EA042157B1 - Неинвазивное определение метилома плода или опухоли по плазме - Google Patents

Неинвазивное определение метилома плода или опухоли по плазме Download PDF

Info

Publication number
EA042157B1
EA042157B1 EA201500327 EA042157B1 EA 042157 B1 EA042157 B1 EA 042157B1 EA 201500327 EA201500327 EA 201500327 EA 042157 B1 EA042157 B1 EA 042157B1
Authority
EA
Eurasian Patent Office
Prior art keywords
methylation
dna
plasma
cancer
level
Prior art date
Application number
EA201500327
Other languages
English (en)
Inventor
Росса Вай Квун Чиу
Кван Чи Чань
Юйк-Мин Деннис Ло
Мю Фань Лунь
Пэйюн Цзян
Вай Мань Чань
Original Assignee
Те Чайниз Юниверсити Ов Гонконг
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Те Чайниз Юниверсити Ов Гонконг filed Critical Те Чайниз Юниверсити Ов Гонконг
Publication of EA042157B1 publication Critical patent/EA042157B1/ru

Links

Description

Перекрестные ссылки на родственную заявку
Настоящая заявка представляет собой заявку РСТ, испрашивающую приоритет по предварительной заявке на патент США № 61/830571, озаглавленной: Tumor Detection In Plasma Using Methylation Status And Copy Number (Детекция опухолей в плазме с использованием данных о статусе метилирования и количестве копий), поданной 3 июня 2013 г.; и заявке на патент США № 13/842209, озаглавленной: Non-Invasive Determination Of Methylome Of Fetus Or Tumor From Plasma (Неинвазивное определение метилома плода или опухоли по плазме), поданной 15 марта 2013 г., которая представляет собой непредварительную заявку и испрашивает приоритет по предварительной заявке на патент США № 61/703512, озаглавленной: Method Of Determining The Whole Genome DNA Methylation Status Of The Placenta By Massively Parallel Sequencing Of Maternal Plasma (Способ определения статуса метилирования ДНК полного генома плаценты с применением массивно-параллельного секвенирования материнской плазмы, поданной 20 сентября 2012 г., которые включены в настоящий документ посредством ссылки полностью во всех отношениях.
Область техники
Раскрытое в настоящем описании изобретение относится в целом к определению паттерна метилирования (метилома) ДНК, и, конкретнее, к анализу биологического образца (например, плазмы), который содержит смесь ДНК разных геномов (например, плода и матери, или опухоли и нормальных клеток), для определения паттерна метилирования (метилома) минорного генома. Также описаны варианты применения установленного метилома.
Уровень техники
Развитие эмбриона и плода представляет собой сложный процесс и включает множество высококоординированных генетических и эпигенетических событий. Развитие ракового заболевания также представляет собой сложный процесс, включающий ряд генетических и эпигенетических этапов. Аномалии эпигенетического контроля процессов развития связаны с бесплодием, самопроизвольными абортами, аномалиями внутриутробного роста и постнатальными последствиями. Метилирование ДНК является одним из наиболее интенсивно исследуемых эпигенетических механизмов. Метилирование ДНК в основном происходит в контексте добавления метильной группы к 5'-концевому атому углерода остатков цитозина в динуклеотидах CpG. Метилирование цитозина добавляет еще один уровень контроля транскрипции генов и функции ДНК. Например, гиперметилирование генных промоторов, богатых динуклеотидами CpG и называемых CpG-островками, как правило, связано с подавлением функции гена.
Несмотря на важную роль эпигенетических механизмов в опосредовании процессов развития, ткани эмбриона и плода человека не являются легкодоступными для анализа (аналогичным образом могут быть недоступны и опухоли). Исследования динамических изменений таких эпигенетических процессов в норме и при наличии заболеваний во время внутриутробного периода у человека практически невозможны. Одно из главных направлений таких исследований было представлено внеэмбриональными тканями, в частности, плацентой, которые могут быть получены в ходе пренатальных диагностических процедур или после рождения ребенка. Однако для таких тканей требуется осуществление инвазивных процедур.
Профиль метилирования ДНК плаценты человека интересовал ученых в течение многих десятилетий. Плацента человека демонстрирует множество своеобразных физиологических особенностей, задействующих метилирование ДНК. На глобальном уровне плацентарные ткани гипометилированы по сравнению с большинством соматических тканей. На уровне генов статус метилирования отдельных геномных локусов является специфической сигнатурой плацентарных тканей. Как глобальный, так и локусспецифический профили метилирования демонстрируют зависимые от гестационного возраста изменения. Импринтинговые гены, а именно гены, экспрессия которых зависит от родительского происхождения аллелей, осуществляют ключевые функции в плаценте. Плацента была описана как превдозлокачественное образование, и наблюдалось гиперметилирование нескольких генов-супрессоров опухолей.
Исследования профиля метилирования ДНК плацентарных тканей обеспечили ценную информацию для понимания патофизиологии ассоциированных с беременностью или связанных с процессами развития заболеваний, таких как преэклампсия и задержка внутриутробного развития. Расстройства геномного импринтинга связаны с такими расстройствами развития, как синдром Прадера-Вилли и синдром Ангельмана. Измененные профили геномного импринтинга и глобального метилирования ДНК в плацентарных и плодных тканях наблюдались при беременностях, наступивших в результате применения вспомогательных репродуктивных технологий (Н Hiura et al. 2012 Hum Reprod; 27: 2541-2548). Ряд факторов окружающей среды, таких как курение матери (KE Haworth et al. 2013 Epigenomics; 5: 37-49), питание матери (X Jiang et al. 2012 FASEB J; 26: 3563-3574) и метаболический статус матери, например, диабет (N Hajj et al., Diabetes. ЦИО: 10.2337/db12-0289), были ассоциированы с эпигенетическими аберрациями у потомства.
Несмотря на десятилетия работы, отсутствовали какие-либо практические средства для изучения метиломы плода или опухоли и для мониторинга динамических изменений на протяжении всей беременности или во время болезненных процессов, например, при злокачественных новообразованиях. Таким образом, существует потребность в неинвазивных способах анализа полного плодного и опухолевого метилома или его фрагментов.
- 1 042157
Краткое описание изобретения
В вариантах реализации представлены системы, способы и устройства для определения и применения профилей метилирования различных тканей и образцов. Приведены примеры. Профиль метилирования может быть выведен для плодной/опухолевой ткани на основании сравнения метилирования в плазме (или другом образце, содержащем ДНК, свободную от клеток, например, образце мочи, слюны, смывах с половых органов) с профилем метилирования матери/пациента. Профиль метилирования может быть определен для плодной/опухолевой ткани с применением тканеспецифических аллелей для идентификации ДНК плода/опухоли, если образец содержит смесь ДНК. Профиль метилирования может применяться для определения вариации числа копий в геноме плода/опухоли. Маркеры метилирования у плода идентифицировали с помощью различных методик. Профиль метилирования может быть определен путем определения размерного параметра распределения размеров фрагментов ДНК, при этом референсные значения размерного параметра могут применяться для определения уровней метилирования.
Кроме того, уровень метилирования может применяться для определения уровня рака. В контексте раковых заболеваний измерение изменений метилома в плазме может позволять детектировать рак (например, для целей скрининга), проводить мониторинг (например, детектировать отклик на противораковую терапию; и детектировать рецидив рака) и осуществлять прогнозирование (например, измерение нагрузки организма раковыми клетками или для стадирования, оценки вероятности летального исхода в результате заболевания, прогрессирования заболевания или метастатических процессов).
Лучшее понимание природы и преимуществ вариантов реализации настоящего изобретения может быть достигнуто на основе приведенного ниже подробного описания и сопроводительных чертежей.
Краткое описание чертежей
На фиг. 1A приведена табл. 100 результатов секвенирования для материнской крови, плаценты и материнской плазмы в соответствии с вариантами реализации настоящего изобретения.
На фиг. 1В показана плотность метилирования участков размером 1 Мб из секвенированных образцов в соответствии с вариантами реализации настоящего изобретения.
На фиг. 2А-С приведены графики зависимости бета-значений от индексов метилирования: (А) Клетки материнской крови, (В) Образец ворсин хориона, (С) Ткань зрелой плаценты.
На фиг. 3А и В приведены гистограммы процентного содержания метилированных CpG-сайтов в плазме и в клетках крови, полученных от взрослого мужчины и небеременной взрослой женщины: (А) Аутосомы, (В) Х-хромосома.
На фиг. 4А и В приведены графики плотностей метилирования соответствующих локусов в ДНК клеток крови и ДНК плазмы: (А) Небеременная взрослая женщина, (В) Взрослый мужчина.
На фиг. 5А и В приведены гистограммы процентного содержания метилированных CpG-сайтов в образцах, полученных при беременности: (А). Аутосомы, (В) Х-хромосома.
На фиг. 6 приведена гистограмма уровня метилирования разных классов повторов в геноме человека для материнской крови, плаценты и материнской плазмы.
На фиг. 7А приведен Circos-график 700 для образцов, полученных в первом триместре.
На фиг. 7В приведен Circos-график 750 для образцов, полученных в третьем триместре.
На фиг. 8A-D приведены графики сравнения плотностей метилирования геномной тканевой ДНК с ДНК материнской плазмы для CpG-сайтов, окружающих информативные однонуклеотидные полиморфизмы.
Фиг. 9 представляет собой блок-схему, иллюстрирующую способ 900 определения первого профиля метилирования по биологическому образцу организма в соответствии с вариантами реализации настоящего изобретения.
Фиг. 10 представляет собой блок-схему, иллюстрирующую способ 1000 определения первого профиля метилирования по биологическому образцу организма в соответствии с вариантами реализации настоящего изобретения.
На фиг. 11А и В приведены графические представления эффективности алгоритма прогнозирования с применением данных материнской плазмы и фракционной концентрации плодной ДНК в соответствии с вариантами реализации настоящего изобретения.
Фиг. 12А представляет собой табл. 1200, где приведены подробные данные для 15 выбранных геномных локусов для прогнозирования метилирования в соответствии с вариантами реализации настоящего изобретения.
На фиг. 12В приведено графическое представление 1250 выведенных категорий для 15 выбранных геномных локусов и соответствующих им уровней метилирования в плаценте.
Фиг. 13 представляет собой блок-схему способа 1300 детектирования хромосомной аномалии плода по биологическому образцу, полученному от субъекта - беременной по меньшей мере одним плодом женщины.
Фиг. 14 представляет собой блок-схему способа 1400 идентификации маркеров метилирования путем сравнения профиля метилирования плаценты с материнским профилем метилирования в соответствии с вариантами реализации настоящего изобретения.
Фиг. 15А представляет собой таблицу 1500, представляющую эффективность алгоритма идентифи
- 2 042157 кации DMR с применением данных для первого триместра с учетом 33 ранее описанных маркеров первого триместра.
Фиг. 15В представляет собой таблицу 1550, представляющую эффективность алгоритма идентификации DMR с применением данных для третьего триместра, сравниваемых с образцом плаценты, полученным при родах.
Фиг. 16 представляет собой табл. 1600, где приведены количества локусов, гиперметилированных или гипометилированных согласно прогнозу на основе прямого анализа данных бисульфитного секвенирования для материнской плазмы.
Фиг. 17А представляет собой график 1700, демонстрирующий распределение размеров ДНК материнской плазмы, контрольной плазмы небеременной женщины, плацентарной ДНК и ДНК периферической крови.
Фиг. 17В представляет собой график 1750 распределения размеров и профиля метилирования материнской плазмы, контрольной плазмы от взрослой женщины, плацентарной ткани и контрольной крови от взрослой женщины.
Фиг. 18А и В представляют собой графики плотностей метилирования и размеров молекул ДНК плазмы в соответствии с вариантами реализации настоящего изобретения.
На фиг. 19А приведен график 1900 плотностей метилирования и размеров ридов секвенирования для взрослой небеременной женщины.
Фиг. 19В представляет собой график 1950, демонстрирующий распределение размеров и профиль метилирования специфичных для плода и специфичных для матери молекул ДНК в материнской плазме.
Фиг. 20 представляет собой блок-схему способа 2000 оценки уровня метилирования ДНК в биологическом образце организма в соответствии с вариантами реализации настоящего изобретения.
Фиг. 21A представляет собой табл. 2100, где приведены плотности метилирования для предоперационных образцов плазмы и ткани пациента с гепатоцеллюлярной карциномой (ГЦК).
Фиг. 21В представляет собой табл. 2150, где приведено количество рядов последовательностей и достигнутая глубина секвенирования на образец.
Фиг. 22 представляет собой табл. 220, где приведены плотности метилирования в аутосомах, варьирующие от 71,2 до 72,5%, в образцах плазмы здоровых контролей.
На фиг. 23А и В приведена плотность метилирования лейкоцитарной пленки, опухолевой ткани, неопухолевой ткани печени, предоперационной плазмы и послеоперационной плазмы пациента с ГЦК.
Фиг. 24А представляет собой график 2400, демонстрирующий плотности метилирования предоперационной плазмы пациента с ГЦК.
Фиг. 24В представляет собой график 2450, демонстрирующий плотности метилирования послеоперационной плазмы пациента с ГЦК.
На фиг. 25А и В приведены Z-показатели плотностей метилирования ДНК плазмы для предоперационных (график 2500) и послеоперационных (график 2550) образцов плазмы пациента с ГЦК с применением данных о метиломе плазмы четырех здоровых контрольных субъектов в качестве эталона для хромосомы 1.
Фиг. 26А представляет собой табл. 2600, где приведены данные Z-показателей для предоперационной и послеоперационной плазмы.
Фиг. 26В представляет собой Circos-график 2620, отражающий Z-показатель плотностей метилирования ДНК плазмы для предоперационных и послеоперационных образцов плазмы пациента с ГЦК с использованием четырех здоровых контрольных субъектов в качестве эталона для участков размером 1 Мб, проанализированных для всех аутосом.
Фиг. 26С представляет собой табл. 2640, представляющую распределение Z-показателей участков размером 1 Мб для полного генома как в предоперационных, так и в послеоперационных образцах плазмы пациента с ГЦК.
Фиг. 26D представляет собой табл. 2660, где представлены уровни метилирования в образце опухолевой ткани и предоперационной плазмы, перекрывающиеся с некоторыми из контрольных образцов плазмы в контексте СНН и CHG.
На фиг. 27А-Н представлен Circos-график плотности метилирования у 8 пациентов с раковыми заболеваниями в соответствии с вариантами реализации настоящего изобретения.
Фиг. 27I представляет собой таблицу 2780, где приведено количество ридов последовательностей и достигнутая глубина секвенирования на образец.
Фиг. 27J представляет собой таблицу 2790, представляющую распределение Z-показателей участков размером 1 Мб для полного генома в плазме пациентов с разными злокачественными новообразованиями. АЛ = аденокарцинома легкого; НГК = носоглоточная карцинома; КРК = колоректальная карцинома; НЭК = нейроэндокринная карцинома; ГМС = гладкомышечная саркома.
Фиг. 28 представляет собой блок-схему способа 2800 анализа биологического образца организма для установления классификации уровня рака в соответствии с вариантами реализации настоящего изобретения.
Фиг. 29А представляет собой график 2900, демонстрирующий распределение плотностей метили
- 3 042157 рования у референсных субъектов при предположении, что указанное распределение соответствует нормальному распределению.
Фиг. 29В представляет собой график 2950, демонстрирующий распределение плотностей метилирования у пациентов с раковым заболеванием при предположении, что указанное распределение соответствует нормальному распределению, и среднее значение уровня метилирования ниже точки отсечения на 2 стандартных отклонения.
Фиг. 30 представляет собой график 3000, демонстрирующий распределение плотностей метилирования ДНК плазмы здоровых субъектов и пациентов с раковыми заболеваниями.
На фиг. 31 приведено графическое представление 3100 распределения различий среднего плотностей метилирования ДНК плазмы здоровых субъектов и опухолевой ткани пациента с ГЦК.
Фиг. 32А представляет собой таблицу 3200, где представлен эффект уменьшения глубины секвенирования в случаях, когда образец плазмы содержал 5% или 2% опухолевой ДНК.
На фиг. 32В приведено графическое представление 3250 плотностей метилирования повторяющихся элементов и областей без повторов в плазме четырех здоровых контрольных субъектов, в лейкоцитарной пленке, нормальной ткани печени, опухолевой ткани, образцах предоперационной плазмы и послеоперационной плазмы пациента с ГЦК.
На фиг. 33 представлена блок-диаграмма примера компьютерной системы 3300, подходящей для применения с системой и способами в соответствии с вариантами реализации настоящего изобретения.
На фиг. 34А представлено распределение размеров ДНК плазмы у пациента с системной красной волчанкой (СКВ) СКВ04.
На фиг. 34В и С представлен анализ метилирования для ДНК плазмы пациента с СКВ СКВ04 (фиг. 34В) и пациента с ГЦК TBR36 (фиг. 34С).
Фиг. 35 представляет собой блок-схему способа 3500 установления классификации уровня рака на основе гиперметилирования CpG-островков в соответствии с вариантами реализации настоящего изобретения.
Фиг. 36 представляет собой блок-схему способа 3600 анализа биологического образца организма с применением множества хромосомных областей в соответствии с вариантами реализации настоящего изобретения.
На фиг. 37А представлен анализ CNA (аберраций числа копий) для опухолевых тканей, не обработанной бисульфитом (БС) ДНК плазмы и обработанной бисульфитом ДНК плазмы (от центра к краям) для пациента TBR36.
Фиг. 37В представляет собой график рассеяния, отражающий зависимость между Z-показателями для детекции CNA, с применением обработанной бисульфитом и не обработанной бисульфитом плазмы, для участков размером 1 Мб у пациента TBR36.
На фиг. 38А представлен анализ CNA для опухолевых тканей, не обработанной бисульфитом (БС) ДНК плазмы и обработанной бисульфитом ДНК плазмы (от центра к краям) для пациента TBR34.
Фиг. 38В представляет собой график рассеяния, отражающий зависимость между Z-показателями для детекции CNA, с применением обработанной бисульфитом и не обработанной бисульфитом плазмы, для участков размером 1 Мб у пациента TBR34.
Фиг. 39А представляет собой Circos-график, демонстрирующий CNA (внутренний круг) и анализ метилирования (внешний круг) для обработанной бисульфитом плазмы пациента с ГЦК TBR240.
Фиг. 39В представляет собой Circos-график, демонстрирующий CNA (внутренний круг) и анализ метилирования (внешний круг) для обработанной бисульфитом плазмы пациента с ГЦК TBR164.
На фиг. 40А представлен анализ CNA у пациента TBR36 образца до лечения и образца после лечения.
На фиг. 40В представлен анализ метилирования у пациента TBR36 образца до лечения и образца после лечения.
На фиг. 41А представлен анализ CNA у пациента TBR34 образца до лечения и образца после лечения.
Фиг. 41В представлен анализ метилирования у пациента TBR34 образца до лечения и образца после лечения.
На фиг. 42 представлена диаграмма диагностической эффективности полногеномного анализа гипометилирования при разном количестве ридов секвенирования.
Фиг. 43 представляет собой диаграмму, демонстрирующую кривые ROC для детекции ракового заболевания на основе полногеномного анализа гипометилирования при разном размере участков (50 кб, 100 кб, 200 кб и 1 Мб).
На фиг. 44А представлена диагностическая эффективность суммарной вероятности (СР) и процентное содержание участков с аберрациями.
На фиг. 44В представлена диагностическая эффективность анализа плазмы для оценки глобального гипометилирования, CpG-островков гиперметилирования и CNA.
На фиг. 45 приведена таблица результатов для глобального гипометилирования, CpG-островков гиперметилирования и CNA у пациентов с гепатоцеллюлярной карциномой.
На фиг. 46 приведена таблица результатов для глобального гипометилирования, CpG-островков гиперметилирования и CNA у пациентов с раковыми заболеваниями, отличными от гепатоцеллюлярной
- 4 042157 карциномы.
На фиг. 47 представлен серийный анализ метилирования в плазме для пациента TBR34.
На фиг. 48А представлен Circos-график, демонстрирующий изменения CNA (внутренний круг) и метилирования (внешний круг) в обработанной бисульфитом ДНК плазме пациента с ГЦК TBR36.
Фиг. 48В представляет собой график Z-показателей метилирования для областей с добавлением или утратой хромосомного материала, и областей без изменения числа копий для пациента с ГЦК TBR36.
На фиг. 49А представлен Circos-график, демонстрирующий изменения CNA (внутренний круг) и метилирования (внешний круг) в обработанной бисульфитом ДНК плазмы пациента с ГЦК TBR34.
Фиг. 49В представляет собой график Z-показателей метилирования для областей с добавлением или утратой хромосомного материала, и областей без изменения числа копий для пациента с ГЦК TBR34.
На фиг. 50А и В представлены результаты анализа гипометилирования плазмы и CNA для пациентов с CKB, CKB04 и CKB10.
На фиг. 51А и В представлен анализ Zmeth для областей с CNA и без CNA в плазме двух пациентов с ГЦК (TBR34 и TBR36).
Фиг. 51С и D представлен Zmeth анализ для областей с CNA и без CNA в плазме двух пациентов с CKB (CKB04 и CKB10).
На фиг. 52А представлен иерархический кластерный анализ для образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с использованием признаков группы А для CNA, глобального метилирования и метилирования CpG-островков.
На фиг. 52В представлена иерархическая кластеризация с использованием признаков группы В для CNA, глобального метилирования и метилирования CpG-островков.
На фиг. 53А представлен иерархический кластерный анализ для образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с использованием признаков метилирования CpG-островков группы А.
На фиг. 53В представлен иерархический кластерный анализ образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с использованием плотностей глобального метилирования группы А.
На фиг. 54А представлен иерархический кластерный анализ образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с использованием глобального содержания CNA группы А.
На фиг. 54В представлен иерархический кластерный анализ образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с использованием плотностей метилирования CpG-островков группы В.
На фиг. 55А представлен иерархический кластерный анализ для образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с использованием плотностей глобального метилирования группы В.
На фиг. 55В представлен иерархический кластерный анализ образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с использованием плотностей глобального метилирования группы В.
На фиг. 56 представлено среднее плотности метилирования участков размером 1 Мб (красные точки) у 32 здоровых субъектов.
Определения
Метилом представляет собой меру величины метилирования ДНК во множестве сайтов или локусов в геноме. Метилом может соответствовать всему геному, существенной части генома или относительно небольшой(им) части(ям) генома. Плодный метилом соответствует метилому плода беременной женщины. Плодный метилом может быть определен с использованием разнообразных плодных тканей или источников плодной ДНК, включая плацентарные ткани и свободную от клеток плодную ДНК в материнской плазме. Опухолевый метилом соответствует метилому опухоли организма (например, человека). Опухолевый метилом может быть определен с использованием опухолевой ткани или свободной от клеток опухолевой ДНК в материнской плазме. Плодный метилом и опухолевый метилом представляют собой примеры представляющего интерес метилома. Другими примерами представляющих интерес метиломов являются метиломы органов (например, метиломы клеток головного мозга, костей, легких, сердца, мышц и почек, и т.д.), из которых ДНК может попадать в жидкости организма (например, плазму, сыворотку, пот, слюну, мочу, выделения половых органов, семенную жидкость, жидкость из испражнений, диарейную жидкость, спинномозговую жидкость, выделения из желудочно-кишечного тракта, выделения поджелудочной железы, выделения кишечника, мокроту, слезы, аспирационную жидкость из молочных желез и щитовидной железы, и т.д.). Указанные органы могут представлять собой трансплантированные органы.
Метилом плазмы представляет собой метилом, определенный по плазме или сыворотке животного (например, человека). Метилом плазмы представляет собой пример метилом свободной от клеток ДНК, поскольку плазма или сыворотка содержат свободную от клеток ДНК. Метилом плазмы является также примером смешанного метилома, поскольку он представляет собой смесь плодного/материнского
- 5 042157 метилома или метилома опухоли/пациента. Плацентарный метилом может быть определен по образцу ворсин хориона (CVS) или образцу плацентарной ткани (например, полученному после родов). Клеточный метилом соответствует метилому, определенному по клеткам (например, клеткам крови) пациента. Метилом в клетках крови называют метиломом клеток крови (или метиломом крови).
Сайт соответствует одному сайту, который может представлять собой одно основание или группу связанных оснований, например, CpG-сайт. Локус может соответствовать области, которая включает несколько сайтов. Локус может включать всего один сайт, что делает локус эквивалентным сайту в данном контексте.
Индекс метилирования каждого геномного сайта (например, CpG-сайта) относится к соотношению ридов секвенирования, демонстрирующих метилирование в указанном сайте, к общему количеству ридов, покрывающих указанный сайт. Плотность метилирования области представляет собой число демонстрирующих метилирование ридов на сайтах внутри указанной области, разделенное на общее число ридов, покрывающих сайты в указанной области. Сайты могут иметь специфические характеристики, например, представлять собой CpG-сайты. Соответственно, плотность метилирования CpG для области представляет собой число демонстрирующих CpG метилирование ридов, разделенное на общее число ридов, покрывающих CpG-сайты в указанной области (например, конкретный CpG-сайт, CpGсайты в составе CpG-островка или область большего размера). Например, плотность метилирования для каждого 100-кб участок в геноме человека может быть определена по общему числу цитозинов, не конвертированных после обработки бисульфитом (что соответствует метилированному цитозину) в CpGсайтах, как пропорциональной доли от всех CpG-сайтов, покрываемых ридами последовательностей, картируемыми на область размером 100 кб. Указанный анализ может также проводиться для участков других размеров, например, 50 кб или 1 Мб, и т.д. Область может представлять собой весь геном, или хромосому, или часть хромосомы (например, плечо хромосомы). Индекс метилирования CpG-сайта совпадает с плотностью метилирования области, если указанная область включает только указанный CpGсайт. Доля метилированных цитозинов относится к отношению числа цитозиновых сайтов, С, которые, как показано, метилированы (например, не конвертированы после обработки бисульфитом), к общему количеству анализируемых остатков цитозина, т.е. в том числе, цитозинов вне контекста CpG, в указанной области. Индекс метилирования, плотность метилирования и доля метилированных цитозинов представляют собой примеры уровней метилирования.
Профиль метилирования (также называемый статусом метилирования) включает информацию относительно метилирования ДНК для области. Информация относительно метилирования ДНК может включать, не ограничиваясь перечисленным, индекс метилирования CpG-сайта, плотность метилирования CpG-сайтов в области, распределение CpG-сайтов на протяжении непрерывной области, паттерн или уровень метилирования для каждого индивидуального CpG-сайта в составе области, которая содержит более чем один CpG-сайт, и метилирования по сайтам, не являющимся CpG. Профиль метилирования существенной части генома может считаться эквивалентным метилому. Метилирование ДНК в геномах млекопитающих, как правило, относится к добавлению метильной группы к 5'-концевому атому углерода остатков цитозина (т.е. 5-метилцитозинам) в динуклеотидах CpG. Метилирование ДНК по цитозинам может происходить в других контекстах, например, в CHG и СНН, где Н представляет собой аденин, цитозин или тимин. Метилирование цитозина может также быть представлено 5гидроксиметилцитозином. Также было описано метилирование по не являющимся цитозинам основаниям, например, по К6-метиладенину.
Ткань соответствует любым клеткам. Разные типы ткани могут соответствовать разным типам клеток (например, печени, легкого или крови), а также могут соответствовать тканям разных организмов (матери/плода) или здоровым клеткам/опухолевым клеткам. Биологический образец относится к любому образцу, который получают от субъекта (например, человека, такого как беременная женщина, индивидуум с раковым заболеванием или индивидуум, у которого предположительно имеется раковое заболевание, реципиент трансплантированного органа или субъект, у которого предположительно имеется болезненный процесс, в который вовлечен орган (например, сердце при инфаркте миокарда, или головной мозг при инсульте), и содержит одну или большее количество представляющих интерес молекул нуклеиновой кислоты. Биологический образец может представлять собой жидкость организма, такую как кровь, плазма, сыворотка, моча, влагалищное отделяемое, смывы из матки или влагалища, плевральная жидкость, асцитическая жидкость, спинномозговая жидкость, слюна, пот, слеза, мокрота, жидкость бронхоальвеолярного лаважа и т.д. Также могут использоваться образцы стула.
Термин уровень рака может относиться как к наличию ракового заболевания, так и к стадии ракового заболевания, размеру опухоли, наличию метастазов, общей опухолевой нагрузке на организм и/или к другой мере тяжести ракового заболевания. Уровень рака может быть выражен числом или обозначен иначе. Уровень может быть равен 0. Уровень рака также включает предзлокачественные или предраковые состояния (статусы), связанные с мутациями или рядом мутаций. Уровень рака может быть использован различным образом. Например, скрининг может показывать, имеется ли раковое заболевание у кого-либо, по имеющимся сведениям ранее не страдавшего раковым заболеванием. Оценка может проводиться для кого-либо с диагностированным раковым заболеванием для мониторинга прогрессирования
- 6 042157 ракового заболевания с течением времени, исследования эффективности терапии или для определения прогноза. Согласно одному варианту реализации прогноз может быть представлен в виде вероятности смерти пациента в результате ракового заболевания, или вероятности прогрессирования ракового заболевания через определенный период или промежуток времени, или вероятности метастазирования рака. Детекция может означать скрининг или может означать проверку на наличие рака у кого-либо, демонстрирующего указывающие на раковое заболевание признаки (например, симптомы или другие положительные тесты).
Подробное описание изобретения
Эпигенетические механизмы играют важную роль в развитии эмбриона и плода. Однако ткани эмбриона и плода человека (в том числе плацентарные ткани) не являются легкодоступными (патент США №6927028). Некоторые варианты осуществления направлены на решение указанной проблемы путем анализа образца, содержащего молекулу свободной от клеток плодной ДНК, присутствующей в материнском кровотоке. Плодный метилом может быть выведен различными способами. Например, может быть проведено сравнение метилома материнской плазмы и материнского клеточного метилома (по клеткам крови матери), и обнаружены различия, которые коррелируют с плодным метиломом. Согласно другому примеру специфичные для плода аллели могут применяться для определения метилирования плодного метилома в конкретных локусах. Кроме того, размер фрагмента может применяться в качестве индикатора процента метилирования, так как показана корреляция между размером и процентом метилирования.
Согласно одному варианту реализации полногеномное бисульфитное секвенирование применяется для анализа профиля метилирования (всего метилома или его части) ДНК материнской плазмы с разрешением до одного нуклеотида. При использовании различий полиморфизмов матери и плода можно собрать плодный метилом по образцам материнской крови. Согласно еще одному варианту реализации различия полиморфизмов не использовались, однако может использоваться различие между метиломом плазмы и метиломом клеток крови.
Согласно другому варианту реализации за счет использования однонуклеотидных вариаций и/или аберраций числа копий между геномом опухоли и неопухолевым геномом, а также данных секвестрования для плазмы (или другого образца), может быть получен профиль метилирования опухоли для образца от пациента, у которого предположительно или точно имеется раковое заболевание. Отличие уровня метилирования в образце плазмы тестируемого индивидуума при сравнении с уровнем метилирования плазмы здорового контроля или группы здоровых контролей может обеспечивать идентификацию тестируемого индивидуума как имеющего раковое заболевание. Кроме того, профиль метилирования может выполнять роль сигнатуры типа ракового заболевания, например, показывать, из какого органа происходит рак у данного индивидуума, и имеются ли метастазы.
Благодаря неинвазивной природе указанного способа авторы настоящего изобретения имели возможность провести серийную оценку плодных метиломов и метиломов материнской плазмы по образцам материнской крови, собранным в первом триместре, третьем триместре и после родов. Наблюдались изменения, связанные с гестацией. Указанный способ также может применяться в отношении образцов, полученных на протяжении второго триместра. Плодный метилом, определенный по материнской плазме во время беременности, напоминал плацентарный метилом. Импринтинговые гены и дифференциально метилированные области идентифицировали по данным материнской плазмы.
Таким образом, авторы разработали способ серийного комплексного неинвахивного исследования плодного метилома неинвазивным, предлагающего, соответственно, возможность идентификации биомаркеров или прямого тестирования связанных с патологиями беременности. Варианты реализации также могут использоваться для серийного комплексного неинвазивного исследования опухолевого метилома, для скрининга или детекции наличия у субъекта ракового заболевания, для мониторинга злокачественных заболеваний у больного раковым заболеванием пациента и для прогнозирования. Варианты реализации могут быть применены к любому типу ракового заболевания, включая, но не ограничиваясь перечисленным, рак легкого, рак молочной железы, рак толстой и прямой кишки, рак предстательной железы, рак носоглотки, рак желудка, рак яичка, рак кожи (например, меланома), поражающий нервную систему рак, рак костей, рак яичника, рак печени (например, гепатоцеллюлярная карцинома), гематологические злокачественные новообразования, рак поджелудочной железы, эндометриоидная карцинома, рак почки, рак шейки матки, рак мочевого пузыря и т.д.
Сначала обсуждаются способы определения метилома или профиля метилирования, затем описываются различные метиломы (такие как плодные метиломы, опухолевый метилом, метиломы матери или пациента, и смешанный метилом, например, плазмы). Затем описано определение профиля метилирования у плода с использованием специфичных для плода маркеров или путем сравнения смешанного профиля метилирования с клеточным профилем метилирования. Плодные маркеры метилирования определяют путем сравнения профилей метилирования. Обсуждается зависимость между размером и метилированием. Также предложены варианты применения профилей метилирования для детекции раковых заболеваний.
I. Определение метилома
Для исследования плацентарного метилома использовалось множество подходов, однако каждый
- 7 042157 подход имеет свои ограничения. Например, бисульфит натрия, химическое вещество, которое модифицирует неметилированные остатки цитозина, превращая их в урацил, и оставляет метилированный цитозин в неизмененном виде, преобразует различия в метилировании цитозина в различия генетических последовательностей для дальнейшего изучения. Золотой стандарт исследований метилирования цитозина основан на обработке тканевой ДНК бисульфитом натрия с последующим прямым секвенированием индивидуальных клонов конвертированных бисульфитом молекул ДНК. После анализа множества клонов молекул ДНК могут быть получены паттерн метилирования цитозина и количественный профиль в расчете на CpG-сайт. Тем не менее, бисульфитное секвенирование клонов представляет собой трудоемкую процедуру с низкой пропускной способностью, которую невозможно с легкостью применять в полногеномном масштабе.
Чувствительные к метилированию рестрикционные ферменты, которые, как правило, расщепляют неметилированную ДНК, обеспечивают недорогой способ исследования метилирования ДНК. Однако данные, обеспечиваемые такими исследованиями, ограничены локусами, содержащими распознаваемые ферментами мотивы, и результаты не являются количественными. Иммунопреципитация ДНК, связываемой антителами против метилированного цитозина, может применяться для исследования больших сегментов генома, однако для него характерна тенденция к смещению в пользу локусов с высокой плотностью метилирования из-за более интенсивного связывания антител с такими областями. Способы на основе микроматриц зависят от изначальной конструкции аналитических зондов и эффективности гибридизации зондов с целевой ДНК.
Для комплексного изучения метилома в некоторых вариантах реализации используется массивнопараллельное секвенирование (МПС) для получения полногеномной информации и количественной оценки уровня метилирования в расчете на нуклеотид и на аллель. Недавно стало возможным осуществление бисульфитной конверсии с последующим полногеномным МПС (R Lister et al 2008 Cell; 133: 523-536).
Из небольшого числа опубликованных исследований (R Lister et al. 2009 Nature; 462: 315-322; L Laurent et al. 2010 Genome Res; 20: 320-331; Y Li et al. 2010 PLoS Biol; 8: e1000533; и М Kulis et al. 2012 Nat Genet; 44: 1236-1242), где применялось полногеномное бисульфитное секвенирование для исследования метиломов человека, два исследования фокусируются на эмбриональных стволовых клетках и фетальных фибробластах (R Lister et al. 2009 Nature; 462: 315-322; L Laurent et al. 2010 Genome Res; 20: 320331). В обоих исследованиях исследовали полученную из клеточных линий ДНК.
А. Полногеномное бисульфитное секвенирование.
Некоторые варианты реализации позволяют преодолеть вышеописанные проблемы и проводить комплексное неинвазивное серийное исследование плодного метилома. Согласно одному варианту реализации использовали полногеномное бисульфитное секвенирование для анализа свободных от клеток молекул плодной ДНК, присутствующих в кровотоке беременных женщин. Несмотря на незначительное содержание и фрагментированную природу молекул ДНК в плазме, авторам удалось собрать плодный метилом с высоким разрешением по материнской плазме и провести серийные наблюдения изменений с течением беременности. Учитывая, что неинвазивное пренатальное тестирование (NIPT) представляет значительный интерес, варианты реализации могут обеспечить новый мощный инструмент для поиска фетальных биомаркеров или служить непосредственно в качестве платформы для проведения NIPT заболеваний плода или связанных с беременностью заболеваний. Представлены данные полногеномного бисульфитного секвенирования различных образцов, исходя из которых может быть установлен плодный метилом. Согласно одному варианту реализации указанная технология может применяться для определения профиля метилирования при беременности, осложненной преэклампсией, или внутриутробной задержкой роста, или преждевременными родами. При таких осложненных беременностях указанная технология может применяться серийно благодаря своей неинвазивной природе, позволяя проводить мониторинг, и/или прогнозирование, и/или оценку ответа на лечение.
На фиг. 1А приведена табл. 100 результатов секвенирования для материнской крови, плаценты и материнской плазмы в соответствии с вариантами реализации настоящего изобретения. Согласно одному варианту реализации полногеномное секвенирование осуществляли на конвертированных бисульфитом библиотеках ДНК, полученных с применением адаптеров для библиотек метилированной ДНК (Illumina) (R Lister et al. 2008 Cell; 133: 523-536), клетках крови из образца крови, взятого в первом триместре, CVS, плацентарной ткани, собранной при своевременных родах, образцах материнской плазмы, собранных в первом и третьем триместрах и в послеродовом периоде. Также исследовали образцы ДНК клеток крови и плазмы, полученные от одного взрослого мужчины и одной взрослой небеременной женщины. Всего в указанном исследовании получали 9,5 миллиардов пар необработанных ридов последовательностей. Глубина секвенирования для каждого образца представлена в табл. 100.
Риды последовательностей, уникально картируемые на референсный геном человека, обеспечивали 50-кратное, 34-кратное и 28-кратное среднее покрытие гаплоидного генома, соответственно, для образцов материнской плазмы в первом триместре, третьем триместре и в послеродовой период. Покрытие CpG-сайтов в геноме варьировало от 81 до 92% для образцов, полученных при беременности. Риды последовательностей, захватывающие CpG-сайты, обеспечивали 33-кратное среднее покрытие гаплоидного генома на цепь, 23-кратное покрытие на цепь и 19-кратное покрытие на цепь, соответственно, для образ
- 8 042157 цов материнской плазмы в первом триместре, третьем триместре и в послеродовой период. Эффективность бисульфитной конверсии для всех образцов составляла >99,9% (табл. 100).
В табл. 100 показатель неоднозначности (помечен индексом а) относится к доле ридов, картируемых на обе цепи Уотсона-Крика (и цепь 5'^3', и цепь 3'^5') референсного генома человека. Показатель конверсии лямбда относится к доле неметилированных цитозинов во внутреннем контроле, лямбда-ДНК, конвертируемых в остатки тимина в результате бисульфитной модификации. Н - обобщенное обозначение А, С или Т. а относится к ридам, которые могут быть картированы на конкретный геномный локус, но не могут быть соотнесены с цепью Уотсона (5'^3') или Крика (3'^5'). b относится к парным ридам с идентичными координатами начала и конца, с: некоторое количество лямбда-ДНК вносили в каждый образец до бисульфитной конверсии. Показатель конверсии лямбда относится к доле цитозиновых нуклеотидов, остающихся цитозиновыми после бисульфитной конверсии и используемых в качестве индикатора скорости успешной бисульфитной конверсии, d относится к числу цитозиновых нуклеотидов, присутствующих в референсном геноме человека и сохраняющих последовательность цитозина после бисульфитной конверсии.
При бисульфитной модификации неметилированные цитозины превращаются в урацилы и впоследствии в тимины после ПЦР-амплификации, тогда как метилированные цитозины остаются интактными (М Frommer et al. 1992 Proc Natl Acad Sci USA;89:1827-31). После секвенирования и выравнивания статус метилирования индивидуального CpG-сайта может, соответственно, быть выведен при помощи подсчета ридов метилированных последовательностей М (метилированные) и ридов неметилированных последовательности U (неметилированные) по остаткам цитозина в контексте CpG. С применением данных бисульфитного секвенирования конструировали полные метиломы материнской крови, плаценты и материнской плазмы. Среднее плотности метилирования CpG (также называется плотностью метилирования MD) конкретных локусов в материнской плазме может быть рассчитано с применением уравнения:
М
MD =--M + U где М представляет собой подсчитанное число метилированных ридов и U представляет собой подсчитанное число неметилированных ридов в CpG-сайтах в составе генетического локуса. Если в состав локуса входит более чем один CpG-сайт, М и U соответствуют подчитанному числу во всех этих сайтах.
В. Различные методики.
Согласно приведенному выше описанию, определение профиля метилирования может осуществляться с применением массивно-параллельного секвенирования (МПС) конвертированной бисульфитом ДНК плазмы. МПС конвертированной бисульфитом ДНК плазмы может осуществляться случайным образом или методом дробовика. Глубина секвенирования может варьировать в соответствии с размером представляющей интерес области.
Согласно другому варианту реализации представляющая(е) интерес область(и) в конвертированной бисульфитом ДНК плазмы может (могут) быть сначала захвачена(ы) с применением способа на основе жидкофазной или твердофазной гибридизации с последующим МПС. Массивно-параллельное секвенирование может осуществляться с применением платформ для секвенирования синтезом, таких как Illumina, платформ для секвенирования лигированием, таких как платформа SOLiD от Life Technologies, системы для секвенирования на основе полупроводников, такой как платформы Ion Torrent или Ion Proton от Life Technologies, или система для одномолекулярного секвенирования, такая как Helicos или Pacific Biosciences, или система для секвенирования на основе нанопор. Секвенирование на основе нанопор, в том числе нанопор, конструируемых с применением, например, липидных бислоев, белковых нанопор и твердотельных нанопор (например, на основе графена). Поскольку выбранные платформы для одномолекулярного секвенирования позволяют установить метилирование молекул ДНК (включая N6метиладенин, 5-метилцитозин и 5-гидроксиметилцитозин) непосредственно, без бисульфитной конверсии (ВА Flusberg et al. 2010 Nat Methods; 7: 461-465; J Shim et al. 2013 Sci Rep; 3:1389. ЦИО: 10.1038/srep01389), применение таких платформ позволяет проанализировать статус метилирования в образце неконвертированной бисульфитом ДНК (например, ДНК плазмы).
Наряду с секвенированием могут применяться другие методики. Согласно одному варианту реализации определение профиля метилирования может быть проведено с применением специфической к метилированию ПЦР или расщепления чувствительными к метилированию рестрикционными ферментами с последующей ПЦР или лигазной цепной реакцией с последующим ПЦР. Согласно другим вариантам реализации ПЦР представляет собой форму одномолекулярной или цифровой ПЦР (В Vogelstein et al. 1999 Proc Natl Acad Sci USA; 96: 9236-9241). Согласно дополнительным вариантам реализации ПЦР может представлять собой ПЦР в реальном времени. Согласно другим вариантам реализации ПЦР может представлять собой мультиплексную ПЦР.
II. Анализ метиломов
Некоторые варианты реализации позволяют определять профиль метилирования ДНК плазмы с применением полногеномного бисульфитного секвенирования. Профиль метилирования плода может
- 9 042157 быть определен посредством секвенирования ДНК из образцов материнской плазмы согласно приведенному ниже описанию. Соответственно, молекулы плодной ДНК (и плодный метилом) оценивали неинвазивным образом во время беременности, и изменения отслеживали серийно по мере развития беременности. Благодаря полноте данных секвенирования авторам удалось исследовать метиломы материнской плазмы в полногеномном масштабе с разрешением до одного нуклеотида.
Поскольку геномные координаты ридов секвенирования были известны, указанные данные позволяли исследовать общие уровни метилирования метилома или любой представляющей интерес области в геноме, и провести сравнение между разными генетическими элементами. Кроме того, каждый CpG-сайт или локус покрывался несколькими ридами последовательности. В настоящем документе приводится описание некоторых метрик, использованных для измерения метилома.
А. Метилирование молекул ДНК плазмы.
Молекулы ДНК присутствуют в плазме человека в низких концентрациях, в виде фрагментов, длина которых, как правило, напоминает мононуклеосомные единицы (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91; и YW Zheng et al. 2012 Clin Chem; 58: 549-558). Несмотря на указанные ограничения, система полногеномного бисульфитного секвенирования позволила провести анализ метилирования молекул ДНК плазмы. Согласно другим вариантам реализации, так как выбранные платформы для одномолекулярного секвенирования позволяют установить статус метилирования молекул ДНК непосредственно, без бисульфитной конверсии (BA Flusberg et al. 2010 Nat Способы; 7: 461-465; J Shim et al. 2013 Sci Rep; 3:1389. ЦИО: 10.1038/srep01389), применение таких платформ позволяет использовать неконвертированную бисульфитом ДНК плазмы для определения уровней метилирования ДНК плазмы или для определения метилома плазмы. Такие платформы позволяют детектировать N6-метиладенин, 5-метилцитозин и 5гидроксиметилцитозин, что может обеспечить улучшенные результаты (например, улучшенную чувствительность или специфичность) в отношении разных биологических функций разных форм метилирования. Такие улучшенные результаты могут быть полезны при применении вариантов реализации для детекции или мониторинга конкретных расстройств, например, преэклампсии или ракового заболевания определенного типа.
Бисульфитное секвенирование позволяет также различать разные формы метилирования. Согласно одному варианту реализации можно включить дополнительные этапы, позволяющие различить 5метилцитозин и 5-гидроксиметилцитозин. Один из таких подходов представлен окислительным бисульфитным секвенированием (oxBS-seq), которое может установить локализацию 5-метилцитозина и 5гидроксиметилцитозина с разрешением, равным одному основанию (MJ Booth et al. 2012 Science; 336: 934-937; MJ Booth et al. 2013 Nature Protocols; 8: 1841-1851). При бисульфитном секвенировании и 5метилцитозин, и 5-гидроксиметилцитозин считываются как цитозины и, соответственно, различить их невозможно. С другой стороны, при oxBS-seq специфическое окисление 5-гидроксиметилцитозина до 5формилцитозина за счет обработки перрутенатом калия (KRuO4) с последующей конверсией новообразованного 5-формилцитозина в урацил с применением бисульфитной конверсии позволяет отличить 5гидроксиметилцитозин от 5-метилцитозина. Таким образом, регистрация 5-метилцитозина может быть проведена за один цикл oxBS-seq, а уровни 5-гидроксиметилцитозина выводят путем сравнения с результатами бисульфитного секвенирования. Согласно другому варианту реализации 5-метилцитозин можно отличить от 5-гидроксиметилцитозина с применением бисульфитного секвенирования с использованием Tet (TAB-seq) (M Yu et al. 2012 Nat Protoc; 7: 2159-2170). TAB-seq позволяет идентифицировать 5гидроксиметилцитозин с разрешением, равным одному нуклеотиду, а также определить его содержание в каждом участке модификации. Указанный способ задействует опосредованную β-глюкозилтрансферазой защиту 5-гидроксиметилцитозина (глюкозилирование) и опосредованное рекомбинантным Tet1 (mTet1) мыши окисление 5-метилцитозина до 5-карбоксилцитозина. После последующей обработки бисульфитом и ПЦР-амплификации и цитозин, и 5-карбоксилцитозин (полученный из 5-метилцитозина) превращаются в тимин (Т), при этом 5-гидроксиметилцитозин будет считываться как С.
На фиг. 1В представлена плотность метилирования на участках секвенированных образцов размером 1 Мб в соответствии с вариантами реализации настоящего изобретения. График 150 представляет собой Circos-график, отражающий плотность метилирования в ДНК материнской плазмы и геномной ДНК на участках размером 1 Мб по всему геному. От центра к краям: идеограммы хромосом могут быть ориентированы от короткого плеча к длинному плечу (pter-qter) по часовой стрелке (центромеры обозначены красным цветом), материнская кровь (красный), плацента (желтый), материнская плазма (зеленый), общие риды в материнской плазме (голубой), и специфичные для плода риды в материнской плазме (фиолетовый). Общие CpG уровни метилирования (т.е. уровни плотности) клеток материнской крови, плаценты и материнской плазмы приведены в табл. 100. Уровень метилирования клеток материнской крови в целом выше, чем уровень метилирования плаценты, по всему геному.
В. Сравнение бисульфитного секвенирования с другими методиками.
Авторы исследовали плацентарный метилом с применением массивно-параллельного бисульфитного секвенирования. Кроме того, авторы исследовали плацентарный метилом с применением платформы на основе олигонуклеотидных матриц, покрывающей приблизительно 480 000 CpG-сайтов в геноме человека (Illumina) (M Kulis et al. 2012 Nat Genet; 44: 1236-1242; и С Clark et al. 2012 PLoS One; 7: e50233).
- 10 042157
Согласно одному варианту реализации с применением генотипирования на основе BeadChip и анализа метилирования, генотипирование выполняли с применением матрицы для генотипирования Illumina HumanOmni2.5-8 в соответствии с протоколом производителя. Генотипы прогнозировали с применением алгоритма программного обеспечения GenCall Genome Studio Software (Illumina). Показатели прогнозирования превышали 99%. Для анализа метилирования на основе микроматриц геномную ДНК (500-800 нг) обрабатывали бисульфитом натрия с применением набора Zymo EZ DNA Methylation Kit (Zymo Research, Ориндж, Калифорния, США) в соответствии с рекомендациями производителя для анализа метилирования Illumina Infinium Methylation Assay.
Анализ метилирования осуществляли на 4 мкл конвертированной бисульфитом геномной ДНК в концентрации 50 нг/мкл в соответствии с протоколом анализа метилирования Infinium HD Methylation Assay. Гибридизированный чип (BeadChip) сканировали с помощью инструмента Illumina iScan. Данные метилирования ДНК исследовали с помощью программного обеспечения GenomeStudio (v2011.1) Methylation Module (v1.9.0), с нормализацией по внутренним контролям и вычитанием фона. Индекс метилирования для индивидуального CpG-сайта представлен в виде бета-значения ('), которое рассчитывали с использованием отношения интенсивностей флуоресценции метилированных и неметилированных аллелей:
_ Плотность метилированного аллеля
Плотность неметилированного аллеля + Плотность метилированного аллеля + 100
Для CpG-сайтов, представленных на матрице и секвенированных по меньшей мере с 10-кратной глубиной, авторы сравнивали бета-значение, полученное с помощью матрицы, с индексом метилирования, определенным посредством секвенирования того же сайта. Бета-значения выражают плотность метилированных зондов в виде отношения объединенной плотности метилированных и неметилированных зондов, покрывающих один и тот же CpG-сайт. Индекс метилирования для каждого CpG-сайта относится к отношению метилированных ридов к общему количеству ридов, покрывающих указанный CpG.
На фиг. 2А-С приведены графики зависимости бета-значений, определенных с помощью матрицы BeadChip Illumina Infinium HumanMethylation 450K, от индексов метилирования, определенных с помощью полногеномного бисульфитного секвенирования, соответствующих CpG-сайтам, исследованных с помощью обеих платформ: (А) Клетки материнской крови, (В) Образец ворсин хориона, (С) Ткань зрелой плаценты. Данные обеих платформ хорошо согласовались, и коэффициенты корреляции Пирсона составляли 0,972, 0,939 и 0,954; значения R2 составляли 0,945, 0,882 и 0,910 для клеток материнской крови, CVS и ткани зрелой плаценты соответственно.
Авторы также сравнили собственные данных секвенирования с данными, описанными Chu с коллегами, исследовавших профили метилирования 12 пар образцов ДНК CVS и ДНК клеток материнской крови с применением олигонуклеотидной матрицы, захватывающей приблизительно 27 000 CpG-сайтов (Т Chu et al. 2011 PLoS One; 6: е14723). Данные относительно корреляции результатов секвенирования ДНК CVS и клеток материнской крови и каждого из 12 пар образцов в проведенном ранее исследовании давали средний коэффициент Пирсона (0,967) и R2 (0,935) для материнской крови, и средний коэффициент Пирсона (0,943) и R2 (0,888) для CVS. Полученные авторами настоящего изобретения данные относительно CpG-сайтов, представленных на обеих матрицах, хорошо коррелировали с опубликованными данными. Уровни метилирования сайтов, не являющихся CpG-сайтами, составляли < 1% для клеток материнской крови, CVS и плацентарных тканей (табл. 100). Указанные результаты согласуются с современными представлениями о том, что существенные уровни метилирования сайтов, не являющихся CpGсайтами, в основном ограничены плюрипотентными клетками (R Lister et al. 2009 Nature; 462: 315-322; L Laurent et al. 2010 Genome Res; 20: 320-331).
С. Сравнение метиломов плазмы и крови небеременных субъектов.
На фиг. 3А и В приведены гистограммы процентного содержания метилированных CpG-сайтов в плазме и клетках крови, полученных от взрослого мужчины и небеременной взрослой женщины: (А) Аутосомы, (В) Х-хромосома. Графики демонстрируют сходство метиломов плазмы и крови мужчины и небеременной женщины. Общие отношения метилированных CpG-сайтов в образцах плазмы мужчины и небеременной женщины были почти такими же, как в соответствующей ДНК клеток крови (табл. 100 и фиг. 2А и В).
Затем авторы настоящего изобретения исследовали корреляцию профилей метилирования образцов плазмы и клеток крови локус-специфическим образом. Авторы определили плотность метилирования каждого участка размером 100 кб в геноме человека путем определения общего числа неконвертированных цитозинов в CpG-сайтах как доли всех CpG-сайтов, захватываемых ридами последовательностей, картирующимися на область 100 кб. Плотности метилирования хорошо согласовались в образцах плазмы и соответствующих образцах ДНК клеток крови и мужчины, и женщины.
На фиг. 4А и В приведены графики плотностей метилирования соответствующих локусов в ДНК клеток крови и ДНК плазмы: (А) Небеременная взрослая женщина, (В) Взрослый мужчина. Коэффициент корреляции Пирсона и значение R2 для образцов от небеременной женщины составляли, соответственно, 0,963 и 0,927, а для образцов от мужчины, соответственно, 0,953 и 0,908. Эти данные согласуются с полученными ранее результатами, основанными на оценке генотипов молекул ДНК плазмы реципиентов трансплантированных аллогенных гемопоэтических стволовых клеток, которые показали, что гемо- 11 042157 поэтические клетки являются преобладающим источником ДНК в плазме человека (YW Zheng et al. 2012 Clin Chem; 58: 549-558).
D. Уровни метилирования разных метиломов.
Затем авторы настоящего изобретения исследовали уровни метилирования ДНК материнской плазмы, клеток материнской крови и плацентарной ткани для определения уровней метилирования. Указанные уровни определяли для областей повторов, областей без повторов, а также определяли общие уровни.
На фиг. 5А и В приведены гистограммы процентного содержания метилированных CpG-сайтов в образцах, полученных при беременности: (А). Аутосомы, (В) Х-хромосома. Общее содержание метилированных CpG составляло 67,0% и 68,2% для образцов материнской плазмы в первом и третьем триместре, соответственно. В отличие от результатов, полученных от небеременных индивидуумов, указанное содержание было ниже, чем в образце клеток материнской крови в первом триместре, но выше, чем в образцах CVS и ткани зрелой плаценты (табл. 100). Примечательно, что процент метилированных CpG в образце материнской плазмы послеродового периода составлял 73,1%, что аналогично данным для клеток крови (табл. 100). Указанные тренды наблюдались в CpG, встречающихся во всех аутосомах, а также Х-хромосоме, и захватьюали как области без повторов, так и несколько классов повторяющихся элементов генома человека.
Было обнаружено, что и повторяющиеся, и неповторяющиеся элементы в плаценте гипометилированы относительно клеток материнской крови. Эти результаты согласовались с опубликованными данными, согласно которым плацента гипометилирована относительно других тканей, включая клетки периферической крови.
От 71 до 72% секвенированных CpG-сайтов были метилированы в ДНК клеток крови беременной женщины, небеременной женщины и взрослого мужчины (табл. 100 на фиг. 1). Эти данные сопоставимы с сообщением Y Li et al. (Y Li et al. 2010 PLoS Biol; 8: e1000533) о 68,4% CpG-сайтов мононуклеарных клеток крови. В соответствии с предыдущими сообщениями относительно гипометилированной природы плацентарных тканей, 55 и 59% CpG-сайтов были метилированы в CVS и ткани зрелой плаценты, соответственно (табл. 100).
На фиг. 6 приведена гистограмма уровня метилирования разных классов повторов в геноме человека, для материнской крови, плаценты и материнской плазмы. Указанные классы повторов соответствуют определенным браузерам геномов UCSC. Приведены данные для образцов первого триместра. В отличие от ранее полученных данных, предполагающих, что гипометилированная природа плацентарных тканей наблюдалась главным образом в определенных классах повторов в геноме (В Novakovic et al. 2012 Placenta; 33: 959-970), в настоящем описании авторы изобретения демонстрируют, что плацента на самом деле гипометилирована по большинству классов геномных элементов относительно клеток крови.
E. Сходство метиломов.
Варианты реализации позволяют определять метиломы плацентарных тканей, клеток крови и плазмы с применением одной и той же платформы. Соответственно, можно было проводить прямые сравнения метиломов указанных типов биологических образцов. Высокий уровень сходства метиломов клеток крови и плазмы мужчины и небеременной женщины, а также клеток материнской крови и образца материнской плазмы в послеродовой период дополнительно подтверждают, что гемопоэтические клетки являются основным источником ДНК в плазме человека (YW Zheng et al. 2012 Clin Chem; 58: 549-558).
Сходство очевидно с точки зрения как общей доли метилированных CpG в геноме, так и высокой степени корреляции плотностей метилирования соответствующих локусов в ДНК клеток крови и ДНК плазмы. Однако при этом общая доля метилированных CpG в образцах материнской плазмы в первом триместре и в третьем триместре бьшо понижено по сравнению с данными для клеток материнской крови или образца материнской плазмы в послеродовой период. Пониженные уровни метилирования во время беременности были обусловлены гипометилированной природой молекул плодной ДНК, присутствующих в материнской плазме.
Обращение профиля метилирования в образце материнской плазмы в послеродовой период с приобретением большего сходства с профилем клеток материнской крови предполагает, что молекулы плодной ДНК были устранены из материнского кровотока. Расчет концентраций плодной ДНК на основе маркеров ОНП плода действительно показал, что указанная концентрация изменилась от 33,9% в дородовом образце до всего 4,5% в образце в послеродовой период.
F. Другие применения.
Согласно вариантам реализации были успешно собраны метиломы ДНК с помощью МПС-анализа ДНК плазмы. Возможность определения плацентарного или плодного метилома по материнской плазме обеспечивает неинвазивный способ определения, детекции и мониторинга аберрантных профилей метилирования, ассоциированных со связанными с беременностью состояниями, такими как преэклампсия, задержка внутриутробного развития, преждевременные роды и др. Например, детекция специфической для заболевания сигнатуры аберрантного метилирования позволяет проводить скрининг, диагностику и мониторинг таких связанных с беременностью состояний. Измерение уровня метилирования материнской плазмы позволяет проводить скрининг, диагностику и мониторинг таких связанных с беременностью состояний. Помимо непосредственного применения для исследования связанных с беременностью
- 12 042157 состояний, указанный способ может применяться в других областях медицины, для которых анализ ДНК плазмы представляет интерес. Например, метиломы раковых заболеваний могут быть определены по ДНК плазмы страдающих раковым заболеванием пациентов. Анализ метиломов раковых заболеваний по плазме, согласно описанию в настоящем документе, представляет собой потенциальную синергическую технологию анализа ракового генома по плазме (KCA Chan et al. 2013 Clin Chem; 59: 211-224 и RJ Leary et al. 2012 Sci Transl Med; 4:162ra154).
Например, определение уровня метилирования образца плазмы может использоваться для скрининга раковых заболеваний. Если уровень метилирования образца плазмы демонстрирует аберрантные уровни по сравнению со здоровыми контролями, можно предположить наличие рака. В таком случае может быть получено дополнительное подтверждение и проведена оценка типа ракового заболевания или ткани происхождения ракового заболевания путем определения профиля метилирования плазмы в разных геномных локусах или путем геномного анализа плазмы для детекции ассоциированных с опухолью аберраций числа копий, хромосомных транслокаций и однонуклеотидных вариаций. Так, согласно одному варианту реализации настоящего изобретения, определение профиля ракового метилома и генома в плазме может проводиться одновременно. Как вариант, могут использоваться радиологические исследования и визуализация (например, компьютерная томография, магнитно-резонансная визуализация, позитронно-эмиссионная томография) или эндоскопия (например, эндоскопия верхних отделов желудочнокишечного тракта или колоноскопия) для дополнительного обследования индивидуумов, у которых на основании анализа уровня метилирования в плазме предполагается наличие ракового заболевания.
При скрининге или детекции ракового заболевания определение уровня метилирования образца плазмы (или другого биологического материала) может применяться в сочетании с другими методами скрининга или детекции ракового заболевания, такими как измерение простатического специфического антигена (например, для рака предстательной железы), карциноэмбрионального антигена (например, для колоректальной карциномы, карциномы желудка, карциномы поджелудочной железы, карциномы легкого, карциномы молочной железы, медуллярной карциномы щитовидной железы), альфа-фетопротеина (например, для рака печени или герминативно-клеточных опухолей), СА125 (например, для рака яичника и рака молочной железы) и СА19-9 (например, для карциномы поджелудочной железы).
Кроме того, могут быть секвенированы другие ткани для получения клеточного метилома. Например, может быть проанализирована ткань печени для определения паттерна метилирования, специфического для печени, который может быть использован для идентификации патологий печени. Другие ткани, которые также могут быть проанализированы, включают клетки головного мозга, кости, легкие, сердце, мышцы и почки и т.д. Профили метилирования различных тканей могут время от времени изменяться, например, в результате развития, старения, болезненных процессов (например, воспаления или цирроза, или аутоиммунных процессов (таких как при системной красной волчанке)) или лечения (например, лечения деметилирующими агентами, такими как 5-азацитидин и 5-азадезоксицитидин). Динамическая природа метилирования ДНК делает такой анализ потенциально очень полезным для мониторинга физиологических и патологических процессов. Например, если обнаруживается изменение метилома плазмы индивидуума относительно исходного значения, полученного, когда указанный индивидуум был здоров, можно детектировать болезненные процессы в органах, которые вносят вклад в ДНК плазмы.
Также могут быть определены метиломы трансплантированных органов по ДНК плазмы реципиентов трансплантированных органов. Метиломный анализ трансплантатов по плазме согласно описанию настоящего изобретения потенциально представляет собой синергическую технологию геномного анализа трансплантатов по плазме (YW Zheng et al, 2012; YMD Lo et al. 1998 Lancet; 351: 1329-1330; и TM Snyder et al. 2011 Proc Natl Acad Sci USA; 108: 6229-6234). Поскольку ДНК плазмы как правило, рассматривается в качестве маркера клеточной смерти, повышение в плазме уровня ДНК, высвобождаемой из трансплантированного органа, может использоваться в качестве маркера повышения клеточной смерти в указанном органе, например, криза отторжения или других патологических процессов с участием указанного органа (например, инфекции или абсцесса). В случае успешного проведения терапии, направленной против отторжения, уровень высвобождаемой трансплантированным органом ДНК в плазме предположительно будет снижаться.
III. Определение метилома плода или опухоли с использованием ОНП
Согласно приведенному выше описанию метилом плазмы соответствует метилому крови у небеременного здорового индивидуума. Однако у беременной женщины указанные метиломы различаются. Молекулы плодной ДНК циркулируют в материнской плазме наряду с составляющим фон большинством молекул материнской ДНК (YMD Lo et al. 1998 Am J Hum Genet; 62: 768-775). Таким образом, у беременной женщины метилом плазмы в значительной степени представляет собой смесь плацентарного метилома и метилома крови. Соответственно, можно получить плацентарный метилом, используя плазму.
Согласно одному варианту реализации различия однонуклеотидных полиморфизмов (ОНП) между матерью и плодом используют для идентификации молекул плодной ДНК в материнской плазме. Цель заключалась в идентификации ОНП-локусов, по которым мать гомозиготна, а плод гетерозиготен; специфичный для плода аллель может применяться для определения того, какие фрагменты ДНК принадле
- 13 042157 жат плоду. Геномную ДНК из клеток материнской крови исследовали с применением матрицы для генотипирования ОНП Illumina HumanOmni2.5-8. С другой стороны, для ОНП-локусов, по которым мать гетерозиготна, а плод гомозиготен, аллель ОНП, специфичный для матери, может применяться для определения того, какие фрагменты ДНК плазмы принадлежат матери. Уровень метилирования таких фрагментов ДНК будет отражать уровень метилирования соответствующих геномных областей у матери.
А. Корреляция метилирования специфичных для плода ридов и плацентарного метилома.
Локусы, в которых содержится два разных аллеля, причем количество одного аллеля (В) значительно меньше количества другого аллеля (А), идентифицировали по результатам секвенирования биологического образца. Риды, покрывающие аллели В, считали специфичными для плода (специфичные для плода риды). Мать определяли как гомозиготную по А, а плод как гетерозиготный по А/В, и, соответственно, риды, покрывающие аллель А, были общими для матери и плода (общие риды).
В одном проанализированном случае беременности, который использовали для иллюстрации нескольких концепций настоящего изобретения, было обнаружено, что беременная мать гомозиготна по 1945516 локусам на аутосомах. Изучали риды секвенирования ДНК материнской плазмы, покрывающие указанные ОНП. Риды, несущие не являющийся материнским аллель, были обнаружены в 107 750 локусах, и указанные локусы считали информативными. В каждом информативном ОНП аллель, происходящий не от матери, называли специфичным для плода аллелем, а другой называли общим аллелем.
Может быть определена фракционная концентрация плодной/опухолевой ДНК (также называемая процентом плодной ДНК) в материнской плазме. Согласно одному варианту реализации фракционную концентрацию плодной ДНК в материнской плазмеД определяют из уравнения:
где р представляет собой число ридов секвенирования со специфичным для плода аллелем, и q представляет собой число ридов секвенирования с общим для матери и плода аллелем (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91). Доля плодной ДНК в образцах материнской плазмы первом триместре, третьем триместре и в послеродовой период, как было установлено, составляет 14,4, 33,9 и 4,5%, соответственно. Долю плодной ДНК также рассчитывали с применением числа ридов, выравниваемых по Yхромосоме. На основе данных Y-хромосомы эти результаты составили 14,2, 34,9 и 3,7% соответственно, в образцах материнской плазмы в первом триместре, в третьем триместре и в послеродовой период.
Варианты реализации, где используется раздельный анализ специфичных для плода или общих ридов последовательностей, демонстрируют, что циркулирующие молекулы плодной ДНК в значительно большей степени гипометилированы, чем фоновые молекулы ДНК. Сравнения плотностей метилирования соответствующих локусов в специфичных для плода ридах материнской плазмы и данных для плацентарной ткани, как для первого, так и для третьего триместра, показали высокие уровни корреляции. Эти данные обеспечивают на геномном уровне подтверждение того, что плацента является основным источником происходящих от плода молекул ДНК в материнской плазме, и представляют собой важный шаг вперед по сравнению с имевшимися данными, основанными на информации, полученной для отдельных локусов.
Авторы определяли плотность метилирования каждой области объемом 1 Мб в геноме с использованием либо специфичных для плода, либо общих ридов, захватывающих CpG-сайты, смежные с информативными ОНП. Плодный и неспецифичный для плода метиломы, собранные из ридов последовательностей материнской плазмы, могут быть представлены, например, на Circos-графике (М Krzywinski et al. 2009 Genome Res; 19: 1639-1645). Плотности метилирования в расчете на участок размером 1 Мб также определяли для образцов клеток материнской крови и плацентарной ткани.
На фиг. 7А приведен Circos-график 700 для образцов, полученных в первом триместре. На фиг. 7В приведен Circos-график 750 для образцов, полученных в третьем триместре. Графики 700 и 750 отображают плотность метилирования в расчете на участок 1 Мб. Идеограммы хромосом (внешний круг) ориентированы от короткого плеча к длинному плечу по часовой стрелке (центромеры выделены красным цветом). Второй снаружи круг представляет число CpG-сайтов в соответствующих областях размером 1 Мб. Для красных столбцов приведена шкала до 20000 сайтов на участок 1 Мб. Плотности метилирования соответствующих областей размером 1 Мб показаны на других кругах с использованием цветовой схемы, приведенной в центре.
Для образцов первого триместра (фиг. 7А), от центра к краям, на кругах представлены: образец ворсин хориона, специфичные для плода риды в материнской плазме, специфичные для матери риды в материнской плазме, комбинация плодных и неплодных ридов в материнской плазме, и клетки материнской крови. Для образцов третьего триместра (фиг. 7В) на кругах представлены: ткань зрелой плаценты, специфичные для плода риды в материнской плазме, специфичные для матери риды в материнской плазме, комбинация плодных и не относящихся к плоду ридов в материнской плазме, в материнской плазме в послеродовой период и клетках материнской крови (из образца крови первого триместра). Видно, что в образцах плазмы и в первом, и в третьем триместре плодные метиломы более гипометилированы, чем в неспецифичных для плода метиломах.
- 14 042157
Общий профиль метилирования плодных метиломов больше напоминал профиль образцов CVS или плацентарной ткани. С другой стороны, профиль метилирования ДНК для общих ридов в плазме, преимущественно представляющих материнскую ДНК, больше напоминал профиль клеток материнской крови. Затем авторы настоящего изобретения провели систематическое сравнение плотностей метилирования локусов одного за другим, ридов ДНК материнской плазмы и материнских или плодных тканей. Авторы определили плотности метилирования CpG-сайтов, которые присутствовали на том же риде последовательности, что и информативные ОНП, и которые были покрыты по меньшей мере 5 ридами последовательностей ДНК материнской плазмы.
На фиг. 8A-D приведены графики сравнения плотностей метилирования геномной тканевой ДНК и ДНК материнской плазмы для CpG-сайтов, окружающих информативные однонуклеотидные полиморфизмы. На фиг. 8А показаны плотности метилирования для специфичных для плода ридов в образце материнской плазмы в первом триместре относительно плотностей метилирования для ридов в образце CVS. Как можно видеть, специфичные для плода значения хорошо согласуются со значениями для CVS.
На фиг. 8В показаны плотности метилирования для специфичных для плода ридов в образце материнской плазмы в третьем триместре относительно плотностей метилирования для ридов в ткани зрелой плаценты. Наборы плотностей также хорошо согласуются, указывая на то, что плодный профиль метилирования может быть получен путем анализа ридов со специфичными для плода аллелями.
На фиг. 8С показаны плотности метилирования для общих ридов в образце материнской плазмы в первом триместре относительно плотностей метилирования для ридов в клетках материнской крови. С учетом того, что большинство общих ридов происходят от матери, указанные два набора значений хорошо согласуются. На фиг. 8D показаны плотности метилирования для общих ридов в образце материнской плазмы в третьем триместре относительно плотностей метилирования для ридов в клетках материнской крови.
Для специфичных для плода ридов в материнской плазме коэффициент корреляции Спирмена между материнской плазмой в первом триместре и CVS составлял 0,705 (Р<2,2*е-16); между материнской плазмой в третьем триместре и тканью зрелой плаценты указанный коэффициент составлял 0,796 (Р<2,2*е-16) (фиг. 8А и В). Аналогичное сравнение выполняли для общих ридов в материнской плазме с данными клеток материнской крови. Коэффициент корреляции Пирсона составлял 0,653 (Р<2,2*е-16) для образца плазмы в первом триместре, и 0,638 (Р <2,2*е-16) для образца плазмы в третьем триместре (фиг. 8С и D).
В. Плодный метилом.
Согласно одному варианту реализации для сборки плодного метилома по материнской плазме авторы настоящего изобретения отбирали риды последовательностей, захватывающие по меньшей мере один информативный плодный ОНП-сайт и содержавшие по меньшей мере один CpG-сайт в составе того же рида. Риды, где обнаруживались специфичные для плода аллели, включали в сборку плодного метилома. Риды, где обнаруживался общий аллель, т.е. аллель, не являющийся специфичным для плода, включали в сборку неспецифичного для плода метилома, который преимущественно состоит из происходящих от матери молекул ДНК.
Специфичные для плода риды покрывали 218 010 CpG-сайтов на аутосомах в образцах материнской плазмы в первом триместре. Соответствующие значения для образцов материнской плазмы в третьем триместре и в послеродовой период составляли 263 611 и 74 020 соответственно. В среднем, общие риды покрывали указанные CpG-сайты со средней кратностью 33,3, 21,7 и 26,3, соответственно. Специфичные для плода риды покрывали указанные CpG-сайты с кратностью 3,0, 4,4 и 1,8 соответственно, для образцов материнской плазмы первого триместра, третьего триместра и послеродового периода.
Плодная ДНК представляет собой минорную популяцию в материнской плазме и, соответственно, покрытие указанных CpG-сайтов специфичными для плода ридами было пропорционально проценту плодной ДНК в образце. Для образца материнской плазмы в первом триместре общий процент метилированных CpG в ридах плода составлял 47,0%, тогда как для общих ридов он составлял 68,1%. Для образца материнской плазмы в третьем триместре процент метилированных CpG в ридах плода составлял 53,3%, тогда как для общих ридов он составлял 68,8%. Эти данные показали, что специфичные для плода риды в материнской плазме были более гипометилированы, чем общие риды в материнской плазме.
С. Способ.
Описанные выше методики также могут применяться для определения опухолевого профиля метилирования. Ниже описаны способы определения плодных и опухолевых профилей метилирования.
Фиг. 9 представляет собой блок-схему, иллюстрирующую способ 900 определения первого профиля метилирования по биологическому образцу организма в соответствии с вариантами реализации настоящего изобретения. Способ 900 позволяет сконструировать эпигенетическую карту плода по профилю метилирования материнской плазмы. Биологический образец включает свободную от клеток ДНК, содержащую смесь свободной от клеток ДНК, происходящей из первой ткани и из второй ткани. Например, указанная первая ткань может происходить от плода, из опухоли или трансплантированного органа.
На этапе 910 анализируют множество молекул ДНК из указанного биологического образца. Анализ молекулы ДНК может включать определение локализации указанной молекулы ДНК в геноме указанно
- 15 042157 го организма, определение генотипа молекулы ДНК, и определение того, метилирована ли указанная молекула ДНК в одном или большем числе сайтов.
Согласно одному варианту реализации молекулы ДНК анализируют с использованием ридов последовательностей молекул ДНК, при этом секвенирование чувствительно к метилированию. Соответственно, указанные риды последовательностей включают статус метилирования молекул ДНК из указанного биологического образца. Статус метилирования может включать информацию о том, является ли конкретный остаток цитозина 5-метилцитозином или 5-гидроксиметилцитозином. Указанные риды последовательностей могут быть получены с помощью различных методик секвенирования, методик ПЦР, матриц и других подходящих методик идентификации последовательностей фрагментов. Статус метилирования сайтов рида последовательностей может быть определен согласно описанию в настоящем документе.
На этапе 920 идентифицируют множество первых локусов, отличающихся тем, что первый геном первой ткани гетерозиготен по соответствующему первому аллелю, и соответствующий второй аллель и второй геном второй ткани гомозиготен по соответствующему первому аллелю. Например, специфичные для плода риды могут быть идентифицированы во множестве первых локусов, или специфичные для опухоли риды могут быть идентифицированы во множестве первых локусов. Тканеспецифичные риды могут быть идентифицированы по ридам при секвенировании, где процент ридов последовательностей второго аллеля попадает в определенный диапазон, например, приблизительно 3-25%, таким образом указывая на минорную популяцию фрагмента ДНК из гетерозиготного генома в указанном локусе и мажорную популяцию из гомозиготного генома в указанном локусе.
На этапе 930 анализируют молекулы ДНК, локализованные в одном или большем числе сайтов каждого из первых локусов. Определяют число молекул ДНК, которые метилированы в сайте и соответствуют соответствующему второму аллелю указанного локуса. Может присутствовать более одного сайта на локус. Например, ОНП может указывать на то, что фрагмент специфичен для плода, и указанный фрагмент может содержать несколько сайтов, статус метилирования которых определяют. Может быть определено число метилированных ридов в каждом сайте и общее число метилированных ридов для локуса.
Локус может быть определен через конкретное число сайтов, конкретный набор сайтов, или конкретный размер области вокруг вариации, которая содержит специфичный для ткани аллель. Локус может содержать всего один сайт. Сайты могут обладать специфическими свойствами, например, быть CpG-сайтами. Определение числа неметилированных ридов эквивалентно определению статуса метилирования и включено в него.
На этапе 940 для каждого из первых локусов рассчитывают плотность метилирования на основе количеств молекул ДНК, метилированных в одном или большем числе сайтов указанного локуса и соответствующих соответствующему второму аллелю указанного локуса. Например, плотность метилирования может быть определена для CpG-сайтов, соответствующих локусу.
На этапе 950 определяют первый профиль метилирования первой ткани по плотностям метилирования для первых локусов. Указанный первый профиль метилирования может соответствовать конкретным сайтам, например, CpG-сайтам. Указанный профиль метилирования может относиться ко всем локусам, содержащим специфичный для плода аллель, или только к некоторым из указанных локусов.
IV. Использование различий метиломов плазмы и крови
Выше было показано, что специфичные для плода риды из плазмы коррелируют с плацентарным метиломом. Поскольку материнский компонент метилома материнской плазмы в основном определяется клетками крови, различия между метиломом плазмы и метиломом крови могут применяться для определения плацентарного метилома для всех локусов, а не только локализации специфичных для плода аллелей. Различия между метиломом плазмы и метиломом крови также могут применяться для определения метилома опухоли.
А. Способ.
Фиг. 10 представляет собой блок-схему, иллюстрирующую способ 1000 определения первого профиля метилирования по биологическому образцу организма в соответствии с вариантами реализации настоящего изобретения. Указанный биологический образец (например, плазма) включает свободную от клеток ДНК, содержащую смесь свободной от клеток ДНК, происходящей из первой ткани и из второй ткани. Указанный первый профиль метилирования соответствует профилю метилирования первой ткани (например, плодной ткани или опухолевой ткани). Способ 1200 может обеспечивать определение дифференциально метилированных областей по материнской плазме.
На этапе 1010 получают биологический образец. Указанный биологический образец может быть получен просто с помощью аппарата (например, секвенатора). Указанный биологический образец может быть представлен формой, полученной из организма, или обработанной формой, например, указанный образец может представлять собой плазму, экстрагированную из образца крови.
На этапе 1020 получают второй профиль метилирования, соответствующий ДНК второй ткани. Указанный второй профиль метилирования может быть считан из памяти, так как возможно он был определен ранее. Указанный второй профиль метилирования может быть определен по второй ткани, например, другого образца, который содержит исключительно или преимущественно клетки второй ткани. Указанный второй профиль метилирования может соответствовать клеточному профилю метилирования
- 16 042157 и быть получен из клеточной ДНК. Согласно другому примеру указанный второй профиль может быть определен по образцу плазмы, полученному до беременности или до развития ракового заболевания, так как метилом плазмы небеременного индивидуума, не страдающего раковым заболеванием, в значительной мере аналогичен метилому клеток крови.
Указанный второй профиль метилирования может обеспечивать плотность метилирования в каждом из множества локусов в геноме указанного организма. Плотность метилирования в конкретном локусе соответствует доле метилированной ДНК второй ткани. Согласно одному варианту реализации плотность метилирования представляет собой плотность метилирования CpG, при этом CpG-сайты, связанные с локусом, используют для определения плотности метилирования. Если на один локус приходится один сайт, плотность метилирования может быть равна индексу метилирования. Плотность метилирования также соответствует плотности отсутствия метилирования, так как указанные два значения взаимно дополняют друг друга.
Согласно одному варианту реализации указанный второй профиль метилирования получают путем проведения чувствительного к метилированию секвенирования клеточной ДНК из образца организма. Один из примеров чувствительного к метилированию секвенирования включает обработку ДНК бисульфитом натрия и затем осуществление секвенирования ДНК. Согласно другому примеру чувствительное к метилированию секвенирование может осуществляться без применения бисульфита натрия, с применением платформы для мономолекулярного секвенирования, позволяющей устанавливать статус метилирования молекул ДНК (включая N6-метиладенин, 5-метилцитозин и 5-гидроксиметилцитозин) непосредственно, без бисульфитной конверсии (АВ Flusberg et al. 2010 Nat Methods; 7: 461-465; J Shim et al. 2013 Sci Rep; 3:1389. ЦИО: 10.1038/srep01389); или посредством иммунопреципитации метилированного цитозина (например, с применением антитела против метилцитозина или с применением связывающего метилированную ДНК белка или пептида (LG Acevedo et al. 2011 Epigenomics; 3: 93-101) с последующим секвенированием; или путем применения чувствительных к метилированию рестрикционных ферментов с последующим секвенированием. Согласно другому варианту реализации используют методики без секвенирования, такие как матрицы, цифровая ПЦР и масс-спектрометрия.
Согласно другому варианту реализации вторая плотность метилирования второй ткани может быть получена ранее из контрольных образцов от субъекта или от других субъектов. Плотность метилирования от другого субъекта может работать в качестве референсного профиля метилирования, характеризующегося референсными плотностями метилирования. Референсные плотности метилирования могут быть определены по нескольким образцам, при этом среднее уровня (или другая статистическая величина) разных плотностей метилирования в локусе может использоваться в качестве референсной плотности метилирования в указанном локусе.
На этапе 1030 определяют профиль метилирования свободной от клеток ДНК по свободной от клеток ДНК из смеси. Указанный профиль метилирования свободной от клеток ДНК определяет плотность метилирования в каждом из множества локусов. Указанный профиль метилирования свободной от клеток ДНК может быть определен путем получения ридов последовательностей при секвенировании свободной от клеток ДНК, при этом информацию о метилировании получают с ридами последовательностей. Указанный профиль метилирования свободной от клеток ДНК может быть определен тем же способом, что и клеточный метилом.
На этапе 1040 определяют процент свободной от клеток ДНК из первой ткани в биологическом образце. Согласно одному варианту реализации указанная первая ткань представляет собой плодную ткань, и соответствующая ДНК представляет собой плодную ДНК. Согласно другому варианту реализации указанная первая ткань представляет собой опухолевую ткань, и соответствующая ДНК представляет собой опухолевую ДНК. Указанный процент может быть определен различными способами, например, с использованием специфичного для плода аллеля или специфичного для опухоли аллеля. Число копий также может быть использовано для определения указанного процента, например, согласно описанию во включенной посредством ссылки заявке на патент США 13/801748, озаглавленной Мутационный анализ ДНК плазмы для детекции раковых заболеваний (Mutational Analysis Of Plasma DNA For Cancer Detection), которая была подана 13 марта 3013 г.
На этапе 1050 идентифицируют множество локусов для определения первого метилома. Указанные локусы могут соответствовать каждому из локусов, используемых для определения профиля метилирования свободной от клеток ДНК и второго профиля метилирования. Таким образом, соответствовать может множество локусов. Возможно, может быть использовано большее количество локусов для определения профиля метилирования свободной от клеток ДНК и второго профиля метилирования.
Согласно некоторым вариантам реализации могут быть идентифицированы локусы, которые были гиперметилированы или гипометилированы во втором профиле метилирования, например, с применением клеток материнской крови. Для идентификации локусов, которые были гиперметилированы в клетках материнской крови, можно провести сканирование хромосомы с одного конца для обнаружения CpGсайта с индексом метилирования >Х% (например, 80%). Затем можно провести поиск следующего CpGсайта в расположенной ниже (3') области (например, на расположенном ниже отрезке 200 п.о.). Если рас
- 17 042157 положенный непосредственно ниже CpG-сайт также имеет индекс метилирования >Х% (или > другой указанной величины), первый и второй CpG-сайты могут быть сгруппированы. Распределение по группам может продолжаться либо до тех пор, пока в составе следующей расположенной ниже области не останется CpG-сайтов; либо до тех пор, пока индекс метилирования расположенного непосредственно ниже CpG-сайта не составит < Х%. Область сгруппированных CpG-сайтов может быть описана как гиперметилированная в клетках материнской крови, если указанная область содержит по меньшей мере пять непосредственно смежных гиперметилированных CpG-сайтов. Аналогичный анализ для поиска локусов, которые были гипометилированы в клетках материнской крови, может осуществляться для CpGсайтов с индексами метилирования <20%. Плотности метилирования для второго профиля метилирования могут быть рассчитаны для предварительно отобранных локусов и использованы для установления первого профиля метилирования (например, плотности метилирования плацентарной ткани) соответствующих локусов, например, по данным бисульфитного секвенирования материнской плазмы.
На этапе 1060 определяют первый профиль метилирования первой ткани путем расчета дифференциального параметра, который включает разность между плотностью метилирования второго профиля метилирования и плотностью метилирования профиля метилирования свободной от клеток ДНК для каждого из множества локусов. Указанную разность выражают в процентах.
Согласно одному варианту реализации первую плотность метилирования локуса в первой (например, плацентарной) ткани (D) выводили с применением следующего уравнения:
СтЬс-тр) D-mbc-где mbc обозначает плотность метилирования второго профиля метилирования в локусе (например, предварительно отобранном локусе, определенном по данным бисульфитного секвенирования в клетках материнской крови); mp обозначает плотность метилирования соответствующего локуса в материнской плазме по данным бисульфитного секвенирования; f отражает процент свободной от клеток ДНК из первой ткани (например, фракционную концентрацию плодной ДНК), и CN отражает число копий в указанном локусе (например, более высокое значение для амплификации или более низкое число для делеций относительно нормы). Если амплификации или делеции в первой ткани отсутствуют, CN может быть равен 1. При трисомии (или дупликации области в опухоли или у плода) CN может быть равен 1,5 (поскольку происходит увеличение от 2 копий до 3 копий) и для моносомии может быть равен 0,5. При более высоких уровнях амплификации может происходить увеличение с шагом 0,5. В указанном примере D может соответствовать дифференциальному параметру.
На этапе 1070 преобразуют первую плотность метилирования для получения скорректированной первой плотности метилирования первой ткани. Указанное преобразование позволяет учесть фиксированные различия между дифференциальными параметрами и фактическим профилем метилирования первой ткани. Например, указанные значения могут отличаться на фиксированную константу или на коэффициент. Указанное преобразование может быть линейным или нелинейным.
Согласно одному варианту реализации было обнаружено, что распределение выведенных значений, D, ниже, чем фактический уровень метилирования плацентарной ткани. Например, выведенные значения могут быть линейно преобразованы с применением данных для CpG-островков, представлявших собой геномные сегменты с преобладанием CpG-сайтов. Положения в геноме CpG-островков, используемых в указанном исследовании, получали из базы данных браузера геномов UCSC (версия NCBI 36/hg18) (PA Fujita et al. 2011 Nucleic Acids Res; 39: D876-882). Например, CpG-островок может быть определен как геномный сегмент с содержанием GC>50%, длиной в геноме >200 п.о. и отношением наблюдаемого/ожидаемого числа CpG>0,6 (M Gardiner-Garden et al 1987 J Mol Biol; 196:261-282).
Согласно одному варианту реализации для получения уравнения линейного преобразования могут быть включены CpG-островки по меньшей мере с 4 CpG-сайтами и средней глубиной секвенирования >5 на CpG-сайт в секвенированных образцах. После определения линейных зависимостей между плотностями метилирования CpG-островков в CVS или зрелой плаценте, и выведенными значениями, D, использовали следующие уравнения для определения прогнозируемых значений.
Прогнозируемые значения для первого триместра =Dx 1,6+0,2 Прогнозируемые значения для третьего триместра =Dx 1,2+0,05
В. Пример с плодом.
Как упоминалось выше, способ 1000 может применяться для выведения ландшафта метилирования плаценты по материнской плазме. Циркулирующая ДНК в плазме в основном происходит из гемопоэтических клеток. Т ем не менее, присутствует неустановленная доля свободной от клеток ДНК, поступающей из других внутренних органов. Кроме того, происходящая из плаценты свободная от клеток ДНК составляет приблизительно 5-40% от всей ДНК в материнской плазме, со средним значением приблизительно 15%. Соответственно, можно сделать предположение, что уровень метилирования в материнской плазме эквивалентен сумме существующего фонового метилирования и вклада плаценты во время беременности, согласно приведенному выше описанию.
Уровень метилирования в материнской плазме, МР, может быть определен с применением следую- 18 042157 щего уравнения:
MP = BKG х (1 - Л + PLN х / где BKG представляет фоновый уровень метилирования ДНК в плазме, полученной из клеток крови и внутренних органов, PLN представляет уровень метилирования плаценты и f представляет фракционную концентрацию плодной ДНК в материнской плазме.
Согласно одному варианту реализации уровень метилирования плаценты может теоретически быть выведен исходя из уравнения:
MP-BKG X ¢1-/)
PLN = (2)
Уравнения (1) и (2) эквивалентны, если CN равен 1, D равен PLN, и BKG равен mbc. Согласно другому варианту реализации фракционную концентрацию плодной ДНК можно считать принимающей указанное значение, или устанавливать на уровне указанного значения, например, в рамках предположения о присутствии минимальной f.
Уровень метилирования материнской крови принимали за фоновое метилирование материнской плазмы. Помимо локусов, которые были гиперметилйрованы или гипометилированы в клетках материнской крови, авторы настоящего изобретения дополнительно исследовали способ выведения, фокусируясь на определенных клинически релевантных областях, например, CpG-островках в геноме человека.
Среднее плотности метилирования для общего количества 27 458 CpG-островков (версия NCBI 36/hg18) на аутосомах и Х-хромосоме получали из данных секвенирования материнской плазмы и плаценты. Отбирали только островки с покрытием >10 CpG-сайтов и средней глубиной секвенирования >5 в расчете на покрытые CpG-сайты во всех анализируемых образцах, включая плаценту, материнскую кровь и материнскую плазму. В результате оставляли 26 698 CpG-островков (97,2%) как удовлетворяющих условию, и для них выводили уровень метилирования с применением данных о метилировании плазмы и фракционную концентрацию плодной ДНК в соответствии с приведенным выше уравнением.
Было отмечено, что распределение выведенных значений PLN было ниже фактического уровня метилирования CpG-островков в плацентарной ткани. Соответственно, согласно одному варианту реализации выведенные значения PLN, или просто выведенные значения (D) использовали в качестве условной единицы оценки уровня метилирования CpG-островков в плаценте. После преобразования выведенные значения линеаризовали, и их распределение начинало в большей степени напоминать фактический набор данных. Преобразованные выведенные значения были названы прогностическими значениями метилирования (MPV) и впоследствии использовались для прогнозирования уровня метилирования генетических локусов в плаценте.
В указанном примере CpG-островки классифицировали на 3 категории на основе их плотностей метилирования в плаценте: Низкая (<0,4), Средняя (>0,4-<0,8) и Высокая (>0,8). Используя уравнение для выведения, авторы настоящего изобретения рассчитывали MPV для одного и того же набора CpGостровков и затем использовали указанные значения для классификации островков на 3 категории с одними и теми же точками отсечения. Сравнив фактические и выведенные наборы данных, авторы настоящего изобретения обнаружили, что 75,1% предварительно отобранных CpG-островков могут быть корректно сопоставлены по MPV с теми же категориями данных для тканей. Приблизительно 22% CpGостровков были распределены в одну группу при различии на один уровень (высокая/средняя, или средняя/низкая плотность) и менее чем 3% предположительно были полностью неправильно классифицированы (высокая/низкая плотность) (фиг. 12А). Также определяли общую эффективность классификации: 86,1, 31,4 и 68,8% CpG-островков с плотностями метилирования <0,4, >0,4-<0,8 и >0,8 в плаценте были корректно сочтены имеющими низкую, среднюю и высокую плотность метилирования (фиг. 12В).
На фиг. 11А и В приведены графические представления эффективности алгоритма прогнозирования с применением данных материнской плазмы и фракционной концентрации плодной ДНК в соответствии с вариантами реализации настоящего изобретения. На фиг. 11А приведено графическое представление 1100, демонстрирующее точность классификации CpG-островков с применением классификации с коррекцией по MPV (выведенная категория точно совпадает с фактическим набором данных); различие на 1 уровень (выведенная категория отличается на 1 уровень от фактического набора данных); и ошибочная классификация (выведенная категория противоположна фактическому набору данных). Фиг. 11В представляет собой графическое представление 1150, отражающее долю классифицируемых CpG-островков в каждой из выведенных категорий.
При условии, что материнское фоновое метилирование в соответствующих геномных областях незначительно, присутствие гиперметилированной происходящей из плаценты ДНК в кровотоке повышает общий уровень метилирования плазмы до степени, которая зависит от фракционной концентрации плодной ДНК. Выраженное изменение может наблюдаться в том случае, когда высвободившаяся плодная ДНК полностью метилирована. И напротив, если материнское фоновое метилирование значительно, степень изменения уровня метилирования плазмы станет более значительной при высвобождении гипометилированной плодной ДНК. Таким образом, применение указанного алгоритма выведения может быть более целесообразным тогда, когда уровень метилирования выводят для генетических локусов, которые,
- 19 042157 по имеющимся сведениям, различаются для материнского фона и плаценты, в частности, для гиперметилированных и гипометилированных маркеров плаценты.
Фиг. 12А представляет собой табл. 1200, где приведены подробные данные для 15 выбранных геномных локусов для прогнозирования метилирования в соответствии с вариантами реализации настоящего изобретения. Для подтверждения методик авторы настоящего изобретения выбрали 15 в различной степени метилированных геномных локусов, которые были исследованы ранее. Уровни метилирования выбранных областей выводили и сравнивали с ранее исследованными 15-ю метилированными в различной степени генетическими локусами (RWK Chiu et al. 2007 Am J Pathol; 170: 941-950; S.S.C. Chim et al. 2008 Clin Chem; 54: 500-511; SSC Chim et al. 2005 Proc Natl Acad Sci USA; 102: 14753-14758; DWY Tsui et al. 2010 PLoS One; 5: e15069).
Фиг. 12В представляет собой графическое представление 1250 выведенных категорий 15 выбранных геномных локусов и соответствующих им уровней метилирования в плаценте. Были выведены следующие категории метилирования: низкое, <0,4; среднее, >0,4-<0,8; высокое, >0,8. Табл. 1200 и графическое представление 1300 демонстрируют, что уровни метилирования в плаценте могут быть корректно выведены для них с несколькими исключениями: RASSF1A, CGI009, CGI137 и VAPA. Из указанных 4 маркеров только CGI009 показал заметное расхождение с фактическим набором данных. Остальные были в минимальной степени неправильно классифицированы.
В табл. 1200 1 относится к выведенным значениям (D), рассчитываемым по уравнению:
где f представляет собой фракционную концентрацию плодной ДНК. Отметка 2 относится к прогностическим значениям метилирования (MPV), относящимся к линеаризованным выведенным значениям с применением следующего уравнения: MPV = D х 1,6 + 0,25. Отметка 3 относится к точкам отсечения классификации для выведенных значений: Низкая, <0,4; Средняя, >0,4-<0,8; Высокая, >0,8. Отметка 4 относится к точкам отсечения классификации для фактического плацентарного набора данных: Низкая, <0,4; Средняя, >0,4-<0,8; Высокая, >0,8. Отметка 5 означает, что плацентарный статус относится к статусу метилирования плаценты относительно статуса метилирования клеток материнской крови.
С. Расчет фракционных концентраций плодной ДНК.
Согласно одному варианту реализации для определения процента плодной ДНК из первой ткани можно использовать Y-хромосому для плода мужского пола. Доля последовательностей Y-хромосомы (% chrY) в образце материнской плазмы была представлена смесью ридов Y-хромосомы, полученных от плода мужского пола, и ряда материнских (женских) ридов, которые ошибочно выравнивали по Yхромосоме (RWK Chiu et al. 2011 BMJ; 342: c7401). Соответственно, зависимость между %chrY и фракционной концентрацией плодной ДНК (f) в образце может быть задана как:
где %chrYmale относится к соотношению ридов, выравниваемых по Y-хромосоме, в образце плазмы, содержащем 100% мужской ДНК; и %chrYfemale относится к соотношению ридов, выравниваемых по Yхромосоме в образце плазмы, содержащем 100% женской ДНК.
Значение %chrY может быть определено по ридам, которые выравнивались по Y-хромосоме без несовпадений, из образца, полученного от женщины, беременной плодом мужского пола, например, по ридам, полученным из конвертированных бисульфитом образцов. Значение %chrYmale может быть получено с помощью бисульфитного секвенирования двух образцов плазмы взрослого мужчины. Значение %chrYfemale может быть получен с помощью бисульфитного секвенирования двух образцов плазмы небеременной взрослой женщины.
Согласно другим вариантам реализации процент плодной ДНК может быть определен по специфичным для плода аллелям на аутосоме. В другом примере для определения процента плодной ДНК могут использоваться эпигенетические маркеры. Могут также использоваться другие способы определения процента плодной ДНК.
D. Способ применения метилирования для определения числа копий.
Плацентарный геном более гипометилирован, чем материнский геном. Как обсуждалось выше, метилирование плазмы беременной женщины зависит от фракционной концентрации происходящей из плаценты плодной ДНК в материнской плазме. Таким образом, посредством анализа плотности метилирования хромосомной области можно детектировать различие вклада плодных тканей в материнскую плазму. Например, у беременной женщины, вынашивающей трисомный плод (например, страдающий трисомией 21, или трисомией 18, или трисомией 13), указанный плод будет вносить дополнительное количество ДНК из трисомической хромосомы в материнскую плазму по сравнению с дисомическими хромосомами. В указанной ситуации плотность метилирования плазмы для трисомической хромосомы (или любой хромосомной области, содержащей амплификацию) будет ниже, чем плотности метилирования дисомических хромосом. Степень различия можно прогнозировать путем математического расчета, с учетом фракционной концентрации плодной ДНК в образце плазмы. Чем выше фракционная концентрация плодной ДНК в образце плазмы, тем значительнее будет различие плотности метилирования между
- 20 042157 трисомическими и дисомическими хромосомами. Для областей, содержащих делецию, плотность метилирования будет выше.
Одним из примеров делеции является синдром Тернера, при котором плод женского пола имеет только одну копию Х-хромосомы. В указанной ситуации у беременной женщины, вынашивающей плод, страдающий синдромом Тернера, плотность метилирования Х-хромосомы в ДНК плазмы будет выше, чем в ситуации, когда та же беременная женщина вынашивает плод женского пола с нормальным числом Х-хромосом. Согласно одному варианту реализации указанной стратегии сначала может быть проанализирована материнская плазма на присутствие или отсутствие последовательностей Y-хромосомы (например, с применением МПС или методики на основе ПЦР). Если последовательности Y-хромосомы присутствуют, плод может быть классифицирован как плод мужского пола, и в последующем анализе не будет необходимости. С другой стороны, если последовательности Y-хромосомы в материнской плазме отсутствуют, плод может быть классифицирован как плод женского пола. В указанной ситуации может быть проведен анализ плотности метилирования Х-хромосомы в материнской плазме. Более высокая плотность метилирования Х-хромосомы по сравнению с нормальной будет указывать на высокий риск наличия синдрома Тернера у плода. Указанный способ также может применяться для других анеуплоидий половых хромосом. Например, у плода XYY плотность метилирования Y-хромосомы в материнской плазме будет ниже, чем у нормального плода XY при аналогичном уровне плодной ДНК в материнской плазме. В другом примере у плода, страдающего синдромом Клайнфельтера (XXY), в материнской плазме присутствуют последовательности Y-хромосомы, однако плотность метилирования Х-хромосомы в материнской плазме ниже, чем для нормального плода XY при аналогичном уровне плодной ДНК в материнской плазме.
Исходя из вышесказанного, плотность метилирования в плазме для дисомической хромосомы ίΧΛΡ ϊ A MPNm_aneu=BKGx(l-f) + PLNxf „ (MPNon_aneu) может быть рассчитана как: > где BKG представляет собой фоновый уровень метилирования ДНК в плазме, полученный на клетках крови и внутренних органов, PLN представляет собой уровень метилирования плаценты и f представляет собой фракционную концентрацию плодной ДНК в материнской плазме.
Плотность метилирования в плазме для трисомической хромосомы (MPAneu) может быть рассчитана „ . МРАпви = BKG xQi-f ) + PLN х f xl,5 , .___ Λ .
как: Апви * > где 1,5 соответствует числу копий CN и добавление еще одной хромосомы дает увеличение на 50%. Различие между трисомическими и дисомическими хромосомами (MPDiff) будет составлять
MPKff = PLN х / х 0,5
Согласно одному варианту реализации сравнение плотности метилирования потенциально анеуплоидной хромосомы (или хромосомной области) с одной или несколькими другими предположительно не являющимися анеуплоидными хромосомами, или общая плотность метилирования генома может применяться для эффективной нормировки концентрации плодной ДНК в образце плазмы. Сравнение может проводиться посредством расчета параметра (например, включающего отношение или разность), связывающего плотности метилирования двух областей, для получения нормированной плотности метилирования. Указанное сравнение может устранять зависимый характер полученного уровня метилирования (например, определенного как параметр по двум плотностям метилирования).
Если плотность метилирования потенциально анеуплоидной хромосомы не нормирована по плотности метилирования одной или нескольких других хромосом, или по другим параметрам, отражающим фракционную концентрацию плодной ДНК, фракционная концентрация будет представлять собой основной фактор, влияющий на плотность метилирования в плазме. Например, плотность метилирования хромосомы 21 в плазме беременной женщины, вынашивающей плод с трисомией 21, при фракционной концентрации плодной ДНК 10% будет такой же, что и у беременной женщины, вынашивающей эуплоидный плод, при фракционной концентрации плодной ДНК 15%, тогда как нормированная плотность метилирования покажет различие.
Согласно другому варианту реализации плотность метилирования потенциально анеуплоидной хромосомы может быть нормирована по фракционной концентрации плодной ДНК. Например, для нормировки плотности метилирования может быть использовано следующее уравнение: Normalized ^-^nan-normalized + (BKG - PLN)x f ’ где MPNormalized представляет собой плотность метилирования, нормированную по фракционной концентрации плодной ДНК в плазме, MPNon-normalized представляет собой измеренную плотность метилирования, BKG представляет собой фоновую плотность метилирования в клетках материнской крови или тканей, PLN представляет собой плотность метилирования в плацентарных тканях, и / представляет собой фракционную концентрацию плодной ДНК. Плотности метилирования BKG и PLN могут быть основаны на референсных значениях, установленных ранее по клеткам материнской крови и плацентарным тканям, полученным при здоровых беременностях. Для определения фракционной концентрации плодной ДНК в образце плазмы могут применяться различные генетические и эпигенетические способы, например, измерение процента ридов секвенирования от Y-хромосомы с применением массивно-параллельного секвенирования или ПЦР не конвертированной бисульфитом
- 21 042157
ДНК.
Согласно одному варианту реализации нормированная плотность метилирования потенциально анеуплоидной хромосомы может сравниваться с референсной группой, которая представлена беременной женщиной, вынашивающей эуплоидные плоды. Может быть определено среднее и SD нормированной плотности метилирования референсной группы. Затем нормированная плотность метилирования в тестируемом случае может быть представлена в виде Z-показателя, отражающего число стандартных Z - score - МРуогтаНгеЛ ~ ΜβΟΠ
SD отклонений SD от среднего значения для референсной группы, как: ’ где
MPNo.m. zed представляет собой нормированную плотность метилирования для тестируемого случая, Mean представляет собой среднее нормированной плотности метилирования референсных случаев и SD представляет собой стандартное отклонение нормированной плотности метилирования референсных случаев. Точка отсечения, например, Z-показатель <-3, может применяться для классификации хромосомы как значительно гипометилированной и, таким образом, для определения анеуплоидного статуса образца.
Согласно другому варианту реализации MPDiff может применяться в качестве нормированной плотности метилирования. Согласно подобному варианту реализации PLN может быть выведен, например, с применением способа 1000. Согласно некоторым вариантам реализации референсная плотность метилирования (которая может быть нормирована с использованием f) может быть определена по уровню метилирования не-анеуплоидной области. Например, среднее (Mean) может быть определено по одной или нескольким хромосомным областям в одном образце. Точка отсечения может быть масштабирована по f, или просто установлена на уровне, достаточном при условии присутствия минимальной концентрации.
Соответственно, сравнение уровня метилирования для области с точкой отсечения может осуществляться различным образом. Указанное сравнение может включать нормировку (например, согласно приведенному выше описанию), которая может осуществляться эквивалентным образом по уровню метилирования или по предельному значению, в зависимости от способа определения значений. Соответственно, можно различными способами определить, отличается ли статистически уровень метилирования области от референсного уровня (определенный по тому же образцу или другим образцам).
Описанный выше анализ может применяться при анализе хромосомных областей, которые могут включать целую хромосому или части хромосомы, включая последовательные или разобщенные подобласти хромосомы. Согласно одному варианту реализации потенциально анеуплоидная хромосома может быть разделена на ряд участков. Размеры указанных участков могут быть одинаковыми или разными. Плотность метилирования каждого участка может быть нормирована по фракционной концентрации образца или по плотности метилирования одной или нескольких предположительно не-анеуплоидных хромосом, или по общей плотности метилирования генома. Затем нормированную плотность метилирования каждого участка можно сравнить с референсной группой для определения наличия ее значительного гипометилирования. Затем может быть определен процент значительно гипометилированных участков. Точка отсечения, например, более чем 5, 10, 15, 20 или 30% значительно гипометилированных участков, может применяться для классификации анеуплоидного статуса тестируемого случая.
При тестировании на наличие амплификации или делеции плотность метилирования может сравниваться с референсной плотностью метилирования, которая может быть специфической для конкретной тестируемой области. Каждая область может иметь отличную референсную плотность метилирования, так как метилирование может варьировать от области к области, в частности, в зависимости от размера областей (например, области меньшего размера демонстрируют большую вариабельность).
Как упоминалось выше, одна или несколько беременных женщин, каждая из которых вынашивает эуплоидный плод, могут использоваться для определения нормального диапазона плотности метилирования представляющей интерес области или разности плотностей метилирования между двумя хромосомными областями. Нормальный диапазон может также быть определен для PLN (например, путем прямого измерения или выведен согласно способу 1000). Согласно другим вариантам реализации для анализа может применяться отношение двух плотностей метилирования, например, потенциально анеуплоидной хромосомы и неанеуплоидной хромосомы, вместо их разности. Указанный способ анализа метилирования может быть скомбинирован с методом подсчета ридов последовательностей (RWK Chiu et al. 2008 Proc Natl Acad Sci USA; 105:20458-20463) и методами, включающими анализ размеров ДНК плазмы (патент США 2011/0276277), для определения или подтверждения анеуплоидии. Метод подсчета ридов последовательностей, применяемый в комбинации с анализом метилирования, может осуществляться либо с применением случайного секвенирования (RWK Chiu et al. 2008 Proc Natl Acad Sci USA;105:20458-20463; DW Bianchi DW et al. 2012 Obstet Gynecol 119:890-901), либо направленного секвенирования (АВ Sparks et al. 2012 Am J Obstet Gynecol 206:319.e1-9; В Zimmermann et al. 2012 Prenat Diagn 32:1233-1241; GJ Liao et al. 2012 PLoS One; 7:e38154).
Использование BKG позволяет учитывать вариации фона между образцами. Например, у одной женщины уровни метилирования BKG могут отличаться от уровней у другой женщины, однако в такой ситуации можно использовать разность BKG и PLN для всех образцов. Точка отсечения для разных хромосомных областей может быть разной, например, если плотность метилирования одной области генома
- 22 042157 отличается от плотности метилирования другой области генома.
Указанный способ может быть обобщен для детекции любых хромосомных аберраций, включая делеции и амплификации, в плодном геноме. Кроме того, разрешение указанного анализа может быть скорректировано до требуемого уровня, например, геном может быть разделен на участки 10 Мб, 5 Мб, 2 Мб, 1 Мб, 500 кб, 100 кб. Соответственно, указанная технология также может применяться для детектирования субхромосомных дупликаций или субхромосомных делеций. Указанная технология, соответственно, позволяет устанавливать пренатальный молекулярный кариотип плода неинвазивным образом. При применении указанным образом данная технология может применяться в комбинации со способами неинвазивного пренатального тестирования на основе подсчета молекул (A Srinivasan et al. 2013 Am J Hum Genet;92:167-176; SCY Yu et al. 2013 PLoS One 8: e60968). Согласно другим вариантам реализации размер участков не обязательно должен быть идентичен. Например, размер участков может быть скорректирован таким образом, чтобы каждый участок содержал идентичное число динуклеотидов CpG. В указанном случае физический размер участков будет разным.
Уравнение может быть переформулировано для применения для разных типов хромосомных аберMPDiff = {ВKG - PLN) X / X 0.5 х CN раций как ’ где CN - величина изменения числа копий в пораженной области. CN = 1 при добавлении 1 копии хромосомы, 2 при добавлении 2 копий хромосомы и -1 для утраты одной из двух гомологичных хромосом (например, при детектировании синдрома Тернера у плода, при котором у плода женского пола утрачена одна из Х-хромосом, что приводит к кариотипу ХО). Указанное уравнение не требует внесения правок при изменении размера участков. Тем не менее, чувствительность и специфичность могут снижаться при использовании участков меньшего размера, так как на участках меньшего размера присутствует меньшее число динуклеотидов CpG (или других комбинаций нуклеотидов, для которых наблюдаются различия в метилировании плодной ДНК и материнской ДНК), что приводит к увеличению случайных колебаний при измерении плотностей метилирования. Согласно одному варианту реализации необходимое число ридов может быть определено путем анализа коэффициента вариации плотности метилирования и требуемого уровня чувствительности.
Чтобы продемонстрировать осуществимость указанного способа, авторы настоящего изобретения исследовали образцы плазмы 9 беременных женщин. Каждая из пяти беременных женщин вынашивала эуплоидный плод, каждая из остальных четырех женщин вынашивала плод с трисомией 21 (Т21). Три из пяти эуплоидных беременностей были выбраны случайным образом для формирования референсной группы. Остальные две эуплоидных беременности (Eu1 и Eu2) и четыре случая Т21 (Т21-1, Т21-2, Т21-3 и Т21-4) исследовали с применением указанного способа для тестирования потенциального статуса Т21. ДНК плазмы конвертировали бисульфитом и секвенировали с применением платформы Illumina HiSeq2000. Согласно одному варианту реализации рассчитывали плотность метилирования индивидуальных хромосом. Затем определяли разность плотности метилирования между хромосомой 21 и средним значением по другим 21 аутосомам для получения нормированной плотности метилирования (табл. 1). Среднее и SD референсной группы использовали для расчета Z-показателя для шести тестируемых случаев.
Таблица 1
При применении точки отсечения <-3 для Z-показателя для классификации образца как Т21, классификация всех случаев эуплоидии и Т21 была корректной.
Eul Eu2 Т21-1 Т21-2 Т21-3 Т21-4
Z-показатель для МРида между хромосомой 21 и другими аутосомами -1,48 1,09 -4,46 -5,30 -8,06 -5,69
Согласно другому варианту реализации геном разделяли на участки размером 1 Мб и определяли плотность метилирования для каждого участка размером 1 Мб. Плотность метилирования всех участков на потенциально анеуплоидной хромосоме может быть нормирована по медиане плотности метилирования всех участков, расположенных на предположительно не являющихся анеуплоидными хромосомах. Согласно одному варианту реализации для каждого участка может быть рассчитано различие плотности метилирования от медианы не являющихся анеуплоидными участков. Z-показатель может быть рассчитан для указанных значений с применением значений среднего и SD референсной группы. Можно определить процент участков, где наблюдается гипометилирование (табл. 2), и сравнить с процентом, соответствующим точке отсечения.
Таблица 2
При применении 5% в качестве точки отсечения для значительно более гипометилированных участков на хромосоме 21, все случаи были классифицировали корректно в отношении статуса Т21.
Eul Eu2 Т21-1 Т21-2 Т21-3 Т21-4
Процент участков на хромосоме 21 с Zпоказателем для МР^к <-3 0% 0% 33,3% 58,3% 19,4% 52,8%
Указанный способ детектирования плодных хромосомных или субхромосомных аберраций на основе метилирования ДНК может применяться в сочетании с методами, основанными на подсчета молекул, например, посредством секвенирования (RWK Chiu et al. 2008 Proc Natl Acad Sci USA; 105: 2045820463), или цифровой ПЦР (YMD Lo et al. 2007 Proc Natl Acad Sci USA; 104: 13116-13121), или опреде
- 23 042157 лением размеров молекул ДНК (патентная публикация США 2011/0276277). Такое комбинирование (например, метилирование ДНК плюс подсчет молекул, или метилирование ДНК плюс определение размеров, или метилирование ДНК плюс подсчет молекул и плюс определение размеров) будет давать синергетический эффект, который был бы благоприятным в клинических условиях, например, повышал бы чувствительность и/или специфичность. Например, число молекул ДНК, которое необходимо проанализировать, например, посредством секвенирования, может быть уменьшено без отрицательного воздействия на диагностическую точность. Указанная особенность позволяет проводить такие тесты с меньшими затратами. В другом примере для определенного анализируемого числа молекул ДНК комбинированный подход позволяет детектировать плодные хромосомные или субхромосомные аберрации при более низкой фракционной концентрации плодной ДНК.
На фиг. 13 приведена блок-схема способа 1300 детектирования хромосомной аномалии по биологическому образцу организма. Указанный биологический образец включает свободную от клеток ДНК, содержащую смесь свободной от клеток ДНК, происходящей из первой ткани и из второй ткани. Первая ткань может происходить из плода или опухоли, и вторая ткань может происходить от беременной женщины или от пациента.
На этапе 1310 анализируют множество молекул ДНК из указанного биологического образца. Анализ молекулы ДНК может включать определение локализации указанной молекулы ДНК в геноме указанного организма и определение того, метилирована ли указанная молекула ДНК в одном или большем числе сайтов. Анализ может осуществляться путем получения ридов последовательностей с помощью чувствительного к метилированию секвенирования, и, соответственно, анализ может осуществляться исключительно по ранее полученным для ДНК данным. Согласно другим вариантам реализации анализ может включать фактическое секвенирование или другие активные этапы получения данных.
Определение локализации может включать картирование молекул ДНК (например, с применением ридов последовательностей) на соответствующие части генома человека, например, на специфические области. Согласно одному варианту реализации, если рид не картируется на представляющую интерес область, он может не учитываться.
На этапе 1320 для каждого из множества сайтов определяют относительное количество молекул ДНК, которые метилированы в указанном сайте. Согласно одному варианту реализации указанные сайты представляют собой CpG-сайты, и могут представлять собой только определенные CpG-сайты, выбранные с применением одного или большего количества упоминаемых в настоящем документе критериев. Определение количества метилированной ДНК эквивалентно определению количества неметилированной ДНК, если нормировка проводится с использованием общего числа анализируемых молекул ДНК в конкретном сайте, например, общего числа ридов секвенирования.
На этапе 1330 рассчитывают первый уровень метилирования первой хромосомной области на основании соответствующих количеств молекул ДНК, метилированных в сайтах в составе первой хромосомной области. Указанная первая хромосомная область может быть любого размера, например, иметь размеры, описанные выше. Уровень метилирования может учитывать общее число молекул ДНК, выравниваемых с первой хромосомной областью, например, в рамках процедуры нормировки.
Первая хромосомная область может быть любого размера (например, представлять собой целую хромосому) и может быть состоять из разобщенных подобластей, т.е. подобластей, которые отделены одна от другой. Уровни метилирования каждой подобласти могут быть определены и скомбинированы, например, в виде среднего значения или медианы, для определения уровня метилирования первой хромосомной области.
На этапе 1340 первый уровень метилирования сравнивают с предельным значением (значением отсечения). Предельное значение может представлять собой референсный уровень метилирования или быть связано с референсным уровнем метилирования (например, находиться на определенном расстоянии от нормального уровня). Предельное значение может быть определено по другим беременным субъектам женского пола, вынашивающим плоды без хромосомной аномалии по первой хромосомной области, по образцам индивидуумов, не страдающих раковым заболеванием или по локусам указанного организма, которые, как известно, не связаны с анеуплоидией (т.е. по областям, которые являются дисомическими).
Согласно одному варианту реализации предельное значение может быть определено как отличающееся от референсного уровня метилирования на ~ xfxO.Sx CN } где BKG представляет собой фон указанной женщины (или среднее значение или медиану для других субъектов),/представляет собой фракционную концентрацию свободной от клеток ДНК, происходящей из первой ткани, и CN представляет собой тестируемое число копий. CN представляет собой пример масштабирующего коэффициента, соответствующего типу аномалии (делеции или дупликации). Изначально для тестирования всех амплификации может использоваться точка отсечения для CN, равная 1, и дополнительные точки отсечения могут применяться для определения степени амплификации. Предельное значение может быть основано на фракционной концентрации свободной от клеток ДНК, происходящей из первой ткани, для определения ожидаемого уровня метилирования для локуса, например, если аберрация числа копий отсутствует.
- 24 042157
На этапе 1350 классифицируют аномалию первой хромосомной области на основе указанного сравнения. Статистически значимое различие уровней может указывать на повышенный риск хромосомной аномалии у плода. Согласно различным вариантам реализации указанная хромосомная аномалия может представлять собой трисомию 21, трисомию 18, трисомию 13, синдром Тернера или синдром Клайнфельтера. Другие примеры представлены субхромосомной делецией, субхромосомной дупликацией или синдромом Ди Джорджи.
V. Определение маркеров
Как было отмечено выше, некоторые части плодного генома метилированы иначе, чем материнский геном. Указанные различия могут быть общими для всех беременностей. Области отличающегося метилирования могут использоваться для идентификации фрагментов ДНК, происходящих от плода.
А. Способ определения DMR по плацентарной ткани и материнской ткани.
Плацента содержит тканеспецифичные сигнатуры метилирования. Для детекции в материнской плазме и для применения при неинвазивной пренатальной диагностике были разработаны специфичные для плода маркеры метилирования ДНК на основе локусов, дифференциально метилированных в плацентарных тканях и в клетках материнской крови (SSC Chim et al. 2008 Clin Chem; 54: 500-511 EA Papageorgiou et al 2009 Am J Pathol; 174: 1609-1618; и T Chu et al. 2011 PLoS One; 6: e14723). Предложены варианты реализации для анализа таких дифференциально метилированных областей (DMR) в полногеномном масштабе.
Фиг. 14 представляет собой блок-схему способа 1400 идентификации маркеров метилирования путем сравнения профиля метилирования плаценты с материнским профилем метилирования (например, определенным по клеткам крови) в соответствии с вариантами реализации настоящего изобретения. Способ 1400 может также применяться для определения маркеров опухоли путем сравнения профиля метилирования опухоли с профилем метилирования, соответствующим здоровой ткани.
На этапе 1410 получают плацентарный метилом и метилом крови. Плацентарный метилом может быть определен по плацентарному образцу, например, CVS или зрелой плаценты. Следует понимать, что метилом может включать плотности метилирования только части генома.
На этапе 1420 идентифицируют область, которая содержит указанное число сайтов (например, 5 CpG -сайтов) и для которой было получено достаточное число ридов. Согласно одному варианту реализации идентификацию начинают с одного конца каждой хромосомы для определения локализации первой области размером 500 п.о., содержащей по меньшей мере пять подходящих CpG-сайтов. CpGсайт может считаться подходящим, если указанный сайт покрывают по меньшей мере пять ридов последовательностей.
На этапе 1430 для каждого сайта рассчитывают индекс метилирования плаценты и индекс метилирования крови. Например, индекс метилирования рассчитывали индивидуально для всех подходящих CpG-сайтов в каждой области размером 500 п.о.
На этапе 1440 сравнивали индексы метилирования клеток материнской крови и индексы метилирования плацентарного образца, для определения того, различаются ли множества указанных индексов. Например, сравнивали индексы метилирования клеток материнской крови и индексы метилирования CVS или зрелой плаценты с применением, например, критерия Манна-Уитни. Р-значение, составляющее, например, <0,01 считали определяющим статистически значимое различие, хотя могут использоваться и другие значения, при этом меньшее значение приведет к уменьшению количества ложноположительных областей.
Согласно одному варианту реализации в случае, если число подходящих CpG-сайтов составляло менее 5, или критерий Манна-Уитни показывал отсутствие статистической значимости, область размером 500 п.о. сдвигали ниже (в 3'-направлении) на 100 п.о. Область продолжали сдвигать в 3'-направлении, пока критерий Манна-Уитни не показывал статистическую значимость для области размером 500 п.о. Тогда рассматривали следующую область размером 500 п.о. Если выяснялось, что для следующей области наблюдается статистическая значимость согласно критерию Манна-Уитни, ее добавляли к текущей области, при условии, что размер комбинированной последовательной области не превышал 1000 п.о.
На этапе 1450 смежные области, которые бьши определены как статистически значимо отличающиеся (например, по критерию Манна-Уитни), могут быть объединены. Отметим, что указанное различие относится к индексам метилирования для двух образцов. Согласно одному варианту реализации в случае, если смежные области находятся в пределах указанного расстояния (например, 1000 п.о.) друг от друга, и если для них наблюдается аналогичный профиль метилирования, их объединяют. Согласно одному варианту реализации сходство профиля метилирования смежных областей может быть определено на основании любого из следующих пунктов: (1) при наблюдаемой одинаковой тенденции в плацентарной ткани относительно клеток материнской крови, например, обе области сильнее метилированы в плацентарных тканях, чем в клетках крови; (2) по различиям плотностей метилирования, составляющим менее чем 10% для смежных областей в плацентарной ткани; и (3) по различиям плотностей метилирования, составляющим менее чем 10% для смежных областей в клетках материнской крови.
На этапе 1460 рассчитывали плотности метилирования для метилома крови по ДНК клеток мате
- 25 042157 ринской крови и плацентарного образца (например, CVS или ткани зрелой плаценты) в указанных областях. Плотности метилирования могут быть определены согласно описанию в настоящем документе.
На этапе 1470 определяют предполагаемые DMR, отличающиеся тем, что общая плацентарная плотность метилирования и общая плотность метилирования крови статистически значимо различаются для всех сайтов в указанной области. Согласно одному варианту реализации все подходящие CpG-сайты в составе объединенной области оценивают с применением критерия χ2. Критерий χ2 показывал, присутствовало ли статистически значимое различие между клетками материнской крови и плацентарной ткани по числу метилированных цитозинов, как пропорции метилированных и неметилированных цитозинов во всех подходящих CpG-сайтах в составе объединенной области. Согласно одному варианту реализации для критерия χ2 P-значение <0,01 может считаться определяющим статистически значимое различие. Объединенные сегменты, для которых была показана значимость с применением критерия χ2, считали предполагаемыми DMR.
На этапе 1480 идентифицировали локусы, где плотности метилирования ДНК клеток материнской крови бьши выше верхней точки отсечения или ниже нижней точки отсечения. Согласно одному варианту реализации идентифицировали локусы, где плотности метилирования ДНК клеток материнской крови составляли либо <20%, либо>80%. Согласно другим вариантам реализации могут быть использованы жидкости организма, отличные от материнской крови, включая, не ограничиваясь перечисленным, слюну, смывы с матки или шейки матки из половых путей женщины, слезы, пот, слюну и мочу.
Ключом к успешному получению специфичных для плода маркеров метилирования ДНК в материнской плазме может быть то, что статус метилирования клеток материнской крови соответствует либо высокометилированному, либо настолько неметилированному, насколько это возможно. Это может снизить (например, минимизировать) вероятность влияния молекул материнской ДНК на анализ происходящих из плаценты молекул плодной ДНК, демонстрирующих противоположный профиль метилирования. Соответственно, согласно одному варианту реализации кандидатные DMR выбирали путем дополнительной фильтрации. Кандидатными гипометилированными локусами считали локусы, демонстрирующие плотности метилирования <20% в клетках материнской крови и по меньшей мере на 20% более высокие плотности метилирования в плацентарных тканях. Кандидатными гиперметилированными локусами считали локусы, демонстрирующие плотности метилирования >80% в клетках материнской крови и по меньшей мере на 20% меньшие плотности метилирования в плацентарных тканях. Могут быть использованы и другие процентные отношения.
Затем на этапе 1490 идентифицировали DMR в подмножестве локусов, где плацентарные плотности метилирования значительно отличаются от плотностей метилирования крови путем сравнения указанного различия с пороговым. Согласно одному варианту реализации порог составляет 20%, так что плотности метилирования отличались по меньшей мере на 20% от плотностей метилирования клеток материнской крови. Соответственно, может быть рассчитана разность между плацентарными плотностями метилирования и плотностями метилирования крови в каждом из идентифицированных локусов. Указанная разность может представлять собой результат простого вычитания. Согласно другим вариантам реализации могут применяться масштабирующие коэффициенты и другие функции для определения разности (например, разность может быть представлена в виде результата применения функции к результату простого вычитания).
Согласно одному варианту реализации с применением указанного способа идентифицировали 11 729 гиперметилированных и 239 747 гипометилированных локусов по плацентарному образцу первого триместра. 100 первых гиперметилированных локусов перечислены в табл. S2A приложения. 100 первых гипометилированных локусов перечислены в табл. S2B приложения. В табл. S2A и S2B указана хромосома, локализация начала и конца, размер области, плотность метилирования в материнской крови, плотность метилирования в плацентарном образце, Р-значения (все Р-значения очень невысокие) и различия в метилировании. Локализации соответствуют референсному геному hg18, который можно найти по адресу: hgdownload.soe.ucsc.edu/goldenPath/hg18/chromosomes.
11920 гиперметилированных и 204768 гипометилированных локусов идентифицировали по плацентарному образцу третьего триместра. 100 первых гиперметилированных локусов для третьего триместра перечислены в табл. S2C, и 100 первых гипометилированных локусов перечислены в табл. S2D. 33 локуса, которые были ранее описаны как дифференциально метилированные в клетках материнской крови и в плацентарных тканях первого триместра, использовали для валидации полученного авторами настоящего изобретения списка кандидатных локусов первого триместра. 79% из указанных 33 локусов были идентифицированы как DMR с применением предложенного авторами настоящего изобретения алгоритма.
Фиг. 15А представляет собой таблицу 1500, отражающую эффективность алгоритма идентификации DMR при применении данных для первого триместра с учетом 33 ранее описанных маркеров первого триместра. В указанной табл. а означает, что локусы 1-15 были ранее описаны в (RWK Chiu et al. 2007 Am J Pathol; 170:941-950 и SSC Chim et al. 2008 Clin Chem; 54:500-511); локусы 16-23 были ранее описаны в (KC Yuen, thesis 2007, The Chinese University of Hong Kong, Hong Kong); и локусы 24-33 были ранее описаны в (ЕА Papageorgiou et al. 2009 Am J Pathol; 174:1609-1618). b означает, что указанные
- 26 042157 данные были получены из перечисленных выше публикаций, с означает, что плотности метилирования клеток материнской крови и образца ворсин хориона и их различия наблюдали в данных секвенирования, полученных в настоящем исследовании, но они основаны на геномных координатах, приведенных в оригинальных исследованиях, d означает, что данные для локусов идентифицированы с применением вариантов реализации способа 1400 на данньк бисульфитного секвенирования без использования референсных данных из упоминаемых выше публикаций Chiu et al (2007), Chim et al (2008), Yuen (2007) и Papageorgiou et al (2009). Указанные локусы содержали ранее описанные геномные области, однако, как правило, захватывали более протяженные области, е означает, что кандидатные DMR классифицировали как истинно положительные (ТР) или ложноотрицательные (FN) на основании соблюдения требования наблюдаемой разности >0,20 между плотностями метилирования, соответствующими геномным координатам указанных DMR в клетках материнской крови и в образце ворсин хориона.
Фиг. 15В представляет собой таблицу 1550, отражающую эффективность алгоритма идентификации DMR с применением данных для третьего триместра и сравнения с образцом плаценты, полученным при родах, а означает, что использовали тот же список из 33 локусов, что и на фиг. 17А. b означает, что поскольку указанные 33 локуса были ранее идентифицированы по образцам, полученным на ранних сроках беременности, они могут не соответствовать данным для третьего триместра. Поэтому данные бисульфитного секвенирования, полученные в настоящем исследовании для ткани зрелой плаценты на основе геномных координат, полученных в оригинальных исследованиях, пересматривались. Разность плотностей метилирования >0,20 между клетками материнской крови и тканью зрелой плаценты использовали для определения того, действительно ли указанные локусы являлись областями DMR в третьем триместре, с означает, что данные по локусам были идентифицированы с применением способа 1400 к данным бисульфитного секвенирования без учета упомянутых выше публикаций Chiu et al (2007), Chim et al (2008), Yuen (2007) и Papageorgiou et al (2009). Указанные локусы содержали ранее описанные геномные области, однако, как правило, захватывали более протяженные области, d означает, что кандидатные DMR, содержащие локусы, подходящие в качестве дифференциально метилированных в третьем триместре, классифицировали как истинно положительные (ТР) или ложноотрицательные (FN) на основании соблюдения требования наблюдающейся разности >0,20 между плотностями метилирования соответствующих геномных координат DMR в клетках материнской крови и в ткани зрелой плаценты. Для локусов, не подходящих в качестве дифференциально метилированных в третьем триместре, отсутствующие в списке DMR или присутствующие DMR, содержащие указанные локусы, но демонстрирующие разность метилирования <0,20, считали областями DMR с истинно отрицательным результатом (TN).
В. DMR по данным секвенирования материнской плазмы.
DMR плацентарной ткани можно идентифицировать непосредственно по данным бисульфитного секвенирования ДНК материнской плазмы, при условии, что также известна фракционная концентрация плодной ДНК образца. Это возможно, поскольку плацента является основным источником плодной ДНК в материнской плазме (SSC Chim et al. 2005 Proc Natl Acad Sci USA 102, 14753-14758), и авторы настоящего изобретения показали в настоящем исследовании, что статус метилирования специфичной для плода ДНК в материнской плазме коррелирует с плацентарным метиломом.
Таким образом, аспекты способа 1400 могут быть реализованы с использованием метилома плазмы для выведения плацентарного метилома вместо использования плацентарного образца. Соответственно, способ 1000 и способ 1400 могут быть скомбинированы для определения DMR. Способ 1000 может применяться для определения прогнозируемых значений профиля метилирования плаценты и их использования в способе 1400. В примере указанного анализа внимание также сфокусировано на локусах, которые были либо <20%, либо >80% метилированы в клетках материнской крови.
Согласно одному варианту реализации для определения локусов, которые были гиперметилированы в плацентарных тканях относительно клеток материнской крови, авторы настоящего изобретения отбирали локусы, демонстрировавшие метилирование < 20% в клетках материнской крови, и метилирование >60% в соответствии с предсказанным значением с разностью по меньшей мере 50% между плотностью метилирования клетками крови и предсказанным значением. Для определения локусов, которые были гипометилированы в плацентарных тканях относительно клеток материнской крови, авторы настоящего изобретения отбирали локусы, демонстрировавшие метилирование >80% в клетках материнской крови, и метилирование <40% в соответствии с предсказанным значением с разностью по меньшей мере 50% между плотностью метилирования клеток крови и предсказанным значением.
Фиг. 16 представляет собой таблицу 1600, отражающую число локусов, гиперметилированных или гипометилированных согласно прогнозу на основании прямого анализа данных бисульфитного секвенирования материнской плазмы. H/О означает не определено, а означает, что поиск гиперметилированных локусов начинали со списка локусов, демонстрирующих плотности метилирования <20% в клетках материнской крови. b означает, что поиск гипометилированных локусов начинали со списка локусов, демонстрирующих плотности метилирования >80% в клетках материнской крови, с означает, что данные бисульфитного секвенирования для образца ворсин хориона использовали для проверки данных
- 27 042157 материнской плазмы первого триместра, и ткань зрелой плаценты использовали для проверки данных материнской плазмы третьего триместра.
Как видно из табл. 1600, большинство определенных неинвазивным образом локусов демонстрировали ожидаемый паттерн метилирования в тканях и перекрывались с DMR, установленными по данным тканей и представленными в разделе выше. В приложении приведен список DMR, идентифицированных в плазме. В табл. S3A перечислены 100 первых локусов, для которых установлено гиперметилирование по данным бисульфитного секвенирования для материнской плазмы первого триместра. В табл. S3B перечислены 100 первых локусов, для которых установлено гипометилирование по данным бисульфитного секвенирования для материнской плазмы первого триместра. В табл. S3C перечислены 100 первых локусов, для которых установлено гиперметилирование по данным бисульфитного секвенирования для материнской плазмы третьего триместра. В таблице S3D перечислены 100 первых локусов, для которых установлено гипометилирование по данным бисульфитного секвенирования для материнской плазмы третьего триместра.
C. Гестационные вариации плацентарного и плодного метиломов.
Общая доля метилированных CpG в CVS составляла 55%, и 59% для зрелой плаценты (табл. 100 на фиг. 1). В CVS могут быть идентифицированы более гипометилированные DMR, чем в зрелой плаценте, при этом некоторые гиперметилированные DMR аналогичны в обеих тканях. Соответственно, было очевидно, что CVS более гипометилированы, чем зрелая плацента. Указанная тенденция при гестации была также очевидна для данных по материнской плазме. Доля метилированных CpG в специфичных для плода ридах составляла 47,0% в материнской плазме в первом триместре, но 53,3% в материнской плазме в третьем триместре. Количества валидированных гиперметилированных локусов были аналогичны в образцах материнской плазмы первого триместра (1457 локусов) и третьего триместра (1279 локусов) однако в образцах первого триместра присутствовали по существу более гипометилированные локусы (21812 локусов), чем в образцах третьего триместра (12677 локусов) (табл. 1600 на фиг. 16).
D. Применение маркеров.
Дифференциально метилированные маркеры, или DMR, подходят для применения в нескольких аспектах. Присутствие таких маркеров в материнской плазме указывает на наличие и подтверждает присутствие или плодной, или плацентарной ДНК. Указанное подтверждение может применяться для контроля качества при неинвазивном пренатальном тестировании. DMR могут служить универсальными маркерами плодной ДНК в материнской плазме и обладают преимуществами относительно маркеров, основанных на генотипических различиях между матерью и плодом, таких как маркеры на основе полиморфизмов или на основе Y-хромосомы. DMR являются универсальными плодными маркерами, подходящими для всех беременностей. Маркеры на основе полиморфизмов подходят для применения только в подгруппе беременностей, где плод наследует указанный маркер от отца, а геном матери не содержит указанного маркера. Кроме того, можно измерить концентрацию плодной ДНК в образце материнской плазмы путем количественного определения молекул ДНК, происходящих из указанных DMR.
При наличии известного профиля DMR, ожидаемого для нормальных беременностей, могут быть детектированы связанные с беременностью осложнения, в частности, включающие изменения плацентарной ткани, при наблюдении отклонений профиля DMR в материнской плазме или профиля метилирования от ожидаемого для нормальных беременностей. Связанные с беременностью осложнения, включающие изменения плацентарной ткани, включают, не ограничиваясь указанным, плодные хромосомные анеуплоидии. Примеры включают трисомию 21, преэклампсию, внутриутробную задержку роста и преждевременные роды.
Е. Наборы с маркерами.
Согласно вариантам реализации могут обеспечиваться композиции и наборы для реализации описанных в настоящем документе и других подходящих способов. Наборы могут применяться для проведения анализов плодной ДНК, например, свободной от клеток плодной ДНК в материнской плазме. Согласно одному варианту реализации набор может включать по меньшей мере один олигонуклеотид, подходящий для специфической гибридизации с одним или большим количеством локусов, идентифицированных согласно настоящему документу. Набор также может включать по меньшей мере один олигонуклеотид, подходящий для специфической гибридизации с одним или большим количеством референсных локусов. Согласно одному варианту реализации измеряют плацентарные гиперметилированные маркеры. Тестируемый локус может представлять собой метилированную ДНК в материнской плазме, и референсный локус может представлять собой метилированную ДНК в материнской плазме. Аналогичный набор может быть собран для анализа опухолевой ДНК в плазме.
В некоторых случаях наборы могут включать по меньшей мере два олигонуклеотидных праймера, которые могут применяться при амплификации по меньшей мере части целевого локуса (например, локуса, представленного в приложении) и референсного локуса. Вместо или помимо праймеров набор может включать меченые зонды для детекции фрагмента ДНК, соответствующего целевому локусу и референсному локусу. Согласно различным вариантам реализации один или большее количество олигонуклеотидов набора соответствуют локусу из таблиц приложения. Как правило, указанные наборы также содержат руководство по эксплуатации для направления пользователей при анализе тестируемых образцов
- 28 042157 и оценке физиологического состояния или патологии у тестируемого субъекта.
Согласно различным вариантам реализации предложен набор для анализа плодной ДНК в биологическом образце, содержащем смесь плодной ДНК и ДНК субъекта -беременной плодом женщины. Набор может включать один или большее количество олигонуклеотидов для специфической гибридизации по меньшей мере с частью геномной области из перечисленных в таблицах S2A, S2B, S2C, S2D, S3A, S3B, S3C и S3D. Соответственно, может быть использовано любое число олигонуклеотидов из любых таблиц или только из одной таблицы. Указанные олигонуклеотиды могут функционировать в качестве праймеров, и могут быть представлены в виде пар праймеров, при этом пара соответствует конкретной области из перечисленных в таблицах.
VI. Связь между размером и плотностью метилирования
Известно, что молекулы ДНК плазмы присутствуют в кровотоке в форме коротких молекул, при этом длина большинства молекул составляет приблизительно 160 п.о. (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91, YW Zheng et al. 2012 Clin Chem; 58: 549-558). Интересно, что данные авторов настоящего изобретения демонстрируют зависимость между статусом метилирования и размером молекул ДНК плазмы. Соответственно, длина фрагмента ДНК плазмы связана с уровнем метилирования ДНК. Характеристические профили размеров молекул ДНК плазмы предполагают, что большая их часть связана с мононуклеосомами, возможно, образующимися при ферментативном расщеплении во время апоптоза.
Циркулирующая ДНК в природе фрагментирована. В частности, циркулирующая плодная ДНК короче, чем происходящая от матери ДНК в образцах материнской плазмы (KCA Chan et al. 2004 Clin Chem; 50: 88-92). Так как выравнивание спаренных концов позволяет проводить анализ размера обработанной бисульфитом ДНК, можно непосредственно оценить наличие какой-либо корреляции между размером молекул ДНК плазмы и соответствующими им уровнями метилирования. Авторы настоящего изобретения исследовали указанную корреляцию в материнской плазме, а также в контрольном образце плазмы небеременной взрослой женщины.
Секвенирование спаренных концов (включающее секвенирование полной молекулы) для обоих концов каждой молекулы ДНК использовали для анализа каждого образца в указанном исследовании. Путем выравнивания пары концевых последовательностей каждой молекулы ДНК с референсным геномом человека и получения геномных координат концов ридов секвенирования, можно определить длины секвенированных молекул ДНК. Молекулы ДНК плазмы естественным образом фрагментированы на небольшие молекулы и библиотеки секвенирования для ДНК плазмы, как правило, получают без какихлибо этапов фрагментации. Соответственно, длины, установленные с помощью секвенирования, отражают размеры исходных молекул ДНК плазмы.
В предыдущем исследовании авторы настоящего изобретения определили профили размеров плодных и материнских молекул ДНК в материнской плазме (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91). Авторы настоящего изобретения показали, что молекулы ДНК плазмы имеют размеры, напоминающие мононуклеосомы; молекулы плодной ДНК были короче, чем материнские. В указанном исследовании авторы настоящего изобретения определили связь статуса метилирования молекул ДНК плазмы с их размерами.
А. Результаты.
На фиг. 17А представлен график 1700, отражающий распределение размеров ДНК материнской плазмы, контрольной плазмы небеременной женщины, плацентарной ДНК и ДНК периферической крови. Два обработанных бисульфитом образца плазмы из образцов материнской плазмы и контрольной плазмы небеременной женщины демонстрировали те же характеристические распределения размеров, что и ранее описанные (YMD Lo et al. 2010 Sci Transl Med; 2: 61ra91), с наиболее распространенной общей длиной последовательностей 166-167 п.о. и периодичностью 10 п.о. для молекул ДНК, длина которых составляет менее 143 п.о.
Фиг. 17В представляет собой график 1750 распределения размеров и профиля метилирования материнской плазмы, контрольной плазмы взрослой женщины, плацентарной ткани и контрольной крови взрослой женщины. Для молекул ДНК одинакового размера и содержащих по меньшей мере один CpGсайт рассчитывали среднее значение плотности метилирования. Затем авторы настоящего изобретения строили график зависимости между размерами молекул ДНК и их плотностями метилирования. В частности, определяли среднее значение плотности метилирования для каждой длины фрагмента, варьирующей от 50 п.о. до 180 п.о., для ридов секвенирования, покрывающих по меньшей мере 1 CpG-сайт. Интересно, что плотность метилирования увеличивалась при возрастании размера ДНК плазмы, и имела максимальное значение при размерах приблизительно 166-167 п.о. Указанный паттерн, тем не менее, не наблюдался в образцах ДНК плаценты и контрольных образцах крови, фрагментированных с применением ультразвуковой системы.
На фиг. 18 приведены графики плотностей метилирования и размера молекул ДНК плазмы. Фиг. 18А представляет собой график 1800 для материнской плазмы в первом триместре. Фиг. 18В представляет собой график 1850 для материнской плазмы в третьем триместре. Данные для всех ридов секвенирования, которые покрывали по меньшей мере один CpG-сайт, представлены голубой кривой 1805. Данные для ридов, содержавших также специфичный для плода аллель ОНП, представлены красной кривой 1810.
- 29 042157
Данные для ридов, содержавших также специфичный для матери аллель ОНП, представлены зеленой кривой 1815.
Риды, содержавшие специфичный для плода аллель ОНП, считали относящимися к молекулам плодной ДНК. Риды, содержавшие специфичный для матери аллель ОНП, считали относящимися к молекулам материнской ДНК. Как правило, молекулы ДНК с высокими плотностями метилирования имели больший размер. Указанная тенденция наблюдалась для молекул как плодной, так и материнской ДНК, и в первом, и в третьем триместрах. Как ранее уже говорилось, общие размеры молекул плодной ДНК были меньше, чем размеры материнских молекул.
На фиг. 19А приведен график 1900 плотностей метилирования и размеров ридов секвенирования для взрослой небеременной женщины. Для образца ДНК плазмы взрослой небеременной женщины наблюдалась такая же зависимость между размерами и состоянием метилирования молекул ДНК. С другой стороны, на этапе обработки ультразвуком, до анализа с применением МПС, образцы геномной ДНК были фрагментированы. Как видно на графике 1900, в данных для образцов клеток крови и плацентарной ткани указанная тенденция отсутствует. Поскольку производится искусственная фрагментация клеток, можно ожидать, что связь между размером и плотностью будет отсутствовать. Так как для фрагментированных естественным образом молекул ДНК в плазме наблюдается зависимость от размера, можно предположить, что молекулы с более низкими плотностями метилирования с большей вероятностью распадаются на более короткие фрагменты.
Фиг. 19В представляет собой график 1950, отражающий распределение размеров и профиль метилирования специфичных для плода и специфичных для матери молекул ДНК в материнской плазме. Для специфичных для плода и специфичных для матери молекул ДНК плазмы также наблюдалась указанная корреляция между размерами фрагментов и уровнем метилирования. Длины фрагментов как происходящей из плаценты, так и материнской циркулирующей свободной от клеток ДНК увеличивались с увеличением уровня метилирования. Кроме того, распределения их статуса метилирования не перекрывались, предполагая, что указанное явление существует независимо от исходной длины фрагмента из источников циркулирующих молекул ДНК.
В. Способ.
Соответственно распределение размеров может применяться для определения общего процента метилирования образца плазмы. Указанное измерение метилирования затем может отслеживаться во время беременности, при мониторинге ракового заболевания, или при лечении путем серийных измерений распределений размеров ДНК плазмы в соответствии с зависимостью, представленной на фиг. 18А и В. Измерение метилирования также может применяться для отслеживания повышенного или пониженного высвобождения ДНК из представляющего интерес органа или ткани. Например, можно конкретным образом отслеживать сигнатуры метилирования ДНК, специфические для конкретного органа (например, для печени) и измерять концентрации указанных сигнатур в плазме. Поскольку ДНК высвобождается в плазму при гибели клеток, повышение уровней может означать увеличение уровней клеточной смерти или повреждения указанного конкретного органа или ткани. Снижение уровня для конкретного органа может означать, что противодействующее повреждению лечение или патологические процессы в указанном органе находятся под контролем.
Фиг. 20 представляет собой блок-схему способа 2000 оценки уровня метилирования ДНК в биологическом образце организма в соответствии с вариантами реализации настоящего изобретения. Уровень метилирования может быть определен для конкретной области генома или для всего генома. Если требуется конкретная область, могут быть использованы фрагменты ДНК исключительно из этой конкретной области.
На этапе 2010 измеряют количества фрагментов ДНК, соответствующих различным размерам. Для каждого размера из множества размеров может быть измерено количество множества фрагментов ДНК из указанного биологического образца, соответствующих указанному размеру. Например, может быть измерено число фрагментов ДНК с длиной 140 оснований. Указанные количества могут быть сохранены в виде гистограммы. Согласно одному варианту реализации измеряют размер каждой из множества нуклеиновых кислот из указанного биологического образца, что может быть реализовано на индивидуальной основе (например, путем мономолекулярного секвенирования целой молекулы или исключительно концов молекулы) или на групповой основе (например, посредством электрофореза). Размеры могут соответствовать диапазону размеров. Соответственно, количество может относиться к фрагментам ДНК, имеющим размер, попадающий в определенный диапазон. При проведении секвенирования спаренных концов картирование (выравнивание) фрагментов ДНК (определенных по парным ридам последовательностей) по конкретной области может быть использовано для определения уровня метилирования указанной области.
На этапе 2020 рассчитывают первое значение первого параметра на основе количества фрагментов ДНК различных размеров. Согласно одному аспекту первый параметр обеспечивает статистическую меру профиля размеров (например, гистограмму) фрагментов ДНК в биологическом образце. Указанный параметр может называться размерным параметром, поскольку он определяется на основании размеров множества фрагментов ДНК.
- 30 042157
Первый параметр может принимать различные формы. Одним из параметров является процент фрагментов ДНК конкретного или попадающего в некоторый диапазон размера относительно всех фрагментов ДНК, или относительно фрагментов ДНК другого размера или из другого диапазона. Такой параметр представляет собой число фрагментов ДНК конкретного размера, разделенное на общее число фрагментов, которое можно получить из гистограммы (любой структуры данных, позволяющей подсчитать абсолютное или относительное количество фрагментов конкретных размеров). В другом примере параметр может представлять собой число фрагментов конкретного размера или относящихся к определенному диапазону, разделенное на число фрагментов другого размер или из другого диапазона. Деление может служить в качестве нормировки для учета разного числа анализируемых фрагментов ДНК для разных образцов. Нормировка может осуществляться путем анализа одинакового числа фрагментов ДНК для каждого образца, что эффективно обеспечивает тот же результат, что и деление на общее число анализируемых фрагментов. Дополнительные примеры параметров и анализа размеров можно найти в заявке на патент США 13/789553, которая включена в настоящий документ посредством ссылки во всех отношениях.
На этапе 2030 сравнивают первое значение размера с референсным значением размера. Референсное значение размера может быть рассчитано по фрагментам ДНК референсного образца. Для определения референсных значений размера может быть рассчитан и количественно определен профиль метилирования для референсного образца, а также значение первого размерного параметра. Соответственно, при сравнении первого значения размера и референсного значения размера может быть определен уровень метилирования.
На этапе 2040 определяют уровень метилирования на основании указанного сравнения. Согласно одному варианту реализации можно определить, выше или ниже первое значение первого параметра, чем референсное значение размера, и таким образом определить, выше или ниже уровень метилирования тестируемого образца, чем уровень метилирования для референсного значения размера. Согласно другому варианту реализации сравнение осуществляют путем введения первого значения в калибровочную функцию. Калибровочная функция позволяет эффективно сравнивать первое значение с калибровочными значениями (набором референсных значений размеров) путем идентификации точки на кривой, соответствующей первому значению. Затем получают расчетный уровень метилирования в качестве выходного значения калибровочной функции.
Соответственно можно откалибровать размерный параметр по уровню метилирования. Например, уровень метилирования может быть измерен и связан с конкретным размерным параметром для указанного образца. Затем точки данных для различных образцов могут быть аппроксимированы калибровочной функцией. Согласно одному варианту реализации для разных подмножеств ДНК могут применяться разные калибровочные функции. Соответственно, может применяться некоторая форма калибровки, основанная на предварительном знании зависимости между метилированием и размером для конкретного подмножества ДНК. Например, калибровка для плодной и материнской ДНК может быть разной.
Как было показано выше, плацента более гипометилирована по сравнению с материнской кровью, и соответственно плодная ДНК имеет меньший размер ввиду меньшей степени метилирования. Соответственно, для определения плотности метилирования может использоваться средний размер фрагментов образца (или другая статистическая величина). Так как размеры фрагментов могут быть измерены с применением секвенирования спаренных концов, а не потенциально более сложного технически чувствительного к метилированию секвенирования, указанный способ может быть потенциально более экономичным при клиническом применении. Указанный способ может применяться для мониторинга изменений метилирования, связанных с прогрессом беременности, или связанных с беременностью расстройств, таких как преэклампсия, преждевременные роды и расстройства плода (например, вызванные хромосомными или генетическими аномалиями или внутриутробной задержкой роста).
Согласно другому варианту реализации указанный способ может применяться для детектирования и мониторинга ракового заболевания. Например, при успешном лечении ракового заболевания профиль метилирования в плазме или другой жидкости организма по оценке с применением указанного основанного на размерах способа будет изменяться в направлении профиля здоровых индивидуумов, у которых отсутствует раковое заболевание. И напротив, в том случае, если раковое заболевание прогрессирует, профиль метилирования в плазме или другой жидкости организма будет расходиться с профилем здоровых индивидуумов, у которых отсутствует раковое заболевание.
В целом, гипометилированные молекулы в плазме были короче гиперметилированных. Указанная тенденция наблюдалась и для плодных, и для материнских молекул ДНК. Поскольку известно, что метилирование ДНК влияет на упаковку нуклеосом, данные авторов настоящего изобретения предполагают, что, возможно, гипометилированные молекулы ДНК были менее плотно упакованы гистонами и были, таким образом, более восприимчивы к ферментативному расщеплению. С другой стороны, данные, представленные на фиг. 18А и 18В, также показывают, что несмотря на значительно большее гипометилирование плодной ДНК по сравнению в материнскими ридами, распределения размеров плодной и материнской ДНК не полностью обособлены друг от друга. На фиг. 19В можно видеть, что даже в одной размерной категории уровни метилирования специфичных для плода и для матери ридов отличаются
- 31 042157 друг от друга. Указанное наблюдение предполагает, что гипометилированное состояние плодной ДНК не единственный фактор, который обуславливает ее относительно небольшую длину по сравнению с материнской ДНК.
VII. Импринтинговый статус генных локусов
В материнской плазме могут быть детектированы происходящие из плода молекулы ДНК, имеющие тот же генотип, что и мать, но другие эпигенетические сигнатуры (LLM Poon et al. 2002 Clin Chem; 48: 35-41). Чтобы продемонстрировать, что способ с применением секвенирования является чувствительным способом выбора происходящих от плода молекул ДНК в материнской плазме, авторы настоящего изобретения использовали ту же стратегию для детекции импринтинговых плодных аллелей в образце материнской плазмы. Идентифицировали две геномных импринтинговых области: Н19 (chr11:1 977 419-1 977 821, версия NCBI 36/hg18) и MEST (chr7:129 917 976-129 920 347, версия NCBI 36/hg18). Обе содержат информативные ОНП для различения материнских и плодных последовательностей. По H19, экспрессируемому у матери гену, мать была гомозиготна (А/А) и плод был гетерозиготен (А/С) по ОНП rs2071094 (chr11:1 977 740) в указанной области. Один из материнских А аллелей был полностью метилирован, а другой не метилирован. В плаценте при этом аллель А был не метилирован, тогда как унаследованный от отца аллель С был полностью метилирован. Авторы настоящего изобретения детектировали два метилированных рида с генотипом С, соответствующих импринтинговым отцовским аллелям, происходящим из плаценты, в материнской плазме.
MEST, также известный как PEG1, представляет собой экспрессируемый у отца ген. И мать, и плод были гетерозиготны (A/G) по ОНП rs2301335 (chr7:129 920 062) в составе указанного импринтингового локуса. В материнской крови аллель G был метилирован, а аллель А был не метилирован. Паттерн метилирования в плаценте был противоположным и включал метилированный материнский А аллель и неметилированный отцовский аллель G. В материнской плазме можно было детектировать три неметилированных аллеля G, которые происходили от отца. Напротив, VAV1, для неимпринтингового генного локуса на хромосоме 19 (chr19:6 723 621-6 724 121) не наблюдалось какого-либо аллельного паттерна метилирования ДНК в образцах ткани и плазмы.
Таким образом, статус метилирования может применяться для определения того, какие фрагменты ДНК принадлежат плоду. Например, само по себе обнаружение аллеля А в материнской плазме не может использоваться в качестве плодного маркера, если мать гетерозиготна (GA). Однако если наблюдается отличный статус метилирования молекул А в плазме, метилированные молекулы А специфичны для плода, а неметилированные молекулы А специфичны для матери, или наоборот.
Далее авторы настоящего изобретения фокусировались на локусах, которые были описаны как демонстрирующие геномный импринтинг в плацентарных тканях. На основе списка локусов, представленного Woodfine et al. (2011 Epigenetics Chromatin; 4:1), авторы настоящего изобретения дополнительно отбирали такие локусы, которые содержали ОНП в области контроля импринтинга. Четыре локуса удовлетворяли указанным критериям; указанные локусы были представлены H19, KCNQ10T1, MEST и NESP.
Что касается ридов из образца клеток материнской крови для H19 и KCNQ10T1, материнские риды были гомозиготны по ОНП и доли метилированных и неметилированных ридов были приблизительно равны. Образцы CVS и ткани зрелой плаценты показали, что плод был гетерозиготен по обоим локусам, и каждый аллель был строго либо метилирован, либо неметилирован, т.е. наблюдалось моноаллельное метилирование. В образцах материнской плазме были обнаружены унаследованные от отца молекулы плодной ДНК для обоих локусов. Для H19 унаследованные от отца молекулы были представлены ридами секвенирования, которые содержали специфичный для плода аллель и были метилированы. Для KCNQ10T1 унаследованные от отца молекулы были представлены ридами секвенирования, которые содержали специфичный для плода аллель и не были метилированы.
С другой стороны, мать была гетерозиготна как по MEST, так и по NESP. В случае MEST и мать, и плод были гетерозиготны (GA) по ОНП. При этом, что очевидно из данных для цепи 5'-3' для клеток материнской крови и плацентарной ткани, статус метилирования для CpG, смежного с ОНП, был у матери и плода противоположным. Аллель А был неметилирован в ДНК матери, но метилирован в ДНК плода. В случае MEST материнский аллель был метилирован. Соответственно, можно точно определить, что плод унаследовал аллель А от матери (метилирован в CVS), а мать унаследовала аллель А от своего отца (неметилирован в клетках материнской крови). Интересно, что в образцах материнской плазмы все четыре группы молекул можно легко различить, включая каждый из двух аллелей матери и каждый из двух аллелей плода. Таким образом, комбинируя генотипическую информацию со статусом метилирования в импринтинговых локусах, авторы настоящего изобретения могли легко отличить унаследованные от матери молекулы плодной ДНК от фоновых материнских молекул ДНК (LLM Poon et al. 2002 Clin Chem; 48: 35-41).
Указанный способ может применяться для детекции однородительской дисомии. Например, если известно, что отец данного плода гомозиготен по аллелю G, невозможность детектировать неметилированный аллель G в материнской плазме означает отсутствие вклада отцовского аллеля. Кроме того, в таких обстоятельствах, если в плазме при указанной беременности были детектированы и метилированный аллель G, и метилированный аллель А, у плода предположительно наблюдается материнская гете
- 32 042157 родисомия, т.е. наследование двух разных аллелей от матери без наследования от отца. Как вариант, если в материнской плазме бьши детектированы и метилированный аллель А (плодный аллель, унаследованный от матери) и неметилированный аллель А (материнский аллель, унаследованный матерью от своего отца) без неметилированного аллеля G (отцовский аллель, который должен был быть унаследован плодом), у плода предположительно наблюдается материнская изодисомия, т.е. наследование двух идентичных аллелей от матери без наследования от отца.
В случае NESP мать была гетерозиготна (GA) по ОНП, а плод был гомозиготен по аллелю G. Отцовский аллель был метилирован по NESP. В образцах материнской плазмы унаследованные от отца плодные аллели G, которые были метилированы, могут быть легко отличены от фоновых материнских аллелей G, которые были не метилированы.
VIII. Раковые заболевания/доноры
Некоторые варианты реализации могут применяться для детекции, скрининга, мониторинг (например, рецидива, ремиссии или ответа (например, присутствия или отсутствия ответа) на лечение), стадирования, классификации (например, для содействия при выборе наиболее целесообразного метода лечения) и прогнозирования раковых заболеваний с применением анализа метилирования циркулирующей ДНК плазмы/сыворотки.
Известно, что в раковой ДНК наблюдается аберрантное метилирование (JG Herman et al. 2003 N Engl J Med; 349: 2042-2054). Например, CpG-островковые промоторы генов, например, геновсупрессоров опухолей, гиперметилированы, тогда как CpG-сайты в теле гена гипометилированы по сравнению с не являющимися раковыми клетками. При условии, что профиль метилирования раковых клеток может быть представлен профилем метилирования происходящих из опухоли молекул ДНК плазмы с применением описанных в настоящем документе способов, авторы настоящего изобретения предполагают, что общий профиль метилирования в плазме будет отличаться у индивидуумов, больных раковым заболеванием, по сравнению со здоровыми индивидуумами, у которых отсутствует раковое заболевание, или по сравнению с индивидуумами, излечившимися от ракового заболевания. Типы различий профиля метилирования могут относиться к количественным различиям плотностей метилирования генома и/или плотностей метилирования сегментов геномов. Например, в плазме страдающих раковым заболеванием пациентов будет наблюдаться уменьшение плотностей метилирования метилома плазмы или сегментов генома ввиду общей гипометилированной природы ДНК раковых тканей (Gama-Sosa MA et al. 1983 Nucleic Acids Res; 11: 6883-6894).
Качественные изменения профиля метилирования также должны быть отражены в данных метилома плазмы. Например, молекулы ДНК плазмы, происходящие из генов, которые гиперметилированы исключительно в раковых клетках, будут демонстрировать гиперметилирование в плазме пациента, страдающего раковым заболеванием, относительно молекул ДНК плазмы, происходящих из тех же генов, но присутствующих в образце от здорового контроля. Поскольку аберрантное метилирование происходит при большинстве раковых заболеваний, описанные в настоящем документе способы могут применяться для детекции всех форм злокачественных новообразований с аберрантным метилированием, например, не ограничиваясь перечисленными, злокачественных новообразований в легком, молочной железе, ободочной и прямой кишки, предстательной железы, носоглотки, желудка, яичек, кожи, нервной системы, костей, яичника, печени, гематологических тканей, поджелудочной железы, матки, почек, мочевого пузыря, лимфоидных тканей и т.д. Злокачественные новообразования могут быть представлены разнообразными гистологическими подтипами, такими как карциномы, аденокарциномы, саркомы, фиброаденокарцинома, нейроэндокринные и недифференцированные, и т.д.
С другой стороны, авторы настоящего изобретения предполагают, что происходящие из опухоли молекулы ДНК можно отличить от фоновых происходящих не из опухоли молекул ДНК, так как общий небольшой размерный профиль происходящей из опухоли ДНК более выражен у молекул ДНК, происходящих из локусов с ассоциированным с опухолью аберрантным гипометилированием, которое должно оказывать дополнительный эффект на размер молекулы ДНК. Также происходящие из опухоли молекулы ДНК плазмы можно отличить от фоновых происходящих не из опухоли молекул ДНК плазмы с применением нескольких характерных особенностей, связанных с опухолевой ДНК, включая, но не ограничиваясь перечисленными, однонуклеотидные вариации, увеличение и уменьшение числа копий, транслокации, инверсии, аберрантное гипер- или гипометилирование и размерный профиль. Так как все перечисленные изменения могут происходить независимым образом, комплексное использование указанных признаков может обеспечить дополнительное преимущество для чувствительной и специфичной детекции раковой ДНК в плазме.
A. Размер и раковые заболевания.
Размер происходящих из опухоли ДНК молекул в плазме также напоминает размеры мононуклеосомных единиц; указанные молекулы короче фоновых происходящих не из опухоли молекул ДНК, которые также присутствуют в плазме страдающих раковым заболеванием пациентов. Было показано, что размерные параметры коррелируют с раковыми заболеваниями согласно описанию в заявке на патент США 13/789553, включенной в настоящий документ посредством ссылки во всех отношениях.
Поскольку продемонстрирована зависимость между размером и статусом метилирования молекулы
- 33 042157 и для происходящей от плода, и для происходящей от матери ДНК в плазме, ожидается, что для происходящих из опухоли молекул ДНК будет наблюдаться та же тенденция. Например, гипометилированные молекулы будут короче гиперметилированных молекул в плазме страдающих раковым заболеванием пациентов или субъектов, у которых проводится скрининг на раковые заболевания.
B. Плотности метилирования разных тканей у больных раковыми заболеваниями пациентов.
В данном примере авторы настоящего изобретения исследовали образцы плазмы и ткани пациента с гепатоцеллюлярной карциномой (ГЦК). Образцы крови получали от указанного пациента с ГЦК до хирургического удаления опухоли и через 1 неделю после хирургического удаления опухоли. Плазму и лейкоцитарную пленку собирали после центрифугирования образцов крови. Собирали резецированную опухоль и соседнюю неопухолевую ткань печени. Образцы ДНК, экстрагированные из образцов плазмы и ткани, исследовали с применением массивно-параллельного секвенирования с предварительной обработкой бисульфитом и без предварительной обработки бисульфитом. Также исследовали ДНК плазмы четырех здоровых индивидуумов без раковых заболеваний в качестве контролей. Обработка бисульфитом ДНК преобразует неметилированные остатки цитозина в урацил. В ходе последующих полимеразной цепной реакции и секвенирования указанные остатки урацила будут вести себя как тимидин. С другой стороны, обработка бисульфитом не приводит к конверсии метилированных остатков цитозина в урацил. После массивно-параллельного секвенирования риды последовательностей исследовали с помощью Methy-Pipe (P Jiang, et al. Methy-Pipe: An integrated bioinformatics data analysis pipeline for whole genome methylome analysis (Methy-Pipe: комплексная система анализа данных биоинформатики для полногеномного анализа метилома), доклад представлен на Международной практической конференции по биоинформатике и биомедицине Международного института инженеров электротехники и электроники (IEEE International Conference on Bioinformatics and Biomedicine Workshops), Гонконг, 18-21 декабря 2010 г.), для определения статуса метилирования остатков цитозина во всех положениях с динуклеотидами CG, т.е. в CpG-сайтах.
Фиг. 21А представляет собой табл. 2100, где приведены плотности метилирования предоперационных образцов плазмы и ткани пациента с ГЦК. Плотность метилирования CpG для представляющих интерес областей (например, CpG-сайтов, промотора или повторяющихся областей, и т.д.) относится к доле ридов, демонстрирующих метилирование CpG, в общем количестве ридов, покрывающих геномные динуклеотиды CpG. Плотности метилирования лейкоцитарной пленки и неопухолевой ткани печени аналогичны. Общая плотность метилирования опухолевой ткани, на основе данных для всех аутосом, была на 25% ниже, чем плотность метилирования лейкоцитарной пленки и неопухолевой ткани печени. Гипометилирование было стабильным для каждой индивидуальной хромосомы. Плотность метилирования плазмы находилась между значениями плотности для незлокачественных тканей и раковых тканей. Указанное наблюдение согласуется с тем фактом, что и раковые, и не являющиеся раковыми ткани вносят вклад в циркулирующую ДНК пациента с раковым заболеванием. Было показано, что гемопоэтическая система является главным источником циркулирующей ДНК у индивидуумов без активных злокачественных состояний (YYN Lui, et al. 2002 Clin Chem; 48: 421-7). Поэтому авторы настоящего изобретения также исследовали образцы плазмы, полученные от четырех здоровых контролей. Число ридов секвенирования и достигнутая глубина секвенирования на образец приведены в таблице 2150 на фиг. 21В.
Фиг. 22 представляет собой табл. 220, где приведены плотности метилирования в аутосомах, варьирующие от 71,2% до 72,5% в образцах плазмы здоровых контролей. Эти данные показывают ожидаемый уровень метилирования ДНК в образцах плазмы, полученных от индивидуумов, у которых отсутствует источник опухолевой ДНК. У больного раковым заболеванием пациента опухолевая ткань также высвобождает ДНК в кровоток (KCA Chan et al. 2013 Clin Chem; 59: 211-224); RJ Leary et al. 2012 Sci Transl Med; 4: 162ra154). Из-за гипометилированной природы опухоли ГЦК присутствие как происходящей из опухоли, так и происходящей не из опухоли ДНК в предоперационной плазме пациента приводило к уменьшению плотности метилирования относительно уровней в плазме здоровых контролей. Фактически, плотность метилирования в образце предоперационной плазмы находилась между значениями плотностей метилирования опухолевой ткани и плазмы здоровых контролей. Причина заключается в том, что на уровень метилирования ДНК плазмы страдающих раковым заболеванием пациентов влияет степень аберрантного метилирования, в указанном случае - гипометилирования, опухолевой ткани и фракционная концентрация происходящей из опухоли ДНК в кровотоке. Меньшая плотность метилирования опухолевой ткани и более высокая фракционная концентрация происходящей из опухоли ДНК в кровотоке приводят к меньшей плотности метилирования ДНК плазмы у больного раковым заболеванием пациента. Большинство опухолей, как сообщается, демонстрируют глобальное гипометилирование (JG Herman et al. 2003 N Engl J Med; 349: 2042-2054; MA Gama-Sosa et al. 1983 Nucleic Acids Res; 11: 6883-6894). Соответственно, данные наблюдения для образцов ГЦК должны быть также применимы к другим типам опухолей.
Согласно одному варианту реализации плотность метилирования ДНК плазмы может использоваться для определения фракционной концентрации происходящей из опухоли ДНК в образце плазмы/сыворотки, если известен уровень метилирования опухолевой ткани. Уровень метилирования, например, плотность метилирования опухолевой ткани, может быть определен, если доступен образец опухоли или биоптат опухоли. Согласно другому варианту реализации информация относительно уровня
- 34 042157 метилирования опухолевой ткани может быть получена при изучении уровня метилирования в группе опухолей аналогичного типа, и указанную информацию (например, среднее значение уровня или медиана уровня) используют для исследуемого пациента с применением описанной в указанном изобретении технологии. Уровень метилирования опухолевой ткани может быть определен посредством анализа опухолевой ткани пациента или выведен по анализу опухолевых тканей других пациентов с раковым заболеванием того же или аналогичного типа. Метилирование опухолевых тканей может быть определено с применением ряда чувствительных к метилированию платформ, включая, но не ограничиваясь перечисленными, массивно-параллельное секвенирование, одномолекулярное секвенирование, микроматрицы (например, олигонуклеотидные матрицы), или масс-спектрометрия (например, анализ Epityper от Sequenom Inc.). Согласно некоторым вариантам реализации такой анализ может предваряться процедурами, чувствительными к статусу метилирования молекул ДНК, включая, но не ограничиваясь перечисленным, иммунопреципитация цитозина и расщепление чувствительными к метилированию рестрикционными ферментами. Если известен уровень метилирования опухоли, после анализа метилома плазмы может быть рассчитана фракционная концентрация опухолевой ДНК в плазме страдающих раковым заболеванием пациентов.
Зависимость между уровнем метилирования в плазме, Р, с фракционной концентрацией опухолевой ДНК, f, и уровнем метилирования опухолевой ткани, TUM, может быть описана как ΒΚθ X(1J)+TUM где BKG представляет собой фоновый уровень метилирования ДНК в плазме, полученной из клеток крови и других внутренних органов. Например, было показано, что общая плотность метилирования всех аутосом составляет 42,9% в биоптате опухолевой ткани, полученном от указанного пациента с ГЦК, т.е. это значение TUM для указанного случая. Среднее значение плотности метилирования образцов плазмы от четырех здоровых контролей составляло 71,6%, т.е. значение BKG для указанного случая. Плотность метилирования в плазме для предоперационной плазмы составляла 59,7%. Используя указанные значения, определяют, что/составляет 41,5%.
Согласно другому варианту реализации уровень метилирования опухолевой ткани может быть установлен неинвазивным образом на основе данных о метиломе плазмы, если известна фракционная концентрация происходящей из опухоли ДНК в образце плазмы. Фракционная концентрация происходящей из опухоли ДНК в образце плазмы может быть определена посредством другого генетического анализа, например, полногеномного анализа потери аллелей (GAAL) и анализа однонуклеотидных мутаций согласно более раннему описанию (заявка на патент США 13/308473; KCA Chan et al. 2013 Clin Chem; 59: 211-24). Указанный расчет основан на тех же взаимосвязях, что и описанные выше, за исключением того, что согласно указанному варианту реализации значение f известно, а значение TUM становится неизвестным. Указанное выведение может осуществляться для полного генома или для частей генома, аналогично данным, рассмотренным в контексте определения уровня метилирования плацентарной ткани по данным материнской плазмы.
Согласно другому варианту реализации может использоваться вариативность между участками или профилями плотностей метилирования для различения субъектов, имеющих раковые заболевания и не имеющих раковых заболеваний. Разрешение анализа метилирования может быть дополнительно увеличено путем разделения генома на участки конкретного размера, например, 1 Мб. Согласно подобному варианту реализации рассчитывали плотность метилирования каждого участка размером 1 Мб для собранных образцов, например, лейкоцитарной пленки, ткани резецированной ГЦК, неопухолевой ткани печени, смежной с опухолью и плазмы, собранной до и после удаления опухоли. Согласно другому варианту реализации размеры участков не обязательно должны быть постоянными. Согласно одному варианту реализации число CpG-сайтов остается постоянным в составе каждого участка, при этом размер самого участка может варьировать.
На фиг. 23А и В представлена плотность метилирования лейкоцитарной пленки, опухолевой ткани, неопухолевой ткани печени, предоперационной плазмы и послеоперационной плазмы пациента с ГЦК. Фиг. 23А представляет собой график 2300 результатов для хромосомы 1. Фиг. 23 В представляет собой график 2350 результатов для хромосомы 2.
Для большинства участков размером 1 Мб плотности метилирования лейкоцитарной пленки и неопухолевой ткани печени, смежной с опухолью, были аналогичны, тогда как плотности метилирования опухолевых тканей были более низкими. Значения плотности метилирования предоперационной плазмы находятся между значениями для опухоли и незлокачественных тканей. Плотности метилирования исследуемых геномных областей в опухолевых тканях могут быть выведены с применением данных о метилировании предоперационной плазмы и фракционной концентрации опухолевой ДНК. Указанный способ идентичен описанному выше описанию способу с использованием значений плотности метилирования для всех аутосом. Описанное выведение значений метилирования опухоли может также проводиться с применением указанных данных более высокого разрешения относительно метилирования ДНК плазмы. Также могут использоваться участки другого размера, например, 300 кб, 500 кб, 2 Мб, 3 Мб, 5 Мб или более чем 5 Мб. Согласно одному варианту реализации размеры участков не обязательно должны быть постоянными. Согласно одному варианту исполнения число CpG-сайтов остается постоянным в
- 35 042157 составе каждого участка, при этом размер самого участка может варьировать.
С. Сравнение плотности метилирования в плазме больного раковым заболеванием пациента и здоровых индивидуумов.
Как видно из 2100, плотности метилирования ДНК предоперационной плазмы у больного раковым заболеванием пациента были ниже, чем плотности метилирования незлокачественных тканей. Это предположительно обусловлено присутствием ДНК из опухолевой ткани, которая гипометилирована. Указанная более низкая плотность метилирование ДНК плазмы потенциально может использоваться в качестве биомаркера для детекции и мониторинга раковых заболеваний. При мониторинге ракового заболевания в том случае, если рак прогрессирует, со временем будет наблюдаться повышенное количество происходящей из ракового новообразования ДНК в плазме. Согласно указанному примеру повышенное количество циркулирующей происходящей из ракового новообразования ДНК в плазме будет приводить к последующему снижению плотности метилирования ДНК в плазме в полногеномном масштабе.
И напротив, если раковое заболевание реагирует на лечение, количество происходящей из ракового новообразования ДНК в плазме будет уменьшаться со временем. Согласно указанному примеру уменьшение количества происходящей из ракового новообразования ДНК в плазме приведет к увеличению плотности метилирования ДНК в плазме. Например, если проводилось лечение пациента с раком легкого с мутацией рецептора эпидермального фактора роста с применением таргетной терапии, например, ингибирования тирозинкиназ, увеличение плотности метилирования ДНК в плазме свидетельствует об ответе. Последующее появление опухолевого клона, устойчивого к ингибиторам тирозинкиназы, будет связано с уменьшением плотности метилирования ДНК в плазме, что может указывать на рецидив.
Измерения плотности метилирования в плазме могут осуществляться серийно; при таких измерениях могут быть рассчитаны скорости изменения и использованы для прогнозирования или корреляции с клиническим прогрессированием или ремиссией, или прогнозом. Для выбранных геномных локусов, гиперметилированных в раковых тканях, но гипометилированных в нормальных тканях, например, промоторных областей некоторых генов-супрессоров опухолей, зависимость между прогрессированием рака и благоприятным ответом на лечение будет обратной относительно паттернов, описанных выше.
Чтобы продемонстрировать осуществимость указанного способа, авторы настоящего изобретения сравнивали плотности метилирования ДНК образцов плазмы, полученных от больного раковым заболеванием пациента до и после хирургического удаления опухоли, с ДНК плазмы, полученной от четырех здоровых контрольных субъектов.
В таблице 2200 приведены плотности метилирования ДНК каждой аутосомы и объединенные значения для всех аутосом предоперационных и послеоперационных образцов плазмы больного раковым заболеванием пациента, и объединенные значения для всех аутосом четырех здоровых контрольных субъектов. Для всех хромосом плотности метилирования ДНК в образце предоперационной плазмы были ниже, чем плотности в послеоперационном образце и образцах плазмы четырех здоровых субъектов. Различие плотностей метилирования ДНК в плазме между предоперационными и послеоперационными образцами представляет собой доказательство того, что более низкие плотности метилирования в образце предоперационной плазмы были обусловлены присутствием ДНК из опухоли ГЦК.
Возвращение плотностей метилирования ДНК в образце послеоперационной плазмы к уровням, аналогичным уровням в образцах плазмы здоровых контролей, предполагает, что значительная часть происходящей из опухоли ДНК исчезла благодаря хирургическому удалению источника, т.е. опухоли. Эти данные предполагают, что плотность метилирования предоперационной плазмы, определенная с применением доступных для обширных геномных областей данных, таких как все аутосомы или индивидуальные хромосомы, находилась на более низком уровне, чем плотность метилирования у здоровых контролей, что позволяет идентифицировать тестируемый случай как раковое заболевание, т.е. установить диагноз или провести скрининг.
Данные для предоперационной плазмы также показали значительно более низкий уровень метилирования, чем в послеоперационной плазме, что указывает на то, что уровень метилирования в плазме также можно использовать для мониторинга опухолевой нагрузки и, соответственно, для прогнозирования и мониторинга прогрессирования ракового заболевания у пациента. Референсные значения можно определить по плазме здоровых контролей или индивидуумов, у которых имеется риск развития ракового заболевания, но на текущий момент не имеющих раковых заболеваний. Индивидуумы, у которых имеется риск развития ГЦК, включают страдающих хроническим гепатитом В или инфицированных гепатитом С, индивидуумов с гемохроматозом и индивидуумов с циррозом печени.
Значения плотности метилирования в плазме за пределами, например, ниже указанной точки отсечения, основанной на референсных значениях, может применяться для оценки наличия или отсутствия в плазме небеременного индивидуума опухолевой ДНК. Для детекции присутствия гипометилированной циркулирующей опухолевой ДНК точка отсечения может быть определена как уровень ниже 5-го или 1го процентиля значений в контрольной популяции, или может быть определена на основе нескольких стандартных отклонений, например, 2 или 3 стандартных отклонений (SD), ниже средних значений плотности метилирования у контролей, или на основе нескольких медианных значений (МоМ). Для гиперметилированной опухолевой ДНК точка отсечения может быть определен как уровень выше 95-го
- 36 042157 или 99-го процентиля значений в контрольной популяции, или может быть определена на основе нескольких стандартных отклонений, например, 2 или 3 SD вьппе средних значений плотности метилирования значений контролей, или на основе определения нескольких медианных значений (МоМ). Согласно одному варианту реализации возраст в контрольной популяции совпадает с возрастом тестируемого субъекта. Совпадение по возрасту не обязательно должно быть точным и может быть представлено возрастными группами (например, от 30 до 40 лет, при возрасте тестируемого субъекта, составляющем 35 лет).
Затем авторы настоящего изобретения сравнили плотности метилирования участков размером 1 Мб в образцах плазмы больного раковым заболеванием пациента и в образцах от четырех контрольных субъектов. Для наглядности представлены указанные результаты для хромосомы 1.
Фиг. 24А представляет собой график 2400, отражающий плотности метилирования предоперационной плазмы от пациента с ГЦК. Фиг. 24В представляет собой график 2450, отражающий плотности метилирования в послеоперационной плазме от пациента с ГЦК. Голубые точки представляют результаты для контрольных субъектов, красными точками обозначены результаты для образца плазмы от пациента с ГЦК.
Как видно на фиг. 24А, плотности метилирования в предоперационной плазме от пациента с ГЦК были ниже, чем плотности метилирования контрольных субъектов для большинства участков. Аналогичные паттерны наблюдались для других хромосом. Как видно на фиг. 24В, плотности метилирования в послеоперационной плазме от пациента с ГЦК были аналогичны плотностям метилирования у контрольных субъектов для большинства участков. Аналогичные паттерны наблюдались для других хромосом.
Для оценки того, имеется ли раковое заболевания у тестируемого субъекта, результат для тестируемого субъекта сравнивают со значениями для референсной группы. Согласно одному варианту реализации референсная группа может быть составлена несколькими здоровыми субъектами. Согласно другому варианту реализации референсная группа может быть составлена субъектами с незлокачественными состояниями, например, инфекцией хронического гепатита В или циррозом. Затем может быть количественно определено различие плотностей метилирования между тестируемым субъектом и референсной группой.
Согласно одному варианту реализации референсный диапазон может быть определен по значениям контрольной группы. Затем могут быть использованы отклонения результата для тестируемого субъекта от верхнего или нижнего предела для референсной группы для определения того, имеется ли у субъекта опухоль. На эту величину будет влиять фракционная концентрация происходящей из опухоли ДНК в плазме и различие уровня метилирования между злокачественными и незлокачественными тканями. Более высокая фракционная концентрация происходящей из опухоли ДНК в плазме приводит к большим различиям плотности метилирования между тестируемым образцом плазмы и контролями. Большая степень различия уровней метилирования злокачественных и незлокачественных тканей также связана с большими различиями плотности метилирования между тестируемым образцом плазмы и контролями. Согласно еще одному варианту реализации для тестируемых субъектов из разных возрастных диапазонов выбирают разные референсные группы.
Согласно другому варианту реализации рассчитывали среднее значение и SD плотностей метилирования четырех контрольных субъектов для каждого участка размером 1 Мб. Затем для соответствующих участков рассчитывали разность между плотностями метилирования пациента с ГЦК и средним значением для контрольных субъектов. Согласно одному варианту реализации указанную разность далее делили на SD соответствующего участка для определения Z-показателя. Другими словами, Z-показатель представляет разность плотностей метилирования тестируемого и контрольного образцов плазмы, выраженную в виде нескольких SD средних значений для контрольных субъектов. Z-показатель >3 для участка означает, что ДНК плазмы пациента с ГЦК более гиперметилирована, чем у контрольных субъектов, более чем на 3 SD на указанном участке, тогда как Z-показатель < -3 на участке означает, что ДНК плазмы пациента с ГЦК более гипометилирована, чем у контрольных субъектов, более чем на 3 SD на указанном участке.
На фиг. 25А и В представлены Z-показатели плотностей метилирования ДНК плазмы для предоперационных (график 2500) и послеоперационных (график 2550) образцов плазмы пациента с ГЦК с применением данных о метиломе плазмы четырех здоровых контрольных субъектов в качестве эталона для хромосомы 1. Каждая точка представляет результат для одного участка размером 1 Мб. Черными точками обозначены участки с Z-показателем в диапазоне от -3 до 3. Красными точками обозначены участки с Z-показателем <-3.
Фиг. 26А представляет собой табл. 2600, где приведены данные Z-показателей для предоперационной и послеоперационной плазмы. Большинство участков на хромосоме 1 (80,9%) в образце предоперационной плазмы имели Z-показатель <-3, указывающий на то, что ДНК предоперационной плазмы пациента с ГЦК была значительно более гипометилирована по сравнению с контрольными субъектами. С другой стороны, число красных точек существенно снижалось в образце послеоперационной плазмы (8,3% участков на хромосоме 1), предполагая, что большая часть опухолевой ДНК была устранена из кровотока благодаря хирургическому удалению источника циркулирующей опухолевой ДНК.
Фиг. 26В представляет собой Circos-график 2620, демонстрирующий Z-показатель плотностей ме
- 37 042157 тилирования ДНК плазмы для предоперационных и послеоперационных образцов плазмы пациента с ГЦК с использованием четырех здоровых контрольных субъектов в качестве эталона для участков размером 1 Мб, проанализированных для всех аутосом. Внешний круг представляет идеограммы аутосом человека. Средний круг представляет данные для образца предоперационной плазмы. Внутренний круг представляет указанные данные для образца послеоперационной плазмы. Каждая точка представляет результат для одного участка размером 1 Мб. Черными точками обозначены участки с Z-показателями от -3 до 3. Красными точками обозначены участки с Z-показателями <-3. Зелеными точками обозначены участки с Z-показателями >3.
Фиг. 26С представляет собой таблицу 2640, демонстрирующую распределение Z-показателей участков размером 1 Мб для полного генома как в предоперационных, так и в послеоперационных образцах плазмы пациента с ГЦК. Эти результаты показывают, что ДНК предоперационной плазмы пациента с ГЦК была более гипометилирована, чем у контролей, для большинства областей (85,2% участков размером 1 Мб) во все геноме. С другой стороны, большинство областей (93,5% участков размером 1 Мб) в образце послеоперационной плазмы не демонстрировали значительного гиперметилирования или гипометилирования по сравнению с контролями. Эти данные показывают, что большая часть опухолевой ДНК, по своей природе главным образом гипометилированной для данной ГЦК, больше не присутствовала в образце послеоперационной плазмы.
Согласно одному варианту реализации число, процент или доля участков с Z-показателями <-3 может применяться для определения наличия ракового заболевания. Например, как видно из таблицы 2640, 2330 из 2734 проанализированных участков (85,2%) демонстрировали Z-показатели <-3 в предоперационной плазме, но при этом только 171 из 2734 проанализированных участков (6,3%) демонстрировали Zпоказатели <-3 в послеоперационной плазме. Эти данные показывают, что нагрузка опухолевой ДНК в предоперационной плазме была значительно выше, чем в послеоперационной плазме.
Предельные значения числа участков могут быть определены с применением статистических методов. Например, приблизительно 0,15% участков, как ожидается, будут иметь Z-показатель <-3 на основе нормального распределения. Таким образом, точка отсечения для числа участков может составлять 0,15% от общего числа анализируемых участков. Другими словами, если в образце плазмы небеременного индивидуума наблюдается более чем 0,15% участков с Z-показателями <-3, имеется источник гипометилированной ДНК в плазме, а именно, раковое заболевание. Например, 0,15% из 2734 участков размером 1 Мб, которые авторы настоящего изобретения исследовали в данном примере, составляет приблизительно 4 участка. При использовании указанной величины в качестве точки отсечения образцы и предоперационной, и послеоперационной плазмы содержали гипометилированную происходящую из опухоли ДНК, хотя ее количество значительно выше в образце предоперационной плазмы по сравнению с образцом послеоперационной плазмы. У четырех здоровых контрольных субъектов ни один из участков не показал значительного гиперметилирования или гипометилирования. Могут применяться другие предельные значения (например, 1,1%) и они могут варьировать в зависимости от требований используемого анализа. В других примерах процент отсечения может варьировать на основании статистического распределения, а также требуемой чувствительности и приемлемой специфичности.
Согласно другому варианту реализации точка отсечения может быть определена посредством анализа кривых функциональных характеристик (кривых ROC), путем анализа числа страдающих раковым заболеванием пациентов и индивидуумов без раковых заболеваний. Для дополнительной валидации специфичности указанного подхода исследовали образец плазмы от пациента, обратившегося за медицинской консультацией в связи с незлокачественным состоянием (С06). 1,1% участков имели Z-показатель <-3. Согласно одному варианту реализации разные пороги могут применяться для классификации разных уровней статуса заболевания. Более низкий пороговый процент может применяться для различения статуса здоровья от доброкачественных состояний, и более высокий пороговый процент для различения доброкачественных состояний и злокачественных новообразований.
Диагностическая эффективность анализа гипометилирования плазмы с применением массивнопараллельного секвенирования, по-видимому, выше, чем эффективность при применении полимеразной цепной реакции (ПЦР), основанной на амплификации специфических классов повторяющихся элементов, например, длинного диспергированного ядерного элемента-1 (LINE-1) (Р Tangkijvanich et al. 2007 Clin Chim Acta; 379:127-133). Одним из возможных объяснений указанного наблюдения является то, что хотя гипометилирование широко распространено в геноме опухоли, ему все же свойственна некоторая степень неоднородности в разных геномных областях.
Фактически, авторы настоящего изобретения наблюдали, что средние значения плотностей метилирования в плазме у референсных субъектов варьировали по всему геному (фиг. 56). Каждая красная точка на фиг. 56 отражает среднее значение плотности метилирования одного участка размером 1 Мб у 32 здоровых субъектов. На графике представлены все проанализированные участки размером 1 Мб по всему геному. Число в каждой рамке представляет собой номер хромосомы. Авторы настоящего изобретения наблюдали варьирование средних значений плотности метилирования от участка к участку.
Диагностический алгоритм простого анализа на основе ПЦР не позволяет учитывать такую гетерогенность между областями. Такая гетерогенность расширяет диапазон плотностей метилирования, на
- 38 042157 блюдаемых у здоровых индивидуумов. Поэтому может требоваться более значительное снижение плотности метилирования, чтобы образец считался демонстрирующим гипометилирование. Это приведет к снижению чувствительности теста.
Напротив, при использовании способа на основе массивно-параллельного секвенирования геном разделяется на участки размером 1 Мб (или участки других размеров) и плотности метилирования для таких участков измеряются индивидуально. Указанный способ уменьшает влияние вариаций исходных плотностей метилирования в разных геномных областях, поскольку сравнивают каждую область в тестируемом образце и в контролях. Так, для одного и того же участка вариативность между 32 здоровыми контрольными индивидуумами была относительно невелика. Для 32 здоровых контролей 95% участков имели коэффициент вариации (CV), составляющий <1,8%. Однако для дополнительного повышения чувствительности при детектировании связанного с раковым заболеванием гипометилирования сравнение может осуществляться по нескольким геномным областям. Чувствительность будет повышаться при тестировании нескольких геномных областей, поскольку это гарантирует отсутствие влияния биологической изменчивости, когда при тестировании всего одной области гипометилирование образца ракового новообразования для конкретной области не наблюдается.
Способ, включающий сравнение плотности метилирования эквивалентных геномных областей в контролях и тестируемых образцах (например, тестирование каждой геномной области по отдельности, и затем, возможно, объединение таких результатов) и осуществление указанного сравнения для нескольких геномных областей дает более высокое отношение сигнал/шум при детекции гипометилирования, связанного с раковым заболеванием. Указанный способ, включающий массивно-параллельное секвенирование, представлен в иллюстративных целях. Можно ожидать, что и другие методики, позволяющие определять плотности метилирования нескольких геномных областей и проводить сравнение плотностей метилирования соответствующих областей в контролях и тестируемых образцах, будут обеспечивать аналогичный эффект. Например, для достижения требуемого эффекта могут быть сконструированы зонды гибридизации или инвертированные молекулярные зонды, которые могут быть нацелены на молекулы ДНК плазмы, происходящие из конкретных геномных областей, а также определять уровень метилирования указанной области.
Согласно еще одному варианту реализации может применяться сумма Z-показателей всех участков для определения присутствия ракового заболевания или для мониторинга последовательных изменений уровня метилирования ДНК в плазме. В связи с общей гипометилированной природой опухолевой ДНК сумма Z-показателей будет ниже в плазме, полученной от индивидуума, больного раковым заболеванием, чем у здоровых контролей. Сумма Z-показателей для образцов предоперационной и послеоперационной плазмы пациента с ГЦК составляла -49843,8 и -3132,13 соответственно.
Согласно другим вариантам реализации могут применяться другие способы для исследования уровня метилирования ДНК плазмы. Например, может быть определена доля метилированных остатков цитозина в общем содержании остатков цитозина с применением масс-спектрометрии (ML Chen et al. 2013 Clin Chem; 59: 824-832) или массивно-параллельного секвенирования. Однако так как большинство остатков цитозина находится вне контекста динуклеотидов CpG, доля метилированных цитозинов в общем количестве остатков цитозина будет относительно небольшой по сравнению с уровнями метилирования, определяемыми в контексте динуклеотидов CpG. Авторы настоящего изобретения определили уровень метилирования образцов ткани и плазмы, полученных от пациента с ГЦК, а также четырех образцов плазмы, полученной от здоровых контролей. Уровни метилирования измеряли в контексте CpG, любых цитозинов, в контекстах CHG и СНН с применением данных полногеномного массивнопараллельного секвенирования. Н относится к аденину, тимину или остаткам цитозина.
Фиг. 26D представляет собой таблицу 2660, где представлены уровни метилирования в образце опухолевой ткани и предоперационной плазмы, пересекающиеся с некоторыми из контрольных образцов плазмы в контексте СНН и CHG. Уровни метилирования в образце опухолевой ткани и предоперационной плазмы были стабильно более низкими по сравнению с лейкоцитарной пленкой, неопухолевой тканью печени, образцом послеоперационной плазмы и образцов плазмы здоровых контролей, как для CpG, так и для любых цитозинов. Однако данные на основе метилированных CpG, т.е. плотности метилирования, демонстрировали более широкий динамический диапазон, чем данные на основе метилированных цитозинов.
Согласно другим вариантам реализации статус метилирования ДНК плазмы может быть определен способами с применением антител против метилированного цитозина, например, иммунопреципитацией метилированной ДНК (MeDIP). Однако точность указанных способов, как ожидается, будет ниже, чем точность способов на основе секвенирования, из-за вариабельности связывания антител. Согласно еще одному варианту реализации может быть определен уровень 5-гидроксиметилцитозина в ДНК плазмы. При этом было обнаружено, что снижение уровня 5-гидроксиметилцитозина является эпигенетическим признаком некоторых раковых заболеваний, например, меланомы (CG Lian, et al. 2012 Cell; 150: 1135-1146).
Помимо ГЦК авторы настоящего изобретения также исследовали, возможно ли применение указанного способа для других типов раковых заболеваний. Авторы настоящего изобретения исследовали образцы плазмы от 2 пациентов с аденокарциномой легкого (АЛ1 и АЛ2), 2 пациентов с носоглоточной
- 39 042157 карциномой (НГК1 и НГК2), 2 пациентов с раком толстой и прямой кишки (КРК1 и КРК2), 1 пациента с метастатической нейроэндокринной опухолью (НЭК1) и 1 пациента с метастатической гладкомышечной саркомой (ГМС1). ДНК плазмы указанных субъектов конвертировали бисульфитом и секвенировали с применением платформы Illumina HiSeq2000 для 50 п.о. на одном конце. Четырех здоровых контрольных субъектов, упомянутых выше, использовали в качестве референсной группы для анализа у указанных 8 пациентов. Использовали 50 п.о. ридов последовательностей на одном конце. Весь геном разделяли на участки размером 1 Мб. Среднее значение и SD плотности метилирования рассчитывали для каждого участка с применением данных референсной группы. Затем эти результаты для 8 больных раком пациентов выражали в виде Z-показателей, представляющих собой число SD среднего значения референсной группы. Положительное значение означает, что плотность метилирования в тестируемом случае ниже, чем среднее значение для референсной группы, и наоборот. Число ридов секвенирования и достигнутая глубина секвенирования на образец приведены в табл. 2780 на фиг. 27I.
На фиг. 27А-Н представлен Circos-график плотности метилирования у 8 пациентов с раковыми заболеваниями в соответствии с вариантами реализации настоящего изобретения. Каждая точка представляет результат для участка размером 1 Мб. Черными точками обозначены участки с Z-показателями в диапазоне от -3 до 3. Красными точками обозначены участки с Z-показателями <-3. Зелеными точками обозначены участки с Z-показателями >3. Интервал между двумя последовательными линиями представляет разность Z-показателей, равную 20.
Значительное гипометилирование наблюдалась в нескольких областях геномов пациентов при большинстве типов раковых заболеваний, включая рак легкого, носоглоточную карциному, рак толстой и прямой кишки и метастатическую нейроэндокринную опухоль. Интересно, что, помимо гипометилирования, наблюдалась значительное гиперметилирование нескольких областей по всему геному в случае с метастатической гладкомышечной саркомой. Гладкомышечная саркома происходит из эмбриональной мезодермы, тогда как другие типы раковых заболеваний у остальных 7 пациентов имеют эктодермальное эмбриональное происхождение. Таким образом, возможно, что паттерн метилирования ДНК саркомы может отличаться от паттерна карциномы.
Как видно из указанного случая, паттерн метилирования ДНК плазмы также может подходить для дифференциации разных типов раковых заболеваний, в указанном примере - для дифференциации карциномы и саркомы. Эти данные также предполагают, что указанный способ может использоваться для детекции аберрантного гиперметилирования, связанного со злокачественньм новообразованием. Во всех указанных 8 случаях были доступны только образцы плазмы и анализ опухолевой ткани не проводился. Это показало, что даже при отсутствии предварительного профиля метилирования или уровней метилирования опухолевой ткани происходящая из опухоли ДНК может быть легко детектирована в плазме с применением описанных способов.
Фиг. 27J представляет собой табл. 2790, отражающую распределение Z-показателей участков размером 1 Мб полного генома в плазме пациентов с разными злокачественными новообразованиями. Для каждого случая показан процент участков с Z-показателем <-3, -3-3 и >3. Более чем 5% участков имели Z-показатель <-3 для всех случаев. Таким образом, при использовании авторами настоящего изобретения для классификации образца как положительного по раковому заболеванию точки отсечения, равной 5% значительно гипометилированных участков, все указанные случаи будут классифицированы как положительные по раковому заболеванию. Полученные авторами результаты показывают, что гипометилирование предположительно представляет собой общее явление для разных типов раковых заболеваний, и анализ метилома плазмы подходит для детекции разных типов раковых заболеваний.
D. Способ.
Фиг. 28 представляет собой блок-схему способа 2800 анализа биологического образца организма для установления классификации уровня рака в соответствии с вариантами реализации настоящего изобретения. Указанный биологический образец включает ДНК, происходящую из нормальных клеток, и может потенциально включать ДНК из клеток, связанных с раковым заболеванием. По меньшей мере часть ДНК в биологическом образце может быть свободной от клеток.
На этапе 2810 анализируют множество молекул ДНК из указанного биологического образца. Анализ молекулы ДНК может включать определение локализации указанной молекулы ДНК в геноме указанного организма и определение того, метилирована ли указанная молекула ДНК в одном или большем числе сайтов. Указанный анализ может осуществляться путем получения ридов последовательностей с помощью чувствительного к метилированию секвенирования, и, соответственно, анализ может осуществляться исключительно на основе ранее полученных для указанной ДНК данных. Согласно другим вариантам реализации анализ может включать фактическое секвенирование или другие активные этапы получения данных.
На этапе 2820 для каждого из множества сайтов определяют относительное количество молекул ДНК, которые метилированы в указанном сайте. Согласно одному варианту реализации указанные сайты представлены CpG-сайтами, и могут быть представлены только некоторыми CpG-сайтами, выбранными с применением одного или нескольких критериев, упоминаемых в настоящем документе. Число молекул ДНК, которые метилированы, эквивалентно определению числа неметилированных молекул, если нор
- 40 042157 мировка проводится с использованием общего числа анализируемых молекул ДНК в конкретном сайте, например, общего числа ридов секвенирования. Например, увеличение плотности метилирования CpG в области эквивалентно уменьшению плотности неметилированных CpG в той же области.
На этапе 2830 рассчитывают первый уровень метилирования на основании соответствующих количеств молекул ДНК, метилированных во множестве сайтов. Первый уровень метилирования может соответствовать плотности метилирования, которую определяют на основании числа молекул ДНК, соответствующих указанному множеству сайтов. Указанные сайты могут соответствовать множеству локусов или только одному локусу.
На этапе 2840 сравнивают первый уровень метилирования с первым предельным значением. Первое предельное значение может представлять собой референсный уровень метилирования или быть связано с референсным уровнем метилирования (например, находиться на определенном расстоянии от нормального уровня). Референсный уровень метилирования может быть определен по образцам индивидуумов без раковых заболеваний, или по локусам организма, которые, как известно, не связаны с раковым заболеванием у указанного организма. Первое предельное значение может быть установлено по референсному уровню метилирования, определенному по предыдущему биологическому образцу от указанного организма, полученному ранее тестируемого биологического образца.
Согласно одному варианту реализации первое предельное значение представляет собой указанное расстояние (например, указанное число стандартных отклонений) от референсного уровня метилирования, установленного по биологическому образцу, полученному от здорового организма. Сравнение может осуществляться путем определения разности между первым уровнем метилирования и референсным уровнем метилирования, и затем сравнения указанной разности с порогом, соответствующим первому предельному значению (например, для определения того, отличается ли статистически уровень метилирования от референсного уровня метилирования).
На этапе 2850 проводят классификацию уровня рака на основании указанного сравнения. Примеры уровня рака включают наличие или отсутствие у субъекта ракового заболевания или предзлокачественного состояния, или повышенная вероятность развития ракового заболевания. Согласно одному варианту реализации первое предельное значение может быть определено по ранее полученному образцу от субъекта (например, референсный уровень метилирования может быть определен по ранее полученному образцу).
Согласно некоторым вариантам реализации первый уровень метилирования может соответствовать ряду областей, где уровни метилирования превышают пороговое значение. Например, может быть идентифицировано множество областей генома указанного организма. Указанные области могут быть идентифицированы с применением упоминаемых в настоящем документе критериев, например, по определенной длине или определенному числу сайтов. В составе каждой из указанных областей могут быть идентифицированы один или несколько сайтов (например, CpG-сайтов). Для каждой области может быть рассчитан уровень метилирования области. Первый уровень метилирования соответствует первой области. Каждый из уровней метилирования области сравнивают с соответствующим предельным значением для области, которое может быть одинаковым или варьировать для разных областей. Предельное значение для первой области называют первым предельным значением. Соответствующие предельные значения для областей могут быть представлены указанным количеством (например, половиной (0,5)) референсного уровня метилирования, таким образом, подсчитываются только области, значительно отличающиеся от эталона, который может быть определен по субъектам, не имеющим раковых заболеваний.
Может быть определено первое число областей, уровень метилирования которых превышает соответствующее предельное значение для области, и оно может сравниваться с пороговьм значением для определения классификации. Согласно одному варианту реализации пороговое значение представляет собой процент. Сравнение указанного первого числа с пороговым значением может включать деление первого числа областей на второе число областей (например, все области) до сравнения с пороговым значением, например, в рамках процесса нормировки.
Согласно приведенному выше описанию фракционная концентрация опухолевой ДНК в биологическом образце может применяться для расчета первого предельного значения. Фракционная концентрация может определяться просто как превышающая минимальное значение, при этом образец с фракционной концентрацией ниже минимального значения может быть помечен, например, как неподходящий для анализа. Минимальное значение может быть определено на основе ожидаемого различия уровней метилирования опухоли относительно референсного уровня метилирования. Например, если разница составляет 0,5 (например, используемая в качестве предельного значения), требуется определенная опухолевая концентрация, достаточно высокая для того, чтобы проявилась указанная разница.
Специфические методики согласно способу 1300 могут использоваться и в способе 2800. Согласно способу 1300 для опухоли могут быть определены вариации числа копий (например, первая хромосомная область опухоли может быть протестирована на изменение числа копий относительно второй хромосомной области опухоли). Соответственно, способ 1300 может предполагать, что опухоль существует. Согласно способу 2800 образец может быть протестирован на наличие какой-либо опухоли в принципе, независимо от каких-либо характеристик числа копий. Некоторые методики указанных двух способов могут быть аналогичными. Однако предельные значения и параметры метилирования (например, норми
- 41 042157 рованные уровни метилирования) согласно способу 2800 позволяют обнаружить статистическое отличие от референсного уровня метилирования для неопухолевой ДНК, а не отличие от референсного уровня метилирования для смеси раковой ДНК и неопухолевой ДНК, при этом некоторые области, возможно, содержат вариации числа копий. Соответственно, референсные значения для способа 2800 могут быть определены по образцам без раковой ДНК, например, полученным от организмов, не имеющих раковых заболеваний, или по образцам неопухолевой ткани того же пациента (например, плазмы, полученной ранее, или по полученным в то же самое время образцам, которые, как известно, не затронуты раковым заболеванием, что может быть определено по клеточной ДНК).
Е. Прогнозирование минимальной фракционной концентрации опухолевой ДНК, детектируемой с применением анализа метилирования ДНК плазмы.
Один из способов измерения чувствительности способа детекции ракового заболевания с использованием уровня метилирования ДНК плазмы связан с минимальной фракционной концентрацией происходящей из опухоли ДНК, необходимой для обнаружения изменения уровня метилирования ДНК плазмы при сравнении с уровнями контролей. Чувствительность тестирования также зависит от степени различия метилирования ДНК между опухолевой тканью и исходными уровнями метилирования ДНК плазмы здоровых контролей или ДНК клеток крови. Клетки крови являются основным источником ДНК в плазме здоровых индивидуумов. Чем больше указанное различие, тем проще отличить больных раковым заболеванием пациентов от не имеющих раковых заболеваний индивидуумов, что находит отражение в более низких порогах детекции происходящей из опухоли ДНК в плазме и более высокой клинической чувствительности при детекции раковых заболеваний у пациентов. Кроме того, вариации метилирования ДНК в плазме здоровых субъектов или субъектов разного возраста (G Hannum et al. 2013 Mol Cell; 49: 359-367) также влияют на чувствительность детекции изменений метилирования, связанных с наличием ракового заболевания. Меньшая вариативность метилирования ДНК в плазме здоровых субъектов упрощает детекцию изменений, обусловленных наличием небольшого количества происходящей из ракового новообразования ДНК.
Фиг. 29А представляет собой график 2900, отражающий распределение плотностей метилирования у референсных субъектов при предположении, что указанное распределение соответствует нормальному распределению. Указанный анализ основан на наличии для каждого образца плазмы только одного показателя плотности метилирования, например, плотности метилирования всех аутосом или конкретной хромосомы. Показано, как это влияет на специфичность анализа. Согласно одному варианту реализации используется точка отсечения на 3 SD ниже среднего значения плотности метилирования ДНК у референсных субъектов для определения наличия значительно большего гипометилирования тестируемого образца по сравнению с образцами от референсных субъектов. При использовании указанной точки отсечения ожидается, что приблизительно для 0,15% не имеющих раковых заболеваний субъектов будут получены ложноположительные результаты, подтверждающие наличие ракового заболевания, что соответствует специфичности 99,85%.
Фиг. 29В представляет собой график 2950, отражающий распределения плотностей метилирования у референсных субъектов и больных раковым заболеванием пациентов. Предельное значение на 3 SD ниже среднего значения плотностей метилирования у референсных субъектов. Если указанное среднее значение плотностей метилирования больных раковыми заболеваниями пациентов на 2 SD ниже предельного значения (т.е. на 5 SD ниже среднего значения для референсных субъектов), ожидается, что у 97,5% больных раковым заболеванием субъектов плотность метилирования будет ниже предельного значения. Другими словами, ожидаемая чувствительность составит 97,5%, если для каждого субъекта известен один показатель плотности метилирования, например, если анализируется общая плотность метилирования всего генома, всех аутосом или конкретной хромосомы. На разность средних значений плотностей метилирования для двух популяций влияют два фактора, а именно, степень различия уровня метилирования между раковыми и нераковыми тканями, и фракционная концентрация происходящей из опухоли ДНК в образце плазмы. Чем выше значения указанных двух параметров, тем больше разность значений плотностей метилирования для указанных двух популяций.
Кроме того, чем ниже SD для распределений плотностей метилирования для указанных двух популяций, тем меньше пересекаются распределения плотностей метилирования для указанных двух популяций.
В настоящем описании авторы используют гипотетический пример, чтобы проиллюстрировать указанный принцип. Предположим, что плотность метилирования опухолевой ткани составляет приблизительно 0,45, а плотность метилирования ДНК плазмы здоровых субъектов составляет приблизительно 0,7. Указанные предполагаемые значения аналогичны полученным для нашего пациента с ГЦК, при этом общая плотность метилирования аутосом составляет 42,9% и среднее значение плотности метилирования аутосом для образцов плазмы от здоровых контролей составляла 71,6%. При предположении, что CV измерения плотности метилирования ДНК плазмы для полного генома составляет 1%, предельное значение будет составлять 0,7х(100%-3х1%)=0,679. Для обеспечения чувствительности 97,5%, среднее значение плотности метилирования ДНК плазмы для больных раковыми заболеваниями пациентов должно составлять приблизительно 0,679-0,7х(2х1%)=0,665. Пусть f представляет фракционную концентрацию
- 42 042157 происходящей из опухоли ДНК в образце плазмы. Тогда f может быть рассчитан как (0,7-0,45)xf=0,7-0,665. Таким образом, f составляет приблизительно 14%. С помощью этого расчета определяют, что минимальная фракционная концентрация, которую можно детектировать в плазме, составляет 14% для обеспечения диагностической чувствительности 97,5%, если в качестве диагностического параметра используется общая плотность метилирования всего генома.
Затем авторы настоящего изобретения проводили указанный анализ на данных, полученных от пациента с ГЦК. Для иллюстративных целей в этом случае осуществлялось только одно измерение плотности метилирования на основе показателя, определенного для всех аутосом, для каждого образца. Среднее значение плотности метилирования составляло 71,6% в образцах плазмы, полученных от здоровых субъектов. SD плотностей метилирования для указанных четырех образцов составляло 0,631%. Таким образом, предельное значение для плотности метилирования в плазме должно составлять 71,6%3х0,631%=69,7%, чтобы обеспечить Z-показатель <-3 и специфичность 99,85%. Для обеспечения чувствительности 97,5%, среднее значение плотности метилирования в плазме больных раковыми заболеваниями пациентов должно быть на 2 SD ниже точки отсечения, т.е. составлять 68,4%. Поскольку плотность метилирования опухолевой ткани составляла 42,9%, на основании формулы Р=BKGx(1-f)+TUMxf) f должна составлять по меньшей мере 11,1%.
Согласно другому варианту реализации плотности метилирования разных геномных областей могут быть проанализированы по отдельности, например, как показано на фиг. 25А или В. Другими словами, осуществляли несколько измерений уровня метилирования для каждого образца. Как показано ниже, значительное гипометилирование может быть детектировано при значительно более низкой фракционной концентрации опухолевой ДНК в плазме и, соответственно, диагностическая эффективность анализа метилирования ДНК плазмы для детекции раковых заболеваний будет выше. Число геномных областей, демонстрирующих значительное отклонение плотностей метилирования от референсной популяции, может быть подсчитано. Затем указанное число геномных областей можно сравнить с предельным значением для определения наличия значительного общего гипометилирования ДНК плазмы в популяции для исследуемых геномных областей, например, участков размером 1 Мб по всему геному. Предельное значение может быть установлено путем анализа группы референсных субъектов, не имеющих раковых заболеваний, или выведено математически, например, в соответствии с функцией нормального распределения.
Фиг. 30 представляет собой график 3000, отражающий распределение плотностей метилирования ДНК плазмы здоровых субъектов и пациентов с раковыми заболеваниями. Плотность метилирования каждого участка размером 1 Мб сравнивают с соответствующими значениями для референсной группы. Определяли процент участков, демонстрирующих значительное гипометилирование (на 3 SD ниже среднего значения для референсной группы). Для определения наличия в образце плазмы происходящей из опухоли ДНК использовали точку отсечения, равную 10% значительно гипометилированных областей. Также могут использоваться другие предельные значения, такие как 5, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80 или 90%, в соответствии с требуемыми чувствительностью и специфичностью теста.
Например, для классификации образца как содержащего происходящую из опухоли ДНК авторы настоящего изобретения могут использовать 10% участков размером 1 Мб, демонстрирующих значительное гипометилирование (Z-показатель <-3), в качестве точки отсечения. Если более чем 10% указанных участков значительно более гипометилированы по сравнению с референсной группой, образец классифицируют как положительный по результатам теста на раковое заболевание. Для каждого участка размером 1 Мб используется точка отсечения на 3 SD ниже среднего значения плотности метилирования референсной группы для определения образца как значительно более гипометилированного. Для каждого из участков размером 1 Мб, если среднее значение плотности метилирования ДНК плазмы больных раковыми заболеваниями пациентов на 1,72 SD ниже среднего значения плотностей метилирования ДНК плазмы у референсных субъектов, имеется 10% вероятность, что показатель плотности метилирования любого конкретного участка у пациента с раковым заболеванием будет ниже, чем точка отсечения (т.е. Z-показатель <-3) и даст положительный результат. В таком случае, при рассмотрении всех участков размером 1 Мб для полного генома, ожидается, что приблизительно для 10% участков будут наблюдаться положительные результаты при значительно более низких плотностях метилирования (т.е. Zпоказатели <-3). При предположении, что общая плотность метилирования ДНК плазмы здоровых субъектов составляет приблизительно 0,7, и коэффициент вариации (CV) измерения плотности метилирования ДНК плазмы для каждого участка размером 1 Мб составляет 1%, среднее значение плотности метилирования ДНК плазмы больных раковыми заболеваниями пациентов должно составлять 0,7х(100%1,72x1%) = 0,68796. Пусть f представляет фракционную концентрацию происходящей из опухоли ДНК в плазме, обеспечивающую указанное среднее значение плотности метилирования ДНК плазмы. При предположении, что плотность метилирования опухолевой ткани составляет 0,45, значение f может быть рассчитано с применением следующего уравнения:
_ (Мр^ -Mlumor)xf = Мр^ -Мр^ где Pr‘f представляет среднее значение плотности метилирования ДНК плазмы у референсных
- 43 042157 индивидуумов;
Η»™,· представляет плотность метилирования опухолевой ткани у больного раковым заболеванием пациента;
и Мр^'г представляет среднее значение плотность метилирования ДНК плазмы у больных раковыми заболеваниями пациентов.
На основании указанного уравнения (0,7-0,45)xf=0,7-0,68796. Соответственно минимальная фракционная концентрация, которую можно детектировать с применением указанного способа, определяется как 4,8%. Чувствительность может быть дополнительно повышена за счет снижения процента отсечения значительно более гипометилированных участков, например, от 10 до 5%.
Как показано в приведенном выше примере, чувствительность указанного способа определяется степенью различия уровня метилирования раковых и нераковых тканей, например, клеток крови. Согласно одному варианту реализации выбирают только хромосомные области, демонстрирующие значительное отличие плотностей метилирования ДНК в плазме субъектов, не имеющих раковых заболеваний, и плотностей метилирования ДНК опухолевой ткани. Согласно одному варианту реализации выбирают только области, различие плотности метилирования которых составляет >0,5. Согласно другим вариантам реализации для выбора подходящих областей может использоваться различие, составляющее 0,4, 0,6, 0,7, 0,8 или 0,9. Согласно другим вариантам реализации физический размер геномных областей не фиксирован. Вместо этого геномные области определяют, например, на основе фиксированной глубины секвенирования или фиксированного числа CpG-сайтов. Уровни метилирования в нескольких указанных геномных областях оценивают для каждого образца.
Фиг. 31 представляет собой графическое представление 3100, отражающее распределение различий среднего значения плотностей метилирования ДНК плазмы здоровых субъектов и опухолевой ткани пациента с ГЦК. Положительное значение означает, что плотность метилирования выше для ДНК в плазме здоровых субъектов, а отрицательное значение означает, что плотность метилирования выше в опухолевой ткани.
Согласно одному варианту реализации могут выбираться участки с максимальным различием плотности метилирования раковых и нераковых тканей, например, такие, для которых различие составляет >0,5, независимо от того, гипометилирована или гиперметилирована опухоль по указанным участкам. Предел детекции фракционной концентрации происходящей из опухоли ДНК в плазме может быть снижен за счет фокусирования на указанных участках, благодаря более значительным различиям распределений уровней метилирования ДНК плазмы между больными раком и не больными раком субъектами, при одинаковой фракционной концентрации происходящей из опухоли ДНК в плазме. Например, при использовании только участков с различиями >0,5, и принятии точки отсечения, соответствующей 10% значительно более гипометилированных участков для определения наличия ракового заболевания у тестируемого индивидуума, минимальная фракционная концентрация (f) детектируемой происходящей из опухоли ДНК может быть рассчитана с применением следующего уравнения:
{Mp„f - М^) xf = Mp„f - Мр^
Mp
Где г представляет среднее значение плотности метилирования ДНК плазмы у референсных индивидуумов;
tumor представляет плотность метилирования опухолевой ткани у больного раковым заболеванием пациента;
~Мр представляет среднее значение плотности метилирования ДНК плазмы у больных раковыми заболеваниями пациентов.
При этом различие плотности метилирования в плазме референсных субъектов и в опухолевых тканях составляет по меньшей мере 0,5. Соответственно, мы имеем 0,5xf= 0,7-0,68796 и f=2,4%. Таким образом, фокусируясь на участках с более значительным различием плотности метилирования в раковых и нераковых тканях, нижний предел для фракционной концентрации происходящей из опухоли ДНК можно снизить с 4,8 до 2,4%. Информацию относительно того, для каких участков наблюдаются большие различия степени метилирования между раковыми и нераковыми тканями, например, клетками крови, можно получить, используя опухолевые ткани из того же органа или ткани того же гистологического типа, полученные от других индивидуумов.
Согласно другому варианту реализации на основе плотности метилирования ДНК плазмы для всех участков может быть получен параметр, учитывающий различие плотностей метилирования между раковыми и нераковыми тканями. Участкам с более значительным различием может придаваться больший вес. Согласно одному варианту реализации различие плотности метилирования между раковой и нераковой тканью для каждого участка может непосредственно использоваться в качестве веса конкретного участка при вычислении конечного параметра.
Согласно еще одному варианту реализации разные типы раковых заболеваний могут иметь разные
- 44 042157 паттерны метилирования в опухолевой ткани. Может быть получен специфичный для ракового заболевания весовой профиль на основании степени метилирования при конкретном типе ракового заболевания.
Согласно еще одному варианту реализации может быть определена зависимость плотности метилирования между участками у субъектов, у которых имеется или отсутствует раковое заболевание. На фиг. 8 можно наблюдать, что в незначительном числе участков опухолевые ткани более метилированы, чем ДНК плазмы у референсных субъектов. Соответственно, могут выбираться участки с крайними значениями различия, например, различиями >0,5 и <0. Отношение плотности метилирования указанных участков затем можно использовать для определения наличия ракового заболевания у тестируемого индивидуума. Согласно другим вариантам реализации разность и частное плотности метилирования разных участков могут применяться в качестве параметров для определения зависимости между участками.
Авторы также оценивали чувствительность способа детекции или оценки опухоли с применением плотностей метилирования нескольких геномных областей, что иллюстрируют данные, полученные от пациента с ГЦК. Сначала авторы настоящего изобретения объединяли риды для предоперационной плазмы с ридами, полученными для образцов плазмы здоровых контролей, для имитации образцов плазмы, содержащих фракционные концентрации опухолевой ДНК, варьирующие от 20 до 0,5%. Затем авторы подсчитывали процент участков размером 1 Мб (из 2734 участков всего генома) с плотностями метилирования, эквивалентными Z-показателям <-3. При фракционной концентрации опухолевой ДНК в плазме, составляющей 20%, для 80,0% участков наблюдалось значительное гипометилирование. Соответствующие данные для фракционной концентрации опухолевой ДНК в плазме, равной 10, 5, 2, 1 и 0,5%, составляли 67,6, 49,7, 18,9, 3,8 и 0,77% участков, демонстрирующих гипометилирование, соответственно. Поскольку теоретический предел числа участков, демонстрирующих Z-показатели <-3, в контрольных образцах составляет 0,15%, полученные авторами данные демонстрируют, что даже при фракционной концентрации опухолевой ДНК, составляющей всего 0,5%, имелось больше участков (0,77%) за теоретическим пределом отсечения.
Фиг. 32А представляет собой табл. 3200, демонстрирующую эффект уменьшения глубины секвенирования в случаях, когда образец плазмы содержал 5% или 2% опухолевой ДНК. Высокое содержание участков (>0,15%), демонстрирующих значительное гипометилирование, может быть детектировано даже при среднем значении глубины секвенирования всего 0,022х гаплоидного генома.
Фиг. 32В представляет собой графическое представление 3250, отражающее плотности метилирования повторяющихся элементов и областей без повторов в плазме четырех здоровых контрольных субъектов, лейкоцитарной пленке, нормальной ткани печени, опухолевой ткани, образцах предоперационной плазмы и послеоперационной плазмы пациента с ГЦК. Видно, что повторяющиеся элементы более метилированы (более высокая плотность метилирования), чем области без повторов как в раковых, так и в нераковых тканях. Однако различие метилирования между повторяющимися элементами и областями без повторов было более значительным в нераковых тканях и ДНК плазмы здоровых субъектов, по сравнению с опухолевыми тканями.
В результате, для ДНК плазмы больного раковым заболеванием пациента наблюдалось большее снижение плотности метилирования для повторяющихся элементов, чем для областей без повторов. Различие плотности метилирования ДНК в плазме между средним значением для четырех здоровых контролей и для пациента с ГЦК составляло 0,163 и 0,088 для повторяющихся элементов и областей без повторов, соответственно. Данные для образцов предоперационной и послеоперационной плазмы также показали, что динамический диапазон изменения плотности метилирования был больше для повторяющихся областей по сравнению с областями без повторов. Согласно одному варианту реализации плотность метилирования повторяющихся элементов ДНК в плазме может использоваться для определения наличия ракового заболевания у пациента или для мониторинга прогрессирования заболевания.
Как обсуждалось выше, вариации плотностей метилирования в плазме у референсных субъектов также влияют на точность дифференциации больных раковым заболеванием пациентов от индивидуумов, не имеющих раковых заболеваний. Чем плотнее распределение плотностей метилирования (т.е. меньшее стандартное отклонение), тем точнее будет дифференциация больных раком и не имеющих раковых заболеваний субъектов. Согласно другому варианту реализации коэффициент вариации (CV) плотностей метилирования участков размером 1 Мб может применяться в качестве критерия для выбора участков с низкой вариабельностью плотностей метилирования ДНК в плазме в референсной группе. Например, выбирают только участки с CV<1%. Другие значения, например, 0,5, 0,75, 1,25 и 1,5% также могут применяться в качестве критериев для выбора участков с низкой вариабельностью плотности метилирования. Согласно еще одному варианту реализации критерии выбора могут включать как CV для указанного участка, так и различие плотности метилирования между раковыми и нераковыми тканями.
Плотность метилирования также может использоваться для определения фракционной концентрации происходящей из опухоли ДНК в образце плазмы, если известна плотность метилирования опухолевой ткани. Указанная информация может быть получена путем анализа опухоли пациента или исследования опухолей нескольких пациентов, у которых имеется раковое заболевание того же типа. Как обсуждалось выше, плотность метилирования в плазме (Р) может быть выражена с применением следующего уравнения:
- 45 042157
где BKG представляет собой фоновую плотность метилирования в клетках крови и других органах, TUM представляет собой плотность метилирования в опухолевой ткани, и f представляет собой фракционную концентрацию происходящей из опухоли ДНК в образце плазмы. Указанное уравнение может быть переформулировано как:
BKG-P ? ~ BKG-TUM
Значения BKG могут быть определены путем анализа образца плазмы пациента в момент времени, когда рак отсутствует, или путем изучения референсной группы индивидуумов без раковых заболеваний. Таким образом, после измерения плотности метилирования в плазме, может быть определено значение f.
F. Комбинирование с другими способами.
Способы анализа метилирования, описанные в настоящем документе, могут применяться в комбинации с другими способами, которые основаны на генетических изменениях происходящей из опухоли ДНК в плазме. Примеры таких способов включают анализ на связанные с раковым заболеванием хромосомные аберрации (KCA Chan et al. 2013 Clin Chem; 59:211-224; RJ Leary et al. 2012 Sci Transl Med; 4:162ra154) и связанные с раковым заболеванием однонуклеотидные вариации в плазме (KCA Chan et al. 2013 Clin Chem; 59:211-224). Применение анализа метилирования имеет некоторые преимущества по сравнению с указанными генетическими методами.
Как показано на фиг. 21А, гипометилирование опухолевой ДНК представляет собой глобальное явление, охватывающее области, распределенные почти по всему геному. Таким образом, фрагменты ДНК всех хромосомных областей будут информативными в смысле внесения потенциального вклада в наличие происходящей из опухоли гипометилированной ДНК в плазме/сыворотке пациента. В то же время хромосомные аберрации (амплификация или деления хромосомной области) присутствуют только в некоторых хромосомных областях, и фрагменты ДНК из областей без хромосомных аберраций в опухолевой ткани не будут информативными для анализа (KCA Chan et al. 2013 Clin Chem; 59: 211-224). Аналогичным образом, всего несколько тысяч однонуклеотидных изменений наблюдается в каждом раковом геноме (KCA Chan et al. 2013 Clin Chem; 59: 211-224). Фрагменты ДНК, не перекрывающиеся с указанными однонуклеотидных изменений не будут информативными для определения наличия в плазме, происходящей из опухоли ДНК. Таким образом, предложенный способ анализа метилирования потенциально представляет собой более экономически эффективный подход, чем указанные генетические методы детекции связанных с раковым заболеванием изменений в кровотоке.
Согласно одному варианту реализации экономическая эффективность анализа метилирования в плазме ДНК может быть дополнительно увеличена путем обогащения фрагментами ДНК из наиболее информативных областей, например, областей с максимальными различиями метилирования между раковыми и не являющимися раковыми тканями. Примеры способов обогащения указанными областями включают применение зондов гибридизации (например, системы Nimblegen SeqCap и системы Agilent SureSelect Target Enrichment), ПЦР-амплификация и твердофазную гибридизацию.
G. Тканеспецифичный анализ/доноры.
Происходящие из опухоли клетки внедряются и метастазируют в смежные или отдаленные органы. Пораженные ткани или метастазы вносят вклад в ДНК плазмы в результате клеточной смерти. Путем анализа профиля метилирования ДНК в плазме страдающих раковым заболеванием пациентов и детекции присутствия тканеспецифичных сигнатур метилирования, можно детектировать типы тканей, которые вовлечены в патологический процесс. Указанный способ обеспечивает неинвазивное анатомическое сканирование тканей, вовлеченных в злокачественный процесс, что помогает идентифицировать органы, задействованные в первичных очагах и метастатических сайтах. Мониторинг относительных концентраций сигнатур метилирования вовлеченных органов в плазме также позволит оценить опухолевую нагрузку в указанных органах и определить, прогрессируют ли обусловленные раковым заболеванием повреждения в указанном органе, или наблюдается улучшение или излечение. Например, предположим, что ген X специфически метилирован в печени. В таком случае можно ожидать, что при метастазировании в печень ракового новообразования (например, рака толстой и прямой кишки) концентрация метилированных последовательностей гена X в плазме будет повышаться. Может существовать также другая последовательность или группы последовательностей с аналогичными гену X характеристиками метилирования. В таком случае результаты для таких последовательностей могут быть объединены. Аналогичные соображения применимы к другим тканям, например, головному мозгу, костям, легким и почкам, и т.д.
С другой стороны, известно, что в ДНК из разных органов наблюдаются тканеспецифичные сигнатуры метилирования (BW Futscher et al. 2002 Nat Genet; 31:175-179; SSC Chim et al. 2008 Clin Chem; 54: 500-511). Соответственно, определение профиля метилирования в плазме может применяться для установления вносимого тканями различных органов вклада в плазму. Установление такого вклада может применяться для оценки повреждения органа, так как считается, что ДНК плазмы высвобождается при гибели клеток. Например, патология печени, такая как гепатит (например, обусловленный вирусами, аутоиммунными процессами и т.п.), или гепатотоксичность (например, передозировка лекарствами (например, парацетамолом) или токсинами (например, алкоголем)), вызванная лекарственными средствами,
- 46 042157 связана с повреждением клеток печени и предположительно будет связана с повышением уровня происходящей из печени ДНК в плазме. Например, предположим, что ген X специфически метилирован в печени. В таком случае можно ожидать, что при патологии печени концентрация метилированных последовательностей гена X в плазме будет повышаться. И напротив, предположим, что ген Y специфично гипометилирован в печени. В таком случае можно ожидать, что при патологии печени концентрация метилированных последовательностей гена Y в плазме будет снижаться. Согласно еще одному варианту реализации ген X или Y может быть заменен на любые геномные последовательности, которые не обязательно представляют собой ген, демонстрирующие различия метилирования в разных тканях организма.
Методики, описанные в настоящем документе, также могут применяться для оценки происходящей от донора ДНК в плазме реципиентов трансплантации органов (YMD Lo et al. 1998 Lancet; 351:13291330). Различия полиморфизмов между донором и реципиентом использовались для дифференциации происходящей от донора ДНК и происходящей от реципиента ДНК в плазме (YW Zheng et al. 2012 Clin Chem; 58: 549-558). Авторы настоящего изобретения предположили, что тканеспецифичные сигнатуры метилирования трансплантированного органа также можно использовать в качестве способа детекции донорской ДНК в плазме реципиента.
Путем мониторинга концентрации ДНК донора можно неинвазивным образом оценить статус трансплантированного органа. Например, отторжение трансплантата связано с более высоким уровнем клеточной смерти и, соответственно, концентрация ДНК донора в плазме реципиента (или сыворотке), которую отражает сигнатура метилирования трансплантированного органа, будет повышаться относительно концентрации в то время, когда состояние пациента стабильно, или по сравнению с другими стабильными реципиентами трансплантатов или здоровыми контролями, которым не проводилась трансплантация. Аналогично тому, что было описано для раковых заболеваний, происходящая от донора ДНК может быть идентифицирована в плазме реципиентов трансплантации путем детекции всех или некоторых характерных особенностей, включая различия полиморфизмов, ДНК меньших размеров для трансплантированных солидных органов (YW Zheng et al. 2012 Clin Chem; 58: 549-558) и тканеспецифичного профиля метилирования.
Н. Нормировка метилирования по размерам.
Согласно приведенному выше описанию и описанию у Lun et al (FMF Lun et al. Clin. Chem. 2013; ЦИО:10.1373/clinchem.2013.212274) плотность метилирования (например, ДНК плазмы) коррелирует с размером фрагментов ДНК. Распределение плотностей метилирования для более коротких фрагментов ДНК плазмы было значительно ниже, чем для более длинных фрагментов. Авторы настоящего изобретения предполагают, что при некоторых не являющихся злокачественными состояниях (например, системной красной волчанке (СКВ)) с аномальными паттернами фрагментации ДНК плазмы может наблюдаться очевидное гипометилирование ДНК плазмы благодаря присутствию большего количества коротких фрагментов ДНК плазмы, которые менее метилированы. Другими словами, распределение размеров ДНК плазмы может представлять собой искажающий фактор для плотности метилирования ДНК плазмы.
На фиг. 34А представлено распределение размеров ДНК плазмы у пациента с СКВ СКВ04. Распределения размеров для девяти здоровых контрольных субъектов показаны пунктирными серыми линиями и распределения для СКВ04 показан в виде сплошной черной линии. Короткие фрагменты ДНК плазмы присутствовали в большем количестве у СКВ04 по сравнению с девятью здоровыми контрольными субъектами, поскольку более короткие фрагменты ДНК обычно менее метилированы, указанный паттерн распределения размеров может искажать результаты анализа метилирования для ДНК плазмы и приводить к более выраженному гипометилированию.
Согласно некоторым вариантам реализации измеренный уровень метилирования может быть нормирован для уменьшения искажающего эффекта распределения размеров на анализ метилирования ДНК плазмы. Например, может быть измерен размер молекул ДНК во множестве сайтов. Согласно разнообразным вариантам реализации указанное измерение может обеспечивать конкретный размер (например, длину) молекулы ДНК или просто определять, что размер попадает в конкретный диапазон, который может также соответствовать размеру. Нормированный уровень метилирования затем может сравниваться с предельным значением. Существует несколько способов выполнения нормировки для снижения искажающего эффекта распределения размеров на анализ метилирования ДНК плазмы.
Согласно одному варианту реализации может осуществляться фракционирование по размеру ДНК (например, ДНК плазмы). Фракционирование по размеру может обеспечить использование фрагментов ДНК аналогичного размера для определения уровня метилирования в соответствии с предельным значением. В рамках фракционирования по размеру могут выбираться фрагменты ДНК первого размера (например, первого диапазона длин), при этом первое предельное значение соответствует первому размеру. Нормировку можно осуществлять путем расчета уровня метилирования с применением исключительно выбранных фрагментов ДНК.
Фракционирование по размеру может достигаться различным образом, например, либо физическим разделением разных по размеру молекул ДНК (например, посредством электрофореза, или с помощью технологий на основе микрофлюидики, или технологий на основе центрифугирования), либо посредством анализа in silico. Для анализа in silico согласно одному варианту реализации может быть проведено
- 47 042157 массивно-параллельное секвенирование спаренных концов молекул ДНК плазмы. Затем может быть установлен размер секвенированных молекул путем сравнения локализации каждого из двух концов молекулы ДНК плазмы с референсным геномом человека. Затем может быть проведен последующий анализ путем отбора секвенированных молекул ДНК, соответствующих одному или нескольким критериям выбора размера (например, критериям, определяющим размер в указанном диапазоне). Соответственно, согласно одному варианту реализации плотность метилирования может быть проанализирована для фрагментов аналогичного размера (например, в указанном диапазоне). Предельное значение (например, на этапе 2840 способа 2800) может быть определено на основе фрагментов из того же диапазона размеров. Например, уровни метилирования могут быть определены по образцам, которые, как известно, относятся к раковому заболеванию или не относятся к раковому заболеванию, и по указанным уровням метилирования могут быть определены предельные значения.
Согласно другому варианту реализации может быть определена функциональная зависимость между плотностью метилирования и размером циркулирующей ДНК. Указанная функциональная зависимость может быть определена точкой данных или коэффициентами функции. Указанная функциональная зависимость может обеспечивать масштабирующие значения, соответствующие соответствующим размерам (например, метилирование при более коротких размерах может соответствующим образом повышаться). Согласно разнообразным вариантам реализации масштабирующее значение может составлять от 0 до 1, или превышать 1.
Можно осуществить нормировку по среднему размеру. Например, может быть вычислен средний размер, соответствующий молекулам ДНК, используемым для расчета первого уровня метилирования, и указанный первый уровень метилирования может быть умножен на соответствующее масштабирующее значение (т.е. соответствующее среднему размеру). В другом примере плотность метилирования каждой молекулы ДНК может быть нормирована в соответствии с размером молекулы ДНК и зависимостью между размером и метилированием ДНК.
Согласно другому варианту реализации нормировка может быть выполнена в расчете на молекулу. Например, может быть получен соответствующий размер молекулы ДНК в конкретном сайте (например, согласно приведенному выше описанию), и масштабирующее значение, соответствующие соответствующему размеру, может быть идентифицировано по функциональной зависимости. При ненормированном расчете каждую молекулу подсчитывают одинаковым образом при определении индекса метилирования в указанном сайте. При нормированном расчете вклад молекулы в индекс метилирования может быть взвешен по масштабирующему коэффициенту, который соответствует размеру молекулы.
На фиг. 34В и С представлен анализ метилирования для ДНК плазмы от пациента с СКВ СКВ04 (фиг. 34В) и пациента с ГЦК TBR36 (фиг. 34С). Внешние круги отображают результаты Zmeth для ДНК плазмы без фракционирования по размеру in silico. Внутренние круги отображают результаты Zmeth для ДНК плазмы размером 130 п.о. или более. У пациента с СКВ, СКВ04, наблюдалось гипометилирование 84% участков без фракционирования по размеру in silico. Процент участков, демонстрирующих гипометилирование, снижался до 15% при анализе только фрагментов размером 130 п.о. или более. У пациента с ГЦК TBR36, наблюдалось гипометилирование 98,5 и 98,6% участков ДНК плазмы с фракционированием и без фракционирования по размеру in silico, соответственно. Указанные результаты предполагают, что фракционирование по размеру in silico позволяет эффективно уменьшать количество ложноположительных результатов анализа гипометилирования, связанных с повышенной фрагментацией ДНК плазмы, например, у пациентов с СКВ или другими воспалительными состояниями.
Согласно одному варианту реализации могут сравниваться результаты анализов с фракционированием и без фракционирования по размеру для обнаружения наличия какого-либо искажающего эффекта размера на результаты анализа метилирования. Соответственно, вдобавок или вместо нормировки может применяться расчет уровня метилирования для конкретного размера, для определения того, имеется ли вероятность ложноположительного результата, если процент участков со значениями выше предельного значения отличается при фракционировании и без фракционирования по размеру, или отличается только конкретный уровень метилирования. Например, присутствие значимого различия между этими результатами для образцов с фракционированием и без фракционирования по размеру может использоваться для определения вероятности ложноположительного результата, обусловленного аномальным паттерном фрагментации. Порог для определения значимости различий может быть установлен с помощью анализа когорты страдающих раковым заболеванием пациентов и когорты не имеющих раковых заболеваний контрольных субъектов.
I. Анализ полногеномного гиперметилирования CpG-островков в плазме.
Помимо общего гипометилирования, при раковых заболеваниях часто наблюдается также гиперметилирование CpG-островков (SB Baylin et al. 2011 Nat Rev Cancer; 11: 726-734; PA Jones et al. 2007, Cell; 128: 683-692; M Esteller et al. 2007 Nat Rev Genet 2007; 8: 286-298; M Ehrlich et al. 2002 Oncogene 2002; 21: 5400-5413). В данном разделе авторы настоящего изобретения описывают применение полногеномного анализа гиперметилирования CpG-островков для детекции и мониторинга раковых заболеваний.
Фиг. 35 представляет собой блок-схему способа 3500 определения классификации уровня рака на основе гиперметилирования CpG-островков в соответствии с вариантами реализации настоящего изобре
- 48 042157 тения. Множество сайтов согласно способу 2800 может включать CpG-сайты, при этом указанные CpGсайты организованы во множество CpG-островков, где каждый CpG-островок включает один или большее количество CpG-сайтов. Уровни метилирования для каждого CpG-островка могут использоваться для определения классификации уровня рака.
На этапе 3510 идентифицируют подлежащие анализу CpG-островки. В указанном анализе в качестве примера авторы настоящего изобретения сначала определяли набор CpG-островков для анализа, характеризующихся относительно низкими плотностями метилирования в плазме здоровых референсных субъектов. Согласно одному аспекту вариация плотностей метилирования в референсной группе может быть относительно незначительной, что делает проще детекцию связанного с раковым заболеванием гиперметилирования. Согласно одному варианту реализации среднее значение плотности метилирования CpG-островков меньше первого процента в референсной группе, и коэффициент вариации для плотности метилирования в референсной группе меньше, чем второй процент.
Например, в целях иллюстрации используют следующие критерии для идентификации подходящих CpG-островков.
i) Среднее значение плотности метилирования для CpG-островка в референсной группе (например, здоровых субъектов) <5%.
ii) Коэффициент вариации для анализа плотности метилирования в плазме для референсной группы (например, здоровых субъектов) <30%.
Указанные параметры могут быть скорректированы для конкретного применения. В полученном авторами наборе данных 454 CpG-островков в геноме удовлетворяли указанным критериям.
На этапе 3520 рассчитывают плотность метилирования для каждого CpG-островка. Плотности метилирования могут быть определены согласно описанию в настоящем документе.
На этапе 3530 определяют, гиперметилирован ли каждый из CpG-островков. Например, для анализа на гиперметилирование CpG-островка в тестируемом случае, плотность метилирования каждого CpGостровка сравнивали с соответствующими данными референсной группы. Плотность метилирования (пример уровня метилирования) может сравниваться с одним или несколькими предельными значениями для определения того, гиперметилирован ли конкретный островок.
Согласно одному варианту реализации первое предельное значение может соответствовать среднему значению плотностей метилирования для референсной группы плюс указанный процент. Другое предельное значение может соответствовать среднему значению плотностей метилирования для референсной группы плюс указанное число стандартных отклонений. Согласно одному варианту реализации рассчитывали Z-показатель (Zmeth) и сравнивали с предельными значениями. Например, CpG-островок у тестируемого субъекта (например, субъекта, у которого проводится скрининг на рак) считался значительно гиперметилированным, если он удовлетворял следующим критериям:
i) его плотность метилирования была выше, чем среднее значение референсной группы, на 2%, и ii) Zmeth>3.
Указанные параметры могут также быть скорректированы для конкретного применения.
На этапе 3540 используют плотности метилирования (например, в виде Z-показателей) гиперметилированных CpG-островков для определения кумулятивного показателя. Например, после идентификации всех значительно гиперметилированных CpG-островков может быть рассчитан показатель, включающий сумму Z-показателей или функции Z-показателей всех гиперметилированных CpG-островков. Примером показателя является показатель суммарной вероятности (СР), согласно описанию в другом разделе. Показатель суммарной вероятности использует Zmeth для определения вероятности такого наблюдения за счет случайного эффекта в соответствии с распределением вероятности (например, tраспределения вероятности Стьюдента с 3 степенями свободы).
На этапе 3550 кумулятивный показатель сравнивают с кумулятивным порогом для установления классификации уровня рака. Например, если общее гиперметилирование в идентифицированных CpGостровках достаточно велико, организм может быть идентифицирован как пораженный раковым заболеванием. Согласно одному варианту реализации кумулятивный порог соответствует максимальному кумулятивному показателю референсной группы.
IX. Метилирование и CNA (абберации числа копий)
Как упоминалось выше, способы анализа метилирования, описанные в настоящем документе, могут применяться в комбинации с другими способами, которые основаны на генетических изменениях происходящей из опухоли ДНК в плазме. Примеры таких способов включают анализ на связанные с раковым заболеванием хромосомные аберрации (KCA Chan et al. 2013 Clin Chem; 59: 211-224; RJ Leary et al. 2012 Sci Transl Med; 4: 162ra154). Аспекты аберраций числа копий (CNA) описаны в заявке на патент США № 13/308473.
A. CNA.
Аберрации числа копий могут быть обнаружены путем подсчета фрагментов ДНК, которые выравниваются с конкретной частью генома, нормировки полученного подсчета и сравнения подсчитанного значения с предельным значением. Согласно различным вариантам реализации нормировка может осуществляться путем подсчета фрагментов ДНК, выравниваемых по другому гаплотипу той же части гено
- 49 042157 ма (метод анализа относительных доз гаплотипа (RHDO)) или путем подсчета фрагментов ДНК, выравниваемых по другой части генома.
Способ RHDO основан на применении гетерозиготных локусов. Варианты реализации, описанные в данном разделе, также могут применяться для гомозиготных локусов, путем сравнения двух областей, а не двух гаплотипов одной области, и, соответственно, не являются специфичными для гаплотипов. В родственном методе относительных доз хромосомных областей число фрагментов одной хромосомной области (например, определенное с помощью подсчета ридов последовательностей, выравниваемых по указанной области) сравнивают с ожидаемым значением (которое может относиться к референсной хромосомной области или той же области в другом, заведомо здоровом образце). Таким образом, фрагмент хромосомной области будет подсчитан независимо от того, из какого гаплотипа происходит секвенируемая метка. Соответственно, риды последовательностей, которые не содержат гетерозиготных локусов, тем не менее могут использоваться. Для проведения сравнения, согласно варианту реализации, подсчитанное число меток может быть нормировано перед указанным сравнением. Каждая область определяется по меньшей мере двумя локусами (которые отделены друг от друга), и фрагменты в указанных локусах могут применяться для получения общего значения для указанной области.
Нормированное значение для ридов секвенирования (меток) для конкретной области может быть рассчитано путем деления числа ридов секвенирования, выравнивающихся с указанной областью, на общее число ридов секвенирования, выравниваемых со всем геномом. Указанное подсчитанное число меток нормировки позволяет сравнить результаты от одного образца с результатами для другого образца. Например, нормированное значение может представлять собой долю (например, процент или фракцию) ридов секвенирования, предположительно происходящих из конкретной области, как указано вьппе. Согласно другим вариантам реализации возможно применение других способов нормировки. Например, возможна нормировка путем деления подсчитанного числа для одной области на подсчитанное число для референсной области (в описанном вьппе случае референсная область представлена просто полным геномом). Указанное подсчитанное число меток нормировки затем можно сравнить с пороговым значением, которое может быть определено по одному или нескольким референсным образцам без раковых заболеваний.
Подсчитанное число меток нормировки тестируемого случая затем сравнивают с подсчитанным числом меток нормировки одного или нескольких референсных субъектов, например, субъектов без раковых заболеваний. Согласно одному варианту реализации указанное сравнение осуществляют путем расчета Z-показателя указанного случая для конкретной хромосомной области. Z-показатель может быть рассчитан с применением следующего уравнения: Z-показатель = (подсчитанное число меток нормировки указанного случая - среднее значение) / SD, где среднее значение представляет собой среднее значение подсчитанного числа меток нормировки, выравнивающихся по конкретной хромосомной области для референсных образцов; и SD представляет собой стандартное отклонение подсчитанного числа меток нормировки, выравнивающихся по конкретной области для референсных образцов. Соответственно, Z-показатель представляет собой число стандартных отклонений, на которое подсчитанное число меток нормировки хромосомной области для тестируемого случая отличается от среднего значения подсчитанного числа меток нормировки для той же хромосомной области у одного или нескольких референсных субъектов.
В ситуации, когда у тестируемого организма имеется раковое заболевание, хромосомные области, амплифицированные в опухолевых тканях, будут избыточно представлены в ДНК плазмы. Это будет приводить к положительному значению Z-показателя. С другой стороны, хромосомные области, которые удалены в опухолевых тканях, будут недопредставлены в ДНК плазмы. Это будет приводить к отрицательному значению Z-показателя. Величина Z-показателя определяется несколькими факторами.
Один фактор представлен фракционной концентрацией происходящей из опухоли ДНК в биологическом образце (например, в плазме). Чем выше фракционная концентрация происходящей из опухоли ДНК в образце (например, в плазме), тем больше будет разность между подсчитанным числом меток нормировки для тестируемого случая и референсных случаев. Соответственно, будет наблюдаться большее значение Z-показателя.
Другой фактор представлен вариацией подсчитанного числа меток нормировки в одном или нескольких референсных случаях. При одинаковом содержании хромосомной области в биологическом образце (например, в плазме) для тестируемого случая, меньшая вариация (т.е. меньшее стандартное отклонение) подсчитанного числа меток нормировки в референсной группе будет приводить к более высокому Z-показателю. Аналогичным образом, при одинаковой степени пониженной представленности хромосомной области в биологическом образце (например, в плазме) для тестируемого случая, меньшее стандартное отклонение подсчитанного числа меток нормировки в референсной группе будет приводить к более отрицательному значению Z-показателя.
Другим фактором является величина хромосомных аберраций в опухолевых тканях. Величина хромосомных аберраций относится к изменениям числа копий для конкретной хромосомной области (добавление или утрата). Чем значительнее изменения числа копий в опухолевых тканях, тем выше степень избыточной представленности или пониженной представленности конкретной хромосомной области в
- 50 042157
ДНК плазмы.
Например, утрата обеих копий хромосомы будет приводить к большей пониженной представленности хромосомной области в ДНК плазмы, чем утрата одной из двух копий хромосомы, и, соответственно, приводить к более отрицательному значению Z-показателя. Как правило, при раковых заболеваниях имеется несколько хромосомных аберраций. Указанные хромосомные аберрации в каждом случае ракового заболевания могут дополнительно варьировать по характеру (т.е. представлять собой амплификацию или делению), степени (одно или несколько добавлений или утрат копий) и объему (размеру аберрации относительно длины хромосомы).
На точность измерения подсчитанного числа меток нормировки влияет число анализируемых молекул. Авторы настоящего изобретения предполагают, что необходим анализ 15 000, 60 000 и 240 000 молекул для детекции хромосомных аберраций с одним изменением числа копий (добавлением или утратой), если фракционная концентрация составляет приблизительно 12,5%, 6,3% и 3,2%, соответственно. Более подробная информация относительно подсчета меток для детекции раковых заболеваний для разных хромосомных областей приведена в патентной публикации США №2009/0029377, авторы Lo et al., озаглавленной Diagnosing Fetal Chromosomal Aneuploidy Using Massively Parallel Genomic Sequencing (Диагностика хромосомной анеуплоидии плода с применением массивно-параллельного секвенирования генома), все содержание которой включено в настоящий документ посредством ссылки во всех отношениях.
Согласно вариантам реализации может также использоваться анализ размеров вместо метода подсчета меток. Может также применяться анализ размеров вместо подсчета меток нормировки. При анализе размеров могут использоваться различные параметры, упоминаемые в настоящем документе и в заявке на патент США № 12/940992. Например, могут использоваться значения Q или F, см. выше. Такие размерные значения не нуждаются в нормировки по подсчетам для других областей, поскольку указанные значения не изменяются в зависимости от числа ридов. Методики, использующие гаплотипспецифические методы, такие как метод RHDO, описанный выше, а также описанный более подробно в заявке на патент США №13/308473, могут применяться также для неспецифических способов. Например, могут быть использованы методики, задействующие глубину секвенирования и уточнение области. Согласно некоторым вариантам реализации может учитываться стандартное смещение GC для конкретной области, если сравниваются две области. Поскольку в методе RHDO используется одна и та же область, такая коррекция не нужна.
Хотя некоторые раковые заболевания могут в общем случае сопровождаться аберрациями в конкретных хромосомных областях, такие раковые заболевания не всегда сопровождаются аберрациями исключительно в таких областях. Например, могут наблюдаться аберрации в дополнительных хромосомных областях, и локализация таких дополнительных областей может быть неизвестна. Кроме того, при скрининге пациентов для выявления ранних стадий рака может требоваться идентификация широкого спектра видов рака, при которых могут наблюдаться аберрации по всему геному. В указанных ситуациях, согласно вариантам реализации, можно анализировать множество областей систематическим образом для определения того, в каких областях наблюдаются аберрации. Число аберраций и их локализация (например, информация о том, последовательны ли они) может использоваться, например, для подтверждения аберраций, определения стадии ракового заболевания, диагностирования ракового заболевания (например, если указанное число выше порогового значения), и получения прогноза на основе указанного числа и локализации различных областей, в которых наблюдается аберрация.
Соответственно, варианты реализации позволяют идентифицировать наличие в организме ракового заболевания на основании числа областей, в которых наблюдается аберрация. Соответственно, можно протестировать множество областей (например, 3000) для идентификации числа областей, в которых наблюдается аберрация. Указанные области могут захватывать весь геном или только части генома, например, область без повторов.
Фиг. 36 представляет собой блок-схему способа 3600 анализа биологического образца организма с применением множества хромосомных областей в соответствии с вариантами реализации настоящего изобретения. Указанный биологический образец включает молекулы нуклеиновых кислот (называемые также фрагментами).
На этапе 3610 идентифицируют множество областей (например, неперекрывающихся областей) генома указанного организма. Каждая хромосомная область включает множество локусов. Размер области может составлять 1 Мб, или быть представлен каким-либо другим равным размером. В ситуации, когда размер области составляет 1 Мб, весь геном может включать приблизительно 3000 областей, каждая из которых имеет заранее установленный размер и локализацию. Такие заранее установленные области могут варьировать, чтобы соответствовать длине конкретной хромосомы или указанному числу областей, которые предполагается использовать, и любым другим критериям, упоминаемым в настоящем документе. Если области имеют разные длины, такие длины могут использоваться для нормировки результатов, например, согласно описанию в настоящем документе. Указанные области могут быть специально отобраны на основании определенных критериев для конкретного организма и/или на основании информации о раковом заболевании, на которое проводится тестирование. Области также могут быть выбраны
- 51 042157 произвольно.
На этапе 3620 идентифицируют локализацию молекулы нуклеиновой кислоты в референсном геноме указанного организма для каждой из множества молекул нуклеиновых кислот. Локализация может быть определена любым из способов, упоминаемых в настоящем документе, например, посредством секвенирования фрагментов для получения секвенируемых меток и выравнивания указанных секвенируемых меток по референсному геному. Для гаплотип-специфических способов может также быть определен конкретный гаплотип молекулы.
Этапы 3630-3650 выполняют для каждой из хромосомных областей. На этапе 3630 соответствующую группу молекул нуклеиновых кислот идентифицируют как происходящую из хромосомной области на основе идентифицированных локализаций. Указанная соответствующая группа может включать по меньшей мере одну молекулу нуклеиновой кислоты, локализованную в каждом из множества локусов хромосомной области. Согласно одному варианту реализации указанная группа может быть представлена фрагментами, которые выравниваются по конкретному гаплотипу хромосомной области, например, как в описанном выше методе RHDO. Согласно другому варианту реализации указанная группа может быть представлена любым фрагментом, который выравнивается на хромосомную область.
На этапе 3640 компьютерная система рассчитывает соответствующее значение для соответствующей группы молекул нуклеиновых кислот. Указанное соответствующее значение определяет свойства молекул нуклеиновых кислот соответствующей группы. Указанное соответствующее значение может представлять собой любое из значений, упоминаемых в настоящем документе. Например, указанное значение может представлять собой число фрагментов в группе или статистический показатель распределения размеров фрагментов в группе. Соответствующее значение может также представлять собой нормированное значение, например, подсчитанное число меток указанной области, разделенное на общее число подсчитанных меток для указанного образца или подсчитанное число меток для референсной области. Соответствующее значение может также определяться относительно другого значения как разность или соотношение (например, в методе RHDO), определяя таким образом отличительный признак для области.
На этапе 3650 соответствующее значение сравнивают с референсным значением для определения классификации первой хромосомной области как демонстрирующей делецию или амплификацию. Указанное референсное значение может представлять собой 109 любое пороговое или референсное значение из описанных в настоящем документе. Например, референсное значение может представлять собой пороговое значение, определенное для нормальных образцов. В методе RHDO соответствующее значение может представлять собой разность или соотношение подсчитанного числа меток для двух гаплотипов, и референсное значение может представлять собой порог для определения наличия статистически значимого отклонения. В другом примере референсное значение может представлять собой подсчитанное число меток или размерную величину для другого гаплотипа или области, и сравнение может включать получение разности или отношения (или их функции) с последующим определением того, превышает ли указанная(ое) разность или отношение пороговое значение.
Референсное значение может варьировать в зависимости от результатов для других областей. Например, если соседние области также демонстрируют отклонение (хотя и незначительное относительно одного порога, например, Z-показателя, равного 3), может применяться более низкий порог. Например, если превышение первого порога наблюдается для трех последовательных областей, раковое заболевание может быть более вероятным. Соответственно, указанный первый порог может быть ниже другого порога, необходимого для идентификации рака по непоследовательным областям. Наличие трех областей (или более чем трех), демонстрирующих даже незначительное отклонение, может иметь достаточно низкую вероятность случайного эффекта для сохранения чувствительности и специфичности.
На этапе 3660 определяют количество геномных областей, классифицированных как демонстрирующие делецию или амплификацию. Подсчитываемые хромосомные области могут иметь ограничения. Например, могут подсчитываться только области, являющиеся последовательными относительно по меньшей мере одной другой области (или может требоваться определенный размер последовательных областей, например, 4 или более области). В вариантах реализации с неравными областями указанное число также может определяться с учетом соответствующих длин (например, указанное число может представлять собой общую длину аберрантных областей).
На этапе 3670 указанное количество сравнивают с пороговым значением количества для определения классификации образца. Например, указанная классификация может определять наличие в организме ракового заболевания, стадию ракового заболевания и прогноз для ракового заболевания. Согласно одному варианту реализации подсчитывают все аберрантные области и используют одно пороговое значение независимо от локализации указанных областей. Согласно другому варианту реализации пороговое значение может варьировать на основании локализации и размера подсчитываемых областей. Например, количество областей на конкретной хромосоме или плече хромосомы может сравниваться с порогом для указанной конкретной хромосомы (или плеча). Может использоваться несколько порогов. Например, количество аберрантных областей на конкретной хромосоме (или плече) должно быть больше первого порогового значения, а общее количество аберрантных областей в геноме должно быть больше второго порогового значения. Пороговое значение может представлять собой процент областей, для которых бы
- 52 042157 ло определено присутствие делеции или амплификации.
Указанное пороговое значение для количества областей может также зависеть от того, насколько выражен дисбаланс для подсчитываемых областей. Например, количество областей, используемое в качестве порогового для определения классификации рака, может зависеть от специфичности и чувствительности (аберрантный порог) для детекции аберрации в каждой области. Например, при низком аберрантном пороге (например, Z-показатель равен 2) может быть выбрано высокое пороговое количество (например, 150). Однако при высоком аберрантном пороге (например, Z-показатель равен 3) пороговое количество может быть более низким (например, 50). Количество областей, демонстрирующих аберрацию, может также представлять собой взвешенную величину, например, одной области, которая демонстрирует высокий дисбаланс, может быть придан больший вес, чем области, которая демонстрирует только незначительный дисбаланс (т.е. классификаций больше, чем просто положительные и отрицательные результаты на наличие аберрации). Например, может использоваться сумма Z-показателей, с применением, таким образом, взвешенных значений.
Соответственно, количество (которое может включать число и/или размер) хромосомных областей, демонстрирующих значительную избыточную или недостаточную представленность подсчитанных меток нормировки (или другое соответствующее значение для свойства группы) может использоваться для отражения тяжести заболевания. Количество хромосомных областей с аберрантным подсчитанным числом меток нормировки может определяться по двум факторам, а именно, числу (или размеру) хромосомных аберраций в опухолевых тканях и фракционной концентрации происходящей из опухоли ДНК в биологическом образце (например, в плазме). При более распространенном раке наблюдается тенденция к большему количеству (и больших) хромосомных аберраций. Соответственно, в образце (например, плазме) потенциально можно детектировать больше связанных с раковым заболеванием хромосомных аберраций. У пациентов с более распространенным раком более высокая опухолевая нагрузка будет приводить к более высокой фракционной концентрации происходящей из опухоли ДНК в плазме. В результате ассоциированные с опухолью хромосомные аберрации в образце плазмы проще детектировать.
Один из возможных способов повышения чувствительности без ущерба для специфичности заключается в учете результата для смежного хромосомного сегмента. Согласно одному варианту реализации точки отсечения для Z-показателя остаются на уровне >2 и <-2. Однако хромосомную область классифицируют как потенциально аберрантную только в том случае, если в двух последовательных сегментах наблюдается один и тот же тип аберраций, например, оба сегмента имеют Z-показатель >2. Согласно другим вариантам реализации Z-показатели соседних сегментов могут быть суммированы при использовании более высокого предельного значения. Например, могут быть суммированы Z-показатели трех последовательных сегментов, и может применяться предельное значение, равное 5. Указанный принцип может быть распространен на более чем три последовательных сегмента.
Комбинирование количественных и аберрантных порогов может также зависеть от цели анализа, и любых предварительных данных относительно организма (или их отсутствия). Например, при скрининге нормальной здоровой популяции на наличие раковых заболеваний, как правило, используется высокая специфичность, потенциально как в отношении количества областей (т.е. высокий порог для числа областей), так и в отношении аберрантного порога при идентификации области как содержащей аберрацию. Однако для пациента с более высоким риском (например, для пациента с жалобами на наличие опухоли или пациента с семейным анамнезом, курильщика, носителя хронической инфекции папилломавируса человека (HPV), носителя вируса гепатита или другого вируса) пороги могут быть более низкими, чтобы обеспечить большую чувствительность (меньшее количество ложноотрицательных результатов).
Согласно одному варианту реализации при использовании для детекции хромосомной аберрации разрешения 1 Мб и нижнего предела детекции при 6,3% происходящей из опухоли ДНК, число молекул в каждом сегменте размером 1 Мб должно составлять 60 000. При трансляции это даст приблизительно 180 млн. (60 000 ридов/Мб х 3000 Мб) выравниваемых ридов для полного генома.
Меньший размер сегмента обеспечивает более высокое разрешение для детекции меньших хромосомных аберраций. Однако это увеличивает необходимое для анализа общее число молекул. Больший размер сегмента снижает требуемое для анализа число молекул в ущерб разрешению. Соответственно, могут быть обнаружены только аберрации большего размера. Согласно одному варианту реализации могут использоваться области большего размера, демонстрирующие аберрацию сегменты могут быть разделены и полученные подобласти проанализированы для получения лучшего разрешения (например, согласно описанию выше). При наличии расчетных данных для размера детектируемой делеции или амплификации (или минимальной концентрации для детекции) может быть определено число молекул для анализа.
В. CNA на основе секвенирования обработанной бисульфитом ДНК плазмы.
Полногеномное гипометилирование и CNA часто наблюдаются в опухолевых тканях. В данном описании авторы настоящего изобретения демонстрируют, что информация о CNA и связанных с раковым заболеванием изменениях метилирования может быть одновременно получена при бисульфитном секвенировании ДНК плазмы. Поскольку указанные два типа анализа могут быть проведены на одном наборе данных, практически отсутствуют дополнительные расходы на анализ CNA. Согласно другим
- 53 042157 вариантам реализации могут проводиться отдельные процедуры для получения информации о метилировании и генетической информации. Согласно другим вариантам реализации может проводиться аналогичный анализ связанного с раковым заболеванием гиперметилирования в сочетании с анализом CNA.
На фиг. 37А представлен анализ CNA для опухолевых тканей, на не обработанной бисульфитом (БС) ДНК плазмы и обработанной бисульфитом ДНК плазмы (от центра к краям), для пациента TBR36. На фиг. 37А представлен анализ CNA для опухолевых тканей, на не обработанной бисульфитом (БС) ДНК плазмы и обработанной бисульфитом ДНК плазмы (от центра к краям), для пациента TBR36. Внешний круг представляет собой идеограмму хромосомы. Каждая точка представляет результат для области объемом 1 Мб. Зелеными, красными и серыми точками обозначены области с добавлением копий, утратой копий и без изменения числа копий, соответственно. Приведены Z-показатели для анализа плазмы. Разность между двумя концентрическими линиями составляет 5. Показано число копий для анализа опухолевой ткани. Разность между двумя концентрическими линиями составляет 1 копию. На фиг. 38А представлен анализ CNA для опухолевых тканей, на не обработанной бисульфитом (БС) ДНК плазмы и обработанной бисульфитом ДНК плазмы (от центра к краям), для пациента TBR34. Паттерны CNA, детектированные в обработанных бисульфитом и не обработанных бисульфитом образцах плазмы, согласовались.
Паттерны CNA, детектированные в опухолевых тканях, не обработанной бисульфитом плазме и обработанной бисульфитом плазме, согласовались. Для дальнейшей оценки соответствия между результатами для обработанной бисульфитом и не обработанной бисульфитом плазмы строили график рассеяния. Фиг. 37В представляет собой график рассеяния, отражающий зависимость между Z-показателями для детекции CNA на участках размером 1 Мб с применением обработанной бисульфитом и не обработанной бисульфитом плазмы, для пациента TBR36. Наблюдалась положительная корреляция между Zпоказателями указанных двух анализов (r=0,89, р<0,001, корреляция Пирсона). Фиг. 38В представляет собой график рассеяния, отражающий зависимость между Z-показателями для детекции CNA на участках размером 1 Мб с применением обработанной бисульфитом и не обработанной бисульфитом плазмы, для пациента TBR34. Наблюдалась положительная корреляция между Z-показателями указанных двух анализов (r=0,81, р<0,001, корреляция Пирсона).
С. Синергетический анализ связанных с раковым заболеванием CNA и изменений метилирования.
Согласно приведенному выше описанию анализ на CNA может включать подсчет числа ридов секвенирования в каждой области размером 1 Мб, а анализ плотности метилирования может включать выявление доли метилированных остатков цитозина в динуклеотидах CpG. Комбинирование указанных двух анализов может обеспечить синергетическую информацию для детекции раковых заболеваний. Например, классификация метилирования и классификация CNA могут использоваться для определения третьей классификации уровня рака.
Согласно одному варианту реализации наличие либо связанных с раковым заболеванием CNA, либо изменений метилирования может использоваться для установления потенциального наличия ракового заболевания. Согласно такому варианту реализации чувствительность детекции ракового заболевания может быть повышена при наличии либо CNA, либо изменений метилирования в плазме тестируемого субъекта. Согласно другому варианту реализации наличие обоих изменений может применяться для установления наличия ракового заболевания. Согласно такому варианту реализации специфичность теста может быть повышена, так как изменения любого из указанных двух типов потенциально могут детектироваться у некоторых не имеющих раковых заболеваний субъектов. Соответственно, третья классификация может быть положительной по раковому заболеванию только в том случае, если и первая классификация, и вторая классификация указывают на раковое заболевание.
В исследование включали 26 пациентов с ГЦК и 22 здоровых субъектов. У каждого субъекта брали образец крови и секвенировали ДНК плазмы после обработки бисульфитом. У пациентов с ГЦК образцы крови брали в момент установления диагноза. Наличие значимого количества CNA определяли, например, как присутствие >5% участков, демонстрирующих Z-показатель <-3 или >3. Наличие значимого связанного с раковым заболеванием гипометилирования определяли как присутствие >3% участков, демонстрирующих Z-показатель <-3. Количество областей (участков) может быть представлено, например, в виде подсчитанного без обработки числа участков, процента и длины указанных участков.
В табл. 3 показана детекция значимых количеств CNA и изменений метилирования в плазме 26 пациентов с ГЦК при применении массивно-параллельного секвенирования обработанной бисульфитом ДНК плазмы.
Уровни детекции связанного с раковым заболеванием изменения метилирования и CNA составляли и 50%, соответственно. Уровень детекции (т.е. диагностическая чувствительность) повышался до 73%
- 54 042157 при использовании присутствия любого показателя для установления потенциального наличия ракового заболевания.
Показаны результаты для двух пациентов, отражающие либо наличие CNA (фиг. 39А), либо изменения метилирования (фиг. 39В). Фиг. 39А представляет собой Circos-график, представляющий CNA (внутренний круг) и анализ метилирования (внешний круг) для обработанной бисульфитом плазмы пациента с ГЦК TBR240. В анализе CNA зелеными, красными и серыми точками обозначены области с добавлениями хромосомного материала, утратами хромосомного материала, а также области без изменения числа копий, соответственно. В анализе метилирования зелеными, красными и серыми точками обозначены области с гиперметилированием, гипометилированием и нормальным метилированием, соответственно. У указанного пациента в плазме детектировали связанные с раковым заболеванием CNA, тогда как анализ метилирования не обнаружил значительного связанного с раковым заболеванием гипометилирования. Фиг. 39В представляет собой Circos-график, представляющий CNA (внутренний круг) и анализ метилирования (внешний круг) для обработанной бисульфитом плазмы пациента с ГЦК TBR164. У указанного пациента детектировали связанное с раковым заболеванием гипометилирование в плазме. Однако значительных количеств CNA не наблюдалось. Эти результаты для двух пациентов, отражающие наличие как CNA, так и изменений метилирования, представлены на фиг. 48А (TBR36) и 49А (TBR34).
В табл. 4 показана детекция значительных количеств CNA и изменений метилирования в плазме 22 контрольных субъектов с применением массивно-параллельного секвенирования обработанной бисульфитом ДНК плазмы. Для оценки каждого из контрольных субъектов использовали метод бутстреппинга (т.е. с исключением по одному образцу). Соответственно, при оценке конкретного субъекта остальные субъекты (21 субъект) использовались для расчета среднего и SD для контрольной группы.
Таблица 4
CNA _______________________Наличие Отсутствие
Изменение метилирования Наличие 1 2
Отсутствие 1 18
Специфичность детекции значительных изменений метилирования и CNA составляла 86 и 91%, соответственно. Специфичность повышалась до 95%, если требовалось присутствие обоих показателей для установления потенциального наличия ракового заболевания.
Согласно одному варианту реализации образцы, положительные по CNA и/или гипометилированию считают положительными по раковому заболеванию, и образцы, где не детектируется ни то, ни другое, считают отрицательными. Применение логической схемы или обеспечивает более высокую чувствительность. Согласно другому варианту реализации только положительные и по CNA, и по гипометилированию образцы считают положительными по раковому заболеванию, таким образом обеспечивается более высокая специфичность. Согласно еще одному варианту реализации может использоваться три уровня классификации. Субъектов классифицируют по наличию: i) обоих нормальных показателей; ii) одного аномального показателя; ш. обоих аномальных показателей.
Для указанных трех классификаций могут применяться разные стратегии последующего исследования. Например, для субъектов (iii) может использоваться наиболее интенсивный протокол последующего исследования, например, включающий визуализацию всего организма; для субъектов (ii) может использоваться менее интенсивный протокол последующего исследования, например, повторные секвенирования ДНК плазмы через относительно короткий промежуток времени, составляющий несколько недель; и для субъектов (i) может использоваться наименее интенсивный протокол последующего исследования, например, повторное тестирование через несколько лет. Согласно другим вариантам реализации измерения метилирование и CNA может применяться в сочетании с другими клиническими параметрами (например, результатами визуализации или биохимическими показателями сыворотки) для дополнительного уточнения классификации.
D. Прогностическая ценность анализа ДНК плазмы после направленного на излечение лечения.
Наличие связанных с раковым заболеванием CNA и/или изменений метилирования в плазме указывает на наличие происходящей из опухоли ДНК в кровотоке больного раковым заболеванием пациента. После лечения (например, хирургического) ожидается уменьшение или исчезновение указанных связанных с раковым заболеванием изменений. С другой стороны, персистирование указанных изменений в плазме после лечения может указывать на неполное удаление всех опухолевых клеток из организма и может подходить для прогнозирования рецидива заболевания.
Образцы крови брали у двух пациентов с ГЦК, TBR34 и TBR36, через неделю после направленного на излечение хирургического удаления опухолей. Анализ CNA и метилирования проводили на обработанных бисульфитом образцах послеоперационной плазмы.
На фиг. 40А показан анализ CNA на обработанной бисульфитом ДНК плазмы, собранной до (внутренний круг) и после (внешний круг) хирургического удаления опухоли у пациента с ГЦК, TBR36. Каждая точка представляет результат для области размером 1 Мб. Зелеными, красными и серыми точками обозначены области с увеличением числа копий, утратой копий и без изменений числа копий, соответственно. Большинство CNA, наблюдавшихся до лечения, исчезали после удаления опухоли. Доля участков,
- 55 042157 демонстрирующих Z-показатель <-3 или >3, снижалась от 25% до 6,6%.
На фиг. 40В показан анализ метилирования обработанной бисульфитом ДНК плазмы собранной до (внутренний круг) и после (внешний круг) хирургическое удаление опухоли у пациента с ГЦК TBR36. Зелеными, красными и серыми точками обозначены области с гиперметилированием, гипометилированием и нормальным метилированием, соответственно. Наблюдалось заметное снижение доли участков, демонстрирующих значительное гипометилирование, с 90 до 7,9%, и наблюдалось также заметное снижение степени гипометилирования. У указанного пациента наступила полная клиническая ремиссия через 22 месяца после удаления опухоли.
На фиг. 41А показан анализ CNA обработанной бисульфитом ДНК плазмы собранной до (внутренний круг) и после (внешний круг) хирургического удаления опухоли у пациента с ГЦК, TBR34. Хотя наблюдается снижение как числа участков, демонстрирующих CNA, так и величины CNA в пораженных участках после хирургического удаления опухоли, можно наблюдать остаточные CNA в образце послеоперационной плазмы. Красным кругом обозначена область, где наиболее очевидно выражены остаточные CNA. Доля участков, демонстрирующих Z-показатель <-3 или >3, снижалась от 57 до 12%.
На фиг. 41В. показан анализ метилирования обработанной бисульфитом ДНК плазмы собранной до (внутренний круг) и после (внешний круг) хирургического удаления опухоли у пациента с ГЦК TBR34. Величина гипометилирования уменьшалась после удаления опухоли, при уменьшении среднего значения Z-показателя для гипометилированных участков от -7,9 до -4,0. Однако для доли участков с Zпоказателем <-3 наблюдалось противоположное изменение, с увеличением от 41% до 85%. Указанное наблюдение потенциально указывает на присутствие остаточных раковых клеток после лечения. Клинически было обнаружено несколько очагов опухолевых узлов в нерезецированной печени через 3 месяца после удаления опухоли. С 4-го месяца после хирургического вмешательства наблюдались метастазы в легкие. Указанный пациент скончался в результате локального рецидива и метастазирования через 8 месяцев после операции.
Наблюдения в случаях указанных двух пациентов (TBR34 и TBR36) предполагают, что наличие остаточных связанных с раковым заболеванием изменений CNA и гипометилирования может использоваться для мониторинга и прогнозирования у больных раковыми заболеваниями пациентов после направленного на излечение лечения. Данные также показали, что степень изменения количества детектируемых CNA в плазме может использоваться синергетически с оценкой степени изменения уровня гипометилирования ДНК плазмы для прогнозирования и мониторинга эффективности лечения.
Соответственно, согласно некоторым вариантам реализации один биологический образец получают до лечения и второй биологический образец получают после лечения (например, хирургического). Для первого образца получают первые значения, например, Z-показатели для областей (например, уровни метилирования области и нормированные значения CNA), и число областей, демонстрирующих гипометилирование и CNA (например, амплификацию или делецию). Для второго образца могут быть получены вторые значения. Согласно другому варианту реализации после лечения может быть получен третий или даже последующие дополнительные образцы. Число областей, демонстрирующих гипометилирование и CNA (например, амплификацию или делецию) может быть получено для третьего или даже последующих дополнительных образцов.
Согласно приведенному выше описанию для фиг. 40А и 41А первое число областей, демонстрирующих гипометилирование, для первого образца может сравниваться со вторым количеством областей, демонстрирующих гипометилирование, для второго образца. Согласно приведенному выше описанию для фиг. 40В и 41В первое количество демонстрирующих гипометилирование областей для первого образца, может сравниваться со вторым количеством демонстрирующих гипометилирование областей для второго образца. Сравнение указанного первого количества с указанным вторым количеством, и первого числа со вторым числом может использоваться для определения прогноза лечения. Согласно различным вариантам реализации только одно из сравнений может быть определяющим для прогноза, либо могут использоваться оба сравнения. Согласно вариантам реализации, где получают третий или последующие дополнительные образцы, один или большее количество указанных образцов может применяться для определения прогноза лечения, либо сами по себе, либо в сочетании со вторым образцом.
Согласно одному варианту реализации делают более плохой прогноз, если первая разность между первым количеством и вторым количеством ниже порога для первой разности. Согласно другому варианту реализации делают более плохой прогноз, если вторая разности между первым числом и вторым числом ниже порога для второй разности. Порог может быть одинаковым или разным. Согласно одному варианту реализации порог для первой разности и порог для второй разности равны 0. Соответственно, в примере, приведенном выше, разность значений метилирования указывает на худший прогноз для пациента TBR34.
Прогноз может быть лучше, если первая разность и/или вторая разность выше одного и того же порога либо соответствующих порогов. Классификация для прогноза может зависеть от того, насколько выше или ниже порога имеющиеся различия. Для получения различных классификаций может использоваться несколько порогов. При более значительных различиях могут прогнозироваться лучшие исходы, а при меньших различиях (и даже отрицательных значениях) могут прогнозироваться худшие исходы.
- 56 042157
Согласно некоторым вариантам реализации могут также учитываться моменты времени, когда отбирают различные образцы. При наличии таких временных параметров возможно определить кинетику или скорость изменения количества. Согласно одному варианту реализации быстрое снижение ассоциированного с опухолью гипометилирования в плазме и/или быстрое уменьшение ассоциированных с опухолью CNA в плазме указывает на хороший прогноз. И напротив, статичность или быстрое повышение ассоциированного с опухолью гипометилирования в плазме и/или статичность или быстрое увеличение ассоциированных с опухолью CNA указывает на плохой прогноз. Измерения метилирования и CNA могут использоваться в комбинации с другими клиническими параметрами (например, результатами визуализации, биохимическими показателями сыворотки или белковыми маркерами) для прогнозирования клинического исхода.
Согласно вариантам реализации могут использоваться другие образцы помимо плазмы. Например, ассоциированные с опухолью аберрации метилирования (например, гипометилирование) и/или ассоциированные с опухолью CNA могут быть измерены в опухолевых клетках, циркулирующих в крови страдающих раковым заболеванием пациентов, в свободной от клеток ДНК или опухолевых клетках в моче, стуле, слюне, мокроте, билиарной жидкости, жидкости поджелудочной железы, шеечных мазках, секрете половых путей (например, влагалища), асцитической жидкости, плевральной жидкости, семенной жидкости, поте и слезе.
Согласно различным вариантам реализации ассоциированные с опухолью аберрации метилирования (например, гипометилирование) и/или ассоциированные с опухолью CNA могут быть детектированы в крови или плазме пациентов с раком молочной железы, раком легкого, раком толстой и прямой кишки, раком поджелудочной железы, раком яичника, носоглоточной карциномой, раком шейки матки, меланомой, опухолями головного мозга и т.д. Таким образом, поскольку метилирование и генетические изменения, такие как CNA, представляют собой универсальное явление при раковых заболеваниях, описанные способы могут применяться для всех типов рака. Измерения метилирования и CNA могут использоваться в сочетании с другими клиническими параметрами (например, результатами визуализации) для прогнозирования клинического исхода. Варианты реализации также могут применяться для скрининга и мониторинга пациентов с предраковыми состояниями, например, аденомами.
Соответственно, согласно одному варианту реализации указанный биологический образец берут до лечения, и повторяют измерения CNA и метилирования после лечения. Указанные измерения могут давать следующее первое количество областей, для которых было определено присутствие делеции или амплификации, и могут давать следующее второе количество областей, которые, как было определено, имеют уровень метилирования области, превышающий соответствующее предельное значение для области. Первое количество может сравниваться со следующим первым количеством, и второе количество может сравниваться со следующим вторым количеством для определения прогноза для указанного организма.
Сравнение для определения прогноза для указанного организма может включать определение первой разности между первым количеством и следующим первым количеством, и указанная первая разность может сравниваться с одним или несколькими порогами для первой разности для определения прогноза. Сравнение для определения прогноза для указанного организма также может включать определение второй разности между вторым количеством и следующим вторым количеством, и указанная вторая разность может сравниваться с одним или несколькими порогами для второй разности. Пороговое значение может быть равно 0 или другому числу.
Прогноз может быть хуже, если первая разность ниже порога для первой разности, по сравнению с прогнозом, если первая разность выше порога для первой разности. Прогноз может быть хуже, если вторая разность ниже порога для второй разности, по сравнению с прогнозом, если вторая разность выше порога для второй разности. Примеры лечения включают иммунотерапию, хирургию, радиационную терапию, химиотерапию, терапию на основе антител, генную терапию, эпигенетическую терапию или таргетную терапию.
Е. Эффективность.
Ниже описывается диагностическая эффективность анализа CNA и метилирования для разного числа ридов секвенирования и участков разного размера.
1. Число ридов секвенирования.
В соответствии с одним вариантом реализации авторы настоящего изобретения исследовали ДНК плазмы 32 здоровых контрольных субъектов, 26 пациентов, страдающих гепатоцеллюлярной карциномой и 20 пациентов, страдающих другими типами раковых заболеваний, включая носоглоточную карциному, рак молочной железы, рак легкого, нейроэндокринный рак и гладкомышечную саркому. 22 из 32 здоровых субъектов были выбраны случайным образом в качестве референсной группы. Среднее значение и стандартное отклонение (SD) для указанных 22 референсных индивидуумов использовали для определения нормального диапазона плотности метилирования и представленности в геноме. ДНК, экстрагированную из образца плазмы каждого индивидуума, использовали для получения библиотеки секвенирования с применением набора для секвенирования парных концов от Illumina. Затем библиотеки для секвенирования обрабатывали бисульфитом, которые конвертирует неметилированные остатки цитозина в урацил. Конвертированную бисульфитом библиотеку для секвенирования для каждого образца плазмы
- 57 042157 секвенировали на одной дорожке секвенатора Illumina HiSeq2000.
После распознавания оснований адаптерные последовательности и основания низкого качества (т.е. с показателем качества <5) на концах фрагментов удаляли. Затем обрезанные риды в формате FASTQ обрабатывали с помощью системы анализа данных метилирования Methy-Pipe (P Jiang et al. 2010, IEEE International Conference on Biomformatics and Biomedicine, ЦИО:10.1109/BIBMW.2010.5703866). Для выравнивания конвертированных бисульфитом ридов секвенирования авторы настоящего изобретения сначала выполняли конверсию in silico всех остатков цитозина в тимины на цепях Уотсона-Крика по отдельности с применением референсного генома человека (версия NCBI 36/hg19). Затем авторы настоящего изобретения выполняли конверсию in silico каждого цитозина в тимин во всех обработанных ридах и сохраняли информацию о расположении каждого конвертированного остатка. SOAP2 использовали для выравнивания конвертированных ридов по двум предварительно конвертированным референсным геномам человека (R Li et al. 2009 Bioinformatics 25:1966-1967), максимум с двумя несовпадениями для каждого выравниваемого рида. Только риды, картирующиеся с уникальной геномной локализацией, использовали для дальнейшего анализа. Неоднозначные риды, картирующиеся на обе цепи Уотсона-Крика и дублирующиеся (клональные) риды удаляли. Остатки цитозина в контексте динуклеотидов CpG использовали для последующего анализа метилирования. После выравнивания цитозины, исходно присутствовавшие в ридах секвенирования, восстанавливали на основе информации о расположении, сохраненной при конверсии in silico. Восстановленные цитозины в динуклеотидах CpG подсчитывали как метилированные. Тимины в динуклеотидах CpG подсчитывали как неметилированные.
Для анализа метилирования геном разделяли на участки равного размера. Протестированные размеры участков включают 50 кб, 100 кб, 200 кб и 1 Мб. Плотность метилирования для каждого участка рассчитывали как число метилированных цитозинов в контексте динуклеотидов CpG, разделенное на общее число цитозинов в положениях CpG. Согласно другим вариантам реализации размер участков может не быть одинаковым по всему геному. Согласно одному варианту реализации каждый участок из таких участков неодинакового размера сравнивают у нескольких субъектов.
Для определения того, является ли нормальной плотность метилирования в плазме в тестируемом случае, плотность метилирования сравнивали с результатами референсной группы. 22 из 32 здоровых субъектов были выбраны случайным образом в качестве референсной группы для расчета Z-показателя метилирования (Zmeth).
MDlest - MD ref MDsd
Zmeth ~
Где - плотность метилирования в тестируемом случае для конкретного участка размером 1 Мб;
^Dref - среднее значение плотности метилирования референсной группы для соответствующего участка; и - SD плотности метилирования референсной группы для соответствующего участка.
Для анализа CNA определяли число ридов секвенирования, картируемых с каждым участком размером 1 Мб (KCA Chan et al. 2013 Clin Chem 59:211-24). Плотность ридов секвенирования определяли для каждого участка после коррекции смещения по GC с применением локально взвешенной регрессии для сглаживания графика рассеяния согласно существующему описанию (EZ Chen et al. 2011 PLoS One 6: e21791). Для анализа плазмы плотность ридов секвенирования в тестируемом случае сравнивали с референсной у группой для расчета Z-показателя CNA ( аи):
. RDlesl ~ RD ref CNA RDsd
RD
Где - плотность ридов секвенирования для тестируемого случая для конкретного участка размером 1 Мб;
RDrrf - среднее значение плотности ридов секвенирования для референсной группы для соответстRDc^ СП 1 вующего участка; и ~ плотность ридов секвенирования для референсной группы для соответствующего участка. Участок определяли как демонстрирующий CNA, если Zcna указанного участка был <3 или >3.
В расчете на один случай получали среднее значение выравниваемых ридов, составляющее 93 млн (диапазон: 39 млн-142 млн). Для оценки эффекта уменьшения числа ридов секвенирования на диагностическую эффективность авторы настоящего изобретения случайным образом выбирали 10 млн. выравниваемых ридов в каждом случае. Один и тот же набор референсных индивидуумов использовали для установления референсного диапазона для каждого участка размером 1 Мб для набора данных с уменьшенным количеством ридов секвенирования. Для каждого случая определяли процент участков, демонстрирующих значительное гипометилирование, т.е. Zmeth < -3, и процент участков с CNA, т.е. Zcna <-3 или >3. Кривые функциональных характеристик приемника (ROC) использовали для иллюстрации диагностической эффективности полногеномного анализа гипометилирования и CNA для наборов данных со
- 58 042157 всеми ридами секвенирования с 1 дорожки и 10 млн ридов на случай. При анализе ROC использовали всех здоровых субъектов (32 субъекта).
На фиг. 42 приведена диаграмма диагностической эффективности полногеномного анализ гипометилирования при разном количестве ридов секвенирования. Для анализа гипометилирования значения площади под кривой для кривых ROC значительно не отличались между двумя наборами данных, которые исследовали все риды секвенирования с одной дорожки и 10 млн. ридов на случай (Р=0,761). Диагностическая эффективность анализа CNA ухудшалась, со значительным снижением значений площади под кривой, при уменьшении числа ридов секвенирования от данных одной дорожки до 10 млн (Р<0,001).
2. Эффект применения участков различного размера.
Помимо разделения генома на участки размером 1 Мб авторы настоящего изобретения также исследовали возможность использования участков меньшего размера.
Теоретически, применение участков меньшего размера потенциально может уменьшать вариабельность плотности метилирования на участке. Это обусловлено тем, что плотность метилирования разных геномных областей может широко варьировать. Если размер участка больше, вероятности включения областей с разными плотностями метилирования повышаются и, соответственно, приводят к общему увеличению вариабельности плотности метилирования участков.
Хотя использование участков меньшего размера потенциально может уменьшать вариабельность плотности метилирования, связанную с различиями между областями, с другой стороны, при этом снизится число ридов секвенирования, картируемых на конкретный участок. При уменьшении картирования ридов на индивидуальные участки будет повышаться вариабельность за счет вариаций выборки. Оптимальный размер участка, способный обеспечить минимальную общую вариабельность плотности метилирования, может быть установлен экспериментально с учетом требований при конкретном диагностическом применении, например, с учетом общего числа ридов секвенирования на образец и типа используемого секвенатора ДНК.
На фиг. 43 приведена диаграмма, демонстрирующая кривые ROC для детекции ракового заболевания на основе полногеномного анализа гипометилирования при разных размерах участков (50 кб, 100 кб, 200 кб и 1 Мб). Показаны Р-значения для сравнения площади под кривой при размере участка 1 Мб. Наблюдается тенденция к улучшению при уменьшении размера участка от 1 Мб до 200 кб.
F. Показатель суммарной вероятности.
Количество областей метилирования и CNA может принимать различные значения. В приведенных выше примерах описано число областей, превышающее предельное значение или процент таких областей, демонстрирующих значительное гипометилирование или CNA, в качестве параметра классификации образца как связанного с раковым заболеванием. Такие способы не учитывают величину аберрации для индивидуальных участков. Например, участок с Zmeth, равным -3,5, будет классифицирован так же, как участок с Zmeth, равным -30, так как оба они будут классифицированы как значительно гипометилированные. Однако на степень изменений гипометилирования в плазме, т.е. на величину значения Zmeth, влияет количество связанной с раковым заболеванием ДНК в образце и, соответственно, она может дополнить информацию о проценте участков, демонстрирующих аберрации, отражая опухолевую нагрузку. Более высокая фракционная концентрация опухолевой ДНК в образце плазмы будет приводить к более низкой плотности метилирования, и это будет обуславливать меньшее значение Zmeth.
1. Показатель суммарной вероятности как диагностический параметр.
Для использования информации о величине аберраций авторы настоящего изобретения разработали способ, называемый показателем суммарной вероятности (СР). На основании нормального распределения вероятностной функции каждое значение Zmeth переводили в вероятность случайного возникновения такого наблюдения.
Показатель СР рассчитывали как:
СР score = -log(Prob.) для участка (i) с Zmeth<-3 где Probi представляет собой вероятность Zmeth для участка (i) в соответствии с t-распределением Стьюдента с 3 степенями свободы, и log представляет собой функцию натурального логарифма. Согласно другому варианту реализации может использоваться логарифм по основанию 10 (или другому числу). Согласно другим вариантам реализации могут использоваться другие распределения, например, но не ограниченные перечисленными нормальным распределением и гамма-распределением, для преобразования Z-показателя в СР.
Больший показатель СР указывает на более низкую вероятность случайного возникновения такого отклонения плотности метилирования в нормальной популяции. Таким образом, высокий показатель СР будет указывать на более высокую вероятность аномального гипометилирования ДНК в образце, например, на присутствие связанной с раковым заболеванием ДНК.
По сравнению с процентом участков, демонстрирующих аберрации, измеренный показатель СР имеет более высокий динамический диапазон. Хотя опухолевая нагрузка у разных пациентов может ва
- 59 042157 рьировать в широком диапазоне, больший диапазон значений СР может подходить для отражения опухолевой нагрузки у пациентов с относительно высокой и относительно низкой опухолевой нагрузкой. Кроме того, применение показателей СР может потенциально обеспечивать более чувствительную детекцию изменений концентрации связанной с опухолью ДНК в плазме. Это обеспечивает преимущества при мониторинге ответа на лечение и прогнозировании. Соответственно, снижение показателей СР во время лечения указывает на хороший ответ на лечение. Отсутствие снижения или даже увеличение показателей СР во время лечения указывает на неудовлетворительный или отсутствующий ответ. При прогнозировании высокий СР показатель указывает на высокую опухолевую нагрузку и предполагает плохой прогноз (например, более высокую вероятности смерти или прогрессирования опухоли).
На фиг. 44А показана диагностическая эффективность суммарной вероятности (СР) и процентного содержания участков с аберрациями. Не наблюдалось значимой разности между значениями площади под кривой для двух типов диагностического алгоритма (Р=0,791).
На фиг. 44В показана диагностическая эффективность анализа плазмы на глобальное гипометилирование, гиперметилирование CpG-островков и CNA. При одной дорожке секвенирования на образец (размер участков 200 кб для анализа гипометилирования и размер участков 1 Мб для CNA; CpGостровки определены в соответствии с базой данных Университета Калифорнии, Санта-Крус (UCSC)) значения площади под кривой для всех трех типов анализа превышали 0,90.
Во всех последующих анализах максимальный показатель СР для контрольных субъектов использовали в качестве точки отсечения для каждого из трех типов анализа. Выбор указанных точек отсечения обеспечивал диагностическую специфичность, составляющую 100%. Диагностическая чувствительность для анализа общего гипометилирования, гиперметилирования CpG-островков и CNA составляла 78%, 89% и 52%, соответственно. У 43 из 46 больных раковыми заболеваниями пациентов детектировали аберрации по меньшей мере одного из трех типов, что, соответственно, давало чувствительность 93,4% и специфичность 100%. Наши результаты показывают, что указанные три типа анализа могут использоваться синергетически для детекции раковых заболеваний.
На фиг. 45 приведена таблица результатов анализа на глобальное гипометилирование, гиперметилирование CpG-островков и CNA у пациентов с гепатоцеллюлярной карциномой. Предельные значения показателя СР для трех типов анализа составляли 960, 2,9 и 211, соответственно. Положительные результаты для показателя СР выделены жирным шрифтом и подчеркнуты.
На фиг. 46 приведена таблица результатов анализа на глобальное гипометилирование, гиперметилирование CpG-островков и CNA у пациентов с раковыми заболеваниями, отличными от гепатоцеллюлярной карциномы. Предельные значения показателя СР для трех типов анализа составляли 960, 2,9 и 211 соответственно. Положительные результаты для показателя СР выделены жирным шрифтом и подчеркнуты.
2. Применение показателя СР для мониторинга раковых заболеваний.
От пациента с ГЦК TBR34 до и после лечения получали последовательные образцы. Указанные образцы исследовали на глобальное гипометилирование.
На фиг. 47 представлен серийный анализ метилирования в плазме для пациента TBR34. Внутренний круг отражает плотность метилирования лейкоцитарной пленки (черный) и опухолевых тканей (фиолетовый). Для образцов плазмы показан Zmeth для каждого участка размером 1 Мб. Разность между двумя линиями отражает разность Zmeth, равную 5. Красными и серыми точками обозначены участки с гипометилированием и без изменений плотности метилирования по сравнению с референсной группой. Начиная от второго от центра круга в направлении внешнего круга представлены образцы плазмы, полученные до лечения, через 3 дня и через 2 месяца после удаления опухоли, соответственно. До лечения в плазме можно было наблюдать высокую степень гипометилирования, и более 18,5% участков имели Zmeth, <-10. Через 3 дня после удаления опухоли можно наблюдать уменьшение степени гипометилирования в плазме при отсутствии участков С Zmeth <-10.
Таблица 5
Случай № Момент времени Анализ метилирования
Процент участков, демонстрирующих значительное гипометилирование Показатель суммарной вероятность (СР) Суммативный Z-показатель
TBR34 До хирургического лечения (ОТ) 62,6% 37,573 14,285
3 дня после ОТ 80,5% 17,777 9,195
2 месяца после ОТ 40,1% 15,087 5,201
Табл. 5 демонстрирует, что, несмотря на уменьшение величины изменений гипометилирования через 3 для после хирургического удаления опухоли, процент участков, где наблюдались аберрации, парадоксальным образом повышался. С другой стороны, показатель СР более точно обнаруживал снижение степени гипометилирования в плазме и может лучше отражать изменения опухолевой нагрузки.
Через 2 месяца после ОТ все еще присутствовал значительный процент участков, демонстрирую
- 60 042157 щих изменения гипометилирования. Показатель СР также оставался статичным на уровне, составляющем приблизительно 15000. Позже, через 3 месяца, у указанного пациента были диагностированы мультифокальные метастазы опухоли (ранее неизвестные на время хирургического вмешательства) в нерезецированной части печени, и было обнаружено несколько метастазов в легкие через 4 месяца после операции. Пациент скончался в результате метастатического процесса через 8 месяцев после операции. Эти результаты предполагают, что показатель СР может быть более эффективным, чем процент участков с аберрациями, для отражения опухолевой нагрузки.
В целом СР может подходить для применения в тех случаях, когда требуется измерение количества опухолевой ДНК в плазме. Примеры таких применений включают: прогнозирование и мониторинг у страдающих раковым заболеванием пациентов (например, наблюдение за ответом на лечение, или наблюдение за прогрессированием опухоли).
Суммативный Z-показатель представляет собой прямую сумму Z-показателей, т.е. без преобразования в вероятность. В указанном примере для суммативного Z-показателя наблюдается такое же поведение, как и для показателя СР. В других случаях СР может быть более чувствителен, чем суммативный Zпоказатель, для мониторинга остаточного заболевания, благодаря большему динамическому диапазону показателя СР.
X. Влияние CNA на метилирование
Использование CNA и метилирования для определения соответствующих классификаций уровня рака, с объединением указанных классификаций для получения третьей классификации, описано выше. Помимо такого объединения CNA может использоваться для изменения предельных значений для анализа метилирования и для идентификации ложноположительных результатов путем сравнения уровней метилирования для групп областей с разными характеристиками CNA. Например, уровень метилирования при избыточном содержании (например, ZCNA>3) может сравниваться с уровнем метилирования для нормального содержания (например, -3<ZCNA <3). Сначала описано влияние CNA на уровни метилирования.
А. Изменение плотности метилирования в областях с добавлением или утратой хромосомного материала.
Поскольку в опухолевых тканях обычно наблюдается общее гипометилирование, наличие происходящей из опухоли ДНК в плазме страдающих раковым заболеванием пациентов будет приводить к снижению плотности метилирования в сравнении с не имеющими раковых заболеваний субъектами. Теоретически, степень гипометилирования в плазме страдающих раковым заболеванием пациентов пропорциональна фракционной концентрации происходящей из опухоли ДНК в образце плазмы.
В случае областей, для которых наблюдается добавление хромосомного материала в опухолевых тканях, из амплифицированных сегментов ДНК в плазму высвобождается дополнительная доза опухолевой ДНК. Указанный повышенный вклад опухолевой ДНК в плазму теоретически приводит более высокой степени гипометилирования пораженной области ДНК плазмы. Дополнительным фактором является то, что геномные области, для которых наблюдается амплификация, предположительно стимулируют рост опухолевых клеток, и, соответственно, предположительно будут экспрессироваться. Такие области обычно гипометилированы.
Напротив, для областей, где наблюдается утрата хромосомного материала в опухолевой ткани, пониженный вклад опухолевой ДНК в плазму будет приводить к более низкой степени гипометилирования по сравнению с областями без изменения числа копий. Дополнительным фактором является то, что геномные области, которые удалены в опухолевых клетках, могут содержать гены-супрессоры опухолей, и для опухолевых клеток может быть благоприятен сайленсинг таких областей. Соответственно, можно ожидать, что вероятность гиперметилирования таких областей будет выше.
В настоящем изобретении авторы используют результаты двух пациентов с ГЦК (TBR34 и TBR36) для иллюстрации указанного эффекта. На фиг. 48А (TBR36) и 49А (TBR34) кругами выделены области с добавлением или утратой хромосомного материала, и представлен соответствующий анализ метилирования. Фиг. 48В и 49В приведены графики z-показателей метилирования при утрате, норме и добавлении для пациентов TBR36 и TBR34 соответственно.
На фиг. 48А представлен Circos-график, отражающий CNA (внутренний круг) и изменения метилирования (внешний круг) в обработанной бисульфитом ДНК плазмы у пациента с ГЦК TBR36. Красными кругами выделены области с добавлением или утратой хромосомного материала. Области, где наблюдается добавление хромосомного материала, были более гипометилированы, чем области без изменения числа копий. Области, где наблюдается утрата хромосомного материала, были менее гипометилированы, чем области без изменения числа копий. Фиг. 48В представляет собой график Z-показателей метилирования для областей с добавлением или утратой хромосомного материала, и областей без изменения числа копий для пациента с ГЦК TBR36. По сравнению с областями без изменений числа копий, области с добавлением хромосомного материала имели более отрицательные Z-показатели (большее гипометилирование), а области с утратой хромосомного материала имели менее отрицательные Z-показатели (меньшее гипометилирование).
На фиг. 49А представлен Circos-график, отражающий CNA (внутренний круг) и изменения метилирования (внешний круг) в обработанной бисульфитом ДНК плазмы у пациента с ГЦК TBR34. Фиг. 49В
- 61 042157 представляет собой график Z-показателей метилирования для областей с добавлением или утратой хромосомного материала, и областей без изменения числа копий для пациента с ГЦК TBR34. Различие плотности метилирования между областями с добавлением или утратой хромосомного материала было больше у пациента TBR36 по сравнению с пациентом TBR34, так как фракционная концентрация происходящей из опухоли ДНК у первого пациента была выше.
В указанном примере для определения CNA используются те же области, что и для определения метилирования. Согласно одному варианту реализации соответствующие предельные значения для областей зависят от того, наблюдается ли в соответствующей области делеция или амплификация. Согласно одному варианту реализации величина соответствующего предельного значения для области (например, точка отсечения Z-показателя, используемая для определения гипометилирования) больше в тех случаях, когда в соответствующей области наблюдается амплификация, чем в тех случаях, когда амплификация не наблюдается (например, указанная величина может превышать 3, и может применяться точка отсечения <-3). Соответственно при тестировании на гипометилирование соответствующее предельное значение для области может иметь большее отрицательное значение в тех случаях, когда в соответствующей области наблюдается амплификация, чем в тех случаях, когда амплификация не наблюдается. Ожидается, что такой вариант реализации повысит специфичность тестирования для детекции раковых заболеваний.
Согласно другому варианту реализации величина соответствующего предельного значения для области меньше (например, менее чем 3) в тех случаях, когда в соответствующей области наблюдается делеция, чем в тех случаях, когда делеция не наблюдается. Соответственно, при тестировании на гипометилирование соответствующее предельное значение для области может быть менее отрицательным в тех случаях, когда в соответствующей области наблюдается делеция, чем в тех случаях, когда делеция не наблюдается. Ожидается, что такой вариант реализации повысит чувствительность тестирования для детекции раковых заболеваний. Коррекция предельных значений согласно описанным выше вариантам реализации может быть изменена в зависимости от требуемой чувствительности и специфичности для конкретного диагностического сценария. Согласно другим вариантам реализации измерения метилирования и CNA могут применяться в сочетании с другими клиническими параметрами (например, результатами визуализация или биохимическими показателями сыворотки) для прогнозирования раковых заболеваний.
В. Использование CNA для выбора областей.
Согласно приведенному выше описанию, авторы настоящего изобретения показали, что плотность метилирования в плазме изменяется в областях, содержащих аберрации числа копий, в опухолевых тканях. В областях с увеличением числа копий в опухолевой ткани повышенный вклад гипометилированной опухолевой ДНК в плазму будет приводить к большей степени гипометилирования ДНК плазмы по сравнению с областями без аберраций числа копий. Напротив, в областях с утратой копий в опухолевой ткани пониженный вклад гипометилированной происходящей из ракового новообразования ДНК в плазму будет приводить к меньшей степени гипометилирования ДНК плазмы. Указанная зависимость между плотностью метилирования ДНК плазмы и относительной представленностью может потенциально использоваться для дифференциации результатов гипометилирования, связанных с присутствием связанной с раковым заболеванием ДНК и с другими не связанными с раковыми заболеваниями причинами (например, СКВ) гипометилирования ДНК плазмы.
Чтобы проиллюстрировать указанный способ, авторы настоящего изобретения исследовали образцы плазмы двух пациентов с гепатоцеллюлярной карциномой (ГЦК) и двух пациентов с СКВ, не имеющих раковых заболеваний. У указанных двух пациентов с СКВ (СКВ04 и СКВ10) наблюдалось очевидное наличие гипометилирования и CNA в плазме. У пациента СКВ04 наблюдалось гипометилирование 84% участков и CNA в 11,2% участков. У пациента СКВ10 наблюдалось гипометилирование 10,3% участков и CNA в 5,7% участков.
На фиг. 50А и В представлены результаты анализа гипометилирования плазмы и CNA для пациентов с СКВ, СКВ04 и СКВ10. Внешний круг отображает Z-показатели метилирования (Zmeth) при разрешении 1 Мб. Участки с Z-показателем метилирования Zmeth <-3 отмечены красным, с Zmeth >-3 - серым цветом. Внутренний круг отображает Z-показатели CNA (ZCNA). Зелеными, красными и серыми точками обозначены участки с ZCNA>3, <3 и от -3 до 3, соответственно. У указанных двух пациентов с СКВ наблюдались изменения гипометилирования и CNA в плазме.
Для определения того, согласовались ли изменения метилирования и CNA с наличием происходящей из ракового новообразования ДНК в плазме, авторы настоящего изобретения сравнивали Zmeth для областей с ZCNA>3, <-3 и от -3 до 3. При изменениях метилирования и CNA, в которые вносит вклад происходящая из ракового новообразования ДНК в плазме, ожидается, что области с ZCNA<-3 будут менее гипометилированы и будут иметь менее отрицательный Zmeth. Напротив, области с ZCNA>3, как ожидается, будут более гипометилированы и будут иметь более отрицательный Zmeth. Для наглядности авторы настоящего изобретения применяли односторонний критерий суммы рангов для сравнения Zmeth для областей с CNA (т.е. областей с ZCNA<-3 или >3) с областями без CNA (т.е. областями с ZCNA от -3 до 3). Согласно другим вариантам реализации могут применяться другие статистические критерии, например,
- 62 042157 но не ограничиваясь t-критерием Стьюдента, дисперсионным анализом (ANOVA) и критерием КраскелаУоллиса.
На фиг. 51А и В представлен анализ Zmeth для областей с CNA и без CNA в плазме двух пациентов с ГЦК (TBR34 и TBR36). Области с ZCNA<-3 и >3 представляют области, недостаточно и избыточно представленные в плазме, соответственно. И у TBR34, и у TBR36 области, которые были недопредставлены в плазме (т.е. области с ZCNA<-3), имели значительно более высокий Zmeth (Р-значение <10-5, односторонний критерий суммы рангов) по сравнению с областями, нормально представленными в плазме (т.е. областями с ZCNA, составляющими от -3 до 3). Нормальная представленность соответствуют ожидаемой для эуплоидного генома. Представленные избыточно области в плазме (т.е. области с ZCNA>3) имели значительно более низкий Zmeth по сравнению с областями, нормально представленными в плазме (Р-значение <105, односторонний критерий суммы рангов). Все указанные изменения согласовались с присутствием гипометилированной опухолевой ДНК в образцах плазмы.
На фиг. 51С и D представлен анализ Zmeth для областей с CNA и без CNA в плазме двух пациентов с СКВ (СКВ04 и СКВ10). Области с ZCNA<-3 и >3 представляют области, недостаточно и избыточно представленные в плазме, соответственно. У СКВ04 области, которые были недопредставлены в плазме (т.е. области с ZCNA<-3), не имели значительно более высокого Zmeth (Р-значение = 0,99, односторонний критерий суммы рангов) по сравнению с областями, нормально представленными в плазме (т.е. областями с ZCNA, составляющими от -3 до 3); и области, избыточно представленные в плазме (т.е. области с ZCNA>3) не имели значительно более низкого Zmeth по сравнению с областями, нормально представленными в плазме (Р-значение = 0,68, односторонний критерий суммы рангов). Указанные результаты отличаются от ожидаемых изменений из-за присутствия в плазме происходящей из опухоли гипометилированной ДНК. Аналогичным образом, у СКВ10 области с ZCNA<-3 не имели значительно более высокого Zmeth по сравнению с областями с ZCNA, составляющими от -3 до 3 (Р-значение = 0,99, односторонний критерий суммы рангов).
Причина отсутствия типичного связанного с раковым заболеванием паттерна взаимосвязи между Zmeth и Zcna у пациентов с СКВ заключается в том, что у пациентов с СКВ CNA не присутствуют в конкретном типе клеток, в которых также наблюдается гипометилирование. В данном случае, наблюдаемое очевидное присутствие CNA и гипометилирования обусловлено измененным распределением размеров циркулирующей ДНК у пациентов с СКВ. Измененное распределение размеров потенциально может изменять плотности ридов секвенирования для разных геномных областей, что приводит к очевидным CNA, так как эталоны получены от здоровых субъектов. Согласно описанию в предшествующих разделах, имеется корреляция между размером фрагмента циркулирующей ДНК и плотностью его метилирования. Таким образом, измененное распределение размеров также может приводить к аберрантному метилированию.
Хотя области с ZCNA>3 имели немного более низкие уровни метилирования по сравнению с областями с ZCNA, составляющими от -3 до 3, Р-значение для указанного сравнения было значительно выше, чем наблюдавшиеся для двух больных раковым заболеванием пациентов. Согласно одному варианту реализации Р-значение может применяться в качестве параметра для определения вероятности наличия в тестируемом случае ракового заболевания. Согласно другому варианту реализации различие Zmeth между нормально и аберрантно представленными областями может использоваться в качестве параметра, отражающего вероятность наличия раковых заболеваний. Согласно одному варианту реализации группа страдающих раковым заболеванием пациентов может быть использована для установления корреляции между Zmeth и ZCNA, и для определения порогов для разных параметров, что позволяет установить, согласуются ли изменения с присутствием происходящей из ракового новообразования гипометилированной ДНК в тестируемом образце плазмы.
Соответственно согласно одному варианту реализации может осуществляться анализ CNA для определения первого набора областей, все из которых демонстрируют что-либо одно из: делеции, амплификации или нормальной представленности. Например, в первом наборе областей все области могут демонстрировать делецию, или все области могут демонстрировать амплификацию, или все области могут демонстрировать нормальную представленность (например, содержать нормальное первое количество областей, например, иметь нормальный Zmeth). Для указанного первого набора областей может быть определен уровень метилирования (например, первый уровень метилирования согласно способу 2800 может соответствовать первому набору областей).
Анализ CNA позволяет определить второй набор областей, все из которых демонстрируют что-либо второе из: делеции, амплификации или нормальной представленности. В указанном втором наборе областей будут наблюдаться отличные от первого набора признаки. Например, если области первого набора были нормальными, в областях второго набора может наблюдаться делеция или амплификация. Второй уровень метилирования может быть рассчитан на основании соответствующих количеств молекул ДНК, метилированных в сайтах областей второго набора.
Затем может быть вычислен параметр, связывающий первый уровень метилирования и второе метилирование. Например, может вычисляться разность или отношение и сравниваться с предельным значением. Указанная(ое) разность или отношение могут быть также обработаны с применением распреде
- 63 042157 ления вероятностей (например, в рамках статистического тестирования) для определения вероятности получения значения, и указанная вероятность может сравниваться с предельным значением для определения уровня рака на основе уровней метилирования. Такая точка отсечения может быть выбрана для различения образцов, относящихся к раковому заболеванию и не относящихся к раковому заболеванию (например, СКВ).
Согласно одному варианту реализации может быть определен уровень метилирования для первого набора областей или для смеси областей (а именно, смеси областей, демонстрирующих амплификацию, делецию, а также нормальных). Указанный уровень метилирования затем может сравниваться с первой точкой отсечения в рамках первого этапа анализа. При превышении точки отсечения, что указывает на вероятность наличия ракового заболевания, может осуществляться описанный выше анализ для определения, является ли указание ложноположительным. Результирующая классификация уровня рака может соответственно включать сравнение параметра для двух уровней метилирования со второй точкой отсечения.
Первый уровень метилирования может представлять собой статистический показатель (например, среднее значение или медиану) уровней метилирования области, рассчитанных для каждой области из первого набора областей. Второй уровень метилирования может также представлять собой статистический показатель уровней метилирования области, рассчитанный для каждой области второго набора областей. Например, статистический показатель может быть определен с применением одностороннего критерия суммы рангов, t-критерия Стьюдента, дисперсионного анализа (ANOVA) или критерия Краскела-Уоллиса.
XI. Классификация типов раковых заболеваний
Помимо определения наличия или отсутствия ракового заболевания в организме варианты реализации позволяют идентифицировать тип ракового заболевания, связанного с образцом. Указанная идентификация типа ракового заболевания может задействовать паттерны глобального гипометилирования, гиперметилирования CpG-островков и/или CNA. Указанные паттерны могут включать разбиение на кластеры пациентов с известным диагнозом с применением измеренных уровней метилирования областей, соответствующих значений CNA для областей и уровня метилирования CpG-островков. Приведенные ниже результаты демонстрируют, что для организмов с аналогичным типом ракового заболевания наблюдаются аналогичные значения для областей и CpG-островков; также и у пациентов, не имеющих раковых заболеваний, наблюдаются аналогичные значения. При разбиении на кластеры каждое из значений для области или островка может представлять собой отдельное измерение при разбиении на кластеры.
Известно, что при одном и том же типе ракового заболевания наблюдаются аналогичные генетические и эпигенетические изменения (Е Gebhart et al. 2004 Cytogenet Genome Res; 104: 352-358; PA Jones et al. 2007 Cell; 128: 683-692). Ниже авторы настоящего изобретения приводят описание того, как паттерны CNA и изменений метилирования, детектированные в плазме, могут использоваться для установления происхождения или типа ракового заболевания. Образцы ДНК плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов классифицировали с применением, например, иерархического кластерного анализа. Указанный анализ выполняли с применением, например, функции heatmap.2 пакета скриптов R (cran.r-project.org/web/packages/gplots/gplots.pdf).
Чтобы проиллюстрировать потенциал указанного способа, авторы настоящего изобретения использовали два набора критериев (группа А и группа В) в качестве примеров для идентификации подходящих признаков для классификации образцов плазмы (см. табл. 6). Согласно другим вариантам реализации могут применяться другие критерии для идентификации указанных признаков. Использованные признаки включали глобальные CNA при разрешении 1 Мб, глобальную плотность метилирования при разрешении 1 Мб и метилирование CpG-островков.
Таблица 6
Глобальное метилирование при разрешении 1 Мб
Группа критериев А Группа критериев В
Критерии >20 случаев ракового заболевания с Zпоказателем >3 или <-3 >20 случаев ракового заболевания с Zпоказателем >2,5 или <-2,5
Кол-во идентифицированных признаков 584 1911
Признаки CNA
Группа критериев А Группа критериев В
Критерии >10 случаев ракового заболевания с Zпоказателем >3 или <-3 >10 случаев ракового заболевания с Zпоказателем >2,5 <-2,5
Кол-во идентифицированных признаков 355 759
- 64 042157
Метилирование CpG-островков
Группа критериев А Группа критериев В
Критерии >5 случаев ракового заболевания с плотностью метилирования, отличающейся от среднего референсного значения на 2% в конкретных CpGостровках >1 случая ракового заболевания с плотностью метилирования, отличающейся от среднего референсного значения на 2% в конкретных CpGостровках
Кол-во идентифицированных признаков 110 191
В первых двух примерах авторы настоящего изобретения использовали для классификации все признаки CNA, глобального метилирования при разрешении 1 Мб и метилирования CpG-островков. Согласно другим вариантам реализации могут применяться другие критерии, например, но не ограничиваясь точностью измерения признака в плазме референсной группы.
На фиг. 52А представлен иерархический кластерный анализ для образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с применением всех из 1130 признаков группы А, включая 355 CNA, 584 признаков глобального метилирования при разрешении 1 Мб и статуса метилирования 110 CpG-островков. Цветной диаграммой в верхней части представлены группы образцов: зеленый, синий и красный цвета представляют здоровых субъектов, ГЦК и пациентов с отличным от ГЦК заболеванием, соответственно. В целом, в указанных трех группах субъектов наблюдалась тенденция к совместной кластеризации. По вертикальной оси представлены классифицирующие признаки. Признаки, характеризующиеся аналогичными паттернами у разных субъектов, кластеризовались вместе. Эти результаты предполагают, что паттерны изменений метилирования CpGостровков, изменений полногеномного метилирования при разрешении 1 Мб и CNA в плазме потенциально могут использоваться для определения происхождения ракового заболевания у пациентов при неизвестных первичных очагах.
На фиг. 52В представлен иерархический кластерный анализ для образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с применением всех 2780 признаков группы В, включая 759 CNA, 1911 признаков глобального метилирования при разрешении 1 Мб и статус метилирования для 191 CpG-островка. Цветной диаграммой в верхней части представлены группы образцов: зеленый, синий и красный цвета представляют здоровых субъектов, ГЦК и пациентов с отличным от ГЦК заболеванием, соответственно. В целом, в указанных трех группах субъектов наблюдалась тенденция к совместной кластеризации. По вертикальной оси представлены классифицирующие признаки. Признаки, характеризующиеся аналогичными паттернами у разных субъектов, кластеризовались вместе. Эти результаты предполагают, что паттерны изменений метилирования разных наборов CpG-островков, изменений полногеномного метилирования при разрешении 1 Мб и CNA в плазме могут использоваться для определения происхождения ракового заболевания у пациентов при неизвестных первичных очагах. Выбор классифицирующих признаков может быть адаптирован под конкретные варианты применения. Кроме того, прогнозу для типа ракового заболевания может присваиваться вес в соответствии с предварительно известными вероятностями разных типов раковых заболеваний у субъектов. Например, у пациентов с хроническим вирусным гепатитом имеется склонность к развитию гепатоцеллюлярной карциномы, а у хронических курильщиков имеется склонность к развитию рака легкого. Соответственно, может быть рассчитана взвешенная вероятность типа ракового заболевания с применением, например, но не ограничиваясь перечисленным, логистической, множественной или кластерной регрессии.
Согласно другим вариантам реализации для анализа классификации может применяться один тип признаков. Например, в нижеследующих примерах для иерархического кластерного анализа использовали только глобальное метилирование при разрешении 1 Мб, гиперметилирование CpG-островков или CNA при разрешении 1 Мб. Мощность дифференциации может быть разной при использовании разных признаков. Дополнительное уточнение параметров классифицирующих признаков потенциально может повышать точность классификации.
На фиг. 53А представлен иерархический кластерный анализ для образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с применением группы признаков А метилирования CpG-островков. В целом, больные раковыми заболеваниями пациенты кластеризовались совместно, а субъекты без раковых заболеваний попадали в другой кластер. Однако разделение пациентов с ГЦК и с отличным от ГЦК заболеванием было менее выраженным при сравнении с применением всех трех типов признаков.
На фиг. 53В представлен иерархический кластерный анализ для образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с применением группы А плотностей глобального метилирования при разрешении 1 Мб в качестве классифицирующих признаков. Наблюдалось преимущественное разбиение по кластерам пациентов с ГЦК и отличным от
- 65 042157
ГЦК заболеванием.
На фиг. 54А представлен иерархический кластерный анализ для образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с применением группы А глобальных CNA при разрешении 1 Мб в качестве классифицирующих признаков. Наблюдалось преимущественное разбиение по кластерам пациентов с ГЦК и с отличным от ГЦК заболеванием.
На фиг. 54В представлен иерархический кластерный анализ для образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с применением группы В плотностей метилирования CpG-островков в качестве классифицирующих признаков. Можно наблюдать преимущественное разбиение по кластерам пациентов с ГЦК и с отличным от ГЦК заболеванием.
На фиг. 55А представлен иерархический кластерный анализ для образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с применением группы В плотностей глобального метилирования при разрешении 1 Мб в качестве классифицирующих признаков. Можно наблюдать преимущественное разбиение по кластерам пациентов с ГЦК и с отличным от ГЦК заболеванием.
На фиг. 55В представлен иерархический кластерный анализ для образцов плазмы от пациентов с ГЦК, пациентов с отличным от ГЦК заболеванием и здоровых контрольных субъектов с применением группы В глобальных CNA при разрешении 1 Мб в качестве классифицирующих признаков. Можно наблюдать преимущественное разбиение по кластерам пациентов с ГЦК и с отличным от ГЦК заболеванием.
Указанные результаты иерархической кластеризации для образцов плазмы предполагают, что комбинации разных признаков потенциально могут использоваться для идентификации типов первичного рака. Дальнейшее уточнение критериев выбора критериев потенциально может дополнительно повышать точность классификации.
Соответственно согласно одному варианту реализации, если классификация метилирования указывает на раковое заболевание в организме, может быть идентифицирован тип ракового заболевания, связанного с указанным организмом, путем сравнения уровня метилирования (например, первого уровня метилирования согласно способу 2800, или уровня метилирования любой области) с соответствующим значением, определенным для других организмов (т.е. других организмов того же типа, например, человека). Указанное соответствующие значение может относиться к той же области или набору сайтов, для которой(ого) рассчитывали уровень метилирования. По меньшей мере у двух из указанных других организмов идентифицировано наличие других типов раковых заболеваний. Например, соответствующие значения могут быть организованы в кластеры, при этом два кластера связаны с разными типами рака.
Далее, если CNA и метилирование используют совместно для получения третьей классификации уровня рака, признаки CNA и метилирования могут сравниваться с соответствующими значениями для других организмов. Например, первое количество областей (например, на фиг. 36), где наблюдается делеция или амплификация, может сравниваться с соответствующими значениями, определенными для других организмов, для идентификации типа ракового заболевания, связанного с указанным организмом.
Согласно некоторым вариантам реализации признаки метилирования представлены уровнями метилирования областей из множества областей генома. Могут использоваться области, которые, как было определено, имеют уровень метилирования областей, превышающий соответствующее предельное значение для области, например, уровни метилирования области указанного организма могут сравниваться с уровнями метилирования тех же областей генома у других организмов. Указанное сравнение может позволить дифференцировать типы рака, или просто обеспечить дополнительный фильтр для подтверждения наличия ракового заболевания (например, для идентификации ложноположительных результатов). Соответственно на основании указанного сравнения можно определить, имеется ли в организме раковое заболевание первого типа, отсутствует ли раковое заболевание или имеется раковое заболевание второго типа.
Другие организмы (наряду с тестируемым) могут быть кластеризованы с применением уровней метилирования области. Соответственно, сравнение уровней метилирования области может применяться для определения того, к какому кластеру принадлежит организм. При разбиении на кластеры могут также использоваться нормированные значения CNA для областей, для которых было определено присутствие делеции или амплификации, согласно описанию выше. Также при разбиении на кластеры могут использоваться соответствующие плотности метилирования гиперметилированных CpG-островков.
Чтобы проиллюстрировать принцип, на котором основан указанный способ, авторы настоящего изобретения приводят пример применения логистической регрессии для классификации двух неизвестных образцов. Целью указанной классификации было определение того, относятся ли указанные два образца к ГЦК или не являющемуся ГЦК раковому заболеванию. Был составлен обучающий набор образцов, включавший 23 образца плазмы, полученных от пациентов с ГЦК, и 18 образцов от пациентов, страдающих отличным от ГЦК раковым заболеванием. Таким образом, всего в обучающий набор входило 41 случая. В указанном примере выбирали 13 признаков, включая пять признаков метилирования CpGостровков (Х1-Х5), шесть признаков метилирования областей размером 1 Мб (Х6-Х11) и 2 признаков CNA для областей размером 1 Мб (Х12-Х13). Признаки метилирования CpG выбирали на основе критерия наличия Z-показателя >3 или <-3 по меньшей мере в 15 случаях из обучающего набора. Признаки метилирования областей размером 1 Мб выбирали на основе критерия наличия Z-показателя >3 или <-3
- 66 042157 по меньшей мере в 39 случаях из обучающего набора. Признаки CNA выбирали на основе критерия наличия Z-показателя >3 или <-3 по меньшей мере в 20 случаях. Логистический регрессионный анализ осуществляли на образцах указанного обучающего набора для определения коэффициента регрессии для каждого из признаков (Х1-Х13). Признаки с коэффициентами регрессии большей величины (независимо от того, в положительном или в отрицательном смысле) позволяют лучше дифференцировать образцы ГЦК и образцы, не относящиеся к ГЦК. Z-показатели для соответствующих признаков в каждом случае использовали в качестве входных значений независимых переменных. Затем исследовали по 13 признакам два образца плазмы, один от пациента с ГЦК (TBR36) и один от пациента, страдающего раком легкого (TBR177).
В данном анализе для классификации типа рака предполагалось, что указанные два образца получены от пациентов, страдающих раковыми заболеваниями неизвестного происхождения. Для каждого образца Z-показатели соответствующего признака подставляли в уравнение логистической регрессии для определения натурального логарифма отношения шансов (In(отношение шансов)), где указанное отношение шансов представляет отношение вероятностей наличия ГЦК и отсутствия ГЦК (ГЦК/не-ГЦК).
В табл. 7 приведены коэффициенты регрессии уравнения логистической регрессии для 13 признаков. Также приведены Z-показатели соответствующих признаков для двух тестируемых случаев (TBR36 и TBR177). Логарифм 1п(отношение шансов) ГЦК для TBR36 и TBR177 составлял 37,03 и -4,7, соответственно. Рассчитанная по указанным отношениям шансов вероятность того, что образцы плазмы получены от пациентов с ГЦК, составляла >99,9% и 1%, соответственно. Вкратце, существовала высокая вероятность того, что TBR36 представляет собой образец от пациента с ГЦК, и низкая вероятность того, что TBR177 представляет собой образец от пациента с ГЦК.
Таблица 7
Признак Коэффициент регрессии Z-показатель соответствующего признака
TBR36 TBR177
XI -2,9575 14,8 0
Х2 2,2534 21,3 0
хз -1,5099 6,1 0
Х4 -0,236 34,0 0
Х5 0,7426 17,3 0
Х6 -0,6682 -26,3 -1,5
Х7 -0,2828 -13,9 -2,6
Х8 -0,7281 -9,4 -4,4
Х9 1,0581 -7,8 -3,7
Х10 0,3877 -20,8 -4,3
XII 0,3534 -15,5 -3,1
Х12 -1,1826 4,8 3,3
Х13 -0,3805 -11,7 -1,4
1п(отношение шансов) 37,03 -4,37463
Согласно другим вариантам реализации для определения вероятного первичного происхождения ракового заболевания может применяться иерархическая кластерная регрессия, анализ с применением деревьев классификации и другие регрессионные модели.
XII. Материалы и методы
А. Получение библиотек обработанной бисульфитом ДНК и секвенирование.
Геномную ДНК (5 мкг) с добавлением 0,5% (w/w) неметилированной лямбда-ДНК (Promega) фрагментировали с помощью системы Covaris S220 (Covaris) на фрагменты длиной приблизительно 200 п.о. Библиотеки ДНК получали с применением набора для подготовки образцов для секвенирования спаренных концов (Paired-End Sequencing Sample Preparation Kit, Illumina) в соответствии с инструкциями производителя, за исключением того, что во фрагменты ДНК лигировали метилированные адаптеры (Illumina). После двух раундов очищения с применением магнитных гранул AMPure XP (Beckman Coulter) продукты лигирования расщепляли на 2 фрагмента, один из которых подвергали 2 раундам бисульфитной модификации с применением набора EpiTect Bisulfite Kit (Qiagen). Неметилированные цитозины в CpG-сайтах вставок превращались в урацилы, тогда как метилированные цитозины сохранялись в неизмененном виде. Молекулы ДНК с лигированными адаптерами, обработанные или необработанные бисульфитом натрия, обогащали путем проведения 10 циклов ПЦР с применением следующего состава: 2,5U ДНК-полимеразы PfuTurboCx Hotstart (Agilent Technologies), 1X реакционного буфера PfuTurboCx, 25 мкМ дНТФ, 1 мкл ПЦР-праймера РЕ 1.0 и 1 мкл ПЦР-праймера РЕ 2.0 (Illumina) в реакционном объеме 50 мкл. Использовали следующий профиль термоциклирования: 95°С в течение 2 минут, 98°С в течение 30 с, затем 10 циклов при 98°С в течение 15 с, 60°С в течение 30 с и 72°С в течение 4 минут, с финальным этапом при 72°С в течение 10 минут (R Lister, et al. 2009 Nature; 462: 315-322). Продукты ПЦР очищали с применением магнитных гранул AMPure XP.
- 67 042157
В ДНК плазмы, экстрагированной из 3,2-4 мл образцов материнской плазмы, добавляли калибровочную фрагментированную лямбда-ДНК (25 пг на мл плазмы) и конструировали библиотеку согласно приведенному выше описанию (RWK Chiu et al. 2011 BMJ; 342: c7401). После лигирования метилированных адаптеров продукты лигирования расщепляли на 2 половины и часть обрабатывали в 2 раундах бисульфитной модификации. Обработанные бисульфитом или необработанные продукты лигирования затем обогащали путем проведения 10 циклов ПЦР согласно приведенному выше описанию.
Библиотеки обработанной или необработанной бисульфитом ДНК секвенировали по 75 п.о. в формате спаренных концов в применением инструментов HiSeq2000 (Illumina).
Кластеры ДНК получали с применением набора Paired-End Cluster Generation Kit v3 с помощью инструмента cBot (Illumina). Анализ изображений в режиме реального времени и распознавание оснований проводили с применением управляющего программного обеспечения HiSeq Control Software (HCS) v1.4 и программного обеспечения анализа в реальном времени Real Time Analysis (RTA) Software v1.13 (Illumina), с помощью которого проводили автоматизированный расчет матриц и фазирование на основе калибровочного контроля PhiX v3, секвенируемого с библиотеками ДНК.
В. Выравнивание последовательностей и идентификация метилированных цитозинов.
После распознавания оснований, адаптерные последовательности и основания низкого качества (т.е. с показателем качества< 20) на концах фрагментов удаляли. Обрезанные риды в формате FASTQ затем обрабатывали с применением системы анализа данных метилирования, называемой Methy-Pipe (P Jiang, et al. Methy-Pipe: An integrated bioinformatics data analysis pipeline for whole genome methylome analysis (Methy-Pipe: комплексная система анализа данных биоинформатики для полногеномного анализа метилома), доклад представлен на Международной практической конференции по биоинформатике и биомедицине Международного института инженеров электротехники и электроники (IEEE International Conference on Bioinformatics and Biomedicine Workshops), Гонконг, 18-21 декабря 2010 г.). Для выравнивания конвертированных бисульфитом ридов секвенирования авторы настоящего изобретения сначала конвертировали все остатки цитозина в тимины in silico, на цепях Уотсона-Крика по отдельности, с использованием референсного генома человека (версия NCBI 36/hg18). Затем авторы настоящего изобретения конвертировали каждый цитозин в тимин in silico во всех обработанных ридах и сохраняли информацию о расположении каждого конвертированного остатка. SOAP2 (R Li, et al. 2009 Bioinformatics; 25: 1966-1967) использовали для выравнивания конвертированных ридов по двум предварительно конвертированным референсным геномам человека, максимум с двумя несовпадениями для каждого выравниваемого рида. Выбирали только риды, картирующиеся с уникальной геномной локализацией. Неоднозначные риды, картирующиеся на обе цепи Уотсона-Крика и дублирующиеся (клональные) риды с одинаковыми стартовыми и конечными положениями в геноме удаляли. Риды секвенирования с размером вставок <600 п.о. сохраняли для анализа метилирования и размеров.
Остатки цитозина в контексте динуклеотидов CpG были основной мишенью последующих исследований метилирования ДНК. После выравнивания цитозины, исходно присутствовавшие на ридах секвенирования, восстанавливали на основании информации о расположении, сохраненной при конверсии in silico. Восстановленные цитозины в динуклеотидах CpG подсчитывали как метилированные. Тимины в динуклеотидах CpG подсчитьшали как неметилированные. Неметилированная лямбда-ДНК, включенная при подготовке библиотеки, использовалась в качестве внутреннего контроля для оценки эффективности модификации бисульфитом натрия. Все цитозины на лямбда-ДНК должны были быть конвертированы в тимины при эффективности бисульфитной конверсии, составляющей 100%.
XIII. Выводы
Применение описанных в настоящем документе вариантов реализации позволяет проводить скрининг, детекцию, мониторинг или прогнозирование ракового заболевания неинвазивным образом с применением, например, плазмы субъекта. Возможно также осуществление пренатального скрининга, получение диагноза, исследование или мониторинг плода путем установления профиля метилирования плодной ДНК по материнской плазме. Для иллюстрации эффективности указанного способа авторы настоящего изобретения показали, что информация, которую обычно получали путем исследования плацентарных тканей, может быть определена непосредственно по материнской плазме. Например, удалось определить импринтинговый статус генных локусов, идентифицировать локусы с дифференциальным метилированием в плодной и материнской ДНК и оценить гестационные вариации профиля метилирования генных локусов посредством прямого анализа ДНК материнской плазмы. Важным преимуществом предложенного авторами изобретения способа является то, что плодный метилом может комплексно оцениваться во время беременности без ущерба для беременности или без необходимости инвазивного отбора образцов плодных тканей. С учетом известных связей между измененным статусом метилирования ДНК и многими связанными с беременностью состояниями, описанный в указанном исследовании способ может быть ценным инструментом для исследования патофизиологии и идентификации биомаркеров таких состояний. Сфокусировавшись на импринтинговых локусах, авторы настоящего изобретения показали, что как передаваемые от отца, так и передаваемые от матери плодные профили метилирования могут оцениваться по материнской плазме. Указанный способ потенциально может подходить для исследования импринтинговых заболеваний. Варианты реализации также могут применяться непосредственно для
- 68 042157 пренатальной оценки заболеваний плода или связанных с беременностью заболеваний.
Авторы настоящего изобретения также продемонстрировали, что для исследования профиля метилирования ДНК плацентарных тканей может применяться полногеномное бисульфитное секвенирование. В геноме человека содержится приблизительно 28М CpG-сайтов (С Clark et al. 2012 PLoS One; 7: e50233). Полученные авторами изобретения данные бисульфитного секвенирования для CVS и образца ткани зрелой плаценты захватывали более чем 80% CpG, что представляет по существу более широкое покрытие, чем обеспечиваемое с применением других высокопроизводительных платформ. Например, набор Illumina Infinium HumanMethylation 27K BeadChip Array, который использовали в предыдущем исследовании на плацентарных тканях (Т Chu et al. 2011 PLoS One; 6: el4723), захватывал только 0,1% CpG в геноме. Набор Illumina Infinium HumanMethylation 450K BeadChip, появившийся недавно, захватывал только 1,7% CpG (С Clark et al. 2012 PLoS One; 7: e50233). Поскольку при методе МПС отсутствуют ограничения в отношении конструкции зондов, эффективности гибридизации или эффективности захвата антител, могут оцениваться CpG в составе CpG-островков и за их пределами, в контексте большинства последовательностей.
XIV. Компьютерная система
В любых компьютерных системах, упомянутых в данном изобретении, может применяться любое подходящее количество подсистем. Примеры таких подсистем показаны на фиг. 33 в компьютерном устройстве 3300. Согласно некоторым вариантам реализации компьютерная система включает отдельное компьютерное устройство, где подсистемы могут представлять собой компоненты указанного компьютерного устройства. Согласно другим вариантам реализации компьютерная система может включать несколько компьютерных устройств, каждое из которых представляет собой подсистему, с внутренними компонентами.
Подсистемы, показанные на фиг. 33, взаимосвязаны посредством системной шины 3375. Показаны дополнительные подсистемы, такие как принтер 3374, клавиатура 3378, устройство(а) хранения 3379, монитор 3376, который соединен с видеоадаптером 3382, и другие. Периферические устройства и устройства ввода/вывода (I/O), которые соединены с контроллером ввода/вывода 3371, можно подсоединить к компьютерной системе с применением любого числа известных в данной области техники способов, таких как порт последовательного ввода-вывода 3377. Например, порт последовательного ввода-вывода 3377 или внешний интерфейс 3381 (например, Ethernet, Wi-Fi и т.д.) можно применять для подсоединения компьютерной системы 3300 к глобальной компьютерной сети, такой как Интернет, к устройству ввода мышь или к сканеру. Взаимосвязь посредством системной шины 3375 позволяет центральному процессору 3373 обмениваться данными с каждой подсистемой и контролировать выполнение инструкций от системной памяти 3372 или устройств(а) хранения 3379 (например, жесткого диска), а также обмениваться информацией между подсистемами. Системная память 3372 и/или устройство(а) хранения
3379 может включать в себя машиночитаемый носитель. Любые значения, упомянутые в настоящем документе, могут передаваться от одного компонента к другому компоненту и могут выводиться для предоставления пользователю.
Компьютерная система может включать множество одинаковых компонентов или подсистем, например, соединенных друг с другом через внешний интерфейс 3381 или через внутренний интерфейс. Согласно некоторым вариантам реализации компьютерные системы, подсистемы или устройства могут обмениваться информацией через сеть. В таких случаях один компьютер можно считать клиентом, а другой компьютер - сервером, при этом каждый из указанных компьютеров может представлять собой часть одной и той же компьютерной системы. Как клиент, так и сервер может включать несколько систем, подсистем или компонентов.
Следует понимать, что любой из вариантов реализации настоящего изобретения можно осуществить в виде логических схем устройства управления с применением аппаратного обеспечения (например, специализированной интегральной микросхемы или программируемой пользователем вентильной матрицы) и/или с применением компьютерного программного обеспечения, с программируемым в широком смысле процессором в модульной или интегральной форме. В настоящем документе процессор включает многоядерный процессор на одном и том же интегральном чипе или несколько обрабатывающих модулей, расположенных на одной печатной плате или объединенных в сеть. На основании настоящего описания и идей, предложенных в настоящем документе, среднему специалисту в данной области техники будут очевидны и понятны другие пути и/или способы осуществления вариантов реализации настоящего изобретения с применением аппаратного обеспечения и комбинаций аппаратного обеспечения с программным обеспечением.
Любые компоненты или функции программного обеспечения, описанные в настоящем изобретении, можно осуществить в виде программного кода, который выполнит процессор, с применением любого подходящего языка программирования, такого как, например, Java, C++ или Perl, с использованием, например, обычных или объектно-ориентированных методик. Программный код можно хранить в виде ряда инструкций или команд на машиночитаемом носителе для хранения и/или передачи, подходящие носители включают оперативное запоминающее устройство (RAM), постоянное запоминающее устройство (ROM), магнитный носитель, такой как жесткий диск или дискету, или оптический носитель, такой
- 69 042157 как компакт-диск (CD) или DVD (универсальный цифровой диск), флеш-память и т.п. Машиночитаемые носители могут представлять собой любую комбинацию таких устройств хранения или передачи.
Такие программы также могут кодироваться и передаваться с помощью несущих сигналов, предназначенных для передачи через проводные, оптические и/или беспроводные сети, соответствующих множеству протоколов, включая Интернет. Таким образом, машиночитаемые носители согласно варианту реализации настоящего изобретения можно получить, применяя информационный сигнал, кодируемый такими программами. Машиночитаемые носители, кодированные с помощью программного кода, могут быть упакованы вместе с совместимым устройством или предоставлены отдельно от других устройств (например, посредством загрузки через Интернет). Любой такой машиночитаемый носитель может храниться на/в едином компьютерном программном продукте (например, на жестком диске, CD-диске или в составе всей компьютерной системы), и может присутствовать в составе различных программных продуктов или на различных программных продуктах внутри системы или сети. Компьютерная система может включать монитор, принтер или другое подходящее устройство отображения для предоставления пользователю любого из результатов, упомянутых в данном изобретении.
Любой из способов, описанных в данном изобретении, можно полностью или частично осуществить с помощью компьютерной системы, включающей один или большее количество процессоров, которые можно сконфигурировать для осуществления указанных этапов. Таким образом, варианты реализации могут быть направлены на компьютерные системы, сконфигурированные для осуществления этапов любого из способов, описанных в данном изобретении, возможно с различными компонентами, осуществляющими соответствующие этапы или соответствующую группу этапов. Хотя этапы согласно описанным в настоящем документе способам и были представлены в пронумерованном виде, указанные этапы могут осуществляться одновременно или в другом порядке. Кроме того, блоки данных этапов можно применять с блоками других этапов из других способов. Также весь этап или блоки этапа могут быть необязательными. Кроме того, любой из этапов любого из способов можно осуществить с помощью модулей, схем или других средств для осуществления указанных этапов.
Специфические детали конкретных вариантов реализации могут быть скомбинированы любым подходящим способом без отступления от сущности и объема вариантов реализации настоящего изобретения. Тем не менее, другие варианты реализации настоящего изобретения могут быть направлены на конкретные варианты реализации, относящиеся к каждому отдельному аспекту, или на конкретные комбинации указанных отдельных аспектов.
Предшествующее описание примеров вариантов реализации настоящего изобретения представлено с целью иллюстрации и описания. Не предполагается, что оно является исчерпывающим или ограничивает настоящее изобретение точно описанной формой; возможны многие модификации и вариации в свете описанных выше идей. Варианты реализации были выбраны и описаны для того, чтобы наилучшим образом объяснить принципы настоящего изобретения и его практического применения, с тем, чтобы дать возможность другим специалистам в данной области техники наилучшим образом применять настоящее изобретение в различных вариантах реализации и с различными модификациями, подходящими для конкретного предполагаемого применения.
Предполагается, что применение формы единственного числа, в том числе в сочетании с определением указанный(указанная/указанное), означает один или большее количество, если явным образом не указано иное.
Все патенты, заявки на патент, публикации и описания патентов, упомянутые в настоящем документе, полностью включены посредством ссылки во всех отношениях. Ни один из данных источников не считают известным уровнем техники.
- 70 042157
Таблица S2A
Перечень 100 наиболее гиперметилированных областей, идентифицированных в образце ворсин хориона и клетках крови матери в первом триместре
Хромосома Начало Конец Размер (п.о.) Клетки крови матери CVS Рзначения Различие метилирования
chrl3 113063600 113064100 500 0,009 0,9 3,67Е-15 0,891
chr6 36279700 36280200 500 0,0068 0,8957 2,39Е-22 0,8889
chrl6 66876000 66876500 500 0,0327 0,9211 3,82Е-21 0,8884
chrlO 163500 164000 500 0,0195 0,9034 3,60Е-35 0,8839
chr9 3518300 3518800 500 0,0263 0,9045 1,32Е-26 0,8782
chrl2 31877100 31877600 500 0,007 0,8784 3,08Е-22 0,8714
chr22 37477400 37478400 1000 0,0152 0,8848 0,00Е+00 0,8696
chr4 148940500 148941000 500 0,0055 0,8717 4,40Е-29 0,8662
chr5 131836300 131836800 500 0,075 0,9403 1,54Е-10 0,8653
chrl7 26661700 26663600 1900 0,0187 0,875 2,95Е-38 0,8563
chr2 105758600 105759600 1000 0,0305 0,8828 1Д9Е-53 0,8523
chr22 39188800 39189800 1000 0 0,8514 2,05Е-46 0,8514
chr3 153443900 153444900 1000 0,0436 0,8945 5,43Е-34 0,8509
chr6 25149600 25150600 1000 0,0135 0,8632 0,00Е+00 0,8497
chr5 98296800 98297300 500 0,0432 0,8925 4,97Е-23 0,8493
chr7 150679900 150680400 500 0,0496 0,8944 6,50Е-17 0,8448
chr7 107563100 107563600 500 0,0495 0,8895 9,58Е-26 0,84
chr7 37348300 37349300 1000 0,0012 0,8409 0,00Е+00 0,8397
chrl4 58837800 58838300 500 0,0097 0,848 3,35Е-16 0,8383
chr6 119238100 119238600 500 0,0899 0,928 2,38Е-19 0,8381
chrl5 93669900 93670400 500 0,0753 0,913 2,19Е-10 0,8377
chrl7 26669200 26670200 1000 0,0221 0,859 1,44Е-29 0,8369
chr2 88108100 88108600 500 0,075 0,9109 3,55Е-17 0,8359
chrl3 98363800 98364300 500 0,11 0,9457 1,28Е-11 0,8357
chr!6 66948000 66948500 500 0,0331 0,8685 0,00Е+00 0,8354
- 71 042157
chr6 42098000 42098500 500 0,0484 0,8835 3,73E-16 0,8351
chr3 129876000 129876500 500 0,0565 0,8897 8,81E-17 0,8332
chr3 142700300 142700800 500 0,0063 0,8393 2,59E-22 0,833
chr8 145883800 145884300 500 0,0392 0,872 0,00E+00 0,8328
chrlO 8320700 8321200 500 0,0566 0,8871 9,40E-09 0,8305
chr3 120438100 120438600 500 0,102 0,9292 7,09E-16 0,8272
chr3 173792600 173793100 500 0,0182 0,8453 2,84E-39 0,8271
chrl7 40320700 40321200 500 0,0539 0,8788 6,50E-30 0,8249
chrl 5 72076200 72076700 500 0,0299 0,8525 6,48E-10 0,8226
chrl6 29663900 29665400 1500 0,0081 0,8305 0,00E+00 0,8224
chrll 66961100 66962100 1000 0,0489 0,8712 0,00E+00 0,8223
chr9 27083100 27084100 1000 0,097 0,9177 2,37E-55 0,8207
chr9 111249600 111250100 500 0,0613 0,8795 l,99E-20 0,8182
chrl4 101412400 101412900 500 0 0,8167 8,26E-32 0,8167
chrl 242549200 242549700 500 0 0,8155 3,50E-21 0,8155
chr8 38642800 38643300 500 0,0191 0,8346 3,22E-41 0,8155
chr4 85893600 85894100 500 0,0394 0,8533 1,45E-15 0,8139
chr5 142368600 142369100 500 0,0385 0,8523 1Д8Е-18 0,8138
chr8 130969500 130970000 500 0,069 0,8824 2,42E-24 0,8134
chr2 196783900 196784400 500 0 0,8123 3,63E-40 0,8123
chrl 6 49258100 49258600 500 0,0733 0,8851 4,29E-18 0,8118
chrl 232601200 232601700 500 0,0594 0,8707 1,73E-13 0,8113
chrl 109039500 109040000 500 0,0366 0,8471 l,07E-ll 0,8105
chrl 7 59491300 59491800 500 0,0662 0,8758 2Д5Е-17 0,8096
chr21 42194100 42194600 500 0,11 0,9182 1,61E-12 0,8082
chr9 116174500 116175500 1000 0,0062 0,8132 l,98E-60 0,807
chrl 5 73429200 73429700 500 0 0,8066 9,81E-33 0,8066
chr6 157462800 157463300 500 0,0758 0,8819 7,94E-16 0,8061
chr3 16858500 16859500 1000 0,0021 0,8068 4,76E-68 0,8047
chr9 96662800 96663300 500 0,0614 0,8651 6,79E-28 0,8037
chr9 88143000 88143500 500 0,1538 0,9559 7,43E-09 0,8021
chrl 9 16090000 16091000 1000 0,0899 0,8904 l,60E-53 0,8005
chrl 5 29436300 29437300 1000 0,0553 0,8556 1Д8Е-80 0,8003
chrll 77816100 77816600 500 0,1069 0,9068 2,31E-17 0,7999
chrlO 30346800 30347300 500 0,1212 0,9211 7,48E-07 0,7999
chrl 89510300 89511300 1000 0,0203 0,8191 3,53E-77 0,7988
chr3 125986100 125986600 500 0,1686 0,9674 5,24E-22 0,7988
chrl9 60162800 60163300 500 0,0127 0,8113 9,99E-19 0,7986
chrl 6 73655900 73656900 1000 0,082 0,8806 4,48E-41 0,7986
chrl 6 30104300 30105800 1500 0,0298 0,8282 0,00E+00 0,7984
chrlO 118642400 118642900 500 0,0588 0,8571 8,63E-11 0,7983
chrl 6 4495000 4496000 1000 0,0632 0,8615 2,27E-44 0,7983
chrl 2048300 2048800 500 0,0309 0,8289 1Д9Е-80 0,798
chr2 136481800 136482800 1000 0,0554 0,8533 8,50E-48 0,7979
chrlO 29959200 '29959700 500 0,1429 0,94 2,60E-08 0,7971
chr6 139642400 139642900 500 0,0618 0,8585 2Д6Е-29 0,7967
chrl4 69825300 69825800 500 0,0654 0,8615 6,85E-14 0,7961
chr8 49739700 49740200 500 0,0324 0,828 2,88E-30 0,7956
chrl 7 42205700 42206200 500 0,057 0,852 2Д1Е-30 0,795
chr4 77445300 77445800 500 0,0442 0,8377 l,79E-35 0,7935
- 72 042157
chrl 7 53762700 53766300 3600 0,0003 0,7926 0,00E+00 0,7923
chrl 7 44269900 44270400 500 0,026 0,8182 3,49E-21 0,7922
chr6 42462700 42463200 500 0,0761 0,8678 4,74E-22 0,7917
chr2 23396200 23396700 500 0,0333 0,8235 1,25E-14 0,7902
chr9 100921100 100921600 500 0,0244 0,814 3,32E-21 0,7896
chr7 74016100 74016600 500 0,1442 0,9333 6,74E-10 0,7891
chr6 157879000 157879500 500 0,133 0,9219 6,36E-17 0,7889
chr3 3189400 3190400 1000 0,0693 0,8571 l,38E-24 0,7878
chrl6 29581500 29584500 3000 0,0081 0,7956 0,00E+00 0,7875
chrl 7 42201800 42202800 1000 0,0884 0,8751 0,00E+00 0,7867
chrll 94257000 94257500 500 0,1122 0,8986 4,29E-10 0,7864
chrlO 14741600 14742100 500 0,0139 0,8 l,73E-20 0,7861
chr21 33826900 33827400 500 0,0879 0,8739 2,81E-11 0,786
chr4 130057200 130057700 500 0,0893 0,875 1,76E-13 0,7857
chr21 35343400 35343900 500 0 0,7853 7,43E-18 0,7853
chrl2 105372800 105373300 500 0,0923 0,8767 8,67E-22 0,7844
chr5 10799800 10800300 500 0,1429 0,9263 8,2 IE-17 0,7834
chr5 16753100 16753600 500 0,041 0,8241 l,40E-15 0,7831
chr3 135746000 135746500 500 0,1429 0,9259 2,86E-09 0,783
chr6 53708300 53708800 500 0,0412 0,8235 2,74E-31 0,7823
chr2 128122900 128123400 500 0,0634 0,8455 4,82E-21 0,7821
chr5 150574200 150574700 500 0,0876 0,8696 l,56E-20 0,782
chrl6 84326000 84327000 1000 0,1071 0,8891 3,58E-61 0,782
chrl 26744500 26745500 1000 0,0336 0,8152 0,00E+00 0,7816
chr2 234882000 234882500 500 0,0392 0,819 7,63E-14 0,7798
Таблица S2B
Перечень 100 наиболее гипометилированных областей, идентифицированных в образце ворсин хориона и клетках крови матери в первом триместре
Хромосома Начало Конец Размер (п.о.) Клетки крови матери CVS Рзначения Различие метилирования
chrl 8 12217500 12218500 1000 0,9873 0 3,05Е-25 0,9873
chrl 7 22885400 22885900 500 0,9714 0,0161 8,92Е-12 0,9553
chr3 184827100 184827600 500 0,9875 0,033 4,79Е-16 0,9545
chr5 148968300 148968800 500 0,98 0,0426 6,70Е-09 0,9374
chrlO 104794500 104795000 500 0,973 0,0385 9,ЗЗЕ-10 0,9345
chr4 84977900 84978400 500 0,9643 0,0417 2,98Е-08 0,9226
chr3 180395300 180395800 500 0,9877 0,0667 6,72Е-08 0,921
chr2 138908300 138908800 500 0,939 0,0208 Ι,ΙΟΕ-16 0,9182
chr6 139873100 139873600 500 0,9667 0,0526 1,29Е-07 0,914
chr8 59604700 59605200 500 0,9468 0,033 2,88Е-14 0,9138
chr6 167622300 167622800 500 0,9452 0,0316 3,86Е-14 0,9136 .
chr3 175701300 175701800 500 0,9846 0,0735 7,43Е-10 0,9111
chrl3 59246400 59246900 500 0,9402 0,0313 2,31Е-11 0,9089
chrl2 71263600 71264100 500 0,9296 0,0213 1,08Е-08 0,9083
chr5 39459400 39459900 500 0,9219 0,014 5,01Е-22 0,9079
chrl 7 24904700 24905200 500 0,9161 0,0092 5,04Е-35 0,9069
chrl 2 31889900 31890400 500 0,9524 0,0465 6,78Е-13 0,9059
chr3 152897800 152898300 500 0,9402 0,0345 1,70Е-17 0,9057
chrl 40378700 40379200 500 0,9565 0,0526 3,31Е-09 0,9039
- 73 042157
chrl2 43979300 43979800 500 0,952 0,05 6,68E-13 0,902
chrl 8 1395900 1397400 1500 0,9308 0,0293 0,00E+00 0,9015
chrl 223482900 223483400 500 0,9579 0,0575 3,36E-24 0,9004
chr9 130357000 130357500 500 0,9282 0,0286 9Д9Е-13 0,8996
chr3 72878300 72878800 500 0,9612 0,0625 8,20E-14 0,8987
chr7 84347200 84348700 1500 0,9401 0,0418 0,00E+00 0,8983
chrl 5 37317500 37318000 500 0,9358 0,0385 7,58E-14 0,8973
chr8 42528600 42529100 500 0,9302 0,0337 1,73E-14 0,8965
chr6 134914000 134914500 500 0,9037 0,0076 4,84E-21 0,8961
chrl3 56207100 56208100 1000 0,9184 0,0245 0,00E+00 0,894
chr2 209074000 209074500 500 0,9309 0,037 6ДЗЕ-27 0,8938
chrl2 74021100 74022100 1000 0,9513 0,058 0,00E+00 0,8933
chr4 118939300 118939800 500 0,9192 0,0276 6,58E-27 0,8916
chr5 12626600 12628600 2000 0,9266 0,0355 0,00E+00 0,8911
chr5 105517300 105518300 1000 0,927 0,0359 0,00E+00 0,891
chrl2 70056300 70057300 1000 0,9488 0,0609 0,00E+00 0,888
chr6 153238200 153239200 1000 0,9123 0,0244 0,00E+00 0,8879
chrl 7 60374800 60375300 500 0,9655 0,0777 3,64E-14 0,8878
chrl4 68272700 68273200 500 0,9389 0,0523 l,23E-22 0,8866
chrl 9 54533800 54534800 1000 0,9117 0,0262 0,00E+00 0,8855
chrl2 15392200 15393200 1000 0,9307 0,0457 0,00E+00 0,885
chrl 212517400 212517900 500 0,9266 0,0417 9,81E-12 0,8849
chrlO 49344400 49345400 1000 0,9422 0,0579 0,00E+00 0,8844
chr3 47410400 47410900 500 0,9213 0,0381 5,59E-16 0,8832
chr3 879500 880000 500 0,9455 0,0625 8,06E-06 0,883
chr2 31572400 31573400 1000 0,9176 0,0357 0,00E+00 0,8819
chrl 89131200 89131700 500 0,9314 0,0498 5Д5Е-70 0,8816
chr8 94832000 94832500 500 0,9156 0,0351 2Д6Е-65 0,8805
chr7 14008300 14009800 1500 0,9349 0,0545 0,00E+00 0,8804
chrl2 12971300 12972300 1000 0,9361 0,0559 0,00E+00 0,8802
chr5 43114700 43115200 500 0,9638 0,0842 1,79E-13 0,8796
chrll 107872400 107872900 500 0,9472 0,0677 2,31E-32 0,8794
chr8 49757600 49758100 500 0,9048 0,0269 ЗД5Е-52 0,8779
chrl3 33106400 33106900 500 0,9384 0,0606 9,54E-15 0,8778
chr3 190658800 190659300 500 0,9388 0,0617 2,71E-22 0,877
chrl 181508000 181508500 500 0,9259 0,0495 3,78E-15 0,8764
chrl 180436900 180437400 500 0,9412 0,0652 2,36E-13 0,876
chr6 122642800 122643800 1000 0,9218 0,0458 0,00E+00 0,8759
chr5 166429300 166429800 500 0,9551 0,08 5,26E-05 0,8751
chrl 2 14972900 14973400 500 0,9483 0,0733 2Д0Е-18 0,8749
chr5 123933900 123934400 500 0,943 0,0683 1Д2Е-39 0,8746
chr2 15969400 15970400 1000 0,8939 0,0196 9,43E-46 0,8743
chr3 167635200 167636200 1000 0,9363 0,0625 9,03E-41 0,8738
chr5 159442700 159443200 500 0,9174 0,044 6,27E-14 0,8734
chr4 48027200 48027700 ‘500 0,9839 0,1111 8,89E-06 0,8728
chr6 140071500 140072000 500 0,9234 0,0506 4,39E-33 0,8728
chrlO 22356300 22356800 500 0,9548 0,0822 l,04E-18 0,8726
chr8 61007300 61007800 500 0,9197 0,0476 1,24E-15 0,8721
chrll 95463500 95464000 500 0,9348 0,0629 1Д6Е-20 0,8718
chr2 216399800 216400300 500 0,938 0,0667 5,98E-06 0,8713
- 74 042157
chrl 8 57359700 57360200 500 0,9293 0,0584 1,77E-19 0,871
chr3 102734400 102734900 500 0,8917 0,0207 7,94E-22 0,871
chrl 173605700 173606200 500 0,96 0,0891 5,46E-13 0,8709
chr2 86993700 86995700 2000 0,8965 0,0261 0,00E+00 0,8704
chr3 162621100 162621600 500 0,9226 0,0526 7,89E-38 0,8699
chrl2 10144800 10145300 500 0,929 0,0598 3,45E-17 0,8691
chr3 113855100 113855600 500 0,9667 0,0982 3,97E-14 0,8685
chr2 156958200 156959200 1000 0,9252 0,0571 8,89E-50 0,8681
chr2 55775000 55776000 1000 0,9159 0,0483 0,00E+00 0,8676
chr6 124898400 124898900 500 0,8987 0,0313 1,91E-15 0,8675
chr5 42003700 42004700 1000 0,9262 0,0588 0,00E+00 0,8674
chr3 24162200 24162700 500 0,883 0,0161 l,75E-27 0,8668
chr6 35394000 35395000 1000 0,9204 0,0539 0,00E+00 0,8665
chrl 7 8451800 8453300 1500 0,9376 0,0714 0,00E+00 0,8662
chrl4 53487700 53488700 1000 0,9013 0,0353 0,00E+00 0,866
chr7 98572800 98573300 500 0,9651 0,0995 8,37E-26 0,8656
chr6 52298700 52299200 500 0,9427 0,0772 l,31E-28 0,8655
chr6 159047900 159048400 500 0,908 0,0426 3,34E-08 0,8655
chrl4 22152600 22153100 500 0,9085 0,0435 4,43E-17 0,865
chrl2 103285000 103285500 500 0,9321 0,0674 0,00E+00 0,8647
chr7 43302200 43302700 500 0,968 0,1037 6,40E-16 0,8643
chrl4 22247400 22247900 500 0,9804 0,1163 3,83E-06 0,8641
chr2 66780900 66781400 500 0,9355 0,0714 8,37E-09 0,8641
chrl2 97393000 97393500 500 0,9045 0,0408 3,46E-21 0,8637
chr5 162797900 162798900 1000 0,9271 0,0635 l,75E-57 0,8636
chr2 83598400 83599400 1000 0,9354 0,0719 0,00E+00 0,8635
chrll 111358800 111359300 500 0,9156 0,0523 4,15E-24 0,8632
chrll 104891100 104892600 1500 0,9164 0,0533 0,00E+00 0,863
chrl 184583600 184584100 500 0,9647 0,1026 3,02E-13 0,8621
chr5 132350500 132351500 1000 0,9042 0,0426 l,86E-36 0,8616
chr5 53268300 53268800 500 0,972 0,1111 4,76E-16 0,8609
Таблица S2C
Перечень 100 наиболее гиперметилированных областей, идентифицированных в третьем триместре в плацентарной ткани и в клетках крови матери
Хромосома Начало Конец Размер (п.о.) к Зрелая плацента Рзначения Различие метилирования
chr4 78129700 78130200 500 0,0488 0,9747 3,97Е-33 0,926
chr5 131467400 131467900 500 0,0213 0,9275 7Д0Е-27 0,9063
chrl 7 26661700 26663600 1900 0,0187 0,9226 1,79Е-41 0,9039
chr4 148940500 148941000 500 0,0055 0,9079 1,82Е-29 0,9024
chr9 100921100 100921600 500 0,0244 0,9242 1,38Е-25 0,8998
chr6 137114200 137114700 500 0 0,8934 8,87Е-14 0,8934
chr3 173792600 173793100 500 0,0182 0,9091 1,70Е-42 0,8908
chr5 98296800 98297300 500 0,0432 0,9333 2,58Е-23 0,8901
chrl 2 44898000 44898500 500 0 0,8889 4,47Е-11 0,8889
chr3 197328900 197329400 500 0,0169 0,9048 5,55Е-10 0,8878
chr8 49739700 49740200 500 0,0324 0,9194 5,71Е-34 0,887
chrl 2 122279300 122279800 500 0,0135 0,8969 3,46Е-21 0,8834
chrl 7 43092200 43092700 500 0 0,8824 4,34Е-10 0,8824
chr7 107563100 107563600 500 0,0495 0,931 1,05Е-28 0,8815
- 75 042157
chrll 72543200 72543700 500 0,0377 0,9167 2,94E-09 0,8789
chrl4 58837800 58838300 500 0,0097 0,886 9Д6Е-18 0,8763
chr3 153443900 153444900 1000 0,0436 0,9197 6,24E-39 0,876
chr3 16953200 16953700 500 0,0896 0,9655 6,78E-09 0,876
chrl 7 42205700 42206200 500 0,057 0,933 1ДЗЕ-31 0,8759
chr6 53217600 53218100 500 0,0818 0,9571 1,54E-19 0,8754
chr3 112749000 112749500 500 0,0403 0,9154 4Д1Е-22 0,8752
chr8 22453700 22454200 500 0,003 0,8765 l,64E-50 0,8735
chrl 162860900 162861400 500 0,023 0,8932 8,37E-14 0,8702
chr6 36279700 36280200 500 0,0068 0,8762 1Д4Е-21 0,8694
chr5 80962500 80963000 500 0 0,8679 2,08E-15 0,8679
chrl 6 11312500 11313000 500 0 0,8679 2Д4Е-10 0,8679
chrl 6 29663900 29665400 1500 0,0081 0,8759 0,00E+00 0,8678
chr3 120438100 120438600 500 0,102 0,9639 2,98E-15 0,8618
chr8 134157000 134157500 500 0,0625 0,9219 6Д0Е-20 0,8594
chr6 42620900 42621400 500 0 0,8571 5,68E-08 0,8571
chr5 131836300 131836800 500 0,075 0,9315 l,26E-10 0,8565
chrl4 60290000 60290500 500 0 0,8544 5,63E-14 0,8544
chr6 42850300 42851300 1000 0,0676 0,9211 2,38E-24 0,8534
chr8 28974100 28974600 500 0,0394 0,8927 2,03E-51 0,8533
chr22 22368500 22369000 500 0,0248 0,8778 1Д8Е-70 0,8529
chrl4 69825300 69825800 500 0,0654 0,9174 2,73E-14 0,852
chr3 142700300 142700800 500 0,0063 0,8582 2,56E-23 0,8519
chrl 7 59491300 59491800 500 0,0662 0,9175 1,81E-16 0,8513
chrl 5 30881700 30882200 500 0,0493 0,8995 2,38E-26 0,8502
chrl 5 91496300 91496800 500 0 0,85 ЗДЗЕ-17 0,85
chrl 7 18745300 18745800 500 0,0294 0,8775 3,47E-51 0,848
chrl 5 29436500 29437000 500 0,0336 0,8811 2,62E-66 0,8476
chr2 217795300 217795800 500 0 0,8472 l,78E-22 0,8472
chrll 16328100 16328600 500 0,0278 0,875 3,43E-11 0,8472
chrl3 113063500 113064000 500 0,0102 0,8571 1,82E-15 0,8469
chr5 40472400 40472900 500 0,0197 0,8664 7,54E-35 0,8467
chrl 242549200 242549700 500 0 0,8462 8,53E-23 0,8462
chrll 58099100 58099600 500 0,0162 0,8612 4,45E-35 0,845
chr9 16020400 16020900 500 0,0132 0,8555 8,05E-23 0,8423
chr8 37550700 37551200 500 0,0093 0,8512 1Д1Е-16 0,8419
chr5 75722400 75722900 500 0Д215 0,9627 5,97E-23 0,8411
chrl 9 60454700 60455200 500 0,0316 0,8722 2,44E-62 0,8405
chr4 99587100 99587600 500 0,0128 0,8526 1,49E-12 0,8398
chr6 25149600 25150600 1000 0,0135 0,8514 0,00E+00 0,8379
chrl 32065200 32065700 500 0 0,8371 l,09E-44 0,8371
chr7 5337200 5337700 500 0,0727 0,9098 2Д8Е-14 0,8371
chrl7 44269900 44270400 500 0,026 0,8621 3,94E-22 0,8361
chrl 36180800 36181300 500 0,0714 0,9067 l,23E-09 0,8352
chrl 8 10472700 10473700 1000 0,0713 0,9064 9,35E-70 0,8351
chr5 350000 350500 500 0,0297 0,8643 1,49E-16 0,8346
chr2 136481800 136482800 1000 0,0554 0,8887 l,87E-52 0,8332
chr4 89241100 89241600 500 0,1091 0,9423 l,05E-12 0,8332
chrl 7 40320700 40321200 500 0,0539 0,8859 6,94E-31 0,832
chr7 133897200 133897700 500 0,0769 0,9077 l,64E-24 0,8308
chr8 98060600 98061100 500 0,0741 0,9048 ЗД1Е-07 0,8307
- 76 042157
chr8 134141500 134142000 500 0 0,829 2,77E-58 0,829
chrl4 80250600 80251100 500 0,0839 0,9122 2,05E-18 0,8283
chr2 100730900 100731400 500 0,0787 0,9067 4,85E-11 0,828
chr2 88108100 88108600 500 0,075 0,901 2,10E-16 0,826
chrl9 16338500 16339500 1000 0,0011 0,8259 0,00E+00 0,8247
chr5 141791900 141792900 1000 0,0225 0,8467 0,00E+00 0,8243
chrll 116227400 116227900 500 0 0,8242 l,01E-17 0,8242
chr22 48705500 48706000 500 0,0649 0,8891 4,OOE-76 0,8242
chr9 3518300 3518800 500 0,0263 0,8493 6,66E-25 0,823
chrll 16791000 16791500 500 0,1095 0,9322 l,05E-22 0,8228
chr3 135746000 135746500 500 0,1429 0,9651 7,63E-10 0,8223
chrl 19323400 19323900 500 0,0411 0,8624 2,36E-20 0,8213
chr9 96662800 96663300 500 0,0614 0,8826 l,07E-28 0,8212
chr7 37348300 37349300 1000 0,0012 0,821 0,00E+00 0,8198
chr2 234882000 234882500 500 0,0392 0,8591 5,36E-15 0,8198
chr6 44694000 44694500 500 0,1024 0,9222 5,68E-19 0,8198
chrl 7 18320500 18321000 500 0 0,8197 2,78E-39 0,8197
chr22 28992000 28994000 2000 0,0012 0,8195 0,00E+00 0,8183
chrl 7 53762700 53766300 3600 0,0003 0,8179 0,00E+00 0,8176
chrl 114215500 114216000 500 0 0,8169 2,24E-20 0,8169
chr6 13381700 13382700 1000 0,0037 0,8206 l,03E-40 0,8169
chr5 17045400 17045900 500 0,0235 0,84 3,24E-13 0,8165
chrl2 „ 110924300 110924800 500 0,0855 0,9016 l,01E-18 0,816
chrl 200499800 200500300 500 0,011 0,8269 9,73E-24 0,8159
chr4 8311000 8311500 500 0,053 0,8687 7,82E-18 0,8157
chr8 6535300 6535800 500 0,0667 0,8824 5,25E-09 0,8157
chr6 42462700 42463200 500 0,0761 0,8919 5,78E-23 0,8157
chrl 91969900 91970400 500 0,0172 0,8325 5,23E-18 0,8152
chr2 105758600 105759600 1000 0,0305 0,8455 5Д5Е-52 0,815
chr21 37538500 37539000 500 0,1595 0,9745 8,81E-16 0,815
chr9 92953000 92953500 500 0,0189 0,8333 1,88E-15 0,8145
chrl 6 30104400 30105900 1500 0,0505 0,8636 0,00E+00 0,8131
chrl 234184400 234185400 1000 0,0346 0,8477 9,66E-31 0,813
chr8 19116400 19116900 500 0 0,8125 9,33E-11 0,8125
chr4 141194300 141195300 1000 0,0865 0,899 5,46E-30 0,8125
Таблица S2D
Перечень 100 наиболее гипометилированных областей, идентифицированных в третьем триместре в плацентарной ткани и в клетках крови матери
Хромосома Начало Конец Размер (п.о.) Клетки крови матери Зрелая плацента Рзначения Различие метилирования
chr9 40380300 40380800 500 0,9667 0 1,13Е-06 0,9667
chrl 31769200 31769700 500 0,9548 0,0256 5,57Е-25 0,9291
chrl 8 12217600 12218100 500 0,9873 0,0602 1,63Е-19 0,9271
chr20 19704400 19704900 500 0,9426 0,018 4,34Е-18 0,9246
chrl 5 37317500 37318000 500 0,9358 0,0132 1,90Е-25 0,9226
chrX 83368400 83368900 500 0,913 0 3,15Е-07 0,913
chrll 27549100 27549600 500 0,9224 0,0123 3,92Е-24 0,9101
chrl 8 58141500 58142000 500 0,9737 0,0645 1,07Е-09 0,9092
chrl 159897000 159897500 500 0,9067 0 2,53Е-16 0,9067
- 77 042157
chr7 84347200 84348700 1500 0,9401 0,0407 0,00E+00 0,8994
chr2 216916100 216916600 500 0,9695 0,0714 2,13E-16 0,8981
chr7 144200000 144200500 500 0,9294 0,0317 l,24E-10 0,8977
chrl 241331600 241332100 500 0,9198 0,0227 0,00E+00 0,8971
chr7 123190000 123191000 1000 0,9341 0,0384 0,00E+00 0,8957
chr5 12626600 12628600 2000 0,9266 0,0321 0,00E+00 0,8944
chrl2 12971300 12972300 1000 0,9361 0,0438 0,00E+00 0,8923
chr22 20936500 20937000 500 0,9528 0,0606 l,87E-06 0,8922
chrl3 31321900 31322400 500 0,9231 0,0313 l,43E-06 0,8918
chr22 21701500 21702000 500 0,9579 0,0667 l,30E-09 0,8912
chrlO 104794400 104794900 500 1 0,1111 6,10E-09 0,8889
chr7 21835800 21836300 500 0,9156 0,0267 3,85E-13 0,8889
chrlO 16134800 16135300 500 0,95 0,0635 4,79E-10 0,8865
chr3 47410400 47410900 500 0,9213 0,0357 6,63E-17 0,8855
chrlO 49344400 49345400 1000 0,9422 0,0571 0,00E+00 0,8851
chr2 209073900 209074400 500 0,9196 0,0353 l,63E-22 0,8843
chrl 89131200 89131700 500 0,9314 0,0472 l,05E-75 0,8842
chr3 167118500 167119500 1000 0,9365 0,0527 0,00E+00 0,8838
chrl 8 1395900 1397400 1500 0,9308 0,0472 0,00E+00 0,8836
chr2 59670300 59670800 500 0,9433 0,0599 5,09E-23 0,8834
chrl4 28368900 28369400 500 0,9446 0,0619 5,03E-64 0,8827
chr3 126028800 126029300 500 0,9379 0,0556 l,83E-20 0,8823
chr9 69378900 69379900 1000 0,8816 0 6,02E-51 0,8816
chr5 105517300 105518300 1000 0,927 0,0461 0,00E+00 0,8808
chr2 31572400 31573400 1000 0,9176 0,037 0,00E+00 0,8806
chr5 42003700 42004700 1000 0,9262 0,0462 0,00E+00 0,88
chrl4 94718300 94718800 500 0,9548 0,0764 6,67E-19 0,8784
chrl 9 56417800 56418300 500 0,9615 0,0833 l,71E-06 0,8782
chr2 70183000 70183500 500 0,9694 0,0914 9,49E-39 0,878
chr4 118939300 118939800 500 0,9192 0,0412 2,20E-34 0,878
chrl3 59246400 59246900 500 0,9402 0,0633 5,40E-12 0,8769
chrl2 74021100 74022100 1000 0,9513 0,0752 0,00E+00 0,8761
chr2 173432500 173433000 500 0,9529 0,0778 5,39E-12 0,8752
chrl 6 24004400 24004900 500 0,9239 0,0488 3,25E-23 0,8751
chrl3 27596300 27597300 1000 0,9538 0,0795 0,00E+00 0,8743
chrl 5 88904300 88904800 500 0,9212 0,0481 7,69E-27 0,8731
chrl 8 12720200 12721200 1000 0,9346 0,0618 0,00E+00 0,8728
chrl 5 60975900 60976900 1000 0,9311 0,0587 0,00E+00 0,8724
chr21 39630100 39631100 1000 0,9423 0,07 4,68E-43 0,8723
chr5 123933900 123934400 500 0,943 0,0707 2,60E-38 0,8722
chr8 77382600 77383600 1000 0,9117 0,0395 0,00E+00 0,8722
chr21 32238800 32239300 500 0,9396 0,0677 1,28E-18 0,8719
chr5 175019600 175020100 500 0,9542 0,0828 4,34E-20 0,8714
chr8 134437400 134438400 1000 0,9083 0,037 4,79E-29 0,8713
chr5 69668800 69669300 500 0,9194 0,0492 2,88E-09 0,8702
chrl 60877900 60878900 1000 0,9378 0,068 0,00E+00 0,8698
chrl 6 80650400 80650900 500 0,9309 0,0611 2,49E-32 0,8698
chrl 8 59388800 59389300 500 0,9706 0,1008 4,84E-15 0,8697
chr2 15969400 15970400 1000 0,8939 0,0244 3,07E-52 0,8695
chrl3 56207100 56208100 1000 0,9184 0,0505 0,00E+00 0,868
- 78 042157
chr3 180395300 180395800 500 0,9877 0,12 l,73E-09 0,8677
chr6 153238200 153239200 1000 0,9123 0,0452 0,00E+00 0,8671
chrl8 61635100 61635600 500 0,9268 0,06 2,77E-13 0,8668
chr3 177562200 177563200 1000 0,9121 0,0455 0,00E+00 0,8666
chr4 160368300 160370200 1900 0,9272 0,0606 0,00E+00 0,8665
chr6 144626900 144627400 500 0,9114 0,046 2,10E-12 0,8654
chrl6 59885500 59886500 1000 0,9407 0,0757 l,12E-62 0,865
chrl 55667100 55667600 500 0,9095 0,0446 8,62E-39 0,8649
chr2 83598300 83599300 1000 0,9366 0,0718 0,00E+00 0,8648
chr4 105135200 105136200 1000 0,913 0,0486 0,00E+00 0,8644
chr!4 32048400 32048900 500 0,9142 0,0499 5,43E-53 0,8643
chrl 223482700 223483700 1000 0,9636 0,0997 2,69E-34 0,864
chrl4 47487700 47488200 500 0,915 0,0514 5,45E-33 0,8636
chr3 104515000 104515500 500 1 0,1373 l,08E-06 0,8627
chr7 14008300 14009800 1500 0,9349 0,0725 0,00E+00 0,8624
chrl 243134000 243135500 1500 0,9208 0,0588 0,00E+00 0,8619
chrlO 14156400 14156900 500 0,9105 0,0489 0,00E+00 0,8616
chr2 118616200 118617200 1000 0,9178 0,0565 0,00E+00 0,8613
chrl 7 8455500 8456000 500 0,8941 0,0331 1,94E-18 0,8611
chrl2 15392200 15393200 1000 0,9307 0,0697 0,00E+00 0,861
chr8 81275900 81276900 1000 0,9291 0,0684 0,00E+00 0,8606
chrl 234269300 234269800 500 0,9471 0,087 2,25E-25 0,8602
chrl 181970300 181970800 500 0,9167 0,0566 2,15E-08 0,8601
chr2 55775000 55776000 1000 0,9159 0,0559 0,00E+00 0,8599
chr3 88338000 88339000 1000 0,8909 0,0311 0,00E+00 0,8598
chr5 140078700 140079200 500 0,8852 0,0253 0,00E+00 0,8598
chr21 16720900 16721400 500 0,9317 0,0721 1,38E-15 0,8596
chrll 104891100 104892600 1500 0,9164 0,0569 0,00E+00 0,8595
chrl 184204700 184205200 500 0,9194 0,0603 8Д6Е-16 0,859
chr6 160732500 160733000 500 0,9191 0,0606 l,31E-10 0,8585
chr8 37134300 37134800 500 0,9151 0,0567 l,21E-26 0,8584
chrl 8 5869800 5870300 500 0,913 0,0548 l,21E-09 0,8582
chrl 98448100 98448600 500 0,9574 2,08E-05 0,8574
chr3 152897800 152898300 500 0,9402 0,0828 3,28E-18 0,8574
chrl 110304000 110304500 500 0,9783 0,121 2,60E-18 0,8572
chr2 86993600 86995600 2000 0,8965 0,0395 0,00E+00 0,857
chrl 9 15428100 15430600 2500 0,9424 0,0862 0,00E+00 0,8563
chrl3 75176800 75177800 1000 0,9258 0,0697 3,09E-47 0,8561
chrl3 24126700 24127200 500 0,9498 0,0938 1,57E-17 0,856
chrl 6 28238500 28240500 2000 0,9427 0,0868 0,00E+00 0,8559
chr2 158079500 158080500 1000 0,9199 0,0642 0,00E+00 0,8557
Таблица S3A
Перечень первых 100 локусов, определенных как гиперметилированные по данным бисульфитного секвенирования для материнской плазмы в первом триместре
Хромосома Начало Конец Клетки крови матери CVS Различие метилирования
chr22 39189067 39189863 0 0,8444 0,8444
chrl 7 53763065 53764027 0 0,7922 0,7922
chr7 41887694 41888212 0 0,7614 0,7614
- 79 042157
chr2 1Д4Е+08 l,14E+08 0 0,751 0,751
chrl2 25096242 25097206 0 0,7098 0,7098
chrl 66574104 66574793 0 0,7025 0,7025
chr6 11489985 11490755 0 0,7004 0,7004
chr6 l,07E+08 l,07E+08 0 0,6978 0,6978
chrlO 30858286 30858871 0 0,6693 0,6693
chrl7 21131574 21132167 0 0,6496 0,6496
chrl 8 13454740 13455292 0 0,5468 0,5468
chrl 6 11298755 11299326 0 0,5373 0,5373
chr2 1,75E+O8 l,75E+08 0 0,5196 0,5196
chrl9 44060511 44061036 0 0,5128 0,5128
chr6 l,08E+08 l,08E+08 0 0,5 0,5
chr3 71261611 71262501 0 0,4587 0,4587
chr9 36247847 36248885 0 0,447 0,447
chrl 9 17819240 17820082 0 0,4279 0,4279
chrl 7 53769900 53770731 0 0,4102 0,4102
chrl 1Д2Е+08 l,12E+08 0,0002 0,6167 0,6166
chr7 l,34E+08 l,34E+08 0,0003 0,4351 0,4348
chr3 11658550 11659929 0,0004 0,4299 0,4295
chrl 7 53764417 53765963 0,0005 0,7967 0,7961
chrlO 11246762 11249052 0,0005 0,4002 0,3997
chr22 28992647 28993434 0,0006 0,8092 0,8087
chrl 5 62460278 62461007 0,0006 0,4334 0,4328
chrl 31002038 31003474 0,0007 0,5926 0,5919
chrl 9 3129246 3132159 0,0008 0,7725 0,7717
chrl2 l,21E+08 l,21E+08 0,0008 0,7303 0,7295
chrl9 12304446 12305741 0,0009 0,6986 0,6978
chr3 67788734 67789395 0,001 0,9131 0,9121
chr9 l,32E+08 l,32E+08 0,001 0,7047 0,7037
chrl9 6723370 6724479 0,001 0,689 0,688
chr3 l,84E+08 l,84E+08 0,001 0,4384 0,4374
chr2 53848089 53849214 0,001 0,4368 0,4358
chrl 7 59450886 59452113 0,0012 0,469 0,4678
chr5 l,72E+08 l,72E+08 0,0014 0,578 0,5766
chr21 35342527 35343373 0,0014 0,5392 0,5378
chr21 45164804 45165437 0,0015 0,4251 0,4236
chrX 3742417 3744601 0,0016 0,4486 0,447
chr21 45158293 45159003 0,0017 0,7799 0,7782
chr7 39839340 39839876 0,0017 0,4074 0,4057
chr2 l,75E+08 l,75E+08 0,0018 0,4816 0,4797
chrl2 l,24E+08 l,24E+08 0,0019 0,6306 0,6287
chr3 50352688 50353823 0,002 0,624 0,622
chr9 97264382 97265523 0,0021 0,5008 0,4987
chr7 64178628 64179354 0,0021 0,4088 0,4066
chr9 94767202 94767802 0,0023 0,7568 0,7544
chr5 42986308 42988304 0,0023 0,4882 0,4859
chrl 7 63854127 63854693 0,0024 0,8266 0,8242
chrl2 l,22E+08 l,22E+08 0,0024 0,4869 0,4844
chrl7 16260170 16260909 0,0026 0,6404 0,6378
chr4 39874787 39875456 0,0027 0,7233 0,7206
- 80 042157
chrl2 6441080 6441608 0,0027 0,6228 0,6201
chrl9 45015653 45016886 0,0028 0,5444 0,5416
chr6 30757752 30758823 0,0028 0,4783 0,4755
chr6 41636176 41637112 0,0028 0,4254 0,4226
chrl2 6315199 6315765 0,0029 0,4613 0,4584
chrl4 76576283 76577070 0,0029 0,4365 0,4336
chrl6 48857790 48858300 0,0031 0,5625 0,5594
chr5 l,7E+08 1,7E+O8 0,0031 0,4752 0,4721
chrl3 26897813 26898557 0,0032 0,4354 0,4322
chrl4 52753948 52754571 0,0032 0,4221 0,4189
chrl l,66E+08 l,66E+08 0,0033 0,5579 0,5545
chrl2 56157424 56158348 0,0033 0,47 0,4667
chr22 16079971 16080532 0,0034 0,6226 0,6193
chr7 1946410 1946975 0,0036 0,6826 0,6789
chrll 258799 259749 0,0036 0,5072 0,5037
chr6 13381944 13382477 0,0037 0,5945 0,5908
chr7 l,27E+08 l,27E+08 0,0037 0,5096 0,5058
chrl3 23743886 23744467 0,0037 0,4534 0,4497
chr2 l,21E+08 l,21E+08 0,0038 0,7175 0,7137
chr21 25855853 25857105 0,0039 0,4661 0,4622
chr2 43211724 43212565 0,0039 0,4345 0,4306
chrl2 l,08E+08 l,08E+08 0,0041 0,6024 0,5983
chrl5 92928924 92929575 0,0041 0,4074 0,4033
chrl9 10731043 10731636 0,0042 0,5868 0,5826
chr6 l,45E+08 l,45E+08 0,0043 0,5783 0,574
chrl 52875323 52875907 0,0044 0,4145 0,4101
chrl4 75058186 75058956 0,0045 0,602 0,5975
chrl 2 l,21E+08 l,21E+08 0,0045 0,4821 0,4776
chrl 7 76873737 76874417 0,0046 0,6012 0,5966
chr2 2,38E+08 2,38E+08 0,0049 0,7654 0,7604
chr2 l,98E+08 l,98E+08 0,0049 0,7228 0,7179
chr6 l,47E+08 l,47E+08 0,0049 0,4967 0,4918
chr9 l,36E+08 l,36E+08 0,0049 0,4584 0,4535
chrl 67545402 67546771 0,005 0,4971 0,4921
chr6 l,58E+08 l,58E+08 0,0052 0,6145 0,6093
chr3 1,7E+O8 l,7E+08 0,0052 0,5845 0,5794
chrl 2,34E+08 2,34E+08 0,0053 0,7033 0,6979
chrlO 80715722 80716751 0,0053 0,6515 0,6462
chr4 48602901 48603736 0,0053 0,6315 0,6262
chrl9 13957965 13958580 0,0053 0,599 0,5937
chrl 90081114 90082367 0,0053 0,4574 0,4521
chr2 l,06E+08 l,06E+08 0,0054 0,8858 0,8804
chrl 6 29664213 29665369 0,0054 0,8339 0,8285
chrl l,59E+08 l,59E+08 0,0054 0,7663 0,7608
chrl3 97926489 97927025 0,0054 0,6229 0,6175
chrl 41604452 41605277 0,0054 0,6011 0,5956
chr9 l,28E+08 l,28E+08 0,0054 0,5871 0,5818
-81 042157
Таблица S3B
Перечень первых 100 локусов, определенных как гипометилированные по данным бисульфитного секвенирования для материнской плазмы в первом триместре
Хромосома Начало Конец Клетки крови матери CVS Различие метилирования
chrl 235771917 235772426 0,9868 0,549 0,4377
chrl 97357972 97358622 0,9835 0,4805 0,503
chrl 4490516 4491074 0,9826 0,4793 0,5032
chr4 181124168 181124671 0,9825 0,4725 0,5099
chrl 6 71908694 71909213 0,982 0,5581 0,4239
chr3 182727915 182728477 0,981 0,3577 0,6233
chr5 115339535 115340038 0,9802 0,5455 0,4347
chr3 195855575 195856122 0,9801 0,3793 0,6008
chr6 155437621 155438161 0,9799 0,5991 0,3808
chr9 20468093 20468904 0,9798 0,4271 0,5527
chrlO 90702298 90702987 0,9787 0,3324 0,6463
chrl 170581654 170582162 0,9785 0,4817 0,4968
chr3 108816849 108817794 0,9783 0,4793 0,4989
chr20 36912749 36913319 0,9783 0,5 0,4783
chrl3 72517281 72517839 0,9782 0,4855 0,4927
chrl2 103553001 103553677 ' 0,9774 0,492 - 0,4854
chr22 27638905 27639408 0,9766 0,5385 0,4382
chr7 17290850 17291462 0,9763 0,59 0,3863
chr6 17227866 17228510 0,976 0,4058 0,5703
chrl 5 56998547 56999107 0,9754 0,3766 0,5988
chr7 70965945 70966842 0,9753 0,5893 0,386
chr3 32159338 32160065 0,9752 0,5379 0,4372
chrl 6 17043258 17043854 0,9752 0,5521 0,4231
chrl 6 22776223 22776850 0,9752 0,5735 0,4017
chr5 169344029 169344869 0,9751 0,4211 0,5541
chrll 34324955 34325722 0,975 0,5561 0,4189
chr8 58554745 58555376 0,9747 0,5784 0,3964
chrl 153933389 153934121 0,9746 0,463 0,5116
chrl4 88003983 88004485 0,9745 0,5379 0,4366
chr3 151738501 151739120 0,9741 0,4901 0,484
chrl4 105618699 105619606 0,974 0,3457 0,6283
chrl6 24060085 24060702 0,9738 0,3991 0,5747
chr8 68941792 68942711 0,9738 0,5449 0,429
chrl 2 53208707 53209304 0,9737 0,4847 0,489
chr7 76892564 76893249 0,9736 0,5664 0,4072
chr3 69464294 69464971 0,9736 0,5893 0,3843
chrl 9 61401137 61401745 0,9732 0,4933 0,4799
chrll 124569867 124570490 0,9732 0,5136 0,4595
chrl 8 42618440 42619096 0,9732 0,5942 0,379
chr5 169398896 169399637 0,9731 0,498 0,4751
chr5 169328124 169328983 0,9731 0,572 0,401
chr20 34679880 34680448 0,9731 0,5922 0,3809
chrl 6 9042198 9042702 0,973 0,4286 0,5444
chrlO 90205044 90205701 0,973 0,4407 0,5323
chrl3 33236454 33236997 0,973 0,5906 0,3824
chrl6 | 73284579 | 73285087 | 0,9729 | 0,5602 | 0,4127
- 82 042157
chr8 29100691 29101428 0,9728 0,505 0,4678
chr2 202383851 202384447 0,9727 0,5461 0,4267
chr3 179501620 179502300 0,9722 0,5766 0,3956
chr6 107674976 107675906 0,9719 0,4434 0,5285
chr6 107880632 107881161 0,9718 0,5623 0,4095
chrl2 56350283 56350933 0,9718 0,5909 0,3809
chrl9 40636458 40637339 0,9717 0,4941 0,4776
chr2 223472599 223473287 0,9714 0,1824 0,7891
chr22 20709067 20709787 0,9714 0,5149 0,4565
chr!9 46095583 46096190 0,9713 0,5385 0,4328
chr6 90258338 90259318 0,9712 0,3415 0,6297
chr2 54598347 54598933 0,9712 0,5894 0,3819
chr3 114810453 114811493 0,9711 0,5166 0,4545
chrl9 15851125 15851654 0,9711 0,5236 0,4476
chr8 42889138 42890084 0,9711 0,5652 0,4059
chrl8 52354390 52355064 0,971 0,598 0,373
chrl 5 38206236 38207010 0,9709 0,4186 0,5523
chr7 99700554 99701110 0,9708 0,305 0,6658
chrl2 19487336 19487855 0,9708 0,4105 0,5603
chr7 87996908 87997437 0,9708 0,5462 0,4246
chr6 63628653 63629378 0,9707 0,529 0,4417
chrl5 38209108 38209618 0,9706 0,5882 0,3824
chrl 9 6623769 6624450 0,9704 0,5179 0,4526
chr2 10794513 10795242 0,9704 0,5976 0,3728
chr2 118472785 118474454 0,9704 0,5992 0,3712
chr5 57820209 57820801 0,9701 0,5815 0,3886
chrlO 100183380 100184702 0,9701 0,5826 0,3875
chr2 8151989 8152646 0,97 0,4701 0,4999
chrlO 3938374 3938914 0,9699 0,1741 0,7958
chr9 123724524 123725439 0,9697 0,57 0,3997
chrl4 89085469 89086097 0,9696 0,3278 0,6418
chrl6 14129437 14130133 0,9695 0,5304 0,4392
chr5 60746367 60747191 0,9695 0,5571 0,4124
chrl 92002953 92003729 0,9694 0,52 0,4494
chr6 31264677 31265413 0,9693 0,5135 0,4558
chr7 99317013 99318281 0,9692 0,5117 0,4574
chr8 8808867 8809422 0,9692 0,5691 0,4002
chrl 9 20052165 20052720 0,969 0,2792 0,6898
chr8 129139026 129139573 0,969 0,3458 0,6232
chrll 122314929 122315458 0,969 0,4232 0,5458
chrl3 98377663 98378165 0,9688 0,3319 0,6369
chr9 107606194 107606872 0,9688 0,449 0,5198
chr8 56096904 56097736 0,9688 0,5267 0,4422
chr7 128093836 128094339 0,9688 0,5929 0,3758
chr2 103109370 103109916 0,9686 0,3333 0,6352
chr3 101803534 101804063 0,9686 0,5027 0,4659
chrlO 69505720 69506278 0,9684 0,2515 0,7169
chrl3 26608225 26608754 0,9683 0,3614 0,6069
chrl 90993315 90993828 0,9683 0,5519 0,4164
chr6 11361243 11361801 0,9681 0,2578 0,7103
chr21 36529300 36529981 0,968 0,1944 0,7736
chr21 37813953 37814521 0,9679 0,2175 0,7505
chr2 15226273 15227211 0,9679 0,5134 0,4545
chrl 9 4102809 4103443 0,9679 0,5646 | 0,4034
- 83 042157
Таблица S3C
Перечень первых 100 локусов, определенных как гиперметилированные по данным бисульфитного секвенирования для материнской плазмы в третьем триместре
Хромосома Начало Конец Клетки крови матери Зрелая плацента Различие метилирования
chrl7 53763065 53764027 0,0000 0,8680 0,8680
chr22 39189067 39189863 0,0000 0,8233 0,8233
chrlO 30858286 30858871 0,0000 0,7713 0,7713
chr7 41887694 41888212 0,0000 0,7578 0,7578
chr2 1Д4Е+08 1Д4Е+08 0,0000 0,7500 0,7500
chrl2 25096242 25097206 0,0000 0,7332 0,7332
chr6 l,07E+08 l,07E+08 0,0000 0,7229 0,7229
chrl 66574104 66574793 0,0000 0,7136 0,7136
chrl6 11298755 11299326 0,0000 0,7005 0,7005
chr6 11489985 11490755 0,0000 0,6935 0,6935
chrl 8 13454740 13455292 0,0000 0,6594 0,6594
chr6 l,08E+08 l,08E+08 0,0000 0,6231 0,6231
chrX 3627885 , 3628549 0,0000 0,6133 0,6133
chrl 2 7979754 7980413 0,0000 0,6118 0,6118
chr3 71261611 71262501 0,0000 0,5938 0,5938
chrl 7 53769900 53770731 0,0000 0,5586 0,5586
chrll 1Д8Е+08 1Д8Е+08 0,0000 0,5558 0,5558
chrl9 44060511 44061036 0,0000 0,5464 0,5464
chr2 2,38E+08 2,38E+08 0,0000 0,5330 0,5330
chrl l,91E+08 l,91E+08 0,0000 0,5294 0,5294
chrl l,44E+08 l,44E+08 0,0000 0,4857 0,4857
chr2 l,75E+08 l,75E+08 0,0000 0,4785 0,4785
chr4 15366889 15367646 0,0000 0,4729 0,4729
chr2 19537237 19537737 0,0000 0,4599 0,4599
chrl 1Д5Е+08 1Д5Е+08 0,0000 0,4351 0,4351
chrl l,54E+08 l,54E+08 0,0000 0,4299 0,4299
chrl 4 51383387 51384149 0,0000 0,4186 0,4186
chrl 1Д2Е+08 1Д2Е+08 0,0002 0,5350 0,5348
chr3 11658550 11659929 0,0004 0,5579 0,5575
chrl 7 53764417 53765963 0,0005 0,7894 0,7889
chr22 28992647 28993434 0,0006 0,8053 0,8047
chr6 27214981 27215823 0,0006 0,4593 0,4587
chrl 31002038 31003474 0,0007 0,6309 0,6302
chrl2 l,21E+08 l,21E+08 0,0008 0,7360 0,7352
chrl 9 3129246 3132159 0,0008 0,7257 0,7249
chrl9 12304446 12305741 0,0009 0,6397 0,6388
chr6 28723918 28724965 0,0009 0,4344 0,4335
chrl9 6723370 6724479 0,0010 0,7280 0,7270
chr2 53848089 53849214 0,0010 0,4060 0,4050
chr9 l,32E+08 l,32E+08 0,0010 0,7558 0,7548
chr3 67788734 67789395 0,0010 0,9219 0,9209
chrl 9 18276368 18277132 0,0011 0,5136 0,5125
chrl 7 59450886 59452113 0,0012 0,5196 0,5184
chrl7 74243852 74244670 0,0012 0,4117 0,4105
- 84 042157
chr3 1,85E+O8 1,85E+O8 0,0014 0,4961 0,4948
chr21 35342527 35343373 0,0014 0,5126 0,5112
chr5 l,72E+08 l,72E+08 0,0014 0,6531 0,6516
chr21 45164804 45165437 0,0015 0,4364 0,4349
chrX 3742417 3744601 0,0016 0,7517 0,7501
chr21 45158293 45159003 0,0017 0,8180 0,8163
chr2 l,75E+08 l,75E+08 0,0018 0,6214 0,6196
chrl2 l,24E+08 l,24E+08 0,0019 0,5906 0,5887
chr3 50352688 50353823 0,0020 0,6082 0,6062
chr9 94767202 94767802 0,0023 0,8327 0,8304
chrl7 63854127 63854693 0,0024 0,7886 0,7862
chrl2 l,22E+08 l,22E+08 0,0024 0,5021 0,4997
chrl7 16260170 16260909 0,0026 0,5780 0,5754
chrl2 6441080 6441608 0,0027 0,7471 0,7444
chr4 39874787 39875456 0,0027 0,7962 0,7935
chrl 8 50536032 50536649 0,0027 0,4920 0,4893
chr6 30757752 30758823 0,0028 0,4029 0,4001
chrl9 2571763 2572292 0,0031 0,4200 0,4169
chr5 l,7E+08 l,7E+08 0,0031 0,4218 0,4187
chrl3 26897813 26898557 0,0032 0,6485 0,6453
chrl2 56157424 56158348 0,0033 0,5541 0,5508
chrl l,66E+08 l,66E+08 0,0033 0,5147 0,5113
chr22 16079971 16080532 0,0034 0,6265 0,6231
chr6 16820551 16821134 0,0035 0,4800 0,4765
chrll 258799 259749 0,0036 0,5475 0,5439
chr7 1946410 1946975 0,0036 0,8251 0,8215
chr6 13381944 13382477 0,0037 0,8221 0,8183
chr7 l,27E+08 l,27E+08 0,0037 0,4767 0,4730
chr2 l,21E+08 l,21E+08 0,0038 0,6734 0,6697
chr2 43211724 43212565 0,0039 0,4256 0,4217
chrl 5 92928924 92929575 0,0041 0,5605 0,5564
chrl 2 l,08E+08 l,08E+08 0,0041 0,7313 0,7271
chrl 9 10731043 10731636 0,0042 0,5668 0,5626
chr6 l,45E+08 l,45E+08 0,0043 0,5910 0,5867
chrl 52875323 52875907 0,0044 0,6115 0,6071
chrl 2 l,21E+08 l,21E+08 0,0045 0,5884 0,5839
chrl4 75058186 75058956 0,0045 0,6534 0,6489
chrl 7 76873737 76874417 0,0046 0,5658 0,5612
chr6 l,47E+08 l,47E+08 0,0049 0,5826 0,5777
chr2 l,98E+08 l,98E+08 0,0049 0,7944 0,7895
chr2 2,38E+08 2,38E+08 0,0049 0,7328 0,7278
chr8 l,42E+08 l,42E+08 0,0050 0,7728 0,7679
chr3 l,7E+08 l,7E+08 0,0052 0,7227 0,7176
chr6 1.58E+08 l,58E+08 0,0052 0,6389 0,6337
chr2 2,38E+08 2,38E+08 0,0052 0,4238 0,4185
chrll 56948854 56949496 0,0053 0,4484 0,4431
chr4 48602901 48603736 0,0053 0,5920 0,5867
chr5 l,31E+08 l,31E+08 0,0053 0,4858 0,4805
chrlO 80715722 80716751 0,0053 0,5249 0,5196
chrl 9 13957965 13958580 0,0053 0,4379 0,4326
chrl 2,34E+08 2,34E+08 0,0053 0,8440 0,8387
chrl3 97926489 97927025 0,0054 0,7233 0,7179
chr9 l,28E+08 l,28E+08 0,0054 0,7312 0,7258
chr2 l,06E+08 l,06E+08 0,0054 0,8513 0,8459
chr2 96556705 96557637 0,0054 0,4095 0,4041
chrl 6 29664213 29665369 0,0054 0,8837 0,8783
- 85 042157
Таблица S3D
Перечень первых 100 локусов, определенных как гипометилированные по данным бисульфитного секвенирования для материнской плазмы в третьем триместре
Хромосома Начало Конец Клетки крови матери Зрелая плацента Различие метилирования
chrlO 7548948 7549483 0,9866 0,5685 0,4181
chrl 4490516 4491074 0,9826 0,5015 0,4810
chr4 l,81E+08 l,81E+08 0,9825 0,5981 0,3843
chr3 l,83E+08 l,83E+08 0,9810 0,2925 0,6886
chr3 l,96E+08 l,96E+08 0,9801 0,4643 0,5158
chr6 l,55E+08 l,55E+08 0,9799 0,4610 0,5189
chrl l,71E+08 l,71E+08 0,9785 0,5122 0,4662
chr20 . 36912749 36913319 0,9783 0,4513 0,5269
chr22 38583100 38583616 0,9783 0,5428 0,4355
chrl 19391314 19392207 0,9778 0,5273 0,4505
chr5 l,74E+08 l,74E+08 0,9770 0,5852 0,3918
chrl 9 13678906 13679531 0,9760 0,5812 0,3949
chrl4 83650790 83651395 0,9760 0,5378 0,4382
chrl 5 56998547 56999107 0,9754 0,4691 0,5063
chrl 6 22776223 22776850 0,9752 0,5114 0,4638
chr5 l,69E+08 l,69E+08 0,9751 0,4809 0,4943
chr8 58554745 58555376 0,9747 0,5977 0,3770
chrl 4 l,06E+08 l,06E+08 0,9740 0,2069 0,7671
chr8 68941792 68942711 0,9738 0,5872 0,3866
chrl 6 24060085 24060702 0,9738 0,3470 0,6268
chrl 2 53208707 53209304 0,9737 0,5278 0,4459
chr5 l,69E+08 l,69E+08 0,9731 0,5057 0,4673
chrl 6 9042198 9042702 0,9730 0,1860 0,7869
chrlO 90205044 90205701 0,9730 0,5922 0,3808
chr3 l,89E+08 l,89E+08 0,9720 0,4949 0,4771
chr6 l,08E+08 l,08E+08 0,9719 0,5825 0,3894
chr2 2,23E+08 2,23E+08 0,9714 0,3333 0,6381
chrl 9 46095583 46096190 0,9713 0,5065 0,4648
chr8 l,41E+08 l,41E+08 0,9713 0,5753 0,3959
chr6 90258338 90259318 0,9712 0,4357 0,5355
chrl3 51403556 51404069 0,9710 0,3980 0,5731
chrl 8 66875048 66875726 0,9710 0,5259 0,4451
chr7 99700554 99701110 0,9708 0,3757 0,5951
chr7 87996908 87997437 0,9708 0,5720 0,3988
chrl 9 6623769 6624450 0,9704 0,4774 0,4930
chrl 97639047 97639749 0,9701 0,4148 0,5553
chrl 6 23892096 23892772 0,9701 0,5000 0,4701
chrlO 3938374 3938914 0,9699 0,1148 0,8551
chrl 4 89085469 89086097 0,9696 0,2964 0,6732
chr8 l,29E+08 l,29E+08 0,9690 0,3565 0,6126
chrl3 98377663 98378165 0,9688 0,3123 0,6566
chr8 56096904 56097736 0,9688 0,4562 0,5126
chr2 l,03E+08 l,03E+08 0,9686 0,3459 0,6227
- 86 042157
chrl3 26608225 26608754 0,9683 0,4562 0,5121
chr2 22738157 22738760 0,9682 0,5122 0,4560
chr6 11361243 11361801 0,9681 0,2646 0,7035
chr21 36529300 36529981 0,9680 0,1829 0,7852
chr21 37813953 37814521 0,9679 0,3061 0,6619
chr2 2,43E+08 2,43E+08 0,9679 0,5750 0,3929
chr4 12413543 12414103 0,9679 0,5944 0,3735
chr3 l,27E+08 l,27E+08 0,9677 0,4030 0,5648
chr7 33509047 33509556 0,9676 0,4627 0,5048
chrl4 59284846 59285553 0,9674 0,5254 0,4420
chrl7 42623453 42624024 0,9673 0,4318 0,5355
chrl 9 6778363 6779377 0,9671 0,4416 0,5255
chr4 41798250 41798788 0,9670 0,5000 0,4670
chr5 88054080 88054588 0,9669 0,2238 0,7431
chrl6 24109379 24110289 0,9669 0,5062 0,4607
chrlO 13847159 13847895 0,9667 0,3188 0,6479
chrlO l,27E+08 l,27E+08 0,9667 0,5423 0,4244
chrl2 1Д2Е+08 1Д2Е+08 0,9663 0,3722 0,5941
chrlO 17220886 17221845 0,9662 0,4455 0,5207
chr8 5947355 5947862 0,9662 0,5171 0,4491
chr3 73740840 73741439 0,9659 0,3657 0,6002
chrl4 57945953 57946875 0,9658 0,5357 0,4301
chrl4 50905777 50906333 0,9658 0,3008 0,6650
chrl5 90275374 90276000 0,9657 0,5409 0,4248
chr22 24717299 24718197 0,9657 0,5160 0,4497
chr7 36530128 36530987 0,9656 0,5194 0,4462
chr2 l,31E+08 l,31E+08 0,9655 0,4384 0,5271
chr4 42116988 42117788 0,9654 0,5195 0,4459
chrl 2 1Д6Е+08 1Д6Е+08 0,9653 0,5594 0,4059
chr2 7491785 7492736 0,9652 0,4556 0,5097
chrl9 6599638 6600187 0,9652 0,5488 0,4163
chr6 25326803 25327398 0,9651 0,3974 0,5677
chr4 l,7E+08 l,7E+08 0,9651 0,4933 0,4718
chr7 99875338 99876155 0,9650 0,2696 0,6953
chrl4 97144328 97145208 0,9649 0,5377 0,4272
chr3 11718596 11719163 0,9649 0,5521 0,4128
chrl4 1E+08 1E+08 0,9649 0,3794 0,5855
chr7 l,5E+08 l,5E+08 0,9648 0,3327 0,6322
chrl2 56357827 56358328 0,9648 0,4217 0,5430
chrlO 8275750 8276276 0,9647 0,3100 0,6547
chrll 16999685 17000209 0,9647 0,2765 0,6882
chr22 34419356 34419861 0,9646 0,4245 0,5401
chrl8 72453151 72453725 0,9646 0,4700 0,4946
chr5 49919879 49920699 0,9645 0,3169 0,6476
chrl 24580891 24581805 0,9643 0,3565 0,6078
chr22 18233774 18234492 0,9641 0,5205 0,4436
chrl4 45356178 45356903 0,9640 0,3934 0,5706
chr3 53007193 53008661 0,9638 0,4902 0,4737
chr4 55027912 55028539 0,9637 0,5254 0,4384
chr5 l,37E+08 l,37E+08 0,9637 0,5290 0,4347
chrl 2,23E+08 2,23E+08 0,9636 0,0997 0,8640
chr7 l,35E+08 l,35E+08 0,9636 0,2959 0,6677
chr5 80350438 80351169 0,9636 0,4969 0,4667
chrl2 31889600 31890343 0,9636 0,1745 0,7891
chrl 2 8365395 8366096 0,9636 0,5721 0,3914
chrl9 15424819 15425355 0,9635 0,2836 0,6799
chrlO 10985469 10986409 0,9635 0,4877 0,4759

Claims (58)

  1. ФОРМУЛА ИЗОБРЕТЕНИЯ
    1. Способ анализа биологического образца организма, чтобы определить классификацию уровня рака, где указанный биологический образец содержит молекулы дезоксирибонуклеиновой кислоты (ДНК), происходящие из нормальных клеток и потенциально из клеток, связанных с раковым заболеванием, причем, по меньшей мере, некоторые из молекул ДНК в биологическом образце являются внеклеточными молекулами ДНК, при этом указанный способ включает анализ множества молекул ДНК из указанного биологического образца, где анализ молекулы ДНК
    - 87 042157 включает определение локализации указанной молекулы ДНК в геноме указанного организма;
    определение того, метилирована ли указанная молекула ДНК в одном или большем числе сайтов, где указанное определение включает осуществление чувствительного к метилированию массивногопараллельного секвенирования;
    для каждого из множества сайтов:
    определение соответствующего количества молекул ДНК, которые метилированы в указанном сайте;
    вычисление первого уровня метилирования на основе соответствующих количеств молекул ДНК, метилированных во множестве сайтов, при этом первый уровень метилирования может соответствовать индексу метилирования, плотности метилирования или доле метилированных цитозинов, где индекс метилирования относится к доле молекул ДНК, показывающих метилирование в одном и более сайтах относительно количества молекул ДНК, покрывающих один и более сайтов, где плотность метилирования области представляет собой количество молекул ДНК в сайтах указанной области, показывающей метилирование, разделенное на количество молекул ДНК, покрывающих сайты области, и где доля метилированных цитозинов относится к цитозиновым сайтам, в отношении которых показано метилирование из числа проанализированных остатков цитозина в области;
    генерирование сравнения первого уровня метилирования с первым предельным значением, где указанное первое предельное значение представляет собой референсный уровень метилирования, находится на указанном расстоянии от референсного уровня метилирования или устанавливается по указанному референсному уровню метилирования, где референсный уровень метилирования определяют по одному или более образцам, уровень рака в которых известен; и определение первой классификации уровня рака, являющейся классификацией по метилированию, на основе указанного сравнения, где уровень рака может относится либо к наличию рака, стадии рака, размеру раковой опухоли, либо к наличию метастазов, общей опухолевой нагрузке на организм и/или к другой мере тяжести ракового заболевания.
  2. 2. Способ по п.1, отличающийся тем, что осуществление чувствительного к метилированию секвенирования включает обработку молекул ДНК бисульфитом натрия;
    осуществление секвенирования обработанных молекул ДНК.
  3. 3. Способ по п.2, отличающийся тем, что обработка молекул ДНК бисульфитом натрия представляет собой часть бисульфитной конверсии с использованием Tet или окислительного бисульфитного секвенирования для детекции 5-гидроксиметилцитозина.
  4. 4. Способ по п.1, отличающийся тем, что относительные количества молекул ДНК определяют путем выравнивания ридов последовательностей, полученных при чувствительном к метилированию секвенировании.
  5. 5. Способ по п.1, отличающийся тем, что определение того, метилирована ли указанная молекула ДНК в одном или большем числе сайтов, включает применение расщепления чувствительными к метилированию рестрикционными ферментами, специфической к метилированию ПЦР, зависимой от метилирования преципитации ДНК, связывающего метилированную ДНК белка/пептида или мономолекулярного секвенирования без обработки бисульфитом натрия.
  6. 6. Способ по п.1, также включающий для каждой из первого множества областей генома оп ределение соответствующего количества молекул ДНК, происходящих из указанной области, в биологическом образце;
    вы числение соответствующего нормированного значения по соответствующему количеству молекул ДНК, происходящих из указанной области;
    ср авнение соответствующего нормированного значения с референсным значением для определения того, наблюдается ли в области делеция или амплификация, где референсное значение может быть определено из нормального образца, значения другого гаплотипа или значения для другой области;
    оп ределение первого количества областей из первого множества областей генома, для которых было определено присутствие делеции или амплификации;
    сравнение указанного первого количества с первым пороговым значением для определения второй классификации уровня рака, которая является классификацией по абберациям числа копий; и использование первой классификации и второй классификации для определения третьей классификации уровня рака, которая является классификаций по метилированию и по абберациям числа копий.
  7. 7. Способ по п.6, отличающийся тем, что первое пороговое значение представляет собой процент от первого множества областей, для которых было определено присутствие делеции или амплификации.
  8. 8. Способ по п.6, отличающийся тем, что третья классификация положительна по раковому заболеванию только в том случае, если и первая классификация, и вторая классификация указывают на раковое заболевание.
  9. 9. Способ по п.1 или 6, отличающийся тем, что если первая классификация указывает на наличие ракового заболевания в организме, то способ включает дополнительно идентификацию типа ракового
    - 88 042157 заболевания, связанного с указанным организмом, путем сравнения первого уровня метилирования с соответствующим значением, определенным для других организмов, при этом по меньшей мере два из указанных других организмов идентифицированы как имеющие различные типы раковых заболеваний.
  10. 10. Способ по п.6, отличающийся тем, что если третья классификация указывает на раковое заболевание в организме, то способ включает дополнительно идентификацию типа ракового заболевания, связанного с указанным организмом, путем сравнения первого количества областей с соответствующими значениями, определенными для других организмов.
  11. 11. Способ по п.1 или 6, отличающийся тем, что вычисление первого уровня метилирования включает идентификацию второго множества областей генома;
    идентификацию одного или большего количества сайтов в составе каждой области второго множества областей;
    вычисление уровня метилирования области для каждой области второго множества областей, при этом первый уровень метилирования соответствует первой области второго множества областей, где генерирование сравнения первого уровня метилирования с первым предельным значением дополнительно включает сравнение каждого из уровней метилирования области с соответствующим предельным значением для области, включающее сравнение первого уровня метилирования с первым предельным значением; и где определение первой классификации уровня рака на основе указанного сравнения включает определение второго количества областей из второго множества областей, которые, как было определено, имеют уровень метилирования области, превышающий соответствующее предельное значение для области; и сравнение указанного второго количества областей со вторым пороговым значением для определения первой классификации.
  12. 12. Способ по п.11, отличающийся тем, что указанные области, которые, как было определено, имеют уровень метилирования области, превышающий соответствующее предельное значение для области, соответствуют первому набору областей, и включающий дополнительно сравнение уровней метилирования области из первого набора областей с соответствующими уровнями метилирования области у других организмов для первого набора областей, при этом у указанных других организмов имеется по меньшей мере два из следующего: раковое заболевание первого типа, отсутствие ракового заболевания и раковое заболевание второго типа; и определение того, имеется ли у организма раковое заболевание первого типа, отсутствует ли раковое заболевание или имеется ли раковое заболевание второго типа на основании указанного сравнения.
  13. 13. Способ по п.12, где сравнение включает разбиение на кластеры указанных других организмов на основании соответствующих уровней метилирования области из первого набора областей других организмов, причем два из указанных кластеров соответствуют любым двум пунктам из первого типа ракового заболевания, отсутствия ракового заболевания и второго типа ракового заболевания, определение, к какому кластеру принадлежит организм.
  14. 14. Способ по п.13, отличающийся тем, что при разбиении на кластеры указанных других организмов используются уровни метилирования области указанного организма.
  15. 15. Способ по п.13, отличающийся тем, что указанные кластеры включают первый кластер, соответствующий первому типу раковых заболеваний, второй кластер, соответствующий второму типу раковых заболеваний, и третий кластер, соответствующий отсутствию раковых заболеваний.
  16. 16. Способ по п.13, отличающийся тем, что разбиение на кластеры указанных других организмов основано дополнительно на соответствующих нормированных значениях второго набора областей для указанных других организмов, где указанный второй набор областей соответствует областям, для которых было определено присутствие делеции или амплификации, и где соответствующее нормированное значение для области определяют по соответствующему количеству молекул ДНК из указанной области; при этом указанный способ дополнительно включает для каждой из второго набора областей:
    определение соответствующего количества молекул ДНК как происходящих из указанной области;
    вычисление соответствующего нормированного значения по соответствующему количеству молекул ДНК из указанной области; и сравнение соответствующих нормированных значений второго набора областей для указанного организма с соответствующими нормированными значениями для других организмов, в рамках определения того, к какому кластеру принадлежит указанный организм.
  17. 17. Способ по п.16, отличающийся тем, что разбиение на кластеры указанных других организмов основано дополнительно на соответствующих плотностях метилирования гиперметилированных CpGостровков, и указанный способ дополнительно включает для каждого из гиперметилированных CpG-островков:
    определение соответствующей плотности метилирования, и
    - 89 042157 сравнение соответствующих плотностей метилирования гиперметилированных CpG-островков у указанного организма с плотностями метилирования у других организмов в рамках определения того, к какому кластеру принадлежит указанный организм.
  18. 18. Способ по п.11, также включающий для каждой из второго множества областей:
    вычисление соответствующей разности между уровнем метилирования области и соответствующим предельным значением для области; и вычисление соответствующей вероятности, которая является вероятностью получения соответствующей разницы случайно согласно статистическому распределению;
    при этом определение второго количества областей из второго множества областей включает вычисление кумулятивного показателя, включающего сумму соответствующих вероятностей.
  19. 19. Способ по п.18 отличающийся тем, что вычисление указанного кумулятивного показателя включает вычисление логарифма соответствующей вероятности каждой области второго множества областей для получения соответствующего логарифмического результата; и вычисление суммы, включающей соответствующие логарифмические результаты.
  20. 20. Способ по п.18, отличающийся тем, что соответствующая разность каждой области второго множества областей нормирована по стандартному отклонению, связанному с соответствующим предельным значением для области.
  21. 21. Способ по п.18, отличающийся тем, что второе пороговое значение соответствует максимальному кумулятивному показателю от референсной группы образцов других организмов.
  22. 22. Способ по п.11, отличающийся тем, что второе пороговое значение представляет собой процент, и при этом сравнение второго количества областей с вторым пороговым значением включает деление указанного второго количества областей на число второго множества областей перед сравнением с указанным вторым пороговым значением.
  23. 23. Способ по п.22, отличающийся тем, что указанное число второго множества областей соответствует всему второму множеству областей.
  24. 24. Способ по п.11, отличающийся тем, что первое множество областей совпадает со вторым множеством областей.
  25. 25. Способ по п.11, отличающийся тем, что указанный биологический образец берут до лечения, и дополнительно включающий повторение способа по п.11 для другого биологического образца, взятого после лечения, для получения:
    следующего первого количества областей, для которых было определено присутствие делеции или амплификации; и следующего второго количества областей, которые, как было определено, имеют уровень метилирования области, превышающий соответствующее предельное значение для области;
    сравнение первого количества со следующим первым количеством и второго количества со следующим вторым количеством для определения прогноза для указанного организма.
  26. 26. Способ по п.25, отличающийся тем, что сравнение первого количества со следующим первым количеством и второго количества со следующим вторым количеством для определения прогноза для указанного организма включает определение первой разности между первым количеством и следующим первым количеством;
    сравнение указанной первой разности с одним или несколькими порогами для первой разности; определение второй разности между вторым количеством и следующим вторым количеством; и сравнение второй разности с одним или несколькими порогами второй разности.
  27. 27. Способ по п.26, отличающийся тем, что делают более плохой прогноз, если первая разность ниже одного из порогов первой разности, чем в тех случаях, когда указанная первая разность превышает один из порогов первой разности, и при этом делают более плохой прогноз, если вторая разность ниже одного из порогов второй разности, чем в тех случаях, когда указанная вторая разность превышает один из порогов второй разности.
  28. 28. Способ по п.25, отличающийся тем, что указанное лечение представляет собой иммунотерапию, хирургию, радиационную терапию, химиотерапию, терапию на основе антител, эпигенетическую терапию или таргетную терапию.
  29. 29. Способ по п.1, отличающийся тем, что первое предельное значение представляет собой указанное расстояние от референсного уровня метилирования, установленного по биологическому образцу, полученному из здорового организма.
  30. 30. Способ по п.29, отличающийся тем, что указанное расстояние представляет собой указанное число стандартных отклонений от референсного уровня метилирования.
  31. 31. Способ по п.1, отличающийся тем, что первое предельное значение устанавливают по референсному уровню метилирования, определенному по предыдущему биологическому образцу из указанного организма, полученному раньше, чем исследуемый биологический образец.
    - 90 042157
  32. 32. Способ по п.1, где способу предшествует определение фракционной концентрации опухолевой ДНК в биологическом образце;
    определение того, превышает ли фракционная концентрация опухолевой ДНК в биологическом образце минимальное значение; и в том случае, если фракционная концентрация не превышает минимальное значение, маркировку указанного биологического образца как непригодного для анализа.
  33. 33. Способ по п.32, отличающийся тем, что минимальное значение определяют на основе ожидаемой разности между уровнями метилирования для опухоли и референсного уровня метилирования.
  34. 34. Способ по п.1, где вычисление первого уровня метилирования также включает измерение размера молекул ДНК, расположенных в множестве сайтов; и нормировку первого уровня метилирования на основе измеренных размеров молекул ДНК перед сравнением первого уровня метилирования с первым предельным значением.
  35. 35. Способ по п.34, отличающийся тем, что нормировка первого уровня метилирования на основе измеренных размеров включает отбор молекул ДНК, имеющих первый размер, где первый размер является предопределенным; и использование выбранных молекул ДНК для расчета первого уровня метилирования, первое предельное значение соответствует первому размеру.
  36. 36. Способ по п.35, отличающийся тем, что первый размер представляет собой диапазон длин.
  37. 37. Способ по п.35, отличающийся тем, что молекулы ДНК выбирают на основании физического разделения молекул ДНК по размеру.
  38. 38. Способ по п.35, отличающийся тем, что осуществление чувствительного к метилированию массивного параллельного секвенирования дает пару последовательностей для каждой молекулы ДНК, и отбор молекул ДНК первого размера включает определение размера молекул ДНК путем сравнения пар последовательностей множества молекул ДНК с референсным геномом; и отбор молекул ДНК, имеющих первый размер.
  39. 39. Способ по п.34, отличающийся тем, что нормировка первого уровня метилирования на основе измеренных размеров включает определение функциональной зависимости между размером и уровнями метилирования, где функциональную зависимость определяют путем измерения уровней метилирования молекул ДНК различных размеров и построения графика измеренных значений; и использование указанной функциональной зависимости для нормировки первого уровня метилирования, где указанная функциональная зависимость обеспечивает масштабирующие значения, соответствующие соответствующим размерам.
  40. 40. Способ по п.39, где использование функциональной зависимости для нормировки первого уровня метилирования включает вычисление среднего размера, соответствующего молекулам ДНК, используемым для расчета первого уровня метилирования; и умножение указанного первого уровня метилирования на соответствующее масштабирующее значение.
  41. 41. Способ по п.39, где использование функциональной зависимости для нормировки первого уровня метилирования включает для каждого из множества сайтов:
    для каждой из молекул ДНК, локализованных в указанном сайте:
    получение соответствующего размера молекулы ДНК в указанном сайте; и использование масштабирующего значения, соответствующего указанному соответствующему размеру, для нормировки вклада молекулы ДНК в соответствующее количество молекул ДНК, которые метилированы в указанном сайте.
  42. 42. Способ по п.1, отличающийся тем, что множество сайтов включает CpG-сайты, причем указанные CpG-сайты организованы во множество CpG-островков, каждый CpG-островок включает один или большее количество CpG-сайтов, при этом первый уровень метилирования соответствует первому CpGостровку множества CpG-островков.
  43. 43. Способ по п.42, где каждый из CpG-островков отбирается как имеющий среднее значение плотности метилирования, которое ниже желаемого процента в референсной группе образцов других организмов, и где каждый из CpG-островков отбирается как имеющий коэффициент вариации для средней плотности метилирования в референсной группе ниже желаемого процента множества CpG-островков.
  44. 44. Способ по п.42, также включающий для каждого из CpG-островков:
    определение того, гиперметилирован ли CpG-островок относительно референсной группы образцов от других организмов путем сравнения уровня метилирования CpG-островка с соответствующим предельным значением;
    - 91 042157 для каждого из гиперметилированных CpG-островков:
    определение соответствующей плотности метилирования;
    вычисление кумулятивного показателя по соответствующим плотностям метилирования; и сравнение указанного кумулятивного показателя с кумулятивным предельным значением для определения первой классификации.
  45. 45. Способ по п.44, отличающийся тем, что вычисление кумулятивного показателя по соответствующим плотностям метилирования включает для каждого из гиперметилированных CpG-островков:
    вычисление соответствующей разности между соответствующей плотностью метилирования и референсной плотностью; и вычисление соответствующей вероятности, которая является вероятностью получения соответствующей разницы случайно согласно статистическому распределению; и применение суммы соответствующих вероятностей для определения кумулятивного показателя.
  46. 46. Способ по п.45, отличающийся тем, что кумулятивный показатель определяют путем:
    для каждого гиперметилированного CpG-островка гиперметилированных CpG-островков:
    вычисления логарифма соответствующей вероятности для получения соответствующего логарифмического результата; и вычисления суммы, включающей соответствующие логарифмические результаты.
  47. 47. Способ по п.45, отличающийся тем, что каждая соответствующая разность нормирована по стандартному отклонению, связанному с референсной плотностью.
  48. 48. Способ по п.44, отличающийся тем, что кумулятивное предельное значение соответствует максимальному кумулятивному показателю референсной группы.
  49. 49. Способ по п.44, отличающийся тем, что определение того, гиперметилирован ли первый CpGостровок, включает сравнение первого уровня метилирования с первым предельным значением и со вторым предельным значением, при этом первое предельное значение соответствует среднему значению плотностей метилирования для референсной группы плюс 2%, а второе предельное значение соответствует трем стандартным отклонениям плюс среднее значение плотностей метилирования для референсной группы.
  50. 50. Способ по п.1, также включающий для каждой из первого множества областей генома:
    определение соответствующего количества молекул ДНК как происходящих из указанной области; вычисление соответствующего нормированного значения по соответствующему количеству; и сравнение указанного соответствующего нормированного значения с референсным значением для определения того, наблюдается ли в соответствующей области делеция или амплификация;
    определение первого набора областей, все из которых, как было определено, демонстрируют чтолибо одно из делеции, амплификации или нормальной представленности, при этом первый уровень метилирования соответствует первому набору областей;
    определение второго набора областей, все из которых, как определено, демонстрируют что-либо второе из делеции, амплификации или нормальной представленности; и вычисление второго уровня метилирования на основе соответствующих количеств молекул ДНК, метилированных в сайтах второго набора областей, при этом сравнение первого уровня метилирования с первым предельным значением включает вычисление параметра, связывающего первый уровень метилирования и второе метилирование, где параметр включает отношение или разницу между первым уровнем метилирования и вторым уровнем метилирования; и сравнение указанного параметра с первым предельным значением.
  51. 51. Способ по п.50, отличающийся тем, что первый уровень метилирования представляет собой статистический показатель, отражающий уровень метилирования области, рассчитанный для каждой области из первого набора областей, и при этом второй уровень метилирования представляет собой статистический показатель уровней метилирования области, рассчитанный для каждой области второго набора областей.
  52. 52. Способ по п.51, отличающийся тем, что указанный статистический показатель определяют с применением t-критерия Стьюдента, дисперсионного анализа (ANOVA) или критерия Краскела-Уоллиса.
  53. 53. Способ по п.50, отличающийся тем, что вычисление указанного параметра включает применение распределения вероятностей к отношению или разности для получения вероятности, являющейся параметром.
  54. 54. Способ по любому из пп.1, 5-53, в котором указанный биологический образец получают таким способом, чтобы получить молекулы нуклеиновой кислоты, которые свободны от клеток в биологическом образце.
  55. 55. Способ по п.54, в котором биологический образец выбирают из группы, состоящей из плазмы и сыворотки крови.
    - 92 042157
  56. 56. Способ по п.54, в котором биологический образец получают центрифугированием.
  57. 57. Машиночитаемый носитель, хранящий множество инструкций, которые нужны при выполнении управляющих команд компьютерной системой для реализации способа, описанного здесь, причем указанные инструкции включают стадии по любому из пунктов, представленных выше.
  58. 58. Компьютерная система, содержащая один и более процессоров и машиночитаемый носитель, хранящий множество инструкций, которые нужны при выполнении управляющих команд компьютерной системой для реализации способа по любому из пп.1 и 5-56.
EA201500327 2012-09-20 2013-09-20 Неинвазивное определение метилома плода или опухоли по плазме EA042157B1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US61/703,512 2012-09-20
US13/842,209 2013-03-15
US61/830,571 2013-06-03

Publications (1)

Publication Number Publication Date
EA042157B1 true EA042157B1 (ru) 2023-01-19

Family

ID=

Similar Documents

Publication Publication Date Title
JP6985753B2 (ja) 血漿による胎児または腫瘍のメチロームの非侵襲的決定
US20150011403A1 (en) Non-invasive determination of methylome of tumor from plasma
US10706957B2 (en) Non-invasive determination of methylome of tumor from plasma
EA042157B1 (ru) Неинвазивное определение метилома плода или опухоли по плазме