EA033752B1 - Способ определения по меньшей мере части генома плода на основе анализа материнского биологического образца - Google Patents

Способ определения по меньшей мере части генома плода на основе анализа материнского биологического образца Download PDF

Info

Publication number
EA033752B1
EA033752B1 EA201200690A EA201200690A EA033752B1 EA 033752 B1 EA033752 B1 EA 033752B1 EA 201200690 A EA201200690 A EA 201200690A EA 201200690 A EA201200690 A EA 201200690A EA 033752 B1 EA033752 B1 EA 033752B1
Authority
EA
Eurasian Patent Office
Prior art keywords
loci
alleles
genome
inherited
fetus
Prior art date
Application number
EA201200690A
Other languages
English (en)
Other versions
EA201200690A1 (ru
Inventor
Yuk Ming Dennis Lo
Kwan Chee Chan
Wai Kwun Rossa Chiu
Charles Cantor
Original Assignee
Univ Hong Kong Chinese
Sequenom Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Hong Kong Chinese, Sequenom Inc filed Critical Univ Hong Kong Chinese
Publication of EA201200690A1 publication Critical patent/EA201200690A1/ru
Publication of EA033752B1 publication Critical patent/EA033752B1/ru

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/14Heterocyclic carbon compound [i.e., O, S, N, Se, Te, as only ring hetero atom]
    • Y10T436/142222Hetero-O [e.g., ascorbic acid, etc.]
    • Y10T436/143333Saccharide [e.g., DNA, etc.]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Evolutionary Computation (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Заявлены способы и устройства для определения по меньшей мере части генома плода. Фрагменты ДНК из материнского образца (ДНК матери и плода) подвергаются анализу для идентификации аллелей по определенным локусам. Можно установить общее количество фрагментов ДНК соответствующих аллелей в этих локусах для определения относительного количества гаплотипов по этим локусам и определить, какие гаплотипы унаследованы из родительских геномов. Также можно выявить локусы, по которым родители гомозиготны и гетерозиготны для определения участков генома плода. Вместе с анализом фрагментов ДНК из материнского образца для определения геномов матери и отца можно использовать контрольные гаплотипы, распространенные в популяции. Также обсуждаются способы определения мутаций, фракционной концентрации ДНК плода в материнском образце и степени охвата секвенированием фрагментов ДНК материнского образца.

Description

Перекрестные ссылки на родственные заявки
Заявка на настоящий патент претендует на приоритет от и является непредварительным вариантом предварительной заявки на патент США № 61/258567, озаглавленной Анализ генома плода и поданной 5 ноября 2009 г., предварительной заявки на патент США № 61/259075, озаглавленной Анализ генома плода из материнского биологического образца и поданной 6 ноября 2009 г., и предварительной заявки на патент США № 61/381854, озаглавленной Анализ генома плода из материнского биологического образца и поданной 10 сентября 2010 г., все содержание которых включено путем ссылки на все случаи.
Заявка на настоящий патент также связана с заявкой на патент США № 12/178181, озаглавленной Диагностика хромосомной анеуплоидии у плода при помощи массированного параллельного секвенирования генома и поданной 5 ноября 2009 г. (Attorney Docket № 016285-005220US); заявкой на патент США № 12/614350, озаглавленной Диагностика хромосомной анеуплоидии у плода при помощи секвенирования генома с обогащением (Attorney Docket № 016285-005221US), и поданной одновременно с ней заявкой США, озаглавленной Анализ генома на основе размера (Attorney Docket № 016285006610US), все содержание которых включено путем ссылки на все случаи.
Уровень техники
Настоящее изобретение, в общем, касается анализа генома плода на основе материнского образца, в частности, определения всего или части генома плода на основе анализа генетических фрагментов в материнском образце.
Открытие бесклеточных нуклеиновых кислот зародыша в материнской плазме в 1997 г. открыло новые возможности для неинвазивной пренатальной диагностики (Lo Y.M.D. et al., 1997, 350: 485-487; и US Patent 6285540). Эта технология быстро воплотилась в клинические применения с детектированием полученных плодом по отцовской линии генов или последовательностей, например, для определения пола у плода, определения статуса RhD у плода и установления того, унаследовал ли он передающуюся по отцовской линии мутацию (Amicucci P. et al., Clin. Chem. 2000, 46: 301-302; Saito H. et al., Lancet 2000, 356: 1170; и Chiu R.W.K. et al., Lancet 2002, 360: 998-1000). Недавний прогресс в этой области сделал возможной пренатальную диагностику хромосомной анеуплоидии у плода типа трисомии 21 из анализа нуклеиновых кислот в материнской плазме (Lo Y.M.D. et al., Nat Med 2007, 13: 218-223; Tong Y.K. et al., Clin. Chem. 2006, 52: 2194-2202; US Patent Publication 2006/0252071; Lo Y.M.D. et al., Proc. Natl. Acad. Sci. USA 2007, 104: 13116-13121; Chiu R.W.K. et al., Proc. Natl. Acad. Sci. USA 2008, 105: 20458-20463; Fan H.C. et al., Proc. Natl. Acad. Sci. 2008, 105: 16266-16271; US Patent Publication 2007/0202525; и US Patent Publication 2009/0029377).
Другая область значительного прогресса последнего времени - это применение способов подсчета отдельных молекул типа цифровой ПЦР для неинвазивной пренатальной диагностики моногенных болезней, при которых и мать, и отец несут одну и ту же мутацию. Это достигается анализом относительной дозы мутации (RMD) в материнской плазме (US Patent Application 2009/0087847; Lun F.M.F. et al., Proc. Natl. Acad. Sci. USA 2008, 105: 19920-19925; и Chiu R.W.K. et al., Trends Genet 2009, 25: 324-331).
Однако в таких методах используются уже существующие знания о возможных мутациях для анализа конкретных частей генома, поэтому ими нельзя идентифицировать латентные или редкие мутации или генетические заболевания. Следовательно, нужно предоставить новые методы, системы и приборы, которыми можно идентифицировать весь или часть генома у плода при помощи неинвазивных методов.
Сущность изобретения
В некоторых воплощениях настоящего изобретения предусмотрены способы, системы и приборы для определения по меньшей мере части генома еще не рожденного плода у беременной матери. Можно составить генетическую карту всего генома или отдельных участков генома плода до рождения, используя образцы, содержащие генетический материал плода и матери (например, образец крови беременной матери). Генетическая карта может содержать последовательности, которые плод унаследовал от обоих родителей, или же только последовательности от одного из родителей. Исходя из одной или нескольких таких генетических карт, можно определить риск возникновения у плода генетического заболевания или предрасположенности к генетическому или другому заболеванию или генетической особенности. В одном воплощении можно подвергнуть анализу фрагменты ДНК из материнского образца (содержащего ДНК матери и плода) для идентификации аллелей по некоторым заданным локусам (ориентирам). Затем можно проанализировать общее количество фрагментов ДНК соответствующих аллелей в этих локусах для определения относительного количества гаплотипов по этим локусам и тем самым определить, какие гаплотипы унаследованы плодом из материнского и/или отцовского генома. Идентифицируя гаплотипы плода, можно определить генотип плода по индивидуальным локусам в соответствующем участке генома, включая заданные локусы. В различных воплощениях локусы, по которым родители представлены определенными комбинациями гомозиготных и гетерозиготных, можно подвергнуть анализу таким образом, чтобы определить участки генома плода. В одном воплощении для определения материнского и отцовского геномов используются контрольные гаплотипы, представляющие распространенные в популяции гаплотипы, вместе с анализом фрагментов ДНК материнского образца. Также предусмотрены и другие воплощения, как-то определение мутаций, определение доли плода в образце матери и определение охвата секвенированием материнского образца.
- 1 033752
Другие воплощения изобретения касаются систем, приборов и считываемых компьютером носителей, связанных с описанными здесь способами. В одном воплощении считываемый компьютером носитель содержит инструкции для получения данных и анализа данных, но не инструкции для направления машины на создание данных (например, секвенирование молекул нуклеиновых кислот). А в другом воплощении считываемый компьютером носитель содержит инструкции для направления машины на создание данных. В одном воплощении компьютерный программный продукт включает считываемый компьютером носитель, хранящий множество инструкций для управления процессором при выполнении операций для описанных здесь способов. Воплощения также касаются компьютерных систем, конфигурированных на выполнение стадий любого из описанных здесь способов, необязательно с различными компонентами, выполняющими соответствующую стадию или соответствующую группу стадий.
При обращении к остальным частям описания, включая рисунки и формулу изобретения, будут реализованы другие особенности и преимущества воплощений настоящего изобретения. Дополнительные особенности и преимущества, а также структура и действие различных воплощений настоящего изобретения подробно описаны ниже с привлечением сопроводительных рисунков. На рисунках одинаковые номера обозначений могут означать идентичные или функционально близкие элементы.
Краткое описание фигур
На фиг. 1 представлена блок-схема способа определения 100 по меньшей мере части генома еще не рожденного плода беременной женщины согласно воплощениям настоящего изобретения.
На фиг. 2 представлены два гаплотипа у отца и два гаплотипа у матери для определенного сегмента соответствующего им геномного кода согласно воплощениям настоящего изобретения.
На фиг. 3 представлены два типа SNP у родительских гаплотипов из фиг. 2 согласно воплощениям настоящего изобретения.
На фиг. 4А и 4В представлен анализ для определения гаплотипов плода для двух типов SNP согласно воплощениям настоящего изобретения.
На фиг. 5А и 5В представлен сравнительный анализ относительного количества (например, встречаемости) фрагментов по каждому локусу и того, что результат сравнения классифицирует определенный генотип как наследуемый или нет, согласно воплощениям настоящего изобретения.
На фиг. 6 представлен эффект изменения отношения вероятностей при классификации по SPRT согласно воплощениям настоящего изобретения.
На фиг. 7 представлена блок-схема способа определения 700 по меньшей мере части генома, унаследованной от отца, у еще не рожденного плода беременной женщины согласно воплощениям настоящего изобретения.
На фиг. 8 представлена блок-схема способа определения 800 по меньшей мере части генома у еще не рожденного плода беременной женщины на участке, в котором отец и мать гетерозиготны, согласно воплощениям настоящего изобретения.
На фиг. 9 представлены гаплотипы отца и матери, которые оба гетерозиготны на определенном участке генома согласно воплощениям настоящего изобретения.
На фиг. 10 представлена блок-схема способа определения 1000 фракционной концентрации материала плода в материнском образце согласно воплощениям настоящего изобретения.
На фиг. 11 представлена блок-схема способа определения того, что локус является информативным согласно воплощениям настоящего изобретения.
На фиг. 12А и 12В представлено прогнозируемое распределение встречаемости для аллеля Т (наименее распространенный аллель в сценариях (а) и (с)) по трем сценариям в предположении, что фракционная концентрация ДНК плода составляет 20 и 5% соответственно, согласно воплощениям настоящего изобретения.
На фиг. 13А, 13В и 14 представлено прогнозируемое распределение встречаемости для наименее распространенного аллеля при фракционной концентрации ДНК плода в 20% при различном общем числе молекул, соответствующих SNP, согласно воплощениям настоящего изобретения.
На фиг. 15А и 15В представлены примеры контрольных гаплотипов, родительских гаплотипов, полученных от контрольных гаплотипов, и возникающие при этом гаплотипы плода согласно воплощениям настоящего изобретения.
На фиг. 16 представлена блок-схема способа определения 1600 по меньшей мере части генома плода, когда известен набор контрольных гаплотипов, но не известны родительские гаплотипы, согласно воплощениям настоящего изобретения.
На фиг. 17 представлен пример определения информативных локусов при анализе фрагментов ДНК из материнского образца согласно воплощениям настоящего изобретения.
На фиг. 18 представлены три контрольных гаплотипа (Hap А, Hap В и Hap С) и отцовские аллели.
На фиг. 19 представлено определение родительского гаплотипа по отцовским аллелям согласно воплощениям настоящего изобретения.
На фиг. 20 представлено вычисление материнских генотипов при анализе материнского образца согласно воплощениям настоящего изобретения.
На фиг. 21 представлено воплощение для определения материнских гаплотипов из материнских ге- 2 033752 нотипов и контрольных гаплотипов согласно воплощениям настоящего изобретения.
На фиг. 22 представлены материнские гаплотипы и наследуемые по отцовской линии гаплотипы, определенные согласно воплощениям настоящего изобретения.
На фиг. 23 представлены различные типы локусов (альфа (А) и бета (В)) для материнских гаплотипов относительно отцовского гаплотипа согласно воплощениям настоящего изобретения.
На фиг. 24 представлена блок-схема, иллюстрирующая способ идентификации 2400 мутаций de novo в геноме еще не рожденного плода у беременной женщины.
На фиг. 25А представлено абсолютное количество и процентное содержание SNP, представляющих различные комбинации генотипов для отца, матери и плода (CVS) согласно воплощениям настоящего изобретения.
На фиг. 25В представлена таблица, в которой приведена статистика совмещения по первым 20 проточным кюветам.
На фиг. 26 представлена таблица, в которой приведены фракционные концентрации ДНК плода, рассчитанные по SNP двумя способами согласно воплощениям настоящего изобретения.
На фиг. 27А представлен график, иллюстрирующий наблюдаемый процент SNP в той подгруппе, в которой аллель плода наблюдается по данным секвенирования при анализе первых 20 проточных кювет, а на фиг. 27В представлен график охвата от количества прочитанных отрезков согласно воплощениям настоящего изобретения.
На фиг. 28А и 28В представлены графики корреляции между охватом наследуемых по отцовской линии аллелей и числом картируемых прочтений последовательности и количеством секвенируемых проточных кювет, соответственно, согласно воплощениям настоящего изобретения.
На фиг. 29А представлена корреляция между долей ложно-положительных и количеством секвенируемых проточных кювет, а на фиг. 29В представлена корреляция между долей ложно-положительных и количеством секвенируемых проточных кювет согласно воплощениям настоящего изобретения.
На фиг. 30 представлен охват специфичных для плода SNP при различном числе анализируемых проточных кювет согласно воплощениям настоящего изобретения.
На фиг. 31 представлена точность анализа типа А при использовании данных от 10 проточных кювет согласно воплощениям настоящего изобретения.
На фиг. 32 представлена точность анализа типа В при использовании данных от 10 проточных кювет согласно воплощениям настоящего изобретения.
На фиг. 33 представлена точность анализа типа А при использовании данных от 20 проточных кювет согласно воплощениям настоящего изобретения.
На фиг. 34 представлена точность анализа типа В при использовании данных от 20 проточных кювет согласно воплощениям настоящего изобретения.
На фиг. 35А и 35В представлены отрезки последовательностей с мутациями и отрезки дикого типа по кодонам 41/42 согласно воплощениям настоящего изобретения.
На фиг. 36 представлена таблица анализа RHDO типа А, а на фиг. 37 представлен анализ RHDO типа В согласно воплощениям настоящего изобретения.
На фиг. 38А и 38В представлены результаты классификации по SPRT для случая PW226 в качестве примера.
На фиг. 39 представлена таблица, суммирующая результаты анализа RHDO для пяти случаев согласно воплощениям настоящего изобретения.
На фиг. 40 представлен график полноты секвенирования от числа секвенируемых проточных кювет согласно воплощениям настоящего изобретения.
На фиг. 41 представлен график размера последовательностей плода и общих последовательностей для всего генома, а на фиг. 42А-42С представлены аналогичные графики индивидуально для каждой хромосомы согласно воплощениям настоящего изобретения.
На фиг. 43 представлена блок-схема примера компьютерной системы 4300, применяемой с системой и способами согласно воплощениям настоящего изобретения.
Определения
Термин биологический образец в настоящем изобретении относится к любым образцам, взятым у субъекта (например, человека, как беременной женщины) и содержащим одну или несколько представляющих интерес молекул нуклеиновой кислоты.
Термин нуклеиновая кислота или полинуклеотид относится к дезоксирибонуклеиновой кислоте (ДНК) или рибонуклеиновой кислоте (РНК) и их полимерам как в одноцепочечном, так и двухцепочечном виде. Если не оговорено особо, термин охватывает нуклеиновые кислоты, содержащие известные аналоги природных нуклеотидов, обладающие такими же свойствами связывания, как и стандартная нуклеиновая кислота, и подвергающиеся метаболизму таким же образом, как и природные нуклеотиды. Если не указано иначе, конкретная последовательность нуклеиновой кислоты также косвенным образом охватывает ее консервативно модифицированные варианты (например, замены на вырожденные кодоны), аллели, ортологи, SNPs и комплементарные последовательности, а также последовательности, ука- 3 033752 занные в явном виде. В частности, замены на вырожденные кодоны могут осуществляться путем создания последовательностей, в которых у одного или несколько отдельных (либо всех) кодонов в третьем положении произведены замены на смешанные основания и/или остатки дезоксинозина (Batzer et al., Nucleic Acid Res. 19:5081 (1991); Ohtsuka et al., J. Biol. Chem. 260:2605-2608 (1985); и Rossolini et al., Mol. Cell. Probes 8:91-98 (1994)). Термин нуклеиновая кислота применяется взаимозаменяемо с геном, кДНК, мРНК, небольшими некодирующими РНК, микроРНК (miRNA), взаимодействующими с Piwi-PHK и короткими шпилечными РНК (shRNA), кодируемыми геном или локусом.
Термин ген обозначает сегмент ДНК, участвующий в вырабатывании полипептидной цепи или транкрибируемого продукта РНК. Он может включать участки, предшествующие или последующие за кодирующим участком (лидерные или трейлерные), а также промежуточные последовательности (интроны) между отдельными кодирующими сегментами (экзонами).
Термин клинически значимая последовательность нуклеиновой кислоты (также именуется последовательностью мишени или хромосомой) в настоящем изобретении может обозначать полинуклеотидную последовательность, соответствующую сегменту большей геномной последовательности, возможный дисбаланс которой проверяется, или самой этой большей геномной последовательности. Одним из примеров является последовательность хромосомы 21. Другие примеры включают хромосомы 18, 13, X и Y.
Еще другие примеры включают мутированные генетические последовательности или генетические полиморфизмы или вариации числа копий, которые плод может унаследовать от одного или от обоих родителей или в качестве мутации de novo у плода. В некоторых воплощениях для получения данных для выявления дисбаланса может использоваться множество клинически значимых последовательностей нуклеиновых кислот или же множество маркеров клинически значимой последовательности нуклеиновой кислоты. Например, для определения возможного нарушения в хромосоме 21 можно аддитивно использовать данные из пяти несмежных последовательностей на хромосоме 21, при этом требуемый объем образца эффективно снижается до 1/5.
Термин на основе в настоящем изобретении означает по крайней мере частично на основе и относится к одной величине (или результату), которая используется для определения другой величины, как это происходит на входе способа и на выходе этого способа. Термин выводить в настоящем изобретении также относится к взаимоотношению между входными данными способа и результатом этого способа, как это происходит тогда, когда выведение означает вычисление по формуле.
Термин параметр в настоящем изобретении обозначает численное значение, характеризующее набор количественных данных и/или количественное взаимоотношение между наборами числовых данных. Например, параметром является соотношение (или функция отношения) между первым количеством первой последовательности нуклеиновой кислоты и вторым количеством второй последовательности нуклеиновой кислоты.
В настоящем изобретении термин локус или его множественная форма локусы обозначает расположение или адрес любого отрезка нуклеотидов (или пар оснований), имеющего вариации между геномами.
Термин дисбаланс последовательности в настоящем изобретении означает любое значительное отклонение, определяемое по меньшей мере одним значением отсечения, по количеству клинически значимой последовательности нуклеиновой кислоты от стандартного количества. Дисбаланс последовательности может включать хромосомный дисбаланс, аллельный дисбаланс, мутационный дисбаланс, дисбаланс по гаплотипу и другие аналогичные дисбалансы. В качестве примера: аллельный или мутационный дисбаланс происходит тогда, когда генотип плода отличается от материнского, при этом возникает дисбаланс по определенному локусу в образце.
Термин хромосомная анеуплоидия в настоящем изобретении означает изменение числа хромосом от диплоидного набора в геноме. Изменение может быть приобретением или потерей. Оно может включать целую хромосому или участок хромосомы.
Термин гаплотип в настоящем изобретении относится к комбинации аллелей по множественным локусам, которые передаются вместе на одной и той же хромосоме или участке хромосомы. Гаплотип может относиться всего лишь к одной паре локусов или к участку хромосомы либо ко всей хромосоме. Термин аллели относится к альтернативным последовательностям ДНК в одном и том же физическом локусе генома, которые могут или не могут приводить к различным фенотипическим признакам. В каком-либо определенном диплоидном организме с двумя копиями каждой хромосомы (за исключением половых хромосом у мужчин) генотип для каждого гена содержит пару аллелей, присутствующих в таком локусе, которые являются одинаковыми у гомозигот и разными у гетерозигот. Популяция организмов или вид обычно содержит несколько аллелей в каждом локусе у различных индивидов. Геномный локус, по которому в популяции обнаруживается более одного аллеля, называется полиморфным сайтом. Аллельные вариации в локусе измеряются числом аллелей (т.е. степенью полиморфизма) или пропорцией гетерозигот (т.е. гетерозиготностью) в популяции. В настоящем изобретении термин полиморфизм относится к любым вариациям между особями в геноме человека, независимо от их частоты. Примеры таких вариаций включают, без ограничения, полиморфизм по одному нуклеотиду, полиморфизмы типа
- 4 033752 простых тандемных повторов, полиморфизмы типа вставки-делеции, мутации (которые могут вызывать болезни) и вариации по числу копий.
Раскрытие сущности изобретения
Составление частичной генетической карты или полной геномной последовательности еще не рожденного плода может осуществляться на основе гаплотипов полиморфных последовательностей его родителей. Термин гаплотип в настоящем изобретении обозначает комбинацию аллелей по множественным локусам, которые переносятся вместе на одну и ту же хромосому или участок хромосомы. Например, в воплощениях можно подвергнуть анализу фрагменты ДНК из материнского образца (содержащие ДНК матери и плода) для идентификации аллелей по некоторым заданным локусам (маркерам). Затем можно проанализировать общее количество фрагментов ДНК соответствующих аллелей в этих локусах для определения относительного количества гаплотипов по этим локусам и тем самым определить, какие гаплотипы унаследованы плодом из материнского и/или отцовского генома. Идентифицируя гаплотипы плода, можно определить генотип плода по индивидуальным локусам в соответствующем участке генома, включая заданные локусы. В различных воплощениях локусы, по которым родители представлены определенными комбинациями гомозигот и гетерозигот, можно подвергнуть анализу таким образом, чтобы определить участки генома плода. В одном воплощении для определения материнского и отцовского геномов используются контрольные гаплотипы, представляющие распространенные в популяции гаплотипы, вместе с анализом фрагментов ДНК материнского образца.
Примером применения одного воплощения для определения по меньшей мере части генома плода может служить определение отцовства путем сравнения выведенного генотипа или гаплотипа плода с генотипом или гаплотипом предполагаемого отца. Другим примером является выявление одной или нескольких приобретенных зародышем мутаций de novo или выявление случаев мейотической рекомбинации, произошедших во время образования гамет у его родителей. Это те гаметы, которые подверглись оплодотворению, а из полученной зиготы развился плод.
Кроме того, некоторые воплощения также дают возможность определить геномную последовательность еще не рожденного плода с требуемым разрешением. Например, в некоторых применениях воплощения можно определить полную или близкую к полной геномную последовательность еще не рожденного плода. В одном воплощении разрешение определяемой геномной последовательности плода зависит от знания геномов отца и матери вместе с информацией по секвенированию материнского биологического образца, содержащего нуклеиновые кислоты плода. В том случае, когда известны полные или почти полные геномные последовательности отца и матери, можно вывести полную или почти полную геномную последовательность еще не рожденного плода.
В других воплощениях выясняются только геномные последовательности отдельных участков генома, например, для пренатальной диагностики выбранных генетических, эпигенетических (таких как нарушения импринтинга) или хромосомных нарушений. Примеры генетических нарушений, к которым может применяться воплощение, включают гемоглобинопатии (как-то бета-талассемия, альфаталассемия, серповидно-клеточная анемия, болезнь гемоглобина Е), кистозный фиброз и связанные с полом заболевания (как-то гемофилия и мышечная дистрофия Дюшенна). Дополнительные примеры мутаций, которые можно определить при помощи воплощения, можно найти в Online Mendelian Inheritance in Man (www.ncbi.nlm.nih.gov/omim/getmorbid.cgi).
Некоторые воплощения также могут применяться для определения фракционной концентрации ДНК плода, которое может выполняться без предварительного знания конкретных геномов родителей. Аналогичный анализ также может примениться для определения полноты охвата, необходимой для точного определения генома плода. Так, определение охвата может применяться для оценки того, сколько нужно проанализировать данных, чтобы получить точные результаты.
I. Введение.
Когда в качестве материала для выяснения гаплотипа плода используется материнский образец (например, плазма или сыворотка), могут возникнуть две основные проблемы. Первая проблема состоит в том, что материнская плазма или сыворотка состоит из смеси ДНК плода и матери, причем ДНК плода составляет незначительную популяцию. Установлено, что средняя/медианная доля ДНК плода составляет от 5 до 10% от общей ДНК в материнской плазме в первые два триместра беременности (Lo Y.M.D. et al., Am J Hum Genet 1998, 62: 768-775; Lun FMF et al., Clin. Chem. 2008, 54: 1664-1672). Поскольку ДНК высвобождается материнскими клетками крови в процессе свертывания крови, фракционная концентрация ДНК плода в материнской сыворотке может быть даже меньше, чем в материнской плазме. Поэтому в некоторых воплощениях материнская плазма предпочтительнее, чем материнская сыворотка.
Вторая проблема заключается в том, что ДНК плода и ДНК матери в материнской плазме состоят из коротких фрагментов (Chan K.C.A. et al., Clin. Chem. 2004, 50: 88-92). Так, в материнской плазме ДНК, происходящая от плода, обычно короче, чем ДНК, происходящая от матери. Большая часть ДНК плода в материнской плазме имеет длину менее 200 п.о. При использовании таких коротких фрагментов ДНК в плазме самих по себе будет трудно составить гаплотип генетических полиморфизмов на длинных отрезках генома. Вышеуказанные проблемы в отношении материнской плазмы и сыворотки также применимы и к выявлению ДНК плода в моче матери (Botezatu I. et al., Clin. Chem. 2000, 46: 1078-1084). ДНК плода
- 5 033752 составляет лишь небольшую долю ДНК в моче беременной женщины, и ДНК плода в моче матери тоже состоит из коротких фрагментов ДНК.
А. Секвенирование и анализ материнского образца.
Подход, предпринятый в некоторых воплощениях для того, чтобы справиться с первой проблемой, состоит в применении способа, позволяющего с высокой точностью количественно генотипировать нуклеиновые кислоты, полученные из материнского биологического образца. В одном воплощении такого подхода точность достигается путем анализа большого числа (к примеру, миллионов или миллиардов) молекул нуклеиновой кислоты. Более того, точность можно повысить путем анализа отдельных молекул нуклеиновой кислоты или клональной амплификации отдельных молекул нуклеиновой кислоты. В одном воплощении применяется массированное параллельное секвенирование ДНК типа того, что выполняется на платформе Illumina Genome Analyzer (Bentley D.R. et al., Nature 2008, 456: 53-59), платформе Roche 454 (Margulies M. et al., Nature 2005, 437: 376-380), платформе ABI SOLiD (McKernan K.J. et al., Genome Res 2009, 19: 1527-1541), платформе секвенирования отдельных молекул Helicos (Harris T.D. et al., Science 2008, 320: 106-109), секвенирования в реальном времени с использованием отдельных молекул полимеразы (Science 2009, 323: 133-138) и нанопорового секвенирования (Clarke J. et al., Nat. Nanotechnol. 2009, 4: 265-70). В одном воплощении массированное параллельное секвенирование выполняется на случайном подмножестве молекул нуклеиновой кислоты в биологическом образце.
В некоторых воплощениях может оказаться выгодным считывание как можно более длинной последовательности с каждой молекулы. Одним из ограничений длины считывания последовательности может быть природа молекул нуклеиновой кислоты в материнском биологическом образце. Например, известно, что большинство молекул ДНК в материнской плазме состоят из коротких фрагментов (Chan
C.A. et al., Clin. Chem. 2004, 50: 88-92). Более того, длина считывания должна уравновешиваться надежностью системы секвенирования при большой длине считывания. Для некоторых из вышеприведенных систем может оказаться предпочтительным секвенирование с обоих концов молекулы, так называемое секвенирование по спаренным концам. В качестве примера: один из подходов состоит в том, чтобы просеквенировать по 50 п.о. с каждого конца молекулы ДНК, получая в итоге последовательность из 100 п.о. на молекулу. В другом воплощении секвенируют по 75 п.о. с каждого конца молекулы ДНК, получая в итоге последовательность из 150 п.о. на молекулу.
После выполнения секвенирования полученные последовательности выравниваются с контрольным геномом человека. Поскольку воплощения выявляют геномные вариации, унаследованные еще не рожденным плодом от родителей, то алгоритм выравнивания должен учитывать вариации последовательностей. Одним из примеров такого пакета программного обеспечения является программа Efficient LargeScale Alignment of Nucleotide Databases (ELAND) фирмы Illumina. Другим примером такого пакета программного обеспечения являются программы SOAP (short oligonucleotide alignment program, т.е. программа выравнивания коротких олигонуклеотидов) и SOAP2 (Li R. et al., Bioinformatics 2008, 24:713-714; Li R et al., Bioinformatics 2009, 25:1966-1967).
Степень секвенирования ДНК, которая может потребоваться для этого, может зависеть от разрешения, с которым нужно составить генетическую карту плода или геномную последовательность плода. В общем, чем больше молекул подвергается секвенированию, тем выше разрешение. Другим определяющим фактором разрешения генетической карты плода или геномной последовательности плода при данном уровне или полноте секвенирования ДНК является фракционная концентрация ДНК плода в материнском биологическом образце. В общем, чем больше фракционная концентрация ДНК плода, тем выше разрешение генетической карты плода или геномной последовательности плода, которое может быть получено при данном уровне секвенирования ДНК. Поскольку фракционная концентрация ДНК плода в материнской плазме выше, чем в материнской сыворотке, то для некоторых воплощений материнская плазма является более предпочтительным типом материнского биологического образца, чем материнская сыворотка.
Производительность вышеуказанных методов на основе секвенирования может быть повышена при помощи индексирования или штрих-кодирования. Так, к фрагментам нуклеиновых кислот в определенной библиотеке нуклеиновых кислот для секвенирования можно добавить специфичный для образца или пациента индекс или штрих-код. Затем можно смешать и просеквенировать вместе несколько таких библиотек, каждая со своим специфичным для образца или пациента индексом или штрих-кодом. После реакции секвенирования можно извлечь данные по секвенированию от каждого образца или пациента на основании штрих-кода или индекса. Такая стратегия может повысить производительность и тем самым рентабельность воплощений настоящего изобретения.
В одном воплощении молекулы нуклеиновой кислоты в биологическом образце можно подвергнуть отбору или фракционировать еще до количественного генотипирования (например, секвенирования). В одном варианте молекулы нуклеиновой кислоты обрабатываются с помощью устройства (например, микроматрицы), которое может предпочтительно связывать молекулы нуклеиновой кислоты из выбранных локусов в геноме (например, участка на хромосоме 7, содержащего ген CFTR). После этого секвенирование может выполняться предпочтительно на молекулах нуклеиновой кислоты, захваченных устройством. Такая схема позволяет нацелить секвенирование на представляющий интерес участок генома. В
- 6 033752 одном воплощении такой схемы можно использовать систему захвата последовательности Nimblegen (www.nimblegen.com/products/seqcap/index.html) либо систему обогащения мишени Agilent SureSelect
Target Enrichment System (www.opengenomics.com/SureSelect_Target_Enrichment_System) или похожие платформы. В некоторых воплощениях молекулы нуклеиновой кислоты из выбранных участков генома подвергаются рандомизированному секвенированию.
В другом воплощении представляющий интерес участок генома в биологическом образце сначала может подвергаться амплификации при помощи одного набора или нескольких наборов амплификационных праймеров. После этого может проводиться количественное генотипирование, к примеру, секвенирование продуктов амплификации. В одном исполнении такой схемы может использоваться система RainDance (www.raindancetech.com/technology/pcr-genomics-research.asp). В некоторых воплощениях амплифицированные молекулы нуклеиновой кислоты подвергаются рандомизированному секвенированию.
Молекулы нуклеиновой кислоты в биологическом образце также могут подвергаться фракционированию по размерам. Поскольку известно, что ДНК плода короче ДНК матери в материнском образце (Li et al., Clin. Chem. 2004, 50: 1002-1011; US Patent Application 20050164241; US Patent Application 20070202525), можно отобрать и затем использовать для количественного генотипирования, например, секвенирования, фракцию более мелких по размерам молекул. Такая фракция будет содержать большую долю ДНК плода по сравнению с исходным биологическим образцом. Так, секвенирование фракции, обогащенной ДНК плода, дает возможность составить генетическую карту плода или вывести геномную последовательность с более высоким разрешением при заданном уровне анализа (например, полноте секвенирования), чем при использовании не обогащенного образца. При этом технология станет более рентабельной. В качестве примера способов фракционирования по размерам можно использовать: (i) гельэлектрофорез с последующим экстрагированием молекул нуклеиновой кислоты из определенных частей геля; (ii) связывающие нуклеиновые кислоты матрицы с дифференциальным сродством к молекулам нуклеиновых кислот разного размера; или (iii) системы фильтрации с дифференциальным удержанием молекул нуклеиновых кислот разных размеров.
А в другом воплощении предпочтительно подвергаются анализу молекулы нуклеиновой кислоты определенного размера или диапазона размеров после секвенирования нуклеиновой кислоты. Например, можно проводить секвенирование по спаренным концам, при котором секвенирование происходит с обоих концов молекулы ДНК. Затем можно картировать геномные координаты обоих этих концов по контрольному геному человека. После этого можно вычислить размер молекулы вычитанием геномных координат двух концов. Один из способов проведения такого секвенирования по спаренным концам состоит в применении протокола секвенирования по спаренным концам Illumina Genome Analyzer. Другой способ выведения размера молекулы ДНК заключается в секвенировании всей молекулы ДНК. Проще всего это делается при помощи секвенирующих платформ с относительно большой протяженностью считывания типа платформы Roche 454 (Marguelis et al., Nature 2005, 437:376-380) и технологии отдельных молекул в реальном времени (SMRT™) фирмы Pacific Biosciences (Eid et al., Science 2009, 323: 133138). После вычисления размера молекул нуклеиновой кислоты можно сосредоточиться на последующем анализе молекул меньше определенного предела отсечения, при этом увеличивается фракционная концентрация ДНК плода. Анализ этого подмножества молекул позволяет составить генетическую карту плода или геномные последовательности плода с меньшим количеством анализируемых молекул после отбора по размерам, чем без такой процедуры. В одном воплощении используется предел отсечения в 300 п.о. В других воплощениях может использоваться предел отсечения в 250 п.о., 200 п.о., 180 п.о., 150 п.о., 125 п.о., 100 п.о. или 75 п.о.
В. Использование родительских геномов в качестве каркаса.
Для решения второй проблемы в некоторых воплощениях гаплотипы хромосом матери могут использоваться в качестве каркаса. А гаплотипы хромосом отца могут использоваться в качестве другого каркаса. Этот каркас можно сравнить с генетической информацией плода, полученной из материнского образца, содержащего ДНК плода. Такая генетическая информация плода может использоваться для определения того, как каркас матери и/или отца был развернут в геноме плода, используя при этом составные части каркаса для определения возникающего генома плода.
Родительские гаплотипы могут быть составлены из геномной ДНК отца и матери и других членов семьи, например, брата или сестры плода в текущей беременности. Возможно, что доступность родительских гаплотипов станет все более обычным явлением ввиду снижения стоимости секвенирования генома. В одном сценарии, если геномы одного или обоих родителей уже просеквенированы и их гаплотипы на одном или нескольких участках хромосом определены, то эта информация может использоваться в качестве вышеуказанного каркаса.
Можно использовать любые платформы генотипирования, известные в данной области, которые способны выявлять вариации последовательностей в геноме, включая секвенирование ДНК, микроматрицы, гибридизационные зонды, флуоресцентные методы, оптические методы, молекулярные штрихкоды и формирование изображений отдельных молекул (Geiss G.K. et al., Nat Biotechnol 2008, 26: 317325), анализ отдельных молекул, ПЦР, цифровую ПЦР, масс-спектрометрию (типа платформы Sequenom MassARRAY) и др. В качестве экстремального примера: можно определить последовательность ДНК
- 7 033752 отца и матери путем секвенирования всего генома методом массированного параллельного секвенирования (например, Bentley D.R. et al., Nature 2008, 456: 53-59; McKernan K.J. et al., Genome Res 2009, 19: 1527-1541). Примером вариаций последовательности, которые могут представлять интерес, являются полиморфизмы по отдельным нуклеотидам (SNP). Особенно предпочтительным способом определения родительских генотипов является анализ SNP на микроматрицах по всему геному или по отдельным участкам генома, например, содержащим гены, мутации которых могут вызывать генетические заболевания (как-то гены в бета-глобиновом кластере или вызывающий кистозный фиброз ген регулятора трансмембранной проводимости (CFTR)). Помимо вариаций последовательности, могут использоваться и вариации числа копий. Вариации последовательности и вариации числа копий именуются полиморфными генетическими признаками (PMF).
В одном аспекте материнские генотипы на представляющих интерес хромосомах или участках хромосом могут быть составлены в гаплотипы. Это может осуществляться путем анализа других членов семейства, родственных матери, например, сына или дочери матери, родителей, братьев и сестер и т.п. Гаплотипы можно составить и другими методами, которые хорошо известны в данной области и приведены выше.
Затем информацию по генотипам можно распространить на информацию по гаплотипам родителей путем сравнения информации по генотипам с другими членами семьи, к примеру, братьями и сестрами плода текущей беременности или по генотипам дедушек и бабушек и т.д. Гаплотипы родителей можно составить и другими методами, хорошо известными специалистам. Примеры таких методов включают методы на основе анализа отдельных молекул, как-то метод цифровой ПЦР (Ding С. and Cantor C.R., Proc. Natl. Acad. Sci. USA 2003, 100: 7449-7453; Ruano G. et al., Proc. Natl. Acad. Sci. USA 1990, 87: 62966300), гаплотипирование спермы (Lien S et al., Curr Protoc Hum Genet 2002, Chapter 1 :Unit 1.6) и методы формирования изображений (Xiao M. et al., Hum Mutat 2007, 28: 913-921). Другие методы включают методы на основе аллеле-специфичной ПЦР (Michalatos-Beloin S et al., Nucleic Acids Res 1996, 24: 48414843; Lo Y.M.D. et al., Nucleic Acids Res 1991, 19:3561-3567), клонирования и расщепления рестрикционными ферментами (Smirnova AS et al., Immunogenetics 2007, 59: 93-8) и др. Еще другие методы основываются на распределении и структуре неравновесного сцепления блоков гаплотипов в популяции, что позволяет составить материнский гаплотип по статистическим оценкам (Clark A.G., Mol. Biol. Evol. 1990, 7: 111-22; 10:13-9; Salem R.M. et al., Hum Genomics 2005; 2:39-66).
С. Использование информации по геному из материнского образца для составления каркаса.
В одном воплощении для того, чтобы узнать, какая из материнских хромосом была передана плоду, применяется метод относительной дозы гаплотипа (RHDO). Основной принцип этого метода следует из примера, когда мать гетерозиготна по каждому из генетических полиморфизмов. Итак, имеется два гаплотипа и относительная доза этих гаплотипов должна быть 1:1. Однако присутствие в материнском образце небольшой доли ДНК плода может изменить относительную дозу гаплотипа. Это происходит потому, что плод наследует половину своего комплекта гаплотипов от матери, а другую половину от отца. Более того, по каждой хромосоме плод мог унаследовать мозаику гаплотипов, происходящих из той или другой гомологичной хромосомы от каждого родителя, в зависимости от наличия мейотической рекомбинации. Все эти факторы могут вызвать отклонение относительной дозы гаплотипов от соотношения 1:1 в составе материнской ДНК. Таким образом, для данной хромосомы или участка хромосомы составляющие аллели этих гаплотипов можно отыскать из аналитических данных (например, данных по секвенированию), полученных из материнского образца.
Затем можно выполнить статистическую процедуру для определения относительной дозы гаплотипов или того, что один из гаплотипов представлен сильнее, чем другой. Классификационный порог для этой статистической процедуры может быть установлен в зависимости от фракционной концентрации ДНК плода. В общем случае, более высокая фракционная концентрация ДНК плода способствует достижению порога при меньшем количестве молекул. Классификационный порог также может быть установлен в зависимости от количества успешно классифицированных фрагментов, которое нужно получить по всему геному или по искомым участкам генома. В одном воплощении может применяться последовательный критерий отношения вероятностей (SPRT).
В одном воплощении для определения относительной дозы аллеля по определенным полиморфизмам матери можно использовать относительную дозу мутаций (RMD), как описано в US Patent Application 2009/0087847. Эти относительные количества могут использоваться при определении гаплотипа у плода (например, когда полиморфизмы приходятся на следующие друг за другом или связанные локусы). В одном исполнении этого прицельного подхода применяется полимеразная цепная реакция (ПЦР) для амплификации специфических последовательностей из отдельных частей генома для анализа RMD. Для того чтобы этот подход к определению наследования плодом по RMD распространялся на большую область генома или целый геном, требуется большой объем материнского образца.
В одном воплощении с использованием рандомизированного секвенирования представляющие интерес участки генома не выбираются прицельно. Таким образом, количество последовательностей, полученных в интересующих участках генома, может быть не столь большим, как при прицельном подходе (если только не проводится очень глубокое секвенирование). Однако при этом можно объединить итоги
- 8 033752 по нескольким сцепленным полиморфизмам для достижения необходимой статистической значимости для диагностических целей. Практическое значение этого воплощения секвенирования состоит в том, что можно сэкономить расходы, так как отпадает необходимость в слишком глубоком секвенировании. К тому же нужно вносить меньшее количество материнского образца, чем при подходах на основе цифровой ПЦР.
Кроме того, может быть желательно проведение такого анализ RHDO блоками. Иными словами, каждую хромосому можно анализировать в одном или предпочтительно больше чем одном блоке. В одном аспекте последнее дает возможность наблюдать мейотическую рекомбинацию. Например, может оказаться, что гаплотип одного сегмента определенной хромосомы плода происходит из одной из материнских гомологичных хромосом, тогда как другой сегмент той же самой хромосомы плода имеет гаплотип из другой гомологичной хромосомы. Анализ по SPRT может способствовать проведению такого сегментирования.
Например, анализ по SPRT можно провести на соседствующих SNP, проявляющих требуемую конфигурацию родительского генотипа (т.е. гомозиготного отца и гетерозиготной матери), начиная с одного конца хромосомы. Это должно продолжаться до тех пор, пока анализ SPRT не покажет, что в аналитических данных материнской плазмы (например, данных по секвенированию) преобладает один из материнских гаплотипов. Затем анализ SPRT можно перенастроить и начать заново со следующего соседнего SNP, проявляющего требуемую конфигурацию родительского генотипа. Это можно опять продолжать до тех пор, пока анализ SPRT не покажет еще раз, что в аналитических данных материнской плазмы (например, данных по секвенированию) преобладает один из материнских гаплотипов. Этот процесс может продолжаться до последнего выбранного SNP на данной хромосоме. Затем эти разнообразные установленные по SPRT сегменты гаплотипов на хромосоме можно сравнить с гаплотипами двух гомологичных хромосом в геноме матери. Мейотическая рекомбинация отмечается тогда, когда окажется, что сегменты гаплотипов у плода переключились с одной материнской гомологичной хромосомы на другую. Эта система срабатывает, даже если имеется больше чем одна гомологичная рекомбинация на хромосому.
Как будет описано позже, анализ RHDO может проводиться и по тем участкам генома, в которых и отец, и мать оба гетерозиготны по входящим в их состав генетическим полиморфизмам. Этот сценарий особенно полезен в тех случаях, когда отец и мать содержат мутантную копию вызывающего заболевание гена от одного и того же предка, как-то когда они близкородственны или когда вызывающая заболевание мутация преобладает вследствие сильного эффекта основателя (т.е. большинство индивидов с этой мутацией унаследовали один и тот же гаплотип от общего предка-основателя популяции). Таким образом, для вычисления гаплотипа плода можно использовать гаплотипы отца и матери на этом участке.
II. Составление генома плода из генома матери.
Далее описано составление генетической карты плода или выяснение геномной последовательности плода при явном знании родительских геномов.
А. Способ.
На фиг. 1 представлена блок-схема способа определения 100 по меньшей мере части генома еще не рожденного плода беременной женщины. У плода есть отец и беременная женщина-мать. Отец обладает отцовским геномом с двумя гаплотипами, а мать обладает материнским геномом с двумя гаплотипами. Способом 100 проводится анализ молекул (фрагментов) нуклеиновой кислоты из биологического образца, взятого у беременной женщины, для определения генома плода. Способ 100 описан в основном на примере, когда отец гомозиготен, а мать гетерозиготна по нескольким локусам, тогда как в других примерах описаны другие воплощения.
Способ 100 и любой из описанных здесь способов может целиком или частично выполняться с помощью компьютерной системы, включающей процессор, который может быть настроен на выполнение стадий. Таким образом, воплощения направлены на компьютерные системы, настроенные на выполнение стадий любых из описанных здесь способов, потенциально с различными компонентами, выполняющими соответствующую стадию или соответствующую группу стадий. Хотя они и представлены в виде пронумерованных стадий, стадии способов могут выполняться одновременно или в другом порядке. Кроме того, части этих стадий можно использовать вместе с частями других стадий из других способов. К тому же все стадии или части стадий могут быть необязательными. Кроме того, любые стадии любых способов могут выполняться с помощью модулей, контуров или других средств для выполнения этих стадий.
На стадии 110 определяется первое множество локусов, по которым материнский геном гетерозиготен. В одном воплощении это определение может выполняться как часть генотипирования отца и матери на уровне генома или по выбранным геномным локусам. В других воплощениях определение первого множества локусов может проводиться во время анализа материнского образца, что описано в дальнейших разделах.
На стадии 120 определяется каждый из двух материнских гаплотипов, охватывающих первое множество локусов. Как указано выше, материнский геном может быть получен при прямом секвенировании. В других воплощениях генотипирование может проводиться по множеству локусов с последующим использованием картированного генома лица, у которого должен быть похожий геном, например, члена
- 9 033752 семьи, или же контрольного генома, общего для той же или сходной популяции. В одном воплощении стадия 120 может выполняться сначала для всего или части материнского генома, а затем материнский геном может быть исследован для выявления локусов, по которым мать гетерозиготна.
В одном аспекте составление гаплотипа хромосом отца не является обязательным. Однако, если можно составить отцовские гаплотипы, то из результатов секвенирования можно получить дополнительную информацию. Такая дополнительная информация включает возможность проведения анализа относительной дозы гаплотипа для участков, по которым оба родителя гетерозиготны. Другая дополнительная информация, которая может быть получена, если доступен отцовский гаплотип, это информация касательно мейотической рекомбинации с участием одной или нескольких отцовских хромосом, чтобы установить, переданы ли плоду вызывающие заболевания аллели, связанные с такими полиморфизмами.
На стадии 130 определяется аллель, унаследованный плодом от отца по каждому из первого множества локусов. В некоторых воплощениях используются геномные локусы, по которым отец гомозиготен, а мать гетерозиготна (как указано на стадии 110). Таким образом, если отец гомозиготен по этим локусам, то будут известны аллели, унаследованные от отца. Г енотипирование отца для определения локусов, по которым отец гомозиготен, может осуществляться любым из описанных здесь способов. В одном воплощении определение первого множества локусов может осуществляться, исходя из генотипирования отца и матери, чтобы обнаружить локусы, по которым отец гомозиготен, а мать гетерозиготна.
В другом воплощении можно использовать второе множество локусов генома отца, по которым он гетерозиготен, для определения отцовского гаплотипа, унаследованного плодом по первому множеству локусов, по которым отец гомозиготен. Например, если материнский геном гомозиготен по второму множеству локусов, то можно идентифицировать аллели, присутствующие в отцовском геноме в соответствующих локусах из второго множества локусов и отсутствующие в материнском геноме. Затем можно идентифицировать унаследованный от отца гаплотип как гаплотип с идентифицированными аллелями и использовать его для определения аллелей, унаследованных от отца по первому множеству локусов. Эти аспекты определения отцовского гаплотипа обсуждаются более подробно ниже.
На стадии 140 проводится анализ множества молекул нуклеиновой кислоты из биологического образца, взятого у беременной женщины. Образец содержит смесь нуклеиновых кислот матери и плода. Материнский биологический образец может быть взят, а затем обработан для анализа. В одном воплощении используется материнская плазма и сыворотка. В других воплощениях можно использовать материнскую кровь, материнскую мочу, материнскую слюну, смывную жидкость матки или клетки плода, полученные из крови матери.
В одном воплощении анализ молекул нуклеиновой кислоты включает определение локализации молекулы нуклеиновой кислоты в геноме человека и определение ее аллеля по индивидуальному локусу. Таким образом, в одном воплощении может выполняться количественное генотипирование с использованием установленных аллелей молекул нуклеиновой кислоты из одного и того же локуса. Для определения геномной локализации и аллелей (информации о генотипе) молекул нуклеиновой кислоты в материнском образце можно использовать любой подходящий способ. Некоторые из таких способов описаны в заявках США 12/178181 и 12/614350 и заявке под названием Анализ генома на основе размера.
На стадии 150, исходя из установленных аллелей молекул нуклеиновой кислоты, определяются количества соответствующих аллелей по каждому из первого множества локусов. В одном воплощении эти количества могут составлять число аллелей каждого типа в первом локусе. Например, шесть А и четыре Т. В другом воплощении количество может означать распределение по размерам молекул нуклеиновой кислоты, содержащих определенные аллели. Например, относительное количество также может включать распределение по размерам фрагментов с определенным генотипом, что может означать относительное количество фрагментов определенной длины. Такие относительные количества могут дать информацию и о том, какой генотип у генома плода, так как у плода фрагменты обычно меньше, чем фрагменты матери. Некоторые примеры количеств и способов описаны в заявках США 12/178181 и 12/614350 и заявке под названием Анализ генома на основе размера.
В одном воплощении относительные количества аллелей в одном локусе могут дать информацию о том, какой генотип унаследован плодом (например, после того, как набор данных достигнет достаточной статистической значимости). Например, относительные количества могут использоваться для определения того, что происходит дисбаланс последовательности относительно генотипа матери по одному локусу. В приведенных выше родственных патентных заявках предоставлены примеры воплощений для выявления дисбаланса последовательности по определенному локусу или участку.
На стадии 160 проводится сравнение относительных количеств соответствующих аллелей молекул нуклеиновой кислоты по более чем одному локусу из первого множества локусов. В некоторых воплощениях перед проведением сравнения суммируют количество каждого аллеля по всем локусам первого множества локусов, составляющих гаплотипы.
Затем сравнивают суммарные количества родительских гаплотипов для определения того, что гаплотип избыточно представлен, одинаково представлен или недостаточно представлен. В других воплощениях сравнивают количества аллелей в локусах и проводят сравнение по множественным локусам. Например, можно суммировать значения разделения (например, разности или отношения), которые
- 10 033752 можно использовать при сравнении с пределом отсечения. Каждое из этих воплощений применимо к любым из описанных здесь операций сравнения.
В различных воплощениях относительное количество может означать встречаемость каждого фрагмента с определенным аллелем в определенном локусе, встречаемость фрагментов из любого локуса (или любых локусов на участке) по определенному гаплотипу и статистическое значение встречаемости (например, среднее) по определенному локусу или по определенному гаплотипу. Так, в одном воплощении сравнение может означать определение величины разделения (например, разности или отношения) одного аллеля в сравнении с другим аллелем по каждому локусу.
На стадии 170, исходя из сравнения, можно определить гаплотип, унаследованный еще не рожденным плодом от матери в части генома, охваченной первым множеством локусов. В одном воплощении, для того чтобы установить, какая из материнских хромосом перешла к плоду, применяется метод относительной дозы гаплотипов (RHDO), например, как указано выше. Поскольку мать гетерозиготна по каждому из первых локусов, то первые локусы соответствуют двум гаплотипам для области генома первых локусов. Относительная доза этих гаплотипов должна быть 1:1, если образец был только от матери. Отклонение или отсутствие отклонений от этого соотношения можно использовать для определения гаплотипа плода, унаследованного от матери (и от отца, что изложено более подробно далее) Таким образом, для данной хромосомы или участка хромосомы аллели, составляющие эти гаплотипы, можно отыскать из аналитических данных (например, данных по секвенированию), полученных на стадии 130.
Поскольку множество локусов подвергается анализу и сравнению с гаплотипом матери, то последовательности между локусами можно отнести к определенному гаплотипу. В одном воплощении, если несколько локусов соответствуют определенному гаплотипу, то можно заключить, что сегменты последовательности между локусами будут такими же, как и материнский гаплотип. Вследствие явления мейотической рекомбинации окончательный гаплотип, унаследованный плодом, может состоять из мозаики сегментов гаплотипов, происходящих из одной из этих двух гомологичных хромосом. Воплощения могут выявлять такую рекомбинацию.
Разрешение, с которым можно выявить такую рекомбинацию, зависит от числа и распределения генетических маркеров, которые были определены в составе ДНК матери и отца, и от порога, который применяется в последующем биоинформационном анализе (к примеру, методом SPRT). Например, если сравнение свидетельствует о том, что унаследованный от матери аллель по каждому из первого набора последовательных локусов соответствует первому гаплотипу, то первый гаплотип считается унаследованным по положению в геноме, соответствующему первому набору локусов. Если второй набор последовательных локусов свидетельствует о том, что унаследован второй гаплотип, то второй гаплотип считается унаследованным по положению в геноме, соответствующему второму набору локусов.
В одном воплощении, поскольку подвергается анализу множество локусов, то гаплотип может быть определен с большей точностью. Например, статистические данные для одних локусов могут и не быть решающими, но в сочетании со статистическими данными по другим локусам можно установить, какой гаплотип унаследован. В другом воплощении можно подвергнуть анализу каждый локус независимо для составления классификации, а затем проанализировать эти классификации, чтобы установить, какой гаплотип унаследован для данного участка.
В одном воплощении для определения относительной дозы гаплотипа (например, если один из гаплотипов избыточно представлен перед другим гаплотипом) можно провести статистическую процедуру. Классификационный порог для этой статистической процедуры может быть установлен в зависимости от фракционной концентрации ДНК плода. В общем, более высокая фракционная концентрация ДНК плода позволяет достичь порога при меньшем количестве молекул. Классификационный порог также может быть установлен в зависимости от количества успешно классифицированных сегментов, которое нужно получить по всему геному или отдельным участкам генома.
Обращаясь опять к фиг. 1, на стадии 180 можно подвергнуть анализу геном плода на мутации. Например, воплощения можно использовать для поиска на предмет мутаций, вызывающих генетические заболевания в определенной популяции. Примеры мутаций, которые можно установить с помощью воплощений, можно найти на сайте Online Mendelian Inheritance in Man (www.ncbi.nlm.nih.gov/omim/getmorbid.cgi). Эти мутации можно поискать на стадиях 140-160 или в виде отдельной стадии, как описано далее. Например, поиск на мутации в семьях, в которых отец является носителем одной или нескольких мутаций, отсутствующих у матери, можно вести по аналитическим данным (например, данным по секвенированию) из материнского биологического образца.
Помимо выявления существующих мутаций, можно вести поиск на полиморфные генетические маркеры, сцепленные с мутантным аллелем или аллелем дикого типа у отца или матери. Например, при анализе RHDO может оказаться, что плод унаследовал от матери известный гаплотип, который несет мутацию, вызывающую заболевание. Воплощения изобретения также могут применяться для неинвазивной пренатальной диагностики заболеваний, вызванных делециями участков хромосом, например, делеции Southeast Asian, вызывающей альфа-талассемию. В том случае, когда и отец, и мать являются носителями делеции, а плод гомозиготен по делеции, то при проведении массированного параллельного секвенирования ДНК из плазмы матери должно наблюдаться снижение частоты последовательностей ДНК,
- 11 033752 происходящих из делегированного участка в материнской плазме.
В. Пример.
В этом разделе описан пример воплощений (например, способа 100), применимых к однонуклеотидному полиморфизму (SNP), в случаях, когда мать гетерозиготна. Аллели SNP на одной и той же хромосоме образуют гаплотип, причем у матери есть гомологичная пара каждой хромосомы, т.е. два гаплотипа. Для иллюстрации того, как выполняется такое определение, рассмотрим сегмент на хромосоме 3, например, как показано на фиг. 2.
На фиг. 2 представлены два гаплотипа для отца и два гаплотипа для матери по определенному сегменту соответствующего им геномного кода. Внутри этого сегмента обнаружено пять SNP, по которым отец гомозиготен, а мать гетерозиготна по всем 5 из этих SNP. Две гомологичные хромосомы отца имеют один и тот же гаплотип (Hap), т.е. А-G-A-A-G (сверху вниз на фиг. 2). Для простоты отцовские гаплотипы называются Hap I и Hap II, учитывая, что оба они идентичны по этому набору из 5 SNP. У матери отмечены два гаплотипа, а именно Hap III - A-A-A-G-G и Hap IV - G-G-G-A-A.
В этом примере SNPs можно далее классифицировать на два типа. На фиг. 3 представлены два типа SNP согласно воплощениям настоящего изобретения. Тип А состоит из таких SNP, у которых родительские аллели те же, что и в материнском гаплотипе III. Тип В состоит из таких SNP, в которых родительские аллели те же, что и в материнском гаплотипе IV.
Эти два типа SNP могут потребовать слегка различной математической обработки. Так, по сценарию типа А наследование плодом гаплотипа III приведет к избыточной представленности гаплотипа III по отношению к гаплотипу IV в материнской плазме (фиг. 4А). Например, рассматривая для упрощения только один SNP 410, аллель А наследуется от отца, а если от матери наследуется Hap III, то у плода будет два аллеля А в образце, что приведет к избыточной представленности А. Если же плод унаследовал гаплотип IV, то избыточная представленность не будет наблюдаться, так как плод тоже будет гетерозиготным по А и G в этом локусе.
С другой стороны, по сценарию типа В наследование плодом гаплотипа III приведет к равной представленности гаплотипа III и гаплотипа IV в материнской плазме (фиг. 4В). Например, рассматривая SNP 420, наследование G от отца и А в составе Hap III приведет к тому, что у плода будут равные количества А и G по SNP 420, совсем как у матери. Если же плод унаследовал гаплотип IV, тогда будет наблюдаться избыточная представленность, как явствует из вышеприведенного обсуждения.
На фиг. 5А и 5В представлен анализ путем сравнения относительных количеств (например, встречаемости) фрагментов для каждого локуса и будет ли результат сравнения означать, что определенный гаплотип наследуется или нет. Для этого примера можно использовать любое место в геноме, в котором есть SNP, который соответствует одной из этих конфигураций генотипа у отца и матери (например, сценарии типа А или типа В). Из данных по секвенированию материнской плазмы можно сосредоточиться на том, какое количество просеквенированных молекул соответствует определенному аллелю SNP. Можно использовать анализ по SPRT (или другой метод сравнения) для установления наличия какоголибо аллельного дисбаланса между этими аллелями (Lo YD et al., Proc. Natl. Acad. Sci. USA 2007, 104: 13116-13121).
На фиг. 5А представлен анализ SNP типа А. Как видим, для каждого SNP сравнение методом SPRT относительных количеств (например, определенных по величине разделения) со значением порога отсечения обеспечивает классификацию. В одном воплощении, если достигнут классификационный порог для SPRT, то можно заключить, что плод унаследовал определенный материнский гаплотип. После этого можно заново настроить параметры для анализа SPRT. Затем можно перейти к анализу соседнего SNP, соответствующего требуемой конфигурации генотипа, как в направлении от теломеры к центромере, так и наоборот; и можно начинать новый анализ SPRT по этому SNP.
С другой стороны, в одном воплощении, если классификация SNP по SPRT не была достигнута, то можно опять же перейти к соседнему SNP аналогичным образом, за исключением того, что баллы для следующего SNP можно добавить к предыдущему, а затем снова провести анализ по SPRT. Этот процесс может продолжаться до тех пор, пока не будет достигнут классификационный порог. На фиг. 5А и фиг. 5В представлено исполнение этого процесса для анализов типа А и типа В. В одном воплощении все классификации анализируются вместе для получения итоговой классификации для участка. Например, если получена классификация для первой группы SNP и для следующей группы SNP, то можно сравнить обе классификации, чтобы узнать, согласуются ли они.
На фиг. 6 представлен эффект изменения отношения вероятностей при классификации по SPRT (Zhou W et al., Nat Biotechnol 2001, 19:78-81; Karoui NE et al., Statist Med 2006, 25:3124-33). В общем, меньшее отношение вероятностей для классификации, например, 8, может облегчить проведение классификации. При этом может увеличиться количество классифицированных участков внутри генома. Однако следует ожидать, что некоторые из таких участков будут классифицированы неправильно. С другой стороны, при большем отношении вероятностей для классификации, например 1200, классификация станет возможной только при оценке большего числа SNP. При этом может уменьшиться количество классифицированных участков внутри генома. Следует ожидать, что количество и доля неправильно классифицированных участков будет меньше по сравнению с использованием меньшего классификационного
- 12 033752 порога.
В одном воплощении классификация засчитывается только в том случае, если две последовательные классификации по SPRT дают один и тот же гаплотип (что именуется алгоритмом двух последовательных блоков). В одном аспекте алгоритм двух последовательных блоков может повысить точность классификации. В некоторых воплощениях, для любых отрезков последовательности, сначала может выполняться анализ SPRT для SNP типа А, а затем проводится другой анализ SPRT для SNP типа В. В одном воплощении предусмотрен сценарий для таких отрезков последовательности, в которых SNP типа А и типа В образуют две перемежающиеся группы генетических ориентиров (например, SNP). В воплощениях с применением алгоритма двух последовательных блоков эти два блока могут быть различного типа.
Результаты анализа SPRT для типа А и типа В следует проверить на согласованность или несогласованность результатов классификации. Для повышения точности классификации в одном воплощении (перемежающийся подход) классификация засчитывается только в том случае, если анализ типа А и типа В для данного участка генома дает непротиворечивые результаты. Если эти два анализа дают противоречивые результаты, то нужно проверить результаты классификации двух смежных участков, следующих за этим, одного со стороны центромеры и другого со стороны теломеры. Если эти два смежных участка дают непротиворечивые результаты, то первый участок можно классифицировать как имеющий одинаковый гаплотип с этими двумя участками. Если же два смежных участка не дают непротиворечивые результаты, то можно перейти к следующим двум смежным участкам, пока не будет наблюдаться согласованность. Один из вариантов этой темы состоит в том, чтобы продвигаться только в одном направлении и принимать результаты классификации следующих одного, двух или же нескольких смежных участков за результаты исходного рассматриваемого участка.
Общий принцип заключается в том, чтобы использовать результаты классификации смежных участков генома для проверки результатов классификации данного участка.
III. Определение отцовских аллелей, унаследованных плодом.
На фиг. 7 представлена блок-схема способа определения 700 по меньшей мере части генома, унаследованной от отца, у еще не рожденного плода беременной женщины. Способом 700 проводится анализ молекул (фрагментов) нуклеиновой кислоты из биологического образца, взятого у беременной женщины, для определения генома плода. Образец содержит смесь нуклеиновых кислот матери и плода.
На стадии 710 проводится анализ каждой из множества молекул нуклеиновых кислот из биологического образца для определения локализации молекулы нуклеиновой кислоты в геноме человека и определения аллельного типа молекулы нуклеиновой кислоты. Таким образом, в одном воплощении можно определить генотипы молекул нуклеиновой кислоты в определенном месте (локусе). Для этого анализа можно применять любые способы, описанные выше и по тексту.
На стадии 720 определяется первое множество локусов, по которым отцовский геном гетерозиготен, а материнский геном гомозиготен. В одном воплощении первое множество локусов получают путем определения отцовского и материнского геномов. Эти геномы можно проверить на геномные локусы, по которым отец гетерозиготен, а мать гомозиготна.
На стадии 730 определяется гаплотип, унаследованный еще не рожденным плодом от отца в той части генома, которая охвачена первым множеством локусов, исходя из установленных генотипов по первому множеству локусов. В одном воплощении из аналитических данных (например, данных по секвенированию) по каждому из этих локусов определяется аллель, который представлен у отца, но отсутствует в геноме матери. Комбинация этих аллелей будет указывать на гаплотипы хромосом, которые плод унаследовал от отца.
В другом воплощении, если известны гаплотипы каждой из хромосом или искомых участков хромосом в геноме отца, то можно определить, где во время сперматогенеза у отца произошла мейотическая рекомбинация. Так, мейотическая рекомбинация у отца отмечается тогда, когда гаплотип отрезка ДНК в унаследованной от отца хромосоме отличается между плодом и отцом. Включение такой информации о рекомбинации может быть полезным при использовании аналитических данных (например, данных по секвенированию) для пренатальной диагностики генетических заболеваний по сцеплению с генетическими полиморфизмами.
IV. Отец и мать гетерозиготны на участке генома.
Воплощения предусматривают сценарий, при котором отец и мать гетерозиготны на участке генома. Этот сценарий может быть особенно важным для семей, в которых отец и мать являются близкими родственниками, а также когда заболевание связано с преобладающей мутацией вследствие сильного эффекта предка-основателя. При таких обстоятельствах следует ожидать, что если отец и мать еще не рожденного плода являются носителями мутантного гена, то гаплотип хромосомы, несущей мутантную копию гена, будет практически идентичным, за исключением случаев мейотической рекомбинации. Такой тип анализа может оказаться особенно полезным при аутосомных рецессивных заболеваниях, таких как кистозный фиброз, бета-талассемия, серповидно-клеточная анемия и болезнь гемоглобина Е.
На фиг. 8 представлена блок-схема способа определения 800 по меньшей мере части генома еще не рожденного плода на участке, в котором отец и мать гетерозиготны согласно воплощениям настоящего
- 13 033752 изобретения.
На стадии 810 определяется первое множество локусов, по которым и отец, и мать гетерозиготны. В одном воплощении первые локусы можно определить любым из приведенных здесь способов. Например, можно просеквенировать весь отцовский геном или его участки либо генотипировать различные части для выявления первых локусов. При этом станут известны каждый из двух отцовских и каждый из двух материнских гаплотипов по первому множеству локусов.
В качестве примера на фиг. 9 представлены гаплотипы отца и матери, которые оба гетерозиготны на определенном участке генома. Как видим, оба родителя содержат мутантный ген (аллель) на участке 1. В частности, Hap I отца и Hap III матери содержат мутантный ген. Также видно, что и отец, и мать могут содержать другую копию хромосомы, несущую копию гена дикого типа. В частности, Hap II отца и Hap IV матери содержат ген дикого типа. Таким образом, этот пример относится к определению того, унаследовал ли плод мутантный ген. Хромосомы от отца и матери, несущие ген дикого типа, имеют одинаковый гаплотип в непосредственной близости от гена, но могут иметь разные гаплотипы на большем удалении от гена. Поскольку эта хромосома скорее всего происходит от различных предков, то она вряд ли будет иметь идентичные гаплотипы между отцом и матерью по всей длине хромосомы.
На стадии 820 определяется второе множество локусов, по которым отец гетерозиготен, а мать гомозиготна. Как видим, первое и второе множество локусов находятся на одной и той же хромосоме. На участке 2 представлены такие вторые локусы. Участок 2 выбирается таким образом, чтобы отец был гетерозиготен по одному или нескольким SNP на этом участке, а мать была гомозиготна на этом участке.
На стадии 830 проводится анализ фрагментов из образца беременной женщины для установления локализации в геноме человека и генотипа. Локализация может использоваться для определения того, что фрагмент (молекула нуклеиновой кислоты) включает один или несколько первых локусов либо один или несколько вторых локусов. Затем эта информация может использоваться для определения гаплотипа, унаследованного от отца, и гаплотипа, унаследованного от матери.
На стадии 840 определяется, какой из двух родительских гаплотипов был унаследован плодом, путем анализа установленных генотипов множества молекул нуклеиновой кислоты из биологического образца хотя бы по одному из вторых локусов. Например, можно провести поиск аллелей SNP, представленных исключительно в геноме отца, но отсутствующих в геноме матери, как-то аллеля Т, обозначенного *, и аллеля А, обозначенного +, на фиг. 9, из аналитических данных (например, локализации и генотипа, установленных на стадии 710) материнского биологического образца. Так же, как это делается в способе 700, если в материнской плазме выявляется аллель Т, обозначенный *, то это значит, что плодом от отца унаследован гаплотип II (Hap II). Наоборот, если в материнской плазме определяется аллель А, обозначенный +, то это означает, что плодом от отца унаследован Hap I.
На стадии 850 проводится сравнение относительных количеств установленных генотипов молекул нуклеиновой кислоты по более чем одному из первого множества локусов. В одном воплощении суммируют количества по всем локусам и сравнивают относительные количества материнских гаплотипов. Относительные количества могут означать встречаемость, распределение по размерам и любые другие параметры, дающие информацию о том, какой генотип представлен в геноме плода по определенному локусу.
На стадии 860, исходя из того, какой гаплотип унаследован плодом от отца, и исходя из сравнения относительных количеств, определяется гаплотип, унаследованный еще не рожденным плодом от матери в той части генома, которая охвачена первым множеством локусов. Так, для определения того, какой из двух материнских гаплотипов унаследован плодом, проводится анализ RHDO (например, как описано выше) SNP на участке 1 по аналитических данным материнского биологического образца, с учетом отцовского гаплотипа, унаследованного плодом на участке 2. В одном воплощении предполагается, что между участками 1 и 2 не было рекомбинации при переходе этих участков от родителей к плоду.
Например, рассмотрим сценарий, когда при анализе участка 2 было установлено, что плод унаследовал Hap I от отца. Тогда наследование плодом Hap III (который идентичен Hap I на участке 1) от матери приведет к избыточной представленности Hap III относительно Hap IV в материнской плазме. Наоборот, если плод унаследовал Hap IV от матери, то в материнской плазме будет наблюдаться равная представленность Hap III и Hap IV.
В качестве другого примера рассмотрим сценарий, когда при анализе участка 2 было установлено, что плод унаследовал Hap II от отца. Тогда наследование плодом Hap IV (который идентичен Hap II на участке 1) от матери приведет к избыточной представленности Hap IV относительно Hap III в материнской плазме. Наоборот, если плод унаследовал Hap III от матери, то в материнской плазме будет наблюдаться равная представленность Hap III и Hap IV.
В предыдущих разделах авторы изобретения выводили геном плода и фракционную концентрацию ДНК плода, используя данные, полученные при секвенировании ДНК из материнской плазмы, а также информацию о генотипе родителей плода. В следующих разделах описаны воплощения для выведения фракционной концентрации ДНК плода и генотипа плода без предварительной информации о генотипах/гаплотипах матери и отца.
V. Определение фракционной концентрации ДНК плода.
- 14 033752
В некоторых воплощениях необязательной стадией является определение фракционной концентрации ДНК плода. В различных аспектах эта фракционная концентрация может определять объем анализа (например, необходимый объем секвенирования) или определять точность анализа для данного количества данных (например, полноту охвата последовательности генома). Определение фракционной концентрации ДНК плода может применяться и для определения предела отсечения при классификации того, какой гаплотип и/или генотип наследуется.
В одном воплощении фракционная концентрация ДНК плода определяется путем извлечения аналитических данных (например, полученных на стадии 140 и 710) для локусов, по которым и отец, и мать гомозиготны, но с различными аллелями. Например, для SNP с двумя аллелями, А и G, у отца может быть АА, а у матери GG, и наоборот. По таким локусам плод будет облигатной гетерозиготой. В вышеприведенном примере у плода будет генотип AG, а доля аллеля А в материнском образце может использоваться для определения фракционной концентрации ДНК плода. В другом воплощении для определения локуса, по которому мать гомозиготна, а плод гетерозиготен, может проводиться статистический анализ. При этом не требуется никакой информации о геноме матери или геноме отца.
В качестве альтернативы извлечению аналитических данных фракционную концентрацию ДНК плода также можно определить при помощи другого подхода, как-то методом ПЦР, цифровым методом ПЦР или методом на основе масс-спектрометрии, используя комплект полиморфных генетических маркеров (Lun F.M.F. et al., Clin. Chem. 2008, 54: 1664-1672). Другой альтернативой является использование одного или нескольких геномных локусов, отличающихся по метилированию ДНК между плодом и матерью (Poon L.L.M. et al., Clin. Chem. 2002, 48: 35-41; Chan K.C.A. et al., Clin. Chem. 2006, 52: 2211-2218; US Patent 6,927,028). Еще одной альтернативой является использование приблизительной фракционной концентрации ДНК плода, определенной в контрольной популяции, например, при аналогичном гестационном возрасте. Однако, поскольку фракционная концентрация ДНК плода может отличаться от образца к образцу, можно ожидать, что этот последний подход будет менее точным, чем при измерении концентрации специально для тестируемого образца.
A. Определение фракционной концентрации у облигатных гетерозигот.
В тех воплощениях, в которых плод является облигатной гетерозиготой, можно определить фракционную концентрацию ДНК плода, используя следующие серии расчетов (например, при массированном параллельном секвенировании). Пусть p означает количество аллеля у плода, который отсутствует в материнском геноме. Пусть q означает количество другого аллеля, а именно аллеля, который есть в геноме и матери, и плода. Фракционная концентрация ДНК плода задается следующим уравнением:
p + q'
В одном воплощении такое вычисление проводится на совокупных данных по всем полиморфным генетическим локусам или полиморфным генетическим признакам, соответствующим конфигурации родительских генотипов (например, оба родителя гомозиготны, но по различным аллелям).
B. Определение по информативным SNP.
Фракционную концентрацию ДНК плода также можно определить для любого локуса, по которому мать гомозиготна, а плод гетерозиготен, а не только когда мать гомозиготна по одному аллелю, а отец гомозиготен по другому аллелю. Оба способа предусматривают, что локус является информативным. Термин информативный SNP может применяться в разных контекстах в зависимости от того, какая нужна информация. В одном контексте это информация об аллеле в геноме плода в определенном локусе, в котором аллель не представлен в материнском геноме. Так, подмножество SNP, по которым мать гомозиготна, а плод гетерозиготен, можно называть информативными SNP в контексте определения концентрации ДНК плода. Случаи, когда и мать, и плод гетерозиготны, но отличаются хотя бы по одному аллелю, также могут использоваться в качестве информативных SNP. Однако триаллельные SNP относительно редко встречаются в геноме.
На фиг. 10 представлена блок-схема способа определения 1000 фракционной концентрации материала плода в материнском образце согласно воплощениям настоящего изобретения. На стадии 1010 фрагменты из образца беременной женщины подвергаются анализу для установления локализации в геноме человека и типа аллелей (что может привести к определению генотипа на этом участке). В одном воплощении фрагменты подвергаются анализу путем секвенирования множества молекул нуклеиновой кислоты из биологического образца, взятого у беременной женщины. В других воплощениях может применяться ПЦР в реальном времени или цифровой метод ПЦР.
На стадии 1020 определяется, что один или несколько первых локусов являются информативными. В некоторых воплощениях материнский геном гомозиготен, но в образце по информативному локусу выявляется не материнский аллель. В одном воплощении геном плода гетерозиготен по всем первым локусам, а материнский геном гомозиготен по всем первым локусам. Например, в одном первом локусе геном плода может содержать первый и второй аллели (например, ТА), а материнский геном может содержать два соответствующих вторых аллеля (например, АА) в первом локусе. Однако такие локусы могут и не быть заранее известны, например, в ситуациях, когда плод не является облигатной гетерозиготой.
- 15 033752
В одном воплощении для определения информативного локуса рассматриваются те SNP, по которым мать гомозиготна. По тем SNP, по которым мать гомозиготна, плод будет либо гомозиготен по тому же аллелю, либо гетерозиготен. Например, если SNP полиморфен по А и Т, а у матери генотип АА, то у плода будет генотип АА или ТА. В этом случае наличие аллеля Т в образце материнской плазмы означает, что у плода будет генотип ТА, а не АА. Некоторые воплощения нацелены на то, в какой степени наличие аллеля Т означает генотип ТА путем вычисления необходимого предела отсечения, как описано ниже.
На стадии 1030 для хотя бы одного из первых локусов определяется первое число p случаев (встречаемость) соответствующего первого аллеля и второе число q случаев (встречаемость) соответствующего второго аллеля. В одном воплощении число специфичных для плода (аллель Т) и совместных (аллель А) аллелей в материнской плазме определяется различными методами, к примеру, без ограничения, ПЦР в реальном времени, цифровым методом ПЦР и массированным параллельным секвенированием.
На стадии 1040 на основании первых и вторых чисел рассчитывается фракционная концентрация. В одном воплощении для беременной женщины с генотипом АА и ее плода с генотипом ТА фракционная концентрация ДНК плода (f) рассчитывается по уравнению:
f = 2xp/(p+q), где p означает встречаемость специфичного для плода аллеля (аллель Т); q означает встречаемость аллеля, встречающегося и у матери, и у плода (аллель А).
В другом воплощении фракционная концентрация ДНК плода в материнской плазме может быть установлена с большей точностью при использовании множественных информативных SNP. При использовании встречаемости аллелей по множественным SNP (общее число SNP = n) фракционная концентрация ДНК плода (f) может быть рассчитана по уравнению:
f . Σ,_,2α·
Σ/,Ή+</,)’ где p, означает встречаемость специфичного для плода аллеля по информативному SNP;; q, - встречаемость аллеля, совместного для матери и для плода по информативному SNP;; n - общее число информативных SNP.
Использование встречаемости аллелей по множественным SNP может повысить точность определения фракционной концентрации ДНК плода.
С. Фракционная концентрация без явной генетической информации о родителях.
Теперь опишем способ определения фракционной концентрации ДНК плода в образце материнской плазмы, при котором не требуется предварительная информация о генотипах плода и матери. В одном воплощении осуществляется определение информативных SNP по встречаемости различных аллелей в локусах этих SNP в материнской плазме. При этом способ 1000 может применяться вместе с определением информативных SNP на основании воплощений, описанных ниже. Сначала представим описание вероятностей, для того чтобы облегчить понимание расчета порога отсечения, используемого для идентификации информативных SNP.
В одном воплощении вероятность выявления специфичного для плода аллеля подчиняется распределению Пуассона. Вероятность (P) выявления специфичного для плода аллеля можно вычислить по следующему уравнению: P = 1 - ехр(ДхК/2), где f означает фракционную концентрацию ДНК плода в образце материнской плазмы, N - общее число молекул, соответствующих локусу данного анализируемого SNP, а ехр() означает экспоненциальную функцию. В одном аспекте P рассматривается как ожидаемое распределение, так как это распределение получается не при измерении количества молекул по многим образцам. В других воплощениях можно использовать и другие распределения.
Принимая, что фракционная концентрация ДНК плода составляет 5% (типичное значение для первого триместра беременности) и подвергается анализу 100 молекул (матери + плода), соответствующих этому локусу SNP (что эквивалентно количеству, содержащемуся в 50 диплоидных геномах), вероятность обнаружения специфичного для плода аллеля (аллеля Т) равна 1-ехр(-0,05х 100/2)=0,92. Вероятность обнаружения специфичного для плода аллеля возрастает с повышением фракционной концентрации ДНК плода и числа молекул, подвергаемых анализу на локус SNP. Например, если концентрация ДНК плода составляет 10% и анализируется 100 молекул, то вероятность обнаружения специфичного для плода аллеля составляет 0,99.
Следовательно, в локусе SNP, по которому мать гомозиготна, присутствие в материнской плазме аллеля, отличающегося от материнского, может означать, что этот SNP информативен для расчета фракционной концентрации ДНК плода. Вероятность пропуска любого информативного SNP может зависеть от числа анализируемых молекул. Иными словами, для выявления информативных SNP при любом желательном уровне достоверности число молекул, которое нужно проанализировать для получения требуемой точности, можно рассчитать по вероятностной функции Пуассона.
Применяя вышеуказанный анализ, в некоторых воплощениях можно определить, является локус информативным или нет, когда генотип матери неизвестен. В одном воплощении определяются локусы, по которым в материнской плазме проводится выявление двух различных аллелей. Например, для локуса
- 16 033752
SNP с двумя возможными аллелями, А и Т, в материнской плазме проводится выявление обоих аллелей,
А и Т.
На фиг. 11 представлена блок-схема способа определения 1100 того, что локус является информативным согласно воплощениям настоящего изобретения. В одном воплощении способ 1100 может применяться при выполнении стадии 1020 способа 1000. В другом воплощении одна стадия способа 1100 заключается в определении предела отсечения на основе статистического распределения, а на другой стадии предел отсечения используется для определения того, является ли локус (SNP) информативным.
На стадии 1110 определяется предел отсечения для предсказания встречаемости соответствующего первого аллеля в определенном локусе. В одном воплощении предел отсечения предсказывает, является ли материнский геном гомозиготным, а геном плода гетерозиготным. В одном воплощении предел отсечения определяется на основе статистического распределения встречаемости для различных комбинаций гомозиготности и гетерозиготности в конкретном локусе. Например, распределение частоты аллелей можно предсказать по вероятностной функции Пуассона.
На стадии 1120, исходя из анализа молекул нуклеиновой кислоты из материнского образца (например, на стадии 1010), в локусе проводится выявление первого аллеля и второго аллеля. Например, при картировании на анализируемый локус приходится набор фрагментов, в которых был обнаружен первый аллель или второй аллель. Первый аллель может соответствовать одному из соответствующих первых аллелей из стадии 1020, а второй аллель может соответствовать одному из соответствующих вторых аллелей. В одном воплощении, если не обнаруживаются два различных аллеля, то это значит, что локус не является информативным.
На стадии 1130 определяется фактическая встречаемость соответствующего первого аллеля в локусе на основании анализа молекул нуклеиновой кислоты. Например, можно подсчитать результаты секвенирования множества молекул нуклеиновой кислоты и установить, сколько раз на этот локус приходится фрагмент с генотипом первого аллеля.
На стадии 1140 локус идентифицируется как один из первых локусов, исходя из сравнения фактической встречаемости с пределом отсечения. В одном аспекте предел отсечения используется для различения между тремя возможностями: (а) мать гомозиготна (АА), а плод гетерозиготен (AT); (b) мать гетерозиготна (AT), и плод гетерозиготен (AT); и (с) мать гетерозиготна (AT), а плод гомозиготен (АА) или (ТТ). Для иллюстрации в приведенных ниже примерах принимается, что у плода генотип АА по сценарию (с). Однако вычисление будет таким же, если у плода будет генотип ТТ. Информативному локусу соответствует вариант (а).
В одном воплощении локус определяется как один из первых локусов, если его фактическая встречаемость меньше предела отсечения. В другом воплощении можно использовать и меньшее значение порога, чтобы избежать ложного картирования.
А теперь опишем определение предела отсечения. Исходя из физиологически возможной фракционной концентрации ДНК плода (эта информация доступна из предыдущих исследований) и общего числа молекул, соответствующих локусу SNP, можно предсказать распределение встречаемости аллелей для трех возможных сценариев, приведенных выше. Исходя из предсказанного распределения, можно определить предел отсечения для интерпретации наблюдаемой встречаемости аллелей в материнской плазме для определения того, что SNP является информативным (т.е. вариант (а)) или нет.
Фракционная концентрация ДНК плода обычно составляет от 5 до 20% в начале беременности и от 10 до 35% в конце беременности (Lun et al. Micro fluidics digital PCR reveals a higher than expected fraction of fetal DNA in maternal plasma. Clin. Chem. 2008, 54: 1664-72). Так, в одном воплощении определяли прогнозируемое распределение встречаемости аллелей при фракционной концентрации ДНК плода в 5% и 20%.
На фиг. 12А представлено прогнозируемое распределение встречаемости для аллеля Т (менее распространенный аллель по сценариям (а) и (с)) для трех сценариев с предполагаемой фракционной концентрацией ДНК плода в 20%. На фиг. 12В представлено прогнозируемое распределение встречаемости для аллеля Т (менее распространенный аллель по сценариям (а) и (с)) для трех сценариев с предполагаемой фракционной концентрацией ДНК плода в 5%. В обеих моделях предполагается, что для анализа локуса SNP было взято в целом 200 молекул.
Используя в качестве предела отсечения встречаемость менее распространенного аллеля (аллеля Т), составляющую 40 раз, можно статистически отличить три возможности. Иными словами, при выявлении в материнской плазме локуса SNP с двумя аллелями и при анализе в общей сложности 200 молекул, если частота второстепенного аллеля (менее распространенного аллеля) будет меньше 40, то этот локус SNP можно считать информативным. При фракционной концентрации ДНК плода в 5% и 20% различение информативных SNP (сценарий (а)) от тех SNP, по которым мать гетерозиготна (сценарии (b) и (с)), будет правильным на 100%.
На практике общее число выявляемых молекул может быть различным для различных SNP. Для каждого локуса SNP можно составить свою кривую прогнозируемого распределения с учетом общего числа выявляемых молекул в образце материнской плазмы, охватывающих этот локус SNP. Иными словами, предел отсечения для определения того, что SNP является информативным или нет, может варьи- 17 033752 ровать между различными SNP и зависит от того, сколько раз встречался этот локус SNP.
В следующей таблице представлена встречаемость аллелей из трех локусов SNP в материнской плазме при секвенировании образца материнской плазмы. По каждому из трех SNP в материнской плазме обнаружено два разных аллеля. Общее число выявленных случаев в материнской плазме, соответствующих этим трем SNP, отличается друг от друга.
Локус SNP Обозначение SNP Аллель (разы) Аллель (разы) Общее число раз
1 rs3107146 А (Ю) G(163) 173
2 rs7522344 G(9) Т(112) 121
3 rs2272908 АД72) θί62) 134
Прогнозируемое распределение встречаемости менее распространенного аллеля при фракционной концентрации ДНК плода в 20% и различном числе молекул, соответствующих SNP, представлено на фиг. 13А, 13В и 14. Прогнозируемое распределение составляли, принимая концентрацию ДНК плода в 20%, так как она представляет верхний предел концентрации ДНК плода в первом триместре. Чем более высокая концентрация ДНК плода, тем большее ожидается перекрывание между кривыми распределения второстепенного аллеля, по которому мать гомозиготна, и главного аллеля, по которому мать гетерозиготна. Таким образом, для предсказания информативных SNP будет более уместным вычисление предела отсечения для второстепенного аллеля с использованием более высокой концентрации ДНК плода.
На фиг. 13А представлено прогнозируемое распределение встречаемости менее распространенного аллеля при общем числе 173 молекул и фракционной концентрации ДНК плода в 20%. В одном воплощении, исходя из этого распределения, для идентификации информативных SNP подходит критерий отсечения менее 40 для встречаемости менее распространенного аллеля. Поскольку аллель А встречается 10 раз, то локус SNP № 1 считается информативным для вычисления фракционной концентрации ДНК плода.
На фиг. 13В представлено прогнозируемое распределение встречаемости менее распространенного аллеля при общем числе 121 молекулы и фракционной концентрации ДНК плода в 20%. В одном воплощении, исходя из этого распределения, для идентификации информативных SNP подходит предел отсечения менее 26 для встречаемости менее распространенного аллеля. Поскольку аллель Т встречается 9 раз, то локус SNP № 2 считается информативным для вычисления фракционной концентрации ДНК плода.
На фиг. 12 представлено прогнозируемое распределение встречаемости менее распространенного аллеля при общем числе 134 молекул и фракционной концентрации ДНК плода в 20%. В одном воплощении, исходя из этого распределения, для идентификации информативных SNP подходит предел отсечения менее 25 для встречаемости менее распространенного аллеля. Поскольку аллель Т встречается 62 раза, то локус SNP № 3 считается не информативным и не должен использоваться для вычисления фракционной концентрации ДНК плода.
В некоторых воплощениях фракционную концентрацию ДНК плода можно рассчитать по формуле f=2xp/(p+q), используя встречаемость аллелей для SNP № 1 и 2 и объединяя их. Результаты представлены ниже.
Локус SNP, используемый для вычисления Фракционная концентрация ДНК плода
1 10x2/(10+ 163)= 11,6%
2 9*2/(9 + 112) = 14,9%
1 и 2 (10 + 9)х2/(10 + 9+163 + 112) = 12,9%
D. Определение полноты охвата генома плода.
Помимо получения фракционной концентрации, можно определить степень охвата генома плода при выполнении аналитической процедуры (например, секвенирования) на стадии 1010. В некоторых воплощениях для определения степени охвата можно использовать информативные локусы. Например, можно использовать любой из вышеприведенных примеров. В одном воплощении можно использовать локусы, по которым плод является облигатной гетерозиготой. В другом воплощении можно использовать локусы, по которым плод оказался гетерозиготным, а мать гомозиготна (например, используя способ 1100).
Для определения степени охвата можно использовать фрагменты, которые при картировании попадают на информативные локусы. В одном воплощении определяется доля тех локусов из первого множества локусов, в которых по результатам секвенирования выявляется соответствующий первый аллель. Например, если по одному локусу у плода будет ТА, а у матери АА, то по результатам секвенирования должен выявляться аллель Т, если этот локус подвергался секвенированию. Таким образом, можно рассчитать, какая доля генома плода в биологическом образце подвергалась секвенированию, исходя из этого соотношения. В одном воплощении в качестве степени охвата генома плода принимается доля тех первых локусов, в которых отмечен специфичный для плода аллель. В других воплощениях эта доля может подвергаться модификации в зависимости от того, где находятся эти локусы. Например, можно определить степень охвата для каждой хромосомы. С другой стороны, можно считать, что степень охвата меньше, чем эта доля, если первые локусы не являются хорошей репрезентативной выборкой генома. С
- 18 033752 другой стороны, можно представить диапазон, в котором эта доля составляет один конец диапазона. В то время, как высокая степень охвата, т.е. близкая к 100%, означает почти полный охват генома плода, большинство генетических заболеваний можно диагностировать при значительном меньшем охвате, чем
100%, например, 80% или 50% или еще меньше.
VI. Отсутствие предварительной информации о геноме матери и отца.
В предыдущих разделах, в некоторых воплощениях определяли генетическую карту плода (или части генома плода), когда были известны гаплотипы матери и генотипы отца. В других воплощениях было показано, что фракционную концентрацию ДНК плода можно определить путем анализа ДНК в материнской плазме без предварительного знания о генотипах матери, отца или плода. Еще в других воплощениях авторы изобретения теперь также опишут способ определения генетической карты плода (или части генома плода) при помощи анализа RHDO без предварительной информации о генотипах/гаплотипах матери и отца.
В одном воплощении используется информация о контрольных (например, распространенных или известных) гаплотипах той популяции, к которой принадлежат родители. Эта информация может использоваться для выведения гаплотипов матери и отца. Покажем принцип этого метода на одном примере. Информацию по таким контрольным гаплотипам можно получить, к примеру, из вебсайта международного проекта International HapMap Project (hapmap.ncbi.nlm.nih.gov/).
Для примера предположим, что в популяции есть три контрольных гаплотипа (Hap А, Hap В и Hap С, как показано на фиг. 15А). Каждый из этих трех гаплотипов состоит из 14 локусов SNP, причем в каждом локусе есть два возможных аллеля. В этом примере отец обладает Hap В и Hap С, а мать обладает Hap А и Hap В, как показано на фиг. 15В. В этом примере принимается, что плод наследует Hap А от матери и Hap С от отца. Поэтому у плода будет Hap А и Hap С, как показано на фиг. 15В.
На фиг. 16 представлена блок-схема способа определения 1600 по меньшей мере части генома плода, когда известен набор контрольных гаплотипов, но неизвестны родительские гаплотипы, согласно воплощениям настоящего изобретения.
На стадии 1610 материнский образец подвергается анализу для выявления тех SNP, по которым мать гомозиготна, а плод гетерозиготен. Такой анализ проводится таким же образом, как и определение информативных локусов, как описано выше. Так, в одном воплощении можно использовать способ 1000 и/или 1100. В других воплощениях, описанных выше, подвергаются анализу геномы матери и отца, чтобы получить данные для картирования генома плода.
На фиг. 17 представлен пример определения информативных локусов при анализе фрагментов ДНК из материнского образца. Для каждого из 14 локусов определяется встречаемость двух аллелей по каждому локусу. Встречаемость этих аллелей можно определить, к примеру, без ограничения, методом ПЦР в реальном времени, цифровым методом ПЦР и массированным параллельным секвенированием. По каждому из этих локусов нужно выявить два разных аллеля в материнской плазме. В отличие от тех SNP, по которым мать гетерозиготна, доля этих двух аллелей будет существенно отличаться. Специфичный для плода аллель (тот, который плод наследует от отца) будет встречаться гораздо реже, чем материнский аллель. Информативные локусы 1710 отмечены на фиг. 17.
На стадии 1620 определяется один или несколько аллелей из отцовского гаплотипа, унаследованных плодом. В одном воплощении каждый из локусов 1710 может использоваться для определения унаследованного отцовского гаплотипа. Например, отцовский аллель, унаследованный плодом, можно идентифицировать как специфичный для плода аллель по локусам 1720, поскольку в материнском образце специфичный для плода аллель встречается гораздо реже, чем материнский аллель.
На стадии 1630 отцовские аллели сравнивают с контрольными гаплотипами, чтобы определить гаплотип, унаследованный от отца. В некоторых воплощениях можно вывести целый ряд возможных гаплотипов плода, каждый со своей вероятностью. Затем один или несколько из наиболее вероятных гаплотипов плода можно использовать для последующего анализа или для клинической диагностики.
В приведенном на фиг. 18 примере в популяции есть три возможных гаплотипа (Hap А, Hap В и Hap С). При анализе материнской плазмы четыре SNPs оказались гомозиготными для матери и гетерозиготными для плода, поэтому они представляют отцовские аллели, унаследованные плодом. Генотипы по этим четырем SNPs соответствуют профилю Hap С. Следовательно, плод унаследовал Hap С от отца, как показано на фиг. 19. Иными словами, для всех SNPs в пределах одного и того же блока гаплотипов можно вычислить отцовские аллели, унаследованные плодом.
На стадии 1640 можно определить локусы (например, SNPs), по которым мать гетерозиготна. В одном воплощении те SNPs, по которым мать гетерозиготна, получают при анализе материнского образца. Например, по каждому из этих SNPs выявляется два разных аллеля. В отличие от тех SNPs, по которым мать гомозиготна, а плод гетерозиготен, когда специфичные для плода аллели составляют лишь небольшую долю от всех аллелей в материнской плазме, встречаемость двух аллелей будет одинаковой для тех SNPs, по которым мать гетерозиготна. Таким образом, при анализе материнской плазмы можно установить полный генотип матери по всем локусам SNP в пределах одного блока гаплотипов, например, как показано на фиг. 20.
На стадии 1650 составляются материнские гаплотипы из генотипов матери на стадии 1640 путем
- 19 033752 сравнения генотипов по локусам с информацией о гаплотипах в соответствующей популяции. На фиг. 21 представлено воплощение для определения материнских гаплотипов из генотипов матери и контрольных гаплотипов. В данном примере мать гомозиготна по аллелю G в третьем локусе SNP. Поскольку только Hap А и Hap В соответствуют этому критерию, то это значит, что у матери должна быть одна из трех комбинаций гаплотипов, а именно Hap А/Hap А, Hap А/Hap В или Hap В/HapB. Кроме того, поскольку мать гетерозиготна по А и С для первого SNP, можно заключить, что у матери должна быть комбинация гаплотипов Hap А/Hap В. В одном воплощении может возникнуть более чем одна возможность, причем каждую возможность можно проверить на следующей стадии. Из вышеприведенного анализа были установлены гаплотипы матери и гаплотип, унаследованный плодом от отца. На фиг. 22 представлены установленные гаплотипы матери и унаследованный от отца гаплотип.
На стадии 1660 определяется материнский гаплотип, унаследованный плодом, из гаплотипов матери, установленных на стадии 1650, и унаследованного от отца гаплотипа, установленного на стадии 1630. Используя эту информацию, в одном воплощении для определения того, какой материнский гаплотип перешел к плоду, применяется анализ RHDO. Анализ RHDO может проводиться по любому из описанных здесь воплощений.
В одном воплощении для анализа RHDO те SNPs, по которым мать гетерозиготна, можно разделить на два типа, тип альфа и тип бета (например, как показано на фиг. 23 и описано выше). К SNPs типа альфа относятся те локусы, в которых отцовский аллель, перешедший к плоду, идентичен материнскому аллелю в составе Hap А. Для SNPs типа альфа, если плод от матери унаследует Hap А, то аллели из Hap А будут избыточно представлены в материнской плазме. С другой стороны, если плод от матери унаследует Hap В, то два материнских аллеля будут одинаково представлены в материнской плазме.
К SNPs типа бета относятся те локусы, в которых отцовский аллель, перешедший к плоду, идентичен материнскому аллелю в составе Hap В. Для SNPs типа бета, если плод от матери унаследует Hap В, то аллели из Hap В будут избыточно представлены в материнской плазме. Однако, если плод от матери унаследует Hap А, то два материнских аллеля будут одинаково представлены в материнской плазме. Возможную избыточную представленность аллелей из Hap А или Hap В можно определить при помощи анализа RHDO.
В некоторых воплощениях при применении анализа RHDO к определенному участку без предварительной информации о гаплотипах матери и генотипах отца может потребоваться сравнительно многократный охват SNPs в пределах блока гаплотипов, к примеру, в одном воплощении нужно проанализировать 200 молекул, соответствующих локусу SNP. Такая информация может быть получена, к примеру, без ограничения, методом ПЦР в реальном времени, цифровым методом ПЦР и массированным параллельным секвенированием. В одном воплощении для получения репрезентативной и объективной количественной информации по различным аллелям на искомом участке можно использовать прицельное секвенирование (например, сочетанием обогащения мишени и массированного параллельного секвенирования). Прицельное секвенирование описано в приведенном ниже примере. Таким образом, анализ RHDO может применяться к данным по прицельному секвенированию ДНК в материнской плазме для определения того, какие материнские аллели/гаплотипы передаются плоду, без предварительной информации о генотипах/гаплотипах родителей.
VII. Выявление мутаций de novo.
В некоторых воплощениях можно выявить мутации, приобретенные плодом. Мутации de novo - это такие мутации, которые не передаются отцом или матерью, а возникают, к примеру, при гаметогенезе у отца или у матери или у обоих. Выявление их имеет клиническое значение, так как мутации de novo играют важную роль, вызывая целый ряд генетических заболеваний, например, гемофилию А и хондродистрофию.
На фиг. 24 представлена блок-схема, иллюстрирующая способ идентификации 2400 мутаций de novo в геноме еще не рожденного плода у беременной женщины. У плода есть отец и беременная женщина-мать, причем отец обладает отцовским геномом с двумя гаплотипами, а мать обладает материнским геномом с двумя гаплотипами, при этом способ включает следующее.
На стадии 2410 проводится секвенирование множества молекул нуклеиновой кислоты из биологического образца, взятого у беременной женщины. Отметим, что образец содержит смесь нуклеиновых кислот матери и плода.
На стадии 2420 устанавливается локализация каждой из просеквенированных молекул нуклеиновой кислоты в геноме человека. В одном воплощении картирование последовательностей осуществляется путем секвенирования с одного конца или с обоих концов. В одном аспекте картирование для локализации в геноме человека не требует точного совпадения каждого из нуклеотидов при выявлении локализации.
На стадии 2430 для каждого по крайней мере из части местоположений определяется материнская последовательность и отцовская последовательность в данном положении. Например, если на стадии 2420 установлено 100 местоположений, то можно определить материнские и отцовские геномы в этих 100 положениях. В одном воплощении отцовские последовательности определяются из взятого у отца образца, в отличие от использования контрольных гаплотипов, как это описано выше. При этом можно
- 20 033752 выявить мутации, не представленные в контрольном геноме. В различных воплощениях материнские последовательности можно получить из образца, содержащего только материнскую ДНК, или же получить из биологического образца, например, с помощью описанных здесь методов.
На стадии 2440 устанавливается первая последовательность во множестве молекул нуклеиновой кислоты, которая не присутствует среди выявленных материнских или отцовских последовательностей. В одном воплощении сравнение первой последовательности с выявленными материнскими или отцовскими последовательностями требует точного совпадения. Так, если совпадение не будет точным, то считается, что первая последовательность не присутствует среди выявленных материнских или отцовских последовательностей. При этом можно идентифицировать даже незначительные мутации de novo, так как мутация de novo может представлять собой изменение всего лишь одного нуклеотида. В другом воплощении, для того чтобы последовательность рассматривалась как мутация de novo, необходимо определенное количество фрагментов ДНК, содержащих не материнскую и не отцовскую последовательность. Например, можно использовать предел отсечения в 3 фрагмента ДНК для определения того, что в последовательности есть мутация de novo или нет ее.
На стадии 2450 определяется первая фракционная концентрация первой последовательности в биологическом образце. Например, количество фрагментов ДНК, содержащих первую последовательность, можно выразить в виде доли от всех фрагментов ДНК, выявленных по этому локусу.
На стадии 2460 определяется вторая фракционная концентрация нуклеиновой кислоты плода в биологическом образце, используя молекулу нуклеиновой кислоты, унаследованную плодом от отца, которая присутствует в отцовском геноме, но отсутствует в материнском геноме. Такая молекула нуклеиновой кислоты может содержать первый аллель в таком локусе, по которому отец гомозиготен, а мать тоже гомозиготна, но по другому аллелю, поэтому плод будет облигатной гетерозиготой. Для выяснения того, какую молекулу нуклеиновой кислоты следует использовать для определения второй фракционной концентрации, можно использовать информативные локусы, описанные выше.
В других воплощениях вторая фракционная концентрация определяется при помощи других подходов, как-то методом ПЦР, цифровым методом ПЦР или методом на основе масс-спектрометрии, по Yхромосоме, по комплекту геннетических полиморфизмов, т.е. полиморфизмов по одному нуклеотиду или полиморфизмов типа вставки-делеции (Lun F.M.F. et al., Clin. Chem. 2008, 54: 1664-1672). Другая альтернатива состоит в использовании одного или нескольких геномных локусов, проявляющих различия по метилированию ДНК между плодом и матерью (Poon L.L.M. et al., Clin. Chem. 2002, 48: 35-41; Chan K.C.A. et al., Clin. Chem. 2006, 52: 2211-2218; US Patent 6927028).
В одном воплощении различия в эпигенетическом статусе отражаются различиями по метилированию ДНК. Различия по метилированию ДНК могут затрагивать ген 1А из семейства доменов ассоциации с RAS (RASSF1A) или ген лигазы синтетазы голокарбоксилазы (биотин(пропионил-СоА-карбоксилазы (АТФ-гидролизирующей)) (HLCS). Количество фрагментов ДНК со специфичным для плода профилем метилирования ДНК можно выразить в виде доли от всех фрагментов ДНК, возникающих по этому локусу с дифференциальным метилированием.
На стадии 2470 первая последовательность рассматривается как мутантная de novo, если первая и вторая фракционная концентрация примерно одинаковы. Не материнские и не отцовские последовательности, возникающие из-за ошибок в процессе анализа, например, ошибок при секвенировании, являются случайными явлениями и могут случиться с малой вероятностью. Поэтому множественные фрагменты ДНК, содержащие одну и ту же не материнскую и не отцовскую последовательность в количестве, близком к измеренной фракционной концентрации ДНК плода в образце, скорее всего представляют мутацию de novo, присутствующую в геноме плода, а не возникли из-за ошибки при секвенировании. В одном воплощении для определения того, что фракционные концентрации одинаковы, можно использовать предел отсечения. Например, если концентрации отличаются друг от друга на заданную величину, то первая последовательность рассматривается как мутантная de novo. В различных воплощениях заданная величина может составлять 5, 10 или 15%.
Примеры
Пример 1.
Для иллюстрации воплощений настоящего изобретения проанализируем следующий случай. Была привлечена пара, посещающая акушерскую клинику для пренатальной диагностики бета-талассемии. Отец был носителем делеции 4 пар оснований -СТТТ из кодонов 41/42 гена бета-глобина человека. Беременная мать была носителем мутации A^G по нуклеотиду -28 гена бета-глобина человека. У отца и матери брали образцы крови. У матери образец крови брали перед взятием образца хориальных ворсин (CVS) после 12 недель беременности. Часть образца CVS сохраняли для эксперимента. Целью эксперимента было составление генетической карты всего генома или определение полной или частичной геномной последовательности плода путем массированного параллельного секвенирования ДНК материнской плазмы.
1. Определение родительских генотипов.
ДНК экстрагировали из лейкоцитной пленки отца и матери и из образца CVS. Эти образцы ДНК подвергали анализу на установке Affymetrix Genome-Wide Human SNP Array 6.0 system. Эта система со- 21 033752 держит 1,8 млн генетических маркеров, включая ~900 000 полиморфизмов по одному нуклеотиду (SNP) и более 950 000 зондов для выявления вариаций числа копий. Абсолютное количество и проценты SNPs, проявляющих различные комбинации генотипов для отца, матери и плода (CVS), приведены в таблице на фиг. 25А.
Хотя в этом примере использовалась система Affymetrix, на практике можно использовать любую платформу генотипирования, известную в данной области. Так, помимо генотипирования, ДНК из лейкоцитной пленки отца и матери также можно подвергнуть секвенированию, как по всему геному, так и по отдельным участкам генома. Более того, для установления генотипов родителей можно использовать любой источник ДНК (например, ДНК буккальных клеток, ДНК волосяных фолликулов и т.д.) из организма отца и матери.
Образец CVS подвергали анализу, чтобы получить стандарт для сравнения с генетической картой плода, составленной при анализе материнской плазмы. Кроме того, для этого эксперимента генотип образца CVS также можно использовать для составления гаплотипа матери для анализа RHDO. При этом использование генотипа CVS с целью составления гаплотипа матери применялось только для иллюстрации. При клиническом применении воплощений гаплотип матери можно составить посредством анализа других членов семьи, к примеру, предыдущих детей, братьев и сестер, родителей или других родственников матери. Гаплотип матери по искомым участкам хромосом также можно составить и другими методами, хорошо известными специалистам, из которых некоторые приведены здесь.
В отдельных воплощениях также определяется гаплотип отца еще не рожденного плода. Такая информация может быть особенно полезной при определении относительной дозы гаплотипа по тем участкам хромосом, по которым и отец, и мать гетерозиготны.
2. Массированное параллельное секвенирование ДНК материнской плазмы.
ДНК из плазмы, полученной от матери, подвергали массированному параллельному секвенированию на платформе Illumina Genome Analyzer. Секвенирование молекул ДНК из плазмы проводили с двух концов. Каждую молекулу секвенировали по каждому концу на 50 п.о., в общей сложности 100 п.о. на молекулу. Оба конца последовательности выравнивали с демаскированным по повторам геномом человека (Hg18 NCBI.36 из сайта UCSC http://genome.ucsc.edu) с помощью программы SOAP2 из Пекинского института геномики в Шеньчжене (Beijing Genomics Institute at Shenzhen; soap.genomics.org.cn) (Li R et al., Bioinformatics 2009, 25(15): 1966-7). В таблице на фиг. 25В приведена статистика выравнивания для первых 20 проточных кювет. Так, при 20 проточных кюветах с контрольным геномом человека было выровнено свыше 3,932 млрд. прочитанных отрезков.
3. Вычисление фракционной концентрации ДНК плода.
Как указано выше, фракционную концентрацию ДНК плода в образце материнской плазмы можно вычислить по данным секвенирования. Так, можно проанализировать те SNPs, по которым и отец, и мать гомозиготны, но по различным аллелям. По таким SNPs плод будет облигатной гетерозиготой по одному отцовскому и одному материнскому аллелю. В одном воплощении можно использовать любой из способов вычисления, описанных в разделе V. А в этом примере вычисления проводились по кумулятивным данным из различных полиморфных генетических локусов, соответствующих конфигурации родительских генотипов (т.е. оба родителя гомозиготны, но по различным аллелям) на разных хромосомах. Фракционные концентрации ДНК плода, рассчитанные по SNPs, локализованным на разных хромосомах, приведены в самом правом столбце на фиг. 26. Как видно из таблицы, фракционные концентрации, рассчитанные по SNPs, локализованным на разных хромосомах, очень хорошо коррелируют друг с другом.
В качестве эксперимента по контролю качества исследовали и те SNPs, по которым мать гомозиготна, а отец гетерозиготен, путем анализа образцов из лейкоцитной пленки методом Affymetrix SNP 6.0 (средний столбец на фиг. 26). Видно, что при достаточной полноте секвенирования ДНК измеренные при этом фракционные концентрации ДНК плода оказались очень близкими тем, которые измеряли по SNPs, по которым и отец, и мать гомозиготны, но по различным аллелям.
В одном воплощении, если по этим двум типам SNPs наблюдаются почти одинаковые фракционные концентрации ДНК плода, то можно заключить, что геном плода был почти полностью охвачен секвенированием. В одном аспекте, при меньшей полноте охвата фракционные концентрации ДНК плода, измеренные по SNPs, по которым мать гомозиготна, а отец гетерозиготен, будут более высокими, чем при измерении по тем SNPs, по которым и отец, и мать гомозиготны, но по различным аллелям. При меньшей полноте охвата отсутствие уникального по отцовской линии аллеля может быть вызвано двумя возможными факторами: (i) тем, что плод не унаследовал этот аллель от отца; и/или (ii) тем, что плод унаследовал этот аллель от отца, но затем он был утерян при секвенировании, потому что полнота секвенирования была недостаточной.
4а. Вычисление степени охвата генома плода.
Также, как указано выше, можно определить, какой процент генома плода был проанализирован при секвенировании ДНК из материнской плазмы, если посмотреть на подгруппу SNPs, по которым и отец, и мать гомозиготны, но по различным аллелям. В этой семье 45 900 SNPs на матрице Affymetrix SNP 6.0 принадлежали к этой подгруппе. Степень охвата генома плода можно вычислить путем анализа данных по секвенированию ДНК из плазмы, чтобы узнать, у какого процента SNPs из этой подгруппы
- 22 033752 выявляется аллель плода при секвенировании.
На графике из фиг. 27А представлен наблюдаемый процент SNP в этой подгруппе, в которой аллель плода наблюдается по данным секвенирования при анализе первых 20 проточных кювет. Так, аллель плода наблюдается у 94% таких SNPs. Такая степень секвенирования соответствует более 3,932 млрд. прочитанных отрезков при последовательности в 100 п.о. На графике из фиг. 27В представлен охват в зависимости от числа прочитанных отрезков вместо количества проточных кювет. С увеличением производительности различных платформ секвенирования следует ожидать, что количество проточных кювет или запусков, используемых или необходимых для получения такого количества прочитанных последовательностей или отрезков последовательностей, в будущем уменьшится.
В некоторых воплощениях, поскольку в каждом участке хромосомы или хромосом выявляется несколько SNPs, то охват генома плода составит менее 94% и тем не менее обеспечит правильное картирование генома. Например, предположим, что на участке хромосомы имеется 30 информативных SNPs, но аллель плода выявляется только у 20 из этих 30 SNPs. Тем не менее, участок хромосомы можно правильно идентифицировать и при 20 SNPs. Так, в одном воплощении равнозначная точность достигается при охвате, составляющем менее 94%.
4b. Охват генетической картой аллелей, унаследованных плодом от отца.
В этом примере анализа изучали те аллели SNPs, по которым отец гетерозиготен, а мать гомозиготна. В этой семье 131 037 SNPs на матрице Affymetrix SNP 6.0 относились к этой категории. Подгруппа таких SNPs состояла из 65 875 SNPs, по которым мать гомозиготна, а отец и плод гетерозиготны. При использовании 20 проточных кювет аллели, наследуемые по отцовской линии, наблюдались у 61 875 таких SNPs, что означает охват в 93,9%. Этот процент хорошо соответствует данным по степени охвата, полученным в предыдущем параграфе. Корреляции между охватом наследуемых по отцовской линии аллелей и количеством поддающихся картированию прочитанных последовательностей и количеством последовательностей из проточных кювет приведены на фиг. 28А и фиг. 28В, соответственно.
Для выяснения специфичности такого подхода к выявлению истинных наследуемых по отцовской линии аллелей у плода подвергали анализу 65 162 (т.е. 131 037-65 875) SNPs, по которым плод унаследовал те же самые аллели, что и мать. Для таких SNPs кажущееся выявление аллелей, отличающихся от аллелей матери, должно означать ложно-положительные результаты. Так, из этих 65 162 SNPs при анализе 20 проточных кювет отмечено только 3 225 ложно-положительных (4,95%). Эти ложноположительные результаты могли возникнуть в результате ошибок при секвенировании или ошибок при генотипировании ДНК отца или матери либо мутаций de novo у плода. Корреляция между долей ложноположительных и количеством просеквенированных проточных кювет представлена на фиг. 29А.
Долю ложно-положительных можно определить и при рассмотрении подгруппы SNPs, по которым и отец, и мать гомозиготны по одному и тому же аллелю. Наличие любого альтернативного аллеля в определенном локусе считалось ложно-положительным результатом. Эти ложно-положительные могли возникнуть в результате ошибок при секвенировании или ошибок при генотипировании ДНК отца или матери либо мутаций de novo у плода. В этой подгруппе было 500 673 SNPs. По данным секвенирования из 20 проточных кювет ложно-положительные результаты отмечались у 48 396 SNPs (9,67%). Корреляция между долей ложно-положительных и количеством просеквенированных проточных кювет представлена на фиг. 29В. Доля ложно-положительных при этом была выше, чем при оценке по подгруппе SNPs, по которым и мать, и плод гомозиготны, а отец гетерозиготен. Это вызвано тем, что в последней подгруппе SNPs ложно-положительным считается только наличие в материнской плазме наследуемых по отцовской линии аллелей, тогда как в первой подгруппе ложно-положительным результатом считается любой аллель, отличающийся от общих для отца и матери аллелей.
На фиг. 30 представлен охват специфичных для плода SNPs при различном числе анализируемых проточных кювет. В этот анализ включены те SNPs, по которым и отец, и мать гомозиготны, но по различным аллелям. По оси X представлена степень охвата специфичных для плода SNPs, а по оси Y - процент SNPs с заданной степенью охвата. При повышении числа анализируемых проточных кювет возрастает средняя степень охвата специфичных для плода SNPs. Например, при одной анализируемой проточной кювете средняя степень охвата SNPs составляет 0,23 раз. А при анализе 20 проточных кювет средняя степень охвата возрастает до 4,52 раз.
5. Правильность генетической карты, унаследованной от матери.
На фиг. 31 представлена точность анализа типа А при использовании данных из 10 проточных кювет. В разделе II.B описаны воплощения анализа типа А и типа В (также именуются альфа и бета). Точность относится к правильному определению гаплотипа, унаследованного от матери. Точность представлена отдельно для каждой хромосомы.
Используя соотношение правдоподобия = 1200 при анализе SPRT (Zhou W. et al., Nat. Biotechnol. 2001, 19:78-81; Karoui N.E. et al., Statist Med 2006, 25:3124-33), точность составляла от 96 до 100%. Как видим, даже при таком высоком соотношении правдоподобия для классификации по SPRT, в общей сложности классифицировали 2760 сегментов по всему геному. Такая степень разрешения достаточна для большинства задач, если учесть, что мейотическая рекомбинация происходит с частотой от одного до нескольких раз на одно плечо хромосомы за поколение. Кроме того, видно, что все ошибочные клас- 23 033752 сификации можно было предотвратить при использовании перемежающегося подхода (справа на фиг. 31). Как описано выше, в перемежающемся подходе применяется анализ и типа А, и типа В.
На фиг. 32 представлена точность анализа типа В при использовании данных из 10 проточных кювет. Используя соотношение правдоподобия = 1200 при анализе SPRT, точность составляла от 94,1 до 100%. Все ошибочные классификации можно было предотвратить при использовании перемежающегося подхода (справа на фиг. 32), как это отмечалось и на фиг. 31.
На фиг. 33 представлена точность анализа типа А при использовании данных из 20 проточных кювет. Используя соотношение правдоподобия = 1200 при анализе SPRT и алгоритм двух последовательных блоков, в общей сложности было сделано 3780 классификаций, и только 3 (0,1%) классификации оказались неправильными. На фиг. 34 представлена точность анализа типа В при использовании данных из 20 проточных кювет. Используя соотношение правдоподобия = 1200 при анализе SPRT и алгоритм двух последовательных блоков, в общей сложности было сделано 3355 классификаций, и только 6 (0,2%) классификаций оказались неправильными. В этих примерах анализ SPRT проводился по целому ряду генетических маркеров типа SNPs.
Пример 2. Пренатальное определение риска бета-талассемии.
В одном воплощении для определения риска бета-талассемии у плода (аутосомного рецессивного заболевания) можно определить, унаследовал ли плод мутантные аллели, переносимые его отцом и матерью. В данном случае, приведенном выше, отец является носителем делеции 4 пар оснований -СТТТ из кодонов 41/42 гена бета-глобина человека. Беременная мать является носителем мутации A^G по нуклеотиду -28 гена бета-глобина человека.
Для того чтобы определить, унаследовал ли плод отцовскую мутацию по кодонам 41/42, проводили поиск среди данных секвенирования ДНК из материнской плазмы с использованием первых 10 проточных кювет на предмет этой мутации. Всего обнаружили 10 сигналов с этой мутацией (фиг. 35А). Таким образом, плод унаследовал отцовскую мутацию. Кроме того, 62 сигнала содержали последовательность дикого типа по кодонам 41/42 (фиг. 35В). Следовательно, на этом участке процент сигналов, содержащих эту мутацию, равен 0,1389. Эта цифра очень близка фракционной концентрации ДНК плода, установленной на фиг. 26. В одном воплощении риск наследования плодом отцовской мутации можно определить и по наследованию им генетических полиморфизмов, сцепленных с отцовской мутацией.
В одном воплощении для определения риска того, что плод унаследовал материнскую мутацию -28, проводили анализ RHDO. В этой семье мутация -28 локализована на гаплотипе IV, тогда как аллель дикого типа локализован на гаплотипе III. Результаты анализа RHDO типа А представлены на фиг. 36, а результаты анализа RHDO типа В представлены на фиг. 37. При обоих типах анализа установлено наследование плодом гаплотипа III от матери. Иными словами, плод унаследовал от матери аллель дикого типа. Окончательный диагноз у плода состоит в том, что он унаследовал мутацию по кодонам 41/42 от отца и аллель дикого типа от матери. Таким образом, плод является гетерозиготным носителем бетаталассемии и поэтому должен быть клинически здоровым.
Пример 3. Обогащение мишени и прицельное секвенирование.
Как изложено в предыдущих разделах, точность определения фракционной концентрации ДНК плода и разрешение генетической карты, составленной по анализу ДНК в материнской плазме, может зависеть от полноты охвата искомых локусов. Например, авторы изобретения показали, что для определения с высокой точностью фракционной концентрации ДНК плода без предварительной информации о генотипе матери должно хватить и 200 молекул, соответствующих локусу SNP. Встречаемость аллелей для SNP в материнской плазме можно получить, к примеру, без ограничения, методом ПЦР в реальном времени, цифровым методом ПЦР и массированным параллельным секвенированием.
Поскольку при массированном параллельном секвенировании ДНК из материнской плазмы можно одновременно определить встречаемость аллелей для миллионов SNP по всему геному, то это идеальная платформа для анализа всего генома по различным локусам. Основной формат массированного параллельного секвенирования позволяет охватить различные участки генома с аналогичной полнотой. Однако для того чтобы просеквенировать определенный участок с высокой полнотой секвенирования методом случайного массированного параллельного секвенирования, нужно в такой же степени просеквенировать и остальные части генома (не предназначенные для анализа). Так что этот подход может оказаться дорогостоящим. Для улучшения рентабельности подхода массированного параллельного секвенирования можно подвергнуть обогащению искомый участок перед проведением секвенирования. Прицельное секвенирование может проводиться при помощи захвата в растворимой фазе (Gnirke A. et al. Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing. Nat. Biotechnol. 2009, 27:182-9), захвата на микроматрице (например, на алатформе NimbleGen) или прицельной амплификации (Tewhey R. et al. Microdroplet-based PCR enrichment for large-scale targeted sequencing. Nat. Biotechnol. 2009, 27: 1025-31).
Прицельное секвенирование сначала применялось для генетических вариаций в популяции, например, при исследовании генетической ассоциации. Поэтому его текущее применение в исследованиях по геномике направлено на решение качественных задач (например, генотипирование или выявление мутаций). Однако применение прицельного секвенирования ДНК из материнской плазмы для неинвазивной
- 24 033752 пренатальной диагностики включает и количественные соображения, осуществимость которых остается неясной. Например, применение прицельного секвенирования может вносить количественные ошибки при выявлении ДНК плода и матери в материнской плазме. Кроме того, в предшествующих работах было показано, что ДНК плода короче, чем ДНК матери (Chan K.C.A. et al. Size distributions of maternal and fetal DNA in maternal plasma. Clin. Chem. 2004, 50: 88-92). Такая разница в размерах также может вносить количественные ошибки или различия в эффективности при захвате ДНК плода и матери в материнской плазме. К тому же нет уверенности в том, с какой эффективностью могут захватываться такие фрагментированные молекулы ДНК. В нижеследующем описании авторы изобретения покажут, что прицельное секвенирование может осуществляться посредством обогащения мишени с последующим массированным параллельным секвенированием. Авторы изобретения также покажут, что обогащение мишени является эффективным способом оценки фракционной концентрации ДНК плода по сравнению с секвенированием целого генома.
А. Определение фракционной концентрации с обогащением мишени.
1. Материалы и методы.
Были привлечены 4 беременные женщины (М6011, М6028, М6029 и М6043) с единственными плодами женского пола. Образцы периферической крови матерей собирали в пробирки с ЭДТА перед избирательным кесаревым сечением в третьем триместре, а образцы плаценты брали после избирательного кесарева сечения. После центрифугирования из клеток периферической крови экстрагировали ДНК с помощью набора Blood Mini Kit (Qiagen). ДНК из 2,4 мл плазмы экстрагировали с помощью набора DSP DNA Blood Mini Kit (Qiagen). Геномную ДНК матери экстрагировали из лейкоцитной пленки, а геномную ДНК плода экстрагировали из ткани плаценты. В этом примере образцы брали в третьем триместре только для иллюстрации. Равным образом можно использовать образцы из первого или второго триместра.
Генотипы матери и плода определяли на матрице Affymetrix Genome-Wide Human SNP Array 6.0. В каждом случае 5-30 нг ДНК из плазмы использовали для конструирования библиотеки ДНК с помощью набора Paired-end Sample Preparation kit (Illumina) по методике изготовителя с приготовлением образцов типа Chromatin Immunoprecipitation Sequencing. Лигированную с адаптером ДНК очищали прямо на центрифужных колонках из набора QIAquick PCR Purification kit (Qiagen) без дальнейшего отбора по размерам. Затем лигированную с адаптером ДНК подвергали амплификации за 15 циклов ПЦР с помощью стандартных праймеров, которыми служили PCR Primer РЕ 1.0 и 2.0 фирмы Illumina. Библиотеки ДНК подвергали количественному определению с помощью спектрофотометра NanoDrop ND-1000 (NanoDrop Technologies) и пропускали через анализатор 2100 Bioanalyzer, используя набор DNA 1000 kit (Agilent) для проверки распределения по размерам. По каждому образцу получали 0,6-1 мкг амплифицированной библиотеки ДНК из плазмы со средним размером около 290 п.о. Захватывающую библиотеку получали от Agilent, она охватывала 85% экзонов на хромосоме chrX человека (кат. № 5190-1993). Во всех 4 случаях в данном исследовании по 500 нг амплифицированной библиотеки ДНК из плазмы инкубировали с захватывающими зондами в течение 24 ч при 65°С согласно инструкции производителя. После гибридизации захваченные мишени отбирали путем притягивания гибридов типа биотинилированный зонд/мишень с помощью покрытых стрептавидином магнитных шариков (Dynal DynaMag-2, Invitrogen) и очищали с помощью набора MinElute PCR Purification Kit (Qiagen). Наконец, искомые библиотеки ДНК подвергали обогащению путем ПЦР-амплификации за 12 циклов с помощью праймеров SureSelect GA РЕ фирмы Agilent. Продукты ПЦР очищали с помощью набора QIAquick PCR Purification Kit (Qiagen). После этого библиотеки ДНК, полученные с обогащением мишени или без него, подвергали случайному массированному параллельному секвенированию на анализаторе Illumina Genome Analyzer IIx. При секвенировании использовали одну дорожку на стандартной проточной кювете для секвенирования одной библиотеки ДНК. 2. Фракционная концентрация ДНК плода без обогащения мишени Фракционная концентрация ДНК плода может быть рассчитана на основе встречаемости аллелей информативных SNP (т.е. SNPs, по которым мать гомозиготна, а отец гетерозиготен). Из нижеприведенной таблицы видно, что для 4 случаев по всему геному идентифицировано 120 184, 110 730, 107 362 и 110 321 информативных SNP, тогда как на искомый участок хромосомы X приходится 63, 61, 69 и 65 (в таком же порядке перечисления, соответственно). Без обогащения мишени фракционные концентрации ДНК плода составили 33,4, 31,3, 29,2 и 34,4%, исходя из данных по всем информативным SNP в геноме.
Образец Обогащение мишени Информативные SNP по всему геному Совместные аллели Специфичные для плода аллели Фракционная конц. ДНК плода
М6011 нет 120 184 15 309 3 064 33,4%
М6028 нет 110 730 16 778 3 114 31,3%
М6029 нет 107 362 19 889 3 404 29,2%
М6043 нет 110 321 21 070 4 369 34,4%
3. Сравнение образцов с обогащением мишени и без него.
В некоторых воплощениях полнота охвата последовательности представлена средним числом раз, когда каждое основание было просеквенировано на определенном участке. В этом воплощении полнота охвата последовательности рассчитывается делением общего числа просеквенированных оснований на
- 25 033752 искомом участке на длину искомого участка (3,05 Mb). Для участков, охватываемых набором для обогащения, средний охват последовательности составил 0,19 раз для необогащенных образцов и 54,9 раза для обогащенных образцов, что означает в среднем 289-кратное обогащение. При такой полноте секвенирования на искомом участке перед обогащением мишени выявлялось только 4,0% специфичных для плода аллелей (см. таблицу внизу). Для сравнения, после обогащения мишени выявлялось 95,8% из них. Следовательно, обогащение мишени сильно повышает показатель выявления специфичных для плода аллелей на заданном участке.
После этого авторы изобретения сравнили фракционные концентрации ДНК плода на основе встречаемости всех информативных SNP на заданном участке по каждому образцу, с обогащением и без него. Без обогащения мишени число специфичных для плода аллелей составило от 0 до 6 для четырех образцов (см. таблицу внизу). Вследствие низкого охвата последовательности неадекватный отбор молекул ДНК плода будет мешать точному определению фракционной концентрации ДНК плода. При обогащении мишени на заданном участке наблюдалось гораздо большее число специфичных для плода аллелей (511-776) и совместных аллелей (2570-3922) (см. таблицу внизу). Содержание ДНК плода составило 35,4, 33,2, 26,1 и 33,0%, что согласуется с содержанием ДНК плода, установленным по данным из всего генома в необогащенных образцах (см. таблицу внизу). Эти результаты означают, что на заданном участке молекулы ДНК матери и плода подвергались обогащению в равной степени.
Образец Обогащение мишени Число информативных SNP на участке Выявлено специф. для плода аллелей Процент специф. для плода аллелей Число совместных аллелей Число специф. Для плода аллелей Фракц. КОНЦ. ДНК плода
М6011 нет 63 6 9,5% 13 6 63,2%
М6028 нет 61 2 3,3% 6 2 50,0%
М6029 нет 69 2 2,9% 11 2 30,8%
М6043 нет 65 0 0,0% 15 0 0,00%
М6011 да 63 60 95,2% 3072 661 35,4%
М6028 да 61 60 98,4% 2570 511 33,2%
М6029 да 69 66 95,7% 3835 575 26,1%
М6043 да 65 61 93,9% 3922 776 33,0%
В. Определение генома плода с обогащением мишени.
Одним из применений метода RHDO является неинвазивная пренатальная диагностика наследуемых по материнской линии генетических заболеваний. С помощью массированного параллельного секвенирования материнской плазмы без обогащения мишени при анализе RHDO можно правильно определить, какой гаплотип матери был передан плоду, в среднем по 17 SNPs, если полнота секвенирования ДНК материнской плазмы составляет примерно 65-кратный охват генома человека. Для улучшения рентабельности этого подхода можно избирательно направить секвенирование на определенные участки генома, а затем применить анализ RHDO к данным по секвенированию. В примерах авторы изобретения проверили эту концепцию при прицельном секвенировании и анализе RHDO хромосомы X. Однако прицельное секвенирование и анализ RHDO может применяться ко всем хромосомам, например, аутосомам. В одном воплощении анализ RHDO, как описано выше, может применяться для прицельных воплощений.
Было привлечено 5 беременных женщин (PW226, PW263, PW316, PW370 и PW421) с единственными плодами мужского пола. Образцы периферической крови матерей собирали в пробирки с ЭДТА перед взятием образца хориальных ворсин (CVS) в первом триместре. После центрифугирования из клеток периферической крови экстрагировали ДНК с помощью набора Blood Mini Kit (Qiagen). ДНК из 3,2 мл плазмы экстрагировали с помощью набора DSP DNA Blood Mini Kit (Qiagen). Геномную ДНК матери экстрагировали из лейкоцитной пленки, а геномную ДНК плода экстрагировали из хориальных ворсин. Образцы готовили и анализировали, как описано выше. Затем каждый образец секвенировали случайным образом, используя одну дорожку на проточной кювете фирмы Illumina.
В этом примере для выведения материнских гаплотипов для хромосомы X и того, какой гаплотип унаследован от матери, использовали генотип плода вместе с информацией по секвенированию нуклеиновых кислот матери. Для каждого SNP на хромосоме X, по которому мать гетерозиготна (т.е. это информативные SNP), наследуемый плодом аллель определяется как происходящий из материнского гаплотипа 1 (Hap I), тогда как материнский аллель, который не перешел к плоду, определяется как происходящий из материнского гаплотипа 2 (Hap II). В некоторых воплощениях для клинического применения генотип плода может быть неизвестен заранее, а гаплотипы матери можно определить или установить методами, хорошо известными специалистам, а также методами, описанными здесь. При этом хромосома X используется только для иллюстрации. При таком анализе можно использовать и другие хромосомы, например, аутосомы.
Во всех 5 случаях, описанных здесь, у них было по одному плоду мужского пола. Поскольку мужской плод наследует только одну хромосому X от матери, но никакой хромосомы X от отца, то перешедшая к плоду материнская хромосома X будет избыточно представлена в материнской плазме. Анализ RHDO проводили от pter до qter хромосомы X. Начиная с SNP, ближайшего к pter хромосомы X, анали
- 26 033752 зом SPRT можно определить, что аллель из Hap I или Hap II статистически значимым образом избыточно представлен в материнской плазме. Если ни один из двух гаплотипов не представлен избыточно статистически значимым образом, то можно сложить встречаемость аллелей по следующему SNP для дальнейшего анализа методом SPRT. Можно объединять дополнительные SNPs для анализа до тех пор, пока в процессе SPRT не будет установлено, что один из гаплотипов избыточно представлен статистически значимым образом. Затем процесс классификации можно начать заново по следующему SNP.
На фиг. 38А и 38В представлены результаты классификации по SPRT для случая PW226 в качестве примера. В этом случае всего было 9 успешных классификаций по SPRT для хромосомы X. При каждой классификации по SPRT аллели из Hap I оказались избыточно представленными в образце материнской плазмы, указывая на то, что плод унаследовал от матери Hap I. Поскольку авторы изобретения определили Hap I как гаплотип, содержащий аллели, перешедшие к плоду, то результаты всех этих классификаций по SPRT были правильными.
На фиг. 39 приведены результаты анализа RHDO для этих 5 случаев. Количество успешных классификаций по SPRT составляло от 1 до 9. Все классификации по SPRT были правильными. Более высокая фракционная концентрация ДНК плода связана с большим числом классификаций, потому что аллельный дисбаланс, обусловленный присутствием ДНК плода, легче выявляется при более высокой фракционной концентрации ДНК плода. Поэтому для получения успешной классификации RHDO требуется меньше SNPs. При этом определенные участки хромосомы можно разделить на большее число блоков RHDO. Наши результаты подтверждают, что анализ RHDO может проводиться по данным массированного секвенирования, полученным после обогащения мишени.
Наши данные также показывают, что прицельный подход является более рентабельным способом проведения анализа RHDO. Без обогащения мишени при секвенировании образцов с близкими концентрациями ДНК плода нужно примерно 5 проточных кювет (т.е. 40 дорожек для секвенирования) (фиг. 40), чтобы достичь такой же средней полноты, как у образцов, представленных на фиг. 39. А у нас при обогащении мишени секвенирование всего лишь по одной дорожке дает среднюю полноту секвенирования от 15 до 19 крат для успешной классификации RHDO.
С другой стороны, можно достичь еще более многократного охвата секвенирования при сравнительно небольших дополнительных затратах, если использовать обогащение мишени. Более высокий охват секвенирования может существенно уменьшить размер участка генома, который необходим для успешной классификации RHDO, и тем самым улучшить разрешение при анализе.
Пример 4. Обогащение мишени.
С 2004 г. было известно, что циркулирующие молекулы ДНК плода в общем короче, чем ДНК матери в материнской плазме (Chan K.C.A. et al., Clin. Chem. 2004, 50: 88-92; Li et al., Clin. Chem. 2004). Однако молекулярная основа этого наблюдения оставалась неизвестной. В настоящем исследовании авторы изобретения прочитали 3,931x109 отрезков в исследуемом образце плазмы и использовали разбиение в 1 п.о. при биоинформатическом анализе. Размер каждой просеквенированной молекулы ДНК из плазмы выводили из геномных координат концов прочитанных с двух концов отрезков.
Для этого анализа авторы изобретения сосредоточились на полиморфизмах по одному нуклеотиду (SNPs), по которым и отец, и мать гомозиготны, но по различным аллелям. По таким SNPs плод является облигатной гетерозиготой. Аллели по каждому SNP, унаследованному плодом от отца, можно использовать в качестве специфичного для плода маркера. Определяли размеры последовательностей плода (используя наследуемые по отцовской линии специфичные для плода аллели) и общих последовательностей для всего генома (фиг. 41) и отдельно для каждой хромосомы (фиг. 42А-42С).
Как оказалось, наиболее заметным отличием между ДНК плода и матери в материнской плазме было уменьшение пика в 166 п.о. по сравнению с пиком в 143 п.о. (фиг. 41). Самые распространенные общие последовательности (главным образом материнские) имели длину в 166 п.о. Наиболее заметным отличием в распределении по размерам между ДНК плода и общей ДНК было то, что у плода проявлялось уменьшение пика ДНК в 166 п.о. (фиг. 41) и относительная заметность пика в 143 п.о. Последний, видимо, соответствует отщеплению соединительного фрагмента (линкера) в ~20 п.о. из нуклеосомы с образованием ядра нуклеосомы в ~146 п.о. (Lewin В., in Gene IX, Jones and Bartlett, Sudbury, 2008, p. 757795).
Начиная примерно со 143 п.о. и ниже, в распределении ДНК плода и общей ДНК проявлялась периодичность в 10 п.о., как при расщеплении нуклеосом нуклеазой. Это свидетельствует о том, что фрагменты ДНК в плазме возникают при воздействии апоптозных ферментов. Напротив, такой нуклеосомный профиль не проявлялся при анализе по размерам прочитанных отрезков, соответствующих не связанному с гистонами геному митохондрий (фиг. 41). Эти результаты дают ранее неизвестное молекулярное объяснение известным отличиям по размерам между ДНК плода и матери по хромосоме Y и отдельным полиморфным генетическим маркерам (Chan K.C.A. et al., Clin. Chem. 2004, 50: 88-92; Li et al., Clin. Chem. 2004, 50: 1002-1011; US Patent Application 2005/0164241; US Patent Application 2007/0202525) и свидетельствуют о том, что такие отличия по размерам существуют по всему геному. Наиболее вероятное объяснение таких различий состоит в том, что среди циркулирующих молекул ДНК плода содержится больше таких молекул, у которых из нуклеосомы был отщеплен соединительный фрагмент в ~20 п.о.
- 27 033752
Учитывая эти наблюдения, существует ряд способов, которыми можно провести обогащение образца ДНК плода. В одном воплощении можно использовать реагенты, которые будут предпочтительно связываться с фрагментом линкера. Такие реагенты должны предпочтительно связываться с ДНК матери по сравнению с ДНК плода в материнской плазме. Одним из примеров таких реагентов являются антитела. Одна из мишеней таких антител должна связываться с гистоном H1. Как известно, гистон H1 связывается с линкерным фрагментом. Одно из применений таких антител заключается в обогащении ДНК плода путем отрицательного отбора, т.е. путем иммунопреципитации содержащей линкер ДНК матери в материнской плазме вместе с гистоном H1. Кроме того, известно, что существует целый ряд вариантов H1, причем некоторые из них проявляют тканеспецифичные вариации в экспрессии (Sancho M. et al., PLoS Genet 2008, 4: el 000227). Эти варианты можно было бы также использовать для отличения ДНК плода (преимущественно из плаценты) от ДНК матери (преимущественно гемопоэтической) (Lui Y.Y.N. et al., Clin. Chem. 2002, 48: 421-427). Например, можно нацелиться на вариант гистона H1, который преимущественно экспрессируется в клетках трофобластов, чтобы проводить избирательный и положительный отбор ДНК плода в материнской плазме. Такая стратегия может применяться и к другим гистоновым белкам, проявляющим тканеспецифичный, особенно специфичный к трофобластам, профиль экспрессии.
Учитывая резкий пик в 166 п.о. у ДНК матери, другая возможность обогащения ДНК плода состоит в разработке системы отрицательного отбора фрагментов ДНК длиной в 166±2 п.о. Например, система на основе капиллярного электрофореза или высокоэффективной жидкостной хроматографии позволила бы точное измерение размеров и разделение молекул ДНК. Другим способом отрицательного отбора является проведение его in silico во время биоинформатического анализа данных по секвенированию.
Поскольку и другие разновидности ДНК в плазме, например, ДНК опухолей (Vlassov V.V. et al., Curr. Mol. Med. 2010, 10: 142-165) и ДНК трансплантированных органов (Lo Y.M.D. et al., Lancet 1998, 351: 1329-1330), должны иметь такие же характеристики, как и ДНК плода в материнской плазме, то стратегии, приведенные выше в пунктах (1) и (2), можно использовать и для обогащения этих разновидностей ДНК.
В соответствии с одним воплощением предусмотрен способ дифференциального обогащения разновидностей ДНК в плазме или сыворотке человека через воздействие на линкерный фрагмент нуклеосом. В одном воплощении обогащение осуществляется путем удаления одного из следующего: ДНК матери или ДНК из гемопоэтических клеток. В другом воплощении воздействие включает реагент (как-то антитело или белок другого типа), который будет предпочтительно связываться с компонентом белка или нуклеиновой кислоты линкерного фрагмента нуклеосом. В другом воплощении реагент должен избирательно связываться с гистоном H1 или другим белком, связывающимся с линкерным фрагментом нуклеосом. В другом воплощении реагент должен связываться с материнскими или гематологическими вариантами гистона H1 или другого белка, связывающегося с линкерным фрагментом нуклеосом. В одном воплощении удаление ДНК проводится методом иммунопреципитации или связывания на твердой поверхности.
В соответствии с другим воплощением способ дифференциального обогащения ДНК плода в материнской плазме или сыворотке включает: (а) использование антитела, связывающегося с одним или несколькими компонентами линкерного фрагмента нуклеосом; (b) удаление связавшейся фракции методом иммунопреципитации или захвата на твердой поверхности; и (с) извлечение несвязавшейся фракции, содержащей ДНК плода с повышенной фракционной концентрацией.
Любые компоненты или функции программного обеспечения, описанные в данной заявке, могут выполняться в виде системной программы, исполняемой процессором с помощью любого подходящего компьютерного языка, такого, к примеру, как Java, C++ или Perl, с использованием, к примеру, стандартных или объектно-ориентированных методов. Системная программа может храниться в виде ряда инструкций или команд на считываемом компьютером носителе для хранения и/или передачи, а подходящими носителями являются запоминающие устройства с произвольной выборкой (RAM), постоянные запоминающие устройства (ROM), магнитные носители типа жесткого диска или дискеты, или же такие оптические носители, как компакт-диск (CD) или DVD (универсальный цифровой диск), флэш-память и др. Считываемый компьютером носитель может представлять собой любую комбинацию таких устройств для хранения или передачи данных.
Такие программы могут кодироваться и передаваться с помощью сигналов-переносчиков, адаптированных для передачи через проводные, оптические и/или беспроводные сети, соответствующие различным протоколам, в том числе Интернет. При этом считываемый компьютером носитель в соответствии с воплощением настоящего изобретения может быть создан с помощью сигнала передачи данных, кодируемого такой программой. Считываемый компьютером носитель, кодируемый управляющей программой, может помещаться в одной упаковке с совместимым устройством или предоставляться отдельно от других устройств (например, загружаться через Интернет). Любой такой считываемый компьютером носитель может находиться на или в одном компьютерном программном продукте (например, жестком диске или целой компьютерной системе), а может находиться на или в различных компьютерных программных продуктах внутри системы или сети. Компьютерная система может включать монитор, принтер или другой подходящий дисплей для предоставления пользователю любых из приведенных
- 28 033752 здесь результатов.
Пример компьютерной системы представлен на фиг. 43. Приведенные на фиг. 43 подсистемы связаны друг с другом через системную шину 4375. Представлены и другие подсистемы, как-то принтер 4374, клавиатура 4378, несъемный жесткий диск 4379, монитор 4376, который подключен к адаптеру дисплея 4382, и др. Периферические и устройства ввода/вывода (I/O), подключенные к контроллеру ввода-вывода 4371, могут соединяться с компьютерной системой любыми известными способами, как-то через последовательный порт 4377. Например, последовательный порт 4377 или внешний интерфейс 4381 может использоваться для соединения самого компьютера с глобальной сетью типа Интернет, устройством ввода с мыши или сканером. Внутреннее соединение через системную шину дает возможность центральному процессору 4373 соединяться с каждой подсистемой и контролировать исполнение инструкций из системной памяти 4372 или несъемного жесткого диска 4379, а также обмен информации между подсистемами. Системная память 4372 и/или несъемный жесткий диск 4379 могут воплощать считываемый компьютером носитель. Любая из приведенных здесь величин может означать вывод данных из одного компонента на другой компонент или же на пользователя.
Компьютерная система может включать несколько одинаковых компонентов или подсистем, например, соединенных через внешний интерфейс 4381 или через внутренний интерфейс. В некоторых воплощениях компьютерные системы, подсистемы или машины могут обмениваться информацией через сеть. В таких случаях один компьютер может рассматриваться как клиент, а другой - как сервер, при этом каждый может входить в состав одной и той же компьютерной системы. И клиент, и сервер может включать множественные системы, подсистемы или компоненты.
Конкретные детали определенных воплощений могут сочетаться любым подходящим образом или отличаться от тех, что представлены и описаны здесь, не отходя от сущности и не выходя за рамки воплощений изобретения.
Вышеприведенное описание типичных воплощений изобретения представлено в целях иллюстрации и описания. Оно не может быть исчерпывающим или ограничивать изобретение в точности описанной формой, причем возможны многие модификации и вариации в свете вышеприведенных положений. Воплощения были выбраны и описаны с тем, чтобы наилучшим образом разъяснить принципы изобретения и его практическое применение и тем самым дать возможность другим специалистам наилучшим образом использовать изобретение в различных воплощениях и с различными модификациями, подходящими для его конкретного предназначения.

Claims (26)

  1. ФОРМУЛА ИЗОБРЕТЕНИЯ
    1. Способ определения по меньшей мере части генома еще не рожденного плода беременной женщины, которая является его биологической матерью, путем определения унаследованного материнского гаплотипа, который включает анализ множества молекул нуклеиновых кислот из биологического образца, взятого у беременной женщины, причем биологический образец содержит смесь нуклеиновых кислот матери и плода, при этом анализ молекул нуклеиновой кислоты включает определение локализации молекулы нуклеиновой кислоты в геноме человека и определение последовательности молекулы нуклеиновой кислоты; идентификацию первого множества локусов, где материнский геном является гетерозиготным; определение отцовских аллелей, унаследованных плодом от отца по каждому локусу из первого множества локусов;
    определение каждого из двух материнских гаплотипов в первом множестве локусов;
    исходя из определенных последовательностей молекул нуклеиновых кислот, определение компьютерной системой количеств соответствующих аллелей в каждом локусе из первого множества локусов;
    используя определенные количества соответствующих аллелей в первом множестве локусов, определение относительных количеств соответствующих аллелей молекул нуклеиновых кислот в первом множестве локусов;
    сравнение относительных количеств соответствующих аллелей молекул нуклеиновых кислот из двух материнских гаплотипов в первом множестве локусов и, учитывая отцовские аллели, унаследованные плодом, определение того, какой из двух материнских гаплотипов унаследован еще не рожденным плодом от матери в той части генома, которая охвачена первым множеством локусов, где если унаследованные плодом отцовские аллели соответствуют аллелям первого гаплотипа матери, то считается, что плод унаследовал первый гаплотип от матери, если аллели соответствующих локусов, которые содержит первый гаплотип, сверхпредставлены по сравнению с аллелями соответствующих локусов, которые содержатся во втором материнском гаплотипе; или если унаследованные плодом отцовские аллели соответствуют аллелям первого гаплотипа матери, то считается, что плод унаследовал второй гаплотип от матери, если наблюдается равная представленность аллелей в соответствующих локусах, которые содержатся в первом и втором гаплотипах.
  2. 2. Способ по п.1, в котором относительные количества включают распределения молекул нуклеи
    - 29 033752 новых кислот по размерам.
  3. 3. Способ по п.1, в котором определение каждого из двух материнских гаплотипов в первом множестве локусов основывается на анализе множества молекул нуклеиновых кислот из биологического образца.
  4. 4. Способ по п.1, где определение отцовских аллелей, унаследованных от отца по каждому локусу из первого множества локусов, включает определение второго множества локусов отцовского генома, которые являются гетерозиготными, причем материнский геном гомозиготен по второму множеству локусов;
    идентификацию во множестве молекул нуклеиновых кислот аллелей, присутствующих в отцовском геноме в локусах из вышеупомянутого второго множества локусов и отсутствующих в материнском геноме, причем отцовский гаплотип с идентифицированными аллелями и является гаплотипом, унаследованным от отца; и анализ унаследованного от отца гаплотипа для определения отцовских аллелей в первом множестве локусов, которые содержатся в данном гаплотипе, где эти определенные отцовские аллели являются теми аллелями, которые унаследованы от отца в первом множестве локусов.
  5. 5. Способ по п.1, в котором определение каждого из двух материнских гаплотипов из первого множества локусов включает идентификацию аллелей из материнского генома по одному или нескольким локусам из первого множества локусов, исходя из количеств соответствующих установленных аллелей молекул нуклеиновых кислот по соответствующим локусам;
    идентификацию контрольных гаплотипов и сравнение идентифицированных аллелей из материнского генома с аллелями в соответствующих локусах из контрольных гаплотипов для установления, какой контрольный гаплотип соответствует этим аллелям, тем самым определяя каждый из двух материнских гаплотипов.
  6. 6. Способ по п.5, в котором определение каждого из двух материнских гаплотипов из первого множества локусов дополнительно включает повторяющееся сравнение идентифицированных аллелей из материнского генома с аллелями в соответствующих локусах контрольных гаплотипов до тех пор, пока не будет однозначно установлен каждый из двух материнских гаплотипов.
  7. 7. Способ по п.1, где определение отцовских аллелей, унаследованных от отца по каждому локусу из первого множества локусов, основывается на анализе множества молекул нуклеиновых кислот из биологического образца, при этом определение отцовских аллелей, унаследованных от отца по каждому локусу из первого множества локусов, включает определение второго множества локусов, по которым геном плода гетерозиготен, а геном матери гомозиготен;
    определение аллелей, унаследованных от отца по каждому локусу из второго множества локусов, путем определения относительных количеств соответствующих установленных аллелей молекул нуклеиновых кислот по соответствующим локусам из второго множества и идентификации аллелей с наименьшим относительным количеством как аллелей, унаследованных по соответствующим локусам;
    идентификацию контрольных гаплотипов;
    анализ аллелей, унаследованных от отца по каждому локусу из второго множества локусов, для определения того, какой из контрольных гаплотипов унаследован от отца, причем определяемый гаплотип включает первое множество локусов, где определение, какой из контрольных гаплотипов унаследован от отца, включает повторяющееся сравнение аллелей, установленных как унаследованные от отца, в каждом из второго множества локусов с аллелями в соответствующих локусах из контрольных гаплотипов до тех пор, пока контрольный гаплотип, унаследованный от отца, не будет однозначно установлен; и анализ гаплотипа, для которого установлено, что он унаследован от отца, для идентификации содержащихся в этом гаплотипе отцовских аллелей первого множества локусов, где эти идентифицированные отцовские аллели являются теми аллелями, которые унаследованы от отца в первом множестве локусов.
  8. 8. Способ по п.7, в котором определение конкретного локуса как одного из второго множества локусов, по которым геном плода гетерозиготен, а геном матери гомозиготен, включает определение предела отсечения для ряда предсказанных встречаемостей аллеля в данном локусе, причем предел отсечения позволяет установить, является ли геном матери гомозиготным, а геном плода гетерозиготным, при этом предел отсечения определяют на основе статистического распределения встречаемости для различных комбинаций гомозиготности и гетерозиготности в данном локусе;
    исходя из анализа множества молекул нуклеиновых кислот из биологического образца, выявление первого аллеля и второго аллеля в данном локусе;
    определение фактической встречаемости первого аллеля, исходя из секвенирования множества молекул нуклеиновых кислот из биологического образца; и
    - 30 033752 установление того, что геном плода гетерозиготен по первому аллелю и второму аллелю, а геном матери гомозиготен по второму аллелю, если фактическая встречаемость первого аллеля будет меньше предела отсечения.
  9. 9. Способ по п.8, в котором статистическое распределение предсказывают на основе фракционной концентрации молекул нуклеиновых кислот в биологическом образце, происходящих от плода.
  10. 10. Способ по п.9, в котором статистическое распределение дополнительно предсказывают на основе количества молекул нуклеиновой кислоты, соответствующих данному локусу, в множестве.
  11. 11. Способ по п.1, где определение отцовских аллелей, унаследованных плодом от отца по каждому локусу из первого множества локусов, включает анализ генома отца для определения множества гомозиготных локусов;
    определение, какой аллель унаследован плодом от отца в соответствующем локусе первого множества локусов, путем определения аллеля отцовского генома по каждому гомозиготному локусу, соответствующему локусу из первого множества локусов.
  12. 12. Способ по п.1, в котором анализ молекул нуклеиновой кислоты включает выполнение по крайней мере на части молекул нуклеиновых кислот по меньшей мере одного метода, выбранного из группы, состоящей из массированного параллельного секвенирования, метода микроматриц, гибридизации, ПЦР, цифровой ПЦР и масс-спектрометрии.
  13. 13. Способ по п.1, дополнительно включающий для каждого из первого подмножества соседних локусов из первого множества локусов определение того, какой гаплотип унаследован еще не рожденным плодом от матери для первого участка генома, включающего первое подмножество соседних локусов, причем определение, какой из двух материнских гаплотипов унаследован, включает:
    (a) определение первого количества соответствующих аллелей молекул нуклеиновых кислот, соответствующих одному из двух материнских гаплотипов для первого подмножества соседних локусов;
    (b) определение второго количества соответствующих аллелей молекул нуклеиновых кислот, соответствующих второму из двух материнских гаплотипов для первого подмножества соседних локусов; и (c) определение унаследованного гаплотипа для первого участка генома, исходя из сравнения первого количества со вторым количеством, где если унаследованные плодом отцовские аллели являются такими же, как аллели первого гаплотипа из двух материнских гаплотипов, и первое количество статистически превосходит второе количество, делают вывод о том, что плод унаследовал от матери первый гаплотип;
    если унаследованные плодом отцовские аллели являются такими же, как аллели первого гаплотипа из двух материнских гаплотипов, и когда первое количество статистически примерное такое же, как второе количество, делают вывод о том, что плод унаследовал от матери второй гаплотип;
    если унаследованные плодом отцовские аллели являются такими же, как аллели второго гаплотипа, и первое количество статистически примерное такое же, как второе количество, то делают вывод о том, что плод унаследовал от матери первый гаплотип; или если унаследованные плодом отцовские аллели являются такими же, как аллели второго гаплотипа, и второе количество статистически превосходит первое количество, то делают вывод о том, что плод унаследовал от матери второй гаплотип.
  14. 14. Способ по п.13, в котором при сравнении первого количества со вторым количеством применяют последовательный критерий отношения вероятностей.
  15. 15. Способ по п.13, в котором определение и первого количества, и второго количества проводится последовательно для первого подмножества соседних локусов, начиная с одного конца хромосомы.
  16. 16. Способ по п.13, в котором первое подмножество соседних локусов дополнительно подразделяют на две подгруппы, причем первая подгруппа состоит из локусов, по которым аллели отца соответствуют аллелям первого гаплотипа матери, а вторая подгруппа состоит из локусов, по которым аллели отца соответствуют аллелям второго гаплотипа матери, при этом стадии (а)-(с) выполняют отдельно для каждой из двух подгрупп, а способ дополнительно включает определение унаследованного гаплотипа для первого участка генома, исходя из результатов стадии (с) для этих двух подгрупп.
  17. 17. Способ по п.1, дополнительно включающий определение того, что плод унаследовал мутацию от матери, путем анализа гаплотипа матери, унаследованного плодом, и идентификации мутации в унаследованном гаплотипе.
  18. 18. Способ по п.1, в котором анализ множества молекул нуклеиновых кислот из биологического образца включает обогащение биологического образца по нуклеиновым кислотам из искомого участка генома, и/или предпочтительно секвенирование нуклеиновых кислот на искомом участке, при этом первое множество локусов находится в искомом участке.
  19. 19. Способ по п.18, в котором искомый участок идентифицируется как содержащий 61, 63, 65 или 69 локусов, где материнский геном гомозиготен, а плод гетерозиготен.
  20. 20. Способ по п.18, в котором проводят секвенирование нуклеиновых кислот только на искомом участке.
    - 31 033752
  21. 21. Способ определения по меньшей мере части генома еще не рожденного плода беременной женщины, которая является его биологической матерью, путем определения унаследованного отцовского гаплотипа, который является гаплотипом, содержащим комбинацию аллелей, соответствующих отцовским аллелям, присутствие которых в биологическом образце установлено и которые передаются вместе на одной и той же хромосоме или участке хромосомы, который включает анализ множества молекул нуклеиновых кислот из биологического образца, взятого у беременной женщины, причем биологический образец содержит смесь нуклеиновых кислот матери и плода, при этом анализ молекулы нуклеиновой кислоты включает определение локализации молекулы нуклеиновой кислоты в геноме человека и определение последовательности молекулы нуклеиновой кислоты;
    идентификацию первого множества локусов, где отцовский геном гетерозиготен, а материнский геном гомозиготен, причем данные об отцовском геноме получены от отца еще не рожденного плода, и отцовский генотип в первом множестве локусов отцовского генома известен;
    определение для каждого локуса из первого множества локусов, присутствует ли аллель, соответствующий отцовской аллели, который отсутствует в материнском геноме, в биологическом образце, для идентификации в биологическом образце аллелей, соответствующих отцовской аллели; и определение компьютерной системой гаплотипа, унаследованного еще не рожденным плодом от отца в той части генома, которая охвачена первым множеством локусов, путем определения комбинации отцовских аллелей, присутствие которых в биологическом образце установлено и которые передаются вместе на одной и той же хромосоме или участке хромосомы.
  22. 22. Способ по п.21, дополнительно включающий определение того, что плод унаследовал мутацию от отца, путем анализа гаплотипа отца, унаследованного плодом, и идентификации мутации в унаследованном гаплотипе.
  23. 23. Способ определения по меньшей мере части генома еще не рожденного плода беременной женщины, которая является его биологической матерью, путем определения унаследованного материнского гаплотипа, который включает определение первого множества локусов отцовского генома, которые являются гетерозиготными, причем отцовский геном получен от отца еще не рожденного плода, при этом материнский геном, полученный от матери еще не рожденного плода, тоже гетерозиготен по первому множеству локусов, при этом известен каждый из двух отцовских гаплотипов и каждый из двух материнских гаплотипов по первому множеству локусов;
    определение второго множества локусов отцовского генома, которые являются гетерозиготными, причем материнский геном гомозиготен по второму множеству локусов, при этом первое множество локусов и второе множество локусов находятся на одной и той же хромосоме;
    анализ множества молекул нуклеиновых кислот из биологического образца, взятого у беременной женщины, причем биологический образец содержит смесь нуклеиновых кислот матери и плода, при этом анализ молекулы нуклеиновой кислоты включает определение локализации молекулы нуклеиновой кислоты в геноме человека;
    на основании локализации молекулы нуклеиновой кислоты определение, будет ли молекула нуклеиновой кислоты расположена в одном из первых локусов или в одном из вторых локусов;
    определение последовательности молекулы нуклеиновой кислоты;
    определение соответствующего аллеля в каждом локусе первого множества локусов и/или второго множества локусов, где локализуется молекула нуклеиновой кислоты;
    анализ определенных соответствующих аллелей для определения в биологическом образце наличия или отсутствия отцовской аллели, которая отсутствует в материнском геноме по меньшей мере в одном локусе из второго множества локусов, и основываясь на анализе определенных соответствующих аллелей, определение того, какой из двух отцовских гаплотипов унаследован плодом;
    основываясь на определенных последовательностях молекул нуклеиновых кислот, определение количеств соответствующих аллелей в каждом локусе из первого множества локусов;
    определение относительных количеств соответствующих аллелей молекул нуклеиновых кислот в первом множестве локусов, используя определенные количества соответствующих аллелей в первом множестве локусов;
    сравнение компьютерной системой относительных количеств установленных соответствующих аллелей молекул нуклеиновых кислот в первом множестве локусов; и определение, какой из двух материнских гаплотипов унаследован еще не рожденным плодом от матери в той части генома, которая охвачена первым множеством локусов, путем сравнения относительных количеств определенных соответствующих аллелей с учетом отцовского гаплотипа, для которого определили, что он унаследован плодом, где если определили, что плод унаследовал первый отцовский гаплотип от отца, то когда относительные количества аллелей, соответствующих первому материнскому гаплотипу, статистически превосходят относительные количества аллелей, соответствующих второму материнскому гаплотипу, делают вывод о том, что плод унаследовал первый материнский гаплотип, чьи аллели соот- 32 033752 ветствуют аллелям первого отцовского гаплотипа, или когда относительные количества аллелей, соответствующих первому материнскому гаплотипу, статистически примерное такие же, как относительные количества аллелей, соответствующих второму материнскому гаплотипу, делают вывод о том, что плод унаследовал второй материнский гаплотип, чьи аллели не соответствуют аллелям первого отцовского гаплотипа.
  24. 24. Способ определения по меньшей мере части генома еще не рожденного плода беременной женщины, которая является его биологической матерью, который включает анализ множества молекул нуклеиновых кислот из биологического образца, взятого у беременной женщины, причем биологический образец содержит смесь нуклеиновых кислот матери и плода, при этом анализ молекулы нуклеиновой кислоты включает определение локализации молекулы нуклеиновой кислоты в геноме человека и определение последовательности молекулы нуклеиновой кислоты;
    определение первого множества локусов, по которым геном плода гетерозиготен, а геном матери гомозиготен;
    определение компьютерной системой аллелей, унаследованных от отца по каждому из первого множества локусов, следующим образом:
    основываясь на определенных последовательностях молекул нуклеиновых кислот, определение количества соответствующих аллелей в соответствующих локусах первого множества локусов;
    определение относительных количеств соответствующих аллелей у молекул нуклеиновых кислот в соответствующих локусах из первого множества локусов, используя определенные количества соответствующих аллелей в первом множестве локусов; и идентификацию аллелей с наименьшим относительным количеством как аллелей, унаследованных от отца, по соответствующим локусам;
    идентификацию контрольных гаплотипов; и анализ аллелей, унаследованных от отца по каждому из первого множества локусов, для определения того, какой из контрольных гаплотипов унаследован от отца в той части генома, которая охвачена первым множеством локусов, как указано ниже определение, какой из контрольных гаплотипов унаследован от отца гаплотипу в части генома, охваченной первым множеством локусов, путем повторяющегося сравнения аллелей, для которых определено, что они унаследованы от отца в каждом из первого множества локусов, с аллелями в соответствующих локусах контрольных гаплотипов, для определения, какой из контрольных гаплотипов соответствует этим аллелям и тем самым идентифицируя, какой из контрольных гаплотипов унаследован от отца.
  25. 25. Способ по п.24, в котором определение конкретного локуса как одного из первого множества локусов, по которым геном плода гетерозиготен, а геном матери гомозиготен, включает определение предела отсечения для предсказания встречаемости аллеля в данном локусе, причем предел отсечения предсказывает, является ли геном матери гомозиготным, а геном плода гетерозиготным, при этом предел отсечения определяют на основе статистического распределения встречаемости для различных комбинаций гомозиготности и гетерозиготности в данном локусе;
    исходя из анализа молекул нуклеиновых кислот из биологического образца, выявление первого аллеля и второго аллеля в данном локусе;
    определение фактической встречаемости первого аллеля, исходя из секвенирования множества молекул нуклеиновых кислот из биологического образца; и установление того, что геном плода гетерозиготен по первому аллелю и второму аллелю, а геном матери гомозиготен по второму аллелю, если фактическая встречаемость первого аллеля будет меньше предела отсечения.
  26. 26. Компьютерный программный продукт, включающий машиночитаемый носитель, хранящий инструкции для управления процессором при выполнении способа по любому из пп.1-25.
EA201200690A 2009-11-05 2010-11-05 Способ определения по меньшей мере части генома плода на основе анализа материнского биологического образца EA033752B1 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US25856709P 2009-11-05 2009-11-05
US25907509P 2009-11-06 2009-11-06
US38185410P 2010-09-10 2010-09-10
PCT/US2010/055655 WO2011057094A1 (en) 2009-11-05 2010-11-05 Fetal genomic analysis from a maternal biological sample

Publications (2)

Publication Number Publication Date
EA201200690A1 EA201200690A1 (ru) 2013-05-30
EA033752B1 true EA033752B1 (ru) 2019-11-21

Family

ID=43500337

Family Applications (1)

Application Number Title Priority Date Filing Date
EA201200690A EA033752B1 (ru) 2009-11-05 2010-11-05 Способ определения по меньшей мере части генома плода на основе анализа материнского биологического образца

Country Status (24)

Country Link
US (5) US8467976B2 (ru)
EP (5) EP4170043A1 (ru)
JP (3) JP5540105B2 (ru)
CN (2) CN105779280B (ru)
AU (1) AU2010315037B9 (ru)
BR (1) BR112012010694B8 (ru)
CA (1) CA2779695C (ru)
CY (1) CY1122003T1 (ru)
DK (3) DK3783110T3 (ru)
EA (1) EA033752B1 (ru)
ES (3) ES2628874T3 (ru)
FI (1) FI3783110T3 (ru)
HK (1) HK1222413A1 (ru)
HR (2) HRP20230134T1 (ru)
HU (3) HUE043574T2 (ru)
IL (3) IL219521A (ru)
LT (2) LT3783110T (ru)
MX (3) MX2012005214A (ru)
PL (3) PL3783110T3 (ru)
PT (3) PT3241914T (ru)
RS (2) RS58879B1 (ru)
SI (2) SI3783110T1 (ru)
TW (1) TWI458976B (ru)
WO (1) WO2011057094A1 (ru)

Families Citing this family (193)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
US8609338B2 (en) 2006-02-28 2013-12-17 University Of Louisville Research Foundation, Inc. Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms
EP1996728B1 (en) 2006-02-28 2011-05-04 University of Louisville Research Foundation Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms
US20080050739A1 (en) 2006-06-14 2008-02-28 Roland Stoughton Diagnosis of fetal abnormalities using polymorphisms including short tandem repeats
WO2007147074A2 (en) 2006-06-14 2007-12-21 Living Microsystems, Inc. Use of highly parallel snp genotyping for fetal diagnosis
US9218449B2 (en) 2007-07-23 2015-12-22 The Chinese University Of Hong Kong Methods for analyzing massively parallel sequencing data for noninvasive prenatal diagnosis
WO2009105531A1 (en) * 2008-02-19 2009-08-27 Gene Security Network, Inc. Methods for cell genotyping
EP2271772B1 (en) * 2008-03-11 2014-07-16 Sequenom, Inc. Nucleic acid-based tests for prenatal gender determination
US9367800B1 (en) 2012-11-08 2016-06-14 23Andme, Inc. Ancestry painting with local ancestry inference
WO2009146335A1 (en) * 2008-05-27 2009-12-03 Gene Security Network, Inc. Methods for embryo characterization and comparison
CN102171565B (zh) 2008-08-04 2015-04-29 纳特拉公司 等位基因调用和倍性调用的方法
US8962247B2 (en) * 2008-09-16 2015-02-24 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
US9524369B2 (en) 2009-06-15 2016-12-20 Complete Genomics, Inc. Processing and analysis of complex nucleic acid sequence data
WO2011041485A1 (en) 2009-09-30 2011-04-07 Gene Security Network, Inc. Methods for non-invasive prenatal ploidy calling
EP4170043A1 (en) 2009-11-05 2023-04-26 The Chinese University Of Hong Kong Fetal genomic analysis from a maternal biological sample
JP2013511991A (ja) * 2009-11-25 2013-04-11 クアンタライフ, インコーポレイテッド 遺伝子材料を検出する方法および組成物
WO2011087760A2 (en) 2009-12-22 2011-07-21 Sequenom, Inc. Processes and kits for identifying aneuploidy
AU2010343278B2 (en) * 2010-01-19 2015-05-21 Verinata Health, Inc. Simultaneous determination of aneuploidy and fetal fraction
US10662474B2 (en) 2010-01-19 2020-05-26 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic DNA by whole genome sequencing
US20120100548A1 (en) 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
AU2011207561B2 (en) 2010-01-19 2014-02-20 Verinata Health, Inc. Partition defined detection methods
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
US20120010085A1 (en) 2010-01-19 2012-01-12 Rava Richard P Methods for determining fraction of fetal nucleic acids in maternal samples
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US20110312503A1 (en) 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US10179937B2 (en) 2014-04-21 2019-01-15 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
EP2854058A3 (en) 2010-05-18 2015-10-28 Natera, Inc. Methods for non-invasive pre-natal ploidy calling
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
CA2802111A1 (en) * 2010-07-23 2012-01-26 Esoterix Genetic Laboratories, Llc Identification of differentially represented fetal or maternal genomic regions and uses thereof
US11031095B2 (en) 2010-08-06 2021-06-08 Ariosa Diagnostics, Inc. Assay systems for determination of fetal copy number variation
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
US11203786B2 (en) 2010-08-06 2021-12-21 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US8700338B2 (en) 2011-01-25 2014-04-15 Ariosa Diagnosis, Inc. Risk calculation for evaluation of fetal aneuploidy
US10533223B2 (en) 2010-08-06 2020-01-14 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US20130040375A1 (en) 2011-08-08 2013-02-14 Tandem Diagnotics, Inc. Assay systems for genetic analysis
US10167508B2 (en) 2010-08-06 2019-01-01 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
US20130261003A1 (en) 2010-08-06 2013-10-03 Ariosa Diagnostics, In. Ligation-based detection of genetic variants
US20140342940A1 (en) 2011-01-25 2014-11-20 Ariosa Diagnostics, Inc. Detection of Target Nucleic Acids using Hybridization
SG10201509766YA (en) 2010-11-30 2015-12-30 Univ Hong Kong Chinese Detection of genetic or molecular aberrations associated with cancer
EP2649199A2 (en) 2010-12-07 2013-10-16 Stanford University Non-invasive determination of fetal inheritance of parental haplotypes at the genome-wide scale
AU2011348100B2 (en) 2010-12-22 2016-08-25 Natera, Inc. Methods for non-invasive prenatal paternity testing
US10131947B2 (en) 2011-01-25 2018-11-20 Ariosa Diagnostics, Inc. Noninvasive detection of fetal aneuploidy in egg donor pregnancies
US11270781B2 (en) 2011-01-25 2022-03-08 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
US9994897B2 (en) 2013-03-08 2018-06-12 Ariosa Diagnostics, Inc. Non-invasive fetal sex determination
WO2012103031A2 (en) * 2011-01-25 2012-08-02 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
US8756020B2 (en) * 2011-01-25 2014-06-17 Ariosa Diagnostics, Inc. Enhanced risk probabilities using biomolecule estimations
EP3483285B1 (en) 2011-02-09 2021-07-14 Bio-Rad Laboratories, Inc. Analysis of nucleic acids
EP2673729B1 (en) 2011-02-09 2018-10-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
EP2860265B1 (en) 2011-02-24 2016-10-26 The Chinese University of Hong Kong Determining fetal DNA percentage for twins
PL2697392T3 (pl) * 2011-04-12 2016-08-31 Verinata Health Inc Rozdzielanie frakcji genomowych z wykorzystaniem liczby polimorfizmów
GB2484764B (en) 2011-04-14 2012-09-05 Verinata Health Inc Normalizing chromosomes for the determination and verification of common and rare chromosomal aneuploidies
US9411937B2 (en) 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
WO2012177792A2 (en) 2011-06-24 2012-12-27 Sequenom, Inc. Methods and processes for non-invasive assessment of a genetic variation
US8880456B2 (en) 2011-08-25 2014-11-04 Complete Genomics, Inc. Analyzing genome sequencing information to determine likelihood of co-segregating alleles on haplotypes
US8712697B2 (en) 2011-09-07 2014-04-29 Ariosa Diagnostics, Inc. Determination of copy number variations using binomial probability calculations
US10424394B2 (en) 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2013052907A2 (en) 2011-10-06 2013-04-11 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9984198B2 (en) 2011-10-06 2018-05-29 Sequenom, Inc. Reducing sequence read count error in assessment of complex genetic variations
US10196681B2 (en) 2011-10-06 2019-02-05 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
AU2013209499B2 (en) 2012-01-20 2018-05-10 Sequenom, Inc. Diagnostic processes that factor experimental conditions
US9238836B2 (en) * 2012-03-30 2016-01-19 Pacific Biosciences Of California, Inc. Methods and compositions for sequencing modified nucleic acids
WO2013130848A1 (en) * 2012-02-29 2013-09-06 Natera, Inc. Informatics enhanced analysis of fetal samples subject to maternal contamination
WO2013131021A1 (en) * 2012-03-02 2013-09-06 Sequenom Inc. Methods and processes for non-invasive assessment of genetic variations
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
SG11201407515RA (en) * 2012-05-14 2014-12-30 Bgi Diagnosis Co Ltd Method, system and computer readable medium for determining base information in predetermined area of fetus genome
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10289800B2 (en) 2012-05-21 2019-05-14 Ariosa Diagnostics, Inc. Processes for calculating phased fetal genomic sequences
WO2013177581A2 (en) * 2012-05-24 2013-11-28 University Of Washington Through Its Center For Commercialization Whole genome sequencing of a human fetus
US11261494B2 (en) 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
US10497461B2 (en) 2012-06-22 2019-12-03 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP3388533A1 (en) * 2012-07-13 2018-10-17 Life Technologies Corporation Human identification using a panel of snps
WO2014011928A1 (en) 2012-07-13 2014-01-16 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
WO2014015269A1 (en) 2012-07-19 2014-01-23 Ariosa Diagnostics, Inc. Multiplexed sequential ligation-based detection of genetic variants
US20140065621A1 (en) * 2012-09-04 2014-03-06 Natera, Inc. Methods for increasing fetal fraction in maternal blood
AU2013312355A1 (en) * 2012-09-06 2014-09-18 Ancestry.Com Dna, Llc Using haplotypes to infer ancestral origins for recently admixed individuals
US9732390B2 (en) 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
HUE053822T2 (hu) * 2012-09-20 2021-07-28 Univ Hong Kong Chinese Nem invazív módszer daganat metilom meghatározása plazmából
US10706957B2 (en) 2012-09-20 2020-07-07 The Chinese University Of Hong Kong Non-invasive determination of methylome of tumor from plasma
US10482994B2 (en) * 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9213947B1 (en) 2012-11-08 2015-12-15 23Andme, Inc. Scalable pipeline for local ancestry inference
US10643738B2 (en) * 2013-01-10 2020-05-05 The Chinese University Of Hong Kong Noninvasive prenatal molecular karyotyping from maternal plasma
CN105190656B (zh) 2013-01-17 2018-01-16 佩索纳里斯公司 用于遗传分析的方法和系统
US20130309666A1 (en) 2013-01-25 2013-11-21 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2014132244A1 (en) 2013-02-28 2014-09-04 The Chinese University Of Hong Kong Maternal plasma transcriptome analysis by massively parallel rna sequencing
EP2971100A1 (en) 2013-03-13 2016-01-20 Sequenom, Inc. Primers for dna methylation analysis
WO2014139477A1 (en) * 2013-03-15 2014-09-18 The Chinese University Of Hong Kong Determining fetal genomes for multiple fetus pregnancies
HUE061261T2 (hu) 2013-04-03 2023-05-28 Sequenom Inc Eljárások és folyamatok genetikai variánsok nem invazív értékelésére
CN105189787A (zh) * 2013-05-09 2015-12-23 豪夫迈·罗氏有限公司 使用hla标志物测定母体血液中的胎儿dna的分数的方法
WO2014190286A2 (en) 2013-05-24 2014-11-27 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CN114724627A (zh) 2013-06-21 2022-07-08 塞昆纳姆股份有限公司 用于遗传变异的非侵入性评估的方法和过程
US20150004601A1 (en) * 2013-06-28 2015-01-01 Ariosa Diagnostics, Inc. Massively parallel sequencing of random dna fragments for determination of fetal fraction
GB201318369D0 (en) * 2013-10-17 2013-12-04 Univ Leuven Kath Methods using BAF
GB2534067B (en) 2013-08-30 2021-07-21 Personalis Inc Methods and systems for genomic analysis
US9499870B2 (en) 2013-09-27 2016-11-22 Natera, Inc. Cell free DNA diagnostic testing standards
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
WO2015051275A1 (en) 2013-10-03 2015-04-09 Personalis, Inc. Methods for analyzing genotypes
CA2925528C (en) 2013-10-04 2023-09-05 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP3851539A1 (en) 2013-10-07 2021-07-21 Sequenom, Inc. Methods and processes for non-invasive assessment of chromosome alterations
US11365447B2 (en) 2014-03-13 2022-06-21 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
DK3656875T3 (da) 2014-07-18 2021-12-13 Illumina Inc Ikke-invasiv prænatal diagnostik
US20160026759A1 (en) * 2014-07-22 2016-01-28 Yourgene Bioscience Detecting Chromosomal Aneuploidy
WO2016015058A2 (en) 2014-07-25 2016-01-28 University Of Washington Methods of determining tissues and/or cell types giving rise to cell-free dna, and methods of identifying a disease or disorder using same
US20160034640A1 (en) 2014-07-30 2016-02-04 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CN104182655B (zh) * 2014-09-01 2017-03-08 上海美吉生物医药科技有限公司 一种判断胎儿基因型的方法
CN104232778B (zh) * 2014-09-19 2016-08-17 天津华大基因科技有限公司 同时确定胎儿单体型及染色体非整倍性的方法及装置
US10612080B2 (en) * 2014-09-22 2020-04-07 Roche Molecular Systems, Inc. Digital PCR for non-invasive prenatal testing
WO2016070131A1 (en) 2014-10-30 2016-05-06 Personalis, Inc. Methods for using mosaicism in nucleic acids sampled distal to their origin
CN105648045B (zh) * 2014-11-13 2019-10-11 天津华大基因科技有限公司 确定胎儿目标区域单体型的方法和装置
CN105648044B (zh) * 2014-11-13 2019-10-11 天津华大基因科技有限公司 确定胎儿目标区域单体型的方法和装置
CN104561311B (zh) * 2015-01-04 2016-08-17 北京大学第三医院 一种来自人辅助生殖胚胎发育早期出生安全性预测的试剂盒
CN104561309B (zh) * 2015-01-04 2017-04-19 北京积水潭医院 一种来自人辅助生殖囊胚植入前进行出生安全性预测的试剂盒
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
CN107109324B (zh) * 2015-01-16 2019-11-08 深圳华大基因股份有限公司 确定胎儿核酸含量的方法和装置
AU2016218631B2 (en) * 2015-02-10 2022-03-10 The Chinese University Of Hong Kong Detecting mutations for cancer screening and fetal analysis
US10424396B2 (en) * 2015-03-27 2019-09-24 Sentieon Inc. Computation pipeline of location-dependent variant calls
EP3294906B1 (en) 2015-05-11 2024-07-10 Natera, Inc. Methods for determining ploidy
WO2016187234A1 (en) * 2015-05-18 2016-11-24 Karius, Inc. Compositions and methods for enriching populations of nucleic acids
EP3317420B1 (en) 2015-07-02 2021-10-20 Arima Genomics, Inc. Accurate molecular deconvolution of mixtures samples
ES2911613T3 (es) * 2015-07-20 2022-05-20 Univ Hong Kong Chinese Análisis de patrones de metilación de haplotipos en tejidos en una mezcla de ADN
TWI802886B (zh) 2015-07-23 2023-05-21 香港中文大學 游離dna(cell-free dna)之片段化模式分析
US11319586B2 (en) 2015-08-12 2022-05-03 The Chinese University Of Hong Kong Single-molecule sequencing of plasma DNA
TW202300654A (zh) 2015-09-22 2023-01-01 香港中文大學 藉由母體血漿dna之淺深度測序以準確定量胎兒dna含量
GB201518665D0 (en) 2015-10-21 2015-12-02 Singapore Volition Pte Ltd Method for enrichment of cell free nucleosomes
CN105335625B (zh) * 2015-11-04 2018-02-16 和卓生物科技(上海)有限公司 胚胎植入前的遗传学检测装置
CN105926043B (zh) * 2016-04-19 2018-08-28 苏州贝康医疗器械有限公司 一种提高孕妇血浆游离dna测序文库中胎儿游离dna占比的方法
US20170321270A1 (en) * 2016-05-06 2017-11-09 Counsyl, Inc. Noninvasive prenatal diagnostic methods
US11299783B2 (en) 2016-05-27 2022-04-12 Personalis, Inc. Methods and systems for genetic analysis
WO2018003220A1 (ja) * 2016-06-29 2018-01-04 トヨタ自動車株式会社 Dnaライブラリーの作製方法及びdnaライブラリーを用いたゲノムdna解析方法
WO2018022890A1 (en) 2016-07-27 2018-02-01 Sequenom, Inc. Genetic copy number alteration classifications
CA3037366A1 (en) 2016-09-29 2018-04-05 Myriad Women's Health, Inc. Noninvasive prenatal screening using dynamic iterative depth optimization
WO2018067517A1 (en) 2016-10-04 2018-04-12 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
MY195527A (en) 2016-10-24 2023-01-30 Grail Inc Methods And Systems For Tumor Detection
CN109996894A (zh) * 2016-11-18 2019-07-09 香港中文大学 用于单基因疾病的基于通用单倍型的非侵入性产前测试
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
EP3574424A1 (en) 2017-01-24 2019-12-04 Sequenom, Inc. Methods and processes for assessment of genetic variations
MY197535A (en) 2017-01-25 2023-06-21 Univ Hong Kong Chinese Diagnostic applications using nucleic acid fragments
US10894976B2 (en) 2017-02-21 2021-01-19 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
US11232850B2 (en) 2017-03-24 2022-01-25 Myriad Genetics, Inc. Copy number variant caller
WO2018209222A1 (en) * 2017-05-12 2018-11-15 Massachusetts Institute Of Technology Systems and methods for crowdsourcing, analyzing, and/or matching personal data
KR102145417B1 (ko) * 2017-05-24 2020-08-19 지니너스 주식회사 무세포 핵산으로부터 수득된 서열 분석 데이터에 대한 배경 대립인자의 빈도 분포를 생성하는 방법 및 이를 이용하여 무세포 핵산으로부터 변이를 검출하는 방법
WO2019010410A1 (en) * 2017-07-07 2019-01-10 Massachusetts Institute Of Technology SYSTEMS AND METHODS OF GENETIC IDENTIFICATION AND ANALYSIS
WO2019014455A2 (en) * 2017-07-12 2019-01-17 Ande Corporation PATTERN RECOGNITION SYSTEM
CN109280697B (zh) * 2017-07-20 2022-04-26 天昊生物医药科技(苏州)有限公司 利用孕妇血浆游离dna进行胎儿基因型鉴定的方法
CN111051511A (zh) 2017-08-04 2020-04-21 十亿至一公司 用于与生物靶相关的表征的靶相关分子
EP3662085B1 (en) 2017-08-04 2022-06-22 Billiontoone, Inc. Sequencing output determination and analysis with target-associated molecules in quantification associated with biological targets
US11519024B2 (en) 2017-08-04 2022-12-06 Billiontoone, Inc. Homologous genomic regions for characterization associated with biological targets
CN107545153B (zh) * 2017-10-25 2021-06-11 桂林电子科技大学 一种基于卷积神经网络的核小体分类预测方法
JP7047373B2 (ja) 2017-12-25 2022-04-05 トヨタ自動車株式会社 次世代シーケンサー用プライマー並びにその製造方法、次世代シーケンサー用プライマーを用いたdnaライブラリー並びにその製造方法、及びdnaライブラリーを用いたゲノムdna解析方法
FI3735470T3 (fi) 2018-01-05 2024-02-21 Billiontoone Inc Laadunvarmistustemplaatit sekvensointiin perustuvien testien validiteetin varmistamiseksi
CN112236535A (zh) 2018-04-14 2021-01-15 纳特拉公司 用于借助于循环肿瘤dna的个人化检测的癌症检测和监测的方法
EP3788172A4 (en) 2018-05-03 2022-01-19 The Chinese University Of Hong Kong SIZE-MARKED PREFERRED ENDS AND ALIGNMENT-AWARE ANALYSIS TO MEASURE PROPERTIES OF CELL-FREE MIXTURES
US11814750B2 (en) 2018-05-31 2023-11-14 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
US10801064B2 (en) * 2018-05-31 2020-10-13 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
WO2020049558A1 (en) * 2018-09-03 2020-03-12 Ramot At Tel-Aviv University Ltd. Method and system for identifying gene disorder in maternal blood
KR20210071983A (ko) * 2018-09-07 2021-06-16 일루미나, 인코포레이티드 임산부로부터 분리된 순환 페탈 세포가 현재 또는 과거의 임신의 것인지 확인하는 방법
EP3899030A2 (en) 2018-12-17 2021-10-27 Natera, Inc. Methods for analysis of circulating cells
CN109887548B (zh) * 2019-01-18 2022-11-08 臻悦生物科技江苏有限公司 基于捕获测序的ctDNA占比的检测方法及检测装置
CN111560424A (zh) * 2019-02-13 2020-08-21 广州医科大学附属第一医院 可检测的目标核酸、探针、确定胎儿f8基因单体型的方法及应用
CA3130810A1 (en) 2019-03-25 2020-10-01 The Chinese University Of Hong Kong Determining linear and circular forms of circulating nucleic acids
KR20220002929A (ko) * 2019-04-22 2022-01-07 퍼스널 게놈 다이아그노스틱스 인코포레이티드 유전학적 분석을 위한 방법 및 시스템
US20210020266A1 (en) 2019-07-19 2021-01-21 23Andme, Inc. Phase-aware determination of identity-by-descent dna segments
HUE061561T2 (hu) * 2019-08-14 2023-07-28 Bgi Genomics Co Ltd Eljárás és berendezés magzati nukleinsav-koncentráció meghatározására várandós nõ vérében
TWI752593B (zh) 2019-08-16 2022-01-11 香港中文大學 核酸鹼基修飾的測定
CN112466397A (zh) * 2019-09-09 2021-03-09 深圳乐土生物科技有限公司 一种用于亲缘关系检测的方法和装置
WO2021155831A1 (en) * 2020-02-05 2021-08-12 The Chinese University Of Hong Kong Molecular analyses using long cell-free fragments in pregnancy
CN111312332B (zh) * 2020-02-13 2020-10-30 国家卫生健康委科学技术研究所 基于hla基因的生物信息处理方法、装置及终端
US11817176B2 (en) 2020-08-13 2023-11-14 23Andme, Inc. Ancestry composition determination
US20230307130A1 (en) * 2020-11-08 2023-09-28 The Johns Hopkins University Methods and related aspects for analyzing chromosome number status
CN112575077A (zh) * 2020-12-23 2021-03-30 东莞市妇幼保健院 一种胎儿显性遗传病新发突变的无创基因检测方法及应用
CA3226132A1 (en) 2021-04-22 2022-10-27 Natera, Inc. Methods for determining velocity of tumor growth
EP4381099A1 (en) 2021-08-02 2024-06-12 Natera, Inc. Methods for detecting neoplasm in pregnant women
WO2023133131A1 (en) 2022-01-04 2023-07-13 Natera, Inc. Methods for cancer detection and monitoring
US12043873B2 (en) 2022-03-21 2024-07-23 Billiontoone, Inc. Molecule counting of methylated cell-free DNA for treatment monitoring

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004078999A1 (en) * 2003-03-05 2004-09-16 Genetic Technologies Limited Identification of fetal dna and fetal cell markers in maternal plasma or serum
WO2007100911A2 (en) * 2006-02-28 2007-09-07 University Of Louisville Research Foundation Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms
WO2009013492A1 (en) * 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Determining a nucleic acid sequence imbalance

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9704444D0 (en) * 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
US6664056B2 (en) * 2000-10-17 2003-12-16 The Chinese University Of Hong Kong Non-invasive prenatal monitoring
US6927028B2 (en) * 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
BR0308161A (pt) 2002-03-01 2006-06-06 Ravgen Inc métodos para a detecção de distúrbios genéticos
US6977162B2 (en) * 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
RU2200761C1 (ru) 2002-04-01 2003-03-20 Московский НИИ педиатрии и детской хирургии Набор рекомбинантных плазмидных днк рyai 11-19, рyai 2-45, рys 37 и рyai 7-29 для определения происхождения добавочных или маркерных (мини-) хромосом человека
US7727720B2 (en) * 2002-05-08 2010-06-01 Ravgen, Inc. Methods for detection of genetic disorders
US20070178478A1 (en) 2002-05-08 2007-08-02 Dhallan Ravinder S Methods for detection of genetic disorders
EP1601785A4 (en) 2003-02-28 2007-02-07 Ravgen Inc METHOD FOR DETECTING GENETIC DISEASES
DE60328193D1 (de) 2003-10-16 2009-08-13 Sequenom Inc Nicht invasiver Nachweis fötaler genetischer Merkmale
CA2601221C (en) 2005-03-18 2013-08-06 The Chinese University Of Hong Kong A method for the detection of chromosomal aneuploidies
US20070122823A1 (en) 2005-09-01 2007-05-31 Bianchi Diana W Amniotic fluid cell-free fetal DNA fragment size pattern for prenatal diagnosis
GB0523276D0 (en) * 2005-11-15 2005-12-21 London Bridge Fertility Chromosomal analysis by molecular karyotyping
PL3002338T3 (pl) 2006-02-02 2019-12-31 The Board Of Trustees Of The Leland Stanford Junior University Nieinwazyjne badania przesiewowe płodu poprzez analizę cyfrową
WO2007147074A2 (en) 2006-06-14 2007-12-21 Living Microsystems, Inc. Use of highly parallel snp genotyping for fetal diagnosis
US20100112590A1 (en) * 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
CN102171565B (zh) * 2008-08-04 2015-04-29 纳特拉公司 等位基因调用和倍性调用的方法
CN104531837A (zh) 2008-12-22 2015-04-22 赛卢拉有限公司 检测等位基因、基因组和转录物组的方法和基因型分析谱
EP4170043A1 (en) 2009-11-05 2023-04-26 The Chinese University Of Hong Kong Fetal genomic analysis from a maternal biological sample
JP5770737B2 (ja) * 2009-11-06 2015-08-26 ザ チャイニーズ ユニバーシティ オブ ホンコン サイズに基づくゲノム分析
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
EP2854058A3 (en) 2010-05-18 2015-10-28 Natera, Inc. Methods for non-invasive pre-natal ploidy calling
WO2012103031A2 (en) 2011-01-25 2012-08-02 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
EP2860265B1 (en) 2011-02-24 2016-10-26 The Chinese University of Hong Kong Determining fetal DNA percentage for twins
WO2014139477A1 (en) 2013-03-15 2014-09-18 The Chinese University Of Hong Kong Determining fetal genomes for multiple fetus pregnancies

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004078999A1 (en) * 2003-03-05 2004-09-16 Genetic Technologies Limited Identification of fetal dna and fetal cell markers in maternal plasma or serum
WO2007100911A2 (en) * 2006-02-28 2007-09-07 University Of Louisville Research Foundation Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms
WO2009013492A1 (en) * 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Determining a nucleic acid sequence imbalance

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CHIU ROSSA W K ET AL: "Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, NATIONAL ACADEMY OF SCIENCES, vol. 105, no. 51, 23 December 2008 (2008-12-23), pages 20458 - 20463, XP002620454, ISSN: 0027-8424, DOI: 10.1073/pnas.0810641105 *
CHIU, R.W.K. ; CANTOR, C.R. ; LO, Y.M.D.: "Non-invasive prenatal diagnosis by single molecule counting technologies", TRENDS IN GENETICS., ELSEVIER SCIENCE PUBLISHERS B.V. AMSTERDAM., NL, vol. 25, no. 7, 1 July 2009 (2009-07-01), NL, pages 324 - 331, XP026301457, ISSN: 0168-9525, DOI: 10.1016/j.tig.2009.05.004 *
DING CHUNMING ET AL: "MS analysis of single-nucleotide differences in circulating nucleic acids: Application to noninvasive prenatal diagnosis", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, NATIONAL ACADEMY OF SCIENCES, vol. 101, no. 29, 20 July 2004 (2004-07-20), pages 10762 - 10767, XP002614099, ISSN: 0027-8424, DOI: 10.1073/pnas.0403962101 *
FAN H.C., ET AL: "Noninvasive diagnosis of fetal aneuploidy by shotgun sequencing DNA from maternal blood.", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, NATIONAL ACADEMY OF SCIENCES, vol. 105, no. 42, 21 October 2008 (2008-10-21), pages 16266 - 16271, XP002613056, ISSN: 0027-8424, DOI: 10.1073/pnas.0808319105 *
FIONA M. F. LUN, NANCY B. Y. TSUI, K. C. ALLEN CHAN, TAK Y. LEUNG, TZE K. LAU, PIMLAK CHAROENKWAN, KATHERINE C. K. CHOW, WYATT Y. : "Noninvasive prenatal diagnosis of monogenic diseases by digital size selection and relative mutation dosage on DNA in maternal plasma", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, NATIONAL ACADEMY OF SCIENCES, vol. 105, no. 50, 16 December 2008 (2008-12-16), pages 19920 - 19925, XP002620453, ISSN: 0027-8424, DOI: 10.1073/pnas.0810373105 *
REED W ET AL: "Non-invasive determination of the paternal HLA haplotype of a fetus using kinetic PCR to detect fetal microchimerism in maternal plasma", BONE MARROW TRANSPLANTATION, NATURE PUBLISHING GROUP, GB, vol. 29, no. 6, 2 March 2002 (2002-03-02), GB, pages 527 - 529, XP002424270, ISSN: 0268-3369, DOI: 10.1038/sj.bmt.1703411 *

Also Published As

Publication number Publication date
EP3783110A1 (en) 2021-02-24
JP2013509884A (ja) 2013-03-21
RS58879B1 (sr) 2019-08-30
CN105779280B (zh) 2018-09-25
EA201200690A1 (ru) 2013-05-30
CN102770558B (zh) 2016-04-06
US20130323731A1 (en) 2013-12-05
AU2010315037A8 (en) 2012-07-12
US8467976B2 (en) 2013-06-18
TW201122470A (en) 2011-07-01
EP3498863A1 (en) 2019-06-19
EP3241914A1 (en) 2017-11-08
IL219521A (en) 2015-02-26
FI3783110T3 (fi) 2023-03-02
AU2010315037A1 (en) 2012-06-07
US11401551B2 (en) 2022-08-02
US20130253844A1 (en) 2013-09-26
CN102770558A (zh) 2012-11-07
IL219521A0 (en) 2012-06-28
HUE061110T2 (hu) 2023-05-28
PT3783110T (pt) 2023-01-02
AU2010315037B2 (en) 2014-09-18
US20220325344A1 (en) 2022-10-13
IL237175A (en) 2017-05-29
ES2934941T3 (es) 2023-02-28
IL237179A (en) 2016-05-31
DK3783110T3 (da) 2023-02-06
EP2496717A1 (en) 2012-09-12
EP3783110B1 (en) 2022-11-23
EP3241914B1 (en) 2019-03-06
JP2016195598A (ja) 2016-11-24
ES2720282T3 (es) 2019-07-19
CY1122003T1 (el) 2020-10-14
DK3241914T3 (en) 2019-04-23
HUE043574T2 (hu) 2019-08-28
BR112012010694A2 (pt) 2018-09-11
MX2012005214A (es) 2012-09-21
LT3241914T (lt) 2019-04-25
CA2779695A1 (en) 2011-05-12
JP6386494B2 (ja) 2018-09-05
US10093976B2 (en) 2018-10-09
CA2779695C (en) 2016-05-24
PL2496717T3 (pl) 2017-11-30
EP3498863B1 (en) 2020-11-04
RS63944B1 (sr) 2023-02-28
JP2014193165A (ja) 2014-10-09
MX355132B (es) 2018-04-06
EP2496717B1 (en) 2017-06-07
JP6023117B2 (ja) 2016-11-09
BR112012010694B8 (pt) 2021-07-27
AU2010315037B9 (en) 2015-04-23
PL3783110T3 (pl) 2023-05-08
EP4170043A1 (en) 2023-04-26
DK2496717T3 (en) 2017-07-24
HK1222413A1 (zh) 2017-06-30
WO2011057094A1 (en) 2011-05-12
SI3241914T1 (sl) 2019-07-31
SI3783110T1 (sl) 2023-02-28
JP5540105B2 (ja) 2014-07-02
PT2496717T (pt) 2017-07-12
PT3241914T (pt) 2019-04-30
US20180282807A1 (en) 2018-10-04
MX2022004800A (es) 2022-05-16
CN105779280A (zh) 2016-07-20
BR112012010694B1 (pt) 2020-11-17
HRP20190601T1 (hr) 2019-10-04
US9512480B2 (en) 2016-12-06
HUE034854T2 (en) 2018-03-28
ES2628874T3 (es) 2017-08-04
HRP20230134T1 (hr) 2023-03-31
LT3783110T (lt) 2023-01-25
PL3241914T3 (pl) 2019-08-30
TWI458976B (zh) 2014-11-01
US20110105353A1 (en) 2011-05-05

Similar Documents

Publication Publication Date Title
US20220325344A1 (en) Identifying a de novo fetal mutation from a maternal biological sample
US20220282332A1 (en) Size-based genomic analysis
AU2013203446B2 (en) Identifying a de novo fetal mutation from a maternal biological sample
EA040939B1 (ru) Анализ генома плода из материнского биологического образца
AU2015200462A1 (en) Size-based genomic analysis