EA034241B1 - Способ пренатальной диагностики дисбаланса последовательности - Google Patents

Способ пренатальной диагностики дисбаланса последовательности Download PDF

Info

Publication number
EA034241B1
EA034241B1 EA201200701A EA201200701A EA034241B1 EA 034241 B1 EA034241 B1 EA 034241B1 EA 201200701 A EA201200701 A EA 201200701A EA 201200701 A EA201200701 A EA 201200701A EA 034241 B1 EA034241 B1 EA 034241B1
Authority
EA
Eurasian Patent Office
Prior art keywords
chromosome
size
threshold value
indicator
fragments
Prior art date
Application number
EA201200701A
Other languages
English (en)
Other versions
EA201200701A1 (ru
Inventor
Юйк Мин Дэннис Ло
Квань Чэ Чань
Вэньли Чжэн
Вай Квунь Росса Чиу
Original Assignee
Те Чайниз Юниверсити Ов Гонконг
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Те Чайниз Юниверсити Ов Гонконг filed Critical Те Чайниз Юниверсити Ов Гонконг
Publication of EA201200701A1 publication Critical patent/EA201200701A1/ru
Publication of EA034241B1 publication Critical patent/EA034241B1/ru

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Описываются способы для выполнения пренатальной диагностики дисбаланса последовательности. Признаком дисбаланса в некоторых обстоятельствах может быть сдвиг (например, в сторону более узкого распределения по размерам). Например, распределение по размерам фрагментов нуклеиновых кислот из хромосомы "в группе риска" можно использовать для определения фетальной хромосомной анеуплоидии. Ранжировку по размеру различных хромосом можно использовать для определения отклонений ранжира хромосомы "в группе риска" от ожидаемой ранжировки. Также различие между статистическим показателем размеров для одной хромосомы можно сравнить со статистическим показателем размеров другой хромосомы для идентификации значимого сдвига в размере. Также с использованием распределения по размерам можно определить, имеет ли место дисбаланс последовательности в материнском образце относительно генотипа или гаплотипа матери, и посредством этого определить генотип или гаплотип плода.

Description

Заявка на данное изобретение притязает на приоритет и является окончательным вариантом предварительной заявки на патент США № 61/259076, озаглавленной Обнаружение хромосомного дисбаланса, поданной 6 ноября 2009 г., и предварительной заявки на патент США № 61/360399, озаглавленной Геномный анализ на основе размеров, поданной 30 июня 2010 г., включенных в данное описание в качестве ссылок для всех целей.
Заявка на изобретение также является родственной заявке на патент США № 12/178181, озаглавленной Диагностика фетальной хромосомной анеуплоидии с использованием массивного параллельного секвенирования генома, поданной 23 июля 2008 г. (номер в патентном реестре № 016285-005220US); заявке на патент США № 12/614350, озаглавленной Диагностика фетальной хромосомной анеуплоидии с использованием массивного параллельного секвенирования генома с обогащением (номер в патентном реестре № 016285-005221US), и одновременно поданной заявке на патент США озаглавленной Геномный анализ плода из материнского биологического образца (номер в патентном реестре № 016285-006710US), включенных в данное описание в качестве ссылок для всех целей.
Уровень техники
Открытие фетальной ДНК в материнской плазме в 1997 году открывает новые возможности для неинвазивной пренатальной диагностики (Lo et al., Lancet, 1997, 350:485-487). Такая технология быстро переместилась в клинические применения с детекцией происходящих от плода унаследованных от отца генов или последовательностей, например, для определения пола плода и для определения статуса RhD плода. Однако применение в пренатальной диагностике, включающее анализ геномных мишеней, которые присутствуют как в материнском геноме, так и геноме плода, например 21 хромосомы, является гораздо более многообещающим.
Недавно показано, что методы подсчета отдельных молекул с их превосходной количественной точностью могут быть перспективным решением такой проблемы (Lo et al., Proc. Natl. Acad. Sci. USA, 2007, 104:13116-13121; Fan et al., Anal. Chem., 2007, 79:7576-7579; заявка на патент США 11/701686; Chiu et al., Trends Genet., 2009, 25:324-331; Chiu et al., Proc. Natl. Acad. Sci. USA, 2008, 105:20458-20463; Fan et al., Proc. Natl. Acad. Sci. USA, 2008, 105:16266-16271). В таких методах целей диагностики достигают через наблюдение количественных различий в числе молекул из выбранных геномных локаций между болезненным и здоровым состоянием. Например, для диагноза синдрома Дауна у плода число молекул из хромосомы 21 будет возрастать, когда плод страдает от трисомии 21 (Chiu et al., Proc. Natl. Acad. Sci. USA, 2008, 105:20458-20463; Fan et al., Proc. Natl. Acad. Sci. USA, 2008, 105:16266-16271).
Однако такие методы подсчета могут страдать от ограниченного числа полученных данных или других недостатков. Поэтому желательно предоставить новые методы, системы и приборы для выполнения пренатальной диагностики, имеющие определенные преимущества перед существующими методами.
Сущность изобретения
Настоящее изобретение предлагает способ пренатальной диагностики количественного дисбаланса последовательности в биологическом образце, полученном от беременной женщины, где биологический образец содержит фрагменты ДНК указанных плода и женщины, включающий для каждого из множества фрагментов ДНК в данном биологическом образце измерение размера фрагмента ДНК;
идентификацию того, из какой геномной области происходит данный фрагмент ДНК;
определение с использованием компьютерной системы показателя распределения по размерам фрагментов ДНК, определенных как происходящих из указанной геномной области, как раскрыто в данном описании;
сравнение показателя распределения по размерам с пороговым значением, раскрытым в данном описании;
на основании указанного сравнения установление того, существует ли количественный дисбаланс последовательности у плода для указанной геномной области, причем идентифицируют указанный дисбаланс, если показатель распределения по размерам значимо отличается от эталонной величины, как определяют с помощью порогового значения.
Данный способ может дополнительно включать определение материнского генотипа указанной беременной женщины в локусе геномной области, причем материнский генотип гетерозиготен по аллелю М и по аллелю N, а указанная геномная область содержит аллель N в данном локусе;
на основании определенного материнского генотипа в указанном локусе и указанного определенного показателя распределения по размерам установление того, существует ли количественный дисбаланс последовательности для указанной геномной области в биологическом образце относительно материнского генотипа в указанном локусе; и определение генотипа плода в данном локусе, причем генотип плода определяют как гетерозиготный для аллеля М и для аллеля N, когда отсутствует дисбаланс последовательности между аллелем М и аллелем N.
- 1 034241
В другом варианте согласно способу по изобретению определяют материнский гаплотип беременной женщины с использованием образца, который не содержит ДНК плода, причем указанная геномная область содержит по меньшей мере часть материнского гаплотипа; и на основании указанного определенного материнского гаплотипа и указанного определенного показателя распределения по размерам устанавливают, существует ли количественный дисбаланс последовательности для указанной геномной области в биологическом образце относительно материнского гаплотипа; и определяют гаплотип плода на основании указанного дисбаланса, причем идентифицируют указанный дисбаланс, если показатель распределения по размерам значимо отличается от эталонной величины, как определяют с помощью порогового значения.
При этом в этом воплощении согласно способу также могут определять отцовский генотип в указанной геномной области и на основании определенного отцовского генотипа в указанной геномной области устанавливают, является ли анализируемый дисбаланс последовательности у плода для указанной геномной области сверхпредставленностью или недопредставленностью относительно материнского гаплотипа.
В другом варианте осуществления способа по изобретению геномная область может представлять собой хромосому, а количественный дисбаланс последовательности-фетальную хромосомную анеуплоидию.
В этом воплощении указанное множество фрагментов ДНК предварительно отбирают на основании размера с формированием по меньшей мере двух групп, причем каждая группа имеет различный интервал размеров, показатель распределения по размерам получают путем определения параметра распределения по размерам фрагментов ДНК каждой группы, соответствующих указанной хромосоме;
сравнивают показатель распределения по размерам с пороговым значением;
на основании указанного сравнения устанавливают, существует ли фетальная хромосомная анеуплоидия для указанной хромосомы, причем идентифицируют анеуплоидию, если показатель распределения по размерам значимо отличается от эталонной величины, как определяют с помощью порогового значения.
Альтернативно, установление того, существует ли фетальная хромосомная анеуплоидия для указанной хромосомы, может включать сравнение установленного ранга указанной хромосомы с другим рангом указанной хромосомы, полученной из эталонного биологического образца, и на основании указанного сравнения установление того, существует ли фетальная хромосомная анеуплоидия для указанной хромосомы, причем установление ранга указанной хромосомы осуществляют, как раскрыто в данном описании.
Для установления того, существует ли фетальная хромосомная анеуплоидия для указанной хромосомы, в одном из воплощений вычисляют первый статистический показатель, исходя из размеров фрагментов ДНК, соответствующих указанной хромосоме, как раскрыто в данном описании;
вычисляют второй статистический показатель, исходя из размеров фрагментов ДНК, соответствующих одной или нескольким другим хромосомам, как раскрыто в данном описании;
определяют показатель разделения между первым статистическим показателем и вторым статистическим показателем, где показатель разделения представляет собой разницу между первым статистическим показателем и вторым статистическим показателем или отношение первого статистического показателя и второго статистического показателя, сравнивают показатель разделения с одним или несколькими пороговыми значениями, раскрытыми в данном описании, и на основании указанного сравнения устанавливают, существует ли фетальная хромосомная анеуплоидия для указанной хромосомы, причем идентифицируют анеуплоидию, если показатель разделения значимо отличается от эталонной величины, как определяют с помощью одного или нескольких пороговых значений.
Причем в этом воплощении изобретения первый статистический показатель и второй статистический показатель могут представлять собой суммы размеров соответствующих фрагментов ДНК, которые имеют размер ниже первого порогового значения. Например, первый статистический показатель может представлять собой результат деления суммы размеров всех фрагментов ДНК, соответствующих указанной хромосоме, которые имеют размер ниже первого порогового значения, на сумму размеров фрагментов ДНК, соответствующих одной или нескольким другим хромосомам, которые имеют размер ниже указанного первого порогового значения.
Альтернативно, первый статистический показатель может представлять собой результат деления суммы размеров всех фрагментов ДНК, соответствующих указанной хромосоме, которые имеют размер ниже первого порогового значения, на сумму размеров фрагментов ДНК, соответствующих одной или нескольким другим хромосомам, которые имеют размер ниже второго порогового значения, причем вто- 2 034241 рое пороговое значение больше, чем первое пороговое значение.
В еще одном воплощении первый статистический показатель представляет собой результат деления суммы размеров всех фрагментов ДНК, соответствующих указанной хромосоме, которые имеют размер ниже первого порогового значения, на сумму размеров фрагментов ДНК, соответствующих одной или нескольким другим хромосомам, которые имеют размер выше второго порогового значения, причем второе пороговое значение равно первому пороговому значению, и при этом сумма, на которую производят деление, представляет собой сумму размеров соответствующих фрагментов ДНК, которые имеют размер ниже третьего порогового значения, причем третье пороговое значение больше второго порогового значения.
Когда первый статистический показатель и второй статистический показатель представляют собой суммы размеров соответствующих фрагментов ДНК, которые имеют размер ниже первого порогового значения, способ может дополнительно включать повторение вычисления первого статистического показателя и второго статистического показателя для множества первых пороговых значений и определение показателя разделения между первым и вторым статистическими показателями для каждого из первых пороговых значений;
идентификацию экстремума показателя разделения;
сравнение экстремума с одним или несколькими пороговыми значениями, раскрытыми в данном описании, и на основании указанного сравнения установление, существует ли фетальная хромосомная анеуплоидия, причем идентифицируют анеуплоидию, если значение экстремума значимо отличается от эталонной величины, как определяют с помощью одного или нескольких пороговых значений.
Также в соответствии с настоящим изобретением предложен компьютер, содержащий компьютерную программу, включающую команды для компьютерной системы, запрограммированной для осуществления описанного выше способа.
Таким образом, некоторые воплощения настоящего изобретения могут предоставить средства (способ и компьютер по изобретению), которые можно использовать в анализе на основе размеров для выполнения пренатальной диагностики дисбаланса последовательностей (например, фетальной хромосомной анеуплоидии) в биологическом образце, полученном от беременной женщины. Например, распределение по размерам фрагментов молекул нуклеиновых кислот для хромосомы в группе риска можно использовать для определения фетальной хромосомной анеуплоидии. Некоторые воплощения также могут позволить обнаруживать другие дисбалансы последовательностей, такие как дисбаланс в биологическом образце (содержащем ДНК матери и плода), где дисбаланс соотносится с генотипом, мутационным статусом или гаплотипом матери. Такой дисбаланс можно определить с помощью распределения по размерам фрагментов (молекул нуклеиновых кислот), соответствующих определенной последовательности, соотносительно с ожидаемым распределением по размерам, когда образец является чисто материнским, а не от плода и матери. Сдвиг (например, к более узкому распределению по размерам) может быть признаком дисбаланса при некоторых обстоятельствах.
В одном воплощении для определения дисбаланса используют ранжировку распределения по размеру (например, статистического показателя, представляющего распределение по размеру) фрагментов из соответствующих хромосом относительно друг друга. Например, ранжировку по размеру фрагментов хромосомы в группе риска в испытываемом образце можно сравнить с ранжировкой для хромосомы в группе риска, которую получают из эталонного биологического образца. На основе сравнения можно выполнить диагностику. Как пример, если ранжировка изменяется (например, показывая уменьшение размера фрагментов нуклеиновых кислот) на определенную величину, тогда можно поставить диагноз, что в хромосоме из группы риска существует фетальная хромосомная анеуплоидия. В различных воплощениях с использованием такого анализа ранжировки можно использовать все 22 аутосомы и половые хромосом или подмножество хромосом.
В другом воплощении используют различие между размером (т.е. статистическим показателем, представляющим распределение по размерам) фрагментов хромосомы из группы риска и размером фрагментов эталонной хромосомы. Например, если различие в размере больше или меньше, чем предельная величина (также называемая пороговой величиной), тогда можно диагностировать, что в хромосоме из группы риска существует фетальная хромосомная анеуплоидия.
Согласно одному примеру воплощения предоставляется способ выполнения пренатальной диагностики дисбаланса последовательностей в биологическом образце, полученном от беременной женщины. Биологический образец включает молекулы нуклеиновых кислот, которые являются частью нуклеотидных последовательностей. Измеряют размер каждой молекулы нуклеиновой кислоты из множества молекул нуклеиновых кислот в биологическом образце, и из этого идентифицируют нуклеотидную последовательность, из которой происходит молекула нуклеиновой кислоты. Компьютерная система определяет распределение по размерам молекул нуклеиновых кислот, соответствующих конкретной последовательности. На основании установленного распределения по размерам устанавливают, существует ли дисбаланс последовательности в отношении указанной конкретной последовательности.
- 3 034241
Согласно другому примеру воплощения предоставляется способ выполнения пренатальной диагностики фетальной хромосомной анеуплоидии в биологическом образце, полученном от беременной женщины. Измеряют размер каждой молекулы нуклеиновой кислоты из множества молекул нуклеиновых кислот в биологическом образце, и из этого идентифицируют хромосому, из которой происходит молекула нуклеиновой кислоты. Компьютерная система вычисляет статистический показатель исходя из размеров молекул нуклеиновых кислот, соответствующих хромосоме. Статистический показатель вычисляют для каждой из множества хромосом. На основании статистического показателя определяют ранжировку хромосом. Установленный ранг хромосомы сравнивают с другим рангом этой же хромосомы, полученной из эталонного биологического образца. На основании сравнения устанавливают, существует ли фетальная хромосомная анеуплоидия для указанной последовательности.
Согласно другому примеру воплощения предоставляется способ выполнения пренатальной диагностики фетальной хромосомной анеуплоидии в биологическом образце, полученном от беременной женщины. Измеряют размер каждой молекулы нуклеиновой кислоты из множества молекул нуклеиновых кислот в биологическом образце, и из этого идентифицируют хромосому, из которой происходит молекула нуклеиновой кислоты. Компьютерная система вычисляет первый статистический показатель исходя из размеров молекул нуклеиновых кислот, соответствующих идентифицированной хромосоме. Компьютерная система вычисляет второй статистический показатель исходя из размеров молекул нуклеиновых кислот, соответствующих одной или нескольким другим хромосомам. Определяют показатель разделения между первым статистическим показателем и вторым статистическим показателем. Показатель разделения сравнивают с одной или несколькими пороговыми величинами. На основании сравнения проводят классификацию, существует ли фетальная хромосомная анеуплоидия для первой последовательности.
Другие воплощения изобретения относятся компьютеру, который может быть включен в компьютерную систему, для использования в способах, описанных в данном описании. В одном воплощении компьютер снабжен машиночитаемым носителем информации, который содержит команды по восприятию данных и анализу данных, но отсутствуют команды по управлению механизмом для получения данных (например, секвенированию молекул нуклеиновых кислот). В другом воплощении машиночитаемый носитель информации содержит команды по управлению механизмом для получения данных. В одном воплощении компьютер содержит компьютерный программный продукт, например, компьютерную программу, и включает машиночитаемый носитель информации, содержащий набор команд по регулированию процессора для выполнения операции, для способов, описанных в данном описании. Согласно отдельным воплощениям компьютер может использоваться в компьютерных системах, сформированных для выполнения стадий любого из способов, описанных в данном описании, возможно, с различными компонентами, выполняющими соответствующую стадию или соответствующую группу стадий.
Обращение к остальным частям описания, включая чертежи и формулу изобретения, сделает наглядными другие особенности и преимущества воплощений настоящего изобретения. Другие особенности и преимущества, а также структура и работа различных воплощений настоящего изобретения подробно описаны ниже с учетом прилагаемых чертежей. На чертежах схожие номера для ссылки могут указывать на идентичные или функционально схожие элементы.
Краткое описание чертежей
Фиг. 1 представляет собой блок-схему, иллюстрирующую способ 100 выполнения пренатальной диагностики дисбаланса последовательностей в биологическом образце, полученном от беременной женщины, согласно воплощениям настоящего изобретения.
Фиг. 2 представляет собой график, показывающий медианную ранжировку хромосом распределенную в соответствии с размерами последовательностей, выровненных с ними (когда используют вариант 1 набора реагентов генерации кластеров Illumina), согласно воплощениям настоящего изобретения.
Фиг. 3 представляет собой график, показывающий, что анализ размеров последовательностей, происходящих от различных хромосом в материнской плазме, согласно воплощениям настоящего изобретения можно использовать для неинвазивного пренатального обнаружения фетальных анеуплоидий хромосомы 21.
Фиг. 4 представляет собой блок-схему, иллюстрирующую способ выполнения пренатальной диагностики фетальной хромосомной анеуплоидии в биологическом образце, полученном от беременной женщины, с использованием ранжировки статистического показателя размера, согласно воплощениям настоящего изобретения.
Фиг. 5 представляет собой таблицу, иллюстрирующую сравнение хромосомы 21 с хромосомой 7 и хромосомой 14 по размеру последовательностей, выровненных с ними, согласно воплощениям настоящего изобретения.
Фиг. 6 представляет собой блок-схему, иллюстрирующую способ выполнения пренатальной диагностики дисбаланса последовательностей в биологическом образце, полученном от беременной женщины, согласно воплощениям настоящего изобретения, с использованием сравнения статистического показателя размера фрагментов для геномной локации.
- 4 034241
Фиг. 7 показывает график 700 доли общей длины, вносимой короткими фрагментами (F), против порогового значения (w), согласно воплощениям настоящего изобретения.
Фиг. 8 показывает график 800 доли общей длины, вносимой короткими фрагментами (F), для хромосомы 21 (сплошная линия) и эталонных хромосом (все аутомосы, за исключением хромосом 13, 18 и 21) (пунктирная линия), против порогового значения в случае эуплоидной беременности, согласно воплощениям настоящего изобретения.
Фиг. 9 показывает график 900 величин F для хромосомы 21 (сплошная линия) и эталонных хромосом (все аутосомы, за исключением хромосом 13, 18 и 21) (пунктирная линия) против порогового значения в случае беременности с трисомией 21 согласно воплощениям настоящего изобретения.
Фиг. 10 показывает график 1000 AF(21-Ref) между хромосомой 21 и эталонными хромосомами (все аутомосы, за исключением хромосом 13, 18 и 21) против порогового значения в случае эуплоидной беременности и беременности с трисомией 21 согласно воплощениям настоящего изобретения.
Фиг. 11 показывает табл. 1100 для анатомического пола и классификацию 120 беременностей согласно воплощениям настоящего изобретения.
Фиг. 12 иллюстрирует ранжировку различных хромосом для четырех образцов с различными заболеваниями или состояний без заболеваний согласно воплощениям настоящего изобретения.
Фиг. 13 показывает ранжировку хромосомы 13 для 120 случаев эуплоидии, трисомии 13, трисомии 18 и трисомии 21 согласно воплощениям настоящего изобретения.
Фиг. 14 показывает ранжировку хромосомы 18 для 120 случаев эуплоидии, трисомии 13, трисомии 18 и трисомии 21 согласно воплощениям настоящего изобретения.
Фиг. 15 показывает ранжировку хромосомы 21 для 120 случаев эуплоидии, трисомии 13, трисомии 18 и трисомии 21 согласно воплощениям настоящего изобретения.
Фиг. 16 представляет собой таблицу, иллюстрирующую сравнение хромосомы 13 с хромосомой 5 и хромосомой 6 по размеру последовательностей, выровненных с ними, согласно воплощениям настоящего изобретения. Сравнение хромосом 5 и 6 с хромосомой 13 используют для обнаружения изменений в размере последовательностей хромосомы 21 при беременности с трисомией 13. Результаты при беременности с эуплоидией и трисомией 18 включены для сравнения.
Фиг. 17 представляет собой таблицу, иллюстрирующую сравнение хромосомы 18 с хромосомой 12 и хромосомой 14 по размеру последовательностей, выровненных с ними, согласно воплощениям настоящего изобретения. Результаты при беременности с эуплоидией и трисомией 13 включены для сравнения согласно воплощениям настоящего изобретения.
Фиг. 18 показывает различие в долях общей длины, вносимых короткими фрагментами, между хромосомой 18 и эталонными хромосомами (AF(18-Ref)) в 150 п.о., согласно воплощениям настоящего изобретения.
Фиг. 19 показывает различие в долях общей длины, вносимых короткими фрагментами, между хромосомой 21 и эталонными хромосомами (AF(21-Ref)), в 150 п.о., согласно воплощениям настоящего изобретения.
Фиг. 20 показывает GC-состав различных хромосом (NCBI build 36, версия 48) согласно воплощениям настоящего изобретения.
Фиг. 21 показывает различие в долях общей длины, вносимых короткими фрагментами, между хромосомой 13 и эталонными хромосомами (AF(18-ref)), в 150 п.о., согласно воплощениям настоящего изобретения.
Фиг. 22 представляет собой график, показывающий корреляцию между медианным размером последовательностей, выровненных с хромосомой 21, и процентом последовательностей, выровненных с хромосомой Y, согласно воплощениям настоящего изобретения.
Фиг. 23А-23С представляют собой графики, показывающие корреляцию между медианным размером последовательностей, выровненных соответственно с хромосомами 18, 13 и 21, и процентом последовательностей, выровненных с хромосомой Y, согласно воплощениям настоящего изобретения.
Фиг. 24 показывает сравнение точности воплощения настоящего изобретения и другого способа неинвазивного обнаружения фетальной анеуплоидии (трисомия 13 и трисомия 18) с использованием анализа ДНК материнской плазмы.
Фиг. 25А-25С показывают диаграммы различных вариантов генотипов беременной женщины и плода согласно воплощениям настоящего изобретения.
Фиг. 26 показывает пример, когда мать является гетерозиготной, а отец является гомозиготным, согласно воплощениям настоящего изобретения.
Фиг. 27 показывает пример, когда плод наследует Hap I от матери, когда родительский гаплотип такой, как показанный на фиг. 26, согласно воплощениям настоящего изобретения.
Фиг. 28 показывает таблицу, иллюстрирующую анализ размеров для однонуклеотидного полиморфизма (SNP) типа α на хромосоме 22 согласно воплощениям настоящего изобретения.
Фиг. 29 показывает таблицу, иллюстрирующую анализ размеров для SNP типа β на хромосоме 22 согласно воплощениям настоящего изобретения.
- 5 034241
Фиг. 30 показывает график AF(Hap I-Hap щ для SNP типа α и типа β на хромосоме 22 согласно воплощениям настоящего изобретения.
Фиг. 31А представляет собой таблицу, которая представляет анализ размеров ДНК плазмы без обогащения мишени согласно воплощениям настоящего изобретения.
Фиг. 31В представляет собой таблицу, которая представляет анализ размеров ДНК плазмы с обогащением мишени согласно воплощениям настоящего изобретения.
Фиг. 32 представляет собой график AF для Т21 и эуплоидных образцов с и без обогащения мишени согласно воплощениям настоящего изобретения.
Фиг. 33 представляет собой блок-схему примера компьютерной аппаратуры, применимой с системой и способами согласно воплощениям настоящего изобретения.
Определения
Термин биологический образец, используемый в данном описании, относится к любому образцу, взятому у субъекта (например, человека, такого как беременная женщина) и содержащему одну или несколько молекул нуклеиновой кислоты, представляющих интерес.
Термин нуклеиновая кислота или полинуклеотид относится к дезоксирибонуклеиновой кислоте (ДНК) или рибонуклеиновой кислоте (РНК) и их полимерам или в одно- или в двухцепочечной форме. Если нет особых ограничений, термин охватывает нуклеиновые кислоты, содержащие известные аналоги природных нуклеотидов, которые имеют схожие свойства связывания с эталонной нуклеиновой кислотой и метаболизируются схоже с нуклеотидами, встречающимися в природе. Если не указано иное, определенная нуклеотидная последовательность также потенциально охватывает ее консервативно модифицированные варианты (например, замены вырожденных кодонов), аллели, ортологи, SNP, варианты копийности и комплементарные последовательности, а также точно указанные последовательности. Конкретно, замены вырожденных кодонов можно достичь путем генерации последовательностей, в которых третья позиция одного или нескольких выбранных (или всех) кодонов заменена смешанными основными и/или дезоксиинозиновыми остатками (Batzer et al., Nucleic Acid Res., 19:5081 (1991); Ohtsuka et al., J. Biol. Chem., 260:2605-2608 (1985) и Rossolini et al., Mol. Cell. Probes, 8:91-98 (1994)). Термин нуклеиновая кислота используют как взаимозаменяемый с геном, кДНК, мРНК, небольшой некодирующей РНК, микро-РНК (миРНК), взаимодействующей с Piwi РНК и короткой шпилечной РНК (sh-PHK), кодированной геном или локусом.
Термин ген обозначает сегмент ДНК, вовлеченной в продуцирование полипептидной цепи или транскрибированного продукта РНК. Он может включать участки, предшествующие и следующие за кодирующим участком (лидерные и трейлерные), а также вставочные последовательности (интроны) между отдельными кодирующими сегментами (экзонами).
Термин клинически релевантная нуклеотидная последовательность (также называемая последовательностью-мишенью или хромосомой), используемый в данном описании, может относиться к нуклеотидной последовательности, соответствующей сегменту более крупной геномной последовательности, потенциальный дисбаланс которой проверяют, или к самой более крупной геномной последовательности. Одним из примеров является последовательность хромосомы 21. Другие примеры включают хромосому 18, 13, X и Y. Еще другие примеры включают мутированные генетические последовательности или генетические полиморфизмы или варианты копийности, которые плод может унаследовать от одного или обоих родителей, или как мутацию de novo у плода. В некоторых воплощениях несколько клинически релевантных нуклеотидных последовательностей или, равнозначно, несколько маркеров клинически релевантной нуклеотидной последовательности могут быть использованы для получения данных для обнаружения дисбаланса. Например, данные по пяти несмежным последовательностям на хромосоме 21 можно использовать в дополнение для определения возможного дисбаланса хромосомы 21, причем объем образца необходимый для анализа эффективно уменьшается до 1/5.
Термин эталонная нуклеотидная последовательность, используемый в данном описании, относится к нуклеотидной последовательности, распределение по размерам которой используют для сравнения против последовательности-мишени. Примеры эталонной нуклеотидной последовательности включают хромосому, часть хромосомы, определенный аллель (например, матери), определенный гаплотип, геном или искусственно синтезированную нуклеотидную последовательность. Такие эталонные нуклеотидные последовательности могут или существовать эндогенно в образце, или добавляться экзогенно во время обработки или анализа образца. В некоторых воплощениях эталонные нуклеотидные последовательности демонстрируют профиль размеров, который характерен для здорового состояния в отсутствие заболевания.
Термин основан на, используемый в данном описании, означает основанный, по меньшей мере, частично на и относится к одному показателю (или результату), используемому при определении другого показателя (величины), как происходит в соотношении входа способа и выхода указанного способа. Термин происходить, используемый в данном описании, также относится к соотношению входа способа и выхода указанного способа, такого, какое имеет место, когда происхождение является вычислением по формуле.
- 6 034241
Термин параметр, используемый в данном описании, означает численную величину, которая характеризует набор количественных данных, и/или численное соотношение между наборами количественных данных. Например, параметром является отношение (или функция отношения) между первым количеством первой нуклеотидной последовательности и вторым количеством второй нуклеотидной последовательности.
Используемый в данном описании термин локус или его множественное число локусы отображает локацию или местоположение любого отрезка нуклеотидов (или пар оснований), который имеет вариацию в геномах.
Термин дисбаланс последовательности, используемый в данном описании, означает любое значимое отклонение, определяемое как по меньшей мере одна пороговая величина, в количестве клинически релевантной нуклеотидной последовательности от эталонной величины. Дисбаланс последовательности может включать дисбаланс дозы хромосомы, дисбаланс аллели, дисбаланс дозы мутаций, дисбаланс копийности, дисбаланс дозы гаплотипа и другие подобные дисбалансы. Как пример, дисбаланс аллели или дозы мутаций может иметь место, когда плод имеет генотип, отличный от материнского, причем посредством этого создается дисбаланс в образце в определенном локусе.
Термин хромосомная анеуплоидия, используемый в данном описании, означает изменение в количестве хромосом от количества диплоидного генома. Изменение может быть увеличением или уменьшением. Оно может включать одну хромосому целиком или участок хромосомы.
Термин гаплотип, используемый в данном описании, относится к комбинации аллелей в нескольких локусах, которые переданы по наследству вместе на одной и той же хромосоме или участке хромосомы. Г аплотип может относиться к такому небольшому количеству, как одна пара локусов, или к участку хромосомы или ко всей хромосоме. Термин аллели относится к альтернативным последовательностям ДНК в одном и том же физическом геномном локусе, которые могут или не могут привести к различным фенотипическим признакам. В любом определенном диплоидном организме с двумя копиями каждой хромосомы (за исключением половых хромосом у мужчины) генотип для каждого гена включает пару аллелей, присутствующих в указанном локусе, которые являются одинаковыми в гомозиготах и различными в гетерозиготах. Популяция или вид организмов типично включает несколько аллелей для каждого локуса у различных индивидуумов. Геномный локус, в котором в популяции находят более одного аллеля, называют полиморфным сайтом. Изменение аллелей в локусе можно измерить как число присутствующих аллелей (т.е. степень полиморфизма) или долю гетерозигот (т.е. степень гетерозиготности) в популяции. Используемый в данном описании термин полиморфизм относится к любому межличностному изменению в геноме человека независимо от его повторяемости. Примеры таких изменений включают, но не ограничиваются указанным, однонуклеотидный полиморфизм, полиморфизмы простых тандемных повторов, инсерционные-делеционные полиморфизмы, мутации (которые могут вызывать заболевания) и изменения копийности.
Подробное описание
Обнаружено, что молекулы фетальной ДНК, которые присутствуют в плазме беременной женщины, как правило, короче, чем молекулы материнского происхождения (Chan et al., Clin. Chem., 2004, 50:88-92; Li et al., Clin. Chem., 2004, 50:1002-1011; заявка на патент США 20050164241). В некоторых воплощениях настоящего изобретения из ДНК материнской плазмы по изменению размера молекул ДНК, полученных из указанной части генома, можно определить, имеет ли плод избыточное или недостаточное представление этой части генома. Так как фетальная ДНК представляет минорную фракцию ДНК в материнской плазме, общая степень изменения размеров в материнской плазме должна быть, вероятно, небольшой, и таким образом, может быть обнаружена с трудом. В некоторых воплощениях размеры ряда молекул измеряют для достижения статистически значимого различия между болезнью и здоровым состоянием.
I. Определение размера фрагмента.
Одним из способов, которыми можно измерить размеры ряда молекул ДНК, является массивное параллельное секвенирование генома. Его можно осуществить, например, на платформе геномного анализатора Illumina (с использованием секвенирования путем синтеза) (Bentley D.R. et al., Nature, 2008, 456:53-59), ABI SOLiD (c использованием секвенирования путем лигирования) (McKernan et al., Genome Res., 2009, 19:1527-1541), платформе Roche 454 (Marguelis et al., Nature, 2005, 437:376-380) и платформе одномолекулярного секвенирования Helicos (Harris et al., Science, 2008, 320:106-109). Также предполагается, что также можно использовать другие платформы массивного параллельного секвенирования, например Pacific Biosciences (одномолекулярная технология в реальном времени (SMRT™)) (Eid et al., Science, 2009, 323:133-138), секвенирование в нанопорах (Clarke J. et al., Nat. Nanotechnol., 2009, 4:465-470), полупроводниковое секвенирование (например, с Ion Torrent (www.iontorrent.com) и т.д.
Одним из путей получения информации о размерах ДНК из такого секвенирования является выполнение секвенирования спаренных концов (paired-end) (РЕ), при котором секвенируют оба конца молекулы ДНК. Затем последовательности, соответствующие обоим концам молекулы, можно обратно картировать в эталонном геноме (например, эталонном геноме человека или эталонном геноме лошади или геноме любого животного, представляющего интерес). В одном воплощении оба конца секвенируют,
- 7 034241 каждый, на расстояние, которое является достаточно протяженным для обратного картирования в эталонном геноме человека (например, примерно 10-24 основания или 25-36 оснований). В другом воплощении только часть последовательностей может быть обратно картирована без ошибок в участке генома человека не содержащем повторы. В одном аспекте картирование может быть однозначным, если обе последовательности используют при картировании вместе. При таком варианте, даже если оба конца без сомнения могут быть слишком короткими для обратного картирования, использование обеих последовательностей может обеспечить однозначное картирование. Размер молекулы может быть вычислен путем вычитания геномных координат концов двух последовательностей.
В другом воплощении размер молекулы можно получить путем полного или почти полного секвенирования всей молекулы ДНК вместо только ее двух концов. Это можно эффективно осуществить с помощью платформ секвенирования с относительно протяженными отрезками считывания, такими как платформа Roche 454, одномолекулярная технология в реальном времени (SMRT™) Pacific Biosciences и технология Ion Torrent (www.iontorrent.com).
Производительность методов секвенирования на основе вышеуказанного можно повысить путем использования индексирования или штрихового кода (Cronn et al., Nucleic Acids Res., 2008, 36: e122). Таким образом, к фрагментам нуклеиновой кислоты в определенной библиотеке секвенирования нуклеиновых кислот может быть добавлен индекс или штриховой код, специфический для образца или пациента. Затем ряд таких библиотек, каждая с индексом или штриховым кодом, специфическим для образца или пациента, смешивают вместе и вместе секвенируют. После реакций секвенирования можно собрать данные секвенирования для каждого образца или пациента на основании кода или индекса. Такая стратегия может повысить производительность и, таким образом, экономическую эффективность данного изобретения.
В другом воплощении молекулы нуклеиновых кислот в биологическом образце перед анализом размеров можно отобрать или фракционировать. В одном варианте молекулы нуклеиновых кислот обрабатывают с помощью устройства (например, микроматрицы или растворов, содержащих зонды), которое может преимущественно связывать молекулы нуклеиновых кислот из выбранных локусов в геноме (например, одной из хромосом 21, 18, 13 или X), затем можно выполнить анализ размеров на подмножестве связанных молекул нуклеиновых кислот. В таком воплощении можно использовать систему захвата последовательностей Nimblegen (www.nimblegen.com/products/seqcap/index.html) или систему Aglient SureSelect Target Enrichment (www.opengenomics.co.SureSelect_Target_Enrichment_System) или подобные платформы. В другом воплощении подмножество несвязанных молекул нуклеиновых кислот может быть дифференцированно удалено, или разрушено, или гидролизовано.
По меньшей мере, по некоторым воплощениям можно работать с анализом одной молекулы на любой платформе, в котором можно анализировать хромосомное происхождение и длину молекулы, например, с электрофорезом, оптическими методами (например, оптическим картированием и его вариантами, en.wikipedia.org/wiki/Optical_mapping#cite_note-Nanocoding-3, и Jo et al., Proc. Natl. Acad. Sci. USA, 2007, 104:2673-2678), методом на основе флуоресценции, методами на основе зондов, цифровой ПЦР (на основе микрожидкостей или на основе эмульсии, например, BEAMing (Dressman et al., Proc. Natl. Acad. Sci. USA, 2003, 100:8817-8822), RainDance (www.raindancetech.com/technology/per-genomic-research.asp)), амплификацией по типу катящегося кольца, масс-спектрометрией, анализом плавления (или анализом кривой плавления), с молекулярными ситами и т.д. Как пример, в случае масс-спектрометрии более длинная молекула будет иметь большую массу (пример показателя размера).
В одном примере молекулы ДНК плазмы произвольно секвенируют с помощью системы геномного анализатора Illumina с использованием протокола секвенирования спаренных концов. В таком эксперименте используют версию 1 набора реагентов Illumina Paired-end (PE) Cluster Generation. Каждый конец секвенируют для 36 п.о. Оба конца каждой последовательности выравнивают с геномом человека с маскированными повторами (NCBI Build 36, версия 48) с использованием программы cland_pair в пакете программ GAPipeline-1.0, предоставленном Illumina. Для целей выравнивания используют только 32 п.о. из 36 с каждого конца.
В некоторых воплощениях для последующего анализа можно использовать данные РЕ, удовлетворяющие следующим критериям:
(1) отдельные члены каждой предложенной пары оба секвенированы на одной и той же позиции кластера на секвенирующей проточной камере и могут быть выровнены с одной и той же хромосомой с правильной ориентацией, ожидаемой для эталонного генома человека;
(2) данные секвенирования обоих членов пары могут быть выровнены с эталонным геномом человека с маскированными повторами без какой-либо ошибки по нуклеотидам;
(3) данные секвенирования каждого члена пары имеют показатель однозначности >4;
(4) пары, показывающие размер вставки менее 600 п.о.
Затем вычисляют размер каждой выровненной последовательности согласно позиции каждого из двух концов.
- 8 034241
II. Использование распределения по размерам для определения состояния анеуплоидии.
Фиг. 1 представляет собой блок-схему, иллюстрирующую способ 100 осуществления пренатальной диагностики дисбаланса последовательностей в биологическом образце, полученном от беременной женщины, согласно воплощениям настоящего изобретения. Хотя способ 100 описан, главным образом, в связи с анализом фетальной хромосомной анеуплоидии, другие воплощения способа 100 и другие способы в данном описании могут быть применены к дисбалансам других последовательностей (например, идентификация генотипа или мутаций). Способ 100 и другие способы, указанные в данном описании, могут быть осуществлены полностью или частично с помощью компьютерной системы, включающей один или несколько процессоров.
Способ 100 и любой другой способ, описанный в данном описании, может быть осуществлен полностью или частично с помощью компьютерной системы, включающей процессор, конфигурация которого может быть создана для выполнения стадий. Таким образом, воплощения относятся к компьютерным системам, конфигурация которых создана для выполнения стадий любого из способов, описанных в данном описании, потенциально, с различными компонентами, выполняющими соответствующую стадию или соответствующую группу стадий. Хотя стадии представлены нумерованными, стадии способа по данному изобретению могут быть выполнены все одновременно или в другом порядке. Кроме того, все или части стадий могут быть необязательными. Кроме того, любая из стадий любого из способов может быть выполнена с модулями, схемами или другими средствами для выполнения таких стадий.
На стадии 110 измеряют размер, по меньшей мере, некоторых молекул нуклеиновых кислот (например, ДНК или РНК) в биологическом образце. Молекулы нуклеиновых кислот также называются фрагментами, так как они представляют собой фрагменты полного генома. Размер можно измерить любым подходящим способом, например, способами, описанными выше.
На стадии 120 идентифицируют локацию в геноме, из которого происходит каждая из молекул нуклеиновых кислот. Локацией может являться любая часть генома, который в данных примерах является геномом человека, но может быть частью других геномов. Например, локацией может являться хромосома с определенным номером, из которой произошел фрагмент, где часть хромосомы может быть определена геномными координатами (например, конкретной координатой или рядом координат), и даже может представлять собой одну определенную хромосому из хромосомной пары (исходя из того, что организм эуплоид), из которой произошел фрагмент.
В одном воплощении такую идентификацию можно выполнить путем секвенирования и сравнения информации о последовательностях с эталонной последовательностью генома человека. В другом воплощении такую идентификацию можно выполнить путем гибридизации с панелью зондов с известным хромосомным происхождением. Зонды могут быть помечены одной или несколькими флуоресцентными метками в любом формате микроматриц или в растворе. В еще одном воплощении молекулы нуклеиновых кислот могут быть захвачены панелью зондов или в растворе или на твердой поверхности, и затем захваченные (или оставшиеся незахваченными) молекулы нуклеиновых кислот секвенируют. В некоторых воплощениях, где необходимо идентифицировать дисбаланс последовательности иной, чем хромосомная анеуплоидия, стадия идентификации хромосомы, из которой происходит фрагмент, может быть необязательной.
На стадии 130 определяют распределение по размерам молекул нуклеиновых кислот, соответствующих первой локации (например, первой хромосоме). Различные воплощения можно использовать для различных распределений по размерам. В некоторых воплощениях распределение по размерам соотносят с ранжированием размеров (например, усредненный (average), медианный (median), средний (mean)) фрагментов одной хромосомы относительно фрагментов других хромосом. В других воплощениях распределение по размерам может соотноситься со статистическим показателем фактических размеров фрагментов хромосомы. В одном воплощении статистический показатель может включать усредненный, медианный или средний размер фрагментов хромосомы. В другом воплощении статистический показатель может включать полную длину фрагментов меньше пороговой величины, которую можно разделить на полную длину всех фрагментов или, по меньшей мере, фрагментов меньше пороговой величины.
На стадии 140 на основании определенного распределения по размерам классифицируют, существует ли дисбаланс последовательности (например, фетальная хромосомная анеуплоидия) для первой локации. В одном воплощении ранжировку хромосомы сравнивают с ранжировкой эталонного образца (например, ранжировкой эуплоидного образца). Если изменение значимое (например, превышающее пороговое значение), тогда образец можно классифицировать как анеуплоидный. В другом воплощении сравнивают статистические показатели фактических размеров двух хромосом или групп хромосом. Например, можно взять различие между соответствующими статистическими показателями и сравнить с пороговым значением.
III. Распределение по размеру (ранжировка).
В воплощениях могут быть использованы значения размеров фрагментов нуклеиновых кислот образца для того, чтобы определить существует ли хромосомный дисбаланс. Фрагментами также называют последовательности после выполнения секвенирования. В одном воплощении определяют распределение по размерам фрагментов нескольких хромосом, и хромосомы располагают в определенном порядке на
- 9 034241 основании статистического показателя распределения (например, усредненного, медианного или среднего). Для удобства термин размер можно использовать в данном описании как синоним статистического показателя размера. Это должно быть ясно, когда термин размер относят к размеру конкретного фрагмента и статистической оценке набора фрагментов.
А. Ранжировка.
Фиг. 2 представляет собой график, иллюстрирующий измеренное распределение по размеру фрагментов ДНК, происходящих из различных хромосом в материнской плазме. Так как измеренный размер может отражать не только размер фрагментов ДНК in vivo, но также вклад аналитических стадий, предполагается, что распределение по размерам может изменяться от платформы к платформе (например, для платформы для геномного анализатора Illumina и для платформы ABI SOLID) и даже может изменяться, когда для определенной платформы используют различные реагенты. Однако до тех пор, пока эталонные образцы и испытываемые образцы анализируют с использованием одной и той же платформы или типов реагентов, воплощения можно считать как независимые от платформы/реагентов. Некоторые воплощения также можно использовать с различными платформами и/или типами реагентов, например, если можно определить и скорректировать любые ошибки, или если можно показать, что платформы и/или типы реагентов плотно соответствуют аналитическим действиям.
На фиг. 2 сравнивают 22 аутосомы и хромосому X по размерам последовательностей выровненных с ними фрагментов. По оси Y ранжир предстает в порядке убывания размера последовательностей, т.е. хромосоме с самой длинной последовательностью присваивают ранжир 1, и хромосоме с самой короткой последовательностью присваивают ранжир 23. В одном воплощении сравнение (Kruskal-Wallis One Way Analysis of Variance on Ranks followed by Bonferroni-corrected pairwaise comparisons) осуществляют непараметрически с использованием программы SigmaStat (SPSS). Сравнение может быть по любому статистическому показателю, представляющему размер, включая ранжировку каждого из отдельных размеров и статистический анализ отдельных ранжировок для последовательностей каждой хромосомы. В одном воплощении при нумерации по ранжиру допускается нумерация петель и пропусков.
В некоторых воплощениях каждую из последовательностей картируют на определенной хромосоме. Затем для каждой хромосомы определяют один или несколько статистических показателей для последовательностей, картированных на такой хромосоме. Иными словами, для размеров каждой хромосомы могут быть вычислены статистические показатели различных типов (например, усредненный, средний и медианный). Затем соответствующие статистические показатели можно расположить в определенном порядке. Например, можно сравнить друг с другом усредненные размеры для каждой хромосомы. Если используют более одного статистического показателя, тогда такие статистические показатели можно объединить (например, согласно некоторой формуле, такой как усреднение по массе) и можно ранжировать такой комбинированный статистический показатель. В одном воплощении ранжировки статистических показателей для определенной хромосомы можно объединить (например, так, как указано для статистических показателей выше) и затем комбинированные статистические показатели можно сравнить друг с другом.
В других воплощениях все последовательности по отдельности выстраивают в определенном порядке согласно размеру. Иными словами, если существует 1000000 последовательностей, тогда идет ранжировка с нумерацией от 1 до 1 млн с возможными петлями и пропусками. Затем могут быть добавлены ранжировки для всех последовательностей, картированных на одной и той же хромосоме. Сумму ранжировок можно разделить на число последовательностей, выровненных с определенной хромосомой, и получить среднюю ранжировку последовательностей для хромосомы. Хромосома с самой высокой средней ранжировкой последовательностей может быть маркирована как самая длинная (ранжиры 1, наивысшие по оси Y), и хромосома с самой низкой средней ранжировкой последовательностей может быть самой короткой (ранжиры 23, самые низкие по оси Y). В другом воплощении может быть определен медианный ранжир. Медианные ранжиры для пациентов с эуплоидным плодом мужского пола, эуплоидным плодом женского пола и плодом мужского пола с трисомией 21 показаны на фиг. 2.
По оси X хромосомы располагают в порядке убывания размеров по распределению по размерам фрагментов ДНК, произошедших от каждой хромосомы (за исключением хромосомы X (см. далее)). В одном воплощении для такого расположения используют только случаи эуплоидии. Хромосому самого большого измеренного размера (например, длины) располагают на левой стороне. Хромосому X размещают на диаграмме справа, поскольку ее ранжировка определяется полом плода.
Как указано выше, измеренный размер может изменяться от платформы к платформе (например, размер изменяется при переходе от системы Illumina к другой системе). Таким образом, в одном аспекте размер может называться измеренным размером в отличие от фактического размера. Размер даже может изменяться при переключении от одной версии набора Illumina в другой версии, например, когда размер изменяется при переходе от версии 1 набора для генерации кластера спаренных концов к версии 2. В одном воплощении пользователи могут выполнять ранжировку для выбранной ими определенной системы.
Из фиг. 2 можно видеть, что средний ранжир хромосомы X ниже (т.е. становится более сжатым) в плазме беременной женщины, вынашивающей плод женского пола, при сравнении с женщиной, вына- 10 034241 шивающей плод мужского пола. Объяснение данного наблюдения таково, что фрагменты ДНК, высвобождаемые плодом, более короткие, чем фрагменты от матери. Таким образом, за счет высвобождения двойной дозы хромосомы X плод женского пола в материнской плазме будет уменьшать общий измеренный размер фрагментов, происходящих от хромосомы X. Напротив, плод мужского пола будет способен высвобождать только одну дозу хромосомы X.
Также из фиг. 2 можно видеть, что ранжир хромосомы 21 снижается (т.е. становится более сжатым) в плазме беременной женщины, вынашивающей плод с трисомией 21, при сравнении с женщиной, вынашивающей эуплоидный плод. Объяснение данного наблюдения может быть снова обращено к измеренному размеру фрагментов в материнской плазме, происходящих от хромосомы 21. Напротив, эуплоидный плод будет способен высвобождать только две дозы хромосомы 21 на фетальную клетку.
Фиг. 3 представляет собой график 300, показывающий, что анализ размеров последовательностей в материнской плазме, происходящих от различных хромосом, согласно воплощениям настоящего изобретения можно использовать для неинвазивного пренатального обнаружения фетальных анеуплоидий хромосомы 21. В данном примере размер хромосомы представлен ранжиром по размеру при сравнении с другими хромосомами. Таким образом, большее число ранжира по размеру указывает, что хромосома в материнской плазме имеет более короткие по размерам фрагменты ДНК.
График 300 показывает, что число ранжира по размеру хромосомы 21 в материнской плазме больше (указывая, таким образом, на более короткие фрагменты ДНК) в случае беременности, включающей плод с трисомией 21 (ранжировка от ранжира 18 до 21), чем когда плод является эуплоидным (ранжировка от ранжира 9 до 18). Объяснение данного наблюдения таково, что фетальная ДНК короче материнской ДНК и что дополнительная доза хромосомы 21 от плода с трисомией 21 может привести к общему сокращению статистического показателя последовательностей хромосомы 21 в материнской плазме.
В. Методы с использованием ранжира.
Фиг. 4 представляет собой блок-схему, иллюстрирующую способ выполнения пренатальной диагностики фетальной хромосомной анеуплоидии в биологическом образце, полученном от беременной женщины, с использованием ранжировок статистического показателя размера согласно воплощениям настоящего изобретения.
На стадии 410 измеряют размер каждой из множества молекул нуклеиновых кислот (фрагментов), полученных из биологического образца. Обращает внимание, что такое множество молекул нуклеиновых кислот может представлять собой подмножество всех полученных молекул нуклеиновых кислот. Множество молекул нуклеиновых кислот даже может представлять собой подмножество всех отсеквенированных молекул нуклеиновых кислот, когда осуществляют секвенирование в целях измерения размеров.
На стадии 420 идентифицируют, из каких хромосом происходит множество молекул нуклеиновых кислот. В различных воплощениях порядок стадий 410 и 420 может быть изменен на противоположный или их осуществляют одновременно. Например, в контексте секвенирования спаренных концов геномное выравнивание последовательности может предоставить ее хромосомную локацию плюс ее длину (путем вычитания начальных и конечных геномных координат). В одном воплощении хромосому можно идентифицировать как на стадии 120.
На стадии 430 для каждой из множества хромосом вычисляют статистический показатель из размеров молекул нуклеиновых кислот, соответствующих хромосоме. Статистический показатель можно вычислить любым из способов, описанных в данном документе. Например, статистический показатель может включать результат начальной стадии ранжировки, описанной выше. В одном воплощении можно использовать только часть молекул нуклеиновых кислот, соответствующих любой определенной хромосоме.
На стадии 440 расположение хромосом в определенном порядке определяют на основании статистических показателей. В одном воплощении ранжировку можно определить с использованием основного алгоритма сортинга. В другом воплощении можно выполнить более сложное сравнение, такое как по Kruskal-Wallis - один из способов анализа дисперсии по ранжирам с последующими попарными сравнениями с учетом поправки по Bonferroni, или другими подходящими способами. В различных воплощениях ранжировки могут быть целыми, частями, реальными числами (например, в интервале) или буквенноцифровыми ранжировками, основанными на инициалах (например, А-Х).
На стадии 450 определенную ранжировку первой хромосомы сравнивают с другой ранжировкой первой хромосомы, полученной от эталонного биологического образца. В одном воплощении сравнение представляет собой сравнение определенной ранжировки с пороговым значением (например, одной величиной или интервалом), который определяют из ранжировок одного или нескольких эталонных биологических образцов. Такое пороговое значение может быть, если ранжир 18 (или 19) или выше, такой как можно определить из фиг. 3. В другом воплощении можно определить различие в ранжировках первой хромосомы между двумя образцами, и различие можно сравнить с пороговым значением. В одном воплощении анализируют эталонный биологический образец для того, чтобы определить, что он не содержит заболевания, представляющего интерес, и даже можно определить, что образец не содержит какоголибо релевантного заболевания, которое может вызывать проблемы с ранжировкой.
- 11 034241
На стадии 460 на основании сравнения классифицируют, существует ли фетальная хромосомная анеуплоидия для первой хромосомы. В одном воплощении классификация может представлять собой бинарную классификацию заболевания или отсутствия заболевания. В другом воплощении классификация может быть тройной, при которой может быть использована промежуточная классификация. В еще одном воплощении классификация может включать вероятность частной классификации, и таким образом, быть эффективнее, чем просто три классификации.
IV. Распределение по размерам (статистические показатели размера)
В других воплощениях распределение по размерам может включать статистические показатели размера фрагментов (например, статистические показатели фактических или абсолютных величин для определенной геномной локации) как противопоставление ранжировкам. В одном воплощении фактические размеры первой хромосомы можно сравнить с фактическими размерами одной или нескольких эталонных хромосом для одного и того же испытываемого образца. Например, показатель разделения (например, различие или отношение) между такими фактическими размерами первой хромосомы и одной или нескольких эталонных хромосом можно сравнить с пороговым значением. В одном воплощении пороговое значение можно определить из эталонных образцов. В другом воплощении для сравнения наряду с пороговым значением можно использовать показатель разделения между фактическими размерами фрагментов хромосомы между испытываемым образцом и эталонным биологическим образцом. В еще одном воплощении фактические размеры фрагментов хромосомы можно сравнить с пороговым значением и получить надежную классификацию.
A. Абсолютный размер.
Некоторые примеры показывают, что можно добиться неинвазивного пренатального обнаружения тримосомии 21 путем сравнения абсолютных размеров фрагментов, происходящих от хромосомы 21, с абсолютными размерами фрагментов, происходящих от одной или нескольких эталонных хромосом. В одном воплощении в качестве эталонных хромосом можно выбрать хромосомы 7 и 14, так как они могут иметь величины размеров (например, абсолютный размер или ранжировки по размеру) в материнской плазме, которые относительно близки к хромосоме 21. На практике эталонная хромосома может представлять собой любую хромосому, которая имеет размеры фрагментов, которые соотносятся, например, для конкретной аналитической платформы и/или типа реагента, с хромосомой 21 (или другой хромосомой, представляющей интерес) для эуплоидных образцов.
Фиг. 5 представляет собой табл. 500, иллюстрирующую сравнение хромосомы 21 с хромосомой 7 и хромосомой 14 по размерам последовательностей, выровненных с соответствующими хромосомами, согласно воплощениям настоящего изобретения. Данные для табл. 500 получают при испытании 16 образцов. Для каждого образца показан средний размер для фрагментов каждой из хромосом 7, 14 и 21. Также приводится различие между средними значениями. Величина р показывает вероятность того, что каждое различие может иметь место в образце от здоровой женщины.
Как можно видеть из табл. 500 на фиг. 5, последовательности, выровненные с хромосомой 21, значительно короче (например, по среднему размеру), чем последовательности, выровненные с хромосомой 7 и хромосомой 14, для всех случаев беременности с трисомией 21 (критерий суммы ранжиров МаннаУитни, величина р<0,001). Сокращение при такой степени статистической значимости не наблюдают при эуплоидной беременности. Таким образом, табл. 500 показывает, что для всех случаев беременности с трисомией 21 различие в среднем размере фрагментов между хромосомой 21 и хромосомой 7 превышает 1 п.о., в то время как ни один из случаев эуплоидии не показывает различия больше 1 п.о. Соответственно, 1 п.о. может дать точное пороговое значение для определения классификации. Подобным образом, для всех случаев беременности с трисомией 21 средний размер фрагментов из хромосомы 14 согласованно больше среднего размера фрагментов из хромосомы 21. Действительно, если используют порог в 0,5 п.о. для наблюдаемого удлинения фрагментов хромосомы 14 при сравнении с фрагментами хромосомы 21, все случаи трисомии 21 можно отличить от случаев без трисомии 21. Так, в одном воплощении пороговую величину можно определить из одного или нескольких эталонных образцов.
B. Способы с использованием абсолютного размера.
Фиг. 6 представляет собой блок-схему, иллюстрирующую способ выполнения пренатальной диагностики дисбаланса последовательностей в биологическом образце, полученном от беременной женщины, с использованием сравнения статистического показателя размеров фрагментов для геномной локации согласно воплощениям настоящего изобретения. В одном аспекте способ 600 может относиться к определению классификации дисбаланса последовательностей на основании показателя разделения (например, различия или отношения) для размеров фрагментов первой хромосомы и размеров фрагментов одной или нескольких эталонных хромосом.
На стадии 610 измеряют размер множества молекул нуклеиновых кислот, полученных из биологического образца. Обращает внимание, что множество молекул нуклеиновых кислот может быть получено и может включать схожие фрагменты, как отмечено на стадии 410.
На стадии 620 идентифицируют геномную локацию, из которой происходит каждая из молекул нуклеиновых кислот. Локацией может быть любая часть генома, как описано для стадии 120 и в других местах. Например, идентифицируют, от какой хромосомы происходит каждая из молекул нуклеиновых
- 12 034241 кислот. Такое определение можно сделать путем картирования в эталонном геноме, как описано в данном описании.
На стадии 630 вычисляют первый статистический показатель из размеров молекул нуклеиновых кислот, соответствующих первой геномной локации (например, первой хромосоме). В одном воплощении первый статистический показатель может представлять собой усредненный, средний или медианный размер фрагментов, соответствующих первой хромосоме. В другом воплощении первый статистический показатель может включать сумму длин фрагментов ниже первого размера, которая может представлять собой пороговую величину. Например, можно суммировать длины каждого из фрагментов, которые меньше 200 п.о. Сумму можно разделить на другое число, такое как сумма длин всех фрагментов, соответствующих первой хромосоме, или сумма длин фрагментов, превышающих пороговую величину второго размера (который может быть таким же, как первый размер). Например, первый статистический показатель может представлять собой отношение общей длины фрагментов ниже пороговой величины первого размера к общей длине фрагментов или отношение общей длины мелких фрагментов к общей длине крупных фрагментов.
На стадии 640 вычисляют второй статистический показатель из размеров молекул нуклеиновых кислот, соответствующих второй геномной локации (например, второй хромосоме). Вторую хромосому можно рассматривать как эталонную хромосому. В одном воплощении можно вычислить статистический показатель для множества эталонных хромосом. В одном воплощении статистические показатели можно объединить, так что может иметь место статистический показатель одной или нескольких вторых хромосом. В другом воплощении статистические показатели для множества эталонных хромосом можно сравнивать по отдельности, как указано ниже.
На стадии 650 первый статистический показатель и второй статистический показатель сравнивают, и получают показатель разделения. В одном воплощении определяют показатель разделения, который может представлять собой различие между первым статистическим показателем и втором статистическим показателем. В другом воплощении показатель разделения может представлять собой отношение двух статистических показателей. В еще одном воплощении можно определить множество показателей разделения, например, показатель для каждого второго статистического показателя, который можно вычислить для каждой эталонной хромосомы.
На стадии 660 показатель разделения сравнивают с одной или несколькими пороговыми величинами. В одном воплощении сравнение можно выполнить для каждого из множества показателей разделения. Например, как указано выше, можно определить другой показатель разделения между первым статистическим показателем и каждым вторым статистическим показателем. В различных воплощениях каждый показатель разделения можно сравнить с одной и той же или различными пороговыми величинами. В другом воплощении показатель разделения сравнивают с двумя пороговыми величинами и определяют, находится ли показатель разделения в определенном интервале. Интервал может включать одну пороговую величину для определения, если имеет место один из результатов, отличных от нормального (например, анеуплоидия), и можно использовать для определения вторую пороговую величину, если один из результатов возможно вызван ошибкой измерения или анализа (например, если показатель разделения выше, чем можно было бы ожидать даже для образца при заболевании).
На стадии 670 на основании сравнения определяют классификацию, существует ли дисбаланс последовательности (например, фетальная хромосомная анеуплоидия) для первой геномной локации. В одном воплощении можно использовать множество пороговых величин (например, N пороговых величин) для одного показателя разделения. В таком воплощении можно определить N+1 классификаций. Например, можно использовать две пороговые величины для определения классификации как эуплоидной (нормальное или здоровое состояние), недетерменированной и анеуплоидной (болезненное или нездоровое состояние). В другом воплощении, когда осуществляют множество сравнений (например, сравнение для каждого показателя разделения), классификация может быть основана на каждом сравнении. Например, способ, основанный системе правил, можно рассматривать при классификациях, являющихся результатами каждого из сравнений. В одном воплощении окончательная классификация обеспечивается только тогда, когда все классификации совместимы. В другом воплощении используют классификацию большинства. В еще одном воплощении можно использовать более сложные формулы на основании того, насколько близок каждый из показателей разделения к соответствующей пороговой величине, и такие величины близости можно анализировать для определения классификации. Например, величины близости можно суммировать (наряду с другими факторами, такими как нормализация), и результат можно сравнить с другой пороговой величиной.
В других воплощения также можно применить вариации способа 600 для непосредственного сравнения статистического показателя для первой хромосомы с пороговой величиной, которая может быть получена из эталонного образца. Некоторые воплощения также можно использовать для анализа биологических образцов от небеременных женщин. Такой анализ можно рассматривать именно при статистическом показателе для размера всех фрагментов образца и сравнении статистического показателя или показателя разделения с пороговым значением для того, чтобы определить может ли существовать дисбаланс последовательности. Если дисбаланс последовательности классифицируют как существующий,
- 13 034241 можно выполнить дополнительный анализ локации дисбаланса, например анализируя статистические показатели размеров и/или показатели разделения для определенной геномной локации (например, хромосомы).
С. Использование общих длин коротких фрагментов.
Как указывалось выше, в некоторых воплощениях распределение по размерам ДНК плазмы также может быть отражено долей общей длины ДНК, в которую вносят вклад короткие фрагменты ДНК. Например, распределение по размерам может включать общую длину фрагментов меньше пороговой величины, которую можно разделить на общую длину всех фрагментов, или, по меньшей мере, фрагментов больше пороговой величины. Напротив, распределение по размерам ДНК плазмы также может быть отражено долей полной длины ДНК, в которую вносят вклад длинные фрагменты ДНК. Например, распределение по размерам может включать общую длину фрагментов больше пороговой величины, которую можно разделить на общую длину всех фрагментов или, по меньшей мере, фрагментов меньше пороговой величины. Как другой пример, также можно использовать отношение мелких фрагментов к крупным. В одном воплощении в качестве порога используют 150 п.о. для определения коротких фрагментов ДНК плазмы. Однако также в качестве порогов для определения коротких фрагментов ДНК можно использовать любую пороговую величину, например, в 130 п.о., 140 п.о., 160 п.о. и 170 п.о. Отмечается, что, как используется в данном описании, пары оснований также могут называться, как синоним, числом нуклеотидов (nt) при обращении к длине одноцепочечного фрагмента.
В одном воплощении вычисление доли длины ДНК, вносимой короткими фрагментами ДНК, можно выполнить следующим образом: F = доля длины ДНК, вносимой короткими фрагментами ДНК; S = сумма длин всех коротких фрагментов ДНК (длины, равные или меньше порога); и Т = общая длина всех фрагментов ДНК в образце независимо от их длины. Так, указанную долю можно представить как F = S/Т, что является одним примером статистического показателя размера. Вычислить F можно для всех фрагментов из образца или для определенной локации в геноме, например, для определенной хромосомы.
В одном воплощении можно определить общую длину всех фрагментов ДНК. Затем можно выбрать размер порога (w), меньше которой фрагменты ДНК определяют как короткие фрагменты. Размер порога может изменяться и быть выбран как соответствующий определенным диагностическим целям. Общую длину всех фрагментов ДНК можно вычислить, суммируя длину всех фрагментов ДНК, которые равны или короче порога. Долю общей длины, вносимую короткими фрагментами ДНК, можно вычислить следующим образом:
F = Zw длин/Σ600 длин, где Σw длин представляет собой сумму длин фрагментов ДНК с длиной, равной или меньше пороговой длины w (п.о.); и
Σ600 длин представляет собой сумму длин фрагментов ДНК с длиной, равной или меньше 600 п.о.
Статистический показатель F также можно использовать в воплощениях с использованием расположения в определенном порядке. Например, можно вычислить F для фрагментов из каждого набора соответствующих геномных локаций (например, хромосом).
С целью пояснения, в примере, приведенном ниже, можно вычислить общую длину путем суммирования фрагментов короче 600 п.о. Однако для вычисления общей длины можно использовать другие пределы размера, например 400 п.о., 500 п.о. и 700 п.о. В данном примере общую длину вычисляют, основываясь на фрагментах в 600 п.о. или меньше, поскольку система геномного анализатора Illumina (Solexa) не эффективна при амплифицировании и секвенировании фрагментов ДНК длиннее 600 п.о. Кроме того, устанавливая предел анализа фрагментов ДНК короче 600 п.о., также можно избежать смещений, появляющихся из структурных изменений генома. При наличии структурного изменения, например, перестановок (Kidd J.M. et al., Nature, 2008, 453:56-64), размер фрагмента ДНК может быть переоценен, когда размер оценивают биоинформативно путем картирования концов фрагмента ДНК в эталонном геноме. Кроме того, >99,9% всех фрагментов ДНК, успешно секвенированных и картированных в эталонном геноме, имеют менее 600 п.о., и, таким образом, включение всех фрагментов, равных и короче 600 п.о., может обеспечить репрезентативную оценку распределения по размерам фрагментов ДНК в образце.
Как обсуждалось выше, сдвиг распределения по размерам к более коротким фрагментам ДНК можно наблюдать для хромосомы, которая представлена у плода избыточной копией. В одном аспекте измерение различия в долях общей длины, вносимых короткими фрагментами ДНК, между хромосомой с повышенным риском анеуплоидии (хромосома-мишень) и хромосомами, не входящими в группу с повышенным риском анеуплоидии (эталонные хромосомы), может быть осуществлено количественно для определения того, различается ли распределение по размерам фрагментов ДНК, происходящих от указанных хромосом.
В одном воплощении F(Tar) и F(Ref) определяют как доли общей длины, вносимые короткими фрагментами ДНК, для хромосомы с повышенным риском анеуплоидии и эталонной хромосомы(хромосом) соответственно. Различие в долях общей длины, вносимых короткими фрагментами ДНК, между хромо- 14 034241 сомой-мишенью и эталонной хромосомой(хромосомами) (AF(Tar-Ref)) можно вычислить как
AF(Tar-Ref) = F(Tar) - F(Ref)·
Например, AF(2i-i) представляет собой различие между долями общей длины, вносимыми короткими фрагментами ДНК, для хромосомы 21 и хромосомы 1· Применение AF(Tar-Ref) в пренатальной диагностике фетальных хромосомных анеуплоидии будет обсуждаться в последующих разделах. В другом воплощении отношение F(Tar)/F(Ref) также может быть использовано как показатель разделения путем, схожим с путем использования AF(Tar-Ref)·
Различие между величинами F хромосомы-мишени и эталонной хромосомы можно использовать в качестве показателя для определения, является ли плод трисомиком по хромосоме-мишени или нет· Когда плод является трисомиком по хромосоме-мишени, трисомическая хромосома будет вносить в материнскую плазму дополнительную дозу короткой фетальной ДНК, приводя, следовательно, к явному сжатию распределения по размерам последовательностей хромосомы-мишени. Такое сжатие распределения по размерам последовательностей хромосомы-мишени может привести к возрастанию доли длины последовательностей, вносимой короткими фрагментами ДНК, для последовательности-мишени (Ftarget)· В результате может иметь место возрастание в различии AF между Ftarget и Fref·
Фиг. 7 показывает график 700 доли общей длины, вносимой короткими фрагментами (F), против размера порога (w) для образца материнской плазмы с плодом мужского пола· Величины F для фрагментов ДНК, выровненных с аутосомами и хромосомой Y, на графике нанесены по вертикальной оси против размера порога, используемого для определения коротких фрагментов ДНК· При беременности с плодом мужского пола молекулы ДНК, выровненные с хромосомой Y, представляют ДНК, высвобожденную из плода мужского пола· Так как большинство циркулирующих молекул ДНК в материнской плазме происходят от матери, фрагменты ДНК, выровненные с аутосомами, должны представлять собой преимущественно фрагменты материнской ДНК· Величина F возрастает с размером порога и приближается к величине 1,0, когда все фрагменты ДНК в образце короче или равны пороговому размеру· Различие в распределении по размерам между двумя видами молекул ДНК может быть отражено различием в их величинах F, Более высокая величина F показывает, что большая доля общей длины вносится короткими фрагментами, и, таким образом, указывает на более сжатое распределение по размерам фрагментов ДНК·
Как видно на графике 700, распределение по размерам молекул ДНК из хромосомы Y более узкое, чем распределение по размерам ДНК из аутосом· Конкретно, величина F для хромосомы Y возрастает раньше, чем для аутосом, что приводит к FY более высокой, чем Раутосомы между 80 пю· и 300 пю· Различие в величинах F между хромосомой Y и аутосомами (AF^-a^^oc,;^)) откладывают на графике против размера порога и представляют пунктирной линией, которая положительна между 80 пю· и 300 пю· Максимальная величина для АБ(^аутосомы) составляет 0,23 и имеет место вблизи 150 пю· Как поясняется в последующих примерах, различие в доли общей длины фрагментов, вносимой короткими фрагментами (AF), между хромосомой в группе риска и эталонной хромосомой(ами), является применимым показателем разделения для количественного определения различия в их распределении по размерам· Также, в порядке примера, можно определить величину AF с любым размером порога, например, между 130 пю· и 170 п,о.
Фиг· 8 показывает график 800 доли общей длины, вносимой короткими фрагментами (F), для хромосомы 21 (сплошная линия) и эталонными хромосомами (все аутосомы, за исключением хромосом 13, 18 и 21) (пунктирная линия) против размера порога для эуплоидной беременности· Различие в двух величинах F (AF(21-Ref) = F(xp 21) - F(Ref)) представлено штриховой линией· Так как распределение по размерам фрагментов ДНК из хромосомы 21 и эталонных хромосом схоже при эуплоидной беременности, величина AF(21-Ref) близка к нулю для любого размера порога·
Фиг· 9 показывает график 900 величины F для хромосомы 21 (сплошная линия) и эталонных хромосом (все аутосомы, за исключением хромосом 13, 18 и 21) (пунктирная линия) против размера порога для беременности с трисомией 21· Различие AF(21-Ref) представлено штриховой линией· Из-за дополнительной дозы хромосомы 21 из плода распределение по размерам фрагментов ДНК в материнской плазме для хромосомы 21 более сжатое, чем распределение по размерам для эталонных хромосом· Такое различие в распределении по размерам фрагментов ДНК отображается положительной величиной AF(21-Ref), которая достигает максимума в 0,016 при приблизительно 150 пю·
Фиг· 10 показывает график 1000 AF(21-Ref) между хромосомой 21 и эталонными хромосомами (все аутосомы, за исключением хромосом 13, 18 и 21) против размера порога для эуплоидной беременности и беременности с трисомией 21· В случае трисомии 21 наблюдают возросшую величину AF(21-Ref), но AF(21-Ref) равна приблизительно нулю при каждом размере порога в случае эуплоида· Так как максимум AF(21-Ref) наблюдают вблизи 150 пю·, различие в 150 пю· можно использовать в качестве показателя разделения для определения, если в распределении по размерам последовательностей хромосомы 21 существует любое значимое сжатие· Однако можно использовать любой размер, при котором возникает различие между случаями эуплоидии и трисомии, например, но без ограничения, 140 пю·, 145 пю·, 155 пю· и 160 ΗΌ· В данном примере различие между долей общей длины хромосомы 21 и эталонных хромосом,
- 15 034241 наблюдаемое при 150 п.о., составляет 0,016 и -0,002 для беременности с трисомией 21 и эуплоидной беременности соответственно.
Такое различие в форме доли общей длины ДНК, вносимой короткими фрагментами ДНК, можно использовать для того, чтобы различить эуплоидный и ануэплоидный плод. Различие можно проверить различными способами. В одном воплощении величину AF при определенном размере порога (пример показателя разделения) можно сравнить с пороговой величиной для определения категоризации (классификации) образца. В другом воплощении можно найти пиковую величину в AF, и эту величину можно сравнить с одной или несколькими пороговыми величинами категоризации. В различных воплощениях пиковая величина может представлять собой максимальную или минимальную величину, усредненную величину вблизи макс/мин величины или другую величину, ассоциированную с или происходящую от макс/мин величины. Также можно использовать другие статистические показатели показателя разделения (например, AF), такие как ширина пика или местоположение определенного порога, соответствующей пику.
В одном воплощении величину F (или другой статистический показатель, описанный выше, такой как длина мелких фрагментов, деленная на длину крупных фрагментов), полученную из множества фрагментов для определенной геномной локации или для полного генома, можно использовать для определения того, существует ли патология. Например, если статистический показатель превышает величину порога, тогда патологию можно определять как существующую, так как количество мелких фрагментов находится вне нормального интервала. Кроме беременных женщин, это можно осуществлять и для других пациентов для идентификации иных заболеваний, чем заболевания плода.
В некоторых воплощениях перед анализом размеров фрагментов можно выполнить физическое фракционирование по размерам. В одном воплощении молекулы нуклеиновых кислот можно разделить по размерам на две фракции (например, одну крупнее 200 п.о. и одну, равную или меньше 200 п.о.) и затем можно сравнить распределение по размерам выбранных хромосом (например, хромосомы 21) с каждой из таких фракций по размерам. При наличии фетальной трисомии (например, трисомии 21) фракция по размерам молекул меньшего размера может увеличиваться в относительном избытке при сравнении с фракцией по размерам молекул большего размера.
В других воплощениях вместо распределения по размерам можно использовать число фрагментов меньше пороговой длины. Например, можно сравнить число фрагментов меньше пороговой длины (например, по различию или отношению) для хромосомы-мишени (например, хромосомы 21) относительно одной или нескольких эталонных хромосом. В одном воплощении число фрагментов меньше пороговой длины делят на общее число фрагментов, и получают их долю в процентах, и можно сравнить такие доли в процентах для хромосомы-мишени и одной или нескольких эталонных хромосом и получить параметр. Полученный параметр (например, различие или отношение) можно сравнить с пороговой величиной (например, 1%). В одном аспекте пороговую длину можно выбрать при длине, где указанная выше доля в процентах является наибольшей.
V. Примеры использования ранжировки.
Кроме трисомии 21 анализ размеров фрагментов в материнской плазме также можно использовать для неинвазивного пренатального обнаружения других фетальных хромосомных анеуплоидий, таких как трисомия 13, трисомия 18 и анеуплоидии половых хромосом (такие как синдром Тернера, синдром Клайнфельтера и XYY и т.д.). Воплощения также можно использовать, когда в хромосомную анормальность вовлекается только часть определенной хромосомы (например, при трисомии 21, вызванной хромосомной транслокацией). При таком варианте развития событий анормальности в размерах фрагментов будут отмечаться для фрагментов ДНК из пораженных хромосомных участков.
Фиг. 11 показывает табл. 1100 для библиотек ДНК материнской плазмы, которые сконструированы с использованием набора multiplexing sample preparation (Illumina) согласно инструкциям изготовителя. Каждые два образца с различимыми штриховыми кодами вводят в одну полосу и последовательно подвергают стандартному мультиплексному секвенированию спаренных концов на геномном анализаторе II Illumina. Образцы можно различить на основании штриховых кодов. Анализируют образцы плазмы от 120 беременных женщин. Пол и состояние хромосомной анеуплоидии плодов показаны в табл. 1100.
Фиг. 12 иллюстрирует ранжировку различных хромосом для четырех образцов при различных болезненных состояниях или состояниях в отсутствие заболеваний согласно воплощениям настоящего изобретения. Располагают 22 аутосомы вместе с хромосомой X в порядке размеров их фрагментов, как описано ранее. Как можно видеть, относительная ранжировка хромосом на основе версии 2 набора реагентов для генерации кластеров Illumina отличается от ранжировки при использовании версии 1 набора (фиг. 2). Как показано ниже, воплощения (например, способ 400) позволяют отличить случай анеуплоидии от случая эуплоидии.
A. Трисомия 13.
В данном примере демонстрируется применение воплощений для пренатальной диагностики трисомии 13. Фиг. 13 показывает график ранжировки хромосомы 13 для 120 случаев беременности, например, который можно получить по способу 400. На графике Т13, Т18, Т21 и Eu относятся к беременности
- 16 034241 с трисомией 13, трисомией 18, трисомией 21 и эуплоидной беременности, соответственно. В 18 (78,3%) из 23 случаев беременности с трисомией 13 хромосоме 13 присваивают ранжир 22 или ниже, в то время как только в 2 (2,1%) из 97 случаев беременности без трисомии 13 хромосоме 13 присваивают ранжир 22 или ниже. Следовательно, с использованием порогового ранжира 22 чувствительность и специфичность анализа по ранжиру размеров фрагментов хромосом для пренатальной диагностики фетальной трисомии 13 составляет 87,3% и 97,9%, соответственно.
На фиг. 13 можно видеть, что ранжир хромосомы 13 выше (т.е. с меньшим числом, отмечающим ранжир) для эуплоидной беременности и беременности с трисомией 18 и 21, чем для беременности с трисомией 13. Иными словами, при сравнении с последовательностями других хромосом оказывается, что последовательности хромосомы 13 короче в случаях беременности с трисомией 13, чем в случаях беременности без трисомии 13. Явное укорачивание последовательностей хромосомы 13 при беременности с трисомией 13 имеет место из-за повышенного вклада фетальной ДНК в хромосому 13 из-за дополнительной хромосомы 13 плода.
B. Трисомия 18.
Фиг. 14 показывает ранжировку хромосомы 18 для 120 случаев. В 26 (86,7%) из 30 случаев трисомии 18 ранжиры хромосомы 18 ниже (т.е. с большим числом, отмечающим ранжир), чем 13, в то время как ни в одном из 90 случаев без трисомии 18 ранжир не ниже чем 13. Следовательно, с использованием ранжира 13 в качестве пороговой величины чувствительность и специфичность анализа по ранжиру размеров фрагментов хромосом для пренатальной диагностики фетальной трисомии 18 составляют 86,7 и 100% соответственно.
В таком анализе сравнивают ранжировку по размеру хромосомы 18 при беременности с трисомией 18, трисомией 13, трисомией 21 и эуплоидной беременности. В контексте хромосомы 18 последние три группы могут рассматриваться как нормальный контроль, поскольку они не имеют дозы анормальностей, включающих хромосому 18.
Как можно видеть из фиг. 14, ранжиры для хромосомы 18 в случаях эуплоидии и трисомии 13 группируются вокруг 1-3. С другой стороны, ранжирами для хромосомы 18 в случаях трисомии 18 являются 13-22, что указывает, что размеры фрагментов хромосомы 18 меньше, чем размеры в случаях эуплоидии, трисомии 21 и трисомии 13. Снова такие наблюдения объясняет дополнительная хромосома 18.
C. Трисомия 21.
Фиг. 15 показывает ранжировку хромосомы 21 для 120 случаев. В 8 (88,9%) из 9 случаев трисомии 21 хромосоме 21 присваивают ранжиры 22 или ниже, в то время как ни в одном из 111 случаев без трисомии 21 хромосома 21 не имеет ранжир 22 или ниже. Следовательно, с использованием ранжира 22 в качестве пороговой величины чувствительность и специфичность анализа по ранжиру размеров фрагментов хромосом для пренатальной диагностики фетальной трисомии 21 составляет 89,9% и 100%, соответственно.
VI. Примеры использования различия в размерах.
A. Трисомия 13.
В последующих примерах демонстрируется, что можно добиться неинвазивного пренатального обнаружения трисомии 13 путем сравнения абсолютных размеров фрагментов, происходящих от хромосомы 13, с абсолютными размерами фрагментов, происходящих от одной или нескольких эталонных хромосом, например, так, как описано для способа 600. В данном примере используют тот же набор данных, что и в предыдущем примере. В порядке иллюстрации, для обнаружения трисомии 13 в качестве эталонных хромосом выбирают хромосому 5 и хромосому 6.
Как можно видеть из табл. 1600 на фиг. 16, в пределах одного и того же образца последовательности, выровненные с хромосомой 13, существенно короче, чем последовательности, выровненные с хромосомой 5 и хромосомой 6, для всех случаев беременности с трисомией 13 (критерий суммы ранжиров Манна-Уитни, величина р<0,001). В качестве контроля включают эуплоидную беременность и беременность с трисомией 18. Как при эуплоидной беременности, так и при беременности с трисомией 18 доза хромосомы 13 нормальная. Как можно видеть из табл. 1600, анормальностей размеров такой статистической значимости для последовательностей, происходящих от хромосомы 13, при эуплоидной беременности и беременности с трисомией 18 не видно.
Кроме того, для всех случаев беременности с трисомией 13 в пределах одного и того же образца различие в среднем размере фрагментов между хромосомой 13 и хромосомой 5 больше 0,4 п.о., в то время как ни один из случаев без трисомии 13 не показывает различия больше 0,4 п.о. Подобным образом, для всех случаев беременности с трисомией 13 различие в среднем размере фрагментов между хромосомой 13 и хромосомой 6 больше 0,5 и.о., в то время как ни один из случаев без трисомии 13 не показывает различия больше 0,5 и.о.
B. Трисомия 18.
В порядке иллюстрации для обнаружения трисомии 18 в качестве эталонной хромосомы выбирают хромосому 14. Для случаев беременности без трисомии 18 в табл. 1700 на фиг. 17 можно видеть, что последовательности, происходящие от хромосомы 18, статистически значимо длиннее, чем последователь
- 17 034241 ности, происходящие от хромосомы 14 (критерий суммы ранжиров Манна-Уитни, величина р<0,005). Однако для случаев трисомии 18 последовательности хромосомы 18 несущественно длиннее, чем последовательности, выровненные с хромосомой 14. Случаи эуплоидии и трисомии 18 можно различить на основании различия между средним размером фрагментов ДНК из хромосом 18 и 14 с использованием пороговой величины 0 п.о. Такие наблюдения можно объяснить тем фактом, что дополнительная доза происходящих от плода последовательностей хромосомы 18, которые короче, чем материнские последовательности, будет снижать общий размер таких последовательностей, когда плод имеет трисомию 18. Это также будет подводить общее распределение по размерам для хромосомы 18 ближе к распределению для хромосомы 14.
VII. Примеры с использованием вклада в общую длину.
В примере, описанном ниже, эталонные хромосомы включают все аутосомы, за исключением хромосом 13, 18 и 21.
Фиг. 18 показывает различие в долях общей длины, вносимых короткими фрагментами, между хромосомой 18 и эталонными хромосомами (AF(18-Ref)) в 150 п.о. С использованием диагностической пороговой величины 0,0003 для AF(18-Ref) беременность с трисомией 18 можно обнаружить с чувствительностью 93,3% и специфичностью 100%.
Фиг. 19 показывает различие в долях общей длины, вносимых короткими фрагментами, между хромосомой 21 и эталонными хромосомами (AF(21-Ref)) в 150 п.о. С использованием диагностической пороговой величины 0,007 для AF(21-Ref) беременность с трисомией 21 можно обнаружить с чувствительностью 100% и специфичностью 100%.
VIII. Отбор эталонной хромосомы(хромосом).
Одну или несколько эталонных хромосом для неинвазивного пренатального обнаружения фетальной хромосомной анеуплоидии анализом размеров ДНК в материнской плазме можно отобрать различными способами, например с использованием способа 600. В различных воплощениях могут быть отобраны различные эталонные хромосомы.
Первым типом эталонных хромосом являются хромосомы, в которых фрагменты ДНК, происходящие от них, показывают распределение по размерам на специфической аналитической платформе (или аналитических платформах, которые близко соответствуют аналитическим действиям), схожее с распределением, полученным для хромосомы в материнской плазме, потенциально вовлеченной в анеуплоидию (например, хромосомы 21, 18 или 13). В одном воплощении в анализе такого типа фетальную хромосомную анеуплоидию обнаруживают, если расположение по размерам или абсолютный размер хромосомы из группы риска показывает статистически значимое уменьшение от эталонной хромосомы(хромосом). В других воплощениях можно измерить различие в средних или медианных размерах между фрагментами, происходящими от хромосомы из группы риска и фрагментами эталонной хромосомы(хромосом).
Вторым типом эталонных хромосом являются хромосомы, в которых фрагменты ДНК, происходящие от них, статистически короче, чем фрагменты, происходящие от хромосомы в материнской плазме, потенциально вовлеченной в анеуплоидию (например, хромосомы 21, 18 или 13), когда плод является эуплоидным. Такой вариант развития событий может встретиться, когда хромосома из группы риска является одной из самых длинных при измерении с использованием определенной платформы. Например, на фиг. 12 фрагменты ДНК в материнской плазме, происходящие от хромосомы 18, при измерении являются самыми длинными среди аутосом. Таким образом, можно отобрать эталонные хромосомы, фрагменты которых статистически значимо короче, чем хромосома 18. В одном воплощении в анализе такого типа фетальную хромосомную анеуплоидию обнаруживают в случае, если нельзя увидеть, что расположение по размерам или абсолютный размер хромосомы из группы риска статистически значимо отличается от эталонной хромосомы(хромосом). Например, такую стратегию используют для анализа, отображенного на фиг. 17, описанного выше.
Третьим типом эталонных хромосом являются хромосомы, в которых фрагменты ДНК в материнской плазме, происходящие от них, статистически длиннее, чем фрагменты, происходящие от хромосомы, потенциально вовлеченной в анеуплоидию (например, хромосомы 21, 18 или 13), когда плод является эуплоидным. Такой вариант может встретиться, когда хромосома из группы риска является одной из самых коротких при измерении с использованием определенной платформы. Таким образом, можно отобрать эталонные хромосомы, фрагменты которых статистически значимо длиннее, чем хромосома из группы риска. В одном воплощении в анализе такого типа фетальную хромосомную анеуплоидию обнаруживают в случае, если ранжировка по размеру, различие в ранжировке или абсолютном размере между эталонной хромосомой и хромосомой из группы риска возрастает.
Четвертым типом эталонных хромосом являются хромосомы со схожим содержанием GC. Содержание GC в хромосоме может влиять на считывание количественных данных при реакции секвенирования. По одному способу для минимизации возможной погрешности, являющейся результатом различия в содержании GC между хромосомами, следует отбирать соответствующие эталонные хромосомы со схожим содержанием GC. На фиг. 20 приводится содержание GC в различных хромосомах (NCBI build 36, версия 48). Хромосомы перечислены в порядке возрастания содержания GC. Теперь приводится пример
- 18 034241 использования эталонных хромосом со схожим содержанием GC.
Фиг. 21 показывает различие в долях общей длины, вносимых короткими фрагментами, между хромосомой 13 и эталонными хромосомами (AF(13-Ref)) в 150 п.о. В данном случае в порядке иллюстрации для анализа AF(13.Ref) в качестве эталонных хромосом используют хромосомы 3, 4, 5 и 6. Как видно на фиг. 20, хромосомы 3-6 имеют содержание GC 36,53-38,79%, что схоже с содержанием GC 37,10% для хромосомы 13. С использованием диагностической пороговой величины 0,0038 анализ AF обнаруживает случаи трисомии 13 с чувствительностью 95,7% и специфичностью 99,0%.
Предполагается, что проблема смещения GC может влиять на секвенирование на различных платформах в различной степени. Например, использование платформ, для которых не требуется предварительная амплификация, таких как платформа Helicos (Harris T.D. et al., Single-molecule DNA sequencing of a viral genome, Science, 2008, 320:106-9), нанопоры (Lund J., Parviz B.A., Scanning probe and nanopore DNA sequencing: core techniques and possibilities, Methods Mol. Biol., 2009, 578:113-22) или одномолекулярная система реального времени от Pacific Biosciences (Eid J. et al., Real-time DNA sequencing from single polymerase molecules, Science, 2009, 323:133-8), может допускать более широкий выбор группы эталонных хромосом.
IX. Использование концентрации фетальной ДНК.
При беременности с трисомией 13 (или другой трисомией) плод будет высвобождать в материнскую плазму дополнительную дозу фрагментов хромосомы 21, которые могут быть короче, чем фрагменты из материнских клеток. Можно ожидать, что концентрация таких более коротких фрагментов будет коррелировать с концентрацией фетальной ДНК в материнской плазме. Иными словами, при беременности с трисомией 21, чем выше долевая концентрация последовательностей, происходящих от хромосомы Y, тем меньше будет измеренный размер последовательностей, происходящих от хромосомы 21.
Фиг. 22 иллюстрирует результаты, полученные для случаев беременности, включающей плод мужского пола с трисомией 21. Как можно видеть на фиг. 22, действительно существует отрицательная корреляция между медианным размером последовательностей хромосомы 21 и процентом последовательностей, выровненных с хромосомой Y (r=-0,942, корреляция по Пирсону). Подобной тенденции также можно ожидать, если используют ранжировку по размеру хромосомы 21, т.е. номер по ранжиру хромосомы 21 будет повышаться, указывая на более короткие фрагменты, когда долевая концентрация фетальной ДНК возрастает. Так как корреляция существует, в воплощениях измерение концентрации фетальной ДНК можно использовать в качестве параметра в любом из способов, описанных в данном описании.
В анализе такого типа долевую и абсолютную концентрацию фетальной ДНК в материнской плазме можно измерить любым способом, известным специалистам в данной области техники. Если плод мужского пола, концентрацию фетальной ДНК можно измерить по долевой концентрации в материнской плазме последовательностей, происходящих от хромосомы Y. Другим примером является использование наследуемых от отца генетических маркеров, таких как однонуклеотидные полиморфизмы или полиморфизм простых тандемных повторов или инсерционно-делеционные полиморфизмы. Другим примером является использование эпигенетических маркеров, таких как участки, которые дифференцированно метилированы в фетальной и материнской ДНК (Poon et al., Clin. Chem., 2002, 48:35-41; Chi et al., Am. J. Pathol., 2007, 170:941-950; Chan et al., Clin. Chem., 2006, 52:2211-2218; патент США № 6927028). Вышеуказанные маркеры можно анализировать с использованием способов, известных специалистам в данной области техники, в том числе полимеразной цепной реакции (ПЦР), численной ПЦР, секвенирования, массивным параллельным секвенированием и нацеленным массивным параллельным секвенированием.
В одном воплощении можно изменять диагностический порог (например, пороговую величину для любого способа, описанного в данном описании) для обнаружения хромосомной анеуплоидии в отношении измеренной концентрации фетальной ДНК в материнской плазме. Таким образом, можно ожидать, что для образцов материнской плазмы с относительно высокой концентрацией фетальной ДНК степень укорачивания молекул ДНК в плазме, происходящих от хромосомы, потенциально вовлеченной в анеуплоидию, будет более значительной, чем для образцов материнской плазмы с относительно низкой концентрацией фетальной ДНК.
Так как AF соотносится с распределением по размерам, AF также показывает корреляцию с концентрацией фетальной ДНК. Фиг. 23 показывает корреляцию между AF(18-Ref) (хромосома 18 против эталонных хромосом) и концентрацией фетальной ДНК. В десяти из тридцати случаев Т18 вынашиваются плоды мужского пола, и, таким образом, долевую концентрацию фетальной ДНК можно оценить по долевой концентрации последовательностей хромосомы Y в указанных образцах. Существует значимая корреляция между AF(18-Ref) и долевой концентрацией последовательностей хромосомы Y (r=0,879, корреляция по Спирману). Такие результаты предполагают, что при беременности с трисомией 18 степень сужения в распределении по размерам последовательностей хромосомы 18 в материнской плазме коррелирует с долевой концентрацией фетальной ДНК в материнской плазме.
Случаи ниже диагностической пороговой величины представлены незаштрихованными кружочками, в то время как случаи с различием больше пороговой величины представлены заштрихованными кружочками. Два случая, в которых величины AF меньше диагностической пороговой величины (0,0003)
- 19 034241 (представлены незаштрихованными кружочками) имеют относительно низкие долевые концентрации фетальной ДНК при сравнении со случаями с величинами AF, превышающими 0,0003 (представлены заштрихованными кружочками). Низкие долевые концентрации фетальной ДНК могут быть причиной, по которой на фиг. 18 указанные два случая пропущены при выполнении анализа. Соответственно, в одном воплощении, если фетальная концентрация в образце низкая, классификацией можно пренебречь или провести ее снова.
Фиг. 23В показывает корреляцию между AF(21-Ref) (хромосома 21 против референсных хромосом) и концентрацией фетальной ДНК. В пяти из девяти случаев Т21 вынашиваются плоды мужского пола. Существует значимая корреляция между величиной AF(21-Ref) и долевой концентрацией последовательностей хромосомы Y (r=0,9, корреляция по Спирману).
Фиг. 23С показывает корреляцию между AF(13-Ref) (хромосома 13 против хромосом 3, 4, 5 и 6) и концентрацией фетальной ДНК. В четырнадцати из двадцати трех случаев трисомии 13 вынашиваются плоды мужского пола. Долевую концентрацию фетальной ДНК можно оценить по долевой концентрации последовательностей хромосомы Y в образцах. Существует положительная корреляция между AF(13-Ref) и долевой концентрацией последовательностей хромосомы Y (r=0,644, корреляция по Спирману). Случай, когда AF(13-Ref) меньше диагностической пороговой величины (0,0038), представлен незаштрихованными кружочками. Низкие долевые концентрации фетальной ДНК могут быть причиной, по которой на фиг. 21 указанный случай пропущен при выполнении анализа.
X. Сравнение анализа размеров и способа с подсчетом молекул.
Фиг. 24 показывает сравнение точности воплощения настоящего изобретения и другого способа неинвазивного обнаружения фетальных анеуплоидий (трисомии 13 и трисомии 18) с использованием анализа ДНК материнской плазмы. Данный пример иллюстрирует сравнение воплощений с использованием размеров против способа, основанного на подсчете молекул (заявка на патент США № 11/701686; Chiu et al., Trends Genet., 2009, 25:324-331; Chiu et al., Proc. Natl. Acad. Sci. USA, 2008, 105:20458-20463; Fan et al., Proc. Natl. Acad. Sci. USA, 2008, 105:16266-16271; публикация патента США 2009/0029377). Восемь образцов материнской плазмы (два эуплоидных, два с трисомией 18 и четыре с трисомией 13) анализируют с использованием способа, описанного Chiu et al. (Proc. Natl. Acad. Sci. USA, 2008, 105:2045820463). Для каждого случая описанный ранее способ с подсчетом молекул с использованием z-оценки по Chiu et al. сравнивают с результатами воплощений на основе анализа размеров.
Для вычисления z-оценки сначала в каждом случае вычисляют представленность, в процентах, хромосомы, представляющей интерес. Затем вычисляют среднее и стандартное отклонение хромосомной представленности для случаев для сравнения. В таком наборе данных случаи 1, 2, 5, 6, 7 и 8 используют в качестве эталонной группы для вычисления среднего и стандартного отклонения представленности хромосомы 18. Случаи 1, 2, 3 и 4 используют в качестве эталонной группы для вычисления среднего и стандартного отклонения представленности хромосомы 13. Определяют z-оценку как число стандартных отклонений от среднего группы для сравнения. Значимую сверхпредставленность хромосомы определяют как z-оценку <3. В случаях 3 и 4 вынашивается плод с трисомией 18, и в их плазме сверхпредставлены фрагменты хромосомы 18. Случаи 5, 6, 7 и 8 являются случаями вынашивания с трисомией 13, но только 5 и 7 показывают сверхпредставленность хромосомы 13 в их плазме. Случаи 6 и 8 не показывают значимой сверхпредставленности хромосомы 13 в материнской плазме, несмотря на вынашивание плода с трисомией 13.
Значимое уменьшение размеров фрагментов ДНК хромосомы обнаруживают путем сравнения размера всех фрагментов, выровненных с определенной хромосомой, с размерами фрагментов, выровненных с эталонной хромосомой. Используют для сравнения критерий Манна-Уитни, и величину Р<0,0001 определяют как наличие значимого различия. Для анализа размеров фрагментов хромосомы 13 эталонной хромосомой является хромосома 5. Для всех случаев с эуплоидным плодом или плодом с трисомией 18 размер фрагментов хромосомы 13 значимо не отличается от размера фрагментов хромосомы 5. Для четырех случаев с плодом с трисомией 13 фрагменты значимо короче, чем фрагменты хромосомы 5, что подразумевает, что размер фрагментов хромосомы 13 меньше по сравнению с размерами в случае отсутствия трисомии 13. Таким образом, все четыре случая трисомии 13 правильно идентифицируются по настоящему изобретению при сравнении с двумя из четырех по способу с z-оценкой.
Для анализа размеров фрагментов хромосомы 18 эталонной хромосомой является хромосома 12. Для всех случаев вынашивания эуплоидного плода или плода с трисомией 13 фрагменты хромосомы 18 значимо длиннее, чем фрагменты хромосомы 12. Для двух случаев вынашивания плода с трисомией 18 размеры фрагментов хромосомы 18 значимо не отличаются от размеров фрагментов хромосомы 12, что подразумевает, что размер фрагментов хромосомы 18 уменьшается при сравнении со случаями вынашивания плода без трисомии 18. Иными словами, оба случая трисомии 18 классифицированы правильно.
XI. Обнаружение полиморфизмов и диагностика генетических нарушений.
Анализ размеров ДНК материнской плазмы также можно использовать для неинвазивного анализа генотипа плода. Генотип плода можно использовать для определения того, наследует ли плод мутированный ген, имеет ли дисбаланс определенного аллеля или другой дисбаланс последовательности, или
- 20 034241 для других целей. В таких воплощениях один аллель может представлять собой эталонную геномную локацию (последовательность), а отличающийся аллель может представлять собой испытываемую геномную локацию. Таким образом, любой способ с использованием эталонной последовательности также можно применить для определения генотипа и дисбаланса последовательностей.
В одном воплощении дисбаланс последовательности (и таким образом, возможно, генотип) можно определить по тому, существует ли или нет различие в размерах (дисбаланс) между аллелями в материнском образце (например, когда мать является гетерозизотной по аллелю). Например, если различия в профиле размеров между аллелями в образце не имеется, тогда плод можно определить как имеющий тот же генотип, что у матери. Как другой пример, если различие в профиле размеров между аллелями в образце имеется, тогда плод можно определить как имеющий генотип, отличающийся от генотипа матери.
В последующих примерах мать является гетерозиготной (т.е. с одной копией аллеля N и одной копией аллеля М, что обозначается NM) для определенного локуса. Буквы N и М номинально представляют аллели дикого типа (N для нормальных) и мутантные (М для мутантных) соответственно. Однако аллели N и М могут соответствовать любым двум различным аллелям, а не обязательно дикому типу и/или мутанту. В одном воплощении М можно рассматривать как последовательность хромосомы из группы риска и N как эталонная последовательность. В данном контексте для определения генотипа можно предположить применение любого из вышеуказанных способов с использованием эталонной последовательности.
У небеременной женщины усредненный размер молекул, содержащих оба аллеля, может быть одинаковым. Однако в плазме беременной женщины существует смесь молекул ДНК матери и плода. Молекулы ДНК, происходящие от матери, длиннее, чем происходящие от плода. Если мать и плод имеют два аллеля (т.е. оба аллеля N и М), оба указанных аллеля будут иметь равный вклад длинных и коротких молекул ДНК. Таким образом, полученное распределение по размерам аллелей N и М будет одинаковым. Напротив, если генотипы матери и плода различаются, например если мать является NM, а плод является ММ, тогда распределение по размерам аллелей N и М будет различным. Иными словами, на распределение по размерам двух аллелей в плазме может повлиять генотип плода. Фиг. 25А-25С показывают диаграммы для различных вариантов генотипов беременной женщины и плода согласно воплощениям настоящего изобретения.
На фиг. 25А плод имеет генотип NN и генотип матери NM. Длина столбца 2510 является показателем усредненного (среднего) размера фрагментов, которые являются фрагментами одного из двух аллелей матери и плода соответственно. Как описано выше, плод имеет меньший средний размер, чем мать. Таким образом, длинные столбцы представляют материнскую ДНК, и короткие столбцы представляют фетальную ДНК.
Поскольку как мать, так и плод вносят вклад в аллель N, в то время как в аллель М вносит вклад только мать, распределение по размерам молекул с аллелем N будет более узким по сравнению с распределением молекул с аллелем М. Иными словами, у беременной женщины, которая имеет генотип NM, более узкое распределение по размерам в случае аллеля N по сравнению с аллелем М будет предполагать, что генотип плода NN. Таким образом, можно идентифицировать, что плод имеет два аллеля дикого типа (N), когда распределение по размерам (например, средний размер) N более узкое, чем для М, по определенной пороговой величине (например, величине в процентах или абсолютной величине).
На фиг. 25В плод имеет генотип NM. Как мать, так и плод вносят вклад в аллели N и М. В результате распределение по размерам для молекул с аллелями М и N является одинаковым. У беременной женщины, которая имеет генотип NM, одинаковое распределение по размерам для аллелей М и N будет указывать, что генотип плода NM. Таким образом, можно идентифицировать, что плод имеет один аллель дикого типа (N) и один мутантный (М) аллель, когда распределение по размерам (например, средний размер) N примерно эквивалентно распределению М при определенной пороговой величине (например, в процентах или величине).
На фиг. 25С плод имеет генотип ММ. Поскольку как мать, так и плод вносят вклад в аллель М, в то время как в аллель N вносит вклад только мать, распределение по размерам молекул с аллелем М будет более узким по сравнению с аллелем N. У беременной женщины, которая имеет генотип NM, более узкое распределения по размерам в случае аллеля М, чем для аллеля N, может указывать, что генотип плода ММ. Таким образом, можно идентифицировать, что плод имеет два мутантных аллеля (М), когда распределение по размерам (например, средний размер) М более узкое, чем для N, при определенной пороговой величине (например, величине в процентах или величине).
Способ также можно использовать для анализа ситуаций, когда мать является гомозиготной, например, NN или ММ. Если плод имеет другой генотип, распределение по размерам материнского образца также будет изменяться, и таким образом можно определить генотип плода. Также, если распределение по размерам не изменяется, генотип можно определить как такой же, как у матери, как описано выше для случая, когда мать представляет собой гомозиготный случай.
В некоторых воплощениях определение того, имеется ли дисбаланс, или иначе, отношение к генотипу матери (например, один N для одного М может означать отсутствие дисбаланса) можно выполнить, используя пороговые величины. Например, если имеется достаточно большое отклонение (например, в
- 21 034241 процентах) от генотипа матери, тогда плод можно определить как наследующий аллель с более узким распределением по размерам. В одном воплощении величина порога может зависеть от процентного содержания фетальных нуклеиновых кислот в материнском образце. Если процент фетальных нуклеиновых кислот выше, тогда можно ожидать большее отклонение и таким образом, можно использовать большую величину порога (например, в случае различия в распределении по размерам одного аллеля относительно другого. Если процент фетальных нуклеиновых кислот меньше, тогда можно ожидать меньшего отклонения и, таким образом, можно использовать меньшую величину порога.
В одном воплощении для определения того, какой аллель матери может иметь распределение по размерам, измененное из-за фетальных нуклеиновых кислот, можно использовать генотип отца. В случаях, когда отец является гомозиготным для генотипа, это может создать возможность для сужения возможного генотипа плода просто до аллеля, наследуемого от матери, так как известно, какой аллель пришел от отца. После сужения определение генома плода может быть более точным, так как может потребоваться испытывать только две возможности. В одном воплощении используют одну и ту же величину порога, несмотря на то, что какой генотип наследуется от отца. В другом воплощении можно использовать различные пороговые величины.
В различных воплощениях любое распределение по размерам, упомянутое в данном описании, можно использовать при таких определениях дисбаланса последовательностей. В некоторых воплощениях также можно обеспечить уровень точности. Например, также можно использовать классификацию неопределенный, помимо классификации дисбаланса и баланса. В таком случае некоторые определения можно определить с высокой степенью достоверности, в то время как величины в среднем участке могут требовать дополнительных экспериментальных точек.
XII. Анализ размеров для определения гаплотипа, унаследованного плодом.
Применение анализа размеров также можно расширить до определения, какой материнский гаплотип переходит к плоду. Гаплотип может относиться к аллелям во многих локусах. Определение термина гаплотип можно найти в разделе Определения настоящего описания. Гаплотип плода можно использовать для определения того, наследует ли плод мутированный ген, имеет ли дисбаланс определенного аллеля или для других целей. Таким образом, гаплотип можно использовать так же, как генотип, но так как существует больше локусов, можно использовать меньший объем образца крови для достижения такой же, или даже лучшей статистической достоверности определения гаплотипов плода. В одном аспекте дисбаланс последовательности можно определить относительно гаплотипа матери. В данном случае гаплотип может быть представлен как ряд полиморфизмов, например SNP, каждого в определенной локации в геноме, при которых известно изменение последовательности.
В одном воплощении предлагается способ определения гаплотипа плода путем анализа дисбалансов последовательностей в материнской плазме. В одном аспекте для определения дисбаланса последовательностей используют показатели разделения (например, различия) в профилях размеров между гаплотипами. В одном воплощении гаплотипы матери (например, Hap I и Hap II) определяют путем анализа (например, секвенирования (Не D. et al., Bioinformatics, 2010, 26:i183-i190) или одномолекулярного гаплотипирования (Ding С. et al., Proc. Natl. Acad. Sci. USA, 2003, 100:7449-7453 и Xiao M. et al., Nat. Methods, 2009, 6:199-201) материнского образца (например, образца, который не содержит фетальных нуклеиновых кислот). В другом воплощении гаплотип(ы) матери можно определить с использованием анализа образцов от родителей матери, сиблингов, предыдущего ребенка или других родственников. В еще одном воплощении в случае полиморфизмов при сильном неравновесном сцеплении, зная генотип матери в одном локусе, можно предположить генотип в других локусах, например, когда аллели нормально появляются в одной и той же последовательности, т.е. гаплотип. Таким образом, гаплотип матери может быть потенциально определен из генотипа матери. Генотип в более чем одном локусе также может быть определен, где каждый определенный генотип может предполагать генотипы в других локусах, и, следовательно, устанавливается гаплотип.
В одном воплощении также определяют генотип отца. Такую информацию можно использовать для определения, если отец является гомозиготным или гетерозиготным при определенных SNP. Можно осуществить прямое определение отцовского аллеля в каждом локусе. Соответственно, можно определить, если отцовский аллель является тем же, что аллель Hap I или Hap II матери, обозначение SNP типа α или типа β.
В другом воплощении также определяют гаплотип отца. Гаплотип отца можно определить анализом (например, секвенированием (Не D. et al., Bioinformatics, 2010, 26:i183-i190) или одномолекулярным гаплотипированием (Ding С. et al., Proc. Natl. Acad. Sci. USA, 2003, 100:7449-7453 и Xiao M. et al., Nat. Methods, 2009, 6:199-201) отцовского образца или анализом образцов от родителей отца, сиблингов, предыдущего ребенка или других родственников. С другой стороны, в случае полиморфизмов при сильном неравновесном сцеплении, зная генотип отца в одном локусе, можно предположить генотип в других локусах, например, когда аллели нормально появляются в одной и той же последовательности, т.е. гаплотип. Генотип в более чем одном локусе также может быть определен, где каждый определенный генотип может предполагать генотипы в других локусах, и, следовательно, устанавливается гаплотип.
- 22 034241
Другим применением таких воплощений может быть определение, существует ли или не существует дисбаланс последовательности (например, путем обнаружения различия в распределении по размерам) в материнском образце, содержащем фетальные нуклеиновые кислоты, путем анализа SNP, где как отец, так и мать являются гетерозиготными. Генотип отца или гаплотип посредством этого выводится на основании того, существует или не существует дисбаланс последовательности.
Фиг. 26 показывает пример, когда мать является гетерозиготной, а отец является гомозиготным в анализируемых локусах SNP. Для того чтобы осуществить анализ размеров, средоточение может быть на подмножестве SNP, где мать является гетерозиготной, а отец является гомозиготным. Две гомологичные хромосомы матери обозначают Hap I и Hap II соответственно. Для каждого из указанных SNP можно определить, который аллель из двух материнских аллелей располагается в Hap I и который в Hap II. SNP определяют как тип α, если отцовские аллели идентичны материнскому аллелю в Hap I, и как тип β, если отцовские аллели идентичны материнскому аллелю в Hap II. Дополнительное описание определений генома плода можно найти в заявке Геномный анализ плода из материнского биологического образца, упомянутой выше.
Как только гаплотип матери и генотипы или гаплотип отца известны, можно анализировать распределение по размерам фрагментов, ассоциированных с SNP, для определения гаплотипа плода путем идентификации, существует ли дисбаланс последовательности в подмножестве SNP. В альтернативном воплощении генотип или гаплотип отца неизвестен наверняка, но, тем не менее, может быть установлен с использованием, например, статистической процедуры, как вероятный генотип или гаплотип отца, на основании, например, повторяемости известных генотипов или гаплотипов в испытываемой популяции. Затем определяют дисбаланс последовательности (определенный через дисбаланс размеров) для каждого SNP, например, так, как описано в разделе X.
Например, если отец является гомозиготным для аллеля в Hap I (тип а), тогда дисбаланса размеров не будет (плод наследует Hap II от матери и, таким образом, является гетерозиготным для Hap I и Hap II именно как мать) или дисбаланс размеров будет иметь место, когда Hap I имеет более узкое распределение по размерам (плод наследует Hap I от матери и, таким образом, является гомозиготным для Hap I). Если отец является гомозиготным для Hap II (тип β, как описано ниже), тогда дисбаланса не будет (плод наследует Hap I от матери и, таким образом, является гетерозиготным для Hap I и Hap II) или дисбаланс будет иметь место, когда Hap II имеет более узкое распределение по размерам (плод наследует Hap II от матери и, таким образом, является гомозиготным для Hap I). Также можно использовать промежуточную классификацию или изменяющиеся уровни достоверности между балансом и дисбалансом. Типично можно использовать схожие пороговые величины для любого типа. В различных воплощениях можно использовать любое распределение по размерам, указанное в данном описании.
В одном воплощении можно анализировать распределение по размерам фрагментов каждой из множества локаций SNP для определения двух гаплотипов плода. Например, различие между распределением по размерам фрагментов для аллелей SNP в гаплотипе можно сравнить с распределением по размерам фрагментов для аллелей SNP в другом гаплотипе. Статистические результаты можно анализировать различными путями, например осуществляя определение для каждого SNP и затем принимая большинство (баланс, дисбаланс, и может быть включая промежуточное состояние) за гаплотип. Как другой пример размеры можно агрегировать по SNP (например, для получения распределения по усредненным или медианным размерам, которое сравнивают с пороговой величиной) или можно использовать комбинацию двух способов. Другое воплощение может представлять собой использование экстремума частных значений, например наименьшее различие для определенного SNP.
Фиг. 27 показывает пример, когда плод наследует Hap I от матери, когда гаплотип отца такой, как показанный на фиг. 26. Для SNP типа α (заключенных в незаштрихованные прямоугольники) плод будет наследовать от отца аллели, идентичные аллелям, расположенным в материнском Hap I. Следовательно, плод будет гомозиготным для аллелей в Hap I. В результате в материнской плазме распределение по размерам аллелей в Hap I будет более узким, чем аллеля в Hap II. Для SNP типа β (заключенных в заштрихованные прямоугольники) плод будет наследовать от отца аллели, идентичные аллелям, расположенным в материнском Hap II. Следовательно, плод будет гетерозиготным. В результате в материнской плазме распределение по размерам аллелей в Hap I и Hap II будет одинаковым.
В одном воплощении SNP одного и того же типа (типа α или типа β) можно анализировать вместе. Для SNP типа α распределение по размерам молекул, содержащих аллели в Hap I, будет более узким, чем распределение по размерам молекул, содержащих аллели в Hap II. Для SNP типа β распределение по размерам молекул, содержащих аллели в Hap I и Hap II, будет одинаковым. Иными словами, если распределение по размерам молекул, содержащих аллели в Hap I, будет более узким, чем молекул, содержащих аллели в Hap II, плод является гомозиготным для Hap I. Если распределение по размерам молекул, содержащих Hap I и Hap II, будет одинаковым, плод является гетерозиготным.
- 23 034241
Пример.
Следующий эксперимент используют для проверки точности анализа определения гаплотипа, унаследованного плодом. Привлекли пару, пришедшую в акушерскую клинику, для проведения пренатальной диагностики β-талассемии. Образцы крови берут у отца и матери. У матери образец крови берут перед взятием образца хориальных ворсинок (CVS) на 12 неделе беременности. Часть образца CVS хранят для эксперимента.
Экстрагируют ДНК из лейкоцитной пленки отца и матери и образца CVS. Эти образцы ДНК подвергают анализу на системе Affymetrix Genome-Wide Human SNP Array 6.0 для определения генотипов отца, матери и плода. В этом эксперименте данные по CVS используют для установления гаплотипа матери. Однако в клиническом осуществлении испытания гаплотип матери можно установить другими способами, как описано выше. Данные по CVS также используют для подтверждения точности определения с использованием способов, для которых CVS не требуется.
В описываемой иллюстрации сосредотачиваются на информативном подмножестве SNP, в которых мать является гетерозиготной, а отец является гомозиготным. В таком подмножестве SNP генотипы пары и плода используют для конструирования гаплотипов матери. Определяют, что гаплотип I (Нар I) представляет собой ряд аллелей, которые мать передает плоду, в то время как гаплотип II (Нар II) представляет собой ряд аллелей, которые плод не получает от матери.
Затем информативные SNP делят на два подтипа, а именно, тип α и тип β. Для типа α отцовские аллели идентичны материнскому аллелю в Hap I. В случае таких SNP плод будет наследовать от родителей один и тот же аллель (аллель в Hap I), и, следовательно, плод будет гомозиготным для SNP в Hap I. Для типа β отцовские аллели идентичны материнскому аллелю в Hap II. В случае таких SNP плод будет наследовать аллели в Hap I от матери и другие аллели (идентичные аллелям в Hap II) от отца, и, следовательно, плод будет гетерозиготным.
ДНК, экстрагированную из плазмы матери, подвергают массивному параллельному секвенированию с использованием платформы геномного анализатора Illumina. Выполняют секвенирование спаренных концов молекул ДНК из плазмы. Каждую молекулу секвенируют по каждому концу на 50 п.о., что составляет 100 п.о. на молекулу. Два конца каждой последовательности выравнивают с геномом человека, с немаскированными повторами (Hg18 NCBI.36 downloaded from UCSC genome.ucsc.edu), с использованием программы SOAP2 от Beijing Genomics Institute at Shenzhen (soap.genomics.org.cn/) (Li R. et al., Bioinformatics, 2009, 25(15): 1966-7).
В одном воплощении статистический показатель доли общей длины, вносимой короткими фрагментами для гаплотипов, используют для определения того, какой гаплотип матери передается плоду. Как пример, используют хромосому 22 для иллюстрации того, как можно использовать анализ размеров для установления того, какой гаплотип матери передается плоду. Сначала хромосому 22 делят на несколько сегментов, причем каждый сегмент содержит 50 информативных SNP, в которых мать является гетерозиготной, а отец является гомозиготным (хромосома 22 и сегменты являются примерами последовательностей). Для каждого сегмента фрагменты (примеры молекул, которые являются частью последовательностей), перекрывающие такие информативные SNP, делят на две группы, а именно Hap I и Hap II, соответственно, которому из двух гаплотипов матери такие фрагменты соответствуют. Для каждого сегмента определяют сумму общей длины всех фрагментов, картирующихся к Hap I матери и Hap II матери. Затем подобным образом в каждом сегменте определяют сумму общей длины коротких фрагментов, картирующихся к Hap I и Hap II матери. С целью иллюстрации в данном примере для вычисления общей длины коротких фрагментов как короткие определяют фрагменты в 150 п.о. или более короткие. Из полученных длин в каждом сегменте для фрагментов ДНК, картирующихся к Hap I и Hap II, можно вычислить доли, вносимые короткими фрагментами.
Фиг. 28 показывает таблицу, иллюстрирующую анализ размеров для SNP типа а на хромосоме 22 согласно воплощениям настоящего изобретения. AF(Hap I-Hap щ представляет собой различие между Hap I и Hap II в доли общей длины, вносимой короткими фрагментами. Когда последний сегмент, который состоит только из 28 SNP, исключают, AF(Hap I-Hap щ колеблется от 0,0288 до 0,0701. Положительные значения AF(Hap I-Hap II) показывают, что величины F Hap I всегда больше, чем величины Hap II. Так как величина F определяется как доля общей длины, вносимая короткими фрагментами, более высокая величина F показывает, что более высокая доля общей длины вносится короткими фрагментами. Иными словами, такие результаты показывают, что фрагменты ДНК, содержащие аллели в Hap I, короче, чем фрагменты, содержащие аллели в Hap II, для каждого из участков, состоящих 50 анализируемых SNP. Это показывает, что распределение по размерам Hap I более узкое, чем распределение по размерам Hap II. Следовательно, можно установить, что плод является гомозиготным для аллелей в Hap I. Как указывалось выше, в одном воплощении можно провести классификацию для каждого сегмента на основании показателя разделения (например, AF) между двумя геномными локациями в Hap I и Hap II, и затем можно провести общую классификацию на основании соответствующей классификации сегментов. В другом воплощении можно определить общий показатель разделения (например, усредненный показатель разделения) из показателей разделения для каждого сегмента, и такой общий статистический показатель можно использо
- 24 034241 вать для определения классификации.
В одном воплощении для определения можно использовать пороговую величину примерно 0,02, если существует дисбаланс. Если используют медианное или усредненное AF, можно использовать большую пороговую величину и сохранить точность. Пороговые величины также можно использовать для промежуточных результатов, например, при необходимости дополнительного анализа промежуточным может быть интервал от 0,015 до 0,025.
Фиг. 29 показывает таблицу, иллюстрирующую анализ размеров для SNP типа β на хромосоме 22 согласно воплощениям настоящего изобретения. AF(Hap I-Hap п) представляет собой различие в доли общей длины, вносимой короткими фрагментами, для Hap I и Hap II. Величины AF(Hap I-Hap щ колеблются от -0,0203 до 0,0207 со средним 0,0003. Небольшая величина AF(Hap I-Hap щ совместима с одинаковым распределением по размерам фрагментов, картирующихся к Hap I и Hap II. Таким образом, можно установить, что плод является гетерозиготным для Hap I и Hap II. Так как тип SNP β определяется как SNP, в которых отцовские аллели идентичны материнским аллелям в Hap I, такой результат означает, что плод наследует Hap I от матери.
Фиг. 30 показывает график AF(Hap I-Hap щ для SNP типа α и типа β на хромосоме 22 согласно воплощениям настоящего изобретения. Для SNP типа α и распределение по размерам фрагментов Hap I более узкое, чем распределение по размерам фрагментов Hap II, что выражается в величинах AF(Hap I-Hap щ больше нуля. Для SNP типа β не имеется различия в распределении по размерам фрагментов Hap I и Hap II; следовательно, величины AF(Hap I-Hap щ собираются вблизи 0. С использованием порога в 0,025 анализом AF(Hap I-Hap II) можно правильно установить наследование плодом для всех 13 сегментов типа α и 21 сегмента типа β.
XIII. Пример использования прицельного секвенирования.
Следующий пример демонстрирует, что диагностический подход на основе размеров по воплощениям настоящего изобретения можно применить в формате прицельного секвенирования. В таком формате для секвенирования специфически намечаются участки генома, представляющие интерес для диагностики. Такой формат имеет преимущество в том, что секвенирование фокусируется на участке, представляющем интерес, в отличие от ситуации, включающей случайное секвенирование, когда часть производительности секвенирования используют для участков, которые не имеют непосредственного отношения к применению в диагностике. Таким образом, можно ожидать, что формат прицельного секвенирования повысит производительность и снизит затраты на систему. Прицельное секвенирование можно выполнять с использованием любого формата, известного специалистам в данной области техники, включая систему захвата в фазе раствора (например, систему Agilent SureSelect), систему захвата в твердой фазе (например, систему Roche NimbleGen) или мишень-специфическую амплификацию (например, систему RainDance).
Образцы крови берут у восьми беременных женщин во время их первого триместра. В каждом случае экстрагируют ДНК из 3,2 мл плазмы с помощью мининабора DSP DNA Blood (Qiagen). Кариотипирование, выполненное на образцах хориальных ворсин (собранных после взятия образцов материнской крови), показывает, что четыре плода имеют Т21 (UK229, UK510, UK807, PW421), в то время как другие четыре являются эуплоидами мужского пола (PW226, PW263, PW316, PW370).
В каждом случае используют 5-30 нг ДНК для конструирования библиотеки ДНК с помощью набора для получения образцов спаренных концов (Illumina) согласно протоколу получения образцов для секвенирования с иммунопреципитацией с хроматином, представленного изготовителем. ДНК с лигированным адептером очищают непосредственно с использованием спин-колонок, предоставленных в наборе для очистки продуктов ПЦР QIAquick (Qiagen), без дополнительного отбора по размерам. Затем амплифицируют ДНК с лигированным адептером с использованием 15-циклов ПЦР со стандартными праймерами. Праймеры представляют собой праймеры для ПЦР РЕ 1.0 и 2.0 от Illumina. Библиотеки ДНК определяют количественно с использованием спектрофотометра NanoDrop ND-1000 (NanoDrop Technologies) и анализируют в биоанализаторе 2100 с использованием набора DNA 1000 (Agilent) для контроля за распределением по размерам. Получают 0,6-1 мкг библиотеки амплифицированной ДНК плазмы для каждого образца с усредненным размером примерно 290 п.о.
Библиотека SureSubset Human All Exon полученная от Agilent и содержит 37,8 Мм человеческих экзонов (каталожный номер 5190-2310). Для всех восьми случаев в данном исследовании 500 нг библиотеки амплифцированной ДНК плазмы в каждом случае инкубируют с зондами захвата в течение 24 ч при 65°C согласно инструкциям изготовителя. После гибридизации захваченные мишени отбирают путем сбора биотинилированных гибридов зонд/мишень с использованием магнитных шариков, покрытых стрептавидином (Dynal DynaMag-2 Invitrogen), и очищают с использованием набора для очистки MinElute PCR (Qiagen). Наконец, меченые библиотеки ДНК обогащают 12-циклами ПЦР амплификации с праймерами SureSelect GA РЕ от Agilent. Продукты ПЦР очищают с использованием набора для очистки продуктов ПЦР QIAquick (Qiagen).
Восемь пар библиотек, обогащенных и необогащенных мишенью, загружают на 16 полос двухпроточных ячеек и затем секвенируют с помощью геномного анализатора Iix (Illumina) с использованием
- 25 034241
п.о. х 2 в формате спаренных концов. Все данные по 36 п.о. выравнивают с эталонным геномом человека с немаскированными повторами (Hg18) (http://genome.ucsc.edu) с использованием программы выравнивания коротких олигонуклеотидов 2 (http://soap.genome.org.cn./). Данные по размерам фрагментов по спаренным концам определяют как колеблющиеся от 40 п.о. до 600 п.о. Размер каждого секвенированного фрагмента ДНК выводят из координат самых дальних нуклеотидов на обоих концах.
Анализ размеров для пренатального обнаружения трисомии 21 у плода.
В данном примере доли общей длины, вносимые короткими фрагментами, вычисляют для хромосомы 21 и эталонных хромосом, представленных F21 и Fref соответственно. Эталонные хромосомы включают все аутосомы, за исключением хромосом 13, 18 и 21. Общую длину вычисляют суммированием всех фрагментов ДНК в 600 п.о. или меньше. Различие между хромосомой 21 и эталонными хромосомами в долях длины (AF), вносимых короткими фрагментами, вычисляют как F21 - Fref.
Фиг. 31А представляет собой таблицу, которая предоставляет анализ размеров согласно воплощениям настоящего изобретения ДНК плазмы без обогащения мишенью. В различных столбцах приводится общая длина фрагментов <150 п.о. для хромосомы 21, общая длина фрагментов <600 п.о. для хромосомы 21 и их отношение как F21. В других столбцах приводится общая длина фрагментов <150 п.о. для эталонных хромосом, общая длина фрагментов <600 п.о. для эталонных хромосом и их отношение как Fref. В последнем столбце приводится различие между двумя долями AF.
Фиг 31В представляет собой таблицу, которая предоставляет анализ размеров согласно воплощениям настоящего изобретения ДНК плазмы с обогащением мишенью. Столбцы на фиг. 31 имеют тот же формат данных, как в таблице на фиг. 31А.
Фиг. 32 представляет собой график AF для Т21 и эуплоидных образцов с или без обогащения мишенью. Для образцов без обогащения мишенью с использованием величины порога для AF 0,005 образцы плазмы при беременности с Т21 и эуплоидной беременности можно дифференцировать с точностью 100%. Для образцов с обогащением мишенью с использованием величины порога для AF 0,004 образцы плазмы при беременности с Т21 и эуплоидной беременности можно дифференцировать с точностью 100%. Данный пример демонстрирует, что анализ на основе размеров можно выполнять с использованием нацеленного секвенирования. Для обнаружения Т21 может быть выгодным использование нацеленного секвенирования для хромосомы 21 и эталонной хромосомы, так что 50% секвенирования направлено на первую хромосому и остальное направлено на последнюю. Такое исполнение может уменьшить расход производительности секвенирования на участки, которые не относятся непосредственно к обнаружению Т21. Такое исполнение может позволить секвенировать образцы от нескольких пациентов с использованием мультиплексного секвенирования (например, путем использования индексированного секвенирования или секвенирования со штриховым кодом).
Любые из компонентов программного обеспечения или функций, описанных в данной заявке, могут быть осуществлены в виде прикладных программ, выполняемых процессором, с использованием любого подходящего машинного языка, такого как, например, Java, C++ или Perl, с использованием, например, обычных или объектно-ориентированных методов. Прикладные программы могут храниться как набор инструкций или команд на машиночитаемым носителе информации для хранения и/или передачи данных, подходящие носители включают запоминающее устройство с произвольной выборкой (ЗУПВ), постоянное запоминающее устройство (ПЗУ), магнитный носитель, такой как жесткий диск или дискета, или оптический носитель, такой как компактный диск (CD) или DVD (цифровой универсальный диск), флэш-запоминающее устройство и т.п. Машиночитаемый носитель информации может представлять собой любую комбинацию таких устройств для хранения и передачи информации.
Такие программы также могут кодироваться и передаваться с использованием несущих сигналов, адаптированных для переноса по проводным, оптическим и/или беспроводным сетям, соответствующим различным протоколам, включая Интернет. Как таковой, машиночитаемый носитель информации согласно воплощению настоящего изобретения может быть создан с использованием сигнала данных, кодированного такими программами. Удобочитаемые компьютерные носители информации, кодированные прикладными программами, могут быть собраны в пакет с совместимым устройством или предоставлены отдельно от других устройств (например, через загрузку в Интернет). Любой такой машиночитаемый носитель информации может быть размещен на или в рамках одного компьютерного программного продукта (например, жесткого диска или всей компьютерной системы) и может быть представлен на или в рамках различных компьютерных программных продуктов в системе или сети. Компьютерная система может включать монитор или другой подходящий дисплей для предоставления пользователю любых результатов, указанных в данном описании.
Пример компьютерной системы показан на фиг. 33. Подсистемы, показанные на фиг. 33, взаимосвязаны через системную магистраль 3375. Показаны дополнительные подсистемы, такие как принтер 3374, клавиатура 3378, фиксированный диск 3379, монитор 3376, которые подсоединены к адаптеру дисплея 3382, и другие подсистемы. Периферийные устройства и устройства ввода/вывода (I/O), которые соединены с контроллером I/O, могут быть соединены с компьютерной системой любыми способами, известными в технике, такими как последовательный порт 3377. Например, последовательный порт 3377 или
- 26 034241 внешний интерфейс 3381 можно использовать для соединения компьютера с глобальной сетью, такой как Интернет, вводным устройством мышью или сканером. Взаимосвязь через магистраль позволяет центральному процессору 3373 взаимодействовать с каждой подсистемой и управлять выполнением команд из памяти системы 3372 или с фиксированного диска 3379, а также обмен информацией между подсистемами. Память системы 3372 и/или фиксированный диск 3379 могут заключать в себе машиночитаемый носитель информации.
Компьютерная система может включать несколько одинаковых компонентов или подсистем, например, соединенных вместе наружным интерфейсом 3381 или внутренним интерфейсом. В некоторых воплощениях компьютерные системы, подсистема или приборы могут взаимодействовать по всей сети. В таких случаях один компьютер может рассматриваться как пользователь, а другой компьютер как обслуживающее устройство, где каждый может представлять собой часть компьютерной системы. Пользователь и обслуживающее устройство могут включать, каждый, несколько систем, подсистем или компонентов.
Специфические детали определенных воплощений можно комбинировать любым подходящим способом без отхода от сущности и объема воплощений изобретения. Однако другие воплощения изобретения могут относиться к специфическим воплощениям, касающимся каждого отдельного аспекта, или специфическим комбинациям таких отдельных аспектов.
Приведенное выше описание примеров воплощений изобретения представлено в целях иллюстрации и описания. Оно не предназначено для того, чтобы изобретение точно исчерпывалось или ограничивалось описанным, и в свете вышеизложенного возможны многие модификации и изменения. Воплощения выбраны и описаны с целью наилучшего пояснения принципов изобретения и его практического применения, посредством которых другие специалисты в данной области техники смогут наилучшим образом использовать изобретение в различных воплощениях и с различными модификациями, которые подходят для определенного рассматриваемого применения.
Все публикации, патенты и заявки на патенты, цитированные в данном описании, включены в него в качестве ссылок.

Claims (14)

1. Способ пренатальной диагностики количественного дисбаланса последовательности в биологическом образце, полученном от беременной женщины, где биологический образец содержит фрагменты ДНК плода и указанной женщины, включающий для каждого из множества фрагментов ДНК в данном биологическом образце измерение размера фрагмента ДНК;
идентификацию того, из какой геномной области происходит данный фрагмент ДНК;
определение с использованием компьютерной системы показателя распределения по размерам фрагментов ДНК, определенных как происходящих из указанной геномной области, как раскрыто в описании изобретения;
сравнение показателя распределения по размерам с пороговым значением, раскрытым в описании изобретения; и на основании указанного сравнения установление того, существует ли количественный дисбаланс последовательности у плода для указанной геномной области, причем идентифицируют указанный дисбаланс, если показатель распределения по размерам значимо отличается от эталонной величины, как определяют с помощью порогового значения.
2. Способ по п.1, дополнительно включающий определение материнского генотипа указанной беременной женщины в локусе геномной области, причем материнский генотип гетерозиготен по аллелю М и по аллелю N, а указанная геномная область содержит аллель N в данном локусе;
на основании определенного материнского генотипа в указанном локусе и указанного определенного показателя распределения по размерам установление того, существует ли количественный дисбаланс последовательности для указанной геномной области в биологическом образце относительно материнского генотипа в указанном локусе; и определение генотипа плода в данном локусе, причем генотип плода определяют как гетерозиготный для аллеля М и для аллеля N, когда отсутствует дисбаланс последовательности между аллелем М и аллелем N.
3. Способ по п.1, согласно которому определяют материнский гаплотип беременной женщины с использованием образца, который не содержит ДНК плода, причем указанная геномная область содержит по меньшей мере часть материнского гаплотипа; и на основании указанного определенного материнского гаплотипа и указанного определенного показателя распределения по размерам устанавливают, существует ли количественный дисбаланс последовательности для указанной геномной области в биологическом образце относительно материнского гапло
- 27 034241 типа; и определяют гаплотип плода на основании указанного дисбаланса, причем идентифицируют указанный дисбаланс, если показатель распределения по размерам значимо отличается от эталонной величины, как определяют с помощью порогового значения.
4. Способ по п.3, согласно которому определяют отцовский генотип в указанной геномной области и на основании определенного отцовского генотипа в указанной геномной области устанавливают, является ли анализируемый дисбаланс последовательности у плода для указанной геномной области сверхпредставленностью или недопредставленностью относительно материнского гаплотипа.
5. Способ по п.1, в котором указанная геномная область представляет собой хромосому, а количественный дисбаланс последовательности представляет собой фетальную хромосомную анеуплоидию.
6. Способ по п.5, где указанное множество фрагментов ДНК предварительно отбирают на основании размера с формированием по меньшей мере двух групп, причем каждая группа имеет различный интервал размеров;
показатель распределения по размерам получают путем определения параметра распределения по размерам фрагментов ДНК каждой группы, соответствующих указанной хромосоме;
сравнивают показатель распределения по размерам с пороговым значением;
на основании указанного сравнения устанавливают, существует ли фетальная хромосомная анеуплоидия для указанной хромосомы, причем идентифицируют анеуплоидию, если показатель распределения по размерам значимо отличается от эталонной величины, как определяют с помощью порогового значения.
7. Способ по п.5, где установление того, существует ли фетальная хромосомная анеуплоидия для указанной хромосомы, включает сравнение установленного ранга указанной хромосомы с другим рангом указанной хромосомы, полученной из эталонного биологического образца; и на основании указанного сравнения установление того, существует ли фетальная хромосомная анеуплоидия для указанной хромосомы, причем установление ранга указанной хромосомы осуществляют, как раскрыто в описании.
8. Способ по п.5, согласно которому вычисляют первый статистический показатель, исходя из размеров фрагментов ДНК, соответствующих указанной хромосоме, как раскрыто в описании;
вычисляют второй статистический показатель, исходя из размеров фрагментов ДНК, соответствующих одной или нескольким другим хромосомам, как раскрыто в описании;
определяют показатель разделения между первым статистическим показателем и вторым статистическим показателем, где показатель разделения представляет собой разницу между первым статистическим показателем и вторым статистическим показателем или отношение первого статистического показателя и второго статистического показателя;
сравнивают показатель разделения с одним или несколькими пороговыми значениями, раскрытыми в описании, и на основании указанного сравнения устанавливают, существует ли фетальная хромосомная анеуплоидия для указанной хромосомы, причем идентифицируют анеуплоидию, если показатель разделения значимо отличается от эталонной величины, как определяют с помощью одного или нескольких пороговых значений.
9. Способ по п.8, где первый статистический показатель и второй статистический показатель представляют собой суммы размеров соответствующих фрагментов ДНК, которые имеют размер ниже первого порогового значения.
10. Способ по п.9, где первый статистический показатель представляет собой результат деления суммы размеров всех фрагментов ДНК, соответствующих указанной хромосоме, которые имеют размер ниже первого порогового значения, на сумму размеров фрагментов ДНК, соответствующих одной или нескольким другим хромосомам, которые имеют размер ниже указанного первого порогового значения.
11. Способ по п.8, где первый статистический показатель представляет собой результат деления суммы размеров всех фрагментов ДНК, соответствующих указанной хромосоме, которые имеют размер ниже первого порогового значения, на сумму размеров фрагментов ДНК, соответствующих одной или нескольким другим хромосомам, которые имеют размер ниже второго порогового значения, причем второе пороговое значение больше первого порогового значения.
12. Способ по п.8, где первый статистический показатель представляет собой результат деления суммы размеров всех фрагментов ДНК, соответствующих указанной хромосоме, которые имеют размер ниже первого порогового значения, на сумму размеров фрагментов ДНК, соответствующих одной или нескольким другим хромосомам, которые имеют размер выше второго порогового значения, причем второе пороговое значение равно первому пороговому значению, и при этом сумма, на которую производят деление, представляет собой сумму размеров соответствующих фрагментов ДНК, которые имеют размер ниже третьего порогового значения, причем третье пороговое значение больше второго порогового значения.
- 28 034241
13. Способ по п.9, дополнительно включающий повторение вычисления первого статистического показателя и второго статистического показателя для множества первых пороговых значений и определение показателя разделения между первым и вторым статистическими показателями для каждого из первых пороговых значений;
идентификацию экстремума показателя разделения;
сравнение экстремума с одним или несколькими пороговыми значениями, раскрытыми в описании; на основании указанного сравнения установление, существует ли фетальная хромосомная анеуплоидия, причем идентифицируют анеуплоидию, если значение экстремума значимо отличается от эталонной величины, как определяют с помощью одного или нескольких пороговых значений.
14. Компьютер, содержащий компьютерную программу, включающую команды для компьютерной системы, запрограммированной для осуществления способа по п.1.
EA201200701A 2009-11-06 2010-11-05 Способ пренатальной диагностики дисбаланса последовательности EA034241B1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US25907609P 2009-11-06 2009-11-06
US36039910P 2010-06-30 2010-06-30
PCT/EP2010/066935 WO2011054936A1 (en) 2009-11-06 2010-11-05 Size-based genomic analysis

Publications (2)

Publication Number Publication Date
EA201200701A1 EA201200701A1 (ru) 2012-12-28
EA034241B1 true EA034241B1 (ru) 2020-01-21

Family

ID=43530526

Family Applications (1)

Application Number Title Priority Date Filing Date
EA201200701A EA034241B1 (ru) 2009-11-06 2010-11-05 Способ пренатальной диагностики дисбаланса последовательности

Country Status (12)

Country Link
US (4) US8620593B2 (ru)
EP (3) EP3406737B1 (ru)
JP (2) JP5770737B2 (ru)
CN (2) CN102791881B (ru)
AU (1) AU2010317019B2 (ru)
BR (1) BR112012010708A2 (ru)
CA (1) CA2780016C (ru)
EA (1) EA034241B1 (ru)
IL (1) IL219545A (ru)
MX (2) MX357692B (ru)
TW (1) TWI445854B (ru)
WO (1) WO2011054936A1 (ru)

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HUE030510T2 (hu) * 2007-07-23 2017-05-29 Univ Hong Kong Chinese Magzati kromoszómális aneuploidia diagnosztizálása genomszekvenálás alkalmazásával
US8709726B2 (en) 2008-03-11 2014-04-29 Sequenom, Inc. Nucleic acid-based tests for prenatal gender determination
US8962247B2 (en) 2008-09-16 2015-02-24 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
CA2779695C (en) 2009-11-05 2016-05-24 The Chinese University Of Hong Kong Fetal genomic analysis from a maternal biological sample
EP3406737B1 (en) * 2009-11-06 2023-05-31 The Chinese University of Hong Kong Size-based genomic analysis
EP3088532B1 (en) 2009-12-22 2019-10-30 Sequenom, Inc. Processes and kits for identifying aneuploidy
CN101921874B (zh) * 2010-06-30 2013-09-11 深圳华大基因科技有限公司 基于Solexa测序法的检测人类乳头瘤病毒的方法
US20140342940A1 (en) 2011-01-25 2014-11-20 Ariosa Diagnostics, Inc. Detection of Target Nucleic Acids using Hybridization
US20130040375A1 (en) 2011-08-08 2013-02-14 Tandem Diagnotics, Inc. Assay systems for genetic analysis
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
US11031095B2 (en) 2010-08-06 2021-06-08 Ariosa Diagnostics, Inc. Assay systems for determination of fetal copy number variation
US10533223B2 (en) 2010-08-06 2020-01-14 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US8700338B2 (en) 2011-01-25 2014-04-15 Ariosa Diagnosis, Inc. Risk calculation for evaluation of fetal aneuploidy
US11203786B2 (en) 2010-08-06 2021-12-21 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US10167508B2 (en) 2010-08-06 2019-01-01 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
US20130261003A1 (en) 2010-08-06 2013-10-03 Ariosa Diagnostics, In. Ligation-based detection of genetic variants
CN108899091B (zh) 2010-11-30 2022-04-15 香港中文大学 与癌症相关的遗传或分子畸变的检测
US10131947B2 (en) 2011-01-25 2018-11-20 Ariosa Diagnostics, Inc. Noninvasive detection of fetal aneuploidy in egg donor pregnancies
US11270781B2 (en) 2011-01-25 2022-03-08 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
US8756020B2 (en) 2011-01-25 2014-06-17 Ariosa Diagnostics, Inc. Enhanced risk probabilities using biomolecule estimations
US9994897B2 (en) 2013-03-08 2018-06-12 Ariosa Diagnostics, Inc. Non-invasive fetal sex determination
CN103717750B (zh) 2011-04-29 2017-03-08 塞昆纳姆股份有限公司 少数核酸物质的定量
US8712697B2 (en) 2011-09-07 2014-04-29 Ariosa Diagnostics, Inc. Determination of copy number variations using binomial probability calculations
US10424394B2 (en) 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2013060762A1 (en) * 2011-10-25 2013-05-02 Roche Diagnostics Gmbh Method for diagnosing a disease based on plasma-dna distribution
EP3757210B1 (en) 2012-03-02 2022-08-24 Sequenom, Inc. Methods for enriching cancer nucleic acid from a biological sample
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
WO2013138527A1 (en) 2012-03-13 2013-09-19 The Chinese University Of Hong Kong Methods for analyzing massively parallel sequencing data for noninvasive prenatal diagnosis
US10289800B2 (en) 2012-05-21 2019-05-14 Ariosa Diagnostics, Inc. Processes for calculating phased fetal genomic sequences
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US11261494B2 (en) 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
CA2878979C (en) 2012-07-13 2021-09-14 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
AU2013292287A1 (en) 2012-07-19 2015-02-19 Ariosa Diagnostics, Inc. Multiplexed sequential ligation-based detection of genetic variants
GB201215449D0 (en) * 2012-08-30 2012-10-17 Zoragen Biotechnologies Llp Method of detecting chromosonal abnormalities
KR20230145530A (ko) 2012-09-20 2023-10-17 더 차이니즈 유니버시티 오브 홍콩 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정
US10482994B2 (en) 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP2971100A1 (en) 2013-03-13 2016-01-20 Sequenom, Inc. Primers for dna methylation analysis
AU2014231358A1 (en) 2013-03-15 2015-09-24 The Chinese University Of Hong Kong Determining fetal genomes for multiple fetus pregnancies
WO2014200579A1 (en) * 2013-06-13 2014-12-18 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
KR102447079B1 (ko) 2013-06-21 2022-09-23 시쿼넘, 인코포레이티드 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
EP3061021B1 (en) * 2013-10-21 2023-05-10 Verinata Health, Inc. Method for improving the sensitivity of detection in determining copy number variations
WO2015138774A1 (en) 2014-03-13 2015-09-17 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP3149199B1 (en) 2014-05-30 2020-03-25 Verinata Health, Inc. Detecting, optionally fetal, sub-chromosomal aneuploidies and copy number variations
EP4170044A1 (en) * 2014-06-06 2023-04-26 Cornell University Method for identification and enumeration of nucleic acid sequence, expression, copy, or dna methylation changes, using combined nuclease, ligase, polymerase, and sequencing reactions
US11062789B2 (en) * 2014-07-18 2021-07-13 The Chinese University Of Hong Kong Methylation pattern analysis of tissues in a DNA mixture
JP2017522908A (ja) 2014-07-25 2017-08-17 ユニヴァーシティ オブ ワシントン セルフリーdnaを生じる組織及び/又は細胞タイプを決定する方法、並びにそれを用いて疾患又は異常を識別する方法
ES2752237T3 (es) * 2014-08-01 2020-04-03 Ariosa Diagnostics Inc Detección de ácidos nucleicos diana usando hibridación
EP3230469B1 (en) 2014-12-12 2019-04-03 Verinata Health, Inc. Using cell-free dna fragment size to determine copy number variations
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
US10319463B2 (en) 2015-01-23 2019-06-11 The Chinese University Of Hong Kong Combined size- and count-based analysis of maternal plasma for detection of fetal subchromosomal aberrations
ES2908347T3 (es) 2015-02-10 2022-04-28 Univ Hong Kong Chinese Detección de mutaciones para cribado de cáncer y análisis fetal
CN104789686B (zh) * 2015-05-06 2018-09-07 浙江安诺优达生物科技有限公司 检测染色体非整倍性的试剂盒和装置
EP3666902A1 (en) 2015-05-22 2020-06-17 Nipd Genetics Public Company Limited Multiplexed parallel analysis of targeted genomic regions for non-invasive prenatal testing
EP3325663B1 (en) 2015-07-20 2020-08-19 The Chinese University Of Hong Kong Methylation pattern analysis of haplotypes in tissues in dna mixture
ES2960201T3 (es) 2015-07-23 2024-03-01 Univ Hong Kong Chinese Análisis de los patrones de fragmentación del ADN acelular
IL285795B (en) 2015-08-12 2022-07-01 Univ Hong Kong Chinese Sequencing a single molecule of DNA. plasma
US10095831B2 (en) 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
KR20190017738A (ko) * 2016-04-11 2019-02-20 퀀텀 바이오시스템즈 가부시키가이샤 생물학적 데이터 관리를 위한 시스템 및 방법
CA3037366A1 (en) 2016-09-29 2018-04-05 Myriad Women's Health, Inc. Noninvasive prenatal screening using dynamic iterative depth optimization
SG11201903346QA (en) 2016-10-19 2019-05-30 Univ Hong Kong Chinese Gestational age assessment by methylation and size profiling of maternal plasma dna
EP3535415A4 (en) 2016-10-24 2020-07-01 The Chinese University of Hong Kong TUMOR DETECTION METHODS AND SYSTEMS
CN106591451B (zh) * 2016-12-14 2020-06-23 北京贝瑞和康生物技术有限公司 测定胎儿游离dna含量的方法及其用于实施该方法的装置
SG11201906397UA (en) 2017-01-25 2019-08-27 Univ Hong Kong Chinese Diagnostic applications using nucleic acid fragments
US20200109452A1 (en) * 2017-03-31 2020-04-09 Premaitha Limited Method of detecting a fetal chromosomal abnormality
US11342047B2 (en) 2017-04-21 2022-05-24 Illumina, Inc. Using cell-free DNA fragment size to detect tumor-associated variant
WO2019020057A1 (en) 2017-07-26 2019-01-31 The Chinese University Of Hong Kong ENHANCING CANCER SCREENING WITH ACELLULAR VIRAL NUCLEIC ACIDS
US11168356B2 (en) 2017-11-02 2021-11-09 The Chinese University Of Hong Kong Using nucleic acid size range for noninvasive cancer detection
CN108827887B (zh) * 2018-03-19 2021-05-18 陕西学前师范学院 一种商陆基因组大小估计方法及基因组大小测量系统
CA3105349A1 (en) 2018-05-03 2019-11-07 The Chinese University Of Hong Kong Size-tagged preferred ends and orientation-aware analysis for measuring properties of cell-free mixtures
CA3130810A1 (en) 2019-03-25 2020-10-01 The Chinese University Of Hong Kong Determining linear and circular forms of circulating nucleic acids
JP2022544626A (ja) * 2019-08-19 2022-10-19 グリーン クロス ゲノム コーポレーション 核酸断片間距離情報を用いた染色体異常検出方法
JP7311934B2 (ja) * 2020-02-05 2023-07-20 ザ チャイニーズ ユニバーシティ オブ ホンコン 妊娠中の無細胞断片を使用する分子分析

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007028155A2 (en) * 2005-09-01 2007-03-08 The New England Medical Center Hospitals Fragment size distribution pattern of amniotic fluid cell-free fetal dna for prenatal diagnosis
WO2009013492A1 (en) * 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Determining a nucleic acid sequence imbalance

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0016742D0 (en) * 2000-07-10 2000-08-30 Simeg Limited Diagnostic method
US6664056B2 (en) * 2000-10-17 2003-12-16 The Chinese University Of Hong Kong Non-invasive prenatal monitoring
WO2002077274A2 (fr) * 2001-03-23 2002-10-03 Gencell S.A. Procedes de purification et de detection de sequences cibles d'adn double brin par interaction triple helice.
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
US8394582B2 (en) 2003-03-05 2013-03-12 Genetic Technologies, Inc Identification of fetal DNA and fetal cell markers in maternal plasma or serum
AU2003901671A0 (en) * 2003-04-02 2003-05-01 The University Of Adelaide Comparative genomic hybridization
EP1524321B2 (en) * 2003-10-16 2014-07-23 Sequenom, Inc. Non-invasive detection of fetal genetic traits
US7645576B2 (en) * 2005-03-18 2010-01-12 The Chinese University Of Hong Kong Method for the detection of chromosomal aneuploidies
PL1981995T5 (pl) 2006-02-02 2019-10-31 Univ Leland Stanford Junior Nieinwazyjne genetyczne badania przesiewowe płodu metodą analizy cyfrowej
DK1996728T3 (da) 2006-02-28 2011-08-15 Univ Louisville Res Found Detektering af føtale chromosomale abnormiteter under anvendelse af tandem-enkeltnukleotid-polymorfismer
ES2391212T3 (es) * 2006-12-07 2012-11-22 Novartis Ag Cribado genético prenatal no-invasivo
US20100112590A1 (en) * 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
US20090053719A1 (en) 2007-08-03 2009-02-26 The Chinese University Of Hong Kong Analysis of nucleic acids by digital pcr
WO2010053980A2 (en) 2008-11-04 2010-05-14 The Johns Hopkins University Dna integrity assay (dia) for cancer diagnostics, using confocal fluorescence spectroscopy
NZ595993A (en) 2009-03-31 2013-05-31 Oridis Biomarkers Gmbh Method for diagnosis of cancer and monitoring of cancer treatments
WO2011053790A2 (en) 2009-10-30 2011-05-05 Fluidigm Corporation Assay of closely linked targets in fetal diagnosis and coincidence detection assay for genetic analysis
EP3406737B1 (en) * 2009-11-06 2023-05-31 The Chinese University of Hong Kong Size-based genomic analysis
EP2513341B1 (en) 2010-01-19 2017-04-12 Verinata Health, Inc Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
EP3382037B1 (en) 2010-01-19 2021-02-17 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acids in maternal samples
WO2011103236A2 (en) 2010-02-18 2011-08-25 The Johns Hopkins University Personalized tumor biomarkers
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007028155A2 (en) * 2005-09-01 2007-03-08 The New England Medical Center Hospitals Fragment size distribution pattern of amniotic fluid cell-free fetal dna for prenatal diagnosis
WO2009013492A1 (en) * 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Determining a nucleic acid sequence imbalance

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LARRABEE PAIGE B ET AL: "Microarray analysis of cell-free fetal DNA in amniotic fluid: a prenatal molecular karyotype.", AMERICAN JOURNAL OF HUMAN GENETICS, AMERICAN SOCIETY OF HUMAN GENETICS, CHICAGO, IL., US, vol. 75, no. 3, 1 September 2004 (2004-09-01), US, pages 485 - 491, XP002413186, ISSN: 0002-9297, DOI: 10.1086/423288 *
LI YING ET AL: "Size separation of circulatory DNA in maternal plasma permits ready detection of fetal DNA polymorphisms.", CLINICAL CHEMISTRY, P.B. HOEBER, vol. 50, no. 6, 1 June 2004 (2004-06-01), pages 1002 - 1011, XP002510472, ISSN: 0009-9147, DOI: 10.1373/CLINCHEM.2003.029835 *
LO Y M DENNIS ET AL: "Digital PCR for the molecular detection of fetal chromosomal aneuploidy", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, NATIONAL ACADEMY OF SCIENCES, vol. 104, no. 32, 7 August 2007 (2007-08-07), pages 13116 - 13121, XP002620788, ISSN: 0027-8424, DOI: 10.1073/pnas.0705765104 *

Also Published As

Publication number Publication date
CN102791881B (zh) 2017-08-08
AU2010317019A1 (en) 2012-05-31
US20110276277A1 (en) 2011-11-10
EP4212630A1 (en) 2023-07-19
JP2015165805A (ja) 2015-09-24
CN107312844B (zh) 2021-01-22
US20140080720A1 (en) 2014-03-20
TWI445854B (zh) 2014-07-21
TW201129736A (en) 2011-09-01
BR112012010708A2 (pt) 2016-03-29
MX357692B (es) 2018-07-19
WO2011054936A1 (en) 2011-05-12
US20220282332A1 (en) 2022-09-08
CN107312844A (zh) 2017-11-03
CA2780016C (en) 2017-09-19
EP2496713A1 (en) 2012-09-12
US20180237858A1 (en) 2018-08-23
CN102791881A (zh) 2012-11-21
IL219545A (en) 2015-02-26
US9982300B2 (en) 2018-05-29
US8620593B2 (en) 2013-12-31
EA201200701A1 (ru) 2012-12-28
MX2012005217A (es) 2012-07-23
JP5770737B2 (ja) 2015-08-26
EP3406737B1 (en) 2023-05-31
CA2780016A1 (en) 2011-05-12
JP6001721B2 (ja) 2016-10-05
EP2496713B1 (en) 2018-07-18
IL219545A0 (en) 2012-06-28
AU2010317019B2 (en) 2014-10-30
US11365448B2 (en) 2022-06-21
EP3406737A1 (en) 2018-11-28
JP2013509870A (ja) 2013-03-21

Similar Documents

Publication Publication Date Title
US20220282332A1 (en) Size-based genomic analysis
US20220325344A1 (en) Identifying a de novo fetal mutation from a maternal biological sample
US20140256559A1 (en) Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing
EP2971126B1 (en) Determining fetal genomes for multiple fetus pregnancies
AU2015200462B2 (en) Size-based genomic analysis
EA042606B1 (ru) Геномный анализ на основе размеров
LO et al. Patent 2780016 Summary