EA038374B1 - Способ анализа биологического образца организма для выявления хромосомных делеций или амплификаций, ассоциированных с раком - Google Patents

Способ анализа биологического образца организма для выявления хромосомных делеций или амплификаций, ассоциированных с раком Download PDF

Info

Publication number
EA038374B1
EA038374B1 EA201300649A EA201300649A EA038374B1 EA 038374 B1 EA038374 B1 EA 038374B1 EA 201300649 A EA201300649 A EA 201300649A EA 201300649 A EA201300649 A EA 201300649A EA 038374 B1 EA038374 B1 EA 038374B1
Authority
EA
Eurasian Patent Office
Prior art keywords
value
cancer
nucleic acid
chromosome
region
Prior art date
Application number
EA201300649A
Other languages
English (en)
Other versions
EA201300649A1 (ru
Inventor
Юйк Мин Дэннис Ло
Квань Чэ Чань
Вай Квунь Росса Чиу
Пэйюн Цзян
Original Assignee
Те Чайниз Юниверсити Ов Гонконг
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=46171096&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=EA038374(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Те Чайниз Юниверсити Ов Гонконг filed Critical Те Чайниз Юниверсити Ов Гонконг
Publication of EA201300649A1 publication Critical patent/EA201300649A1/ru
Publication of EA038374B1 publication Critical patent/EA038374B1/ru

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis
    • C12Q2545/114Reactions characterised by their quantitative nature the purpose being quantitative analysis involving a quantitation step
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)

Abstract

Предложены способ анализа биологического образца организма для выявления хромосомных делеций или амплификации, ассоциированных с раком, машиночитаемый носитель, включающий компьютерную программу для осуществления этого способа, и компьютерная система, включающая процессор и указанный машиночитаемый носитель. В качестве биологического образца для анализа используют биологический образец, включающий бесклеточную смесь множества молекул нуклеиновых кислот, происходящих из хромосом здоровых клеток и из хромосом клеток, возможно, ассоциированных с раком. При анализе используют множество локусов области хромосомы, в которых аллели первого и второго гаплотипов гетерозиготны, и определяют группы молекул нуклеиновых кислот образца, соответствующие каждому из указанных гаплотипов. Сравнение разницы или отношения значений, рассчитанных для каждой из групп молекул нуклеиновых кислот, с пороговым значением позволяет сделать вывод о том, проявляет ли область хромосомы делецию или амплификацию в клетках, ассоциированных с раком. Выявленный дисбаланс можно применять для диагностики, определения стадии, прогнозирования или отслеживания прогрессирования степени рака.

Description

Настоящее изобретение испрашивает приоритет и является непредварительной заявкой предварительной заявки на патент США № 61/418391, озаглавленной Detection of genetic aberrations associated with cancer (Выявление генетических аббераций, ассоциированных с раком), поданной 30 ноября 2010 г., и предварительной заявки на патент США № 61/529877, озаглавленной Detection of genetic or molecular aberrations associated with cancer (Выявление генетических или молекулярных аббераций, ассоциированных с раком), поданной 31 августа 2011 г., полное содержание которых включено в данное описание посредством ссылки для всех целей.
Настоящее изобретение также является родственной заявкам тех же заявителей - заявке на патент США № 12/940992 (публикация 2011/0276277), озаглавленной Size-Based Genomic Analysis (Геномный анализ на основании размера), на имя Ло с соавт. (досье поверенного № 80015-794101/006610 US), поданной 5 ноября 2010 г., и заявке на патент США № 12/940993 (публикация 2011/0105353), озаглавленной Fetal Genomic Analysis From A Maternal Biological Sample (Анализ генома плода по биологическим образцам, взятым у матери), на имя Ло с соавт. (досье поверенного № 80015-794103/006710 US), поданной 5 ноября 2010 г., содержание которых включено в данное описание посредством ссылки во всей полноте.
Область техники
Рак является распространенным заболеванием, которое поражает многих людей. Часто рак не удается выявить до тех пор, пока не проявятся тяжелые симптомы. Для распространенных типов рака существуют способы скрининга для идентификации пациентов, у которых может быть рак. Но такие способы часто ненадежны или требуют воздействия облучения на пациента. Для многих других типов рака не существует способов эффективного скрининга.
Была выявлена потеря гетерозиготности (ПГ) в конкретном локусе ДНК, циркулирующей в крови пациентов, страдающих раком легких, а также головы и шеи (Chen XQ, et al. Nat Med 1996; 2: 1033-5; Nawroz H.,et al. Nat Med 1996; 2: 1035-7). Однако такие методики сопряжены с затруднениями, связанными с относительно малым количеством ПГ, поддающимся обнаружению при исследовании конкретного локуса. Даже при применении цифровой ПЦР (полимеразной цепной реакции) данные способы попрежнему не способны обнаруживать малые количества ПГ. Кроме того, такие методики все еще ограничены исследованием конкретного локуса, о котором известно, что он возникает при конкретном типе рака. Таким образом, скрининг для обнаружения раковых заболеваний в целом до сих пор был невозможен или неэффективен.
Помимо скрининга, для определения наличия рака современные способы также не позволяют давать прогноз состояния пациента, страдающего раковым заболеванием, и отслеживать действенность лечения (например, восстановление после операции, или химиотерапии, или иммунотерапии, или направленной терапии). Такие способы часто затратны (например, способы получения изображения), неточны, неэффективны, нечувствительны или могут требовать облучения пациента в случае способов получения изображения.
Соответственно желательно обеспечить новые способы скрининга, прогнозирования и мониторинга пациентов на предмет раковых заболеваний.
Сущность изобретения
Согласно вариантам реализации предложены системы, устройства и способы определения генетических аберраций, ассоциированных с раком. Биологические образцы, включая бесклеточные фрагменты ДНК, анализируют с целью выявления дисбаланса между областями хромосом, например вследствие делеций и/или амплификации в опухоли. Применение области хромосомы с множеством локусов позволяет достичь более высокой эффективности и/или точности. Затем такой дисбаланс можно использовать для диагностики или скрининга рака у пациента, а также прогнозировать состояние пациента, страдающего раковым заболеванием. Могут быть использованы степень дисбаланса, а также число областей, обнаруживающих дисбаланс. Кроме того, состояние пациента можно оценивать во времени, чтобы отслеживать степень тяжести заболевания в каждой одной или более областях хромосом и число областей хромосом, что делает возможным скрининг и прогнозирование, а также отслеживание прогресса (например, после лечения).
Согласно одному варианту реализации предложен способ анализа биологического образца, отобранного из организма, с целью определения хромосомных делеций или амплификаций при раке. Биологический образец включает молекулы нуклеиновых кислот, полученные из здоровых клеток и, возможно, из клеток, ассоциированных с раком. По меньшей мере, некоторые из молекул нуклеиновых кислот в указанном биологическом образце находятся в бесклеточной форме. Первый и второй гаплотипы определяют для здоровых клеток организма в первой области хромосомы. Первая область хромосомы включает первое множество гетерозиготных локусов. Каждое из множеств молекул нуклеиновых кислот в образце имеет определенную локализацию в эталонном геноме данного организма и содержит соответствующий определяемый аллель. Локализацию и определяемые аллели применяют для определения молекул нуклеиновых кислот первой группы из первого гаплотипа и второй группы - из второго гаплотипа. Компьютерная система рассчитывает первое значение для первой группы и второе значение для второй группы. Каждое значение определяет свойство соответствующей группы молекул нуклеиновых кислот
- 1 038374 (например, средний размер или количество молекул в группе). Первое значение сравнивают со вторым значением и определяют классификацию или определяют, обнаруживает ли первая область хромосомы делецию или амплификацию в каких-либо клетках, ассоциированных с раком.
Согласно другому варианту реализации предложен способ анализа биологического образца, отобранного из организма. Биологический образец включает молекулы нуклеиновых кислот, полученные из здоровых клеток и, возможно, из клеток, ассоциированных с раком. По меньшей мере, некоторые из молекул нуклеиновых кислот в образце находятся в бесклеточной форме. Выявляют множество неперекрывающихся областей хромосомы. Каждая область хромосомы включает множество локусов. Каждая из множества молекул нуклеиновых кислот в образце имеет локализацию в эталонном геноме данного организма. Для каждой области хромосомы выявляют соответствующую группу молекул нуклеиновых кислот, которые происходят из указанной области хромосомы на основании выявленной локализации. Каждая соответствующая группа включает по меньшей мере одну молекулу нуклеиновой кислоты, локализованную в каждом из множества локусов указанной области хромосомы. Компьютерная система рассчитывает соответствующие значения для соответствующей группы, причем соответствующее значение определяет свойство молекул нуклеиновых кислот соответствующей группы. Соответствующее значение сравнивают с эталонным значением и определяют классификацию или определяют, обнаруживает ли указанная область хромосомы делецию или амплификацию. Затем определяют количество областей хромосомы, классифицированных как обнаруживающие делецию или амплификацию.
Согласно еще одному варианту реализации предложен способ определения прогресса хромосомных аберраций в организме с применением биологических образцов, включающих молекулы нуклеиновых кислот, полученные из здоровых клеток и, возможно, из клеток, ассоциированных с раком. По меньшей мере, некоторые из молекул нуклеиновых кислот в образце находятся в бесклеточной форме. Для эталонного генома указанного организма выявляют одну или более неперекрывающихся областей хромосомы. Каждая область хромосомы включает множество локусов. Анализируют образцы, отобранные из указанного организма в разные моменты времени, и определяют прогресс. Для определенного образца каждая из множества молекул нуклеиновых кислот в образце обладает локализацией в эталонном геноме данного организма. Для каждой области хромосомы выявляют соответствующую группу молекул нуклеиновых кислот, которые происходят из указанной области хромосомы, на основании выявленной локализации. Каждая соответствующая группа включает по меньшей мере одну молекулу нуклеиновой кислоты, локализованную в каждом из множества локусов указанной области хромосомы. Компьютерная система рассчитывает соответствующие значения для соответствующей группы молекул нуклеиновых кислот. Соответствующее значение определяет свойство молекул нуклеиновых кислот соответствующей группы. Соответствующее значение сравнивают с эталонным значением и определяют классификацию или определяют, обнаруживает ли указанная область хромосомы делецию или амплификацию. Затем классификацию каждой из областей хромосомы в указанном множестве моментов времени применяют для определения прогресса хромосомных аберраций у указанного организма.
Другие варианты реализации настоящего изобретения относятся к системам, потребительским электронным устройствам и носителям, считываемым на компьютере, ассоциированным со способами, описанными в настоящем изобретении.
Лучшего понимания характера и преимуществ настоящего изобретения можно достичь, обратившись к приведенному далее подробному описанию и прилагаемым рисункам.
Краткое описание чертежей
Фиг. 1 иллюстрирует область хромосомы раковой клетки, демонстрирующей аберрацию в форме делеции.
Фиг. 2 иллюстрирует область хромосомы раковой клетки, демонстрирующей аберрацию в форме амплификации.
На фиг. 3 показана таблица, иллюстрирующая разные типы рака и ассоциированные с ними области, а также соответствующие им аберрации.
Фиг. 4 иллюстрирует области хромосомы в раковой клетке, которая не обнаруживает аберрации, а также измерения, сделанные в плазме крови согласно вариантам реализации настоящего изобретения.
Фиг. 5 иллюстрирует делецию 510 области хромосомы в раковой клетке, а также измерения, сделанные в плазме для определения делетированной области согласно вариантам реализации настоящего изобретения.
Фиг. 6 иллюстрирует амплификацию 610 области хромосомы в раковой клетке, а также измерения, сделанные в плазме крови для определения амплифицированной области, согласно вариантам реализации настоящего изобретения.
На фиг. 7 показан анализ RHDO (относительной дозировки гаплотипа) для ДНК в плазме пациента, страдающего печеночно-клеточным раком (НСС), для сегмента, локализованного в хромосоме 1р, который продемонстрировал моноаллельную амплификацию в ткани опухоли согласно вариантам реализации настоящего изобретения.
На фиг. 8 показано изменение в распределении по размеру фрагментов для двух гаплотипов области хромосомы в тех случаях, когда имеет место опухоль, содержащая делецию согласно вариантам реа- 2 038374 лизации настоящего изобретения.
На фиг. 9 показано изменение в распределении по размеру фрагментов для двух гаплотипов области хромосомы в тех случаях, когда имеет место опухоль, содержащая амплификацию согласно вариантам реализации настоящего изобретения.
На фиг. 10 показана блок-схема способа анализа гаплотипов биологической пробы определенного организма с целью определения, обнаруживает ли определенная область хромосомы делецию или амплификацию согласно вариантам реализации настоящего изобретения.
На фиг. 11 показана область 1110 с подобластью 1130, которая подвергается делеции в раковых клетках, а также измерения, сделанные в плазме для определения делетированной области согласно вариантам реализации настоящего изобретения.
На фиг. 12 показано, как локализацию аберраций можно картировать при помощи анализа RHDO согласно вариантам реализации настоящего изобретения.
На фиг. 13 показана классификация на основе RHDO, начатая с другого направления, согласно вариантам реализации настоящего изобретения.
На фиг. 14 показана блок-схема способа 1400 анализа биологического образца определенного организма с применением множества областей хромосом согласно вариантам реализации настоящего изобретения.
На фиг. 15 показана таблица 1500, иллюстрирующая глубину, нужную для разного количества сегментов и относительной концентрации фрагментов опухолевого происхождения, согласно вариантам реализации настоящего изобретения. На фиг. 15 приведена оценка числа молекул, которое следует анализировать при разном проценте относительной концентрации ДНК опухолевого происхождения в пробе.
На фиг. 16 показан принцип измерения относительной концентрации ДНК опухолевого происхождения в плазме на основании анализа относительной дозы гаплотипов (RHDO) согласно вариантам реализации настоящего изобретения. Нар I и Нар II представляют собой два гаплотипа в неопухолевых тканях согласно вариантам реализации настоящего изобретения.
На фиг. 17 показана блок-схема, иллюстрирующая способ определения прогресса хромосомных аберраций в организме с применением биологических образцов, включающих молекулы нуклеиновых кислот согласно вариантам реализации настоящего изобретения.
На фиг. 18А показаны кривые последовательного критерия отношения вероятностей (SPRT), полученные при анализе RHDO для сегмента в q-плече 4 хромосомы у пациента с раком. Точками показано отношение накопленной встречаемости после соответствующих гетерозиготных локусов. На фиг. 18B показаны кривые SPRT, полученные при анализе RHDO для сегмента в q-плече 4 хромосомы у пациента после лечения.
На фиг. 19 показаны частые хромосомные аберрации, обнаруживаемые при печеночно-клеточном раке.
На фиг. 20А показаны результаты нормированного отношения количества маркерных последовательностей для пациентов с печеночно-клеточным раком и для здоровых пациентов, полученные путем направленного анализа. На фиг. 20В показаны результаты анализа размеров после направленного обогащения и массивно-параллельного секвенирования для 3 пациентов, страдающих печеночно-клеточным раком, и 4 здоровых субъектов из контрольной группы.
На фиг. 21 показаны круговые диаграммы для пациентов, страдающих печеночно-клеточным раком, на которых изображены данные о подсчете секвенированных маркерных последовательностей в ДНК плазмы крови согласно вариантам реализации настоящего изобретения.
На фиг. 22 показан анализ на основе подсчета секвенированных маркерных последовательностей в образце плазмы хронического носителя вируса гепатита В (HBV), не содержащем печеночно-клеточного рака согласно вариантам реализации настоящего изобретения.
На фиг. 23 показан анализ на основе подсчета секвенированных маркерных последовательностей в образце плазмы пациента, страдающего раком носоглотки (NPC) 3 стадии, согласно вариантам реализации настоящего изобретения.
На фиг. 24 показан анализ на основе подсчета секвенированных маркерных последовательностей в образце плазмы пациента NPC 4 стадии согласно вариантам реализации настоящего изобретения.
На фиг. 25 показан график зависимости накопленной частоты ДНК в плазме от размера для области, проявляющей потерю гетерозиготности (ПГ) в ткани опухоли согласно вариантам реализации настоящего изобретения.
На фиг. 26 показан график зависимости ΔQ от размера секвенированной ДНК плазмы для области с ПГ. Согласно вариантам реализации настоящего изобретения ΔQ достигает 0,2 при размере 130 по (пар оснований).
На фиг. 27 показан график зависимости накопленной частоты ДНК в плазме от размера для области с дупликацией хромосомы в ткани опухоли согласно вариантам реализации настоящего изобретения.
На фиг. 28 показан график зависимости ΔQ от размера секвенированной ДНК плазмы для амплифицированной области согласно вариантам реализации настоящего изобретения.
- 3 038374
На фиг. 29 показана блок-схема примерной компьютерной системы 900, применяемой с системой и способами согласно вариантам реализации настоящего изобретения.
Определения
Термин биологический образец, используемый в настоящем описании, относится к любому образцу, взятому у субъекта (например, человека, человека, страдающего раковым заболеванием, человека, у которого предполагается наличие рака, или у других организмов) и содержащему одну или несколько молекул нуклеиновой(ых) кислоты (кислот), представляющих интерес.
Термин нуклеиновая кислота или полинуклеотид относится к дезоксирибонуклеиновой кислоте (ДНК) или рибонуклеиновой кислоте (РНК) и их полимеру либо в одно-, либо в двухцепочечной форме. Если конкретно не указано иное, данный термин охватывает нуклеиновые кислоты, содержащие известные аналоги природных нуклеотидов, которые обладают свойствами связывания, схожими с эталонной нуклеиновой кислотой, и метаболизируются подобно нуклеотидам, встречающимся в природе. Если не указано иное, определенная последовательность нуклеиновой кислоты также в неявном виде охватывает ее консервативно модифицированные варианты (например, замещения вырожденного кодона), аллели, ортологи, однонуклеотидные полиморфизмы (SNP), варианты по числу копий и комплементарные последовательности, а также точно указанную последовательность. Более конкретно замещений вырожденного кодона можно достичь, генерируя последовательности, в которых третья позиция одного или нескольких выбранных (или всех) кодонов замещена смешанными остатками оснований и/или дезоксинозинов (Batzer et al, Nucleic Acid Res., 19: 5081 (1991); Ohtsuka et al, J. Biol. Chem., 260: 2605-2608 (1985); и Rossolini et al., Mol. Cell. Probes, 8: 91-98 (1994)). Термин нуклеиновая кислота включает, но не ограничивается указанными, термины ген, кДНК, мРНК, малая некодирующая РНК, микроРНК (миРНК), взаимодействующая с Piwi РНК и короткая шпилечная РНК (shRNA), кодируемая геном или локусом.
Термин ген обозначает сегмент ДНК, участвующий в продукции полипептидной цепи или транскрибируемого продукта РНК. Он может включать участки, предшествующие и следующие за кодирующей областью (лидерные и концевые), а также промежуточные последовательности (интроны) между отдельными кодирующими сегментами (экзонами).
Термин клинически релевантная нуклеотидная последовательность или клинически релевантная область хромосомы, используемый в настоящем описании, может относиться к полинуклеотидной последовательности, соответствующей сегменту более крупной геномной последовательности, возможный дисбаланс которой исследуют, или еще более крупной геномной последовательности. Примеры включают сегменты генома, которые подверглись или возможно подверглись делеции или увеличению числа копий (включая простую дупликацию), или более крупную область, которая включает подобласть указанного сегмента. Согласно некоторым вариантам реализации несколько клинически релевантных нуклеотидных последовательностей или, эквивалентно, несколько маркеров клинически релевантной нуклеотидной последовательности можно применять для получения данных для выявления дисбаланса в определенной области. Например, данные о пяти не следующих подряд друг за другом последовательностях хромосомы можно применять в совокупности для определения возможного дисбаланса, причем эффективно уменьшается потребность в объеме образца до 1/5.
Термин эталонная нуклеотидная последовательность или эталонная область хромосомы, используемый в настоящем описании, относится к нуклеотидной последовательности, количественный профиль или распределение по размерам которой применяют для сравнения с исследуемой областью. Примеры эталонной нуклеотидной последовательности включают область хромосомы, которая не содержит делеции или амплификации, весь геном (например, посредством нормировки на общее количество секвенированных маркерных последовательностей), область из одного или более образцов, полученных из здоровых клеток (которая может быть той же исследуемой областью образца), или конкретный гаплотип области хромосомы. Такие эталонные нуклеотидные последовательности могут либо существовать эндогенно в образце, либо их можно добавлять экзогенно во время обработки или анализа образцов. Согласно некоторым вариантам реализации указанная эталонная область хромосомы демонстрирует профиль распределения размеров, который характерен для здорового состояния. Согласно некоторым другим вариантам реализации указанная эталонная область хромосомы демонстрирует количественный профиль, который характерен для здорового состояния.
Термин на основании (основе), используемый в настоящем описании, обозначает на основании (основе), по меньшей мере частично и относится к одному значению (или результату), применяемому при определении другого значения, например, что имеет место в соотношении на входе и выходе данного способа. Термин получать, используемый в настоящем описании, также относится к соотношению на входе и выходе данного способа, например, когда получение представляет собой расчет по формуле.
Термин параметр, используемый в настоящем описании, обозначает численное значение, которое характеризует набор количественных данных и/или соотношение между наборами количественных данных. Например, параметром является отношение (или функция отношения) между первым количеством первой нуклеотидной последовательности и вторым количеством второй нуклеотидной последовательности.
- 4 038374
Термин локус или его множественное число локусы, используемые в настоящем описании, относится к локализации или адресу любой длины по количеству нуклеотидов (или пар нуклеотидов), которые могут иметь вариации в разных геномах.
Термин дисбаланс последовательностей или аберрация, используемый в настоящем описании, обозначает значимое отклонение, определенное по меньшей мере по одному пороговому значению в количестве клинически релевантной области хромосомы в сравнении с эталонным количеством. Дисбаланс последовательностей может включать дисбаланс дозировки хромосом, дисбаланс аллелей, дисбаланс дозировки мутаций, дисбаланс дозировки гаплотипов и другие сходные виды дисбаланса. Например, дисбаланс аллелей может возникать, когда в опухоли один аллель гена делетирован, или один аллель гена амплифицирован, или в ее геноме произошла дифференциальная амплификация двух аллелей, что приводит к дисбалансу в конкретном локусе в указанной пробе. В качестве другого примера, у пациента может быть наследственная мутация в гене-супрессоре опухоли. В дальнейшем у пациента может развиться опухоль, в которой немутированный аллель гена-супрессора опухоли делетирован. Таким образом, в указанной опухоли имеет место дисбаланс дозировки мутации. Когда опухоль выделит свою ДНК в плазму указанного пациента, ДНК опухоли будет смешиваться со структурной ДНК (из нормальной клеток) пациента в указанной плазме. Посредством применения способов, описываемых в настоящем описании, можно выявлять дисбаланс дозировки мутации данной смеси ДНК в плазме.
Термин гаплотип, используемый в настоящем описании, относится к сочетанию аллелей во многих локусах, которые переносятся вместе на одной и той же хромосоме или области хромосомы. Термин гаплотип может относиться только лишь к паре локусов или к области хромосомы или же к целой хромосоме. Термин аллель относится к альтернативным последовательностям ДНК в одной и той же физической области генома, которые могут приводить, а могут и не приводить к развитию разных фенотипических признаков. В любом конкретном диплоидном организме с двумя копиями каждой хромосомы (за исключением половых хромосом у мужской особи человека) генотип для каждого гена содержит пару аллелей, присутствующих в данном локусе, которые одинаковы у гомозигот и различаются у гетерозигот. Популяция или вид организмов включает обычно множество аллелей в каждом локусе у разных индивидуумов. Геномный локус, в котором обнаруживается более одного аллеля в популяции, называют полиморфным сайтом. Вариации аллелей в определенном локусе можно измерять по количеству присутствующих аллелей (т.е. степень полиморфизма) или по доле гетерозигот (т.е. процент гетерозиготности) в популяции. Термин полиморфизм в настоящем описании относится к любой вариации между особями в геноме человека, независимо от их частоты. Примеры таких вариаций включают без ограничений однонуклеотидные полиморфизмы, простые тандемные повторы, полиморфизмы типа вставки-делеции, мутации (которые могут вызывать заболевание) и вариации числа копий.
Термин секвенированная маркерная последовательность, используемый в настоящем описании, относится к последовательности, определяемой по всей молекуле нуклеиновой кислоты или ее части, например фрагменту ДНК. Часто секвенируют только один конец указанного фрагмента, например приблизительно 30 по. Затем секвенированную маркерную последовательность можно выравнивать относительно эталонного генома. В качестве альтернативы оба конца фрагмента можно секвенировать, чтобы сгенерировать две секвенированные маркерные последовательности, которые могут обеспечить более высокую точность при выравнивании и также обеспечить определенную длину указанного фрагмента.
Термин универсальное секвенирование относится к секвенированию, при котором к концу фрагмента добавляют адаптеры, а к указанным адаптерам присоединяют праймеры для секвенирования. Таким образом, любой фрагмент можно секвенировать при помощи одного и того же праймера, и, таким образом, секвенирование может быть случайным.
Термин распределение по размеру относится к любому одному значению или набору значений, которые соответствуют длине, массе, весам или другим показателям размера молекул, соответствующих конкретной группе (например, фрагменты из конкретного гаплотипа или из конкретной области хромосомы). В разных вариантах реализации можно применять разные распределения по размеру. Согласно некоторым вариантам реализации распределение по размеру относится к ранжированию по размерам (например, усредненному размеру, медиане или среднему значению) фрагментов одной хромосомы относительно фрагментов других хромосом. Согласно другим вариантам реализации распределение по размеру может относиться к статистическому значению реальных размеров фрагментов хромосомы. Согласно одному варианту реализации статистическое значение может включать усредненное, среднее значение или медиану размера фрагментов хромосомы. Согласно другому варианту реализации статистическое значение может включать общую длину фрагментов ниже порогового значения, которую можно делить на общую длину всех фрагментов, или, по меньшей мере, фрагментов ниже более высокого порогового значения.
Термин классификация, используемый в настоящем описании, относится к любому числу(ам) или другой характеристике(ам), которые связаны с конкретным свойством образца. Например, символ + (или слово положительный) может обозначать, что образец классифицируется как содержащий делеции или амплификации. Классификация может быть двоичной (например, положительный или отрицательный) или включать больше уровней классификации (например, шкалу от 1 до 10 или от 0 до 1). Тер- 5 038374 мин пороговый и порог относится к заранее определенному числу, применяемому при определенной операции. Например, термин пороговый размер может относиться, фрагменты более которого исключаются. Пороговым значением может быть значение, выше или ниже которого применима конкретная классификация. Любой из указанных термином может применять в любом из указанных контекстов.
Термин степень рака может относиться либо к факту наличия рака, к стадии рака, к размеру опухоли, к количеству вовлеченных делеций или амплификации (например, две или три) и/или к другим показателям тяжести ракового заболевания. Степенью рака может быть число или другие характеристики. Указанная степень может быть нулевой. Степень рака также включает предраковые состояния, ассоциированные с делециями или амплификациями.
Подробное описание
Раковая ткань (опухоль) может содержать аберрации, такие как делеция или амплификация области хромосомы. Опухоль может выделять фрагменты ДНК в жидкие среды организма. Варианты реализации изобретения позволяют выявить опухоль посредством анализа фрагментов ДНК, чтобы выявить аберрации по сравнению с нормальными (ожидаемыми) значениями для ДНК в указанной области хромосомы.
Точный размер делеции или амплификации может варьировать так же, как и локализация. В некоторые моменты времени известно, что конкретная область демонстрирует аберрацию при раке вообще или при раке конкретного типа (что приводит к диагностике конкретного рака). Когда конкретная область неизвестна, можно применять систематический способ анализа всего генома или крупных частей генома, чтобы выявить аберрантные области, которые могут быть рассеяны по всему геному и размер которых (например, количество оснований, делетированных, или число копий которых увеличено) варьирует. Указанную область(и) хромосомы можно проследить во времени, чтобы выявить изменения тяжести аберрации или числа областей, демонстрирующих аберрацию. Такое прослеживание может предоставить жизненно важную информацию для скрининга, прогнозирования состояния и мониторинга опухоли (например, после лечения или для выявления рецидива или прогрессирования опухоли).
Данное описание начинается с примеров хромосомных аберраций при раке. Затем обсуждают примеры путей выявления хромосомной аберрации путем выявления и анализа бесклеточной ДНК в биологической пробе. Когда установлены способы выявления аберрации в области хромосомы, обсуждаются способы выявления аберраций во многих областях хромосом, которые применяются для систематического пути скрининга (диагностики) и прогнозирования состояния пациента. В данном описании также охарактеризованы способы прослеживания количественных показателей, получаемых при тестировании на хромосомные аберрации в одной или более областях во времени для обеспечения скрининга, прогнозирования и мониторинга пациентов. Далее обсуждаются примеры.
I. Примеры хромосмных абераций при раке.
Хромосомные аберрации часто выявляются в раковых клетках. Кроме того, в избранных типах рака можно обнаружить особый характер хромосомных аберраций. Например, при печеночно-клеточном раке (НСС) часто выявляется увеличение количества ДНК в плечах хромосом 1p, 1q, 7q, 15q, 16p, 17q и 20q и потеря ДНК в 3р, 4q, 9p и 11q.
Предыдущие исследования продемонстрировали, что такие генетические аберрации можно также выявить в циркулирующей ДНК пациентов, страдающих раковыми заболеваниями. Например, в молекулах, циркулирующих в крови пациентов, страдающих раком легких, а также головы и шеи, была выявлена потеря гетерозиготности (ПГ) в конкретном локусе (Chen XQ, et al. Nat Med 1996; 2: 1033-5; Nawroz H,et al. Nat Med 1996; 2: 1035-7). Генетические изменения, выявляемые в плазме или сыворотке, были идентичны тем, которые обнаруживались в ткани опухоли. Однако, поскольку ДНК, происходящая из опухоли, составляет лишь незначительную долю полной циркулирующей бесклеточной ДНК, дисбаланс аллелей, вызванный ПГ клеток опухоли, обычно мал. Многие исследователи разработали технологию количественной полимеразной цепной реакции (ПЦР) (Vogelstein В, Kinzler KW. Proc Natl Acad Sci USA. 1999; 96: 9236-41; Zhou W, et al. Nat Biotechnol 2001; 19: 78-81; Zhou W, et al. Lancet. 2002; 359: 219-25) для точного количественного определения разных аллелей локуса среди циркулирующих молекул ДНК (Chang HW, et al. J Natl Cancer Inst. 2002; 94: 1697-703). Количественная ПЦР обладает существенно более высокой чувствительностью, чем ПЦР в режиме реального времени или другие способы количественной оценки ДНК при выявлении малого дисбаланса аллелей, вызванного ПГ в конкретном локусе опухолевой ДНК. Однако в методике количественной ПЦР все еще существуют трудности при выявлении очень малого дисбаланса аллелей в конкретном локусе, и, таким образом, варианты реализации, описанные в настоящем описании, позволяют анализировать области хромосом совместно.
Технология, описываемая в настоящем описании, также применима для выявления предраковых состояний. Примеры таких состояний включают цирроз печени и внутриэпителиальную неоплазию шейки матки. Первое состояние является предраковым состоянием для развития печеночно-клеточного рака, а второе состояние является предраковым для развития рака шейки матки. Есть сообщения о том, что такие предраковые состояния уже проявляют некоторые молекулярные изменения в своей эволюции на пути к злокачественной опухоли. Например, наличие ПГ в плечах хромосом 1p, 4q, 13q, 18q и сопутствующие потери более чем в 3 локусах ассоциированы с повышенным риском развития печеночноклеточного рака у пациентов с циррозом печени (Roncalli M et al. Hepatology 2000;31:846-50). Такие
- 6 038374 предраковые поражения также могли бы выделять ДНК в кровеносное русло, хотя, вероятно, в более низких концентрациях. Указанная технология может позволить проводить выявление делеций или увеличения числа копий путем анализа фрагментов ДНК в плазме с целью измерения концентрации (включая относительную концентрацию) циркулирующей предраковой ДНК в плазме.
Легкость, с которой выявляются такие аберрации (например, глубина секвенирования или количество таких выявляемых изменений) и концентрации могут предсказать вероятность или скорость прогрессирования развитого ракового состояния.
A. Делеция области хромосомы.
Фиг. 1 иллюстрирует область хромосомы раковой клетки, обнаруживающую аберрацию в форме делеции. Показано, что здоровая клетка обладает двумя гаплотипами, Нар I и Нар II. Как показано, и Нар I, и Нар II содержат последовательность в каждом из многих гетерозиготных локусов 110 (также называются однонуклеотидными полиморфизмами - SNP). В клетке, ассоциированной с раком, в Нар II 120 область хромосомы делетирована. В качестве примера раковая клетка может происходить из опухоли (например, злокачественной опухоли), из очага метастазирования (например, в регионарном лимфатическом узле или в отдаленном органе) или из предракового поражения, например, которые упоминались выше.
В 120 области хромосомы раковой клетки, в которой один из двух гомологичных гаплотипов делетирован, все гетерозиготные SNP могут выглядеть гомозиготными вследствие потери другого аллеля в соответствующей делетированной гомологичной хромосоме. Следовательно, данный тип хромосомной аберрации называют потерей гетерозиготности (ПГ). В 120 области неделетированные аллели указанных SNP могут представлять один или два гаплотипа, которые могут обнаруживаться в здоровых тканях. В примере, показанном на фиг. 1, гаплотип I (Нар I) в 120 области с ПГ можно определить путем генотипирования ткани опухоли. Другой гаплотип (Нар II) можно определить путем сравнения наблюдаемых генотипов здоровых тканей и раковых тканей. Нар II можно сконструировать путем присоединения всех делетированных аллелей. То есть все из аллелей в нормальной клетке для 120 области, которые не проявляются в 120 области раковой клетки, определяются как один и тот же гаплотип, т.е. Нар I. Посредством данного анализа можно определить гаплотипы пациентов (например, пациентов с печеночноклеточным раком) для всех областей хромосом, проявляющих ПГ в ткани опухоли. Такой способ полезен, только если у человека есть раковые клетки, и он работает только для определения гаплотипа в 120 области, но не дает четкой картины для делетированной области хромосомы.
B. Амплификация области хромосомы.
Фиг. 2 иллюстрирует область хромосомы раковой клетки, проявляющую аберрацию в форме амплификации. Показано, что здоровая клетка обладает двумя гаплотипами, Нар I и Нар II. Как показано, и Нар I, и Нар II содержат последовательность в каждом из многих гетерозиготных локусов 210. В клетке опухоли Нар II содержит 220 область хромосомы дважды (дуплицирована).
Аналогично для областей с моноаллельным увеличением числа копий в тканях опухоли амплифицированные аллели в 210 SNP можно выявить при помощи таких способов как анализ на микроматрицах. Один из двух гаплотипов (Нар II в примере, показанном на фиг. 2) можно определить путем соединения всех амплифицированных аллелей в 220 области хромосомы. Указанный амплифицированный аллель в конкретном локусе можно определить путем сравнения количеств каждого из аллелей в указанном локусе. Затем другой гаплотип (Нар I) можно определить путем соединения неамплифицированных аллелей. Такой способ применим, только если у человека есть раковые клетки, и он действенен только для определения гаплотипа в 220 области, но все же он дает четкую картину амплифицированных областей хромосом.
Амплификация может возникать из-за присутствия более чем 2 хромосом или из-за повторения гена в одной хромосоме. Одна область может удваиваться тандемно, или область может быть микрохромосомой, которая содержит одну или более копий указанной области. Увеличение числа копий также может возникать из-за копирования и вставки гена из одной хромосомы в другую хромосому или другую область в той же хромосоме. Такие инсерции являются определенным типом увеличения числа копий.
II. Выбор области хромосомы.
Поскольку раковая ткань будет обусловливать, по меньшей мере, некоторую часть из указанной бесклеточной ДНК (и потенциально клеточной ДНК), геномные аберрации указанной раковой ткани можно выявить в пробе такой плазмы или сыворотки. Проблема выявления указанных аберраций состоит в том, что указанная опухоль или рак могут быть слишком малы, вследствие чего они обеспечивают относительно малое количество ДНК из раковых клеток. Таким образом, количество циркулирующей ДНК с аберрациями слишком мало, что очень затрудняет выявление. ДНК в отдельном локусе генома может быть недостаточно для того, чтобы выявить аберрацию. Способы, описываемые в настоящем описании, позволяют преодолеть указанную трудность путем анализа ДНК в области хромосомы, включающей множество локусов (гаплотип), заменяя маленькие вариации в одном локусе на заметное различие, когда оно собирается со всего гаплотипа. Таким образом, анализ множества локусов некоторой области может обеспечить более высокую точность и может уменьшить ложно-положительные и ложно-отрицательные результаты.
- 7 038374
Также область аберрации может быть слишком мала, что затрудняет выявление указанной аберрации. Если применяется только один локус или специфические локусы, аберрации не из указанных локусов не будут учтены. Некоторые способы, такие как описываемые в настоящем описании, позволяют изучать целые области, чтобы обнаружить аберрацию в подмножестве указанных областей. Когда анализируемые области перекрывают геном, таким образом, можно анализировать весь геном с целью обнаружения аберраций разной длины и локализации, как более подробно описано ниже.
Для иллюстрации вышесказанного одна область может содержать одну аберрацию. Но должна быть выбрана область для анализа. Длина и положение области может изменить результаты и, таким образом, повлиять на анализ. Например, если анализируют первую область на фиг. 1, никаких аберраций выявить нельзя. Если анализируют вторую область, можно выявить аберрацию, например, при помощи способов, описываемых в настоящем описании. Если бы анализировалась более крупная область, включающая как первую, так и вторую область, возникла бы та трудность, что только часть более крупной области содержит аберрацию, что может сделать выявление любой аберрации более трудной, а также встает проблема выявления точной локализации и длины указанной аберрации. Разные варианты реализации могут быть направлены на решение некоторых и/или всех указанных трудностей. Описание выбора области в равной степени применимо к способам, в которых применяются гаплотипы той же области хромосомы или в которых применяются разные области хромосом.
А. Выбор конкретной области хромосомы
Согласно одному варианту реализации конкретную область можно выбрать на основании информации, имеющейся о конкретном типе рака или о пациенте. Например, может быть известно, что указанная область часто проявляет аберрации при многих типах рака или при конкретном типе рака. Точную длину и положение указанной области можно определить, обратившись к литературе, касающейся того, что хорошо известно о данном типе рака или о пациентах с конкретными факторами риска. Кроме того, можно получить и проанализировать ткани опухоли пациента, чтобы выявить области с аберрациями, как описано выше. В настоящее время такая технология может потребовать получения раковой клетки (которая может и не быть полученной конкретно от пациентов, которым только был поставлен диагноз), но такую технологию можно применять для выявления областей для мониторинга одного и того же пациента во времени (например, после операции по удалению раковой ткани или после химиотерапии, иммунотерапии или направленной терапии, или для выявления рецидива или прогрессирования опухоли).
Можно выявить более чем одну конкретную область. Анализ каждой из таких областей можно применять независимо или разные области можно анализировать в совокупности. Кроме того, область можно подразделить, чтобы получить более высокую точность определения локализации аберрации.
На фиг. 3 показана табл. 300, иллюстрирующая разные типы рака, ассоциированные с ними области и соответствующие им аберрации. В столбце 310 перечислены разные типы рака. Варианты реализации, описываемые в настоящем описании, можно применять для любого типа рака, подразумевающего наличие аберрации, и, таким образом, данный перечень является лишь примерным. В столбце 320 показаны области (например, большие области, такие как 7р или более специфические области 17q25), в которых добавление (амплификация) ассоциировано с конкретным раком в той же строке. В столбце 330 показаны области, в которых можно обнаружить потери (делеции). В столбце 340 перечислены ссылки на источники, в которых обсуждается взаимосвязь указанных областей с конкретным типом рака.
Указанные области с потенциальными хромосомными аберрациями можно применять в качестве областей хромосом для анализа согласно способам, описываемым в настоящем описании. Примеры других областей генома, изменяемых при раке, можно найти в базе данных Проекта анатомии генома при раке (cgap.nci.nih.gov /Chromosomes/RecurrentAberrataions) и Атласа генетики и цитогенетики в онкологии и гематологии (atlasgeneticsoncology.org Tumors/Tumorliste.html).
Как можно видеть, выявленные области могут быть достаточно крупными, а другие могут быть более специфичными. Аберрации не могут включать всю область, определенную в таблице. Таким образом, такие подсказки относительно типа аберраций не дают точного указания на то, где указанная аберрация фактически расположена для конкретного пациента, но могут применяться в большей степени как грубое указание на крупные области для анализа. Такие крупные области могут включать много подобластей (которые могут быть равного размера), которые анализируют индивидуально, а также в совокупности в более крупной области (подробности такого анализа описываются в настоящем описании). Таким образом, варианты реализации могут сочетать в себе аспекты выбора крупной области на основании особенностей рака, который требуется оценивать, но могут также включать применение более общих технологий (например, исследование подобластей), как описано далее.
В. Выбор произвольной области хромосомы.
Согласно еще одному варианту реализации область хромосомы, которую будут оценивать, выбирают произвольно. Например, геном можно поделить на области, которые обладают длиной одна мегабаза (Мб), или другие заранее предопределенные сегменты с длиной 500 Кб или 2 Мб. Если области обладают длиной 1 Мб, то в геноме человека присутствует приблизительно 3000 областей, поскольку в гаплоидном геноме человека всего около 3 млрд оснований. Каждую из указанных областей затем можно анализировать, как более подробно обсуждается далее.
- 8 038374
Такие области можно определять не на основании каких-либо знаний о конкретном типе рака, а на основании систематического разбиения генома на области, которые нужно анализировать. Согласно одному варианту реализации, когда хромосома не обладает длиной, которая кратна заранее определенному сегменту (например, не делится на миллион оснований), последняя область хромосомы может быть меньше заранее определенной длины (например, менее чем 1 Мб). Согласно еще одному варианту применения каждую хромосому можно разделить на области равной длины (или приблизительно равной в пределах погрешности округления), исходя из полной длины хромосомы и числа сегментов, которое требуется создать (что обычно может варьировать в разных хромосомах). Согласно таким вариантам применения длина указанных сегментов каждой хромосомы может быть разной.
Как упоминалось выше, конкретную область можно выявить на основании специфического рака, который оценивают, но затем указанную конкретную область можно разделить на более мелкие области (например, подобласти равного размера, которые перекрывают конкретную более крупную область). Таким способом можно точно установить аберрации. В приведенном ниже обсуждении любая общая ссылка на область хромосомы может относиться к области, которая специфически идентифицирована, к области, которая выбрана произвольно, или к их сочетанию.
III. Выявление аберраций в конкретном гаплотипе.
В данном разделе описаны способы выявления аберрации в одиночной области хромосомы путем анализа биологического образца, которая включает бесклеточную ДНК. Согласно вариантам реализации настоящего раздела одиночная область хромосомы является гетерозиготной (разные аллели) во множестве локусов в указанной области, что обеспечивает наличие двух гаплотипов, которые можно различить, зная конкретный аллель в заданном локусе. Таким образом, заданную молекулу нуклеиновой кислоты (например, фрагмент бесклеточной ДНК) можно идентифицировать как есть из конкретного одного из двух гаплотипов. Например, указанный фрагмент можно секвенировать и получить маркерную последовательность, которая выравнивается с указанной областью хромосомы, а затем можно выявить указанный гаплотип в гетерозиготных локусах, к которым принадлежит указанный аллель. Далее описаны технологии двух общих типов, которые применяют для определения аберраций в конкретном гаплотипе (Нар), а именно подсчет маркерных последовательностей и анализ по размерам.
А. Определение гаплотипа.
Чтобы различить два гаплотипа, сначала определяют два указанных гаплотипа области хромосомы. Например, можно определять два гаплотипа Нар I и Нар II, показанные в нормальной клетке на фиг. 1. На фиг. 1 указанные гаплотипы включают первое множество локусов 110, которое является гетерозиготным, что позволяет различать два указанных гаплотипа. Указанное первое множество локусов перекрывает область хромосомы, подлежащую анализу. Можно сначала определить аллели в разных гетерозиготных локусах (полокусное генное разнообразие), а затем применить их для определения гаплотипов у пациентов.
Гаплотип указанных аллелей SNP можно определить при помощи способов анализа одиночных молекул. Примеры таких способов были описаны у Fan et al. (Nat Biotechnol. 2011; 29:51-7), Yang et al. (ProcNatl Acad Sci USA. 2011; 108:12-7) и Kitzman et al. (Nat Biotechnol. 2011 Jan; 29:59-63). В качестве альтернативы гаплотипы индивидуума можно определить посредством анализа генотипов членов семьи (например, родителей, родных сестер и братьев, детей). Примеры включают способы, описанные у Roach et al. (Am J Hum Genet. 2011;89(3):382-97) и Lo et al. (Sci Transl Med. 2010; 2:61ra91). Согласно еще одному варианту реализации гаплотип индивидуумов можно определить посредством сравнения результатов генотипирования тканей опухоли и геномной ДНК. Генотипирование указанных субъектов можно проводить путем анализа на микроматрицах.
Также гаплотипы можно сконструировать другими способами, хорошо известными специалистам в данной области техники. Примеры таких способов включают способы, основанные на анализе одиночных молекул, таких как количественная ПЦР (Ding С and Cantor CR. Proc Natl Acad Sci USA 2003; 100: 7449-7453; Ruano G et al. Proc Natl Acad Sci USA 1990; 87: 6296-6300), сортировка или разделение хромосом (Yang H et al. Proc Natl Acad Sci USA 2011; 108: 12-17; Fan HC et al. Nat Biotechnol 2011; 29: 51-57), гаплотипирование спермы (Lien S et al. Curr Protoc Hum Genet 2002; Chapter 1:Unit 1.6) и технологии визуализации (Xiao M et al. Hum Mutat 2007; 28: 913-921). Другие способы включают способы, основанные на аллель-специфичной ПЦР (Michalatos-Beloin S et al. Nucleic Acids Res 1996; 24: 4841-4843; Lo YMD et al. Nucleic Acids Res 19: 3561-3567), клонирование и расщепление рестриктазами (Smirnova AS et al. Immunogenetics 2007; 59:93-8) и др. Еще некоторые способы основаны на распределении и структуре неслучайного распределения блоков гаплотипов в популяции, которые позволяют вывести гаплотип субъекта из статистических оценок (Clark AG. Mol Biol Evol 1990; 7:111-22; 10:13-9; Salem RM et al. Hum Genomics 2005; 2:39-66).
Другой способ определения гаплотипа области ПГ основан на генотипировании нормальных тканей и тканей опухоли указанного субъекта, если ткани опухоли доступны. При наличии ПГ ткани опухоли с очень высокой концентрацией клеток опухоли могут продемонстрировать кажущуюся гомозиготность для всех локусов SNP в пределах области, демонстрирующей ПГ. Генотипы указанных локусов SNP могут содержать один гаплотип (Нар I области ПГ на фиг. 1). С другой стороны, нормальные ткани могут
- 9 038374 показать, что указанный субъект гетерозиготен по указанным локусам SNP в пределах области, демонстрирующей ПГ. Аллели, которые присутствуют в нормальных тканях, но не в тканях опухоли, могут содержать другой гаплотип (Нар II области ПГ на фиг. 1).
В. Анализ относительной дозировки гаплотипа (RHDO).
Как упоминалось выше, хромосомные аберрации с амплицикацией или делецией одного из гаплотипов области хромосомы могут приводить к дисбалансу дозировки двух гаплотипов в указанной области хромосомы в тканях опухоли. В плазме крови человека с опухолевым ростом определенная доля циркулирующей ДНК происходит из клеток указанной опухоли. Из-за присутствия ДНК из опухоли в плазме пациентов, страдающих раковыми заболеваниями, также может присутствовать такой дисбаланс в плазме. Дисбаланс дозировки двух указанных гаплотипов можно выявить путем подсчета числа молекул, происходящих из каждого гаплотипа.
Для областей хромосом, в которых наблюдается ПГ в тканях опухоли (например, 120 область на фиг. 1) Нар I может быть представлен в избытке среди циркулирующих молекул ДНК (фрагментов) по сравнению с Нар II из-за недостаточной доли Нар II из тканей опухоли. Для областей хромосом, в которых в тканях опухоли наблюдается амплификация, Нар II может присутствовать в избытке по сравнению с Нар I для областей, вовлеченных в моноаллельную амплификацию Нар II, из-за выделения дополнительной дозы Нар II из тканей опухоли. Чтобы определить избыточное и недостаточное присутствие, определяют, происходят ли определенные фрагменты в ДНК в пробе из Нар I или Нар II, что можно сделать при помощи разных способов, например путем проведения универсального секвенирования и выравнивания с применением количественной ПНР сайт-специфичных зондов.
После секвенирования множества фрагментов ДНК из плазмы (или другого биологического образца) пациентов, страдающих раковыми заболеваниями, с целью сгенерировать секвенированные маркерные последовательности указанные секвенированные маркерные последовательности, соответствующие аллелям двух указанным гаплотипам, можно выявить и подсчитать. Количество секвенированных маркерных последовательностей, соответствующих каждому из двух гаплотипов, в равной степени представлено в плазме. Согласно одному варианту реализации для определения того, значимо ли различается присутствие двух указанных гаплотипов, можно применять последовательный критерий отношения вероятностей (SPRT). Статистически значимое различие предполагает наличие хромосомной аберрации в анализируемой области хромосомы. Кроме того, количественное различие двух указанных гаплотипов в плазме можно применять для оценки относительной концентрации ДНК, происходящей из опухоли, как описано ниже.
Диагностические способы для определения идентичности фрагмента ДНК (например, его локализации в геноме человека), описываемые в настоящем описании, не ограничиваются применением массивно-параллельного секвенирования в качестве платформы для выявления. Указанные диагностические способы можно также применять, например, без ограничений, для микрофлюидных систем для количественной ПЦР (например, цифровая матричная система Fluidigm, микрокапельная система для количественной ПЦР (например, система от компании RainDance и QuantaLife), системы BEAM-ing (например, ПЦР, амплификация и магнитные измерения на гранулах, в эмульсии) (Diehl et al. ProcNatlAcadSci USA 2005; 102: 16368-16373), ПЦР в режиме реального времени, системы на основе масс-спектрометрии (например, система SequenomMassArray) и анализ на основе мультиплексной, зависящей от лигирования амплификации зондов (MLPA).
Нормальные области
Фиг. 4 иллюстрирует области хромосом в раковой клетке, которые не обнаруживают аберрации, а также измерения, сделанные в плазме согласно вариантам реализации настоящего изобретения. 410 область хромосомы можно выбрать любым способом, например, в зависимости от специфического типа рака, который требуется оценивать, или на основании обычного скрининга, при котором применяют заранее определенные сегменты, перекрывающие большие участки генома. Чтобы различить два гаплотипа, сначала определяют эти два гаплотипа. На фиг. 4 показаны два гаплотипа (Нар I и Нар II) нормальной клетки для 410 области хромосомы. Указанные гаплотипы включают первое множество локусов 420. Указанное первое множество локусов 420 перекрывает 410 область хромосомы, которую анализируют. Как показано, указанные локусы в нормальной клетке гетерозиготны. Показаны два гаплотипа для раковой клетки. В раковой клетке ни одна из областей не подверглась делеции или амплификации.
Также на фиг. 4 показано число встречаемостей аллелей в каждом гаплотипе для каждого локуса 420. Также приведена сумма нарастающим итогом для определенных подобластей 410 области хромосомы. Число встречаемостей аллелей соответствует количеству фрагментов ДНК, соответствующих конкретному гаплотипу в каждом конкретном локусе. Например, фрагмент ДНК, который включает указанные первые локусы 421 и содержит аллель А, можно засчитать как Нар I. А фрагмент ДНК с аллелем Т можно засчитать как Нар II. Выяснить, выравнивается ли фрагмент (т.е. включает ли он конкретный локус) и какой аллель он содержит, можно разными способами, как упоминается в настоящем описании. Можно применять соотношение количеств двух гаплотипов, чтобы определить, есть ли значимое различие. В настоящем описании данное соотношение называется соотношением шансов. Также можно применять различие между двумя значениями; указанное различие можно нормировать на
- 10 038374 общее число фрагментов. Отношение и различие (и функции от них) являются примерами параметров, которые сравнивают с пороговыми значениями, чтобы определить классификацию или выяснить, существует ли аберрация.
Можно применять анализ RHDO всех аллелей в одном и том же гаплотипе (например, накопленную встречаемость) для определения, есть ли какой-либо дисбаланс двух гаплотипов в плазме, например, как это можно сделать с плазмой матери, как описано в заявках на патенты Lo 12/940 992 и 12/940 993, о которых речь шла выше. Указанный способ может значительно увеличить количество молекул ДНК, применяемых для определения того, есть ли какой-либо дисбаланс и, следовательно, позволяет достичь более высокой статистической мощности для дифференциации дисбаланса в связи с наличием рака по распределению вероятностей встречаемости аллелей в отсутствии рака или предракового состояния. В отличие от раздельного анализа множественных локуксов SNP, способ RHDO может основываться на относительном положении аллелей в двух указанных хромосомах (информация о гаплотипе) так, что аллели, расположенные в одной и той же хромосоме, можно анализировать вместе. В отсутствии информации о гаплотипе встречаемости аллелей разных локусов SNP нельзя складывать вместе, чтобы оценить статистически, представлен ли гаплотип в плазме в недостаточной или избыточной доле. Количественное определение встречаемости аллелей можно проводить без ограничений посредством массивнопараллельного секвенирования (например, посредством секвенирования Illumina при помощи системы синтеза, секвенирования при помощи технологии сшивки (SOLiD) от компании Life Technologies, системы секвенирования Ion Torrent от компании Life Technologies, секвенирования на нанопорах (nanoporetech.com) и посредством технологии секвенирования 454 (Roche), количественной ПЦР (например, посредством микрокапельной количественной ПЦР (например, Fluidigm (fluidigm.com)), или BEAMing (например, ПЦР, амплификация и магнитные измерения на гранулах, в эмульсии), или капельной ПЦР (например, от компании QuantaLife (quantalife.com) и RainDance (raindancetechnologies.com)), а также ПЦР в режиме реального времени. Согласно другому варианту применения указанной технологии можно применять обогащенное направленное секвенирование с применением захвата из раствора (например, с применением системы Agilent SureSelect, пользовательского набора для обогащения Illumina TruSeq (illumina.com/applications/sequencing/targeted_resequencing.ilmn), или с применением пользовательского набора для обогащения MyGenostics GenCap (mygenostics.com/)), или захвата на основе матриц (например, с применением системы Roche NimbleGen).
В примере, показанном на фиг. 4, наблюдается слабый дисбаланс аллелей для первых двух локусов SNP (24 и 26 для первого SNP, и 18 и 20 для второго SNP). Однако встречаемость аллелей недостаточна со статистической точки зрения для определения, присутствует ли реальный дисбаланс аллелей. Таким образом, встречаемости аллелей в одном и том же гаплотипе складывают до тех пор, пока накопленных встречаемостей аллелей для двух указанных гаплотипов не будет достаточно, чтобы статистически достоверно заключить, что для 410 области хромосомы между двумя указанными гаплотипами дисбаланса аллелей нет (пятый SNP в данном примере). После достижения статистически значимой классификации, накопленная встречаемость обнуляется (в шестом SNP в данном примере). Затем накопленную встречаемость определяют до тех пор, пока накопленных встречаемостей аллелей для двух указанных гаплотипов снова не будет достаточно, чтобы сделать статистическое заключение об отсутствии дисбаланса аллелей между двумя указанными гаплотипами для данной конкретной подобласти 410 области. Также можно применять итоговую накопленную встречаемость для всей области, но предыдущий способ позволяет оценивать разные подобласти, что обеспечивает более высокую точность (т.е. подобласть) при определении локализации аберрации, в отличие от целой области 410. Примеры статистических критериев для определения, присутствует ли реальный дисбаланс, включают без ограничений последовательный критерий отношения вероятностей (Zhou W, et al. Nat Biotechnol 2001; 19: 78-81; Zhou W, et al. Lancet. 2002; 359: 219-25), t-криетрий Сьюдента и критерий хи-квадрат.
Выявление делеций
Фиг. 5 иллюстрирует делецию 510 области хромосомы в раковой клетке, а также измерения, сделанные в плазме для определения делетированной области согласно вариантам реализации настоящего изобретения. На фиг. 5 показаны два гаплотипа (Нар I и Нар II) нормальной клетки для 510 области хромосомы. Указанные гаплотипы включают первое множество гетерозиготных локусов 520, которые перекрывают 510 область хромосомы, подвергаемую анализу. Показаны два гаплотипа для раковой клетки. В раковой клетке для гаплотипа II область 510 подверглась делеции. Как и на фиг. 4, на фиг. 5 также показано число встречаемости аллелей, для каждого локуса 520. Также приведена сумма нарастающим итогом для определенных подобластей 510 области хромосомы.
Поскольку ткани опухоли обычно содержат смесь опухолевых и неопухолевых клеток, ПГ может проявляться по отклонению соотношения количеств двух указанных аллелей в локусах в 510 области. В такой ситуации делетированный гаплотип Нар II в 510 области можно определить на основании сочетания локусов 520, которые демонстрируют относительное уменьшение количеств фрагментов ДНК по сравнению с соответствующими локусами в здоровых тканях. Гаплотип с фрагментами, которые появляются чаще, является Нар I, который сохранен в клетках опухоли. Согласно определенным вариантам реализации может быт желательно провести процедуру, которая могла бы обогатить долю раковых кле- 11 038374 ток в пробе опухоли, чтобы было легче определять и делеированный, и сохраненный гаплотипы. Одним примером такой процедуры является микродиссекция (либо ручная, либо при помощи технологий лазерного захвата).
Теоретически каждый из аллелей в Нар I может быть представлен в избытке в циркулирующей ДНК для области хромосомы, проявляющей ПГ в тканях опухоли, и степень дисбаланса аллелей может зависеть от относительной концентрации ДНК опухоли в плазме крови. Однако в то же время относительная распространенность двух указанных аллелей в любой пробе циркулирующей ДНК также должна подчиняться закону распределения Пуассона. Можно проводить статистический анализ, чтобы определить, связан ли наблюдаемый дисбаланс аллелей с наличием ПГ в раковых тканях или с вероятностью. Мощность выявления реального дисбаланса аллелей, ассоциированного с ПГ в раковой опухоли, зависит от количества циркулирующих молекул ДНК, которые анализируют, и от относительной концентрации опухолевой ДНК. Более высокая относительная концентрация опухолевой ДНК и большее количество анализируемых молекул могут обеспечить более высокую чувствительность и специфичность выявления реального дисбаланса аллелей.
В примере, показанном на фиг. 5, наблюдается слабый дисбаланс аллелей для первых двух локусов SNP (24 и 22 для первого SNP, и 18 и 15 для второго SNP). Однако значения встречаемости аллелей не достаточно со статистической точки зрения для определения, присутствует ли реальный дисбаланс аллелей. Таким образом, встречаемости аллелей в одном и том же гаплотипе складывают до тех пор, пока накопленных встречаемостей аллелей для двух указанных гаплотипов не будет достаточно, чтобы статистически достоверно заключить, что в 510 области присутствует дисбаланс аллелей между двумя указанными гаплотипами (пятый SNP в данном примере). Согласно некоторым вариантам реализации известен только дисбаланс, а специфический тип (делеция или увеличение числа копий) не известен. Затем накопленную встречаемость определяют до тех пор, пока накопленных встречаемостей аллелей для двух указанных гаплотипов снова не будет достаточно, чтобы сделать статистическое заключение о дисбалансе аллелей между двумя указанными гаплотипами для данной конкретной подобласти 510 области. Также можно применять итоговую накопленную встречаемость для всей области, как можно делать при любом способе, описываемом в настоящем описании.
Выявление амплификации хромосомы
Фиг. 6 иллюстрирует амплификацию 610 области хромосомы в раковой клетке, а также измерения, сделанные в плазме для определения амплифицированной области согласно вариантам реализации настоящего изобретения. Помимо ПГ в раковых тканях также часто наблюдается амплификация областей хромосом. В примере, показанном на фиг. 6, в раковой клетке число копий Нар II в 610 области хромосомы увеличено до трех. Как показано, 610 область включает только шесть гетерозиготных локусов, в противоположность более длинным областям, показанным на предыдущих фигурах. Увеличение числа копий выявляются как статистически значимое в шестых локусах, где определяется статистически значимое избыточное присутствие. Согласно некоторым вариантам реализации известен только дисбаланс, а специфический тип (делеция или амплификация) не определяется. Согласно другим вариантам реализации можно получить и анализировать раковую клетку. Такой анализ может предоставить информацию о том, связан ли указанный дисбаланс с делецией (раковая клетка гомозиготна по делетированной области) или с амплификацией (раковая клетка гетерозиготна по амплифицированной области). Согласно другим вариантам применения определить, присутствует ли делеция или амплификация, можно при помощи способов, описанных в разделе IV, для анализа целой области (т.е. не отдельно взятых гаплотипов). Если указанная область присутствует в избытке, то аберрация является увеличением числа копий; а если указанная область присутствует в недостатке, то аберрация является делецией. Также анализируют 620 область, и накопленная встречаемость подтверждает, что дисбаланса не существует.
Анализ SPRT для анализа RHDO плазмы
Для любых областей хромосом, которые содержат гетерозиготные локусы, анализ RHDO можно применять для определения того, существует ли дисбаланс дозировок двух указанных гаплотипов в плазме. В указанных областях наличие дисбаланса дозировок гаплотипов в плазме свидетельствует о наличии ДНК опухолевого происхождения в указанной пробе плазмы. Согласно одному варианту реализации анализ SPRT можно применять для определения того, является ли статистически значимым различие в числе секвенированных считываний для Нар I и Нар II. В данном примере анализа SPRT мы сначала определяли число секвенированных считываний, поступающих от каждого из двух указанных гаплотипов. Затем можно определить параметр (например, долю), которая соответствует пропорциональному количеству секвенированных считываний, в которое вносит вклад потенциально представленный в избытке гаплотип (например, доля числа считываний для одного гаплотипа, разделенная на число считываний другого гаплотипа). Потенциально представленный в избытке гаплотип может быть неделетированным гаплотипом в сценарии ПГ и амплифицированным гаплотипом в сценарии моноаллельного увеличения числа копий области хромосомы. Затем указанную долю можно сравнивать с пороговыми значениями (верхним и нижним пороговым значением), которые сконструированы на основании нулевой гипотезы, т.е. отсутствия дисбаланса дозировки гаплотипов, и альтернативной гипотезы, т.е. присутствия дисбаланса дозировки гаплотипов. Если указанная доля больше, чем верхнее пороговое значение, это
- 12 038374 указывает на наличие статистически значимого дисбаланса двух указанных гаплотипов в плазме. Если указанная доля ниже, чем нижнее пороговое значение, это указывает на то, что нет статистически значимого дисбаланса двух указанных гаплотипов. Если указанная доля попадает в диапазон между верхним и нижним пороговым значением, это указывает на то, что статистическая мощность недостаточна, чтобы сделать заключение. Можно проводить последовательное увеличение количества гетерозиготных локусов для области, которую анализируют, до тех пор, пока не будет сделана успешная классификация SPRT. Уравнения для расчета верхних и нижних границ SPRT следующие:
Верхнее пороговое значение= 1η δ]/1η γ ,
Нижнее пороговое значение=^'п 1η δ]/1η γ, где δ = (1 - 9,)/(1 - 02) и A'Al· щ U Ц)
Θ1 представляют собой ожидаемую долю секвенированных маркерных последовательностей из потенциально представленного в избытке гаплотипа, когда в плазме имеет место дисбаланс аллелей, θ2 представляет собой ожидаемую долю любых двух гаплотипов, когда нет дисбаланса аллелей, т.е. 0,5, N - общее количество секвенированных маркерных последовательностей для Нар I и Нар II, In - математический символ, обозначающий натуральный логарифм (т.е. loge). Θ1 может зависеть от относительной концентрации ДНК опухолевого происхождения (F), которая, как предполагается (или известно), присутствует в пробе плазмы.
В варианте ПГ θι=1/(2-Ρ). В варианте моноаллельной амплификации θ1=(1+zF)/(2+zF), где z представляет собой количество дополнительных копий области хромосомы, которая амплифицирована в опухоли. Например, если одна хромосома дуплицирована, будет одна дополнительная копия конкретной хромосомы. Тогда z равно 1.
На фиг. 7 показан анализ RHDO ДНК в плазме пациента с НСС для сегмента, локализованного в хромосоме 1р, которая демонстрирует амплификацию одного аллеля в ткани опухоли согласно вариантам реализации настоящего изобретения. Зелеными треугольниками показаны данные пациента. Общее количество секвенированных считываний увеличивалось при увеличении количества анализируемых SNP. Доля всех секвенированных считываний и амплифицированного гаплотипа в опухоли варьирует при увеличении количества всех анализируемых секвенированных считываний и в итоге достигает значения, превышающего верхнее пороговое значение. Это указывает на значимый дисбаланс дозировки гаплотипов и, следовательно, подтверждает наличие в плазме данной ассоциированной с раком аберрации.
Для всех областей хромосом пациента с НСС, демонстрирующих амплификации и делеции в тканях опухоли, проводили анализ RHDO с применением SPRT. Результаты приведены далее для 992 сегментов, которые, как известно, демонстрируют ПГ, и для 105 сегментов, которые, как известно, демонстрируют амплификации. Для ПГ 922 сегмента были классифицированы при помощи SPRT, и 921 сегмент был правильно идентифицирован как демонстрирующий дисбаланс дозировки гаплотипов в плазме, и была достигнута точность 99,99%. Для моноаллельной амплификации 105 сегментов были классифицированы при помощи SPRT, и 105 сегментов были правильно идентифицированы как демонстрирующие дисбаланс дозировки гаплотипов в плазме, и была достигнута точность 100%.
С. Анализ относительного размера гаплотипа.
В качестве альтернативы подсчету дозировки фрагментов, выровненных с двумя указанными гаплотипами, можно применять размер фрагментов для соответствующих гаплотипов. Например, для конкретной области хромосомы размер фрагментов ДНК из одного гаплотипа можно сравнивать с размером фрагментов ДНК другого гаплотипа. Можно проанализировать распределение по размерам фрагментов ДНК, которые соответствуют любому из аллелей гетерозиготных локусов первого гаплотипа указанной области, и сравнить его с распределением по размерам фрагментов ДНК, которые соответствуют любому из аллелей гетерозиготных локусов второго указанного гаплотипа. Статистически значимое различие распределений по размеру можно применять для идентификации аберрации, аналогично с применением количества встречаемости.
Сообщалось, что распределение по размеру всей ДНК плазмы (т.е. опухолевой и неопухолевой) у пациентов, страдающих раковыми заболеваниями, увеличено (Wang BG, et al. Cancer Res. 2003; 63: 3966-8). Однако если специально изучать ДНК опухолевого происхождения вместо количества всей ДНК (т.е. опухолевой и неопухолевой), было отмечено, что распределение по размеру молекул ДНК опухолевого происхождения более узкое, чем распределение молекул, полученных из неопухолевых клеток (Diehl et al. Proc Natl Acad Sci USA. 2005;102:16368-73). Следовательно, распределение по размеру циркулирующей ДНК можно применять для определения того, присутствуют ли ассоциированные с раком хромосомные аберрации. Принцип анализа по размерам показан на фиг. 8.
На фиг. 8 показано изменение распределения по размеру фрагментов двух гаплотипов области хромосомы, когда присутствует опухоль, содержащая делецию согласно вариантам реализации настоящего изобретения. Как проиллюстрировано на фиг. 8, аллель Т в указанной ткани опухоли делетирован. Как
- 13 038374 следствие, ткани опухоли могут выделять в плазму только короткие молекулы указанного аллеля А. Короткие молекулы ДНК опухолевого происхождения могут приводить к общему сужению распределения по размеру в плазме для аллеля А, таким образом, приводя к сужению распределения по размеру аллеля А по сравнению с распределением аллеля Т в плазме. Как обсуждалось выше, все аллели, локализованные в одном и том же гаплотипе, можно анализировать вместе. Иными словами, распределение по размеру молекул ДНК, несущих аллели, локализованные в одном гаплотипе, можно сравнивать с распределением молекул ДНК, несущих аллели, локализованные в другом гаплотипе. Гаплотип, делетированный в тканях опухоли, может демонстрировать более широкое распределение по размеру в плазме.
Анализ размеров также можно применять для выявления амплификации областей хромосомы, ассоциированных с раком. На фиг. 9 показано изменение распределения по размеру фрагментов двух гаплотипов области хромосомы, когда присутствует опухоль, содержащая амплификацию согласно вариантам реализации настоящего изобретения. В примере, показанном на фиг. 9, аллель Т в указанной опухоли дуплицирован. Как следствие, в плазму может выделяться увеличенное количество коротких молекул ДНК опухолевого происхождения, таким образом, приводя к сужению распределения по размеру аллеля Т по сравнению с распределением аллеля А. Анализ размеров можно применять совместно для всех аллелей, локализованных в одном и том же гаплотипе. Иными словами, распределение по размеру для гаплотипа с увеличенным числом копий в тканях опухоли может быть уже, чем распределение по размеру для гаплотипа без увеличенного числа копий в тканях опухоли.
Выявление сужения распределения по размеру циркулирующей ДНК
Размер фрагментов ДНК, возникающих из двух гаплотипов, а именно Нар I и Нар II, можно определять без ограничений при помощи массивно-параллельного секвенирования с парными концами. После секвенирования концов некоторого фрагмента ДНК секвенирование считывания (маркерные последовательности) можно выровнять с эталонным геном человека. О размере секвенированных молекул ДНК можно сделать вывод на основании координат крайнего нуклеотида на каждом конце. Секвенированные маркерные последовательности указанной молекулы можно применять для определения того, происходит ли указанный фрагмент ДНК из Нар I или Нар II. Например, одна из секвенированных маркерных последовательностей может включать гетерозиготный локус в анализируемой области хромосомы.
Следовательно, для каждой секвенируемой молекулы мы можем определить как размер, так и то, происходит ли она из Нар I или Нар II. На основании размера указанных фрагментов, выровненных с каждым гаплотипом, компьютерная система может рассчитать профиль распределения по размерам (например, средний размер фрагмента) как для Нар I, так и для Нар II. Распределение по размерам фрагментов ДНК из Нар I и Нар II можно сравнивать при помощи соответствующего статистического анализа, чтобы определить, когда распределение по размерам достаточно различается, чтобы идентифицировать аберрацию. Помимо массивно-параллельного секвенирования с парными концами для определения размера фрагментов ДНК можно применять другие способы, включая без ограничений секвенирование целых фрагментов ДНК, масс-спектрометрию и оптические способы для выявления и сравнения длины наблюдаемых молекул ДНК со стандартом.
Далее мы внедрили два примерных способа для выявления укорочения циркулирующей ДНК, ассоциированного с генетическими аберрациями опухолей. Указанные два способа направлены на проведение количественных измерений различий в распределении по размеру для двух популяций фрагментов ДНК. Указанные две популяции фрагментов ДНК приписывают молекулам ДНК, соответствующим Нар I и Нар II.
Различие в доле коротких фрагментов ДНК
Согласно одному способу применения применяют долю коротких фрагментов ДНК. Устанавливают размеры отсечки (w), чтобы определить, какие молекулы ДНК являются короткими. Размер отсечки может варьировать, и можно выбирать его, чтобы удовлетворить разным диагностическим целям. Компьютерная система может определить количество молекул, которые имеют размер меньше либо равный размеру отсечки. Затем можно рассчитать долю фрагментов ДНК (Q) путем деления числа коротких ДНК на общее число фрагментов ДНК. На значение Q может влиять распределение по размеру указанной популяции молекул ДНК. Более узкое общее распределение по размеру показывает, что большая доля молекул ДНК может представлять собой короткие фрагменты, что дает более высокое значение Q.
Затем можно применять различие в доле коротких фрагментов ДНК между Нар I и Нар II. Различие в распределении по размеру фрагментов ДНК из Нар I и Нар II может отражаться на разнице в доле коротких фрагментов для Нар I и Нар II (AQ).
AQ QHapi QHapii, где QHapI представляет собой долю коротких фрагментов для фрагментов ДНК Нар I; a QHapII представляет собой долю коротких фрагментов для фрагментов ДНК Нар II. QHapI и QHapII являются примерами статистического показателя двух групп распределений по размеру фрагментов из каждого гаплотипа.
Как показано в предыдущем разделе, когда Нар I выявляется в тканях опухоли, распределение по размеру фрагментов ДНК Нар I может быть уже, чем для фрагментов ДНК Нар II. Как следствие, может наблюдаться положительное значение AQ. Положительное значение AQ можно сравнивать с пороговым
- 14 038374 значением, чтобы определить, достаточно ли велико AQ, чтобы делецию считать существующей. Амплификация Нар I также может демонстрировать положительное значение AQ. Когда в тканях опухоли имеет место дупликация Нар II, распределение по размеру фрагментов ДНК Нар II может быть уже, чем для фрагментов ДНК Нар I. Следовательно, значение AQ может стать отрицательным. В отсутствии хромосомной аберрации распределение по размерам фрагментов ДНК Нар I и Нар II в плазме/сыворотке может быть сходным. Следовательно, значение AQ может быть приблизительно нулевым.
AQ определенного пациента можно сравнивать с AQ нормальных индивидуумов, чтобы определить, нормальное ли данное значение. Дополнительно или в качестве альтернативы значение AQ пациента можно сравнивать со значениями, полученными у пациентов, страдающих аналогичным типом рака, чтобы определить, аномальное ли данное значение. Такое сравнение может включать в себя сравнение с пороговыми значениями, описываемыми в настоящем описании. В контексте мониторинга заболевания значение AQ можно отслеживать последовательно во времени. Изменение значения AQ может указывать на увеличение относительной концентрации опухолевой ДНК в плазме/сыворотке крови. Согласно избранному варианту применения указанной технологии относительная концентрация опухолевой ДНК может быть коррелирована со стадией опухоли, прогнозированием и прогрессированием заболевания. Такие варианты применения, основанные на измерениях в разные времени, более подробно обсуждаются далее.
Различие в доле в общей длины, приписываемой коротким фрагментам ДНК
Согласно данному варианту применения применяют долю в общей длине, которую приписывают коротким фрагментам ДНК. Компьютерная система может определить общую длину группы фрагментов ДНК в пробе (например, фрагменты из конкретного гаплотипа данной области или просто из данной области). Можно выбрать размер отсечки (w), фрагменты ДНК меньше которого определяют как короткие фрагменты. Размер отсечки может варьировать, и можно выбирать его, чтобы удовлетворить разным диагностическим целям. Затем компьютерная система может определить общую длину коротких фрагментов ДНК путем суммирования длины случайно выбранных фрагментов ДНК, которые равны или короче размера отсечки. Затем можно рассчитать долю в общей длине, приписываемую коротким фрагмента < F = Ylength / ENlength ΣΑ там ДНК, которую можно рассчитать следующим образом: — - ^ & , где length представляет собой сумму длин фрагментов ДНК с длиной, равной или меньше w(bp); и“ представляет собой сумму длин фрагментов ДНК с длиной, равной или меньше, чем заранее установленная длина N. Согласно одному варианту реализации N составляет 600 оснований. Однако для расчета общей длины можно применять другие ограничения размеров, например 150 оснований, 180 оснований, 200 оснований, 250 оснований, 300 оснований, 400 оснований, 500 оснований и 700 оснований.
Может быть выбрано значение 600 оснований или менее, поскольку система Illumina Genome Analyzer не эффективна при амплификации и секвенировании фрагментов ДНК более 600 оснований. Кроме того, ограничение анализа фрагментами ДНК короче 600 оснований также позволяет избежать погрешности, возникающей из-за структурных вариаций генома. В присутствии структурных вариаций, например перестроек (Kidd JM et al, Nature 2008; 453:56-64), размер фрагментов генома можно переоценить, когда размер оценивают способами биоинформатики, путем картирования концов указанного фрагмента ДНК относительно эталонного генома. Кроме того, >99,9% всех фрагментов ДНК, успешно секвенированных и картированных относительно эталонного генома, короче 600 оснований и, таким образом, включение всех фрагментов, равных или короче 600 оснований, могут обеспечить репрезентативную оценку распределения по размеру фрагментов ДНК в пробе.
Соответственно можно применять различие в долях в общей длине, приписываемых коротким фрагментам ДНК, между гаплотипами Нар I и Нар II. Отклонение распределения по размеру между фрагментами ДНК Нар I и Нар II может отражаться в различии их значений F. Здесь мы определяем FHapi и FHapII как доли в общей длине, приписываемые коротким фрагментам ДНК Нар I и Нар II соответственно. Разницу в долях в общей длине, приписываемых коротким фрагментам ДНК, между Нар I и Нар II AF =FHap I - Ьнар II (ΔF) можно рассчитать следующим образом: . FHapI и FHapII представляют собой примеры статистического показателя двух групп распределений по размеру фрагментов из каждого гаплотипа.
Аналогично вариантам реализации, проиллюстрированным в предыдущем разделе, делеция Нар II в тканях опухоли может приводить к кажущемуся сужению распределения по размеру фрагментов ДНК Нар по сравнению с распределением фрагментов ДНК Нар II. Это может приводить к тому, что значение ΔF будет положительным. Когда Нар II дуплицирован, может наблюдаться отрицательное значение ΔF. В отсутствии хромосомной аберрации значение FΔ может быть приблизительно нулевым.
Значение ΔF определенного пациента можно сравниваться со значением ΔF у здоровых индивидуумов, чтобы определить нормальное ли указанное значение. Значение ΔF определенного пациента можно сравниваться со значением AF, полученным у пациента с аналогичными типами рака, чтобы определить аномальное ли указанное значение. Такое сравнение может включать в себя сравнение с пороговыми значениями, описываемыми в настоящем описании. В контексте мониторинга заболевания значение ΔQ можно отслеживать во времени последовательно. Изменение значения ΔF может указывать на увеличе
- 15 038374 ние относительной концентрации опухолевой ДНК в плазме/сыворотке крови.
D. Общий способ.
На фиг. 10 показана блок-схема способа анализа гаплотипов биологической пробы организма с целью определения, обнаруживает ли определенная область хромосомы делецию или амплификацию согласно вариантам реализации настоящего изобретения. Указанный биологический образец включает молекулы нуклеиновых кислот (также называемые фрагментами), полученные из здоровых клеток и, возможно, из клеток, ассоциированных с раком. Указанные молекулы могут присутствовать в указанном образце в бесклеточной форме. Указанный организм может быть любого типа, который содержит более одной копии хромосомы, т.е., по меньшей мере, диплоидным организмом, но может включать и организмы с более высокой степенью полиплоидности.
Согласно одному варианту реализации данного и других способов, описываемых в настоящем описании, указанный образец содержит бесклеточные фрагменты ДНК. Хотя анализ ДНК в плазме применялся для иллюстрации разных способов, описанных в настоящем описании, указанные способы можно также применять для определения ассоциированных с опухолью хромосомных аберраций в пробах, содержащих смесь здоровой ДНК и ДНК опухолевого происхождения. Другие типы проб включают слюну, слезную жидкость, плевральную жидкость, мочу, сыворотку, панкреатический сок, кал и пробы мазков из шейки матки.
На этапе 1010 определяют первый и второй гаплотипы для здоровых клеток указанного организма в первой области хромосомы. Г аплотипы можно определять любыми подходящими способами, такими как способы, упоминаемые выше в настоящем описании. Указанную область хромосомы можно выбрать посредством любого способа, например посредством способов, описываемых в настоящем описании. Указанная первая область хромосомы включает первое множество локусов (например локусы 420 из 410 области), которые гетерозиготны. Гетерозиготные локусы (полокусное генное разнообразие) могут находиться далеко друг от друга, например, локусы могут быть на расстоянии 500 или 1000 оснований (или более) от другого локуса указанного первого множества локусов. Могут существовать другие типы полокусного генного разнообразия в первой области хромосомы, но их не применяют.
На этапе 1020 множество молекул нуклеиновых кислот в указанной биологической пробе характеризуют с точки зрения локализации и аллеля каждой молекулы. Например, можно выявить локализацию молекулы нуклеиновой кислоты в эталонном геноме указанного организма. Определение локализации можно проводить разными способами, включая проведение секвенирования молекул (например, посредством универсального секвенирования), чтобы получить одну или две (с парными концами) секвенированных маркерных последовательностей указанной молекулы, а затем провести выравнивание секвенированной маркерной последовательности (последовательностей) с эталонным геномом. Такое выравнивание можно проводить при помощи таких средств как средство поиска основного локального выравнивания (BLAST). Локализацию можно идентифицировать как число в плече определенной хромосомы. Аллель в одном из гетерозиготных локусов локусы (полокусное генное разнообразие) можно применять для определения того, из какого гаплотипа произошел фрагмент.
На этапе 1030 идентифицируют первую группу молекул нуклеиновых кислот как происходящую из первого гаплотипа на основании выявленных локализаций и определенных аллелей. Например, фрагмент, включающий локус 421 на фиг. 4, содержащий аллель А, можно идентифицировать как происходящий из Нар I. Указанная первая группа может перекрывать первую область хромосомы при включении по меньшей мере одной молекулы нуклеиновой кислоты, расположенной в каждом из первого множества ло кусов.
На этапе 1040 идентифицируют вторую группу молекул нуклеиновых кислот как происходящую из второго гаплотипа на основании выявленных локализаций и определенных аллелей. Например, фрагмент, включающий локус 421 на фиг. 4, содержащий аллель Т, можно идентифицировать как происходящий из Нар II. Указанная вторая группа включает по меньшей мере одну молекулу нуклеиновой кислоты, расположенную в каждом из первого множества локусов.
На этапе 1050 компьютерная система рассчитывает первое значение для первой группы молекул нуклеиновых кислот. Первое значение определяет свойство молекул нуклеиновых кислот первой группы. Примеры первого значения включают подсчет маркерных последовательностей из числа молекул первой группы и распределение по размеру указанных молекул в первой группе.
На этапе 1060 компьютерная система рассчитывает второе значение для второй группы молекул нуклеиновых кислот. Второе значение определяет свойство молекул нуклеиновых кислот второй группы.
На этапе 1070 указанное первое значение сравнивают с указанным вторым значением, чтобы классифицировать, обнаруживает ли указанная первая область хромосомы делецию или амплификацию. Классификация, основанная на наличии делеции или амплификации, может дать информацию о том, содержит ли указанный организм клетки, ассоциированные с раком. Примеры сравнения включают оценку различия или отношения двух значений и сравнение результатов с одним или более пороговыми значениями, как описано в настоящем описании. Например, отношение можно сравнивать с пороговыми значениями при анализе SPRT. Пример классификации может включать положительное (т.е. увеличение числа копий или делеция определяются), отрицательное значение или неопределенное значение, а также
- 16 038374 разные степени положительного и отрицательного значения (например, с применением целых чисел от 0 до 10 или действительных чисел от 0 до 1). Увеличение числа копий может включать простую дупликацию. При помощи такого способа можно выявлять наличие ассоциированных с раком нуклеиновых кислот, которые включают ДНК опухолевого происхождения и ДНК из новообразований, например из предшественников рака.
Е. Глубина.
Термин глубина анализа относится к количеству молекул, которые требуется анализировать, чтобы получить классификацию или другое определение с заданной точностью. Согласно одному варианту реализации глубину можно рассчитать на основании известной аберрации, а затем можно проводить измерение и анализ с такой глубиной. Согласно еще одному варианту реализации указанный анализ можно продолжать до тех пор, пока не удастся произвести классификацию, которую можно применять для определения степени рака (например, стадии рака или размера опухоли). Далее приведены примеры некоторых расчетов, относящихся к глубине.
Термин отклонение может относиться к любому различию или отношению, описываемым в настоящем описании. В качестве примера отклонение может существовать между первым и вторым значениями или может существовать отклонение параметра от порогового значения или концентрации опухоли, описываемых в настоящем описании. Если отклонение удваивается, то количество фрагментов, которые требуется измерить, снижается на 1/4. В более общем случае, если отклонение увеличивается в N раз, то количество фрагментов, которые требуется измерить, составляет 1/N2. Дополнительно, если указанное отклонение снижается в 1/N, то количество фрагментов, которые требуется оценивать, увеличивается в N2 раз. N может быть действительным или целым числом. Предположим, что концентрация ДНК опухоли в пробе составляет 10% (например, в плазме), и предположим, что статистически значимое различие наблюдается при секвенировании 10 млн фрагментов. Тогда скажем, например, проводится процедура обогащения такая, что теперь концентрация ДНК опухоли в пробе составляет 20%, тогда количество фрагментов, которое требуется, может быть 2500000. Таким образом, глубина может коррелировать с процентом ДНК опухоли в указанном образце.
Также на глубину может влиять объем увеличения числа копий. Для области, в которой произошло удвоение числа копий в данной области (например, 4 вместо 2 в норме), положим X равным количеству фрагментов, которые требуются для анализа. Если область содержит в четыре раза больше копий, чем в норме, то для данной области потребуется Х/4 фрагментов.
F. Пороговые значения.
Объем отклонения параметра (например, различия или отношения величин для каждого гаплотипа) от нормальных значений можно применять для проведения диагностики, как описано выше. Например, указанным отклонением может быть различие в среднем размере фрагментов одного гаплотипа области со средним размером фрагментов другого гаплотипа. Если указанное отклонение превышает определенное число (например, пороговое значение, которое определено для нормальных проб и/или областей), то выявляют делецию или амплификацию. Но может быть информативной и степень превышения над пороговым значением, что может приводить к применению многих пороговых значений, каждое из которых соответствует разной степени рака.
Например, более выраженное отклонение от нормы может указывать на то, какая стадия рака присутствует (например, 4 стадия может демонстрировать большую степень дисбаланса, чем 3 стадия). Более выраженное отклонение может также быть следствием того, что опухоль крупная и в результате выделяет много фрагментов и/или что указанная область амплифицирована многократно.
Помимо определения разных степеней рака, разные пороговые значения могут также позволить эффективно выявлять области с аберрациями или специфические области. Например, можно установить высокое пороговое значение, чтобы отследить главным образом амплификацию до трех и более раз, которая приводит к более высокому дисбалансу, чем делеции одного гаплотипа. Также можно выявлять делеции двух копий определенной области. Также можно применять более низкое пороговое значение, чтобы идентифицировать области, которые могут содержать аберрацию, а затем указанные области можно анализировать более подробно, чтобы подтвердить, действительно ли существует аберрация, и ее локализацию. Например, можно проводить бинарный поиск (или поиск более высокого порядка, такой как восьмеричное дерево), причем на более низких уровнях иерархии применять более высокие пороговые значения.
На фиг. 11 показана область 1110 с подобластью 1130, которая подвергается делеции в раковых клетках, а также измерения, сделанные в плазме для определения делетированной области согласно вариантам реализации настоящего изобретения. Область хромосомы 1110 можно выбрать при помощи любого способа, упоминаемого в настоящем описании, такого как разделение генома на сегменты одинакового размера. На фиг. 11 также показано число встречаемости аллелей для каждого из локусов 1120. Сумма нарастающим итогом также показана 1140 области (нормальная область) и области 1130 (делетированная область) соответственно.
Если для анализа выбирают 1110 область, сумма нарастающим итогом составляет 258 для Нар I и 250 для Нар II и различие составляет 18 по одиннадцати локусам. Такое различие меньше по проценту
- 17 038374 общего числа отсчетов, чем в случае анализа только делетированной 1130 подобласти. Это следует понимать так, что в раковых клетках приблизительно половина 1110 области нормальна, а вся 1130 подобласть делетирована. Таким образом, аберрацию в 1110 области можно пропустить в зависимости от применяемого порогового значения.
Чтобы было возможно определить делеции подобластей, можно применять варианты реализации с более низким пороговым значением для относительно крупных областей (в данном примере 1110 область предполагается относительно крупной по сравнению с размером делетированных областей, которые требуется идентифицировать).
Более низкое пороговое значение может позволить идентифицировать больше областей, которые могут включать некоторые ложноположительные результаты, но они могут снизить количество ложноотрицательных результатов. Теперь ложноположительные результаты можно устранить при помощи дальнейшего анализа, который может также указать на аберрации.
После того как определенная область помечена для дальнейшего анализа, указанную область можно разделить на подобласти для дальнейшего анализа. На фиг. 11 можно разделить одиннадцать локусов пополам (например, при помощи бинарного дерева), чтобы получить 1140 подобласть из шести локусов и 1130 подобласть из пяти локусов. Указанные области можно анализировать с тем же пороговым значением или с более строгим пороговым значением. В данном примере 1140 подобласть можно далее определить как нормальную, а 1130 подобласть определить как включающую делецию или амплификацию. Таким образом, более крупные области можно проигнорировать как не содержащие аберраций, и может быть потрачено время на дальнейший анализ подозреваемых областей (областей со значением выше более низкого порогового значения), чтобы выявить подобласти, которые обнаруживают аберрацию с высокой степенью достоверности (например, с применением более высокого порогового значения). Хотя в настоящем описании применяли RHDO, технология с применением размеров применима в той же степени.
Размер областей для поиска первого уровня (и размер подобластей более низких уровней в дереве) можно выбирать на основании размера аберрации, которую требуется выявить. Может быть показано, что типы рака демонстрируют десять областей с аберрациями длиной 10 МБ. У пациентов также имеются области 10 МБ, проявляющие аберрации. На более поздних стадиях рака могут быть более длинные отрезки аберраций.
G. Уточнение локализации аберрации в определенной области.
В последнем разделе обсуждалось подразделение области на подобласти на основании древовидного поиска. Здесь мы обсуждаем другие способы анализа подобластей указания аберраций внутри определенной области.
На фиг. 12 показано, как локализацию аберраций можно картировать при помощи анализа RHDO согласно вариантам реализации настоящего изобретения. Указанная область хромосомы показана горизонтально, а гаплотипы нераковых клеток обозначены как Нар I и Нар II. Делетированная область Нар II в раковой клетке обозначена как ПГ.
Как показано, анализ RHDO начинают с левой стороны в направлении правой стороны гипотетической 1202 области хромосомы. Каждая из стрелок отражает сегмент классификации RHDO. Каждый сегмент можно считать своей собственной областью, особенно подобласть с набором полокусного генного разнообразия более крупной области. Размер сегмента классификации RHDO зависит от количества локусов (и положений указанных локусов) до того, как определена классификация. Количество локусов, включаемых в каждый сегмент RHDO, зависит от количества молекул, анализируемых для каждого сегмента, желаемой точности (например, отношения шансов при анализе SPRT) и относительной концентрации ДНК опухолевого происхождения в пробе. Можно провести классификацию, когда количество молекул адекватно для определения того, есть ли статистически значимое различие между двумя гаплотипами, как в примерах, проиллюстрированных на фиг. 4 и 5.
Каждая из непрерывных горизонтальных стрелок представляет собой сегмент классификации RHDO, и они показывают, что в пробе ДНК дисбаланс дозировки гаплотипов отсутствует. В указанной области без ПГ в опухоли проводится шесть классификаций RHDO, и каждая из них указывает на отсутствие дисбаланса дозировки гаплотипов. Следующий сегмент классификации RHDO 1210 пересекает соединение 1205 между областями с ПГ и без ПГ. В нижней части фиг. 12 показана кривая SPRT для сегмента RHDO 1210. Черные вертикальные стрелки показывают соединение между областями с ПГ и без ПГ. При накоплении возрастающего количества данных из области с ПГ классификация RHDO данного сегмента указывает на наличие дисбаланса дозировки гаплотипов.
Каждая из белых горизонтальных стрелок представляет собой сегмент классификации RHDO, который показывает, что в пробе ДНК присутствует дисбаланс дозировки гаплотипов. Последующие четыре RHDO с правой стороны также указывают на наличие дисбаланса дозировки гаплотипов в указанной пробе ДНК. Можно вывести, что соединение между областями с ПГ и без ПГ находится внутри первого сегмента RHDO, что указывает на изменение в классификации RHDO, а именно с наличия на отсутствие дисбаланса дозировки гаплотипов или наоборот.
На фиг. 13 показана классификация на основе RHDO, начатая с другого направления, согласно вариантам реализации настоящего изобретения. На фиг. 13 показана классификация на основе RHDO с
- 18 038374 обоих направлений. На основании анализа RHDO, который начинали с левой стороны, можно заключить, что соединение между областями с ПГ и без ПГ находится внутри первого сегмента RHDO, что указывает на наличие дисбаланса дозировки гаплотипов. На основании анализа RHDO, который начинали с правой стороны, можно заключить, что указанное соединение находится внутри первого сегмента RHDO 1320, что указывает на отсутствие дисбаланса дозировки гаплотипов. Объединяя информацию, полученную при анализе RHDO, проводимого в обоих направлениях, можно сделать заключение о локализации соединения между областями 1330 с ПГ и без ПГ.
IV. Неспецифическое выявление аберрации на основании гаплотипа.
Способ RHDO основан на применении гетерозиготных локусов. Теперь, хромосомы диплоидного организма будут обладать некоторыми различиями, что приводит к образованию двух гаплотипов, но количество гетерозиготных локусов может варьировать. У некоторых индивидуумов может быть относительно мало гетерозиготных локусов. Вариант реализации, описываемый в настоящем разделе, можно также применять для локусов, которые гомозиготны, путем сравнения двух областей, а не гаплотипов одной и той же области. Таким образом, можно получить больше экспериментальных точек, хотя могут существовать некоторые недостатки из-за сравнения двух разных областей хромосом.
Согласно способу дозировки областей хромосом количество фрагментов из одной области хромосомы (например, определяемое путем подсчета маркерных последовательность, выравнивающихся с данной областью) сравнивают с расчетным значением (которое может быть получено для эталонной области хромосомы или для той же области в другом образце, полученной от здорового субъекта). Таким образом, фрагмент можно подсчитывать для определенной области хромосомы, независимо от того, из какого гаплотипа происходит секвенированная маркерная последовательность. Таким образом, попрежнему можно применять секвенированные маркерные последовательности, которые не содержат полокусного генного разнообразия. Чтобы провести сравнение, в одном варианте реализации можно нормировать количество маркерных последовательностей перед сравнением. Каждая область определяется по меньшей мере по двум локусам (которые отделены друг от друга), и фрагменты в указанных локусах можно применять для получения совокупного значения для указанной области.
Нормированное значение для секвенированных считываний (маркерных последовательностей) для конкретной области можно рассчитать путем деления числа секвенированных считываний, выравнивающихся с данной областью, на общее число секвенированных считываний, которые могут выравнивать со всем геномом. Такое нормированное количество маркерных последовательностей позволяет результаты одной пробы сравнивать с результатами другого образца. Например, нормированное значение может быть долей (например, процентом или частью) секвенированных считываний, предположительно происходящих из конкретной области, как указывалось выше. Но возможны многие другие варианты нормировки, что должно быть понятно специалистам в данной области техники. Например, можно проводить нормировку путем деления количества подсчетов для одной области на количества подсчетов для эталонной области (в случае, описанном выше, эталонной областью является просто весь геном). Такое нормированное количество маркерных последовательностей затем можно сравнивать с пороговым значением, которое можно определить из одного или более эталонных образцов, не демонстрирующих рак.
Нормированный подсчет маркерных последовательностей в исследуемом случае можно затем сравнивать с нормированным подсчетом маркерных последовательностей одного или более эталонных субъектов, например субъектов, не страдающих раковыми заболеваниями. Согласно одному варианту реализации, сравнение проводят путем расчета z-показателя случая для конкретной области хромосомы, zпоказатель рассчитывают по следующему уравнению:
z-показатель = (нормированный подсчет маркерных последовательностей случая - среднее)/С.О., где среднее означает среднюю нормированную встречаемость маркерных последовательностей, выравнивающихся с конкретной областью хромосомы для эталонных проб; а С.О. обозначает стандартное отклонение количества нормированных встречаемостей маркерных последовательностей, выравнивающихся с конкретной областью для эталонных проб. Следовательно, z-показатель представляет собой значение стандартного отклонения, на которое нормированный подсчет маркерных последовательностей области хромосомы для исследуемого случая отклоняется от среднего нормированного подсчета маркерных последовательностей для той же области хромосомы у одного или более эталонных субъектов.
В ситуации, когда исследуемый организм болен раком, области хромосом, которые амплифицированы в тканях опухоли, могут присутствовать в избытке в ДНК плазмы. Это может приводить к тому, что значение z-показателя будет положительным. С другой стороны, области хромосом, которые делетированы в тканях опухоли, могут присутствовать в недостатке в ДНК плазмы. Это может приводить к тому, что значение z-показателя будет отрицательным. Величина z-показателя определяется несколькими факторами.
Одним фактором является относительная концентрация ДНК опухолевого происхождения в указанной биологической пробе (например, плазме). Чем выше относительная концентрация ДНК опухолевого происхождения в указанной биологической пробе (например, плазме), тем больше может быть различие между нормированной встречаемостью маркерных последовательностей исследуемого случая и эталонными случаями. Следовательно, может быть получена более высокая амплитуда z-показателя.
Еще одним фактором является разброс нормированной встречаемости маркерных последовательно
- 19 038374 стей в одном или более эталонных случаях. При одной и той же степени присутствия в избытке области хромосомы в указанном биологическом образце (например, плазме) в исследуемом случае, меньший разброс (т.е. меньшее стандартное отклонение) нормированной встречаемости маркерных последовательностей в эталонной группе может приводить к более высокому z-показателю. Аналогично при одной и той же степени присутствия в недостатке области хромосомы в указанной биологической пробе (например, плазме) в исследуемом случае меньшее стандартное отклонение нормированной встречаемости маркерных последовательностей в эталонной группе может приводить к более отрицательному z-показателю.
Еще одним фактором является объем хромосомной аберрации в тканях опухоли. Термин объем хромосомной аберрации относится к изменению числа копий для конкретной области хромосомы (либо добавление, либо утрата). Чем больше изменения числа копий в тканях опухоли, тем выше может быть степень недостаточного или избыточного присутствия конкретной области хромосомы в ДНК плазмы. Например, утрата обеих копий указанной хромосомы может приводить к присутствию в более выраженном недостатке указанной области хромосомы в ДНК плазмы по сравнению с утратой одной из двух копий указанной хромосомы, и, следовательно, приводить к более отрицательному z-показателю. Обычно при раке имеют место множественные хромосомные аберрации. Хромосомные аберрации при каждом типе рака могут также варьировать по своей природе (т.е. амплификации или делеции), степени (добавление или утрата одной или нескольких копий) и по объему (размер аберрации в выражении длины хромосомы).
На точность измерения нормированного подсчета маркерных последовательностей влияет количество анализируемых молекул. Мы предполагаем, что для выявления хромосомных аберраций с изменений одной копии (либо добавлением, либо утратой) может потребоваться 15000, 60000 и 240000 молекул при относительной концентрации приблизительно 12,5%, 6,3% и 3,2% соответственно. Более подробная информация о подсчете маркерных последовательностей для выявления рака для разных областей хромосом представлена в публикации патента США № 2009/0029377 под названием Diagnosing Fetal Chromosomal Aneuploidy Using Massively Parallel Genomic Sequencing, Lo et al., полное содержание которой включено в настоящее описание посредством ссылки для всех целей.
Также варианты реализации могут быть основаны на применении анализа по размерам, взамен способа подсчета маркерных последовательностей. Анализ по размерам можно также применять вместо подсчета маркерных последовательностей. При анализе по размерам можно применять разные параметры, упоминаемые в настоящем описании, и в заявке на патент США № 12/940992. Например, можно применять значения Q или F, упоминаемые выше. Такие значения, характеризующие размеры, не требуют нормировки на подсчет других областей, поскольку указанные значения не шкалируются в зависимости от числа считываний. Также для неспецифических способов можно применять технологии гаплотипспецифичных способов. Например, можно применять технологии, основанные на глубине и уточнении области. Согласно некоторым вариантам реализации при необходимости можно учитывать GCсмещение, когда сравнивают две области. Поскольку при способе RHDO применяют одну и ту же область, такая коррекция не требуется.
V. Множество областей.
Хотя могут существовать определенные типы рака с аберрациями в конкретных областях хромосом, такие типы рака не всегда проявляются в одних и тех же областях. Например, аберрации могут демонстрировать дополнительные области хромосом, и локализация таких дополнительных областей может быть неизвестна. Кроме того, когда проводят скрининг пациентов с целью идентификации ранних стадий рака, может быть желательно идентифицировать широкий диапазон типов рака, которые могут демонстрировать аберрации, присутствующие по всему геному. Чтобы справиться с такими ситуациями, варианты реализации могут быть основаны на анализе множества областей систематическим образом, чтобы определить, какие области демонстрируют аберрации. Например, можно применять количество аберраций и их локализацию (т.е. примыкают ли они друг к другу) для подтверждения аберраций, определения стадии рака, проведения диагностики рака (т.е. если количество больше, чем пороговое значение) и прогнозирования на основании количества и локализации разных областей, проявляющих аберрации.
Соответственно варианты реализации позволяют выявить наличие рака в организме на основании некоторого количества областей, которые демонстрируют аберрации. Таким образом, можно тестировать множество областей (например, 3000), чтобы выявить некоторое количество областей, проявляющих аберрацию. Указанные области могут охватывать весь геном или только части генома, например неповторяющуюся область.
На фиг. 14 показана блок-схема способа 1400 анализа биологического образца определенного организма с применением множества областей хромосом согласно вариантам реализации настоящего изобретения. Указанный биологический образец включает молекулы нуклеиновых кислот (также называемые фрагментами).
На этапе 1410 идентифицируют множество неперекрывающихся областей хромосом указанного организма. Каждая область хромосомы включает множество локусов. Как упоминалось выше, область может обладать размером 1 Мб или каким-либо другим одинаковым размером. Тогда весь геном может включать приблизительно 3000 областей, каждая из которых обладает заранее определенным размером и локализацией. Также как упоминалось выше, такие заранее определенные области могут варьировать по
- 20 038374 длине, в зависимости от длины конкретной хромосомы или заданного количества областей, которое следует применять, и любых других критериев, упоминаемых в настоящем описании. Если области обладают разной длиной, такие значения длины можно применять для нормировки результатов, например, как описано в настоящем описании.
На этапе 1420 идентифицируют локализацию указанной молекулы нуклеиновой кислоты в эталонном геноме человека для каждой из множества молекул нуклеиновых кислот. Локализацию можно определить при помощи любого из способов, упоминаемых в настоящем описании, например, путем секвенирования фрагментов для получения секвенированных маркерных последовательностей и выравнивания указанных секвенированных маркерных последовательностей с эталонным геномом. Также для гаплотип-специфичных способов можно определить конкретный гаплотип молекулы.
Для каждой из указанных областей хромосом проводят этапы 1430-1450. На этапе 1430 соответствующую группу молекул нуклеиновых кислот определяют как происходящую из указанной области хромосомы на основании выявленных локализаций. Соответствующая группа включает по меньшей мере одну молекулу нуклеиновой кислоты, локализованную в каждом из множества локусов указанной области хромосомы. Согласно одному варианту реализации указанной группой могут быть фрагменты, которые выравниваются с конкретным гаплотипом указанной области хромосомы, например в способе RHDO, описанном выше. Согласно другому варианту реализации группой могут быть фрагмент, который выравнивается с указанной областью хромосомы, как в способе, описанном в разделе IV.
На этапе 1440 компьютерная система рассчитывает соответствующее значение соответствующей группы молекул нуклеиновых кислот. Указанное соответствующее значение определяет свойство молекул нуклеиновых кислот соответствующей группы. Указанное соответствующее значение может представлять собой любое из значений, упоминаемых в настоящем описании. Например, указанное значение может представлять собой количество фрагментов в указанной группе или статистический показатель распределения по размеру фрагментов в указанной группе. Указанное соответствующее значение также может представлять собой нормированное значение, например встречаемость маркерных последовательностей, поделенной на общее количество встречаемости маркерных последовательностей для указанной пробы или количество встречаемости маркерных последовательностей для эталонной области. Указанное соответствующее значение также может представлять собой разницу или отношение к другому значению (например, при RHDO), что позволяет определить свойство различия для указанной области.
На этапе 1450 указанное соответствующее значение сравнивают с эталонным значением и определяют классификацию или определяют, демонстрирует ли указанная первая область хромосомы делецию или амплификацию. Затем определяют количество областей хромосомы, классифицированных как демонстрирующие делецию или амплификацию. Указанное эталонное значение может быть любым пороговым или эталонным значением, обсуждаемым в настоящем описании. Например, указанное эталонное значение может быть пороговым значением, определенным для нормальных проб. Для RHDO указанное соответствующее значение может быть различием или отношением встречаемости маркерных последовательностей для двух гаплотипов, а указанное эталонное значение может быть пороговым значением для определения того, существует ли статистически значимое отклонение. В качестве еще одного примера указанное эталонное значение может быть встречаемостью маркерных последовательностей или показателем размера для другого гаплотипа или области, а сравнение может включать вычисление различия или отношения (или функции от них) и последующее определение того, превышает ли указанное различие или отношение пороговое значение.
Указанное эталонное значение может варьировать в зависимости от результатов других областей. Например, если соседние области также демонстрируют отклонение (хотя и малое по сравнению с одним пороговым значением, например, z-показатель равен 3), можно применять более низкое пороговое значение. Например, если три идущих друг за другом области демонстрируют значение выше первого порогового значения, вероятность наличия рака может быть более высокой. Таким образом, указанное первое пороговое значение может быть ниже, чем другое пороговое значение, которое требуется для идентификации рака на основании не идущих друг за другом областей. Три области (или более трех), обладающих даже малым отклонением, могут иметь низкую достаточную вероятность случайного эффекта, что может сохранить чувствительность и специфичность.
На этапе 1460 определяют количество областей хромосом, классифицированных как демонстрирующие делецию или амплификацию. Области хромосом, которые подсчитываются, могут иметь ограничения. Например, могут быть подсчитаны только области, которые соседствуют по меньшей мере с одной другой областью (может требоваться, чтобы смежные области обладали определенным размером, например 4 или более области). Для тех вариантов реализации, в которых области не равны, число может также обусловливать соответствующие длины (например, число может быть общей длиной аберрантных областей).
На этапе 1470 указанное количество сравнивают с пороговым количеством и определяют классификацию указанной пробы. В качестве примера, классификация может представлять собой определение наличие рака у указанного организма, стадию рака и прогнозирование состояния при раке. Согласно одному варианту реализации подсчитывают все аберрантные области и применяют одно пороговое значе- 21 038374 ние, независимо от того, где указанные области наблюдаются. Согласно другому варианту реализации пороговое значение может варьировать в зависимости от локализации и размера областей, которые подсчитываются. Например, количество областей конкретной хромосомы или плеча хромосомы можно сравнивать с пороговым значением для данной конкретной хромосомы (или плеча). Можно применять несколько пороговых значений. Например, количество аберрантных областей в конкретной хромосоме (или плече) обязательно должно быть выше, чем первое пороговое значение, а общее количество аберрантных областей в геноме обязательно должно быть выше, чем второе пороговое значение.
Данное указанное пороговое значение для количества областей также может зависеть от того, насколько сильный дисбаланс имеет место для подсчитываемых областей. Например, количество областей, которое применяют в качестве порогового значения для классификации рака, может зависеть от специфичности и чувствительности (аберрантное пороговое значение), применяемых при выявлении аберрации в каждой области. Например, если аберрантное пороговое значение низкое (например, z-показатель равен 2), тогда пороговое значение количества можно выбирать высоким (например, 150). Но если аберрантное пороговое значение высокое (например, z-показатель равен 3), тогда пороговое значение количества может быть ниже (например, 50). Количество областей, демонстрирующих аберрацию, также может быть взвешенным значением, например одна область, которая демонстрирует высокий дисбаланс, может иметь более высокий весовой коэффициент, чем область, которая демонстрирует лишь малый дисбаланс (т.е. существует больше классификаций, чем просто положительная и отрицательная классификация наличия аберрации).
Соответственно количество (которое может включать количество или размер) областей хромосом, демонстрирующих значительный избыток или недостаток нормированной встречаемости маркерных последовательностей (или другого соответствующего значения для оценки свойства указанной группы) можно применять для оценки тяжести заболевания. Количество областей хромосом с аберрантной нормированной встречаемостью маркерных последовательностей может определяться двумя факторами, а именно числом (или размером) хромосомных аберраций в тканях опухоли и относительной концентрацией ДНК опухолевого происхождения в биологической пробе (например, плазме). Более распространенные типы рака, как правило, обнаруживают больше (и более крупные) хромосомных аберраций. Следовательно, в указанной пробе (например, плазме) потенциально может определяться больше ассоциированных с раком хромосомных аберраций. У пациентов с более распространенным раком более высокая опухолевая нагрузка может приводить к более высокой относительной концентрации ДНК опухолевого происхождения в плазме. Как следствие, ассоциированные с опухолью хромосомные аберрации может быть легче определить в пробе плазмы.
В контексте скрининга или выявления рака количество областей хромосом, проявляющих избыток или недостаток нормированной встречаемости маркерных последовательностей (или другого значения), можно применять для определения вероятности того, что исследуемый субъект болен раком. Если применять уровень отсечки ±2 (т.е. z-показатель >2 или <-2), приблизительно 5% тестируемых областей предположительно дадут значительное отклонение z-показателя от среднего для контрольных субъектов просто из-за вероятности. Когда весь геном делят на сегменты 1 Мб, во всем геноме будет приблизительно 3000 сегментов. Таким образом, приблизительно 150 сегментов предположительно будут демонстрировать z-показатель >2 или <-2.
Таким образом, уровень отсечки (пороговое значение) 150 для числа сегментов с z-показателем >2 или <-2 можно применять для определения наличия ракового заболевания. Для удовлетворения диагностических целей можно выбрать другие уровни отсечки для числа сегментов с аберрантным zпоказателем (например, 100, 125, 175, 200, 250 и 300). Более низкий уровень отсечки, например 100, может приводить к более высокой чувствительности оценки, но к более низкой специфичности, а более высокий уровень отсечки может приводить к большей специфичности, но меньшей чувствительности. Число ложноположительных классификаций можно снизить путем повышения уровней отсечки zпоказателя. Например, если уровень отсечки увеличить до 3, то только 0,3% сегментов будут ложноположительными. В данной ситуации для выявления наличия рака можно применять более 3 сегментов с аберрантным z-показателем. Можно выбирать другие уровни отсечки, например 1, 2, 4, 5, 10, 20 и 30, для удовлетворения разных диагностических целей. Однако чувствительность выявления ассоциированных с раком хромосомных аберраций можно снизить при увеличении количества аберрантных сегментов, требуемых для постановки диагноза.
Один из возможных способов повышения чувствительности без ухудшения специфичности состоит в том, чтобы учитывать результат соседнего сегмента хромосомы. Согласно одному варианту реализации уровень отсечки для z-показателя остается >2 и <-2. Однако область хромосомы можно классифицировать как потенциально аберрантную только тогда, когда два идущих друг за другом сегмента будут демонстрировать аберрации одного и того же типа, например оба сегмента демонстрируют z-показатель >2. Если отклонение в нормированной встречаемости маркерных последовательностей является случайной погрешностью, вероятность того, что два идущих друг за другом сегмента будут ложноположительными в одном и том же направлении, будет равна 0,125% (5%х5%/2). С другой стороны, если хромосомная
- 22 038374 аберрация охватывает два идущих друг за другом сегмента, более низкий уровень отсечки сделает выявление избыточного или недостаточного присутствия указанных сегментов в пробе плазмы более чувствительным. Поскольку отклонение нормированной встречаемости маркерных последовательностей (или другого значения) от среднего значения для контрольных субъектов не связано со случайной погрешностью, последовательные требования классификации не окажут значительного неблагоприятного действия на чувствительность. Согласно другому варианту реализации вместе с применением более высокого уровня отсечки можно добавлять z-показатель соседних сегментов. Например, z-показатель трех идущих друг за другом сегментов можно суммировать и можно применить уровень отсечки 5. Данную концепцию можно распространить на более чем три идущих друг за другом сегмента.
Сочетание количества и аберрантных пороговых значений может также зависеть от цели анализа и любого предшествующего знания об организме (или его отсутствия). Например, если проводят скрининг нормальной здоровой популяции для определения наличия рака, то, как правило, применяют высокую специфичность, потенциально как в отношении количества областей (т.е. высокое пороговое значение для количества областей), так и в отношении порогового значения, когда область определяют как обладающую аберрацией. Однако у пациентов с более высоким риском (например, пациент, жалующийся на новообразование или с отягощенным семейным анамнезом, курильщик, вирус ВИЧ, вирус гепатита или другие вирусы) пороговые значения можно снизить, чтобы чувствительность была более высокой (меньше ложноотрицательных результатов).
Согласно одному варианту реализации, если применяют разрешение 1 Мб и более низкий предел выявления 6,3% ДНК опухолевого происхождения для выявления хромосомной аберрации, может потребоваться число молекул 60000 в каждом сегменте 1 Мб. Это можно перевести приблизительно в 180 млн (60000 считываний/Мбх3000 Мб) выравниваемых считываний на весь геном.
На фиг. 15 показана таблица, иллюстрирующая глубину, требуемую для разного числа сегментов и относительной концентрации фрагментов опухолевого происхождения согласно вариантам реализации настоящего изобретения. В столбце 1510 приведена концентрация фрагментов из клеток опухоли в указанной пробе. Чем выше указанная концентрация, тем легче выявить указанную аберрацию, тем меньше молекул требуется для анализа. В столбце 1520 приведено расчетное требуемое число молекул на один сегмент, которое можно рассчитать при помощи способа, описанного выше относительно глубины.
Более маленький размер сегмента может приводить к более высокому разрешению выявления более маленьких хромосомных аберраций. Однако он может повышать требования к количеству молекул, которые требуется анализировать суммарно. Более крупный размер сегмента может снижать требования к количеству молекул для анализа ценой уменьшения разрешения. Следовательно, можно выявлять только более крупные аберрации. Согласно одному варианту реализации более крупные области, сегменты, демонстрирующие аберрацию, можно разделить и указанные подобласти анализировать, получая более высокое разрешение (например, как описано выше). В столбце 1530 приведен размер каждого сегмента. Чем меньше значение, тем больше областей применяется. В столбце 1530 приведено число молекул, которое требуется анализировать для всего генома. Соответственно, если есть оценка (или минимальная концентрация для выявления), можно определить число молекул для анализа.
VI. Прогресс во времени.
По мере того как опухоль прогрессирует, количество опухолевых фрагментов может увеличиваться, поскольку опухоль будет выделять больше фрагментов ДНК (например, из-за роста опухоли, расширяющегося некроза или большей васкуляризации). Большее количество фрагментов ДНК из тканей опухоли в плазме будет увеличивать степень дисбаланса в плазме (например, будет увеличиваться различие во встречаемости маркерных последовательностей между двумя гаплотипами при RHDO). Кроме того, поскольку количество фрагментов опухолевого происхождения увеличивается, количество областей, где существует аберрация, можно определять легче. Например, когда опухоль мала и выделяет малое количество фрагментов раковой ДНК, количество ДНК опухолевого происхождения для определенной области может быть столь мало, что аберрацию выявить не удается, поскольку нельзя достичь статистически значимого различия, поскольку недостаточно фрагментов для анализа. Даже когда опухоль мала, можно анализировать больше фрагментов, но для этого может потребоваться большой образец (например, большое количество плазмы).
При отслеживании прогресса рака можно применять объем аберрации в одной или более областях (например, по дисбалансу или требуемой глубине) или объем (количество или размер) областей хромосом, проявляющих аберрацию. Согласно одному примеру, если объем аберрации одной области (или нескольких областей) увеличивается быстрее, чем объем аберраций других областей, то такую область(и) можно применять в качестве предпочтительного маркера для отслеживания рака. Такое увеличение может быть следствием того, что опухоль стала больше и, таким образом, выделяет много фрагментов и/или что указанная область многократно амплифицирована. Можно также отслеживать показатель аберрации (например, объем аберрации, или количество областей, демонстрирующих аберрации, или их сочетание) после операции для подтверждения того, что опухоль была удалена должным образом.
Согласно разным вариантам применения указанной технологии определение относительной концентрации ДНК опухолевого происхождения применяют для оценки стадии, прогноза или отслеживания
- 23 038374 прогресса рака. Оценка прогресса может предоставить информацию о текущей стадии рака и о том, как быстро опухоль растет или распространяется. Термин стадия рака относится ко всем или части из следующих пунктов: размер опухоли, гистологическое проявление, наличие/отсутствие вовлечения лимфатических узлов, а также наличие/отсутствие отдаленных метастазов. Прогнозирование рака подразумевает оценку вероятности прогрессирования заболевания и/или вероятность выживания при раке. Также оно может подразумевать оценку времени, в течение которого у пациента не будет клинического прогрессирования или длительности выживания. Под мониторингом рака можно понимать отслеживание с целью определить, прогрессировало ли заболевание (например, увеличение в размере опухоли, увеличение вовлечения лимфатических узлов или распространение на отделанные органы, т.е. метастазирование). Также мониторинг может подразумевать отслеживание того, удалось ли контролировать опухоль посредством лечения. Например, если лечение эффективно, то можно наблюдать уменьшение размера опухоли, регрессию метастазов или вовлечения лимфатических узлов, улучшение общего состояния пациента (например, повышение массы тела).
А. Определение относительной концентрации ДНК опухолевого происхождения.
Один из способов отслеживания объема увеличения аберрации для одной или более областей состоит в определении относительной концентрации раковой ДНК для определенной области(ей). Изменение относительной концентрации раковой ДНК затем можно применять для отслеживания указанной опухоли во времени. Такое отслеживание можно применять для диагностики, например первое измерение может дать информацию о фоновом уровне (который может соответствовать общему уровню аберрации у субъекта), а более поздние измерения могут показать изменения, которые могут указывать на рост опухоли (то есть, рака). Изменения относительной концентрации раковой ДНК также можно применять для прогнозирования, насколько хорошо пройдет лечение. Согласно другим вариантам применения данной технологии увеличение относительной концентрации ДНК опухолевого происхождения в плазме может указывать на плохой прогноз или увеличение опухолевой нагрузки у указанного пациента.
Относительную концентрацию раковой ДНК можно определять разными способами. Например, различие во встречаемости маркерных последовательностей из одного гаплотипа по сравнению с другим (или одной области по сравнению с другой). Другой способ основан на определении глубины (т.е. числа анализируемых фрагментов) до выявления статистически значимого различия. Для более раннего примера для определения относительной концентрации ДНК опухолевого происхождения в биологическом образце (например, плазме) путем анализа областей хромосомы с потерей гетерозиготности можно применять различие в дозировке гаплотипов.
Было показано, что количество ДНК опухолевого происхождения положительно коррелирует с опухолевой нагрузкой у пациентов с раком (Lo et al. Cancer Res. 1999;59:5452-5. and Chan et al. Clin Chem. 2005;51:2192-5). Следовательно, для отслеживания прогрессирования заболевания пациента можно применять последовательный мониторинг относительной концентрации ДНК опухолевого происхождения в биологических образцах (например, образцах плазмы) посредством анализа RHDO. Например, мониторинг относительной концентрации ДНК опухолевого происхождения в отбираемых последовательно биологических образцах (например, плазмы) после лечения можно применять для определения успеха лечения.
На фиг. 16 показан принцип измерения относительной концентрации ДНК опухолевого происхождения в плазме на основании анализа RHDO согласно вариантам реализации настоящего изобретения. Определяют дисбаланс между двумя гаплотипами, и степень дисбаланса можно применять для определения относительной концентрации ДНК опухолевого происхождения в указанном образце.
Нар I и Нар II представляют собой два гаплотипа в неопухолевых тканях. Нар II частично делетирован в тканях опухоли в подобласти 1610. Следовательно, Нар II ассоциированные фрагменты, соответствующие делетированной 1610 области, которые определяют в плазме, обусловлены неопухолевыми тканями. С одной стороны, 1610 область в Нар I присутствует как в опухолевых, так в неопухолевых тканях. Следовательно, различие между встречаемостью считываний Нар I и Нар II может представлять собой количество ДНК опухолевого происхождения в плазме.
Относительную концентрацию ДНК опухолевого происхождения (F) можно рассчитать на основании числа секвенированных считываний (маркерных последовательностей) из подвергшихся и не подвергшихся делеции хромосом для областей хромосом, охваченных ПГ, по следующей формуле:
где NHapI представляет собой число секвенированных считываний, соответствующих аллелям в Нар I для гетерозиготных SNP, расположенных в областях хромосом, охваченных ПГ; a NHapII представляет собой число секвенированных считываний, соответствующих аллелям в Нар II для гетерозиготных SNP, расположенных в 1610 области хромосомы, охваченной ПГ.
Приведенная выше формула аналогична для определения р как накопленной встречаемости маркерных последовательностей для гетерозиготных локусов, расположенных в областях хромосом, не включающих делецию (Нар I) и для определения q как накопленной встречаемости маркерных последовательностей для области хромосомы, включающей делецию (Нар II) 1610, причем относительная кон- 24 038374 центрация опухолевой ДНК в указанном образце (F) рассчитывается как F=1-q/p. Для примера, проиллюстрированного на фиг. 11, относительная концентрация ДНК опухолевого происхождения составляет
14% (1-104/121).
Относительную концентрацию ДНК опухолевого происхождения в пробах плазмы пациентов с НСС определяли до резекции опухоли и после нее. До резекции опухоли NHapI для первого гаплотипа заданной области хромосомы составляло 30443, a NHapII для первого гаплотипа указанной области хромосомы составляло 16221, тогда F составляет 46,7%. После резекции опухоли NHapI составило 31534, a NHapII составило 31089, тогда F составляет 1,4%. Данный мониторинг показывает, что резекция опухоли была успешной.
Также для определения относительной концентрации можно применять степень изменения профиля размеров циркулирующей ДНК. Согласно одному варианту применения можно применять точное распределение по размеру ДНК плазмы, происходящей как из опухолевых, так из неопухолевых тканей, и затем измеренное распределение по размерам, попадающее между двумя известными распределениями, может дать относительную концентрацию (например, с применением линейной модели между двумя статистическими показателями распределений по размеру опухолевых и неопухолевых тканей). В качестве альтернативы можно применять последовательный мониторинг изменений размеров. Согласно одному аспекту определяют изменение распределения по размеру как пропорциональное относительной концентрации ДНК опухолевого происхождения в плазме.
Аналогичным образом можно также применять различие между разными областями, т.е. способы неспецифического выявления гаплотипа, описываемые выше. Согласно способам подсчета маркерных последовательностей для мониторинга прогрессирования заболевания можно применять несколько параметров. Например, можно применять величину z-показателя для областей, проявляющих хромосомные аберрации, которая отражает относительную концентрацию ДНК опухолевого происхождения в биологическом образце (например, плазме). Степень присутствия в избытке или недостатке конкретной области пропорциональна относительной концентрации ДНК опухолевого происхождения в образце и степени изменения или количеству числа копий в тканях опухоли. Величина z-показателя представляет собой меру степени присутствия в избытке или недостатке конкретной области хромосомы в пробе по сравнению с контрольными субъектами. Следовательно, величина z-показателя может соответствовать относительной концентрации ДНК опухолевого происхождения в пробе и, следовательно, опухолевой нагрузке у пациента.
B. Отслеживание количества областей.
Как упоминалось выше, количество областей, проявляющих хромосомную аберрацию, можно применять для скрининга на рак, а также его можно применять для мониторинга и составления прогноза. В качестве примера мониторинг можно применять для определения текущей стадии рака, если рак появляется вновь, и если подействовало лечение. По мере того как опухоль прогрессирует, геномный состав опухоли будет деградировать еще больше. Для определения такой продолжающейся деградации можно применять способы отслеживания некоторых областей (например, заранее определенных областей длиной 1 Мб), чтобы определить прогрессирование опухоли. Тогда опухоли на более поздних стадиях будут содержать больше областей, обнаруживающих аберрации.
C. Способ.
На фиг. 17 показана блок-схема, иллюстрирующая способ определения прогресса хромосомных аберраций в организме с применением биологических проб, включающих молекулы нуклеиновых кислот согласно вариантам реализации настоящего изобретения.
Согласно одному варианту реализации, по меньшей мере, некоторые молекулы нуклеиновых кислот находятся в бесклеточной форме. В качестве примера указанные хромосомные аберрации могут происходить из злокачественных опухолей или предраковых поражений. Также увеличение аберраций может быть связано с тем, что в указанном организме со временем становится все больше клеток, содержащих хромосомные аберрации, или с тем, что в указанном организме определенная доля клеток содержит повышенное количество аберраций на клетку. В качестве примера снижения, лечение (например, операция или химиотерапия) может вызывать удаление или уменьшение числа клеток, ассоциированных с раком.
На этапе 1710 идентифицируют одну или более неперекрывающихся областей хромосом в указанном организме. Каждая область хромосомы включает множество локусов. Указанные области можно выявить при помощи подходящего способа, например способа, описываемого в настоящем описании.
Этапы 1720-1750 проводят для каждого из множества моментов времени. Каждый момент времени соответствует разному времени отбора образца из организма. Текущий образец - это образец, анализируемый для данного периода времени. Например, образец можно отбирать раз в месяц в течение 6 месяцев и анализ можно проводить вскоре после отбора указанного образца. В качестве альтернативы анализ можно проводить после того, как будут сделаны несколько измерений за несколько периодов времени.
На этапе 1720 анализируют текущий биологический образец из указанного организма и определяют локализацию молекулы нуклеиновой кислоты в эталонном геноме указанного организма. Локализацию можно определять при помощи любого из способов, упоминаемых в настоящем описании, например путем секвенирования фрагментов с целью получения секвенированных маркерных последовательностей и
- 25 038374 выравнивания указанных секвенированных маркерных последовательностей с эталонным геномом. Также для гаплотип-специфичных способов можно определять конкретный гаплотип молекулы.
Этапы 1730-1750 проводят для каждой из одной или более областей хромосом. Когда применяют множество областей, можно применять варианты реализации из раздела V. На этапе 1730 идентифицируют соответствующую группу молекул нуклеиновых кислот как происходящую из указанной области хромосомы, на основании идентифицированных локализаций. Соответствующая группа включает по меньшей мере одну молекулу нуклеиновой кислоты, локализованную в каждом из множества локусов указанной области хромосомы. Согласно одному варианту реализации указанная группа может быть представлена фрагментами, которые выравниваются с конкретным гаплотипом указанной области хромосомы, например, как в способе RHDO, описанном выше. Согласно другому варианту реализации указанная группа может быть представлена любым фрагментом, который выравнивается с указанной областью хромосомы, как в способах, описанных в разделе V.
На этапе 1740 компьютерная система рассчитывает соответствующее значение для соответствующей группы молекул нуклеиновых кислот. Указанное соответствующее значение определяет свойство молекул нуклеиновых кислот соответствующей группы. Указанное соответствующее значение может быть любым из значений, упоминаемых в настоящем описании. Например, указанное значение может быть количеством фрагментов в указанной группе или статистическим показателем распределения по размеру фрагментов в указанной группе. Указанное соответствующее значение также может быть нормированным значением, например встречаемостью маркерных последовательностей, поделенной на общее количество встречаемости маркерных последовательностей для указанной пробы или количество встречаемости маркерных последовательностей для эталонной области. Указанное соответствующее значение также может быть различием или отношением к другому значению (например, при RHDO), что позволяет определить свойство различия для указанной области.
На этапе 1750 указанное соответствующее значение сравнивают с эталонным значением и определяют классификацию или определяют, демонстрирует ли указанная область хромосомы делецию или амплификацию. Указанное эталонное значение может быть любым пороговым или эталонным значением, описываемым в настоящем описании. Например, указанное эталонное значение может быть пороговым значением, определенным для нормальных проб. Для RHDO указанное соответствующее значение может быть различием или отношением встречаемости маркерных последовательностей для двух гаплотипов, а указанное эталонное значение может быть пороговым значением для определения того, существует ли статистически значимое отклонение. В качестве еще одного примера указанное эталонное значение может быть встречаемостью маркерных последовательностей или показателем размера для другого гаплотипа или области, а сравнение может включать вычисление различия или отношения (или функции от них) и последующее определение того, превышает ли указанное различие или отношение пороговое значение. Указанное эталонное значение можно определять согласно любому подходящему способу и критерию, например, описанному в настоящем описании.
На этапе 1760 указанную классификацию каждой из областей хромосом в указанном множестве моментов времени применяют для определения прогрессирования хромосомных аберраций в организме. Информацию о прогрессировании можно применять для определения наличия ракового заболевания в указанном организме, определения стадии рака и прогнозирования состояния при раке. Каждое из таких определений может подразумевать классификацию рака, как описано в настоящем описании.
Указанную классификацию рака можно проводить разными способами. Например, можно подсчитывать объем аберрантных областей и сравнивать его с пороговым значением. Указанная классификация для областей может принимать числовое значений (т.е. концентрация опухоли, причем соответствующее и эталонное значения являются значениями для разных гаплотипов или разных областей), и можно определять изменение указанной концентрации. Изменение концентрации можно сравнивать с пороговым значением и определять, есть ли значимое увеличение, что должно сигнализировать о существовании опухоли.
VII. Примеры.
A. RHDO с применением SPRT.
В данном разделе представлен пример применения анализа относительной дозировки гаплотипа (RHDO) с применением SPRT у пациента с печеночно-клеточным раком (НСС). В ткани опухоли указанного пациента выявили делецию одной из двух 4 хромосом. Это приводит к потере гетерозиготности для SNP в 4 хромосоме. Для гаплотипирования указанного пациента анализировали геномную ДНК самого пациента, его жены и сына и определяли генотипы трех указанных индивидуумов. Затем на основании их генотипов получили структурные гаплотипы указанного пациента. Проводили массивнопараллельное секвенирование, идентифицировали и подсчитывали секвенированные считывания с аллелями SNP, соответствующими двум указанным гаплотипам 4 хромосомы.
Уравнения и принципы RHDO и SPRT были описаны выше. Согласно одному варианту реализации анализ RHDO можно запрограммировать на определение, например, 10% различия дозировки гаплотипов в пробе ДНК, которое соответствует присутствию 10% ДНК опухолевого происхождения, когда один из двух гаплотипов амплифицирован или делетирован. Согласно другим вариантам реализации чувстви- 26 038374 тельность анализа RHDO можно установить на уровне 2, 5, 15, 20, 25, 30, 40, 50% и т.д., ДНК опухолевого происхождения в указанном образце ДНК. Чувствительность анализа RHDO можно корректировать по параметру для расчета верхнего и нижнего порогового значения кривых SPRT классификации. Таким корректируемым параметром может быть желаемый уровень предела определения (например, какой процент концентрации опухоли должен быть обнаруживаемым, что влияет на количество анализируемых молекул) и пороговое значения для классификации, например, с применением отношения шансов (отношение встречаемости маркерных последовательностей для одного гаплотипа к встречаемости маркерных последовательностей для другого гаплотипа).
При таком анализе RHDO нулевая гипотеза состоит в том, что два гаплотипа для 4 хромосомы присутствуют в одинаковой дозировке. Альтернативная гипотеза состоит в том, что дозировки указанных двух гаплотипов в указанном биологическом образце (например, плазме) различаются более чем на 10%. Число секвенированных считываний с аллелями SNP, соответствующими двум указанным гаплотипам, сравнивали статистическими методами в отношении двух указанных гипотез по мере того, как накапливались разные SNP. Классификацию SNP проводят, когда накопленных данных становится достаточно, чтобы определить, присутствуют ли два указанных гаплотипа в равном количестве или их количества статистически различаются по меньшей мере на 10%. Типичный блок классификации SPRT на q-плече 4 хромосомы показан на фиг. 18. Здесь применяют пороговое значение 10% только в целях иллюстрации. Также можно выявлять другие степени различия (например, 0,1, 1, 2, 5, 15 или 20%). Как правило, чем ниже степень различия, которую желательно выявить, тем больше молекул ДНК требуется для анализа. И наоборот, чем выше степень различия, которую желательно выявить, тем меньше число молекул ДНК, которое требуется для анализа, при котором все же можно достичь статистически значимого результата. Для данного анализа SPRT применяют отношение шансов, но можно применять и другие параметры, такие как z-показатель или р-показатель.
В указанном образце плазмы пациента с НСС, отобранном во время диагностики, было сделано 76 и 148 успешных классификаций RHDO для р и q-плечей 4 хромосомы соответственно. Все классификации RHDO указывают на то, что в образце плазмы, отобранном во время диагностики, был дисбаланс дозировки гаплотипов. Для сравнения в также анализировали образцы плазмы пациента, отобранные после хирургической резекции опухоли, как показано на фиг. 18В. Для образцов, отобранных после лечения, было сделано 4 и 9 успешных классификаций RHDO для р и q-плечей 4 хромосомы соответственно. Все четыре классификации RHDO указывают на то, что в указанном образце плазмы нет обнаруживаемого дисбаланса дозировки гаплотипа >10%. Из 9 классификаций RHDO для хромосомы 4q, 7 указывают на отсутствие дисбаланса дозировки гаплотипа, а 2 указывают, что такой дисбаланс присутствует. Количество блоков RHDO, демонстрирующих дисбаланс дозировки гаплотипа >10, значительно снизилось после резекции опухоли, что указывает на то, что размер области хромосомы, демонстрирующей дисбаланс дозировки гаплотипа >10%, стал значительно меньше в пробе после лечения, чем в пробе до лечения. Данные результаты указывают на то, что относительная концентрация ДНК опухолевого происхождения в плазме снизилась после хирургической резекции опухоли.
По сравнению с не гаплотип-специфичными способами анализ RHDO может обеспечить более точную оценку относительной концентрации ДНК опухолевого происхождения и особенно полезен при мониторинге прогрессирования заболевания. Таким образом, можно ожидать, что случаи прогрессирования заболевания могут проявлять увеличение относительной концентрации ДНК опухолевого происхождения в плазме; тогда как случаи стабильного заболевания или случаи, когда опухоль регрессирует, могут демонстрировать снижение относительной концентрации ДНК опухолевого происхождения в плазме.
В. Направленный анализ.
Согласно избранным вариантам реализации можно проводить универсальное секвенирование фрагментов ДНК и последующее применение способа направленного обогащения. Такой способ в настоящем описании также называют обогащенным направленным секвенированием. Один вариант реализации такого способа состоит в предварительном отборе фрагментов с применением захвата из раствора (например, система Agilent SureSelect, пользовательский набор для обогащения Illumina TruSeq (illumina.com/applications/sequencing/targeted_resequencing.ilmn) или с применением пользовательского набора для обогащения MyGenostics GenCap (mygenostics.com/)) или захвата на основе матриц (например, с применением системы Roche NimbleGen). Хотя можно захватывать некоторые другие области, более предпочтительно захватывать определенные области. Такие способы могут позволить проводить анализ таких областей с большей глубиной (например, можно секвенировать или анализировать больше фрагментов при помощи количественной ПЦР) и/или с меньшими затратами. При большей глубине может увеличиваться чувствительность в указанной области. Можно осуществлять другие способы обогащения на основании размеров фрагментов и характера метилирования.
Соответственно альтернативой анализа пробы ДНК общегеномным способом является нацеливание на рассматриваемые области для выявления распространенных хромосомных аберраций. Направленный способ может потенциально повысить экономическую эффективность данного способа, поскольку процесс анализа можно главным образом сосредоточить на областях, где потенциально присутствуют хромосомные аберрации, или на областях с изменениями, которые могут быть характерны для определенно
- 27 038374 го типа опухоли, или на областях с изменениями, которые могут обладать особой клинической значимостью. Примеры последнего варианта изменений могут включать в себя изменения, которые могут возникать на ранней стадии онтогенеза конкретного типа рака (например, наличие увеличения числа копий 1q и 8q, и делеции 8q является ранним хромосомным изменением при НСС - van Malenstein et al.Eur J Cancer 2011;47:1789-97); или изменения, которые ассоциированы с хорошим и плохим прогнозом (например, во время прогрессирования опухоли наблюдается добавление в 6q и 17q и потеря в 6q и 9q, а с более плохим выживанием у пациентов с раком ободочной и прямой кишки ассоциировано наличие ПГ в 18q, 8р и 17р - Westra et al. Clin Colorectal Cancer 2004;4:252-9); или изменения, которые являются прогностическим признаком ответа на лечение (например, наличие добавления в 7р является прогностическим признаком ответа на ингибиторы тирозинкиназы у пациентов с мутациями в рецепторе эпидермального фактора роста - Yuan et al. J ClinOncol 2011;29:3435-42). Другие примеры областей генома, которые изменены при раковом заболевании, можно найти в многочисленных базах данных (например, база данных Проекта анатомии генома при раке (cgap.nci.nih.gov /Chromosomes/RecurrentAberrataions) и Атлас генетики и цитогенетики в онкологии и гематологии (atlasgeneticsoncology.org Tumors/Tumorliste.html). В отличие от этого, при ненаправленном общегеномном способе области, в которых с малой вероятностью возникают хромосомные аберрации, можно анализировать в той же степени, что и области с потенциальными аберрациями.
Мы применили стратегию направленного обогащения для анализа проб плазмы, отобранных у 3 пациентов с НСС и 4 здоровых контрольных субъектов. Направленное обогащение проводили с применением системы захвата SureSelect от компании Agilent (Gnirke et al. Nat. Biotechnol 2009.27:182-9). Система SureSelect была выбрана в качестве примера возможной технологии направленного обогащения. Также можно применять другие системы направленного захвата на основе жидкой фазы (пользовательская система обогащения Illumina TruSeq) или твердой фазы (например, система Roche-Nimblegen), a также системы направленного обогащения на основе ампликона (например, система QuantaLife и система RainDance). Зонды для захвата разработаны так, чтобы они были локализованы в областях хромосом, которые часто и редко проявляют аберрации при НСС. После направленного захвата каждую пробу ДНК секвенируют при помощи одной полосы измерительной кюветы анализатора IlluminaGAIIx. Области, в которых редко возникают увеличение числа копий и делеции, применяют в качестве эталона для сравнения с областями, в которых амплификации и делеции присутствуют чаще.
На фиг. 19 показаны распространенные хромосомные аберрации, обнаруживаемые при НСС (фигура адаптирована из Wong et al (Am J Pathol 1999;154:37-43). Линии с правой стороны идеограммы хромосомы показывают добавление хромосом, а линии с левой стороны соответствуют потере хромосом в пробах индивидуального пациента. Толстые линии показывают добавление высокого уровня. Квадратами показана локализация зондов для направленного захвата.
Направленный анализ с подсчетом маркерных последовательностей
Для выявления хромосомных аберраций мы сначала рассчитали нормированную встречаемость маркерных последовательностей для областей с потенциальными аберрациями и эталонных областей. Нормированные встречаемости маркерных последовательностей затем корректировали на содержание GC указанной области, как ранее было описано у Chen et al (PLoS One 2011;6:e21791). В настоящем примере р-плечо 8 хромосомы было выбрано в качестве области потенциальной аберрации, а q-плечо 9 хромосомы было выбрано в качестве эталонной области. Ткани опухоли трех пациентов с НСС анализировали на наличие хромосомных аберраций при помощи матрицы AffymetrixSNP 6.0. Изменения дозировки хромосом для 8р и 9q в тканях опухоли показаны ниже для 3 указанных пациентов. У пациента НСС 013 была потеря 8р и не было изменений в 9q. У пациента НСС 027 было добавление в 8р и не было изменений в 9q. У пациента НСС 023 была потеря 8р и не было изменений в 9q.
Затем для трех указанных пациентов с НСС и четырех здоровых контрольных субъектов рассчитывали отношение нормированных встречаемостей маркерных последовательностей между хромосомами 8р и 9q. На фиг. 20А показаны результаты отношения нормированных встречаемостей маркерных последовательностей для пациентов с НСС и здоровых субъектов. Для случаев НСС 013 и НСС023 наблюдалось сниженное отношение нормированных встречаемостей маркерных последовательностей между 8р и 9q. Это согласуется с наблюдением, касающимся потери 8р в тканях опухоли. Для случая НСС 027 наблюдалось повышенное отношение, что согласуется с добавлением 8р в тканях опухоли в данном случае. Пунктирные линии показывают область с двумя стандартными отклонениями от среднего значения для четырех случаев нормы.
Направленный анализ по размеру
В предыдущих разделах описан принцип выявления ассоциированных с раком изменений профиля размеров для фрагментов ДНК в плазме у пациентов, страдающих раковыми заболеваниями. Изменения размеров также можно выявлять при помощи способа направленного обогащения. Для указанных трех случаев (НСС 013, НСС 027 и НСС023) размер каждого секвенированного фрагмента ДНК определяли после выравнивания секвенированных считываний с эталонным геномом человека. Заключение о размере секвенированных фрагментов ДНК делали на основании координат наиболее удаленных от центра нуклеотидов на обоих концах. Согласно другим вариантам реализации можно секвенировать целый
- 28 038374 фрагмент ДНК, и затем размер указанного фрагмента можно определить прямо на основании секвенированной длины. Распределение по размерам фрагментов ДНК, выравнивающихся с хромосомой 8р, сравнивали с распределением по размерам двух фрагментов ДНК, выравнивающихся с хромосомой 9q. Для выявления различия распределений по размеру для двух популяций ДНК сначала для каждой популяции в настоящем примере определяли долю фрагментов ДНК короче, чем 150 по. Согласно другим вариантам реализации можно применять другие уровни отсечки по размеру, например, 80 по, 110 по, 100 по, 110 по, 120 по, 130 по, 140 по, 160 по и 170 по. Затем определяли значения ΔQ как разность двух указанных долей. ΔQ= Q8p-Q9q, где Q8p представляет собой долю фрагментов ДНК, выравнивающихся с хромосомой 8р, которые короче чем 150 по; a Q9q, представляет собой долю фрагментов ДНК, выравнивающихся с хромосомой 9q, которые короче чем 150 по.
Поскольку более узкое распределение по размерам фрагментов ДНК может давать более высокое значение доли ДНК короче уровня отсечки (например, 150 по в настоящем примере), более высокое (более положительное) значение ΔF может соответствовать более узкому распределению фрагментов ДНК, выравнивающихся с хромосомой 8р, по сравнению с распределением фрагментов ДНК, выравнивающихся с хромосомой 9q. Напротив, более низкий (или более отрицательный) результат может указывать на более широкое распределение по размерам фрагментов ДНК, выравнивающихся с хромосомой 8р, по сравнению с распределением фрагментов ДНК, выравнивающихся с хромосомой 9q.
На фиг. 20В показаны результаты анализа по размерам после направленного обогащения и массивно-параллельного секвенирования для 3 пациентов с печеночно-клеточным раком и 4 здоровых субъектов из контрольной группы. Положительные значения ΔQ у четырех здоровых контрольных субъектов указывает на несколько более узкое распределение по размерам фрагментов ДНК, выравнивающихся с хромосомой 8р, по сравнению с распределением фрагментов ДНК, выравнивающихся с хромосомой 9q. Пунктирные линии показывают интервал ΔQ в пределах двух стандартных отклонений от среднего для четырех контрольных субъектов. Значения ΔQ для случаев НСС 013 и НСС 023 были ниже среднего значения для контрольных субъектов более чем на два стандартных отклонения. В указанных двух случаях имела место делеция хромосомы 8р в тканях опухоли. Делеция 8р в опухоли может приводить к сниженному распределению ДНК опухолевого происхождения в плазме для данной области хромосомы. Поскольку ДНК опухолевого происхождения в кровяном русле короче, чем ДНК, происходящая из неопухолевых тканей, это может приводить к кажущемуся более широкому распределению фрагментов ДНК в плазме, выравнивающихся с хромосомой 8р. Это согласуется с более низким (более отрицательным) значением ΔQ в двух указанных случаях. Напротив, увеличение числа копий 8р в случае НСС 027 могло привести к кажущемуся более узкому распределению фрагментов ДНК, выравнивающихся с данной областью. Таким образом, более высокая доля ДНК фрагментов в плазме, выравнивающихся с хромосомой 8р, может считаться короткими. Это согласуется с тем наблюдением, что значение ΔQ в случае НСС 027 более положительное, чем у здоровых контрольных субъектов.
С. Множество областей для выявления хромосомных аберраций опухолевого происхождения.
В тканях опухоли часто выявляются хромосомные аберрации, включая делецию и увеличения числа копий определенных областей хромосом. При разных типах рака наблюдаются характерные картины хромосомных аберраций. Здесь мы применяем несколько примеров, чтобы проиллюстрировать разные способы выявления указанных ассоциированных с раком хромосомных аберраций в плазме пациентов, страдающих раковыми заболеваниями. Наш способ также применим для скрининга на рак и мониторинга прогрессирования заболевания, а также ответа на лечение. Анализировали пробы, отобранные у одного пациента с НСС и двух пациентов с раком носоглотки (NPC). У пациента с НСС пробы венозной крови отбирали перед хирургической резекцией опухоли и после нее. У двух пациентов с NPC пробы венозной крови отбирали во время диагностики. Кроме того, анализировали пробы плазмы крови одного хронического носителя вируса гепатита В и одного субъекта с определимой ДНК вируса Эпштейна-Барр в плазме. У указных двух субъектов рака не обнаружено.
Определение хромосомных аберраций опухолевого происхождения проводили при помощи анализа на микроматрицах. Точнее говоря, ДНК, экстрагированную из клеток крови и пробы опухоли пациентов с НСС, анализировали при помощи системы микроматриц Asymetrix SNP6.0. Генотипы клеток крови и тканей опухоли определяли при помощи Affymetrix Genotyping Console v4.0. Хромосомные аберрации, включая добавления и делеции, определяли при помощи при помощи алгоритма Birdseed v2, основанного на интенсивностях разных аллелей SNP и зондов вариации числа копий (CNV) на указанной микроматрице.
Анализ, основанный на подсчете
Для проведения анализа на основе подсчета секвенированных маркерных последовательностей у каждого из указанных субъектов отбирали по десять миллилитров венозной крови. Для каждой пробы крови после ее центрифугирования отделяли плазму.
ДНК выделяли из 4-6 мл плазмы при помощи набора QIAmp blood mini (Qiagen). Библиотеку ДНК плазмы создавали, как было описано ранее (Lo YMD. Sci Transl Med 2010,2:61ra91), и затем ее подвергали массивно-параллельному секвенированию с применением платформы Illumina Genome Analyzer.
- 29 038374
Проводили секвенирование молекул ДНК плазмы с парными концами. Каждую молекулу секвенировали с каждого из двух концов на протяжении 50 по, т.е. суммарно на протяжении 100 по на молекулу. Два конца каждой молекулы выравнивали с маскированным геномом человека без повторов (Hg18 NCBI.36, загружен с сайта UCSC genome.ucsc.edu) при помощи программы SOAP2 (soap.genomics.org.cn/) (Li R et al. Bioinformatics 2009, 25:1966-7).
Затем указанный геном разделяли на несколько сегментов длиной 1 мегабаза (1 Мб) и определяли число секвенированных считываний, выравнивающихся с каждым из сегментов 1 Мб. Встречаемость маркерных последовательностей в каждом интервале затем корректировали при помощи алгоритма, основанного на локально взвешенном сглаживании диаграммы рассеяния (LOESS) в соответствии с содержанием GC в каждом интервале (Chen E et al. PLoS One 2011, 6:e21791). Такая коррекция направлена на минимизацию количественных погрешностей, связанных с секвенированием, которые возникают из-за различий содержания GC в разных сегментах генома. Упоминаемое выше разделение на сегменты 1 Мб применяются в целях иллюстрации. Также можно применять другие размеры сегментов, например 2 Мб, 10 Мб, 25 Мб или 50 Мб. Также возможно выбирать размер сегмента на основании геномных характеристик конкретной опухоли у конкретного пациента и конкретного типа опухоли в целом. Кроме того, если можно показать, что процесс секвенирования обладает низкой погрешностью в связи с GC, например для технологий секвенирования отдельных молекул, таких как система Helicos (www.helicosbio.com) или система Pacific Biosciences Single Molecular Real-Time (www.pacificbiosciences.com), этап коррекции GC можно пропустить.
В предыдущем исследовании мы секвенировали 57 образцов плазмы, отобранных у пациентов, не страдающих раковыми заболеваниями. Результаты указанного секвенирования были применены для определения эталонного диапазона встречаемости маркерных последовательностей для каждого сегмента 1 Мб. Для каждого сегмента 1 Мб определяли среднее и стандартное отклонение встречаемости маркерных последовательностей у 57 индивидуумов. Затем результаты исследования субъектов выражали в виде z-показателя, который рассчитывали по следующей формуле:
z-показатель=(количество секвенированных маркерных последовательностей, в данном случае среднее)/СО, где термин среднее относится к количеству секвенированных маркерных последовательностей, выравнивающихся с конкретным сегментом 1 Мб для эталонных проб; а СО - стандартное отклонение количества секвенированных маркерных последовательностей, выравнивающихся с конкретным сегментом 1 Мб для эталонных проб.
На фиг. 21-24 показаны результаты анализа на основе подсчета секвенированных маркерных последовательностей у четырех исследуемых субъектов. Сегменты 1 Мб показаны на краю графиков. Номера и идеограммы хромосом человека (наружный круг) ориентированы от теломеры короткого плеча к теломере длинного плеча по часовой стрелке (центромеры показаны желтым). На фиг. 21 внутренняя окружность 2101 показывает области аберрации (делеции или увеличения числа копий), определенные при анализе указанной опухоли. Внутренняя окружность 2101 показана с пятью шкалами. Шкала простирается от -2 (самая внутренняя линия) до +2 (самая наружная линия). Значение -2 соответствует потере обеих копий хромосом для соответствующей области. Значение -1 соответствует потере одной из двух копий хромосом. Значение 0 соответствует отсутствию добавления или потери хромосом. Значение +1 соответствует добавлению одной копии хромосомы, а +2 соответствует добавлению двух копий хромосомы.
Средняя окружность 2102 показывает результаты анализа плазмы. Можно видеть, что указанные результаты являются зеркальным отражением внутреннего круга. Средняя окружность 2102 содержит больше делений шкалы, но прогрессирование такое же. Наружная окружность 2103 показывает точки данных, полученные при анализе данных после лечения, и указанные точки данных показаны серым (подтверждение отсутствия избыточного/недостаточного присутствия - отсутствия аберраций).
Области хромосом с присутствием в избытке секвенированных маркерных последовательностей в плазме (z-показатель >3) показаны зелеными точками 2110. Области без значимых хромосомных аберраций, выявленные в плазме (z-показатель от -3 до 3) показаны серыми точками. Присутствие в избытке/недостатке нормируют на общее количество встречаемости. В случае амплификации перед секвенированием при нормировке можно учесть погрешность GC.
На фиг. 21 показаны круговые диаграммы для пациентов с НСС, на которых изображены данные о подсчете секвенированных маркерных последовательностей в ДНК плазмы согласно вариантам реализации настоящего изобретения. Линии, проходящие из внутренней части наружу: хромосомные аберрации в ткани опухоли, выявляемые при анализе на микроматрицах (красный и зеленый цвет соответствует делеции и увеличению числа копий, соответственно); анализ z-показателя для пробы плазмы, полученной до хирургической резекции опухоли и через 1 месяц после резекции. До резекции опухоли хромосомные аберрации, выявляемые в плазме, коррелируют с аберрациями, идентифицируемыми в ткани опухоли посредством анализа на микроматрицах. После резекции опухоли большинство ассоциированных с раком хромосомных аберраций в плазме исчезло. Указанные данные показывают ценность такого способа при мониторинге прогрессирования заболевания и эффективности лечения.
На фиг. 22 показан анализ на основе подсчета секвенированных маркерных последовательностей в
- 30 038374 пробе плазмы хронического носителя HBV без НСС согласно вариантам реализации настоящего изобретения. В отличие от пациента с НСС (фиг. 21), ассоциированные с раком хромосомные аберрации в плазме данного пациента не выявлялись. Указанные данные показывают ценность такого способа при скрининге на рак и мониторинге.
На фиг. 23 показан анализ на основе подсчета секвенированных маркерных последовательностей в образце плазмы пациента NPC 3 стадии согласно вариантам реализации настоящего изобретения. В пробе плазмы, отобранной перед проведением лечения, определялись хромосомные аберрации. Точнее говоря, значимые аберрации были идентифицированы в хромосомах 1, 3, 7, 9 и 14.
На фиг. 24 показан анализ на основе подсчета секвенированных маркерных последовательностей в пробе плазмы пациента NPC 4 стадии согласно вариантам реализации настоящего изобретения. В пробе плазмы, отобранной перед проведением лечения, определялись хромосомные аберрации. По сравнению с пациентом с 3 стадией заболевания (фиг. 23) определялось больше хромосомных аберраций. Встречаемости секвенированных маркерных последовательностей также в большей степени отклонялись от среднего для контрольных субъектов, т.е. z-показатель больше отклонялся от нуля (либо в положительную, либо в отрицательную сторону). Повышенное количество хромосомных аберраций и более высокая степень отклонения встречаемостей секвенированных маркерных последовательностей по сравнению с контролем отражает более тяжелую степень геномных изменений при более поздней стадии заболевания и, следовательно, показывает ценность такого способа при установлении стадии, прогнозировании и мониторинге рака.
Анализ, основанный на размерах
В предыдущих исследованиях было показано, что распределение по размеру фрагментов ДНК, происходящих из тканей опухоли, уже, чем распределение по размеру фрагментов из неопухолевых тканей (Diehl F et al. Proc Natl Acad Sci USA 2005, 102(45): 16368-73). В предыдущих разделах был охарактеризован способ выявления дисбаланса гаплотипов в плазме посредством анализа, основанного на размерах ДНК в плазме. Здесь применялись данные секвенирования для пациентов НСС, чтобы более подробно проиллюстрировать данный способ.
В целях иллюстрации мы идентифицировали две области для анализа по размерам. В одной области (1 хромосома (chrl); координаты 159 935 347 - 167 219 158) в тканях опухоли была выявлена дупликация одной из двух гомологичных хромосом. В одной области (10 хромосома (chr10); координаты 100 137 050 - 101 907 356) в тканях опухоли была выявлена делеция одной из двух гомологичных хромосом (т.е. ПГ). Помимо определения того, из какого гаплотипа произошел секвенированный фрагмент, также способами биоинформатики определяли размер указанного секвенированного фрагмента на основании координат самых удаленных от центра нуклеотидов секвенированного фрагмента в эталонном геноме. Затем определяли распределение по размерам фрагментов из каждого из двух указанных гаплотипов.
Для области с ПГ Chr10 в ткани опухоли гаплотип был делетирован (делетированный гаплотип). Следовательно, все фрагменты ДНК в плазме, выравнивающиеся с данным делетированным гаплотипом, происходили из нераковых тканей. С другой стороны, фрагменты, выравнивающиеся с гаплотипом, который не был делетирован в тканях опухоли (неделетированный гаплотип) мог происходить как из опухолевых, так и из неопухолевых тканей. Поскольку распределение по размерам ДНК опухолевого происхождения уже, мы можем предположить более узкое распределение по размерам для фрагментов из неделетированного гаплотипа по сравнению с распределением фрагментов из делетированного гаплотипа. Различие двух распределений по размеру можно определить путем построения графика зависимости накопленной встречаемости фрагментов от размера фрагментов ДНК. Популяция ДНК с более узким распределением по размерам может быть более богата короткой ДНК и, следовательно, в ней происходит более быстрое увеличение накопленной частоты в короткой части спектра размеров.
На фиг. 25 показан график зависимости накопленной частоты ДНК в плазме от размера для области, проявляющей ПГ в ткани опухоли согласно вариантам реализации настоящего изобретения. По оси X отложен размер фрагмента в парах оснований. По оси Y отложен процент фрагментов, обладающих размером ниже значения на оси X. Последовательности из неделетированного гаплотипа демонстрируют более быстрое увеличение и более высокую накопленную частоту меньше размера 170 по по сравнению с последовательностями из делетированного гаплотипа. Это указывает на то, что фрагменты ДНК из неделтированного гаплотипа присутствовали в большем избытке. Это согласуется с предсказанием, сделанным выше исходя из распределения короткой ДНК опухолевого происхождения из неделетированного гаплотипа.
Согласно некоторым вариантам реализации различие в распределении по размеру можно оценить количественно по разности накопленных частот двух популяций молекул ДНК. Мы определяем ΔQ как разность накопленных частот двух указанных популяций.
- Qnon-deieted - Qdcicicd·, где Qnon-deleted представляет собой накопленную частоту для секвенированных фрагментов ДНК, происходящих из неделетированного гаплотипа; а Qdeleted представляет собой накопленную частоту для секвенированных фрагментов ДНК, происходящих из делетированного гаплотипа.
- 31 038374
На фиг. 26 показан график зависимости ΔQ от размера секвенированной ДНК плазмы для области с ПГ. ΔQ достигает 0,2 при размере 130 по согласно вариантам реализации настоящего изобретения. Это указывает на то, что применение уровня отсечки 130 по для определения короткой ДНК оптимально, для применения в формулах, приведенных выше. При применении указанного уровня отсечки короткие молекулы ДНК представлены в избытке 20% в популяции из неделетированного гаплотипа по сравнению с популяцией из делетированного гаплотипа. Данное процентное различие (или полученную аналогичным способом величину) можно затем сравнивать с пороговым значением, полученным для людей, не страдающих раковыми заболеваниями.
Для области с увеличением числа копий хромосомы в ткани опухоли один гаплотип был дуплицирован (амплифицированный гаплотип). Поскольку в плазму могло выделяться избыточное количество коротких молекул ДНК опухолевого происхождения из указанного амплифицированного гаплотипа, распределение по размеру для фрагментов из амплифицированного гаплотипа может быть уже, чем распределение по размеру для фрагментов из неамплифицированного гаплотипа. Аналогично сценарию ПГ, различие в распределении по размеру можно определить путем построения графика зависимости накопленной встречаемости фрагментов от размера фрагментов ДНК. Популяция ДНК с более узким распределением по размерам может быть более богата короткой ДНК и, следовательно, в ней происходит более быстрое увеличение накопленной частоты в короткой части спектра размеров.
На фиг. 27 показан график зависимости накопленной частоты ДНК в плазме от размера для области с дупликацией хромосомы в ткани опухоли согласно вариантам реализации настоящего изобретения. Последовательности из амплифицированного гаплотипа демонстрировали более быстрое увеличение и более высокую накопленную частоту меньше размера 170 по по сравнению с последовательностями из неамплифицированного гаплотипа. Это указывает на то, что фрагменты ДНК из амплифицированного гаплотипа присутствовали в большем избытке. Это согласуется с предсказанием, приведенным ниже, поскольку большее количество короткой ДНК опухолевого происхождения происходило из амплифицированного гаплотипа.
Аналогично сценарию ПГ, различие в распределении по размеру можно оценивать количественно по разности накопленных частот двух популяций молекул ДНК. Мы определяем ΔQ как разность накопленных частот двух указанных популяций. △Q - Qamplified Qnon-amplified, где Qamplified представляет собой накопленную частоту для секвенированных фрагментов ДНК, происходящих из амплифицированного гаплотипа; а Qnon.amplified представляет собой накопленную частоту для секвенированных фрагментов ДНК, происходящих из неамплифицированного гаплотипа.
На фиг. 28 показан график зависимости ΔQ от размера секвенированной ДНК плазмы для амплифицированной области согласно вариантам реализации настоящего изобретения. ΔQ достигает 0,08 при размере 126 по согласно вариантам реализации настоящего изобретения. Это указывает на то, что при применении уровня отсечки 126 по для определения короткой ДНК короткие молекулы ДНК представлены в избытке 8% в популяции из амплифицированного гаплотипа по сравнению с популяцией из неамплифицированного гаплотипа.
D. Дополнительные технологии.
Согласно другим вариантам реализации можно применять технологии, специфичные в отношении последовательности. Например, можно разрабатывать олигонуклеотиды для гибридизации фрагментов конкретной области. Затем указанные олигонуклеотиды можно подсчитывать способом, аналогичным подсчету секвенированных маркерных последовательностей. Данный способ можно применять для типов рака, которые проявляют конкретные аберрации.
VIII. Компьютерная система.
В любой из компьютерных систем, упоминаемых в настоящем описании, может применяться любое подходящее количество подсистем. Примеры таких подсистем показаны на фиг. 9 в компьютерном устройстве 900. Согласно некоторым вариантам реализации компьютерная система включает одно компьютерное устройство, в котором указанными подсистемами могут быть компоненты указанного компьютерного устройства. Согласно другим вариантам реализации компьютерная система может включать несколько компьютерных устройств, каждый из которых является подсистемой, с внутренними компонентами.
Подсистемы, показанные на фиг. 29, соединяются между собой системной шиной 2975. Показаны дополнительные подсистемы, такие как принтер 2974, клавиатура 2978, фиксированный диск 2979, монитор 2976, который соединен с адаптером дисплея 2982, и другие. Периферические устройства и устройства ввода/вывода (I/O), которые соединены с контроллером I/O 2971, могут быть соединены с компьютерной системой любыми средствами, известными в технике, такими как последовательный порт 2977. Например, для присоединения компьютерной системы 2900 к региональной сети, такой как интернет, устройству ввода данных или сканеру можно применять последовательный порт 2977 или внешний интерфейс 2981 (такой как локальная сеть, Wi-Fi и др.). Соединение через системную шину 2975 позволяет коммутировать центральный процессор 2973 с каждой подсистемой и контролировать выполнение инструкций из запоминающей системы 2972 или фиксированного диска 2979, а также обмен информаци- 32 038374 ей между подсистемами. Запоминающая система 2972 и/или фиксированный диск 2979 могут составлять часть считываемой компьютером среды. Любое из значений, упоминаемых в настоящем описании, можно выводить из компонента в другой компонент и можно выводить для пользователя.
Компьютерная система может включать множество одинаковых компонентов или подсистем, например, соединенных между собой внешним интерфейсом 2981 или внутренним интерфейсом. Согласно некоторым вариантам реализации компьютерные системы, подсистемы или устройства можно соединять друг с другом сетью. Согласно таким примерам один компьютер может считаться клиентом, а другой компьютер - сервером, где каждый из них может быть частью одной и той же компьютерной системы. И клиент, и сервер могут включать многие системы, подсистемы или компоненты.
Следует понимать, что любой из вариантов реализации настоящего изобретения можно реализовать в форме алгоритма управления с применением средств технического обеспечения и/или с применением компьютерных программ в модульном или интегрированном виде. На основании раскрытия изобретения и идей, приведенных в настоящем описании, специалист в данной области техники должен знать и понимать другие способы и/или пути осуществления вариантов реализации настоящего изобретения с применением средств технического обеспечения и сочетания средств технического обеспечения и программ.
Любые из компонентов или функций программ, описываемых в настоящем описании, можно выполнить в виде программного кода, выполняемого процессором с использованием любого подходящего машинного языка, такого как, например, Java, C++ или Perl, с использованием, например, традиционных или ориентированных на объект методов. Программный код может сохраняться как ряд инструкций или команд на носителе, считываемом компьютером, для хранения и/или передачи, подходящие носители включают запоминающее устройство с произвольной выборкой (RAM), постоянное запоминающее устройство (ПЗУ, ROM), магнитный носитель, жесткий дисковод или дискету, или оптический носитель, такой как компакт-диск (CD) или DVD (цифровой универсальный диск), флэш-память и т.п. Носитель, считываемый компьютером, может представлять собой любое сочетание таких устройств хранения или передачи информации.
Такие программы также можно кодировать и передавать с применением сигналов носителя, адаптированных для передачи по проводным, оптическим и/или беспроводным сетям, соответствующим протоколам, включая интернет. Как таковой носитель, считываемый компьютером, согласно одному варианту реализации настоящего изобретения может быть создан с применением сигнала данных, кодированного такими программами. Носитель, считываемый компьютером, кодированный программным кодом, может быть в пакете с совместимым устройством или предоставлен отдельно от других устройств (например, пересылаться через интернет). Любой такой считываемый компьютером носитель может быть размещен на или в пределах отдельного компьютерного программного продукта (например, жесткий дисковод или целая компьютерная система) и может быть представлен на или в рамках различных компьютерных программных продуктов в системе или сети. Компьютерная система может включать монитор, принтер или другой подходящий дисплей для предоставления пользователю любых результатов, указанных в настоящем описании.
Любые из способов, описываемых в настоящем описании, можно реализовать полностью или частично при помощи компьютерной системы, включающей процессор, который можно настроить для реализации указанных этапов. Таким образом, варианты реализации могут направляться в компьютерные системы, настроенные для проведения этапов любого из способов, описанных в настоящем описании, потенциально при помощи разных компонентов, осуществляющих соответствующие этапы или соответствующие группы этапов. Хотя и представленные в форме пронумерованных этапов, этапы способов, описываемых в настоящем описании, можно осуществлять одновременно или в разном порядке. Кроме того, части указанных этапов можно применять с частями других этапов из других способов. Также весь или часть этапа могут быть необязательными. Кроме того, любой из этапов любого из способов можно проводить при помощи модулей, замкнутых циклов или других средств осуществления указанных этапов.
Специфические детали конкретных вариантов реализации настоящего изобретения можно сочетать любым подходящим образом, не отклоняясь от сущности и области вариантов реализации настоящего изобретения. Однако другие варианты реализации настоящего изобретения могут быть направлены на специфические варианты реализации, связанные с каждым отдельным аспектом, или специфическими сочетаниями указанных отдельных аспектов.
Приведенное выше описание примерных вариантов реализации изобретения представлено в целях пояснения и описания. Не предполагается, что оно является исчерпывающим или ограничивает изобретение точно описанной формой, и в свете описанного выше возможны многие модификации и вариации. Варианты реализации выбраны и описаны для наилучшего объяснения принципов изобретения и его практических применений, которые позволят другим специалистам в данной области техники применять изобретение наилучшим образом в различных вариантах реализации и различных модификациях, которые подходят для определенного предполагаемого применения.
Перечисление определенных и неопределенных артиклей должно означать один или более, если особо не указано другое. Все патенты, заявки на патент, публикации и описания, упоминаемые в данном описании, входят в него в виде ссылок для всех целей. Ни один из них не признается предыдущим уровнем техники.

Claims (16)

    ФОРМУЛА ИЗОБРЕТЕНИЯ
  1. (1) определение аллелей первого и второго гаплотипов для здоровых клеток указанного организма в области хромосомы, которая включает множество локусов, причем аллели указанного первого и второго гаплотипов гетерозиготны в каждом локусе из указанного множества локусов;
    1. Способ анализа биологического образца организма для выявления хромосомных делеций или амплификаций, ассоциированных с раком, причем организм является диплоидным, и указанный биологический образец включает бесклеточную смесь множества молекул нуклеиновых кислот, происходящих из хромосом здоровых клеток и из хромосом клеток, возможно, ассоциированных с раком, причем указанный способ включает:
  2. 2. Способ по п.1, отличающийся тем, что указанное первое значение для первой группы молекул нуклеиновых кислот соответствует статистическому показателю распределения по размеру молекул нуклеиновых кислот указанной первой группы, а указанное второе значение для второй группы молекул нуклеиновых кислот соответствует статистическому показателю распределения по размеру молекул нуклеиновых кислот указанной второй группы.
    (2) идентификацию локализации в эталонном геноме указанного организма каждой из множества молекул нуклеиновых кислот из указанного биологического образца;
  3. 3. Способ по п.2, отличающийся тем, что указанное первое значение представляет собой средний размер молекул нуклеиновых кислот указанной первой группы, а указанное второе значение представляет собой средний размер молекул нуклеиновых кислот указанной второй группы.
    (3) определение аллеля каждой из множества молекул нуклеиновых кислот из указанного биологического образца;
  4. 4. Способ по п.2, отличающийся тем, что указанное первое значение, обозначенное как QHapI, представляет собой долю молекул нуклеиновых кислот в указанной первой группе, которые короче размера отсечки, и тем, что второе значение, обозначенное как QHapII, представляет собой долю молекул нуклеиновых кислот в указанной второй группе, которые короче размера отсечки
    (4) идентификацию первой группы молекул нуклеиновых кислот как происходящей из указанного первого гаплотипа на основании идентифицированных локализаций, определенных аллелей множества молекул нуклеиновых кислот и аллелей первого гаплотипа во множестве локусов, причем указанная первая группа включает по меньшей мере одну молекулу нуклеиновой кислоты, локализующуюся в каждом из локусов указанного множества в указанной области хромосомы;
  5. 5. Способ по п.4, отличающийся тем, что сравнение первого значения со вторым значением включает определение разницы между ними: ΔQ=QHapI-QHapII, причем положительное значение ΔQ выше порогового значения указывает на то, что второй гаплотип включает делецию в указанной области хромосомы в ткани опухоли в указанном организме или что первый гаплотип включает амплификацию в указанной области хромосомы в ткани опухоли в этом организме.
    (5) идентификацию второй группы молекул нуклеиновых кислот как происходящей из указанного второго гаплотипа на основании идентифицированных локализаций, определенных аллелей множества молекул нуклеиновых кислот и аллелей второго гаплотипа во множестве локусов, причем указанная вторая группа включает по меньшей мере одну молекулу нуклеиновой кислоты, локализующуюся в каждом из локусов указанного множества в указанной области хромосомы;
  6. 6. Способ по п.4, отличающийся тем, что сравнение первого значения со вторым значением включает определение разницы между ними: ΔQ=QHapI-QHapII, причем значение ΔQ, приблизительно равное нулю, указывает на отсутствие делеции или амплификации в указанной области хромосомы, которая вклю чает множество локусов.
    (6) расчет при помощи компьютерной системы первого значения для указанной первой группы молекул нуклеиновых кислот, причем указанное первое значение определяет статистический показатель распределения по размеру молекул нуклеиновых кислот первой группы или определяет количество молекул нуклеиновых кислот из первой группы;
  7. 7. Способ по п.2, отличающийся тем, что указанное первое значение, обозначенное как FHapi, и указанное второе значение, обозначенное как FHapII, определяют для соответствующей группы по формуF = ywlength / yNlength ywlength ____ „ „ „ „ „ __ ле i- o о , где представляет собой сумму длин молекул нуклеиновых кислот __________ „ - _____ -___ - „ „ ___________ yNlength______________ соответствующей группы с длиной, равной или меньше размера отсечки w, а представляет собой
    - 34 038374 сумму длин молекул нуклеиновых кислот соответствующей группы с длиной, равной или меньшей, чем
    N оснований, где N больше, чем w.
    (7) расчет при помощи компьютерной системы второго значения для указанной второй группы молекул нуклеиновых кислот, причем указанное второе значение определяет статистический показатель распределения по размеру молекул нуклеиновых кислот второй группы или определяет количество молекул нуклеиновых кислот из второй группы;
  8. 8. Способ по п.7, отличающийся тем, что сравнение первого значения со вторым значением включает определение разницы между ними: AF=FHapI-FHapII, причем если второй гаплотип включает делецию в указанной области хромосомы в раковой ткани в организме, то AF имеет положительное значение выше порогового значения.
    (8) сравнение первого значения со вторым значением, причем разница или отношение между указанными первым значением и вторым значением, превышающее пороговое значение, указывает на то, что область хромосомы, которая включает множество локусов, проявляет делецию или амплификацию в клетках, ассоциированных с раком, причем это пороговое значение определяют так, как раскрыто в описании.
  9. 9. Способ по п.7, отличающийся тем, что сравнение первого значения со вторым значением включает определение разницы между ними: AF=FHapI-FHapII, причем если второй гаплотип включает амплификацию в указанной области хромосомы в раковой ткани в организме, то AF имеет отрицательное значение выше порогового значения.
  10. 10. Способ по п.1, отличающийся тем, что указанное первое значение для первой группы молекул нуклеиновых кислот соответствует количеству молекул нуклеиновых кислот из первой группы, а указанное второе значение для второй группы молекул нуклеиновых кислот соответствует количеству молекул нуклеиновых кислот из второй группы.
  11. 11. Способ по п.10, отличающийся тем, что сравнение первого значения со вторым значением включает определение отношения указанного первого значения к указанному второму значению для определения относительной концентрации раковых молекул нуклеиновых кислот в указанном биологическом образце, причем способ дополнительно включает определение относительной концентрации раковых молекул нуклеиновых кислот в указанном биологическом образце во множество моментов времени для диагностики, определения стадии, прогнозирования или отслеживания прогрессирования степени рака в указанном организме.
  12. 12. Способ по любому из пп.1-11, отличающийся тем, что включает анализ множества хромосомных областей;
    определение количества областей хромосом, которые проявляют делецию или амплификацию; и сравнение указанного количества с одним или более пороговыми значениями для определения степени рака в указанном организме.
  13. 13. Способ по п.12, дополнительно включающий определение для каждой области хромосомы, которая была идентифицирована как проявляющая делецию или амплификацию, степени делеции или амплификации;
    сравнение результата с одним или более пороговыми значениями для определения степени рака указанного организма.
  14. 14. Способ по любому из пп.1-11, отличающийся тем, что включает повторение во множество моментов времени стадий анализа множества областей хромосомы и определение количества хромосомных областей, которые проявляют делецию или амплификацию, для диагностики, определения стадии, прогнозирования или отслеживания прогрессирования степени рака в указанном организме.
  15. 15. Машиночитаемый носитель, включающий компьютерную программу для осуществления способа по любому из пп.1-14.
  16. 16. Компьютерная система, включающая процессор и машиночитаемый носитель по п.15, для осуществления способа по любому из пп.1-14.
EA201300649A 2010-11-30 2011-11-30 Способ анализа биологического образца организма для выявления хромосомных делеций или амплификаций, ассоциированных с раком EA038374B1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US41839110P 2010-11-30 2010-11-30
US201161529877P 2011-08-31 2011-08-31
PCT/AU2011/001562 WO2012071621A1 (en) 2010-11-30 2011-11-30 Detection of genetic or molecular aberrations associated with cancer

Publications (2)

Publication Number Publication Date
EA201300649A1 EA201300649A1 (ru) 2013-10-30
EA038374B1 true EA038374B1 (ru) 2021-08-17

Family

ID=46171096

Family Applications (1)

Application Number Title Priority Date Filing Date
EA201300649A EA038374B1 (ru) 2010-11-30 2011-11-30 Способ анализа биологического образца организма для выявления хромосомных делеций или амплификаций, ассоциированных с раком

Country Status (19)

Country Link
US (3) US8741811B2 (ru)
EP (4) EP2646579B1 (ru)
JP (5) JP6196157B2 (ru)
KR (6) KR20230014851A (ru)
CN (4) CN103403182B (ru)
AU (1) AU2011335891B2 (ru)
BR (1) BR112013013421A2 (ru)
CA (1) CA2817370C (ru)
DK (2) DK2646579T3 (ru)
EA (1) EA038374B1 (ru)
HK (2) HK1190437A1 (ru)
IL (3) IL226272A (ru)
MX (3) MX370249B (ru)
MY (1) MY169852A (ru)
NZ (1) NZ611599A (ru)
SG (3) SG10202008532PA (ru)
TW (5) TWI719339B (ru)
WO (1) WO2012071621A1 (ru)
ZA (1) ZA201304625B (ru)

Families Citing this family (124)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
CA2731991C (en) 2008-08-04 2021-06-08 Gene Security Network, Inc. Methods for allele calling and ploidy calling
CN102597266A (zh) 2009-09-30 2012-07-18 纳特拉公司 无创性产前倍性调用的方法
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
WO2011091046A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
US20120100548A1 (en) 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
CA2786357C (en) 2010-01-19 2018-08-21 Verinata Health, Inc. Simultaneous determination of aneuploidy and fetal fraction
EP2526415B1 (en) 2010-01-19 2017-05-03 Verinata Health, Inc Partition defined detection methods
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
EP2854057B1 (en) 2010-05-18 2018-03-07 Natera, Inc. Methods for non-invasive pre-natal ploidy calling
TWI719339B (zh) 2010-11-30 2021-02-21 香港中文大學 與癌症有關之基因或分子變異之檢測
RU2620959C2 (ru) 2010-12-22 2017-05-30 Натера, Инк. Способы неинвазивного пренатального установления отцовства
JP6153874B2 (ja) 2011-02-09 2017-06-28 ナテラ, インコーポレイテッド 非侵襲的出生前倍数性呼び出しのための方法
CN103562407A (zh) 2011-02-09 2014-02-05 伯乐生命医学产品有限公司 核酸的分析
RS63008B1 (sr) 2011-04-12 2022-03-31 Verinata Health Inc Rešavanje frakcija genoma koristeći brojanje polimorfizma
ES2625288T3 (es) 2011-04-15 2017-07-19 The Johns Hopkins University Sistema de secuenciación segura
US9411937B2 (en) 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
EP3757210B1 (en) 2012-03-02 2022-08-24 Sequenom, Inc. Methods for enriching cancer nucleic acid from a biological sample
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
CA2867293C (en) 2012-03-13 2020-09-01 Abhijit Ajit PATEL Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
US11261494B2 (en) * 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
EP2877594B1 (en) * 2012-07-20 2019-12-04 Verinata Health, Inc. Detecting and classifying copy number variation in a fetal genome
US11913065B2 (en) 2012-09-04 2024-02-27 Guardent Health, Inc. Systems and methods to detect rare mutations and copy number variation
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
PT2893040T (pt) 2012-09-04 2019-04-01 Guardant Health Inc Métodos para deteção de mutações raras e de variação do número de cópias
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US10706957B2 (en) 2012-09-20 2020-07-07 The Chinese University Of Hong Kong Non-invasive determination of methylome of tumor from plasma
US9732390B2 (en) 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
SG11201501927VA (en) 2012-09-20 2015-04-29 Univ Hong Kong Chinese Non-invasive determination of methylome of fetus or tumor from plasma
ES2886507T3 (es) 2012-10-29 2021-12-20 Univ Johns Hopkins Prueba de Papanicolaou para cánceres de ovario y de endometrio
SG11201504334WA (en) 2012-12-10 2015-07-30 Resolution Bioscience Inc Methods for targeted genomic analysis
US10643738B2 (en) * 2013-01-10 2020-05-05 The Chinese University Of Hong Kong Noninvasive prenatal molecular karyotyping from maternal plasma
EP3597774A1 (en) 2013-03-13 2020-01-22 Sequenom, Inc. Primers for dna methylation analysis
EP3795696B1 (en) * 2013-03-15 2023-04-26 The Board of Trustees of the Leland Stanford Junior University Identification and use of circulating nucleic acid tumor markers
KR102665592B1 (ko) 2013-05-24 2024-05-21 시쿼넘, 인코포레이티드 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
US9944998B2 (en) 2013-07-25 2018-04-17 Bio-Rad Laboratories, Inc. Genetic assays
US9499870B2 (en) 2013-09-27 2016-11-22 Natera, Inc. Cell free DNA diagnostic testing standards
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
US10851414B2 (en) * 2013-10-18 2020-12-01 Good Start Genetics, Inc. Methods for determining carrier status
EP3061021B1 (en) * 2013-10-21 2023-05-10 Verinata Health, Inc. Method for improving the sensitivity of detection in determining copy number variations
ES2822125T3 (es) 2013-12-28 2021-04-29 Guardant Health Inc Métodos y sistemas para detectar variantes genéticas
US11365447B2 (en) 2014-03-13 2022-06-21 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CN113774132A (zh) 2014-04-21 2021-12-10 纳特拉公司 检测染色体片段中的突变和倍性
WO2015164432A1 (en) * 2014-04-21 2015-10-29 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
CN106795562B (zh) 2014-07-18 2022-03-25 香港中文大学 Dna混合物中的组织甲基化模式分析
CN117402950A (zh) 2014-07-25 2024-01-16 华盛顿大学 确定导致无细胞dna的产生的组织和/或细胞类型的方法以及使用其鉴定疾病或紊乱的方法
US11783911B2 (en) 2014-07-30 2023-10-10 Sequenom, Inc Methods and processes for non-invasive assessment of genetic variations
CN107750277B (zh) 2014-12-12 2021-11-09 维里纳塔健康股份有限公司 使用无细胞dna片段大小来确定拷贝数变化
US10364467B2 (en) * 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
US11242559B2 (en) 2015-01-13 2022-02-08 The Chinese University Of Hong Kong Method of nuclear DNA and mitochondrial DNA analysis
US10319463B2 (en) * 2015-01-23 2019-06-11 The Chinese University Of Hong Kong Combined size- and count-based analysis of maternal plasma for detection of fetal subchromosomal aberrations
EP4012715A1 (en) 2015-02-10 2022-06-15 The Chinese University Of Hong Kong Detecting mutations for cancer screening and fetal analysis
CN106021992A (zh) * 2015-03-27 2016-10-12 知源生信公司(美国硅谷) 位置相关变体识别计算流水线
JPWO2016163539A1 (ja) * 2015-04-10 2018-04-19 社会福祉法人恩賜財団済生会 肝疾患の病態を判別する方法
WO2016183106A1 (en) 2015-05-11 2016-11-17 Natera, Inc. Methods and compositions for determining ploidy
DK3739061T3 (da) 2015-07-20 2022-04-19 Univ Hong Kong Chinese Methyleringsmønsteranalyse af haplotyper i væv i DNA-blanding
HUE057821T2 (hu) 2015-07-23 2022-06-28 Univ Hong Kong Chinese Sejtmentes DNS fragmentációs mintázatának elemzése
JP6675164B2 (ja) * 2015-07-28 2020-04-01 株式会社理研ジェネシス 変異判定方法、変異判定プログラムおよび記録媒体
US11286531B2 (en) 2015-08-11 2022-03-29 The Johns Hopkins University Assaying ovarian cyst fluid
IL285795B (en) 2015-08-12 2022-07-01 Univ Hong Kong Chinese Sequencing a single molecule of DNA. plasma
EP3374525B1 (en) 2015-11-11 2021-01-20 Resolution Bioscience, Inc. High efficiency construction of dna libraries
CN108603228B (zh) 2015-12-17 2023-09-01 夸登特健康公司 通过分析无细胞dna确定肿瘤基因拷贝数的方法
US10095831B2 (en) 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
AU2017237187B2 (en) 2016-03-24 2022-12-08 Biological Dynamics, Inc. Disposable fluidic cartridge and components
IL303115A (en) 2016-05-30 2023-07-01 Univ Hong Kong Chinese Detection of hematological disorders using cell-free DNA in blood
TWI578180B (zh) * 2016-07-13 2017-04-11 國立臺灣師範大學 微核糖核酸與腦部疾病風險的關聯性運算平台
WO2018022890A1 (en) 2016-07-27 2018-02-01 Sequenom, Inc. Genetic copy number alteration classifications
WO2018039463A1 (en) 2016-08-25 2018-03-01 Resolution Bioscience, Inc. Methods for the detection of genomic copy changes in dna samples
EP3518974A4 (en) * 2016-09-29 2020-05-27 Myriad Women's Health, Inc. NON-INVASIVE PRENATAL SCREENING USING DYNAMIC ITERATIVE DEEP OPTIMIZATION
WO2018067517A1 (en) 2016-10-04 2018-04-12 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
AU2017347790B2 (en) 2016-10-24 2024-06-13 Grail, Inc. Methods and systems for tumor detection
KR20230062684A (ko) 2016-11-30 2023-05-09 더 차이니즈 유니버시티 오브 홍콩 소변 및 기타 샘플에서의 무세포 dna의 분석
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
CA3050055C (en) 2017-01-24 2023-09-19 Sequenom, Inc. Methods and processes for assessment of genetic variations
MY197535A (en) 2017-01-25 2023-06-21 Univ Hong Kong Chinese Diagnostic applications using nucleic acid fragments
AU2018225348A1 (en) 2017-02-21 2019-07-18 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
US10818379B2 (en) 2017-05-08 2020-10-27 Biological Dynamics, Inc. Methods and systems for analyte information processing
KR102145417B1 (ko) * 2017-05-24 2020-08-19 지니너스 주식회사 무세포 핵산으로부터 수득된 서열 분석 데이터에 대한 배경 대립인자의 빈도 분포를 생성하는 방법 및 이를 이용하여 무세포 핵산으로부터 변이를 검출하는 방법
SG11201911642SA (en) * 2017-06-08 2020-01-30 Nantomics Llc An integrative panomic approach to pharmacogenomics screening
JP2020527958A (ja) 2017-07-26 2020-09-17 ザ チャイニーズ ユニバーシティー オブ ホンコンThe Chinese University Of Hongkong 無細胞ウイルス核酸を用いる癌スクリーニングの強化
CN110021355B (zh) * 2017-09-22 2021-05-04 深圳华大生命科学研究院 二倍体基因组测序片段的单倍体分型和变异检测方法和装置
US11168356B2 (en) 2017-11-02 2021-11-09 The Chinese University Of Hong Kong Using nucleic acid size range for noninvasive cancer detection
TWI669618B (zh) * 2017-11-24 2019-08-21 南韓商韓國美迪基因科技有限公司 預測疾病的方法及裝置以及計算每種疾病發生風險的加權分數的方法
US11731132B2 (en) 2017-12-19 2023-08-22 Biological Dynamics, Inc. Methods and devices for detection of multiple analytes from a biological sample
US20210214798A1 (en) * 2017-12-19 2021-07-15 Biological Dynamics, Inc. Methods and devices for detecting and quantifying cell-free dna fragments
CN112534506A (zh) 2018-03-15 2021-03-19 格瑞尔公司 组织特异性的甲基化标志物
CN117065932A (zh) 2018-04-02 2023-11-17 生物动力学公司 介电材料
CA3096678A1 (en) 2018-04-13 2019-10-17 Grail, Inc. Multi-assay prediction model for cancer detection
CA3105349A1 (en) 2018-05-03 2019-11-07 The Chinese University Of Hong Kong Size-tagged preferred ends and orientation-aware analysis for measuring properties of cell-free mixtures
WO2019232435A1 (en) 2018-06-01 2019-12-05 Grail, Inc. Convolutional neural network systems and methods for data classification
WO2019237230A1 (zh) * 2018-06-11 2019-12-19 深圳华大生命科学研究院 确定待测样本类型的方法及系统
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
CN112740239A (zh) * 2018-10-08 2021-04-30 福瑞诺姆控股公司 转录因子分析
US11581062B2 (en) 2018-12-10 2023-02-14 Grail, Llc Systems and methods for classifying patients with respect to multiple cancer classes
US20200199656A1 (en) 2018-12-19 2020-06-25 The Chinese University Of Hong Kong Cell-free dna end characteristics
JP7332695B2 (ja) * 2018-12-21 2023-08-23 エフ. ホフマン-ラ ロシュ アーゲー 循環核酸からの全ゲノム配列データにおける包括的配列特徴の同定
EP3938534A4 (en) 2019-03-13 2023-03-29 Grail, LLC SYSTEMS AND METHODS FOR ENRICHMENT OF CANCER DERIVED FRAGMENTS USING FRAGMENT SIZE
WO2020192680A1 (en) 2019-03-25 2020-10-01 The Chinese University Of Hong Kong Determining linear and circular forms of circulating nucleic acids
CN110825819A (zh) * 2019-09-24 2020-02-21 昆明理工大学 一种处理有缺失值和不平衡非小细胞肺癌数据的二分类方法
WO2021108654A1 (en) 2019-11-27 2021-06-03 Grail, Inc. Systems and methods for evaluating longitudinal biological feature data
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
CN114093417B (zh) * 2021-11-23 2022-10-04 深圳吉因加信息科技有限公司 一种鉴定染色体臂杂合性缺失的方法和装置
CN115220623B (zh) * 2021-12-17 2023-12-05 深圳市瑞图生物技术有限公司 染色体图像分析方法、设备及存储介质
CN114525341A (zh) * 2022-02-24 2022-05-24 苏州宏元生物科技有限公司 一种同时检测肺癌和肺部感染的试剂盒
WO2024003936A1 (en) 2022-06-29 2024-01-04 Raman Govindarajan Method for detecting cancer susceptibility, early detection and predicting cancer behaviour
CN114898802B (zh) * 2022-07-14 2022-09-30 臻和(北京)生物科技有限公司 基于血浆游离dna甲基化测序数据的末端序列频率分布特征确定方法、评价方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090029377A1 (en) * 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994011531A1 (en) * 1992-11-13 1994-05-26 California Institute Of Biological Research Identification of neoplasms by detection of genetic insertions and deletions
CH686982A5 (fr) 1993-12-16 1996-08-15 Maurice Stroun Méthode pour le diagnostic de cancers.
US6291163B1 (en) * 1996-08-28 2001-09-18 The Johns Hopkins University School Of Medicine Method for detecting cell proliferative disorders
EP1158055A1 (fr) 2000-05-26 2001-11-28 Xu Qi University of Teaxs Laboratoire de Leucémie Chen Méthode pour le diagnostic de cancers
US20030219802A1 (en) * 2002-03-08 2003-11-27 The Regents Of The University Of Michigan Diagnosis and treatment of osteosarcoma
US7704687B2 (en) 2002-11-15 2010-04-27 The Johns Hopkins University Digital karyotyping
EP1678329A4 (en) * 2003-10-30 2008-07-02 Tufts New England Medical Ct PRENATAL DIAGNOSIS USING CELL-FREE FEDERAL DNA IN FRUIT WATER
EP1531183A1 (en) 2003-11-14 2005-05-18 bioMérieux BV Method for amplification of RNA sequences
EP1712639B1 (en) 2005-04-06 2008-08-27 Maurice Stroun Method for the diagnosis of cancer by detecting circulating DNA and RNA
US8554488B2 (en) * 2005-12-14 2013-10-08 Cold Spring Harbor Laboratory Determining a probabilistic diagnosis of autism by analysis of genomic copy number variations
CN100533120C (zh) * 2007-03-24 2009-08-26 辽宁师范大学 多色荧光复合扩增11个肺癌易感性相关snp位点试剂盒
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
US8093063B2 (en) 2007-11-29 2012-01-10 Quest Diagnostics Investments Incorporated Assay for detecting genetic abnormalities in genomic nucleic acids
US20100041048A1 (en) * 2008-07-31 2010-02-18 The Johns Hopkins University Circulating Mutant DNA to Assess Tumor Dynamics
CN102272327B (zh) * 2008-11-07 2015-11-25 赛昆塔公司 通过序列分析监测状况的方法
US20100136560A1 (en) 2008-12-02 2010-06-03 The Johns Hopkins University Integrated Analyses of Breast and Colorectal Cancers
WO2010070366A1 (en) * 2008-12-15 2010-06-24 Debreceni Egyetem Cytometric method for the comparative analysis of the length of pcr products and uses of this method
CN104531837A (zh) 2008-12-22 2015-04-22 赛卢拉有限公司 检测等位基因、基因组和转录物组的方法和基因型分析谱
SI3783110T1 (sl) 2009-11-05 2023-02-28 The Chinese University Of Hong Kong, Genomska analiza ploda iz materinega biološkega vzorca
EP3406737B1 (en) 2009-11-06 2023-05-31 The Chinese University of Hong Kong Size-based genomic analysis
CA2786357C (en) * 2010-01-19 2018-08-21 Verinata Health, Inc. Simultaneous determination of aneuploidy and fetal fraction
WO2011091046A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
WO2011103236A2 (en) 2010-02-18 2011-08-25 The Johns Hopkins University Personalized tumor biomarkers
US10047397B2 (en) * 2010-04-16 2018-08-14 Chronix Biomedical Breast cancer associated circulating nucleic acid biomarkers
KR102218512B1 (ko) * 2010-05-25 2021-02-19 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 Bambam:고처리율 서열분석 데이터의 병렬 비교 분석
US20120034603A1 (en) * 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
TWI719339B (zh) 2010-11-30 2021-02-21 香港中文大學 與癌症有關之基因或分子變異之檢測

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090029377A1 (en) * 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MULLER, I. et al., "Identification of Loss of Heterozygosity on Circulating Free DNA in Peripheral Blood of Prostate Cancer Patients: Potential and Technical Improvements", Clinical Chemistry, 2008, vol. 54, no. 4, pages 688-696, See Abstract; page 689, right hand column, paragraph 6 - page 690, left hand column, paragraph 2 *
TABACK, B. et al., "Prognostic Significance of Circulating Microsatellite Markers in the Plasma of Melanoma Patients", Cancer Research, 2001, vol. 61, pages 5723-5726, See Abstract; pg 5724, paragraphs 2-3 *

Also Published As

Publication number Publication date
IL243823A (en) 2017-03-30
US12002544B2 (en) 2024-06-04
AU2011335891B2 (en) 2015-03-26
SG10202008532PA (en) 2020-10-29
KR20200133825A (ko) 2020-11-30
TWI719339B (zh) 2021-02-21
TW201920685A (zh) 2019-06-01
KR20210148410A (ko) 2021-12-07
US8741811B2 (en) 2014-06-03
DK2646579T3 (en) 2017-08-07
EA201300649A1 (ru) 2013-10-30
EP2646579A4 (en) 2014-06-04
JP6487504B2 (ja) 2019-03-20
JP2019146561A (ja) 2019-09-05
EP4269623A3 (en) 2024-03-06
DK3243910T3 (da) 2020-02-24
SG190344A1 (en) 2013-06-28
US9965585B2 (en) 2018-05-08
JP6931013B2 (ja) 2021-09-01
CN114678128A (zh) 2022-06-28
EP3243910B1 (en) 2019-12-25
CN105243295B (zh) 2018-08-17
MX349568B (es) 2017-08-03
CN103403182B (zh) 2015-11-25
WO2012071621A1 (en) 2012-06-07
IL226272A0 (en) 2013-07-31
EP2646579A1 (en) 2013-10-09
NZ611599A (en) 2015-05-29
IL226272A (en) 2016-02-29
KR20190125535A (ko) 2019-11-06
KR101891847B1 (ko) 2018-08-24
EP3243910A1 (en) 2017-11-15
KR102489749B1 (ko) 2023-01-17
TWI786520B (zh) 2022-12-11
JP2023179458A (ja) 2023-12-19
TW201307570A (zh) 2013-02-16
EP4269623A2 (en) 2023-11-01
US20170220736A1 (en) 2017-08-03
US20130040824A1 (en) 2013-02-14
TW202242133A (zh) 2022-11-01
JP7351537B2 (ja) 2023-09-27
ZA201304625B (en) 2016-09-28
MX2013006075A (es) 2013-07-02
EP3640346A1 (en) 2020-04-22
JP2014502155A (ja) 2014-01-30
MY169852A (en) 2019-05-17
MX2019014657A (es) 2020-02-07
KR20180095941A (ko) 2018-08-28
MX370249B (es) 2019-12-06
AU2011335891A1 (en) 2013-05-02
US20140227699A1 (en) 2014-08-14
JP2022000021A (ja) 2022-01-04
CA2817370A1 (en) 2012-06-07
KR102333664B1 (ko) 2021-12-01
TW202132572A (zh) 2021-09-01
JP6196157B2 (ja) 2017-09-20
KR20140091650A (ko) 2014-07-22
BR112013013421A2 (pt) 2016-09-06
TW201615841A (zh) 2016-05-01
SG10201509766YA (en) 2015-12-30
CN105243295A (zh) 2016-01-13
CN108899091B (zh) 2022-04-15
CN108899091A (zh) 2018-11-27
CA2817370C (en) 2022-02-01
KR102185244B1 (ko) 2020-12-02
KR20230014851A (ko) 2023-01-30
EP2646579B1 (en) 2017-06-14
IL250931A0 (en) 2017-04-30
TWI642786B (zh) 2018-12-01
KR102040307B1 (ko) 2019-11-27
IL243823A0 (en) 2016-04-21
HK1190437A1 (zh) 2014-07-04
TWI532843B (zh) 2016-05-11
HK1217553A1 (zh) 2017-01-13
CN103403182A (zh) 2013-11-20
JP2018019696A (ja) 2018-02-08

Similar Documents

Publication Publication Date Title
JP7351537B2 (ja) 癌関連の遺伝子または分子異常の検出
AU2020201081B2 (en) Detection of genetic or molecular aberrations associated with cancer