KR20230145530A - 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정 - Google Patents

혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정 Download PDF

Info

Publication number
KR20230145530A
KR20230145530A KR1020237033920A KR20237033920A KR20230145530A KR 20230145530 A KR20230145530 A KR 20230145530A KR 1020237033920 A KR1020237033920 A KR 1020237033920A KR 20237033920 A KR20237033920 A KR 20237033920A KR 20230145530 A KR20230145530 A KR 20230145530A
Authority
KR
South Korea
Prior art keywords
methylation
dna
region
plasma
cancer
Prior art date
Application number
KR1020237033920A
Other languages
English (en)
Inventor
로사 와이 퀀 치우
콴 치 찬
유크 밍 데니스 로
미우 판 룬
페이용 지앙
와이 만 찬
Original Assignee
더 차이니즈 유니버시티 오브 홍콩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=50340462&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20230145530(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from US13/842,209 external-priority patent/US9732390B2/en
Application filed by 더 차이니즈 유니버시티 오브 홍콩 filed Critical 더 차이니즈 유니버시티 오브 홍콩
Publication of KR20230145530A publication Critical patent/KR20230145530A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/125Bisulfite(s)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Abstract

본 발명은, 다양한 조직 및 표본의 메틸화 프로필을 결정하고 이용할 수 있는 시스템, 방법, 및 장치에 관한 것이다. 본 발명에는 그 예가 제공되어 있다. 혈장 메틸화(또는 무세포 DNA를 갖는 다른 표본)와 모체/환자의 메틸화 프로필의 비교에 기반하여 태아/종양 조직에 대해 임의의 메틸화 프로필이 추정될 수 있다. 표본이 DNA 혼합물을 갖는 경우 태아/종양 유래 DNA를 확인하기 위해 조직-특이적 대립유전자를 이용하여 태아/종양 조직에 대해 임의의 메틸화 프로필이 결정될 수 있다. 태아/종양의 게놈에서 복제수 변동을 결정하는데 임의의 메틸화 프로필이 이용될 수 있다. 태아에 대한 메틸화 마커가 다양한 기법을 통해 확인되고 있다. 그 메틸화 프로필은 DNA 단편 크기 분포의 크기 파라미터를 결정함으로써 결정될 수 있고, 여기서 메틸화 수준을 결정하는데 크기 파라미터에 대한 기준값이 이용될 수 있다. 추가로, 암 수준을 결정하는데 임의의 메틸화 수준이 이용될 수 있다.

Description

혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정{NON-INVASIVE DETERMINATION OF METHYLOME OF FETUS OR TUMOR FROM PLASMA}
관련 출원에 대한 교차 참조
본 출원은 2013. 6. 3.에 출원되고 "Tumor Detection In Plasma Using Methylation Status And Copy Number"를 표제로 하는 U.S. 특허 가출원 번호 61/830,571; 및 2012. 9. 20.에 출원되고 "Method Of Determining The Whole Genome DNA Methylation Status Of The Placenta By Massively Parallel Sequencing Of Maternal Plasma"를 표제로 하는 U.S. 특허 가출원 번호 61/703,512의 정규 출원이고 그 이익을 향유하는 2013. 3. 15.에 출원되고 "Non-Invasive Determination Of Methylome Of Fetus Or Tumor From Plasma"를 표제로 하는 U.S. 출원 번호 13/842,209를 우선권으로 청구하는 PCT 출원이며, 본원에 이들의 전문이 모든 목적에 대해 참조로 도입된다.
분야
본 개시는 일반적으로 DNA의 메틸화 패턴(메틸롬)의 결정, 보다 구체적으로 상이한 게놈 유래(예로, 태아 및 모체 유래, 또는 종양 및 정상 세포 유래) DNA 혼합물을 포함하는 생물학적 표본(예로, 혈장)을 분석하여 소수 게놈의 메틸화 패턴(메틸롬)을 결정하는 것에 관한 것이다. 결정된 메틸롬의 용도도 기재된다.
배아 및 태아 발생은 복잡한 절차이며 일련의 고도로 조직화된 유전적 및 후생적 사건이 수반된다. 암 발생도 전형적으로 여러 유전적 및 후생적 단계가 수반되는 복잡한 절차이다. 발생 절차의 후생적 제어 이상이 불임, 자연 유산, 자궁내 성장 이상 및 출생 후 결과에 수반된다. DNA 메틸화는 가장 빈번하게 연구되는 후생적 기전 중 하나이다. DNA의 메틸화는 대부분 CpG 디뉴클레오티드 중 시토신 잔기의 5' 탄소에 대한 메틸기 부가의 맥락에서 일어난다. 시토신 메틸화는 유전자 전사 및 DNA 기능에 대한 제어층을 부가한다. 예를 들어, CpG 섬으로 불리는 CpG 디뉴클레오티드가 풍부한 유전자 프로모터의 고메틸화는 전형적으로 유전자 기능의 억제에 연관된다.
발생 절차의 매개에서 후생적 기전의 중요한 역할에도 불구하고, 인간 배아 및 태아 조직은 분석을 위해 쉽게 접근할 수 없다(종양도 유사하게 접근 불가능할 수 있다). 인간의 산전 기간 동안 건강 및 질환에서의 이러한 후생적 절차의 동적 변화 연구는 실질적으로 불가능하다. 산전 진단 절차의 일환으로 또는 출생 후 수득될 수 있는 배아 외 조직, 특히 태반이 이러한 연구를 위한 주요 방법 중 하나를 제공해왔다. 그러나 이러한 조직은 침습적 절차를 필요로 한다.
인간 태반의 DNA 메틸화 프로필은 수십 년 간 연구자들의 흥미를 끌었다. 인간 태반은 DNA 메틸화가 수반되는 독특한 생리학적 특성의 과다를 나타낸다. 전반적 수준에서, 태반 조직은 대부분의 신체 조직과 비교될 때 저메틸화된다. 유전자 수준에서, 선택된 게놈 유전자좌의 메틸화 상태는 태반 조직의 특이적 성질이다. 전반적 및 유전자좌-특이적 메틸화 프로필은 모두 임신 나이 의존적 변화를 나타낸다. 각인 유전자, 즉 그 발현이 대립유전자의 부모 기원에 의존하는 유전자가 태반에서 주요 기능을 수행한다. 태반은 위-악성으로 설명되었으며, 몇몇 종양 억제인자 유전자의 고메틸화가 관찰되었다.
태반 조직의 DNA 메틸화 프로필 연구는 임신 연관 또는 발생 관련 질환, 예컨대 자간전증 및 자궁내 성장 제한의 병태생리에 대한 식견을 제공하였다. 게놈 각인 장애는 발생 장애, 예컨대 프라더-윌리 증후군 및 앙겔만 증후군에 연관된다. 태반 및 태아 조직에서의 게놈 각인 및 전반적 DNA 메틸화의 변경된 프로필이 보조 생식 기법으로 일어난 임신에서 관찰되었다(H Hiura 등, 2012 Hum Reprod; 27: 2541-2548). 여러 환경적 요인, 예컨대 모체 흡연(KE Haworth 등, 2013 Epigenomes; 5: 37-49), 모체 식이 요인(X Jiang 등, 2012 FASEB J; 26: 3563-3574) 및 모체 대사 상태, 예컨대 당뇨병(N Hajj 등, Diabetes. doi: 10.2337/db12-0289)은 후손의 후생적 이상에 연관되었다.
수십 년 간의 노력에도 불구하고, 임신 전반에 걸쳐 또는 질환 절차, 예컨대 악성화 동안 태아 또는 종양 메틸롬을 연구하고 동적 변화를 모니터링할 수 있는 어떠한 실제적 수단이 없었다. 따라서, 태아 메틸롬 및 종양 메틸롬의 전체 또는 일부를 비침습적으로 분석하기 위한 방법을 제공하는 것이 바람직하다.
요약
구현예는 다양한 조직 및 표본의 메틸화 프로필을 결정하고 이용하기 위한 시스템, 방법, 및 장치를 제공한다. 본원에는 그 예가 제공되어 있다. 혈장 메틸화(또는 무세포 DNA를 갖는 다른 표본, 예로 소변, 침, 생식기 세척액)와 모체/환자의 메틸화 프로필의 비교에 기반하여 태아/종양 조직에 대해 임의의 메틸화 프로필이 추정될 수 있다. 표본이 DNA 혼합물을 갖는 경우 태아/종양 유래 DNA를 확인하기 위해 조직-특이적 대립유전자를 이용하여 태아/종양 조직에 대해 임의의 메틸화 프로필이 결정될 수 있다. 태아/종양의 게놈에서 복제수 변동을 결정하는데 임의의 메틸화 프로필이 이용될 수 있다. 태아에 대한 메틸화 마커가 다양한 기법을 통해 확인되고 있다. 그 메틸화 프로필은 DNA 단편 크기 분포의 크기 파라미터를 결정함으로써 결정될 수 있고, 여기서 메틸화 수준을 결정하는데 크기 파라미터에 대한 기준값이 이용될 수 있다.
추가로, 암 수준을 결정하는데 임의의 메틸화 수준이 이용될 수 있다. 암의 맥락에서, 혈장 중 메틸롬(methylomic) 변화의 측정으로, 모니터링을 위해(예를 들면, 항암 치료 후 반응을 검출하기 위해; 그리고 암 재발을 검출하기 위해), 그리고 예진을 위해(예를 들어, 체내 암 세포 부하를 측정하기 위해, 또는 단계분석 목적을 위해, 또는 질환 또는 질환 진행 또는 전이 과정으로부터의 사망 가능성을 평가하기 위해) 암을 검출할 수 있다(예를 들면, 스크리닝 목적을 위해).
본 발명의 구현예의 성질 및 장점의 더 우수한 이해는 하기 상세한 설명 및 첨부 도면을 참조하여 얻어질 수 있다.
도 1a는 본 발명의 구현예에 따른 모체 혈액, 태반, 및 모체 혈장에 대한 서열분석 결과의 표 100을 나타낸다.
도 1b는 본 발명의 구현예에 따른 서열분석 표본의 1Mb 윈도우에서의 메틸화 밀도를 나타낸다.
도 2a-2c는 메틸화 지수에 대한 베타-값의 그래프를 나타낸다: (a) 모체 혈액 세포, (b) 융모막 융모 표본, (c) 만기 태반 조직.
도 3a 및 3b는 성인 남성 및 비임신 성인 여성에서 수집된 혈장 및 혈액 세포에서 메틸화된 CpG 부위 백분율의 막대 그래프를 나타낸다: (a) 상염색체, (b) 염색체 X.
도 4a 및 4b는 혈액 세포 DNA 및 혈장 DNA에서 대응 유전자좌의 메틸화 밀도 그래프를 나타낸다: (a) 비임신 성인 여성, (b) 성인 남성.
도 5a 및 5b는 임산부에서 수집된 표본 중 메틸화 CpG 부위 백분율의 막대 그래프를 나타낸다: (A) 상염색체, (B) 염색체 X.
도 6은 모체 혈액, 태반 및 모체 혈장에 대한 인간 게놈의 상이한 반복 클래스의 메틸화 수준의 막대 그래프를 나타낸다.
도 7a는 제1 석달 표본에 대한 Circos 그래프 700을 나타낸다. 도 7b는 제3 석달 표본에 대한 Circos 그래프 750을 나타낸다.
도 8a-8d는 정보를 제공하는 단일 뉴클레오티드 다형성 주변의 CpG 부위에 대한 모체 혈장 DNA 대비 게놈 조직 DNA의 메틸화 밀도의 비교 그래프를 나타낸다.
도 9는 본 발명의 구현예에 따른 유기체의 생물학적 표본으로부터 제1 메틸화 프로필을 결정하기 위한 방법 900을 예시하는 순서도이다.
도 10은 본 발명의 구현예에 따른 유기체의 생물학적 표본으로부터 제1 메틸화 프로필을 결정하기 위한 방법 1000을 예시하는 순서도이다.
도 11a 및 11b는 본 발명의 구현예에 따른 모체 혈장 데이터 및 분획 태아 DNA 농도를 이용한 예측 알고리즘의 수행 그래프를 나타낸다
도 12a는 본 발명의 구현예에 따른 메틸화 예측을 위한 15개의 선택된 게놈 유전자좌의 상세내용을 나타내는 표 1200이다. 도 12b는 태반에서 15개의 선택된 게놈 유전자좌 및 이들의 대응 메틸화 수준의 추정 범주를 나타내는 그래프 1250이다.
도 13은 적어도 하나의 태아를 임신한 여성 대상자의 생물학적 표본에서 태아 염색체 이상을 검출하기 위한 방법 1300의 순서도이다.
도 14는 본 발명의 구현예에 따라 태반 메틸화 프로필과 모체 메틸화 프로필을 비교하여 메틸화 마커를 확인하기 위한 방법 1400의 순서도이다.
도 15a는 33개의 이전에 보고된 제1 석달 마커를 참조하여 제1 석달 데이터를 이용한 DMR 확인 알고리즘의 수행을 나타내는 표 1500이다. 도 15b는 출산 시 수득한 태반 표본과 비교되는 제3 석달 데이터를 이용한 DMR 확인 알고리즘의 성능을 나타내는 표 1550이다.
도 16은 모체 혈장 바이설파이트-서열분석 데이터의 직접 분석에 기반하여 고메틸화 또는 저메틸화된 것으로 예측되는 유전자좌의 수를 나타내는 표 1600이다.
도 17a는 모체 혈장, 비임신 여성 대조군 혈장, 태반 및 말초 혈액 DNA의 크기 분포를 나타내는 그래프 1700이다. 도 17b는 모체 혈장, 성인 여성 대조군 혈장, 태반 조직 및 성인 여성 대조군 혈액의 크기 분포 및 메틸화 프로필의 그래프 1750이다.
도 18a 및 18b는 본 발명의 구현예에 따른 혈장 DNA 분자의 메틸화 밀도 및 크기 그래프이다.
도 19a는 성인 비임신 여성에 대한 서열분석 측정치의 크기 및 메틸화 밀도의 그래프 1900을 나타낸다. 도 19b는 모체 혈장 중 태아-특이적 및 모체-특이적 DNA 분자의 크기 분포 및 메틸화 프로필을 나타내는 그래프 1950이다.
도 20은 본 발명의 구현예에 따른 유기체의 생물학적 표본 중 DNA의 메틸화 수준을 산정하기 위한 방법 2000의 순서도이다.
도 21a는 간세포암종(HCC) 환자의 수술 전 혈장 및 조직 표본의 메틸화 밀도를 나타내는 표 2100이다. 도 21b는 표본 별로 달성된 서열 리드의 수 및 서열분석 깊이를 나타내는 표 2150이다.
도 22는 건강한 대조군의 혈장 표본 중 71.2% 내지 72.5% 범위의, 상염색체에서의 메틸화 밀도를 나타내는 표 220이다.
도 23a 및 23b는 HCC 환자의 버피 코트, 종양 조직, 비종양 간 조직, 수술 전 혈장 및 수술 후 혈장의 메틸화 밀도를 나타낸다.
도 24a는 HCC 환자로부터의 수술 전 혈장의 메틸화 밀도를 나타내는 그래프 2400이다. 도 24b는 HCC 환자로부터의 수술 후 혈장의 메틸화 밀도를 나타내는 그래프 2450이다.
도 25a 및 25b는 염색체 1에 대한 기준으로 4명의 건강한 대조군 대상자의 혈장 메틸롬 데이터를 이용하여 HCC 환자의 수술 전(그래프 2500) 및 수술 후(그래프 2550) 혈장 표본에 대한 혈장 DNA 메틸화 밀도의 z-스코어를 나타낸다.
도 26a는 수술 전 및 수술 후 혈장에 대한 z-스코어 데이터를 나타내는 표 2600이다. 도 26b는 전체 상염색체에서 분석된 1Mb bin에 대한 기준으로 4명의 건강한 대조군 대상자를 이용하여 HCC 환자의 수술 전 및 수술 후 혈장 표본에 대한 혈장 DNA 메틸화 밀도의 z-스코어를 나타내는 Circos 그래프 2620이다. 도 26c는 HCC 환자의 수술 전 및 수술 후 혈장 표본 모두에서 전체 게놈에 대한 1Mb bin의 z-스코어 분포를 나타내는 표 2640이다. 도 26d는 CHH 및 CHG 맥락을 이용하는 경우 일부 대조군 혈장 표본과 중복되는 종양 조직 및 수술 전 혈장 표본의 메틸화 수준을 나타내는 표 2660이다.
도 27a-h는 본 발명의 구현예에 따른 8명의 암 환자의 메틸화 밀도의 Circos 그래프를 나타낸다. 도 27i는 표본 별로 달성한 서열 리드의 수 및 서열분석 깊이를 나타내는 표 2780이다. 도 27j는 상이한 악성물을 갖는 환자의 혈장에서 전체 게놈에 대해 1Mb bin의 z-스코어 분포를 나타내는 표 2790이다. CL=폐의 선암종; NPC=코인두암종; CRC=결직장암종; NE=신경내분비암종; SMS=평활근육종.
도 28은 본 발명의 구현예에 따른 암 수준의 분류를 결정하기 위한 유기체의 생물학적 표본을 분석하는 방법 2800의 순서도이다.
도 29a는 상기 분포가 정규 분포를 따른다고 가정하는 기준 대상자에서 메틸화 밀도의 분포를 나타내는 그래프 2900이다. 도 29b는 상기 분포가 정규 분포를 따른다고 가정하는 암 대상자에서 메틸화 밀도의 분포를 나타내는 그래프 2950이며, 평균 메틸화 수준은 컷 오프의 2 표준 편차 미만이다.
도 30은 건강한 대상자 및 암 환자의 혈장 DNA의 메틸화 밀도 분포를 나타내는 그래프 3000이다.
도 31은 HCC 환자의 종양 조직 및 건강한 대상자의 혈장 DNA의 평균 간 메틸화 밀도 차이의 분포를 나타내는 그래프 3100이다.
도 32a는 혈장 표본이 5% 또는 2% 종양 DNA를 함유한 경우 서열분석 깊이의 감소 효과를 나타내는 표 3200이다.
도 32b는 4명의 건강한 대조군 대상자의 혈장, 버피 코트, 정상 간 조직, HCC 환자의 종양 조직, 수술 전 혈장 및 수술 후 혈장 표본 중 반복 요소 및 비반복 영역의 메틸화 밀도를 나타내는 그래프 3250이다.
도 33은 본 발명의 구현예에 따른 시스템 및 방법에 이용 가능한 예시적 컴퓨터 시스템 3300의 블록 구성도를 나타낸다.
도 34a는 전신 홍반 루푸스(SLE) 환자 SLE04에서 혈장 DNA의 크기 분포를 나타낸다. 도 34b 및 34c는 SLE 환자 SLE04(도 34b) 및 HCC 환자 TBR36(도 34c)으로부터의 혈장 DNA에 대한 메틸화 분석을 나타낸다.
도 35는 본 발명의 구현예에 따른 CpG 섬의 고메틸화에 기반한 암 수준의 분류를 결정하는 방법 3500의 순서도이다.
도 36은 본 발명의 구현예에 따른 복수의 염색체 영역을 이용한 유기체의 생물학적 표본을 분석하는 방법 3600의 순서도이다.
도 37a는 환자 TBR36에 대한 종양 조직, 바이설파이트(BS)-미처리 혈장 DNA 및 바이설파이트-처리 혈장 DNA(내부에서 외부로)에 대한 CNA 분석을 나타낸다. 도 37b는 환자 TBR36에 대한 1Mb bin의 바이설파이트-처리 및 바이설파이트-미처리 혈장을 이용한 CNA의 검출을 위한 z-스코어 간 관계를 나타내는 산포도이다.
도 38a는 환자 TBR34에 대한 종양 조직, 바이설파이트(BS)-미처리 혈장 DNA 및 바이설파이트-처리 혈장 DNA(내부에서 외부로)에 대한 CNA 분석을 나타낸다. 도 38b는 환자 TBR34에 대한 1Mb bin의 바이설파이트-처리 및 바이설파이트-미처리 혈장을 이용한 CNA의 검출을 위한 z-스코어 간 관계를 나타내는 산포도이다.
도 39a는 HCC 환자 TBR240의 바이설파이트-처리 혈장에 대한 CNA(내부 고리) 및 메틸화 분석(외부 고리)을 나타내는 Circos 그래프이다. 도 39b는 HCC 환자 TBR164의 바이설파이트-처리 혈장에 대한 CNA(내부 고리) 및 메틸화 분석(외부 고리)을 나타내는 Circos 그래프이다.
도 40a는 처리-전 표본 및 처리-후 표본에 대한 환자 TBR36의 CNA 분석을 나타낸다. 도 40b는 처리-전 표본 및 처리-후 표본에 대한 환자 TBR36의 메틸화 분석을 나타낸다. 도 41a는 처리-전 표본 및 처리-후 표본에 대한 환자 TBR34의 CNA 분석을 나타낸다. 도 41b는 처리-전 표본 및 처리-후 표본에 대한 환자 TBR34의 메틸화 분석을 나타낸다.
도 42는 상이한 수의 서열분석 측정치를 갖는 게놈에 걸친 저메틸화 분석의 진단 수행 도형을 나타낸다.
도 43은 상이한 bin 크기(50kb, 100kb, 200kb 및 1Mb)를 갖는 게놈에 걸친 저메틸화 분석에 기반한 암 검출을 위한 ROC 곡선을 나타내는 도형이다.
도 44a는 이상이 있는 bin의 누적 확률(CP) 및 백분율에 대한 진단 성능을 나타낸다. 도 44b는 전반적 저메틸화, CpG 섬 고메틸화 및 CNA에 대한 혈장 분석을 위한 진단 성능을 나타낸다.
도 45는 간세포암종 환자에서 전반적 저메틸화, CpG 섬 고메틸화 및 CNA에 대한 결과표를 나타낸다.
도 46은 간세포암종 이외의 암 환자에서의 전반적 저메틸화, CpG 섬 고메틸화 및 CNA에 대한 결과표를 나타낸다.
도 47은 케이스 TBR34의 혈장 메틸화에 대한 연속 분석을 나타낸다.
도 48a는 HCC 환자 TBR36에 대한 바이설파이트-처리 혈장 DNA 중 CNA(내부 고리) 및 메틸화 변화(외부 고리)를 나타내는 Circos 그래프를 나타낸다. 도 48b는 HCC 환자 TBR36에 대해 염색체 획득 및 손실을 갖는 영역 그리고 복제수 변화가 없는 영역에 대한 메틸화 z-스코어의 그래프이다.
도 49a는 HCC 환자 TBR34에 대한 바이설파이트-처리 혈장 DNA 중 CNA(내부 고리) 및 메틸화 변화(외부 고리)를 나타내는 Circos 그래프를 나타낸다. 도 49b는 HCC 환자 TBR34에 대해 염색체 획득 및 손실을 갖는 영역, 및 복제수 변화가 없는 영역에 대한 메틸화 z-스코어의 그래프이다.
도 50a 및 50b는 SLE 환자 SLE04 및 SLE10에 대한 혈장 저메틸화 및 CNA 분석 결과를 나타낸다.
도 51a 및 51b는 두 HCC 환자(TBR34 및 TBR36)의 혈장에 대해 CNA를 포함하는 및 포함하지 않는 영역에 대한 Zmeth 분석을 나타낸다. 도 51c 및 51d는 두 SLE 환자(SLE04 및 SLE10)의 혈장에 대해 CNA를 포함하는 및 포함하지 않는 영역에 대한 Zmeth 분석을 나타낸다.
도 52a는 CNA, 전반적 메틸화, 및 CpG 섬 메틸화에 대한 A군 특성을 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다. 도 52b는 CNA, 전반적 메틸화, 및 CpG 섬 메틸화에 대한 B군 특성을 이용한 계층 클러스터링을 나타낸다.
도 53a는 A군 CpG 섬 메틸화 특성을 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다. 도 53b는 A군의 전반적 메틸화 밀도를 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다.
도 54a는 A군의 전반적 CNA를 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다. 도 54b는 B군의 CpG 섬 메틸화 밀도를 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다.
도 55a는 B군의 전반적 메틸화 밀도를 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다. 도 55b는 B군의 전반적 메틸화 밀도를 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다.
도 56은 32명의 건강한 대상자 간 1Mb bin(빨간 점)의 평균 메틸화 밀도를 나타낸다.
정의
"메틸롬"은 게놈의 복수의 부위 또는 유전자좌에서 DNA 메틸화량의 측정치를 제공한다. 메틸롬은 게놈의 전체, 게놈의 상당 부분 또는 게놈의 상대적으로 작은 부분(들)에 대응할 수 있다. "태아 메틸롬"은 임신 여성의 태아의 메틸롬에 대응한다. 태아 메틸롬은 모체 혈장 중의 무세포 태아 DNA 및 태반 조직을 포함하는 다양한 태아 조직 또는 태아 DNA의 원천을 이용해서 결정될 수 있다. "종양 메틸롬"은 유기체(예로 인간)의 종양의 메틸롬에 대응한다. 종양 메틸롬은 모체 혈장 중 무세포 종양 DNA 또는 종양 조직을 이용하여 결정될 수 있다. 태아 메틸롬 및 종양 메틸롬이 관심 메틸롬의 예이다. 관심 메틸롬의 다른 예는 체액(예로 혈장, 혈청, 땀, 침, 소변, 생식기 분비물, 정액, 대변액, 설사액, 뇌척수액, 위장관 분비물, 췌장 분비물, 장 분비물, 가래, 눈물, 유방 및 갑상샘으로부터의 흡인액 등) 내로의 DNA에 기여할 수 있는 기관의 메틸롬(예로 뇌 세포, 뼈, 폐, 심장, 근육 및 신장 등의 메틸롬)이다. 기관은 이식된 기관일 수 있다.
"혈장 메틸롬"은 동물(예로 인간)의 혈장 또는 혈청에서 결정된 메틸롬이다. 혈장 메틸롬은 혈장 및 혈청에 무세포 DNA가 포함되므로, 무세포 메틸롬의 예이다. 혈장 메틸롬은 태아/모체 메틸롬 또는 종양/환자 메틸롬의 혼합물이므로, 또한 혼합 메틸롬의 예이다. "태반 메틸롬"은 융모막 융모 표본(CVS) 또는 태반 조직 표본(예로, 출산 후 수득된 것)에서 결정될 수 있다. "세포 메틸롬"은 환자의 세포(예로 혈액 세포)에서 결정되는 메틸롬에 대응한다. 혈액 세포의 메틸롬은 혈액 세포 메틸롬(또는 혈액 메틸롬)으로 불린다.
"부위"는 단일 부위에 대응하며, 이는 단일 염기 위치 또는 관련된 염기 위치의 그룹, 예로 CpG 부위일 수 있다. "유전자좌"는 다중 부위를 포함하는 영역에 대응할 수 있다. 유전자좌에는 단 하나의 부위가 포함될 수 있고, 이는 그 맥락에서 유전자좌를 부위와 동등하게 만들 것이다.
각각의 게놈 부위(예로, CpG 부위)에 대한 "메틸화 지수"는 그 부위를 커버하는 측정치의 총 수에 걸쳐 부위에서 메틸화를 나타내는 서열 리드 비율을 나타낸다. 영역의 "메틸화 밀도"는 영역에서 부위를 커버하는 측정치의 총 수로 나눈 메틸화를 나타내는 영역 내 부위에서의 측정치의 수이다. 부위는 특이적 특징을 가질 수 있다, 예로 CpG 부위일 수 있다. 따라서, 영역의 "CpG 메틸화 밀도"는 영역에서 CpG 부위(예로, 특정 CpG 부위, CpG 섬 내에서의 CpG 부위, 또는 더 큰 영역)를 커버하는 측정치의 총 수로 나눈 CpG 메틸화를 나타내는 측정치의 수이다. 예를 들어, 인간 게놈에서 각각의 100kb bin에 대한 메틸화 밀도는 CpG 부위에서 바이설파이트 처리 후 전환되지 않은 시토신(메틸화 시토신에 대응함)의 총 수에서 100-kb 영역에 맵핑된 서열 리드로 커버되는 모든 CpG 부위의 비율로 결정될 수 있다. 상기 분석은 다른 bin 크기, 예로 50-kb 또는 1-Mb 등에 대해서도 수행될 수 있다. 영역은 전체 게놈 또는 염색체 또는 염색체의 일부(예로 염색체 팔)일 수 있다. CpG 부위의 메틸화 지수는 영역에 CpG 부위만 포함되는 경우의 영역에 대한 메틸화 밀도와 동일하다. "메틸화 시토신의 비율"은 분석된 시토신 잔기의 총 수에 걸쳐 , 즉 영역에서 CpG 맥락 외부의 시토신을 포함하여 메틸화된 것으로 나타나는(예를 들어 바이설파이트 전환 후 미전환된) 시토신 부위 "C"의 수를 나타낸다. 메틸화 지수, 메틸화 밀도 및 메틸화 시토신의 비율은 "메틸화 수준"의 예이다.
"메틸화 프로필"(또한 메틸화 상태로도 불림)에는 영역에 대한 DNA 메틸화에 관련된 정보가 포함된다. DNA 메틸화에 관련된 정보에는 비제한적으로 CpG 부위의 메틸화 지수, 영역에서 CpG 부위의 메틸화 밀도, 인접 영역에 걸친 CpG 부위의 분포, 둘 이상의 CpG 부위를 함유하는 영역 내의 각각의 개별 CpG 부위에 대한 메틸화 패턴 또는 수준 및 비-CpG 메틸화가 포함될 수 있다. 게놈의 상당 부분의 메틸화 프로필은 메틸롬과 동등한 것으로 간주될 수 있다. 포유류 게놈에서의 "DNA 메틸화"는 전형적으로 CpG 디뉴클레오티드 간 시토신 잔기의 5' 탄소에 대한 메틸기 첨가(즉 5-메틸 시토신)를 나타낸다. DNA 메틸화는 다른 맥락에서, 예를 들어 CHG 및 CHH 중 시토신에서 일어날 수 있고, 여기서 H는 아데닌, 시토신 또는 티민이다. 시토신 메틸화는 또한 5-히드록시메틸시토신의 형태일 수 있다. 비-시토신 메틸화, 예컨대 N6-메틸아데닌도 보고되었다.
"조직"은 임의 세포에 대응한다. 상이한 유형의 조직은 상이한 유형의 세포(예로, 간, 폐, 또는 혈액)에 대응할 수 있지만, 또한 상이한 유기체(모체 vs. 태아)로부터의 조직 또는 건강한 세포 vs. 종양 세포에 대응할 수도 있다. "생물학적 표본"은 대상자(예로 인간, 예컨대 임신 여성, 암이 있는 사람 또는 암이 있는 것으로 추정되는 사람, 기관 이식 수령자 또는 기관(예로 심근경색에서의 심장 또는 뇌졸중에서의 뇌)를 갖는 것으로 추정되는 대상자)이 수반된 질환 절차에서 얻어지고, 하나 이상의 관심 핵산 분자(들)를 함유하는 임의 표본을 나타낸다. 생물학적 표본은 체액, 예컨대 혈액, 혈장, 혈청, 소변, 질액, 자궁 또는 질 세척액, 복수, 양수, 뇌척수액, 침, 땀, 눈물, 가래, 기관지폐포 세척액 등일 수 있다. 대변 표본도 이용될 수 있다.
용어 "암의 수준"은 암이 존재하는지의 여부, 암의 단계, 종양의 크기, 전이가 존재하는지의 여부, 신체의 총 종양 부담, 및/또는 암의 다른 중증도 측정치를 나타낼 수 있다. 암의 수준은 수 또는 다른 특징일 수 있다. 수준은 0일 수 있다. 암의 수준에는 또한 돌연변이 또는 여러 돌연변이와 연관된 전악성 또는 전암성 상태(단계)가 포함된다. 암의 수준은 다양한 방식으로 이용될 수 있다. 예를 들어, 스크리닝은 암이 이전에 암을 가진 것으로 알려지지 않은 사람에서 존재하는지를 확인할 수 있다. 평가는 암으로 진단받은 사람을 조사하여 경시적으로 암의 진행을 모니터링하거나, 치료법의 유효성을 연구하거나 또는 예후를 결정할 수 있다. 하나의 구현예에서, 예후는 환자가 암으로 죽을 가능성 또는 특정 기간 또는 시간 후 암이 진행할 가능성 또는 암의 전이 가능성으로 표현될 수 있다. 검출은 암을 제시하는 특성(예로 증상 또는 다른 양성 평가)이 있는 사람이 암을 갖는지의 '스크리닝'을 의미할 수도 있고 확인을 의미할 수도 있다.
상세한 설명
후생적 기전은 배아 및 태아 발생에서 중요한 역할을 수행한다. 그러나, 인간 배아 및 태아 조직(태반 조직 포함)에는 쉽게 접근할 수 없다(U.S. 특허 6,927,028). 특정 구현예에서는 모체 순환 중에 존재하는 무세포 태아 DNA 분자를 갖는 표본을 분석하여 상기 문제를 해결하였다. 태아 메틸롬은 다양한 방식으로 추정될 수 있다. 예를 들어, 모체 혈장 메틸롬이 세포 메틸롬(모체의 혈액 세포 유래)과 비교될 수 있고, 차이는 태아 메틸롬과 관련된 것으로 나타난다. 다른 예로서, 태아-특이적 대립유전자를 이용하여 특정 유전자좌에서 태아 메틸롬의 메틸화를 결정할 수 있다. 또한, 크기 및 메틸화 백분율 간 상관관계가 나타나므로, 단편 크기가 메틸화 백분율의 지표로 이용될 수 있다.
하나의 구현예에서, 게놈에 걸친 바이설파이트 서열분석을 이용하여 단일 뉴클레오티드 해상에서 모체 혈장 DNA의 메틸화 프로필(메틸롬의 일부 또는 전체)을 분석한다. 모체 및 태아 간 다형성 차이를 탐색하여, 태아 메틸롬이 모체 혈액 표본에서 조립될 수 있다. 다른 구현에서는, 다형성 차이가 이용되지 않았지만 혈장 메틸롬 및 혈액 세포 메틸롬 간 차이가 이용될 수 있다.
다른 구현예에서, 종양 게놈 및 비종양 게놈 간 단일 뉴클레오티드 변동 및/또는 복제수 이상, 및 혈장(또는 다른 표본) 서열분석 데이터를 탐색함으로써, 종양의 메틸화 프로필 확인이 암을 갖는 것으로 추정되거나 알려진 환자의 표본에서 수행될 수 있다. 건강한 대조군 또는 건강한 대조군 그룹의 혈장 메틸화 수준과 비교되는 경우, 평가 개인의 혈장 표본 중 메틸화 수준의 차이는 암을 보유한 평가 개인을 확인할 수 있게 한다. 또한, 메틸화 프로필은, 예를 들어 개인에서 발생한 암의 유형, 예를 들어 기관의 유래 및 전이가 일어났는지를 드러내는 특징으로 작용할 수 있다.
상기 접근의 비침습적 성질로 인해, 제1 석달, 제3 석달 중 및 출산 후 수집된 모체 혈액 표본에서 태아 및 모체 혈장 메틸롬을 연속 평가할 수 있었다. 임신 관련 변화가 관찰되었다. 접근은 제2 석달 동안 수득된 표본에도 적용될 수 있다. 임신 중 모체 혈장에서 추정된 태아 메틸롬은 태반 메틸롬과 유사하였다. 각인 유전자 및 상이하게 메틸화된 영역이 모체 혈장 데이터에서 확인되었다.
따라서 태아 메틸롬을 비침습적으로, 연속적으로 그리고 통합적으로 연구하여 임신 관련 병리의 바이오마커 확인 또는 직접적 평가를 위한 가능성을 제공하는 접근을 개발하였다. 구현예는 대상자에 암이 있는지를 스크리닝하거나 검출하기 위해, 암 환자에서 악성 질환을 모니터링하기 위해 그리고 예진을 위해, 종양 메틸롬을 비침습적으로, 연속적으로 그리고 통합적으로 연구하기 위해서도 이용될 수 있다. 구현예는 비제한적으로 폐암, 유방암, 결직장암, 전립선암, 코인두암, 위암, 정소암, 피부암(예로 흑색종), 신경계에 영향을 주는 암, 뼈암, 난소암, 간암(예로 간세포암종), 혈액 악성물, 췌장암, 자궁내막암종, 신장암, 자궁경부암, 방광암 등을 포함하는 임의의 암 유형에 적용될 수 있다.
메틸롬 또는 메틸화 프로필을 결정하는 방법에 대한 설명이 먼저 논의된 후, 상이한 메틸롬(예컨대 태아 메틸롬, 종양 메틸롬, 모체 또는 환자의 메틸롬, 및 혼합 메틸롬, 예로 혈장 유래)이 기재된다. 이어서 태아 메틸화 프로필의 결정이 태아-특이적 마커를 이용해서 또는 혼합 메틸화 프로필을 세포 메틸화 프로필과 비교하여 기재된다. 태아 메틸화 마커는 메틸화 프로필을 비교하여 결정된다. 크기 및 메틸렌 간 관계가 논의된다. 암을 검출하기 위한 메틸화 프로필의 용도도 제공된다.
I. 메틸롬의 결정
여러 접근을 이용하여 태반 메틸롬을 조사하였으나, 각각의 접근은 그 한계를 갖는다. 예를 들어, 비메틸화 시토신 잔기를 우라실로 개질하고 메틸화된 시토신은 변하지 않은 채 놔두는 화학물질인 나트륨 바이설파이트는 시토신 메틸화의 차이를 추가 의문을 위한 유전적 서열 차이로 전환한다. 시토신 메틸화를 연구하는 최고의 방법은 조직 DNA를 나트륨 바이설파이트로 처리한 뒤 바이설파이트 전환 DNA분자의 개별 클론의 직접적 서열분석에 기반한다. 여러 DNA 분자 클론의 분석 후, CpG 부위 별 정량적 프로필 및 시토신 메틸화 패턴이 수득될 수 있다. 그러나 클로닝된 바이설파이트 서열분석은 게놈에 걸친 규모 상에 쉽게 적용될 수 없는 저처리량의 노동 집약적 절차이다.
전형적으로 비메틸화 DNA를 소화시키는 메틸화-감수성 제한 효소는 DNA 메틸화를 연구하기 위한 저비용 접근을 제공한다. 그러나 이러한 연구에서 생성된 데이터는 효소 인식 모티프를 갖는 유전자좌에 제한되며 결과가 정량적이지 않다. 항-메틸화 시토신 항체에 결합된 DNA의 면역침전을 이용하여 큰 게놈 절편을 조사할 수 있지만, 이러한 영역에 대한 더 강한 항체 결합 강도로 인해 조밀한 메틸화를 갖는 유전자좌에 대해 편향되는 경향이 있다. 마이크로어레이 기반 접근은 프로브 및 표적 DNA 간 연구 프로브의 선험적 설계 및 혼성화 효율에 의존한다
메틸롬을 통합적으로 조사하기 위해, 일부 구현예는 대량 병렬 서열분석(MPS)을 이용하여 뉴클레오티드 별로 그리고 대립유전자 기준 별로 메틸화 수준의 정량적 평가 및 게놈에 걸친 정보를 제공한다. 최근, 바이설파이트 전환에 이은 게놈에 걸친 MPS가 타당해졌다(R Lister 등, 2008 Cell; 133: 523-536).
인간 메틸롬의 조사를 위해 게놈에 걸친 바이설파이트 서열분석을 적용한 소수의 공개 연구(R Lister 등, 2009 Nature; 462: 315-322; L Laurent 등, 2010 Genome Res; 20: 320-331; Y Li 등, 2010 PLoS Biol; 8: e1000533; 및 M Kulis 등, 2012 Nat Genet; 44: 1236-1242) 중에서, 두 연구가 배아 줄기 세포 및 태아 섬유아세포에 초점을 맞췄다(R Lister 등, 2009 Nature; 462: 315-322; L Laurent 등, 2010 Genome Res; 20: 320-331). 두 연구 모두 세포주 유래 DNA를 분석하였다.
A. 게놈에 걸친 바이설파이트 서열분석
특정 구현예는 상기 난제를 극복하고 태아 메틸롬을 통합적이고 비침습적으로 그리고 연속적으로 조사할 수 있게 한다. 하나의 구현예에서, 게놈에 걸친 바이설파이트 서열분석을 이용하여 임신 여성의 순환에서 확인되는 무세포 태아 DNA 분자를 분석하였다. 혈장 DNA 분자의 낮은 풍부도 및 단편화된 성질에도 불구하고, 모체 혈장에서 고해상 태아 메틸롬을 조립하고 임신 진행에 따른 변화를 연속 관찰할 수 있었다. 비침습적 산전 평가(NIPT)에 대한 큰 관심에 기반하여, 구현예는 태아 바이오마커 발견을 위한 강력한 신규 도구를 제공하거나 태아 또는 임신 연관 질환의 NIPT를 달성하기 위한 직접적 플랫폼으로 작용할 수 있다. 이제 태아 메틸롬이 유도될 수 있는 다양한 표본의 게놈에 걸친 바이설파이트 서열분석으로부터의 데이터가 제공된다. 하나의 구현예에서, 상기 기술이 자간전증, 또는 자궁내 성장 지연을 합병증으로 갖는 임신 또는 조산에서의 메틸화 프로필 확인을 위해 적용될 수 있다. 이러한 합병증을 갖는 임신에서, 상기 기술은 그 비침습적 성질로 인해 연속 이용하여 모니터링 및/또는 예진 및/또는 치료에 대한 반응을 허용할 수 있다.
도 1a는 본 발명의 구현예에 따른 모체 혈액, 태반, 및 모체 혈장에 대한 서열분석 결과표 100을 나타낸다. 하나의 구현예에서, 전체 게놈 서열분석이 제1 석달에 수집된 혈액 표본의 혈액 세포, CVS, 출산 시 수집된 태반 조직, 제1 및 제3 석달 동안 및 산후기에 수집된 모체 혈장 표본의 메틸화 DNA 라이브러리 어댑터(Illumina)를 이용해서 제조된 바이설파이트-전환 DNA 라이브러리 상에서 수행되었다(R Lister 등, 2008 Cell; 133: 523-536). 1명의 성인 남성 및 1명의 비임신 성인 여성에서 수득한 혈액 세포 및 혈장 DNA 표본도 분석되었다. 총 95억쌍의 미가공 서열 리드가 상기 연구에서 생성되었다. 각 표본의 서열분석 커버 범위를 표 100에 나타낸다.
인간 기준 게놈에 독특하게 맵핑될 수 있던 서열 리드는 제1 석달, 제3 석달 및 산후 모체 혈장 표본에 대해 각각 50배, 34배 및 28배의 평균 홑배수체 게놈 커버 범위에 도달하였다. 게놈에서 CpG 부위의 커버 범위는 임산부에서 수득한 표본에 대해 81% 내지 92% 범위였다. CpG 부위에 걸친 서열 리드는 제1 석달, 제3 석달 및 산후 모체 혈장 표본에 대해 각각 가닥 당 33배, 가닥 당 23배 및 가닥 당 19배의 평균 홑배수체 커버 범위에 달하였다. 모든 표본에 대한 바이설파이트 전환 효율은 >99.9%였다(표 100).
표 100에서, 모호 비율("a"로 표시)은 기준 인간 게놈의 왓슨 및 크릭 가닥 모두에 맵핑된 측정치의 비율을 나타낸다. 람다 전환 비율은 바이설파이트 개질에 의해 "티민" 잔기로 전환된 내부 람다 DNA 대조군 중 비메틸화 시토신의 비율을 나타낸다. H는 일반적으로 A, C, 또는 T와 같다. "a"는 특정 게놈 유전자좌에 맵핑될 수 있지만 왓슨 또는 크릭 가닥에 지정될 수 없는 측정치를 나타낸다. "b"는 동일한 시작 및 끝 좌표를 갖는 페어를 이룬 측정치를 나타낸다. "c"에 있어서, 람다 DNA는 바이설파이트 전환 전에 각 표본 내로 스파이크 처리되었다. 람다 전환 비율은 바이설파이트 전환 후 시토신으로 유지되는 시토신 뉴클레오티드의 비율을 나타내며, 성공적인 바이설파이트 전환 비율의 지표로 이용된다. "d"는 기준 인간 게놈에 존재하고 바이설파이트 전환 후 시토신 서열로 유지되는 시토신 뉴클레오티드의 수를 나타낸다.
바이설파이트 개질 동안, 비메틸화 시토신은 PCR 증폭 후 우라실, 이어서 티민으로 전환되는 반면, 메틸화 시토신은 온전히 유지될 것이다(M Frommer 등, 1992 Proc Natl Acad Sci USA;89:1827-31). 따라서 서열분석 및 정렬 후, 개별 CpG 부위의 메틸화 상태는 CpG 맥락 내 시토신 잔기에서 메틸화 서열 리드 "M"(메틸화) 카운트 및 비메틸화 서열 리드 "U"(비메틸화) 카운트에서 도출될 수 있다. 바이설파이트 서열분석 데이터를 이용하여, 모체 혈액, 태반 및 모체 혈장의 전체 메틸롬이 정립되었다. 모체 혈장 중 특정 유전자좌의 평균 메틸화 CpG 밀도(또한 메틸화 밀도 MD로 불림)가 다음 식을 이용해서 계산될 수 있다:
식 중, M은 유전적 유전자좌 내 CpG 부위에서의 메틸화 측정치의 카운트이고, U는 비메틸화 측정치의 카운트이다. 유전자좌 내에 둘 이상의 CpG 부위가 있는 경우, M 및 U는 부위에 걸친 카운트에 대응한다.
B. 다양한 기법
전술된 바와 같이, 바이설파이트 전환 혈장 DNA의 대량 병렬 서열분석(MPS)을 이용하여 메틸화 프로필 확인을 수행할 수 있다. 바이설파이트 전환 혈장 DNA의 MPS는 무작위로 또는 샷건 방식으로 수행할 수 있다. 서열분석의 깊이는 관심 영역의 크기에 따라 변할 수 있다.
다른 구현예에서, 바이설파이트 전환 혈장 DNA 중의 관심 영역(들)은 먼저 용액상 또는 고상 혼성화 기반 절차를 이용해서 포획된 후 MPS가 뒤따를 수 있다. 합성 시 서열분석 플랫폼, 예컨대 Illumina, 결찰 시 서열분석 플랫폼, 예컨대 Life Technologies의 SOLiD 플랫폼, 반도체 기반 서열분석 시스템, 예컨대 Ion Torrent 또는 Life Technologies의 Ion Proton 시스템, 또는 단일 분자 서열분석 시스템, 예컨대 Helicos 시스템 또는 Pacific Biosciences 시스템 또는 나노포어 기반 서열분석 시스템을 이용하여 대량 병렬 서열분석을 수행할 수 있다. 나노포어-기반 서열분석은, 예를 들어 지질 이중층 및 단백질 나노포어, 그리고 고상 나노포어(예컨대 그래핀 기반 나노포어)를 이용하여 정립된 나노포어를 포함한다. 선택된 단일 분자 서열분석 플랫폼은 DNA 분자(N6-메틸아데닌, 5-메틸시토신 및 5-히드록시메틸시토신 포함)의 메틸화 상태가 바이설파이트 전환 없이 직접 규명될 수 있도록 할 것이며(BA Flusberg 등, 2010 Nat Methods; 7: 461-465; J Shim 등, 2013 Sci Rep; 3:1389. doi: 10.1038/srep01389), 이러한 플랫폼의 이용은 비-바이설파이트 전환 표본 DNA(예로 혈장 DNA)의 메틸화 상태를 분석할 수 있도록 할 것이다.
서열분석 이외에도 다른 기법을 이용할 수 있다. 하나의 구현예에서, 메틸화 프로필 확인은 메틸화-특이적 PCR 또는 메틸화-감수성 제한 효소 분해에 이어 PCR 또는 결찰효소 연쇄 반응에 이어 PCR에 의해 수행될 수 있다. 다른 구현예에서, PCR은 단일 분자 또는 디지털 PCR의 형태이다(B Vogelstein 등, 1999 Proc Natl Acad Sci USA; 96: 9236-9241). 추가 구현예에서, PCR은 실시간 PCR일 수 있다. 다른 구현예에서, PCR은 멀티플렉스 PCR일 수 있다.
II. 메틸롬의 분석
일부 구현예는 전체 게놈 바이설파이트 서열분석을 이용하여 혈장 DNA의 메틸화 프로필을 결정할 수 있다. 태아의 메틸화 프로필은 후술되는 바와 같이 모체 혈장 DNA 표본의 서열분석에 의해 결정될 수 있다. 따라서 태아 DNA 분자(및 태아 메틸롬)가 임신 동안 비침습적으로 평가되고, 임신이 진행됨에 따라 변화가 연속적으로 모니터링되었다. 서열분석 데이터의 통합성으로 인해, 모체 혈장 메틸롬을 게놈에 걸친 규모 상에서 단일 뉴클레오티드 해상으로 연구할 수 있었다.
서열분석 측정치의 게놈 좌표가 알려져 있었으므로, 이들 데이터는 메틸롬의 전체적 메틸화 수준 또는 게놈 중 임의 관심 영역을 연구하고, 상이한 유전 요소 간 비교를 수행할 수 있도록 하였다. 또한, 다중 서열 리드가 각각의 CpG 부위 또는 유전자좌를 커버하였다. 이제 메틸롬을 측정하기 위해 이용된 일부 측정법의 설명이 제공된다.
A. 혈장 DNA 분자의 메틸화
DNA 분자는 저농도로 그리고 단편화된 형태로, 전형적으로 단일 뉴클레오솜 단위와 유사한 길이로 인간 혈장에 존재한다(YMD Lo 등, 2010 Sci Transl Med; 2: 61ra91; 및 YW Zheng 등, 2012 Clin Chem; 58: 549-558). 이러한 제한에도 불구하고, 게놈에 걸친 바이설파이트-서열분석 파이프라인으로 혈장 DNA 분자의 메틸화를 분석할 수 있었다. 다른 구현예에서, 선택된 단일 분자 서열분석 플랫폼이 바이설파이트 전환 없이 DNA 분자의 메틸화 상태가 직접 규명될 수 있도록 할 것이므로(BA Flusberg 등, 2010 Nat Methods; 7: 461-465; J Shim 등, 2013 Sci Rep; 3:1389. doi: 10.1038/srep01389), 이러한 플랫폼의 이용은 비-바이설파이트 전환 혈장 DNA가 혈장 DNA의 메틸화 수준을 결정하기 위해 또는 혈장 메틸롬을 결정하기 위해 이용될 수 있도록 할 것이다. 이러한 플랫폼은 N6-메틸아데닌, 5-메틸시토신, 및 5-히드록시메틸시토신을 검출할 수 있고, 이는 상이한 메틸화 형태의 상이한 생물학적 기능에 관련된 개선된 결과(예로 개선된 민감성 또는 특이성)를 제공할 수 있다. 이러한 개선된 결과는 검출을 위해 구현예를 적용하거나 특정 장애, 예로 자간전증 또는 특정 유형의 암을 모니터링할 때 유용할 수 있다.
바이설파이트 서열분석은 또한 상이한 메틸화 형태 간을 구별할 수 있다. 하나의 구현예에서, 5-메틸시토신을 5-히드록시메틸시토신과 구별할 수 있는 추가 단계를 포함시킬 수 있다. 이러한 접근의 하나는 산화적 바이설파이트 서열분석(oxBS-seq)으로, 단일 염기 해상에서 5-메틸시토신 및 5-히드록시메틸시토신의 위치를 규명할 수 있다(MJ Booth 등, 2012 Science; 336: 934-937; MJ Booth 등, 2013 Nature Protocols; 8: 1841-1851). 바이설파이트 서열분석에서, 5-메틸시토신과 5-히드록시메틸시토신은 모두 시토신으로 측정되므로, 구별될 수 없다. 반면 oxBS-seq에서는, 칼륨 퍼루테네이트(KRuO4)를 이용한 처리에 의해 5-히드록시메틸시토신이 5-포르밀시토신으로 특이적 산화된 후 바이설파이트 전환을 이용해서 새로 형성된 5-포르밀시토신이 우라실로 전환되어 5-히드록시메틸시토신을 5-메틸시토신과 구별할 수 있도록 한다. 따라서 5-메틸시토신 판독이 단일 oxBS-seq 수행에서 수득될 수 있고, 5-히드록시메틸시토신 수준이 바이설파이트 서열분석 결과와의 비교에 의해 추정된다. 다른 구현예에서, 5-메틸시토신은 Tet-보조 바이설파이트 서열분석(TAB-seq)을 이용하여 5-히드록시메틸시토신과 구별될 수 있다(M Yu 등, 2012 Nat Protoc; 7: 2159-2170). TAB-seq는 단일 염기 해상에서 5-히드록시메틸시토신을 확인할 수 있을 뿐만 아니라 각 개질 부위에서 그 풍부도를 결정할 수 있다. 상기 방법에는 5-히드록시메틸시토신의 β-글루코실트랜스퍼라아제 매개 보호(글루코실화) 및 5-메틸시토신의 5-카르복실시토신으로의 재조합 마우스 Tet1(mTet1)-매개 산화가 수반된다. 후속 바이설파이트 처리 및 PCR 증폭 후, 시토신 및 5-카르복실시토신(5-메틸시토신 유래)은 모두 티민(T)으로 전환되는 반면, 5-히드록시메틸시토신은 C로 판독될 것이다.
도 1b는 본 발명의 구현예에 따른 서열분석된 표본의 1Mb 윈도우에서의 메틸화 밀도를 나타낸다. 그래프 150은 게놈에 걸친 1Mb 윈도우에서 모체 혈장 및 게놈 DNA에서의 메틸화 밀도를 나타내는 Circos 그래프이다. 외부에서 내부로: 염색체 핵형도는 시계 방향으로(중심절은 빨간색으로 나타냄), 모체 혈액(빨간색), 태반(노란색), 모체 혈장(녹색), 모체 혈장 중 공유 측정치(파란색), 및 모체 혈장 중 태아-특이적 측정치(보라색)로 배향될 수 있다. 모체 혈액 세포, 태반 및 모체 혈장의 전체적 CpG 메틸화 수준(즉, 밀도 수준)은 표 100에서 확인할 수 있다. 모체 혈액 세포 중 메틸화 수준은 일반적으로 전체 게놈에 걸친 태반의 메틸화 수준보다 높다.
B. 다른 기법에 대한 바이설파이트 서열분석의 비교
대량 병렬 바이설파이트 서열분석을 이용하여 태반 메틸롬을 연구하였다. 또한 인간 게놈에서 약 480,000 CpG 부위를 커버하는 올리고뉴클레오티드 어레이 플랫폼(Illumina)을 이용하여 태반 메틸롬을 연구하였다(M Kulis 등, 2012 Nat Genet; 44: 1236-1242; 및 C Clark 등, 2012 PLoS One; 7: e50233). 비드칩 기반 유전형 분석 및 메틸화 분석을 이용하는 하나의 구현예에서, 유전형 분석은 제조업체의 프로토콜에 따라 Illumina HumanOmni2.5-8 유전형 분석 어레이를 이용하여 수행되었다. 유전형은 Genome Studio 소프트웨어(Illumina)의 GenCall 알고리즘을 이용하여 호출되었다. 호출 비율은 99%를 초과하였다. 마이크로어레이 기반 메틸화 분석에 있어서, 게놈 DNA(500-800ng)는 Illumina Infinium 메틸화 분석에 대한 제조업체의 권장사항에 따라 Zymo EZ DNA 메틸화 키트(Zymo Research, Orange, CA, USA)를 이용하여 나트륨 바이설파이트로 처리하였다.
메틸화 분석은 Infinium HD 메틸화 분석 프로토콜에 따라 50ng/㎕로 4㎕ 바이설파이트-전환 게놈 DNA 상에서 수행하였다. 혼성화된 비드칩을 Illumina iScan 기구 상에서 스캐닝하였다. DNA 메틸화 데이터를 내부 대조군 및 배경 감산에 대해 정규화하여 GenomeStudio(v2011.1) 메틸화 모듈(v1.9.0) 소프트웨어로 분석하였다. 개별 CpG 부위에 대한 메틸화 지수를 베타값(β)으로 나타내었고, 이는 메틸화 및 비메틸화 대립유전자 간 형광 강도의 비를 이용하여 계산하였다:
β = (메틸화 대립유전자의 강도)/(비메틸화 대립유전자의 강도+메틸화 대립유전자의 강도+100)
어레이 상에 나타내고 적어도 10배의 커버 범위에 대해 서열분석된 CpG 부위에 있어서, 어레이에 의해 수득된 베타값을 동일 부위의 서열분석에 의해 결정된 메틸화 지수와 비교하였다. 베타값은 동일한 CpG 부위를 커버하는 메틸화 및 비메틸화 프로브의 조합 강도의 비율로 메틸화 프로브의 강도를 나타내었다. 각각의 CpG 부위에 대한 메틸화 지수는 CpG를 커버하는 측정치의 총 수에 걸친 메틸화 측정치의 비율을 나타낸다.
도 2a-2c는 두 플랫폼에 의해 연구된 대응 CpG 부위의 게놈에 걸친 바이설파이트 서열분석에 의해 결정된 메틸화 지수에 대한 Illumina Infinium 인간메틸화 450K 비드칩 어레이에 의해 결정된 베타값의 그래프를 나타낸다: (A) 모체 혈액 세포, (B) 융모막 융모 표본, (C) 만기 태반 조직. 두 플랫폼의 데이터는 유의미하게 합치하였고, 모체 혈액 세포, CVS 및 만기 태반 조직 각각에 대해 Pearson 상관관계 계수는 0.972, 0.939 및 0.954였고, R2값은 0.945, 0.882 및 0.910이었다.
본 발명자들은 자체 서열분석 데이터를 약 27,000 CpG 부위를 커버하는 올리고뉴클레오티드 어레이를 이용해서 12쌍의 CVS 및 모체 혈액 세포 DNA 표본의 메틸화 프로필을 연구한 Chu 등이 보고한 것과 추가 비교하였다(T Chu 등, 2011 PLoS One; 6: e14723). CVS 및 모체 혈액 세포 DNA의 서열분석 결과 및 이전 연구에서 각각의 12쌍의 표본 간 상관관계 데이터는 모체 혈액에 대해 평균 Pearson 계수(0.967) 및 R2(0.935)를 제공하였고, CVS에 대해 평균 Pearson 계수(0.943) 및 R2(0.888)를 제공하였다. 두 어레이에 제시된 CpG 부위 가운데, 본 발명자들의 데이터가 공개된 데이터와 유의미하게 연관되었다. 비-CpG 메틸화 비율은 모체 혈액 세포, CVS 및 태반 조직에 대해 <1%이었다(표 100). 이들 결과는 상당량의 비-CpG 메틸화가 주로 다능 세포로 제한된다는 현재의 믿음과도 일치하였다(R Lister 등, 2009 Nature; 462: 315-322; L Laurent 등, 2010 Genome Res; 20: 320-331).
C. 비임신 대상자에 대한 혈장 및 혈액 메틸롬의 비교
도 3a 및 3b는 성인 남성 및 비임신 성인 여성에서 수집된 혈장 및 혈액 세포 중 메틸화 CpG 부위의 백분율의 막대 그래프를 나타낸다: (A) 상염색체, (B) 염색체 X. 그래프는 남성 및 비임신 여성의 혈장 및 혈액 메틸롬 간 유사성을 나타낸다. 남성 및 비임신 여성 혈장 표본에서 메틸화된 CpG 부위의 전체적 비율은 대응 혈액 세포 DNA와 거의 동일하였다(표 100 및 도 2a 및 2b).
다음으로 유전자좌-특이적 방식으로 혈장 및 혈액 세포 표본의 메틸화 프로필의 상관관계를 연구하였다. CpG 부위에서 미전환 시토신의 총 수를 100kb 영역에 맵핑된 서열 리드로 커버되는 모든 CpG 부위의 비율로 결정하여, 인간 게놈에서 각각의 100kb bin의 메틸화 밀도를 결정하였다. 메틸화 밀도는 남성뿐만 아니라 여성 표본의 혈장 표본 및 대응 혈액 세포 DNA 간에 상당히 일치하였다.
도 4a 및 4b는 혈액 세포 DNA 및 혈장 DNA에서 대응 유전자좌의 메틸화 밀도 그래프를 나타낸다: (A) 비임신 성인 여성, (B) 성인 남성. 비임신 여성 표본에 대한 Pearson 상관관계 계수 및 R2값은 각각 0.963 및 0.927이었으며, 남성 표본에 대한 것은 각각 0.953 및 0.908이었다. 이들 데이터는 조혈 세포가 인간 혈장 중 DNA의 주요한 원천임을 나타낸 동종이계 조혈 줄기 세포 이식 수령자의 혈장 DNA 분자의 유전형 평가에 기반한 이전 발견과 일치한다(YW Zheng 등, 2012 Clin Chem; 58: 549-558).
D. 메틸롬에 걸친 메틸화 수준
다음으로 모체 혈장 DNA, 모체 혈액 세포, 및 태반 조직의 DNA 메틸화 수준을 연구하여 메틸화 수준을 결정하였다. 수준을 반복 영역, 비반복 영역, 및 전체에 대해 결정하였다.
도 5a 및 5b는 임산부에서 수집된 표본 간 메틸화 CpG 부위의 백분율의 막대 그래프를 나타낸다: (A) 상염색체, (B) 염색체 X. 메틸화 CpG의 전체적 비율은 각각 제1 및 제3 석달 모체 혈장 표본에 대해 67.0% 및 68.2%였다. 비임신 개인에서 수득된 결과와는 달리, 이들 비율은 제1 석달 모체 혈액 세포 표본에서보다 낮았지만 CVS 및 만기 태반 조직 표본에서보다 높았다(표 100). 주목할 것은, 산후 모체 혈장 표본에 대한 메틸화 CpG의 백분율이 혈액 세포 데이터와 유사한 73.1%였다(표 100). 이들 경향은 모든 상염색체뿐만 아니라 염색체 X에 걸쳐 분포된 CpG에서 관찰되었으며, 인간 게놈의 반복 요소의 다중 클래스 및 비반복 영역 모두에 걸쳐 존재하였다.
태반에서의 반복 및 비-반복 요소는 모두 모체 혈액 세포에 비해 저메틸화된 것으로 나타났다. 이 결과는 태반이 말초 혈액 세포를 포함하여 다른 조직에 비해 저메틸화된다는 문헌에서의 발견과 일치하였다.
서열분석된 CpG 부위의 71% 내지 72%가 임신 여성, 비임신 여성 및 성인 남성의 혈액 세포 DNA에서 메틸화되었다(도 1의 표 100) 이들 데이터는 Y Li 등(2010 PLoS Biol; 8: e1000533)에서 보고된 혈액 단핵구의 CpG 부위의 68.4% 보고와 필적한다. 태반 조직의 저메틸화 성질에 대한 이전 보고와 일치하게, CpG 부위의 55% 및 59%가 각각 CVS 및 만기 태반 조직에서 메틸화되었다(표 100).
도 6은 모체 혈액, 태반 및 모체 혈장에 대한 인간 게놈의 상이한 반복 클래스의 메틸화 수준의 막대 그래프를 나타낸다. 반복 클래스는 UCSC 게놈 브라우저에 의해 정의된 바와 같다. 나타낸 데이터는 제1 석달 표본의 것이다. 태반 조직의 저메틸화 성질이 게놈의 특정 반복 클래스에서 주로 관찰됨을 제시한 이전 데이터와는 달리(B Novakovic 등, 2012 Placenta; 33: 959-970), 여기서는 태반이 실제로 혈액 세포에 비해 게놈 요소의 대부분의 클래스에서 저메틸화되었음을 나타낸다.
E. 메틸롬의 유사성
구현예는 동일한 플랫폼을 이용하여 태반 조직, 혈액 세포 및 혈장의 메틸롬을 결정할 수 있다. 따라서 이들 생물학적 표본 유형의 직접 비교가 가능하였다. 남성 및 비임신 여성의 혈액 세포 및 혈장 메틸롬 간 뿐만 아니라 모체 혈액 세포 및 산후 모체 혈장 표본 간 고수준의 유사성은 조혈 세포가 인간 혈장에서 DNA의 주요 원천임을 추가로 확인시켰다(YW Zheng 등, 2012 Clin Chem; 58: 549-558).
유사성은 게놈에서의 메틸화 CpG의 전체적 비율뿐만 아니라 혈액 세포 DNA 및 혈장 DNA의 대응 유전자좌 간 메틸화 밀도의 높은 연관 관점에서 모두 자명하다. 그러나 제1 석달 및 제3 석달 모체 혈장 표본 중 메틸화 CpG의 전체적 비율은 모체 혈액 세포 데이터 또는 산후 모체 혈장 표본과 비교 시 감소되었다. 임신 동안 감소된 메틸화 수준은 모체 혈장에 존재하는 태아 DNA 분자의 저메틸화 성질 때문이었다.
산후 모체 혈장 표본의 메틸화 프로필이 모체 혈액 세포의 메틸화 프로필과 더 유사해지는 역전은 태아 DNA 분자가 모체 순환에서 제거되었음을 제시한다. 태아의 SNP 마커에 기반한 태아 DNA 농도의 계산은 실제로 농도가 산전 33.9%에서 산후 표본에서의 불과 4.5%로 변화하였음을 나타내었다.
F. 다른 용도
구현예는 혈장 DNA의 MPS 분석을 통해 DNA 메틸롬을 성공적으로 조립하였다. 모체 혈장에서 태반 또는 태아 메틸롬을 결정하는 능력은 임신 연관 상태, 예컨대 자간전증, 자궁내 성장 제한, 조산 등에 연관된 이상 메틸화 프로필을 결정하고, 검출하고 모니터링하기 위한 비침습적 방법을 제공한다. 예를 들어, 질환-특이적 이상 메틸화 특징의 검출은 이러한 임신 연관 상태의 스크리닝, 진단 및 모니터링을 허용한다. 모체 혈장 메틸화 수준의 측정은 이러한 임신 연관 상태의 스크리닝, 진단 및 모니터링을 허용한다. 임신 연관 상태의 조사에 대한 직접 적용 이외에도, 이러한 접근은 혈장 DNA 분석이 관심의 대상인 다른 의약 분야에 적용될 수 있다. 예를 들어, 암의 메틸롬이 암 환자의 혈장 DNA에서 결정될 수 있다. 본원에 기재된 바와 같이, 혈장으로부터의 암 메틸롬 분석은 혈장으로부터의 암 게놈 분석에 대해 잠재적으로 상승 효과를 갖는 기술이다(KCA Chan 등, 2013 Clin Chem; 59: 211-224 및 RJ Leary 등, 2012 Sci Transl Med; 4:162ra154).
예를 들어, 혈장 표본의 메틸화 수준 결정을 암을 스크리닝하기 위해 이용할 수 있다. 혈장 표본의 메틸화 수준이 건강한 대조군에 비해 이상 수준을 나타내는 경우, 암을 추정할 수 있다. 이어서 암의 유형 또는 암의 조직 기원의 추가 확인 및 평가가 상이한 게놈 유전자좌에서 메틸화의 혈장 프로필을 결정하여 또는 종양 연관 복제수 이상, 염색체 전위 및 단일 뉴클레오티드 변이를 검출하기 위한 혈장 게놈 분석에 의해 수행될 수 있다. 실제로 본 발명의 하나의 구현예에서, 혈장 암 메틸 및 게놈 프로필 확인이 동시에 수행될 수 있다. 대안적으로, 방사선 및 조영 조사(예로 전산화 단층촬영, 자기 공명 조영, 양성자 방출 단층촬영) 또는 내시경(예로 상부 위장관 시험 내시경 또는 대장내시경 검사)이 혈장 메틸화 수준 분석에 기반하여 암을 갖는 것으로 추정되는 개인을 추가 조사하기 위해 이용될 수 있다.
암 스크리닝 또는 검출을 위해, 혈장(또는 다른 생물학적) 표본의 메틸화 수준의 결정은 암 스크리닝 또는 검출을 위한 다른 양식, 예컨대 전립선 특이적 항원 측정(예로 전립선암을 위한), 암배아 항원(예로 결직장암종, 위암종, 췌장암종, 폐암종, 유방암종, 수질성 갑상샘암종을 위한), 알파 태아단백질(예로 간암 또는 생식 세포 종양을 위한), CA125(예로 난소암 및 유방암을 위한) 및 CA19-9(예로 췌장암종을 위한)와 함께 이용될 수 있다.
또한, 다른 조직을 서열분석하여 세포 메틸롬을 수득할 수 있다. 예를 들어, 간 조직을 분석하여 간에 특이적인 메틸화 패턴을 결정하고, 이를 간 병리를 확인하기 위해 이용할 수 있다. 또한 분석할 수 있는 다른 조직에는 뇌 세포, 뼈, 폐, 심장, 근육 및 신장 등이 포함된다. 다양한 조직의 메틸화 프로필은, 예로 발생, 노화, 질환 절차(예로 염증 또는 경화 또는 자가면역 절차(예컨대 전신 홍반 루푸스에서)) 또는 치료(예로 탈메틸화제, 예컨대 5-아자시티딘 및 5-아자데옥시시티딘을 이용한 치료)의 결과 때때로 변할 수 있다. DNA 메틸화의 동적 성질은 이러한 분석을 생리학적 및 병리학적 절차의 모니터링을 위해 잠재적으로 매우 중요하게 만든다. 예를 들어, 건강할 때 수득한 베이스라인값에 비해 개인의 혈장 메틸롬 변화를 검출하는 경우, 혈장 DNA에 기여하는 기관에서 질환 절차를 검출할 수 있다.
또한, 이식 기관의 메틸롬은 기관 이식 수령자의 혈장 DNA에서 결정될 수 있다. 본 발명에 기재된 바와 같이, 혈장으로부터의 이식 메틸롬 분석은 혈장으로부터의 이식 게놈 분석에 대한 잠재적으로 상승효과를 갖는 기술이다(YW Zheng 등, 2012; YMD Lo 등, 1998 Lancet; 351: 1329-1330; 및 TM Snyder 등, 2011 Proc Natl Acad Sci USA; 108: 6229-6234). 혈장 DNA는 일반적으로 세포사의 마커로 간주되므로, 이식 기관에서 방출된 DNA의 혈장 수준 증가는 그 기관으로부터의 증가된 세포사, 예컨대 거부 증례 또는 그 기관이 수반되는 다른 병리적 절차(예로 감염 또는 농양)에 대한 마커로 이용될 수 있다. 항-거부 치료법이 성공적으로 시행되는 경우, 이식 기관에서 방출되는 DNA의 혈장 수준이 감소할 것으로 예측될 것이다.
III. SNP를 이용한 태아 또는 종양 메틸롬의 결정
전술된 바와 같이, 혈장 메틸롬은 비임신 정상 개인에 대한 혈액 메틸롬에 대응한다. 그러나 임신 여성에 있어서는 메틸롬이 상이하다. 태아 DNA 분자는 모체 DNA의 대부분의 배경 가운데 모체 혈장에서 순환한다(YMD Lo 등, 1998 Am J Hum Genet; 62: 768-775). 따라서 임신 여성에 있어서, 혈장 메틸롬은 크게는 태반 메틸롬 및 혈액 메틸롬의 복합물이다. 따라서 혈장에서 태반 메틸롬을 추출할 수 있다.
하나의 구현예에서, 모체 및 태아 간 단일 뉴클레오티드 다형성(SNP) 차이가 모체 혈장 중에서 태아 DNA 분자를 확인하기 위해 이용된다. 목적은 모체가 동종접합성이지만 태아가 이종접합성인 SNP 유전자좌를 확인하는 것이었다; 태아-특이적 대립유전자를 이용하여 어느 DNA 단편이 태아에서 유래되는지를 결정할 수 있다. 모체 혈액 세포로부터의 게놈 DNA는 SNP 유전형 분석 어레이, Illumina HumanOmni2.5-8을 이용하여 분석될 수 있다. 반면, 모체가 이종접합성이고 태아가 동종접합성인 SNP 유전자좌에 있어서, 모체에 대해 특이적인 SNP 대립유전자를 이용하여 어느 혈장 DNA 단편이 모체에서 유래되는지를 결정할 수 있다. 이러한 DNA 단편의 메틸화 수준은 모체에서 관련 게놈 영역에 대한 메틸화 수준을 반영할 것이다.
A. 태아-특이적 측정치의 메틸화 및 태반 메틸롬의 상관관계
하나의 대립유전자(B)의 양이 다른 대립유전자(A)보다 훨씬 더 적은 두 상이한 대립유전자를 갖는 유전자좌가 생물학적 표본의 서열분석 결과에서 확인되었다. B 대립유전자를 커버하는 측정치는 태아-특이적으로(태아-특이적 측정치로) 간주되었다. 모체는 A에 대해 동종접합성인 것으로 그리고 태아는 A/B에 대해 이종접합성인 것으로 결정되며, 이에 따라 A 대립유전자를 커버하는 측정치는 모체 및 태아에 의해 공유된다(공유 측정치).
본 발명의 몇몇 개념을 예시하기 위해 이용된 하나의 분석된 임신 케이스에서, 임신 모체는 상염색체 상 1,945,516 유전자좌에서 동종접합성으로 나타났다. 이들 SNP를 커버하는 모체 혈장 DNA 서열분석 측정치가 조사되었다. 비-모체 대립유전자를 수반하는 측정치가 107,750 유전자좌에서 검출되었고, 이들은 정보를 제공하는 유전자좌로 간주되었다. 각각의 정보를 제공하는 SNP에서, 모체에서 유래되지 않은 대립유전자가 태아-특이적 대립유전자로 명명된 반면, 다른 것은 공유 대립유전자로 명명되었다.
모체 혈장 중 분획 태아/종양 DNA 농도(또한 태아 DNA 백분율로 불림)가 결정될 수 있다. 하나의 구현예에서, 모체 혈장 중 분획 태아 DNA 농도, f는 다음 공식으로 결정된다:
식 중, p는 태아-특이적 대립유전자의 서열분석 측정치의 수이며, q는 모체 및 태아 간 공유 대립유전자의 서열분석 측정치의 수이다(YMD Lo 등, 2010 Sci Transl Med; 2: 61ra91). 제1 석달, 제3 석달 및 산후 모체 혈장 표본 중 태아 DNA 비율은 각각 14.4%, 33.9% 및 4.5%로 나타났다. 태아 DNA 비율은 또한 염색체 Y에 지정된 측정치의 수를 이용해서 계산되었다. 염색체 Y 데이터에 기반하여, 제1 석달, 제3 석달 및 산후 모체 혈장 표본에서의 결과는 각각 14.2%, 34.9% 및 3.7%였다.
태아-특이적 또는 공유 서열 리드를 별도로 분석함으로써, 구현예는 순환 태아 DNA 분자가 배경 DNA 분자보다 훨씬 더 저메틸화되었음을 나타낸다. 제1 및 제3 석달 모두에 대한 태반 조직 데이터 및 태아-특이적 모체 혈장 측정치에서 대응 유전자좌의 메틸화 밀도 비교는 높은 수준의 상관관계를 드러내었다. 이들 데이터는 태반이 모체 혈장에서 태아 유래 DNA 분자의 주요 원천이며 선택된 유전자좌에서 유래된 정보에 기반한 이전 증거에 비해 주요 발전 단계를 나타내는 게놈 수준 증거를 제공하였다.
정보를 제공하는 SNP에 인접한 CpG 부위를 커버하는 태아-특이적 또는 공유 측정치를 이용하여 게놈에서 각각의 1Mb 영역의 메틸화 밀도를 결정하였다. 모체 혈장 서열 리드에서 조립된 태아 및 비-태아-특이적 메틸롬은, 예를 들어 Circos 그래프에 디스플레이될 수 있다(M Krzywinski 등, 2009 Genome Res; 19: 1639-1645). 1Mb bin 별 메틸화 밀도도 모체 혈액 세포 및 태반 조직 표본에 대해 결정되었다.
도 7a는 제1 석달 표본에 대한 Circos 그래프 700을 나타낸다. 도 7b는 제3 석달 표본에 대한 Circos 그래프 750을 나타낸다. 그래프 700 및 750은 1Mb bin 별 메틸화 밀도를 나타낸다. 염색체 핵형도(최외부 고리)는 시계 방향으로 배향된다(중심절은 빨간색으로 나타냄). 두 번째 최외부 궤도는 대응 1Mb 영역에서 CpG 부위의 수를 나타낸다. 나타낸 빨간색 막대 스케일은 1Mb bin 별로 최대 20,000 부위이다. 대응 1Mb 영역의 메틸화 밀도를 중심에 나타낸 컬러 방식에 기반한 다른 궤도에 나타낸다.
제1 석달 표본(도 7a)에 대해, 내부에서 외부로 궤도는 다음과 같다: 융모막 융모 표본, 모체 혈장 중 태아-특이적 측정치, 모체 혈장 중 모체-특이적 측정치, 모체 혈장 중 조합된 태아 및 비-태아 측정치, 및 모체 혈액 세포. 제3 석달 표본(도 7b)에 대해, 궤도는 다음과 같다: 만기 태반 조직, 모체 혈장 중 태아-특이적 측정치, 모체 혈장 중 모체-특이적 측정치, 모체 혈장 중 조합된 태아 및 비-태아 측정치, 산후 모체 혈장 및 모체 혈액 세포(제1 석달 혈액 표본 유래). 제1 및 제3 석달 혈장 표본 모두에 대해, 태아 메틸롬이 비-태아-특이적 메틸롬에 비해 더 저메틸화되었음이 이해될 수 있다.
태아 메틸롬의 전체적 메틸화 프로필은 CVS 또는 태반 조직 표본과 보다 더 유사하였다. 반대로, 주로 모체 DNA였던 혈장 중 공유 측정치의 DNA 메틸화 프로필은 모체 혈액 세포와 보다 더 유사하였다. 이어서 모체 혈장 DNA 측정치 및 모체 또는 태아 조직의 메틸화 밀도의 체계적 유전자좌별 비교를 수행하였다. 적어도 5 모체 혈장 DNA 서열 리드로 커버되며 정보를 제공하는 SNP와 동일한 서열 리드 상에 존재하는 CpG 부위의 메틸화 밀도를 결정하였다.
도 8a-8d는 정보를 제공하는 단일 뉴클레오티드 다형성 주위의 CpG 부위에 대한 모체 혈장 DNA 대비 게놈 조직 DNA의 메틸화 밀도의 비교 그래프를 나타낸다. 도 8a는 CVS 표본에서의 측정치에 대한 메틸화 밀도 대비 제1 석달 모체 혈장 표본에서의 태아-특이적 측정치에 대한 메틸화 밀도를 나타낸다. 알 수 있듯이, 태아-특이적 값은 CVS값에 잘 대응한다.
도 8b는 만기 태반 조직에서의 측정치에 대한 메틸화 밀도 대비 제3 석달 모체 혈장 표본에서의 태아-특이적 측정치에 대한 메틸화 밀도를 나타낸다. 또 다시, 밀도 세트가 잘 대응하여, 태아 메틸화 프로필이 태아-특이적 대립유전자의 측정치를 분석하여 수득될 수 있음을 시사한다.
도 8c는 모체 혈액 세포에서의 측정치에 대한 메틸화 밀도 대비 제1 석달 모체 혈장 표본에서의 공유 측정치에 대한 메틸화 밀도를 나타낸다. 대부분의 공유 측정치가 모체에서 유래되었다는 점에서, 두 세트값은 잘 대응한다. 도 8d는 모체 혈액 세포에서의 측정치에 대한 메틸화 밀도 대비 제3 석달 모체 혈장 표본에서의 공유 측정치에 대한 메틸화 밀도를 나타낸다.
모체 혈장에서의 태아-특이적 측정치에 있어서, 상기 제1 석달 모체 혈장 및 CVS 간 Spearman 상관관계 계수는 0.705였고(P <2.2*e-16); 제3 석달 모체 혈장 및 만기 태반 조직 간에는 0.796이었다(P <2.2*e-16)(도 8a 및 8b). 유사한 비교를 모체 혈액 세포 데이터로 모체 혈장에서의 공유 측정치에 대해 수행하였다. Pearson 상관관계 계수는 제1 석달 혈장 표본에 대해 0.653이었고(P <2.2*e-16), 제3 석달 혈장 표본에 대해서는 0.638이었다(P <2.2*e-16)(도 8c 및 8d).
B. 태아 메틸롬
하나의 구현예에서, 모체 혈장으로부터 태아 메틸롬을 조립하기 위해, 적어도 하나의 정보를 제공하는 태아 SNP 부위에 걸치고 동일 측정치 내에서 적어도 하나의 CpG 부위를 함유한 서열 리드에 대해 정렬하였다. 태아-특이적 대립유전자를 나타낸 측정치는 태아 메틸롬의 조립에 포함되었다. 공유 대립유전자, 즉 비-태아-특이적 대립유전자를 나타낸 측정치는 주로 모체 유래 DNA 분자로 이루어진 비-태아-특이적 메틸롬의 조립에 포함되었다.
태아-특이적 측정치는 제1 석달 모체 혈장 표본에 대해 상염색체 상의 218,010 CpG 부위를 커버하였다. 제3 석달 및 산후 모체 혈장 표본에 대한 대응 수치는 각각 263,611 및 74,020이었다. 평균적으로, 공유 측정치는 각각 평균 33.3, 21.7 및 26.3배의 이들 CpG 부위를 커버하였다. 태아-특이적 측정치는 제1 석달, 제3 석달 및 산후 모체 혈장 표본에 대해 각각 3.0, 4.4 및 1.8배로 이들 CpG 부위를 커버하였다.
태아 DNA는 모체 혈장에서 소량 모집단을 나타내며, 이에 따라 태아-특이적 측정치에 의한 이들 CpG 부위의 커버 범위는 표본의 태아 DNA 백분율에 비례하였다. 제1 석달 모체 혈장 표본에 있어서, 태아 측정치 중 메틸화 CpG의 전체적 백분율은 47.0%였던 반면, 공유 측정치에 대한 백분율은 68.1%였다. 제3 석달 모체 혈장 표본에 있어서, 태아 측정치의 메틸화 CpG의 백분율은 53.3%였던 반면, 공유 측정치에 대한 백분율은 68.8%였다. 이들 데이터는 모체 혈장 중 태아-특이적 측정치가 모체 혈장 중 공유 측정치에 비해 더 저메틸화됨을 나타내었다.
C. 방법
상술된 기법은 또한 종양 메틸화 프로필을 결정하기 위해 이용될 수 있다. 이제 태아 및 종양 메틸화 프로필을 결정하기 위한 방법을 설명한다.
도 9는 본 발명의 구현예에 따른 유기체의 생물학적 표본에서 제1 메틸화 프로필을 결정하기 위한 방법 900을 예시하는 순서도이다. 방법 900은 모체 혈장의 메틸화 프로필에서 태아의 후생적 맵을 정립할 수 있다. 생물학적 표본에는 제1 조직 및 제2 조직에서 유래되는 무세포 DNA의 혼합물을 포함하는 무세포 DNA가 포함된다. 예로서, 제1 조직은 태아, 종양, 또는 이식 기관 유래일 수 있다.
블록 910에서, 복수의 DNA 분자가 생물학적 표본에서 분석된다. DNA 분자의 분석에는 유기체의 게놈에서 상기 DNA 분자의 위치를 결정하고, 상기 DNA 분자의 유전형을 결정하고, 상기 DNA 분자가 하나 이상의 부위에서 메틸화되어 있는지의 여부를 결정하는 것이 포함될 수 있다.
하나의 구현예에서, DNA 분자는 DNA 분자의 서열 리드를 이용하여 분석되며, 여기서 서열분석은 메틸화를 인식한다. 따라서 서열 리드에는 생물학적 표본 유래 DNA 분자의 메틸화 상태가 포함된다. 메틸화 상태에는 특정 시토신 잔기가 5- 메틸시토신 또는 5-히드록시메틸시토신인지가 포함될 수 있다. 서열 리드는 다양한 서열분석 기법, PCR-기법, 어레이, 및 단편의 서열을 확인하기 위한 다른 적합한 기법에서 수득될 수 있다. 서열 리드의 부위의 메틸화 상태는 본원에 기재된 바와 같이 수득될 수 있다.
블록 920에서, 제1 조직의 제1 게놈이 각각의 제1 대립유전자 및 각각의 제2 대립유전자에 대해 이종접합성이고, 제2 조직의 제2 게놈이 각각의 제1 대립유전자에 대해 동종접합성인 복수의 제1 유전자좌가 확인된다. 예를 들어, 태아-특이적 측정치가 복수의 제1 유전자좌에서 확인될 수 있다. 또는, 종양-특이적 측정치가 복수의 제1 유전자좌에서 확인될 수 있다. 조직-특이적 측정치는 제2 대립유전자의 서열 리드 백분율이 특정 범위, 예로 약 3%-25% 내에 속하여 유전자좌에서 이종접합성 게놈 유래의 소량 모집단의 DNA 단편 및 유전자좌에서 동종접합성 게놈 유래의 다량 모집단을 시사하는 서열분석 측정치에서 확인될 수 있다.
블록 930에서, 각각의 제1 유전자좌의 하나 이상의 부위에 위치한 DNA 분자가 분석된다. 부위에서 메틸화되고 유전자좌의 각각의 제2 대립유전자에 대응하는 여러 DNA 분자가 결정된다. 유전자좌 당 둘 이상의 부위가 존재할 수 있다. 예를 들어, SNP는 단편이 태아-특이적임을, 그리고 단편이 메틸화 상태가 결정된 여러 부위를 가질 수 있음을 시사할 수 있다. 메틸화된 각 부위에서 측정치의 수가 결정될 수 있고, 유전자좌에 대한 메틸화 측정치의 총 수가 결정될 수 있다.
유전자좌는 조직-특이적 대립유전자를 포함하는 변동 주위 영역에 대한 특정 수의 부위, 특정 세트의 부위 또는 특정 크기로 정의될 수 있다. 유전자좌는 단 하나의 부위를 가질 수 있다. 부위는 특이적 특성을 가질 수 있다, 예로 CpG일 수 있다. 비메틸화된 여러 측정치의 결정은 동등하며, 메틸화 상태의 결정 내에 포함된다.
블록 940에서, 각각의 제1 유전자좌에 대해 메틸화 밀도는 유전자좌의 하나 이상의 부위에서 및 유전자좌의 각각의 제2 대립유전자에 대응하여 메틸화된 DNA 분자의 수에 기반하여 계산된다. 예를 들어, 메틸화 밀도는 유전자좌에 대응하는 CpG 부위에 대해 결정될 수 있다.
블록 950에서, 제1 조직의 제1 메틸화 프로필은 제1 유전자좌에 대한 메틸화 밀도에서 생성된다. 제1 메틸화 프로필은 특정 부위, 예로 CpG 부위에 대응할 수 있다. 메틸화 프로필은 태아-특이적 대립유전자를 갖는 모든 유전자좌 또는 이들 유전자좌의 단지 일부에 대한 것일 수 있다.
IV. 혈장 및 혈액 메틸롬의 차이 이용
상기에서, 혈장의 태아-특이적 측정치가 태반 메틸롬과 연관됨이 나타났다. 모체 혈장 메틸롬의 모체 성분은 주로 혈액 세포에 의해 기여되므로, 혈장 메틸롬 및 혈액 메틸롬 간 차이가 태아-특이적 대립유전자의 위치뿐만 아니라 모든 유전자좌에 대한 태반 메틸롬을 결정하기 위해 이용될 수 있다. 혈장 메틸롬 및 혈액 메틸롬 간 차이는 또한 종양 메틸롬을 결정하기 위해 이용될 수 있다.
A. 방법
도 10은 본 발명의 구현예에 따른 유기체의 생물학적 표본으로부터 제1 메틸화 프로필을 결정하는 방법 1000을 예시하는 순서도이다. 생물학적 표본(예로, 혈장)에는 제1 조직에서 그리고 상기 제2 조직에서 기원하는 무세포 DNA 혼합물을 포함하는 무세포 DNA가 포함된다. 제1 메틸화 프로필은 제1 조직(예로, 태아 조직 또는 종양 조직)의 메틸화 프로필에 대응한다. 방법 1200은 모체 혈장으로부터 상이하게 메틸화된 영역의 추정을 제공할 수 있다.
블록 1010에서, 상기 생물학적 표본이 수신된다. 생물학적 표본은 기계(예로, 서열분석기)에서 단순히 수신될 수 있다. 생물학적 표본은 유기체에서 얻은 형태일 수도 있고, 또는 가공된 형태일 수 있다, 예로 표본은 혈액 표본에서 추출된 혈장일 수 있다.
블록 1020에서, 상기 제2 조직의 DNA에 대응하는 제2 메틸화 프로필이 수득된다. 제2 메틸화 프로필은 이전에 결정되었을 수 있으므로, 메모리에서 읽혀질 수 있다. 제2 메틸화 프로필은 제2 조직, 예로 제2 조직의 세포만을 또는 이를 주로 함유하는 상이한 표본에서 결정될 수 있다. 제2 메틸화 프로필은 세포 메틸화 프로필에 대응할 수 있고, 세포 DNA에서 수득될 수 있다. 다른 예로서, 암이 없는 비임신 개인의 혈장 메틸롬이 혈액 세포의 메틸롬과 매우 유사하므로, 제2 프로필은 임신 전에 또는 암 발생 전에 수집된 혈장 표본에서 결정될 수 있다.
제2 메틸화 프로필은 유기체의 게놈에서 각각의 복수의 유전자좌에서 메틸화 밀도를 제공할 수 있다. 특정 유전자좌에서의 메틸화 밀도는 메틸화된 상기 제2 조직의 DNA의 비율에 대응한다. 하나의 구현예에서, 메틸화 밀도는 CpG 메틸화 밀도이며, 여기서 유전자좌와 연관된 CpG 부위는 메틸화 밀도를 결정하기 위해 이용된다. 유전자좌에 대해 하나의 부위가 존재하는 경우, 메틸화 밀도는 메틸화 지수와 같을 수 있다. 메틸화 밀도는 두 값이 상보적이므로, 비메틸화 밀도에도 대응한다.
하나의 구현예에서, 제2 메틸화 프로필은 유기체의 표본에서 세포 DNA의 메틸화 인식 서열분석(methylation-aware sequencing)을 수행하여 수득된다. 메틸화-인식 서열분석의 한 예에는 나트륨 바이설파이트를 이용한 DNA 처리 및 DNA 서열분석의 수행이 포함된다. 다른 예에서, 메틸화-인식 서열분석은 나트륨 바이설파이트를 이용하지 않고, 상기 DNA 분자(N6-메틸아데닌, 5-메틸시토신 및 5-히드록시메틸시토신 포함)의 메틸화 상태가 바이설파이트 전환 없이 직접 규명될 수 있도록 하는 단일 분자 서열분석 플랫폼을 이용하여(AB Flusberg 등, 2010 Nat Methods; 7: 461-465; J Shim 등, 2013 Sci Rep; 3:1389. doi: 10.1038/srep01389); 또는 메틸화 시토신의 면역침전을 통해(예로 메틸시토신에 대한 항체를 이용하거나 메틸화 DNA 결합 단백질 또는 펩티드를 이용한 후(LG Acevedo 등, 2011 Epigenomes; 3: 93-101) 서열분석을 통해); 또는 메틸화-감수성 제한 효소의 이용 후 서열분석을 통해 수행될 수 있다. 다른 구현예에서, 비-서열분석 기법, 예컨대 어레이, 디지털 PCR 및 질량 분광측정이 이용된다.
다른 구현예에서, 제2 조직의 제2 메틸화 밀도는 대상자의 대조군 표본에서 또는 다른 대상자에서 이전에 수득될 수 있다. 다른 대상자로부터의 메틸화 밀도는 기준 메틸화 밀도를 갖는 기준 메틸화 프로필로 작용할 수 있다. 기준 메틸화 밀도는 여러 표본에서 결정될 수 있고, 여기서 유전자좌에서 상이한 메틸화 밀도의 평균 수준(또는 다른 통계값)이 유전자좌에서 기준 메틸화 밀도로 이용될 수 있다.
블록 1030에서, 무세포 메틸화 프로필이 혼합물의 무세포 DNA에서 결정된다. 무세포 메틸화 프로필은 각각의 복수의 유전자좌에서 메틸화 밀도를 제공한다. 무세포 메틸화 프로필은 무세포 DNA의 서열분석에서 서열 리드를 수신하여 결정될 수 있고, 여기서 메틸화 정보가 서열 리드와 함께 수득된다. 무세포 메틸화 프로필은 세포 메틸롬과 동일한 방식으로 결정될 수 있다.
블록 1040에서, 상기 생물학적 표본 중 제1 조직으로부터의 무세포 DNA의 백분율이 결정된다. 하나의 구현예에서, 제1 조직은 태아 조직이고, 대응 DNA는 태아 DNA이다. 다른 구현예에서, 제1 조직은 종양 조직이고, 대응 DNA는 종양 DNA이다. 백분율은 다양한 방식, 예로 태아-특이적 대립유전자 또는 종양-특이적 대립유전자를 이용하여 결정될 수 있다. 복제수는 또한 참조로 도입된, 2013. 3. 13.에 출원된 "Mutational Analysis Of Plasma DNA For Cancer Detection"을 표제로 하는 U.S. 특허 출원 13/801,748에 기재된 바와 같이 백분율을 결정하기 위해 이용될 수 있다.
블록 1050에서, 제1 메틸롬을 결정하기 위한 복수의 유전자좌가 확인된다. 이들 유전자좌는 무세포 메틸화 프로필 및 제2 메틸화 프로필을 결정하기 위해 이용되는 각각의 유전자좌에 대응할 수 있다. 따라서 복수의 유전자좌가 대응할 수 있다. 더 많은 유전자좌가 무세포 메틸화 프로필 및 제2 메틸화 프로필을 결정하기 위해 이용될 수 있다.
일부 구현예에서, 제2 메틸화 프로필에서 고메틸화 또는 저메틸화된 유전자좌가, 예로 모체 혈액 세포를 이용해서 확인될 수 있다. 모체 혈액 세포에서 고메틸화된 유전자좌를 확인하기 위해, 메틸화 지수 ≥X%(예로, 80%)인 CpG 부위에 대해 염색체의 한 말단부터 스캐닝할 수 있다. 이어서 하류 영역 내에서(예로, 200-bp 하류 내에서) 다음 CpG 부위에 대해 검색할 수 있다. 바로 하류 CpG 부위도 메틸화 지수 ≥X%(또는 다른 특정된 양)를 가진 경우, 제1 및 제2 CpG 부위가 그룹핑될 수 있다. 그룹핑은 다음 하류 영역 내에 다른 CpG 부위가 없을 때까지; 또는 바로 하류 CpG 부위가 메틸화 지수 <X%를 가질 때까지 계속될 수 있다. 그룹핑된 CpG 부위의 영역은 그 영역이 적어도 5개의 바로 인접한 고메틸화 CpG 부위를 함유하는 경우, 모체 혈액 세포에서 고메틸화된 것으로 보고될 수 있다. 메틸화 지수 ≤20%인 CpG 부위에 대해 모체 혈액 세포 중에서 저메틸화된 유전자좌에 대해 검색하기 위해 유사한 분석이 수행될 수 있다. 제2 메틸화 프로필에 대한 메틸화 밀도는 짧게 기재된 유전자좌에 대해 계산되고, 예로 모체 혈장 바이설파이트-서열분석 데이터로부터 대응 유전자좌의 제1 메틸화 프로필(예로, 태반 조직 메틸화 밀도)를 추정하기 위해 이용될 수 있다.
블록 1060에서, 제1 조직의 제1 메틸화 프로필은 상기 제2 메틸화 프로필의 메틸화 밀도 및 각각의 복수의 유전자좌에 대한 무세포 메틸화 프로필의 메틸화 밀도 간 차이를 포함하는 차등적 파라미터를 계산하여 결정된다. 차이는 백분율로 등급화된다.
하나의 구현예에서, 제1(예로, 태반) 조직에서 유전자좌의 제1 메틸화 밀도(D)는 다음 공식을 이용하여 추정되었다:
식 중, mbc는 유전자좌(예로, 모체 혈액 세포 바이설파이트-서열분석 데이터에서 결정된 짧게 기재된 유전자좌)에서 상기 제2 메틸화 프로필의 메틸화 밀도를 나타내며; mp는 모체 혈장 바이설파이트-서열분석 데이터에서 대응 유전자좌의 메틸화 밀도를 나타내고; f는 제1 조직(예로, 분획 태아 DNA 농도)으로부터 무세포 DNA의 백분율을 나타내고, CN은 유전자좌에서의 복제수(예로, 정상 대비 증폭에 대해 더 높은 값 또는 결실에 대해 더 낮은 값)를 나타낸다. 제1 조직에 증폭 또는 결실이 없는 경우, CN은 1일 수 있다. 삼염색체증(또는 종양 또는 태아에서 영역의 중복)에 있어서, CN은 1.5일 것이고(증가가 2개 카피 내지 3개 카피이므로), 일염색체증은 0.5를 가질 것이다. 더 높은 증폭은 0.5 증분씩 증가할 수 있다. 상기 예에서, D는 차등적 파라미터에 대응할 수 있다.
블록 1070에서, 제1 메틸화 밀도는 제1 조직의 보정된 제1 메틸화 밀도를 수득하기 위해 변환된다. 변환은 제1 조직의 차등적 파라미터 및 실제 메틸화 프로필 간의 고정 차이를 설명할 수 있다. 예를 들어, 값은 고정 상수만큼 또는 경사도만큼 다를 수 있다. 변환은 선형 또는 비선형일 수 있다.
하나의 구현예에서, 추정값의 분포, D는 태반 조직의 실제 메틸화 수준보다 낮은 것으로 나타났다. 예를 들어, 추정값은 CpG 부위의 상향 제시를 가진 게놈 절편인 CpG 섬의 데이터를 이용해서 선형으로 변환될 수 있다. 상기 연구에서 이용된 CpG 섬의 게놈 위치는 UCSC 게놈 브라우저 데이터베이스(NCBI build 36/hg18)에서 수득되었다(PA Fujita 등, 2011 Nucleic Acids Res; 39: D876-882). 예를 들어, CpG 섬은 GC 함량 ≥50%, 게놈 길이 >200bp 및 관찰/예측 CpG수의 비 >0.6인 게놈 절편으로 정의될 수 있다(M Gardiner-Garden 등, 1987 J Mol Biol; 196: 261-282).
하나의 시행에서, 선형 변환식을 유도하기 위해 서열분석된 표본에서 적어도 4 CpG 부위 및 CpG 부위 별 평균 측정 깊이 ≥5를 갖는 CpG 섬이 포함될 수 있다. CVS 또는 만기 태반에서 CpG 섬의 메틸화 밀도 및 추정값, D 간의 선형 관계를 결정한 후, 하기 공식이 예측값을 결정하기 위해 이용될 수 있다:
제1 석달 예측값 = D × 1.6 + 0.2
제3 석달 예측값 = D × 1.2 + 0.05
B. 태아 예
상술된 바와 같이, 방법 1000은 모체 혈장으로부터 태반의 메틸화 상황을 추정하기 위해 이용될 수 있다. 혈장 중 순환 DNA는 주로 조혈 세포에서 유래된다. 여전히 여기에는 다른 내부 기관에서 기여되는 미지 비율의 무세포 DNA가 존재한다. 또한, 태반-유래 무세포 DNA가 모체 혈장 중 전체 DNA의 대략 5-40%를 나타내며, 평균 대략 15%이다. 따라서 모체 혈장 중 메틸화 수준이 전술된 바와 같이 임신 동안 기존 배경 메틸화 + 태반 분포와 동일하다고 가정할 수 있다.
모체 혈장 메틸화 수준, MP는 하기 식을 이용해서 결정될 수 있다:
식 중, BKG는 혈액 세포 및 내부 기관에서 유래된 혈장 중의 배경 DNA 메틸화 수준이며, PLN은 태반의 메틸화 수준이고, f는 모체 혈장 중 분획 태아 DNA 농도이다.
하나의 구현예에서, 태반의 메틸화 수준은 이론적으로 다음과 같이 추정될 수 있다:
식 (1) 및 (2)는 CN이 1이고, D가 PLN이고, BKG가 mbc인 경우 동일하다. 다른 구현예에서, 분획 태아 DNA 농도는, 예로 최소 f가 존재한다는 가정의 일부로서, 특정값으로 가정되거나 또는 설정될 수 있다.
모체 혈액의 메틸화 수준은 모체 혈장의 배경 메틸화를 나타내기 위해 얻을 수 있다. 모체 혈액 세포에서 고메틸화 또는 저메틸화된 유전자좌에 부가하여, 임상적 관련성을 갖는 정의된 영역, 예를 들어 인간 게놈에서의 CpG 섬에 초점을 맞춰 추정 접근을 추가 탐색하였다.
상염색체 및 chrX에 대한 총 27,458개의 CpG 섬(NCBI Build36/hg18)의 평균 메틸화 밀도는 모체 혈장 및 태반의 서열분석 데이터에서 유래되었다. ≥10 CpG 부위를 가지고 태반, 모체 혈액 및 모체 혈장을 포함하는 모든 분석 표본에서 커버되는 CpG 부위 별 평균 측정 깊이 ≥5인 것들만 선택되었다. 그 결과, 26,698개의 CpG 섬(97.2%)이 유효하게 남았고, 이들의 메틸화 수준이 상기 식에 따라 혈장 메틸화 데이터 및 분획 태아 DNA 농도를 이용하여 추정되었다.
추정된 PLN값의 분포는 태반 조직에서 CpG 섬의 실제 메틸화 수준보다 낮음이 주지되었다. 따라서 하나의 구현예에서, 추정된 PLN값, 또는 단순 추정값(D)이 태반에서 CpG 섬의 메틸화 수준을 추산하기 위한 임의 단위로 이용되었다. 변환 후, 추정값은 선형으로 그리고 이들의 분포는 실제 데이터세트와 더 유사해졌다. 변환된 추정값은 메틸화 예측값(MPV)으로 명명되었고, 이어서 태반에서 유전적 유전자좌의 메틸화 수준을 추정하기 위해 이용되었다.
상기 예에서, CpG 섬은 태반에서 이들의 메틸화 밀도에 기반하여 3 범주로 분류되었다: 저(≤0.4), 중간(>0.4-<0.8) 및 고(≥0.8). 추정 공식을 이용하여, 동일 세트의 CpG 섬의 MPV를 계산한 뒤 값들을 이용해서 동일한 컷오프를 갖는 3 범주로 이들을 분류하였다. 실제 및 추정 데이터세트를 비교하여, 짧게 기재된 CpG 섬의 75.1%가 이들의 MPV에 따른 조직 데이터에서 동일한 범주와 정확히 매치될 수 있음을 확인하였다. CpG 섬의 약 22%는 1-수준 차이를 갖는 그룹(고 대 중간 또는 중간 대 저)으로 지정되며, 3% 미만이 완벽하게 오분류될 것이다(고 대 저) (도 12a). 전체적 분류 성능도 결정되었다: 태반에서 메틸화 밀도 ≤0.4, >0.4-<0.8 및 ≥0.8을 갖는 CpG 섬의 86.1%, 31.4% 및 68.8%가 정확히 "저", "중간" 및 "고"로 추정되었다(도 12b).
도 11a 및 11b는 본 발명의 구현예에 따른 모체 혈장 데이터 및 분획 태아 DNA 농도를 이용한 예측 알고리즘의 성능 그래프를 나타낸다. 도 11a는 MPV 수정 분류를 이용한 CpG 섬 분류의 정확성(추정 카테고리가 실제 데이터세트와 정확히 매치된다); 1-수준 차이(추정 카테고리가 실제 데이터세트와 1-수준 상이하다); 및 오분류(추정 분류가 실제 데이터세트와 반대이다)를 나타내는 그래프 1100이다. 도 11b는 각각의 추정 카테고리에 분류된 CpG 섬의 비율을 나타내는 그래프 1150이다.
모체 배경 메틸화가 각각의 게놈 영역에서 낮다면, 순환 중 고메틸화 태반-유래 DNA의 존재는 분획 태아 DNA 농도에 따른 정도로 전체적 혈장 메틸화 수준을 증가시킬 것이다. 배출된 태아 DNA가 완전 메틸화된 경우, 현저한 변화가 관찰될 수 있다. 반대로 모체 배경 메틸화가 높은 경우, 혈장 메틸화 수준의 변화 정도는 저메틸화 태아 DNA가 배출된 경우 더 커질 것이다. 따라서, 추정 방식은 메틸화 수준이 모체 배경 및 태반 간에 구별되는 것이 알려져 있는 유전적 유전자좌에 대해, 특히 태반에서 고메틸화 및 저메틸화 마커에 대해 추정되는 경우 더 실용적이 될 수 있다.
도 12a는 본 발명의 구현예에 따른 메틸화 예측을 위한 15개의 선택된 게놈 유전자좌의 상세내용을 나타내는 표 1200이다. 기법을 확인하기 위해, 이전에 연구된 15개의 차등적으로 메틸화된 게놈 유전자좌를 선택하였다. 선택된 영역의 메틸화 수준을 추정하고 이전에 연구된 15개의 차등적으로 메틸화된 유전적 유전자좌와 비교하였다(RWK Chiu 등, 2007 Am J Pathol; 170: 941-950; S.S.C. Chim 등, 2008 Clin Chem; 54: 500-511; SSC Chim 등, 2005 Proc Natl Acad Sci U S A; 102: 14753-14758; DWY Tsui 등, 2010 PLoS One; 5: e15069).
도 12b는 태반에서 15개의 선택된 게놈 유전자좌 및 이들의 대응 메틸화 수준의 추정 범주를 나타내는 그래프 1250이다. 추정 메틸화 범주는 다음과 같다: 저, ≤0.4; 중간, >0.4-<0.8; 고, ≥0.8. 표 1200 및 그래프 1300은 태반에서의 이들의 메틸화 수준이 몇몇 예외 RASSF1A, CGI009, CGI137 및 VAPA를 가지며 정확히 추정될 수 있었음을 나타낸다. 이들 4개 마커 중 CGI009만이 실제 데이터세트와 현저한 불일치를 나타내었다. 나머지는 약간만 오분류되었다.
표 1200에서, "1"은 하기 식에 의해 계산된 추정값(D)을 나타낸다:
식 중, f는 분획 태아 DNA 농도이다. 표시 "2"는 하기 식을 이용해서 선형으로 변환된 추정값에 대한 메틸화 예측값(MPV)을 나타낸다:
MPV = D × 1.6 + 0.25. 표시 "3"은 추정값에 대한 분류 컷오프를 나타낸다: 저, ≤0.4; 중간, >0.4-<0.8; 고, ≥0.8. 표시 "4"는 실제 태반 데이터세트에 대한 분류 컷오프를 나타낸다: 저, ≤0.4; 중간, >0.4-<0.8; 고, ≥0.8. 표시 "5"는 태반 상태가 모체 혈액 세포에 대비한 태반의 메틸화 상태를 나타냄을 표시한다.
C. 태아 DNA의 분획 농도 계산
하나의 구현예에서, 제1 조직의 태아 DNA의 백분율은 남성 태아에 대해 Y 염색체를 이용할 수 있다. 모체 혈장 표본 중 염색체 Y 서열의 비율(%chrY)은 남성 태아에서 유래된 염색체 Y 측정치 및 염색체 Y에 대해 잘못 정렬된 모체(여성) 측정치의 수의 합성 함수였다(RWK Chiu 등, 2011 BMJ; 342: c7401). 따라서 표본에서 %chrY 및 분획 태아 DNA 농도(f) 간 관계는 다음과 같이 주어질 수 있다:
식 중, %chrYmale은 100% 남성 DNA를 함유하는 혈장 표본 중 염색체 Y에 정렬된 측정치의 비율을 나타내며; %chrYfemale은 100% 여성 DNA를 함유하는 혈장 표본 중 염색체 Y에 정렬된 측정치의 비율을 나타낸다.
%chrY는 남성 태아를 갖는 여성 임산부의 표본에 대해 미스매치가 없는 염색체 Y에 정렬된 측정치로부터, 예로 측정치가 바이설파이트-전환 표본에서 유래된 경우 결정될 수 있다. %chrYmale값은 두 성인 남성 혈장 표본의 바이설파이트-서열분석에서 수득될 수 있다. %chrYfemale값은 두 비임신 성인 여성 혈장 표본의 바이설파이트-서열분석에서 수득될 수 있다.
다른 구현예에서, 태아 DNA 백분율은 상염색체 상의 태아-특이적 대립유전자에서 결정될 수 있다. 다른 예로서, 후생적 마커가 태아 DNA 백분율을 결정하기 위해 이용될 수 있다. 태아 DNA 백분율의 다른 결정 방식도 이용될 수 있다.
D. 복제수를 결정하기 위한 메틸화 이용 방법
태반 게놈은 모체 게놈에 비해 더 저메틸화된다. 위에서 논의된 바와 같이, 임신 여성의 혈장 메틸화는 모체 혈장 중 태반 유래 태아 DNA의 분획 농도에 의존한다. 따라서 염색체 영역의 메틸화 밀도 분석을 통해, 모체 혈장에 대한 태아 조직의 기여에서의 차이를 검출할 수 있다. 예를 들어, 삼염색체 태아(예로 삼염색체증 21 또는 삼염색체증 18 또는 삼염색체증 13을 갖는)를 수반하는 임신 여성에 있어서, 태아는 이염색체와 비교 시 모체 혈장에 대해 삼염색체로부터 추가량의 DNA에 기여할 것이다. 상기 상황에서, 삼염색체(또는 증폭을 갖는 임의의 염색체 영역)에 대한 혈장 메틸화 밀도는 이염색체에 대한 것보다 낮을 것이다. 차이의 정도는 혈장 표본 중 분획 태아 DNA 농도를 고려하여 수학적 계산에 의해 예측될 수 있다. 혈장 표본 중 분획 태아 DNA 농도가 높을수록, 삼염색체 및 이염색체 간 메틸화 밀도 차이는 더 커질 것이다. 결실을 갖는 영역에 대해서는 메틸화 밀도가 더 높을 것이다.
결실의 한 예는 여성 태아가 염색체 X의 한 개 사본만을 가지게 되는 터너 증후군이다. 상기 상황에서, 터너 증후군을 겪는 태아를 수반하는 임신 여성에 있어서, 그녀의 혈장 DNA 중 염색체 X의 메틸화 밀도는 정상 수의 염색체 X를 갖는 여성 태아를 수반하는 동일 임신 여성의 상황에서보다 높을 것이다. 상기 전략의 하나의 구현예에서, 염색체 Y 서열의 존재 또는 부재에 대해 먼저 모체 혈장을 분석할 수 있다(예로 MPS 또는 PCR-기반 기법을 이용해서). 염색체 Y 서열이 존재하는 경우, 태아는 남성으로 분류될 수 있고, 후속 분석이 필요하지 않을 것이다. 반면, 염색체 Y 서열이 모체 혈장 중에 부재하는 경우, 태아는 여성으로 분류될 수 있다. 상기 상황에서는, 모체 혈장 중 염색체 X의 메틸화 밀도를 분석할 수 있다. 정상보다 높은 염색체 X 메틸화 밀도는 태아가 터너 증후군을 가질 높은 위험이 있음을 시사할 것이다. 상기 접근은 다른 성 염색체 홀배수체에도 적용될 수 있다. 예를 들어, XYY를 겪는 태아에 있어서, 모체 혈장 중 Y 염색체에 대한 메틸화 밀도는 모체 혈장 중 유사한 수준의 태아 DNA를 갖는 정상 XY 태아에 비해 더 낮을 것이다. 다른 예로서, 클라인펠터 증후군(XXY)을 겪는 태아에 있어서, 염색체 Y 서열은 모체 혈장 중에 존재하지만, 모체 혈장 중 염색체 X의 메틸화 밀도는 모체 혈장 중 유사한 수준의 태아 DNA를 갖는 정상 XY 태아에 비해 더 낮을 것이다.
이전 논의로부터, 이염색체에 대한 혈장 메틸화 밀도(MPNon-aneu)는 다음과 같이 계산될 수 있다:
식 중, BKG는 혈액 세포 및 내부 기관에서 유래된 혈장 중의 배경 DNA 메틸화 수준이며, PLN은 태반의 메틸화 수준이고, f는 모체 혈장 중 분획 태아 DNA 농도이다.
삼염색체에 대한 혈장 메틸화 밀도(MPAneu)는 다음과 같이 계산될 수 있다:
식 중, 1.5는 복제수 CN에 대응하며, 한 개 염색체의 추가는 50% 증가이다. 삼염색체 및 이염색체 간 차이(MPDiff)는 다음과 같을 것이다:
하나의 구현예에서, 잠재적 홀배수체 염색체(또는 염색체 영역)의 메틸화 밀도와 하나 이상의 다른 추정 비-홀배수체 염색체(들) 또는 게놈의 전체적 메틸화 밀도의 비교는 혈장 표본 중 태아 DNA 농도를 효과적으로 정규화하기 위해 이용될 수 있다. 비교는 정규화된 메틸화 밀도를 수득하기 위해 두 영역의 메틸화 밀도 간 파라미터(예로 비 또는 차이가 수반되는)의 계산을 통할 수 있다. 비교는 생성 메틸화 수준의 의존성을 제거할 수 있다(예로 두 메틸화 밀도에서 파라미터로 결정됨).
잠재적 홀배수체 염색체의 메틸화 밀도가 하나 이상의 다른 염색체(들)의 메틸화 밀도 또는 태아 DNA의 분획 농도를 반영하는 다른 파라미터에 대해 정규화되지 않은 경우, 분획 농도는 혈장 중 메틸화 밀도에 영향을 미치는 주요 요인일 것이다. 예를 들어, 분획 태아 DNA 농도 10%로 삼염색체증 21 태아를 수반하는 임신 여성의 염색체 21의 혈장 메틸화 밀도는 정배수체 태아를 수반하며 분획 태아 DNA 농도가 15%인 임신 여성과 동일할 것인 반면, 정규화된 메틸화 밀도는 차이를 나타낼 것이다.
다른 구현예에서, 잠재적 홀배수체 염색체의 메틸화 밀도는 분획 태아 DNA 농도에 대해 정규화될 수 있다. 예를 들어, 하기 식이 메틸화 밀도를 정규화하기 위해 적용될 수 있다:
식 중, MPNormalized는 혈장 중 분획 태아 DNA 농도로 정규화된 메틸화 밀도이며, MPnon-normalized는 측정된 메틸화 밀도이고, BKG는 모체 혈액 세포 또는 조직으로부터의 배경 메틸화 밀도이고, PLN은 태반 조직 중 메틸화 밀도이고, f는 분획 태아 DNA 농도이다. BKG 및 PLN의 메틸화 밀도는 건강한 임산부에서 수득된 모체 혈액 세포 및 태반 조직에서 이전에 정립된 기준값에 기반할 수 있다. 상이한 유전적 및 후생적 방법이 혈장 표본 중 분획 태아 DNA 농도의 결정을 위해, 예를 들어 대량 병렬 서열분석 또는 비-바이설파이트-전환 DNA 상의 PCR을 이용하여 염색체 Y로부터 서열 리드 백분율의 측정에 의해 이용될 수 있다.
하나의 시행에서, 잠재 홀배수체 염색체에 대한 정규화된 메틸화 밀도는 정배수체 태아를 수반하는 임신 여성으로 구성된 기준 군과 비교될 수 있다. 기준 군의 정규화된 메틸화 밀도의 평균 및 SD가 결정될 수 있다. 이어서 평가 케이스의 정규화된 메틸화 밀도가 하기 식에 의해 기준 군의 평균으로부터 SD의 수를 시사하는 z-스코어로 표현될 수 있다:
z-스코어 =
식 중, MPNormalized는 평가 케이스에 대해 정규화된 메틸화 밀도이고, Mean은 기준 케이스의 정규화된 메틸화 밀도의 평균이고 SD는 기준 케이스의 정규화된 메틸화 밀도의 표준 편차이다. 염색체가 크게 저메틸화된 경우 분류하기 위해, 그리고 이에 따라 표본의 홀배수체 상태를 결정하기 위해, 예를 들어 z-스코어 <-3의 컷오프가 이용될 수 있다.
다른 구현예에서, MPDiff가 정규화된 메틸화 밀도로 이용될 수 있다. 이러한 구현예에서, PLN은, 예로 방법 1000을 이용해서 추정될 수 있다. 일부 시행에서, 기준 메틸화 밀도(f를 이용해서 정규화될 수 있음)가 비-홀배수체 영역의 메틸화 수준에서 결정될 수 있다. 예를 들어, Mean은 동일한 표본의 하나 이상의 염색체 영역에서 결정될 수 있다. 컷오프는 f에 의해 스케일링되거나 최소 농도가 존재하는 한 충분한 수준으로 설정될 수 있다.
따라서, 영역의 메틸화 수준의 컷오프에 대한 비교는 다양한 방식으로 수행될 수 있다. 비교에는 정규화가 수반될 수 있고(예로, 전술된 바와 같이), 이는 값들이 정의되는 방식에 따라 메틸화 수준 또는 컷오프값에서 동등하게 수행될 수 있다. 따라서 영역의 결정된 메틸화 수준이 기준 수준과 통계적으로 상이한지 여부는(동일한 표본 또는 다른 표본에서 결정됨) 다양한 방식으로 결정될 수 있다.
상기 분석은 염색체 영역의 분석에 적용될 수 있고, 여기에는 염색체의 인접 또는 비인접 서브영역을 포함하는 염색체의 일부 또는 염색체의 전부가 포함될 수 있다. 하나의 구현예에서, 잠재적인 홀배수체 염색체는 여러 bin으로 구분될 수 있다. bin은 동일한 크기 또는 상이한 크기일 수 있다. 각각의 bin의 메틸화 밀도는 표본의 분획 농도 또는 하나 이상의 추정 비-홀배수체 염색체(들)의 메틸화 밀도 또는 게놈의 전체적 메틸화 밀도에 대해 정규화될 수 있다. 이어서 각각의 bin의 정규화된 메틸화 밀도는 이것이 유의미하게 저메틸화되었는지를 결정하기 위해 기준 군과 비교될 수 있다. 이어서 유의미하게 저메틸화된 bin의 백분율이 결정될 수 있다. 예를 들어 5%, 10%, 15%, 20% 또는 30% 초과의 bin이 유의미하게 저메틸화된 컷오프가 케이스의 홀배수체 상태를 분류하기 위해 이용될 수 있다.
증폭 또는 결실을 평가하는 경우, 메틸화 밀도를 평가되는 특정 영역에 특이적일 수 있는 기준 메틸화 밀도에 대해 비교할 수 있다. 각각의 영역은 메틸화가 특히 영역의 크기에 따라(예로 더 작은 영역이 더 변동을 보일 것임) 영역 별로 변할 수 있으므로, 상이한 기준 메틸화 밀도를 가질 수 있다.
상술된 바와 같이, 각각 정배수체 태아를 수반하는 하나 이상의 임신 여성이 두 염색체 영역 간 메틸화 밀도 차이 또는 관심 영역에 대한 메틸화 밀도의 정상 범위를 정의하기 위해 이용될 수 있다. 정상 범위는 또한 PLN에 대해(예로 직접 측정에 의해 또는 방법 1000으로 추정되는 바와 같이) 결정될 수 있다. 다른 구현예에서, 예로 잠재적으로 홀배수체 염색체의 두 메틸화 밀도 간의 비가 이용될 수 있고, 비-홀배수체 염색체가 이들의 차이 대신 분석에 이용될 수 있다. 상기 메틸화 분석 접근은 홀배수체를 결정하거나 확인하기 위한 서열 리드 카운트 접근(RWK Chiu 등, 2008 Proc Natl Acad Sci USA;105:20458-20463) 및 혈장 DNA의 크기 분석이 수반되는 접근(US 특허 2011/0276277)과 조합될 수 있다. 메틸화 분석과 조합 이용되는 서열 리드 카운트 접근은 무작위 서열분석(RWK Chiu 등, 2008 Proc Natl Acad Sci USA;105:20458-20463; DW Bianchi DW 등, 2012 Obstet Gynecol 119:890-901) 또는 표적화된 서열분석(AB Sparks 등, 2012 Am J Obstet Gynecol 206:319.e1-9; B Zimmermann 등, 2012 Prenat Diagn 32:1233-1241; GJ Liao 등, 2012 PLoS One; 7:e38154)을 이용해서 수행될 수 있다.
BKG의 이용은 표본 간 배경 변동을 설명할 수 있다. 예를 들어, 한 여성은 다른 여성과 상이한 BKG 메틸화 수준을 가질 수 있지만, BKG 및 PLN 간 차이가 이러한 상황에서 표본에 걸쳐 이용될 수 있다. 상이한 염색체 영역에 대한 컷오프는, 예로 게놈의 한 영역의 메틸화 밀도가 게놈의 다른 영역에 비해 상이한 경우, 상이할 수 있다.
상기 접근은 태아 게놈에서의 결실 및 증폭을 포함하는 임의의 염색체 이상을 검출하기 위해 일반화될 수 있다. 또한, 상기 분석의 해상은 원하는 수준으로 조정될 수 있다, 예를 들어 게놈이 10Mb, 5Mb, 2Mb, 1Mb, 500kb, 100kb bin으로 구분될 수 있다. 따라서 상기 기술은 아염색체 중복 또는 아염색체 결실을 검출하기 위해서도 이용될 수 있다. 따라서 상기 기술은 산전 태아 분자 핵형이 비침습적으로 수득될 수 있도록 할 것이다. 상기 방식으로 이용되는 경우, 상기 기술은 분자 카운팅에 기반한 비침습적 산전 평가 방법과 조합 이용될 수 있다(A Srinivasan 등, 2013 Am J Hum Genet;92:167-176; SCY Yu 등, 2013 PLoS One 8: e60968). 다른 구현예에서, bin의 크기가 동일할 필요는 없다. 예를 들어, bin의 크기는 각각의 bin이 동일한 수의 CpG 디뉴클레오티드를 함유하도록 조정될 수 있다. 이러한 경우, bin의 물리적 크기가 상이할 것이다.
공식은 상이한 유형의 염색체 이상에 적용하기 위해 다음과 같이 다시 쓰일 수 있다: 식 중, CN은 관련 영역에서 복제수 변화의 수를 나타낸다. CN은 염색체 1개 사본의 획득에 대해 1이고, 염색체 2개 사본의 획득에 대해 2이며, 두 개의 상동성 염색체 중 하나의 손실에 대해 -1이다(예로 여성 태아가 X 염색체 중 하나를 소실하여 XO 핵형으로 이어지는 태아 터너 증후군의 검출에 있어서). bin의 크기가 변하는 경우, 상기 식이 변할 필요는 없다. 그러나 더 작은 크기의 bin이 이용되는 경우, 더 적은 수의 CpG 디뉴클레오티드(또는 태아 DNA 및 모체 DNA 간 차등적 메틸화를 나타내는 다른 뉴클레오티드 조합)가 더 적은 bin에 존재하여 메틸화 밀도 측정의 증가된 확률적 변동으로 이어질 것이므로 민감성 및 특이성이 감소할 수 있다. 하나의 구현예에서, 필요한 측정치의 수는 메틸화 밀도의 변동 계수 및 원하는 민감성 수준을 분석하여 결정될 수 있다.
상기 접근의 타당성을 나타내기 위해, 9명의 임신 여성으로부터 혈장 표본을 분석하였다. 5명의 임신 여성에서, 각각은 정배수체 태아를 수반하였으며, 다른 4명은 삼염색체증 21(T21) 태아를 수반하였다. 5명의 정배수체 임산부 중 3명이 무작위 선택되어 기준 군을 형성하였다. 나머지 2명의 정배수체 임신 케이스(Eu1 및 Eu2) 및 4명의 T21 케이스(T21-1, T21-2, T21-3 및 T21-4)는 잠재적인 T21 상태에 대해 평가하기 위해 상기 접근을 이용해서 분석되었다. 혈장 DNA는 바이설파이트-전환되고 Illumina HiSeq2000 플랫폼을 이용해서 서열분석되었다. 하나의 구현예에서, 개별 염색체의 메틸화 밀도가 계산되었다. 이어서 염색체 21 및 다른 21개 상염색체의 평균 간 메틸화 밀도 차이가 결정되어 정규화된 메틸화 밀도가 수득되었다(표 1). 기준 군의 평균 및 SD가 6개 평가 케이스의 z-스코어 계산을 위해 이용되었다.
표본을 T21로 분류하기 위한 z-스코어 <-3의 컷오프 이용으로, 모든 정배수체 및 T21 케이스의 분류가 정확하였음.
Eu1 Eu2 T21-1 T21-2 T21-3 T21-4
chr 21 및 다른 상염색체 간 MPDiff에 대한 z-스코어 -1.48 1.09 -4.46 -5.30 -8.06 -5.69
다른 구현예에서, 게놈을 1Mb bin으로 나누고 각각의 1Mb bin에 대한 메틸화 밀도를 결정하였다. 잠재적인 홀배수체 염색체에 대한 모든 bin의 메틸화 밀도는 추정되는 비-홀배수체 염색체 상에 존재하는 모든 bin의 중앙값 메틸화 밀도로 정규화될 수 있다. 하나의 시행에서, 각각의 bin에 대해 비-홀배수체 bin의 중앙값으로부터의 메틸화 밀도 차이가 계산될 수 있다. z-스코어는 기준 군의 평균 및 SD값을 이용하여 이들 값에 대해 계산될 수 있다. 저메틸화를 나타내는 bin의 백분율이 결정되고 컷오프 백분율과 비교할 수 있다(표 2).
염색체 21 상에 유의미하게 더 저메틸화된 bin에 대해 컷오프 5% 이용으로, 모든 케이스가 T21 상태에 대해 정확히 분류되었음.
Eu1 Eu2 T21-1 T21-2 T21-3 T21-4
MPDiff <-3의 z-스코어를 갖는 chr 21 상 bin의 백분율 0% 0% 33.3% 58.3% 19.4% 52.8%
태아 염색체 또는 아염색체 이상을 검출하기 위한 상기 DNA 메틸화-기반 접근은 분자 카운팅 기반 접근, 예컨대 서열분석(RWK Chiu 등, 2008 Proc Natl Acad Sci USA; 105: 20458-20463) 또는 디지털 PCR(YMD Lo 등, 2007 Proc Natl Acad Sci USA; 104: 13116-13121), 또는 DNA 분자의 크기별 배열(US 특허 공개 2011/0276277)과 함께 이용될 수 있다. 이러한 조합(예로 DNA 메틸화 + 분자 카운팅, 또는 DNA 메틸화 + 크기별 배열, 또는 DNA 메틸화 + 분자 카운팅 + 크기별 배열)은 임상 환경에서 유리할, 예로 민감성 및/또는 특이성을 개선할 상승 효과를 가질 것이다. 예를 들어, 예로 서열분석으로 분석되어야 할 DNA 분자의 수가 진단 정확성에 부정적 영향을 미치지 않고 감소될 수 있다. 상기 특성은 이러한 평가가 보다 경제적으로 수행될 수 있도록 할 것이다. 다른 예로서, 주어진 수의 분석되는 DNA 분자에 대해, 조합 접근은 더 낮은 분획 농도의 태아 DNA로 태아 염색체 또는 아염색체 이상이 검출될 수 있도록 할 것이다.도 13은 유기체의 생물학적 표본에서 염색체 이상을 검출하기 위한 방법 1300의 순서도이다. 생물학적 표본에는 제1 조직에서 그리고 상기 제2 조직에서 기원하는 무세포 DNA의 혼합물을 포함하는 무세포 DNA가 포함된다. 제1 조직은 태아 또는 종양 유래일 수 있고 상기 제2 조직은 임신 여성 또는 환자 유래일 수 있다.블록 1310에서, 상기 생물학적 표본으로부터의 복수의 DNA 분자가 분석된다. DNA 분자의 분석에는 유기체의 게놈에서 상기 DNA 분자의 위치 결정 및 DNA 분자가 하나 이상의 부위에서 메틸화되어 있는지의 여부를 결정하는 것이 포함될 수 있다. 분석은 메틸화-인식 서열분석에서 서열 리드를 수신하여 수행될 수 있고, 이에 따라 분석은 DNA에서 이전에 수득된 데이터에 대해서만 수행될 수 있다. 다른 구현예에서, 분석에는 실제 서열분석 또는 데이터 수득의 다른 유효 단계가 포함될 수 있다.
위치 결정에는 인간 게놈의 각 부분, 예로 특정 영역으로의 DNA 분자의 맵핑(예로 서열 리드를 통해)이 포함될 수 있다. 하나의 시행에서, 측정치가 관심 영역에 맵핑되지 않는 경우, 측정치는 무시될 수 있다.
블록 1320에서, 부위에서 메틸화되어 있는 DNA 분자의 각각의 수가 각각의 복수의 부위에 대해 결정된다. 하나의 구현예에서, 부위는 CpG 부위이며, 본원에 언급된 하나 이상의 기준을 이용하여 선택된 바와 같은, 특정 CpG 부위만일 수도 있다. 메틸화되는 DNA의 수는 특정 부위에서 분석되는 DNA 분자의 총 수, 예로 서열 리드의 총 수를 이용하여 정규화가 수행되면 비메틸화되는 수를 결정하는 것과 동등하다.
블록 1330에서, 제1 염색체 영역의 제1 메틸화 수준은 제1 염색체 영역 내 부위에서 메틸화되어 있는 DNA 분자의 각각의 수에 기반하여 계선된다. 제1 염색체 영역은 임의 크기, 예로 상기 언급된 크기일 수 있다. 메틸화 수준은, 예로 정규화 절차의 일부로서 제1 염색체 영역에 지정된 DNA 분자의 총 수를 설명할 수 있다.
제1 염색체 영역은 임의 크기(예로 전체 염색체)일 수 있고, 분리된 서브영역으로 이루어질 수도 있다, 즉 서브영역이 서로 분리된다. 각각의 서브영역의 메틸화 수준은, 예로 평균 또는 중앙값으로 결정되고 조합되어 제1 염색체 영역에 대한 메틸화 수준을 결정할 수 있다.
블록 1340에서, 제1 메틸화 수준이 컷오프값과 비교된다. 컷오프값은 기준 메틸화 수준이거나 기준 메틸화 수준에 관련될 수 있다(예로 정규화 수준에서 특정된 거리에 있음). 컷오프값은 제1 염색체 영역에 대해 염색체 이상이 없는 태아를 수반하는 다른 여성 임신 대상자, 암이 없는 개인의 표본, 또는 홀배수체와 연관되지 않은 것으로 알려진 유기체의 유전자좌(즉 이염색체인 영역)에서 결정될 수 있다.
하나의 구현예에서, 컷오프값은 다음의 기준 메틸화 수준으로부터의 차이를 갖는 것으로 정의될 수 있다: 식 중 BKG는 여성의 배경(또는 다른 대상자로부터의 평균 또는 중앙값)이고, f는 제1 조직에서 기원하는 무세포 DNA의 분획 농도이고, CN은 평가되는 복제수이다. CN은 한 유형의 이상(결실 또는 중복)에 대응하는 스케일 인자의 예이다. CN에 대해 컷오프 1이 초기에 모든 증폭을 평가하기 위해 이용될 수 있고, 이어서 추가 컷오프가 증폭 정도를 결정하기 위해 이용될 수 있다. 컷오프값은, 예로 복제수 이상이 존재하지 않는 경우 유전자좌에 대한 예측 메틸화 수준을 결정하기 위해, 제1 조직에서 기원하는 무세포 DNA의 분획 농도에 기반할 수 있다.
블록 1350에서, 제1 염색체 영역에 대한 이상의 분류는 비교에 기반하여 결정된다. 통계적으로 유의미한 수준 차이는 태아가 염색체 이상을 가질 증가된 위험을 시사할 수 있다. 다양한 구현예에서, 염색체 이상은 삼염색체증 21, 삼염색체증 18, 삼염색체증 13, 터너 증후군, 또는 클라인펠터 증후군일 수 있다. 다른 예는 아염색체 결실, 아염색체 중복, 또는 디조지 증후군이다.
V. 마커 결정
위에서 주지된 바와 같이, 태아 게놈의 특정 부분은 모체 게놈과 상이하게 메틸화된다. 이들 차이는 임산부에 걸쳐 일반적일 수 있다. 상이한 메틸화 영역이 태아에서 유래된 DNA 단편을 확인하기 위해 이용될 수 있다.
A. 태반 조직 및 모체 조직에서 DMR을 결정하기 위한 방법
태반은 조직-특이적 메틸화 특징을 갖는다. 태아-특이적 DNA 메틸화 마커가 태반 조직 및 모체 혈액 세포 간에 차등적으로 메틸화된 유전자좌에 기반하여 모체 혈장 검출을 위해 그리고 비침습적 산전 진단 적용을 위해 개발되었다(SSC Chim 등, 2008 Clin Chem; 54: 500-511; EA Papageorgiou 등, 2009 Am J Pathol; 174: 1609-1618; 및 T Chu 등, 2011 PLoS One; 6: e14723). 게놈에 걸친 기준으로 이러한 차등적으로 메틸화된 영역(DMR)을 마이닝하기 위한 구현예가 제공된다.
도 14는 본 발명의 구현예에 따라 태반 메틸화 프로필을 모체 메틸화 프로필(예로, 혈액 세포에서 결정됨)과 비교하여 메틸화 마커를 확인하기 위한 방법 1400의 순서도이다. 방법 1400은 또한 종양 메틸화 프로필을 건강한 조직에 대응하는 메틸화 프로필과 비교하여 종양에 대한 마커를 결정하기 위해 이용될 수 있다.
블록 1410에서, 태반 메틸롬 및 혈액 메틸롬이 수득된다. 태반 메틸롬은 태반 표본, 예로 CVS 또는 만기 태반에서 결정될 수 있다. 메틸롬은 게놈 일부만의 메틸화 밀도를 포함할 수 있는 것임이 이해되어야 한다.
블록 1420에서, 특정한 수의 부위(예로, 5개 CpG 부위)를 포함하고 충분한 수의 측정치가 수득된 영역이 확인된다. 하나의 구현예에서, 적어도 5개의 적격 CpG 부위를 포함하는 첫 번째 500-bp 영역을 배치하기 위해 각 염색체의 한 말단부터 확인이 시작되었다. CpG 부위는 그 부위가 적어도 5개의 서열 리드로 커버되는 경우, 적격으로 간주될 수 있다.
블록 1430에서, 태반 메틸화 지수 및 혈액 메틸화 지수가 각 부위에 대해 계산된다. 예를 들어, 메틸화 지수는 각각의 500bp 영역 내에서 모든 적격 CpG 부위에 대해 개별적으로 계산되었다.
블록 1440에서, 메틸화 지수는 지수 세트가 서로 상이한지를 결정하기 위해 모체 혈액 세포 및 태반 표본 간에 비교되었다. 예를 들어, 메틸화 지수는, 예를 들어 Mann-Whitney 평가를 이용하여 모체 혈액 세포 및 CVS 또는 만기 태반 간에 비교되었다. 더 적은 수가 위양성 영역을 감소시킬 경우 다른 값이 이용될 수 있지만, 예를 들어 ≤0.01의 P-값이 통계적으로 유의미하게 상이한 것으로 간주되었다.
하나의 구현예에서, 적격 CpG 부위의 수가 5 미만이거나 Mann-Whitney 평가가 유의미하지 않은 경우, 500-bp 영역이 100bp 하류로 이동하였다. 영역은 Mann-Whitney 평가가 500bp 영역에 대해 유의미해질 때까지 하류로 계속 이동하였다. 이어서 다음 500-bp 영역이 고려될 것이다. 다음 영역이 Mann-Whitney 평가에 의해 통계적 유의성을 나타내는 것으로 확인되면, 조합된 인접 영역이 1,000bp 이하인 한, 현재 영역에 추가될 것이다.
블록 1450에서, 통계적으로 유의미하게 상이한(예로, Mann-Whitney 평가에 의해) 인접 영역은 병합될 수 있다. 차이는 두 표본에 대한 메틸화 지수 간에 대한 것임을 주지하라. 하나의 구현예에서, 인접 영역이 서로 특정된 거리(예로, 1,000bp) 내에 있고 이들이 유사한 메틸화 프로필을 나타낸 경우, 이들은 병합될 수 있다. 하나의 시행에서, 인접 영역 간 메틸화 프로필의 유사성은 하기 중 임의를 이용하여 정의될 수 있다: (1) 모체 혈액 세포에 비해 태반 조직에서 동일한 경향성을 나타냄, 예로 두 영역이 혈액 세포에 비해 태반 조직에서 더 많이 메틸화됨; (2) 태반 조직에서 인접 영역에 대해 10% 미만의 메틸화 밀도 차이를 가짐; 및 (3) 모체 혈액 세포에서 인접 영역에 대해 10% 미만의 메틸화 밀도 차이를 가짐.
블록 1460에서, 영역에서 모체 혈액 세포 DNA 및 태반 표본(예로, CVS 또는 만기 태반 조직)으로부터의 혈액 메틸롬의 메틸화 밀도가 계산되었다. 메틸화 밀도는 본원에 기재된 바와 같이 결정될 수 있다.
블록 1470에서, 영역에서 모든 부위에 대한 총 태반 메틸화 밀도 및 총 혈액 메틸화 밀도가 통계적으로 유의미하게 상이한 추정 DMR이 결정된다. 하나의 구현예에서, 병합 영역 내의 모든 적격 CpG 부위가 χ2 평가를 거친다. 병합 영역 내의 모든 CpG 부위에 걸친 메틸화 및 비메틸화 시토신의 비율로서의 메틸화 시토신의 수가 모체 혈액 세포 및 태반 조직 간에 통계적으로 유의미하게 상이한 경우 χ2 평가를 평가하였다. 하나의 시행에서, χ2 평가에 대해 ≤0.01의 P-값이 통계적으로 유의미하게 상이한 것으로 간주될 수 있다. χ2 평가에 의해 유의성을 나타낸 병합 절편이 추정 DMR로 간주되었다.
블록 1480에서, 모체 혈액 세포 DNA의 메틸화 밀도가 상한 컷오프 초과 또는 하한 컷오프 미만인 유전자좌가 확인되었다. 하나의 구현예에서, 모체 혈액 세포 DNA의 메틸화 밀도가 ≤20% 또는 ≥80%인 유전자좌가 확인되었다. 다른 구현예에서, 침, 소변 또는 여성 생식기의 자궁 경부 세척액, 눈물, 땀, 침 및 소변을 비제한적으로 포함하는 모체 혈액 이외의 체액이 이용될 수 있다.
모체 혈장 중 태아-특이적인 DNA 메틸화 마커의 성공적 개발을 위한 핵심은 모체 혈액 세포의 메틸화 상태가 가능한 한 고메틸화되거나 비메틸화되는 것일 수 있다. 이는 반대의 메틸화 프로필을 나타내는 태반-유래 태아 DNA 분자의 분석을 방해하는 모체 DNA 분자를 가질 가능성을 감소(예로 최소화)시킬 수 있다. 따라서 하나의 구현예에서, 후보 DMR이 추가 필터링에 의해 선택되었다. 후보 저메틸화 유전자좌는 모체 혈액 세포 중 메틸화 밀도 ≤20% 및 태반 조직 중 적어도 20% 더 높은 메틸화 밀도를 나타낸 것이었다. 후보 고메틸화 유전자좌는 모체 혈액 세포 중 메틸화 밀도 ≥80% 및 태반 조직 중 적어도 20% 더 낮은 메틸화 밀도를 나타낸 것이었다. 다른 백분율이 이용될 수 있다.
블록 1490에서, 차이를 역치와 비교하여 태반 메틸화 밀도가 혈액 메틸화 밀도와 유의미하게 상이한 유전자좌 서브세트 중에서 DMR이 확인되었다. 하나의 구현예에서, 역치는 20%로, 메틸화 밀도는 모체 혈액 세포의 메틸화 밀도와 적어도 20% 상이하였다. 따라서 각각의 확인된 유전자좌에서의 태반 메틸화 밀도 및 혈액 메틸화 밀도 간 차이가 계산될 수 있다. 차이는 단순 차감일 수 있다. 다른 구현예에서, 차이를 결정하기 위해 스케일링 인자 및 다른 함수가 이용될 수 있다(예로, 차이는 단순 차감에 대해 적용되는 함수의 결과일 수 있다).
하나의 시행에서, 상기 방법을 이용하여 11,729개의 고메틸화 및 239,747개의 저메틸화 유전자좌가 제1 석달 태반 표본에서 확인되었다. 상위 100개의 고메틸화 유전자좌가 첨부 표 S2A에 기재된다. 상위 100개의 저메틸화 유전자좌가 첨부 표 S2B에 기재된다. 표 S2A 및 S2B는 염색체, 시작 및 끝 위치, 영역의 크기, 모체 혈액 중 메틸화 밀도, 태반 표본 중 메틸화 밀도, P-값(모두 매우 작음), 및 메틸화 차이를 기재한다. 위치는 기준 게놈 hg18에 대응하며, 이는 hgdownload.soe.ucsc.edu/goldenPath/hg18/chromosomes에서 확인할 수 있다.
11,920개의 고메틸화 및 204,768개의 저메틸화 유전자좌가 제3 석달 태반 표본에서 확인되었다. 제3 석달에 대한 상위 100개의 고메틸화 유전자좌가 표 S2C에 기재되며, 상위 100개의 저메틸화 유전자좌가 표 S2D에 기재된다. 이전에 모체 혈액 세포 및 제1 석달 태반 조직 간에 상이하게 메틸화된 것으로 이전에 보고된 33 유전자좌가 제1 석달 후보 목록을 검증하기 위해 이용되었다. 33 유전자좌의 79%는 본 발명자들의 알고리즘을 이용하여 DMR로 확인되었다
도 15a는 이전에 보고된 33의 제1 석달 마커에 대해 제1 석달 데이터를 이용한 DMR 확인 알고리즘의 성능을 나타내는 표 1500이다. 표에서, "a"는 유전자좌 1 내지 15가 이전에 (RWK Chiu 등, 2007 Am J Pathol; 170:941-950 및 SSC Chim 등, 2008 Clin Chem; 54:500-511)에 보고되었으며; 유전자좌 16 내지 23이 (KC Yuen, thesis 2007, The Chinese University of Hong Kong, Hong Kong)에 기재되었고; 유전자좌 24 내지 33이 (EA Papageorgiou 등, 2009 Am J Pathol; 174:1609-1618)에 기재되었음을 시사한다. "b"는 이들 데이터가 상기 문헌에서 유도되었음을 시사한다. "c"는 모체 혈액 세포 및 융모막 융모 표본의 메틸화 밀도 및 이들의 차이가 본 연구에서 생성된 서열분석 데이터에서 관찰되었지만 원래 연구에서 제공되는 게놈 좌표에 기반함을 시사한다. "d"는 유전자좌 상의 데이터가 Chiu 등(2007), Chim 등(2008), Yuen(2007) 및 Papageorgiou 등(2009)에 의해 위에 언급된 문헌을 참조하지 않고 바이설파이트 서열분석 데이터 상에서 방법 1400의 구현예를 이용하여 확인되었음을 시사한다. 유전자좌 범위에는 이전에 보고된 게놈 영역이 포함되지만 일반적으로 더 넓은 영역에 걸쳐 있었다. "e"는 후보 DMR이 모체 혈액 세포 및 융모막 융모 표본 중 DMR의 대응 게놈 좌표의 메틸화 밀도 간에 >0.20 차이를 관찰하는 요건에 기반하여 진양성(TP) 또는 위음성(FN)으로 분류되었음을 시사한다.
도 15b는 출산 시 수득된 태반 표본에 비해 제3 석달 데이터를 이용한 DMR 확인 알고리즘의 성능을 나타내는 표 1550이다. "a"는 도 17a에 기재된 것과 동일한 33 유전자좌 목록이 이용되었음을 시사한다. "b"는 33 유전자좌가 초기 임신 표본에서 이전에 확인되었으므로, 이들이 제3 석달 데이터에 적용 가능하지 않을 수 있음을 시사한다. 따라서 원래 연구에서 제공되는 게놈 좌표에 기반한 만기 태반 조직 상에서 본 연구에서 생성된 바이설파이트 서열분석 데이터가 검토되었다. 유전자좌가 제3 석달에 실제로 진DMR인지를 결정하기 위해 모체 혈액 세포 및 만기 태반 조직 간 메틸화 밀도에서 >0.20의 차이가 이용되었다. "c"는 유전자좌 상의 데이터가 Chiu 등(2007), Chim 등(2008), Yuen(2007) 및 Papageorgiou 등(2009)에 의해 전에 언급된 문헌을 참조하지 않고 바이설파이트 서열분석 데이터 상에서 방법 1400을 이용하여 확인되었음을 시사한다. 유전자좌 범위에는 이전에 보고된 게놈 영역이 포함되지만 일반적으로 더 넓은 영역에 걸쳐 있었다. "d"는 제3 석달에 상이하게 메틸화된 것이 적격인 유전자좌를 포함한 후보 DMR이 모체 혈액 세포 및 만기 태반 조직 중 DMR의 대응 게놈 좌표의 메틸화 밀도 간에 >0.20 차이를 관찰하는 요건에 기반하여 진양성(TP) 또는 위음성(FN)으로 분류되었음을 시사한다. 제3 석달에 상이하게 메틸화된 것에 적격이 아닌 유전자좌에 있어서, DMR 목록에서의 이들의 부재 또는 유전자좌를 함유하지만 메틸화 차이 <0.20을 나타내는 DMR의 존재는 진음성(TN) DMR로 간주되었다.
B. 모체 혈장 서열분석 데이터로부터의 DMR
표본의 분획 태아 DNA 농도가 또한 알려진 경우, 모체 혈장 DNA 바이설파이트-서열분석 데이터에서 직접 태반 조직 DMR을 확인할 수 있어야 한다. 태반은 모체 혈장 중 태아 DNA의 주요 원천이므로 이것이 가능하며(SSC Chim 등, 2005 Proc Natl Acad Sci USA 102, 14753-14758) 본 연구에서 모체 혈장 중 태아 특이적 DNA의 메틸화 상태가 태반 메틸롬과 연관되었음을 나타내었다.
따라서 방법 1400의 측면은 태반 표본을 이용하는 대신 추정된 태반 메틸롬을 결정하기 위해 혈장 메틸롬을 이용하여 시행할 수 있다. 이에 따라 방법 1000 및 방법 1400이 DMR을 결정하기 위해 조합될 수 있다. 방법 1000은 태반 메틸화 프로필에 대한 예측값을 결정하고 이들을 방법 1400에서 이용하기 위해 이용될 수 있다. 상기 분석을 위해, 실시예는 또한 모체 혈액 세포 중 ≤20% 또는 ≥80% 메틸화된 유전자좌에 초점을 맞춘다.
하나의 시행에서, 모체 혈액 세포에 비해 태반 조직 중에서 고메틸화된 유전자좌를 추정하기 위해, 모체 혈액 세포 중 ≤20% 메틸화 및 혈액 세포 메틸화 밀도와 추정값 간 적어도 50% 차이를 가지는 추정값에 따른 ≥60% 메틸화를 나타낸 유전자좌에 대해 정렬하였다. 모체 혈액 세포에 비해 태반 조직 중에서 저메틸화된 유전자좌를 추정하기 위해, 모체 혈액 세포 중 ≥80% 메틸화 및 혈액 세포 메틸화 밀도 및 추정값 간 적어도 50% 차이를 가지는 추정값에 따른 ≤40% 메틸화를 나타낸 유전자좌에 대해 정렬하였다.
도 16은 모체 혈장 바이설파이트-서열분석 데이터의 직접 분석에 기반하여 고메틸화 또는 저메틸화된 것으로 예측되는 유전자좌의 수를 나타내는 표 1600이다. "N/A"는 해당되지 않음을 의미한다. "a"는 고메틸화 유전자좌에 대한 검색이 모체 혈액 세포 중 <20% 메틸화 밀도를 나타내는 유전자좌 목록에서 시작하였음을 시사한다. "b"는 저메틸화 유전자좌에 대한 검색이 모체 혈액 세포 중 >80% 메틸화 밀도를 나타내는 유전자좌 목록에서 시작하였음을 시사한다. "c"는 융모막 융모 표본으로부터의 바이설파이트-서열분석 데이터가 제1 석달 모체 혈장 데이터의 확인을 위해 이용되었고 만기 태반 조직이 제3 석달 모체 혈장 데이터의 확인을 위해 이용되었음을 시사한다.
표 1600에 나타낸 바와 같이, 대부분의 비침습적으로 추정된 유전자좌는 조직에서 예측되는 메틸화 패턴을 나타내었고, 조직 데이터에서 마이닝되고 이전 섹션에 제시된 DMR과 중복되었다. 첨부에서는 혈장에서 확인된 DMR을 기재한다. 표 S3A는 제1 석달 모체 혈장 바이설파이트-서열분석 데이터에서 고메틸화된 것으로 추정된 상위 100개 유전자좌를 기재한다. 표 S3B는 제1 석달 모체 혈장 바이설파이트-서열분석 데이터에서 저메틸화된 것으로 추정된 상위 100개 유전자좌를 기재한다. 표 S3C는 제3 석달 모체 혈장 바이설파이트-서열분석 데이터에서 고메틸화된 것으로 추정된 상위 100개 유전자좌를 기재한다. 표 S3D는 제3 석달 모체 혈장 바이설파이트-서열분석 데이터에서 저메틸화된 것으로 추정된 상위 100개 유전자좌를 기재한다.
C. 태반 및 태아 메틸롬의 임신 중 변동
CVS 에서 메틸화 CpG의 전체적 비율은 55%였던 반면 만기 태반에 대해서는 59%였다(도 1의 표 100). 더 많은 저메틸화 DMR이 만기 태반에서보다 CVS에서 확인될 수 있던 반면, 고메틸화 DMR의 수는 두 조직에 대해 유사하였다. 따라서, CVS가 만기 태반에 비해 더 저메틸화됨이 명백하였다. 이러한 임신 경향은 모체 혈장 데이터에서도 명백하였다. 태아-특이적 측정치 중 메틸화 CpG의 비율은 제1 석달 모체 혈장에서 47.0%였지만 제3 석달 모체 혈장에서는 53.3%였다. 검증된 고메틸화 유전자좌의 수는 제1(1,457 유전자좌) 및 제3 석달(1,279 유전자좌) 모체 혈장 표본에서 유사하였지만 제3 석달(12,677 유전자좌) 표본에 비해 제1 석달(21,812 유전자좌) 표본에서 실질적으로 더 많은 저메틸화 유전자좌가 존재하였다(도 16의 표 1600).
D. 마커의 이용
상이하게 메틸화된 마커, 또는 DMR은 여러 측면에서 유용하다. 모체 혈장 중 이러한 마커의 존재는 태아 또는 태반 DNA의 존재를 시사하고 확인시킨다. 상기 확인은 비침습적 산전 평가를 위한 품질 대조군으로 이용될 수 있다. DMR은 모체 혈장 중 일반적인 태아 DNA 마커로 작용할 수 있고, 모체 및 태아 간 유전형 차이에 의존하는 마커, 예컨대 다형성 기반 마커 또는 염색체 Y에 기반하는 마커에 비해 장점을 가질 수 있다. DMR은 모든 임신에 대해 유용한 일반적 태아 마커이다. 다형성 기반 마커는 태아가 마커를 그 아버지에게 유전받았고 모체가 그녀의 게놈에 상기 마커를 보유하지 않는 임신의 하위세트에만 적용 가능하다. 또한, 이들 DMR에서 유래되는 DNA 분자의 정량에 의해 모체 혈장 표본에서 태아 DNA 농도를 측정할 수 있다. 정상 임신에 대해 예측되는 DMR 프로필을 인지함으로써, 임신 연관 합병증, 특히 태반 조직 변화가 수반되는 것들이 정상 임신에서 예측되는 것으로부터 모체 혈장 DMR 프로필 또는 메틸화 프로필의 일탈을 관찰하여 검출될 수 있다. 태반 조직 변화가 수반되는 임신 연관 합병증에는 비제한적으로 태아 염색체 홀배수체가 포함된다. 예에는 삼염색체증 21, 자간전증, 자궁내 성장 지연 및 조산이 포함된다.
E. 마커를 이용하는 키트
구현예에서는 본원에 기재된 방법 및 다른 적용 가능한 방법을 실시하기 위한 조성물 및 키트를 제공할 수 있다. 키트는 태아 DNA, 예로 모체 혈장 중 무세포 태아 DNA를 분석하기 위해 분석을 수행하는데 이용될 수 있다. 하나의 구현예에서, 키트에는 본원에서 확인된 하나 이상의 유전자좌와의 특이적 혼성화에 유용한 적어도 하나의 올리고뉴클레오티드가 포함될 수 있다. 키트에는 또한 하나 이상의 기준 유전자좌와의 특이적 혼성화에 유용한 적어도 하나의 올리고뉴클레오티드가 포함될 수 있다. 하나의 구현예에서, 태반 고메틸화 마커가 측정된다. 평가 유전자좌는 모체 혈장 중의 메틸화 DNA일 수 있고, 기준 유전자좌는 모체 혈장 중의 메틸화 DNA일 수 있다. 유사한 키트가 혈장 중 종양 DNA의 분석을 위해 구성될 수 있다.
일부 경우, 키트에는 표적 유전자좌(예로, 첨부된 유전자좌) 및 기준 유전자좌의 적어도 한 구획의 증폭에 이용될 수 있는 적어도 두 올리고뉴클레오티드 프라이머가 포함될 수 있다. 프라이머 대신 또는 이에 부가하여, 키트에는 표적 유전자좌 및 기준 유전자좌에 대응하는 DNA 단편을 검출하기 위한 표지된 프로브가 포함될 수 있다. 다양한 구현예에서, 키트의 하나 이상의 올리고뉴클레오티드는 첨부된 표에서의 유전자좌에 대응한다. 전형적으로, 키트는 또한 사용자가 평가 표본을 분석하고 평가 대상자에서의 생리 또는 병리 상태를 평가하기 위한 명령을 제공하는 명령 매뉴얼을 제공한다.
다양한 구현예에서, 태아 DNA 및 태아를 임신한 여성 대상자 유래 DNA의 혼합물을 함유하는 생물학적 표본 중 태아 DNA를 분석하기 위한 키트가 제공된다. 키트는 표 S2A, S2B, S2C, S2D, S3A, S3B, S3C, 및 S3D에 기재된 게놈 영역의 적어도 한 구획에 특이적으로 혼성화하기 위한 하나 이상의 올리고뉴클레오티드를 포함할 수 있다. 따라서, 표에 걸쳐 또는 단 하나의 표로부터의 임의 수의 올리고뉴클레오티드가 이용될 수 있다. 올리고뉴클레오티드는 프라이머로 작용할 수 있고, 프라이머쌍으로 조직화될 수 있으며, 여기서 한 쌍이 표로부터의 특정 영역에 대응한다.
VI. 크기 및 메틸화 밀도의 관계
혈장 DNA 분자는 짧은 분자의 형태로 순환에 존재하는 것으로 알려져 있고, 대부분의 분자가 약 160bp 길이이다(YMD Lo 등, 2010 Sci Transl Med; 2: 61ra91, YW Zheng 등, 2012 Clin Chem; 58: 549-558). 흥미롭게도 본 발명자들의 데이터는 혈장 DNA 분자의 메틸화 상태 및 크기 간 관계를 드러내었다. 즉, 혈장 DNA 단편 길이는 DNA 메틸화 수준에 연관된다. 혈장 DNA 분자의 특징적인 크기 프로필은 대부분이 아마도 아폽토시스 동안의 효소 분해에서 유도될 수 있는 단일 뉴클레오솜과 연관됨을 제시한다.
순환 DNA는 성질 상 단편화되어 있다. 특히 순환 태아 DNA는 모체 혈장 표본 중의 모체 유래 DNA보다 짧다(KCA Chan 등, 2004 Clin Chem; 50: 88-92). 페어-엔드(paired-end) 정렬이 바이설파이트-처리 DNA의 크기 분석을 가능케 하므로, 혈장 DNA 분자의 크기 및 이들 각각의 메틸화 수준 간에 존재하는 경우 임의 상관관계가 직접 평가할 수 있다. 이를 모체 혈장뿐만 아니라 비임신 성인 여성 대조군의 혈장 표본 중에서 탐색하였다.
각각의 DNA 분자의 양 말단에 대한 페어-엔드 서열분석(전체 분자의 서열분석이 포함됨)이 본 연구에서 각 표본을 분석하기 위해 이용되었다. 각 DNA 분자의 말단 서열 페어를 기준 인간 게놈에 대해 정렬하고 서열분석 측정치의 극 말단의 게놈 좌표를 주지하여, 서열분석된 DNA 분자의 길이를 결정할 수 있다. 혈장 DNA 분자는 자연적으로 소분자로 단편화되며, 혈장 DNA에 대한 서열분석 라이브러리는 전형적으로 임의의 단편화 단계 없이 제조된다. 따라서 서열분석으로 추정된 길이는 원래 혈장 DNA 분자의 크기를 나타내었다.
이전 연구에서, 모체 혈장 중 태아 및 모체 DNA 분자의 크기 프로필을 결정하였다(YMD Lo 등, 2010 Sci Transl Med; 2: 61ra91). 혈장 DNA 분자가 단일 뉴클레오솜과 유사한 크기를 가졌으며 태아 DNA 분자가 모체 분자에 비해 더 짧았음을 나타내었다. 본 연구에서는 혈장 DNA 분자의 메틸화 상태와 이들의 크기에 대한 관계를 결정하였다.
A. 결과
도 17a는 모체 혈장, 비임신 여성 대조군 혈장, 태반 및 말초 혈액 DNA의 크기 분포를 나타내는 그래프 1700이다. 모체 표본 및 비임신 여성 대조군 혈장에 있어서, 두 바이설파이트-처리 혈장 표본은 이전에 보고된 것과 동일한 특징적 크기 분포를 나타내었고(YMD Lo 등, 2010 Sci Transl Med; 2: 61ra91) 가장 풍부한 전체 서열은 166-167bp 길이이고 143bp보다 짧은 DNA 분자가 10-bp 주기로 나타났다.
도 17b는 모체 혈장, 성인 여성 대조군 혈장, 태반 조직 및 성인 여성 대조군 혈액 크기 분포 및 메틸화 프로필 그래프 1750이다. 동일한 크기이고 적어도 하나의 CpG 부위를 함유하는 DNA 분자에 있어서, 이들의 평균 메틸화 밀도가 계산되었다. 이어서 DNA 분자의 크기 및 이들의 메틸화 밀도 간 관계를 그래프화하였다. 구체적으로 평균 메틸화 밀도가 적어도 1 CpG 부위를 커버하는 서열분석 측정치에 대해 50bp 내지 최대 180bp 범위의 각각의 단편 길이에 대해 결정되었다. 흥미롭게도, 메틸화 밀도는 혈장 DNA 크기와 함께 증가하였고, 166-167bp 근처에서 피크를 나타냈다. 그러나 상기 패턴은 초음파 분쇄 시스템을 이용하여 단편화된 태반 및 대조군 혈액 DNA 표본에서는 관찰되지 않았다.
도 18은 혈장 DNA 분자의 메틸화 밀도 및 크기 그래프를 나타낸다. 도 18a는 제1 석달 모체 혈장에 대한 그래프 1800이다. 도 18b는 제3 석달 모체 혈장에 대한 그래프 1850이다. 적어도 하나의 CpG 부위를 커버하는 모든 서열분석 측정치에 대한 데이터는 파란색 곡선 1805로 나타낸다. 태아-특이적 SNP 대립유전자를 또한 함유하는 측정치에 대한 데이터는 빨간색 곡선 1810으로 나타낸다. 모체-특이적 SNP 대립유전자를 또한 함유하는 측정치에 대한 데이터는 녹색 곡선 1815로 나타낸다.
태아-특이적 SNP 대립유전자를 함유한 측정치는 태아 DNA 분자에서 유래된 것으로 간주된다. 모체-특이적 SNP 대립유전자를 함유한 측정치는 모체 DNA 분자에서 유래된 것으로 간주된다. 일반적으로, 높은 메틸화 밀도를 갖는 DNA 분자의 크기가 더 길었다. 이러한 경향은 제1 및 제3 석달 모두의 태아 및 모체 DNA 분자 둘 다에 존재하였다. 태아 DNA 분자의 전체적 크기는 이전에 보고된 바와 같이 모체보다 짧았다.
도 19a는 성인 비임신 여성에 대한 서열분석 측정치의 크기 및 메틸화 밀도의 그래프 1900을 나타낸다. 성인 비임신 여성의 혈장 DNA 표본은 또한 DNA 분자의 크기 및 메틸화 상태 간에 동일한 관계를 나타내었다. 반면, 게놈 DNA 표본은 MPS 분석 전에 초음파 분쇄 단계로 단편화되었다. 그래프 1900에 나타낸 바와 같이, 혈액 세포 및 태반 조직 표본으로부터의 데이터는 동일한 경향을 드러내지 않았다. 세포의 단편화가 인공적이므로, 크기 및 밀도 간에 관계를 갖지 않을 것으로 예상하게 된다. 혈장 중 천연 단편화된 DNA 분자는 크기에 대한 의존성을 나타내며, 메틸화 밀도가 낮을수록 분자가 더 작은 단편으로 분쇄되기 쉬워진다고 추정될 수 있다.
도 19b는 모체 혈장 중 태아-특이적 및 모체-특이적 DNA 분자의 크기 분포 및 메틸화 프로필을 나타내는 그래프 1950을 나타낸다. 태아-특이적 및 모체-특이적 혈장 DNA 분자는 또한 단편 크기 및 메틸화 수준 간에 동일한 상관관계를 나타내었다. 태반 유래 및 모체 순환 무세포 DNA의 단편 길이는 모두 메틸화 수준과 함께 증가하였다. 또한, 이들의 메틸화 상태 분포가 서로 중복되지 않아, 그러한 현상이 순환 DNA 분자 원천의 원래 단편 길이와 무관하게 존재함을 제시하였다.
B. 방법
따라서, 혈장 표본의 총 메틸화 백분율을 산정하기 위해 크기 분포가 이용될 수 있다. 이어서 이러한 메틸화 측정이 임신 동안, 암 모니터링 동안 또는 치료 동안 도 18a 및 18b에 나타낸 관계에 따라 혈장 DNA 크기 분포의 연속 측정에 의해 추적될 수 있다. 메틸화 측정은 또한 관심 기관 또는 조직 유래 DNA의 증가되거나 감소된 배출을 살피기 위해 이용될 수 있다. 예를 들어, 특정 기관(예로 간)에 특이적인 DNA 메틸화 특징을 특이적으로 살피고 혈장 중 이들의 특징의 농도를 측정할 수 있다. DNA는 세포가 사멸할 때 혈장 중으로 배출되므로, 수준 증가는 그 특정 기관 또는 조직에서의 세포사 또는 손상 증가를 의미할 수 있다. 특정 기관으로부터의 수준 감소는 그 기관에서의 손상 또는 병리적 절차에 대응하기 위한 치료가 조절되고 있음을 의미할 수 있다.
도 20은 본 발명의 구현예에 따른 유기체의 생물학적 표본에서 DNA의 메틸화 수준을 산정하기 위한 방법 2000의 순서도이다. 메틸화 수준은 게놈의 특정 영역 또는 전체 게놈에 대해 산정될 수 있다. 특정 영역을 원하는 경우, 그 특정 영역에서만 유래된 DNA 단편이 이용될 수 있다.
블록 2010에서, 다양한 크기에 대응하는 DNA 단편의 양이 측정된다. 복수의 크기의 각각의 크기에 대해, 그 크기에 대응하는 생물학적 표본으로부터의 복수의 DNA 단편의 양이 측정될 수 있다. 예를 들어, 140염기 길이를 갖는 DNA 단편의 수가 측정될 수 있다. 그 양은 히스토그램으로 저장될 수 있다. 하나의 구현예에서, 상기 생물학적 표본으로부터의 복수의 핵산의 각각의 크기가 측정되고, 이는 개별 기준으로(예로 전체 분자 또는 분자 말단만의 단일 분자 서열분석에 의해) 또는 그룹 기준으로(예로 전기영동을 통해) 수행될 수 있다. 크기는 범위에 대응할 수 있다. 따라서 양은 특정 범위 내의 크기를 갖는 DNA 단편에 대한 것일 수 있다. 페어-엔드 서열분석이 수행되는 경우, 특정 영역에 대한 DNA 단편(페어 형성 서열 리드로 결정됨) 맵핑(정렬)이 영역의 메틸화 수준을 결정하기 위해 이용될 수 있다.
블록 2020에서, 제1 파라미터의 제1값은 여러 크기의 DNA 단편의 양에 기반하여 계산된다. 하나의 측면에서, 제1 파라미터는 생물학적 표본 중 DNA 단편의 크기 프로필의 통계적 측정치(예로, 히스토그램)를 제공한다. 파라미터는 이것이 복수의 DNA 단편의 크기로부터 결정되므로, 크기 파라미터로 불릴 수 있다.
제1 파라미터는 다양한 형태일 수 있다. 하나의 파라미터는 전체 DNA 단편에 대한 또는 다른 크기 또는 범위의 DNA 단편에 대한 특정 크기 또는 크기 범위의 DNA 단편의 백분율이다. 이러한 파라미터는 단편의 총 수로 나누어지는 특정 크기의 DNA 단편의 수이며, 이는 히스토그램(특정 크기 단편의 절대 또는 상대 카운트를 제공하는 임의의 데이터 구조)에서 수득될 수 있다. 다른 예로서, 파라미터는 다른 크기 또는 범위의 단편의 수로 나누어지는 특정 크기의 또는 특정 범위 내의 단편의 수일 수 있다. 구분은 상이한 수의 DNA 단편이 상이한 표본에 대해 분석되는 것을 설명하기 위한 정규화로 작용할 수 있다. 정규화는 각각의 표본에 대해 동일한 수의 DNA 단편으로 분석하여 달성될 수 있고, 이는 분석되는 단편의 총 수로 나누는 것과 동일한 결과를 효과적으로 제공한다. 파라미터 및 크기 분석에 대한 추가 예는 모든 목적에 대해 참조로 도입된 U.S. 특허 출원 13/789,553에서 확인할 수 있다.
블록 2030에서, 제1 크기값은 기준 크기값과 비교된다. 기준 크기값은 기준 표본의 DNA 단편에서 계산될 수 있다. 기준 크기값을 결정하기 위해, 메틸화 프로필이 기준 표본뿐만 아니라 제1 크기 파라미터값에 대해 계산되고 정량될 수 있다. 따라서 제1 크기값이 기준 크기값과 비교되는 경우, 메틸화 수준이 결정될 수 있다.
블록 2040에서, 메틸화 수준이 비교에 기반하여 산정된다. 하나의 구현예에서, 제1 파라미터의 제1값이 기준 크기값 초과 또는 미만인지를 결정하고, 이에 따라 대응 표본의 메틸화 수준이 기준 크기값에 대한 메틸화 수준의 초과 또는 미만인지를 결정할 수 있다. 다른 구현예에서, 비교는 제1값을 검정 함수로 입력하여 달성된다. 검정 함수는 제1값에 대응하는 곡선 상의 지점을 확인하여 제1값을 검정값(기준 크기값 세트)과 효과적으로 비교할 수 있다. 이어서 산정된 메틸화 수준이 검정 함수의 출력값으로 제공된다.
따라서 크기 파라미터를 메틸화 수준에 대해 검정할 수 있다. 예를 들어, 메틸화 수준이 측정되고 그 표본에 대한 특정 크기의 파라미터와 연관될 수 있다. 이어서 다양한 표본으로부터의 데이터 지점이 검정 함수에 맞춤화될 수 있다. 하나의 시행에서, 상이한 검정 함수가 상이한 DNA 서브세트에 대해 이용될 수 있다. 따라서 DNA의 특정 서브세트에 대한 메틸화 및 크기 간 관계에 대한 이전 지식에 기반한 일부 검정 형태가 존재할 수 있다. 예를 들어, 태아 및 모체 DNA에 대한 검정이 상이할 수 있다.
위에 나타낸 바와 같이, 태반은 모체 혈액에 비해 더 저메틸화되어 있고, 이에 따라 태아 DNA는 더 낮은 메틸화로 인해 더 작다. 따라서 표본 단편의 평균 크기(또는 다른 통계값)를 이용하여 메틸화 밀도를 산정할 수 있다. 단편 크기는 잠재적으로는 기술적으로 더 복잡한 메틸화-인식 서열분석보다는 페어-엔드 서열분석을 통해 측정될 수 있으므로, 상기 접근은 임상적으로 이용되는 경우 잠재적으로 비용 효과적일 것이다. 상기 접근은 임신 진행 또는 임신 연관 장애, 예컨대 자간전증, 조산 및 태아 장애(예컨대 염색체 또는 유전적 비정상성 또는 자궁내 성장 지연으로 야기되는 것들)에 연관된 메틸화 변화의 모니터링을 위해 이용될 수 있다.
다른 구현예에서, 상기 접근은 암의 검출 및 모니터링을 위해 이용될 수 있다. 예를 들어, 성공적인 암 치료를 이용하면, 상기 크기 기반 접근을 이용하여 측정되는 혈장 또는 다른 체액 중 메틸화 프로필이 암이 없는 건강한 개인의 프로필로 변할 것이다. 반대로, 암이 진행 중인 경우, 혈장 또는 다른 체액 중의 메틸화 프로필은 암이 없는 건강한 개인의 프로필로부터 일탈할 것이다.
요약하면, 저메틸화 분자가 혈장 중의 고메틸화 분자에 비해 더 짧았다. 동일 경향이 태아 및 모체 DNA 분자 모두에서 관찰되었다. DNA 메틸화는 뉴클레오솜 충전에 영향을 미치는 것으로 알려져 있으므로, 본 발명자들의 데이터는 아마도 저메틸화 DNA 분자가 히스톤으로 덜 밀집되게 충전되며 이에 따라 효소 분해에 더 민감하였음을 제시한다. 반면, 도 18a 및 18b에 제시된 데이터는 또한 태아 DNA가 모체 측정치에 비해 훨씬 더 저메틸화됨에도 불구하고, 태아 및 모체 DNA의 크기 분포는 서로 완벽히 구분되지 않음을 나타내었다. 도 19b에서, 동일한 크기 분류에 대해서도 태아- 및 모체-특이적 측정치의 메틸화 수준이 서로 상이함을 알 수 있다. 이러한 관찰은 태아 DNA의 저메틸화 상태가 모체 DNA에 대비한 그 상대적 단축성을 설명하는 유일한 요인이 아님을 제시한다.
VII. 유전자 유전자좌의 각인 상태
동일한 유전형을 그러나 모체 혈장 중 모체와 상이한 후생적 특징을 공유하는 태아-유래 DNA 분자가 검출될 수 있다(LLM Poon 등, 2002 Clin Chem; 48: 35-41). 서열분석 접근이 모체 혈장 중 태아 유래 DNA 분자의 선별에 민감함을 나타내기 위해, 모체 혈장 표본 중 각인된 태아 대립유전자를 검출하기 위해 동일한 전략을 적용하였다. 두 게놈 각인 영역이 확인되었다: H19(chr11:1,977,419-1,977,821, NCBI Build36/hg18) 및 MEST(chr7:129,917,976-129,920,347, NCBI Build36/hg18). 둘 다 모체 및 태아 서열 간 차별화를 위해 정보를 제공하는 SNP를 함유한다. H19, 모체 발현 유전자의 경우, 모체는 영역 중의 SNP rs2071094(chr11:1,977,740)에 대해 동종접합성(A/A)이고 태아는 이종접합성(A/C)이었다. 모체 A 대립유전자 중 하나는 완전 메틸화되고 다른 것은 비메틸화된다. 그러나 태반에서는, A 대립유전자가 비메틸화된 반면, 부계에서 유전된 C 대립유전자는 완전 메틸화되었다. 본 발명자들은 모체 혈장 중, 태반에서 유래된 각인된 부계 대립유전자에 대응하는 C 유전형을 갖는 두 메틸화 측정치를 검출하였다.
또한 PEG1로도 알려져 있는 MEST는 부계 발현 유전자이다. 모체 및 태아는 모두 각인 유전자좌 내에서 SNP rs2301335(chr7:129,920,062)에 대해 이종접합성(A/G)이었다. 모체 혈액 중 G 대립유전자는 메틸화된 반면 A 대립유전자는 비메틸화되었다. 태반에서는 메틸화 패턴이 역전되어 모체 A 대립유전자가 메틸화되고 부계 G 대립유전자가 비메틸화되었다. 부계 유래된 세 비메틸화 G 대립유전자가 모체 혈장 중에 검출될 수 있었다. 대조적으로, 염색체 19 상의 비각인 유전자 유전자좌(chr19:6,723,621-6,724,121)인 VAV1은 조직에서뿐만 아니라 혈장 DNA 표본에서 어떠한 대립유전자 메틸화 패턴도 나타내지 않았다.
따라서 메틸화 상태를 이용하여 어느 DNA 단편이 태아에서 유래되는지를 결정할 수 있다. 예를 들어, 모체 혈장에서 A 대립유전자만을 검출하는 것은 모체가 GA 이종접합성인 경우 태아 마커로 이용될 수 없다. 그러나 혈장에서 A 분자의 메틸화 상태를 구별하면, 메틸화 A 분자는 태아-특이적인 반면 비메틸화 A-분자는 모체-특이적이거나, 또는 반대이다.
다음으로 태반 조직에서 게놈 각인을 나타내는 것으로 보고된 유전자좌에 초점을 맞추었다. Woodfine 등(2011 Epigenetics Chromatin; 4: 1)이 보고한 유전자좌 목록에 기반하여, 각인 조절 영역 내에 SNP를 함유한 것들에 대해 추가 정렬하였다. 네 유전자좌가 요건을 충족하였고, 이들은 H19, KCNQ10T1, MEST 및 NESP였다.
H19 및 KCNQ10T1에 대한 모체 혈액 세포 표본의 측정치에 있어서, 모체 측정치는 SNP에 대해 동종접합성이었고, 이들은 메틸화 및 비메틸화 측정치의 비율이 대략 같았다. CVS 및 만기 태반 조직 표본은 태아가 두 유전자좌에 대해 이종접합성이었으며 각각의 대립 유전자가 배타적으로 메틸화 또는 비메틸화되었음을, 즉 단일대립유전자 메틸화였음을 드러내었다. 모체 혈장 표본에서, 부계 유전된 태아 DNA 분자가 두 유전자좌 모두에 대해 검출되었다. H19에 있어서, 부계 유전된 분자는 태아-특이적 대립유전자를 함유하고 메틸화된 서열분석 측정치로 나타났다. KCNQ10T1에 있어서, 부계 유전된 분자는 태아-특이적 대립유전자를 함유하고 비메틸화된 서열분석 측정치로 나타났다.
반면, 모체는 MEST 및 NESP 모두에 대해 이종접합성이었다. MEST에 있어서, 모체 및 태아는 모두 SNP에 대해 GA 이종접합체였다. 그러나 모체 혈액 세포 및 태반 조직에서 왓슨 가닥에 대한 데이터에서 명백하듯이, SNP에 인접한 CpG에 대한 메틸화 상태는 모체 및 태아에서 반대였다. A-대립유전자는 모체의 DNA에서 비메틸화된 반면 태아의 DNA에서는 메틸화되었다. MEST에 있어서, 모체 대립유전자는 메틸화되었다. 따라서 태아가 그 모체로부터 A-대립유전자를 유전받았고(CVS 중 메틸화됨), 모체는 그 아버지로부터 A-대립유전자를 유전받았음(모체 혈액 세포 중 비메틸화됨)을 찾아낼 수 있었다. 흥미롭게도 모체 혈장 표본에서, 모체의 각각의 두 대립유전자 및 태아의 각각의 두 대립유전자를 포함하는 모든 네 분자 그룹이 쉽게 구별될 수 있었다. 따라서 각인 유전자좌에서 유전형 정보와 메틸화 상태를 조합하여, 배경 모체 DNA 분자로부터 모체에서 유전된 태아 DNA 분자를 쉽게 구별할 수 있었다(LLM Poon 등, 2002 Clin Chem; 48: 35-41).
상기 접근을 이용하여 단부모 이염색체를 검출할 수 있었다. 예를 들어, 상기 태아의 아버지가 G-대립유전자에 대해 동종접합성으로 알려진 경우, 모체 혈장 중 비메틸화 G-대립유전자의 검출 실패는 부계 대립유전자의 기여 부재를 나타낸다. 또한 이러한 상황 하에서, 메틸화 G-대립유전자 및 메틸화 A-대립유전자가 모두 상기 임산부의 혈장에서 검출되었다면, 이는 태아가 모체로부터 이종이염색체를 가짐을, 즉 아버지로부터의 간섭 없이 모체로부터 두 상이한 대립유전자가 유전되었음을 제시할 것이다. 대안적으로 메틸화 A-대립유전자(모체에서 유전된 태아 대립유전자) 및 비메틸화 A-대립유전자(모체 할아버지에서 유전된 모체 대립유전자)가 모두 비메틸화 G-대립유전자(태아가 유전받았어야 하는 부계 대립유전자) 없이 모체 혈장에서 검출되는 경우, 이는 태아가 모체로부터 동종이염색체를 가짐을, 즉 아버지로부터의 간섭 없이 모체로부터 두 동일한 대립유전자가 유전되었음을 제시할 것이다.
NESP에 있어서, 모체는 SNP에서 GA 이종접합체인 반면 태아는 G-대립유전자에 대해 동종접합성이었다. 부계 대립유전자는 NESP에 대해 메틸화되었다. 모체 혈장 표본에서, 메틸화된, 부계 유전된 태아 G-대립유전자는 비메틸화된 배경 모체 G-대립유전자로부터 쉽게 구별될 수 있었다.
VIII. 암/공여자
일부 구현예가 순환 혈청/혈청 DNA의 메틸화 분석을 이용하여 암의 검출, 스크리닝, 모니터링(예로 치료에 대한 재발, 완화, 또는 반응(예로 존재 또는 부재)), 단계 설정, 분류(예로 가장 적절한 치료 양식의 선택을 보조하기 위해) 및 예진을 위해 이용될 수 있다.
암 DNA는 이상 DNA 메틸화를 나타내는 것으로 알려져 있다(JG Herman 등, 2003 N Engl J Med; 349: 2042-2054). 예를 들어, 유전자, 예로 종양 억제인자 유전자의 CpG 섬 프로모터는 고메틸화된 반면, 유전자 본체에서의 CpG 부위는 비암세포에 비해 저메틸화되어 있다. 암 세포의 메틸화 프로필이 본원에 기재된 방법을 이용하여 종양 유래 혈장 DNA의 분자의 메틸화 프로필로 반영될 수 있는 한, 혈장 중의 전체적 메틸화 프로필은 암이 있는 개인을 암이 없는 건강한 개인과 비교 시 또는 암이 치유된 개인과 비교 시 상이할 것으로 예측된다. 메틸화 프로필의 차이 유형은 게놈의 메틸화 밀도 및/또는 게놈 절편의 메틸화 밀도에서의 정량적 차이의 관점일 수 있다. 예를 들어 암 조직 DNA의 일반적인 저메틸화 성질로 인해(Gama-Sosa MA 등, 1983 Nucleic Acids Res; 11: 6883-6894), 혈장 메틸롬 또는 게놈 절편에서의 메틸화 밀도 감소가 암 환자의 혈장에서 관찰될 것이다.
메틸화 프로필의 정량적 변화는 또한 혈장 메틸롬 데이터에 걸쳐 반영될 수 있다. 예를 들어, 암 세포에서만 고메틸화된 유전자에서 유래되는 혈장 DNA 분자는 동일한 유전자에서 유래되지만 건강한 대조군 표본 중의 혈장 DNA 분자에 비해 암 환자의 혈장에서 고메틸화를 나타낼 것이다. 이상 메틸화는 대부분의 암에서 일어나므로, 본원에 기재된 방법은 이상 메틸화를 갖는 모든 형태의 악성물, 예를 들어 폐, 유방, 결직장, 전립성, 코인두, 위, 정소, 피부, 신경계, 뼈, 난소, 간, 혈액 조직, 췌장, 자궁, 신장, 방광, 림프 조직 등에서를 비제한적으로 포함하는 악성물의 검출에 적용될 수 있다. 악성물은 다양한 조직 하위유형, 예를 들어 암종, 선암종, 육종, 섬유선암종, 신경내분비 및 미분화된 것 등일 수 있다.
반면, 본 발명자들은 DNA 분자의 크기에 추가 효과를 가질 종양 연관된 이상 저메틸화를 갖는 유전자좌 유래의 DNA 분자에서 종양 유래 DNA 분자의 전체적으로 짧은 크기 프로필이 강조되므로, 종양 유래 DNA 분자가 배경 비-종양 유래 DNA 분자와 구별될 수 있는 것으로 예상한다. 또한, 종양 유래 혈장 DNA 분자는 단일 뉴클레오티드 변이체, 복제수 획득 및 손실, 전위, 역전, 이상 고- 또는 저-메틸화 및 크기 프로필 확인을 비제한적으로 포함하는 종양 DNA와 연관된 여러 특징적 특성을 이용하여 배경 비-종양 유래 혈장 DNA 분자와 구별될 수 있다. 이들 변화가 모두 독립적으로 일어날 수 있으므로, 이들 특성의 조합 이용은 혈장 중 암 DNA의 민감하고 특이적인 검출을 위해 추가적인 장점을 제공할 수 있다.
A. 크기 및 암
혈장 중 종양-유래 DNA 분자의 크기는 또한 단일 뉴클레오솜 단위체의 크기와 유사하고, 암 환자의 혈장 중에 공존하는 배경 비-종양-유래 DNA 분자보다 짧다. 크기 파라미터는 모든 목적을 위해 참조로 도입된, U.S. 특허 출원 13/789,553에 기재된 바와 같이 암에 연관된 것으로 나타났다.
혈장 중 태아-유래 및 모체-유래 DNA는 모두 분자의 크기 및 메틸화 상태 간의 관계를 나타내었으므로, 종양-유래 DNA 분자는 동일한 경향을 나타낼 것으로 예상된다. 예를 들어, 저메틸화 분자는 암에 대해 스크리닝되는 대상자 또는 암 환자의 혈장 중에서 고메틸화 분자에 비해 더 짧을 것이다.
B. 암 환자에서 상이한 조직의 메틸화 밀도
본 예에서, 간세포암종(HCC) 환자의 혈장 및 조직 표본을 분석하였다. 혈액 표본을 종양의 수술적 절제 이전 및 이후 1주에 HCC 환자에서 수집하였다. 혈액 표본의 원심분리 후 혈장 및 버피 코트를 수확하였다. 절제된 종양 및 인접한 비-종양 간 조직을 수집하였다. 혈장 및 조직 표본에서 추출된 DNA 표본을 사전 바이설파이트 처리와 함께 또는 이것이 없이 대량 병렬 서열분석을 이용하여 분석하였다. 암이 없는 4명의 건강한 개인의 혈장 DNA도 대조군으로 분석하였다. DNA 표본의 바이설파이트 처리는 비메틸화 시토신 잔기를 우라실로 전환할 것이다. 하류 폴리머라아제 연쇄 반응 및 서열분석에서, 이들 우라실 잔기는 티미딘으로 작용할 것이다. 반면, 바이설파이트 처리는 메틸화 시토신 잔기를 우라실로 전환하지 않을 것이다. 대량 병렬 서열분석 후, 서열분석 측정치를 Methy-Pipe(P Jiang, 등, Methy-Pipe: 전체 게놈 메틸롬 분석을 위한 통합 바이오인포마틱스 데이터 분석 파이프라인, 논문은 2010. 12. 18~21, IEEE International Conference on Bioinformatics and Biomedicine Workshops, Hong Kong에서 발표됨)로 분석하여 모든 CG 디뉴클레오티드 위치, 즉 CpG 부위에서 시토신 잔기의 메틸화 상태를 결정하였다.
도 21a는 HCC 환자의 수술 전 혈장 및 조직 표본의 메틸화 밀도를 나타내는 표 2100이다. 관심 영역(예로 CpG 부위, 프로모터, 또는 반복 영역 등)에 대한 CpG 메틸화 밀도는 게놈 CpG 디뉴클레오티드를 커버하는 측정치의 총 수에 걸쳐 CpG 메틸화를 나타내는 측정치의 비율을 나타낸다. 버피 코트 및 비종양 간 조직의 메틸화 밀도는 유사하다. 모든 상염색체에서의 데이터에 기반한 종양 조직의 전체적 메틸화 밀도는 버피 코트 및 비종양 간 조직에 대한 것보다 25% 더 낮았다. 저메틸화는 각각의 개별 염색체에 걸쳐 일치하였다. 혈장의 메틸화 밀도는 비악성 조직 및 암 조직의 값 사이에 있었다. 상기 관찰은 암 및 비암 조직이 모두 암 환자의 순환 DNA에 기여할 것이라는 점과 일치한다. 조혈계는 활성 악성 상태가 없는 개인에서 순환 DNA의 주요 원천임이 나타났다(YYN Lui, 등, 2002 Clin Chem; 48: 421-7). 따라서 4명의 건강한 대조군에서 수득한 혈장 표본을 또한 분석하였다. 표본 별로 획득한 서열 리드의 수 및 서열분석 깊이를 도 21b의 표 2150에 나타낸다.
도 22는 건강한 대조군의 혈장 표본 중 71.2% 내지 72.5% 범위의 상염색체에서의 메틸화 밀도를 나타내는 표 220이다. 이들 데이터는 종양 DNA 원천이 없는 개인에서 수득한 혈장 표본 중 DNA 메틸화의 예측 수준을 나타내었다. 암 환자에서, 종양-조직은 또한 DNA를 순환 내로 배출할 것이다(KCA Chan 등, 2013 Clin Chem; 59: 211-224); RJ Leary 등, 2012 Sci Transl Med; 4: 162ra154). HCC 종양의 저메틸화 성질로 인해, 환자의 수술 전 혈장 중 종양- 및 비-종양-유래 DNA 모두의 존재가 건강한 대조군의 혈장 수준과 비교 시 메틸화 밀도 감소를 일으켰다. 사실 상, 수술 전 혈장 표본의 메틸화 밀도는 종양 조직 및 건강한 대조군의 혈장의 메틸화 밀도 사이에 있었다. 그 이유는 암 환자의 혈장 DNA의 메틸화 수준이 순환에서 종양-유래 DNA의 분획 농도 및 종양 조직의 이상 메틸화, 이 경우에는 저메틸화 정도에 영향을 받을 것이기 때문이다. 종양 조직의 더 낮은 메틸화 밀도 및 순환 중 종양-유래 DNA의 더 높은 분획 농도는 암 환자에서 혈장 DNA의 더 낮은 메틸화 밀도로 이어질 것이다. 대부분의 종양은 전반적 저메틸화를 나타내는 것으로 보고되었다(JG Herman 등, 2003 N Engl J Med; 349: 2042-2054; MA Gama-Sosa 등, 1983 Nucleic Acids Res; 11: 6883-6894). 따라서 HCC 표본에서 나타난 본 관찰도 다른 유형의 종양에도 적용 가능할 것이다.
하나의 구현예에서, 종양 조직의 메틸화 수준을 아는 경우, 혈장 DNA의 메틸화 밀도를 이용하여 혈장/혈청 표본 중 종양-유래 DNA의 분획 농도를 결정할 수 있다. 종양 조직의 메틸화 수준, 예로 메틸화 밀도는 종양 표본을 이용할 수 있거나 종양 생검을 이용할 수 있는 경우 수득될 수 있다. 다른 구현예에서, 종양 조직의 메틸화 수준에 대한 정보는 유사한 유형의 종양 그룹에서 메틸화 수준 조사로 수득될 수 있고, 상기 정보(예로 평균 수준 또는 중앙값 수준)는 본 발명에 기재된 기술을 이용하여 분석될 환자에게 적용된다. 종양 조직의 메틸화 수준은 환자의 종양 조직 분석에 의해 결정되거나, 동일하거나 유사한 암 유형을 갖는 다른 환자의 종양 조직 분석에서 도출될 수 있다. 종양 조직의 메틸화는 비제한적으로 대량 병렬 서열분석, 단일 분자 서열분석, 마이크로어레이(예로 올리고뉴클레오티드 어레이), 또는 질량 분광측정(예컨대 Epityper, Sequenom, Inc., 분석)을 포함하는 다양한 메틸화 인식 플랫폼을 이용하여 결정될 수 있다. 일부 구현예에서, 이러한 분석에는 비제한적으로 시토신 면역침전 및 메틸화 인식 제한효소 분해를 포함하는 DNA 분자의 메틸화 상태에 민감한 절차가 선행될 수 있다. 종양의 메틸화 수준을 아는 경우, 암 환자의 혈장 중 종양 DNA의 분획 농도가 혈장 메틸롬 분석 후 계산될 수 있다.
혈장 메틸화 수준, P와 분획 종양 DNA 농도, f, 및 종양 조직 메틸화 수준, TUM 간 관계는 다음과 같이 기재될 수 있다: 식 중, BKG는 혈액 세포 유래 혈장 및 다른 내부 기관 중 배경 DNA 메틸화 수준이다. 예를 들어, 상기 HCC 환자에서 수득한 종양 생검 조직 중 모든 상염색체의 전체적 메틸화 밀도, 즉 이 경우 TUM값은 42.9%로 나타났다. 4명의 건강한 대조군으로부터의 혈장 표본의 평균 메틸화 밀도, 즉 이 경우 BKG값은 71.6%였다. 수술 전 혈장에 대한 혈장 메틸화 밀도는 59.7%였다. 이들 값을 이용해서, f 41.5%로 산정된다.
다른 구현예에서, 종양 조직의 메틸화 수준은 혈장 표본에서의 종양-유래 DNA의 분획 농도를 아는 경우, 혈장 메틸롬 데이터에 기반하여 비침습적으로 산정될 수 있다. 혈장 표본 중 종양-유래 DNA의 분획 농도는 다른 유전적 분석, 예를 들어 전술된 바와 같이 대립유전자 상실에 대한 게놈에 걸친 분석(GAAL) 및 단일 뉴클레오티드 돌연변이 분석(US 특허 출원 13/308,473; KCA Chan 등, 2013 Clin Chem; 59: 211-24)에 의해 결정될 수 있다. 계산은 본 구현예에서 f값이 알려져 있고 TUM값을 알 수 없다는 것을 제외하고는 상술된 바와 동일한 관계에 기반한다. 추정은 모체 혈장 데이터에서 태반 조직 메틸화 수준 결정 맥락에 대해 관찰되는 데이터와 유사하게, 전체 게놈에 대해 또는 게놈의 일부에 대해 수행될 수 있다.
다른 구현예에서, 메틸화 밀도에서의 bin간 변동 또는 프로필을 이용하여 암이 있는 및 암이 없는 대상자를 구별할 수 있다. 메틸화 분석의 해상은 게놈을 특정 크기, 예로 1Mb의 bin으로 나누어 추가 증가될 수 있다. 이러한 구현예에서, 각각의 1Mb bin의 메틸화 밀도가 수집된 표본, 예로 버피 코트, 절제 HCC 조직, 종양에 인접한 비종양 간 조직 및 종양 절제 이전 및 이후에 수집된 혈장에 대해 계산되었다. 다른 구현예에서, bin 크기가 일정하게 유지될 필요는 없다. 하나의 시행에서, CpG 부위의 수는 각각의 bin 내에서 일정하게 유지되는 반면 bin 자체는 크기가 변할 수 있다.
도 23a 및 23b는 HCC 환자의 버피 코트, 종양 조직, 비종양 간 조직, 수술 전 혈장 및 수술 후 혈장의 메틸화 밀도를 나타낸다. 도 23a는 염색체 1에 대한 결과 그래프 2300이다. 도 23b는 염색체 2에 대한 결과 그래프 2350이다.
대부분의 1Mb 윈도우에 있어서, 버피 코트 및 종양에 인접한 비종양 간 조직에 대한 메틸화 밀도는 유사한 반면 종양 조직의 밀도는 더 낮았다. 수술 전 혈장의 메틸화 밀도는 종양 및 비악성 조직의 사이에 놓인다. 종양 조직에서 조사 게놈 영역의 메틸화 밀도는 수술 전 혈장 및 분획 종양 DNA 농도의 메틸화 데이터를 이용해서 추정될 수 있다. 방법은 모든 상염색체의 메틸화 밀도값을 이용하여 전술된 바와 같이 동일하다. 기재된 종양 메틸화의 추정은 혈장 DNA의 이러한 더 높은 해상의 메틸화 데이터를 이용해서 수행될 수 있다. 다른 bin 크기, 예컨대 300kb, 500kb, 2Mb, 3Mb, 5Mb 또는 5Mb 초과도 이용될 수 있다. 하나의 구현예에서, bin 크기가 일정하게 유지될 필요는 없다. 하나의 시행에서, CpG 부위의 수는 각각의 bin 내에서 일정하게 유지되는 반면 bin 자체는 크기가 변할 수 있다.
C. 암 환자 및 건강한 개인 간 혈장 메틸화 밀도의 비교
2100에 나타낸 바와 같이, 수술 전 혈장 DNA의 메틸화 밀도는 암 환자에서 비악성 조직의 밀도보다 더 낮았다. 이는 저메틸화된 종양 조직 유래 DNA의 존재에 기인할 수 있다. 이러한 더 낮은 혈장 DNA 메틸화 밀도는 잠재적으로 암 검출 및 모니터링을 위한 바이오마커로 이용될 수 있다. 암 모니터링을 위해, 암이 진행되고 있는 경우, 혈장 중 암-유래 DNA량의 경시적 증가가 있을 것이다. 이러한 예에서, 혈장 중 순환 암-유래 DNA의 증가된 양은 게놈에 걸친 수준에서 혈장 DNA 메틸화 밀도의 추가 감소로 이어질 것이다.
반대로 암이 치료에 반응하는 경우, 혈장 중 암-유래 DNA의 양은 경시적으로 감소할 것이다. 이러한 예에서, 혈장 중, 암-유래 DNA량의 감소는 혈장 DNA 메틸화 밀도의 증가로 이어질 것이다. 예를 들어, 표피 성장 인자 수용체 돌연변이를 갖는 폐암 환자가 표적화된 치료법, 예로 티로신 키나아제 저해로 치료받은 경우, 혈장 DNA 메틸화 밀도 증가는 반응을 나타낼 것이다. 이어서 티로신 키나아제 저해에 대해 내성이 있는 종양 클론의 출현은 재발을 시사할 혈장 DNA 메틸화 밀도의 감소와 연관될 것이다.
혈장 메틸화 밀도 측정은 연속 수행될 수 있고, 이러한 측정의 변화율이 계산되고 임상적 진행 또는 완화 또는 예후를 예측하거나 연관시키기 위해 이용될 수 있다. 암 조직에서 고메틸화되지만 정상 조직에서 저메틸화된 선택된 게놈 유전자좌, 예로 여러 종양 억제인자 유전자의 프로모터 영역에 있어서, 암 진행 및 치료에 대해 바람직한 반응 간의 관계는 전술된 패턴에 반대일 것이다.
상기 접근의 타당성을 나타내기 위해, 종양의 수술적 제거 이전 및 이후 암 환자에서 수집된 혈장 표본의 DNA 메틸화 밀도를 4명의 건강한 대조군 대상자에서 수득한 혈장 DNA와 비교하였다.
표 2200은 각각의 상염색체의 DNA 메틸화 밀도 및 암 환자의 수술 전 및 수술 후 혈장 표본의 모든 상염색체 및 4명의 건강한 대조군 대상자에서의 조합값을 나타낸다. 모든 염색체에 있어서, 수술 전 혈장 DNA 표본의 메틸화 밀도는 수술 후 표본 및 4명의 건강한 대상자로부터의 혈장 표본에서보다 낮았다. 수술 전 및 수술 후 표본 간 혈장 DNA 메틸화 밀도의 차이는 수술 전 혈장 표본에서의 더 낮은 메틸화 밀도가 HCC 종양 유래 DNA 존재에 기인하였음을 지지하는 증거를 제공하였다.
수술 후 혈장 표본 중 DNA 메틸화 밀도의 건강한 대조군의 혈장 표본과 유사한 수준으로의 역전은 다수의 종양-유래 DNA가 원천, 즉 종양의 수술적 제거로 인해 사라졌음을 제시하였다. 이들 데이터는 큰 게놈 영역, 예컨대 모든 상염색체 또는 개별 염색체에서 이용 가능한 데이터를 이용해서 결정되는 수술 전 혈장의 메틸화 밀도가 건강한 대조군에서보다 낮은 메틸화 수준을 가져서 암을 갖는 평가 케이스의 확인, 즉 진단 또는 스크리닝을 허용함을 제시한다.
수술 전 혈장의 데이터는 또한 수술 후 혈장에서보다 훨씬 더 낮은 메틸화 수준을 나타내어 혈장 메틸화 수준이 또한 종양 부하의 모니터링에 이용될 수 있고, 이에 따라 환자에서 암의 진행을 예진하고 모니터링할 수 있음을 제시한다. 기준값은 건강한 대조군 또는 암에 대한 위험이 있지만 현재 암이 없는 개인의 혈장에서 결정될 수 있다. HCC에 대한 위험이 있는 개인에는 만성 B형 간염 또는 만성 C형 간염이 감염된 환자, 혈색소증 환자 및 간 경화 환자가 포함된다.
기준값에 기반한 정의된 컷오프를 넘어서는, 예를 들어 그보다 낮은 혈장 메틸화 밀도값을 이용해서 비임신 개인의 혈장이 종양 DNA를 갖는지의 여부를 결정할 수 있다. 저메틸화 순환 종양 DNA의 존재를 검출하기 위해, 컷오프는 대조군 모집단값의 제5 또는 제1 퍼센타일보다 낮은 것으로, 또는 표준 편차의 수, 예를 들어 대조군의 평균 메틸화 밀도값의 2 또는 3 표준 편차(SD) 미만에 기반하여, 또는 다수의 중앙값(MoM) 결정에 기반하여 정의될 수 있다. 고메틸화 종양 DNA에 있어서, 컷오프는 대조군 모집단값의 제95 또는 제99 퍼센타일보다 높은 것으로, 또는 표준 편차의 수, 예를 들어 대조군의 평균 메틸화 밀도값의 2 또는 3 표준 편차(SD) 초과에 기반하여, 또는 다수의 중앙값(MoM) 결정에 기반하여 정의될 수 있다. 하나의 구현예에서, 대조군 모집단은 평가 대상자에 대해 연령 매치된다. 연령 매칭이 정확할 필요는 없고, 연령 구간(예로 35세 평가 대상자에 대해 30 내지 40세)로 수행될 수 있다.
다음으로 암 환자 및 4명의 대조군 대상자의 혈장 표본 간 1Mb bin의 메틸화 밀도를 비교하였다. 예시적 목적으로 염색체 1의 결과를 나타낸다.
도 24a는 HCC 환자의 수술 전 혈장의 메틸화 밀도를 나타내는 그래프 2400이다. 도 24b는 HCC 환자의 수술 후 혈장의 메틸화 밀도를 나타내는 그래프 2450이다. 파란색 점은 대조군 대상자의 결과를 나타내고, 빨간색 점은 HCC 환자의 혈장 표본의 결과를 나타낸다.
도 24a에 나타낸 바와 같이, HCC 환자의 수술 전 혈장의 메틸화 밀도는 대부분의 bin에 대해 대조군 대상자에서보다 낮았다. 유사한 패턴이 다른 염색체에 대해 관찰되었다. 도 24b에 나타낸 바와 같이, HCC 환자의 수술 후 혈장의 메틸화 밀도는 대부분의 bin에 대해 대조군 대상자와 유사하였다. 유사한 패턴이 다른 염색체에 대해 관찰되었다.
평가 대상자가 암을 갖는지를 결정하기 위해, 평가 대상자의 결과가 기준 군의 값과 비교될 것이다. 하나의 구현예에서, 기준 군은 여러 건강한 대상자를 포함할 수 있다. 다른 구현예에서, 기준 군은 비-악성 상태, 예를 들어, 만성 B형 간염 감염 또는 경화가 있는 대상자를 포함할 수 있다. 이어서 평가 대상자 및 기준 군 간 메틸화 밀도 차이가 정량될 수 있다.
하나의 구현예에서, 기준 범위는 대조군의 값에서 유도될 수 있다. 이어서 기준 군의 상한 또는 하한으로부터 평가 대상자 결과의 일탈을 이용하여 대상자가 종양을 갖는지를 결정할 수 있다. 상기 양은 혈장 중 종양-유래 DNA의 분획 농도 및 악성 및 비-악성 조직 간 메틸화 수준 차이에 의해 영향을 받을 것이다. 혈장 중 더 높은 분획 농도의 종양-유래 DNA는 평가 혈장 표본 및 대조군 간에 더 큰 메틸화 밀도 차이로 이어질 것이다. 악성 및 비-악성 조직의 더 큰 정도의 메틸화 수준 차이도 평가 혈장 표본 및 대조군 간의 더 큰 메틸화 밀도 차이와 연관된다. 다른 구현예에서, 상이한 기준 군이 상이한 연령 범위의 평가 대상자에 대해 선택된다.
다른 구현예에서, 4명의 대조군 대상자의 메틸화 밀도의 평균 및 SD가 각각의 1Mb bin에 대해 계산되었다. 이어서 대응 bin에 대해, HCC 환자의 메틸화 밀도 및 대조군 대상자의 평균값 간 차이가 계산되었다. 하나의 구현예에서, 상기 차이가 대응 bin의 SD로 나뉘어 z-스코어를 결정하였다. 다시 말하면, z-스코어는 대조군 대상자의 평균으로부터 SD의 수로 표현되는 평가 및 대조군 혈장 표본 간의 메틸화 밀도 차이를 나타낸다. 3을 초과하는 z-스코어의 bin은 HCC 환자의 혈장 DNA가 대조군 대상자에 비해 그 bin에서 3SD를 초과해서 더 고메틸화됨을 시사하는 반면, -3 미만의 z-스코어의 bin은 HCC 환자의 혈장 DNA가 대조군 대상자에 비해 그 bin에서 3SD를 초과해서 더 저메틸화됨을 시사한다.
도 25a 및 25b는 염색체 1에 대한 기준으로 4명의 건강한 대조군 대상자의 혈장 메틸롬 데이터를 이용해서 HCC 환자의 수술 전(그래프 2500) 및 수술 후(그래프 2550) 혈장 표본에 대한 혈장 DNA 메틸화 밀도의 z-스코어를 나타낸다. 각각의 점은 하나의 1Mb bin의 결과를 나타낸다. 검은 점은 -3 내지 3의 z-스코어를 갖는 bin을 나타낸다. 빨간색 점은 -3 미만의 z-스코어를 갖는 bin을 나타낸다.
도 26a는 수술 전 및 수술 후 혈장에 대한 z-스코어에 대한 데이터를 나타내는 표 2600이다. 수술 전 혈장 표본에서 염색체 1의 대부분의 bin(80.9%)은 -3 미만의 z-스코어를 가져서 HCC 환자의 수술 전 혈장 DNA가 대조군 대상자에 비해 유의미하게 더 저메틸화됨을 시사하였다. 반대로 빨간색 점의 수는 수술 후 혈장 표본에서 실질적으로 감소되어(염색체 1 상의 bin의 8.3%) 대부분의 종양 DNA가 순환 종양 DNA 원천의 수술적 절제로 인해 순환에서 제거되었음을 제시하였다.
도 26b는 모든 상염색체에서 분석된 1Mb bin에 대한 기준으로 4명의 건강한 대조군 대상자를 이용해서 HCC 환자의 수술 전 및 수술 후 혈장 표본에 대한 혈장 DNA 메틸화 밀도의 z-스코어를 나타내는 Circos 그래프 2620이다. 최외부 고리는 인간 상염색체의 핵형도를 나타낸다. 가운데 고리는 수술 전 혈장 표본에 대한 데이터를 나타낸다. 최내부 고리는 수술 후 혈장 표본에 대한 데이터를 나타낸다. 각각의 점은 하나의 1Mb bin의 결과를 나타낸다. 검은 점은 -3 내지 3의 z-스코어를 갖는 bin을 나타낸다. 빨간색 점은 -3 미만의 z-스코어를 갖는 bin을 나타낸다. 녹색 점은 3 초과의 z-스코어를 갖는 bin을 나타낸다.
도 26c는 HCC 환자의 수술 전 및 수술 후 혈장 표본 모두에서 전체 게놈에 대한 1Mb bin의 z-스코어 분포를 나타내는 표 2640이다. 결과는 HCC 환자의 수술 전 혈장 DNA가 전체 게놈에서 대부분의 영역(1Mb bin의 85.2%)에 대해 대조군에 비해 더 저메틸화되었음을 시사한다. 반대로, 수술 후 혈장 표본에서 대부분의 영역(1Mb bin의 93.5%)은 대조군에 비해 유의미한 고메틸화 또는 저메틸화를 나타내지 않았다. 이들 데이터는 상기 HCC에 대해서 성질 상 주로 저메틸화된 다수의 종양 DNA가 더 이상 수술 후 혈장 표본에 존재하지 않았음을 시사한다.
하나의 구현예에서, -3 미만의 z-스코어를 갖는 bin의 수, 백분율 또는 비율을 이용하여 암이 존재하는지를 나타낼 수 있다. 예를 들어 표 2640에 나타낸 바와 같이, 분석된 2734개의 bin 중 2330개(85.2%)가 수술 전 혈장에서 -3 미만의 z-스코어를 나타낸 반면, 분석된 2734개의 bins 중 171개(6.3%)만이 수술 후 혈장에서 -3 미만의 z-스코어를 나타냈다. 데이터는 수술 전 혈장에서의 종양 DNA 부하가 수술 후 혈장에서보다 훨씬 더 높음을 시사하였다.
bin 수의 컷오프값은 통계적 방법을 이용해서 결정될 수 있다. 예를 들어, 대략 0.15%의 bin이 정규 분포에 기반하여 -3 미만의 z-스코어를 가질 것으로 예상될 것이다. 따라서 bin의 컷오프 수는 분석되는 bin의 총 수의 0.15%일 수 있다. 다시 말하면, 비임신 개인의 혈장 표본이 -3 미만의 z-스코어를 갖는 0.15% 초과의 bin을 나타내는 경우, 혈장 중 저메틸화 DNA의 원천, 즉 암이 존재한다. 예를 들어, 상기 예에서 분석한 2734개의 1Mb bin의 0.15%는 약 4개 bin이다. 상기 값을 컷오프로 이용하면, 그 양이 수술 후 혈장 표본에 비해 수술 전 혈장 표본에서 훨씬 더 크지만, 수술 전 및 수술 후 혈장 표본은 모두 저메틸화 종양-유래 DNA를 함유하였다. 4명의 건강한 대조군 대상자에 있어서, 어느 bin도 유의미한 고메틸화 또는 저메틸화를 나타내지 않았다. 다른 컷오프값(예로, 1.1 %)이 이용될 수 있고, 이용되는 분석의 요건에 따라 변할 수 있다. 다른 예로서, 컷오프 백분율은 통계적 분포뿐만 아니라 요구되는 민감성 및 허용 가능한 특이성에 기반하여 변할 수 있다.
다른 구현예에서, 컷오프 수는 암 환자 및 암이 없는 개인의 수를 분석하여 수신자 조작 특징(ROC) 곡선 분석으로 결정될 수 있다. 상기 접근의 특이성을 추가 검증하기 위해, 비-악성 상태에 대한 의학적 자문을 구하는 환자의 혈장 표본(C06)이 분석되었다. bin의 1.1%는 -3 미만의 z-스코어를 가졌다. 하나의 구현예에서, 상이한 역치를 이용하여 상이한 수준의 질환 상태를 분류할 수 있다. 더 낮은 백분율 역치를 이용해서 건강한 상태와 양성 상태를 구별하고, 더 높은 백분율 역치로 양성 상태와 악성을 구별할 수 있다.
대량 병렬 서열분석을 이용한 혈장 저메틸화 분석을 위한 진단 수행은 특정 클래스의 반복 요소, 예로 장산재 핵 요소-1(LINE-1)의 폴리머라아제 연쇄 반응(PCR) 기반 증폭을 이용하여 수득된 것보다 더 우수한 것으로 나타난다(P Tangkijvanich 등, 2007 Clin Chim Acta; 379:127-133). 상기 관찰에 대한 하나의 가능한 설명은 저메틸화가 종양 게놈에서 전반적인 반면, 하나의 게놈 영역에서 다른 게놈 영역 간 어느 정도의 이종성을 갖는다는 것이다.
사실 상, 기준 대상자의 평균 혈장 메틸화 밀도가 게놈에 걸쳐 변하는 것을 관찰하였다(도 56). 도 56에서 각각의 빨간색 점은 32명의 건강한 대상자 중 하나의 1Mb bin의 평균 메틸화 밀도를 나타낸다. 그래프는 게놈에 걸쳐 분석되는 모든 1Mb bin을 나타낸다. 각각의 상자 내의 수는 염색체 번호를 나타낸다. 평균 메틸화 밀도가 bin에 따라 변화함을 관찰하였다.
단순 PCR-기반 분석은 이러한 영역 별 이종성을 그 진단 알고리즘 내에서 고려할 수 없을 것이다. 이러한 이종성은 건강한 개인 간에 관찰되는 메틸화 밀도 범위를 확장시킬 것이다. 이어서 표본이 저메틸화를 나타내는 것으로 간주되기 위해 더 큰 크기의 메틸화 밀도 감소가 필요할 것이다. 이는 평가 민감성 감소를 일으킬 것이다.
반대로, 대량 병렬 서열분석-기반 접근은 게놈을 1Mb bin(또는 다른 크기의 bin)으로 나누며 이러한 bin에 대한 메틸화 밀도를 개별적으로 측정한다. 각각의 영역이 평가 표본 및 대조군 간에 비교되므로 상기 접근은 상이한 게놈 영역에 걸쳐 베이스라인 메틸화 밀도의 변동 영향을 감소시킨다. 실제로 동일한 bin 내에서, 32명의 건강한 대조군에 걸친 개인 간 변동은 상대적으로 작았다. 95%의 bin은 32명의 건강한 대조군에 걸쳐 1.8% 이하의 변동 계수(CV)를 가졌다. 그러나 암 연관 저메틸화 검출을 위한 민감성을 추가 증강시키기 위해, 비교가 여러 게놈 영역에 걸쳐 수행될 수 있다. 하나의 영역만 평가될 때에슨 암 표본이 특정 영역에 대해 저메틸화를 나타내지 않는 경우 생물학적 변동 효과에 대해 보장할 수 있으므로, 여러 게놈 영역을 평가하여 민감성이 증강될 것이다.
대조군 및 평가 표본 간 대등한 게놈 영역의 메틸화 밀도를 비교(예로, 각각의 게놈 영역을 별도로 평가한 뒤 가능하면 이러한 결과를 조합)하고 상기 비교를 다수의 게놈 영역에 대해 수행하는 접근은 암에 연관된 저메틸화의 검출에 대해 더 높은 신호 대 노이즈비를 갖는다. 이러한 대량 병렬 서열분석 접근을 예로서 나타낸다. 다수의 게놈 영역의 메틸화 밀도를 결정하고 대조군 및 평가 표본 간 대응 영역의 메틸화 밀도 비교를 허용할 수 있는 다른 방법론은 유사한 효과를 달성할 것으로 예측될 것이다. 예를 들어, 특정 게놈 영역에서 유래된 혈장 DNA 분자를 표적화할 수 있을 뿐만 아니라 그 영역의 메틸화 수준을 결정할 수 있는 혼성화 프로브 또는 분자 역전 프로브를 설계하여 원하는 효과를 달성할 수 있다.
다른 구현예에서, 모든 bin에 대한 z-스코어의 합을 이용하여 암이 존재하는지를 결정하거나 혈장 DNA 메틸화 수준의 일련의 변화를 모니터링하기 위해 이용할 수 있다. 종양 DNA의 전체적인 저메틸화 성질로 인해, z-스코어의 합은 건강한 대조군에 비해 암을 갖는 개인에서 수집된 혈장에서 더 낮을 것이다. HCC 환자의 수술 전 및 후 혈장 표본에 대한 z-스코어의 합은 각각 -49843.8 및 -3132.13이었다.
다른 구현예에서, 다른 방법을 이용하여 혈장 DNA의 메틸화 수준을 조사할 수 있다. 예를 들어, 시토신 잔기의 총 함량에 대한 메틸화 시토신 잔기의 비율은 질량 분광측정(ML Chen 등, 2013 Clin Chem; 59: 824-832) 또는 대량 병렬 서열분석을 이용하여 결정될 수 있다. 그러나 대부분의 시토신 잔기가 CpG 디뉴클레오티드 맥락에 있지 않으므로, 총 시토신 잔기 중 메틸화 시토신의 비율이 CpG 디뉴클레오티드 맥락에서 산정된 메틸화 수준에 비해 상대적으로 작을 것이다. HCC 환자에서 수득된 조직 및 혈장 표본뿐만 아니라 건강한 대조군에서 수득한 4개의 혈장 표본의 메틸화 수준을 결정하였다. 메틸화 수준은 게놈에 걸친 대량 병렬 서열분석 데이터를 이용하여 CpG 맥락에서, 임의의 시토신, CHG 및 CHH 맥락에서 측정되었다. H는 아데닌, 티민 또는 시토신 잔기를 나타낸다.
도 26d는 CHH 및 CHG 맥락을 이용하는 경우 일부 대조군 혈장 표본과 중복되는 종양 조직 및 수술 전 혈장 표본의 메틸화 수준을 나타내는 표 2660이다. 종양 조직 및 수술 전 혈장 표본의 메틸화 수준은 CpG 및 특정되지 않은 시토신 모두에서 버피 코트, 비-종양 간 조직, 수술 후 혈장 표본 및 건강한 대조군 혈장 표본과 비교 시 일관되게 더 낮았다. 그러나 메틸화 CpG, 즉 메틸화 밀도에 기반한 데이터는 메틸화 시토신에 기반한 데이터에 비해 더 넓은 동적 범위를 나타내었다.
다른 구현예에서, 혈장 DNA의 메틸화 상태는 메틸화 시토신에 대한 항체를 이용하는 방법, 예를 들어 메틸화 DNA 면역침전(MeDIP)에 의해 결정될 수 있다. 그러나 이들 방법의 정밀도는 항체 결합의 변동성으로 인해 서열분석 기반 방법에 비해 열등한 것으로 예상된다. 다른 구현예에서, 혈장 DNA 중 5-히드록시메틸시토신의 수준이 결정될 수 있다. 이와 관련하여, 5-히드록시메틸시토신의 수준 감소는 특정 암, 예로 흑색종의 후생적 특성인 것으로 나타났다(CG Lian, 등, 2012 Cell; 150: 1135-1146).
HCC에 부가하여, 상기 접근이 다른 유형의 암에도 적용될 수 있는지를 조사하였다. 2명의 폐 선암종 환자(CL1 및 CL2), 2명의 코인두암종 환자(NPC1 및 NPC2), 2명의 결직장암 환자(CRC1 및 CRC2), 1명의 전이성 신경내분비 종양 환자(NE1) 및 1명의 전이성 평활근육종 환자(SMS1)로부터의 혈장 표본을 분석하였다. 이들 대상자의 혈장 DNA가 바이설파이트-전환되고 한 말단에서 50bp 대해 Illumina HiSeq2000 플랫폼을 이용하여 서열분석되었다. 상기 언급된 4명의 건강한 대조군 대상자가 이들 8명의 환자 분석을 위한 기준 군으로 이용되었다. 한 말단에서의 서열 리드 50bp가 이용되었다. 전체 게놈은 1Mb bin으로 나뉘었다. 메틸화 밀도의 평균 및 SD가 기준 군의 데이터를 이용하여 각각의 bin에서 계산되었다. 이어서 8명의 암 환자의 결과가 기준 군의 평균으로부터의 SD 수로 나타내는 z-스코어로 표현되었다. 양의 값은 평가 케이스의 메틸화 밀도가 기준 군의 평균보다 낮다는 것을 시사하며, 그리고 음의 값은 그 반대를 시사한다. 표본 별로 달성되는 서열 리드의 수 및 서열분석 깊이를 도 27i의 표 2780에 나타낸다.
도 27a-h는 본 발명의 구현예에 따른 8명의 암 환자의 메틸화 밀도의 Circos 그래프를 나타낸다. 각각의 점은 1Mb bin의 결과를 나타낸다. 검은색 점은 -3 내지 3의 z-스코어를 갖는 bin을 나타낸다. 빨간색 점은 -3 미만의 z-스코어를 갖는 bin을 나타낸다. 녹색 점은 3 초과의 z-스코어를 갖는 bin을 나타낸다. 두 연속선 사이의 간격은 20의 z-스코어 차이를 나타낸다.
폐암, 코인두암종, 결직장암 및 전이성 신경내분비 종양을 포함하는 대부분의 암 유형의 환자에 대해 게놈에 걸쳐 다수의 영역에서 유의미한 저메틸화가 관찰되었다. 흥미롭게도, 저메틸화에 부가하여 전이성 평활근육종 케이스에서 게놈에 걸쳐 다수의 영역에서 유의미한 고메틸화가 관찰되었다. 평활근육종의 배아 기원은 중배엽인 반면, 나머지 7명 환자에서 다른 유형의 암의 배아 기원은 외배엽이다. 따라서 육종의 DNA 메틸화 패턴이 암종의 패턴과 상이할 수 있음이 가능하다.
이 경우에 나타난 바와 같이, 혈장 DNA의 메틸화 패턴은 또한 상이한 암 유형의 구별, 이 예에서는 암종 및 육종의 구별을 위해 유용할 수 있다. 이들 데이터는 또한 접근을 이용하여 악성에 연관된 이상 고메틸화를 검출할 수 있음을 제시한다. 이들 전체 8 케이스에 있어서, 혈장 표본만 이용 가능하였고 종양 조직은 분석되지 않았다. 이는 이전의 메틸화 프로필 또는 종양 조직의 메틸화 수준 없이도 종양-유래 DNA가 기재된 방법을 이용하여 혈장에서 쉽게 검출될 수 있음을 나타내었다.
도 27j는 상이한 악성 환자의 혈장에서 전체 게놈에 대해 1Mb bin의 z-스코어 분포를 나타내는 표인 표 2790이다. 각 케이스에 대해 -3 미만, -3 내지 3 및 3 초과의 z-스코어를 갖는 bin의 백분율을 나타낸다. 모든 케이스에 있어서, 5% 초과의 bin이 -3 미만의 z-스코어를 가졌다. 따라서 표본을 암에 대해 양성으로 분류하기 위해 bin의 5% 컷오프를 유의미하게 저메틸화된 것으로 이용하는 경우, 이들 전체 케이스가 암에 대해 양성으로 분류될 것이다. 본 발명자들의 결과는 저메틸화가 상이한 유형의 암에 대해 일반적인 현상일 수 있으며, 혈장 메틸롬 분석이 상이한 유형의 암 검출을 위해 유용할 것임을 나타낸다.
D. 방법
도 28은 본 발명의 구현예에 따른 암 수준의 분류를 결정하기 위해 유기체의 생물학적 표본을 분석하는 방법 2800의 순서도이다. 생물학적 표본에는 정상 세포에서 유래된 DNA가 포함되며, 잠재적으로 암에 연관된 세포 유래 DNA가 포함될 수 있다. 적어도 일부 DNA는 생물학적 표본에서 무세포일 수 있다.
블록 2810에서, 상기 생물학적 표본으로부터 복수의 DNA 분자가 분석된다. DNA 분자의 분석에는 유기체의 게놈에서의 DNA 분자 위치 결정 및 DNA 분자가 하나 이상의 부위에서 메틸화되어 있는지의 여부를 결정하는 것이 포함될 수 있다. 분석은 메틸화-인식 서열분석으로부터 서열 리드를 수신하여 수행될 수 있고, 이에 따라 분석은 DNA에서 이전에 수득된 데이터 상에서만 수행될 수 있다. 다른 구현예에서, 분석에는 실제 서열분석 또는 데이터를 수득하는 다른 유효 단계가 포함될 수 있다.
블록 2820에서, 부위에서 메틸화되어 있는 DNA 분자의 각각의 수가 각각의 복수의 부위에 대해 결정된다. 하나의 구현예에서, 부위는 CpG 부위이고 본원에 언급된 하나 이상의 기준을 이용하여 선택된 특정 CpG 부위만일 수 있다. 메틸화된 DNA 분자의 수는 특정 부위에서 분석되는 DNA 분자의 총 수, 예로 서열 리드의 총 수를 이용하여 정규화가 수행되는 경우 비메틸화되는 수의 결정과 대등하다. 예를 들어, 영역의 CpG 메틸화 밀도 증가는 동일한 영역의 비메틸화 CpG 밀도의 감소와 대등하다.
블록 2830에서, 제1 메틸화 수준은 상기 복수의 부위에서 상기 메틸화된 DNA 분자의 각각의 수에 기반하여 계산된다. 제1 메틸화 수준은 복수의 부위에 대응하는 DNA 분자의 수에 기반하여 결정되는 메틸화 밀도에 대응할 수 있다. 부위는 복수의 유전자좌 또는 단 하나의 유전자좌에 대응할 수 있다.
블록 2840에서, 제1 메틸화 수준이 제1 컷오프값과 비교된다. 제1 컷오프값은 기준 메틸화 수준일 수 있거나 기준 메틸화 수준에 관련될 수 있다(예로, 정상 수준으로부터 특정된 거리). 기준 메틸화 수준은 암이 없는 개인의 표본에서 또는 유기체의 암과 연관되지 않은 것으로 알려진 유전자좌 또는 유기체에서 결정될 수 있다. 제1 컷오프값은 평가되는 생물학적 표본에 대해 이전에 수득된 유기체의 이전 생물학적 표본에서 결정된 기준 메틸화 수준에서 정립될 수 있다.
하나의 구현예에서, 제1 컷오프값은 건강한 유기체에서 수득된 생물학적 표본에서 정립된 기준 메틸화 수준으로부터의 특정된 거리(예로 표준 편차의 특정된 수)이다. 비교는 제1 메틸화 수준 및 기준 메틸화 수준 간 차이를 결정한 뒤 그 차이를 제1 컷오프값에 대응하는 역치와 비교하여 수행될 수 있다(예로 메틸화 수준이 기준 메틸화 수준과 통계적으로 상이한지를 결정하기 위해).
블록 2850에서, 암의 수준 분류는 비교에 기반하여 결정된다. 암의 수준의 예에는 대상자가 암 또는 전악성 상태, 또는 증가된 암 발생 가능성을 갖는지의 여부가 포함된다. 하나의 구현예에서, 제1 컷오프값은 대상자에서 이전에 수득된 표본에서 결정될 수 있다(예로, 기준 메틸화 수준이 이전 표본에서 결정될 수 있다).
일부 구현예에서, 제1 메틸화 수준은 그 메틸화 수준이 역치값을 초과하는 여러 영역에 대응할 수 있다. 예를 들어, 유기체 게놈의 복수 영역이 확인될 수 있다. 영역은 본원에 언급된 기준, 예로 특정 길이 또는 특정 수의 부위를 이용해서 확인될 수 있다. 하나 이상의 부위(예로, CpG 부위)가 각각의 영역 내에서 확인될 수 있다. 영역의 메틸화 수준이 각 영역에 대해 계산될 수 있다. 제1 메틸화 수준은 제1 영역에 대한 것이다. 각각의 영역 메틸화 수준은 각각의 영역 컷오프값과 비교되며, 이는 영역 간에 동일하거나 변할 수 있다. 제1 영역에 대한 영역 컷오프값이 제1 컷오프값이다. 각각의 영역 컷오프값은 기준 메틸화 수준에서 특정된 양(예로 0.5)이고, 이에 따라 기준으로부터 유의미한 차이를 갖는 영역만을 카운트할 수 있으며, 이는 비-암 대상자에서 결정될 수 있다.
그 영역 메틸화 수준이 각각의 영역 컷오프값을 초과하는 영역의 제1 수가 결정되고 역치값과 비교되어 분류를 결정한다. 하나의 시행에서, 역치값은 백분율이다. 제1 수와 역치값의 비교에는, 예로 정규화 절차의 일환으로, 역치값과의 비교 전에 영역의 제1 수를 영역의 제2 수(예로, 전체 영역)으로 나누는 것이 포함될 수 있다.
전술된 바와 같이, 상기 생물학적 표본 중 종양 DNA의 분획 농도를 이용하여 제1 컷오프값을 계산할 수 있다. 분획 농도는 단순히 최소값보다 크게 산정될 수 있는 반면, 최소값 미만의 분획 농도를 갖는 표본은, 예로 분석을 위해 적합하지 않은 것으로 표시될 수 있다. 최소값은 기준 메틸화 수준 대비 종양에 대한 메틸화 수준의 예상 차이에 기반하여 결정될 수 있다. 예를 들어, 차이가 0.5(예로, 컷오프값으로 사용되는 것)인 경우, 특정 종양 농도는 이러한 차이를 보기에 충분히 높도록 요구될 것이다.
방법 1300으로부터의 특정 기법이 방법 2800을 위해 적용될 수 있다. 방법 1300에서, 복제수 변동이 종양에 대해 결정될 수 있다(예로, 종양의 제1 염색체 영역이 종양의 제2 염색체 영역에 비해 복제수 변화를 갖는지가 평가될 수 있는 경우). 즉, 방법 1300은 종양이 존재함을 추정할 수 있다. 방법 2800에서, 표본은 임의의 복제수 특징과 무관하게 결국 임의 종양의 존재가 시사되는지에 대해 평가될 수 있다. 두 방법의 일부 기법은 유사할 수 있다. 그러나 방법 2800에 대한 컷오프값 및 메틸화 파라미터(예로, 정규화된 메틸화 수준)는 복제수 변동을 가질 수 있는 일부 영역을 포함하는 암 DNA 및 비-암 DNA의 혼합물에 대한 기준 메틸화 수준으로부터의 차이와 대조되어 비-암 DNA에 대한 기준 메틸화 수준으로부터의 통계적 차이를 검출할 수 있다. 따라서 방법 2800에 대한 기준값은, 암이 없는 표본, 예컨대 암이 없는 유기체 또는 동일한 환자의 비-암 조직(예로, 세포 DNA에서 결정될 수 있는, 이전에 채취된 혈장 또는 암을 갖지 않는 것으로 알려진 동시에 획득된 표본)에서 결정될 수 있다.
E. 혈장 DNA 메틸화 분석을 이용해서 검출되는 종양-DNA의 최소 분획 농도의 예측
혈장 DNA의 메틸화 수준을 이용하여 암을 검출하기 위한 접근의 민감성을 측정하는 하나의 방식은 대조군과 비교되는 경우 혈장 DNA 메틸화 수준 변화를 드러내는데 필요한 최소 분획 종양-유래 DNA 농도에 관련된다. 평가 민감성은 또한 건강한 대조군 또는 혈액 세포 DNA에서의 베이스라인 혈장 DNA 메틸화 수준 및 종양 조직 간의 DNA 메틸화 차이 정도에 의존한다. 혈액 세포는 건강한 개인의 혈장에서 주요한 DNA 원천이다. 차이가 클수록, 암 환자를 비-암 개인과 구별하기 쉬울 수 있고, 더 높은 임상적 민감성 및 혈장 중 더 낮은 종양-유래 검출 하한으로 암 환자 검출에 반영될 것이다. 또한, 상이한 연령의 대상자 또는 건강한 대상자에서 혈장 DNA 메틸화의 변동(G Hannum 등, 2013 Mol Cell; 49: 359-367)도 암의 존재에 연관된 메틸화 변화 검출의 민감성에 영향을 미칠 것이다. 건강한 대상자에서 혈장 DNA 메틸화의 변동이 적으면 소량의 암 유래 DNA 존재로 야기되는 변화의 검출이 더 쉬워질 것이다.
도 29a는 상기 분포가 정규 분포를 따른다고 가정하는 기준 대상자에서 메틸화 밀도 분포를 나타내는 그래프 2900이다. 상기 분석은 하나의 메틸화 밀도값, 예를 들어 모든 상염색체 또는 특정 염색체의 메틸화 밀도만을 제공하는 각각의 혈장 표본에 기반을 둔다. 이는 분석의 특이성이 어떻게 영향을 받을지를 나타낸다. 하나의 구현예에서, 기준 대상자의 평균 DNA 메틸화 밀도의 3SD 미만의 컷오프를 이용하여 평가 표본이 기준 대상자의 표본보다 유의미하게 더 저메틸화되어 있는지가 결정된다. 상기 컷오프가 이용되는 경우, 비-암 대상자의 대략 0.15%가 암을 갖는 것으로 분류되는 위양성 결과를 가져서 99.85%의 특이성을 야기할 것으로 예상된다.
도 29b는 기준 대상자 및 암 환자에서 메틸화 밀도의 분포를 나타내는 그래프 2950이다. 컷오프값은 기준 대상자의 메틸화 밀도 평균의 3SD 미만이다. 암 환자의 메틸화 밀도 평균이 컷오프값의 2SD 미만(즉 기준 대상자 평균의 5SD 미만)인 경우, 97.5%의 암 대상자는 컷오프값 미만의 메틸화 밀도를 가질 것으로 예상될 것이다. 다시 말하면, 하나의 메틸화 밀도값이 각각의 대상자에 대해 제공되는 경우, 예를 들어 전체 게놈, 모든 상염색체 또는 특정 염색체의 총 메틸화 밀도가 분석되는 경우, 예상되는 민감성은 97.5%일 것이다. 두 모집단의 평균 메틸화 밀도 간 차이는 두 요인, 즉 암 및 비-암 조직 간 메틸화 수준의 차이 정도 및 혈장 표본 중 종양-유래 DNA의 분획 농도에 의해 영향을 받는다. 이들 두 파라미터값이 높을수록, 이들 두 모집단의 메틸화 밀도값의 차이가 더 클 것이다. 또한, 두 모집단의 메틸화 밀도 분포의 SD가 낮을수록, 두 모집단의 메틸화 밀도 분포의 중복이 더 적다.
여기서는 상기 개념을 나타내기 위해 가상의 예를 이용한다. 종양 조직의 메틸화 밀도가 약 0.45이고, 건강한 대상자의 혈장 DNA가 약 0.7이라고 가정해 보자. 이러한 가정값은 상염색체의 전체적 메틸화 밀도가 42.9%이고 건강한 대조군의 혈장 표본에 대한 상염색체의 평균 메틸화 밀도가 71.6%인 HCC 환자에서 수득된 것과 유사하다. 전체 게놈에 대해 혈장 DNA 메틸화 밀도 측정 CV가 1%라고 가정하면, 컷오프값은 0.7×(100%-3×1%)=0.679일 것이다. 97.5%의 민감성을 확보하기 위해, 암 환자에 대한 혈장 DNA의 평균 메틸화 밀도는 대략 0.679-0.7×(2×1%)=0.665여야 한다. f가 혈장 표본 중 종양-유래 DNA의 분획 농도를 나타낸다고 하자. 그러면 f (0.7-0.45)×f=0.7-0.665로 계산될 수 있다. 따라서 f는 대략 14%이다. 상기 계산으로부터, 전체 게놈의 총 메틸화 농도가 진단 파라미터로 이용되는 경우, 97.5%의 진단 민감성을 달성하기 위해 혈장에서 검출될 수 있는 최소 분획 농도는 14%인 것으로 산정된다.
다음으로 HCC 환자에서 수득한 데이터 상에서 상기 분석을 수행하였다. 이 예시를 위해, 각 표본에 대해 모든 상염색체에서 산정된 값에 기반하여 단 하나의 메틸화 밀도만 측정하였다. 건강한 대상자에서 수득된 혈장 표본 간 평균 메틸화 밀도는 71.6%였다. 이들 네 표본의 메틸화 밀도의 SD는 0.631%였다. 따라서 혈장 메틸화 밀도의 컷오프값은 -3 미만의 z-스코어 및 99.85%의 특이성에 도달하기 위해 71.6%-3×0.631%=69.7%여야 할 것이다. 97.5%의 민감성에 도달하기 위해, 암 환자의 평균 혈장 메틸화 밀도는 컷오프의 2SD 미만, 즉 68.4%여야 할 것이다. 종양 조직의 메틸화 밀도가 42.9%이므로, 식 P=BKG×(1-f)+TUM×f를 이용하면 f는 적어도 11.1%여야 할 것이다.
다른 구현예에서, 상이한 게놈 영역의 메틸화 밀도는, 예로 도 25a 또는 26b에 나타낸 바와 같이 별도로 분석될 수 있다. 다시 말하면, 각 표본에 대해 메틸화 수준의 복수 측정이 수행될 수 있다. 아래 나타낸 바와 같이, 유의미한 저메틸화는 혈장 중 훨씬 더 낮은 분획 종양 DNA 농도를 검출할 수 있고, 이에 따라 암 검출을 위한 혈장 DNA 메틸화 분석의 진단 성능이 증강될 것이다. 기준 모집단에서 메틸화 밀도의 유의미한 일탈을 나타내는 게놈 영역의 수가 카운트될 수 있다. 이어서 게놈 영역의 수를 컷오프값과 비교하여 조사되는 게놈 영역 모집단, 예를 들어 전체 게놈의 1Mb bin에 걸쳐 혈장 DNA의 전체적으로 유의미한 저메틸화가 존재하는지를 결정할 수 있다. 컷오프값은 암이 없는 기준 대상자군의 분석에 의해 정립되거나 또는 예를 들어 정규 분포 함수에 따라 수학적으로 유도될 수 있다.
도 30은 건강한 대상자 및 암 환자의 혈장 DNA의 메틸화 밀도 분포를 나타내는 그래프 3000이다. 각각의 1Mb bin의 메틸화 밀도가 기준 군의 대응값과 비교된다. 유의미한 저메틸화(기준 군 평균의 3SD 미만)를 나타내는 bin의 백분율이 결정되었다. 유의미한 저메틸화인 10% 컷오프를 이용하여 종양-유래 DNA가 혈장 표본 중에 존재하는지를 결정하였다. 다른 컷오프값, 예컨대 5%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 60%, 70%, 80% 또는 90%가 또한 원하는 평가 민감성 및 특이성에 따라 이용될 수 있다.
예를 들어, 표본을 종양-유래 DNA를 함유하는 것으로 분류하기 위해, 유의미한 저메틸화(z-스코어 <-3)를 나타내는 1Mb bin의 10%를 컷오프로 이용할 수 있다. 기준 군보다 유의미하게 더 저메틸화된 bin이 10% 초과로 존재하는 경우, 표본은 암 평가에 대해 양성으로 분류된다. 각각의 1Mb bin에 대해, 기준 군의 평균 메틸화 밀도의 3SD 미만의 컷오프를 이용하여 표본이 유의미하게 더 저메틸화된 것으로 정의한다. 각각의 1Mb bin에 대해, 암 환자의 평균 혈장 DNA 메틸화 밀도가 기준 대상자의 평균 혈장 DNA 메틸화 밀도보다 1.72SD 미만인 경우, 암 환자의 임의의 특정 bin의 메틸화 밀도값이 컷오프(즉, z-스코어 <-3)보다 낮고 양성 결과를 나타낼 확률은 10%이다. 이어서 전체 게놈에 대해 모든 1Mb bin을 살펴보면, 대략 10%의 bin이 유의미하게 더 낮은 메틸화 밀도(즉 z-스코어 <-3)를 갖는 양성 결과를 나타낼 것으로 예상될 것이다. 건강한 대상자의 혈장 DNA의 전체적 메틸화 밀도가 대략 0.7이고 각각의 1Mb bin에 대한 혈장 DNA 메틸화 밀도 측정의 변동 계수(CV)가 1%라고 가정하면, 암 환자의 혈장 DNA의 평균 메틸화 밀도는 0.7×(100%-1.72×1%)=0.68796이어야 할 것이다. 상기 평균 혈장 DNA 메틸화 밀도를 수득하기 위해, 혈장 중 종양-유래 DNA의 분획 농도를 f라고 하자. 종양 조직의 메틸화 밀도가 0.45라고 가정하면, f는 다음 식을 이용해서 계산될 수 있다:
식 중, 는 기준 개인에서 혈장 DNA의 평균 메틸화 밀도를 나타내며, 는 암 환자에서 종양 조직의 메틸화 밀도를 나타내고; 는 암 환자에서 혈장 DNA의 평균 메틸화 밀도를 나타낸다.
상기 식을 이용하면, (0.7-0.45)×f=0.7-0.68796이다. 따라서 상기 접근을 이용해서 검출될 수 있는 최소 분획 농도는 4.8%로 추정될 것이다. 민감성은 bin의 컷오프 백분율을 유의미하게 더 저메틸화되도록, 예를 들어 10%에서 5%로 감소시켜 추가 증강될 수 있다.
상기 예에 나타낸 바와 같이, 상기 방법의 민감성은 암 및 비-암 조직, 예를 들어 혈액 세포 간 메틸화 수준의 차이 정도로 결정된다. 하나의 구현예에서, 비-암 대상자의 혈장 DNA 및 종양 조직 간에 큰 메틸화 밀도 차이를 나타내는 염색체 영역만 선택된다. 하나의 구현예에서, 0.5 초과의 메틸화 밀도 차이를 갖는 영역만 선택된다. 다른 구현예에서, 0.4, 0.6, 0.7, 0.8 또는 0.9의 차이가 적합한 영역을 선택하기 위해 이용될 수 있다. 다른 구현예에서, 게놈 영역의 물리적 크기는 고정되지 않는다. 대신 게놈 영역은, 예를 들어 고정된 측정치 깊이 또는 고정된 수의 CpG 부위에 기반하여 정의된다. 복수의 이들 게놈 영역에서의 메틸화 수준이 각 표본에 대해 평가된다.
도 31은 건강한 대상자의 혈장 DNA 및 HCC 환자의 종양 조직의 평균 간 메틸화 밀도 차이의 분포를 나타내는 그래프 3100이다. 양의 값은 메틸화 밀도가 건강한 대상자의 혈장 DNA에서 더 높음을 표시하고, 음의 값은 메틸화 밀도가 종양 조직에서 더 높음을 표시한다.
하나의 구현예에서, 암 및 비-암 조직의 메틸화 밀도 간에 가장 큰 차이를 갖는 bin이, 예를 들어 종양이 이들 bin에 대해 저메틸화 또는 고메틸화되어 있는지와 무관하게 0.5 초과의 차이를 갖는 것들이 선택될 수 있다. 혈장 중 종양-유래 DNA 분획 농도의 검출 한계는 혈장 중 종양-유래 DNA의 동일한 분획 농도가 주어진 암 및 비-암 대상자 간 혈장 DNA 메틸화 수준의 분포 간의 더 큰 차이로 인해 이들 bin에 초점을 맞춰 낮춰질 수 있다. 예를 들어, 평가된 개인이 암을 갖는지를 결정하기 위해 0.5 초과 차이를 갖는 bin만 이용되고 10%의 bin이 유의미하게 더 저메틸화된 컷오프가 채택되는 경우, 검출된 종양 유래 DNA의 최소 분획 농도(f)는 다음 공식을 이용해서 계산될 수 있다:
식 중, 는 기준 개인에서 혈장 DNA의 평균 메틸화 밀도를 나타내며, 는 암 환자에서 종양 조직의 메틸화 밀도를 나타내고; 는 암 환자에서 혈장 DNA의 평균 메틸화 밀도를 나타낸다.
기준 대상자의 혈장 및 종양 조직 간 메틸화 밀도 차이는 적어도 0.5이다. 그러면 0.5×f=0.7-0.68796이고 f=2.4%이다. 따라서 암 및 비-암 조직 간 메틸화 밀도 차이가 더 높은 bin에 초점을 맞춤으로써, 분획 종양-유래 DNA의 하한이 4.8%에서 2.4%로 낮춰질 수 있다. 어느 bin이 암 및 비-암 조직, 예를 들어 혈액 세포 간에 더 큰 정도의 메틸화 차이를 나타내는지에 대한 정보는 동일한 기관의 종양 조직 또는 다른 개인에서 수득된 동일한 조직 유형에서 결정될 수 있다.
다른 구현예에서, 파라미터는 암 및 비-암 조직 간 메틸화 밀도 차이를 고려하여 모든 bin의 혈장 DNA의 메틸화 밀도에서 유도될 수 있다. 더 큰 차이를 갖는 bin에 더 큰 가중치가 제공될 수 있다. 하나의 구현예에서, 각각의 bin의 암 및 비-암 조직 간 메틸화 밀도 차이는 특정 bin이 최종 파라미터 계산에 있는 경우 가중치로 직접 이용될 수 있다.
다른 구현예에서, 상이한 유형의 암은 종양 조직에서 상이한 메틸화 패턴을 가질 수 있다. 암-특이적 가중치 프로필은 특정 유형의 암의 메틸화 정도에서 유도될 수 있다.
다른 구현예에서, 메틸화 밀도의 bin-간 관계는 암이 있는 및 암이 없는 대상자에서 결정될 수 있다. 도 8에서, 작은 수의 bin에서 종양 조직이 기준 대상자의 혈장 DNA에 비해 더 메틸화되었음을 관찰할 수 있다. 따라서 가장 심한 차이값, 예로 0.5 초과 차이 및 0 미만의 차이를 갖는 bin이 선택될 수 있다. 이어서 이들 bin의 메틸화 밀도비를 이용하여 평가된 개인이 암을 갖는지를 나타낼 수 있다. 다른 구현예에서, 상이한 bin의 메틸화 밀도 차이 및 할당이 bin간 관계를 나타내기 위한 파라미터로 이용될 수 있다.
HCC 환자에서 수득된 데이터로 나타내는 바와 같이 다수 게놈 영역의 메틸화 밀도를 이용하여 종양을 검출하거나 평가하기 위한 접근의 검출 민감성을 추가로 평가하였다. 먼저, 수술 전 혈장으로부터의 측정치를 건강한 대조군의 혈장 표본에서 수득된 것과 혼합하여 20% 내지 0.5% 범위인 분획 종양 DNA 농도를 함유하는 혈장 표본을 시뮬레이션하였다. 이어서 z-스코어 <-3과 대등한 메틸화 밀도를 갖는 1Mb bin의 백분율을(전체 게놈에서의 2,734개 bin 중에) 스코어링하였다. 혈장 중 분획 종양 DNA 농도가 20%였다면, bin의 80.0%가 유의미한 저메틸화를 나타내었다. 10%, 5%, 2%, 1% 및 0.5%의 혈장 중 분획 종양 DNA 농도에 대한 대응 데이터는 각각 저메틸화를 나타내는 bin 67.6%, 49.7%, 18.9%, 3.8% 및 0.77%였다. 대조군 표본에서 z-스코어 <-3을 나타내는 bin 수의 이론적 한계가 0.15%이므로, 본 발명자들의 데이터는 종양 분획 농도가 단지 0.5%였던 경우에도 이론적 컷오프 한계를 넘어서는 훨씬 더 많은 bin(0.77%)이 존재하였음을 나타낸다.
도 32a는 혈장 표본이 5% 또는 2%의 종양 DNA를 함유하는 경우, 서열분석 깊이를 감소시키는 효과를 나타내는 표 3200이다. 평균 서열분석 깊이가 홑배수체 게놈의 단지 0.022배였던 경우에도 유의미한 저메틸화를 나타내는 높은 비율(>0.15%)의 bin이 여전히 검출될 수 있었다.
도 32b는 4명의 건강한 대조군 대상자의 혈장, 버피 코트, 정상 간 조직, 종양 조직, HCC 환자의 수술 전 혈장 및 수술 후 혈장 표본에서 반복 요소 및 비반복 영역의 메틸화 밀도를 나타내는 그래프 3250이다. 반복 요소가 암 및 비-암 조직 모두에서 비반복 영역에 비해 더 메틸화되었음을(더 높은 메틸화 밀도) 관찰할 수 있다. 그러나 반복 요소 및 비반복 영역 간 메틸화 밀도의 차이는 종양 조직과 비교 시 건강한 대상자의 혈장 DNA 및 비-암 조직에서 더 컸다.
그 결과, 암 환자의 혈장 DNA는 비반복 영역에서보다 반복 영역에서 더 큰 메틸화 밀도 감소를 가졌다. 4명의 건강한 대조군 평균 및 HCC 환자 간 혈장 DNA 메틸화 밀도의 차이는 반복 요소 및 비반복 영역에 대해 각각 0.163 및 0.088이었다. 수술 전 및 수술 후 혈장 표본에 대한 데이터도 메틸화 밀도 변화에서의 동적 범위가 비반복 영역에 비해 반복 영역에서 더 큼을 나타내었다. 하나의 구현예에서, 반복 요소의 혈장 DNA 메틸화 밀도는 환자가 암에 의해 영향받는지를 결정하기 위해 또는 질환 진행을 모니터링하기 위해 이용될 수 있다.
상기 논의된 바와 같이, 기준 대상자의 혈장 중 메틸화 밀도의 변동은 또한 암 환자와 비-암 개인의 구별의 정확성에 영향을 미칠 것이다. 메틸화 밀도의 분포가 조밀할수록(즉 표준 편차가 작을수록), 암 및 비-암 대상자를 더 정확히 구별하게 될 것이다. 다른 구현예에서, 1Mb bin의 메틸화 밀도의 변동 계수(CV)는 기준 군에서 혈장 DNA 메틸화 밀도의 낮은 변동성을 갖는 bin을 선택하기 위한 기준으로 이용될 수 있다. 예를 들어, 1% 미만의 CV를 갖는 bin만 선택된다. 다른 값, 예를 들어 0.5%, 0.75%, 1.25% 및 1.5%도 메틸화 밀도에서 낮은 변동성을 갖는 bin의 선택을 위한 기준으로 이용될 수 있다. 다른 구현예에서, 선택 기준에는 bin의 CV 및 암 및 비-암 조직 간 메틸화 밀도 차이 모두가 포함될 수 있다.
종양 조직의 메틸화 밀도를 아는 경우, 메틸화 밀도를 또한 이용하여 혈장 표본 중 종양-유래 DNA의 분획 농도를 산정할 수 있다. 상기 정보는 동일한 유형의 암을 갖는 여러 환자의 종양 조사로부터 또는 환자 종양의 분석에 의해 수득될 수 있다. 상기 논의된 바와 같이, 혈장 메틸화 밀도(P)는 다음 공식을 이용하여 표현될 수 있다: , 식 중 BKG는 혈액 세포 및 다른 기관의 배경 메틸화 밀도이고, TUM은 종양 조직에서의 메틸화 밀도이고, f는 혈장 표본 중 종양-유래 DNA의 분획 농도이다. 이는 다음과 같이 다시 쓰여질 수 있다:
BKG값은 암이 없는 개인 기준 군 조사에서 또는 암이 존재하지 않는 시점에 환자의 혈장 표본을 분석하여 결정될 수 있다. 따라서 혈장 메틸화 밀도의 측정 후, f가 결정될 수 있다.
F. 다른 방법과의 조합
본원에 기재된 메틸화 분석 접근은 혈장 중 종양-유래 DNA의 유전적 변화에 기반한 다른 방법과 조합되어 이용될 수 있다. 이러한 방법의 예에는 암 연관 염색체 이상에 대한 분석(KCA Chan 등, 2013 Clin Chem; 59:211-224; RJ Leary 등, 2012 Sci Transl Med; 4:162ra154) 및 혈장 중의 암-연관 단일 뉴클레오티드 변동(KCA Chan 등, 2013 Clin Chem; 59:211-224)이 포함된다. 이러한 유전적 접근에 비해 메틸화 분석 접근의 장점이 존재한다.
도 21a에 나타낸 바와 같이, 종양 DNA의 저메틸화는 거의 전체 게놈에 걸쳐 분포된 영역이 수반되는 전반적 현상이다. 따라서 모든 염색체 영역 유래 DNA 단편은 환자에서 종양-유래 저메틸화 DNA의 혈장/혈청 DNA에 대한 잠재적 분포에 관해 정보를 제공할 것이다. 대조적으로, 염색체 이상(염색체 영역의 증폭 또는 결실)은 일부 염색체 영역에만 존재하며, 종양 조직 중 염색체 이상이 없는 영역 유래 DNA 단편은 분석에서 정보를 제공하지 않을 것이다(KCA Chan 등, 2013 Clin Chem; 59: 211-224). 유사하게 각각의 암 게놈에서 수 천개의 단일 뉴클레오티드 변형만이 관찰된다(KCA Chan 등, 2013 Clin Chem; 59: 211-224). 이들 단일 뉴클레오티드 변화와 중복되지 않는 DNA 단편은 종양-유래 DNA가 혈장 중에 존재하는지를 결정하는데 있어 정보를 제공하지 않을 것이다. 따라서 상기 메틸화 분석 접근은 순환 중 암 연관 변화를 검출하기 위한 이러한 유전적 접근에 비해 잠재적으로 더 비용 효과적이다.
하나의 구현예에서, 혈장 DNA 메틸화 분석의 비용 효율성은 가장 많은 정보를 제공하는 영역, 예를 들어 암 및 비-암 조직 간에 가장 높은 차등적 메틸화 차이를 갖는 영역으로부터 DNA 단편을 농축하여 추가 증강될 수 있다. 이러한 영역에 대한 농축 방법의 예에는 혼성화 프로브의 이용(예로 Nimblegen SeqCap 시스템 및 Agilent SureSelect 표적 농축 시스템), PCR 증폭 및 고상 혼성화가 포함된다.
G. 조직-특이적 분석/ 공여자
종양-유래 세포는 인접한 또는 먼 기관으로 침입하고 전이한다. 침입된 조직 또는 전이성 병터는 세포사 결과 혈장 내로의 DNA에 기여한다. 암 환자의 혈장 중 DNA의 메틸화 프로필을 분석하고 조직-특이적 메틸화 특징의 존재를 검출함으로써, 질환 절차에 수반된 조직 유형을 검출할 수 있다. 상기 접근은 일차 및 전이성 부위로 수반된 기관의 확인을 보조하기 위해 암성 절차에 수반된 조직의 비침습적 해부학적 스캔을 제공한다. 혈장 중 수반 기관의 메틸화 특징의 상대 농도 모니터링도 그 기관에서의 암 절차가 악화 중 또는 개선 중인지 또는 치유되었는지를 결정하고 그 기관의 종양 부하를 평가할 수 있도록 할 것이다. 예를 들어, 유전자 X가 간에서 특이적으로 메틸화된 경우, 암(예로 결직장암)에 의한 간의 전이성 수반은 혈장 중 유전자 X의 메틸화 서열 농도를 증가시킬 것으로 예상될 것이다. 또한 유전자 X와 유사한 메틸화 특징을 갖는 다른 서열 또는 서열 그룹이 있을 것이다. 이어서 이러한 서열로부터의 결과를 조합할 수 있다. 유사한 고려사항이 다른 조직, 예로 뇌, 뼈, 폐 및 신장 등에 적용 가능하다.
반면, 상이한 기관 유래 DNA는 조직-특이적 메틸화 특징을 나타내는 것으로 알려져 있다(BW Futscher 등, 2002 Nat Genet; 31:175-179; SSC Chim 등, 2008 Clin Chem; 54: 500-511). 따라서 혈장 중의 메틸화 프로필 확인이 다양한 기관으로부터 혈장 내로의 조직의 기여를 규명하기 위해 이용될 수 있다. 세포 사멸 시 혈장 DNA가 배출되는 것으로 여겨지므로, 이러한 기여의 규명은 기관 손상을 평가하기 위해 이용될 수 있다. 예를 들어, 간 병리, 예컨대 간염(예로 바이러스, 자가면역 절차 등에 의한) 또는 약물에 의해 야기되는 간 독성(예로 약물 과용량(예컨대 파라세타몰에 의한) 또는 독소(예컨대 알코올))은 간 세포 손상과 연관되며, 혈장 중 간-유래 DNA의 증가된 수준과 연관된 것으로 예상될 것이다. 예를 들어 유전자 X가 간에서 특이적으로 메틸화된 경우, 간 병리는 혈장 중 유전자 X의 메틸화 서열 농도를 증가시킬 것으로 예상될 것이다. 반대로 유전자 Y가 간에서 특이적으로 저메틸화된 경우, 간 병리는 혈장 중 유전자 Y의 메틸화 서열 농도를 감소시킬 것으로 예상될 것이다. 다른 구현예에서, 유전자 X 또는 Y는 유전자가 아닐 수 있고 체내에서 상이한 조직 중 차등적 메틸화를 나타내는 임의의 게놈 서열로 대체될 수 있다.
본원에 기재된 기법은 또한 기관 이식 수령자의 혈장 중 공여자 유래 DNA의 평가에 적용될 수 있다(YMD Lo 등, 1998 Lancet; 351:1329-1330). 공여자 및 수령자 간 다형성 차이를 이용하여 혈장 중 공여자 유래 DNA를 수령자 유래 DNA와 구별하였다(YW Zheng 등, 2012 Clin Chem; 58: 549-558). 본 발명자들은 이식 기관의 조직-특이적 메틸화 특징이 수령자의 혈장 중 공여자의 DNA를 검출하기 위한 방법으로도 이용될 수 있음을 제안한다.
공여자의 DNA 농도를 모니터링함으로써, 이식된 기관의 상태를 비침습적으로 평가할 수 있다. 예를 들어, 이식 거부는 더 높은 비의 세포사와 연관되며, 따라서 환자가 안정한 상태에 있는 때와 비교 시 또는 이식 없이 건강한 대조군 또는 다른 안정한 이식 수령자와 비교 시 이식 기관의 메틸화 특징으로 반영되는 수령자 혈장(또는 혈청) 중 공여자의 DNA 농도가 증가될 것이다. 암에 대해 기재된 바와 유사하게, 공여자-유래 DNA는 다형성 차이, 이식 고형 기관에 대해 더 짧은 크기의 DNA(YW Zheng 등, 2012 Clin Chem; 58: 549-558) 및 조직-특이적 메틸화 프로필을 포함하는 전체 또는 일부 특징적 특성에 대한 검출에 의해 이식 수령자의 혈장 중에서 확인될 수 있다.
H. 크기에 기반한 메틸화의 정규화
전술되고 Lun 등(FMF Lun 등, Clin. Chem. 2013; doi:10.1373/clinchem.2013.212274)에 의해 기재된 바와 같이, 메틸화 밀도(예로, 혈장 DNA의 메틸화 밀도)는 DNA 단편의 크기와 연관된다. 더 짧은 혈장 DNA 단편에 대한 메틸화 밀도의 분포는 더 긴 단편에 비해 유의미하게 더 낮았다. 혈장 DNA의 비정상적 단편화 패턴을 갖는 일부 비-암 상태(예로, 전신 홍반 루푸스(SLE))는 덜 메틸화된 보다 풍부한 짧은 혈장 DNA 단편의 존재로 인해 혈장 DNA의 현저한 저메틸화를 나타낼 수 있음을 제안한다. 다시 말하면, 혈장 DNA의 크기 분포는 혈장 DNA에 있어서 메틸화 밀도에 대한 교란 교인일 수 있다.
도 34a는 SLE 환자 SLE04에서 혈장 DNA의 크기 분포를 나타낸다. 9명의 건강한 대조군 대상자의 크기 분포는 회색 점선으로 나타내며, SLE04에 대한 것은 검은색 실선으로 나타낸다. 짧은 혈장 DNA 단편이 9명의 건강한 대조군 대상자에 비해 SLE04에서 더 풍부하였다. 더 짧은 DNA 단편은 일반적으로 덜 메틸화되므로, 상기 크기 분포 패턴은 혈장 DNA에 대한 메틸화 분석을 교란시킬 수 있고, 보다 명백한 저메틸화로 이어질 수 있다.
일부 구현예에서, 측정된 메틸화 수준을 정규화하여 혈장 DNA 메틸화 분석에 대한 크기 분포의 교란 효과를 감소시킬 수 있다. 예를 들어, 복수의 부위에서의 DNA 분자의 크기가 측정될 수 있다. 다양한 시행에서, 측정은 DNA 분자에 특정 크기(예로 길이)를 제공하거나 또는 단순히 크기가 특정 범위 내에 속하는지를 결정할 수 있고, 이것도 크기에 대응할 수 있다. 이어서 정규화된 메틸화 수준이 컷오프값과 비교될 수 있다. DNA 메틸화 분석에 있어서 크기 분포의 교란 효과를 감소시키기 위해 정규화를 수행하기 위한 몇몇 방식이 존재한다.
하나의 구현예에서, DNA(예로, 혈장 DNA)의 크기 분획화가 수행될 수 있다. 크기 분획화는 유사한 크기의 DNA 단편을 이용하여 컷오프값과 일치하는 방식으로 메틸화 수준을 결정하도록 할 수 있다. 크기 분획화의 일환으로, 제1 크기(예로, 제1 길이 범위)를 갖는 DNA 단편이 선택될 수 있고, 상기 제1 컷오프값은 제1 크기에 대응한다. 정규화는 선택된 DNA 단편만을 이용하여 메틸화 수준을 계산함으로써 달성될 수 있다.
크기 분획화는 다양한 방식, 예로 상이한 크기의 DNA 분자의 물리적 분리에 의해(예로 전기영동 또는 마이크로유체 기반 기술 또는 원심분리 기반 기술에 의해) 또는 컴퓨터내 분석에 의해 달성될 수 있다. 컴퓨터내 분석에 있어서, 하나의 구현예에서 혈장 DNA 분자의 페어-엔드 대량 병렬 서열분석을 수행할 수 있다. 이어서 혈장 DNA 분자의 각각의 두 말단의 위치를 기준 인간 게놈과 비교하여 서열분석된 분자의 크기를 추정할 수 있다. 그 뒤 하나 이상의 크기 선택 기준(예로 특정된 범위 내인 크기 기준)에 매치되는 서열분석된 DNA 분자의 선택에 의해 후속 분석을 수행할 수 있다. 따라서 하나의 구현예에서, 메틸화 밀도가 유사한 크기를 갖는(예로 특정된 범위 내인) 단편에 대해 분석될 수 있다. 컷오프값(예로, 방법 2800의 블록 2840에서)은 동일한 크기 범위 내의 단편에 기반하여 결정될 수 있다. 예를 들어, 메틸화 수준은 암을 갖는 또는 암을 갖지 않는 것으로 알려진 표본에서 결정될 수 있고, 컷오프값은 이들 메틸화 수준으로부터 결정될 수 있다.
다른 구현예에서, 순환 DNA의 메틸화 밀도 및 크기 간 함수 관계가 결정될 수 있다. 함수 관계는 함수의 계수 또는 데이터 지점에 의해 정의될 수 있다. 함수 관계는 상기 각각의 크기에 대응하는 스케일링값을 제공할 수 있다(예로 더 짧은 크기는 메틸화에 대해 대응하는 증가를 가질 수 있다). 다양한 시행에서, 스케일링값은 0 내지 1 또는 1 초과일 수 있다.
평균 크기에 기반하여 정규화가 이루어질 수 있다. 예를 들어, 제1 메틸화 수준을 계산하기 위해 이용되는 DNA 분자에 대응하는 평균 크기가 컴퓨터 연산되고, 상기 제1 메틸화 수준이 대응 스케일링값으로 곱해질 수 있다(즉 평균 크기에 대응됨). 다른 예로서, 각각의 DNA 분자의 메틸화 밀도는 DNA 분자의 크기와 DNA 크기 및 메틸화 간 관계에 따라 정규화될 수 있다.
다른 시행에서, 정규화는 분자 기준 별로 수행될 수 있다. 예를 들어, 특정 부위에서 DNA 분자의 각각의 크기가 수득될 수 있고(예로, 전술된 바와 같이), 각각의 크기에 대응하는 스케일링값이 함수 관계로부터 확인될 수 있다. 비-정규화된 계산에 있어서, 상기 각각의 분자는 부위에서의 메틸화 지수 결정에 있어서 동일하게 카운트될 것이다. 정규화된 계산에 있어서, 메틸화 지수에 대한 분자의 기여는 분자 크기에 대응하는 스케일링 인자에 의해 가중치를 얻을 것이다.
도 34b 및 34c는 SLE 환자 SLE04(도 34b) 및 HCC 환자 TBR36(도 34c)로부터의 혈장 DNA에 대한 메틸화 분석을 나타낸다. 외부 원은 컴퓨터내 크기 분획화 없이 혈장 DNA에 대한 Zmeth 결과를 나타낸다. 내부 원은 130bp 이상의 혈장 DNA에 대한 Zmeth 결과를 나타낸다. SLE 환자 SLE04에 있어서, 84%의 bin이 컴퓨터내 크기 분획화 없이 저메틸화를 나타내었다. 130bp 이상의 단편만 분석된 경우 저메틸화를 나타내는 bin의 백분율이 15%로 감소되었다. HCC 환자 TBR36에 있어서, 98.5% 및 98.6%의 bin이 각각 컴퓨터내 크기 분획화로 또는 이것이 없이 혈장 DNA에 대해 저메틸화를 나타내었다. 이들 결과는 컴퓨터내 크기 분획화가, 예로 SLE 또는 다른 염증 상태 환자에서, 혈장 DNA의 증가된 단편화에 관련된 위양성 저메틸화 결과를 효과적으로 감소시킬 수 있음을 제시한다.
하나의 구현예에서, 크기 분획화를 포함하는 및 이를 포함하지 않는 분석에 대한 결과를 비교하여 메틸화 결과 상에 크기의 임의 교란 효과가 있는지를 나타낼 수 있다. 따라서 정규화에 부가하여 또는 대신에, 특정 크기에서 메틸화 수준의 계산을 이용하여 컷오프값을 초과하는 bin의 백분율이 크기 분획화를 포함하는 및 포함하지 않는 것과 더불어 상이한 경우 위양성 가능성이 있는지 또는 단지 특정 메틸화 수준이 상이한 것인지를 결정할 수 있다. 예를 들어, 크기 분획화를 포함하는 및 포함하지 않는 표본에 대한 결과 간의 유의미한 차이의 존재를 이용하여 비정상적인 단편화 패턴으로 인한 위양성 결과의 가능성을 나타낼 수 있다. 차이가 유의미한지를 결정하기 위한 역치는 암 환자 코호트 및 비-암 대조군 대상자의 코호트 분석을 통해 정립될 수 있다.
I. 혈장 중 게놈에 걸친 CpG 섬 고메틸화에 대한 분석
일반적인 저메틸화에 부가하여, CpG 섬의 고메틸화도 암에서 일반적으로 관찰된다(SB Baylin 등, 2011 Nat Rev Cancer; 11: 726-734; PA Jones 등, 2007, Cell; 128: 683-692; M Esteller 등, 2007 Nat Rev Genet 2007; 8: 286-298; M Ehrlich 등, 2002 Oncogene 2002; 21: 5400-5413). 이 섹션에서는 암의 검출 및 모니터링을 위한 CpG 섬 고메틸화에 대한 게놈에 걸친 분석의 이용을 설명한다.
도 35는 본 발명의 구현예에 따른 CpG 섬의 고메틸화에 기반한 암 수준의 분류 결정 방법 3500의 순서도이다. 방법 2800의 복수의 부위에는 CpG 부위가 포함될 수 있고, 여기서 CpG 부위는 복수의 CpG 섬으로 조직되며, 각각의 CpG 섬은 하나 이상의 CpG 부위를 포함한다. 각각의 CpG 섬에 대한 메틸화 수준을 이용하여 암의 수준 분류를 결정할 수 있다.
블록 3510에서, 분석될 CpG 섬이 확인된다. 상기 분석에서, 예로서 먼저 분석될 CpG 섬 세트를 정의하였고, 이는 건강한 기준 대상자의 혈장 중 상대적으로 낮은 메틸화 밀도를 특징으로 한다. 하나의 측면에서, 기준 군에서의 메틸화 밀도 변동은 암-연관 고메틸화의 검출을 보다 쉽게 허용하기 위해 상대적으로 작을 수 있다. 하나의 구현예에서, CpG 섬은 기준 군에서 제1 백분율보다 작은 평균 메틸화 밀도를 가지며, 기준 군에서 메틸화 밀도에 대한 변동 계수는 제2 백분율보다 작다.
예로서, 예시적 목적으로 다음 기준이 유용한 CpG 섬의 확인을 위해 이용된다:
i. 기준 군(예로 건강한 대상자)에서 CpG 섬에 대한 평균 메틸화 밀도 <5%
ii. 기준 군(예로 건강한 대상자)에서 혈장 중 메틸화 밀도의 분석을 위한 변동 계수 <30%.
이들 파라미터는 특정 용도를 위해 조정될 수 있다. 본 발명자들의 데이터세트로부터, 게놈 중 454개 CpG 섬이 상기 기준을 충족하였다.
블록 3520에서, 각각의 CpG 섬에 대해 메틸화 밀도가 계산된다. 메틸화 밀도는 본원에 기재된 바와 같이 결정될 수 있다.
블록 3530에서, 각각의 CpG 섬이 고메틸화되어 있는지의 여부가 결정된다. 예를 들어 평가 케이스의 CpG 섬 고메틸화에 대한 분석을 위해, 각각의 CpG 섬의 메틸화 밀도가 기준 군의 대응 데이터와 비교되었다. 메틸화 밀도(메틸화 수준의 예)를 하나 이상의 컷오프값과 비교하여 특정 섬이 고메틸화되어 있는지의 여부를 결정할 수 있다.
하나의 구현예에서, 제1 컷오프값은 기준 군에 대한 메틸화 밀도의 평균 + 특정된 백분율에 대응할 수 있다. 다른 컷오프값은 기준 군에 대한 메틸화 밀도의 평균 + 표준 편차의 특정된 수에 대응할 수 있다. 하나의 시행에서, z-스코어(Z meth )가 계산되고 컷오프값과 비교되었다. 예로서, 평가 대상자(예로 암에 대해 스크리닝되는 대상자)에서의 CpG 섬은 이것이 다음 기준을 충족하는 경우, 유의미하게 고메틸화된 것으로 간주되었다:
i. 그 메틸화 밀도가 기준 군의 평균보다 2% 이상 더 높았음, 및
ii. Z meth >3.
이들 파라미터도 특정 용도를 위해 조정될 수 있다.
블록 3540에서, 고메틸화 CpG 섬의 메틸화 밀도(예로, z-스코어로)를 이용하여 누적 스코어를 결정한다. 예를 들어, 모든 유의미하게 고메틸화된 CpG 섬의 확인 후, z-스코어의 합 또는 모든 고메틸화 CpG 섬의 z-스코어의 함수가 수반되는 스코어가 계산될 수 있다. 스코어의 한 예는 다른 섹션에 기재되는 누적 확률(CP) 스코어이다. 누적 확률 스코어는 Z meth 를 이용하여 확률 분포에 따라 우연한 관찰을 가질 확률을 결정한다(예로, 3의 자유도를 갖는 Student t 확률 분포).
블록 3550에서, 누적 스코어를 누적 역치와 비교하여 암의 수준 분류를 결정한다. 예를 들어, 확인된 CpG 섬에서의 총 고메틸화가 충분히 크면, 유기체가 암을 갖는 것으로 확인될 수 있다. 하나의 구현예에서, 누적 역치는 기준 군으로부터의 최고 누적 스코어에 대응한다.
IX. 메틸화 및 CNA
상술된 바와 같이, 본원에 기재된 메틸화 분석 접근은 혈장 중 종양-유래 DNA의 유전적 변화에 기반한 다른 방법과 조합되어 사용될 수 있다. 이러한 방법의 예에는 암-연관 염색체 이상 분석이 포함된다(KCA Chan 등, 2013 Clin Chem; 59: 211-224; RJ Leary 등, 2012 Sci Transl Med; 4: 162ra154). 복제수 이상(CNA)의 측면은 U.S. 특허 출원 번호 13/308,473에 기재된다.
A. CNA
복제수 이상은 게놈의 특정 부분에 정렬하는 DNA 단편을 카운트하고, 카운트를 정규화하고, 카운트를 컷오프값과 비교하여 검출될 수 있다. 다양한 구현예에서, 정규화는 게놈의 동일 부분의 다른 일배체형에 정렬된 DNA 단편(상대 일배체형 용량(RHDO))의 카운트에 의해 또는 게놈의 다른 부분에 정렬된 DNA 단편의 카운트에 의해 수행될 수 있다.
RHDO 방법은 이종접합성 유전자좌의 이용에 의존한다. 본 섹션에 기재된 구현예는 또한 동일한 영역의 두 일배체형이 아지며, 따라서 비-일배체형 특이적인 두 영역을 비교하여 동종접합성인 유전자좌에 대해 이용될 수 있다. 상대 염색체 영역 용량 방법에서, 한 염색체 영역으로부터의 단편의 수(예로, 그 영역에 정렬된 서열 리드의 카운팅에 의해 결정됨)가 예상값(건강한 것으로 알려진 다른 표본에서의 동일한 영역에서 또는 기준 염색체 영역에서 유래될 수 있음)과 비교된다. 이러한 방식으로, 단편은 서열분석된 태그가 유래되는 일배체형과 무관하게 염색체 영역에 대해 카운트될 것이다. 따라서 이종접합성 유전자좌를 함유하지 않는 서열 리드가 여전히 이용될 수 있다. 비교를 수행하기 위해, 하나의 구현예는 비교 전에 태그 카운트를 정규화할 수 있다. 각각의 영역은 적어도 두 유전자좌(서로 분리됨)에 의해 정의되며, 이들 유전자좌에서의 단편을 이용하여 영역에 대한 종합값을 수득할 수 있다.
특정 영역에 대한 서열분석 측정치(태그)에 대한 정규화값은 그 영역에 정렬하는 서열분석 측정치의 수를 전체 게놈에 정렬 가능한 서열분석 측정치의 총 수로 나누어 계산될 수 있다. 상기 정규화된 태그 카운트는 하나의 표본으로부터의 결과가 다른 표본의 결과와 비교될 수 있도록 한다. 예를 들어, 정규화값은 위에 언급된 바와 같이, 특정 영역 유래로 예상되는 서열분석 측정치의 비율(예로, 백분율 또는 분획)일 수 있다. 다른 구현예에서, 정규화를 위해 다른 방법이 가능하다. 예를 들어, 한 영역에 대한 카운트 수를 기준 영역에 대한 카운트 수로 나누어 정규화할 수 있다(상기 경우, 기준 영역은 단지 전체 게놈이다). 이어서 이러한 정규화된 태그 카운트가 역치값에 대해 비교될 수 있고, 이는 암을 나타내지 않는 하나 이상의 기준 표본에서 결정될 수 있다.
그 뒤, 평가된 케이스의 정규화된 태그 카운트는 하나 이상의 기준 대상자, 예로 암이 없는 대상자의 정규화된 태그 카운트와 비교될 것이다. 하나의 구현예에서, 특정 염색체 영역에 대한 케이스의 z-스코어를 계산하여 비교가 수행된다. z-스코어는 다음 식을 이용해서 계산될 수 있다: z-스코어=(케이스의 정규화된 태그 카운트-평균)/SD,
식 중, "평균"은 기준 표본에 대해 특정 염색체 영역에 정렬하는 평균 정규화 태그 카운트이고; SD는 기준 표본에 있어서 특정 영역에 정렬하는 정규화 태그 카운트 수의 표준 편차이다. 따라서 z-스코어는 평가 케이스에 대한 염색체 영역의 정규화 태그 카운트가 하나 이상의 기준 대상자의 동일한 염색체 영역에 대한 평균 정규화 태그 카운트에서 벗어나는 표준 편차의 수이다.
평가 유기체가 암을 갖는 상황에서, 종양 조직에서 증폭된 염색체 영역은 혈장 DNA 중에 상향 제시될 것이다. 이는 양의 값의 z-스코어를 생성할 것이다. 반면, 종양 조직에서 결실된 염색체 영역은 혈장 DNA에서 하향 제시될 것이다. 이는 음의 값의 z-스코어를 생성할 것이다. z-스코어의 크기는 몇몇 요인에 의해 결정된다.
하나의 요인은 생물학적 표본(예로 혈장) 중 종양-유래 DNA의 분획 농도이다. 표본(예로 혈장) 중 종양-유래 DNA의 분획 농도가 높을수록, 평가 케이스 및 기준 케이스의 정규화 태그 카운트 간 차이가 클 것이다. 따라서 더 큰 크기의 z-스코어를 생성할 것이다.
다른 요인은 하나 이상의 기준 케이스에서의 정규화 태그 카운트의 변동이다. 평가 케이스의 생물학적 표본(예로 혈장) 중 염색체 영역의 동일한 정도의 상향 제시에 있어서, 기준 군에서 정규화 태그 카운트의 더 작은 변동(즉, 더 작은 표준 편차)는 더 높은 z-스코어를 생성할 것이다. 유사하게, 평가 케이스의 생물학적 표본(예로 혈장) 중 염색체 영역의 동일한 정도의 하향 제시에 있어서, 기준 군에서 정규화 태그 카운트의 더 작은 표준 편차는 더 음의 z-스코어를 생성할 것이다.
또 다른 요인은 종양 조직에서의 염색체 이상의 크기이다. 염색체 이상의 크기는 특정 염색체 영역에 대한 복제수 변화(획득 또는 손실)를 나타낸다. 종양 조직에서의 복제수 변화가 높을수록, 혈장 DNA에서 특정 염색체 영역의 상향 또는 하향 제시의 정도가 더 높다. 예를 들어, 염색체의 두 사본 모두의 손실은 염색체의 두 사본 중 하나의 손실에 비해 혈장 DNA 중 염색체 영역의 더 큰 하향 제시를 일으킬 것이므로, 이에 따라 더 음의 z-스코어를 생성하였다. 전형적으로, 암에는 여러 염색체 이상이 존재한다. 각각의 암에서의 염색체 이상은 그 성질(즉 증폭 또는 결실), 그 정도(단일 또는 복수의 복제 획득 또는 손실) 및 그 범위(염색체 길이의 관점에서 이상의 크기)에 의해 추가로 변할 수 있다.
정규화 태그 카운트의 측정 정밀도는 분석되는 분자의 수에 의해 영향을 받는다. 분획 농도가 각각 대략 12.5%, 6.3% 및 3.2%인 경우, 하나의 복제 변화(획득 또는 손실)를 갖는 염색체 이상을 검출하기 위해 15,000, 60,000 및 240,000 분자가 분석되어야 할 것으로 예상한다. 상이한 염색체 영역에 대해 암 검출을 위한 태그 카운팅의 추가 상세내용은 Lo 등의 "Diagnosing Fetal Chromosomal Aneuploidy Using Massively Parallel Genomic Sequencing"을 표제로 하는 U.S. 특허 공개 번호 2009/0029377에 기재되며, 그 전문은 본원에 모든 목적에 대해 참조로 도입된다.
구현예는 또한 태그 카운팅 방법 대신에 크기 분석을 이용할 수 있다. 크기 분석은 또한 정규화 태그 카운트 대신에 이용될 수 있다. 크기 분석은 본원 및 U.S. 특허 출원 번호 12/940,992에서 언급된 다양한 파라미터를 이용할 수 있다. 예를 들어, 상기로부터의 Q 또는 F값이 이용될 수 있다. 이러한 크기값은 이들 값이 측정치의 수와 함께 스케일이 변하지 않으므로 다른 영역으로부터의 카운트에 의해 정규화될 필요가 없다. 일배체형-특이적 방법의 기법, 예컨대 상술되고 U.S. 특허 출원 번호 13/308,473에 보다 상세히 기재된 RHDO 방법이 비특이적 방법에 대해서도 이용될 수 있다. 예를 들어, 영역의 깊이 및 정련이 수반되는 기법이 이용될 수 있다. 일부 구현예에서, 두 영역의 비교 시 특정 영역에 대한 GC 바이어스가 고려될 수 있다. RHDO 방법은 동일한 영역을 이용하므로, 이러한 수정이 필요하지 않다.
특정 암은 전형적으로 특정 염색체 영역에서의 이상을 제시하지만, 이러한 암이 항상 이러한 영역에서의 이상을 배타적으로 제시하지는 않는다. 예를 들어, 추가적인 염색체 영역이 이상을 나타낼 수 있고, 이러한 추가적 영역의 위치가 알려지지 않을 수 있다. 또한 암의 초기 단계를 확인하기 위한 환자 스크리닝 시, 다양한 암을 확인하고 싶을 수 있고, 이는 게놈에 걸쳐 존재하는 이상을 나타낼 수 있다. 이러한 상황을 해결하기 위해, 구현예는 어느 영역이 이상을 나타내는지를 결정하기 위한 체계적 방식으로 복수 영역을 분석할 수 있다. 이상의 수 및 이들의 위치(예로 이들이 인접한지 여부)를 이용하여, 예를 들어 이상을 확인하고, 암의 단계를 결정하고, 암의 진단을 제공하고(그 수가 역치값보다 큰 경우), 이상을 나타내는 다양한 영역의 수 및 위치에 기반하여 예후를 제공할 수 있다.
따라서 구현예는 이상을 나타내는 영역의 수에 기반하여 유기체가 암을 갖는지를 확인할 수 있다. 따라서 복수 영역(예로, 3,000)을 평가하여 이상을 나타내는 영역의 수를 확인할 수 있다. 영역은 전체 게놈 또는 게놈의 단지 일부, 예로 비반복 영역을 커버할 수도 있다.
도 36은 본 발명의 구현예에 따른 복수의 염색체 영역을 이용한 유기체의 생물학적 표본의 분석 방법 3600의 순서도이다. 생물학적 표본에는 핵산 분자(단편으로도 불림)가 포함된다.
블록 3610에서, 유기체 게놈의 복수 영역(예로, 비-중복 영역)이 확인된다. 각각의 염색체 영역에는 복수의 유전자좌가 포함된다. 영역은 1Mb 크기일 수도, 또는 일부 다른 동일-크기일 수도 있다. 영역이 1Mb 크기인 상황에 있어서, 전체 게놈은 각각 소정 크기 및 위치의 약 3,000개 영역을 포함할 수 있다. 이러한 소정 영역은 특정 염색체의 길이 이용될 영역의 특정된 수 및 본원에서 언급된 임의의 다른 기준에 맞춰 변할 수 있다. 영역이 상이한 길이를 갖는 경우, 이러한 길이를 이용하여 결과를, 예로 본원에 기재된 바와 같이 정규화할 수 있다. 영역은 평가되는 암의 지식에 기반하여 및/또는 특정 유기체의 특정 요건에 기반하여 구체적으로 선택될 수 있다. 영역은 또한 임의로 선택될 수 있다.
블록 3620에서, 유기체의 기준 게놈 중 핵산 분자의 위치가 각각의 복수의 핵산 분자에 대해 확인된다. 위치는 본원에서 언급된 임의 방식, 예로 분석된 태그를 수득하기 위해 단편을 서열분석하고, 서열분석된 태그를 기준 게놈에 대해 정렬하여 결정될 수 있다. 분자의 특정 일배체형도 일배체형-특이적 방법에 대해 결정될 수 있다.
블록 3630-3650이 각각의 염색체 영역에 대해 수행된다. 블록 3630에서, 각 그룹의 핵산 분자는 확인된 위치에 기반하여 염색체 영역에서 유래된 것으로 확인된다. 각 그룹에는 염색체 영역의 각각의 복수 유전자좌에 위치한 적어도 하나의 핵산 분자가 포함될 수 있다. 하나의 구현예에서, 그룹은, 예로 상기 RHDO 방법에서와 같이 염색체 영역의 특정 일배체형에 정렬하는 단편일 수 있다. 다른 구현예에서, 그룹은 염색체 영역에 정렬하는 임의의 단편일 수 있다.
블록 3640에서, 컴퓨터 시스템은 각 그룹의 핵산 분자의 각각의 값을 계산한다. 각각의 값은 각 그룹의 핵산 분자의 특성을 정의한다. 각각의 값은 본원에 언급된 임의의 값일 수 있다. 예를 들어, 값은 그룹 내 단편의 수 또는 그룹 내 단편의 크기 분포의 통계값일 수 있다. 각각의 값은 또한 정규화값, 예로 기준 영역에 대한 태그 카운트의 수 또는 표본에 대한 태그 카운트의 총 수로 나눈 영역의 태그 카운트일 수 있다. 각각의 값은 또한 다른 값으로부터의 차이 또는 비(예로 RHCO 중)일 수 있고, 이에 따라 영역에 대한 차이 특성을 제공할 수 있다.
블록 3650에서, 각각의 값을 기준값과 비교하여 제1 염색체 영역이 결실 또는 증폭을 나타내는지의 분류를 결정한다. 상기 기준값은 본원에 기재된 임의의 역치 또는 기준값일 수 있다. 예를 들어, 기준값은 정상 표본에 대해 결정된 역치값일 수 있다. RHDO에 있어서, 상기 각각의 값은 두 일배체형에 대한 태그 카운트의 차이 또는 비일 수 있고, 기준값은 통계적으로 유의미한 일탈이 존재하는지를 결정하기 위한 역치일 수 있다. 다른 예로서, 기준값은 다른 일배체형 또는 영역에 대한 태그 카운트 또는 크기값일 수 있고, 비교에는 차이 또는 비(또는 그 함수)를 얻은 뒤 차이 또는 비가 역치값보다 큰지를 결정하는 것이 포함될 수 있다.
기준값은 다른 영역의 결과에 기반하여 변할 수 있다. 예를 들어, 주변 영역도 일탈을 보이는 경우(하나의 역치에 비해 적더라도, 예로 z-스코어 3이더라도), 더 낮은 역치가 이용될 수 있다. 예를 들어, 세 연속 영역이 모두 제1 역치보다 위에 있는 경우, 암의 가능성이 더 높을 수 있다. 따라서 상기 제1 역치는 비연속 영역에서 암을 확인하기 위해 필요한 다른 역치보다 낮을 수 있다. 더 작은 일탈을 갖는 세(또는 넷 이상의) 영역을 갖는 것은 민감성 및 특이성이 보존될 수 있는 충분히 낮은 기회 효과 확률을 가질 수 있다.
블록 3660에서, 결실 또는 증폭을 나타내는 것으로 분류되는 게놈 영역의 양이 결정된다. 카운트되는 염색체 영역은 제한을 가질 수 있다. 예를 들어, 적어도 하나의 다른 영역에 인접한 영역만 카운트될 수 있다(또는 인접 영역이 특정 크기, 예로 4개 이상의 영역이어야 할 수 있다). 영역이 동일하지 않은 구현예에 있어서, 상기 각각의 길이에 대한 수도 고려될 수 있다(예로, 그 수는 이상 영역의 총 길이일 수 있다).
블록 3670에서, 양을 양의 역치값과 비교하여 표본의 분류를 결정한다. 예로서, 분류는 유기체에 암이 있는지의 여부, 암의 단계, 및 암의 예후일 수 있다. 하나의 구현예에서, 모든 이상 영역이 카운트되고 영역이 나타나는 위치와 무관하게 단일 역치값이 이용된다. 다른 구현예에서, 역치값은 카운트되는 영역의 위치 및 크기에 따라 변할 수 있다. 예를 들어, 특정 염색체 또는 염색체 팔 상의 영역의 양은 그 특정 염색체(또는 팔)에 대한 역치와 비교될 수 있다. 다중 역치가 이용될 수 있다. 예를 들어, 특정 염색체(또는 팔)에서 이상 영역의 양은 제1 역치값보다 커야 하며, 게놈에서 이상 영역의 총량은 제2 역치값보다 커야 한다. 역치값은 결실 또는 증폭을 나타내는 것으로 결정되는 영역의 백분율일 수 있다.
영역의 양에 대한 상기 역치값은 또한 카운트되는 영역에 대한 불균형이 얼마나 강력한지에 의존할 수 있다. 예를 들어, 암의 분류 결정을 위한 역치로 이용되는 영역의 양은 각 영역에서 이상을 검출하기 위해 이용되는 특이성 및 민감성(이상 역치)에 의존할 수 있다. 예를 들어, 이상 역치가 낮은 경우(예로 z-스코어 2), 양의 역치는 높게 선택될 수 있다(예로 150). 그러나 이상 역치가 높은 경우(예로, z-스코어 3), 양의 역치는 낮아질 수 있다(예로, 50). 이상을 나타내는 영역의 양은 또한 가중치가 부여된 값일 수 있다, 예로 높은 불균형을 나타내는 하나의 영역이 거의 불균형을 보이지 않는 영역에 비해 더 가중치가 높을 수 있다(즉, 이상에 대해 단지 양 및 음의 분류보다 더 많은 분류가 있다). 예로서, z-스코어의 합이 이용되어 가중치가 부여된 값을 이용할 수 있다.
따라서 정규화 태그 카운트(또는 그룹 특성에 대한 다른 각각의 값)의 유의미한 상향- 또는 하향-제시를 나타내는 염색체 영역의 양(수 및/또는 크기를 포함할 수 있음)이 질환의 중증도를 반영하기 위해 이용될 수 있다. 이상 정규화 태그 카운트를 갖는 염색체 영역의 양은 두 요인, 즉 종양 조직 중 염색체 이상의 수(또는 크기) 및 생물학적 표본(예로 혈장) 중 종양-유래 DNA의 분획 농도에 의해 결정될 수 있다. 보다 진행된 암은 더 많은(그리고 더 큰) 염색체 이상을 보이는 경향이 있다. 따라서 더 많은 암 연관 염색체 이상이 잠재적으로 표본(예로 혈장) 중에서 검출 가능할 것이다. 더 진행된 암 환자에서, 더 높은 종양 부하는 혈장 중 종양-유래 DNA의 더 높은 분획 농도로 이어질 것이다. 그 결과, 종양 연관 염색체 이상이 혈장 표본 중에서 보다 쉽게 검출될 것이다.
특이성을 손상시키지 않고 민감성을 개선하기 위한 하나의 가능한 접근은 인접한 염색체 절편의 결과를 고려하는 것이다. 하나의 구현예에서, z-스코어에 대한 컷오프는 >2 및 <-2로 유지된다. 그러나 염색체 영역은 두 연속 절편이 동일한 유형의 이상을 나타내는 경우에만, 예로 두 절편이 모두 2 초과의 z-스코어를 갖는 경우에만 잠재적으로 이상한 것으로 분류될 것이다. 다른 구현예에서, 주변 절편의 z-스코어가 더 높은 컷오프값을 이용하여 함께 추가될 수 있다. 예를 들어, 세 연속 절편의 z-스코어가 합산될 수 있고 컷오프값 5가 이용될 수 있다. 상기 개념이 넷 이상의 연속 절편으로 확장될 수 있다.
양 및 이상 역치의 조합은 또한 분석의 목적 및 유기체의 임의의 사전 지식(또는 그 부재)에 의존할 수 있다. 예를 들어, 암에 대해 건강한 정상 모집단을 스크리닝하는 경우, 영역이 이상을 갖는 것으로 확인된 경우에 대해 잠재적으로 영역의 양(즉 영역의 수에 대한 높은 역치) 및 이상 역치 모두에서 전형적으로 높은 특이성을 이용할 것이다. 그러나 더 높은 위험을 갖는 환자(예로 종괴 또는 가족력이 있는 환자, 흡연자, 만성 인간 유두종바이러스(HPV) 보균자, 간염 바이러스 보균자 또는 다른 바이러스 보균자)에서, 역치는 더 큰 민감성(더 적은 위음성)을 갖기 위해 낮아질 수 있다.
하나의 구현예에서, 염색체 이상을 검출하기 위해 1-Mb 해상 및 종양-유래 DNA의 더 낮은 검출 하한 6.3%를 이용하는 경우, 각각의 1Mb 절편에서의 분자 수는 60,000이 되어야 할 것이다. 이는 전체 게놈에 대해 대략 1억 8천만 개(60,000측정치/Mb×3,000Mb)의 정렬 가능한 측정치로 환산될 것이다.
더 작은 절편 크기는 더 작은 염색체 이상을 검출하기 위해 더 높은 해상을 제공할 것이다. 그러나 이는 전체적으로 분석될 분자 수의 요건을 증가시킬 것이다. 더 큰 절편 크기는 해상을 소모하며 분석을 위해 필요한 분자 수를 감수시킬 것이다. 따라서 더 큰 이상만 검출될 수 있다. 하나의 시행에서, 더 큰 영역이 이용될 수 있고, 이상을 나타내는 절편이 하위 구분되고 이들 하위 영역이 분석되어 더 우수한 해상을 수득할 수 있다(예로 전술된 바와 같이). 검출될 결실 또는 증폭의 크기(또는 검출할 최소 농도)에 대한 산정치가 있는 경우, 분석할 분자 수가 결정될 수 있다.
B. 바이설파이트-처리 혈장 DNA의 서열분석에 기반한 CNA
게놈에 걸친 저메틸화 및 CNA는 종양 조직에서 빈번히 관찰될 수 있다. 여기서, CNA 및 암 연관 메틸화 변화 정보가 혈장 DNA의 바이설파이트 서열분석에서 동시에 수득될 수 있음을 나타낸다. 두 유형의 분석이 동일한 데이터 세트 상에서 수행될 수 있으므로, 실질적으로 CNA 분석에 대한 추가 비용이 없다. 다른 구현예는 상이한 절차를 이용해서 메틸화 정보 및 유전 정보를 수득할 수 있다. 다른 구현예에서, CNA 분석과 함께 암 연관 고메틸화에 대한 유사 분석을 수행할 수 있다.
도 37a는 환자 TBR36에 대한 종양 조직, 바이설파이트(BS)-비처리 혈장 DNA 및 바이설파이트-처리 혈장 DNA에 대한 CNA 분석(내부에서 외부로)을 나타낸다. 도 37a는 환자 TBR36에 대한 종양 조직, 바이설파이트(BS)-비처리 혈장 DNA 및 바이설파이트-처리 혈장 DNA에 대한 CNA 분석(내부에서 외부로)을 나타낸다. 최외부 고리는 염색체 핵형도를 나타낸다. 각각의 점은 1-Mb 영역의 결과를 나타낸다. 녹색, 빨간색 및 회색 점은 각각 복제수 획득, 복제수 손실을 갖는 영역 및 복제수 변화가 없는 영역을 나타낸다. 혈장 분석을 위해, z-스코어를 나타낸다. 두 동심 선 사이에는 5의 차이가 존재한다. 종양 조직 분석을 위해, 복제수를 나타낸다. 두 동심 선 사이에 하나의 사본 차이가 존재한다. 도 38a는 환자 TBR34에 대한 종양 조직, 바이설파이트(BS)-비처리 혈장 DNA 및 바이설파이트-처리 혈장 DNA에 대한 CNA 분석(내부에서 외부로)을 나타낸다. 바이설파이트-처리 및 바이설파이트-비처리 혈장 표본에서 검출된 CNA 패턴은 일치하였다.
종양 조직, 바이설파이트-비처리 혈장 및 바이설파이트-처리 혈장에서 검출된 CNA 패턴은 일치하였다. 바이설파이트-처리 및 바이설파이트-비처리 혈장 결과 간 일치를 추가 평가하기 위해, 산포 그래프가 정립된다. 도 37b는 환자 TBR36에 대한 1Mb bin의 바이설파이트-처리 및 바이설파이트-비처리 혈장을 이용한 CNA 검출을 위한 z-스코어 간 관계를 나타내는 산포 그래프이다. 두 분석의 z-스코어 간 양의 상관관계가 관찰되었다(r = 0.89, p <0.001, Pearson 상관관계). 도 38b는 환자 TBR34에 대한 1Mb bin의 바이설파이트-처리 및 바이설파이트-비처리 혈장을 이용한 CNA 검출을 위한 z-스코어 간 관계를 나타내는 산포 그래프이다. 두 분석의 z-스코어 간 양의 상관관계가 관찰되었다(r = 0.81, p <0.001, Pearson 상관관계).
C. 암 연관 CNA 및 메틸화 변화의 상승적 분석
전술된 바와 같이, CNA에 대한 분석에는 각각의 1Mb 영역에서 서열 리드의 수의 카운팅이 수반될 수 있는 반면, 메틸화 밀도에 대한 분석에는 CpG 디뉴클레오티드에서 시토신 잔기가 메틸화된 비율의 검출이 수반될 수 있다. 이들 두 분석의 조합은 암 검출을 위해 상승적 정보를 제공할 수 있다. 예를 들어, 메틸화 분류 및 CNA 분류를 이용하여 암 수준의 제3 분류를 결정할 수 있다.
하나의 구현예에서, 암 연관 CNA 또는 메틸화 변화의 존재를 이용하여 암의 잠재적 존재를 나타낼 수 있다. 이러한 구현예에서, 암 검출의 민감성은 CNA 또는 메틸화 변화가 평가된 대상자의 혈장 중에 존재하는 경우 증가될 수 있다. 다른 구현예에서, 두 변화의 존재를 이용하여 암의 존재를 나타낼 수 있다. 이러한 구현예에서, 두 유형의 변화 중 하나가 일부 비-암 대상자에서 잠재적으로 검출될 수 있으므로, 평가의 특이성이 개선될 수 있다. 따라서 제3 분류는 상기 제1 분류 및 제2 분류가 모두 암을 나타내는 경우에만 암에 대해 양성일 수 있다.
26명의 HCC 환자 및 22명의 건강한 대상자가 모집되었다. 혈액 표본이 각 대상자에서 수집되었고, 혈장 DNA가 바이설파이트 처리 후 서열분석되었다. HCC 환자에 있어서, 혈액 표본이 진단 시 수집되었다. 유의미한 양의 CNA의 존재는, 예를 들어 <-3 또는 >3의 z-스코어를 나타내는 bin을 5% 초과로 갖는 것으로 정의되었다. 유의미한 양의 암 연관 저메틸화의 존재는 <-3의 z-스코어를 나타내는 bin을 3% 초과로 갖는 것으로 정의되었다. 예로서, 영역(bin)의 양은 bin의 미가공 카운트, 백분율 및 bin의 길이로 표현될 수 있다.
표 3은 바이설파이트-처리 혈장 DNA 상에서 대량 병렬 서열분석을 이용한 26명의 HCC 환자 혈장 중 유의미한 양의 CNA 및 메틸화 변화의 검출을 나타낸다.
CNA
존재 부재
메틸화 변화 존재 12 6
부재 1 7
암 연관 메틸화 변화 및 CNA의 검출 비율은 각각 69% 및 50%였다. 어느 한 기준의 존재를 이용하여 암의 잠재적 존재를 나타낸 경우, 검출 비율(즉 진단 민감성)은 73%로 개선되었다.
CNA(도 39a) 또는 메틸화 변화(도 39b)의 존재를 나타내는 두 환자의 결과를 나타낸다. 도 39a는 HCC 환자 TBR240에 있어서 바이설파이트-처리 혈장에 대한 CNA(내부 고리) 및 메틸화 분석(외부 고리)을 나타내는 Circos 그래프이다. CNA 분석에 있어서, 녹색, 빨간색 및 회색 점은 각각 염색체 획득, 손실을 갖는 영역 및 복제수 변화가 없는 영역을 나타낸다. 메틸화 분석에 있어서, 녹색, 빨간색 및 회색 점은 각각 고메틸화, 저메틸화 및 정상 메틸화를 갖는 영역을 나타낸다. 상기 환자에서, 암 연관 CNA가 혈장 중에 검출된 반면, 메틸화 분석은 유의미한 양의 암 연관 저메틸화를 드러내지 않았다. 도 39b는 HCC 환자 TBR164에 있어서 바이설파이트-처리 혈장에 대한 CNA(내부 고리) 및 메틸화 분석(외부 고리)을 나타내는 Circos 그래프이다. 상기 환자에서, 암 연관 저메틸화가 혈장에서 검출되었다. 그러나, 유의미한 양의 CNA는 관찰할 수 없었다. CNA 및 메틸화 변화 모두의 존재를 나타내는 두 환자의 결과를 도 48a(TBR36) 및 49a(TBR34)에 나타낸다.
표 4는 바이설파이트-처리 혈장 DNA 상에서 대량 병렬 서열분석을 이용한 22명의 대조군 대상자 혈장 중 유의미한 양의 CNA 및 메틸화 변화의 검출을 나타낸다. 부트스트랩핑(즉 LOO(하나를 남기고 없애는) 접근)이 각각의 대조군 대상자의 평가를 위해 이용되었다. 따라서 특정 대상자가 평가되는 경우, 다른 21명의 대상자가 대조군 그룹의 평균 및 SD 계산을 위해 이용되었다.
CNA
존재 부재
메틸화 변화 존재 1 2
부재 1 18
유의미한 양의 메틸화 변화 및 CNA의 검출 특이성은 각각 86% 및 91%였다. 두 기준 모두의 존재가 암의 잠재적 존재를 나타내기 위해 필요한 경우, 특이성은 95%로 개선되었다.
하나의 구현예에서, CNA 및/또는 저메틸화에 대해 양성인 표본은 암에 대해 양성으로 간주되며, 둘 다 검출 불가능한 경우 표본은 음성으로 간주된다. "또는" 논리의 이용이 더 높은 민감성을 제공한다. 다른 구현예에서, CNA 및 저메틸화 모두에 대해 양성인 표본만 암에 대해 양성으로 간주되어, 더 높은 특이성을 제공한다. 다른 구현예에서, 3층 분류가 이용될 수 있다. 대상자는 i. 둘 다 정상; ii. 하나가 비정상; iii. 둘 다 비정상으로 분류된다.
상이한 추적 전략이 이들 세 분류에 대해 이용될 수 있다.  예를 들어, (iii)에 대한 대상자는, 예로 전신 조영이 수반되는 가장 집중적인 추적 프로토콜을 거칠 수 있고; (ii)에 대한 대상자는, 예로 상대적으로 짧은 수 주의 간격 후 혈장 DNA 서열분석을 반복하는, 덜 집중적인 추적 프로토콜을 거칠 수 있고; (i)에 대한 대상자는, 수 년 후 재평가과 같이 가장 덜 집중적인 추적 프로토콜을 거칠 수 있다. 다른 구현예에서, 메틸화 및 CNA 측정은 분류의 추가 정련을 위해 다른 임상적 파라미터(예로 조영 결과 또는 혈청 생화학)와 함께 이용될 수 있다.
D. 근치 목적 치료 후 혈장 DNA 분석의 예후값
혈장 중 암 연관 CNA 및/또는 메틸화 변화의 존재는 암 환자의 순환 중 종양-유래 DNA의 존재를 시사할 것이다. 이들 암 연관 변화의 감소 또는 제거가 치료(예로 수술) 후 예상될 것이다. 반면, 치료 후 혈장 중 이들 변화의 지속은 신체로부터 모든 종양 세포의 불완전한 제거를 시사할 수 있고, 질환 재발에 대해 유용한 예후 지표일 수 있다.
혈액 표본이 종양의 근치 목적 수술적 절제 1주 후 2명의 HCC 환자 TBR34 및 TBR36에서 수집되었다. CNA 및 메틸화 분석이 바이설파이트-처리 치료-후 혈장 표본에서 수행되었다.
도 40a는 HCC 환자 TBR36에 대한 종양의 수술적 절제 이전(내부 고리) 및 이후(외부 고리)에 수집된 바이설파이트-처리 혈장 DNA 상의 CNA 분석을 나타낸다. 각각의 점은 1-Mb 영역의 결과를 나타낸다. 녹색, 빨간색 및 회색 점은 각각 복제수 획득, 복제수 손실을 갖는 영역 및 복제수 변화가 없는 영역을 나타낸다. 치료 전에 관찰된 대부분의 CNA는 종양 절제 후 사라졌다. <-3 또는 >3의 z-스코어를 나타내는 bin의 비율은 25%에서 6.6%로 감소하였다.
도 40b는 HCC 환자 TBR36에 대한 종양의 수술적 절제 이전(내부 고리) 및 이후(외부 고리)에 수집된 바이설파이트-처리 혈장 DNA 상의 메틸화 분석을 나타낸다. 녹색, 빨간색 및 회색 점은 각각 고메틸화, 저메틸화 및 정상 메틸화를 갖는 영역을 나타낸다. 유의미한 저메틸화를 나타내는 bin의 비율에서 90%에서 7.9%로의 현저한 감소가 있었으며 저메틸화 정도도 현저한 감소를 나타내었다. 상기 환자는 종양 절제 후 22개월에 완전히 임상적으로 완화되었다.
도 41a는 HCC 환자 TBR34에 대한 종양의 수술적 절제 이전(내부 고리) 및 이후(외부 고리)에 수집된 바이설파이트-처리 혈장 DNA 상의 CNA 분석을 나타낸다. CNA를 나타내는 bin의 수 및 종양의 수술적 절제 후 영향받은 bin에서 CNA의 크기 모두에 감소가 존재하지만, 잔여 CNA가 수술 후 혈장 표본에서 관찰될 수 있었다. 빨간색 원은 잔여 CNA가 가장 뚜렷한 영역을 강조한다. <-3 또는 >3의 z-스코어를 나타내는 bin의 비율은 57%에서 12%로 감소하였다.
도 41b는 HCC 환자 TBR34에 대한 종양의 수술적 절제 이전(내부 고리) 및 이후(외부 고리)에 수집된 바이설파이트-처리 혈장 DNA 상의 메틸화 분석을 나타낸다. 저메틸화의 크기는 종양 절제 후 감소하여 저메틸화 bin에 대한 평균 z-스코어는 -7.9에서 -4.0으로 감소하였다. 그러나 <-3의 z-스코어를 갖는 bin의 비율은 반대 변화를 나타내어 41%에서 85%로 증가하였다. 상기 관찰은 치료 후 잔여 암 세포의 존재를 잠재적으로 시사한다. 임상적으로, 종양 절제 후 3개월에 종양 결절의 다중 병터가 잔여 비-절제 간에서 검출되었다. 수술 후 4개월째부터 폐 전이가 관찰되었다. 환자는 수술 8개월 후 국소 재발 및 전이성 질환으로 사망하였다.
이들 두 환자(TBR34 및 TBR36)에서의 관찰은 CNA 및 저메틸화의 잔여 암 연관 변화의 존재가 근치 목적 치료 후 암 환자의 모니터링 및 예진을 위해 이용될 수 있음을 제시한다. 데이터는 또한 검출된 혈장 CNA의 양에서의 변화 정도가 치료 유효성의 예진 및 모니터링을 위한 혈장 DNA 저메틸화의 정도의 변화 정도 평가와 함께 상승 효과를 가지고 이용될 수 있음을 나타내었다.
따라서 일부 구현예에서, 하나의 생물학적 표본은 치료 전에 수득되고 제2의 생물학적 표본은 치료(예로, 수술) 후에 수득된다. 제1값, 예컨대 영역의 z-스코어(예로, 영역 메틸화 수준 및 CNA에 대한 정규화값) 및 저메틸화 및 CNA(예로, 증폭 또는 결실)를 나타내는 영역의 수가 제1 표본에 대해 수득된다. 제2값이 제2 표본에 대해 수득될 수 있다. 다른 구현예에서, 제3, 또는 더 추가적인 표본이 치료 후 수득될 수 있다. 저메틸화 및 CNA(예로, 증폭 또는 결실)를 나타내는 영역의 수가 제3, 또는 더 추가적인 표본에서 수득될 수 있다.
도 40a 및 41a에 대해 전술된 바와 같이, 제1 표본에 대해 저메틸화를 나타내는 영역의 제1 수는 제2 표본에 대한 저메틸화를 나타내는 영역의 제2 양과 비교될 수 있다. 도 40b 및 41b에 대해 전술된 바와 같이, 제1 표본에 대해 저메틸화를 나타내는 영역의 제1 양은 제2 표본에 대해 저메틸화를 나타내는 영역의 제2 양과 비교될 수 있다. 제1 양과 제2 양, 및 제1 수와 제2 수의 비교를 이용하여 치료의 예후를 결정할 수 있다. 다양한 구현예에서, 하나의 비교로만 예후가 결정될 수 있거나 두 비교가 모두 이용될 수 있다. 제3 또는 더 추가적인 표본이 수득되는 구현예에서, 하나 이상의 이들 표본을 이용하여 자체적으로 또는 제2 표본과 함께 치료의 예후를 결정할 수 있다.
하나의 시행에서, 제1 양 및 제2 양 간의 제1 차이가 제1 차이 역치 미만인 경우, 예후가 악화될 것으로 예측된다. 다른 시행에서, 제1 수 및 제2 수 간의 제2 차이가 제2 차이 역치 미만인 경우, 예후가 악화될 것으로 예측된다. 역치는 동일하거나 상이할 수 있다. 하나의 구현예에서, 제1 차이 역치 및 제2 차이 역치는 0이다. 따라서 상기 예에 있어서, 메틸화 값 간의 차이는 환자 TBR34에 대해 더 나쁜 예후를 시사할 것이다.
예후는 제1 차이 및/또는 제2 차이가 동일한 역치 또는 각각의 역치 초과인 경우 더 우수할 수 있다. 예후에 대한 분류는 차이가 역치보다 얼마나 위에 또는 아래에 있는지에 의존할 수 있다. 다중 역치를 이용하여 다양한 분류를 제공할 수 있다. 차이가 클수록 더 우수한 결과를 예측할 수 있고, 차이가 작을수록(심지어 음의 값일수록) 더 나쁜 결과를 예측할 수 있다.
일부 구현예에서, 다양한 표본을 얻는 시점도 주지된다. 이러한 시간적 파라미터로, 양 변화의 역학 또는 비율을 결정할 수 있다. 하나의 구현예에서, 혈장 중 종양 연관 저메틸화의 빠른 감소 및/또는 혈장 중 종양-연관 CNA의 빠른 감소는 우수한 예후를 예측할 것이다. 반대로 혈장 중 종양 연관 저메틸화의 정적이거나 빠른 증가 및/또는 종양-연관 CNA의 정적이거나 빠른 증가는 나쁜 예후를 예측할 것이다. 메틸화 및 CNA 측정은 임상 결과의 예측을 위한 다른 임상적 파라미터(예로 조영 결과 또는 혈청 생화학 또는 단백질 마커)와 함께 이용될 수 있다.
구현예는 혈장 이외에 다른 표본을 이용할 수 있다. 예를 들어, 종양-연관 메틸화 이상(예로 저메틸화) 및/또는 종양-연관 CNA는 암 환자의 혈액 중에 순환하는 종양 세포로부터, 소변, 대변, 침, 가래, 담액, 췌장액, 경부 면봉채취물, 생식관으로부터의(예로 질로부터의) 분비물, 복수, 흉수, 정액, 땀 및 눈물 중 무세포 DNA 또는 종양 세포로부터 측정될 수 있다.
다양한 구현예에서, 종양-연관 메틸화 이상(예로 저메틸화) 및/또는 종양-연관 CNA는 유방암, 폐암, 결직장암, 췌장암, 난소암, 코인두암종, 자궁경부암, 흑색종, 뇌 종양 등의 환자 혈액 또는 혈장에서 검출될 수 있다. 실제로 메틸화 및 유전적 변형, 예컨대 CNA가 암에서 일반적인 현상이므로, 기재된 접근은 모든 암 유형에 대해 이용될 수 있다. 메틸화 및 CNA 측정은 임상 결과의 예측을 위한 다른 임상적 파라미터(예로 조영 결과)와 함께 이용될 수 있다. 구현예는 또한 전-암성 병소, 예로 선암종 환자의 스크리닝 및 모니터링을 위해 이용될 수 있다.
따라서 하나의 구현예에서, 상기 생물학적 표본이 치료 전에 얻어지고, CNA 및 메틸화 측정이 치료 후 반복된다. 측정은 결실 또는 증폭을 나타내는 것으로 결정된 영역의 후속 제1 양을 산출할 수 있고, 각각의 영역 컷오프값을 초과하는 영역 메틸화 값을 갖는 것으로 결정된 영역의 후속 제2 양을 산출할 수 있다. 제1 양이 후속 제1 양과 비교되고, 상기 제2 양이 후속 제2 양과 비교되어 유기체의 예후를 결정할 수 있다.
유기체의 예후를 결정하기 위한 비교에는 제1 양 및 후속 제1 양 간의 제1 차이의 결정이 포함될 수 있고, 상기 제1 차이를 하나 이상의 제1 차이 역치와 비교하여 예후를 결정할 수 있다. 유기체의 예후를 결정하기 위한 비교에는 또한 상기 제2 양 및 후속 제2 양 간의 제2 차이의 결정이 포함될 수 있고, 상기 제2 차이를 하나 이상의 제2 차가 역치와 비교할 수 있다. 역치는 0이거나 다른 수일 수 있다.
예후는 제1 차이가 제1 차이 역치 초과일 때보다 제1 차이가 제1 차이 역치 미만일 때 악화될 것으로 예측될 수 있다. 예후는 제2 차이가 제2 차이 역치 초과일 때보다 제2 차이가 제2 차이 역치 미만일 때 악화될 것으로 예측될 수 있다. 치료의 예에는 면역치료법, 수술, 방사선치료법, 화학치료법, 항체 기반 치료법, 유전자 치료법, 후생적 치료법 또는 표적화 치료법이 포함된다.
E. 성능
이제 상이한 수의 서열 리드 및 bin 크기에 대한 진단 성능이 CNA 및 메틸화 분석에 대해 설명된다.
1. 서열 리드의 수
하나의 구현예에 따르면, 32명의 건강한 대조군 대상자, 26명의 간세포암종 환자 및 코인두암종, 유방암, 폐암, 신경내분비암 및 평활근육종을 포함하는 20명의 다른 유형의 암 환자의 혈장 DNA를 분석하였다. 32명의 건강한 대상자 중 22명이 기준 군으로 무작위 선택되었다. 이들 22명의 기준 개인의 평균 및 표준 편차(SD)가 메틸화 밀도 및 게놈 표시의 정상 범위를 결정하기 위해 이용되었다. 각 개인의 혈장 표본에서 추출된 DNA가 Illumina 페어-엔드 서열분석 키트를 이용한 서열분석 라이브러리 정립을 위해 이용되었다. 이어서 서열분석 라이브러리는 비메틸화 시토신 잔기를 우라실로 전환하는 바이설파이트 처리를 거쳤다. 각 혈장 표본에 대한 바이설파이트 전환 서열분석 라이브러리가 Illumina HiSeq2000 서열분석기 중 하나의 레인을 이용하여 서열분석되었다.
염기 호출 후, 단편 말단 상에서 어댑터 서열 및 저품질 염기(즉 품질 스코어 <5)가 제거되었다. FASTQ 포맷의 가공 측정치를 Methy-Pipe(P Jiang 등, 2010, IEEE International Conference on Bioinformatics and Biomedicine, doi:10.1109/BIBMW.2010.5703866)로 불리는 메틸화 데이터 분석 파이프라인으로 처리하였다. 바이설파이트 전환 서열분석 측정치를 정렬하기 위해, 먼저 기준 인간 게놈(NCBI build 36/hg19)을 이용하여 왓슨 및 크릭 가닥 상에서 각각 모든 시토신 잔기의 티민으로의 컴퓨터내 전환을 수행하였다. 이어서 모든 처리된 측정치에서 각각의 시토신의 티민으로의 컴퓨터내 전환을 수행하고, 각각의 전환 잔기에 대한 위치 정보를 유지하였다. SOAP2를 이용해서 전환 측정치를 2개의 사전 전환된 기준 인간 게놈에 대해 정렬시켰고(R Li 등, 2009 Bioinformatics 25:1966-1967), 각각의 정렬된 측정치에 대해 최대 2개의 미스매치가 허용되었다. 고유한 게놈 위치에 맵핑 가능한 측정치만 하류 분석을 위해 이용되었다. 왓슨 및 크릭 가닥 모두에 맵핑되는 모호한 측정치 및 중복(클론) 측정치가 제거되었다. CpG 디뉴클레오티드 맥락에서의 시토신 잔기가 하류 메틸화 분석을 위해 이용되었다. 정렬 후, 서열분석 측정치 상에 원래 존재하는 시토신이 컴퓨터내 전환 동안 유지된 위치 정보에 기반하여 회수되었다. CpG 디뉴클레오티드 중에서 회수된 시토신은 메틸화된 것으로 스코어링되었다. CpG 디뉴클레오티드 중의 티민은 비메틸화된 것을 스코어링되었다.
메틸화 분석을 위해, 게놈이 동일한 크기의 bin으로 구분되었다. 평가된 bin의 크기에는 50kb, 100kb, 200kb 및 1Mb가 포함된다. 각각의 bin에 대한 메틸화 밀도는 CpG 디뉴클레오티드 맥락에서의 메틸화 시토신 수를 CpG 위치에서 시토신의 총 수로 나누어 계산되었다. 다른 구현예에서, bin 크기는 게놈에 걸쳐 동일하지 않을 수 있다. 하나의 구현예에서, 동일하지 않은 크기의 이러한 bin 중의 각각의 bin이 다중 대상자에 걸쳐 비교된다.
평가 케이스의 혈장 메틸화 밀도가 정상인지를 결정하기 위해, 메틸화 밀도가 기준 군의 결과와 비교되었다. 32명의 건강한 대상자 중 22명이 메틸화 z-스코어(Z meth )의 계산을 위한 기준 군으로 무작위 선택되었다.
식 중, 는 특정 1Mb bin에 대한 평가 케이스의 메틸화 밀도였고; 는 대응 bin에 대한 기준 군의 평균 메틸화 밀도였고; 는 대응 bin에 대한 기준 군의 메틸화 밀도의 SD였다.
CNA 분석을 위해, 각각의 1-Mb bin에 맵핑된 서열분석 측정치의 수가 결정되었다(KCA Chan 등, 2013 Clin Chem 59:211-24). 서열분석 측정치 밀도는 전술된 바와 같은 국소 가중치 부여 산포 그래프 평활화 회귀를 이용하여 GC 바이어스에 대한 수정 후 각각의 bin에 대해 결정되었다(EZ Chen 등, 2011 PLoS One 6: e21791). 혈장 분석을 위해, 평가 케이스의 서열분석 측정치 밀도가 기준 군과 비교되어 CNA z-스코어()가 계산되었다:
식 중, 는 특정 1-Mb bin에 대한 평가 케이스의 서열분석 측정치 밀도였고; 는 대응 bin에 대한 기준 군의 평균 서열분석 측정치 밀도였고; 는 대응 bin에 대한 기준 군의 서열분석 측정치 밀도의 SD였다. bin의 가 <-3 또는 >3인 경우, bin은 CNA를 나타내는 것으로 정의되었다.
케이스 별로 평균 9300만 개(범위: 3900만 내지 1억 4200만 개)의 정렬된 측정치의 평균이 수득되었다. 진단 성능에 대한 서열분석 측정치 수의 감소 효과를 평가하기 위해, 각 케이스로부터 1000만 개의 정렬된 측정치를 무작위 선택하였다. 동일한 세트의 기준 개인이 감소된 서열분석 측정치를 갖는 데이터세트에 대해 각각의 1Mb bin의 기준 범위를 정립하기 위해 이용되었다. 유의미한 저메틸화를 나타내는 bin의 백분율, 즉 Z meth <-3 및 CNA를 갖는 bin의 백분율, 즉 Z CNA <-3 또는 >3이 각각의 케이스에 대해 결정되었다. 수신자 조작 특징(ROC) 곡선을 이용하여 케이스 당 1000만 개 측정치 및 1개 레인으로부터의 모든 서열분석 측정치의 데이터세트에 대해 게놈에 걸친 저메틸화 및 CNA 분석의 진단 성능을 나타내었다. ROC 분석에서, 모든 32명의 건강한 대상자가 분석을 위해 이용되었다.
도 42는 상이한 수의 서열분석 측정치를 갖는 게놈에 걸친 저메틸화 분석의 진단 성능의 다이어그램을 나타낸다. 저메틸화 분석에 있어서, ROC 곡선에 대한 곡선 하 면적은 케이스 당 1000만 개 측정치 및 1개 레인으로부터의 모든 서열분석 측정치를 분석한 두 데이터세트 간에 유의미하게 상이하지 않았다(P=0.761). CNA 분석에 있어서, 1000만 개에 대한 하나의 레인의 데이터를 이용하여 서열분석 측정치의 수가 감소된 경우, 곡선 하 면적의 유의미한 감소를 가지며 진단 성능이 악화되었다(P <0.001).
2. 상이한 bin 크기의 이용 효과
게놈을 1-Mb bin으로 구분하는 것에 부가하여, 더 작은 bin 크기가 이용될 수 있는지도 탐색하였다. 이론적으로 더 작은 bin의 이용은 bin 내의 메틸화 밀도 변동을 잠재적으로 감소시킬 수 있다. 이는 상이한 게놈 영역 간 메틸화 밀도가 크게 변할 수 있기 때문이다. bin이 더 크면, 상이한 메틸화 밀도를 갖는 영역을 포함할 가능성이 증가할 것이고, 이에 따라 bin의 메틸화 밀도 변동의 전체적 증가로 이어질 것이다.
더 작은 bin 크기의 이용이 영역 간 차이에 관련된 메틸화 밀도의 변동을 잠재적으로 감소시킬 수 있지만, 반면에 이는 특정 bin에 맵핑되는 서열분석 측정치의 수를 감소시킬 것이다. 개별 bin에 맵핑되는 측정치의 감소는 샘플링 변동으로 인해 변동성을 증가시킬 것이다. 메틸화 밀도에서 가장 적은 전체적 변동을 줄 수 있는 최적의 bin 크기는 특정 진단 용도의 요건, 예로 이용되는 DNA 서열분석기의 유형 및 표본 별 서열분석 측정치의 총 수에 대해 실험적으로 결정될 수 있다.
도 43은 상이한 bin 크기(50kb, 100kb, 200kb 및 1Mb)를 갖는 게놈에 걸친 저메틸화 분석에 기반하여 암의 검출을 위한 ROC 곡선을 나타내는 다이어그램이다. 나타낸 P값은 1Mb의 bin 크기를 갖는 곡선 하 면적 비교를 위한 것이다. bin크기가 1Mb에서 200kb로 감소된 경우 개선 경향이 나타날 수 있다.
F. 누적 확률 스코어
메틸화 및 CNA에 대한 영역의 양은 다양한 값일 수 있다. 상술된 예는 표본이 암에 연관된 경우 분류를 위한 파라미터로서 유의미한 저메틸화 또는 CNA를 나타낸 이러한 영역의 백분율 또는 컷오프값을 초과하는 영역의 수를 기재하였다. 이러한 접근은 개별 bin에 대한 이상의 크기를 고려하지 않는다. 예를 들어, Z meth -3.5의 bin과 Z meth -30의 bin은 이들이 둘 다 유의미한 저메틸화를 갖는 것으로 분류될 것이므로 동일할 것이다. 그러나 혈장 중 저메틸화의 변화 정도, 즉 Z meth 값의 크기는 표본 중 암 연관 DNA의 양에 의해 영향을 받으며, 이에 따라 종양 부하를 반영하기 위해 이상을 나타내는 bin의 백분율 정보를 보강할 수 있다. 혈장 표본 중 종양 DNA의 분획 농도가 높을수록 더 낮은 메틸화 밀도로 이어질 것이며, 이는 더 낮은 Z meth 값으로 환산될 것이다.
1. 진단 파라미터로서의 누적 확률 스코어
이상의 크기에서 정보를 이용하기 위해, 누적 확률(CP) 스코어로 불리는 접근을 개발한다. 정규 분포 확률 함수에 기반하여, 각각의 Z meth 값이 이러한 관찰을 할 확률으로 환산되었다.
CP 스코어는 다음과 같이 계산되었다:
Z meth <-3인 bin (i)에 대해, CP 스코어 =
식 중, Probi는 3의 자유도를 갖는 스튜던트 t 분포에 따른 bin (i)의 Z met h에 대한 확률이며, log는 자연 로그 함수이다. 다른 구현예에서, 기수가 10(또는 다른 수)인 로그가 이용될 수 있다. 다른 구현예에서, 다른 분포, 예를 들어 비제한적으로 정규 분포 및 감마 분포를 적용하여 z-스코어를 CP로 변환할 수 있다.
더 큰 CP 스코어는 이러한 일탈된 메틸화 밀도를 정상 모집단에서 가질 확률이 더 낮음을 나타낸다. 따라서 높은 CP 스코어는 표본 중 비정상적으로 저메틸화된 DNA, 예로 암 연관 DNA의 존재를 가질 가능성이 더 높음을 나타낼 것이다.
이상을 보이는 bin의 백분율에 비해, CP 스코어 측정은 더 높은 동적 범위를 갖는다. 상이한 환자 간 종양 부하가 크게 변할 수 있으므로, 더 큰 범위의 CP값이 상대적으로 높은 및 상대적으로 낮은 종양 부하를 갖는 환자의 종양 부하를 반영하기 위해 유용할 것이다. 또한, CP 스코어의 이용은 혈장 중 종양-연관 DNA 농도의 변화를 검출하기 위해 잠재적으로 더 민감할 수 있다. 이는 치료 반응의 모니터링 및 예진을 위해 유리하다. 따라서 치료 동안 CP 스코어의 감소는 치료에 대한 우수한 반응을 시사한다. 치료 동안 CP 스코어의 감소 부재 또는 심지어 증가는 불량한 반응 또는 반응의 부재를 시사할 것이다. 예진에 있어서, 높은 CP 스코어는 높은 종양 부하를 시사하며 불량한 예후(예로 더 높은 사망 또는 종양 진행 가능성)를 제시한다.
도 44a는 이상을 갖는 bin의 누적 확률(CP) 및 백분율에 대한 진단 성능을 나타낸다. 두 유형의 진단 알고리즘에 대한 곡선 하 면적 간에는 유의미한 차이가 없었다(P=0.791).
도 44b는 전반적 저메틸화, CpG 섬 고메틸화 및 CNA에 대한 혈장 분석을 위한 진단 성능을 나타낸다. 표본 당 하나의 서열분석 레인에서(The University of California, Santa Cruz(UCSC)에서 호스팅하는 데이터베이스에 따라 정의된 저메틸화 분석에 대한 200kb bin 크기 및 CNA와 CpG 섬에 대한 1Mb bin 크기), 모든 세 유형의 분석에 대한 곡선 하 면적은 0.90 초과였다.
후속 분석에서, 대조군 대상자에서 가장 높은 CP 스코어는 각각의 세 유형의 분석에 대한 컷오프로 이용되었다. 이들 컷오프의 선택은 100%의 진단 특이성을 제공하였다. 일반적 저메틸화, CpG 섬 고메틸화 및 CNA 분석에 대한 진단 민감성은 각각 78%, 89% 및 52%였다. 46명의 암 환자 중 43명에서, 세 유형의 이상 중 적어도 하나가 검출되었고, 이에 따라 93.4%의 민감성 및 100%의 특이성을 제공하였다. 본 발명자들의 결과는 세 유형의 분석이 암 검출을 위해 상승 효과를 가지고 이용될 수 있음을 시사한다.
도 45는 간세포암종 환자에서 전반적 저메틸화, CpG 섬 고메틸화 및 CNA에 대한 결과표를 나타낸다. 세 유형의 분석에 대한 CP 스코어 컷오프값은 각각 960, 2.9 및 211이었다. 양의 CP 스코어 결과에는 진한 글씨로 밑줄을 쳤다.
도 46은 간세포암종 이외의 암 환자에서 전반적 저메틸화, CpG 섬 고메틸화 및 CNA에 대한 결과표를 나타낸다. 세 유형의 분석에 대한 CP 스코어 컷오프값은 각각 960, 2.9 및 211이었다. 양의 CP 스코어 결과에는 진한 글씨로 밑줄을 쳤다.
2. 암 모니터링을 위한 CP 스코어의 적용
치료 이전 및 이후 HCC 환자 TBR34에서 연속 표본이 수집되었다. 표본은 전반적 저메틸화에 대해 분석되었다.
도 47은 케이스 TBR34에 있어서 혈장 메틸화에 대한 연속 분석을 나타낸다. 최내부 고리는 버피 코트(검은색) 및 종양 조직(보라색)의 메틸화 밀도를 나타낸다. 혈장 표본에 있어서, Z meth 를 각각의 1Mb bin에 대해 나타낸다. 두 선 간의 차이는 5의 Z meth 차이를 나타낸다. 빨간색 및 회색 점은 기준 군에 비해 저메틸화된 및 메틸화 밀도 변화를 갖지 않는 bin을 나타낸다. 2번째 내부 고리부터 바깥쪽으로는 각각 치료 이전, 종양 절제 후 3일 및 2개월에 얻은 혈장 표본이다. 치료 전에는 높은 정도의 저메틸화가 혈장에서 관찰될 수 있고, 18.5%를 초과하는 bin이 <-10의 Z meth 를 가졌다. 종양 절제 3일 후에는 저메틸화 정도가 혈장에서 감소된 것이 관찰될 수 있고, 어느 bin도 <-10의 Z meth 를 갖지 않았다.
케이스 번호 시점 메틸화 분석
유의미한 저메틸화를 나타내는 bin의 백분율 누적 확률(CP) 스코어 합산 z-스코어
TBR34 OT 전 62.6% 37,573 14,285
OT 후 3일 80.5% 17,777 9,195
OT 후 2개월 40.1% 15,087 5,201
표 5는 저메틸화 변화 크기가 종양의 수술적 절제 3일 후에 감소됨에도 불구하고, 이상을 나타내는 bin의 백분율은 역설적 증가를 나타내었음을 나타낸다. 반면, CP 스코어는 혈장 중 저메틸화 정도의 감소를 더 정확히 드러내었고, 종양 부하의 변화를 더 반영할 수 있다.
OT 2개월 후에는 유의미한 백분율의 bin이 여전히 저메틸화 변화를 나타내었다. CP 스코어도 대략 15,000으로 안정되게 유지되었다. 상기 환자는 이후 3개월째에 잔여 비절제 간에서 다병터성 종양 침적물(이전 수술 시에는 알지 못했음)을 갖는 것으로 진단되었고, 수술 4개월 후에 다중 폐 전이를 갖는 것이 주지되었다. 환자는 수술 8개월 후 전이성 질환으로 사망하였다. 이들 결과는 CP 스코어가 종양 부하의 반영을 위해 이상을 갖는 bin의 백분율보다 더 강력할 수 있음을 제시하였다.
전체적으로, CP는 혈장 중 종양 DNA의 양 측정을 필요로 하는 용도를 위해 유용할 수 있다. 이러한 용도의 예에는 암 환자의 예진 및 모니터링(예로 치료에 대한 반응을 관찰하기 위한, 또는 종양 진행을 관찰하기 위한)이 포함된다.
합산 z-스코어는 z-스코어의 직접적인, 즉 확률으로의 전환이 없는 합이다. 상기 예에서, 합산 z-스코어는 CP 스코어와 동일한 거동을 나타낸다. 다른 예에서, CP는 CP 스코어에 대한 더 큰 동적 범위로 인해 잔여 질환의 모니터링을 위해 합산 z-스코어보다 더 민감할 수 있다.
X. 메틸화에 대한 CNA 영향
분류가 조합되어 제3 분류를 제공하는, 암 수준에 대해 각각의 분류를 결정하기 위한 CNA 및 메틸화의 이용이 전술되었다. 이러한 조합에 부가하여, CNA를 이용하여 메틸화 분석을 위한 컷오프값을 변경하고 상이한 CNA 특징을 갖는 영역 그룹에 대해 메틸화 수준을 비교하여 위양성을 확인할 수 있다. 예를 들어, 초과-존재에 대한 메틸화 수준(예로, ZCNA >3)이 정상 존재에 대한 메틸화 수준(예로, -3< ZCNA <3)과 비교될 수 있다. 먼저, 메틸화 수준에 대한 CNA의 영향이 설명된다.
A. 염색체 획득 및 손실을 갖는 영역에서의 메틸화 밀도 변경
종양 조직은 일반적으로 전체적인 저메틸화를 나타내므로, 암 환자의 혈장 중 종양-유래 DNA의 존재는 비-암 대상자와 비교되는 경우, 메틸화 밀도 감소로 이어질 것이다. 암 환자의 혈장 중 저메틸화 정도는 이론적으로 혈장 표본 중 종양-유래 DNA의 분획 농도와 비례한다.
종양 조직 중 염색체 획득을 나타내는 영역에 있어서, 종양 DNA의 추가 용량이 증폭된 DNA 절편에서 혈장 내로 배출될 것이다. 종양 DNA의 혈장에 대한 상기 증가된 기여는 이론적으로 영향을 받는 영역에 대해 혈장 DNA 중 더 높은 정도의 저메틸화로 이어질 것이다. 추가 요인은 증폭을 나타내는 게놈 영역이 종양 세포에 성장 이점을 부여하는 것이 예상될 것이며, 이에 따라 발현될 것으로 예상된다는 것이다. 이러한 영역은 일반적으로 저메틸화된다.
대조적으로, 종양 조직 중 염색체 손실을 보이는 영역에 있어서, 종양 DNA의 혈장에 대한 감소된 기여는 복제수 변화가 없는 영역에 비해 더 낮은 정도의 저메틸화로 이어질 것이다. 추가 요인은 종양 세포에서 결실된 게놈 영역이 종양 억제인자 유전자를 함유할 수 있고, 이러한 영역이 침묵화된 것이 종양 세포에 유리할 수 있다는 것이다. 따라서 이러한 영역은 더 높은 고메틸화 가능성을 가질 것으로 예상된다.
여기서, 상기 효과를 나타내기 위해 두 HCC 환자(TBR34 및 TBR36)의 결과를 이용한다. 도 48a(TBR36) 및 49a(TBR34)는 염색체 획득 또는 손실을 갖는 영역을 강조하는 원 및 대응하는 메틸화 분석을 나타낸다. 도 48b 및 49b는 환자 TBR36 및 TBR34에 대해 각각 손실, 정상 및 획득에 대한 메틸화 z-스코어 그래프를 나타낸다.
도 48a는 HCC 환자 TBR36에 대해 바이설파이트-처리 혈장 DNA 중 CNA(내부 고리) 및 메틸화 변화(외부 고리)를 나타내는 Circos 그래프를 나타낸다. 빨간색 원은 염색체 획득 또는 손실을 갖는 영역을 강조한다. 염색체 획득을 나타내는 영역은 복제수 변화가 없는 영역에 비해 더 저메틸화되었다. 염색체 손실을 나타내는 영역은 복제수 변화가 없는 영역에 비해 덜 저메틸화되었다. 도 48b는 HCC 환자 TBR36에 대해 염색체 획득 및 손실을 갖는 영역, 및 복제수 변화가 없는 영역에 대한 메틸화 z-스코어 그래프이다. 복제수 변화가 없는 영역에 비해, 염색체 획득을 갖는 영역은 더 큰 음의 z-스코어를 가졌고(더 저메틸화됨) 염색체 손실을 갖는 영역은 더 작은 음의 z-스코어를 가졌다(덜 저메틸화됨).
도 49a는 HCC 환자 TBR34에 대해 바이설파이트-처리 혈장 DNA 중 CNA(내부 고리) 및 메틸화 변화(외부 고리)를 나타내는 Circos 그래프를 나타낸다. 도 49b는 HCC 환자 TBR34에 대해 염색체 획득 및 손실을 갖는 영역, 및 복제수 변화가 없는 영역에 대한 메틸화 z-스코어 그래프이다. 환자 TBR36에서의 종양-유래 DNA의 분획 농도가 더 높았으므로, 염색체 획득 및 손실을 갖는 영역 간 메틸화 밀도 차이는 환자 TBR36가 환자 TBR34에서보다 더 컸다.
상기 예에서, CNA를 결정하기 위해 이용된 영역은 메틸화를 결정하기 위해 이용된 영역과 동일하다. 하나의 구현예에서, 각각의 영역 컷오프값은 각각의 영역이 결실 또는 증폭을 나타내는지에 의존한다. 하나의 시행에서, 각각의 영역 컷오프값(예로, 저메틸화를 결정하기 위해 이용된 z-스코어 컷오프)은 증폭이 나타나지 않는 경우에 비해 각 영역이 증폭을 나타내는 경우 더 큰 크기를 가졌다(예로, 크기는 3 초과일 수 있고, -3 미만의 컷오프가 이용될 수 있다). 따라서 저메틸화를 평가하기 위해, 증폭이 나타나지 않는 경우에 비해 각 영역이 증폭을 나타내는 경우 각각의 영역 컷오프값이 더 큰 음의 값을 가질 수 있다. 이러한 시행은 암을 검출하기 위한 평가의 특이성을 개선할 것으로 예상된다.
다른 시행에서, 결실이 나타나지 않는 경우에 비해 각 영역이 결실을 나타내는 경우 각각의 영역 컷오프값은 더 작은 크기(예로, 3 미만)를 갖는다. 따라서 저메틸화를 평가하기 위해, 결실이 나타나지 않는 경우에 비해 각 영역이 결실을 나타내는 경우 각각의 영역 컷오프값은 더 작은 음의 값을 가질 수 있다. 이러한 시행은 암을 검출하기 위한 평가의 민감성을 개선할 것으로 예상된다. 상기 시행에서 컷오프값의 조정은 특히 진단 시나리오를 위해 원하는 민감성 및 특이성에 따라 변할 수 있다. 다른 구현예에서, 메틸화 및 CNA 측정은 암을 예측하기 위한 다른 임상적 파라미터(예로 조영 결과 또는 혈청 생화학)와 함께 이용될 수 있다.
B. 영역을 선택하기 위한 CNA의 이용
전술된 바와 같이, 혈장 메틸화 밀도가 종양 조직 중 복제수 이상을 갖는 영역에서 변경될 것임을 나타내었다. 종양 조직 중 복제수 획득을 갖는 영역에서, 저메틸화된 종양 DNA의 혈장에 대한 증가된 기여는 복제수 이상이 없는 영역에 비해 혈장 DNA의 더 큰 정도의 저메틸화로 이어질 것이다. 반대로 종양 조직 중 복제수 손실을 갖는 영역에서, 저메틸화된 종양 DNA의 혈장에 대한 감소된 기여는 혈장 DNA의 더 작은 정도의 저메틸화로 이어질 것이다. 혈장 DNA의 메틸화 밀도 및 상대적 제시 간의 이러한 관계는 혈장 DNA 중 암 연관 DNA 및 다른 비-암성 요인(예로, SLE)의 저메틸화의 존재와 연관된 저메틸화 결과를 구별하기 위해 잠재적으로 이용될 수 있다.
상기 접근을 예시하기 위해, 2명의 간세포암종(HCC) 환자 및 2명의 암이 없는 SLE 환자의 혈장 표본을 분석하였다. 이들 두 SLE 환자(SLE04 및 SLE10)는 혈장 중 뚜렷한 저메틸화 및 CNA의 존재를 나타내었다. 환자 SLE04에 있어서, 84%의 bin이 저메틸화를 나타내었고 11.2%의 bin이 CNA를 나타내었다. 환자 SLE10에 있어서, 10.3%의 bin이 저메틸화를 나타내었고 5.7%의 bin이 CNA를 나타내었다.
도 50a 및 50b는 SLE 환자 SLE04 및 SLE10에 대한 혈장 저메틸화 및 CNA 분석 결과를 나타낸다. 외부의 원은 1Mb 해상에서의 메틸화 z-스코어(Zmeth)를 나타낸다. 메틸화 Zmeth <-3인 bin은 빨간색이었고 Zmeth >-3인 bin은 회색이었다. 내부의 원은 CNA z-스코어(ZCNA)를 나타낸다. 녹색, 빨간색 및 회색 점은 각각 ZCNA >3, <3 및 -3 내지 3인 bin을 나타낸다. 이들 두 SLE 환자에서, 저메틸화 및 CNA 변화가 혈장 중에서 관찰되었다.
메틸화의 변화 및 CNA가 혈장 중 암-유래 DNA의 존재와 일치하는지를 결정하기 위해, ZCNA >3, <-3 및 -3 내지 3인 영역에 대해 Zmeth를 비교하였다. 혈장 중 암-유래 DNA가 기여하는 메틸화 변화 및 CNA에 있어서, ZCNA <-3인 영역은 덜 저메틸화되고 더 작은 음의 Zmeth를 가질 것으로 예상될 것이다. 대조적으로 ZCNA >3인 영역은 더 메틸화되고 더 큰 음의 Zmeth를 가질 것으로 예상될 것이다. 예시적 목적으로, 1측 순위 합산 평가를 적용하여 CNA를 갖는 영역(즉 ZCNA <-3 또는 >3인 영역)에 대한 Zmeth를 CNA를 갖지 않는 영역(즉 ZCNA -3 내지 3인 영역)에 대한 Zmeth와 비교하였다. 다른 구현예에서, 다른 통계학적 평가, 예를 들어 비제한적으로 스튜던트 t-테스트, 분산 분석(ANOVA) 테스트 및 크루스칼-왈리스(Kruskal-Wallis) 테스트가 이용될 수 있다.
도 51a 및 51b는 두 HCC 환자(TBR34 및 TBR36)의 혈장에 대해 CNA를 갖는 및 갖지 않는 영역에 대한 Zmeth 분석을 나타낸다. ZCNA <-3 및 >3인 영역은 각각 혈장 중 하향- 또는 상향-제시를 갖는 영역을 나타낸다. TBR34 및 TBR36 모두에서, 혈장 중 하향 제시된 영역(즉 ZCNA <-3인 영역)은 혈장 중 정상 제시(normal represetation)되는 영역(즉 ZCNA -3 내지 3인 영역)에 비해 유의미하게 더 높은 Zmeth를 가졌다(P-값 <10-5, 1측 순위 합산 평가). 정상 제시는 정배수체 게놈에 대해 예상되는 것에 대응한다. 혈장 중 상향 제시되는 영역(즉 ZCNA >3인 영역)에 있어서, 이들은 혈장 중 정상 제시되는 영역에 비해 유의미하게 더 낮은 Zmeth를 가졌다(P-값 <10-5, 1측 순위 합산 평가). 이들 모든 변화는 혈장 표본 중 저메틸화 종양 DNA의 존재와 일치하였다.
도 51c 및 51d는 두 SLE 환자(SLE04 및 SLE10)의 혈장에 대해 CNA를 갖는 및 갖지 않는 영역에 대한 Zmeth 분석을 나타낸다. ZCNA <-3 및 >3인 영역은 각각 혈장 중 하향- 또는 상향-제시를 갖는 영역을 나타낸다. SLE04에 있어서, 혈장 중 하향 제시된 영역(즉 ZCNA <-3인 영역)은 혈장 중 정상 제시되는 영역(즉 ZCNA -3 내지 3의 영역)에 비해 유의미하게 더 높은 Zmeth를 갖지 않았고(P-값=0.99, 1측 순위 합산 평가), 혈장 중 상향 제시된 영역(즉 ZCNA >3인 영역)은 혈장 중 정상 제시되는 영역에 비해 유의미하게 더 높은 Zmeth를 갖지 않았다(P-값=0.68, 1측 순위 합산 평가). 이들 결과는 혈장 중 종양-유래 저메틸화 DNA의 존재로 인해 예상되는 변화와 상이하였다. 유사하게 SLE10에 있어서, ZCNA <-3인 영역은 ZCNA -3 내지 3인 영역에 비해 유의미하게 더 높은 Zmeth를 갖지 않았다(P-값=0.99, 1측 순위 합산 평가).
SLE 환자에서 Zmeth ZCNA 간 전형적인 암 연관 패턴을 갖지 않는 이유는, SLE 환자에서 CNA가 저메틸화를 또한 나타내는 특정 세포 유형을 제시하지 않는데 있다. 그 대신, 관찰되는 CNA 및 저메틸화의 뚜렷한 존재는 SLE 환자에서 순환 DNA의 변형된 크기 분포에 기인한다. 기준이 건강한 대상자에서 유래되므로, 변형된 크기 분포는 상이한 게놈 영역에 대한 서열분석 측정치 밀도를 잠재적으로 변형하여 뚜렷한 CNA로 이어질 수 있다. 이전 섹션에서 기재된 바와 같이, 순환 DNA 단편의 크기 및 그 메틸화 밀도 간에는 상관관계가 존재한다. 따라서 변형된 크기 분포도 이상 메틸화로 이어질 수 있다.
ZCNA >3인 영역이 ZCNA -3 내지 3인 영역보다 약간 더 낮은 메틸화 수준을 가졌지만, 비교를 위한 p-값은 두 명의 암 환자에서 관찰된 것에 비해 훨씬 더 높았다. 하나의 구현예에서, p-값은 평가 케이스가 암을 가질 가능성을 결정하기 위한 파라미터로 이용될 수 있다. 다른 구현예에서, 정상 및 이상 제시를 갖는 영역 간 Zmeth 차이는 암의 존재 가능성을 시사하기 위한 파라미터로 이용될 수 있다. 하나의 구현예에서, 암 환자 그룹을 이용하여 평가되는 혈장 표본 중 암-유래 저메틸화 DNA의 존재와 변화가 일치함을 나타내기 위해 Zmeth 및 ZCNA 간 상관관계를 정립하고 차등적 파라미터에 대한 역치를 결정할 수 있다.
따라서 하나의 구현예에서, CNA 분석을 수행하여 모두 결실, 증폭, 또는 정상 제시 중 하나를 나타내는 제1 영역 세트를 결정할 수 있다. 예를 들어, 제1 영역 세트는 모두 결실을 나타내거나, 또는 모두 증폭을 나타내거나, 또는 모두 정상 제시를 나타낼 수 있다(예로, 정상인 영역의 제1 양, 예컨대 정상 Zmeth를 가짐). 메틸화 수준이 상기 제1 영역 세트에 대해 결정될 수 있다(예로, 방법 2800의 제1 메틸화 수준이 제1 영역 세트에 대응할 수 있다).
CNA 분석은 모두 두 번째로 결실, 증폭, 또는 정상 제시를 나타내는 제2 영역 세트를 결정할 수 있다. 제2 영역 세트는 제1 세트와는 상이하게 나타날 것이다. 예를 들어, 제1 영역 세트가 정상인 경우, 제2 영역 세트는 결실 또는 증폭을 나타낼 수 있다. 제2 메틸화 수준은 상기 제2 영역 세트의 부위에서 메틸화되어 있는 DNA 분자의 각각의 수에 기반하여 계산될 수 있다.
이어서 파라미터는 제1 메틸화 수준 및 제2 메틸화 간에 컴퓨터로 연산될 수 있다. 예를 들어, 차이 또는 비가 컴퓨터로 연산되고 컷오프값과 비교될 수 있다. 차이 또는 비는 또한 값을 수득할 가능성을 결정하기 위해 확률 분포(예로 통계 평가의 일환으로)를 거칠 수 있고, 상기 확률을 컷오프값과 비교하여 메틸화 수준에 기반하여 암의 수준을 결정할 수 있다. 이러한 컷오프는 암을 갖는 표본 및 암을 갖지 않는 표본(예로 SLE)을 구별하기 위해 선택될 수 있다.
하나의 구현예에서, 메틸화 수준은 제1 영역 세트 또는 영역 혼합(즉 증폭, 결실, 및 정상을 나타내는 영역의 혼합)에 대해 결정될 수 있다. 이어서 상기 메틸화 수준이 분석의 제1 단계의 일환으로 제1 컷오프와 비교될 수 있다. 컷오프를 초과하고, 이에 따라 암의 가능성을 시사하는 경우, 위의 분석을 수행하여 그 시사가 위양성인지 여부를 결정할 수 있다. 따라서 암의 수준에 대한 최종 분류에는 두 메틸화 수준에 대한 파라미터와 제2 컷오프의 비교가 포함될 수 있다.
제1 메틸화 수준은 제1 영역 세트의 각 영역에 대해 계산된 영역 메틸화 수준의 통계값(예로, 평균 또는 중앙값)일 수 있다. 제2 메틸화 수준은 또한 제2 영역 세트의 각 영역에 대해 계산된 영역 메틸화 수준의 통계값일 수 있다. 예로서, 통계값은 1측 순위 합산 평가, 스튜던트 t-테스트, 분산 분석(ANOVA) 테스트, 또는 크루스칼-왈리스(Kruskal-Wallis) 테스트를 이용해서 결정될 수 있다.
XI. 암 유형 분류
유기체가 암을 갖는지의 여부를 결정하는 것에 부가하여, 구현예는 표본과 연관된 암의 유형을 확인할 수 있다. 상기 암 유형의 확인은 전반적 저메틸화, CpG 섬 고메틸화, 및/또는 CNA의 패턴을 이용할 수 있다. 패턴에는 측정된 영역 메틸화 수준, 영역에 대한 각각의 CNA값, 및 CpG 섬에 대한 메틸화 수준을 이용하여 알려진 공지 진단으로 환자를 클러스터링하는 것이 수반될 수 있다. 아래 결과는 유사한 유형의 암을 갖는 유기체가 영역 및 CpG 섬에 대해 유사한 값을 가질 뿐만 아니라 비-암 환자도 유사한 값을 가짐을 나타낸다. 클러스터링에서, 영역 또는 섬에 대한 각각의 값은 클러스터링 절차에서 별개의 차원일 수 있다.
동일한 유형의 암이 유사한 유전적 및 후생적 변화를 공유할 것임이 알려졌다(E Gebhart 등, 2004 CytoGenet Genome Res; 104: 352-358; PA Jones 등, 2007 Cell; 128: 683-692). 아래에서는, 혈장 중에 검출된 CNA 및 메틸화 변화의 패턴이 암의 기원 또는 유형의 도출을 위해 어떻게 유용한지를 설명한다. HCC 환자, 비-HCC 환자 및 건강한 대조군 대상자로부터의 혈장 DNA 표본이, 예를 들어 계층 클러스터링 분석을 이용하여 분류되었다. 분석은, 예를 들어 R script 패키지(cran.r-project.org/web/packages/gplots/gplots.pdf)의 heatmap.2 기능을 이용하여 수행되었다.
상기 접근의 가능성을 예시하기 위해, 혈장 표본의 분류를 위한 유용한 특성을 확인하기 위한 예로 2개 세트의 기준(A군 및 B군)을 이용하였다(표 6 참고). 다른 구현예에서, 다른 기준이 특성 확인을 위해 이용될 수 있다. 이용된 특성에는 1Mb 해상에서의 전반적 CNA, 1Mb 해상에서의 전반적 메틸화 밀도 및 CpG 섬 메틸화가 포함되었다.
처음 두 예에서, 분류를 위해 CNA, 1Mb 해상에서의 전반적 메틸화 및 CpG 섬 메틸화 특성을 모두 이용하였다. 다른 구현예에서, 다른 기준, 예를 들어 비제한적으로 기준 군의 혈장 중 특성 측정의 정밀도가 이용될 수 있다.
도 52a는 355 CNA, 1Mb 해상에서의 584 전반적 메틸화 특성 및 110 CpG 섬의 메틸화 상태를 포함하는 1,130의 모든 A군 특성을 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자로부터의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다. 상부측 컬러 막대는 표본군을 나타낸다: 녹색, 파란색 및 빨간색은 각각 건강한 대상자, HCC 및 비-HCC 암 환자를 나타낸다. 일반적으로 세 군의 대상자는 함께 클러스터되는 경향을 보였다. 세로축은 분류 특성을 나타낸다. 상이한 대상자에 걸쳐 유사한 패턴을 갖는 특성이 함께 클러스터링되었다. 이들 결과는 CpG 섬 메틸화 변화, 1Mb 해상에서의 게놈에 걸친 메틸화 변화 및 혈장 중 CNA의 패턴이 일차 원인을 알지 못하는 환자에서 암의 기원을 결정하기 위해 잠재적으로 이용될 수 있음을 제시한다.
도 52b는 759 CNA, 1Mb 해상에서의 1,911 전반적 메틸화 특성 및 191 CpG 섬의 메틸화 상태를 포함하는 2,780의 모든 B군 특성을 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자로부터의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다. 상부측 컬러 막대는 표본군을 나타낸다: 녹색, 파란색 및 빨간색은 각각 건강한 대상자, HCC 및 비-HCC 암 환자를 나타낸다. 일반적으로 세 군의 대상자는 함께 클러스터되는 경향을 보였다. 세로축은 분류 특성을 나타낸다. 상이한 대상자에 걸쳐 유사한 패턴을 갖는 특성이 함께 클러스터링되었다. 이들 결과는 CpG 섬 메틸화 변화, 1Mb 해상에서의 게놈에 걸친 메틸화 변화 및 혈장 중 CNA의 패턴이 일차 원인을 알지 못하는 환자에서 암의 기원을 결정하기 위해 이용될 수 있음을 제시한다. 분류 특성의 선택은 구체적 용도를 위해 조정될 수 있다. 또한, 상이한 유형의 암에 대한 대상자의 이전 확률에 따라 암 유형 예측에 가중치가 주어질 수 있다. 예를 들어, 만성 바이러스성 간염 환자는 간세포암종이 발생하기 쉽고, 만성 흡연자는 폐암이 발생하기 쉽다. 따라서 가중치가 부여된 암 유형의 확률이, 예를 들어 비제한적으로 논리적, 다중 또는 클러스터링 회귀를 이용하여 계산될 수 있다.
다른 구현예에서, 단일 유형의 특성이 분류 분석을 위해 이용될 수 있다. 예를 들어 하기 예에서, 1Mb 해상에서의 전반적 메틸화, CpG 섬 고메틸화 또는 1Mb 해상에서의 CNA만 계층 클러스터링 분석을 위해 이용되었다. 상이한 특성이 이용되는 경우 구별력이 상이할 수 있다. 분류 특성의 추가 정련이 분류 정확성을 잠재적으로 개선할 수 있다.
도 53a는 A군의 CpG 섬 메틸화 특성을 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자로부터의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다. 일반적으로, 암 환자가 함께 클러스터링되었고 비-암 대상자는 다른 클러스터에 있었다. 그러나 HCC 및 비-HCC 환자는 모든 세 유형의 특성에 비해 덜 분리되었다.
도 53b는 분류 특성으로 1Mb 해상에서의 A군의 전반적 메틸화 밀도를 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자로부터의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다. HCC 및 비-HCC 환자의 우선적 클러스터링이 관찰되었다.
도 54a는 분류 특성으로 1Mb 해상에서의 A군의 전반적 CNA를 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자로부터의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다. HCC 및 비-HCC 환자의 우선적 클러스터링이 나타났다.
도 54b는 분류 특성으로 B군의 CpG 섬 메틸화 밀도를 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자로부터의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다. HCC 및 비-HCC 암 환자의 우선적 클러스터링이 관찰될 수 있었다.
도 55a는 분류 특성으로 1Mb 해상에서의 B군의 전반적 메틸화 밀도를 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자로부터의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다. HCC 및 비-HCC 암 환자의 우선적 클러스터링이 관찰될 수 있었다.
도 55b는 분류 특성으로 1Mb 해상에서의 B군의 전반적 CNA를 이용한 HCC 환자, 비-HCC 암 환자 및 건강한 대조군 대상자로부터의 혈장 표본에 대한 계층 클러스터링 분석을 나타낸다. HCC 및 비-HCC 암 환자의 우선적 클러스터링이 관찰될 수 있었다.
혈장 표본에 대한 이들 계층 클러스터링 결과는 상이한 특성의 조합이 일차 암 유형의 확인을 위해 잠재적으로 이용될 수 있음을 제시한다. 선택 기준의 추가 정련은 분류의 정확성을 잠재적으로 추가 개선할 수 있다.
따라서 하나의 구현예에서, 메틸화 분류가 상기 유기체에 있어 암이 존재함을 시사하는 경우, 유기체에 연관된 암의 유형은 메틸화 수준(예로 방법 2800로부터의 제1 메틸화 또는 임의 영역의 메틸화 수준)을 다른 유기체(즉 동일한 유형, 예컨대 인간의 다른 유기체)로부터 결정된 대응값과 비교하여 확인될 수 있다. 대응값은 메틸화 수준이 계산되는 동일한 영역 또는 부위 세트에 대한 것일 수 있다. 적어도 두 명의 다른 유기체가 상이한 유형의 암을 갖는 것으로 확인된다. 예를 들어, 대응값은 클러스터로 조직될 수 있고, 여기서 클러스터 중 2 개는 상이한 암에 연관된다.
또한 CNA 및 메틸화가 암 수준의 제3 분류를 수득하기 위해 함께 이용되는 경우, CNA 및 메틸화 특성은 다른 유기체로부터의 대응값과 비교될 수 있다. 예를 들어, 결실 또는 증폭을 나타내는 영역의 제1 양(예로, 도 36의)을 다른 유기체로부터 결정된 대응값과 비교하여 상기 유기체와 연관된 암 유형을 확인할 수 있다.
일부 구현예에서, 메틸화 특성은 게놈의 복수 영역의 영역 메틸화 수준이다. 각각의 영역 컷오프값을 초과하는 영역 메틸화 수준을 갖는 것으로 결정된 영역이 이용될 수 있다, 예로 유기체의 영역 메틸화 수준이 게놈의 동일한 영역에 대한 다른 유기체의 영역 메틸화 수준과 비교될 수 있다. 비교는 암 유형을 구별할 수 있도록 하거나 단지 암을 확인하기 위한(예로 위양성을 확인하기 위한) 추가 필터를 제공할 수 있다. 따라서 상기 비교에 기반하여 유기체가 제1 유형의 암, 암의 부재 또는 제2 유형의 암을 갖는지가 결정될 수 있다.
다른 유기체(평가되는 것과 함께)가 영역 메틸화 수준을 이용해서 클러스터링될 수 있다. 따라서 영역 메틸화 수준의 비교를 이용하여 유기체가 어느 클러스터에 속하는지를 결정할 수 있다. 클러스터링은 또한 상술된 바와 같이 결실 또는 증폭을 나타내는 것으로 결정된 영역에 대한 CNA 정규화값을 이용할 수 있다. 또한 클러스터링은 고메틸화 CpG 섬의 각각의 메틸화 밀도를 이용할 수 있다.
상기 방법의 원리를 예시하기 위해, 두 미지의 표본 분류를 위해 논리 회귀를 이용하는 예를 나타낸다. 이 분류의 목적은 이들 두 표본이 HCC 또는 비-HCC 암인지를 결정하기 위한 것이었다. HCC 환자에서 수집된 23개 혈장 표본 및 HCC 이외 암 환자의 18개 표본을 포함하는 표본 교육 세트가 컴파일링되었다. 따라서 교육 세트에는 총 41 케이스가 있었다. 상기 예에서, CpG 섬(X1-X5)의 메틸화에 대한 5 특성(X1-X5), 1Mb 영역의 메틸화에 대한 6 특성(X6-X11) 및 1Mb 영역의 CNA에 대한 2 특성(X12-X13)을 포함하는 13 특성이 선택되었다. CpG 메틸화 특성은 >3 또는 <-3의 z-스코어를 갖는 교육 세트에서 적어도 15 케이스의 기준에 기반하여 선택되었다. 1-Mb 메틸화 특성은 >3 또는 <-3의 z-스코어를 갖는 교육 세트에서 적어도 39 케이스의 기준에 기반하여 선택되었다. CNA 특성은 >3 또는 <-3의 z-스코어를 갖는 적어도 20 케이스의 기준에 기반하여 선택되었다. 각 특성(X1-X13)에 대한 회귀 계수를 결정하기 위해, 상기 교육 세트의 표본 상에서 논리 회귀가 수행되었다. 더 큰 크기의 회귀 계수를 갖는 특성(이것이 양의 관점인지 또는 음의 관점인지와 무관하게)이 HCC 및 비-HCC 표본 간에 더 우수한 구별을 제공하였다. 각각의 특성에 대한 각 케이스의 z-스코어가 독립 변수의 입력 값으로 이용되었다. 이어서 HCC 환자로부터 하나(TBR36) 및 폐암 환자로부터 하나(TBR177)의 두 혈장 표본이 13 특성에 대해 분석되었다.
상기 암 유형 분류 분석에서, 이들 두 표본은 미지 기원의 암 환자에서 수집되는 것으로 가정되었다. 각 표본에 있어서, 상기 각각의 특성에 대한 z-스코어가 교차비의 자연 로그(ln(교차비))를 결정하기 위한 논리 회귀 공식에 대입되었으며, 여기서 교차비는 HCC를 갖는 및 HCC를 갖지 않는 확률의 비(HCC/비-HCC)를 나타내었다.
표 7은 논리 회귀 공식의 13 특성에 대한 회귀 계수를 나타낸다. 두 평가 케이스(TBR36 및 TBR177)의 각각의 특성에 대한 z-스코어도 나타낸다. TBR36 및 TBR177에 대한 HCC의 ln(교차비)는 각각 37.03 및 -4.37이었다. 이들 교차비로부터, 혈장 표본이 HCC 환자에서 수집될 확률은 각각 >99.9% 및 1%로 계산되었다. 요약하면, TBR36은 HCC 환자로부터의 표본일 가능성이 높았던 반면, TBR177은 HCC 환자로부터의 표본일 가능성이 낮았다.
특성 회귀 계수 각 특성의 z-스코어
TBR36 TBR177
X1 -2.9575 14.8 0
X2 2.2534 21.3 0
X3 -1.5099 6.1 0
X4 -0.236 34.0 0
X5 0.7426 17.3 0
X6 -0.6682 -26.3 -1.5
X7 -0.2828 -13.9 -2.6
X8 -0.7281 -9.4 -4.4
X9 1.0581 -7.8 -3.7
X10 0.3877 -20.8 -4.3
X11 0.3534 -15.5 -3.1
X12 -1.1826 4.8 3.3
X13 -0.3805 -11.7 -1.4
ln(교차비) 37.03 -4.37463
다른 구현예에서, 계층 클러스터링 회귀, 분류 트리 분석 및 다른 회귀 모델이 암의 가능한 일차 기원을 결정하기 위해 이용될 수 있다. XII. 재료 및 방법
A. 바이설파이트-처리 DNA 라이브러리의 제조 및 서열분석
0.5%(w/w) 비메틸화 람다 DNA(Promega)가 첨가된 게놈 DNA(5㎍)를 Covaris S220 시스템(Covaris)에 의해 대략 200bp 길이로 단편화하였다. 메틸화 어댑터(Illumina)를 DNA 단편에 결찰한 것을 제외하고는 제조업체의 지시에 따라 페어-엔드 서열분석 표본 제조 키트(Illumina)를 이용하여 DNA 라이브러리를 제조하였다. AMPure XP 자기 비드(Beckman Coulter)를 이용한 2회 정제 후, 결찰 산물을 2개 부분으로 분할하여 그 중 하나를 EpiTect 바이설파이트 키트(Qiagen)로 2회의 바이설파이트 개질을 거쳤다. 삽입물 중 CpG 부위에서의 비메틸화 시토신은 우라실로 전환된 반면, 메틸화 시토신은 변하지 않고 유지되었다. 나트륨 바이설파이트로 처리한 또는 처리하지 않은 어댑터가 결찰된 DNA 분자를 다음 조성을 이용하여 10사이클의 PCR로 농축하였다: 50㎕-반응에서 2.5U PfuTurboCx 핫스타트 DNA 폴리머라아제(Agilent Technologies), 1X PfuTurboCx 반응 완충액, 25μM dNTPs, 1㎕ PCR 프라이머 PE 1.0 및 1㎕ PCR 프라이머 PE 2.0(Illumina). 열 사이클링 프로필은 다음과 같았다: 95℃에서 2분, 98℃에서 30초, 이어서 98℃에서 15초, 60℃에서 30초 및 72℃에서 4분을 10사이클, 마지막 단계로 72℃에서 10분(R Lister, 등, 2009 Nature; 462: 315-322). PCR 산물을 AMPure XP 자기 비드를 이용하여 정제하였다.
3.2-4ml의 모체 혈장 표본에서 추출한 혈장 DNA를 단편화된 람다 DNA(25pg/혈장ml)과 함께 스파이크 처리하고 전술된 바와 같이 라이브러리 정립을 거쳤다(RWK Chiu 등, 2011 BMJ; 342: c7401). 메틸화 어댑터로의 결찰 후, 결찰 산물을 2개로 절반씩 분할하고, 1개 부분으로 2회의 바이설파이트 개질을 거쳤다. 이어서 바이설파이트-처리 또는 미처리 결찰 산물을 전술된 바와 같이 10사이클의 PCR로 농축하였다.
바이설파이트-처리 또는 미처리 DNA 라이브러리를 HiSeq2000 장비(Illumina) 상에서 페어-엔드 포맷으로 75bp에 대해 서열분석하였다. DNA 클러스터를 cBot 장비(Illumina) 상에서 페어-엔드 클러스터 생성 키트 v3으로 생성하였다. 실시간 영상 분석 및 염기 호출을 HiSeq 제어 소프트웨어(HCS) v1.4 및 실시간 분석(RTA) 소프트웨어 v1.13(Illumina)을 이용해서 수행하였고, 자동화 매트릭스 및 위상 계산은 DNA 라이브러리로 서열분석된 스파이크-인 PhiX 제어 v3에 기반하였다.
B. 메틸화 시토신의 서열 정렬 및 확인
염기 호출 후, 단편 말단 상의 어댑터 서열 및 저품질 염기(즉 품질 스코어 <20)를 제거하였다. 이어서 FASTQ 포맷의 가공 측정치를 Methy-Pipe(P Jiang, 등, Methy-Pipe: 전체 게놈 메틸롬 분석을 위한 통합 바이오인포마틱스 데이터 분석 파이프라인, 논문은 2010. 12. 18~21, IEEE International Conference on Bioinformatics and Biomedicine Workshops, Hong Kong에서 발표됨)로 불리는 메틸화 데이터 분석 파이프라인으로 처리하였다. 바이설파이트 전환 서열분석 측정치를 정렬하기 위해, 먼저 기준 인간 게놈(NCBI build 36/hg18)을 이용하여 각각 왓슨 및 크릭 가닥 상에서 모든 시토신 잔기의 티민으로의 컴퓨터내 전환을 수행하였다. 이어서 모든 처리된 측정치에서 각각의 시토신의 티민으로의 컴퓨터내 전환을 수행하고, 각각의 전환된 잔기의 위치 정보를 유지하였다. SOAP2(R Li, 등, 2009 Bioinformatics; 25: 1966-1967)를 이용하여 전환된 측정치를 2 사전 전환된 기준 인간 게놈에 대해 정렬하고, 각각의 정렬된 측정치에 대해 최대 2 미스매치를 허용하였다. 고유한 게놈 위치에 맵핑 가능한 측정치만 선택하였다. 왓슨 및 크릭 가닥 모두에 맵핑되는 모호한 측정치 및 동일한 시작 및 끝 게놈 위치를 가진 중복된(클론) 측정치를 제거하였다. 삽입물 크기가 ≤600bp인 서열분석 측정치를 메틸화 및 크기 분석을 위해 보유하였다.
CpG 디뉴클레오티드 맥락의 시토신 잔기가 하류 DNA 메틸화 연구를 위한 주요 표적이었다. 정렬 후, 원래 서열분석 측정치에 존재하는 시토신을 컴퓨터내 전환 동안 유지된 위치 정보에 기반하여 회수하였다. CpG 디뉴클레오티드 중에서 회수된 시토신을 메틸화된 것으로 스코어링하였다. CpG 디뉴클레오티드 중의 티민은 비메틸화된 것으로 스코어링하였다. 라이브러리 제조 동안 포함된 비메틸화 람다 DNA는 나트륨 바이설파이트 개질의 효율 산정을 위한 내부 대조군으로 작용하였다. 바이설파이트 전환 효율이 100%인 경우, 람다 DNA 상의 모든 시토신이 티민으로 전환되어야 한다.
XIII. 요약
본원에 기재된 구현예를 이용하여, 예를 들어 대상자의 혈장을 이용하여 비침습적으로 암을 스크리닝, 검출, 모니터링 또는 예진할 수 있었다. 또한 모체 혈장으로부터 태아 DNA의 메틸화 프로필을 추정하여 태아의 산전 스크리닝, 진단, 연구 또는 모니터링을 수행할 수 있었다. 접근의 파워를 예시하기 위해, 태반 조직의 연구를 통해 통상적으로 수득된 정보가 모체 혈장에서 직접 평가될 수 있음을 나타내었다. 예를 들어, 유전자 유전자좌의 각인 상태, 태아 및 모체 DNA 간 차등적 메틸화를 갖는 유전자좌의 확인 및 유전자 유전자좌의 메틸화 프로필의 임신 중 변동이 모체 혈장 DNA의 직접적 분석을 통해 달성되었다. 본 발명자들의 접근의 주요 장점은 태아 메틸롬이 임신에 대한 손상 또는 태아 조직의 침습적 표본 채집이 필요 없이 임신 동안 통합적으로 평가될 수 있다는 것이다. 변경된 DNA 메틸화 상태 및 여러 임신 연관 상태 간의 기지의 상관관계에 있어서, 본 연구에 기재된 접근은 이들 상태에 대한 병태생리의 조사 및 바이오마커의 확인을 위한 중요한 도구로 작용할 수 있다. 각인된 유전자좌에 초점을 맞춤으로써, 모계 전달된 태아 메틸화 프로필뿐만 아니라 부계 전달된 것이 모두 모체 혈장에서 평가될 수 있음을 나타내었다. 상기 접근은 각인 질환의 조사를 위해 잠재적으로 유용할 수 있다. 구현예는 또한 태아의 산전 평가 또는 임신 연관 질환에 대해 직접 적용될 수 있다.
게놈에 걸친 바이설파이트 서열분석이 태반 조직의 DNA 메틸화 프로필을 조사하기 위해 적용될 수 있음을 나타내었다. 인간 게놈에는 대략 2800만 개의 CpG 부위가 존재한다(C Clark 등, 2012 PLoS One; 7: e50233). CVS 및 만기 태반 조직 표본에 대한 본 발명자들의 바이설파이트 서열분석 데이터는 CpG를 80% 초과 커버하였다. 이는 다른 고처리량 플랫폼을 이용하여 달성 가능한 것보다 실질적으로 더 넓은 커버 범위를 나타낸다. 예를 들어, 태반 조직에 대한 이전 연구(T Chu 등, 2011 PLoS One; 6: e14723)에서 이용된 Illumina Infinium HumanMethylation 27K 비드칩 어레이는 게놈에서 CpG의 0.1%만을 커버하였다. 보다 최근에 이용 가능해진 Illumina Infinium HumanMethylation 450K 비드칩 어레이는 CpG의 1.7%만을 커버하였다(C Clark 등, 2012 PLoS One; 7: e50233). MPS 접근에는 프로브 설계, 혼성화 효율 또는 항체 포획 강도에 관련된 제한이 없으므로, CpG 섬 내 또는 그를 넘어선 그리고 대부분의 서열 맥락에서의 CpG가 평가될 수 있다.
XIV. 컴퓨터 시스템
본원에서 언급된 임의의 컴퓨터 시스템은 임의의 적합한 수의 서브시스템을 이용할 수 있다. 이러한 서브시스템의 예를 도 33에서 컴퓨터 장치 3300에 나타낸다. 일부 구현예에서, 컴퓨터 시스템에는 단일 컴퓨터 장치가 포함되며, 여기서 서브시스템은 컴퓨터 장치의 컴포넌트일 수 있다. 다른 구현예에서, 컴퓨터 시스템에는 다중 컴퓨터 장치가 포함될 수 있고, 각각이 내부 컴포넌트를 갖는 서브시스템이다.
도 33에 나타낸 서브시스템은 시스템 버스 3375를 통해 상호연결된다. 추가적인 서브시스템, 예컨대 프린터 3374, 키보드 3378, 저장 장치(들) 3379, 어댑터 3382를 디스플레이하도록 커플링된 모니터 3376 등을 나타낸다. I/O 컨트롤러 3371에 커플링된 주변 및 입력/출력(I/O) 장치는 당분야에 공지된 임의 수의 수단, 예컨대 시리얼 포트 3377에 의해 컴퓨터 시스템에 연결될 수 있다. 예를 들어, 시리얼 포트 3377 또는 외부 인터페이스 3381(예로 이더넷, 와이파이 등)을 이용하여 컴퓨터 시스템 3300을 광역 네트워크, 예컨대 인터넷, 마우스 입력 장치 또는 스캐너에 연결할 수 있다. 시스템 버스 3375를 통한 상호연결은 중앙 프로세서 3373이 각각의 서브시스템과 통신하고 시스템 메모리 3372 또는 저장 장치(들) 3379(예로 고정 디스크)로부터의 지시 수행뿐만 아니라 서스시스템 간 정보 교환을 제어할 수 있도록 한다. 시스템 메모리 3372 및/또는 저장 장치(들) 3379는 컴퓨터에서 읽을 수 있는 매체를 구현할 수 있다. 본원에 언급된 임의의 값은 하나의 컴포넌트로부터 다른 컴포넌트로 출력될 수 있고 사용자에게 출력될 수 있다.
컴퓨터 시스템에는, 예로 외부 인터페이스 3381에 의해 또는 내부 인터페이스에 의해 함께 연결된, 복수의 동일한 컴포넌트 또는 서브시스템이 포함될 수 있다. 일부 구현예에서, 컴퓨터 시스템, 서브시스템, 또는 장치는 네트워크를 통해 통신할 수 있다. 이러한 상황에서, 하나의 컴퓨터가 클라이언트로 그리고 다른 컴퓨터가 서버로 간주될 수 있고, 여기서 각각은 동일한 컴퓨터 시스템의 일부일 수 있다. 클라이언트 및 서버에는 각각 다중 시스템, 서브시스템, 또는 컴포넌트가 포함될 수 있다.
본 발명의 임의 구현예가 모듈 또는 집적 방식으로 하드웨어(예로 어플리케이션 특이적 집적 회로 또는 현장에서 프로그래밍 가능한 게이트 어레이)를 이용해서 및/또는 일반적으로 프로그래밍 가능한 프로세서를 갖는 컴퓨터 소프트웨어를 이용해서 제어 논리의 형태로 시행될 수 있음이 이해되어야 한다. 본원에서 이용된 바와 같이, 프로세서에는 동일한 집적 칩 상의 멀티 코어 프로세서 또는 단일 회로판 상의 또는 네트워크화된 다중 프로세싱 유닛이 포함된다. 본원에 제공된 개시 및 교시에 기반하여, 당업자는 하드웨어 및 하드웨어와 소프트웨어의 조합을 이용하여 본 발명의 구현예를 시행하기 위한 다른 방식 및/또는 방법을 알고 이해할 것이다.
본 출원에 기재된 임의의 소프트웨어 컴포넌트 또는 기능은, 예를 들어 통상적인 또는 오브젝트향 기법을 이용하여 임의의 적합한 컴퓨터 언어, 예를 들어 Java, C++ 또는 Perl을 이용하여 프로세서에 의해 시행될 소프트웨어 코드로 시행될 수 있다. 소프트웨어 코드는 저장 및/또는 전송을 위해 컴퓨터에서 읽을 수 있는 매체 상에 일련의 명령 또는 명령으로 저장될 수 있고, 적합한 매체에는 램(random access memory, RAM), 롬(read only memory, ROM), 자기 매체, 예컨대 하드 드라이브 또는 플로피 디스크, 또는 광 매체, 예컨대 컴팩트 디스크(CD) 또는 DVD(digital versatile disk), 플래시 메모리 등이 포함된다. 컴퓨터 컴퓨터로 판독 가능한 매체는 이러한 저장 또는 전송 장치의 임의 조합일 수 있다.
이러한 프로그램은 또한 인터넷을 포함하는 다양한 프로토콜에 적합한 유선, 광, 및/또는 무선 네트워크를 통한 전송을 위해 채택된 캐리어 신호를 이용하여 인코딩되고 전송될 수 있다. 이와 같이, 본 발명의 구현예에 따른 컴퓨터로 판독 가능한 매체는 이러한 프로그램으로 인코딩되는 데이터 신호를 이용하여 생성될 수 있다. 프로그램 코드로 인코딩되는 컴퓨터로 판독 가능한 매체는 호환 장치와 패키지화되거나 다른 장치에서 별도로 제공될 수 있다(예로 인터넷 다운로드를 통해). 임의의 이러한 컴퓨터로 판독 가능한 매체는 단일 컴퓨터 프로그램 제품(예로 하드 드라이브, CD 또는 전체 컴퓨터 시스템) 상에 또는 내에 존재할 수도 있고, 시스템 또는 네트워크 내에서 상이한 컴퓨터 프로그램 제품 상에 또는 내에 존재할 수도 있다. 컴퓨터 시스템에는 본원에서 언급된 임의 결과를 사용자에게 제공하기 위한 모니터, 프린터, 또는 다른 적합한 디스플레이가 포함될 수 있다.
본원에 기재된 임의 방법은 하나 이상의 프로세서를 포함하는 컴퓨터 시스템으로 완전히 또는 부분적으로 수행될 수 있고, 이는 단계들을 수행하기 위해 구성될 수 있다. 따라서, 구현예는 잠재적으로 각각의 단계 또는 각각의 단계군을 수행하는 상이한 컴포넌트를 갖는, 본원에 기재된 임의 방법 단계를 수행하기 위해 구성된 컴퓨터 시스템에 관한 것일 수 있다. 번호가 지정된 단계로 제시되었으나, 본원의 방법 단계는 동시에 또는 상이한 순서로 수행될 수 있다. 또한 이들 단계의 일부가 다른 방법으로부터의 다른 단계의 일부와 함께 이용될 수도 있다. 또한 단계의 전부 또는 일부가 선택적일 수 있다. 또한 임의 방법의 임의 단계가 모듈, 회로 또는 이들 단계를 수행하기 위한 다른 수단으로 수행될 수 있다.
특정 구현예의 구체적 상세내용은 본 발명의 구현예의 요지 및 범위에서 벗어나지 않고 임의의 적합한 방식으로 조합될 수 있다. 그러나 본 발명의 다른 구현예는 각각의 개별 측면에 관한 특정 구현예 또는 이들 개별 측면의 특정 조합에 관한 것일 수 있다.
본 발명의 예시적 구현예의 상기 설명은 예시 및 설명의 목적을 위해 제시되었다. 이는 본 발명을 기재된 정확한 형태로 제한하거나 배타적이기 위한 것이 아니며, 여러 개질 및 변형이 상기 교시의 관점에서 가능하다. 구현예는 본 발명의 이론 및 그 실제 적용을 가장 잘 설명하여 당분야의 다른 숙련자가 본 발명을 예시된 특정 용도에 적합하게 다양한 구현예 및 다양한 개질로 가장 잘 이용할 수 있도록 하기 위해 선택되고 기재되었다.
단수의 언급은 구체적으로 반대로 나타내지 않는 이상 "하나 이상"을 의미하는 것이다.
본원에서 언급된 모든 특허, 특허 출원, 공보 및 기재는 모든 목적을 위해 이들의 전문이 참조로 도입된다. 어느 것도 선행 기술로 인정되지는 않는다.
[표 S2A]
제1 석달 융모막 융모 표본 및 모체 혈액 세포에서 확인된 상위 100개의 고메틸화 영역의 목록
[표 S2B]
제1 석달 융모막 융모 표본 및 모체 혈액 세포에서 확인된 상위 100개의 저메틸화 영역의 목록
[표 S2C]
제3 석달 태반 조직 및 모체 혈액 세포에서 확인된 상위 100개의 고메틸화 영역의 목록
[표 S2D]
제3 석달 태반 조직 및 모체 혈액 세포에서 확인된 상위 100개의 저메틸화 영역의 목록
[표 S3A]
제1 석달 모체 혈장 바이설파이트-서열분석 데이터로부터 고메틸화된 것으로 추정된 상위 100개 유전자좌의 목록
[표 S3B]
제1 석달 모체 혈장 바이설파이트-서열분석 데이터로부터 저메틸화된 것으로 추정된 상위 100개 유전자좌의 목록
[표 S3C]
제3 석달 모체 혈장 바이설파이트-서열분석 데이터로부터 고메틸화된 것으로 추정된 상위 100개 유전자좌의 목록
[표 S3D]
제3 석달 모체 혈장 바이설파이트-서열분석 데이터로부터 저메틸화된 것으로 추정된 상위 100개 유전자좌의 목록

Claims (134)

  1. 유기체의 생물학적 표본을 분석하는 방법으로서, 상기 생물학적 표본은 정상 세포에서 그리고 잠재적으로 암에 연관된 세포에서 기원하는 핵산 분자를 포함하며, 상기 핵산 분자의 적어도 일부는 생물학적 표본 중 무세포이고, 상기 방법은
    상기 생물학적 표본으로부터 복수의 DNA 분자를 분석하는 단계로서, 이 DNA 분자의 분석 단계는
    상기 유기체의 게놈에서 DNA 분자의 위치를 결정하는 단계,
    상기 DNA 분자가 하나 이상의 부위에서 메틸화되어 있는지의 여부를 결정하는 단계,
    복수의 부위 각각에 대해, 상기 부위에서 메틸화되어 있는 DNA 분자의 각각의 수를 결정하는 단계
    를 포함하는 단계;
    상기 복수의 부위에서 메틸화된 DNA 분자의 각각의 수에 기반하여 제1 메틸화 수준을 계산하는 단계;
    상기 제1 메틸화 수준을 제1 컷오프값과 비교하는 단계;
    상기 비교에 기반하여 암 수준의 제1 분류를 결정하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서, 상기 DNA 분자가 하나 이상의 부위에서 메틸화되어 있는지의 여부를 결정하는 단계는 메틸화-인식 서열분석(methylation-aware sequencing)을 수행하는 단계를 포함하는 방법.
  3. 제2항에 있어서, 상기 메틸화-인식 서열분석을 수행하는 단계는
    상기 DNA 분자를 나트륨 바이설파이트로 처리하는 것, 및
    상기 처리된 DNA 분자의 서열분석을 수행하는 것
    을 포함하는 방법.
  4. 제3항에 있어서, 상기 나트륨 바이설파이트에 의한 무세포 DNA 분자의 처리는 5-히드록시메틸시토신의 검출을 위한 Tet-보조 바이설파이트 전환 또는 산화적 바이설파이트 서열분석의 부분인 방법.
  5. 제2항에 있어서, 상기 각 영역에 대한 DNA 분자의 각각의 수는 상기 메틸화-인식 서열분석에서 수득된 서열 판독치를 정렬함으로써 결정되는 방법.
  6. 제1항에 있어서, 상기 DNA 분자가 하나 이상의 부위에서 메틸화되어 있는지의 여부를 결정하는 단계는 메틸화-감수성 제한 효소 분해, 메틸화-특이적 PCR, 메틸화-의존적 DNA 침전, 메틸화 DNA 결합 단백질/펩티드 또는 나트륨 바이설파이트 처리 없는 단일 분자 서열분석을 이용하는 것을 포함하는 방법.
  7. 제1항에 있어서,
    게놈의 제1 복수 영역 각각에 대해, 상기 영역에서 유래되는 DNA 분자의 각각의 수를 결정하는 단계, 상기 각각의 수로부터 각각의 정규화값을 계산하는 단계, 상기 각각의 정규화값을 기준값과 비교하여 각각의 영역이 결실 또는 증폭을 나타내는지의 여부를 결정하는 단계;
    결실 또는 증폭을 나타내는 것으로 결정되는 영역의 제1 양을 결정하는 단계;
    상기 제1 양을 제1 역치값과 비교하여 암 수준의 제2 분류를 결정하는 단계; 및
    상기 제1 분류 및 제2 분류를 이용하여 암 수준의 제3 분류를 결정하는 단계
    를 추가로 포함하는 방법.
  8. 제7항에 있어서, 상기 제1 역치값은 결실 또는 증폭을 나타내는 것으로 결정되는 상기 제1 복수 영역의 백분율인 방법.
  9. 제7항에 있어서, 상기 제3 분류는 상기 제1 분류 및 제2 분류가 모두 암을 지시하는 경우에만 암에 대해 양성인 방법.
  10. 제7항에 있어서, 상기 제3 분류는 상기 제1 분류 또는 제2 분류 어느 하나가 암을 지시하는 경우 암에 대해 양성인 방법.
  11. 제1항 또는 제7항에 있어서, 상기 제1 분류는 상기 유기체에 대해 암이 존재함을 시사하며, 상기 방법은
    상기 제1 메틸화 수준을 다른 유기체에서 결정된 대응값과 비교하여 상기 유기체와 연관된 암의 유형을 확인하는 단계로서, 상기 다른 유기체 중 2 이상은 상이한 유형의 암을 갖는 것으로서 확인되는 단계
    를 추가로 포함하는 방법.
  12. 제11항에 있어서, 상기 제3 분류는 상기 유기체에 대해 암이 존재함을 시사하며, 상기 방법은
    상기 영역의 제1 양을 다른 유기체에서 결정된 대응값과 비교하여 상기 유기체와 연관된 암의 유형을 확인하는 단계
    를 추가로 포함하는 방법.
  13. 제1항 또는 제7항에 있어서, 상기 제1 메틸화 수준을 계산하는 단계는
    게놈의 제2 복수 영역을 확인하는 단계,
    각 영역 내에서 하나 이상의 부위를 확인하는 단계,
    각 영역에 대해 영역 메틸화 수준을 계산하는 단계
    를 포함하며, 상기 제1 메틸화 수준은 제1 영역에 대한 것이고,
    상기 방법은,
    상기 제1 메틸화 수준을 제1 컷오프값과 비교하는 단계를 포함하는, 각각의 영역 메틸화 수준을 각각의 영역 컷오프값과 비교하는 단계;
    상기 각각의 영역 컷오프값을 초과하는 영역 메틸화 수준을 갖는 것으로 결정되는 영역의 제2 양을 결정하는 단계; 및
    상기 영역의 제2 양을 제2 역치값과 비교하여 제1 분류를 결정하는 단계
    를 추가로 포함하는 방법.
  14. 제13항에 있어서, 상기 각각의 영역 컷오프값을 초과하는 영역 메틸화 수준을 갖는 것으로 결정되는 영역은 제1 영역 세트에 대응하고, 상기 방법은
    상기 제1 영역 세트의 영역 메틸화 수준을 제1 영역 세트에 대한 다른 유기체의 대응 영역 메틸화 수준과 비교하는 단계로서, 상기 다른 유기체는 제1 유형의 암, 암의 부재 및 제2 유형의 암 중 2 이상을 갖는 단계; 및
    상기 비교에 기반하여 유기체가 제1 유형의 암, 암의 부재 또는 제2 유형의 암을 갖는지의 여부를 결정하는 단계
    를 추가로 포함하는 방법.
  15. 제14항에 있어서,
    상기 제1 영역 세트의 영역 메틸화 수준에 기반하여 다른 유기체를 클러스터링하는 단계로서, 클러스터 중 2개는 제1 유형의 암, 암의 부재 및 제2 유형의 암 중 임의의 2개에 대응하는 단계
    를 추가로 포함하고, 상기 영역 메틸화 수준의 비교는 유기체가 어느 클러스터에 속하는지를 결정하는 방법.
  16. 제15항에 있어서, 상기 다른 유기체의 클러스터링 단계는 상기 유기체의 영역 메틸화 수준을 이용하는 방법.
  17. 제15항에 있어서, 상기 클러스터는 상기 제1 유형의 암에 대응하는 제1 클러스터, 상기 제2 유형의 암에 대응하는 제2 클러스터 및 암의 부재에 대응하는 제3 클러스터를 포함하는 방법.
  18. 제15항에 있어서, 상기 다른 유기체의 클러스터링 단계는 다른 유기체에 대한 제2 영역 세트의 각각의 정규화값에 추가로 기반하며, 상기 제2 영역 세트는 결실 또는 증폭을 나타내는 것으로 결정되는 영역에 대응하고, 영역에 대한 각각의 정규화값은 영역 유래 DNA 분자의 각각의 수로부터 결정되며, 상기 방법은
    상기 제2 영역 세트 각각에 대해, 상기 영역에서 유래되는 DNA 분자의 각각의 수를 결정하는 단계, 상기 각각의 수로부터 각각의 정규화값을 계산하는 단계; 및
    상기 유기체가 어느 클러스터에 속하는지를 결정하는 부분으로서, 상기 유기체에 대한 제2 영역 세트의 각각의 정규화값을 상기 다른 유기체의 각각의 정규화값과 비교하는 단계
    를 추가로 포함하는 방법.
  19. 제18항에 있어서, 상기 다른 유기체의 클러스터링 단계는 고메틸화 CpG 섬의 각각의 메틸화 밀도에 추가로 기반하며, 상기 방법은
    상기 고메틸화 CpG 섬 각각에 대해, 각각의 메틸화 밀도를 결정하는 단계;
    상기 유기체가 어느 클러스터에 속하는지를 결정하는 부분으로서, 상기 유기체에 대한 고메틸화 CpG 섬의 각각의 메틸화 밀도를 상기 다른 유기체의 메틸화 밀도와 비교하는 단계
    를 추가로 포함하는 방법.
  20. 제13항에 있어서, 상기 제2 복수 영역 각각에 대해, 상기 영역 메틸화 수준과 각각의 영역 컷오프값 간의 각각의 차이를 컴퓨터 연산하는 단계, 및 상기 각각의 차이에 대응하는 각각의 확률을 계산하는 단계를 추가로 포함하고,
    상기 영역의 제2 양을 결정하는 단계는 각각의 확률을 포함하는 누적 스코어를 계산하는 단계를 포함하는 방법.
  21. 제20항에 있어서, 상기 누적 스코어의 계산 단계는
    상기 각각의 확률의 로그를 취하여 각각의 로그 결과를 수득하는 것, 및
    각각의 로그 결과를 포함하는 합을 계산하는 것
    을 포함하는 방법.
  22. 제21항에 있어서, 상기 누적 스코어는 상기 각각의 로그 결과의 합의 음의 값인 방법.
  23. 제20항에 있어서, 각각의 차이는 상기 각각의 영역 컷오프값과 연관된 표준 편차로 정규화되는 방법.
  24. 제20항에 있어서, 상기 각각의 확률은 통계 분포에 따른 각각의 차이에 대한 확률에 대응하는 방법.
  25. 제20항에 있어서, 상기 제2 역치값은 기준 군으로부터의 최고 누적 스코어에 대응하는 방법.
  26. 제13항에 있어서, 상기 제1 복수 영역 각각에 대해, 상기 각각의 정규화값과 기준값 간의 각각의 차이를 컴퓨터 연산하는 단계, 및 상기 각각의 차이에 대응하는 각각의 확률을 계산하는 단계를 추가로 포함하며,
    상기 영역의 제1 양을 결정하는 단계는 각각의 확률을 포함하는 제1 합을 계산하는 단계를 포함하는 방법.
  27. 제13항에 있어서, 상기 각각의 영역 컷오프값은 기준 메틸화 수준으로부터의 특정된 양인 방법.
  28. 제13항에 있어서, 상기 제2 역치값은 백분율이고, 상기 영역의 제2 양과 제2 역치값을 비교하는 단계는,
    상기 영역의 제2 양을, 제2 역치값과 비교하기 전에, 상기 제2 복수 영역의 제2 수로 나누는 단계
    를 포함하는 방법.
  29. 제28항에 있어서, 상기 제2 수는 모든 제2 복수 영역에 대응하는 방법.
  30. 제13항에 있어서, 상기 제1 복수 영역은 상기 제2 복수 영역과 동일하며, 각각의 영역 컷오프값은 각각의 영역이 결실 또는 증폭을 나타내는지의 여부에 의존하는 방법.
  31. 제30항에 있어서, 각각의 영역 컷오프값은 각각의 영역이 증폭을 나타내지 않는 경우에 비해 증폭을 나타내는 경우 더 큰 크기를 갖고, 각각의 영역 컷오프값은 각각의 영역이 결실을 나타내지 않는 경우에 비해 결실을 나타내는 경우 더 작은 크기를 갖는 방법.
  32. 제31항에 있어서, 각각의 영역 컷오프값은 상기 제2 복수 영역의 저메틸화에 대해 시험하며, 각각의 영역 컷오프값은 각각의 영역이 증폭을 나타내지 않는 경우에 비해 증폭을 나타내는 경우 더 큰 음의 값을 갖고, 각각의 영역 컷오프값은 각각의 영역이 결실을 나타내지 않는 경우에 비해 결실을 나타내는 경우 더 작은 음의 값을 갖는 방법.
  33. 제13항에 있어서, 상기 생물학적 표본은 치료 전에 얻고, 상기 방법은,
    치료 후 얻은 다른 생물학적 표본에 대해 제13항의 방법을 반복하여,
    결실 또는 증폭을 나타내는 것으로 결정되는 영역의 후속 제1 양, 및
    각각의 영역 컷오프값을 초과하는 영역 메틸화 수준을 갖는 것으로 결정되는 영역의 후속 제2 양
    을 수득하는 단계;
    상기 제1 양을 후속 제1 양과 비교하고 상기 제2 양을 후속 제2 양과 비교하여 유기체의 예후를 결정하는 단계
    를 추가로 포함하는 방법.
  34. 제33항에 있어서, 상기 제1 양을 상기 후속 제1 양과 및 상기 제2 양을 후속 제2 양과 비교하여 유기체의 예후를 결정하는 단계는
    상기 제1 양과 후속 제1 양 간의 제1 차이를 결정하는 단계,
    상기 제1 차이를 하나 이상의 제1 차이 역치와 비교하는 단계,
    상기 제2 양과 후속 제2 양 간의 제2 차이를 결정하는 단계, 및
    상기 제2 차이를 하나 이상의 제2 차이 역치와 비교하는 단계
    를 포함하는 방법.
  35. 제34항에 있어서, 상기 예후는 제1 차이가 하나의 제1 차이 역치 초과인 경우보다 제1 차이가 하나의 제1 차이 역치 미만인 경우 더 악화될 것으로 예측되며, 상기 예후는 제2 차이가 하나의 제2 차이 역치 초과인 경우보다 제2 차이가 하나의 제2 차이 역치 미만인 경우 더 악화될 것으로 예측되는 방법.
  36. 제35항에 있어서, 상기 하나의 제1 차이 역치 및 하나의 제2 차이 역치가 0인 방법.
  37. 제33항에 있어서, 상기 치료는 면역치료법, 수술, 방사선치료법, 화학치료법, 항체-기반 치료법, 후생적 치료법 또는 표적화 치료법인 방법.
  38. 제1항에 있어서, 상기 제1 컷오프값은 건강한 유기체에서 수득된 생물학적 표본으로부터 정립된 기준 메틸화 수준으로부터의 특정된 거리인 방법.
  39. 제38항에 있어서, 상기 특정된 거리는 기준 메틸화 수준으로부터의 표준 편차의 특정된 수인 방법.
  40. 제1항에 있어서, 상기 제1 컷오프값은 생물학적 표본을 시험하기 전에 수득된 유기체의 이전 생물학적 표본으로부터 결정된 기준 메틸화 수준으로부터 정립되는 방법.
  41. 제1항에 있어서, 상기 제1 메틸화 수준을 제1 컷오프값과 비교하는 단계는,
    상기 제1 메틸화 수준과 기준 메틸화 수준 간의 차이를 결정하는 단계, 및
    상기 차이를 제1 컷오프값에 대응하는 역치와 비교하는 단계
    를 포함하는 방법.
  42. 제1항에 있어서, 상기 생물학적 표본 중 종양 DNA의 분획 농도를 결정하는 단계;
    상기 분획 농도에 기반하여 상기 제1 컷오프값을 계산하는 단계
    를 추가로 포함하는 방법.
  43. 제1항에 있어서, 상기 생물학적 표본 중 종양 DNA의 분획 농도가 최소값보다 큰지의 여부를 결정하는 단계; 및
    상기 분획 농도가 최소값보다 크지 않은 경우, 상기 생물학적 표본에 표시하는 단계
    를 추가로 포함하는 방법.
  44. 제43항에 있어서, 상기 최소값은 기준 메틸화 수준에 비하여 종양에 대한 메틸화 수준의 예상된 차이에 기반하여 결정되는 방법.
  45. 제1항에 있어서, 상기 복수의 부위에서 DNA 분자의 크기를 측정하는 단계; 및
    상기 제1 메틸화 수준을 제1 컷오프값과 비교하기 전에, DNA 분자의 측정 크기에 기반하여 상기 제1 메틸화 수준을 정규화하는 단계
    를 추가로 포함하는 방법.
  46. 제45항에 있어서, 상기 측정 크기에 기반하여 상기 제1 메틸화 수준을 정규화하는 단계는,
    상기 제1 크기를 갖는 DNA 분자를 선택하는 단계,
    상기 선택된 DNA 분자를 이용하여 제1 메틸화 수준을 계산하는 단계
    를 포함하며, 상기 제1 컷오프값은 제1 크기에 대응하는 방법.
  47. 제46항에 있어서, 상기 제1 크기는 일련의 길이인 방법.
  48. 제46항에 있어서, 상기 DNA 분자는 크기에 의존적인 물리적 분리에 기반하여 선택되는 방법.
  49. 제46항에 있어서, 상기 제1 크기를 갖는 DNA 분자를 선택하는 단계는
    복수의 DNA 분자의 페어-엔드(paired-end) 대량 병렬 서열분석을 수행하여 각각의 DNA 분자에 대한 서열 페어를 수득하는 것,
    상기 서열 페어를 기준 게놈과 비교하여 DNA 분자의 크기를 결정하는 것, 및
    상기 제1 크기를 갖는 DNA 분자를 선택하는 것
    을 포함하는 방법.
  50. 제45항에 있어서, 상기 측정 크기에 기반하여 제1 메틸화 수준을 정규화하는 단계는
    크기와 메틸화 수준 간의 함수 관계를 수득하는 단계, 및
    상기 함수 관계를 이용하여 상기 제1 메틸화 수준을 정규화하는 단계
    를 포함하는 방법.
  51. 제50항에 있어서, 상기 함수 관계는 상기 각각의 크기에 대응하는 스케일링값을 제공하는 방법.
  52. 제51항에 있어서, 사용된 DNA 분자에 대응하는 평균 크기를 컴퓨터 연산하여 상기 제1 메틸화 수준을 계산하는 단계, 및
    상기 제1 메틸화 수준에, 대응하는 스케일링값을 곱하는 단계
    를 추가로 포함하는 방법.
  53. 제51항에 있어서, 상기 복수의 부위 각각에 대해, 상기 부위에 위치한 DNA 분자 각각에 있어서,
    상기 부위에서 DNA 분자의 각각의 크기를 수득하는 단계, 및
    상기 각각의 크기에 대응하는 스케일링값을 이용하여 상기 부위에서 메틸화되어 있는 DNA 분자의 각각의 수에 대한 DNA 분자의 기여를 정규화하는 단계
    를 추가로 포함하는 방법.
  54. 제1항에 있어서, 상기 복수의 부위는 CpG 부위를 포함하며, 상기 CpG 부위는 복수의 CpG 섬으로 조직되고, 각각의 CpG 섬은 하나 이상의 CpG 부위를 포함하고, 상기 제1 메틸화 수준은 제1 CpG 섬에 대응하는 방법.
  55. 제54항에 있어서, 상기 CpG 섬은 기준 군에서 제1 백분율보다 작은 평균 메틸화 밀도를 가지며, 기준 군에서 메틸화 밀도에 대한 변동 계수는 제2 백분율보다 작은 방법.
  56. 제54항에 있어서,
    상기 CpG 섬 각각에 대해, 상기 CpG 섬의 메틸화 수준을 각각의 컷오프값과 비교함으로써 CpG 섬이 다른 유기체 표본의 기준 군에 비해 고메틸화되어 있는지의 여부를 결정하는 단계;
    상기 고메틸화 CpG 섬 각각에 대해, 상기 각각의 메틸화 밀도를 결정하는 단계;
    상기 각각의 메틸화 밀도로부터 누적 스코어를 계산하는 단계; 및
    상기 누적 스코어를 누적 컷오프값과 비교하여 제1 분류를 결정하는 단계
    를 추가로 포함하는 방법.
  57. 제56항에 있어서, 상기 각각의 메틸화 밀도로부터 누적 스코어를 계산하는 단계는
    상기 고메틸화 CpG 섬 각각에 대해, 각각의 메틸화 밀도와 기준 밀도 간의 각각의 차이를 계산하는 단계, 및 상기 각각의 차이에 대응하는 각각의 확률을 계산하는 단계, 및
    상기 각각의 확률을 이용하여 누적 스코어를 결정하는 단계
    를 포함하는 방법.
  58. 제56항에 있어서, 상기 누적 스코어는 상기 각각의 확률의 로그를 취하여 각각의 로그 결과를 수득하고 각각의 로그 결과를 포함하는 합을 계산함으로써 결정되며, 상기 누적 스코어는 상기 합의 음의 값인 방법.
  59. 제56항에 있어서, 각각의 차이는 상기 기준 밀도와 연관된 표준 편차로 정규화되는 방법.
  60. 제56항에 있어서, 상기 누적 컷오프값은 기준 군으로부터의 최고 누적 스코어에 대응하는 방법.
  61. 제56항에 있어서, 상기 제1 CpG 섬이 고메틸화되어 있는지의 여부를 결정하는 단계는
    상기 제1 메틸화 수준을 제1 컷오프값 및 제3 컷오프값과 비교하는 단계
    를 포함하고, 상기 제1 컷오프값은 기준 군에 대한 메틸화 밀도의 평균 + 특정된 백분율에 대응하고, 상기 제3 컷오프값은 표준 편차의 특정된 수 + 기준 군에 대한 메틸화 밀도의 평균에 대응하는 방법.
  62. 제61항에 있어서, 상기 특정된 백분율은 2%인 방법.
  63. 제61항에 있어서, 상기 표준 편차의 특정된 수는 3인 방법.
  64. 제1항에 있어서,
    상기 게놈의 제1 복수 영역 각각에 대해, 상기 영역에서 유래된 DNA 분자의 각각의 수를 결정하는 단계, 상기 각각의 수로부터 각각의 정규화값을 계산하는 단계, 상기 각각의 정규화값을 기준값과 비교하여 각각의 영역이 결실 또는 증폭을 나타내는지의 여부를 결정하는 단계;
    모두가 결실, 증폭 또는 정상 제시(normal represetation) 중 하나를 나타낸 것으로 결정되는 제1 영역 세트를 결정하는 단계로서, 상기 제1 메틸화 수준은 제1 영역 세트에 대응하는 단계;
    모두가 제2의 결실, 증폭 또는 정상 제시를 나타낸 것으로 결정되는 제2 영역 세트를 결정하는 단계;
    상기 제2 영역 세트의 부위에서 메틸화된 DNA 분자의 각각의 수에 기반하여 제2 메틸화 수준을 계산하는 단계
    를 추가로 포함하며,
    상기 제1 메틸화 수준을 제1 컷오프과 비교하는 단계는
    제1 메틸화 수준과 제2 메틸화 간의 파라미터를 컴퓨터 연산하는 단계, 및
    상기 파라미터를 제1 컷오프값과 비교하는 단계
    를 포함하는 방법.
  65. 제64항에 있어서, 상기 제1 메틸화 수준은 제1 영역 세트의 각 영역에 대해 계산된 영역 메틸화 수준의 통계값이고, 상기 제2 메틸화 수준은 제2 영역 세트의 각 영역에 대해 계산된 영역 메틸화 수준의 통계값인 방법.
  66. 제65항에 있어서, 상기 통계값은 스튜던트 t-테스트, 분산 분석(ANOVA) 테스트, 또는 크루스칼-왈리스(Kruskal-Wallis) 테스트를 이용하여 결정되는 방법.
  67. 제64항에 있어서, 상기 파라미터는 비 또는 차이를 포함하는 방법.
  68. 제67항에 있어서, 상기 파라미터를 컴퓨터 연산하는 단계는 확률 분포를 상기 비 또는 차이에 적용하는 것을 포함하는 방법.
  69. 유기체의 생물학적 표본으로부터 제1 메틸화 프로필을 결정하는 방법으로서, 상기 생물학적 표본은 제1 조직으로부터 및 제2 조직으로부터 기원하는 무세포 DNA 분자의 혼합물을 포함하는 무세포 DNA를 포함하고, 상기 방법은
    상기 제2 조직의 DNA 분자에 대응하는 제2 메틸화 프로필을 수득하는 단계로서, 상기 제2 메틸화 프로필은 유기체의 게놈에서 복수의 유전자좌 각각에서의 메틸화 밀도를 제공하며, 상기 특정 유전자좌에서의 메틸화 밀도는 메틸화되어 있는 상기 제2 조직의 DNA 분자의 비율에 대응하는 단계;
    상기 혼합물의 무세포 DNA 분자로부터 무세포 메틸화 프로필을 결정하는 단계로서, 상기 무세포 메틸화 프로필은 복수의 유전자좌 각각에서의 메틸화 밀도를 제공하는 단계;
    상기 제1 조직에서 유래하는 혼합물 중 무세포 DNA 분자의 백분율을 결정하는 단계; 및
    복수의 유전자좌 각각에 대해, 상기 제2 메틸화 프로필의 메틸화 밀도와 무세포 메틸화 프로필의 메틸화 밀도 간의 차이를 포함하는 차등적 파라미터를 계산하여 제1 조직의 제1 메틸화 프로필을 결정하는 단계로서, 상기 차이는 백분율로 스케일링되는 단계
    를 포함하는 방법.
  70. 제69항에 있어서, 상기 제1 메틸화 프로필로부터 제1 메틸화 수준을 결정하는 단계; 및
    상기 제1 메틸화 수준을 제1 컷오프값과 비교하여 이 비교에 기반한 암 수준의 분류를 결정하는 단계
    를 추가로 포함하는 방법.
  71. 제69항에 있어서, 상기 제1 메틸화 프로필을 변환하여 보정된 제1 메틸화 프로필을 수득하는 단계를 추가로 포함하는 방법.
  72. 제71항에 있어서, 상기 변환은 선형 변환인 방법.
  73. 제69항에 있어서, 상기 유전자좌에 대한 차등적 파라미터 D는 으로 정의되며, 식 중 mbc는 유전자좌에서 상기 제2 메틸화 프로필의 메틸화 밀도를 나타내고, mp는 유전자좌에서 무세포 메틸화 프로필의 메틸화 밀도를 나타내고, f는 생물학적 표본에서 제1 조직으로부터의 무세포 DNA 분자의 백분율이고, CN은 유전자좌에서의 복제수를 나타내는 방법.
  74. 제73항에 있어서, 상기 CN이 유전자좌에서 이염색체인 제1 조직의 복제수에 대해 1인 방법.
  75. 제73항에 있어서, D가 역치를 초과하는 영역을 확인하는 단계를 추가로 포함하는 방법.
  76. 제69항에 있어서, 하기 기준:
    50% 초과의 GC 함량;
    제1 역치 미만이거나 제2 역치 초과인 제2 메틸화 프로필의 메틸화 밀도; 및
    유전자좌에 의해 한정된 영역에서 최소 5개의 CpG 부위
    중 임의의 하나 이상을 갖는 유전자좌를 선택하여 복수의 유전자좌를 확인하는 단계를 추가로 포함하는 방법.
  77. 제69항에 있어서, 상기 생물학적 표본은 태아를 임신한 여성 대상자에서 유래되며, 상기 제1 조직은 태아 또는 태반에서 유래되고, 상기 제2 조직은 여성 대상자 유래되는 방법.
  78. 제77항에 있어서, 상기 제1 메틸화 수준을 제1 메틸화 프로필로부터 결정하는 단계; 및
    상기 제1 메틸화 수준을 제1 컷오프값과 비교하여 의학적 병태의 분류를 결정하는 단계
    를 추가로 포함하는 방법.
  79. 제78항에 있어서, 상기 의학적 병태는 제1 조직에서의 자간전증 또는 염색체 이상인 방법.
  80. 제69항에 있어서, 상기 제1 조직은 유기체 내의 종양에서 유래되고, 상기 제2 조직은 유기체의 비-악성 조직에서 유래되는 방법.
  81. 제69항에 있어서, 상기 생물학적 표본은 제2 조직으로부터의 DNA 분자를 또한 포함하고, 상기 제2 메틸화 프로필을 수득하는 단계는
    제2 조직으로부터의 DNA 분자를 분석하여 제2 메틸화 프로필을 결정하는 단계
    를 포함하는 방법.
  82. 제69항에 있어서, 상기 수득된 제2 메틸화 프로필은 대조군 표본의 군에서 수득된 평균 메틸화 프로필에 대응하는 방법.
  83. 제69항에 있어서, 상기 복수의 유전자좌 중 제1 유전자좌에 대한 무세포 메틸화 프로필의 메틸화 밀도를 결정하는 단계는
    상기 제1 유전자좌에서 유래되는 무세포 DNA 분자의 제1 수를 결정하는 단계;
    상기 제1 수의 각각의 DNA 분자가 하나 이상의 부위에서 메틸화되어 있는지의 여부를 결정하여 메틸화 DNA 분자의 제2 수를 수득하는 단계; 및
    상기 제1 수 및 제2 수로부터 메틸화 밀도를 계산하는 단계
    를 포함하는 방법.
  84. 제83항에 있어서, 상기 하나 이상의 부위는 CpG 부위인 방법.
  85. 제69항에 있어서, 상기 무세포 메틸화 프로필을 결정하는 단계는
    상기 무세포 DNA 분자를 나트륨 바이설파이트로 처리하는 것, 및
    상기 처리된 DNA 분자의 서열분석을 수행하는 것
    을 포함하는 방법.
  86. 제85항에 있어서, 상기 무세포 DNA 분자의 처리는 Tet-보조 바이설파이트 전환의 부분이거나 또는 무세포 DNA 분자를 칼륨 퍼루테네이트(KRuO4)로 처리하는 것을 포함하는 방법.
  87. 제69항에 있어서, 상기 무세포 메틸화 프로필을 결정하는 단계는
    DNA의 단일 분자 서열분석을 수행하는 단계로서, 이 단일 분자의 서열분석은 DNA 분자의 적어도 하나의 부위가 메틸화되어 있는지의 여부를 결정하는 것을 포함하는 단계
    를 포함하는 방법.
  88. 실행되는 경우 제1항의 방법을 수행하도록 컴퓨터 시스템을 제어하는 복수의 명령을 저장하는 비일시적 컴퓨터로 판독 가능한 매체를 포함하는 컴퓨터 제품.
  89. 유기체의 생물학적 표본으로부터 제1 메틸화 프로필을 결정하는 방법으로서, 상기 생물학적 표본은 제1 조직에서 그리고 제2 조직에서 기원하는 무세포 DNA의 혼합물을 포함하는 무세포 DNA를 포함하고, 상기 방법은,
    상기 생물학적 표본으로부터 복수의 DNA 분자를 분석하는 단계로서, 이 DNA 분자의 분석 단계는 유기체의 게놈에서 상기 DNA 분자의 위치를 결정하는 단계, DNA 분자의 유전형을 결정하는 단계, DNA 분자가 하나 이상의 부위에서 메틸화되어 있는지의 여부를 결정하는 단계를 포함하는 단계;
    상기 제1 조직의 제1 게놈이 각각의 제1 대립유전자 및 각각의 제2 대립유전자에 대해 이종접합성이고 상기 제2 조직의 제2 게놈이 각각의 제1 대립유전자에 대해 동종접합성인 복수의 제1 유전자좌를 확인하는 단계;
    각각의 제1 유전자좌에 대해, 상기 유전자좌와 연관된 하나 이상의 부위 각각에 있어서, 상기 부위에서 메틸화되고 유전자좌의 각각의 제2 대립유전자에 대응하는 DNA 분자의 수를 결정하는 단계, 상기 유전자좌의 하나 이상의 부위에서 메틸화되어 있고 유전자좌의 각각의 제2 대립 유전자에 대응하는 DNA 분자의 수에 기반하여 메틸화 밀도를 계산하는 단계;
    제1 유전자좌에 대한 메틸화 밀도로부터 제1 조직의 제1 메틸화 프로필을 생성하는 단계
    를 포함하는 방법.
  90. 제89항에 있어서, 상기 생물학적 표본은 태아를 임신한 여성 대상자에서 유래되고, 제1 조직은 태아 또는 태반에서 유래되며, 제2 조직은 여성 대상자에 대응하는 방법.
  91. 제89항에 있어서, 상기 부위는 CpG 부위에 대응하는 방법.
  92. 제89항에 있어서, 상기 각각의 유전자좌는 하나 이상의 CpG 부위를 포함하는 방법.
  93. 제89항에 있어서, 각각의 유전자좌는 하나 이상의 CpG 부위에 인접한 방법.
  94. 태아 DNA와 태아를 임신한 여성 대상자로부터의 DNA와의 혼합물을 함유하는 생물학적 표본 중 태아 DNA를 분석하기 위한 키트로서,
    표 S2A, S2B, S2C, S2D, S3A, S3B, S3C, 및 S3D에 기재된 게놈 영역의 구획에 적어도 특이적으로 혼성화하기 위한 하나 이상의 올리고뉴클레오티드
    를 포함하는 키트.
  95. 제94항에 있어서, 상기 하나 이상의 올리고뉴클레오티드는 게놈 영역 중 한 영역의 구획에 적어도 대응하는 프라이머인 키트.
  96. 제94항에 있어서, 상기 하나 이상의 올리고뉴클레오티드는 게놈 영역 중 한 영역의 구획에 적어도 대응하는 프로브인 키트.
  97. 제94항에 있어서, 하나 이상의 메틸화-감수성 제한 효소를 추가로 포함하는 키트.
  98. 제94항에 있어서, 상기 하나 이상의 메틸화-감수성 제한 효소 중 하나 이상은 저메틸화된 DNA 분자를 절단하는 키트.
  99. 제94항에 있어서, 상기 하나 이상의 메틸화-감수성 제한 효소 중 하나 이상은 고메틸화된 DNA 분자를 절단하는 키트.
  100. 제94항에 있어서, 상기 하나 이상의 올리고뉴클레오티드 중 하나 이상은 표 S2A에서 선택되는 키트.
  101. 제94항에 있어서, 상기 하나 이상의 올리고뉴클레오티드 중 하나 이상은 표 S2B에서 선택되는 키트.
  102. 제94항에 있어서, 상기 하나 이상의 올리고뉴클레오티드 중 하나 이상은 표 S2C에서 선택되는 키트.
  103. 제94항에 있어서, 상기 하나 이상의 올리고뉴클레오티드 중 하나 이상은 표 S2D에서 선택되는 키트.
  104. 제94항에 있어서, 상기 하나 이상의 올리고뉴클레오티드 중 하나 이상은 표 S3A에서 선택되는 키트.
  105. 제94항에 있어서, 상기 하나 이상의 올리고뉴클레오티드 중 하나 이상은 표 S3B에서 선택되는 키트.
  106. 제94항에 있어서, 상기 하나 이상의 올리고뉴클레오티드 중 하나 이상은 표 S3C에서 선택되는 키트.
  107. 제94항에 있어서, 상기 하나 이상의 올리고뉴클레오티드 중 하나 이상은 표 S3D에서 선택되는 키트.
  108. 유기체의 생물학적 표본 중 DNA의 메틸화 수준을 산정하는 방법으로서,
    복수의 크기 중 각각의 크기에 대해, 상기 크기에 대응하는 생물학적 표본으로부터의 복수의 DNA 단편의 양을 측정하는 단계;
    컴퓨터 시스템으로, 다중 크기에서의 DNA 단편의 양에 기반하여 제1 파라미터의 제1 값을 계산하는 단계로서, 상기 제1 파라미터는 생물학적 표본 중 DNA 단편의 크기 프로필의 통계적 측정치를 제공하는 단계;
    제1 크기값을 기준 크기값과 비교하는 단계로서, 상기 기준 크기값은 기준 표본의 DNA 단편으로부터 계산되는 단계; 및
    상기 비교에 기반하여 메틸화 수준을 산정하는 단계
    를 포함하는 방법.
  109. 제108항에 있어서, 상기 크기에 대응하는 DNA 단편의 양을 측정하는 단계는 생물학적 표본으로부터의 각각의 복수의 DNA 단편에 대해, DNA 단편의 크기를 측정하는 단계를 포함하고,
    상기 DNA 단편의 크기를 측정하는 단계는 상기 DNA 단편의 페어-엔드 서열분석을 수행하여 페어링된 서열 판독치를 수득하는 단계, 상기 페어링된 서열 판독치를 기준 게놈에 대해 정렬하는 단계, 및 상기 정렬된 위치를 이용하여 DNA 단편의 크기를 결정하는 단계를 포함하는 방법.
  110. 제109항에 있어서, 상기 메틸화 수준은 특정 영역에 대해 정렬되는 DNA 단편으로부터만 제1 크기값을 결정함으로써 특정 영역에 대응하는 방법.
  111. 제108항에 있어서, 상기 크기에 대응하는 DNA 단편의 양을 측정하는 단계는 전기영동을 이용하는 것을 포함하는 방법.
  112. 제108항에 있어서, 상기 기준 표본은 상기 생물학적 표본보다 빠른 시기에 유기체로부터 수득되고, 상기 산정된 메틸화 수준은 기준 크기값에 비하여 제1 크기값의 증가 또는 감소의 양에 대응하는 상대 수준인 방법.
  113. 제108항에 있어서, 상기 기준 크기값이 검정 곡선의 일부인 방법.
  114. 제108항에 있어서, 상기 메틸화 수준은 메틸화 밀도인 방법.
  115. 제114항에 있어서, 상기 메틸화 밀도는 CpG 부위에 대한 것인 방법.
  116. 유기체의 생물학적 표본으로부터 염색체 이상을 검출하는 방법으로서, 상기 생물학적 표본은 제1 조직에서 그리고 제2 조직에서 기원하는 무세포 DNA의 혼합물을 포함하고, 상기 방법은,
    상기 생물학적 표본으로부터 복수의 DNA 분자를 분석하는 단계로서, 이 DNA 분자의 분석 단계는
    기준 게놈에서 상기 DNA 분자의 위치를 결정하는 단계,
    DNA 분자가 하나 이상의 부위에서 메틸화되어 있는지의 여부를 결정하는 단계,
    복수의 부위 각각에 대해, 상기 부위에서 메틸화되어 있는 DNA 분자의 각각의 수를 결정하는 단계
    를 포함하는 단계;
    제1 염색체 영역 내 부위에서 메틸화되어 있는 DNA 분자의 각각의 수에 기반하여 상기 제1 염색체 영역의 제1 메틸화 수준을 계산하는 단계;
    상기 제1 메틸화 수준을 컷오프값과 비교하는 단계;
    상기 비교에 기반하여 상기 제1 염색체 영역에 대해 제1 조직에서 이상 분류를 결정하는 단계
    를 포함하는 방법.
  117. 제116항에 있어서, 상기 제1 메틸화 수준을 컷오프값과 비교하는 단계는
    상기 제1 메틸화 수준을 정규화하는 단계, 및
    상기 정규화된 제1 메틸화 수준을 컷오프값과 비교하는 단계
    를 포함하는 방법.
  118. 제117항에 있어서, 상기 정규화는 제2 염색체 영역의 제2 메틸화 수준을 이용하는 방법.
  119. 제117항에 있어서, 상기 정규화는 제1 조직으로부터의 무세포 DNA의 분획 농도를 이용하는 방법.
  120. 제116항에 있어서, 상기 제1 메틸화 수준을 계산하는 단계는
    유기체 게놈의 복수 영역을 확인하는 단계,
    상기 영역의 각각 내에서 하나 이상의 부위를 확인하는 단계,
    각 영역에 대해 영역 메틸화 수준을 계산하는 단계
    를 포함하며, 상기 제1 메틸화 수준은 제1 영역에 대한 것이고,
    상기 제1 메틸화 수준을 제1 컷오프값과 비교하는 단계는
    각각의 영역 메틸화 수준을 각각의 영역 컷오프값과 비교하는 단계,
    상기 영역 메틸화 수준이 각각의 영역 컷오프값을 초과하는 영역의 제1 수를 결정하는 단계, 및
    상기 제1 수를 역치값과 비교하여 분류를 결정하는 단계
    를 포함하는 방법.
  121. 제120항에 있어서, 상기 역치값은 백분율이며, 상기 제1 수를 역치값과 비교하는 단계는,
    상기 영역의 제1 수를, 역치값과 비교하기 전에, 영역의 제2 수로 나누는 것
    을 포함하는 방법.
  122. 제121항에 있어서, 상기 영역의 제2 수는 확인된 복수 영역의 전체인 방법.
  123. 제120항에 있어서, 상기 각각의 영역 컷오프값은 기준 메틸화 수준으로부터의 특정된 양인 방법.
  124. 제116항에 있어서, 상기 생물학적 표본은 태아를 임신한 여성 대상자에서 유래되고, 제1 조직은 태아 또는 태반에서 유래되며, 제2 조직은 여성 대상자에서 유래되고, 염색체 이상은 태아 염색체 이상인 방법.
  125. 제116항에 있어서, 상기 컷오프값은 여성 대상자로부터의 상기 제2 조직의 DNA와 연관된 배경 메틸화 수준에 기반하는 방법.
  126. 제124항에 있어서, 상기 컷오프값은 제1 염색체 영역에 대해 염색체 이상이 없는 태아를 가진 다른 여성 임신 대상자로부터 결정되는 방법.
  127. 제124항에 있어서, 상기 염색체 이상이 삼염색체증 21 또는 삼염색체증 18 또는 삼염색체증 13 또는 터너 증후군 또는 클라인펠터 증후군인 방법.
  128. 제116항에 있어서, 상기 제1 조직이 유기체 내의 종양에서 유래되고, 상기 제2 조직이 상기 유기체의 비-악성 조직에서 유래되는 방법.
  129. 제116항에 있어서, 상기 컷오프값은 암을 갖지 않는 다른 유기체로부터 결정되는 방법.
  130. 제116항에 있어서, 상기 컷오프값은 생물학적 표본 중 제1 조직으로부터 기원하는 무세포 DNA의 농도에 기반하는 방법.
  131. 제130항에 있어서, 상기 컷오프값은 한 유형의 이상에 대응하는 스케일 인자에 기반하며, 상기 한 유형의 이상은 결실 또는 중복인 방법.
  132. 제116항에 있어서, 상기 기준 게놈에서의 DNA 분자의 위치를 결정하는 단계는 상기 위치가 제1 염색체 영역 내에 있는지의 여부를 결정하는 단계를 포함하는 방법.
  133. 제132항에 있어서, 상기 기준 게놈에서의 DNA 분자의 위치를 결정하는 단계는 DNA 분자가 제1 염색체 영역에 맵핑되는지의 여부를 결정함으로써 달성되는 방법.
  134. 제116항에 있어서, 상기 염색체 이상은 아염색체 결실 또는 아염색체 중복 또는 디조지 증후군인 방법.
KR1020237033920A 2012-09-20 2013-09-20 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정 KR20230145530A (ko)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US201261703512P 2012-09-20 2012-09-20
US61/703,512 2012-09-20
US13/842,209 US9732390B2 (en) 2012-09-20 2013-03-15 Non-invasive determination of methylome of fetus or tumor from plasma
US13/842,209 2013-03-15
US201361830571P 2013-06-03 2013-06-03
US61/830,571 2013-06-03
PCT/AU2013/001088 WO2014043763A1 (en) 2012-09-20 2013-09-20 Non-invasive determination of methylome of fetus or tumor from plasma
KR1020227013227A KR102587176B1 (ko) 2012-09-20 2013-09-20 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020227013227A Division KR102587176B1 (ko) 2012-09-20 2013-09-20 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정

Publications (1)

Publication Number Publication Date
KR20230145530A true KR20230145530A (ko) 2023-10-17

Family

ID=50340462

Family Applications (5)

Application Number Title Priority Date Filing Date
KR1020157010184A KR102148547B1 (ko) 2012-09-20 2013-09-20 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정
KR1020217030373A KR102390711B1 (ko) 2012-09-20 2013-09-20 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정
KR1020237033920A KR20230145530A (ko) 2012-09-20 2013-09-20 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정
KR1020227013227A KR102587176B1 (ko) 2012-09-20 2013-09-20 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정
KR1020207019527A KR102307424B1 (ko) 2012-09-20 2013-09-20 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020157010184A KR102148547B1 (ko) 2012-09-20 2013-09-20 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정
KR1020217030373A KR102390711B1 (ko) 2012-09-20 2013-09-20 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020227013227A KR102587176B1 (ko) 2012-09-20 2013-09-20 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정
KR1020207019527A KR102307424B1 (ko) 2012-09-20 2013-09-20 혈장으로부터 태아 또는 종양 메틸롬의 비침습적 결정

Country Status (27)

Country Link
EP (6) EP3839065A1 (ko)
JP (5) JP6317354B2 (ko)
KR (5) KR102148547B1 (ko)
CN (2) CN117757932A (ko)
AU (4) AU2013317708C1 (ko)
BR (3) BR122021021825B1 (ko)
CA (2) CA2884066C (ko)
CY (1) CY1124139T1 (ko)
DK (3) DK2898100T4 (ko)
EA (1) EA201500327A1 (ko)
ES (2) ES2665273T5 (ko)
FI (1) FI3536807T3 (ko)
HK (3) HK1206797A1 (ko)
HR (2) HRP20240210T1 (ko)
HU (1) HUE053822T2 (ko)
IL (3) IL299444A (ko)
LT (1) LT3354747T (ko)
MX (1) MX360034B (ko)
MY (2) MY173356A (ko)
NZ (2) NZ706269A (ko)
PH (1) PH12015500547A1 (ko)
PL (2) PL2898100T5 (ko)
PT (3) PT2898100T (ko)
SG (2) SG10201705198UA (ko)
TW (5) TWI640634B (ko)
WO (1) WO2014043763A1 (ko)
ZA (1) ZA201501772B (ko)

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI335354B (en) 2006-09-27 2011-01-01 Univ Hong Kong Chinese Methods for the detection of the degree of the methylation of a target dna and kits
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
NZ706269A (en) 2012-09-20 2016-08-26 Univ Hong Kong Chinese Non-invasive determination of methylome of fetus or tumor from plasma
US10706957B2 (en) 2012-09-20 2020-07-07 The Chinese University Of Hong Kong Non-invasive determination of methylome of tumor from plasma
US9732390B2 (en) 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
WO2015013885A1 (zh) * 2013-07-30 2015-02-05 深圳华大基因科技有限公司 确定核酸混合物中核酸组成的方法
US10174375B2 (en) * 2013-09-20 2019-01-08 The Chinese University Of Hong Kong Sequencing analysis of circulating DNA to detect and monitor autoimmune diseases
US20160369331A1 (en) * 2014-02-18 2016-12-22 Bionano Genomics, Inc. Improved methods of determining nucleic acid structural information
EP2942400A1 (en) 2014-05-09 2015-11-11 Lifecodexx AG Multiplex detection of DNA that originates from a specific cell-type
EP3140421B8 (en) 2014-05-09 2020-05-06 Eurofins LifeCodexx GmbH Detection of dna that originates from a specific cell-type and related methods
PT3543356T (pt) * 2014-07-18 2021-10-04 Univ Hong Kong Chinese Análise dos padrões de metilação de tecidos em mistura de adn
WO2016010401A1 (ko) * 2014-07-18 2016-01-21 에스케이텔레콘 주식회사 산모의 혈청 dna를 이용한 태아의 단일유전자 유전변이의 예측방법
EP4358097A1 (en) 2014-07-25 2024-04-24 University of Washington Methods of determining tissues and/or cell types giving rise to cell-free dna, and methods of identifying a disease or disorder using same
US10364467B2 (en) * 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
PT3256605T (pt) 2015-02-10 2022-03-17 Univ Hong Kong Chinese Deteção de mutações para rastreio de cancro e análise fetal
EP3739061B1 (en) * 2015-07-20 2022-03-23 The Chinese University Of Hong Kong Methylation pattern analysis of haplotypes in tissues in dna mixture
IL305462A (en) 2015-07-23 2023-10-01 Univ Hong Kong Chinese DNA fragmentation pattern analysis suitable clean
US11319586B2 (en) 2015-08-12 2022-05-03 The Chinese University Of Hong Kong Single-molecule sequencing of plasma DNA
CN115035949A (zh) 2015-09-22 2022-09-09 香港中文大学 通过母亲血浆dna的浅深度测序准确定量胎儿dna分数
US10260088B2 (en) * 2015-10-30 2019-04-16 New England Biolabs, Inc. Compositions and methods for analyzing modified nucleotides
EP4180532A1 (en) * 2015-11-09 2023-05-17 Roche Molecular Systems, Inc. Methods for determining the origin of dna molecules
HUE050491T2 (hu) 2015-11-10 2020-12-28 Eurofins Lifecodexx Gmbh Magzati kromoszomális aneuploidiák kimutatása olyan DNS régiókat alkalmazva, amelyek különbözõképpen vannak metilezve a magzat és a terhes nõstény között
AU2016370835B2 (en) * 2015-12-17 2020-02-13 Illumina, Inc. Distinguishing methylation levels in complex biological samples
CN116640847A (zh) * 2016-02-02 2023-08-25 夸登特健康公司 癌症进化检测和诊断
US11514289B1 (en) 2016-03-09 2022-11-29 Freenome Holdings, Inc. Generating machine learning models using genetic data
US11078475B2 (en) * 2016-05-03 2021-08-03 Sinai Health System Methods of capturing cell-free methylated DNA and uses of same
US20190256921A1 (en) * 2016-05-04 2019-08-22 Queen's University At Kingston Cell-free detection of methylated tumour dna
KR102605504B1 (ko) * 2016-05-30 2023-11-22 더 차이니즈 유니버시티 오브 홍콩 혈액 내 무세포 dna를 사용하는 혈액 장애의 검출
JP7066643B2 (ja) * 2016-06-16 2022-05-13 ザ・ジョンズ・ホプキンス・ユニバーシティ エピジェネティクス解析の為の方法及びシステム
US20230183795A1 (en) * 2016-08-24 2023-06-15 Shanghai Institutes For Biological Sciences, Chinese Academy Of Sciences Novel Modification of 5-Methylcytosine Catalyzed by CMD1 Enzyme and Application Thereof
EP4209598A1 (en) 2016-10-19 2023-07-12 The Chinese University of Hong Kong Gestational age assessment by methylation and size profiling of maternal plasma dna
EP3535415A4 (en) 2016-10-24 2020-07-01 The Chinese University of Hong Kong TUMOR DETECTION METHODS AND SYSTEMS
CN109983134A (zh) 2016-11-30 2019-07-05 香港中文大学 尿液和其他样品中无细胞dna的分析
WO2018112100A2 (en) * 2016-12-13 2018-06-21 Bellwether Bio, Inc. Determining a physiological condition in an individual by analyzing cell-free dna fragment endpoints in a biological sample
MX2019008320A (es) * 2017-01-11 2019-09-09 Quest Diagnostics Invest Llc Metodo para la deteccion prenatal no invasiva de aneuploidia.
WO2018137496A1 (zh) * 2017-01-24 2018-08-02 深圳华大基因股份有限公司 确定生物样本中预定来源的游离核酸比例的方法及装置
TWI803477B (zh) 2017-01-25 2023-06-01 香港中文大學 使用核酸片段之診斷應用
CN107247873B (zh) * 2017-03-29 2020-04-14 电子科技大学 一种差异甲基化位点识别方法
EP3622091A4 (en) * 2017-05-12 2021-02-17 President and Fellows of Harvard College UNIVERSAL EARLY CANCER DIAGNOSIS
WO2019014455A2 (en) * 2017-07-12 2019-01-17 Ande Corporation PATTERN RECOGNITION SYSTEM
CA3069754A1 (en) * 2017-07-12 2019-01-17 University Health Network Cancer detection and classification using methylome analysis
AU2018305609B2 (en) * 2017-07-26 2023-01-19 The Chinese University Of Hong Kong Enhancement of cancer screening using cell-free viral nucleic acids
US20200263170A1 (en) 2017-09-14 2020-08-20 Grail, Inc. Methods for preparing a sequencing library from single-stranded dna
EP4269583A3 (en) 2017-09-28 2024-01-17 Grail, LLC Enrichment of short nucleic acid fragments in sequencing library preparation
US11168356B2 (en) 2017-11-02 2021-11-09 The Chinese University Of Hong Kong Using nucleic acid size range for noninvasive cancer detection
CN112534506A (zh) * 2018-03-15 2021-03-19 格瑞尔公司 组织特异性的甲基化标志物
SG11202009696WA (en) * 2018-04-13 2020-10-29 Freenome Holdings Inc Machine learning implementation for multi-analyte assay of biological samples
US11932899B2 (en) * 2018-06-07 2024-03-19 10X Genomics, Inc. Methods and systems for characterizing nucleic acid molecules
CN109448789A (zh) * 2018-09-17 2019-03-08 上海派森诺生物科技股份有限公司 一种基于perl语言的种群特异SNP位点的自动化分析方法
AU2019351130A1 (en) 2018-09-27 2021-04-08 Grail, Llc Methylation markers and targeted methylation probe panel
CN109295230A (zh) * 2018-10-24 2019-02-01 福建翊善生物科技有限公司 一种基于ctDNA的多基因联合突变检测评估肿瘤动态变化的方法
WO2020125709A1 (en) * 2018-12-19 2020-06-25 The Chinese University Of Hong Kong Cell-free dna end characteristics
US20200239965A1 (en) 2018-12-21 2020-07-30 Grail, Inc. Source of origin deconvolution based on methylation fragments in cell-free dna samples
EP3921445A4 (en) 2019-02-05 2022-10-26 Grail, LLC DETECTION OF CANCER, ORIGIN CANCER TISSUE, AND/OR A CANCER CELL TYPE
WO2020163410A1 (en) 2019-02-05 2020-08-13 Grail, Inc. Detecting cancer, cancer tissue of origin, and/or a cancer cell type
US11773450B2 (en) 2019-04-03 2023-10-03 Grail, Llc Methylation-based false positive duplicate marking reduction
CN115244188A (zh) * 2019-05-03 2022-10-25 康奈尔大学 用于鉴定和定量核酸序列突变、表达、剪接变体、易位、拷贝数或甲基化变化的标记物
AU2020333348B2 (en) * 2019-08-19 2023-11-23 Green Cross Genome Corporation Method for detecting chromosomal abnormality by using information about distance between nucleic acid fragments
KR102452413B1 (ko) * 2019-08-19 2022-10-11 주식회사 지씨지놈 핵산 단편간 거리 정보를 이용한 염색체 이상 검출 방법
GB201915469D0 (en) 2019-10-24 2019-12-11 Univ London Cancer detection methods
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
WO2021174072A1 (en) * 2020-02-28 2021-09-02 Grail, Inc. Identifying methylation patterns that discriminate or indicate a cancer condition
CN112662764A (zh) * 2020-03-17 2021-04-16 博尔诚(北京)科技有限公司 一种检测11种癌症的探针组合物
RU2738675C1 (ru) * 2020-07-28 2020-12-15 Федеральное государственное автономное образовательное учреждение высшего образования "Белгородский государственный национальный исследовательский университет" (НИУ "БелГУ") Способ прогнозирования риска развития преэклампсии у женщин без отягощенного семейного анамнеза с учетом генетических факторов
CN112813148A (zh) * 2021-02-02 2021-05-18 博淼生物科技(北京)有限公司 飞行时间质谱检测5-羟甲基胞嘧啶的方法
WO2023052917A1 (en) * 2021-09-28 2023-04-06 Act Genomics (ip) Limited Methylation biomarker selection apparatuses and methods
KR20230059423A (ko) * 2021-10-26 2023-05-03 주식회사 지씨지놈 메틸화된 무세포 핵산을 이용한 암 진단 및 암 종 예측방법
US20230138633A1 (en) * 2021-11-04 2023-05-04 Universal Diagnostics, S.L. Systems and methods for preparing biological samples for genetic sequencing
CN115064211B (zh) * 2022-08-15 2023-01-24 臻和(北京)生物科技有限公司 一种基于全基因组甲基化测序的ctDNA预测方法及装置
CN115612723B (zh) * 2022-09-26 2023-07-14 广州女娲生命科技有限公司 植入前胚胎的筛选方法
CN117025753A (zh) * 2023-08-15 2023-11-10 广州女娲生命科技有限公司 检测染色体变异的方法和装置
CN117079822B (zh) * 2023-10-17 2024-01-02 北京大学第三医院(北京大学第三临床医学院) 一种妊娠早中期四因子预测胎儿脑损伤的系统

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
ES2253461T3 (es) 2002-03-05 2006-06-01 Epigenomics Ag Procedimiento y dispositivo para la determinacion de la especificidad del tejido y del adn que flota libre en tejidos corporales.
WO2004046332A2 (en) * 2002-11-19 2004-06-03 Amgen Inc. Amplified genes involved in cancer
US20060183128A1 (en) 2003-08-12 2006-08-17 Epigenomics Ag Methods and compositions for differentiating tissues for cell types using epigenetic markers
DE10348407A1 (de) 2003-10-17 2005-05-19 Widschwendter, Martin, Prof. Prognostische und diagnostische Marker für Zell-proliferative Erkrankungen von Brustgeweben
US8440404B2 (en) * 2004-03-08 2013-05-14 Rubicon Genomics Methods and compositions for generating and amplifying DNA libraries for sensitive detection and analysis of DNA methylation
EP1888786A4 (en) 2005-05-27 2009-12-30 Wayne John Cancer Inst USE FREE CIRCULATIVE DNA FOR THE DIAGNOSIS, FORECAST AND TREATMENT OF CANCER
US7754428B2 (en) * 2006-05-03 2010-07-13 The Chinese University Of Hong Kong Fetal methylation markers
US7901884B2 (en) * 2006-05-03 2011-03-08 The Chinese University Of Hong Kong Markers for prenatal diagnosis and monitoring
TWI335354B (en) * 2006-09-27 2011-01-01 Univ Hong Kong Chinese Methods for the detection of the degree of the methylation of a target dna and kits
EP2173897A2 (en) 2007-06-19 2010-04-14 Oncomethylome Sciences SA Improved urine sample collecting and processing
US20090029377A1 (en) 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing
US20110028333A1 (en) 2009-05-01 2011-02-03 Brown University Diagnosing, prognosing, and early detection of cancers by dna methylation profiling
US8563242B2 (en) * 2009-08-11 2013-10-22 The Chinese University Of Hong Kong Method for detecting chromosomal aneuploidy
US20120208711A1 (en) * 2009-10-02 2012-08-16 Centre For Addiction And Mental Health Method for Analysis of DNA Methylation Profiles of Cell-Free Circulating DNA in Bodily Fluids
FI3783110T3 (fi) * 2009-11-05 2023-03-02 Fetaalisen genomin analyysi maternaalisesta biologisesta näytteestä
BR112012010708A2 (pt) 2009-11-06 2016-03-29 Univ Hong Kong Chinese método para realizar diagnóstico pré-natal, e, produto de programa de computador
CA2786564A1 (en) * 2010-01-19 2011-07-28 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
US9249462B2 (en) * 2010-01-26 2016-02-02 Nipd Genetics Ltd Methods and compositions for noninvasive prenatal diagnosis of fetal aneuploidies
CA3007713C (en) 2010-04-29 2020-05-26 The Regents Of The University Of California Pathway recognition algorithm using data integration on genomic models (paradigm)
GB201007944D0 (en) 2010-05-12 2010-06-30 Univ Aberystwyth Methods
WO2011150075A2 (en) 2010-05-25 2011-12-01 The Johns Hopkins University Compositions and methods for detecting a neoplasia
MX361944B (es) * 2010-07-23 2018-12-19 President And Fellows Of Harvard College Star Metodos para detectar firmas de enfermedad o condiciones en fluidos corporales.
SG186787A1 (en) * 2010-07-23 2013-02-28 Esoterix Genetic Lab Llc Identification of differentially represented fetal or maternal genomic regions and uses thereof
WO2012031329A1 (en) * 2010-09-10 2012-03-15 Murdoch Childrens Research Institute Assay for detection and monitoring of cancer
CN105243295B (zh) 2010-11-30 2018-08-17 香港中文大学 与癌症相关的遗传或分子畸变的检测
NZ706269A (en) * 2012-09-20 2016-08-26 Univ Hong Kong Chinese Non-invasive determination of methylome of fetus or tumor from plasma

Also Published As

Publication number Publication date
EP2898100B1 (en) 2017-11-22
TW201418474A (zh) 2014-05-16
TWI784258B (zh) 2022-11-21
HK1257868A1 (zh) 2019-11-01
ZA201501772B (en) 2016-10-26
WO2014043763A1 (en) 2014-03-27
MX360034B (es) 2018-10-19
HK1206797A1 (en) 2016-01-15
EP2898100B9 (en) 2023-08-02
HUE053822T2 (hu) 2021-07-28
EP3354747B1 (en) 2021-02-17
CA2884066C (en) 2021-08-10
JP6985753B2 (ja) 2021-12-22
TWI640634B (zh) 2018-11-11
NZ717423A (en) 2017-08-25
BR122021021825B1 (pt) 2022-05-24
DK2898100T3 (en) 2018-02-26
JP2024009833A (ja) 2024-01-23
EP3536807B1 (en) 2023-11-29
ES2665273T5 (es) 2023-10-02
HK1207124A1 (en) 2016-01-22
KR20200085928A (ko) 2020-07-15
EP2898100A1 (en) 2015-07-29
PL3354747T3 (pl) 2021-07-26
SG10201705198UA (en) 2017-07-28
AU2022201026A1 (en) 2022-03-10
HRP20210716T1 (hr) 2021-06-11
KR20150082228A (ko) 2015-07-15
JP6683752B2 (ja) 2020-04-22
EP3354747A1 (en) 2018-08-01
LT3354747T (lt) 2021-04-12
AU2017251832A1 (en) 2017-11-16
KR102587176B1 (ko) 2023-10-06
EP3536807A1 (en) 2019-09-11
MY173356A (en) 2020-01-21
TW202305145A (zh) 2023-02-01
EA201500327A1 (ru) 2015-07-30
ES2862726T3 (es) 2021-10-07
CA3122779A1 (en) 2014-03-27
AU2020200128A1 (en) 2020-01-30
PT2898100T (pt) 2018-02-26
IL237495A0 (en) 2015-04-30
EP4335929A2 (en) 2024-03-13
IL299444A (en) 2023-02-01
TW201907013A (zh) 2019-02-16
EP4056712A1 (en) 2022-09-14
EP2898100B2 (en) 2023-05-10
IL268512A (en) 2019-09-26
BR112015006183A2 (pt) 2017-07-04
AU2020200128B2 (en) 2021-11-18
AU2013317708C1 (en) 2017-11-23
PL2898100T3 (pl) 2018-06-29
DK3354747T3 (da) 2021-04-19
TW202043483A (zh) 2020-12-01
NZ706269A (en) 2016-08-26
JP2018121644A (ja) 2018-08-09
PT3536807T (pt) 2024-02-01
AU2017251832B2 (en) 2019-10-10
CN104781422B (zh) 2023-12-26
CA2884066A1 (en) 2014-03-27
TWI806621B (zh) 2023-06-21
KR102390711B1 (ko) 2022-04-26
PH12015500547A1 (en) 2015-05-04
PL2898100T5 (pl) 2023-11-06
IL237495B (en) 2019-09-26
AU2013317708B2 (en) 2017-08-03
KR102307424B1 (ko) 2021-09-29
JP2015536639A (ja) 2015-12-24
PT3354747T (pt) 2021-05-07
CN104781422A (zh) 2015-07-15
BR112015006183B1 (pt) 2022-04-26
JP6317354B2 (ja) 2018-04-25
JP2020108400A (ja) 2020-07-16
EP2898100A4 (en) 2016-05-11
ES2665273T3 (es) 2018-04-25
CN117757932A (zh) 2024-03-26
IL268512B2 (en) 2023-06-01
HRP20240210T1 (hr) 2024-05-10
EP3839065A1 (en) 2021-06-23
KR20210120124A (ko) 2021-10-06
SG11201501927VA (en) 2015-04-29
DK3536807T3 (da) 2024-02-05
CY1124139T1 (el) 2022-05-27
MY187444A (en) 2021-09-22
KR102148547B1 (ko) 2020-08-26
JP2022031753A (ja) 2022-02-22
DK2898100T4 (da) 2023-07-24
TW202334438A (zh) 2023-09-01
KR20220065034A (ko) 2022-05-19
MX2015003571A (es) 2015-06-22
AU2013317708A1 (en) 2015-04-09
FI3536807T3 (fi) 2024-02-01
TWI707953B (zh) 2020-10-21
BR122021021823B1 (pt) 2023-04-25

Similar Documents

Publication Publication Date Title
JP6985753B2 (ja) 血漿による胎児または腫瘍のメチロームの非侵襲的決定
US20220267861A1 (en) Non-invasive determination of tissue source of cell-free dna
EA042157B1 (ru) Неинвазивное определение метилома плода или опухоли по плазме

Legal Events

Date Code Title Description
A107 Divisional application of patent