KR102082025B1 - 대량 동시 rna 서열분석에 의한 모체 혈장 전사물 분석 - Google Patents

대량 동시 rna 서열분석에 의한 모체 혈장 전사물 분석 Download PDF

Info

Publication number
KR102082025B1
KR102082025B1 KR1020157022741A KR20157022741A KR102082025B1 KR 102082025 B1 KR102082025 B1 KR 102082025B1 KR 1020157022741 A KR1020157022741 A KR 1020157022741A KR 20157022741 A KR20157022741 A KR 20157022741A KR 102082025 B1 KR102082025 B1 KR 102082025B1
Authority
KR
South Korea
Prior art keywords
allele
locus
fetal
rna
informative
Prior art date
Application number
KR1020157022741A
Other languages
English (en)
Other versions
KR20150123807A (ko
Inventor
육 밍 데니스 로
로사 와이 쿤 치우
콴 치 찬
페이용 지앙
보 인 추이
Original Assignee
더 차이니즈 유니버시티 오브 홍콩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 차이니즈 유니버시티 오브 홍콩 filed Critical 더 차이니즈 유니버시티 오브 홍콩
Publication of KR20150123807A publication Critical patent/KR20150123807A/ko
Application granted granted Critical
Publication of KR102082025B1 publication Critical patent/KR102082025B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

임신 관련 장애를 진단하고/하거나, 대립유전자 비율을 결정하고/하거나, 순환하는 전사체에 대한 모체 또는 태아 기여도를 결정하고/하거나, 임신한 암컷 피험체로부터 샘플을 사용하여 모체 또는 태아 마커를 확인하는 방법이 제공된다. 또한 임신한 암컷 피험체에서 임신 관련 장애를 진단하기 위한 유전자의 용도가 제공된다.

Description

대량 동시 RNA 서열분석에 의한 모체 혈장 전사물 분석{MATERNAL PLASMA TRANSCRIPTOME ANALYSIS BY MASSIVELY PARALLEL RNA SEQUENCING}
관련 출원에 대한 상호 참조
본원은 2013년 2월 28일자에 출원된 발명의 명칭이 "대량 동시 RNA 서열 분석에 의한 모체 혈장 전사물 분석(MATERNAL PLASMA TRANSCRIPTOME ANALYSIS BY MASSIVELY PARALLEL RNA SEQUENCING)"(모든 목적을 위해 참고로 본 명세서에 포함됨)인 미국 가출원 제61/770,985호에 대한 우선권을 주장한다.
모체 혈장에서 임신 특이적인 세포외 RNA 분자가 보고되었다1. 이것은 단순히 모친으로부터의 말초 혈액 견본을 사용하여 태아 평가 및 임신 모니터링에 대한 비침습적 시험 도구를 제공한다. 현재까지, 모체 혈장 RNA를 사용하여 다수의 유망한 산전 진단 어플리케이션이 개발되었다2-8. 조사자들은 태아 장애 및 임신 병리학의 다른 상황에서 어플리케이션을 확대하기 위해 추가의 RNA 마커에 대해 활발히 조사하고 있다.
이론적으로, 대부분의 간단한 RNA 마커 확인 방법은 모체 혈장에서 세포외 RNA 분자를 직접 프로파일링하는 것이다. 이 방법은 그러나 쉽지 않은데, 왜냐하면 종래의 고속 스크리닝 기술, 예컨대 마이크로어레이 분석 및 유전자 발현의 연속 분석(serial analysis of gene expression: SAGE)은 모체 혈장에서 통상적으로 낮은 농도의 부분적으로 분해된 세포외 RNA를 검출하는 제한된 능력을 갖기 때문이다9. 대신에, 대부분의 보고된 RNA 마커 스크리닝 전략은 태반과 모체 혈액 세포의 발현 프로파일을 비교함으로써 간접적으로 작동한다10. 매우 민감하지만 저속인 기술, 예컨대 실시간 역전사효소 중합효소 사슬 반응(real-time reverse transcriptase polymerase chain reaction: RT-PCR)에 의해 모체 혈액 세포에서보다 태반에서 훨씬 더 높게 발현된 전사체만이 모체 혈장 샘플에서 추가로 연구되었다. 여태까지, 이 간접 방법에 의해 확인된 혈장 RNA 마커는 비교적 제한된다. 이것은 아마도 조직 기반 조사 전략이 모체 혈장에서 태반 RNA 수준에 영향을 미치는 생물학적 인자 모두를 완전히 고려하지 않기 때문이다. 또한, 임신에 반응하여 발현되고 비태반 조직에 의해 방출된 전사체는 이 방법에 의해 확인될 수 없다. 모체 혈장 전사물의 직접적인 프로파일링을 허용하는 민감하고 고속인 방법론이 따라서 매우 바람직할 것이다.
유사하게, 직접적인 혈장 RNA 프로파일링은 예컨대 장기 이식의 경우 2명의 개체로부터의 RNA 분자의 혼합물이 존재하는 다른 시나리오에서 유용할 수 있다. 이식 수혜자의 순환은 공여자 및 수혜자 둘 다로부터의 핵산 분자를 함유한다. 공여자 또는 수혜자가 기여한 RNA 분자의 상대 프로파일의 변화는 이식된 장기 또는 수혜자에서의 병리학, 예컨대 이식편 거부를 나타낼 수 있다.
임신 관련 장애를 진단하고/하거나, 대립유전자 비율을 결정하고/하거나, 순환하는 전사체에 대한 모체 또는 태아 기여도를 결정하고/하거나, 임신한 암컷 피험체로부터의 샘플을 사용하여 모체 또는 태아 마커를 확인하는 방법, 시스템 및 장치가 제공된다. 몇몇 실시형태에서, 샘플은 모체 및 태아 유래 RNA 분자의 혼합물을 함유하는 혈액 혈장이다.
RNA 분자를 분석(예를 들어, 서열분석)하여 복수의 리드(read)를 얻고, 기준 서열(reference sequence)에서의 이 리드의 위치를 (예를 들어, 서열 정렬에 의해) 확인한다. 모친 또는 태아에서 제1 대립유전자에 대해 동형접합성(homozygous)이고, 모친 및 태아의 다른 하나에서의 제1 대립유전자 및 제2 대립유전자에 대해 이형접합성(heterozygous)인 정보제공 좌위(informative loci)를 확인한다. 이후, 정보제공 좌위를 여과시키고, 여과된 정보제공 좌위에 위치한(예를 들어, 이에 정렬된) 리드를 추가로 분석한다. 몇몇 실시형태에서, 제1 대립유전자 및 제2 대립유전자에 상응하는 리드의 비율을 계산하고 컷오프(cutoff)와 비교하여 임신 관련 장애를 진단한다. 몇몇 실시형태에서, 여과된 정보제공 모체 좌위에 위치한 리드를 사용하여 태아 기원인 샘플에서의 RNA의 부분을 결정한다. 몇몇 실시형태에서, 각각의 여과된 정보제공 좌위에 대해 제1 대립유전자 및 제2 대립유전자에 상응하는 리드의 비율을 계산하고, 그 비율을 컷오프와 비교하여 모체 또는 태아 마커로서 좌위를 지정한다.
본 방법은 산전 진단으로 제한되지 않고, 2명의 개체로부터 유래한 RNA 분자의 혼합물을 함유하는 임의의 생물학적 샘플에 적용될 수 있다. 예를 들어, 장기 이식 수혜자로부터 얻은 혈액 혈장 샘플을 사용할 수 있다. 이식된 장기에서 발현된 전사체는 공여자의 유전자형을 반영하여, 수혜자의 혈액에서 검출 가능한 수준으로 발생한다. 이 전사체를 판독함으로써, 공여자 및 수혜자 둘 다에 의해 발현된 유전자 내의 정보제공 좌위를 확인할 수 있고, 각각의 개체로부터의 대립유전자의 상대 발현 수준을 측정할 수 있다. 공여자 또는 수혜자만 원인이 되는 대립유전자의 비정상 발현 수준을 이용하여 이식 관련 장애를 진단할 수 있다.
본 방법에서 사용될 수 있는 생물학적 샘플은 혈액, 혈장, 혈청, 뇨, 타액 및 조직 샘플을 포함한다. 예를 들어, 태아 핵산은 임신한 여성의 뇨에서 검출된다. 신장 이식의 수혜자의 뇨는 이식된 장기로부터의 세포 비함유 핵산 및 세포를 포함하는 것으로 나타났다. 많은 환경에서 미소키메리즘(microchierism)이 관찰된다. 미소키메리즘은 특정한 개체의 장기 및 조직을 포함하여, 신체에서 다른 사람으로부터의 세포 또는 핵산의 공급원의 존재를 의미한다. 미소키메리즘은 갑상선, 간, 비장, 피부, 골수 및 다른 조직의 생검에서 관찰된다. 미소키메리즘은 이전의 임신 또는 혈액 수혈의 결과로서 발생할 수 있다.
임신한 암컷 피험체에서의 임신 관련 장애를 진단하기 위한 유전자의 용도가 또한 제공된다. 유전자의 발현 수준은 각각 건강한 태아를 임신한 하나 이상의 다른 암컷 피험체로부터 결정된 대조군 값과 비교된다. 본 명세서에서 다루는 임신 관련 장애는 임신중독증, 자궁내 발육 지연, 침윤성 태반형성(invasive placentation) 및 조산을 포함한다. 다른 임신 관련 장애는 태아를 태아 사망의 위험에 놓는 상태, 예컨대 신생아의 용혈 질환, 태반 기능부전, 태아수종, 태아 기형일 수 있다. 또 다른 임신 관련 질환은 임신 동안 합병증을 발생시킬 수 있는 상태, 예컨대 HELLP 증후군, 전신 홍반 루푸스 및 모친의 다른 면역학적 질환일 수 있다.
도 1은 태반 및 모체 혈액 세포에서의 각각의 유전자의 상대 발현 수준과 대립유전자 비율 B/A 사이의 양의 관계를 나타낸다.
도 2는 태반 및 모체 혈액 세포에서의 유전자의 상대 발현 수준과 전체 유전자 발현 수준 사이의 관계를 나타낸다.
도 3은 임신 관련 장애를 진단하는 방법에 대한 흐름도이다.
도 4 및 도 5는 RNA-seq 리드 정렬 결과의 요약을 나타낸다.
도 6은 2명의 개체의 혈액 혈장 RNA의 서열분석으로부터의 데이터를 나타낸다. 도 6a는 M9356P(리보-제로 골드(Ribo-Zero Gold) 전처리됨) 및 M9415P(리보-제로 골드 전처리 없음)의 RNA-seq 라이브러리로부터의 서열분석된 리드의 GC% 분포를 나타낸다. 도 6b는 M9356P와 M9415P 사이의 유전자 발현 프로파일의 상관을 나타낸다.
도 7은 상대 조직 발현 수준(태반/혈액 세포)에 대해 작도된 모체 혈장에서의 상이한 RNA 전사체의 전체 혈장 농도 및 RNA-SNP 대립유전자 비율을 나타낸다.
도 8은 상대 조직 발현 수준(혈액 세포/태반)에 대해 작도된 정보제공 SNP를 함유하는 상이한 유전자의 전체 혈장 수치 및 RNA-SNP 대립유전자 비율을 나타낸다.
도 9는 태아 특이적 SNP 대립유전자에 대한 RNA-SNP 대립유전자 비율 및 모체 혈장에서의 이 대립유전자를 함유하는 RNA 전사체의 발현 수준을 나타낸다.
도 10은 모체 특이적 SNP 대립유전자에 대한 RNA-SNP 대립유전자 비율 및 모체 혈장에서의 이 대립유전자를 함유하는 RNA 전사체의 발현 수준을 나타낸다.
도 11은 임신중독증(pre-eclamptic) 및 대조군 피험체에서의 모체 특이적 SNP 대립유전자에 대한 데이터를 나타낸다. 도 11a는 모체 특이적 SNP 대립유전자를 포함하는 정보제공 SNP에 대한 사례 5641(임신 제3 삼분기 후기 발병 임신중독증) 및 사례 7171(대조군)의 RNA-SNP 대립유전자 비율을 나타낸다. 도 11b는 모체 특이적 SNP 대립유전자를 함유하는 정보제공 SNP에 대한 사례 7171(대조군)에 대한 사례 5641의 혈장 수치 및 RNA-SNP 대립유전자 비율의 배수 차이를 나타낸다.
도 12는 임신중독증 및 대조군 피험체에서의 모체 특이적 SNP 대립유전자에 대한 데이터를 나타낸다. 도 12a는 모체 특이적 SNP 대립유전자를 함유하는 정보제공 SNP에 대한 사례 5641(임신 제3 삼분기 후기 발병 임신중독증) 및 사례 9356(대조군)의 RNA-SNP 대립유전자 비율을 나타낸다. 도 12b는 모체 특이적 SNP 대립유전자를 함유하는 정보제공 SNP에 대한 사례 9356에 대한 사례 5641의 혈장 수치 및 RNA-SNP 대립유전자 비율의 배수 차이를 나타낸다.
도 13은 표 형태의 도 11에서의 데이터를 나타낸다.
도 14는 표 형태의 도 12에서의 데이터를 나타낸다.
도 15는 태아를 임신한 암컷 피험체로부터의 샘플에서 태아 기원인 RNA의 부분을 결정하는 방법에 대한 흐름도이다.
도 16은 모체 혈장 전사물의 정보제공 SNP 분석의 결과를 나타낸다.
도 17은 후기 임신의 모체 혈장 샘플에서의 대립유전자 특이적 발현 여과가 없는 상대 태아 및 모체 기여도를 나타낸다.
도 18은 모체 혈장 전사물에서의 태아 및 모체 기여도를 나타낸다. 도 18a는 초기 및 후기 임신의 모체 혈장에서 태아 및 모체 유래 전사체의 비율을 나타낸다. 도 18b는 출산 전 및 후의 대립유전자 수 및 태아-대립유전자 비율을 나타낸다.
도 19는 임신중독증 및 대조군 임신 사례에 대한 하나의 RNA-SNP에서의 태아 및 모체 기여도 분율을 비교한 것이다.
도 20은 모체 또는 태아 마커로서의 게놈 좌위를 지정하는 방법에 대한 흐름도이다.
도 21은 임신 관련 유전자의 목록이다.
도 22는 출산 전과 비교하여 출산 후 피험체에서의 임신 관련 유전자의 더 낮은 발현 수준을 나타낸다.
도 23은 131개 임신 관련 유전자를 사용한 혈장 샘플의 계층적 클러스터링을 나타낸다.
도 24는 태반, 모체 혈액 세포 및 모체 혈장에서의 131개 임신 관련 유전자의 발현 수준을 나타낸다. 도 24a는 태반 및 모체 혈액 세포의 유전자 발현(log2(전사체 수준)) 및 2명의 후기 임신 사례의 출산 전 및 출산 후 모체 혈장의 열지도(heatmap)이다. 131개 임신 관련 유전자는 태반에서 우선적으로 발현된다. 도 24b는 태반 및 혈장에서의 131개 유전자의 발현 수준이 양으로 상관된다(P<0.05, 스피어만(Spearman) 상관)는 것을 나타낸다.
도 25는 혈장 및 조직 기반 방법으로 확인된 유전자에 대한 혈장에서의 RNA에 대한 태아 및 모체 기여도를 비교한 것이다.
도 26은 RNA-Seq로서 확인된 모체 혈장에서의 98개 임신중독증 관련 RNA를 기재한 것이다. 문제가 없는 임신한 여성 및 임신중독증이 생긴 여성으로부터 수집된 혈장에서의 발현 수준이 도시되어 있다.
도 27은 사례 9415에 대해 PAPPA RNA에서의 단일 뉴클레오타이드 다형(single-nucleotide polymorphism: SNP) 부위에 대한 RNA 서열분석 리드 수를 나타낸다. 대립유전자-A는 공유된 대립유전자이고, 대립유전자-G는 태아 특이적 대립유전자이다.
도 28은 사례 9415에 대해 H19 RNA에서의 단일 뉴클레오타이드 다형(SNP) 부위에 대한 RNA 서열분석 리드 수를 나타낸다.
도 29는 메틸화 감수성 제한 효소 분해에 의한 모체 H19 메틸화 상태의 검출을 나타낸다.
도 30은 본 발명의 실시형태에 따른 시스템 및 방법과 사용 가능한 예시적인 컴퓨터 시스템(3000)의 블록 다이어그램을 나타낸다.
I. 도입
모체 혈장에서의 세포 비함유 태아 RNA의 존재는 십년 전에 보고되었다11. 이러한 발견 이후, 모체 혈장에서의 태아 및 태반 기원의 순환하는 RNA를 검출하도록 많은 연구가 이후에 수행되었다1,10,12. 흥미롭게도, 혈장에서의 태반 특이적 전사체의 발현 수준은 태반 조직에서의 것과 양으로 상관되는 것으로 밝혀졌고10, 태반 또는 태아 건강 및 발생을 모니터링하기 위한 비침습적 도구로서의 혈장 RNA 분석의 임상 이용성을 분명히 보여준다. 실제로, 모체의 순환하는 RNA의 검사는 임신중독증2,13-15, 자궁내 발육 지연4 및 조산8과 같은 임신 또는 태반 관련 장애, 및 태아 염색체 이수성5,7,16의 비침습적 시험에 대한 임상적 적용을 밝혀냈다. 이러한 개발은 태아기 장애의 분자 평가에 대한 RNA 바이오마커의 잠재적 이용성을 강조한다.
태아기 시험에서의 혈장 RNA 분석의 유망한 견해에도 불구하고, 현재까지 모체 혈장에서의 제한된 수의 널리 검증된 임신 또는 태반 관련 전사체가 존재한다. 이와 관련하여, 혈장에서의 RNA 바이오마커의 검사는 분석마다 비교적 적은 수의 RNA 종을 통상적으로 표적화하는 민감한 방법인 역전사효소(RT)-PCR을 사용하여 수행되었다1,4,8,10,12,13. 흥미롭게도, 이 연구는 임신 관련 유전자가 대부분 태반으로부터 유래한다는 전제 하에 모체 혈액 세포과 비교할 때 태반에서의 비교적 높은 수준의 발현을 갖는 유전자에 주로 초점을 둔다. 이러한 접근법은 태반에서 고도로 발현된 임신 관련 RNA 표적을 확인하였지만, 다른 중요한 표적을 놓칠 것이다. 더욱이, 혈장 RNA의 저농도 및 빈약한 통합성을 고려하면9,15, 종래의 고속 방법, 예컨대 유전자 발현의 연속 분석 및 마이크로어레이 분석은 혈장 전사물의 직접적인 검사에 강력하지 않을 것이다.
혈장 RNA 분석의 상기 언급된 기술적 제한은 RNA 분석에 대한 대량 동시 서열분석(massively parallel sequencing: MPS), 즉 RNA 서열분석(RNA-seq)을 이용함으로써 잠재적으로 해결될 수 있다17, 18. 민감성 증가 및 넒은 동적 범위를 고려하면, 태반을 포함하는 많은 인간 조직에서 유전자 발현을 검사하기 위해 RNA-seq가 이용된다19. MPS의 우수성은 건강한 개체20 및 임신한 여성21,22에서의 혈장 miRNA의 직접적인 프로파일링의 이의 실행 가능성에 의해 추가로 입증되었다. 그럼에도 불구하고, 혈장 전사물의 완전한 스펙트럼은 규정되기 어렵고, 이는 혈장에서의 짧은 miRNA와 비교하여 긴 RNA 종의 더 낮은 안정성 때문일 것이다23.
이 연구에서, 본 발명자들은 태아 및 모체 유래 전사체가 모체 혈장에서 검출될 수 있고, 태아 및 모체 특이적 단일 뉴클레오타이드 다형(SNP)의 검사에 의해 RNA-seq를 사용하여 이의 상대 기여도가 예측될 수 있다는 것을 발견하였다. 또한, 태반의 대립유전자 특이적 발현 패턴은 모체 혈장에서 모니터링될 수 있다. 본 발명자들은 또한 임신 관련 전사체가 출산 전 및 후의 모체 혈장의 직접적인 검사에 의해 확인될 수 있다는 것을 입증하였다.
II. SNP 대립유전자 비율을 이용한 임신 관련 장애를 진단하는 방법
유전자 발현 프로파일의 분석은 개체의 질환 상태의 검출에 유용하다. 본 발명의 실시형태는 2명의 상이한 개체로부터의 RNA 분자의 혼합물의 분석을 통한 개체의 발현 프로파일을 분석하는 방법을 포함한다. 상기 방법은 1명의 개체에 특이적인 대립유전자 및 2명의 개체 사이에 공유된 대립유전자의 상대 풍부도를 이용한다. 공유된 및 개체 특이적 대립유전자의 상대 풍부도에 기초하여, 2명의 개체의 유전자 발현 프로파일이 결정될 수 있다. 본 방법의 하나의 가능한 적용은 태아 및 임신한 여성 둘 다로부터의 RNA를 함유하는 모체 혈장 샘플에서의 RNA를 분석함으로써 태아의 유전자 발현 프로파일의 분석이다. 다른 적용은 공여자 및 수혜자 둘 다로부터의 RNA를 함유하는 이식 수혜자로부터 수집된 혈장 샘플에서의 공여자 유래 RNA의 유전자 발현 프로파일의 분석이다.
2명의 개체로부터의 RNA를 함유하는 혼합물에서, 각각의 개체의 발현 프로파일은 전체 RNA에 대한 각각의 개체의 상대 기여도를 결정하기 어려우므로 혼합물에서의 상이한 RNA 전사체의 전체 양의 분석에 기초하여 결정될 수 없다. 상이한 RNA 전사체의 상대 풍부도는 개체의 웰빙의 모니터링하거나 질환 상태를 검출하는 데 유용할 수 있다.
이 방법에서, 2명의 개체의 유전자형은 처음에 개체의 직접적인 유전자형분석 또는 패밀리 분석에 의해 결정될 수 있다. 예를 들어, 부모가 AA 및 TT의 유전자형을 갖는 경우, 태아의 유전자형은 AT일 것이다.
하기 가설의 예는 이 방법의 원칙을 예시한다. 관심 있는 각각의 유전자의 경우, 코딩 구역 내에 SNP가 존재하여 상이한 유전자의 RNA 전사체에서 다형이 관찰될 수 있다. 태아 및 임신한 여성의 유전자형이 각각 AB 및 AA라는 것을 추정한다. 따라서, B 대립유전자는 태아에 특이적일 것이고, A 대립유전자는 태아와 모친 사이에 공유될 것이다. 태반 및 모체 혈액 세포에서의 상이한 유전자의 상대 발현 수준은 표 1에 기재되어 있다.
이 예에서, 본 발명자들은 태반 및 모체 혈액 세포가 모체 혈장에 대한 각각의 이의 RNA 전사체의 2%의 상대 동일 비율에 기여할 것이라고 추정한다. 즉, 유전자의 태반 발현 수준이 10000인 경우, 이것은 모체 혈장에 대한 이 유전자의 200개의 RNA 전사체에 기여할 것이다. 도 1에 도시된 바대로, 대립유전자 비율 B/A는 태반 및 모체 혈액 세포에서의 각각의 유전자의 상대 발현 수준과의 우수한 양의 관계를 나타낸다. 반대로, 전체 유전자 발현 수준은 모체 혈액 세포의 발현의 변동에 의해 영향을 받고, 그러므로 태반의 발현과 덜 상관된다(도 2).
Figure 112015081206883-pct00001
대립유전자 비율 분석을 이용하는 것의 다른 이점은 태반에서의 특정한 유전자의 발현 수준이 모체 혈액 세포의 발현 수준으로 정규화된다는 것이다. 발현 수준이 상이한 유전자 및 상이한 샘플에 걸쳐 크게 변할 수 있으므로, 이 정규화는 상이한 유전자에 걸친 비교가 더 튼튼하게 하고 기준 유전자, 예를 들어 하우스 키핑 유전자(house keeping gene)에 대한 비교의 필요성을 피할 것이다. 즉, 종래의 유전자 발현 분석에서, 샘플에서의 유전자의 발현 수준은 하우스 키핑 유전자에 대해 또는 샘플의 전체 RNA에 대한 양으로서 측정된다. 비정상 유전자 발현을 확인하기 위해, 종래에, 대조군 샘플에 대한 시험 샘플의 이 상대 값을 비교하였다.
여기서, 본 발명자들은 새로운 접근법을 제안하였고, 이에 의해 본 발명자들은 유전자 발현 프로파일을 결정하기 위한 수단으로서 동일한 유전자의 모친의 기여도로 정규화된 태아가 기여한 상대량을 이용한다. 병리학적 상태, 예를 들어 임신중독증, 조기 산통, 모체 질환, 예컨대 전신 홍반(이에 의해, 태반 또는 모체 장기에서의 유전자의 발현이 변경됨)에서, 이 유전자의 태아 대 모체 비율은 이러한 병리학적 조건이 없는 임신과 비교하여 변경될 것이다. 이 접근법은 모체 혈장에서의 RNA 전사체 사이의 공유된 대립유전자에 대한 태아 특이적 SNP 대립유전자를 사용하여 실행될 수 있다.
이 접근법은 또한 모체 혈장에서의 RNA 전사체 사이의 공유된 대립유전자에 대해 모체 특이적 SNP 대립유전자를 사용하여 실행될 수 있다. 하나 이상의 RNA 유전자 전사체에 대한 이러한 대립유전자 비율 중 하나 이상이 비병리학적 상태에 대해 예측된 것과 비교하여 변경될 때 병리학적 조건이 확인될 수 있다. 병리학적 상태를 확인하기 위해 하나의 유전자 좌위 또는 다수의 유전자 좌위에 걸친 이러한 대립유전자 비율의 패턴이 사용될 수 있다. 비병리학적 상태는 임신이 병리학적 상태에 의해 더 이상 영향을 받지 않을 때 시험 전 및 후에 얻은 샘플에서 또는 정상 임신으로부터 이전에 얻은 기존의 데이터, 즉 이전에 유도된 기준 범위로부터, 정상 임신에서의 대립유전자 비율에 의해 표시될 수 있다.
본 방법을 이용하여 진단될 수 있는 임신 관련 장애는 모체 및 태아 조직에서의 유전자의 비정상 상대 발현 수준을 특징으로 하는 임의의 장애를 포함한다. 이 장애는 임신중독증, 자궁내 발육 지연, 침윤성 태반형성, 조산, 신생아의 용혈 질환, 태반 기능부전, 태아수종, 태아 기형, HELLP 증후군, 전신 홍반 루푸스 및 모친의 다른 면역학적 질환을 포함하지만, 이들로 제한되지는 않는다. 상기 방법은 이러한 분자의 혼합물을 함유하는 샘플에서의 모친 및 태아가 기여한 RNA 분자 사이를 구별한다. 상기 방법은 따라서 다른 개체로부터의 기여도가 반대의 방향으로 변하거나 이동하지 않더라도, 특정한 좌위에서 또는 특정한 유전자에 대해 혼합물에 대한 1명의 개체(즉, 모친 또는 태아)로부터의 기여도의 변화를 확인할 수 있다. 이러한 변화는 기원의 개체 또는 조직과 상관 없이 유전자의 전체 발현 수준을 측정할 때 쉽게 검출될 수 없다. 본 명세서에 기재된 임신 관련 장애는 태아에서의 염색체 비정상, 예를 들어 이수성을 특징으로 하지 않는다.
본 방법은 또한 태반의 이전의 유전자형분석 정보 없이 수행될 수 있다. 예를 들어, 임신한 여성의 유전자형은 이 여성의 혈액 세포의 직접적인 유전자형분석에 의해 결정될 수 있다. 이후, 혈장 샘플의 RNA 전사체는 분석될 수 있고, 예를 들어 대량 동시 서열분석으로 제한되지 않는다. 2개의 상이한 대립유전자를 나타내는 RNA 전사체가 확인될 수 있다. 이 일련의 전사체에서, 모친이 동형접합성인 경우, 이것은 태아가 태아 특이적 대립유전자 및 모체 대립유전자에 이형접합성이라는 것을 나타낼 것이다. 이 시나리오에서, RNA 대립유전자 비율 분석은 태아(또는 태반)의 이전의 유전자형 정보 없이 수행될 수 있다. 추가로, 모친이 이형접합성이지만 태아가 동형접합성인 경우는 1:1 비율로부터의 편차에 의해 확인될 수 있다. 이러한 기술의 추가의 상세내용은 미국 특허 제8,467,976호에 기재되어 있다.
A. 진단 방법
몇몇 실시형태에 따른 임신 관련 장애를 진단하는 방법(300)이 도 3에 도시되어 있다. 상기 방법은 태아를 임신한 암컷 피험체로부터의 샘플을 사용한다. 샘플은 모체 혈액 혈장 유래일 수 있고 모체 및 태아 유래 RNA 분자의 혼합물을 함유한다. 샘플은 임의의 임신 단계에서 암컷 피험체로부터 원하는 바대로 얻어질 수 있다. 예를 들어, 외둥이 임신을 한 임신 제1 삼분기, 제2 삼분기 및 제3 삼분기의 임신한 여성은 피험체로 작용할 수 있다. 임신 제1 삼분기 및 제2 삼분기의 임신한 여성은 "초기 임신 사례"로 분류될 수 있고, 임신 제3 삼분기의 임신한 여성은 "후기 임신 사례"로 분류될 수 있다. 몇몇 실시형태에서, 샘플은 또한 태아의 출산 후, 또는 출산 전 및 후의 동일한 피험체로부터 수집될 수 있고, 비임신한 암컷으로부터의 샘플은 대조군으로서 작용할 수 있다. 샘플은 출산 후 임의의 시점(예를 들어, 24시간)에 얻어질 수 있다.
샘플은 말초 혈액으로부터 얻어질 수 있다. 모체 혈액 샘플은 혈장으로부터 혈액 세포를 분리하기 위해 예를 들어 원심분리에 의해 원하는 바대로 처리될 수 있다. 안정화제가 혈액 샘플 또는 이의 부분에 첨가될 수 있고, 샘플은 사용 전에 저장될 수 있다. 몇몇 실시형태에서, 융모막 융모, 양수 또는 태반 조직과 같은 태아 조직의 샘플이 또한 얻어진다. 태아 조직은 하기 기재된 바대로 태아 유전자형을 결정하기 위해 사용될 수 있다. 태아 조직은 출산 전 또는 후에 얻어질 수 있다.
샘플이 얻어지면, RNA 또는 DNA는 이후 모체 혈액 세포 및 혈장, 및 임의의 태아 조직, 예컨대 태반의 샘플로부터 추출될 수 있다. 태반 및 혈액 세포 RNA 샘플은 라이브러리 제제를 서열분석하기 전에 리보솜 RNA(rRNA)를 제거하기 위해, 예컨대 리보-제로 골드 키트(Epicentre)로 전처리될 수 있다.
상기 방법의 단계(301)에서, 복수의 리드를 수취한다. 리드는 샘플로부터 얻어진 RNA 분자의 분석으로부터 얻어진다. 다양한 실시형태에서, 리드는 서열분석, 디지털 PCR, RT-PCR 및 질량 분석법에 의해 얻어질 수 있다. 기재사항이 서열분석에 초점을 두지만, 기재사항의 양상은 또한 리드를 얻기 위한 다른 기술에 적용 가능하다. 예를 들어, 디지털 PCR(미소유체 및 드롭렛(droplet) PCR 포함)은 각각의 대립유전자에 대한 프로브(프라이머 포함)를 사용하여 특정한 좌위에서의 상이한 대립유전자의 지식을 제공할 수 있다. 프로브는 예를 들어 상이한 색상을 나타냄으로써 이들이 서로 구별 가능하게 만드는 라벨을 보유할 수 있다. 동일한 실험에서 또는 (예를 들어, 별개의 슬라이드 또는 칩 상의) 상이한 실험에서, 상이한 라벨을 갖는 프로브는 상이한 좌위에 관한 것일 수 있다. 라벨의 검출은 증폭되는 RNA 또는 cDNA 분자의 존재 및/또는 분량을 반영하고, RNA 또는 cDNA 분자의 리드에 상응하고, 여기서 이러한 리드는 프로브에 상응하는 좌위에서의 RNA 또는 cDNA 분자의 서열에 대한 정보를 제공한다. "서열 리드"와 관한 설명은 비서열분석 기술을 포함하는 임의의 적합한 기술을 통해 얻은 리드에 동등하게 적용된다.
임의의 이용 가능한 기술을 이용하여 서열분석을 원하는 바대로 수행할 수 있다. 핵산 서열분석 기술 및 방법의 예는 대량 동시 서열분석, 차세대 서열분석, 전체 게놈 서열분석, 엑솜 서열분석, 표적 농후 존재 또는 부재 하의 서열분석, 합성에 의한 서열분석(예를 들어, 증폭에 의한 서열분석, 클론 증폭, 브릿지 증폭, 가역적 종결자에 의한 서열분석), 결찰에 의한 서열분석, 혼성화에 의한 서열분석(예를 들어, 마이크로어레이 서열분석), 단일 분자 서열분석, 실시간 서열분석, 나노기공 서열분석, 파이로서열분석(pyrosequencing), 반도체 서열분석, 질량 분석법에 의한 서열분석, 샷건(shotgun) 서열분석 및 생어(Sanger) 서열분석을 포함한다. 몇몇 실시형태에서, 샘플에서의 RNA로부터 제조된 cDNA 라이브러리에서 대량 동시 기술을 이용하여 서열분석이 수행된다. 제조업자의 지시에 따라 또는 약간 변형하여 예를 들어 mRNA-Seq 샘플 제조 키트(Sample preparation Kit)(일루미나(Illumina))를 사용하여 cDNA 라이브러리를 원하는 바대로 합성할 수 있다. 몇몇 실시형태에서, 혈장 cDNA의 말단-보수 단계에 5배 희석된 클레노브(Klenow) DNA 중합효소를 사용한다. 각각 말단 보수된 및 아데닐화된 생성물을 정제하기 위해 퀴아퀵(QIAquick) PCR 정제 키트 및 퀴아퀵 민일루트 키트(QIAquick MinElute Kit)(퀴아젠(Qiagen))를 사용할 수 있다. 몇몇 실시형태에서, 10배 희석된 쌍 지은 말단 어댑터(adapter)는 혈장 cDNA 샘플에 대해 사용되거나, 2회 라운드의 정제는 AMPure XP 비드(아젠코트(Agencourt))를 사용하여 어댑터 결찰된 생성물에 대해 수행된다. cDNA 라이브러리는 HiSeq 2000 기구(일루미나)에서의 쌍 지은 말단 포맷에서 또는 다른 포맷 또는 기구를 사용하여 75bp에 대해 서열분석될 수 있다.
단계(302)에서, 기준 서열에서의 리드의 위치를 결정한다. PCR 기반 기술의 경우, 예를 들어 프로브 또는 프라이머에 대한 검출된 라벨의 색상을 프로브 또는 프라이머가 특이적인 서열에 매칭함으로써 위치를 결정할 수 있다. 서열분석 기술을 위해, 서열 리드를 기준 서열에 대해 정렬시킴으로써 위치를 결정할 수 있다. 컴퓨터 시스템에 의해 서열 정렬을 수행할 수 있다. 임의의 생물정보학 파이프라인은 원 데이터 전처리(예컨대, 매우 중복된 리드 및 낮은 품질의 리드의 제거), 데이터 정렬 및/또는 데이터 규격화에 이용될 수 있다. 모체 혈액 세포, 태반 조직 및 모체 혈장에서의 RNA 전사체 수준은 100만분의 1의 엑손 리드당 킬로염기마다의 분획(fragment per kilobase per millionth exonic read: FPKM)으로서 계산될 수 있다. 대립유전자 비율을 결정하기 위해, 데이터 전처리 및 정렬을 수행할 수 있지만, 데이터 규격화는 필요하지 않다. 정렬에 임의의 기준 서열(예를 들어, hg19 기준 인간 게놈) 및 임의의 알고리즘을 사용할 수 있다.
단계(301 및 302)를 수행하는 일 예에서, 중복된 리드 및 rRNA 리드의 제거 후, 각각의 임신하지 않은 암컷 혈장 샘플에 대해 평균 300만개의 분석 가능한 리드가 얻어지고; 임신한 여성의 각각의 혈장 샘플에 대해 평균 1200만개의 분석 가능한 리드가 얻어진다. 조직 RNA-seq의 경우, 태반 및 혈액 세포에 대해 각각 샘플마다 평균 17300만개 및 4100만개의 분석 가능한 리드가 얻어진다. RNA-seq 정렬 통계가 도 4도 5에 요약되어 있다. 서열분석된 리드의 GC 함량은 또한 모든 샘플에서 검사된다(도 6a표 2).
Figure 112015081206883-pct00002
단계(303)에서, 하나 이상의 정보제공 좌위를 확인한다. 이 단계는 게놈 내의 좌위에서의 암컷 피험체 및 태아의 유전자형을 결정하거나 이 유전자형에 대해 추론할 수 있고, 이 유전자형을 비교한다. 좌위는 상응하는 제1 대립유전자(예를 들어, AA)에 대해 제1 독립체(entity)에서 동형접합성이고, 상응하는 제1 대립유전자 및 상응하는 제2 대립유전자(예를 들어, AB)에 대해 제2 독립체에서 이형접합성인 경우 정보제공으로 생각된다. 제1 독립체는 임신한 암컷 피험체 또는 태아일 수 있고, 제2 독립체는 다른 임신한 암컷 피험체 및 태아이다. 즉, 각각의 정보제공 좌위에 대해 1명의 개체(모친 또는 태아)가 동형접합성이고, 다른 개체가 이형접합성이다.
정보제공 좌위는 개인이 이형접합성이고 1개의 대립유전자의 유일한 기여자라는 것에 따라 추가로 분류될 수 있다. 태아가 동형접합성이고 임신한 암컷 피험체가 이형접합성인 경우, 좌위는 정보제공 모체 좌위 또는 동등하게 모체 특이적 좌위로 생각된다. 임신한 암컷 피험체가 동형접합성이고 태아가 이형접합성인 경우, 좌위는 정보제공 태아 좌위 또는 동등하게 태아 특이적 좌위로 생각된다. 단계(303)에서, 확인된 정보제공 좌위는 모두 모체 특이적 또는 태아 특이적인데, 왜냐하면 동일한 개체가 모든 이 좌위에 대해 제2 독립체로서 작용하기 때문이다.
정보제공 좌위는 단일 뉴클레오타이드 다형 또는 "SNP"를 나타낼 수 있고, 여기서 제1 대립유전자 및 제2 대립유전자는 단일 뉴클레오타이드의 정체성이 다르다. 정보제공 좌위는 또한 짧은 삽입 또는 결실을 나타낼 수 있고, 여기서 하나 이상의 뉴클레오타이드는 다른 대립유전자와 비교하여 하나의 대립유전자에서 삽입되거나 결실된다.
몇몇 실시형태에서, 하나 이상의 정보제공 좌위 또는 각각의 정보제공 좌위에서의 임신한 암컷 피험체의 유전자형은 모체 조직으로부터 얻은 게놈 DNA를 서열분석함으로써 결정된다. 모체 조직은 모체 혈액 세포 또는 임의의 다른 유형의 조직일 수 있다. 몇몇 실시형태에서, 하나 이상의 정보제공 좌위 또는 각각의 정보제공 좌위에서의 태아의 유전자형은 태아 조직, 예컨대 태반, 융모막 융모, 양수로부터 얻은 게놈 DNA를 서열분석함으로써 결정된다. 덜 침습적인 방법이 바람직한 경우, 모체 혈액 샘플로부터 서열분석하기 위해 태아 DNA가 또한 얻어질 수 있다. 서열분석에 RNA 분자를 얻기 위해 사용된 동일한 샘플은 이러한 태아 DNA의 소스일 수 있거나, 상이한 샘플이 사용될 수 있다. 태아를 직접적으로 유전자형분석하지 않고 정보제공 태아 좌위를 확인할 수 있는 것으로 이해될 것이다. 예를 들어, 임신한 암컷 피험체가 하나의 좌위에서 제1 대립유전자에 대해 동형접합성인 것으로 결정되고, RNA 서열분석이 모체 및 태아 RNA의 혼합물에서 제2 대립유전자의 존재를 나타내는 경우, 태아는 이 좌위에서 이형접합성인 것으로 추정될 수 있다.
몇몇 실시형태에서, 모친 및 태아는 정보제공 좌위를 확인하기 위한 대량 동시 방법을 이용하여 둘 다 유전자형분석된다. 서열분석은 엑솜 농후 모체 혈액 세포 및 태반 게놈 DNA 샘플에서 수행될 수 있다. 게놈 DNA는 제조업자의 지시에 따라 각각 QIAamp DNA 키트 및 QIAamp 혈액 키트(둘 다 퀴아젠사제)를 사용하여 태반 조직 및 모체 혈액 세포로부터 추출될 수 있다. 엑솜 농후 및 서열분석 라이브러리 제제는 제조업자의 프로토콜에 따라 TruSeq 엑솜 농후 키트(TruSeq Exome Enrichment Kit)(일루미나)를 사용하여 수행될 수 있다. 라이브러리는 HiSeq 2000 기구(일루미나)에서 PE 포맷에서 75bp에 대해 서열분석될 수 있다.
단계(304)에서, 하나 이상의 정보제공 좌위를 여과시킨다. 본 명세서에 사용된 바대로, "여과"는 추가의 분석을 위해 단계(303)에서 확인된 것 중에서 소정의 정보제공 좌위를 선택하는 것을 의미한다. "여과된" 정보제공 좌위는 이렇게 선택된 좌위이다. 선택은 하나 이상의 기준에 기초하여 이루어질 수 있다. 이러한 하나의 기준은 정보제공 좌위가 게놈에서 또는 기준 서열에 대해 어디에 위치하는지이다. 몇몇 실시형태에서, 기준 서열의 엑손 또는 발현된 구역 내에 위치한 좌위만이 추가로 분석된다.
여과에 대한 다른 기준은, 단계(301)에서 수취되고 단계(302)에서 기준 서열에 대해 정렬된 모든 것 중에서, 이 좌위에 대해 정렬되고 각각의 대립유전자를 함유하는, 서열 리드의 수이다. 몇몇 실시형태에서, 여과된 정보제공 좌위는 제1 대립유전자를 함유하는 적어도 제1 선결정된 수의 서열 리드, 및/또는 제2 대립유전자를 함유하는 제2 선결정된 수의 서열 리드와 관련되어야 한다. 선결정된 수는 1, 2 또는 이것 초과일 수 있고, 원하는 리드 품질 또는 서열분석 깊이에 상응할 수 있다. 여과의 결과로서, 하나 이상의 여과된 정보제공 좌위가 확인된다.
몇몇 실시형태에서, SNP를 나타내는 정보제공 좌위만이 여과에 고려된다. 상기 방법의 일 예에서, NCBI dbSNP Build 135 데이터베이스에서의 대략 100만개의 SNP(모두 엑손에 위치함)가 검사되고, 정보제공 SNP는 모체 및 태아 유전자형을 사용하여 이 100만개 중에서 확인되었다. 정보제공 SNP의 설명을 위해, "A"는 공유된 대립유전자로 배정되고, "B"는 모체 또는 태아 특이적 대립유전자로 배정된다. 정보제공 SNP는 모체 특이적 SNP 대립유전자를 갖는 것, 즉 소정의 좌위에서 태아에서의 "AA" 및 모친에서의 "AB", 및 태아 특이적 SNP 대립유전자를 갖는 것, 즉 소정의 좌위에서 모친에서의 "AA" 및 태아에서의 "AB"를 포함한다. 유전자형은 인 하우스(in-house) 생물정보학 파이프라인을 이용하여 불린다. 여과를 수행하기 위해, "A" 대립유전자 및 "B" 대립유전자 둘 다 각각 적어도 하나의 리드 수를 나타내는 정보제공 SNP만이 분석에 포함된다.
단계(305 및 306)에서, 각각의 여과된 정보제공 좌위에 정렬된 서열 리드를 계수되고 이것이 함유하는 대립유전자에 따라 분류한다. 각각의 여과된 정보제공 좌위에 대해, 2개의 수를 결정한다: 제1 수, 좌위에 정렬되고 상응하는 제1 대립유전자를 함유하는 서열 리드의 수(즉, 공유된 대립유전자); 및 제2 수, 좌위에 정렬되고 상응하는 제2 대립유전자를 함유하는 서열 리드의 수(즉, 모체 또는 태아 특이적 대립유전자). 제1 수와 제2 수를 원하는 바대로 산출할 수 있다. 각각의 좌위에 대한 제1 수와 제2 수는 좌위에 정렬된 서열 리드의 전체 수를 제공한다. 특정한 여과된 정보제공 좌위에 대한 제1 수와 제2 수의 비율은 "대립유전자 비율"로 칭해질 수 있다.
단계(307 및 308)에서, 제1 대립유전자 및 제2 대립유전자의 수를 여과된 정보제공 좌위에 걸쳐 합한다. 단계(307)에서, 제1 수의 제1 합을 계산한다. 제1 합은 여과된 정보제공 좌위에 대해 상응하는 제1 대립유전자를 함유하는 서열 리드(즉, 공유된 대립유전자)의 전체 수를 나타낸다. 단계(308)에서, 제2 수의 제2 합을 계산한다. 제2 합은 여과된 정보제공 좌위에 대해 상응하는 제2 대립유전자를 함유하는 서열 리드(즉, 모체 또는 태아 특이적 대립유전자)의 전체 수를 나타낸다. 합은 단계(304)에서 확인된 모든 여과된 정보제공 좌위 또는 이의 하위세트를 사용하여 원하는 바대로 산출될 수 있다. 몇몇 실시형태에서, 합은 가중된다. 예를 들어, 소정의 염색체로부터의 좌위의 합에 대한 기여도는 이 좌위에 대한 제1 수 및 제2 수에 스칼라(scalar)를 곱하여 규모 확대 또는 규모 축소될 수 있다.
단계(309)에서, 제1 합과 제2 합의 비율을 계산한다. 이 비율은 여과된 정보제공 좌위에 걸쳐 합계된 제1 대립유전자 및 제2 대립유전자에 대한 서열 리드의 상대 수를 나타낸다. 몇몇 실시형태에서, 이 비율은 단순히 제2 합으로 나눈 제1 합으로서 계산된다. 이러한 계산은 모체 또는 태아 특이적 대립유전자에 대한 서열 리드의 배수로서 공유된 대립유전자에 대한 서열 리드의 수를 생성한다. 대안적으로, 이 비율은 제1 합과 제2 합의 합으로 나눈 제2 합으로서 계산될 수 있다. 여기서, 이 비율은 모든 서열 리드의 분획으로서 모체 또는 태아 특이적 대립유전자에 대한 서열 리드의 수를 제공한다. 이 비율을 계산하는 다른 방법은 숙련된 당업자에게 명확할 것이다. 이 비율이 계산되는 제1 합 및 제2 합은 여과된 정보제공 좌위에 대해 공유된 및 특이적 대립유전자로부터 생긴 샘플에 존재하는 RNA(즉, 전사체)의 양에 대한 대리로서 작용할 수 있다.
단계(310)에서, 태아, 모친 또는 임신이 임신 관련 장애를 갖는지를 결정하기 위해 단계(309)에서 계산된 비율을 컷오프 값과 비교한다. 다양한 실시형태에서, 컷오프 값은 임신 관련 장애가 없는 임신한 암컷 피험체(즉, 대조군 피험체)로부터 얻은 하나 이상의 샘플로부터 결정되고/되거나, 임신 관련 장애를 갖는 임신한 암컷 피험체로부터 얻은 하나 이상의 샘플로부터 결정될 수 있다. 몇몇 실시형태에서, 대조군 피험체로부터의 샘플에 대해 상기 기재된 동일한 방법을 수행하고, 이것 또는 여과된 정보제공 좌위의 중첩하는 세트를 검사함으로써 컷오프를 결정한다. 장애가 없는 임신에 대해 예상된 값과 장애를 갖는 임신에 대해 예상된 값 사이의 값에서 컷오프를 설정할 수 있다. 컷오프는 정상 값으로부터의 통계차에 기초할 수 있다.
몇몇 실시형태에서, (단계(309)에서처럼) 임신한 암컷 피험체에 대해 계산된 비율은 소정의 세트의 유전자에서 여과된 정보제공 좌위를 이용하고, 일부 또는 모든 동일한 유전자에서의 여과된 정보제공 좌위를 이용하여 대조군 피험체에 대해 비율(즉, 컷오프)을 계산한다. 임신한 암컷 피험체에 대해 계산된 비율이 모체 특이적 대립유전자에 기초하는 경우, 대조군 피험체에 대해 계산된 컷오프는 또한 모체 특이적 대립유전자에 기초할 수 있다. 유사하게, 이 비율 및 컷오프는 둘 다 태아 특이적 대립유전자에 기초할 수 있다.
이 비율과 컷오프 사이의 비교를 원하는 바대로 수행할 수 있다. 예를 들어, 이 비율이 임의의 양으로 또는 소정의 차이로 컷오프를 초과하거나 컷오프보다 적은 경우 장애가 진단될 수 있다. 이 비교는 차이를 계산하거나 임신한 암컷 피험체에 대한 비율과 컷오프 값 사이의 다른 비율을 계산하는 것을 포함할 수 있다. 몇몇 실시형태에서, 이 비교는 소정의 유전자에 대해 공유된 및 비공유된 대립유전자의 상대 발현 수준이 임신한 암컷 피험체와 대조군 피험체 사이에 상당히 다른지를 평가하는 것을 포함한다.
원하는 경우, 상기 방법은 또한 모체 또는 태아 기원인 샘플에서 RNA의 부분을 예측하기 위해 이용될 수 있다. 단계(309)에서 계산된 비율에 스칼라를 곱하여 예측을 한다. 스칼라는 이형접합성 개체에서 제2 대립유전자의 발현에 대한 여과된 정보제공 좌위에서의 전체 발현 수준을 나타낸다.
하기 예는 스칼라의 적용을 예시한다. 이 방법에서 계수된 제2 대립유전자가 태아 특이적인 경우, 단계(309)에서 계산된 비율은 여과된 정보제공 좌위에 대해 모든 서열 리드의 분획으로서 태아 특이적 대립유전자에 대한 서열 리드의 수를 제공할 수 있다. 공유된 대립유전자를 함유하는 서열 리드 중에서, 몇몇은 모친이 기여하고 몇몇은 태아가 기여한다. 태아에서의 태아 특이적 및 공유된 대립유전자의 상대 발현 수준이 알려져 있거나 예측될 수 있는 경우, 여과된 정보제공 좌위에 대해 모든 서열 리드에 대한 태아 기여도 분율의 예측치를 얻기 위해 이 분율은 규모 조정될 수 있다.
몇몇 실시형태에서, 태아 및 공유된 대립유전자는 대부분의 좌위에서 대칭적으로 발현되고, 스칼라는 약 2인 것으로 예측된다. 다른 실시형태에서, 스칼라는 2와 다르고, 비대칭적 유전자 발현을 고려한다24. 서열 리드에 대한 모체 기여도 분율은 이후 1 - 태아 기여 분율이다. 여과된 정보제공 좌위에서의 제2 대립유전자가 모체 특이적일 때 유사한 계산을 할 수 있다.
B. 실시예:
1. 대립유전자 비율 및 혈장 농도의 상관
모체 혈장 샘플(임신령 37 2/7)의 발현 프로파일을 분석하고, 임신한 여성에 대해 상응하는 태반 및 모체 혈액 세포와 비교하였다. 일루미나 HiSeq 2000 기구를 사용하여 각각의 이 샘플에 대해 RNA의 대량 동시 서열분석을 수행하였다. 대량 동시 서열분석에 의해 엑솜 서열분석을 이용하여 태반 및 모체 혈액 세포를 유전자형분석하였다. 본 발명자들은 엑손에 위치한 NCBI dbSNP Build 135 데이터베이스에서 대략 100만개의 SNP를 검사하였고, 모친이 동형접합성(유전자형 AA)이고 태아가 이형접합성(유전자형 AB)인 정보제공 SNP에 대해 분류하였다. 따라서, A 대립유전자는 모친과 태아 사이에 공유된 대립유전자이고, B 대립유전자는 태아 특이적이다.
모체 혈장에서의 상이한 RNA 전사체의 전체 혈장 농도 및 RNA-SNP 대립유전자 비율은 상대 조직 발현 수준(태반/혈액 세포)에 대해 작도된다(도 7). 본 발명자들은 혈장에서의 RNA-SNP 대립유전자 비율이 상대 조직 발현 수준과 매우 상관된다(스피어만 R = 0.9731679, P = 1.126e-09)는 것을 관찰할 수 있다. 그러나, 전체 혈장 수치는 조직 발현과 상관되지 않았다(스피어만 R = -0.7285714, P = 0.002927).
태아 발현의 분석 이외에, 이 방법은 또한 모체 발현의 프로파일링을 위해 이용될 수 있다. 이 시나리오에서, 모친이 이형접합성(유전자형 AB)이고 태아가 동형접합성(유전자형 AA)인 정보제공 SNP를 이용할 수 있다. 이후, RNA-SNP 대립유전자 비율은 공유된 대립유전자의 수로 나눈 모체 특이적 대립유전자 수로서 계산될 수 있다. 도 8에서, 정보제공 SNP를 함유하는 상이한 유전자의 전체 혈장 수치 및 RNA-SNP 대립유전자 비율은 상대 조직 발현 수준(혈액 세포/태반)에 대해 작도된다. 본 발명자들은 조직 발현 수준과 모체 혈장에서의 RNA-SNP 대립유전자 비율 사이의 우수한 양의 관계(스피어만 R = 0.9386, P < 2.2e-16)를 관찰할 수 있지만, 전체 혈장 전사체 수준(스피어만 R = 0.0574, P = 0.7431)을 관찰할 수 없었다.
RNA 전사체, 이의 RNA-SNP 대립유전자 비율 및 이의 혈장 수치는 도 9도 10에서 표로 기재되어 있다.
2. 임신중독증 및 대조군 임신 사례에 대한 모체 혈장 RNA-SNP 대립유전자 비율의 비교
2명의 임신한 암컷 피험체의 사례의 경우에, 117,901,334개의 원 단편의 평균 수를 얻었다(표 3A). 임신 제3 삼분기 후기 발병 임신중독증(PET) 사례, 5641과 이의 임신 연령 매치 대조군 사례, 7171 사이에 모체 특이적 SNP 대립유전자를 보유하는 순환하는 전사체의 하위세트의 RNA-SNP 대립유전자 비율을 비교하였다. 도 11a에서 볼 수 있는 것처럼, 이 전사체의 RNA-SNP 대립유전자 비율은 PET 및 대조군 사례에서 상이한 프로파일을 나타낸다. 중요하게는, RNA-SNP 대립유전자 비율 프로파일은 도 11b에서 볼 수 있는 것과 같은 혈장 전사체 수준 프로파일과 구별된다. 이는 모체 혈장 RNA-SNP 대립유전자 비율 분석이 정상 임신 사례로부터 PET 사례를 더 잘 구별하기 위한 다른 미터법으로서 이용될 수 있다는 것을 제시한다. 정보제공 전사체의 수는 PET 사례, 5641과 다른 정상 임신 대조군 사례, 9356(도 12a도 12b) 사이의 비교에 의해 예시된 것처럼, 정보제공 SNP의 수 증가와 함께 추가로 증가한다. 도 11도 12에 도시된 RNA 전사체의 혈장 수치 및 RNA-SNP 대립유전자 비율은 각각 도 13도 14에서 표로 되어 있다.
Figure 112015081206883-pct00003
III. 태아 또는 모체 RNA 기여도를 결정하는 방법
A. 방법
태아를 임신한 암컷 피험체로부터의 샘플에서 태아 기원인 RNA의 부분을 결정하기 위한 방법(1500)이 도 15에 도시되어 있다. 방법(300)에 대해 상기 기재된 바대로 샘플을 얻고 제조할 수 있다.
단계(1501)에서, 복수의 서열 리드를 수취한다. 단계(1502)에서, 서열 리드를 기준 서열에 정렬시킨다. 단계(301 및 302)에 대해 상기 기재된 바대로 이 단계들을 수행할 수 있다.
단계(1503)에서, 하나 이상의 정보제공 모체 좌위를 확인한다. 각각의 정보제공 모체 좌위는 상응하는 제1 대립유전자에 대해 태아에서 동형접합성이고, 상응하는 제1 대립유전자 및 상응하는 제2 대립유전자에 대해 임신한 암컷 피험체에서 이형접합성이다. 이후, 제1 대립유전자는 모친과 태아 사이에 공유되고, 제2 대립유전자는 모체 특이적이다. 단계(303)에 대해 상기 기재된 바대로 정보제공 모체 좌위를 확인할 수 있다.
단계(1504)에서, 정보제공 모체 좌위를 단계(304)에서처럼 여과시키고, 하나 이상의 여과된 정보제공 모체 좌위를 확인한다. 이후, 단계(1505-1511)에서 서열 리드를 개별적인 여과된 정보제공 모체 좌위의 수준에서 조작한다. 단계(1505 및 1506)에서, 각각의 여과된 정보제공 모체 좌위에 대해 제1 수 및 제2 수를 결정한다. 좌위에 정렬되고 상응하는 제1 대립유전자를 함유하는 서열 리드의 수로서 단계(1505)에서 제1 수를 결정한다. 좌위에 정렬되고 상응하는 제2 대립유전자를 함유하는 서열 리드의 수로서 단계(1506)에서 제2 수를 결정한다. 상기 기재된 단계(305 및 306)와 유사하게 단계(1505 및 1506)를 수행할 수 있다.
단계(1507)에서, 각각의 정보제공 모체 좌위에 대해 제1 수와 제2 수의 합을 계산한다. 합은 좌위에 정렬된 서열 리드의 전체 수와 동일할 수 있다. 단계(1508)에서, 제2 수에 합으로 나눠 모체 비율을 계산한다. 모체 비율은 제2(모체 특이적) 대립유전자를 함유하는 특정한 좌위에 정렬된 모든 서열 리드의 분획을 제공한다.
단계(1509)에서, 스칼라를 결정한다. 스칼라는 임신한 암컷 피험체에서의 상응하는 제2 대립유전자의 발현에 대한 여과된 정보제공 모체 좌위에서의 전체 발현 수준을 나타낸다. 몇몇 실시형태에서, 임신한 암컷 피험체에서의 2개의 대립유전자의 발현이 대칭적인 것으로 알려져 있거나 추정되는 경우, 스칼라는 약 2이다. 다른 실시형태에서, 스칼라는 2와 다를 수 있고 비대칭 유전자 발현을 고려한다. 대부분의 좌위가 비대칭적으로 발현되므로, 대칭의 추정은 유효하다.
단계(1510)에서, 모체 비율에 스칼라를 곱해 모체 기여도를 얻는다. 모체 기여도는, 여과된 정보제공 모체 좌위에서, 모친이 기여하는 서열 리드의 분율(또는, 연장에 의해, 샘플 내의 RNA의 분율)을 나타낸다. 1 - 모체 기여도는 태아 기여도 또는 태아가 기여하는 서열 리드의 분율이다. 단계(1511)에서, 여과된 정보제공 모체 좌위에 대해 태아 기여도를 계산한다.
단계(1512)에서, 태아 기원인 샘플에서의 RNA의 부분을 결정한다. 이 부분은 여과된 정보제공 모체 좌위에 대한 태아 기여도의 평균이다. 몇몇 실시형태에서, 예를 들어 여과된 정보제공 모체 좌위에 대해 계산된 합에 의해 이 평균을 가중한다. 가중된 평균을 계산함으로써, 단계(1512)에서 결정된 부분은 샘플에서의 상이한 좌위 또는 유전자의 상대 발현 수준을 반영할 수 있다.
서열분석 데이터가 얻어지는, 하나의 여과된 정보제공 모체 좌위, 많은 이러한 좌위 또는 모든 이러한 좌위에 대해 태아 기원인 샘플에서의 RNA의 부분을 계산할 수 있다. 이 부분이 샘플이 획득되는 시간에 특정한 임신한 암컷 피험체에서의 순환하는 전사물을 반영하는 것으로 이해될 것이다. 샘플이 임신의 과정에 걸쳐 상이한 시간에 피험체로부터 얻어지는 경우, 방법(1500)에서 확인된 일련의 여과된 정보제공 모체 좌위는 샘플마다 변할 수 있고, 이 좌위에서 결정된 태아 기원 RNA의 부분도 그럴 수 있다. 태아 기원인 샘플에서의 RNA의 부분은 임신 단계 또는 다른 인자를 제어할 때에도 또한 피험체마다 변할 수 있고, 임신 관련 장애를 갖는 피험체와 건강한 피험체 사이에 변할 수 있다. 따라서, 이 부분은 이러한 장애를 진단하기 위해 컷오프 값과 비교될 수 있다.
몇몇 실시형태에서, 하나 이상의 건강한 피험체로부터의 샘플을 사용하여 방법(1500)을 수행함으로써 컷오프 값을 결정한다. 몇몇 실시형태에서, 이 부분이 임의의 양으로 또는 소정의 차이로 컷오프를 초과하거나 컷오프보다 적은 경우 진단이 이루어진다. 비교는 임신한 암컷 피험체에서의 태아 기원 RNA의 부분과 컷오프 값 사이의 비율을 계산하거나 차이를 계산하는 것을 수반할 수 있다. 몇몇 실시형태에서, 비교는 임신한 암컷 피험체에서의 태아 기원 RNA의 부분이 유사한 임신 기간에서 건강한 임신한 여성에서 보일 수 있는 것과 상당히 다른지를 평가하는 것을 수반한다.
정보제공 태아 좌위를 검사함으로써 태아 기원인 샘플에서의 RNA의 부분을 또한 결정할 수 있다. 각각의 정보제공 태아 좌위에서, 서열 리드의 전체 수로 나눈 제2(태아 특이적) 대립유전자를 함유하는 서열 리드의 수인 태아 비율을 처음에 계산함으로써 이 부분을 추정할 수 있다. 이후, 태아 기여도는 태아 비율에 스칼라를 곱한 것이고 태아에서의 2개의 대립유전자의 상대 발현 수준을 나타낸다. 따라서, 정보제공 태아 좌위를 확인하고, 이 좌위를 여과시키고, 각각의 여과된 좌위에 대해 태아 기여도를 계산하고, 여과된 좌위에 대해 태아 기여도를 평균함으로써 방법(1500)의 검증을 수행할 수 있다. 원하는 경우, 여과된 정보제공 모체 좌위에 대해 계산된 태아 기여도를 여과된 정보제공 태아 좌위에 대해 계산된 태아 기여도로 평균함으로써 방법(1500)에 의해 결정된 RNA의 태아 기원 부분을 증가시킬 수 있다. 여기서 계산된 평균을 가중하여, 상이한 좌위에서 서열 리드의 수의 변동을 반영하여, 모체 또는 태아 특이적 좌위에 또는 달리 원하는 바대로 더 가중할 수 있다.
B. 실시예
1. 모체 혈장에서의 태아 및 모체 유래 전사체의 확인 및 예측
적어도 하나의 정보제공 SNP를 갖는 유전자로서 정의된 정보제공 유전자를 처음에 유전자형분석 데이터에 기초하여 확인하였다. 2개의 초기 임신 사례에서, 6,714 및 6,753개의 정보제공 유전자의 전체 수가 각각 태아 및 모체 기여도의 상대 비율을 검사하기 위해 이용 가능하다(도 16도 17). 2개의 후기 임신 사례에서, 7,788 및 7,761개의 정보제공 유전자의 전체 수가 각각 태아 및 모체 기여도의 상대 비율을 검사하기 위해 이용 가능하다. 모체 혈장에서의 태아 기여의 상대 비율을 측정하기 위해, 본 발명자들은 태아 특이적 대립유전자 모체 혈장 샘플에서 적어도 하나의 RNA-seq 리드에 의해 커버되는 RNA 전사체에 대해 분류하였다. 이러한 태아 유래 전사체의 상대 비율은 각각 초기 및 후기 임신 동안 3.70% 및 11.28%였다. 유사한 접근법을 이용하여, 모체 특이적 SNP 대립유전자를 사용하여 검사된, 순환에서의 모체 기여도의 상대 비율은 각각 초기 및 후기 임신 동안 76.90% 및 78.32%인 것으로 예측되었다(도 18a).
2. PET 및 대조군 임신 사례에 대한 RNA-SNP 분획 태아 및 모체 기여의 비교
본 발명자들은 PET 사례, 5641 및 이의 임신 연령 매치 대조군 사례, 7171 둘 다에서 검출된 GNAS 전사체에 대한 태아 및 모체 기여도 분율을 검사하였다. GNAS 전사체에서, 사례 5641에서 좌위 rs7121에서, 태아 특이적 SNP 대립유전자를 포함하는 정보제공 SNP 부위가 있고; 사례 7171에서 동일한 SNP 부위에서, 모체 특이적 SNP 대립유전자가 있었다. 사례 5641에서 이 SNP 부위에 대한 태아 및 모체 기여도 분율은 각각 0.09 및 0.91인 것으로 계산되었다. 반면, 사례 7171에서 동일한 SNP 부위에 대한 태아 및 모체 기여도 분율은 각각 0.08 및 0.92였다(도 19). 대조군 사례 7171과 비교하여, 이 전사체에서 12.5%의 태아 기여 분율의 증가가 있었고 1.09%의 모체 기여도 분율의 감소가 있었다. 흥미롭게도, FPKM에서의 21% 증가가 7171과 비교하여 사례 5641에서 이 전사체에 대해 검출되었다.
IV. 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법
A. 방법
모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법(2000)이 도 20에 도시되어 있다. 상기 방법은 태아를 임신한 암컷 피험체로부터 샘플을 분석하는 것을 수반한다. 샘플은 모체 혈액 혈장을 가질 수 있고, 모체 및 태아 유래 RNA 분자의 혼합물을 함유한다. 방법(300)에 대해 상기 기재된 바대로 샘플을 얻고 제조할 수 있다.
단계(2001)에서, 복수의 서열 리드를 수취한다. 단계(2002)에서, 서열 리드를 기준 서열에 정렬시킨다. 단계(301 및 302)에 대해 상기 기재된 바대로 이 단계를 수행할 수 있다.
단계(2003)에서, 하나 이상의 정보제공 좌위를 확인한다. 각각의 좌위는 상응하는 제1 대립유전자에 대해 제1 독립체에서 동형접합성이고, 상응하는 제1 대립유전자 및 상응하는 제2 대립유전자에 대해 제2 독립체에서 이형접합성이다. 제1 독립체는 임신한 암컷 피험체 또는 태아이고, 제2 독립체는 다른 임신한 암컷 피험체 및 태아이다. 단계(303)에 대해 상기 기재된 바대로 정보제공 좌위를 확인할 수 있다.
단계(2004)에서, 단계(304)에서처럼 정보제공 좌위를 여과시키고, 하나 이상의 여과된 정보제공 좌위를 확인한다. 몇몇 실시형태에서, SNP를 나타내는 정보제공 좌위만이 여과에 고려된다. 상기 방법의 일 예에서, 여과된 정보제공 좌위는 모체 혈장에서 "A" 대립유전자에 대한 적어도 하나의 서열 리드 및 "B" 대립유전자에 대한 하나의 서열 리드를 갖는 정보제공 SNP를 포함한다.
이후, 단계(2005-2008)에서 개체 여과된 정보제공 좌위의 수준에서 서열 리드를 조작한다. 단계(2005 및 2006)에서, 각각의 여과된 정보제공 좌위에 대해 제1 수 및 제2 수를 결정한다. 단계(2005)에서 좌위에 정렬되고 상응하는 제1 대립유전자를 함유하는 서열 리드의 수로서 제1 수를 결정한다. 단계(2006)에서 좌위에 정렬되고 상응하는 제2 대립유전자를 함유하는 서열 리드의 수로서 제2 수를 결정한다. 상기 기재된 단계(305 및 306)와 유사하게 단계(2005 및 2006)를 수행할 수 있다.
단계(2007)에서, 각각의 여과된 정보제공 좌위에 대한 제1 수와 제2 수의 비율을 계산한다. 이 비율은 제1 대립유전자 및 제2 대립유전자를 함유하는 서열 리드(및, 연장에 의해, 샘플 내의 전사체)의 상대 풍부도를 나타낸다. 몇몇 실시형태에서, 제1 수를 제2 수로 나누어서 이 비율을 단순히 계산한다. 이러한 계산은 모체 또는 태아 특이적 대립유전자에 대한 다수의 서열 리드로서 공유된 대립유전자에 대한 서열 리드의 수를 생성시킨다. 이 비율 또는 이의 역수는 대립유전자 비율 및 SNP 좌위의 경우 RNA-SNP 대립유전자 비율로 생각될 수 있다.
몇몇 실시형태에서, 모체 특이적 SNP 대립유전자를 포함하는 정보제공 SNP의 경우, 각각의 SNP에 대한 RNA-SNP 대립유전자 비율은 모체 특이적 대립유전자:공유된 대립유전자로서 계산된다. 반면, 태아 특이적 SNP 대립유전자를 포함하는 정보제공 SNP의 경우, RNA-SNP 대립유전자 비율은 태아 특이적 대립유전자:공유된 대립유전자로서 계산될 수 있다. 데이터 정규화가 전제 조건인 유전자 발현 분석과 달리, RNA-SNP 대립유전자 비율 분석은 데이터 정규화를 요하지 않고, 더 적은 바이어스(bias)가 도입된다. 하나 초과의 정보제공 SNP를 함유하는 전사체의 경우, 각각의 정보제공 SNP 부위에 대해 RNA-SNP 대립유전자 비율을 계산할 수 있고, 전사체마다 평균 RNA-SNP 대립유전자 비율을 산출할 수 있다.
단계(2007)에서, 대안적으로 제2 수를 제1 수와 제2 수의 합으로 나누어서 이 비율을 계산할 수 있다. 여기서, 이 비율은 좌위에서의 모든 서열 리드의 분획으로서 모체 또는 태아 특이적 대립유전자에 대한 서열 리드의 수를 제공한다. "A" 및 "B" 대립유전자의 면에서, 이 비율은 하기대로 표시될 수 있다.
B 대립유전자 비율 = B 대립유전자 수/(A 대립유전자 수 + B 대립유전자 수)
이론적으로, 태아 또는 모친이 오로지 기여한 혈장 전사체의 경우, 대립유전자 특이적 발현이 없다는 것을 가정하여, B 대립유전자 비율은 0.5이어야 한다. 이 비율을 계산하는 다른 방법은 당업자에게 명확할 것이다.
단계(2008)에서, 이 비율이 컷오프를 초과할 때, 여과된 정보제공 좌위를 마커로서 지정한다. 몇몇 실시형태에서, 컷오프는 약 0.2 내지 약 0.5이다. 몇몇 실시형태에서, 컷오프는 0.4이다. 상기 방법의 일 예에서, B 대립유전자 비율 컷오프는 높은 태아 또는 모체 기여도를 갖는 RNA 전사체의 경우 ≥0.4로서 정의된다. 이 컷오프는 RNA-seq 리드의 랜덤 샘플링 및 포이즌(Poisson) 분포를 고려한다. 몇몇 실시형태에서, 이 비율이 컷오프를 초과할 때 "B" 대립유전자의 기여는 높다고 한다.
특정한 정보제공 좌위에서의 높은 대립유전자 비율은 (ⅰ) 제2 또는 "B" 대립유전자가 "A" 대립유전자보다 이형접합성 개체에서 매우 높게 발현된다(즉, 대립유전자는 비대칭적으로 발현된다)는 것, (ⅱ) 모체 혈장에서의 좌위에 정렬된 모든 RNA의 더 높은 공유가 이형접합성 개체에 의해 기여된다는 것, 또는 (ⅰ) 및 (ⅱ) 둘 다를 나타낼 수 있다. 정보제공 좌위와 관련된 유전자가 병리학적으로 과발현된 경우, 높은 대립유전자 비율은 또한 임신 관련 장애를 나타낼 수 있다. 따라서, 상기 방법의 몇몇 실시형태는 또한 여과된 정보제공 좌위가 제2 독립체(즉, 이형접합성 개체)에 대한 마커로서 지정되는지에 기초하여 임신 관련 장애를 진단하는 것을 포함한다. 이러한 진단을 할 때에, 대립유전자 비율에 대한 비교에 이용된 컷오프는 건강한 임신한 피험체로부터 얻은 혈장 샘플에서의 전사체 수준에 기초할 수 있다.
몇몇 실시형태에서, 특정한 여과된 정보제공 좌위에서, 모체 또는 태아 기원인 샘플에서 RNA의 부분을 예측하기 위해 방법(2000)을 또한 이용할 수 있다. 단계(2007)에서 계산된 비율에 스칼라를 곱하여 예측을 한다. 스칼라는 이형접합성 개체에서의 제2 대립유전자의 발현에 대한 좌위에서의 전체 발현 수준을 나타낸다.
설명하기 위해, 상기 방법에서 계수된 제2("B") 대립유전자가 태아 특이적인 경우, 상기한 바대로 계산된 B 대립유전자 비율은 여과된 정보제공 좌위에 대한 모든 서열 리드의 분획으로서의 이 대립유전자에 대한 서열 리드의 수를 나타낸다. 공유된("A") 대립유전자를 함유하는 서열 리드 중에서, 몇몇은 모친이 기여하고, 몇몇은 태아가 기여한다. 태아에서의 태아 특이적 및 공유된 대립유전자의 상대 발현 수준이 알려져 있거나 예측될 수 있을 경우, 좌위에 대해 모든 서열 리드에 대한 태아 기여도 분율의 예측치를 얻기 위해 B 대립유전자 비율을 스케일링할 수 있다. "A" 및 "B" 대립유전자가 태아에서 동등하게 발현되는 경우, 스칼라는 약 2이다. 좌위에서 서열 리드에 대한 모체 기여도 분율은 이후 1 - 태아 기여도 분율이다. 여과된 정보제공 좌위에서의 "B" 대립유전자가 모체 특이적일 때 유사한 계산을 할 수 있다.
B. 실시예: 높은 태아 및 모체 기여도
상기 기재된 바대로 0.4의 B 대립유전자 컷오프를 이용하여, 순환하는 전사체의 0.91%는 초기 임신(즉, 제1 및 제2 삼분기) 동안 태아에 의한 높은 기여도를 나타내는 것으로 나타났다. 이 백분율은 후기 임신(즉, 제3 삼분기) 동안 2.52%로 증가하였다. 반면, 42.58% 및 50.98%는 각각 초기 및 후기 임신(도 16, 도 17도 18a) 동안 모친에 의한 높은 기여도를 나타냈다.
V. 임신 관련 장애를 진단하기 위한 유전자의 용도
A. 임신 관련 유전자
임신 관련 유전자를 확인하는 방법이 또한 제공된다. 상기 방법은 복수의 제1 서열 리드 및 복수의 제2 서열 리드를 수취하는 것을 포함한다. 제1 서열 리드는 임신한 여성의 혈액 혈장 샘플로부터 얻은 서열분석 RNA 분자로부터 생긴다. 제2 서열 리드는 비임신 여성의 혈액 혈장 샘플로부터 얻은 서열분석 RNA 분자로부터 생긴다. 제1 서열 리드 및 제2 서열 리드는 기준 서열과 정렬되고, 일련의 후보 유전자가 지정된다.
상기 방법에 따르면, 임신한 여성 및 비임신 여성으로부터의 샘플에서 각각의 후보 유전자에 대한 발현 수준을 결정하기 위해 이후 서열 리드를 이용한다. 구체적으로, 각각의 후보 유전자의 경우, 제1 서열 리드를 이용하여 후보 유전자에 상응하는 전사체의 제1 수를 결정하고; 제2 서열 리드를 이용하여 후보 유전자에 상응하는 전사체의 제2 수를 결정한다. 전사체의 제1 수 및 전사체의 제2 수를 정규화할 수 있다. 후보 유전자에 대한 전사체 비율을 이후 계산하고, 전사체 비율은 전사체의 제2 수로 나눈 전사체의 제1 수를 포함한다. 이후, 전사체 비율을 컷오프와 비교한다. 전사체 비율이 컷오프를 초과하는 경우, 후보 유전자는 임신 관련 유전자로서 확인된다.
상기 방법의 몇몇 실시형태에서, 전사체의 제1 수의 정규화는 제1 서열 리드의 전체 수에 의해 전사체의 제1 수를 스케일링하는 것에 상응한다. 유사하게, 전사체의 제2 수의 정규화는 제2 서열 리드의 전체 수에 의해 전사체의 제2 수를 스케일링하는 것에 상응할 수 있다. 다른 실시형태에서, 각각의 후보 유전자에 대한 전사체의 제1 수의 정규화는 모든 후보 유전자에 대해 제1 전사체의 전체 수에 의해 후보 유전자에 대한 전사체의 제1 수를 스케일링하는 것에 상응한다. 각각의 후보 유전자에 대한 전사체의 제2 수의 정규화는 모든 후보 유전자에 대한 제2 전사체의 전체 수에 의해 후보 유전자에 대한 전사체의 제2 수를 스케일링하는 것에 상응한다.
유전자가 비임신 여성과 비교하여 임신한 여성에서 더 높은 수준으로 발현되고 그 외 동일한 경우, 상기 방법은 일반적으로 이 유전자를 임신 관련으로 확인한다. 임신한 여성 및 비임신 여성은 동일한 개체일 수 있고; 즉, 출산 전 및 후에 개체로부터 얻은 샘플은 각각 제1 서열 리드 및 제2 서열 리드의 소스일 수 있다.
본 발명자들은 태아 특이적 대립유전자를 보유하는 순환하는 RNA 전사체의 하위세트가 출산 후 모체 혈장으로부터 완전히 사라진다는 것을 밝혀냈다(도 18b). 이 전사체는 모체 혈장에서 태아 특이적인 것으로 생각된다. 반면, 모체 특이적 대립유전자의 부분은 출산 후 또한 검출 가능하지 않다. 따라서, 본 발명자들은 출산 전 및 후의 모체 혈장에서의 이의 표시를 직접 비교함으로써 임신 관련 유전자라 불리는 임신 동안 상향조절을 나타낸 유전자를 조사하였다. 본 발명자들은 제3 삼분기 임신 여성의 출산 전 혈장에서 검출된 것으로서 임신 관련 유전자를 정의하였고, 이의 산후 혈장 수치는 사례 둘 다에서 ≥2배로 감소하였다. 데이터 정규화 및 차등적 유전자 발현 분석에 대해 생물정보학 알고리즘을 이용함으로써, 본 발명자들은 131개 임신 관련 유전자의 목록을 파일화하였다(도 21). 이들 유전자들 중에서, 15개는 이전에 모체 혈장에서 임신 특이적인 것으로 보고되었다1,2,4,5,9,10,12. 1단계 실시간 RT-PCR을 이용하여, 본 발명자들은 출산 전 모체 혈장에서 풍부한 5개의 새로 확인된 전사체, 즉 제3 삼분기 임신 여성으로부터의 10개의 추가의 혈장 샘플에서의 STAT1, GBP1HSD17B1, 및 제3 삼분기 임신 여성의 다른 코호트로부터의 10개의 혈장 샘플에서의 KRT18GADD45G의 임신 관련을 추가로 검증하였다(도 22).
임신과 이 131개 유전자의 관련을 평가하기 위해, 모든 혈장 샘플에 대해 계층적 클러스터링을 수행하였다. 임신한 여성(즉, 초기 및 후기 임신)으로부터의 혈장 샘플과 진행 중인 임신과 관련되지 않은 것(즉, 비임신 대조군 및 출산 후) 사이의 명확한 분리가 관찰되었다(도 23).
흥미롭게도, 2개의 후기 임신 사례의 혈장 샘플과 이의 상응하는 태반 및 모체 혈액 세포 사이에 이 131개 유전자의 발현 패턴을 비교할 때, 태반과 출산 전 혈장 샘플 사이에 및 모체 혈액 세포와 산후 혈장 샘플 사이에 더 명확한 유사성이 관찰되었다(도 24a). 이 관찰은 가장 임신과 관련 유전자가 모체 혈액 세포에서보다 태반에서 우선적으로 발현된다는 가설을 지지한다. 더욱이, 태반 및 모체 혈장에서의 이 임신 관련 전사체의 발현 수준은 양으로 상관된다(P < 0.05, 스피어만 상관)(도 24b).
B. 태반 및 모체 혈액에서의 차등적 유전자 발현
본 발명자들이 출산 전 및 후의 모체 혈장 샘플의 직접 검사를 통해 임신 관련 유전자의 패널을 분류할 수 있는 반면, 본 발명자들은 비교 목적을 위해 태반 및 혈액 세포 RNA-seq 데이터를 또한 보고하였다. 임신 관련 유전자가 상기 기재된 바대로10,15 태반에서 높은 수준으로 발현되고 모체 혈액 세포에서 낮은 수준으로 발현된 것이어야 한다고 가정하여, 본 발명자들은 조직 기반 분석을 위해 최소 컷오프로서 20배 차이를 임의로 설정하였다. 이 조직 기반 분석은 전체 798개의 가능한 후보 유전자를 생성하였고, 여기서 모체 혈장에서의 태아 및 모체 기여도의 비율을 계산하였다. 전체 전사물과 비교할 때(도 18a), 비교적 높은 비율의 주요 태아 기여도를 갖는 유전자가 확인되었다(도 25). 그러나, 혈장 기반 전략은 주요 태아 기여를 갖는 더 높은 비율의 유전자를 확인할 수 있는 데 있어서 조직 기반 전략을 능가하였다(도 25).
C. 질환 또는 장애와 관련된 유전자
임신 관련 장애와 관련된 유전자를 확인하는 방법이 또한 본 명세서에서 제공된다. 상기 방법은 복수의 제1 서열 리드 및 복수의 제2 서열 리드를 수취하는 것을 포함한다. 제1 서열 리드는 건강한 임신한 여성의 혈액 혈장 샘플로부터 얻은 서열분석 RNA 분자로부터 생긴다. 제2 서열 리드는 임신 관련 장애를 겪거나 임신 관련 장애를 겪는 태아를 수태한 임신한 여성의 혈액 혈장 샘플로부터 얻은 서열분석 RNA 분자로부터 생긴다. 제1 서열 리드 및 제2 서열 리드를 기준 서열과 정렬시키고, 일련의 후보 유전자를 지정한다.
상기 방법에 따르면, 2개의 임신한 여성에 대한 샘플에서의 각각의 후보 유전자에 대해 발현 수준을 결정하기 위해 이후 서열 리드를 이용한다. 구체적으로, 각각의 후보 유전자의 경우, 제1 서열 리드를 이용하여 후보 유전자에 상응하는 전사체의 제1 수를 결정하고, 제2 서열 리드를 이용하여 후보 유전자에 상응하는 전사체의 제2 수를 결정한다. 전사체의 제1 수 및 전사체의 제2 수를 정규화할 수 있다. 이후, 후보 유전자에 대한 전사체 비율을 계산하고, 전사체 비율은 전사체의 제2 수로 나눈 전사체의 제1 수를 포함한다. 이후, 전사체 비율을 기준 값과 비교한다. 전사체 비율이 기준 값과 다른 경우, 후보 유전자는 장애와 관련된 것으로 확인된다.
상기 방법의 몇몇 실시형태에서, 전사체의 제1 수의 정규화는 제1 서열 리드의 전체 수에 의해 전사체의 제1 수를 스케일링하는 것에 상응한다. 유사하게, 전사체의 제2 수의 정규화는 제2 서열 리드의 전체 수에 의해 전사체의 제2 수를 스케일링하는 것에 상응할 수 있다. 다른 실시형태에서, 각각의 후보 유전자에 대한 전사체의 제1 수의 정규화는 모든 후보 유전자에 대해 제1 전사체의 전체 수에 의해 후보 유전자에 대한 전사체의 제1 수를 스케일링하는 것에 상응한다. 각각의 후보 유전자에 대한 전사체의 제2 수의 정규화는 모든 후보 유전자에 대한 제2 전사체의 전체 수에 의해 후보 유전자에 대한 전사체의 제2 수를 스케일링하는 것에 상응할 수 있다.
임신 관련 장애와 관련된 유전자를 확인하는 방법에 따르면, 몇몇 실시형태에서, 기준 값은 1이다. 몇몇 실시형태에서, 전사체 비율 및 기준 값이 컷오프를 초과하거나 적은 경우, 전사체 비율은 기준 값과 다르다. 몇몇 실시형태에서, 전사체 비율과 기준 값 사이의 차이가 컷오프를 초과하는 경우, 전사체 비율은 기준 값과 다르다.
유전자의 발현 수준이 장애를 나타내거나 나타내지 않은 임신에서 상당히 다르고 그 외 동일한 경우, 상기 방법은 일반적으로 이 유전자를 임신 관련 장애와 관련된 것으로 확인한다.
태아 장애 및 임신 병리학의 진단 및 모니터링은 질환과 관련된 모체 혈장 RNA를 사용하여 이전에 성취되었다. 예를 들어, 부신피질자극 방출 호르몬(corticotrophin releasing hormone: CRH) mRNA의 모체 혈장 수치는 임신중독증의 비침습적 검출 및 예측에 유용한 것으로 나타났다2,3. 모체 혈장에서의 인터류킨 1 수용체 유사 1(IL1RL1) mRNA의 검출은 자연히 발생한 조산을 갖는 여성을 확인하는 데 유용한 것으로 나타났다8. 성장 관련 모체 혈장 RNA 마커의 패널은 태아 성장 및 자궁내 발육 지연의 비침습적 평가에 대해 또한 조사되었다4. 이 연구에서, 본 발명자들은 새로운 질환 관련 순환하는 RNA 마커가 정상 임신한 여성 및 임신중독증, 자궁내 발육 지연, 조기 진통 및 태아 이수성과 같은 문제가 있는 임신을 갖는 여성의 모체 혈장 전사물을 직접 비교함으로써 확인될 수 있다고 판단한다. 이 접근법의 실행 가능성을 입증하기 위해, 본 발명자들은 임신중독증을 발생시킨 3명의 임신한 여성 및 일치한 임신령의 7명의 문제가 없는 임신한 여성으로부터 얻은 모체 혈장 샘플에 대해 RNA-Seq를 수행하였다. 본 발명자들은 임신중독증 임신 여성의 혈장에서 상당한 상승을 나타낸 98개의 전사체를 확인하였다(도 26). 새로 확인된 임신중독증 관련 전사체는 질환의 예측, 예언 및 모니터링에 잠재적으로 유용하다.
이 기술을 또한 조기 진통의 예측 및 모니터링에 이용될 수 있다. 상기 기술은 또한 임박한 태아 사망의 예측에 이용될 수 있다. 상기 기술은 또한, 관련된 유전자가 태아 또는 태반 조직에서 전사되고 전사체가 모체 혈장에서 검출 가능한 한, 유전자 돌연변이에 의해 발생한 질환을 검출하기 위해 이용될 수 있다.
혈장 RNA-Seq는 다른 임상 시나리오에서 적용될 수 있다. 예를 들어, 이 연구에서 개발된 혈장 RNA-Seq 방법론은 비정상 혈장 RNA 농도가 보고된 암과 같은 다른 병리학적 병증을 연구하는 데 잠재적으로 유용할 것이다13,14. 예를 들어, 치료 전 및 후의 암 환자의 혈장 전사물를 비교함으로써, 비침습적 진단학적 적용에 대해 종양 관련 순환하는 RNA 마커가 확인될 수 있다.
VI. 특이적 유전자의 대립유전자 발현 패턴
대립유전자 발현 패턴25을 검사하기 위해 RNA 서열분석을 이용한다. 본 발명자들은 RNA 전사체가 조직으로부터 순환으로 방출될 때 소정의 유전자에 대한 대립유전자 발현 패턴이 보유되고, 이에 따라 혈장에서 검출될 수 있다고 상정하였다. 이 연구에서, 본 발명자들은 2개의 RNA 전사체, 즉 임신 특이적 유전자인 PAPPA 및 각인된(imprinted) 모체로 발현된 유전자인 H19의 대립유전자 수를 검사하였다26,27.
PAPPA 유전자의 경우, 본 발명자들은 태아 특이적 SNP 대립유전자를 함유하는 rs386088인 SNP를 분석하였다(도 27). 출산 후의 혈장 샘플에서의 PAPPA RNA-seq 리드의 부재는 이것이 실제로 임신 특이적이라는 것을 나타낸다4. 흥미롭게도, 출산 전의 모체 혈장과 태반 RNA 샘플 사이의 태아-대립유전자 리드 수의 비율의 통계학적으로 유의적인 차이가 없어서(P = 0.320, χ2 시험), 모체 혈장 데이터가 태반에서의 PAPPA의 이중 대립유전자(bi-allelic) 발현 패턴을 반영한다는 것을 나타낸다.
본 발명자들은 태반 및 모체 혈액 세포에서의 각인된 모체로 발현된 H19 유전자의 DNA 메틸화 패턴이 모체 혈장 DNA의 바이설파이트 DNA 서열분석에 의해 검출될 수 있다는 것을 최근에 보고하였다28. 여기서, 본 발명자들은 H19 유전자의 게놈 각인 상태가 RNA 수준에서 조사될 수 있는지를 추가로 검사하였다. 본 발명자들은 처음에 모체 특이적 대립유전자, 즉 태아에서 AA 및 모친에서 AG를 함유하는 rs2839698인 H19 유전자의 엑손 1에서의 SNP 부위에 집중하였다. 도 28에 도시된 바대로, 출산 후의 모체 혈장에서 G 대립유전자만이 검출되었다(도 28). 이러한 단일대립유전자 패턴은 각인 조절 구역에서의 rs4930098 SNP 부위에 대한 비메틸화 G 대립유전자에 대한 이의 연결에 따른다(도 29). 출산 전의 모체 혈장에서, G 대립유전자가 존재하지만, 태반이 기여한 A-대립유전자가 또한 검출되었다(도 28). 모체 특이적 대립유전자를 보유하는 3개의 다른 SNP 부위, 즉 rs2839701, rs2839702 및 rs3741219에서, 유사한 대립유전자 패턴, 즉 출산 전의 모체 혈장에서의 이중 대립유전자 및 출산 후의 모체 혈장에서의 모노대립유전자가 발견되었다(도 28). 이 SNP 부위에 대한 모체 특이적 대립유전자는 비메틸화되고 따라서 전사된 동일한 모체 단상형(haplotype)에 있을 것이다. 특히, H19 RNA는 모체 혈액 세포에서 발현되지 않아서(도 28), 혈장에서의 H19 RNA 분자가 혈액 세포 이외의 모체 조직/장기로부터 유래한다는 것을 제시한다. H19 발현을 나타내는 것으로 보고된 비태반 및 비태아 조직은 부신, 골격근, 자궁, 지방세포, 간 및 췌장을 포함하였다29.
VII. 결론
이 작업에서, 본 발명자들은 RNA-seq를 이용하여 모체 혈장에서 유전자전사적(transcriptomic) 활성의 포괄적 검토를 제공하는 기술을 개발하는 것을 목표로 하였다. 본 발명자들은 전체 태아 게놈이 모체 혈장에서 균등하게 나타나므로30, 하나 또는 몇몇의 태아 특이적 좌위를 표적화함으로써 모체 혈장에서의 분획 태아 DNA를 계산할 수 있다는 것을 이전에 나타냈다. 순환하는 DNA와 달리, 모체 혈장에서의 태아 유래 RNA 전사체의 비율의 측정은 태아 및 모체 조직에서의 차등적 유전자 발현 및 아마도 순환으로의 이의 방출에 의해 복잡하므로 덜 간단하다. 모체 혈장에서 RNA-seq를 수행하고 태아와 모친 사이의 다형 차이를 검사함으로써, 본 발명자들은 태아가 기여한 혈장 전사체의 비율을 예측할 수 있었다. 모체 유래 전사체가 혈장 전사물에 우세하지만, 예상할 수 있는 것처럼, 모체 혈장에서의 순환하는 전사체의 3.70% 및 11.28%가 각각 초기 및 후기 임신 동안 태아로부터 유래한다. 이 태아 유래 전사체는 태아 및 모친이 동시 기여하는 RNA 분자, 및 태아가 오로지 기여하는 것을 포함한다. 본 발명자들은 후자가 각각 초기 및 후기 임신 동안 모체의 순환하는 전사체의 0.90% 및 2.52%를 구성한다는 것을 발견하였다. 후기 임신 동안의 더 높은 표시의 이러한 태아 특이적 유전자는 아마도 임신이 진행되면서 태아 및 태반의 크기의 증가와 상관된다.
이 연구에서, 본 발명자들은 태반에서의 임신 특이적 PAPPA 유전자의 균형이룬 RNA 대립유전자 발현 및 각인된 모체로 발현된 H19 유전자의 단일대립유전자 발현이 모체 혈장에서 관찰될 수 있다는 것을 나타낸다. 이 데이터는 모체 혈장이 대립유전자 발현 패턴의 연구에 대한 비침습적 샘플 소스로서 사용될 수 있다는 것을 제시한다.
출산 전 및 후의 모체 혈장 샘플에서의 RNA 전사체의 정량적 비교에 의해, 본 발명자들은 산후 혈장 샘플에서 이의 감소한 표시로 입증된 바대로 임신 동안 상향조절된 131개 유전자의 목록을 컴파일링하였다. 예상된 바대로, 이 유전자의 프로파일은 임신한 여성의 혈장 샘플을 비임신 여성의 것으로부터 구별하기 위해 이용될 수 있다. 출산 전 및 후의 모체 혈장 샘플의 이러한 직접 비교는 고속 방식으로 본 발명자들이 임신 관련 유전자를 분류하도록 하고, 이는 선행 작업에서 입증된 바대로10,15 모체 혈액 세포에서보다 태반에서 훨씬 더 높은 수준으로 반드시 발현될 필요는 없다. 본질적으로, 이 직접 혈장 검사 방법은 태반 조직 및 혈액 세포의 유전자전사적 프로파일이 선험적 지식 없이 순환하는 임신 관련 RNA 전사체의 발견에 대한 다른 방안을 제시한다.
본 발명자들은 RNA-seq가 혈장 전사물을 프로파일링하는 실행 가능한 방법이라는 것을 밝혀냈지만, 몇몇 기술적 문제가 추가로 개선될 수 있다. 첫째, 혈장 RNA-seq에 대한 정보 수율은 특히 혈장으로부터의 매우 전사된 rRNA 및 글로빈 유전자의 결실에서 서열분석 프로토콜의 추가의 최적화에 의해 증가하였다. 둘째, 본 발명자들은 기준 전사체에 오직 초점을 두고, 개개의 아이소폼을 아직 조사하지 않았다. 추가의 연구는 새로운 전사체의 검출, 및 서열분석 리드 길이를 증가시킴으로써 스플라이싱 변이체 및 이의 아이소폼의 차등 분석을 포함한다31-33. 셋째, 본 발명자들은 융모막 융모 및 양수가 유전자형 분석에 소모되므로 초기 임신 샘플에 대한 태아 및 모체 유래 전사체의 비율의 분석에서 ASE 여과를 생략하였다. 그럼에도 불구하고, 본 발명자들은 후기 임신에서 ASE 여과가 모체 혈장에서의 주요 태아 및 모체 기여도를 갖는 유전자의 확인에 대한 현저한 영향을 미치지 않는다는 것을 나타냈다(도 16도 17).
결론으로, 본 발명자들은 태아 유래 전사체의 비율을 측정하고 모체 혈장에서 순환하는 임신 관련 유전자를 확인하기 위해 RNA-seq 기술을 이용할 수 있다는 것을 입증하였다. 이 연구는 모체 혈장의 유전자전사적 경관의 더 우수한 이해에 대한 경로를 조성하여 임신 관련 질환과 관련된 바이오마커 후보의 확인을 수월하게 한다. 본 발명자들은 이 기술이 임신 또는 태반 관련 질환 및 또한 암과 같은 다른 질환에 대한 분자 진단학에 대한 새로운 방안을 발생시킬 것이라고 생각한다34.
VIII. 이식
상기 기재된 바대로, 본 명세서에 기재된 방법은 또한 이식에 적용될 수 있다. 이식 방법은 태아 분석에 대한 것과 유사한 방식으로 진행될 수 있다. 예를 들어, 이식된 조직의 유전자형을 얻을 수 있다. 실시형태는 이식된 조직이 이형접합성이고 숙주 유기체(예를 들어, 남성 또는 여성)가 동형접합성인 좌위를 확인할 수 있다. 그리고, 실시형태는 이식된 조직이 동형접합성이고, 숙주 유기체(예를 들어, 남성 또는 여성)가 이형접합성인 좌위를 확인할 수 있다. 동일한 비율을 산출하고 컷오프 값과 비교하여 장애가 존재하는지를 결정할 수 있다.
IX. 컴퓨터 시스템
본 명세서에 언급된 임의의 컴퓨터 시스템은 임의의 적합한 수의 하위시스템을 이용할 수 있다. 이러한 하위시스템의 예는 도 30에서 컴퓨터 기기(3000)에 도시되어 있다. 몇몇 실시형태에서, 컴퓨터 시스템은 단일 컴퓨터 기기를 포함하고, 하위시스템은 컴퓨터 기기의 부품일 수 있다. 다른 실시형태에서, 컴퓨터 시스템 다수의 컴퓨터 기기를 포함할 수 있고, 각각은 내부 부품을 갖는 하위시스템이다.
도 30에 도시된 하위시스템은 시스템 버스(system bus)(3075)를 통해 상호연결된다. 추가의 하위시스템, 예컨대 프린터(3074), 키보드(3078), 저장 장치(들)(3079), 모니터(3076)(디스플레이 어댑터(3082)에 커플링됨), 및 기타가 도시되어 있다. 주변장치 및 입력/출력(I/O) 장치(I/O 제어기(3071)에 커플링됨)는 당해 분야에 공지된 임의의 수의 수단, 예컨대 시리얼 포트(3077)에 의해 컴퓨터 시스템에 연결될 수 있다. 예를 들어, 시리얼 포트(3077) 또는 외부 인터페이스(3081)(예를 들어, 이더넷(Ethernet), 와이파이(Wi-Fi) 등)는 컴퓨터 시스템(3000)을 광대역 네트워크, 예컨대 인터넷, 마우스 입력 장치 또는 스캐너에 연결하도록 사용될 수 있다. 시스템 버스(3075)를 통한 상호연결은 중앙 프로세서(3073)가 각각의 하위시스템과 소통하고, 시스템 메모리(3072) 또는 저장 장치(들)(3079)(예를 들어, 고정 디스크, 예컨대 하드 드라이브 또는 광학 디스크)로부터의 명령의 실행, 및 하위시스템 사이의 정보의 교환을 제어하도록 한다. 시스템 메모리(3072) 및/또는 저장 장치(들)(3079)는 컴퓨터 판독 가능한 매체를 구현할 수 있다. 본 명세서에 언급된 임의의 데이터는 하나의 부품으로부터 다른 부품으로 출력될 수 있고, 사용자에게 출력될 수 있다.
컴퓨터 시스템은 예를 들어 외부 인터페이스(3081) 또는 내부 인터페이스에 의해 함께 연결된 복수의 동일한 부품 또는 하위시스템을 포함할 수 있다. 몇몇 실시형태에서, 컴퓨터 시스템, 하위시스템 또는 기기는 네트워크에 걸쳐 소통할 수 있다. 이런 경우에, 하나의 컴퓨터는 클라이언트(client)로 생각되고, 다른 컴퓨터는 서버(server)로 생각되며, 각각은 동일한 컴퓨터 시스템의 부분일 수 있다. 클라이언트 및 서버는 각각 다수의 시스템, 하위시스템 또는 부품을 포함할 수 있다.
본 발명의 임의의 실시형태가 하드웨어(예를 들어, 응용 주문형 집적 회로(application specific integrated circuit) 또는 필드 프로그래밍 가능한 게이트 어레이)를 사용하여 및/또는 모듈식 또는 집적식 방식으로 컴퓨터 소프트웨어와 함께 일반적으로 프로그래밍 가능한 프로세서를 사용하여 제어 논리의 형태로 실행될 수 있는 것으로 이해되어야 한다. 본 명세서에 사용되는 바대로, 프로세서는 동일한 집적 칩 상의 멀티 코어 프로세서, 또는 단일 회로판 또는 네트워크 상의 다수의 프로세싱 유닛을 포함한다. 본 명세서에 제공된 개시내용 및 교시내용에 기초하여, 당해 분야의 당업자는 하드웨어 및 하드웨어와 소프트웨어의 조합을 이용하여 본 발명의 실시형태를 실행하기 위한 다른 방식 및/또는 방법을 알고 이해할 것이다.
본원에 기재된 임의의 소프트웨어 부품 또는 기능은 예를 들어 종래의 또는 객체 지향 기법을 이용하여 임의의 적합한 컴퓨터 언어, 예를 들어 자바(Java), C++ 또는 Perl 등을 이용하여 프로세서에 의해 실행되는 소프트웨어 코드로서 실행될 수 있다. 소프트웨어 코드는 저장 및/또는 전송을 위한 컴퓨터 판독 가능한 매체 상에 일련의 명령 또는 명령어로서 저장될 수 있고, 적합한 매체는 임의 접근 메모리(RAM), 읽기 전용 메모리(ROM), 자기 매체, 예컨대 하드 드라이브 또는 플로피 디스크 또는 광학 매체, 예컨대 컴팩트 디스크(CD) 또는 DVD(디지털 다기능 디스크), 플래시 메모리 등을 포함한다. 컴퓨터 판독 가능한 매체는 이러한 저장 또는 전송 장치의 임의의 조합일 수 있다.
이러한 프로그램은 인터넷을 포함하여, 다양한 프로토콜에 따르는, 유선, 광학 및/또는 무선 네트워크를 통해 전송에 적합한 반송파 신호를 이용하여 또한 코딩되고 전송될 수 있다. 그러므로, 본 발명의 실시형태에 따른 컴퓨터 판독 가능한 매체는 이러한 프로그램에 의해 코딩된 데이터 신호를 이용하여 생성될 수 있다. 프로그램 코드에 의해 코딩된 컴퓨터 판독 가능한 매체는 호환 장치와 패키징되거나 (예를 들어, 인터넷 다운로드를 통해) 다른 장치로부터 별도로 제공될 수 있다. 임의의 이러한 컴퓨터 판독 가능한 매체는 단일 컴퓨터 제품(예를 들어, 하드 드라이브, CD 또는 전체 컴퓨터 시스템) 상에 또는 내에 있을 수 있고, 시스템 또는 네트워크 내의 상이한 컴퓨터 제품 상에 또는 내에 있을 수 있다. 컴퓨터 시스템은 사용자에게 본 명세서에 언급된 임의의 결과를 제공하기 위한 모니터, 프린터 또는 다른 적합한 디스플레이를 포함한다.
본 명세서에 기재된 임의의 방법은 단계를 수행하도록 구성될 수 있는 하나 이상의 프로세서를 포함하는 컴퓨터 시스템에 의해 전체로 또는 부분적으로 수행될 수 있다. 따라서, 실시형태는 본 명세서에 기재된 임의의 방법의 단계를 수행하도록 구성된 컴퓨터 시스템에 관한 것일 수 있고, 가능하게는 상이한 부품은 각각의 단계 또는 단계의 각각의 그룹을 수행한다. 숫자의 단계로 제시되어 있지만, 본 명세서에서 방법의 단계는 동일한 시간에 또는 상이한 순서로 수행될 수 있다. 추가로, 이 단계의 부분은 다른 방법으로부터의 다른 단계의 부분과 함께 사용될 수 있다. 또한, 단계의 전부 또는 일부는 임의일 수 있다. 추가로, 임의의 방법의 임의의 단계는 이 단계를 수행하기 위한 모듈, 회로 또는 다른 수단으로 수행될 수 있다.
특정한 실시형태의 구체적인 상세내용이 본 발명의 실시형태의 정신 및 범위로부터 벗어남이 없이 임의의 적합한 방식으로 조합될 수 있다. 그러나, 본 발명의 다른 실시형태는 각각의 개별 양상에 대한 구체적인 실시형태 또는 이 개별 양상의 구체적인 조합에 관한 것일 수 있다.
본 발명의 예시적인 실시형태의 상기 설명은 예시 및 설명의 목적을 위해 제시된다. 이것은 배타적이거나 본 발명을 기재된 정확한 형태로 제한하도록 의도되지 않고, 많은 변형 및 변경이 상기 교시내용의 견지에서 가능하다. 본 발명의 원칙 및 이의 실질적인 적용을 가장 잘 설명하여 당해 분야의 당업자가 다양한 실시형태에서 본 발명을 가장 잘 이용하도록 실시형태가 선택되고 기재되어 있으며, 특정한 사용에 적합한 다양한 변형이 고려된다.
"일", "하나" 또는 "그"의 언급은 구체적으로 반대를 나타내지 않는 한 "하나 이상"을 의미하는 것으로 의도된다.
본 명세서에 언급된 모든 특허, 특허 출원, 공보 및 설명은 모든 목적을 위해 그 전문이 참조문헌으로 포함된다. 어떤 것도 선행 기술로 인정되지 않는다.
X. 참조문헌
Figure 112015081206883-pct00004
Figure 112015081206883-pct00005

Claims (57)

  1. 태아를 임신한 암컷(female) 피험체로부터의 샘플을 사용하여 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법으로서,
    복수의 리드(read)를 수취하는 단계로서, 상기 리드는 모체 및 태아 유래 RNA 분자의 혼합물을 함유하는 샘플로부터 얻은 RNA 분자의 분석으로부터 얻어지는 단계;
    컴퓨터 시스템에 의해 기준 서열(reference sequence)에서의 상기 리드의 위치를 확인하는 단계;
    하나 이상의 정보제공 좌위(informative loci)를 확인하는 단계로서, 각각의 정보제공 좌위는 상응하는 제1 대립유전자에 대해 제1 독립체(entity)에서 동형접합성(homozygous)이고, 상응하는 제1 대립유전자 및 상응하는 제2 대립유전자에 대해 제2 독립체에서 이형접합성(heterozygous)이며, 상기 제1 독립체는 상기 임신한 암컷 피험체 또는 상기 태아이고, 상기 제2 독립체는 상기 임신한 암컷 피험체 및 상기 태아 중 다른 하나인 단계;
    상기 하나 이상의 정보제공 좌위를 여과시켜,
    상기 상응하는 제1 대립유전자를 함유하는 복수의 리드에서의 적어도 제1 선결정된 수의 리드가 위치하고, 그리고
    상기 상응하는 제2 대립유전자를 함유하는 복수의 리드에서의 적어도 제2 선결정된 수의 리드가 위치하는,
    상기 기준 서열의 발현된 구역 내에 위치한 하나 이상의 여과된 정보제공 좌위를 확인하는 단계;
    상기 여과된 정보제공 좌위의 각각에 대해,
    상기 여과된 정보제공 좌위에 위치하고 상기 상응하는 제1 대립유전자를 함유하는 리드의 제1 수를 결정하는 단계;
    상기 여과된 정보제공 좌위에 위치하고 상기 상응하는 제2 대립유전자를 함유하는 리드의 제2 수를 결정하는 단계;
    상기 제1 수의 제1 합과 상기 제2 수의 제2 합을 계산하는 단계;
    상기 제1 합과 상기 제2 합의 비율을 계산하는 단계; 및
    상기 비율을 컷오프(cutoff) 값과 비교하여 태아, 모친 또는 임신이 임신 관련 장애를 갖는지를 결정하는 단계로서, 상기 컷오프 값은 상기 임신 관련 장애가 없는 임신한 암컷 피험체로부터 얻은 하나 이상의 샘플로부터 결정되는 단계를 포함하는, 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법.
  2. 제1항에 있어서, 임신한 암컷의 샘플이 혈액 혈장의 샘플인, 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법.
  3. 제1항에 있어서, 상기 제2 독립체는 임신한 암컷 피험체인, 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법.
  4. 제1항에 있어서, 상기 제2 독립체는 태아인, 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법.
  5. 제1항에 있어서, 상기 제1 합과 상기 제2 합의 비율을 계산하는 단계는 상기 제2 합을 상기 제1 합과 상기 제2 합의 합으로 나누는 것을 포함하는, 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법.
  6. 제1항에 있어서, 상기 샘플로부터 얻은 RNA 분자의 분석은 상기 RNA 분자 또는 이의 cDNA 카피를 서열분석하는 것을 포함하는, 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법.
  7. 제1항에 있어서, 상기 샘플로부터 얻은 RNA 분자의 분석은 디지털 PCR을 수행하는 것을 포함하는, 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법.
  8. 제1항에 있어서, 기준 서열에서의 상기 리드의 위치를 확인하는 단계는 상기 리드를 상기 기준 서열에 정렬시키는 것을 포함하는, 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법.
  9. 제1항에 있어서, 상기 제1 선결정된 수의 리드는 1이고, 상기 제2 선결정된 수의 리드는 1인, 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법.
  10. 제1항에 있어서, 모체 조직으로부터 얻은 게놈 DNA를 서열분석하여 각각의 정보제공 좌위에서 상기 임신한 암컷 피험체의 유전자형을 결정하는 단계를 더 포함하는, 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법.
  11. 제1항에 있어서, 태반, 융모막 융모, 양수 또는 모체 혈장으로부터 얻은 게놈 DNA를 서열분석하여 각각의 정보제공 좌위에서 상기 태아의 유전자형을 결정하는 단계를 더 포함하는, 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법.
  12. 제1항에 있어서, 모체 또는 태아 기원인 샘플에서의 RNA의 부분을 예측하는 단계를 더 포함하되, 상기 부분은 스칼라(scalar)를 곱한 비율이며, 상기 스칼라는 제2 독립체에서 제2 대립유전자의 발현에 대한 여과된 정보제공 좌위에서의 전체 발현 수준을 나타내는 것인, 임신 관련 장애의 진단에 유용한 정보를 제공하는 방법.
  13. 태아를 임신한 암컷 피험체로부터의 샘플에서 태아 기원인 RNA의 부분을 결정하는 방법으로서,
    복수의 리드를 수취하는 단계로서, 상기 리드는 모체 및 태아 유래 RNA 분자의 혼합물을 함유하는 샘플로부터 얻은 RNA 분자의 분석으로부터 얻어지는 단계;
    컴퓨터 시스템에 의해 기준 서열에서의 상기 리드의 위치를 확인하는 단계;
    하나 이상의 정보제공 모체 좌위를 확인하는 단계로서, 상기 정보제공 모체 좌위의 각각은 상응하는 제1 대립유전자에 대해 태아에서 동형접합성이고, 상응하는 제1 대립유전자 및 상응하는 제2 대립유전자에 대해 임신한 암컷 피험체에서 이형접합성인 단계;
    상기 하나 이상의 정보제공 모체 좌위를 여과시켜,
    상기 상응하는 제1 대립유전자를 함유하는 복수의 리드에서의 적어도 제1 선결정된 수의 리드가 위치하고, 그리고
    상기 상응하는 제2 대립유전자를 함유하는 복수의 리드에서의 적어도 제2 선결정된 수의 리드가 위치하는,
    상기 기준 서열의 발현된 구역 내에 위치한 하나 이상의 여과된 정보제공 모체 좌위를 확인하는 단계;
    상기 여과된 정보제공 모체 좌위의 각각에 대해,
    상기 여과된 정보제공 모체 좌위에 위치하고 상기 상응하는 제1 대립유전자를 함유하는 리드의 제1 수를 결정하는 단계;
    상기 여과된 정보제공 모체 좌위에 위치하고 상기 상응하는 제2 대립유전자를 함유하는 리드의 제2 수를 결정하는 단계;
    상기 제1 수와 상기 제2 수의 합을 계산하는 단계;
    상기 제2 수를 상기 합으로 나눈 모체 비율을 계산하는 단계;
    상기 임신한 암컷 피험체에서의 상응하는 제2 대립유전자의 발현에 대해 상기 여과된 정보제공 모체 좌위에서의 전체 발현을 나타내는 스칼라를 결정하는 단계,
    상기 모체 비율에 스칼라를 곱하여 모체 기여도를 얻는 단계,
    1 - 모체 기여도로서 태아 기여도를 계산하는 단계, 및
    태아 기원인 상기 샘플에서의 RNA의 부분을 결정하는 단계로서, 상기 부분은 상기 여과된 정보제공 모체 좌위에 대한 태아 기여도의 평균인 단계를 포함하는, 태아 기원인 RNA의 부분을 결정하는 방법.
  14. 제13항에 있어서, 상기 평균은 상기 여과된 정보제공 모체 좌위에 대한 합이 가중된, 태아 기원인 RNA의 부분을 결정하는 방법.
  15. 제13항에 있어서, 상기 스칼라는 여과된 정보제공 모체 좌위에 대해 2인 것으로 추정되는, 태아 기원인 RNA의 부분을 결정하는 방법.
  16. 제13항에 있어서, 임신한 암컷의 샘플이 혈액 혈장의 샘플인, 태아 기원인 RNA의 부분을 결정하는 방법.
  17. 제13항에 있어서, 상기 샘플로부터 얻은 RNA 분자의 분석은 상기 RNA 분자 또는 이의 cDNA 카피를 서열분석하는 것을 포함하는, 태아 기원인 RNA의 부분을 결정하는 방법.
  18. 제13항에 있어서, 상기 샘플로부터 얻은 RNA 분자의 분석은 디지털 PCR을 수행하는 것을 포함하는, 태아 기원인 RNA의 부분을 결정하는 방법.
  19. 제13항에 있어서, 기준 서열에서의 상기 리드의 위치를 확인하는 단계는 상기 리드를 상기 기준 서열에 정렬시키는 것을 포함하는, 태아 기원인 RNA의 부분을 결정하는 방법.
  20. 제13항에 있어서, 상기 하나 이상의 여과된 정보제공 모체 좌위에 대한 제1 선결정된 수의 리드는 1이고, 상기 하나 이상의 여과된 정보제공 모체 좌위에 대한 제2 선결정된 수의 리드는 1인, 태아 기원인 RNA의 부분을 결정하는 방법.
  21. 제13항에 있어서, 모체 조직으로부터 얻은 게놈 DNA를 서열분석하여 각각의 정보제공 모체 좌위에서의 임신한 암컷 피험체의 유전자형을 결정하는 단계를 더 포함하는, 태아 기원인 RNA의 부분을 결정하는 방법.
  22. 제13항에 있어서, 태반, 융모막 융모, 양수 또는 모체 혈장으로부터 얻은 게놈 DNA를 서열분석하여 각각의 정보제공 모체 좌위에서의 태아의 유전자형을 결정하는 단계를 더 포함하는, 태아 기원인 RNA의 부분을 결정하는 방법.
  23. 제13항에 있어서,
    하나 이상의 정보제공 태아 좌위를 확인하는 단계로서, 상기 정보제공 태아 좌위의 각각은 상응하는 제1 대립유전자에 대해 임신한 암컷 피험체에서 동형접합성이고, 상응하는 제1 대립유전자 및 상응하는 제2 대립유전자에 대해 태아에서 이형접합성인 단계;
    상기 하나 이상의 정보제공 태아 좌위를 여과시켜,
    상기 상응하는 제1 대립유전자를 함유하는 복수의 리드에서의 적어도 제1 선결정된 수의 리드가 위치하고, 그리고
    상기 상응하는 제2 대립유전자를 함유하는 복수의 리드에서의 적어도 제2 선결정된 수의 리드가 위치하는,
    상기 기준 서열의 발현된 구역 내에 위치한 하나 이상의 여과된 정보제공 태아 좌위를 확인하는 단계;
    상기 여과된 정보제공 태아 좌위의 각각에 대해,
    상기 여과된 정보제공 태아 좌위에 위치하고 상기 상응하는 제1 대립유전자를 함유하는 리드의 제1 수를 결정하는 단계;
    상기 여과된 정보제공 태아 좌위에 위치하고 상기 상응하는 제2 대립유전자를 함유하는 리드의 제2 수를 결정하는 단계;
    상기 제1 수와 상기 제2 수의 합을 계산하는 단계;
    상기 제2 수를 상기 합으로 나눈 태아 비율을 계산하는 단계;
    상기 태아에서의 상응하는 제2 대립유전자의 발현에 대해 상기 여과된 정보제공 태아 좌위에서의 전체 발현을 나타내는 스칼라를 결정하는 단계,
    상기 태아 비율에 스칼라를 곱하여 태아 기여도를 얻는 단계; 및
    태아 기원인 상기 샘플에서의 RNA의 부분을 결정하는 단계로서, 상기 부분은 상기 여과된 정보제공 모체 좌위 및 상기 여과된 정보제공 태아 좌위에 대한 태아 기여도의 평균인 단계를 더 포함하는, 태아 기원인 RNA의 부분을 결정하는 방법.
  24. 제23항에 있어서, 상기 평균은 상기 여과된 정보제공 모체 좌위 및 상기 여과된 정보제공 태아 좌위에 대한 합이 가중된, 태아 기원인 RNA의 부분을 결정하는 방법.
  25. 제23항에 있어서, 상기 스칼라는 상기 여과된 정보제공 태아 좌위에 대해 2인 것으로 추정되는, 태아 기원인 RNA의 부분을 결정하는 방법.
  26. 제23항에 있어서, 상기 하나 이상의 여과된 정보제공 태아 좌위에 대한 제1 선결정된 수의 리드는 1이고, 상기 하나 이상의 여과된 정보제공 태아 좌위에 대한 제2 선결정된 수의 리드는 1인, 태아 기원인 RNA의 부분을 결정하는 방법.
  27. 제23항에 있어서, 모체 조직으로부터 얻은 게놈 DNA를 서열분석하여 각각의 정보제공 태아 좌위에서의 임신한 암컷 피험체의 유전자형을 결정하는 단계를 더 포함하는, 태아 기원인 RNA의 부분을 결정하는 방법.
  28. 제23항에 있어서, 태반, 융모막 융모, 양수 또는 모체 혈장으로부터 얻은 게놈 DNA를 서열분석하여 각각의 정보제공 태아 좌위에서의 태아의 유전자형을 결정하는 단계를 더 포함하는, 태아 기원인 RNA의 부분을 결정하는 방법.
  29. 제13항에 있어서, 태아 기원인 샘플에서의 RNA의 부분을 컷오프 값과 비교하여 임신 관련 장애의 진단에 유용한 정보를 제공하는 단계를 더 포함하는, 태아 기원인 RNA의 부분을 결정하는 방법.
  30. 태아를 임신한 암컷 피험체로부터의 샘플을 분석하여 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법으로서,
    복수의 리드를 수취하는 단계로서, 상기 리드는 모체 및 태아 유래 RNA 분자의 혼합물을 함유하는 샘플로부터 얻은 RNA 분자의 분석으로부터 얻어지는 단계;
    컴퓨터 시스템에 의해 기준 서열에서의 상기 리드의 위치를 확인하는 단계;
    하나 이상의 정보제공 좌위를 확인하는 단계로서, 상기 정보제공 좌위의 각각은 상응하는 제1 대립유전자에 대해 제1 독립체에서 동형접합성이고, 상응하는 제1 대립유전자 및 상응하는 제2 대립유전자에 대해 제2 독립체에서 이형접합성이며, 상기 제1 독립체는 상기 임신한 암컷 피험체 또는 상기 태아이고, 상기 제2 독립체는 상기 임신한 암컷 피험체 및 상기 태아 중 다른 하나인 단계;
    상기 하나 이상의 정보제공 좌위를 여과시켜,
    상기 상응하는 제1 대립유전자를 함유하는 복수의 리드에서의 적어도 제1 선결정된 수의 리드가 위치하고, 그리고
    상기 상응하는 제2 대립유전자를 함유하는 복수의 리드에서의 적어도 제2 선결정된 수의 리드가 위치하는,
    상기 기준 서열의 발현된 구역 내에 위치한 하나 이상의 여과된 정보제공 좌위를 확인하는 단계;
    상기 여과된 정보제공 좌위의 각각에 대해,
    상기 여과된 정보제공 좌위에 위치하고 상기 상응하는 제1 대립유전자를 함유하는 리드의 제1 수를 결정하는 단계;
    상기 여과된 정보제공 좌위에 위치하고 상기 상응하는 제2 대립유전자를 함유하는 리드의 제2 수를 결정하는 단계;
    상기 제1 수와 상기 제2 수의 비율을 계산하는 단계;
    상기 비율이 컷오프를 초과할 때, 상기 제2 독립체에 대한 마커로서 상기 여과된 정보제공 좌위를 지정하는 단계를 포함하는, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  31. 제30항에 있어서, 상기 임신한 암컷의 샘플은 혈액 혈장의 샘플인, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  32. 제30항에 있어서, 상기 제2 독립체는 상기 임신한 암컷 피험체인, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  33. 제30항에 있어서, 상기 제2 독립체는 태아인, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  34. 제30항에 있어서, 상기 제1 수와 상기 제2 수의 비율을 계산하는 단계는 상기 제2 수를 상기 제1 수와 상기 제2 수의 합으로 나누는 것을 포함하는, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  35. 제30항에 있어서, 상기 컷오프는 0.2 내지 0.5인, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  36. 제35항에 있어서, 상기 컷오프는 0.4인, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  37. 제30항에 있어서, 상기 샘플로부터 얻은 RNA 분자의 분석은 상기 RNA 분자 또는 이의 cDNA 카피를 서열분석하는 것을 포함하는, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  38. 제30항에 있어서, 상기 샘플로부터 얻은 RNA 분자의 분석은 디지털 PCR을 수행하는 것을 포함하는, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  39. 제30항에 있어서, 기준 서열에서의 상기 리드의 위치를 확인하는 단계는 상기 리드를 상기 기준 서열에 정렬시키는 것을 포함하는, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  40. 제30항에 있어서, 상기 제1 선결정된 수의 리드는 1이고, 상기 제2 선결정된 수의 리드는 1인, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  41. 제30항에 있어서, 모체 조직으로부터 얻은 게놈 DNA를 서열분석하여 각각의 정보제공 좌위에서 상기 임신한 암컷 피험체의 유전자형을 결정하는 단계를 더 포함하는, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  42. 제30항에 있어서, 태반, 융모막 융모, 양수 또는 모체 혈장으로부터 얻은 게놈 DNA를 서열분석하여 각각의 정보제공 좌위에서 상기 태아의 유전자형을 결정하는 단계를 더 포함하는, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  43. 제30항에 있어서, 여과된 정보제공 좌위가 상기 제2 독립체에 대한 마커로서 지정되는지에 기초하여 임신 관련 장애의 진단에 유용한 정보를 제공하는 단계를 더 포함하는, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  44. 제30항에 있어서, 여과된 정보제공 좌위를 포함하는 샘플에서의 RNA에 대해, 상기 제2 독립체 유래의 RNA의 부분을 결정하는 단계를 더 포함하되, 상기 부분은 상기 비율에 스칼라를 곱하여 결정되며, 상기 스칼라는 제2 독립체에서 제2 대립유전자의 발현에 대한 여과된 정보제공 좌위에서의 전체 발현 수준을 나타내는 것인, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  45. 제44항에 있어서, 상기 스칼라는 2인 것으로 추정되는, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  46. 제44항에 있어서, 1에서 상기 제2 독립체 유래의 RNA의 부분을 공제하여 상기 제1 독립체 유래의 RNA의 부분을 결정하는 단계를 더 포함하는, 모체 또는 태아 마커로서 게놈 좌위를 지정하는 방법.
  47. 제1항 내지 제12항 중 어느 한 항의 방법을 수행하도록 구성된 하나 이상의 프로세서를 포함하는 시스템.
  48. 제1항 내지 제12항 중 어느 한 항의 방법을 수행하도록 프로세서를 제어하기 위한 복수의 명령을 저장하는 컴퓨터 판독 가능한 매체를 포함하는 컴퓨터 제품.
  49. 제13항 내지 제29항 중 어느 한 항의 방법을 수행하도록 구성된 하나 이상의 프로세서를 포함하는 시스템.
  50. 제13항 내지 제29항 중 어느 한 항의 방법을 수행하도록 프로세서를 제어하기 위한 복수의 명령을 저장하는 컴퓨터 판독 가능한 매체를 포함하는 컴퓨터 제품.
  51. 제30항 내지 제46항 중 어느 한 항의 방법을 수행하도록 구성된 하나 이상의 프로세서를 포함하는 시스템.
  52. 제30항 내지 제46항 중 어느 한 항의 방법을 수행하도록 프로세서를 제어하기 위한 복수의 명령을 저장하는 컴퓨터 판독 가능한 매체를 포함하는 컴퓨터 제품.
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
KR1020157022741A 2013-02-28 2014-02-28 대량 동시 rna 서열분석에 의한 모체 혈장 전사물 분석 KR102082025B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361770985P 2013-02-28 2013-02-28
US61/770,985 2013-02-28
PCT/IB2014/059351 WO2014132244A1 (en) 2013-02-28 2014-02-28 Maternal plasma transcriptome analysis by massively parallel rna sequencing

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020207004904A Division KR102241051B1 (ko) 2013-02-28 2014-02-28 대량 동시 rna 서열분석에 의한 모체 혈장 전사물 분석

Publications (2)

Publication Number Publication Date
KR20150123807A KR20150123807A (ko) 2015-11-04
KR102082025B1 true KR102082025B1 (ko) 2020-02-26

Family

ID=51388739

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020207004904A KR102241051B1 (ko) 2013-02-28 2014-02-28 대량 동시 rna 서열분석에 의한 모체 혈장 전사물 분석
KR1020157022741A KR102082025B1 (ko) 2013-02-28 2014-02-28 대량 동시 rna 서열분석에 의한 모체 혈장 전사물 분석

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020207004904A KR102241051B1 (ko) 2013-02-28 2014-02-28 대량 동시 rna 서열분석에 의한 모체 혈장 전사물 분석

Country Status (15)

Country Link
US (2) US10240199B2 (ko)
EP (4) EP3351643B1 (ko)
JP (4) JP6525894B2 (ko)
KR (2) KR102241051B1 (ko)
CN (2) CN109136364A (ko)
AU (4) AU2014222312B2 (ko)
CA (2) CA2897684C (ko)
EA (2) EA202190075A3 (ko)
ES (1) ES2670544T3 (ko)
HK (1) HK1253097A1 (ko)
IL (4) IL289547B2 (ko)
MX (3) MX368004B (ko)
SG (2) SG10201609080WA (ko)
TW (3) TWI641834B (ko)
WO (1) WO2014132244A1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3351643B1 (en) * 2013-02-28 2019-09-18 The Chinese University Of Hong Kong Maternal plasma transcriptome analysis by massively parallel rna sequencing
CN105441432B (zh) * 2014-09-05 2019-05-28 天津华大基因科技有限公司 组合物及其在序列测定和变异检测中的用途
CN104232777B (zh) * 2014-09-19 2016-08-24 天津华大基因科技有限公司 同时确定胎儿核酸含量和染色体非整倍性的方法及装置
CN104232778B (zh) * 2014-09-19 2016-08-17 天津华大基因科技有限公司 同时确定胎儿单体型及染色体非整倍性的方法及装置
US10889861B2 (en) * 2015-06-17 2021-01-12 The Translational Genomics Research Institute Systems and methods for obtaining biological molecules from a sample
NL2016967B1 (en) 2016-06-15 2017-12-21 Iq Products B V Markers and their ratio to determine the risk for early-onset preeclampsia.
WO2018210275A1 (en) * 2017-05-16 2018-11-22 The Chinese University Of Hong Kong Integrative single-cell and cell-free plasma rna analysis
CN109280697B (zh) * 2017-07-20 2022-04-26 天昊生物医药科技(苏州)有限公司 利用孕妇血浆游离dna进行胎儿基因型鉴定的方法
CN110785499A (zh) 2018-05-25 2020-02-11 伊鲁米那股份有限公司 对先兆子痫具有特异性的循环rna标识
CN113677807A (zh) 2019-11-22 2021-11-19 因美纳有限公司 先兆子痫特异性的循环rna标记
KR102326813B1 (ko) * 2020-04-20 2021-11-16 강원대학교산학협력단 임신중독증의 예측 또는 진단을 위한 바이오마커로서의 miRNA-214-3p 및 miRNA-1290-3p
CA3186291A1 (en) 2020-06-10 2021-12-16 Board Of Regents, The University Of Texas System Method for determining risk of pre-term birth
KR102494583B1 (ko) * 2020-11-04 2023-02-07 강원대학교산학협력단 miR-31-5p 및 miR-1290-3p의 발현수준 비율을 이용한 임신중독증 진단 방법
KR102497167B1 (ko) * 2020-11-04 2023-02-08 강원대학교산학협력단 miR-155-5p 및 miR-1290-3p의 발현수준 비율을 이용한 임신중독증 진단 방법
WO2023235353A2 (en) 2022-06-03 2023-12-07 Illumina, Inc. Circulating rna biomarkers for preeclampsia

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004065629A1 (en) 2003-01-17 2004-08-05 The Chinese University Of Hong Kong Circulating mrna as diagnostic markers for pregnancy-related disorders
WO2012058316A1 (en) 2010-10-26 2012-05-03 Stanford University Non-invasive fetal genetic screening by sequencing analysis
WO2012093331A1 (en) 2011-01-05 2012-07-12 The Chinese University Of Hong Kong Noninvasive prenatal genotyping of fetal sex chromosomes

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6664056B2 (en) * 2000-10-17 2003-12-16 The Chinese University Of Hong Kong Non-invasive prenatal monitoring
AU2003263660A1 (en) * 2003-08-29 2005-03-16 Pantarhei Bioscience B.V. Prenatal diagnosis of down syndrome by detection of fetal rna markers in maternal blood
KR20130119506A (ko) * 2004-09-24 2013-10-31 베스 이스라엘 데코니스 메디칼 센터 임신성 합병증의 진단 및 치료 방법
AU2006224971B2 (en) * 2005-03-18 2009-07-02 Boston University A method for the detection of chromosomal aneuploidies
EP1859051A4 (en) 2005-03-18 2009-08-05 Univ Hong Kong Chinese MARKERS FOR PRENATAL DIAGNOSIS AND SURVEILLANCE
DE102005013949A1 (de) 2005-03-26 2006-09-28 Carl Zeiss Meditec Ag Scanvorrichtung
US7790463B2 (en) * 2006-02-02 2010-09-07 Yale University Methods of determining whether a pregnant woman is at risk of developing preeclampsia
US7901884B2 (en) 2006-05-03 2011-03-08 The Chinese University Of Hong Kong Markers for prenatal diagnosis and monitoring
US20080233583A1 (en) * 2007-02-20 2008-09-25 Regents Of The University Of California Biomarkers for preeclampsia
US20090029377A1 (en) 2007-07-23 2009-01-29 The Chinese University Of Hong Kong Diagnosing fetal chromosomal aneuploidy using massively parallel genomic sequencing
US20100016173A1 (en) 2008-01-30 2010-01-21 Proteogenix, Inc. Maternal serum biomarkers for detection of pre-eclampsia
EP4219762A1 (en) * 2008-02-01 2023-08-02 The General Hospital Corporation Use of microvesicles in diagnosis and prognosis of medical diseases and conditions
US20110171650A1 (en) * 2008-09-16 2011-07-14 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Gene expression related to preeclampsia
CN101871002B (zh) * 2009-04-22 2013-04-17 中山大学达安基因股份有限公司 一种无创性产前筛查21-三体综合征的试剂盒
FI3783110T3 (fi) 2009-11-05 2023-03-02 Fetaalisen genomin analyysi maternaalisesta biologisesta näytteestä
ES2534758T3 (es) * 2010-01-19 2015-04-28 Verinata Health, Inc. Métodos de secuenciación en diagnósticos prenatales
US9260745B2 (en) * 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
US20130316351A1 (en) 2010-06-07 2013-11-28 Osnat Ashur-Fabian Methods and kits for diagnosing conditions related to hypoxia
US20120077185A1 (en) 2010-08-06 2012-03-29 Tandem Diagnostics, Inc. Detection of genetic abnormalities and infectious disease
EP2426217A1 (en) 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
AU2011348267A1 (en) * 2010-12-23 2013-08-01 Sequenom, Inc. Fetal genetic variation detection
US8530228B2 (en) 2010-12-28 2013-09-10 Bexmart Integrated versatile and systems preparation of specimens
EP2490027A1 (en) * 2011-02-15 2012-08-22 Roche Diagnostics GmbH Means and methods for diagnosing pregnancy complications based on GDF-15 and PlGF/sFlt1
JP5837622B2 (ja) 2011-02-24 2015-12-24 ザ チャイニーズ ユニバーシティー オブ ホンコンThe Chinese University Of Hongkong 多胎妊娠の分子検査
CN102286462A (zh) * 2011-06-27 2011-12-21 深圳市易瑞生物技术有限公司 一种游离rna提取方法及试剂盒
EP3351643B1 (en) 2013-02-28 2019-09-18 The Chinese University Of Hong Kong Maternal plasma transcriptome analysis by massively parallel rna sequencing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004065629A1 (en) 2003-01-17 2004-08-05 The Chinese University Of Hong Kong Circulating mrna as diagnostic markers for pregnancy-related disorders
WO2012058316A1 (en) 2010-10-26 2012-05-03 Stanford University Non-invasive fetal genetic screening by sequencing analysis
WO2012093331A1 (en) 2011-01-05 2012-07-12 The Chinese University Of Hong Kong Noninvasive prenatal genotyping of fetal sex chromosomes

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Clinical Chemistry (2003) 5(49):727-731
Nature Medicine (2007) 2(13):218-223

Also Published As

Publication number Publication date
CA2897684C (en) 2021-06-29
MX2021015876A (es) 2022-02-03
EP2961851A1 (en) 2016-01-06
JP6525894B2 (ja) 2019-06-05
CN109136364A (zh) 2019-01-04
TW202246521A (zh) 2022-12-01
CA3117788A1 (en) 2014-09-04
KR102241051B1 (ko) 2021-04-16
CA2897684A1 (en) 2014-09-04
SG10201609080WA (en) 2016-12-29
IL281429A (en) 2021-04-29
EP2961851B1 (en) 2018-04-25
IL239939B (en) 2019-07-31
EP3587588B1 (en) 2021-06-30
CN105143466B (zh) 2018-10-23
JP2021164469A (ja) 2021-10-14
JP2019162121A (ja) 2019-09-26
SG11201506516TA (en) 2015-09-29
EA202190075A2 (ru) 2021-04-30
HK1253097A1 (zh) 2019-06-06
EP3351643B1 (en) 2019-09-18
KR20200020996A (ko) 2020-02-26
TW201900882A (zh) 2019-01-01
EP3587588A1 (en) 2020-01-01
MX2015010784A (es) 2016-05-12
AU2022200046A1 (en) 2022-02-03
AU2019246833B2 (en) 2021-10-07
IL239939A0 (en) 2015-08-31
JP7397498B2 (ja) 2023-12-13
IL267845A (en) 2019-09-26
EA037326B1 (ru) 2021-03-12
EP2961851A4 (en) 2016-11-16
TWI762728B (zh) 2022-05-01
US20190218615A1 (en) 2019-07-18
AU2014222312A1 (en) 2015-07-30
ES2670544T3 (es) 2018-05-30
EA202190075A3 (ru) 2021-07-30
IL289547B2 (en) 2024-01-01
AU2023200786A1 (en) 2023-03-09
CN105143466A (zh) 2015-12-09
US11970742B2 (en) 2024-04-30
EP3910072A3 (en) 2022-02-16
KR20150123807A (ko) 2015-11-04
EP3351643A1 (en) 2018-07-25
AU2014222312B2 (en) 2019-08-01
WO2014132244A9 (en) 2014-11-27
EP3910072A2 (en) 2021-11-17
WO2014132244A1 (en) 2014-09-04
US10240199B2 (en) 2019-03-26
TW201441618A (zh) 2014-11-01
IL289547B1 (en) 2023-09-01
JP2016511641A (ja) 2016-04-21
AU2022200046B2 (en) 2022-11-17
TWI641834B (zh) 2018-11-21
JP2024023390A (ja) 2024-02-21
IL267845B (en) 2021-04-29
EA201591582A1 (ru) 2015-12-30
IL281429B (en) 2022-02-01
MX368004B (es) 2019-09-13
MX2019010844A (es) 2019-10-30
AU2019246833A1 (en) 2019-10-31
IL289547A (en) 2022-03-01
US20140243212A1 (en) 2014-08-28
TWI801188B (zh) 2023-05-01

Similar Documents

Publication Publication Date Title
KR102082025B1 (ko) 대량 동시 rna 서열분석에 의한 모체 혈장 전사물 분석
JP7168247B2 (ja) 癌スクリーニング及び胎児分析のための変異検出
US11111538B2 (en) Multiplexed parallel analysis of targeted genomic regions for non-invasive prenatal testing

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant