KR102521642B1 - 질병 상태의 핵산-기반 실시간 결정을 위한 방법 및 장치 - Google Patents

질병 상태의 핵산-기반 실시간 결정을 위한 방법 및 장치 Download PDF

Info

Publication number
KR102521642B1
KR102521642B1 KR1020207001521A KR20207001521A KR102521642B1 KR 102521642 B1 KR102521642 B1 KR 102521642B1 KR 1020207001521 A KR1020207001521 A KR 1020207001521A KR 20207001521 A KR20207001521 A KR 20207001521A KR 102521642 B1 KR102521642 B1 KR 102521642B1
Authority
KR
South Korea
Prior art keywords
subject
sequence reads
map
species
microorganism
Prior art date
Application number
KR1020207001521A
Other languages
English (en)
Other versions
KR20200029472A (ko
Inventor
필립 스티븐스
Original Assignee
노센도 게엠바하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노센도 게엠바하 filed Critical 노센도 게엠바하
Publication of KR20200029472A publication Critical patent/KR20200029472A/ko
Application granted granted Critical
Publication of KR102521642B1 publication Critical patent/KR102521642B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 대상체에서 질병 상태, 예를 들어, 1가지 이상의 미생물에 의해 유발된 감염 또는 암의 실시간 진단을 위한 방법 및 장치에 관한 것이다.

Description

질병 상태의 핵산-기반 실시간 결정을 위한 방법 및 장치
본 발명은 2017년 7월 19일에 출원된 유럽 특허 출원 제17 182 104.4호의 우선권 이익을 주장하며, 이 출원의 내용은 그 전체가 본원에 참고로 포함된다.
본 발명은 감염과 같은 대상체 내의 질병 상태의 결정뿐만 아니라 질병 상태의 원인 물질의 확인을 위한 방법 및 장치에 관한 것으로, 이 방법은 대상체에 맵핑(mapping)되는 핵산들에 대한 대상체에 맵핑되지 않는 대상체 내의 핵산의 양의 시간 경과에 따른 결정에 기초한다.
감염성 질병의 진단 방법은 현재 두 가지 넓은 영역으로 나뉠 수 있다. 한 가지 영역은 (아마도 감염된) 숙주 유기체와 관련된 감염을 진단하는 것에 관한 것이다. 이 영역에서, 진단은 숙주가 감염을 앓고 있는지 여부의 질문에 대한 예 또는 아니오 답변의 형태로 나타나는데, 예는 감염이 존재하는 것이고, 아니오는 감염이 존재하지 않는 것이다. 감염-관련 질병을 진단하는 다른 방법은 감염 유발 미생물을 진단하는 것이다. 이 경우에도, 진단 절차는 예/아니오 답변만을 생성하는데, 예는 환자 X가 미생물 Y로 고통받고 있는 것이고, 아니오는 그 환자가 그렇지 않은 것이다.
질병 원인 미생물을 확인하는 것에 초점을 맞춘 진단법은 오늘날 혈액 배양 또는 PCR 기법에 기반한다. 순수하게 정성적인 결과(예/아니오 답변) 외에도 그러한 진단 접근법은 규정된 미생물 세트를 검출할 수 있을 뿐이다. 혈액 배양의 경우, 이는 (바이러스 또는 진균과 같이) 모든 미생물이 혈액 배양병 내에서 성장할 수 있는 것은 아니라는 사실로 인해서이다. PCR-기반 진단의 경우, 예를 들어, 복잡성의 이유로 인해, 지나치게 큰 표적 세트에 대한 특이성을 제한하는 프라이머 쌍 세트(들)가 규정되어야 한다. 이러한 진단 검사는 모든 부류의 가능한 미생물, 예를 들어, 세균, 진균, 바이러스 및 기생충에 대한 편향되지 않은 고특이성의 고감도 검사를 가능하게 하지 않는다. 또한, PCR-기반 접근법은 혈액 배양보다 신속하지만, 혈액 배양이 여전히 감염성 질병에 대한 제1 선(first line) 진단 검사이다.
또한, 두 접근법 모두는 공생 미생물, 오염, 및 환자에게 고통을 주는 진정한 감염원을 구별할 수 없다. 이는 궁극적으로 많은 위양성(false positive) 결과로 이어진다.
기존 혈액 배양 검사에는 2일 내지 7일이 소요된다. 원인 미생물이 알려지기 전인 이 시간 동안, 가장 최근의 치료 지침에 따라 치료 의사가 판단한 바와 같이, 환자는 넓은 스펙트럼의 항생제를 사용하여 치료된다. 이로 인해, 열악한 진단 절차를 고려할 때, 넓은 스펙트럼의 항생제의 무분별한 과다 사용으로 인해 미생물은 다중 내성이 될 수 있다. 따라서, 적절한 항-감염제를 사용한 환자의 빠르고 효과적인 치료를 제공하기 위해서는, 감염원이 가능한 한 빨리 확인될 필요가 있으며, 감염원과 공생 미생물/진단 절차 중의 오염을 구별할 수 있는 것이 가장 중요하다.
환자로부터 얻은 샘플에 포함된 미생물을 확인하기 위한 그 샘플의 시퀀싱(sequencing)의 예가 문헌에 존재하는데, 예컨대 문헌[Hasman et al., 2014, Journal of Clinical Microbiology 52:139-146]은 소변 샘플에 포함된 미생물을 확인하기 위한 그 소변 샘플에 대한 전체 게놈 시퀀싱을 기술하며, 이 시퀀싱 결과는 종래의 배양 및 확인으로 얻은 결과와 비교되었다. 다른 문헌으로는 패혈증 환자로부터 얻은 샘플의 차세대 시퀀싱을 개시하는 문헌[Grumaz et al., 2016, Genome Medicine 8:73]; 질 스왑(swab) 진단 표본으로부터 유래된 DNA의 울트라-딥(ultra-deep) 시퀀싱을 기술하는 문헌[Andersson et al., 2013, Clin Microbiol Infect 19:E405-E408]; 및 비만(obese) 또는 마른(lean) 장내 마이크로바이옴에서 공통적으로 농축된 유전자를 확인하기 위한 총 분변 DNA의 샷건(shotgun) 시퀀싱을 기술하는 문헌[Turnbaugh et al., 2009, Nature 457:480-484]이 있다. 이들 방법은 샘플 내의 임의의 미생물을 확인하기 위해 비-숙주 핵산을 시퀀싱하고 데이터베이스와 비교한다.
그러나, 더 정확한 결과가 제공되도록 하고/하거나 질병 유발 미생물의 더 신속한 확인을 가능하게 하여 효과적인 치료가 더 일찍 시작될 수 있도록 하는 서열 데이터의 더 효율적인 처리가 당업계에 필요한 실정이다.
본 발명은, 적어도 부분적으로, 대상체가 질병 상태를 가질 가능성이 대상체로부터 얻은 생물학적 샘플에 존재하지만 건강한 대상체에는 일반적으로 존재하지 않는 핵산의 양을 고려하여 결정될 수 있다는 본 발명자들의 발견에 기초한다. 예를 들어, 대상체로부터 얻은 생물학적 샘플 내의 미생물(들)에 맵핑되는 핵산의 양을 결정함으로써, 대상체가 미생물(들)에 의해 유발된 감염과 같은 질병 상태로 고통받을 가능성이 결정될 수 있다. 또한, 이 발견은 대상체가 암에 걸릴 가능성의 결정을 가능하게 하고, 암 치료를 모니터링하는 데 특히 유용하다. 이 가능성은, 일 구현예에서, 특정 미생물에 맵핑되는 핵산 서열을 대상체에서 발견할 확률에 대한 유의성 점수를, 대상체와 동일한 종에 맵핑되는 판독값들의 수 및 샘플 내의 임의의 미생물에 맵핑되는 판독값들의 수를 포함하는, 특정 미생물에 맵핑되는(할당되는) 서열 판독값들의 총수 및 종에 맵핑(할당)될 수 있는 모든 서열 판독값들의 총수에 기초하여 계산함으로써 결정된다. 특정 미생물에 맵핑되는 서열 판독값들의 수와 대상체로부터 얻은 생물학적 샘플에 존재하는 종에 맵핑되는 서열 판독값들의 총수의 비에 본질적으로 기초한 이 유의성 점수는 시간 경과에 따라 계산될 수 있으며, 즉, 실시간으로 계산될 수 있는데, 이는 맵핑되는 판독값들의 총수가 증가하기(더욱 더 많은 서열 판독값들이 얻어지고 종에 맵핑되기) 때문이다.
일 구현예에서, 본 발명은 대상체에서 미생물의 존재를 결정하는 방법에 관한 것으로, 이 방법은, 일 구현예에서, 특정 미생물의 게놈에 맵핑되는 서열 판독값들의 수 및 대상체와 동일한 종을 포함하는 종의 게놈에 맵핑되는 서열 판독값들의 수를 결정하는 단계를 포함한다. 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산의 시퀀싱으로부터 얻어지는 서열 판독값들은 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교될 수 있다. 이어서, 숙주 종 및 임의의 미생물을 포함하는 종에 맵핑되는 서열 판독값들의 수, 및 특정 미생물에 맵핑되는 서열 판독값들의 수가 결정될 수 있다. 일 구현예에서, 방법은 특정 미생물에 대한 유의성 점수를 계산하는 단계를 추가로 포함하며, 이 유의성 점수는 특정 미생물에 맵핑되는 서열 판독값들의 수 및 종에 맵핑되는 판독값들의 총수에 기초한다. 결정 단계는 시간 경과에 따라 수행될 수 있기 때문에, 이 유의성 점수 계산도 서열 판독값들이 얻어지고 맵핑됨에 따라 시간 경과에 따라 수행될 수 있다. 또한, 이 계산은, 서열 판독값들은 이미 얻어졌지만 아직 비교되지 않아 종에 맵핑되지 않은 구현예들에서, 서열 판독값들이 하나 이상의 데이터베이스 내의 유전자 정보와 비교됨에 따라 시간 경과에 따라 수행될 수 있다.
본 발명은 대상체에서 미생물의 존재를 결정하는 방법으로서, (a) 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱하여 복수의 핵산 서열 판독값을 얻는 단계; (b) 단계 (a)에서 얻은 서열 판독값들을, 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 비교된 서열 판독값이 종에 맵핑되는지의 여부를 결정하는 단계; 및 (c) 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계를 포함하는, 방법에 관한 것이다.
또한, 본 발명은 대상체에서 미생물의 존재를 결정하는 방법으로서, (a) 서열 판독값들을, 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 비교된 서열 판독값이 종에 맵핑되는지의 여부를 결정하는 단계로서, 서열 판독값들은 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱함으로써 얻어지는, 단계; 및 (b) 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계를 포함하는, 방법에 관한 것이다.
또한, 본 발명은 대상체에서 미생물의 존재를 결정하는 방법으로서, 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계로서, 비교된 서열 판독값들은, 생성된 서열 판독값들을 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여 비교된 서열 판독값이 종에 맵핑되는지의 여부를 결정함으로써 얻어지고, 서열 판독값들은 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱함으로써 생성되는, 단계를 포함하는, 방법에 관한 것이다.
본 발명의 일 구현예에서, 방법은, 대상체에서 특정 미생물에 맵핑되는 비교된 서열 판독값을 발견할 확률에 대한 유의성 점수를, 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수에 기초하여 계산하는 단계를 추가로 포함한다.
또한, 본 발명은 대상체에서 미생물의 존재를 결정하는 방법으로서, 대상체에서 특정 미생물에 맵핑되는 서열 판독값을 발견할 확률에 대한 유의성 점수를, 특정 미생물에 맵핑되는 서열 판독값들의 수 및 종에 맵핑되는 서열 판독값들의 수에 기초하여 시간 경과에 따라 계산하는 단계를 포함하고, 특정 미생물에 맵핑되는 서열 판독값들 및 종에 맵핑되는 서열 판독값들은, 서열 판독값들을 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여 비교된 서열 판독값이 하나 이상의 데이터베이스 내에 포함된 종에 맵핑되는지 여부를 결정함으로써 얻어지고, 서열 판독값들은 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱함으로써 생성되는, 방법에 관한 것이다.
또한, 본 발명은 대상체에서 미생물의 존재를 결정하는 방법으로서, (a) 특정 미생물에 맵핑되는 서열 판독값들의 수 및 종에 맵핑되는 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계로서, 서열 판독 값들은, 서열 판독 값들을 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여 서열 판독값이 하나 이상의 데이터베이스 내에 포함된 종에 맵핑되는지 여부를 결정함으로써 얻어지고, 서열 판독값들은 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱함으로써 생성되는, 단계; 및 (b) 대상체에서 특정 미생물에 맵핑되는 서열 판독값을 발견할 확률에 대한 유의성 점수를, 특정 미생물에 맵핑되는 서열 판독값들의 수 및 종에 맵핑되는 서열 판독값들의 수에 기초하여 계산하는 단계를 포함하는, 방법에 관한 것이다.
본 발명의 다수의 구현예에서, 핵산의 시퀀싱 직후에, 즉, 본질적으로 그와 동시에, 서열 판독값들을 비교하여 판독값들을 종에 맵핑시키게 하고 유의성 점수를 계산하게 하거나, 시퀀싱의 결과가 저장되고, 이어서 저장된 시퀀싱 결과가 시퀀싱된 판독값들을 하나 이상의 데이터베이스와 비교하는 데 사용될 수 있고, 예를 들어, 유의성 점수의 계산을 가능하게 하도록, 시퀀싱이 비교/결정/계산 단계 이전에 언제라도 일어날 수 있는, 방법이 수행될 수 있다.
일 구현예에서, 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계는, 특정 미생물에 맵핑될 수 있는 비교된 판독값들의 수가 계수되고, 종에 맵핑될 수 있는 비교된 판독값들, 즉, 특정 미생물에 맵핑되는 판독값들뿐만 아니라 대상체에 맵핑될뿐만 아니라 샘플에 존재하는 임의의 다른 미생물에도 맵핑되는 판독값들의 수가 계수됨을 의미한다. 아마도 분해로 인해 길이가 너무 짧아서 종에 맵핑될 수 없거나 하나 이상의 데이터베이스에 존재하지 않는 미생물로부터 유래된 서열 판독값들은 본 발명에서 사용되지 않는다. 바람직하게는, 모든 서열 판독값들이 본 발명에서 사용되는 것은 아니며, 종에 맵핑될 수 있는 것들만이 사용된다.
일 구현예에서, 특정 미생물에 대한 유의성 점수가 임계 값을 충족하거나 초과할 때, 특정 미생물이 대상체에 존재하는 것으로 결정되거나 특정 미생물에 대한 유의성 점수가 임계 값을 충족하거나 초과할 때, 특정 미생물은 대상체에서 질병을 유발하는 것과 관련된 것으로 결정된다. 다른 구현예들에서, 유의성 점수가 임계 값을 초과할수록, 미생물의 부하가 대상체에서 더 높고, 이는 더 중증인 감염 상태를 반영할 수 있다. 일 구현예에서, 임계 값은, 대상체에서 질병을 유발하는 것에 대한 특정 미생물의 관련성에 관하여 위양성 및 위음성의 수를 최소화하기 위해 설정된다.
또 다른 구현예에서, 특정 미생물에 대한 유의성 점수가 종에 맵핑되는 소수의 서열 판독값으로 임계 값을 초과할 때, 미생물의 존재로 인한 질병은 중증인 것으로 간주될 수 있다. 이 구현예와 관련하여, "소수"는 샘플 내의 핵산을 시퀀싱함으로써 생성된 시퀀싱된 판독값들 중 전부가 아닌 판독값들, 즉, 일부가 비교되고 맵핑되었지만 임계 값이 이미 충족되었거나 초과했다는 사실을 지칭한다. 비교되고 맵핑된 판독값들의 일부는 비교되고 맵핑된 모든 판독값들의 1%, 2%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%일 수 있다. 바람직하게는, "소수"는 비교되고 맵핑된 모든 판독값들의 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5%, 2%, 1% 미만을 지칭한다. "소수"는 또한 고정된 수의 판독값, 예컨대 100개, 1,000개, 10,000개, 또는 100,000개 미만의 판독값일 수 있다.
일 구현예에서, 본 발명의 방법은, 제공된 정보, 예컨대 대상체/특정 미생물에 맵핑되는 판독값들의 수 또는 이하 기재된 것을 포함하는 또 다른 파라미터가 대상체가 질병 상태를 갖거나 갖지 않거나 하나 이상의 미생물로 감염되었거나 감염되지 않았다는 것뿐만 아니라 하나 이상의 미생물 또는 암 유형의 아이덴티티(identity)의 확실성 수준에서의 결정을 가능하게 하는 지점까지 시간 경과에 따라 수행될 수 있다. 이 지점에 도달하면, 대상체에서 미생물의 존재 또는 질병 상태를 결정하기 위해 추가의 정보가 반드시 제공될 필요가 없기 때문에 방법이 중단될 수 있다.
시간 경과에 따른 특정 미생물에 맵핑되는 판독값들의 수 및 종에 맵핑되는 판독값들의 수는, 예를 들어, 특정 미생물이 대상체에서의 질병 상태와 관련이 있는지 여부를 결정하는 데 유용할뿐만 아니라 둘 이상의 환자 사이의 (원인이 동일한) 질병 상태의 비교를 가능하게 하는, 시간 경과에 따른 파라미터를 생성하는 데 사용될 수 있다. 다시 말하자면, 두 환자 사이의 종에 맵핑되는 판독값들의 수는 동일하지만 특정 미생물에 맵핑되는 판독값들의 수가 다른(더 많거나 적은) 경우, 이 차이는 두 환자 사이의 특정 미생물의 부하/양의 차이를 나타낼 수 있다. 예를 들어, 한 대상체가 종에 맵핑되는 106개의 판독값들 중 특정 미생물에 대한 1개의 판독값을 갖고 두 번째 대상체가 종에 맵핑되는 5 x 105개의 판독값들 중 동일한 특정 미생물에 대해 1 개의 판독값을 갖는 경우, 미생물은 두 번째 대상체에만 존재하는 것은 아니지만 두 번째 대상체가 더 높은 부하/수준의 감염을 갖는 것으로 결론내려질 수 있다.
더욱이, 이 파라미터는, 모든 서열 판독값들이 비교되고 모든 비교된 판독값들이 맵핑된 종점에서뿐만 아니라, 방법 동안 (시간 경과에 따라) 언제라도 실시간으로 생성될 수 있다. 따라서, 총 판독값들의 소량만이 비교되고 맵핑된 시점에서, 한 대상체가, 대조 샘플에서 관찰되는 것과 동일한 수의 종에 맵핑되는 판독값들에 비해 5배의 특정 미생물에 맵핑되는 판독값들의 수를 갖는 것으로 관찰된 경우, 방법은 모든 시퀀싱된 판독값들을 비교하고 맵핑하기 전의 그 이른 시점에서 중단될 수 있는데, 이는 5배 더 많은 판독값을 갖는 환자가 특정 미생물로 인해 질병 상태(감염)를 가질 가능성이 있음이 명백하기 때문이다.
분석의 종료 전에, 즉, 샘플 내의 모든 핵산이 시퀀싱되어 모든 판독값이 비교되고 맵핑되기 전에 방법이 중단될 수 있도록 시퀀싱, 비교 및 맵핑 단계 동안 시간 경과에 따라 이 파라미터를 생성하는 능력은 그렇게 중단될 수 없는 방법론에 비해 유리하게는 시간 및 자원의 절약을 가능하게 한다. 예를 들어, 샘플 내의 모든 핵산의 시퀀싱, 비교 및 맵핑 단계에는 일반적으로 최대 30시간 이상이 소요될 수 있다. 그러나, 본 발명은 이 시간을 상당히 줄일 수 있으며, 예를 들어, 일부 경우에 10시간 이상을 감소시켜서 10시간의 시퀀싱 및/또는 컴퓨터 시간이 절약될 수 있게 한다. 더욱이, 대상체가 더 신속하게 진단될 수 있기 때문에, 적절한 치료가 더 신속하게 시작되어 대상체의 더 높은 생존 가능성을 가져올 수 있다. 이는 또한 감염 또는 질병 상태를 치료하는 것에 적절하게 표적화되지 않은 약제를 낭비하지 않게 할 수 있으며, 예를 들어, 바이러스 감염에 항생제를 제공하지 않게 하거나 미생물이 내성을 갖는 항생제를 제공하지 않게 한다.
또한, 본 발명은 대상체에서 질병 상태의 존재를 결정하는 방법으로서, (a) 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱하여 복수의 핵산 서열 판독값을 얻는 단계; (b) 단계 (a)에서 얻은 서열 판독값들을, 동일한 종의 대조 대상체로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 비교된 서열 판독값이 대조 대상체에 맵핑되는지 여부를 결정하는 단계; 및 (c) 대조 대상체에 맵핑되는 및 맵핑되지 않는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계를 포함하는, 방법에 관한 것이다. 또한, 본 발명은 대상체에서 질병 상태의 존재를 결정하는 방법으로서, (a) 서열 판독값들을, 동일한 종의 대조 대상체로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 비교된 서열 판독값이 대조 대상체에 맵핑되는지 여부를 결정하는 단계로서, 서열 판독값들은 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱함으로써 얻어지는, 단계; 및 (b) 대조 대상체에 맵핑되는 및 맵핑되지 않는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계를 포함하는, 방법에 관한 것이다. 또한, 본 발명은 대상체에서 질병 상태의 존재를 결정하는 방법으로서, 대조 대상체에 맵핑되는 및 맵핑되지 않는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계로서, 비교된 서열 판독값들은, 생성된 서열 판독값들을 동일한 종의 대조 대상체로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여 비교된 서열 판독값이 대조 대상체에 맵핑되는지 여부를 결정함으로써 얻어지고, 서열 판독값들은 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱함으로써 생성되는, 단계를 포함하는, 방법에 관한 것이다.
일 구현예에서, 방법은, 대상체에서 대조 대상체에 맵핑되지 않는 비교된 서열 판독값을 발견할 확률에 대한 유의성 점수를, 대조 대상체에 맵핑되지 않는 비교된 서열 판독값들의 수 및 대조 대상체에 맵핑될 수 있는, 예를 들어, 맵핑되는 비교된 서열 판독값들의 수에 기초하여 계산하는 단계를 추가로 포함한다.
또한, 본 발명은 대상체에서 질병 상태의 존재를 결정하는 방법으로서, 대상체에서 대조 대상체에 맵핑되지 않는 서열 판독값을 발견할 확률에 대한 유의성 점수를, 대조 대상체에 맵핑되지 않는 서열 판독값들의 수 및 대조 대상체에 맵핑되는 서열 판독값들의 수에 기초하여 시간 경과에 따라 계산하는 단계를 포함하고, 대조 대상체에 맵핑되는 서열 판독값들 및 대조 대상체에 맵핑되지 않는 서열 판독값들은, 서열 판독값들을 동일한 종의 대조 대상체로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여 비교된 서열 판독값이 대조 대상체에 맵핑되는지 여부를 결정함으로써 얻어지고, 서열 판독값들은 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱함으로써 생성되는, 방법에 관한 것이다.
일 구현예에서, 유의성 점수가 임계 값을 충족하거나 초과할 때, 질병 상태가 대상체에 존재하는 것으로 결정된다. 본원에 사용되는 바와 같이, 용어 "대조 대상체에 맵핑되지 않는 비교된 서열 판독값"은 서열이 대조 대상체의 서열과 매우 유사하지 않거나 그와 실질적으로 동일하지 않음을 항상 의미하는 것은 아니며, 종종 그러할 수 있다. 예를 들어, 질병 상태가 대상체의 핵산 서열에서의 점 돌연변이에 의해 유발된 것인 일 구현예에서, 그러한 점 돌연변이를 갖는 서열 판독값은, 판독값의 모든 다른 뉴클레오티드가 대조 대상체와 동일하더라도, 대조 대상체에 맵핑되지 않는 것으로 간주된다. 더욱이, 일 구현예에서, 서열 판독값들을 비교할 때, 알려진 게놈 다형성, 예를 들어, 단일 뉴클레오티드 다형성이 참조될 수 있어서, 이들 차이가 대상체의 시퀀싱된 판독값들에서 돌연변이로 간주되지 않게 한다.
본 발명의 일 구현예에서, 질병 상태는 암, 바람직하게는 유전자 이상, 예를 들어, 점 돌연변이, 결실, 삽입 또는 인델(indel)에 의해 유발된 암이다. 또 다른 구현예에서, 질병 상태는 미생물에 의해 유발된 감염이며, 바람직하게는 미생물은 바이러스, 세균, 진균 또는 기생충이다.
질병 상태가 암인 구현예에서, 또한 본 발명의 방법은 암 치료를 모니터링하는 데에뿐만 아니라 치료 라운드 후 암의 재발을 모니터링하는 데에도 이용될 수 있다. 예를 들어, 암으로 진단된 대상체는 종양의 외과적 제거와 같은 치료를 받는다. 종양의 유전자 정보의 데이터베이스가 만들어질 수 있고, 대상체로부터 얻은 핵산이 시퀀싱될 수 있고 판독값들은 동일한 종으로부터의 대조 대상체의 유전자 정보 및 종양의 유전자 정보를 함유하는 하나 이상의 데이터베이스와 비교될 수 있다. 이어서, 비교된 판독값이 대조 대상체 또는 종양 데이터베이스에 맵핑되어, 본 발명에 따른 유의성 점수가 암 게놈에 맵핑되는 판독값들의 수 및 암 게놈과 대조 게놈에 맵핑되는 판독값들의 수에 기초하여 계산되게 함으로써, 암의 존재, 즉, 암의 재발의 결정을 가능하게 한다. 유사하게, 샘플은 치료 동안 얻어질 수 있고, 점수는 치료가 효과가 있는지를 결정하기 위해 계산될 수 있다.
질병 상태가 미생물에 의한 감염인 구현예에서, 본 발명의 방법은 감염의 치료를 모니터링하고/모니터링하거나 감염의 재발을 모니터링하는 데 또한 이용될 수 있다. 그러한 구현예들에서, 생물학적 샘플은 치료 동안 및/또는 치료 후에 대상체로부터 얻어지고, 미생물에 맵핑되는 판독값들의 수 및 종에 맵핑되는 판독값들의 수에 기초하여 유의성 점수가 계산되도록 상기 기재된 바와 같은 방법이 이어진다.
특정 구현예들에서, 생물학적 샘플은 전혈, 혈청, 혈장, 양수, 활액, 액(liquor), 조직 또는 세포 도말 표본(smear), 조직 또는 세포 스왑, 소변, 조직, 가래, 대변, 위장 분비물, 림프액, 및 세척물(lavage)로 이루어진 군으로부터 선택될 수 있다.
특정 구현예들에서, 대상체는 척추 동물, 바람직하게는 포유 동물, 예를 들어, 인간, 개, 고양이, 돼지, 말, 소, 양, 염소, 마우스, 또는 래트이고, 바람직하게는 대상체는 인간이다.
일 구현예에서, 시퀀싱은 울트라-딥 또는 고-처리량 시퀀싱 방법을 이용하여 수행된다. 본 발명의 바람직한 구현예들에서, 시퀀싱은 분자 고-처리량 서열 분석, 즉, 일루미나/솔렉사(Illumina/Solexa) 또는 옥스포드 나노포어(Oxford Nanopore) 방법론에 의해서와 같은 차세대 또는 3세대 시퀀싱에 의해 수행된다.
본 발명의 일 구현예에서, 특정 미생물 또는 질병 상태가 대상체에 존재하는 것으로 결정될 때, 방법은 특정 미생물 또는 질병 상태에 의해 유발된 질병을 치료하는 것으로 알려진 약학적 활성 화합물을 대상체에게 투여하는 단계를 추가로 포함한다. 더욱이, 감염성 질병을 유발하는 미생물이 확인되면, 그 미생물이 임의의 유형의 항생제/항-감염제에 내성을 갖는지 여부가 결정되어 치료가 효과적이 되게 할 수 있을 것이다. 일 구현예에서, 미생물이 임의의 유형의 항생제/항-감염제에 내성을 갖는지 여부를 결정하기 전에 샘플 내의 대상체의 핵산이 고갈될 수 있다.
하나의 특정 구현예에서, 대상체에서 미생물(들)에 의해 유발된 감염성 질병을 진단하는 방법은, 대상체에서 특정 미생물에 맵핑되는 서열 판독값을 발견할 확률에 대한 유의성 점수를, 특정 미생물에 맵핑되는 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수에 기초하여 시간 경과에 따라 계산하는 단계로서, 특정 미생물에 대한 점수가 임계 값을 충족하거나 초과할 때, 특정 미생물은 감염성 질병을 유발하는 것으로 결정되고, 특정 미생물에 맵핑되는 서열 판독값들 및 종에 맵핑되는 서열 판독값들은, 서열 판독값들을 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여 비교된 서열 판독값이 하나 이상의 데이터베이스 내에 포함된 종에 맵핑되는지 여부를 결정함으로써 얻어지고, 서열 판독값들은 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱함으로써 생성되는, 단계를 포함한다.
하나의 특정 구현예에서, 대상체에서 미생물(들)에 의해 유발된 감염성 질병을 진단하는 방법은, (a) 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱하여 복수의 핵산 서열 판독값을 얻는 단계; (b) 단계 (a)에서 얻은 서열 판독값들을, 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 비교된 서열 판독값이 하나 이상의 데이터베이스 내에 포함된 종에 맵핑되는지 여부를 결정하는 단계; (c) 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계; 및 (d) 대상체에서 특정 미생물에 맵핑되는 비교된 서열 판독값을 발견할 확률에 대한 유의성 점수를, 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수에 기초하여 계산하는 단계를 포함하고, 특정 미생물에 대한 점수가 임계 값을 충족하거나 초과할 때, 특정 미생물은 감염성 질병을 유발하는 것으로 결정된다.
본 발명은 대상체에서 미생물에 의해 유발된 질병 또는 감염을 치료하는 방법으로서, (a) 대상체에서 미생물의 존재를 결정하기 위한 전술한 방법들 중 임의의 것에 따라 대상체에서 특정 미생물에 대한 유의성 점수를 결정하는 단계, 및 (b) 특정 미생물에 대한 유의성이 임계 값을 충족하거나 초과할 때, 특정 미생물의 성장을 억제하는 화합물을 대상체에게 투여하는 단계를 포함하는, 방법에 관한 것이다. 또한, 본 발명은 대상체에서 미생물에 의해 유발된 질병 또는 감염을 치료하는 방법으로서, 유의성 점수가 임계 값을 충족하거나 초과하는 미생물의 성장을 억제하는 화합물을 대상체에게 투여하는 단계로서, 유의성 점수는 본원에 기술된 대상체에서 미생물의 존재를 결정하기 위한 전술한 방법들 중 임의의 것에 따라 계산되는, 단계를 포함하는, 방법에 관한 것이다.
또한, 본 발명은, 프로세서에 의해 실행될 때 본 발명의 방법을 수행하는 명령을 포함하는 프로그램 코드가 저장된 컴퓨터-판독 가능 저장 매체뿐만 아니라, 본 발명의 방법을 수행하도록 구성된, 현장-프로그램 가능 게이트 어레이(field-programmable gate array)와 같은 프로세서를 포함하는 컴퓨터 시스템을 포함한다.
도 1은 7가지 상이한 미생물에 관한 환자 S9에 대한 완전한 검사 실행을 도시한다(유의한 것으로 표지된 미생물에 대해서는 검사가 중단되지 않았음). 통계적 관련성 임계값을 나타내는 수평 파선이 또한 그어진다.
도 2는 4가지 상이한 미생물에 관한 환자 S11에 대한 완전한 검사 실행을 도시한다(유의한 것으로 표지된 미생물에 대해서는 검사가 중단되지 않았음). 통계적 관련성 임계값을 나타내는 수평 파선이 또한 그어진다.
도 3은 5가지 상이한 미생물에 관한 환자 S60에 대한 완전한 검사 실행을 도시한다(유의한 것으로 표지된 미생물에 대해서는 검사가 중단되지 않았음). 통계적 관련성 임계값을 나타내는 수평 파선이 또한 그어진다.
본 발명은 이하에서 상세하게 설명되지만, 본 발명은 본원에 기술된 특정 방법론, 프로토콜 및 시약으로 제한되지 않음을 이해해야 하는데, 이는 이들이 달라질 수 있기 때문이다. 또한, 본원에 사용된 용어는 특정 구현예들을 설명하기 위한 것일 뿐이며, 첨부된 청구범위에 의해서만 제한되는 본 발명의 범위를 제한하려는 것이 아님을 이해해야 한다. 달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 학술 용어는 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다.
이하에서, 본 발명의 요소들이 설명될 것이다. 이 요소들은 특정 구현예들과 함께 나열되지만, 그러한 요소들은 추가의 구현예들을 생성하기 위해 임의의 방식으로 그리고 임의의 수로 조합될 수 있음을 이해해야 한다. 다양하게 설명된 실시예들 및 바람직한 구현예들은 본 발명을 명시적으로 설명된 구현예들로만 제한하도록 해석되어서는 안된다. 본 설명은 명시적으로 설명된 구현예들을 임의의 수의 개시된 및/또는 바람직한 요소들과 조합시킨 구현예들을 뒷받침하고 포함하는 것임을 이해해야 한다. 또한, 본 출원에서의 설명된 모든 요소들의 임의의 순열들 및 조합들은 문맥이 달리 나타내지 않는 한 본 출원의 설명에 의해 개시된 것으로 간주되어야 한다.
바람직하게는, 본원에 사용된 용어들은 문헌["A multilingual glossary of biotechnological terms: (IUPAC Recommendations)", H.G.W. Leuenberger, B. Nagel, and H. Koelbl, Eds., (1995) Helvetica Chimica Acta, CH-4010 Basel, Switzerland]에 기재된 바와 같이 정의된다.
달리 지시되지 않는 한, 본 발명의 실시는 해당 분야의 문헌(예를 들어, 문헌[Molecular Cloning: A Laboratory Manual, 2nd Edition, J. Sambrook et al. eds., Cold Spring Harbor Laboratory Press, Cold Spring Harbor 1989] 참조)에 설명된 생화학, 세포 생물학, 면역학, 및 재조합 DNA 기법의 종래의 방법을 이용한다.
문맥이 달리 요구하지 않는 한, 본 명세서 및 하기 청구범위 전반에 걸쳐, 단어 "포함한다", 및 "포함하고" 및 "포함하는"과 같은 변화형은, 언급된 멤버, 정수 또는 단계 또는 멤버들, 정수들 또는 단계들의 군을 포함함을 의미하지만 임의의 다른 멤버, 정수 또는 단계 또는 멤버들, 정수들 또는 단계들의 군을 배제함을 의미하는 것은 아닌 것으로 이해될 것이지만, 일부 구현예들에서 그러한 다른 멤버, 정수 또는 단계 또는 멤버들, 정수들 또는 단계들의 군은 배제될 수 있으며, 즉, 대상은 언급된 멤버, 정수 또는 단계 또는 멤버들, 정수들 또는 단계들의 군을 포함함에 존재한다. 본 발명을 설명하는 맥락에서(특히 청구범위의 맥락에서) 사용된 단수 용어 및 유사한 언급 대상은 본원에 달리 지시되거나 문맥상 명백히 모순되지 않는 한 단수 및 복수를 모두 포함하는 것으로 해석되어야 한다. 본원에서의 값의 범위의 열거는 범위 내에 속하는 각각의 개별 값을 개별적으로 지칭하는 간편한 방법으로서 기능하도록 의도될 뿐이다. 본원에서 달리 지시되지 않는 한, 각각의 개별 값은 그것이 본원에서 개별적으로 열거된 것처럼 명세서에 통합된다.
본원에 기술된 모든 방법은 본원에 달리 지시되거나 문맥상 달리 명백히 모순되지 않는 한 임의의 적합한 순서로 수행될 수 있다. 본원에 제공된 임의의 및 모든 예, 또는 예시적인 표현(예를 들어, "~와 같은")의 사용은 본 발명을 더 잘 예시하기 위해 의도될 뿐이며, 달리 청구된 본 발명의 범위를 제한하지 않는다. 본 명세서의 어떠한 표현도 본 발명의 실시에 필수적인 임의의 청구되지 않은 요소를 나타내는 것으로 해석되어서는 안된다.
본 명세서의 텍스트 전체에 걸쳐 몇몇 문헌이 인용되어 있다. (모든 특허, 특허 출원, 학술 간행물, 제조업체의 사양, 지침 등을 포함하는) 본원에 인용된 문헌들 각각은, 상기에 인용되어 있든지 하기에 인용되어 있든지 간에, 그 전체가 본원에 참고로 포함된다. 본원에 인용된 어떠한 문헌도 본 발명이 선행 발명에 의해 그러한 개시보다 앞설 자격이 없음을 인정하는 것으로 해석되어서는 안된다.
전술한 바와 같이, 본 발명은, 예를 들어, 종/정상 게놈에 맵핑될 수 있는 판독값들의 총수에 대한, 예를 들어, 특정 미생물 또는 암 게놈에 맵핑되는 서열 판독값들의 수에 기초한다. 따라서, 본 발명은 공생체/오염과 가장 가능성이 높은 감염 원인 물질을 진단하고 그들을 구별하기 위한 토대를 제공한다. 유리하게는, 본 발명은 적어도 다음을 제공한다:
a) 얻어진 생물학적 시료에 관해 어떠한 가정도 하지 않는 편향되지 않은 방법,
b) 공생체/오염과 감염원을 구별할 수 있는 방법,
c) 주어진 시간에 샘플에서 확인된 모든 미생물에 대해 실시간으로 결과를 제공하는 방법,
d) 시퀀싱 동안 실시간으로 데이터를 생성하는 방법,
e) 데이터를 처리하면서 실시간으로 정보를 제공하는 방법,
f) 미생물이 질병 상태에 유의하거나/그와 관련이 있다고 결정되면 전체 데이터세트의 적은 부분만을 분석한 후 중단될 수 있는 방법,
g) 동일한 질병 상태의 둘 이상의 생물학적 샘플을 비교할 수 있게 하는 파라미터를 생성하는 방법, 및
h) 임상의들과 연구자들이 동일한 미생물로 감염된 환자들 사이에서 미생물로 인한 감염의 중증도를 비교할 수 있게 하는 방법.
본 발명의 또 다른 이점은 다수의 미생물에 의해 유발된 감염을 검출하는 능력, 및 모든 미생물이 감염/병의 상태에 유의하게 기여할 수 있지만, 어떤 미생물이 주요 원인 물질이고 어떤 미생물들이 부수적인 물질들인지를 결정하는 능력이다.
용어 "대상체", "개체", "유기체" 또는 "환자"는 상호 교환적으로 사용되며, 척추 동물, 바람직하게는 포유 동물과 관련된다. 예를 들어, 포유 동물은 본 발명의 맥락에서 인간, 비인간 영장류, 개, 고양이, 양, 소, 염소, 돼지, 말 등과 같은 가축, 마우스, 래트, 토끼, 어류, 기니 피그 등과 같은 실험실 동물뿐만 아니라 동물원의 동물과 같은 감금 상태의 동물이다. 용어 "동물"은 또한 인간을 포함한다. 바람직하게는, 용어 "대상체", "개체", "유기체" 또는 "환자"는 수컷 및 암컷 포유 동물, 특히 남성 및 여성 인간을 지칭한다. 대상체는 신생아(예를 들어, 출생시 내지 약 6개월), 유아(예를 들어, 약 6개월 내지 약 2세), 어린이(예를 들어, 약 2세 내지 약 10세), 청소년(예를 들어, 약 10세 내지 약 21세), 및 성인(예를 들어, 약 21세 이상)을 포함하는 임의의 연령일 수 있다.
특정 구현예들에서, 대상체는, 예를 들어, 면역억제 약물의 복용으로 인해 면역 손상되어 있을 수 있거나, 자연 면역계/기능의 억제 또는 파괴를 필요로 하는 이식을 받는 중의 대상체이다. 다른 대상체들은 만성 또는 전신 감염이 있는 대상체일 수 있다. 특정 구현예들에서, 대상체는 패혈증, 심내막염, 인공 관절을 포함한 관절의 감염, 또는 연조직 감염으로 의심되거나 그로부터 고통을 받고 있을 수 있다. 일 구현예에서, 대상체는 패혈증에 걸렸거나 걸린 것으로 의심되는 신생아이다. 또 다른 구현예에서, 의심되는 감염은 자궁에 존재하며, 예를 들어, 임신 중의, 양수내 감염(융모양막염)이다.
본 발명의 맥락에서, "대조 표준" 또는 "대조군"은 건강하거나 건강한 것으로 간주되는, 즉, 질병을 앓고 있지 않거나 적어도 검사되는 대상체와 동일한 질병을 앓고 있지 않은, 대상체로부터의 생물학적 샘플 또는 대상체들의 군으로부터의 샘플들을 각각 지칭한다. 바람직하게는, 대조 표준 또는 대조군은, 유사한 연령, 동일한 성 또는 성별, 동일한 사회 계층 또는 동일한 민족, 또는 국가, 주, 또는 도시의 실질적으로 동일한 지역에서의 거주와 같이 다양한 방식으로 대상체와 매칭되는 건강한 개체로부터의 샘플(들)을 포함한다.
본 발명의 맥락에서, 용어 "건강한"은 특정 질병의 임의의 징후를 나타내지 않으며, 바람직하게는 현재 질병을 발병하지 않고 있는 대상체를 지칭하고자 한다. 예를 들어, 건강한 대상체는 감염 또는 질병의 징후를 보이지 않지만 그럼에도 불구하고 다양한 공생 미생물 종의 숙주이다. 바람직하게는, 대상체는 감염되었지만 감염이 명백하지 않은 감염 단계에 있는 대상체는 아니다.
본원에 사용된 바와 같이, "생물학적 샘플"은 대상체, 예를 들어, 대상체의 신체로부터 얻은 임의의 생물학적 샘플을 포함한다. 그러한 생물학적 샘플의 예로는 전혈, 혈액 분획, 예컨대 혈장, 혈청, 조직의 도말 표본 또는 스왑, 가래, 기관지 흡인물, 소변, 정액, 대변, 담즙, 위장 분비물, 생식계 분비물, 양수, 활액, 림프액, 액, 골수, 기관 흡인물 및 펀치(punch) 생검물을 포함한 조직 생검물이 있다. 선택적으로, 생물학적 샘플은 환자의 점막으로부터 얻을 수 있다. 용어 "생물학적 샘플"은 분획 또는 분리물과 같은 가공된 생물학적 샘플, 예를 들어, 핵산 또는 분리된 세포를 또한 포함할 수 있다. 바람직하게는, 생물학적 샘플은 핵산, 예를 들어, 게놈 DNA 또는 mRNA를 함유하여, 핵산의 서열이 결정될 수 있게 한다. 일 구현예에서, 생물학적 샘플은 질병 상태의 징후를 보이는, 예를 들어, 감염의 징후를 보이는 조직으로부터 얻은 것일 수 있다. 바람직한 구현예에서, 생물학적 샘플은 대상체로부터 얻은 혈액 또는 혈장이다. 샘플은 본 발명의 방법에 따라 분석되고, 방법 중에 또는 그 후에 일반적으로 신체로 복귀되지 않는다. 대부분의 구현예들에서, 본 발명의 방법을 수행하기 위해 대상체의 신체의 존재는 필요하지 않다.
일 구현예에서, 생물학적 샘플은 혈장, 바람직하게는 대상체로부터 직접 얻은 혈장이다. 혈장은 바람직하게는 무세포성이고, 바람직하게는 주로/대부분 무세포성이며, 예를 들어, 세포는 mL당 10,000개, 1,000개, 100개, 또는 10개 미만이다. 생물학적 샘플, 예를 들어, 혈장은 대상체의 핵산 및 대상체의 것이 아닌 핵산, 예를 들어, 미생물의 핵산을 포함하는 유리 순환 핵산을 함유할 수 있다. 일 구현예에서 생물학적 샘플은 희석되거나 농축될 수 있다. 또 다른 구현예에서, 샘플은 시퀀싱 전에 처리되고, 바람직하게는 샘플은 시퀀싱 전에 지질 및 단백질과 같은 세포 성분을 제거하도록 정제된다. 일 구현예에서, 생물학적 샘플은 무세포 핵산만이 시퀀싱되도록 시퀀싱 전에 처리된다.
생물학적 샘플을 얻을 수 있는 환자의 조직은 목, 입, 코, 위, 장, 피부, 관절, 간, 췌장, 폐, 신경 자궁 경부, 질, 자궁, 요도, 직장, 음경, 및 근육을 포함하지만 이로 제한되지는 않는다. 환자 및/또는 적절한 조직으로부터 생물학적 샘플을 얻기 위한 임의의 적합한 방법이 본 발명과 관련하여 이용될 수 있다.
용어 "생체 내(in vivo)"는 대상체 내의 상황과 관련된다.
용어 "게놈"은 유기체 또는 세포의 염색체 내의 유전자 정보의 총량과 관련된다.
용어 "엑솜"은 발현된 유전자들의 코딩 부분들인 엑손들에 의해 형성된 유기체의 게놈의 일부를 지칭한다. 엑솜은 단백질 및 다른 기능성 유전자 산물의 합성에 사용되는 유전자 블루프린트(genetic blueprint)를 제공한다. 엑솜은 게놈의 가장 기능적으로 관련된 부분이며, 그에 따라 유기체의 표현형에 기여할 가능성이 가장 높다. 인간 게놈의 엑솜은 총 게놈의 1.5%를 구성하는 것으로 추정된다(문헌[Ng et al., 2008, PLoS Gen 4(8):1-15]).
용어 "트랜스크립톰(transcriptome)"은 하나의 세포 또는 세포 집단에서 생성된 mRNA, rRNA, tRNA, 및 다른 비-코딩 RNA를 포함한 모든 RNA 분자의 세트와 관련된다. 본 발명의 맥락에서, 트랜스크립톰은 특정 시점에서 주어진 개체의 하나의 세포, 세포 집단, 또는 모든 세포에서 생성된 모든 RNA 분자 세트를 의미한다.
용어 "유전 물질"은 DNA 또는 RNA인 분리된 핵산, 이중 나선의 절편, 염색체의 절편, 또는 유기체 또는 세포의 전체 게놈, 특히 그의 엑솜 또는 트랜스크립톰을 포함한다.
본 발명에 따르면, "핵산"은 바람직하게는 데옥시리보핵산(DNA) 또는 리보핵산(RNA)이다. 핵산은 게놈 DNA, cDNA, mRNA, 재조합적으로 생성된 분자 및 화학적으로 합성된 분자를 포함한다. 핵산은 단일-가닥 또는 이중-가닥이고 선형 또는 공유적으로 원형으로 폐쇄된(covalently circularly closed) 분자뿐만 아니라 이들의 혼합물로 존재할 수 있다. 핵산은 분리될 수 있다. 바람직하게는, 핵산은 유리 순환 DNA 및/또는 RNA 분자이다. 일 구현예에서, 용어 "핵산"은 또한 "핵산 서열"을 의미하는 것으로 이해된다. 또한, 시퀀싱 전에, 핵산이 처리될 수 있으며, 예를 들어, 농축 또는 증폭된다. 샘플로부터 얻은 핵산이 RNA인 경우, RNA는 시퀀싱을 위해 DNA로 역전사되거나 RNA 자체가 시퀀싱될 수 있다.
용어 "돌연변이"는 기준과 비교되는 핵산 서열의 변화 또는 차이(뉴클레오티드 치환, 첨가 또는 결실)를 지칭한다. "체세포 돌연변이"는 생식 세포(정자 및 난자)를 제외한 신체의 임의의 세포에서 발생할 수 있고, 그에 따라 어린이에게로 전달되지 않는다. 이러한 변경은 (항상 그러한 것은 아니지만) 암 또는 다른 질병을 유발할 수 있다. 바람직하게는 돌연변이는 비동의(non-synonymous) 돌연변이이다. 용어 "비동의 돌연변이"는, 번역 산물에서 아미노산 치환과 같은 아미노산 변화를 초래하는 돌연변이, 바람직하게는 뉴클레오티드 치환을 지칭한다.
본 발명에 따르면, 용어 "돌연변이"는 점 돌연변이, 인델, 융합, 크로모트립시스(chromothripsis) 및 RNA 편집을 포함한다.
본 발명에 따르면, 용어 "인델"은, 공동-국재화 삽입과 결실 및 뉴클레오티드의 순이득 또는 순손실을 초래하는 돌연변이로서 정의된, 특수한 돌연변이 클래스를 설명한다. 게놈의 코딩 영역에서, 인델의 길이가 3의 배수가 아닌 한, 이는 프레임시프트 돌연변이를 생성한다. 인델은 점 돌연변이와 대비될 수 있는데, 인델이 서열에서 뉴클레오티드들을 삽입하고 결실하는 것이라면, 점 돌연변이는 뉴클레오티드들 중 하나를 대체하는 치환의 형태이다.
본 발명에 따르면, 용어 "크로모트립시스"는 게놈의 특정 영역이 산산조각난 후 단일 파괴 이벤트를 통해 함께 스티칭(stitching)되는 유전 현상을 지칭한다.
융합은 2개의 이전에 분리된 유전자로부터 형성된 하이브리드 유전자를 생성할 수 있다. 이는 전위, 간질성 결실, 또는 염색체 역전의 결과로 발생할 수 있다. 종종, 융합 유전자는 종양 유전자이다. 종양 융합 유전자들은 새로운 기능 또는 두 융합 파트너와는 다른 기능을 가진 유전자 산물을 가져올 수 있다. 대안적으로, 원-종양 유전자(proto-oncogene)는 강한 프로모터에 융합되고, 그에 의해 종양 유전자 기능은 업스트림 융합 파트너의 강한 프로모터에 의해 유발된 상향 조절에 의해 기능하도록 설정된다. 종양 융합 전사체는 트랜스-스플라이싱(trans-splicing) 또는 리드-쓰루(read-through) 이벤트에 의해 또한 유발될 수 있다.
본 발명의 맥락에서, 용어 "시퀀싱"은 적어도 하나의 핵산의 서열을 결정하는 것을 의미하고, 적어도 하나의 핵산의 가닥에서 염기들의 순서를 결정하는 데 이용되는 임의의 방법을 포함한다. 바람직한 시퀀싱 방법은 차세대 시퀀싱 또는 3세대 시퀀싱과 같은 고-처리량 시퀀싱이다.
명확함을 위해, 용어 "차세대 시퀀싱" 또는 "NGS"는 본 발명의 맥락에서, Sanger 화학으로 알려진 "종래의" 시퀀싱 방법론과 대조적으로, 전체 게놈을 작은 조각들로 쪼갬으로써 전체 게놈을 따라 무작위로 병렬적으로 핵산 주형을 판독하는, 모든 고 처리량 시퀀싱 기술을 의미한다. 그러한 NGS 기술(대규모 병렬 시퀀싱 기술이라고도 알려져 있음)은 전체 게놈, 엑솜, 트랜스크립톰(게놈의 모든 전사된 서열) 또는 메틸롬(methylome)(게놈의 모든 메틸화된 서열)의 핵산 서열 정보를 매우 짧은 기간 내에, 예를 들어, 1주 내지 2 주 이내에, 바람직하게는 1일 내지 7일 이내에 또는 가장 바람직하게는 24시간 이내에 전달할 수 있고, 원칙적으로, 단일 세포 시퀀싱 접근법을 가능하게 한다. 상업적으로 이용 가능하거나 문헌에 언급된 다수의 NGS 플랫폼, 예를 들어, 문헌[Zhang et al., 2011, The impact of next-generation sequencing on genomics. J. Genet Genomics 38:95-109]; 또는 문헌[Voelkerding et al., 2009, Next generation sequencing: From basic research to diagnostics, Clinical chemistry 55:641-658]에 상세히 기술된 것들이 본 발명의 맥락에서 사용될 수 있다. 그러한 NGS 기술/플랫폼의 비제한적인 예는 다음과 같다:
1) 문헌[Ronaghi et al., 1998, A sequencing method based on real-time pyrophosphate, Science 281:363-365]에 최초로 기술된, 예를 들어, Roche-관련 회사인 454 Life Sciences(미국 코넥티컷주 브랜포드 소재)의 GS-FLX 454 Genome SequencerTM로 구현된, 파이로시퀀싱(pyrosequencing)으로 알려진 합성에 의한 시퀀싱(sequencing-by-synthesis) 기술. 이 기술은, 단일-가닥 DNA 결합 비드가 격렬한 볼텍싱에 의해 에멀전 PCR 증폭을 위해 오일에 의해 둘러싸인 PCR 반응물을 함유하는 수성 미셀로 캡슐화되는 에멀전 PCR을 사용한다. 파이로시퀀싱 공정 동안, 뉴클레오티드 혼입 동안 포스페이트 분자로부터 방출된 광은 폴리머라제가 DNA 가닥을 합성함에 따라 기록된다.
2) 가역적 염료-종결제를 기반으로 하고, 예를 들어, Illumina/Solexa Genome AnalyzerTM 및 Illumina HiSeq 2000 Genome AnalyzerTM로 구현된, Solexa(현재는 미국 캘리포니아주 샌디에고 소재의 Illumina Inc.에 속함)에 의해 개발된 합성에 의한 시퀀싱 접근법. 이 기술에서, 4개의 모든 뉴클레오티드가 DNA 폴리머라제와 함께 흐름-세포 채널 내의 올리고-프라임(oligo-primed) 클러스터 단편 내로 동시에 첨가된다. 브릿지 증폭(bridge amplification)은 시퀀싱을 위해 모든 4개의 형광 표지된 뉴클레오티드로 클러스터 가닥을 확장시킨다.
3) 예를 들어, Applied Biosystems(현재는 미국 캘리포니아주 칼즈배드 소재의 Life Technologies Corporation)의 SOLidTM 플랫폼으로 구현된, 리게이션에 의한 시퀀싱(sequencing-by-ligation) 접근법. 이 기술에서, 고정 길이의 모든 가능한 올리고뉴클레오티드의 풀(pool)이 시퀀싱된 위치에 따라 표지된다. 올리고뉴클레오티드는 어닐링되고 리게이션되고; 서열들을 매칭시키기 위한 DNA 리가아제에 의한 우선적 리게이션은 그 위치에 있는 뉴클레오티드를 알려주는 신호를 생성한다. 시퀀싱 전에, DNA는 에멀전 PCR에 의해 증폭된다. 동일한 DNA 분자의 카피만을 각각 함유하는 결과적인 비드는 유리 슬라이드 상에 침착된다. 두 번째 예로서, Dover Systems(미국 뉴햄프셔주 세일럼 소재)의 PolonatorTM G.007 플랫폼은, 무작위로 배열된 비드-기반 에멀전 PCR을 사용하여 병렬 시퀀싱을 위해 DNA 단편을 증폭시킴으로써 리게이션에 의한 시퀀싱 접근법을 또한 이용한다.
4) 예를 들어, Pacific Biosciences(미국 캘리포니아주 멘로 파크 소재)의 PacBio RS 시스템 또는 Helicos Biosciences(미국 매사추세츠주 케임브리지 소재)의 HeliScopeTM 플랫폼으로 구현된 것과 같은, 단일-분자 시퀀싱 기술. 이 기술의 독특한 특징은, SMRT(Single-Molecule Real Time) DNA 시퀀싱으로 정의된, 증폭없이 단일 DNA 또는 RNA 분자를 시퀀싱하는 능력이다. 예를 들어, HeliScope는 고도로 민감한 형광 검출 시스템을 사용하여 각각의 뉴클레오티드를 그것이 합성됨에 따라 직접 검출한다. FRET(fluorescence resonance energy transfer)에 기반한 유사한 접근법이 Visigen Biotechnology(미국 텍사스주 휴스턴 소재)로부터 개발되었다. 다른 형광-기반 단일-분자 기법은 US Genomics(GeneEngineTM) 및 Genovoxx(AnyGeneTM)로부터의 것이다.
5) 예를 들어, 복제 동안 단일 가닥 상에서의 폴리머라제 분자의 이동을 모니터링하기 위해 칩 상에 배열된, 다양한 나노구조가 사용되는 단일-분자 시퀀싱을 위한 나노-기술. 나노-기술에 기반한 접근법에 대한 비제한적인 예로는 Oxford Nanopore Technologies(영국 옥스포드 소재)의 GridONTM 플랫폼, Nabsys(미국 로드아일랜드주 프로비던스 소재)에 의해 개발된 하이브리드화-지원 나노-포어 시퀀싱(HANSTM) 플랫폼, 및 조합 프로브-앵커 리게이션으로 일컬어지는 DNA 나노볼(DNB) 기술을 이용한 독점적 리가제-기반 DNA 시퀀싱 플랫폼(cPALTM)이 있다.
6) 단일-분자 시퀀싱을 위한 전자 현미경 기반 기술, 예를 들어, LightSpeed Genomics(미국 캘리포니아주 서니베일 소재) 및 Halcyon Molecular(미국 캘리포니아주 레드우드 시티 소재)에 의해 개발된 기술
7) DNA의 중합 동안 방출되는 수소 이온의 검출에 기반한 이온 반도체 시퀀싱. 예를 들어, Ion Torrent Systems(미국 캘리포니아주 샌프란시스코 소재)는 이 생화학적 공정을 대규모 병렬 방식으로 수행하기 위해 미세-가공 웰(micro-machined well)의 고밀도 어레이를 사용한다. 각각의 웰은 상이한 DNA 주형을 보유한다. 웰 아래에는 이온-민감 층이 있고, 그 아래에는 독점적 이온 센서가 있다.
본 발명의 맥락에서 유용한 다른 시퀀싱 방법은 터널링 전류 시퀀싱(tunneling currents sequencing)을 포함한다(문헌[Xu et al., 2007, The electronic properties of DNA bases, Small 3:1539-1543], 문헌[Di Ventra, 2013, Fast DNA sequencing by electrical means inches closer, Nanotechnology 24:342501]). 특히 바람직한 차세대 시퀀싱(NGS) 방법론은 Illumina의 IONTorrent 및 NanoPore 시퀀싱을 포함한다.
바람직하게는, DNA 및 RNA 제조물은 NGS을 위한 출발 물질로서 기능한다. 그러한 핵산은 생물학적 샘플로부터, 예를 들어, 혈액 또는 새로운, 급속-동결(flash-frozen) 또는 포르말린-고정 조직 샘플로부터 또는 새로 분리된 세포로부터 또는 환자의 말초 혈액에 존재하는 순환 종양 세포(CTC)로부터 쉽게 얻을 수 있다. 정상(비-돌연변이) 게놈 DNA 또는 RNA가 정상 체세포 조직으로부터 추출될 수 있지만, 생식계열 세포가 바람직하다. 생식계열 DNA 또는 RNA는 비-혈액 악성종양 환자의 말초 혈액 단핵 세포(PBMC)로부터 추출될 수 있다. 추출된 핵산은 고도로 단편화될 수 있지만, 그럼에도 불구하고 그러한 핵산은 NGS 적용에 적합하다.
엑솜 시퀀싱을 위한 몇몇 표적화된 NGS 방법이 문헌에 기술되어 있으며(검토를 위해, 예를 들어, 문헌[Teer and Mullikin, 2010, Human Mol Genet 19:R145-51]을 참조함), 이들 모두는 본 발명과 함께 사용될 수 있다. (예를 들어, 게놈 포획, 게놈 분할, 게놈 농축 등으로 기술된) 이들 방법 중 다수는 하이브리드화 기법을 이용하며, 어레이-기반(예를 들어, 문헌[Hodges et al., 2007, Nat Genet 39:1522-1527]) 및 액체-기반(예를 들어, 문헌[Choi et al., 2009, Proc Natl Acad Sci USA 106:19096-19101] 하이브리드화 접근법을 포함한다. DNA 샘플 준비 및 후속 엑솜 포획을 위한 상업용 키트도 이용 가능하며, 예를 들어, Illumina Inc.(미국 캘리포니아주 샌디에이고 소재)는 TruSeqTM DNA 샘플 준비 키트 및 엑솜 농축 키트 TruSeqTM 엑솜 농축 키트를 제공한다.
핵산들이 시퀀싱되면, 결과적인 서열들(시퀀싱된 판독값들)은 바람직하게는 다수의 종으로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교될 수 있어서, 시퀀싱된 판독값들이 특정 종, 예컨대 대상체로부터의 것 및/또는 특정 미생물로부터의 것으로 결정될 수 있으며, 이는 특정 미생물에 맵핑되는 시퀀싱된 판독값들의 수 및 종에 맵핑되는 시퀀싱된 판독값들의 수, 즉, 대상체에 맵핑되는 것뿐만 아니라 임의의 미생물에 맵핑되는 것의 결정을 가능하게 한다. 상기 설명된 바와 같이, 어떤 종에도 맵핑될 수 없는 시퀀싱된 판독값들은 본 발명에서 사용되지 않는다. 기원 종(species of origin)에 대한 정보를 제공하기 위해 시퀀싱된 판독값들을 맵핑하는 방법은 당업계에 잘 알려져 있으며, 임의의 그러한 적합한 방법이 본 발명과 관련하여 이용될 수 있다. 예를 들어, 문헌[Wood and Salzberg, 2014, Genome Biol 15:R46]에 기술된 Kraken 초고속 메타게노믹스 서열 분류 방법론이 이용될 수 있다. 또 다른 예시적인 방법은 문헌[Sedlazeck et al., 2013, Bioinformatics 29:2790-2791]에 기술된 NextGenMap이다. 또 다른 예시적인 방법은 문헌[Naccache et al., 2014, Genome Res 24:1180-1192]에 기술된 바와 같은 임상 샘플의 차세대 시퀀싱으로부터의 초고속 병원체 확인을 위한 클라우드-호환성(cloud-compatible) 생물정보학 파이프라인이다. 당업계에 알려져 있고 본 발명에 유용한 추가의 방법은 문헌[Huson et al., 2007, Genome Res 17:377-386]; 문헌[Freitas et al., 2015, Nucl Acids Res 43:e69]; 및 문헌[Kim et al., 2016, Genome Res 26:1721-1729]에 기술된 것들을 포함하지만 이로 제한되지 않는다.
본 발명의 특정 구현예들에서, 서열들을 검출하고 비교하는 데에 있어서 위양성 결과의 수를 감소시키기 위해, 서열들을 복제물들로 결정/비교하는 것이 바람직하다. 따라서, 생물학적 샘플 내의 핵산 서열들은 2회, 3회 또는 그 초과의 횟수로 결정되는 것이 바람직하다. 일 구현예에서, 종양 샘플의 핵산 서열은 2회, 3회 또는 그 초과의 횟수로 결정된다. 게놈 DNA에서 서열을 적어도 1회 결정하고 상기 샘플의 RNA에서 서열을 적어도 1회 결정함으로써 서열을 1회 초과로 결정하는 것이 또한 가능할 수 있다. 예를 들어, 샘플의 복제물들 사이의 변이를 결정함으로써, 통계량으로서의 예상 위양성 돌연변이 비율(FDR)이 추정될 수 있다. 샘플의 기술적 반복은 동일한 결과를 생성해야 하며, 이 "동일 대 동일 비교"에서의 임의의 검출된 돌연변이가 위양성이다. 또한, 다양한 품질 관련 메트릭(metric)들(예를 들어, 커버리지(coverage) 또는 SNP 품질)은 머신 러닝 접근법을 이용하여 단일 품질 점수로 합쳐질 수 있다. 주어진 체세포 변이에 대해, 초과의 품질 점수를 갖는 다른 모든 변이가 계수될 수 있으며, 이는 데이터세트에서 모든 변이의 등급화를 가능하게 한다.
본 발명의 맥락에서, 용어 "데이터베이스"는, 바람직하게는 전자 파일링 시스템으로서의, 체계화된 데이터 수집체뿐만 아니라 비-구조화된 데이터 수집체, 예컨대 자연 형식으로 저장된 데이터 시스템 또는 보관소인 데이터 레이크(data lake)와 관련될 수 있다. 데이터 레이크는, 소스(source) 시스템 데이터의 로우 카피(raw copy) 및 보고, 시각화, 분석 및 머신 러닝과 같은 작업에 사용되는 변환된 데이터를 포함하는 모든 엔터프라이즈 데이터(enterprise data)의 단일 저장소가될 수 있다. 일부 구현예들에서, 데이터 레이크는 관계형 데이터베이스(행 및 열)로부터의 정형 데이터, 반-정형 데이터(CSV, 로그, XML, JSON), 비정형 데이터(이메일, 문서, PDF), 및/또는 이진 데이터(이미지, 오디오, 비디오)를 포함할 수 있다. 일 구현예에서, 서열 데이터베이스는, 컴퓨터에 저장된 컴퓨터화된("디지털") 핵산 서열들, 단백질 서열들, 또는 다른 중합체 서열들의 수집체로 구성된 데이터베이스 유형이다. 바람직하게는, 데이터베이스는 핵산 서열들, 즉, 다수의 종으로부터의 유전자 정보의 수집체이다. 유전자 정보는 종의 게놈 및/또는 엑솜 및/또는 트랜스크립톰으로부터 유래될 수 있다. 본 발명에 유용한 예시적인 핵산 데이터베이스는, INSD(International Nucleotide Sequence Database), 일본의 DNA 데이터 뱅크(National Institute of Genetics), EMBL(European Bioinformatics Institute), GenBank(National Center for Biotechnology), 바이오인포매틱 하베스터(Bioinformatic Harvester), 유전자 질병 데이터베이스(Gene Disease Database), SNPedia, 미생물 게노믹스 및 메타게노믹스용 CAMERA 리소스(Resource), EcoCyc(모델 유기체인 대장균 K-12의 게놈 및 생화학적 기구를 설명하는 데이터베이스), 앙상블(Ensembl)(인간, 마우스, 다른 척추 동물 및 진핵 생물 게놈에 대한 자동 주석달기 데이터베이스를 제공함), 앙상블 게놈즈(Ensembl Genomes)((앙상블 소프트웨어 플랫폼을 사용하는) 통합된 대화형 및 프로그래밍 인터페이스 세트를 통해, 세균, 원생 생물, 진균, 식물 및 무척추 동물 후생 동물에 대한 게놈-규모 데이터를 제공함), ExAC(Exome Aggregation Consortium)(매우 다양한 대규모 시퀀싱 프로젝트(Broad Institute)로부터의 엑솜 시퀀싱 데이터), PATRIC(PathoSystems Resource Integration Center), MGI 마우스 게놈(Jackson Laboratory), DOE-조인트 게놈 인스티튜트(DOE-Joint Genome Institute)의 JGI 게놈즈(Genomes)(많은 진핵 생물 및 미생물 게놈의 데이터베이스를 제공함), 내셔널 마이크로비얼 패소젠 데이터 리소스(National Microbial Pathogen Data Resource)(병원균인 캄필로박터(Campylobacter), 클라미디아(Chlamydia), 클라미도필라(Chlamydophila), 헤모필루스(Haemophilus), 리스테리아(Listeria), 미코플라스마(Mycoplasma), 나이세리아(Neisseria), 스태필로코커스(Staphylococcus), 스트렙토코커스(Streptococcus), 트레포네마(Treponema), 우레아플라스마(Ureaplasma) 및 비브리오(Vibrio)에 대한 주석이 달린 게놈 데이터에 대한 수동으로 큐레이팅(curating)된 데이터베이스), RegulonDB(대장균 K-12 세포의 전사 개시 또는 조절 네트워크의 복합적 조절 모델), 사카로마이세스 게놈 데이터베이스(효모 모델 유기체의 게놈), 바이럴 바이오인포매틱스 리소스 센서(Viral Bioinformatics Resource Center)(11가지 바이러스 패밀리에 대한 주석이 달린 게놈 데이터를 포함하는 큐레이팅된 데이터베이스), SEED 플랫폼(모든 완전한 미생물 게놈, 및 대부분의 부분 게놈을 포함하고, 플랫폼은 서브시스템을 사용하여 미생물 게놈에 주석을 달기 위해 사용됨), 웜베이스 파라사이트(WormBase ParaSite)(기생충 종), UCSC 말라리아 게놈 브라우저(UCSC Malaria Genome Browser)(말라리아 유발 종(플라스모디움 팔시파룸(Plasmodium falciparum) 및 다른 것들)의 게놈), 래트 게놈 데이터베이스(라투스 노르베기쿠스(Rattus norvegicus)에 대한 게놈 및 표현형 데이터), INTEGRALL(항생제 내성에 관여하는 세균 유전자 요소인 인테그론(integron) 전용 데이터베이스), VectorBase(NIAID 바이오인포매틱스 리소스 센터 포 인버터브레이트 벡터스 오브 휴먼 패쏘젠스(Bioinformatics Resource Center for Invertebrate Vectors of Human Pathogens)), EzGenome, 원핵 생물(고세균 및 세균)의 수동으로 큐레이팅된 게놈 프로젝트에 관한 포괄적 정보, GeneDB(아피콤플렉산 프로토조아(Apicomplexan Protozoa), 키네토플라스티드 프로토조아(Kinetoplastid Protozoa), 패러시틱 헬민쓰(Parasitic Helminths), 기생충 벡터뿐만 아니라 몇몇 세균 및 바이러스), EuPathDB(진핵 생물 병원체 데이터베이스 자원은 아메바, 진균, 플라스모디움, 트리파노소마티드(trypanosomatid) 등을 포함함); 1000 게놈즈 프로젝트(Genomes Project)(다수의 상이한 인종 그룹로부터의 수천 명을 초과하는 익명 참가자의 게놈을 제공함), 퍼스널 게놈 프로젝트(Personal Genome Project)(인간 게놈을 제공함)을 포함하지만, 이로 제한되지 않는다.
다른 데이터베이스는 개인화된 데이터베이스, 예컨대 동일한 대상체의 건강한 조직 및 질병 조직의 유전자 정보를 포함하는 데이터베이스를 포함할 수 있다. 그러한 데이터베이스는, 예를 들어, 치료 후 암의 재발을 스크리닝하거나 대상체에서 치료의 효과를 모니터링하기 위한 방법에서 유용할 수 있다.
본 발명의 맥락에서, 용어 "서열 판독값" 또는 "판독값"은 상호 교환적으로 사용되며, 뉴클레오티드 서열이 시퀀싱에 의해 결정되고, 바람직하게는 종에 할당되는, 바람직하게는 각각의 종의 게놈에 맵핑되는, 임의의 크기의 특정 핵산을 지칭한다. 바람직한 구현예에서, 판독값들은 특정 종, 예컨대 대상체 및/또는 미생물로 분류되고, 바람직하게는 특정 미생물로 분류된다. 일 구현예에서, 판독값들은 그들의 존재비에 의해 정규화될 수 있다.
추가 구현예에서 본 발명은 대상체에서의 질병 상태 또는 질병, 예를 들어, 감염성 질병의 진단 방법에 관한 것으로, 여기서 본 발명에 따른 상기 대상체에서 질병 상태 또는 질병을 결정하는 방법이 수행된다.
일 구현예에서, 본 발명은 대상체의 감염 상태를 모니터링하는 방법, 바람직하게는 치료 및 요법에 대한 반응 동안 대상체를 모니터링하는 방법을 제공하며, 여기서 본 발명에 따른 상기 대상체의 감염 상태를 결정하는 방법이 수행된다.
그러한 방법은 바람직하게는 질병을 앓고 있는 대상체의 확인, 바람직하게는 질병의 스크리닝, 바람직하게는 예방용 의학적 분석에 관한 것이다. 바람직한 구현예에서, 그러한 방법은 미생물의 존재 및 대상체에서의 질병 발병의 상관 관계를 확인한다.
바람직하게는 본 발명은, 병원성 상태가 적어도 하나의 미생물, 예를 들어, 적어도 하나의 바이러스, 세균, 진균 또는 기생 유기체의 비정상적, 특히 병원성 양의 핵산을 특징으로 하는 방법에 관한 것이다.
임의의 미생물, 바람직하게는 핵산 서열이 알려져 있는 미생물이 대상체에 존재하는 것으로 결정될 수 있을뿐만 아니라 대상체에서 질병의 원인 물질로서 결정될 수 있다. 대상체에서 존재가 결정될 수 있는 예시적인 미생물은 바이러스, 세균, 진균 및 기생충을 포함한다. 예시적인 세균으로는 나이세리아 메닌지티스(Neisseria meningitis), 스트렙토코커스 뉴모니아에(Streptococcus pneumoniae), 스트렙토코커스 피오제네스(Streptococcus pyogenes), 모락셀라 카타랄리스(Moraxella catarrhalis), 보르데텔라 퍼투시스(Bordetella pertussis), 스태필로코커스 아우레우스(Staphylococcus aureus), 클로스트리디움 테타니(Clostridium tetani), 코리네박테리움 디프테리아(Corynebacterium diphtheria), 헤모필루스 인플루엔자(Haemophilus influenza), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 스트렙토코커스 아갈락티아에(Streptococcus agalactiae), 클라미디아 트라코마티스(Chlamydia trachomatis), 클라미디아 뉴모니아에(Chlamydia pneumoniae), 헬리코박터 필로리(Helicobacter pylori), 대장균, 바실러스 안트라시스(Bacillus anthracis), 예르시니아 페스티스(Yersinia pestis), 스태필로코커스 에피더미디스(Staphylococcus epidermidis), 클로스트리디움 퍼프린겐스(Clostridium perfringens), 클로스트리디움 보툴리눔(Clostridium botulinum), 레지오넬라 뉴모필라(Legionella pneumophila), 콕시엘라 부르네티이(Coxiella burnetii), 브루셀라(Brucella) 종, 예컨대 브루셀라 아보르투스(B. abortus), 브루셀라 카니스(B. canis), 브루셀라 멜리텐시스(B. melitensis), 브루셀라 네오토마에(B. neotomae), 브루셀라 오비스(B. ovis), 브루셀라 수이스(B. suis), 브루셀라 피니페디아에(B. pinnipediae), 프란시셀라(Francisella) 종, 예컨대 프란시셀라 노비시다(F. novicida), 프란시셀라 필로미라지아(F. philomiragia), 프란시셀라 툴라렌시스(F. tularensis), 나이세리아 고노로아애(Neisseria gonorrhoeae), 트레포네마 팔리둠(Treponema pallidum), 헤모필루스 듀크레이(Haemophilus ducreyi), 엔테로코커스 파에칼리스(Enterococcus faecalis), 엔테로코커스 파에시움(Enterococcus faecium), 스태필로코커스 사프로피티쿠스(Staphylococcus saprophyticus), 예르시니아 엔테로콜리티카(Yersinia enterocolitica), 미코박테리움 튜버쿨로시스(Mycobacterium tuberculosis), 리케치아(Rickettsia) 종, 리스테리아 모노시토게네스(Listeria monocytogenes), 비브리오 콜레라(Vibrio cholera), 살모넬라 티피(Salmonella typhi), 보렐리아 부르그도르페리(Borrelia burgdorferi), 포르피로모나스 긴기발리스(Porphyromonas gingivalis), 클레브시엘라(Klebsiella) 종, 클레브시엘라 뉴모니아에(Klebsiella pneumoniae)를 포함하지만, 이로 제한되는 것은 아니다.
예시적인 바이러스는 오르토믹소비리다에(Orthomyxoviridae), 예컨대 인플루엔자 A, B 또는 C 바이러스; 파라믹소비리다에(Paramyxoviridae) 바이러스, 예컨대 뉴모바이러스(Pneumovirus)(예를 들어, 호흡기 세포 융합 바이러스, RSV), 루불라바이러스(Rubulavirus)(예를 들어, 볼거리 바이러스), 파라믹소바이러스(예를 들어, 파라인플루엔자 바이러스), 메타뉴모바이러스(Metapneumovirus) 및 모르빌리바이러스(Morbillivirus)(예를 들어, 홍역); 폭스비리다에(Poxviridae), 예컨대 오르토폭스바이러스(Orthopoxvirus)(예를 들어, 바리올라 메이저(Variola major) 및 바리올라 마이너(Variola minor)를 포함하는 바리올라 베라(Variola vera)); 피코나비리다에(Picornaviridae), 예컨대 엔테로바이러스(Enterovirus)(예를 들어, 폴리오바이러스, 예를 들어 타입 1, 타입 2 및/또는 타입 3 폴리오바이러스, EV71 엔테로바이러스, 콕삭키 A 또는 B 바이러스), 라이노바이러스(Rhinovirus), 헤파나바이러스(Heparnavirus), 카디오바이러스(Cardiovirus) 및 아프토바이러스(Aphthovirus); 부니아바이러스(Bunyavirus), 예컨대 오르토부니아바이러스(Orthobunyavirus)(예를 들어, 캘리포니아 엔세팔리티스 바이러스(California encephalitis virus)), 플레보바이러스(Phlebovirus)(예를 들어, 리프트 밸리 피버 바이러스(Rift Valley Fever virus)), 또는 뉴로바이러스(Neurovirus)(예를 들어, 크림-콩고(Crimean-Congo) 출혈열 바이러스); 헤파나바이러스(예를 들어, A형 간염 바이러스(HAV), B형 간염 바이러스 및 C형 간염 바이러스); 필로비리다에(Filoviridae)(예를 들어, 에볼라 바이러스(자이레(Zaire), 아이보리 코스트(Ivory Coast), 레스톤(Reston) 또는 수단(Sudan) 에볼라바이러스를 포함함) 또는 마르부르그 바이러스(Marburg virus)); 토가바이러스(Togavirus)(예를 들어, 루벨라 바이러스(rubella virus)를 포함하는, 루비바이러스(Rubivirus), 알파바이러스(Alphavirus), 및 아테리바이러스(Arterivirus)); 플라비바이러스(Flavivirus)(예를 들어, 진드기-매개 뇌염(Tick-borne encephalitis, TBE) 바이러스, 뎅기(타입 1, 2, 3 또는 4) 바이러스, 황열(Yellow Fever) 바이러스, 일본 뇌염 바이러스, 캬사늘 포레스트 바이러스(Kyasanur Forest Virus), 웨스트-나일(West Nile) 뇌염 바이러스, 세인트루이스 뇌염 바이러스, 러시아 춘하(Russian spring-summer) 뇌염 바이러스, 및 포와산(Powassan) 뇌염 바이러스); 페스티바이러스(Pestivirus)(예를 들어, BVDV(Bovine viral diarrhea), CSFV(Classical swine fever) 및 BDV(Border disease)); 헤파드나바이러스(Hepadnavirus)(예를 들어, B형 간염 바이러스, C형 간염 바이러스, 델타 간염 바이러스, E형 간염 바이러스, 또는 G형 간염 바이러스); 라브도바이러스(Rhabdovirus)(예를 들어, 리사바이러스(Lyssavirus), 광견병 바이러스 및 베시큘로바이러스(Vesiculovirus)(VSV)); 칼리시비리다에(Caliciviridae)(예를 들어, 노웍 바이러스(Norwalk virus)(노로바이러스), 및 노웍-유사 바이러스, 예컨대 하와이 바이러스(Hawaii Virus) 및 스노우 마운틴 바이러스(Snow Mountain Virus)); 코로나바이러스(Coronavirus)(예를 들어, SARS 코로나바이러스, IBV(avian infectious bronchitis), MHV(Mouse hepatitis virus), 및 돼지 전염성 위장염 바이러스(TGEV)); 레트로바이러스(Retrovirus)(예를 들어, 온코바이러스(Oncovirus), 렌티바이러스(Lentivirus)(예를 들어, HIV-1 또는 HIV-2) 또는 스푸마바이러스(Spumavirus)); 레오바이러스(Reovirus)(예를 들어, 오르토레오바이러스(Orthoreovirus), 로타바이러스(Rotavirus), 오비바이러스(Orbivirus), 및 콜티바이러스(Coltivirus)); 파보바이러스(Parvovirus)(예를 들어, 파보바이러스 B19); 포진바이러스(Herpesvirus)(예를 들어, 인간 포진바이러스, 예컨대 단순 포진 바이러스(HSV), 예를 들어, HSV 타입 1 및 2, 수두-대상포진 바이러스(Varicella-zoster virus)(VZV), 엡스타인-바르 바이러스(Epstein-Barr virus)(EBV), 사이토메갈로바이러스(Cytomegalovirus)(CMV), 인간 포진바이러스(Human Herpesvirus) 6(HHV6), 인간 포진바이러스 7(HHV7), 및 인간 포진바이러스 8(HHV8)); 파보비리다에(Papovaviridae)(예를 들어, 파필로마바이러스 및 폴리오마바이러스, 예를 들어, 혈청형 1, 2, 4, 5, 6, 8, 11, 13, 16, 18, 31, 33, 35, 39, 41, 42, 47, 51, 57, 58, 63 또는 65, 바람직하게는 혈청형 6, 11, 16 및/또는 18 중 하나 이상으로부터의 것); 아데노바이러스(Adenovirus), 예컨대 아데노바이러스 혈청형 36(Ad-36)을 포함하지만, 이로 제한되지 않는다.
예시적인 진균은 에피더모피톤 플로쿠숨(Epidermophyton floccusum), 미크로스포룸 아우도우이니(Microsporum audouini), 미크로스포룸 카니스(Microsporum canis), 미크로스포룸 디스토르툼(Microsporum distortum), 미크로스포룸 에퀴눔(Microsporum equinum), 미크로스포룸 깁숨(Microsporum gypsum), 미크로스포룸 나눔(Microsporum nanum), 트리코피톤 콘센트리쿰(Trichophyton concentricum), 트리코피톤 에퀴눔(Trichophyton equinum), 트리코피톤 갈리나에(Trichophyton gallinae), 트리코피톤 깁세움(Trichophyton gypseum), 트리코피톤 나에그니니(Trichophyton naegnini), 트리코피톤 멘타그로피테스(Trichophyton mentagrophytes), 트리코피톤 퀸크케아눔(Trichophyton quinckeanum), 트리코피톤 루브룸(Trichophyton rubrum), 트리코피톤 쇼엔레이니(Trichophyton schoenleini), 트리코피톤 톤수란스(Trichophyton tonsurans), 트리코피톤 베루코숨(Trichophyton verrucosum), 트리코피톤 베루코숨바르. 알붐(T. verrucosum var. album), 바르. 디스코이데스(var. discoides), 바르. 오크라세움(var. ochraceum), 트리코피톤 비올라세움(Trichophyton violaceum), 및/또는 트리코피톤 파비포르메(Trichophyton faviforme)를 포함하는 더마토피트레스(Dermatophytres); 아스페르길루스 푸미가투스(Aspergillus fumigatus), 아스페르길루스 플라부스(Aspergillus flavus), 아스페르길루스 니거(Aspergillus niger), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 테레우스(Aspergillus terreus), 아스페르길루스 시도위(Aspergillus sydowi), 아스페르길루스 플라바투스(Aspergillus flavatus), 아스페르길루스 글라우쿠스(Aspergillus glaucus), 블라스토쉬조마이세스 카피타투스(Blastoschizomyces capitatus), 칸디다 알비칸스(Candida albicans), 칸디다 에놀라세(Candida enolase), 칸디다 트로피칼리스(Candida tropicalis), 칸디다 글라브라타(Candida glabrata), 칸디다 크루세이(Candida krusei), 칸디다 파라프실로시스(Candida parapsilosis), 칸디다 스텔라토이데아(Candida stellatoidea), 칸디다 쿠세이(Candida kusei), 칸디다 파라크우세이(Candida parakwsei), 칸디다 루시타니아에(Candida lusitaniae), 칸디다 슈도트로피칼리스(Candida pseudotropicalis), 칸디다 구일리에르몬디(Candida guilliermondi), 클라도스포리움 카르리오니이(Cladosporium carrionii), 콕시디오이데스 임미티스(Coccidioides immitis), 블라스토마이세스 데르마티디스(Blastomyces dermatidis), 크립토코쿠스 네오포르만스(Cryptococcus neoformans), 게오트리쿰 클라바툼(Geotrichum clavatum), 히스토플라스마 카프술라툼(Histoplasma capsulatum), 미크로스포리디아(Microsporidia), 엔세팔리토준(Encephalitozoon) 종, 셉타타 인테스티날리스(Septata intestinalis) 및 엔테로시토준 비에네우시(Enterocytozoon bieneusi); 브라키올라(Brachiola) 종, 미크로스포리디움(Microsporidium) 종, 노세마(Nosema) 종, 플레이스토포라(Pleistophora) 종, 트라키플레이스토포라(Trachipleistophora) 종, 비타포르마(Vittaforma) 종, 파라콕시디오이데스 브라실리엔시스(Paracoccidioides brasiliensis), 뉴모시스티스 카리니이(Pneumocystis carinii), 피티움 인시디오숨(Pythiumn insidiosum), 피티로스포룸 오발레(Pityrosporum ovale), 사카로마이세스 세레비사에(Sacharomyces cerevisae), 사카로마이세스 보울라르디이(Saccharomyces boulardii), 사카로마이세스 폼베(Saccharomyces pombe), 세도스포리움 아피오스페룸(Scedosporium apiosperum), 스포로트릭스 쉔크키이(Sporothrix schenckii), 트리코스포론 베이젤리이(Trichosporon beigelii), 톡소플라스마 곤디이(Toxoplasma gondii), 페니실리움 마르네페이(Penicillium marneffei), 말라세지아(Malassezia) 종, 폰세카에아(Fonsecaea) 종, 와기엘라(Wangiella) 종, 스포로트릭스(Sporothrix) 종, 바시디오볼루스(Basidiobolus) 종, 코니디오볼루스(Conidiobolus) 종, 리조푸스(Rhizopus) 종, 무코르(Mucor) 종, 압시디아(Absidia) 종, 모르티에렐라(Mortierella) 종, 쿤닝하멜라(Cunninghamella) 종, 사크세나에아(Saksenaea) 종, 알테르나리아(Alternaria) 종, 쿠르불라리아(Curvularia) 종, 헬민토스포리움(Helminthosporium) 종, 푸사리움(Fusarium) 종, 아스페르길루스(Aspergillus) 종, 페니실리움(Penicillium) 종, 모놀리니아(Monolinia) 종, 리조크토니아(Rhizoctonia) 종, 파에실로마이세스(Paecilomyces) 종, 피토마이세스(Pithomyces) 종 및 클라도스포리움(Cladosporium) 종을 포함하지만, 이로 제한되지 않는다.
예시적인 기생충은 플라스모디움, 예컨대 플라스모디움 팔시파룸, 플라스모디움 비박스(P. Vivax), 플라스모디움 말라리아에(P. Malariae) 및 플라스모디움 오발레(P. Ovale)뿐만 아니라 칼리기다에(Caligidae) 과로부터의 기생충, 특히 레페오프테이루스(Lepeophtheirus) 및 칼리구스게네라(Caligusgenera)로부터의 기생충, 예를 들어, 바다 이(sea lice), 예컨대 레페오프테이루스 살모니스(Lepeophtheirus salmonis) 및 칼리구스 로게르크레세이이(Caligus rogercresseyi)를 포함하지만, 이로 제한되지 않는다.
본 발명의 맥락에서, 용어 "항생제 내성"은 항생제의 사멸 또는 성장-억제 특성에 대한 세균의 감수성 상실을 의미한다. 또한 이는 미생물에 의해 유발된 감염의 치료에 원래 효과적인 항미생물 약물에 대한 미생물의 내성과 관련된다. 세균, 진균, 바이러스 및 기생충을 포함한 내성 미생물은 항세균 약물, 항진균제, 항바이러스제, 및 항말라리아제와 같은 항미생물 약물에 의한 공격을 견딜 수 있어, 표준 치료법이 효과가 없고 감염이 지속된다.
본 발명에 따르면, 용어 "종양" 또는 "종양 질병"은, 바람직하게는 팽윤 또는 병변을 형성하는, 세포(신생(neoplastic) 세포, 종양발생 세포 또는 종양 세포로 일컬어짐)의 비정상적 성장을 지칭한다. "종양 세포"는 신속하고 제어되지 않은 세포 증식에 의해 성장하고 새로운 성장을 개시한 자극이 중단된 후에도 계속 성장하는 비정상 세포를 의미한다. 종양은 정상 조직과의 구조적 조직화 및 기능적 조화의 부분적 또는 완전한 결여를 보이고, 일반적으로 양성, 전-악성 또는 악성일 수 있는 뚜렷한 조직 덩어리를 형성한다.
암(의학 용어:악성 신생물(neoplasm))은 일단의 세포가 제어되지 않은 성장(정상 한계를 벗어난 분열), 침습(인접 조직으로의 침투 및 그의 파괴), 및 때때로 전이(림프 또는 혈액을 통한 체내의 다른 위치로의 확산)을 나타내는 질병의 부류이다. 암의 이러한 세 가지 악성 특성은 암이, 자가 제한적이고, 침습하거나 전이되지 않는 양성 종양과 구별되게 한다. 대부분의 암은 종양을 형성하지만, 백혈병과 같은 일부는 그렇지 않다. 악성종양, 악성 신생물, 및 악성 종양은 본질적으로 암과 동의어이다.
신생물은 신형성(neoplasia)의 결과로서의 비정상적 조직 덩어리이다. 신형성(그리스어로 새로운 성장임)은 세포의 비정상적 증식이다. 세포의 성장이 과도하여, 그 주위의 정상 조직의 성장과 조화를 이루지 못하게 된다. 성장은 자극이 중단된 후에도 동일하게 과도한 방식으로 지속된다. 이는 일반적으로 종괴(lump) 또는 종양을 유발한다. 신생물은 양성, 전-악성 또는 악성일 수 있다.
본 발명에 따른 "종양의 성장" 또는 "종양 성장"은 종양이 그 크기를 증가시키려는 경향 및/또는 종양 세포가 증식하려는 경향과 관련된다.
본 발명의 목적을 위해, 용어 "암" 및 "암 질병"은 용어 "종양" 및 "종양 질병"과 상호 교환적으로 사용된다.
암은 종양과 유사한 세포 유형에 의해 분류되며, 그에 따라 조직이 종양의 기원인 것으로 추정된다. 이들은 각각 조직학 및 위치이다.
본 발명에 따른 용어 "암"은 암종, 선암종, 모세포종, 백혈병, 고환종, 흑색종, 기형종, 림프종, 신경모세포종, 신경아교종, 직장암, 자궁내막암, 신장암, 부신암, 갑상선암, 혈액암, 피부암, 뇌암, 자궁경부암, 장암(intestinal cancer), 간암, 결장암, 위암, 장암(intestine cancer), 두경부암, 위장관암, 림프절암, 식도암, 대장암, 췌장암, 이비인후(ENT)암, 유방암, 전립선암, 자궁암, 난소암 및 폐암 및 이들의 전이를 포함한다. 이의 예로는 폐 암종, 유방 암종, 전립선 암종, 결장 암종, 신장 세포 암종, 자궁경부 암종, 또는 전술한 암 유형 또는 종양의 전이가 있다. 본 발명에 따른 암이라는 용어는 암의 전이 및 재발을 또한 포함한다.
본 발명에 따르면, "암종"은 상피 세포로부터 유래된 악성 종양이다. 이 그룹은 흔한 형태의 유방암, 전립선암, 폐암 및 결장암을 포함하는 가장 흔한 암을 나타낸다. "선암종"은 선 조직(glandular tissue)에서 기원하는 암이다. 또한 이 조직은 상피 조직으로 알려진 더 큰 조직 범주의 일부이다. 상피 조직은 피부, 선 및 신체의 공동 및 기관을 라이닝(lining)하는 다양한 다른 조직을 포함한다. 상피는 발생학적으로 외배엽, 내배엽 및 중배엽으로부터 유래된다. 선암종으로 분류되기 위해, 세포가 분비 특성을 갖는 한, 세포는 반드시 선의 일부일 필요는 없다. 이 형태의 암종은 인간을 포함하는 일부 고등 포유 동물에서 발생할 수 있다. 잘 분화된 선암종은 그것이 유래한 선 조직과 유사한 경향이 있는 한편, 잘 분화되지 못한 선암종은 그러하지 아니할 수 있다. 생검물로부터의 세포를 염색함으로써, 병리학자는 종양이 선암종인지 아니면 일부 다른 유형의 암인지를 결정할 것이다. 선암종은 신체 내에서의 선의 편재성으로 인해 신체의 많은 조직에서 발생할 수 있다. 각각의 선은 동일한 물질을 분비하지 않을 수 있는 한편, 세포에 대한 외분비 기능이 있는 한 그것은 선으로 간주되고, 따라서 그의 악성 형태는 선암종으로 명명된다. 악성 선암종은 다른 조직을 침습하고, 전이되기에 충분한 시간이 주어지는 경우 종종 전이된다. 난소 선암종은 가장 흔한 유형의 난소 암종이다. 이는 장액성 및 점액성 선암종, 투명 세포 선암종 및 자궁내막양 선암종을 포함한다.
"전이"라 함은 암 세포가 그의 원래 부위로부터 신체의 또 다른 부분으로 확산되는 것을 의미한다. 전이의 형성은 매우 복잡한 과정이며, 원발성 종양으로부터의 악성 세포의 탈리, 세포외 매트릭스의 침습, 체강 및 혈관에 진입하기 위한 내피 기저막의 침투, 및 이어서, 혈액에 의해 수송된 후, 표적 기관의 침윤에 좌우된다. 최종적으로, 표적 부위에서의 새로운 종양, 즉, 2차 종양 또는 전이성 종양의 성장은 혈관형성에 좌우된다. 원발성 종양의 제거 후에도 종양 전이가 종종 발생하는데, 이는 종양 세포 또는 성분이 남아서 전이력(metastatic potential)을 나타낼 수 있기 때문이다. 일 구현예에서, 본 발명에 따른 용어 "전이"는 원발성 종양 및 국소 림프절 시스템으로부터 멀리 떨어진 전이와 관련된 "원거리 전이"와 관련된다.
2차 또는 전이성 종양의 세포는 원래 종양의 세포와 같다. 예를 들어, 이는 유방암이 간으로 전이된 경우, 2차 종양은 비정상적 간 세포가 아닌 비정상적 유방 세포로 이루어짐을 의미한다. 이어서, 간에서의 종양은 간암이 아닌 전이성 유방암으로 일컬어진다.
용어 "순환 종양 세포" 또는 "CTC"는 원발성 종양 또는 종양 전이물로부터 탈리되어 혈류에서 순환하는 세포와 관련된다. CTC는 다양한 조직에서 추가의 종양(전이물)의 후속 성장을 위한 시드(seed)를 구성할 수 있다. 순환 종양 세포는 전이성 질병이 있는 환자에서 전혈 mL당 약 1개 내지 10개 CTC의 빈도로 발견된다. CTC를 분리하기 위한 연구 방법이 개발되었다. CTC를 분리하기 위한 여러 연구 방법, 예를 들어, 상피 세포가 정상 혈액 세포에 부재하는 세포 부착 단백질인 EpCAM을 공통적으로 발현한다는 사실을 이용하는 기법이 당업계에 기술되어 있다. 면역자성 비드-기반 포획은 자성 입자와 접합된 EpCAM에 대한 항체로 혈액 표본을 처리한 후, 자기장에서 태깅된 세포를 분리하는 것을 포함한다. 이어서, 분리된 세포는, 희귀 CTC를 오염성 백혈구와 구별하도록, 또 다른 상피 마커인 사이토케라틴뿐만 아니라 공통 백혈구 마커인 CD45에 대한 항체로 염색된다. 이 강력하고 반자동화된 접근법은 대략 1 CTC/mL의 평균 수율과 0.1%의 순도로 CTC를 확인한다(문헌[Allard et al., 2004, Clin Cancer Res 10:6897-6904]). CTC를 단리하는 두 번째 방법은, EpCAM에 대한 항체에 의한 코팅에 의해 기능성으로 된 80,000개의 마이크로포스트(micropost)가 내장된 챔버를 통해 전혈을 유동시키는 것을 포함하는 미세유체-기반 CTC 포획 장치를 사용한다. 이어서, CTC는 사이토케라틴 또는 조직 특이적 마커, 예컨대 전립선 암에서의 PSA 또는 유방암에서의 HER2에 대한 2차 항체로 염색되고, 3차원 좌표를 따른 다중 평면에서의 마이크로포스트의 자동 스캐닝에 의해 가시화된다. CTC-칩은 50개 세포/ml의 평균 수율 및 1% 내지 80% 범위의 순도로 환자에서 사이토케라틴-양성 순환 종양 세포를 확인할 수 있다(문헌[Nagrath et al., 2007, Nature 450:1235-1239]). CTC를 분리하기 위한 또 다른 가능성은, 혈액 튜브에서 CTC를 포획, 확인, 및 계수하는 Veridex, LLC(미국 뉴저지주 래리턴 소재)로부터의 CellSearchTM 순환 종양 세포(CTC) 테스트를 사용하는 것이다. CellSearchTM 시스템은 면역자기 표지와 자동 디지털 현미경의 조합을 기반으로 하는 전혈 내 CTC의 계산을 위한 미국 FDA(Food and Drug Administration) 승인된 방법론이다. 문헌에 기술된 CTC를 분리하는 다른 방법들이 존재하며, 이들 모두는 본 발명과 함께 사용될 수 있다.
재발 또는 재발생(recurrence)은 과거에 영향을 주었던 질환에 의해 사람이 다시 영향을 받을 때 일어난다. 예를 들어, 환자가 종양 질병을 앓은 적이 있고, 상기 질병의 성공적인 치료를 받은 적이 있고, 상기 질병을 다시 발병한 경우, 상기 새로 발병된 질병은 재발 또는 재발생으로 간주될 수 있다. 그러나, 본 발명에 따르면, 종양 질병의 재발 또는 재발생은 원래 종양 질병의 부위에서 발생할 수 있지만, 반드시 그러한 것은 아니다. 따라서, 예를 들어, 환자가 유방 종양을 앓은 적이 있고, 성공적인 치료를 받은 적이 있는 경우, 재발 또는 재발생은 유방 종양의 발생일 수 있거나 유방과 다른 부위에서의 종양의 발생일 수 있다. 종양의 재발 또는 재발생은 종양이 원래 종양 부위에서뿐만 아니라 원래 종양과 다른 부위에서도 발생하는 상황을 또한 포함한다. 바람직하게는, 환자가 치료를 받은 적이 있는 원래 종양은 원발성 종양이고, 원래 종양의 부위와 다른 부위에서의 종양은 2차 또는 전이성 종양이다.
"치료하다"라 함은, 대상체에서 종양의 크기 또는 종양의 수를 감소시키는 것을 또한 포함하는, 감염성 질병과 같은 질병을 예방하거나 제거하기 위해; 대상체에서 질병을 저지하거나 늦추기 위해; 대상체에서 새로운 질병의 발병을 억제하거나 늦추기 위해; 현재 질병이 있거나 또는 과거에 질병에 걸린 적이 있는 대상체에서 증상의 빈도 또는 중증도 및/또는 재발생을 감소시키기 위해; 및/또는 대상체의 수명을 연장, 즉, 증가시키기 위해 본원에 기재된 바와 같은 화합물 또는 조성물을 대상체에게 투여하는 것을 의미한다. 특히, 용어 "질병의 치료"는 질병 또는 그의 증상을 치유하거나, 지속 시간을 단축시키거나, 개선시키거나, 예방하거나, 진행 또는 악화를 늦추거나 억제하거나, 발병을 예방하거나 지연하는 것을 포함한다.
"위험이 있는"이라 함은 일반적인 집단과 비교하여 질병, 특히 암을 발병할 가능성이 정상보다 높은 것으로 확인된 대상체, 즉, 환자를 의미한다. 또한, 질병, 특히 암에 걸린 적이 있거나 현재 걸려 있는 대상체는 질병을 발병할 위험이 높은 대상체인데, 이는 그러한 대상체가 질병을 계속 발병할 수 있기 때문이다. 현재 암에 걸려 있거나 걸린 적이 있는 대상체도 암 전이의 위험이 높다.
본 발명의 맥락에서, "보호하다", "예방하다", "예방의", "예방적인" 또는 "보호하는"과 같은 용어는 대상체에서의 질병의 발생 및/또는 전파의 예방 또는 치료 또는 둘 모두와 관련되고, 특히, 대상체가 질병을 발병할 가능성을 최소화하거나 질병의 발병을 지연시키는 것과 관련된다. 예를 들어, 전술한 바와 같은 종양에 걸릴 위험이 있는 사람은 종양을 예방하기 위한 요법에 대한 후보일 것이다.
본 발명의 일 구현예에 따르면, 대상체가 감염성 질병 또는 다른 질병 상태를 갖는 것으로 결정되면, 대상체는 감염성 질병 또는 다른 질병 상태를 치료하기 위해 적절한 요법을 적용받을 수 있다. 항생제 및 항암제를 포함한 이들 요법은 당업계에 잘 알려져 있으며, 어떤 적절한 요법이 궁극적으로 대상체에게 주어질 것인지는 치료 의사에 의해 결정될 것이다.
일 구현예에서, 또한 본 발명은 본 발명에 따른 방법을 수행하기 위한 장치에 관한 것으로, 서열 판독값들을, 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 비교된 서열 판독값이 하나 이상의 데이터베이스 내에 포함된 종에 맵핑되는지를 결정하는 것은 장치의 중앙 처리 유닛에 의해 계산된다. 일 구현예에서, 또한 본 발명은 본 발명에 따른 방법을 수행하기 위한 장치에 관한 것으로, 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 것은 장치의 중앙 처리 유닛에 의해 계산된다. 일 구현예에서, 또한 본 발명은 본 발명에 따른 방법을 수행하기 위한 장치에 관한 것으로, 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수에 기초하여 대상체에서 특정 미생물에 맵핑되는 비교된 서열 판독값을 발견할 확률에 대한 유의성 점수는 장치의 중앙 처리 유닛에 의해 계산된다. 일 구현예에서, 중앙 처리 유닛은 FPGA(field-programmable gate array)이다. 바람직한 구현예에서, 장치는 전술한 계산들 중 하나 이상 또는 전부를 수행한다. 일 구현예에서, 또한 본 발명은 대상체에서 질병 상태의 존재를 결정하는 것과 관련된 계산들 중 하나 이상 또는 전부를 수행할 수 있는 장치에 관한 것이다.
따라서, 본 발명은 핵산, 예를 들어 유리 순환 DNA의 편향되지 않은 서열 분석에 기초하여 생물학적 샘플 내의 미생물 또는 질병 상태의 존재의 결정을 위한 완전한 진단 워크플로우(workflow)를 제공한다. 방법은 유리하게는 의심되는 미생물 또는 질병 상태를 알지 못하고도 데이터-주도(data-driven) 진단을 제공하고, 특정 프라이머 설계를 요구하지 않으며, 단일 검정으로 다수의 바이러스, 세균, 진균 및 기생 미생물을 검출할 기회를 제공한다.
본 발명의 방법은 바람직하게는 특정 미생물의 결정에 제한되지 않는다. 일 구현예에서, 본 방법은 모든 미생물, 바람직하게는 감염과 같은 대상체 내의 질병 상태와 관련된 모든 미생물의 존재를 결정한다. 또한, 본 발명의 방법은 바람직하게는 대상체 내의 특정 유형의 암의 결정에 제한되는 것이 아니라 하나 초과의 유형의 암뿐만 아니라 암의 하위 유형의 존재를 결정할 수 있다. 바람직한 구현예에서, 대상체 내의 다양한 유형 및/또는 하위 유형의 암은 그의 유전 물질에서 다양한 돌연변이를 가져서, 하나 이상의 유형 및/또는 하위 유형의 암의 대상체 내의 존재가 본 발명의 방법에 따라 결정될 수 있게 한다.
따라서, 본 발명은 짧은 시간 내에 대상체 내의 감염 또는 다른 질병 상태의 원인을 확인하기 위한 유용한 방법을 제공하여, 확인된 감염 또는 다른 질병 상태에 대한 적절한 요법이 짧은 시간 내에 선택될 수 있게 한다.
따라서, 본 발명의 방법은, 임상 표본 내의 미생물의 데이터-주도 확인을 위해, 대상체의 미생물 부하 및 표적화된 치료에 대한 반응을 모니터링하기 위해, 그리고 표준 임상 미생물학을 보완하기 위해 매우 유용할 수 있다. 본 발명의 방법은, 임상 표본 내의 종양 세포의 존재의 데이터-주도 확인을 위해, 대상체의 종양 세포 부하 및 표적화된 치료에 대한 반응을 모니터링하기 위해, 그리고 표준 임상 종양학을 보완하기 위해 매우 유용할 수 있다.
본 발명은 이하에서 도면 및 실시예에 의해 상세히 설명되며, 그러한 도면 및 실시예는 예시 목적으로만 사용되며 제한하려는 것이 아니다. 설명 및 실시예로 인해, 마찬가지로 본 발명에 포함되는 추가의 구현예들이 당업자에게 이용 가능하다.
실시예
본원에 사용된 기법 및 방법은 본원에 기술되어 있거나, 그 자체로 알려진 방식으로 그리고, 예를 들어, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.]에 기술된 바와 같이 수행된다. 키트 및 시약의 사용을 포함한 모든 방법은 구체적으로 지시되지 않는 한 제조업체의 정보에 따라 수행된다.
실시예 1
생물학적 샘플, 즉, 혈장을 감염성 질병을 앓고 있는 것으로 의심되는 인간 대상체로부터 얻었다. 샘플 내의 핵산을 차세대 시퀀싱 방법을 이용하여 시퀀싱하여, 복수의 서열 판독값을 생성하였다. 이 데이터를 저장하고, 후속하여 다음과 같이 분석하였다.
개별 서열 판독값들을 인간 및 복수의 미생물 둘 모두의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 가능한 경우 각각의 판독값이 특정 미생물 또는 인간 게놈에 맵핑되게 하였다. 맵핑은 특정 미생물에 맵핑되는 판독값들의 총수 및 종, 즉, 특정 미생물, 인간 게놈뿐만 아니라 임의의 다른 미생물에 맵핑될 수 있는 판독값들의 총수를 실시간으로 제공하였다. 따라서, 특정 미생물 또는 인간 대상체에 기인한 판독값들의 수가 진단 절차 동안 모든 시점에서 알려졌다.
이 정보는 카운트 벡터(count-vector) C: c m , ..., c l ; m = 1, .... l의 생성을 가능하게 했고, 그러한 벡터는 진단 동안 임의의 그러나 고정된 시점에서 샘플/환자 j에서 모든 종 m에 대한 판독값들의 수를 유지한다. 새로운 판독값들이 종에 맵핑되는 동안 c m 은 환자 j의 진단 중에 시간 경과에 따라 변한다. 또한, 새로운 미생물 종이 확인됨에 따라 C가 커질 수 있다. 처음에, 빈 벡터가 초기화되어 있고, 방법의 실행시간 동안 동적 벡터가 생성된다. C는 현재 진단된 환자의 미생물 부담을 설명한다. 부담이 비정상적 존재비를 갖는 미생물을 확인하기 위해, 주어진 시간에서의 환자 j 내의 이 특정 미생물 부담의 역 누적 밀도 함수(cdf)를 다음과 같이 계산하였다:
Figure 112020005082012-pct00001
여기서, c m 은 현재 시간에서의 환자 j 내의 종 m에 대해 측정된 판독값들의 수이고, n은 전체로서(미생물 및 숙주) 맵핑될 수 있는 판독값들의 수이다. p M 은 실시간으로 계산되는 발견 확률을 설명하며 종 m에 대한 판독값을 검출할 확률을 나타낸다.
종래의 검사와 대조적으로, 이 검사는 종점 검사가 아니라 순차적 검사의 프레임워크에서 실행되고 있는 것이다. 따라서, 순차적 검사 접근법을 통해, 모든 필요하고 중요한 정보는 검사가 완료된 후가 아니라 검사가 실행되는 동안 이용 가능하다. 이는 차세대 시퀀싱의 영역에서 새로운 감염 진단 방법과 새로운 검사 절차 방법을 제공한다. 제공된 정보는 특정 종에 맵핑되는 핵산의 현재량이 이례적인 것으로 간주되는지 여부를 설명하는 p-값이고, 그에 따라 이 종에 대한 발견 확률과 현재 실행 중인 검사 설정을 고려할 때 매우 낮은 p-값에 도달한다.
이 방법은 "이벤트당 미생물 신호"와 같은 새로운 특성 변수의 정의를 가능하게 한다. 이러한 변수들은 미생물이 통계적으로 관련있게 되는 시간에 직접적으로 좌우되고, 그에 따라 새로운 변수들은 특히 중요하다. 가능한 특성 변수들은 "초당 미생물 판독값들" 또는 "인간 판독값들당 미생물 판독값들"이다. 모든 대상체 및 모든 미생물에 대해 그러한 변수가 계산될 수 있고, 그에 따라 분석된 각 샘플에 대해 감염 중증도에 대한 더 심층적인 통찰력을 제공할 것이다. 또한, 그러한 특성 변수들은 그러한 변수들의 기술적 독립성으로 인해 다양한 기술로 시퀀싱된 샘플들의 비교를 가능하게 할 것이다.
실시예 2
대상체 S9로부터 얻은 혈장의 생물학적 샘플로부터의 핵산을 시퀀싱하여, 대상체에서 특정 미생물에 대해 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수에 기초하여 특정 미생물에 맵핑되는 비교된 서열 판독값을 발견할 확률이 본 발명에 따라 계산되게 하였다. 결과는 도 1에 제시되어 있다.
도 1은 7가지 상이한 미생물에 대한 완전한 검사 순서를 동시에 도시한다(검사는 특정 미생물들에 대한 유의성에 의해 중단되거나 중지되지 않았음). 미생물이 감염을 유발하는 것과 "관련된" 것으로 간주되기 전에 초과해야 하는 통계적 임계값을 나타내는 수평 적색-파선이 또한 나타나 있다. 미생물인 엔테로박터 클로아카에(Enterobacter cloacae)를 나타내는 청색 선은 데이터를 생성한 지 몇 분 후만에 통계적 임계값을 초과하여 검사가 이 미생물에 대해 단지 몇 분 후에 종료될 수 있게 하였음이 또한 분명하다. 세균인 대장균에 속하는 자주색 선은 값의 느린 증가를 나타내며 500k 판독값까지 관련된 것으로서의 유의성 수준을 넘지 못하는데, 이는 대장균 및 다른 미생물들이 오염 또는 공생 미생물임을 나타낸다.
실시예 3
대상체 S11로부터 얻은 혈장의 생물학적 샘플로부터의 핵산을 시퀀싱하여, 대상체에서 특정 미생물에 대해 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수에 기초하여 특정 미생물에 맵핑되는 비교된 서열 판독값을 발견할 확률이 본 발명에 따라 계산되게 하였다. 결과는 도 2에 제시되어 있다.
도 1과 유사하게, 도 2는 단일 세균, 여기서는 클레브시엘라 뉴모니아에(녹색)가 질병 상태와 관련될, 즉, 감염의 원인 물질일 확률의 빠른 증가를 도시한다. 인간 피부에 살고 있는 세균인 큐티박테리움 아크네스(Cutibacterium acnes)가 검출되지만, 이 세균이 감염의 원인 물질이 될 관련성/확률은 0임을 유의한다. 이는 의도된 바와 같은 방법이 공생 종을 걸러냄을 나타낸다. 대조적으로, 대장균의 관련성은 350k 판독값의 시간 프레임에 걸쳐 유의성 임계값까지 증가한다. 관련된 것으로 보이지 않지만, 이는 환자가 대장균에 의해 유발된 2차 감염을 발생시킬 위험이 있음을 나타낼 수 있다.
이는 방법이 현재의 "종점 기반" 검사가 제공할 수 없는 정보를 생성함을 나타낸다. 따라서, 이 방법은 실제로 임상적으로 관련되기 전에 임상의에게 감염에 대해 행동을 취하도록 지시하는 데이터를 제공한다. 본원에 기술된 방법의 또 다른 이점은 다수의 미생물에 의해 유발된 감염을 검출하고 어떤 미생물이 주요 원인 물질(들)인지를 추가로 세분화하는 능력이다.
실시예 4
대상체 S60으로부터 얻은 혈장의 생물학적 샘플로부터의 핵산을 시퀀싱하여, 대상체에서 특정 미생물에 대해 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수에 기초하여 특정 미생물에 맵핑되는 비교된 서열 판독값을 발견할 확률이 본 발명에 따라 계산되게 하였다. 결과는 도 3에 제시되어 있다.
도 3에 명확하게 나타낸 바와 같이, 주요 감염원은 박테로이데스 프라길리스(B. Fragilis)인데, 이는 녹색 선이 방법 시작시 바로 관련성 임계값을 넘기 때문이다. 그러나, 일부 이벤트들(분석된 판독값들) 후에 2가지 다른 세균이 관련성 임계값을 크게 뛰어 넘으며, 이는, 대장균 및 스태필로코커스 아우레우스(S. aureus) 각각에 대해 주황색 선 및 자주색 선으로 표시되는, 그러한 2가지 세균이 대상체의 패혈증에 또한 기여하고 있음을 보여준다.
이 결과를 모든 3가지 세균에 대한 정례적인 검사에 기초한 기존 결과와 비교하면, 결과는 동일하게 보일 것이다. 각 미생물에는 거의 동일한 관련성이 할당되었을 것이다. 그러나, 본원에 기술된 방법을 이용하여, 주요 원인 물질이 명확하게 확인되었고, "시간당 이벤트"와 같은 특성 변수의 객관적인 사용을 통해 주요 원인 물질뿐만 아니라 감염에 기여하는 다른 미생물들이 확인되었다.
상기 도면에서의 축은 항상 식 1로 계산된 p-값의 로그 및 분석된 판독값들의 수이다. 물론, 이 축에 표시된 단위를 변경할 수 있다. 여기서, 새로운 단위를 통해, 판독값들의 독특한 순서화가 가능함이 오로지 필요하다. 이는, 예를 들어, 판독값들이 생성된 순서 또는 그러한 판독값들이 데이터베이스와 비교된 시간일 수 있다. 전술한 방법을 이용하여, 상기 언급된 특성 변수들, 예를 들어 특정 미생물 및 환자에 대한 "관련될 때까지의 이벤트 당 판독값들"이 계산될 수 있다. 이들 변수는 동일한 미생물로 고통받는 다양한 환자를 비교하는 데 사용될 수 있다. 또한, 주요 원인 물질은 그 동일한 환자에서 다양한 미생물의 변수들을 비교함으로써 확인될 수 있다.
실제 감염은, 예를 들어, "이벤트당 판독값들"에 의해 측정된 [x-y]와 같은 특정 간격의 범위인 것으로 가정된다. 이어서, 오염 물질과 공생체는 이 "감염 간격"의 경계를 벗어난 곳에서 나타날 것이다. 따라서, 그러한 감염 간격을 사용한 통계 분석은 감염을 확인하고 확인된 미생물들의 관련성을 평가하기에 충분하다. 또한, 감염의 중증도는 그러한 간격에 의해 평가된다. 이는 대기 시간 분석의 통계적 프레임워크를 사용하여 달성된다. 대부분의 경우, 대기 시간 분석은 지수 함수를 사용하여 수행된다. 따라서, "특성 감염 변수"를 설명하는 변수가 하기 지수 확률 변수(exponential random variable) 다음에 분포된다고 가정하고:
Figure 112020005082012-pct00002
특정 미생물에 대한 대기 시간이 500개 내지 1000개 판독값 사이라고 가정하면, λ = 1/500 내지 λ = 1/1000이다. P(500 < X <1000)의 확률에 관심이 있으므로 P (x < 1000) - P (x ≤ 500)를 계산한다. 이는 감염으로 고통받지 않을 확률을 설명한다. 이보다 빠른 간격을 원하므로 P(X ≤ 500)를 계산한다. 이제, 500번째 판독 값이 다시 미생물 판독값인 경우, 취할 행위는 P(X > 500) e -500λ
Figure 112020005082012-pct00003
0.36을 계산하는 것이다. 따라서, 이 특정 종에 대해 500 내지 1000의 간격이 주어지면 숙주의 500개 판독값 후에 미생물 판독값을 관찰할 가능성이 매우 높다. 그러나, 10개 판독값 직후에 제2 미생물 판독값을 관찰하는 경우, P(X > 10) = e -100λ
Figure 112020005082012-pct00004
0.98을 계산하는데, 이는 10개의 신호(비교된 판독값들) 후에 미생물 판독값을 관찰하였는 바 P(X ≤ 10)에 관심이 있고, 그에 따라 1 - P(X > 10) = 0.019이기 때문이다. 따라서, 10개의 신호 후에 미생물을 검출할 가능성은 거의 없으며, 따라서 10개의 신호 후에 미생물이 검출된 경우, 이를 임상의에게 보고할 필요가 있다.
두 접근법 모두, 일련의 이벤트가 주어진 경우 고정된 그러나 임의의 양의 이벤트와의 확률의 결합 및 결과적인 대기 시간 분석은 감염성 질병 진단법 또는 일반적 진단법에 기술되어 있지 않다. 일반적으로, 데이터 생성이 다양한 채널들 또는 블록들로 분리될 수 있는 경우, 검사를 각 개별 채널로 다시 병렬화(즉, 모든 채널을 개별적으로 검사하고 각 채널을 별도의 실험으로 취급함)하고, 그에 따라 결과까지의 시간을 최소화할 수 있다. 이는 또한 종점 검사를 사용하여 가능하지 않은데, 이는 본원에 기술된 방법이 종점 기반 검사와 대조적으로 더 높은 처리량으로 확장 가능함을 의미한다.
본 발명은 특히 다음을 제공한다:
1. 대상체에서 미생물의 존재를 결정하는 방법으로서,
(a) 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱하여 복수의 핵산 서열 판독값을 얻는 단계;
(b) 단계 (a)에서 얻은 서열 판독값들을, 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 비교된 서열 판독값이 하나 이상의 데이터베이스 내에 포함되는 종에 맵핑되는지의 여부를 결정하는 단계; 및
(c) 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계를 포함하는, 방법.
2. 대상체에서 미생물의 존재를 결정하는 방법으로서,
(a) 서열 판독값들을, 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 비교된 서열 판독값이 하나 이상의 데이터베이스 내에 포함되는 종에 맵핑되는지의 여부를 결정하는 단계로서, 서열 판독값들이 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱함으로써 얻어지는, 단계; 및
(b) 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계를 포함하는, 방법.
3. 항목 1 또는 항목 2에 있어서, 방법은, 대상체에서 특정 미생물에 맵핑되는 비교된 서열 판독값을 발견할 확률에 대한 유의성 점수를, 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수에 기초하여 계산하는 단계를 추가로 포함하는, 방법.
4. 항목 3에 있어서, 특정 미생물에 대한 점수가 임계 값을 충족하거나 초과할 때, 특정 미생물은 대상체에 존재하는 것으로 결정되는, 방법.
5. 항목 3에 있어서, 특정 미생물에 대한 점수가 임계 값을 충족하거나 초과할 때, 특정 미생물은 대상체에서 질병을 유발하는 것과 관련된 것으로 결정되는, 방법.
6. 항목 5에 있어서, 특정 미생물에 대한 점수가 소수의 서열 판독값으로 임계 값을 초과할 때, 미생물의 존재로 인한 질병은 중증인 것으로 간주되는, 방법.
7. 대상체에서 질병 상태의 존재를 결정하는 방법으로서,
(a) 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱하여 복수의 핵산 서열 판독값을 얻는 단계;
(b) 단계 (a)에서 얻은 서열 판독값들을, 동일한 종의 대조 대상체로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 비교된 서열 판독값이 대조 대상체에 맵핑되는지 여부를 결정하는 단계; 및
(c) 대조 대상체에 맵핑되는 및 맵핑되지 않는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계를 포함하는, 방법.
8. 항목 7에 있어서, 방법은, 대상체에서 대조 대상체에 맵핑되지 않는 비교된 서열 판독값을 발견할 확률에 대한 유의성 점수를, 대조 대상체에 맵핑되지 않는 비교된 서열 판독값들의 수 및 대조 대상체에 맵핑되는 비교된 서열 판독값들의 수에 기초하여 계산하는 단계를 추가로 포함하는, 방법.
9. 항목 8에 있어서, 점수가 임계 값을 충족하거나 초과할 때, 질병 상태는 대상체에 존재하는 것으로 결정되는, 방법.
10. 항목 7 내지 항목 9 중 어느 하나에 있어서, 질병 상태는 암인, 방법.
11. 항목 10에 있어서, 암은 유전자 이상에 의해 유발되는, 방법.
12. 항목 7 내지 항목 9 중 어느 하나에 있어서, 질병 상태는 미생물에 의해 유발된 감염인, 방법.
13. 항목 12에 있어서, 미생물은 바이러스, 세균, 진균 또는 기생충인, 방법.
14. 항목 1 내지 항목 13 중 어느 하나에 있어서, 생물학적 샘플은 전혈, 혈청, 혈장, 양수, 활액, 액, 조직 또는 세포 도말 표본, 조직 또는 세포 스왑, 소변, 조직, 가래, 대변, 위장 분비물, 림프액, 및 세척물로 이루어진 군으로부터 선택되는, 방법.
15. 항목 1 내지 항목 14 중 어느 하나에 있어서, 대상체는 척추 동물, 바람직하게는 포유 동물, 예를 들어, 인간, 개, 고양이, 돼지, 말, 소, 양, 염소, 마우스, 또는 래트인, 방법.
16. 항목 15에 있어서, 대상체는 인간인, 방법.
17. 항목 1 내지 항목 16 중 어느 하나에 있어서, 시퀀싱은 분자 고-처리량 서열 분석에 의해 수행되는, 방법.
18. 항목 1 내지 항목 17 중 어느 하나에 있어서, 특정 미생물 또는 질병 상태가 대상체에 존재하는 것으로 결정될 때, 방법은, 특정 미생물 또는 질병 상태에 의해 유발된 질병을 치료하는 것으로 알려진 약학적 활성 화합물을 대상체에게 투여하는 단계를 추가로 포함하는, 방법.
19. 대상체에서 미생물에 의해 유발된 감염성 질병을 진단하는 방법으로서,
(a) 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱하여 복수의 핵산 서열 판독값을 얻는 단계;
(b) 단계 (a)에서 얻은 서열 판독값들을, 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 비교된 서열 판독값이 하나 이상의 데이터베이스 내에 포함된 종에 맵핑되는지 여부를 결정하는 단계;
(c) 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계; 및
(d) 대상체에서 특정 미생물에 맵핑되는 비교된 서열 판독값을 발견할 확률에 대한 유의성 점수를, 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수에 기초하여 계산하는 단계를 포함하고,
특정 미생물에 대한 점수가 임계 값을 충족하거나 초과할 때, 특정 미생물은 감염성 질병을 유발하는 것으로 결정되는, 방법.
20. 프로세서에 의해 실행될 때 항목 1 내지 항목 19 중 어느 하나에 따른 방법을 수행하는 명령을 포함하는 프로그램 코드가 저장된 컴퓨터-판독 가능 저장 매체.
21. 항목 1 내지 항목 19 중 어느 하나에 따른 방법을 수행하도록 구성된 프로세서를 포함하는 컴퓨터 시스템.

Claims (19)

  1. 대상체에서 미생물의 존재를 결정하는 방법으로서,
    (a) 상기 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱(sequencing)하여 복수의 핵산 서열 판독값을 얻는 단계;
    (b) 단계 (a)에서 얻은 서열 판독값들을, 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 비교된 서열 판독값이 상기 하나 이상의 데이터베이스 내에 포함되는 종에 맵핑되는지의 여부를 결정하는 단계;
    (c) 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계를 포함하고; 및
    (d) 상기 방법은, 상기 대상체에서 상기 특정 미생물에 맵핑되는 비교된 서열 판독값을 발견할 확률에 대한 유의성 점수를, 상기 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 상기 종에 맵핑되는 비교된 서열 판독값들의 수에 기초하여 계산하는 단계를 포함하고, 상기 특정 미생물에 대한 유의성 점수가 임계 값을 충족하거나 초과할 때, 상기 특정 미생물은 상기 대상체에 존재하는 것으로 결정되는, 방법.
  2. 삭제
  3. 삭제
  4. 대상체에서 미생물의 존재를 결정하는 방법으로서,
    상기 대상체에서 특정 미생물에 맵핑되는 서열 판독값을 발견할 확률에 대한 유의성 점수를, 상기 특정 미생물에 맵핑되는 서열 판독값들의 수 및 종에 맵핑되는 서열 판독값들의 수에 기초하여 시간 경과에 따라 계산하는 단계를 포함하고, 상기 특정 미생물에 대한 유의성 점수가 임계 값을 충족하거나 초과할 때, 상기 특정 미생물은 상기 대상체에 존재하는 것으로 결정되는 단계를 포함하고,
    상기 특정 미생물에 맵핑되는 서열 판독값들 및 상기 종에 맵핑되는 서열 판독값들은, 서열 판독값들을 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여 비교된 서열 판독값이 상기 하나 이상의 데이터베이스 내에 포함된 종에 맵핑되는지 여부를 결정함으로써 얻어지고, 상기 서열 판독값들은 상기 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱함으로써 생성되는, 방법.
  5. 대상체에서 미생물의 존재를 결정하는 방법으로서,
    (a) 특정 미생물에 맵핑되는 서열 판독값들의 수 및 종에 맵핑되는 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계로서, 상기 서열 판독 값들은, 서열 판독 값들을 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여 서열 판독값이 상기 하나의 데이터베이스 내에 포함된 종에 맵핑되는지 여부를 결정함으로써 얻어지고, 상기 서열 판독값들은 상기 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱함으로써 생성되는, 단계; 및
    (b) 상기 대상체에서 상기 특정 미생물에 맵핑되는 서열 판독값을 발견할 확률에 대한 유의성 점수를, 상기 특정 미생물에 맵핑되는 서열 판독값들의 수 및 상기 종에 맵핑되는 서열 판독값들의 수에 기초하여 시간 경과에 따라 계산하는 단계를 포함하고, 상기 특정 미생물에 대한 유의성 점수가 임계 값을 충족하거나 초과할 때, 상기 특정 미생물은 상기 대상체에 존재하는 것으로 결정되는, 방법.
  6. 삭제
  7. 제1항, 제4항, 제5항 중 어느 한 항에 있어서, 상기 특정 미생물에 대한 유의성 점수가 임계 값을 충족하거나 초과할 때, 상기 특정 미생물은 상기 대상체에서 질병을 유발하는 것과 관련된 것으로 결정되는, 방법.
  8. 제7항에 있어서, 상기 특정 미생물에 대한 유의성 점수가 소수의 서열 판독값으로 임계 값을 초과할 때, 상기 미생물의 존재로 인한 상기 질병은 중증인 것으로 간주되는, 방법.
  9. 삭제
  10. 삭제
  11. 대상체에서 질병 상태의 존재를 결정하는 방법으로서,
    상기 대상체에서 대조 대상체에 맵핑되지 않는 서열 판독값을 발견할 확률에 대한 유의성 점수를, 상기 대조 대상체에 맵핑되지 않는 서열 판독값들의 수 및 상기 대조 대상체에 맵핑되는 서열 판독값들의 수에 기초하여 시간 경과에 따라 계산하는 단계를 포함하고, 특정 미생물에 대한 유의성 점수가 임계 값을 충족하거나 초과할 때, 상기 특정 미생물은 상기 대상체에 존재하는 것으로 결정되어 대상체에서 질병 상태의 존재를 결정하는 단계를 포함하고,
    상기 대조 대상체에 맵핑되는 서열 판독값들 및 상기 대조 대상체에 맵핑되지 않는 서열 판독값들은, 서열 판독값들을 동일한 종의 대조 대상체로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여 비교된 서열 판독값이 상기 대조 대상체에 맵핑되는지 여부를 결정함으로써 얻어지고, 상기 서열 판독값들은 상기 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱함으로써 생성되는, 방법.
  12. 삭제
  13. 제11항에 있어서, 상기 질병 상태가 암인, 방법.
  14. 제11항에 있어서, 상기 질병 상태가 미생물에 의해 유발된 감염인, 방법.
  15. 삭제
  16. 대상체에서 미생물에 의해 유발된 감염성 질병의 진단을 위한 정보를 제공하는 방법으로서,
    (a) 상기 대상체로부터 얻은 생물학적 샘플에 존재하는 핵산을 시퀀싱하여 복수의 핵산 서열 판독값을 얻는 단계;
    (b) 단계 (a)에서 얻은 서열 판독값들을, 동일한 종의 대조 대상체로부터의 유전자 정보 및 복수의 미생물로부터의 유전자 정보를 포함하는 하나 이상의 데이터베이스와 비교하여, 비교된 서열 판독값이 상기 하나 이상의 데이터베이스 내에 포함된 종에 맵핑되는지 여부를 결정하는 단계;
    (c) 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 종에 맵핑되는 비교된 서열 판독값들의 수를 시간 경과에 따라 결정하는 단계; 및
    (d) 상기 대상체에서 상기 특정 미생물에 맵핑되는 비교된 서열 판독값을 발견할 확률에 대한 유의성 점수를, 상기 특정 미생물에 맵핑되는 비교된 서열 판독값들의 수 및 상기 종에 맵핑되는 비교된 서열 판독값들의 수에 기초하여 시간 경과에 따라 계산하는 단계를 포함하고,
    상기 특정 미생물에 대한 유의성 점수가 임계 값을 충족하거나 초과할 때, 상기 특정 미생물은 상기 감염성 질병을 유발하는 것으로 결정되는, 방법.
  17. 프로세서에 의해 실행될 때 제1항, 제4항, 제5항, 제11항, 제16항 중 어느 한 항에 따른 방법을 수행하는 명령을 포함하는 프로그램 코드가 저장된 컴퓨터-판독 가능 저장 매체.
  18. 제1항, 제4항, 제5항, 제11항, 제16항 중 어느 한 항에 따른 방법을 수행하도록 구성된 프로세서를 포함하는 컴퓨터 시스템.
  19. 삭제
KR1020207001521A 2017-07-19 2018-07-18 질병 상태의 핵산-기반 실시간 결정을 위한 방법 및 장치 KR102521642B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17182104.4 2017-07-19
EP17182104.4A EP3431610A1 (en) 2017-07-19 2017-07-19 Methods and devices for nucleic acid-based real-time determination of disease states
PCT/EP2018/069493 WO2019016258A1 (en) 2017-07-19 2018-07-18 METHODS AND DEVICES FOR THE DETERMINATION OF REAL-TIME PATHOLOGICAL CONDITIONS BASED ON NUCLEIC ACIDS

Publications (2)

Publication Number Publication Date
KR20200029472A KR20200029472A (ko) 2020-03-18
KR102521642B1 true KR102521642B1 (ko) 2023-04-14

Family

ID=59387899

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207001521A KR102521642B1 (ko) 2017-07-19 2018-07-18 질병 상태의 핵산-기반 실시간 결정을 위한 방법 및 장치

Country Status (21)

Country Link
US (1) US11749378B2 (ko)
EP (2) EP3431610A1 (ko)
JP (1) JP7220711B2 (ko)
KR (1) KR102521642B1 (ko)
CN (1) CN110914451A (ko)
AU (1) AU2018303179A1 (ko)
CA (1) CA3069349A1 (ko)
DK (1) DK3655540T3 (ko)
ES (1) ES2927022T3 (ko)
HR (1) HRP20221116T1 (ko)
HU (1) HUE059856T2 (ko)
IL (1) IL272068A (ko)
LT (1) LT3655540T (ko)
NZ (1) NZ759783A (ko)
PL (1) PL3655540T3 (ko)
PT (1) PT3655540T (ko)
RS (1) RS63553B1 (ko)
RU (1) RU2763969C2 (ko)
SG (1) SG11202000365QA (ko)
SI (1) SI3655540T1 (ko)
WO (1) WO2019016258A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3431610A1 (en) 2017-07-19 2019-01-23 Noscendo GmbH Methods and devices for nucleic acid-based real-time determination of disease states
JP6590417B2 (ja) * 2017-11-21 2019-10-16 株式会社バイオーム 判別装置、判別方法、判別プログラム、判別システム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017042287A1 (en) * 2015-09-10 2017-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and device for nucleic acid based diagnostic approaches including the determination of a deviant condition, especially a health condition and/or a pathogenic condition of a sample

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0601302D0 (en) * 2006-01-23 2006-03-01 Semikhodskii Andrei Diagnostic methods and apparatus
GB2477439B (en) 2008-11-07 2012-02-15 Sequenta Inc Methods for correlating clonotypes with a disease in a patient
US9689044B2 (en) * 2011-01-26 2017-06-27 The Brigham And Women's Hospital, Inc. Assays and methods to sequence microbes directly from immune complexes
CN103403186B (zh) * 2011-01-26 2015-09-16 雷蒙特亚特特拉维夫大学有限公司 利用小rna测序消减和组装检测微生物感染
AU2012308092A1 (en) * 2011-09-13 2014-04-17 Commonwealth Scientific And Industrial Research Organisation Detection of viral infection
CN103305607B (zh) * 2013-05-22 2015-04-15 宁波大学 一种基于微生物群落变化的水产养殖病害预测方法
KR102649364B1 (ko) * 2013-11-07 2024-03-20 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 인간 마이크로바이옴 및 그의 성분의 분석을 위한 무세포 핵산
JP2017510871A (ja) * 2014-01-10 2017-04-13 セブン ブリッジズ ジェノミクス インコーポレイテッド リードマッピングにおける公知の対立遺伝子の使用のためのシステム及び方法
WO2016127944A1 (en) * 2015-02-10 2016-08-18 The Chinese University Of Hong Kong Detecting mutations for cancer screening and fetal analysis
US10724110B2 (en) 2015-09-01 2020-07-28 Seven Bridges Genomics Inc. Systems and methods for analyzing viral nucleic acids
CN106636423A (zh) * 2017-01-12 2017-05-10 杨俊杰 口腔菌群多样性的分析方法及与疾病相关的菌群标志物
EP3431610A1 (en) 2017-07-19 2019-01-23 Noscendo GmbH Methods and devices for nucleic acid-based real-time determination of disease states

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017042287A1 (en) * 2015-09-10 2017-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and device for nucleic acid based diagnostic approaches including the determination of a deviant condition, especially a health condition and/or a pathogenic condition of a sample

Also Published As

Publication number Publication date
HRP20221116T1 (hr) 2022-11-25
EP3655540B1 (en) 2022-08-31
EP3655540A1 (en) 2020-05-27
SG11202000365QA (en) 2020-02-27
IL272068A (en) 2020-03-31
EP3431610A1 (en) 2019-01-23
LT3655540T (lt) 2022-10-10
US20200176079A1 (en) 2020-06-04
WO2019016258A1 (en) 2019-01-24
KR20200029472A (ko) 2020-03-18
JP2020527364A (ja) 2020-09-10
NZ759783A (en) 2023-02-24
HUE059856T2 (hu) 2023-01-28
PT3655540T (pt) 2022-09-20
JP7220711B2 (ja) 2023-02-10
RU2020103728A (ru) 2021-08-19
RS63553B1 (sr) 2022-09-30
RU2020103728A3 (ko) 2021-08-19
ES2927022T3 (es) 2022-11-02
PL3655540T3 (pl) 2022-10-03
SI3655540T1 (sl) 2022-11-30
AU2018303179A1 (en) 2020-01-02
CA3069349A1 (en) 2019-01-24
DK3655540T3 (da) 2022-09-19
RU2763969C2 (ru) 2022-01-12
CN110914451A (zh) 2020-03-24
US11749378B2 (en) 2023-09-05

Similar Documents

Publication Publication Date Title
US20210381062A1 (en) Nasal epithelium gene expression signature and classifier for the prediction of lung cancer
JP6161607B2 (ja) サンプルにおける異なる異数性の有無を決定する方法
JP6755391B2 (ja) 胃癌の生物学的特性に基づく群区分および予後予測システム
JP6680680B2 (ja) 染色体変化の非侵襲性評価のための方法およびプロセス
US20200395097A1 (en) Pan-cancer model to predict the pd-l1 status of a cancer cell sample using rna expression data and other patient data
US20220119881A1 (en) Systems and methods for sample preparation, sample sequencing, and sequencing data bias correction and quality control
Alvarez-Breckenridge et al. Microenvironmental landscape of human melanoma brain metastases in response to immune checkpoint inhibition
JP2023054163A (ja) 融合遺伝子及び/又はエクソンスキッピングにより生ずる転写産物を検出するためのプローブ及び方法
CN112639983A (zh) 微卫星不稳定性检测
JP2024507536A (ja) 複数の臓器の移植レシピエントにおけるドナー由来無細胞dnaの検出方法
Ancarola et al. Extracellular non-coding RNA signatures of the metacestode stage of Echinococcus multilocularis
KR102521642B1 (ko) 질병 상태의 핵산-기반 실시간 결정을 위한 방법 및 장치
Skerget et al. Genomic basis of multiple myeloma subtypes from the MMRF CoMMpass study
Shohdy et al. Functional comparison of exome capture-based methods for transcriptomic profiling of formalin-fixed paraffin-embedded tumors
Zhang et al. Identification of five cytotoxicity-related genes involved in the progression of triple-negative breast cancer
KR102112951B1 (ko) 암의 진단을 위한 ngs 방법
Badia-Bringué et al. MicroRNAs modulate immunological and inflammatory responses in Holstein cattle naturally infected with Mycobacterium avium subsp. paratuberculosis
WO2015127103A1 (en) Methods for treating hepatocellular carcinoma
TWI839151B (zh) 核酸定序辨識偽陽性變異體之方法
Blacklock Application of Genomics to Identify Novel Prognostic Biomarkers for Cancers in Dogs
Hulstaert et al. Exploring the extracellular transcriptome in seminal plasma for non-invasive prostate cancer diagnosis
Fischer Characterizing Driver Gene Heterogeneity and Clonal Origin of Intraductal Papillary Mucinous Neoplasms of The Pancreas
Bhandari The Molecular Landmarks of Tumour Evolution and Hypoxia Across Cancers
CN114250297A (zh) 基因突变在结肠癌、肺癌易感基因变异检测中的应用
JP2024512372A (ja) オフターゲットポリヌクレオチド配列決定データに基づく腫瘍の存在の検出

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant