KR20230045097A - Methods for Selective Cell-Free Nucleic Acid Analysis - Google Patents

Methods for Selective Cell-Free Nucleic Acid Analysis Download PDF

Info

Publication number
KR20230045097A
KR20230045097A KR1020237009253A KR20237009253A KR20230045097A KR 20230045097 A KR20230045097 A KR 20230045097A KR 1020237009253 A KR1020237009253 A KR 1020237009253A KR 20237009253 A KR20237009253 A KR 20237009253A KR 20230045097 A KR20230045097 A KR 20230045097A
Authority
KR
South Korea
Prior art keywords
nucleic acid
acid molecules
sequencing
subset
cancer
Prior art date
Application number
KR1020237009253A
Other languages
Korean (ko)
Inventor
리 웡
말렉 파함
토비아스 위트코프
Original Assignee
아큐라젠 홀딩스 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아큐라젠 홀딩스 리미티드 filed Critical 아큐라젠 홀딩스 리미티드
Publication of KR20230045097A publication Critical patent/KR20230045097A/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/101DNA polymerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2522/00Reaction characterised by the use of non-enzymatic proteins
    • C12Q2522/10Nucleic acid binding proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/307Circular oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/101Sanger sequencing method, i.e. oligonucleotide sequencing using primer elongation and dideoxynucleotides as chain terminators
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법으로서, 상기 복수의 핵산 분자 또는 이의 유도체를 복수의 결합제와 접촉시켜, 상기 복수의 결합제에 커플링된 상기 복수의 핵산 분자의 제1 서브세트 및 상기 복수의 핵산 분자의 제2 서브세트를 제공하는 단계; 상기 복수의 결합제에 커플링된 상기 복수의 핵산 분자의 상기 제1 서브세트를, 상기 복수의 핵산 분자의 상기 제2 서브세트로부터 분리하는 단계; 상기 복수의 핵산 분자의 상기 제1 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자를 수득하는 단계; 및 상기 원형화된 핵산 분자 또는 이의 유도체를 확인하는 단계를 포함하는 방법이 본원에 제공된다.A method of processing a plurality of nucleic acid molecules derived from a cell-free biological sample by contacting the plurality of nucleic acid molecules or derivatives thereof with a plurality of binding agents, comprising: first sub-units of the plurality of nucleic acid molecules coupled to the plurality of binding agents; providing a set and a second subset of the plurality of nucleic acid molecules; separating the first subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents from the second subset of the plurality of nucleic acid molecules; circularizing nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules to obtain circularized nucleic acid molecules; and identifying the circularized nucleic acid molecule or derivative thereof.

Description

선택적 무세포 핵산 분석을 위한 방법Methods for Selective Cell-Free Nucleic Acid Analysis

상호 참조cross reference

본 특허 출원은 2020년 8월 19일에 출원된 미국 가출원 제63/067,800호를 우선권으로 주장하며, 상기 가출원은 그 전체가 본원에 참조로 인용된다.This patent application claims priority to U.S. Provisional Application No. 63/067,800, filed on August 19, 2020, which is hereby incorporated by reference in its entirety.

핵산 변이는 종종 전사 인자를 포함하지만 이로 제한되지 않는 핵산 결합 단백질과 같은 단백질 결합뿐만 아니라, 메틸화와 같은 핵산 변형의 차이를 포함한다. 이러한 변이는 때때로 질병 또는 질병 발병 위험과 관련이 있다. 따라서, 특정 단백질에 결합되거나 특정 변경을 갖는 핵산의 분석은 질병 진단 및 치료에 유용할 수 있다.Nucleic acid variations often include differences in protein binding, such as nucleic acid binding proteins, including but not limited to transcription factors, as well as nucleic acid modifications, such as methylation. These variations are sometimes associated with a disease or risk of developing a disease. Thus, analysis of nucleic acids that bind to specific proteins or have specific alterations can be useful for disease diagnosis and treatment.

개요outline

일 양상에서, 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법이 본원에 제공된다. 일부 경우에, 본원의 방법은 (a) 복수의 핵산 분자 또는 이의 유도체를 복수의 결합제와 접촉시켜, 복수의 결합제에 커플링된 복수의 핵산 분자의 제1 서브세트 및 복수의 핵산 분자의 제2 서브세트를 제공하는 단계; (b) 복수의 결합제에 커플링된 복수의 핵산 분자의 제1 서브세트를 복수의 핵산 분자의 제2 서브세트로부터 분리하는 단계; (c) (b) 이후에, 복수의 핵산 분자의 제1 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자를 수득하는 단계; 및 (d) 원형화된 핵산 분자 또는 이의 유도체를 확인하는 단계를 포함한다. 일부 경우에, 복수의 핵산 분자는 데옥시리보핵산(DNA) 분자 또는 리보핵산(RNA) 분자를 포함한다. 일부 경우에, 원형화는 핵산 분자의 5' 말단과 3' 말단을 서로 결찰시키는 것을 포함한다. 일부 경우에, 원형화는 어댑터를 핵산 분자의 3' 말단, 5' 말단, 또는 5' 말단과 3' 말단 둘 모두에 커플링시키는 것을 포함한다. 일부 경우에 방법은 원형화된 핵산 분자를 핵산 증폭시켜 원형화된 핵산 분자의 복수의 증폭 산물을 생성하는 단계를 추가로 포함하며, 여기서 (d)는 복수의 핵산 증폭 산물을 확인하는 것을 포함한다. 일부 경우에, 핵산 증폭은 가닥 치환 활성을 갖는 폴리머라제에 의해 수행된다. 일부 경우에, 핵산 증폭은 가닥 치환 활성을 갖지 않는 폴리머라제에 의해 수행된다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 무작위 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함한다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 하나 이상의 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함하고, 프라이머 각각은 서열 상보성을 통해 상이한 표적 서열에 특이적으로 혼성화한다. 일부 경우에, 결합제는 항체 또는 이의 단편을 포함한다. 일부 경우에, 항체 또는 이의 단편은 핵산 결합 단백질에 특이적으로 결합한다. 일부 경우에, 핵산 결합 단백질은 염색질 단백질이다. 일부 경우에, 핵산 결합 단백질은 히스톤이다. 일부 경우에, 핵산 결합 단백질은 메틸 CpG 결합 단백질이다. 일부 경우에, 핵산 결합 단백질은 전사 인자이다. 일부 경우에, 핵산 결합 단백질은 RNA 결합 단백질이다. 일부 경우에, 항체 또는 이의 단편은 핵산 서열에 특이적으로 결합한다. 일부 경우에, 핵산 서열은 메틸화된다. 일부 경우에, 결합제는 폴리펩타이드 또는 핵산을 포함한다. 일부 경우에, 폴리펩타이드는 스트렙타비딘을 포함한다. 일부 경우에 방법은 복수의 무세포 핵산 분자들의 각각의 무세포 핵산 분자의 크기를 결정하는 단계를 추가로 포함한다. 일부 경우에, (d)는 원형화된 핵산 분자 또는 이의 유도체를 시퀀싱하는 것을 포함한다. 일부 경우에, 시퀀싱은 합성에 의한 시퀀싱, 결찰에 의한 시퀀싱, 나노포어 시퀀싱(nanopore sequencing), 나노볼 시퀀싱(nanoball sequencing), 이온 검출, 혼성화에 의한 시퀀싱, 중합된 콜로니(polymerized colony)(POLONY) 시퀀싱, 나노그리드 롤링 서클 시퀀싱(nanogrid rolling circle sequencing)(ROLONY) 및 이온 토렌트 시퀀싱(ion torrent sequencing) 중 하나 이상으로부터 선택된 방법을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 75 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 체액을 포함한다. 일부 경우에, 체액은 소변, 타액, 혈액, 혈청, 혈장, 눈물, 가래, 뇌척수액, 활액, 점액, 담즙, 정액, 림프, 양수, 월경액, 또는 이들의 조합이다. 일부 경우에, (d)는 원형화된 핵산 분자 또는 이의 유도체를 시퀀싱하는 것을 포함한다. 일부 경우에 방법은 복수의 참조 서열에 대해 서열을 프로세싱하여 복수의 참조 서열의 적어도 한 서브세트에 상응하는 서열을 확인함으로써, 대상체가 질병을 갖거나 가질 위험이 있는지를 결정하는 단계를 추가로 포함한다. 일부 경우에, 질병은 암이다. 일부 경우에, 암은 결장암, 비소세포 폐암, 소세포 폐암, 유방암, 간세포 암종, 간암, 피부암, 악성 흑색종, 자궁내막암, 식도암, 위암, 난소암, 췌장암, 뇌암, 백혈병, 림프종 및 골수종으로 이루어진 군으로부터 선택된다. 일부 경우에 방법은 확인된 서열을 사용하여 대상체가 질병을 갖거나 가질 위험이 있음을 표시하는 전자 보고서를 산출하는 단계를 추가로 포함한다. 일부 경우에 방법은 확인된 서열을 사용하여 질병에 대해 대상체에게 치료적 개입을 제공하는 단계를 추가로 포함한다. 일부 경우에 방법은 확인된 서열을 사용하여 질병에 대해 대상체를 치료하는 단계를 추가로 포함한다. 일부 경우에, 대상체는 대상체에게 화학요법 또는 면역요법을 수행함으로써 치료된다. 일부 경우에 방법은 확인된 서열을 사용하여 대상체의 진행 또는 퇴행에 대해 대상체를 모니터링하는 단계를 추가로 포함한다. 일부 경우에, (c) 핵산 분자는 복수의 결합제들의 결합제에 커플링된다.In one aspect, provided herein is a method of processing a plurality of nucleic acid molecules derived from a cell-free biological sample. In some cases, the methods herein include (a) contacting a plurality of nucleic acid molecules or derivatives thereof with a plurality of binding agents to obtain a first subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents and a second subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents. providing a subset; (b) separating a first subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents from a second subset of the plurality of nucleic acid molecules; (c) after (b), circularizing the nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules to obtain circularized nucleic acid molecules; and (d) identifying the circularized nucleic acid molecule or derivative thereof. In some cases, the plurality of nucleic acid molecules comprises deoxyribonucleic acid (DNA) molecules or ribonucleic acid (RNA) molecules. In some cases, circularization involves ligating together the 5' and 3' ends of the nucleic acid molecule. In some cases, circularization includes coupling the adapter to the 3' end, the 5' end, or both the 5' and 3' ends of the nucleic acid molecule. In some cases the method further comprises nucleic acid amplifying the circularized nucleic acid molecule to generate a plurality of amplification products of the circularized nucleic acid molecule, where (d) comprises identifying the plurality of nucleic acid amplification products. . In some cases, nucleic acid amplification is performed by a polymerase having strand displacement activity. In some cases, nucleic acid amplification is performed by a polymerase that does not have strand displacement activity. In some cases, nucleic acid amplification involves contacting circularized nucleic acid molecules with an amplification reaction mixture that includes random primers. In some cases, nucleic acid amplification involves contacting a circularized nucleic acid molecule with an amplification reaction mixture comprising one or more primers, each of which through sequence complementarity specifically hybridizes to a different target sequence. In some cases, binding agents include antibodies or fragments thereof. In some cases, the antibody or fragment thereof specifically binds to a nucleic acid binding protein. In some cases, the nucleic acid binding protein is a chromatin protein. In some cases, the nucleic acid binding protein is a histone. In some cases, the nucleic acid binding protein is a methyl CpG binding protein. In some cases, the nucleic acid binding protein is a transcription factor. In some cases, the nucleic acid binding protein is an RNA binding protein. In some cases, an antibody or fragment thereof specifically binds to a nucleic acid sequence. In some cases, nucleic acid sequences are methylated. In some cases, binding agents include polypeptides or nucleic acids. In some cases, the polypeptide includes streptavidin. In some cases the method further comprises determining the size of each cell-free nucleic acid molecule of the plurality of cell-free nucleic acid molecules. In some cases, (d) includes sequencing the circularized nucleic acid molecule or derivative thereof. In some cases, sequencing is sequencing by synthesis, sequencing by ligation, nanopore sequencing, nanoball sequencing, ion detection, sequencing by hybridization, polymerized colony (POLONY) sequencing, nanogrid rolling circle sequencing (ROLONY) and ion torrent sequencing. In some cases, a cell-free biological sample contains less than 75 nanograms of nucleic acids. In some cases, cell-free biological samples include bodily fluids. In some cases, the bodily fluid is urine, saliva, blood, serum, plasma, tears, sputum, cerebrospinal fluid, synovial fluid, mucus, bile, semen, lymph, amniotic fluid, menstrual fluid, or combinations thereof. In some cases, (d) includes sequencing the circularized nucleic acid molecule or derivative thereof. In some cases the method further comprises processing the sequences against the plurality of reference sequences to identify sequences corresponding to at least a subset of the plurality of reference sequences, thereby determining whether the subject has or is at risk of having the disease. do. In some cases, the disease is cancer. In some cases, the cancer consists of colon cancer, non-small cell lung cancer, small cell lung cancer, breast cancer, hepatocellular carcinoma, liver cancer, skin cancer, malignant melanoma, endometrial cancer, esophageal cancer, gastric cancer, ovarian cancer, pancreatic cancer, brain cancer, leukemia, lymphoma, and myeloma. selected from the group. In some cases the method further comprises generating an electronic report indicating that the subject has or is at risk of having the disease using the identified sequence. In some cases, the method further comprises providing therapeutic intervention to a subject for a disease using the identified sequence. In some cases the method further comprises treating the subject for a disease using the identified sequence. In some cases, a subject is treated by subjecting the subject to chemotherapy or immunotherapy. In some cases the method further comprises monitoring the subject for progression or regression using the identified sequence. In some cases, (c) the nucleic acid molecule is coupled to a binding agent of a plurality of binding agents.

또 다른 양상에서, 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법으로서, (a) 복수의 핵산 분자들의 핵산 분자에 대한 메틸화 상태를 결정하는 단계; (b) 복수의 핵산 분자들의 핵산 분자에 대한 크기를 결정하는 단계; 및 (c) (i) 제1 데이터베이스에 대한 복수의 핵산 분자들의 핵산 분자에 대한 메틸화 상태, 및 (ii) 제2 데이터베이스에 대한 복수의 핵산 분자들의 핵산 분자에 대한 크기를 프로세싱하여, 적어도 한 질병과 메틸화 상태 및 크기의 연관성을 확인하는 단계를 포함하는 방법이 제공된다. 일부 경우에, 메틸화 상태를 결정하는 것은 복수의 핵산 분자들의 핵산 분자를 시퀀싱하는 것을 포함한다. 일부 경우에, 시퀀싱은 합성에 의한 시퀀싱, 결찰에 의한 시퀀싱, 나노포어 시퀀싱, 나노볼 시퀀싱, 이온 검출, 혼성화에 의한 시퀀싱, 중합된 콜로니(POLONY) 시퀀싱, 나노그리드 롤링 서클 시퀀싱(ROLONY) 및 이온 토렌트 시퀀싱 중 하나 이상으로부터 선택된 방법을 포함한다. 일부 경우에, 메틸화 상태를 결정하는 것은 핵산 분자를 메틸화된 핵산 또는 이의 유도체에 특이적으로 결합하는 결합제에 접촉시키는 것을 포함한다. 일부 경우에, 메틸화 상태를 결정하는 단계는 (a) 복수의 핵산 분자를 복수의 결합제와 접촉시켜, 복수의 결합제에 커플링된 복수의 핵산 분자의 제1 서브세트 및 복수의 핵산 분자의 제2 서브세트를 제공하는 단계; (b) 복수의 결합제에 커플링된 복수의 핵산 분자의 제1 서브세트를 복수의 핵산 분자의 제2 서브세트로부터 분리하는 단계; (c) (b) 이후에, 복수의 핵산 분자의 제1 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자를 수득하는 단계; 및 (d) 원형화된 핵산 분자 또는 이의 유도체를 확인하는 단계를 포함한다. 일부 경우에, 결합제는 항체 또는 이의 단편을 포함한다. 일부 경우에, 결합제는 폴리펩타이드 또는 핵산을 포함한다. 일부 경우에, 폴리펩타이드는 스트렙타비딘을 포함한다. 일부 경우에, 복수의 핵산 분자는 데옥시리보핵산(DNA) 분자 또는 리보핵산(RNA) 분자를 포함한다. 일부 경우에, 원형화는 핵산 분자의 5' 말단과 3' 말단을 서로 결찰시키는 것을 포함한다. 일부 경우에, 원형화는 어댑터를 핵산 분자의 3' 말단, 5' 말단, 또는 5' 말단과 3' 말단 둘 모두에 커플링시키는 것을 포함한다. 일부 경우에 방법은 원형화된 핵산 분자를 핵산 증폭시켜 원형화된 핵산 분자의 복수의 증폭 산물을 생성하는 단계를 추가로 포함하며, 여기서 (d)는 복수의 핵산 증폭 산물을 확인하는 것을 포함한다. 일부 경우에, 핵산 증폭은 가닥 치환 활성을 갖는 폴리머라제에 의해 수행된다. 일부 경우에, 핵산 증폭은 가닥 치환 활성을 갖지 않는 폴리머라제에 의해 수행된다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 무작위 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함한다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 하나 이상의 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함하고, 프라이머 각각은 서열 상보성을 통해 상이한 표적 서열에 특이적으로 혼성화한다. 일부 경우에, (d)는 원형화된 핵산 분자 또는 이의 유도체를 시퀀싱하는 것을 포함한다. 일부 경우에, 시퀀싱은 합성에 의한 시퀀싱, 결찰에 의한 시퀀싱, 나노포어 시퀀싱, 나노볼 시퀀싱, 이온 검출, 혼성화에 의한 시퀀싱, 중합된 콜로니(POLONY) 시퀀싱, 나노그리드 롤링 서클 시퀀싱(ROLONY) 및 이온 토렌트 시퀀싱 중 하나 이상으로부터 선택된 방법을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 75 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 체액을 포함한다. 일부 경우에, 체액은 소변, 타액, 혈액, 혈청, 혈장, 눈물, 가래, 뇌척수액, 활액, 점액, 담즙, 정액, 림프, 양수, 월경액, 또는 이들의 조합이다. 일부 경우에 방법은 복수의 참조 메틸화 상태에 대해 메틸화 상태를 프로세싱하고, 복수의 참조 크기에 대해 크기를 프로세싱하여 복수의 참조 메틸화 상태의 적어도 한 서브세트에 상응하는 메틸화 상태 및 참조 크기의 적어도 한 서브세트에 상응하는 크기를 확인함으로써, 대상체가 질병을 갖거나 가질 위험이 있는지를 결정하는 단계를 추가로 포함한다. 일부 경우에, 질병은 암이다. 일부 경우에, 암은 결장암, 비소세포 폐암, 소세포 폐암, 유방암, 간세포 암종, 간암, 피부암, 악성 흑색종, 자궁내막암, 식도암, 위암, 난소암, 췌장암, 뇌암, 백혈병, 림프종 및 골수종으로 이루어진 군으로부터 선택된다. 일부 경우에 방법은 확인된 메틸화 상태 및 크기를 이용하여 대상체가 질병을 갖거나 가질 위험이 있음을 표시하는 전자 보고서를 산출하는 단계를 추가로 포함한다. 일부 경우에 방법은 확인된 메틸화 상태 및 크기를 이용하여 질병에 대해 대상체에게 치료적 개입을 제공하는 단계를 추가로 포함한다. 일부 경우에 방법은 확인된 메틸화 상태 및 크기를 이용하여 질병에 대해 대상체를 치료하는 단계를 추가로 포함한다. 일부 경우에, 대상체는 대상체에게 화학요법 또는 면역요법을 수행함으로써 치료된다. 일부 경우에 방법은 확인된 메틸화 상태 및 크기를 이용하여 대상체의 진행 또는 퇴행에 대해 대상체를 모니터링하는 단계를 추가로 포함한다.In another aspect, a method of processing a plurality of nucleic acid molecules derived from a cell-free biological sample, comprising: (a) determining the methylation status of the nucleic acid molecules of the plurality of nucleic acid molecules; (b) determining the size of the nucleic acid molecules of the plurality of nucleic acid molecules; and (c) processing (i) the methylation status of the nucleic acid molecules of the plurality of nucleic acid molecules for the first database, and (ii) the size of the nucleic acid molecules of the plurality of nucleic acid molecules for the second database, at least one disease A method comprising ascertaining the association of hypermethylation status and size is provided. In some cases, determining methylation status includes sequencing nucleic acid molecules of a plurality of nucleic acid molecules. In some cases, sequencing includes sequencing by synthesis, sequencing by ligation, nanopore sequencing, nanoball sequencing, ion detection, sequencing by hybridization, polymerized colony (POLONY) sequencing, nanogrid rolling circle sequencing (ROLONY), and ion detection. including a method selected from one or more of torrent sequencing. In some cases, determining the methylation status involves contacting the nucleic acid molecule with a binding agent that specifically binds to the methylated nucleic acid or derivative thereof. In some cases, determining the methylation status comprises (a) contacting the plurality of nucleic acid molecules with a plurality of binding agents, wherein a first subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents and a second subset of the plurality of nucleic acid molecules are coupled to the plurality of binding agents. providing a subset; (b) separating a first subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents from a second subset of the plurality of nucleic acid molecules; (c) after (b), circularizing the nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules to obtain circularized nucleic acid molecules; and (d) identifying the circularized nucleic acid molecule or derivative thereof. In some cases, binding agents include antibodies or fragments thereof. In some cases, binding agents include polypeptides or nucleic acids. In some cases, the polypeptide includes streptavidin. In some cases, the plurality of nucleic acid molecules comprises deoxyribonucleic acid (DNA) molecules or ribonucleic acid (RNA) molecules. In some cases, circularization involves ligating together the 5' and 3' ends of the nucleic acid molecule. In some cases, circularization includes coupling the adapter to the 3' end, the 5' end, or both the 5' and 3' ends of the nucleic acid molecule. In some cases the method further comprises nucleic acid amplifying the circularized nucleic acid molecule to generate a plurality of amplification products of the circularized nucleic acid molecule, where (d) comprises identifying the plurality of nucleic acid amplification products. . In some cases, nucleic acid amplification is performed by a polymerase having strand displacement activity. In some cases, nucleic acid amplification is performed by a polymerase that does not have strand displacement activity. In some cases, nucleic acid amplification involves contacting circularized nucleic acid molecules with an amplification reaction mixture that includes random primers. In some cases, nucleic acid amplification involves contacting a circularized nucleic acid molecule with an amplification reaction mixture comprising one or more primers, each of which through sequence complementarity specifically hybridizes to a different target sequence. In some cases, (d) includes sequencing the circularized nucleic acid molecule or derivative thereof. In some cases, sequencing includes sequencing by synthesis, sequencing by ligation, nanopore sequencing, nanoball sequencing, ion detection, sequencing by hybridization, polymerized colony (POLONY) sequencing, nanogrid rolling circle sequencing (ROLONY), and ion detection. including a method selected from one or more of torrent sequencing. In some cases, a cell-free biological sample contains less than 75 nanograms of nucleic acids. In some cases, cell-free biological samples include bodily fluids. In some cases, the bodily fluid is urine, saliva, blood, serum, plasma, tears, sputum, cerebrospinal fluid, synovial fluid, mucus, bile, semen, lymph, amniotic fluid, menstrual fluid, or combinations thereof. In some cases, the method processes a methylation state relative to a plurality of reference methylation states and processes a size relative to a plurality of reference sizes to obtain a methylation state corresponding to at least a subset of the plurality of reference methylation states and at least one subset of the reference size. and determining whether the subject has or is at risk of having the disease by ascertaining a size corresponding to the set. In some cases, the disease is cancer. In some cases, the cancer consists of colon cancer, non-small cell lung cancer, small cell lung cancer, breast cancer, hepatocellular carcinoma, liver cancer, skin cancer, malignant melanoma, endometrial cancer, esophageal cancer, gastric cancer, ovarian cancer, pancreatic cancer, brain cancer, leukemia, lymphoma, and myeloma. selected from the group. In some cases, the method further includes generating an electronic report using the identified methylation status and size to indicate that the subject has or is at risk of having the disease. In some cases, the method further comprises providing therapeutic intervention to the subject for the disease using the identified methylation status and size. In some cases, the method further comprises treating the subject for a disease using the identified methylation status and size. In some cases, a subject is treated by subjecting the subject to chemotherapy or immunotherapy. In some cases, the method further comprises monitoring the subject for progression or regression using the identified methylation status and size.

또 다른 양상에서, 대상체의 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법으로서, (a) 복수의 핵산 분자 또는 이의 유도체를 복수의 결합제와 접촉시켜, 복수의 결합제에 커플링된 복수의 핵산 분자의 제1 서브세트 및 복수의 핵산 분자의 제2 서브세트를 제공하는 단계; (b) 복수의 결합제에 커플링된 상기 복수의 핵산 분자의 제1 서브세트를 복수의 핵산 분자의 제2 서브세트로부터 분리하는 단계; (c) (b) 이후에, 복수의 핵산 분자의 제1 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자의 제1 서브세트를 수득하는 단계; 및 (d) (b) 이후에, 복수의 핵산 분자의 제2 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자의 제2 서브세트를 수득하는 단계; (e) 원형화된 핵산 분자 또는 이의 유도체의 제1 서브세트를 시퀀싱하여 제1 크기를 수득하고, 원형화된 핵산 분자 또는 이의 유도체의 제2 서브세트를 시퀀싱하여 제2 크기를 수득하는 단계; (f) 제1 크기와 제2 크기를 비교하여 대상체의 질병 수준을 결정하는 단계를 포함하는 방법이 제공된다.In another aspect, a method of processing a plurality of nucleic acid molecules derived from a cell-free biological sample of a subject, comprising: (a) contacting a plurality of nucleic acid molecules or derivatives thereof with a plurality of binding agents, thereby providing a plurality of nucleic acid molecules coupled to the plurality of binding agents; providing a first subset of nucleic acid molecules and a second subset of a plurality of nucleic acid molecules; (b) separating the first subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents from the second subset of the plurality of nucleic acid molecules; (c) after (b), circularizing the nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules to obtain a first subset of circularized nucleic acid molecules; and (d) after (b), circularizing nucleic acid molecules derived from the second subset of the plurality of nucleic acid molecules to obtain a second subset of circularized nucleic acid molecules; (e) sequencing a first subset of circularized nucleic acid molecules or derivatives thereof to obtain a first size and sequencing a second subset of circularized nucleic acid molecules or derivatives thereof to obtain a second size; (f) comparing the first magnitude and the second magnitude to determine the level of disease in the subject.

또 다른 양상에서, 대상체의 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법으로서, (a) 복수의 핵산 분자 또는 이의 유도체를 복수의 결합제와 접촉시켜, 복수의 결합제에 커플링된 복수의 핵산 분자의 제1 서브세트 및 복수의 핵산 분자의 제2 서브세트를 제공하는 단계; (b) 복수의 결합제에 커플링된 복수의 핵산 분자의 제1 서브세트를 복수의 핵산 분자의 제2 서브세트로부터 분리하는 단계; (c) (b) 이후에, 복수의 핵산 분자의 제1 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자의 제1 서브세트를 수득하는 단계; 및 (d) (b) 이후에, 복수의 핵산 분자의 제2 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자의 제2 서브세트를 수득하는 단계; (e) 원형화된 핵산 분자 또는 이의 유도체의 제1 서브세트를 시퀀싱하여 제1 최종 서열을 수득하고, 원형화된 핵산 분자 또는 이의 유도체의 제2 서브세트를 시퀀싱하여 제2 최종 서열을 수득하는 단계; (f) 제1 최종 서열과 제2 최종 서열을 비교하여 대상체의 질병 수준을 결정하는 단계를 포함하는 방법이 제공된다.In another aspect, a method of processing a plurality of nucleic acid molecules derived from a cell-free biological sample of a subject, comprising: (a) contacting a plurality of nucleic acid molecules or derivatives thereof with a plurality of binding agents, thereby providing a plurality of nucleic acid molecules coupled to the plurality of binding agents; providing a first subset of nucleic acid molecules and a second subset of a plurality of nucleic acid molecules; (b) separating a first subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents from a second subset of the plurality of nucleic acid molecules; (c) after (b), circularizing the nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules to obtain a first subset of circularized nucleic acid molecules; and (d) after (b), circularizing the nucleic acid molecules derived from the second subset of the plurality of nucleic acid molecules to obtain a second subset of circularized nucleic acid molecules; (e) sequencing a first subset of circularized nucleic acid molecules or derivatives thereof to obtain a first final sequence and sequencing a second subset of circularized nucleic acid molecules or derivatives thereof to obtain a second final sequence; step; (f) comparing the first final sequence and the second final sequence to determine the level of disease in the subject.

참조에 의한 인용Citation by reference

본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 마치 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함된다고 구체적이고 개별적으로 표시된 것과 동일한 정도로 본 명세서에 참조로 포함된다.All publications, patents and patent applications mentioned herein are incorporated herein by reference to the same extent as if each individual publication, patent or patent application was specifically and individually indicated to be incorporated by reference.

본 발명의 신규한 특징은 첨부된 청구범위에서 구체적으로 제시된다. 본 발명의 특징 및 이점에 대한 더 나은 이해는 본 발명의 원리가 활용되는 예시적인 실시양태를 제시하는 다음의 상세한 설명, 및 첨부 도면(본원에서 또한 "도면" 및 "도")을 참고로 하여 얻어질 것이다.
도 1은 본 개시의 방법을 구현하도록 프로그래밍되거나 달리 구성될 수 있는 컴퓨터 시스템을 개략적으로 도시한다.
The novel features of the invention are pointed out with particularity in the appended claims. A better understanding of the features and advantages of the present invention may be obtained by reference to the following detailed description, which sets forth exemplary embodiments in which the principles of the present invention are utilized, and to the accompanying drawings (herein also referred to as "Figures" and "Figures"). will be obtained
1 schematically illustrates a computer system that may be programmed or otherwise configured to implement the methods of the present disclosure.

상세한 설명details

본 발명의 다양한 실시양태가 본 명세서에서 제시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 관련 기술 분야의 통상의 기술자에게 명백할 것이다. 본 발명을 벗어나지 않으면서 관련 기술 분야의 통상의 기술자에 의해 수많은 변형, 변경 및 대체가 이루어질 수 있다. 본 명세서에서 설명되는 본 발명의 실시양태에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다.Although various embodiments of the present invention have been shown and described herein, it will be apparent to those skilled in the art that these embodiments are provided by way of example only. Numerous variations, modifications and substitutions may be made by those skilled in the art without departing from the invention. It should be understood that various alternatives to the embodiments of the invention described herein may be used.

본원에서 사용되는 용어 "약" 또는 "대략"은 관련 기술 분야의 통상의 기술자에 의해 결정된 특정 값에 대해 허용 가능한 오차 범위 내를 의미하며, 이는 값이 어떻게 측정 또는 결정되는지에 따라, 즉, 측정 시스템의 한계에 따라 부분적으로 좌우될 수 있다. 예를 들어, "약"은 관련 기술 분야의 관행에 따라 1 또는 1 초과의 표준 편차 이내를 의미할 수 있다. 또 다른 예로서, "약"은 주어진 값의 20% 이하, 10% 이하, 5% 이하, 또는 1% 이하의 범위를 의미할 수 있다. 생물학적 시스템 또는 공정과 관련하여, 용어 "약"은 값의 5-배 이내 또는 2-배 이내와 같은 크기의 정도 이내를 의미할 수 있다. 특정 값이 출원 및 청구범위에 기재된 경우, 달리 명시되지 않는 한, 용어 "약"은 특정 값에 대해 허용되는 오차 범위 이내를 의미한다.As used herein, the term "about" or "approximately" means within an acceptable error range for a particular value determined by one of ordinary skill in the relevant art, depending on how the value is measured or determined, i.e., measured It may depend in part on the limitations of the system. For example, "about" can mean within 1 or more than 1 standard deviation, depending on the practice in the art. As another example, “about” can mean a range of 20% or less, 10% or less, 5% or less, or 1% or less of a given value. In the context of a biological system or process, the term "about" can mean within an order of magnitude, such as within 5-fold or within 2-fold of a value. Where specific values are recited in applications and claims, unless otherwise specified, the term "about" means within an acceptable error range for the specific value.

본원에서 사용되는 용어 "폴리뉴클레오타이드"은 일반적으로 데옥시리보뉴클레오타이드(DNA) 또는 리보뉴클레오타이드(RNA), 또는 이들의 유사체인 임의의 길이의 뉴클레오타이드의 폴리머 형태를 지칭한다. 폴리뉴클레오타이드는 핵산 분자일 수 있다. 폴리뉴클레오타이드(또는 올리고뉴클레오타이드)는 뉴클레오타이드 또는 핵산 서열을 가질 수 있다. 폴리뉴클레오타이드는 임의의 3차원 구조를 가질 수 있고, 임의의 기능을 수행할 수 있다. 하기는 폴리뉴클레오타이드의 비-제한적 예이다: 무세포 핵산, 무세포 DNA(cfDNA), 무세포 RNA(cfRNA), 순환 종양 DNA(ctDNA), 순환 종양 RNA(ctRNA), 유전자 또는 유전자 단편의 코딩 또는 비코딩 영역, 연결 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 메신저 RNA(mRNA), 운반 RNA(tRNA), 리보솜 RNA(rRNA), 짧은 간섭 RNA(siRNA), 짧은-헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오타이드, 분지형 폴리뉴클레오타이드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브, 및 프라이머. 폴리뉴클레오타이드는 메틸화된 뉴클레오타이드 및 뉴클레오타이드 유사체와 같은 하나 이상의 변형된 뉴클레오타이드를 포함할 수 있다. 존재하는 경우, 뉴클레오타이드 구조에 대한 변형은 폴리머의 조립 전 또는 후에 부여될 수 있다. 뉴클레오타이드의 서열은 비-뉴클레오타이드 구성요소에 의해 중단될 수 있다. 폴리뉴클레오타이드는, 예컨대 표지 구성요소와의 접합에 의해서, 중합 후에 추가 변형될 수 있다.As used herein, the term "polynucleotide" refers to a polymeric form of nucleotides of any length, generally deoxyribonucleotides (DNA) or ribonucleotides (RNA), or analogs thereof. A polynucleotide can be a nucleic acid molecule. A polynucleotide (or oligonucleotide) can have a sequence of nucleotides or nucleic acids. Polynucleotides can have any three-dimensional structure and can perform any function. The following are non-limiting examples of polynucleotides: cell-free nucleic acid, cell-free DNA (cfDNA), cell-free RNA (cfRNA), circulating tumor DNA (ctDNA), circulating tumor RNA (ctRNA), coding for a gene or gene fragment, or Non-coding regions, loci defined from linkage analysis (loci), exons, introns, messenger RNA (mRNA), transfer RNA (tRNA), ribosomal RNA (rRNA), short interfering RNA (siRNA), short-hairpin RNA (shRNA) ), micro-RNA (miRNA), ribozymes, cDNA, recombinant polynucleotides, branched polynucleotides, plasmids, vectors, isolated DNA of any sequence, isolated RNA of any sequence, nucleic acid probes, and primers. A polynucleotide may include one or more modified nucleotides, such as methylated nucleotides and nucleotide analogs. If present, modifications to the nucleotide structure can be imparted before or after assembly of the polymer. A sequence of nucleotides may be interrupted by non-nucleotide elements. The polynucleotide may be further modified after polymerization, such as by conjugation with a labeling component.

본원에서 사용되는 용어 "대상체"는 일반적으로 포유동물(예를 들어, 인간)과 같은 척추동물을 지칭한다. 포유동물은 뮤린, 유인원, 인간, 농장 동물, 스포츠 동물, 및 애완동물(예를 들어, 개 또는 고양이)을 포함하지만, 이로 제한되지 않는다. 생체내에서 수득되거나 시험관내에서 배양된 생물학적 개체의 조직, 세포, 및 이들의 자손이 또한 포함된다. 대상체는 환자일 수 있다. 대상체는 질병(예를 들어, 암)과 관련하여 증상이 있을 수 있다. 다르게는, 대상체는 질병과 관련하여 무증상일 수 있다.As used herein, the term "subject" generally refers to a vertebrate, such as a mammal (eg, a human). Mammals include, but are not limited to, murines, apes, humans, farm animals, sport animals, and pets (eg, dogs or cats). Tissues, cells, and progeny thereof of a biological subject obtained in vivo or cultured in vitro are also included. A subject may be a patient. A subject may have symptoms associated with a disease (eg, cancer). Alternatively, the subject may be asymptomatic in relation to the disease.

본원에서 사용되는 용어 "생물학적 샘플"은 일반적으로 포유동물(예를 들어, 인간)과 같은 대상체로부터 유래되거나 수득된 샘플을 지칭한다. 생물학적 샘플은 모발, 손톱, 피부, 땀, 눈물, 안액, 비강 면봉 또는 비인두 세척액, 가래, 인후 면봉, 타액, 점액, 혈액, 혈청, 혈장, 태반액, 양수, 제대혈, 강조액, 강액, 귀지, 오일, 선 분비물, 담즙, 림프, 고름, 미생물군, 태변, 모유, 골수, 뼈, CNS 조직, 뇌척수액, 지방 조직, 활액, 대변, 위액, 소변, 정액, 질 분비물, 위, 소장, 대장, 직장, 췌장, 간, 신장, 방광, 폐, 및 대상체로부터 유래되거나 대상체로부터 수득된 다른 조직 및 유체를 포함할 수 있지만, 이로 제한되지 않는다. 생물학적 샘플은 무세포(또는 무세포) 생물학적 샘플일 수 있다.As used herein, the term "biological sample" generally refers to a sample derived from or obtained from a subject, such as a mammal (eg, a human). Biological samples include hair, fingernails, skin, sweat, tears, eye fluid, nasal swabs or nasopharyngeal lavage fluid, sputum, throat swabs, saliva, mucus, blood, serum, plasma, placental fluid, amniotic fluid, umbilical cord blood, umbilical cord fluid, cerebral fluid, earwax. , oil, glandular secretion, bile, lymph, pus, microbiome, meconium, breast milk, bone marrow, bone, CNS tissue, cerebrospinal fluid, adipose tissue, synovial fluid, stool, gastric fluid, urine, semen, vaginal secretion, stomach, small intestine, large intestine, rectum, pancreas, liver, kidney, bladder, lung, and other tissues and fluids derived from or obtained from a subject. A biological sample may be a cell-free (or cell-free) biological sample.

본원에서 사용되는 용어 "무세포 생물학적 샘플"은 일반적으로 세포가 없는 대상체로부터 유래되거나 수득된 샘플을 지칭한다. 무세포 생물학적 샘플은 무세포 DNA, 무세포 RNA, 또는 무세포 폴리펩타이드(예를 들어, 단백질)와 같은 하나 이상의 무세포 분자를 포함할 수 있다. 무세포 생물학적 샘플은 혈액, 혈청, 혈장, 비강 면봉 또는 비인두 세척액, 타액, 소변, 위액, 눈물, 대변, 점액, 땀, 귀지, 오일, 선 분비물, 담즙, 림프, 뇌척수액, 조직, 정액, 질액, 종양 조직으로부터 유래된 간질액을 포함하는 간질액, 안액, 척수, 인후 면봉, 호흡, 모발, 손톱, 피부, 생검, 태반액, 양수, 제대혈, 강조액, 강액, 가래, 고름, 미생물총, 태변, 모유 및/또는 다른 배설물을 포함할 수 있지만, 이로 제한되지 않는다.As used herein, the term “cell-free biological sample” generally refers to a sample derived from or obtained from a cell-free subject. A cell-free biological sample may include one or more cell-free molecules, such as cell-free DNA, cell-free RNA, or cell-free polypeptides (eg, proteins). Cell-free biological samples include blood, serum, plasma, nasal swab or nasopharyngeal lavage fluid, saliva, urine, gastric fluid, tears, feces, mucus, sweat, ear wax, oil, glandular secretions, bile, lymph, cerebrospinal fluid, tissue, semen, and vaginal fluid. , interstitial fluid, including interstitial fluid derived from tumor tissue, eye fluid, spinal cord, throat swab, breath, hair, nails, skin, biopsy, placental fluid, amniotic fluid, umbilical cord blood, spleen fluid, sinus fluid, sputum, pus, microflora, It may include, but is not limited to, meconium, human milk and/or other feces.

본원에서 사용되는 용어 "결합제"는 일반적으로 핵산에 결합하는 물질을 지칭한다. 결합제는 항체 또는 이의 단편, 폴리펩타이드, 스트렙타비딘, 핵산, DNA 프로브, 또는 RNA 프로브 중 하나 이상을 포함할 수 있지만, 이로 제한되지 않는다.As used herein, the term "binding agent" generally refers to a substance that binds to a nucleic acid. Binding agents may include, but are not limited to, one or more of antibodies or fragments thereof, polypeptides, streptavidin, nucleic acids, DNA probes, or RNA probes.

본원에서 사용되는 용어 "조기 암" 및 "비-전이성 암"은 일반적으로 대상체에서 전이되지 않을 수 있는 암을 지칭한다(즉, 암이 이의 초기 위치를 떠나 다른 위치로 확산되지 않음). 조기 암은 대상체에서 전이될 수 있다. 다르게는, 조기 암은 대상체에서 전이되지 않을 수 있다. 정확한 병기는 암의 유형에 따라 달라질 수 있다.As used herein, the terms “early cancer” and “non-metastatic cancer” generally refer to a cancer that may not metastasize in a subject (ie, the cancer has not left its initial location and spread to other locations). Early cancers can metastasize in a subject. Alternatively, an early cancer may not metastasize in a subject. The exact stage may depend on the type of cancer.

본원에서 사용되는 용어 "종양 부담" 및 "종양 부하"는 일반적으로 대상체의 신체에서 종양의 크기 또는 암의 양을 지칭한다.As used herein, the terms "tumor burden" and "tumor burden" generally refer to the size of a tumor or amount of cancer in a subject's body.

용어 "적어도", "초과", 또는 "이상"이 2 개 이상의 일련의 수치 값에서 첫 번째 수치 값 앞에 올 때마다, 용어 "적어도", "초과" 또는 "이상"은 일련의 수치 값에서 각각의 수치 값에 적용된다. 예를 들어, 1, 2, 또는 3 이상은 1 이상, 2 이상, 또는 3 이상이다.Whenever the terms "at least", "more than", or "at least" precede the first numerical value in a sequence of two or more numerical values, the terms "at least", "greater than", or "greater than" occur respectively in the sequence of numerical values. is applied to the numerical value of For example, 1, 2, or 3 or more is 1 or more, 2 or more, or 3 or more.

용어 "이내", "미만", 또는 "이하"가 2 개 이상의 일련의 수치 값에서 첫 번째 수치 값 앞에 올 때마다, 용어 "이내"는, "미만" 또는 "이하"는 일련의 수치 값에서 각각의 수치 값에 적용된다. 예를 들어, 3, 2, 또는 1 이하는 3 이하, 2 이하, 또는 1 이하이다.Whenever the terms "within", "less than", or "less than" precede the first numerical value in a sequence of two or more numerical values, the term "within", "less than" or "less than" occurs in the sequence of numerical values. Applies to each numerical value. For example, 3, 2, or 1 or less is 3 or less, 2 or less, or 1 or less.

무세포 생물학적 샘플에서 핵산의 적어도 한 서브세트의 선택을 포함하는 무세포 생물학적 샘플로부터 핵산을 분석하기 위한 방법, 시스템, 및 조성물이 본원에 제공된다. 이러한 일부 방법은 항체 또는 이의 단편과 같은 결합제를 사용하여 핵산, 예컨대, 메틸화된 핵산 또는 단백질, 예컨대, 핵산 결합 단백질(예를 들어, 전사 인자)에 결합된 핵산의 면역침전 및 서열 또는 크기 분석과 같은 추가 분석을 위해 결합된 핵산의 단리를 포함할 수 있다.Provided herein are methods, systems, and compositions for analyzing nucleic acids from a cell-free biological sample comprising a selection of at least a subset of the nucleic acids in the cell-free biological sample. Some of these methods include immunoprecipitation and sequence or size analysis of nucleic acids bound to nucleic acids, such as methylated nucleic acids or proteins, such as nucleic acid binding proteins (eg, transcription factors), using binding agents such as antibodies or fragments thereof; isolation of bound nucleic acids for further analysis, such as

선택적 핵산 분석을 위한 방법Methods for Selective Nucleic Acid Analysis

선택적 핵산 분석을 위한 방법이 본원에 제공된다. 일부 경우에, 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법은 복수의 핵산 분자를 항체 또는 이의 단편과 같은 복수의 결합제와 접촉시키는 것을 포함한다. 이는 복수의 항체 또는 이의 단편에 커플링된 복수의 핵산 분자의 제1 서브세트 및 복수의 핵산 분자의 제2 서브세트를 제공한다. 다음으로, 복수의 항체 또는 이의 단편에 커플링된 복수의 핵산 분자의 제1 서브세트는 복수의 핵산 분자의 제2 서브세트로부터 분리될 수 있다. 다음으로, 복수의 핵산 분자의 제1 서브세트로부터 유래된 핵산 분자는 원형화되어 원형화된 핵산 분자를 수득할 수 있다. 이후 방법은 원형화된 핵산 분자 또는 이의 유도체를 확인하는 것을 수반한다. Methods for selective nucleic acid analysis are provided herein. In some cases, a method of processing a plurality of nucleic acid molecules derived from a cell-free biological sample includes contacting the plurality of nucleic acid molecules with a plurality of binding agents, such as antibodies or fragments thereof. It provides a first subset of the plurality of nucleic acid molecules and a second subset of the plurality of nucleic acid molecules coupled to the plurality of antibodies or fragments thereof. Next, a first subset of the plurality of nucleic acid molecules coupled to the plurality of antibodies or fragments thereof can be separated from a second subset of the plurality of nucleic acid molecules. Next, the nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules can be circularized to obtain circularized nucleic acid molecules. The method then involves identifying the circularized nucleic acid molecule or derivative thereof.

본원에 제공된 선택적 핵산 분석을 위한 방법의 양상에서, 일부 경우에, 복수의 핵산 분자는 데옥시리보핵산(DNA) 분자를 포함한다. 일부 경우에, 복수의 핵산 분자는 리보핵산(RNA) 분자를 포함한다. 일부 경우에, 복수의 핵산 분자는 RNA 분자와 DNA 분자의 혼합물을 포함한다.In aspects of the methods for selective nucleic acid analysis provided herein, in some cases, the plurality of nucleic acid molecules comprises deoxyribonucleic acid (DNA) molecules. In some cases, the plurality of nucleic acid molecules includes ribonucleic acid (RNA) molecules. In some cases, the plurality of nucleic acid molecules includes a mixture of RNA molecules and DNA molecules.

본원에 제공된 선택적 핵산 분석을 위한 방법의 양상에서, 일부 경우에, 원형화는 핵산 분자의 5' 말단과 3' 말단을 서로 결찰시키는 것을 포함한다. 일부 경우에, 원형화는 어댑터를 핵산 분자의 3' 말단, 5' 말단, 또는 5' 말단과 3' 말단 둘 모두에 커플링시키는 것을 포함한다.In aspects of the methods for selective nucleic acid analysis provided herein, in some cases, circularization includes ligating together the 5' and 3' ends of the nucleic acid molecule. In some cases, circularization involves coupling the adapter to the 3' end, the 5' end, or both the 5' and 3' ends of the nucleic acid molecule.

본원에 제공된 선택적 핵산 분석을 위한 방법의 양상에서, 일부 경우에 방법은 원형화된 핵산 분자를 핵산 증폭시켜 원형화된 핵산 분자의 복수의 증폭 산물을 생성하는 단계를 추가로 포함하며, 여기서 확인 단계는 복수의 핵산 증폭 산물을 확인하는 것을 포함한다. 일부 경우에, 핵산 증폭은 가닥 치환 활성을 갖는 폴리머라제에 의해 수행된다. 일부 경우에, 핵산 증폭은 가닥 치환 활성을 갖지 않는 폴리머라제에 의해 수행된다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 무작위 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함한다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 하나 이상의 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함하고, 프라이머 각각은 서열 상보성을 통해 상이한 표적 서열에 특이적으로 혼성화한다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 하나 이상의 무작위 프라이머를 포함하는 증폭 혼합물에 접촉시키는 것을 포함한다.In aspects of the methods for selective nucleic acid analysis provided herein, in some cases the method further comprises nucleic acid amplifying the circularized nucleic acid molecule to generate a plurality of amplification products of the circularized nucleic acid molecule, wherein the identification step includes identifying a plurality of nucleic acid amplification products. In some cases, nucleic acid amplification is performed by a polymerase having strand displacement activity. In some cases, nucleic acid amplification is performed by a polymerase that does not have strand displacement activity. In some cases, nucleic acid amplification involves contacting circularized nucleic acid molecules with an amplification reaction mixture comprising random primers. In some cases, nucleic acid amplification involves contacting a circularized nucleic acid molecule with an amplification reaction mixture comprising one or more primers, each of which through sequence complementarity specifically hybridizes to a different target sequence. In some cases, nucleic acid amplification involves contacting circularized nucleic acid molecules with an amplification mixture comprising one or more random primers.

본원에 제공된 선택적 핵산 분석을 위한 방법의 양상에서, 일부 경우에, 결합제, 예컨대, 항체 또는 이의 단편은 핵산에 특이적으로 결합한다. 일부 경우에, 항체 또는 이의 단편은 핵산 결합 단백질에 특이적으로 결합한다. 일부 경우에, 핵산 결합 단백질은 염색질 단백질이다. 일부 경우에, 핵산 결합 단백질은 히스톤이다. 일부 경우에, 핵산 결합 단백질은 메틸 CpG 결합 단백질이다. 일부 경우에, 핵산 결합 단백질은 전사 인자이다. 일부 경우에, 핵산 결합 단백질은 폴리머라제이다. 일부 경우에, 핵산 결합 단백질은 뉴클레아제이다. 일부 경우에, 핵산 결합 단백질은 징크 핑거 모티프, 헬릭스-턴-헬릭스 모티프, 또는 류신 지퍼 모티프를 포함한다. 일부 경우에, 핵산 결합 단백질은 RNA 결합 단백질이다. 일부 경우에, 핵산 결합 단백질은 스플라이싱 단백질 또는 RNA 수송 단백질이다. 일부 경우에, 항체 또는 이의 단편은 핵산 서열에 특이적으로 결합한다. 일부 경우에, 항체 또는 이의 단편은 메틸화된 핵산 서열에 특이적으로 결합한다. 일부 경우에, 항체 또는 이의 단편은 인산화된 핵산 서열에 특이적으로 결합한다. 일부 경우에, 항체 또는 이의 단편은 아세틸화된 핵산 서열에 특이적으로 결합한다. 일부 경우에, 핵산 분자는 복수의 항체 또는 이의 단편의 항체 또는 이의 단편에 커플링된다.In aspects of the methods for selective nucleic acid analysis provided herein, in some cases, a binding agent, such as an antibody or fragment thereof, specifically binds a nucleic acid. In some cases, the antibody or fragment thereof specifically binds to a nucleic acid binding protein. In some cases, the nucleic acid binding protein is a chromatin protein. In some cases, the nucleic acid binding protein is a histone. In some cases, the nucleic acid binding protein is a methyl CpG binding protein. In some cases, the nucleic acid binding protein is a transcription factor. In some cases, the nucleic acid binding protein is a polymerase. In some cases, the nucleic acid binding protein is a nuclease. In some cases, the nucleic acid binding protein includes a zinc finger motif, a helix-turn-helix motif, or a leucine zipper motif. In some cases, the nucleic acid binding protein is an RNA binding protein. In some cases, the nucleic acid binding protein is a splicing protein or RNA transport protein. In some cases, an antibody or fragment thereof specifically binds to a nucleic acid sequence. In some cases, an antibody or fragment thereof specifically binds to a methylated nucleic acid sequence. In some cases, an antibody or fragment thereof specifically binds to a phosphorylated nucleic acid sequence. In some cases, an antibody or fragment thereof specifically binds to an acetylated nucleic acid sequence. In some cases, a nucleic acid molecule is coupled to an antibody or fragment thereof of a plurality of antibodies or fragments thereof.

본원에 제공된 선택적 핵산 분석을 위한 방법의 양상에서, 일부 경우에 방법은 복수의 무세포 핵산 분자들의 각각의 무세포 핵산 분자의 크기를 결정하는 단계를 추가로 포함한다. 일부 경우에, 각각의 무세포 핵산 분자의 크기를 결정하는 것은 시퀀싱, 전기영동, 또는 이들의 조합을 포함한다.In aspects of the methods for selective nucleic acid analysis provided herein, in some cases the methods further include determining the size of each cell-free nucleic acid molecule of the plurality of cell-free nucleic acid molecules. In some cases, determining the size of each cell-free nucleic acid molecule includes sequencing, electrophoresis, or a combination thereof.

본원에 제공된 선택적 핵산 분석을 위한 방법의 양상에서, 일부 경우에, 원형화된 핵산을 확인하는 것은 원형화된 핵산 분자 또는 이의 유도체를 시퀀싱하는 것을 포함한다. 일부 경우에, 시퀀싱은 합성에 의한 시퀀싱, 결찰에 의한 시퀀싱, 나노포어 시퀀싱, 나노볼 시퀀싱, 이온 검출, 혼성화에 의한 시퀀싱, 중합된 콜로니(POLONY) 시퀀싱, 나노그리드 롤링 서클 시퀀싱(ROLONY) 및 이온 토렌트 시퀀싱 중 하나 이상으로부터 선택된 방법을 포함한다.In aspects of the methods for selective nucleic acid analysis provided herein, in some cases, identifying the circularized nucleic acid comprises sequencing the circularized nucleic acid molecule or derivative thereof. In some cases, sequencing is sequencing by synthesis, sequencing by ligation, nanopore sequencing, nanoball sequencing, ion detection, sequencing by hybridization, polymerized colony (POLONY) sequencing, nanogrid rolling circle sequencing (ROLONY), and ion detection. including a method selected from one or more of torrent sequencing.

본원에 제공된 선택적 핵산 분석을 위한 방법의 양상에서, 일부 경우에, 무세포 생물학적 샘플은 100 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 90 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 80 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 75 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 70 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 60 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 50 나노그램 미만의 핵산을 포함한다.In aspects of the methods for selective nucleic acid analysis provided herein, in some cases, a cell-free biological sample comprises less than 100 nanograms of nucleic acid. In some cases, a cell-free biological sample contains less than 90 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 80 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 75 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 70 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 60 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 50 nanograms of nucleic acid.

본원에 제공된 선택적 핵산 분석을 위한 방법의 양상에서, 일부 경우에, 무세포 생물학적 샘플은 체액을 포함한다. 일부 경우에, 체액은 소변, 타액, 혈액, 혈청, 혈장, 눈물, 가래, 뇌척수액, 활액, 점액, 담즙, 정액, 림프, 양수, 월경액, 또는 이들의 조합이다.In aspects of the methods for selective nucleic acid analysis provided herein, in some cases, a cell-free biological sample comprises a bodily fluid. In some cases, the bodily fluid is urine, saliva, blood, serum, plasma, tears, sputum, cerebrospinal fluid, synovial fluid, mucus, bile, semen, lymph, amniotic fluid, menstrual fluid, or combinations thereof.

대상체가 질병을 갖거나 가질 위험이 있는지 여부를 결정하기 위한 방법Methods for determining whether a subject has or is at risk of having a disease

본원에서 선택적 핵산 분석을 포함하는 대상체가 질병을 갖거나 가질 위험이 있는지 여부를 결정하는 방법이 본원에 제공된다. 일부 경우에, 이러한 일부 방법은 복수의 핵산 분자를 복수의 결합제, 예컨대, 항체 또는 이의 단편과 접촉시켜, 복수의 항체 또는 이의 단편에 커플링된 복수의 핵산 분자의 제1 서브세트 및 복수의 핵산 분자의 제2 서브세트를 제공하는 것을 포함한다. 다음으로, 일부 경우에 방법은 복수의 항체 또는 이의 단편에 커플링된 복수의 핵산 분자의 제1 서브세트를 복수의 핵산 분자의 제2 서브세트로부터 분리하는 것을 포함한다. 다음으로 방법은 복수의 핵산 분자의 제1 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자를 수득하는 것을 포함한다. 이후 방법은 원형화된 핵산 분자 또는 이의 유도체의 서열을 확인하고, 복수의 참조 서열에 대해 서열을 프로세싱하여, 복수의 참조 서열의 적어도 한 서브세트에 상응하는 서열을 확인함으로써, 대상체가 질병을 갖거나 가질 위험이 있는지를 결정하는 것을 포함한다. 일부 경우에, 복수의 핵산 분자는 데옥시리보핵산(DNA) 분자 또는 리보핵산(RNA) 분자를 포함한다. 일부 경우에, 핵산 분자는 복수의 항체 또는 이의 단편의 항체 또는 이의 단편에 커플링된다.Provided herein are methods of determining whether a subject has or is at risk of having a disease, comprising selective nucleic acid analysis. In some cases, some such methods contact a plurality of nucleic acid molecules with a plurality of binding agents, such as antibodies or fragments thereof, to form a first subset of the plurality of nucleic acid molecules coupled to the plurality of antibodies or fragments thereof and the plurality of nucleic acids. and providing a second subset of molecules. Next, in some cases the method comprises separating a first subset of the plurality of nucleic acid molecules coupled to the plurality of antibodies or fragments thereof from a second subset of the plurality of nucleic acid molecules. The method then includes circularizing nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules to obtain circularized nucleic acid molecules. The method then identifies the sequence of the circularized nucleic acid molecule or derivative thereof, processes the sequence against a plurality of reference sequences, and identifies sequences corresponding to at least a subset of the plurality of reference sequences, so that the subject has the disease. This includes determining whether or not there is a risk of In some cases, the plurality of nucleic acid molecules comprises deoxyribonucleic acid (DNA) molecules or ribonucleic acid (RNA) molecules. In some cases, a nucleic acid molecule is coupled to an antibody or fragment thereof of a plurality of antibodies or fragments thereof.

본원에 제공된 선택적 핵산 분석을 위한 방법의 양상에서, 일부 경우에, 원형화는 핵산 분자의 5' 말단과 3' 말단을 서로 결찰시키는 것을 포함한다. 일부 경우에, 원형화는 어댑터를 핵산 분자의 3' 말단, 5' 말단, 또는 5' 말단과 3' 말단 둘 모두에 커플링시키는 것을 포함한다.In aspects of the methods for selective nucleic acid analysis provided herein, in some cases, circularization includes ligating together the 5' and 3' ends of the nucleic acid molecule. In some cases, circularization includes coupling the adapter to the 3' end, the 5' end, or both the 5' and 3' ends of the nucleic acid molecule.

본원에 제공된 진단 방법의 양상에서, 일부 경우에 방법은 원형화된 핵산 분자를 핵산 증폭시켜 원형화된 핵산 분자의 복수의 증폭 산물을 생성하는 단계를 추가로 포함하며, 여기서 확인 단계는 복수의 핵산 증폭 산물을 확인하는 것을 포함한다. 일부 경우에, 핵산 증폭은 가닥 치환 활성을 갖는 폴리머라제에 의해 수행된다. 일부 경우에, 핵산 증폭은 가닥 치환 활성을 갖지 않는 폴리머라제에 의해 수행된다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 무작위 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함한다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 하나 이상의 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함하고, 프라이머 각각은 서열 상보성을 통해 상이한 표적 서열에 특이적으로 혼성화한다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 하나 이상의 무작위 프라이머를 포함하는 증폭 혼합물에 접촉시키는 것을 포함한다.In aspects of the diagnostic methods provided herein, in some cases the method further comprises nucleic acid amplifying the circularized nucleic acid molecule to generate a plurality of amplification products of the circularized nucleic acid molecule, wherein the identifying step comprises a plurality of nucleic acid molecules. This includes identifying the amplification product. In some cases, nucleic acid amplification is performed by a polymerase having strand displacement activity. In some cases, nucleic acid amplification is performed by a polymerase that does not have strand displacement activity. In some cases, nucleic acid amplification involves contacting circularized nucleic acid molecules with an amplification reaction mixture comprising random primers. In some cases, nucleic acid amplification involves contacting a circularized nucleic acid molecule with an amplification reaction mixture comprising one or more primers, each of which through sequence complementarity specifically hybridizes to a different target sequence. In some cases, nucleic acid amplification involves contacting circularized nucleic acid molecules with an amplification mixture comprising one or more random primers.

본원에 제공된 진단 방법의 양상에서, 일부 경우에, 결합제, 예컨대, 항체 또는 이의 단편은 핵산에 특이적으로 결합한다. 일부 경우에, 항체 또는 이의 단편은 핵산 결합 단백질에 특이적으로 결합한다. 일부 경우에, 핵산 결합 단백질은 염색질 단백질이다. 일부 경우에, 핵산 결합 단백질은 히스톤이다. 일부 경우에, 핵산 결합 단백질은 메틸 CpG 결합 단백질이다. 일부 경우에, 핵산 결합 단백질은 전사 인자이다. 일부 경우에, 핵산 결합 단백질은 폴리머라제이다. 일부 경우에, 핵산 결합 단백질은 뉴클레아제이다. 일부 경우에, 핵산 결합 단백질은 징크 핑거 모티프, 헬릭스-턴-헬릭스 모티프, 또는 류신 지퍼 모티프를 포함한다. 일부 경우에, 핵산 결합 단백질은 RNA 결합 단백질이다. 일부 경우에, 핵산 결합 단백질은 스플라이싱 단백질 또는 RNA 수송 단백질이다. 일부 경우에, 항체 또는 이의 단편은 핵산 서열에 특이적으로 결합한다. 일부 경우에, 항체 또는 이의 단편은 메틸화된 핵산 서열에 특이적으로 결합한다. 일부 경우에, 항체 또는 이의 단편은 인산화된 핵산 서열에 특이적으로 결합한다. 일부 경우에, 항체 또는 이의 단편은 아세틸화된 핵산 서열에 특이적으로 결합한다. 일부 경우에, 핵산 분자는 복수의 항체 또는 이의 단편의 항체 또는 이의 단편에 커플링된다.In aspects of the diagnostic methods provided herein, in some cases, a binding agent, such as an antibody or fragment thereof, specifically binds a nucleic acid. In some cases, the antibody or fragment thereof specifically binds to a nucleic acid binding protein. In some cases, the nucleic acid binding protein is a chromatin protein. In some cases, the nucleic acid binding protein is a histone. In some cases, the nucleic acid binding protein is a methyl CpG binding protein. In some cases, the nucleic acid binding protein is a transcription factor. In some cases, the nucleic acid binding protein is a polymerase. In some cases, the nucleic acid binding protein is a nuclease. In some cases, the nucleic acid binding protein includes a zinc finger motif, a helix-turn-helix motif, or a leucine zipper motif. In some cases, the nucleic acid binding protein is an RNA binding protein. In some cases, the nucleic acid binding protein is a splicing protein or RNA transport protein. In some cases, an antibody or fragment thereof specifically binds to a nucleic acid sequence. In some cases, an antibody or fragment thereof specifically binds to a methylated nucleic acid sequence. In some cases, an antibody or fragment thereof specifically binds to a phosphorylated nucleic acid sequence. In some cases, an antibody or fragment thereof specifically binds to an acetylated nucleic acid sequence. In some cases, a nucleic acid molecule is coupled to an antibody or fragment thereof of a plurality of antibodies or fragments thereof.

본원에 제공된 진단 방법의 양상에서, 일부 경우에 방법은 복수의 무세포 핵산 분자들의 각각의 무세포 핵산 분자의 크기를 결정하는 단계를 추가로 포함한다. 일부 경우에, 각각의 무세포 핵산 분자의 크기를 결정하는 것은 시퀀싱, 전기영동, 또는 이들의 조합을 포함한다.In aspects of the diagnostic methods provided herein, in some cases the method further comprises determining the size of each cell-free nucleic acid molecule of the plurality of cell-free nucleic acid molecules. In some cases, determining the size of each cell-free nucleic acid molecule includes sequencing, electrophoresis, or a combination thereof.

본원에 제공된 진단 방법의 양상에서, 일부 경우에, 원형화된 핵산을 확인하는 것은 원형화된 핵산 분자 또는 이의 유도체를 시퀀싱하는 것을 포함한다. 일부 경우에, 시퀀싱은 합성에 의한 시퀀싱, 결찰에 의한 시퀀싱, 나노포어 시퀀싱, 나노볼 시퀀싱, 이온 검출, 혼성화에 의한 시퀀싱, 중합된 콜로니(POLONY) 시퀀싱, 나노그리드 롤링 서클 시퀀싱(ROLONY) 및 이온 토렌트 시퀀싱 중 하나 이상으로부터 선택된 방법을 포함한다.In aspects of the diagnostic methods provided herein, in some cases, identifying the circularized nucleic acid comprises sequencing the circularized nucleic acid molecule or derivative thereof. In some cases, sequencing includes sequencing by synthesis, sequencing by ligation, nanopore sequencing, nanoball sequencing, ion detection, sequencing by hybridization, polymerized colony (POLONY) sequencing, nanogrid rolling circle sequencing (ROLONY), and ion detection. including a method selected from one or more of torrent sequencing.

본원에 제공된 진단 방법의 양상에서, 일부 경우에, 무세포 생물학적 샘플은 100 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 90 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 80 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 75 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 70 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 60 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 50 나노그램 미만의 핵산을 포함한다.In aspects of the diagnostic methods provided herein, in some cases, a cell-free biological sample comprises less than 100 nanograms of nucleic acid. In some cases, a cell-free biological sample contains less than 90 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 80 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 75 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 70 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 60 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 50 nanograms of nucleic acids.

본원에 제공된 진단 방법의 양상에서, 일부 경우에, 무세포 생물학적 샘플은 체액을 포함한다. 일부 경우에, 체액은 소변, 타액, 혈액, 혈청, 혈장, 눈물, 가래, 뇌척수액, 활액, 점액, 담즙, 정액, 림프, 양수, 월경액, 또는 이들의 조합이다.In aspects of the diagnostic methods provided herein, in some cases, a cell-free biological sample includes bodily fluid. In some cases, the bodily fluid is urine, saliva, blood, serum, plasma, tears, sputum, cerebrospinal fluid, synovial fluid, mucus, bile, semen, lymph, amniotic fluid, menstrual fluid, or combinations thereof.

본원에 제공된 진단 방법의 양상에서, 일부 경우에 질병은 암이다. 일부 경우에, 암은 결장암, 비소세포 폐암, 소세포 폐암, 유방암, 간세포 암종, 간암, 피부암, 악성 흑색종, 자궁내막암, 식도암, 위암, 난소암, 췌장암, 뇌암, 백혈병, 림프종 및 골수종으로 이루어진 군으로부터 선택된다. In aspects of the diagnostic methods provided herein, in some cases the disease is cancer. In some cases, the cancer consists of colon cancer, non-small cell lung cancer, small cell lung cancer, breast cancer, hepatocellular carcinoma, liver cancer, skin cancer, malignant melanoma, endometrial cancer, esophageal cancer, gastric cancer, ovarian cancer, pancreatic cancer, brain cancer, leukemia, lymphoma, and myeloma. selected from the group.

본원에 제공된 진단 방법의 양상에서, 일부 경우에 방법은 확인된 서열을 사용하여 대상체가 질병을 갖거나 가질 위험이 있음을 표시하는 전자 보고서를 산출하는 단계를 추가로 포함한다. 일부 경우에 방법은 확인된 서열을 사용하여 질병에 대해 대상체에게 치료적 개입을 제공하는 단계를 추가로 포함한다. 일부 경우에 방법은 확인된 서열을 사용하여 질병에 대해 대상체를 치료하는 단계를 추가로 포함한다.In aspects of the diagnostic methods provided herein, in some cases the method further comprises generating an electronic report indicating that the subject has or is at risk of having the disease using the identified sequence. In some cases, the method further comprises providing therapeutic intervention to a subject for a disease using the identified sequence. In some cases the method further comprises treating the subject for a disease using the identified sequence.

본원에 제공된 진단 방법의 양상에서, 일부 경우에, 대상체는 대상체에게 화학요법 또는 면역요법을 수행함으로써 치료된다.In aspects of the diagnostic methods provided herein, in some instances, a subject is treated by subjecting the subject to chemotherapy or immunotherapy.

본원에 제공된 진단 방법의 양상에서, 일부 경우에 방법은 확인된 서열을 사용하여 대상체의 진행 또는 퇴행에 대해 대상체를 모니터링하는 단계를 추가로 포함한다.In aspects of the diagnostic methods provided herein, in some cases the method further comprises monitoring the subject for progression or regression of the subject using the identified sequence.

본원에서 선택적 핵산 분석을 포함하는 대상체가 질병을 갖거나 가질 위험이 있는지 여부를 결정하는 방법이 본원에 추가로 제공된다. 일부 경우에 방법은 복수의 핵산 분자들의 핵산 분자에 대한 메틸화 상태를 결정하고, 복수의 핵산 분자들의 핵산 분자에 대한 크기를 결정하는 것을 포함한다. 이후 방법은 제1 데이터베이스에 대해 복수의 핵산 분자들의 핵산 분자에 대한 메틸화 상태를 프로세싱하고, 제2 데이터베이스에 대해 복수의 핵산 분자들의 핵산 분자에 대한 크기를 프로세싱하는 것을 포함한다. 다음으로 방법은 적어도 질병과 메틸화 상태 및 크기의 연관성을 확인함으로써 대상체가 질병을 갖거나 가질 위험이 있는지를 결정하는 것을 포함한다.Further provided herein are methods of determining whether a subject has or is at risk of having a disease comprising selective nucleic acid analysis herein. In some cases the method includes determining a methylation state for a nucleic acid molecule of a plurality of nucleic acid molecules and determining a size for a nucleic acid molecule of the plurality of nucleic acid molecules. The method then includes processing a methylation state for a nucleic acid molecule of a plurality of nucleic acid molecules against a first database, and processing a size for a nucleic acid molecule of a plurality of nucleic acid molecules against a second database. The method then includes determining whether the subject has or is at risk of having the disease, at least by ascertaining an association of methylation status and size with the disease.

본원에 제공된 진단 방법의 양상에서, 일부 경우에 질병은 암이다. 일부 경우에, 암은 결장암, 비소세포 폐암, 소세포 폐암, 유방암, 간세포 암종, 간암, 피부암, 악성 흑색종, 자궁내막암, 식도암, 위암, 난소암, 췌장암, 뇌암, 백혈병, 림프종 및 골수종으로 이루어진 군으로부터 선택된다. In aspects of the diagnostic methods provided herein, in some cases the disease is cancer. In some cases, the cancer consists of colon cancer, non-small cell lung cancer, small cell lung cancer, breast cancer, hepatocellular carcinoma, liver cancer, skin cancer, malignant melanoma, endometrial cancer, esophageal cancer, gastric cancer, ovarian cancer, pancreatic cancer, brain cancer, leukemia, lymphoma, and myeloma. selected from the group.

본원에 제공된 진단 방법의 양상에서, 일부 경우에 방법은 확인된 메틸화 상태 및 크기를 이용하여 대상체가 질병을 갖거나 가질 위험이 있음을 표시하는 전자 보고서를 산출하는 것을 포함한다. 일부 경우에 방법은 확인된 메틸화 상태 및 크기를 이용하여 질병에 대해 대상체에게 치료적 개입을 제공하는 단계를 추가로 포함한다. 일부 경우에 방법은 확인된 메틸화 상태 및 크기를 이용하여 질병에 대해 대상체를 치료하는 단계를 추가로 포함한다. 일부 경우에, 대상체는 대상체에게 화학요법 또는 면역요법을 수행함으로써 치료된다. 일부 경우에 방법은 확인된 메틸화 상태 및 크기를 이용하여 대상체의 진행 또는 퇴행에 대해 대상체를 모니터링하는 단계를 추가로 포함한다.In aspects of the diagnostic methods provided herein, in some cases the methods include using the identified methylation status and size to generate an electronic report indicating that the subject has or is at risk of having the disease. In some cases, the method further comprises providing therapeutic intervention to the subject for the disease using the identified methylation status and size. In some cases, the method further comprises treating the subject for a disease using the identified methylation status and size. In some cases, a subject is treated by subjecting the subject to chemotherapy or immunotherapy. In some cases the method further comprises monitoring the subject for progression or regression using the identified methylation status and size.

메틸화 및 크기 핵산 분석 방법Methylation and Size Nucleic Acid Analysis Methods

메틸화 상태 및 크기를 이용한 핵산 분석 방법이 본원에 제공된다. 일부 경우에 방법은 복수의 핵산 분자들의 핵산 분자에 대한 메틸화 상태를 결정하고, 복수의 핵산 분자들의 핵산 분자에 대한 크기를 결정하는 것을 포함한다. 다음으로 방법은 제1 데이터베이스에 대해 복수의 핵산 분자들의 핵산 분자에 대한 메틸화 상태를 프로세싱하고, 제2 데이터베이스에 대해 복수의 핵산 분자들의 핵산 분자에 대한 크기를 프로세싱하는 것을 포함한다. 이후 방법은 적어도 한 질병과 핵산 분자의 메틸화 상태 및 핵산 분자의 크기의 연관성을 확인하는 것을 포함한다.Methods for analyzing nucleic acids using methylation status and size are provided herein. In some cases the method includes determining a methylation state for a nucleic acid molecule of a plurality of nucleic acid molecules and determining a size for a nucleic acid molecule of the plurality of nucleic acid molecules. Next, the method includes processing a methylation state for a nucleic acid molecule of a plurality of nucleic acid molecules against a first database, and processing a size for a nucleic acid molecule of a plurality of nucleic acid molecules against a second database. The method then includes ascertaining an association of the size of the nucleic acid molecule and the methylation status of the nucleic acid molecule with at least one disease.

본원의 핵산 분석 방법의 양상에서, 일부 경우에, 메틸화 상태를 결정하는 것은 복수의 핵산 분자들의 핵산 분자를 시퀀싱하는 것을 포함한다. 일부 경우에, 시퀀싱은 합성에 의한 시퀀싱, 결찰에 의한 시퀀싱, 나노포어 시퀀싱, 나노볼 시퀀싱, 이온 검출, 혼성화에 의한 시퀀싱, 중합된 콜로니(POLONY) 시퀀싱, 나노그리드 롤링 서클 시퀀싱(ROLONY) 및 이온 토렌트 시퀀싱 중 하나 이상으로부터 선택된 방법을 포함한다. 일부 경우에, 메틸화 상태를 결정하는 것은 바이설파이트 시퀀싱을 포함한다.In aspects of the nucleic acid analysis methods herein, in some cases, determining methylation status includes sequencing nucleic acid molecules of a plurality of nucleic acid molecules. In some cases, sequencing is sequencing by synthesis, sequencing by ligation, nanopore sequencing, nanoball sequencing, ion detection, sequencing by hybridization, polymerized colony (POLONY) sequencing, nanogrid rolling circle sequencing (ROLONY), and ion detection. including a method selected from one or more of torrent sequencing. In some cases, determining methylation status includes bisulfite sequencing.

본원의 핵산 분석 방법의 양상에서, 일부 경우에, 메틸화 상태를 결정하는 것은 핵산 분자를 메틸화된 핵산에 특이적으로 결합하는 항체 또는 이의 단편에 접촉시키는 것을 포함한다. 일부 경우에, 항체 또는 이의 단편은 메틸화된 핵산 결합 단백질 또는 이의 단편에 특이적으로 결합한다.In aspects of the nucleic acid analysis methods herein, in some cases, determining methylation status comprises contacting a nucleic acid molecule with an antibody or fragment thereof that specifically binds to a methylated nucleic acid. In some cases, the antibody or fragment thereof specifically binds to a methylated nucleic acid binding protein or fragment thereof.

본원의 핵산 분석 방법의 양상에서, 일부 경우에, 메틸화 상태를 결정하는 것은 복수의 핵산 분자를 복수의 항체 또는 이의 단편과 접촉시켜, 복수의 항체 또는 이의 단편에 커플링된 복수의 핵산 분자의 제1 서브세트 및 복수의 핵산 분자의 제2 서브세트를 제공하는 것을 포함한다. 다음으로 방법은 복수의 항체 또는 이의 단편에 커플링된 복수의 핵산 분자의 제1 서브세트를 복수의 핵산 분자의 제2 서브세트로부터 분리하는 것을 포함한다. 이후 방법은 복수의 핵산 분자의 제1 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자를 수득하고, 원형화된 핵산 분자 또는 이의 유도체를 확인하는 것을 포함한다.In aspects of the nucleic acid analysis methods herein, in some cases, determining methylation status comprises contacting a plurality of nucleic acid molecules with a plurality of antibodies or fragments thereof, thereby determining the number of nucleic acid molecules coupled to the plurality of antibodies or fragments thereof. providing one subset and a second subset of the plurality of nucleic acid molecules. The method then includes separating a first subset of the plurality of nucleic acid molecules coupled to the plurality of antibodies or fragments thereof from a second subset of the plurality of nucleic acid molecules. The method then includes circularizing nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules to obtain circularized nucleic acid molecules, and identifying circularized nucleic acid molecules or derivatives thereof.

본원의 핵산 분석 방법의 양상에서, 일부 경우에, 복수의 핵산 분자는 데옥시리보핵산(DNA) 분자를 포함한다. 일부 경우에, 복수의 핵산 분자는 리보핵산(RNA) 분자를 포함한다. 일부 경우에, 복수의 핵산 분자는 RNA 분자와 DNA 분자의 혼합물을 포함한다.In aspects of the nucleic acid analysis methods herein, in some cases, the plurality of nucleic acid molecules comprises deoxyribonucleic acid (DNA) molecules. In some cases, the plurality of nucleic acid molecules includes ribonucleic acid (RNA) molecules. In some cases, the plurality of nucleic acid molecules includes a mixture of RNA molecules and DNA molecules.

본원의 핵산 분석 방법의 양상에서, 일부 경우에, 원형화는 핵산 분자의 5' 말단과 3' 말단을 서로 결찰시키는 것을 포함한다. 일부 경우에, 원형화는 어댑터를 핵산 분자의 3' 말단, 5' 말단, 또는 5' 말단과 3' 말단 둘 모두에 커플링시키는 것을 포함한다.In aspects of the nucleic acid analysis methods herein, in some cases, circularization includes ligating together the 5' and 3' ends of the nucleic acid molecule. In some cases, circularization includes coupling the adapter to the 3' end, the 5' end, or both the 5' and 3' ends of the nucleic acid molecule.

본원의 제공된 핵산 분석 방법의 양상에서, 일부 경우에 방법은 원형화된 핵산 분자를 핵산 증폭시켜 원형화된 핵산 분자의 복수의 증폭 산물을 생성하는 단계를 추가로 포함하며, 여기서 확인 단계는 복수의 핵산 증폭 산물을 확인하는 것을 포함한다. 일부 경우에, 핵산 증폭은 가닥 치환 활성을 갖는 폴리머라제에 의해 수행된다. 일부 경우에, 핵산 증폭은 가닥 치환 활성을 갖지 않는 폴리머라제에 의해 수행된다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 무작위 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함한다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 하나 이상의 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함하고, 프라이머 각각은 서열 상보성을 통해 상이한 표적 서열에 특이적으로 혼성화한다. 일부 경우에, 핵산 증폭은 원형화된 핵산 분자를 하나 이상의 무작위 프라이머를 포함하는 증폭 혼합물에 접촉시키는 것을 포함한다.In aspects of the nucleic acid analysis methods provided herein, in some cases the method further comprises nucleic acid amplifying the circularized nucleic acid molecule to generate a plurality of amplification products of the circularized nucleic acid molecule, wherein the identifying step comprises a plurality of It includes identifying the nucleic acid amplification product. In some cases, nucleic acid amplification is performed by a polymerase having strand displacement activity. In some cases, nucleic acid amplification is performed by a polymerase that does not have strand displacement activity. In some cases, nucleic acid amplification involves contacting circularized nucleic acid molecules with an amplification reaction mixture comprising random primers. In some cases, nucleic acid amplification involves contacting a circularized nucleic acid molecule with an amplification reaction mixture comprising one or more primers, each of which through sequence complementarity specifically hybridizes to a different target sequence. In some cases, nucleic acid amplification involves contacting circularized nucleic acid molecules with an amplification mixture comprising one or more random primers.

본원의 핵산 분석 방법의 양상에서, 일부 경우에, 항체 또는 이의 단편은 핵산에 특이적으로 결합한다. 일부 경우에, 항체 또는 이의 단편은 핵산 결합 단백질에 특이적으로 결합한다. 일부 경우에, 핵산 결합 단백질은 염색질 단백질이다. 일부 경우에, 핵산 결합 단백질은 히스톤이다. 일부 경우에, 핵산 결합 단백질은 메틸 CpG 결합 단백질이다. 일부 경우에, 핵산 결합 단백질은 전사 인자이다. 일부 경우에, 핵산 결합 단백질은 RNA 결합 단백질이다. 일부 경우에, 항체 또는 이의 단편은 핵산 서열에 특이적으로 결합한다. 일부 경우에, 항체 또는 이의 단편은 메틸화된 핵산 서열에 특이적으로 결합한다. 일부 경우에, 핵산 분자는 복수의 항체 또는 이의 단편의 항체 또는 이의 단편에 커플링된다.In aspects of the nucleic acid analysis methods herein, in some cases, an antibody or fragment thereof specifically binds to a nucleic acid. In some cases, the antibody or fragment thereof specifically binds to a nucleic acid binding protein. In some cases, the nucleic acid binding protein is a chromatin protein. In some cases, the nucleic acid binding protein is a histone. In some cases, the nucleic acid binding protein is a methyl CpG binding protein. In some cases, the nucleic acid binding protein is a transcription factor. In some cases, the nucleic acid binding protein is an RNA binding protein. In some cases, an antibody or fragment thereof specifically binds to a nucleic acid sequence. In some cases, an antibody or fragment thereof specifically binds to a methylated nucleic acid sequence. In some cases, a nucleic acid molecule is coupled to an antibody or fragment thereof of a plurality of antibodies or fragments thereof.

본원의 핵산 분석 방법의 양상에서, 일부 경우에 방법은 복수의 무세포 핵산 분자들의 각각의 무세포 핵산 분자의 크기를 결정하는 단계를 추가로 포함한다.In aspects of the nucleic acid analysis methods herein, in some cases the method further comprises determining the size of each cell-free nucleic acid molecule of the plurality of cell-free nucleic acid molecules.

본원의 핵산 분석 방법의 양상에서, 일부 경우에, 원형화된 핵산을 확인하는 것은 원형화된 핵산 분자 또는 이의 유도체를 시퀀싱하는 것을 포함한다. 일부 경우에, 시퀀싱은 합성에 의한 시퀀싱, 결찰에 의한 시퀀싱, 나노포어 시퀀싱, 나노볼 시퀀싱, 이온 검출, 혼성화에 의한 시퀀싱, 중합된 콜로니(POLONY) 시퀀싱, 나노그리드 롤링 서클 시퀀싱(ROLONY) 및 이온 토렌트 시퀀싱 중 하나 이상으로부터 선택된 방법을 포함한다.In aspects of the nucleic acid analysis methods herein, in some cases, identifying a circularized nucleic acid comprises sequencing the circularized nucleic acid molecule or derivative thereof. In some cases, sequencing is sequencing by synthesis, sequencing by ligation, nanopore sequencing, nanoball sequencing, ion detection, sequencing by hybridization, polymerized colony (POLONY) sequencing, nanogrid rolling circle sequencing (ROLONY), and ion detection. including a method selected from one or more of torrent sequencing.

본원의 핵산 분석 방법의 양상에서, 일부 경우에, 무세포 생물학적 샘플은 100 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 90 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 80 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 75 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 70 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 60 나노그램 미만의 핵산을 포함한다. 일부 경우에, 무세포 생물학적 샘플은 50 나노그램 미만의 핵산을 포함한다.In aspects of the nucleic acid analysis methods herein, in some cases, a cell-free biological sample comprises less than 100 nanograms of nucleic acid. In some cases, a cell-free biological sample contains less than 90 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 80 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 75 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 70 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 60 nanograms of nucleic acids. In some cases, a cell-free biological sample contains less than 50 nanograms of nucleic acids.

본원의 핵산 분석 방법의 양상에서, 일부 경우에, 무세포 생물학적 샘플은 체액을 포함한다. 일부 경우에, 체액은 소변, 타액, 혈액, 혈청, 혈장, 눈물, 가래, 뇌척수액, 활액, 점액, 담즙, 정액, 림프, 양수, 월경액, 또는 이들의 조합이다.In aspects of the nucleic acid analysis methods herein, in some cases, a cell-free biological sample comprises a bodily fluid. In some cases, the bodily fluid is urine, saliva, blood, serum, plasma, tears, sputum, cerebrospinal fluid, synovial fluid, mucus, bile, semen, lymph, amniotic fluid, menstrual fluid, or combinations thereof.

시스템 및 컴퓨터 보조 방법System and Computer Assisted Methods

본원에 제공된 선택적 핵산 분석 방법을 위한 시스템이 본원에 제공된다. 일부 경우에, 본원의 시스템은 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하기 위한 사용자 요청을 수신하도록 구성된 컴퓨터 및 복수의 핵산 분자를 복수의 결합제, 예컨대, 항체 또는 이의 단편과 접촉시켜 복수의 항체 또는 이의 단편에 커플링된 복수의 핵산 분자의 제1 서브세트 및 복수의 핵산 분자의 제2 서브세트를 수득하기 위한 프로세싱 유닛을 포함한다. 일부 경우에, 시스템은 복수의 항체 또는 이의 단편에 커플링된 복수의 핵산 분자의 제1 서브세트를 복수의 핵산 분자의 제2 서브세트로부터 분리하기 위한 단리 유닛을 추가로 포함한다. 일부 경우에, 시스템은 복수의 핵산 분자의 제1 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자를 수득하기 위한 원형화 유닛을 추가로 포함한다. 일부 경우에, 시스템은 원형화된 핵산 분자 또는 이의 유도체를 확인하기 위한 확인 유닛을 추가로 포함한다. 일부 경우에, 시스템은 환형화된 핵산 분자 또는 이의 유도체의 동일성을 포함하는 보고서를 수신자에게 보내는 보고서 생성기를 추가로 포함한다.Systems for the selective nucleic acid analysis methods provided herein are provided herein. In some cases, the systems herein contact a computer configured to receive a user request to process a plurality of nucleic acid molecules derived from a cell-free biological sample and a plurality of nucleic acid molecules by contacting a plurality of binding agents, such as antibodies or fragments thereof, with a plurality of nucleic acid molecules. A processing unit for obtaining a first subset of the plurality of nucleic acid molecules and a second subset of the plurality of nucleic acid molecules coupled to an antibody of or a fragment thereof. In some cases, the system further comprises an isolation unit for separating a first subset of the plurality of nucleic acid molecules coupled to the plurality of antibodies or fragments thereof from a second subset of the plurality of nucleic acid molecules. In some cases, the system further comprises a circularization unit for circularizing nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules to obtain circularized nucleic acid molecules. In some cases, the system further comprises an identification unit for identifying the circularized nucleic acid molecule or derivative thereof. In some cases, the system further comprises a report generator that sends a report containing the identity of the circularized nucleic acid molecule or derivative thereof to the recipient.

시스템에서 사용하기 위한 컴퓨터는 하나 이상의 프로세서를 포함할 수 있다. 프로세서는 하나 이상의 제어기, 계산 유닛, 및/또는 컴퓨터 시스템의 다른 유닛과 결합되거나, 요망에 따른 펌웨어에서 실행될 수 있다. 소프트웨어에서 실행되는 경우, 루틴(routine)이 임의의 컴퓨터 판독 가능 메모리에, 예컨대, RAM, ROM, 플래쉬 메모리, 자기 디스크, 레이저 디스크, 또는 다른 적합한 저장 매체에 저장될 수 있다. 마찬가지로, 이러한 소프트웨어는, 예를 들어, 통신 채널, 예컨대, 전화선, 인터넷, 무선 연결 등으로, 또는 전송 가능 매체, 예컨대, 컴퓨터 판독 가능 디스크, 플래쉬 드라이브 등을 통하는 것을 포함하는 임의의 공지된 전달 방법을 통해 컴퓨팅 장치로 전달될 수 있다. 다양한 단계들이 다양한 블록, 작업, 도구, 모듈 및 기술로서 실행될 수 있고, 이는 이어서 하드웨어, 펌웨어, 소프트웨어, 또는 하드웨어, 펌웨어, 및/또는 소프트웨어의 임의의 조합으로 실행될 수 있다. 하드웨어에서 실행되는 경우, 상기 블록, 작업, 기술 등의 일부 또는 전부가, 예를 들어, 사용자 집적 회로(IC), 주문형 집적 회로(ASIC), 필드 프로그램 가능 로직 어레이(FPGA), 프로그램 가능 로직 어레이(PLA) 등에서 실행될 수 있다. 클라이언트-서버, 관계형 데이터베이스 아키텍처가 시스템의 실시양태에서 사용될 수 있다. 클라이언트-서버 아키텍처는 네트워크 상의 각각의 컴퓨터 또는 프로세스가 클라이언트 또는 서버인 네트워크 아키텍처이다. 서버 컴퓨터는 전형적으로 디스크 드라이브(파일 서버), 프린터(인쇄 서버), 또는 네트워크 트래픽(네트워크 서버)을 관리하기 위한 전용의 강력한 컴퓨터이다. 클라이언트 컴퓨터는 사용자가 애플리케이션뿐만 아니라 본원에 개시된 바와 같은 예시적 출력 장치를 작동시키는 PC(퍼스널 컴퓨터) 또는 워크스테이션을 포함한다. 클라이언트 컴퓨터는 리소스, 예컨대, 파일, 장치, 및 심지어 프로세싱 파워를 위해 서버 컴퓨터에 의존한다. 일부 실시양태에서, 상기 서버 컴퓨터는 모든 데이터베이스 기능을 다룬다. 클라이언트 컴퓨터는 모든 프론트-엔드 데이터 관리를 다루는 소프트웨어를 가질 수 있고, 또한 사용자로부터 입력된 데이터를 수신할 수 있다.A computer for use in the system may include one or more processors. A processor may be combined with one or more controllers, computational units, and/or other units of a computer system, or may be implemented in firmware as desired. When executed in software, the routines may be stored in any computer readable memory, such as RAM, ROM, flash memory, magnetic disk, laser disk, or other suitable storage medium. Likewise, such software may be delivered by any known method of delivery including, for example, over a communication channel such as a telephone line, the Internet, a wireless connection, or the like, or via a transferable medium such as a computer readable disk, a flash drive, or the like. It can be transmitted to the computing device through. The various steps may be implemented as various blocks, tasks, tools, modules and techniques, which in turn may be implemented as hardware, firmware, software, or any combination of hardware, firmware, and/or software. When executed in hardware, some or all of the blocks, tasks, techniques, etc. may be, for example, user integrated circuits (ICs), application specific integrated circuits (ASICs), field programmable logic arrays (FPGAs), programmable logic arrays. (PLA), etc. A client-server, relational database architecture may be used in embodiments of the system. A client-server architecture is a network architecture in which each computer or process on the network is either a client or a server. Server computers are typically powerful computers dedicated to managing disk drives (file servers), printers (print servers), or network traffic (network servers). Client computers include PCs (personal computers) or workstations on which users run applications as well as exemplary output devices as disclosed herein. Client computers depend on server computers for resources, such as files, devices, and even processing power. In some embodiments, the server computer handles all database functions. The client computer may have software that handles all front-end data management, and may also receive input data from the user.

시스템은 샘플에 대해 검출 반응을 수행해 달라는 사용자 요청을 수신하도록 구성될 수 있다. 사용자 요청은 직접적이거나 간접적일 수 있다. 직접적인 요청의 예는 입력 장치, 예컨대, 키보드, 마우스, 또는 터치 스크린과 같은 입력 장치에 의해 전송된 것들을 포함한다. 간접적인 요청의 예는 통신 매체, 예컨대, 인터넷(유선 또는 무선)을 통한 전송을 포함한다.The system can be configured to receive a user request to perform a detection reaction on a sample. User requests can be direct or indirect. Examples of direct requests include those sent by an input device, such as a keyboard, mouse, or touch screen. Examples of indirect requests include transmission over a communication medium, such as the Internet (wired or wireless).

시스템은 사용자 요청에 대응하여 샘플 또는 이의 일부에 대해 핵산 증폭 반응을 수행하는 증폭 시스템을 추가로 포함할 수 있다. 폴리뉴클레오타이드(예를 들어, DNA 및/또는 RNA)를 증폭시키는 다양한 방법이 이용 가능하다. 증폭은 선형, 지수이거나, 또는 다-단계 증폭 공정에서 선형과 지수기 둘 모두를 포함할 수 있다. 증폭 방법은 온도 변화, 예컨대, 열 변성 단계를 수반할 수 있거나, 열 변성을 필요로 하지 않는 등온 공정일 수 있다. 적합한 증폭 공정의 비-제한적인 예는 본 개시의 임의의 다양한 양상에 대해서와 같이, 본원에 기재되어 있다. 일부 실시양태에서, 증폭은 롤링 서클 증폭(RCA)을 포함한다. 폴리뉴클레오타이드를 증폭시키기 위한 다양한 시스템이 이용 가능하며, 이는 수행되는 증폭 반응의 유형에 기초하여 달라질 수 있다. 예를 들어, 온도 변화의 사이클을 포함하는 증폭 반응의 경우, 증폭 시스템은 열순환기(thermocycler)를 포함할 수 있다. 증폭 시스템은 실시간 증폭 및 검출 기기, 예컨대, Applied Biosystems, Roche, 및 Stratagene에 의해 제조된 시스템을 포함할 수 있다. 일부 실시양태에서, 증폭 반응은 (i) 개별 폴리뉴클레오타이드를 원형화시켜 복수의 원형 폴리뉴클레오타이드를 형성하는 단계로서, 이들 각각은 5' 말단과 3' 말단 사이에 접합부를 가지는 단계; 및 (ii) 원형 폴리뉴클레오타이드를 증폭시키는 단계를 포함한다. 샘플, 폴리뉴클레오타이드, 프라이머, 폴리머라제, 및 다른 시약은, 예컨대, 임의의 다양한 양상에 대해, 본원에 기재된 것 중 어느 것일 수 있다. 원형화 공정(예를 들어, 어댑터 올리고뉴클레오타이드를 이용하고 이용하지 않는), 시약(예를 들어, 어댑터의 유형, 리가제의 사용), 반응 조건(예를 들어, 자가-연결을 선호하는), 선택적인 추가 공정(예를 들어, 후-반응 정제), 및 이에 의해 형성된 접합부의 비-제한적인 예가, 예컨대, 본 개시의 임의의 다양한 양상과 관련하여 본원에 제공되어 있다. 시스템은 임의의 상기 방법을 수행하도록 선택되고/거나 설계될 수 있다.The system may further include an amplification system that performs a nucleic acid amplification reaction on the sample or a portion thereof in response to a user request. A variety of methods are available for amplifying polynucleotides (eg, DNA and/or RNA). Amplification can be linear, exponential, or include both linear and exponential phases in a multi-step amplification process. The amplification method may involve a change in temperature, such as a heat denaturation step, or may be an isothermal process that does not require heat denaturation. Non-limiting examples of suitable amplification processes are described herein, as for any of the various aspects of the present disclosure. In some embodiments, amplification comprises rolling circle amplification (RCA). A variety of systems are available for amplifying polynucleotides, which may vary based on the type of amplification reaction being performed. For example, in the case of an amplification reaction involving cycles of temperature change, the amplification system may include a thermocycler. Amplification systems can include real-time amplification and detection instruments, such as systems manufactured by Applied Biosystems, Roche, and Stratagene. In some embodiments, the amplification reaction comprises (i) circularizing individual polynucleotides to form a plurality of circular polynucleotides, each having a junction between the 5' and 3' ends; and (ii) amplifying the circular polynucleotide. Samples, polynucleotides, primers, polymerases, and other reagents can be, eg, any of those described herein, for any of the various aspects. circularization process (e.g., with and without adapter oligonucleotides), reagents (e.g., type of adapter, use of ligase), reaction conditions (e.g., favoring self-ligation), Non-limiting examples of optional additional processes (eg, post-reaction purification), and junctions formed thereby, are provided herein, eg, in connection with any of the various aspects of the present disclosure. A system may be selected and/or designed to perform any of the above methods.

시스템은 증폭 시스템에 의해 증폭된 폴리뉴클레오타이드에 대한 시퀀싱 리드를 생성하고, 시퀀싱 리드와 참조 서열 간의 서열 차이를 확인하고, 상이한 접합부를 갖는 적어도 2 개의 원형 폴리뉴클레오타이드에 존재하는 서열 차이를 서열 변이로서 판정하는 시퀀싱 시스템을 추가로 포함할 수 있다. 시퀀싱 시스템 및 증폭 시스템은 동일하거나, 중복되는 장비를 포함할 수 있다. 예를 들어, 증폭 시스템과 시퀀싱 시스템 둘 모두는 동일한 열순환기를 이용할 수 있다. 시스템에서 사용하기 위한 다양한 시퀀싱 플랫폼이 이용 가능하며, 선택된 시퀀싱 방법에 기초하여 선택될 수 있다. 시퀀싱 방법의 예가 본원에 기재되어 있다. 증폭 및 시퀀싱은 액체 처리기(liquid handler)의 사용을 포함할 수 있다. 상업적으로 이용 가능한 몇 가지 액체 처리 시스템이 이들 공정의 자동화를 실행하기 위해 이용될 수 있다(예를 들어, 예시로서 Perkin-Elmer, Beckman Coulter, Caliper Life Sciences, Tecan, Eppendorf, Apricot Design, Velocity 11로부터의 액체 처리기 참조). 다양한 자동화된 시퀀싱 기기가 상업적으로 이용 가능하며, Life Technologies(SOLiD 플랫폼, 및 pH-기반 검출), Roche(454 플랫폼), 일루미나(예를 들어, 유세포 기반 시스템, 예컨대, 게놈 분석기 장치)에 의해 제조된 시퀀서를 포함한다. 2 개, 3 개, 4 개, 5 개 이상의 자동화된 장치 사이에서의 이송(예를 들어, 하나 이상의 액체 처리기 및 시퀀싱 장치 사이에서)은 수동이거나 자동일 수 있다.The system generates sequencing reads for polynucleotides amplified by the amplification system, identifies sequence differences between the sequencing reads and a reference sequence, and determines sequence differences present in at least two circular polynucleotides with different junctions as sequence variants. It may further include a sequencing system that does. The sequencing system and amplification system may include identical or overlapping equipment. For example, both an amplification system and a sequencing system can use the same thermocycler. A variety of sequencing platforms are available for use in the system and can be selected based on the sequencing method selected. Examples of sequencing methods are described herein. Amplification and sequencing may involve the use of a liquid handler. Several commercially available liquid handling systems can be used to implement the automation of these processes (eg from Perkin-Elmer, Beckman Coulter, Caliper Life Sciences, Tecan, Eppendorf, Apricot Design, Velocity 11 as examples). See Liquid Handler in ). A variety of automated sequencing instruments are commercially available and manufactured by Life Technologies (SOLiD platform, and pH-based detection), Roche (454 platform), Illumina (e.g., flow cytometry based systems such as genomic analyzer devices). contains a sequencer. Transfer between two, three, four, five or more automated devices (eg, between one or more liquid handling devices and a sequencing device) may be manual or automated.

시스템은 수신자에게 보고서를 보내는 보고서 생성기를 추가로 포함할 수 있으며, 여기서 보고서는 서열 변이의 검출 결과를 포함한다. 보고서는, 공정이 진행됨에 따라 주기적 업데이트와 함께, 예컨대, 시퀀싱 리드 동안 또는 시퀀싱 데이터가 분석되면서 실시간으로 생성될 수 있다. 또한, 또는 다르게는, 보고서는 분석의 종결 시에 생성될 수 있다. 보고서는 이러한 시퀀싱 시스템이 원형 핵산을 확인하는 단계를 완료할 때, 자동으로 생성될 수 있다. 일부 실시양태에서, 보고서는 사용자로부터의 지시에 대한 반응으로 생성된다. 핵산의 확인 결과 외에도, 보고서는 또한 확인된 핵산에 기초한 분석을 포함할 수 있다. 예를 들어, 하나 이상의 서열 변이가 특정한 오염물질 또는 표현형과 연관된 경우, 보고서는 이러한 연관성과 관련된 정보, 예컨대, 오염 물질 또는 표현형이 어떤 수준으로 존재할 가능성, 및 선택적으로 이러한 정보에 기초한 제안(예를 들어, 추가 시험, 모니터링, 또는 구제 조치)을 포함할 수 있다. 보고서는 임의의 다양한 형태를 취할 수 있다. 본 개시와 관련된 데이터는 수신 및/또는 수신자에 의한 검토를 위해 상기 네트워크 또는 접속(또는 비제한적으로 물리적 보고서, 예컨대, 프린트 출력물을 메일로 보내는 것을 포함하지만, 이로 제한되지 않는, 정보를 전송하기 위한 임의의 다른 적합한 수단)으로 전송될 수 있음이 구상된다. 수신자는 개인, 또는 전자 시스템(예를 들어, 하나 이상의 컴퓨터, 및/또는 하나 이상의 서버)일 수 있지만, 이로 제한되지 않는다.The system may further include a report generator that sends a report to a recipient, where the report includes detection results of the sequence variant. Reports can be generated in real time, eg, during sequencing reads or as sequencing data is analyzed, with periodic updates as the process progresses. Additionally, or alternatively, a report may be generated at the conclusion of the analysis. A report can be automatically generated when such a sequencing system completes the steps of identifying intact nucleic acids. In some embodiments, a report is generated in response to instructions from a user. In addition to the results of identification of the nucleic acids, the report may also include an analysis based on the identified nucleic acids. For example, if one or more sequence variants are associated with a particular contaminant or phenotype, the report may include information related to this association, such as the likelihood that the contaminant or phenotype is present at some level, and optionally suggestions based on such information (e.g. For example, additional testing, monitoring, or remedial action). Reports can take any of a variety of forms. Data related to this disclosure may be used to transmit information, including but not limited to, mailing a physical report, e.g., a printout, to the network or connection (or for review by a recipient) for receipt and/or review by the recipient. It is envisioned that it can be transmitted by any other suitable means). The recipient can be, but is not limited to, a person or an electronic system (eg, one or more computers, and/or one or more servers).

컴퓨터-실행 가능 코드를 포함하는 기계 판독 가능 매체는 유형의 저장 매체, 반송파(carrier wave) 매체 또는 물리적 전송 매체를 포함하지만, 이로 제한되지 않는 다수 형태를 취할 수 있다. 비-휘발성 저장 매체는, 예를 들어, 광학 또는 자기 디스크, 예컨대, 임의의 컴퓨터 내의 임의의 저장 장치 등을 포함하고, 예컨대, 데이터베이스 등을 실행하는 데 사용될 수 있다. 휘발성 저장 매체는 동적 메모리, 예컨대, 그러한 컴퓨터 플랫폼의 주 메모리를 포함한다. 유형의 전송 매체에는 동축 케이블; 컴퓨터 시스템 내의 버스를 포함하는 와이어를 포함한 구리 와이어 및 광섬유가 포함된다. 반송파 전송 매체는 전기 또는 전자기 신호, 또는 무선 주파수(RF) 및 적외선(IR) 데이터 통신 중에 생성되는 것과 같은 음향 또는 광파의 형태를 취할 수 있다. 따라서, 컴퓨터 판독 가능 매체의 일반적인 형태에는, 예를 들어, 플로피 디스크, 플렉시블 디스크, 하드 디스크, 자기 테이프, 임의의 기타 자기 매체, CD-ROM, DVD 또는 DVD-ROM, 임의의 기타 광학 매체, 펀치 카드 용지 테이프, 구멍 패턴이 있는 임의의 기타 물리적 저장 매체, RAM, ROM, PROM 및 EPROM, FLASH-EPROM, 임의의 기타 메모리 칩 또는 카트리지, 데이터 또는 명령을 전송하는 반송파, 이러한 반송파를 전송하는 케이블 또는 링크, 또는 컴퓨터가 프로그래밍 코드 및/또는 데이터를 읽을 수 있는 임의의 기타 매체가 포함된다. 이러한 형태의 컴퓨터 판독 가능 매체 중 다수는 실행을 위해 하나 이상의 명령의 하나 이상의 시퀀스를 프로세서에 전달하는 데 관여할 수 있다.Machine-readable media containing computer-executable code may take many forms, including but not limited to tangible storage media, carrier wave media, or physical transmission media. Non-volatile storage media include, for example, optical or magnetic disks, eg, any storage device in any computer, and the like, and may be used, eg, to run a database or the like. Volatile storage media include dynamic memory, such as the main memory of such computer platforms. Tangible transmission media include coaxial cable; Included are copper wires and optical fibers, including wires that contain buses in computer systems. Carrier-wave transmission media may take the form of electrical or electromagnetic signals, or acoustic or light waves, such as those generated during radio frequency (RF) and infrared (IR) data communications. Thus, common forms of computer readable media include, for example, floppy disks, flexible disks, hard disks, magnetic tapes, any other magnetic media, CD-ROMs, DVDs or DVD-ROMs, any other optical media, punches Card stock tape, any other physical storage medium with a pattern of holes, RAM, ROM, PROM and EPROM, FLASH-EPROM, any other memory chip or cartridge, carrier waves carrying data or instructions, cables carrying such carrier waves, or links, or any other medium from which a computer can read programming code and/or data. Many of these forms of computer readable media may be involved in carrying one or more sequences of one or more instructions to a processor for execution.

대상 컴퓨터-실행가능 코드는 서버, PC, 또는 모바일 장치, 예컨대, 스마트폰 또는 태블릿을 포함하는, 프로세서를 포함하는 임의의 적합한 장치에서 실행될 수 있다. 임의의 컨트롤러 또는 컴퓨터는 선택적으로 모니터를 포함하며, 이는 음극선관("CRT") 디스플레이, 평면 패널 디스플레이(예를 들어, 능동 매트릭스형 액정 디스플레이, 액정 디스플레이 등) 등일 수 있다. 컴퓨터 회로망은 종종 박스에 넣어지며, 이는 다수의 집적 회로 칩, 예컨대, 마이크로프로세서, 메모리, 인터페이스 회로 등을 포함한다. 박스는 또한 선택적으로 하드 디스크 드라이브, 플로피 디스크 드라이브, 고용량 제거 가능 드라이브, 예컨대, 기록 가능 CD-ROM, 및 다른 일반적인 주변 요소를 포함한다. 입력 장치, 예컨대, 키보드, 마우스, 또는 터치-감응식 스크린은 선택적으로 사용자로부터의 입력을 제공한다. 컴퓨터는 파라미터 필드의 세트 내로의 사용자 입력의 형태, 예를 들어, GUI, 또는 사전프로그래밍된 지시의 형태, 예를 들어, 다양한 상이한 특정 작업에 대해 사전프로그래밍된 지시의 형태의 사용자 지시를 수신하기 위한 적절한 소프트웨어를 포함할 수 있다.The subject computer-executable code may be executed on any suitable device comprising a processor, including a server, PC, or mobile device such as a smartphone or tablet. Any controller or computer optionally includes a monitor, which may be a cathode ray tube (“CRT”) display, a flat panel display (eg, an active matrix type liquid crystal display, liquid crystal display, etc.), or the like. Computer circuitry is often enclosed in a box, which contains a number of integrated circuit chips, such as microprocessors, memory, interface circuitry, and the like. The box also optionally includes a hard disk drive, a floppy disk drive, a high capacity removable drive such as a recordable CD-ROM, and other common peripheral elements. An input device, such as a keyboard, mouse, or touch-sensitive screen, optionally provides input from the user. The computer is configured to receive user instructions in the form of user input into a set of parameter fields, eg, a GUI, or in the form of preprogrammed instructions, eg, preprogrammed instructions for a variety of different specific tasks. Appropriate software may be included.

라이브러리 제조 및 증폭 방법Library preparation and amplification methods

본원의 방법은, 특정 경우에, 대상체로부터의 샘플에 존재하는 폴리뉴클레오타이드의 증폭을 포함한다. 본원에서 사용되는 증폭 방법은 종종 롤링-서클 증폭을 포함한다. 다르게는 또는 조합하여, 본원에서 사용되는 증폭 방법은 PCR을 포함한다. 일부 경우에, 본원의 증폭 방법은 선형 증폭을 포함한다. 종종 증폭은 하나의 유전자 또는 유전자 세트로 표적화되지 않으며 전체 핵산 샘플이 증폭된다. 일부 경우에 방법은 (a) 복수의 개별 폴리뉴클레오타이드를 원형화시켜 복수의 원형 폴리뉴클레오타이드를 형성하는 단계로서, 이들 각각은 5' 말단과 3' 말단 사이에 접합부를 갖는, 단계; 및 (b) (a)의 원형 폴리뉴클레오타이드를 증폭시켜 증폭된 폴리뉴클레오타이드를 생산하는 단계를 포함한다. 추가의 경우에서, 증폭 방법은 (c) 증폭된 폴리뉴클레오타이드를 전단하여 전단된 폴리뉴클레오타이드를 생산하는 단계로서, 각각의 전단된 폴리뉴클레오타이드는 5' 말단 및/또는 3' 말단에 하나 이상의 전단점을 포함하는, 단계를 포함한다. 일부 경우에 방법은 표적 서열에 대한 농축을 포함하지 않는다.The methods herein include, in certain instances, amplification of polynucleotides present in a sample from a subject. Amplification methods used herein often include rolling-circle amplification. Alternatively or in combination, amplification methods used herein include PCR. In some cases, amplification methods herein include linear amplification. Often, amplification is not targeted to one gene or set of genes and the entire nucleic acid sample is amplified. In some cases the method comprises (a) circularizing a plurality of individual polynucleotides to form a plurality of circular polynucleotides, each having a junction between a 5' end and a 3' end; and (b) amplifying the circular polynucleotide of (a) to produce an amplified polynucleotide. In a further case, the amplification method comprises (c) shearing the amplified polynucleotides to produce sheared polynucleotides, each sheared polynucleotide having one or more shear points at its 5' end and/or 3' end. Including, including steps. In some cases the method does not include enrichment for the target sequence.

일반적으로, 폴리뉴클레오타이드의 말단을 서로 접합하여 원형 폴리뉴클레오타이드를 형성하는 것(직접, 또는 하나 이상의 중간 어댑터 올리고뉴클레오타이드를 이용하여)은 접합부 서열을 갖는 접합부를 생성한다. 폴리뉴클레오타이드의 5' 말단 및 3' 말단이 어댑터 폴리뉴클레오타이드를 통해 연결되는 경우, 용어 "접합부"는 폴리뉴클레오타이드와 어댑터 사이에 접합부를 지칭할 수 있거나(예를 들어, 5' 말단 접합부 또는 3' 말단 접합부 중 하나), 어댑터 폴리뉴클레오타이드에 의해 형성되고 이를 포함하는 것과 같은 폴리뉴클레오타이드의 5' 말단과 3' 말단 사이의 접합부를 지칭할 수 있다. 폴리뉴클레오타이드의 5' 말단 및 3' 말단이 개입 어댑터 없이 연결되는 경우(예를 들어, 단일-가닥 DNA의 5' 말단 및 3' 말단), 용어 "접합부"는 이들 두 말단이 연결되는 점을 지칭한다. 접합부는 접합부를 포함하는 뉴클레오타이드의 서열("접합부 서열"로도 지칭됨)에 의해 확인될 수 있다.Generally, joining the ends of polynucleotides together to form circular polynucleotides (either directly or using one or more intermediate adapter oligonucleotides) creates junctions having junction sequences. When the 5' end and 3' end of a polynucleotide are joined via an adapter polynucleotide, the term "junction" may refer to a junction between a polynucleotide and an adapter (e.g., a 5' end junction or a 3' end junction). one of the junctions), the junction between the 5' and 3' ends of a polynucleotide, such as formed by and including an adapter polynucleotide. Where the 5' and 3' ends of a polynucleotide are joined without intervening adapters (e.g., the 5' and 3' ends of single-stranded DNA), the term "junction" refers to the point at which these two ends are joined. do. A junction can be identified by a sequence of nucleotides comprising the junction (also referred to as “junction sequence”).

본원의 샘플은 자연 분해 과정(예컨대, 세포 용해, 세포 사멸, 및 DNA 및 RNA가 세포로부터 그 주변 환경으로 방출되고, 예를 들어, 무세포 폴리뉴클레오타이드, 예를 들어, 무세포 DNA 및 무세포 RNA에서 추가로 분해될 수 있는 다른 과정), 샘플 가공(예컨대, 고정, 염색, 및/또는 보관 과정)의 부산물인 단편화, 및 특이적 표적 서열에 대한 제한 없이 DNA를 절단하는 방법에 의한 단편화(예를 들어, 기계적 단편화, 예컨대, 초음파처리에 의한; 비-서열 특이적 뉴클레아제 처리, 예컨대, DNase I, 단편화효소)에 의해 형성된 말단의 혼합물을 갖는 폴리뉴클레오타이드를 포함한다. 샘플이 말단의 혼합물을 갖는 폴리뉴클레오타이드를 포함하는 경우, 2 개의 폴리뉴클레오타이드가 동일한 5' 말단 또는 3' 말단을 가질 가능성은 낮으며, 2 개의 폴리뉴클레오타이드가 독립적으로 동일한 5' 말단과 3' 말단 둘 모두를 가질 가능성은 더 낮다. 따라서, 일부 실시양태에서, 상기 2 개의 폴리뉴클레오타이드가 동일한 표적 서열을 갖는 부분을 포함하는 경우에도, 접합부는 상이한 폴리뉴클레오타이드를 구별하는 데 사용될 수 있다. 폴리뉴클레오타이드 말단이 개입 어댑터 없이 연결되는 경우, 접합부 서열은 참조 서열에 대한 정렬에 의해 확인될 수 있다. 예를 들어, 2 개의 구성요소 서열들의 순서가 참조 서열에 대해 역전된 것으로 보이는 경우, 상기 역전이 발생하는 것으로 보이는 지점이 상기 지점에서 접합부를 표시하는 것일 수 있다. 폴리뉴클레오타이드 말단이 하나 이상의 어댑터 서열을 통해 접합되는 경우, 접합부는 공지된 어댑터 서열에 대한 근접에 의해, 또는 상기와 같이 시퀀싱 리드가 원형화된 폴리뉴클레오타이드의 5' 말단과 3' 말단 둘 모두로부터 서열을 얻는 데 충분한 길이인 경우 정렬에 의해 확인될 수 있다. 일부 실시양태에서, 특정한 접합부의 형성은 충분히 희귀한 사건이어서 그것은 샘플의 원형화된 폴리뉴클레오타이드 중에서 독특하다.Samples herein are subject to natural degradation processes (e.g., cell lysis, cell death, and release of DNA and RNA from cells into their surroundings, e.g., cell-free polynucleotides, e.g., cell-free DNA and cell-free RNA). fragmentation as a by-product of sample processing (e.g., fixation, staining, and/or storage), and fragmentation by methods that cut DNA without restriction to a specific target sequence (e.g., eg by mechanical fragmentation, eg by sonication; by non-sequence specific nuclease treatment, eg DNase I, a fragmentase). If the sample contains polynucleotides with a mixture of ends, it is unlikely that two polynucleotides will have the same 5' end or 3' end, and the two polynucleotides will independently have both the same 5' and 3' ends. The odds of having them all are lower. Thus, in some embodiments, junctions can be used to distinguish different polynucleotides, even when the two polynucleotides contain a portion with the same target sequence. Where polynucleotide ends are ligated without intervening adapters, junction sequences can be identified by alignment to a reference sequence. For example, if the order of two component sequences appears to be reversed relative to the reference sequence, the point at which the inversion appears to occur may indicate a junction at that point. When polynucleotide ends are joined via one or more adapter sequences, the junctions are either by proximity to known adapter sequences, or sequences from both the 5' and 3' ends of the polynucleotide to which the sequencing reads were circularized as above. can be checked by alignment if it is of sufficient length to obtain In some embodiments, the formation of a particular junction is a sufficiently rare event that it is unique among the circularized polynucleotides of the sample.

일부 실시양태에서, 개별 폴리뉴클레오타이드의 원형화는 복수의 폴리뉴클레오타이드를 결찰 반응에 적용함으로써 달성된다. 결찰 반응은 리가제 효소를 포함할 수 있다. 일부 경우에, 리가제 효소는 단일 가닥 DNA 또는 RNA 리가제이다. 일부 경우에, 리가제 효소는 이중 가닥 DNA 리가제이다. 일부 실시양태에서, 리가제 효소는 (b)에서 증폭 전에 분해된다. (b)에서 증폭 전 리가제의 분해는 증폭 가능한 폴리뉴클레오타이드의 회수율을 증가시킬 수 있다. 일부 실시양태에서, 복수의 원형화된 폴리뉴클레오타이드는 (b) 전에 정제되거나 단리되지 않는다. 일부 실시양태에서, 원형화되지 않은 선형 폴리뉴클레오타이드는 증폭 전에 분해된다. 일부 경우에, 복수의 폴리뉴클레오타이드는 원형화 전에 변성되어 단일 가닥 폴리뉴클레오타이드를 생성하고; 일부 경우에, 복수의 폴리뉴클레오타이드는 원형화 전에 변성되지 않는다.In some embodiments, circularization of individual polynucleotides is achieved by subjecting a plurality of polynucleotides to a ligation reaction. A ligation reaction may involve a ligase enzyme. In some cases, the ligase enzyme is a single-stranded DNA or RNA ligase. In some cases, the ligase enzyme is a double-stranded DNA ligase. In some embodiments, the ligase enzyme is digested prior to amplification in (b). In (b), degradation of the ligase prior to amplification may increase the recovery rate of amplifiable polynucleotides. In some embodiments, the plurality of circularized polynucleotides are not purified or isolated prior to (b). In some embodiments, linear polynucleotides that are not circularized are digested prior to amplification. In some cases, the plurality of polynucleotides are denatured prior to circularization to create single-stranded polynucleotides; In some cases, the plurality of polynucleotides are not denatured prior to circularization.

일부 경우에, (a)에서 원형화는 복수의 폴리뉴클레오타이드에서 폴리뉴클레오타이드의 5' 말단, 3' 말단, 또는 5' 말단과 3' 말단 둘 모두에 폴리뉴클레오타이드를 연결하고 어댑터하는 단계를 포함한다. 앞서 기재된 바와 같이, 폴리뉴클레오타이드의 5' 말단 및/또는 3' 말단이 어댑터 폴리뉴클레오타이드를 통해 연결되는 경우, 용어 "접합부"는 폴리뉴클레오타이드와 어댑터 사이에 접합부를 지칭할 수 있거나(예를 들어, 5' 말단 접합부 또는 3' 말단 접합부 중 하나), 어댑터 폴리뉴클레오타이드에 의해 형성되고 이를 포함하는 것과 같은 폴리뉴클레오타이드의 5' 말단과 3' 말단 사이의 접합부를 지칭할 수 있다. In some cases, circularization in (a) includes linking and adapting the polynucleotides to the 5' end, 3' end, or both the 5' and 3' ends of the polynucleotides in the plurality of polynucleotides. As described above, when the 5' end and/or 3' end of a polynucleotide is joined via an adapter polynucleotide, the term "junction" may refer to a junction between a polynucleotide and an adapter (e.g., 5 'end junction or 3' end junction), a junction between the 5' and 3' ends of a polynucleotide, such as formed by and including an adapter polynucleotide.

원형화된 폴리뉴클레오타이드는 일부 경우에, 예를 들어, 리가제 효소의 분해 후에 증폭되어, 증폭된 폴리뉴클레오타이드를 생성한다. 원형 폴리뉴클레오타이드의 증폭은 폴리머라제에 의해 수행될 수 있다. 일부 경우에, 폴리머라제는 가닥 치환 활성을 갖는 폴리머라제이다. 일부 경우에, 폴리머라제는 Phi29 DNA 폴리머라제이다. 다르게는, 폴리머라제는 가닥 치환 활성을 갖지 않는 폴리머라제이다. 일부 경우에, 폴리머라제는 T4 DNA 폴리머라제 또는 T7 DNA 폴리머라제이다. 다르게는 또는 조합하여, 폴리머라제는 Taq 폴리머라제, 또는 Taq 폴리머라제 패밀리의 폴리머라제이다. 일부 경우에, 폴리머라제는 역전사효소이다. 일부 경우에, 증폭은 롤링 서클 증폭(RCA)을 포함한다. RCA로부터 생성된 증폭된 폴리뉴클레오타이드는 선형 콘카티머, 또는 주형 폴리뉴클레오타이드로부터의 표적 서열(예를 들어, 서브유닛 서열)의 하나 초과의 카피를 포함하는 폴리뉴클레오타이드를 포함할 수 있다. 일부 실시양태에서, 증폭은 원형 폴리뉴클레오타이드를 무작위 프라이머를 포함하는 증폭 반응 혼합물에 적용하는 것을 포함한다. 일부 경우에, 증폭은 원형 폴리뉴클레오타이드를 하나 이상의 프라이머를 포함하는 증폭 반응 혼합물에 적용하는 것을 포함하며, 이들 각각은 서열 상보성을 통해 상이한 표적 서열에 특이적으로 혼성화한다. 일부 경우에, 증폭은 원형 폴리뉴클레오타이드를 역 프라이머를 포함하는 증폭 반응 혼합물에 적용하는 것을 포함한다.Circularized polynucleotides are in some cases amplified, eg, after digestion with a ligase enzyme, to produce amplified polynucleotides. Amplification of circular polynucleotides can be performed by polymerases. In some cases, the polymerase is a polymerase with strand displacement activity. In some cases, the polymerase is Phi29 DNA polymerase. Alternatively, the polymerase is a polymerase that does not have strand displacement activity. In some cases, the polymerase is T4 DNA polymerase or T7 DNA polymerase. Alternatively or in combination, the polymerase is a Taq polymerase, or a polymerase of the Taq polymerase family. In some cases, the polymerase is a reverse transcriptase. In some cases, amplification includes rolling circle amplification (RCA). Amplified polynucleotides generated from RCA may include linear concatemers, or polynucleotides comprising more than one copy of a target sequence (eg, a subunit sequence) from a template polynucleotide. In some embodiments, amplification comprises applying circular polynucleotides to an amplification reaction mixture comprising random primers. In some cases, amplification involves applying the circular polynucleotide to an amplification reaction mixture comprising one or more primers, each of which specifically hybridizes to a different target sequence through sequence complementarity. In some cases, amplification includes applying the circular polynucleotide to an amplification reaction mixture comprising reverse primers.

증폭된 폴리뉴클레오타이드는, 일부 경우에, 전단되지 않은 폴리뉴클레오타이드에 비해 길이가 더 짧은 전단된 폴리뉴클레오타이드를 생산하기 위해 전단된다. 동일한 선형 콘카티머로부터 유래하는 2 개 이상의 전단된 폴리뉴클레오타이드는 동일한 접합 서열을 가질 수 있지만, 상이한 5' 및/또는 3' 말단(예를 들어, 전단 말단)을 가질 수 있다.Amplified polynucleotides are, in some cases, sheared to produce sheared polynucleotides that are shorter in length than unsheared polynucleotides. Two or more sheared polynucleotides from the same linear concatemer may have the same splice sequence, but may have different 5' and/or 3' ends (eg, shear ends).

샘플로부터의 무세포 폴리뉴클레오타이드는 DNA, RNA, 리보솜 RNA(rRNA), 전이 RNA(tRNA), 마이크로 RNA(miRNA), 메신저 RNA(mRNA), 소형 간섭 RNA(siRNA), 이들 중 임의의 것의 단편, 또는 이들 중 임의의 둘 이상의 조합을 포함하지만, 이로 제한되지 않는 임의의 다양한 폴리뉴클레오타이드일 수 있다. 일부 실시양태에서, 샘플은 DNA를 포함한다. 일부 실시양태에서, 샘플은 무세포 게놈 DNA를 포함한다. 일부 실시양태에서, 샘플은 폴리머라제 연쇄 반응(PCR), 역전사, 및 이들의 조합을 포함하지만, 이로 제한되지 않는 DNA 폴리머라제와 프라이머의 임의의 적합한 조합을 사용하는 프라이머 연장 반응과 같은 증폭에 의해 생성된 DNA를 포함한다. 프라이머 연장 반응을 위한 주형이 RNA인 경우, 역전사 산물은 상보적 DNA(cDNA)로 지칭된다. 프라이머 연장 반응에 유용한 프라이머는 하나 이상의 표적에 특이적인 서열, 무작위 서열, 부분적 무작위 서열, 및 이들의 조합을 포함할 수 있다. 일반적으로, 샘플 폴리뉴클레오타이드는 샘플에 존재하는 임의의 폴리뉴클레오타이드를 포함하며, 이는 표적 폴리뉴클레오타이드를 포함할 수 있거나 포함하지 않을 수 있다. 폴리뉴클레오타이드는 단일-가닥, 이중-가닥, 또는 이들의 조합일 수 있다. 일부 실시양태에서, 개시 방법에 적용되는 폴리뉴클레오타이드는 이중-가닥 폴리뉴클레오타이드의 존재 하에 있거나 존재하지 않을 수 있는 단일-가닥 폴리뉴클레오타이드이다. 일부 실시양태에서, 폴리뉴클레오타이드는 단일-가닥 DNA이다. 단일-가닥 DNA(ssDNA)는 단일-가닥 형태로 단리된 ssDNA, 또는 이중-가닥 형태로 단리된 후 본 개시 방법에서 하나 이상의 단계의 목적으로 단일-가닥으로 제조된 DNA일 수 있다.Cell-free polynucleotides from the sample may be DNA, RNA, ribosomal RNA (rRNA), transfer RNA (tRNA), micro RNA (miRNA), messenger RNA (mRNA), small interfering RNA (siRNA), fragments of any of these, or any of a variety of polynucleotides including, but not limited to, combinations of any two or more of these. In some embodiments, a sample comprises DNA. In some embodiments, a sample comprises cell free genomic DNA. In some embodiments, a sample is amplified by amplification, such as a primer extension reaction using any suitable combination of DNA polymerase and primers, including but not limited to polymerase chain reaction (PCR), reverse transcription, and combinations thereof. contains the generated DNA. When the template for the primer extension reaction is RNA, the product of reverse transcription is referred to as complementary DNA (cDNA). Primers useful in the primer extension reaction can include one or more target-specific sequences, random sequences, partially random sequences, and combinations thereof. Generally, the sample polynucleotide includes any polynucleotide present in the sample, which may or may not include the target polynucleotide. A polynucleotide may be single-stranded, double-stranded, or a combination thereof. In some embodiments, the polynucleotides subjected to the method of disclosure are single-stranded polynucleotides that may or may not be present in the presence of double-stranded polynucleotides. In some embodiments, a polynucleotide is single-stranded DNA. Single-stranded DNA (ssDNA) may be ssDNA isolated in single-stranded form, or DNA isolated in double-stranded form and then made single-stranded for the purpose of one or more steps in the disclosed method.

일부 실시양태에서, 폴리뉴클레오타이드는 추출 단계 없이, 및/또는 정제 단계 없이 차후 단계(예를 들어, 원형화 및 증폭)를 거친다. 예를 들어, 유체 샘플은 추출 단계 없이 세포를 제거하도록 처리되어 정제된 액체 샘플 및 세포 샘플을 생성한 후, 상기 정제된 유체 샘플로부터 DNA를 단리할 수 있다. 침전 또는 기질에의 비특이적 결합 후 상기 기질을 세척하여 결합된 폴리뉴클레오타이드를 방출시키는 것과 같은, 폴리뉴클레오타이드의 단리를 위한 다양한 절차가 이용 가능하다. 폴리뉴클레오타이드가 세포 추출 단계 없이 샘플로부터 단리되는 경우, 폴리뉴클레오타이드는 주로 세포외 또는 "무세포" 폴리뉴클레오타이드, 예컨대, 무세포 DNA 및 무세포 RNA일 것이며, 이는 사멸되거나 손상된 세포에 상응할 수 있다. 이러한 세포의 동일성은 종양 세포(예를 들어, 암 검출에서), 태아 세포(예를 들어, 산전 진단에서), 이식된 조직으로부터의 세포(예를 들어, 이식 실패의 초기 검출에서), 또는 미생물 군집의 구성원과 같이 이들이 유래된 세포 또는 세포의 집단을 특징화하는 데 사용될 수 있다.In some embodiments, the polynucleotide is subjected to subsequent steps (eg, circularization and amplification) without an extraction step and/or without a purification step. For example, a fluid sample can be treated to remove cells without an extraction step to produce a purified liquid sample and a cell sample, and then DNA is isolated from the purified fluid sample. A variety of procedures are available for isolation of polynucleotides, such as precipitation or non-specific binding to a substrate followed by washing the substrate to release the bound polynucleotide. When polynucleotides are isolated from a sample without a cell extraction step, the polynucleotides will be primarily extracellular or "cell-free" polynucleotides, such as cell-free DNA and cell-free RNA, which may correspond to dead or damaged cells. The identity of such cells may be tumor cells (eg, in cancer detection), fetal cells (eg, in prenatal diagnosis), cells from transplanted tissue (eg, in early detection of transplant failure), or microbes. It can be used to characterize the cell or population of cells from which they are derived, such as members of a population.

샘플이, 예컨대, 샘플 내의 세포로부터, 폴리뉴클레오타이드를 추출하도록 처리되는 경우, 다양한 추출 방법이 이용 가능하다. 예를 들어, 핵산은 페놀, 페놀/클로로포름/이소아밀 알콜, 또는 TRIzol 및 TriReagent를 포함하는 유사한 제형을 이용한 유기 추출에 의해 정제될 수 있다. 추출 기술의 다른 비-제한적인 예는: (1) 자동화 핵산 추출기, 예를 들어, Applied Biosystems(포스터 시티, 캘리포니아)로부터 이용 가능한 모델 341 DNA 추출기를 이용하거나, 이용하지 않고, 예를 들어, 페놀/클로로포름 유기 시약(전체가 본원에 참조로 포함되는 문헌[Ausubel et al., 1993])을 이용하여, 유기 추출 후 에탄올 침전; (2) 고정상 흡착 방법(각각 전체가 본원에 참조로 포함되는, 미국 특허 제5,234,809호; 문헌[Walsh et al., 1991]); 및 (3) 염-유도 핵산 침전 방법(전체가 본원에 참조로 포 포함되는 문헌[Miller et al., (1988)])으로서, 전형적으로 "염석" 방법으로 지칭되는 침전 방법을 포함한다. 핵산 단리 및/또는 정제의 또 다른 예는 핵산이 특이적으로 또는 비-특이적으로 결합할 수 있는 자기 입자를 사용한 후, 자석을 이용하여 비드를 단리하고, 세척하고, 상기 비드로부터 핵산을 용리시키는 것을 포함한다(예를 들어, 전체가 본원에 참조로 포함되는 미국 특허 제5,705,628호 참조). 일부 실시양태에서, 상기 단리 방법은 샘플로부터 원하지 않는 단백질의 제거를 돕기 위한 효소 분해 단계, 예를 들어, 프로테이나제 K, 또는 다른 유사 프로테아제를 이용한 분해 후에 진행될 수 있다. 예를 들어, 전체가 본원에 참조로 포함되는 미국 특허 제7,001,724호를 참조한다. 원하는 경우, RNase 억제제가 용해 완충액에 첨가될 수 있다. 특정 세포 또는 샘플 유형의 경우, 단백질 변성/분해 단계를 프로토콜에 부가하는 것이 바람직할 수 있다. 정제 방법은 DNA, RNA, 또는 이 둘 모두를 단리하는 것에 관한 것일 수 있다. 추출 절차 동안 또는 추출 절차 이후에 DNA와 RNA 둘 모두가 함께 단리되는 경우, 다른 것들로부터 하나 또는 둘 모두를 분리하여 정제하기 위해 추가 단계가 이용될 수 있다. 추출된 핵산의 하위-분획이 또한, 예를 들어, 크기, 서열, 또는 다른 물리적 또는 화학적 특징에 의한 정제에 의해 생성될 수 있다. 초기 핵산 단리 단계 외에, 핵산의 정제는, 예컨대, 과잉의 또는 원하지 않는 시약, 반응물, 또는 산물을 제거하기 위해, 개시된 방법의 임의의 단계 이후에 수행될 수 있다. 샘플 내의 핵산의 양 및/또는 순도를 결정하는 다양한 방법, 예컨대, 흡광도(예를 들어, 260 nm, 280 nm에서의 빛의 흡광도, 및 이들의 비율) 및 표지의 검출(예를 들어, 형광 염료 및 인터칼레이팅제, 예컨대, SYBR 그린, SYBR 블루, DAPI, 프로피듐 요오드, Hoechst 염색, SYBR 골드, 에티디움 브로마이드)에 의한 방법이 이용 가능하다.When a sample is processed to extract polynucleotides, eg, from cells within the sample, a variety of extraction methods are available. For example, nucleic acids can be purified by organic extraction using phenol, phenol/chloroform/isoamyl alcohol, or similar formulations including TRIzol and TriReagent. Other non-limiting examples of extraction techniques include: (1) with or without an automated nucleic acid extractor, e.g., the Model 341 DNA extractor available from Applied Biosystems (Foster City, Calif.), e.g., phenol / organic extraction using chloroform organic reagent (Ausubel et al., 1993, incorporated herein by reference in its entirety) followed by ethanol precipitation; (2) the fixed bed adsorption method (U.S. Patent No. 5,234,809; Walsh et al., 1991, each of which is incorporated herein by reference in its entirety); and (3) salt-induced nucleic acid precipitation methods (Miller et al., (1988), incorporated herein by reference in its entirety), typically referred to as "salting out" methods. Another example of nucleic acid isolation and/or purification is the use of magnetic particles capable of specifically or non-specifically binding to nucleic acids, followed by isolating beads using a magnet, washing, and eluting the nucleic acids from the beads. (See, eg, US Pat. No. 5,705,628, incorporated herein by reference in its entirety). In some embodiments, the isolation method may proceed after an enzymatic digestion step to assist in the removal of unwanted proteins from the sample, eg, digestion with proteinase K, or other similar proteases. See, eg, US Pat. No. 7,001,724, incorporated herein by reference in its entirety. If desired, an RNase inhibitor may be added to the lysis buffer. For certain cell or sample types, it may be desirable to add a protein denaturation/degradation step to the protocol. Purification methods may relate to isolating DNA, RNA, or both. If both DNA and RNA are isolated together during or after the extraction procedure, additional steps may be used to separate and purify one or both from the others. Sub-fractions of extracted nucleic acids may also be generated by purification, for example by size, sequence, or other physical or chemical characteristics. In addition to the initial nucleic acid isolation step, purification of the nucleic acid may be performed after any step of the disclosed methods, such as to remove excess or unwanted reagents, reactants, or products. Various methods for determining the amount and/or purity of nucleic acids in a sample, such as absorbance (eg, absorbance of light at 260 nm, 280 nm, and ratios thereof) and detection of labels (eg, fluorescent dyes) and intercalating agents such as SYBR green, SYBR blue, DAPI, propidium iodide, Hoechst staining, SYBR gold, ethidium bromide).

일부 경우에, 본원의 방법은 폴리뉴클레오타이드로부터 DNA 라이브러리의 제조를 포함한다. 예를 들어, 본원의 방법은 단일 가닥 DNA 라이브러리의 제조를 포함한다. 단일 가닥 DNA 라이브러리를 제조하는 임의의 적합한 방법이 본원의 방법에 사용될 수 있다. 예를 들어, 단일 가닥 DNA 라이브러리를 제조하는 방법은 DNA 샘플을 변성시켜 복수의 ssDNA를 생성하는 단계; 비-주형 합성을 통해 ssDNA 분자의 3' 말단에 어댑터를 결찰하거나 ssDNA 분자의 3' 말단을 연장시키는 단계; 어댑터 또는 3' 연장된 서열에 상보적인 프라이머를 사용하여 제2 가닥을 합성하는 단계; 이중 가닥 어댑터를 연장 산물에 결찰하는 단계; 제1 및 제2 어댑터를 표적화하는 프라이머를 사용하여(예를 들어, PCR을 사용하여) 제2 가닥을 증폭시키는 단계; 및 시퀀서 상에서 라이브러리를 시퀀싱하는 단계를 포함한다. 단일 가닥 라이브러리 제조의 추가적인 방법은 DNA 샘플을 변성시켜 복수의 ssDNA를 생성하는 단계; 어댑터를 ssDNA 분자의 3' 말단에 결찰하는 단계; 어댑터에 상보적인 프라이머를 사용하여 제2 가닥을 합성하는 단계; 이중 가닥 어댑터를 연장 산물에 결찰하는 단계; 제1 및 제2 어댑터를 표적화하는 프라이머를 사용하여(예를 들어, PCR에 의해) 제2 가닥을 증폭시키는 단계; 포획 프로브와의 혼성화를 사용하여 관심 영역에 대해 선택적으로 농축하는 단계; 포획된 산물을 증폭시키는(예를 들어, PCR에 의해) 단계; 및 시퀀서 상에서 라이브러리를 시퀀싱하는 단계를 포함한다.In some cases, the methods herein include the preparation of DNA libraries from polynucleotides. For example, the methods herein include the preparation of single-stranded DNA libraries. Any suitable method for preparing single-stranded DNA libraries can be used in the methods herein. For example, a method of preparing a single-stranded DNA library includes generating a plurality of ssDNAs by denaturing a DNA sample; ligating an adapter to the 3' end of the ssDNA molecule or extending the 3' end of the ssDNA molecule through non-template synthesis; synthesizing a second strand using a primer complementary to the adapter or 3' extended sequence; ligating the double stranded adapter to the extension product; amplifying the second strand using primers targeting the first and second adapters (eg, using PCR); and sequencing the library on a sequencer. Additional methods of single-stranded library preparation include denaturing a DNA sample to generate a plurality of ssDNA; ligating the adapter to the 3' end of the ssDNA molecule; synthesizing a second strand using a primer complementary to the adapter; ligating the double stranded adapter to the extension product; amplifying the second strand using primers targeting the first and second adapters (eg, by PCR); selectively enriching for a region of interest using hybridization with a capture probe; amplifying the captured product (eg, by PCR); and sequencing the library on a sequencer.

단일 가닥 라이브러리 제조의 추가 예는, 전체가 본원에 참조로 포함되는 문헌[Gansauge et al. 2013. Nature Protocols. 8(4) 737-748]에 기재된 바와 같이, DNA를 열 불안정성 포스파타제로 처리하여 DNA 가닥의 5' 및 3' 말단으로부터 잔류 포스페이트 기를 제거하는 단계; DNA 가닥으로부터 시토신 탈아미노화로부터 유래된 데옥시우라실을 제거하는 단계; DNA 가닥의 3' 말단에 약 10 개의 뉴클레오타이드 및 긴 3' 비오티닐화된 스페이서 아암을 갖는 5'-인산화 어댑터 올리고뉴클레오타이드를 결찰하는 단계; 스트렙타비딘 비드 상에 어댑터-결찰된 분자를 고정화하는 단계; Bst 폴리머라제를 사용하여 어댑터에 상보적인 5'-테일드 프라이머를 사용하여 주형 가닥을 복사하는 단계; 과잉 프라이머를 세척하는 단계; T4 DNA 폴리머라제를 사용한 3' 돌출부를 제거하는 단계; 평활-말단 결찰을 사용하여 제2 어댑터를 새로 합성된 가닥에 연결하는 단계; 과잉 어댑터를 세척하는 단계; 열 변성에 의해 라이브러리 분자를 방출하는 단계; 테일드 프라이머를 사용한 증폭을 통해 바코드를 포함하는 전장 어댑터 서열을 첨가하는 단계; 및 라이브러리를 시퀀싱하는 단계를 포함하는 방법을 포함한다.Additional examples of single-stranded library preparation are described in Gansauge et al. 2013. Nature Protocols. 8(4) 737-748; treating the DNA with a heat labile phosphatase to remove residual phosphate groups from the 5' and 3' ends of the DNA strand; removing deoxyuracil derived from cytosine deamination from the DNA strand; ligating a 5'-phosphorylated adapter oligonucleotide having about 10 nucleotides and a long 3' biotinylated spacer arm to the 3' end of the DNA strand; immobilizing adapter-ligated molecules on streptavidin beads; copying the template strand using a 5'-tailed primer complementary to the adapter using Bst polymerase; washing off excess primer; removing the 3' overhang using T4 DNA polymerase; joining the second adapter to the newly synthesized strand using blunt-end ligation; washing excess adapters; releasing library molecules by thermal denaturation; Adding a full-length adapter sequence including a barcode through amplification using a tailed primer; and methods comprising sequencing the library.

추가 실시양태에서, 본원의 방법은 이중 가닥 DNA 라이브러리의 제조를 포함한다. 이중 가닥 DNA 라이브러리를 제조하는 임의의 적합한 방법이 본원의 방법에 사용될 수 있다. 예를 들어, 이중 가닥 DNA 라이브러리를 제조하는 방법은 시퀀싱 어댑터를 복수의 DNA 단편의 5' 및 3' 말단에 결찰하는 단계 및 시퀀서 상에서 라이브러리를 시퀀싱하는 단계를 포함한다. 이중 가닥 DNA 라이브러리 제조의 추가 방법은 어댑터를 복수의 DNA 단편의 5' 및 3' 말단에 결찰하는 단계; 결찰된 어댑터에 상보적인 프라이머를 사용하여 PCR을 통해 전체 어댑터 서열을 결찰된 단편에 부착시키는 단계; 및 시퀀서 상에서 라이브러리를 시퀀싱하는 단계를 포함한다. 추가의 방법은 어댑터를 복수의 DNA 단편의 5' 및 3' 말단에 결찰하는 단계; 결찰된 어댑터에 상보적인 PCR을 통해 결찰된 산물을 증폭시키는 단계; 선택적으로 포획 프로브와의 혼성화를 통해 관심 영역을 농축시키는 단계; 포획된 산물을 PCR 증폭시키는 단계; 및 시퀀서 상에서 라이브러리를 시퀀싱하는 단계를 포함한다. 이중 가닥 라이브러리 제조의 추가적인 방법은 어댑터를 복수의 DNA 단편의 5' 및 3' 말단에 결찰하는 단계; 결찰된 어댑터에 상보적인 프라이머를 사용하여 PCR을 통해 결찰된 산물을 증폭시키는 단계; 이중 가닥 PCR 산물을 원형화시키거나 단일 가닥 PCR 산물을 변성 및 원형화시키는 단계; 선택적으로 특정 유전자를 표적화하는 프라이머를 사용하여 PCR에 의해 관심 영역을 농축시키는 단계; 및 시퀀서 상에서 라이브러리를 시퀀싱하는 단계를 포함한다.In a further embodiment, the methods herein include the preparation of a double-stranded DNA library. Any suitable method of making a double-stranded DNA library can be used in the methods herein. For example, a method of making a double-stranded DNA library includes ligating sequencing adapters to the 5' and 3' ends of a plurality of DNA fragments and sequencing the library on a sequencer. A further method of preparing a double-stranded DNA library includes ligating adapters to the 5' and 3' ends of a plurality of DNA fragments; attaching the entire adapter sequence to the ligated fragment via PCR using a primer complementary to the ligated adapter; and sequencing the library on a sequencer. Additional methods include ligating adapters to the 5' and 3' ends of the plurality of DNA fragments; Amplifying the ligated product through PCR complementary to the ligated adapter; optionally enriching the region of interest through hybridization with a capture probe; PCR amplifying the captured product; and sequencing the library on a sequencer. Additional methods of double-stranded library preparation include ligating adapters to the 5' and 3' ends of a plurality of DNA fragments; amplifying the ligated product through PCR using a primer complementary to the ligated adapter; circularizing double-stranded PCR products or denaturing and circularizing single-stranded PCR products; enriching the region of interest by PCR using primers that selectively target specific genes; and sequencing the library on a sequencer.

이중 가닥 라이브러리 제조의 추가 예는 전체가 본원에 참조로 포함되는 Kinde 등의 문헌[Kinde et al. 2011. Proc. Natl. Acad. Sci., USA, 108(23) 9530-9535]에 기재된 안전-시퀀싱 시스템을 포함하고, 이는 각각의 주형 분자에 고유 식별자(UID)의 할당; UID 패밀리를 생성하기 위한 각각의 고유하게 태깅된 주형 분자의 증폭; 및 증폭 산물의 중복 시퀀싱을 포함한다. 추가적인 예는 전체가 본원에 참조로 포함되는 Lv 등의 문헌[Lv et al. 2015. Clin. Chem., 61(1) 172-181]에 기재된 순환 단일-분자 증폭 및 재시퀀싱 기법(cSMART)을 포함하며, 여기서 태그는 단일 분자를 고유의 바코드로 태깅하고, 원형화시키고, 역 PCR에 의한 복제를 위해 대립유전자를 표적화한 다음, 제조된 라이브러리를 시퀀싱하고, 존재하는 대립유전자를 계수한다. Additional examples of double-stranded library preparation are described in Kinde et al., Kinde et al. 2011. Proc. Natl. Acad. Sci., USA, 108(23) 9530-9535], which assigns each template molecule a unique identifier (UID); amplification of each uniquely tagged template molecule to create a UID family; and duplicate sequencing of amplification products. Additional examples may be found in Lv et al., Lv et al. 2015. Clin. Chem., 61(1) 172-181], wherein the tag tags a single molecule with a unique barcode, circularizes it, and reverse PCR After targeting the allele for replication, the prepared library is sequenced and the alleles present are counted.

추가적인 라이브러리 제조 방법에서, 특정 특징을 갖는 cfDNA 단편은 항체를 사용하여 선택된다. 일부 경우에, 메틸화되거나 과메틸화된 cfDNA 단편은 항체를 사용하여 선택된다. 선택된 cfDNA 단편은 이후 원형화, 단일 가닥 DNA 라이브러리 제조, 및 이중 가닥 DNA 라이브러리 제조를 포함하는 본원에 기재된 임의의 라이브러리 제조 방법에 사용된다. 이러한 단리된 cfDNA 단편의 서열화는 메틸화 또는 과메틸화와 같은 변형을 포함하여 cfDNA에 존재하는 특징에 대한 정보를 제공한다.In an additional library construction method, cfDNA fragments with specific characteristics are selected using antibodies. In some cases, methylated or hypermethylated cfDNA fragments are selected using antibodies. The selected cfDNA fragments are then used in any of the library preparation methods described herein, including circularization, single-stranded DNA library preparation, and double-stranded DNA library preparation. Sequencing of these isolated cfDNA fragments provides information about features present in cfDNA, including modifications such as methylation or hypermethylation.

일부 실시양태에 따르면, 샘플로부터의 복수의 폴리뉴클레오타이드 중의 폴리뉴클레오타이드는 원형화된다. 원형화는 폴리뉴클레오타이드의 5' 말단을 동일한 폴리뉴클레오타이드의 3' 말단에, 샘플 내의 또 다른 폴리뉴클레오타이드의 3' 말단에, 또는 상이한 공급원으로부터의 폴리뉴클레오타이드(예를 들어, 올리고뉴클레오타이드 어댑터와 같은, 인공 폴리뉴클레오타이드)의 3' 말단에 접합시키는 것을 포함할 수 있다. 일부 실시양태에서, 폴리뉴클레오타이드의 5' 말단은 동일한 폴리뉴클레오타이드의 3' 말단에 연결된다("자가-연결"로도 지칭됨). 일부 실시양태에서, 원형화 반응의 조건은 특정한 평균 길이의 원형화된 폴리뉴클레오타이드의 집단을 생성하기 위해, 특정한 범위의 길이 내의 폴리뉴클레오타이드의 자가-연결이 유리하도록 선택된다. 예를 들어, 원형화 반응 조건은 약 5000, 2500, 1000, 750, 500, 400, 300, 200, 150, 100, 50 개 이하의 뉴클레오타이드 길이보다 더 짧은 폴리뉴클레오타이드의 자가-연결이 유리하도록 선택될 수 있다. 일부 실시양태에서, 원형화된 폴리뉴클레오타이드의 평균 길이가 각각의 범위 내에 속하도록 50 개 내지 5000 개 뉴클레오타이드, 100 개 내지 2500 개 뉴클레오타이드, 또는 150 개 내지 500 개 뉴클레오타이드의 길이를 갖는 단편이 유리하다. 일부 실시양태에서, 원형화된 단편의 80% 이상이 50 개 내지 500 개 뉴클레오타이드 길이, 예컨대, 50 개 내지 200 개 뉴클레오타이드 길이이다. 최적화될 수 있는 반응 조건은 연결 반응을 위해 할당된 시간의 길이, 다양한 시약의 농도, 및 연결될 폴리뉴클레오타이드의 농도를 포함한다. 일부 실시양태에서, 원형화 반응은 원형화 이전에 샘플 내에 존재하는 단편 길이의 분포를 보존시킨다. 예를 들어, 원형화 전 샘플에서 그리고 원형화된 폴리뉴클레오타이드의 단편 길이의 평균, 중앙, 모드, 및 표준 편차 중 하나 이상은 또 다른 것의 75%, 80%, 85%, 90%, 95%, 또는 그 이상 이내에 있다.According to some embodiments, the polynucleotides in the plurality of polynucleotides from the sample are circularized. Circularization can be done by linking the 5' end of a polynucleotide to the 3' end of the same polynucleotide, to the 3' end of another polynucleotide in the sample, or to a polynucleotide from a different source (e.g., an artificial polynucleotide) to the 3' end. In some embodiments, the 5' end of a polynucleotide is joined to the 3' end of the same polynucleotide (also referred to as "self-joining"). In some embodiments, the conditions of the circularization reaction are selected to favor self-association of polynucleotides within a particular range of lengths to produce a population of circularized polynucleotides of a particular average length. For example, circularization reaction conditions may be selected to favor self-association of polynucleotides shorter than about 5000, 2500, 1000, 750, 500, 400, 300, 200, 150, 100, 50 or less nucleotides in length. can In some embodiments, fragments having a length of 50 to 5000 nucleotides, 100 to 2500 nucleotides, or 150 to 500 nucleotides are advantageous such that the average length of the circularized polynucleotides falls within the respective ranges. In some embodiments, at least 80% of the circularized fragments are between 50 and 500 nucleotides in length, such as between 50 and 200 nucleotides in length. Reaction conditions that can be optimized include the length of time allotted for the ligation reaction, the concentrations of various reagents, and the concentration of polynucleotides to be ligated. In some embodiments, the circularization reaction preserves the distribution of fragment lengths present in the sample prior to circularization. For example, one or more of the mean, median, mode, and standard deviation of fragment lengths in a sample prior to circularization and of circularized polynucleotides is 75%, 80%, 85%, 90%, 95%, or within more.

일부 경우에, 우선적으로 자가-연결 원형화 산물을 형성하기보다는, 샘플 내의 폴리뉴클레오타이드의 5' 말단 및 3' 말단이 하나 이상의 개입 어댑터 올리고뉴클레오타이드에 의해 연결되어 원형 폴리뉴클레오타이드를 형성하도록, 하나 이상의 어댑터 올리고뉴클레오타이드가 사용된다. 예를 들어, 폴리뉴클레오타이드의 5' 말단은 어댑터의 3' 말단에 연결될 수 있고, 동일한 어댑터의 5' 말단은 동일한 폴리뉴클레오타이드의 3' 말단에 연결될 수 있다. 어댑터 올리고뉴클레오타이드는 샘플 폴리뉴클레오타이드에 연결될 수 있는, 적어도 일부가 공지된 서열을 갖는 임의의 올리고뉴클레오타이드를 포함한다. 어댑터 올리고뉴클레오타이드는 DNA, RNA, 뉴클레오타이드 유사체, 비정규(non-canonical) 뉴클레오타이드, 표지된 뉴클레오타이드, 변형된 뉴클레오타이드, 또는 이의 조합을 포함할 수 있다. 어댑터 올리고뉴클레오타이드는 단일 가닥, 이중 가닥, 또는 부분적 이중체일 수 있다. 일반적으로, 부분적 이중체 어댑터는 하나 이상의 단일 가닥 영역 및 하나 이상의 이중 가닥 영역을 포함한다. 이중 가닥 어댑터는 서로 혼성화된 2 개의 별개의 올리고뉴클레오타이드를 포함할 수 있고("올리고뉴클레오타이드 이중체"로도 지칭됨), 혼성화는 하나 이상의 평활 말단, 하나 이상의 3' 오버행, 하나 이상의 5' 오버행, 미스매치된 및/또는 쌍을 이루지 않은 뉴클레오타이드로부터 비롯된 하나 이상의 불룩한 것(bulge), 또는 이들의 임의의 조합을 남길 수 있다. 어댑터의 2 개의 혼성화된 영역이 비-혼성화된 영역에 의해 서로 분리되는 경우, "버블" 구조가 야기된다. 상이한 종류의 어댑터들, 예컨대, 상이한 서열의 어댑터들이 조합되어 사용될 수 있다. 상이한 어댑터들은 순차적 반응에서 또는 동시에 샘플 폴리뉴클레오타이드에 연결될 수 있다. 일부 실시양태에서, 동일한 어댑터들이 표적 폴리뉴클레오타이드의 양 말단에 부가된다. 예를 들어, 제1 및 제2 어댑터가 동일한 반응에 부가될 수 있다. 어댑터는 샘플 폴리뉴클레오타이드와 조합하기 전에 조작될 수 있다. 예를 들어, 말단 포스페이트가 부가되거나 제거될 수 있다.In some cases, rather than preferentially forming self-associating circularized products, one or more adapters are used such that the 5' and 3' ends of polynucleotides in the sample are joined by one or more intervening adapter oligonucleotides to form circular polynucleotides. Oligonucleotides are used. For example, the 5' end of a polynucleotide can be linked to the 3' end of an adapter, and the 5' end of the same adapter can be linked to the 3' end of the same polynucleotide. Adapter oligonucleotides include any oligonucleotide, at least some of which have a known sequence, that can be linked to a sample polynucleotide. Adapter oligonucleotides can include DNA, RNA, nucleotide analogues, non-canonical nucleotides, labeled nucleotides, modified nucleotides, or combinations thereof. Adapter oligonucleotides can be single-stranded, double-stranded, or partially duplex. Generally, partial duplex adapters include one or more single-stranded regions and one or more double-stranded regions. A double-stranded adapter may comprise two separate oligonucleotides hybridized to each other (also referred to as an "oligonucleotide duplex"), wherein the hybridization is at least one blunt end, one or more 3' overhangs, one or more 5' overhangs, a miss One or more bulges resulting from matched and/or unpaired nucleotides, or any combination thereof, may be left. When two hybridized regions of an adapter are separated from each other by a non-hybridized region, a “bubble” structure results. Different types of adapters, eg adapters of different sequences, may be used in combination. Different adapters can be linked to the sample polynucleotide in a sequential reaction or simultaneously. In some embodiments, identical adapters are added to both ends of a target polynucleotide. For example, a first and second adapter may be added to the same reaction. Adapters can be engineered prior to combining with sample polynucleotides. For example, a terminal phosphate may be added or removed.

어댑터 올리고뉴클레오타이드가 사용되는 경우, 어댑터 올리고뉴클레오타이드는 하나 이상의 다양한 서열 요소를 함유할 수 있으며, 이는 비제한적으로, 하나 이상의 증폭 프라이머 어닐링 서열 또는 이의 보체, 하나 이상의 시퀀싱 프라이머 어닐링 서열 또는 이의 보체, 하나 이상의 바코드 서열, 다수의 상이한 어댑터 또는 상이한 어댑터의 서브셋 사이에서 공유된 하나 이상의 공통 서열, 하나 이상의 제한 효소 인식 부위, 하나 이상의 표적 폴리뉴클레오타이드 오버행에 상보적인 하나 이상의 오버행, 하나 이상의 프로브 결합 부위(예를 들어, Illumina, Inc.에 의해 개발된 바와 같은 유세포와 같은, 대규모 병렬 시퀀싱을 위한 유세포와 같은, 시퀀싱 플렛폼에의 부착을 위한), 하나 이상의 무작위 또는 거의-무작위(near-random) 서열(예를 들어, 하나 이상의 위치에 있는 2 개 이상의 상이한 뉴클레오타이드의 세트로부터 무작위로 선택된 하나 이상의 뉴클레오타이드, 하나 이상의 위치에서 선택된 상이한 뉴클레오타이드 각각은 무작위 서열을 포함하는 어댑터의 집합에 나타남), 및 이의 조합을 포함한다. 일부 경우에, 어댑터는, 예를 들어, 혼성화에 의해 정확한 어댑터를 갖는 폐쇄된 원형을 "포획"할 수 있는, 어댑터에 대해 상보적인 서열을 포함하는 올리고뉴클레오타이드로 코팅된 비드(특히 취급하기 쉬운 자기 비드)를 이용하여 어댑터를 함유하는 상기 원형을 정제하고, 어댑터 및 어떤 결찰되지 않은 구성성분을 함유하지 않은 상기 원형을 세척해낸 다음, 비드로부터 포획된 원형을 방출하는 데 사용될 수 있다. 또한, 일부 경우에, 혼성화된 포획 프로브 및 표적 원형의 복합체가, 예컨대, 직접적인 롤링 서클 증폭(RCA)에 의해서, 연쇄체를 생성하는 데 직접 사용될 수 있다. 일부 실시양태에서, 원형 내의 어댑터는 또한 시퀀싱 프라이머로서 사용될 수 있다. 2 개 이상의 서열 요소들은 서로-비인접하거나(예를 들어, 하나 이상의 뉴클레오타이드에 의해 분리되거나), 서로 인접하거나, 부분적으로 중첩되거나, 완전히 중첩될 수 있다. 예를 들어, 증폭 프라이머 어닐링 서열은 또한 시퀀싱 프라이머 어닐링 서열로서 작용할 수 있다. 서열 요소들은 3' 말단에 또는 그 부근에, 5' 말단에 또는 그 부근에, 또는 어댑터 올리고뉴클레오타이드의 내부에 위치할 수 있다. 서열 요소는 임의의 적합한 길이, 예컨대, 최대 약 50, 45, 40, 35, 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3 개 이하의 뉴클레오타이드 길이일 수 있다. 어댑터 올리고뉴클레오타이드는 이들이 구성하는 하나 이상의 서열 요소를 수용하는 데 적어도 충분한 임의의 적합한 길이를 가질 수 있다. 일부 실시양태에서, 어댑터는 최대 약 200, 100, 90, 80, 75, 70, 65, 60, 55, 50, 45, 40, 35, 30, 25, 20, 15, 10 개 이하의 뉴클레오타이드 길이이다. 일부 실시양태에서, 어댑터 올리고뉴클레오타이드는 약 12 내지 40 개 뉴클레오타이드 길이, 예컨대, 약 15 내지 35 개 뉴클레오타이드 길이의 범위이다.When adapter oligonucleotides are used, the adapter oligonucleotides may contain one or more of a variety of sequence elements, including but not limited to one or more amplification primer annealing sequences or their complement, one or more sequencing primer annealing sequences or their complement, one or more A barcode sequence, one or more consensus sequences shared between multiple different adapters or subsets of different adapters, one or more restriction enzyme recognition sites, one or more overhangs complementary to one or more target polynucleotide overhangs, one or more probe binding sites (e.g., , for attachment to a sequencing platform, such as a flow cell for massively parallel sequencing, such as a flow cell as developed by Illumina, Inc.), one or more random or near-random sequences (e.g. , one or more nucleotides randomly selected from the set of two or more different nucleotides at one or more positions, each different nucleotide selected at one or more positions appearing in a set of adapters comprising a random sequence), and combinations thereof. In some cases, the adapter is a bead coated with an oligonucleotide comprising a sequence complementary to the adapter (particularly a tractable magnetic beads) to purify the prototypes containing adapters, wash the prototypes free of adapters and any unligated components, and then release the captured prototypes from the beads. Also, in some cases, complexes of hybridized capture probes and target prototypes can be used directly to generate concatemers, such as by direct rolling circle amplification (RCA). In some embodiments, adapters in circles can also be used as sequencing primers. Two or more sequence elements may be non-adjacent to each other (eg, separated by one or more nucleotides), adjacent to each other, partially overlapping, or completely overlapping. For example, an amplification primer annealing sequence can also serve as a sequencing primer annealing sequence. Sequence elements may be located at or near the 3' end, at or near the 5' end, or internal to an adapter oligonucleotide. A sequence element can be of any suitable length, such as up to about 50, 45, 40, 35, 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3 or fewer nucleotides in length. there is. Adapter oligonucleotides may be of any suitable length, at least sufficient to accommodate the one or more sequence elements of which they are composed. In some embodiments, an adapter is no more than about 200, 100, 90, 80, 75, 70, 65, 60, 55, 50, 45, 40, 35, 30, 25, 20, 15, 10 or less nucleotides in length. . In some embodiments, adapter oligonucleotides range from about 12 to 40 nucleotides in length, such as from about 15 to 35 nucleotides in length.

일부 실시양태에서, 하나의 샘플로부터의 단편화된 폴리뉴클레오타이드에 연결된 어댑터 올리고뉴클레오타이드는 모든 어댑터 올리고뉴클레오타이드에 공통적인 하나 이상의 서열 및 상기 특정 샘플의 폴리뉴클레오타이드에 연결된 어댑터에 독특한 바코드를 포함하며, 이로써 바코드 서열은 하나의 샘플 또는 어댑터 연결 반응으로부터 비롯되는 폴리뉴클레오타이드를 또 다른 샘플 또는 어댑터 연결 반응으로부터 비롯되는 폴리뉴클레오타이드와 구별하는 데 사용될 수 있다. 일부 실시양태에서, 어댑터 올리고뉴클레오타이드는 하나 이상의 표적 폴리뉴클레오타이드 오버행에 상보적인 5' 오버행, 3' 오버행, 또는 이 둘 모두를 포함한다. 상보적 오버행은 비제한적으로 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 개 이상의 뉴클레오타이드 길이를 포함하는, 하나 이상의 뉴클레오타이드 길이일 수 있다. 상보적 오버행은 고정된 서열을 포함할 수 있다. 어댑터 올리고뉴클레오타이드의 상보적 오버행은 하나 이상의 뉴클레오타이드의 무작위 서열을 포함할 수 있고, 이로써 하나 이상의 뉴클레오타이드는 하나 이상의 위치에 있는 2 개 이상의 상이한 뉴클레오타이드의 세트로부터 무작위로 선택되고, 상이한 뉴클레오타이드 각각은 무작위 서열을 서열을 포함하는 상보적 오버행을 갖는 어댑터의 집합에서 나타낸 하나 이상의 위치에서 선택된다. 일부 실시양태에서, 어댑터 오버행은 제한 엔도뉴클레아제 절단에 의해 생성된 표적 폴리뉴클레오타이드 오버행에 상보적이다. 일부 실시양태에서, 어댑터 오버행은 아데닌 또는 티민으로 이루어진다.In some embodiments, adapter oligonucleotides linked to fragmented polynucleotides from one sample comprise at least one sequence common to all adapter oligonucleotides and a barcode unique to the adapter linked to polynucleotides from that particular sample, whereby the barcode sequence can be used to distinguish polynucleotides originating from one sample or adapter ligation reaction from polynucleotides originating from another sample or adapter ligation reaction. In some embodiments, an adapter oligonucleotide comprises a 5' overhang, a 3' overhang, or both complementary to one or more target polynucleotide overhangs. Complementary overhangs can be one or more nucleotides in length, including but not limited to 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 or more nucleotides in length. there is. Complementary overhangs can include fixed sequences. The complementary overhang of the adapter oligonucleotide may comprise a random sequence of one or more nucleotides, such that one or more nucleotides are randomly selected from a set of two or more different nucleotides at one or more positions, and each of the different nucleotides comprises a random sequence. It is selected at one or more positions shown in the set of adapters with complementary overhangs comprising the sequence. In some embodiments, an adapter overhang is complementary to a target polynucleotide overhang created by restriction endonuclease digestion. In some embodiments, the adapter overhang consists of adenine or thymine.

폴리뉴클레오타이드를 원형화시키는 다양한 방법이 이용 가능하다. 일부 실시양태에서, 원형화는 효소적 반응, 예컨대, 리가제(예컨대, RNA 또는 DNA 리가제)의 사용을 포함한다. 다양한 리가제가 이용 가능하며, 이는 비제한적으로, CircLigase™(Epicentre; Madison, WI), RNA 리가제, T4 RNA 리가제 1(DNA와 RNA 둘 모두에 작용하는 ssRNA 리가제)를 포함한다. 또한, T4 DNA 리가제 역시 dsDNA 주형이 존재하지 않는 경우 ssDNA를 결찰할 수 있지만, 이 반응은 일반적으로 느린 반응이다. 리가제의 다른 비제한적인 예는 Taq DNA 리가제, 써머스 필리포미스(Thermus filiformis) DNA 리가제, 에스케리키아 콜라이(Escherichia coli) DNA 리가제, Tth DNA 리가제, 써머스 스코토덕터스(Thermus scotoductus) DNA 리가제(I 및 II), 내열성 리가제, 앰플리가제(Ampligase) 내열성 DNA 리가제, VanC-유형 리가제, 9°N DNA 리가제, Tsp DNA 리가제, 및 생물탐사(bioprospecting)에 의해 발견된 신규 리가제를 포함하는 NAD-의존적 리가제; T4 RNA 리가제, T4 DNA 리가제, T3 DNA 리가제, T7 DNA 리가제, Pfu DNA 리가제, DNA 리가제 1, DNA 리가제 III, DNA 리가제 IV, 및 생물탐사에 의해 발견된 신규 리가제를 포함하는 ATP-의존적 리가제; 및 야생형, 돌연변이 아형, 및 이의 유전적으로 조작된 변이체를 포함한다. 자가-연결이 요구되는 경우, 분자간 구조보다 분자내 원형의 형성을 용이하게 하기 위해 폴리뉴클레오타이드 및 효소의 농도는 조절될 수 있다. 반응 온도 및 시간 역시 조절될 수 있다. 일부 실시양태에서, 분자내 원형을 용이하게 하기 위해 60℃가 사용된다. 일부 실시양태에서, 반응 시간은 12 시간 내지 16 시간이다. 반응 조건은 선택된 효소의 제조사에 의해 명시된 것들일 수 있다. 일부 실시양태에서, 원형화 반응 후 임의의 결찰되지 않은 핵산을 절단하기 위해 엑소뉴클레아제 단계가 포함될 수 있다. 즉, 폐쇄된 원형은 자유 5' 또는 3' 말단을 함유하지 않으며, 따라서, 5' 또는 3' 엑소뉴클레아제의 도입은 상기 폐쇄된 원형을 절단하지 않지만 결찰되지 않은 구성요소는 절단할 것이다. 이들은 멀티플렉스 시스템에서 특히 유용할 수 있다.A variety of methods for circularizing polynucleotides are available. In some embodiments, circularization comprises an enzymatic reaction, such as the use of a ligase (eg, RNA or DNA ligase). A variety of ligases are available, including but not limited to CircLigase™ (Epicentre; Madison, WI), RNA ligase, T4 RNA ligase 1 (ssRNA ligase that acts on both DNA and RNA). In addition, T4 DNA ligase can also ligate ssDNA in the absence of a dsDNA template, but this reaction is generally slow. Other non-limiting examples of ligases are Taq DNA ligase, Thermus filiformis DNA ligase, Escherichia coli DNA ligase, Tth DNA ligase, Thermus scotoductus DNA ligases (I and II), thermostable ligase, Ampligase thermostable DNA ligase, VanC-type ligase, 9°N DNA ligase, Tsp DNA ligase, and bioprospecting NAD-dependent ligases, including discovered novel ligases; T4 RNA ligase, T4 DNA ligase, T3 DNA ligase, T7 DNA ligase, Pfu DNA ligase, DNA ligase 1, DNA ligase III, DNA ligase IV, and novel ligases discovered by bioprospecting ATP-dependent ligase including; and wild-type, mutant subtypes, and genetically engineered variants thereof. When self-association is desired, the concentrations of polynucleotide and enzyme can be adjusted to facilitate the formation of intramolecular circles rather than intermolecular structures. The reaction temperature and time can also be controlled. In some embodiments, 60° C. is used to facilitate intramolecular circularity. In some embodiments, the reaction time is 12 hours to 16 hours. Reaction conditions may be those specified by the manufacturer of the selected enzyme. In some embodiments, an exonuclease step may be included to cleave any unligated nucleic acids after the circularization reaction. That is, the closed circle does not contain a free 5' or 3' end, and thus introduction of a 5' or 3' exonuclease will not cleave the closed circle but will cleave the unligated components. These can be particularly useful in multiplex systems.

일반적으로, 폴리뉴클레오타이드의 말단을 서로 접합하여 원형 폴리뉴클레오타이드를 형성하는 것(직접, 또는 하나 이상의 중간 어댑터 올리고뉴클레오타이드를 이용하여)은 접합부 서열을 갖는 접합부를 생성한다. 폴리뉴클레오타이드의 5' 말단 및 3' 말단이 어댑터 폴리뉴클레오타이드를 통해 연결되는 경우, 용어 "접합부"는 폴리뉴클레오타이드와 어댑터 사이의 접합부를 지칭할 수 있거나(예를 들어, 5' 말단 접합부 또는 3' 말단 접합부 중 하나), 어댑터 폴리뉴클레오타이드에 의해 형성되고 이를 포함하는 것과 같은 폴리뉴클레오타이드의 5' 말단과 3' 말단 사이의 접합부를 지칭할 수 있다. 폴리뉴클레오타이드의 5' 말단 및 3' 말단이 개입 어댑터 없이 연결되는 경우(예를 들어, 단일-가닥 DNA의 5' 말단 및 3' 말단), 용어 "접합부"는 이들 두 말단이 접합되는 점을 지칭한다. 접합부는 접합부를 포함하는 뉴클레오타이드의 서열("접합부 서열"로도 지칭됨)에 의해 확인될 수 있다. 일부 실시양태에서, 샘플은 자연 분해 과정(예컨대, 세포 용해, 세포 사멸, 및 DNA가 세포로부터 그 주변 환경으로 방출되고, 예컨대, 무세포 폴리뉴클레오타이드, 예컨대, 무세포 DNA 및 무세포 RNA에서 추가로 분해될 수 있는 다른 과정), 샘플 가공(예컨대, 고정, 염색, 및/또는 보관 과정)의 부산물인 단편화, 및 특이적 표적 서열에 대한 제한 없이 DNA를 절단하는 방법에 의한 단편화(예를 들어, 기계적 단편화, 예컨대, 초음파처리에 의한 기계적 단편화; 비-서열 특이적 뉴클레아제 처리, 예컨대, DNase I, 단편화효소)에 의해 형성된 말단의 혼합물을 갖는 폴리뉴클레오타이드를 포함한다. 샘플이 말단의 혼합물을 갖는 폴리뉴클레오타이드를 포함하는 경우, 2 개의 폴리뉴클레오타이드가 동일한 5' 말단 또는 3' 말단을 가질 가능성은 낮으며, 2 개의 폴리뉴클레오타이드가 독립적으로 동일한 5' 말단과 3' 말단 둘 모두를 가질 가능성은 극히 낮다. 따라서, 일부 실시양태에서, 상기 2 개의 폴리뉴클레오타이드가 동일한 표적 서열을 갖는 부분을 포함하는 경우에도, 접합부는 상이한 폴리뉴클레오타이드를 구별하는 데 사용될 수 있다. 폴리뉴클레오타이드 말단이 개입 어댑터 없이 연결되는 경우, 접합부 서열은 참조 서열에 대한 정렬에 의해 확인될 수 있다. 예를 들어, 2 개의 구성요소 서열들의 순서가 참조 서열에 대해 역전된 것으로 보이는 경우, 상기 역전이 발생하는 것으로 보이는 지점이 상기 지점에서 접합부를 표시하는 것일 수 있다. 폴리뉴클레오타이드 말단이 하나 이상의 어댑터 서열을 통해 접합되는 경우, 접합부는 공지된 어댑터 서열에 대한 근접에 의해, 또는 상기와 같이 시퀀싱 리드가 원형화된 폴리뉴클레오타이드의 5' 말단과 3' 말단 둘 모두로부터 서열을 얻는 데 충분한 길이인 경우 정렬에 의해 확인될 수 있다. 일부 실시양태에서, 특정한 접합부의 형성은 충분히 희귀한 사건이어서 그것은 샘플의 원형화된 폴리뉴클레오타이드 중에서 독특하다.Generally, joining the ends of polynucleotides together to form a circular polynucleotide (either directly or using one or more intermediate adapter oligonucleotides) creates a junction having a junction sequence. When the 5' end and 3' end of a polynucleotide are joined via an adapter polynucleotide, the term "junction" can refer to the junction between the polynucleotide and the adapter (e.g., a 5' end junction or a 3' end junction). one of the junctions), the junction between the 5' end and the 3' end of a polynucleotide, such as formed by and including an adapter polynucleotide. Where the 5' and 3' ends of a polynucleotide are joined without intervening adapters (e.g., the 5' and 3' ends of single-stranded DNA), the term "junction" refers to the point at which these two ends are joined. do. A junction can be identified by a sequence of nucleotides comprising the junction (also referred to as “junction sequence”). In some embodiments, the sample is further processed during natural degradation processes (e.g., cell lysis, cell death, and release of DNA from cells into its surroundings, e.g., cell-free polynucleotides, e.g., cell-free DNA and cell-free RNA). fragmentation that is a by-product of sample processing (e.g., fixation, staining, and/or storage), and fragmentation by methods that cut DNA without restriction to a specific target sequence (e.g., other processes that may be degraded). mechanical fragmentation, such as by sonication; non-sequence specific nuclease treatment, such as DNase I, a fragmentase). If the sample contains polynucleotides with a mixture of ends, it is unlikely that two polynucleotides will have the same 5' end or 3' end, and the two polynucleotides will independently have both the same 5' and 3' ends. The chances of having them all are extremely low. Thus, in some embodiments, junctions can be used to distinguish different polynucleotides, even when the two polynucleotides contain a portion with the same target sequence. Where polynucleotide ends are ligated without intervening adapters, junction sequences can be identified by alignment to a reference sequence. For example, if the order of two component sequences appears to be reversed relative to the reference sequence, the point at which the inversion appears to occur may indicate a junction at that point. When polynucleotide ends are joined via one or more adapter sequences, the junctions are either by proximity to known adapter sequences, or sequences from both the 5' and 3' ends of the polynucleotide to which the sequencing reads were circularized as above. can be checked by alignment if it is of sufficient length to obtain In some embodiments, the formation of a particular junction is a sufficiently rare event that it is unique among the circularized polynucleotides of the sample.

시퀀싱 방법Sequencing method

일부 실시양태에 따르면, 선형 및/또는 원형화된 폴리뉴클레오타이드(또는 선택적으로 농축될 수 있는 이의 증폭 산물)는 시퀀싱 반응을 거쳐 시퀀싱 리드를 생성한다. 이러한 방법에 의해 생산된 시퀀싱 리드는 본원에 개시된 다른 방법에 따라 사용될 수 있다. 다양한 시퀀싱 방법, 특히 고처리량 시퀀싱 방법이 이용 가능하다. 예로는, 제한 없이, Illumina에 의해 제조된 시퀀싱 시스템(HiSeq® 및 MiSeq®와 같은 시퀀싱 시스템), Life Technologies(Ion Torrent®, SOLiD® 등), Roche's 454 Life Sciences systems, Pacific Biosciences systems, Oxford Nanopore Technologies, 나노볼 시퀀싱, 혼성화에 의한 시퀀싱, 중합된 콜로니(POLONY) 시퀀싱, 나노그리드 롤링 서클 시퀀싱(ROLONY) 등이 포함된다. 일부 실시양태에서, 시퀀싱은 약 또는 최소 약 50, 75, 100, 125, 150, 175, 200, 250, 300 이상의 뉴클레오타이드 길이의 리드를 생산하기 위해 HiSeq® 및 MiSeq®의 사용을 포함한다. 일부 실시양태에서, 시퀀싱은 합성 공정에 의한 시퀀싱을 포함하며, 여기서 개별 뉴클레오타이드는 성장하는 프라이머 연장 산물에 첨가될 때 반복적으로 확인된다. 피로시퀀싱은 시퀀싱 반응의 부산물, 즉, 피로포스페이트의 존재에 대해 생성된 합성 혼합물을 검정함으로써 뉴클레오타이드의 혼입을 확인하는 합성 공정에 의한 서열의 예이다. 특히, 프라이머/주형/폴리머라제 복합체는 단일 유형의 뉴클레오타이드와 접촉된다. 이러한 뉴클레오타이드가 혼입되는 경우, 중합 반응은 트리포스페이트 사슬의 α 및 β 포스페이트 사이에서 뉴클레오사이드 트리포스페이트를 절단하여 피로포스페이트를 방출한다. 방출된 피로포스페이트의 존재는 이후 AMP와 함께 피로포스페이트를 ATP로 전환시킨 다음, 루시페라제 효소를 사용하여 ATP를 측정하여 측정 가능한 광 신호를 생성하는 화학발광 효소 리포터 시스템을 사용하여 확인된다. 광이 검출되면 염기가 혼입되고, 광이 검출되지 않으면 염기가 혼입되지 않는다. 적절한 세척 단계 후에, 다양한 염기가 복합체와 주기적으로 접촉되어 주형 서열에서 후속 염기를 순차적으로 확인한다. 예를 들어, 미국 특허 제6,210,891호를 참조한다.According to some embodiments, linear and/or circularized polynucleotides (or amplification products thereof, which may optionally be enriched) are subjected to a sequencing reaction to generate sequencing reads. Sequencing reads produced by these methods can be used according to other methods disclosed herein. A variety of sequencing methods are available, particularly high-throughput sequencing methods. Examples include, but are not limited to, sequencing systems manufactured by Illumina (sequencing systems such as HiSeq® and MiSeq®), Life Technologies (Ion Torrent®, SOLiD®, etc.), Roche's 454 Life Sciences systems, Pacific Biosciences systems, Oxford Nanopore Technologies , nanoball sequencing, sequencing by hybridization, polymerized colony (POLONY) sequencing, nanogrid rolling circle sequencing (ROLONY), and the like. In some embodiments, sequencing comprises the use of HiSeq® and MiSeq® to produce reads of about or at least about 50, 75, 100, 125, 150, 175, 200, 250, 300 or more nucleotides in length. In some embodiments, sequencing comprises sequencing by synthetic process, wherein individual nucleotides are repeatedly identified as they are added to a growing primer extension product. Pyrosequencing is an example of a sequence by which the incorporation of a nucleotide is confirmed by assaying the resulting synthetic mixture for the presence of a by-product of the sequencing reaction, pyrophosphate. In particular, the primer/template/polymerase complex is contacted with a single type of nucleotide. When these nucleotides are incorporated, the polymerization reaction cleaves the nucleoside triphosphate between the α and β phosphates of the triphosphate chain, releasing pyrophosphate. The presence of the released pyrophosphate is then confirmed using a chemiluminescent enzyme reporter system that converts the pyrophosphate to ATP with AMP and then measures the ATP using a luciferase enzyme to produce a measurable light signal. The base is incorporated when light is detected, and the base is not incorporated when light is not detected. After appropriate washing steps, various bases are periodically contacted with the complex to sequentially identify subsequent bases in the template sequence. See, eg, US Patent No. 6,210,891.

관련된 시퀀싱 공정에서, 프라이머/주형/폴리머라제 복합체는 기질 상에 고정화되고, 복합체는 표지된 뉴클레오타이드와 접촉된다. 복합체의 고정화는 프라이머 서열, 주형 서열 및/또는 폴리머라제 효소를 통해 이루어질 수 있고, 공유 또는 비공유일 수 있다. 예를 들어, 복합체의 고정화는 폴리머라제 또는 프라이머와 기질 표면 사이의 연결을 통해 이루어질 수 있다. 대안적인 구성에서, 뉴클레오타이드는 제거 가능한 종결 그룹과 함께 또는 상기 그룹 없이 제공된다. 혼입 시, 표지는 복합체와 커플링되어 검출 가능하다. 종결자를 갖는 뉴클레오타이드의 경우, 개별적으로 식별 가능한 표지를 보유하는 4 개의 상이한 뉴클레오타이드 모두가 복합체와 접촉된다. 표지된 뉴클레오타이드의 혼입은 종결자의 존재에 인해 연장을 정지시키고, 복합체에 표지를 부가하여, 혼입된 뉴클레오타이드의 확인을 가능하게 한다. 그리고 나서, 표지 및 종결자가 혼입된 뉴클레오타이드로부터 제거되고, 적절한 세척 단계 이후, 상기 공정은 반복된다. 비-종결된 뉴클레오타이드의 경우, 뉴클레오타이드가 피로시퀀싱에서처럼 혼입될지의 여부를 결정하기 위해 단일 유형의 표지된 뉴클레오타이드가 복합체에 부가된다. 뉴클레오타이드 상의 표지 그룹의 제거 및 적절한 세척 단계 후, 다양한 상이한 뉴클레오타이드가 상기 동일한 공정에서 상기 반응 혼합물을 통해 순환한다. 예를 들어, 모든 목적 상 그 전체가 본원에 참조로 포함되는 미국 특허 제6,833,246호를 참조한다. 예를 들어, Illumina 게놈 분석기 시스템은 제WO 98/44151호에 기재된 기술에 기반하고, 여기서 DNA 분자는 앵커 프로브 결합 부위(달리 유세포 결합 부위로도 불림)를 통해 시퀀싱 플랫폼(유세포)에 결합되고 유리 슬라이드 상에서 그 자리에서 증폭된다. DNA 분자가 증폭되는 고체 표면은 전형적으로 복수의 제1 및 제2 결합된 올리고뉴클레오타이드, 즉, 표적 폴리뉴클레오타이드의 하나의 말단 부근 또는 말단에 있는 서열에 상보적인 제1 결합된 올리고뉴클레오타이드 및 표적 폴리뉴클레오타이드의 다른 말단 부근 또는 말단에 있는 서열에 상보적인 제2 결합된 올리고뉴클레오타이드를 포함한다. 이러한 배열은, 예컨대, 제US20140121116호에 기술된, 브릿지 증폭을 가능하게 한다. 이후, DNA 분자는 시퀀싱 프라이머에 어닐링되고, 가역적 종결자 접근법을 이용하여 염기별로 병렬 시퀀싱된다. 시퀀싱 프라이머의 혼성화는 브릿지를 앵커링하는 상기 결합된 올리고뉴클레오타이드 중 하나에서의 절단 부위에서 이중 가닥 브릿지 폴리뉴클레오타이드 중 하나의 가닥의 절단보다 뒤에 일어나며, 따라서 변성에 의해 제거될 수 있는 고체 기질에 결합되지 않은 하나의 단일 가닥 및 결합되고 시퀀싱 프라이머에의 혼성화에 이용 가능한 다른 가닥을 남긴다. 전형적으로, Illumina 게놈 분석기 시스템은 8 채널을 갖는 유세포를 이용하여 18 개 내지 36 개 염기 길이의 시퀀싱 리드를 생성하고, 런당 >1.3 Gbp의 고품질 데이터를 생성한다(www.illumina.com 참조).In a related sequencing process, a primer/template/polymerase complex is immobilized on a substrate, and the complex is contacted with labeled nucleotides. Immobilization of the complexes may be achieved through primer sequences, template sequences and/or polymerase enzymes, and may be covalent or non-covalent. For example, immobilization of the complex can be achieved through linkage between the polymerase or primer and the substrate surface. In an alternative configuration, the nucleotides are provided with or without a removable terminating group. Upon incorporation, the label is coupled to the complex and is detectable. For nucleotides with terminators, all four different nucleotides bearing individually identifiable labels are contacted with the complex. Incorporation of the labeled nucleotide stops extension due to the presence of the terminator and adds a label to the complex, allowing identification of the incorporated nucleotide. Labels and terminators are then removed from the incorporated nucleotides, and after appropriate washing steps, the process is repeated. For non-terminated nucleotides, a single type of labeled nucleotide is added to the complex to determine whether the nucleotide will be incorporated as in pyrosequencing. After removal of labeling groups on nucleotides and appropriate washing steps, a variety of different nucleotides are cycled through the reaction mixture in the same process. See, eg, US Pat. No. 6,833,246, which is incorporated herein by reference in its entirety for all purposes. For example, the Illumina genome analyzer system is based on the technology described in WO 98/44151, wherein DNA molecules are coupled to a sequencing platform (flow cell) via anchor probe binding sites (otherwise referred to as flow cell binding sites) and free It is amplified in situ on the slide. The solid surface on which the DNA molecule is amplified typically comprises a plurality of first and second linked oligonucleotides, i.e., a first linked oligonucleotide complementary to a sequence near or at the end of one of the target polynucleotide and the target polynucleotide. and a second linked oligonucleotide that is complementary to a sequence near or at the other end of the. This arrangement enables bridge amplification, described for example in US20140121116. The DNA molecules are then annealed to sequencing primers and sequenced base-by-base in parallel using a reversible terminator approach. Hybridization of the sequencing primers follows cleavage of one strand of the double-stranded bridge polynucleotide at the cleavage site in one of the linked oligonucleotides anchoring the bridge, thus leaving unbound solid substrates that can be removed by denaturation. leaving one single strand and the other strand bound and available for hybridization to the sequencing primer. Typically, the Illumina Genome Analyzer system uses a flow cell with 8 channels to generate sequencing reads between 18 and 36 bases in length and produces high quality data of >1.3 Gbp per run (see www.illumina.com).

합성 공정에 의한 또 다른 추가 서열에서, 주형 의존적 합성이 수행됨에 따라 상이하게 표지된 뉴클레오타이드의 혼입이 실시간으로 관찰된다. 형광 표지된 뉴클레오타이드가 혼입됨에 따라 개별 고정화된 프라이머/주형/폴리머라제 복합체가 관찰될 수 있으며, 이는 그것이 부가될 때 각각의 부가된 염기의 실시간 확인을 가능하게 한다. 이러한 공정에서, 표지 그룹은 뉴클레오타이드의 일부에 부착되어 혼입 동안 절단될 수 있다. 예를 들어, 표지 그룹을 혼입 동안 제거된 포스페이트 사슬의 일부, 즉, 뉴클레오사이드 폴리포스페이트 상의 β, γ, 또는 다른 말단 포스페이트 기에 부착시킴으로써, 표지는 생성 가닥 내로 혼입되지 않으며, 대신 천연 DNA가 생성된다. 개별 분자의 관찰은 매우 작은 조명 부피 내에 상기 복합체의 광 집중(optical confinement)을 수반할 수 있다. 복합체를 광집중시킴으로써, 모니터링된 영역을 생성될 수 있으며, 여기에서 무작위로 확산하는 뉴클레오타이드는 매우 짧은 시간 동안 존재할 수 있는 대신 혼입된 뉴클레오타이드는 이들이 혼입될 때 더 긴 기간 동안 관찰 부피 내에서 유지될 수 있다. 이는, 또한 부가되는 염기의 특징인 신호 프로파일을 특징으로 하는 혼입 사건과 연관된 특징적인 신호를 야기할 수 있다. 상호작용하는 표지 구성성분, 예컨대, 형광 공명 에너지 전달(FRET) 염료 쌍이 폴리머라제 또는 복합체의 다른 부분 및 혼입하는 뉴클레오타이드에 제공되며, 이로써 혼입 사건이 표지 구성성분들을 상호적으로 근접시키고, 다시 또한 혼입되는 염기의 특징인 특징적인 신호를 야기한다(예를 들어, 각각 전체가 본원에 참조로 포함되는 미국 특허 제6,917,726호, 제7,033,764, 제7,052,847호, 제7,056,676호, 제7,170,050호, 제7,361,466호, 및 제7,416,844호; 및 미국 제20070134128호 참조).In yet another additional sequence by synthetic process, incorporation of differently labeled nucleotides is observed in real time as template dependent synthesis is performed. Individual immobilized primer/template/polymerase complexes can be observed as fluorescently labeled nucleotides are incorporated, allowing real-time identification of each added base as it is added. In this process, a labeling group can be attached to a portion of a nucleotide and cleaved during incorporation. For example, by attaching a label group to a portion of the phosphate chain removed during incorporation, i.e., a β, γ, or other terminal phosphate group on a nucleoside polyphosphate, the label is not incorporated into the resulting strand and instead natural DNA is produced do. Observation of individual molecules may involve optical confinement of the complex within a very small illumination volume. By light-focusing the complex, a monitored region can be created in which randomly diffusing nucleotides can exist for very short periods of time, whereas incorporated nucleotides can remain within the observation volume for longer periods of time when they are incorporated. there is. This can also result in a characteristic signal associated with an incorporation event characterized by a signal profile characteristic of the added base. An interacting label component, such as a pair of fluorescence resonance energy transfer (FRET) dyes, is provided to the polymerase or other part of the complex and the incorporating nucleotide, whereby the incorporation event brings the label components into mutual proximity and, in turn, also incorporates them. causes a characteristic signal that is characteristic of a base that is and 7,416,844; and US 20070134128).

일부 실시양태에서, 샘플 내의 핵산은 결찰에 의해 시퀀싱될 수 있다. 이러한 방법은, 예를 들어, 폴로니(polony) 방법에서 그리고 SOLiD 기술(Applied Biosystems, 현재는 Invitrogen)에서의 사용과 같이, 표적 서열을 확인하기 위해 전형적으로 DNA 리가제 효소를 이용한다. 일반적으로, 고정된 길이의 모든 가능한 올리고뉴클레오타이드의 집단이 제공되며, 시퀀싱된 위치에 따라 표지된다. 올리고뉴클레오타이드들은 어닐링되고 결찰되며; 매칭 서열에 대한 DNA 리가제에 의한 우선적인 결찰이 상기 위치에서 상보적인 서열에 상응하는 신호를 야기한다.In some embodiments, nucleic acids in a sample can be sequenced by ligation. These methods typically use DNA ligase enzymes to identify target sequences, such as, for example, in the polony method and for use in SOLiD technology (Applied Biosystems, now Invitrogen). In general, a population of all possible oligonucleotides of fixed length is provided and labeled according to the sequenced position. Oligonucleotides are annealed and ligated; Preferential ligation by DNA ligase to the matching sequence results in a signal corresponding to the complementary sequence at that position.

본 개시의 시퀀싱 방법은, 예를 들어, 대상체에서 질병(예를 들어, 암)을 확인하거나 대상체가 질병을 가질(또는 발병할) 위험이 있는지 결정하는 것과 같은 다양한 적용에 유용한 정보를 제공할 수 있다. 시퀀싱은 다형성 영역의 서열을 제공할 수 있다. 시퀀싱은 DNA(예를 들어, cfDNA)와 같은 폴리뉴클레오타이드의 길이를 제공할 수 있다. 추가로, 시퀀싱은 cfDNA와 같은 DNA의 말단 또는 중단점의 서열을 제공할 수 있다. 시퀀싱은 단백질 결합 부위의 경계 또는 DNase 과민성 부위의 경계의 서열을 제공할 수 있다.The sequencing methods of the present disclosure may provide useful information for a variety of applications, such as, for example, identifying a disease (eg, cancer) in a subject or determining whether a subject is at risk of having (or developing) a disease. there is. Sequencing can provide the sequence of a polymorphic region. Sequencing can provide the length of a polynucleotide, such as DNA (eg, cfDNA). Additionally, sequencing can provide sequences of ends or breakpoints of DNA, such as cfDNA. Sequencing can provide sequences of the borders of protein binding sites or the borders of DNase hypersensitive sites.

샘플Sample

본원에 기재된 다양한 방법의 일부 실시양태에서, 샘플은 대상체로부터의 것이다. 대상체는 소, 돼지, 마우스, 래트, 닭, 고양이, 개 등을 포함하지만, 이로 제한되지 않는 임의의 동물일 수 있고, 일반적으로 인간과 같은 포유동물이다. 샘플 폴리뉴클레오타이드는 종종, 예를 들어, 혈액 샘플, 또는 핵산을 함유하는 유체 샘플(예를 들어, 타액)을 포함하는 조직 샘플, 체액 샘플, 또는 장기 샘플과 같은 대상체로부터의 무세포 샘플로부터 단리된다. 일부 경우에, 샘플은 세포를 제거하도록 처리되거나, 폴리뉴클레오타이드가 세포 추출 단계 없이 단리된다(예를 들어, 무세포 DNA와 같은 무세포 폴리뉴클레오타이드를 단리하기 위해). 샘플 공급원의 다른 예는 혈액, 소변, 대변, 콧구멍, 폐, 내장, 다른 체액 또는 배설물, 이들로부터 유래된 물질, 또는 이들의 조합으로부터의 것들을 포함한다. 일부 실시양태에서, 샘플은 혈액 샘플 또는 이의 일부(예컨대, 혈액 혈장 또는 혈청)이다. 혈청 및 혈장은 상기 조직 중에서도 악성 세포 사멸의 더 높은 비율과 연관된 종양 DNA에 대한 상대적 농축으로 인해, 특히 관심 대상일 수 있다. 일부 실시양태에서, 단일 개체로부터의 샘플은 별개의 다수의 샘플(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상의 별개의 샘플)로 분할되며, 이는 이반복, 삼반복, 사반복 이상의 분석과 같이, 독립적으로 본 개시의 방법을 거친다. 샘플이 대상체로부터 유래되는 경우, 참조 서열은 또한 분석 중인 샘플로부터의 콘센서스 서열 또는 동일한 대상체의 또 다른 샘플 또는 조직으로부터의 폴리뉴클레오타이드의 서열과 같이, 대상체로부터 유래될 수 있다. 예를 들어, 혈액 샘플은 ctDNA 돌연변이에 대해 분석될 수 있는 반면, 또 다른 샘플(예컨대, 구강 또는 피부 샘플)로부터의 세포 DNA가 참조 서열을 결정하기 위해 분석된다.In some embodiments of the various methods described herein, the sample is from a subject. The subject can be any animal, including but not limited to cows, pigs, mice, rats, chickens, cats, dogs, etc., and is generally a mammal such as a human. A sample polynucleotide is often isolated from a cell-free sample from a subject, such as, for example, a blood sample, or a tissue sample, including a fluid sample (eg, saliva) containing nucleic acids, a bodily fluid sample, or an organ sample. . In some cases, the sample is treated to remove cells, or polynucleotides are isolated without a cell extraction step (eg, to isolate cell-free polynucleotides, such as cell-free DNA). Other examples of sample sources include those from blood, urine, feces, nostrils, lungs, intestines, other bodily fluids or excretions, materials derived therefrom, or combinations thereof. In some embodiments, the sample is a blood sample or a portion thereof (eg, blood plasma or serum). Serum and plasma may be of particular interest due to their relative enrichment for tumor DNA associated with higher rates of malignant cell death among these tissues. In some embodiments, a sample from a single individual is divided into multiple distinct samples (eg, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more distinct samples), which is Assays of 2, 3, 4 or more are independently subjected to the methods of the present disclosure. Where the sample is from a subject, the reference sequence may also be derived from the subject, such as a consensus sequence from a sample under analysis or a sequence of a polynucleotide from another sample or tissue of the same subject. For example, a blood sample can be analyzed for ctDNA mutations, while cellular DNA from another sample (eg, oral or skin sample) is analyzed to determine a reference sequence.

폴리뉴클레오타이드는 임의의 적합한 방법에 따라 샘플로부터 추출될 수 있다. 다양한 키트가 폴리뉴클레오타이드의 추출을 위해 이용 가능하며, 이의 선택은 샘플의 유형, 또는 단리될 핵산의 유형에 좌우될 수 있다. 추출 방법의 예는 본원에 개시된 임의의 다양한 양상에 대해 기술된 것들과 같이 본원에 제공되어 있다. 일례에서, 샘플은 혈액 샘플, 예컨대, EDTA 튜브(예를 들어, BD Vacutainer)에서 수집된 샘플일 수 있다. 혈장은 원심분리(예를 들어, 4℃에서 1900xg에서 10 분)에 의해 말초 혈액 세포으로부터 분리될 수 있다. 6 mL 혈액 샘플에 대해 이러한 방식으로 수행된 혈장 분리는 전형적으로 2.5 mL 내지 3 mL의 혈장을 생성할 것이다. 순환 무세포 DNA는, 예컨대, QIAmp 순환 핵산 키트(Qiagene)를 제조사의 프로토콜에 따라 이용하여 혈장 샘플로부터 추출될 수 있다. 그 후에, DNA는 정량화될 수 있다(예를 들어, 고감도 DNA 키트(Agilent)를 이용하여 Agilent 2100 Bioanalyzer 상에서). 예로서, 건강한 사람으로부터의 이러한 혈장 샘플로부터의 순환 DNA의 수율은 혈장 mL 당 1 ng 내지 10 ng의 범위일 수 있으며, 질병(예를 들어, 암) 환자 샘플에서는 유의미하게 더 많다.Polynucleotides can be extracted from a sample according to any suitable method. A variety of kits are available for extraction of polynucleotides, the choice of which may depend on the type of sample or type of nucleic acid to be isolated. Examples of extraction methods are provided herein, such as those described for any of the various aspects disclosed herein. In one example, the sample may be a blood sample, such as a sample collected in an EDTA tube (eg, BD Vacutainer). Plasma can be separated from peripheral blood cells by centrifugation (eg, 10 minutes at 1900xg at 4°C). Plasma separation performed in this manner on a 6 mL blood sample will typically yield between 2.5 mL and 3 mL of plasma. Circulating cell-free DNA can be extracted from plasma samples using, for example, the QIAmp Circulating Nucleic Acid Kit (Qiagene) according to the manufacturer's protocol. Afterwards, DNA can be quantified (eg on an Agilent 2100 Bioanalyzer using a High Sensitivity DNA kit (Agilent)). As an example, yields of circulating DNA from such plasma samples from healthy individuals can range from 1 ng to 10 ng per mL plasma, and significantly more in diseased (eg, cancer) patient samples.

일부 실시양태에서, 복수의 폴리뉴클레오타이드는 무세포 폴리뉴클레오타이드, 예컨대, 무세포 DNA(cfDNA), 무세포 RNA(cfRNA), 순환 종양 DNA(ctDNA), 또는 순환 종양 RNA(ctRNA)를 포함한다. 무세포 DNA는 건강한 개체와 이환된 개체 둘 모두에서 순환한다. 무세포 RNA는 건강한 개체와 이환된 개체 둘 모두에서 순환한다. 종양으로부터의 cfDNA(ctDNA)는 임의의 특정 암 유형에 국한되지 않지만, 상이한 악성종양에 걸쳐 공통적인 발견인 것으로 보인다. 일부 측정에 따르면, 혈장 중 유리 순환 DNA 농도는 대조 대상체에서 약 14 ng/ml 내지 18 ng/ml 및 신생물 환자에서 약 180 ng/ml 내지 318 ng/ml이다. 아폽토시스 및 괴사 세포 사멸은 체액에서 무세포 순환 DNA에 기여한다. 예를 들어, 유의하게 증가된 순환 DNA 수준은 전립선암 및 양성 전립선 비대증 및 전립선염과 같은 다른 전립선 질병 환자의 혈장에서 관찰되었다. 또한, 순환 종양 DNA는 원발성 종양이 발생하는 장기로부터 유래하는 유체에 존재한다. 따라서, 유방암 검출은 도관 세척에서 달성될 수 있고; 결장직장암 검출은 대변에서 달성될 수 있고; 폐암 검출은 가래에서 달성될 수 있고; 전립선 암 검출은 소변 또는 사정에서 달성될 수 있다. 무세포 DNA는 다양한 공급원으로부터 수득될 수 있다. 하나의 일반적인 공급원은 대상체의 혈액 샘플이다. 그러나, cfDNA 또는 다른 단편화된 DNA는 다양한 다른 공급원으로부터 유래될 수 있다. 예를 들어, 소변 및 대변 샘플은 ctDNA를 포함하는 cfDNA의 공급원일 수 있다. 무세포 RNA는 다양한 공급원으로부터 수득될 수 있다.In some embodiments, the plurality of polynucleotides comprises cell-free polynucleotides, such as cell-free DNA (cfDNA), cell-free RNA (cfRNA), circulating tumor DNA (ctDNA), or circulating tumor RNA (ctRNA). Cell-free DNA circulates in both healthy and diseased individuals. Cell-free RNA circulates in both healthy and diseased individuals. cfDNA (ctDNA) from tumors is not limited to any particular cancer type, but appears to be a common finding across different malignancies. According to some measurements, the free circulating DNA concentration in plasma is about 14 ng/ml to 18 ng/ml in control subjects and about 180 ng/ml to 318 ng/ml in neoplasia patients. Apoptotic and necrotic cell death contributes to cell-free circulating DNA in body fluids. For example, significantly increased circulating DNA levels have been observed in the plasma of patients with prostate cancer and other prostate diseases such as benign prostatic hyperplasia and prostatitis. Circulating tumor DNA is also present in fluids from the organ in which the primary tumor develops. Thus, breast cancer detection can be achieved in ductal lavage; Colorectal cancer detection can be achieved in feces; Lung cancer detection can be achieved in sputum; Prostate cancer detection can be achieved in urine or ejaculate. Cell-free DNA can be obtained from a variety of sources. One common source is a subject's blood sample. However, cfDNA or other fragmented DNA can be derived from a variety of other sources. For example, urine and feces samples can be a source of cfDNA including ctDNA. Cell-free RNA can be obtained from a variety of sources.

일부 실시양태에서, 폴리뉴클레오타이드는 추출 단계 없이, 및/또는 정제 단계 없이 차후 단계(예를 들어, 원형화 및 증폭)를 거친다. 예를 들어, 유체 샘플은 추출 단계 없이 세포를 제거하도록 처리되어 정제된 액체 샘플 및 세포 샘플을 생성한 후, 상기 정제된 유체 샘플로부터 DNA를 단리할 수 있다. 침전 또는 기질에의 비특이적 결합 후 상기 기질을 세척하여 결합된 폴리뉴클레오타이드를 방출시키는 것과 같은, 폴리뉴클레오타이드의 단리를 위한 다양한 절차가 이용 가능하다. 폴리뉴클레오타이드가 세포 추출 단계 없이 샘플로부터 단리되는 경우, 폴리뉴클레오타이드는 주로 세포외 또는 "무세포" 폴리뉴클레오타이드일 것이다. 예를 들어, 무세포 폴리뉴클레오타이드는 무세포 DNA("순환" DNA로도 불림)를 포함할 수 있다. 일부 실시양태에서, 순환 DNA는 체액 또는 배설물(예를 들어, 혈액 샘플)과 같은 종양 세포로부터의 순환 종양 DNA(ctDNA)이다. 무세포 폴리뉴클레오타이드는 무세포 RNA("순환" RNA로도 불림)를 포함할 수 있다. 일부 실시양태에서, 순환 RNA는 종양 세포로부터의 순환 종양 RNA(ctRNA)이다. 종양은 종양 핵산이 다양한 기전을 통해 상이한 형태 및 상이한 수준으로 대상체의 혈류를 포함하는 신체로 방출되도록 아폽토시스 또는 괴사를 나타낼 수 있다. 전형적으로, ctDNA의 크기는 더 높은 농도의 더 작은 단편, 일반적으로 70 개 내지 200 개의 뉴클레오타이드 길이 내지 최대 수천 킬로염기의 큰 단편의 더 낮은 농도의 범위일 수 있다.In some embodiments, the polynucleotide is subjected to subsequent steps (eg, circularization and amplification) without an extraction step and/or without a purification step. For example, a fluid sample can be treated to remove cells without an extraction step to produce a purified liquid sample and a cell sample, and then DNA is isolated from the purified fluid sample. A variety of procedures are available for isolation of polynucleotides, such as precipitation or non-specific binding to a substrate followed by washing the substrate to release the bound polynucleotide. When polynucleotides are isolated from a sample without a cell extraction step, the polynucleotides will primarily be extracellular or "cell-free" polynucleotides. For example, cell-free polynucleotides may include cell-free DNA (also referred to as “circulating” DNA). In some embodiments, the circulating DNA is circulating tumor DNA (ctDNA) from tumor cells such as bodily fluids or feces (eg, blood samples). Cell-free polynucleotides may include cell-free RNA (also called "circulating" RNA). In some embodiments, the circulating RNA is a circulating tumor RNA (ctRNA) from a tumor cell. Tumors can exhibit apoptosis or necrosis such that tumor nucleic acids are released into the body, including the subject's bloodstream, in different forms and at different levels through a variety of mechanisms. Typically, the size of ctDNA may range from higher concentrations of smaller fragments, generally 70 to 200 nucleotides in length, to lower concentrations of large fragments up to several thousand kilobases.

cancer

본원의 방법은 암의 검출 또는 암의 위험 검출을 제공한다. 암의 병기결정은 각 암 유형이 그 자체의 분류 체계를 갖는 암 유형에 의존적이다. 암 병기결정 또는 분류 체계의 예는 하기에 더 상세히 기술된다.The methods herein provide detection of cancer or detection of risk of cancer. Cancer staging is dependent on the cancer type, with each cancer type having its own classification system. Examples of cancer staging or classification systems are described in more detail below.

Figure pct00001
Figure pct00001

Figure pct00002
Figure pct00002

Figure pct00003
Figure pct00003

Figure pct00004
Figure pct00004

Figure pct00005
Figure pct00005

Figure pct00006
Figure pct00006

Figure pct00007
Figure pct00007

Figure pct00008
Figure pct00008

Figure pct00009
Figure pct00009

Figure pct00010
Figure pct00010

Figure pct00011
Figure pct00011

Figure pct00012
Figure pct00012

Figure pct00013
Figure pct00013

Figure pct00014
Figure pct00014

Figure pct00015
Figure pct00015

Figure pct00016
Figure pct00016

Figure pct00017
Figure pct00017

Figure pct00018
Figure pct00018

Figure pct00019
Figure pct00019

Figure pct00020
Figure pct00020

Figure pct00021
Figure pct00021

Figure pct00022
Figure pct00022

Figure pct00023
Figure pct00023

Figure pct00024
Figure pct00024

Figure pct00025
Figure pct00025

Figure pct00026
Figure pct00026

Figure pct00027
Figure pct00027

Figure pct00028
Figure pct00028

특정 양상에서, 본원에 제공된 방법은 암의 조기 검출 또는 비-전이성 암의 검출을 가능하게 한다. 본원에 개시된 방법에 따라 검출될 수 있는 암의 예는, 제한 없이, 극세포종, 선방세포 암종, 청신경종, 선단 흑자성 흑색종, 선단한선종, 급성 호산구 백혈병, 급성 림프모구성 백혈병, 급성 거핵모구성 백혈병, 급성 단구성 백혈병, 성숙을 동반한 급성 골수모세포성 백혈병, 급성 골수 수지상 세포 백혈병, 급성 골수 백혈병, 급성 전골수구성 백혈병, 법랑질종, 선암종, 선양 낭성 암종, 선종, 선모양 치원성 종양, 부신피질 암종, 성인 T-세포 백혈병, 침습성 NK-세포 백혈병, AIDS-관련 암, AIDS-관련 림프종, 폐포 연질부 육종, 법랑모세포성 섬유종, 항문암, 역형성 대세포 림프종, 역형성 갑상선 암, 혈관면역모세포성 T-세포 림프종, 혈관근육지방종, 맥관육종, 맹장암, 별아교세포종, 비정형 기형 횡문근양 종양, 기저세포 암종, 기저 유사 암종, B-세포 백혈병, B-세포 림프종, 벨리니(Bellini) 관상 암종, 담관암, 방광암, 모세포종, 골암, 골 종양, 뇌간 신경아교종, 뇌 종양, 유방암, 브레너(Brenner) 종양, 기관지 종양, 세기관지폐포 암종, 브라운(Brown) 종양, 버킷(Burkitt) 림프종, 미지의 원발 부위의 암, 유암 종양, 암종, 제자리 암종, 음경의 암종, 미지의 원발 부위의 암종, 암육종, 캐슬만(Castleman) 병, 중추신경계 배아 종양, 소뇌 별아교세포종, 뇌 별아교세포종, 자궁경부암, 담관암종, 척삭종, 연골육종, 척색종, 융모막암종, 맥락막총 유두종, 만성 림프구성 백혈병, 만성 단구성 백혈병, 만성 골수성 백혈병, 만성 골수증식성 장애, 만성 호중구성 백혈병, 투명-세포 종양, 결장암, 결직장암, 두개인두종, 피부 T-세포 림프종, 데고스병(Degos disease), 돌출성 피부섬유육종, 유피낭종, 결합조직형성 소원형 세포 종양, 미만성 큰 B 세포 림프종, 배엽부전성 신경상피 종양, 배아 암종, 내배엽동 종양, 자궁내막암, 자궁내막 자궁암, 자궁내막모양 종양, 장병증-관련 T-세포 림프종, 상의모세포종, 뇌실막세포종, 상피모양 육종, 적백혈병, 식도암, 비강신경교세포종, 유잉(Ewing) 종양 패밀리, 유잉 패밀리 육종, 유잉 육종, 두개외 생식세포 종양, 고환외 생식세포 종양, 간외 담도암, 유선외 파제트병, 나팔관암, 태아내 태아, 섬유종, 섬유육종, 여포성 림프종, 여포성 갑상선암, 담낭암, 담낭암, 신경절교종, 신경절신경종, 위암, 위 림프종, 위장암, 위장 유암 종양, 위장 기질 종양, 위장 기질 종양, 생식세포 종양, 종자세포종, 임신성 융모막암종, 임신성 융모성 종양, 골의 거대세포 종양, 다형성 교모세포종, 신경아교종, 대뇌 교종증, 사구 종양, 글루카곤종, 생식선모세포종, 과립막 세포 종양, 모발세포 백혈병, 모발세포 백혈병, 두경부암, 두경부 암, 심장 암, 혈관모세포종, 혈관주위세포종, 혈관육종, 혈액 악성종양, 간세포 암종, 간비장 T-세포 림프종, 유전성 유방-난소암 증후군, 호지킨 림프종, 호지킨의 림프종, 하인두암, 시상하부 신경아교종, 염증성 유방암, 안구내 흑색종, 소도세포 암종, 소도세포 종양, 유년성 골수단구성 백혈병, 카포시(Kaposi) 육종, 카포시의 육종, 신장암, 클라스킨(Klatskin) 종양, 크루켄베르크(Krukenberg) 종양, 후두암, 후두 암, 악성 흑자 흑색종, 백혈병, 백혈병, 입술 및 구강암, 지방육종, 폐암, 황체종, 림프관종, 림프관육종, 림프상피종, 림프성 백혈병, 림프종, 거대글로불린혈증, 악성 섬유성 조직구종, 악성 섬유성 조직구종, 골의 악성 섬유질 조직구종, 악성 신경아교종, 악성 중피종, 악성 말초 신경초 종양, 악성 횡문근양 종양, 악성 트리톤 종양, MALT 림프종, 외투세포 림프종, 비만세포 백혈병, 종격 생식세포 종양, 종격 종양, 수질 갑상선암, 수모세포종, 수모세포종, 수질상피종, 흑색종, 흑색종, 수막종, 머켈(Merkel) 세포 암종, 중피종, 중피종, 잠복 원발 전이성 편평상피 목암, 전이성 요상피 암종, 혼합된 뮬레리안(Mullerian) 종양, 단구성 백혈병, 입암, 점액성 종양, 다발성 내분비 신생물 증후군, 다발성 골수종, 다발성 골수종, 균상식육종, 균상식육종, 골수이형성 질환, 골수이형성 증후군, 골수성 백혈병, 골수성 육종, 골수증식성 질환, 점액종, 비강암, 비인두암, 비인두 암종, 신생물, 신경초종, 신경모세포종, 신경모세포종, 신경섬유종, 신경종, 결절성 흑색종, 비호지킨 림프종, 비호지킨 림프종, 비흑색종 피부암, 비소세포 폐암, 안구 종양, 희소돌기별아교세포종, 희소돌기아교세포종, 종양세포종, 시신경초 수막종, 구강암, 구강 암, 구강인두암, 골육종, 골 육종, 난소암, 난소 암, 난소 상피암, 난소 생식세포 종양, 난소 낮은 악성 잠재적 종양, 유방의 파제트병, 판코스트(Pancoast) 종양, 췌장암, 췌장암, 유두상 갑상선암, 유두종증, 부신경절종, 부비동암, 부갑상선암, 음경암, 말초혈관 상피모양 세포 종양, 인두암, 크롬친화 세포종, 중간체 분화의 송과체 실질 종양, 송과체모세포종, 과립세포종, 뇌하수체 선종, 뇌하수체 종양, 형질세포 신생물, 흉막폐 모세포종, 다배아종, 전구체 T-림프모구성 림프종, 원발성 중추신경계 림프종, 원발성 삼출 림프종, 원발성 간세포암, 원발성 간암, 원발성 복막암, 원시 신경외배엽성 종양, 전립선암, 복막 가점액종, 직장암, 신장 세포 암종, 15번 염색체 상의 NUT 유전자와 관련된 기도 암종, 망막모세포종, 횡문근종, 횡문근육종, 리히터(Richter) 형질전환, 천골미골 기형종, 타액선암, 육종, 신경초종증, 피지선 암종, 2차 신생물, 정상피종, 장액 종양, 세르톨리-라이디히(Sertoli-Leydig) 세포 종양, 성삭-기질 종양, 세자리(Sezary) 증후군, 인환 세포 암종, 피부암, 청색 소원형 세포 종양, 소세포 암종, 소세포 폐암, 소세포 림프종, 소장암, 연부 조직 육종, 소마토스타틴종, 검댕 사마귀, 척수 종양, 척추 종양, 비장 변연부 림프종, 편평상피 세포 암종, 위암, 표재 확장성 흑색종, 천막상 원시 신경외배엽성 종양, 표면 상피-기질 종양, 활막 육종, T-세포 급성 림프모구성 백혈병, T-세포 거대 과립 림프구 백혈병, T-세포 백혈병, T-세포 림프종, T-세포 전림프구성 백혈병, 기형종, 말단 림프암, 고환암, 난포막종, 인후두암, 흉선 암종, 흉선종, 갑상선암, 신우 및 요관의 이행세포암, 이행세포 암종, 요막관암, 요도암, 비뇨생식기 신생물, 자궁육종, 포도막 흑색종, 질암, 버너 모리슨(Verner Morrison) 증후군, 사마귀모양 암종, 시각경로 신경아교종, 외음부암, 발덴스트롬(Waldenstrom) 거대글로불린혈증, 와르틴(Warthin) 종양, 윌름스 종양, 및 이들의 조합을 포함한다.In certain aspects, the methods provided herein enable early detection of cancer or detection of non-metastatic cancer. Examples of cancers that can be detected according to the methods disclosed herein include, but are not limited to, acanthoma, acinar cell carcinoma, acoustic neuroma, acromegaly melanoma, acromegaly adenoma, acute eosinophilic leukemia, acute lymphoblastic leukemia, acute megakaryoma Blastous leukemia, acute monocytic leukemia, acute myeloblastic leukemia with maturation, acute myeloid dendritic cell leukemia, acute myelocytic leukemia, acute promyelocytic leukemia, enamel, adenocarcinoma, adenoid cystic carcinoma, adenoma, adenoid odontogenic Tumor, adrenocortical carcinoma, adult T-cell leukemia, invasive NK-cell leukemia, AIDS-related cancer, AIDS-related lymphoma, alveolar soft tissue sarcoma, ameloblastic fibroma, anal cancer, anaplastic large cell lymphoma, anaplastic thyroid Cancer, angioimmunoblastic T-cell lymphoma, angiomyolipoma, angiosarcoma, caecal cancer, astrocytoma, atypical malformed rhabdomyomas, basal cell carcinoma, basal-like carcinoma, B-cell leukemia, B-cell lymphoma, Bellini ( Bellini) tubular carcinoma, cholangiocarcinoma, bladder cancer, blastoma, bone cancer, bone tumor, brainstem glioma, brain tumor, breast cancer, Brenner tumor, bronchial tumor, bronchioloalveolar carcinoma, Brown tumor, Burkitt's lymphoma, Cancer of unknown primary site, carcinoid tumor, carcinoma, carcinoma in situ, carcinoma of the penis, carcinoma of unknown primary site, carcinosarcoma, Castleman's disease, central nervous system embryonic tumor, cerebellar astrocytoma, brain astrocytoma, uterus Cervical cancer, cholangiocarcinoma, chordoma, chondrosarcoma, chordoma, choriocarcinoma, choroidal plexus papilloma, chronic lymphocytic leukemia, chronic monocytic leukemia, chronic myelogenous leukemia, chronic myeloproliferative disorder, chronic neutrophilic leukemia, clear-cell tumor , colon cancer, colorectal cancer, craniopharyngioma, cutaneous T-cell lymphoma, Degos disease, protruding dermatofibrosarcoma, dermoid cyst, connective tissue formation small-cell tumor, diffuse large B-cell lymphoma, germinal insufficiency nerve Epithelial tumor, embryonic carcinoma, endoderm sinus tumor, endometrial cancer, endometrial uterine cancer, endometrioid tumor, enteropathy-associated T-cell lymphoma, ependymoma, ependymcytoma, epithelioid sarcoma, erythroleukemia, esophageal cancer, nasal glioblastoma , Ewing family of tumors, Ewing family sarcoma, Ewing sarcoma, extracranial germ cell tumor, extra-testicular germ cell tumor, extrahepatic cholangiocarcinoma, extramammary Paget's disease, fallopian tube cancer, intrafetal fetus, fibroma, fibrosarcoma, follicle Gastrointestinal lymphoma, follicular thyroid cancer, gallbladder cancer, gallbladder cancer, ganglionglioma, ganglioneuroma, gastric cancer, gastric lymphoma, gastrointestinal cancer, gastrointestinal carcinoid tumor, gastrointestinal stromal tumor, gastrointestinal stromal tumor, germ cell tumor, sematocyte tumor, gestational choriocarcinoma, gestational choriocarcinoma Sex tumor, giant cell tumor of bone, glioblastoma multiforme, glioma, cerebral glioma, glomerular tumor, glucagonoma, gonadoblastoma, granulosa cell tumor, hairy cell leukemia, hairy cell leukemia, head and neck cancer, head and neck cancer, heart cancer , hemangioblastoma, hemangiopericytoma, hemangiosarcoma, hematological malignancy, hepatocellular carcinoma, hepatosplenic T-cell lymphoma, hereditary breast-ovarian cancer syndrome, Hodgkin's lymphoma, Hodgkin's lymphoma, hypopharyngeal cancer, hypothalamic glioma, inflammatory breast cancer , intraocular melanoma, islet cell carcinoma, islet cell tumor, juvenile myelomonocytic leukemia, Kaposi's sarcoma, Kaposi's sarcoma, kidney cancer, Klatskin's tumor, Krukenberg tumor, laryngeal cancer , laryngeal cancer, lentigo malignant melanoma, leukemia, leukemia, lip and oral cancer, liposarcoma, lung cancer, corpus luteum, lymphangioma, lymphangiosarcoma, lymphoepithelialoma, lymphocytic leukemia, lymphoma, macroglobulinemia, malignant fibrous histiocytoma, Malignant fibrous histiocytoma, malignant fibrous histiocytoma of bone, glioma malignant, mesothelioma malignant, peripheral nerve sheath tumor malignant, malignant rhabdomyomas, malignant triton tumor, MALT lymphoma, mantle cell lymphoma, mast cell leukemia, mediastinal germ cell tumor, Mediastinal tumor, medullary thyroid carcinoma, medulloblastoma, medulloblastoma, medullary epithelioma, melanoma, melanoma, meningioma, Merkel cell carcinoma, mesothelioma, mesothelioma, occult primary metastatic squamous neck carcinoma, metastatic urothelial carcinoma, mixed mule mullerian tumor, monocytic leukemia, oral cancer, myxoid tumor, multiple endocrine neoplasia syndrome, multiple myeloma, multiple myeloma, mycosis fungoides, mycosis fungoides, myelodysplastic disease, myelodysplastic syndrome, myelogenous leukemia, myeloid sarcoma , myeloproliferative disease, myxoma, nasal cancer, nasopharyngeal cancer, nasopharyngeal carcinoma, neoplasia, schwannoma, neuroblastoma, neuroblastoma, neurofibroma, neuroma, nodular melanoma, non-Hodgkin's lymphoma, non-Hodgkin's lymphoma, non-melanoma skin cancer , non-small cell lung cancer, ocular tumor, oligodendrogliocytoma, oligodendroglioma, oncocytoma, optic nerve sheath meningioma, oral cancer, oral cancer, oropharyngeal cancer, osteosarcoma, osteosarcoma, ovarian cancer, ovarian cancer, ovarian epithelial cancer, ovarian reproductive Cell tumor, ovarian low malignant potential tumor, Paget's disease of the breast, Pancoast tumor, pancreatic cancer, pancreatic cancer, papillary thyroid cancer, papillomatosis, paraganglioma, sinus cancer, parathyroid cancer, penile cancer, peripheral vascular epithelial cell Tumor, Pharyngeal Cancer, Pheochromocytoma, Pineal Parenchymal Tumor of Intermediate Differentiation, Pineal Blastoma, Granulocytoma, Pituitary Adenoma, Pituitary Tumor, Plasma Cell Neoplasia, Pleuropulmonary Blastoma, Multiple Blastoma, Precursor T-lymphoblastic Lymphoma, Primary Central nervous system lymphoma, primary effusion lymphoma, primary hepatocellular carcinoma, primary liver cancer, primary peritoneal cancer, primitive neuroectodermal tumor, prostate cancer, peritoneal pseudomyxoma, rectal cancer, renal cell carcinoma, airway carcinoma associated with the NUT gene on chromosome 15, retina Blastoma, rhabdomyomas, rhabdomyosarcoma, Richter's transformation, sacral coccyx teratoma, salivary gland carcinoma, sarcoma, schwannomatosis, sebaceous gland carcinoma, secondary neoplasia, seminoma, serous tumor, Sertoli-Leydig Leydig) cell tumor, sex cord-stromal tumor, Sezary syndrome, signet ring cell carcinoma, skin cancer, small cell carcinoma blue, small cell carcinoma, small cell lung cancer, small cell lymphoma, small bowel cancer, soft tissue sarcoma, somatostatinoma, sooty wart, Spinal Cord Tumor, Spinal Tumor, Splenic Marginal Lymphoma, Squamous Cell Carcinoma, Gastric Cancer, Superficial Dilated Melanoma, Supratentorial Primitive Neuroectodermal Tumor, Superficial Epithelial-stromal Tumor, Synovial Sarcoma, T-Cell Acute Lymphoblastic Leukemia, T -Cell giant granular lymphocytic leukemia, T-cell leukemia, T-cell lymphoma, T-cell prolymphocytic leukemia, teratoma, terminal lymphoma, testicular cancer, follicular cancer, laryngeal cancer, thymic carcinoma, thymoma, thyroid cancer, renal pelvis and ureter of transitional cell carcinoma, transitional cell carcinoma, urinary tract cancer, urethral cancer, urogenital neoplasia, uterine sarcoma, uveal melanoma, vaginal cancer, Verner Morrison syndrome, wartoid carcinoma, visual pathway glioma, vulvar cancer, Walden Waldenstrom's macroglobulinemia, Warthin's tumor, Wilms' tumor, and combinations thereof.

컴퓨터 시스템computer system

본 개시는 본 개시의 방법을 구현하도록 프로그래밍된 컴퓨터 시스템을 제공한다. 도 1은 본 개시의 방법을 구현하도록 프로그래밍되거나 달리 구성된 컴퓨터 시스템(201)을 보여준다. 컴퓨터 시스템(201)은, 예를 들어, 대상체가 질병(예를 들어, 암)을 갖거나 가질 위험이 있는지를 결정하기 위한 방법과 같은 본 개시의 방법의 다양한 양상을 조절할 수 있다.The present disclosure provides a computer system programmed to implement the methods of the present disclosure. 1 shows a computer system 201 programmed or otherwise configured to implement the methods of the present disclosure. Computer system 201 may control various aspects of the methods of the present disclosure, such as, for example, a method for determining whether a subject has or is at risk of having a disease (eg, cancer).

컴퓨터 시스템(201)은 단일 코어 또는 멀티 코어 프로세서, 또는 병렬 처리를 위한 복수의 프로세서일 수 있는 중앙 처리 장치(CPU, 본원에서 또한 "프로세서" 및 "컴퓨터 프로세서")(205)를 포함한다. 컴퓨터 시스템(201)은 또한 메모리 또는 메모리 위치(210)(예를 들어, 랜덤 액세스 메모리, 읽기 전용 메모리, 플래시 메모리), 전자 저장 장치(215)(예를 들어, 하드 디스크), 하나 이상의 다른 시스템과 통신하기 위한 통신 인터페이스(220)(예를 들어, 네트워크 어댑터), 및 주변 장치(225), 예컨대, 캐시, 기타 메모리, 데이터 저장 및/또는 전자 디스플레이 어댑터를 포함한다. 메모리(210), 저장 장치(215), 인터페이스(220) 및 주변 장치(225)는 마더보드와 같은 통신 버스(실선)를 통해 CPU(205)와 통신한다. 저장 장치(215)는 데이터를 저장하기 위한 데이터 저장 장치(또는 데이터 저장소)일 수 있다. 컴퓨터 시스템(201)은 통신 인터페이스(220)의 도움으로 컴퓨터 네트워크("네트워크")(230)에 작동 가능하게 결합될 수 있다. 네트워크(230)는 인터넷(Internet), 인터넷(internet) 및/또는 엑스트라넷, 또는 인터넷과 통신하는 인트라넷 및/또는 엑스트라넷일 수 있다. 일부 경우에 네트워크(230)는 텔레커뮤니케이션 및/또는 데이터 네트워크이다. 네트워크(230)는 클라우드 컴퓨팅과 같은 분산 컴퓨팅을 가능하게 할 수 있는 하나 이상의 컴퓨터 서버를 포함할 수 있다. 네트워크(230)는 일부 경우에 컴퓨터 시스템(201)의 도움으로 피어-투-피어 네트워크를 구현할 수 있으며, 이는 컴퓨터 시스템(201)에 연결된 장치가 클라이언트 또는 서버로서 동작하도록 할 수 있다.Computer system 201 includes a central processing unit (CPU, also herein “processor” and “computer processor”) 205 which can be a single-core or multi-core processor, or multiple processors for parallel processing. Computer system 201 may also include a memory or memory location 210 (eg, random access memory, read-only memory, flash memory), an electronic storage device 215 (eg, hard disk), one or more other systems. and a communication interface 220 (eg, a network adapter) for communicating with and a peripheral device 225, such as a cache, other memory, data storage, and/or electronic display adapter. The memory 210, storage device 215, interface 220, and peripheral device 225 communicate with the CPU 205 through a communication bus (solid line), such as a motherboard. The storage device 215 may be a data storage device (or data storage) for storing data. Computer system 201 may be operatively coupled to a computer network (“network”) 230 with the aid of a communication interface 220 . Network 230 may be the Internet, the Internet and/or extranet, or an intranet and/or extranet in communication with the Internet. In some cases, network 230 is a telecommunications and/or data network. Network 230 may include one or more computer servers that may enable distributed computing, such as cloud computing. Network 230 may in some cases implement a peer-to-peer network with the help of computer system 201, which may allow devices connected to computer system 201 to act as clients or servers.

CPU(205)는 프로그램 또는 소프트웨어로 구현될 수 있는 기계-판독 가능 명령 시퀀스를 실행할 수 있다. 명령은 메모리(210)와 같은 메모리 위치에 저장될 수 있다. 명령은 CPU(205)로 지시될 수 있으며, 이는 본 개시의 방법을 구현하기 위해 CPU(205)를 후속적으로 프로그래밍하거나 달리 구성할 수 있다. CPU(205)에 의해 수행되는 작업의 예는 페치, 디코딩, 실행 및 라이트백(writeback)을 포함할 수 있다.CPU 205 may execute a machine-readable sequence of instructions, which may be implemented as a program or software. Instructions may be stored in memory locations such as memory 210 . Instructions may be directed to CPU 205, which may subsequently program or otherwise configure CPU 205 to implement the methods of the present disclosure. Examples of tasks performed by CPU 205 may include fetch, decode, execute, and writeback.

CPU(205)는 집적 회로와 같은 회로의 일부일 수 있다. 시스템 (201)의 하나 이상의 다른 구성 요소가 회로에 포함될 수 있다. 일부 경우에, 회로는 주문형 집적 회로(ASIC)이다.CPU 205 may be part of a circuit such as an integrated circuit. One or more other components of system 201 may be included in the circuit. In some cases, the circuit is an application specific integrated circuit (ASIC).

저장 장치(215)는 드라이버, 라이브러리 및 저장된 프로그램과 같은 파일을 저장할 수 있다. 저장 장치(215)는 사용자 데이터, 예를 들어, 사용자 선호도 및 사용자 프로그램을 저장할 수 있다. 일부 경우에 컴퓨터 시스템(201)은 인트라넷 또는 인터넷을 통해 컴퓨터 시스템(201)과 통신하는 원격 서버에 위치된 것과 같이, 컴퓨터 시스템(201) 외부에 있는 하나 이상의 추가 데이터 저장 장치를 포함할 수 있다.The storage device 215 may store files such as drivers, libraries, and stored programs. The storage device 215 may store user data, for example user preferences and user programs. In some cases computer system 201 may include one or more additional data storage devices that are external to computer system 201, such as located on a remote server that communicates with computer system 201 over an intranet or the Internet.

컴퓨터 시스템(201)은 네트워크(230)를 통해 하나 이상의 원격 컴퓨터 시스템과 통신할 수 있다. 예를 들어, 컴퓨터 시스템(201)은 사용자(예를 들어, 의료 제공자 또는 환자)의 원격 컴퓨터 시스템과 통신할 수 있다. 원격 컴퓨터 시스템의 예로는 개인용 컴퓨터(예를 들어, 휴대용 PC), 슬레이트 또는 태블릿 PC(예를 들어, Apple® iPad, Samsung® Galaxy Tab), 전화기, 스마트폰(예를 들어, Apple® iPhone, Android-사용 가능 장치, Blackberry®), 또는 개인용 디지털 단말기가 포함된다. 사용자는 네트워크(230)를 통해 컴퓨터 시스템(201)에 액세스할 수 있다.Computer system 201 may communicate with one or more remote computer systems via network 230 . For example, computer system 201 may communicate with a remote computer system of a user (eg, a medical provider or patient). Examples of remote computer systems include personal computers (e.g., portable PCs), slate or tablet PCs (e.g., Apple® iPad, Samsung® Galaxy Tab), phones, smartphones (e.g., Apple® iPhone, Android -Enabled devices, including Blackberry®, or personal digital assistants. A user may access computer system 201 through network 230 .

본원에 기재된 바와 같은 방법은, 예를 들어, 메모리(210) 또는 전자 저장 장치(215)와 같은 컴퓨터 시스템(201)의 전자 저장 위치에 저장된 기계(예를 들어, 컴퓨터 프로세서) 실행 가능 코드에 의해 구현될 수 있다. 기계-실행 가능 코드 또는 기계 판독 가능 코드는 소프트웨어 형태로 제공될 수 있다. 사용 중에, 코드는 프로세서(205)에 의해 실행될 수 있다. 일부 경우에, 코드는 저장 장치(215)으로부터 검색되고 프로세서(205)에 의한 빠른 액세스를 위해 메모리(210)에 저장될 수 있다. 일부 상황에서, 전자 저장 장치(215)는 제외될 수 있고, 기계-실행 가능 명령은 메모리(210)에 저장된다.Methods as described herein may be performed by machine (e.g., computer processor) executable code stored in an electronic storage location of computer system 201, such as, for example, memory 210 or electronic storage device 215. can be implemented Machine-executable code or machine-readable code may be provided in software form. In use, code may be executed by processor 205 . In some cases, the code may be retrieved from storage 215 and stored in memory 210 for quick access by processor 205 . In some circumstances, electronic storage device 215 may be excluded, and machine-executable instructions are stored in memory 210 .

코드는 코드를 실행하기에 적합한 프로세서를 가진 기계와 함께 사용하기 위해 프리컴파일되고 구성될 수 있거나, 런타임 동안 컴파일될 수 있다. 코드는 프리컴파일, 컴파일된 대로의 방식으로 코드가 실행할 수 있도록 선택될 수 있는 프로그래밍 언어로 제공될 수 있다.The code may be precompiled and configured for use with a machine having a processor suitable for executing the code, or may be compiled during runtime. The code may be provided in a programming language of choice so that the code can be executed in a precompiled, as-compiled manner.

컴퓨터 시스템(201)과 같은 본원에 제공된 시스템 및 방법의 양상은 프로그래밍으로 구현될 수 있다. 기술의 다양한 양상은 전형적으로 기계(또는 프로세서) 실행 가능 코드 및/또는 일종의 기계 판독 가능 매체에서 수행되거나 구현되는 관련 데이터의 형태인 "제품" 또는 "제조품"으로 간주될 수 있다. 기계-실행 가능 코드는 메모리(예를 들어, 읽기-전용 메모리, 랜덤-액세스 메모리, 플래시 메모리) 또는 하드 디스크와 같은 전자 저장 장치에 저장될 수 있다. "저장"형 매체는 소프트웨어 프로그래밍을 위해 언제든지 비일시적 스토리지를 제공할 수 있는 다양한 반도체 메모리, 테이프 드라이브, 디스크 드라이브 등과 같은, 컴퓨터, 프로세서 등, 또는 그의 관련 모듈의 임의의 또는 모든 유형의 메모리를 포함할 수 있다. 소프트웨어의 전부 또는 일부는 때때로 인터넷 또는 다양한 기타 텔레커뮤니케이션 네트워크를 통해 통신될 수 있다. 예를 들어, 이러한 통신은 하나의 컴퓨터 또는 프로세서에서 다른 컴퓨터 또는 프로세서로, 예를 들어, 관리 서버 또는 호스트 컴퓨터에서 애플리케이션 서버의 컴퓨터 플랫폼으로 소프트웨어의 로딩을 가능하게 할 수 있다. 따라서, 소프트웨어 요소를 보유할 수 있는 또 다른 유형의 매체에는 유선 및 광 유선 네트워크를 통해, 그리고 다양한 에어-링크에 걸쳐 로컬 장치 간의 물리적 인터페이스를 통해 사용되는 것과 같은 광, 전기 및 전자기파가 포함된다. 유선 또는 무선 링크, 광 링크 등과 같이 이러한 파동을 전달하는 물리적 요소도 소프트웨어를 보유하는 매체로서 간주될 수 있다. 본원에서 사용되는 바와 같이, 비-일시적 유형의 "저장" 매체로 제한되지 않는 한, 컴퓨터 또는 기계 "판독 가능 매체"와 같은 용어는 실행을 위해 프로세서에 명령을 제공하는 데 참여하는 임의의 매체를 지칭한다.Aspects of the systems and methods provided herein, such as computer system 201, may be implemented in programming. Various aspects of technology may be considered a “product” or “article of manufacture,” typically in the form of machine (or processor) executable code and/or related data executed or embodied on some kind of machine-readable medium. Machine-executable code may be stored in a memory (eg, read-only memory, random-access memory, flash memory) or an electronic storage device such as a hard disk. A “storage” type medium includes any or all types of memory in a computer, processor, etc., or related modules thereof, such as various semiconductor memories, tape drives, disk drives, etc., which can at any time provide non-transitory storage for software programming. can do. All or part of the Software may be communicated over the Internet or various other telecommunication networks from time to time. For example, such communication may enable loading of software from one computer or processor to another computer or processor, eg, from a management server or host computer to the application server's computer platform. Thus, other types of media that may carry software elements include optical, electrical and electromagnetic waves as used over wired and fiber wired networks and over physical interfaces between local devices over various air-links. A physical element that transmits these waves, such as a wired or wireless link, an optical link, etc., can also be considered as a medium holding software. As used herein, unless limited to a non-transitory tangible "storage" medium, the term computer or machine "readable medium" refers to any medium that participates in providing instructions to a processor for execution. refers to

따라서, 컴퓨터-실행 가능 코드와 같은 기계 판독 가능 매체는 유형의 저장 매체, 반송파 매체 또는 물리적 전송 매체를 포함하지만 이로 제한되지 않는 다양한 형태를 취할 수 있다. 비휘발성 저장 매체는, 예를 들어, 광학 또는 자기 디스크, 예컨대, 도면에 도시된 데이터베이스를 구현하는 데 사용될 수 있는 것 등과 같은 임의의 컴퓨터(들)의 임의의 저장 장치 등을 포함한다. 휘발성 저장 매체는 이러한 컴퓨터 플랫폼의 주 메모리와 같은 동적 메모리를 포함한다. 유형의 전송 매체에는 동축 케이블; 컴퓨터 시스템 내의 버스를 포함하는 와이어를 포함한 구리 와이어 및 광 섬유가 포함된다. 반송파 전송 매체는 전기 또는 전자기 신호, 또는 무선 주파수(RF) 및 적외선(IR) 데이터 통신 중에 생성되는 것과 같은 음향 또는 광파의 형태를 취할 수 있다. 따라서, 컴퓨터 판독 가능 매체의 일반적인 형태에는, 예를 들어, 플로피 디스크, 플렉시블 디스크, 하드 디스크, 자기 테이프, 임의의 기타 자기 매체, CD-ROM, DVD 또는 DVD-ROM, 임의의 기타 광학 매체, 펀치 카드 용지 테이프, 구멍 패턴이 있는 임의의 기타 물리적 저장 매체, RAM, ROM, PROM 및 EPROM, FLASH-EPROM, 임의의 기타 메모리 칩 또는 카트리지, 데이터 또는 명령을 전송하는 반송파, 이러한 반송파를 전송하는 케이블 또는 링크, 또는 컴퓨터가 프로그래밍 코드 및/또는 데이터를 읽을 수 있는 임의의 기타 매체가 포함된다. 이러한 형태의 컴퓨터 판독 가능 매체 중 다수는 실행을 위해 하나 이상의 명령의 하나 이상의 시퀀스를 프로세서에 전달하는 데 관여할 수 있다.Accordingly, machine-readable media such as computer-executable code may take many forms, including but not limited to tangible storage media, carrier wave media, or physical transmission media. Non-volatile storage media include, for example, any storage devices of any computer(s), such as optical or magnetic disks, such as those that may be used to implement the databases shown in the drawings, and the like. Volatile storage media include dynamic memory, such as the main memory of these computer platforms. Tangible transmission media include coaxial cable; Included are copper wires and optical fibers, including wires that contain buses in computer systems. Carrier-wave transmission media can take the form of electrical or electromagnetic signals, or acoustic or light waves, such as those generated during radio frequency (RF) and infrared (IR) data communications. Thus, common forms of computer readable media include, for example, floppy disks, flexible disks, hard disks, magnetic tapes, any other magnetic media, CD-ROMs, DVDs or DVD-ROMs, any other optical media, punches Card stock tape, any other physical storage medium with a pattern of holes, RAM, ROM, PROM and EPROM, FLASH-EPROM, any other memory chip or cartridge, carrier waves carrying data or commands, cables carrying such carrier waves, or links, or any other medium from which a computer can read programming code and/or data. Many of these forms of computer readable media may be involved in carrying one or more sequences of one or more instructions to a processor for execution.

컴퓨터 시스템(201)은, 예를 들어, 본 개시의 방법의 결과를 제공하기 위한 사용자 인터페이스(UI)(240)를 구성하는 전자 디스플레이(235)를 포함하거나 그와 통신할 수 있다. UI의 예로는, 제한 없이, 그래픽 사용자 인터페이스(GUI) 및 웹-기반 사용자 인터페이스가 포함된다.The computer system 201 may include or communicate with an electronic display 235 that constitutes, for example, a user interface (UI) 240 for presenting results of the methods of the present disclosure. Examples of UIs include, without limitation, graphical user interfaces (GUIs) and web-based user interfaces.

본 개시의 방법 및 시스템은 하나 이상의 알고리즘에 의해 구현될 수 있다. 알고리즘은 중앙 처리 장치(205)에 의해 실행될 때 소프트웨어를 통해 구현될 수 있다. 알고리즘은, 예를 들어, 지원 벡터 머신 또는 신경망과 같은, 예를 들어, 훈련된 알고리즘(또는 훈련된 기계 학습 알고리즘)일 수 있다.The methods and systems of this disclosure may be implemented by one or more algorithms. Algorithms may be implemented via software when executed by the central processing unit 205 . The algorithm may be, for example, a trained algorithm (or a trained machine learning algorithm), such as a support vector machine or a neural network.

실시예Example

하기 실시예는 본 발명의 다양한 실시양태를 예시하려는 목적으로 제공된 것이며, 본 발명을 어떠한 방식으로든 제한하려는 것이 아니다. 본원에 기재된 방법과 함께 본 실시예는 본원의 바람직한 실시양태를 나타내고, 예시적이며, 본 발명의 범위를 제한하려는 것이 아니다. 청구항의 범위에 의해 정의된 바와 같은 본 발명의 사상 내에 포함되는 변경 및 다른 용도가 당업자에게 이루어질 것이다.The following examples are provided for the purpose of illustrating various embodiments of the invention and are not intended to limit the invention in any way. These examples, along with the methods described herein, represent preferred embodiments of the present application, are illustrative, and are not intended to limit the scope of the present invention. Modifications and other uses that fall within the spirit of the invention as defined by the scope of the claims will occur to those skilled in the art.

실시예 1: 선택적 시퀀싱을 위한 방법Example 1: Methods for selective sequencing

생물학적 샘플을 대상체로부터 수득하고, 무세포 핵산을 샘플로부터 단리하였다. 메틸화된 핵산에 특이적으로 결합하는 항체를 사용하여 메틸화된 서열을 갖는 핵산을 메틸화된 서열을 갖지 않는 핵산으로부터 분리하였다. 항체에 결합된 핵산을 항체로부터 정제한 다음 원형화시키고 시퀀싱하여 대상체에서 메틸화된 서열을 갖는 무세포 핵산의 서열을 수득하였다.A biological sample is obtained from the subject and cell-free nucleic acids are isolated from the sample. Nucleic acids with methylated sequences are separated from nucleic acids without methylated sequences using antibodies that specifically bind to methylated nucleic acids. Nucleic acids bound to the antibody were purified from the antibody, then circularized and sequenced to obtain sequences of cell-free nucleic acids having methylated sequences in the subject.

본 발명의 바람직한 실시양태가 본원에서 제시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 관련 기술 분야의 통상의 기술자에게 명백할 것이다. 수많은 변형, 변경 및 대체가 이제 본 발명을 벗어나지 않으면서 관련 기술 분야의 통상의 기술자에 의해 이루어질 것이다. 본원에 기재된 본 발명의 실시양태에 대한 다양한 대안이 사용될 수 있음을 이해해야 한다. 하기 청구범위는 본 발명의 범위를 규정하고 이들 청구범위 및 그의 균등물의 범위 내의 방법 및 구조는 청구범위에 의해 포함되는 것으로 의도된다.Although preferred embodiments of the invention have been shown and described herein, it will be apparent to those skilled in the art that these embodiments are provided by way of example only. Numerous variations, modifications and substitutions will now be made by those skilled in the art without departing from the invention. It should be understood that various alternatives to the embodiments of the invention described herein may be used. It is intended that the following claims define the scope of the invention and that methods and structures within the scope of these claims and their equivalents be covered by the claims.

Claims (67)

무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법으로서,
(a) 상기 복수의 핵산 분자 또는 이의 유도체를 복수의 결합제와 접촉시켜, 상기 복수의 결합제에 커플링된 상기 복수의 핵산 분자의 제1 서브세트 및 상기 복수의 핵산 분자의 제2 서브세트를 제공하는 단계;
(b) 상기 복수의 결합제에 커플링된 상기 복수의 핵산 분자의 제1 서브세트를, 상기 복수의 핵산 분자의 제2 서브세트로부터 분리하는 단계;
(c) (b) 이후에, 상기 복수의 핵산 분자의 상기 제1 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자를 수득하는 단계; 및
(d) 상기 원형화된 핵산 분자 또는 이의 유도체를 확인하는 단계
를 포함하는, 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법.
A method of processing a plurality of nucleic acid molecules derived from a cell-free biological sample comprising:
(a) contacting the plurality of nucleic acid molecules or derivatives thereof with a plurality of binding agents to provide a first subset of the plurality of nucleic acid molecules and a second subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents; doing;
(b) separating a first subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents from a second subset of the plurality of nucleic acid molecules;
(c) after (b), circularizing the nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules to obtain circularized nucleic acid molecules; and
(d) identifying the circularized nucleic acid molecule or derivative thereof
A method for processing a plurality of nucleic acid molecules derived from a cell-free biological sample, comprising:
제1항에 있어서, 상기 복수의 핵산 분자는 데옥시리보핵산(DNA) 분자 또는 리보핵산(RNA) 분자를 포함하는 것인 방법.The method of claim 1 , wherein the plurality of nucleic acid molecules comprises deoxyribonucleic acid (DNA) molecules or ribonucleic acid (RNA) molecules. 제1항 또는 제2항에 있어서, 원형화는 상기 핵산 분자의 5' 말단과 3' 말단을 서로 결찰시키는 것을 포함하는 것인 방법.3. The method according to claim 1 or 2, wherein the circularization comprises ligating the 5' end and the 3' end of the nucleic acid molecule to each other. 제1항 내지 제3항 중 어느 한 항에 있어서, 원형화는 어댑터를 상기 핵산 분자의 3' 말단, 5' 말단, 또는 5' 말단과 3' 말단 둘 모두에 커플링시키는 것을 포함하는 것인 방법.4. The method of any one of claims 1 to 3, wherein circularization comprises coupling adapters to the 3' end, the 5' end, or both the 5' and 3' ends of the nucleic acid molecule. method. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 원형화된 핵산 분자를 핵산 증폭시켜, 상기 원형화된 핵산 분자의 복수의 증폭 산물을 생성하는 단계를 추가로 포함하며, 여기서 (d)는 상기 복수의 핵산 증폭 산물을 확인하는 것을 포함하는 것인 방법.5. The method of any one of claims 1 to 4, further comprising nucleic acid amplifying the circularized nucleic acid molecule to generate a plurality of amplification products of the circularized nucleic acid molecule, wherein (d) The method comprising identifying the plurality of nucleic acid amplification products. 제5항에 있어서, 상기 핵산 증폭은 가닥 치환 활성을 갖는 폴리머라제에 의해 수행되는 것인 방법.The method of claim 5, wherein the nucleic acid amplification is performed by a polymerase having strand displacement activity. 제5항에 있어서, 상기 핵산 증폭은 가닥 치환 활성을 갖지 않는 폴리머라제에 의해 수행되는 것인 방법.6. The method of claim 5, wherein the nucleic acid amplification is performed by a polymerase having no strand displacement activity. 제5항에 있어서, 상기 핵산 증폭은, 상기 원형화된 핵산 분자를 무작위 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함하는 것인 방법.6. The method of claim 5, wherein amplifying the nucleic acid comprises contacting the circularized nucleic acid molecule with an amplification reaction mixture comprising random primers. 제5항에 있어서, 상기 핵산 증폭은, 상기 원형화된 핵산 분자를 하나 이상의 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함하고, 프라이머 각각은 서열 상보성을 통해 상이한 표적 서열에 특이적으로 혼성화하는 것인 방법.The method of claim 5, wherein the nucleic acid amplification comprises contacting the circularized nucleic acid molecule with an amplification reaction mixture comprising one or more primers, each of which specifically hybridizes to a different target sequence through sequence complementarity. how it would be. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 결합제는 항체 또는 이의 단편을 포함하는 것인 방법.10. The method of any one of claims 1-9, wherein the binding agent comprises an antibody or fragment thereof. 제10항에 있어서, 상기 항체 또는 이의 단편은 핵산 결합 단백질에 특이적으로 결합하는 것인 방법.11. The method of claim 10, wherein the antibody or fragment thereof specifically binds to a nucleic acid binding protein. 제10항에 있어서, 상기 핵산 결합 단백질은 염색질 단백질인 방법.11. The method of claim 10, wherein the nucleic acid binding protein is a chromatin protein. 제10항에 있어서, 상기 핵산 결합 단백질은 히스톤인 방법.11. The method of claim 10, wherein the nucleic acid binding protein is a histone. 제10항에 있어서, 상기 핵산 결합 단백질은 메틸 CpG 결합 단백질인 방법.11. The method of claim 10, wherein the nucleic acid binding protein is a methyl CpG binding protein. 제10항에 있어서, 상기 핵산 결합 단백질은 전사 인자인 방법.11. The method of claim 10, wherein the nucleic acid binding protein is a transcription factor. 제10항에 있어서, 상기 핵산 결합 단백질은 RNA 결합 단백질인 방법.11. The method of claim 10, wherein the nucleic acid binding protein is an RNA binding protein. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 항체 또는 이의 단편은 핵산 서열에 특이적으로 결합하는 것인 방법.10. The method of any one of claims 1 to 9, wherein the antibody or fragment thereof specifically binds to a nucleic acid sequence. 제17항에 있어서, 상기 핵산 서열은 메틸화된 것인 방법.18. The method of claim 17, wherein the nucleic acid sequence is methylated. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 결합제는 폴리펩타이드 또는 핵산을 포함하는 것인 방법.10. The method of any one of claims 1-9, wherein the binding agent comprises a polypeptide or a nucleic acid. 제19항에 있어서, 상기 폴리펩타이드는 스트렙타비딘을 포함하는 것인 방법.20. The method of claim 19, wherein the polypeptide comprises streptavidin. 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 복수의 무세포 핵산 분자들의 각각의 무세포 핵산 분자의 크기를 결정하는 단계를 추가로 포함하는 방법.19. The method of any one of claims 1 to 18, further comprising determining the size of each cell-free nucleic acid molecule of the plurality of cell-free nucleic acid molecules. 제1항 내지 제19항 중 어느 한 항에 있어서, (d)는 상기 원형화된 핵산 분자 또는 이의 유도체를 시퀀싱하는 것을 포함하는 것인 방법.20. The method of any one of claims 1-19, wherein (d) comprises sequencing the circularized nucleic acid molecule or derivative thereof. 제22항에 있어서, 상기 시퀀싱은 합성에 의한 시퀀싱, 결찰에 의한 시퀀싱, 나노포어 시퀀싱, 나노볼 시퀀싱, 이온 검출, 혼성화에 의한 시퀀싱, 중합된 콜로니(POLONY) 시퀀싱, 나노그리드 롤링 서클 시퀀싱(ROLONY), 및 이온 토렌트 시퀀싱 중 하나 이상으로부터 선택된 방법을 포함하는 것인 방법.23. The method of claim 22, wherein the sequencing is sequencing by synthesis, sequencing by ligation, nanopore sequencing, nanoball sequencing, ion detection, sequencing by hybridization, polymerized colony (POLONY) sequencing, nanogrid rolling circle sequencing (ROLONY) ), and Ion Torrent sequencing. 제1항 내지 제23항 중 어느 한 항에 있어서, 상기 무세포 생물학적 샘플은 75 나노그램 미만의 핵산을 포함하는 것인 방법.24. The method of any one of claims 1-23, wherein the cell-free biological sample comprises less than 75 nanograms of nucleic acid. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 무세포 생물학적 샘플은 체액을 포함하는 것인 방법.25. The method of any one of claims 1-24, wherein the cell-free biological sample comprises bodily fluid. 제25항에 있어서, 상기 체액은 소변, 타액, 혈액, 혈청, 혈장, 눈물, 가래, 뇌척수액, 활액, 점액, 담즙, 정액, 림프, 양수, 월경액, 또는 이들의 조합인 방법.26. The method of claim 25, wherein the bodily fluid is urine, saliva, blood, serum, plasma, tears, sputum, cerebrospinal fluid, synovial fluid, mucus, bile, semen, lymph, amniotic fluid, menstrual fluid, or a combination thereof. 제1항 내지 제26항 중 어느 한 항에 있어서, (d)는 상기 원형화된 핵산 분자 또는 이의 유도체를 시퀀싱하는 것을 포함하는 것인 방법.27. The method of any one of claims 1-26, wherein (d) comprises sequencing the circularized nucleic acid molecule or derivative thereof. 제27항에 있어서, 복수의 참조 서열에 대해 상기 서열을 프로세싱하여, 상기 복수의 참조 서열의 적어도 한 서브세트에 상응하는 상기 서열을 확인함으로써, 대상체가 질병을 갖거나 가질 위험이 있는지를 결정하는 단계를 추가로 포함하는 방법.28. The method of claim 27, wherein the method determines whether a subject has or is at risk of having a disease by processing the sequence against a plurality of reference sequences to identify the sequence corresponding to at least a subset of the plurality of reference sequences. How to include additional steps. 제28항에 있어서, 상기 질병은 암인 방법.29. The method of claim 28, wherein the disease is cancer. 제29항에 있어서, 상기 암은 결장암, 비소세포 폐암, 소세포 폐암, 유방암, 간세포 암종, 간암, 피부암, 악성 흑색종, 자궁내막암, 식도암, 위암, 난소암, 췌장암, 뇌암, 백혈병, 림프종 및 골수종으로 이루어진 군으로부터 선택되는 것인 방법.30. The method of claim 29, wherein the cancer is colon cancer, non-small cell lung cancer, small cell lung cancer, breast cancer, hepatocellular carcinoma, liver cancer, skin cancer, malignant melanoma, endometrial cancer, esophageal cancer, gastric cancer, ovarian cancer, pancreatic cancer, brain cancer, leukemia, lymphoma, and and is selected from the group consisting of myeloma. 제28항에 있어서, 확인된 상기 서열을 사용하여 상기 대상체가 질병을 갖거나 가질 위험이 있음을 표시하는 전자 보고서를 산출하는 단계를 추가로 포함하는 방법.29. The method of claim 28, further comprising generating an electronic report indicating that the subject has or is at risk of having the disease using the sequence identified. 제28항에 있어서, 확인된 상기 서열을 사용하여 질병에 대해 상기 대상체에게 치료적 개입을 제공하는 단계를 추가로 포함하는 방법.29. The method of claim 28, further comprising providing therapeutic intervention to said subject for a disease using said identified sequence. 제28항에 있어서, 확인된 상기 서열을 사용하여 상기 질병에 대해 상기 대상체를 치료하는 단계를 추가로 포함하는 방법.29. The method of claim 28, further comprising treating the subject for the disease using the identified sequence. 제32항 또는 제33항에 있어서, 상기 대상체는 상기 대상체에게 화학요법 또는 면역요법을 수행함으로써 치료되는 것인 방법.34. The method of claim 32 or 33, wherein the subject is treated by subjecting the subject to chemotherapy or immunotherapy. 제28항에 있어서, 확인된 상기 서열을 사용하여 상기 대상체의 진행 또는 퇴행에 대해 상기 대상체를 모니터링하는 단계를 추가로 포함하는 방법.29. The method of claim 28, further comprising monitoring the subject for progression or regression using the sequence identified. 제1항에 있어서, (c)에서 상기 핵산 분자는 상기 복수의 결합제들의 결합제에 커플링되는 것인 방법.The method of claim 1 , wherein in (c) the nucleic acid molecule is coupled to a binding agent of the plurality of binding agents. 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법으로서,
(a) 상기 복수의 핵산 분자들의 핵산 분자에 대한 메틸화 상태를 결정하는 단계;
(b) 상기 복수의 핵산 분자들의 상기 핵산 분자에 대한 크기를 결정하는 단계; 및
(c) (i) 제1 데이터베이스에 대한 상기 복수의 핵산 분자들의 상기 핵산 분자에 대한 상기 메틸화 상태, 및 (ii) 제2 데이터베이스에 대한 상기 복수의 핵산 분자들의 상기 핵산 분자에 대한 상기 크기를 프로세싱하여, 적어도 한 질병과 상기 메틸화 상태 및 상기 크기의 연관성을 확인하는 단계
를 포함하는, 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법.
A method of processing a plurality of nucleic acid molecules derived from a cell-free biological sample comprising:
(a) determining a methylation state of a nucleic acid molecule of the plurality of nucleic acid molecules;
(b) determining the size of the nucleic acid molecule of the plurality of nucleic acid molecules; and
(c) processing (i) the methylation status for the nucleic acid molecule of the plurality of nucleic acid molecules for a first database, and (ii) the size for the nucleic acid molecule of the plurality of nucleic acid molecules for a second database So, confirming the association between at least one disease and the methylation status and the size
A method for processing a plurality of nucleic acid molecules derived from a cell-free biological sample, comprising:
제37항에 있어서, 상기 메틸화 상태를 결정하는 단계는, 상기 복수의 핵산 분자들의 상기 핵산 분자를 시퀀싱하는 것을 포함하는 것인 방법.38. The method of claim 37, wherein determining the methylation status comprises sequencing the nucleic acid molecules of the plurality of nucleic acid molecules. 제38항에 있어서, 상기 시퀀싱은 합성에 의한 시퀀싱, 결찰에 의한 시퀀싱, 나노포어 시퀀싱, 나노볼 시퀀싱, 이온 검출, 혼성화에 의한 시퀀싱, 중합된 콜로니(POLONY) 시퀀싱, 나노그리드 롤링 서클 시퀀싱(ROLONY) 및 이온 토렌트 시퀀싱 중 하나 이상으로부터 선택된 방법을 포함하는 것인 방법.39. The method of claim 38, wherein the sequencing is sequencing by synthesis, sequencing by ligation, nanopore sequencing, nanoball sequencing, ion detection, sequencing by hybridization, polymerized colony (POLONY) sequencing, nanogrid rolling circle sequencing (ROLONY) ) and Ion Torrent sequencing. 제37항에 있어서, 상기 메틸화 상태를 결정하는 단계는, 상기 핵산 분자를 메틸화된 핵산 또는 이의 유도체에 특이적으로 결합하는 결합제에 접촉시키는 것을 포함하는 것인 방법.38. The method of claim 37, wherein determining the methylation status comprises contacting the nucleic acid molecule with a binding agent that specifically binds to a methylated nucleic acid or derivative thereof. 제37항 내지 제40항 중 어느 한 항에 있어서, 상기 메틸화 상태를 결정하는 단계는,
(a) 상기 복수의 핵산 분자를 복수의 결합제와 접촉시켜, 상기 복수의 결합제에 커플링된 상기 복수의 핵산 분자의 제1 서브세트 및 상기 복수의 핵산 분자의 제2 서브세트를 제공하는 단계;
(b) 상기 복수의 결합제에 커플링된 상기 복수의 핵산 분자의 상기 제1 서브세트를, 상기 복수의 핵산 분자의 상기 제2 서브세트로부터 분리하는 단계;
(c) (b) 이후에, 상기 복수의 핵산 분자의 상기 제1 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자를 수득하는 단계; 및
(d) 상기 원형화된 핵산 분자 또는 이의 유도체를 확인하는 단계
를 포함하는 것인 방법.
41. The method of any one of claims 37-40, wherein determining the methylation status comprises:
(a) contacting the plurality of nucleic acid molecules with a plurality of binding agents to provide a first subset of the plurality of nucleic acid molecules and a second subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents;
(b) separating the first subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents from the second subset of the plurality of nucleic acid molecules;
(c) after (b), circularizing the nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules to obtain circularized nucleic acid molecules; and
(d) identifying the circularized nucleic acid molecule or derivative thereof
A method comprising a.
제37항 내지 제41항 중 어느 한 항에 있어서, 상기 결합제는 항체 또는 이의 단편을 포함하는 것인 방법.42. The method of any one of claims 37-41, wherein the binding agent comprises an antibody or fragment thereof. 제37항 내지 제41항 중 어느 한 항에 있어서, 상기 결합제는 폴리펩타이드 또는 핵산을 포함하는 것인 방법.42. The method of any one of claims 37-41, wherein the binding agent comprises a polypeptide or a nucleic acid. 제43항에 있어서, 상기 폴리펩타이드는 스트렙타비딘을 포함하는 것인 방법.44. The method of claim 43, wherein the polypeptide comprises streptavidin. 제37항 내지 제44항 중 어느 한 항에 있어서, 상기 복수의 핵산 분자는 데옥시리보핵산(DNA) 분자 또는 리보핵산(RNA) 분자를 포함하는 것인 방법.45. The method of any one of claims 37-44, wherein the plurality of nucleic acid molecules comprises deoxyribonucleic acid (DNA) molecules or ribonucleic acid (RNA) molecules. 제41항 또는 제45항에 있어서, 원형화는 상기 핵산 분자의 5' 말단과 3' 말단을 서로 결찰시키는 것을 포함하는 것인 방법.46. The method of claim 41 or 45, wherein circularization comprises ligating the 5' end and the 3' end of the nucleic acid molecule to each other. 제41항 내지 제46항 중 어느 한 항에 있어서, 원형화는 어댑터를 상기 핵산 분자의 3' 말단, 5' 말단, 또는 5' 말단과 3' 말단 둘 모두에 커플링시키는 것을 포함하는 것인 방법.47. The method of any one of claims 41-46, wherein circularization comprises coupling adapters to the 3' end, the 5' end, or both the 5' and 3' ends of the nucleic acid molecule. method. 제41항 내지 제47항 중 어느 한 항에 있어서, 상기 원형화된 핵산 분자를 핵산 증폭시켜, 상기 원형화된 핵산 분자의 복수의 증폭 산물을 생성하는 단계를 추가로 포함하고, 여기서 (d)는 상기 복수의 핵산 증폭 산물을 확인하는 것을 포함하는 것인 방법.48. The method of any one of claims 41 to 47, further comprising nucleic acid amplifying the circularized nucleic acid molecule to generate a plurality of amplification products of the circularized nucleic acid molecule, wherein (d) The method comprising identifying the plurality of nucleic acid amplification products. 제48항에 있어서, 상기 핵산 증폭은 가닥 치환 활성을 갖는 폴리머라제에 의해 수행되는 것인 방법.49. The method of claim 48, wherein the nucleic acid amplification is performed by a polymerase having strand displacement activity. 제48항에 있어서, 상기 핵산 증폭은 가닥 치환 활성을 갖지 않는 폴리머라제에 의해 수행되는 것인 방법.49. The method of claim 48, wherein the nucleic acid amplification is performed by a polymerase that does not have strand displacement activity. 제48항에 있어서, 상기 핵산 증폭은, 상기 원형화된 핵산 분자를 무작위 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함하는 것인 방법.49. The method of claim 48, wherein amplifying the nucleic acid comprises contacting the circularized nucleic acid molecule with an amplification reaction mixture comprising random primers. 제48항에 있어서, 상기 핵산 증폭은, 상기 원형화된 핵산 분자를 하나 이상의 프라이머를 포함하는 증폭 반응 혼합물에 접촉시키는 것을 포함하고, 프라이머 각각은 서열 상보성을 통해 상이한 표적 서열에 특이적으로 혼성화하는 것인 방법.49. The method of claim 48, wherein the nucleic acid amplification comprises contacting the circularized nucleic acid molecule with an amplification reaction mixture comprising one or more primers, each of which specifically hybridizes to a different target sequence through sequence complementarity. how it would be. 제41항 내지 제52항 중 어느 한 항에 있어서, (d)는 상기 원형화된 핵산 분자 또는 이의 유도체를 시퀀싱하는 것을 포함하는 것인 방법.53. The method of any one of claims 41-52, wherein (d) comprises sequencing the circularized nucleic acid molecule or derivative thereof. 제53항에 있어서, 상기 시퀀싱은 합성에 의한 시퀀싱, 결찰에 의한 시퀀싱, 나노포어 시퀀싱, 나노볼 시퀀싱, 이온 검출, 혼성화에 의한 시퀀싱, 중합된 콜로니(POLONY) 시퀀싱, 나노그리드 롤링 서클 시퀀싱(ROLONY) 및 이온 토렌트 시퀀싱 중 하나 이상으로부터 선택된 방법을 포함하는 것인 방법.54. The method of claim 53, wherein the sequencing is sequencing by synthesis, sequencing by ligation, nanopore sequencing, nanoball sequencing, ion detection, sequencing by hybridization, polymerized colony (POLONY) sequencing, nanogrid rolling circle sequencing (ROLONY) ) and Ion Torrent sequencing. 제37항 내지 제54항 중 어느 한 항에 있어서, 상기 무세포 생물학적 샘플은 75 나노그램 미만의 핵산을 포함하는 것인 방법.55. The method of any one of claims 37-54, wherein the cell-free biological sample comprises less than 75 nanograms of nucleic acid. 제37항 내지 제55항 중 어느 한 항에 있어서, 상기 무세포 생물학적 샘플은 체액을 포함하는 것인 방법.56. The method of any one of claims 37-55, wherein the cell-free biological sample comprises bodily fluid. 제56항에 있어서, 상기 체액은 소변, 타액, 혈액, 혈청, 혈장, 눈물, 가래, 뇌척수액, 활액, 점액, 담즙, 정액, 림프, 양수, 월경액, 또는 이들의 조합인 방법.57. The method of claim 56, wherein the bodily fluid is urine, saliva, blood, serum, plasma, tears, sputum, cerebrospinal fluid, synovial fluid, mucus, bile, semen, lymph, amniotic fluid, menstrual fluid, or combinations thereof. 제37항 내지 제57항 중 어느 한 항에 있어서, 복수의 참조 메틸화 상태에 대해 상기 메틸화 상태를 프로세싱하고, 복수의 참조 크기에 대해 상기 크기를 프로세싱하여, 상기 복수의 참조 메틸화 상태의 적어도 한 서브세트에 상응하는 상기 메틸화 상태 및 상기 참조 크기의 적어도 한 서브세트에 상응하는 상기 크기를 확인함으로써, 대상체가 질병을 갖거나 가질 위험이 있는지를 결정하는 단계를 추가로 포함하는 방법.58. The method of any one of claims 37-57, wherein processing the methylation status relative to a plurality of reference methylation statuses and processing the magnitudes relative to a plurality of reference methylation statuses results in at least one sub-selection of the plurality of reference methylation statuses. determining whether the subject has or is at risk of having the disease by ascertaining the methylation status corresponding to a set and the size corresponding to at least a subset of the reference size. 제58항에 있어서, 상기 질병은 암인 방법.59. The method of claim 58, wherein the disease is cancer. 제59항에 있어서, 상기 암은 결장암, 비소세포 폐암, 소세포 폐암, 유방암, 간세포 암종, 간암, 피부암, 악성 흑색종, 자궁내막암, 식도암, 위암, 난소암, 췌장암, 뇌암, 백혈병, 림프종 및 골수종으로 이루어진 군으로부터 선택되는 것인 방법.60. The method of claim 59, wherein the cancer is colon cancer, non-small cell lung cancer, small cell lung cancer, breast cancer, hepatocellular carcinoma, liver cancer, skin cancer, malignant melanoma, endometrial cancer, esophageal cancer, gastric cancer, ovarian cancer, pancreatic cancer, brain cancer, leukemia, lymphoma, and and is selected from the group consisting of myeloma. 제58항에 있어서, 확인된 상기 메틸화 상태 및 상기 크기를 이용하여 상기 대상체가 질병을 갖거나 가질 위험이 있음을 표시하는 전자 보고서를 산출하는 단계를 추가로 포함하는 방법.59. The method of claim 58, further comprising generating an electronic report indicating that the subject has or is at risk of having the disease using the identified methylation status and the size. 제58항에 있어서, 확인된 상기 메틸화 상태 및 상기 크기를 이용하여 질병에 대해 상기 대상체에게 치료적 개입을 제공하는 단계를 추가로 포함하는 방법.59. The method of claim 58, further comprising providing a therapeutic intervention to the subject for a disease using the determined methylation status and the size. 제58항에 있어서, 확인된 상기 메틸화 상태 및 상기 크기를 이용하여 상기 질병에 대해 상기 대상체를 치료하는 단계를 추가로 포함하는 것인 방법.59. The method of claim 58, further comprising treating the subject for the disease using the determined methylation status and the size. 제62항 또는 제63항에 있어서, 상기 대상체는 상기 대상체에게 화학요법 또는 면역요법을 수행함으로써 치료되는 것인 방법.64. The method of claim 62 or 63, wherein the subject is treated by subjecting the subject to chemotherapy or immunotherapy. 제58항에 있어서, 확인된 상기 메틸화 상태 및 상기 크기를 이용하여 상기 대상체의 진행 또는 퇴행에 대해 상기 대상체를 모니터링하는 단계를 추가로 포함하는 방법.59. The method of claim 58, further comprising monitoring the subject for progression or regression using the identified methylation status and the size. 대상체의 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법으로서,
(a) 상기 복수의 핵산 분자 또는 이의 유도체를 복수의 결합제와 접촉시켜, 상기 복수의 결합제에 커플링된 상기 복수의 핵산 분자의 제1 서브세트 및 상기 복수의 핵산 분자의 제2 서브세트를 제공하는 단계;
(b) 상기 복수의 결합제에 커플링된 상기 복수의 핵산 분자의 상기 제1 서브세트를, 상기 복수의 핵산 분자의 상기 제2 서브세트로부터 분리하는 단계;
(c) (b) 이후에, 상기 복수의 핵산 분자의 상기 제1 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자의 제1 서브세트를 수득하는 단계; 및
(d) (b) 이후에, 상기 복수의 핵산 분자의 상기 제2 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자의 제2 서브세트를 수득하는 단계;
(e) 원형화된 핵산 분자 또는 이의 유도체의 상기 제1 서브세트를 시퀀싱하여 제1 크기를 수득하고, 원형화된 핵산 분자 또는 이의 유도체의 상기 제2 서브세트를 시퀀싱하여 제2 크기를 수득하는 단계;
(f) 상기 제1 크기와 상기 제2 크기를 비교하여, 상기 대상체의 질병 수준을 결정하는 단계
를 포함하는, 대상체의 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법.
A method of processing a plurality of nucleic acid molecules derived from a cell-free biological sample of a subject comprising:
(a) contacting the plurality of nucleic acid molecules or derivatives thereof with a plurality of binding agents to provide a first subset of the plurality of nucleic acid molecules and a second subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents; doing;
(b) separating the first subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents from the second subset of the plurality of nucleic acid molecules;
(c) after (b), circularizing the nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules to obtain a first subset of circularized nucleic acid molecules; and
(d) after (b), circularizing nucleic acid molecules derived from the second subset of the plurality of nucleic acid molecules to obtain a second subset of circularized nucleic acid molecules;
(e) sequencing said first subset of circularized nucleic acid molecules or derivatives thereof to obtain a first size and sequencing said second subset of circularized nucleic acid molecules or derivatives thereof to obtain a second size; step;
(f) comparing the first size and the second size to determine the disease level of the subject
A method of processing a plurality of nucleic acid molecules derived from a cell-free biological sample of a subject, comprising:
대상체의 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법으로서,
(a) 상기 복수의 핵산 분자 또는 이의 유도체를 복수의 결합제와 접촉시켜, 상기 복수의 결합제에 커플링된 상기 복수의 핵산 분자의 제1 서브세트 및 상기 복수의 핵산 분자의 제2 서브세트를 제공하는 단계;
(b) 상기 복수의 결합제에 커플링된 상기 복수의 핵산 분자의 상기 제1 서브세트를, 상기 복수의 핵산 분자의 상기 제2 서브세트로부터 분리하는 단계;
(c) (b) 이후에, 상기 복수의 핵산 분자의 상기 제1 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자의 제1 서브세트를 수득하는 단계; 및
(d) (b) 이후에, 상기 복수의 핵산 분자의 상기 제2 서브세트로부터 유래된 핵산 분자를 원형화하여, 원형화된 핵산 분자의 제2 서브세트를 수득하는 단계;
(e) 원형화된 핵산 분자 또는 이의 유도체의 상기 제1 서브세트를 시퀀싱하여 제1 최종 서열을 수득하고, 원형화된 핵산 분자 또는 이의 유도체의 상기 제2 서브세트를 시퀀싱하여 제2 최종 서열을 수득하는 단계;
(f) 상기 제1 최종 서열과 상기 제2 최종 서열을 비교하여, 상기 대상체의 질병 수준을 결정하는 단계
를 포함하는, 대상체의 무세포 생물학적 샘플로부터 유래된 복수의 핵산 분자를 프로세싱하는 방법.
A method of processing a plurality of nucleic acid molecules derived from a cell-free biological sample of a subject comprising:
(a) contacting the plurality of nucleic acid molecules or derivatives thereof with a plurality of binding agents to provide a first subset of the plurality of nucleic acid molecules and a second subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents; doing;
(b) separating the first subset of the plurality of nucleic acid molecules coupled to the plurality of binding agents from the second subset of the plurality of nucleic acid molecules;
(c) after (b), circularizing the nucleic acid molecules derived from the first subset of the plurality of nucleic acid molecules to obtain a first subset of circularized nucleic acid molecules; and
(d) after (b), circularizing nucleic acid molecules derived from the second subset of the plurality of nucleic acid molecules to obtain a second subset of circularized nucleic acid molecules;
(e) sequencing said first subset of circularized nucleic acid molecules or derivatives thereof to obtain a first final sequence, and sequencing said second subset of circularized nucleic acid molecules or derivatives thereof to obtain a second final sequence obtaining;
(f) comparing the first final sequence and the second final sequence to determine the disease level of the subject.
A method of processing a plurality of nucleic acid molecules derived from a cell-free biological sample of a subject, comprising:
KR1020237009253A 2020-08-19 2021-08-17 Methods for Selective Cell-Free Nucleic Acid Analysis KR20230045097A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063067800P 2020-08-19 2020-08-19
US63/067,800 2020-08-19
PCT/US2021/046246 WO2022040147A1 (en) 2020-08-19 2021-08-17 Methods for selective cell-free nucleic acid analysis

Publications (1)

Publication Number Publication Date
KR20230045097A true KR20230045097A (en) 2023-04-04

Family

ID=80323198

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237009253A KR20230045097A (en) 2020-08-19 2021-08-17 Methods for Selective Cell-Free Nucleic Acid Analysis

Country Status (7)

Country Link
US (1) US20230265486A1 (en)
EP (1) EP4200417A1 (en)
JP (1) JP2023540016A (en)
KR (1) KR20230045097A (en)
CN (1) CN116472348A (en)
CA (1) CA3189709A1 (en)
WO (1) WO2022040147A1 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3383994A4 (en) * 2015-12-03 2019-08-28 Accuragen Holdings Limited Methods and compositions for forming ligation products
WO2017223366A1 (en) * 2016-06-23 2017-12-28 Accuragen Holdings Limited Cell-free nucleic acid standards and uses thereof
SG10202111825YA (en) * 2016-08-15 2021-12-30 Accuragen Holdings Ltd Compositions and methods for detecting rare sequence variants
EP3548632A4 (en) * 2016-11-30 2020-06-24 The Chinese University Of Hong Kong Analysis of cell-free dna in urine and other samples
WO2020125709A1 (en) * 2018-12-19 2020-06-25 The Chinese University Of Hong Kong Cell-free dna end characteristics

Also Published As

Publication number Publication date
WO2022040147A1 (en) 2022-02-24
US20230265486A1 (en) 2023-08-24
EP4200417A1 (en) 2023-06-28
CN116472348A (en) 2023-07-21
JP2023540016A (en) 2023-09-21
CA3189709A1 (en) 2022-02-24

Similar Documents

Publication Publication Date Title
US20220010372A1 (en) Differential tagging of rna for preparation of a cell-free dna/rna sequencing library
JP7365382B2 (en) Compositions and methods for detecting rare sequence variants
KR102379877B1 (en) Compositions and methods for detecting rare sequence variants
US20220033916A1 (en) Methods and compositions for early cancer detection
US20220112540A1 (en) Methods and systems for disease detection
KR20230045097A (en) Methods for Selective Cell-Free Nucleic Acid Analysis
EP4077735A1 (en) Methods and systems for disease detection
WO2022271857A1 (en) Gene expression and cell-free dna methods and systems for disease detection
WO2022103750A1 (en) Methods and systems for sample normalization
JP2023526032A (en) Cell-free DNA size detection
WO2024102761A1 (en) Tumor nucleic acid identification methods