RU2818052C2 - Способы и системы мониторинга состояния здоровья и патологии органов - Google Patents
Способы и системы мониторинга состояния здоровья и патологии органов Download PDFInfo
- Publication number
- RU2818052C2 RU2818052C2 RU2020141071A RU2020141071A RU2818052C2 RU 2818052 C2 RU2818052 C2 RU 2818052C2 RU 2020141071 A RU2020141071 A RU 2020141071A RU 2020141071 A RU2020141071 A RU 2020141071A RU 2818052 C2 RU2818052 C2 RU 2818052C2
- Authority
- RU
- Russia
- Prior art keywords
- cfdna
- copy number
- tissue
- sample
- genome
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 121
- 210000000056 organ Anatomy 0.000 title claims abstract description 42
- 238000012544 monitoring process Methods 0.000 title claims abstract description 34
- 230000036541 health Effects 0.000 title claims abstract description 24
- 230000007170 pathology Effects 0.000 title description 3
- 239000000523 sample Substances 0.000 claims abstract description 76
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 40
- 239000012472 biological sample Substances 0.000 claims abstract description 37
- 201000010099 disease Diseases 0.000 claims abstract description 36
- 239000012634 fragment Substances 0.000 claims abstract description 32
- 230000008816 organ damage Effects 0.000 claims abstract description 17
- 230000000451 tissue damage Effects 0.000 claims abstract description 13
- 231100000827 tissue damage Toxicity 0.000 claims abstract description 8
- 238000011161 development Methods 0.000 claims abstract description 5
- 230000005779 cell damage Effects 0.000 claims abstract description 4
- 208000037887 cell injury Diseases 0.000 claims abstract description 4
- 230000008859 change Effects 0.000 claims abstract description 3
- 210000001519 tissue Anatomy 0.000 claims description 121
- 210000004027 cell Anatomy 0.000 claims description 54
- 108020004414 DNA Proteins 0.000 claims description 41
- 238000011002 quantification Methods 0.000 claims description 28
- 238000012163 sequencing technique Methods 0.000 claims description 27
- 210000004369 blood Anatomy 0.000 claims description 22
- 239000008280 blood Substances 0.000 claims description 22
- 210000002381 plasma Anatomy 0.000 claims description 20
- 230000003321 amplification Effects 0.000 claims description 16
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 16
- 239000012530 fluid Substances 0.000 claims description 11
- 239000003814 drug Substances 0.000 claims description 8
- 238000009396 hybridization Methods 0.000 claims description 8
- 210000004185 liver Anatomy 0.000 claims description 8
- 210000002700 urine Anatomy 0.000 claims description 8
- 206010036790 Productive cough Diseases 0.000 claims description 7
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 7
- 206010012601 diabetes mellitus Diseases 0.000 claims description 7
- 208000017169 kidney disease Diseases 0.000 claims description 7
- 210000002966 serum Anatomy 0.000 claims description 7
- 210000003802 sputum Anatomy 0.000 claims description 7
- 208000024794 sputum Diseases 0.000 claims description 7
- 238000012408 PCR amplification Methods 0.000 claims description 6
- 230000003862 health status Effects 0.000 claims description 6
- 230000008774 maternal effect Effects 0.000 claims description 6
- 210000003296 saliva Anatomy 0.000 claims description 6
- 210000001138 tear Anatomy 0.000 claims description 6
- 102000053602 DNA Human genes 0.000 claims description 5
- 238000013382 DNA quantification Methods 0.000 claims description 5
- 210000001742 aqueous humor Anatomy 0.000 claims description 5
- 210000003756 cervix mucus Anatomy 0.000 claims description 5
- 229940079593 drug Drugs 0.000 claims description 5
- 210000004080 milk Anatomy 0.000 claims description 5
- 239000008267 milk Substances 0.000 claims description 5
- 235000013336 milk Nutrition 0.000 claims description 5
- -1 tears Substances 0.000 claims description 5
- 210000004127 vitreous body Anatomy 0.000 claims description 5
- 208000011231 Crohn disease Diseases 0.000 claims description 4
- 210000004556 brain Anatomy 0.000 claims description 4
- 206010019280 Heart failures Diseases 0.000 claims description 3
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 claims description 3
- 210000000601 blood cell Anatomy 0.000 claims description 3
- 230000000747 cardiac effect Effects 0.000 claims description 3
- 210000003754 fetus Anatomy 0.000 claims description 3
- 238000013412 genome amplification Methods 0.000 claims description 3
- 210000003292 kidney cell Anatomy 0.000 claims description 3
- 230000001926 lymphatic effect Effects 0.000 claims description 3
- 210000003205 muscle Anatomy 0.000 claims description 3
- 231100000419 toxicity Toxicity 0.000 claims description 3
- 230000001988 toxicity Effects 0.000 claims description 3
- 210000000988 bone and bone Anatomy 0.000 claims description 2
- 210000000845 cartilage Anatomy 0.000 claims description 2
- 210000002919 epithelial cell Anatomy 0.000 claims description 2
- 230000002496 gastric effect Effects 0.000 claims description 2
- 230000000762 glandular Effects 0.000 claims description 2
- 210000002865 immune cell Anatomy 0.000 claims description 2
- 230000000968 intestinal effect Effects 0.000 claims description 2
- 231100000516 lung damage Toxicity 0.000 claims description 2
- 210000004880 lymph fluid Anatomy 0.000 claims description 2
- 210000002569 neuron Anatomy 0.000 claims description 2
- 230000002685 pulmonary effect Effects 0.000 claims description 2
- 230000002792 vascular Effects 0.000 claims description 2
- 108091092584 GDNA Proteins 0.000 claims 1
- 210000005068 bladder tissue Anatomy 0.000 claims 1
- 238000002955 isolation Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 2
- 239000000126 substance Substances 0.000 abstract 1
- 238000009826 distribution Methods 0.000 description 36
- 239000000203 mixture Substances 0.000 description 34
- 210000003734 kidney Anatomy 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 21
- 206010028980 Neoplasm Diseases 0.000 description 19
- 150000007523 nucleic acids Chemical class 0.000 description 17
- 201000011510 cancer Diseases 0.000 description 13
- 238000010801 machine learning Methods 0.000 description 13
- 102000039446 nucleic acids Human genes 0.000 description 13
- 108020004707 nucleic acids Proteins 0.000 description 13
- 208000020832 chronic kidney disease Diseases 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- 238000001574 biopsy Methods 0.000 description 10
- 230000030833 cell death Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- 210000004072 lung Anatomy 0.000 description 9
- 208000014674 injury Diseases 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 108091033319 polynucleotide Proteins 0.000 description 8
- 102000040430 polynucleotide Human genes 0.000 description 8
- 239000002157 polynucleotide Substances 0.000 description 8
- 238000003745 diagnosis Methods 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 230000006378 damage Effects 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 238000002203 pretreatment Methods 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 239000004055 small Interfering RNA Substances 0.000 description 6
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 description 5
- 206010070863 Toxicity to various agents Diseases 0.000 description 5
- 238000000354 decomposition reaction Methods 0.000 description 5
- 230000001605 fetal effect Effects 0.000 description 5
- 210000002216 heart Anatomy 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000008733 trauma Effects 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 208000001647 Renal Insufficiency Diseases 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 239000013060 biological fluid Substances 0.000 description 4
- 210000001072 colon Anatomy 0.000 description 4
- 208000035475 disorder Diseases 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000001973 epigenetic effect Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 201000006370 kidney failure Diseases 0.000 description 4
- 238000012417 linear regression Methods 0.000 description 4
- 230000035935 pregnancy Effects 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 208000031229 Cardiomyopathies Diseases 0.000 description 3
- 208000026350 Inborn Genetic disease Diseases 0.000 description 3
- 206010067125 Liver injury Diseases 0.000 description 3
- 208000027418 Wounds and injury Diseases 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000009534 blood test Methods 0.000 description 3
- 210000001124 body fluid Anatomy 0.000 description 3
- 239000010839 body fluid Substances 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 201000000523 end stage renal failure Diseases 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 208000016361 genetic disease Diseases 0.000 description 3
- 206010025135 lupus erythematosus Diseases 0.000 description 3
- 230000003211 malignant effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008506 pathogenesis Effects 0.000 description 3
- 239000013610 patient sample Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000007306 turnover Effects 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 208000015943 Coeliac disease Diseases 0.000 description 2
- 230000007067 DNA methylation Effects 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 241000283086 Equidae Species 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 206010019196 Head injury Diseases 0.000 description 2
- 208000013875 Heart injury Diseases 0.000 description 2
- 206010019851 Hepatotoxicity Diseases 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 206010029155 Nephropathy toxic Diseases 0.000 description 2
- 206010029260 Neuroblastoma Diseases 0.000 description 2
- 206010053159 Organ failure Diseases 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- 206010039491 Sarcoma Diseases 0.000 description 2
- 102000039471 Small Nuclear RNA Human genes 0.000 description 2
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 2
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 208000028208 end stage renal disease Diseases 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 231100000234 hepatic damage Toxicity 0.000 description 2
- 231100000304 hepatotoxicity Toxicity 0.000 description 2
- 230000007686 hepatotoxicity Effects 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000008818 liver damage Effects 0.000 description 2
- 208000019423 liver disease Diseases 0.000 description 2
- 238000007403 mPCR Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000013188 needle biopsy Methods 0.000 description 2
- 230000007694 nephrotoxicity Effects 0.000 description 2
- 231100000417 nephrotoxicity Toxicity 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 208000030761 polycystic kidney disease Diseases 0.000 description 2
- 238000009598 prenatal testing Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 210000005084 renal tissue Anatomy 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 2
- 238000013106 supervised machine learning method Methods 0.000 description 2
- 208000011580 syndromic disease Diseases 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 206010000234 Abortion spontaneous Diseases 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 206010003011 Appendicitis Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 206010008874 Chronic Fatigue Syndrome Diseases 0.000 description 1
- 206010009900 Colitis ulcerative Diseases 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 208000032027 Essential Thrombocythemia Diseases 0.000 description 1
- 208000001640 Fibromyalgia Diseases 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- 208000037147 Hypercalcaemia Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 1
- 206010023126 Jaundice Diseases 0.000 description 1
- 208000004852 Lung Injury Diseases 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 208000000172 Medulloblastoma Diseases 0.000 description 1
- 206010027406 Mesothelioma Diseases 0.000 description 1
- 241000237852 Mollusca Species 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 208000021642 Muscular disease Diseases 0.000 description 1
- 201000009623 Myopathy Diseases 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 208000006994 Precancerous Conditions Diseases 0.000 description 1
- 206010049422 Precancerous skin lesion Diseases 0.000 description 1
- 208000005107 Premature Birth Diseases 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 206010061481 Renal injury Diseases 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 206010040047 Sepsis Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 206010069363 Traumatic lung injury Diseases 0.000 description 1
- 201000006704 Ulcerative Colitis Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 208000033559 Waldenström macroglobulinemia Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 201000005188 adrenal gland cancer Diseases 0.000 description 1
- 208000024447 adrenal gland neoplasm Diseases 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 210000003567 ascitic fluid Anatomy 0.000 description 1
- 230000008436 biogenesis Effects 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 208000035269 cancer or benign tumor Diseases 0.000 description 1
- 208000002458 carcinoid tumor Diseases 0.000 description 1
- 230000005189 cardiac health Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 210000000038 chest Anatomy 0.000 description 1
- 230000035606 childbirth Effects 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 108091092240 circulating cell-free DNA Proteins 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 238000010201 enrichment analysis Methods 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 231100000753 hepatic injury Toxicity 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 230000000148 hypercalcaemia Effects 0.000 description 1
- 208000030915 hypercalcemia disease Diseases 0.000 description 1
- 230000009610 hypersensitivity Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 208000002551 irritable bowel syndrome Diseases 0.000 description 1
- 208000037806 kidney injury Diseases 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 231100000515 lung injury Toxicity 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 208000037841 lung tumor Diseases 0.000 description 1
- 201000000564 macroglobulinemia Diseases 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 208000015994 miscarriage Diseases 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 201000006417 multiple sclerosis Diseases 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 208000029766 myalgic encephalomeyelitis/chronic fatigue syndrome Diseases 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 238000001921 nucleic acid quantification Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 208000021255 pancreatic insulinoma Diseases 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 201000010065 polycystic ovary syndrome Diseases 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000000955 prescription drug Substances 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 238000011155 quantitative monitoring Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 208000000995 spontaneous abortion Diseases 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Abstract
Изобретение относится к биотехнологии. Описан способ анализа внеклеточной ДНК (вкДНК) в биологическом образце, включающий: получение биологического образца, содержащего вкДНК; выделение вкДНК из указанного образца с получением очищенной вкДНК, где указанная очищенная вкДНК содержит множество фрагментов вкДНК, причем каждый из фрагментов соответствует определенному типу ткани или клеток; количественную оценку указанных фрагментов вкДНК для создания полногеномного профиля числа копий вкДНК, где указанный полногеномный профиль числа копий вкДНК содержит множество сигналов числа копий, каждый из которых соответствует фрагменту вкДНК; и сравнение указанного полногеномного профиля числа копий вкДНК с набором известных сигнатур вкДНК для определения повреждения клеток, повреждения ткани или повреждения органа. Также описан способ мониторинга развития заболевания у субъекта, включающий: получение биологического образца от указанного субъекта, где указанный биологический образец содержит внеклеточную ДНК (вкДНК); количественную оценку вкДНК в указанном образце для получения полногеномного профиля вкДНК, содержащего множество сигналов числа копий, каждый из которых соответствует фрагменту вкДНК определенного типа клеток или типа ткани; и сравнение указанного множества сигналов числа копий вкДНК с набором известных сигналов числа копий здоровых субъектов, где разница между сигналом числа копий в образце и известными сигналами числа копий коррелирует с развитием заболевания у указанного субъекта. Раскрыт способ мониторинга состояния здоровья тканей и органов у субъекта, включающий: получение биологического образца от указанного субъекта, где указанный биологический образец содержит внеклеточную ДНК (вкДНК); количественную оценку вкДНК в указанном образце для получения полногеномного профиля вкДНК, содержащего множество сигналов числа копий, каждый из которых соответствует фрагменту вкДНК определенного типа клеток или типа ткани; и сравнение указанного множества сигналов числа копий вкДНК с набором известных сигналов числа копий здоровых субъектов, где разница между сигналом числа копий в образце и известными сигналами числа копий коррелирует с изменением состояния здоровья органа у указанного субъекта. Изобретение позволяет извлекать локус-специфические сигналы числа копий из образцов внеклеточной ДНК для идентификации тканеспецифических профилей числа копий вкДНК и позволяет количественно оценивать доли ткани в образцах вкДНК. 3 н. и 30 з.п. ф-лы, 5 ил., 1 табл., 3 пр.
Description
ОБЛАСТЬ ТЕХНИКИ
[0001] Системы, способы и композиции, предложенные в настоящем документе, относятся к способам извлечения локус-специфических сигналов числа копий вкДНК из образца для мониторинга состояния здоровья, диагностики или клеточного профилирования и анализа. В частности, системы, способы и композиции относятся к способам анализа внеклеточной ДНК (вкДНК) в образце для определения относительного вклада типа ткани или клеток в суммарную вкДНК в образце. В способах, предложенных в настоящем документе, используются сиквенс-специфические сигналы покрытия, интенсивности или числа копий вкДНК и не предусматривается прямое определение статуса метилирования на вкДНК.
УРОВЕНЬ ТЕХНИКИ
[0002] В последние годы внеклеточная ДНК (вкДНК) начала рассматриваться в качестве перспективного источника для выявления биомаркеров для диагностики заболеваний. В частности, вкДНК плода и интактные клетки плода могут попадать в кровоток матери. Следовательно, анализ этого генетического материала плода может сделать возможным раннее неинвазивное пренатальное тестирование (НИПТ). Ключевой проблемой при проведении НИПТ на вкДНК плода является то, что она обычно смешана с вкДНК матери, и поэтому анализ вкДНК затруднен необходимостью учета материнского генотипического сигнала. Кроме того, анализ вкДНК пригоден в качестве диагностического инструмента для обнаружения и диагностики рака.
[0003] Текущие протоколы для получения библиотеки для секвенирования из образца внеклеточной нуклеиновой кислоты (например, образца плазмы) обычно включают выделение вкДНК для подготовки библиотеки для секвенирования для проведения анализа. Однако существующие методы анализа вкДНК, будь то для НИПТ или применений в онкологии, основаны на извлечении сигнала генетических изменений из секвенирования вкДНК и поэтому ограничиваются НИПТ и онкологией.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[0004] Настоящее изобретение относится к системам, способам и композициям для анализа вкДНК в образце для извлечения локус-специфических сигналов числа копий вкДНК для количественной оценки ткане- и/или клеточноспецифических долей вкДНК в образце.
[0005] Некоторые варианты осуществления, предложенные в настоящем документе, относятся к способам анализа внеклеточной ДНК (вкДНК) в биологическом образце. В некоторых вариантах осуществления образец получен от человека с вероятной гибелью клеток, повреждением ткани или заболеванием. В некоторых вариантах осуществления гибель клеток или повреждение ткани/органа включает тупую травму, такую как травма головы, токсическое действие лекарственного средства на печень или почки, заболевания, которые сопровождаются повреждением органов, например, повреждение сердца при кардиомиопатиях, повреждение почек при заболеваниях почек, повреждение печени при заболеваниях печени или гибель бета-клеток при диабете. В некоторых вариантах осуществления гибель клеток или повреждение ткани/органа включает рак или беременность, при которых имеет место чрезмерная гибель клеток или скорость обновления клеточной популяции.
[0006] В некоторых вариантах осуществления способы включают получение биологического образца, содержащего вкДНК, где указанная вкДНК содержит множество фрагментов вкДНК, каждый из которых соответствует одному или более типам ткани или клеток; количественную оценку каждого фрагмента вкДНК для создания полногеномного или целевого (локус-специфического) профиля вкДНК, где указанный полногеномный профиль вкДНК содержит множество сигналов числа копий, каждый из которых (включая покрытие или интенсивность) соответствует фрагменту вкДНК; и сравнение указанного полногеномного профиля сигналов числа копий вкДНК с набором референсных профилей сигналов числа копий для определения или количественной оценки источников повреждения клеток, повреждения ткани или повреждения органа. В некоторых вариантах осуществления способ необязательно включает обогащение образца вкДНК методом “pull down“ или ПЦР с получением обогащенной вкДНК.
[0007] Некоторые варианты осуществления, предложенные в настоящем документе, относятся к способам мониторинга развития повреждения ткани или органа у субъекта. В некоторых вариантах осуществления способы включают получение биологического образца от указанного субъекта, где указанный биологический образец содержит внеклеточную ДНК (вкДНК); количественную оценку вкДНК в указанном образце для получения полногеномного профиля сигналов числа копий вкДНК, содержащего множество сигналов числа копий, каждый из которых соответствует фрагменту вкДНК определенного типа клеток или типа ткани; и сравнение указанного полногеномного профиля сигналов числа копий вкДНК с набором профилей известных сигналов числа копий здоровых субъектов или чистых типов тканей. В некоторых вариантах осуществления количественную оценку проводят без ПЦР или обогащения. В некоторых вариантах осуществления разница между сигналом числа копий в образце и известными сигналами числа копий коррелирует с состоянием у субъекта, связанным с повреждением ткани или органа.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
[0008] На ФИГ. 1 показан график, иллюстрирующий профили сигналов вкДНК ткани почек и крови вдоль целевых участков хромосомы. Ткане-/клеточноспецифический сигнал извлекают с использованием методов неотрицательного матричного разложения из сигналов числа копий вкДНК плазмы пациентов с заболеванием почек, полученных с помощью секвенирования вкДНК. Целевые области анализируют с помощью мультиплексной ПЦР на образцах вкДНК.
[0009] На ФИГ. 2 показан график, демонстрирующий результаты прогнозирования почечной недостаточности у пациентов на основе количественных оценок доли вкДНК почек в плазме крови.
[0010] На ФИГ. 3A и 3B показаны графики зависимости от времени доли ДНК из ткани почек в группе реципиентов трансплантата почки. На ФИГ. 3A показана расчетная почечная доля вкДНК донорской почки, а на ФИГ. 3B показана расчетная почечная доля вкДНК собственной почки пациента. Как на ФИГ. 3A, так и на 3B показана зависимость статистически значимых изменений от времени, и характер изменений во времени согласуется с биомедицинскими процедурами, о проведении которых известно для этих пациентов.
[0011] На ФИГ. 4 показана доля компонента вкДНК ободочной кишки при различных заболеваниях, причем доля для болезни Крона оказалась значительно выше, чем при других проанализированных заболеваниях.
[0012] На ФИГ. 5 показана блок-схема, иллюстрирующая процесс оценки образцов вкДНК для количественной оценки вкДНК ткани.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[0013] В следующем подробном описании изобретения приводится ссылка на сопроводительные графические материалы, являющиеся его частью. В графических материалах одинаковые символы, как правило, обозначают схожие компоненты, если из контекста не следует иное. Иллюстративные варианты осуществления, описанные в подробном описании изобретения, графических материалах и формуле изобретения, не имеют ограничительного характера. Могут быть использованы другие варианты осуществления и могут быть внесены другие изменения, без отклонений от сущности или объема объекта изобретения, представленного в настоящем документе. Ясно, что аспекты настоящего изобретения, как в целом описано в настоящем документе и проиллюстрировано на графических материалах, могут быть скомпонованы, заменены, объединены, разделены и спроектированы в самых различных конфигурациях, все из которых явным образом предусмотрены в настоящем документе.
[0014] Варианты осуществления систем, способов и композиций, предложенных в настоящем документе, относятся к анализу фрагментов нуклеиновой кислоты в образце для определения того, сколько фрагментов нуклеиновой кислоты происходит из различных частей генома различных частей организма субъекта. Более конкретно, системы, способы и композиции, предложенные в настоящем документе, относятся к анализу популяций вкДНК в образце для определения относительного количества вкДНК из различных частей генома различных частей организма субъекта. Таким образом, системы, способы и композиции относятся к количественной оценке тканевого происхождения вкДНК и могут использоваться для целого ряда применений, характеризующихся повышенной гибелью клеток или повышенными генетическими изменениями, в том числе, например, для мониторинга развития заболевания, мониторинга состояния здоровья органов или тканей, диагностики или обнаружения заболеваний, определения эффективности или токсичности лекарственных средств или мониторинга состояния здоровья новорожденных.
[0015] В одном из вариантов осуществления биологический образец, о котором известно, что он содержит вкДНК, такой как плазма крови, берут у субъекта с подозрением на наличие определенного типа повреждения органа или повышенной скорости обновления клеточной популяции. На вкДНК в указанном биологическом образце проводят анализ полногеномной последовательности (WGS), чтобы выявить области генома, которые могут демонстрировать больше или меньше вкДНК, чем у типичного субъекта. Например, если субъект страдает повреждением печени или почечной недостаточностью, можно ожидать увидеть больше вкДНК, происходящей из печени или почек, по сравнению с контрольной популяцией исходного уровня. После завершения анализа последовательности ее подвергают сравнению с помощью различных протоколов машинного обучения, искусственного интеллекта или других протоколов для выявления различий в вкДНК, полученной от субъекта, по сравнению с контролем исходного уровня. В одном из вариантов осуществления часть анализа может включать количественную оценку относительных долей вкДНК из различных тканей субъекта и нормальных контролей исходного уровня. В некоторых вариантах осуществления количественная оценка может включать одно или оба из определения набора референсных профилей ткани и количественной оценки долей вкДНК ткани в образце вкДНК на основе полногеномных данных о покрытии вкДНК.
[0016] Например, для полногеномных или целевых профилей числа копий вкДНК для набора образцов нормальных и/или больных субъектов получают набор референсных профилей покрытия вкДНК, и полученная линейная комбинация восстанавливает сигналы числа копий вкДНК из образцов нормальных и/или больных субъектов. Каждый референсный профиль соответствует определенному типу клеток или ткани. С помощью методов машинного обучения без учителя, таких как неотрицательное матричное разложение, могут быть разложены сигналы вкДНК от отдельных субъектов и извлечены референсные ткане- или клеточноспецифические профили, с получением тем самым референсных профилей исходного уровня. В зависимости от типа биологической жидкости преобладающие типы клеток или тканей могут различаться. Например, для плазмы основной вклад будут вносить профили сигналов белых кровяных телец. Пример анализа извлеченных профилей сигналов вкДНК ткани почек и крови вдоль целевых участков хромосомы показан на фиг. 1.
[0017] Традиционные методы анализа вкДНК требуют сиквенс-специфического детектирования, что ограничивает чувствительность анализа и не обеспечивает точных, надежных или воспроизводимых определений относительного вклада каждого типа ткани субъекта в суммарную вкДНК в биологическом образце. Например, традиционный подход не позволяет определить, сколько вкДНК в образце происходит из легких, селезенки, печени, почек и т.д. по сравнению с нормальным образцом. Ранее известные методы секвенирования вкДНК предназначались для областей применения, связанных с мониторингом состояния тканей трансплантата или раковых заболеваний. Однако такие методы требуют анализа на основе аллелей, который требует секвенирования и выявления однонуклеотидных вариаций между донором и хозяином или опухолевой и нормальной тканью. Не существует метода, который позволил бы количественно оценить состояние здоровья собственных органов субъекта на основе секвенирования вкДНК, матричной гибридизации или аналогичных методов.
[0018] Кроме того, традиционные способы мониторинга состояния здоровья органа или ткани выполняют с помощью биопсии ткани. Биопсия ткани может использоваться для исследования и определения наличия или степени заболевания на основе конкретной ткани и может выполняться путем извлечения клеток или ткани из биоптата ткани, взятого у субъекта. Однако эти способы являются инвазивными, времязатратными, дорогими и, как правило, сопряжены с повышенным риском непредвиденных последствий для здоровья.
[0019] Системы, способы и композиции, описанные в настоящем документе, напротив, относятся к определению количества фрагментов вкДНК, происходящих из различных тканей. Кроме того, настоящие системы, способы и композиции являются неинвазивными и могут обеспечить немедленное определение динамики гибели клеток или повреждения ткани. Системы, способы и композиции, предложенные в настоящем документе, могут сделать возможным раннее обнаружение множества показаний до того, как будут обнаружены клинические симптомы или функциональное ухудшение состояния организма субъекта. Более того, эти способы не требуют выбора конкретного целевого органа, а вместо этого позволяют лицу, осуществляющему уход, обнаружить, какой орган может быть поврежден, что невозможно при использовании биопсии ткани в качестве метода скрининга. Соответственно, способы, системы и композиции могут обеспечить возможность количественной оценки и мониторинга сразу нескольких органов в одном анализе с меньшей систематической ошибкой выборки, чем методы биопсии ткани.
[0020] Если не указано иное, практическое осуществление способа и системы, раскрытых в настоящем документе, включает общепринятые методики и устройства, обычно используемые в молекулярной биологии, микробиологии, очистке белков, белковой инженерии, секвенировании белков и ДНК и областях рекомбинантной ДНК, которые находятся в пределах компетенции специалиста в данной области техники. Такие методики и устройства известны специалистам в данной области техники и описаны во множестве текстов и справочных материалов (см., например, Sambrook et al., “Molecular Cloning: A Laboratory Manual,” Third Edition (Cold Spring Harbor), [2001]); и Ausubel et al., “Current Protocols in Molecular Biology” [1987]).
[0021] Численные диапазоны включают границы диапазонов. Подразумевается, что каждое максимальное численное ограничение, приведенное в данном описании, включает каждое более низкое численное ограничение, как если бы такие более низкие численные ограничения были явно указаны в настоящем документе. Каждое минимальное численное ограничение, приведенное в данном описании, будет включать каждое более высокое численное ограничение, как если бы такие более высокие численные ограничения были явно указаны в настоящем документе. Каждый численный диапазон, приведенный в данном описании, будет включать каждый более узкий численный диапазон, который попадает в такой более широкий численный диапазон, как если бы все такие более узкие численные диапазоны были явно указаны в настоящем документе.
[0022] Если в настоящем документе не указано иное, все технические и научные термины, используемые в настоящем документе, имеют значение, общепринятое для специалиста в данной области техники. Различные научные словари, которые включают термины, включенные в настоящий документ, хорошо известны и доступны специалистам в данной области техники. Хотя любые методы и материалы, подобные или эквивалентные тем, которые описаны в настоящем документе, находят применение при осуществлении или тестировании вариантов осуществления, раскрытых в настоящем документе, некоторые методы и материалы описаны.
[0023] Термины, определенные непосредственно ниже, более полно описаны со ссылкой на описание в целом. Следует понимать, что данное изобретение не ограничивается конкретной описанной методикой, протоколами и реагентами, поскольку они могут варьироваться в зависимости от контекста, в котором они используются специалистами в данной области техники. В контексте настоящего документа термины в единственном числе включают множественное число, если из контекста явно не следует иное.
[0024] Если не указано иное, нуклеиновые кислоты записываются слева направо в ориентации от 5'-конца к 3'-концу, а аминокислотные последовательности записываются слева направо в ориентации от аминоконца к карбоксиконцу, соответственно.
[0025] В контексте настоящего документа термины “полинуклеотид” и “нуклеиновая кислота” могут использоваться взаимозаменяемо и могут относиться к полимерной форме нуклеотидов любой длины, будь то рибонуклеотиды или дезоксирибонуклеотиды. Таким образом, эти термины включают одно-, двух- или многоцепочечные ДНК или РНК. Примеры полинуклеотидов включают ген или фрагмент гена, внеклеточную ДНК (вкДНК), полногеномную ДНК, геномную ДНК, фрагмент эпигеномной, геномной ДНК, экзон, интрон, матричную РНК (мРНК), регуляторную РНК, транспортную РНК, рибосомную РНК, некодирующую РНК (нкРНК), такую как PIWI-взаимодействующая РНК (piRNA), малая интерферирующая РНК (siRNA) и длинная некодирующая РНК (днкРНК), короткую шпилечную (кшРНК), малую ядерную РНК (мяРНК), микро РНК (мкРНК), малую ядрышковую РНК (мякРНК) и вирусную РНК, рибозим, кДНК, рекомбинантный полинуклеотид, разветвленный полинуклеотид, плазмиду, вектор, выделенную ДНК любой последовательности, выделенную РНК любой последовательности, нуклеиново-кислотный зонд, праймер или амплифицированную копию любого из вышеперечисленного. Полинуклеотид может включать модифицированные нуклеотиды, такие как метилированные нуклеотиды и аналоги нуклеотидов, включая нуклеотиды с неприродными основаниями, нуклеотиды с модифицированными природными основаниями, такими как аза- или деазапурины. Полинуклеотид может состоять из определенной последовательности из четырех нуклеотидных оснований: аденина (A); цитозина (C); гуанина (G); и тимина (T). Также может присутствовать урацил (U), например, в качестве природной замены тимина, когда полинуклеотид представляет собой РНК. Урацил также может использоваться в ДНК. Термин “последовательность нуклеиновой кислоты“ может относиться к буквенному представлению полинуклеотида или любой молекулы нуклеиновой кислоты, включая природные и неприродные основания.
[0026] Термин “донорская ДНК“ (дДНК) относится к молекулам ДНК, происходящим из клеток донора трансплантата. В различных реализациях дДНК содержится в образце, полученном от реципиента, получившего трансплантированную ткань или орган от донора.
[0027] Циркулирующая внеклеточная ДНК или просто внеклеточная ДНК (вкДНК) представляют собой фрагменты ДНК, которые не локализованы в клетках и свободно циркулируют в кровотоке или других биологических жидкостях. Известно, что вкДНК имеет различное происхождение, в некоторых случаях из ДНК донорской ткани, циркулирующей в крови реципиента, в некоторых случаях из опухолевых клеток или пораженных опухолью клеток, в других случаях из ДНК плода, циркулирующей в крови матери. Другие неограничивающие примеры включают вкДНК, происходящую из собственной ткани или органов этого же организма, например, из почек, легких, головного мозга и сердца. Уровни тканеспецифической вкДНК могут увеличиваться или уменьшаться при гибели клеток, повреждении тканей или повреждении органов, включая, например, тупую травму, такую как травма головы, токсическое действие лекарственного средства на печень или почки, заболевания, которые сопровождаются повреждением органов, например, повреждение сердца при кардиомиопатиях, повреждение почек при заболеваниях почек, повреждение печени при заболеваниях печени и гибель бета-клеток при диабете. Примеры также включают рак и беременность, при которых имеет место чрезмерная гибель клеток или скорость обновления клеточной популяции.
[0028] В целом вкДНК является фрагментированной и включает только небольшую часть генома, которая может отличаться от генома индивидуума, от которого получена вкДНК. Точный механизм биогенеза вкДНК неизвестен. Согласно широко распространенному мнению вкДНК возникает в результате апоптотической или некротической гибели клеток, однако есть также свидетельства, указывающие на активное высвобождение вкДНК из живых клеток. Как правило, вкДНК происходит из разных типов клеток, и в зависимости от клеточного происхождения и состояния здоровья полногеномный профиль вкДНК субъекта может варьироваться.
[0029] Термин “нециркулирующая’’ геномная ДНК’’ (гДНК) или “клеточная ДНК“ используются для обозначения молекул ДНК, локализованных в клетках и часто включающих полный геном.
[0030] Биномиальное распределение - это дискретное распределение вероятностей количества “успехов“ в последовательности из n независимых экспериментов, в каждом из которых задается вопрос “да-нет“, и каждый имеет свой собственный булевозначный результат: случайная величина, содержащая один бит информации: положительный (с вероятностью p) или отрицательный (с вероятностью q=1 - p). Для одного испытания, т.е. n=1, биномиальное распределение является распределением Бернулли. Биномиальное распределение часто используется для моделирования количества успехов в выборке размера n, взятой с заменой из популяции размера N. Если случайная переменная X следует биномиальному распределению с параметрами n ∈ N и p ∈ [0,1], случайная переменная X записывается как X ~ B(n, p).
[0031] Распределение Пуассона, обозначаемое в настоящем документе как Pois(), представляет собой дискретное распределение вероятностей, которое выражает вероятность заданного числа событий, происходящих в фиксированном интервале времени и/или пространстве, если эти события происходят с известной средней частотой и независимо времени, прошедшего с последнего события. Распределение Пуассона также можно использовать для числа событий в других заданных интервалах, таких как расстояние, площадь или объем. Вероятность наблюдения k событий в интервале согласно распределению Пуассона определяется уравнением:
где λ представляет собой среднее число событий в интервале или частоту событий, также называемую параметром частоты, e равно 2,71828 - число Эйлера или основание натуральных логарифмов, k принимает значения 0, 1, 2,… и k! представляет собой факториал k.
[0032] Гамма-распределение - это двухпараметрическое семейство непрерывных распределений вероятностей. Обычно используются три различных параметризации: с параметром формы k и параметром масштаба θ; с параметром формы α=k и обратным параметром масштаба β=1/θ, называемым параметром скорости; или с параметром формы k и средним параметром μ=k/β. В каждой из этих трех форм оба параметра являются положительными действительными числами. Гамма-распределение - это распределение вероятностей максимальной энтропии для случайной переменной X, для которой E[X]=kθ=α/β фиксировано и больше нуля, а E[ln(X)]=ψ(k)+ln(θ)=ψ(α) - ln(β) фиксировано (ψ представляет собой дигамма-функцию).
[0033] Термин ''образец'' в настоящем документе относится к образцу, обычно получаемому из биологической жидкости, клетки, ткани, органа или организма, содержащему нуклеиновую кислоту или смесь нуклеиновых кислот, и может называться в настоящем документе биологическим образцом. Такие образцы включают, не ограничиваясь перечисленным, мокроту/жидкость ротовой полости, амниотическую жидкость, кровь, фракцию крови или образцы тонкоигольной биопсии (например, хирургической биопсии, тонкоигольной биопсии и т.д.), мочу, перитонеальную жидкость, плевральную жидкость и тому подобное. Хотя образец часто берут у человека (например, пациента), анализы можно использовать для образцов от любого млекопитающего, включая, не ограничиваясь перечисленным, собак, кошек, лошадей, коз, овец, крупный рогатый скот, свиней и т.д. Образец можно использовать непосредственно в том виде, в котором он был получен из биологического источника, или после предварительной обработки, чтобы изменить характер образца. Например, такая предварительная обработка может включать получение плазмы из крови, разбавление вязких жидкостей и т.д. Способы предварительной обработки могут также включать, не ограничиваясь перечисленным, фильтрацию, осаждение, разбавление, дистилляцию, смешивание, центрифугирование, замораживание, лиофилизацию, концентрирование, амплификацию, фрагментацию нуклеиновой кислоты, инактивацию мешающих компонентов, добавление реагентов, лизирование и т.д. Если такие способы предварительной обработки используются в отношении образца, такие способы предварительной обработки обычно таковы, что представляющая интерес нуклеиновая кислота(ы) остается в тестируемом образце, иногда в концентрации, пропорциональной концентрации в необработанном тестируемом образце (например, а именно, образеце, который не подвергался никакому подобному способу(ам) предварительной обработки). Такие “обработанные“ или “переработанные“ образцы по-прежнему считаются биологическими “тестируемыми“ образцами в отношении описанных в настоящем документе способов.
[0034] Термин “биологическая жидкость“ в настоящем документе относится к жидкости, взятой из биологического источника, и включает, например, кровь, сыворотку, плазму, мокроту, смывную жидкость, спинномозговую жидкость, мочу, сперму, пот, слезы, слюну и тому подобное. В контексте настоящего документа термины ''кровь'', ''плазма'' и ''сыворотка'' явным образом охватывают их фракции или обработанные части. Точно так же, если образец взят из биоптата, мазка тампоном, мазка и т.д., ''образец'' явным образом включает обработанную фракцию или часть, полученную из биоптата, мазка тампоном, мазка и т.д.
[0035] Образец может быть получен от субъекта в случае, когда желательно контролировать состояние здоровья ткани или органа, диагностировать или обнаружить заболевание или иным образом проанализировать образец, полученный от субъекта. В контексте настоящего документа термин ''субъект'' относится к животному, которое является объектом лечения, наблюдения или эксперимента. ''Животное'' включает холоднокровных и теплокровных позвоночных и беспозвоночных, таких как рыбы, моллюски, рептилии и, в частности, млекопитающие. ''Млекопитающее'' включает, не ограничиваясь перечисленным, мышей, крыс, кроликов, морских свинок, собак, кошек, овец, коз, коров, лошадей, приматов, таких как обезьяны, шимпанзе и человекообразные обезьяны, и, в частности, людей. Субъект может представлять собой субъекта, страдающего или подозреваемого на наличие рака, генетического нарушения, повреждения органа или повреждения ткани, или другого заболевания или нарушения, мониторинг которого можно осуществлять. В некоторых вариантах осуществления субъект представляет собой реципиента органа, такого как субъект, который является реципиентом трансплантата органа. В некоторых вариантах осуществления субъект имеет вероятное повреждение органа из-за хронического заболевания или тупой травмы.
[0036] Варианты систем, способов и композиций относятся к получению образца от субъекта и мониторингу, обнаружению, оценке, прогнозированию или диагностике заболевания или расстройства у указанного субъекта, мониторингу повреждения ткани или органа у субъекта или оценке или количественной оценке тканевого происхождения нуклеиновой кислоты. Заболевания могут включать, например, раковые заболевания, генетические нарушения, органоспецифические расстройства или другие заболевания или расстройства, которые характеризуются повышенной вкДНК в различных областях генома в зависимости от тканевого происхождения и/или типа заболевания.
[0037] В контексте настоящего документа термин ''референсный геном'' относится к любой определенной известной последовательности генома, частичной или полной, любого организма, которая может быть использована для сравнения выявленных у субъекта последовательностей. ''Геном'' относится к полной генетической информации организма или вируса, выраженной в последовательностях нуклеиновых кислот.
[0038] Некоторые варианты осуществления способов, систем и композиций, предложенных в настоящем документе, относятся к одновременной количественной оценке относительных вкладов нескольких типов тканей или клеток в образец вкДНК на основе полногеномных сигналов числа копий (CN) вкДНК. В зависимости от предполагаемого применения образец вкДНК может быть получен из биологического образца, например, из крови, плазмы, мочи, спинномозговой жидкости или любых других типов биологических жидкостей из организма человека. Полногеномные сигналы покрытия, числа копий или интенсивности вкДНК могут быть получены путем подсчета молекул ДНК на основе секвенирования, например, с помощью любых технологий секвенирования или технологий количественной оценки числа копий ДНК на основе гибридизации. В некоторых вариантах осуществления перед измерением сигнала числа копий вкДНК может быть подвергнута направленной ПЦР или анализу обогащения или полногеномной амплификации. В любом из вариантов осуществления могут быть использованы различные методы амплификации, включая, например, неспецифическую амплификацию целого генома, например, методы полногеномной амплификации (WGA), такие как MDA (амплификация с множественным замещением), или высоконаправленную ПЦР-амплификацию нескольких или одной выбранной области размером, например, несколько кб.
[0039] При наличии покрытия вкДНК из биологического образца или набора биологических образцов из любой из систем или способов, описанных в настоящем документе, могут быть количественно оценены относительные доли различных тканей. В некоторых вариантах осуществления количественная оценка может включать одно или оба из определения набора референсных профилей ткани и количественной оценки доли вкДНК ткани в образце вкДНК на основе полногеномных или целевых данных о покрытии вкДНК.
[0040] Например, для полногеномных профилей числа копий вкДНК для набора нормальных образцов получают набор референсных профилей покрытия вкДНК, так что полученные линейные комбинации соответствуют профилям числа копий вкДНК из нормальных образцов. В то время как профиль числа копий вкДНК крови соответствует смеси сигналов от нескольких типов клеток или тканей, референсный профиль соответствует конкретному типу клеток или ткани. С помощью методов машинного обучения без учителя, таких как неотрицательное матричное разложение, может быть разложен набор сигналов вкДНК плазмы и извлечены референсные профили с получением тем самым набора референсных профилей исходного уровня. В зависимости от типа биологической жидкости преобладающие типы клеток или тканей могут различаться. Например, для плазмы основной вклад будут вносить профили сигналов белых кровяных телец.
[0041] Аналогичным образом, для полногеномных профилей числа копий вкДНК для набора образцов пациентов с известным повреждением органа или определенным заболеванием, связанным с повреждением органа, может быть использовано полуконтролируемое машинное обучение для извлечения профилей тканеспецифической или специфичной для заболевания вкДНК в дополнение к референсным профилям исходного уровня. Полученные референсные профили исходного уровня могут быть использованы для учета исходной части сигнала вкДНК из образцов пациентов, а затем из неучтенных сигналов покрытия вкДНК получают дополнительные референсные профили тканей.
[0042] Подход без учителя и полуконтролируемый подход может быть дополнительно объединен с методом машинного обучения с учителем, основанным на глубинной нейронной сети, для прогнозирования профилей покрытия вкДНК для типов тканей или клеток, для которых ограничен доступ к релевантным образцам вкДНК. Метод глубокого обучения может быть использован для прогнозирования профиля покрытия вкДНК для типа клеток при наличии эпигенетических сигналов для данного типа клеток в качестве входных характеристик, включая, например, сигналы доступности ДНКазы, сигналы гистоновых меток и сигналы метилирования геномной ДНК.
[0043] Соответственно, в некоторых вариантах осуществления набор референсных профилей ткани используют для количественной оценки ткани в представляющих интерес образцах. Для профиля покрытия вкДНК доли ткани могут быть количественно оценены путем линейного проецирования наблюдаемых профилей покрытия вкДНК на известные референсные профили.
[0044] Варианты осуществления систем, способов и композиций, предложенных в настоящем документе, могут быть использованы для целого ряда применений, включая, например, мониторинг состояния здоровья органов, мониторинг токсичности лекарственных средств, спортивную медицину, диагностику и обнаружение заболеваний, онкологию, неинвазивное пренатальное тестирование (НИПТ) и мониторинг состояния здоровья новорожденных или исследования патогенеза заболеваний.
[0045] В области мониторинга состояния здоровья органов варианты осуществления систем, способов и композиций могут быть использованы, например, для мониторинга нескольких органов, таких как, например, почка, легкое или сердце, и для мониторинга и диагностики до и после заболевания на основе одного анализа крови. Описанные в настоящем документе варианты осуществления включают недорогой универсальный анализ крови, направленный на основные органы, позволяющий осуществлять раннее обнаружение и предотвращение тяжелой недостаточности органов, в том числе для стратегии мониторинга групп высокого риска. Например, мониторинг состояния здоровья почек у пациентов, страдающих волчанкой или диабетом; мониторинг состояния здоровья сердца для лиц с семейной историей кардиомиопатии; или мониторинг состояния здоровья нескольких органов для пациентов с сепсисом. Кроме того, степень тяжести травмы (тупой травмы), например, головы или в области грудной клетки/легких, непросто определить, если не наблюдаются серьезных функциональных последствий. Варианты осуществления систем, способов и композиций, предложенных в настоящем документе, позволяют осуществлять количественный мониторинг степени тяжести травмы и информировать о необходимости ранних медицинских вмешательств.
[0046] В области мониторинга токсичности лекарственных средств варианты осуществления систем, способов и композиций могут быть использованы, например, для мониторинга гепатотоксичности или нефротоксичности отпускаемых по рецепту лекарственных средств у отдельно взятого пациента, что позволяет индивидуализировать медицину и в режиме реального времени корректировать схемы приема лекарственных средств для отдельных пациентов, или измерять гепатотоксичность или нефротоксичность новых лекарственных средств в ходе клинических исследований.
[0047] В области спортивной медицины варианты осуществления систем, способов и композиций могут быть использованы, например, для мониторинга величины повреждения тела из-за интенсивных тренировок, что позволяет рационально настроить график тренировок спортсмена и предотвратить синдром перетренированности. Установлено, что уровень внеклеточной ДНК увеличивается при выполнении упражнений. Для спортсменов синдром перетренированности (СПТ) - частое состояние, когда они постоянно стремятся к пределу своих возможностей. После возникновения СПТ на восстановление может уйти от нескольких дней до нескольких недель, а в некоторых случаях спортсмен может никогда не восстановиться. Подход к количественной оценке мышечной вкДНК и, следовательно, раннему выявлению и предотвращению СПТ имел бы большое значение для спортсмена для достижения оптимального результата тренировки.
[0048] В области диагностики и обнаружения заболеваний варианты осуществления систем, способов и композиций могут быть использованы, например, для мониторинга или анализа заболеваний, которые трудно диагностировать или которые часто диагностируются неправильно, например, синдрома раздраженного кишечника, воспалительного заболевания кишечника, целиакии, фибромиалгии, ревматоидного артрита, рассеянного склероза, волчанки, синдрома поликистозных яичников, аппендицита, болезни Крона, язвенного колита или идиопатических миопатий. Некоторые из этих заболеваний обычно надежно диагностируются только с помощью биопсии ткани. Многие заболевания в настоящее время диагностируются с помощью биопсии тканей, например, целиакия. Есть много заболеваний, для которых не существует диагностических маркеров или отсутствуют хорошие диагностические маркеры, например, синдром хронической усталости. Варианты осуществления систем, способов и композиций, предложенных в настоящем документе, позволяют осуществлять мониторинг, обнаружение, оценку, прогнозирование или диагностику этих и других заболеваний и расстройств. Например, варианты осуществления систем и способов могут быть использованы для определения долей компонента определенной ткани для выявления определенного заболевания. Как показано на фиг. 4, например, показана доля компонента вкДНК ободочной кишки при различных заболеваниях, причем доля для болезни Крона значительно выше, чем при других проанализированных заболеваниях.
[0049] В области онкологии варианты осуществления систем, способов и композиций могут быть использованы, например, для количественной оценки тканевого происхождения вкДНК и определения происхождения раковой ткани, а также мутаций из одного анализа полногеномной последовательности (WGS) вкДНК. WGS включает всю последовательность (включая все хромосомы) генома зародышевой линии субъекта.
[0050] В области НИПТ и мониторинга состояния здоровья новорожденных варианты осуществления систем, способов и композиций могут быть использованы, например, для определения и мониторинга состояния здоровья матери и измерения иммунного ответа матери на плод. Некоторые варианты осуществления относятся к прогнозированию выкидыша и преждевременных родов. Некоторые варианты осуществления относятся к мониторингу, исследованию, диагностике или прогнозированию патологий новорожденных, таких как недоразвитость органов, желтуха, генетические нарушения или другие патологии новорожденных, посредством секвенирования вкДНК плазмы новорожденных.
[0051] В области исследования патогенеза заболеваний варианты осуществления систем, способов и композиций могут быть использованы, например, для простой и недорогой количественной оценки тканевого происхождения, чтобы позволить исследователям проводить продольные исследования для понимания патогенеза многих заболеваний путем составления профиля динамики и взаимодействий между несколькими человеческими органами.
[0052] Соответственно, некоторые варианты осуществления, предложенные в настоящем документе, относятся к способам и системам для количественной оценки вкДНК у субъекта. В некоторых вариантах осуществления способы включают получение биологического образца, о котором известно, что он содержит вкДНК, такого как плазма крови, у субъекта, имеющего определенный типа рака или подозреваемого на его наличие. В контексте настоящего документа термин ''рак'' относится ко всем типам рака или новообразования, или злокачественных опухолей, встречающихся у млекопитающих, в особенности у людей, включая лейкозы, саркомы, карциномы и меланому. Примерами раковых заболеваний являются рак головного мозга, молочной железы, шейки матки, ободочной кишки, головы и шеи, почки, легкого, немелкоклеточный рак легкого, меланома, мезотелиома, рак яичника, саркома, рак желудка, матки и медуллобластома. Дополнительные раковые заболевания могут включать, например, болезнь Ходжкина, неходжкинскую лимфому, множественную миелому, нейробластому, рак молочной железы, рак яичника, рак легкого, рабдомиосаркому, первичный тромбоцитоз, первичную макроглобулинемию, мелкоклеточные опухоли легкого, первичные опухоли головного мозга, рак желудка, рак ободочной кишки, злокачественную инсулиному поджелудочной железы, злокачественный карциноид, рак мочевого пузыря, предраковые поражения кожи, рак яичка, лимфомы, рак щитовидной железы, нейробластому, рак пищевода, рак мочеполовых путей, злокачественную гиперкальциемию, рак шейки матки, рак эндометрия, рак коры надпочечников и рак предстательной железы.
[0053] В некоторых вариантах осуществления анализ полногеномной последовательности (WGS) проводят на вкДНК в биологическом образце для выявления областей, которые могут демонстрировать повышенные или пониженные количества вкДНК по сравнению с количествами вкДНК у здорового пациента или по сравнению с уровнями вкДНК в разрезе здоровых пациентов. Например, если пациент страдает повреждением печени или раком печени, можно ожидать увидеть повышенные уровни вкДНК, идентифицированные как происходящие из печени, по сравнению с уровнями вкДНК из печени из контрольной популяции исходного уровня. Уровни определенного типа вкДНК могут быть определены из уровня суммарной вкДНК с помощью различных алгоритмов, приведенных в настоящем документе, включая анализ с помощью различных алгоритмов машинного обучения, искусственного интеллекта или других алгоритмов для определения уровней и отличий определенной внДНК у субъекта по сравнению с контролем исходного уровня, или для определения и сравнения уровней и отличий нескольких типов вкДНК, полученных из нескольких типов тканей. В некоторых вариантах осуществления анализ вкДНК включает количественную оценку относительных долей вкДНК из различных тканей субъекта и нормальных контролей исходного уровня. В некоторых вариантах осуществления количественная оценка может включать одно или оба из определения набора референсных профилей ткани и количественной оценки доли вкДНК ткани в образце вкДНК на основе полногеномных данных о покрытии вкДНК. Контроли исходного уровня могут включать контрольные образцы здоровых субъектов из совокупности образцов, включая образцы из различных географических регионов, от субъектов разных возрастов, этнической принадлежности, расы или пола, чтобы установить надлежащий исходный уровень.
[0054] Некоторые варианты осуществления, предложенные в настоящем документе, относятся к способам анализа внеклеточной ДНК (вкДНК) в биологическом образце. В некоторых вариантах осуществления способы включают получение биологического образца, содержащего вкДНК; обогащение указанного образца вкДНК с получением обогащенной вкДНК, где указанная обогащенная вкДНК содержит множество фрагментов вкДНК, каждый из которых соответствует определенному типу ткани или клеток; количественную оценку каждого фрагмента вкДНК для создания полногеномного профиля вкДНК, где указанный полногеномный профиль вкДНК содержит множество сигналов числа копий, каждый из которых соответствует фрагменту вкДНК; и сравнение указанного полногеномного профиля вкДНК с профилем известных сигнатур числа копий вкДНК для определения повреждения клеток, повреждения ткани или повреждения органа.
[0055] В некоторых вариантах осуществления биологический образец может представлять собой любой биологический образец, имеющий или предположительно имеющий профиль вкДНК. Таким образом, биологический образец может представлять собой любой образец, взятый или полученный от субъекта, например, биологическую жидкость, полученную от субъекта. Таким образом, например, биологический образец может представлять собой или может быть получен из крови, плазмы, сыворотки, мочи, спинномозговой жидкости, слюны, лимфатической жидкости, внутриглазной жидкости, стекловидной влаги, кохлеарной жидкости, слез, молока, мокроты, вагинальных выделений или любой их комбинации.
[0056] В некоторых вариантах осуществления обогащение представляющей интерес нуклеиновой кислотой или ее фрагментом, например, обогащение вкДНК в образце, может включать любые подходящие методы обогащения. В некоторых вариантах осуществления обогащение вкДНК может включать обогащение с помощью инвертированных молекулярных зондов, улавливания из раствора, зондов для анализа методом ‘’pull down’’, наборов приманок, стандартной ПЦР, мультиплексной ПЦР, гибридной ловушки, расщепления эндонуклеазами, гиперчувствительности к ДНКазе I и избирательной циркуляризации. Обогащение может быть достигнуто за счет негативной селекции нуклеиновых кислот путем удаления нежелательного материала. Этот вид обогащения включает в себя техники ''футпринтинга'' или ''вычитающей'' гибридной ловушки. В первом случае целевой образец защищен от нуклеазной активности за счет защиты белка или одно- и двухцепочечными структурами. Во втором случае удаляются нуклеиновые кислоты, связывающие зонды-приманки. В некоторых вариантах осуществления обогащение включает амплификацию вкДНК. В некоторых вариантах осуществления амплификация включает ПЦР-амплификацию или полногеномную амплификацию.
[0057] В некоторых вариантах осуществления количественная оценка нуклеиновой кислоты, такая как количественная оценка вкДНК, может включать любой метод, подходящий для определения количества нуклеиновой кислоты или фрагмента нуклеиновой кислоты в образце. Таким образом, например, количественная оценка может включать секвенирование вкДНК с использованием подсчета молекул ДНК на основе секвенирования или проведение количественной оценки ДНК на основе гибридизации.
[0058] В некоторых вариантах осуществления каждый сигнал числа копий характеризует относительный вклад вкДНК из определенного типа ткани или клеток. Число копий в контексте настоящего документа относится к полногеномному покрытию вкДНК в образце на основе сигналов, полученных путем подсчета молекул ДНК, например, с помощью любых технологий секвенирования или технологий количественной оценки числа копий ДНК на основе гибридизации.
[0059] В некоторых вариантах осуществления тип ткани представляет собой любой тип ткани, в отношении которого требуется осуществлять мониторинг, анализ, измерение, или повреждение которого имеет место или подозревается. В некоторых вариантах осуществления тип ткани представляет собой почечную, мышечную, сердечную, сосудистую, печеночную, головного мозга, глазную, легочную, жировую, железистую, костную, костномозговую, хрящевую, кишечную, желудочную, кожную или мочевого пузыря. В некоторых вариантах осуществления тип клеток представляет собой клетки крови, нейроны, клетки почки, эпителиальные клетки, клетки внеклеточного матрикса или иммунные клетки, или любые комбинации клеток. Например, способ может включать измерение или мониторинг одного или нескольких типов тканей или органов у субъекта. Таким образом, в некоторых вариантах осуществления полногеномный профиль вкДНК представляет собой количественную оценку количества вкДНК из нескольких органов для обеспечения оценки состояния здоровья органов. В некоторых вариантах осуществления количественную оценку всех фрагментов вкДНК проводят одновременно. В контексте настоящего документа ''одновременный'' относится к действию, которое происходит в одно и то же время или по существу в одно и то же время. Таким образом, одновременная количественная оценка относится к анализу множества фрагментов вкДНК в одном анализе в одно и то же время или по существу в одно и то же время. Соответственно, варианты осуществления, предложенные в настоящем документе, относятся к универсальному анализу крови, представляющему собой один анализ, где осуществляется или может осуществляться мониторинг нескольких органов в одном анализе. Например, количественная оценка вкДНК ткани может быть проведена на нескольких тканях или одной ткани. Одним из примеров может быть количественная оценка долей вкДНК почек. Как показано на фиг. 2, доля почек выше у пациентов с почечной недостаточностью, и количественная оценка, описанная в настоящем документе, позволяет прогнозировать почечную недостаточность.
[0060] В некоторых вариантах осуществления образец периодически получают от субъекта и анализируют для мониторинга состояния здоровья с течением времени, так что исходный образец анализируют в первый момент времени, а второй образец анализируют во второй момент времени, и оценивают различия в профиле вкДНК, чтобы получить свидетельства изменений профиля вкДНК. Такой анализ может предоставить информацию, касающуюся улучшения или ухудшения состояния определенных типов тканей с течением времени. Например, такие способы могут быть использованы для мониторинга трансплантата органа, для мониторинга токсичности лекарственных средств, для мониторинга схем лечения, для мониторинга состояния здоровья различных органов или тканей с течением времени, для мониторинга состояния здоровья матери на разных стадиях беременности, для мониторинга состояния здоровья новорожденных во время беременности и до родов или после родов, или для других подходящих оценок. Таким образом, некоторые варианты осуществления, предложенные в настоящем документе, относятся к мониторингу трансплантата органа с течением времени. В некоторых вариантах осуществления полногеномный профиль вкДНК характеризует токсичность лекарственного средства в органе. В некоторых вариантах осуществления образец является материнским образцом, и полногеномный профиль вкДНК характеризует состояние здоровья плода. Подходящие периоды времени для мониторинга определенной ткани, органа, клетки или состояния могут зависеть от конкретной области применения и могут составлять порядка нескольких минут, например, мониторинг образца раз в 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 20, 25, 30, 35, 40, 45, 50, 55 или 60 минут, часов, например, раз в 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 18, 20 или 24 часа, дней, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25 или 30, месяцев, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 или 12, или лет, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80 или более лет, или в течение периода времени в диапазоне, определяемом любыми двумя из вышеупомянутых значений. Например, мониторинг трансплантата почки с течением времени можно осуществлять, используя описанные в настоящем документе системы и способы. Как показано на фиг. 3A-3B, можно осуществлять мониторинг зависимости доли ДНК из ткани почек от времени для вкДНК донорской почки и вкДНК собственной почки пациента с течением времени.
[0061] В некоторых вариантах осуществления способы дополнительно включают вычитание референсного профиля исходного уровня из полногеномного профиля вкДНК. Референсный профиль исходного уровня соответствует определенному типу клеток или ткани, присутствующему в образцах вкДНК исходного уровня, так что профиль исходного уровня может быть учтен в тестируемом образце, а изменения или отклонения от исходного уровня могут быть использованы для диагностики или обнаружения отклонений.
[0062] Некоторые варианты осуществления, предложенные в настоящем документе, относятся к способам мониторинга развития рака у субъекта. В некоторых вариантах осуществления способы включают получение биологического образца от указанного субъекта, где указанный биологический образец содержит внеклеточную ДНК (вкДНК); количественную оценку вкДНК в указанном образце для получения полногеномного профиля вкДНК, содержащего множество сигналов числа копий, каждый из которых соответствует фрагменту вкДНК определенного типа клеток или типа ткани; и сравнение указанного множества сигналов числа копий с профилем известных сигналов числа копий здоровых субъектов. В некоторых вариантах осуществления разница между сигналом числа копий в образце и известными сигналами числа копий коррелирует с раковым или предраковым состоянием у субъекта. В некоторых вариантах осуществления образец обогащают суммарной вкДНК перед количественной оценкой вкДНК. В некоторых вариантах осуществления способы дополнительно включают сравнение множества сигналов числа копий с профилем известных сигналов числа копий образцов больных раком пациентов. В некоторых вариантах осуществления биологический образец включает кровь, плазму, сыворотку, мочу, спинномозговую жидкость, слюну, лимфатическую жидкость, внутриглазную жидкость, стекловидную влагу, кохлеарную жидкость, слезы, молоко, мокроту, вагинальные выделения или любую их комбинацию. В некоторых вариантах осуществления количественная оценка включает секвенирование вкДНК с использованием подсчета молекул ДНК на основе секвенирования. В некоторых вариантах осуществления количественная оценка включает проведение количественной оценки ДНК на основе гибридизации. В некоторых вариантах осуществления способы дополнительно включают обогащение вкДНК перед количественной оценкой вкДНК. В некоторых вариантах осуществления обогащение включает амплификацию вкДНК посредством ПЦР-амплификации или полногеномной амплификации.
ПРИМЕРЫ
[0063] Дополнительные альтернативы более подробно раскрыты в следующих примерах, которые никоим образом не предназначены для ограничения объема формулы изобретения.
Общие процедуры и методы
Извлечение
[0064] Нормальная скорость кровотока составляет около 5 литров в минуту, так что полный объем крови циркулирует один раз в минуту. Эта скорость намного выше, чем кинетика образования и деградации вкДНК, и состав вкДНК в крови человека является единообразным в течение короткого периода времени (например, менее 5 минут). В этих условиях забор крови приблизительно представляет собой пуассоновскую выборку вкДНК. Для моделирования извлечения ДНК используется либо полиномиальное распределение, либо многомерное гипергеометрическое распределение.
[0065] Процесс извлечения следует распределению Пуассона n''l ~ Pois(n'' · Σt βt · Atl), или совместно полиномиальному распределению (n''l) ~ Multi(Σt βt · At, n''), где n''l представляет собой число копий в локусе l, n'' представляет собой суммарное число копий фрагментов вкДНК, βt представляет собой долю вкДНК из типа ткани t, и At представляет собой референсный профиль числа копий для типа ткани t.
ПЦР-амплификация
[0066] Процесс ПЦР аппроксимируется гамма-распределением n'l ~ Gamma(n''l · ρ, θ), или совместно распределением Дирихле (n'l) / θ~ Dir(α=(n''l · ρ)), где ρ=(1+r)/(1- r)/[1 - (1+r) –t], θ=[(1+r)t - 1] · (1 - r)/(1+r), и r представляет собой эффективность ПЦР-амплификации в каждом цикле, n'l представляет собой число молекул ДНК в локусе l после ПЦР, n' представляет собой суммарное число молекул ДНК, амплифицированных из фрагментов вкДНК.
Секвенирование
[0067] Подобно извлечению, секвенирование следует распределению Пуассона nl ~ Pois(n · n'l / n'), или совместно полиномиальному распределению (nl) ~ Multi(n'l /n', n), где n представляет собой число фрагментов, наблюдаемых при секвенировании, а nl представляет собой наблюдаемое число копий вкДНК в данном локусе l.
Некоторые числа
[0068] Учитывая, что в обычном человеке содержится приблизительно 5000 мл крови, 1,8-44 нг/мл вкДНК плазмы соответствует 1,35-33 миллионам копий человеческих геномов. Доля ткани в 1% соответствует 13 500-330 000 копий. В качестве примера, когда 3 нг вкДНК используются в качестве входных данных для WGS-анализа вкДНК, это соответствует в общей сложности 900 копий, 9 копий 1% тканевого генома и 0,9 копий 0,1% тканевого генома.
Пример 1 - Моделирование совокупного профиля сигналов вкДНК
[0069] В следующем примере демонстрируется вариант осуществления моделирования совокупного профиля сигналов вкДНК.
[0070] Не принимая во внимание переменные извлечения и ПЦР, модель S сигналов вкДНК представляет собой (nl) ~ Multi(Σt βt · At, n). Учитывая большое количество сгруппированных данных (или локусов), которые приблизительно равномерно распределены, оно близко к распределению Пуассона: nl ~ Pois(n · Σt βt · At). Учитывая известные профили ткани A, неизвестными являются только доли ткани B=(βt), которые могут быть вычислены путем численной оптимизации.
[0071] Модель PS сигнала вкДНК представляет собой гамма-пуассоновское (отрицательное биномиальное) распределение nl ~ NB(n''l…ρ, p=n · θ / (n'+n · θ)). Если n'=n'' · ρ · θ, n''l=n'' · Σt βt · Atl, и без учета вариабельности при извлечении, получаем nl ~ NB(n'' · ρ · Σt βt · Atl, n / (n'' · ρ+n)). Когда n<n'' · ρ, оно приблизительно представляет собой nl ~ Pois(n · Σt βt · Atl), что совпадает с моделью S.
[0072] Объединение стадий E и P в одно распределение Дирихле (n'l) / θ ~ Dir(n'' · α · 1/(1+1/ρ)), или n'l ~ Gamma(n'' · α · ρ/(1+ρ), (1+ρ) θ). Распределение Дирихле используется для оценки неизвестного полиномиального распределения вероятностей. В частности, оно расширяет бета-распределение на несколько измерений и обеспечивает плавный переход между предыдущим распределением и наблюдаемым распределением, а также позволяет контролировать скорость этого перехода.
[0073] При объединении стадий извлечения, ПЦР и секвенирования модель EPS сигнала вкДНК представляет собой (nl) ~ DM(n'' / (1+1/ρ) · α, n) или (nl) ~ DM(n'' · α · (1+r)/2, n), где DM представляет собой полиномиальное распределение Дирихле. Учитывая большое количество сгруппированных данных (или локусов), которые приблизительно равномерно распределены, оно близко к отрицательному биномиальному распределению: nl ~ NB(n'' · α · ρ/(1+ρ), (1+ρ) θ n / [(1+ρ) θ n+n’] или nl ~ NB(n''·αl·(1+r)/2, n / [n+n''·(1+r)/2]. Среднее значение и дисперсия μ=n · αl, δ2=n · αl · [n/ n'' · (1/ρ+1)+1]. Когда n<n'', например, для 30x WGS с>1 нг входной вкДНК, nl приближается к распределению Пуассона nl ~ Pois(n · αl). В таблице 1 представлен список статистических моделей, используемых в количественной оценке вкДНК, где αl=Σt βt · Atl и α=Σt βt · At.
Таблица 1
Зависимая модель | Независимая модель | |
Компонент E | (n''l) ~ Multi(α, n'') | n ''l ~ Пуа (n'' ·αl) |
Компонент P | (n’l) / θ ~ Dir((n''l · ρ)) | n'l ~ Gamma(n''l · ρ, θ) |
Компонент S | (nl) ~ Multi((n'l / n'), n) | nl ~ Pois(n · n'l / n') |
Модель S | (nl) ~ Multi(α, n) | nl ~ Pois(n · αl) |
Модель PS | (nl) ~ DM(n'' · ρ · α, n) | nl ~ NB(n'' · ρ · αl, n/(n'' · ρ+n)) или nl ~ Pois(n · αl), если n<n'' · ρ. |
Модель EPS | (nl) ~ DM(n''/(1+1/ρ) · α, n), | nl ~ NB(n''·αl·ρ/(1+ρ), n/[n+n''·ρ/(1+ρ)] или nl ~ Pois (n · αl), если n<n''. |
[0074] Модель PS сигнала вкДНК представляет собой гамма-пуассоновское (отрицательное биномиальное) распределение nl ~ NB(n''l · ρ, p=n · θ / (n'+n · θ)). Если n'=n'' · ρ · θ, n''l=n'' · Σt βt · Atl, и без учета вариабельности при извлечении, получаем nl ~ NB(n'' · ρ · Σt βt · Atl, n / (n'' · ρ+n)). Когда n<n'' · ρ, оно приблизительно представляет собой nl ~ Pois(n · Σt βt · Atl), что совпадает с моделью S.
Мультипликативное обновление
[0075] Модель Пуассона nl ~ Pois(n · αl) эквивалентна неотрицательной матричной факторизации с дивергенцией KL в качестве стоимости. Для вычисления βt применяется алгоритм мультипликативного обновления βst ← βst · Σl Atl · rsl / (β⋅A)sl / Σl Atl, основанный на алгоритме неотрицательной матричной факторизации (NMF), описанном в Lee and Seung, 2001.
Итеративная взвешенная линейная регрессия
[0076] Для отдельно взятого образца с расчетной долей ткани β0 взвешенная линейная регрессия с функцией стоимости определяется как E(β; β0, A)=1/2 · Σl [(rl - (β⋅A)l)2/ (β0⋅A)l]. Эта взвешенная линейная регрессия решается (β0, A), затем β ← r ⋅W-1⋅AT (A⋅W-1⋅AT)-1, где W=diag(β0⋅A), обеспечивая дальнейший алгоритм итеративного обновления. Разница между этой и обычной линейной регрессией E=1/2 · Σl [(rl - (β⋅A)l)2 заключается во взвешивании, основанном на W=diag(α)=β ⋅ AL.
Выведение модели EPS
[0077] Дано (n'l) / θ ~ Dir((n''l · ρ)) и (n''l) ~ Multi(α, n''), и закон общей дисперсии задан следующим образом:
E((n'l) / θ)=α,
var((n'l) / θ)=var(n''l/ n'')+E(n''l · ρ (n'' · ρ- n''l · ρ)/ [(n'' · ρ)2(n'' · ρ+1)].
~=var(n''l/ n'')+E(n''l / n'' (1 - n''l / n'')/ [n''· ρ]).
=α (1-α) / n''+α / [n''· ρ] - (var(n''l / n'')+α2) / [n''· ρ])
=α (1-α) / n''+α / [n''· ρ] - (α (1-α) / n''+α2) / [n''· ρ])
=α (1-α) {1 / n'' (1 - 1/[n''· ρ])+1/ [n''· ρ]}
~=α (1-α) {1 / n''+1/ [n''· ρ]}
=α (1-α) / [n'' · 1/(1+1/ρ))]
[0078] Это совпадает с Dir(n'' · α · 1/(1+1/ρ)). Учитывая n''l ~ Pois(n'' · αl) и n'l ~ Gamma(n''l · ρ, θ), закон общей дисперсии дает:
E((n'l))=n'' · αl · ρ · θ,
var((n'l))=var(n''l · ρ · θ)+E(n''l · ρ θ2)
=n'' · αl· ρ (1+ρ) θ2
[0079] Это совпадает с Gamma(n'' ⋅ α ⋅ ρ/(1+ρ), (1+ρ) θ).
n · n'l / n' ~ Gamma(n'' ⋅ α ⋅ ρ/(1+ρ), (1+ρ) θ n / n')
nl ~ Pois(n ⋅ n'l / n')
nl ~ NB(n'' ⋅ α ⋅ ρ/(1+ρ), (1+ρ) θ n / [(1+ρ) θ n+n']
nl ~ NB(n'' ⋅ α ⋅ ρ/(1+ρ), (1+ρ) n / [(1+ρ) n+n'' ⋅ ρ]
Пример 2 - Определение профиля вкДНК ткани
[0080] Следующий пример демонстрирует варианты осуществления способа определения референсного профиля вкДНК ткани.
[0081] Для расчета тканеспецифических или специфических для типа клеток профилей сигналов вкДНК могут быть использованы две взаимодополняющие стратегии. Первый метод заключается в использовании машинного обучения без учителя, основанного на наборе образцов, содержащих представляющую интерес ткань/клетку в различных долях. Второй метод заключается в использовании машинного обучения с учителем путем прогнозирования профилей сигналов вкДНК, происходящей из данной ткани/клетки, на основе эпигенетических профилей геномной ДНК (гДНК) или профилей экспрессии генов данного типа ткани/клеток.
Машинное обучение без учителя
[0082] В методе машинного обучения с учителем используется неотрицательное матричное разложение для разложения сигнала смеси вкДНК и извлечения тканеспецифических профилей покрытия вкДНК. Модель Пуассона nl ~ Pois(n · αl) эквивалентна неотрицательному матричному разложению с дивергенцией Кульбака-Лейблера (KL) в качестве стоимости. Дивергенция KL - это мера того, как одно распределение вероятностей отличается от референсного распределения вероятностей. Для данного набора данных достаточного размера и тканевого состава представляющего интерес типа ткани алгоритм NMF за авт. Lee and Seung 2001 применяется для расчета долей ткани в каждом образце, а также для установления профилей вкДНК ткани. Тканевая доля ткани t в образце s рассчитывается с помощью βst (βst · Σl Atl · rsl / (β⋅A)sl / Σl Atl, где сигнал вкДНК в локусе l для типа ткани t рассчитывается с помощью Atl ← Atl · Σs βst · rsl / (β⋅A)sl / Σs βst, где (представляет собой умножение матриц, rsl представляет собой долю прочтений, покрывающих локус l в образце s.
Машинное обучение с учителем
[0083] Существует два связанных ограничения алгоритма без учителя. Во-первых, для этого требуются образцы от субъектов, находящихся в определенных физиологических или патологических условиях, например, для изучения профиля вкДНК почек требуется доступ ко множеству образцов вкДНК от пациентов с повышенным повреждением почек. Во-вторых, для типов тканей с небольшими популяциями клеток или типов клеток, которые встречаются редко, доля сигнала вкДНК крови, привносимая такими клетками, может быть очень маленькой. Таким образом, требуется большее количество образцов вкДНК, чтобы эффективно изучить профили сигналов вкДНК для таких типов тканей или клеток. Эти ограничения можно преодолеть с помощью больших наборов данных. Однако на практике большие наборы данных могут помешать широкому применению количественной оценки вкДНК тканей на основе WGS для всех типов тканей.
[0084] По этим причинам может быть использовано машинное обучение с учителем, которое прогнозирует тканеспецифические профили числа копий вкДНК на основе эпигенетических данных или данных экспрессии из образцов клеток определенной ткани. Машинное обучение с учителем не требует доступа к образцам вкДНК от пациентов с определенным повреждением органов, а вместо этого использует только выделенные клетки ткани из образцов нормальных или больных субъектов. В этих методах применяется глубинная нейронная сеть, а точнее, рекуррентная нейронная сеть или сверточная нейронная сеть на одномерных данных секвенирования для прогнозирования профилей вкДНК. Входные характеристики для нейронных сетей включают полногеномную доступность ДНКазы, метилирование ДНК, метилирование гистонов, профили ацетилирования гистонов или профили экспрессии генов для данного типа ткани. Прогноз на основе машинного обучения представляет собой полногеномный профиль числа копий вкДНК для представляющей интерес ткани.
[0085] Перекрестная проверка как внутри ткани, так и между тканями используется для обучения и оценки моделей машинного обучения. Более конкретно, тканеспецифические эпигенетические данные подготавливаются в качестве входных характеристик, а расчетные профили покрытия вкДНК ткани (из алгоритмов без учителя) подготавливаются как целевые. Для перекрестной проверки внутри ткани сохраняется подмножество локусов в геноме для проверки, а другие локусы используются для обучения. Для перекрестной проверки между тканями референсные профили вкДНК для определенных типов клеток, таких как клетки крови, используются для обучения, а референсные профили вкДНК для дополнительных типов клеток, таких как клетки почек или легких, используются для проверки.
Пример 3 - исследования вкДНК
[0086] Следующий пример демонстрирует варианты осуществления исследований для анализа вкДНК в образце от субъекта.
Пилотное исследование
[0087] Плазменная ДНК от 10 пациентов с терминальной почечной недостаточностью (ТПН) и 10 нормальных контролей, соответствующих по возрасту, полу и массе тела, были получены и изучены. Для каждого образца был проведен 30x WGS. Было получено присутствие сильных сигналов вкДНК, которые могут надежно дифференцировать ТПН по сравнению с нормальными контролями. Кластерный анализ и анализ главных компонент (PCA) показывают, что ТПН и нормальные образцы образуют отдельные группы. Для нормальных контролей определенные доли почек составили <0,5%.
Исследование смеси
[0088] Для трех пар случай-контроль были приготовлены смеси синтетических вкДНК путем смешивания ТПН с контрольной вкДНК посредством последовательных разведений. Для каждой пары случай-контроль восемь смесей со 100%, 50%, 25%, 12,5%, 6,25%, 3,125%, 1,5625% и 0,78125% вкДНК ТПН разбавляли контрольной вкДНК. С помощью этого набора данных были определены аналитические характеристики количественной оценки тканей. Исследование смеси показало, что расчетная доля почек линейна по отношению к истинной доле почек, и что доля почек может быть точно определена (CV (коэффициент вариации) <20%) для до 0,5%.
[0089] Один вариант осуществления для проверки изображен на блок-схеме на фиг. 5, которая иллюстрирует процесс оценки образцов вкДНК для количественной оценки вкДНК ткани. Как показано на фиг. 5, первая когорта может включать контрольных и больных субъектов, которые подвергаются подготовке библиотеки, 30x WGS, а затем анализируются. Части продукта WGS подвергаются выявлению биомаркеров, тогда как другие части подвергаются проверке сигнала или алгоритмов WGS. Вторая когорта может представлять собой когорту синтетических смесей, включая, например, множество образцов от пациентов с диабетом, волчанкой, артериальной гипертензией, заболеваниями почек (такими как хроническая болезнь почек (ХБП) или поликистоз почек (ПКП)), контрольные образцы или образцы от других субъектов. Смеси подвергаются анализу ампликонов, секвенированию и применению алгоритмов для определения характеристик способов количественной оценки ткани (включая определение предела количественного определения (LOQ) или предела обнаружения LOD) и линейности способов) или диагностики заболевания (включая определение чувствительности и специфичности способов).
Полное исследование
[0090] После исследования смеси собирают около 200 образцов пациентов с диабетом на различных стадиях хронической болезни почек (ХБП) и подвергают 30x WGS вкДНК. Результаты показывают, что расчетная доля почек может надежно дифференцировать пациентов с ранней стадией ХБП от пациентов с терминальной стадией ХБП, что расчетная доля почек может надежно дифференцировать пациентов с ранней стадией ХБП от пациентов с диабетом без ХБП, и что расчетная доля почек коррелирует со степенью тяжести заболевания почек.
Исследование различных органов
[0091] Собирают пять образцов крови у пациентов с сердечной недостаточностью или повреждением легких (например, кистозным фиброзом) или нормальных контролей и подвергают 30x WGS вкДНК. Результаты демонстрируют, что пациенты с сердечной недостаточностью, повреждением легких или заболеванием почек имеют различающиеся между собой профили сигналов вкДНК, и они отличаются от нормальных контролей, и что доли вкДНК сердца и доли вкДНК легких могут быть количественно оценены.
Исследование различных трансплантатов
[0092] Собирают пять образцов крови от пациентов с трансплантатами легких или сердца и подвергают 30x WGS вкДНК. Результаты демонстрируют, что пациенты с трансплантатами сердца или легких имеют различающиеся картины, и что расчетные доли легких или доли сердца линейно коррелируют с долями донорских органов на основе генетических вариантов.
[0093] Термин ''содержащий'' в настоящем документе является синонимом терминов ''включающий'', ''содержащий'' или ''характеризующийся'' и является включительным или открытым, и не исключает дополнительных, не перечисленных элементов или стадий способа.
[0094] Приведенное выше описание раскрывает несколько методов и материалов согласно настоящему изобретению. Данное изобретение допускает модификации методов и материалов, а также изменения способов изготовления и оборудования. Такие модификации будут очевидны специалистам в данной области техники после прочтения данного описания или практического осуществления изобретения, раскрытого в настоящем документе. Следовательно, предполагается, что данное изобретение не ограничивается конкретными вариантами осуществления, раскрытыми в настоящем документе, но охватывает все модификации и альтернативные варианты, входящие в истинный объем и сущность изобретения.
[0095] Все цитируемые в настоящем документе источники, включая, не ограничиваясь перечисленным, опубликованные и неопубликованные заявки, патенты и литературные ссылки, полностью включены в настоящий документ посредством ссылки и, таким образом, являются частью данного описания. В той степени, в которой публикации и патенты или патентные заявки, включенные посредством ссылки, противоречат раскрытию, содержащемуся в описании, данное описание заменяет и/или имеет преимущественную силу над любым таким противоречащим материалом.
Claims (45)
1. Способ анализа внеклеточной ДНК (вкДНК) в биологическом образце, включающий:
получение биологического образца, содержащего вкДНК;
выделение вкДНК из указанного образца с получением очищенной вкДНК, где указанная очищенная вкДНК содержит множество фрагментов вкДНК, причем каждый из фрагментов соответствует определенному типу ткани или клеток;
количественную оценку указанных фрагментов вкДНК для создания полногеномного профиля числа копий вкДНК, где указанный полногеномный профиль числа копий вкДНК содержит множество сигналов числа копий, каждый из которых соответствует фрагменту вкДНК; и
сравнение указанного полногеномного профиля числа копий вкДНК с набором известных сигнатур вкДНК для определения повреждения клеток, повреждения ткани или повреждения органа.
2. Способ по п. 1, где биологический образец включает кровь, плазму, сыворотку, мочу, спинномозговую жидкость, слюну, лимфатическую жидкость, внутриглазную жидкость, стекловидную влагу, кохлеарную жидкость, слезы, молоко, мокроту, вагинальные выделения или любую их комбинацию.
3. Способ по п. 1, где количественная оценка включает секвенирование вкДНК с использованием подсчета молекул ДНК на основе секвенирования.
4. Способ по п. 1, дополнительно включающий обогащение представляющими интерес фрагментами вкДНК.
5. Способ по п. 1, где количественная оценка включает проведение количественной оценки ДНК на основе гибридизации.
6. Способ по п. 1, где выделение включает обогащение на основе размера для исключения гДНК и обогащения фрагментами вкДНК.
7. Способ по п. 1, где обогащение включает амплификацию вкДНК.
8. Способ по п. 7, где амплификация включает ПЦР-амплификацию или полногеномную амплификацию.
9. Способ по п. 1, где каждый сигнал числа копий характеризует относительный вклад вкДНК из определенного типа ткани или клеток.
10. Способ по п. 1, где тип ткани представляет собой почечную, мышечную, сердечную, сосудистую, печеночную, головного мозга, глазную, легочную, жировую, железистую, костную, костномозговую, хрящевую, кишечную, желудочную, кожную или ткань мочевого пузыря.
11. Способ по п. 1, где тип клеток представляет собой клетки крови, нейроны, клетки почки, эпителиальные клетки, бета-клетки или иммунные клетки.
12. Способ по п. 1, где полногеномный профиль вкДНК используют для количественной оценки количеств вкДНК из нескольких органов для обеспечения оценки состояния здоровья органа или нескольких органов.
13. Способ по п. 1, где образец периодически получают от субъекта и анализируют для мониторинга состояния здоровья с течением времени.
14. Способ по п. 13, дополнительно включающий мониторинг трансплантата органа с течением времени.
15. Способ по п. 1, где полногеномный профиль вкДНК свидетельствует о токсичности или эффективности лекарственного средства в органе.
16. Способ по п. 1, где образец является материнским образцом, и где полногеномный профиль вкДНК характеризует здоровье плода.
17. Способ по п. 1, где одновременно количественно оценивают несколько органов путем проецирования полногеномного профиля вкДНК на набор референсных профилей вкДНК, соответствующих различным типам тканей и клеток.
18. Способ по п. 1, дополнительно включающий вычитание референсного профиля исходного уровня из полногеномного профиля вкДНК.
19. Способ мониторинга развития заболевания у субъекта, включающий:
получение биологического образца от указанного субъекта, где указанный биологический образец содержит внеклеточную ДНК (вкДНК);
количественную оценку вкДНК в указанном образце для получения полногеномного профиля вкДНК, содержащего множество сигналов числа копий, каждый из которых соответствует фрагменту вкДНК определенного типа клеток или типа ткани; и
сравнение указанного множества сигналов числа копий вкДНК с набором известных сигналов числа копий здоровых субъектов,
где разница между сигналом числа копий в образце и известными сигналами числа копий коррелирует с развитием заболевания у указанного субъекта.
20. Способ по п. 19, где образец обогащают суммарной вкДНК перед количественной оценкой вкДНК.
21. Способ по п. 19, дополнительно включающий сравнение множества сигналов числа копий с профилем известных сигналов числа копий образцов больных пациентов.
22. Способ по п. 19, где биологический образец включает кровь, плазму, сыворотку, мочу, спинномозговую жидкость, слюну, лимфатическую жидкость, внутриглазную жидкость, стекловидную влагу, кохлеарную жидкость, слезы, молоко, мокроту, вагинальные выделения или любую их комбинацию.
23. Способ по п. 19, где количественная оценка включает секвенирование вкДНК с использованием подсчета молекул ДНК на основе секвенирования.
24. Способ по п. 19, где количественная оценка включает проведение количественной оценки ДНК на основе гибридизации.
25. Способ по п. 19, где заболевание выбрано из сердечной недостаточности, повреждения легких, диабета, болезни Крона или заболевания почек.
26. Способ по п. 25, где обогащение включает амплификацию вкДНК посредством направленной амплификации или полногеномной амплификации.
27. Способ мониторинга состояния здоровья тканей и органов у субъекта, включающий:
получение биологического образца от указанного субъекта, где указанный биологический образец содержит внеклеточную ДНК (вкДНК);
количественную оценку вкДНК в указанном образце для получения полногеномного профиля вкДНК, содержащего множество сигналов числа копий, каждый из которых соответствует фрагменту вкДНК определенного типа клеток или типа ткани; и
сравнение указанного множества сигналов числа копий вкДНК с набором известных сигналов числа копий здоровых субъектов,
где разница между сигналом числа копий в образце и известными сигналами числа копий коррелирует с изменением состояния здоровья органа у указанного субъекта.
28. Способ по п. 27, где образец обогащают суммарной вкДНК перед количественной оценкой вкДНК.
29. Способ по п. 27, дополнительно включающий сравнение множества сигналов числа копий с профилем известных сигналов числа копий образцов от пациента, имеющего неудовлетворительное состояние здоровья ткани или органа.
30. Способ по п. 27, где биологический образец включает кровь, плазму, сыворотку, мочу, спинномозговую жидкость, слюну, лимфатическую жидкость, внутриглазную жидкость, стекловидную влагу, кохлеарную жидкость, слезы, молоко, мокроту, вагинальные выделения или любую их комбинацию.
31. Способ по п. 27, где количественная оценка включает секвенирование вкДНК с использованием подсчета молекул ДНК на основе секвенирования.
32. Способ по п. 27, где количественная оценка включает проведение количественной оценки ДНК на основе гибридизации.
33. Способ по п. 27, где обогащение включает амплификацию вкДНК посредством направленной амплификации или полногеномной амплификации.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/796,481 | 2019-01-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2020141071A RU2020141071A (ru) | 2023-02-27 |
RU2818052C2 true RU2818052C2 (ru) | 2024-04-23 |
Family
ID=
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2627673C2 (ru) * | 2015-12-22 | 2017-08-09 | Закрытое акционерное общество "Геноаналитика" | Способ неинвазивной пренатальной диагностики анеуплоидий плода |
WO2018187521A2 (en) * | 2017-04-06 | 2018-10-11 | Cornell University | Methods of detecting cell-free dna in biological samples |
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2627673C2 (ru) * | 2015-12-22 | 2017-08-09 | Закрытое акционерное общество "Геноаналитика" | Способ неинвазивной пренатальной диагностики анеуплоидий плода |
WO2018187521A2 (en) * | 2017-04-06 | 2018-10-11 | Cornell University | Methods of detecting cell-free dna in biological samples |
Non-Patent Citations (1)
Title |
---|
CHENG TIMOTHY H.T. et al. "Genomewide bisulfite sequencing reveals the origin and time-dependent fragmentation of urinary cfDNA", CLINICAL BIOCHEMISTRY, ELSEVIER INC, US, CA,Vol. 50, No. 9, 24 February 2017 (2017-02-24), p. 496-501. * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210310067A1 (en) | Methods and systems for monitoring organ health and disease | |
US10016159B2 (en) | Determination of TGF-β pathway activity using unique combination of target genes | |
EP3729439B1 (en) | Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression | |
Riedmaier et al. | Transcriptional biomarkers–high throughput screening, quantitative verification, and bioinformatical validation methods | |
US20210010076A1 (en) | Methods and systems for abnormality detection in the patterns of nucleic acids | |
US20190078162A1 (en) | In vitro methods for skin therapeutic compound discovery using skin age biomarkers | |
WO2022121960A1 (zh) | 泛癌症早筛预测方法 | |
TWI758670B (zh) | 健康風險評估方法 | |
RU2818052C2 (ru) | Способы и системы мониторинга состояния здоровья и патологии органов | |
WO2020243587A1 (en) | Methods and systems for urine-based detection of urologic conditions | |
JP2024043823A (ja) | 対象のがん罹患の可能性を分析する方法 | |
US20230175064A1 (en) | Methods and systems for monitoring organ health and disease | |
CN113817818B (zh) | 用于诊断过敏性气道炎症的工具 | |
CN113528635B (zh) | 一种印记基因的甲基化作为心脑血管疾病早期诊断的标志物 | |
EP4417704A1 (en) | Method for creating biomarker set for detecting cancer | |
WO2024155681A1 (en) | Methods and systems for detecting and assessing liver conditions | |
CN117568458A (zh) | 一种辅助诊断心脑血管疾病的甲基化标志物 | |
CN118028450A (zh) | 一种对冠心病和脑卒中进行预警的数据处理装置、系统及其应用 | |
CN118782244A (en) | Computer device for early warning and prognosis of cardiovascular and cerebrovascular diseases and application thereof | |
Hsu et al. | Liquid Biopsies with Circulating miRNAs, Circulating Tumor Cells, and Cell-Free Circulating Tumor DNA in Head and Neck Cancer | |
KR20240012517A (ko) | 프래그멘토믹스를 사용하여 암을 검출하는 방법 및 조성물 | |
CN113362884A (zh) | 基于单碱基替换特征的肿瘤标志物筛选方法及应用 | |
JPWO2020054474A1 (ja) | 関節リウマチを検査する方法 |