JP2023504529A - がん予測パイプラインにおけるrna発現コールを自動化するためのシステムおよび方法 - Google Patents
がん予測パイプラインにおけるrna発現コールを自動化するためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2023504529A JP2023504529A JP2022533160A JP2022533160A JP2023504529A JP 2023504529 A JP2023504529 A JP 2023504529A JP 2022533160 A JP2022533160 A JP 2022533160A JP 2022533160 A JP2022533160 A JP 2022533160A JP 2023504529 A JP2023504529 A JP 2023504529A
- Authority
- JP
- Japan
- Prior art keywords
- sample
- batch
- samples
- quality control
- test
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 266
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 126
- 201000011510 cancer Diseases 0.000 title claims abstract description 76
- 230000014509 gene expression Effects 0.000 title claims description 222
- 108091032973 (ribonucleotides)n+m Proteins 0.000 title claims description 62
- 238000003908 quality control method Methods 0.000 claims abstract description 182
- 238000003559 RNA-seq method Methods 0.000 claims abstract description 66
- 238000004458 analytical method Methods 0.000 claims abstract description 54
- 238000007689 inspection Methods 0.000 claims abstract description 11
- 239000000523 sample Substances 0.000 claims description 436
- 238000012360 testing method Methods 0.000 claims description 152
- 108090000623 proteins and genes Proteins 0.000 claims description 108
- 239000013074 reference sample Substances 0.000 claims description 92
- 230000000694 effects Effects 0.000 claims description 79
- 238000012163 sequencing technique Methods 0.000 claims description 66
- 238000001574 biopsy Methods 0.000 claims description 64
- 210000001519 tissue Anatomy 0.000 claims description 53
- 230000009467 reduction Effects 0.000 claims description 36
- 150000007523 nucleic acids Chemical class 0.000 claims description 30
- 108020004707 nucleic acids Proteins 0.000 claims description 24
- 102000039446 nucleic acids Human genes 0.000 claims description 24
- 238000003860 storage Methods 0.000 claims description 18
- 239000003153 chemical reaction reagent Substances 0.000 claims description 16
- 210000004369 blood Anatomy 0.000 claims description 13
- 239000008280 blood Substances 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 11
- 239000002299 complementary DNA Substances 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 10
- 238000007481 next generation sequencing Methods 0.000 claims description 9
- 238000002560 therapeutic procedure Methods 0.000 claims description 9
- 210000001185 bone marrow Anatomy 0.000 claims description 8
- 239000013068 control sample Substances 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 238000002360 preparation method Methods 0.000 claims description 6
- 238000012552 review Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000013145 classification model Methods 0.000 claims description 5
- 238000011109 contamination Methods 0.000 claims description 4
- 238000013188 needle biopsy Methods 0.000 claims description 3
- 210000002307 prostate Anatomy 0.000 claims description 3
- 238000007388 punch biopsy Methods 0.000 claims description 3
- 238000007390 skin biopsy Methods 0.000 claims description 3
- 238000012049 whole transcriptome sequencing Methods 0.000 claims description 3
- 210000000988 bone and bone Anatomy 0.000 claims 1
- 238000003672 processing method Methods 0.000 claims 1
- 210000001082 somatic cell Anatomy 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 37
- 230000008569 process Effects 0.000 description 31
- 239000002773 nucleotide Substances 0.000 description 29
- 125000003729 nucleotide group Chemical group 0.000 description 29
- 238000009826 distribution Methods 0.000 description 22
- 108700028369 Alleles Proteins 0.000 description 16
- 230000035772 mutation Effects 0.000 description 16
- 238000000513 principal component analysis Methods 0.000 description 16
- 238000012937 correction Methods 0.000 description 15
- 108020004999 messenger RNA Proteins 0.000 description 13
- 239000007787 solid Substances 0.000 description 13
- 208000003174 Brain Neoplasms Diseases 0.000 description 11
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 11
- 238000000585 Mann–Whitney U test Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 230000002085 persistent effect Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 238000003745 diagnosis Methods 0.000 description 10
- 238000011222 transcriptome analysis Methods 0.000 description 10
- 239000013614 RNA sample Substances 0.000 description 9
- 238000003556 assay Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 150000003278 haem Chemical class 0.000 description 9
- 230000000392 somatic effect Effects 0.000 description 9
- 238000013480 data collection Methods 0.000 description 8
- 230000003321 amplification Effects 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000002759 chromosomal effect Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 230000008826 genomic mutation Effects 0.000 description 6
- 238000011068 loading method Methods 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 210000002220 organoid Anatomy 0.000 description 6
- 238000007482 whole exome sequencing Methods 0.000 description 6
- 206010009944 Colon cancer Diseases 0.000 description 5
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 201000005202 lung cancer Diseases 0.000 description 5
- 208000020816 lung neoplasm Diseases 0.000 description 5
- 244000052769 pathogen Species 0.000 description 5
- 230000001717 pathogenic effect Effects 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 206010006187 Breast cancer Diseases 0.000 description 4
- 208000026310 Breast neoplasm Diseases 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 208000029742 colonic neoplasm Diseases 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 4
- 238000007672 fourth generation sequencing Methods 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 240000008168 Ficus benjamina Species 0.000 description 3
- 208000008839 Kidney Neoplasms Diseases 0.000 description 3
- 206010061535 Ovarian neoplasm Diseases 0.000 description 3
- 238000002123 RNA extraction Methods 0.000 description 3
- 238000001793 Wilcoxon signed-rank test Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000009545 invasion Effects 0.000 description 3
- 210000004072 lung Anatomy 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000000869 mutational effect Effects 0.000 description 3
- 238000010238 partial least squares regression Methods 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 2
- 208000032818 Microsatellite Instability Diseases 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 108010029485 Protein Isoforms Proteins 0.000 description 2
- 102000001708 Protein Isoforms Human genes 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000007470 bone biopsy Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000037437 driver mutation Effects 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- 208000005017 glioblastoma Diseases 0.000 description 2
- 201000005787 hematologic cancer Diseases 0.000 description 2
- 230000002489 hematologic effect Effects 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000003364 immunohistochemistry Methods 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 238000011528 liquid biopsy Methods 0.000 description 2
- 230000003211 malignant effect Effects 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013450 outlier detection Methods 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 230000037438 passenger mutation Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000011524 similarity measure Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000009946 DNA mutation Effects 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 241000534431 Hygrocybe pratensis Species 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003851 biochemical process Effects 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 208000023965 endometrium neoplasm Diseases 0.000 description 1
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 230000008775 paternal effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 208000023958 prostate neoplasm Diseases 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/40—Population genetics; Linkage disequilibrium
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/40—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management of medical equipment or devices, e.g. scheduling maintenance or upgrades
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Physiology (AREA)
- Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Hospice & Palliative Care (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Ecology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Description
本出願は、2019年12月4日に出願された米国仮特許出願第62/943,712号の優先権を主張し、その内容は、すべての目的のためにそれらの全体が参照により本明細書に組み込まれる。
本開示は、トランスクリプトーム試料のセット(例えば、フローセル)における技術的バッチ効果を、がんの種類および組織部位が一致した検証された参照試料のセット(例えば、コホート一致参照バッチ)とともにプールすることによって、それらを評価する新規方法を提供する。これらの方法は、グローバル(例えば、バッチ内の試料のセット全体に対して実施される)および単一試料品質管理分析を同時に可能にするという点で、従来技術に対して改善される。これらの品質管理方法は、試料品質の迅速かつ正確な分析を提供することによって患者に利益をもたらし、したがって、改善された、より時宜にかなった患者の診断および治療を提供する。
本開示で使用される用語は、特定の実施形態を説明することのみを目的としており、本発明を限定することを意図するものではない。本発明の説明および特許請求の範囲の中で使用するとき、単数形「a」、「an」および「the」は、文脈において特に明確な指示がない限り、複数形も含むことを意図する。また、本明細書で使用されるとき、「および/または」という用語は、列挙する関連項目の1つ以上の任意かつすべての可能な組み合わせを指し、包含することも理解されるであろう。さらに本明細書で使用されるとき、「含む(includes)」、「含む(comprising)」という用語、またはそれらの任意の変形は、記載された特徴、整数、ステップ、動作、要素、および/もしくは構成要素の存在を規定するが、1つ以上の他の特徴、整数、ステップ、動作、要素、構成要素、および/もしくはそれらの群の存在、または追加を除外しないことも理解されたい。さらに、「含んでいる(including)」、「含む(includes)」、「有している(having)」、「有する(has)」、「有する(with)」、またはそれらの異形の用語が、詳細な説明および/または特許請求の範囲のいずれかにおいて使用される限り、そのような用語は、「含んでいる(comprising)」という用語と同様の方法で包括的であることを意図する。
本開示のいくつかの態様の概要および本開示において使用されるいくつかの定義が提供されたので、次に、例示的なシステムの詳細を図1と併せて説明する。図1は、いくつかの実装形態によるシステム100を示すブロック図である。いくつかの実装形態におけるシステム100は、1つ以上の処理ユニットCPU(複数可)102(プロセッサとも呼ばれる)、1つ以上のネットワークインターフェース104、(任意選択により)ディスプレイ108および入力システム110を含むユーザインターフェース106、非永続メモリ111、永続メモリ112、ならびにこれらのコンポーネントを相互接続するための1つ以上の通信バス114を含む。1つ以上の通信バス114は、任意で、システムコンポーネント間の通信を相互接続および制御する回路(チップセットと呼ばれることもある)を含む。非永続メモリ111は、典型的には、DRAM、SRAM、DDR RAM、ROM、EEPROM、フラッシュメモリなどの高速ランダムアクセスメモリを含み、一方、永続メモリ112は、典型的には、CD-ROM、デジタル多用途ディスク(DVD)もしくは他の光記憶、磁気カセット、磁気テープ、磁気ディスクストレージもしくは他の磁気記憶デバイス、磁気ディスク記憶デバイス、光ディスク記憶デバイス、フラッシュメモリデバイス、または他の不揮発性ソリッドステート記憶デバイスを含む。永続メモリ112は、任意で、CPU 102から遠隔に配置された1つ以上のストレージデバイスを含む。永続メモリ112、および非永続メモリ112内の不揮発性メモリデバイスは、非一時的コンピュータ可読記憶媒体を備える。いくつかの実装形態において、非永続メモリ111、または非一時的コンピュータ可読記憶媒体は、以下のプログラム、モジュール、データ構造体、またはそれらのサブセットを、場合には永続メモリ112と組み合わせて、格納する。
・様々な基本的なシステムサービスを処理し、ハードウェアに依存するタスクを実施するための手順を含む、任意選択のオペレーティングシステム116;
・システム100を他のデバイスおよび/または通信ネットワーク104に接続するための任意選択のネットワーク通信モジュール(または命令)118;
・RNA配列決定試料のバッチのバッチ品質管理を実施するためのバッチ品質管理モジュール120;
・各バッチデータセットが、複数(例えば、バッチ)の試料における各試料124について、少なくとも対応する複数の配列リード126および対応する試料メタデータ128を含み、また、各バッチデータセットにおいて、対応するコホート一致参照バッチ130も含まれる、1つ以上のバッチデータセット122;
・各参照試料が、少なくとも対応する複数の参照試料配列144および対応する参照試料メタデータ146を含む、1つ以上の参照試料142を格納する参照試料データセット140;
・1つ以上のバッチ品質管理試験152が、品質管理モジュール120を介して、バッチデータセット(例えば、バッチデータセット122-1)に含まれる複数の試料(例えば、124-1、...124-A)に対して実施される、1つ以上のバッチ品質管理試験152を格納するためのグローバル品質管理データセット150;
・RNA配列決定試料の単一試料品質管理を実施するための単一試料品質管理モジュール121;ならびに
・1つ以上の単一試料品質管理試験162が、品質管理モジュール120を介して、バッチデータセット122に含まれる個々の試料124に対して実施される、1つ以上の単一試料品質管理試験162を格納するための単一試料品質管理データセット160。
本開示によるシステム100の詳細が開示されたので、次に、本開示の様々な実施形態によるシステムのプロセスおよび特徴に関する詳細が、以下に開示される。具体的には、図2A、2B、15、16、および17を参照して、例示的なプロセスを以下に説明する。いくつかの実施形態において、システムのこのようなプロセスおよび特徴は、図1に示されるように、モジュール118、120、および/または121によって実行される。
ブロック206。図2Aのブロック206を参照すると、バッチデータセットが電子形式で取得される(例えば、バッチデータセット内の各試料の情報は、.csvファイルで格納される)。バッチデータセットは、複数(例えば、バッチ)の試料内の各それぞれの試料について、標的化パネルまたは全トランスクリプトーム配列決定によってそれぞれの試料から得られた対応する複数の配列リードを含む。いくつかの実施形態において、対応する複数の配列リードの各々は、複数のRNA分子または該複数のRNA分子の誘導体(例えば、cDNAなどの誘導体)から取得される。いくつかの実施形態において、対応する複数の配列リードの各々は、完全なトランスクリプトーム配列決定によって取得される。いくつかの実施形態において、1つ以上の対応する複数の配列リードは、固形または血液学的腫瘍(例えば、固形生検)から単離されたRNAに由来する。いくつかの実施形態において、1つ以上の対応する複数の配列リードは、それぞれの対象から取得された生殖細胞系列試料に由来する。
図2Aのブロック210を参照すると、いくつかの実施形態において、バッチデータセットについてのコホート一致参照データセットを決定することは、試料のバッチ内の各試料について、i)それぞれの複数の配列リードからのそれぞれの複数の配列特徴を抽出し、それによって、バッチの複数の配列特徴を取得することと、ii)それぞれの複数の試料メタデータ特徴を抽出し、それによって、バッチの複数のメタデータ特徴を取得することと、を含む。いくつかの実施形態において、バッチの複数の配列特徴またはバッチの複数のメタデータ特徴に少なくとも部分的に基づいて、参照データセットから、複数の参照試料を含むコホート一致参照データセットを選択する。
ブロック214。図2Bのブロック214を参照すると、1つ以上のグローバル品質管理試験(例えば、試験152)が、少なくともコホート一致参照データセット(例えば、バッチ)を使用してバッチデータセットに対して実施される。いくつかの実施形態において、1つ以上のグローバルバッチ品質管理試験は、バイオインフォマティクスパイプライン分析および配列決定方法を含むセットからの1つ以上のバッチ効果についての試験を含む。
ブロック222を参照すると、いくつかの実施形態において、試料のバッチ内の各試料について(いくつかの実施形態において、グローバルバッチ品質管理試験に不合格となった試料でさえ)、それぞれの試料レポートが提供される。代替の実施形態において、試料レポートは、グローバルバッチ品質管理試験のうちのいずれか1つに不合格とならなかった試料(例えば、更新されたバッチデータセットに含まれる試料)についてのみ提供される。いくつかの実施形態において、各それぞれの試料レポートは、発現コールのセット、1つ以上の一致した療法、または1つ以上の一致した臨床試験のうちの少なくとも1つを含む。いくつかの実施形態において、適切な一致した療法は、発現コールおよびがんの種類の情報に基づいて決定される。いくつかの実施形態において、オルガノイド試験に基づいて、適切な一致した治療が決定される。オルガノイド試験の例、およびオルガノイド試験結果と療法感度との間の相関関係は、“Systems and Methods for Predicting Therapeutic Sensitivity”と題され、2019年10月22日に出願された米国仮特許出願第62/924,621号に提供されている。いくつかの実施形態において、適切な一致した臨床試験は、それぞれの試料についての対応する発現コールに少なくとも部分的に基づいて決定される。
ブロック230。図2Bのブロック230を参照すると、いくつかの実施形態において、試料のバッチ内の各それぞれの試料について、対応する複数の配列リードから、1つ以上の単一試料品質管理試験が、それぞれの試料に対して実施される。1つ以上の単一試料品質管理試験のうちのいずれか1つに不合格となった試料のバッチからのそれぞれの試料は、バッチデータセットから除去されるか、または手動検査のためにフラグが立てられる。いくつかの実施形態において、任意の単一試料品質管理試験を、バッチデータセット全体に適用することができる。いくつかの実施形態において、単一試料QC試験は、バッチQC試験の前に実施される。いくつかの実施形態において、単一試料QC試験は、バッチQC試験の後に実施される。
ブロック240。図2Bのブロック240を参照すると、いくつかの実施形態において、1つ以上のバッチ品質管理試験(例えば、バッチ外れ値全体の検出)は、第1のモジュール(例えば、モジュール120)を含み、1つ以上の単一試料品質管理試験(例えば、単一試料外れ値の検出)は、第2のモジュール(例えば、モジュール121)を含む。いくつかの実施形態において、第1のモジュールおよび第2のモジュールのそれぞれは、それぞれのドッカー(例えば、オペレーティングシステム116に関係なく、バッチ品質管理試験および単一試料品質管理試験の実施を可能にする計算コンテナ)を含む。いくつかの実施形態において、第1のモジュールおよび第2のモジュールは、同じコンピュータシステムで実施される。いくつかの実施形態において、第1のモジュールおよび第2のモジュールは、異なるコンピュータシステムで実施される。
本開示の別の態様は、1つ以上のプロセッサと、1つ以上のプロセッサによって実行するための1つ以上のプログラムを格納するメモリと、を有するコンピュータシステムにおいて、品質管理を実施する方法を提供する。この方法は、試験試料のバッチ内の各それぞれの試験試料について、遺伝子の第1のセットにおける各それぞれの遺伝子についての対応する遺伝子発現値を含む対応する発現プロファイルと、試料についての特徴の第1のセットにおける各それぞれの特徴についての値を含むメタデータの対応するセットと、を含む、バッチデータセットを電子形式で取得することを含む。
本開示の別の態様は、1つ以上のプロセッサと、1つ以上のプロセッサによって実行するための1つ以上のプログラムを格納するメモリと、を有するコンピュータシステムにおいて、RNA発現パイプラインにおける変化を検証する方法を提供する。この方法は、試験試料のバッチ内の各それぞれの試験試料について、第1のRNA発現パイプラインを使用して調製された対応する発現プロファイルを含むバッチデータセットを電子形式で取得することを含む。対応する発現プロファイルは、遺伝子の第1のセットにおける各それぞれの遺伝子についての対応する遺伝子発現値を含む。バッチデータセットは、それぞれの試験試料についての特徴の第1のセットにおける各それぞれの特徴についての値を含むメタデータの対応するセットをさらに含む。
本開示の別の態様は、1つ以上のプロセッサと、1つ以上のプロセッサによって実行するための1つ以上のプログラムを格納するメモリと、を有するコンピュータシステムにおいて、RNA発現データを参照データベースに追加する方法を提供する。この方法は、新しい発現データセットを電子形式で取得することを含む。新しい発現データセットは、複数の試験試料中の各それぞれの試験試料について、第1のRNA発現パイプラインを使用して調製された対応する発現プロファイルを含み、対応する発現プロファイルは、遺伝子の第1のセットにおける各それぞれの遺伝子についての対応する遺伝子発現値を含む。新しい発現データセットは、それぞれの試験試料についての特徴の第1のセットにおける各それぞれの特徴についての値を含むメタデータの対応するセットをさらに含む。
本明細書に記載されるシステムおよび方法のいくつかの実施形態(例えば、上記のように図2、15、16、および17に概説されている方法)において、バッチデータセットを取得することは、試料のバッチ内の各それぞれの試料について、標的化または全トランスクリプトームRNA配列決定によってそれぞれの試料から得られた対応する複数の配列リードを電子形式で取得すること、および対応する複数の配列リードから、遺伝子の第1のセットにおける各それぞれの遺伝子についての対応する遺伝子発現値を決定すること、を含む。いくつかの実施形態において、本明細書に記載される方法はまた、配列決定データを生成するステップを含む。しかしながら、他の態様において、本明細書に記載される方法は、配列決定がすでに実施された後に開始する。例えば、いくつかの実施形態において、本明細書に記載される方法は、本明細書に記載されるように、試料のバッチ内の各試料について、電子形式で配列リードを取得すること、配列リードに基づいて試料のバッチ内の各試料についての発現プロファイルを決定すること、および次に1つ以上の品質管理方法を実施すること、によって開始する。同様に、いくつかの実施形態において、本明細書に記載される方法は、本明細書に記載されるように、試料のバッチ内の各試料について、電子形式で発現プロファイルを取得すること、および次に1つ以上の品質管理方法を実施することによって開始する。
プロトコル、試薬、または配列決定技術の変更などの技術的バッチ効果により、大規模なトランスクリプトーム研究が無効になる可能性がある。腫瘍の種類、時間、または複数の施設にわたってトランスクリプトームを分析する検査室は、バッチ間のデータの互換性を検証するための体系的な方法を有する必要がある。
キャプチャRNA-Seq法は、特に、FFPE試料における遺伝子発現を分析する場合、全mRNAキャプチャ法に比べて多くの利点を有する。例えば、全mRNAキャプチャ法でのポリA選択は、固定プロセス中にRNA分子が断片化されるため、FFPE試料では最適に機能しない。したがって、多くのmRNA断片は、もはやポリAテールに関連付けられていないため、キャプチャされない。対照的に、キャプチャRNA-Seq法は、標的mRNAのコード配列に対して設計されたプローブを使用してmRNA断片を単離するため、これらの方法は、断片化による影響を大幅に軽減する。さらに、血液学的試料を使用する場合、キャプチャRNA-Seq方法論は、リボソーム枯渇およびヘモグロビン枯渇による影響が少ない。
Eci=(Ei*mi)+bi
式中、Eiは、第2世代のエクソームキャプチャプローブのセットを使用して遺伝子i(log2 TPM)に対して決定された未補正の発現レベルであり、miは、遺伝子iについての勾配補正係数であり、biは、遺伝子iについての切片補正係数である。各遺伝子についてのこれらの勾配および切片の補正係数は、一致したデータセットにおけるv1および補正されたv2の分布に一致するように学習される。これを、対合した試料の状況を考慮することができる加重損失関数を最小化することによって最適化した。この副次情報を利用することにより、第2世代のエクソームプローブのセットを使用して処理されたすべての試料に同じ線形補正を適用できるため、結果として得られる補正係数は、任意のがんの種類の配列決定された試料に対してロバストに機能するであろう。
ヘムがんは、全血、骨髄から採取することができ、時々、ホルマリン固定パラフィン包埋(FFPE)に保存することができる。しかしながら、これらの試料採取方法論の相違により、技術的バッチ効果の導入がもたらされる。簡潔に説明すると、血液サンプリング、骨髄サンプリングのいずれかによって採取した、またはFFPEに保存したコホート一致がん試料からのRNA発現データを、本開示のいくつかの実施形態に従って、UMAPを使用して2座標に埋め込んだ、次元縮小分析によって分析した。図7に提示した結果は、トランスクリプトーム試料がクラスター化され、y軸でFFPE対EDTA血液/骨髄チューブによって分離され、軸で骨髄対全体によって分離されていることを示す。この分離は、生物学的および技術的な相違の両方によって駆動され、適切な参照の一致を必要とする。
トランスクリプトーム分析中に使用した異なる抽出方法および化学物質は、バッチ効果を導入する可能性がある。例えば、バッチ効果は、RNAseq分析(内部抽出)の直前とは対照的に、例えば、臨床医によって試料が配列決定(外部抽出)のために送られる前にRNA試料が抽出された場合に生じる可能性がある。簡潔に説明すると、RNA単離の前または後に取得されたコホート一致がん試料からのRNA発現データを、本開示のいくつかの実施形態に従って、UMAPを使用して2座標に埋め込んだ、次元縮小分析によって分析した。図8に提示した結果は、ヘムが、内部で抽出された試料とは別に、外部ソースクラスターによって試料を抽出したことを示す。実施例3に記載されているように、血液および骨髄から内部抽出されたFFPE試料を分離することにより、第2のバッチ効果が観察される。
キャプチャRNASeqの方法論は、キャプチャプローブを使用してcDNA断片ライブラリーが濃縮されるステップを含む。この一例では、いくつかのがん試料用に調製したcDNA断片ライブラリーの2つの試料を、目的のゲノム領域に相補的なビオチン化オリゴヌクレオチドプローブの同じセットの2つのバッチにハイブリダイズした。これらのキャプチャプローブライブラリーは、時々、それ自体が、異なるゲノムキャプチャ設計のプールになり得る。プローブロットの製造およびキャプチャライブラリーのプールは、バッチ効果を導入する可能性がある。次に、両方のロットのキャプチャプローブを使用して生成したRNA発現データを、PCA次元縮小分析によって分析した。図9に提示した結果は、PC8(x軸)で検出された、異なるプローブロットによって導入されたバッチ効果を示す。
ハイブリダイゼーションプレキシティとは、標的化キャプチャ中に一緒にプールされたcDNA試料の数を指す。アッセイは、プール内の単一のみの試料から12を超える試料まで様々であり得る。この実験では、9つの腫瘍試料および2つの細胞対照を、3つのプレキシティ条件(単一、3倍、および6倍の試料プール)下で配列決定した。RNA配列決定に続いて、異なるプレキシティ条件下で調製した試料を使用して生成した発現データを、本開示のいくつかの実施形態に従って、UMAPを使用して2座標に埋め込んだ、次元縮小分析によって分析した。図10に提示した結果は、使用したプレキシティ条件に関係なく、一致した試料がクラスター化されたことを示し、これは、プレキシティがトランスクリプトーム分析に対してバッチ効果を導入しないことを示す。
一部のRNAseq方法論では、キャプチャ後のPCRは、アンプリコン断片がプローブによってキャプチャされた後、かつ配列決定の前の増幅ステップである。非結合断片は洗い流され、残りの断片は設定されたサイクル数で増幅される(サイクルが多いほど増幅が多くなる)。サイクルが多すぎると、配列の特徴に基づいて不均衡な重複率が発生する可能性がある。この実験では、6つの腫瘍および1つの対照試料に対する増幅サイクル数(7~9)の効果を決定した。RNA配列決定に続いて、異なる増幅条件(7~9サイクル)下で調製した試料を使用して生成した発現データを、本開示のいくつかの実施形態に従って、UMAPを使用して2座標に埋め込んだ、次元縮小分析によって分析した。図11に提示した結果は、使用した増幅サイクルの数に関係なく、一致した試料がクラスター化されたことを示し、これは、7~9のPCR増幅サイクル数の変動が、トランスクリプトーム分析に対してバッチ効果を導入しないことを示す。
負荷モル濃度は、シーケンサーに負荷される試料の量を指す。典型的に、モル濃度が低すぎると、複製率が高くなり、データのノイズが大きくなる可能性がある。このバッチ効果実験では、11個の腫瘍試料および3個の対照試料を、3つのモル濃度条件(0.7、1、および1.5uM)下で配列決定した。RNA配列決定に続いて、異なる負荷モル濃度下で調製した試料を使用して生成した発現データを、本開示のいくつかの実施形態に従って、UMAPを使用して2座標に埋め込んだ、次元縮小分析によって分析した。図12に提示した結果は、使用した負荷モル濃度に関係なく、一致した試料がクラスター化されたことを示し、これは、0.7~1.5uMの負荷モル濃度の変動が、トランスクリプトーム分析に対してバッチ効果を導入しないことを示す。
Illuminaの配列決定試薬の変更は、それらの技術に対する追加の特徴により良く適合させるために使用される化学物質の一般的で専有的な変更である。試薬変更の最近の例は、ユニバーサル分子インデックス(UMI)での追加のリードを可能にするために適合された。バッチ効果対照実験では、28個の試料を2つの試薬バージョン下で配列決定し、以前のバージョンと現在のバージョンの試薬の間にバッチ効果が検出されなかったことを確認した。RNA配列決定に続いて、異なるバージョンの試薬を使用して調製した試料を使用して生成した発現データを、本開示のいくつかの実施形態に従って、UMAPを使用して2座標に埋め込んだ、次元縮小分析によって分析した。全体として、試料は試料ごとにクラスター化され(図13、結んだ線)、試薬は少しではあるが、トランスクリプトーム分散に対して許容範囲内にある。
本明細書に記載される方法は、RNA配列決定試料のバッチを評価するための改善された品質管理方法を提供する。以前の方法よりも精度が改善し、解像度が高いため、本明細書で提供される予測アルゴリズムを使用して、品質管理基準を満たす単一の試料およびバッチ全体を特定することができる。このように品質管理が強化されると、患者に診断を提供し、適切な治療を決定するために使用される情報がより正確になり、診断が改善され、患者に対するより多くの情報に基づいた治療の推奨がもたらされる。
本明細書に引用されるすべての参考文献は、あたかも各個々の刊行物または特許または特許出願がすべての目的のためにその全体が参照により組み込まれるように、具体的かつ個別に示されるのと同程度に、それらの全体がすべての目的のために本明細書に参照により組み込まれる。
Claims (56)
- 品質管理を実施する方法であって、前記方法が、
1つ以上のプロセッサと、前記1つ以上のプロセッサによって実行するための1つ以上のプログラムを格納するメモリと、を有するコンピュータシステムにおいて、
a)試料のバッチ内の各それぞれの試料について、標的化または全トランスクリプトームRNA配列決定によって前記それぞれの試料から得られた対応する複数の配列リードと、前記それぞれの試料についての対応するメタデータと、を含む、バッチデータセットを電子形式で取得すること、
b)前記バッチデータセットについて、コホート一致参照バッチを決定することであって、前記コホート一致参照バッチが、組織部位、腫瘍純度、がんの種類、収集方法、シーケンサーの同一性、および/または配列決定された日付について均衡が取れている、決定すること、
c)少なくとも前記コホート一致参照バッチを使用して前記バッチデータセットに対して1つ以上のグローバルバッチ品質管理試験を実施すること、ならびに
d)前記1つ以上のグローバルバッチ品質管理試験の実施後、
前記1つ以上のグローバルバッチ品質管理試験の各々が満たされている場合、前記バッチデータセットを検証すること、または
前記グローバルバッチ品質管理試験のうちの1つ以上が満たされていない場合、前記バッチデータセットを検証しないこと、を含む、方法。 - 前記グローバルバッチ品質管理試験のうちの1つ以上が満たされていない場合、前記1つ以上のグローバルバッチ品質管理試験のうちのいずれか1つに不合格となる前記バッチデータセットからそれぞれの試料を除去すること、または前記1つ以上のグローバルバッチ品質管理試験のうちのいずれか1つに不合格となるそれぞれの試料に、手動検査のためのフラグを立てることをさらに含む、請求項1に記載の方法。
- 標的化パネルRNA配列決定が、複数のプローブを使用する、請求項1または2に記載の方法。
- 前記複数のプローブにおける各プローブが、参照トランスクリプトームのそれぞれの部分を一意的に標的化し、
前記対応する複数の配列リードにおける各配列リードが、前記複数のプローブにおける少なくとも1つのプローブに対応する、請求項3に記載の方法。 - 全トランスクリプトーム配列決定が、次世代配列決定を含む、請求項1~4のいずれか一項に記載の方法。
- 前記除去することが、更新されたバッチデータセットを提供することをさらに含む、請求項2~5のいずれか一項に記載の方法。
- 前記バッチデータセットについてのコホート一致参照データセットを決定することが、
試料の前記バッチ内の各試料について、
i)それぞれの複数の配列リードからそれぞれの複数の配列特徴を抽出し、それによって、バッチの複数の配列特徴を取得すること、および
ii)それぞれの複数の試料メタデータ特徴を抽出し、それによって、バッチの複数のメタデータ特徴を取得することと、
前記バッチの複数の配列特徴または前記バッチの複数のメタデータ特徴に少なくとも部分的に基づいて、参照データセットから、複数の参照試料を含む前記コホート一致参照データセットを選択することと、を含む、請求項1~6のいずれか一項に記載の方法。 - 前記コホート一致参照データセットが、複数の参照試料を含み、
前記複数の参照試料中の各参照試料が、標的化または全トランスクリプトームRNA配列決定によってそれぞれの参照試料から得られた対応する複数の配列リードと、前記それぞれの参照試料についての対応するメタデータと、を含む、請求項7に記載の方法。 - 前記バッチデータセットにおける試料の第1のサブセットにおける各試料が、対応する第1の生検の種類を有し、
前記バッチデータセットにおける試料の第2のサブセットにおける各試料が、対応する第2の生検の種類を有する、請求項7に記載の方法。 - 前記第1の生検の種類または第2の生検の種類が、マクロ解剖されたホルマリン固定パラフィン包埋(FFPE)組織切片、外科生検、皮膚生検、パンチ生検、前立腺生検、骨生検、骨髄生検、針生検、CTガイド下生検、超音波ガイド下生検、細針吸引、吸引生検、新鮮な組織または血液試料を含むセットから選択される体細胞生検を含む、請求項9に記載の方法。
- 前記方法が、
試料の前記バッチ内の各それぞれの試料について、前記対応する複数の配列リードから、前記それぞれの試料に対して1つ以上の単一試料品質管理試験を実施することと、
前記1つ以上の単一試料品質管理試験のうちのいずれか1つに不合格である試料の前記バッチからそれぞれの試料を除去するか、または前記1つ以上の単一試料品質管理試験のうちのいずれか1つに不合格となるそれぞれの試料に、手動検査のためのフラグを立てることと、をさらに含む、請求項1~10のいずれか一項に記載の方法。 - 前記1つ以上の単一試料品質管理試験におけるそれぞれの単一試料品質管理試験が、
i)試料の前記バッチ内のそれぞれの試料について、前記複数の配列リードにおけるそれぞれの数の重複していないマッピングされた配列リードを決定することであって、各重複していないマッピングされた配列リードが、参照ゲノムの対応する部分にマッピングする、決定することと、
ii)前記それぞれの数の重複していないマッピングされた配列リードを、予想された数の重複していないマッピングされた配列リードと比較することであって、前記それぞれの数の重複していないマッピングされた配列リードが、所定の数の重複していないマッピングされたリードを下回る場合、前記それぞれの試料が、前記それぞれの単一試料品質管理試験に不合格となる、比較することと、を含む、請求項11に記載の方法。 - 前記1つ以上の単一試料品質管理試験におけるそれぞれの単一試料品質管理試験が、試料の前記バッチ内のそれぞれの試料について、適切に対合した配列リードのそれぞれのパーセンテージを決定することであって、適切に対合した配列リードの前記パーセンテージが、所定の対合したリード閾値を下回る場合、前記それぞれの試料が、前記それぞれの単一試料品質管理試験に不合格となる、決定することを含む、請求項11または12に記載の方法。
- 前記1つ以上の単一試料品質管理試験におけるそれぞれの単一試料品質管理試験が、試料の前記バッチ内のそれぞれの試料について、前記対応する複数の配列リードのそれぞれのGC含量を決定することであって、前記それぞれのGC含量が、所定のGC含量閾値の範囲外である場合、前記それぞれの試料が、前記それぞれの単一試料品質管理試験に不合格となる、決定することを含む、請求項11~13のいずれか一項に記載の方法。
- 前記1つ以上の単一試料品質管理試験におけるそれぞれの単一試料品質管理試験が、試料の前記バッチ内のそれぞれの試料について、それぞれの数の発現遺伝子を決定することであって、対応する発現リードスコアが、所定の数の発現リードを下回る場合、前記それぞれの試料が、前記それぞれの単一試料品質管理試験に不合格となる、決定することを含む、請求項11~14のいずれか一項に記載の方法。
- 前記1つ以上のグローバルバッチ品質管理試験が、バイオインフォマティクスパイプライン分析、DNA汚染、試料処理、および配列決定方法を含むセットからの1つ以上のバッチ効果についての試験を含む、請求項1~15のいずれか一項に記載の方法。
- それぞれのグローバルバッチ品質管理試験が、
i)前記バッチデータセット全体の試料当たりの配列リードの平均数を決定することと、
ii)参照データセットから試料当たりの配列リードの参照平均数を取得することと、
iii)前記バッチデータセット全体の配列リードの前記平均数を、試料当たりの配列リードの参照平均数と比較することであって、配列リードの前記平均数が、試料当たりの配列リードの前記参照平均数を下回る場合、前記バッチデータセットが、前記それぞれのグローバルバッチ品質管理試験に不合格となる、比較することと、を含む、請求項16に記載の方法。 - それぞれのグローバルバッチ品質管理試験が、
前記バッチデータセット内の各それぞれの試料について、前記対応する複数の配列リードおよび対応するメタデータを、第1の訓練された分類モデルに適用し、それによって、前記第1の訓練された分類モデルが、各試料についてのそれぞれの予測された性別割り当てを含む、予測された性別割り当てのセットを提供することと、
予測された性別割り当ての前記セットを、性別割り当ての予想されたセットと比較することであって、性別割り当ての前記予想されたセットと一致しないそれぞれの予測された性別割り当てを有する各試料が、前記それぞれのグローバルバッチ品質試験に不合格となる、比較することと、を含む、請求項16または17に記載の方法。 - 前記方法が、前記バッチの複数の配列特徴および前記バッチの複数のメタデータ特徴を、次元縮小手法に供することによって、前記バッチの複数の配列特徴および前記バッチの複数のメタデータ特徴の線形または非線形の組み合わせを決定することをさらに含む、請求項1~18のいずれか一項に記載の方法。
- 前記方法が、(c)前記1つ以上のグローバルバッチ品質管理試験を実施する前に、前記コホート一致参照バッチを使用して、1つ以上の交絡共変量について前記バッチデータセット内の各試料を調整することをさらに含む、請求項1~19のいずれか一項に記載の方法。
- 前記バッチデータセット内の少なくとも1つの試料が、対照試料である、請求項20に記載の方法。
- 前記バッチデータセット内の前記少なくとも1つの対照試料が、前記バッチデータセット内の各々の他の試料を調整するために使用される、請求項21に記載の方法。
- 前記方法が、試料の前記バッチ内の各試料について、それぞれの試料レポートを提供することであって、各それぞれの試料レポートが、発現コールのセット、1つ以上の一致した療法、または1つ以上の一致した臨床試験のうちの少なくとも1つを含む、提供することをさらに含む、請求項1~22のいずれか一項に記載の方法。
- 前記方法が、クラウドサーバを備えるコンピュータシステムで実施される、請求項1~23のいずれか一項に記載の方法。
- 前記1つ以上のグローバルバッチ品質管理試験が、第1のモジュールを含み、
前記1つ以上の単一試料品質管理試験が、第2のモジュールを含む、請求項11~24のいずれか一項に記載の方法。 - 品質管理を実施する方法であって、前記方法が、
1つ以上のプロセッサと、前記1つ以上のプロセッサによって実行するための1つ以上のプログラムを格納するメモリと、を有するコンピュータシステムにおいて、
a)試験試料のバッチ内の各それぞれの試験試料について、
遺伝子の第1のセットにおける各それぞれの遺伝子についての対応する遺伝子発現値を含む対応する発現プロファイルと、
前記それぞれの試験試料についての特徴の第1のセットにおける各それぞれの特徴についての値を含むメタデータの対応するセットと、を含む、バッチデータセットを電子形式で取得することと、
b)複数の参照試料における各それぞれの参照試料について、遺伝子の前記第1のセットにおける各それぞれの遺伝子についての対応する遺伝子発現値を含む対応する発現プロファイルを含むコホート一致参照データセットを、前記バッチデータセットについて決定することであって、
前記複数の参照試料における各それぞれの参照試料が、前記それぞれの参照試料についての特徴の第2のセットにおける各それぞれの特徴についての対応する値を含むメタデータの対応するセットに関連付けられ、
特徴の前記第1のセットおよび特徴の前記第2のセットの両方に存在する1つ以上の特徴の第3のセットにおける各それぞれの特徴についての集計値が、前記バッチデータセットと、前記コホート一致参照データセットとの間で均衡が取れている、決定することと、
c)前記複数の試験試料における各それぞれの試験試料についての前記対応する発現プロファイル、および前記複数の参照試料における各それぞれの参照試料についての前記対応する発現プロファイルからなる組み合わせたデータセットに対して次元縮小を実施し、それによって、各それぞれの試験試料および各それぞれの参照試料について、前記対応する発現プロファイルの次元よりも低い次元空間に埋め込まれた座標の対応するセットを取得することと、
d)前記試験試料について取得した座標の前記セットと、前記参照試料について取得した座標の前記セットとの間の類似性の統計的尺度を決定することと、
e)類似性の前記統計的尺度を閾値と比較し、
類似性の前記統計的尺度が、前記閾値を満たしている場合、報告するための前記バッチデータセットを検証すること、または
類似性の前記統計的尺度が、前記閾値を満たしていない場合、報告するための前記バッチデータセットを検証しないことと、を含む、方法。 - 類似性の前記統計的尺度が、前記閾値を満たしていない場合、さらなるレビューのために前記バッチデータセットにフラグを立てることをさらに含む、請求項26に記載の方法。
- RNA発現パイプラインの変化を検証する方法であって、前記方法が、
1つ以上のプロセッサと、前記1つ以上のプロセッサによって実行するための1つ以上のプログラムを格納するメモリと、を有するコンピュータシステムにおいて、
a)バッチデータセットを電子形式で取得することであって、前記バッチデータセットが、試験試料のバッチ内の各それぞれの試験試料について、
第1のRNA発現パイプラインを使用して調製された対応する発現プロファイルであって、遺伝子の第1のセットにおける各それぞれの遺伝子についての対応する遺伝子発現値を含む、対応する発現プロファイルと、
前記それぞれの試験試料についての特徴の第1のセットにおける各それぞれの特徴についての値を含むメタデータの対応するセットと、を含む、取得することと、
b)複数の参照試料における各それぞれの参照試料について、第2のRNA発現パイプラインを使用して調製された遺伝子の前記第1のセットにおける各それぞれの遺伝子についての対応する遺伝子発現値を含む対応する発現プロファイルを含むコホート一致参照データセットを、前記バッチデータセットについて決定することであって、
前記複数の参照試料における各それぞれの参照試料が、前記それぞれの参照試料についての特徴の第2のセットにおける各それぞれの特徴についての対応する値を含むメタデータの対応するセットに関連付けられ、
特徴の前記第1のセットおよび特徴の前記第2のセットの両方に存在する1つ以上の特徴の第3のセットにおける各それぞれの特徴についての集計値が、前記バッチデータセットと、前記コホート一致参照データセットとの間で均衡が取れている、決定することと、
c)前記複数の試験試料における各それぞれの試験試料についての前記対応する発現プロファイル、および前記複数の参照試料における各それぞれの参照試料についての前記対応する発現プロファイルからなる組み合わせたデータセットに対して次元縮小を実施し、それによって、各それぞれの試験試料および各それぞれの参照試料について、前記対応する発現プロファイルの次元よりも低い次元空間に埋め込まれた座標の対応するセットを取得することと、
d)前記試験試料について取得した座標の前記セットと、前記参照試料について取得した座標の前記セットとの間の類似性の統計的尺度を決定することと、
e)類似性の前記統計的尺度を閾値と比較し、
類似性の前記統計的尺度が、前記閾値を満たしている場合、前記RNA発現パイプラインにおける変化を検証すること、または
類似性の前記統計的尺度が、前記閾値を満たしている場合、前記RNA発現パイプラインにおける前記変化を検証しないことと、を含む、方法。 - 類似性の前記統計的尺度が、前記閾値を満たしていない場合、類似性の前記統計的尺度が、前記閾値を満たしていない場合のさらなる評価のために前記RNA発現パイプラインの前記変化にフラグを立てることをさらに含む、請求項28に記載の方法。
- 前記コホート一致参照データセットが、試料対合参照データセットである、請求項28または29に記載の方法。
- RNA発現データを参照データベースに追加する方法であって、前記方法が、
1つ以上のプロセッサと、前記1つ以上のプロセッサによって実行するための1つ以上のプログラムを格納するメモリと、を有するコンピュータシステムにおいて、
a)新しい発現データセットを電子形式で取得することであって、前記新しい発現データセットが、複数の試験試料中の各それぞれの試験試料について、
第1のRNA発現パイプラインを使用して調製された対応する発現プロファイルであって、遺伝子の第1のセットにおける各それぞれの遺伝子についての対応する遺伝子発現値を含む、対応する発現プロファイルと、
前記それぞれの試験試料についての特徴の第1のセットにおける各それぞれの特徴についての値を含むメタデータの対応するセットと、を含む、取得することと、
b)複数の参照試料における各それぞれの参照試料について、遺伝子の前記第1のセットにおける各それぞれの遺伝子についての対応する遺伝子発現値を含む対応する発現プロファイルを含むコホート一致参照データセットを、前記新しい発現データセットについて決定することであって、
前記複数の参照試料における各それぞれの参照試料が、前記それぞれの参照試料についての特徴の第2のセットにおける各それぞれの特徴についての対応する値を含むメタデータの対応するセットに関連付けられ、
前記複数の参照試料における参照試料に対応する各発現プロファイルが、前記参照データベースからのものであり、
特徴の前記第1のセットおよび特徴の前記第2のセットの両方に存在する1つ以上の特徴の第3のセットにおける各それぞれの特徴についての集計値が、前記バッチデータセットと、前記コホート一致参照データセットとの間で均衡が取れている、決定することと、
c)前記複数の試験試料における各それぞれの試験試料についての前記対応する発現プロファイル、および前記複数の参照試料における各それぞれの参照試料についての前記対応する発現プロファイルからなる組み合わせたデータセットに対して次元縮小を実施し、それによって、各それぞれの試験試料および各それぞれの参照試料について、前記対応する発現プロファイルの次元よりも低い次元空間に埋め込まれた座標の対応するセットを取得することと、
d)前記試験試料について取得した座標の前記セットと、前記参照試料について取得した座標の前記セットとの間の類似性の統計的尺度を決定することと、
e)類似性の前記統計的尺度を閾値と比較し、
類似性の前記統計的尺度が、前記閾値を満たしている場合、新しい発現データセットを前記参照データベースに追加すること、または
類似性の前記統計的尺度が、前記閾値を満たしていない場合、
前記参照データベース内の発現プロファイルに対して前記新しい発現データセットにおける前記発現プロファイルを標準化するための変換係数のセットを決定し、
変換係数の前記セットを使用して前記新しい発現データセットにおける前記発現プロファイルを標準化し、それによって、標準化された新しい発現データセットを取得し、
前記標準化された新しい発現データセットを前記参照データベースに追加することと、を含む、方法。 - 前記バッチデータセットを取得することが、試料の前記バッチ内の各それぞれの試料について、
標的化または全トランスクリプトームRNA配列決定によって前記それぞれの試料から得られた対応する複数の配列リードを電子形式で取得することと、
前記対応する複数の配列リードから、遺伝子の前記第1のセットにおける各それぞれの遺伝子についての前記対応する遺伝子発現値を決定することと、を含む、請求項26~31のいずれか一項に記載の方法。 - 試料の前記バッチ内の各それぞれの試料について、前記対応する複数の配列リードが、少なくとも10,000個の配列リードを含む、請求項32に記載の方法。
- 試験試料の前記バッチが、少なくとも10個の試験試料を含む、請求項26~33のいずれか一項に記載の方法。
- 遺伝子の前記第1のセットが、少なくとも10個の遺伝子を含む、請求項26~34のいずれか一項に記載の方法。
- 遺伝子の前記第1のセットが、少なくとも10,000個の遺伝子を含む、請求項26~34のいずれか一項に記載の方法。
- 特徴の前記第3のセットが、組織部位、腫瘍純度、がんの種類、シーケンサーの同一性、および配列決定日付からなる群から選択される特徴を含む、請求項26~36のいずれか一項に記載の方法。
- 特徴の前記第3のセットが、核酸抽出法、cDNAライブラリー調製法、RNA配列決定法、使用される試薬の種類、および使用される機器の種類から選択される特徴を含む、請求項26~37のいずれか一項に記載の方法。
- 前記複数の参照試料が、少なくとも100個の参照試料を含む、請求項26~38のいずれか一項に記載の方法。
- 前記複数の参照試料が、少なくとも1000個の参照試料を含む、請求項26~38のいずれか一項に記載の方法。
- それぞれの特徴についての前記集計値が、試験試料の前記バッチ内で、前記それぞれの特徴についてのそれぞれの値を有する、それぞれの試験試料のパーセンテージが、前記複数の参照試料において、前記それぞれの特徴について同じそれぞれの値を有する、それぞれの参照試料のパーセンテージの2.5%以内である場合、前記バッチデータセットと、前記コホート一致参照セットとの間で均衡が取れている、請求項26~40のいずれか一項に記載の方法。
- 次元縮小が、各それぞれの試験試料および各それぞれの参照試料について、前記対応する発現プロファイルを二次元表示に埋め込むことを含む、請求項26~41のいずれか一項に記載の方法。
- 試験試料のバッチ内の各それぞれの試験試料について、前記対応する発現プロファイルが、標的化または全トランスクリプトームRNA配列決定によって前記それぞれの試料から得られた配列リードから決定される、請求項26~42のいずれか一項に記載の方法。
- 標的化パネルRNA配列決定が、複数のプローブを使用し、
前記複数のプローブにおける各プローブが、参照トランスクリプトームのそれぞれの部分を一意的に標的化し、
前記対応する複数の配列リードにおける各配列リードが、前記複数のプローブにおける少なくとも1つのプローブに対応する、請求項43に記載の方法。 - 前記全トランスクリプトーム配列決定が、次世代配列決定を含む、請求項43に記載の方法。
- 試料の前記バッチ内の各それぞれの試料について、前記それぞれの試料に対して1つ以上の単一試料品質管理試験を実施することと、
前記1つ以上の単一試料品質管理試験のうちのいずれか1つに不合格となる試料の前記バッチからそれぞれの試料を除去するか、または前記1つ以上の単一試料品質管理試験のうちのいずれか1つに不合格となるそれぞれの試料に、手動検査のためのフラグを立てることと、をさらに含む、請求項26~45のいずれか一項に記載の方法。 - 前記1つ以上の単一試料品質管理試験におけるそれぞれの単一試料品質管理試験が、
i)試料の前記バッチ内のそれぞれの試料について、前記複数の配列リードにおけるそれぞれの数の重複していないマッピングされた配列リードを決定することであって、各重複していないマッピングされた配列リードが、参照ゲノムの対応する部分にマッピングする、決定することと、
ii)前記それぞれの数の重複していないマッピングされた配列リードを、予想された数の重複していないマッピングされた配列リードと比較することであって、前記それぞれの数の重複していないマッピングされた配列リードが、所定の数の重複していないマッピングされたリードを下回る場合、前記それぞれの試料が、前記それぞれの単一試料品質管理試験に不合格となる、比較することと、を含む、請求項46に記載の方法。 - 前記1つ以上の単一試料品質管理試験におけるそれぞれの単一試料品質管理試験が、試料の前記バッチ内のそれぞれの試料について、適切に対合した配列リードのそれぞれのパーセンテージを決定することであって、適切に対合した配列リードの前記パーセンテージが、所定の対合したリード閾値を下回る場合、前記それぞれの試料が、前記それぞれの単一試料品質管理試験に不合格となる、決定することを含む、請求項46または47に記載の方法。
- 前記1つ以上の単一試料品質管理試験におけるそれぞれの単一試料品質管理試験が、試料の前記バッチ内のそれぞれの試料について、前記対応する複数の配列リードのそれぞれのGC含量を決定することであって、前記それぞれのGC含量が、所定のGC含量閾値の範囲外である場合、前記それぞれの試料が、前記それぞれの単一試料品質管理試験に不合格となる、決定することを含む、請求項46~48のいずれか一項に記載の方法。
- 前記1つ以上の単一試料品質管理試験におけるそれぞれの単一試料品質管理試験が、試料の前記バッチ内のそれぞれの試料について、それぞれの数の発現遺伝子を決定することであって、前記対応する発現リードスコアが、所定の数の発現リードを下回る場合、前記それぞれの試料が、前記それぞれの単一試料品質管理試験に不合格となる、決定することを含む、請求項46~49のいずれか一項に記載の方法。
- 前記方法が、試料の前記バッチ内の各試料について、それぞれの試料レポートを提供することであって、各それぞれの試料レポートが、発現コールのセット、1つ以上の一致した療法、または1つ以上の一致した臨床試験のうちの少なくとも1つを含む、提供することをさらに含む、請求項26~50のいずれか一項に記載の方法。
- 前記方法が、クラウドサーバを備えるコンピュータシステムで実施される、請求項26~51のいずれか一項に記載の方法。
- 品質管理を実施するための少なくとも1つのプログラムを格納する非一時的なコンピュータ可読記憶媒体であって、前記少なくとも1つのプログラムが、コンピュータによって実行されるように構成され、前記少なくとも1つのプログラムが、
a)試料のバッチ内の各それぞれの試料について、標的化または全トランスクリプトームRNA配列決定によって前記それぞれの試料から得られた対応する複数の配列リードと、前記それぞれの試料についての対応するメタデータと、を含む、バッチデータセットを電子形式で取得することと、
b)前記バッチデータセットについて、コホート一致参照バッチを決定することであって、前記コホート一致参照バッチが、組織部位、腫瘍純度、がんの種類、シーケンサーの同一性、または配列決定された日付について均衡が取れている、決定することと、
c)少なくとも前記コホート一致参照バッチを使用して前記バッチデータセットに対して1つ以上のグローバルバッチ品質管理試験を実施することと、
d)前記1つ以上のグローバルバッチ品質管理試験のうちのいずれか1つに不合格となる前記バッチデータセットからそれぞれの試料を除去するか、または前記1つ以上のグローバルバッチ品質管理試験のうちのいずれか1つに不合格となるそれぞれの試料に、手動検査のためのフラグを立てることと、についての命令を含む、非一時的なコンピュータ可読記憶媒体。 - コンピュータシステムであって、
少なくとも1つのプロセッサ、
前記少なくとも1つのプロセッサによって実行される少なくとも1つのプログラムを格納するメモリ、を備え、
前記少なくとも1つのプログラムが、
a)試料のバッチ内の各それぞれの試料について、標的化または全トランスクリプトームRNA配列決定によって前記それぞれの試料から得られた対応する複数の配列リードと、前記それぞれの試料についての対応するメタデータと、を含む、バッチデータセットを電子形式で取得することと、
b)前記バッチデータセットについて、コホート一致参照バッチを決定することであって、前記コホート一致参照バッチが、組織部位、腫瘍純度、がんの種類、シーケンサーの同一性、または配列決定された日付について均衡が取れている、決定することと、
c)少なくとも前記コホート一致参照バッチを使用して前記バッチデータセットに対して1つ以上のグローバルバッチ品質管理試験を実施することと、
d)前記1つ以上のグローバルバッチ品質管理試験のうちのいずれか1つに不合格となる前記バッチデータセットからそれぞれの試料を除去するか、または前記1つ以上のグローバルバッチ品質管理試験のうちのいずれか1つに不合格となるそれぞれの試料に、手動検査のためのフラグを立てることと、を含む、方法によって品質管理スコアを実施するための命令を含む、コンピュータシステム。 - コンピュータによる実行のために構成された少なくとも1つのプログラムを格納する非一時的なコンピュータ可読記憶媒体であって、前記少なくとも1つのプログラムが、請求項1~52のいずれか一項に記載の方法を実施するための命令を含む、非一時的なコンピュータ可読記憶媒体。
- コンピュータシステムであって、
少なくとも1つのプロセッサ、
前記少なくとも1つのプロセッサによって実行される少なくとも1つのプログラムを格納するメモリ、を備え、
前記少なくとも1つのプログラムが、請求項1~52のいずれか一項に記載の方法を実施するための命令を含む、コンピュータシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962943712P | 2019-12-04 | 2019-12-04 | |
US62/943,712 | 2019-12-04 | ||
PCT/US2020/063462 WO2021113749A1 (en) | 2019-12-04 | 2020-12-04 | Systems and methods for automating rna expression calls in a cancer prediction pipeline |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023504529A true JP2023504529A (ja) | 2023-02-03 |
JPWO2021113749A5 JPWO2021113749A5 (ja) | 2024-04-22 |
Family
ID=74106149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022533160A Pending JP2023504529A (ja) | 2019-12-04 | 2020-12-04 | がん予測パイプラインにおけるrna発現コールを自動化するためのシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11043283B1 (ja) |
EP (1) | EP4070318A1 (ja) |
JP (1) | JP2023504529A (ja) |
AU (1) | AU2020398175A1 (ja) |
WO (1) | WO2021113749A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4070318A1 (en) * | 2019-12-04 | 2022-10-12 | Tempus Labs, Inc. | Systems and methods for automating rna expression calls in a cancer prediction pipeline |
US11613783B2 (en) | 2020-12-31 | 2023-03-28 | Tempus Labs, Inc. | Systems and methods for detecting multi-molecule biomarkers |
CA3204451A1 (en) | 2021-01-07 | 2022-07-14 | Francisco M. De La Vega | Systems and methods for joint low-coverage whole genome sequencing and whole exome sequencing inference of copy number variation for clinical diagnostics |
WO2022159774A2 (en) | 2021-01-21 | 2022-07-28 | Tempus Labs, Inc. | METHODS AND SYSTEMS FOR mRNA BOUNDARY ANALYSIS IN NEXT GENERATION SEQUENCING |
CN113604544B (zh) * | 2021-08-03 | 2023-03-10 | 北京大学口腔医学院 | 一种生物材料功能预测评价方法 |
WO2023064309A1 (en) | 2021-10-11 | 2023-04-20 | Tempus Labs, Inc. | Methods and systems for detecting alternative splicing in sequencing data |
CN114064716B (zh) * | 2021-10-29 | 2023-10-20 | 北京市农林科学院信息技术研究中心 | 基于元数据的web报表自动生成方法及装置 |
WO2023091316A1 (en) | 2021-11-19 | 2023-05-25 | Tempus Labs, Inc. | Methods and systems for accurate genotyping of repeat polymorphisms |
EP4239647A1 (en) | 2022-03-03 | 2023-09-06 | Tempus Labs, Inc. | Systems and methods for deep orthogonal fusion for multimodal prognostic biomarker discovery |
CN116362569B (zh) * | 2023-06-02 | 2023-08-01 | 北京建工环境修复股份有限公司 | 一种场地污染的多维度评估方法及系统 |
CN117149820B (zh) * | 2023-09-25 | 2024-05-14 | 湖南长银五八消费金融股份有限公司 | 一种借据操作检测方法、装置、设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014152939A1 (en) * | 2013-03-14 | 2014-09-25 | President And Fellows Of Harvard College | Methods and systems for identifying a physiological state of a target cell |
EP4070318A1 (en) * | 2019-12-04 | 2022-10-12 | Tempus Labs, Inc. | Systems and methods for automating rna expression calls in a cancer prediction pipeline |
-
2020
- 2020-12-04 EP EP20834038.0A patent/EP4070318A1/en active Pending
- 2020-12-04 US US17/112,877 patent/US11043283B1/en active Active
- 2020-12-04 WO PCT/US2020/063462 patent/WO2021113749A1/en unknown
- 2020-12-04 AU AU2020398175A patent/AU2020398175A1/en active Pending
- 2020-12-04 JP JP2022533160A patent/JP2023504529A/ja active Pending
-
2021
- 2021-05-19 US US17/324,949 patent/US20210272649A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2020398175A1 (en) | 2022-06-16 |
EP4070318A1 (en) | 2022-10-12 |
WO2021113749A1 (en) | 2021-06-10 |
US11043283B1 (en) | 2021-06-22 |
US20210272649A1 (en) | 2021-09-02 |
US20210174898A1 (en) | 2021-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023504529A (ja) | がん予測パイプラインにおけるrna発現コールを自動化するためのシステムおよび方法 | |
US20220246234A1 (en) | Using cell-free dna fragment size to detect tumor-associated variant | |
TWI636255B (zh) | 癌症檢測之血漿dna突變分析 | |
US9115401B2 (en) | Partition defined detection methods | |
US9670530B2 (en) | Haplotype resolved genome sequencing | |
US11193175B2 (en) | Normalizing tumor mutation burden | |
EP3924502A1 (en) | An integrated machine-learning framework to estimate homologous recombination deficiency | |
US11581062B2 (en) | Systems and methods for classifying patients with respect to multiple cancer classes | |
EP3322816A2 (en) | System and methodology for the analysis of genomic data obtained from a subject | |
US20210407623A1 (en) | Determining tumor fraction for a sample based on methyl binding domain calibration data | |
JP2021101629A (ja) | ゲノム解析および遺伝子解析用のシステム並びに方法 | |
EP3588506B1 (en) | Systems and methods for genomic and genetic analysis | |
CN113748467A (zh) | 基于等位基因频率的功能丧失计算模型 | |
US20190249229A1 (en) | Bam signatures from liquid and solid tumors and uses therefor | |
US20230162815A1 (en) | Methods and systems for accurate genotyping of repeat polymorphisms | |
WO2023048713A1 (en) | Compositions and methods for targeted ngs sequencing of cfrna and cftna | |
Cradic | Next Generation Sequencing: Applications for the Clinic |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231201 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240410 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20240410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240424 |