CN113393901B - 一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置 - Google Patents
一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置 Download PDFInfo
- Publication number
- CN113393901B CN113393901B CN202110660861.2A CN202110660861A CN113393901B CN 113393901 B CN113393901 B CN 113393901B CN 202110660861 A CN202110660861 A CN 202110660861A CN 113393901 B CN113393901 B CN 113393901B
- Authority
- CN
- China
- Prior art keywords
- glioma
- nucleic acid
- genes
- module
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010018338 Glioma Diseases 0.000 title claims abstract description 62
- 208000032612 Glial tumor Diseases 0.000 title claims abstract description 61
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 30
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 19
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 19
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 19
- 210000001616 monocyte Anatomy 0.000 title claims description 12
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 64
- 210000005087 mononuclear cell Anatomy 0.000 claims abstract description 17
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 238000012165 high-throughput sequencing Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 6
- 239000000523 sample Substances 0.000 claims description 37
- 238000012163 sequencing technique Methods 0.000 claims description 13
- 210000005259 peripheral blood Anatomy 0.000 claims description 11
- 239000011886 peripheral blood Substances 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 11
- 208000005017 glioblastoma Diseases 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 7
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 claims description 5
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 239000013068 control sample Substances 0.000 claims description 2
- 238000002955 isolation Methods 0.000 claims description 2
- 210000004369 blood Anatomy 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- 238000003384 imaging method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- 210000004027 cell Anatomy 0.000 description 4
- 210000005266 circulating tumour cell Anatomy 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 3
- 238000002591 computed tomography Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000002595 magnetic resonance imaging Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 238000002603 single-photon emission computed tomography Methods 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- OZFAFGSSMRRTDW-UHFFFAOYSA-N (2,4-dichlorophenyl) benzenesulfonate Chemical compound ClC1=CC(Cl)=CC=C1OS(=O)(=O)C1=CC=CC=C1 OZFAFGSSMRRTDW-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 2
- 239000012591 Dulbecco’s Phosphate Buffered Saline Substances 0.000 description 2
- 238000001793 Wilcoxon signed-rank test Methods 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000001808 exosome Anatomy 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000008595 infiltration Effects 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 239000003068 molecular probe Substances 0.000 description 2
- 230000002980 postoperative effect Effects 0.000 description 2
- 230000005740 tumor formation Effects 0.000 description 2
- 108020003215 DNA Probes Proteins 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 238000010802 RNA extraction kit Methods 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 230000010100 anticoagulation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000010201 enrichment analysis Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 208000030173 low grade glioma Diseases 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000013421 nuclear magnetic resonance imaging Methods 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 238000002600 positron emission tomography Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/20—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Zoology (AREA)
- Analytical Chemistry (AREA)
- Wood Science & Technology (AREA)
- Medical Informatics (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Bioethics (AREA)
- Pathology (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Oncology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Hospice & Palliative Care (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置,该装置包括:采集模块,用于采集单核细胞内的肿瘤核酸;信息对比模块,用于对高通量测序的下机数据进行处理,并将下机数据比对至参考基因组,获得表达信息;信息分析模块,用于将基因组合中的基因的表达进行统计,计算胶质瘤特征基因得分;判定模块,用于依据计算胶质瘤特征基因得分预测待测样本的胶质瘤状态。本发明装置可用于肿瘤早期的确诊分析,早发现早治疗,以提高治疗的有效性,避免其进展到晚期后治疗无效。
Description
技术领域
本发明属于医疗装置领域,尤其涉及一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置。
背景技术
现有分检装置包括各类影像学检查,主要包括核磁共振成像(magneticresonance imaging,MRI)、X线电子计算机断层成像(Computed Tomography,CT)、单光子发射计算机断层成像术(Single-Photon Emission Computed Tomography,SPECT)和正电子发射断层扫(Positron Emission Tomography-Computed Tomography,PET-CT)等。常规影像学方法缺陷在于难以发现直径小于1cm的微小病灶。此外,分子影像技术通过肿瘤分子标记探针,利用MRI等成像手段可以在无创早期中及时发现肿瘤细胞信号。然而其特异性的分子探针设计较为复杂(例如需设计可代谢的无毒副作用的分子探针;针对不同成像工具设计特异检测探针等),限制了分子影像技术的使用。
目前,基于血液的分检装置主要是检测血液中的循环肿瘤细胞(circulatingtumor cells,CTC)、循环肿瘤DNA(circulating tumor DNA,ctDNA)、外泌体(exosome)和肿瘤驯化的血小板(tumor educated platelet,TEP)等。然而,CTC和ctDNA在胶质瘤患者外周血中极其微量。例如,Muller等人研究发现,141例胶质瘤患者的外周血中仅有20%的患者能够检测到CTC,且其中部分患者10ml外周血中仅能发现一个CTC;另外,研究发现10ml血浆中能检测到携带突变的ctDNA不足10条。
因此,亟待寻找新的胶质瘤特异性标记,开发新的早期检测和术后监测方法。研究发现,髓系单核细胞浸润发生在肿瘤形成早期,且与正常人相比,胶质瘤患者外周血中的单核细胞显著增多,肿瘤级别越高,单核细胞数量越多。上述研究表明,骨髓来源的单核细胞浸润发生在在肿瘤形成早期且伴随肿瘤进全过程,因此,外周血中的单核细胞可以作为预测是否存在胶质瘤以及胶质瘤进展的胶质瘤早期筛查及进展监测的指标。
发明内容
本发明的目的在于提供一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置,旨在解决现有胶质瘤特异性标记的早期检测和术后监测方法所存在的各种不足之处。
本发明是这样实现的,一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置,该装置包括:
采集模块,用于采集单核细胞内的肿瘤核酸;
信息对比模块,用于对高通量测序的下机数据进行处理,并将下机数据比对至参考基因组,获得表达信息;
信息分析模块,用于将基因组合中的基因的表达进行统计,计算胶质瘤特征基因得分;
判定模块,用于依据计算胶质瘤特征基因得分预测待测样本的胶质瘤状态。
优选地,在采集模块中,所述的采集单核细胞内的肿瘤核酸具体为:从外周血分离出CD14+单核细胞。
优选地,在信息对比模块中,所述下机数据进行处理具体包括:对测序所得的每个样本序列进行过滤以去除掉不合格的序列和接头序列。
优选地,在信息对比模块中,所述将下机数据比对至参考基因组具体为:将过滤的每个样本序列分别比对到参考基因组序列,对比后的每个样本序列分别进行筛选以得到唯一比对的样本序列,确定每个唯一比对的样本序列相对于参考基因组序列的位置信息,并对位置信息进行排序以获得所有基因BG的秩次。
优选地,在信息分析模块中,所述胶质瘤特征基因得分的计算具体包括以下步骤:
特征基因筛选,保留在Data_A原发GBM中基因平均表达值在前50%的基因作为胶质瘤特征基因;
将收集的基因样本分为训练集和测试集,使用训练集数据构建模型,将模型在测试集上进行性能评估。
优选地,在判定模块中,通过对比胶质瘤和健康人群对照样本确定后续用于判定是否为胶质瘤类型的GSS阈值,所检测样品的GSS若在阈值范围内,则判定该样品为胶质瘤类型。
优选地,所述阈值范围为0.5~1。
本发明克服现有技术的不足,提供一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置,本发明通过分离外周血中的单核细胞并提取单核细胞中的核酸,进一步对基因组特征、转录组特征、表观遗传调控特征和蛋白质组特征进行分析,判断单核细胞中是否包含胶质瘤特征,并通过该特征达到对胶质瘤的进展进行预测的目的。
相比于现有技术的缺点和不足,本发明具有以下有益效果:
(1)本发明装置可用于肿瘤早期的确诊分析,早发现早治疗,以提高治疗的有效性,避免其进展到晚期后治疗无效;
(2)本发明装置可用于监控病程,指导治疗;对于治疗后的患者,通常无法定期取到活体组织判断疾病进展状态,而应用本发明可利用外周血随时地无创地监控病情,有利于及时发现疾病恶性进展;
(3)本发明装置基于外周血的液态活检,具有易获得、低风险、无创伤等特征,可用于临床普查,将推动整个胶质瘤诊疗技术的发展和进步。
附图说明
图1是本发明装置的结构示意图;
图2是在第一个验证队列中胶质瘤特征基因得分区分胶质瘤与正常人的AUC曲线;
图3是在第二个验证队列中胶质瘤特征基因得分区分胶质瘤与正常人的AUC曲线。AUC曲线越接近1,模型的区分效能越好;
图2、图3中,AUC曲线越接近1,模型的区分效能越好。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明公开了一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置,如图1所示,该装置包括:
采集模块1,用于采集单核细胞内的肿瘤核酸进行测序
抽取10ml外周血,存储于EDTA抗凝管,以4℃或插入碎冰保存运输;使用10ml DPBS稀释全血,以血样与淋巴细胞分离液体积比2:1的比例,先加分层液再加稀释血液的顺序,使分层液在下,稀释血液叠于分层液上;使用水平离心机,水平离心20min,离心后提取单个核细胞,移入另外一个离心管中,再次加入DPBS洗涤,水平离心10min,弃去上清;弃上清之后,向离心管中加入80ul的Buffer溶液,重悬管中沉淀,缓慢地混匀;然后再加入20ul的CD14磁珠,轻轻混匀后放入冰箱孵育15min,保持每5min混匀一次;在孵育完毕后,向管中加入5mL的Buffer溶液,离心5min;再次弃去上清,用500ul Buffer重悬细胞沉淀;最后将分选柱放入磁力架中,先使用500ul的Buffer润洗分选柱,再将细胞缓慢滴入,收集的下方细胞为CD14-单个核细胞,用活塞将分选柱中液体推出,为CD14+单核细胞。
信息对比模块2,用于对高通量测序的下机数据进行处理,并将下机数据比对至参考基因组,获得表达信息
利用RNA提取试剂盒(如QIAGEN、Beyotime Biotechnology等)或核酸自动提取仪提取步骤对待测样本的单核细胞进行RNA提取,进行RNA测序。其中的测序方法,可以按照常规的实验方法、教科书、探针设计方法、测序仪使用手册的描述进行,主要的流程包括:对每个样本进行RNA提取,获取转录组RNA;通过超声破碎将RNA片段过于大的样本打断至200~350碱基对;对片段化的RNA分子执行末端修复、添加嘌呤、文库接头连接等操作;获得的RNA片段与文库长为120碱基的单链生物素标记DNA探针分子杂交,再以链霉亲和素包裹的磁珠分离捕获的RNA文库分子;在二代测序仪上进行高通量测序。其中高通量测序技术可以为现有的任何一种高通量测序技术。
测序反应获得的数据通过生物信息学分析,这里的处理主要是对测序所得的每个样本序列进行过滤,以去除掉不合格的序列和接头序列;其中,不合格的序列可以为下列情况的至少一种:测序质量低于某一阈值的碱基个数超过整条序列碱基个数一定比例(例如:50%)和序列中的测序结果不确定的碱基个数超过整条序列碱基数目的一定比例(例如:10%);其中,低质量阈值可以由具体的测序技术和测序环境确定,将过滤的每个样本序列分别比对到参考基因组序列,对比后的每个样本序列分别进行筛选以得到唯一比对的样本序列,确定每个唯一比对的样本序列相对于参考基因组序列的位置信息,并对位置信息进行排序。具体的:(1)首先可以通过任何RNA比对映射程序将过滤得到每个样本序列分别比对到参考基因组序列得到每个样本序列在参考基因组上的位置情况。(2)然后,对比对结果进行定量,统计基因/转录本上比对上的序列数目。
信息分析模块3,用于将基因组合中的基因的表达进行统计,计算胶质瘤特征基因得分
特征基因筛选:下载公共数据库The Cancer Genome Atlas(TCGA)Pan-Cancer(Data_A)和Gliovis(Data_B)的表达谱数据。首先,利用Wilcoxon signed-rank test方法将Data_A中153个原发的GBM样本与其他30种癌型的样本(除低级别胶质瘤和白血病)逐一进行比较,筛选校正后p值小于0.01,且差异倍数大于等于1.5的基因。然后,将GBM样本与30种癌症的差异高表达基因取交集,获取GBM特异性高表达基因。使用Data_B,将GBM与正常脑组织进行Wilcoxon signed-rank test,同样筛选校正后p值小于0.01,且差异倍数大于等于1.5的基因。与GBM特异性高表达基因取交集,并且仅保留在Data_A原发GBM中基因平均表达值在前50%的基因,作为胶质瘤特征基因;
模型构建:将收集的样本分为训练集(70%)和测试集(30%),使用训练集数据构建模型。基于胶质瘤特征基因通过单样本富集分析模型(支持向量机模型、随机森林模型、逻辑回归模型)将胶质瘤特征基因的表达值拟合成样本的胶质瘤特征基因得分(GSS)。将模型在测试集上进行性能评估。通过计算受试者工作特征(receiver operatingcharacteristic,ROC)曲线下面积(area under the receiver operatingcharacteristic curve,AUC)评估模型性能,在50次循环中,每次选取的特征建立的模型,在预留出的原发测试集,复发数据测试集的预测效果。基于胶质瘤特异性基因构建的模型在两个独立的验证集中都能够很好的区分胶质瘤患者与正常人群(结果如图2、图3所示)。
利用胶质瘤特征基因的表达数据,通过上述模型计算胶质瘤特征基因得分;主要的流程包括:对每个样本的所有基因的表达水平进行排序,获得所有基因的秩次,这些基因的集合为BG;从BG里寻找在胶质瘤特征基因的存在的基因并计数为NC,并将这些基因的表达水平加和为SG;对于表达谱中的任一基因G:如果G是集合胶质瘤特征基因集中的基因则他的ES等于该基因的表达水平除以SG,否则该基因的ES等于1除以(基因集合BG总个数-NC)。其中ES表示胶质瘤特征基因在检测样本中的富集得分,ES越高表明该胶质瘤特征基因在检测样本的表达水平越高。依次计算每个BG中的基因的ES值,找到其中绝对值最大的ES作为胶质瘤特征基因得分(Glioma signature score,GSS)。
判定模块4,用于依据计算胶质瘤特征基因得分预测待测样本的胶质瘤状态
本发明收集了健康人群对照样本的外周血CD14阳性单核细胞,将健康人的数据与胶质瘤患者的数据合并在一起。为了获得稳健的GSS阈值,本发明实施例以70%:30%的比例将收集的数据划分为训练数据和测试数据,在训练数据中构建模型,并将该模型用于测试数据计算GSS。在测试数据中通过计算曲线下面积获取最佳阈值。该过程重复50次,选择50次迭代后的最佳阈值的均值为最终的GSS阈值(0.5~1)。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置,其特征在于,该装置包括:
采集模块,用于采集单核细胞内的肿瘤核酸;
信息对比模块,用于对高通量测序的下机数据进行处理,并将下机数据比对至参考基因组,获得表达信息;
信息分析模块,用于将基因组合中的基因的表达进行统计,计算胶质瘤特征基因得分;
判定模块,用于依据计算胶质瘤特征基因得分预测待测样本的胶质瘤状态;
在信息对比模块中,所述将下机数据比对至参考基因组具体为:将过滤的每个样本序列分别比对到参考基因组序列,对比后的每个样本序列分别进行筛选以得到唯一比对的样本序列,确定每个唯一比对的样本序列相对于参考基因组序列的位置信息,并对位置信息进行排序以获得所有基因BG的秩次;
在信息分析模块中,所述胶质瘤特征基因得分的计算具体包括以下步骤:
特征基因筛选,保留在Data_A原发GBM中基因平均表达值在前50%的基因作为胶质瘤特征基因;
将收集的基因样本分为训练集和测试集,使用训练集数据构建模型,将模型在测试集上进行性能评估;
在判定模块中,通过对比胶质瘤和健康人群对照样本确定后续用于判定是否为胶质瘤类型的GSS阈值,所检测样品的GSS若在阈值范围内,则判定该样品为胶质瘤类型。
2.如权利要求1所述的基于单核细胞采集肿瘤核酸的胶质瘤分检装置,其特征在于,在采集模块中,所述的采集单核细胞内的肿瘤核酸具体为:从外周血分离出CD14+单核细胞。
3.如权利要求1所述的基于单核细胞采集肿瘤核酸的胶质瘤分检装置,其特征在于,在信息对比模块中,所述下机数据进行处理具体包括:对测序所得的每个样本序列进行过滤以去除掉不合格的序列和接头序列。
4.如权利要求1所述的基于单核细胞采集肿瘤核酸的胶质瘤分检装置,其特征在于,所述阈值范围为0.5~1。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110660861.2A CN113393901B (zh) | 2021-06-15 | 2021-06-15 | 一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置 |
CN202311556791.1A CN117594124A (zh) | 2021-06-15 | 2021-06-15 | 一种基于单核细胞预测胶质瘤的试剂盒、系统和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110660861.2A CN113393901B (zh) | 2021-06-15 | 2021-06-15 | 一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311556791.1A Division CN117594124A (zh) | 2021-06-15 | 2021-06-15 | 一种基于单核细胞预测胶质瘤的试剂盒、系统和应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113393901A CN113393901A (zh) | 2021-09-14 |
CN113393901B true CN113393901B (zh) | 2023-10-31 |
Family
ID=77621070
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110660861.2A Active CN113393901B (zh) | 2021-06-15 | 2021-06-15 | 一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置 |
CN202311556791.1A Pending CN117594124A (zh) | 2021-06-15 | 2021-06-15 | 一种基于单核细胞预测胶质瘤的试剂盒、系统和应用 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311556791.1A Pending CN117594124A (zh) | 2021-06-15 | 2021-06-15 | 一种基于单核细胞预测胶质瘤的试剂盒、系统和应用 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN113393901B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017151524A1 (en) * | 2016-02-29 | 2017-09-08 | Foundation Medicine, Inc. | Methods and systems for evaluating tumor mutational burden |
CN110272985A (zh) * | 2019-06-26 | 2019-09-24 | 广州市雄基生物信息技术有限公司 | 基于外周血血浆游离dna高通量测序技术的肿瘤筛查试剂盒及其系统与方法 |
WO2020114491A1 (en) * | 2018-12-07 | 2020-06-11 | Gracell Biotechnologies (Shanghai) Co., Ltd. | Compositions and methods for immunotherapy |
CN111357054A (zh) * | 2017-09-20 | 2020-06-30 | 夸登特健康公司 | 用于区分体细胞变异和种系变异的方法和系统 |
CN112837748A (zh) * | 2021-01-26 | 2021-05-25 | 南京医科大学 | 一种区分不同解剖学起源肿瘤的系统及其方法 |
-
2021
- 2021-06-15 CN CN202110660861.2A patent/CN113393901B/zh active Active
- 2021-06-15 CN CN202311556791.1A patent/CN117594124A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017151524A1 (en) * | 2016-02-29 | 2017-09-08 | Foundation Medicine, Inc. | Methods and systems for evaluating tumor mutational burden |
CN111357054A (zh) * | 2017-09-20 | 2020-06-30 | 夸登特健康公司 | 用于区分体细胞变异和种系变异的方法和系统 |
WO2020114491A1 (en) * | 2018-12-07 | 2020-06-11 | Gracell Biotechnologies (Shanghai) Co., Ltd. | Compositions and methods for immunotherapy |
CN110272985A (zh) * | 2019-06-26 | 2019-09-24 | 广州市雄基生物信息技术有限公司 | 基于外周血血浆游离dna高通量测序技术的肿瘤筛查试剂盒及其系统与方法 |
CN112837748A (zh) * | 2021-01-26 | 2021-05-25 | 南京医科大学 | 一种区分不同解剖学起源肿瘤的系统及其方法 |
Non-Patent Citations (1)
Title |
---|
The Predictive Value of Monocytes in Immune Microenvironment and Prognosis of Glioma Patients Based on Machine Learning;Nan Zhang et al.;《Frontiers in Immunology》;第12卷;第1-15页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117594124A (zh) | 2024-02-23 |
CN113393901A (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105219844B (zh) | 一种筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型 | |
CN105506115B (zh) | 一种检测诊断遗传性心肌病致病基因的dna文库及其应用 | |
CN111833965A (zh) | 一种尿沉渣基因组dna的分类方法、装置和用途 | |
CN107034301A (zh) | 一种检测肺结节为良性或恶性的试剂盒及其应用 | |
CN109658980A (zh) | 一种粪便基因标志物的筛选及应用 | |
CN106350589A (zh) | 一种检测遗传性血管疾病致病基因的dna文库及其应用 | |
CN111676291B (zh) | 一种用于肺癌患病风险评估的miRNA标志物 | |
CN113362893A (zh) | 肿瘤筛查模型的构建方法及应用 | |
CN108949979A (zh) | 一种通过血液样本判断肺结节良恶性的方法 | |
CN106156541B (zh) | 分析个体两类状态的免疫差异的方法和装置 | |
CN106399304A (zh) | 一种与乳腺癌相关的snp标记 | |
CN104988141A (zh) | BRCA2基因g.32912799T>C突变及其在乳腺癌辅助诊断中的应用 | |
CN106156540B (zh) | 分析个体两类状态的免疫差异、辅助确定个体状态的方法 | |
CN105671179B (zh) | 血清microRNA在肝癌诊断中的应用及诊断试剂盒 | |
CN113393901B (zh) | 一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置 | |
CN105779433A (zh) | 试剂盒及其用途 | |
KR102217272B1 (ko) | 유전체 변이 정보를 이용한 질병 진단 바이오마커 추출 방법 | |
CN110724743A (zh) | 人血液中结直肠癌诊断相关的甲基化生物标记物及其应用 | |
CN114317725B (zh) | 克罗恩病生物标志物、试剂盒及生物标志物的筛选方法 | |
CN116312800A (zh) | 一种基于血浆中循环rna全转录组测序的肺癌特征识别方法、装置和存储介质 | |
CN115148364A (zh) | 基于外周血ctDNA水平预测DLBCL初治患者预后的装置及计算机可读存储介质 | |
CN110396538A (zh) | 偏头痛生物标志物及其用途 | |
TWI758670B (zh) | 健康風險評估方法 | |
CN106709267A (zh) | 数据获取方法及装置 | |
CN109295233A (zh) | 一种联合检测miRNA诊断结直肠癌的试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |