CN113604544A - 一种生物材料功能预测评价方法 - Google Patents
一种生物材料功能预测评价方法 Download PDFInfo
- Publication number
- CN113604544A CN113604544A CN202110884816.5A CN202110884816A CN113604544A CN 113604544 A CN113604544 A CN 113604544A CN 202110884816 A CN202110884816 A CN 202110884816A CN 113604544 A CN113604544 A CN 113604544A
- Authority
- CN
- China
- Prior art keywords
- sample
- model
- data
- effect correction
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 32
- 239000012620 biological material Substances 0.000 title claims abstract description 23
- 210000004027 cell Anatomy 0.000 claims abstract description 47
- 230000000694 effects Effects 0.000 claims abstract description 42
- 238000012937 correction Methods 0.000 claims abstract description 30
- 210000002901 mesenchymal stem cell Anatomy 0.000 claims abstract description 18
- 238000000605 extraction Methods 0.000 claims abstract description 16
- 238000013210 evaluation model Methods 0.000 claims abstract description 14
- 239000000463 material Substances 0.000 claims abstract description 7
- 238000012258 culturing Methods 0.000 claims abstract description 4
- 238000012163 sequencing technique Methods 0.000 claims abstract description 4
- 238000012360 testing method Methods 0.000 claims description 31
- 238000012549 training Methods 0.000 claims description 31
- 230000014509 gene expression Effects 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 23
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 108090000623 proteins and genes Proteins 0.000 claims description 15
- 238000010801 machine learning Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 8
- 238000012706 support-vector machine Methods 0.000 claims description 6
- 238000003066 decision tree Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000013518 transcription Methods 0.000 claims description 3
- 230000035897 transcription Effects 0.000 claims description 3
- 239000000523 sample Substances 0.000 description 28
- 210000000963 osteoblast Anatomy 0.000 description 8
- 210000001789 adipocyte Anatomy 0.000 description 7
- 210000001612 chondrocyte Anatomy 0.000 description 6
- 238000003559 RNA-seq method Methods 0.000 description 5
- 238000011529 RT qPCR Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000024245 cell differentiation Effects 0.000 description 3
- 230000002648 chondrogenic effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000002188 osteogenic effect Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000002293 adipogenic effect Effects 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000011419 induction treatment Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000013074 reference sample Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 101100328883 Arabidopsis thaliana COL1 gene Proteins 0.000 description 1
- 102100024506 Bone morphogenetic protein 2 Human genes 0.000 description 1
- 102000015775 Core Binding Factor Alpha 1 Subunit Human genes 0.000 description 1
- 108010024682 Core Binding Factor Alpha 1 Subunit Proteins 0.000 description 1
- 101000762366 Homo sapiens Bone morphogenetic protein 2 Proteins 0.000 description 1
- 102100031475 Osteocalcin Human genes 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012925 biological evaluation Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000012567 medical material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001582 osteoblastic effect Effects 0.000 description 1
- 210000004409 osteocyte Anatomy 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6881—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Cell Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种生物材料功能预测评价方法,其解决了现有评价方法劳动密集、实验周期长、样本库异质性大的技术问题,其包括如下步骤:(1)在待测材料环境中,培养人源骨髓间充质干细胞;(2)收集所述步骤(1)培养的人源骨髓间充质干细胞,提取总RNA,纯化建库,转录组测序,得到待测样本的转录组数据;(3)将所述步骤(2)得到的待测样本的转录组数据经批次效应校正、特征提取后,输入本发明的功能预测评价模型,计算出待测样本分别为不同细胞类型的置信度。本发明可用于生物材料功能预测评价领域。
Description
技术领域
本发明涉及一种生物材料的评价模型,具体地说,其涉及一种生物材料功能预测评价方法。
背景技术
当前,国内外对医用材料的评价内容主要分为理化性能评价和生物学评价两方面。其中,生物性能的评价集中在生物毒性,安全性评估方面,而在功能性评估上缺乏统一的评价体系。例如,对生物材料的干细胞命运调控功能评估尚未纳入国家医用生物材料有效性和安全性评价标准。因此这方面的材料评估数据产生于各生物材料研究实验室,由于表征手段,表征技术等缺乏统一的标准,样本数据库存在异质性。此外,当前大多数功能评估实验局限于单一的指标。细胞的身份体现在特异基因的表达上,因此当前对细胞类型的鉴定往往是对单个特异性基因表达的鉴定。例如,在基因层面上对在成骨细胞中高表达的基因BMP2,Runx2,COL1等进行qPCR检测,或者在蛋白质层面上对骨钙蛋白OCN,骨源性碱性磷酸酶ALP进行Western Blot检测。
然而,使用传统单一指标评价方法具有很大局限性,主要体现在以下几个方面:(1)单基因的qPCR检测不足以准确判断细胞的身份,因为同一种基因可能在多种细胞类型中高表达,另外,即使只有一部分细胞高表达该基因仍可能导致qPCR检测为整体高表达。(2)为提高准确性,往往需要对多个基因进行qPCR检测,造成劳力的浪费。(3)不同材料的评估之间难以比较:基于不同指标的评价无法直接比较,即使相同的指标也因缺乏标准定量化而难以比较。(4)无法提供细胞分化状态的全貌,既不能给出分化细胞的比例,也无法知晓细胞是否已经朝骨细胞的方向分化。
综上所述,单个生物标志分子的表达对细胞分化方向的评估效果不可定量,缺乏对细胞分化全貌的可量化评估,使得新型生物材料功能性上的设计优化研究缺少理论和数据支持,难以高通量筛选优化材料体系的理化参数,新型生物材料的生物性能也缺乏可预测性。
发明内容
本发明就是针对现有评价方法劳动密集、实验周期长、样本库异质性大等技术问题,提供一种准确率高、可预测的生物材料功能预测评价方法。
为此,本发明提供一种生物材料功能预测评价方法,包括如下步骤:
(1)在待测材料环境中,培养人源骨髓间充质干细胞;(2)收集所述步骤(1)培养的人源骨髓间充质干细胞,提取总RNA,纯化建库,转录组测序,得到待测样本的转录组数据;(3)将所述步骤(2)得到的待测样本的转录组数据经批次效应校正、特征提取后,输入功能预测评价模型,计算出待测样本分别为不同细胞类型的置信度。
优选的,所述步骤(3)中的功能预测评价模型的构建方法包括如下步骤:(a)将所述步骤(2)得到的待测样本的转录组数据分为训练集和测试集,分别进行批次效应校正;(b)基于训练集数据提取四类细胞类型的基因表达特征,并对转录组数据进行特征提取;(c)基于训练集数据训练机器学习模型,优化得到Ensemble Learning智能预测模型;(d)将测试集数据输入Ensemble Learning智能预测模型,得到测试集样本的预测细胞类型,与样本的真实细胞类型比较,计算模型的准确率、查全率指标。
优选的,所述步骤(a)中,所述批次效应校正,基于ComBatseq算法和DaMiRseq算法整合优化;训练集已知样本类型和批次;测试集的样本类型未知,对测试集的批次效应校正基于训练集批次效应校正产生的参数,每个测试集独立校正。
优选的,所述步骤(b)中,所述特征提取,基于DaMiRseq算法和DESeq2算法整合提取;对训练集进行批次效应校正后,根据样本类型提取四类细胞类型的特征表达基因;对经过批次效应校正处理后的训练集和测试集数据分别提取特征基因的表达矩阵。
优选的,所述步骤(c)中,通过整合Ridge Classifier CV、Support VectorMachine、Decision Tree和Gaussian Naive Bayes四种机器学习算法,构建得到EnsembleLearning智能预测模型;首先在训练集上训练和优化模型,然后在测试集上计算模型的评价指标。
本发明具有以下有益效果:
本发明设计和构建以转录组为定量评价依据的生物材料功能预测评价方法,将待测细胞转录组与事先构建好的干细胞分化的不同细胞类型的基因表达谱进行比较,以获得生物材料诱导细胞分化状态的全貌。
具体地说,本发明整合Ridge Classifier CV、Support Vector Machine、Decision Tree和Gaussian Naive Bayes四种机器学习算法,训练出能区分成骨细胞、成软骨细胞、脂细胞、未分化间充质干细胞四类细胞类型样本的智能预测模型,相对于传统生物标志物评价方法,对四种细胞类型的判断准确率有明显提升;同时,本发明将来源于公共数据库的,经化学诱导和生物材料培养前后人骨髓间充质干细胞的RNAseq数据作为测试样本,输入基于参考样本基因表达谱数据库构建的预测模型,得到的结果显示,智能模型预测出的细胞类型与测试样本的表型相符。
附图说明
图1为本发明中公共数据库来源的RNAseq数据的层级聚类图,通过样本之间的相关系数我们剔除横线以上的异常样本,保留下来的样本用于参考样本基因表达谱数据库的构建;
图2(a)、图2(b)、图2(c)、图2(d)为本发明中批次效应校正前后,参考样本基因表达谱数据库的变量方差解释百分比定量柱状图及基因表达箱型图;其中,图2(a)显示批次效应校正前,参考数据库中批次所解释的方差百分比明显高于细胞类型,说明样本之间的差异主要源于批次效应;图2(b)显示批次效应校正前,参考数据库中样本的基因表达分布在各批次间不一致,存在明显的批次效应;图2(c)显示批次效应校正后,参考数据库中细胞类型所解释的方差百分比明显升高并高于批次效应;图2(d)显示显示批次效应校正后,参考数据库中样本的基因表达分布在各批次间趋于一致,批次效应得到明显校正;
图3(a)、图3(b)为本发明中在数据预处理前后,参考数据库中样本通过tSNE降维的可视化图;其中,图3(a)显示在数据预处理前,降维后样本按照批次聚类;图3(b)显示在经过批次效应校正和特征提取两步预处理后,降维后样本按照细胞类型聚类,同一种细胞类型的样本在大数据中可视化会聚类在一起;
图4为本发明中在经过特征提取后,成骨细胞、成软骨细胞、脂细胞、未分化间充质干细胞四类细胞类型样本的基因表达热图,显示在提取特征基因的基因表达图谱后,成骨细胞、成软骨细胞、脂细胞、未分化间充质干细胞四类细胞类型有明显的区别,纵坐标是基因名,横坐标是样本;
图5(a)、图5(b)为本发明中比较经典的机器学习模型预测样本细胞类型的准确率和优化后的智能预测模型的受试者工作特征曲线;其中图5(a)显示,在训练集上交叉验证100次循环,随机森林模型、支持向量机模型、高斯分布模型、线性判别式分析模型及四种模型组合构建的Ensemble Learning智能预测模型对四类细胞类型样本的预测准确率均高于90%;图5(b)显示优化后的Ensemble Learning智能预测模型的受试者工作特征曲线(ROCcurve),纵坐标为真阳性率,横坐标为假阳性率,平均受试者工作特征曲线靠近左上角,曲线下面积(AUC值)接近1,表明该预测模型具有优良的分类效果;
图6为本发明中优化后智能预测模型的分类效果评价报告,将来源于公共数据库的成骨、成软骨、成脂三种化学诱导处理前后人骨髓间充质干细胞的RNAseq数据作为测试样本,输入智能预测模型,计算后得到每个样本的预测细胞类型,从而对智能预测模型的分类效果进行评价,可见四类测试样本均能获得较高的F1分数,说明综合查准率和查全率两个指标,智能预测模型对成骨细胞、成软骨细胞、脂细胞、未分化间充质干细胞四类细胞类型样本的分类效果良好;
图7为本发明中功能预测评价模型的构建方法流程图。
具体实施方式
下面结合实施例对本发明做进一步描述。
本发明提供一种生物材料功能预测评价方法,其包括如下步骤:(1)在待测材料环境中,培养人源骨髓间充质干细胞;(2)收集所述步骤(1)培养的人源骨髓间充质干细胞,提取总RNA,纯化建库,转录组测序;(3)将待测样本的转录组数据(即步骤(2)得到样本的数据)经批次效应校正、特征提取后,输入本发明的功能预测评价模型(功能预测评价模型是通过整合Ridge Classifier CV、Support Vector Machine、Decision Tree和GaussianNaive Bayes四种机器学习算法,构建得到的Ensemble Learning智能预测模型),计算出待测样本分别为成骨细胞、成软骨细胞、脂细胞、未分化间充质干细胞四类细胞类型的置信度。
如图7所示,本发明中功能预测评价模型的构建包括如下步骤:首先,转录组数据被分为训练集和测试集,分别进行批次效应校正;然后,基于训练集数据提取四类细胞类型的基因表达特征,并对转录组数据进行特征提取;之后,基于训练集数据训练机器学习模型,优化得到Ensemble Learning智能预测模型;最后,将测试集数据输入EnsembleLearning智能预测模型,得到测试集样本的预测细胞类型,与样本的真实细胞类型比较,计算模型的准确率、查全率等指标。
一、批次效应校正:基于ComBatseq算法和DaMiRseq算法整合优化。
训练集已知样本类型和批次,批次效应校正选用的函数参数如示意图7所示;测试集的样本类型未知,对测试集的批次效应校正基于训练集批次效应校正产生的参数,每个测试集独立校正,选用的函数参数如示意图7所示。
二、特征提取:基于DaMiRseq算法和DESeq2算法整合提取。
对训练集进行批次效应校正后,根据样本类型提取四类细胞类型的特征表达基因,选用的函数参数如示意图7所示;然后,对经过批次效应校正处理后的训练集和测试集数据分别提取特征基因的表达矩阵。
三、功能预测评价模型:通过整合Ridge Classifier CV、Support VectorMachine、Decision Tree和Gaussian Naive Bayes四种机器学习算法,构建得到EnsembleLearning智能预测模型。首先在训练集上训练和优化模型,然后在测试集上计算模型的评价指标。
如图3(a)、图3(b)、图4所示,本发明经批次效应校正和特征提取两步数据预处理后,参考数据库中成骨细胞、成软骨细胞、脂细胞、未分化间充质干细胞四类细胞类型的样本在基因表达图谱上存在明显类间差异。
如图5(b)所示,用优化后的Ensemble Learning智能预测模型训练出能区分成骨细胞、成软骨细胞、脂细胞、未分化间充质干细胞四类细胞类型样本的智能预测模型,受试者工作特征曲线显示,基于大数据和机器学习的Ensemble Learning智能预测模型对四种细胞类型具有优良的分类效果。
如图6所示,将来源于公共数据库的成骨、成软骨、成脂三种化学诱导处理前后人骨髓间充质干细胞的RNAseq数据作为测试样本,输入智能预测模型,计算后得到每个样本的预测细胞类型,从而对Ensemble Learning智能预测模型的分类效果进行评价,可见四类测试样本均能获得较高的F1分数,其中成骨细胞一类细胞类型的查准率和查全率均较高,说明Ensemble Learning智能预测模型对于生物材料环境培养的样本是否成骨具有可靠的预测效果。
惟以上所述者,仅为本发明的具体实施例而已,当不能以此限定本发明实施的范围,故其等同组件的置换,或依本发明专利保护范围所作的等同变化与修改,皆应仍属本发明权利要求书涵盖之范畴。
Claims (5)
1.一种生物材料功能预测评价方法,其特征是,包括如下步骤:
(1)在待测材料环境中,培养人源骨髓间充质干细胞;
(2)收集所述步骤(1)培养的人源骨髓间充质干细胞,提取总RNA,纯化建库,转录组测序,得到待测样本的转录组数据;
(3)将所述步骤(2)得到的待测样本的转录组数据经批次效应校正、特征提取后,输入功能预测评价模型,计算出待测样本分别为不同细胞类型的置信度。
2.根据权利要求1所述的生物材料功能预测评价方法,其特征在于,所述步骤(3)中的功能预测评价模型的构建方法包括如下步骤:
(a)将所述步骤(2)得到的待测样本的转录组数据分为训练集和测试集,分别进行批次效应校正;
(b)基于训练集数据提取四类细胞类型的基因表达特征,并对转录组数据进行特征提取;
(c)基于训练集数据训练机器学习模型,优化得到Ensemble Learning智能预测模型;
(d)将测试集数据输入Ensemble Learning智能预测模型,得到测试集样本的预测细胞类型,与样本的真实细胞类型比较,计算模型的准确率、查全率指标。
3.根据权利要求2所述的的生物材料功能预测评价方法,其特征在于,所述步骤(a)中,所述批次效应校正,基于ComBatseq算法和DaMiRseq算法整合优化;训练集已知样本类型和批次;测试集的样本类型未知,对测试集的批次效应校正基于训练集批次效应校正产生的参数,每个测试集独立校正。
4.根据权利要求2所述的的生物材料功能预测评价方法,其特征在于,所述步骤(b)中,所述特征提取,基于DaMiRseq算法和DESeq2算法整合提取;对训练集进行批次效应校正后,根据样本类型提取四类细胞类型的特征表达基因;对经过批次效应校正处理后的训练集和测试集数据分别提取特征基因的表达矩阵。
5.根据权利要求2所述的的生物材料功能预测评价方法,其特征在于,所述步骤(c)中,通过整合Ridge Classifier CV、Support Vector Machine、Decision Tree和GaussianNaive Bayes四种机器学习算法,构建得到Ensemble Learning智能预测模型;首先在训练集上训练和优化模型,然后在测试集上计算模型的评价指标。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110884816.5A CN113604544B (zh) | 2021-08-03 | 2021-08-03 | 一种生物材料功能预测评价方法 |
PCT/CN2021/119233 WO2023010660A1 (zh) | 2021-08-03 | 2021-09-18 | 一种生物材料功能预测评价方法 |
US18/429,680 US20240274228A1 (en) | 2021-08-03 | 2024-02-01 | Method for predicting and evaluating function of biomaterial |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110884816.5A CN113604544B (zh) | 2021-08-03 | 2021-08-03 | 一种生物材料功能预测评价方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113604544A true CN113604544A (zh) | 2021-11-05 |
CN113604544B CN113604544B (zh) | 2023-03-10 |
Family
ID=78339171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110884816.5A Active CN113604544B (zh) | 2021-08-03 | 2021-08-03 | 一种生物材料功能预测评价方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240274228A1 (zh) |
CN (1) | CN113604544B (zh) |
WO (1) | WO2023010660A1 (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104331642A (zh) * | 2014-10-28 | 2015-02-04 | 山东大学 | 用于识别细胞外基质蛋白的集成学习方法 |
CN105567829A (zh) * | 2016-01-26 | 2016-05-11 | 大连理工大学 | 用人骨髓间充质干细胞预测遗传毒性的方法 |
WO2016117812A1 (ko) * | 2015-01-21 | 2016-07-28 | 서울대학교 산학협력단 | 암 바이오마커의 성능 평가 장치 및 방법 |
CN107045637A (zh) * | 2016-12-16 | 2017-08-15 | 中国医学科学院生物医学工程研究所 | 一种基于光谱的血液物种识别仪及识别方法 |
CN108182346A (zh) * | 2016-12-08 | 2018-06-19 | 杭州康万达医药科技有限公司 | 预测siRNA针对某类细胞的毒性的机器学习模型的建立方法及其应用 |
CN109360198A (zh) * | 2018-10-08 | 2019-02-19 | 北京羽医甘蓝信息技术有限公司 | 基于深度学习的骨髓细胞分类方法及分类装置 |
CN109416928A (zh) * | 2016-06-07 | 2019-03-01 | 伊路米纳有限公司 | 用于进行二级和/或三级处理的生物信息学系统、设备和方法 |
CN109918708A (zh) * | 2019-01-21 | 2019-06-21 | 昆明理工大学 | 一种基于异质集成学习的材料性能预测模型构建方法 |
WO2019178561A2 (en) * | 2018-03-16 | 2019-09-19 | The United States Of America, As Represented By The Secretary, Department Of Health & Human Services | Using machine learning and/or neural networks to validate stem cells and their derivatives for use in cell therapy, drug discovery, and diagnostics |
CN110400601A (zh) * | 2019-08-23 | 2019-11-01 | 元码基因科技(无锡)有限公司 | 基于rna靶向测序和机器学习的癌症亚型分型方法及装置 |
TW202002999A (zh) * | 2018-04-06 | 2020-01-16 | 新加坡商細胞研究私人有限公司 | 臍帶羊膜的基本上純的間質幹細胞群用於產生攜帶轉殖基因的哺乳動物幹細胞的用途 |
CN112159791A (zh) * | 2020-10-21 | 2021-01-01 | 北京大学口腔医学院 | 一种促进间充质干细胞定向成骨分化的方法 |
CN112292697A (zh) * | 2018-04-13 | 2021-01-29 | 弗里诺姆控股股份有限公司 | 用于生物样品的多分析物测定的机器学习实施方式 |
CN112382352A (zh) * | 2020-10-30 | 2021-02-19 | 华南理工大学 | 基于机器学习的金属有机骨架材料结构特征快速评估方法 |
CN112858434A (zh) * | 2021-01-11 | 2021-05-28 | 北京大学口腔医学院 | 半胱氨酸蛋白酶抑制剂b检测装置及其制备方法和应用 |
US20210174898A1 (en) * | 2019-12-04 | 2021-06-10 | Tempus Labs, Inc. | Systems and methods for automating rna expression calls in a cancer prediction pipeline |
CN113195739A (zh) * | 2018-10-12 | 2021-07-30 | 罗斯托克大学 | 用于对骨髓干细胞疗法的响应的预测的方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011049439A1 (en) * | 2009-10-19 | 2011-04-28 | Universiteit Twente | Method for selecting bone forming mesenchymal stem cells |
CA2972598C (en) * | 2014-12-31 | 2024-03-12 | Wisconsin Alumni Research Foundation | Human pluripotent stem cell-based models for predictive developmental neural toxicity |
WO2016161311A1 (en) * | 2015-04-02 | 2016-10-06 | The New York Stem Cell Foundation | In vitro methods for assessing tissue compatibility of a material |
CN105112493A (zh) * | 2015-09-21 | 2015-12-02 | 中国人民解放军第四军医大学 | 一种骨植入材料表面体外细胞形态与成骨功能的检测与评价方法 |
WO2019066421A2 (ko) * | 2017-09-27 | 2019-04-04 | 이화여자대학교 산학협력단 | Dna 복제수 변이 기반의 암 종 예측 방법 |
US20230049525A1 (en) * | 2019-11-26 | 2023-02-16 | The United states of American, as Representative by the Secretary, Dept.of Health and Human Services | Methods of identifying cell-type-specific gene expression levels by deconvolving bulk gene expression |
-
2021
- 2021-08-03 CN CN202110884816.5A patent/CN113604544B/zh active Active
- 2021-09-18 WO PCT/CN2021/119233 patent/WO2023010660A1/zh active Application Filing
-
2024
- 2024-02-01 US US18/429,680 patent/US20240274228A1/en active Pending
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104331642A (zh) * | 2014-10-28 | 2015-02-04 | 山东大学 | 用于识别细胞外基质蛋白的集成学习方法 |
WO2016117812A1 (ko) * | 2015-01-21 | 2016-07-28 | 서울대학교 산학협력단 | 암 바이오마커의 성능 평가 장치 및 방법 |
CN105567829A (zh) * | 2016-01-26 | 2016-05-11 | 大连理工大学 | 用人骨髓间充质干细胞预测遗传毒性的方法 |
CN109416928A (zh) * | 2016-06-07 | 2019-03-01 | 伊路米纳有限公司 | 用于进行二级和/或三级处理的生物信息学系统、设备和方法 |
CN108182346A (zh) * | 2016-12-08 | 2018-06-19 | 杭州康万达医药科技有限公司 | 预测siRNA针对某类细胞的毒性的机器学习模型的建立方法及其应用 |
CN107045637A (zh) * | 2016-12-16 | 2017-08-15 | 中国医学科学院生物医学工程研究所 | 一种基于光谱的血液物种识别仪及识别方法 |
WO2019178561A2 (en) * | 2018-03-16 | 2019-09-19 | The United States Of America, As Represented By The Secretary, Department Of Health & Human Services | Using machine learning and/or neural networks to validate stem cells and their derivatives for use in cell therapy, drug discovery, and diagnostics |
US20210117729A1 (en) * | 2018-03-16 | 2021-04-22 | The United States Of America, As Represented By The Secretary, Department Of Health & Human Services | Using machine learning and/or neural networks to validate stem cells and their derivatives (2-d cells and 3-d tissues) for use in cell therapy and tissue engineered products |
TW202002999A (zh) * | 2018-04-06 | 2020-01-16 | 新加坡商細胞研究私人有限公司 | 臍帶羊膜的基本上純的間質幹細胞群用於產生攜帶轉殖基因的哺乳動物幹細胞的用途 |
CN112292697A (zh) * | 2018-04-13 | 2021-01-29 | 弗里诺姆控股股份有限公司 | 用于生物样品的多分析物测定的机器学习实施方式 |
CN109360198A (zh) * | 2018-10-08 | 2019-02-19 | 北京羽医甘蓝信息技术有限公司 | 基于深度学习的骨髓细胞分类方法及分类装置 |
CN113195739A (zh) * | 2018-10-12 | 2021-07-30 | 罗斯托克大学 | 用于对骨髓干细胞疗法的响应的预测的方法 |
CN109918708A (zh) * | 2019-01-21 | 2019-06-21 | 昆明理工大学 | 一种基于异质集成学习的材料性能预测模型构建方法 |
CN110400601A (zh) * | 2019-08-23 | 2019-11-01 | 元码基因科技(无锡)有限公司 | 基于rna靶向测序和机器学习的癌症亚型分型方法及装置 |
US20210174898A1 (en) * | 2019-12-04 | 2021-06-10 | Tempus Labs, Inc. | Systems and methods for automating rna expression calls in a cancer prediction pipeline |
CN112159791A (zh) * | 2020-10-21 | 2021-01-01 | 北京大学口腔医学院 | 一种促进间充质干细胞定向成骨分化的方法 |
CN112382352A (zh) * | 2020-10-30 | 2021-02-19 | 华南理工大学 | 基于机器学习的金属有机骨架材料结构特征快速评估方法 |
CN112858434A (zh) * | 2021-01-11 | 2021-05-28 | 北京大学口腔医学院 | 半胱氨酸蛋白酶抑制剂b检测装置及其制备方法和应用 |
Non-Patent Citations (4)
Title |
---|
CHEN DS,等: "Early time-point cell morphology classifiers successfully predict human bone marrow stromal cell differentiation modulated by fiber density in nanofiber scaffolds", 《BIOMATERIALS》 * |
DHALIWAL A,等: "Profiling stem cell states in three-dimensional biomaterial niches using high content image informatics", 《ACTA BIOMATERIALIA》 * |
GOUSIADOU C,等: "Machine learning predictions of concentration-specific aggregate hazard scores of inorganic nanomaterials in embryonic zebrafish", 《NANOTOXICOLOGY》 * |
SUN XW,等: "Bone Piezoelectricity-Mimicking Nanocomposite Membranes Enhance Osteogenic Differentiation of Bone Marrow Mesenchymal Stem Cells by Amplifying Cell Adhesion and Actin Cytoskeleton", 《JOURNAL OF BIOMEDICAL NANOTECHNOLOGY》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113604544B (zh) | 2023-03-10 |
WO2023010660A1 (zh) | 2023-02-09 |
US20240274228A1 (en) | 2024-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110598902A (zh) | 一种基于支持向量机与knn相结合的水质预测方法 | |
CN108319984B (zh) | 基于dna甲基化水平的木本植物叶片表型特征和光合特性预测模型的构建方法及预测方法 | |
CN107238638A (zh) | 基于大曲各成分理化指标与产酒量和酒质联系的测定方法 | |
CN112466399B (zh) | 一种通过机器学习算法预测化学品致突变性的方法 | |
CN111292801A (zh) | 蛋白质质谱结合深度学习评估甲状腺结节的方法 | |
CN114038501B (zh) | 一种基于机器学习的背景菌判定方法 | |
CN118446652A (zh) | 一种基于物联网的led轨道灯生产控制方法及系统 | |
CN113604544B (zh) | 一种生物材料功能预测评价方法 | |
CN112599190B (zh) | 一种基于混合分类器来识别耳聋相关基因的方法 | |
CN111128300B (zh) | 基于突变信息的蛋白相互作用影响判断方法 | |
CN108342447B (zh) | 一种筛选与已知菌株表型相似的菌株的方法 | |
CN116497104A (zh) | 一种实验室标准菌株的质量控制评估方法及系统 | |
Ohnuki et al. | Dynamic changes in brewing yeast cells in culture revealed by statistical analyses of yeast morphological data | |
CN115598164B (zh) | 一种集成机器学习的土壤重金属浓度检测方法及系统 | |
CN110277139B (zh) | 一种基于互联网的微生物限度检查系统及方法 | |
CN115965294A (zh) | 一种基于机器学习和环境dna的河流水生态健康评价方法 | |
CN114634988B (zh) | 一组用于东亚群体生物地理来源鉴识研究的snp位点及方法 | |
CN109215736A (zh) | 一种肠道病毒组的高通量检测方法及应用 | |
CN106546553A (zh) | 一种转基因大豆油的快速无损鉴别方法 | |
CN116312813B (zh) | 鉴定干细胞群代次的方法及标志物 | |
CN116646010B (zh) | 人源性病毒检测方法及装置、设备、存储介质 | |
Wainer-Katsir et al. | BIRD: identifying cell doublets via biallelic expression from single cells | |
CN117314908B (zh) | 一种烤烟病毒溯源方法、介质及系统 | |
CN116312811A (zh) | 基于深度学习的cas12a检测试剂的sgRNA的高通量筛选方法和装置 | |
Baskir et al. | An integrated approach for DNA-damage detection from comet-images of Drosophila melanogaster |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Deng Xuliang Inventor after: Zhang Xuehui Inventor after: Zhou Yingying Inventor after: Ping Xianfeng Inventor before: Deng Xuliang Inventor before: Zhou Yingying Inventor before: Zhang Xuehui Inventor before: Ping Xianfeng |
|
CB03 | Change of inventor or designer information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |