CN117037895B - 模型训练方法、装置、电子设备及存储介质 - Google Patents

模型训练方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117037895B
CN117037895B CN202311297591.9A CN202311297591A CN117037895B CN 117037895 B CN117037895 B CN 117037895B CN 202311297591 A CN202311297591 A CN 202311297591A CN 117037895 B CN117037895 B CN 117037895B
Authority
CN
China
Prior art keywords
gene
sample
training
model
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311297591.9A
Other languages
English (en)
Other versions
CN117037895A (zh
Inventor
童浩南
张闯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Metabrain Intelligent Technology Co Ltd
Original Assignee
Suzhou Metabrain Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Metabrain Intelligent Technology Co Ltd filed Critical Suzhou Metabrain Intelligent Technology Co Ltd
Priority to CN202311297591.9A priority Critical patent/CN117037895B/zh
Publication of CN117037895A publication Critical patent/CN117037895A/zh
Application granted granted Critical
Publication of CN117037895B publication Critical patent/CN117037895B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种模型训练方法、装置、电子设备及存储介质,涉及信息处理技术领域,方法包括:基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集;对于任意一个所述训练样本,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果;基于所述训练样本对应的基因分类结果和所述基因分类标签,计算第一损失值,并基于所述训练样本对应的基因位置结果和所述基因位置标签,计算第二损失值;在所述第一损失值小于第一预设阈值,且所述第二损失值小于第二预设阈值的情况下,完成所述预设模型的训练,得到训练好的基因网络模型。

Description

模型训练方法、装置、电子设备及存储介质
技术领域
本发明涉及信息处理技术领域,尤其涉及一种模型训练方法、装置、电子设备及存储介质。
背景技术
基因与生物过程之间存在密切的关系,基因能够参与并调控多种生物过程,而不同的基因则会影响不同的生物过程。例如,有些基因可能会影响生物的发育过程、代谢过程,而另一些基因可能会影响生物的免疫反应或者呼吸等生理过程,而基因通过调控基因表达来参与并决定各种生物过程的进行,深入了解基因与生物过程之间的关系,对于理解生物学现象具有重要意义。
而由于生物系统的复杂性,基因表达的多样性,如何准确对于基因进行识别和定位,以及如何确定基因对应生物过程,仍然是一个难以解决的问题。
发明内容
本发明提供一种模型训练方法、装置、电子设备及存储介质,用以解决现有技术中由于生物系统的复杂性,基因表达的多样性,难以准确对基因进行识别和定位,以及难以确定基因对应生物过程的问题。
本发明提供一种模型训练方法,包括:
基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集;
对于任意一个所述训练样本,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果;
基于所述训练样本对应的基因分类结果和所述基因分类标签,计算第一损失值,并基于所述训练样本对应的基因位置结果和所述基因位置标签,计算第二损失值;
在所述第一损失值小于第一预设阈值,且所述第二损失值小于第二预设阈值的情况下,完成所述预设模型的训练,得到训练好的基因网络模型。
根据本发明提供的一种模型训练方法,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果,包括:
将每个所述训练样本输入预设模型中的特征提取模块,输出多尺度的特征图样本;
将不同尺度的所述特征图样本分别输入所述预设模型中的共表达基因分类模块,输出不同尺度所述特征图样本对应的基因分类结果;
将不同尺度的所述特征图样本分别输入所述预设模型中的共表达基因边界识别模块,输出不同尺度所述特征图样本对应的基因位置结果。
根据本发明提供的一种模型训练方法,将每个所述训练样本输入预设模型中的特征提取模块,输出多尺度的特征图样本,包括:
通过所述特征提取模块中主干网络的不同层级网络,对所述训练样本进行特征提取,得到多个不同尺寸的基因表达特征图;
通过特征金字塔结构或跳跃连接机制,将多个不同尺寸的所述基因表达特征图进行特征融合,得到多尺度的特征图样本;其中,所述多尺度的特征图样本包括一组具备不同分辨率和语义信息的特征图。
根据本发明提供的一种模型训练方法,将不同尺度的所述特征图样本分别输入所述预设模型中的共表达基因分类模块,输出不同尺度所述特征图样本对应的基因分类结果,包括:
将不同尺度的所述特征图样本分别输入所述共表达基因分类模块中的N个第一卷积层,将所述N个第一卷积层的输出输入到所述共表达基因分类模块中的激活函数,输出不同尺寸的特征图样本属于不同脑部生物过程类别的存在概率;N为正整数;
基于所述不同尺寸的特征图样本属于不同脑部生物过程类别的存在概率,得到不同尺度所述特征图样本对应的基因分类结果。
根据本发明提供的一种模型训练,将不同尺度的所述特征图样本分别输入所述预设模型中的共表达基因边界识别模块,输出不同尺度所述特征图样本对应的基因位置结果,包括:
将不同尺度的所述特征图样本输入所述共表达基因边界识别模块中的M个第二卷积层,将所述M个第二卷积层的输出输入到所述共表达基因边界识别模块中的线性输出层,输出不同尺度的所述特征图样本对应的4A个线性输出;
基于所述4A个线性输出,确定不同尺度所述特征图样本对应的基因位置结果;其中,A为不同尺度上不同基因网络的数量,M为正整数。
根据本发明提供的一种模型训练方法,在所述完成所述预设模型的训练,得到训练好的基因网络模型的步骤之后,还包括:
获取待分析对象的基因表达矩阵;
将所述基因表达矩阵输入所述基因网络模型中的特征提取模块,输出多尺度的特征图;
将不同尺度的所述特征图分别输入所述基因网络模型中的共表达基因分类模块和所述共表达基因边界识别模块,输出所述不同尺度所述特征图对应的基因分类结果和基因位置结果;
基于所述不同尺度所述特征图对应的基因分类结果和基因位置结果,确定所述待分析对象的基因网络检测结果。
根据本发明提供的一种模型训练方法,基于所述不同尺度所述特征图对应的基因分类结果和基因位置结果,确定所述待分析对象的基因网络检测结果,包括:
基于不同尺度所述特征图中各个相同基因位置结果的个数,确定各个基因位置结果的解码置信度;
基于目标基因位置结果对应的基因分类结果,确定基因检测结果;其中,所述目标基因位置结果是所述解码置信度大于预设解码置信度的基因位置结果。
根据本发明提供的一种模型训练方法,所述第一损失值的计算方法,具体包括:
通过平衡交叉熵损失函数,对所述训练样本对应的基因分类结果和所述基因分类标签进行损失值分析,得到第一损失值。
根据本发明提供的一种模型训练方法,所述第二损失值的计算方法,具体包括:
基于聚焦损失函数,对所述训练样本对应的基因位置结果和所述基因位置标签进行损失值分析,得到第二损失值。
根据本发明提供的一种模型训练方法,基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集,包括:
获取多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签;
将每个所述基因表达矩阵样本和所述基因表达矩阵样本对应的基因分类标签和基因位置标签作为一个训练样板,获取多个训练样本;
基于所述多个训练样本,构建包含至少一个训练样本的训练样本集。
根据本发明提供的一种模型训练方法,所述基因表达矩阵样本的获取方式,包括:
对待分析样本对应短序列的基因读段信息进行数据预处理,得到预处理后的基因读段信息;
将所述预处理后的基因读段信息与预设参考基因组或预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数;
基于所述每个基因的基因表达计数,构建所述待分析样本对应的基因表达矩阵样本。
根据本发明提供的一种模型训练方法,所述对待分析样本对应短序列的基因读段信息进行数据预处理,得到预处理后的基因读段信息,包括:
去除所述短序列的基因读段信息中的低质量基因读段信息,并去除所述基因读段信息中的适配器序列后,得到目标基因读段信息;
修剪或过滤所述目标基因读段信息中的低质量碱基,得到预处理后的基因读段信息。
根据本发明提供的一种模型训练方法,将所述预处理后的基因读段信息与预设参考基因组或预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数,包括:
在所述待分析样本对应有预设参考基因组的情况下,将所述预处理后的基因读段信息与所述预设参考基因组进行比对,得到每个所述待分析样本的每个基因的基因表达计数。
根据本发明提供的一种模型训练方法,将所述预处理后的基因读段信息与预设参考基因组或预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数,包括:
在所述待分析样本未对应有预设参考基因组,且对应有预设转录组的情况下,将所述预处理后的基因读段信息与所述预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数。
根据本发明提供的一种模型训练方法,所述基于所述每个基因的基因表达计数,构建所述待分析样本对应的基因表达矩阵样本,包括:
将各个所述基因的基因表达计数,整理为基因表达矩阵样本;
其中,所述基因表达矩阵样本中每行代表一个所述基因的基因表达计数。
根据本发明提供的一种模型训练方法,所述基因分类标签包括:神经退行性生物过程标签、神经发育性生物过程标签、神经精神生物过程标签或脑血管相关生物过程标签中的至少一项。
根据本发明提供的一种模型训练方法,在所述完成所述预设模型的训练,得到训练好的基因网络模型的步骤之后,还包括:
获取至少一个携带有所述基因分类结果和所述基因分类标签的基因表达验证矩阵;
将至少一个所述基因表达验证矩阵输入所述基因网络模型,输出每个所述基因表达验证矩阵对应的基因位置结果和基因分类结果;
基于所述基因位置结果、基因分类结果与所述基因分类结果和所述基因分类标签的比较,确定所述基因网络模型的验证结果。
本发明还提供一种模型训练装置,包括:
构建模块,用于基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集;
输入模块,用于对于任意一个所述训练样本,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果;
计算模块,用于基于所述训练样本对应的基因分类结果和所述基因分类标签,计算第一损失值,并基于所述训练样本对应的基因位置结果和所述基因位置标签,计算第二损失值;
完成模块,用于在所述第一损失值小于第一预设阈值,且所述第二损失值小于第二预设阈值的情况下,完成所述预设模型的训练,得到训练好的基因网络模型。
根据本申请提供的一种模型训练装置,所述装置还用于:
将每个所述训练样本输入预设模型中的特征提取模块,输出多尺度的特征图样本;
将不同尺度的所述特征图样本分别输入所述预设模型中的共表达基因分类模块,输出不同尺度所述特征图样本对应的基因分类结果;
将不同尺度的所述特征图样本分别输入所述预设模型中的共表达基因边界识别模块,输出不同尺度所述特征图样本对应的基因位置结果。
根据本申请提供的一种模型训练装置,所述装置还用于:
通过所述特征提取模块中主干网络的不同层级网络,对所述训练样本进行特征提取,得到多个不同尺寸的基因表达特征图;
通过特征金字塔结构或跳跃连接机制,将多个不同尺寸的所述基因表达特征图进行特征融合,得到多尺度的特征图样本;其中,所述多尺度的特征图样本包括一组具备不同分辨率和语义信息的特征图。
根据本申请提供的一种模型训练装置,所述装置还用于:
将不同尺度的所述特征图样本分别输入所述共表达基因分类模块中的N个第一卷积层,将所述N个第一卷积层的输出输入到所述共表达基因分类模块中的激活函数,输出不同尺寸的特征图样本属于不同脑部生物过程类别的存在概率;N为正整数;
基于所述不同尺寸的特征图样本属于不同脑部生物过程类别的存在概率,得到不同尺度所述特征图样本对应的基因分类结果。
根据本申请提供的一种模型训练装置,所述装置还用于:
将不同尺度的所述特征图样本输入所述共表达基因边界识别模块中的M个第二卷积层,将所述M个第二卷积层的输出输入到所述共表达基因边界识别模块中的线性输出层,输出不同尺度的所述特征图样本对应的4A个线性输出;
基于所述4A个线性输出,确定不同尺度所述特征图样本对应的基因位置结果;其中,A为不同尺度上不同基因网络的数量,M为正整数。
根据本申请提供的一种模型训练装置,所述装置还用于:
获取待分析对象的基因表达矩阵;
将所述基因表达矩阵输入所述基因网络模型中的特征提取模块,输出多尺度的特征图;
将不同尺度的所述特征图分别输入所述基因网络模型中的共表达基因分类模块和所述共表达基因边界识别模块,输出所述不同尺度所述特征图对应的基因分类结果和基因位置结果;
基于所述不同尺度所述特征图对应的基因分类结果和基因位置结果,确定所述待分析对象的基因网络检测结果。
根据本申请提供的一种模型训练装置,所述装置还用于:
基于不同尺度所述特征图中各个相同基因位置结果的个数,确定各个基因位置结果的解码置信度;
基于目标基因位置结果对应的基因分类结果,确定基因检测结果;其中,所述目标基因位置结果是所述解码置信度大于预设解码置信度的基因位置结果。
根据本申请提供的一种模型训练装置,所述装置还用于:
通过平衡交叉熵损失函数,对所述训练样本对应的基因分类结果和所述基因分类标签进行损失值分析,得到第一损失值。
根据本申请提供的一种模型训练装置,所述装置还用于:
基于聚焦损失函数,对所述训练样本对应的基因位置结果和所述基因位置标签进行损失值分析,得到第二损失值。
根据本申请提供的一种模型训练装置,所述装置还用于:
基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集,包括:
获取多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签;
将每个所述基因表达矩阵样本和所述基因表达矩阵样本对应的基因分类标签和基因位置标签作为一个训练样板,获取多个训练样本;
基于所述多个训练样本,构建包含至少一个训练样本的训练样本集。
根据本申请提供的一种模型训练装置,所述装置还用于:
对待分析样本对应短序列的基因读段信息进行数据预处理,得到预处理后的基因读段信息;
将所述预处理后的基因读段信息与预设参考基因组或预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数;
基于所述每个基因的基因表达计数,构建所述待分析样本对应的基因表达矩阵样本。
根据本申请提供的一种模型训练装置,所述装置还用于:
去除所述短序列的基因读段信息中的低质量基因读段信息,并去除所述基因读段信息中的适配器序列后,得到目标基因读段信息;
修剪或过滤所述目标基因读段信息中的低质量碱基,得到预处理后的基因读段信息。
根据本申请提供的一种模型训练装置,所述装置还用于:
在所述待分析样本对应有预设参考基因组的情况下,将所述预处理后的基因读段信息与所述预设参考基因组进行比对,得到每个所述待分析样本的每个基因的基因表达计数。
根据本申请提供的一种模型训练装置,所述装置还用于:
在所述待分析样本未对应有预设参考基因组,且对应有预设转录组的情况下,将所述预处理后的基因读段信息与所述预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数。
根据本申请提供的一种模型训练装置,所述装置还用于:
将各个所述基因的基因表达计数整理为基因表达矩阵样本;
其中,所述基因表达矩阵样本中每行代表一个所述基因的基因表达计数。
根据本申请提供的一种模型训练装置,所述装置还用于:
所述基因分类标签包括:神经退行性生物过程标签、神经发育性生物过程标签、神经精神生物过程标签或脑血管相关生物过程标签中的至少一项。
根据本申请提供的一种模型训练装置,所述装置还用于:
在所述完成所述预设模型的训练,得到训练好的基因网络模型的步骤之后,还包括:
获取至少一个携带有所述基因分类结果和所述基因分类标签的基因表达验证矩阵;
将至少一个所述基因表达验证矩阵输入所述基因网络模型,输出每个所述基因表达验证矩阵对应的基因位置结果和基因分类结果;
基于所述基因位置结果、基因分类结果与所述基因分类结果和所述基因分类标签的比较,确定所述基因网络模型的验证结果。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述模型训练方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述模型训练方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述模型训练方法。
本发明提供的模型训练方法、装置、电子设备及存储介质,通过携带有基因分类标签和基因位置标签的基因表达矩阵样本,来对包含有特征提取模块、共表达基因分类模块和共表达基因边界识别模块的预设模型进行训练,使得训练好的基因网络模型能够对基因表达矩阵有效生成该基因表达矩阵对应的多尺度的特征图,并且通过该基因网络模型中的共表达基因分类模块和所述共表达基因边界识别模块,可以分别有效识别不同尺度特征图对应的基因分类结果和基因位置结果,最终通过不同尺度特征图对应的基因分类结果和基因位置结果,能够精准预测每个共表达基因的位置,并基于对应共表达基因对应的基因分类结果,有效确定其对应的生物过程。本申请通过基因网络模型的训练,能够有效的实现对于基因网络的准确识别和定位,有效帮助对于基因调控与生物过程之间关系的理解。并为生物过程诊断、治疗和个性化医疗提供支持。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的模型训练方法流程示意图;
图2为本申请实施例提供的处理流程示意图;
图3为本申请实施例提供的模型训练装置结构示意图;
图4是本发明提供的电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的模型训练方法流程示意图,如图1所示,包括:
步骤110,基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集;
在本申请实施例中,基因表达矩阵样本具体可以是对样本使用高通量测序技术等获取的,具体可以是将样本中提取的RNA转录成cDNA,并对其进行测序或探针杂交实验。生成大量的数据,记录了每个基因在不同样本中的表达情况,最终根据这些表达情况得到基因表达矩阵样本。
在本申请实施例中,基因表达矩阵样本的每一行代表一个特定的基因,每一列代表一个样本。矩阵中的每个元素可以表示基因的表达量、表达水平的对数转换值或标准化的表达值。基因表达水平的值越高,表示该基因在对应样本中的表达程度越高。
在本申请实施例中,基因分类标签具体可以是用于标示该基因表达矩阵对应的生物过程类别的标签,该基因分类标签包括:神经退行性生物过程标签、神经发育性生物过程标签、神经精神生物过程标签或脑血管相关生物过程标签中的至少一项。
在本申请实施例中,基因位置标签具体是用于标识该基因表达矩阵样本在真实基因网络中的位置。真实的基因网络是由基因之间相互作用和调控关系构成的复杂网络。基因网络描述了基因之间的相互作用、调控及其对生物体内多种生物过程的影响。在基因网络中,基因被表示为节点,而基因之间的相互作用和调控关系则通过边来表示。这些边可以代表基因之间的物理相互作用、遗传调控、蛋白质相互作用等。
在本申请实施例中,每个训练样本为包含有一个基因分类标签和一个基因位置标签的基因表达矩阵样本,各个不同的训练样本的基因表达矩阵样本可能不同。
步骤120,对于任意一个所述训练样本,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果;
在本申请实施例中,预设模型中包括有特征提取模块、共表达基因分类模块和共表达基因边界识别模块。
在本申请实施例中,预设模型中的特征提取模块用于提取多尺度的特征图。
本申请实施例中,预设模型中的共表达基因分类模块,用于对多尺度的特征图进行分析,得到不同尺度所述特征图样本对应的基因分类结果。
在本申请实施例中,预设模型中的共表达基因边界识别模块,用于对多尺度的特征图进行分析,得到不同尺度所述特征图样本对应的基因位置结果。
步骤130,基于所述训练样本对应的基因分类结果和所述基因分类标签,计算第一损失值,并基于所述训练样本对应的基因位置结果和所述基因位置标签,计算第二损失值;
在本申请实施例中,在得到不同尺度特征图样本对应的基因分类结果之后,分别计算每个基因分类结果与基因分类标签之间的损失值之后,将这些损失值加权求和,得到该训练样本对应的第一损失值。
在本申请实施例中,在得到不同尺度所述特征图样本对应的基因位置结果之后,分别计算每个基因位置结果与基因位置标签的损失之后,将这些损失值进行加权求和,得到该训练样本对应的第二损失值。
步骤140,在所述第一损失值小于第一预设阈值,且所述第二损失值小于第二预设阈值的情况下,完成所述预设模型的训练,得到训练好的基因网络模型。
在本申请实施例中,第一预设阈值和第二预设阈值均可以是预先设定的阈值,其具体的设定可以是根据用户需求的设定的。
在第一损失值小于第一预设阈值,且第二损失值小于第二预设阈值的情况下,则说明该模型收敛,此时认为完成该预设模型的训练,最终得到训练好的基因网络模型。
在本申请实施例中,该训练好的基因网络模型用于在基因表达矩阵输入所述基因网络模型后,输出所述不同尺度特征图对应的基因分类结果和基因位置结果。
在本申请实施例中,通过携带有基因分类标签和基因位置标签的基因表达矩阵样本,来对包含有特征提取模块、共表达基因分类模块和共表达基因边界识别模块的预设模型进行训练,使得训练好的基因网络模型能够对基因表达矩阵有效生成该基因表达矩阵对应的多尺度的特征图,并且通过该基因网络模型中的共表达基因分类模块和所述共表达基因边界识别模块,可以分别有效识别不同尺度特征图对应的基因分类结果和基因位置结果,最终通过不同尺度特征图对应的基因分类结果和基因位置结果,能够精准预测每个共表达基因的位置,并基于对应共表达基因对应的基因分类结果,有效确定其对应的生物过程。本申请通过基因网络模型的训练,能够有效的实现对于基因网络的准确识别和定位,有效帮助对于基因调控与生物过程之间关系的理解。并为生物过程诊断、治疗和个性化医疗提供支持。
可选地,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果,包括:
将每个所述训练样本输入预设模型中的特征提取模块,输出多尺度的特征图样本;
将不同尺度的所述特征图样本输入所述预设模型中的共表达基因分类模块,输出不同尺度所述特征图样本对应的基因分类结果;
将不同尺度的所述特征图样本输入所述预设模型中的共表达基因边界识别模块,输出不同尺度所述特征图样本对应的基因位置结果。
具体地,将每个所述训练样本输入预设模型中的特征提取模块,输出多尺度的特征图样本,包括:
通过所述特征提取模块中主干网络的不同层级网络,对所述训练样本进行特征提取,得到多个不同尺寸的基因表达特征图;
通过特征金字塔结构或跳跃连接机制,将多个不同尺寸的所述基因表达特征图进行特征融合,得到多尺度的特征图样本;其中,所述多尺度的特征图样本包括一组具备不同分辨率和语义信息的特征图。
在本申请实施例中,训练样本输入到特征提取模块的卷积层后,可以通过卷积层捕捉输入数据中的局部模式和特征。卷积层通常使用一维卷积(或两维卷积)对基因表达数据的时间(或空间)轴进行卷积,从而提取不同尺寸的特征。卷积操作通常使用多个滤波器,每个滤波器学习不同的特征。
然后,卷积层的数据会继续输入到残差块中,残差块是由残差单元组成的基本模块,用于减缓神经网络训练时出现的梯度消失或爆炸问题。在基因表达分析中,残差块可以用于建立深层的卷积神经网络,以提高模型的性能和泛化能力。
残差块的输入可以进一步输入到池化层,池化层可以将特征图的尺寸缩小,减少特征数量和计算复杂度。在基因表达分析中,通常使用最大池化或平均池化对特征图进行下采样。池化操作也可以用于提取输入数据的不变性和平移不变性等特征。
在一个可选地实施例中在该主干网络的末尾还可以添加Transformer模块,用于进一步编码和建模基因之间的关系。
最后一层卷积层的输出特征图的维度将根据模型设计和参数设置而定。通常,输出特征图的维度将为(H'/s)x(W'/s)xC,其中H'和W'是经过卷积和池化操作后特征图的高度和宽度,s是下采样因子,C是通道数,最终得到基因表达特征图。
在本申请实施例中,特征金字塔结构和跳跃连接机制是在深度学习中常用的方法,可以用于获取多尺度的基因表达特征图。
在一个可选地实施例中,特征金字塔结构是指使用不同大小的滤波器或下采样来提取不同尺度的特征。对于基因表达数据,可以通过使用不同长度的卷积核或池化操作来实现。例如,可以使用较小的滤波器或池化核来捕捉细节和局部模式,而较大的滤波器或池化核则可以用于捕捉更大范围的模式和全局信息。通过堆叠或并行使用不同尺寸的滤波器或池化层,可以得到多尺度的基因表达特征图。
在另一个可选地实施例中,跳跃连接机制是指将不同层的特征图进行连接,以便获得多尺度的特征表示。在基因表达分析中,可以在网络中引入跳跃连接,以允许底层和高层之间的信息传递。一种常见的方法是使用残差连接,即将底层的特征图与高层的特征图相加或进行元素级别的合并操作。这样可以确保网络学习到细粒度的特征同时保留更全局的特征。得到多尺度的基因表达特征图。
在本申请实施例中,通过特征金字塔结构和跳跃连接机制,可以得到多张不同尺寸的基因表达特征图。这些特征图可以包含不同层次和尺度的信息,从而更全面地描述基因表达数据。在基于这些特征图进行进一步的分析和预测时,可以充分利用多尺度的信息,提高模型性能和泛化能力。
在本申请实施例中,采用深度残差网络和多尺度特征金字塔网络,能够从不同层级上提取多尺度的基因表达特征,更全面地捕捉基因表达矩阵中的信息,并有效地处理不同尺度的特征。
可选地,将不同尺度的所述特征图样本输入所述预设模型中的共表达基因分类模块,输出不同尺度所述特征图样本对应的基因分类结果,包括:
将不同尺度的所述特征图样本分别输入所述共表达基因分类模块中的N个第一卷积层,将所述N个第一卷积层的输出输入到所述共表达基因分类模块中的激活函数,输出不同尺寸的特征图样本属于不同脑部生物过程类别的存在概率;N为正整数;
基于所述不同尺寸的特征图样本属于不同脑部生物过程类别的存在概率,得到不同尺度所述特征图样本对应的基因分类结果。
在本申请实施例中,在得到不同尺度的特征图样本之后,可以进一步通过共表达基因分类模块,来计算不同尺寸的特征图样本属于不同脑部生物过程类别的存在概率。
在本申请实施例中,共表达基因分类模块可以是附加在每个特征提取模块输出的不同尺度的特征图上的基因网络,其参数在所有金字塔级别之间共享。具体步骤如下:
获取具有C个通道的输入特征图后,将多尺度特征图输入四个3×3第一卷积层,每个卷积层具有C个卷积核,并紧跟ReLU激活函数。
在四个卷积层处理后,可以应用一个具有KA个卷积核的3×3卷积层,其中A代表不同尺度上不同基因网络大小的数量。
最后,通过一个Sigmoid激活函数输出每个空间位置上每个尺度基因网络属于每个脑部生物过程类别的存在概率。
这个分类子网络可以在不同金字塔级别上共享参数,以提取多尺度的基因表达特征,并通过卷积和激活函数进行特征提取和非线性映射,最终输出每个不同尺度特征样本图中基因网络属于不同脑部生物过程类别的概率。
本申请实施例中,根据不同尺寸的特征图样本属于不同脑部生物过程类别的存在概率,进而确定不同尺度所述特征图样本对应的基因分类结果。
在本申请实施例中,基于卷积神经网络的共表达基因分类模块,接收特征提取模块的特征图作为输入,通过处理和提取这些特征,能够判断不同尺度共表达基因网络所属的类型,获得与目标类别相关的特征表示。
可选地,将不同尺度的所述特征图样本输入所述预设模型中的共表达基因边界识别模块,输出不同尺度所述特征图样本对应的基因位置结果,包括:
将不同尺度的所述特征图样本输入所述共表达基因边界识别模块中的M个第二卷积层,将所述M个第二卷积层的输出输入到所述共表达基因边界识别模块中的线性输出层,输出不同尺度的所述特征图样本对应的4A个线性输出;
基于所述4A个线性输出,确定不同尺度所述特征图样本对应的基因位置结果;其中,A为不同尺度上不同基因网络的数量,M为正整数。
在本申请实施例中,可以在前述特征提取模块的金字塔网络中附加另一个卷积网络作为共表达基因边界识别模块,
在本申请实施例中,对于每个空间位置的A个基因网络,通过应用一系列卷积层来提取特征。可以使用3×3的卷积核,并逐渐减少通道数,以减少参数数量。可以根据具体需求和实验调整卷积层的数量和卷积核大小。
对于线性输出层:在每个空间位置上,通过线性输出层生成4A个输出,用于预测共表达基因的边界框偏移量,得到不同尺度所述特征图样本对应的基因位置结果。
在本申请实施例中,共表达基因识别模块通过较少的参数来获得不同尺度基因网络的位置。并且,本申请中共表达基因识别模块与共表达基因边界识别模块即便具有共同的结构,但它们使用相互独立的参数。这意味着共表达基因识别模块专门用于预测基因网络的边界框偏移量,以准确定位和识别共表达基因。通过这样的设计,可以有效地将基因表达矩阵中的共表达基因识别出来,为后续的分析和研究提供有价值的信息。
可选地,在所述完成所述预设模型的训练,得到训练好的基因网络模型的步骤之后,还包括:
获取待分析对象的基因表达矩阵;
将所述基因表达矩阵输入所述基因网络模型中的特征提取模块,输出多尺度的特征图;
将不同尺度的所述特征图分别输入所述基因网络模型中的共表达基因分类模块和所述共表达基因边界识别模块,输出所述不同尺度所述特征图对应的基因分类结果和基因位置结果;
基于所述不同尺度所述特征图对应的基因分类结果和基因位置结果,确定所述待分析对象的基因网络检测结果。
在本申请实施例中,该待分析对象具体可以是包含有基因信息的待分析对象,例如基因的生物表达数据。
在本申请实施例中,可以进一步使用高通量测序技术(如RNA-seq)或基因芯片技术,对待分析对象的样本进行基因表达数据的测量,然后在进行数据预处理,序列比对和基因表达量估计之后,进行标准化和转换,将经过标准化和转换的表达量数据整理成矩阵形式,其中每行表示一个基因,每列表示一个样本,矩阵中的元素表示相应基因在相应样本中的表达量,完成待分析对象的基因表达矩阵的获取。
在本申请实施例中,在基因网络模型已经完成训练之后,图2为本申请实施例提供的处理流程示意图,如图2所示,在将基因表达矩阵输入到基因网络模型中的特征提取模块,能有效进行特征提取,并且通过特征金字塔结构或跳跃连接机制,将多个不同尺寸的所述基因表达特征图进行特征融合,输出多尺度的特征图。
在本申请实施例中,还可以进一步将不同尺度的特征图分别输入基因网络模型中的共表达基因分类模块和共表达基因边界识别模块,共表达基因分类模块可以输出不同尺度所述特征图对应的基因分类结果,共表达基因边界识别模块可以输出不同尺度所述特征图对应的基因位置结果。
在本申请实施例中,在得到不同尺度所述特征图对应的基因分类结果和基因位置结果之后,可以进一步多尺度特征图级别上,筛选解码置信度更高的结果。
更进一步地,基于所述不同尺度所述特征图对应的基因分类结果和基因位置结果,确定所述待分析对象的基因网络检测结果,包括:
基于不同尺度所述特征图中各个相同基因位置结果的个数,确定各个基因位置结果的解码置信度;
基于目标基因位置结果对应的基因分类结果,确定基因检测结果;其中,所述目标基因位置结果是所述解码置信度大于预设解码置信度的基因位置结果。
在本申请实施例中,不同尺度所述特征图中各个相同基因位置结果的个数,具体可以是指不同尺度所述特征图中位置重叠的基因位置结果。
在本申请实施例中,若相同基因位置结果的个数越多,则对应该基因位置结果的解码置信度越高,例如,相同基因位置结果的个数为5个,则对应解码置信度为0.1,相同基因位置结果的个数为10个,则对应解码置信度为0.2。
在本申请实施例中,可以通过上述方式对每个基因位置结果进行解码置信度分析,得到每个基因位置结果的解码置信度。
在本申请实施例中,预设解码置信度可以是预先设定的数值,在基因位置结果的解码置信度大于预设解码置信度的基因位置结果的情况下,则说明此时该基因位置结果的可信度较高,可以将其作为目标基因位置结果。例如,使用预设解码置信度为0.5的阈值进行筛选。
在本申请实施例中,筛选出目标基因位置结果后,可以进一步将各个尺度的目标基因位置结果进行合并,并根据合并后的目标基因位置结果对应的基因分类结果,确定最终的基因检测结果。
在本申请实施例中,通过采用深度残差网络和多尺度特征金字塔网络,能够从不同层级上提取多尺度的基因表达特征,更全面地捕捉基因表达矩阵中的信息,并有效地处理不同尺度的特征,同时通过基因网络模型中的共表达基因分类模块和所述共表达基因边界识别模块,判断不同尺度共表达基因网络所属的类型,同时精准预测每个共表达基因网络在表达矩阵中的位置。
可选地,所述第一损失值的计算方法,具体包括:
通过平衡交叉熵损失函数,对所述训练样本对应的基因分类结果和所述基因分类标签进行损失值分析,得到第一损失值。
在本申请实施例中,平衡交叉熵损失函数是一种常用于分类问题的损失函数,平衡交叉熵通过给予少数类别更大的权重,使得模型更加关注少数类别的正确分类,从而解决样本不平衡问题,在对训练样本进行分类时,可以利用平衡交叉熵损失函数来计算基因分类结果和基因分类标签之间的差异,从而得到第一损失值。
可选地,所述第二损失值的计算方法,具体包括:
基于聚焦损失函数,对所述训练样本对应的基因位置结果和所述基因位置标签进行损失值分析,得到第二损失值。
在本申请实施例中,在传统的交叉熵损失函数中,对于样本不平衡问题,容易受到大量易分类样本的干扰,导致难分类样本的学习效果不佳。而聚焦损失函数通过引入一个聚焦因子,使得模型更关注在分类困难的样本上,从而提高这些样本的学习效果。
在本申请实施例中,利用聚焦损失函数,可以有效基因位置结果和所述基因位置标签进行损失值分析,得到第二损失值。
在本申请实施例中,通过采用平衡交叉熵和聚焦损失作为损失函数,并选择适当的优化器进行参数优化,实现对基于深度学习的基因网络构建模型的有效训练和性能提升。
可选地,基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集,包括:
获取多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签;
将每个所述基因表达矩阵样本和所述基因表达矩阵样本对应的基因分类标签和基因位置标签作为一个训练样板,获取多个训练样本;
基于所述多个训练样本,构建包含至少一个训练样本的训练样本集。
在本申请实施例中,通过每个基因表达矩阵样本对应有一个基因分类标签和一个基因位置标签。
在本申请实施例中,可以获取多个不同的基因表达矩阵样本,及每个基因表达矩阵样本对应的基因分类标签和基因位置标签,最终完成训练样本集的构建。
更进一步的,所述基因表达矩阵样本的获取方式,包括:
对待分析样本对应短序列的基因读段信息进行数据预处理,得到预处理后的基因读段信息;
将所述预处理后的基因读段信息与预设参考基因组或预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数;
基于所述每个基因的基因表达计数,构建所述待分析样本对应的基因表达矩阵样本。
在本申请实施例中,对从测序仪获得的短序列读段进行质量控制和预处理,得到预处理后的基因读段信息。
在一个可选地实施例中,所述对待分析样本对应短序列的基因读段信息进行数据预处理,得到预处理后的基因读段信息,包括:
去除所述短序列的基因读段信息中的低质量基因读段信息,并去除所述基因读段信息中的适配器序列后,得到目标基因读段信息;
修剪或过滤所述目标基因读段信息中的低质量碱基,得到预处理后的基因读段信息。
在本申请实施例中,可以首先,检查和修剪低质量的读段。可以使用工具如FastQC检查每个读段的质量分数,并根据设定的阈值来去除低质量的读段,得到目标基因读段信息。
更具体地,本申请实施例中所描述的修剪或过滤所述目标基因读段信息中的低质量碱基,修建具体可以是将低质量碱基从读段的末端截除,以提高整个读段的质量。修剪通常会根据读段的质量分值进行,并将分值低于一个阈值的碱基从末端截去。修剪的工具包括Trimmomatic、Cutadapt等。
本申请实施例中,过滤是指将包含低质量碱基的读段从样本中删除,以提高后续分析的准确性。过滤通常会根据读段的平均质量分值、碱基含量和长度等指标进行,并将不符合指标的读段从样本中删除。过滤的工具包括fastp、Prinseq等。
在完成修剪或过滤后,可以有效得到预处理后的基因读段信息。
在本申请实施例中,通过去除低质量基因读段信息,已经修剪或过滤目标基因读段信息中的低质量碱基,能够有效提高数据质量。
可选地,将所述预处理后的基因读段信息与预设参考基因组或预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数,包括:
在所述待分析样本对应有预设参考基因组的情况下,将所述预处理后的基因读段信息与所述预设参考基因组进行比对,得到每个所述待分析样本的每个基因的基因表达计数。
在所述待分析样本未对应有预设参考基因组,且对应有预设转录组的情况下,将所述预处理后的基因读段信息与所述预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数。
在本申请实施例中,将预处理后的读段与参考基因组或转录组进行比对。这一步的目标是确定每个读段在参考序列中的位置,以便将它们与特定的基因相关联。
对于基因组比对:如果希望计算基因的表达水平,并且有一个预设参考基因组(通常是已知的物种基因组),则将读段与该预设参考基因组比对。
对于转录组比对:如果希望计算转录本或外显子的表达水平,或者研究对象没有已知的预设参考基因组,而是已知的转录组,那么将读段与该转录组进行比对。
在本申请实施例中,一旦完成比对,可以根据比对的结果来计算每个基因的表达水平。通常,将读段按其比对到的基因进行计数。这可以通过诸如HTSeq、featureCounts等工具来完成。计数表示每个基因上的读段数量,反映了该基因的表达水平,最终得到每个待分析样本的每个基因的基因表达计数。
可选地,所述基于所述每个基因的基因表达计数,构建所述待分析样本对应的基因表达矩阵样本,包括:
将各个所述基因的基因表达计数整理为基因表达矩阵样本;
其中,所述基因表达矩阵样本中每行代表一个所述基因的基因表达计数。
在本申请实施例中,收集各个基因的基因表达计数数据。这些数据可以来自于转录组测序、RNA-seq或其他相关技术得到的结果。确保每个样本的基因表达计数数据都在同一尺度下进行测量。
然后,根据收集到的基因表达计数数据,创建一个基因表达矩阵。矩阵的行代表每个基因,列代表每个样本。确保基因在矩阵中的顺序一致,以便后续分析的一致性。最终,将每个基因的基因表达计数填充到矩阵中相应的位置。确保每行代表一个基因的基因表达计数。
在另一个可选的实施例中,通过数据扩充来增加训练样本的多样性和数量。在基因表达数据中,数值和位置的准确性非常重要,因此传统的图像增强操作可能不适用于基因表达数据的数据扩充。本申请实施例中可以向基因表达矩阵样本中引入适度的噪声,以模拟实际测量中的噪声。这可以帮助网络学习对噪声的鲁棒性,并提高模型的泛化能力。此外,可以对基因表达矩阵样本进行平移操作,即在水平或垂直方向上对数据进行微小的平移。这有助于模型学习到基因表达数据中的位置信息。最后,可以对基因表达矩阵样本进行平移操作,即在水平或垂直方向上对数据进行微小的平移。这有助于模型学习到基因表达矩阵样本中的位置信息。通过这些操作来扩充需要的训练样本集。
在本申请实施例中,通过选择相关基因表达矩阵样本并采用适度噪声引入和平移操作进行数据扩充,以提高训练样本的多样性、数量和准确性。
可选地,在所述完成所述预设模型的训练,得到训练好的基因网络模型的步骤之后,还包括:
获取至少一个携带有所述基因分类结果标签基因分类结果和所述基因分类标签的基因表达验证矩阵;
将至少一个所述基因表达验证矩阵输入所述基因网络模型,输出每个所述基因表达验证矩阵对应的基因位置结果和基因分类结果;
基于所述基因位置结果、基因分类结果与所述基因分类结果标签基因分类结果和所述基因分类标签的比较,确定所述基因网络模型的验证结果。
在本申请实施例中,将基因表达验证矩阵输入所述基因网络模型,基因网络模型将输出每个基因表达验证矩阵对应的基因位置结果和基因分类结果。
基因位置结果可以是基因在染色体上的具体位置或其他相关位置信息。基因分类结果是模型根据输入数据推断出的基因分类标签。
在本申请实施例中,可以将基因位置结果、基因分类结果与基因分类结果标签进行比较。通过评估模型在验证数据上的准确性、召回率、F1分数等指标,确定基因网络模型的验证结果。
在本申请实施例中,通过基因表达验证矩阵,能够有效验证基因网络模型的可靠性。
下面对本发明提供的模型训练装置进行描述,下文描述的模型训练装置与上文描述的模型训练方法可相互对应参照。
图3为本申请实施例提供的模型训练装置结构示意图,如图3所示,包括:
构建模块310用于基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集;
输入模块320用于对于任意一个所述训练样本,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果;
计算模块330用于基于所述训练样本对应的基因分类结果标签基因分类结果和所述基因分类标签,计算第一损失值,并基于所述训练样本对应的基因位置结果和所述基因位置标签,计算第二损失值;
完成模块340用于在所述第一损失值小于第一预设阈值,且所述第二损失值小于第二预设阈值的情况下,完成所述预设模型的训练,得到训练好的基因网络模型。
根据本申请提供的一种模型训练装置,所述装置还用于:
将每个所述训练样本输入预设模型中的特征提取模块,输出多尺度的特征图样本;
将不同尺度的所述特征图样本分别输入所述预设模型中的共表达基因分类模块,输出不同尺度所述特征图样本对应的基因分类结果;
将不同尺度的所述特征图样本分别输入所述预设模型中的共表达基因边界识别模块,输出不同尺度所述特征图样本对应的基因位置结果。
根据本申请提供的一种模型训练装置,所述装置还用于:
通过所述特征提取模块中主干网络的不同层级网络,对所述训练样本进行特征提取,得到多个不同尺寸的基因表达特征图;
通过特征金字塔结构或跳跃连接机制,将多个不同尺寸的所述基因表达特征图进行特征融合,得到多尺度的特征图样本;其中,所述多尺度的特征图样本包括一组具备不同分辨率和语义信息的特征图。
根据本申请提供的一种模型训练装置,所述装置还用于:
将不同尺度的所述特征图样本分别输入所述共表达基因分类模块中的N个第一卷积层,将所述N个第一卷积层的输出输入到所述共表达基因分类模块中的激活函数,输出不同尺寸的特征图样本属于不同脑部生物过程类别的存在概率;N为正整数;
基于所述不同尺寸的特征图样本属于不同脑部生物过程类别的存在概率,得到不同尺度所述特征图样本对应的基因分类结果。
根据本申请提供的一种模型训练装置,所述装置还用于:
将不同尺度的所述特征图样本输入所述共表达基因边界识别模块中的M个第二卷积层,将所述M个第二卷积层的输出输入到所述共表达基因边界识别模块中的线性输出层,输出不同尺度的所述特征图样本对应的4A个线性输出;
基于所述4A个线性输出,确定不同尺度所述特征图样本对应的基因位置结果;其中,A为不同尺度上不同基因网络的数量,M为正整数。
根据本申请提供的一种模型训练装置,所述装置还用于:
获取待分析对象的基因表达矩阵;
将所述基因表达矩阵输入所述基因网络模型中的特征提取模块,输出多尺度的特征图;
将不同尺度的所述特征图分别输入所述基因网络模型中的共表达基因分类模块和所述共表达基因边界识别模块,输出所述不同尺度所述特征图对应的基因分类结果和基因位置结果;
基于所述不同尺度所述特征图对应的基因分类结果和基因位置结果,确定所述待分析对象的基因网络检测结果。
根据本申请提供的一种模型训练装置,所述装置还用于:
基于不同尺度所述特征图中各个相同基因位置结果的个数,确定各个基因位置结果的解码置信度;
基于目标基因位置结果对应的基因分类结果,确定基因检测结果;其中,所述目标基因位置结果是所述解码置信度大于预设解码置信度的基因位置结果。
根据本申请提供的一种模型训练装置,所述装置还用于:
通过平衡交叉熵损失函数,对所述训练样本对应的基因分类结果和所述基因分类标签进行损失值分析,得到第一损失值。
根据本申请提供的一种模型训练装置,所述装置还用于:
基于聚焦损失函数,对所述训练样本对应的基因位置结果和所述基因位置标签进行损失值分析,得到第二损失值。
根据本申请提供的一种模型训练装置,所述装置还用于:
基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集,包括:
获取多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签;
将每个所述基因表达矩阵样本和所述基因表达矩阵样本对应的基因分类标签和基因位置标签作为一个训练样板,获取多个训练样本;
基于所述多个训练样本,构建包含至少一个训练样本的训练样本集。
根据本申请提供的一种模型训练装置,所述装置还用于:
对待分析样本对应短序列的基因读段信息进行数据预处理,得到预处理后的基因读段信息;
将所述预处理后的基因读段信息与预设参考基因组或预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数;
基于所述每个基因的基因表达计数,构建所述待分析样本对应的基因表达矩阵样本。
根据本申请提供的一种模型训练装置,所述装置还用于:
去除所述短序列的基因读段信息中的低质量基因读段信息,并去除所述基因读段信息中的适配器序列后,得到目标基因读段信息;
修剪或过滤所述目标基因读段信息中的低质量碱基,得到预处理后的基因读段信息。
根据本申请提供的一种模型训练装置,所述装置还用于:
在所述待分析样本对应有预设参考基因组的情况下,将所述预处理后的基因读段信息与所述预设参考基因组进行比对,得到每个所述待分析样本的每个基因的基因表达计数。
根据本申请提供的一种模型训练装置,所述装置还用于:
在所述待分析样本未对应有预设参考基因组,且对应有预设转录组的情况下,将所述预处理后的基因读段信息与所述预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数。
根据本申请提供的一种模型训练装置,所述装置还用于:
将各个所述基因的基因表达计数整理为基因表达矩阵样本;
其中,所述基因表达矩阵样本中每行代表一个所述基因的基因表达计数。
根据本申请提供的一种模型训练装置,所述装置还用于:
所述基因分类标签包括:神经退行性生物过程标签、神经发育性生物过程标签、神经精神生物过程标签或脑血管相关生物过程标签中的至少一项。
根据本申请提供的一种模型训练装置,所述装置还用于:
在所述完成所述预设模型的训练,得到训练好的基因网络模型的步骤之后,还包括:
获取至少一个携带有所述基因分类结果和所述基因分类标签的基因表达验证矩阵;
将至少一个所述基因表达验证矩阵输入所述基因网络模型,输出每个所述基因表达验证矩阵对应的基因位置结果和基因分类结果;
基于所述基因位置结果、基因分类结果与所述基因分类结果和所述基因分类标签的比较,确定所述基因网络模型的验证结果。
在本申请实施例中,通过携带有基因分类标签和基因位置标签的基因表达矩阵样本,来对包含有特征提取模块、共表达基因分类模块和共表达基因边界识别模块的预设模型进行训练,使得训练好的基因网络模型能够对基因表达矩阵有效生成该基因表达矩阵对应的多尺度的特征图,并且通过该基因网络模型中的共表达基因分类模块和所述共表达基因边界识别模块,可以分别有效识别不同尺度特征图对应的基因分类结果和基因位置结果,最终通过不同尺度特征图对应的基因分类结果和基因位置结果,能够精准预测每个共表达基因的位置,并基于对应共表达基因对应的基因分类结果,有效确定其对应的生物过程。本申请通过基因网络模型的训练,能够有效的实现对于基因网络的准确识别和定位,有效帮助对于基因调控与生物过程之间关系的理解。并为生物过程诊断、治疗和个性化医疗提供支持。
图4是本发明提供的电子设备的结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行模型训练方法,该方法包括:基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集;
对于任意一个所述训练样本,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果;
基于所述训练样本对应的基因分类结果和所述基因分类标签,计算第一损失值,并基于所述训练样本对应的基因位置结果和所述基因位置标签,计算第二损失值;
在所述第一损失值小于第一预设阈值,且所述第二损失值小于第二预设阈值的情况下,完成所述预设模型的训练,得到训练好的基因网络模型。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的模型训练方法,该方法包括:基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集;
对于任意一个所述训练样本,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果;
基于所述训练样本对应的基因分类结果和所述基因分类标签,计算第一损失值,并基于所述训练样本对应的基因位置结果和所述基因位置标签,计算第二损失值;
在所述第一损失值小于第一预设阈值,且所述第二损失值小于第二预设阈值的情况下,完成所述预设模型的训练,得到训练好的基因网络模型。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的模型训练方法,该方法包括:基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集;
对于任意一个所述训练样本,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果;
基于所述训练样本对应的基因分类结果和所述基因分类标签,计算第一损失值,并基于所述训练样本对应的基因位置结果和所述基因位置标签,计算第二损失值;
在所述第一损失值小于第一预设阈值,且所述第二损失值小于第二预设阈值的情况下,完成所述预设模型的训练,得到训练好的基因网络模型。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (19)

1.一种模型训练方法,其特征在于,包括:
基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集;
对于任意一个所述训练样本,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果;
基于所述训练样本对应的基因分类结果和所述基因分类标签,计算第一损失值,并基于所述训练样本对应的基因位置结果和所述基因位置标签,计算第二损失值;
在所述第一损失值小于第一预设阈值,且所述第二损失值小于第二预设阈值的情况下,完成所述预设模型的训练,得到训练好的基因网络模型;
其中,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果,包括:
将每个所述训练样本输入预设模型中的特征提取模块,输出多尺度的特征图样本;
将不同尺度的所述特征图样本输入所述预设模型中的共表达基因分类模块,输出不同尺度所述特征图样本对应的基因分类结果;
将不同尺度的所述特征图样本输入所述预设模型中的共表达基因边界识别模块,输出不同尺度所述特征图样本对应的基因位置结果。
2.根据权利要求1所述的模型训练方法,其特征在于,将每个所述训练样本输入预设模型中的特征提取模块,输出多尺度的特征图样本,包括:
通过所述特征提取模块中主干网络的不同层级网络,对所述训练样本进行特征提取,得到多个不同尺寸的基因表达特征图;
通过特征金字塔结构或跳跃连接机制,将多个不同尺寸的所述基因表达特征图进行特征融合,得到多尺度的特征图样本;其中,所述多尺度的特征图样本包括一组具备不同分辨率和语义信息的特征图。
3.根据权利要求1所述的模型训练方法,其特征在于,将不同尺度的所述特征图样本输入所述预设模型中的共表达基因分类模块,输出不同尺度所述特征图样本对应的基因分类结果,包括:
将不同尺度的所述特征图样本分别输入所述共表达基因分类模块中的N个第一卷积层,将所述N个第一卷积层的输出输入到所述共表达基因分类模块中的激活函数,输出不同尺寸的特征图样本属于不同脑部生物过程类别的存在概率;N为正整数;
基于所述不同尺寸的特征图样本属于不同脑部生物过程类别的存在概率,得到不同尺度所述特征图样本对应的基因分类结果。
4.据权利要求1所述的模型训练方法,其特征在于,将不同尺度的所述特征图样本输入所述预设模型中的共表达基因边界识别模块,输出不同尺度所述特征图样本对应的基因位置结果,包括:
将不同尺度的所述特征图样本输入所述共表达基因边界识别模块中的M个第二卷积层,将所述M个第二卷积层的输出输入到所述共表达基因边界识别模块中的线性输出层,输出不同尺度的所述特征图样本对应的4A个线性输出;
基于所述4A个线性输出,确定不同尺度所述特征图样本对应的基因位置结果;其中,A为不同尺度上不同基因网络的数量,M为正整数。
5.根据权利要求1所述的模型训练方法,其特征在于,在所述完成所述预设模型的训练,得到训练好的基因网络模型的步骤之后,还包括:
获取待分析对象的基因表达矩阵;
将所述基因表达矩阵输入所述基因网络模型中的特征提取模块,输出多尺度的特征图;
将不同尺度的所述特征图分别输入所述基因网络模型中的共表达基因分类模块和所述共表达基因边界识别模块,输出所述不同尺度所述特征图对应的基因分类结果和基因位置结果;
基于所述不同尺度所述特征图对应的基因分类结果和基因位置结果,确定所述待分析对象的基因网络检测结果。
6.根据权利要求1所述的模型训练方法,其特征在于,基于所述不同尺度所述特征图对应的基因分类结果和基因位置结果,确定待分析对象的基因网络检测结果,包括:
基于不同尺度所述特征图中各个相同基因位置结果的个数,确定各个基因位置结果的解码置信度;
基于目标基因位置结果对应的基因分类结果,确定基因检测结果;其中,所述目标基因位置结果是所述解码置信度大于预设解码置信度的基因位置结果。
7.根据权利要求1所述的模型训练方法,其特征在于,所述第一损失值的计算方法,具体包括:
通过平衡交叉熵损失函数,对所述训练样本对应的基因分类结果和所述基因分类标签进行损失值分析,得到第一损失值。
8.根据权利要求1所述的模型训练方法,其特征在于,所述第二损失值的计算方法,具体包括:
基于聚焦损失函数,对所述训练样本对应的基因位置结果和所述基因位置标签进行损失值分析,得到第二损失值。
9.根据权利要求1所述的模型训练方法,其特征在于,基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集,包括:
获取多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签;
将每个所述基因表达矩阵样本和所述基因表达矩阵样本对应的基因分类标签和基因位置标签作为一个训练样板,获取多个训练样本;
基于所述多个训练样本,构建包含至少一个训练样本的训练样本集。
10.根据权利要求9所述的模型训练方法,其特征在于,所述基因表达矩阵样本的获取方式,包括:
对待分析样本对应短序列的基因读段信息进行数据预处理,得到预处理后的基因读段信息;
将所述预处理后的基因读段信息与预设参考基因组或预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数;
基于所述每个基因的基因表达计数,构建所述待分析样本对应的基因表达矩阵样本。
11.根据权利要求10所述的模型训练方法,其特征在于,所述对待分析样本对应短序列的基因读段信息进行数据预处理,得到预处理后的基因读段信息,包括:
去除所述短序列的基因读段信息中的低质量基因读段信息,并去除所述基因读段信息中的适配器序列后,得到目标基因读段信息;
修剪或过滤所述目标基因读段信息中的低质量碱基,得到预处理后的基因读段信息。
12.根据权利要求10所述的模型训练方法,其特征在于,将所述预处理后的基因读段信息与预设参考基因组或预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数,包括:
在所述待分析样本对应有预设参考基因组的情况下,将所述预处理后的基因读段信息与所述预设参考基因组进行比对,得到每个所述待分析样本的每个基因的基因表达计数。
13.根据权利要求10所述的模型训练方法,其特征在于,将所述预处理后的基因读段信息与预设参考基因组或预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数,包括:
在所述待分析样本未对应有预设参考基因组,且对应有预设转录组的情况下,将所述预处理后的基因读段信息与所述预设转录组进行比对,得到每个所述待分析样本的每个基因的基因表达计数。
14.根据权利要求10所述的模型训练方法,其特征在于,所述基于所述每个基因的基因表达计数,构建所述待分析样本对应的基因表达矩阵样本,包括:
将各个所述基因的基因表达计数整理为基因表达矩阵样本;
其中,所述基因表达矩阵样本中每行代表一个所述基因的基因表达计数。
15.根据权利要求1所述的模型训练方法,其特征在于,所述基因分类标签包括:神经退行性生物过程标签、神经发育性生物过程标签、神经精神生物过程标签或脑血管相关生物过程标签中的至少一项。
16.根据权利要求1所述的模型训练方法,其特征在于,在所述完成所述预设模型的训练,得到训练好的基因网络模型的步骤之后,还包括:
获取至少一个携带有所述基因分类结果和所述基因分类标签的基因表达验证矩阵;
将至少一个所述基因表达验证矩阵输入所述基因网络模型,输出每个所述基因表达验证矩阵对应的基因位置结果和基因分类结果;
基于所述基因位置结果、基因分类结果与所述基因分类结果和所述基因分类标签的比较,确定所述基因网络模型的验证结果。
17.一种模型训练装置,其特征在于,包括:
构建模块,用于基于多个基因表达矩阵样本和每个所述基因表达矩阵样本对应的基因分类标签和基因位置标签,构建包含至少一个训练样本的训练样本集;
输入模块,用于对于任意一个所述训练样本,将所述训练样本输入预设模型,输出所述训练样本对应的基因位置结果和基因分类结果;
计算模块,用于基于所述训练样本对应的基因分类结果和所述基因分类标签,计算第一损失值,并基于所述训练样本对应的基因位置结果和所述基因位置标签,计算第二损失值;
完成模块,用于在所述第一损失值小于第一预设阈值,且所述第二损失值小于第二预设阈值的情况下,完成所述预设模型的训练,得到训练好的基因网络模型;
其中,所述装置还用于:
将每个所述训练样本输入预设模型中的特征提取模块,输出多尺度的特征图样本;
将不同尺度的所述特征图样本输入所述预设模型中的共表达基因分类模块,输出不同尺度所述特征图样本对应的基因分类结果;
将不同尺度的所述特征图样本输入所述预设模型中的共表达基因边界识别模块,输出不同尺度所述特征图样本对应的基因位置结果。
18.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至16任一项所述模型训练方法。
19.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至16任一项所述模型训练方法。
CN202311297591.9A 2023-10-09 2023-10-09 模型训练方法、装置、电子设备及存储介质 Active CN117037895B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311297591.9A CN117037895B (zh) 2023-10-09 2023-10-09 模型训练方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311297591.9A CN117037895B (zh) 2023-10-09 2023-10-09 模型训练方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN117037895A CN117037895A (zh) 2023-11-10
CN117037895B true CN117037895B (zh) 2024-02-20

Family

ID=88624859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311297591.9A Active CN117037895B (zh) 2023-10-09 2023-10-09 模型训练方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117037895B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062405A (zh) * 2018-10-17 2020-04-24 三星电子株式会社 训练图像识别模型的方法和装置以及图像识别方法和装置
CN112863696A (zh) * 2021-04-25 2021-05-28 浙江大学 基于迁移学习和图神经网络的药物敏感性预测方法和装置
CN113239982A (zh) * 2021-04-23 2021-08-10 北京旷视科技有限公司 检测模型的训练方法、目标检测方法、装置和电子系统
CN114399780A (zh) * 2021-12-02 2022-04-26 清华大学 表格检测方法、表格检测模型训练方法及装置
CN114492761A (zh) * 2022-02-09 2022-05-13 腾讯科技(深圳)有限公司 编码模型的获取方法、聚类方法、装置、设备及介质
CN115439440A (zh) * 2022-09-02 2022-12-06 沈阳航空航天大学 一种基于深度学习的雏鸡快慢羽检测识别方法
CN116152254A (zh) * 2023-04-20 2023-05-23 北京万龙精益科技有限公司 工业泄露目标气体检测模型训练方法、检测方法、电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062405A (zh) * 2018-10-17 2020-04-24 三星电子株式会社 训练图像识别模型的方法和装置以及图像识别方法和装置
CN113239982A (zh) * 2021-04-23 2021-08-10 北京旷视科技有限公司 检测模型的训练方法、目标检测方法、装置和电子系统
CN112863696A (zh) * 2021-04-25 2021-05-28 浙江大学 基于迁移学习和图神经网络的药物敏感性预测方法和装置
CN114399780A (zh) * 2021-12-02 2022-04-26 清华大学 表格检测方法、表格检测模型训练方法及装置
CN114492761A (zh) * 2022-02-09 2022-05-13 腾讯科技(深圳)有限公司 编码模型的获取方法、聚类方法、装置、设备及介质
CN115439440A (zh) * 2022-09-02 2022-12-06 沈阳航空航天大学 一种基于深度学习的雏鸡快慢羽检测识别方法
CN116152254A (zh) * 2023-04-20 2023-05-23 北京万龙精益科技有限公司 工业泄露目标气体检测模型训练方法、检测方法、电子设备

Also Published As

Publication number Publication date
CN117037895A (zh) 2023-11-10

Similar Documents

Publication Publication Date Title
CN111598881B (zh) 基于变分自编码器的图像异常检测方法
CN105447569B (zh) 一种基于深度学习的乳腺癌细胞特征分析系统
CN106503727B (zh) 一种高光谱图像分类的方法及装置
CN110163261A (zh) 不平衡数据分类模型训练方法、装置、设备及存储介质
CN111428625A (zh) 一种基于深度学习的交通场景目标检测方法及系统
CN110930378B (zh) 基于低数据需求的肺气肿影像处理方法及系统
CN111354338B (zh) 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统
CN112052813B (zh) 染色体间易位识别方法、装置、电子设备及可读存储介质
CN115343676B (zh) 密封电子设备内部多余物定位技术的特征优化方法
CN115439654B (zh) 动态约束下的弱监督农田地块精细化分割方法及系统
CN113764034B (zh) 基因组序列中潜在bgc的预测方法、装置、设备及介质
CN114496099A (zh) 细胞功能注释方法、装置、设备及介质
CN115359845A (zh) 一种融合单细胞转录组的空间转录组生物组织亚结构解析方法
CN114445356A (zh) 基于多分辨率的全视野病理切片图像肿瘤快速定位方法
US20150242676A1 (en) Method for the Supervised Classification of Cells Included in Microscopy Images
CN108805181B (zh) 一种基于多分类模型的图像分类装置及分类方法
CN111863135B (zh) 一种假阳性结构变异过滤方法、存储介质及计算设备
CN117037895B (zh) 模型训练方法、装置、电子设备及存储介质
CN117371511A (zh) 图像分类模型的训练方法、装置、设备及存储介质
CN116129189A (zh) 一种植物病害识别方法、设备、存储介质及装置
CN113177602B (zh) 图像分类方法、装置、电子设备和存储介质
CN113627522A (zh) 基于关系网络的图像分类方法、装置、设备及存储介质
CN113222887A (zh) 基于深度学习的纳米铁标记神经干细胞示踪的方法
CN112184708B (zh) 精子存活率检测方法及装置
CN109784356A (zh) 基于Fisher判别分析的矩阵变量受限玻尔兹曼机图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant