CN113743414B - 基于语义编码的病灶识别方法、装置及系统 - Google Patents

基于语义编码的病灶识别方法、装置及系统 Download PDF

Info

Publication number
CN113743414B
CN113743414B CN202110882517.8A CN202110882517A CN113743414B CN 113743414 B CN113743414 B CN 113743414B CN 202110882517 A CN202110882517 A CN 202110882517A CN 113743414 B CN113743414 B CN 113743414B
Authority
CN
China
Prior art keywords
target
semantic
patient
target tissue
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110882517.8A
Other languages
English (en)
Other versions
CN113743414A (zh
Inventor
王雪
张蔚航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110882517.8A priority Critical patent/CN113743414B/zh
Publication of CN113743414A publication Critical patent/CN113743414A/zh
Application granted granted Critical
Publication of CN113743414B publication Critical patent/CN113743414B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本发明提供一种基于语义编码的病灶识别方法、装置及系统,该方法包括:根据目标患者的临床数据获取对应的目标语义编码向量组,目标患者对应的病变组织为目标组织,目标语义编码向量组包括至少一个目标语义编码向量;根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成包括至少一个目标语义特征向量的目标语义特征向量组,目标组织CT影像特征基于目标患者对应的目标组织CT影像确定;将目标语义特征向量组输入目标组织病灶识别模型以识别病灶,获取目标患者的目标组织病灶识别结果。本发明可以基于临床数据和医学影像对疑似病变的语义特征进行提取,且可以基于相对全面的特征提高病灶识别与疾病诊断的准确性。

Description

基于语义编码的病灶识别方法、装置及系统
技术领域
本发明涉及医学信息分析技术领域,尤其涉及一种基于语义编码的病灶识别方法、装置及系统。
背景技术
通过计算机断层扫描(Computed Tomography,CT)可以为多种疾病的无创检查与诊断带来巨大的便利,在无需对患者进行手术或穿刺的前提下能够清晰地显示病变组织及其内部病灶的解剖结构信息,为患者的疾病诊断、病程追踪、手术规划等提供可靠依据。
CT序列能够清晰地显示病灶特征属性,在三维空间中提供更多细节信息。随着CT序列的成像水平不断提高,每名患者的CT图像可多达数百张,为放射科医生带来了极大的阅片工作量。医生不仅需要从CT序列中找出存在病灶的图像,还需依据医学经验通过肉眼辨别判断病灶的三维形状、空间位置与相关属性。在病灶尺寸较小且其灰度值在CT图像中与其他部位比较接近时,医生在视觉疲劳的状况下很容易发生误检与漏检。因此,采用智能手段对患者CT序列进行自动分析并对病灶进行有效识别,对疾病的辅助诊断、降低医生工作负担具有非常重要的实际意义。
现阶段业内在基于CT序列进行智能分析与处理时,往往依据病灶的经验特征或者深度学习模型训练得到的特征组合,对病灶进行直接的检测或识别结果的判定。
其中,仅依据病灶的经验特征进行病灶识别准确度难以保证。另一方面,针对基于深度学习方法进行病灶识别而言,目前主流深度学习模型的可解释性一般不强,疑似病灶的特征主要依据算法的规则自主提取,虽然这些特征在高维空间中具有良好的可分性,对病灶的准确识别具有较高的有效性,但其在医学层面上的具体含义难以解释,对医生临床经验的积累与病理的认识研究作用较小。且仅通过对CT序列进行分析进行病灶识别,所依据的数据片面,具有识别局限性较大的弊端,且易出现识别不准确的情况。
发明内容
本发明实施例提供了一种基于语义编码的病灶识别方法、装置及系统,以解决现有技术中在仅依据CT序列进行病灶识别时所存在的对医生临床经验的积累与病理的认识研究作用较小、易导致识别不准确以及识别局限性较大的问题。
第一方面,本发明实施例提供一种基于语义编码的病灶识别方法,包括:
根据目标患者的临床数据获取对应的目标语义编码向量组,所述目标患者对应的病变组织为目标组织,所述目标语义编码向量组包括至少一个目标语义编码向量;
根据所述目标语义编码向量组和所述目标患者对应的目标组织CT影像特征,生成包括至少一个目标语义特征向量的目标语义特征向量组,所述目标组织CT影像特征基于所述目标患者对应的目标组织CT影像确定;
将所述目标语义特征向量组输入目标组织病灶识别模型以识别病灶,获取所述目标患者对应的目标组织病灶识别结果。
第二方面,本发明实施例提供一种基于语义编码的病灶识别装置,包括:
第一获取模块,用于根据目标患者的临床数据获取对应的目标语义编码向量组,所述目标患者对应的病变组织为目标组织,所述目标语义编码向量组包括至少一个目标语义编码向量;
生成模块,用于根据所述目标语义编码向量组和所述目标患者对应的目标组织CT影像特征,生成包括至少一个目标语义特征向量的目标语义特征向量组,所述目标组织CT影像特征基于所述目标患者对应的目标组织CT影像确定;
处理模块,用于将所述目标语义特征向量组输入目标组织病灶识别模型以识别病灶,获取所述目标患者对应的目标组织病灶识别结果。
第三方面,本发明实施例提供一种基于语义编码的病灶识别系统,包括边缘计算平台、中间计算平台以及云计算平台;
所述中间计算平台用于:根据目标患者的临床数据获取对应的目标语义编码向量组,根据所述目标语义编码向量组和所述目标患者对应的目标组织CT影像特征,生成目标语义特征向量组,所述目标患者对应的病变组织为目标组织,所述目标语义编码向量组包括至少一个目标语义编码向量,所述目标语义特征向量组包括至少一个目标语义特征向量;
所述边缘计算平台用于:获取所述目标患者对应的目标组织CT影像,并上传至所述中间计算平台,所述目标患者对应的目标组织CT影像特征由所述中间计算平台基于所述目标患者对应的目标组织CT影像确定;
所述云计算平台用于:获取所述目标语义特征向量组,将所述目标语义特征向量组输入目标组织病灶识别模型以识别病灶,获取所述目标患者对应的目标组织病灶识别结果。
第四方面,本发明实施例提供一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的基于语义编码的病灶识别方法。
第五方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的基于语义编码的病灶识别方法。
本发明实施例的技术方法,通过根据目标患者的临床数据获取对应的目标语义编码向量组,根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成目标语义特征向量组,可以基于临床数据和医学影像实现对目标组织内疑似病变的语义特征进行提取,将提取的语义特征输入目标组织病灶识别模型,以对目标患者的目标组织进行病灶识别,可以实现基于相对全面的特征提高病灶识别与疾病诊断的准确性。
附图说明
图1表示本发明实施例基于语义编码的病灶识别方法的示意图;
图2表示本发明实施例根据临床数据以及目标组织CT影像特征获取病灶识别结果的一具体实施框图;
图3表示本发明实施例基于语义编码的病灶识别装置的示意图;
图4表示本发明实施例基于语义编码的病灶识别系统的示意图;
图5表示本发明实施例基于语义编码的病灶识别系统对应的一具体实施框图;
图6表示本发明实施例电子设备示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。
在本发明的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
本发明实施例提供一种基于语义编码的病灶识别方法,如图1所示,包括:
步骤101、根据目标患者的临床数据获取对应的目标语义编码向量组,目标患者对应的病变组织为目标组织,目标语义编码向量组包括至少一个目标语义编码向量。
本发明实施例提供的基于语义编码的病灶识别方法,应用于基于语义编码的病灶识别系统,可以对患者的病变组织进行病灶识别。在需要对目标患者发生病变的目标组织进行识别时,可以首先获取目标患者的临床数据,其中,目标患者为目标组织发生病变的患者,目标组织可以为肺组织、肝组织、心脏组织或者脾组织等。
针对目标患者,在获取对应的临床数据之后,可以根据目标患者的临床数据获取目标患者对应的目标语义编码向量组,目标语义编码向量组包括至少一个目标语义编码向量,即,根据目标患者对应的临床数据获取至少一个目标语义编码向量,根据至少一个目标语义编码向量确定目标语义编码向量组。
步骤102、根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成包括至少一个目标语义特征向量的目标语义特征向量组,目标组织CT影像特征基于目标患者对应的目标组织CT影像确定。
在获取目标患者对应的包括至少一个目标语义编码向量的目标语义编码向量组之后,可以根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成目标语义特征向量组。其中,目标语义特征向量组包括至少一个目标语义特征向量,至少一个目标语义特征向量与至少一个目标语义编码向量一一对应。
目标患者对应的目标组织CT影像特征,可以基于目标患者对应的目标组织CT影像确定,目标组织CT影像可以为多张,即,可以基于目标患者对应的目标组织CT序列确定目标组织CT影像特征。
步骤103、将目标语义特征向量组输入目标组织病灶识别模型以识别病灶,获取目标患者对应的目标组织病灶识别结果。
在获取目标患者对应的目标语义特征向量组之后,可以通过目标组织病灶识别模型进行病灶识别,即,将目标语义特征向量组输入目标组织病灶识别模型中,由目标组织病灶识别模型基于目标语义特征向量组识别病灶,获取目标患者对应的目标组织病灶识别结果。
本发明上述实施过程,通过根据目标患者的临床数据获取对应的目标语义编码向量组,根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成目标语义特征向量组,可以基于临床数据和医学影像实现对目标组织内疑似病变的语义特征进行提取,将提取的语义特征输入目标组织病灶识别模型,以对目标患者的目标组织进行病灶识别,可以实现基于相对全面的特征提高病灶识别与疾病诊断的准确性。
可选的,临床数据包括医生临床经验、患者病例数据以及非影像学检查结果中的至少一类数据;步骤101根据目标患者的临床数据获取对应的目标语义编码向量组,包括以下方案至少之一:
采用第一编码器组阵列对医生临床经验进行编码处理,获取第一目标语义编码向量;
采用第二编码器组阵列对患者病例数据进行编码处理,获取第二目标语义编码向量;
采用第三编码器组阵列对非影像学检查结果进行编码处理,获取第三目标语义编码向量;
其中,目标语义编码向量组包括第一目标语义编码向量、第二目标语义编码向量和第三目标语义编码向量中的至少一个。
本发明实施例中的临床数据可以包括医生临床经验、患者病例数据以及非影像学检查结果中的至少一类数据,针对医生临床经验而言,可以包括主治医生的经验以及专家会诊经验。
在临床数据包括医生临床经验的情况下,在根据目标患者的临床数据获取对应的目标语义编码向量组时,可以采用第一编码器组阵列对医生临床经验进行编码处理,获取第一目标语义编码向量。其中,编码处理的过程可以理解为语义解析的过程。第一编码器组阵列包括多个第一编码器,多个第一编码器依序排列,在采用多个第一编码器对医生临床经验进行处理时,可以按照多个第一编码器的排序,依次采用不同的第一编码器进行处理,且每个第一编码器对应的待处理数据相区别,即,各第一编码器聚焦的数据不同。例如,排序首位的第一编码器对应的待处理数据为医生临床经验,排序第二位的第一编码器对应的待处理数据为经第一编码器处理后的中间数据,在中间数据中进行数据提取,实现数据过滤,保留关注数据,依次类推,经过多个第一编码器的处理,实现获取第一目标语义编码向量,第一目标语义编码向量包括经过筛选保留的有效数据。
在临床数据包括患者病例数据的情况下,在根据目标患者的临床数据获取对应的目标语义编码向量组时,可以采用第二编码器组阵列对患者病例数据进行编码处理,获取第二目标语义编码向量。其中,第二编码器组阵列包括多个第二编码器,多个第二编码器依序排列,在采用多个第二编码器对患者病例数据进行处理时,可以按照多个第二编码器的排序,依次采用不同的第二编码器进行处理,且每个第二编码器对应的待处理数据相区别。具体可参见多个第一编码器的依序处理过程。
在临床数据包括非影像学检查结果的情况下,在根据目标患者的临床数据获取对应的目标语义编码向量组时,可以采用第三编码器组阵列对非影像学检查结果进行编码处理,获取第三目标语义编码向量。其中,第三编码器组阵列包括多个第三编码器,多个第三编码器依序排列,在采用多个第三编码器对非影像学检查结果进行处理时,可以按照多个第三编码器的排序,依次采用不同的第三编码器进行处理,且每个第三编码器对应的待处理数据相区别。具体可参见多个第一编码器的依序处理过程。
需要说明的是,第一编码器组阵列、第二编码器组阵列以及第三编码器组阵列可以为相同的阵列或者不同的阵列,第一编码器、第二编码器以及第三编码器的数量也可以相同或者不同。
在目标患者的临床数据包括医生临床经验时,目标语义编码向量组包括第一目标语义编码向量;在临床数据包括患者病例数据时,目标语义编码向量组包括第二目标语义编码向量;在临床数据包括非影像学检查结果时,目标语义编码向量组包括第三目标语义编码向量。
上述实施过程,可以根据医生临床经验、患者病例数据以及非影像学检查结果中的至少一项,生成目标语义编码向量组,实现依据至少一类数据获取语义信息,保证语义信息获取的多样性以及全面性。
其中,步骤102根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成包括至少一个目标语义特征向量的目标语义特征向量组,包括:
针对目标语义编码向量组所包含的至少一个目标语义编码向量中的每个目标语义编码向量,将当前目标语义编码向量与目标组织CT影像特征进行融合,获取对应的目标语义特征向量;
根据至少一个目标语义特征向量生成目标语义特征向量组。
在根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成目标语义特征向量组时,可以针对目标语义编码向量组中的每个目标语义编码向量,将当前目标语义编码向量与目标组织CT影像特征进行融合,生成对应的目标语义特征向量。由于目标语义编码向量组包括至少一个目标语义编码向量,可以生成至少一个目标语义特征向量。在获取至少一个目标语义特征向量之后,可以根据至少一个目标语义特征向量生成目标语义特征向量组。其中,目标患者对应的目标组织CT影像特征,可以基于目标患者对应的目标组织CT影像确定,进而实现基于CT影像提取医学影像特征。
在目标语义编码向量为多个(包括两个以及两个以上)的情况下,目标组织CT影像特征可以与每一个目标语义编码向量进行融合,实现目标组织CT影像特征的重复利用。其中,在将目标组织CT影像特征与目标语义编码向量进行融合时,可以基于多头注意力机制进行融合。针对获取的目标语义特征向量为多个的情况,可以确定各目标语义特征向量对应的注意力函数,注意力函数可以用于表征目标语义特征向量在确定病灶结果时的贡献度。
上述实施过程,可以通过对CT影像中的可用信息进行特征提取获取医学影像特征,基于医学影像特征与至少一个目标语义编码向量的融合,实现将医学影像特征与临床经验、患者病例数据以及非影像学检查结果中的至少一项进行融合,可以基于不同的维度进行语义特征提取,进而保证病灶结果识别的准确度。
下面以临床数据包括医生临床经验、患者病例数据以及非影像学检查结果为例,通过一实施框图对根据临床数据以及目标组织CT影像特征进行病灶识别以获取病灶识别结果的过程进行阐述。具体可参见图2所示,针对目标患者对应的医生临床经验,基于第一编码器组阵列(包括多个第一编码器)进行处理,获取第一目标语义编码向量,针对目标患者对应的患者病例数据,基于第二编码器组阵列(包括多个第二编码器)进行处理,获取第二目标语义编码向量,针对目标患者对应的非影像学检查结果,基于第三编码器组阵列(包括多个第三编码器)进行处理,获取第三目标语义编码向量。基于多头注意力机制,将第一目标语义编码向量与目标患者对应的目标组织CT影像特征进行融合、将第二目标语义编码向量与目标患者对应的目标组织CT影像特征进行融合、将第三目标语义编码向量与目标患者对应的目标组织CT影像特征进行融合,以获取与第一目标语义编码向量对应的第一目标语义特征向量、与第二目标语义编码向量对应的第二目标语义特征向量,以及与第三目标语义编码向量对应的第三目标语义特征向量。
在获取第一目标语义特征向量、第二目标语义特征向量以及第三目标语义特征向量之后,将第一目标语义特征向量、第二目标语义特征向量以及第三目标语义特征向量输入目标组织病灶识别模型,获取目标患者对应的目标组织病灶识别结果。
上述实施过程,可以将医学影像特征与临床经验、患者病例数据以及非影像学检查结果进行融合,实现基于不同的维度进行语义特征提取,进而保证病灶识别的准确度。
在本发明一可选实施例中,在根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成目标语义特征向量组之前,该方法还包括:
对目标患者对应的包括目标组织的CT影像进行目标组织分割,获取目标患者对应的目标组织CT影像;
通过轻量级神经网络对目标患者对应的目标组织CT影像进行医学影像特征提取,获取目标患者对应的目标组织CT影像特征。
在生成目标语义特征向量组时,需要获取目标患者对应的目标组织CT影像特征,由于目标患者对应的目标组织CT影像特征,基于目标患者对应的目标组织CT影像确定,因此需要首先确定目标患者对应的目标组织CT影像。然后通过轻量级神经网络对目标患者对应的目标组织CT影像进行医学影像特征提取,获取目标患者对应的目标组织CT影像特征。
在确定目标患者对应的目标组织CT影像时,可以针对目标患者对应的包括目标组织的CT影像,进行目标组织分割,以获取目标组织CT影像,实现减少病变搜索空间,进行医学影像特征的快速提取。
上述实施过程,通过对包括目标组织的CT影像进行目标组织分割,获取目标组织CT影像,可以减少病变搜索空间,提高医学影像特征的提取效率,通过对目标组织CT影像进行医学影像特征提取,可以为目标组织的病灶识别提供有效数据。
在本发明一可选实施例中,该方法还包括:构建目标组织病灶识别模型,在构建目标组织病灶识别模型时,包括如下步骤:
根据多个患者分别对应的临床数据,获取多个患者对应的多个语义编码向量组,多个患者对应的病变组织均为目标组织;
针对每个语义编码向量组,结合对应的目标组织CT影像特征,生成语义特征向量组,每个患者对应的目标组织CT影像特征基于对应的目标组织CT影像确定,每个患者对应的目标组织CT影像通过对对应的包括目标组织的CT影像进行目标组织分割获取;
根据多个语义特征向量组以及多个患者分别对应的病灶类别标签,进行模型训练,生成目标组织病灶识别模型。
在构建目标组织病灶识别模型时,需要针对多个目标组织发生病变的患者进行数据采集,以获取训练数据,在进行数据采集时,需要针对每个患者,采集对应的临床数据、目标组织CT影像特征以及目标组织的病灶类别标签,基于上述数据构成训练数据,以进行模型训练,下面对模型训练的具体过程进行阐述。
针对每个患者,根据对应的临床数据(包括医生临床经验、患者病例数据以及非影像学检查结果中的至少一类数据)生成包括至少一个语义编码向量的语义编码向量组,其中用于进行模型训练的临床数据所包括的数据种类与目标患者对应的临床数据所包括的数据种类相同。在生成语义编码向量组之后,将语义编码向量组中的每个语义编码向量与该患者对应的目标组织CT影像特征进行融合,生成语义特征向量,进而获取包括至少一个语义特征向量的语义特征向量组。在获取语义特征向量组之后,将语义特征向量组与当前患者对应的病灶类别标签(目标组织的病灶类别标签)作为当前患者的训练数据。其中,患者对应的目标组织CT影像特征基于对应的目标组织CT影像确定,针对每个患者而言,可以对该患者对应的包括目标组织的CT影像进行目标组织分割,以获取目标组织CT影像。
在获取多个患者分别对应的训练数据之后,可以根据多个语义特征向量组以及多个患者分别对应的病灶类别标签,进行模型训练,生成目标组织病灶识别模型。
在进行模型训练时,可以将多个语义特征向量组以及对应的多个病灶类别标签输入训练模型,这里的训练模型可以为预先构建的多流递归神经网络模型。其中多流递归神经网络模型包括至少一个分流架构,且所对应的分流架构的数量与语义特征向量组中对应的语义特征向量的数量相同。如,针对语义特征向量组包括三个语义特征向量的情况,多流递归神经网络模型对应于三个分流架构,语义特征向量1输入对应的分流架构1进行处理、语义特征向量2输入对应的分流架构2进行处理,语义特征向量3输入对应的分流架构3进行处理。其中,病灶类别标签会输入至多流递归神经网络模型对应的其他架构。
将多个训练数据输入训练模型之后,调节训练模型的参数并进行模型训练,在训练模型的损失函数收敛时,训练模型所输出的病灶类别标签与真实病灶类别标签匹配(这里的匹配程序取决于模型性能,可能无法做到完全匹配,仅需做到尽可能匹配,如匹配度达到预设匹配度阈值),此时模型训练完成,可以生成目标组织病灶识别模型。
上述实施过程,通过将多个患者(目标组织发生病变)的语义特征向量组以及患者的病灶类别标签作为训练数据进行模型训练,可以生成目标组织病灶识别模型,以便于基于目标组织病灶识别模型对目标患者的目标组织的病变情况进行准确识别。
以上为本发明实施例提供的基于语义编码的病灶识别方法的实施过程,通过根据目标患者的临床数据获取对应的目标语义编码向量组,根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成目标语义特征向量组,可以基于临床数据和医学影像实现对目标组织内疑似病变的语义特征进行提取,将提取的语义特征输入目标组织病灶识别模型,以对目标患者的目标组织进行病灶识别,可以实现基于相对全面的特征提高病灶识别与疾病诊断的准确性。
进一步的,通过根据医生临床经验、患者病例数据以及非影像学检查结果中的至少一项,生成目标语义编码向量组,实现针对至少一类数据进行语义信息提取,保证语义信息获取的多样性以及全面性。通过对CT影像中的可用信息进行特征提取获取医学影像特征,基于医学影像特征与至少一个目标语义编码向量的融合,实现将医学影像特征与临床经验、患者病例数据以及非影像学检查结果中的至少一项进行融合,可以实现在不同的维度进行语义特征提取,进而保证病灶结果识别的准确度。通过对包括目标组织的CT影像进行目标组织分割,获取目标组织CT影像,可以减少病变搜索空间,提高医学影像特征的提取效率。通过基于多个目标组织发生病变的患者进行数据采集以构建目标组织病灶识别模型,可以保证目标患者的目标组织病灶识别的准确性。
本发明实施例还提供一种基于语义编码的病灶识别装置,如图3所示,该装置包括:
第一获取模块301,用于根据目标患者的临床数据获取对应的目标语义编码向量组,所述目标患者对应的病变组织为目标组织,所述目标语义编码向量组包括至少一个目标语义编码向量;
第一生成模块302,用于根据所述目标语义编码向量组和所述目标患者对应的目标组织CT影像特征,生成包括至少一个目标语义特征向量的目标语义特征向量组,所述目标组织CT影像特征基于所述目标患者对应的目标组织CT影像确定;
第一处理模块303,用于将所述目标语义特征向量组输入目标组织病灶识别模型以识别病灶,获取所述目标患者对应的目标组织病灶识别结果。
可选的,所述临床数据包括医生临床经验、患者病例数据以及非影像学检查结果中的至少一类数据;
所述第一获取模块包括以下子模块至少之一:
第一获取子模块,用于采用第一编码器组阵列对所述医生临床经验进行编码处理,获取第一目标语义编码向量;
第二获取子模块,用于采用第二编码器组阵列对所述患者病例数据进行编码处理,获取第二目标语义编码向量;
第三获取子模块,用于采用第三编码器组阵列对所述非影像学检查结果进行编码处理,获取第三目标语义编码向量;
其中,所述目标语义编码向量组包括所述第一目标语义编码向量、所述第二目标语义编码向量和所述第三目标语义编码向量中的至少一个。
可选的,所述第一生成模块包括:
处理子模块,用于针对所述目标语义编码向量组所包含的所述至少一个目标语义编码向量中的每个所述目标语义编码向量,将当前目标语义编码向量与所述目标组织CT影像特征进行融合,获取对应的所述目标语义特征向量;
生成子模块,用于根据至少一个所述目标语义特征向量生成所述目标语义特征向量组。
可选的,该装置还包括:
第二处理模块,用于对所述目标患者对应的包括所述目标组织的CT影像进行所述目标组织分割,获取所述目标患者对应的目标组织CT影像;
第三处理模块,用于通过轻量级神经网络对所述目标患者对应的目标组织CT影像进行医学影像特征提取,获取所述目标患者对应的目标组织CT影像特征。
可选的,该装置还包括:
第二获取模块,用于根据多个患者分别对应的所述临床数据,获取所述多个患者对应的多个语义编码向量组,所述多个患者对应的病变组织均为所述目标组织;
第二生成模块,用于针对每个所述语义编码向量组,结合对应的目标组织CT影像特征,生成语义特征向量组,每个患者对应的目标组织CT影像特征基于对应的目标组织CT影像确定,每个患者对应的目标组织CT影像通过对对应的包括所述目标组织的CT影像进行所述目标组织分割获取;
第三生成模块,用于根据多个所述语义特征向量组以及所述多个患者分别对应的病灶类别标签,进行模型训练,生成所述目标组织病灶识别模型。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
现有技术中,CT序列的智能分析与处理均采用云计算模式进行,即CT影像预处理、组织分割、病灶特征提取与识别决策等过程全部集中在云计算平台,导致云计算模式会占用大量计算资源与存储空间,资源利用不充分,降低分析决策效率;同时,计算资源的受限致使云计算平台无法承载更多的训练样本,很大程度上限制了模型的泛化能力。由此可见,常规的云计算模式已很难满足日益增长的CT数据在资源受限情况下的应用需求。
针对上述情况,本发明实施例还提供一种基于语义编码的病灶识别系统,以合理分配调度计算资源与存储空间,减少云计算平台的工作负荷,提高病灶检测识别的效率。如图4所示,本发明实施例提供的基于语义编码的病灶识别系统40包括:边缘计算平台41、中间计算平台42以及云计算平台43;
中间计算平台42用于:根据目标患者的临床数据获取对应的目标语义编码向量组,根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成目标语义特征向量组,目标患者对应的病变组织为目标组织,目标语义编码向量组包括至少一个目标语义编码向量,目标语义特征向量组包括至少一个目标语义特征向量;
边缘计算平台41用于:获取目标患者对应的目标组织CT影像,并上传至中间计算平台42,目标患者对应的目标组织CT影像特征由中间计算平台42基于目标患者对应的目标组织CT影像确定;
云计算平台43用于:获取目标语义特征向量组,将目标语义特征向量组输入目标组织病灶识别模型以识别病灶,获取目标患者对应的目标组织病灶识别结果。
本发明实施例提供的基于语义编码的病灶识别系统40包括边缘计算平台41、中间计算平台42以及云计算平台43,其中,边缘计算平台41与中间计算平台42通信连接,中间计算平台42与云计算平台43通信连接,云计算平台43通过中间计算平台42与边缘计算平台41通信连接,云计算平台43也可以直接与边缘计算平台41通信连接。
其中,边缘计算平台41可以获取目标患者(目标组织发生病变的患者)对应的目标组织CT影像,并上传至中间计算平台42,中间计算平台42在获取目标患者对应的目标组织CT影像之后,可以根据目标患者对应的目标组织CT影像,确定目标患者对应的目标组织CT影像特征。
中间计算平台42还可以获取目标患者的临床数据,根据目标患者的临床数据获取对应的目标语义编码向量组,并根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成目标语义特征向量组。目标语义编码向量组包括至少一个目标语义编码向量,相应的,目标语义特征向量组包括至少一个目标语义特征向量。中间计算平台42在生成目标患者对应的目标语义特征向量组之后,上传至云计算平台43。
云计算平台43可以获取目标患者对应的目标语义特征向量组,将目标语义特征向量组输入目标组织病灶识别模型以识别病灶,获取目标患者对应的目标组织病灶识别结果。
本发明实施例提供的基于语义编码的病灶识别系统,通过根据目标患者的临床数据获取对应的目标语义编码向量组,根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成目标语义特征向量组,可以基于临床数据和医学影像实现对目标组织内疑似病变的语义特征进行提取,并通过目标组织病灶识别模型基于语义特征识别病灶,可以实现基于相对全面的特征提高病灶识别与疾病诊断的准确性。
进一步而言,通过将获取目标患者对应的目标组织CT影像、获取目标语义特征向量组以及基于目标组织病灶识别模型获取目标组织病灶识别结果的操作分布在不同的平台上,可以有效节约计算资源并起到很好的信息浓缩与传递作用。
可选的,临床数据包括医生临床经验、患者病例数据以及非影像学检查结果中的至少一类数据;中间计算平台42在根据目标患者的临床数据获取对应的目标语义编码向量组时,还用于执行以下方案至少之一:
采用第一编码器组阵列对医生临床经验进行编码处理,获取第一目标语义编码向量;
采用第二编码器组阵列对患者病例数据进行编码处理,获取第二目标语义编码向量;
采用第三编码器组阵列对非影像学检查结果进行编码处理,获取第三目标语义编码向量;
其中,目标语义编码向量组包括第一目标语义编码向量、第二目标语义编码向量和第三目标语义编码向量中的至少一个。
在临床数据包括医生临床经验的情况下,中间计算平台42可以采用第一编码器组阵列对医生临床经验进行处理,获取第一目标语义编码向量。在临床数据包括患者病例数据的情况下,中间计算平台42可以采用第二编码器组阵列对患者病例数据进行处理,获取第二目标语义编码向量。在临床数据包括非影像学检查结果的情况下,中间计算平台42可以采用第三编码器组阵列对非影像学检查结果进行处理,获取第三目标语义编码向量。其中,具体的实现过程可参见方法测的描述,这里不再进一步阐述。
在临床数据包括医生临床经验时,目标语义编码向量组包括第一目标语义编码向量;在临床数据包括患者病例数据时,目标语义编码向量组包括第二目标语义编码向量;在临床数据包括非影像学检查结果时,目标语义编码向量组包括第三目标语义编码向量。
上述过程,通过根据医生临床经验、患者病例数据以及非影像学检查结果中的至少一项,生成目标语义编码向量组,实现针对至少一类数据进行语义信息获取,保证语义信息获取的多样性以及全面性。
可选的,中间计算平台42在根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成目标语义特征向量组时,还用于:
针对目标语义编码向量组所包含的至少一个目标语义编码向量中的每个目标语义编码向量,将当前目标语义编码向量与目标组织CT影像特征进行融合,获取对应的目标语义特征向量;
根据至少一个目标语义特征向量生成目标语义特征向量组。
中间计算平台42在生成目标语义特征向量组时,可以针对目标语义编码向量组中的每个目标语义编码向量,将当前目标语义编码向量与目标组织CT影像特征进行融合,生成对应的目标语义特征向量。由于目标语义编码向量组包括至少一个目标语义编码向量,可以生成至少一个目标语义特征向量,根据至少一个目标语义特征向量生成目标语义特征向量组。目标患者对应的目标组织CT影像特征,可以基于目标患者对应的目标组织CT影像确定,进而实现基于CT影像提取医学影像特征。
通过对CT影像中的可用信息进行特征提取获取医学影像特征,基于医学影像特征与至少一个目标语义编码向量的融合,实现将医学影像特征与临床经验、患者病例数据以及非影像学检查结果中的至少一项进行融合,可以基于不同的维度进行语义特征提取,进而保证病灶结果识别的准确度。
可选的,边缘计算平台41还用于:对目标患者对应的包括目标组织的CT影像进行目标组织分割,获取目标患者对应的目标组织CT影像;
中间计算平台42还用于:通过轻量级神经网络对目标患者对应的目标组织CT影像进行医学影像特征提取,获取目标患者对应的目标组织CT影像特征。
针对边缘计算平台41而言,在确定目标患者对应的目标组织CT影像时,可以针对目标患者对应的包括目标组织的CT影像,进行目标组织分割,以获取目标组织CT影像,实现减少病变搜索空间,进行医学影像特征的快速提取。
中间计算平台42可以获取边缘计算平台41上传的目标患者对应的目标组织CT影像,然后通过轻量级神经网络对目标患者对应的目标组织CT影像进行医学影像特征提取,获取目标患者对应的目标组织CT影像特征。
通过对包括目标组织的CT影像进行目标组织分割,获取目标组织CT影像,可以减少病变搜索空间,提高医学影像特征的提取效率,通过对目标组织CT影像进行医学影像特征提取,可以为目标组织的病灶识别提供有效数据。
可选的,中间计算平台42还用于:根据多个患者分别对应的临床数据,获取多个患者对应的多个语义编码向量组,针对每个语义编码向量组,结合对应的目标组织CT影像特征,生成语义特征向量组,多个患者对应的病变组织均为目标组织;
边缘计算平台41还用于:针对多个患者中的每个患者所对应的包括目标组织的CT影像,进行目标组织分割,获取多个患者分别对应的目标组织CT影像并上传至中间计算平台42,每个患者对应的目标组织CT影像特征由中间计算平台42基于对应的目标组织CT影像确定;
云计算平台43还用于:根据多个语义特征向量组以及多个患者分别对应的病灶类别标签,进行模型训练,生成目标组织病灶识别模型。
边缘计算平台41可以获取多个患者(目标组织发生病变的患者)中的每一个患者分别对应的包括目标组织的至少一张CT影像,针对每个患者,对其对应的至少一张CT影像进行目标组织的分割,获取当前患者对应的至少一张目标组织CT影像并上传至中间计算平台42,中间计算平台42可以基于至少一张目标组织CT影像,获取当前患者对应的目标组织CT影像特征。
中间计算平台42可以针对多个患者(目标组织发生病变的患者)进行数据采集,以获取训练数据,在进行数据采集时,需要针对每个患者,采集对应的临床数据、目标组织CT影像特征以及目标组织的病灶类别标签,基于上述数据构成训练数据。具体为:针对每个患者,根据对应的临床数据(包括医生临床经验、患者病例数据以及非影像学检查结果中的至少一类数据)生成包括至少一个语义编码向量的语义编码向量组,其中用于进行模型训练的临床数据所包括的数据种类与目标患者对应的临床数据所包括的数据种类相同。在生成语义编码向量组之后,将语义编码向量组中的每个语义编码向量与患者对应的目标组织CT影像特征进行结合,生成语义特征向量,进而获取包括至少一个语义特征向量的语义特征向量组。在获取语义特征向量组之后,将语义特征向量组与当前患者对应的目标组织的病灶类别标签作为当前患者的训练数据。
云计算平台43用于获取中间计算平台42上传的多个患者分别对应的训练数据,根据多个语义特征向量组以及多个患者分别对应的病灶类别标签,进行模型训练,生成目标组织病灶识别模型。
通过根据多个患者的语义特征向量组以及患者的病灶类别标签作为训练数据进行模型训练,可以生成目标组织病灶识别模型,以便于基于目标组织病灶识别模型对目标患者的目标组织的病变情况进行准确识别。
本发明实施例提供的基于语义编码的病灶识别系统,提供了一种实现边缘计算平台与中间计算平台之间、中间计算平台与云计算平台之间的协作交互机制,充分挖掘CT影像以及临床数据蕴含的语义信息,便于病灶的准确识别。
下面通过一具体实例对本发明实施例提供的基于语义编码的病灶识别系统的实施过程进行介绍,参见图5所示,边缘计算平台包括多个边缘计算节点,每个边缘计算节点可以对应于一单个病例(患者),边缘计算节点可以对包括目标组织的CT影像数据进行预处理,并对目标组织进行分割,以减少后续特征提取过程中的疑似病变的搜索空间,降低数据上传量。同时,每个边缘计算节点可以对上层云计算平台通过中间计算平台发送的病灶识别结果进行三维可视化与定量分析,以辅助临床医生进行疾病诊断与定量评估。
由于不同患者的目标组织形态及其内部的病变特性差异较大,因此,目标组织分割与内部病灶的定量分析宜在边缘计算平台进行,各边缘计算节点可对单个病例数据进行个性化处理,也可以协作对某个病例进行处理,节约中间计算平台与云计算平台的计算资源和存储空间。
在进行目标组织分割时,可以采用计算方式进行分割,从计算方式的角度来看,目标组织分割也可以在内存空间较为有限的边缘计算平台处进行处理。这样,云计算平台或者中间计算平台可根据实际需求对边缘计算平台的计算资源进行合理分配与调度,提高目标组织分割的计算效率。
中间计算平台可以依据患者的临床数据以及目标组织CT影像,调用满足实际运算需求的中间计算节点,对患者的目标组织内疑似病变的语义特征进行提取。这些特征不仅包含了基于临床数据确定的语义特征,同时融合了医学影像特征(基于轻量级神经网络对目标组织CT影像进行分析获取)。具体可以为中间计算平台根据患者的临床数据获取语义编码向量组,将语义编码向量组中的至少一个语义编码向量分别与患者对应的目标组织CT影像特征融合,生成语义特征向量组。
中间计算平台将患者对应的语义特征向量组上传至云计算平台进行模型训练或者最终的分析决策。由于边缘计算平台已经对目标组织以外的冗余信息进行了去除,中间计算平台仅对边缘计算平台上传的数据做特征提取,因此,中间计算节点的数量相比边缘计算节点的数量可大幅减少,有效节约计算资源并起到很好的信息浓缩与传递作用,进一步减少上传至云计算平台的数据量,同时有效保护病人隐私。从计算方式的角度看,由于中间计算平台在运算时采用编码器组阵列,因此其运算与存储能力介于边缘计算平台与云计算平台之间。即,中间计算平台单一节点的运算与存储能力大于边缘计算平台的单一节点,且小于云计算平台。
针对云计算平台而言,云计算平台可以预先获取多个患者的语义特征以及病灶类别标签,采用多流递归神经网络等深度学习模型进行联合训练,以生成目标组织病灶识别模型。
云计算平台可以汇集中间计算平台的各个中间计算节点上传的语义特征(语义特征可以为语义特征向量组的形式),采用目标组织病灶识别模型对目标组织各类复杂病灶进行识别决策,剔除假阳性。
由于云计算平台只面向中间计算平台获取语义特征向量,无需利用患者的原始CT序列进行模型训练,大大降低了计算负荷,能够充分利用其计算资源与存储空间,在相同的条件下承载更多的训练样本,提高深度学习模型的泛化能力,进而为病灶的快速精准识别与分析决策提供有力保障。同时,云计算平台还可根据实际需要合理分配与调度中间计算平台及边缘计算平台的计算资源,以最大化整体资源利用率。
优选的,本发明实施例还提供了一种电子设备,包括:处理器,存储器,存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述基于语义编码的病灶识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
举例如下,图6示出了一种电子设备的实体结构示意图。
如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令。处理器610用于执行以下步骤:根据目标患者的临床数据获取对应的目标语义编码向量组,目标患者对应的病变组织为目标组织,目标语义编码向量组包括至少一个目标语义编码向量;根据目标语义编码向量组和目标患者对应的目标组织CT影像特征,生成包括至少一个目标语义特征向量的目标语义特征向量组,目标组织CT影像特征基于目标患者对应的目标组织CT影像确定;将目标语义特征向量组输入目标组织病灶识别模型以识别病灶,获取目标患者对应的目标组织病灶识别结果。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述基于语义编码的病灶识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
本领域普通技术人员可以意识到,结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (11)

1.一种基于语义编码的病灶识别方法,其特征在于,包括:
根据目标患者的临床数据获取对应的目标语义编码向量组,所述目标患者对应的病变组织为目标组织,所述目标语义编码向量组包括至少一个目标语义编码向量,所述临床数据包括医生临床经验、患者病例数据以及非影像学检查结果,所述医生临床经验包括主治医生的经验以及专家会诊经验;
根据所述目标语义编码向量组和所述目标患者对应的目标组织CT影像特征,生成包括至少一个目标语义特征向量的目标语义特征向量组,所述目标组织CT影像特征基于所述目标患者对应的目标组织CT影像确定;
将所述目标语义特征向量组输入目标组织病灶识别模型以识别病灶,获取所述目标患者对应的目标组织病灶识别结果;
所述根据所述目标语义编码向量组和所述目标患者对应的目标组织CT影像特征,生成包括至少一个目标语义特征向量的目标语义特征向量组,包括:
针对所述目标语义编码向量组所包含的所述至少一个目标语义编码向量中的每个所述目标语义编码向量,将当前目标语义编码向量与所述目标组织CT影像特征进行融合,获取对应的所述目标语义特征向量;
根据至少一个所述目标语义特征向量生成所述目标语义特征向量组。
2.根据权利要求1所述的方法,其特征在于,所述根据目标患者的临床数据获取对应的目标语义编码向量组,包括:
采用第一编码器组阵列对所述医生临床经验进行编码处理,获取第一目标语义编码向量;
采用第二编码器组阵列对所述患者病例数据进行编码处理,获取第二目标语义编码向量;
采用第三编码器组阵列对所述非影像学检查结果进行编码处理,获取第三目标语义编码向量;
其中,所述目标语义编码向量组包括所述第一目标语义编码向量、所述第二目标语义编码向量和所述第三目标语义编码向量。
3.根据权利要求1所述的方法,其特征在于,还包括:
对所述目标患者对应的包括所述目标组织的CT影像进行所述目标组织分割,获取所述目标患者对应的目标组织CT影像;
通过轻量级神经网络对所述目标患者对应的目标组织CT影像进行医学影像特征提取,获取所述目标患者对应的目标组织CT影像特征。
4.根据权利要求1或2所述的方法,其特征在于,还包括:
根据多个患者分别对应的所述临床数据,获取所述多个患者对应的多个语义编码向量组,所述多个患者对应的病变组织均为所述目标组织;
针对每个所述语义编码向量组,结合对应的目标组织CT影像特征,生成语义特征向量组,每个患者对应的目标组织CT影像特征基于对应的目标组织CT影像确定,每个患者对应的目标组织CT影像通过对对应的包括所述目标组织的CT影像进行所述目标组织分割获取;
根据多个所述语义特征向量组以及所述多个患者分别对应的病灶类别标签,进行模型训练,生成所述目标组织病灶识别模型。
5.一种基于语义编码的病灶识别装置,其特征在于,包括:
第一获取模块,用于根据目标患者的临床数据获取对应的目标语义编码向量组,所述目标患者对应的病变组织为目标组织,所述目标语义编码向量组包括至少一个目标语义编码向量,所述临床数据包括医生临床经验、患者病例数据以及非影像学检查结果,所述医生临床经验包括主治医生的经验以及专家会诊经验;
第一生成模块,用于根据所述目标语义编码向量组和所述目标患者对应的目标组织CT影像特征,生成包括至少一个目标语义特征向量的目标语义特征向量组,所述目标组织CT影像特征基于所述目标患者对应的目标组织CT影像确定;
第一处理模块,用于将所述目标语义特征向量组输入目标组织病灶识别模型以识别病灶,获取所述目标患者对应的目标组织病灶识别结果;
所述第一生成模块包括:
处理子模块,用于针对所述目标语义编码向量组所包含的所述至少一个目标语义编码向量中的每个所述目标语义编码向量,将当前目标语义编码向量与所述目标组织CT影像特征进行融合,获取对应的所述目标语义特征向量;
生成子模块,用于根据至少一个所述目标语义特征向量生成所述目标语义特征向量组。
6.一种基于语义编码的病灶识别系统,其特征在于,包括边缘计算平台、中间计算平台以及云计算平台;
所述中间计算平台用于:根据目标患者的临床数据获取对应的目标语义编码向量组,根据所述目标语义编码向量组和所述目标患者对应的目标组织CT影像特征,生成目标语义特征向量组,所述目标患者对应的病变组织为目标组织,所述目标语义编码向量组包括至少一个目标语义编码向量,所述目标语义特征向量组包括至少一个目标语义特征向量,所述临床数据包括医生临床经验、患者病例数据以及非影像学检查结果,所述医生临床经验包括主治医生的经验以及专家会诊经验;
所述边缘计算平台用于:获取所述目标患者对应的目标组织CT影像,并上传至所述中间计算平台,所述目标患者对应的目标组织CT影像特征由所述中间计算平台基于所述目标患者对应的目标组织CT影像确定;
所述云计算平台用于:获取所述目标语义特征向量组,将所述目标语义特征向量组输入目标组织病灶识别模型以识别病灶,获取所述目标患者对应的目标组织病灶识别结果;
所述中间计算平台在根据所述目标语义编码向量组和所述目标患者对应的目标组织CT影像特征,生成目标语义特征向量组时,还用于:
针对所述目标语义编码向量组所包含的所述至少一个目标语义编码向量中的每个所述目标语义编码向量,将当前目标语义编码向量与所述目标组织CT影像特征进行融合,获取对应的所述目标语义特征向量;
根据至少一个所述目标语义特征向量生成所述目标语义特征向量组。
7.根据权利要求6所述的系统,其特征在于,所述中间计算平台在根据目标患者的临床数据获取对应的目标语义编码向量组时,还用于执行以下方案:
采用第一编码器组阵列对所述医生临床经验进行编码处理,获取第一目标语义编码向量;
采用第二编码器组阵列对所述患者病例数据进行编码处理,获取第二目标语义编码向量;
采用第三编码器组阵列对所述非影像学检查结果进行编码处理,获取第三目标语义编码向量;
其中,所述目标语义编码向量组包括所述第一目标语义编码向量、所述第二目标语义编码向量和所述第三目标语义编码向量。
8.根据权利要求6所述的系统,其特征在于,所述边缘计算平台还用于:对所述目标患者对应的包括所述目标组织的CT影像进行所述目标组织分割,获取所述目标患者对应的目标组织CT影像;
所述中间计算平台还用于:通过轻量级神经网络对所述目标患者对应的目标组织CT影像进行医学影像特征提取,获取所述目标患者对应的目标组织CT影像特征。
9.根据权利要求6或7所述的系统,其特征在于,所述中间计算平台还用于:根据多个患者分别对应的所述临床数据,获取所述多个患者对应的多个语义编码向量组,针对每个所述语义编码向量组,结合对应的目标组织CT影像特征,生成语义特征向量组,所述多个患者对应的病变组织均为所述目标组织;
所述边缘计算平台还用于:针对所述多个患者中的每个患者所对应的包括所述目标组织的CT影像,进行所述目标组织分割,获取所述多个患者分别对应的目标组织CT影像并上传至所述中间计算平台,每个患者对应的目标组织CT影像特征由所述中间计算平台基于对应的目标组织CT影像确定;
所述云计算平台还用于:根据多个所述语义特征向量组以及所述多个患者分别对应的病灶类别标签,进行模型训练,生成所述目标组织病灶识别模型。
10.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至4任一项所述的基于语义编码的病灶识别方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的基于语义编码的病灶识别方法的步骤。
CN202110882517.8A 2021-08-02 2021-08-02 基于语义编码的病灶识别方法、装置及系统 Active CN113743414B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110882517.8A CN113743414B (zh) 2021-08-02 2021-08-02 基于语义编码的病灶识别方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110882517.8A CN113743414B (zh) 2021-08-02 2021-08-02 基于语义编码的病灶识别方法、装置及系统

Publications (2)

Publication Number Publication Date
CN113743414A CN113743414A (zh) 2021-12-03
CN113743414B true CN113743414B (zh) 2022-08-05

Family

ID=78729800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110882517.8A Active CN113743414B (zh) 2021-08-02 2021-08-02 基于语义编码的病灶识别方法、装置及系统

Country Status (1)

Country Link
CN (1) CN113743414B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110619322A (zh) * 2019-10-18 2019-12-27 武汉大学 一种基于多流态卷积循环神经网络的多导联心电异常信号识别方法及系统
CN110717518A (zh) * 2019-09-10 2020-01-21 北京深睿博联科技有限责任公司 基于3d卷积神经网络的持续性肺结节识别方法及装置
CN111179231A (zh) * 2019-12-20 2020-05-19 上海联影智能医疗科技有限公司 图像处理方法、装置、设备和存储介质
CN111209916A (zh) * 2019-12-31 2020-05-29 中国科学技术大学 病灶识别方法及系统、识别设备
CN111639548A (zh) * 2020-05-11 2020-09-08 华南理工大学 一种基于门的视频上下文多模态感知特征优化方法
CN111916207A (zh) * 2020-08-07 2020-11-10 杭州深睿博联科技有限公司 一种基于多模态融合的疾病识别方法及装置
CN112216379A (zh) * 2019-07-12 2021-01-12 刘璐 一种基于智能联合学习的疾病诊断系统
CN112802566A (zh) * 2020-12-31 2021-05-14 医渡云(北京)技术有限公司 一种电子病历的编码方法及装置
CN113077434A (zh) * 2021-03-30 2021-07-06 零氪智慧医疗科技(天津)有限公司 基于多模态信息的肺癌识别方法、装置及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110246109B (zh) * 2019-05-15 2022-03-18 清华大学 融合ct影像和个性化信息的分析系统、方法、装置及介质
CN113052831B (zh) * 2021-04-14 2024-04-23 清华大学 脑部医学影像异常检测方法、装置、设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112216379A (zh) * 2019-07-12 2021-01-12 刘璐 一种基于智能联合学习的疾病诊断系统
CN110717518A (zh) * 2019-09-10 2020-01-21 北京深睿博联科技有限责任公司 基于3d卷积神经网络的持续性肺结节识别方法及装置
CN110619322A (zh) * 2019-10-18 2019-12-27 武汉大学 一种基于多流态卷积循环神经网络的多导联心电异常信号识别方法及系统
CN111179231A (zh) * 2019-12-20 2020-05-19 上海联影智能医疗科技有限公司 图像处理方法、装置、设备和存储介质
CN111209916A (zh) * 2019-12-31 2020-05-29 中国科学技术大学 病灶识别方法及系统、识别设备
CN111639548A (zh) * 2020-05-11 2020-09-08 华南理工大学 一种基于门的视频上下文多模态感知特征优化方法
CN111916207A (zh) * 2020-08-07 2020-11-10 杭州深睿博联科技有限公司 一种基于多模态融合的疾病识别方法及装置
CN112802566A (zh) * 2020-12-31 2021-05-14 医渡云(北京)技术有限公司 一种电子病历的编码方法及装置
CN113077434A (zh) * 2021-03-30 2021-07-06 零氪智慧医疗科技(天津)有限公司 基于多模态信息的肺癌识别方法、装置及存储介质

Also Published As

Publication number Publication date
CN113743414A (zh) 2021-12-03

Similar Documents

Publication Publication Date Title
CN109166130B (zh) 一种图像处理方法及图像处理装置
Frid-Adar et al. GAN-based synthetic medical image augmentation for increased CNN performance in liver lesion classification
WO2020151536A1 (zh) 一种脑部图像分割方法、装置、网络设备和存储介质
CN109919928B (zh) 医学影像的检测方法、装置和存储介质
CN109544518B (zh) 一种应用于骨骼成熟度评估的方法及其系统
Li et al. When medical images meet generative adversarial network: recent development and research opportunities
CN110246109B (zh) 融合ct影像和个性化信息的分析系统、方法、装置及介质
CN111584046B (zh) 一种医学影像数据ai处理方法
CN111368849A (zh) 图像处理方法、装置、电子设备及存储介质
Tursynova et al. 3D U-Net for brain stroke lesion segmentation on ISLES 2018 dataset
CN113707264A (zh) 基于机器学习的药物推荐方法、装置、设备及介质
CN115994902A (zh) 医学图像分析方法、电子设备及存储介质
CN113706441A (zh) 一种基于人工智能的图像预测方法、相关装置及存储介质
CN113688862A (zh) 一种基于半监督联邦学习的脑影像分类方法及终端设备
CN112971718A (zh) 证候识别方法、装置、电子设备及存储介质
CN117237351B (zh) 一种超声图像分析方法以及相关装置
Yu et al. 3D Medical Image Segmentation based on multi-scale MPU-Net
CN116524248B (zh) 医学数据处理装置、方法及分类模型训练装置
CN115115570A (zh) 医学图像分析方法和装置、计算机设备及存储介质
CN113724185A (zh) 用于图像分类的模型处理方法、装置及存储介质
CN112767374A (zh) 基于mri的阿尔茨海默症病灶区域语义分割算法
CN113743414B (zh) 基于语义编码的病灶识别方法、装置及系统
CN116993699A (zh) 一种眼动辅助训练下的医学图像分割方法及系统
CN116664592A (zh) 基于图像的动静脉血管分离方法、装置、电子设备及介质
Huo Full-stack application of skin cancer diagnosis based on CNN Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant