CN117894482A - 一种医学肿瘤的编码方法、系统、电子设备及存储介质 - Google Patents

一种医学肿瘤的编码方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN117894482A
CN117894482A CN202410289076.4A CN202410289076A CN117894482A CN 117894482 A CN117894482 A CN 117894482A CN 202410289076 A CN202410289076 A CN 202410289076A CN 117894482 A CN117894482 A CN 117894482A
Authority
CN
China
Prior art keywords
tumor
icd10
morphology
vectorization
standardized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410289076.4A
Other languages
English (en)
Inventor
郭鹏
邓小宁
史浩田
浦飞飞
张海音
蒋昕
唐倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North Health Medical Big Data Technology Co ltd
Original Assignee
North Health Medical Big Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North Health Medical Big Data Technology Co ltd filed Critical North Health Medical Big Data Technology Co ltd
Priority to CN202410289076.4A priority Critical patent/CN117894482A/zh
Publication of CN117894482A publication Critical patent/CN117894482A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明实施例提供一种医学肿瘤的编码方法、系统、电子设备及存储介质,属于医学术语标准化领域。该方法包括:采用预先训练好的肿瘤ICD10小样本对比模型、肿瘤形态学小样本对比模型对肿瘤ICD10术语、肿瘤形态学进行编码,获得肿瘤ICD10标准术语、肿瘤形态学标准化术语集合向量化表示;分别将肿瘤ICD10和肿瘤形态学向量化表示对应放入肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中;输入待标准化的医学术语至肿瘤分类模型,获得待标准化的医学术语肿瘤形态学/ICD10向量化表示,并从肿瘤ICD10、肿瘤形态学向量化搜索引擎中搜索,获取相似的标准化术语。通过小样本对比学习结合肿瘤分类模型,同时获得肿瘤形态学编码以及肿瘤ICD10编码,提高了肿瘤编码效率和准确性。

Description

一种医学肿瘤的编码方法、系统、电子设备及存储介质
技术领域
本发明涉及医学术语标准化技术领域,具体地涉及一种医学肿瘤的编码方法、系统、电子设备及存储介质。
背景技术
医学术语标准化是将不同来源或格式的医学术语统一为一种标准形式的过程,旨在实现数据的互操作性。肿瘤编码是医疗记录和研究的重要组成部分,肿瘤编码涉及根据肿瘤的解剖位置和形态特征进行分类,在国内ICD10医保2.0版本被广泛使用。这对于数据要素共享、医疗决策支持系统、医疗科学研究等都至关重要。
对于肿瘤的编码需要同时输出两个编码,一种是疾病的ICD10编码,另一种是肿瘤的形态学编码。此外,医生在记录病人信息时可能会使用各种缩写、同义词和非正式的术语,这进一步增加了标准化的复杂性。
现有的医学术语标准化方法无法同时输出ICD10编码以及肿瘤形态学编码,效率低下,而且需要大量人工标注大量医学术语数据。
发明内容
在 ICD 中,肿瘤的分类包含两个方面的内容:部位编码以及形态学编码,二者需要配合使用,缺一不可。其中,肿瘤的部位编码包含了两个分类轴心,一个是动态,也就是大家经常说到的恶性、良性、原位、未肯定、继发性;另外一个非常重要的分类轴心就是解剖部位。
本发明实施例的目的是提供一种医学肿瘤的编码方法、系统、电子设备及存储介质,用于通过肿瘤分类模型自动识别是否为肿瘤疾病,并同时输出ICD10编码和肿瘤形态学编码,提高编码效率和准确性。
为了实现上述目的,本发明实施例提供一种医学肿瘤的编码方法,包括:
采用预先训练好的肿瘤ICD10小样本对比模型对肿瘤ICD10术语进行编码,获得肿瘤ICD10标准术语集合向量化表示;
采用预先训练好肿瘤形态学小样本对比模型对肿瘤形态学进行编码,获得肿瘤形态学标准化术语集合向量化表示;
分别将所述肿瘤ICD10标准术语集合向量化表示和所述肿瘤形态学标准化术语集合向量化表示对应放入肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中;
输入待标准化的医学术语至预先训练好的肿瘤分类模型,获得待标准化的医学术语肿瘤形态学/ICD10向量化表示,并根据待标准化的医学术语肿瘤形态学/ICD10向量化表示从肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中进行搜索,获取相似的标准化术语。
可选的,所述肿瘤ICD10小样本对比模型和所述肿瘤形态学小样本对比模型是基于小样本对比学习算法构建并训练的。
可选的,所述预先训练好的肿瘤分类模型是基于TextCNN算法构建的。
可选的,所述预先训练好的肿瘤分类模型的结构包括卷积层、激活层、池化层、全连接层以及输出层。
可选的,所述肿瘤分类模型的训练过程包括:
收集肿瘤诊断和非肿瘤诊断数据,并由医学专家人工标注是否是肿瘤诊断,获得标注数据;
对收集到的肿瘤诊断和非肿瘤诊断数据进行标准化处理,并使用中文词向量将标准化处理后的肿瘤诊断和非肿瘤诊断数据的格式转换成向量形式;
根据转换成向量形式的肿瘤诊断和非肿瘤诊断数据以及标注数据训练肿瘤分类模型。
可选的,所述根据转换成向量形式的肿瘤诊断和非肿瘤诊断数据以及标注数据训练肿瘤分类模型,包括:
将转换成向量形式的肿瘤诊断和非肿瘤诊断数据输入至肿瘤分类模型的卷积层,获得特征数据;
将所述特征数据输入至激活层,从而获取更复杂的特征数据,并传输池化层获得目标特征数据;
通过全连接层对目标特征进行融合,并经输出层分类获得分类结果;
使用交叉损失函数计算分类结果与标注数据之间的差值,利用优化算法调整肿瘤分类模型的参数,获得训练好的肿瘤分类模型。
另一方面,本发明提供一种医学肿瘤的编码系统,包括:
第一编码单元,用于采用预先训练好的肿瘤ICD10小样本对比模型对肿瘤ICD10术语进行编码,获得肿瘤ICD10标准术语集合向量化表示;
第二编码单元,用于采用预先训练好肿瘤形态学小样本对比模型对肿瘤形态学进行编码,获得肿瘤形态学标准化术语集合向量化表示;
存储单元,用于分别将所述肿瘤ICD10标准术语集合向量化表示和所述肿瘤形态学标准化术语集合向量化表示对应放入肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中;
搜索单元,用于输入待标准化的医学术语至预先训练好的肿瘤分类模型,获得待标准化的医学术语肿瘤形态学/ICD10向量化表示,并根据待标准化的医学术语肿瘤形态学/ICD10向量化表示从肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中进行搜索,获取相似的标准化术语。
另一方面,本发明提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上进行运行的计算机程序,所述处理器执行所述程序时实现上述所述的编码方法的步骤。
另一方面,本发明提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的编码方法的步骤。
通过上述技术方案,通过小样本对比学习结合肿瘤分类模型同时获得肿瘤形态学编码以及肿瘤ICD10编码,提高了肿瘤编码效率和准确性,而且通过小样本对比学习算法,减少了所需标注数量。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1是本发明实施例提供的一种医学肿瘤的编码方法的实施流程图;
图2是本发明实施例提供的一种医学肿瘤的编码方法的详细实施流程图;
图3是本发明实施例提供的一种医学肿瘤的编码系统的结构示意图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
参阅图1所示,为本发明实施例提供的一种医学肿瘤的编码方法的实施流程图,包括以下步骤:
步骤100:采用预先训练好的肿瘤ICD10小样本对比模型对肿瘤ICD10术语进行编码,获得肿瘤ICD10标准术语集合向量化表示。
优选的,所述肿瘤ICD10小样本对比模型是基于小样本对比学习算法构建并训练的。
步骤101:采用预先训练好肿瘤形态学小样本对比模型对肿瘤形态学进行编码,获得肿瘤形态学标准化术语集合向量化表示。
优选的,所述肿瘤形态学小样本对比模型是基于小样本对比学习算法构建并训练的。
步骤102:分别将所述肿瘤ICD10标准术语集合向量化表示和所述肿瘤形态学标准化术语集合向量化表示对应放入肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中。
这样,可以通过向量化搜索引擎提高响应速度。
步骤103:输入待标准化的医学术语至预先训练好的肿瘤分类模型,获得待标准化的医学术语肿瘤形态学/ICD10向量化表示,并根据待标准化的医学术语肿瘤形态学/ICD10向量化表示从肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中进行搜索,获取相似的标准化术语。
优选的,所述预先训练好的肿瘤分类模型是基于TextCNN算法构建的。
其中,所述预先训练好的肿瘤分类模型的结构包括卷积层、激活层、池化层、全连接层以及输出层。
在一些实施方式中,所述肿瘤分类模型的训练过程包括以下步骤:
S1:收集肿瘤诊断和非肿瘤诊断数据,并由医学专家人工标注是否是肿瘤诊断,获得标注数据。
S2:对收集到的肿瘤诊断和非肿瘤诊断数据进行标准化处理,并使用中文词向量将标准化处理后的肿瘤诊断和非肿瘤诊断数据的格式转换成向量形式。
可选的,肿瘤诊断和非肿瘤诊断数据的标准化处理,如统一英文字母大小写、统一标点符号等。
通过使用中文词向量将标准化处理后的肿瘤诊断和非肿瘤诊断数据的格式转换成向量形式,主要是为了确保文本转换成CNN处理的格式。
S3:根据转换成向量形式的肿瘤诊断和非肿瘤诊断数据以及标注数据训练肿瘤分类模型。
具体的,在执行步骤S3时可以具体执行以下步骤:
S30:将转换成向量形式的肿瘤诊断和非肿瘤诊断数据输入至肿瘤分类模型的卷积层,获得特征数据。
S31:将所述特征数据输入至激活层,从而获取更复杂的特征数据,并传输池化层获得目标特征数据。
S32:通过全连接层对目标特征进行融合,并经输出层分类获得分类结果。
S33:使用交叉损失函数计算分类结果与标注数据之间的差值,利用优化算法调整肿瘤分类模型的参数,获得训练好的肿瘤分类模型。
参阅图2所示,为本发明实施例提供的一种医学肿瘤的编码方法的详细实施流程图,包括以下执行步骤:
S200:训练肿瘤ICD10小样本对比模型和肿瘤形态学小样本对比模型。
S201:获得肿瘤ICD10标准化术语集合向量化表示和肿瘤形态学标准化术语集合向量化表示。
S202:将向量化表示放入到肿瘤ICD10向量化搜索引擎、将向量化表示放入到肿瘤ICD10向量化搜索引擎。
S203:收集肿瘤和非肿瘤的数据并标注并进行标准化。
S204:使用词向量将诊断向量化,并训练TextCNN模型。
S205:根据TextCNN模型判断是否是肿瘤疾病,若是,则执行步骤S206。
S206:获取待标准化的医学术语肿瘤形态学/ICD10向量化表示。
S207:在肿瘤形态学向量化搜索引擎搜索相似度,获得标准化术语。
S208:在肿瘤ICD10向量化搜索引擎搜索相似度,获得标准化术语。
通过上述技术方案,通过小样本对比学习结合肿瘤分类模型同时获得肿瘤形态学编码以及肿瘤ICD10编码,提高了肿瘤编码效率和准确性,而且通过小样本对比学习算法,减少了所需标注数量。
参阅图3所示,为本发明实施例提供的一种医学肿瘤的编码系统的结构示意图,包括:
第一编码单元300,用于采用预先训练好的肿瘤ICD10小样本对比模型对肿瘤ICD10术语进行编码,获得肿瘤ICD10标准术语集合向量化表示;
第二编码单元301,用于采用预先训练好肿瘤形态学小样本对比模型对肿瘤形态学进行编码,获得肿瘤形态学标准化术语集合向量化表示;
存储单元302,用于分别将所述肿瘤ICD10标准术语集合向量化表示和所述肿瘤形态学标准化术语集合向量化表示对应放入肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中;
搜索单元303,用于输入待标准化的医学术语至预先训练好的肿瘤分类模型,获得待标准化的医学术语肿瘤形态学/ICD10向量化表示,并根据待标准化的医学术语肿瘤形态学/ICD10向量化表示从肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中进行搜索,获取相似的标准化术语。
另一方面,本发明实施例还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上进行运行的计算机程序,所述处理器执行所述程序时实现上述任一项实施例所述的编码方法的步骤。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项实施例所述的编码方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (9)

1.一种医学肿瘤的编码方法,其特征在于,包括:
采用预先训练好的肿瘤ICD10小样本对比模型对肿瘤ICD10术语进行编码,获得肿瘤ICD10标准术语集合向量化表示;
采用预先训练好肿瘤形态学小样本对比模型对肿瘤形态学进行编码,获得肿瘤形态学标准化术语集合向量化表示;
分别将所述肿瘤ICD10标准术语集合向量化表示和所述肿瘤形态学标准化术语集合向量化表示对应放入肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中;
输入待标准化的医学术语至预先训练好的肿瘤分类模型,获得待标准化的医学术语肿瘤形态学/ICD10向量化表示,并根据待标准化的医学术语肿瘤形态学/ICD10向量化表示从肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中进行搜索,获取相似的标准化术语。
2.根据权利要求1所述的编码方法,其特征在于,所述肿瘤ICD10小样本对比模型和所述肿瘤形态学小样本对比模型是基于小样本对比学习算法构建并训练的。
3.根据权利要求1所述的编码方法,其特征在于,所述预先训练好的肿瘤分类模型是基于TextCNN算法构建的。
4.根据权利要求1所述的编码方法,其特征在于,所述预先训练好的肿瘤分类模型的结构包括卷积层、激活层、池化层、全连接层以及输出层。
5.根据权利要求4所述的编码方法,其特征在于,肿瘤分类模型的训练过程包括:
收集肿瘤诊断和非肿瘤诊断数据,并由医学专家人工标注是否是肿瘤诊断,获得标注数据;
对收集到的肿瘤诊断和非肿瘤诊断数据进行标准化处理,并使用中文词向量将标准化处理后的肿瘤诊断和非肿瘤诊断数据的格式转换成向量形式;
根据转换成向量形式的肿瘤诊断和非肿瘤诊断数据以及标注数据训练肿瘤分类模型。
6.根据权利要求5所述的编码方法,其特征在于,所述根据转换成向量形式的肿瘤诊断和非肿瘤诊断数据以及标注数据训练肿瘤分类模型,包括:
将转换成向量形式的肿瘤诊断和非肿瘤诊断数据输入至肿瘤分类模型的卷积层,获得特征数据;
将所述特征数据输入至激活层,从而获取更复杂的特征数据,并传输池化层获得目标特征数据;
通过全连接层对目标特征进行融合,并经输出层分类获得分类结果;
使用交叉损失函数计算分类结果与标注数据之间的差值,利用优化算法调整肿瘤分类模型的参数,获得训练好的肿瘤分类模型。
7.一种医学肿瘤的编码系统,其特征在于,包括:
第一编码单元,用于采用预先训练好的肿瘤ICD10小样本对比模型对肿瘤ICD10术语进行编码,获得肿瘤ICD10标准术语集合向量化表示;
第二编码单元,用于采用预先训练好肿瘤形态学小样本对比模型对肿瘤形态学进行编码,获得肿瘤形态学标准化术语集合向量化表示;
存储单元,用于分别将所述肿瘤ICD10标准术语集合向量化表示和所述肿瘤形态学标准化术语集合向量化表示对应放入肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中;
搜索单元,用于输入待标准化的医学术语至预先训练好的肿瘤分类模型,获得待标准化的医学术语肿瘤形态学/ICD10向量化表示,并根据待标准化的医学术语肿瘤形态学/ICD10向量化表示从肿瘤ICD10向量化搜索引擎和肿瘤形态学向量化搜索引擎中进行搜索,获取相似的标准化术语。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上进行运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6任一项所述的编码方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6任一项所述的编码方法的步骤。
CN202410289076.4A 2024-03-14 2024-03-14 一种医学肿瘤的编码方法、系统、电子设备及存储介质 Pending CN117894482A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410289076.4A CN117894482A (zh) 2024-03-14 2024-03-14 一种医学肿瘤的编码方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410289076.4A CN117894482A (zh) 2024-03-14 2024-03-14 一种医学肿瘤的编码方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117894482A true CN117894482A (zh) 2024-04-16

Family

ID=90639742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410289076.4A Pending CN117894482A (zh) 2024-03-14 2024-03-14 一种医学肿瘤的编码方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117894482A (zh)

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110106740A1 (en) * 2002-05-24 2011-05-05 University Of South Florida Tissue classification method for diagnosis and treatment of tumors
CN106919793A (zh) * 2017-02-24 2017-07-04 黑龙江特士信息技术有限公司 一种医疗大数据的数据标准化处理方法及装置
CN112132917A (zh) * 2020-08-27 2020-12-25 盐城工学院 一种直肠癌淋巴结转移的智能诊断方法
CN112542223A (zh) * 2020-12-21 2021-03-23 西南科技大学 一种从中文电子病历构建医疗知识图谱的半监督学习方法
WO2021088747A1 (zh) * 2019-11-04 2021-05-14 中国人民解放军总医院 基于深度学习的预测消融术后肝脏肿瘤形态变化的方法
CN113255353A (zh) * 2021-05-31 2021-08-13 中国科学院计算技术研究所厦门数据智能研究院 一种实体标准化方法
CN113593661A (zh) * 2021-07-07 2021-11-02 青岛国新健康产业科技有限公司 临床术语标准化方法、装置、电子设备及存储介质
CN113779996A (zh) * 2021-08-31 2021-12-10 中国中医科学院中医药信息研究所 基于BiLSTM模型的标准实体文本确定方法、装置及存储介质
CN115132372A (zh) * 2022-04-29 2022-09-30 腾讯科技(深圳)有限公司 术语处理方法、装置、电子设备、存储介质及程序产品
CN116721778A (zh) * 2023-08-10 2023-09-08 北方健康医疗大数据科技有限公司 一种医学术语标准化方法、系统、设备及介质
CN116738985A (zh) * 2023-08-11 2023-09-12 北京亚信数据有限公司 医学文本的标准化处理方法及装置
CN116978543A (zh) * 2023-06-26 2023-10-31 中日友好医院(中日友好临床医学研究所) 人工智能辅助骨髓肿瘤病理诊断装置
CN117038099A (zh) * 2023-09-08 2023-11-10 联仁健康医疗大数据科技股份有限公司 医疗类术语标准化方法以及装置
CN117271804A (zh) * 2023-11-21 2023-12-22 之江实验室 一种共病特征知识库生成方法、装置、设备及介质
CN117351484A (zh) * 2023-10-12 2024-01-05 深圳市前海高新国际医疗管理有限公司 基于ai的肿瘤干细胞特征提取及分类系统
CN117454843A (zh) * 2023-11-14 2024-01-26 生命奇点(北京)科技有限公司 一种基于电子病历问答模型的数据预处理系统
CN117556034A (zh) * 2023-11-14 2024-02-13 生命奇点(北京)科技有限公司 一种对电子病历问答模型输出结果标准化的数据处理系统
CN117633148A (zh) * 2023-10-30 2024-03-01 三峡大学 一种基于融合多策略对比学习的医学术语标准化方法

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110106740A1 (en) * 2002-05-24 2011-05-05 University Of South Florida Tissue classification method for diagnosis and treatment of tumors
CN106919793A (zh) * 2017-02-24 2017-07-04 黑龙江特士信息技术有限公司 一种医疗大数据的数据标准化处理方法及装置
WO2021088747A1 (zh) * 2019-11-04 2021-05-14 中国人民解放军总医院 基于深度学习的预测消融术后肝脏肿瘤形态变化的方法
CN112132917A (zh) * 2020-08-27 2020-12-25 盐城工学院 一种直肠癌淋巴结转移的智能诊断方法
CN112542223A (zh) * 2020-12-21 2021-03-23 西南科技大学 一种从中文电子病历构建医疗知识图谱的半监督学习方法
CN113255353A (zh) * 2021-05-31 2021-08-13 中国科学院计算技术研究所厦门数据智能研究院 一种实体标准化方法
CN113593661A (zh) * 2021-07-07 2021-11-02 青岛国新健康产业科技有限公司 临床术语标准化方法、装置、电子设备及存储介质
CN113779996A (zh) * 2021-08-31 2021-12-10 中国中医科学院中医药信息研究所 基于BiLSTM模型的标准实体文本确定方法、装置及存储介质
CN115132372A (zh) * 2022-04-29 2022-09-30 腾讯科技(深圳)有限公司 术语处理方法、装置、电子设备、存储介质及程序产品
CN116978543A (zh) * 2023-06-26 2023-10-31 中日友好医院(中日友好临床医学研究所) 人工智能辅助骨髓肿瘤病理诊断装置
CN116721778A (zh) * 2023-08-10 2023-09-08 北方健康医疗大数据科技有限公司 一种医学术语标准化方法、系统、设备及介质
CN116738985A (zh) * 2023-08-11 2023-09-12 北京亚信数据有限公司 医学文本的标准化处理方法及装置
CN117038099A (zh) * 2023-09-08 2023-11-10 联仁健康医疗大数据科技股份有限公司 医疗类术语标准化方法以及装置
CN117351484A (zh) * 2023-10-12 2024-01-05 深圳市前海高新国际医疗管理有限公司 基于ai的肿瘤干细胞特征提取及分类系统
CN117633148A (zh) * 2023-10-30 2024-03-01 三峡大学 一种基于融合多策略对比学习的医学术语标准化方法
CN117454843A (zh) * 2023-11-14 2024-01-26 生命奇点(北京)科技有限公司 一种基于电子病历问答模型的数据预处理系统
CN117556034A (zh) * 2023-11-14 2024-02-13 生命奇点(北京)科技有限公司 一种对电子病历问答模型输出结果标准化的数据处理系统
CN117271804A (zh) * 2023-11-21 2023-12-22 之江实验室 一种共病特征知识库生成方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李谊澄;侯锐志;邹宗毓;周子君;: "基于机器学习的北京市三甲医院疾病诊断名称规范化研究", 医学与社会, no. 08, 10 August 2020 (2020-08-10) *

Similar Documents

Publication Publication Date Title
CN107908635B (zh) 建立文本分类模型以及文本分类的方法、装置
US20190228320A1 (en) Method, system and terminal for normalizing entities in a knowledge base, and computer readable storage medium
CN111125086B (zh) 获取数据资源的方法、装置、存储介质及处理器
JP6756079B2 (ja) 人工知能に基づく三元組チェック方法、装置及びコンピュータプログラム
US11609748B2 (en) Semantic code search based on augmented programming language corpus
CN111160012A (zh) 医学术语识别方法、装置和电子设备
KR101706300B1 (ko) 기술용어 개념계층도 생성 장치 및 방법
CN112711660A (zh) 文本分类样本的构建方法和文本分类模型的训练方法
CN111552766B (zh) 使用机器学习来表征在引用图形上应用的参考关系
CN109753647B (zh) 段落的划分方法及装置
CN111435410B (zh) 用于医疗文本的关系抽取方法及其装置
CN107577660B (zh) 类目信息识别方法、装置及服务器
CN111063446B (zh) 用于标准化医疗文本数据的方法、装置、设备及存储介质
CN112541373B (zh) 司法文本识别方法、文本识别模型获得方法及相关设备
CN111797626B (zh) 一种命名实体识别方法及装置
CN117894482A (zh) 一种医学肿瘤的编码方法、系统、电子设备及存储介质
CN114691907B (zh) 一种跨模态检索的方法、设备及介质
CN112052254B (zh) 数据封装方法、电子设备及存储介质
Michener Creating and managing metadata
CN111475641B (zh) 一种数据抽取方法、装置、存储介质及设备
US11334571B2 (en) Artificial intelligence-enabled search for a storage system
AU2019290658B2 (en) Systems and methods for identifying and linking events in structured proceedings
CN116010445B (zh) 数据库sql脚本的处理方法及装置
CN118069587B (zh) 三维模型管理方法、装置、设备及存储介质
US12032590B1 (en) Machine learning techniques for normalization of unstructured data into structured data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination