CN115080751A

CN115080751A - 一种基于通用模型的医学标准术语管理系统及方法

Info

Publication number: CN115080751A
Application number: CN202210980851.1A
Authority: CN
Inventors: 李劲松; 俞紫怡; 杨宗峰; 田雨; 周天舒
Original assignee: Zhejiang Lab
Current assignee: Zhejiang Lab
Priority date: 2022-08-16
Filing date: 2022-08-16
Publication date: 2022-09-20
Anticipated expiration: 2042-08-16
Also published as: CN115080751B; JP2024027087A

Abstract

本发明公开了一种基于通用模型的医学标准术语管理系统及方法，包括术语信息处理模块，术语关系网络构建模块，术语库自扩增模块，可视化管理模块；步骤S1：通过术语信息处理模块对开源标准术语数据进行梳理整合，并通过构建的序列标注模型拆分得到所述细分属性名称对应的细分属性内容；步骤S2：建立标准化映射关系，完成术语关系网络的搭建；步骤S3：进行自增推荐，完成术语关系网络的扩展；步骤S4：利用可视化管理模块对所述术语库进行可视化管理。本发明所构建的医学标准术语库可满足不同的科研及业务使用场景，兼容或可溯源至不同平台及权威机构的医学标准术语，所设计的结构体可支持术语的各种组合扩展。

Description

一种基于通用模型的医学标准术语管理系统及方法

技术领域

本发明涉及一种医学领域技术领域，尤其涉及一种基于通用模型的医学标准术语管理系统及方法。

背景技术

随着大数据时代的来临，医疗大数据在医学领域的应用价值也逐渐被挖掘与利用。然而，在这一过程中，由于多源的医学数据不具备统一的标准，在过去缺乏规范性的约束，致使各行业对现有的医疗数据无法进行最大化的合理利用，也成为医学信息化建设及医学研究发展的阻碍因素。

虽然当前，各大国内外权威机构发布的医学标准术语集已在不同的领域被广泛应用及认可，却仍缺乏一个，可兼容多种需求场景，能突破不同服务平台间壁垒的中文标准医学术语体系。致使现阶段，中文标准术语在真实世界的覆盖度仅低于40%，远不足以适应医疗人工智能的应用需求。

已有的中文医学术语管理方法中，一种是基于snowflake算法对同义医学术语进行标识，以概念为中心进行整合后，构建单分类下的树状数据结构医学词典；一种是对英文医学术语资源，如SNOMEDCT，进行机器翻译及大量人工校正。

第一种方式将不同来源获取的医学术语进行分类，得到不同含义的医学术语，以概念为中心实现同义汇聚和语义分类，再对不同含义的医学概念采用snowflake算法进行标识，根据不同的概念标识进行整合得到医学概念表，同时采用Jaccard相似度算法对相同来源的医学术语进行相似度计算以满足准确分类。通过这种方法实现自增ID，保证ID的唯一性和索引性能。其构建的术语体系结构单一，可拓展性低，没有足够的泛化能力和灵活性来面对多样的数据来源和不断更新的应用场景需求。对于术语内部及术语间的关联信息未进行有效利用，致使在术语集的后续维护及拓展上依然需要堆砌大量的人工成本。以新增一例标准术语概念为例，传统的技术方案仅能通过判断原始术语表中是否存在同义概念，来进行概念分类或新增。当新增的概念与原始术语表中的术语存在层级关系，无法自动将新概念添加在有效的节点位置下；当新增概念与现有概念存在信息关联，也无法对其进行识别，从而存储关联信息；当前技术无法有效利用术语本身已有信息进行同类术语聚合，需要依靠纯人工的方式进行管理及维护，无法有效形成一个标准化的术语管理体系和迭代闭环。

第二种方式，若仅通过机器翻译，在不基于大量人工校正的条件下，无法避免翻译结果与专业概念的较大偏差，也容易忽略国内外语言使用习惯的差异，在术语映射时往往得到的是极低的召回率。如需要提高召回率，则在管理和维护上需要付出成倍的人力和资金成本，以及漫长的时间周期。

目前，构建的术语体系结构单一，可拓展性低，没有足够的泛化能力面对多样的数据来源和业务需求，没有足够的灵活性对术语库进行可持续且高效率的管理及优化。主要表现在于：（1）不对来源信息进行保留，不建立，不存储标准术语与非标准术语的映射关系。（2）没有合理利用术语内部及术语间的关联关系，面对标准术语概念的新增，仅能通过判断原始术语表中是否存在同义概念，来进行概念分类或新增，若需新增的概念与原始术语表中的术语存在层级关系，无法自动将新概念添加在有效的节点位置下，若需新增的概念需满足特定的应用需求，位于相对高的层级，无法有效利用其中的关联信息进行其子类的同类术语的聚合；（3）术语库后续的迭代需要堆砌大量的人工进行，未能形成一个高效标准化的术语管理体系和迭代闭环。

以实际需求场景举例，当术语库须要满足DRG或DIP系统的业务需求，则须确保术语可映射或溯源至相关标准数据库，如ICD-10医保版，ICD-9-CM-3医保版；以一个标准概念举例，当临床所见概念“下肢疼痛“未在当前建立的标准术语库中且需新增时，需要将其自动化添加在“四肢疼痛“以及“下肢临床所见“节点下，作为以上两个术语概念的子节点；同时需要将原来在“四肢疼痛”节点下的：“小腿疼痛”，“足部疼痛”，“左下肢疼痛”统一修改为“下肢疼痛”的子节点；以及，需要自动关联身体部位信息“下肢”为发生部位。现有的技术显然还无法完成上述的自动化术语管理流程。

为此，我们提出一种基于通用模型的医学标准术语管理系统及方法以解决上述技术问题。

发明内容

本发明为了解决上述技术问题，提供一种基于通用模型的医学标准术语管理系统及方法。

本发明采用的技术方案如下：

一种基于通用模型的医学标准术语管理系统，包括：

术语信息处理模块，用于对开源标准术语数据进行梳理整合，对所述开源标准术语数据的定义及术语含义进行术语分类，得到术语类别以及术语类别对应的细分属性名称，并通过构建的序列标注模型对病历文本进行拆分得到病历文本细分属性名称对应的细分属性内容，每种所述术语类别都包含一种主要细分属性名称和多种次要细分属性名称；

术语关系网络构建模块，用于在所述细分属性内容中寻找语义相似度最大的语义标准词建立标准化映射关系，并对所述标准化映射关系进行校正及补充，完成术语关系网络的搭建；

术语库自扩增模块，用于对不同的所述术语类别进行自增推荐，完成术语关系网络的扩展，得到完整的术语库；

可视化管理模块，用于对所述术语库进行可视化管理。

进一步地，所述可视化管理模块包括：

医学标准术语查询单元，用于提供用户预览数据，进行标准术语的可视化查询，基于不同维度的筛选条件，筛选出对应的术语，同时提供用户登陆界面入口和术语管理界面入口，展示包含以下维度的标准术语信息，包括：标准术语的顶级类别、同义词、父节点术语、子节点术语和/或属性信息，同时提供进入相关术语详情界面的入口；

术语编辑单元，用于提供用户通过可视化界面进行术语实体编辑，包括：标准术语的新增、删除和/或修改，标准术语同义词的新增和/或删除，标准术语的属性信息修改；

术语审核单元，用于提供术语审核人员进行第二方审核，提供审核人员进行术语审核结果判定；

术语映射单元，用于提供用户对不同来源的医学数据进行标准化映射，对于无法映射的数据，构建推荐队列，保证术语管理人员进行术语的一键映射和推荐队列的形成。

本发明还提供一种基于通用模型的医学标准术语管理方法，包括以下步骤：

步骤S1：通过术语信息处理模块对开源标准术语数据进行梳理整合，对所述开源标准术语数据的定义及术语含义进行术语分类，得到术语类别以及术语类别对应的细分属性名称，并通过构建的序列标注模型拆分得到所述细分属性名称对应的细分属性内容，所述细分属性内容即为标准词，每种所述术语类别都包含一种主要细分属性名称和多种次要细分属性名称；

步骤S2：通过所述序列标注模型对病历文本进行拆分得到病历文本细分属性，利用术语关系网络构建模块在所述标准词中寻找语义相似度最大的语义标准词建立标准化映射关系，并对所述标准化映射关系进行校正及补充，完成术语关系网络的搭建；

步骤S3：通过术语库自扩增模块对不同的术语类别进行自增推荐，完成术语关系网络的扩展，得到完整的术语库；

步骤S4：利用可视化管理模块对所述术语库进行可视化管理，所述可视化管理包括医学标准术语查询单元、术语编辑单元、术语审核单元和术语映射单元。

进一步地，所述步骤S1具体包括以下子步骤：

步骤S11：通过术语信息处理模块对开源标准术语数据进行梳理整合，对所述开源标准术语数据的定义及术语含义进行术语分类，保留原始术语的层级关系、关联关系和/或编码信息，并打上来源标签，得到术语类别以及术语类别对应的细分属性名称；

步骤S12：利用预训练语言模型构建序列标注模型，并通过所述序列标注模型将开源标准术语数据拆分得到细分属性内容。

进一步地，所述步骤S12具体包括以下子步骤：

步骤S121：利用预训练语言模型计算开源标准术语数据中每个字/词的向量表示；

步骤S122：所述向量表示通过自注意力机制计算每个字/词的输出状态；

步骤S123：所述输出状态经过全连接神经网络计算得到每个字/词属于每种细分属性类别的概率，完成序列标注模型的构建；

步骤S124：所述开源标准术语数据通过所述序列标注模型拆分得到细分属性内容，所述细分属性内容即为标准词，所述细分属性内容包含主要细分属性内容和次要细分属性内容。

进一步地，所述步骤S2具体包括以下子步骤：

步骤S21：通过所述序列标注模型对病历文本进行拆分得到病历文本细分属性，利用术语关系网络构建模块在所述标准词中寻找任意语义标准词，通过算法得到病历文本细分属性和所述任意语义标准词的语义相似度，选取语义相似度最高的标准词，建立标准化映射关系；

步骤S22：通过算法拆分得到的次要细分属性，若在当前病历文本中存在可定义描述类型的父节点，且所拆分得到的主要细分属性未包含类型信息，则对主要细分属性进行信息补充，校正为信息对应的细颗粒度子节点，完成标准化映射关系的校正；

步骤S23：若单个术语类别包含多个类型的次要细分属性，导致修正后的主要细分属性存在多个，则选择存在最多的主要细分属性在病历文本中的父节点作为最后的主要细分属性；

步骤S24：当算法拆分得到的结果为各维度信息存在缺失，数据来源本身存在层级结构，则通过所述术语类别的父节点拆分结果进行信息补全，完成术语关系网络的搭建。

进一步地，所述步骤S21具体包括以下子步骤：

步骤S211：在所述病历文本细分属性和所述标准词中获取包含所述病历文本细分属性和所述标准词的句子集合、位于所述病历文本细分属性和所述标准词左边的句子集合和位于所述病历文本细分属性和所述标准词右边的句子集合；

步骤S212：通过计算任意一对句子集合的平均值，并通过最终的平均值组合得到语义相似度，选取语义相似度最高的标准词，建立标准化映射关系。

进一步地，所述步骤S3具体为通过语义相似度判断标准化映射的有效性，若标准化映射有效，则直接作为映射结果；若标准化映射无效，则重新计算从所述病历文本细分属性到所述标准词中其他可能的细分属性类别和语义标准词的标准化映射，作为算法推荐的、需要人工审核的映射结果，对不同的术语类别进行自增推荐，完成术语关系网络的扩展，得到完整的术语库。

进一步地，所述步骤S3具体包括以下子步骤：

步骤S31：通过语义相似度判断标准化映射的有效性，若标准化映射无效，则计算病历文本拆分得到的病历文本细分属性以及语义标准词之间的距离；

步骤S32：将语义标准词按照距离降序排列，取前K个标准词组成与细分属性距离最近的标准词集合；

步骤S33：计算细分属性类别下的语义标准词的推荐分数，将所有细分属性类别按照推荐分数降序排列，取前k1个细分属性类别组成算法推荐的从细分属性到标准术语体系的细分属性类别映射的算法推荐队列：

步骤S34：将所有标准词按照语义相似度降序排列，取前k2个标准词组成细分属性到细分属性类别下的标准词映射的算法推荐队列；

步骤S35：将所有的算法推荐队列组合，完成术语关系网络的扩展，得到完整的术语库。

进一步地，所述步骤S4具体包括：用户基于不同的筛选条件，通过医学标准术语查询单元筛选对应的术语；用户通过术语编辑单元进行术语实体编辑，包括：标准术语的新增、删除和/或修改，标准术语同义词的新增和/或删除，标准术语的属性信息修改；术语审核人员通过术语审核单元进行术语审核结果判定；用户通过术语映射单元对不同来源的医学数据进行标准化映射，对于无法映射的数据，构建推荐队列，保证术语管理人员进行术语的一键映射和推荐队列的形成。

本发明的有益效果是：

1、本发明所构建的医学标准术语库可满足不同的科研及业务使用场景，兼容或可溯源至不同平台及权威机构的医学标准术语，所设计的结构体可支持术语的各种组合扩展；

2、本发明保留和利用多个标准术语之间，单个标准术语内部的关联信息，使用算法和逻辑规则进行标准术语概念的自动新增和聚合推荐；

3、本发明可支持标准术语库仅基于部分人力成本进行高效，半自动化的管理和维护。与各大权威机构所发布的标准医学术语，以及多中心临床数据形成良性的反馈机制。

附图说明

图1为本发明一种基于通用模型的医学标准术语管理系统示意图；

图2为本发明实施例术语关系网络结构图。

具体实施方式

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

见图1，一种基于通用模型的医学标准术语管理系统，包括：

可视化管理模块，用于对所述术语库进行可视化管理；

所述可视化管理模块包括：

实施例：

一种基于通用模型的医学标准术语管理方法，包括以下步骤：

如果开源标准术语数据之间存在对应关系，统一对该信息进行保留，确保机构或个人在面对不同的场景需求时，依然能对数据进行有效利用和转化，以便于进行无障碍的信息交流。

对于开源标准术语数据

，把它包含的所有字和所有词拼接在一起，则可表示为

，其中

是

包含的共 m个字，

是

包含的共n个词。字/词

在医学术语

中的起始位置记为

，终止位置记为

。首先通过预训练的Bert模型计算每个字/词

的向量表示为

；

计算每个字/词

对

的注意力权重

：

其中，

，

表示

和

的相对位置向量，M₁ 和 M₂均为经过预训练的Bert模型训练得到的权重矩阵参数。基于自注意力机制计算每个字/词

位置的输出状态

：

最后将输出状态经过一层全连接神经网络，计算字/词

属于每种细分属性的概率分布

为：

其中，W为矩阵参数，b为向量参数，均通过整个序列标注模型训练得到，W的行数和b的维度均等于医疗术语细分属性的类别数量，

表示向量的Softmax函数。

即为针对开源标准术语数据的序列标注模型的最终输出，是由概率组成的向量，维度等于开源标准术语数据细分属性类别的数量。

的第 k个元素表示字/词

属于第k种细分属性类别的概率，其中最大的元素就表示算法认为

所属的细分属性类别以及对应的概率。

对所有类别的术语进行针对性的内部细分属性信息结构设计，每种术语类别都包含一种主要细分属性名称和多种次要细分属性名称，同时完成了不同类别术语间的关系定义。

步骤S2：通过所述序列标注模型对病历文本进行拆分得到病历文本细分属性，利用术语关系网络构建模块在所述标准词中寻找语义相似度最大的语义标准词建立标准化映射关系，并对所述标准化映射关系进行校正及补充，完成术语关系网络的搭建，参见图2；

图2中的“Acute panmyelosis with myelofibrosis”是指“急性全髓增殖症伴有骨髓纤维化”在snomed ct这个术语集中对应的英文概念。

对于从病历文本中拆分得到的病历文本细分属性a，在所述标准词中寻找与病历文本细分属性a的语义相似度最大的语义标准词

，在病历文本细分属性a和语义标准词

之间建立标准化映射关系。例如中成药名称信息中的：荆花，可映射到物质：土荆芥、水团花。操作名称术语中的：粒子放射，可映射到物理能量：电离辐射，以及物质：放射性同位素。同时通过属性链“活性成分”，“物理能量”，“目标物质”进行信息的关联。

用

表示所述标准词中与病历文本细分属性a具有相同细分属性类别的任意标准词，则病历文本细分属性a和任意标准词

的语义相似度分为两部分，第一部分是它们的向量表示的相似度，即

，其中 cos表示计算向量的余弦相似度。第二部分是病历文本细分属性a和任意标准词

的上下文的相似度，这里的上下文指的是在医院的病历文本中包含病历文本细分属性 a和任意标准词

的句子，以及位于病历文本细分属性a和任意标准词

的左边或右边的句子。用

，

和

分别表示从医院获取的大量病历文本中包含病历文本细分属性a的句子集合、位于病历文本细分属性a左边的句子集合和位于病历文本细分属性a右边的句子集合，同样用

，

和

分别表示包含任意标准词

的句子集合、位于任意标准词

左边的句子集合和位于任意标准词

右边的句子集合。

句子集合

和

的语义相似度定义为这两个集合中任意一对句子的向量表示相似度的平均值，计算方法是：

其中

和

分别表示集合

和

中的句子个数。

和

分别表示句子u和v的向量表示，通过预训练的语言模型计算得到。cos表示计算向量的余弦相似度。用相同的方法计算得到病历文本细分属性a和任意标准词

的左边句子集合的语义相似度

和右边句子集合的语义相似度

。最终由上述两部分结果组合得到病历文本细分属性a和任意标准词

的语义相似度

为：

其中，

为人工设定的权重参数，本实施例中取

，

。在开源标准术语数据中遍历该细分属性类别下的任意标准词

，选取语义相似度最高的标准词

，即为病历文本细分属性a的标准化映射结果，完成标准化映射关系的构建。

例如数据：咳黄脓痰，基于算法拆分得到的结果为，评价对象：痰，一般描述#1：黄，一般描述#2：脓，由于细分属性“黄”和“脓”分别在细分属性“颜色”和“炎症形态”的节点下，则须将评价对象“痰”修正为“痰液性状”和“痰液颜色”，或使用上述术语的同一父节点“痰液外观”作为评价对象。

例如原数据“经活体外血管治疗”，术语拆分后无法得到主体词，则拆分其父节点“药物的静脉旁路移植[引导]加压疗法”得到的信息进行补全，操作方法为“移植”。若数据来源无层级结构，主体词用该类别下的最高节点代替，即“操作方法”。开源标准术语数据通常已存在父子层级结构信息，因此只需要对其进行属性关系网络的完善。对于得到的细分属性非常完整的医学术语，只需要将该术语与细分属性词，通过定义的关系类型进行关联，若细分属性完整度存缺，则需要按上述逻辑进行补全后，再进行关联，即可形成术语关系网络。

所述步骤S3具体为通过语义相似度判断标准化映射的有效性，若标准化映射有效，则直接作为映射结果；若标准化映射无效，则重新计算从所述病历文本细分属性到所述标准词中其他可能的细分属性类别和语义标准词的标准化映射，作为算法推荐的、需要人工审核的映射结果，对不同的术语类别进行自增推荐，完成术语关系网络的扩展，得到完整的术语库。

若需处理的病历文本是平铺的格式，即本身不包含层级关系，则通过获取的细分属性信息，进行层级结构判断，先关联父子关系，再关联属性关系。

算法基于HIS,EMR系统的数据存储规则，定位不同分类下的术语所对应的筛选来源。例如，症状，疾病类术语从电子病历中的的诊断，主诉，既往史，辅助检查来源获得，操作类术语可从检验检查，影像学检查，手术等来源获得，药物名称则可从医嘱，门诊处方等来源获得。从医院获取大量病历文本数据，无法成功完成映射的信息，同样基于拆分得到的细分属性词名称，术语类别等，形成算法推荐的、待存储及校正的队列。对于从病历文本中拆分得到的病历文本细分属性a，使用上述方法将其映射到标准术语体系中的标准词

，若它们的语义相似度满足条件

，则认为本次标准化映射是有效的，可以直接将本次映射结果存储到标准术语体系，其中c是人工设定的阈值，本实施例中取c=0.9。若不满足上述条件，则认为病历文本细分属性a到标准词

的标准化映射无效，需要重新计算从病历文本细分属性a到开源标准术语数据中其他可能的细分属性类别和标准词的标准化映射，作为算法推荐的、需要人工审核的映射结果；

设开源标准术语数据中所有标准词的集合为A，病历文本细分属性类别C下所有标准词集合为A_C，对于从病历文本拆分得到的病历文本细分属性a，以及标准术语体系中的标准词

，基于它们的向量表示计算它们之间的距离为

，其中

表示计算向量的模。

将所有标准词

按照

降序排列，取前K个标准词组成与细分属性a距离最近的标准词集合

，本实施例中取K=1000。

标准术语体系中每个细分属性类别C对细分属性a的推荐分数

定义为细分属性类别C下的标准词包含在集合

中的数量，计算公式为：

其中，

。将所有细分属性类别C按照

降序排列，取前k1个细分属性类别组成算法推荐的从细分属性a到标准术语体系的细分属性类别映射的算法推荐队列：

，本实施例中取k₁=5。

对于细分属性类别

，使用上述方法计算标准术语体系中细分属性类别

下的任意标准词

与细分属性a的语义相似度

，将所有标准词

按照

降序排列，取前k₂ 个标准词组成细分属性a到细分属性类别

下的标准词映射的算法推荐队列：

，本实施例中取 k₂=3。

将所有

组合在一起作为输出，就形成细分属性a到标准术语体系标准化映射的算法推荐的、待人工审核及存储的推荐队列：

。

例如基于算法拆分临床数据“行超声监护宫腔镜手术”得到操作方法“超声监护”，“宫腔镜”可分别标准化为“超声引导”，“镜检”，器械“宫腔镜”可直接映射得到标准概念“宫腔镜”。当该临床术语与标准术语库“超声引导宫腔镜检查”的关系网络图一致，则可进行直接映射，无需进行术语新增。如基于算法拆分临床数据“双下肢红肿”得到发生部位“双下肢”，相关形态学“红肿”，而“红肿”在标准术语库中暂无可直接映射的标准概念。算法基于语义形成推荐队列：

表1拆分组合推荐

表2标准概念映射推荐

术语管理员基于算法推荐结果进行拆分组合及标准映射选择，将术语“双下肢红肿”拆分为“发生部位”+“相关形态学”，将术语“红肿”和标准概念进行正确关联。

同一术语类别下的术语，对于细分属性有重合的术语，可基于既定的聚合逻辑，标准概念命名规则，进行概念的新增，以及相应的信息关联，部分逻辑规则示例如下表3。

表3逻辑规则示例

所述步骤S4具体包括：用户基于不同的筛选条件，通过医学标准术语查询单元筛选对应的术语；用户通过术语编辑单元进行术语实体编辑，包括：标准术语的新增、删除和/或修改，标准术语同义词的新增和/或删除，标准术语的属性信息修改；术语审核人员通过术语审核单元进行术语审核结果判定；用户通过术语映射单元对不同来源的医学数据进行标准化映射，对于无法映射的数据，构建推荐队列，保证术语管理人员进行术语的一键映射和推荐队列的形成。

该模块产出医学术语标准化管理平台软件。模块分为：医学标准术语查询，术语编辑，术语审核，术语映射四个部分。

术语查询部分，提供用户预览数据，进行标准术语的可视化查询：用户可基于不同维度的筛选条件，筛选出对应的术语，同时提供用户登陆界面入口和术语管理界面入口。展示标准术语的多维度信息，包括但不仅限于：该标准术语的顶级类别，同义词，父节点术语，子节点术语，属性信息，同时提供进入相关术语详情界面的入口。

术语编辑部分，提供用户通过可视化界面进行术语实体编辑，其中包括标准术语的新增，删除，修改，以及标准术语同义词的新增和删除，标准术语的属性信息修改。

术语审核部分供术语审核人员进行第二方审核，以保证术语的更新质量。同时可在该页面预览当前待审核的术语。审核详情页面展示术语的具体更新内容，该页面同时提供审核人员进行术语审核结果判定。

术语映射部分提供用户对不同来源的医学数据进行标准化映射，将4.3中的部分过程进行可视化，对于无法映射的数据，构建推荐队列，保证术语管理人员在该平台可以进行术语的一键映射和推荐队列的形成，作为管理人员迭代术语库的参考数据，提高术语库更新扩展的效率和性能。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于通用模型的医学标准术语管理系统，其特征在于，包括：

可视化管理模块，用于对所述术语库进行可视化管理。

2.如权利要求1所述的一种基于通用模型的医学标准术语管理系统，其特征在于，所述可视化管理模块包括：

3.一种基于通用模型的医学标准术语管理方法，其特征在于，包括以下步骤：

4.如权利要求3所述的一种基于通用模型的医学标准术语管理方法，其特征在于，所述步骤S1具体包括以下子步骤：

5.如权利要求4所述的一种基于通用模型的医学标准术语管理方法，其特征在于，所述步骤S12具体包括以下子步骤：

6.如权利要求3所述的一种基于通用模型的医学标准术语管理方法，其特征在于，所述步骤S2具体包括以下子步骤：

7.如权利要求6所述的一种基于通用模型的医学标准术语管理方法，其特征在于，所述步骤S21具体包括以下子步骤：

8.如权利要求3所述的一种基于通用模型的医学标准术语管理方法，其特征在于，所述步骤S3具体为通过语义相似度判断标准化映射的有效性，若标准化映射有效，则直接作为映射结果；若标准化映射无效，则重新计算从所述病历文本细分属性到所述标准词中其他可能的细分属性类别和语义标准词的标准化映射，作为算法推荐的、需要人工审核的映射结果，对不同的术语类别进行自增推荐，完成术语关系网络的扩展，得到完整的术语库。

9.如权利要求3所述的一种基于通用模型的医学标准术语管理方法，其特征在于，所述步骤S3具体包括以下子步骤：

10.如权利要求3所述的一种基于通用模型的医学标准术语管理方法，其特征在于，所述步骤S4具体包括：用户基于不同的筛选条件，通过医学标准术语查询单元筛选对应的术语；用户通过术语编辑单元进行术语实体编辑，包括：标准术语的新增、删除和/或修改，标准术语同义词的新增和/或删除，标准术语的属性信息修改；术语审核人员通过术语审核单元进行术语审核结果判定；用户通过术语映射单元对不同来源的医学数据进行标准化映射，对于无法映射的数据，构建推荐队列，保证术语管理人员进行术语的一键映射和推荐队列的形成。