CN110796180B

CN110796180B - 一种基于人工智能的模型训练系统与方法

Info

Publication number: CN110796180B
Application number: CN201910967379.6A
Authority: CN
Inventors: 蒋鑫萍; 张阳; 王帅
Original assignee: Jilin University
Current assignee: Jilin University
Priority date: 2019-10-12
Filing date: 2019-10-12
Publication date: 2022-06-07
Anticipated expiration: 2039-10-12
Also published as: CN110796180A

Abstract

本发明公开了一种基于人工智能的模型训练系统，其特征在于，包括：至少一个前端子系统，至少一个交互子系统，数据管理子系统；采集医学影像数据，根据所述医学影像的类型信息，对所述采集医学影像数据进行分组，将每一分组内的医学影像数据作为分组初始训练样本，基于预训练模型，生成多个第一子模型；提取至少一个分组内的医学影像数据中的至少一张第一医学影像；根据第一医学影像，创建并维护第一交互任务的第一动态表单；接收至少一个用户语音指令，并根据所述语音指令，更新所述第一动态表单；根据所述第一动态表单更新第一子模型。通过本发明的方法，能够简化医学影像的数据标记，丰富模型训练的样本数据，提高深度学习的效果。

Description

一种基于人工智能的模型训练系统与方法

技术领域

本发明实施例涉及信息处理技术领域，特别涉及一种基于人工智能的模型训练系统与方法。

背景技术

随着人工智能技术的演进，人工智能正逐渐走入多种领域，在这些领域中也都取得了非常大的进步，在医疗领域中基于人工智能的医学影像识别，辅助诊断，药物挖掘，健康管理等方面的需求也变得越来越重要。

近年来，基于大数据训练的深度学习算法不断发展，对于样本数据的累积一直是个重要话题。对于医疗领域，收集医疗影像数据的过程比较复杂，同时，由于专业领域的特殊性，医疗影像数据通常需要专门的资深医师来做数据标注，标注数据量有限，基于当前紧张的医疗资源的情景下，医疗影像数据的获取不便利，大大阻碍了人工智能的发展的进程。人工智能在医疗领域面临的如何简化医学影像的数据标记，丰富模型训练的样本数据，提高深度学习的效果成为亟待解决的问题。

发明内容

针对现有技术中的问题，本发明提供一种基于人工智能的模型训练系统、方法、设备以及计算机可读存储介质。

本发明提供一种基于人工智能的模型训练系统，其特征在于，所述系统包括：至少一个前端子系统，至少一个交互子系统，数据管理子系统，

所述前端子系统用于采集医学影像数据，所述医学影像数据包括医学影像，以及所述医学影像对应的标识信息、类型信息，其中至少一部分所述医学影像数据还包括标记信息和/或诊疗记录；

将所述医学影像数据发送至数据管理子系统；

所述数据管理子系统用于接收所述医学影像数据，根据所述医学影像的类型信息，对所述医学影像数据进行分组，保存所述医学影像数据；

将每一分组内的医学影像数据作为分组初始训练样本，基于预训练模型，生成多个第一子模型；

所述交互子系统用于接收第一请求指令，根据所述第一请求指令，向所述数据管理子系统发送请求，请求提取至少一个分组内的医学影像数据中的至少一张第一医学影像；

所述交互子系统根据请求提取的所述至少一张第一医学影像，创建并维护第一交互任务的第一动态表单；

所述交互子系统接收至少一个用户语音指令，并根据所述语音指令，确定所述至少一个用户的属性信息，所述属性信息包括用户身份标识以及用户角色等级；

所述交互子系统根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息，更新所述第一动态表单；

所述交互子系统将所述更新后的第一动态表单发送给数据管理子系统；

所述数据管理子系统还用于根据所述第一动态表单更新第一子模型。

本发明还提供一种基于人工智能的模型训练方法，其特征在于，所述方法包括：

采集医学影像数据，所述医学影像数据包括医学影像，以及所述医学影像对应的标识信息、类型信息，其中至少一部分所述医学影像数据还包括标记信息和/或诊疗记录；

根据所述医学影像的类型信息，对所述采集医学影像数据进行分组，保存所述医学影像数据；

接收第一请求指令，根据所述第一请求指令，提取至少一个分组内的医学影像数据中的至少一张第一医学影像；

根据请求提取的所述至少一张第一医学影像，创建并维护第一交互任务的第一动态表单；

接收至少一个用户语音指令，并根据所述语音指令，确定所述至少一个用户的属性信息，所述属性信息包括用户身份标识以及用户角色等级；

根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息，更新所述第一动态表单；

根据所述第一动态表单更新第一子模型。

本发明还提供一种终端设备，其特征在于，所述终端设备包括处理器和存储器，所述存储器中存储有可在处理器上运行的计算机程序，所述计算机程序在被所述处理器执行时实现如上所述的方法。

本发明还提供一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有可在处理器上运行的计算机程序、所述计算机程序在被执行时实现如上所述的方法。

通过本发明的方法，能够简化医学影像的数据标记，丰富模型训练的样本数据，提高深度学习的效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一个实施例中的一种系统。

图2是本发明一个实施例中的一种方法。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。本发明的实施例以及实施例的具体特征是对本发明实施例技术方案的详细说明，而非对本发明说明书技术方案的限定，在不冲突的情况下，本发明的实施例以及实施例的技术特征可以相互结合。

实施例一

参考图1，本发明实施例一提供一种基于人工智能的模型训练系统，所述系统包括：至少一个前端子系统，至少一个交互子系统，数据管理子系统。

将所述医学影像数据发送至数据管理子系统；

具体地，至少一个前端子系统可以分布在不同的设备，分别采集医学影像数据，也可以位于一个设备中，通过网络获取不同的采集设备采集到的医学影像数据，所述医学影像包括且不限于通过透视、放射线片、CT、MRI、超声、数字减影、血管造影获取的影像，以及与该影像相关的标识信息、类型信息、以及可能存在的标记信息和/或诊疗记录。

所述的至少一个交互子系统，可以位于一个设备中，也可以分布在不同的设备，例如配置于不同所在地的客户端，通过远程交互调用其他子系统。

所述的基于人工智能的模型训练系统中的交互子系统、前端子系统、数据管理子系统可以分布在不同的设备，也可以位于一个设备中。

具体地，利用已有的开源预训练模型，针对每一分组的分组初始训练样本，生成多个分组的第一子模型；此外，也可以基于所有分组的训练样本数据进行处理，生成第二模型。

优选地，所述类型信息包括组织区域标识；

所述数据管理子系统根据所述医学影像的组织区域标识，将所述采集医学影像数据分为多个针对不同组织区域的分组。

优选地，所述交互子系统用于接收第一请求指令，根据所述第一请求指令，向所述数据管理子系统发送请求，请求提取至少一个分组内的医学影像数据中的至少一张第一医学影像具体包括，

所述交互子系统通过语音输入装置接收用户发出的第一请求指令；

所述第一请求指令包括指定提取的所述至少一张第一医学影像的标识信息；所述标识信息可以是归档的名称、标识或编号。

所述交互子系统基于所述第一请求指令，向所述数据管理子系统发送请求，请求提取至少一个分组内的医学影像数据中的至少一张第一医学影像。

在一个优选的实施例中，在会诊场景中，该至少一张第一医学影像被提取，该至少一张第一医学影像不具备完善的标记信息和/或诊疗记录，例如，未标记或部分标记，未给出最终诊疗方案等。

优选地，所述根据提取的所述至少一张第一医学影像，创建并维护第一交互任务的第一动态表单具体包括：

提取所述至少一张第一医学影像数据；

根据所述至少一张第一医学影像的类型信息和标识信息，创建第一交互任务，以及所述第一交互任务的第一动态表单，所述动态表单包含多个候选列表项；

判断所述至少一张第一医学影像数据是否包含标记信息和/或诊疗记录，若是，基于所述标记信息和/或诊疗记录，填充所述多个候选列表项的内容域。

具体地，根据所述至少一张第一医学影像的类型信息和标识信息，创建第一交互任务，例如第一会诊任务，并基于所述至少一张第一医学影像的类型信息和标识信息确定需要标记的内容和相应的会诊要素记录，基于所述要标记的内容和相应的会诊要素记录创建所述第一会诊任务的第一动态表单，所述动态表单包含多个候选列表项，所述多个候选列表项分别对应需要标记的内容和相应的会诊要素记录。

优选地，所述接收至少一个用户语音指令，并根据所述语音指令，确定所述至少一个用户的属性信息，所述属性信息包括用户身份标识以及用户角色等级进一步包括

接收第一用户输入的语音指令，

获取所述语音指令的声纹信息，基于所述声纹信息匹配用户，若存在匹配用户，则调用存储的该用户的属性信息，所述属性信息包括用户身份标识以及用户角色等级；

若不存在匹配用户，则默认用户角色等级为当前任务最低优先级，或者提示用户输入其属性信息。

具体地，接收第一用户输入的语音指令，例如第一用户通过语音输入指出第一医学影像存在的动脉粥样硬化斑块位置，并给出相应的诊断描述。

交互子系统在接收到该第一用户的语音指令时，将该语音指令输入交互子系统的语音识别模块，在对该语音指令进行识别的同时，提取该语音指令的声纹信息，通过声纹匹配用户，例如事先采集医院医生的声纹信息，若存在匹配用户，则调用存储的该用户的属性信息，所述属性信息包括用户身份标识以及用户角色等级；所述身份标识包括代码和/或姓名；所述角色等级包括职称优先级；例如根据主任医师，副主任医师，主治医师，住院医师，实习医生，见习医生，学生等进行优先级排序，例如该第一用户为副主任医师，此时记录所述第一用户的身份标识，如代码和/或姓名标识，以及所述第一用户角色等级为副主任医师，优先级2。

如果系统未匹配到对应的用户，可以默认用户角色等级为当前任务最低优先级，例如本次会审参加的人员为主治医师以上，则默认该用户角色等级为主治医师，优先级3；或者系统提示用户输入其属性信息，例如弹出窗口提示，由用户输入相应的属性信息。或者可通过后续的语音识别上下文确定该用户属性信息，例如，由于系统中未录入该医师声纹信息，导致无法识别用户的属性信息，但数据库中包含该医师的个人信息，此时，当采集的上一语音数据中包含一姓名或代码，随后该医师发出语音指令，此时可以判断，该医师为上文中提及医师，此时基于所述姓名或代码，在数据库中检索该医生的身份标识以及等级，补充其属性信息。

优选地，所述根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息，更新所述第一动态表单进一步包括

解析所述至少一个用户的语音指令，获取所述至少一个用户的语音指令的内容，基于所述语音指令的内容以及所述动态表单的多个候选列表项，确定所述语音指令的内容是否包含与所述动态表单的多个候选列表项相关联的关键信息，若包含与所述动态表单的多个候选列表项相关联的关键信息，则将所述关键信息填充至对应的候选列表项的内容域，并根据所述至少一个用户的属性信息，确定所述关键信息的优先级信息。

具体地，对所述至少一个用户的语音指令进行识别，解析所述至少一个用户的所述语音指令，获取所述至少一个用户的语音指令的内容，例如所述至少一个用户的语音指令的内容为第一医学影像存在的动脉粥样硬化斑块位置，以及相应的诊断描述。

将所述内容中表述的第一医学影像存在的动脉粥样硬化斑块位置，以及相应的诊断描述信息以及所述动态表单的多个需要标记的内容和相应的会诊要素记录的候选列表项进行匹配，确定需要填入的关键信息，在填入关键信息的同时，对该关键信息进行标注，例如{关键信息，第一用户身份标识，优先级}。

优选地，接收第二用户的语音输入指令，类似地，获取所述语音指令的声纹信息，基于所述声纹信息匹配用户，若存在匹配用户，则调用存储的该用户的属性信息，所述属性信息包括用户身份标识以及用户角色等级；

随后根据所述第二用户语音指令的内容以及所述第二用户的属性信息，更新所述第一动态表单；

例如对所述第二用户的语音指令进行识别，解析所述第二用户的所述语音指令，获取所述第二用户的语音指令的内容，将所述内容中表述的第一医学影像存在的斑块位置，以及相应的诊断描述信息以及所述动态表单的多个需要标记的内容和相应的会诊要素记录的候选列表项进行匹配，确定需要填入的关键信息，在填入关键信息的同时，对该关键信息进行标注：{关键信息，第二用户身份标识，优先级}。

利用同样的方式，获取会诊中多位参与者的语音指令，对第一动态表单进行完善和更新；对同一候选列表项中填充的多个关键信息，依照优先级进行排序。

当同一候选列表项中填充的关键信息存在相悖时，标记该关键信息所在的候选列表项，基于关键信息的优先级，删除优先级低的相悖关键信息。或者如果最后的一个用户输入的语音指令为对本次会诊做出结论，其中包含可填充该标记的候选列表项的内容域的关键信息，则依据最后一次填充的关键信息进行判定，将与最后一次填充的关键信息相悖的关键信息删除，此时该最后一次填充的关键信息优先级别设置为最高。

具体地，在所述任务结束后，将所述更新后的第一动态表单发送给数据管理子系统；

所述数据管理子系统还用于根据所述第一动态表单，提取相应的数据，补充训练样本，更新第一子模型。

具体地，获取第一动态表单中多个候选列表项的内容域中填充的一个或多个关键信息，将其作为所述医学影像对应的标记信息和诊疗记录，从而补充训练样本，更新第一子模型。

在一个优选地实施例中，除了可以在会诊场景中，还可以应用于医学示教中，基于类似的方式，提取所述至少一张第一医学影像，同样基于所述至少一张第一医学影像的类型信息和标识信息确定需要标记的内容和相应的诊疗要素记录，创建示教任务的动态表单，所述创建动态表单包含多个候选列表项，所述多个候选列表项分别对应需要标记的内容和相应的诊断要素记录。

并基于语音指令内容，更新动态表单。在该场景下，通常参加的人员可能包括主任医师，副主任医师，主治医师，住院医师，实习医生，见习医生，学生，获取会诊中多位参与者的语音指令，对第一动态表单进行完善和更新；对同一候选列表项中填充的多个关键信息，依照优先级进行排序。当同一候选列表项中填充的关键信息存在相悖时，删除优先级低的相悖的关键信息。

实施例二

参考图2，本发明实施例二还提供一种基于人工智能的模型训练方法，所述方法包括：

接收第一请求指令，根据所述请求指令，提取至少一组医学影像数据中的至少一张第一医学影像；

根据所述第一动态表单更新第一子模型。

优选地，所述类型信息包括组织区域标识；

优选地，所述根据提取的所述至少一张第一医学影像，创建并维护第一交互任务的第一动态表单具体包括

提取所述至少一张第一医学影像数据；

接收第一用户输入的语音指令，

若不存在匹配用户，则默认用户等级为当前任务最低优先级，或者提示用户输入其属性信息。

本发明提供一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有可在处理器上运行的计算机程序、所述计算机程序在被执行时实现如上所述的方法。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质可以包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、闪存、可擦式可编程只读存储器(EPROM)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码。

以上说明只是为了方便理解本发明而举出的例子，不用于限定本发明的范围。在具体实现时，本领域技术人员可以根据实际情况对装置的部件进行变更、增加、减少，在不影响方法所实现的功能的基础上可以根据实际情况对方法的步骤进行变更、增加、减少或改变顺序。

尽管已经示出和描述了本发明的实施例，本领域技术人员应当理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同替换所限定，在未经创造性劳动所作的改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于人工智能的模型训练系统，其特征在于，所述系统包括：至少一个前端子系统，至少一个交互子系统，数据管理子系统，

将所述医学影像数据发送至数据管理子系统；

2.根据权利要求1所述的系统，其特征在于，

所述类型信息包括组织区域标识；

3.根据权利要求1所述的系统，其特征在于，所述根据提取的所述至少一张第一医学影像，创建并维护第一交互任务的第一动态表单具体包括

提取所述至少一张第一医学影像数据；

4.根据权利要求3所述的系统，其特征在于，所述接收至少一个用户语音指令，并根据所述语音指令，确定所述至少一个用户的属性信息，所述属性信息包括用户身份标识以及用户角色等级进一步包括

接收第一用户输入的语音指令，

5.根据权利要求3所述的系统，其特征在于，所述根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息，更新所述第一动态表单进一步包括

6.一种基于人工智能的模型训练方法，其特征在于，所述方法包括：

根据所述第一动态表单更新第一子模型。

7.根据权利要求6所述的方法，其特征在于，

所述类型信息包括组织区域标识。

8.根据权利要求6所述的方法，其特征在于，所述根据提取的所述至少一张第一医学影像，创建并维护第一交互任务的第一动态表单具体包括

提取所述至少一张第一医学影像数据；

9.根据权利要求8所述的方法，其特征在于，所述接收至少一个用户语音指令，并根据所述语音指令，确定所述至少一个用户的属性信息，所述属性信息包括用户身份标识以及用户角色等级进一步包括

接收第一用户输入的语音指令，

10.根据权利要求8所述的方法，其特征在于，所述根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息，更新所述第一动态表单进一步包括

11.一种终端设备，其特征在于，所述终端设备包括处理器和存储器，所述存储器中存储有可在处理器上运行的计算机程序，所述计算机程序在被所述处理器执行时实现如权利要求1至5任一项所述的方法。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有可在处理器上运行的计算机程序、所述计算机程序在被执行时实现如权利要求1至5任一项所述的方法。