CN110796180B - 一种基于人工智能的模型训练系统与方法 - Google Patents

一种基于人工智能的模型训练系统与方法 Download PDF

Info

Publication number
CN110796180B
CN110796180B CN201910967379.6A CN201910967379A CN110796180B CN 110796180 B CN110796180 B CN 110796180B CN 201910967379 A CN201910967379 A CN 201910967379A CN 110796180 B CN110796180 B CN 110796180B
Authority
CN
China
Prior art keywords
user
medical image
information
image data
voice instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910967379.6A
Other languages
English (en)
Other versions
CN110796180A (zh
Inventor
蒋鑫萍
张阳
王帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201910967379.6A priority Critical patent/CN110796180B/zh
Publication of CN110796180A publication Critical patent/CN110796180A/zh
Application granted granted Critical
Publication of CN110796180B publication Critical patent/CN110796180B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Radiology & Medical Imaging (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于人工智能的模型训练系统,其特征在于,包括:至少一个前端子系统,至少一个交互子系统,数据管理子系统;采集医学影像数据,根据所述医学影像的类型信息,对所述采集医学影像数据进行分组,将每一分组内的医学影像数据作为分组初始训练样本,基于预训练模型,生成多个第一子模型;提取至少一个分组内的医学影像数据中的至少一张第一医学影像;根据第一医学影像,创建并维护第一交互任务的第一动态表单;接收至少一个用户语音指令,并根据所述语音指令,更新所述第一动态表单;根据所述第一动态表单更新第一子模型。通过本发明的方法,能够简化医学影像的数据标记,丰富模型训练的样本数据,提高深度学习的效果。

Description

一种基于人工智能的模型训练系统与方法
技术领域
本发明实施例涉及信息处理技术领域,特别涉及一种基于人工智能的模型训练系统与方法。
背景技术
随着人工智能技术的演进,人工智能正逐渐走入多种领域,在这些领域中也都取得了非常大的进步,在医疗领域中基于人工智能的医学影像识别,辅助诊断,药物挖掘,健康管理等方面的需求也变得越来越重要。
近年来,基于大数据训练的深度学习算法不断发展,对于样本数据的累积一直是个重要话题。对于医疗领域,收集医疗影像数据的过程比较复杂,同时,由于专业领域的特殊性,医疗影像数据通常需要专门的资深医师来做数据标注,标注数据量有限,基于当前紧张的医疗资源的情景下,医疗影像数据的获取不便利,大大阻碍了人工智能的发展的进程。人工智能在医疗领域面临的如何简化医学影像的数据标记,丰富模型训练的样本数据,提高深度学习的效果成为亟待解决的问题。
发明内容
针对现有技术中的问题,本发明提供一种基于人工智能的模型训练系统、方法、设备以及计算机可读存储介质。
本发明提供一种基于人工智能的模型训练系统,其特征在于,所述系统包括:至少一个前端子系统,至少一个交互子系统,数据管理子系统,
所述前端子系统用于采集医学影像数据,所述医学影像数据包括医学影像,以及所述医学影像对应的标识信息、类型信息,其中至少一部分所述医学影像数据还包括标记信息和/或诊疗记录;
将所述医学影像数据发送至数据管理子系统;
所述数据管理子系统用于接收所述医学影像数据,根据所述医学影像的类型信息,对所述医学影像数据进行分组,保存所述医学影像数据;
将每一分组内的医学影像数据作为分组初始训练样本,基于预训练模型,生成多个第一子模型;
所述交互子系统用于接收第一请求指令,根据所述第一请求指令,向所述数据管理子系统发送请求,请求提取至少一个分组内的医学影像数据中的至少一张第一医学影像;
所述交互子系统根据请求提取的所述至少一张第一医学影像,创建并维护第一交互任务的第一动态表单;
所述交互子系统接收至少一个用户语音指令,并根据所述语音指令,确定所述至少一个用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级;
所述交互子系统根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息,更新所述第一动态表单;
所述交互子系统将所述更新后的第一动态表单发送给数据管理子系统;
所述数据管理子系统还用于根据所述第一动态表单更新第一子模型。
本发明还提供一种基于人工智能的模型训练方法,其特征在于,所述方法包括:
采集医学影像数据,所述医学影像数据包括医学影像,以及所述医学影像对应的标识信息、类型信息,其中至少一部分所述医学影像数据还包括标记信息和/或诊疗记录;
根据所述医学影像的类型信息,对所述采集医学影像数据进行分组,保存所述医学影像数据;
将每一分组内的医学影像数据作为分组初始训练样本,基于预训练模型,生成多个第一子模型;
接收第一请求指令,根据所述第一请求指令,提取至少一个分组内的医学影像数据中的至少一张第一医学影像;
根据请求提取的所述至少一张第一医学影像,创建并维护第一交互任务的第一动态表单;
接收至少一个用户语音指令,并根据所述语音指令,确定所述至少一个用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级;
根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息,更新所述第一动态表单;
根据所述第一动态表单更新第一子模型。
本发明还提供一种终端设备,其特征在于,所述终端设备包括处理器和存储器,所述存储器中存储有可在处理器上运行的计算机程序,所述计算机程序在被所述处理器执行时实现如上所述的方法。
本发明还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有可在处理器上运行的计算机程序、所述计算机程序在被执行时实现如上所述的方法。
通过本发明的方法,能够简化医学影像的数据标记,丰富模型训练的样本数据,提高深度学习的效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例中的一种系统。
图2是本发明一个实施例中的一种方法。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。本发明的实施例以及实施例的具体特征是对本发明实施例技术方案的详细说明,而非对本发明说明书技术方案的限定,在不冲突的情况下,本发明的实施例以及实施例的技术特征可以相互结合。
实施例一
参考图1,本发明实施例一提供一种基于人工智能的模型训练系统,所述系统包括:至少一个前端子系统,至少一个交互子系统,数据管理子系统。
所述前端子系统用于采集医学影像数据,所述医学影像数据包括医学影像,以及所述医学影像对应的标识信息、类型信息,其中至少一部分所述医学影像数据还包括标记信息和/或诊疗记录;
将所述医学影像数据发送至数据管理子系统;
所述数据管理子系统用于接收所述医学影像数据,根据所述医学影像的类型信息,对所述医学影像数据进行分组,保存所述医学影像数据;
将每一分组内的医学影像数据作为分组初始训练样本,基于预训练模型,生成多个第一子模型;
所述交互子系统用于接收第一请求指令,根据所述第一请求指令,向所述数据管理子系统发送请求,请求提取至少一个分组内的医学影像数据中的至少一张第一医学影像;
所述交互子系统根据请求提取的所述至少一张第一医学影像,创建并维护第一交互任务的第一动态表单;
所述交互子系统接收至少一个用户语音指令,并根据所述语音指令,确定所述至少一个用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级;
所述交互子系统根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息,更新所述第一动态表单;
所述交互子系统将所述更新后的第一动态表单发送给数据管理子系统;
所述数据管理子系统还用于根据所述第一动态表单更新第一子模型。
具体地,至少一个前端子系统可以分布在不同的设备,分别采集医学影像数据,也可以位于一个设备中,通过网络获取不同的采集设备采集到的医学影像数据,所述医学影像包括且不限于通过透视、放射线片、CT、MRI、超声、数字减影、血管造影获取的影像,以及与该影像相关的标识信息、类型信息、以及可能存在的标记信息和/或诊疗记录。
所述的至少一个交互子系统,可以位于一个设备中,也可以分布在不同的设备,例如配置于不同所在地的客户端,通过远程交互调用其他子系统。
所述的基于人工智能的模型训练系统中的交互子系统、前端子系统、数据管理子系统可以分布在不同的设备,也可以位于一个设备中。
具体地,利用已有的开源预训练模型,针对每一分组的分组初始训练样本,生成多个分组的第一子模型;此外,也可以基于所有分组的训练样本数据进行处理,生成第二模型。
优选地,所述类型信息包括组织区域标识;
所述数据管理子系统根据所述医学影像的组织区域标识,将所述采集医学影像数据分为多个针对不同组织区域的分组。
优选地,所述交互子系统用于接收第一请求指令,根据所述第一请求指令,向所述数据管理子系统发送请求,请求提取至少一个分组内的医学影像数据中的至少一张第一医学影像具体包括,
所述交互子系统通过语音输入装置接收用户发出的第一请求指令;
所述第一请求指令包括指定提取的所述至少一张第一医学影像的标识信息;所述标识信息可以是归档的名称、标识或编号。
所述交互子系统基于所述第一请求指令,向所述数据管理子系统发送请求,请求提取至少一个分组内的医学影像数据中的至少一张第一医学影像。
在一个优选的实施例中,在会诊场景中,该至少一张第一医学影像被提取,该至少一张第一医学影像不具备完善的标记信息和/或诊疗记录,例如,未标记或部分标记,未给出最终诊疗方案等。
优选地,所述根据提取的所述至少一张第一医学影像,创建并维护第一交互任务的第一动态表单具体包括:
提取所述至少一张第一医学影像数据;
根据所述至少一张第一医学影像的类型信息和标识信息,创建第一交互任务,以及所述第一交互任务的第一动态表单,所述动态表单包含多个候选列表项;
判断所述至少一张第一医学影像数据是否包含标记信息和/或诊疗记录,若是,基于所述标记信息和/或诊疗记录,填充所述多个候选列表项的内容域。
具体地,根据所述至少一张第一医学影像的类型信息和标识信息,创建第一交互任务,例如第一会诊任务,并基于所述至少一张第一医学影像的类型信息和标识信息确定需要标记的内容和相应的会诊要素记录,基于所述要标记的内容和相应的会诊要素记录创建所述第一会诊任务的第一动态表单,所述动态表单包含多个候选列表项,所述多个候选列表项分别对应需要标记的内容和相应的会诊要素记录。
优选地,所述接收至少一个用户语音指令,并根据所述语音指令,确定所述至少一个用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级进一步包括
接收第一用户输入的语音指令,
获取所述语音指令的声纹信息,基于所述声纹信息匹配用户,若存在匹配用户,则调用存储的该用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级;
若不存在匹配用户,则默认用户角色等级为当前任务最低优先级,或者提示用户输入其属性信息。
具体地,接收第一用户输入的语音指令,例如第一用户通过语音输入指出第一医学影像存在的动脉粥样硬化斑块位置,并给出相应的诊断描述。
交互子系统在接收到该第一用户的语音指令时,将该语音指令输入交互子系统的语音识别模块,在对该语音指令进行识别的同时,提取该语音指令的声纹信息,通过声纹匹配用户,例如事先采集医院医生的声纹信息,若存在匹配用户,则调用存储的该用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级;所述身份标识包括代码和/或姓名;所述角色等级包括职称优先级;例如根据主任医师,副主任医师,主治医师,住院医师,实习医生,见习医生,学生等进行优先级排序,例如该第一用户为副主任医师,此时记录所述第一用户的身份标识,如代码和/或姓名标识,以及所述第一用户角色等级为副主任医师,优先级2。
如果系统未匹配到对应的用户,可以默认用户角色等级为当前任务最低优先级,例如本次会审参加的人员为主治医师以上,则默认该用户角色等级为主治医师,优先级3;或者系统提示用户输入其属性信息,例如弹出窗口提示,由用户输入相应的属性信息。或者可通过后续的语音识别上下文确定该用户属性信息,例如,由于系统中未录入该医师声纹信息,导致无法识别用户的属性信息,但数据库中包含该医师的个人信息,此时,当采集的上一语音数据中包含一姓名或代码,随后该医师发出语音指令,此时可以判断,该医师为上文中提及医师,此时基于所述姓名或代码,在数据库中检索该医生的身份标识以及等级,补充其属性信息。
优选地,所述根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息,更新所述第一动态表单进一步包括
解析所述至少一个用户的语音指令,获取所述至少一个用户的语音指令的内容,基于所述语音指令的内容以及所述动态表单的多个候选列表项,确定所述语音指令的内容是否包含与所述动态表单的多个候选列表项相关联的关键信息,若包含与所述动态表单的多个候选列表项相关联的关键信息,则将所述关键信息填充至对应的候选列表项的内容域,并根据所述至少一个用户的属性信息,确定所述关键信息的优先级信息。
具体地,对所述至少一个用户的语音指令进行识别,解析所述至少一个用户的所述语音指令,获取所述至少一个用户的语音指令的内容,例如所述至少一个用户的语音指令的内容为第一医学影像存在的动脉粥样硬化斑块位置,以及相应的诊断描述。
将所述内容中表述的第一医学影像存在的动脉粥样硬化斑块位置,以及相应的诊断描述信息以及所述动态表单的多个需要标记的内容和相应的会诊要素记录的候选列表项进行匹配,确定需要填入的关键信息,在填入关键信息的同时,对该关键信息进行标注,例如{关键信息,第一用户身份标识,优先级}。
优选地,接收第二用户的语音输入指令,类似地,获取所述语音指令的声纹信息,基于所述声纹信息匹配用户,若存在匹配用户,则调用存储的该用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级;
随后根据所述第二用户语音指令的内容以及所述第二用户的属性信息,更新所述第一动态表单;
例如对所述第二用户的语音指令进行识别,解析所述第二用户的所述语音指令,获取所述第二用户的语音指令的内容,将所述内容中表述的第一医学影像存在的斑块位置,以及相应的诊断描述信息以及所述动态表单的多个需要标记的内容和相应的会诊要素记录的候选列表项进行匹配,确定需要填入的关键信息,在填入关键信息的同时,对该关键信息进行标注:{关键信息,第二用户身份标识,优先级}。
利用同样的方式,获取会诊中多位参与者的语音指令,对第一动态表单进行完善和更新;对同一候选列表项中填充的多个关键信息,依照优先级进行排序。
当同一候选列表项中填充的关键信息存在相悖时,标记该关键信息所在的候选列表项,基于关键信息的优先级,删除优先级低的相悖关键信息。或者如果最后的一个用户输入的语音指令为对本次会诊做出结论,其中包含可填充该标记的候选列表项的内容域的关键信息,则依据最后一次填充的关键信息进行判定,将与最后一次填充的关键信息相悖的关键信息删除,此时该最后一次填充的关键信息优先级别设置为最高。
具体地,在所述任务结束后,将所述更新后的第一动态表单发送给数据管理子系统;
所述数据管理子系统还用于根据所述第一动态表单,提取相应的数据,补充训练样本,更新第一子模型。
具体地,获取第一动态表单中多个候选列表项的内容域中填充的一个或多个关键信息,将其作为所述医学影像对应的标记信息和诊疗记录,从而补充训练样本,更新第一子模型。
在一个优选地实施例中,除了可以在会诊场景中,还可以应用于医学示教中,基于类似的方式,提取所述至少一张第一医学影像,同样基于所述至少一张第一医学影像的类型信息和标识信息确定需要标记的内容和相应的诊疗要素记录,创建示教任务的动态表单,所述创建动态表单包含多个候选列表项,所述多个候选列表项分别对应需要标记的内容和相应的诊断要素记录。
并基于语音指令内容,更新动态表单。在该场景下,通常参加的人员可能包括主任医师,副主任医师,主治医师,住院医师,实习医生,见习医生,学生,获取会诊中多位参与者的语音指令,对第一动态表单进行完善和更新;对同一候选列表项中填充的多个关键信息,依照优先级进行排序。当同一候选列表项中填充的关键信息存在相悖时,删除优先级低的相悖的关键信息。
通过本发明的方法,能够简化医学影像的数据标记,丰富模型训练的样本数据,提高深度学习的效果。
实施例二
参考图2,本发明实施例二还提供一种基于人工智能的模型训练方法,所述方法包括:
采集医学影像数据,所述医学影像数据包括医学影像,以及所述医学影像对应的标识信息、类型信息,其中至少一部分所述医学影像数据还包括标记信息和/或诊疗记录;
根据所述医学影像的类型信息,对所述采集医学影像数据进行分组,保存所述医学影像数据;
将每一分组内的医学影像数据作为分组初始训练样本,基于预训练模型,生成多个第一子模型;
接收第一请求指令,根据所述请求指令,提取至少一组医学影像数据中的至少一张第一医学影像;
根据请求提取的所述至少一张第一医学影像,创建并维护第一交互任务的第一动态表单;
接收至少一个用户语音指令,并根据所述语音指令,确定所述至少一个用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级;
根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息,更新所述第一动态表单;
根据所述第一动态表单更新第一子模型。
优选地,所述类型信息包括组织区域标识;
所述数据管理子系统根据所述医学影像的组织区域标识,将所述采集医学影像数据分为多个针对不同组织区域的分组。
优选地,所述根据提取的所述至少一张第一医学影像,创建并维护第一交互任务的第一动态表单具体包括
提取所述至少一张第一医学影像数据;
根据所述至少一张第一医学影像的类型信息和标识信息,创建第一交互任务,以及所述第一交互任务的第一动态表单,所述动态表单包含多个候选列表项;
判断所述至少一张第一医学影像数据是否包含标记信息和/或诊疗记录,若是,基于所述标记信息和/或诊疗记录,填充所述多个候选列表项的内容域。
优选地,所述接收至少一个用户语音指令,并根据所述语音指令,确定所述至少一个用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级进一步包括
接收第一用户输入的语音指令,
获取所述语音指令的声纹信息,基于所述声纹信息匹配用户,若存在匹配用户,则调用存储的该用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级;
若不存在匹配用户,则默认用户等级为当前任务最低优先级,或者提示用户输入其属性信息。
优选地,所述根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息,更新所述第一动态表单进一步包括
解析所述至少一个用户的语音指令,获取所述至少一个用户的语音指令的内容,基于所述语音指令的内容以及所述动态表单的多个候选列表项,确定所述语音指令的内容是否包含与所述动态表单的多个候选列表项相关联的关键信息,若包含与所述动态表单的多个候选列表项相关联的关键信息,则将所述关键信息填充至对应的候选列表项的内容域,并根据所述至少一个用户的属性信息,确定所述关键信息的优先级信息。
本发明还提供一种终端设备,其特征在于,所述终端设备包括处理器和存储器,所述存储器中存储有可在处理器上运行的计算机程序,所述计算机程序在被所述处理器执行时实现如上所述的方法。
本发明提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有可在处理器上运行的计算机程序、所述计算机程序在被执行时实现如上所述的方法。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质可以包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、闪存、可擦式可编程只读存储器(EPROM)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码。
以上说明只是为了方便理解本发明而举出的例子,不用于限定本发明的范围。在具体实现时,本领域技术人员可以根据实际情况对装置的部件进行变更、增加、减少,在不影响方法所实现的功能的基础上可以根据实际情况对方法的步骤进行变更、增加、减少或改变顺序。
尽管已经示出和描述了本发明的实施例,本领域技术人员应当理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同替换所限定,在未经创造性劳动所作的改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种基于人工智能的模型训练系统,其特征在于,所述系统包括:至少一个前端子系统,至少一个交互子系统,数据管理子系统,
所述前端子系统用于采集医学影像数据,所述医学影像数据包括医学影像,以及所述医学影像对应的标识信息、类型信息,其中至少一部分所述医学影像数据还包括标记信息和/或诊疗记录;
将所述医学影像数据发送至数据管理子系统;
所述数据管理子系统用于接收所述医学影像数据,根据所述医学影像的类型信息,对所述医学影像数据进行分组,保存所述医学影像数据;
将每一分组内的医学影像数据作为分组初始训练样本,基于预训练模型,生成多个第一子模型;
所述交互子系统用于接收第一请求指令,根据所述第一请求指令,向所述数据管理子系统发送请求,请求提取至少一个分组内的医学影像数据中的至少一张第一医学影像;
所述交互子系统根据请求提取的所述至少一张第一医学影像,创建并维护第一交互任务的第一动态表单;
所述交互子系统接收至少一个用户语音指令,并根据所述语音指令,确定所述至少一个用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级;
所述交互子系统根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息,更新所述第一动态表单;
所述交互子系统将所述更新后的第一动态表单发送给数据管理子系统;
所述数据管理子系统还用于根据所述第一动态表单更新第一子模型。
2.根据权利要求1所述的系统,其特征在于,
所述类型信息包括组织区域标识;
所述数据管理子系统根据所述医学影像的组织区域标识,将所述采集医学影像数据分为多个针对不同组织区域的分组。
3.根据权利要求1所述的系统,其特征在于,所述根据提取的所述至少一张第一医学影像,创建并维护第一交互任务的第一动态表单具体包括
提取所述至少一张第一医学影像数据;
根据所述至少一张第一医学影像的类型信息和标识信息,创建第一交互任务,以及所述第一交互任务的第一动态表单,所述动态表单包含多个候选列表项;
判断所述至少一张第一医学影像数据是否包含标记信息和/或诊疗记录,若是,基于所述标记信息和/或诊疗记录,填充所述多个候选列表项的内容域。
4.根据权利要求3所述的系统,其特征在于,所述接收至少一个用户语音指令,并根据所述语音指令,确定所述至少一个用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级进一步包括
接收第一用户输入的语音指令,
获取所述语音指令的声纹信息,基于所述声纹信息匹配用户,若存在匹配用户,则调用存储的该用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级;
若不存在匹配用户,则默认用户角色等级为当前任务最低优先级,或者提示用户输入其属性信息。
5.根据权利要求3所述的系统,其特征在于,所述根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息,更新所述第一动态表单进一步包括
解析所述至少一个用户的语音指令,获取所述至少一个用户的语音指令的内容,基于所述语音指令的内容以及所述动态表单的多个候选列表项,确定所述语音指令的内容是否包含与所述动态表单的多个候选列表项相关联的关键信息,若包含与所述动态表单的多个候选列表项相关联的关键信息,则将所述关键信息填充至对应的候选列表项的内容域,并根据所述至少一个用户的属性信息,确定所述关键信息的优先级信息。
6.一种基于人工智能的模型训练方法,其特征在于,所述方法包括:
采集医学影像数据,所述医学影像数据包括医学影像,以及所述医学影像对应的标识信息、类型信息,其中至少一部分所述医学影像数据还包括标记信息和/或诊疗记录;
根据所述医学影像的类型信息,对所述采集医学影像数据进行分组,保存所述医学影像数据;
将每一分组内的医学影像数据作为分组初始训练样本,基于预训练模型,生成多个第一子模型;
接收第一请求指令,根据所述第一请求指令,提取至少一个分组内的医学影像数据中的至少一张第一医学影像;
根据请求提取的所述至少一张第一医学影像,创建并维护第一交互任务的第一动态表单;
接收至少一个用户语音指令,并根据所述语音指令,确定所述至少一个用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级;
根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息,更新所述第一动态表单;
根据所述第一动态表单更新第一子模型。
7.根据权利要求6所述的方法,其特征在于,
所述类型信息包括组织区域标识。
8.根据权利要求6所述的方法,其特征在于,所述根据提取的所述至少一张第一医学影像,创建并维护第一交互任务的第一动态表单具体包括
提取所述至少一张第一医学影像数据;
根据所述至少一张第一医学影像的类型信息和标识信息,创建第一交互任务,以及所述第一交互任务的第一动态表单,所述动态表单包含多个候选列表项;
判断所述至少一张第一医学影像数据是否包含标记信息和/或诊疗记录,若是,基于所述标记信息和/或诊疗记录,填充所述多个候选列表项的内容域。
9.根据权利要求8所述的方法,其特征在于,所述接收至少一个用户语音指令,并根据所述语音指令,确定所述至少一个用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级进一步包括
接收第一用户输入的语音指令,
获取所述语音指令的声纹信息,基于所述声纹信息匹配用户,若存在匹配用户,则调用存储的该用户的属性信息,所述属性信息包括用户身份标识以及用户角色等级;
若不存在匹配用户,则默认用户等级为当前任务最低优先级,或者提示用户输入其属性信息。
10.根据权利要求8所述的方法,其特征在于,所述根据所述至少一个用户语音指令的内容以及所述至少一个用户的属性信息,更新所述第一动态表单进一步包括
解析所述至少一个用户的语音指令,获取所述至少一个用户的语音指令的内容,基于所述语音指令的内容以及所述动态表单的多个候选列表项,确定所述语音指令的内容是否包含与所述动态表单的多个候选列表项相关联的关键信息,若包含与所述动态表单的多个候选列表项相关联的关键信息,则将所述关键信息填充至对应的候选列表项的内容域,并根据所述至少一个用户的属性信息,确定所述关键信息的优先级信息。
11.一种终端设备,其特征在于,所述终端设备包括处理器和存储器,所述存储器中存储有可在处理器上运行的计算机程序,所述计算机程序在被所述处理器执行时实现如权利要求1至5任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有可在处理器上运行的计算机程序、所述计算机程序在被执行时实现如权利要求1至5任一项所述的方法。
CN201910967379.6A 2019-10-12 2019-10-12 一种基于人工智能的模型训练系统与方法 Expired - Fee Related CN110796180B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910967379.6A CN110796180B (zh) 2019-10-12 2019-10-12 一种基于人工智能的模型训练系统与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910967379.6A CN110796180B (zh) 2019-10-12 2019-10-12 一种基于人工智能的模型训练系统与方法

Publications (2)

Publication Number Publication Date
CN110796180A CN110796180A (zh) 2020-02-14
CN110796180B true CN110796180B (zh) 2022-06-07

Family

ID=69438937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910967379.6A Expired - Fee Related CN110796180B (zh) 2019-10-12 2019-10-12 一种基于人工智能的模型训练系统与方法

Country Status (1)

Country Link
CN (1) CN110796180B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111462865A (zh) * 2020-02-28 2020-07-28 平安国际智慧城市科技股份有限公司 医疗影像识别模型生成方法、装置、计算机设备和介质
CN112235526B (zh) * 2020-10-10 2021-11-23 江苏环亚医用科技集团股份有限公司 一种基于智慧医疗平台的患者探视方法和装置
CN112632391A (zh) * 2020-12-30 2021-04-09 深圳市华傲数据技术有限公司 数据处理方法、设备及存储介质
CN113450352B (zh) * 2021-08-26 2022-02-01 深圳科亚医疗科技有限公司 一种病理图像的训练集处理方法和系统

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7280965B1 (en) * 2003-04-04 2007-10-09 At&T Corp. Systems and methods for monitoring speech data labelers
CN103544954A (zh) * 2012-07-17 2014-01-29 北京千橡网景科技发展有限公司 用于向语音消息添加文字标签的方法和装置
CN104075718A (zh) * 2014-06-10 2014-10-01 厦门大学 固定线路的行人行走路线定位方法
CN104156794A (zh) * 2013-03-13 2014-11-19 西门子公司 连接应用和工具的方法、设备、系统和计算机可读介质
CN104732208A (zh) * 2015-03-16 2015-06-24 电子科技大学 基于稀疏子空间聚类的视频人体行为识别方法
CN105678253A (zh) * 2016-01-04 2016-06-15 东南大学 半监督人脸年龄估计装置及半监督人脸年龄估计方法
CN105868537A (zh) * 2016-03-24 2016-08-17 江南大学附属医院 Pet-ct动态医学影像智能定量分析系统和分析方法
CN107430859A (zh) * 2015-04-08 2017-12-01 谷歌公司 将输入映射到表单域
CN107424612A (zh) * 2017-07-28 2017-12-01 北京搜狗科技发展有限公司 处理方法、装置和机器可读介质
CN107633225A (zh) * 2017-09-18 2018-01-26 北京金山安全软件有限公司 一种信息获得方法及装置
CN107808661A (zh) * 2017-10-23 2018-03-16 中央民族大学 一种基于协作式批量主动学习的藏语语音语料标注方法及系统
CN108597566A (zh) * 2018-04-17 2018-09-28 广东南海鹰视通达科技有限公司 基于人脸识别的移动电子病历系统及实现方法
CN108616711A (zh) * 2018-04-03 2018-10-02 北京华纬讯电信技术有限公司 一种基于视频信号解决信息网络隔离的交互方法
CN109412882A (zh) * 2017-08-18 2019-03-01 中兴通讯股份有限公司 特征提取方法、装置、服务器及计算机可读存储介质
CN109492120A (zh) * 2018-10-31 2019-03-19 四川大学 模型训练方法、检索方法、装置、电子设备及存储介质
CN109508376A (zh) * 2018-11-23 2019-03-22 四川长虹电器股份有限公司 可在线纠错更新的意图识别方法及装置
CN109783046A (zh) * 2016-06-10 2019-05-21 苹果公司 多任务环境中的智能数字助理
CN109992248A (zh) * 2019-02-25 2019-07-09 百度在线网络技术(北京)有限公司 语音应用的实现方法、装置、设备及计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100332229A1 (en) * 2009-06-30 2010-12-30 Sony Corporation Apparatus control based on visual lip share recognition
CN106997767A (zh) * 2017-03-24 2017-08-01 百度在线网络技术(北京)有限公司 基于人工智能的语音处理方法及装置

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7280965B1 (en) * 2003-04-04 2007-10-09 At&T Corp. Systems and methods for monitoring speech data labelers
CN103544954A (zh) * 2012-07-17 2014-01-29 北京千橡网景科技发展有限公司 用于向语音消息添加文字标签的方法和装置
CN104156794A (zh) * 2013-03-13 2014-11-19 西门子公司 连接应用和工具的方法、设备、系统和计算机可读介质
CN104075718A (zh) * 2014-06-10 2014-10-01 厦门大学 固定线路的行人行走路线定位方法
CN104732208A (zh) * 2015-03-16 2015-06-24 电子科技大学 基于稀疏子空间聚类的视频人体行为识别方法
CN107430859A (zh) * 2015-04-08 2017-12-01 谷歌公司 将输入映射到表单域
CN105678253A (zh) * 2016-01-04 2016-06-15 东南大学 半监督人脸年龄估计装置及半监督人脸年龄估计方法
CN105868537A (zh) * 2016-03-24 2016-08-17 江南大学附属医院 Pet-ct动态医学影像智能定量分析系统和分析方法
CN109783046A (zh) * 2016-06-10 2019-05-21 苹果公司 多任务环境中的智能数字助理
CN107424612A (zh) * 2017-07-28 2017-12-01 北京搜狗科技发展有限公司 处理方法、装置和机器可读介质
CN109412882A (zh) * 2017-08-18 2019-03-01 中兴通讯股份有限公司 特征提取方法、装置、服务器及计算机可读存储介质
CN107633225A (zh) * 2017-09-18 2018-01-26 北京金山安全软件有限公司 一种信息获得方法及装置
CN107808661A (zh) * 2017-10-23 2018-03-16 中央民族大学 一种基于协作式批量主动学习的藏语语音语料标注方法及系统
CN108616711A (zh) * 2018-04-03 2018-10-02 北京华纬讯电信技术有限公司 一种基于视频信号解决信息网络隔离的交互方法
CN108597566A (zh) * 2018-04-17 2018-09-28 广东南海鹰视通达科技有限公司 基于人脸识别的移动电子病历系统及实现方法
CN109492120A (zh) * 2018-10-31 2019-03-19 四川大学 模型训练方法、检索方法、装置、电子设备及存储介质
CN109508376A (zh) * 2018-11-23 2019-03-22 四川长虹电器股份有限公司 可在线纠错更新的意图识别方法及装置
CN109992248A (zh) * 2019-02-25 2019-07-09 百度在线网络技术(北京)有限公司 语音应用的实现方法、装置、设备及计算机可读存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
J. A. Louw 等.Speaker specific phrase break modeling with conditional random fields for text-to-speech.《2016 Pattern Recognition Association of South Africa and Robotics and Mechatronics International Conference》.2016, *
Lotfian R 等.Building naturalistic emotionally balanced speech corpus by retrieving emotional speech from existing podcast recordings.《IEEE Transactions on Affective Computing》.2017,第10卷(第4期), *
王瑞琳 等.先天性肝纤维化合并常染色体显性遗传多囊肾超声诊断1例.《中国超声医学杂志》.2018,第34卷(第09期), *
田枫 等.一种适合弱标签数据集的图像语义标注方法.《软件学报》.2013,第24卷(第10期), *
蔡莲红 等.汉语普通话语音合成语料库TH-CoSS的建设和分析.《中文信息学报》.2007,(第02期), *

Also Published As

Publication number Publication date
CN110796180A (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
CN110796180B (zh) 一种基于人工智能的模型训练系统与方法
US10929420B2 (en) Structured report data from a medical text report
CN112712879B (zh) 医学影像报告的信息提取方法、装置、设备及存储介质
CN112015917A (zh) 基于知识图谱的数据处理方法、装置及计算机设备
CN110610751A (zh) 一种电子病历录入系统及方法
CN109935294A (zh) 一种文本报告输出方法、装置、存储介质及终端
DE102005021860A1 (de) System zum Verwalten von gespeicherter medizinischer Audioinformation
WO2021208444A1 (zh) 电子病例自动生成方法、装置、设备及存储介质
CN112634889B (zh) 基于人工智能的电子病例录入方法、装置、终端及介质
KR102111775B1 (ko) 진료 데이터 수집 관리 시스템 및 방법
CN111462865A (zh) 医疗影像识别模型生成方法、装置、计算机设备和介质
WO2013160382A1 (en) A system for reviewing medical image datasets
CN113689951A (zh) 一种智能导诊方法、系统和计算机可读存储介质
CN112837772A (zh) 一种预问诊病历生成方法及装置
US20140343963A1 (en) Dynamic Superbill Coding Workflow
CN116910105A (zh) 一种基于预训练大模型的医疗信息查询系统及方法
CN109065015B (zh) 一种数据采集方法、装置、设备及可读存储介质
CN113241175B (zh) 基于边缘计算的帕金森症辅助诊断系统和方法
CN113722507B (zh) 基于知识图谱的住院费用预测方法、装置及计算机设备
CN114360678A (zh) 信息处理方法、装置、设备和存储介质
CN117421413A (zh) 一种问答对生成方法、装置及电子设备
CN112259182A (zh) 一种电子病历的生成方法和装置
WO2021026533A1 (en) Method of labeling and automating information associations for clinical applications
CN114360671A (zh) 电子病历的生成方法和装置、存储介质和电子装置
CN117174231A (zh) 一种智能病历管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220607