CN111462865A - 医疗影像识别模型生成方法、装置、计算机设备和介质 - Google Patents

医疗影像识别模型生成方法、装置、计算机设备和介质 Download PDF

Info

Publication number
CN111462865A
CN111462865A CN202010128465.0A CN202010128465A CN111462865A CN 111462865 A CN111462865 A CN 111462865A CN 202010128465 A CN202010128465 A CN 202010128465A CN 111462865 A CN111462865 A CN 111462865A
Authority
CN
China
Prior art keywords
image
medical
information
file
labeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010128465.0A
Other languages
English (en)
Inventor
丁思雨
丁文静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Smart Healthcare Technology Co.,Ltd.
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202010128465.0A priority Critical patent/CN111462865A/zh
Priority to PCT/CN2020/097964 priority patent/WO2021169101A1/zh
Publication of CN111462865A publication Critical patent/CN111462865A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Radiology & Medical Imaging (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Library & Information Science (AREA)

Abstract

本申请涉及大数据领域,特别涉及一种医疗影像识别模型生成方法、装置、计算机设备和介质。方法包括:获取医疗数据;提取医疗数据中的医疗影像,对医疗影像进行特征提取得到影像特征;提取医疗数据中的医疗文件,对医疗文件进行解析生成标注信息,查找标注信息中与医疗影像对应的影像标注信息;根据影像特征以及影像标注信息建立映射关系,根据映射关系生成影像标注文件;将影像标注文件输入机器学习模型,以通过机器学习模型学习影像标注文件中影像特征与影像标注信息之间的特征关系,根据特征关系生成医疗影像识别模型。采用本方法能够实现医疗影像识别模型的自动建立。

Description

医疗影像识别模型生成方法、装置、计算机设备和介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种医疗影像识别模型生成方法、装置、计算机设备和介质。
背景技术
随着经济的快速发展和生活水平的提高,人们对健康问题越来越关注,如今利用医疗设备采集人体器官影像图,已经得到了广泛的应用。
但是通过医疗设备采取的医疗影像必须依靠医疗专业的人士才能识别,并且人工进行识别也不能保证对医疗影像中信息识别的准确度,虽然传统技术中有根据医疗文件建立的医疗文件库,通过查询医疗文件库可获取医疗影像信息,但是目前构建医疗文件库的方法大多是人工建立,使得模型建立的效率低下。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高模型生成效率的医疗影像识别模型生成方法、装置、计算机设备和介质。
一种医疗影像识别模型生成方法,所述方法包括:
获取医疗数据;
提取所述医疗数据中的医疗影像,对所述医疗影像进行特征提取得到影像特征;
提取所述医疗数据中的医疗文件,对所述医疗文件进行解析生成标注信息,查找所述标注信息中与所述医疗影像对应的影像标注信息;
根据所述影像特征以及所述影像标注信息建立映射关系,根据所述映射关系生成影像标注文件;
将所述影像标注文件输入机器学习模型,以通过机器学习模型学习所述影像标注文件中所述影像特征与所述影像标注信息之间的特征关系,根据所述特征关系生成医疗影像识别模型。
在一个实施例中,所述对医疗影像进行特征提取得到影像特征,包括:
提取所述医疗影像中的标注信息;
获取所述标注信息对应的位置坐标;
从医疗影像中提取与所述位置坐标对应的区域医疗影像;
利用图像特征提取算法提取所述区域医疗影像的影像特征。
在一个实施例中,所述对所述医疗文件进行解析生成标注信息之后,还包括:
将所述标注信息按照预设的规则分割为单元标注信息;
将所述单元标注信息与标注信息数据库中的信息进行匹配,将匹配度最大的信息提取为标注信息。
在一个实施例中,所述根据所述影像特征以及所述影像标注信息建立映射关系,根据所述映射关系生成影像标注文件,包括:
获取所述医疗影像对应的影像标识;
查找所述影像标识对应的影像解析方法;
利用所述影像解析方法对所述医疗影像关联的属性信息进行解析,生成影像标签信息;
根据所述影像特征、所述影像标注信息以及所述影像标签信息建立映射关系,根据映射关系生成影像标注文件。
在一个实施例中,所述根据所述映射关系生成影像标注文件之后,还包括:
接收终端发送的查询请求,提取所述查询请求中携带的查询标识;
提取所述影像标注文件对应的影像标识;
计算所述查询标识与各所述影像标识的匹配度;
将所述匹配度最大的所述影像标识关联的所述影像标注文件推送至终端。
在一个实施例中,所述生成医疗影像识别模型之后,还包括:
接收终端发送的医疗影像;
将所述医疗影像输入所述医疗影像识别模型,以通过所述医疗影像识别模型提取所述医疗影像对应的所述影像特征,根据所述医疗影像特征得到所述影像标注信息;
将影像标注信息推送至所述终端。
一种医疗影像识别模型生成装置,所述装置包括:
数据获取模块,用于获取医疗数据;
特征提取模块,用于提取所述医疗数据中的医疗影像,对所述医疗影像进行特征提取得到影像特征;
标注生成模块,用于提取所述医疗数据中的医疗文件,对所述医疗文件进行解析生成标注信息,查找所述标注信息中与所述医疗影像对应的影像标注信息;
影像文件生成模块,用于根据所述影像特征以及所述影像标注信息建立映射关系,根据所述映射关系生成影像标注文件;
模型生成模块,用于将所述影像标注文件输入机器学习模型,以通过机器学习模型学习所述影像标注文件中所述影像特征与所述影像标注信息之间的特征关系,根据所述特征关系生成医疗影像识别模型。
在一个实施例中,所述特征提取模块包括:
影像标注信息提取单元,用于提取所述医疗影像中的标注信息;
坐标获取单元,用于获取所述标注信息对应的位置坐标;
区域影像提取单元,用于从医疗影像中提取与所述位置坐标对应的区域医疗影像;
区域特征提取单元,用于利用图像特征提取算法提取所述区域医疗影像的影像特征。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
上述医疗影像识别模型生成方法、装置、计算机设备和介质,获取医疗数据;提取医疗数据中的医疗影像,对医疗影像进行特征提取得到影像特征,实现了医疗数据中医疗影像的影像特征的自动识别与提取;提取医疗数据中的医疗文件,对医疗文件进行解析生成标注信息,实现了对医疗数据中医疗文件的自动识别与解析,查找标注信息中与医疗影像对应的影像标注信息,实现了从医疗文件中提取与医疗影像对应的影像标注信息;进而可以根据影像特征以及影像标注信息建立映射关系,根据映射关系生成影像标注文件;然后将影像标注文件输入机器学习模型,以通过机器学习模型学习影像标注文件中影像特征与影像标注信息之间的特征关系,根据特征关系生成医疗影像识别模型。进而实现了自动建立模型,提高了模型建立的效率。
附图说明
图1为一个实施例中医疗影像识别模型生成方法的应用场景图;
图2为一个实施例中医疗影像识别模型生成方法的流程示意图;
图3为一个实施例中医疗影像识别模型生成方法及使用方法的流程示意图;
图4为另一个实施例中医疗影像识别模型生成方法的流程示意图;
图5为一个实施例中医疗影像识别模型生成装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的医疗影像识别模型生成方法,可以应用于如图1所示的应用环境中。其中,用户终端102通过网络与服务器104进行通信。服务器104获取医疗数据;服务器104提取医疗数据中的医疗影像,对医疗影像进行特征提取得到影像特征;服务器104提取医疗数据中的医疗文件,对医疗文件进行解析生成标注信息,服务器104查找标注信息中与医疗影像对应的影像标注信息;服务器104根据影像特征以及影像标注信息建立映射关系,根据映射关系生成影像标注文件;将影像标注文件输入机器学习模型,以通过机器学习模型学习影像标注文件中影像特征与影像标注信息之间的特征关系,根据特征关系生成医疗影像识别模型,进一步地,还可以将医疗影像识别模型推送至用户终端102。
其中,用户终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。当服务器104为独立的服务器时,服务器104中可以部署多个数据库,每个数据库中可以存储特定的医疗文件;当服务器104为多个服务器组成的服务器集群时,每个服务器中部署的数据库中可以存储特定的医疗文件数据表。
在一个实施例中,如图2所示,提供了一种医疗影像识别模型生成方法的流程示意图,以该方法应用于图1中的服务器104为例进行说明,在其他实施例中,该方法也可以应用于终端,方法包括以下步骤:
步骤210,获取医疗数据。
医疗数据至少包含医疗过程中产生的医疗影像以及医疗文件。具体地,用户终端借助客户端上传医疗数据,服务器获取用户终端上传的医疗数据,以对医疗数据进行数据分析。
步骤220,提取医疗数据中的医疗影像,对医疗影像进行特征提取得到影像特征。
医疗影像可为医疗设备采集到的人体结构图,医疗影像不仅包含医疗影像本身,还可能会具有与医疗影像关联的属性信息,如属性信息可为医疗影像对应的标签信息、诊断描述信息以及标注结果信息等医疗影像的辅助信息。并且医疗影像也可具有多种存储格式。
具体地,服务器可以利用图像特征提取算法提取医疗影像对应的影像特征。如利用方向梯度直方图(Histogram of Oriented Gradient,HOG)特征提取算法、局部二值模式(Local Binary Pattern,LBP)特征提取算法、或者Haar特征提取算法等提取医疗影像对应的影像特征,如影像特征可为“凸起”、“色调暗”等。
进一步地,在对医疗影像进行特征提取之前还包括:服务器对获取的医疗影像进行预处理,如对医疗影像进行增强处理或者滤波处理等,以提高服务器对医疗影像进行特征提取的精度。
步骤230,提取医疗数据中的医疗文件,对医疗文件进行解析生成标注信息,查找标注信息中与医疗影像对应的影像标注信息。
医疗文件可为就医过程中产生的文字信息等,并且医疗文件可具有多种格式,如可为医疗纸质病历本或者医疗电子病历文档等,更加具体地,医疗电子病历文档可为excel、xml等文件格式。具体地,服务器从医疗数据中提取医疗文件,对医疗文件进行解析生成标注信息,其中标注信息可为医疗专业人员给出的诊断信息等。如医疗文件中可包含对医疗影像的标注信息,其中标注信息可为医疗专业人员给出的针对医疗影像的诊断信息。
具体地,服务器可利用关键词提取技术从医疗文件中提取标注信息,并且当获取的医疗文件为医疗纸质病历本时,服务器还包括对纸质病历本进行电子化处理,得到电子病历文档,然后从电子病历文档中解析出所需的标注信息,其中解析是指从医疗文件中提取所需信息的过程,标注信息可为病因、诊断建议或者诊断结果等。如服务器可以根据关键词匹配技术提取医疗文本中对医疗影像的标注信息,如针对该医疗影像的诊断结果对应的标注信息可以为“肿块”、“阴影”等。
步骤240,根据影像特征以及影像标注信息建立映射关系,根据映射关系生成影像标注文件。
将影像特征与影像标注信息进行关联,建立映射关系,得到影像标注文件。如其中一条影像标注文件可为:阴影-肺囊肿,表明当服务器提取的医疗影像特征为“阴影”时,此时对应的影像标注信息应该为“肺囊肿”,实现根据医疗影响自动获取标注信息的功能。
进一步地,服务器还可以将获取的影像标注文件进行数据处理,如进行数据清洗、数据治理、数据核验等,以使得获取的数据更加标准。
步骤250,将影像标注文件输入机器学习模型,以通过机器学习模型学习影像标注文件中影像特征与影像标注信息之间的特征关系,根据特征关系生成医疗影像识别模型。
将预先获取影像标注文件作为样本集,服务器利用样本集对机器学习模型进行训练得到影像特征与影像标注信息的关联关系,根据关联关系得到医疗影像识别模型。由于医疗影像识别模型中存储了影像特征与影像标注信息之间的对应关系,进而可以利用医疗影像识别模型实现对医疗影像特征或者影像标注信息的自动获取。
在本实施例中,服务器提取医疗数据中的医疗影像以及医疗文本,提取医疗影像对应的影像特征以及医疗文本中的标注信息,实现了自动从医疗数据中提取医疗信息,提高对医疗数据的处理效率和准确性。并根据影像特征以及标注信息建立影像标注文件,将影像标注文件作为样本集对机器学习模型进行训练,得到医疗影像识别模型,进而可以利用医疗影像识别模型实现对影像标注信息的自动提取,提高了对医疗数据的识别准确率以及识别效率。
并且,在本实施例中不仅可以实现对医疗文本的自动处理,还可以实现对医疗影像的自动处理,提高了对不同格式的医疗数据处理的能力,并且医疗影像中具有更多的医疗特征信息,通过识别医疗影像数据也使得医疗数据的获取更加全面。
在一个实施例中,根据影像特征以及影像标注信息建立映射关系,根据映射关系生成影像标注文件,包括:获取医疗影像对应的影像标识;查找影像标识对应的影像解析方法;利用影像解析方法对医疗影像关联的属性信息进行解析,生成影像标签信息;根据影像特征、影像标注信息以及影像标签信息建立映射关系,根据映射关系生成影像标注文件。
影像标识用于唯一识别医疗影像的类别,其中医疗影像的类别可为影像的存储格式。不同的医疗影像可存储为不同的医疗影像格式,不同格式的医疗影像包含的信息各不相同,且使用场景也不一样,在传统技术中都是通过相应的客户端工具读取查看不同格式的医疗影像,这就需要用户下载多种工具且知道对应工具的使用说明,给用户带来了极大的不便,并且也是的医疗影像查看效率的低下。
具体地,不同格式的医疗影像需要不同的解析方法实现对医疗影像的解析。服务器从医疗数据中提取医疗影像,获取医疗影像对应的影像标识,调用与影像标识关联的影像解析方法,以根据影像解析方法对医疗影像关联的属性信息进行自动解析生成影像标签信息。例如存储格式可为DICOM、ndpi、tiff、jpg、bmp、png等。如对于DICOM格式的医疗影像,可利用基于C++的DCMTK、基于Java的dcm4che以及基于python的pydicom进行解析。再例如利用dcm4che解析DICOM文件的tag信息,利用opencv解析处理病理和眼底等医疗影像。
其中,利用影像解析方法对医疗影像对应的属性信息进行提取、解析,得到所需的影像标签信息。如医疗影像关联的属性信息可为编码信息,服务器根据查找得到的影像解析方法对编码信息进行解析、转换得到影像标签信息,如解析出来的影像标签信息为:Tag.PatientID--患者唯一标识、Tag.PatientName--患者姓名、Tag.PatientAge--患者年龄、Tag.PatientSex--患者性别、Tag.StudyID--检查标识、Tag.StudyDate--检查日期等。
在本实施例中,通过识别医疗影像的格式,根据不同的格式选择对应的医疗影像解析方法,进而实现了利用不同的医疗影像解析方法识别不同格式下的医疗影像,提高了对医疗影像的识别范围以及对医疗影像格式的适应性,提高了对医疗影像的处理能力。解决传统技术中对于不同格式的医疗影像的查看过程需要获取其他医疗文件辅助说明,如标注结果、诊断结果、电子病历等,并且这些辅助文件格式、内容区别也是很大,使得用户对医疗影像的存储、管理、查看、对比等带来了极大不便。
在一个实施例中,对医疗影像进行特征提取得到影像特征,包括:提取医疗影像中的标注信息;获取标注信息对应的位置坐标;从医疗影像中提取与位置坐标对应的区域医疗影像;利用图像特征提取算法提取区域医疗影像的影像特征。
医疗影像中的标注信息可以为对医疗影像中需要重点关注的区域进行标识的信息,具体地,标注信息可以基于已经脱敏的内部标注平台生成的xml、json等文件解析出。
位置坐标可为标注信息在医疗影像中的坐标,服务器通过坐标可以获取需要重点关注区域对应的区域医疗影像。
具体地,服务器可以利用HOG特征提取算法、LBP特征提取算法、Haar特征提取算法等自动提取区域医疗影像对应的影像特征,例如提取到的影像特征可为“凸起”、“色调暗”。服务器可以根据关键词匹配技术提取医疗文本中对区域医疗影像的标注信息,例如标注信息可以为“肿块”、“阴影”等。
在本实施例中,根据医疗影像中的坐标自动提取医疗影像中的区域医疗影像,实现自动化提取医疗影像中的重点区域,以及重点区域的区域特征,进而可以实现对区域医疗影像的操作步骤,提高了对医疗影像数据处理的效率。
在一个实施例中,对医疗文件进行解析生成标注信息之后,还包括:将标注信息按照预设的规则分割为单元标注信息;将单元标注信息与标注信息数据库中的信息进行匹配,将匹配度最大的信息提取为标注信息。
服务器对医疗文件进行解析生成的标注信息可为专业人士,例如医生对患者的诊断建议,由于不同的医生对同一个疾病的描述可能会有不同的表述方式,故而此时得到的标注信息可能存在对同一个事项的文字表述不一致情况。
为了对标注信息进行标准化处理,服务器可利用中文自然语言处理分词方法,如HanLP进行汉语分词处理,将获得的标注信息根据一定规则进行切分和调整,得到多个单元标注信息,然后将单元标注信息与标注信息数据库如词典中的词语进行匹配,将词典中匹配度最大的信息提取为标注信息。由于词典中存储的信息都是标准化的信息,故而利用词典匹配技术可以实现对标注信息的标准化处理。
如中文分词方法有基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法等。
在本实施例中,基于HanLP进行汉语分词处理生成标注信息,实现了对标注信息的标准化处理,便于后续数据检索。
在一个实施例中,根据映射关系生成影像标注文件之后,还包括:接收终端发送的查询请求,提取查询请求中携带的查询标识;提取影像标注文件对应的影像标识;计算查询标识与各影像标识的匹配度;将匹配度最大的影像标识关联的影像标注文件推送至终端。
进一步地,根据各影像特征以及对应的影像标注信息建立影像标注文件后,还包括将各影像标注文件与对应的影像标识进行关联,生成影像标注文件库,即影像标注文件库中存储了不同影像标识对应的影像标注文件,如存储了“肺部—肺部影像标注文件、胃部-胃部影像标注文件等”。
当用户终端想要从影像标注文件库中查找医疗影像诊断建议时,用户终端向服务器发送查询请求,服务器根据获取到的查询请求从影像标注文件库中匹配到对应的影像标注文件,将影像标注文件推送至用户终端,进而用户可以跟据查询到的影像标注文件进行操作。例如,用户可以将自己的医疗影像与获取的影像标注文件中的医疗影像进行匹配,进而通过查询影像标注文件库中对医疗影像的标注信息,实现获取对个人病理情况的诊断建议。
具体地,用户终端可向服务器发送查询请求,如可为影像查询请求。服务器提取查询请求中携带的查询标识,如提取影像查询请求中携带的影像查询标识。然后服务器将获取的查询标识与影像标注文件对应的影像标识进行匹配,将匹配成功的影像标识关联的影像标注文件推送至用户终端,以实现用户通过查询请求就可以获取对应的影像标注文件的功能。
再如用户想要获取关于某一类型疾病对应的影像标注文件,只需根据查询请求就可以获取相应的文件,具体地,用户可将获取影像标注文件作为参考文件,可以将其关注的医疗影像与获取的参考影像标注文件中的医疗影像进行比对,进而可以获取关于其关注的医疗影像的参考影像特征以及参考影像标注信息,帮助用户及时获取专业的医疗影像建议。
在本实施例中,服务器获取用户的查询请求,进而可以向用户推送对应的影像标注文件,实现了影像标注文件的自动获取,提高了文件的获取效率。
如图3所示,提供了一种医疗影像识别模型生成方法以及使用方法的流程示意图,包括:
步骤310,获取医疗数据。
步骤320,提取医疗数据中的医疗影像,对医疗影像进行特征提取得到影像特征。
步骤330,提取医疗数据中的医疗文件,对医疗文件进行解析生成标注信息,查找标注信息中与医疗影像对应的影像标注信息。
步骤340,根据影像特征以及影像标注信息建立映射关系,根据映射关系生成影像标注文件。
步骤350,将影像标注文件输入机器学习模型,以通过机器学习模型学习影像标注文件中影像特征与影像标注信息之间的特征关系,根据特征关系生成医疗影像识别模型。
关于步骤310至步骤350的具体实施例可以参考前文中步骤210至步骤250的描述,在此不做赘述。
生成医疗影像识别模型之后,还包括:
步骤360,接收终端发送的医疗影像。
具体地,用户终端可以向服务器发送医疗影像,其中对用户终端发送的医疗影像的格式不做限制。服务器接收用户终端发送的医疗影像。
步骤370,将医疗影像输入医疗影像识别模型,以通过医疗影像识别模型提取医疗影像对应的影像特征,根据医疗影像特征得到影像标注信息。
由于医疗影像识别模型具有识别医疗影像特征以及医疗影像标注信息的功能,故而服务器根据训练好的医疗影像识别模型对获取的医疗影像进行识别,进而得到医疗影像对应的影像标注信息,实现对医疗影像的自动识别。
步骤380,将影像标注信息推送至终端。
服务器将根据医疗影像识别模型识别到的影像标注信息推送至用户终端。
在本实施例中,利用训练好的医疗影像识别模型可以实现对任何格式的医疗影像的识别,实现对医疗影像的自动识别以及自动标注,并且利用大数据自动训练得到的医疗影像识别模型得到的识别结果更加准确,识别效率更高。
如图4所示,提供了另一个实施例中医疗影像识别模型生成的流程示意图,包括:
步骤400,获取DICOM、ndpi、tiff、jpg、bmp、png格式的文件。
具体地,服务器可以获取多种格式的医疗文件,其中服务器可获取用户终端上传的文件。
步骤410,获取诊断文件、标注文件、电子病历。
具体地,服务器可以获取医疗文件中的诊断文件、标注文件以及电子病历等。其中,服务器可获取用户终端上传的文件。
步骤420,上传客户端。
具体地,将在步骤400以及步骤410中获取的医疗文件,上传至客户端。然后服务器可以基于获取的多种格式的医疗文件调用相应的解析算法进行解析,得到步骤430中的医疗影像以及步骤440中的元数据信息,其中,元数据信息可为标注信息,包括tag标签信息、诊断信息以及其他标注信息等。
步骤450,获取医疗标签库。
包括服务器对在步骤440中获取的元数据信息进行清洗、治理等操作,得到标准化后的元数据信息,根据标准化后的元数据信息生成医疗标签库,其中医疗标签库可为影像标注文件。
步骤460,医疗影像管理平台。
服务器将在步骤430以及步骤450中获取的数据上传至医疗影像管理平台,其中医疗影像管理平台可为影像标注文件库,其中存储了多种类型的影像标注文件。然后利用医疗影像管理平台可以进行步骤470医疗影像检索、步骤480医疗影像导出以及步骤490中的智能标注功能。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种医疗影像识别模型生成装置,包括:
数据获取模块510,用于获取医疗数据。
特征提取模块520,用于提取所述医疗数据中的医疗影像,对所述医疗影像进行特征提取得到影像特征。
标注生成模块530,用于提取所述医疗数据中的医疗文件,对所述医疗文件进行解析生成标注信息,查找所述标注信息中与所述医疗影像对应的影像标注信息。
影像文件生成模块540,用于根据所述影像特征以及所述影像标注信息建立映射关系,根据所述映射关系生成影像标注文件。
模型生成模块550,用于将所述影像标注文件输入机器学习模型,以通过机器学习模型学习所述影像标注文件中所述影像特征与所述影像标注信息之间的特征关系,根据所述特征关系生成医疗影像识别模型。
在一个实施例中,所述特征提取模块520包括:
影像标注信息提取单元,用于提取所述医疗影像中的标注信息。
坐标获取单元,用于获取所述标注信息对应的位置坐标。
区域影像提取单元,用于从医疗影像中提取与所述位置坐标对应的区域医疗影像。
区域特征提取单元,用于利用图像特征提取算法提取所述区域医疗影像的影像特征。
在一个实施例中,所述装置,还包括:
分割模块,用于将所述标注信息按照预设的规则分割为单元标注信息。
信息提取模块,用于提取将所述单元标注信息与标注信息数据库中的信息进行匹配,将匹配度最大的信息提取为标注信息。
在一个实施例中,影像文件生成模块540,包括:
标识获取单元,用于获取所述医疗影像对应的影像标识。
方法查找单元,用于查找所述影像标识对应的影像解析方法。
信息生成单元,用于利用所述影像解析方法对所述医疗影像关联的属性信息进行解析,生成影像标签信息。
文件生成单元,用于根据所述影像特征、所述影像标注信息以及所述影像标签信息建立映射关系,根据映射关系生成影像标注文件。
在一个实施例中,所述装置还包括:
查询标识提取模块,用于接收终端发送的查询请求,提取所述查询请求中携带的查询标识。
标识提取模块,用于提取所述影像标注文件对应的影像标识。
计算模块,用于计算所述查询标识与各所述影像标识的匹配度。
第一推送模块,用于将所述匹配度最大的所述影像标识关联的所述影像标注文件推送至终端。
在一个实施例中,所述装置还包括:
接收模块,用于接收终端发送的医疗影像。
标注信息识别模块,用于将所述医疗影像输入所述医疗影像识别模型,以通过所述医疗影像识别模型提取所述医疗影像对应的所述影像特征,根据所述医疗影像特征得到所述影像标注信息。
第二推送模块,用于将影像标注信息推送至所述终端。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
将医疗标识数据库中的医疗影像标注文件推送至用户终端。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于医疗数据处理相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种医疗影像识别模型生成方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取医疗数据;提取所述医疗数据中的医疗影像,对所述医疗影像进行特征提取得到影像特征;提取所述医疗数据中的医疗文件,对所述医疗文件进行解析生成标注信息,查找所述标注信息中与所述医疗影像对应的影像标注信息;根据所述影像特征以及所述影像标注信息建立映射关系,根据所述映射关系生成影像标注文件;将所述影像标注文件输入机器学习模型,以通过机器学习模型学习所述影像标注文件中所述影像特征与所述影像标注信息之间的特征关系,根据所述特征关系生成医疗影像识别模型。
在一个实施例中,该处理器执行计算机程序时实现所述对医疗影像进行特征提取得到影像特征的步骤时还用于:提取所述医疗影像中的标注信息;获取所述标注信息对应的位置坐标;从医疗影像中提取与所述位置坐标对应的区域医疗影像;利用图像特征提取算法提取所述区域医疗影像的影像特征。
在一个实施例中,该处理器执行计算机程序时实现所述对所述医疗文件进行解析生成标注信息之后还用于:将所述标注信息按照预设的规则分割为单元标注信息;将所述单元标注信息与标注信息数据库中的信息进行匹配,将匹配度最大的信息提取为标注信息。
在一个实施例中,该处理器执行计算机程序时实现所述根据所述影像特征以及所述影像标注信息建立映射关系,根据所述映射关系生成影像标注文件的步骤时还用于:获取所述医疗影像对应的影像标识;查找所述影像标识对应的影像解析方法;利用所述影像解析方法对所述医疗影像关联的属性信息进行解析,生成影像标签信息;根据所述影像特征、所述影像标注信息以及所述影像标签信息建立映射关系,根据映射关系生成影像标注文件。
在一个实施例中,该处理器执行计算机程序时实现所述根据所述映射关系生成影像标注文件之后还用于:接收终端发送的查询请求,提取所述查询请求中携带的查询标识;提取所述影像标注文件对应的影像标识;计算所述查询标识与各所述影像标识的匹配度;将所述匹配度最大的所述影像标识关联的所述影像标注文件推送至终端。
在一个实施例中,该处理器执行计算机程序时实现所述生成医疗影像识别模型之后还用于:接收终端发送的医疗影像;将所述医疗影像输入所述医疗影像识别模型,以通过所述医疗影像识别模型提取所述医疗影像对应的所述影像特征,根据所述医疗影像特征得到所述影像标注信息;将影像标注信息推送至所述终端。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取医疗数据;提取所述医疗数据中的医疗影像,对所述医疗影像进行特征提取得到影像特征;提取所述医疗数据中的医疗文件,对所述医疗文件进行解析生成标注信息,查找所述标注信息中与所述医疗影像对应的影像标注信息;根据所述影像特征以及所述影像标注信息建立映射关系,根据所述映射关系生成影像标注文件;将所述影像标注文件输入机器学习模型,以通过机器学习模型学习所述影像标注文件中所述影像特征与所述影像标注信息之间的特征关系,根据所述特征关系生成医疗影像识别模型。
在一个实施例中,计算机程序被处理器执行时实现所述对医疗影像进行特征提取得到影像特征的步骤时还用于:提取所述医疗影像中的标注信息;获取所述标注信息对应的位置坐标;从医疗影像中提取与所述位置坐标对应的区域医疗影像;利用图像特征提取算法提取所述区域医疗影像的影像特征。
在一个实施例中,计算机程序被处理器执行时实现所述对所述医疗文件进行解析生成标注信息之后还用于:将所述标注信息按照预设的规则分割为单元标注信息;将所述单元标注信息与标注信息数据库中的信息进行匹配,将匹配度最大的信息提取为标注信息。
在一个实施例中,计算机程序被处理器执行时实现所述根据所述影像特征以及所述影像标注信息建立映射关系,根据所述映射关系生成影像标注文件的步骤时还用于:获取所述医疗影像对应的影像标识;查找所述影像标识对应的影像解析方法;利用所述影像解析方法对所述医疗影像关联的属性信息进行解析,生成影像标签信息;根据所述影像特征、所述影像标注信息以及所述影像标签信息建立映射关系,根据映射关系生成影像标注文件。
在一个实施例中,计算机程序被处理器执行时实现所述根据所述映射关系生成影像标注文件之后还用于:接收终端发送的查询请求,提取所述查询请求中携带的查询标识;提取所述影像标注文件对应的影像标识;计算所述查询标识与各所述影像标识的匹配度;将所述匹配度最大的所述影像标识关联的所述影像标注文件推送至终端。
在一个实施例中,计算机程序被处理器执行时实现所述生成医疗影像识别模型之后还用于:接收终端发送的医疗影像;将所述医疗影像输入所述医疗影像识别模型,以通过所述医疗影像识别模型提取所述医疗影像对应的所述影像特征,根据所述医疗影像特征得到所述影像标注信息;将影像标注信息推送至所述终端。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种医疗影像识别模型生成方法,所述方法包括:
获取医疗数据;
提取所述医疗数据中的医疗影像,对所述医疗影像进行特征提取得到影像特征;
提取所述医疗数据中的医疗文件,对所述医疗文件进行解析生成标注信息,查找所述标注信息中与所述医疗影像对应的影像标注信息;
根据所述影像特征以及所述影像标注信息建立映射关系,根据所述映射关系生成影像标注文件;
将所述影像标注文件输入机器学习模型,以通过机器学习模型学习所述影像标注文件中所述影像特征与所述影像标注信息之间的特征关系,根据所述特征关系生成医疗影像识别模型。
2.根据权利要求1所述的方法,其特征在于,所述对医疗影像进行特征提取得到影像特征,包括:
提取所述医疗影像中的标注信息;
获取所述标注信息对应的位置坐标;
从医疗影像中提取与所述位置坐标对应的区域医疗影像;
利用图像特征提取算法提取所述区域医疗影像的影像特征。
3.根据权利要求1所述的方法,其特征在于,所述对所述医疗文件进行解析生成标注信息之后,还包括:
将所述标注信息按照预设的规则分割为单元标注信息;
将所述单元标注信息与标注信息数据库中的信息进行匹配,将匹配度最大的信息提取为标注信息。
4.根据权利要求1所述的方法,其特征在于,所述根据所述影像特征以及所述影像标注信息建立映射关系,根据所述映射关系生成影像标注文件,包括:
获取所述医疗影像对应的影像标识;
查找所述影像标识对应的影像解析方法;
利用所述影像解析方法对所述医疗影像关联的属性信息进行解析,生成影像标签信息;
根据所述影像特征、所述影像标注信息以及所述影像标签信息建立映射关系,根据映射关系生成影像标注文件。
5.根据权利要求1或4所述的方法,其特征在于,所述根据所述映射关系生成影像标注文件之后,还包括:
接收终端发送的查询请求,提取所述查询请求中携带的查询标识;
提取所述影像标注文件对应的影像标识;
计算所述查询标识与各所述影像标识的匹配度;
将所述匹配度最大的所述影像标识关联的所述影像标注文件推送至终端。
6.根据权利要求1所述的方法,其特征在于,所述生成医疗影像识别模型之后,还包括:
接收终端发送的医疗影像;
将所述医疗影像输入所述医疗影像识别模型,以通过所述医疗影像识别模型提取所述医疗影像对应的所述影像特征,根据所述医疗影像特征得到所述影像标注信息;
将影像标注信息推送至所述终端。
7.一种医疗影像识别模型生成装置,所述装置包括:
数据获取模块,用于获取医疗数据;
特征提取模块,用于提取所述医疗数据中的医疗影像,对所述医疗影像进行特征提取得到影像特征;
标注生成模块,用于提取所述医疗数据中的医疗文件,对所述医疗文件进行解析生成标注信息,查找所述标注信息中与所述医疗影像对应的影像标注信息;
影像文件生成模块,用于根据所述影像特征以及所述影像标注信息建立映射关系,根据所述映射关系生成影像标注文件;
模型生成模块,用于将所述影像标注文件输入机器学习模型,以通过机器学习模型学习所述影像标注文件中所述影像特征与所述影像标注信息之间的特征关系,根据所述特征关系生成医疗影像识别模型。
8.根据权利要求7所述的装置,其特征在于,所述特征提取模块包括:
影像标注信息提取单元,用于提取所述医疗影像中的标注信息;
坐标获取单元,用于获取所述标注信息对应的位置坐标;
区域影像提取单元,用于从医疗影像中提取与所述位置坐标对应的区域医疗影像;
区域特征提取单元,用于利用图像特征提取算法提取所述区域医疗影像的影像特征。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202010128465.0A 2020-02-28 2020-02-28 医疗影像识别模型生成方法、装置、计算机设备和介质 Pending CN111462865A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010128465.0A CN111462865A (zh) 2020-02-28 2020-02-28 医疗影像识别模型生成方法、装置、计算机设备和介质
PCT/CN2020/097964 WO2021169101A1 (zh) 2020-02-28 2020-06-24 医疗影像识别模型生成方法、装置、计算机设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010128465.0A CN111462865A (zh) 2020-02-28 2020-02-28 医疗影像识别模型生成方法、装置、计算机设备和介质

Publications (1)

Publication Number Publication Date
CN111462865A true CN111462865A (zh) 2020-07-28

Family

ID=71684198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010128465.0A Pending CN111462865A (zh) 2020-02-28 2020-02-28 医疗影像识别模型生成方法、装置、计算机设备和介质

Country Status (2)

Country Link
CN (1) CN111462865A (zh)
WO (1) WO2021169101A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111816284A (zh) * 2020-09-04 2020-10-23 平安国际智慧城市科技股份有限公司 医疗测试数据的批量生成方法、装置、设备及存储介质
CN113192607A (zh) * 2021-04-13 2021-07-30 复旦大学附属中山医院 标注处理方法、装置、计算机设备和存储介质
CN113744845A (zh) * 2021-09-17 2021-12-03 平安好医投资管理有限公司 基于人工智能的医学影像处理方法、装置、设备及介质
CN114095757A (zh) * 2021-11-17 2022-02-25 南通市肿瘤医院 基于云端的医院放射科自学习影像传输系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063740A (zh) * 2018-07-05 2018-12-21 高镜尧 超声影像关键目标的检测模型构建及检测方法、装置
CN110598782A (zh) * 2019-09-06 2019-12-20 上海杏脉信息科技有限公司 一种训练用于医学影像的分类网络的方法与装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI396105B (zh) * 2009-07-21 2013-05-11 Univ Nat Taiwan 用於模擬個體差異之個人化資訊檢索之數位資料處理方法及其電腦裝置可讀式資訊儲存媒體與資訊檢索系統
CN110503151B (zh) * 2019-08-26 2020-11-03 北京推想科技有限公司 一种影像的处理方法和系统
CN110796180B (zh) * 2019-10-12 2022-06-07 吉林大学 一种基于人工智能的模型训练系统与方法
CN110737714A (zh) * 2019-10-18 2020-01-31 西安电子科技大学 基于计算机视觉的电竞数据可视化系统及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063740A (zh) * 2018-07-05 2018-12-21 高镜尧 超声影像关键目标的检测模型构建及检测方法、装置
CN110598782A (zh) * 2019-09-06 2019-12-20 上海杏脉信息科技有限公司 一种训练用于医学影像的分类网络的方法与装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111816284A (zh) * 2020-09-04 2020-10-23 平安国际智慧城市科技股份有限公司 医疗测试数据的批量生成方法、装置、设备及存储介质
CN111816284B (zh) * 2020-09-04 2020-12-25 平安国际智慧城市科技股份有限公司 医疗测试数据的批量生成方法、装置、设备及存储介质
CN113192607A (zh) * 2021-04-13 2021-07-30 复旦大学附属中山医院 标注处理方法、装置、计算机设备和存储介质
CN113192607B (zh) * 2021-04-13 2024-03-26 复旦大学附属中山医院 标注处理方法、装置、计算机设备和存储介质
CN113744845A (zh) * 2021-09-17 2021-12-03 平安好医投资管理有限公司 基于人工智能的医学影像处理方法、装置、设备及介质
CN114095757A (zh) * 2021-11-17 2022-02-25 南通市肿瘤医院 基于云端的医院放射科自学习影像传输系统

Also Published As

Publication number Publication date
WO2021169101A1 (zh) 2021-09-02

Similar Documents

Publication Publication Date Title
CN111462865A (zh) 医疗影像识别模型生成方法、装置、计算机设备和介质
CN110909137A (zh) 基于人机交互的信息推送方法、装置和计算机设备
KR20220064395A (ko) 이미지들 및 전문 지식으로부터 피부 상태들을 수집하고 식별하기 위한 시스템
CN111445968A (zh) 电子病历查询方法、装置、计算机设备和存储介质
US20170091281A1 (en) Systems and methods for barcode annotations for digital images
CN109872784A (zh) 智能病历生成方法、装置、计算机设备以及存储介质
CN112862024B (zh) 一种文本识别方法及系统
CN110796180B (zh) 一种基于人工智能的模型训练系统与方法
CN114358001A (zh) 诊断结果的标准化方法及其相关装置、设备和存储介质
CN109065015B (zh) 一种数据采集方法、装置、设备及可读存储介质
CN110752027A (zh) 电子病历数据推送方法、装置、计算机设备和存储介质
CN113435200A (zh) 实体识别模型训练、电子病历处理方法、系统及设备
CN113642562A (zh) 基于图像识别的数据解读方法、装置、设备及存储介质
CN111191446B (zh) 交互信息处理方法、装置、计算机设备和存储介质
CN116469505A (zh) 数据处理方法、装置、计算机设备及可读存储介质
CN116737924A (zh) 一种医疗文本数据处理方法及装置
CN115662562A (zh) 病历诊疗数据管理方法、装置、设备及存储介质
CN115457586A (zh) 一种病例信息提取方法、装置、设备和存储介质
CN114242262A (zh) 一种基于大数据记录的医疗科研信息快速处理系统
CN113111660A (zh) 数据处理方法、装置、设备和存储介质
Kalaivani et al. Medical image retrieval using convolution neural networks
CN111078976A (zh) 一种基于医疗系统爬虫提取数据的方法
CN111966794A (zh) 一种诊疗数据的识别方法、系统和装置
Shivamurthy Procedures Design and Development of Framework for Content Based Image Retrieval
US20220208317A1 (en) Image content extraction method and image content extraction device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220915

Address after: Room 2601 (Unit 07), Qianhai Free Trade Building, No. 3048, Xinghai Avenue, Nanshan Street, Qianhai Shenzhen-Hong Kong Cooperation Zone, Shenzhen, Guangdong 518000

Applicant after: Shenzhen Ping An Smart Healthcare Technology Co.,Ltd.

Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000

Applicant before: Ping An International Smart City Technology Co.,Ltd.