CN114913383B - 识别图像序列类型的模型训练方法和配置影像设备的方法 - Google Patents

识别图像序列类型的模型训练方法和配置影像设备的方法 Download PDF

Info

Publication number
CN114913383B
CN114913383B CN202210730491.XA CN202210730491A CN114913383B CN 114913383 B CN114913383 B CN 114913383B CN 202210730491 A CN202210730491 A CN 202210730491A CN 114913383 B CN114913383 B CN 114913383B
Authority
CN
China
Prior art keywords
type
parameters
sequence
image
sequence type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210730491.XA
Other languages
English (en)
Other versions
CN114913383A (zh
Inventor
岳新
杨海英
张虽虽
贺长征
霍健
雷明芳
尚可为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Smarttree Medical Technology Co Ltd
AstraZeneca Pharmaceuticals LP
Original Assignee
Beijing Smarttree Medical Technology Co Ltd
AstraZeneca Pharmaceuticals LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Smarttree Medical Technology Co Ltd, AstraZeneca Pharmaceuticals LP filed Critical Beijing Smarttree Medical Technology Co Ltd
Priority to CN202210730491.XA priority Critical patent/CN114913383B/zh
Publication of CN114913383A publication Critical patent/CN114913383A/zh
Application granted granted Critical
Publication of CN114913383B publication Critical patent/CN114913383B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了识别图像序列类型的模型训练方法和配置影像设备的方法。该用于识别图像序列类型的模型训练方法,包括:获取预设个数的检查项目相同的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息,其中,所述图像中的每个序列均带有该序列的序列类型标签;从所述图像中提取每个序列的序列类型标签;以及基于每个序列类型标签和所述扫描信息训练所述模型,以获得包括多组序列类型识别方案的训练后的模型。

Description

识别图像序列类型的模型训练方法和配置影像设备的方法
技术领域
本发明涉及医疗信息领域,更具体地,涉及一种用于识别图像序列类型的模型训练方法和配置影像设备的方法、装置、电子设备及计算机可读存储介质。
背景技术
DICOM(Digital Imaging and Communications in Medicine,医学数字成像和通信)是医学图像和相关信息的国际标准。它定义了质量能满足临床需要的可用于数据交换的医学图像格式。DICOM被广泛应用于放射医疗,心血管成像以及放射诊疗诊断设备(比如,X射线设备、CT设备、磁共振设备,超声设备等),并且在诸多医学领域得到越来越深入广泛的应用。DICOM文件不仅包含图像本身的信息,同时还携带大量的医疗相关信息。每个DICOM的数据包括患者的人口学信息、医疗机构信息、影像设备的品牌型号、详细的扫描参数和患者的空间体位信息,以及本张图像的尺寸等信息,共计几百项。
在磁共振成像(MRI,Magnetic Resonance Imaging)的领域中,MRI(特别是mpMRI)的序列比较多,很多序列是在相同解剖位置执行的不同参数的扫描,这些图像体现了组织/器官在不同维度上的信息。医生在浏览影像做出诊断的时候,也需要在不同的序列上,就同一个病灶提取不同维度的信息,综合分析来进行诊断。在对这些序列进行机器学习的过程中,需要机器模仿人的诊断思维,在不同的序列上提取不同的特征信息,之后汇总这些信息,再按照固定的逻辑进行分析判断。
如何区分磁共振成像序列是目前MR领域人工智能(AI)应用的一个基础需求。传统的序列识别方式在碰到新MR设备,或者MR设备更新了软件版本的时候,扫描参数的范围或者表达方式有所改变,原来配置的序列识别方案就不能正确进行判断了,会导致AI模型因被投送的图像类型错误而失败,甚至因为识别错误而造成医疗风险。
因此,需要一种改进的用于识别核磁共振图像序列类型的方案。
发明内容
考虑到以上问题而作出了本公开。本公开试图基于mpMRI序列的已知标记来自动化地寻找背后的序列区分逻辑,提高在面向新设备、新版软件时配置序列识别方案的效率,降低产品化过程中的成本和风险。
本公开的实施例提供了一种用于识别图像序列类型的模型训练方法,包括:获取预设个数的检查项目相同的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息,其中,所述图像中的每个序列均带有该序列的序列类型标签;从所述图像中提取每个序列的序列类型标签;以及基于每个序列类型标签和所述扫描信息训练所述模型,以获得包括多组序列类型识别方案的训练后的模型。
例如,根据本公开的实施例的方法,其中,所述序列类型标签的设置包括:接收每个序列上的第一输入信息,并使用所述第一输入信息对该序列设置序列类型标签。
例如,根据本公开的实施例的方法,其中,所述扫描信息包括用于确定序列类型的多个扫描参数和影像设备信息,所述影像设备信息包括设备厂家、设备类型、软件版本号中的一个或多个,所述多个扫描参数至少包括具有第一取值类型的一个或多个第一类参数、具有第二取值类型的一个或多个第二类参数和具有第三取值类型的一个或多个第三类参数中的一个或多个。
例如,根据本公开的实施例的方法,其中,所述一个或多个第一类参数包括枚举类型的一个或多个参数,所述一个或多个第二类参数包括具有取值范围的一个或多个参数,以及所述一个或多个第三类参数包括文本类型的一个或多个参数,其中所述一个或多个第一类参数和所述一个或多个第二类参数的标签和对应取值从所述文件头信息中直接提取,所述一个或多个第三类参数的标签和对应取值通过对所述文件头信息中的文本信息执行自然语言处理技术获得,所述一个或多个第三类参数的标签的对应取值的类型包括枚举类型和取值范围中的一者或两者。
例如,根据本公开的实施例的方法,其中,基于每个序列类型标签和所述扫描信息训练所述模型,以获得包括多组序列类型识别方案的训练后的模型包括:使用所述影像设备信息作为分组索引,将所有所述图像文件进行分组;对于每一组的图像文件,使用带有相同的序列类型标签的每个子组的图像文件中的扫描参数分别训练所述模型,以获得包括分别与多个不同组的图像文件相对应的多组序列类型识别方案的训练后的模型。
例如,根据本公开的实施例的方法,其中,使用带有相同的序列类型标签的每个子组的图像文件中的扫描参数分别训练所述模型,以获得包括分别与多个不同组的图像文件相对应的多组序列类型识别方案的训练后的模型包括:对于每一组的图像文件,使用带有相同的序列类型标签的每个子组的图像文件中的扫描参数,确定与该序列类型对应的一个或多个第一类参数中的每一个第一类参数的集合、一个或多个第二类参数中的每一个第二类参数的范围和/或一个或多个第三类参数中的每一个第三类参数的集合和/或范围,基于确定的每一个第一类参数的集合、每一个第二参数的范围和/或每一个第三类参数的集合和/或范围,确定该序列类型的序列类型识别方案,整合确定的多个序列类型识别方案以获得与一组图像文件相对应的一组序列类型,从而获得包括与多个不同组的图像文件相对应的多组序列类型识别方案的训练后的模型。
例如,根据本公开的实施例的方法,其中,确定与该序列类型对应的一个或多个第一类参数中的每一个第一类参数的集合包括针对任意一个第一类参数执行以下步骤:读取每个子组的图像文件的文件头信息的扫描参数中的所述第一类参数的多个标签,针对所述第一类参数的每个标签,记录对应的取值,以形成所述第一类参数的集合。
例如,根据本公开的实施例的方法,其中,确定与该序列类型对应的一个或多个第二类参数中的每一个第二类参数的范围包括针对任意一个第二类参数执行以下步骤:读取每个子组的图像文件的文件头信息的扫描参数中的所述第二类参数的多个标签,针对所述第二类参数的每个标签,记录对应的取值,以形成所述第二类参数的取值范围,使用所有取值中的最小值作为取值范围的最小值,并且使用所有取值中的最大值作为取值范围的最大值。
例如,根据本公开的实施例的方法,其中,确定与该序列类型对应的一个或多个第三类参数中的每一个第三类参数的集合和/或范围包括针对任意一个第三类参数执行以下步骤:针对每个子组的图像文件的文件头信息的文本信息执行自然语言处理以获得所述第三类参数的多个标签以及每个标签的取值,针对对应取值为枚举类型的第三类参数的每个标签,记录对应的取值,以形成所述第三类参数的集合;和/或针对对应取值为取值范围的第三类参数的每个标签,记录对应的取值,以形成所述第三类参数的取值范围,使用所有取值中的最小值作为取值范围的最小值,并且使用所有取值中的最大值作为取值范围的最大值。
例如,根据本公开的实施例的方法,其中,还包括:获取新的图像文件,并将所述新的图像文件输入训练后的模型;读取所述新的图像文件的文件头信息中的影像设备信息,并且根据读取的影像设备信息,在所述训练后的模型中确定相应的一组序列类型识别方案;读取所述新的图像文件的文件头信息中的扫描参数,并且根据读取的扫描参数确定是否需要更新序列类型识别方案。
例如,根据本公开的实施例的方法,其中,响应于读取的扫描参数的范围在所述相应的一组序列类型识别方案中的对应一个序列类型识别方案的扫描参数的范围内,确定不需要更新所示对应一共序列类型识别方案,并且使用所述对应一个序列类型识别方案的序列类型标签标记所述新的图像文件。
例如,根据本公开的实施例的方法,其中,响应于读取的扫描参数的取值不在所述相应的一组序列类型识别方案中的对应一个序列类型识别方案的扫描参数的范围内,确定需要更新所述对应一个序列类型识别方案,并且使用读取的扫描参数的取值或范围更新所述对应一个序列类型识别方案。
例如,根据本公开的实施例的方法,其中,所述影像设备包括X射线装置、电子计算机断层扫描装置、磁共振成像装置、多参数核磁成像装置中的一个。
例如,根据本公开的实施例的方法,其中,所述图像文件是医疗数字影像传输协定DICOM文件,以及所述文件头信息是DICOM文件头。
本公开的实施例还提供了还提供了一种配置影像设备的方法,包括:接收所述影像设备生成的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息;根据所述扫描信息,检索对应的配置文件,所述配置文件包括根据上述的方法生成的用于识别图像的序列类型的模型;以及使用检索的配置文件配置所述影像设备,以识别所述图像的序列类型。
例如,根据本公开的实施例的方法,其中,还包括:根据确定的所述图像的序列类型,将所述图像传输给与该序列类型对应的AI诊断模型。
例如,根据本公开的实施例的方法,其中,还包括:响应于没有检索到对应的配置文件,建立新的配置文件,所述新的配置文件包括未训练的用于识别图像的序列类型的模型;使用前面所述的方法训练所述未训练的用于识别图像的序列类型的模型以获得训练后的模型。
例如,根据本公开的实施例的方法,其中,使用检索的配置文件配置所述影像设备包括:读取所述图像文件的文件头信息中的设备信息,并且根据读取的设备信息作为分组索引,在所述配置文件中确定相应的一组序列类型识别方案;读取所述图像文件的文件头信息中的扫描参数;响应于所有扫描参数的取值都在所述一组序列类型识别方案中的相应的一个序列类型识别方案的范围内,将所述图像文件标识为与所述相应的一个序列类型相同的序列类型;以及响应于至少一个扫描参数的取值不在所述一组序列类型识别方案中的相应的一个序列类型识别方案的范围内,将所述图像文件标识无法识别的序列。
本公开的实施例还提供了一种用于识别图像的序列类型的模型训练装置,包括:获取部件,获取预设个数的检查项目相同的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息,其中,所述图像中的每个序列均带有该序列的序列类型标签;标签提取部件,从所述图像中提取每个序列的序列类型标签;以及训练部件,基于每个序列类型标签和所述扫描信息训练所述模型,以获得包括多组序列类型识别方案的训练后的模型。
本公开的实施例还提供了一种用于配置影像设备的装置,包括:接收部件,接收所述影像设备生成的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息;检索部件,用于根据所述扫描信息,检索对应的配置文件,所述配置文件包括根据上面所述的任意一项方法生成的用于识别图像的序列类型的模型;以及识别部件,用于使用检索的配置文件配置所述影像设备,以识别所述图像的序列类型。
本公开的实施例还提供了一种电子设备,包括存储器和处理器,其中,所述存储器上存储有处理器可读的程序代码,当处理器执行所述程序代码时,执行根据上述方法中任一项所述的方法。
本公开的实施例还提供了一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令用于执行根据上述方法中任一项所述的方法。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对本公开实施例的附图作简单地介绍。明显地,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。
图1示出了DICOM文件头格式的示意图;
图2示出了本公开实施例的用于识别图像序列类型的模型训练方法的应用架构示意图;
图3是概述根据本公开实施例的用于识别图像序列类型的模型训练方法的流程图;
图4示出了根据本公开实施例的统计第一类参数和第二类参数的标签及其取值类型的界面示意图;
图5示出了根据本公开实施例的统计文本中的参数及其取值类型的界面示意图;
图6进一步示出了图3中步骤S303中的更具体的细节;
图7示出了以设备厂家、设备类型和软件版本三者作为分组索引进行分析时的界面示意图;
图8进一步示出了图6中的步骤S602中的更具体的细节;
图9示出了根据本公开实施例的基于用于识别图像序列类型的模型训练方法所得到的配置文件来配置影像设备的方法的流程图;
图10示出了根据本公开实施例中一种用于识别图像的序列类型的模型的训练装置的结构示意图;
图11出了根据本公开实施例的用于配置影像设备的装置的示意图;
图12示出了根据本公开的实施例的存储介质的示意图;以及
图13-图18示出了基于根据本公开实施例的针对用于识别图像序列类型的模型训练方法所设计的界面示意图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清楚、完整地描述,显而易见地,所描述的实施例仅仅是本申请的部分实施例,而不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,也属于本申请保护的范围。
本说明书中使用的术语是考虑到关于本公开的功能而在本领域中当前广泛使用的那些通用术语,但是这些术语可以根据本领域普通技术人员的意图、先例或本领域新技术而变化。此外,特定术语可以由申请人选择,并且在这种情况下,其详细含义将在本公开的详细描述中描述。因此,说明书中使用的术语不应理解为简单的名称,而是基于术语的含义和本公开的总体描述。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
以下,将参考附图详细描述本公开的实施例。
图1为DICOM文件头格式的示意图。如图1所示,需要特别说明的是DICOM文件分为两部分:DICOM文件头和图像信息。
其中,DICOM文件头10包括文件导言21、DICOM前缀22、文件信息元素23、多个数据元素24。
其中(1)、文件导言21,由128个字节组成;(2)、DICOM前缀22,可根据长度为4个字节的字符串是否等于“DICM”来判断该文件是不是DICOM文件;(3)、文件信息元素23。
每个数据元素24包括:(1)、DICOM标签(TAG)41:存储该项信息的标签;(2)、值表现(value representation,VR)字段42:存储描述该项信息的数据类型;(3)、值长(valuelength)字段43:存储描述该项信息的数据长度;(4)、值(value)字段44:存储描述该项信息的数据值。其中,每一个DICOM标签(TAG)都是由两个十六进制数的组合来确定的,分别为组(Group)和元素(Element)。例如,(0010,0010)这个标签的组号为0010,元素号为0010,表示的是这张DICOM图像的患者姓名。
如上所述,对于MRI检查来说,DICOM的文件头当中有很多扫描参数,但DICOM文件头当中并没有一个清晰的参数来说明序列的类型,比如T1/T2/DWI/DCE/ADC图等类型。有些序列的区别仅仅是某个采样时间的范围的差异,比如T1/T2序列。
因此,需要一种识别模型来自动化地寻找序列背后的区分逻辑,以便降低编程的代价,提高在面向新设备、新版软件时配置序列识别方案的效率,降低产品化过程中的成本和风险。
本公开的实施例提出了一种用于识别图像序列类型的模型训练方法和基于训练好的识别图像序列类型的模型来配置影像设备的方法。
图2示出了本公开实施例的用于识别图像序列类型的模型训练方法的应用架构示意图,包括服务器100、终端设备200。
终端设备200可以是影像设备,例如,用户可以基于终端设备200对图像序列类型进行识别。
终端设备200与服务器100之间可以通过互联网相连,实现相互之间的通信。可选地,上述的互联网使用标准通信技术和/或协议。互联网通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(MetropolitanAreaNetwork,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一些实施例中,使用包括超文本标记语言(Hyper TextMarkupLanguage,HTML)、可扩展标记语言(Extensible Markup Language,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(SecureSocketLayer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(VirtualPrivate Network,VPN)、网际协议安全(Internet Protocol Security,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
服务器100可以为终端设备200提供各种网络服务,其中,服务器100可以是一台服务器、若干台服务器组成的服务器集群或云计算中心。
具体地,服务器100可以包括处理器110(Center Processing Unit,CPU)、存储器120、输入设备130和输出设备140等,输入设备130可以包括键盘、鼠标、触摸屏等,输出设备140可以包括显示设备,如液晶显示器(Liquid Crystal Display,LCD)、阴极射线管(Cathode Ray Tube,CRT)等。
存储器120可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器110提供存储器120中存储的程序指令和数据。在本公开实施例中,存储器120可以用于存储本公开实施例中用于识别图像序列类型的模型训练方法和基于训练好的模型来配置影像设备的方法的程序,还可以存储从训练好的模型中导出的配置文件。
处理器110通过调用存储器120存储的程序指令,处理器110用于按照获得的程序指令执行本公开实施例中任一种用于识别图像序列类型的模型训练方法和基于训练好的模型来配置影像设备的方法的步骤。
例如,在本公开实施例中,用于识别图像序列类型的模型训练方法和基于训练好的模型来配置影像设备的方法在服务器100侧执行。例如,服务器100在训练完用于识别图像序列类型的模型之后,建立一个中心数据库(例如存储器120)来存储从训练完成的用于识别图像序列类型的模型导出的配置文件。
例如,当在新场地碰到某个新设备的时候,终端设备200可以将匿名后的DICOM文件头上传,在服务器100侧自动识别其中的参数信息,自动从中心数据库中寻找相关的配置文件,以用于识别该DICOM文件中序列的类型。由服务器100对图像文件进行序列类型识别,并可以将识别结果返回给终端设备200。
如图2所示的应用架构,是以应用于服务器100侧为例进行说明的,当然,本公开实施例的方法也可以由终端设备200执行,本公开对此不作限制。
另外,本公开实施例中的应用架构图是为了更加清楚地说明本公开实施例中的技术方案,并不构成对本公开实施例提供的技术方案的限制,当然,对于其它的应用架构和业务应用,本公开实施例提供的技术方案对于类似的问题,同样适用。
本公开各个实施例以应用于图2所示的应用架构图为例进行示意性说明。
图3是概述根据本公开实施例的用于识别图像序列类型的模型训练方法300的流程图。如图3所示,根据本公开实施例的用于识别图像序列类型的模型训练方法包括以下步骤S301-S303。
在步骤S301,获取预设个数的检查项目相同的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息;其中,所述图像中的每个序列均带有该序列的序列类型标签。
例如,这里的检查项目相同为扫描部位相同、影像设备类型相同的检查。例如,这里的影像设备可以是X射线装置、电子计算机断层扫描装置、磁共振成像装置、多参数核磁成像装置中的一个。
例如,这里的图像文件是医疗数字影像传输协定DICOM文件,以及这里的文件头信息是DICOM文件头。
例如,这里的预设个数可以为了使得数据集尽量完善而选取的任意合适的数量。
例如,这里的扫描信息包括用于确定序列类型的多个扫描参数和影像设备信息。影像设备信息可以包括设备厂家、设备类型、软件版本号中的一个或多个。由于不同设备厂家、不同设备型号和不同软件版本,序列类参数的命名和取值都可能不同,因此,为了使得用于识别图像序列类型的模型的鲁棒性更强,这里可以尽可能地选择不同厂家、型号、软件版本的设备所成像的、以及包含尽可能多的不同序列类型(例如,T1/T2/DWI/DCE/ADC)的图像文件。
通常,DICOM文件头当中的信息从逻辑上分成两类:第一是类似厂家、时间、剂量、扫描部位、体位等的简单赋值项目;另外一类是一串字符串文本,可由影像设备的控制台软件按照规定格式填写,或者由扫描技师在控制台上手工输入的文本。这类文本语句对人来讲容易理解,但对计算机来讲,不进行分词分析就无法使用。基于此,本公开的方案提出基于所确定的每个序列的类型标签和每个序列的DICOM文件头信息中的参数数据来训练用于识别图像序列类型的模型,以提高在面向新设备、新版软件时配置序列识别方案的效率,降低产品化过程中的成本和风险。
接下来,在步骤S302中,从所述图像中提取每个序列的序列类型标签。
不同的设备厂家、型号和软件版本等的原因,相同序列类型的DICOM文件中的影响序列类型判断的参数的标签名称及其取值类型和取值范围均有可能不同。因此,在进行训练的过程中,需要预先确定这些预设个数的图像中的每个序列的序列类型标签,以便可以寻找这些序列背后的序列区分逻辑。
根据本公开的一个实施例,如何设置序列类型标签可以包括:接收每个序列上的第一输入信息,并使用该第一输入信息对该序列设置序列类型标签。
例如,可以通过有经验的医生来对多个患者的不同序列的序列类型标签进行手工标记,这里的第一输入信息便可以是医生输入的标记信息。当然,也可以从带有序列类型标签的已知序列集合直接获取带有序列类型标签的第一输入信息,也可以基于其他机器或其他方式来确定这些序列的序列类型标签并从这些机器或其他方式获取带有序列类型标签的第一信息,本公开对此不作限制。
在步骤S303,基于每个序列类型标签和所述扫描信息训练所述模型,以获得包括多组序列类型识别方案的训练后的模型。
例如,扫描信息包括用于确定序列类型的多个扫描参数的标签及其取值和影像设备信息。
本公开将影响序列类型判断的扫描参数分为三种类型:具有第一取值类型的第一类参数、具有第二取值类型的第二类参数和具有第三取值类型的第三类参数。其中,多个扫描参数至少包括具有第一取值类型的一个或多个第一类参数、具有第二取值类型的一个或多个第二类参数和具有第三取值类型的一个或多个第三类参数中的一个或多个。
具体来说,第一取值类型可以是枚举类型,第二取值类型可以是有变化的取值的范围,第三取值类型为可以是枚举类型和有变化的取值的范围中的一者或两者。例如,第一类参数的示例可以是扫描部位、体位等,其取值类型是简单的枚举类型。例如,第二类参数的示例可以是回波链长度、回波时间、成像频率等具有取值范围的参数。第一类参数和第二类参数及其对应的取值可以从文件头数据中直接读取。第三类参数是由影像设备的控制台软件按照规定格式填写的或者由扫描技师在控制台上手工输入的文本。例如技师手工输入序列的描述“使用风车技术的横轴位T2加权快速自旋回波序列”是第三类参数。
本公开的实施例提出了通过自然语言分析(NLP)来分析此类文本,以提取其中的参数概念和该参数概念的取值。
例如,上面技师手工输入的文本“使用风车技术的横轴位T2加权快速自旋回波序列”经过NLP处理以后,可以基于NLP提取出如下信息:序列类型,取值为T1WI;序列名称,取值为TSE;后缀说明,取值为MV;扫描体位,取值为TRA。
本公开的方案为每一个参数建立一个与该参数的概念相对应的数据结构类型。例如,若该参数的相应取值的类型为枚举类型,则针对该参数建立一个集合,用于统计与该参数概念相关联的所有的取值。例如,若该参数的相应取值的类型为取值范围变化的参数,则针对该参数建立一个范围区间,用于统计与该参数概念相关联的最小取值和最大取值所限定的范围区间。
在进行分析前,通过直接读取的方式,可以先将影响序列类型判断的第一类参数和第二类参数及其相应取值类型添加到列表中进行统计。图4示出了根据本公开实施例的统计第一类参数和第二类参数的标签及其取值类型的界面示意图。例如,如图4所示,标签描述为“MRAcquisitionType”的参数的取值类型属于集合,而标签描述为“RepetitionTime”的参数的取值类型属于范围。如上所述,这些第一类参数和第二类参数的标签及其取值都是数据元素中直接读取的。
图5示出了根据本公开实施例的统计文本中的参数及其取值类型的界面示意图。
如图5左边窗口所示,将基于NLP分析提取的参数依次添加到列表,并进行编号。第一列的ID为所提取的参数概念的编号,第二列为该参数的名称,第三类为该参数的种类,第四列为该参数的同义词(例如详细含义的解释)。
图5右边窗口为针对左边窗口中的参数种类所对应的取值类型的定义。例如,利用NLP在“使用风车技术的横轴位T2加权快速自旋回波序列”中所提取的参数中,其中种类为“序列类型”的参数的取值类型属于集合。
此外,针对第三类参数(例如文本)所提取的某些参数概念对于序列类型分类并不重要,因此可以将该类参数的取值类型标记为属于“不处理”。例如,图5右边窗口中将“后缀说明”、“序列名称”和“扫描体位”的取值类型标记为属于“不处理”。
下面参考图6进一步介绍上面的步骤S303中基于每个序列类型标签和所述扫描信息训练所述模型,以获得包括多组序列类型识别方案的训练后的模型的更具体的细节。如图6所示,步骤S302可以包括子步骤S601-S602。
在步骤S601中,使用所述影像设备信息作为分组索引,将所有所述图像文件进行分组。
通过设定一些与设备相关的固定参数信息作为分组索引,以便于在对接收到的图像序列进行识别时,将其索引到相应一组的序列类型识别方案,从而提高序列类型识别的效率。
例如,可以以设备厂家、设备类型和软件版本中的一个或多个作为分组索引。此外,当出现新的厂家、设备或软件版本的情况下,可以添加和训练以该新的厂家、设备或版本为索引的一组新的序列类型识别方案。
图7示出了以设备厂家、设备类型和软件版本三者作为分组索引进行分析时的界面示意图。其中设备厂家标签的组号为“0008”,元素号为“0070”;设备类型标签的组号为“0008”,元素号为“0060”;软件版本标签的组号为“0018”,元素号为“1020”。应当理解,也可以设备厂家、设备类型和软件版本中的一个或两个作为分组索引,也可以利用其他类似的固定参数作为分组索引,本公开在此不作限制。
接下来,在步骤S602中,对于每一组的图像文件,使用带有相同的序列类型标签的每个子组的图像文件中的扫描参数分别训练所述模型,以获得包括分别与多个不同组的图像文件相对应的多组序列类型识别方案的训练后的模型。
本公开的方案通过读取或提取属于以设备信息作为索引的一组图像文件中的每个子组的图像文件的文件头信息中的参数及其取值,并对这些取值进行整合以生成针对相应的一个子组的图像文件的序列类型识别方案,再将与一组图像文件中的每个子组的图像文件相对应的序列类型识别方案进行整合,从而得到与该组图像文件相对应的一组序列类型识别方案。
下面参考图8进一步介绍上面的步骤S602中的对于每一组的图像文件,使用带有相同的序列类型标签的每个子组的图像文件中的扫描参数分别训练所述模型,以获得包括分别与多个不同组的图像文件相对应的多组序列类型识别方案的训练后的模型的更具体的细节。例如,步骤S602可以包括子步骤S801-S803。
在步骤S801中,对于每一组的图像文件,使用带有相同的序列类型标签的每个子组的图像文件中的扫描参数,确定与该序列类型对应的一个或多个第一类参数中的每一个第一类参数的集合、一个或多个第二类参数中的每一个第二类参数的范围和/或一个或多个第三类参数中的每一个第三类参数的集合和/或范围。
例如,确定与该序列类型对应的一个或多个第一类参数中的每一个第一类参数的集合包括针对任意一个第一类参数执行以下步骤:读取每个子组的图像文件的文件头信息的扫描参数中的该第一类参数的多个标签,针对该第一类参数的每个标签,记录对应的取值,以形成第一类参数的集合。
例如,确定与该序列类型对应的一个或多个第二类参数中的每一个第二类参数的范围包括针对任意一个第二类参数执行以下步骤:读取每个子组的图像文件的文件头信息的扫描参数中的第二类参数的多个标签,针对该第二类参数的每个标签,记录对应的取值,以形成该第二类参数的取值范围,使用所有取值中的最小值作为取值范围的最小值,并且使用所有取值中的最大值作为取值范围的最大值。
例如,确定与该序列类型对应的一个或多个第三类参数中的每一个第三类参数的集合和/或范围包括针对任意一个第三类参数执行以下步骤:针对每个子组的图像文件的文件头信息的文本信息执行自然语言处理以获得第三类参数的多个标签以及每个标签的取值,针对对应取值为枚举类型的第三类参数的每个标签,记录对应的取值,以形成该第三类参数的集合;和/或针对对应取值为取值范围的第三类参数的每个标签,记录对应的取值,以形成所述第三类参数的取值范围,使用所有取值中的最小值作为取值范围的最小值,并且使用所有取值中的最大值作为取值范围的最大值。
在步骤S802中,基于确定的每一个第一类参数的集合、每一个第二参数的范围和/或每一个第三类参数的集合和/或范围,确定该序列类型的序列类型识别方案。
例如,针对每个序列类型,针对一个或多个第一类参数、一个或多个第二参数或一个或多个第三类参数中的每一个确定相应的数据结构及其取值,从而确定该序列类型的序列类型识别方案。
在步骤S803中,整合确定的多个序列类型识别方案以获得与一组图像文件相对应的一组序列类型,从而获得包括与多个不同组的图像文件相对应的多组序列类型识别方案的训练后的模型。
这里的序列类型识别方案针对每个以设备信息为索引的分组而不同,当遇到新的图像文件时,可以基于分组索引(例如上面所述的设备厂家、设备类型和软件版本等影像设备信息)来寻找与该新的图像文件中的索引信息一致的分组,从而基于与该分组相对应的识别方案中进行序列类型识别。
例如,当遇到新的图像文件时,可以将该新的图像文件输入训练后的模型。读取该新的图像文件的文件头信息中的索引信息,并且根据读取的索引信息在训练后的模型中确定与所读取的索引信息一致的相应的一组序列类型识别方案,读取该新的图像文件的文件头信息中的扫描参数,并且根据读取的扫描参数确定是否需要更新序列类型识别方案。
例如,响应于读取的扫描参数的范围在相应的一组序列类型识别方案中的对应一个序列类型识别方案的扫描参数的范围内,确定不需要更新该对应一个序列类型识别方案,并且使用该对应一个序列类型识别方案的序列类型标签标记该新的图像文件。
进一步地,由于可能存在现有训练数据集不够多的情况,可能存在新的图像文件的扫描参数不在基于现有训练数据集所确定的多组序列类型识别方案的范围内的情况。
例如,响应于读取的扫描参数的取值不在相应的一组序列类型识别方案中的对应一个序列类型识别方案的扫描参数的范围内,确定需要更新该对应一个序列类型识别方案,并且使用读取的扫描参数的取值或范围更新该对应一个序列类型识别方案。
例如,只有当所有参数的取值都在相应序列类型识别方案中的相应参数的集合或范围内时,才使用该序列类型识别方案的序列类型标签来标记该新的图像文件,而只要有其中一个参数不在相应参数的范围内,便将该图像文件识别为错误或无法识别。当然,也可以设置一定的容错率,例如,当只有较少数量的参数的取值不在某个序列类型的相应参数的集合或范围内时,也可以将该序列确定为该序列类型。
如此,经过训练和更新过程,可以将最终的模型的全部序列类型识别方案导出为配置文件,或使用影像设备信息作为分组条件,将模型的多组序列类型识别方案中的每一组序列类型识别方案导出为配置文件,并将该配置文件存储在服务器中。当在新场地碰到某个新设备的时候,终端设备可以将匿名后的图像文件头上传,在服务器侧自动识别其中的扫描参数信息,自动从服务器的中心数据库中寻找相关的配置文件,以识别该图像文件中序列的类型,并可以将识别结果返回给终端设备。例如,这里的服务器可以是图2所示的服务器100,这里的终端设备可以是图2所示的终端设备200。
如此,基于本公开实施例的用于识别图像序列类型的模型所得到的配置文件可以自动化地寻找核磁共振序列背后的区分逻辑,降低编程的代价,提高在面向新设备、新版软件时配置序列识别方案的效率,降低产品化过程中的成本和风险。
图9示出了根据本公开实施例的基于用于识别图像序列类型的模型训练方法所得到的配置文件来配置影像设备的方法900的流程图,该配置影像设备的方法包括步骤S901-S903。
在步骤S901,接收所述影像设备生成的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息。
在步骤S902,根据所述扫描信息,检索对应的配置文件,所述配置文件包括根据上述用于识别图像序列类型的模型训练方法生成的用于识别图像的序列类型的模型。
例如,可以从服务器的中心数据库检索配置文件。例如,这里的服务器可以时图2所示的服务器100。
在步骤S903,使用检索的配置文件配置所述影像设备,以识别所述图像的序列类型。
例如,使用检索的配置文件配置影像设备包括:读取图像文件的文件头信息中的设备信息,并且根据读取的设备信息作为分组索引,在配置文件中确定相应的一组序列类型识别方案;读取图像文件的文件头信息中的扫描参数;响应于所有扫描参数的取值都在一组序列类型识别方案中的相应的一个序列类型识别方案的范围内,将该图像文件标识为与该相应的一个序列类型相同的序列类型;以及响应于至少一个扫描参数的取值不在该一组序列类型识别方案中的相应的一个序列类型识别方案的范围内,将该图像文件标识无法识别的序列。
当然,如上面已经陈述过的,也可以设置一定的容错率,例如,当只有较少数量的参数的取值不在相应序列类型的相应参数的集合或范围内时,也可以将该序列确定为该相应序列类型。
进一步地,在识别图像的序列类型之后,可以将该图像传输给与该序列类型对应的AI诊断模型,以基于不同的序列类型提取不同的特征信息,从而进行进一步的分析判断等任务。
此外,更进一步地,当遇到新影像设备或新软件的情况下,在服务器中可能并不能检索到与该新的图像文件相对应的配置文件。此时,响应于没有检索到对应的配置文件,可以建立新的未训练的用于识别图像的序列类型的模型,并基于新的图像文件使用前面所述的用于识别图像序列类型的模型训练方法来训练该模型,以获得新的配置文件。
基于上述实施例,参考图10所示,为本公开实施例的用于识别图像的序列类型的模型的训练装置1000的结构示意图。该装置1000至少包括获取部件1001、标签提取部件1002和训练部件1003。本公开实施例中,获取部件1001、标签提取部件1002和训练部件1003为相关的医疗器械,可以集成在同一医疗器械中,也可以分为多个设备,相互连接通信,组成一个医疗系统来使用等,例如获取部件1001可以为核磁共振成像装置,标签提取部件1002和训练部件1003可以为与核磁共振成像装置相通信的计算机设备等。
具体地,获取部件1001用于获取预设个数的检查项目相同的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息;其中,所述图像中的每个序列均带有该序列的序列类型标签。标签提取部件1002用于从所述图像中提取每个序列的序列类型标签。训练部件1003用于基于每个序列类型标签和所述扫描信息训练所述模型,以获得包括多组序列类型识别方案的训练后的模型。
例如,所述序列类型标签的设置包括:接收每个序列上的第一输入信息,并使用所述第一输入信息对该序列设置序列类型标签。
例如,所述扫描信息包括用于确定序列类型的多个扫描参数和影像设备信息,所述影像设备信息包括设备厂家、设备类型、软件版本号中的一个或多个,所述多个扫描参数至少包括具有第一取值类型的一个或多个第一类参数、具有第二取值类型的一个或多个第二类参数和具有第三取值类型的一个或多个第三类参数中的一个或多个。
例如,所述一个或多个第一类参数包括枚举类型的一个或多个参数,所述一个或多个第二类参数包括具有取值范围的一个或多个参数,以及所述一个或多个第三类参数包括文本类型的一个或多个参数,其中所述一个或多个第一类参数和所述一个或多个第二类参数的标签和对应取值从所述文件头信息中直接提取,所述一个或多个第三类参数的标签和对应取值通过对所述文件头信息中的文本信息执行自然语言识别技术获得,所述一个或多个第三类参数的标签的对应取值的类型包括枚举类型和取值范围中的一者或两者。
例如,训练部件1003基于每个序列类型标签和所述扫描信息训练所述模型,以获得包括多组序列类型识别方案的训练后的模型包括:使用所述影像设备信息作为分组条件,将所有所述图像文件进行分组;对于每一组的图像文件,使用带有相同的序列类型标签的每个子组的图像文件中的扫描参数分别训练所述模型,以获得包括分别与多个不同组的图像文件相对应的多组序列类型识别方案的训练后的模型。
例如,训练部件1003使用带有相同的序列类型标签的每个子组的图像文件中的扫描参数分别训练所述模型,以获得包括分别与多个不同组的图像文件相对应的多组序列类型识别方案的训练后的模型包括:对于每一组的图像文件,使用带有相同的序列类型标签的每个子组的图像文件中的扫描参数,确定与该序列类型对应的一个或多个第一类参数中的每一个第一类参数的集合、一个或多个第二类参数中的每一个第二类参数的范围和/或一个或多个第三类参数中的每一个第三类参数的集合和/或范围,基于确定的每一个第一类参数的集合、每一个第二参数的范围和/或每一个第三参数的集合和/或范围,确定该序列类型的序列类型识别方案,整合确定的多个序列类型识别方案以获得与一组图像文件相对应的一组序列类型,从而获得包括与多个不同组的图像文件相对应的多组序列类型识别方案的训练后的模型。
例如,训练部件1003确定与该序列类型对应的一个或多个第一类参数中的每一个第一类参数的集合包括针对任意一个第一类参数执行以下步骤:读取每个子组的图像文件的文件头信息的扫描参数中的所述第一类参数的多个标签,针对所述第一类参数的每个标签,记录对应的取值,以形成所述第一类参数的集合。
例如,训练部件1003确定与该序列类型对应的一个或多个第二类参数中的每一个第二类参数的范围包括针对任意一个第二类参数执行以下步骤:读取每个子组的图像文件的文件头信息的扫描参数中的所述第二类参数的多个标签,针对所述第二类参数的每个标签,记录对应的取值,以形成所述第二类参数的取值范围,使用所有取值中的最小值作为取值范围的最小值,并且使用所有取值中的最大值作为取值范围的最大值。
例如,训练部件1003确定与该序列类型对应的一个或多个第三类参数中的每一个第三类参数的集合和/或范围包括针对任意一个第三类参数执行以下步骤:针对每个子组的图像文件的文件头信息的文本信息执行自然语言识别以获得所述第三类参数的多个标签以及每个标签的取值,针对对应取值为枚举类型的第三类参数的每个标签,记录对应的取值,以形成所述第三类参数的集合;和/或针对对应取值为取值范围的第三类参数的每个标签,记录对应的取值,以形成所述第三类参数的取值范围,使用所有取值中的最小值作为取值范围的最小值,并且使用所有取值中的最大值作为取值范围的最大值。
根据本公开的另一实施例,装置1000还包括新图像文件获取部件1004,序列类型识别方案确定部件1005,和方案更新判定部件1006。新图像文件获取部件1004用于并将所述新的图像文件输入训练后的模型。序列类型识别方案确定部件1005读取新的图像文件的文件头信息中的影像设备信息,并且根据读取的影像设备信息,在所述训练后的模型中确定相应的一组序列类型识别方案。方案更新判定部件1006读取所述新的图像文件的文件头信息中的扫描参数,并且根据读取的扫描参数确定是否需要更新序列类型识别方案。
例如,响应于读取的扫描参数的范围在所述相应的一组序列类型识别方案中的对应一个序列类型识别方案的扫描参数的范围内,方案更新判定部件1006确定不需要更新对应的序列类型识别方案,并且使用所述对应一个序列类型识别方案的序列类型标签标记所述新的图像文件。
例如,响应于读取的扫描参数的取值不在所述相应的一组序列类型识别方案中的对应一个序列类型识别方案的扫描参数的范围内,确定需要更新所述对应一个序列类型识别方案,方案更新判定部件1006并且使用读取的扫描参数的取值或范围更新所述对应一个序列类型识别方案。
例如,所述影像设备包括X射线装置、电子计算机断层扫描装置、磁共振成像装置、多参数核磁成像装置中的一个。
例如,所述图像文件是医疗数字影像传输协定DICOM文件,以及所述文件头信息是DICOM文件头。
例如,装置1000还包括配置文件导出部件1007(未示出)和配置文件存储部件1008(未示出)。配置文件导出部件1007用于将所述模型的全部序列类型识别方案导出为配置文件,或使用所述影像设备信息作为分组条件,将所述模型的多组序列类型识别方案中的每一组序列类型识别方案导出为配置文件。配置文件存储部件1008用于将所述配置文件存储在服务器中。
图11示出了根据本公开实施例的用于配置影像设备的装置1100的示意图,具体包括接收部件1101,检索部件1102和识别部件1103。
接收部件1101用于接收所述影像设备生成的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息。检索部件1102用于根据所述扫描信息,检索对应的配置文件,所述配置文件包括根据前述上面所述的任意一项方法生成的用于识别图像的序列类型的模型。识别部件1103用于使用检索的配置文件配置所述影像设备,以识别所述图像的序列类型。
基于上述实施例,本公开实施例中还提供了另一示例性实施方式的电子设备。在一些可能的实施方式中,本公开实施例中电子设备可以包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行程序时可以实现上述实施例中内窥镜图像分类模型训练方法或内窥镜图像识别方法的步骤。
例如,以电子设备为本公开图2中的服务器100为例进行说明,则该电子设备中的处理器即为服务器100中的处理器110,该电子设备中的存储器即为服务器100中的存储器120。
本公开的实施例还提供了一种计算机可读存储介质。图12示出了根据本公开的实施例的存储介质1200的示意图。如图12所示,所述计算机可读存储介质1200上存储有计算机可执行指令1201。当所述计算机可执行指令1201由处理器运行时,可以执行参照以上附图描述的根据本公开实施例的用于识别图像序列类型的模型训练方法。所述计算机可读存储介质包括但不限于例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。
本公开的实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行根据本公开实施例的用于识别图像序列类型的模型训练方法。
图13-图18示出了根据本公开实施例的用于识别图像序列类型的模型训练方法和配置影像设备的方法所设计的界面示意图。
图13示出了如上图3所述的步骤S301和步骤S302的界面示意图。
首先在步骤S301中获取预设个数的检查项目相同的图像文件,随后在和步骤S302中提取每个序列的序列类型标签。例如,在该示例中是由有经验的医生在浏览图像之后,在序列上点击右键进行序列的分类标,如图13的(a)和(b)所示。
图14示出了如上所述的图3所述的步骤S303的界面示意图。
如图14所示,在获取完每个序列的序列类型标签以后,选中所有患者,点击右键菜单“分析”,所有患者的图像文件提交后台进行根据本公开实施例的用于识别图像序列类型的模型的训练。
图15示出了训练后的模型所包括的序列类型识别方案的界面示意图。如图15上半部分所示,在图15的示例中包括两组序列类型识别方案,分别“Philips Medical System”、“MR”、“3.2.1”和“GE MEDICAL SYSTEM”、“MR”、“15\LX\MR Software Release:15.0_M4A_0947.a”为进行索引。图15的下半部分为由“Philips Medical System”、“MR”、“3.2.1”索引的一组序列类型识别方案,包括分别与T1、T2和DWI三个序列类型相对应的三个序列类型识别方案。
图16示出了基于训练好的模型所包括的序列类型识别方案对新的图像文件进行测试的示意界面图。如图16所示,选择新的图像文件,右键点击“测试”按钮,得出该新的图像文件的序列标记。例如,若新的图像文件的所有扫描参数的范围都在相应的一个序列类型识别方案的范围内,将该新的图像文件标识为与该相应的一个序列类型相同的序列类型,若新的图像文件的至少一个扫描参数的范围不在相应的一个序列类型识别方案的范围内,将该新的图像文件标识为无法识别的序列,进一步由人工进行标记。如何基于训练好的模型来识别新的图像文件的序列类型的具体细节已在前面进行了详细描述,在此不再赘述。
图17示出了将训练好的模型的序列类型识别方案导出为配置文件的界面示意图。例如,选择下方下拉菜单中的“导出所有配置”选项,导出与所有分组相对应的全部序列类型识别方案,也可以选择下方下拉菜单中的“根据DICOM文件导出”选项,可以基于分组索引,按组来导出配置文件。
图18示出了导入配置文件的界面示意图。
例如,当在新场地碰到某个新设备的时候,终端设备可以将匿名后的DICOM文件头上传到服务器,服务器自动从中心数据库中寻找并导入相关的配置文件,以基于导入的配置文件识别该DICOM文件中序列的类型。服务器对图像文件进行序列类型识别后,可以将识别结果返回给终端设备。
本领域技术人员能够理解,本公开所披露的内容可以出现多种变型和改进。例如,以上所描述的各种设备或组件可以通过硬件实现,也可以通过软件、固件、或者三者中的一些或全部的组合实现。
此外,虽然本公开对根据本公开的实施例的系统中的某些单元做出了各种引用,然而,任何数量的不同单元可以被使用并运行在客户端和/或服务器上。所述单元仅是说明性的,并且所述系统和方法的不同方面可以使用不同单元。
本领域普通技术人员可以理解上述方法中的全部或部分的步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本公开并不限制于任何特定形式的硬件和软件的结合。
除非另有定义,这里使用的所有术语(包括技术和科学术语)具有与本公开所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
以上是对本公开的说明,而不应被认为是对其的限制。尽管描述了本公开的如果干示例性实施例,但本领域技术人员将容易地理解,在不背离本公开的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此,所有这些修改都意图包含在权利要求书所限定的本公开范围内。应当理解,上面是对本公开的说明,而不应被认为是限于所公开的特定实施例,并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本公开由权利要求书及其等效物限定。

Claims (22)

1.一种用于识别图像序列类型的模型训练方法,包括:
获取预设个数的检查项目相同的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息,其中,所述图像中的每个序列均带有该序列的序列类型标签;
从所述图像中提取每个序列的序列类型标签;以及
基于每个序列类型标签和所述扫描信息训练所述模型,以获得包括多组序列类型识别方案的训练后的模型;
其中,所述扫描信息包括用于确定序列类型的多个扫描参数,所述多个扫描参数至少包括具有第一取值类型的一个或多个第一类参数、具有第二取值类型的一个或多个第二类参数和具有第三取值类型的一个或多个第三类参数中的一个或多个;
所述一个或多个第一类参数包括枚举类型的一个或多个参数,
所述一个或多个第二类参数包括具有取值范围的一个或多个参数,以及
所述一个或多个第三类参数包括文本类型的一个或多个参数,
其中所述一个或多个第一类参数和所述一个或多个第二类参数的标签和对应取值从所述文件头信息中直接提取,所述一个或多个第三类参数的标签和对应取值通过对所述文件头信息中的文本信息执行自然语言处理技术获得,所述一个或多个第三类参数的标签的对应取值的类型包括枚举类型和取值范围中的一者或两者。
2.根据权利要求1所述的方法,其中,所述序列类型标签的设置包括:
接收每个序列上的第一输入信息,并使用所述第一输入信息对该序列设置序列类型标签。
3.根据权利要求1所述的方法,其中,所述扫描信息还包括用于确定序列类型的影像设备信息,所述影像设备信息包括设备厂家、设备类型、软件版本号中的一个或多个。
4.根据权利要求1所述的方法,其中,基于每个序列类型标签和所述扫描信息训练所述模型,以获得包括多组序列类型识别方案的训练后的模型包括:
使用影像设备信息作为分组索引,将所有所述图像文件进行分组;
对于每一组的图像文件,使用带有相同的序列类型标签的每个子组的图像文件中的扫描参数分别训练所述模型,以获得包括分别与多个不同组的图像文件相对应的多组序列类型识别方案的训练后的模型。
5.根据权利要求4所述的方法,其中,使用带有相同的序列类型标签的每个子组的图像文件中的扫描参数分别训练所述模型,以获得包括分别与多个不同组的图像文件相对应的多组序列类型识别方案的训练后的模型包括:
对于每一组的图像文件,使用带有相同的序列类型标签的每个子组的图像文件中的扫描参数,确定与该序列类型对应的一个或多个第一类参数中的每一个第一类参数的集合、一个或多个第二类参数中的每一个第二类参数的范围和/或一个或多个第三类参数中的每一个第三类参数的集合和/或范围,
基于确定的每一个第一类参数的集合、每一个第二参数的范围和/或每一个第三类参数的集合和/或范围,确定该序列类型的序列类型识别方案,
整合确定的多个序列类型识别方案以获得与一组图像文件相对应的一组序列类型,从而获得包括与多个不同组的图像文件相对应的多组序列类型识别方案的训练后的模型。
6.根据权利要求5所述的方法,其中,确定与该序列类型对应的一个或多个第一类参数中的每一个第一类参数的集合包括针对任意一个第一类参数执行以下步骤:
读取每个子组的图像文件的文件头信息的扫描参数中的所述第一类参数的多个标签,
针对所述第一类参数的每个标签,记录对应的取值,以形成所述第一类参数的集合。
7.根据权利要求5所述的方法,其中,确定与该序列类型对应的一个或多个第二类参数中的每一个第二类参数的范围包括针对任意一个第二类参数执行以下步骤:
读取每个子组的图像文件的文件头信息的扫描参数中的所述第二类参数的多个标签,
针对所述第二类参数的每个标签,记录对应的取值,以形成所述第二类参数的取值范围,
使用所有取值中的最小值作为取值范围的最小值,并且使用所有取值中的最大值作为取值范围的最大值。
8.根据权利要求5所述的方法,其中,确定与该序列类型对应的一个或多个第三类参数中的每一个第三类参数的集合和/或范围包括针对任意一个第三类参数执行以下步骤:
针对每个子组的图像文件的文件头信息的文本信息执行自然语言处理以获得所述第三类参数的多个标签以及每个标签的取值,
针对对应取值为枚举类型的第三类参数的每个标签,记录对应的取值,以形成所述第三类参数的集合;和/或
针对对应取值为取值范围的第三类参数的每个标签,记录对应的取值,以形成所述第三类参数的取值范围,使用所有取值中的最小值作为取值范围的最小值,并且使用所有取值中的最大值作为取值范围的最大值。
9.根据权利要求5所述的方法,还包括:
获取新的图像文件,并将所述新的图像文件输入训练后的模型;
读取所述新的图像文件的文件头信息中的影像设备信息,并且根据读取的影像设备信息,在所述训练后的模型中确定相应的一组序列类型识别方案;
读取所述新的图像文件的文件头信息中的扫描参数,并且根据读取的扫描参数确定是否需要更新序列类型识别方案。
10.根据权利要求9所述的方法,其中,响应于读取的扫描参数的范围在所述相应的一组序列类型识别方案中的对应一个序列类型识别方案的扫描参数的范围内,确定不需要更新所述对应一个序列类型识别方案,并且使用所述对应一个序列类型识别方案的序列类型标签标记所述新的图像文件。
11.根据权利要求9所述的方法,其中,响应于读取的扫描参数的取值不在所述相应的一组序列类型识别方案中的对应一个序列类型识别方案的扫描参数的范围内,确定需要更新所述对应一个序列类型识别方案,并且使用读取的扫描参数的取值或范围更新所述对应一个序列类型识别方案。
12.根据权利要求3所述的方法,其中,所述影像设备包括X射线装置、电子计算机断层扫描装置、磁共振成像装置、多参数核磁成像装置中的一个。
13.根据权利要求1所述的方法,其中,所述图像文件是医疗数字影像传输协定DICOM文件,以及所述文件头信息是DICOM文件头。
14.根据权利要求1-13的任一所述的方法,还包括:
将所述模型的全部序列类型识别方案导出为配置文件,或使用影像设备信息作为分组索引,将所述模型的多组序列类型识别方案中的每一组序列类型识别方案导出为配置文件;以及
将所述配置文件存储在服务器中。
15.一种配置影像设备的方法,包括:
接收所述影像设备生成的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息;
根据所述扫描信息,检索对应的配置文件,所述配置文件包括根据前述权利要求1-14的任一所述的方法生成的用于识别图像的序列类型的模型;以及
使用检索的配置文件配置所述影像设备,以识别所述图像的序列类型。
16.根据权利要求15所述的方法,还包括:
根据确定的所述图像的序列类型,将所述图像传输给与该序列类型对应的AI诊断模型。
17.根据权利要求15所述的方法,还包括:
响应于没有检索到对应的配置文件,建立新的配置文件,所述新的配置文件包括未训练的用于识别图像的序列类型的模型;
使用权利要求1-14的任一所述的方法训练所述未训练的用于识别图像的序列类型的模型以获得训练后的模型。
18.根据权利要求15所述的方法,其中,使用检索的配置文件配置所述影像设备包括:
读取所述图像文件的文件头信息中的设备信息,并且根据读取的设备信息作为分组索引,在所述配置文件中确定相应的一组序列类型识别方案;
读取所述图像文件的文件头信息中的扫描参数;
响应于所有扫描参数的取值都在所述一组序列类型识别方案中的相应的一个序列类型识别方案的范围内,将所述图像文件标识为与所述相应的一个序列类型相同的序列类型;以及
响应于至少一个扫描参数的取值不在所述一组序列类型识别方案中的相应的一个序列类型识别方案的范围内,将所述图像文件标识为无法识别的序列。
19.一种用于识别图像的序列类型的模型的训练装置,包括:
获取部件,获取预设个数的检查项目相同的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息,其中,所述图像中的每个序列均带有该序列的序列类型标签;
标签提取部件,从所述图像中提取每个序列的序列类型标签;以及
训练部件,基于每个序列类型标签和所述扫描信息训练所述模型,以获得包括多组序列类型识别方案的训练后的模型;
其中,所述扫描信息包括用于确定序列类型的多个扫描参数,所述多个扫描参数至少包括具有第一取值类型的一个或多个第一类参数、具有第二取值类型的一个或多个第二类参数和具有第三取值类型的一个或多个第三类参数中的一个或多个;
所述一个或多个第一类参数包括枚举类型的一个或多个参数,
所述一个或多个第二类参数包括具有取值范围的一个或多个参数,以及
所述一个或多个第三类参数包括文本类型的一个或多个参数,
其中所述一个或多个第一类参数和所述一个或多个第二类参数的标签和对应取值从所述文件头信息中直接提取,所述一个或多个第三类参数的标签和对应取值通过对所述文件头信息中的文本信息执行自然语言处理技术获得,所述一个或多个第三类参数的标签的对应取值的类型包括枚举类型和取值范围中的一者或两者。
20.一种用于配置影像设备的装置,包括:
接收部件,接收所述影像设备生成的图像文件,所述图像文件包括文件头信息和图像,所述文件头信息包括与所述图像有关的扫描信息;
检索部件,根据所述扫描信息,检索对应的配置文件,所述配置文件包括根据前述权利要求1-14的任一所述的方法生成的用于识别图像的序列类型的模型;以及
识别部件,使用检索的配置文件配置所述影像设备,以识别所述图像的序列类型。
21.一种电子设备,包括:存储器和处理器,其中,所述存储器上存储有处理器可执行的程序代码,所述程序代码被所述处理器执行时,用于实现前述权利要求1-18中任一项所述的方法。
22.一种计算机设备可读存储介质,其中,所述计算机设备可读存储介质包括计算机可执行指令,当所述指令被处理器执行时,用于实现前述权利要求1-18中任一项所述的方法。
CN202210730491.XA 2022-06-24 2022-06-24 识别图像序列类型的模型训练方法和配置影像设备的方法 Active CN114913383B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210730491.XA CN114913383B (zh) 2022-06-24 2022-06-24 识别图像序列类型的模型训练方法和配置影像设备的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210730491.XA CN114913383B (zh) 2022-06-24 2022-06-24 识别图像序列类型的模型训练方法和配置影像设备的方法

Publications (2)

Publication Number Publication Date
CN114913383A CN114913383A (zh) 2022-08-16
CN114913383B true CN114913383B (zh) 2023-06-30

Family

ID=82772416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210730491.XA Active CN114913383B (zh) 2022-06-24 2022-06-24 识别图像序列类型的模型训练方法和配置影像设备的方法

Country Status (1)

Country Link
CN (1) CN114913383B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110853740A (zh) * 2019-11-07 2020-02-28 李真林 从dicom图像中提取影像扫描方案特征的系统及方法
CN111524582A (zh) * 2020-07-03 2020-08-11 嘉兴太美医疗科技有限公司 医学影像信息的加载方法、装置、系统和计算机可读介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107669273B (zh) * 2017-11-07 2021-02-19 上海联影医疗科技股份有限公司 磁共振设备扫描系统、扫描方法及计算机可读存储介质
CN114565572A (zh) * 2022-02-22 2022-05-31 南京航空航天大学 一种基于图像序列分析的脑出血ct图像分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110853740A (zh) * 2019-11-07 2020-02-28 李真林 从dicom图像中提取影像扫描方案特征的系统及方法
CN111524582A (zh) * 2020-07-03 2020-08-11 嘉兴太美医疗科技有限公司 医学影像信息的加载方法、装置、系统和计算机可读介质

Also Published As

Publication number Publication date
CN114913383A (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
JP7399102B2 (ja) 医用イメージングにおける自動スライス選択
US10755411B2 (en) Method and apparatus for annotating medical image
US20190279751A1 (en) Medical document creation support apparatus, method, and program
CN112334070B (zh) 医用图像处理装置和方法、机器学习系统以及存储介质
CN103221972B (zh) 医用系统
CN112635011A (zh) 疾病诊断方法、疾病诊断系统和可读存储介质
JP2019061579A (ja) 学習支援装置、学習支援装置の作動方法、学習支援プログラム、学習支援システム、および端末装置
US11574717B2 (en) Medical document creation support apparatus, medical document creation support method, and medical document creation support program
CN111989583A (zh) 磁共振成像中的自动伪影检测和脉冲序列修改
CN106326416B (zh) Dicom图像显示方法及装置
CN115862831B (zh) 一种智能在线预约诊疗管理系统及方法
US11688498B2 (en) Medical document display control apparatus, medical document display control method, and medical document display control program
CN114331992A (zh) 图像序列处理方法、装置、计算设备及存储介质
Dillard et al. Insights into conducting audiological research with clinical databases
CN114913383B (zh) 识别图像序列类型的模型训练方法和配置影像设备的方法
EP3734550A1 (en) Removal of false positives from white matter fiber tracts
WO2019208130A1 (ja) 医療文書作成支援装置、方法およびプログラム、学習済みモデル、並びに学習装置、方法およびプログラム
CN116958539A (zh) 用于血管树分割的模型训练和图像处理方法、装置及设备
EP4210070A1 (en) Machine learning based on radiology report
CN113538395A (zh) 图像处理方法、装置、设备、可读存储介质
CN111709946A (zh) 一种影像数据分析方法、装置、终端设备及存储介质
Zhou et al. A novel approach to form Normal Distribution of Medical Image Segmentation based on multiple doctors’ annotations
US20200051676A1 (en) Device, system, and method for optimizing usage of prior studies
RU2814790C1 (ru) Способ выявления онкозаболеваний в органах малого таза и система для реализации способа
CN107887009A (zh) 医院信息数据的处理方法及装置、计算机存储介质和终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant