CN109830285A - 一种医学影像文件处理方法和装置 - Google Patents
一种医学影像文件处理方法和装置 Download PDFInfo
- Publication number
- CN109830285A CN109830285A CN201910013427.8A CN201910013427A CN109830285A CN 109830285 A CN109830285 A CN 109830285A CN 201910013427 A CN201910013427 A CN 201910013427A CN 109830285 A CN109830285 A CN 109830285A
- Authority
- CN
- China
- Prior art keywords
- attribute
- binary tree
- node
- medical image
- image file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请提供一种医学影像文件的处理方法及装置,其中医学影像文件的处理方法包括:对符合医学数字成像及通信标准的医学影像文件,抽取所述医学影像文件的属性信息,所述属性信息包括属性和属性值;将所述属性信息与所述医学影像文件的存储位置相关联;根据各医学影像文件的属性信息,构建多维类二叉树;根据用户输入的关键词搜索所述多维类二叉树,当在所述多维类二叉树中检索到与所述关键词匹配的目标节点时,确定与所述目标节点表征的属性信息相关联的医学影像文件的存储位置,从所述存储系统中的所述存储位置取出所述医学影像文件返回给用户。本申请提供的方法使用了多维类二叉树的存储结构,在用户检索时,可以快速响应检索的请求。
Description
技术领域
本申请涉及文件处理技术,特别涉及医学影像文件的分类检索。
背景技术
随着医学成像技术的日益普及,医学影像在辅助诊断、远程会诊和医学研究等领域都扮演着重要的角色,医学影像的数量也与日俱增。面对大量的医学影像数据,如何从中快速、精确地找到所需的数据成为一个亟待解决的问题。传统的医学影像检索大多基于文本的检索,依赖于影像的标签,难以达到精确检索。
发明内容
有鉴于此,本申请提供一种医学影像文件处理方法和装置。
第一方面,本申请提供的医学影像文件处理方法是通过如下技术方案实现的:
对符合医学数字成像及通信(Digital Imaging and Communications inMedicine,DICOM)标准的医学影像文件,抽取所述医学影像文件的属性信息,所述属性信息包括属性和属性值;
将所述属性信息与所述医学影像文件的存储位置相关联;
根据各医学影像文件的属性信息,构建多维类二叉树,其中,所述多维类二叉树中每一维二叉树对应一个不同的属性,每一维二叉树的节点由所述属性对应的属性值生成;
根据用户输入的关键词搜索所述多维类二叉树,当在所述多维类二叉树中检索到与所述关键词匹配的目标节点时,确定与所述目标节点表征的属性信息相关联的医学影像文件的存储位置,从所述存储位置取出所述医学影像文件返回给用户。
第二方面,提供一种医学影像文件处理装置,所述装置包括:
抽取模块,用于对符合医学数字成像及通信DICOM标准的医学影像文件,抽取所述医学影像文件的属性信息,所述属性信息包括属性和属性值;
关联模块,用于将所述属性信息与所述医学影像文件的存储位置相关联;
构建模块,用于根据各医学影像文件的属性信息,构建多维类二叉树,其中,所述多维类二叉树中每一维二叉树对应一个不同的属性,每一维二叉树的节点由所述属性对应的属性值生成;
检索模块,用于根据用户输入的关键词搜索所述多维类二叉树,当在所述多维类二叉树中检索到与所述关键词匹配的目标节点时,确定与所述目标节点表征的属性信息相关联的医学影像文件的存储位置,从所述存储位置取出所述医学影像文件返回给用户。
本申请提供的医学影像文件分类检索方法和装置使用了多维类二叉树的存储结构,从而在用户检索时,可以快速响应检索的请求。
附图说明
图1是本申请一示例性实施例示出的医学影像文件处理方法流程图;
图2是本申请另一示例性实施例示出的医学影像文件处理方法流程图;
图3是本申请一示例性实施例示出的二叉搜索树结构图;
图4是本申请一示例性实施例示出的二维类二叉搜索树结构图;
图5是本申请一示例性实施例示出的构建二维类二叉树流程图;
图6是本申请再一示例性实施例示出的医学影像文件处理方法流程图;
图7是本申请一示例性实施例提供的一种医学影像文件处理装置的硬件结构示意图;
图8是本申请一示例性实施例提供的一种医学影像文件处理的逻辑控制功能模块示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
传统的医学影像文件检索大多基于文本的检索,由于需要手工对图像添加标签,存在着耗时耗力及标注不全等问题。此外,由于分类维度单一,无法满足多维检索的需求。
跟随人工智能的潮流发展,在医学影像领域,出现了一些基于人工智能的影像分类和检索的方法。基于人工智能实现的影像分类和检索,在训练模型时需要大量的训练数据作为基础。由于我国的医学影像仍旧在向电子数据过渡阶段,而且医院之间的数据还没有实现共享,在训练模型时没有足够多的数据作为训练基础,模型训练不完善,对于模型预测的准确率有一定的影响。
针对上述医学影像分类和检索的缺点,本申请提供一种医学影像文件处理方法。首先提取影像文件信息,将影像类别划分成多个维度,然后根据不同维度构建数据存储模型,通过检索算法实现快速检索影像的功能。
如图1所示,为根据本申请一个实施例所述医学影像文件处理方法的流程示意图。
步骤S101,对符合DICOM标准的医学影像文件,抽取所述医学影像文件的属性信息,所述属性信息包括属性和属性值。
在步骤S101中,首先将所需的属性信息从影像文件中自动提取出来。为了统一各种数字化影像设备的图像,诞生了DICOM标准。当前医学影像设备均支持该标准。DICOM文件是指按照DICOM标准而存储的医学文件。DICOM文件的数据元素是以属性和对应的属性值形式来存储的。其中,属性可以包括成像时间、检查日期、检查部位、成像仪器、病人姓名、病人id、病人年龄等。通过解析DICOM文件可以提取对应的属性及属性值,所述属性及属性值可以按预定的格式组合成所述DICOM文件的属性信息,例如可以使用软件代码、比如java代码实现的DICOM解析器对属性信息进行自动提取。本申请对实现DICOM解析器的软件语言不做限定。
所述属性信息可以包括在DICOM文件中存储的检查类型、检查部位、患者年龄、或患者id等属性以及各属性的具体值。这样,一幅医学影像就可以用其属性信息进行表征。每幅医学影像的属性信息可为包括数字和/或文字的字符串。例如,检查类型CT-检查部位躯干-患者年龄50。
由于本申请所述方法可以把属性信息自动从医学影像文件中提取出来,无需手工添加标签,从而极大的提高了医学影像文件的归档效率。
步骤S102,将所述属性信息与所述医学影像文件存储位置相关联。
在步骤S102中,将该属性信息作为关键值key,将该医学影像的存储地址作为数值value,每一key值对应一个value值。将key值和value值的对应关系存储于存储系统中。此存储系统与医学影像的存储系统可以相同,也可以不同。本申请对此不做限定。
步骤S103,根据各医学影像文件的属性信息,构建多维类二叉树,其中,所述多维类二叉树中每一维二叉树对应一个不同的属性,每一维二叉树的节点由所述属性对应的属性值生成。
对于key值中的各个属性,可以按照顺序将其称为第一属性、第二属性、第三属性等等。例如,对于key值为检查类型CT-检查部位躯干-患者年龄50的医学影像文件,第一属性可以为检查类型、属性值为CT,第二属性可以为检查部位、属性值为躯干,第三属性可以为患者年龄、属性值为50。
在步骤S103中,可以先对第一属性构建二叉树。该二叉树可以称为第一维二叉树。所构建的第一维二叉树包括多个节点,所述多个节点可以包括:一个根节点,每个根节点可以有两个子节点。可以选择第一属性的任一属性值作为根节点,其他属性值作为相应的子节点。然后根据第二属性,在第一维二叉树的各个节点上,构建第二维二叉树。为了将第二维二叉树和第一维二叉树的节点对应起来,可以在第一维二叉树的每个节点上,设置一个指向下一维二叉树的指针S-node,S-node指向下一维二叉树的根节点。第二属性的各个属性值构成第二维二叉树的每个节点。接着,根据第三属性,在第二维二叉树的各个节点上,构建第三维二叉树。同样,对于第二维二叉树的各个节点设置指向下一维二叉树的指针S-node,并且第三属性的各个属性值构成第三维二叉树的每个节点。以此类推,为第N-1维二叉树的每个节点,构建第N维二叉树,并且在第N维二叉树的节点下存储所述医学影像文件的所述存储位置,其中N为大于或等于2的正整数。
具体的,在一个例子中,在构建第i维二叉树时,可以调整该第i维二叉树中每个节点的指针,使得所述第i维二叉树形成二叉搜索树。
假设第一维二叉树已经构建成功,可以随机抽取代表医学影像文件的key值,根据该key值的所述第一属性的属性值遍历第一维二叉树。当第一属性的属性值与第一维二叉树的某一节点的节点值一致时,称其为第一维目标节点,查找该第一维目标节点的下一维二叉树的指针S-node是否为空,从而判断其是否存在下一维二叉树。如果S-node为空,则表明该节点还没有第二维二叉树;如果S-node不为空,则表明该节点存在第二维二叉树。
如果S-node为空,则设置第一维目标节点的下一维二叉树的指针S-node指向key值的第二属性对应的属性值,并将所述属性值设置为第一维目标节点的下一维二叉树的根节点的值。并且,当所述key值不存在第三属性时,将所述key值对应的医学影像文件的存储位置记录在该根节点下;当所述key值存在第三属性时,将该根节点的下一维二叉树的指针S-node指向第三属性对应的属性值上;依此方法,进行第三维以至更高维二叉树的二叉树根节点的生成。
如果S-node不为空,则根据key值的第二属性对应的属性值遍历第一维目标节点的下一维二叉树。若遍历失败,则在所述下一维二叉树下生成子节点,将key值的第二属性对应的属性值插入到所述子节点上。并且:当key值不存在第三属性时,将key值对应的医学影像存储位置记录在该子节点下;当所述key值存在第三属性时,将该子节点的下一维二叉树的指针S-node指向第三属性对应的属性值上。依此方法,进行第三维以至更高维二叉树的生成。若遍历成功,将匹配的节点称为第二维目标节点,且继续判断key值是否存在第三属性:当不存在第三属性时,将key值对应的医学影像存储位置记录在第二维目标节点下;当存在所述第三属性时,依此方法判断第二维目标节点是否存在下一维二叉树,然后进行第三维以至更高维二叉树的生成或遍历。
由此,可以为每个医学影像文件生成对应所有属性信息的多维类二叉树。将该多维类二叉树存储于存储系统中。
在另一个例子中,由于可以提前知悉某个属性的取值范围,比如,对于病人年龄,可以为0-120。那么提前设置一个中值,比如60。将该中值设置为所述属性对应维度的二叉树的根节点。然后大于60属性值插入到二叉树的右边,小于60的属性值插入到二叉树的左边。
在对应所有医学影像文件的key值构建好多维类二叉树后,对于实际用户的检索需求,有如下的步骤。
步骤S104,根据用户输入的关键词搜索所述多维类二叉树,当在所述多维类二叉树中检索到与所述关键词匹配的目标节点时,确定与所述目标节点表征的属性信息相关联的医学影像文件的存储位置,从所述存储位置取出医学影像文件返回给用户。
在步骤S104中,按照用户输入的关键词,逐维检索多维类二叉树。当在所述多维类二叉树中检索到与所述关键词匹配的目标节点时,根据目标节点下存储的医学影像文件的地址,从所述地址取出医学影像文件返回给用户。
具体来讲,根据关键词中对应第一属性的属性值遍历第一维二叉树,以确定所述第一维二叉树中与所述关键词匹配的子节点作为第一节点。根据所述关键词中对应所述第二属性的属性值遍历所述第一节点下的第二维二叉树,以确定所述第二维二叉树中与所述关键词匹配的子节点作为第二节点。依次类推,直到根据所述关键词中对应所述第N属性的属性值遍历第N-1节点下的所述第N维二叉树,以确定所述第N维二叉树中与所述关键词匹配的子节点作为所述目标节点。然后将目标节点下保存的医学影像文件存储位置,从所述存储位置取出医学影像文件返回给用户。
在现有技术中,根据二叉树实现查找的算法有很多,本申请对具体的查找算法不做限定。
由上述例子可以看出,由于二叉树本身在检索时效率较高,因此本申请所述方法使用了多维类二叉树的存储结构,从而在用户检索时,可以快速响应检索的请求。
为了更好地理解本申请例子的技术方案和技术效果,以下将结合具体的实施例进行详细的说明。
如图2所示,为根据本申请另一个实施例所述的医学影像文件处理方法的流程示意图。在本例中,抽取医学影像文件的两个属性信息。
步骤S201,抽取符合DICOM标准的医学影像文件的两个属性信息,将所述两个属性信息与所述医学影像文件的存储位置相关联。
在本例中,使用检查类型、检查部位作为关键值的属性信息进行抽取。
可以将检查类型、检查部位分别定义序号。检查类型、检查部位的序号对应如表1和表2所示(检查类型和检查部位的种类很多,这里只列出部分数据以作示例)。
序号 | 检查类型 | 检查类型说明 |
1 | QT | 其它 |
2 | PX | 普通X光机 |
3 | CR | CR |
4 | CT | CT |
5 | MR | MR |
6 | US | 超声 |
7 | NKJ | 内窥镜 |
8 | DR | DR |
9 | XA | DSA |
10 | RF | 数字胃肠 |
11 | BL | 病理 |
12 | NM | ECT |
13 | PT | PETCT |
14 | MG | 乳腺钼靶 |
表1检查类型序号及说明
表2检查部位序号及说明
这样一个医学影像文件可以由具有两个属性信息的key值来表征。例如,一个头部的CT检查的影像文件,用检查类型序号-检查部位序号表示的结果为:4-1。
由此每一影像文件可以得到一个类似的key值,将该医学影像文件的存储地址作为数值value,每一key值对应一个value值。
显见的,根据目前使用检查类型和检查部位属性信息来生成key值,对于某些图像,它们的key值会相同。对于这种key值相同的图像,则认为这是同一类影像,把它们合并存储在一起。例如,可以将他们放置在同一个文件夹下,value值指向这个文件夹。或者也可以分别放置,然后value值指向文件的具体地址。不同的影像文件可能有相同的key值,但是可能有相同或者不同的value值。
步骤S202,对第一属性构建第一维二叉搜索树,其中第一属性值的中值作为根节点,其他值作为子节点。
在步骤S202中,将检查类型作为第一属性。可以对其构建第一维二叉树。假设根节点名称为n7,其中7代表检查类型序号,则序号小于7的节点均在根节点的左侧,序号大于7的节点均在根节点的右侧,假设随机取出小于7的节点是n3,随机取出大于7的节点是n11,则n7的对应左子树的指针F-first-node、和对应右子树的指针F-second-node分别指向n3和n11,依此类推,递归构建二叉搜索树。由于向树中添加子节点时是随机选取的节点,图3为给出的一种假设的构建出的二叉搜索树结构图。需要注意的是,二叉树有很多种构建方法以及类型。在本例中,构建的是二叉搜索树,在其他例子中,也可以构建平衡二叉树,本申请对构建的二叉树种类不做限定。但是使用二叉搜索树,可以有效的提高搜索效率。
步骤S203,随机抽取代表医学影像文件的key值,根据key值中的属性信息,构建含有二个属性信息的二维类二叉树。
参见图4,为一种假设的构建出的二维类二叉搜索树结构图。在xy平面上的节点n1-n14表示步骤S202中得到的第一维二叉树,在xz平面上的节点s1-s10表示步骤S203生成的在n1节点下面的第二维二叉树。节点n1指向节点s5的线即为指针S-node。为了简单起见,图4只示出了n1节点下面的第二维二叉树,n2-n14的每个节点下面都有类似的第二维二叉树。此外,需要注意的是不同的第一维节点下的第二维二叉树的节点顺序可以相同,也可以不同。本申请对此不做限定。
如图5所示,为本申请一实施例示出的构建二维类二叉树流程图。随机选取抽象后的代表影像文件的key值,比如1-3,即检查类型为其他、检查部位为颈部,对应图5,A1为1,A2为3,然后遍历步骤S202构建的第一维二叉树节点Node1。当节点序号Node1,此时为n1,与影像文件节点中的检查类型值A1,此时为1,一致时,查找所述第一维二叉树节点n1是否存在第二维的子节点,即n1的下一维二叉树的指针S-node是否有值。
如果指针S-node为空,则表示不存在第二维子节点,则设置所述第一维二叉树节点n1的指针S-node指向该key值的第二属性值A2,此时为3,将s3作为节点n1的第二维二叉树的根节点,同时将所述key值1-3对应的医学影像文件的存储位置记录在节点s3下。
如果指针S-node不为空,则表示节点n1存在第二维二叉树,其根节点为Srnode,例如,可以如图4所示,节点n1的指针S-node指向节点s5,也即Srnode等于s5。则继续使用第二属性值A2,此时为3,向下遍历第二维二叉树,判断作为第二维二叉树节点值与key值的部位序号3是否相同。如果遍历失败,则根据二叉搜索树的插入规则,将3插入到相应的子树中,生成新的子节点s3,并将所述key值1-3对应的医学影像文件的存储位置记录在节点s3下。如果当前的第二维二叉树含有节点s3,则直接将所述key值1-3对应的医学影像存储位置记录在节点s3下即可。需要注意的是,节点s3下可能会有多个存储位置记录,这些记录都对应着检查类型为其他,检查部位为颈部的图像。
为了后续检索方便,在构建第二维二叉树时,也可以尽量将其构建成二叉搜索树。比如在第二维二叉树已经构建好后,调整各个节点的指针,使其满足二叉搜索树的要求。
由此,可以为每个医学影像文件生成对应所有属性信息的二维类二叉树。然后将该二维类二叉树存储于存储系统中。
步骤S204,当用户进行检索时,根据用户输入的关键词检索所述二维类二叉树,当检索到与所述关键词匹配的目标节点时,确定与所述目标节点表征的属性信息相关联的医学影像文件的存储位置,从存储位置取出医学影像文件返回给用户。
对于本例中所述的二维类二叉树,用户可以检索的关键词只包括检查类型和检查部位。例如,当用户输入的关键值为超声、躯干时,首先按照表1和表2,得到超声对应的检查类型序号为6,躯干对应的检查部位序号为8。然后按照图4所示的二维类二叉树结构图,首先比较6和n7,由于6小于7,则检查节点n7的左子树,遍历到节点n3,由于6大于3,则继续检查节点n3的右子树,如此一直检索到节点n6,6等于6,当检索到相同的类型节点后,不再继续检索节点的左子树和右子树,而是从该节点,也即n6的指针S-node继续检索第二维度的节点。可以使用同样的方法,即属性序号大于节点值时搜索右子树,属性序号小于节点值时搜索左子树,在第二维节点中继续检索检查部位序号8。当检索到与所述关键词匹配的目标节点时,确定与所述目标节点表征的属性信息相关联的医学影像文件的存储位置,从存储位置取出医学影像文件返回给用户。
当用户只输入一个属性时,例如,只输入某一检查部位,则对二维类二叉树的第一维的每个节点,检查其S-node指针是否有值。如果S-node不为空,则从S-node指向的节点,对第二维度的二叉树继续进行检索,当检索到与检查部位相同的节点时,确定与所述目标节点表征的属性信息相关联的医学影像文件的存储位置,从存储位置中取出相对应的影像文件返回给用户。
由二叉搜索树的检索效率可知,当检索条件为两个属性时,O(log2N1)+O(log2N2),当检索条件为一个属性时,O(N1)+O(log2N2),其中N1、N2分别是每个属性下节点的个数,O(N)表示检索的时间复杂度。由此可知,使用类二叉树结构,可以有效的减少检索所需的时间。
如图6所示,为根据本申请再一个实施例所述医学影像文件处理的流程示意图。在本例中,抽取医学影像文件中的三个属性。
步骤S301,抽取符合DICOM标准的医学影像文件的三个属性信息,将所述属性信息与所述医学影像文件的存储位置相关联。
在本例中,使用检查类型、患者年龄和检查部位作为关键值的属性信息进行抽取。检查类型、检查部位的序号对应如表1和表2所示。
这样一个医学影像文件可以由具有三个属性的key值来表征。例如,一个头部的CT检查,患者年龄51岁,用检查类型序号-年龄-检查部位序号表示的结果为:4-51-1。
由此每一影像文件可以得到一个类似的key值,将该医学影像的存储地址作为数值value,每一key值对应一个value值。
步骤S302,将第一属性构建第一维二叉搜索树,其中第一属性值的中值作为根节点,其他值作为子节点。
步骤S302的具体方法可以和S202相同,在此不再赘述。
步骤S303,随机抽取代表医学影像文件的key值,根据key值中属性信息,构建含有三个属性信息的三维类二叉树。
随机选取抽象后的代表影像文件的key值,比如4-51-1,遍历步骤S302构建的第一维二叉树节点。当第一维二叉树节点序号n4与key值中的检查类型序号4一致时,查找该节点n4是否存在第二维子节点,即n4的指针S-node是否为空,如果不存在第二维子节点,则设置该节点n4的指针S-node指向该key值的第二属性值51,作为节点n4的第二维二叉树的根节点s51,同时该key值的第三属性值1作为节点s51的第三维二叉树的根节点t1,并把s51的指针S-node指向t1。由于本例中只有三个维度,所以还需要将所述关键值4-51-1对应的医学影像文件的存储位置记录在第三维节点t1下。
如果节点n4存在第二维子节点,则继续向下遍历第二维二叉树,判断作为第二维二叉树节点值与key值中的年龄51是否相同。若遍历失败,则根据二叉树的插入规则,将51插入到第二维二叉树相应的子树中。为了后续检索方便,在构建第二维二叉树时,也可以尽量将其构建成二叉搜索树。对于节点n4的第二维二叉树新的节点s51,同时该key值的第三属性值1作为节点s51的第三维二叉树的根节点t1,并把s51的指针S-node指向t1。同样,由于本例中只有三个维度,所以还需要将所述关键值4-51-1对应的医学影像文件的存储位置记录在第三维节点t1下。
如果当前第二维二叉树已包含节点s51,也即对第二维二叉树遍历成功,则对节点s51继续上述操作,也就是查找节点s51是否有存在下一维子节点t1,然后进行第三维二叉树的生成或遍历。所方法和构成n4的第二维二叉树的方法相同。在此不再赘述。
由此,可以为每个医学影像文件生成对应所有属性信息的三维类二叉树,并将所有所述医学影像文件的所述存储位置按照关键值分别添加在所述多维类二叉树对应的节点下。将该三维类二叉树存储于存储系统中。
步骤S304,当用户进行检索时,根据用户输入的关键词检索所述三维类二叉树,当检索到与所述关键词匹配的目标节点时,确定与所述目标节点表征的属性信息相关联的医学影像文件的存储位置,从存储位置取出医学影像文件返回给用户。
对于本例中所述的三维类二叉树,用户可以检索的关键词包括检查类型、患者年龄和检查部位。例如,当用户输入的关键值为超声、40岁、躯干时,首先按照表1和表2,得到超声对应的检查类型的序号为6,躯干对应的检查部位序号为8。根据检查类型的序号6遍历第一维二叉树,当匹配到第一维二叉树的节点n6后,再按照年龄序号40遍历所述n6下面的第二维二叉树。在匹配到第二维二叉树的节点s40后,再按照检查部位序号8遍历所述s40下面的第三维二叉树。找到对应的节点t8。之后,根据n6-s40-t8这个节点下面存储的医学影像文件存储位置,将医学影像文件返回给客户。
当用户只输入一个属性时,例如,只输入患者年龄时,则对三维类二叉树的第一维的每个节点,搜索其对应的第二维二叉树,当在第二维二叉树检索到与患者年龄相同的节点时,得到该节点下面所有的第三维度节点的存储的影像文件的地址,取出相对应的影像文件返回给用户。也就是说,当只输入一个维度的属性时,只匹配该维度的节点,而将该维度对应的其他维度的所有节点下信息返回给用户。
同样的,由于使用了类二叉树结构,可以有效的减少检索所需的时间。
由上述例子,可以很容易地推导出更高维度的类二叉树的构成和信息检索。在此不再赘述。此外,本申请所述二维类二叉树、三维类二叉树的属性并不限于所述检查类型、患者年龄和检查部位,比如可以将患者性别作为某一属性。这些属性的顺序也不必须为上述实施例中所举的顺序,比如可以将检查部位作为第一属性构成第一维二叉树。本申请对此不做限定。
更进一步,在对应当前的医学影像文件的多维二叉树已经建好的情况下,每天都可能生成新的医学影像文件。为此,可以设定某个周期,比如每天、每周、或者每月,将新的医学影像文件加入到当前的多维类二叉树里面去。加入方法按照上述二叉树插入规则即可实现。
在某些例子中,有可能某些属性会增加表项,比如医院新增了一台以前未使用的成像设备,由此需要在检查类型中增加表项。同样,只要按照上述二叉树插入规则维护该新设备的影像文件即可。
与前述医学影像文件处理方法的实施例相对应,本申请还提供了医学影像文件处理装置的实施例。
本申请医学影像文件处理装置的实施例可以应用在医学影像文件处理上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在医学影像文件处理的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图7所示,为本申请医学影像文件处理装置的一种硬件结构图,除了图7所示的处理器71、内存73、内部总线74、接口75、以及非易失性存储器72之外,实施例中装置通常根据该医学影像文件处理的实际功能,还可以包括其他硬件,对此不再赘述。
进一步地,非易失性存储器74上存储有医学影像文件处理的控制逻辑。参见图8,为本申请实施例提供的一种医学影像文件处理的控制逻辑的功能模块示意图。从功能上划分,所述控制逻辑包括抽取模块81、关联模块82、构建模块83和检索模块84。
抽取模块81,用于对符合DICOM标准的医学影像文件,抽取所述医学影像文件的属性信息,所述属性信息包括属性和属性值。
关联模块82,用于将所述属性信息与所述医学影像文件的存储位置相关联。
构建模块83,用于根据各医学影像文件的属性信息,构建多维类二叉树,其中,所述多维类二叉树中每一维二叉树对应一个不同的属性,每一维二叉树的节点由所述属性对应的属性值生成。
检索模块84,用于根据用户输入的关键词搜索所述多维类二叉树,当在所述多维类二叉树中检索到与所述关键词匹配的目标节点时,确定与所述目标节点表征的属性信息相关联的医学影像文件的存储位置,从所述存储位置取出所述医学影像文件返回给用户。
DICOM文件的数据元素是以属性和对应的属性值形式来存储的。其中,属性可以包括成像时间、检查日期、检查部位、成像仪器、病人姓名、病人id、病人年龄等。通过解析DICOM文件可以提取属性信息。所述抽取模块81可以为解析器,根据所述医学影像文件的属性抽取属性值,再将所述属性及所述属性值按预定的格式组合成所述属性信息。
更进一步的,所述构建模块83还包括:
第一构建子模块,用于根据所述属性信息中包括的N个属性中的第一属性,构建第一维二叉树,其中N为大于或等于2的正整数;
第二构建子模块,用于根据所述N个属性中的第二属性,为所述第一维二叉树的每个节点,构建第二维二叉树;
依次类推,直到第N构建子模块,用于根据所述N个属性中的最后一个属性,为第N-1维二叉树的每个节点,构建第N维二叉树,并且在第N维二叉树的节点下存储所述医学影像文件的所述存储位置。
更进一步的,在第i构建子模块构建第i维二叉树时,其中i为大于等于1并小于等于N的整数,所述第i构建子包括:
调整所述第i维二叉树中每个节点的指针,使得所述第i维二叉树形成二叉搜索树。
由上述例子可以看出,由于二叉树本身在检索时效率较高,因此本申请所述装置使用了多维类二叉树的存储结构,从而在用户检索时,可以快速响应检索的请求。此外,由于本申请所述装置可以把属性信息通过抽取模块81自动从影像文件中提取出来,无需手工添加标签,从而极大得提高了影像文件的归档效率。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本说明书中描述的主题及功能操作的实施例可以在以下中实现:数字电子电路、有形体现的计算机软件或固件、包括本说明书中申请的结构及其结构性等同物的计算机硬件、或者它们中的一个或多个的组合。本说明书中描述的主题的实施例可以实现为一个或多个计算机程序,即编码在有形非暂时性程序载体上以被数据处理装置执行或控制数据处理装置的操作的计算机程序指令中的一个或多个模块。可替代地或附加地,程序指令可以被编码在人工生成的传播信号上,例如机器生成的电、光或电磁信号,该信号被生成以将信息编码并传输到合适的接收机装置以由数据处理装置执行。计算机存储介质可以是机器可读存储设备、机器可读存储基板、随机或串行存取存储器设备、或它们中的一个或多个的组合。
本说明书中描述的处理及逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程计算机执行,以通过根据输入数据进行操作并生成输出来执行相应的功能。所述处理及逻辑流程还可以由专用逻辑电路—例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)来执行,并且装置也可以实现为专用逻辑电路。
适合用于执行计算机程序的计算机包括,例如通用和/或专用微处理器,或任何其他类型的中央处理单元。通常,中央处理单元将从只读存储器和/或随机存取存储器接收指令和数据。计算机的基本组件包括用于实施或执行指令的中央处理单元以及用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备,例如磁盘、磁光盘或光盘等,或者计算机将可操作地与此大容量存储设备耦接以从其接收数据或向其传送数据,抑或两种情况兼而有之。然而,计算机不是必须具有这样的设备。此外,计算机可以嵌入在另一设备中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏操纵台、全球定位系统(GPS)接收机、或例如通用串行总线(USB)闪存驱动器的便携式存储设备,仅举几例。
适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、媒介和存储器设备,例如包括半导体存储器设备(例如EPROM、EEPROM和闪存设备)、磁盘(例如内部硬盘或可移动盘)、磁光盘以及CD ROM和DVD-ROM盘。处理器和存储器可由专用逻辑电路补充或并入专用逻辑电路中。
虽然本说明书包含许多具体实施细节,但是这些不应被解释为限制任何发明的范围或所要求保护的范围,而是主要用于描述特定发明的具体实施例的特征。本说明书内在多个实施例中描述的某些特征也可以在单个实施例中被组合实施。另一方面,在单个实施例中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合来实施。此外,虽然特征可以如上所述在某些组合中起作用并且甚至最初如此要求保护,但是来自所要求保护的组合中的一个或多个特征在一些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序执行或顺次执行、或者要求所有例示的操作被执行,以实现期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述实施例中的各种系统模块和组件的分离不应被理解为在所有实施例中均需要这样的分离,并且应当理解,所描述的程序组件和系统通常可以一起集成在单个软件产品中,或者封装成多个软件产品。
由此,主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下,权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外,附图中描绘的处理并非必需所示的特定顺序或顺次顺序,以实现期望的结果。在某些实现中,多任务和并行处理可能是有利的。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (10)
1.一种医学影像文件的处理方法,其特征在于,所述方法包括:
对符合医学数字成像及通信DICOM标准的医学影像文件,抽取所述医学影像文件的属性信息,所述属性信息包括属性和属性值;
将所述属性信息与所述医学影像文件的存储位置相关联;
根据各医学影像文件的属性信息,构建多维类二叉树,其中,所述多维类二叉树中每一维二叉树对应一个不同的属性,每一维二叉树的节点由所述属性对应的属性值生成;
根据用户输入的关键词搜索所述多维类二叉树,当在所述多维类二叉树中检索到与所述关键词匹配的目标节点时,确定与所述目标节点表征的属性信息相关联的医学影像文件的存储位置,从所述存储位置取出所述医学影像文件返回给用户。
2.根据权利要求1所述的方法,其特征在于,构建所述多维类二叉树,包括:
根据所述属性信息中包括的N个属性中的第一属性,构建第一维二叉树,其中N为大于或等于2的正整数;
根据所述N个属性中的第二属性,为所述第一维二叉树的每个节点,构建第二维二叉树;
依次类推,直到根据所述N个属性中的最后一个属性,为第N-1维二叉树的每个节点,构建第N维二叉树,并且在第N维二叉树的节点下存储所述医学影像文件的所述存储位置。
3.根据权利要求1所述的方法,其特征在于,抽取所述医学影像文件的属性信息,包括:
利用DICOM解析器,抽取所述医学影像文件的属性和属性值;
将所述属性和所述属性值按预定的格式组合成所述属性信息。
4.根据权利要求2所述的方法,其特征在于,在根据第i个属性构建第i维二叉树时,其中i为大于等于1并小于等于N的整数,包括:
预先设置所述第i个属性的中值,并
将所述中值作为所述第i维二叉树的根节点。
5.根据权利要求2所述的方法,其特征在于,在构建所述第i维二叉树时,还包括:
调整所述第i维二叉树中每个节点的指针,使得所述第i维二叉树形成二叉搜索树。
6.根据权利要求2所述的方法,其特征在于,所述根据用户输入的所述关键词搜索所述多维类二叉树,具体包括:
根据所述关键词中对应所述第一属性的属性值遍历所述第一维二叉树,以确定所述第一维二叉树中与所述关键词匹配的子节点作为第一节点;
根据所述关键词中对应所述第二属性的属性值遍历所述第一节点下的所述第二维二叉树,以确定所述第二维二叉树中与所述关键词匹配的子节点作为第二节点;
依次类推,直到根据所述关键词中对应所述第N属性的属性值遍历第N-1节点下的所述第N维二叉树,以确定所述第N维二叉树中与所述关键词匹配的子节点作为所述目标节点。
7.一种医学影像文件处理的装置,其特征在于,所述装置包括:
抽取模块,用于对符合医学数字成像及通信DICOM标准的医学影像文件,抽取所述医学影像文件的属性信息,所述属性信息包括属性和属性值;
关联模块,用于将所述属性信息与所述医学影像文件的存储位置相关联;
构建模块,用于根据各医学影像文件的属性信息,构建多维类二叉树,其中,所述多维类二叉树中每一维二叉树对应一个不同的属性,每一维二叉树的节点由所述属性对应的属性值生成;
检索模块,用于根据用户输入的关键词搜索所述多维类二叉树,当在所述多维类二叉树中检索到与所述关键词匹配的目标节点时,确定与所述目标节点表征的属性信息相关联的医学影像文件的存储位置,从所述存储位置取出所述医学影像文件返回给用户。
8.根据权利要求7所述的装置,其特征在于,所述构建模块包括:
第一构建子模块,用于根据所述属性信息中包括的N个属性中的第一属性,构建第一维二叉树,其中N为大于或等于2的正整数;
第二构建子模块,用于根据所述N个属性中的第二属性,为所述第一维二叉树的每个节点,构建第二维二叉树;
依次类推,直到第N构建子模块,用于根据所述N个属性中的最后一个属性,为第N-1维二叉树的每个节点,构建第N维二叉树,并且在第N维二叉树的节点下存储所述医学影像文件的所述存储位置。
9.根据权利要求7所述的装置,其特征在于,所述抽取模块为DICOM解析器,
用于根据所述医学影像文件的属性抽取属性值;
将所述属性和所述属性值按预定的格式组合成所述属性信息。
10.根据8所述的装置,其特征在于,在第i构建子模块构建第i维二叉树时,其中i为大于等于1并小于等于N的整数,所述第i构建子还包括:
调整所述第i维二叉树中每个节点的指针,使得所述第i维二叉树形成二叉搜索树。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910013427.8A CN109830285B (zh) | 2019-01-07 | 2019-01-07 | 一种医学影像文件处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910013427.8A CN109830285B (zh) | 2019-01-07 | 2019-01-07 | 一种医学影像文件处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109830285A true CN109830285A (zh) | 2019-05-31 |
CN109830285B CN109830285B (zh) | 2022-12-27 |
Family
ID=66860783
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910013427.8A Active CN109830285B (zh) | 2019-01-07 | 2019-01-07 | 一种医学影像文件处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109830285B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197708A (zh) * | 2019-06-05 | 2019-09-03 | 重庆邮电大学 | 一种面向电子医疗病历的区块链迁移与存储方法 |
WO2022052586A1 (zh) * | 2020-09-11 | 2022-03-17 | 苏州浪潮智能科技有限公司 | 一种分布式存储系统中对象元数据检索列举方法及装置 |
CN115392160A (zh) * | 2022-06-10 | 2022-11-25 | 无锡芯光互连技术研究院有限公司 | 一种电路图描述文件的格式转换方法 |
CN116434919A (zh) * | 2023-04-27 | 2023-07-14 | 富士胶片(中国)投资有限公司 | 采集医学影像的方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102651055A (zh) * | 2012-04-11 | 2012-08-29 | 华中科技大学 | 一种基于医学影像的文件生成方法及系统 |
US20130272596A1 (en) * | 2012-04-16 | 2013-10-17 | General Electric Company | Methods for generating a reconstructed tree structure from medical image data |
CN103377237A (zh) * | 2012-04-27 | 2013-10-30 | 常州市图佳网络科技有限公司 | 高维数据的近邻搜索方法以及快速近似图像搜索方法 |
CN103778346A (zh) * | 2014-02-18 | 2014-05-07 | 中国科学院上海技术物理研究所 | 医疗信息处理方法和装置 |
CN104112007A (zh) * | 2014-07-16 | 2014-10-22 | 深圳大学 | 一种影像层次分割结果的数据存储、组织及检索方法 |
CN105184307A (zh) * | 2015-07-27 | 2015-12-23 | 蚌埠医学院 | 一种医学领域图像语义相似度矩阵的生成方法 |
-
2019
- 2019-01-07 CN CN201910013427.8A patent/CN109830285B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102651055A (zh) * | 2012-04-11 | 2012-08-29 | 华中科技大学 | 一种基于医学影像的文件生成方法及系统 |
US20130272596A1 (en) * | 2012-04-16 | 2013-10-17 | General Electric Company | Methods for generating a reconstructed tree structure from medical image data |
CN103377237A (zh) * | 2012-04-27 | 2013-10-30 | 常州市图佳网络科技有限公司 | 高维数据的近邻搜索方法以及快速近似图像搜索方法 |
CN103778346A (zh) * | 2014-02-18 | 2014-05-07 | 中国科学院上海技术物理研究所 | 医疗信息处理方法和装置 |
CN104112007A (zh) * | 2014-07-16 | 2014-10-22 | 深圳大学 | 一种影像层次分割结果的数据存储、组织及检索方法 |
CN105184307A (zh) * | 2015-07-27 | 2015-12-23 | 蚌埠医学院 | 一种医学领域图像语义相似度矩阵的生成方法 |
Non-Patent Citations (1)
Title |
---|
李妍: "活动轮廓模型影像分割方法综述", 《遥感信息》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197708A (zh) * | 2019-06-05 | 2019-09-03 | 重庆邮电大学 | 一种面向电子医疗病历的区块链迁移与存储方法 |
CN110197708B (zh) * | 2019-06-05 | 2023-01-24 | 重庆邮电大学 | 一种面向电子医疗病历的区块链迁移与存储方法 |
WO2022052586A1 (zh) * | 2020-09-11 | 2022-03-17 | 苏州浪潮智能科技有限公司 | 一种分布式存储系统中对象元数据检索列举方法及装置 |
CN115392160A (zh) * | 2022-06-10 | 2022-11-25 | 无锡芯光互连技术研究院有限公司 | 一种电路图描述文件的格式转换方法 |
CN115392160B (zh) * | 2022-06-10 | 2024-04-09 | 无锡芯光互连技术研究院有限公司 | 一种电路图描述文件的格式转换方法 |
CN116434919A (zh) * | 2023-04-27 | 2023-07-14 | 富士胶片(中国)投资有限公司 | 采集医学影像的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109830285B (zh) | 2022-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109830285A (zh) | 一种医学影像文件处理方法和装置 | |
US9069808B2 (en) | Indexing provenance data and evaluating provenance data queries in data processing systems | |
CN105027115B (zh) | 对文档的查询和索引 | |
US8819012B2 (en) | Accessing anchors in voice site content | |
US10698916B1 (en) | Data preparation context navigation | |
US8452808B2 (en) | Automatic generation of virtual database schemas | |
CN112256721B (zh) | Sql语句解析方法、系统、计算机设备和存储介质 | |
CN104160398B (zh) | 用于大对象数据内的结构化内容的方法及其系统 | |
US20110099174A1 (en) | Data Recovery System and Method In A Resource Description Framework Environment | |
CA2853627C (en) | Automatic creation of clinical study reports | |
CN105094924B (zh) | 镜像文件的导入方法及装置 | |
WO2019095551A1 (zh) | 区域医疗电子病历共享整合查询系统及方法 | |
CN107851108A (zh) | 使用位向量搜索索引的匹配文档 | |
CN106709055A (zh) | 一种图片试题的处理方法及装置 | |
US20120124060A1 (en) | Method and system of identifying adjacency data, method and system of generating a dataset for mapping adjacency data, and an adjacency data set | |
CN116737879A (zh) | 知识库查询方法、装置、电子设备及存储介质 | |
CN101908174A (zh) | 处理图纸文件中零部件对象信息的方法、装置及eap系统 | |
EP3859554A1 (en) | Method and apparatus for indexing multi-dimensional records based upon similarity of the records | |
CN107818144A (zh) | 一种基于Solr对多数据源数据进行整合的方法 | |
US11822530B2 (en) | Augmentation to the succinct trie for multi-segment keys | |
CN114741489A (zh) | 文档检索方法、装置、存储介质以及电子设备 | |
JP4963341B2 (ja) | 文書間関係可視化方法、可視化装置、可視化プログラム及びそのプログラムを記録した記録媒体 | |
CN102682073B (zh) | 用于搜索引擎检索的原子(atom)的选择 | |
CN107820612A (zh) | 位向量搜索索引 | |
US20220374399A1 (en) | Method and apparatus for smart and extensible schema matching framework |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |