CN112800264A - 标注数据的压缩方法、电子装置和存储介质 - Google Patents

标注数据的压缩方法、电子装置和存储介质 Download PDF

Info

Publication number
CN112800264A
CN112800264A CN202011622385.7A CN202011622385A CN112800264A CN 112800264 A CN112800264 A CN 112800264A CN 202011622385 A CN202011622385 A CN 202011622385A CN 112800264 A CN112800264 A CN 112800264A
Authority
CN
China
Prior art keywords
value
data
label
dimension value
annotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011622385.7A
Other languages
English (en)
Inventor
魏雪娇
姜久文
王道明
刘三元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Zhongke Medical Technology Industrial Technology Research Institute Co Ltd
Original Assignee
Shanghai United Imaging Intelligent Healthcare Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai United Imaging Intelligent Healthcare Co Ltd filed Critical Shanghai United Imaging Intelligent Healthcare Co Ltd
Priority to CN202011622385.7A priority Critical patent/CN112800264A/zh
Publication of CN112800264A publication Critical patent/CN112800264A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本申请涉及一种标注数据的压缩方法、电子装置和存储介质,其中,该标注数据的压缩方法包括:获取原始图像的标注数据,其中,标注数据包括:标注标签的像素位置和标注标签值,标注标签的像素位置包括第一维度值和第二维度值;以标注标签值和第一维度值为索引,对标注数据进行编码,得到多级编码字典,其中,第二维度值包括一个或者多个连续区间,第二维度值的编码值由每个连续区间的起始值和终止值表示。通过本申请,解决了现有技术标注数据的压缩及传输处理的效率低的问题,提高了标注数据的压缩及传输处理的效率。

Description

标注数据的压缩方法、电子装置和存储介质
技术领域
本申请涉及图像处理领域,特别是涉及标注数据的压缩方法、电子装置和存储介质。
背景技术
在常用的医学图像标注数据处理过程中,现有的医学图像标注数据传输的形式主要有以下两种:(1)直接将原始的三维体数据进行传输;(2)利用编码算法将标注数据压缩后进行传输。而这两种方法都存在以下的不足之处:
第一种传输方法由于标注数据量大,会消耗较大的存储空间和较多的传输时间,导致传输效率低。
第二种传输方法常利用有损编码和无损编码两种编码方法。为了使原始的标注数据和通过编解码后的数据保持一致,通常采用无损编码方法。然而,常用的无损编码方法的编码过程均需经过统计,生成编码两个操作,编码速度相对较慢,并且当原始标注数据局部发生变化时,需将全部数据重新再编码,导致操作效率低。
发明内容
在本实施例中提供了一种标注数据的压缩方法、电子装置和存储介质,以解决现有技术的标注数据的压缩及传输处理的效率低的问题。
第一个方面,在本实施例中提供了一种标注数据的压缩方法,包括:获取原始图像的标注数据,其中,所述标注数据包括:标注标签的像素位置和标注标签值,所述标注标签的像素位置包括第一维度值和第二维度值;以所述标注标签值和所述第一维度值为索引,对所述标注数据进行编码,得到多级编码字典,其中,所述第二维度值包括一个或者多个连续区间,所述第二维度值的编码值由每个连续区间的起始值和终止值表示。
在其中的一些实施例中,所述标注标签的像素位置包括:像素位置的行号和列号;其中,在所述第一维度值为像素位置的行号的情况下,所述第二维度值为像素位置的列号;在所述第一维度值为像素位置的列号的情况下,所述第二维度值为像素位置的行号。
在其中的一些实施例中,以所述标注标签值和所述第一维度值为索引,对所述标注数据进行编码,得到多级编码字典包括:将所述标注标签值作为第一级索引,将所述第一维度值作为第二级索引,生成所述多级编码字典,其中,所述第二级索引的编码值包括所述第二维度值的每个连续区间的起始值和终止值。
在其中的一些实施例中,所述原始图像为三维图像,所述标注标签的像素位置还包括第三维度值;以所述标注标签值和所述第一维度值为索引,对所述标注数据进行编码,得到多级编码字典还包括:以所述标注标签值、所述第三维度值和所述第一维度值为索引,对所述标注数据进行编码,得到所述多级编码字典。
在其中的一些实施例中,以所述标注标签值、所述第三维度值和所述第一维度值为索引,对所述标注数据进行编码,得到所述多级编码字典包括:将所述标注标签值作为第一级索引,将所述第三维度值作为第二级索引,将所述第一维度值作为第三级索引,生成所述多级编码字典,其中,所述第三级索引的编码值包括所述第二维度值的每个连续区间的起始值和终止值。
在其中的一些实施例中,所述方法还包括:在所述标注标签的像素位置被局部更新后,根据被局部更新后得到的新的像素位置生成所述标注标签的新的编码数据;在所述多级编码字典中查询与所述标注标签对应的编码数据,并根据所述新的编码数据更新查询到的编码数据,得到新的多级编码字典。
在其中的一些实施例中,所述方法还包括:生成与所述原始图像的分辨率相同的初始标注结果;确定待渲染的标注数据;在所述多级编码字典中查询以所述待渲染的标注数据的标注标签值为索引的目标像素位置;将所述初始标注结果中所述目标像素位置的像素值替换为预设像素值,得到所述待渲染的标注数据的标注结果,其中,所述预设像素值基于所述标注标签值确定。
在其中的一些实施例中,所述待渲染的标注数据包括具有一个标注标签值的标注数据,或者标注为不同标注标签值的多个标注数据。
第二个方面,在本实施例中提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行第一方面所述的标注数据的压缩方法。
第三个方面,在本实施例中提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行第一方面所述的标注数据的压缩方法。
与相关技术相比,在本实施例中提供的标注数据的压缩方法、电子装置和存储介质,通过以标签值和标注标签像素位置的第一维度值作为索引,将标注数据编码为多级编码字典,并且采用标注标签像素位置的第二维度值的起始值和终止值来表示整个连续区间的第二维度值,实现了图像的压缩编码;并且相对于相关技术中采用的无损编码方案而言,多级编码字典的压缩率不受字符出现概率的影响,因而在编码前无需进行字符统计,提高了压缩编码效率。此外,多级编码字典中将标注数据按照标签值、标注像素位置分层级进行存储,因而能够实现标注数据以标注标签为单位进行传输、局部修改或者局部渲染。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例的CT系统的结构示意图;
图2是本申请实施例的电子装置的硬件结构示意图;
图3是本申请实施例的标注数据的压缩方法的流程图一;
图4是本申请实施例的标注数据的压缩方法的流程图二;
图5是本申请实施例优选实施例的局部修改方法的流程图。
具体实施方式
为更清楚地理解本申请的目的、技术方案和优点,下面结合附图和实施例,对本申请进行了描述和说明。
除另作定义外,本申请所涉及的技术术语或者科学术语应具有本申请所属技术领域具备一般技能的人所理解的一般含义。在本申请中的“一”、“一个”、“一种”、“该”、“这些”等类似的词并不表示数量上的限制,它们可以是单数或者复数。在本申请中所涉及的术语“包括”、“包含”、“具有”及其任何变体,其目的是涵盖不排他的包含;例如,包含一系列步骤或模块(单元)的过程、方法和系统、产品或设备并未限定于列出的步骤或模块(单元),而可包括未列出的步骤或模块(单元),或者可包括这些过程、方法、产品或设备固有的其他步骤或模块(单元)。在本申请中所涉及的“连接”、“相连”、“耦接”等类似的词语并不限定于物理的或机械连接,而可以包括电气连接,无论是直接连接还是间接连接。在本申请中所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。通常情况下,字符“/”表示前后关联的对象是一种“或”的关系。在本申请中所涉及的术语“第一”、“第二”、“第三”等,只是对相似对象进行区分,并不代表针对对象的特定排序。
本申请所涉及的标注数据的压缩方法、电子装置或者计算机可读存储介质可用于对任意模态的医学影像的标注数据的处理。本申请实施例提供的电子装置可以应用于医学影像处理系统中,在该医学影像处理系统可以包括医学图像扫描设备和电子装置。
其中,医学图像扫描设备可以是磁共振系统(MR系统)、正电子发射计算机断层显像系统(PET系统)、正电子发射计算机断层显像-磁共振多模态混合系统(PET-MR系统)、电子计算机断层扫描系统(CT系统)、X射线扫描系统等任意一种或者多种医学图像扫描系统。
下面以医学图像扫描设备为CT系统为例对本申请实施例进行描述和说明。
在本实施例中,CT系统包括检查床110和扫描部件120。其中,检查床110适于承载待检查者。检查床110能够移动,使得待检查者的待检查部位被移动到适合被检测的位置,例如图1中标示为200的位置。扫描部件120具有射线源121和探测器122。
射线源121可以被配置为对待检查者的待检查部位发出射线,用以产生医学图像的扫描数据。待检查者的待检查部位可包括物质、组织、器官、样本、身体,或类似物,或者其他任意组合。在某些实施例中,待检查者的待检查部位可以包括患者或者其一部分,即可以包括头、胸、肺、胸膜、纵膈、腹、大肠、小肠、膀胱、胆囊、三焦、盆腔、骨干、末端、骨架、血管,或类似物,或其任意组合。射线源121被配置为用于产生射线或其他类型的射线。射线能够穿过待检查者的待检查部位。穿过待检查者的待检查部位后被探测器122接收。
射线源121可包括射线发生器。射线发生器可包括一个或多个射线管。射线管可以发射射线或射线束。射线源121可以是X射线球管、冷阴极离子管、高真空热阴极管、旋转阳极管等。发射的射线束的形状可以是线形、窄笔形、窄扇形、扇形、锥形、楔形、或类似物,或不规则形状,或其任何组合。射线束的扇形角度可以是20°至90°范围内的一定值。射线源121中的射线管可以固定在一个位置。在某些情况下,可以平移或旋转射线管。
探测器122可配置为接收来自射线源121或其他辐射源的射线。来自射线源121的射线可以穿过待检查者,然后到达探测器122。接收射线之后,探测器122产生蕴含待检查者的射线图像的探测结果。探测器122包括射线检测器或者其他部件。射线检测器的形状可以是扁平、弓形、圆形、或类似物,或其任意组合。弓形检测器的扇形角度范围可以是20°至90°。扇形角度可固定或者根据不同的情况可调。不同的情况包括期望的图像分辨率、图像大小、检测器的灵敏度、检测器的稳定性、或类似物,或其任意组合。在一些实施例中,检测器的像素可以是最小检测单元的数量,例如检测器单元的数量(例如,闪烁体或光电传感器等)。检测器的像素可以布置成单行、双行或另一数目的行。射线检测器是一维、二维、或者三维的。
CT系统还包括扫描控制装置和图像生成装置。其中,扫描控制装置被配置为控制检查床110和扫描部件120进行扫描。图像生成装置用于根据探测器122的探测结果生成医学影像。
由于扫描部件120在进行扫描时往往会发出射线,因此在一些实施例中,为了避免CT系统的操作者暴露在这些辐射下,可以将图像生成装置设置在与扫描部件120不同的房间内,使得CT系统的操作者可以处在另外的房间内,避免受到射线照射,并能够通过图像生成装置生成以及观察扫描结果。
本实施例的电子装置包括处理器211、存储有计算机程序指令的存储器212和显示设备214。
上述处理器211可以包括中央处理器(CPU),或者特定集成电路(ApplicationSpecific Integrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
在其中一些实施例中,处理器211可以被配置为:获取原始图像的标注数据,其中,标注数据包括:标注标签的像素位置和标注标签值,标注标签的像素位置包括第一维度值和第二维度值;以标注标签值和第一维度值为索引,对标注数据进行编码,得到多级编码字典,其中,第二维度值包括一个或者多个连续区间,第二维度值的编码值由每个连续区间的起始值和终止值表示。
在其中的一些实施例中,标注标签的像素位置包括:像素位置的行号和列号;其中,在第一维度值为像素位置的行号的情况下,第二维度值为像素位置的列号;在第一维度值为像素位置的列号的情况下,第二维度值为像素位置的行号。
在其中一些实施例中,处理器211可以被配置为:将标注标签值作为第一级索引,将第一维度值作为第二级索引,生成多级编码字典,其中,第二级索引的编码值包括第二维度值的每个连续区间的起始值和终止值。
在其中的一些实施例中,原始图像为三维图像,标注标签的像素位置还包括第三维度值;处理器211还可以被配置为:以标注标签值、第三维度值和第一维度值为索引,对标注数据进行编码,得到多级编码字典。
在其中一些实施例中,处理器211可以被配置为:将标注标签值作为第一级索引,将第三维度值作为第二级索引,将第一维度值作为第三级索引,生成多级编码字典,其中,第三级索引的编码值包括第二维度值的每个连续区间的起始值和终止值。
在其中一些实施例中,处理器211还可以被配置为:在标注标签的像素位置被局部更新后,根据被局部更新后得到的新的像素位置生成标注标签的新的编码数据;在多级编码字典中查询与标注标签对应的编码数据,并根据新的编码数据更新查询到的编码数据,得到新的多级编码字典。
在其中一些实施例中,处理器211还可以被配置为:生成与原始图像的分辨率相同的初始标注结果;确定待渲染的标注数据;在多级编码字典中查询以待渲染的标注数据的标注标签值为索引的目标像素位置;将初始标注结果中目标像素位置的像素值替换为预设像素值,得到待渲染的标注数据的标注结果,其中,预设像素值基于标注标签值确定。
在其中的一些实施例中,待渲染的标注数据包括具有一个标注标签值的标注数据,或者标注为不同标注标签值的多个标注数据。
存储器212可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器212可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器212可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器212可在数据处理装置的内部或外部。在特定实施例中,存储器212是非易失性(Non-Volatile)存储器。在特定实施例中,存储器212包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(Random Access Memory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(ErasableProgrammable Read-Only Memory,简称为EPROM)、电可擦除PROM(Electrically ErasableProgrammable Read-Only Memory,简称为EEPROM)、电可改写ROM(ElectricallyAlterable Read-Only Memory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-AccessMemory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode DynamicRandom Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(ExtendedDate Out Dynamic Random Access Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器212可以用来存储或者缓存需要处理和/或通信使用的各种数据文件(例如医学图像、操作系统、原始标注数据、原始医学图像等),以及处理器211所执行的可能的计算机程序指令。
处理器211通过读取并执行存储器212中存储的计算机程序指令,以实现本申请实施例的标注数据的压缩方法。
在其中一些实施例中,计算机设备还可包括通信接口213和总线210。其中,如图2所示,处理器211、存储器212、通信接口213、显示设备214通过总线210连接并完成相互间的通信。
通信接口213用于实现本实施例中各模块、装置、单元和/或设备之间的通信。通信接口213还可以实现与其他部件例如:外接设备、医学影像扫描设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线210包括硬件、软件或两者,将计算机设备的部件彼此耦接在一起。总线210包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(Control Bus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线210可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(Front Side Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Low Pin Count,简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA)总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线210可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该计算机设备可以基于获取到的标注数据,执行本实施例提供的标注数据的压缩方法。
另外,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现本实施例提供的标注数据的压缩方法。
在本实施例中提供了一种标注数据的压缩方法,图3是本实施例的标注数据的压缩方法的流程图,如图3所示,该流程包括如下步骤:
步骤S301,获取原始图像的标注数据,其中,标注数据包括:标注标签的像素位置和标注标签值,标注标签的像素位置包括第一维度值和第二维度值。
其中,在一个二维图像中,像素位置采用像素在图像中像素的行号和列号表示。第一维度值和第二维度值分别为像素位置的行号和列号中的一个和另一个。例如,在一些实施例中,第一维度值为行号,则第二维度值为列号;在另一些实施例中,第一维度值为列号,则第二维度值为行号。
步骤S302,以标注标签值和第一维度值为索引,对标注数据进行编码,得到多级编码字典,其中,第二维度值包括一个或者多个连续区间,第二维度值的编码值由每个连续区间的起始值和终止值表示。
以医学CT图像的标注数据为例,当对CT图像按照组织、器官或者组成成分进行标注后,在每个被标注的组织、器官或者组成成分的局部CT图像上可以生成对应的掩模图像,即为标注结果。不同的组织、器官或者组成成分使用不同的标签值进行区分,该标签值即为标注标签值;同时,不同的标注标签值对应于掩模图像的不同颜色,即不同的掩模图像的像素值不同。
那么根据标注标签值和第一维度值为索引,对标注数据进行编码得到的多级编码字典中,标注标签值和第一维度值作为用于索引第二维度值的键值,第二维度值则进一步被表示为每个连续区间的起始值和终止值,以减少第二维度值占用的字节长度,实现压缩编码。
在一些实施例中,多级编码字典例如被编码为如下的形式:
{标注标签值:{第一维度值:[第二维度值的起始值1,第二维度值的终止值1],[第二维度值的起始值2,第二维度值的终止值2]}}。
其中,根据标注标签值z查询到的结果包括这一标注标签值z对应的标注结果(掩模图像)被标注在原始图像中的所有像素位置。这些像素位置被按照行列号进一步被分层编码到多级编码字典中。例如在第一维度值为像素位置的行号,第二维度值为像素位置的列号时,第一维度值为x表示在原始图像上第x行像素;以第一维度值为索引的编码值[y1:y2],则表示在原始图像的第x行像素上第y1至第y2列像素均属于标注标签值z的掩模图像的像素位置。上述编码方式通过将y1至y2连续的列号表示为[起始值:终止值]的形式,减少了编码值占用的字符数量,实现了标注数据的压缩编码。
本申请实施例中采用多级编码字典进行压缩编码的方式,相对于相关技术中采用的诸如哈夫曼编码、字串表编码等无损编码算法而言,无需进行编码前的字符统计;并且,由于掩模图像通常为具有一点面积的色块,因此,采用第二维度值的起始值和终止值作为第二维度值的编码值,不仅实现了无损压缩,还能够获得较高的压缩率,且压缩过程复杂程度低,具有较高的处理效率。上述实施例,通过行号和列号描述标注标签在图像中的位置,使得标注标签的位置更加清晰,更有利于查找到标注标签所在的范围,也加快了标注数据的压缩的速度,从而提高了标注数据的压缩的效率。
在其中的一些实施例中,以标注标签值和第一维度值为索引,对标注数据进行编码,得到多级编码字典包括:将标注标签值作为第一级索引,将第一维度值作为第二级索引,生成多级编码字典,其中,第二级索引的编码值包括第二维度值的每个连续区间的起始值和终止值。
上述实施例将标注标签值作为多级编码字典的第一级索引,将第一维度值作为多级编码字典的第二级索引,生成多级编码字典,相当于在字典中确定了目录,有助于有序地将确定图像所需的信息存储于多级编码字典中,也有助于实现对内容的快速查找。用每个连续区间的起始值和终止值来表示第二维度值,并作为第二级索引的编码值,而不需要将此区域的标注标签的像素位置一一记录,很大程度地节省了空间和时间资源。
需要说明的是,多级编码字典的编码方式并不局限于以标注标签值为第一级索引,以第一维度值为第二级索引来生成多级编码字典。例如在一些实施例中,还可以以第一维度值为第一级索引,以标注标签值作为第二级索引的方式生成多级编码字典,也能够在一定程度上实现标注数据的压缩编码。此外,在采用标注标签值和第一维度值作为索引编码时,多级编码字典也不局限于只有两级编码,例如还可以增加诸如原始图像的唯一标识、扫描时间等参数进行更多层级的编码。例如,将同一病人不同部位的医学扫描图像的标注数据编码为多级编码字典,则病人的身份标识、扫描部位标识也可以作为多级编码字典的层级索引。
在原始图像为二维图像的情况下,该二维图像中每个像素都包括在图像坐标系内两个维度值,分别为第一维度值和第二维度值。该图像坐标系包括i轴和j轴,可以以二维图像的左上角为坐标原点,i轴水平指向二维图像右边,j轴指向二维图像的下方,则第一维度值和第二维度值分别为该图像坐标系内像素的i轴坐标值和j轴坐标值。
在原始图像为三维图像的情况下,该三维图像中每个体素都包括在图像坐标系内三个维度值,分别为第一维度值、第二维度值和第三维度值。该图像坐标系包括i轴、j轴和k轴,可以以三维图像的左上角为坐标原点,i轴水平指向三维图像右边,j轴指向三维图像的下方,k轴方向符合右手法则,则第一维度值、第二维度值和第三维度值分别为该图像坐标系内体素的i轴坐标值、j轴坐标值和k轴坐标值。
在本实施例中,可以将三维图像的第三维度值也作为多级编码字典的一个索引,从而为整个三维图像生成一个多级编码字典。例如,在进行三维图像的标注数据的编码时,可以以标注标签值、第三维度值和第一维度值为索引,对标注数据进行编码,得到多级编码字典;具体而言可以将标注标签值作为第一级索引,将第三维度值作为第二级索引,将第一维度值作为第三级索引,生成多级编码字典,其中,第三级索引的编码值包括第二维度值的每个连续区间的起始值和终止值。
通过上述方式,有序地将标注数据的位置信息与标签信息均存放入多级编码字典中,实现对图像的压缩,减少了标注数据的压缩的复杂程度,从而提高了标注数据的压缩的效率。
在采用多级编码字典编码标注数据的另一个好处在于,经过多级编码的标注数据可以进行局部更新、局部传输以及局部渲染。例如,在一些情况下,某一个标注标签对应的标注数据可能被人工调整,例如将对应的掩模图像除去一小块,或者增加一块图像到掩模图像中。以二维图像的标注数据局部更新为例,当标注标签的像素位置被局部更新后,可以根据被局部更新后得到的新的像素位置生成新的编码数据,然后在多级编码字典中以标注标签值为索引查询到所有符合条件的编码数据,然后使用新的编码数据更新查询到的编码数据,从而对多级编码字典进行局部更新,得到新的多级编码字典。
其中,当旧的多级编码字典中未查询到更新后的标注标签的像素位置的某一个第一维度值的情况下,则新建这一第一维度值对应的索引值;对于旧的多级编码字典中能够查询到的更新后的标注标签的像素位置,则将查询到的第二维度值的编码值替换为新的编码值;对于旧的多级编码字典中能够查询到的更新后的标注标签的像素位置,而新的编码值中不存在与之对应的编码值的情况,则将旧的多级编码字典中相应的编码值置为空值或者删除。
类似地,在需要将多级编码字典传输给另一端的设备时,如果另一端的设备已经接收过旧的多级编码字典,可以仅将存在更新的标注数据编码为新的编码值,再传输给另一端的设备,从而减少所需传输的数据量,提高效率。或者另一端的设备只需要部分标注标签对应的标注数据的情况下,可以仅将另一端需要的标注数据编码为局部的多级编码字典,或者从多级编码字典中截取另一端设备需要的部分标注标签对应的编码值生成局部的多级编码字典,再传输给另一端设备,减少所需传输的数据量,提高效率。
类似地,在需要对标注数据进行渲染展示时,可以从多级编码字典中查询和解码部分标注标签对应的标注数据,再对该部分的标注数据进行渲染,得到部分标注标签的渲染结果,而不必将所有的标注标签全部都渲染出来,提高渲染效率。
例如,进行部分标注标签的渲染可以采用下列的方式:生成与原始图像的分辨率相同的初始标注结果;确定待渲染的标注数据;在多级编码字典中查询以待渲染的标注数据的标注标签值为索引的目标像素位置;将初始标注结果中目标像素位置的像素值替换为预设像素值,得到待渲染的标注数据的标注结果,其中,预设像素值基于标注标签值确定。
当对多级编码字典编码进行解码时,首先生成与原始图像的分辨率相同的初始标注结果,该初始标注结果可以为单值图像,如图像上每个像素值的RGB值都为(255,255,255)则该初始标注结果为一张空白图像。这样有利于后续对多级编码字典进行解码时,一一地还原与原始图像对应的标识数据。然后根据待渲染的标注数据,得到待渲染的标注数据的标注标签值和标注数据,这一步是用于后续步骤中需要根据标注标签值来确定与标注标签对应的第一维度值和第二维度值,就可以在新生成的单值图像中,确定相同的标注标签的像素位置所属的标注标签值,并对此标注标签的像素位置进行标注标签值的修改。当原始图像为多层图像时,首先生成多层的单值图像,并根据多级编码字典的内容,对新生成的多层单值图像进行逐层填充。
在其中的一些实施例中,待渲染的标注数据包括具有一个标注标签值的标注数据,或者标注为不同标注标签值的多个标注数据。
下面通过优选实施例对本实施例进行描述和说明。
图4是本实施例的标注数据的压缩方法的优选流程图,如图4所示,该标注数据的压缩方法包括如下步骤:
步骤S401,用户标注数据。
步骤S402,将标注结果进行编码,编码方式为遍历标注后的三维结果(DHW),在前两维中找到包含标注的区域,在第三维中找到图像中标注的起始坐标和终止坐标,最终将三维图像转化为一个多级编码字典。
步骤S403,将编码后的结果传输到接收端。
在其中的一些实施例中,接收端可依据多级编码字典灵活高效地对于标注结果进行渲染,可以只渲染指定位置或者指定标签的标注结果,也可以渲染出原始标注数据。
步骤S404,对于需要局部进行修改传输的标注结果,用户可针对医学图像标注结果进行局部编码,将编码后的结果进行局部更新后即可传输。
在其中的一些实施例中,如图5所示,具体步骤操作如下:
步骤S4041,获取局部更新后得到的新标注数据。
步骤S4042,将局部更新后得到的新标注数据进行编码,得到新的局部编码数据。
步骤S4043,在整体编码数据中,将被更新的编码数据更新为新的局部编码数据,得到编辑后的整体编码数据,即新的多级编码字典。
例如,在一些情况下,当需要对原始标注数据进行修改、新增或删除时,首先,将更新的标注数据进行编码,得到新的局部编码数据。其次,根据更新的标注数据对应的标签和区域,从整体编码数据中查询到对应的编码数据,然后将被更新的编码数据替换为新的局部编码数据,得到编辑后的整体编码数据。当然,如果需要对原始标注数据进行新增时,只需要根据新增的标注数据对应的标签值,在整体编码数据中查询到对应的标签位置,并新建索引,存入对应的编码值。同理,如果需要删除原始标注数据的部分内容时,根据更新后的得到的新标注数据对应的标签值,在整体编码数据中查询对应的标签位置,并将相关区域进行删除。这样的话,当原始标注数据局部发送变化时,不需将全部数据重新再编码,只需要对局部区域进行操作,有助于实现局部压缩编码,从而提高标注数据的压缩和传输处理效率。
步骤S405,解码时,先依据标注尺寸初始化一个全为背景的空白标注,然后依据编码的字典再修改对应区间的像素值即可。
在其中的一些实施例中,用户可根据需求只解码特定标签的标注结果或者特定位置的标注结果。
在一些情况下,如果只需要解码原始标注数据中的某一个特定标签的标注结果时,首先,根据特定标注结果对应的标签,在整体编码数据中查询到此标签对应的区域,再从此区域中得到相应的编码值,最后解码该区域的编码值。类似地,当只需要解码特定位置的标注结果时,首先根据特定位置的标注结果对应的像素位置,包括第一维度值和第二维度值上的多个区间,在整体编码数据中,从第一维度值对应的多个编码值中,查询到其在第二维度值方向上指定的区间位置对应的编码值,并进行解码。需要说明的是,如果特定位置只包含第一维度值,则从整体编码数据中,查询到该第一维度值对应的所有编码值,然后进行解码。同理,如果特定位置位于第二维度值方向上,首先将此特定位置编码为编码值,然后从整体编码数据中查询所有与此特定位置对应的编码值一致的编码值,此时的编码值包括了不同标签的多个第一维度值对应的编码值,最后进行解码。这样的话,可以根据需求只解码特定标签的标注结果或者特定位置的标注结果,增加了多级编码字典的灵活性,从而提高了标注数据的可操作性。
在其中的一些实施例中,编码算法的输入为待编码的标注结果及待编码的标签类型,若不指定则所有标注结果均进行编码。算法遍历三维图像,找到最后一维度的标注数据中待编码像素的非重复位置,若为设定的编码标签,则将非重复位置存储到设定的字典结构中。
先将标注数据进行编码为多级编码字典,有助于实现节省时间和空间资源。在本实施例中,多级编码字典的第一级为标注数据所包含的标注结果类别。第二级为包含对应标注区域的第一维坐标。第三级为包含对应标注区域的第二维坐标。第四级为对应标注区域的起始位置和终止位置所构成的数据。
以医学场景为例,假设对具有N层的DICOM格式的CT图像进行勾画后,形成如下的字典:{1:{3:{6:[123,136]}}},其具体含义是指在第三层的第六行坐标区间[123,136]的标注标签对应的标注标签值为1。
上述步骤中,只将标注结果编码为多级编码字典,提高了标注数据的压缩的效率。然后对多级编码字典进行传输,节省了大量的时间和空间资源,提高了标注数据的压缩传输的效率。当需要局部修改原始数据时,仅需要对局部数据进行压缩替换,而不需要将全部数据重新再编码,提高了操作效率。最后,解码时,按照字典结构逐层填充新生成的图像,可以得到与压缩前完全相同的数据,从而实现了无损压缩传输,提高了标注数据的压缩传输的效率。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。例如,步骤S403和步骤S404可互换。
在本实施例中还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取原始图像的标注数据,其中,标注数据包括:标注标签的像素位置和标注标签值,标注标签的像素位置包括第一维度值和第二维度值。
S2,以标注标签值和第一维度值为索引,对标注数据进行编码,得到多级编码字典,其中,第二维度值包括一个或者多个连续区间,第二维度值的编码值由每个连续区间的起始值和终止值表示。
需要说明的是,在本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,在本实施例中不再赘述。
应该明白的是,这里描述的具体实施例只是用来解释这个应用,而不是用来对它进行限定。根据本申请提供的实施例,本领域普通技术人员在不进行创造性劳动的情况下得到的所有其它实施例,均属本申请保护范围。
显然,附图只是本申请的一些例子或实施例,对本领域的普通技术人员来说,也可以根据这些附图将本申请适用于其他类似情况,但无需付出创造性劳动。另外,可以理解的是,尽管在此开发过程中所做的工作可能是复杂和漫长的,但是,对于本领域的普通技术人员来说,根据本申请披露的技术内容进行的某些设计、制造或生产等更改仅是常规的技术手段,不应被视为本申请公开的内容不足。
“实施例”一词在本申请中指的是结合实施例描述的具体特征、结构或特性可以包括在本申请的至少一个实施例中。该短语出现在说明书中的各个位置并不一定意味着相同的实施例,也不意味着与其它实施例相互排斥而具有独立性或可供选择。本领域的普通技术人员能够清楚或隐含地理解的是,本申请中描述的实施例在没有冲突的情况下,可以与其它实施例结合。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对专利保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种标注数据的压缩方法,其特征在于,包括:
获取原始图像的标注数据,其中,所述标注数据包括:标注标签的像素位置和标注标签值,所述标注标签的像素位置包括第一维度值和第二维度值;
以所述标注标签值和所述第一维度值为索引,对所述标注数据进行编码,得到多级编码字典,其中,所述第二维度值包括一个或者多个连续区间,所述第二维度值的编码值由每个连续区间的起始值和终止值表示。
2.根据权利要求1所述的标注数据的压缩方法,其特征在于,所述标注标签的像素位置包括:像素位置的行号和列号;其中,在所述第一维度值为像素位置的行号的情况下,所述第二维度值为像素位置的列号;在所述第一维度值为像素位置的列号的情况下,所述第二维度值为像素位置的行号。
3.根据权利要求1所述的标注数据的压缩方法,其特征在于,以所述标注标签值和所述第一维度值为索引,对所述标注数据进行编码,得到多级编码字典包括:
将所述标注标签值作为第一级索引,将所述第一维度值作为第二级索引,生成所述多级编码字典,其中,所述第二级索引的编码值包括所述第二维度值的每个连续区间的起始值和终止值。
4.根据权利要求1所述的标注数据的压缩方法,其特征在于,所述原始图像为三维图像,所述标注标签的像素位置还包括第三维度值;以所述标注标签值和所述第一维度值为索引,对所述标注数据进行编码,得到多级编码字典还包括:
以所述标注标签值、所述第三维度值和所述第一维度值为索引,对所述标注数据进行编码,得到所述多级编码字典。
5.根据权利要求4所述的标注数据的压缩方法,其特征在于,以所述标注标签值、所述第三维度值和所述第一维度值为索引,对所述标注数据进行编码,得到所述多级编码字典包括:
将所述标注标签值作为第一级索引,将所述第三维度值作为第二级索引,将所述第一维度值作为第三级索引,生成所述多级编码字典,其中,所述第三级索引的编码值包括所述第二维度值的每个连续区间的起始值和终止值。
6.根据权利要求1所述的标注数据的压缩方法,其特征在于,所述方法还包括:
在所述标注标签的像素位置被局部更新后,根据被局部更新后得到的新的像素位置生成所述标注标签的新的编码数据;
在所述多级编码字典中查询与所述标注标签对应的编码数据,并根据所述新的编码数据更新查询到的编码数据,得到新的多级编码字典。
7.根据权利要求1所述的标注数据的压缩方法,其特征在于,所述方法还包括:
生成与所述原始图像的分辨率相同的初始标注结果;
确定待渲染的标注数据;
在所述多级编码字典中查询以所述待渲染的标注数据的标注标签值为索引的目标像素位置;
将所述初始标注结果中所述目标像素位置的像素值替换为预设像素值,得到所述待渲染的标注数据的标注结果,其中,所述预设像素值基于所述标注标签值确定。
8.根据权利要求7所述的标注数据的压缩方法,其特征在于,所述待渲染的标注数据包括具有一个标注标签值的标注数据,或者标注为不同标注标签值的多个标注数据。
9.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至8中任一项所述的标注数据的压缩方法。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1至8中任一项所述的标注数据的压缩方法。
CN202011622385.7A 2020-12-30 2020-12-30 标注数据的压缩方法、电子装置和存储介质 Pending CN112800264A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011622385.7A CN112800264A (zh) 2020-12-30 2020-12-30 标注数据的压缩方法、电子装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011622385.7A CN112800264A (zh) 2020-12-30 2020-12-30 标注数据的压缩方法、电子装置和存储介质

Publications (1)

Publication Number Publication Date
CN112800264A true CN112800264A (zh) 2021-05-14

Family

ID=75807486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011622385.7A Pending CN112800264A (zh) 2020-12-30 2020-12-30 标注数据的压缩方法、电子装置和存储介质

Country Status (1)

Country Link
CN (1) CN112800264A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113568912A (zh) * 2021-07-27 2021-10-29 重庆紫光华山智安科技有限公司 一种设备编码的管理方法、系统、介质及终端
CN117149778A (zh) * 2023-10-30 2023-12-01 之江实验室 稀疏张量运算加速方法、系统、计算机设备和存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113568912A (zh) * 2021-07-27 2021-10-29 重庆紫光华山智安科技有限公司 一种设备编码的管理方法、系统、介质及终端
CN113568912B (zh) * 2021-07-27 2023-05-02 重庆紫光华山智安科技有限公司 一种设备编码的管理方法、系统、介质及终端
CN117149778A (zh) * 2023-10-30 2023-12-01 之江实验室 稀疏张量运算加速方法、系统、计算机设备和存储介质
CN117149778B (zh) * 2023-10-30 2024-01-16 之江实验室 稀疏张量运算加速方法、系统、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
US6728334B1 (en) Automatic detection of pulmonary nodules on volumetric computed tomography images using a local density maximum algorithm
CN109035234B (zh) 一种结节检测方法、装置和存储介质
CN112800264A (zh) 标注数据的压缩方法、电子装置和存储介质
US6633674B1 (en) Picture archiving and communication system employing improved data compression
US8295620B2 (en) Image data set compression based on viewing parameters for storing medical image data from multidimensional data sets, related systems, methods and computer products
EP3611699A1 (en) Image segmentation using deep learning techniques
US7564999B2 (en) Method for identifying markers in radiographic images
US20060112115A1 (en) Data structure for efficient access to variable-size data objects
WO2022017085A1 (zh) 一种处理dicom文件的方法、装置和系统
KR101885562B1 (ko) 제1 의료 영상의 관심 영역을 제2 의료 영상 위에 맵핑하는 방법 및 이를 이용한 장치
CN111445550B (zh) Pet图像的迭代重建方法、装置和计算机可读存储介质
CN111144449B (zh) 图像处理方法、装置、存储介质及电子设备
US10679742B2 (en) Vector-valued diagnostic image encoding
Punitha et al. Analysis of file formats and lossless compression techniques for medical images
Arif et al. Auto-shape lossless compression of pharynx and esophagus fluoroscopic images
Aldemir et al. Chain code strategy for lossless storage and transfer of segmented binary medical data
CN106295138B (zh) 医学图像文件的读取方法及其装置
CN116193136B (zh) 一种核磁共振影像网络通信方法及系统
CN113962958B (zh) 一种征象检测方法及装置
CN111430013B (zh) 一种图像日期的补全方法、装置、设备及存储介质
CN113538253B (zh) 一种医疗影像的处理方法、介质及ct装置
US7688995B2 (en) System and method for quality assurance for distributed computer aided diagnosis solutions
US11741569B2 (en) Compression of CT reconstruction images involving quantizing voxels to provide reduced volume image and compressing image
US20200005945A1 (en) 3d web-based annotation
Fischer et al. Performance comparison of compression algorithms for archiving segmented volumetric binary medical data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220117

Address after: 430206 22 / F, building C3, future science and technology building, 999 Gaoxin Avenue, Donghu New Technology Development Zone, Wuhan, Hubei Province

Applicant after: Wuhan Zhongke Medical Technology Industrial Technology Research Institute Co.,Ltd.

Address before: Room 3674, 3 / F, 2879 Longteng Avenue, Xuhui District, Shanghai, 200232

Applicant before: SHANGHAI UNITED IMAGING INTELLIGENT MEDICAL TECHNOLOGY Co.,Ltd.