CN111200733B - 一种远程眼底筛查和健康大数据系统中的隐私保护方法 - Google Patents

一种远程眼底筛查和健康大数据系统中的隐私保护方法 Download PDF

Info

Publication number
CN111200733B
CN111200733B CN201811382918.1A CN201811382918A CN111200733B CN 111200733 B CN111200733 B CN 111200733B CN 201811382918 A CN201811382918 A CN 201811382918A CN 111200733 B CN111200733 B CN 111200733B
Authority
CN
China
Prior art keywords
data
variable length
embedding
jpeg
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811382918.1A
Other languages
English (en)
Other versions
CN111200733A (zh
Inventor
余轮
邱应强
欧霖杰
曹新容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou Yiying Health Technology Co ltd
Original Assignee
Fuzhou Yiying Health Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou Yiying Health Technology Co ltd filed Critical Fuzhou Yiying Health Technology Co ltd
Priority to CN201811382918.1A priority Critical patent/CN111200733B/zh
Publication of CN111200733A publication Critical patent/CN111200733A/zh
Application granted granted Critical
Publication of CN111200733B publication Critical patent/CN111200733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/633Control signals issued by server directed to the network components or client
    • H04N21/6332Control signals issued by server directed to the network components or client directed to client
    • H04N21/6334Control signals issued by server directed to the network components or client directed to client for authorisation, e.g. by transmitting a key
    • H04N21/63345Control signals issued by server directed to the network components or client directed to client for authorisation, e.g. by transmitting a key by transmitting keys

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Radiology & Medical Imaging (AREA)
  • Discrete Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及信息隐藏技术领域,特别涉及一种远程眼底筛查和健康大数据系统中的隐私保护方法。所述一种远程眼底筛查和健康大数据系统中的隐私保护方法,包括步骤:解析待传输的文件获取目标数据,目标数据包括:隐私数据和JPEG格式眼底图像;在JPEG格式眼底图像中的哈夫曼表定义段中,找到JPEG标准对量化后的交流系数定义了162个变长编码与行程编码之间的对应关系;根据嵌入数据修改所述JPEG数据流中的熵编码数据流实现所述隐私数据嵌入;重组修改后的哈夫曼表定义段数据流、熵编码数据流与其它段未修改数据流得到处理后的JPEG图像。该无损信息隐藏技术可无失真恢复原宿主载体JPEG格式的眼底图像,能够很好地解决个人隐私数据在传输或存储中的保护。

Description

一种远程眼底筛查和健康大数据系统中的隐私保护方法
技术领域
本发明涉及信息隐藏技术领域,特别涉及一种远程眼底筛查和健康大数据系统中的隐私保护方法。
背景技术
随着我国经济的持续快速发展,人们生活水平不断提高,饮食结构和生活方式发生了较大的改变,糖尿病等慢性病的患病率逐年上升。糖尿病及其并发症严重影响生活质量,并造成巨大的社会和经济负担。糖尿病性视网膜病变(DR)是糖尿病的主要并发症之一,是工作年龄人群不可逆盲的首要原因。随着糖尿病的病程增长,DR的患病风险不断增大,糖尿病患者应定期进行至少每年一次的眼底筛查。
DR筛查可使失明风险降低94.4%,但我国的筛查率还不到10%!究其主要原因是我国专业眼底亚专科医生不但极少,更忙于已发眼病的诊治,无暇顾及大量糖尿病患者的筛查;由于缺乏眼科医生或专业读图人员,广大基层医疗机构、社区、乡镇或边远地区的一般健康医疗服务机构或诊所更是难以对广大糖尿病患者开展定期的眼底筛查工作。
因此,如果能够建立起“远程眼底图象判读会诊中心和云健康服务平台”,将眼底相机为主构成的终端设置于基层社区、诊所、健康管理或基层医疗机构,获取眼底图象和相关健康问诊数据后发回“远程眼底图象判读会诊中心”判读和处理,对于减缓基层群众看病难,解决基层缺少眼科医生或专业的读图人才缺乏等问题,都具有重要意义。
眼底是人体中唯一不需要通过手术就能直接观察到血管和神经的部位,从眼底图像中还能够提取有关脑、心血管健康的结构化特征信息,建立知识库以及知识计算分析模型,就能形成了一个能够不断更新、能够分析的健康大数据知识库,对于开展健康大数据服务、治未病、保护广大人民身体健康具有重大的意义,有着广阔的应用前景。
在建设上述“远程眼底图象判读会诊中心和云健康服务平台”,开展上述远程眼底筛查、健康大数据服务,尤其数据的传输和存储过程中,都需要高度重视个人的敏感信息安全和隐私保护等问题,一是由于个人的健康医疗信息最为敏感,二是对涉及健康大数据的管理必须十分注重内容安全和技术安全。
在健康医疗领域中,医学图像是医生对患者的生理疾病信息获取及诊断病情的一个重要依据,往往不允许有任何改动。因为改动后一旦出现误诊,很容易引起法律上的纠纷。无论从法律上还是从经济成本上考虑,任何可能对医学图像造成永久性损失的操作都是不可取的。
无损信息隐藏技术在提取隐秘载体中嵌入的机密数据后,可无失真恢复原宿主载体,能够很好地解决这个问题。尤其是对于本发明远程眼底筛查和健康大数据系统等相关应用场景来说,需要传输和存储的数据包括有数字图像和个人隐私信息,数字图像中的无损信息隐藏技术应用具有特别的意义。
因此,在建设远程眼底筛查系统和健康大数据服务系统时,如何在保障传输速度的同时确保了眼底图像的传输质量又不改变眼底图像的存储容量,如何无失真恢复原宿主载体JPEG格式的眼底图像,并达到基于哈夫曼编码修改实现最大数据嵌入容量,是必须解决得重要问题,国内外尚未见报道。
发明内容
为此,需要提供一种远程眼底筛查和健康大数据系统中的隐私保护方法,用以解决上述技术问题。具体技术方案如下:
一种远程眼底筛查和健康大数据系统中的隐私保护方法,包括步骤:
解析待传输的文件获取目标数据,所述目标数据包括:隐私数据和JPEG格式眼底图像;
在所述JPEG格式眼底图像中的哈夫曼表定义段中,找到JPEG标准对量化后的交流系数定义了162个变长编码与行程编码之间的对应关系;
根据哈夫曼表定义段变长编码定义统计JPEG数据流中的熵编码数据流中已使用变长编码使用次数和未使用变长编码;
建立已使用变长编码和未使用变长编码的映射关系,根据所述映射关系修改所述哈夫曼表定义段;
根据嵌入数据修改所述JPEG数据流中的熵编码数据流实现所述隐私数据嵌入;
重组修改后的哈夫曼表定义段数据流、熵编码数据流与其它段未修改数据流得到处理后的JPEG图像。
进一步的,所述“建立已使用变长编码和未使用变长编码的映射关系,根据所述映射关系修改哈夫曼表定义段”,还包括步骤:
变长编码根据其长度可分成16组{C1,…,C16},
Figure GDA0003214732080000031
Ci可进一步分类成已使用的Ci (u)和未使用的Ci (n),Ci (u)与Ci (n)之间通过快速映射方法构建映射关系;
根据映射关系,将哈夫曼表定义段中Ci (n)中的变长编码对应的行程编码修改成与其建立映射的Ci (u)中的特定已使用变长编码的行程编码。
进一步的,所述“根据嵌入数据修改所述JPEG数据流中的熵编码数据流实现所述隐私数据嵌入”,还包括步骤:
根据映射关系,将熵编码数据流中Ci (u)中的特定已使用变长编码的哈夫曼编码根据嵌入数据修改成与其建立映射关系的Ci (n)中某个特定未使用变长编码对应的哈夫曼编码或保持不变,完成所述隐私数据嵌入。
进一步的,所述“修改所述JPEG数据中的熵编码数据流实现所述隐私数据嵌入”,包括步骤:
嵌入前采用第一密钥对所述隐私数据进行加密;
嵌入过程中采用第二密钥按8×8图像块特定随机顺序嵌入加密后的所述隐私数据;
采用第三密钥对加密后的所述隐私数据生成信息完整性校验码作为数字指纹信息,并将所述数字指纹信息存入JPEG头文件用户定义区。
进一步的,还包括步骤:
所述待传输的文件如果采用DICOM标准传输与存储,则在DICOM头文件中虚构隐私数据。
本发明的有益效果是:通过解析待传输的文件获取目标数据,所述目标数据包括:隐私数据和眼底图像JPEG图像,且根据哈夫曼表定义段变长编码定义统计JPEG数据流中的熵编码数据流中已使用变长编码使用次数和未使用变长编码;建立已使用变长编码和未使用变长编码的映射关系;根据所述映射关系修改哈夫曼表定义段;根据嵌入数据修改所述JPEG数据流中的熵编码数据流实现数据嵌入,可达到基于哈夫曼编码修改实现最大数据嵌入容量,从而在确保传输的眼底图像数据量不变的情况下,却将隐私数据都嵌入到眼底图像的JPEG数据流中,在保障传输速度的同时确保了眼底图像的传输质量;该无损信息隐藏技术在提取宿主载体JPEG格式或DICOM标准数据中嵌入的个人隐私数据后,可无失真恢复原宿主载体JPEG格式的眼底图像,能够很好地解决个人隐私数据在传输或存储中的保护。
本发明对传统的基于哈夫曼编码修改的JPEG图像可逆信息隐藏算法进行两大重要的创新性改进:第一,提出一种快速变长编码映射方法可快速建立已使用变长编码与未使用变长编码的最优映射关系,从而达到基于哈夫曼编码修改实现可逆信息隐藏的最大数据嵌入容量;第二,通过将将较长已使用变长编码映射到码字较短的未使用变长编码,从而在减少文件大小下提高数据嵌入容量。
附图说明
图1为具体实施方式所述JPEG文件结构示意图;
图2a为具体实施方式所述已使用和未使用变长编码一对一映射示意图;
图2b为具体实施方式所述已使用和未使用变长编码一对三映射示意图
图3为具体实施方式所述一种远程眼底筛查和健康大数据系统中的隐私保护方法的示意图;
图4为具体实施方式所述一种远程眼底筛查和健康大数据系统中的隐私保护方法的流程图;
图5为具体实施方式所述一种远程眼底筛查和健康大数据系统中的隐私保护方法的加密的示意图;
图6为具体实施方式所述一种远程眼底筛查和健康大数据系统中的隐私保护方法的解密的示意图。
具体实施方式
为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。
请参阅图1至图6,首先对本实施方式中的一些名词做以下解释说明:
如图1所示,JPEG图像文件以图像开始标记SOI(Start of Image)作为文件头,以图像结束标记EOI(End of Image)作为文件尾,中间包括了相关的不同字段信息。JPEG标准指南对亮度分量量化后的交流(AC)系数定义了162个变长编码VLC(Variable LengthCode),具体AC量化系数则采用变长整数编码VLI(Variable Length Integer),相应地AC系数编码表示为(VLC,VLI)。
DICOM:(Digital Imaging and Communications in Medicine)即医学数字成像和通信,是医学图像和相关信息的国际标准(ISO 12052)。它定义了质量能满足临床需要的可用于数据交换的医学图像格式。
信息隐藏技术是指将特定的秘密信息(Secret Message)嵌入到数字化的宿主载体(Cover)信息中得到隐含秘密信息的隐秘载体(Stego-Cover)由于隐秘载体信息与原载体信息难于区分,可通过公开传输隐秘载体信息来传递秘密信息,隐秘载体信息能够被正常访问和使用,其目的在于防止秘密信息引起拦截者的关注和怀疑,从而降低被攻击的可能性。从狭义来看,信息隐藏就是将秘密信息隐藏在另一个公开信息中,然后通过公开信息的传输来传递秘密信息。
在本实施方式中,无损隐藏嵌入到眼底图像中受保护的个人隐私数据可能包括:个人基本信息(民族、国籍、出生年月、身份证号或社保、医保号,工作单位、职业、姓名、联系电话、住址以及健康问诊资料等敏感或隐私信息。
在本实施方式中,眼底照相机大多以JPEG格式采集眼底图像,而采用国际标准DICOM将有利于解决远程眼科筛查系统解决眼底图像信息共享的问题。
在本实施方式中,如采用DICOM标准保存的文件,文件中包含了隐私数据和眼底图像,所述隐私数据包括:患者姓名、年龄、性别、住址、电话和既往病史等一系列个人隐私信息。
具体实施方式如下:
步骤S401:解析待传输的文件获取目标数据,所述目标数据包括:隐私数据和JPEG格式眼底图像。其中还包括步骤:从JPEG格式眼底图像中解析出JPEG数据流。解析好后,执行步骤S402:在所述JPEG格式眼底图像中的哈夫曼表定义段中,找到JPEG标准对量化后的交流系数定义了162个变长编码与行程编码之间的对应关系。可采用如下方式:在JPEG数据流的哈夫曼表定义段中找到JPEG标准对量化后的交流系数定义了162个变长编码与行程编码之间的对应关系,解析JPEG熵编码数据流统计162个变长编码使用情况。
步骤S403:根据哈夫曼表定义段变长编码定义统计JPEG数据流中的熵编码数据流中已使用变长编码使用次数和未使用变长编码。步骤S404:建立已使用变长编码和未使用变长编码的映射关系,根据所述映射关系修改哈夫曼表定义段。可采用如下方式:变长编码根据其长度可分成16组{C1,…,C16},
Figure GDA0003214732080000061
Ci可进一步分类成已使用的Ci (u)和未使用的Ci (n),Ci (u)与Ci (n)之间通过快速映射方法构建映射关系;根据映射关系,将哈夫曼表定义段中Ci (n)中的变长编码对应的行程编码修改成与其建立映射的Ci (u)中的特定已使用变长编码的行程编码。
在本实施方式中,所述快速映射法包括以下步骤:
a.考虑到使用次数高的编码必将与更多未使用编码建立映射关系,因此在建立映射关系之前将该组pi个已使用变长编码按照统计次数从大到小进行排序,设排序结果为
Figure GDA0003214732080000071
b.按照变长编码使用次数从大到小的顺序按可映射的最大未使用变长编码个数依次建立初始映射关系。为了便于嵌入二进制数据,与已使用变长编码建立映射关系的未使用变长编码的个数必为(2l-1)(由于相同长度的边长编码最大为125,所以参数l取值为1≤l≤7),具体过程可描述为,初始化未映射Ci (n)个数为qi,1=qi,对于
Figure GDA0003214732080000072
Figure GDA0003214732080000073
Figure GDA0003214732080000074
将与
Figure GDA0003214732080000075
个未使用变长编码建立初步映射关系,
Figure GDA0003214732080000076
然后,对于
Figure GDA0003214732080000077
Figure GDA0003214732080000078
Figure GDA0003214732080000079
将与
Figure GDA00032147320800000710
个未使用变长编码建立初步映射关系,
Figure GDA00032147320800000711
一般化地,对于
Figure GDA00032147320800000712
Figure GDA00032147320800000713
Figure GDA00032147320800000714
将与
Figure GDA00032147320800000715
个未使用变长编码建立初步映射关系,
Figure GDA00032147320800000716
构建初步映射关系直至所有已使用变长编码已建立映射关系或所有未使用编码已建立映射关系为止;
c.构建初步映射关系后,Ci (u)中各变长编码对应嵌入级别依次为
Figure GDA00032147320800000718
满足
Figure GDA00032147320800000719
若ki,j=0(1≤j≤pi)表明
Figure GDA00032147320800000717
在初步映射中未建立映射关系。构建的初步映射关系需要经过精细调整实现最优映射从而达到最大数据嵌入容量。精细调整的思想是嵌入等级回退形成可能的低嵌入等级组合测试得到最优组合确定是否回退或如何回退,比如ki,j=3时回退到至ki,j=2将释放ΔNk,j=4个未使用向量,可能的组合有{2,2}、{2,1,1}或{1,1,1,1},需要在
Figure GDA0003214732080000081
中找到相应符合映射条件等级的排列靠前(即对应已使用变长编码使用次数在相同嵌入等级中个数多)的已使用变长编码,将其相应的嵌入等级提升。进而统计相应的数据嵌入增加值与ki,j=3回退可能减少的数据嵌入量进行比较,确定是否回退或如何回退达到更大的数据嵌入量。此外,根据构建初步映射关系原则,ki,j=1(1≤j≤pi)回退将无法提高数据嵌入容量,因此只有ki,j≥2(1≤j≤pi)需要判定回退是否能够提高数据嵌入容量,而且回退过程需要按ki,j大小从小到大逐渐回退。
所述映射精细调整方法法包括以下步骤:
a.从小到大排序
Figure GDA0003214732080000082
按此顺序找到第一个满足ki,j≥2;
b.ki,j回退1个嵌入等级,
Figure GDA0003214732080000083
的出现次数即为回退前后的数据嵌入容量,然后再根据相应需提升嵌入级别的已使用编码组合中各编码使用次数计算相应的数据嵌入容量。若回退后所有可能组合的嵌入容量值均小于ki,j回退前后的嵌入容量变换值
Figure GDA0003214732080000084
则不回退,若此时j=1表明精细调整已完成,j≠1则将j值自减1得到新的ki,j返回步骤b进行判定;反之,从各种不同提升嵌入等级组合中找到嵌入容量最大的组合回退ki,j并提升相应的已使用编码嵌入等级建立新的映射关系,更新
Figure GDA0003214732080000085
中的大小排序,返回步骤a继续进行精细调整。
在本实施方式中,允许低组未使用编码向高组已使用编码映射,快速映射建立过程不在局限于同组内建立映射关系,一旦低组出现未使用变长编码,而高组的已使用变长编码使用次数大于该低组中已使用变长编码最大次数时,将低组和高组合并按快速映射方法建立映射关系,可进一步增大数据嵌入量,同时还能够降低一定的JPEG文件数据量。
步骤S405:根据嵌入数据修改所述JPEG数据流中的熵编码数据流实现所述隐私数据嵌入。可采用如下方式:根据映射关系,将熵编码数据流中Ci (u)中的特定已使用变长编码的哈夫曼编码根据嵌入数据修改成与其建立映射关系的Ci (n)中某个特定未使用变长编码对应的哈夫曼编码或保持不变,完成数据嵌入。步骤S406:重组修改后的哈夫曼表定义段数据流、熵编码数据流与其它段未修改数据流得到处理后的JPEG图像。
通过解析眼底图像文件获取目标数据,所述目标数据包括:隐私数据和眼底图像JPEG数据流,通过虚构所述隐私数据使得隐私数据安全性提高,且根据哈夫曼表定义段变长编码定义统计JPEG数据流中的熵编码数据流中已使用变长编码使用次数和未使用变长编码;建立已使用变长编码和未使用变长编码的映射关系;可达到基于哈夫曼编码修改实现最大数据嵌入容量。且通过将较长已使用变长编码映射到码字较短的未使用变长编码,从而在减少文件大小下提高数据嵌入容量,确保眼底图像数据量大时,也能正常嵌入与传送。
具体可举例如下:
在JPEG图像文件中,由于8×8图像块经DCT变换并量化后的63个交流系数中很多值为0,变长编码VLC进一步采用行程编码RLE(Run Length Encoding)来替代以降低数据的传输量,行程编码还进一步采用哈夫曼编码这种熵编码方式来压缩图像数据,图1中的DHT段定义内容用来表示各VLC与RLE之间的对应关系并用于构建相应的哈夫曼表,其中Li表示DHT段中长度为i的变长编码个数,而Vi,j则为第j个长度为i的变长编码对应的行程编码(run,size)。根据变长编码数据结构定义,各变长编码与对应的行程编码(run,size)可表示为:
Vij=VAL(VLCi,j) (1)
由于定义的162个变长编码涵盖了所有可能的run/size行程编码,但对应特定JPEG图像而言,可能只用到了部分编码,还存在一定的未使用编码,在DHT段修改具体的run/size值可将未使用变长编码映射到相关的已使用变长编码上。在构建未使用和已使用变长编码之间的映射关系的过程中,所有变长编码根据其长度可分成16组{C1,…,C16},各组Ci包含Li个变长编码,可表示为
Figure GDA00032147320800001019
为了后续讨论方便,对于1≤i<j≤16,Ci称为低组,Cj称为高组。对于特定JPEG图像,同组的变长编码可能存在部分已使用、部分未使用的情况,根据使用情况Ci可进一步分类成已使用的Ci (u)和未使用的Ci (n),个数分别为pi和qi,pi+qi=Li
Figure GDA0003214732080000101
Figure GDA0003214732080000102
若pi≥qi且qi>0,该组Ci中的未使用和已使用变长编码之间一对一的映射关系定义为
Figure GDA0003214732080000103
Figure GDA0003214732080000104
代表建立的映射关系,需要在JPEG文件中DHT段中用
Figure GDA0003214732080000105
的行程码
Figure GDA0003214732080000106
替换
Figure GDA0003214732080000107
对应的行程码
Figure GDA0003214732080000108
1≤j≤qi。若
Figure GDA0003214732080000109
表示嵌入数据为“0”,而相应地
Figure GDA00032147320800001010
表示嵌入数据为“1”,那么在数据嵌入过程中,需要SOS数据流根据嵌入数值确定是否需要将
Figure GDA00032147320800001011
应的哈夫曼码用
Figure GDA00032147320800001012
对应的哈夫曼码进行替换。若pi<qi,Ci中的已使用变长编码则与未使用的进行一对多的映射
Figure GDA00032147320800001013
其中
Figure GDA00032147320800001014
单个已使用变长编码与不同数量未使用编码建立映射关系在构建已使用变长编码和未使用变长编码的映射关系中,为了实现有效的二进制数嵌入,任意1个已使用变长编码与1个未使用变长编码建立映射关系方可用于实现1比特数据嵌入,DHT段中的行程码值
Figure GDA00032147320800001015
需要用
Figure GDA00032147320800001016
替换,如图2(a)所示。而如果要实现2比特数据嵌入,相应地需要与3个未使用变长编码建立映射关系,即增加1比特的数据嵌入量需要增加2个未使用变长编码建立映射关系,DHT段中的行程码值
Figure GDA00032147320800001017
需要用
Figure GDA00032147320800001018
替换,如图2(b)所示。
方法的数据嵌入过程可描述为:
步骤1分解JPEG文件码流,解析所有哈夫曼码得到各变长编码的使用次数,包括未使用的变长编码情况;
步骤2根据特定规则构建未使用的变长编码与部分已使用变长编码的映射关系,并在JPEG文件码流中相应的DHT段将各未使用变长编码对应的(run,size)值修改为映射的已使用编码的(run,size)值;
步骤3在JPEG文件的图像压缩数据流中,依次根据嵌入数据值将已建立映射关系的变长编码对应的哈夫曼编码值用相应未使用变长编码的哈夫曼编码值替代或保持不变,从而完成数据嵌入;
为了提高数据嵌入容量,需根据结合各已使用变长编码的使用次数构建最优映射。以C16为例,先将C16中的已使用变长编码根据使用次数从大到小进行排序,设函数count(16,v)表示其中排序后第v个已使用变长编码的使用次数,要求各映射参数m16,j(1≤j≤6)值的选择应满足:
Figure GDA0003214732080000111
并且使得满足
Figure GDA0003214732080000112
以上两式数学表达式求解比较困难,为此提出了一种快速映射方法。具体思路为:
为了保证数据嵌入后会导致JPEG文件大小的变化(由于在JPEG数据流中出现FFH数值需要自动增补00H进行转译,所以嵌入编码后可能会出现JPEG文件数据量的微小变化),哈夫曼码长度相同的同组变长编码Ci中的已使用和未使用编码进行映射,要求pi>0且qi>0,即该组中的已使用和未使用编码个数均不为0。为了能够快速构建映射关系,需要综合考虑单位未使用编码数据嵌入率以及已使用编码使用频率,而且使用次数高的编码必将与更多未使用编码建立映射关系,因此首先在建立映射关系之前将该组已使用变长编码按照统计次数从大到小进行排序。假设Ci中已使用变长编码Ci (u)个数pi和未使用变长编码Ci (n)个数qi。下面以Ci组为例说明快速映射实现思想。
1、考虑到使用次数高的编码必将与更多未使用编码建立映射关系,因此在建立映射关系之前将该组pi个已使用变长编码按照统计次数从大到小进行排序,设排序结果为
Figure GDA0003214732080000121
2、按照变长编码使用次数从大到小的顺序按可映射的最大未使用变长编码个数依次建立初始映射关系。为了便于嵌入二进制数据,与已使用变长编码建立映射关系的未使用变长编码的个数必为(2l-1),具体过程可描述为,初始化未映射Ci (n)个数为qi,1=qi,对于
Figure GDA0003214732080000122
Figure GDA0003214732080000123
Figure GDA0003214732080000124
将与
Figure GDA0003214732080000125
个未使用变长编码建立初步映射关系,
Figure GDA0003214732080000126
然后,对于
Figure GDA0003214732080000127
Figure GDA0003214732080000128
Figure GDA0003214732080000129
将与
Figure GDA00032147320800001210
个未使用变长编码建立初步映射关系,
Figure GDA00032147320800001211
一般化地,对于
Figure GDA00032147320800001212
Figure GDA00032147320800001213
Figure GDA00032147320800001214
将与
Figure GDA00032147320800001215
个未使用变长编码建立初步映射关系,
Figure GDA00032147320800001216
构建初步映射关系直至所有已使用变长编码已建立映射关系或所有未使用编码已建立映射关系为止。
3、构建初步映射关系后,Ci (u)中各变长编码对应嵌入级别依次为
Figure GDA00032147320800001217
满足
Figure GDA00032147320800001218
若ki,j=0(1≤j≤pi)表明
Figure GDA00032147320800001219
在初步映射中未建立映射关系。构建的初步映射关系需要经过精细调整实现最优映射从而达到最大数据嵌入容量。精细调整的思想是嵌入等级回退形成可能的低嵌入等级组合测试得到最优组合确定是否回退或如何回退,比如ki,j=3时回退到至ki,j=2将释放ΔNk,j=4个未使用向量,可能的组合有{2,2}、{2,1,1}或{1,1,1,1},需要在
Figure GDA0003214732080000131
中找到相应符合映射条件等级的排列靠前(即对应已使用变长编码使用次数在相同嵌入等级中个数多)的已使用变长编码,将其相应的嵌入等级提升。进而按照统计相应的数据嵌入增加值与ki,j=3回退可能减少的数据嵌入量进行比较,确定是否回退或如何回退达到更大的数据嵌入量。此外,根据构建初步映射关系原则,ki,j=1(1≤j≤pi)回退将无法提高数据嵌入容量,因此只有ki,j≥2(1≤j≤pi)需要判定回退是否能够提高数据嵌入容量,而且回退过程需要按ki,j大小从小到大逐渐回退。精细调整映射关系的具体步骤为:
步骤1从小到大排序
Figure GDA0003214732080000132
按此顺序找到第一个满足ki,j≥2;
步骤2ki,j回退1个嵌入等级,
Figure GDA0003214732080000133
的出现次数即为回退前后的数据嵌入容量,然后再根据相应需提升嵌入级别的已使用编码组合中各编码使用次数计算相应的数据嵌入容量。若回退后所有可能组合的嵌入容量值均小于ki,j回退前后的嵌入容量变换值
Figure GDA0003214732080000134
则不回退,若此时j=1表明精细调整已完成,j≠1则将j值自减1得到新的ki,j返回步骤2进行判定;反之,从各种不同提升嵌入等级组合中找到嵌入容量最大的组合回退ki,j并提升相应的已使用编码嵌入等级建立新的映射关系,更新
Figure GDA0003214732080000135
中的大小排序,返回步骤1继续进行精细调整。
为了进一步提高数据嵌入容量,可以通过允许低组未使用编码向高组已使用编码映射来进一步增大数据嵌入量,同时还能够降低一定的JPEG文件数据量。由于162个变长编码对应的哈夫曼编码码长从2到16不等,相应的变长编码个数依次为2、1、3、3、2、4、3、5、5、4、4、0、0、1、125,哈夫曼码长大多都是16位,若哈夫曼码长为15位的1个变长编码未使用,可直接并入C16组进行映射,而由于不存在哈夫曼码长为13或14位的变长编码,一般情况下码长16位对应的变长编码统计个数值也相对较低,未使用变长编码个数比较多,而且在不允许高组未使用编码向低组已使用编码映射情况下,用低组未使用编码向C16已使用编码映射一般无法取得更高的嵌入容量,因此约束低组未使用编码最高向C12已使用编码进行映射。若允许低组未使用编码向高组已使用编码映射,对于存在未使用变长编码的低组Ci,统计该组变长编码的最大使用次数,找到存在其中变长编码使用次数大于Ci最大使用次数的高组Cj(i<j<13,Cj可能不止一组),以不允许高组未使用编码向低组已使用编码映射为约束条件,例如,质量因子为60的JPEG图像F16,C10中的5个变长编码出现次数从高到低依次为{38、33、18、10、0},C11中的4个变长编码出现次数从高到低依次为{49、48、19、0}。若C10内部建立映射关系,则可嵌入38比特数据,若C11内部建立映射关系,则可嵌入49比特数据,共嵌入87比特数据。若将C10与C11结合起来,在允许C10未使用编码向C11组已使用编码映射且不允许C11未使用编码向C10组已使用编码映射的条件下,按照以上设计原则则可嵌入97比特数据,增大12比特数据嵌入量,同时还可能降低JPEG图像24比特数据量。
请参阅图5,进一步的,除了可以在DICOM头文件文件中“虚构所述隐私数据”后,还包括步骤:采用第一密钥对所述隐私数据进行加密;采用第二密钥按8×8图像块特定随机顺序嵌入加密后的隐私数据;采用第三密钥对加密后的隐私数据生成信息完整性校验码作为数字指纹信息,并将所述数字指纹信息存入JPEG头文件用户定义区。由于JPEG标准是开放的,而此类方法利用的JPEG文件结构冗余来实现可逆信息隐藏,构建的映射关系是透明的,虽然载密JPEG图像与原JPEG图像之间完全无失真,但攻击者可以通过解析载密JPEG图像数据流发现其中嵌入了秘密信息,并且有可能消除嵌入秘密信息并将伪造数据嵌入其中,故通过以上方法可提高数据的安全性,大大保护用户的隐私。其中第一密钥、第二密钥和第三密钥仅由收发双方享有。
请参阅图6,数据接收端获取处理后的JPEG眼底图象,首先解析处理后眼底图象JPEG数据流,根据哈夫曼表定义段包含的映射关系可直接从熵编码数据流中提取出其中嵌入的隐私数据并恢复原熵编码数据流,将哈夫曼表定义段数据流修改恢复与其他段数据流重组即可得到原JPEG眼底图象。
需要说明的是,尽管在本文中已经对上述各实施例进行了描述,但并非因此限制本发明的专利保护范围。因此,基于本发明的创新理念,对本文所述实施例进行的变更和修改,或利用本发明说明书及附图内容所作的等效结构或等效流程变换,直接或间接地将以上技术方案运用在其他相关的技术领域,均包括在本发明的专利保护范围之内。

Claims (3)

1.一种远程眼底筛查和健康大数据系统中的隐私保护方法,其特征在于,包括步骤:
解析待传输的文件获取目标数据,所述目标数据包括:隐私数据和JPEG格式眼底图像;
在所述JPEG格式眼底图像中的哈夫曼表定义段中,找到JPEG标准对量化后的交流系数定义了162个变长编码与行程编码之间的对应关系;
根据哈夫曼表定义段变长编码定义统计JPEG数据流中的熵编码数据流中已使用变长编码使用次数和未使用变长编码;
建立已使用变长编码和未使用变长编码的映射关系,根据所述映射关系修改所述哈夫曼表定义段;
根据嵌入数据修改所述JPEG数据流中的熵编码数据流实现所述隐私数据嵌入;
重组修改后的哈夫曼表定义段数据流、熵编码数据流与其它段未修改数据流得到处理后的JPEG图像;
所述“建立已使用变长编码和未使用变长编码的映射关系,根据所述映射关系修改哈夫曼表定义段”,还包括步骤:
变长编码根据其长度可分成16组{C1,…,C16},
Figure FDA0003214732070000012
Ci可进一步分类成已使用的Ci (u)和未使用的Ci (n),Ci (u)与Ci (n)之间通过快速映射方法构建映射关系;
根据映射关系,将哈夫曼表定义段中Ci (n)中的变长编码对应的行程编码修改成与其建立映射的Ci (u)中的特定已使用变长编码的行程编码;
所述快速映射法包括以下步骤:
a.在建立映射关系之前将该组pi个已使用变长编码按照统计次数从大到小进行排序,设排序结果为
Figure FDA0003214732070000011
b.按照变长编码使用次数从大到小的顺序按可映射的最大未使用变长编码个数依次建立初始映射关系,为了便于嵌入二进制数据,与已使用变长编码建立映射关系的未使用变长编码的个数必为(2l-1),由于相同长度的边长编码最大为125,所以参数l取值为1≤l≤7,具体过程可描述为,初始化未映射Ci (n)个数为qi,1=qi,对于
Figure FDA0003214732070000021
Figure FDA0003214732070000022
Figure FDA0003214732070000023
将与
Figure FDA0003214732070000024
个未使用变长编码建立初步映射关系,
Figure FDA0003214732070000025
对于
Figure FDA0003214732070000026
Figure FDA0003214732070000027
Figure FDA0003214732070000028
将与
Figure FDA0003214732070000029
个未使用变长编码建立初步映射关系,
Figure FDA00032147320700000210
对于
Figure FDA00032147320700000211
Figure FDA00032147320700000212
Figure FDA00032147320700000213
将与
Figure FDA00032147320700000214
个未使用变长编码建立初步映射关系,
Figure FDA00032147320700000215
构建初步映射关系直至所有已使用变长编码已建立映射关系或所有未使用编码已建立映射关系为止;
c.构建初步映射关系后,Ci (u)中各变长编码对应嵌入级别依次为
Figure FDA00032147320700000216
满足
Figure FDA00032147320700000217
若ki,j=0(1≤j≤pi)表明
Figure FDA00032147320700000218
在初步映射中未建立映射关系,构建的初步映射关系需要经过精细调整实现最优映射从而达到最大数据嵌入容量;
映射精细调整方法包括以下步骤:
a1.从小到大排序
Figure FDA00032147320700000219
按此顺序找到第一个满足ki,j≥2;
b1.ki,j回退1个嵌入等级,
Figure FDA00032147320700000220
的出现次数即为回退前后的数据嵌入容量,根据相应需提升嵌入级别的已使用编码组合中各编码使用次数计算相应的数据嵌入容量,若回退后所有可能组合的嵌入容量值均小于ki,j回退前后的嵌入容量变换值
Figure FDA00032147320700000221
则不回退,若此时j=1表明精细调整已完成,j≠1则将j值自减1得到新的ki,j返回步骤b进行判定;反之,从各种不同提升嵌入等级组合中找到嵌入容量最大的组合回退ki,j并提升相应的已使用编码嵌入等级建立新的映射关系,更新
Figure FDA00032147320700000222
中的大小排序,返回步骤a1继续进行精细调整;
所述“根据嵌入数据修改所述JPEG数据流中的熵编码数据流实现所述隐私数据嵌入”,还包括步骤:
根据映射关系,将熵编码数据流中Ci (u)中的特定已使用变长编码的哈夫曼编码根据嵌入数据修改成与其建立映射关系的Ci (n)中某个特定未使用变长编码对应的哈夫曼编码或保持不变,完成所述隐私数据嵌入。
2.根据权利要求1所述的一种远程眼底筛查和健康大数据系统中的隐私保护方法,其特征在于,
所述“修改所述JPEG数据中的熵编码数据流实现所述隐私数据嵌入”,包括步骤:
嵌入前采用第一密钥对所述隐私数据进行加密;
嵌入过程中采用第二密钥按8×8图像块特定随机顺序嵌入加密后的所述隐私数据;
采用第三密钥对加密后的所述隐私数据生成信息完整性校验码作为数字指纹信息,并将所述数字指纹信息存入JPEG头文件用户定义区。
3.根据权利要求1所述的一种远程眼底筛查和健康大数据系统中的隐私保护方法,其特征在于,还包括步骤:
所述待传输的文件如果采用DICOM标准传输与存储,则在DICOM头文件中虚构隐私数据。
CN201811382918.1A 2018-11-20 2018-11-20 一种远程眼底筛查和健康大数据系统中的隐私保护方法 Active CN111200733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811382918.1A CN111200733B (zh) 2018-11-20 2018-11-20 一种远程眼底筛查和健康大数据系统中的隐私保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811382918.1A CN111200733B (zh) 2018-11-20 2018-11-20 一种远程眼底筛查和健康大数据系统中的隐私保护方法

Publications (2)

Publication Number Publication Date
CN111200733A CN111200733A (zh) 2020-05-26
CN111200733B true CN111200733B (zh) 2021-10-26

Family

ID=70747429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811382918.1A Active CN111200733B (zh) 2018-11-20 2018-11-20 一种远程眼底筛查和健康大数据系统中的隐私保护方法

Country Status (1)

Country Link
CN (1) CN111200733B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010133763A1 (en) * 2009-05-19 2010-11-25 Nokia Corporation Method for variable length coding and apparatus
CN101951520A (zh) * 2010-10-21 2011-01-19 上海交通大学 自适应h.264压缩域视频水印嵌入与提取方法
CN102685500A (zh) * 2012-05-08 2012-09-19 合肥工业大学 基于信息变长分组结构的h.264大容量信息隐藏方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3614784B2 (ja) * 2001-02-01 2005-01-26 松下電器産業株式会社 情報埋め込み装置、情報埋め込み方法、情報取り出し装置、および情報取り出し方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010133763A1 (en) * 2009-05-19 2010-11-25 Nokia Corporation Method for variable length coding and apparatus
CN101951520A (zh) * 2010-10-21 2011-01-19 上海交通大学 自适应h.264压缩域视频水印嵌入与提取方法
CN102685500A (zh) * 2012-05-08 2012-09-19 合肥工业大学 基于信息变长分组结构的h.264大容量信息隐藏方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
数字视频水印嵌入和抽取算法研究;王好贤;《万方数据库》;20130320;全文 *

Also Published As

Publication number Publication date
CN111200733A (zh) 2020-05-26

Similar Documents

Publication Publication Date Title
Swaraja et al. An optimized blind dual medical image watermarking framework for tamper localization and content authentication in secured telemedicine
Magdy et al. Security of medical images for telemedicine: a systematic review
Doss et al. Memetic optimization with cryptographic encryption for secure medical data transmission in IoT-based distributed systems
Usman et al. Using image steganography for providing enhanced medical data security
Peng et al. Secure and traceable image transmission scheme based on semitensor product compressed sensing in telemedicine system
Pandey et al. Secret data transmission using advanced steganography and image compression
Janet et al. Lossless compression techniques for medical images in telemedicine
CN111200733B (zh) 一种远程眼底筛查和健康大数据系统中的隐私保护方法
Rawat et al. Natural share-based lightweight (n, n) single secret image sharing scheme using LSB stuffing for medical images
Madhushree et al. An exhaustive review of authentication, tamper detection with localization and recovery techniques for medical images
Verma et al. A ‘Divide and Embed’approach in a robust crypto-watermarking technique for enhancing the embedding capacity
Sahu et al. An innovative approach to integrate unequal protection-based steganography and progressive transmission of physiological data
CN110473622B (zh) 信息处理方法及装置、电子设备及存储介质
CN115914488A (zh) 医学图像身份混淆共享方法、系统、终端设备及存储介质
Zhang et al. Multimedia healthcare cloud personal archives security system based on compressed sensing and multi-image encryption
Bourbakis et al. Security and privacy in biomedical telemetry: Mobile health platform for secure information exchange
Haddad Protection of encrypted and/or compressed medical images by means of watermarking
Abdulsalam et al. Securing electronic health system using crystographic technique
Sharma et al. Medical imaging security and forensics: a systematic literature review
Vidya et al. Affirmation of electronic patient record through bio-electric signal for medical data encryption authenticity
Umamageswari et al. Enhancing security in medical image informatics using geometrical attacks
OKEDIRAN A security scheme for patient information Privacy in digital medical imaging
Eranki et al. Consultation of orthopaedics cases using multimedia messaging services
Kumari et al. Two stage secure medical data transmission for iot based e-health application
Rubio et al. Introducing keytagging, a novel technique for the protection of medical image-based tests

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant