CN107256364B - 一种基于加密文档基因追踪方法 - Google Patents

一种基于加密文档基因追踪方法 Download PDF

Info

Publication number
CN107256364B
CN107256364B CN201710499579.4A CN201710499579A CN107256364B CN 107256364 B CN107256364 B CN 107256364B CN 201710499579 A CN201710499579 A CN 201710499579A CN 107256364 B CN107256364 B CN 107256364B
Authority
CN
China
Prior art keywords
code
encoded
document
point
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710499579.4A
Other languages
English (en)
Other versions
CN107256364A (zh
Inventor
徐飞
郭选陵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Focus Technology Co Ltd
Original Assignee
Focus Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Focus Technology Co Ltd filed Critical Focus Technology Co Ltd
Priority to CN201710499579.4A priority Critical patent/CN107256364B/zh
Publication of CN107256364A publication Critical patent/CN107256364A/zh
Application granted granted Critical
Publication of CN107256364B publication Critical patent/CN107256364B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Document Processing Apparatus (AREA)
  • Facsimile Transmission Control (AREA)

Abstract

一种基于加密文档基因追踪方法,包括如下步骤:1)通过编码规则将获取机器序列号和当前登录用户信息,进行编码,定位四点坐标,由四个坐标点构成矩形;2)对四个坐标点的数字或/和字符进行编码,转换时把数字的个数转成二进制;设定统一标志位0001代表数字编码,0010为字符编码,3)对字符进行编码,字符编码时将每一组转成11bits的二进制:设定统一标志位0010,0010代表字符编码;4)生成补齐码;5)生成加密图片,根据打印文档的尺寸自动缩放比例,初始化图片位置,将四个坐标原点固定在相对位置上,保持正方形状态;6)对数据码进行分组,进行纠错;7)结构化数据定位。

Description

一种基于加密文档基因追踪方法
技术领域
本发明一种基于加密文档基因追踪方法,针对公司、机关加密文档输出,追踪到具体来源与暗码识别。
背景技术
随着发展公司产生许多重要的对外和对内的文件,若加密文件一旦流出,我们可以找到流出来源,所以需要通过一种加密文档基因来追踪所泄露出的来源。
国内现有的加密文档基因追踪方法,特别是针对企业级,文档基因追踪方面,只能针对文档的修改来比对或者针对文档进行加密,无法追踪到文档的来源,所以在安全性方面比较低下,比如:
中国专利201110005756.1,给出了一种加密文档唯一标识的生成和更新的方法,所述方法通过将文档进行分段,并计算保存文档每一分段对应的哈希值,在文档修改后再次对文档进行分段,并计算文档每一分段对应的哈希值,通过比较修改前后的各分段的哈希值是否发生变化,获得文档的修改比例,根据该修改比例确定是否生成新的加密文档唯一标识。该方法解决了文件修改后造成的多个文档的标识相同但内容不同的问题。该方法属于文档修改前后进行对比,识别出文档是否被修改过,无法对文档进行加密并追踪到来源。
中国专利200910235692.7,提出的方法包括:提供了一种文档安全控制方法、装置和系统,其中,该方法包括:应用代理获取待加密文档,并根据待加密文档,生成加密文档;应用代理将加密文档的密钥保存至文档安全服务器,并将加密文档传送至应用系统。本发明通过应用代理在获取待加密文档时,自动对文档进行加密,实现了加密过程的自动化、透明化。该方法主要解决在服务器中对文档进行加密和解密获取,无法针对加密后的文档进行追踪来源。
发明内容
发明目的:为解决企业内部加密文档输出,追踪到具体来源与暗码识别。本发明提供的任何形式文档输出方法,在公司内部以及外部归档文件和机密文章具有明显作用。
本发明的技术方案是,一种基于加密文档基因追踪方法,其特征在于:包括如下步骤:
1)通过编码规则将获取加密文档的机器序列号和当前登录用户信息,进行编码,定位四点坐标,由四个坐标点构成矩形;
所述定位四个坐标点,根据页面的左上角为原点计算,X轴和Y轴各减去页面长度的四分之一,确定为第一个点,Y轴减去四分之三,确定第二个点,X轴减去页面高度的四分之三,确定为第三个点,以第三个点的Y轴减去页面长度的四分之三,确定为第四个点。
2)对四个坐标点的数字或/和字符进行编码,例如:012 345 67转换为二进制是:
012转成0000001100;
345转成0101011001;
67转成1000011。
转换合格式后:0000001100 0101011001 1000011
转换时把数字的个数转成二进制:0-8为9个数字,二进制是0000、0001、0010、0011、 0100、0101、0110、0111、1000;
设定统一标志位0001代表数字编码,0010为字符编码,
整合后为:0001 0000001000 0000001100 0101011001 1000011;
3)对字符进行编码,字符编码,例如:AC-42
转换后的索引(10,12,41,4,2),分组规则:(10,12)(41,4)(2)
把每一组转成11bits的二进制:
(10,12)10*45+12等于462转成00111001110
(41,4)41*45+4等于1849转成11100111001
(2)等于2转成000010
整合后:00111001110 11100111001 000010
把字符的个数转成二进制:共5个字符,转成000000101
设定统一标志位0010,0010代表字符编码。
整合后为:0010 000000101 00111001110 11100111001 000010
4)生成补齐码,当没有达到我们最大的bits数的限制,还要加一些补齐码,补齐码设置二进制为11101100 00010001,这两个二进制转成十进制是236和17,每一种纠错级别的最大限制,其最大需要104个bits,目前只有80个bits,所以,还需要24个bits,也就是需要3个补齐码,添加三个,于是得到下面的编码:
00100000 01011011 00001011 01111000 11010001 01110010 1101110001001101 01000011 01000000 11101100 00010001 11101100
5)生成加密图片,根据打印文档的尺寸自动缩放比例,初始化图片位置,将四个坐标原点固定在相对位置上,保持正方形状态;
所述定位四个坐标点,根据页面的左上角为原点计算,X轴和Y轴各减去页面长度的四分之一,确定为第一个点,Y轴减去四分之三,确定第二个点,X轴减去页面高度的四分之三,确定为第三个点,以第三个点的Y轴减去页面长度的四分之三,确定为第四个点。
6)对数据码进行分组,进行纠错,分成不同的Block,对各个Block进行纠错编码,需要4个Blocks(2个Blocks为一组,共两组),头一组的两个Blocks中各15个bits 数据+各9个bits的纠错码;
7)结构化数据定位,黑白的区域被指定为固定的位置,称为查询图形和定位图形,寻像图形和定位图形将解码程序确定图形中具体符号的坐标;
蓝色的区域用来保存被编码的数据内容以及纠错信息码;
绿色的区域,用来标识纠错的级别,这个区域为格式化信息。
有益效果:本发明能够解决企业内部加密文档输出,通过加密文档的编码和结构化数据定位,黑白的区域被指定为固定的位置,称为查询图形和定位图形,寻像图形和定位图形将解码程序确定图形中具体符号的坐标。追踪到具体来源与暗码识别。本发明提供的任何形式文档输出方法,在公司内部以及外部归档文件和机密文章具有显著效果。
附图说明
图1为本发明方法的实施流程图。
图2为构化数据定位的颜色表示示意图。
具体实施方式
本发明一种基于加密文档基因追踪方法:包括如下步骤:
(1)通过编码规则将获取机器序列号和当前登录用户信息,进行编码,定位四点坐标,由四个坐标点构成矩形。
(2)通过数字与字符编码器,转换为二进制数,例如:012 345 67转换为二进制是:
012转成0000001100;
345转成0101011001;
67转成1000011。
整合格式后:0000001100 0101011001 1000011
把数字的个数转成二进制:0-7为8个数字,二进制是0000001000
设定统一标志位0001代表数字编码,0010为字符编码,
整合后为:0001 0000001000 0000001100 0101011001 1000011。
(3)对字符进行转码,通过字符转码器,例如:AC-42
转换后的索引(10,12,41,4,2),分组规则:(10,12)(41,4)(2)
把每一组转成11bits的二进制:
(10,12)10*45+12等于462转成00111001110
(41,4)41*45+4等于1849转成11100111001
(2)等于2转成000010
整合后:00111001110 11100111001 000010
把字符的个数转成二进制:共5个字符,转成000000101
设定统一标志位0010,0010代表字符编码。
整合后为:0010 000000101 00111001110 11100111001 000010
(4)通过补齐码编译器,生成补齐码,当没有达到我们最大的bits数的限制,还要加一些补齐码,设置二进制为11101100 00010001,这两个二进制转成十进制是236和17,每一种纠错级别的最大限制,其最大需要104个bits,目前只有80个bits,所以,还需要24个bits,也就是需要3个补齐码,添加三个,于是得到下面的编码:
00100000 01011011 00001011 01111000 11010001 01110010 1101110001001101 01000011 01000000 11101100 00010001 11101100
(4)生成加密图片,根据打印文档的尺寸自动缩放比例,初始化图片位置,将四个坐标原点固定在相对位置上,保持正方形状态;
(5)对数据码进行分组,进行纠错,分成不同的Block,对各个Block进行纠错编码,需要4个Blocks(2个Blocks为一组,共两组),头一组的两个Blocks中各15个 bits数据+各9个bits的纠错码;
(6)生成格式信息,定位10bits格式信息编码,其中包含:
前2个bits用于表示错误异常信息,3个bits表示使用什么样的Mask
5个纠错bits。
将10个bits与1000010010做XOR操作,增加的扫描器的图像识别。
结合数据量、字符类型和纠错级别,均设有相对应的最多输入字符数。当增加数据量,则需要使用更多的码元来组成,校验码就会变得更大。
根据环境、编码尺寸等因素后设置不同的级别。当纸张内容较多时选择Q或H,且数据量较多的时候,也可以选择级别L。一般情况下用户大多选择级别M(15%)。
级别定义如下:
level L:最大7%的错误能够被纠正;
level M:最大15%的错误能够被纠正;
level Q:最大25%的错误能够被纠正;
level H:最大30%的错误能够被纠正;
(6)结构化数据定位
黑白的区域被指定为固定的位置,称为查询图形和定位图形,寻像图形和定位图形将解码程序确定图形中具体符号的坐标。(见图2)
蓝色的区域用来保存被编码的数据内容以及纠错信息码。
绿色的区域,用来标识纠错的级别,这个区域为格式化信息。

Claims (1)

1.一种基于加密文档基因追踪方法,其特征在于:包括如下步骤:
1)通过编码规则将获取加密文档的机器序列号和当前登录用户信息,进行编码,定位四点坐标,由四个坐标点构成矩形;
所述定位四个坐标点,根据页面的左上角为原点计算,X轴和Y轴各减去页面长度的四分之一,确定为第一个点,Y轴减去四分之三,确定第二个点,X轴减去页面高度的四分之三,确定为第三个点,以第三个点的Y轴减去页面长度的四分之三,确定为第四个点;
2) 对四个坐标点的数字进行编码,转换时把数字的个数转成二进制;
设定统一标志位0001代表数字编码,0010为字符编码,
3)对字符进行编码,字符编码时将每一组转成11bits的二进制;
4)生成补齐码,当没有达到最大的bits数的限制,还要加一些补齐码;设置二进制为11101100、00010001,这两个二进制转成十进制分别是236和17,每一种纠错级别的最大限制,最大需要104个bits;
5)生成加密图片,根据打印文档的尺寸自动缩放比例,初始化图片位置,将四个坐标原点固定在相对位置上,保持矩形状态;
6) 对上述编码进行分组,进行纠错, 分成不同的Block,对各个Block进行纠错编码,需要4个Blocks,2个Blocks为一组,共两组;头一组的两个Blocks中各15个bits数据加各 9个bits的纠错码;
7)结构化数据定位:
黑白的区域被指定为固定的位置,称为查询图形和定位图形,寻像图形和定位图形将解码程序确定图形中具体符号的坐标;
蓝色的区域用来保存被编码的数据内容以及纠错信息码;
绿色的区域,用来标识纠错的级别,这个区域为格式化信息;
通过扫描文档中生成的暗码信息,获取出对应的机器序列号和机器名,
扫描文档暗码信息时,将图像转换为二进制代码,再由二进制代码转换为信息内容。
CN201710499579.4A 2017-06-27 2017-06-27 一种基于加密文档基因追踪方法 Active CN107256364B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710499579.4A CN107256364B (zh) 2017-06-27 2017-06-27 一种基于加密文档基因追踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710499579.4A CN107256364B (zh) 2017-06-27 2017-06-27 一种基于加密文档基因追踪方法

Publications (2)

Publication Number Publication Date
CN107256364A CN107256364A (zh) 2017-10-17
CN107256364B true CN107256364B (zh) 2018-07-24

Family

ID=60023820

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710499579.4A Active CN107256364B (zh) 2017-06-27 2017-06-27 一种基于加密文档基因追踪方法

Country Status (1)

Country Link
CN (1) CN107256364B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109240705A (zh) * 2018-11-01 2019-01-18 广东工业大学 一种将上位机智能算法下移至plc的方法、系统及plc装置
CN112700819B (zh) * 2020-12-31 2021-11-30 云舟生物科技(广州)有限公司 基因序列的处理方法、计算机存储介质及电子设备
CN116433454B (zh) * 2023-06-12 2023-09-01 北京和人广智科技有限公司 基于微变字的文档水印嵌入方法、装置及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100364326C (zh) * 2005-12-01 2008-01-23 北京北大方正电子有限公司 一种在文本文档中嵌入及检测数字水印的方法和装置
CN101178763A (zh) * 2007-12-12 2008-05-14 北京航空航天大学 一种公文加密和解密方法
CN102073824B (zh) * 2011-01-12 2014-06-04 深圳昂楷科技有限公司 一种加密文档唯一标识的生成和更新的方法
CN103914639A (zh) * 2014-04-02 2014-07-09 北京中软冠群软件技术有限公司 一种文档追踪方法及装置

Also Published As

Publication number Publication date
CN107256364A (zh) 2017-10-17

Similar Documents

Publication Publication Date Title
Cheng et al. Improved visual secret sharing scheme for QR code applications
WO2018137602A1 (zh) 复合型二维码的生成、识读方法及装置
CN101540823B (zh) 图像处理装置、图像处理系统和图像处理方法
CN107256364B (zh) 一种基于加密文档基因追踪方法
US7240209B2 (en) Methods of invisibly embedding and hiding data into soft-copy text documents
EP1340188B1 (en) Method of encoding a handwritten signature
Abdullah et al. New approaches to encrypt and decrypt data in image using cryptography and steganography algorithm
CN108090329A (zh) 一种对文本内容进行数字水印加密保护的方法及装置
CN104301309A (zh) 基于条码传真识别技术的跨物理隔离网络数据交换系统
KR100855668B1 (ko) 화상처리장치 및 그 제어방법과, 컴퓨터 판독가능한기억매체
Lin et al. A new steganography method for dynamic GIF images based on palette sort
Lu et al. An effective maximum distortion controlling technology in the dual-image-based reversible data hiding scheme
CN108718232A (zh) 基于aes和混沌的图像加密方法
CN114065148A (zh) 基于区块链的涉密文档安全管理与泄露追责方法
CN102142073A (zh) 基于隐密水印的纸质文档防泄密及其鉴别系统
CN115883744B (zh) 一种基于分数阶混沌映射的水印方法、装置和存储介质
Yi et al. Adaptive code embedding for reversible data hiding in encrypted images
Kuo et al. Secure multi-group data hiding based on gemd map
Alaqeel et al. Developing a performance-based tool for arabic text steganography
CN113297613A (zh) 密钥存取方法、密钥处理装置、设备及计算机存储介质
CN101178763A (zh) 一种公文加密和解密方法
Shrivastava et al. A modified approach of key manipulation in cryptography using 2d graphics image
Dong et al. Reversible binary image watermarking method using overlapping pattern substitution
Sethi et al. Steganography Technique with Huffman Code
RU2777708C2 (ru) Способ кодирования цифровой информации в виде многомерного нанобар-кода

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant