CN103646388A - 基于按列拼接的条状规则碎纸片拼接方法 - Google Patents

基于按列拼接的条状规则碎纸片拼接方法 Download PDF

Info

Publication number
CN103646388A
CN103646388A CN201310743272.6A CN201310743272A CN103646388A CN 103646388 A CN103646388 A CN 103646388A CN 201310743272 A CN201310743272 A CN 201310743272A CN 103646388 A CN103646388 A CN 103646388A
Authority
CN
China
Prior art keywords
matrix
row
gray
splicing
scrap
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310743272.6A
Other languages
English (en)
Inventor
曹培培
杜文彬
于龙洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN201310743272.6A priority Critical patent/CN103646388A/zh
Publication of CN103646388A publication Critical patent/CN103646388A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供的基于按列拼接的条状规则碎纸片拼接方法,将条状规则碎纸片拍照,提取图像,并对碎纸片图像进行编号;用Matlab按顺序提取出各个碎纸片图像的灰度矩阵gi(i=1,…,n),取每个碎纸片图像的灰度矩阵gi的第一列和最后一列的灰度值并按顺序组成包含所有碎纸片图像边缘的灰度矩阵G;用SPSS软件对步骤2中所述的灰度矩阵G做Pearson相关系数分析,建立一个相关系数矩阵R;求取相关系数矩阵R中每一列的最大值;根据相关系数矩阵R中的每一列的最大值反求出其图像编号对图片进行接,本方法,按列拼接模型十分精确,边缘连接考虑非常全面;通过对条状碎纸进行图像的数字化处理和自动拼接过程使得被破坏的文本信息得以恢复。

Description

基于按列拼接的条状规则碎纸片拼接方法
技术领域
本发明属于图像处理以及信息复原技术领域,具体涉及一种基于按列拼接的条状规则碎纸片拼接方法。
背景技术
破碎文件拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。当代社会中,碎纸机被广泛应用,它将废弃文件粉碎为规则条状纸片。然而,在某些情况下,可能错将重要的公司文件当做废弃文件处理成碎片,丢弃可能会遭到犯罪分子的利用以造成无法估量的损失,故又需要将已经被破碎的文本信息重新恢复。
本发明将碎纸片拼接转化为基于边缘字迹断线识别法的图像拼接。这种拼接技术可以应用到计算机视觉、模式识别、生物医学等各个领域,故研究碎纸片拼接及其相关技术有着重要的意义。
发明内容
本发明的目的是提供一种纸质条状规则碎片拼接方法,以解决按列剪切的已被破碎的文件的恢复问题。它基于图像拼接的碎纸片复原,通过借助计算机编程进行信息处理,将相邻的碎纸片边缘进行连接。
本发明所采用的技术方案是:.基于按列拼接的条状规则碎纸片拼接方法,具体按照以下步骤实施:
步骤1、将条状规则碎纸片拍照,提取图像,并对碎纸片图像进行编号,记为1,2,…3,n;
步骤2、用Matlab按顺序提取出各个碎纸片图像的灰度矩阵gi(i=1,…,n),取每个碎纸片图像的灰度矩阵gi的第一列和最后一列的灰度值并按顺序组成包含所有碎纸片图像边缘的灰度矩阵G;
步骤3、用SPSS软件对步骤2中所述的灰度矩阵G做Pearson相关系数分析,建立一个相关系数矩阵R;
步骤4、求取相关系数矩阵R中每一列的最大值;
步骤5、根据相关系数矩阵R中的每一列的最大值反求出其图像编号,对图片进行拼接。
本发明特点还在于,
步骤2中的灰度矩阵gi和灰度矩阵G中的元素为图像的灰度值,其颜色深度的范围为0到225,黑色为0,白色为225,gi为n阶方阵,灰度矩阵G为2n阶方阵。
建立相关度系数矩阵R具体按照以下步骤实施:
在SPSS软件系统中,若随机变量X、Y的联合分布是二维是正态分布,xi和yi分别为n次独立观测值,则计算相关系数r定义为以下公式:
r = Σ i = 1 n ( x i - x ‾ ) ( y i - y ‾ ) Σ i = 1 n ( x i - x ‾ ) 2 Σ i = 1 n ( y i - y ‾ ) 2
其中 x ‾ = 1 n Σ i = 1 n x i , y ‾ = 1 n Σ i = 1 n y i ;
得到相关系数矩阵R=(rij)(i,j=1,2,3,…,2n),rij即为灰度矩阵中G中第i列与第j列灰度值的相关系数。
求取相关系数矩阵R中每一列的最大值分别为: M i 1 = max 1 ≤ i ≤ 2 n { r i 1 } , M i 2 = max 1 ≤ i ≤ 2 n { r i 2 },······, M i 2 n = max 1 ≤ i ≤ 2 n , 共2n个。
根据相关系数矩阵R中的每一列的最大值反求出其图像编号对图片进行拼接,具体按照以下步骤实施:
步骤5.1、取任意一列的最大值Mij,按照其下标i和j反求其对应的图像编号,2n阶方阵灰度矩阵G是由n个n阶方阵灰度矩阵gi的第一列和最后一列顺序组成,故求取图像编号的表达式为:
Figure BDA0000448315170000031
Figure BDA0000448315170000032
若i或j为奇数,则代表某纸片的左边缘;若i或j为偶数,则代表某纸片的右边缘,将i对应的图像编号与j对应的图像编号相拼接;
步骤5.2、按照步骤5.1根据每一列的相关系数最大值,并反求出其下标所对应的图像编号进行拼接,即可完成拼接。
本发明的有益效果是:
1、按列拼接模型十分精确,边缘连接考虑非常全面。
4、操作简单,辅助工具较少。
5、对图像的灰度矩阵及相关系数计算均为Matlab计算,程序较为简洁,运行速度快捷。
6、一台普通的个人计算机即可对所述的图像文件进行处理使已被破碎的文本信息恢复原样。
7、软件拼接后可自由添加人工干预拼接过程,使拼接更加准确高效。
附图说明
图1是本发明基于按列拼接的条状规则碎纸片拼接方法的步骤流程图。
具体实施方式
下面结合附图及实施例对本发明作进一步说明:
本发明提供一种基于按列拼接的条状规则碎纸片拼接方法,具体按照以下步骤实施:
步骤1、将条状规则碎纸片拍照,提取图像,并对碎纸片图像进行编号,记为1,2,…3,n;
步骤2、用Matlab按顺序提取出各个碎纸片图像的灰度矩阵gi(i=1,…,n),取每个碎纸片图像的灰度矩阵gi的第一列和最后一列的灰度值并按顺序组成包含所有碎纸片图像边缘的灰度矩阵G;其中,灰度矩阵gi和灰度矩阵G中的元素为图像的灰度值,其颜色深度的范围为0到225,黑色为0,白色为225,gi为n阶方阵,灰度矩阵G为2n阶方阵;
步骤3、用SPSS软件对步骤2中所述的灰度矩阵G做Pearson相关系数分析,建立一个相关系数矩阵R;具体按照以下步骤实施:
在SPSS软件系统中,若随机变量X、Y的联合分布是二维是正态分布,xi和yi分别为n次独立观测值,则计算相关系数r定义为以下公式:
r = Σ i = 1 n ( x i - x ‾ ) ( y i - y ‾ ) Σ i = 1 n ( x i - x ‾ ) 2 Σ i = 1 n ( y i - y ‾ ) 2
其中 x ‾ = 1 n Σ i = 1 n x i , y ‾ = 1 n Σ i = 1 n y i ;
得到相关系数矩阵R=(rij)(i,j=1,2,3,…,2n),rij即为灰度矩阵中G中第i列与第j列灰度值的相关系数;
步骤4、求取相关系数矩阵R中每一列的最大值;相关系数矩阵R中每一列的最大值分别为: M i 1 = max 1 ≤ i ≤ 2 n { r i 1 } , M i 2 = max 1 ≤ i ≤ 2 n { r i 2 },······, M i 2 n = max 1 ≤ i ≤ 2 n , 共2n个;
步骤5、根据相关系数矩阵R中的每一列的最大值反求出其图像编号,对图片进行拼接,具体按照以下步骤实施:
步骤5.1、取任意一列的最大值Mij,按照其下标i和j反求其对应的图像编号,2n阶方阵灰度矩阵G是由n个n阶方阵灰度矩阵gi的第一列和最后一列顺序组成,故求取图像编号的表达式为:
Figure BDA0000448315170000051
Figure BDA0000448315170000052
若i或j为奇数,则代表某纸片的左边缘;若i或j为偶数,则代表某纸片的右边缘,将i对应的图像编号与j对应的图像编号相拼接;
步骤5.2、按照步骤5.1根据每一列的相关系数最大值,并反求出其下标所对应的图像编号进行拼接,即可完成拼接。
通过以上步骤和处理过程,实现对条状规则碎纸片的数字化处理,最后使其文本信息得以恢复。
透过上述基于图像拼接的条状规则碎纸片拼接方法,能够有效恢复我国保密等级为一般销毁处理级别和部分秘密级别的文本信息,并能有效恢复德国保密等级为第一级、第二级和部分第三级级别的文本信息。而且能够有效处理办公场所常用的A4、16K、B5等纸张类型被破碎后的重新恢复、获取文本信息。通过简单的操作流程使得信息恢复变得很容易。本文运用了Matlab数字图像处理技术,采用了边缘字迹断线识别的方法对破碎纸片进行拼接。首先将图像灰度化形成边缘灰度矩阵,再利用相关系数矩阵将碎纸片连接。当碎纸片的数量不是太大,纸片内容不是很特殊的情况下,本文的方法可以适用到所有规则纸片拼接的问题。如有必要,也可尝试在司法物证复原、历史文献修复以及军事情报获取等领域进行应用。

Claims (5)

1.基于按列拼接的条状规则碎纸片拼接方法,其特征在于:具体按照以下步骤实施:
步骤1、将条状规则碎纸片拍照,提取图像,并对碎纸片图像进行编号,记为1,2,…3,n;
步骤2、用Matlab按顺序提取出各个碎纸片图像的灰度矩阵gi(i=1,…,n),取每个碎纸片图像的灰度矩阵gi的第一列和最后一列的灰度值并按顺序组成包含所有碎纸片图像边缘的灰度矩阵G;
步骤3、用SPSS软件对步骤2中所述的灰度矩阵G做Pearson相关系数分析,建立一个相关系数矩阵R;
步骤4、求取相关系数矩阵R中每一列的最大值;
步骤5、根据相关系数矩阵R中的每一列的最大值反求出其图像编号,对图片进行拼接。
2.根据权利要求1所述的基于按列拼接的条状规则碎纸片拼接方法,其特征在于:所述步骤2中的灰度矩阵gi和灰度矩阵G中的元素为图像的灰度值,其颜色深度的范围为0到225,黑色为0,白色为225,gi为n阶方阵,灰度矩阵G为2n阶方阵。
3.根据权利要求2所述的基于按列拼接的条状规则碎纸片拼接方法,其特征在于:所述建立相关度系数矩阵R具体按照以下步骤实施:
在SPSS软件系统中,若随机变量X、Y的联合分布是二维是正态分布,xi和yi分别为n次独立观测值,则计算相关系数r定义为以下公式:
r = Σ i = 1 n ( x i - x ‾ ) ( y i - y ‾ ) Σ i = 1 n ( x i - x ‾ ) 2 Σ i = 1 n ( y i - y ‾ ) 2
其中 x ‾ = 1 n Σ i = 1 n x i , y ‾ = 1 n Σ i = 1 n y i ;
得到相关系数矩阵R=(rij)(i,j=1,2,3,…,2n),rij即为灰度矩阵中G中第i列与第j列灰度值的相关系数。
4.根据权利要求3所述的基于按列拼接的条状规则碎纸片拼接方法,其特征在于:所述求取相关系数矩阵R中每一列的最大值分别为: M i 1 = max 1 ≤ i ≤ 2 n { r i 1 } , M i 2 = max 1 ≤ i ≤ 2 n { r i 2 },······, M i 2 n = max 1 ≤ i ≤ 2 n , 共2n个。
5.根据权利要求4所述的基于按列拼接的条状规则碎纸片拼接方法,其特征在于:所述根据相关系数矩阵R中的每一列的最大值反求出其图像编号对图片进行拼接,具体按照以下步骤实施:
步骤5.1、取任意一列的最大值Mij,按照其下标i和j反求其对应的图像编号,2n阶方阵灰度矩阵G是由n个n阶方阵灰度矩阵gi的第一列和最后一列顺序组成,故求取图像编号的表达式为:
Figure FDA0000448315160000024
Figure FDA0000448315160000025
若i或j为奇数,则代表某纸片的左边缘;若i或j为偶数,则代表某纸片的右边缘,将i对应的图像编号与j对应的图像编号相拼接;
步骤5.2、按照步骤5.1根据每一列的相关系数最大值,并反求出其下标所对应的图像编号进行拼接,即可完成拼接。
CN201310743272.6A 2013-12-27 2013-12-27 基于按列拼接的条状规则碎纸片拼接方法 Pending CN103646388A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310743272.6A CN103646388A (zh) 2013-12-27 2013-12-27 基于按列拼接的条状规则碎纸片拼接方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310743272.6A CN103646388A (zh) 2013-12-27 2013-12-27 基于按列拼接的条状规则碎纸片拼接方法

Publications (1)

Publication Number Publication Date
CN103646388A true CN103646388A (zh) 2014-03-19

Family

ID=50251598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310743272.6A Pending CN103646388A (zh) 2013-12-27 2013-12-27 基于按列拼接的条状规则碎纸片拼接方法

Country Status (1)

Country Link
CN (1) CN103646388A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886570A (zh) * 2014-04-09 2014-06-25 济南大学 一种碎纸机切割的双面文档碎片拼接方法
CN103942771A (zh) * 2014-04-17 2014-07-23 济南大学 一种基于0-1规划的块状文档碎片拼接方法
CN105809623A (zh) * 2016-03-04 2016-07-27 重庆交通大学 一种碎纸片拼接复原方法
CN106952232A (zh) * 2017-03-22 2017-07-14 海南职业技术学院 一种基于蚁群算法的图文碎片恢复方法
CN108510442A (zh) * 2018-03-23 2018-09-07 中南大学 基于绝对值距离优化的单面碎纸片拼接复原方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004048773A (ja) * 2002-07-15 2004-02-12 Samsung Electronics Co Ltd 画面間の相関度を用いた画質改善回路及び方法
CN102184537A (zh) * 2011-04-22 2011-09-14 西安理工大学 基于小波变换和主成分分析的图像区域篡改检测方法
CN103020929A (zh) * 2012-11-26 2013-04-03 西安理工大学 基于文字特征的碎纸机破碎文档恢复方法
CN103295019A (zh) * 2013-05-21 2013-09-11 西安理工大学 一种基于概率统计的中文碎片自适应恢复方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004048773A (ja) * 2002-07-15 2004-02-12 Samsung Electronics Co Ltd 画面間の相関度を用いた画質改善回路及び方法
CN102184537A (zh) * 2011-04-22 2011-09-14 西安理工大学 基于小波变换和主成分分析的图像区域篡改检测方法
CN103020929A (zh) * 2012-11-26 2013-04-03 西安理工大学 基于文字特征的碎纸机破碎文档恢复方法
CN103295019A (zh) * 2013-05-21 2013-09-11 西安理工大学 一种基于概率统计的中文碎片自适应恢复方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马知也: "碎纸片的拼接复原方法研究", 《天水师范学院学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886570A (zh) * 2014-04-09 2014-06-25 济南大学 一种碎纸机切割的双面文档碎片拼接方法
CN103942771A (zh) * 2014-04-17 2014-07-23 济南大学 一种基于0-1规划的块状文档碎片拼接方法
CN105809623A (zh) * 2016-03-04 2016-07-27 重庆交通大学 一种碎纸片拼接复原方法
CN106952232A (zh) * 2017-03-22 2017-07-14 海南职业技术学院 一种基于蚁群算法的图文碎片恢复方法
CN106952232B (zh) * 2017-03-22 2019-01-25 海南职业技术学院 一种基于蚁群算法的图文碎片恢复方法
CN108510442A (zh) * 2018-03-23 2018-09-07 中南大学 基于绝对值距离优化的单面碎纸片拼接复原方法
CN108510442B (zh) * 2018-03-23 2021-12-31 中南大学 基于绝对值距离优化的单面碎纸片拼接复原方法

Similar Documents

Publication Publication Date Title
CN103646388A (zh) 基于按列拼接的条状规则碎纸片拼接方法
CN101685464B (zh) 基于社群潜在主题挖掘的自动图像标注的方法
Qazi et al. Deep learning-based digital image forgery detection system
CN105069042A (zh) 基于内容的无人机侦察图像数据检索方法
CN103927352A (zh) 利用知识库海量关联信息的中文名片ocr数据修正系统
CN103679678A (zh) 一种矩形文字特征碎纸片的半自动拼接复原方法
CN112926379A (zh) 一种构建人脸识别模型的方法及装置
CN103324753B (zh) 基于共生稀疏直方图的图像检索方法
CN102073978B (zh) 利用不规则区域分割的数字图像认证与恢复方法及系统
Ananthi et al. A secure model on Advanced Fake Image-Feature Network (AFIFN) based on deep learning for image forgery detection
CN107239787A (zh) 一种利用多来源数据具有隐私保护功能的图象分类方法
Agarwal et al. Forensic analysis of colorized grayscale images using local binary pattern
CN101782966B (zh) 指纹图像二值化处理方法
CN106570817A (zh) 一种抗几何攻击的鲁棒可逆水印方法
CN108510442A (zh) 基于绝对值距离优化的单面碎纸片拼接复原方法
CN103886570A (zh) 一种碎纸机切割的双面文档碎片拼接方法
Chen Automatic text extraction, removal and inpainting of complex document images
Sun et al. The detecting system of image forgeries with noise features and EXIF information
CN107180412B (zh) 基于水平投影和k均值聚类的横纵切碎纸片重建方法
Li et al. A problem of English document fragments splicing and reconstructing based on fuzzy pattern recognition
Goldberg City in a Garden: Environmental Transformations and Racial Justice in Twentieth-Century Austin, Texas
CN117392501A (zh) 基于yolov7目标检测算法的实时违规旗帜检测方法
Horadi et al. Deep learning based Layout Equivalence Detection in Compressed Domain and analysis of different Document Image Dataset: A Systematic Study
CN107424131A (zh) 基于深度学习的图像去网格方法及装置
u Salam et al. An Appraisal on Digital Forensic and Computer Tools involved in Investigation process: The Case of Pakistan

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140319

RJ01 Rejection of invention patent application after publication