CN115525918B - 一种无纸化办公用文件的加密方法和系统 - Google Patents

一种无纸化办公用文件的加密方法和系统 Download PDF

Info

Publication number
CN115525918B
CN115525918B CN202211373234.1A CN202211373234A CN115525918B CN 115525918 B CN115525918 B CN 115525918B CN 202211373234 A CN202211373234 A CN 202211373234A CN 115525918 B CN115525918 B CN 115525918B
Authority
CN
China
Prior art keywords
content
frame
file
determining
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211373234.1A
Other languages
English (en)
Other versions
CN115525918A (zh
Inventor
王保林
周田雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Shuangren Information Technology Co ltd
Original Assignee
Shandong Shuangren Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Shuangren Information Technology Co ltd filed Critical Shandong Shuangren Information Technology Co ltd
Priority to CN202211373234.1A priority Critical patent/CN115525918B/zh
Publication of CN115525918A publication Critical patent/CN115525918A/zh
Application granted granted Critical
Publication of CN115525918B publication Critical patent/CN115525918B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2107File encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及文件加密技术领域,具体公开了一种无纸化办公用文件的加密方法和系统,所述方法包括依次查询待加密文件中各子文件的标签,根据所述标签查询对应的文件模板;遍历定位所述文件模板的编辑框和标签框,根据编辑框和标签框的位置对子文件进行切分,得到子区域;依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径;统计所有子文件的内容路径,得到待加密文件的内容图,对内容图进行加密传输。本发明将原有的压缩‑加密‑传输过程转换为了提取加密‑传输‑复原过程,在保证数据可复原的基础上,极大地降低的数据传输量,扩充了加密手段,是一种由一维向二维的突破,可以极大地提高办公效率。

Description

一种无纸化办公用文件的加密方法和系统
技术领域
本发明涉及文件加密技术领域,具体是一种无纸化办公用文件的加密方法和系统。
背景技术
日常办公中会用到大量的文件资料,并需要对这些文件资料进行处理和再加工,为了节约资源和便于文件资料的保存,无纸化办公已经成为了目前的主流办公方法。无纸化办公是指利用现代的网络技术进行办公,主要传媒工具是计算机、或是研发出的系统软件。
对于某些重要的文件,无纸化办公的风险很大,比如营销策划方案,很容易受到竞争对手的攻击,尤其在数据传输过程中,因此,需要对无纸化办公文件进行加密;现有的加密方式是,对办公文件进行压缩,在压缩的过程中进行加密(需要保证文件的可复原性);这种方式虽然可行,但是数据传输过程速度很慢,当传输量较大时,这种方式将极大地影响办公效率。如何在保证文件完整性的基础上,优化传输过程是本发明技术方案想要解决的技术问题。
发明内容
本发明的目的在于提供一种无纸化办公用文件的加密方法和系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种无纸化办公用文件的加密方法,所述方法包括:
依次查询待加密文件中各子文件的标签,根据所述标签查询对应的文件模板;
遍历定位所述文件模板的编辑框和标签框,根据编辑框和标签框的位置对子文件进行切分,得到子区域;其中,所述编辑框对应文件模板中的编辑内容;所述标签框对应文件模板中的只读内容;
依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径;
统计所有子文件的内容路径,得到待加密文件的内容图,对内容图进行加密传输。
作为本发明进一步的方案:所述编辑框中设有时间检测端口,用于获取填写时间;
在依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径的步骤中,基于内容路径读取并记录填写时间;
在对内容图进行加密传输的步骤中,根据填写时间对内容图进行加密传输。
作为本发明进一步的方案:所述遍历定位所述文件模板的编辑框和标签框,根据编辑框和标签框的位置对子文件进行切分,得到子区域的步骤包括:
遍历文件模板中的组件,获取组件信息;所述组件信息至少包括用于表征该组件是否能编辑的参数;
根据所述组件信息将各组件分为编辑框和标签框,并获取其位置信息;
根据所述位置信息在子文件中确定待识别框,基于待识别框对子文件进行识别,计算待识别框的边界的交叉点数量;
当所述交叉点数量不为零时,扩充所述待识别框直至交叉点数量为零;
根据扩充后的待识别框对子文件进行切分,得到子区域。
作为本发明进一步的方案:所述依次对子区域进行识别,确定含有内容级别的节点的步骤包括:
根据位置信息对编辑框和标签框进行聚类;
分别对同类的编辑框和标签框进行文本识别,得到编辑内容和标签内容;
根据标签内容遍历预设的内容级别库,查询对应的编辑内容的内容级别;
根据内容级别确定节点大小,根据编辑内容确定节点内容。
作为本发明进一步的方案:所述根据含有内容级别的节点确定内容路径的步骤包括:
根据所述内容级别对节点进行分层;同一内容级别的节点在同一图层;
在同一图层中,根据节点的位置关系确定中心点,基于所述中心点连接其他节点,得到以内容级别为标签的单层路径;
根据所述内容级别叠加所有单层路径,得到内容路径;其中,内容级别最高的单层路径置于最顶层;
依次计算底层节点与其上层节点之间的最小距离,当所述最小距离达到预设的阈值时,将底层节点合并至对应的上层单层路径。
作为本发明进一步的方案:所述在同一图层中,根据节点的位置关系确定中心点的步骤包括:
随机选取一个节点作为初始中心点;
根据预设的距离公式计算其他节点与初始中心点之间的距离均值;
根据所述距离均值以任意两个节点为圆心作圆,确定虚拟中心点;
根据虚拟中心点选取目标中心点,并循环执行上述步骤,直至选取的目标中心点不发生变化;
其中,所述距离公式为:
式中,J为距离,xi为第i个节点的横坐标,yi为第i个节点的纵坐标;xz为中心点的横坐标,yz为中心点的纵坐标;PT为该图层中除中心点的节点数量。
本发明技术方案还提供了一种无纸化办公用文件的加密系统,所述系统包括:
文件模板查询模块,用于依次查询待加密文件中各子文件的标签,根据所述标签查询对应的文件模板;
区域切分模块,用于遍历定位所述文件模板的编辑框和标签框,根据编辑框和标签框的位置对子文件进行切分,得到子区域;其中,所述编辑框对应文件模板中的编辑内容;所述标签框对应文件模板中的只读内容;
路径生成模块,用于依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径;
路径统计模块,用于统计所有子文件的内容路径,得到待加密文件的内容图,对内容图进行加密传输。
作为本发明进一步的方案:所述编辑框中设有时间检测端口,用于获取填写时间;
在依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径的步骤中,基于内容路径读取并记录填写时间;
在对内容图进行加密传输的步骤中,根据填写时间对内容图进行加密传输。
作为本发明进一步的方案:所述区域切分模块包括:
组件遍历单元,用于遍历文件模板中的组件,获取组件信息;所述组件信息至少包括用于表征该组件是否能编辑的参数;
组件分类单元,用于根据所述组件信息将各组件分为编辑框和标签框,并获取其位置信息;
交叉点检测单元,用于根据所述位置信息在子文件中确定待识别框,基于待识别框对子文件进行识别,计算待识别框的边界的交叉点数量;
识别框扩充单元,用于当所述交叉点数量不为零时,扩充所述待识别框直至交叉点数量为零;
切分执行单元,用于根据扩充后的待识别框对子文件进行切分,得到子区域。
作为本发明进一步的方案:所述路径生成模块包括:
聚类单元,用于根据位置信息对编辑框和标签框进行聚类;
文本识别单元,用于分别对同类的编辑框和标签框进行文本识别,得到编辑内容和标签内容;
级别查询单元,用于根据标签内容遍历预设的内容级别库,查询对应的编辑内容的内容级别;
参数应用单元,用于根据内容级别确定节点大小,根据编辑内容确定节点内容。
与现有技术相比,本发明的有益效果是:本发明将原有的压缩-加密-传输过程转换为了提取加密-传输-复原过程,在保证数据可复原的基础上,极大地降低的数据传输量,扩充了加密手段,是一种由一维向二维的突破,可以极大地提高办公效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为无纸化办公用文件的加密方法的流程框图。
图2为无纸化办公用文件的加密方法的第一子流程框图。
图3为无纸化办公用文件的加密方法的第二子流程框图。
图4为无纸化办公用文件的加密系统的组成结构框图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例1
图1为无纸化办公用文件的加密方法的流程框图,本发明实施例中,一种无纸化办公用文件的加密方法,所述方法包括:
步骤S100:依次查询待加密文件中各子文件的标签,根据所述标签查询对应的文件模板;
一个待加密文件由多个不同的子文件组成,举例来说,一次项目申报文件由多个文档组成,项目申报文件就是待加密文件,多个文档就是子文件;不同子文件有着不同的标签,由标签即可查询到对应的文件模板;对于办公文件来说,格式基本上都是固定的,所有文件存在对应的模板,如果出现新的文件形式,相应的,模板库也要随之更新。
步骤S200:遍历定位所述文件模板的编辑框和标签框,根据编辑框和标签框的位置对子文件进行切分,得到子区域;其中,所述编辑框对应文件模板中的编辑内容;所述标签框对应文件模板中的只读内容;
本发明技术方案对文件模板中各区域的切分种类只有两种,一种是可编辑的,一种是只读的(不可编辑的);通俗地说,一种类似于label标签,一种类似于文本框;比如,姓名:***,其中,“姓名:”就是标签框,“***”就是可编辑的编辑框。
由编辑框和标签框可以对子文件进行区域切分,这一过程的前提是子文件基于文件模板生成。
步骤S300:依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径;
对于办公文件,识别方式主要就是文本识别,借助现有的文本识别技术即可提取到各个子区域中的内容;根据提取到的内容,生成一个个含有内容级别的节点,所述内容级别用于反映内容的重要程度;连接各个节点,即可确定内容路径。
需要说明的是,内容路径仅发生在编辑框对应的子区域中,当信息接收端接收到内容路径时,根据内容路径结合相应的模板(同一办公系统下的模板通用),即可复原对应的文件。
步骤S400:统计所有子文件的内容路径,得到待加密文件的内容图,对内容图进行加密传输;
统计所有内容路径,将原有的一维数据转换成了二维数据,相应的,加密手段更加丰富;将原有的压缩-加密-传输过程转换为了提取加密-传输-复原过程,在保证数据可复原的基础上,极大地降低的数据传输量,扩充了加密手段,是一种由一维向二维的突破,可以极大地提高办公效率。
通俗地说,原有的文件压缩再加密的方式,传输内容很多,可以类比于文件下载过程,而现有的文件提取再加密传输的方式,传输内容很小,重点在于文件提取和复原,可以类于比文件安装过程,而文件下载与文件安装相比,大部分情况下,安装速度优于文件下载速度。
本发明技术方案的优势还可以换一种理解角度,即,在办公系统中,办公文件之间存在大部分的重复(基于同一模板,只是待填写的内容不同),本发明根据填写的内容,生成一个二维的内容图,这种提炼方式,有效地剔除了重复部分,基于内容图的文件传输过程,效率极高。
作为本发明技术方案的一个优选实施例,所述编辑框中设有时间检测端口,用于获取填写时间;
在依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径的步骤中,基于内容路径读取并记录填写时间;
在对内容图进行加密传输的步骤中,根据填写时间对内容图进行加密传输。
对于本发明技术方案的加密传输过程,为了提高加密码的随机性,在编辑框中外接时间检测端口,基于时间检测端口获取内容填写时间,根据各个编辑框的内容填写时间,生成一些加密码,这种加密码取决于子文件填写方,随机性极强,无规律,不易破解。
图2为无纸化办公用文件的加密方法的第一子流程框图,所述遍历定位所述文件模板的编辑框和标签框,根据编辑框和标签框的位置对子文件进行切分,得到子区域的步骤包括:
步骤S201:遍历文件模板中的组件,获取组件信息;所述组件信息至少包括用于表征该组件是否能编辑的参数;
文件模板由不同的组件共同组成,这些组件都具备自身的属性参数,也就是上述组件信息。
举例来说,以VB语言生成的文件模板为例,Label标签的常用属性有:
1、name:名称;2、enable:可用性;3、visible:可见性;4、font:字体等,在这些属性中可以增设一个属性,用于表示该Label标签是否能够编辑,如果能够编辑,该属性值为1,不能编辑则为0;其中,所述Label标签就是上述内容中的组件,该属性值就是组件信息。步骤S202:根据所述组件信息将各组件分为编辑框和标签框,并获取其位置信息;
根据组件信息对各组件进行分类的过程并不困难;其重点在于编辑框,其他的非编辑框均可视为标签框;在分类过程中,实时获取各个组件的位置信息;所述位置信息用于表征各组件在子文件中的位置。
步骤S203:根据所述位置信息在子文件中确定待识别框,基于待识别框对子文件进行识别,计算待识别框的边界的交叉点数量;
步骤S201和步骤S202发生在文件模板中,最终得到位置信息;步骤S203的过程是根据位置信息在子文件中确定待识别框,如果待识别框无法完全包括框内的内容,那么待识别框上将会存在一些内容与待识别框边界相交的交叉点。
对于交叉点的数量计算过程需要具体说明,如下:
交叉点本质上是主观性的描述,在计算机识别过程中,可以借用图像处理技术,比如PS中的“魔棒”工具,计算机可以根据色值差异提取待识别框的轮廓,正常情况下,如果待识别框完全包括框内的内容,那么待识别框是矩形;因此,根据待识别框的顶点确定一个理论矩形,然后比对理论矩形和实际的待识别框(作差),即可得到一些矩形边界上的外延线,根据外延线的数量即可确定交叉点的数量。
步骤S204:当所述交叉点数量不为零时,扩充所述待识别框直至交叉点数量为零;
步骤S205:根据扩充后的待识别框对子文件进行切分,得到子区域;
如果存在交叉点,就对待识别框进行扩充,直至待识别框上没有任何交叉点,这样可以进一步提高待识别框的适应能力。
图3为无纸化办公用文件的加密方法的第二子流程框图,所述依次对子区域进行识别,确定含有内容级别的节点的步骤包括:
步骤S301:根据位置信息对编辑框和标签框进行聚类;
在办公文档中,编辑框与标签框大都不是独立存在的,以上述内容为例,“姓名:”是一个标签框,“***”是编辑框,这两者一般是相连的,根据位置信息可以很容易判断;
步骤S302:分别对同类的编辑框和标签框进行文本识别,得到编辑内容和标签内容;
步骤S303:根据标签内容遍历预设的内容级别库,查询对应的编辑内容的内容级别;
根据标签内容可以判断待填写的内容(编辑框)的重要性,比如“身份证号:”这种标签框,后续的编辑框的内容级别会很高。
步骤S304:根据内容级别确定节点大小,根据编辑内容确定节点内容;
节点内容也可以理解为节点名称,它是必要内容,是后续的文件复原过程中,不可缺少的内容。
作为本发明技术方案的一个优选实施例,所述根据含有内容级别的节点确定内容路径的步骤包括:
根据所述内容级别对节点进行分层;同一内容级别的节点在同一图层;
不同内容级别的节点,其重要性不同,不同内容级别的节点需要分开处理;
在同一图层中,根据节点的位置关系确定中心点,基于所述中心点连接其他节点,得到以内容级别为标签的单层路径;
由中心点连接其他节点的方式为,依次连接距离最近的节点,呈螺旋型连接多个节点。
根据所述内容级别叠加所有单层路径,得到内容路径;其中,内容级别最高的单层路径置于最顶层;
叠加所有单层路径,可以得到内容路径;叠加的方式是,最高的内容级别对应的单层路径置于最顶层;最低的内容级别对应的单层路径置于最底层。
在本发明技术方案的一个实例中,依次计算底层节点与其上层节点之间的最小距离,当所述最小距离达到预设的阈值时,将底层节点合并至对应的上层单层路径;
层与层之间的节点位置可能距离非常近,如果近到一定程度,就可以将底层的节点置于上层。这一过程可以理解为简单的融合,有可能会减少层数;属于可有可无的技术方案。
具体的,所述在同一图层中,根据节点的位置关系确定中心点的步骤包括:
随机选取一个节点作为初始中心点;
根据预设的距离公式计算其他节点与初始中心点之间的距离均值;
根据所述距离均值以任意两个节点为圆心作圆,确定虚拟中心点;
对于虚拟中心点的确定过程需要进一步的说明,以任意两个节点为圆心作圆,半径均为距离均值,这两个圆有可能是相交、相切与相离三种情况;如果两圆相交,选取任一个交点(共有两个交点)作为虚拟中心点;如果两圆相切,选取切点作为中心点;如果两圆相离,连接两个圆的圆心,得到一条线段,选取线段的中点作为虚拟中心点。
虚拟中心点更新后,距离均值会改变,然后又会确定新的虚拟中心点,在虚拟中心点的最近处选取目标中心点,随着循环次数的增加,目标中心点最终会固定。
对于上述内容,实际上还有一个小问题,由于作圆过程的圆心是随机选取的,后一次确定的虚拟中心点与前一次确定的虚拟中心点有可能差距很大,当虚拟中心点不断变动时,目标中心点也会不断变动;但是,当循环次数足够多,比如几百次,总会有相邻两次任意选取的节点,是类似的,此时,循环将会跳出;当目标中心点与理论上的中心点越近,跳出循环的概率越高。
更进一步的,上述循环过程最终确定的目标中心点与理论上的中心点也有可能差异很大(作圆步骤任意选取的两个节点相同,且距离均值差异较小),此时,影响的只是后续的“基于所述中心点连接其他节点,得到以内容级别为标签的单层路径”步骤的生成效率,并不是无法进行后续步骤的大问题。
根据虚拟中心点选取目标中心点,并循环执行上述步骤,直至选取的目标中心点不发生变化;
在上述内容中,所述距离公式为:
式中,J为距离,xi为第i个节点的横坐标,yi为第i个节点的纵坐标;xz为中心点的横坐标,yz为中心点的纵坐标;PT为该图层中除中心点的节点数量。
在本发明技术方案的一个实例中,随机选一个节点作为初始中心点,比如选了边角处的一个节点作为初始中心点,然后,计算其他节点与该初始中心点之间的距离,计算距离均值,然后任选两个点,以距离均值为半径作圆,即可确定一个虚拟中心点,选取离虚拟中心点最近的节点作为新的中心点,并重复执行上述内容,直至中心点不再发生变化。
值得一提的是,仅需个位数的循环次数,即可确定最终的中心点。
实施例2
图4为无纸化办公用文件的加密系统的组成结构框图,本发明实施例中,一种无纸化办公用文件的加密系统,所述系统10包括:
文件模板查询模块11,用于依次查询待加密文件中各子文件的标签,根据所述标签查询对应的文件模板;
区域切分模块12,用于遍历定位所述文件模板的编辑框和标签框,根据编辑框和标签框的位置对子文件进行切分,得到子区域;其中,所述编辑框对应文件模板中的编辑内容;所述标签框对应文件模板中的只读内容;
路径生成模块13,用于依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径;
路径统计模块14,用于统计所有子文件的内容路径,得到待加密文件的内容图,对内容图进行加密传输。
其中,所述编辑框中设有时间检测端口,用于获取填写时间;时间检测端口的功能时,当编辑框中的输入操作结束时,读取设备中的时间,作为填写时间;
在依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径的步骤中,基于内容路径读取并记录填写时间;
读取并记录填写时间的步骤在“根据含有内容级别的节点确定内容路径”步骤中的“基于所述中心点连接其他节点,得到以内容级别为标签的单层路径这一过程中”这一子步骤中完成。
在对内容图进行加密传输的步骤中,根据填写时间对内容图进行加密传输;
加密传输的原理非常简单,就是根据填写时间映射出一些数值,作为加密码,由加密码对内容图进行加密传输;最简单的一种方式就是借用现有的压缩技术,将内容图压缩,解压码为加密码。
进一步的,所述区域切分模块12包括:
组件遍历单元,用于遍历文件模板中的组件,获取组件信息;所述组件信息至少包括用于表征该组件是否能编辑的参数;
组件分类单元,用于根据所述组件信息将各组件分为编辑框和标签框,并获取其位置信息;
交叉点检测单元,用于根据所述位置信息在子文件中确定待识别框,基于待识别框对子文件进行识别,计算待识别框的边界的交叉点数量;
识别框扩充单元,用于当所述交叉点数量不为零时,扩充所述待识别框直至交叉点数量为零;
切分执行单元,用于根据扩充后的待识别框对子文件进行切分,得到子区域。
具体的,所述路径生成模块13包括:
聚类单元,用于根据位置信息对编辑框和标签框进行聚类;
文本识别单元,用于分别对同类的编辑框和标签框进行文本识别,得到编辑内容和标签内容;
级别查询单元,用于根据标签内容遍历预设的内容级别库,查询对应的编辑内容的内容级别;
参数应用单元,用于根据内容级别确定节点大小,根据编辑内容确定节点内容。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种无纸化办公用文件的加密方法,其特征在于,所述方法包括:
依次查询待加密文件中各子文件的标签,根据所述标签查询对应的文件模板;
遍历定位所述文件模板的编辑框和标签框,根据编辑框和标签框的位置对子文件进行切分,得到子区域;其中,所述编辑框对应文件模板中的编辑内容;所述标签框对应文件模板中的只读内容;
依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径;
统计所有子文件的内容路径,得到待加密文件的内容图,对内容图进行加密传输;
所述编辑框中设有时间检测端口,用于获取填写时间;
在依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径的步骤中,基于内容路径读取并记录填写时间;
在对内容图进行加密传输的步骤中,根据填写时间对内容图进行加密传输;
所述根据含有内容级别的节点确定内容路径的内容包括:
根据所述内容级别对节点进行分层;同一内容级别的节点在同一图层;
在同一图层中,根据节点的位置关系确定中心点,基于所述中心点连接其他节点,得到以内容级别为标签的单层路径;
根据所述内容级别叠加所有单层路径,得到内容路径;其中,内容级别最高的单层路径置于最顶层;
依次计算底层节点与其上层节点之间的最小距离,当所述最小距离达到预设的阈值时,将底层节点合并至对应的上层单层路径。
2.根据权利要求1所述的无纸化办公用文件的加密方法,其特征在于,所述遍历定位所述文件模板的编辑框和标签框,根据编辑框和标签框的位置对子文件进行切分,得到子区域的步骤包括:
遍历文件模板中的组件,获取组件信息;所述组件信息至少包括用于表征该组件是否能编辑的参数;
根据所述组件信息将各组件分为编辑框和标签框,并获取其位置信息;
根据所述位置信息在子文件中确定待识别框,基于待识别框对子文件进行识别,计算待识别框的边界的交叉点数量;
当所述交叉点数量不为零时,扩充所述待识别框直至交叉点数量为零;
根据扩充后的待识别框对子文件进行切分,得到子区域。
3.根据权利要求1所述的无纸化办公用文件的加密方法,其特征在于,所述依次对子区域进行识别,确定含有内容级别的节点的步骤包括:
根据位置信息对编辑框和标签框进行聚类;
分别对同类的编辑框和标签框进行文本识别,得到编辑内容和标签内容;
根据标签内容遍历预设的内容级别库,查询对应的编辑内容的内容级别;
根据内容级别确定节点大小,根据编辑内容确定节点内容。
4.根据权利要求1所述的无纸化办公用文件的加密方法,其特征在于,所述在同一图层中,根据节点的位置关系确定中心点的步骤包括:
随机选取一个节点作为初始中心点;
根据预设的距离公式计算其他节点与初始中心点之间的距离均值;
根据所述距离均值以任意两个节点为圆心作圆,确定虚拟中心点;
根据虚拟中心点选取目标中心点,并循环执行上述步骤,直至选取的目标中心点不发生变化;
其中,所述距离公式为:
式中,J为距离,xi为第i个节点的横坐标,yi为第i个节点的纵坐标;xz为中心点的横坐标,yz为中心点的纵坐标;PT为该图层中除中心点的节点数量。
5.一种无纸化办公用文件的加密系统,其特征在于,所述系统包括:
文件模板查询模块,用于依次查询待加密文件中各子文件的标签,根据所述标签查询对应的文件模板;
区域切分模块,用于遍历定位所述文件模板的编辑框和标签框,根据编辑框和标签框的位置对子文件进行切分,得到子区域;其中,所述编辑框对应文件模板中的编辑内容;所述标签框对应文件模板中的只读内容;
路径生成模块,用于依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径;
路径统计模块,用于统计所有子文件的内容路径,得到待加密文件的内容图,对内容图进行加密传输;
所述编辑框中设有时间检测端口,用于获取填写时间;
在依次对子区域进行识别,确定含有内容级别的节点,根据含有内容级别的节点确定内容路径的步骤中,基于内容路径读取并记录填写时间;
在对内容图进行加密传输的步骤中,根据填写时间对内容图进行加密传输;
所述根据含有内容级别的节点确定内容路径的内容包括:
根据所述内容级别对节点进行分层;同一内容级别的节点在同一图层;
在同一图层中,根据节点的位置关系确定中心点,基于所述中心点连接其他节点,得到以内容级别为标签的单层路径;
根据所述内容级别叠加所有单层路径,得到内容路径;其中,内容级别最高的单层路径置于最顶层;
依次计算底层节点与其上层节点之间的最小距离,当所述最小距离达到预设的阈值时,将底层节点合并至对应的上层单层路径。
6.根据权利要求5所述的无纸化办公用文件的加密系统,其特征在于,所述区域切分模块包括:
组件遍历单元,用于遍历文件模板中的组件,获取组件信息;所述组件信息至少包括用于表征该组件是否能编辑的参数;
组件分类单元,用于根据所述组件信息将各组件分为编辑框和标签框,并获取其位置信息;
交叉点检测单元,用于根据所述位置信息在子文件中确定待识别框,基于待识别框对子文件进行识别,计算待识别框的边界的交叉点数量;
识别框扩充单元,用于当所述交叉点数量不为零时,扩充所述待识别框直至交叉点数量为零;
切分执行单元,用于根据扩充后的待识别框对子文件进行切分,得到子区域。
7.根据权利要求5所述的无纸化办公用文件的加密系统,其特征在于,所述路径生成模块包括:
聚类单元,用于根据位置信息对编辑框和标签框进行聚类;
文本识别单元,用于分别对同类的编辑框和标签框进行文本识别,得到编辑内容和标签内容;
级别查询单元,用于根据标签内容遍历预设的内容级别库,查询对应的编辑内容的内容级别;
参数应用单元,用于根据内容级别确定节点大小,根据编辑内容确定节点内容。
CN202211373234.1A 2022-11-04 2022-11-04 一种无纸化办公用文件的加密方法和系统 Active CN115525918B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211373234.1A CN115525918B (zh) 2022-11-04 2022-11-04 一种无纸化办公用文件的加密方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211373234.1A CN115525918B (zh) 2022-11-04 2022-11-04 一种无纸化办公用文件的加密方法和系统

Publications (2)

Publication Number Publication Date
CN115525918A CN115525918A (zh) 2022-12-27
CN115525918B true CN115525918B (zh) 2023-04-28

Family

ID=84705205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211373234.1A Active CN115525918B (zh) 2022-11-04 2022-11-04 一种无纸化办公用文件的加密方法和系统

Country Status (1)

Country Link
CN (1) CN115525918B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116521073B (zh) * 2023-04-28 2023-10-24 江苏禾禾贯文网络科技有限公司 基于云服务的存储方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822025A (zh) * 2021-11-25 2021-12-21 深圳市明源云链互联网科技有限公司 办公文件自动生成方法、装置、设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101053219A (zh) * 2004-05-11 2007-10-10 天宝导航有限公司 路径分析系统
US8739291B2 (en) * 2005-01-27 2014-05-27 Nokia Corporation System and method for providing access to OMA DRM protected files from java application
JP5274266B2 (ja) * 2009-01-07 2013-08-28 キヤノン株式会社 文書管理装置、文書管理システム、文書管理方法およびコンピュータプログラム
CN102708336B (zh) * 2012-05-02 2015-04-22 四川建设网有限责任公司 基于关键数据和定制模板分离的电子文档处理方法及系统
CN107426223B (zh) * 2017-08-01 2020-06-05 中国工商银行股份有限公司 云文档加密及解密方法、加密及解密装置、以及处理系统
CN111222151A (zh) * 2019-12-31 2020-06-02 北京指掌易科技有限公司 移动端应用目录保护方法和装置
CN111428451B (zh) * 2020-06-09 2020-09-08 平安国际智慧城市科技股份有限公司 文本在线编辑方法、装置、电子设备及存储介质
CN112861177B (zh) * 2021-02-05 2021-11-19 深圳市辰星瑞腾科技有限公司 一种基于物联网的计算机防卫系统
CN113660126B (zh) * 2021-08-18 2024-04-12 奇安信科技集团股份有限公司 一种组网文件生成方法、组网方法以及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822025A (zh) * 2021-11-25 2021-12-21 深圳市明源云链互联网科技有限公司 办公文件自动生成方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN115525918A (zh) 2022-12-27

Similar Documents

Publication Publication Date Title
JP5068963B2 (ja) 論理的文書構造を決定するための方法及び装置
US7013309B2 (en) Method and apparatus for extracting anchorable information units from complex PDF documents
US7106330B2 (en) Drawing comparison apparatus
US7593961B2 (en) Information processing apparatus for retrieving image data similar to an entered image
JP4393161B2 (ja) 画像処理装置及び画像処理方法
US20150046784A1 (en) Extraction device for composite graph in fixed layout document and extraction method thereof
EP3104302B1 (en) A method of digitalising engineering documents
CN115525918B (zh) 一种无纸化办公用文件的加密方法和系统
CN111931466B (zh) 一种文档处理方法及装置
US7027071B2 (en) Selecting elements from an electronic document
CN109190370B (zh) 一种基于控件区域分布特征的安卓界面相似度计算方法
US20200210746A1 (en) Floating form processing based on topological structures of documents
CN104111913A (zh) 一种流式文档的处理方法及装置
CN115100670A (zh) 保单信息处理方法及其系统、电子设备、存储介质
JP2007109179A (ja) 画像処理装置及びその制御方法、プログラム
JP2009271679A (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2010020642A (ja) 文書管理装置、文書管理方法、及びコンピュータプログラム
CN110188156A (zh) 一种输电线路工程三维设计成果关键信息提取方法和系统
CN110147516A (zh) 页面设计中前端代码的智能识别方法及相关设备
CN105354177A (zh) 一种数据处理系统和一种数据处理方法
CN114037828A (zh) 组件识别方法、装置、电子设备及存储介质
CN101221596B (zh) 基于图示符的处理系统及处理基于图示符的数据的方法
Böschen et al. Formalization and preliminary evaluation of a pipeline for text extraction from infographics
CN114283441B (zh) 适用于铁路客站的二维图纸识别建模方法和装置
Vasin Description Models, Methods, Algorithms, and Technology for Processing Poorly Structured Raster Graphic Documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant