CN114139503A - 文档内容处理方法、装置、设备及存储介质 - Google Patents

文档内容处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114139503A
CN114139503A CN202111446128.7A CN202111446128A CN114139503A CN 114139503 A CN114139503 A CN 114139503A CN 202111446128 A CN202111446128 A CN 202111446128A CN 114139503 A CN114139503 A CN 114139503A
Authority
CN
China
Prior art keywords
content
editing
markup language
user
document content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111446128.7A
Other languages
English (en)
Inventor
王丹丹
孟祥磊
汪伟
李烨
彭存宇
姚作为
齐磊
包小勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202111446128.7A priority Critical patent/CN114139503A/zh
Publication of CN114139503A publication Critical patent/CN114139503A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2372Updates performed during offline database operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/226Validation

Abstract

本申请实施例公开了一种文档内容处理方法、装置、设备及存储介质。方法包括:若接收到终端针对目标文档内容的编辑指令,则检测终端的网络连接状态,若处于离线状态,则获取目标文档内容的文本标记语言和校验脚本;获取编辑指令确定的编辑内容,调用校验脚本对编辑内容的合法性进行验证,若编辑内容具有合法性,则生成编辑内容的文本标记语言,采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言;若终端的网络连接状态恢复至在线状态,则根据更新后的文本标记语言生成更新后的目标文档内容。通过本申请,能够在离线状态下对目标文档内容的编辑内容的合法性进行验证,提高目标文档内容离线编辑的效率。

Description

文档内容处理方法、装置、设备及存储介质
技术领域
本申请涉及机器学习技术领域,尤其涉及一种文档内容处理方法、装置、设备及存储介质。
背景技术
随着计算机的普及,人们可以采用办公软件来记录文字、编写文档以及书籍作品,为人们记录信息带来很大的便利。
目前,当用户在出差、旅游等离开办公环境时,通常会面临网络较差或者没有网络的情况,导致用户在离线状态下对文档内容进行编辑得到的编辑内容无法更新。同时在离线状态时无法支持对输入内容进行丰富的校验,导致恢复至在线状态时无法对用户输入非法参数进行更新存储,则需要用户重新对文档内容进行编辑,导致文档内容的离线编辑效率较低。
发明内容
本申请实施例所要解决的技术问题在于,提供一种文档内容处理方法、装置、设备及存储介质,能够在离线状态中对目标文档内容的编辑内容的合法性进行验证,提高目标文档内容离线编辑的效率。
本申请实施例一方面提供一种文档内容处理方法,包括:
若接收到终端针对目标文档内容的编辑指令,则检测终端的网络连接状态;
若终端的网络连接状态处于离线状态,则获取目标文档内容的文本标记语言,以及目标文档内容的校验脚本;
获取根据编辑指令所得到的编辑内容,调用校验脚本对编辑内容的合法性进行验证,得到验证结果;
若验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言;
若终端的网络连接状态恢复至在线状态,则根据更新后的文本标记语言生成更新后的目标文档内容。
其中,若验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,包括:
若验证结果指示编辑内容具有合法性,则获取编辑内容的编辑属性;
从文本标记语言模板库中,查询与编辑内容的编辑属性匹配的目标文本标记语言模板;目标文本标记语言模板包括反映编辑属性和编辑属性的初始内容的文本标记语言;
采用编辑内容替换目标文本标记语言模板中的初始内容,得到编辑内容的文本标记语言。
其中,校验脚本包括权限校验脚本;
调用校验脚本对编辑内容的合法性进行验证,得到验证结果,包括:
获取编辑指令所对应的编辑用户的用户属性信息;
根据用户属性信息以及权限校验脚本,对编辑用户的编辑权限进行校验,得到权限校验结果;
若权限校验结果指示编辑用户具有对目标文档内容进行编辑的编辑权限,则生成指示编辑内容具有合法性的验证结果;
若权限校验结果指示编辑用户不具有对目标文档内容进行编辑的编辑权限,则生成指示编辑内容不具有合法性的验证结果。
其中,根据用户属性信息以及权限校验脚本,对编辑用户的编辑权限进行校验,得到权限校验结果,包括:
获取权限校验脚本中的样本用户属性信息,样本用户属性信息是指具有编辑权限的用户的属性信息;
确定编辑用户的用户属性信息和样本用户属性信息之间的用户相似度;
若用户相似度大于或者等于目标阈值,则生成指示编辑用户具有对目标文档内容进行编辑的编辑权限的权限校验结果;
若用户相似度小于目标阈值,则生成指示编辑用户不具有对目标文档内容进行编辑的编辑权限的权限校验结果。
其中,校验脚本包括内容校验脚本;
调用校验脚本对编辑内容的合法性进行验证,得到验证结果,包括:
获取编辑内容对应的编辑字段,从内容校验脚本中获取编辑字段的标准字段属性,标准字段属性包括标准字段格式和标准字段类型;
对编辑内容进行解析,得到编辑内容对应的编辑字段的实际字段属性;实际字段属性包括实际字段格式和实际字段类型;
将实际字段属性与标准字段属性进行比对,得到实际字段属性与标准字段属性之间的匹配度;
若匹配度大于或等于匹配度阈值,则生成指示编辑内容具有合法性的验证结果;
若匹配度小于匹配度阈值,则生成指示编辑内容不具有合法性的验证结果。
其中,方法还包括:
若检测到针对目标文档内容的浏览操作,则获取浏览操作所确定的文档浏览方向;
根据文档浏览方向,在目标文档内容中确定加载文档内容和删除文档内容;
获取加载文档内容中的批注脚本,根据批注脚本对加载文档内容进行渲染显示;
对删除文档内容进行删除处理。
其中,方法还包括:
获取初始文档内容对应的目标文档类型信息,获取文档库中M个样本文档分别对应的M个样本文档类型信息;M为正整数;
确定目标文档类型信息分别与M个样本文档类型信息之间的M个类型相似度;
将M个类型相似度中最大的类型相似度所对应的样本文档,确定为目标样本文档,并获取目标样本文档的属性配置信息和校验规则;
将目标样本文档的属性配置信息和校验规则,确定为与初始文档内容相关联的属性配置信息和校验规则;
根据与初始文档内容相关联的属性配置信息和校验规则,对初始文档内容进行配置处理,得到目标文档内容。
本申请实施例一方面提供一种文档内容处理装置,包括:
检测模块,用于若接收到终端针对目标文档内容的编辑指令,则检测终端的网络连接状态;
第一获取模块,用于若终端的网络连接状态处于离线状态,则获取目标文档内容的文本标记语言,以及目标文档内容的校验脚本;
验证模块,用于获取根据编辑指令所得到的编辑内容,调用校验脚本对编辑内容的合法性进行验证,得到验证结果;
更新模块,用于若验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言;
生成模块,用于若终端的网络连接状态恢复至在线状态,则根据更新后的文本标记语言生成更新后的目标文档内容。
其中,更新模块包括:
第一获取单元,用于若验证结果指示编辑内容具有合法性,则获取编辑内容的编辑属性;
查询单元,用于从文本标记语言模板库中,查询与编辑内容的编辑属性匹配的目标文本标记语言模板;目标文本标记语言模板包括反映编辑属性和编辑属性的初始内容的文本标记语言;
替换单元,用于采用编辑内容替换目标文本标记语言模板中的初始内容,得到编辑内容的文本标记语言。
其中,校验脚本包括权限校验脚本;
验证模块包括:
第二获取单元,用于获取编辑指令所对应的编辑用户的用户属性信息;
校验单元,用于根据用户属性信息以及权限校验脚本,对编辑用户的编辑权限进行校验,得到权限校验结果;
第一生成单元,用于若权限校验结果指示编辑用户具有对目标文档内容进行编辑的编辑权限,则生成指示编辑内容具有合法性的验证结果;
第二生成单元,用于若权限校验结果指示编辑用户不具有对目标文档内容进行编辑的编辑权限,则生成指示编辑内容不具有合法性的验证结果。
其中,校验单元具体用于:
获取权限校验脚本中的样本用户属性信息,样本用户属性信息是指具有编辑权限的用户的属性信息;
确定编辑用户的用户属性信息和样本用户属性信息之间的用户相似度;
若用户相似度大于或者等于目标阈值,则生成指示编辑用户具有对目标文档内容进行编辑的编辑权限的权限校验结果;
若用户相似度小于目标阈值,则生成指示编辑用户不具有对目标文档内容进行编辑的编辑权限的权限校验结果。
其中,校验脚本包括内容校验脚本;
验证模块包括:
第三获取单元,用于获取编辑内容对应的编辑字段,从内容校验脚本中获取编辑字段的标准字段属性,标准字段属性包括标准字段格式和标准字段类型;
解析单元,用于对编辑内容进行解析,得到编辑内容对应的编辑字段的实际字段属性;实际字段属性包括实际字段格式和实际字段类型;
比对单元,用于将实际字段属性与标准字段属性进行比对,得到实际字段属性与标准字段属性之间的匹配度;
第三生成单元,用于若匹配度大于或等于匹配度阈值,则生成指示编辑内容具有合法性的验证结果;
第四生成单元,用于若匹配度小于匹配度阈值,则生成指示编辑内容不具有合法性的验证结果。
其中,文档内容处理装置还包括:
第二获取模块,用于若检测到针对目标文档内容的浏览操作,则获取浏览操作所确定的文档浏览方向;
第一确定模块,用于根据文档浏览方向,在目标文档内容中确定加载文档内容和删除文档内容;
渲染显示模块,用于获取加载文档内容中的批注脚本,根据批注脚本对加载文档内容进行渲染显示;
删除处理模块,用于对删除文档内容进行删除处理。
其中,文档内容处理装置还包括:
第三获取模块,用于获取初始文档内容对应的目标文档类型信息,获取文档库中M个样本文档分别对应的M个样本文档类型信息;M为正整数;
第二确定模块,用于确定目标文档类型信息分别与M个样本文档类型信息之间的M个类型相似度;
第四获取模块,用于将M个类型相似度中最大的类型相似度所对应的样本文档,确定为目标样本文档,并获取目标样本文档的属性配置信息和校验规则;
第三确定模块,用于将目标样本文档的属性配置信息和校验规则,确定为与初始文档内容相关联的属性配置信息和校验规则;
配置处理模块,用于根据与初始文档内容相关联的属性配置信息和校验规则,对初始文档内容进行配置处理,得到目标文档内容。
本申请实施例一方面提供了一种计算机设备,包括:处理器和存储器;
处理器与存储器相连,其中,存储器用于存储计算机程序,计算机程序被处理器执行时,使得该计算机设备执行本申请实施例提供的方法。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行本申请实施例提供的方法。
本申请实施例一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例提供的方法。
本申请实施例中,若接收到终端针对目标文档内容的编辑指令,则检测终端的网络连接状态,若终端的网络连接状态处于离线状态,则获取目标文档内容的文本标记语言,以及目标文档内容的校验脚本。获取根据编辑指令所得到的编辑内容,调用校验脚本对编辑内容的合法性进行验证,得到验证结果。通过校验脚本对编辑内容的合法性进行验证,可以保证编辑用户输入合法的编辑内容,实现对目标文档内容的编辑进行有效管理,同时也可以保障目标文档内容编辑的安全性和私密性。若验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,这样通过生成编辑内容的文本标记语言可以实现对编辑内容进行有效存储,便于后续根据该编辑内容对目标文档内容进行更新。采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言。若终端的网络连接状态恢复至在线状态,则根据更新后的文本标记语言生成更新后的目标文档内容。可见,只有在编辑内容具有合法性时才根据编辑内容的文本标记语言对目标文档内容进行更新,避免出现编辑内容不合法时(如编辑内容中存在非法参数时),导致不能根据更新后的文本标记语言对目标文档内容进行更新存储,可以提高目标文档内容的离线编辑效率。通过本申请,可以实现目标文档内容的离线编辑,也可以提高目标文档内容的离线编辑效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种文档内容处理系统的架构示意图;
图2是本申请实施例提供的一种文档内容处理方法的流程示意图;
图3是本申请实施例提供的另一种文档内容处理方法的流程示意图;
图4是本申请实施例提供的一种文档内容处理装置的结构示意图;
图5是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
见图1,图1是本申请实施例提供的一种文档内容处理系统的结构示意图。如图1所示,该文档内容处理系统可以包括服务器10和用户终端集群。该用户终端集群可以包括一个或者多个用户终端,这里将不对用户终端的数量进行限制。如图1所示,具体可以包括用户终端100a、用户终端100b、用户终端100c、…、用户终端100n。如图1所示,用户终端100a、用户终端100b、用户终端100c、…、用户终端100n可以分别与上述服务器10进行网络连接,以便于每个用户终端可以通过该网络连接与服务器10进行数据交互。
其中,该用户终端集群中的每个用户终端均可以包括:智能手机、平板电脑、笔记本电脑、桌上型电脑、可穿戴设备、智能家居、头戴设备、车载终端等具有文档内容处理功能的智能终端。应当理解,如图1所示的用户终端集群中的每个用户终端均可以安装有目标应用(即应用客户端),当该应用客户端运行于各用户终端中时,可以分别与上述图1所示的服务器10之间进行数据交互。
其中,如图1所示,该服务器10可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
为便于理解,本申请实施例可以在图1所示的多个用户终端中选择一个用户终端作为目标用户终端,该目标用户终端可以包括:智能手机、平板电脑、笔记本电脑、桌上型电脑、智能电视等携带文档内容处理功能的智能终端。例如,为便于理解,本申请实施例可以将图1所示的用户终端100a作为目标用户终端,编辑用户可以在用户终端100a提供的显示界面中,对目标文档内容进行编辑。若用户终端100a接收到编辑用户在用户终端100a提供的显示界面中,对目标文档内容进行编辑的编辑操作所生成的编辑指令,则用户终端100a可以检测当前该用户终端100a的网络连接状态。若该用户终端100a等网络连接状态处于离线状态,则获取目标文档内容的文本标记语言以及目标文档内容的校验脚本,该目标文档内容可以是用户终端100a在处于在线状态时,从服务器10中下载并存储至用户终端100a本地的。用户终端100a可以获取根据编辑指令所得到的编辑内容,调用校验脚本对编辑内容的合法性进行验证,得到验证结果。若用户终端100a确定验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,采用该编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言。若用户终端100a检测到其网络连接状态恢复至在线状态,则根据更新后的文本标记语言生成更新的目标文档内容。可见,本申请实施例可以在终端处于离线状态时,对目标文档内容的编辑内容的合法性进行验证,这样可以保障在离线状态下编辑用户输入合法的编辑内容,以便在恢复至在线状态时对具有合法性的编辑内容进行颗粒化存储,提高文档内容的离线编辑效率。
请参见图2,图2是本申请实施例提供的一种文档内容处理方法的流程示意图。该文档内容处理方法可由计算机设备执行,该计算机设备可以为服务器(如上述图1中的服务器10),或者用户终端(如上述图1的用户终端集群中的任一用户终端),或者为服务器和用户终端组成的系统,本申请对此不做限定。如图2所示,该文档内容处理方法可以包括步骤S101-S105。
S101,若接收到终端针对目标文档内容的编辑指令,则检测终端的网络连接状态。
具体的,计算机设备可以在终端处于离线状态时,对编辑用户针对目标文档内容的编辑内容进行合法性验证,保证编辑用户输入具有合法性的编辑内容,同时在检测终端恢复至在线状态时,根据具有合法性的编辑内容对目标文档内容进行更新。这样,可以保证编辑用户对目标文档内容进行编辑得到的编辑内容具有合法性,实现目标文档内容的离线编辑,为编辑用户进行文档内容编辑提高便利。具体的,编辑用户可以在终端提供的页面中,对目标文档内容进行浏览和编辑,当编辑用户实施针对目标文档内容的编辑操作时,终端则请求对目标文档内容进行编辑的编辑指令。若计算机设备接收到终端针对目标文档内容的编辑指令,则检测终端的网络连接状态,该网络连接状态包括在线状态和离线状态,例如,当终端和服务器不能通过互联网进行通信时,则可以确定终端处于离线状态;当终端和服务器可以通过互联网进行通信时,则可以确定终端处于在线状态。其中,计算机设备可以调用编辑监控线程,用于监控是否存在针对目标文档内容的编辑指令,当监控到终端针对目标文档内容的编辑指令时,则检测终端的网络连接状态。
S102,若终端的网络连接状态处于离线状态,则获取目标文档内容的文本标记语言,以及目标文档内容的校验脚本。
具体的,若计算机设备确定终端的网络连接状态处于离线状态,即终端与服务器之间不能进行通信,则可以获取目标文档内容的文本标记语言以及目标文档内容的校验脚本。其中,计算机设备可以预先在服务器中导出目标文档内容的文本标记语言和目标文档内容的校验脚本,存储至终端的本地磁盘中。其中,目标文档内容的文本标记语言可以是指HTML(全称HyperText Markup Language)超文本标记语言,该HTML超文本标记语言是一种网页的标准标记语言,可以包含图片、链接,甚至音乐、程序等非文字元素。计算机设备可以预先将HTML超文本标记语言对目标文档内容进行转换,得到目标文档内容的文本标记语言。对目标文档内容进行转换,得到目标文档内容的文本标记语言,这样,可以在编辑用户需要对目标文档内容进行浏览和编辑时,实现快速加载,以缩短目标文档内容的加载时间,提高编辑用户编辑目标文档内容的体验感。其中,目标文档内容的校验脚本包括权限校验脚本和内容校验脚本,该权限校验脚本用于对编辑用户的编辑权限进行校验,内容校验脚本用于对针对目标文档内容的编辑内容的合法性进行校验。其中,目标文档内容可以包括一个或者多个文档字段(如章节元素),内容校验脚本可以包括一个或者多个文档字段分别对应的标准字段属性,该标准字段属性可以包括标准字段格式、标准字段类型以及标准字段长度等属性。每个文档字段的标准字段属性用于验证该文档字段对应的字段值是否具有合法性,只有文档字段对应的字段值具有合法性时,才会该文档字段的字段值进行存储。即当文档字段的字段值不满足其对应的标准字段属性时,则可以确定该文档字段的字段值不具有合法性,当文档字段的字段值满足其对应的标准字段属性时,则可以确定该文档字段的字段值具有合法性。
S103,获取根据编辑指令所得到的编辑内容,调用校验脚本对编辑内容的合法性进行验证,得到验证结果。
具体的,编辑用户可以对目标文档内容进行编辑,终端可以响应编辑人员的编辑操作生成编辑指令,计算机设备可以获取根据编辑指令获取编辑人员输入的编辑内容,调用目标文档内容对应的校验脚本对该编辑内容的合法性进行验证,得到验证结果。该验证结果可以包括编辑内容具有合法性或者编辑内容不具有合法性。
可选的,校验脚本可以包括权限校验脚本,计算机设备调用校验脚本对编辑内容的合法性进行验证,得到验证结果的具体方式可以包括:获取编辑指令所对应的编辑用户的用户属性信息。根据用户属性信息以及权限校验脚本,对编辑用户的编辑权限进行校验,得到权限校验结果。若权限校验结果指示编辑用户具有对目标文档内容进行编辑的编辑权限,则生成指示编辑内容具有合法性的验证结果。若权限校验结果指示编辑用户不具有对目标文档内容进行编辑的编辑权限,则生成指示编辑内容不具有合法性的验证结果。
具体的,校验脚本包括权限验证脚本,该权限验证脚本用于对编辑用户的编辑权限进行验证,计算机设备可以获取编辑指令所对应的编辑用户的用户属性信息,即获取实施编辑操作的编辑用户的用户属性信息,该用户属性信息可以包括用户职位信息、用户信用信息、用户所属机构信息以及用户类型等。计算机设备可以根据编辑用户的用户属性信息和权限校验脚本,对编辑用户的编辑权限进行校验,得到权限校验结果,该权限校验结果可以包括编辑用户具有对目标文档内容进行编辑的编辑权限,或者,编辑用户不具有对目标文档内容进行编辑的编辑权限。若计算机设备确定权限校验结果指示编辑用户具有对目标文档内容进行编辑的编辑权限,则生成指示编辑内容具有合法性的验证结果。若计算机设备确定权限验证结果指示编辑用户不具有对目标文档内容进行编辑的编辑权限,则生成指示编辑内容不具有合法性的验证结果,并输出提示信息,以提示编辑用户不能对目标文档内容进行编辑。当计算机设备检测到编辑内容不具有合法性时,则将该不具有合法性的编辑内容删除,以减少存储压力。
可选的,计算机设备根据用户属性信息以及权限校验脚本,对编辑用户的编辑权限进行校验,得到权限校验结果的具体方式可以包括:获取权限校验脚本中的样本用户属性信息,样本用户属性信息是指具有编辑权限的用户的属性信息。确定编辑用户的用户属性信息和样本用户属性信息之间的用户相似度。若用户相似度大于或者等于目标阈值,则生成指示编辑用户具有对目标文档内容进行编辑的编辑权限的权限校验结果;若用户相似度小于目标阈值,则生成指示编辑用户不具有对目标文档内容进行编辑的编辑权限的权限校验结果。
具体的,计算机设备可以获取权限校验脚本中的样本用户属性信息,该样本用户属性信息是指具有编辑权限的用户的属性信息,如职业为目标职位、所属机构为目标机构、职位等级为目标职位等级以及编辑信用等级为目标信用等级等属性信息。计算机设备可以确定编辑用户的用户属性信息和样本用户属性信息之间的用户相似度,若编辑用户的用户属性信息和样本用户属性信息之间的用户相似度大于或者等于目标阈值,则可以确定编辑用户具有对目标文档内容进行编辑的编辑条件,并生成编辑用户具备对目标文档内容进行编辑的编辑权限的权限校验结果。若编辑用户的用户属性信息和样本用户属性信息之间的用户相似度小于目标阈值,则可以确定编辑用户不具备对目标文档内容进行编辑的编辑条件,并生成编辑用户不具有对目标文档内容进行编辑的编辑权限的权限校验结果。
可选的,校验脚本包括内容校验脚本,计算机设备调用校验脚本对编辑内容的合法性进行验证,得到验证结果的具体方式可以包括:获取编辑内容对应的编辑字段,从内容校验脚本中获取编辑字段的标准字段属性,标准字段属性包括标准字段格式和标准字段类型。对编辑内容进行解析,得到编辑内容对应的编辑字段的实际字段属性;实际字段属性包括实际字段格式和实际字段类型。将实际字段属性与标准字段属性进行比对,得到实际字段属性与标准字段属性之间的匹配度。若匹配度大于或等于匹配度阈值,则生成指示编辑内容具有合法性的验证结果;若匹配度小于匹配度阈值,则生成指示编辑内容不具有合法性的验证结果。
具体的,计算机设备可以获取编辑内容对应的编辑字段,即编辑用户对目标文档内容中哪些文档编辑进行编辑,如编辑用户对目标文档内容中“身高字段”进行编辑,则可以确定编辑内容对应的编辑字段为“身高字段”。其中,内容校验脚本中包括目标文档内容中一个或者多个文档字段分别对应的标准字段属性,该标准字段属性包括标准字段类型、标准字段格式以及标准字段长度等。计算机设备可以从内容校验脚本中获取编辑字段的标准字段属性,并对编辑内容进行解析,得到编辑内容对应的编辑字段的实际字段属性,该实际字段属性包括实际字段格式和实际字段类型等。计算机设备可以将编辑字段的实际字段属性和标准字段属性进行比对,得到实际字段属性和标准字段属性之间的匹配度。若计算机设备确定该匹配度大于匹配度阈值,则生成指示编辑内容具有合法性的验证结果。若计算机设备确定该匹配度小于或者等于匹配度阈值,则生成指示编辑内容不具有合法性的验证结果。例如,编辑用户A针对目标文档内容中的“身高字段”进行编辑,设置“身高字段”对应的字段值为“一米六”,则编辑内容“一米六”对应的编辑字段为“身高字段”。计算机设备可以从内容校验脚本中获取编辑字段的标注字段属性为数字类型,并对编辑内容“一米六”进行解析,得到编辑内容“一米六”对应的实际字段属性为文字类型。计算机设备可以获取编辑内容“一米六”的标准字段属性和实际字段属性之间的匹配度,即数字类型和文字类型之间的匹配度为0。计算机设备可以确定该匹配度0小于匹配度阈值1,则生成指示编辑内容不具有合法性的验证结果。
可选的,校验脚本可以包括权限校验脚本和内容校验脚本,计算机设备可以根据权限校验脚本对编辑用户的编辑权限进行校验,得到权限校验结果,具体内容可以参见上述的描述,本申请实施例在此不再赘述。计算机设备可以根据内容校验脚本对编辑内容的有效性进行校验,得到内容校验结果,具体内容可以参见上述对编辑内容的合法性的验证步骤的内容。根据权限校验结果和内容校验结果,得到关于编辑内容的合法性的校验结果。其中,若权限校验结果指示编辑用户具有对目标文档内容进行编辑的编辑权限,且内容校验结果指示编辑内容具有有效性,则生成编辑内容具有合法性的校验结果。若权限校验结果指示编辑用户不具有对目标文档内容进行编辑的编辑权限以及内容校验结果指示编辑内容不具有有效性,或者,若权限校验结果指示编辑用户不具有对目标文档内容进行编辑的编辑权限以及内容校验结果指示编辑内容具有有效性,或者,若权限校验结果指示编辑用户具有对目标文档内容进行编辑的编辑权限以及内容校验结果指示编辑内容不具有有效性,则生成编辑内容不具有合法性的校验结果。
可选的,用户属性信息可以包括用户标识、用户职位、用户所属机构以及用户等级等,计算机设备可以获取该编辑用户的用户标识,检测权限校验脚本包括的一个或者多个候选用户标识中,是否存在与编辑用户的用户标识相匹配的候选用户标记,该权限校验脚本包括的一个或者多个候选用户标记为具有对目标文档内容进行编辑的用户的标识。若计算机设备确定一个或者多个候选用户标识中存在与编辑用户的用户标识完全匹配的候选用户标识,则生成编辑用户具有对目标文档内容进行编辑的编辑权限的权限验证结果。若计算机设备确定一个或者多个候选用户标识中不存在与编辑用户的用户标识完全匹配的候选用户标识,则生成编辑用户不具有对目标文档内容进行编辑的编辑权限的权限验证结果。
可选的,用户属性信息可以包括用户职位信息,计算机设备可以获取编辑人员的用户职位信息,检测编辑用户的用户职位信息与权限校验脚本中的目标用户职位信息是否匹配。若计算机设备确定编辑用户的用户职位信息与权限校验脚本中的目标用户的用户职位信息相匹配,则可以生成编辑人员具有对目标文档内容进行编辑的编辑权限的权限验证结果。若计算机设备确定编辑用户的用户职位信息与权限校验脚本中的目标用户的用户职位信息不匹配,则可以生成编辑人员不具有对目标文档内容进行编辑的编辑权限的权限验证结果。
可选的,用户属性信息可以包括用户编辑等级,计算机设备可以获取编辑用户的历史编辑数据,根据该编辑用户的历史编辑数据确定编辑用户的用户编辑等级。若计算机设备确定编辑用户的用户编辑等级大于或者等于目标等级时,则可以生成编辑用户具有对目标文档内容进行编辑的编辑权限的权限验证结果。若计算机设备确定编辑用户的用户编辑等级小于目标等级时,则可以生成编辑用户不具有对目标文档内容进行编辑的编辑权限的权限验证结果。
S104,若验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言。
具体的,若计算机设备确定验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言。其中,编辑内容的文本标记语言可以是指XML(即ExtensibleMarkup Language)标记语言或JSON(即JavaScript Object Notation)标记语言。XML标记语言是指可扩展标记语言,用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。XML是标准通用标记语言,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据,非常适合用于网络传输。JSON标记语言是一种基于文本,独立于语言的轻量级数据交换格式,采用完全独立于编程语言的文本格式来存储和表示数据,JSON是一个序列化的对象或数组,以键值对结构形式存储内容。计算机设备对编辑内容进行语言转换,生成编辑内容的JSON标记语言时,可以将编辑内容所对应的编辑字段作为“键”,将编辑内容中编辑字段对应的字段值作为“值”,生成键值对,便于后续对目标文本内容的更新。计算机设备生成编辑内容的文本标记语言,采用该编辑内容的文本标记语言更新目标文本内容的文本标记语言,得到更新后的文本标记语言。这样,计算机设备可以将更新后的文本标记语言存储在编辑用户所属的终端本地的磁盘中。
可选的,计算机设备生成编辑内容的文本标记语言的具体方式可以包括:若验证结果指示编辑内容具有合法性,则获取编辑内容的编辑属性。从文本标记语言模板库中,查询与编辑内容的编辑属性匹配的目标文本标记语言模板;目标文本标记语言模板包括反映编辑属性和编辑属性的初始内容的文本标记语言。采用编辑内容替换目标文本标记语言模板中的初始内容,得到编辑内容的文本标记语言。
具体的,若计算机设备确定验证结果指示编辑内容具有合法性,则获取编辑内容的编辑属性,该编辑属性是指编辑用户对目标文档内容中哪些内容进行编辑,如编辑用户对目标文档内容中的身高字段进行编辑得到编辑内容,则该编辑内容的编辑属性为身高属性(即文档字段)。计算机设备可以从文本标记语言模板库中,查询与编辑内容的编辑属性相匹配的目标文本标记语言模板,文本标记语言模板库中包括多个候选编辑属性对应的文本标记语言模板。其中,计算机设备可以从文本标记语言模板库中,获取与编辑内容的编辑属性完全匹配的候选编辑属性,将与编辑内容的编辑属性完全匹配的候选编辑属性的文本编辑语言模板,确定为编辑内容的编辑属性的目标文本编辑语言模板。可选的,计算机设备也可以从文本标记语言模板库中,获取与编辑内容的编辑属性之间的匹配度大于或者等于目标阈值的候选编辑属性,将与编辑内容的编辑属性之间的匹配度大于或者等于目标阈值的候选编辑属性的文本编辑语言模板,确定为编辑内容的编辑属性的目标文本编辑语言模板。其中,目标文本标记语言模板包括反映编辑属性和编辑属性的初始内容的文本标记语言,如编辑属性为身高属性时,则该身高属性的目标文本标记语言模板可以包括反映身高属性的HTML超文本标记语言和反映身高属性的初始内容的HTML超文本标记语言。计算机设备可以根据目标文本标记语言模板中的文本标记语言的类型,对编辑内容进行转换,得到语言转换后的编辑内容,采用该编辑内容替换目标文本标记语言模板中的初始内容,得到编辑内容的文本标记语言,即将目标文本标记语言模板中的初始内容替换成语言转换后的编辑内容,得到编辑内容的文本标记语言。
S105,若终端的网络连接状态恢复至在线状态,则根据更新后的文本标记语言生成更新后的目标文档内容。
具体的,若计算机设备检测到终端的网络连接状态恢复至在线状态,即终端与服务器之间可以进行通信,则根据更新后的文本标记语言,对目标文本内容进行更新,得到更新后的目标文本内容。其中,计算机设备可以将存储至终端本地的更新后的文本标记语言发送给服务器,服务器可以根据更新后的文本标记语言所对应的编辑字段,在服务器的目标文档内容中查询编辑字段对应的目标文档字段,将目标文档字段对应的字段值更改为编辑内容中编辑字段对应的字段值。其中,服务器中的目标文档内容的文本标记语言可以与编辑内容的文本标记语言相同,如XML标记语言或JSON标记语言,便于对目标文档内容进行更新。例如,编辑用户对目标文本内容中的文档字段“身高字段”进行编辑得到编辑内容,计算机设备可以生成该编辑内容的文本标记语言,即将编辑内容生成XML标记语言或JSON标记语言。计算机设备可以采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言。其中,当计算机设备确定终端的网络连接状态恢复至在线状态时,则可以将存储至终端本地的更新后的文本标记语言发送给服务器器,这样,仅将编辑用户的编辑内容发送给服务器进行目标文档内容的更新,可以减轻数据传输压力,避免将更改后的整个目标文档内容发送给服务器,因数据量过大而导致传输速度慢等问题。
可选的,编辑用户可以对目标文档内容进行浏览和编辑,若计算机设备检测到针对目标文本内容的浏览操作(如滑动操作、滚动操作等),则可以获取该浏览操作所确定的文档浏览方向,如向下、向上、向左或者向右等。计算机设备可以根据文档浏览方向,在目标文档内容中确定加载文档内容和删除文档内容,该加载文档内容是指需要进行加载显示的文档内容,该删除文档内容是指需要删除的文档内容。其中,计算机设备可以确定编辑用户当前所浏览的当前文档内容,在目标文档内容中以当前文档内容为起点,在文档浏览方向上的文档内容中获取目标长度的文档内容,作为加载文档内容。例如,编辑用户当前浏览目标文档内容中的章节内容3,若文档浏览方向为向下,则计算机设备可以以章节内容3为起点,在章节内容3以下的文档内容中确定两个章节的文档内容,即章节内容4和章节内容5,作为加载文档内容。其中,计算机设备可以确定编辑用户当前所浏览的当前文档内容,在目标文档内容中获取与文档浏览方向相反的方向上的文档内容,在该与文档浏览方向相反的方向上的文档内容中确定目标长度的文档内容,作为删除文档内容。例如,编辑用户当前浏览目标文档内容中的章节内容3,若文档浏览方向为向下,则计算机设备与浏览方向相反的方向上的文档内容中(即章节内容1和章节内容2),确定删除文档内容,如可以将章节内容1确定为删除内容。
其中,计算机设备在目标文档内容中确定加载文档内容后,可以获取加载文档内容中的批注脚本,该批注脚本可以包括凸显内容位置(即用颜色对目标文档内容中的某个部分内容进行标注的位置)、批注内容位置(即对目标文档内容中某个部分内容添加注释的位置)。计算机设备可以根据加载文档内容中的批注脚本,对加载文档内容进行渲染显示,即对加载文档内容进行加载显示的同时,根据批注脚本在加载文档内容中显示凸显内容和批注内容。这样,编辑用户可以在浏览目标文档内容时,在目标文档内容中快速定位到凸显内容和批注内容,使目标文档内容具备离线审阅的功能。计算机设备可以对删除文档内容进行删除,这样,可以减少终端运行内存,进而提高文档内容的加载速度,提高编辑用户对目标文档内容的浏览和编辑的体验感。
本申请实施例中,若接收到终端针对目标文档内容的编辑指令,则检测终端的网络连接状态,若终端的网络连接状态处于离线状态,则获取目标文档内容的文本标记语言,以及目标文档内容的校验脚本。获取根据编辑指令所得到的编辑内容,调用校验脚本对编辑内容的合法性进行验证,得到验证结果。通过校验脚本对编辑内容的合法性进行验证,可以保证编辑用户输入合法的编辑内容,实现对目标文档内容的编辑进行有效管理,同时也可以保障目标文档内容编辑的安全性和私密性。若验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,这样通过生成编辑内容的文本标记语言可以实现对编辑内容进行有效存储,便于后续根据该编辑内容对目标文档内容进行更新。采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言。若终端的网络连接状态恢复至在线状态,则根据更新后的文本标记语言生成更新后的目标文档内容。可见,只有在编辑内容具有合法性时才根据编辑内容的文本标记语言对目标文档内容进行更新,避免出现编辑内容不合法时(如编辑内容中存在非法参数时),导致不能根据更新后的文本标记语言对目标文档内容进行更新存储,可以提高目标文档内容的离线编辑效率。通过本申请,可以实现目标文档内容的离线编辑,也可以提高目标文档内容的离线编辑效率。
请参见图3,图3是本申请实施例提供的一种文档内容处理方法的流程示意图。该文档内容处理方法可由计算机设备执行,该计算机设备可以为服务器(如上述图1中的服务器10),或者用户终端(如上述图1的用户终端集群中的任一用户终端),或者为服务器和用户终端组成的系统,本申请对此不做限定。如图3所示,该文档内容处理方法可以包括步骤S201-S210。
S201,获取初始文档内容对应的目标文档类型信息,获取文档库中M个样本文档分别对应的M个样本文档类型信息。
具体的,计算机设备可以获取初始文档内容对应的目标文档类型信息,该初始文档内容可以是指空白文档,也可以是指包括基础字段的文档,该目标文档类型信息可以是企业项目资金申请业务对应的文档模板、个人贷款申请业务对应的文档模型等,可以根据具体需求设置文档库中的文档模板。计算机设备可以文档库M个样本文档分别对应的M个样本文档类型信息,M为正整数,如M可以取值为1,2,3,..。
S202,确定目标文档类型信息分别与M个样本文档类型信息之间的M个类型相似度。
具体的,计算机设备可以确定目标文档类型信息分别与M个样本文档类型信息之间的M个类型相似度,即确定初始文档内容的目标文档类型信息,与每个样本文档类型信息之间的类型相似度。
S203,将M个类型相似度中最大的类型相似度所对应的样本文档,确定为目标样本文档,并获取目标样本文档的属性配置信息和校验规则。
具体的,计算机设备可以将M个类型相似度中最大的类型相似度所对应的样本文档,确定为目标样本文档,并获取该目标样本文档的属性配置信息和校验规则。其中,属性配置信息可以包括字段配置信息(即需要配置哪些文档字段)、文档初始化方式、文档存储方式以及每个文档字段的字段初始化方式、字段存储方式、字段样式以及字段校验规则等。其中,校验规则可以是指目标文档内容中每个文档字段的校验规则,即校验规则可以包括每个文档字段的标准字段格式、标准字段类型以及标注字段长度等。
S204,将目标样本文档的属性配置信息和校验规则,确定为与初始文档内容相关联的属性配置信息和校验规则。
具体的,计算机设备可以将目标样本文本的属性配置信息和校验规则,确定为与初始文档内容相关联的属性配置信息和校验规则。
S205,根据与初始文档内容相关联的属性配置信息和校验规则,对初始文档内容进行配置处理,得到目标文档内容。
具体的,计算机设备可以根据与初始文档内容相关联的属性配置信息和校验规则,对初始文档内容进行配置处理,得到目标文档内容。计算机设备得到目标文档内容后,可以将目标文档内容转换成HTML页面形式(即网页文本)进行存储,HTML(全称为HyperTextMarkup Language),是指“超文本”就是指页面内可以包含图片、链接,甚至音乐、程序等非文字元素。将目标文档内容以HTML存储方式存储,可以在编辑用户需要对目标文档内容进行编辑时实现快速加载,以缩短文档内容的加载时间,提高用户编辑目标文档内容的体验感。计算机设备还可以将目标文档内容中的各个文档字段转换成JOSN形式存储到服务器的数据库和缓存中。JSON是一种基于文本,独立于语言的轻量级数据交换格式。该JOSN存储方式可以以键值对的方式存储目标文档内容中的字段和字段值,这样,可以便于后续对目标文档内容中的章节内容(即文档字段和字段值)进行更新和复用。其中,目标文档内容中的各个文档字段可以分为表单类型和非表单类型,对于表单类型的文档字段可以设置其是否支持离线编辑。若表单类型的文档字段可以支持离线编辑,则可以设置该可离线编辑的文档字段对应的编辑框,编辑用户可以在离线的情况下在编辑框中输入编辑内容,进而对可离线编辑的文档字段进行编辑。若表单类型的文档字段不可以支持离线编辑,则编辑用户在离线的情况下不可以对该文档字段进行编辑。
可选的,初始文档内容的属性配置信息可以由编程人员自行定义,即目标文档内容中各个文档字段的属性配置信息可以由编程人员进行设置。在设计目标文档内容的文档字段时,可以通过编程人员自定义配置各个文档字段的属性配置信息,例如,可以设置文档字段的输入框是否必填内容,当文档字段的输入框设置为必填内容时,编辑用户必须要填入该文档字段的字段值才能提交。
可选的,计算机设备可以检测文档库中是否存在初始文档内容的目标文档类型,若文档库中存在目标文档类型,则获取目标文档类型所对应的样本文档内容的属性配置信息和校验规则,确定为与初始文档内容相关联的属性配置信息和校验规则。若文档库中不存在初始文档内容的目标文档类型,则可以输出文档创建提示信息,以提示编程人员进行创建目标文档类型的文档内容,并建立该目标文档类型与编程人员创建的文档内容之间的对应关系,将该对应关系存储至文档库中,便于后续用于查找目标文档类型对应的目标文档内容。这样,可以快速根据编程人员输入的目标文档类型确定目标文档内容,可以提高目标文档内容的创建效率。同时,编程人员可以根据具体需求,对目标文档内容中的章节元素的属性配置进行修改。
可选的,计算机设备还可以获取编程人员的历史文档配置记录,从历史文档配置记录中获取编程人员配置次数最多的文档内容,或者,配置次数大于或者等于目标次数的文档内容,将次数最多的文档内容,或者,配置次数大于或者等于目标次数的文档内容作为推荐文档内容。当检测到编程人员需要对初始文档内容进行配置时,向编程人员推荐该推荐文档内容。这样,可以提供编程人员配置文档内容的便利性,同时提高文档配置效率。
S206,若接收到终端针对目标文档内容的编辑指令,则检测终端的网络连接状态。
S207,若终端的网络连接状态处于离线状态,则获取目标文档内容的文本标记语言,以及目标文档内容的校验脚本。
S208,获取根据编辑指令所得到的编辑内容,调用校验脚本对编辑内容的合法性进行验证,得到验证结果。
S209,若验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言。
S210,若终端的网络连接状态恢复至在线状态,则根据更新后的文本标记语言生成更新后的目标文档内容。
具体的,步骤S206-步骤S210的具体内容可以参见上述图2中步骤S101-步骤S105的内容,本申请实施例在此不再赘述。
本申请实施例中,通过根据与初始文档内容相关联的属性配置信息和校验规则,对初始文档内容进行配置处理,得到目标文档内容。可见,可以通过对初始文档内容进行配置处理,得到目标文档内容的校验规则,便于对目标文档内容的编辑进行有效管理。若接收到终端针对目标文档内容的编辑指令,则检测终端的网络连接状态,若终端的网络连接状态处于离线状态,则获取目标文档内容的文本标记语言,以及目标文档内容的校验脚本。获取根据编辑指令所得到的编辑内容,调用校验脚本对编辑内容的合法性进行验证,得到验证结果。通过校验脚本对编辑内容的合法性进行验证,可以保证编辑用户输入合法的编辑内容,实现对目标文档内容的编辑进行有效管理,同时也可以保障目标文档内容编辑的安全性和私密性。若验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,这样通过生成编辑内容的文本标记语言可以实现对编辑内容进行有效存储,便于后续根据该编辑内容对目标文档内容进行更新。采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言。若终端的网络连接状态恢复至在线状态,则根据更新后的文本标记语言生成更新后的目标文档内容。可见,只有在编辑内容具有合法性时才根据编辑内容的文本标记语言对目标文档内容进行更新,避免出现编辑内容不合法时(如编辑内容中存在非法参数时),导致不能根据更新后的文本标记语言对目标文档内容进行更新存储,可以提高目标文档内容的离线编辑效率。通过本申请,可以实现目标文档内容的离线编辑,也可以提高目标文档内容的离线编辑效率。
请参见图4,图4是本申请实施例提供的一种文档内容处理装置的结构示意图。上述文档内容处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该文档内容处理装置为一个应用软件;该文档内容处理装置可以用于执行本申请实施例提供的文档内容处理方法中的相应步骤。如图4所示,该文档内容处理装置可以包括:检测模块11、第一获取模块12、验证模块13、更新模块14以及生成模块15。
检测模块11,用于若接收到终端针对目标文档内容的编辑指令,则检测终端的网络连接状态;
第一获取模块12,用于若终端的网络连接状态处于离线状态,则获取目标文档内容的文本标记语言,以及目标文档内容的校验脚本;
验证模块13,用于获取根据编辑指令所得到的编辑内容,调用校验脚本对编辑内容的合法性进行验证,得到验证结果;
更新模块14,用于若验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言;
生成模块15,用于若终端的网络连接状态恢复至在线状态,则根据更新后的文本标记语言生成更新后的目标文档内容。
其中,更新模块14包括:
第一获取单元1401,用于若验证结果指示编辑内容具有合法性,则获取编辑内容的编辑属性;
查询单元1402,用于从文本标记语言模板库中,查询与编辑内容的编辑属性匹配的目标文本标记语言模板;目标文本标记语言模板包括反映编辑属性和编辑属性的初始内容的文本标记语言;
替换单元1403,用于采用编辑内容替换目标文本标记语言模板中的初始内容,得到编辑内容的文本标记语言。
其中,校验脚本包括权限校验脚本;
验证模块13包括:
第二获取单元1301,用于获取编辑指令所对应的编辑用户的用户属性信息;
校验单元1302,用于根据用户属性信息以及权限校验脚本,对编辑用户的编辑权限进行校验,得到权限校验结果;
第一生成单元1303,用于若权限校验结果指示编辑用户具有对目标文档内容进行编辑的编辑权限,则生成指示编辑内容具有合法性的验证结果;
第二生成单元1304,用于若权限校验结果指示编辑用户不具有对目标文档内容进行编辑的编辑权限,则生成指示编辑内容不具有合法性的验证结果。
其中,校验单元1302具体用于:
获取权限校验脚本中的样本用户属性信息,样本用户属性信息是指具有编辑权限的用户的属性信息;
确定编辑用户的用户属性信息和样本用户属性信息之间的用户相似度;
若用户相似度大于或者等于目标阈值,则生成指示编辑用户具有对目标文档内容进行编辑的编辑权限的权限校验结果;
若用户相似度小于目标阈值,则生成指示编辑用户不具有对目标文档内容进行编辑的编辑权限的权限校验结果。
其中,校验脚本包括内容校验脚本;
验证模块13包括:
第三获取单元1305,用于获取编辑内容对应的编辑字段,从内容校验脚本中获取编辑字段的标准字段属性,标准字段属性包括标准字段格式和标准字段类型;
解析单元1306,用于对编辑内容进行解析,得到编辑内容对应的编辑字段的实际字段属性;实际字段属性包括实际字段格式和实际字段类型;
比对单元1307,用于将实际字段属性与标准字段属性进行比对,得到实际字段属性与标准字段属性之间的匹配度;
第三生成单元1308,用于若匹配度大于或等于匹配度阈值,则生成指示编辑内容具有合法性的验证结果;
第四生成单元1309,用于若匹配度小于匹配度阈值,则生成指示编辑内容不具有合法性的验证结果。
其中,文档内容处理装置还包括:
第二获取模块16,用于若检测到针对目标文档内容的浏览操作,则获取浏览操作所确定的文档浏览方向;
第一确定模块17,用于根据文档浏览方向,在目标文档内容中确定加载文档内容和删除文档内容;
渲染显示模块18,用于获取加载文档内容中的批注脚本,根据批注脚本对加载文档内容进行渲染显示;
删除处理模块19,用于对删除文档内容进行删除处理。
其中,文档内容处理装置还包括:
第三获取模块20,用于获取初始文档内容对应的目标文档类型信息,获取文档库中M个样本文档分别对应的M个样本文档类型信息;M为正整数;
第二确定模块21,用于确定目标文档类型信息分别与M个样本文档类型信息之间的M个类型相似度;
第四获取模块22,用于将M个类型相似度中最大的类型相似度所对应的样本文档,确定为目标样本文档,并获取目标样本文档的属性配置信息和校验规则;
第三确定模块23,用于将目标样本文档的属性配置信息和校验规则,确定为与初始文档内容相关联的属性配置信息和校验规则;
配置处理模块24,用于根据与初始文档内容相关联的属性配置信息和校验规则,对初始文档内容进行配置处理,得到目标文档内容。
应当理解,本申请实施例中所描述的文档内容处理装置可执行前文图2或者图3所对应实施例中对文档内容处理方法的描述,在此不再赘述。
本申请实施例中,通过根据与初始文档内容相关联的属性配置信息和校验规则,对初始文档内容进行配置处理,得到目标文档内容。可见,可以通过对初始文档内容进行配置处理,得到目标文档内容的校验规则,便于对目标文档内容的编辑进行有效管理。若接收到终端针对目标文档内容的编辑指令,则检测终端的网络连接状态,若终端的网络连接状态处于离线状态,则获取目标文档内容的文本标记语言,以及目标文档内容的校验脚本。获取根据编辑指令所得到的编辑内容,调用校验脚本对编辑内容的合法性进行验证,得到验证结果。通过校验脚本对编辑内容的合法性进行验证,可以保证编辑用户输入合法的编辑内容,实现对目标文档内容的编辑进行有效管理,同时也可以保障目标文档内容编辑的安全性和私密性。若验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,这样通过生成编辑内容的文本标记语言可以实现对编辑内容进行有效存储,便于后续根据该编辑内容对目标文档内容进行更新。采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言。若终端的网络连接状态恢复至在线状态,则根据更新后的文本标记语言生成更新后的目标文档内容。可见,只有在编辑内容具有合法性时才根据编辑内容的文本标记语言对目标文档内容进行更新,避免出现编辑内容不合法时(如编辑内容中存在非法参数时),导致不能根据更新后的文本标记语言对目标文档内容进行更新存储,可以提高目标文档内容的离线编辑效率。通过本申请,可以实现目标文档内容的离线编辑,也可以提高目标文档内容的离线编辑效率。
请参见图5,图5是本申请实施例提供的一种计算机设备的结构示意图。如图5所示,上述计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非易失性的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图5所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图5所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为目标用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
若接收到终端针对目标文档内容的编辑指令,则检测终端的网络连接状态;
若终端的网络连接状态处于离线状态,则获取目标文档内容的文本标记语言,以及目标文档内容的校验脚本;
获取根据编辑指令所得到的编辑内容,调用校验脚本对编辑内容的合法性进行验证,得到验证结果;
若验证结果指示编辑内容具有合法性,则生成编辑内容的文本标记语言,采用编辑内容的文本标记语言更新目标文档内容的文本标记语言,得到更新后的文本标记语言;
若终端的网络连接状态恢复至在线状态,则根据更新后的文本标记语言生成更新后的目标文档内容。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图2或者图3所对应实施例中对文档内容处理方法的描述,也可执行前文图4所对应实施例中对文档内容处理装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且计算机可读存储介质中存储有前文提及的文档内容处理装置所执行的计算机程序,且计算机程序包括程序指令,当处理器执行程序指令时,能够执行前文图2或者图3所对应实施例中对文档内容处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。作为示例,程序指令可被部署在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行,分布在多个地点且通过通信网络互连的多个计算设备可以组成区块链系统。
此外,需要说明的是:本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或者计算机程序可以包括计算机指令,该计算机指令可以存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器可以执行该计算机指令,使得该计算机设备执行前文图2或者图3所对应实施例中对文档内容处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机程序产品或者计算机程序实施例中未披露的技术细节,请参照本申请方法实施例的描述。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储器(Read-Only Memory,ROM)或随机存储器(Random Access Memory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (10)

1.一种文档内容处理方法,其特征在于,包括:
若接收到终端针对目标文档内容的编辑指令,则检测所述终端的网络连接状态;
若所述终端的网络连接状态处于离线状态,则获取所述目标文档内容的文本标记语言,以及所述目标文档内容的校验脚本;
获取根据所述编辑指令所得到的编辑内容,调用所述校验脚本对所述编辑内容的合法性进行验证,得到验证结果;
若所述验证结果指示所述编辑内容具有合法性,则生成所述编辑内容的文本标记语言,采用所述编辑内容的文本标记语言更新所述目标文档内容的文本标记语言,得到更新后的文本标记语言;
若所述终端的网络连接状态恢复至在线状态,则根据所述更新后的文本标记语言生成更新后的目标文档内容。
2.根据权利要求1所述的方法,其特征在于,所述若所述验证结果指示所述编辑内容具有合法性,则生成所述编辑内容的文本标记语言,包括:
若所述验证结果指示所述编辑内容具有合法性,则获取所述编辑内容的编辑属性;
从文本标记语言模板库中,查询与所述编辑内容的编辑属性匹配的目标文本标记语言模板;所述目标文本标记语言模板包括反映所述编辑属性和所述编辑属性的初始内容的文本标记语言;
采用所述编辑内容替换所述目标文本标记语言模板中的初始内容,得到所述编辑内容的文本标记语言。
3.根据权利要求1所述的方法,其特征在于,所述校验脚本包括权限校验脚本;
所述调用所述校验脚本对所述编辑内容的合法性进行验证,得到验证结果,包括:
获取所述编辑指令所对应的编辑用户的用户属性信息;
根据所述用户属性信息以及所述权限校验脚本,对所述编辑用户的编辑权限进行校验,得到权限校验结果;
若所述权限校验结果指示所述编辑用户具有对目标文档内容进行编辑的编辑权限,则生成指示所述编辑内容具有合法性的验证结果;
若所述权限校验结果指示所述编辑用户不具有对目标文档内容进行编辑的编辑权限,则生成指示所述编辑内容不具有合法性的验证结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述用户属性信息以及所述权限校验脚本,对所述编辑用户的编辑权限进行校验,得到权限校验结果,包括:
获取所述权限校验脚本中的样本用户属性信息,所述样本用户属性信息是指具有编辑权限的用户的属性信息;
确定所述编辑用户的用户属性信息和所述样本用户属性信息之间的用户相似度;
若所述用户相似度大于或者等于目标阈值,则生成指示所述编辑用户具有对所述目标文档内容进行编辑的编辑权限的权限校验结果;
若所述用户相似度小于目标阈值,则生成指示所述编辑用户不具有对所述目标文档内容进行编辑的编辑权限的权限校验结果。
5.根据权利要求1所述的方法,其特征在于,所述校验脚本包括内容校验脚本;
所述调用所述校验脚本对所述编辑内容的合法性进行验证,得到验证结果,包括:
获取所述编辑内容对应的编辑字段,从所述内容校验脚本中获取所述编辑字段的标准字段属性,所述标准字段属性包括标准字段格式和标准字段类型;
对所述编辑内容进行解析,得到所述编辑内容对应的编辑字段的实际字段属性;所述实际字段属性包括实际字段格式和实际字段类型;
将所述实际字段属性与所述标准字段属性进行比对,得到所述实际字段属性与所述标准字段属性之间的匹配度;
若所述匹配度大于或等于匹配度阈值,则生成指示所述编辑内容具有合法性的验证结果;
若所述匹配度小于所述匹配度阈值,则生成指示所述编辑内容不具有合法性的验证结果。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若检测到针对所述目标文档内容的浏览操作,则获取所述浏览操作所确定的文档浏览方向;
根据所述文档浏览方向,在所述目标文档内容中确定加载文档内容和删除文档内容;
获取所述加载文档内容中的批注脚本,根据所述批注脚本对所述加载文档内容进行渲染显示;
对所述删除文档内容进行删除处理。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取初始文档内容对应的目标文档类型信息,获取文档库中M个样本文档分别对应的M个样本文档类型信息;M为正整数;
确定所述目标文档类型信息分别与所述M个样本文档类型信息之间的M个类型相似度;
将所述M个类型相似度中最大的类型相似度所对应的样本文档,确定为目标样本文档,并获取所述目标样本文档的属性配置信息和校验规则;
将所述目标样本文档的属性配置信息和校验规则,确定为与所述初始文档内容相关联的属性配置信息和校验规则;
根据所述与初始文档内容相关联的属性配置信息和校验规则,对所述初始文档内容进行配置处理,得到目标文档内容。
8.一种文档内容处理装置,其特征在于,包括:
检测模块,用于若接收到终端针对目标文档内容的编辑指令,则检测所述终端的网络连接状态;
获取模块,用于若所述终端的网络连接状态处于离线状态,则获取所述目标文档内容的文本标记语言,以及所述目标文档内容的校验脚本;
验证模块,用于获取根据所述编辑指令所得到的编辑内容,调用所述校验脚本对所述编辑内容的合法性进行验证,得到验证结果;
更新模块,用于若所述验证结果指示所述编辑内容具有合法性,则生成所述编辑内容的文本标记语言,采用所述编辑内容的文本标记语言更新所述目标文档内容的文本标记语言,得到更新后的文本标记语言;
生成模块,用于若所述终端的网络连接状态恢复至在线状态,则根据所述更新后的文本标记语言生成更新后的目标文档内容。
9.一种计算机设备,其特征在于,包括:处理器和存储器;
所述处理器与存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使得所述计算机设备执行权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1-7任一项所述的方法。
CN202111446128.7A 2021-11-30 2021-11-30 文档内容处理方法、装置、设备及存储介质 Pending CN114139503A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111446128.7A CN114139503A (zh) 2021-11-30 2021-11-30 文档内容处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111446128.7A CN114139503A (zh) 2021-11-30 2021-11-30 文档内容处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114139503A true CN114139503A (zh) 2022-03-04

Family

ID=80386051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111446128.7A Pending CN114139503A (zh) 2021-11-30 2021-11-30 文档内容处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114139503A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115708105A (zh) * 2022-09-30 2023-02-21 中国电建集团国际工程有限公司 基于云平台下的文档离线编辑应用方法
CN116663504A (zh) * 2023-07-28 2023-08-29 北京尽微致广信息技术有限公司 协同文件编辑方法及装置、存储介质及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115708105A (zh) * 2022-09-30 2023-02-21 中国电建集团国际工程有限公司 基于云平台下的文档离线编辑应用方法
CN116663504A (zh) * 2023-07-28 2023-08-29 北京尽微致广信息技术有限公司 协同文件编辑方法及装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
KR101367928B1 (ko) 컨테이너 문서로의 원격 모듈 편입
US20150199307A1 (en) Pluggable Architecture For Optimizing Versioned Rendering of Collaborative Documents
US20160062963A1 (en) Synchronizing DOM Element References
CN108090351B (zh) 用于处理请求消息的方法和装置
CN111475757A (zh) 页面更新方法和装置
US10169005B2 (en) Consolidating and reusing portal information
CN114139503A (zh) 文档内容处理方法、装置、设备及存储介质
CN104252521A (zh) 使用预定项目模板的Web内容管理的方法和系统
EP1830275A1 (en) Information distribution system
WO2022111591A1 (zh) 页面生成方法和装置、存储介质和电子设备
US20130232424A1 (en) User operation detection system and user operation detection method
CN113377373A (zh) 基于解析引擎的页面加载方法、装置、计算机设备及介质
CN114118038A (zh) 表格文档在线编辑方法、装置、设备及介质
CN113382083B (zh) 一种网页截图方法和装置
CN110020358A (zh) 用于生成动态页面的方法和装置
CN114139502A (zh) 文档内容处理方法、装置、设备及存储介质
CN114817811B (zh) 一种网站解析方法和装置
CN115599386A (zh) 代码生成方法、装置、设备及存储介质
CN111427577A (zh) 代码处理方法、装置及服务器
CN113535587A (zh) 目标应用检测方法、装置及计算机设备
US10956659B1 (en) System for generating templates from webpages
KR20130029926A (ko) 웹 어플리케이션 설치 시스템 및 방법
CN113239670A (zh) 一种业务模板上传的方法、装置、计算机设备及存储介质
CN111783006A (zh) 页面的生成方法、装置、电子设备及计算机可读介质
CN111178025A (zh) 核电站运行导则的编辑方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination