CN109815243A - 一种文档界面化修改时的结构化存储方法和装置 - Google Patents
一种文档界面化修改时的结构化存储方法和装置 Download PDFInfo
- Publication number
- CN109815243A CN109815243A CN201910124215.7A CN201910124215A CN109815243A CN 109815243 A CN109815243 A CN 109815243A CN 201910124215 A CN201910124215 A CN 201910124215A CN 109815243 A CN109815243 A CN 109815243A
- Authority
- CN
- China
- Prior art keywords
- document
- target
- segment
- original document
- modification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明提供了一种文档界面化修改时的结构化存储方法和装置,涉及文档处理的技术领域,包括:获取待处理文档和文档结构化标准;基于文档结构化标准,确定出待处理文档的界面化展示方案,待处理文档的碎片化和结构化切割片段规则;基于碎片化和结构化切割片段规则,将待处理文档切割为初始文档片段,存储初始文档片段和初始文档片段的属性信息;确定用户对目标初始文档片段对应的目标可编辑区域执行目标操作,根据目标操作对目标可编辑区域文档内容进行修改,并对修改后的目标初始文档片段进行结构化存储,解决了现有的文档界面化修改时的结构化存储方法中对文档进行修改时,会破坏文档原有结构化特征,导致修改后的文档无法结构化保存的技术问题。
Description
技术领域
本发明涉及文档处理技术领域,尤其是涉及一种文档界面化修改时的结构化存储方法和装置。
背景技术
技期刊论文XML文档如何能在线以友好的整体界面化形式下(如word、notepad等文档整体修改界面)修改,并且在修改后保存时,不会因为非结构化的操作导致破坏结构化特征,一直以来都是个难题。
但在科技期刊数字出版过程中,各个编校环节阶段的内容修改非常多;而正因为在修改过程中XML文档的结构化特征容易被破坏,导致修改后的XML文档不能结构化保存,因此目前为止,科技期刊数字出版普遍还在采用现有的非结构化状态下的对科技期刊论文进行排版和校对修改,最后将修改至最终定稿后的文档通过数据清洗过程来做到数字化、结构化和碎片化。这种科技期刊论文的先出版后数字化结构化的处理方法的效率低下,且成本很高。
针对上述问题,还未提出有效的解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种文档界面化修改时的结构化存储和装置,以缓解了现有的文档在统一界面化修改时的结构化存储方法中对文档进行修改时,会破坏文档原有结构化特征,导致修改后的文档无法结构化的保存技术问题。
第一方面,本发明实施例提供了一种文档界面化修改时的结构化存储方法,该方法包括:获取待处理文档和文档结构化标准;基于所述文档结构化标准,确定出所述待处理文档的界面化展示方案,以及确定出所述待处理文档的碎片化和结构化切割片段规则;基于所述碎片化和结构化切割片段规则,将所述待处理文档切割为初始文档片段,并存储所述初始文档片段和所述初始文档片段的属性信息,其中,所述初始文档片段的数量为多个,所述属性信息包括:所述初始文档片段在所述待处理文档中的节点ID信息,所述初始文档片段对应的标识项内容,所述初始文档片段的位置信息;基于所述界面化展示方案,将所述初始文档片段显示在终端设备的界面上;若确定出用户对目标初始文档片段对应的目标可编辑区域执行目标操作,则根据所述目标操作对所述目标可编辑区域文档内容进行修改,并基于修改之后的所述目标初始文档片段的属性信息,对修改之后的所述目标初始文档片段进行结构化存储。
进一步地,根据所述目标操作对所述目标可编辑区域内的文档内容进行修改包括:基于所述目标操作调用对应的编辑器,其中,所述编辑器用于获取用户输入的修改信息;若获取到用户在所述编辑器中输入的修改信息,则基于所述修改信息对所述目标可编辑区域内的文档内容进行修改。
进一步地,基于所述目标操作调用对应的编辑器包括:若所述目标初始文档片段为文本片段,且检测到用户对所述目标可编辑区域的所执行的目标操作为单击操作,则调用HTML编辑器;若所述目标初始文档片段为公式片段,且检测到用户对所述目标可编辑区域所执行的目标操作为双击操作,则调用latex公式编辑器。
进一步地,所述方法还包括:若所述目标初始文档片段为文本片段,且在检测到用户对所述目标可编辑区域的所执行的目标操作为单击操作之后,获取光标在所述目标可编辑区域内执行所述单击操作时的目标位置;将所述光标定位至所述目标位置。
进一步地,在基于所述修改信息对所述目标可编辑区域内的文档内容进行修改之后,所述方法还包括:在修改之后的所述目标初始文档片段中显示修改痕迹,并生成修改痕迹记录。
进一步地,在根据所述目标操作对所述目标可编辑区域内的文档内容进行修改之后,所述方法还包括:若检测到光标从所述目标可编辑区域内移动至所述目标可编辑区域外,则保存修改之后的所述目标初始文档片段。
第二方面,本发明实施例提供了一种文档界面化修改时的结构化存储装置,该装置包括:获取单元,确定单元,切割单元,展示单元和修改单元,其中,所述获取单元用于获取待处理文档和文档结构化标准;所述确定单元用于基于所述文档结构化标准,确定出所述待处理文档的界面化展示方案,以及确定出所述待处理文档的碎片化和结构化切割片段规则;所述切割单元用于基于所述碎片化和结构化切割片段规则,将所述待处理文档切割为初始文档片段,并存储所述初始文档片段和所述初始文档片段的属性信息,其中,所述初始文档片段的数量为多个,所述属性信息包括:所述初始文档片段在所述待处理文档中的节点ID信息,所述初始文档片段对应的标识项内容,所述初始文档片段的位置信息;所述展示单元用于基于所述界面化展示方案,在终端设备的显示界面上显示所述初始文档片段;所述修改单元用于若确定出用户对目标初始文档片段对应的目标可编辑区域执行目标操作,则根据所述目标操作对所述目标可编辑区域文档内容进行修改,并基于修改之后的所述目标初始文档片段的属性信息,对修改之后的所述目标初始文档片段进行结构化存储。
进一步地,所述修改单元还用于:基于所述目标操作调用对应的编辑器,其中,所述编辑器用于获取用户输入的修改信息;若获取到用户在所述编辑器中输入的修改信息,则基于所述修改信息对所述目标可编辑区域内的文档内容进行修改。
进一步地,所述修改单元还用于:若所述目标初始文档片段为文本片段,且确定出用户对所述目标可编辑区域的所执行的目标操作为单击操作,则调用HTML编辑器;若所述目标初始文档片段为公式片段,且确定出用户对所述目标可编辑区域所执行的目标操作为双击操作,则调用latex公式编辑器。
进一步地,所述装置还包括:定位单元,用于若所述目标初始文档片段为文本片段,且在确定出到用户对所述目标可编辑区域的所执行的目标操作为单击操作之后,获取光标在所述目标可编辑区域内执行所述单击操作时的目标位置;将所述光标定位至所述目标位置。
在本发明实施例中,通过对将待处理文档按照文档结构化标准进行片段化的分割,得到多个初始文档片段,当用户对目标初始文档片段对应的目标可编辑区域执行目标操作后,则可以根据目标操作对目标可编辑区域内的文档内容进行修改,并基于修改之后的目标初始文档片段的属性信息,对修改之后的目标初始文档片段进行结构化存储。
本发明中,由于每个初始文档片段在待处理文档中的位置已经由初始文档片段的属性信息确定,且在对初始文档片段修改时,是仅对初始文档片段的内容进行修改,然后基于修改之后的目标初始文档片段的属性信息,对修改之后的目标初始文档片段进行结构化存储,从而达到不会破坏文档结构的目的,进而解决了现有的文档界面化修改时的结构化存储方法中对文档进行界面化修改时,会破坏文档原有结构化特征,导致修改后的文档无法结构化保存的技术问题,从而实现了在不破坏文档结构的前提下,界面化修改文档内容的技术效果。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种文档界面化修改时的结构化存储方法的流程图;
图2为本发明实施例提供的另一种文档界面化修改时的结构化存储方法的流程图;
图3为本发明实施例提供的一种文档界面化修改时的结构化存储装置的示意图;
图4为本发明实施例提供的一种服务器的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据本发明实施例,提供了一种文档界面化修改时的结构化存储方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种文档界面化修改时的结构化存储方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取待处理文档和文档结构化标准;
步骤S104,基于所述文档结构化标准,确定出所述待处理文档的界面化展示方案,以及确定出所述待处理文档的碎片化和结构化切割片段规则;
步骤S106,于所述碎片化和结构化切割片段规则,将所述待处理文档切割为初始文档片段,并存储所述初始文档片段和所述初始文档片段的属性信息,其中,所述初始文档片段的数量为多个,所述属性信息包括:所述初始文档片段在所述待处理文档中的节点ID信息,所述初始文档片段对应的标识项内容,所述初始文档片段的位置信息;
步骤S108,基于所述界面化展示方案,将所述初始文档片段显示在终端设备的显示界面上;
步骤S110,若确定出用户对目标初始文档片段对应的目标可编辑区域执行目标操作,则根据所述目标操作对所述目标可编辑区域文档内容进行修改,并基于修改之后的所述目标初始文档片段的属性信息,对修改之后的所述目标初始文档片段进行结构化存储。
本发明中,由于每个初始文档片段在待处理文档中的位置已经由初始文档片段的属性信息确定,且在对初始文档片段修改时,是仅对初始文档片段的内容进行修改,然后基于修改之后的目标初始文档片段的属性信息,对修改之后的目标初始文档片段进行结构化存储,从而达到不会破坏文档结构的目的,进而解决了现有的文档界面化修改时的结构化存储方法中对文档进行界面化修改时,会破坏文档原有结构化特征,导致修改后的文档无法结构化保存的技术问题,从而实现了在不破坏文档结构的前提下,界面化修改文档内容的技术效果。
需要说明的是,上述的待处理文档可以为期刊,论文或其他类型的文档。
若上述的待处理文档为期刊或论文时,上述的初始片段对应的文档内容类型为:待处理文档的作者、待处理文档所属的单位、待处理文档的摘要、待处理文档的段落、待处理文档中的表格、待处理文档的参考文献等。
在执行步骤S106时,可以将待处理文档的作者切割为姓片段、名片段、地址标签片段等;将待处理文档所属的单位切割为单位名称片段、单位邮编片段、单位所属国别片段、单位所属城市片段等;待处理文档的可以切割为目的片段、方法片段、结果片段、结论片段等;待处理文档的段落可以切割为文字片段、引用片段(其中,引用片段包括:图引用片段、表引用片段、公式引用片段、文献引用片段)、行内公式片段、其他特殊字符片段等;待处理文档的表格主要切割为各单元格片段;待处理文档的参考文献可以切割为文献作者片段、文献标题片段、文献来源片段、文献发布年号片段、文献所属卷号片段、文献所属期号片段、文献的起始页码片段、文献的结束页码片段、文献的doi片段等。
另外,还需要说明的是在进行整体界面化展示的时候,将所有切割片段的组合到一个统一的HTML阅读页面整体集中展示,展示的同时,详细记录全部初始文档片段序列并存储到内存系统,包括初始文档片段的ID号,初始文档片段的内容,初始文档片段的标识项(比如字体字形的标识<spanstyle=”font-family:楷体_GB2312”>或者是文献引用的标识<xrefref-type="bibr"rid="b1">等等),以及初始文档片段在加载显示时的相对起点位置信息和长度信息。存储的全部初始文档片段序列按照XML结构化中的相对嵌套关系存储。
当用户通过光标点击整体HTML阅读界面的某个位置时,自动获取对应位置所对应的初始文档片段ID,获取初始文档片段内容,获取初始文档篇所在的位置信息,并在这个位置区域原地创建和加载调用一个HTML编辑器,使得这个初始文档片段区域变成可修改状态。
由于对目标初始文档片段进行修改后,修改之后的目标初始文档片段中的字符数量会发生变化,因此需要服务器对修改之后的目标初始文档片段的相对起点位置信息和长度信息再次进行计算,从而保证后续的各修改都能实时定位实时原位置调用编辑器修改。
在本发明实施例中,如图2所示,根据所述目标操作对所述目标可编辑区域内的文档内容进行修改包括:
步骤S11,基于所述目标操作调用对应的编辑器,其中,所述编辑器用于获取用户输入的修改信息;
步骤S12,若获取到用户在所述编辑器中输入的修改信息,则基于所述修改信息对所述目标可编辑区域内的文档内容进行修改。
在本发明实施例中,当根据用户光标位置确定出目标初始文档片段,从而获取到用户对目标可编辑区域的目标操作后,将基于该目标操作调用对应的编辑器。
在调用了编辑器后,如果编辑器获取到用户输入的修改信息,那么就根据修改信息对该可编辑区域内的内容进行修改。
在本发明实施例中,步骤S11还包括如下步骤:
步骤S21,若所述目标初始文档片段为文本片段,且检测到用户对所述目标可编辑区域的所执行的目标操作为单击操作,则调用HTML编辑器;
步骤S22,若所述目标初始文档片段为公式片段,且检测到用户对所述目标可编辑区域所执行的目标操作为双击操作,则调用latex公式编辑器。
在本发明实施例中,如果检测用户的目标操作为对文本片段对应的目标区域的单击操作,那么就调用HTML编辑器,以使用户能够通过该HTML编辑器直接对该文本片段的内容进行修改。
需要说明的是,在检测到用户对文本片段对应的目标可编辑区域的单击直接修改操作后,还可以获取光标在该目标可编辑区域内执行该单击直接修改操作时的坐标位置,因为在创建和调用编辑器时,光标会默认自动定位到该编辑器的头部,所以为了让修改操作能有直接定位的体验,还需要在加载调用HTML编辑器之后,再通过计算将光标定位到原坐标位置。
另外,还需要说明的是,当用户对文本片段的内容进行修改后,可以基于diff差异分析技术,分析出该文本片段与修改之后的文本片段之间的差异,从而生成文本内容修改痕迹,并将该修改痕迹显示在修改之后的文本片段中。
通过上述的步骤以使用户能够在对该文本片段的内容进行修改时,直接将光标定位到需要修改的文字所在的位置,进而解决了现有的文档界面化处理方法在对文本片段修改时,光标只能定位到该文本片段对应的目标可编辑区域的最前端,导致用户还需要再次进行光标移动的操作才能将光标移动至需要修改的文字所在的位置的技术问题,达到了减少了用户的操作步骤,提升用户体验的技术效果。
如果检测到用户对公式片段对应的目标可编辑区域的双击操作后,那么就调用并弹出具备交互功能的latex公式编辑器,以使用户通过该latex公式编辑器对该公式片段的内容进行修改。
需要说明的是,当调用了latex公式编辑器后,该编辑器中将以tex形式显示原公式的内容,以使用户可以直接在该编辑器中对该原公式的内容进行修改,从而达到对公式片段的内容进行修改的目的。
另外,还需要说明的是,当用户在latex公式编辑器中对公式片段的内容进行修改后,通过latexdiff差异分析方法分析出原公式的tex形式内容与修改后的公式tex形式内容之间的差异,从而生成公式内容的修改痕迹,并将该修改痕迹显示在修改后的公式片段中。
例如,原文本片段内容为12345,修改后的文本片段的内容为123456,则显示出的修改痕迹可以为6的文字颜色与12345的文字颜色不同;
或者,原文本片段内容为12345,修改后的文本片段的内容为12346,则显示出的修改痕迹可以为6的文字颜色为蓝色,1234的文字颜色为黑色,5的文字颜色为红色,且5上包含一条红色的横线,以表征5被删除。
另外,当用户在latex公式编辑器中对公式片段的内容进行修改后,将原公式的tex形式内容与修改后的公式tex形式内容组合为依赖多宏包的tex文件,从而生成相应的PDF文件,以PDF的形式展示修改后的公式片段。
另外,还需要说明的是,如果需要在HTML样式的待处理文档进行增加段落、表格行、单元格等操作时,可以在显示界面中添加特定的按钮,当检测用户对该按钮的按键操作后,调用HTML编辑器或latex公式编辑器,以使用户在编辑器中输入需要添加的内容,在完成内容添加后生成对应的文档片段,并根据该文档片段在HTML样式的待处理文档中位置,确定该文档片段属性信息,从而保证添加的文档片段不会破坏原HTML样式的待处理文档的结构。
在本发明实施例中,如图2所示,根据所述目标操作对所述目标可编辑区域内的文档内容进行修改之后,所述方法还包括如下步骤:
步骤S31,若检测到光标从所述目标可编辑区域内移动至所述目标可编辑区域外,并基于修改之后的所述目标初始文档片段的属性信息,对修改之后的所述目标初始文档片段进行结构化存储。
在本发明实施例中,在用户对目标可编辑区域内的文档内容修改完成后,如果检测到光标从该可编辑区域移动到该目标可编辑区域外,那么则基于修改之后的目标初始文档片段的属性信息,对修改之后目标初始文档片段进行结构化保存,并关闭并释放该目标初始文档对应的编辑器,从而达到节省内存的技术效果。
实施例二:
本发明还提供了一种文档界面化修改时的结构化存储装置,该装置用于执行本发明实施例上述内容所提供的文档界面化修改时的结构化存储方法,以下是本发明实施例提供的文档界面化修改时的结构化存储装置的具体介绍。
如图3所述,该装置包括:获取单元10,确定单元20,切割单元30展示单元40和修改单元50,其中,
所述获取单元10用于获取待处理文档和文档结构化标准;
所述确定单元20用于基于所述文档结构化标准,确定出所述待处理文档的界面化展示方案,以及确定出所述待处理文档的碎片化和结构化切割片段规则;
所述切割单元30用于基于所述碎片化和结构化切割片段规则,将所述待处理文档切割为初始文档片段,并存储所述初始文档片段和所述初始文档片段的属性信息,其中,所述初始文档片段的数量为多个,所述属性信息包括:所述初始文档片段在所述待处理文档中的节点ID信息,所述初始文档片段对应的标识项内容,所述初始文档片段的位置信息;
所述展示单元40用于基于所述界面化展示方案,将所述初始文档片段显示在终端设备的显示界面上;
所述修改单元50用于若确定出用户对目标初始文档片段对应的目标可编辑区域执行目标操作,则根据所述目标操作对所述目标可编辑区域文档内容进行修改,并基于修改之后的所述目标初始文档片段的属性信息,对修改之后的所述目标初始文档片段进行结构化存储。
本发明中,由于每个初始文档片段在待处理文档中的位置已经由初始文档片段的属性信息确定,且在对初始文档片段修改时,是仅对初始文档片段的内容进行修改,然后基于修改之后的目标初始文档片段的属性信息,对修改之后的目标初始文档片段进行结构化存储,从而达到不会破坏文档结构的目的,进而解决了现有的文档界面化修改时的结构化存储方法中对文档进行界面化修改时,会破坏文档原有结构化特征,导致修改后的文档无法结构化保存的技术问题,从而实现了在不破坏文档结构的前提下,界面化修改文档内容的技术效果。
可选地,所述修改单元还用于:基于所述目标操作调用对应的编辑器,其中,所述编辑器用于获取用户输入的修改信息;若获取到用户在所述编辑器中输入的修改信息,则基于所述修改信息对所述目标可编辑区域内的文档内容进行修改。
可选地,所述修改单元还用于:若所述目标初始文档片段为文本片段,且检测到用户对所述目标可编辑区域的所执行的目标操作为单击操作,则调用HTML编辑器;若所述目标初始文档片段为公式片段,且检测到用户对所述目标可编辑区域所执行的目标操作为双击操作,则调用latex公式编辑器。
可选地,所述装置还包括:定位单元,用于若所述目标初始文档片段为文本片段,且在检测到用户对所述目标可编辑区域的所执行的目标操作为单击操作之后,获取光标在所述目标可编辑区域内执行所述单击操作时的目标位置;将所述光标定位至所述目标位置。
可选地,所述装置还包括:修改痕迹显示单元,用于在修改之后的所述目标初始文档片段中显示修改痕迹。
可选地,所述装置还包括:保存单元,用于若检测到光标从所述目标可编辑区域内移动至所述目标可编辑区域外,则基于修改之后的所述目标初始文档片段的属性信息,对修改之后的所述目标初始文档片段进行结构化存储。
参见图4,本发明实施例还提供一种服务器100,包括:处理器60,存储器61,总线62和通信接口63,所述处理器60、通信接口63和存储器61通过总线62连接;处理器60用于执行存储器61中存储的可执行模块,例如计算机程序。
其中,存储器61可能包含高速随机存取存储器(RAM,RandomAccessMemory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口63(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线62可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器61用于存储程序,所述处理器60在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器60中,或者由处理器60实现。
处理器60可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器60中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器60可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器61,处理器60读取存储器61中的信息,结合其硬件完成上述方法的步骤。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种文档界面化修改时的结构化存储方法,其特征在于,应用于服务器,包括:
获取待处理文档和文档结构化标准;
基于所述文档结构化标准,确定出所述待处理文档的界面化展示方案,以及确定出所述待处理文档的碎片化和结构化切割片段规则;
基于所述碎片化和结构化切割片段规则,将所述待处理文档切割为初始文档片段,并存储所述初始文档片段和所述初始文档片段的属性信息,其中,所述初始文档片段的数量为多个,所述属性信息包括:所述初始文档片段在所述待处理文档中的节点ID信息,所述初始文档片段对应的标识项内容,所述初始文档片段的位置信息;
基于所述界面化展示方案,将所述初始文档片段显示在终端设备的显示界面上;
若确定出用户对目标初始文档片段对应的目标可编辑区域执行目标操作,则根据所述目标操作对所述目标可编辑区域文档内容进行修改,并基于修改之后的所述目标初始文档片段的属性信息,对修改之后的所述目标初始文档片段进行结构化存储。
2.根据权利要求1所述的方法,其特征在于,根据所述目标操作对所述目标可编辑区域内的文档内容进行修改包括:
基于所述目标操作调用对应的编辑器,其中,所述编辑器用于获取用户输入的修改信息;
若获取到用户在所述编辑器中输入的修改信息,则基于所述修改信息对所述目标可编辑区域内的文档内容进行修改。
3.根据权利要求2所述的方法,其特征在于,基于所述目标操作调用对应的编辑器包括:
若所述目标初始文档片段为文本片段,且确定出用户对所述目标可编辑区域的所执行的目标操作为单击操作,则调用HTML编辑器;
若所述目标初始文档片段为公式片段,且确定出用户对所述目标可编辑区域所执行的目标操作为双击操作,则调用latex公式编辑器。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若所述目标初始文档片段为文本片段,且在确定出到用户对所述目标可编辑区域的所执行的目标操作为单击操作之后,获取光标在所述目标可编辑区域内执行所述单击操作时的目标位置;
将所述光标定位至所述目标位置。
5.根据权利要求2所述的方法,其特征在于,在基于所述修改信息对所述目标可编辑区域内的文档内容进行修改之后,所述方法还包括:
在修改之后的所述目标初始文档片段中显示修改痕迹,并生成修改痕迹记录。
6.根据权利要求1所述的方法,其特征在于,在根据所述目标操作对所述目标可编辑区域内的文档内容进行修改之后,所述方法还包括:
若检测到光标从所述目标可编辑区域内移动至所述目标可编辑区域外,并基于修改之后的所述目标初始文档片段的属性信息,对修改之后的所述目标初始文档片段进行结构化存储。
7.一种文档界面化修改时的结构化存储装置,其特征在于,应用于服务器,包括:获取单元,确定单元,切割单元,展示单元和修改单元,其中,
所述获取单元用于获取待处理文档和文档结构化标准;
所述确定单元用于基于所述文档结构化标准,确定出所述待处理文档的界面化展示方案,以及确定出所述待处理文档的碎片化和结构化切割片段规则;
所述切割单元用于基于所述碎片化和结构化切割片段规则,将所述待处理文档切割为初始文档片段,并存储所述初始文档片段和所述初始文档片段的属性信息,其中,所述初始文档片段的数量为多个,所述属性信息包括:所述初始文档片段在所述待处理文档中的节点ID信息,所述初始文档片段对应的标识项内容,所述初始文档片段的位置信息;
所述展示单元用于基于所述界面化展示方案,在终端设备的显示界面上显示所述初始文档片段;
所述修改单元用于若确定出用户对目标初始文档片段对应的目标可编辑区域执行目标操作,则根据所述目标操作对所述目标可编辑区域文档内容进行修改,并基于修改之后的所述目标初始文档片段的属性信息,对修改之后的所述目标初始文档片段进行结构化存储。
8.根据权利要求7所述的装置,其特征在于,所述修改单元还用于:
基于所述目标操作调用对应的编辑器,其中,所述编辑器用于获取用户输入的修改信息;
若获取到用户在所述编辑器中输入的修改信息,则基于所述修改信息对所述目标可编辑区域内的文档内容进行修改。
9.根据权利要求8所述的装置,其特征在于,所述修改单元还用于:
若所述目标初始文档片段为文本片段,且确定出用户对所述目标可编辑区域的所执行的目标操作为单击操作,则调用HTML编辑器;
若所述目标初始文档片段为公式片段,且确定出用户对所述目标可编辑区域所执行的目标操作为双击操作,则调用latex公式编辑器。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
定位单元,用于若所述目标初始文档片段为文本片段,且在确定出到用户对所述目标可编辑区域的所执行的目标操作为单击操作之后,获取光标在所述目标可编辑区域内执行所述单击操作时的目标位置;
将所述光标定位至所述目标位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910124215.7A CN109815243B (zh) | 2019-02-18 | 2019-02-18 | 一种文档界面化修改时的结构化存储方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910124215.7A CN109815243B (zh) | 2019-02-18 | 2019-02-18 | 一种文档界面化修改时的结构化存储方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109815243A true CN109815243A (zh) | 2019-05-28 |
CN109815243B CN109815243B (zh) | 2020-03-03 |
Family
ID=66606917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910124215.7A Active CN109815243B (zh) | 2019-02-18 | 2019-02-18 | 一种文档界面化修改时的结构化存储方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109815243B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110633461A (zh) * | 2019-09-10 | 2019-12-31 | 北京百度网讯科技有限公司 | 文档检测处理方法、装置、电子设备和存储介质 |
CN111563065A (zh) * | 2020-07-09 | 2020-08-21 | 北京联想协同科技有限公司 | 一种文档保存方法、装置及计算机可读存储介质 |
CN111859850A (zh) * | 2020-07-29 | 2020-10-30 | 厦门亿联网络技术股份有限公司 | 富文本片段整体化的方法、装置、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1462401A (zh) * | 2001-03-23 | 2003-12-17 | 松下电器产业株式会社 | 文档数据处理器、服务器设备、终端设备、和文档数据处理系统 |
CN101008960A (zh) * | 2006-01-26 | 2007-08-01 | 株式会社理光 | 信息处理设备,信息处理方法,以及计算机程序产品 |
CN101271463A (zh) * | 2007-06-22 | 2008-09-24 | 北大方正集团有限公司 | 版式文件逻辑结构信息的表示方法和系统 |
CN101308488B (zh) * | 2008-06-05 | 2010-06-02 | 北京大学 | 基于版式文件的文档流式信息处理方法及装置 |
CN107153633A (zh) * | 2016-03-02 | 2017-09-12 | 北大方正集团有限公司 | 在线文档文件的切分方法和在线文档文件的切分系统 |
CN107358120A (zh) * | 2017-07-06 | 2017-11-17 | 珠海市魅族科技有限公司 | 文档编辑方法及装置、终端设备及计算机可读存储介质 |
CN107391478A (zh) * | 2017-08-15 | 2017-11-24 | 北京北信源软件股份有限公司 | 一种在线文档编辑方法与装置 |
CN107851089A (zh) * | 2015-06-29 | 2018-03-27 | 微软技术许可有限责任公司 | 变形文档 |
-
2019
- 2019-02-18 CN CN201910124215.7A patent/CN109815243B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1462401A (zh) * | 2001-03-23 | 2003-12-17 | 松下电器产业株式会社 | 文档数据处理器、服务器设备、终端设备、和文档数据处理系统 |
CN101008960A (zh) * | 2006-01-26 | 2007-08-01 | 株式会社理光 | 信息处理设备,信息处理方法,以及计算机程序产品 |
CN101271463A (zh) * | 2007-06-22 | 2008-09-24 | 北大方正集团有限公司 | 版式文件逻辑结构信息的表示方法和系统 |
CN101308488B (zh) * | 2008-06-05 | 2010-06-02 | 北京大学 | 基于版式文件的文档流式信息处理方法及装置 |
CN107851089A (zh) * | 2015-06-29 | 2018-03-27 | 微软技术许可有限责任公司 | 变形文档 |
CN107153633A (zh) * | 2016-03-02 | 2017-09-12 | 北大方正集团有限公司 | 在线文档文件的切分方法和在线文档文件的切分系统 |
CN107358120A (zh) * | 2017-07-06 | 2017-11-17 | 珠海市魅族科技有限公司 | 文档编辑方法及装置、终端设备及计算机可读存储介质 |
CN107391478A (zh) * | 2017-08-15 | 2017-11-24 | 北京北信源软件股份有限公司 | 一种在线文档编辑方法与装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110633461A (zh) * | 2019-09-10 | 2019-12-31 | 北京百度网讯科技有限公司 | 文档检测处理方法、装置、电子设备和存储介质 |
CN110633461B (zh) * | 2019-09-10 | 2024-01-16 | 北京百度网讯科技有限公司 | 文档检测处理方法、装置、电子设备和存储介质 |
CN111563065A (zh) * | 2020-07-09 | 2020-08-21 | 北京联想协同科技有限公司 | 一种文档保存方法、装置及计算机可读存储介质 |
CN111563065B (zh) * | 2020-07-09 | 2020-12-11 | 北京联想协同科技有限公司 | 一种文档保存方法、装置及计算机可读存储介质 |
CN111859850A (zh) * | 2020-07-29 | 2020-10-30 | 厦门亿联网络技术股份有限公司 | 富文本片段整体化的方法、装置、电子设备及存储介质 |
CN111859850B (zh) * | 2020-07-29 | 2024-05-10 | 厦门亿联网络技术股份有限公司 | 富文本片段整体化的方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109815243B (zh) | 2020-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109508191B (zh) | 一种代码生成方法及系统 | |
US7870503B1 (en) | Technique for analyzing and graphically displaying document order | |
CN109815243A (zh) | 一种文档界面化修改时的结构化存储方法和装置 | |
JP6090850B2 (ja) | ソースプログラム解析システム、ソースプログラム解析方法およびプログラム | |
CN109657220A (zh) | Pdf文档的在线编辑方法、装置及电子设备 | |
CN109271598B (zh) | 一种抽取新闻网页内容的方法、装置及存储介质 | |
CN109710771A (zh) | 表格信息提取方法、装置和存储介质 | |
WO2016095502A1 (zh) | 数学公式处理方法、装置、设备和计算机存储介质 | |
JP2008052312A (ja) | 業務仕様抽出支援システム | |
CN108446136B (zh) | 一种元素代码的提取方法及系统 | |
CN113283216A (zh) | 网页内容显示方法、装置、设备及存储介质 | |
KR20160119163A (ko) | 프로그램 | |
CN110825745B (zh) | 页面的生成方法及装置 | |
US8701086B2 (en) | Simplifying analysis of software code used in software systems | |
CN108694043B (zh) | 页面装修方法和系统 | |
CN113918789A (zh) | 一种web页面元素查找方法及装置与计算设备 | |
KR102457962B1 (ko) | 논문의 메타데이터 추출 방법 및 장치 | |
US20240061993A1 (en) | Multi-component abstract association and fusion method and apparatus in page design | |
JP2012027743A (ja) | 階層構造の解析・出力方法、および、その情報処理装置、プログラム。 | |
CN113177392B (zh) | 校对界面中行段信息同步方法、计算设备及存储介质 | |
CN113704492B (zh) | 一种老年照护数据知识图谱的构建方法及系统 | |
CN108984709A (zh) | 一种数据导入方法、装置和计算机可读介质 | |
CN115421691A (zh) | 一种基于虚拟列表的数据滚动方法、装置及计算机设备 | |
US11514241B2 (en) | Method, apparatus, and computer-readable medium for transforming a hierarchical document object model to filter non-rendered elements | |
CN110991147B (zh) | 一种字体检测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |