WO2021219066A1

WO2021219066A1 - 文档处理方法、装置及电子设备

Info

Publication number: WO2021219066A1
Application number: PCT/CN2021/090886
Authority: WO
Inventors: 易玮玮
Original assignee: 维沃移动通信有限公司
Priority date: 2020-04-29
Filing date: 2021-04-29
Publication date: 2021-11-04
Also published as: EP4145334A4; US20230062959A1; EP4145334A1; CN111563366A

Abstract

一种文档处理方法、装置及电子设备，属于通信技术领域。该方法包括：获取第一文档的第一数据信息和第二文档的第二数据信息(101)；根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息(102)；将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档(103)；显示所述目标文档(104)。

Description

文档处理方法、装置及电子设备

相关申请的交叉引用

本申请主张在2020年4月29日在中国提交的中国专利申请No.202010354321.7的优先权，其全部内容通过引用包含于此。

技术领域

本申请属于通信技术领域，具体涉及一种文档处理方法、装置及电子设备。

背景技术

目前，在电脑及移动终端用户编辑和填写表格的过程中，当用户需要将一个填写过的旧表格或格式存在错误的表格迁移到新的格式正确的表格中时，一般需要用户将旧表格中填写好的项目逐一进行选择、复制和粘贴到新表格的对应待填项中；另一种方案是用户对照填写好的旧表格在新表格中逐一进行重新编辑和填写；还有一种方案是对照新的表格对之前填写的表格进行格式调整，达到新表格的要求。

现有的相似表格内容移植方法存在不足之处，对于第一种方案，需要用户手动逐一选择和复制粘贴，当用户在移动端进行操作时逐项的选择和复制十分不便，打开第二个表格进行粘贴也是如此，且容易造成新表格的格式改变，效率低下。

对于第二种方案，需要用户对之前已经填写过的表格内容在新的表格中全部或者大部分重新再填写一遍，过程重复，耗时耗力。且如果在手机移动端操作，由于屏幕大小和表格编辑软件的限制，同时打开两个表格已经十分困难，操作就更加不便。

对于第三种方案，对于表格的格式调整需要消耗用户大量时间，在电脑上进行操作可能造成格式不完全一样，后续材料提交不规范的情况。而在手机移动端进行表格的格式调整则受限于手机软件功能和视觉体验，不方便操作。

因此，现有的相似表格内容移植方案，存在操作复杂繁琐、耗时耗力的缺陷。

发明内容

本申请实施例的目的是提供一种文档处理方法、装置及电子设备，能够解决现有的相似表格内容移植方案，存在操作复杂繁琐且耗时耗力的问题。

为了解决上述技术问题，本申请是这样实现的：

第一方面，本申请实施例提供了一种文档处理方法，包括：

获取第一文档的第一数据信息和第二文档的第二数据信息；

根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息；

将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档；

显示所述目标文档。

第二方面，本申请实施例提供了一种文档处理装置，包括：

第一获取模块，用于获取第一文档的第一数据信息和第二文档的第二数据信息；

第二获取模块，用于根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息；

第一生成模块，用于将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档；

第一显示模块，用于显示所述目标文档。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

第四方面，本申请实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

第五方面，本申请实施例提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法。

第六方面，本申请实施例提供了一种计算机程序产品，其中，所述程序产品被存储在非易失的存储介质中，所述程序产品被至少一个处理器执行以实现如第一方面所述的方法。

第七方面，本申请实施例提供了一种电子设备，其中，所述电子设备被配置为执行如第一方面所述的方法。

在本申请实施例中，通过获取第一文档的第一数据信息和第二文档的第二数据信息，根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及在所述第一数据信息中获取与所述第二关键字相关联的目标数据信息，将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档，能够解决用户对文档的内容进行移植时存在操作复杂繁琐且耗时耗力的问题，并且可以一键完成移植过程，提升工作效率，减少人工和时间的消耗。

附图说明

图1是本申请实施例的文档处理方法流程图；

图2是本申请实施例的第一图像显示示意图之一；

图3是本申请实施例的第一图像显示示意图之二；

图4是本申请实施例的第一文档显示示意图之一；

图5是本申请实施例的待选表格列表示意图；

图6表示本申请实施例的文档处理装置的结构示意图；

图7表示本申请实施例的电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

在进行本发明实施例的说明时，首先对下面描述中所用到的一些概念进行解释说明。

待填项：word表格中需要填写的项目，如下表1中，“姓名”格后的空白格；

项目名：待填项前的名称，如下表1中的“姓名”格；

相似表格：若两个表格中，待填项的项目名存在许多重复，例如AB两个表格中都需要填写“姓名”、“性别”、“身份证”等，则AB两个表格称之为相似表格。

表1待填项与项目名的示例性表格

姓名

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的文档处理方法、装置及电子设备进行详细地说明。

如图1所示，本申请实施例提供了一种文档处理方法，包括：

步骤101，获取第一文档的第一数据信息和第二文档的第二数据信息。

需要说明的是，所述文档包括但不限于word表格等。下面可以以文档为表格的情况对本申请实施例进行详细说明。

具体的，所述第一文档的第一数据信息可以包括项目名以及与项目名对应的信息内容；所述第二文档的第二数据信息可以包括项目名和待填项，或者所述第二数据信息可以包括项目名以及与项目名对应的信息内容。其中，所述预设格式可以为字典格式，便于对第一数据信息和第二数据信息的遍历、对比、查询等。

例如：在第一文档为表格A时，所述第一文档的内容如下表2所示：

表2第一文档

姓名	A1	性别	A2
出生日期	A3	联系方式	A4
学历	A5	是否全日制	A6
工作单位	A7	工作年限	A8

其中，所述第一文档的第一数据信息的项目名包括：姓名、性别、出生日期、联系方式、学历、是否全日制、工作单位、工作年限等。与姓名对应的信息内容为A1，与性别对应的信息内容为A2，与出生日期对应的信息内容为A3等，在此不再一一列举。

在第二文档为表格B、且表格B中无填充内容时，所述第二文档的内容可以如下表3所示：

表3第二文档

姓名		性别
联系方式		身份证号
工作单位		单位性质
单位地址		单位法人

其中，所述第二文档的第二数据信息的项目名包括：姓名、性别、联系方式、身份证号、工作单位、单位性质、单位地址、单位法人等。

需要说明的是，所述第二文档中每一个项目名对应的信息内容不一定为待填项，表3仅为示例性说明，在此不做具体限定。

步骤102，根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息。

具体的，根据第二数据信息中的第一关键字，在第一数据信息中获取与第一关键字相匹配的第二关键字，以及在第一数据信息中获取与第二关键字相关联的目标数据信息，即：对所述第一文档中的第一数据信息和第二文档中的第二数据信息进行逐一比对，遍历第二文档中的第一关键字，对于每一个第一关键字在所述第一文档中进行搜索，获取与所述第一关键字匹配的第二关键字，并对第二关键字以及与所述第二关键字相关联的目标数据信息进行记录或标记。其中，所述第一关键字可以为第二文档的项目名，所述第二关键字为所述第一文档的项目名。

例如：如上表2和表3中，在所述第一文档中，与所述第一关键字相匹配的第二关键字为[“姓名”，“性别”，“联系方式”，“工作单元”]，所述目标数据信息为：与姓名对应的A1，与性别对应的A2，与联系方式对应的A4，与工作单元对应的A7。

步骤103，将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档。

具体的，将所述第二数据信息与所述目标数据信息以相同的预设格式进行合成，即让第二数据信息与目标数据信息的格式一致，便于将第一文档和第二文档中的内容进行自动合成，节省人力和时间，效率更高，准确性更高。其中，预设格式可以为字典格式等。

例如：如表2所示，第一数据信息的字典格式可以为：字典A：{“姓名”：“A1”，“性别”：“A2”，“出生日期”：“A3”等}；如表3所示，第二数据信息的字典格式可以为：字典B：{“姓名”：“”，“性别”：“”，“联系方式”：“”等}。

步骤104，显示所述目标文档。

具体的，在目标文档生成之后，用户可以根据需要对目标文档进行修改和编写，便于用户操作。

在本申请上述实施例中，通过获取第一文档的第一数据信息和第二文档的第二数据信息，根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及所述第一数据信息中与所述第二关键字相关联的目标数据信息，将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档，能够解决用户对文档的内容进行移植时存在操作复杂繁琐且耗时耗力的问题，通过上述实施例中的文档处理方法，可以一键完成移植过程，提升工作效率，减少人工和时间的消耗。

可选的，在所述步骤101之后，所述方法还包括：

将所述第一数据信息和所述第二数据信息以预设格式进行储存；

将所述第二文档进行复制，获取复制后的第三文档；

其中，所述步骤103，包括：

将储存的所述第一数据信息中的目标数据信息与储存的所述第二数据信息以所述预设格式进行合成，并并填充至所述第三文档中，生成可编辑的目标文档。

具体的，所述第三文档为复制后的第二文档，即所述第三文档与所述第二文档的内容、格式等全部相同，将所述第一数据信息和所述第二数据信息以相同的预设格式进行储存，不仅便于第一数据信息和所述第二数据信息的合成，而且便于提取数据信息。并且，将储存的第一数据信息中的目标数据信息与储存的第二数据信息合成，填充至第三文档中，即可生成可编辑的目标文档，不仅不会改变第二文档的格式和内容，还能够自动对相似的第一文档和第二文档进行信息移植，节省时间，提高工作效率。

需要说明的是，将所述第一数据信息和所述第二数据信息以预设格式进行储存的步骤与其他步骤的前后关系并不限定，也可以在步骤103之中将所述第一数据信息和所述第二数据信息以预设格式进行储存，在此不做具体限定。

例如：首先复制表格B(即第二文档)为新的表格C(即第三文档)，同时复制字典B信息，遍历步骤102中搜索的所有匹配项目名(即第一关键字)，对于每一个匹配项目名，将信息字典A中项目名对应的项目内容(即目标数据信息)填写到表格C的信息字典C中，得到填充后的表格C：{“姓名”：“A1”，“性别”：“A2”，“联系方式”：“A4”，“身份证号”：“”，“工作单位”：“A7”等}，返回并打开表格C，如下表4所示：

表4目标文档

姓名	A1	性别	A2
联系方式	A4	身份证号
工作单位	A7	单位性质
单位地址		单位法人

可选的，所述步骤101，包括：

接收用户对N个文档的第一输入，所述N为大于或等于2的正整数；

响应于所述第一输入，获取所述N个文档中的第一文档和第二文档；

识别并提取所述第一文档中的第一数据信息以及所述第二文档中的第二数据信息。

具体的，用户可以选择相似文档的第一文档和第二文档，并将所述第一文档和第二文档作为程序输入，识别并提取所述第一文档中的第一数据信息以及识别并提取所述第二文档中的第二数据信息，所述第一文档可以为已经填写项目名对应的信息内容的文档，所述第二文档可以为待填项目为空的文档。

需要说明的是，第一输入为选择性输入，在N个文档中选择第一文档和第二文档。所述第一输入可以为用户对第一文档和第二文档的按压、点击、滑动等输入，所述第一输入也可以为第一操作，在此不做具体限定。

例如：如上表2和表3所示，对表格A、表格B分别进行数据信息的提取，使用python中的扩展包docx，对表格A、表格B使用docx.Document()命令读取表格，遍历表格中的所有行，对于每一行，根据列位置区分项目名和待填项等，进行字典存储。并且，可以对目标数据信息对应的项目名通过加粗、标黄等形式显示出来，方便用户观看。

本申请上述实施例中，实现两个相似文档(如相似表格)之间的数据信息移植，对于具有一些相同项目名的表格，能够自动将已经填写的相关数据信息移植到新表格的对应位置，用户只需对新表格中特有的部分进行编辑填写即可，极大提升了工作效率。

可选的，所述步骤101可以包括：

获取第一图像；

接收用户对所述第一图像的第二输入；

响应于所述第二输入，通过图像识别技术将所述第一图像中的内容转换为第一文档；

识别并提取所述第一文档中的第一数据信息。

具体的，如图2所示，用户可以根据需要，对需要移植的表格进行拍照，获取关于表格的第一图像，并通过用户对第一图像的第二输入，可以在当前界面显示第一控制按钮(如：图3中的“表格识别”按钮)，通过用户对第一控制按钮的点击、按压等操作，可以通过目标检测网络对第一图像进行处理，检测第一图像中的表格部分，并使用文字识别网络提取表格中的文字内容以及对应的行列信息，通过行列信息得到项目名和每一个项目名对应的信息内容，根据得到的项目名和每一个项目名对应的信息内容进行表格重建，得到重建后的电子表格A，即第一文档，如图4所示，所述第一文档的显示方式可以为横屏显示，当然，也可以为竖屏显示，在此不做具体限定。在得到第一文档之后，可以识别并提取所述第一数据信息。

在显示第一文档的界面上可以显示第二控制按钮(如：图4中的表格A下方的“对比合并”按钮)，通过用户对第二控制按钮的点击、按压等操作，显示待选表格列表，用户可以根据需要选择合适的表格，在待选表格列表中，每一个表格待选项后面可以显示选择按钮，用户选择的表格后面的选择按钮中有“√”形显示，表示该表格已被选中，如图5所示，表格1为已选中表格，即表格1为第二文档，然后利用后端程序对表格1进行读取和逐行的数据信息提取，得到项目名和待填项的字典B。通过步骤102和步骤103将第一文档中的目标数据信息填充至第三文档中，即完成第一文档中的目标数据信息的移植，自动完成移植过程，提升工作效率，减少人工和时间的消耗。

需要说明的是，第二输入可以为用户对所述第一图像的按压、点击、滑动等输入，所述第二输入也可以为第二操作，在此不做具体限定。

可选的，所述步骤101包括：

获取第二图像；

接收用户对所述第二图像的第三输入；

响应于所述第三输入，通过图像识别技术将所述第二图像中的内容转换为第二文档；

识别并提取第二文档中的第二数据信息。

具体的，用户可以根据需要，对需要移植的表格进行拍照，获取关于表格的第二图像，并通过用户对第二图像的第三输入，可以在当前界面显示第一控制按钮，通过用户对第一控制按钮的点击、按压等操作，可以通过目标检测网络对第二图像进行处理，检测第二图像中的表格部分，并使用文字识别网络提取表格中的文字内容以及对应的行列信息，通过行列信息得到项目名和每一个项目名对应的待填项信息，根据得到项目名和每一个项目名对应的待填项信息进行表格重建，得到重建后的电子表格B，即第二文档，所述第二文档的显示方式可以为横屏显示也可以为竖屏显示，在此不做具体限定。在得到第二文档之后，可以识别并提取所述第二数据信息。

在显示第二文档的界面上可以显示第二控制按钮，通过用户对第二控制按钮的点击、按压等操作，显示待选表格列表，用户可以根据需要选择合适的表格，在待选表格列表中，每一个表格待选项后面可以显示选择按钮，用户选择的表格后面的选择按钮中有“√”形显示，表示该表格已被选中，然后利用后端程序对已选中的表格进行读取和逐行的数据信息提取，得到项目名和待填项的字典A。通过步骤102和步骤103将第一文档中的目标数据信息填充至第三文档中，即完成第一文档中的目标数据信息的移植，自动完成移植过程，提升工作效率，减少人工和时间的消耗。

本申请上述实施例中，能够实现两个相似文档(如相似表格)之间的数据信息移植，对于具有一些相同项目名的表格，能够自动将已经填写的相关数据信息移植到新表格的对应位置，用户只需对新表格中特有的部分进行编辑填写即可，极大提升了工作效率；并且，还能够对电子设备端用户自行拍摄的表格图像进行对比，将纸质的填写过的内容填充到待填的电子表格中，实现了纸质材料电子化的功能，减少用户查询表格的时间。

综上所述，本申请实施例中，根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息，将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档，可以将相似表格的内容移植完全程序化，用户只需选择两个相似表格，即可一键完成内容的移植，无需自行打开编辑等操作，提升工作效率，减少人工和时间消耗。

需要说明的是，本申请实施例提供的文档处理方法，执行主体可以为文档处理装置，或者该文档处理装置中的用于执行加载文档处理方法的控制模块。本申请实施例中以文档处理装置执行加载文档处理方法为例，说明本申请实施例提供的文档处理方法。

如图6所示，本申请实施例还提供了一种文档处理装置60，包括：

第一获取模块61，用于获取第一文档的第一数据信息和第二文档的第二数据信息；

第二获取模块62，用于根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息；

第一生成模块63，用于将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档；

第一显示模块64，用于显示所述目标文档。

可选的，所述装置还包括：

第一储存模块，用于将所述第一数据信息和所述第二数据信息以预设格式进行储存；

第一处理模块，用于将所述第二文档进行复制，获取复制后的第三文档；

其中，所述第一生成模块，包括：

第一生成单元，用于将储存的所述第一数据信息中的目标数据信息与储存的所述第二数据信息以所述预设格式进行合成，并填充至所述第三文档中，生成可编辑的目标文档。

可选的，所述第一获取模块61，包括：

第一接收单元，用于接收用户对N个文档的第一输入，所述N为大于或等于2的正整数；

第一响应单元，用于响应于所述第一输入，获取所述N个文档中的第一文档和第二文档；

第一处理单元，用于识别并提取所述第一文档中的第一数据信息以及所述第二文档中的第二数据信息。

可选的，所述第一获取模块61，包括：

第一获取单元，用于获取第一图像；

第二接收单元，用于接收用户对所述第一图像的第二输入；

第二响应单元，用于响应于所述第二输入，通过图像识别技术将所述第一图像中的内容转换为第一文档；

第二处理单元，用于识别并提取所述第一文档中的第一数据信息。

可选的，所述第一获取模块61，包括：

第二获取单元，用于获取第二图像；

第三接收单元，用于接收用户对所述第二图像的第三输入；

第三响应单元，用于响应于所述第三输入，通过图像识别技术将所述第二图像中的内容转换为第二文档；

第三处理单元，用于识别并提取第二文档中的第二数据信息。

本申请实施例中的文档处理装置可以是装置，也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备，也可以为非移动电子设备。示例性的，移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personal digital assistant，PDA)等，非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage，NAS)、个人计算机(personal computer，PC)、电视机(television，TV)、柜员机或者自助机等，本申请实施例不作具体限定。

本申请实施例中的文档处理装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统，可以为ios操作系统，还可以为其他可能的操作系统，本申请实施例不作具体限定。

本申请实施例提供的文档处理装置能够实现图1至图5的方法实施例中文档处理装置实现的各个过程，为避免重复，这里不再赘述。

综上所述，本申请实施例中，第一获取模块61获取第一文档的第一数据信息和第二文档的第二数据信息，第二获取模块62根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息，第一生成模块63将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档，可以将相似表格的内容移植完全程序化，用户只需选择两个相似表格，即可一键完成内容的移植，无需自行打开编辑等操作，提升工作效率，减少人工和时间消耗。

可选的，本申请实施例还提供一种电子设备，包括处理器，存储器，存储在存储器上并可在所述处理器上运行的程序或指令，该程序或指令被处理器执行时实现上述文档处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要注意的是，本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。

图7为实现本申请实施例的一种电子设备的硬件结构示意图。

该电子设备70包括但不限于：射频单元71、网络模块72、音频输出单元73、输入单元74、传感器75、显示单元76、用户输入单元77、接口单元78、存储器79、以及处理器80等部件。

本领域技术人员可以理解，电子设备70还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器80逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图7中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

其中，输入单元74，用于获取第一文档的第一数据信息和第二文档的第二数据信息；

处理器80，用于根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息；

处理器80，用于将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档；

显示单元76，用于显示所述目标文档。

本申请上述实施例中，通过输入单元74获取第一文档的第一数据信息和第二文档的第二数据信息，处理器80根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息，将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档，能够解决用户对文档的内容进行移植时存在操作复杂繁琐且耗时耗力的问题，一键完成移植过程，提升工作效率，减少人工和时间的消耗。

可选的，所述存储器79用于：将所述第一数据信息和所述第二数据信息以预设格式进行储存；

所述处理器80，用于将所述第二文档进行复制，获取复制后的第三文档；

所述处理器80具体用于：

将储存的所述第一数据信息中的目标数据信息与储存的所述第二数据信息以所述预设格式进行合成，并填充至所述第三文档中，生成可编辑的目标文档。

可选的，所述输入单元74具体用于：

所述处理器80具体用于：

可选的，所述输入单元74具体用于：

获取第一图像；

接收用户对所述第一图像的第二输入；

所述处理器80具体用于：

识别并提取所述第一文档中的第一数据信息。

可选的，所述输入单元74具体用于：

获取第二图像；

接收用户对所述第二图像的第三输入；

所述处理器80具体用于：

识别并提取第二文档中的第二数据信息。

综上所述，本申请实施例中，处理器80根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息，将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档，可以将相似表格的内容移植完全程序化，用户只需选择两个相似表格，即可一键完成内容的移植，无需自行打开编辑等操作，提升工作效率，减少人工和时间消耗。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述文档处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述文档处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

需要说明的是，应理解以上设备的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，第一获取模块可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上第一获取模块的功能。其它模块的实现与之类似。此外，这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，各个模块、单元、子单元或子模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(Application Specific Integrated Circuit，ASIC)，或，一个或多个微处理器(digital signal processor，DSP)，或，一个或者多个现场可编程门阵列(Field Programmable Gate Array，FPGA)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(Central Processing Unit，CPU)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，SOC)的形式实现。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

一种文档处理方法，包括：

获取第一文档的第一数据信息和第二文档的第二数据信息；

根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息；

将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档；

显示所述目标文档。
根据权利要求1所述的方法，其中，在所述获取第一文档的第一数据信息和第二文档的第二数据信息之后，所述方法还包括：

将所述第一数据信息和所述第二数据信息以预设格式进行储存；

将所述第二文档进行复制，获取复制后的第三文档；

其中，所述将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档，包括：

将储存的所述第一数据信息中的目标数据信息与储存的所述第二数据信息以所述预设格式进行合成，并填充至所述第三文档中，生成可编辑的目标文档。
根据权利要求1所述的方法，其中，所述获取第一文档的第一数据信息和第二文档的第二数据信息，包括：

接收用户对N个文档的第一输入，所述N为大于或等于2的正整数；

响应于所述第一输入，获取所述N个文档中的第一文档和第二文档；

识别并提取所述第一文档中的第一数据信息以及所述第二文档中的第二数据信息。
根据权利要求1所述的方法，其中，所述获取第一文档的第一数据信息，包括：

获取第一图像；

接收用户对所述第一图像的第二输入；

响应于所述第二输入，通过图像识别技术将所述第一图像中的内容转换为第一文档；

识别并提取所述第一文档中的第一数据信息。
根据权利要求1所述的方法，其中，获取第二文档的第二数据信息，包括：

获取第二图像；

接收用户对所述第二图像的第三输入；

响应于所述第三输入，通过图像识别技术将所述第二图像中的内容转换为第二文档；

识别并提取所述第二文档中的第二数据信息。
一种文档处理装置，包括：

第一获取模块，用于获取第一文档的第一数据信息和第二文档的第二数据信息；

第二获取模块，用于根据所述第二数据信息中的第一关键字，在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息；

第一生成模块，用于将所述第二数据信息与所述目标数据信息以预设格式进行合成，生成可编辑的目标文档；

第一显示模块，用于显示所述目标文档。
根据权利要求6所述的文档处理装置，还包括：

第一储存模块，用于将所述第一数据信息和所述第二数据信息以预设格式进行储存；

第一处理模块，用于将所述第二文档进行复制，获取复制后的第三文档；

其中，所述第一生成模块，包括：

第一生成单元，用于将储存的所述第一数据信息中的目标数据信息与储存的所述第二数据信息以所述预设格式进行合成，并填充至所述第三文档中，生成可编辑的目标文档。
根据权利要求6所述的文档处理装置，其中，所述第一获取模块，包括：

第一接收单元，用于接收用户对N个文档的第一输入，所述N为大于或等于2的正整数；

第一响应单元，用于响应于所述第一输入，获取所述N个文档中的第一文档和第二文档；

第一处理单元，用于识别并提取所述第一文档中的第一数据信息以及所述第二文档中的第二数据信息。
根据权利要求6所述的文档处理装置，其中，所述第一获取模块，包括：

第一获取单元，用于获取第一图像；

第二接收单元，用于接收用户对所述第一图像的第二输入；

第二响应单元，用于响应于所述第二输入，通过图像识别技术将所述第一图像中的内容转换为第一文档；

第二处理单元，用于识别并提取所述第一文档中的第一数据信息。
根据权利要求6所述的文档处理装置，其中，所述第一获取模块，包括：

第二获取单元，用于获取第二图像；

第三接收单元，用于接收用户对所述第二图像的第三输入；

第三响应单元，用于响应于所述第三输入，通过图像识别技术将所述第二图像中的内容转换为第二文档；

第三处理单元，用于识别并提取第二文档中的第二数据信息。
一种电子设备，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，其中，所述程序或指令被所述处理器执行时实现如权利要求1-5任一项所述的文档处理方法的步骤。
一种可读存储介质，其中，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1-5任一项所述的文档处理方法的步骤。
一种芯片，包括处理器和通信接口，其中，所述通信接口和所述处理器耦合，所述处理器用于运行程序，实现如权利要求1-5任一项所述的文档处理方法的步骤。
一种计算机程序产品，其中，所述程序产品被存储在非易失的存储介质中，所述程序产品被至少一个处理器执行以实现如权利要求1-5任一项所述的文档处理方法的步骤。
一种电子设备，其中，所述电子设备被配置为执行如权利要求1-5任一项所述的文档处理方法的步骤。