CN112257450A

CN112257450A - 数据处理方法、装置、可读存储介质及设备

Info

Publication number: CN112257450A
Application number: CN202011278359.7A
Authority: CN
Inventors: 王铮; 罗朝亮; 胡林红; 李冠灿; 雍小瓦; 刘志煌
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-11-16
Filing date: 2020-11-16
Publication date: 2021-01-22

Abstract

本发明实施例提供一种数据处理方法、装置、可读存储介质及设备，获取目标文本后，对目标文本进行实体词提取，得到实体词集合；根据实体词集合生成字段集合；显示实体词集合和字段集合，其中，至少部分实体词与字段集合中的字段一一对应显示。基于本申请的方案，可以实现字段的自动生成，并自动将字段与对应的实体词一一对应显示，实现了至少部分信息的自动输入，从而可以减少用户手动输入信息的信息量，提高数据输入效率。

Description

数据处理方法、装置、可读存储介质及设备

技术领域

本发明涉及数据处理技术领域，具体涉及一种数据处理方法、装置、可读存储介质及设备。

背景技术

在政企机构中，工作人员常常要对数据(比如，政务数据，业务数据等)进行可视化分析，以为工作决策提供支持。这就需要将数据输入到数据处理系统中，由数据处理系统对数据进行可视化。

目前的数据处理系统都是由用户手动制作表单，并将数据输入到表单的各个字段中，导致数据输入效率低。

发明内容

有鉴于此，本发明实施例提供一种数据处理方法、装置、可读存储介质及设备，以提高数据输入效率。

为实现上述目的，本发明实施例提供如下技术方案：

一方面，提供一种数据处理方法，包括：

获取目标文本；

对所述目标文本进行实体词提取，得到实体词集合；

根据所述实体词集合生成字段集合；

显示所述实体词集合和所述字段集合，其中，至少部分实体词与所述字段集合中的字段一一对应显示。

第二方面，提供一种数据处理装置，包括：

获取模块，用于获取目标文本；

提取模块，用于对所述目标文本进行实体词提取，得到实体词集合；

生成模块，用于根据所述实体词集合生成字段集合；

显示模块，用于显示所述实体词集合和所述字段集合，其中，至少部分实体词与所述字段集合中的字段一一对应显示。

第三方面，提供一种数据处理设备，包括存储器和处理器；

所述存储器，用于存储计算机程序；

所述处理器，用于执行所述计算机程序，实现如上所述的数据处理方法的各个步骤。

第四方面，提供一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现如上所述的数据处理方法的各个步骤。

本发明实施例提供的数据处理方法、装置、可读存储介质及设备，获取目标文本后，对目标文本进行实体词提取，得到实体词集合；根据实体词集合生成字段集合；显示实体词集合和字段集合，其中，至少部分实体词与字段集合中的字段一一对应显示。基于本申请的方案，可以实现字段的自动生成，并自动将字段与对应的实体词一一对应显示，实现了至少部分信息的自动输入，从而可以减少用户手动输入信息的信息量，提高数据输入效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的数据处理方法的一种实现流程图；

图2为本发明实施例提供的用于输入数据的初始界面的示例图；

图3为本发明实施例提供的界面中包括三种输入接口的示例图；

图4为本发明实施例提供的用户点击“确认”按钮后显示的包含字段和实体词的界面示例图；

图5为本发明实施例提供的显示界面包括通用字段时的一种示例图；

图6为本发明实施例提供的数据处理装置的一种结构示意图；

图7为本发明实施例提供的数据处理设备的硬件结构框图的示例图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请实施例提供的数据处理方法的一种实现流程图如图1所示，可以包括：

步骤S101：获取目标文本。

本申请实施例中，获取目标文本的方式可以有多种，比如，

获取输入的目标文本，具体的，可以通过文本输入框获取目标文本，该文本输入框内的目标文本由用户拷贝到输入框内。或者，

可以通过对图像进行字符识别得到目标文本，上述图像可以是由用户输入的包含目标文本的图像。或者，

可以通过对语音数据进行语音识别得到目标文本，上述语音数据可以是由用户输入的携带目标文本的语音。

步骤S102：对目标文本进行实体词提取，得到实体词集合。

所提取的实体词可以包括但不限于以下列举的几种实体词中的至少一种：人名、地名、项目名、组织机构名、时间、日期、货币、百分比等等。

可选的，可以利用训练好的实体词提取模型从目标文本中提取实体词。其中，实体词提取模型的输入为目标文本，输出为目标文本中包括的实体词。可以通过如下方式训练得到实体词提取模型：

将训练样本输入实体词提取模型，得到实体词预测结果。

根据实体词预测结果与训练样本对应的标签的差异对实体词提取模型的参数进行更新。训练样本对应的标签为训练样本中包含的实体词。

循环执行上述两个步骤直至满足训练结束条件(比如，达到预置的循环次数，或者，实体词预测结果以及训练样本对应的标签的差异小于一定值等)，得到训练好的实体词提取模型。

步骤S103：根据实体词集合生成字段集合。

可以针对每个实体词，确定该实体词对应的字段，该实体词对应的字段可以是该实体词的上位词。

在一些实施例中，每个实体词都可以确定一个上位词，此时，字段集合中字段的数量等于实体词集合中实体词的数量。比如，对于任意一个实体词，可以利用预先训练好的上位词预测模型来预测该实体词的上位词。可选的，该上位词预测模型的输入为实体词，以及上述目标文本，输出为该实体词对应的上位词。可选的，该上位词预测模型可以通过如下方式训练得到：

将训练样本输入上位词预测模型，得到上位词预测模型输出的上位词预测结果；其中，每个训练样本中均包含一个实体词，以及包含该实体词的文本；

根据上位词预测结果以及训练样本对应的标签的差异对上位词预测模型的参数进行更新。其中，训练样本对应的标签为训练样本中的实体词对应的上位词。

循环执行上述两个步骤直至满足训练结束条件(比如，达到预置的循环次数，或者，上位词预测结果以及训练样本对应的标签的差异小于一定值等)，得到训练好的上位词预测模型。

在另外一些实施例中，可能某个或某些实体词无法确定对应的字段，比如，利用预置的上位词-下位词对应关系确定实体词对应的上位词，此时，若预置的上位词-下位词对应关系中不包含实体词对应的上位词，则无法获取实体词对应的上位词，则字段集合中字段的数量小于实体词集合中实体词的数量。

基于上述实施例，本申请中根据实体词集合生成字段集合的一种实现方式可以为：对于实体词集合中每一个实体词，若获取到该实体词的上位词，将该上位词确定为该实体词对应的字段；所确定的所有字段构成字段集合。

步骤S104：显示实体词集合和字段集合，其中，至少部分实体词与字段集合中的字段一一对应显示。

在显示实体词集合和字段集合时，若实体词对应有字段，则将实体词与字段一一对应显示，若实体词未对应有字段，则仅显示该实体词即可。

为了便于用户查看，在将实体词与字段一一对应显示时，字段可以位于实体词的左侧，以适应用户的查看习惯。另外，还可以将实体词与字段以不同的显示效果显示，比如，实体词与字段以不同的颜色显示，或者，字段不加下划线，而实体词加下划线，或者，字段没有外加矩形框，而实体词外加矩形框等等。

本申请实施例提供的数据处理方法，获取目标文本后，对目标文本进行实体词提取，得到实体词集合；根据实体词集合生成字段集合；显示实体词集合和字段集合，其中，至少部分实体词与字段集合中的字段一一对应显示。基于本申请的方案，可以实现字段的自动生成，并自动将字段与对应的实体词一一对应显示，实现了至少部分信息的自动输入，从而可以减少用户手动输入信息的信息量，提高数据输入效率。

在一可选的实施例中，在显示实体词集合和字段集合后，本申请实施例提供的数据处理方法还可以包括：

获取针对第一目标实体词的字段编辑指令；该字段编辑指令中携带有第一目标实体词的目标上位词，第一目标实体词为显示界面中的任意一个实体词；

响应于字段编辑指令，将目标上位词与第一目标实体词对应显示。

本申请实施例中，在显示实体词集合和字段集合后，如果有实体词未对应有字段，则用户可以针对该实体词进行字段编辑，即添加字段。此时，第一目标实体词为显示界面中未对应有字段的实体词，字段编辑指令中携带的目标上位词即为用户输入的第一目标实体词的上位词。

另一种情况是，在显示实体词集合和字段集合后，虽然实体词对应有字段，但用户觉得实体词对应的字段不够准确，也可以针对该实体词进行字段编辑，即修改该实体词对应的字段。此时，第一目标实体词为显示界面中对应有字段的实体词，字段编辑指令中携带的目标上位词即为用户输入的第一目标实体词的上位词，此时是将目标上位词替换掉显示界面中第一目标实体词对应的字段。

本申请实施例中，用户可以在用于显示第一目标实体词对应的字段的位置进行预设操作(比如，双击操作等)来触发显示编辑界面，用户在编辑界面输入目标上位词并确认后即可触发字段编辑指令。

进一步的，在将目标上位词与第一目标实体词对应显示之后，还可以将第一目标实体词与目标上位词关联存储。

这样，后续可以基于第一目标实体词与目标上位词的关联关系，更新上上位词预测模型，或者，更新上位词-下位词对应关系，进而能够提高上位词确定的准确性和效率，进一步提高数据输入效率。

获取针对第二目标实体词的实体词编辑指令；该实体词编辑指令中携带有用于替换第二目标实体的实体词(为便于区分，记为替换实体词)，第二目标实体词为显示界面中对应有字段的实体词；

用替换实体词替换第二目标实体词。

本实施例中，在显示实体词集合和字段集合后，若用户觉得实体词不够准确，可以对实体词进行编辑。可选的，用户可以在第二目标实体词所在的位置进行预设操作(比如，双击操作等)来触发显示编辑界面，用户在编辑界面输入替换实体词并确认后即可触发实体词编辑指令。

获取字段增加指令，该字段增加指令中携带有用户输入的目标字段；

响应于字段增加指令，显示所述目标字段；

获取针对目标字段的实体词添加指令，该实体词添加指令中携带有用户输入的第三目标实体词；

将目标字段与所述第三目标实体词一一对应显示。

本实施例中，在显示实体词集合和字段集合后，如果用户觉得需要增加新的字段和该新的字段对应的实体词，则可以新建一个字段，以及该字段对应的实体词。

可选的，用户可以通过对预设按键(该按键可以是虚拟按键，也可以是物理按键)进行预设操作来触发交互界面，用户在该交互界面输入要增加的字段并确认后，触发生成字段增加指令。也就是说，可以接收针对预设按键的预设操作，响应于该预设操作来显示交互界面，通过该交互界面接收输入的字段及确认指令后，触发生成字段增加指令。

响应于字段增加指令后，可以在显示界面的空白位置显示目标字段。

在显示目标字段后，用户还可以针对该目标字段添加实体词，该实体词是目标文本中的实体词。可选的，用户可以在用于显示目标字段对应的实体词的位置进行预设操作(比如，双击操作等)来触发显示编辑界面，用户在编辑界面输入第三目标实体词并确认后即可触发实体词添加指令。

在一可选的实施例在，上述获取目标文本的一种实现方式可以为：

获取界面创建指令。可选的，用可以通过对预设按键(比如，可以是预设的虚拟按键)进行指定操作(比如单击操作等)来触发界面创建指令。

响应于界面创建指令，生成输入界面并显示；其中，输入界面中具有输入接口，该输入接口用于输入目标文本，或者，输入用于获取目标文本的图像或语音数据；

相应的，上述显示实体词集合和字段集合包括：

在上述输入界面显示实体词集合和字段集合。

下面结合具体的应用实例来对本申请的方案进行举例说明：

如图2所示，为本申请实施例提供的用于输入数据的初始界面的示例图，该初始界面可以在用户打开数据处理装置/系统后自动显示。

用户在图2所示界面单击界面左侧的“新建项目”201这一虚拟按键后，即可触发界面创建指令，响应于该界面创建指令，可以显示如图3所示的界面。

图3所示界面中，如虚线框中所示，包括三种输入接口，用于输入文本的第一输入接口301，用于输入图像的第二输入接口302，以及用于输入语音数据的第三输入接口303。

用户可以通过任意一种接口输入目标文本。

若用户使用第一输入接口301(即文本框)输入目标文本，则可以直接将目标文本拷贝到文本框中。

如果用户使用第二输入接口302，则可以通过第二输入接口302输入图像，输入图像的方式可以为以下输入方式中的任意一种：方式一，用户点击“选择”按钮，然后从已存储的图像中选择包含目标文本的图像；方式二，用户点击“截屏”按钮，然后从当前显示的界面中截取包含目标文本的图像。在获取到图像后，通过对图像进行字符识别，可以到的目标文本。在得到目标文本后，该目标文本可以显示在文本框中，当然也可以不显示在文本框中。

如果用户使用第三输入接口303，则用户可以通过长按第三输入接口303以采集用户语音，该用户语音即携带目标文本的语音，因而，用户需要在长按第三输入接口303的同时读出目标文本，以便采集携带目标文本的语音。在获取到语音后，通过语音识别可以到目标文本。在得到目标文本后，该目标文本可以显示在文本框中，当然也可以不显示在文本框中。

在获取到目标文本后，可以将目标文本显示在文本框中，以便用户确认是否正确，若目标文本中有误，用户还可以对目标文本进行编辑，以纠正目标文本中的错误信息。该示例中，目标文本为“腾讯云近期中标昆明局COP15安保态势感知平台项目，中标金额1390万元。本项目腾讯云提供了LBS、云智天枢、Reid、三维可视等系列产品和解决方案，基于昆明公安现有建设基础进行资源整合和补充建设，结合客户在大型活动安保、治安防控、外来人员管理等业务方面的需求，利用AI、大数据分析、3D可视等创新技术，整合公安内网、互联网、视频网信息数据资源，进行融合分析，对风险事件、风险管控、和能够引起公共安全态势发生变化的安全要素进行获取、理解、预测，实现从全局视角提示对公共安全威胁的发现识别、理解分析、响应处置。实现从全局视角提升对公共安全威胁的发现识别、理解分析、响应处置”。本中是通过图像输入的目标文本。如图4所示。

在用户确认目标文本无误后，点击“确认”按钮，即可以从目标文本中提取实体词，得到实体词结合，根据实体词结合生成字段集合；显示实体词集合和字段集合，其中，至少部分实体词与字段集合中的字段一一对应显示。作为示例，用户点击“确认”按钮后显示的字段和实体词如图4所示的界面。

图4中，实体词及实体词对应的字段分别为：

实体词“COP15安保态势感知平台项目”对应的字段为“项目名称”；

实体词“1390万元”对应的字段为“中标金额”；

实体词“云南省”对应的字段为“所属省份”；

实体词“公共安全”对应的字段为“所属行业”；

实体词“昆明市”对应的字段为“所属城市”；

实体词“西南”对应的字段为“项目区域”；

实体词“中标”对应的字段为“合同状态”。

可选的，图4所示界面中，除了包括实体词及对应的字段外，还可以包括通用的字段及对应的信息，比如，可以包括通用字段“项目详情”及对应的内容。如图5所示，为显示界面包括通用字段时的一种示例图。该通用字段及对应的内容可以由用户添加，或者，可以预先配置好通用字段，在获取目标文本后，在显示实体词集合和字段集合之前，从目标文本中提取与通用字段对应的信息(可以将通用字段输入预先训练好的信息提取模型，得到通用字段对应的信息)，并在显示实体词集合和字段集合时，显示通用字段及通用字段对应的信息。

与方法实施例相对应，本申请实施例还提供一种数据处理装置，本申请实施例提供的数据处理装置的一种结构示意图如图6所示，可以包括：

获取模块601，提取模块602，生成模块603和显示模块604；其中，

获取模块601用于获取目标文本；

提取模块602用于对所述目标文本进行实体词提取，得到实体词集合；

生成模块603用于根据所述实体词集合生成字段集合；

显示模块604用于显示所述实体词集合和所述字段集合，其中，至少部分实体词与所述字段集合中的字段一一对应显示。

本申请实施例提供的数据处理装置，获取目标文本后，对目标文本进行实体词提取，得到实体词集合；根据实体词集合生成字段集合；显示实体词集合和字段集合，其中，至少部分实体词与字段集合中的字段一一对应显示。基于本申请的方案，可以实现字段的自动生成，并自动将字段与对应的实体词一一对应显示，实现了至少部分信息的自动输入，从而可以减少用户手动输入信息的信息量，提高数据输入效率。

在一可选的实施例中，生成模块603具体用于：对于所述实体词集合中每一个实体词，若获取到该实体词的上位词，将所述上位词确定为该实体词对应的字段；所确定的所有字段构成所述字段集合。

在一可选的实施例中，数据处理装置还可以包括：

第一编辑模块，用于获取针对第一目标实体词的字段编辑指令；所述字段编辑指令中携带有所述第一目标实体词的目标上位词，所述第一目标实体词为显示界面中的任意一个实体词；响应于所述字段编辑指令，将所述目标上位词与所述第一目标实体词对应显示。

在一可选的实施例中，数据处理装置还可以包括：

存储模块，用于将所述第一目标实体词与所述目标上位词关联存储。

在一可选的实施例中，数据处理装置还可以包括：

第二编辑模块，用于获取针对第二目标实体词的实体词编辑指令；所述实体词编辑指令中携带有替换实体词，所述第二目标实体词为显示界面中对应有字段的实体词；用所述替换实体词替换所述第二目标实体词。

在一可选的实施例中，数据处理装置还可以包括：

第三编辑模块，用于获取字段增加指令，所述字段增加指令中携带有用户输入的目标字段；响应于所述字段增加指令，显示所述目标字段；获取针对所述目标字段的实体词添加指令，所述实体词添加指令中携带有用户输入的第三目标实体词；将所述目标字段与所述第三目标实体词一一对应显示。

在一可选的实施例中，所述获取模块601包括：

获取单元，用户获取界面创建指令；

界面生成单元，用于响应于所述界面创建指令，生成输入界面并显示；所述输入界面中具有输入接口，所述输入接口用于输入所述目标文本，或者，输入用于获取所述目标文本的图像或语音数据；

所述显示模块具体用于：在所述输入界面显示所述实体词集合和所述字段集合。

本发明实施例还提供一种数据处理设备，如终端、服务器等。其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等，但并不局限于此。在一些实施例中，上述终端或服务器可以是一个分布式系统中的一个节点，其中，该分布式系统可以为区块链系统，该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中，节点之间可以组成点对点(P2P，Peer To Peer)网络，任意形式的计算设备，比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。

数据处理设备可以配置上述数据处理装置。本发明实施例提供的数据处理设备的硬件结构框图的示例图如图7所示，可以包括：

处理器1，通信接口2，存储器3和通信总线4；

其中处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信；

可选的，通信接口2可以为通信模块的接口，如GSM模块的接口；

处理器1可能是一个中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。

存储器3可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。

其中，处理器1具体用于执行存储器3中存储的计算机程序，以执行如下步骤：

获取目标文本；

对所述目标文本进行实体词提取，得到实体词集合；

根据所述实体词集合生成字段集合；

可选的，所述计算机程序的细化功能和扩展功能可参照上文描述。

本申请实施例还提供一种可读存储介质，该存储介质可存储有适于处理器执行的计算机程序，所述计算机程序用于：

获取目标文本；

对所述目标文本进行实体词提取，得到实体词集合；

根据所述实体词集合生成字段集合；

本申请实施例还提供一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述数据处理方法的各种可选实现方式中提供的数据处理方法。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的核心思想或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种数据处理方法，其特征在于，包括：

获取目标文本；

对所述目标文本进行实体词提取，得到实体词集合；

根据所述实体词集合生成字段集合；

2.根据权利要求1所述的方法，其特征在于，所述根据所述实体词集合生成字段集合，包括：

对于所述实体词集合中每一个实体词，若获取到该实体词的上位词，将所述上位词确定为该实体词对应的字段；

所确定的所有字段构成所述字段集合。

3.根据权利要求1所述的方法，其特征在于，还包括：

获取针对第一目标实体词的字段编辑指令；所述字段编辑指令中携带有所述第一目标实体词的目标上位词，所述第一目标实体词为显示界面中的任意一个实体词；

响应于所述字段编辑指令，将所述目标上位词与所述第一目标实体词对应显示。

4.根据权利要求3所述的方法，其特征在于，还包括：

将所述第一目标实体词与所述目标上位词关联存储。

5.根据权利要求1所述的方法，其特征在于，还包括：

获取针对第二目标实体词的实体词编辑指令；所述实体词编辑指令中携带有替换实体词，所述第二目标实体词为显示界面中对应有字段的实体词；

用所述替换实体词替换所述第二目标实体词。

6.根据权利要求1所述的方法，其特征在于，还包括：

获取字段增加指令，所述字段增加指令中携带有用户输入的目标字段；

响应于所述字段增加指令，显示所述目标字段；

获取针对所述目标字段的实体词添加指令，所述实体词添加指令中携带有用户输入的第三目标实体词；

将所述目标字段与所述第三目标实体词一一对应显示。

7.根据权利要求1所述的方法，其特征在于，所述获取目标文本包括：

获取界面创建指令；

响应于所述界面创建指令，生成输入界面并显示；所述输入界面中具有输入接口，所述输入接口用于输入所述目标文本，或者，输入用于获取所述目标文本的图像或语音数据；

所述显示所述实体词集合和所述字段集合包括：

在所述输入界面显示所述实体词集合和所述字段集合。

8.一种数据处理装置，其特征在于，包括：

获取模块，用于获取目标文本；

生成模块，用于根据所述实体词集合生成字段集合；

9.一种数据处理设备，其特征在于，包括存储器和处理器；

所述存储器，用于存储计算机程序；

所述处理器，用于执行所述计算机程序，实现如权利要求1-7中任一项所述的数据处理方法的各个步骤。

10.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1-7中任一项所述的数据处理方法的各个步骤。