CN109782997A

CN109782997A - 一种数据处理方法、装置及存储介质

Info

Publication number: CN109782997A
Application number: CN201910074862.1A
Authority: CN
Inventors: 杨阳
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-01-25
Filing date: 2019-01-25
Publication date: 2019-05-21
Anticipated expiration: 2039-01-25
Also published as: CN109782997B

Abstract

本发明实施例公开一种数据处理方法、装置及存储介质，其中，方法包括：响应针对目标应用的第一操作，实时采集目标语音数据，并将目标语音数据实时转换为第一语种的第一文本信息；响应针对转换界面中的第一文本信息的触控操作，激活第一文本信息的编辑权限；根据编辑权限获取针对第一文本信息的编辑操作，并基于编辑操作对第一文本信息进行编辑，并将编辑后的第一文本信息确定为目标文本信息；响应针对目标应用的第二操作，停止采集目标语音数据，并在获取到针对目标文本信息的存储操作时，根据存储操作保存所述目标文本信息。采用本发明，可以确保文本信息的准确性。

Description

一种数据处理方法、装置及存储介质

技术领域

本发明涉及互联网技术领域，尤其涉及一种数据处理方法、装置及存储介质。

背景技术

随着语音识别(ASR)技术，语音合成(TTS)技术的不断发展，衍生出了各式各样的翻译设备。然而，现有的翻译设备在进行翻译的过程中，具体的实现方式为：用户可以通过翻译设备录制发言人的语音信息，以得到相应的音频文件，进而可以对录制所得的音频文件进行翻译，并对翻译得到的文字结果或者语音信息进行存储。换言之，现有的翻译设备通常需要将预先录制好的音频文件进行存储，再将存储后的音频文件传输到云端进行机器翻译，以得到翻译后的文字结果，然而，现有的翻译设备在得到该文字结果时，会直接对该文字结果进行存储，以至于无法确保所存储的文本信息的准确性，另外，在进行文本信息存储时，也仅通过默认的文本样式进行存储，进而导致该文本信息的存储样式极为单一。

发明内容

本发明实施例提供一种数据处理方法、装置及存储介质，可以确保文本信息的准确性，还可以丰富文本信息的存储样式。

本发明实施例一方面提供了一种数据处理方法，所述方法包括：

响应针对目标应用的第一操作，实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种的第一文本信息；

响应针对转换界面中的第一文本信息的触控操作，激活所述第一文本信息的编辑权限；

根据所述编辑权限获取针对所述第一文本信息的编辑操作，并基于所述编辑操作对所述第一文本信息进行编辑，并将编辑后的第一文本信息确定为目标文本信息；

响应针对所述目标应用的第二操作，停止采集所述目标语音数据，并在获取到针对所述目标文本信息的存储操作时，根据所述存储操作保存所述目标文本信息。

其中，所述响应针对目标应用的第一操作，实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种的第一文本信息，包括：

获取目标应用对应的初始界面，并从所述初始界面关联的至少一个语种中选择所述目标应用对应的第一语种；

响应针对所述初始界面上的第一按钮的第一操作，将已选择所述第一语种的初始界面作为所述目标应用对应的转换界面；

基于所述第一操作实时采集目标语音数据，若所述目标语音数据的语种为第二语种，则将所述第二语种的目标语音数据发送至语音转写引擎对应的服务器，以使所述服务器将所述目标语音数据转换为所述第一语种对应的第一文本信息；

接收所述服务器所返回的第一文本信息，并将所述第一文本信息显示在所述转换界面。

其中，所述响应针对转换界面中的第一文本信息的触控操作，激活所述第一文本信息的编辑权限，包括：

在所述转换界面中获取针对所述第一文本信息的触控操作，并基于所述触控操作调用所述目标应用对应的子线程，并基于所述子线程激活所述第一文本信息的编辑权限；所述子线程是在所述目标应用获取到所述第一操作时所同步构建的。

响应针对目标应用的第一操作，实时采集目标语音数据，并在所述目标应用中基于所述神经网络模型对所述目标语音数据进行语音识别，得到所述神经网络模型对应的语音识别结果；所述语音识别结果中包含从所述目标语音数据中提取到的语音频谱特征与所述神经网络模型中的多个语种属性特征之间的匹配度；

根据所述语音识别结果将具有最大匹配度的语种属性特征确定为目标语种属性特征，并根据所述目标语种属性特征所关联的语种生成所述目标语音数据对应的文本匹配信息；

若所述文本匹配信息对应的语种与从所述目标应用中所选取的第一语种相同，则将所述文本匹配信息作为所述第一语种对应的第一文本信息；

若所述文本匹配信息对应的语种与从所述目标应用中所选取的第一语种不相同，则将所述文本匹配信息转译为所述第一语种对应的第一文本信息。

其中，所述编辑权限包含文本标记权限；

所述根据所述编辑权限获取针对所述第一文本信息的编辑操作，并基于所述编辑操作对所述第一文本信息进行编辑，并将编辑后的第一文本信息确定为目标文本信息，包括：

在所述第一文本信息具备所述文本标记权限时，检测所述第一文本信息对应的文本标记操作，并基于文本标记操作在所述第一文本信息中获取第一位置信息和第二位置信息；

在所述第一文本信息中将所述第一位置信息和所述第二位置信息之间的文本信息确定为待标记文本信息，并在所述第一文本信息中对所述待标记文本信息进行高亮处理，并将高亮处理后的第一文本信息确定为目标文本信息。

其中，所述编辑权限包含文本调整权限；

在所述第一文本信息具备所述文本调整权限时，检测所述第一文本信息对应的文本调整操作；

基于所述文本调整操作对所述第一文本信息进行字符调整，并将字符调整后的第一文本信息确定为目标文本信息。

其中，所述响应针对所述目标应用的第二操作，停止采集所述目标语音数据，并在获取到针对所述目标文本信息的存储操作时，根据所述存储操作保存所述目标文本信息，包括：

获取所述目标应用对应的第二操作；

若所述目标文本信息不具备所述编辑权限，则根据所述第二操作在所述目标应用中结束采集所述目标语音数据，并在获取到针对所述目标文本信息的存储操作时，根据所述存储操作获取所述目标文本信息对应的保存类型，并根据所述保存类型以及所述目标文本信息进行保存处理；

若所述目标文本信息具备所述编辑权限，则基于所述第二操作在所述目标应用中暂停采集所述目标语音数据，并在再次获取到所述目标应用的第一操作时，执行所述实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种的第一文本信息的步骤。

其中，所述方法还包括：

在检测到所述目标文本信息具备所述编辑权限时，在所述目标文本信息所属的转换界面中获取空白区域对应的权限去除操作，并基于所述权限去除操作去除所述目标文本信息的编辑权限；所述空白区域为所述转换界面中除目标文本信息所在区域之外的区域。

其中，所述根据所述保存类型以及所述目标文本信息进行保存处理，包括：

若所述保存类型为第一文本类型，则获取目标文本信息对应的第一文本信息，并基于所述第一文本类型保存所述第一文本信息；

若所述保存类型为第二文本类型，则基于所述第二文本类型保存所述目标文本信息；

若所述保存类型为第一图片类型，则获取目标文本信息对应的第一文本信息，并基于转换界面的尺寸将所述第一文本信息拆分为至少一张图片，并将拆分后的所述至少一张图片分别保存至所述第一文本信息对应的图片列表中；

若所述保存类型为第二图片类型，则基于转换界面的尺寸将所述目标文本信息拆分为至少一张图片，并将拆分后的所述至少一张图片分别保存至所述目标文本信息对应的图片列表中。

其中，所述方法还包括：

响应针对语种选择界面中至少一个语种的同步选取操作，在所述语种选择界面中将同步选取的语种作为第二语种，并基于所述同步选取操作从保存后的目标文本信息中获取文本标记操作对应的第一位置信息和第二位置信息，并在所述目标文本信息中将所述第一位置信息和第二位置信息之间亮高显示的文本信息作为文本标记信息；

当所述目标文本信息同步转换为所述第二语种对应的第二文本信息时，在所述第二文本信息中查找与所述文本标记信息具有映射关系的待处理文本信息，并在所述第二文本信息中对所述待处理文本信息进行高亮处理，并对亮高处理后的第二文本信息进行保存处理。

本发明实施例一方面提供了一种数据处理装置，所述数据处理装置包括：

获取转换模块，用于响应针对目标应用的第一操作，实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种的第一文本信息；

权限激活模块，用于响应针对转换界面中的第一文本信息的触控操作，激活所述第一文本信息的编辑权限；

文本编辑模块，用于根据所述编辑权限获取针对所述第一文本信息的编辑操作，并基于所述编辑操作对所述第一文本信息进行编辑，并将编辑后的第一文本信息确定为目标文本信息；

文本保存模块，用于响应针对所述目标应用的第二操作，停止采集所述目标语音数据，并在获取到针对所述目标文本信息的存储操作时，根据所述存储操作保存所述目标文本信息。

其中，所述获取转换模块包括：

语种选择单元，用于获取目标应用对应的初始界面，并从所述初始界面关联的至少一个语种中选择所述目标应用对应的第一语种；

第一操作获取单元，用于响应针对所述初始界面上的第一按钮的第一操作，将所述第一语种的初始界面作为所述目标应用对应的转换界面；

语音数据获取单元，用于基于所述第一操作实时采集目标语音数据，若所述目标语音数据的语种为第二语种，则将所述第二语种的目标语音数据发送至语音转写引擎对应的服务器，以使所述服务器将所述目标语音数据转换为所述第一语种对应的第一文本信息；

文本接收单元，用于接收所述服务器所返回的第一文本信息，并将所述第一文本信息显示在所述转换界面。

其中，所述权限激活模块，具体用于在所述转换界面中获取针对所述第一文本信息的触控操作，并基于所述触控操作调用所述目标应用对应的子线程，并基于所述子线程激活所述第一文本信息的编辑权限；所述子线程是在所述目标应用获取到所述第一操作时所同步构建的。

其中，所述获取转换模块包括：

语音识别单元，用于响应针对目标应用的第一操作，实时采集目标语音数据，并在所述目标应用中基于所述神经网络模型对所述目标语音数据进行语音识别，得到所述神经网络模型对应的语音识别结果；所述语音识别结果中包含从所述目标语音数据中提取到的语音频谱特征与所述神经网络模型中的多个语种属性特征之间的匹配度；

属性特征确定单元，用于根据所述语音识别结果将具有最大匹配度的语种属性特征确定为目标语种属性特征，并根据所述目标语种属性特征所关联的语种生成所述目标语音数据对应的文本匹配信息；

文本确定单元，用于若所述文本匹配信息对应的语种与从所述目标应用中所选取的第一语种相同，则将所述文本匹配信息作为所述第一语种对应的第一文本信息；

文本转译单元，用于若所述文本匹配信息对应的语种与从所述目标应用中所选取的第一语种不相同，则将所述文本匹配信息转译为所述第一语种对应的第一文本信息。

其中，所述编辑权限包含文本标记权限；

所述文本编辑模块包括：

标记操作检测单元，用于在所述第一文本信息具备所述文本标记权限时，检测所述第一文本信息对应的文本标记操作，并基于文本标记操作在所述第一文本信息中获取第一位置信息和第二位置信息；

文本处理单元，用于在所述第一文本信息中将所述第一位置信息和所述第二位置信息之间的文本信息确定为待标记文本信息，并在所述第一文本信息中对所述待标记文本信息进行高亮处理，并将高亮处理后的第一文本信息确定为目标文本信息。

其中，所述编辑权限包含文本调整权限；

所述文本编辑模块包括：

调整操作检测单元，用于在所述第一文本信息具备所述文本调整权限时，检测所述第一文本信息对应的文本调整操作；

字符调整单元，用于基于所述文本调整操作对所述第一文本信息进行字符调整，并将字符调整后的第一文本信息确定为目标文本信息。

其中，所述文本保存模块包括：

操作获取单元，用于获取所述目标应用对应的第二操作；

结束采集单元，用于若所述目标文本信息不具备所述编辑权限，则根据所述第二操作在所述目标应用中结束采集所述目标语音数据，并在获取到针对所述目标文本信息的存储操作时，根据所述存储操作获取所述目标文本信息对应的保存类型；

保存单元，用于根据所述保存类型以及所述目标文本信息进行保存处理；

暂停采集单元，用于若所述目标文本信息具备所述编辑权限，则基于所述第二操作在所述目标应用中暂停采集所述目标语音数据，并在再次获取到所述目标应用的第一操作时，执行所述实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种的第一文本信息的步骤。

其中，其特征在于，所述文本保存模块还包括：

权限去除单元，用于在检测到所述目标文本信息具备所述编辑权限时，在所述目标文本信息所属的转换界面中获取空白区域对应的权限去除操作，并基于所述权限去除操作去除所述目标文本信息的编辑权限；所述空白区域为所述目标文本信息所属转换界面中除目标文本信息所在区域之外的区域。

其中，其特征在于，所述保存单元包括：

第一保存子单元，用于若所述保存类型为第一文本类型，则获取目标文本信息对应的第一文本信息，并基于所述第一文本类型保存所述第一文本信息；

所述第一保存子单元，还用于若所述保存类型为第二文本类型，则基于所述第二文本类型保存所述目标文本信息；

第二保存子单元，用于若所述保存类型为第一图片类型，则获取目标文本信息对应的第一文本信息，并基于转换界面的尺寸将所述第一文本信息拆分为至少一张图片，并将拆分后的所述至少一张图片分别保存至所述第一文本信息对应的图片列表中；

所述第二保存子单元，还用于若所述保存类型为第二图片类型，则基于转换界面的尺寸将所述目标文本信息拆分为至少一张图片，并将拆分后的所述至少一张图片分别保存至所述目标文本信息对应的图片列表中。

其中，所述装置还包括：

语种选取模块，用于响应针对语种选择界面中至少一个语种的同步选取操作，在所述语种选择界面中将同步选取的语种作为第二语种，并基于所述同步选取操作从保存后的目标文本信息中获取文本标记操作对应的第一位置信息和第二位置信息，并在所述目标文本信息中将所述第一位置信息和第二位置信息之间亮高显示的文本信息作为文本标记信息；

同步转换模块，用于当所述目标文本信息同步转换为第二语种对应的第二文本信息时，在所述第二文本信息中查找与所述文本标记信息具有映射关系的待处理文本信息，并在所述第二文本信息中对所述待处理文本信息进行高亮处理，并对亮高处理后的第二文本信息进行保存处理。

本发明实施例一方面提供了一种数据处理装置，包括：处理器、存储器以及网络接口；

所述处理器与存储器、网络接口相连，其中，网络接口用于提供网络通讯功能，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行以下操作：

本发明实施例一方面提供了一种计算机存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，当所述处理器执行所述程序指令时执行如本发明实施例一方面中的方法。

在本发明实施例中，终端可以响应针对目标应用的第一操作，实时采集目标语音数据，并可以将该目标语音数据实时转换为第一文本信息，换言之，终端可以在目标应用中对目标语音数据进行持续采集的同时，同步将该持续采集到的目标语音数据实时转换并翻译为指定语种(即第一语种)的译文信息，以在该目标应用中的转换界面上实时显示该第一语种的第一文本信息；进一步地，该终端可以响应针对该第一文本信息的触控操作，从而可以激活该第一文本信息的编辑权限；换言之，在接收到针对该第一文本信息的触控操作之前，用户时无法对该翻译所的第一文本信息进行编辑，因此，当在该第一文本信息所在的区域中检测到上述触控操作时，则可以激活该第一文本信息的编辑权限，以便于后续可以进一步根据激活后的编辑权限，响应针对该第一文本信息的编辑操作，换言之，该终端检测到该第一文本信息具备编辑权限时，则可以接收用户对该第一文本信息所执行的编辑操作，以对该第一文本信息进行实时编辑，例如，可以在该第一文本信息中添加标注、修改纠错等，进而可以将编辑后的第一文本信息称之为目标文本信息。由此可见，通过对具备编辑权限时的第一文本信息进行编辑操作，可以增加目标文本信息的可读性，并可以确保该目标文本信息的准确性，另外，该终端还可以在获取到针对该目标文本信息的存储操作时，根据该存储操作所指示的存储样式，选择性对该目标文本信息进行保存处理，以丰富文本信息的存储样式。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种网络架构的结构示意图；

图2是本发明实施例提供的一种数据处理方法的流程示意图；

图3是本发明实施例提供的一种获取目标语音数据的示意图；

图4是本发明实施例提供的一种获取第一文本信息的示意图；

图5是本发明实施例提供的另一种获取第一文本信息的示意图；

图6是本发明实施例提供的一种文本标记操作的示意图；

图7是本发明实施例提供的另一种文本标记操作的示意图；

图8是本发明实施例提供的一种文本调整操作的示意图；

图9是本发明实施例提供的另一种数据处理方法的流程示意图；

图10是本发明实施例提供的一种基于第二操作暂停数据采集的示意图；

图11是本发明实施例提供的一种基于第二操作结束数据采集的示意图；

图12是本发明实施例提供的一种选择保存类型的示意图；

图13是本发明实施例提供的一种数据处理装置的结构示意图；

图14是本发明实施例提供的另一种数据处理装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参见图1，是本发明实施例提供的一种网络架构的结构示意图。如图1所示，所述网络架构可以包括服务器2000以及用户终端集群；所述用户终端集群可以包括多个具有语音采集功能的用户终端，如图1所示，具体包括用户终端3000a、用户终端3000b、…、用户终端3000n；

如图1所示，所述用户终端3000a、用户终端3000b、…、用户终端3000n可以分别与所述服务器2000进行网络连接，所述多个用户终端可以通过网络服务平台对应的服务器2000实现用户数据之间的交互。其中，所述网络服务平台可以为安装在任一用户终端中的目标应用所对应的网络平台，应当理解，安装在任一用户终端中的目标应用可以包含音频应用、视频应用、即时通讯应用等具备多媒体数据处理功能的应用。

为便于理解，本发明实施例以所述目标应用为一个音频应用为例，以描述安装了该音频应用的用户终端与所述服务器2000之间进行数据交互的具体过程。其中，该目标应用所采集到的音频数据可以称之为多媒体数据，由于该目标应用集成在用户终端中，因此，该目标应用对采集到的多媒体数据所进行的数据处理可以等效于集成有该目标应用的用户终端对该多媒体数据所进行的数据处理。其中，数据处理可以包括对音频数据(该音频数据中可以包含用户发出的语音信号，即目标语音数据)的采集、对音频数据的转换(即将目标语音数据实时转换并翻译为相应的译文信息)，以及同步对译文信息中的字符进行调整或者标记等。

可以理解的是，该翻译后所得到的译文信息可以称之为文本数据，也可以称之为第一文本信息，此时，该翻译得到的第一文本信息并不具备编辑权限，此时，还可以将该翻译所得到的译文信息称之为待激活文本信息，即用户此时无法对上述待激活文本信息中的字符进行字符标记或者调整，但是，当集成有上述目标应用的用户终端接收到用户针对上述待激活文本信息的触控操作时，则可以激活上述待激活文本信息的编辑权限。换言之，该用户终端可以在翻译得到第一文本信息之后，进一步响应针对该第一文本信息的触控操作，并激活该第一文本信息的编辑权限。为便于理解，在本发明实施例中，为了区分在接收到触控操作之前的第一文本信息和接收到触控操作后的第一文本信息，本发明实施例可以将在接收到触控操作之前的，且不具备编辑权限的第一文本信息的文本状态称之为第一状态，并将在接收到触控操作之后的，具备编辑权限的第一文本信息称之为第二状态，以便于后续用户能够进一步对处于第二状态下的第一文本信息进行编辑操作，进而可以将编辑后的第一文本信息称之为目标文本信息。

其中，可以理解的是，当用户对具备编辑权限的第一文本信息中的字符进行标记或者调整之后，可以得到编辑后的第一文本信息，并可以将该编辑后的第一文本信息称之为目标文本信息，此时，当该编辑后的第一文本信息具备可编辑权限时，该目标文本信息则也应当具备编辑权限，即用户可以继续对该具备编辑权限的目标文本信息中的其余字符进行调整，以得到新的目标文本信息。其中，该用户终端在检测到上述目标文本信息具备编辑权限，且接收到用户对该转换界面中的停止按钮执行第二操作时，该用户终端可以基于该第二操作暂停采集和暂停翻译该目标语音数据，直到用户再次触发该转换界面中地开始按钮，即接收到新的第一操作时，继续恢复采集和翻译该目标语音数据。

可选地，该用户终端在得到上述目标文本信息之后，若检测到该目标文本信息仍具备编辑权限时，则可以接收到用户在该目标文本信息所属转换界面中的空白区域中所执行的权限去除操作，并可以基于该权限去除操作去除该目标文本信息的编辑权限，以便于该用户终端在检测到该目标文本信息不具备可编辑权限，且该用户终端接收到上述第二操作时，可以在该目标应用中结束采集和翻译该目标语音数据。此时，仍可以将具备编辑权限的目标文本信息的文本状态统称为第二状态，即该处于第二状态下的目标文本信息仍具备编辑权限，因此，当需要对编辑后的目标文本信息进行存储处理之前，需要将该目标文本信息的文本状态由第二状态切换回为第一状态，以便于能够对该翻译得到的目标文本信息进程存储处理。可以理解的是，通过对该第一文本信息进行编辑处理，可以确保后续所存储的目标文本信息的准确性，进一步地，该用户终端还可以选择性地对该目标文本信息进行存储处理，以丰富译文信息的存储样式的多样性。

为便于理解，本发明实施例可以在图1所示的多个用户终端中选择一个用户终端作为目标用户终端，例如，可以将图1所示的用户终端3000a作为所述目标用户终端。其中，该目标用户终端中所集成的目标应用可以被应用于不同的应用场景下，比如，在会议、课程等场景下，此时，该目标用户终端可用于实时将该会议或者课程过程中所采集到的音频数据流实时转换为文字数据流，得到上述第一文本信息。换言之，集成有该目标应用的目标用户终端可以通过该目标应用实时采集环境空间中的音频数据，并可以进一步对该音频数据中的噪音进行降噪处理，以得到该目标应用对应的目标语音数据，与此同时，该目标用户终端还可以对该目标语音数据进行实时转写，以得到第一语种输出的第一文本信息，以便于后续可以在该目标用户终端中对转写后的所得到第一文本信息进行实时编辑，以确保编辑后的所得到的目标文本信息的准确性。可以理解的是，采用本发明，可以在会议结束或者课程结束时，即可以得到该会议或者课程等场景下的译文信息，从而可以快速且准确地将相应的译文信息传递或分享给相关人员，比如，如上述图1所示，用户终端3000a可以将存储的目标文本信息通过上述服务器2000传递给与该会议或课程的具有关联关系的其它人员(例如，缺席人员)，以提高信息传递的效率。

其中，该目标用户终端在接收到针对上述转换界面中第一文本信息的触控操作时，可以继续在后台监听音频数据，并同步拉起该目标应用对应的子线程，并根据该子线程激活所述第一文本信息的编辑权限，从而可以使该第一文本信息在接收到该触控操作之后，可使该第一文本信息具备能够被用户进行实时编辑的权限，此时，可以将能够被用户进行实时编辑的第一文本信息称之为具备编辑权限的第一文本信息。然后，该目标用户终端可以进一步接收针对该具备编辑权限的第一文本信息的编辑操作，以确保编辑后所得到的目标文本信息的准确性，进而可以确保后续所传递的目标文本信息中的文本内容的准确性。

又比如，在即时通讯场景下，该目标用户终端可以实时记录参与会话的双方(比如，客服人员A与用户B)之间的即时通讯信息，其中，该目标用户终端可以将持续采集到的客服人员A的语音信息称之为目标语音数据，并可以将该目标语音数据转换为相应的文本信息(即第一文本信息)，并将该第一文本信息显示在该即时通讯平台中，以便于该客服人员A可以在该目标用户终端中对该即时通讯平台上所显示的第一文本信息进行实时编辑处理，并可以在该目标用户终端中将编辑后的文本信息称之为目标文本信息，以确保上述用户B所接收到的该目标文本信息的准确性，进而可以在该用户B接收到该目标文本信息时，可以准确地获悉客服人员A所传递的服务信息。其中，该第一文本信息所在的显示界面可以称之为该目标应用对应的转换界面。换言之，该目标用户终端可以通过上述服务器2000将转换界面中的目标文本信息转发给用户B所持有的用户终端(例如，上述图1所对应实施例中的用户终端3000b)，以提高服务质量。

其中，所述目标用户终端可以包括智能手机、平板电脑、智能音箱、智能电视等具备多媒体数据处理功能的智能终端。因此，通过该目标用户终端可以按照已选语种将会议、课程或者即时通讯过程中所采集到的音频数据实时转换为该语种对应的文本数据(该文本数据也可以称之为文本信息或者译文信息)，以便于该目标用户终端在对译文信息进行存储之前，可以对该译文进行相应的编辑操作，以确保译文信息的准确性。换言之，使用该目标用户终端的用户可以实时查阅和编辑该译文信息，以确保后续所保存的译文信息的准确性和可读性。可以理解的是，该目标用户终端可以提供多种实时编辑操作，以确保翻译得到的译文信息的可读性和准确性，这里将不对具体的编辑操作进行限制，进一步地，该目标用户终端还可以根据所获取到的文本信息的保存指令，选择性地将该译文信息保存为文本类型和/或图片类型，以丰富该译文信息的保存样式。

可以理解的是，该目标用户终端可以在采集到目标语音数据时，可以对该目标语音数据进行翻译处理，以实现语音转化为文字等功能。比如，会议过程中可以自动形成会议记录，服务通讯过程中可以自动形成服务工单，视频播放过程中可以自动显示字幕等等。其中，该目标用户终端可以在目标应用中集成有语音识别和语音翻译功能时，在本地终端对采集到的语音数据进行语音识别，以将采集到的音频数据流同步转换成相应语种对应的文本信息流，以得到第一文本信息，并可以在后台继续采集音频信息流的同时，同步实现对翻译得到的第一文本信息进行纠错或者重点标记等编辑操作。可选的，该目标用户终端还可以在采集到目标语音数据时，对该目标语言数据的语种进行识别，若该目标语言数据的语种为第二语种，则可以将该第二语种的目标语音数据转发给该目标应用对应的服务器2000，以利用该服务器2000强大的计算能力，快速对接收到的目标语音数据进行语音识别，以实时将采集到的音频数据流同步转换成相应语种对应的文本信息流，并将该文本信息流返回给该目标用户终端，进一步地，该目标用户终端还可以在接收到该文本信息流时，将该文本信息流确定为第一文本信息，并进一步通过该目标应用对应的子线程对该第一文本信息进行编辑处理，以确保后续所存储的文本信息的准确性。

可选地，服务器2000也可以在接收到目标用户终端所传来的目标语音数据时，进一步对接收到的目标语音数据进行语音识别，以将采集到的音频数据流同步转换成相应语种对应的文本信息流，比如，该服务器2000可以将第二语种的目标语言数据转换为第一语种对应的文本信息流，并在该服务器中将该文本信息流确定为第一文本信息，并将该第一文本信息返回给该目标用户终端，以使该目标用户终端可以通过该目标应用对应的子线程，激活该第一文本信息的编辑权限，以便于可以在激活该编辑权限后对该第一文本信息进行编辑操作，以确保后续所存储的文本信息的准确性。其中，所述第二语种为与所述第一语种不同的语种。所述第二语种可以为语种选择界面中的任意一种除第一语种之外的语种。

应当理解，本发明实施例所适用的场景可以包括但不限于上述列举的会议、课程或者即时通讯这几种应用场景，这里将不对具体的应用场景进行具体地限制。另外，该目标用户终端所提供的丰富的实时操作，可以丰富用户与终端之间的交互方式，以确保不同场景下所得到的目标文本信息的可读性和准确性。

其中，所述目标用户终端采集目标语音数据、获取第一文本信息以及得到目标文本信息的具体过程，可以参见如下图2至图12所对应的实施例。

进一步地，请参见图2，是本发明实施例提供的一种数据处理方法的流程示意图。如图2所示，所述方法可以包含：

步骤S101，响应针对目标应用的第一操作，实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种的第一文本信息；

具体地，目标用户终端可以获取目标应用对应的初始界面，并从所述初始界面关联的至少一个语种中选择所述目标应用对应的第一语种；进一步地，该目标用户终端可以响应针对所述初始界面上的第一按钮的第一操作，将已选择所述第一语种的初始界面作为所述目标应用对应的转换界面；进一步地，该目标用户终端可以基于所述第一操作采集目标语音数据，若所述目标语音数据的语种为第二语种，则将所述第二语种的目标语音数据发送至语音转写引擎对应的服务器，以使所述服务器将所述目标语音数据转换为所述第一语种对应的第一文本信息；进一步地，该目标用户终端可以接收所述服务器所返回的第一文本信息，并将所述第一文本信息显示在所述转换界面。可选地，该目标用户终端还可以在通过本地终端具备语音翻译和语音转写功能时，响应针对目标应用的第一操作，实时采集目标语音数据，并在所述目标应用中基于该神经网络模型对所述目标语音数据进行语音识别，得到所述神经网络模型对应的语音识别结果；其中，所述语音识别结果中包含从所述目标语音数据中提取到的语音频谱特征与所述神经网络模型中的多个语种属性特征之间的匹配度；进一步地，该目标用户终端还可以根据所述语音识别结果将具有最大匹配度的语种属性特征确定为目标语种属性特征，并根据所述目标语种属性特征所关联的语种生成所述目标语音数据对应的文本匹配信息；若所述文本匹配信息对应的语种与从所述目标应用中所选取的第一语种相同，则将所述文本匹配信息作为所述第一语种对应的第一文本信息；若所述文本匹配信息对应的语种与从所述目标应用中所选取的第一语种不相同，则将所述文本匹配信息转译为所述第一语种对应的第一文本信息，并可以将该第一文本信息显示在上述转换界面中。

其中，所述第一操作可以包含对目标用户终端中的初始界面执行的点击操作，可选地，该目标用户终端所接收到的第一操作还可以包含语言控制操作或者手势控制操作等操作，比如，用户在初始界面中对目标语音数据进行采集之前，若检测到针对音频数据进行数据采集的手势控制操作，则可以基于该手势控制操作开始获取目标语言数据。在本发明实施例中，将不对第一操作的具体实现形式进行一一列举。

可以理解的是，该目标用户终端也可以根据应用场景的不同，智能选择是否在本地终端中对采集到的语音数据进行语音识别和智能翻译，比如，若该目标用户终端识别到所述应用场景为会议场景，则可以将采集到的目标语音数据直接给到该目标应用对应的服务器，以使该服务器可以利用其强大的数据处理功能，快速对该目标语音数据进行语音识别和语音翻译，从而可以快速得到第一文本信息，且该应用服务器对该目标语音数据进行语音识别和语音翻译的具体过程可以一并参见上述目标用户终端在本地终端对所述目标语音数据进行语音识别和语音翻译的过程，这里将不再继续进行赘述。

为便于理解，本发明以应用场景为会议场景为例，以阐述该目标用户终端获取目标语音数据的具体过程。进一步地，请参见图3，是本发明实施例提供的一种获取目标语音数据的示意图。如图3所示，该目标用户终端可以为上述图1所对应实施例中的目标用户终端，当持有该目标用户终端的用户A在应用显示界面中触发该目标应用之后，可以得到图3所示的初始界面200a，该初始界面200a中可以包含语种选择区域10，该语种选择区域10中的语种选择按钮可用于提供与该初始界面关联的至少一个语种的下拉列表，且该下拉列表中的各语种可以称之为与该初始界面200a相关联的语种，因此，用户A可以从该初始界面相关联的至少一个语种中选择一个语种作为第一语种。换言之，该目标用户终端可以在接收到该用户A的针对该语种选择区域10中的语种选择按钮的点击操作时，从该初始界面所关联的至少一个语种中选择该目标应用对应的语种A作为第一语种，并将该选择的语种A显示在图3所示的语种选择区域10中，以得到该目标应用对应的第一语种，进一步地，持有该终端的用户A还可以对图3所示的目标用户终端中的数据采集按钮(此时，该数据采集按钮可以称之为开始按钮或者第一按钮)执行触控操作，此时，该触控操作可以称之为第一操作，以使该目标用户终端可以基于该第一操作生成数据采集指令，此时，该目标用户终端可以基于该数据采集指令监听图3所示的音频数据，该音频数据中可以携带图3所示的会议发言人K所发出的目标语音数据，还可以携带该目标用户终端所处环境空间中的噪音数据。可以理解的是，在该会议场景下的该目标语音数据对应的会议发言人K也可以称之为目标语音数据对应的用户。因此，该目标用户终端可以在接收到该音频数据时，进一步对该音频数据进行去噪处理，以从该音频数据中恢复得到上述目标语音数据。与此同时，该目标用户终端还可以在获取到图3所示的第一操作时，将图3所示的语种选择区域10中的语种选择按钮的选择状态调整为不可选择状态，比如，可以将该语种选择按钮进行灰度设置，以得到图3所示的语种选择区域20中的语种选择按钮，此时，该语音选择区域20中的语种选择按钮具备不可操作性，换言之，在持续采集目标语音数据的整个过程中，采集到的目标语音数据均会统一转换成该语种A对应的文本信息流。与此同时，该目标用户终端还可以在获取到图3所示的第一操作时，将图3所示的已选择该语种A的初始界面200a作为该目标应用的转换界面，以得到图3所述的转换界面300a，该转换界面300a中包含图3所示的语种选择区域20，且在该语种选择区域20中的语种选择按钮具备不可操作性，从而可以避免该用户A在目标语音数据的持续采集过程中反复提交语种更改指令，从而可以确保在图3所示的转换界面300a中确保翻译所得到的文本信息流的语种的一致性，并可以提高语音数据流转换为文本数据流的效率。

进一步地，请参见图4，是本发明实施例提供的一种获取第一文本信息的示意图。如图4所示，该目标用户终端可以基于上述图3所示的转换界面300a，将翻译所得的语种A对应的文本信息显示在图4所示的文本显示界面400a，可以理解的是，图4所示的文本显示界面400a可以为上述图3所示的转换界面300a中的一部分，该文本显示界面400a仅仅用于显示翻译所得到的第一文本信息，进一步地，请参见图4所示的第一文本信息，可以理解的是，图4所示的第一文本信息中的每个字符所对应的语种均为同一语种，即上述图3所对应实施例中所选择的语种A。

另外，如图4所示，该目标用户终端可以在获取到目标语音数据之后，可以将该目标语音数据上传给图4所示的服务器，该服务器可以为上述图1所对应实施例中的服务器2000，可以理解的是，该服务器可以为该目标用户终端中的语音转写引擎所对应的后台服务器，因此，该目标用户终端可以在接收到第一采集操作时，基于该第一操作建立该目标应用与该语音转写引擎之间的长连接，以确保该目标用户终端可以将会议过程中所采集到的大量的目标语音数据传输给图4所示的服务器，以使该服务器可以通过图4所述的神经网络模型对接收到的目标语音数据进行语音识别，以得到该神经网络模型对应的语音识别结果，其中，该语音识别结果中可以包含从所述目标语音数据中提取到的语音频谱特征与所述神经网络模型中的多个语种属性特征之间的匹配度，进一步地，图4所示的服务器可以根据该语音识别结果将具有最大匹配度的语种属性特征确定为目标语种属性特征，并根据所述目标语种属性特征所关联的语种生成所述目标语音数据对应的文本匹配信息，并基于该文本匹配信息以及上述第一语种得到第一文本信息。可以理解的是，若该目标语种属性特征对应的语种可以与该第一语种相同，即都为语种A，则可以在该服务器中将该文本匹配信息作为第一语种对应的第一文本信息返回给目标用户终端，以使该目标用户终端可以在图4所示的文本显示界面中显示该第一文本信息。

可选地，该目标用户终端也可以在本地进行语音识别，即该目标用户终端可以在所述目标应用中集成有具备语音识别以及语音转写功能的语音转写引擎时，获取该语音转写引擎对应的神经网络模型，并基于该神经网络模型对所述目标语音数据进行语音识别，以得到该神经网络模型对应的语音识别结果。为便于理解，进一步地，请参见图5，是本发明实施例提供的另一种获取第一文本信息的示意图。如图5所示，用户A可以对图5所示的目标用户终端中的数据采集按钮执行触控操作，该触控操作可以称之为该目标应用的第一操作，并可以基于该第一操作生成该目标应用对应的数据采集指令和数据翻译指令，其中，所述数据采集指令可以用于在所述目标应用的后台实时采集音频数据，并从采集到的音频数据中获取目标语音数据，所述数据翻译指令用于对实时采集到的目标语音数据进行实时翻译。比如，该目标用户终端可以基于该第一操作从图5所示的本地数据库中获取该神经网络模型，并可以基于该神经网络模型从持续采集到的音频数据中获取目标语音数据，该目标语音数据可以为该用户A所发出的语音信号，也可以是该目标用户终端所处环境空间中的其他用户(例如，用户K)所发出的语音信号。因此，为提高后续对目标语音数据进行语音识别的效率，该目标用户终端可以对监听到的音频数据中的噪音数据进行处理，以从该音频数据中恢复出该目标语音数据；进一步地，如图5所示，该目标用户终端可以基于该神经网络模型(该神经网络模型可以为深度全序列卷积神经网络模型)对目标语音数据进行语音识别，以得到语音识别结果；其中，该语音识别结果中也可以包含从所述目标语音数据中提取到的语音频谱特征与所述神经网络模型中的多个语种属性特征之间的匹配度；换言之，通过该神经网络模型可以确定出该目标语音数据所对应的用户的语种更贴近于该神经网络模型中的哪个语种，比如，该目标语音数据所对应的用户是采用语种A进行发言时，通过该神经网络模型可以将该语种A对应的目标语音数据翻译得到该语种A对应的文本匹配信息；可选的，如图5所示，若该目标用户终端中所选用的语种为语种B，而通过该神经网络模型所识别到的目标语种属性特征对应的语种为语种A，即该目标用户终端可以首先将该语种A对应的目标语言数据翻译为该语种A对应的文本匹配信息，再进一步将该语种A对应的文本匹配信息翻译为所选语种B对应的文本信息，并将该翻译所得到的语种B对应的文本信息称之为第一语种对应的第一文本信息，进而可以图5所示的转换显示界面500a中显示该第一文本信息。可以理解的是，图5所对应实施例中的语种选择区域30中的语种选择按钮也应当具备不可操作性。

步骤S102，响应针对转换界面中的第一文本信息的触控操作，激活所述第一文本信息的编辑权限。

具体地，该目标用户终端可以在所述转换界面中获取针对所述第一文本信息的触控操作，并基于所述触控操作调用所述目标应用对应的子线程，并基于所述子线程激活所述第一文本信息的编辑权限；所述子线程是在所述目标应用获取到所述第一操作时所同步构建的。

其中，可以理解的是，该目标用户终端在检测到所述触控操作时，可以生成该触控操作对应的所述权限激活指令，且该权限激活指令可以用于调用所述目标应用对应的子线程，基于所述子线程激活所述第一文本信息的编辑权限。其中，该触控操作可以包括但不限于该用户A在上述转换界面中对第一文本信息所执行的单击或者双击操作，进而可以响应针对该第一文本信息的单击或者双击操作，得到该第一文本信息对应的文本激活指令，此时，该目标用户终端可以基于该文本激活指令可以在该目标应用中激活该第一文本信息的编辑权限，并可以进一步将激活所述编辑权限之后的第一文本信息的文本状态称之为第二状态，并将激活该编辑权限之前的第一文本信息的文本状态称之为第一状态。换言之，该目标用户终端可以在接收到该触控操作时，将该第一文本信息的文本状态由不具备编辑权限的第一状态切换为具备编辑权限的第二状态，以便于进一步执行步骤S103。其中，当激活的编辑权限为文本标记权限时，所述第二状态可以包含文本标记状态；可选的，当激活的编辑权限为文本调整权限时，所述第二状态还可以进一步包括文本调整状态，比如，当用户A在该转换界面中对该第一文本信息执行单击操作，该单击操作用于激活文本标记权限时，该目标用户终端可以将该第一文本信息的文本状态由第一状态切换为文本标记状态，以便于后续可以对该第一文本信息中的字符进行标记，比如，可以对该第一文本信息中的重点信息进行标记处理，以提高标记后的第一文本信息的可读性。

可选地，当用户A在该转换界面中对该第一文本信息执行双击操作，该单击操作用于激活文本标记权限时，可以将该第一文本信息的文本状态由第一状态切换为文本调整状态，以便于可以在该转换界面中对第一文本信息中的字符进行调整，比如，可以对该第一文本信息中的文本内容进行纠错处理，以确保纠错处理后的第一文本信息的准确性。

步骤S103，根据所述编辑权限获取针对所述第一文本信息的编辑操作，并基于所述编辑操作对所述第一文本信息进行编辑，并将编辑后的第一文本信息确定为目标文本信息；

具体地，若上述步骤S102中所激活的第一文本信息的编辑权限包含文本标记权限，则该目标用户终端可以在所述第一文本信息具备所述文本标记权限时，检测所述第一文本信息对应的文本标记操作，并基于文本标记操作在所述第一文本信息中获取第一位置信息和第二位置信息；进一步地，在所述第一文本信息中将所述第一位置信息和所述第二位置信息之间的文本信息确定为待文本标记信息，并在所述第一文本信息中对所述待文本标记信息进行高亮处理，并将高亮处理后的第一文本信息确定为目标文本信息。可选地，若上述步骤S102中所激活的第一文本信息的编辑权限包含文本调整权限，则该目标用户终端可以在所述第一文本信息具备所述文本调整权限时，检测所述第一文本信息对应的文本调整操作；进一步地，基于所述文本调整操作对所述第一文本信息进行字符调整，并将字符调整后的第一文本信息确定为目标文本信息。

可以理解的是，若该目标用户终端检测到所述第一文本信息的文本状态为上述文本标记状态，则该目标用户终端在所述目标文本信息所属的转换界面中所检测到的编辑操作可以为文本标记操作，并基于文本标记操作在所述第一文本信息中获取第一位置信息和第二位置信息，并在所述第一文本信息中将所述第一位置信息和所述第二位置信息之间的文本信息确定为待标记文本信息，并在所述第一文本信息中对所述待标记文本信息进行高亮处理，并将高亮处理后的第一文本信息确定为目标文本信息。可选地，若该目标用户终端检测到所述第一文本信息的文本状态为上述文本调整状态，则该目标用户终端在所述目标文本信息所属的转换界面中所检测到的编辑操作可以为文本调整操作，并基于所述文本调整操作对所述第一文本信息进行字符调整，并将字符调整后的第一文本信息确定为目标文本信息。其中，所述字符调整可以包括字符串的增加、更正和删除等操作。

其中，为便于理解，本发明实施例中的所选取的第一语种可以为上述图3所对应实施例中的语种A，该目标用户终端可以在T时刻将采集到的目标语音数据流转换并翻译为语种A对应的第一文本信息，并可以在该语种A关联的转换界面中实时显示翻译得到的第一文本信息，此时，该翻译所得到的第一文本信息对应的文本状态为第一状态，该第一状态用于表征在T时刻所得到的该转换界面中所显示的第一文本信息是不具备编辑权限的，因此，若用户需要对该不具备编辑权限的第一文本信息进行编辑操作，则需要在所述第一文本信息处于第一状态时，响应针对该转换界面中的第一文本信息的触控操作，该触控操作可以理解为权限激活操作，从而可以激活该第一文本信息的编辑权限，此时，可以将具备编辑权限的第一文本信息的文本状态确定为第二状态，以便于用户可以直接对该处于该第二状态下的第一文本信息进行编辑操作。其中，该第二状态可以包含文本标记状态和文本调整状态，因此，若该第一文本信息的文本状态为文本标记状态，则该目标用户终端所接收到的编辑操作可以为文本标记操作，从而可以将文本标记操作后的第一文本信息称之为目标文本信息。可选地，若该第一文本信息的文本状态为文本调整状态，则该目标用户终端所接收到的编辑操作可以为文本调整操作，从而可以将文本调整操作后的第一文本信息称之为目标文本信息。

进一步地，请参见图6，是本发明实施例提供的一种文本标记操作的示意图。其中，为便于理解，以所述第一文本信息300的编辑权限为文本标记权限为例，以阐述用户A如何对携带该文本标记权限的第一文本信息300进行编辑操作的具体过程。此时，图6所示的第一文本信息300的文本状态(即第二状态)可以为文本标记状态，且如图6所示的文本标记操可以为检测到的针对该文本标记状态下的第一文本信息300所执行的单击操作，换言之，持有该目标用户终端的用户A可以在图6所示的第二状态下的第一文本信息300所在区域中对第一文本信息300执行单击操作，该单击操作可以称之为在该第一文本信息具备可编辑权限时所检测到的编辑操作，还可以称之为文本标记操作，以使该目标用户终端可以基于检测到的文本标记操作在该第一文本信息300中获取该文本标记操作对应的目标位置信息。其中，所述目标位置信息可以包括第一位置信息和第二位置信息。可以理解的是，图6所示的文本编辑操若为单击操作，则该目标用户终端可以在第一文本信息中获取该单击操作对应的初始位置信息，并可以基于该初始位置信息在该第一文本信息中向前搜索第一标记符号(比如，译文中的标点符号)，并同步向后搜索第二标记符号，且可以将搜索到的第一标记符号所在的位置信息称之为第一位置信息，将搜索到的第二标记符号所在的位置信息称之为第二位置信息，即该第一位置信息和第二位置信息可以称之为该文本标记操作对应的目标位置信息，进一步地，该目标用户终端可以在该第一文本信息300中将第一位置信息和第二位置信息之间的文本信息确定为待标记文本信息400，具体地，请一并参见图6所确定的待标记文本信息400的示意图。进一步地，该目标用户终端可以在该第一文本信息300中对该待标记文本信息400进行高亮处理(比如，可以在该待标记文本信息的字符串下设置下划线等标记操作)，并将高亮处理后的第一文本信息确定为目标文本信息500，具体地，可以参见图6所示的目标文本信息500。由此可见，通过捕捉用户A对该第二状态下的第一文本信息300所执行的文本编辑操作，可以快速确定出该文本编辑操作对应的第一位置信息和第二位置信息，进而可以快速对该第一位置信息和第二位置信息之间的待标记文本信息400进行标记处理，该标记处理可以称之为亮高处理，从而可以在该第一文本信息中提高文本标记效率。可以理解的是，该待标记文本信息400中的字符串是由第一位置信息和第二位置信息之间所构成的位置区间的大小所决定的。

可选地，若该用户A需要对上述转换界面中所显示的第一文本信息300中更多字符串进行快速标记，则可以接收针对该第一文本信息的滑动操作，并将该滑动操作的起始位置确定为第一位置信息，并将该滑动操作的终止位置确定为第二位置信息，进而可以在该第一文本信息中将该第一位置信息和第二位置信息之间的文本信息确定为待标记文本信息，以便于后续可以进一步对该待标记文本信息中的字符串进行亮高处理，得到目标文本信息。进一步地，请参见图7，是本发明实施例提供的另一种文本标记操作的示意图。将当使用该目标用户终端的用户A需要对翻译后的第一文本信息600中的中的大量信息进行快速标注时，该目标用户终端还可以在该第一文本信息600具备文本标记权限时，接收该用户A针对该第一文本信息600所执行的滑动操作，从而可以在图7所示的第一文本信息中将滑动操作的起始位置(即图7所示的字符A所在的位置)作为第一位置信息，并将该滑动操作的终止位置(即图7所示的字符O所在的位置)作为第二位置信息，并将该字符A到字符O之间的字符串确定为待标记文本信息，进而可以得到图7所示的目标文本信息700。可以理解的是，在本发明实施例中，该目标文本信息700中包含对该携带文本标记权限的第一文本信息进行标记后的标记信息。

可选地，该目标用户终端则可以在该第一文本信息具有编辑权限(即上述文本调整权限)，即该第一文本信息的文本状态为文本调整状态时，进一步接收用户A针对该第一文本信息的文本调整操作，进一步地，请参见图8，是本发明实施例提供的一种文本调整操作的示意图。如图8所示，当该第一文本信息具备文本调整权限时，可以在该第一文本信息800对应的文本显示区域100b中显示可以对该第一文本信息800的字符进行调整的光标，所以，用户A可以在图8所示的光标显示区域对该文本调整状态下的第一文本信息800执行文本调整操作，比如，该用户A可以基于该文本调整操作调用相应的文本输入程序，得到集成于该目标用户终端中的语种A对应的虚拟键盘，以便于该用户A可以通过操作该虚拟键盘对第一文本信息800中的字符进行调整，具体地，可以参见图7所示的在字符H和字符I之间增加字符X的示意图。可以理解的是，用户A可以在检测出翻译所得到的第一文本信息800存在翻译错误时，可以对该第一文本信息800进行纠错处理，比如，可以在字符H和字符I之间缺少字符X时，将字符X插入至该第一文本信息800，以使该目标用户终端可以在图7所示的文本显示区域100b中得到编辑后的第一文本信息，并可以进一步将该编辑后的第一文本信息确定为目标文本信息900。

可以理解的是，该目标用户终端在检测到所述目标文本信息具备所述编辑权限时，可以在所述目标文本信息所属的转换界面中获取空白区域对应的权限去除操作，并基于所述权限去除操作去除所述目标文本信息的编辑权限；所述空白区域为所述转换界面中除目标文本信息所在区域之外的区域。换言之，在上述图8所对应实施例中，若该目标用户终端检测到该目标文本信息(即图8所示的文本显示区域100b中的编辑后的第一文本信息)的文本状态仍处于第二状态，即该编辑后的第一文本信息仍然具备编辑权限，且需要对该编辑后的第一文本信息进行存储处理，则首先需要将该编辑后的第一文本信息的文本状态由第二状态切换为第一状态，即首先需要去除该编辑后的第一文本信息(即目标文本信息)的编辑权限。所以，该目标用户终端可以在图8所示的空白区域200b中接收用户A所执行触控操作，此时，该空白区域200b中的触控操作可以称之为权限去除操作，此时，该目标用户终端可以基于该权限去除操作去除该目标文本信息的编辑权限，以使该目标用户终端可以得到图8所示的目标文本信息900，此时，该目标文本信息900可以为第一状态下的目标文本信息。可以理解的是，图8所示的空白区域可以为转换界面中除目标文本信息所在区域之外的区域。其中，所述文本调整操作可以包括更改字符、删除字符以及增添字符等操作，这里将不对具体的文本调整操作进行限制。

换言之，该目标用户终端可以在所述目标文本信息的文本状态为所述第二状态时，在所述目标文本信息所属的转换界面中获取空白区域对应的权限去除操作，并基于该权限去除操作去除所述目标文本信息的编辑权限，也可以理解为该目标用户终端可以基于该权限去除操作关闭上述所调用的子程序的进程，从而可以关闭该目标文本信息的编辑权限，从而可以进一步执行步骤S104。

步骤S104，响应针对所述目标应用的第二操作，停止采集所述目标语音数据，并在获取到针对所述目标文本信息的存储操作时，根据所述存储操作保存所述目标文本信息。

具体地，该目标用户终端可以在获取所述目标应用对应的第二操作；若所述目标文本信息不具备所述编辑权限，则根据所述第二操作在所述目标应用中结束采集所述目标语音数据，并在获取到针对所述目标文本信息的存储操作时，根据所述存储操作获取所述目标文本信息对应的保存类型，并根据所述保存类型以及所述目标文本信息进行保存处理；若所述目标文本信息具备所述编辑权限，则基于所述第二操作在所述目标应用中暂停采集所述目标语音数据，并在再次获取到所述目标应用的第一操作时，执行所述实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种的第一文本信息的步骤。

由此可见，当该目标用户终端确定该目标文本信息的文本状态为第二状态，即用户A仍可以对该目标文本信息进行编辑处理时，该目标用户终端可以根据接收到的第二操作暂停对目标语音数据的采集与翻译，即用户A可以在会议过程中选择性地录入自己需要重点关注的信息，从而可以提高用户A对待录入语音信息的选择性，以贴合用户的体验。可选地，该目标用户终端还可以在检查到该目标文本信息的文本状态为第一状态时，确定该第二操作是用于结束对目标语音数据的采集与翻译，进而可以在该目标应用中接收对该目标文本信息的存储操作，从而可以选择性地对该目标文本信息进行保存，此时，该目标用户终端可以获取该目标文本信息的保存类型，并基于该保存类型选择性地对该目标文本信息进行存储，比如，可以将该目标文本信息以文本的形式进行存储，还可以将该目标文本信息以图片的形式进行存储。可以理解的是，该目标文本信息可以理解为携带有标记信息的第一文本信息，于是，可选地，该目标用户终端也可以获取该目标文本信息对应的第一文本信息，比如，可以在该目标文本信息中去除文本标记操作对应的标记信息(比如，去除字符串下的下划线)，以得到该目标文本信息对应的纯文本信息，即可以得到新的第一文本信息，从而可以选择性地对该第一文本信息进行存储。

进一步地，请参见图9，是本发明实施例提供的另一种数据处理方法的流程示意图。如图9所示，所述方法可以包括：

步骤S201，获取目标应用对应的初始界面，并从所述初始界面关联的至少一个语种中选择所述目标应用对应的第一语种；

步骤S202，响应针对所述初始界面上的第一按钮的第一操作，将已选择所述第一语种关联的初始界面作为所述目标应用对应的转换界面；

步骤S203，基于所述第一操作实时采集目标语音数据，若所述目标语音数据的语种为第二语种，则将所述第二语种的目标语音数据发送至语音转写引擎对应的服务器，以使所述服务器将所述目标语音数据转换为所述第一语种对应的第一文本信息；

步骤S204，接收所述服务器所返回的第一文本信息，并将所述第一文本信息显示在所述转换界面；

步骤S205，在所述转换界面中获取针对所述第一文本信息的触控操作，并基于所述触控操作调用所述目标应用对应的子线程，并基于所述子线程激活所述第一文本信息的编辑权限；

其中，所述子线程是在所述目标应用获取到所述第一操作时所同步构建的。其中，若该目标用户终端的子线程激活的编辑权限包含文本标记权限，则该目标用户终端可以进一步执行S206-步骤S207，以得到目标文本信息；可选地，若该目标用户终端的子线程激活的编辑权限包含文本标记权限，则可以进一步执行步骤S208-步骤S209，以得到目标文本信息；

步骤S206，在所述第一文本信息具备所述文本标记权限时，检测所述第一文本信息对应的文本标记操作，并基于文本标记操作在所述第一文本信息中获取第一位置信息和第二位置信息；

步骤S207，在所述第一文本信息中将所述第一位置信息和所述第二位置信息之间的文本信息确定为待标记文本信息，并在所述第一文本信息中对所述待标记文本信息进行高亮处理，并将高亮处理后的第一文本信息确定为目标文本信息。

其中，步骤S206-步骤S207的具体实现方式可参见上述图2所对应实施例中对基于所述文本标记操作得到目标文本信息的描述过程，这里将不再继续进行赘述。

可选地，步骤S208，在所述第一文本信息具备所述文本调整权限时，检测所述第一文本信息对应的文本调整操作；

步骤S209，基于所述文本调整操作对所述第一文本信息进行字符调整，并将字符调整后的第一文本信息确定为目标文本信息。

其中，步骤S208-步骤S209的具体实现方式可参见上述图2所对应实施例中对基于所述文本调整操作得到目标文本信息的描述过程，这里将不再继续进行赘述。

步骤S210，获取所述目标应用对应的第二操作；

步骤S211，若所述目标文本信息具备所述编辑权限，则基于所述第二操作在所述目标应用中暂停采集所述目标语音数据。

可选地，该目标用户终端还可以在执行完步骤S211之后，进一步获取到所述目标应用对应的第一操作时，以继续在该目标应用中实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种的第一文本信息，此时，该目标用户终端可以基于第一操作重复执行上述步骤S203-步骤S211，以选择性地对输入该目标用户终端中的目标语音数据进行数据采集与翻译，以避免系统资源的浪费。

为便于理解，进一步地，请参见图10，是本发明实施例提供的一种基于第二操作暂停数据采集的示意图。如图10所示，该目标用户终端可以在检测到该目标文本信息的文本状态为上述第二状态，即该目标文本信息仍然具备编辑权限时，确定图10所示的第二操作是用于暂停对目标语音数据的采集与翻译，以便于能够为用户A提供足够的时间确保该目标文本信息的准确性以及可读性。进一步地，该目标用户终端还可以在图10所示的转换界面中，将除目标文本信息所在区域之外的区域确定为空白区域，并可以在该空白区域执行图10所示的权限去除操作(比如，该权限去除操作可以为针对空白区域所执行的单击操作)，以使该目标用户终端可以基于该权限去除操作将图10所示的携带编辑权限的目标文本信息的编辑权限进行去除，从而可以在该目标用户终端再次获取到该目标应用对应的第一操作时，可以恢复对目标语音数据的采集与翻译，即可以重复执行上述采集目标语音数据的步骤，以将该目标语音数据转换并翻译为第一文本信息。

步骤S212，若所述目标文本信息不具备所述编辑权限，则根据所述第二操作在所述目标应用中结束采集所述目标语音数据，并在获取到针对所述目标文本信息的存储操作时，根据所述存储操作获取所述目标文本信息对应的保存类型，并根据所述保存类型以及所述目标文本信息进行保存处理。

可选地，该目标用户终端在执行步骤S212之前，还可以执行以下步骤：在检测到所述目标文本信息具备所述编辑权限时，在所述目标文本信息所属的转换界面中获取空白区域对应的权限去除操作，并基于所述权限去除操作去除所述目标文本信息的编辑权限；所述空白区域为所述转换界面中除目标文本信息所在区域之外的区域。进一步地，可以参见上述图10所对应实施例中用户A对空白区域的点击操作(即上岁数权限去除操作)。此时，该目标文本信息的编辑权限可以被关闭，从而可以得到不具备编辑权限的目标文本信息，进而可以对不具备编辑权限的目标文本信息进行数据保存。进一步地，请参见图11，是本发明实施例提供的一种基于第二操作结束数据采集的示意图。如图10所示，当去除该目标文本信息的编辑权限之后，用户A可以进一步在该目标文本信息所在的转换界面中对数据采集按钮(此时的数据采集按钮可以为称之为停止按钮或者第二按钮)执行点击操作(此时，该点击操作可以称之为第二操作)，以基于该第二操作结束对目标语音数据的采集与翻译，并可以将该目标文本信息所在的转换界面跳转到该目标文本信息对应的存储界面，具体地，可以参见图11所对应实施例中保存按钮和处于第一状态下的目标文本信息对应的显示界面的示意图，进一步地，当用户A在图11所示的保存按钮(也可以称之为存储按钮)所在的显示界面中对存储按钮执行点击操作(即存储操作)时，可以进一步在该目标用户终端中弹出相应的保存类型。应当理解，在本发明实施例中，去除编辑权限时的目标文本信息的文本内容可以与去除该编辑权限后的目标文本信息的文本内容一致，具体地，可以参见上述由图10所对应实施例中的携带编辑权限的目标文本信息，转变为图11所对应实施例中去除编辑权限的目标文本信息的示意图。

进一步地，请参见图12，是本发明实施例提供的一种选择保存类型的示意图。如图12所示，所述第一文本类型可以理解为将所有译文保存为纯文本类型，即上述用户A可以在图12所示的类型选择区域300b中选择第一文本类型，此时该目标用户终端可以基于所选择的第一文本类型获取该目标文本信息对应的第一文本信息，换言之，该目标用户终端此时可以基于该第一文本类型去除目标文本信息中所携带的标记信息，以得到上述纯文本信息(即得到新的第一文本信息)，此时，该目标用户终端可以将该第一文本信息进行保存处理。可选地，上述用户A也可以在图12所示的类型选择区域300b中选择第二文本类型，此时该目标用户终端可以基于所选择的第二文本类型对该目标文本信息进行存储处理，换言之，该目标用户终端此时可以基于该第二文本类型将携带上述标记信息的目标文本信息进行保存处理。可选地，上述用户A也可以在图12所示的类型选择区域300b中选择第一图片类型，此时该目标用户终端可以基于所选择的第一图片类型获取该目标文本信息对应的第一文本信息，换言之，该目标用户终端此时可以基于该第一文本类型去除目标文本信息中所携带的标记信息，以得到上述纯文本信息(即得到新的第一文本信息)，进一步地，该目标用户终端可以基于上述转换界面的尺寸对该第一文本信息中的内容进行拆分处理，以得到至少一张图片，并可以将拆分后的所述至少一张图片分别保存至所述第一文本信息对应的图片列表中；该第一文本信息对应的图片列表中的每张图片均可以被输出显示在该目标用户终端中，以便于用户A可以更为方便地对该第一文本信息进行查阅。可选地，上述用户A也可以在图12所示的类型选择区域300b中选择第二图片类型，此时该目标用户终端可以基于所选择的第二图片类型、以及上述转换界面的尺寸，将该目标文本信息进行拆分为至少一张图片，并将拆分后的所述至少一张图片分别保存至所述目标文本信息对应的图片列表中，换言之，该目标用户终端此时可以基于该第二文本类型将携带上述标记信息的目标文本信息拆分成多张图片进行保存处理，以提高文本信息的可读性。此外，通过将上述第一文本信息和目标文本信信息拆分为多张图片添加到相应的图片列表中，还可以选择性地将相应图片列表中的图片分析给其他用户，以便于其他用户可以快速获取到所分享的图片中的信息。

可以理解的是，用户A可以在图12所示的选择区域300b中选择一种或者多种保存类型进行保存，以丰富文本信息的保存样式，此外，当该目标用户终端对得到的第一文本信息或者目标文本信息进行保存之后，还可以将所保存的文本信息同步翻译为其他几种语言类型的译文，换言之，该目标用户终端可以在图12所示的消息提醒界面中，接收用户A所执行的确认同步翻译为多语种版本的确认操作，此时，该目标用户终端可以在基于该确认操作在目标应用中显示包含至少一个语种的语种选择区域400b，以构成包含所述至少一个语种的语种选择界面，从而可以在该目标应用中响应针对语种选择界面中至少一个语种的同步选取操作，在所述语种选择界面中将同步选取的语种作为第二语种，并基于所述同步选取操作从保存后的目标文本信息中获取文本标记操作对应的第一位置信息和第二位置信息，并在所述目标文本信息中将所述第一位置信息和第二位置信息之间亮高显示的文本信息作为文本标记信息；可以理解的是，该目标用户终端还可以在所述目标文本信息同步转换为第二语种(例如，图12所示的语种现在区域400b中的语种C)对应的第二文本信息时，在所述第二文本信息中查找与所述文本标记信息具有映射关系的待处理文本信息，并在所述第二文本信息中对所述待处理文本信息进行高亮处理，并对亮高处理后的第二文本信息进行保存处理。其中，可以理解的是，当上述目标文本信息同步翻译为第二文本信息之后，也可以按照上述第一文本信息的保存方式对第二文本信息进行保存处理，例如，可以在图12所示的类型选择区域500b中选择与第二文本信息对应的保存类型，并基于所选择的保存类型对第二文本信息进行选择性存储。可以理解的是，本发明实施例中的第二语种可以包括在图12所示的语种选择区域400b中所选取的语种B、语种C、…、语种D、语种E中的一种或中。因此，对于任意一种语种之间的文本同步翻译的具体过程可以参见上述将第一语种输出的目标文本信息转换为以第二语种输出的第二文本信息的描述，这里将不再继续进行赘述。

应当理解，该目标用户终端可以提供多种保存样式，以丰富文本信息的存储样式，另外，通过将翻译后的目标文本信息同步保存为其他语种对应的第二文本信息，可以有效提升翻译和存储效率。另外，通过将每个语种所对应的文本信息分别保存为一个文件夹，可以方便用户快速对相应语种下所保存的文件信息的查阅，以更贴合用户的体验。

进一步地，请参见图13，是本发明实施例提供的一种数据处理装置的结构示意图，该数据处理装置1可以集成于上述图1所对应实施例中的目标用户终端。如图13所示，该数据处理装置1可以包括：获取转换模块10，权限激活模块20，文本编辑模块30和文本保存模块40；进一步地，该数据处理装置1还可以包含：语种选取模块50和同步转换模块60；

获取转换模块10，用于响应针对目标应用的第一操作，实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种的第一文本信息；

其中，所述获取转换模块10包括：语种选择单元101，第一操作获取单元102，语音数据获取单元103和文本接收单元104；可选地，该获取转换模块10也可以包含语音识别单元106，属性特征确定单元107，文本确定单元108和文本转译单元109；

语种选择单元101，用于获取目标应用对应的初始界面，并从所述初始界面关联的至少一个语种中选择所述目标应用对应的第一语种；

第一操作获取单元102，用于响应针对所述初始界面上的第一按钮的第一操作，将所述第一语种的初始界面作为所述目标应用对应的转换界面；

语音数据获取单元103，用于基于所述第一操作实时采集目标语音数据，若所述目标语音数据的语种为第二语种，则将所述第二语种的目标语音数据发送至语音转写引擎对应的服务器，以使所述服务器将所述目标语音数据转换为所述第一语种对应的第一文本信息；

文本接收单元104，用于接收所述服务器所返回的第一文本信息，并将所述第一文本信息显示在所述转换界面。

可选地，语音识别单元106，用于响应针对目标应用的第一操作，实时采集目标语音数据，并在所述目标应用中基于所述神经网络模型对所述目标语音数据进行语音识别，得到所述神经网络模型对应的语音识别结果；所述语音识别结果中包含从所述目标语音数据中提取到的语音频谱特征与所述神经网络模型中的多个语种属性特征之间的匹配度；

属性特征确定单元107，用于根据所述语音识别结果将具有最大匹配度的语种属性特征确定为目标语种属性特征，并根据所述目标语种属性特征所关联的语种生成所述目标语音数据对应的文本匹配信息；

文本确定单元108，用于若所述文本匹配信息对应的语种与从所述目标应用中所选取的第一语种相同，则将所述文本匹配信息作为所述第一语种对应的第一文本信息；

文本转译单元109，用于若所述文本匹配信息对应的语种与从所述目标应用中所选取的第一语种不相同，则将所述文本匹配信息转译为所述第一语种对应的第一文本信息。

其中，语种选择单元101，第一操作获取单元102，语音数据获取单元103和文本接收单元104以及语音识别单元106，属性特征确定单元107，文本确定单元108和文本转译单元109；的具体实现方式可以参见上述图2所对应实施例中对步骤S101的描述。其中，语种选择单元101，第一操作获取单元102，语音数据获取单元103和文本接收单元104在用于将目标语音数据转换为第一文本信息时，语音识别单元106，属性特征确定单元107，文本确定单元108和文本转译单元109将不用于将目标语音数据转换为第一文本信息时，可选地，语音识别单元106，属性特征确定单元107，文本确定单元108和文本转译单元109在用于将目标语音数据转换为第一文本信息时，语种选择单元101，第一操作获取单元102，语音数据获取单元103和文本接收单元104将不用于将目标语音数据转换为第一文本信息。可以理解的是，当集成有该数据处理装置1的目标用户终端无法在本地将目标语音数据转换为第一文本信息，还可以将该目标语音数据上传至与该目标用户终端具有数据连接关系的服务器进行语音识别和翻译，以得到第一文本信息。

权限激活模块20，用于响应针对转换界面中的第一文本信息的触控操作，激活所述第一文本信息的编辑权限；

具体地，所述权限激活模块20，具体用于在所述转换界面中获取针对所述第一文本信息的触控操作，并基于所述触控操作调用所述目标应用对应的子线程，并基于所述子线程激活所述第一文本信息的编辑权限；所述子线程是在所述目标应用获取到所述第一操作时所同步构建的。

文本编辑模块30，用于根据所述编辑权限获取针对所述第一文本信息的编辑操作，并基于所述编辑操作对所述第一文本信息进行编辑，并将编辑后的第一文本信息确定为目标文本信息；

其中，文本编辑模块30包括：标记操作检测单元301和文本处理单元302；可选地，该文本编辑模块30还可以包括：调整操作检测单元303和字符调整单元304；

标记操作检测单元301，用于在所述第一文本信息具备所述文本标记权限时，检测所述第一文本信息对应的文本标记操作，并基于文本标记操作在所述第一文本信息中获取第一位置信息和第二位置信息；

文本处理单元302，用于在所述第一文本信息中将所述第一位置信息和所述第二位置信息之间的文本信息确定为待标记文本信息，并在所述第一文本信息中对所述待标记文本信息进行高亮处理，并将高亮处理后的第一文本信息确定为目标文本信息。

可选地，调整操作检测单元303，用于在所述第一文本信息具备所述文本调整权限时，检测所述第一文本信息对应的文本调整操作；

字符调整单元304，用于基于所述文本调整操作对所述第一文本信息进行字符调整，并将字符调整后的第一文本信息确定为目标文本信息。

其中，标记操作检测单元301，文本处理单元302，调整操作检测单元303和字符调整单元304的具体实现方式可以参见上述图2所对应实施例中对步骤S103的描述，这里将不再继续进行赘述。

文本保存模块40，用于响应针对所述目标应用的第二操作，停止采集所述目标语音数据，并在获取到针对所述目标文本信息的存储操作时，根据所述存储操作保存所述目标文本信息。

其中，文本保存模块40包括：第二操作获取单元401，暂停采集单元402，结束采集单元403和保存单元404以及权限去除单元405；

第二操作获取单元401，用于获取所述目标应用对应的第二操作；

暂停采集单元402，用于若所述目标文本信息具备所述编辑权限，则基于所述第二操作在所述目标应用中暂停采集所述目标语音数据，并在再次获取到所述目标应用的第一操作时，执行所述实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种的第一文本信息的步骤；

结束采集单元403，用于若所述目标文本信息不具备所述编辑权限，则根据所述第二操作在所述目标应用中结束采集所述目标语音数据，并在获取到针对所述目标文本信息的存储操作时，根据所述存储操作获取所述目标文本信息对应的保存类型；

保存单元404，用于根据所述保存类型以及所述目标文本信息进行保存处理。

其中，所述保存单元404包括：第一保存子单元4041和第二保存子单元4042；

第一保存子单元4041，用于若所述保存类型为第一文本类型，则获取目标文本信息对应的第一文本信息，并基于所述第一文本类型保存所述第一文本信息；

所述第一保存子单元4041，还用于若所述保存类型为第二文本类型，则基于所述第二文本类型保存所述目标文本信息；

第二保存子单元4042，用于若所述保存类型为第一图片类型，则获取目标文本信息对应的第一文本信息，并基于转换界面的尺寸将所述第一文本信息拆分为至少一张图片，并将拆分后的所述至少一张图片分别保存至所述第一文本信息对应的图片列表中；

所述第二保存子单元4042，还用于若所述保存类型为第二图片类型，则基于转换界面的尺寸将所述目标文本信息拆分为至少一张图片，并将拆分后的所述至少一张图片分别保存至所述目标文本信息对应的图片列表中。

其中，第一保存子单元4041和第二保存子单元4042的具体实现方式可参见上述图12所对应实施例中对第一文本类型、第二文本类型、第一图片类型和第二图片类型的描述，这里将不再继续进行赘述。

权限去除单元405，用于在检测到所述目标文本信息具备所述编辑权限时，在所述目标文本信息所属的转换界面中获取空白区域对应的权限去除操作，并基于所述权限去除操作去除所述目标文本信息的编辑权限；所述空白区域为所述目标文本信息所属转换界面中除目标文本信息所在区域之外的区域。

其中，第二操作获取单元401，暂停采集单元402，结束采集单元403和保存单元404以及权限去除单元405的具体实现方式可参见上述图9所对应实施例中对步骤S210-步骤S212的描述，这里将不再继续进行赘述。

语种选取模块50，用于响应针对语种选择界面中至少一个语种的同步选取操作，在所述语种选择界面中将同步选取的语种作为第二语种，并基于所述同步选取操作从保存后的目标文本信息中获取文本标记操作对应的第一位置信息和第二位置信息，并在所述目标文本信息中将所述第一位置信息和第二位置信息之间亮高显示的文本信息作为文本标记信息；

同步转换模块60，用于当所述目标文本信息同步转换为第二语种对应的第二文本信息时，在所述第二文本信息中查找与所述文本标记信息具有映射关系的待处理文本信息，并在所述第二文本信息中对所述待处理文本信息进行高亮处理，并对亮高处理后的第二文本信息进行保存处理。

其中，所述获取转换模块10，权限激活模块20，文本编辑模块30和文本保存模块40的具体实施方式可参见上述图2所对应实施例中对步骤S101-步骤S104的描述，这里将不再继续进行赘述；进一步地，语种选取模块50和同步转换模块60的具体实现方式可参见上述图12所对应实施例对第二文本信息的描述，这里将不再继续进行赘述。

进一步地，请参见图14，是本发明实施例提供的另一种数据处理装置的结构示意图。如图14所示，所述数据处理装置1000可以应用于上述图1对应实施例中的目标用户终端，所述数据处理装置1000可以包括：处理器1001，网络接口1004和存储器1005，此外，所述终端1000还可以包括：用户接口1003，和至少一个通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。其中，用户接口1003可以包括显示屏(Display)、键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1004可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图14所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。

该1000中的网络接口1004可以接收环境空间中的音频数据，该音频数据中可以包含上述用户发出的声音信号，该声音信号也可以称之为目标语音数据，且可选用户接口1003还可以包括显示屏(Display)、键盘(Keyboard)。在图9所示的数据处理装置1000中，网络接口1004可提供网络通讯功能；而用户接口1003主要用于为用户提供输入的接口；而处理器1001可以用于调用存储器1005中存储的设备控制应用程序，以实现：

应当理解，本发明实施例中所描述的数据处理装置1000可执行前文图2和图9所对应实施例中对所述数据处理方法的描述，也可执行前文图13所对应实施例中对所述数据处理装置1的描述，在此不再赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。

此外，这里需要指出的是：本发明实施例还提供了一种计算机存储介质，且所述计算机存储介质中存储有前文提及的数据处理装置1所执行的计算机程序，且所述计算机程序包括程序指令，当所述处理器执行所述程序指令时，能够执行前文图2和图9所对应实施例中对所述数据处理方法的描述，因此，这里将不再进行赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。对于本发明所涉及的计算机存储介质实施例中未披露的技术细节，请参照本发明方法实施例的描述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种数据处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述响应针对目标应用的第一操作，实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种对应的第一文本信息，包括：

3.根据权利要求2所述的方法，其特征在于，所述响应针对转换界面中的第一文本信息的触控操作，激活所述第一文本信息的编辑权限，包括：

4.根据权利要求1所述的方法，其特征在于，所述响应针对目标应用的第一操作，实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种对应的第一文本信息，包括：

响应针对目标应用的第一操作，实时采集目标语音数据，并在所述目标应用中基于神经网络模型对所述目标语音数据进行语音识别，得到所述神经网络模型对应的语音识别结果；所述语音识别结果中包含从所述目标语音数据中提取到的语音频谱特征与所述神经网络模型中的多个语种属性特征之间的匹配度；

5.根据权利要求1所述的方法，其特征在于，所述编辑权限包含文本标记权限；

6.根据权利要求1所述的方法，其特征在于，所述编辑权限包含文本调整权限；

7.根据权利要求1所述的方法，其特征在于，所述响应针对所述目标应用的第二操作，停止采集所述目标语音数据，并在获取到针对所述目标文本信息的存储操作时，根据所述存储操作保存所述目标文本信息，包括：

获取所述目标应用对应的第二操作；

若所述目标文本信息具备所述编辑权限，则基于所述第二操作在所述目标应用中暂停采集所述目标语音数据，并在再次获取到所述目标应用的第一操作时，执行所述实时采集目标语音数据，并将所述目标语音数据实时转换为第一语种对应的第一文本信息的步骤。

8.根据权利要求7所述的方法，其特征在于，还包括：

9.根据权利要求7所述的方法，其特征在于，所述根据所述保存类型以及所述目标文本信息进行保存处理，包括：

10.根据权利要求1所述的方法，其特征在于，还包括：

11.一种数据处理装置，其特征在于，包括：

12.根据权利要求11所述的装置，其特征在于，所述获取转换模块包括：

13.根据权利要求12所述的装置，其特征在于，

所述权限激活模块，具体用于在所述转换界面中获取针对所述第一文本信息的触控操作，并基于所述触控操作调用所述目标应用对应的子线程，并基于所述子线程激活所述第一文本信息的编辑权限；所述子线程是在所述目标应用获取到所述第一操作时所同步构建的。

14.一种数据处理装置，其特征在于，包括：处理器、存储器以及网络接口；

所述处理器与存储器、网络接口相连，其中，网络接口用于连接服务器，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行如权利要求1-10任一项所述的方法。

15.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时，执行如权利要求1-10任一项所述的方法。