CN111953852B

CN111953852B - 通话记录生成方法、装置、终端及存储介质

Info

Publication number: CN111953852B
Application number: CN202010751299.XA
Authority: CN
Inventors: 陈勇; 陈孝良; 常乐
Original assignee: Beijing SoundAI Technology Co Ltd
Current assignee: Beijing SoundAI Technology Co Ltd
Priority date: 2020-07-30
Filing date: 2020-07-30
Publication date: 2021-12-21
Anticipated expiration: 2040-07-30
Also published as: CN111953852A

Abstract

本申请提供了一种通话记录生成方法、装置、终端及存储介质，属于互联网技术领域。所述方法包括：获取第一文本信息，第一文本信息至少包括第一通话文本，第一通话文本是对本次通话过程中当前采集的第一语音信息进行识别得到的；将第一显示区域中的第二文本信息替换为第一文本信息，第一显示区域用于显示本次通话当前的文本信息；将第二文本信息显示于第二显示区域中，第二显示区域用于汇总显示本次通话过程中的历史文本信息；根据第二显示区域中的历史文本信息生成第一文本通话记录，通过上述方法不仅能够提高生成文本通话记录的效率，还能提升通话效果。

Description

通话记录生成方法、装置、终端及存储介质

技术领域

本申请涉及互联网技术领域，特别涉及一种通话记录生成方法、装置、终端及存储介质。

背景技术

随着互联网技术的发展，会议的形式发生了极大的变化，参会人员不必聚集在一个会议室进行开会，而是通过语音通话或者视频通话等方式来进行跨地域的会议，不仅提高了沟通效率，还降低了沟通成本。

在通话过程中，通常需要记录通话内容。相关技术中，往往是记录人员以手动方式对通话内容进行记录，然而这样生成通话记录的效率低。

发明内容

本申请实施例提供了一种通话记录生成方法、装置、终端及存储介质，能够提高生成通话记录的效率。所述技术方案如下：

一方面，提供了一种通话记录生成方法，所述方法包括：

获取第一文本信息，所述第一文本信息至少包括第一通话文本，所述第一通话文本是对本次通话过程中当前采集的第一语音信息进行识别得到的；

将第一显示区域中的第二文本信息替换为所述第一文本信息，所述第一显示区域用于显示本次通话当前的文本信息，所述第二文本信息至少包括第二通话文本，所述第二通话文本是对在所述第一语音信息之前采集的第二语音信息进行识别得到的；

将所述第二文本信息显示于第二显示区域中，所述第二显示区域用于汇总显示本次通话过程中的历史文本信息；

根据所述第二显示区域中的历史文本信息生成第一文本通话记录。

在一种可能的实现方式中，所述第二文本信息还包括所述第二通话文本对应的第二用户标识，所述将所述第二文本信息显示于第二显示区域中，包括：

若所述第二显示区域中已显示的最后一条文本信息包括的用户标识不是所述第二用户标识，将所述第二文本信息显示在所述最后一条文本信息的后面；

若所述第二显示区域中已显示的最后一条文本信息包括的用户标识是所述第二用户标识，将所述第二通话文本与所述最后一条文本信息包括的通话文本合并。

在另一种可能的实现方式中，所述方法还包括：

将所述第二文本信息显示于第三显示区域中，所述第三显示区域为可编辑区域，用于汇总显示或编辑本次通话过程中的历史文本信息；

根据检测到的编辑操作，对所述第二文本信息进行编辑，得到所述第二文本信息编辑后的文本信息；

根据所述第三显示区域中的历史文本信息生成第二文本通话记录。

在另一种可能的实现方式中，所述第二文本信息还包括所述第二通话文本对应的第二用户标识，所述将所述第二文本信息显示于第三显示区域中，包括：

若所述第三显示区域中已显示的最后一条文本信息包括的用户标识不是所述第二用户标识，将所述第二文本信息显示在所述最后一条文本信息的后面；

若所述第三显示区域中已显示的最后一条文本信息包括的用户标识是所述第二用户标识，将所述第二通话文本与所述最后一条文本信息包括的通话文本合并。

在另一种可能的实现方式中，所述历史文本信息包括历史通话文本和所述历史通话文本对应的用户标识，所述方法还包括：

若检测到对所述第三显示区域中的任一个目标用户标识的编辑操作，根据所述编辑操作，对所述第三显示区域中的每个所述目标用户标识进行编辑。

在另一种可能的实现方式中，所述方法还包括：

根据本次通话过程中采集的语音信息生成音频通话记录；

建立所述第一文本通话记录中的每条文本信息与所述音频通话记录中对应的语音信息之间的关联关系。

在另一种可能的实现方式中，所述方法还包括：

响应于对所述第一文本通话记录或所述音频通话记录的浏览操作，在显示所述第一文本通话记录的同时，播放所述音频通话记录，其中，当前播放的语音信息在所述第一文本通话记录中对应的文本信息突出显示。

在另一种可能的实现方式中，所述方法还包括：

根据本次通话过程中采集的语音信息生成音频通话记录；

建立所述第二文本通话记录中的每条文本信息与所述音频通话记录中对应的语音信息之间的关联关系。

在另一种可能的实现方式中，所述方法还包括：

响应于对所述第二文本通话记录或所述音频通话记录的浏览操作，在显示所述第二文本通话记录的同时，播放所述音频通话记录，其中，当前播放的语音信息在所述第二文本通话记录中对应的文本信息突出显示。

在另一种可能的实现方式中，所述获取第一文本信息之前，所述方法还包括：

显示语种设置界面，基于所述语种设置界面获取为当前登录的用户标识设置的目标语种；

向服务器发送所述用户标识和所述目标语种，所述服务器用于将通话过程中采集的语音信息识别为属于所述目标语种的通话文本。

显示禁忌词设置界面，基于所述禁忌词设置界面获取为当前登录的用户标识设置的禁忌词；

向服务器发送所述用户标识和所述禁忌词，所述服务器用于将所述通话过程中采集的语音信息识别为通话文本后，将所述通话文本中的所述禁忌词替换为目标字符。

在另一种可能的实现方式中，所述将第一显示区域中的第二文本信息替换为所述第一文本信息，包括：

显示所述第二文本信息从所述第一显示区域滚动消失的动态效果；

显示所述第一文本信息在所述第一显示区域中滚动出现的动态效果。

另一方面，提供了一种通话记录生成装置，所述装置包括：

文本获取模块，被配置为获取第一文本信息，所述第一文本信息至少包括第一通话文本，所述第一通话文本是对本次通话过程中当前采集的第一语音信息进行识别得到的；

文本替换模块，被配置为将第一显示区域中的第二文本信息替换为所述第一文本信息，所述第一显示区域用于显示本次通话当前的文本信息，所述第二文本信息至少包括第二通话文本，所述第二通话文本是对在所述第一语音信息之前采集的第二语音信息进行识别得到的；

第一文本显示模块，被配置为将所述第二文本信息显示于第二显示区域中，所述第二显示区域用于汇总显示本次通话过程中的历史文本信息；

第一记录生成模块，被配置为根据所述第二显示区域中的历史文本信息生成第一文本通话记录。

在一种可能的实现方式中，所述第二文本信息还包括所述第二通话文本对应的第二用户标识，

所述第一文本显示模块，被配置为若所述第二显示区域中已显示的最后一条文本信息包括的用户标识不是所述第二用户标识，将所述第二文本信息显示在所述最后一条文本信息的后面；若所述第二显示区域中已显示的最后一条文本信息包括的用户标识是所述第二用户标识，将所述第二通话文本与所述最后一条文本信息包括的通话文本合并。

在另一种可能的实现方式中，所述装置还包括：

第二文本显示模块，被配置为将所述第二文本信息显示于第三显示区域中，所述第三显示区域为可编辑区域，用于汇总显示或编辑本次通话过程中的历史文本信息；

文本编辑模块，被配置为根据检测到的编辑操作，对所述第二文本信息进行编辑，得到所述第二文本信息编辑后的文本信息；

第二记录生成模块，被配置为根据所述第三显示区域中的历史文本信息生成第二文本通话记录。

在另一种可能的实现方式中，所述第二文本信息还包括所述第二通话文本对应的第二用户标识，

所述第二文本显示模块，被配置为若所述第三显示区域中已显示的最后一条文本信息包括的用户标识不是所述第二用户标识，将所述第二文本信息显示在所述最后一条文本信息的后面；若所述第三显示区域中已显示的最后一条文本信息包括的用户标识是所述第二用户标识，将所述第二通话文本与所述最后一条文本信息包括的通话文本合并。

在另一种可能的实现方式中，所述历史文本信息包括历史通话文本和所述历史通话文本对应的用户标识，

所述文本编辑模块，还被配置为若检测到对所述第三显示区域中的任一个目标用户标识的编辑操作，根据所述编辑操作，对所述第三显示区域中的每个所述目标用户标识进行编辑。

在另一种可能的实现方式中，所述装置还包括：

第三记录生成模块，被配置为根据本次通话过程中采集的语音信息生成音频通话记录；

第一关联模块，被配置为建立所述第一文本通话记录中的每条文本信息与所述音频通话记录中对应的语音信息之间的关联关系。

在另一种可能的实现方式中，所述装置还包括：

第一记录浏览模块，被配置为响应于对所述第一文本通话记录或所述音频通话记录的浏览操作，在显示所述第一文本通话记录的同时，播放所述音频通话记录，其中，当前播放的语音信息在所述第一文本通话记录中对应的文本信息突出显示。

在另一种可能的实现方式中，所述装置还包括：

第四记录生成模块，被配置为根据本次通话过程中采集的语音信息生成音频通话记录；

第二关联模块，被配置为建立所述第二文本通话记录中的每条文本信息与所述音频通话记录中对应的语音信息之间的关联关系。

在另一种可能的实现方式中，所述装置还包括：

第二记录浏览模块，被配置为响应于对所述第二文本通话记录或所述音频通话记录的浏览操作，在显示所述第二文本通话记录的同时，播放所述音频通话记录，其中，当前播放的语音信息在所述第二文本通话记录中对应的文本信息突出显示。

在另一种可能的实现方式中，所述装置还包括：

语种设置模块，被配置为显示语种设置界面，基于所述语种设置界面获取为当前登录的用户标识设置的目标语种；

语种发送模块，被配置为向服务器发送所述用户标识和所述目标语种，所述服务器用于将通话过程中采集的语音信息识别为属于所述目标语种的通话文本。

在另一种可能的实现方式中，所述装置还包括：

禁忌词设置模块，被配置为显示禁忌词设置界面，基于所述禁忌词设置界面获取为当前登录的用户标识设置的禁忌词；

禁忌词发送模块，被配置为向服务器发送所述用户标识和所述禁忌词，所述服务器用于将所述通话过程中采集的语音信息识别为通话文本后，将所述通话文本中的所述禁忌词替换为目标字符。

在另一种可能的实现方式中，所述文本替换模块，被配置为显示所述第二文本信息从所述第一显示区域滚动消失的动态效果；显示所述第一文本信息在所述第一显示区域中滚动出现的动态效果。

另一方面，提供了一种终端，所述终端包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述程序代码由所述处理器加载并执行以实现上述任一种可能实现方式中的通话记录生成方法中执行的操作。

另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条程序代码，所述程序代码由处理器加载并执行以实现上述任一种可能实现方式中的通话记录生成方法中执行的操作。

另一方面，提供了一种计算机程序产品，所述计算机程序产品中包括至少一条程序代码，所述程序代码由处理器加载并执行以实现上述任一种可能实现方式中的通话记录生成方法中执行的操作。

本申请实施例提供的技术方案带来的有益效果至少包括：

本申请实施例提供了第一显示区域和第二显示区域，在对当前采集的第一语音信息识别得到第一通话文本后，将第一显示区域中的第二文本信息替换为包括第一通话文本的第一文本信息，且将第二文本信息显示于用于汇总显示通话过程中的历史文本信息的第二显示区域，保证了用户既能通过第一显示区域看到本次通话当前识别的最新的通话内容，还能通过第二显示区域看到通话期间的历史通话内容，提升了通话效果，并且，由于第二显示区域中的历史文本信息均是根据语音信息识别得到的，因此，根据第二显示区域中的历史文本信息自动地生成文本通话记录，避免了记录人员以手动方式记录通话内容，简化了记录人员的操作，极大地提高了生成文本通话记录的效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种实施环境的示意图；

图2是本申请实施例提供的一种通话记录生成方法的流程图；

图3是本申请实施例提供的一种通话记录生成方法的流程图；

图4是本申请实施例提供的一种通话记录生成装置的框图；

图5是本申请实施例提供的一种终端的结构示意图；

图6是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

可以理解，本申请所使用的术语“每条”、“多条”及“任一”等，多条包括两条或两条以上，每条是指对应的多条中的每一条，任一是指对应的多条中的任意一条。举例来说，多条文本信息包括10条文本信息，而每条文本信息是指这10条文本信息中的每一条文本信息，任一文本信息是指10条文本信息中的任意一条文本信息。

图1是本申请实施例提供的一种实施环境的示意图。参见图1，该实施环境包括至少一个第一终端101(图1中以1个为例)、至少一个第二终端102(图1中以3个为例)和服务器103。第一终端101、第二终端102以及服务器103之间通过无线或者有线网络连接。并且，第一终端101和第二终端102上安装由服务器103提供服务的目标应用，第一终端101和第二终端102能够通过该目标应用实现例如数据传输、消息交互等功能。

可选地，第一终端101和第二终端102为电脑、手机、平板电脑或者其他终端，目标应用为第一终端101或者第二终端102上安装的任一应用，可选地，目标应用为操作系统中的目标应用或者为第三方提供的目标应用。例如，目标应用为通话应用，该通话应用具有语音通话或者视频通话的功能，可选地，该通话应用还具有其他功能，例如，社交功能、游戏功能等。可选地，服务器103为该目标应用对应的后台服务器，或者，服务器103为提供云计算或云存储等服务的云服务器，本申请对此不做限制。

可选地，第一终端101和第二终端102基于各自的用户标识登录目标应用，在目标应用中进行通话。假设第一终端101为本次通话过程中当前正在发言的用户对应的终端，第二终端102为参与通话的其他终端，第一终端101用于采集当前的语音信息和视频信息，将语音信息和视频信息上传服务器103。服务器103用于将语音信息识别为文本信息，将语音信息、视频信息以及文本信息同步至第二终端102，以及将文本信息同步至第一终端101。

在视频通话或者语音通话过程中，通过本申请提供的通话记录生成方法生成通话记录，不仅能够提高生成通话记录的效率，还能够提高通话效果。

图2是本申请实施例提供的一种通话记录生成方法的流程图。参见图2，该实施例的执行主体为终端，该实施例包括：

步骤201：获取第一文本信息，第一文本信息至少包括第一通话文本，第一通话文本是对本次通话过程中当前采集的第一语音信息进行识别得到的。

步骤202：将第一显示区域中的第二文本信息替换为第一文本信息，第一显示区域用于显示本次通话当前的文本信息，第二文本信息至少包括第二通话文本，第二通话文本是对在第一语音信息之前采集的第二语音信息进行识别得到的。

步骤203：将第二文本信息显示于第二显示区域中，第二显示区域用于汇总显示本次通话过程中的历史文本信息。

步骤204：根据第二显示区域中的历史文本信息生成第一文本通话记录。

在一种可能的实现方式中，第二文本信息还包括第二通话文本对应的第二用户标识，将第二文本信息显示于第二显示区域中，包括：

若第二显示区域中已显示的最后一条文本信息包括的用户标识不是第二用户标识，将第二文本信息显示在最后一条文本信息的后面；

若第二显示区域中已显示的最后一条文本信息包括的用户标识是第二用户标识，将第二通话文本与最后一条文本信息包括的通话文本合并。

在另一种可能的实现方式中，方法还包括：

将第二文本信息显示于第三显示区域中，第三显示区域为可编辑区域，用于汇总显示或编辑本次通话过程中的历史文本信息；

根据检测到的编辑操作，对第二文本信息进行编辑，得到第二文本信息编辑后的文本信息；

根据第三显示区域中的历史文本信息生成第二文本通话记录。

在另一种可能的实现方式中，第二文本信息还包括第二通话文本对应的第二用户标识，将第二文本信息显示于第三显示区域中，包括：

若第三显示区域中已显示的最后一条文本信息包括的用户标识不是第二用户标识，将第二文本信息显示在最后一条文本信息的后面；

若第三显示区域中已显示的最后一条文本信息包括的用户标识是第二用户标识，将第二通话文本与最后一条文本信息包括的通话文本合并。

在另一种可能的实现方式中，历史文本信息包括历史通话文本和历史通话文本对应的用户标识，方法还包括：

若检测到对第三显示区域中的任一个目标用户标识的编辑操作，根据编辑操作，对第三显示区域中的每个目标用户标识进行编辑。

在另一种可能的实现方式中，方法还包括：

根据本次通话过程中采集的语音信息生成音频通话记录；

建立第一文本通话记录中的每条文本信息与音频通话记录中对应的语音信息之间的关联关系。

在另一种可能的实现方式中，方法还包括：

响应于对第一文本通话记录或音频通话记录的浏览操作，在显示第一文本通话记录的同时，播放音频通话记录，其中，当前播放的语音信息在第一文本通话记录中对应的文本信息突出显示。

在另一种可能的实现方式中，方法还包括：

根据本次通话过程中采集的语音信息生成音频通话记录；

建立第二文本通话记录中的每条文本信息与音频通话记录中对应的语音信息之间的关联关系。

在另一种可能的实现方式中，方法还包括：

响应于对第二文本通话记录或音频通话记录的浏览操作，在显示第二文本通话记录的同时，播放音频通话记录，其中，当前播放的语音信息在第二文本通话记录中对应的文本信息突出显示。

在另一种可能的实现方式中，获取第一文本信息之前，方法还包括：

显示语种设置界面，基于语种设置界面获取为当前登录的用户标识设置的目标语种；

向服务器发送用户标识和目标语种，服务器用于将通话过程中采集的语音信息识别为属于目标语种的通话文本。

显示禁忌词设置界面，基于禁忌词设置界面获取为当前登录的用户标识设置的禁忌词；

向服务器发送用户标识和禁忌词，服务器用于将通话过程中采集的语音信息识别为通话文本后，将通话文本中的禁忌词替换为目标字符。

在另一种可能的实现方式中，将第一显示区域中的第二文本信息替换为第一文本信息，包括：

显示第二文本信息从第一显示区域滚动消失的动态效果；

显示第一文本信息在第一显示区域中滚动出现的动态效果。

图3是本申请实施例提供的一种通话记录生成方法的流程图。参见图3，该实施例包括：

步骤301：终端获取第一文本信息，第一文本信息至少包括第一通话文本，第一通话文本是对本次通话过程中当前采集的第一语音信息进行识别得到的。

该实施例描述了终端与其他终端进行语音通话或者视频通话，在通话过程中生成通话记录的方法。可选地，终端基于用户标识登录目标应用，通过目标应用和其他终端进行语音通话或者视频通话，在通话过程中生成通话记录。

其中，用户标识用于表示用户身份，可选地，用户标识为用户的账号或者手机号等，本申请对此不做限制。终端在登录目标应用前，需要先在目标应用中注册用户标识，例如，终端在该目标应用中注册手机号或者注册邮箱。相应的，终端基于在目标应用中注册的用户标识登录目标应用。或者，在登录目标应用前，终端在与该目标应用具有关联关系的第三方应用中注册用户标识，例如，在与目标应用具有关联关系的第三方应用中注册手机号或者注册邮箱。相应的，终端基于在第三方应用中注册的用户标识，登录目标应用。

可选地，终端基于在第三方应用中注册的用户标识登录目标应用的实现方式为：终端基于目标应用获取输入的用户标识和第三方应用标识，表示该用户标识是在第三方应用中注册的。终端向目标应用对应的服务器发送登录请求，登录请求中携带该用户标识和该第三方应用标识，服务器接收到携带该用户标识和该第三方应用标识的登录请求后，转发给该第三方应用对应的第三方服务器，若第三方服务器返回确认通知，表示该用户标识是在第三方应用中注册的用户标识，则该目标应用对应的服务器授权终端登录该用户标识。

可选地，终端在与目标应用共享一个身份认证服务器的其他应用中注册用户标识，且基于该用户标识登录该其他应用后，则能够根据在登录该其他应用时，身份认证服务器返回的身份凭证直接登录目标应用，实现方式为：终端通过目标应用向认证服务器发送登录请求，登录请求中携带身份凭证，该身份凭证是终端在基于用户标识登录与目标应用共享该身份认证服务器的其他应用时，认证服务器返回给终端的，认证服务器接收到携带该身份凭证的登录请求后，验证该身份凭证的有效性，若该身份凭证有效，则授权终端登录该用户标识。这种登录方式称为单点登录方式，通过单点登录方式，用户只需要基于用户标识登录共享身份认证服务器的多个应用中的其中一个应用，则能够基于认证服务器返回的身份凭证登录该多个应用中的任一应用，避免了对用户标识进行重复认证的过程，提高了登录应用的效率。

可选地，终端创建通话，生成该通话的通话链接或者该通话的通话标识，将该通话链接或者通话标识分享给其他终端，则其他终端能够基于该通话链接或者该通话标识加入到该通话中。可选地，终端在创建通话时，设置加入该通话的密码，相应的，当其他终端基于通话链接或者通话标识加入该通话时，需要输入该通话的密码才能加入该通话中。

可选地，终端基于其他终端发送的通话链接或者通话标识加入通话中，当该通话链接或者该通话标识对应的通话设置有密码时，终端获取输入的密码，基于该密码加入对应的通话中。

可选地，终端显示历史通话页面，历史通话页面中包括至少一个终端历史加入过的通话标识，终端基于该历史通话页面获取输入的通话标识，加入到该通话标识对应的通话中。如此，对于一些用户需要经常进行的通话，例如每天早上例行的通话，用户不需要重复创建通话，也不需要重复输入通话标识，而能够基于历史通话页面中显示的历史加入过的通话对应的通话标识直接加入到通话中，提高了进行通话的效率。

可选地，终端显示音频设置界面，基于音频设置界面开启或关闭麦克风。可选地，终端显示视频设置界面，基于视频设置界面开启或关闭摄像头。

终端在加入到通话中后，接收服务器发送的第一文本信息，第一文本信息至少包括第一通话文本，第一通话文本是服务器对本次通话过程中当前采集的第一语音信息进行识别得到的。

一个通话有至少两个终端参与，在通话过程中，正在发言的用户对应的终端采集当前的第一语音信息，向服务器发送该第一语音信息，服务器接收到该第一语音信息后，将该第一语音信息识别为第一通话文本，然后向参与该通话的至少两个终端发送包括该第一通话文本的第一文本信息。

可选地，正在发言的用户对应的终端采集当前的第一语音信息的实现方式为：终端在检测到语音信息时，持续采集第一语音信息，当检测到静默时长大于预设阈值时，停止采集第一语音信息。

可选地，第一文本信息除了包括第一通话文本外，还包括第一通话文本对应的用户标识。在通话过程中，正在发言的用户对应的终端在采集当前的第一语音信息后，将第一语音信息和第一语音信息对应的用户标识一起发送给服务器，服务器将第一语音信息识别为第一通话文本后，向参与该通话的至少两个终端发送包括该第一通话文本和该用户标识的第一文本信息。

需要说明的一点是，第一语音信息对应的用户标识即为第一通话文本对应的用户标识。可选地，第一语音信息对应的用户标识为登录目标应用的用户标识，或者，第一语音信息对应的用户标识是其他用户标识，例如，是终端在加入通话前基于用户标识输入栏获取的用户标识，或者，是终端在加入通话后，基于用户标识修改栏获取的用户标识，本申请对此不做限制。

在一种可能的实现方式中，终端获取第一文本信息之前，方法还包括：终端显示语种设置界面，基于语种设置界面获取为当前登录的用户标识设置的目标语种，向服务器发送用户标识和目标语种，服务器用于将通话过程中采集的语音信息识别为属于目标语种的通话文本。

服务器在接收到终端发送的用户标识和目标语种后，将用户标识和该目标语种关联存储，之后，服务器在接收到通话过程中采集的语音信息时，将语音信息识别为属于该目标语种的通话文本，向该终端发送包括属于该目标语种的通话文本的文本信息。

可选地，服务器将通话过程中采集的语音信息识别为属于目标语种的通话文本的步骤包括：服务器将通话过程中采集的语音信息识别为与该语音信息所属的语种一致的通话文本后，将该通话文本翻译为属于目标语种的通话文本。

需要说明的一点是，由于为每个用户标识设置的语种可能不同，则服务器可能将通话过程中采集的语音信息识别为多个版本的通话文本，每个版本的通话文本所属的语种不同，服务器在得到多个版本的通话文本后，向每个终端发送的文本信息包括与该终端所登录的用户标识对应的语种一致的通话文本，终端接收文本信息，后续显示该文本信息，保证了在通话过程中，不论采用何种语言进行通话，终端都能够显示与用户语种一致的通话文本，便于用户理解通话内容，极大地提高了通话效果。

在一种可能的实现方式中，终端获取第一文本信息之前，方法还包括：终端显示禁忌词设置界面，基于禁忌词设置界面获取为当前登录的用户标识设置的禁忌词，向服务器发送用户标识和禁忌词，服务器用于将通话过程中采集的语音信息识别为通话文本后，将通话文本中的禁忌词替换为目标字符。其中，目标字符包括目标文字和目标符号，可选地，目标文字为任意文字，目标字符为任意字符，例如，目标字符为“*”，本申请对此不做限制。如此，后续终端显示的通话文本中则没有禁忌词，提高了显示文本信息的灵活性。

步骤302：终端将第一显示区域中的第二文本信息替换为第一文本信息。

其中，第一显示区域用于显示本次通话当前的文本信息，可选地，第一显示区域为通话界面上的任一显示区域，例如，第一显示区域为当前通话界面上的左上角区域，或者第一显示区域为当前通话界面上最下方的区域等，本申请对此不做限制。

第二文本信息至少包括第二通话文本，第二通话文本是对在第一语音信息之前采集的第二语音信息进行识别得到的。

在一种可能的实现方式中，终端将第一显示区域中的第二文本信息替换为第一文本信息的步骤包括：终端显示第二文本信息从第一显示区域滚动消失的动态效果，显示第一文本信息在第一显示区域中滚动出现的动态效果。

可选地，终端显示第二文本信息从第一显示区域向上滚动消失的动态效果，显示第一文本信息从第一显示区域的下方在第一显示区域中滚动出现的动态效果。或者，终端显示第二文本信息从第一显示区域向下滚动消失的动态效果，显示第一文本信息从第一显示区域的上方在第一显示区域中滚动出现的动态效果。或者，终端显示第二文本信息从第一显示区域向左滚动消失的动态效果，显示第一文本信息从第一显示区域的右方在第一显示区域中滚动出现的动态效果。或者，终端显示第二文本信息从第一显示区域向右滚动消失的动态效果，显示第一文本信息从第一显示区域的左方在第一显示区域中滚动出现的动态效果，本申请对此不做限制。

可选地，终端显示动态效果的设置界面，基于动态效果的设置界面，设置第一显示区域中替换文本信息的动态效果。如此使得用户能够基于动态效果的设置界面设置自己喜欢的动态效果，满足了用户的个性化需求，提高了用户粘性。

在一种可能的实现方式中，在通话界面上显示第一显示区域是一个选择性的功能，用户能够自由设置是否启用该功能。可选地，实现方式为：通话界面上包括实时文本信息的显示按钮，终端响应于对该实时文本信息的显示按钮的触发操作，在通话界面上显示第一显示区域。

在本申请实施例中，通过将第一显示区域中的第二文本信息替换为第一文本信息，保证了第一显示区域中显示的文本信息是当前识别的最新的文本信息，也即是，保证了第一显示区域中显示的文本信息是与用户当前收听的语音信息同步的文本信息，使得用户能够一边收听当前通话的语音信息，一边观看同步的文本信息，从而提高了通话效果。

步骤303：终端将第二文本信息显示于第二显示区域中，第二显示区域用于汇总显示本次通话过程中的历史文本信息。

终端将第一显示区域中第二文本信息替换为第一文本信息的同时、或者将第一显示区域中的第二文本信息替换为第一文本信息之前或者之后，将第二文本信息显示于第二显示区域中，以保证第二显示区域能够显示从该通话开始到当前的历史文本信息，使得用户在通话时能够看到通话持续期间的历史通话记录，提高了通话效果。

在一种可能的实现方式中，终端将第二文本信息显示于第二显示区域中的步骤包括：终端直接将第二文本信息显示于第二显示区域中已显示的最后一条文本信息的后面。

第二显示区域中汇总显示了本次通话过程中的历史文本信息，将第二文本信息显示在最后一条文本信息的后面，则第二显示区域按照从前至后的顺序显示了本次通话过程中的文本信息，便于用户浏览。

在一种可能的实现方式中，第二文本信息还包括第二通话文本对应的第二用户标识，终端将第二文本信息显示于第二显示区域中，包括：终端将第二用户标识与第二显示区域中已显示的最后一条文本信息相比较，若第二显示区域中已显示的最后一条文本信息包括的用户标识不是第二用户标识，将第二文本信息显示在该最后一条文本信息的后面；若第二显示区域中已显示的最后一条文本信息包括的用户标识是第二用户标识，将第二通话文本与该最后一条文本信息包括的通话文本合并。

第二显示区域汇总显示的历史文本信息也包括历史通话文本和历史通话文本对应的用户标识。可选地，在第二显示区域中，对于每条历史文本信息，其中的用户标识显示在历史通话文本的前面。在将第二文本信息显示在第二显示区域时，在第二文本信息包括第二用户标识和第二通话文本的情况下，若上述最后一条文本信息包括的用户标识不是第二用户标识，则说明第二文本信息与该第二文本信息之前的一个历史文本信息不是同一个用户的文本信息，则将第二文本信息显示在该最后一条文本信息的后面，且对于该第二文本信息，该第二文本信息包括的第二用户标识显示在第二通话文本的前面。若上述最后一条文本信息包括的用户标识是第二用户标识，则说明第二文本信息与该第二文本信息之前的一个历史文本信息是同一个用户的文本信息，则不必在该最后一条文本信息的后面，重复显示第二用户标识，而是将第二通话文本与该最后一条文本信息所包括的通话文本合并，显示在已显示的第二用户标识后面，如此能够避免将同一个用户的文本信息断开，保证同一用户的文本信息连续显示，提高了文本信息的显示效果，便于用户浏览。

在一种可能的实现方式中，在通话界面上显示第二显示区域是的一个选择性的功能，用户能够自由设置是否启用该功能。可选地，实现方式为：通话界面上包括历史文本信息的显示按钮，终端响应于对该历史文本信息的显示按钮的触发操作，在通话界面上显示第二显示区域。

在一种可能的实现方式中，除了将第二文本信息显示于第二显示区域外，终端还将第二文本信息显示于第三显示区域中，其中，第三显示区域为可编辑区域，用于汇总显示或编辑本次通话过程中的历史文本信息。可选地，终端在将第二文本信息显示于第二显示区域中后，根据检测到的编辑操作，对第二文本信息进行编辑，得到第二文本信息编辑后的文本信息。

在本申请实施例中，通过提供一个可编辑的第三显示区域，并且将历史文本信息汇总显示于该第三显示区域中，使得用户在进行通话的同时，能够对文本信息进行编辑整理，例如，对文本信息进行纠错或在文本信息上添加笔记等，后续根据该第三显示区域中的历史文本信息生成通话记录，在提高了生成通话记录的效率的同时，保证了该通话记录是准确且便于用户理解的，保证了该通话记录的质量。

在一种可能的实现方式中，终端将第二文本信息显示于第三显示区域中的步骤包括：终端直接将第二文本信息显示于第三显示区域中已显示的最后一条文本信息的后面。

第三显示区域中汇总显示了本次通话过程中的历史文本信息，将第二文本信息显示在最后一条文本信息的后面，则第二显示区域按照从前至后的顺序显示了本次通话过程中的历史文本信息，便于用户浏览文本信息和编辑文本信息。

在一种可能的实现方式中，第二文本信息还包括第二通话文本对应的第二用户标识，终端将第二文本信息显示于第三显示区域中，包括：终端将第二用户标识与第三显示区域中已显示的最后一条文本信息相比较，若第三显示区域中已显示的最后一条文本信息包括的用户标识不是第二用户标识，将第二文本信息显示在该最后一条文本信息的后面；若第三显示区域中已显示的最后一条文本信息包括的用户标识是第二用户标识，将第二通话文本与该最后一条文本信息包括的通话文本合并。

第三显示区域汇总显示的历史文本信息也包括历史通话文本和历史通话文本对应的用户标识，可选地，在第三显示区域中，对于每条历史文本信息，其中的用户标识显示在历史通话文本的前面。在将第二文本信息显示于第三显示区域时，在第二文本信息包括第二用户标识和第二通话文本的情况下，若上述最后一条文本信息包括的用户标识不是第二用户标识，则说明第二文本信息与该第二文本信息之前的一个历史文本信息不是同一个用户的文本信息，则将第二文本信息显示在该最后一条文本信息的后面，且对于该第二文本信息，该第二文本信息包括的第二用户标识显示在第二通话文本的前面。若上述最后一条文本信息包括的用户标识是第二用户标识，则说明第二文本信息与该第二文本信息之前的一个历史文本信息是同一个用户的文本信息，则不必在该最后一条文本信息的后面，重复显示第二用户标识，而是将第二通话文本与该最后一条文本信息所包括的通话文本合并，显示在已显示的第二用户标识后面，如此能够避免用户标识将同一个用户的文本信息断开，保证同一用户的文本信息连续显示，提高了文本信息的显示效果，便于用户浏览。

需要说明的一点是，第三显示区域中可能包括编辑后的历史文本信息和未编辑的历史文本信息，本申请对此不做限制。

在对第三显示区域中的历史文本信息编辑时，不仅能够编辑历史文本信息中的通话文本，也能够编辑历史文本信息中的用户标识。在通话过程中，同一用户可能陆续进行了多次发言，则第三显示区域中会包括多个相同的用户标识，在用户需要对多个相同的用户标识进行修改的情况下，只需要对其中一个用户标识进行修改，终端则会自动对第三显示区域中与该用户标识相同的多个用户标识进行修改。例如，用户需要将第三显示区域中的“张先生”修改为“张三”，则用户只需要将其中的一个“张先生”修改为“张三”，终端则会自动将第三显示区域中的所有“张先生”修改为“张三”。实现方式为，若终端检测到对第三显示区域中的任一个目标用户标识的编辑操作，终端根据该编辑操作，对第三显示区域中的每个目标用户标识进行编辑。如此，极大地提高了对文本信息编辑的效率。

可选地，用户基于文本信息的格式设置界面，设置第三显示区域中的文本信息的格式，可选地，文本信息的格式包括字体格式、段落格式等，本申请对此不做限制。例如，用户调整第三显示区域中的文本信息的字体、字号、颜色、修饰(粗体/斜体/下划线/删除线)、行距、段首缩进、段间距离等。实现方式为：终端显示文本信息的格式设置界面，基于文本信息的格式设置界面设置文本信息的格式。如此，满足了用户的个性化设置需求，提高了用户粘性。

需要说明的一点是，若用户没有设置第三显示区域中的文本信息的格式，终端则采用默认的格式。可选地，该默认的格式为任意格式，例如，默认的格式为：宋体，5号，黑色，单倍行距，段首无缩进，段间距离10磅等。

在一种可能的实现方式中，在通话界面上显示第三显示区域是一个选择性的功能，用户能够自由设置是否启用该功能。可选地，实现方式为：通话界面上包括文本信息的编辑按钮，终端响应于对该编辑按钮的触发操作，在通话界面上显示第三显示区域。

需要说明的一点是，具有编辑撤销和编辑恢复的功能，也即是，用户能够对在第三显示区域中进行的编辑操作进行撤销或恢复。另外，终端在将第二文本信息显示于第三显示区域中时，不会影响第三显示区域中的光标的位置，光标保持在当前编辑的位置处。

通话终端中登录的用户标识的身份为管理员身份或者不是管理员身份，在一种可能的实现方式中，若终端登录的用户标识的身份不是管理员身份，则终端对于第三显示区域中的历史文本信息的编辑操作只能影响该终端的第三显示区域中的历史文本信息，若终端登录的用户标识的身份是管理员身份，可选地，终端对第三显示区域中的历史文本信息的编辑操作只影响该终端的第三显示区域中的历史文本信息，或者影响参与通话的每个终端的第三显示区域中的历史文本信息。

实现方式为：若终端登录的用户标识为管理员身份，终端在第三显示区域中显示本地编辑按钮和全局编辑按钮，终端响应于对本地编辑按钮的触发操作，为该用户标识设置本地编辑，之后，在检测到该用户标识的编辑操作时，根据编辑操作仅编辑该终端的第三显示区域中的历史文本信息，或者，响应于对全局编辑按钮的触发操作，为该用户标识设置全局编辑，之后，在检测到该用户标识的编辑操作时，根据编辑操作编辑通话对应的每个终端的第三显示区域中的历史文本信息。

可选地，其中根据编辑操作编辑通话对应的每个终端的第三显示区域中的历史文本信息的实现方式为：终端向服务器发送检测到的编辑操作，服务器接收该编辑操作，向通话对应的每个终端发送该编辑操作，每个终端接收到该编辑操作后，根据该编辑操作编辑第三显示区域中的历史文本信息。如此，能够实现通过一个用户的编辑操作对所有终端的第三显示区域中的历史文本信息进行编辑，极大地提高了编辑效率。

上述管理员身份是一种特殊的身份，可选地，创建通话的用户标识的身份即为管理员身份，且管理员身份支持移交，即能够将管理员身份转移给其他用户标识。可选地，若终端中登录目标应用的用户标识为管理员身份，则该终端的目标应用的显示界面与其他终端的目标应用的显示界面不同，例如，该终端的目标应用的显示界面与其他终端的目标应用的显示界面相比，包括更多的功能按钮。例如，终端中登录的目标应用的用户标识为管理员身份时，目标应用的通话界面中包括通话对应的其他终端的麦克风状态的设置按钮和其他终端的摄像头状态的设置按钮，登录目标应用的用户标识为管理员身份的终端能够基于该麦克风状态的设置按钮设置其他终端的麦克风状态，例如开启或者关闭其他终端的麦克风，并且，能够基于该摄像头状态的设置按钮，设置其他终端的摄像头状态，例如，开启或者关闭其他终端的摄像头。

在一种可能的实现方式中，通话界面上还包括第四按钮，终端响应于对第四按钮的触发操作，在通话界面上显示聊天窗口，该聊天窗口中汇总显示了本次通话过程中的聊天信息，聊天信息是指用户在聊天窗口中直接输入的文本信息。可选地，对于本次通话对应的任一终端，当检测到基于聊天窗口输入的聊天信息后，将该聊天信息发送至服务器，服务器将该聊天信息发送至通话对应的其他终端，其他终端接收到该聊天信息后，将该聊天信息显示于聊天窗口中。如此，当通话中有用户正在发言时，其他用户能够在不打扰该用户的发言的情况下，通过聊天窗口进行沟通和交流，例如在聊天窗口中输入文字或表情，如此提高了通话效果。

在一种可能的实现方式中，通话界面上还包括桌面分享按钮，终端响应于对该桌面分享按钮的触发操作，获取终端的桌面画面，向服务器发送该桌面画面，服务器接收该桌面画面，向通话对应的其他终端发送该桌面画面，其他终端接收该桌面画面后，在通话界面上显示该桌面画面。如此，使得用户之间能够分享桌面内容，提高了通话效果。

在一种可能的实现方式中，通话界面上还包括应用分享按钮，终端响应于对该应用分享按钮的触发操作，在通话界面上显示终端上的多个应用，基于当前的选择操作，截取与该选择操作对应的应用程序的画面，向服务器发送该应用程序的画面，服务器接收该应用程序的画面，向通话对应的其他终端发送该应用程序的画面，其他终端接收该应用程序的画面后，在通话界面上显示该应用程序的画面。如此，当用户需要分享桌面上的应用程序的画面时，用户能够仅分享当前桌面中的应用程序的画面，而不必分享整个桌面画面，能够保护用户隐私，提高用户粘性。

步骤304：终端根据第二显示区域中的历史文本信息生成第一文本通话记录。

可选地，终端在通话过程中实时地将第二显示区域中新增的历史文本信息保存到第一文本通话记录，或者，终端每隔预设时长将第二显示区域中新增的历史文本信息保存到第一文本通话记录。如此能够防止第二显示区域中的历史文本信息丢失，保证生成的第一文本通话记录的完整度。

可选地，第一文本通话记录的格式为任意文本格式，例如为RTF(Rich TextFormat，富文本格式)，word格式(一种文档格式)等，本申请对此不做限制。

在一种可能的实现方式中，终端还根据第三显示区域中的历史文本信息生成第二文本通话记录。可选地，终端在通话过程中实时地将第三显示区域中新增的历史文本信息保存到第二文本通话记录，或者，终端每隔预设时长将第三显示区域中新增的历史文本信息保存到第二文本通话记录。如此能够防止第三显示区域中的历史文本信息丢失，保证生成的第二文本通话记录的完整度。

步骤305：终端根据本次通话过程中采集的语音信息生成音频通话记录。

可选地，终端除了生成第一文本通话记录外，还要根据本次通话过程中采集的语音信息生成音频通话记录。如此，方便后续用户重新收听音频通话记录来回顾通话内容，提高了用户粘性。

步骤306：终端响应于对第一文本通话记录或音频通话记录的浏览操作，在显示第一文本通话记录的同时，播放音频通话记录。

需要说明的一点是，该步骤为终端结束本次通话之后的步骤。本次通话结束后，用户能够在任一时间对该通话的文本通话记录或者音频通话记录进行浏览。可选地，上述终端在生成第一文本通话记录和音频通话记录后，存储该第一文本通话记录和音频通话记录。另外，终端在通话记录界面上显示该通话对应的第一文本通话记录和音频通话记录，终端响应于对该通话对应的第一文本通话记录或者音频通话记录的浏览操作，获取存储的第一文本通话记录和音频通话记录，显示第一文本通话记录，并播放音频通话记录。

在一种可能的实现方式中，在显示第一文本通话记录的同时，播放音频通话记录，并且，当前播放的语音信息在第一文本通话记录中对应的文本信息突出显示。如此，使得用户在收听当前的语音信息时，能够浏览与该语音信息同步且突出显示的文本信息，提高了通话记录的浏览效果。

可选地，终端建立第一文本通话记录中的每条文本信息与音频通话记录中对应的语音信息之间的关联关系，将该关联关系存储下来。相应的，终端在显示第一文本通话记录的同时，播放音频通话记录，并且，当前播放的语音信息在第一文本通话记录中对应的文本信息突出显示的实现方式为：终端获取第一文本通话记录中的每条文本信息与音频通话记录中对应的语音信息之间的关联关系，根据该关联关系确定音频通话记录中的每条语音信息在第一文本通话记录中对应的文本信息，在播放音频通话记录中的任一条语音信息时，突出显示该语音信息对应的文本信息。

在一种可能的实现方式中，在生成第二文本通话记录的情况下，终端还存储第二文本通话记录。另外，终端在通话记录界面上显示该通话对应的第二文本通话记录，终端响应于对该通话对应的第二文本通话记录的浏览操作，获取存储的第二文本通话记录和音频通话记录，显示第二文本通话记录，并播放音频通话记录。

在一种可能的实现方式中，在显示第二文本通话记录的同时，播放音频通话记录，并且，当前播放的语音信息在第二文本通话记录中对应的文本信息突出显示。如此，使得用户在收听当前的语音信息时，能够浏览与该语音信息同步且突出显示的文本信息，提高了通话记录的浏览效果。

可选地，终端建立第二文本通话记录中的每条文本信息与音频通话记录中对应的语音信息之间的关联关系，将该关联关系存储下来。相应的，终端在显示第二文本通话记录的同时，播放音频通话记录，并且，当前播放的语音信息在第二文本通话记录中对应的文本信息突出显示的实现方式为：终端获取第二文本通话记录中的每条文本信息与音频通话记录中对应的语音信息之间的关联关系，根据该关联关系确定音频通话记录中的每条语音信息在第二文本通话记录中对应的文本信息，在播放音频通话记录中的任一条语音信息时，突出显示该语音信息对应的文本信息。

可选地，上述突出显示语音信息对应的文本信息的方式包括：将语音信息对应的文本信息以任意颜色高亮显示，或者在该文本信息下方显示下划线等，本申请对此不做限制。

需要说明的一点是，上述方法仅以在显示文本通话记录的同时播放音频通话记录为例进行说明，在一种可能的实现方式中，终端响应于对音频通话记录的浏览操作，仅播放音频通话记录，响应于对第一文本通话记录的浏览操作，仅显示第一文本通话记录，响应于对第二文本通话记录的浏览操作，仅显示第二文本通话记录。或者，终端在通话记录界面上显示音字对照播放按钮，响应于对该音字对照按钮的触发操作，输出用于提示用户选择第一文本通话记录或第二文本通话记录的提示信息，根据当前的选择操作显示与该选择操作对应的文本信息的同时，播放音频通话记录，并且，当前播放的语音信息在文本通话记录中对应的文本信息突出显示。

并且，由于第一显示区域中显示的文本信息是当前识别的最新文本信息，与用户当前收听的语音信息同步，使得用户能够一边收听语音信息，一边观看同步的文本信息，从而提高了通话效果。

并且，若第二文本信息与该第二文本信息之前的一个历史文本信息是同一个用户的文本信息，则不必在该最后一条文本信息的后面重复显示第二用户标识，而是将第二通话文本与该最后一条文本信息所包括的通话文本合并，显示在已显示的第二用户标识后面，如此能够避免将同一个用户的文本信息断开，保证同一用户的文本信息连续显示，提高了文本信息的显示效果，便于用户浏览。

并且，通过提供可编辑的第三显示区域，将历史文本信息汇总显示于该第三显示区域中，使得用户在进行通话的同时，能够对文本信息进行编辑整理，例如，对文本信息进行纠错或在文本信息上添加笔记等，后续根据该第三显示区域中的历史文本信息生成通话记录，在提高了生成通话记录的效率的同时，保证了该通话记录是准确且便于用户理解的，保证了该通话记录的质量。

并且，在第三显示区域中包括多个相同的用户标识的情况下，若用户需要对多个相同的用户标识进行修改，用户只需要对其中一个用户标识进行修改，终端则会自动对第三显示区域中与该用户标识相同的多个用户标识进行修改。如此，极大地提高了对文本信息编辑的效率。

并且，在通话界面上显示聊天窗口，则当通话中有用户正在发言时，其他用户能够在不打扰该用户的发言的情况下，通过聊天窗口进行沟通和交流，例如在聊天窗口中输入文字或表情，如此提高了通话效果。

并且，在显示第一文本通话记录的同时，播放音频通话记录，并且，当前播放的语音信息在第一文本通话记录中对应的文本信息突出显示，使得用户在收听当前的语音信息时，能够浏览与该语音信息同步且突出显示的文本信息，提高了通话记录的浏览效果。

图4是本申请实施例提供的一种通话记录生成装置的框图。参见图4，该装置包括：

文本获取模块401，被配置为获取第一文本信息，第一文本信息至少包括第一通话文本，第一通话文本是对本次通话过程中当前采集的第一语音信息进行识别得到的。

文本替换模块402，被配置为将第一显示区域中的第二文本信息替换为第一文本信息，第一显示区域用于显示本次通话当前的文本信息，第二文本信息至少包括第二通话文本，第二通话文本是对在第一语音信息之前采集的第二语音信息进行识别得到的。

第一文本显示模块403，被配置为将第二文本信息显示于第二显示区域中，第二显示区域用于汇总显示本次通话过程中的历史文本信息。

第一记录生成模块404，被配置为根据第二显示区域中的历史文本信息生成第一文本通话记录。

在一种可能的实现方式中，第二文本信息还包括第二通话文本对应的第二用户标识，

第一文本显示模块，被配置为若第二显示区域中已显示的最后一条文本信息包括的用户标识不是第二用户标识，将第二文本信息显示在最后一条文本信息的后面；若第二显示区域中已显示的最后一条文本信息包括的用户标识是第二用户标识，将第二通话文本与最后一条文本信息包括的通话文本合并。

在另一种可能的实现方式中，装置还包括：

第二文本显示模块，被配置为将第二文本信息显示于第三显示区域中，第三显示区域为可编辑区域，用于汇总显示或编辑本次通话过程中的历史文本信息；

文本编辑模块，被配置为根据检测到的编辑操作，对第二文本信息进行编辑，得到第二文本信息编辑后的文本信息；

第二记录生成模块，被配置为根据第三显示区域中的历史文本信息生成第二文本通话记录。

在另一种可能的实现方式中，第二文本信息还包括第二通话文本对应的第二用户标识，

第二文本显示模块，被配置为若第三显示区域中已显示的最后一条文本信息包括的用户标识不是第二用户标识，将第二文本信息显示在最后一条文本信息的后面；若第三显示区域中已显示的最后一条文本信息包括的用户标识是第二用户标识，将第二通话文本与最后一条文本信息包括的通话文本合并。

在另一种可能的实现方式中，历史文本信息包括历史通话文本和历史通话文本对应的用户标识，

文本编辑模块，还被配置为若检测到对第三显示区域中的任一个目标用户标识的编辑操作，根据编辑操作，对第三显示区域中的每个目标用户标识进行编辑。

在另一种可能的实现方式中，装置还包括：

第一关联模块，被配置为建立第一文本通话记录中的每条文本信息与音频通话记录中对应的语音信息之间的关联关系。

在另一种可能的实现方式中，装置还包括：

第一记录浏览模块，被配置为响应于对第一文本通话记录或音频通话记录的浏览操作，在显示第一文本通话记录的同时，播放音频通话记录，其中，当前播放的语音信息在第一文本通话记录中对应的文本信息突出显示。

在另一种可能的实现方式中，装置还包括：

第二关联模块，被配置为建立第二文本通话记录中的每条文本信息与音频通话记录中对应的语音信息之间的关联关系。

在另一种可能的实现方式中，装置还包括：

第二记录浏览模块，被配置为响应于对第二文本通话记录或音频通话记录的浏览操作，在显示第二文本通话记录的同时，播放音频通话记录，其中，当前播放的语音信息在第二文本通话记录中对应的文本信息突出显示。

在另一种可能的实现方式中，装置还包括：

语种设置模块，被配置为显示语种设置界面，基于语种设置界面获取为当前登录的用户标识设置的目标语种；

语种发送模块，被配置为向服务器发送用户标识和目标语种，服务器用于将通话过程中采集的语音信息识别为属于目标语种的通话文本。

在另一种可能的实现方式中，装置还包括：

禁忌词设置模块，被配置为显示禁忌词设置界面，基于禁忌词设置界面获取为当前登录的用户标识设置的禁忌词；

禁忌词发送模块，被配置为向服务器发送用户标识和禁忌词，服务器用于将通话过程中采集的语音信息识别为通话文本后，将通话文本中的禁忌词替换为目标字符。

在另一种可能的实现方式中，文本替换模块，被配置为显示第二文本信息从第一显示区域滚动消失的动态效果；显示第一文本信息在第一显示区域中滚动出现的动态效果。

上述所有可选技术方案，可以采用任意结合形成本申请的可选实施例，在此不再一一赘述。

需要说明的是：上述实施例提供的通话记录生成装置在生成通话记录时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将终端的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的通话记录生成装置与通话记录生成方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图5示出了本申请一个示例性实施例提供的终端500的结构框图。该终端500可以是：智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio LayerIV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端500还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端500包括有：处理器501和存储器502。

处理器501可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器501可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器501也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器501可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器501还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器502可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器502还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器502中的非暂态的计算机可读存储介质用于存储至少一个程序代码，该至少一个程序代码用于被处理器501所执行以实现本申请中方法实施例提供的通话记录生成方法。

在一些实施例中，终端500还可选包括有：外围设备接口503和至少一个外围设备。处理器501、存储器502和外围设备接口503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口503相连。具体地，外围设备包括：射频电路504、显示屏505、摄像头组件506、音频电路507、定位组件508和电源509中的至少一种。

外围设备接口503可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器501和存储器502。在一些实施例中，处理器501、存储器502和外围设备接口503被集成在同一芯片或电路板上；在一些其他实施例中，处理器501、存储器502和外围设备接口503中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路504用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路504将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路504包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路504可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路504还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏505用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏505是触摸显示屏时，显示屏505还具有采集在显示屏505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器501进行处理。此时，显示屏505还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏505可以为一个，设置终端500的前面板；在另一些实施例中，显示屏505可以为至少两个，分别设置在终端500的不同表面或呈折叠设计；在另一些实施例中，显示屏505可以是柔性显示屏，设置在终端500的弯曲表面上或折叠面上。甚至，显示屏505还可以设置成非矩形的不规则图形，也即异形屏。显示屏505可以采用LCD(LiquidCrystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件506用于采集图像或视频。可选地，摄像头组件506包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件506还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器501进行处理，或者输入至射频电路504以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端500的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器501或射频电路504的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路507还可以包括耳机插孔。

定位组件508用于定位终端500的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件508可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。

电源509用于为终端500中的各个组件进行供电。电源509可以是交流电、直流电、一次性电池或可充电电池。当电源509包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端500还包括有一个或多个传感器510。该一个或多个传感器510包括但不限于：加速度传感器511、陀螺仪传感器512、压力传感器513、指纹传感器514、光学传感器515以及接近传感器516。

加速度传感器511可以检测以终端500建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器511可以用于检测重力加速度在三个坐标轴上的分量。处理器501可以根据加速度传感器511采集的重力加速度信号，控制显示屏505以横向视图或纵向视图进行用户界面的显示。加速度传感器511还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器512可以检测终端500的机体方向及转动角度，陀螺仪传感器512可以与加速度传感器511协同采集用户对终端500的3D动作。处理器501根据陀螺仪传感器512采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器513可以设置在终端500的侧边框和/或显示屏505的下层。当压力传感器513设置在终端500的侧边框时，可以检测用户对终端500的握持信号，由处理器501根据压力传感器513采集的握持信号进行左右手识别或快捷操作。当压力传感器513设置在显示屏505的下层时，由处理器501根据用户对显示屏505的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器514用于采集用户的指纹，由处理器501根据指纹传感器514采集到的指纹识别用户的身份，或者，由指纹传感器514根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器501授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器514可以被设置终端500的正面、背面或侧面。当终端500上设置有物理按键或厂商Logo时，指纹传感器514可以与物理按键或厂商Logo集成在一起。

光学传感器515用于采集环境光强度。在一个实施例中，处理器501可以根据光学传感器515采集的环境光强度，控制显示屏505的显示亮度。具体地，当环境光强度较高时，调高显示屏505的显示亮度；当环境光强度较低时，调低显示屏505的显示亮度。在另一个实施例中，处理器501还可以根据光学传感器515采集的环境光强度，动态调整摄像头组件506的拍摄参数。

接近传感器516，也称距离传感器，通常设置在终端500的前面板。接近传感器516用于采集用户与终端500的正面之间的距离。在一个实施例中，当接近传感器516检测到用户与终端500的正面之间的距离逐渐变小时，由处理器501控制显示屏505从亮屏状态切换为息屏状态；当接近传感器516检测到用户与终端500的正面之间的距离逐渐变大时，由处理器501控制显示屏505从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图5中示出的结构并不构成对终端500的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

图6是本申请实施例提供的一种服务器的结构示意图，该服务器600可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processingunits，CPU)601和一个或一个以上的存储器602，其中，所述存储器602中存储有至少一条程序代码，所述至少一条程序代码由所述处理器601加载并执行以实现上述各个方法实施例提供的通话记录生成方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

本申请实施例还提供了一种终端，该终端包括处理器和存储器，存储器中存储有至少一条程序代码，该至少一条程序代码由处理器加载并执行，以实现上述实施例的通话记录生成方法。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一条程序代码，该至少一条程序代码由处理器加载并执行，以实现上述实施例的通话记录生成方法。

本申请实施例还提供了一种计算机程序产品，该计算机程序产品中包括至少一条程序代码，该程序代码由处理器加载并执行以实现上述任一种可能实现方式中的通话记录生成方法中执行的操作。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来程序代码相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种通话记录生成方法，其特征在于，所述方法包括：

将所述第二文本信息显示于第三显示区域中，所述第三显示区域为可编辑区域，用于汇总显示或编辑本次通话过程中的历史文本信息，所述历史文本信息包括历史通话文本和历史通话文本对应的用户标识；

其中，终端登录的用户标识的身份不是管理员身份，所述终端对所述历史文本信息进行的编辑为本地编辑；或者，所述终端登录的用户标识的身份是管理员身份，所述终端对所述历史文本信息进行的编辑为本地编辑或全局编辑；

所述本地编辑为对所述终端的所述第三显示区域中的历史文本信息进行编辑，所述全局编辑为对参与所述通话的每个终端的所述第三显示区域中的历史文本信息进行编辑；

若所述终端登录的用户标识为管理员身份，所述终端在所述第三显示区域中显示本地编辑按钮和全局编辑按钮；所述方法还包括：

响应于对所述本地编辑按钮的触发操作，为所述终端登录的所述用户标识设置所述本地编辑；或者，响应于对所述全局编辑按钮的触发操作，为所述终端登录的所述用户标识设置所述全局编辑；

所述方法还包括：

检测到对所述第三显示区域中的任一个目标用户标识的编辑操作，根据所述编辑操作，对所述第三显示区域中的每个目标用户标识进行编辑。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述第二文本信息还包括所述第二通话文本对应的第二用户标识，所述将所述第二文本信息显示于第二显示区域中，包括：

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述第二文本信息还包括所述第二通话文本对应的第二用户标识，所述将所述第二文本信息显示于第三显示区域中，包括：

6.根据权利要求4所述的方法，其特征在于，所述历史文本信息包括历史通话文本和所述历史通话文本对应的用户标识，所述方法还包括：

7.根据权利要求2所述的方法，其特征在于，所述方法还包括：

根据本次通话过程中采集的语音信息生成音频通话记录；

8.根据权利要求7所述的方法，其特征在于，所述方法还包括：

9.根据权利要求4所述的方法，其特征在于，所述方法还包括：

根据本次通话过程中采集的语音信息生成音频通话记录；

10.根据权利要求9所述的方法，其特征在于，所述方法还包括：

11.根据权利要求1所述的方法，其特征在于，所述获取第一文本信息之前，所述方法还包括：

12.根据权利要求1所述的方法，其特征在于，所述获取第一文本信息之前，所述方法还包括：

13.根据权利要求1所述的方法，其特征在于，所述将第一显示区域中的第二文本信息替换为所述第一文本信息，包括：

14.一种通话记录生成装置，其特征在于，所述装置包括：

第二文本显示模块，被配置为将所述第二文本信息显示于第三显示区域中，所述第三显示区域为可编辑区域，用于汇总显示或编辑本次通话过程中的历史文本信息，所述历史文本信息包括历史通话文本和历史通话文本对应的用户标识；

若所述终端登录的用户标识为管理员身份，所述终端在所述第三显示区域中显示本地编辑按钮和全局编辑按钮；所述装置还包括用于执行以下步骤的模块：

所述装置还包括用于执行以下步骤的模块：

15.根据权利要求14所述的装置，其特征在于，所述装置还包括：

16.一种终端，其特征在于，所述终端包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述程序代码由所述处理器加载并执行以实现如权利要求1至权利要求13任一项所述的通话记录生成方法所执行的操作。

17.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条程序代码，所述程序代码由处理器加载并执行以实现如权利要求1至权利要求13任一项所述的通话记录生成方法所执行的操作。