CN112494958B

CN112494958B - 语音转换文字的方法、系统、设备及介质

Info

Publication number: CN112494958B
Application number: CN202011504638.0A
Authority: CN
Inventors: 刘沛城; 刘晓皓; 王妍璨; 丁东; 唐凯; 林珊
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-12-18
Filing date: 2020-12-18
Publication date: 2022-09-23
Anticipated expiration: 2040-12-18
Also published as: CN112494958A; WO2022127197A1

Abstract

本申请公开了一种语音转换文字的方法、系统、设备及介质，运用于人机交互领域。方法包括：第一客户端显示第一用户界面，第一用户界面是为第一用户账号控制的第一虚拟角色提供虚拟活动场所的虚拟环境的展示画面；第二客户端显示第二用户界面，第二用户界面是为第二用户账号控制的第二虚拟角色提供虚拟活动场所的虚拟环境的展示画面；响应于第一客户端上的语音输入操作，第一客户端采用第一语言种类显示第一用户账号发送的会话消息，第二客户端采用第二语言种类显示第一用户账号发送的所述会话消息。该方法可以转换语音内容为第一语言种类的会话消息，并翻译第二语言种类的会话消息，可以消除用户间的语言障碍，提高交流效率。

Description

语音转换文字的方法、系统、设备及介质

技术领域

本申请涉及人机交互领域，特别涉及一种语音转换文字的方法、系统、设备及介质。

背景技术

在基于竞技对抗的应用程序中，多名用户会被分为敌对的两组，用户操纵虚拟环境中的虚拟角色进行行走、购买、治疗、战斗等动作，并且同一组用户在该虚拟环境中协同完成某项任务。

相关技术在基于竞技对抗的应用程序中实现语音转换文字，需要用户点击虚拟环境画面上的聊天按钮，显示输入方式选择列表后，由用户选择语音输入，并输入语音信息，在语音信息被转换为会话消息后，经由用户确认该会话消息后，该会话消息会被发送到其它客户端中。

但是相关技术不具备多语言转换的功能，使用不同语言种类的用户在同一场对战中，会使用不同的语言交流，在不具备多语言转换的功能的情况下，用户之间很难交流。

发明内容

本申请实施例提供了一种语音转换文字的方法、系统、设备及介质，该方法会在不同的客户端上显示不同语言种类的会话消息，方便不同客户端的用户之间进行交流，减少了操作步骤，提升了人机交互效率。所述技术方案如下：

根据本申请的一个方面，提供了一种语音转换文字的方法，应用于至少两个客户端中，该方法包括：

第一客户端显示第一用户界面，所述第一用户界面是为第一用户账号控制的第一虚拟角色提供虚拟活动场所的虚拟环境的展示画面；

第二客户端显示第二用户界面，所述第二用户界面是为第二用户账号控制的第二虚拟角色提供虚拟活动场所的虚拟环境的展示画面；

响应于所述第一客户端上的语音输入操作，所述第一客户端采用第一语言种类显示所述第一用户账号发送的会话消息，所述第二客户端采用第二语言种类显示所述第一用户账号发送的所述会话消息，所述第一语音种类是与所述第一用户账号或所述第一客户端关联的语言种类，所述第二语言种类是与所述第二用户账号或所述第二客户端关联的语言种类，所述会话消息的文字内容是基于所述语音输入操作所输入的语音内容识别到的。

根据本申请的另一个方面，提供了一种语音转换文字的方法，应用于服务器中，该服务器至少与两个客户端连接，该方法包括：

接收由第一客户端发送的语音内容；

确定第一语言种类和第二语言种类，所述第一语音种类是与第一用户账号或所述第一客户端关联的语言种类，所述第二语言种类是与第二用户账号或所述第二客户端关联的语言种类；

根据所述语音内容和所述第一语言种类，将所述语音内容转换为所述第一语言种类的会话消息，所述会话消息的文字内容是基于所述语音内容识别到的；

根据所述第一语言种类的所述会话消息和所述第二语言种类，翻译获得所述第二语言种类的所述会话消息；

将所述第二语言种类的所述会话消息发送给第二客户端。

根据本申请的另一个方面，提供了一种语音转换文字的系统，该系统包括第一装置和第二装置，该系统包括：

第一装置，用于显示第一用户界面，所述第一用户界面是为第一用户账号控制的第一虚拟角色提供虚拟活动场所的虚拟环境的展示画面；

第二装置，用于显示第二用户界面，所述第二用户界面是为第二用户账号控制的第二虚拟角色提供虚拟活动场所的虚拟环境的展示画面；

所述第一装置，还用于响应于所述第一装置上的语音输入操作，采用第一语言种类显示所述第一用户账号发送的会话消息，所述第一语音种类是与所述第一用户账号或所述第一客户端关联的语言种类，所述会话消息的文字内容是基于所述语音输入操作所输入的语音内容识别到的；

所述第二装置，还用于采用第二语言种类显示所述第一用户账号发送的所述会话消息，所述第二语言种类是与所述第二用户账号或所述第二客户端关联的语言种类。

在本申请的一个可选设计中，所述第一装置，还用于响应于所述第一装置上的所述语音输入操作，所述第一装置获得所述语音内容；将所述语音内容发送给服务器，所述服务器用于根据所述语音内容生成所述第一语言种类的所述会话消息和所述第二语言种类的所述会话消息；在接收到由所述服务器发送的所述会话消息后，采用所述第一语言种类显示所述会话消息。

在本申请的一个可选设计中，所述第二装置，还用于在接收到由所述服务器发送的所述会话消息后，采用所述第二语言种类显示所述会话消息。

在本申请的一个可选设计中，所述第一装置，还用于向所述服务器发送所述第一语言种类。

在本申请的一个可选设计中，所述第二装置，还用于向所述服务器发送所述第二语言种类。

在本申请的一个可选设计中，所述第一装置，还用于将所述语音内容和所述第一语言种类发送给服务器。

在本申请的一个可选设计中，所述第二装置，还用于接收由所述服务器发送的语言种类获取请求；根据所述语言种类获取请求，向所述服务器发送所述第二语言种类。

在本申请的一个可选设计中，所述第一装置，还用于响应于对所述第一装置上的所述聊天控件的第一触发操作，采用所述第一语言种类显示所述会话消息。

在本申请的一个可选设计中，所述第二装置，还用于响应于对所述第一装置上的所述聊天控件的第一触发操作，采用所述第二语言种类显示所述会话消息。

在本申请的一个可选设计中，所述第一装置，还用于响应于对所述第一装置上的聊天控件的开始输入操作，在所述聊天控件的周侧位置显示语音收录提示，开始接收所述语音内容；响应于对所述第一装置上的聊天控件的结束输入操作，取消显示所述语音收录提示，结束接收所述语音内容。

在本申请的一个可选设计中，所述第一装置，还用于当以所述第一语言种类显示的所述会话消息的显示时间达到预设时长时，取消显示所述会话消息；或，响应于第一取消显示操作，取消显示所述会话消息。

在本申请的一个可选设计中，所述第二装置，还用于当以所述第二语言种类显示的所述会话消息的显示时间达到所述预设时长时，取消显示所述会话消息；或，响应于第二取消显示操作，取消显示所述会话消息。

在本申请的一个可选设计中，所述第二装置，还用于响应于所述第一装置上的所述语音输入操作，采用所述第一语言种类和所述第二语言种类显示所述会话消息。

根据本申请的另一个方面，提供了一种语音转换文字的装置，该装置与第一客户端和第二客户端连接，该装置包括：

接收模块，用于接收由第一客户端发送的语音内容；

所述接收模块，还用于确定第一语言种类和第二语言种类；

转换模块，用于根据所述语音内容和所述第一语言种类，将所述语音内容转换为所述第一语言种类的会话消息，所述会话消息的文字内容是基于所述语音内容识别到的；

翻译模块，用于根据所述第一语言种类的所述会话消息和所述第二语言种类，翻译获得所述第二语言种类的所述会话消息；

发送模块，用于将所述第二语言种类的所述会话消息发送给第二客户端。

在本申请的一个可选设计中，所述接收模块，还用于接收由所述第一客户端发送的所述第一语言种类；接收由所述第二客户端发送的所述第二语言种类。

所述发送模块，还用于向所述第二客户端发送语言种类获取请求。

根据本申请的另一个方面，提供了一种计算机设备，该计算机设备包括：处理器和存储器，存储器中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上方面所述的语音转换文字的方法。

根据本申请的另一个方面，提供了一种计算机存储介质，计算机可读存储介质中存储有至少一条程序代码，程序代码由处理器加载并执行以实现如上方面所述的语音转换文字的方法。

根据本申请的另一个方面，提供了一种计算机程序产品或计算机程序，上述计算机程序产品或计算机程序包括计算机指令，上述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从上述计算机可读存储介质读取上述计算机指令，上述处理器执行上述计算机指令，使得上述计算机设备执行如上方面所述的语音转换文字的方法。

本申请实施例提供的技术方案带来的有益效果至少包括：

当第一客户端上接收到语言输入操作时，会在不同的客户端上显示不同语言种类的会话消息，可以将输入的语音信息翻译成不同语言种类的会话消息，方便使用不同语言种类的用户进行交流，以消除语言障碍。同时，不需要用户使用额外的翻译软件翻译其它语言种类的会话消息，减少用户的操作步骤，提升人机交互效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的计算机系统的结构框图；

图2是本申请一个示例性实施例提供的语音转换文字的方法的流程图；

图3是本申请一个示例性实施例提供的摄像机模型的示意图；

图4是本申请一个示例性实施例提供的语音转换文字的方法的界面示意图；

图5是本申请一个示例性实施例提供的语音转换文字的方法的界面示意图；

图6是本申请一个示例性实施例提供的语音转换文字的方法的流程图；

图7是本申请一个示例性实施例提供的语音转换文字的方法的界面示意图；

图8是本申请一个示例性实施例提供的语音转换文字的方法的流程图；

图9是本申请一个示例性实施例提供的语音转换文字的方法的界面示意图；

图10是本申请一个示例性实施例提供的语音转换文字的方法的界面示意图；

图11是本申请一个示例性实施例提供的语音转换文字的方法的流程图；

图12是本申请一个示例性实施例提供的语音转换文字的系统的结构示意图；

图13是本申请一个示例性实施例提供的语音转换文字的装置的结构示意图；

图14是本申请一个示例性实施例提供的终端的结构框图；

图15是本申请一个示例性实施例提供的服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

首先，对本申请实施例中涉及的名词进行介绍：

虚拟环境：是客户端上运行时显示(或提供)的虚拟环境。该虚拟环境可以是三维虚拟环境，也可以是二维虚拟环境。该三维虚拟环境可以是对真实世界的仿真环境，也可以是半仿真半虚构的环境，还可以是纯虚构的环境。

虚拟角色：指在虚拟环境中的可活动角色。该可活动角色可以是虚拟人物、虚拟动物、动漫人物等，比如：在虚拟环境中显示的人物、动物、植物、油桶、墙壁、石块等。可选地，当虚拟环境为三维虚拟环境时，虚拟角色是基于动画骨骼技术创建的三维立体模型，每个虚拟角色在三维虚拟环境中具有自身的形状和体积，占据三维虚拟环境中的一部分空间。可选地，当虚拟环境为二维虚拟环境时，虚拟角色是基于动画技术创建的二维平面模型，每个虚拟角色在二维虚拟环境中具有自身的形状和面积，占据二维虚拟环境中的一部分面积。

多人在线战术竞技：在虚拟环境中，分属至少两个敌对阵营的不同虚拟队伍分别占据各自的地图区域，以某一种胜利条件作为目标进行竞技。该胜利条件包括但不限于：占领据点或摧毁敌对阵营据点、击杀敌对阵营的虚拟角色、在指定场景和时间内保证自身的存活、抢夺到某种资源、在指定时间内比分超过对方中的至少一种。战术竞技可以以局为单位来进行，每局战术竞技的地图可以相同，也可以不同。每个虚拟队伍包括一个或多个虚拟角色，比如1个、2个、3个或5个。

MOBA(Multiplayer Online Battle Arena)游戏：是一种在虚拟环境中提供若干个据点，处于不同阵营的用户控制虚拟角色在虚拟环境中对战，占领据点或摧毁敌对阵营据点的游戏。例如，MOBA游戏可将用户分成两个敌对阵营，将用户控制的虚拟角色分散在虚拟环境中互相竞争，以摧毁或占领敌方的全部据点作为胜利条件。MOBA游戏以局为单位，一局MOBA游戏的持续时间是从游戏开始的时刻至达成胜利条件的时刻。

FPS(First Person Shooting game)游戏：是一种在虚拟环境中提供若干个据点，处于不同阵营的用户控制虚拟角色在虚拟环境中对战，占领据点或摧毁敌对阵营据点或击杀敌对阵营全部或部分角色的游戏。通常，FPS游戏中用户以第一人称视角进行游戏，用户也可以选择第三人称视角进行游戏。例如，FPS游戏可将用户分成两个敌对阵营，将用户控制的虚拟角色分散在虚拟环境中互相竞争，以击杀敌方的全部用户作为胜利条件。FPS游戏以局为单位，一局FPS游戏的持续时间是从游戏开始的时刻至达成胜利条件的时刻。

SLG(Simulation Games)游戏：是一种在虚拟环境中提供虚拟资源，模拟现实的游戏类型。例如，SLG游戏可将多名用户分入单个阵营，多名用户协同完成指定任务。可选地，一局SLG游戏通常不存在具体的胜利条件。

语音转换文字：指将用户输入语音内容转换为文字，并进行输出。示例性的，用户输入语音内容“早上好”，则会输出相应的文字“早上好”。通常而言，语音转换文字同时只支持将语音内容转换一种语言种类。

图1示出了本申请一个示例性实施例提供的计算机系统的结构框图。该计算机系统100包括：第一终端120、服务器140和第二终端160。

第一终端120安装和运行有支持虚拟环境的客户端。该客户端可以是MOBA游戏、虚拟现实客户端、三维地图客户端、FPS游戏多人枪战类生存游戏、SLG游戏中的任意一种。第一终端120是第一用户使用的终端，第一用户账户是第一用户所持有的账户。第一用户使用第一终端120操作位于三维虚拟环境中的第一虚拟角色进行活动，该活动包括但不限于：攻击、释放技能、购买道具、治疗、调整身体姿态、爬行、步行、骑行、飞行、跳跃、驾驶、拾取、射击、投掷中的至少一种。示意性的，第一虚拟角色是第一虚拟人物。

第一终端120通过无线网络或有线网络与服务器140相连。

服务器140包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。服务器140用于为支持虚拟环境的客户端提供后台服务。可选地，服务器140承担主要计算工作，第一终端120和第二终端160承担次要计算工作；或者，服务器140承担次要计算工作，第一终端120和第二终端160承担主要计算工作；或者，服务器140、第一终端120和第二终端160三者之间采用分布式计算架构进行协同计算。

第二终端160安装和运行有支持虚拟环境的客户端。该客户端可以是MOBA游戏、虚拟现实客户端、三维地图客户端、FPS游戏、多人枪战类生存游戏、SLG游戏中的任意一种。第二终端160是第二用户使用的终端，第二用户账户是第一用户所持有的账户。第二用户使用第二终端160操作位于虚拟环境中的第二虚拟角色进行活动，该活动包括但不限于：攻击、释放技能、购买道具、治疗、调整身体姿态、爬行、步行、骑行、飞行、跳跃、驾驶、拾取、射击、投掷中的至少一种。示意性的，第二虚拟角色是第二虚拟人物。第一虚拟角色和第二虚拟角色可以属于同一个队伍、同一个组织、具有好友关系或具有临时性的通讯权限，第一虚拟角色和第二虚拟角色也可以属于不同队伍或不同组织。

可选地，第一终端120和第二终端160上安装的客户端是相同的，或不同平台的同一类型客户端。第一终端120可以泛指多个终端中的一个，第二终端160可以泛指多个终端中的一个，本实施例仅以第一终端120和第二终端160来举例说明。第一终端120和第二终端160的设备类型相同或不同，该设备类型包括：智能手机、平板电脑、电子书阅读器、MP3播放器、MP4播放器、膝上型便携计算机和台式计算机中的至少一种。

图2示出了本申请一个示例性实施例提供的语音转换文字的方法的流程图。该方法可由图1所示的第一终端120或第二终端160执行，该方法应用于至少两个客户端中，该方法包括：

步骤202：第一客户端显示第一用户界面，第一用户界面是为第一用户账号控制的第一虚拟角色提供虚拟活动场所的虚拟环境的展示画面。

第一客户端指在第一终端上运行的客户端程序。可选地，客户端程序包括MOBA游戏、虚拟现实客户端、三维地图客户端、FPS游戏、多人枪战类生存游戏、SLG游戏中的任意一种。

第一用户账户指第一用户所持有的账户。

第一虚拟角色指由在第一客户端中由第一用户操控的主控角色。可选地，第一虚拟角色是人物、动物、植物、动漫角色中的至少一种。

第一用户界面指第一客户端在运行的过程中，在终端上所能观察到的画面。可选地，第一用户界面是在虚拟环境中通过摄像机模型对第一虚拟角色进行观察时的画面。

可选地，摄像机模型在虚拟环境中对虚拟角色进行自动跟随，即，当虚拟角色在虚拟环境中的位置发生改变时，摄像机模型跟随虚拟角色在虚拟环境中的位置同时发生改变，且该摄像机模型在虚拟环境中始终处于虚拟角色的预设距离范围内。可选地，在自动跟随过程中，摄像头模型和虚拟角色的相对位置不发生变化。

摄像机模型是指在虚拟环境中位于虚拟角色周围的三维模型，当采用第一人称视角时，该摄像机模型位于虚拟角色的头部附近或者位于虚拟角色的头部；当采用第三人称视角时，该摄像机模型可以位于虚拟角色的后方并与虚拟角色进行绑定，也可以位于与虚拟角色相距预设距离的任意位置，通过该摄像机模型可以从不同角度对位于虚拟环境中的虚拟角色进行观察，可选地，该第三人称视角为第一人称的过肩视角时，摄像机模型位于虚拟角色(比如虚拟人物的头肩部)的后方。可选地，除第一人称视角和第三人称视角外，视角还包括其他视角，比如俯视视角；当采用俯视视角时，该摄像机模型可以位于虚拟角色头部的上空，俯视视角是以从空中俯视的角度进行观察虚拟环境的视角。可选地，该摄像机模型在虚拟环境中不会进行实际显示，即，在用户界面显示的虚拟环境中不显示该摄像机模型。

对该摄像机模型位于与虚拟角色相距预设距离的任意位置为例进行说明，可选地，一个虚拟角色对应一个摄像机模型，该摄像机模型可以以虚拟角色为旋转中心进行旋转，如：以虚拟角色的任意一点为旋转中心对摄像机模型进行旋转，摄像机模型在旋转过程中的不仅在角度上有转动，还在位移上有偏移，旋转时摄像机模型与该旋转中心之间的距离保持不变，即，将摄像机模型在以该旋转中心作为球心的球体表面进行旋转，其中，虚拟角色的任意一点可以是虚拟角色的头部、躯干、或者虚拟角色周围的任意一点，本申请实施例对此不加以限定。可选地，摄像机模型在对虚拟角色进行观察时，该摄像机模型的视角的中心指向为该摄像机模型所在球面的点指向球心的方向。

可选地，该摄像机模型还可以在虚拟角色的不同方向以预设的角度对虚拟角色进行观察。

示意性的，请参考图3，在虚拟角色11中确定一点作为旋转中心12，摄像机模型围绕该旋转中心12进行旋转，可选地，该摄像机模型配置有一个初始位置，该初始位置为虚拟角色后上方的位置(比如脑部的后方位置)。示意性的，如图3所示，该初始位置为位置13，当摄像机模型旋转至位置14或者位置15时，摄像机模型的视角方向随摄像机模型的转动而进行改变。

可选地，第一用户画面还包括：会话消息、聊天控件、以上帝视角的缩略地图、背包控件、方位指示控件、外放语音开关、麦克风开关、用于移动虚拟角色的控件、用于控制虚拟角色进行预设动作的控件中的至少一种其它显示元素。

示例性的，如图4所示，在第一用户界面上显示有虚拟角色401、聊天控件402、会话消息403、缩略地图404、移动控件405、用户图标406、技能控件407和购买控件408。

步骤204：第二客户端显示第二用户界面，第二用户界面是为第二用户账号控制的第二虚拟角色提供虚拟活动场所的虚拟环境的展示画面。

第二客户端指在第二终端上运行的客户端程序，可选地，客户端程序包括MOBA游戏、虚拟现实客户端、三维地图客户端、FPS游戏、多人枪战类生存游戏、SLG游戏中的任意一种。可选地，第二终端和第一终端的设备种类可以相同或不同。

第二用户账户指第二用户所持有的账户。其中，第一用户账户和第二用户账户不同。

第二虚拟角色指由在第二客户端中由第二用户操控的主控角色。可选地，第二虚拟角色是人物、动物、植物、动漫角色中的至少一种。其中，第一虚拟角色和第二虚拟角色可以相同，也可以不同。

第二用户界面指第二客户端在运行的过程中，在终端上所能观察到的画面。可选地，第二用户界面是在虚拟环境中通过摄像机模型对第二虚拟角色进行观察时的画面。可选地，第二用户界面和第一用户相同，或不同。

可选地，第二用户画面还包括：会话消息、聊天控件、以上帝视角的缩略地图、背包控件、方位指示控件、外放语音开关、麦克风开关、用于移动虚拟角色的控件、用于控制虚拟角色进行预设动作的控件中的至少一种其它显示元素。

示例性的，如图5所示，在第二用户界面上显示有虚拟角色501、聊天控件502、会话消息503、缩略地图504、移动控件505、用户图标506、技能控件507和购买控件508。

步骤206：响应于第一客户端上的语音输入操作，第一客户端采用第一语言种类显示第一用户账号发送的会话消息，第二客户端采用第二语言种类显示第一用户账号发送的会话消息。

语音输入操作指用户将语音内容输入终端中。可选地，语音输入操作可以是按压一个或多个预设的物理按键以输入语音内容，或者，语音输入操作可以是通过在触摸屏的指定区域上进行长按、点击、双击和/或滑动所产生的信号来执行语音输入操作，或者，语音输入操作可以是通过麦克风设备直接输入语音内容。

第一语言种类和第二语言种类所对应的语言种类不同。示例性的，第一语言种类为中文时，第二语言种类为英语。示例性的，语言种类包括但不限于：中文、英语、日语、德语、俄语、拉丁语、法语中的至少一种。

会话消息包括用户名称和对话内容。会话消息与语音输入操作所输入的语音内容相对应。示例性的，用户ABC所输入的语音内容为“对不起”，第一语言种类的会话消息为“ABC：对不起”，第二语言种类的会话消息为“ABC：I’msorry”，会话消息和会话消息所表达的含义应当与输入内容相对应。

可选地，会话消息显示位置可由用户自行设定。例如，用户界面的左上角，或者，用户界面的右下角。本申请对会话消息的具体显示位置不做限定。

示例性的，如图4和图5所示，图4在第一用户界面上显示的会话消息403的内容为“ABC：你好”，图5在第二用户界面上显示的会话消息503的内容为“ABC：Hello”，会话消息403和会话消息503的语言种类不同，但两者所表达的含义相同。

综上所述，本实施例可以对语音输入操作的输入内容进行翻译，在第一客户端和第二客户端上显示不同的语言种类的会话消息，便于使用不同语言种类的用户之间直接进行交流，提高了用户之间的交流效率。而且，可以提高系统的实时性，便于用户及时获得其他用户的信息。

图6示出了本申请一个示例性实施例提供的语音转换文字的方法的流程图。该方法可由图1所示的第一终端120或第二终端160执行，该方法应用于至少两个客户端中，该方法包括：

步骤601：显示第一用户界面。

第一客户端显示第一用户界面。

步骤602：显示第二用户界面。

第二客户端显示第二用户界面。

步骤601和步骤602在时序上不分先后。

步骤603：响应于第一客户端上的语音输入操作，第一客户端获得语音内容。

语音内容指用户通过第一客户端输入的语音信息。可选地，第一客户端通过语音采集设备获得语音内容，或者，第一客户端通过网络下载语音内容，或者，第一客户端接收由其他客户端发送的语音内容，或者，第一客户端查询本地存储获得语音内容。

步骤604：发送语音内容。

第一客户端将语音内容发送给服务器。

可选地，第一客户端将语音内容和第一语言种类发送给服务器。

步骤605：确定第一语言种类和第二语言种类。

服务器确定第一语言种类和第二语言种类。

服务器通过接收由第一客户端发送的第一语言种类，或者，在服务器中存储有第一语言种类。

服务器通过接收由第一客户端发送的第二语言种类，或者，在服务器中存储有第二语言种类。

可选地，本步骤包括以下两个步骤中的至少一个：

1、第一客户端向服务器发送第一语言种类。

服务器接收第一客户端发送的第一语言种类，并确定第一语言种类。

示例性的，第一客户端向服务器发送版本信息，该版本信息中包括第一语言种类，或者，第一客户端向服务器发送地域信息，该地域信息与第一语言种类相对应，例如，地域信息表示第一客户端位于中国，则第一语言种类为中文，或者，第一客户端向服务器发送终端的语言设置，该语言设置中包括第一语言种类。

2、第二客户端向服务器发送第二语言种类。

服务器接收第二客户端发送的第二语言种类，并确定第二语言种类。

可选地，服务器接收由第二客户端发送的第二语言种类，以确定第二语言种类。示例性的，第二客户端向服务器发送版本信息，该版本信息中包括第二语言种类，或者，第二客户端向服务器发送地域信息，该地域信息与第一语言种类相对应，例如，地域信息表示第二客户端位于中国，则第二语言种类为中文，或者，第二客户端向服务器发送终端的语言设置，该语言设置中包括第二语言种类。

可选地，第二客户端接收由服务器发送的语言种类获取请求；第二客户端根据语言种类获取请求，向服务器发送第二语言种类。语言种类获取请求用于服务器向客户端请求发送语言种类。

步骤606：根据语音内容生成第一语言种类的会话消息和第二语言种类的会话消息。

服务器根据语音内容生成第一语言种类的会话消息和第二语言种类的会话消息。

可选地，服务器引用现有的语音转文字技术将语音内容转换为第一语言种类的会话消息，再引用现有的翻译技术将第一语言种类的会话消息翻译为第二语言种类的会话消息。示例性的，服务器引用A公司的语音转文字技术将语音内容“对不起”转换为第一语言种类的会话消息“对不起”，再引用A公司的翻译技术将第一语言种类的会话消息“对不起”翻译为第二语言种类的会话消息“I’m sorry”。

可选地，第一客户端根据语音内容生成第一语言种类的会话消息；第一客户端将第一语言种类的会话消息发送给服务器；服务器根据第一语言种类的会话消息生成第二语言种类的会话消息。即，将生成第一语言种类的会话消息的任务交由第一客户端执行。

步骤607：发送第一语言种类的会话消息。

服务器将第一语言种类的会话消息发送给第一客户端。

步骤608：发送第二语言种类的会话消息。

服务器将第二语言种类的会话消息发送给第二客户端。

步骤607和步骤608在时序上不分先后。

步骤609：接收到第一语言种类的会话消息。

第一客户端接收到由服务器发送的第一语言种类的会话消息。

步骤610：采用第一语言种类显示会话消息。

第一客户端在第一用户界面上显示第一语言种类的会话消息。

步骤611：取消显示会话消息。

第一客户端取消显示第一语言种类的会话消息。

可选地，当以第一语言种类显示的会话消息的显示时间达到预设时长时，第一客户端取消显示会话消息。示例性的，当会话消息显示10秒后，第一客户端会取消显示会话消息。

可选地，第一客户端响应于第一取消显示操作，取消显示会话消息。第一取消显示操作用于取消显示会话消息。其中，第一取消显示操作可以是按压一个或多个预设的物理按键以取消显示会话消息，或者，第一取消显示操作可以是通过在触摸屏的指定区域上进行长按、点击、双击和/或滑动所产生的信号来执行第一取消显示操作，或者，第一取消显示操作可以是通过识别输入的语音内容来执行第一取消显示操作。

步骤612：接收到第二语言种类的会话消息。

可选地，第二客户端接收到由服务器发送的第一语言种类的会话消息；第二客户端根据第一语言种类的会话消息和第二语言种类确定第二语言种类的会话消息。即，将确定第二语言种类的会话消息的任务交由第二客户端完成。

步骤613：采用第二语言种类显示会话消息。

可选地，响应于第一客户端上的语音输入操作，第二客户端在第二用户界面上显示第一语言种类的会话消息和第二语言种类的会话消息。如图7所示，在第二用户界面上显示的会话消息包括第一语言种类的会话消息和第二语言种类的会话消息，其中，第一语言种类的会话消息为“你好”，第二语言种类的会话消息为“Hello”。并且，同时显示第一语言种类的会话消息和第二语言种类的会话消息可以帮助用户学习其他语言种类，便于用户之后更好地进行交流。

步骤614：取消显示会话消息。

第二客户端取消显示第二语言种类的会话消息。

可选地，当以第二语言种类显示的会话消息的显示时间达到预设时长时，第二客户端取消显示会话消息。示例性的，当会话消息显示10秒后，第二客户端会取消显示会话消息。

可选地，第二客户端响应于第二取消显示操作，取消显示会话消息。第二取消显示操作用于取消显示会话消息。其中，第二取消显示操作可以是按压一个或多个预设的物理按键以取消显示会话消息，或者，第二取消显示操作可以是通过在触摸屏的指定区域上进行长按、点击、双击和/或滑动所产生的信号来执行第二取消显示操作，或者，第二取消显示操作可以是通过识别输入的语音内容来执行第二取消显示操作。第二取消显示操作和第一取消显示操作的具体操作方式可以相同，也可以不同，本申请对此不作具体限定。

综上所述，本实施例可以对语音输入操作的输入内容进行翻译，在第一客户端和第二客户端上显示不同的语言种类的会话消息，便于使用不同语言种类的用户之间直接进行交流，提高了用户之间的交流效率。

并且，通过服务器进行语音转换和会话消息翻译，使得获得的会话消息和会话消息更为准确，提高了语音转换和信息翻译的准确率。

此外，用户还可以根据自身的需要取消显示会话消息和会话消息，防止会话消息和会话消息干扰用户的操作。

在本申请中，用户还可以通过更为快捷的方式来实现语音转换文字。

图8示出了本申请一个示例性实施例提供的语音转换文字的方法的流程图。该方法可由图1所示的第一终端120或第二终端160执行，该方法应用于至少两个客户端中，该方法包括：

基于图2实施例的可选实施例中，上面步骤202至步骤204可替代实现成为如下步骤802至步骤804。

步骤802：第一客户端显示第一用户界面。

步骤804：第二客户端显示第二用户界面。

步骤806：响应于对第一客户端上的聊天控件的第一触发操作，第一客户端采用第一语言种类显示会话消息，第二客户端采用第二语言种类显示会话消息。

聊天控件用于不同客户端之间的用户进行信息交流。示例性的，用户点击聊天控件，并输入文本。

第一触发操作用于使用第一客户端的用户输入语音内容。其中，第一触发操作可以是按压一个或多个预设的物理按键以输入语音内容，或者，第一触发操作可以是通过在触摸屏的指定区域上进行长按、点击、双击和/或滑动所产生的信号来执行第一触发操作。

可选地，给出一种输入语音内容并显示会话消息的实现方式：

1、响应于对第一客户端上的聊天控件的开始输入操作，第一客户端在聊天控件的周侧位置显示语音收录提示，开始接收语音内容。

开始输入操作用于控制第一客户端开始接收语音内容。其中，开始输入操作可以是按压一个或多个预设的物理按键以开始接收语音内容，或者，开始输入操作可以是通过在触摸屏的指定区域上进行长按、点击、双击和/或滑动所产生的信号来执行开始输入操作。

语音收录提示用于提示用户第一客户端正在接受语音内容。可选地，语音收录提示是文字、图标、声音、影像、震动反馈、灯光中的至少一种或多种的组合。

可选地，语音收录提示显示在聊天控件的上侧、下侧、左侧、右侧、左上侧、左下侧、右上侧、右下侧中的至少一种。

示例性的，如图9所示，用户长按第一客户端上的聊天控件402，显示语音收录提示901，其中，语音收录提示901显示有话筒图标和文字提示“倒计时：9s”和“手指左划取消”。

2、响应于对第一客户端上的聊天控件的结束输入操作，第一客户端取消显示语音收录提示，结束接收语音内容。

结束输入操作用于控制第一客户端结束接收语音内容。其中，结束输入操作可以是按压一个或多个预设的物理按键以结束输入语音内容，或者，结束输入操作可以是通过在触摸屏的指定区域上进行长按、点击、双击和/或滑动所产生的信号来执行结束输入操作。

可选地，当语音内容的输入时长达到时长阈值时，第一客户端取消显示语音收录提示，结束接收语音内容。示例性的，当用户输入一段10秒的语音内容时，语音内容的输入时长达到时长阈值，第一客户端结束接收语音内容。

示例性的，如图10所示，用户长按聊天控件402并输入语音内容，用户松开聊天控件402，结束输入语音内容，或者，用户继续长按聊天控件9秒直至达到时长阈值，第一客户端结束接收语音内容。

示例性的，如图10所示，在语音转换的过程中会显示转换提醒1001，其中，转换提醒1001显示有“转换中”。

可选地，在完成语音内容的输入后，第一客户端显示语音转换提示。语音转换提示用于提示用户语音内容输入已经完成和语音内容正在被转换为会话消息。语音转换提示是文字、图标、声音、影像、震动反馈、灯光中的至少一种或多种的组合。

3、第一客户端采用第一语言种类显示会话消息，第二客户端采用第二语言种类显示会话消息。

示例性的，如图4和图5所示，第一客户端采用第一语言种类显示会话消息403，第二客户端采用第二语言种类显示会话消息503，其中，会话消息403为“ABC：你好”，会话消息503为“ABC：Hello”。

综上所述，本实施例为用户输入语音内容提供了快捷方式，便于用户快速输入语音内容，可以减少用户的操作步骤，提高人机交互效率。

图11示出了本申请一个示例性实施例提供的语音转换文字的方法的流程图。该方法可由图1所示的服务器140执行，服务器140至少与两个客户端连接，该方法包括：

步骤1101：接收由第一客户端发送的语音内容。

服务器接收由第一客户端发送的语音内容。

步骤1102：确定第一语言种类和第二语言种类。

可选地，服务器接收由第一客户端发送的第一语言种类，以确定第一语言种类。

可选地，第一客户端向服务器发送版本信息，该版本信息中包括第一语言种类，或者，第一客户端向服务器发送地域信息，该地域信息与第一语言种类相对应，例如，地域信息表示第一客户端位于中国，则第一语言种类为中文，或者，第一客户端向服务器发送终端的语言设置，该语言设置包括第一语言种类。

可选地，服务器接收由第二客户端发送的第二语言种类，以确定第二语言种类。

可选地，第二客户端向服务器发送版本信息，该版本信息中包括第二语言种类，或者，第二客户端向服务器发送地域信息，该地域信息与第一语言种类相对应，例如，地域信息表示第二客户端位于中国，则第二语言种类为中文，或者，第二客户端向服务器发送终端的语言设置，该语言设置包括第二语言种类。

可选地，服务器向第二客户端发送语言种类获取请求，服务器接收由第二客户端发送的第二语言种类。其中，语言种类获取请求用于服务器向客户端请求发送语言种类。

步骤1103：根据语音内容和第一语言种类，将语音内容转换为第一语言种类的会话消息。

可选地，服务器引用现有的语音转文字技术将语音内容转换为会话消息。示例性的，服务器引用A公司的语音转文字技术将语音内容“对不起”转换为会话消息“对不起”。

步骤1104：根据第一语言种类的会话消息和第二语言种类，翻译获得第二语言种类的会话消息。

可选地，服务器引用现有的翻译技术将第一语言种类的会话消息翻译为第二语言种类的会话消息。示例性的，服务器引用A公司的翻译技术将第一语言种类的会话消息“对不起”翻译为第二语言种类的会话消息“I’m sorry”。

步骤1105：将第二语言种类的会话消息发送给第二客户端。

服务器将第二语言种类的会话消息发送给第二客户端。

综上所述，本实施例在服务器中将语音内容转换为会话消息，再将会话消息翻译为会话消息，便于使用不同语言种类的用户之间直接进行交流，提高了用户之间的交流效率。同时，使用服务器可以提高转换和翻译的正确率，为用户提供更为准确的结果。

可选地，本申请运用于MOBA游戏中。示例性的，用户A和用户B在游玩MOBA游戏的过程中，用户A输入中文的语音内容后，在用户A的客户端显示中文的会话消息，在用户B的客户端显示英文的会话消息。

可选地，本申请运用于FPS游戏中。示例性的，用户A和用户B在游玩FPS游戏的过程中，用户A输入中文的语音内容后，在用户A的客户端显示俄语的会话消息，在用户B的客户端显示英文的会话消息。

可选地，本申请运用于SLG游戏中。示例性的，用户A和用户B在游玩SLG游戏的过程中，用户A输入中文的语音内容后，在用户A的客户端显示中文的会话消息，在用户B的客户端显示日语的会话消息。

图12示出了本申请的一个示例性实施例提供的语音转换文字的系统的结构示意图。该系统可以通过软件、硬件或者两者的结合实现成为计算机设备的全部或一部分，该系统120包括第一装置121和第二装置122，具体包括：

第一装置121，用于显示第一用户界面，所述第一用户界面是为第一用户账号控制的第一虚拟角色提供虚拟活动场所的虚拟环境的展示画面；

第二装置122，用于显示第二用户界面，所述第二用户界面是为第二用户账号控制的第二虚拟角色提供虚拟活动场所的虚拟环境的展示画面；

所述第一装置121，还用于响应于所述第一装置121上的语音输入操作，采用第一语言种类显示所述第一用户账号发送的会话消息，所述第一语音种类是与所述第一用户账号或所述第一客户端关联的语言种类，所述会话消息的文字内容是基于所述语音输入操作所输入的语音内容识别到的；

所述第二装置122，还用于采用第二语言种类显示所述第一用户账号发送的所述会话消息，所述第二语言种类是与所述第二用户账号或所述第二客户端关联的语言种类。

在本申请的一个可选设计中，所述第一装置121，还用于响应于所述第一装置121上的所述语音输入操作，所述第一装置获得所述语音内容；将所述语音内容发送给服务器，所述服务器用于根据所述语音内容生成所述第一语言种类的所述会话消息和所述第二语言种类的所述会话消息；在接收到由所述服务器发送的所述会话消息后，采用所述第一语言种类显示所述会话消息。

在本申请的一个可选设计中，所述第二装置122，还用于在接收到由所述服务器发送的所述会话消息后，采用所述第二语言种类显示所述会话消息。

在本申请的一个可选设计中，所述第一装置121，还用于向所述服务器发送所述第一语言种类。

在本申请的一个可选设计中，所述第二装置122，还用于向所述服务器发送所述第二语言种类。

在本申请的一个可选设计中，所述第一装置121，还用于将所述语音内容和所述第一语言种类发送给服务器。

在本申请的一个可选设计中，所述第二装置122，还用于接收由所述服务器发送的语言种类获取请求；根据所述语言种类获取请求，向所述服务器发送所述第二语言种类。

在本申请的一个可选设计中，所述第一装置121，还用于响应于对所述第一装置121上的所述聊天控件的第一触发操作，采用所述第一语言种类显示所述会话消息。

在本申请的一个可选设计中，所述第二装置122，还用于响应于对所述第一装置121上的所述聊天控件的第一触发操作，采用所述第二语言种类显示所述会话消息。

在本申请的一个可选设计中，所述第一装置121，还用于响应于对所述第一装置121上的聊天控件的开始输入操作，在所述聊天控件的周侧位置显示语音收录提示，开始接收所述语音内容；响应于对所述第一装置上的聊天控件的结束输入操作，取消显示所述语音收录提示，结束接收所述语音内容。

在本申请的一个可选设计中，所述第一装置121，还用于当以所述第一语言种类显示的所述会话消息的显示时间达到预设时长时，取消显示所述会话消息；或，响应于第一取消显示操作，取消显示所述会话消息。

在本申请的一个可选设计中，所述第二装置122，还用于当以所述第二语言种类显示的所述会话消息的显示时间达到所述预设时长时，取消显示所述会话消息；或，响应于第二取消显示操作，取消显示所述会话消息。

在本申请的一个可选设计中，所述第二装置122，还用于响应于所述第一装置121上的所述语音输入操作，采用所述第一语言种类和所述第二语言种类显示所述会话消息。

综上所述，本实施例通过在第一客户端上接收到语言输入操作时，在不同的客户端上显示不同语言种类的会话消息，可以将输入的语音信息翻译成不同语言种类的会话消息，方便使用不同语种的用户进行交流，消除语言障碍。同时，不需要用户使用额外的翻译软件翻译其它语言种类的会话消息，减少用户的操作步骤，提升人机交互效率。

图13示出了本申请的一个示例性实施例提供的语音转换文字的装置的结构示意图。该装置可以通过软件、硬件或者两者的结合实现成为服务器的全部或一部分，该装置130包括：

接收模块131，用于接收由第一客户端发送的语音内容；

所述接收模块131，还用于确定第一语言种类和第二语言种类；

转换模块132，用于根据所述语音内容和所述第一语言种类，将所述语音内容转换为所述第一语言种类的会话消息，所述会话消息的文字内容是基于所述语音内容识别到的；

翻译模块133，用于根据所述第一语言种类的所述会话消息和所述第二语言种类，翻译获得所述第二语言种类的所述会话消息；

发送模块134，用于将所述第二语言种类的所述会话消息发送给第二客户端。

在本申请的一个可选设计中，所述接收模块131，还用于接收由所述第一客户端发送的所述第一语言种类；接收由所述第二客户端发送的所述第二语言种类。

在本申请的一个可选设计中，所述发送模块134，还用于向所述第二客户端发送语言种类获取请求。

综上所述，本实施例在服务器中将语音内容转换为第一语言种类的会话消息，再将第一语言种类的会话消息翻译为第二语言种类的会话消息，便于使用不同语言种类的用户之间直接进行交流，提高了用户之间的交流效率。同时，使用服务器可以提高转换和翻译的正确率，为用户提供更为准确的结果。

本申请还提供了一种终端，该终端包括处理器和存储器，存储器中存储有至少一条指令，至少一条指令由处理器加载并执行以实现上述各个方法实施例提供的虚拟世界的画面显示方法。需要说明的是，该终端可以是如下图14所提供的终端。

图14示出了本申请一个示例性实施例提供的终端的结构框图。该终端1400可以是：智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio LayerIV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1400还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端1400包括有：处理器1401和存储器1402。

处理器1401可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1401可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1401也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1401可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1401还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1402可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1402还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1402中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器1401所执行以实现本申请中方法实施例提供的虚拟世界的画面显示方法。

在一些实施例中，终端1400还可选包括有：外围设备接口1403和至少一个外围设备。处理器1401、存储器1402和外围设备接口1403之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1403相连。具体地，外围设备包括：射频电路1404、显示屏1405、摄像头组件1406、音频电路1407、定位组件1408和电源1409中的至少一种。

外围设备接口1403可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器1401和存储器1402。在一些实施例中，处理器1401、存储器1402和外围设备接口1403被集成在同一芯片或电路板上；在一些其他实施例中，处理器1401、存储器1402和外围设备接口1403中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1404用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1404通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1404将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1404包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1404可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1404还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏1405用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1405是触摸显示屏时，显示屏1405还具有采集在显示屏1405的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1401进行处理。此时，显示屏1405还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1405可以为一个，设置终端1400的前面板；在另一些实施例中，显示屏1405可以为至少两个，分别设置在终端1400的不同表面或呈折叠设计；在一些实施例中，显示屏1405可以是柔性显示屏，设置在终端1400的弯曲表面上或折叠面上。甚至，显示屏1405还可以设置成非矩形的不规则图形，也即异形屏。显示屏1405可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode，有机发光二极管)等材质制备。

摄像头组件1406用于采集图像或视频。可选地，摄像头组件1406包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1406还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1407可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1401进行处理，或者输入至射频电路1404以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端1400的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1401或射频电路1404的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1407还可以包括耳机插孔。

定位组件1408用于定位终端1400的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。

电源1409用于为终端1400中的各个组件进行供电。电源1409可以是交流电、直流电、一次性电池或可充电电池。当电源1409包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端1400还包括有一个或多个传感器1410。该一个或多个传感器1410包括但不限于：加速度传感器1411、陀螺仪传感器1412、压力传感器1413、指纹传感器1414、光学传感器1415以及接近传感器1416。

加速度传感器1411可以检测以终端1400建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1411可以用于检测重力加速度在三个坐标轴上的分量。处理器1401可以根据加速度传感器1411采集的重力加速度信号，控制触摸显示屏1405以横向视图或纵向视图进行用户界面的显示。加速度传感器1411还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1412可以检测终端1400的机体方向及转动角度，陀螺仪传感器1412可以与加速度传感器1411协同采集用户对终端1400的3D动作。处理器1401根据陀螺仪传感器1412采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1413可以设置在终端1400的侧边框和/或触摸显示屏1405的下层。当压力传感器1413设置在终端1400的侧边框时，可以检测用户对终端1400的握持信号，由处理器1401根据压力传感器1413采集的握持信号进行左右手识别或快捷操作。当压力传感器1413设置在触摸显示屏1405的下层时，由处理器1401根据用户对触摸显示屏1405的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

光学传感器1415用于采集环境光强度。在一个实施例中，处理器1401可以根据光学传感器1415采集的环境光强度，控制触摸显示屏1405的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏1405的显示亮度；当环境光强度较低时，调低触摸显示屏1405的显示亮度。在另一个实施例中，处理器1401还可以根据光学传感器1415采集的环境光强度，动态调整摄像头组件1406的拍摄参数。

接近传感器1416，也称距离传感器，通常设置在终端1400的前面板。接近传感器1416用于采集用户与终端1400的正面之间的距离。在一个实施例中，当接近传感器1416检测到用户与终端1400的正面之间的距离逐渐变小时，由处理器1401控制触摸显示屏1405从亮屏状态切换为息屏状态；当接近传感器1416检测到用户与终端1400的正面之间的距离逐渐变大时，由处理器1401控制触摸显示屏1405从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图14中示出的结构并不构成对终端1400的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

图15是本申请一个实施例提供的服务器的结构示意图。具体来讲：服务器1500包括中央处理单元(英文：Central Processing Unit，简称：CPU)1501、包括随机存取存储器(英文：Random Access Memory，简称：RAM)1502和只读存储器(英文：Read-Only Memory，简称：ROM)1503的系统存储器1504，以及连接系统存储器1504和中央处理单元1501的系统总线1505。计算机设备1500还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)1506，和用于存储操作系统1513、应用程序1514和其他程序模块1515的大容量存储设备1507。

基本输入/输出系统1506包括有用于显示信息的显示器1508和用于用户输入信息的诸如鼠标、键盘之类的输入设备1509。其中显示器1508和输入设备1509都通过连接到系统总线1505的输入/输出控制器1510连接到中央处理单元1501。基本输入/输出系统1506还可以包括输入/输出控制器1510以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入/输出控制器1510还提供输出到显示屏、打印机或其他类型的输出设备。

大容量存储设备1507通过连接到系统总线1505的大容量存储控制器(未示出)连接到中央处理单元1501。大容量存储设备1507及其相关联的计算机可读介质为服务器1500提供非易失性存储。也就是说，大容量存储设备1507可以包括诸如硬盘或者只读光盘(英文：Compact Disc Read-Only Memory，简称：CD-ROM)驱动器之类的计算机可读介质(未示出)。

不失一般性，计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器(英文：Erasable Programmable Read-Only Memory，简称：EPROM)、电可擦除可编程只读存储器(英文：Electrically Erasable Programmable Read-Only Memory，简称：EEPROM)、闪存或其他固态存储其技术，CD-ROM、数字通用光盘(英文：Digital Versatile Disc，简称：DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器1504和大容量存储设备1507可以统称为存储器。

根据本申请的各种实施例，服务器1500还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1500可以通过连接在系统总线1505上的网络接口单元1511连接到网络1512，或者说，也可以使用网络接口单元1511来连接到其他类型的网络或远程计算机系统(未示出)。

根据本申请的另一方面，还提供了一种计算机存储介质，计算机可读存储介质中存储有至少一条程序代码，程序代码由处理器加载并执行以实现如上述的语音转换文字的方法。

根据本申请的另一方面，还提供了一种计算机程序产品或计算机程序，上述计算机程序产品或计算机程序包括计算机指令，上述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从上述计算机可读存储介质读取上述计算机指令，上述处理器执行上述计算机指令，使得上述计算机设备执行如上述的语音转换文字的方法。

应当理解的是，在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种语音转换文字的方法，其特征在于，应用于至少两个客户端中，所述至少两个客户端是游戏客户端，所述方法包括：

响应于所述第一客户端上的语音输入操作，所述第一客户端获得语音内容；所述第一客户端将所述语音内容发送给服务器，所述服务器用于根据所述语音内容生成第一语言种类的会话消息和第二语言种类的所述会话消息；所述第一客户端在接收到由所述服务器发送的所述第一语言种类的所述会话消息后，采用所述第一语言种类显示所述会话消息；

所述第二客户端在接收到由所述服务器发送的所述第二语言种类的所述会话消息后，采用所述第二语言种类显示所述会话消息；

其中，所述第一语言种类是与所述第一用户账号或所述第一客户端关联的语言种类，所述第一语言种类是根据所述第一客户端的版本信息确定的，所述第二语言种类是与所述第二用户账号或所述第二客户端关联的语言种类，所述第二语言种类是根据所述第二客户端的版本信息确定的，所述会话消息的文字内容是基于所述语音输入操作所输入的语音内容识别到的。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括如下两个步骤中的至少一个：

所述第一客户端向所述服务器发送所述第一客户端的版本信息，所述第一客户端的版本信息包括所述第一语言种类；

所述第二客户端向所述服务器发送所述第二客户端的版本信息，所述第二客户端的版本信息包括所述第二语言种类。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

所述第一客户端将所述语音内容和所述第一语言种类发送给服务器。

4.根据权利要求2所述的方法，其特征在于，所述方法还包括：

所述第二客户端接收由所述服务器发送的语言种类获取请求；

所述第二客户端根据所述语言种类获取请求，向所述服务器发送所述第二语言种类。

5.根据权利要求1至4任一所述的方法，其特征在于，所述第一客户端上还显示有聊天控件；

所述响应于所述第一客户端上的语音输入操作，所述第一客户端采用第一语言种类显示所述第一用户账号发送的会话消息，所述第二客户端采用第二语言种类显示所述第一用户账号发送的所述会话消息，包括：

响应于对所述第一客户端上的所述聊天控件的第一触发操作，所述第一客户端采用所述第一语言种类显示所述会话消息，所述第二客户端采用所述第二语言种类显示所述会话消息。

6.根据权利要求5所述的方法，其特征在于，所述响应于对所述第一客户端上的所述聊天控件的第一触发操作，所述第一客户端采用第一语言种类显示所述会话消息，包括：

响应于对所述第一客户端上的聊天控件的开始输入操作，所述第一客户端在所述聊天控件的周侧位置显示语音收录提示，开始接收所述语音内容；

响应于对所述第一客户端上的聊天控件的结束输入操作，所述第一客户端取消显示所述语音收录提示，结束接收所述语音内容；

所述第一客户端采用所述第一语言种类显示所述会话消息。

7.根据权利要求1至4任一所述的方法，其特征在于，所述方法还包括：

当以所述第一语言种类显示的所述会话消息的显示时间达到预设时长时，所述第一客户端取消显示所述会话消息；

或，

所述第一客户端响应于第一取消显示操作，取消显示所述会话消息。

8.根据权利要求1至4任一所述的方法，其特征在于，所述方法还包括：

当以所述第二语言种类显示的所述会话消息的显示时间达到预设时长时，所述第二客户端取消显示所述会话消息；

或，

所述第二客户端响应于第二取消显示操作，取消显示所述会话消息。

9.根据权利要求1至4任一所述的方法，其特征在于，所述方法还包括：

响应于所述第一客户端上的所述语音输入操作，所述第二客户端采用所述第一语言种类和所述第二语言种类显示所述第一用户账号发送的所述会话消息。

10.一种语音转换文字的方法，其特征在于，应用于服务器中，所述服务器至少与两个客户端连接，所述至少两个客户端是游戏客户端，所述方法包括：

接收由第一客户端发送的语音内容，所述语音内容是所述第一客户端响应于所述第一客户端上的语音输入操作获取的；

确定第一语言种类和第二语言种类，所述第一语言种类是与第一用户账号或所述第一客户端关联的语言种类，所述第一语言种类是根据所述第一客户端的版本信息确定的，所述第二语言种类是与第二用户账号或第二客户端关联的语言种类，所述第二语言种类是根据第二客户端的版本信息确定的；

将所述第二语言种类的所述会话消息发送给所述第二客户端，所述第二客户端用于在接收到由所述服务器发送的所述第二语言种类的所述会话消息后，采用所述第二语言种类显示所述会话消息。

11.根据权利要求10所述的方法，其特征在于，所述确定第一语言种类，包括：

接收由所述第一客户端发送的所述第一语言种类；

所述确定第二语言种类，包括：

向所述第二客户端发送语言种类获取请求；

接收由所述第二客户端发送的所述第二语言种类。

12.一种语音转换文字的系统，其特征在于，所述系统包括第一装置和第二装置，所述第一装置和所述第二装置与游戏客户端相关，所述系统包括：

所述第一装置，用于显示第一用户界面，所述第一用户界面是为第一用户账号控制的第一虚拟角色提供虚拟活动场所的虚拟环境的展示画面；

所述第二装置，用于显示第二用户界面，所述第二用户界面是为第二用户账号控制的第二虚拟角色提供虚拟活动场所的虚拟环境的展示画面；

所述第一装置，还用于响应于所述第一装置上的语音输入操作，所述第一装置获得所述语音内容；将所述语音内容发送给服务器，所述服务器用于根据所述语音内容生成所述第一语言种类的所述会话消息和所述第二语言种类的所述会话消息；在接收到由所述服务器发送的所述第一语言种类的所述会话消息后，采用所述第一语言种类显示所述会话消息，所述第一语言种类是与所述第一用户账号或所述第一装置关联的语言种类，所述第一语言种类是根据所述第一装置的版本信息确定的，所述会话消息的文字内容是基于所述语音输入操作所输入的语音内容识别到的；

所述第二装置，还用于在接收到由所述服务器发送的所述第二语言种类的所述会话消息后，采用所述第二语言种类显示所述会话消息，所述第二语言种类是与所述第二用户账号或所述第二装置关联的语言种类，所述第二语言种类是根据所述第二装置的版本信息确定的。

13.一种语音转换文字的装置，其特征在于，所述装置与至少两个客户端连接，所述至少两个客户端是游戏客户端，所述装置包括：

接收模块，用于接收由第一客户端发送的语音内容，所述语音内容是所述第一客户端响应于所述第一客户端上的语音输入操作获取的；

所述接收模块，还用于确定第一语言种类和第二语言种类，所述第一语言种类是根据所述第一客户端的版本信息确定的，所述第二语言种类是根据第二客户端的版本信息确定的；

发送模块，用于将所述第二语言种类的所述会话消息发送给第二客户端，所述第二客户端用于在接收到由服务器发送的所述第二语言种类的所述会话消息后，采用所述第二语言种类显示所述会话消息。

14.一种计算机设备，其特征在于，所述计算机设备包括：处理器和存储器，所述存储器中存储有至少一段程序，所述至少一段程序由所述处理器加载并执行以实现如权利要求1至9中任一项所述的语音转换文字的方法。

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条程序代码，所述程序代码由处理器加载并执行以实现如权利要求1至9中任一项所述的语音转换文字的方法。