CN113591437B

CN113591437B - 游戏文本翻译方法、电子设备及存储介质

Info

Publication number: CN113591437B
Application number: CN202110908945.3A
Authority: CN
Inventors: 秦泰然; 杨辉
Original assignee: Netease Hangzhou Network Co Ltd
Current assignee: Netease Hangzhou Network Co Ltd
Priority date: 2021-08-09
Filing date: 2021-08-09
Publication date: 2023-08-08
Anticipated expiration: 2041-08-09
Also published as: CN113591437A

Abstract

本申请实施例提供一种游戏文本翻译方法、电子设备及存储介质，通过获取第一像素数据，第一像素数据表征包含第一文本的图像，第一文本为基于第一语言的目标文本；向服务器发送第一像素数据，第一像素数据用于生成翻译数据，并接收服务器返回的翻译数据，其中，翻译数据用于表征第二文本，第二文本为基于第二语言的目标文本；基于翻译数据对第一像素数据进行渲染，得到第二像素数据，并显示第二像素数据，其中，第二像素数据表征包含第二文本的图像，实现了对游戏文本的实时在线翻译，解决了人工翻译游戏文本成本高、效率低的问题，提高了游戏开发进度、降低游戏开发和维护成本。

Description

游戏文本翻译方法、电子设备及存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种游戏文本翻译方法、电子设备及存储介质。

背景技术

本部分旨在为权利要求书中陈述的本申请的实施方式提供背景或上下文。此处的描述不因为包括在本部分中而被认为是现有技术。

随着手机游戏产业的发展，手机游戏被越来越多的玩家所认可和接收，与此同时，手机游戏产品的发行，也从单一的地区逐渐发展为全球化发行，从而为不同地区的玩家提供优秀的手机游戏产品。

然而，考虑到成本等方面的因素，目前在全球化发行的手机游戏产品，通常只包含了少数的几种语言，同时由于手机游戏现阶段的开发生态，也并不支持玩家自定义翻译模块对手机游戏中的文本内容进行语言翻译，造成了玩家用户在玩非母语的手机游戏时巨大的游戏文本阅读障碍，严重影响用户游玩体验。

而现有技术中，通常只能通过游戏厂商针对不同地区的语言开发语言包，来解决游戏文本翻译的问题，但造成了游戏开发和维护成本提高、开发进度延长的问题。

发明内容

本申请提供一种游戏文本翻译方法、电子设备及存储介质，用以解决游戏文本翻译的问题。

根据本申请实施例的第一方面，本申请提供了一种游戏文本翻译方法，应用于终端设备，所述方法包括：

获取第一像素数据，所述第一像素数据表征包含第一文本的图像，所述第一文本为基于第一语言的目标文本；向服务器发送所述第一像素数据，所述第一像素数据用于生成翻译数据，并接收所述服务器返回的所述翻译数据，其中，所述翻译数据用于表征第二文本，所述第二文本为基于第二语言的所述目标文本；基于所述翻译数据对所述第一像素数据进行渲染，得到第二像素数据，并显示所述第二像素数据，其中，所述第二像素数据表征包含所述第二文本的图像。

在一种可能的实现方式中，所述翻译数据包括第一翻译信息和第二翻译信息，其中，所述第一翻译信息用于表征所述第二文本中的各文字，所述第二翻译信息用于表征所述第一文本在所述第一像素数据对应的图像中的位置；基于所述翻译数据对所述第一像素数据进行渲染，得到第二像素数据，包括：根据所述第二翻译信息，确定待渲染坐标，所述待渲染坐标表征所述第二文本在所述第二像素数据对应的图像中的位置；根据所述待渲染坐标以及所述第一翻译信息，将所述第二文本中的各文字，覆盖渲染至所述第一像素数据对应的图像，得到第二像素数据。

在一种可能的实现方式中，所述服务器包括第一服务器和第二服务器，所述向服务器发送所述第一像素数据，包括：向所述第一服务器发送所述第一像素数据；接收所述第一服务器返回的链接信息，所述链接信息用于表征所述第一像素数据的下载地址；向所述第二服务器发送所述链接信息；所述接收所述服务器返回的所述翻译数据，包括：接收所述第二服务器发送的所述翻译数据。

在一种可能的实现方式中，在向所述第一服务器发送所述第一像素数据之前，还包括：对所述第一像素数据进行压缩，生成压缩像素数据；向所述第一服务器发送所述第一像素数据，包括：向所述第一服务器发送所述压缩像素数据。

在一种可能的实现方式中，所述终端设备内运行有游戏客户端，获取第一像素数据，包括：接收翻译请求指令；响应所述翻译请求指令，获取缓存在终端设备内的目标截图数据，所述目标截图数据表征所述游戏客户端当前显示的游戏界面；根据所述目标截图数据，生成所述第一像素数据。

在一种可能的实现方式中，在接收翻译请求指令之前，所述方法还包括：在所述游戏客户端启动时，开启屏幕录制功能，以在所述游戏客户端运行过程中，生成所述游戏客户端显示的游戏界面对应的截图数据。

根据本申请实施例的第二方面，本申请提供了一种游戏文本翻译方法，应用于服务器，所述方法包括：

接收终端设备上传的第一像素数据，所述第一像素数据表征包含第一文本的图像，所述第一文本为基于第一语言的目标文本；根据所述第一像素数据，以及目标文字识别模型，生成翻译数据，其中，所述翻译数据用于表征第二文本，所述第二文本为基于第二语言的所述目标文本；向所述终端设备发送所述翻译数据，其中，所述翻译数据用于对所述第一像素数据进行渲染后得到第二像素数据，所述第二像素数据表征包含所述第二文本的图像。

在一种可能的实现方式中，根据所述第一像素数据，以及目标文字识别模型，生成翻译数据，包括：基于所述目标文字识别模型，对所述第一像素数据进行文字识别，获取所述第一像素数据对应的第一文本；基于所述第一像素数据对应的第一文本进行语言转换处理，生成所述翻译数据。

在一种可能的实现方式中，所述目标文字识别模型包括预训练的连接文本提议网络CTPN模型和预训练的Tesseract引擎；基于所述目标文字识别模型，对所述第一像素数据进行文字识别，获取所述第一像素数据对应的第一文本，包括：基于所述CTPN模型，对所述第一像素数据进行文字定位，获取所述第一像素数据中各文字的坐标；基于所述Tesseract引擎以及所述第一像素数据对应的各文字的坐标，对所述第一像素数据进行文字识别，得到所述取所述第一像素数据对应的第一文本。

在一种可能的实现方式中，基于所述第一像素数据对应的第一文本进行语言转换处理，生成所述翻译数据，包括：调用预设的翻译引擎，对所述第一像素数据对应的第一文本进行语言转换处理，生成第一翻译信息，所述第一翻译信息用于表征所述第二文本中的各文字；根据所述第一像素数据中各文字的坐标，生成第二翻译信息，所述第二翻译信息用于表征所述第一文本在所述第一像素数据对应的图像中的位置；根据所述第一翻译信息和所述第二翻译信息，生成所述翻译数据。

在一种可能的实现方式中，在根据所述第一像素数据，生成翻译数据之前，所述方法还包括：通过以下至少一种方式对所述第一像素数据进行预处理：背景去噪处理、边缘保留处理、图像锐化处理、灰度化处理。

在一种可能的实现方式中，在接收终端设备上传的第一像素数据之前，所述方法还包括：使用预设的图像样本生成脚本，生成字体标注样本，其中，所述字体标注样本包括多张标注图片，以及所述标注图片对应的文字内容，和/或所述标注图片对应的文字位置；根据所述字体标注样本，对预设的初始文字识别模型进行预训练，生成所述目标文字识别模型。

在一种可能的实现方式中，所述初始文字识别模型包括Tesseract引擎，根据所述字体标注样本，对预设的初始文字识别模型进行预训练，生成所述目标文字识别模型，包括：获取预设的常用词库，所述常用词库包含针对游戏客户端的常用字；根据所述常用词库，对包含所述常用词库中的常用字的字体标注样本进行加权训练，生成所述目标文字识别模型。

根据本申请实施例的第三方面，本申请提供了一种游戏文本翻译装置，包括：

获取模块，用于获取第一像素数据，所述第一像素数据表征包含第一文本的图像，所述第一文本为基于第一语言的目标文本；

收发模块，用于向服务器发送所述第一像素数据，所述第一像素数据用于生成翻译数据，并接收所述服务器返回的所述翻译数据，其中，所述翻译数据用于表征第二文本，所述第二文本为基于第二语言的所述目标文本；

渲染模块，用于基于所述翻译数据对所述第一像素数据进行渲染，得到第二像素数据，并显示所述第二像素数据，其中，所述第二像素数据表征包含所述第二文本的图像。

在一种可能的实现方式中，所述翻译数据包括第一翻译信息和第二翻译信息，其中，所述第一翻译信息用于表征所述第二文本中的各文字，所述第二翻译信息用于表征所述第一文本在所述第一像素数据对应的图像中的位置；所述渲染模块在基于所述翻译数据对所述第一像素数据进行渲染，得到第二像素数据时，具体用于：根据所述第二翻译信息，确定待渲染坐标，所述待渲染坐标表征所述第二文本在所述第二像素数据对应的图像中的位置；根据所述待渲染坐标以及所述第一翻译信息，将所述第二文本中的各文字，覆盖渲染至所述第一像素数据对应的图像，得到第二像素数据。

在一种可能的实现方式中，所述服务器包括第一服务器和第二服务器，所述收发模块在向服务器发送所述第一像素数据时，具体用于：向所述第一服务器发送所述第一像素数据；接收所述第一服务器返回的链接信息，所述链接信息用于表征所述第一像素数据的下载地址；向所述第二服务器发送所述链接信息；所述收发模块在接收所述服务器返回的所述翻译数据时，具体用于：接收所述第二服务器发送的所述翻译数据。

在一种可能的实现方式中，所述收发模块在向所述第一服务器发送所述第一像素数据之前，还用于：对所述第一像素数据进行压缩，生成压缩像素数据；所述收发模块在向所述第一服务器发送所述第一像素数据时，具体用于：向所述第一服务器发送所述压缩像素数据。

在一种可能的实现方式中，所述终端设备内运行有游戏客户端，所述获取模块，具体用于：接收翻译请求指令；响应所述翻译请求指令，获取缓存在终端设备内的目标截图数据，所述目标截图数据表征所述游戏客户端当前显示的游戏界面；根据所述目标截图数据，生成所述第一像素数据。

在一种可能的实现方式中，所述获取模块在接收翻译请求指令之前，还用于：在所述游戏客户端启动时，开启屏幕录制功能，以在所述游戏客户端运行过程中，生成所述游戏客户端显示的游戏界面对应的截图数据。

根据本申请实施例的第四方面，本申请提供了一种游戏文本翻译装置，包括：

接收模块，用于接收终端设备上传的第一像素数据，所述第一像素数据表征包含第一文本的图像，所述第一文本为基于第一语言的目标文本；

生成模块，用于根据所述第一像素数据，以及目标文字识别模型，生成翻译数据，其中，所述翻译数据用于表征第二文本，所述第二文本为基于第二语言的所述目标文本；

发送模块，用于向所述终端设备发送所述翻译数据，其中，所述翻译数据用于对所述第一像素数据进行渲染后得到第二像素数据，所述第二像素数据表征包含所述第二文本的图像。

在一种可能的实现方式中，所述生成模块，具体用于：基于所述目标文字识别模型，对所述第一像素数据进行文字识别，获取所述第一像素数据对应的第一文本；基于所述第一像素数据对应的第一文本进行语言转换处理，生成所述翻译数据。

在一种可能的实现方式中，所述目标文字识别模型包括预训练的连接文本提议网络CTPN模型和预训练的Tesseract引擎；所述生成模块在基于所述目标文字识别模型，对所述第一像素数据进行文字识别，获取所述第一像素数据对应的第一文本时，具体用于：基于所述CTPN模型，对所述第一像素数据进行文字定位，获取所述第一像素数据中各文字的坐标；基于所述Tesseract引擎以及所述第一像素数据对应的各文字的坐标，对所述第一像素数据进行文字识别，得到所述取所述第一像素数据对应的第一文本。

在一种可能的实现方式中，所述生成模块在基于所述第一像素数据对应的第一文本进行语言转换处理，生成所述翻译数据时，具体用于：调用预设的翻译引擎，对所述第一像素数据对应的第一文本进行语言转换处理，生成第一翻译信息，所述第一翻译信息用于表征所述第二文本中的各文字；根据所述第一像素数据中各文字的坐标，生成第二翻译信息，所述第二翻译信息用于表征所述第一文本在所述第一像素数据对应的图像中的位置；根据所述第一翻译信息和所述第二翻译信息，生成所述翻译数据。

在一种可能的实现方式中，所述生成模块在在根据所述第一像素数据，生成翻译数据之前，还用于：通过以下至少一种方式对所述第一像素数据进行预处理：背景去噪处理、边缘保留处理、图像锐化处理、灰度化处理。

在一种可能的实现方式中，在接收终端设备上传的第一像素数据之前，所述生成模块，还用于：使用预设的图像样本生成脚本，生成字体标注样本，其中，所述字体标注样本包括多张标注图片，以及所述标注图片对应的文字内容，和/或所述标注图片对应的文字位置；根据所述字体标注样本，对预设的初始文字识别模型进行预训练，生成所述目标文字识别模型。

在一种可能的实现方式中，所述初始文字识别模型包括Tesseract引擎，所述生成模块在根据所述字体标注样本，对预设的初始文字识别模型进行预训练，生成所述目标文字识别模型时，具体用于：获取预设的常用词库，所述常用词库包含针对游戏客户端的常用字；根据所述常用词库，对包含所述常用词库中的常用字的字体标注样本进行加权训练，生成所述目标文字识别模型。

根据本申请实施例的第五方面，本申请提供了一种电子设备，包括：存储器，处理器以及计算机程序；其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行如本申请实施例第一方面任一项所述的游戏文本翻译方法。

根据本申请实施例的第六方面，本申请提供了一种电子设备，包括：存储器，处理器以及计算机程序；其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行如本申请实施例第二方面任一项所述的游戏文本翻译方法。

根据本申请实施例的第七方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如本申请实施例第一方面任一项所述的游戏文本翻译方法，或者，用于实现如本申请实施例第二方面任一项所述的游戏文本翻译方法。

根据本申请实施例的第八方面，本申请提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能的游戏文本翻译方法，或者，实现如本申请实施例第二方面任一项所述的游戏文本翻译方法。

本申请提供的游戏文本翻译方法、电子设备及存储介质，通过获取第一像素数据，所述第一像素数据表征包含第一文本的图像，所述第一文本为基于第一语言的目标文本；向服务器发送所述第一像素数据，所述第一像素数据用于生成翻译数据，并接收所述服务器返回的所述翻译数据，其中，所述翻译数据用于表征第二文本，所述第二文本为基于第二语言的所述目标文本；基于所述翻译数据对所述第一像素数据进行渲染，得到第二像素数据，并显示所述第二像素数据，其中，所述第二像素数据表征包含所述第二文本的图像，实现了对游戏文本的实时在线翻译，解决了人工翻译游戏文本成本高、效率低的问题，提高了游戏开发进度、降低游戏开发和维护成本。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1为本申请实施例提供的游戏文本翻译方法的一种应用场景图；

图2为本申请一个实施例提供的游戏文本翻译方法的流程图；

图3为本公开实施例提供的一种基于翻译数据对所述第一像素数据进行渲染得到第二像素数据的示意图；

图4为本申请另一个实施例提供的游戏文本翻译方法的流程图；

图5为本申请一个实施例提供的游戏文本翻译方法的流程图；

图6为本申请另一个实施例提供的游戏文本翻译方法的流程图；

图7为图6所示实施例中步骤S405的实现步骤的流程图；

图8为图6所示实施例中步骤S406的实现步骤的流程图；

图9为申请实施例提供的一种执行游戏文本翻译方法的终端设备与服务器之间的信令示意图；

图10为本申请一个实施例提供的游戏文本翻译装置的结构示意图；

图11为本申请一个实施例提供的游戏文本翻译装置的结构示意图；

图12为本申请一个实施例提供的电子设备的示意图；

图13为本申请一个实施例提供的电子设备的示意图。

通过上述附图，已示出本申请明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围，而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

下面对本申请实施例的应用场景进行解释：

图1为本申请实施例提供的游戏文本翻译方法的一种应用场景图，本实施例提供的游戏文本翻译方法可以应用于手机游戏的文本在线翻译场景中，具体地，如图1所示，终端设备内运行有游戏客户端，该游戏客户端的游戏界面内显示有基于A语言(例如英文)的角色对话(例如图中所示的“to be or not to be，that's a question”)，以及“翻译”按钮，玩家用户基于自己的需要，通过终端设备的触摸屏，点击“翻译”按钮后，终端设备与服务器数据交互，并通过服务器对游戏界面内的角色对话进行翻译，使游戏客户端的游戏界面内显示的基于A语言的角色对话，更新显示为基于B语言(例如中文)的角色对话(例如图中所示的“生存还是毁灭，这是个问题”)。从而使玩家用户可以无障碍阅读游戏界面内的文本。

现有技术中，对于手机游戏的文本翻译的这一场景，通常只能通过游戏厂商翻译后，生成语言包对不同地区的游戏版本进行适配。这是考虑到手机游戏的闭源开发环境下，无法直接获得游戏中的文本内容并进行修改，因此离线翻译方式的游戏多语言覆盖，只能由游戏厂商来完成，而且，通常游戏厂商运行和发行的手机游戏众多，需要覆盖的语言种类也众多，若各手机游戏均采用离线翻译的方式进行多语言覆盖，通常是无法实现的。

在另一种可能的实现方式中，通过在终端设备或游戏客户端内安装通用的光学字符识别(Optical Character Recognition，OCR)引擎，实时搜索游戏界面内图像中的文字进行翻译，然而，在手机游戏这一场景下，由于游戏中的文本经常显示在颜色和线条复杂的背景画面上，对该背景画面上的文字进行识别，常会导致识别错误，甚至出现乱码，影响文字翻译的质量，从而导致玩家用户的不良体验。

因此，现有亟需一种游戏文本翻译的方式，能够实现手机游戏内的游戏文本的高效、精确、低成本的翻译。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本申请的实施例进行描述。

图2为本申请一个实施例提供的游戏文本翻译方法的流程图，应用于终端设备，如图2所示，本实施例提供的游戏文本翻译方法包括以下几个步骤：

步骤S101，获取第一像素数据，第一像素数据表征包含第一文本的图像，第一文本为基于第一语言的目标文本。

示例性地，第一像素数据是表征终端设备运行的游戏客户端内的游戏界面的图像，更具体地，第一像素数据中包括各像素点的像素值以及像素位置，第一像素数据通过不同像素点的像素值和像素位置，来表现游戏界面的图像。第一像素数据可以通过对游戏界面进行截图而获得。游戏界面的图像中包括有第一文本，该第一文本是游戏界面内与游戏相关，用于表现游戏内容的目标文本，例如，角色对话、物品描述、任务描述等。该第一文本基于第一语言，例如英语。

步骤S102，向服务器发送第一像素数据，第一像素数据用于生成翻译数据，并接收服务器返回的翻译数据，其中，翻译数据用于表征第二文本，第二文本为基于第二语言的目标文本。

示例性地，在获取第一像素数据后，为了实现第一像素数据对应的图像中游戏文本的翻译，将该第一像素数据发送至服务器，并由服务器基于收到的第一像素数据，进行文字识别、翻译等处理步骤，生成翻译数据并返回终端设备，以使终端设备能够接收到该第一像素数据所对应的翻译数据。其中，翻译数据是表征第一像素数据对应的第一文本的翻译结果，更具体地，例如，第一文本是基于第一语言的目标文本，第二文本是服务器对基于第一语言的目标文本进行翻译后，生成的基于第二语言的目标文本。

例如，第一文本为“to be or not to be，that's a question”，对应的第二文本为“生存还是毁灭，这是个问题”。其中，翻译数据是用于表征该第二文本的数据，更具体地，翻译数据中包含该第二文本中的各文字以及显示该第二文本的位置。

其中，服务器对第一文本进行处理，生成第二文本的过程，在后续实施例中详细介绍，此处不再赘述。

步骤S103，基于翻译数据对第一像素数据进行渲染，得到第二像素数据，并显示第二像素数据，其中，第二像素数据表征包含第二文本的图像。

进一步地，在获取翻译数据后，通过翻译数据所表征的第二文本，对第一像素数据进行渲染，修改第一像素数据中部分像素点的像素值和像素位置，生成能够显示包含第二文本的图像的第二像素数据。

示例性地，翻译数据包括第一翻译信息和第二翻译信息，其中，第一翻译信息用于表征第二文本中的各文字，第二翻译信息用于表征第一文本在第一像素数据对应的图像中的位置。其中，第一翻译信息是服务器基于第一文本中各文字进行翻译而确定的，第二第一翻译信息是服务器基于第一文本中各文字的位置而确定。示例性地，基于翻译数据对第一像素数据进行渲染，得到第二像素数据，包括：根据第二翻译信息，确定待渲染坐标，待渲染坐标表征第二文本在第二像素数据对应的图像中的位置；根据待渲染坐标以及第一翻译信息，将第二文本中的各文字，覆盖渲染至第一像素数据对应的图像，得到第二像素数据。

在一种可能的实现方式中，第二翻译信息指示第一文本的开始位置。即根据翻译数据中的第一翻译信息和第二翻译信息，对第一像素数据进行渲染，使第二文本显示在原第一文本的位置，实现对第一文本的覆盖，同时删除第一文本。图3为本公开实施例提供的一种基于翻译数据对第一像素数据进行渲染得到第二像素数据的示意图，如图3所示，原游戏界面内显示第一像素数据对应的A图像，A图像中包含第一文本，第一文本为基于英语的目标文字，例如图中所示的“to be or not to be，that's a question”。在获得翻译数据后，对第一像素数据中第一文本所在区域进行渲染，得到的第二像素数据对应的B图像，并显示在游戏界面内，其中，B图像中包含第二文本，第二文本为基于中文的目标文字，例如图中所示的“生存还是毁灭，这是个问题”。从而，实现对游戏文本的翻译和显示过程。

本实施例中，通过获取第一像素数据，第一像素数据表征包含第一文本的图像，第一文本为基于第一语言的目标文本；向服务器发送第一像素数据，第一像素数据用于生成翻译数据，并接收服务器返回的翻译数据，其中，翻译数据用于表征第二文本，第二文本为基于第二语言的目标文本；基于翻译数据对第一像素数据进行渲染，得到第二像素数据，并显示第二像素数据，其中，第二像素数据表征包含第二文本的图像，实现了对游戏文本的实时在线翻译，解决了人工翻译游戏文本成本高、效率低的问题，提高了游戏开发进度、降低游戏开发和维护成本。

图4为本申请另一个实施例提供的游戏文本翻译方法的流程图，如图4所示，本实施例提供的游戏文本翻译方法在图2所示实施例提供的游戏文本翻译方法的基础上，对步骤S101-S102进一步细化，则本实施例提供的游戏文本翻译方法包括以下几个步骤：

步骤S201，在游戏客户端启动时，开启屏幕录制功能，以在游戏客户端运行过程中，生成游戏客户端显示的游戏界面对应的截图数据。

示例性地，以安卓(Android)系统为例，在游戏客户端启动时，通过安卓系统自带的MediaProjection API获取屏幕录屏权限，并启动屏幕录制，其中，屏幕录制的具体时刻，可以是游戏客户端开始启动之后，主游戏界面加载之前、之后或同时，此处不进行具体限定，也不进行赘述。在启动屏幕录制的功能后，终端设备会自动对游戏客户端显示的游戏界面进行录屏，并通过截取其中的关键帧，获得截图数据。其中，关键帧可以是指图像中存在文本内容，且与上一帧图像不同的图像帧。根据文本内容的显示方式(例如文本滚动显示或直接闪现显示)，可以灵活设置获取关键帧的实现方式，以使关键帧能够包含完整的文本内容。此处不对此进行具体举例赘述。

步骤S202，接收翻译请求指令。

步骤S203，响应翻译请求指令，获取缓存在终端设备内的目标截图数据，目标截图数据表征游戏客户端当前显示的游戏界面。

步骤S204，根据目标截图数据，生成第一像素数据。

示例性地，参考图1所示场景示意图中的游戏界面，当用户通过交互界面触发“翻译”按钮时，终端设备接收翻译请求指令，并对该翻译请求指令进行响应，获取上述步骤中获得并缓存在终端设备内的目标截图数据，其中，响应翻译请求指令所获取的目标截图数据，表征游戏客户端当前显示的游戏界面，具体地，例如，目标截图数据可以为最新缓存的截图数据。进一步地，示例性地，目标截图数据可以为一个图像文件，该图像文件即为第一像素数据。

步骤S205，对第一像素数据进行压缩，生成压缩像素数据。

示例性地，在在线翻译的场景下，为了进一步的提高翻译实时性，降低服务器侧的计算压力，将原始的高分辨率第一像素数据进行压缩，生成低分辨率的压缩像素数据，例如无透明度像素通道的JPG格式，并使用75％压缩率进一步减小生成文件大小，该过程在终端设备本地执行，并使用压缩后的文件，即压缩像素数据进行后续的收发数据处理步骤，从而提高文本翻译的实时性。

步骤S206，向第一服务器发送压缩像素数据。

步骤S207，接收第一服务器返回的链接信息，链接信息用于表征压缩像素数据的下载地址。

步骤S208，向第二服务器发送链接信息。

步骤S209，接收第二服务器发送的翻译数据。

在一种可能的实现方式中，服务器包括第一服务器和第二服务器，其中，第一服务器为存储服务器，用于存储终端设备上传的压缩像素数据，并生成下载地址，通过访问该下载地址，可以实现对压缩像素数据的下载；第二服务器为翻译服务器，用于对图像中的文本进行识别和翻译，并输出对应的翻译数据。其中，第一服务器和第二服务器，可以是对应不同实体的设备，例如通过网络通讯的分布式的服务器，也可以是运行与同一个服务器集群中的两个计算节点，或者部署于云平台中的两个计算单元，即第一服务器和第二服务器，可以通过一个实体设备实现，也可以通过两个或多个实体设备实现，此处不对此进行限制。

本实施例中，终端设备向第一服务器发送压缩像素数据，利用第一服务器的存储资源，存储该压缩像素数据并生成用于访问和下载该压缩像素数据的下载地址，之后终端设备将该下载地址在发送至第二服务器，利用第二服务器的计算资源对压缩像素数据进行识别和翻译，生成翻译数据。通过充分利用第一服务器(存储服务器)和第二服务器(翻译服务器)的设备特性，分别处理数据存储和计算的过程，降低网络资源的消耗，提高服务器的数据处理效率。

步骤S210，基于翻译数据对第一像素数据进行渲染，得到第二像素数据，并显示第二像素数据，其中，第二像素数据表征包含第二文本的图像。

本实施例中，步骤S210的实现方式与本申请图2所示实施例中的步骤S103的实现方式相同，在此不再一一赘述。

图5为本申请一个实施例提供的游戏文本翻译方法的流程图，应用于服务器，如图5所示，本实施例提供的游戏文本翻译方法包括以下几个步骤：

步骤S301，接收终端设备上传的第一像素数据，第一像素数据表征包含第一文本的图像，第一文本为基于第一语言的目标文本。

示例性地，本实施例中，服务器可以为普通服务器，服务器集群或者云服务器。服务器具有相应的存储资源和计算资源，并通过网络与终端设备通信并进行数据交互。更具体地，服务器可以为终端设备上运行的游戏客户端所对应的游戏服务端所在的服务器，终端设备通过游戏客户端向游戏服务端所在的服务器发送第一像素数据或者第一像素数据对应的下载地址，服务器通过接收该第一像素数据，或者根据下载地址获取该第一像素数据后，对该第一像素数据进行处理，输出并返回对应的处理结果，即翻译数据。其中，第一像素数据的具体实现方式，在图2-图4所示实施例中已进行介绍，此处不再赘述。

步骤S302，根据第一像素数据，以及目标文字识别模型，生成翻译数据，其中，翻译数据用于表征第二文本，第二文本为基于第二语言的目标文本。

示例性地，服务器在获取第一像素数据，通过设置在服务器内的目标文字识别模型，对第一像素数据进行处理，从而实现对第一像素数据所表征的图像中的文字的识别、翻译，生成翻译数据的过程。其中，目标文字识别模型是在基于预训练的通用文字识别模型的基础上，利用游戏场景数据，例如游戏内的图片、游戏中的常用文字和词组进行微调(Fine-tune)后生成的。相对于通用的文字识别模型，基于游戏场景数据微调后的目标文字识别模型能够更好的识别和翻译第一像素数据对应的第一文本，是生成的翻译数据更加准确。其中，本实施例中翻译数据的具体实现方式，在图2-图4所示实施例中已进行介绍，此处不再赘述。

步骤S303，向终端设备发送翻译数据，其中，翻译数据用于对第一像素数据进行渲染后得到第二像素数据，第二像素数据表征包含第二文本的图像。

示例性地，在生成翻译数据后，向终端设备返回该翻译数据，使终端设备能够基于翻译数据对第一像素数据进行渲染，生成表征包括第二文本的图像的第二像素数据，并对第二像素数据进行显示。从而，实现对游戏界面中的文本内容的翻译。其中，第一文本、第二文本的具体实现方式，在图2-图4所示实施例中已进行介绍，此处不再赘述。

本实施例中，通过接收终端设备上传的第一像素数据，第一像素数据表征包含第一文本的图像，第一文本为基于第一语言的目标文本；根据第一像素数据，以及目标文字识别模型，生成翻译数据，其中，翻译数据用于表征第二文本，第二文本为基于第二语言的目标文本；向终端设备发送翻译数据，其中，翻译数据用于对第一像素数据进行渲染后得到第二像素数据，第二像素数据表征包含第二文本的图像。实现了基于服务器的在线游戏文本的翻译，由于服务器内的目标文字识别模型在训练和微调完毕后，能够更好的匹配游戏中出现的文本内容，从而实现更好的文字识别、翻译的准确性，相比在终端设备一侧执行文字识别和翻译的过程，能够更加方便的对目标文字识别模型进行调整，也更加容易适配不同的游戏，降低游戏维护成本，提高文字翻译的准确性。

图6为本申请另一个实施例提供的游戏文本翻译方法的流程图，如图6所示，本实施例提供的游戏文本翻译方法在图5所示实施例提供的游戏文本翻译方法的基础上，对步骤S302进一步细化，并增加了通过训练得到目标文字识别模型的步骤，对则本实施例提供的游戏文本翻译方法包括以下几个步骤：

步骤S401，使用预设的图像样本生成脚本，生成字体标注样本，其中，字体标注样本包括多张标注图片，以及标注图片对应的文字内容，和/或标注图片对应的文字位置。

步骤S402，根据字体标注样本，对预设的初始文字识别模型进行预训练，生成目标文字识别模型。

示例性地，图像样本生成脚本是一种脚本(Script)程序或文件，当图像样本生成脚本被执行时，服务器会执行若干操作，以生成多张图片以及对应的标定信息，即标注图片对应的文字内容，和/或标注图片对应的文字位置。更具体地，例如，通过执行图像样本生成脚本，随机生成不同大小，不同字体、不同背景、不同长度以及包括不同文字的UTF-8字符图像，各字符图像对应有对该字符图像中所包含的字符的描述，以及字符在图像中的位置框。可选地，在对各字符图像其进行例如镜像和反色扩充等预处理后，生成包含多组标注图片的字体标注样本。

示例性地，初始文字识别模型包括Tesseract引擎。其中，Tesseract引擎是现有技术中一种开源的多语种OCR引擎，用于图像中的文字识别。

通过字体标注样本，对Tesseract引擎进行预训练，由于Tesseract引擎本身即为预训练的模型，本实施例中根据字体标注样本对Tesseract引擎再次进行预训练，也可以称为对Tesseract引擎的微调(Fine-tune)。具体地，通过获取预设的常用词库，常用词库包含针对游戏客户端的常用字；根据常用词库，对包含常用词库中的常用字的字体标注样本进行加权训练，即将常用词库加入Tesseract引擎的wordlist词典库进行训练，使Tesseract引擎的微调过程中，Tesseract的长短期记忆网络(Long Short-Term Memory,LSTM)模型会偏向于根据上下文对模糊的同形字按词库加权，减少特定场景下对于特定语言的误识情况，提高Tesseract引擎的在游戏场景中的文字识别效果。

更加具体地，对Tesseract引擎进行微调的步骤包括：利用文字转图片(text2image)工具将上述脚本生成的字体标注样本进行语料转化，并加载开源的预训练模型，再加载语料文件列表，使用wordlist参数加载词典库，执行Tesseract的训练脚本lstmtraining，进行微调训练，训练结果会得到具有识别黑底白字、艺术字、花背景的Tesseract引擎，即目标文字识别模型。其中，训练脚本lstmtraining和wordlist参数为Tesseract引擎中预设的指令，具体使用方法为现有技术，此处不对此进行赘述。对通过对Tesseract引擎的微调，可以强化Tesseract引擎对正反色、艺术字、背景非纯色等情况的处理能力。

示例性地，初始文字识别模型中还可以包括预训练的连接文本提议网络(Connectionist Text Proposal Network，CTPN)模型，CTPN模型是现有技术中一种深度学习模型，用于检测图像中的水平文字所在的位置。

通过字体标注样本，获得多张游戏客户端对应的游戏场景下截图产生的有正确标注(Ground Truth)的文字坐标的图片，并基于这些图片对CTPN模型的进行预训练，基于与Tesseract引擎的预训练过程类似的原因，该过程也可成为对CTPN模型的微调(Fine-tune)。

更加具体地，对Tesseract引擎进行微调的步骤包括：使用游戏场景下截图产生的有正确标注(Ground Truth)的文字坐标的图片，利用Tensorflow还原CTPN的模型，将开源的COCOTEXT英文检测模型作为权重起点进行微调，得到可以准确标注所提供游戏内的多语言文本的感兴趣区域(Region Of Interest，ROI)的CTPN的模型。其中，COCOTEXT英文检测模型和Tensorflow为现有技术中的软件库和模型，此处不再对其具体使用方法进行赘述。

进而，将微调后的Tesseract引擎和CTPN模型，确定为目标文字识别模型，进行后续的文字识别步骤。

步骤S403，接收终端设备上传的第一像素数据，第一像素数据表征包含第一文本的图像，第一文本为基于第一语言的目标文本。

步骤S404，对第一像素数据进行预处理。

示例性地，对第一像素数据进行预处理的步骤包括以下至少一种：背景去噪处理、边缘保留处理、图像锐化处理、灰度化处理。

其中，示例性地，通过OpenCV提供的双边滤波函数进行背景去噪处理和边缘保留处理，通过Sobel算子做图像锐化处理。灰度化处理即对图片进行灰度值计算，并将图片转换为灰度图。上述过程为现有技术，此处不再赘述。通过对第一像素数据进行预处理，结合微调后的Tesseract引擎和CTPN模型，可以提高微调后的Tesseract引擎和CTPN模型的文字识别效率和识别精度。

步骤S405，基于目标文字识别模型，对第一像素数据进行文字识别，获取第一像素数据对应的第一文本。

示例性地，目标文字识别模型包括CTPN模型和Tesseract引擎；如图7所示，示例性地，步骤S405包括步骤S4051、步骤S4052两个具体的实现步骤：

S4051，基于CTPN模型，对第一像素数据进行文字定位，获取第一像素数据中各文字的坐标。

S4052，基于Tesseract引擎以及第一像素数据对应的各文字的坐标，对第一像素数据进行文字识别，得到取第一像素数据对应的第一文本。

本实施例中，由于目标文字识别模型中的CTPN模型和Tesseract引擎均基于场景数据，以及游戏客户端对应的游戏截图进行过预训练(微调)，因此，CTPN模型和Tesseract引擎能够更好的适应游戏客户端中文字的字体、背景等因素的干扰，从而提高字体的识别效率和识别精度，进而实现游戏文本的准确翻译。

步骤S406，基于第一像素数据对应的第一文本进行语言转换处理，生成翻译数据。

如图8所示，示例性地，步骤S406包括步骤S4061、S4062和S4063三个具体的实现步骤：

S4061，调用预设的翻译引擎，对第一像素数据对应的第一文本进行语言转换处理，生成第一翻译信息，第一翻译信息用于表征第二文本中的各文字。

S4062，根据第一像素数据中各文字的坐标，生成第二翻译信息，第二翻译信息用于表征第一文本在第一像素数据对应的图像中的位置。

S4063，根据第一翻译信息和第二翻译信息，生成翻译数据。

示例性地，在获取第一像素数据对应的第一文本后，通过预设的翻译引擎第一文本进行语言转换处理，得到基于第二语言的目标文本，即第一翻译信息。同时，根据第一文本对应的各文字的坐标，确定第一文本在第一像素数据中所处的位置，生成第二翻译信息，由于翻译后的第二文本的长度可能与第一文本的长度不一致，为了将翻译后的第二文本准确的显示在第一文本所在位置，需要确定该第一文本的位置。其中，第二翻译信息即用于表征第一文本在第一像素数据对应的图像中的位置的信息。更具体地，第二翻译信息可以通过第一文本的开始位置，以及第一文本的长度或结束位置，来描述第一文本在第一像素数据对应的图像中的位置。

其中，调用翻译引擎进行文本翻译的过程，为现有技术，此处不再进行赘述。

步骤S407，向终端设备发送翻译数据，其中，翻译数据用于对第一像素数据进行渲染后得到第二像素数据，第二像素数据表征包含第二文本的图像。

为更好的说明申请实施例提供的游戏文本翻译方法的实现过程，下面以一个更具体的实施例进行说明。图9为申请实施例提供的一种执行游戏文本翻译方法的终端设备与服务器之间的信令示意图，如图9所示，本实施例提供的游戏文本翻译方法包括以下步骤：

S501，服务器使用预设的图像样本生成脚本，生成字体标注样本，其中，字体标注样本包括多张标注图片，以及标注图片对应的文字内容，和/或标注图片对应的文字位置。

S502，服务器根据字体标注样本，对预设的初始文字识别模型进行预训练，生成目标文字识别模型。

S503，终端设备在游戏客户端启动时，开启屏幕录制功能，以在游戏客户端运行过程中，生成游戏客户端显示的游戏界面对应的截图数据。

S504，终端设备接收翻译请求指令。

S505，终端设备响应翻译请求指令，获取缓存在终端设备内的目标截图数据，目标截图数据表征游戏客户端当前显示的游戏界面。

S506，终端设备对第一像素数据进行压缩，生成压缩像素数据。

S507，终端设备向服务器发送压缩像素数据。

S508，服务器对压缩像素数据进行预处理。

S509，服务器基于目标文字识别模型，对预处理后的压缩像素数据进行文字识别，获取第一像素数据对应的第一文本。

S510，服务器基于第一像素数据对应的第一文本进行语言转换处理，生成翻译数据，翻译数据中包括第一翻译信息和第二翻译信息。

S511，服务器向终端设备发送翻译数据。

S512，终端设备根据第二翻译信息，确定待渲染坐标，待渲染坐标表征第二文本在第二像素数据对应的图像中的位置。

S513，终端设备根据待渲染坐标以及第一翻译信息，将第二文本中的各文字，覆盖渲染至第一像素数据对应的图像，得到第二像素数据。

S514，终端设备在游戏客户端显示第二像素数据。

图10为本申请一个实施例提供的游戏文本翻译装置的结构示意图，应用于终端设备，如图10所示，本实施例提供的游戏文本翻译装置6包括：

获取模块61，用于获取第一像素数据，第一像素数据表征包含第一文本的图像，第一文本为基于第一语言的目标文本；

收发模块62，用于向服务器发送第一像素数据，第一像素数据用于生成翻译数据，并接收服务器返回的翻译数据，其中，翻译数据用于表征第二文本，第二文本为基于第二语言的目标文本；

渲染模块63，用于基于翻译数据对第一像素数据进行渲染，得到第二像素数据，并显示第二像素数据，其中，第二像素数据表征包含第二文本的图像。

在一种可能的实现方式中，翻译数据包括第一翻译信息和第二翻译信息，其中，第一翻译信息用于表征第二文本中的各文字，第二翻译信息用于表征第一文本在第一像素数据对应的图像中的位置；渲染模块63在基于翻译数据对第一像素数据进行渲染，得到第二像素数据时，具体用于：根据第二翻译信息，确定待渲染坐标，待渲染坐标表征第二文本在第二像素数据对应的图像中的位置；根据待渲染坐标以及第一翻译信息，将第二文本中的各文字，覆盖渲染至第一像素数据对应的图像，得到第二像素数据。

在一种可能的实现方式中，服务器包括第一服务器和第二服务器，收发模块62在向服务器发送第一像素数据时，具体用于：向第一服务器发送第一像素数据；接收第一服务器返回的链接信息，链接信息用于表征第一像素数据的下载地址；向第二服务器发送链接信息；收发模块在接收服务器返回的翻译数据时，具体用于：接收第二服务器发送的翻译数据。

在一种可能的实现方式中，收发模块62在向第一服务器发送第一像素数据之前，还用于：对第一像素数据进行压缩，生成压缩像素数据；收发模块在向第一服务器发送第一像素数据时，具体用于：向第一服务器发送压缩像素数据。

在一种可能的实现方式中，终端设备内运行有游戏客户端，获取模块61，具体用于：接收翻译请求指令；响应翻译请求指令，获取缓存在终端设备内的目标截图数据，目标截图数据表征游戏客户端当前显示的游戏界面；根据目标截图数据，生成第一像素数据。

在一种可能的实现方式中，获取模块61在接收翻译请求指令之前，还用于：在游戏客户端启动时，开启屏幕录制功能，以在游戏客户端运行过程中，生成游戏客户端显示的游戏界面对应的截图数据。

其中，获取模块61、收发模块62和渲染模块63依次连接。本实施例提供的游戏文本翻译装置6可以执行如图2-图4所示的方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图11为本申请一个实施例提供的游戏文本翻译装置的结构示意图，应用于服务器，如图11所示，本实施例提供的游戏文本翻译装置7包括：

接收模块71，用于接收终端设备上传的第一像素数据，第一像素数据表征包含第一文本的图像，第一文本为基于第一语言的目标文本；

生成模块72，用于根据第一像素数据，以及目标文字识别模型，生成翻译数据，其中，翻译数据用于表征第二文本，第二文本为基于第二语言的目标文本；

发送模块73，用于向终端设备发送翻译数据，其中，翻译数据用于对第一像素数据进行渲染后得到第二像素数据，第二像素数据表征包含第二文本的图像。

在一种可能的实现方式中，生成模块72，具体用于：基于目标文字识别模型，对第一像素数据进行文字识别，获取第一像素数据对应的第一文本；基于第一像素数据对应的第一文本进行语言转换处理，生成翻译数据。

在一种可能的实现方式中，目标文字识别模型包括预训练的连接文本提议网络CTPN模型和预训练的Tesseract引擎；生成模块72在基于目标文字识别模型，对第一像素数据进行文字识别，获取第一像素数据对应的第一文本时，具体用于：基于CTPN模型，对第一像素数据进行文字定位，获取第一像素数据中各文字的坐标；基于Tesseract引擎以及第一像素数据对应的各文字的坐标，对第一像素数据进行文字识别，得到取第一像素数据对应的第一文本。

在一种可能的实现方式中，生成模块72在基于第一像素数据对应的第一文本进行语言转换处理，生成翻译数据时，具体用于：调用预设的翻译引擎，对第一像素数据对应的第一文本进行语言转换处理，生成第一翻译信息，第一翻译信息用于表征第二文本中的各文字；根据第一像素数据中各文字的坐标，生成第二翻译信息，第二翻译信息用于表征第一文本在第一像素数据对应的图像中的位置；根据第一翻译信息和第二翻译信息，生成翻译数据。

在一种可能的实现方式中，生成模块72在在根据第一像素数据，生成翻译数据之前，还用于：通过以下至少一种方式对第一像素数据进行预处理：背景去噪处理、边缘保留处理、图像锐化处理、灰度化处理。

在一种可能的实现方式中，在接收终端设备上传的第一像素数据之前，生成模块72，还用于：使用预设的图像样本生成脚本，生成字体标注样本，其中，字体标注样本包括多张标注图片，以及标注图片对应的文字内容，和/或标注图片对应的文字位置；根据字体标注样本，对预设的初始文字识别模型进行预训练，生成目标文字识别模型。

在一种可能的实现方式中，初始文字识别模型包括Tesseract引擎，生成模块72在根据字体标注样本，对预设的初始文字识别模型进行预训练，生成目标文字识别模型时，具体用于：获取预设的常用词库，常用词库包含针对游戏客户端的常用字；根据常用词库，对包含常用词库中的常用字的字体标注样本进行加权训练，生成目标文字识别模型。

其中，接收模块71、生成模块72和发送模块73依次连接。本实施例提供的游戏文本翻译装置7可以执行如图5-图6所示的方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图12为本申请一个实施例提供的电子设备的示意图，如图12所示，本实施例提供的电子设备8包括：存储器81，处理器82以及计算机程序。

其中，计算机程序存储在存储器81中，并被配置为由处理器82执行以实现本申请图2-图4所对应的实施例中任一实施例提供的游戏文本翻译方法。

其中，存储器81和处理器82通过总线83连接。

相关说明可以对应参见图2-图4所对应的实施例中的步骤所对应的相关描述和效果进行理解，此处不做过多赘述。

图13为本申请一个实施例提供的电子设备的示意图，如图13所示，本实施例提供的电子设备9包括：存储器91，处理器92以及计算机程序。

其中，计算机程序存储在存储器91中，并被配置为由处理器92执行以实现本申请图5-图8所对应的实施例中任一实施例提供的游戏文本翻译方法。

其中，存储器91和处理器92通过总线93连接。

相关说明可以对应参见图5-图8所对应的实施例中的步骤所对应的相关描述和效果进行理解，此处不做过多赘述。

本申请一个实施例提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行以实现本申请图2-图8所对应的实施例中任一实施例提供的游戏文本翻译方法。

其中，计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本申请一个实施例提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现本申请图2-图8所对应的实施例中任一实施例提供的游戏文本翻译方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

本领域技术人员在考虑说明书及实践这里公开的申请后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由下面的权利要求书指出。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims

1.一种游戏文本翻译方法，其特征在于，应用于终端设备，所述方法包括：

获取第一像素数据，所述第一像素数据表征包含第一文本的图像，所述第一文本为基于第一语言的目标文本；

向服务器发送所述第一像素数据，所述第一像素数据用于生成翻译数据，并接收所述服务器返回的所述翻译数据，其中，所述翻译数据用于表征第二文本，所述第二文本为基于第二语言的所述目标文本，所述翻译数据为所述服务器根据所述第一像素数据以及目标文字识别模型所生成的，所述目标文字识别模型是在基于预训练的初始文字识别模型的基础上，利用游戏场景数据进行微调后生成的，所述游戏场景数据包括游戏内的图片、游戏中的常用文字和词组，所述初始文字识别模型包括Tesseract引擎和连接文本提议网络CTPN模型；

基于所述翻译数据对所述第一像素数据进行渲染，得到第二像素数据，并显示所述第二像素数据，其中，所述第二像素数据表征包含所述第二文本的图像。

2.根据权利要求1所述的方法，其特征在于，所述翻译数据包括第一翻译信息和第二翻译信息，其中，所述第一翻译信息用于表征所述第二文本中的各文字，所述第二翻译信息用于表征所述第一文本在所述第一像素数据对应的图像中的位置；

基于所述翻译数据对所述第一像素数据进行渲染，得到第二像素数据，包括：

根据所述第二翻译信息，确定待渲染坐标，所述待渲染坐标表征所述第二文本在所述第二像素数据对应的图像中的位置；

根据所述待渲染坐标以及所述第一翻译信息，将所述第二文本中的各文字，覆盖渲染至所述第一像素数据对应的图像，得到第二像素数据。

3.根据权利要求1所述的方法，其特征在于，所述服务器包括第一服务器和第二服务器，所述向服务器发送所述第一像素数据，包括：

向所述第一服务器发送所述第一像素数据；

接收所述第一服务器返回的链接信息，所述链接信息用于表征所述第一像素数据的下载地址；

向所述第二服务器发送所述链接信息；

所述接收所述服务器返回的所述翻译数据，包括：

接收所述第二服务器发送的所述翻译数据。

4.根据权利要求3所述的方法，其特征在于，在向所述第一服务器发送所述第一像素数据之前，还包括：

对所述第一像素数据进行压缩，生成压缩像素数据；

向所述第一服务器发送所述第一像素数据，包括：

向所述第一服务器发送所述压缩像素数据。

5.根据权利要求1-4任一项所述的方法，其特征在于，所述终端设备内运行有游戏客户端，获取第一像素数据，包括：

接收翻译请求指令；

响应所述翻译请求指令，获取缓存在终端设备内的目标截图数据，所述目标截图数据表征所述游戏客户端当前显示的游戏界面；

根据所述目标截图数据，生成所述第一像素数据。

6.根据权利要求5所述的方法，其特征在于，在接收翻译请求指令之前，所述方法还包括：

在所述游戏客户端启动时，开启屏幕录制功能，以在所述游戏客户端运行过程中，生成所述游戏客户端显示的游戏界面对应的截图数据。

7.一种游戏文本翻译方法，其特征在于，应用于服务器，所述方法包括：

接收终端设备上传的第一像素数据，所述第一像素数据表征包含第一文本的图像，所述第一文本为基于第一语言的目标文本；

根据所述第一像素数据，以及目标文字识别模型，生成翻译数据，其中，所述翻译数据用于表征第二文本，所述第二文本为基于第二语言的所述目标文本，所述目标文字识别模型是在基于预训练的初始文字识别模型的基础上，利用游戏场景数据进行微调后生成的，所述游戏场景数据包括游戏内的图片、游戏中的常用文字和词组，所述初始文字识别模型包括Tesseract引擎和连接文本提议网络CTPN模型；

向所述终端设备发送所述翻译数据，其中，所述翻译数据用于对所述第一像素数据进行渲染后得到第二像素数据，所述第二像素数据表征包含所述第二文本的图像。

8.根据权利要求7所述的方法，其特征在于，根据所述第一像素数据，以及目标文字识别模型，生成翻译数据，包括：

基于所述目标文字识别模型，对所述第一像素数据进行文字识别，获取所述第一像素数据对应的第一文本；

基于所述第一像素数据对应的第一文本进行语言转换处理，生成所述翻译数据。

9.根据权利要求8所述的方法，其特征在于，所述目标文字识别模型包括预训练的连接文本提议网络CTPN模型和预训练的Tesseract引擎；基于所述目标文字识别模型，对所述第一像素数据进行文字识别，获取所述第一像素数据对应的第一文本，包括：

基于所述CTPN模型，对所述第一像素数据进行文字定位，获取所述第一像素数据中各文字的坐标；

基于所述Tesseract引擎以及所述第一像素数据对应的各文字的坐标，对所述第一像素数据进行文字识别，得到所述取所述第一像素数据对应的第一文本。

10.根据权利要求8所述的方法，其特征在于，基于所述第一像素数据对应的第一文本进行语言转换处理，生成所述翻译数据，包括：

调用预设的翻译引擎，对所述第一像素数据对应的第一文本进行语言转换处理，生成第一翻译信息，所述第一翻译信息用于表征所述第二文本中的各文字；

根据所述第一像素数据中各文字的坐标，生成第二翻译信息，所述第二翻译信息用于表征所述第一文本在所述第一像素数据对应的图像中的位置；

根据所述第一翻译信息和所述第二翻译信息，生成所述翻译数据。

11.根据权利要求7所述的方法，其特征在于，在根据所述第一像素数据，生成翻译数据之前，所述方法还包括：

通过以下至少一种方式对所述第一像素数据进行预处理：

背景去噪处理、边缘保留处理、图像锐化处理、灰度化处理。

12.根据权利要求7所述的方法，其特征在于，在接收终端设备上传的第一像素数据之前，所述方法还包括：

使用预设的图像样本生成脚本，生成字体标注样本，其中，所述字体标注样本包括多张标注图片，以及所述标注图片对应的文字内容，和/或所述标注图片对应的文字位置；

根据所述字体标注样本，对预设的初始文字识别模型进行预训练，生成所述目标文字识别模型。

13.根据权利要求12所述的方法，其特征在于，所述初始文字识别模型包括Tesseract引擎，根据所述字体标注样本，对预设的初始文字识别模型进行预训练，生成所述目标文字识别模型，包括：

获取预设的常用词库，所述常用词库包含针对游戏客户端的常用字；

根据所述常用词库，对包含所述常用词库中的常用字的字体标注样本进行加权训练，生成所述目标文字识别模型。

14.一种电子设备，其特征在于，包括：存储器，处理器以及计算机程序；

其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如权利要求1至13中任一项所述的游戏文本翻译方法。

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1至13任一项所述的游戏文本翻译方法。