WO2022095735A1

WO2022095735A1 - 应用程序多语言支持方法、装置、计算机设备及存储介质

Info

Publication number: WO2022095735A1
Application number: PCT/CN2021/125952
Authority: WO
Inventors: 刘振涛
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2020-11-05
Filing date: 2021-10-25
Publication date: 2022-05-12
Also published as: CN112328348A

Abstract

本申请公开了一种应用程序多语言支持方法、装置、计算机设备及存储介质。涉及人工智能技术领域，可应用于智慧城市建设中。该方法包括：接收用户终端发送的页面翻译请求；通过预训练的目标检测模型获取页面图片包含的文字区域及其坐标；将文字区域从页面图片中分离，并识别其中的文字；将文字转换为目标语言后得到翻译文字；将翻译文字添加到页面图片中，并设置在文字区域的一侧以得到目标页面图片；将目标页面图片发送给用户终端。

Description

应用程序多语言支持方法、装置、计算机设备及存储介质

本申请要求于2020年11月05日提交中国专利局、申请号为202011223224.0、申请名称为“应用程序多语言支持方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种应用程序多语言支持方法、装置、计算机设备及存储介质。

背景技术

如果应用程序/系统需要国际化或者说多语言化，不管是Web程序、窗体程序还是移动应用程序通常都会使用资源文件来定义，并通过切换线程的使用语言来实现。如果是图片文字，则需要准备多个语言版本的图片切图。发明人发现，当前微服务应用非常广泛，一个系统/平台往往包含很多个微服务。如需实现多语言化，则需要每个服务应用都要维护一套多语言，而且服务之间调用码值、话术文本不统一，造成很大的维护成本和对接困难，同时还会使得应用程序的代码十分冗余庞大，运行时占用大量内存。

发明内容

本申请实施例提供了一种应用程序多语言支持方法、装置、计算机设备及存储介质，旨在解决现有应用程序多语言方案导致应用程序代码庞大，占用内存多的问题。

第一方面，本申请实施例提供了一种应用程序多语言支持方法，其包括：

接收用户终端发送的页面翻译请求，所述页面翻译请求包括页面图片以及目标语言；

通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，所述目标检测模型由标注了文字区域的页面样本图片训练得到；

将所述文字区域从所述页面图片中分离，并通过预设的OCR文字识别插件识别所述文字区域包含的文字；

将所述文字转换为所述目标语言后得到翻译文字；

将所述翻译文字添加到所述页面图片中，并根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片；

将所述目标页面图片发送给用户终端。

第二方面，本申请实施例还提供了一种应用程序多语言支持装置，其包括：

第一接收单元，用于接收用户终端发送的页面翻译请求，所述页面翻译请求包括页面图片以及目标语言；

第一获取单元，用于通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，所述目标检测模型由标注了文字区域的页面样本图片训练得到；

识别单元，用于将所述文字区域从所述页面图片中分离，并通过预设的OCR文字识别插件识别所述文字区域包含的文字；

转换单元，用于将所述文字转换为所述目标语言后得到翻译文字；

第一添加单元，用于将所述翻译文字添加到所述页面图片中，并根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片；

第一发送单元，用于将所述目标页面图片发送给用户终端。

第三方面，本申请实施例还提供了一种计算机设备，其包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现如下步骤：

将所述文字转换为所述目标语言后得到翻译文字；

将所述目标页面图片发送给用户终端。

第四方面，本申请实施例还提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序当被处理器执行时可实现如下步骤：

将所述文字转换为所述目标语言后得到翻译文字；

将所述目标页面图片发送给用户终端。

本申请实施例提供了一种应用程序多语言支持方法、装置、计算机设备及存储介质，通过接收用户终端发送的页面翻译请求，所述页面翻译请求包括页面图片以及目标语言；通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，所述目标检测模型由标注了文字区域的页面样本图片训练得到；将所述文字区域从所述页面图片中分离，并通过预设的OCR文字识别插件识别所述文字区域包含的文字；将所述文字转换为所述目标语言后得到翻译文字；将所述翻译文字添加到所述页面图片中，并根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片；将所述目标页面图片发送给用户终端，实现了统一的多语言管理，避免了在终端侧进行多语言维护，终端处无需设置多语言库，无需进行语言版本的调换，从而简化了终端的代码，减少了应用程序的内存占用，提高了应用程序的运行速度。通过预训练的目标检测模型定位页面图片中文字区域的位置，然后将文字区域从页面图片中分离出来，可有效避免无效背景对文字识别的干扰，提高识别的准确性。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种应用程序多语言支持方法的一种应用场景示意图；

图2为本申请实施例提供的一种应用程序多语言支持方法的流程示意图；

图3为本申请实施例提供的一种应用程序多语言支持方法的子流程示意图；

图4为本申请实施例提供的一种应用程序多语言支持方法的子流程示意图；

图5为本申请实施例提供的一种应用程序多语言支持方法的子流程示意图；

图6为本申请实施例提供的一种应用程序多语言支持方法的子流程示意图；

图7为本申请实施例提供的一种应用程序多语言支持方法的子流程示意图；

图8为本申请实施例提供的一种应用程序多语言支持装置的示意性框图；

图9为本申请实施例提供的一种应用程序多语言支持装置的第一获取单元的示意性框图；

图10为本申请实施例提供的一种应用程序多语言支持装置的识别单元的示意性框图；

图11为本申请实施例提供的一种应用程序多语言支持装置的转换单元的示意性框图；

图12为本申请实施例提供的一种应用程序多语言支持装置的判断单元的示意性框图；

图13为本申请实施例提供的一种应用程序多语言支持装置的第一添加单元的示意性框图；

图14为本申请实施例提供的一种计算机设备的示意性框图；

图15为本申请实施例提供的目标页面图片的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参阅图1和图2，图1为本申请实施例提供的应用程序多语言支持方法的应用场景示意图。图2为本申请实施例提供的应用程序多语言支持方法的示意性流程图。所述应用程序多语言支持方法应用于服务器2中。服务器2接收用户终端1发送的页面翻译请求，所述页面翻译请求包括页面图片以及目标语言；服务器2通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，所述目标检测模型由标注了文字区域的页面样本图片训练得到；服务器2将所述文字区域从所述页面图片中分离，并通过预设的OCR文字识别插件识别所述文字区域包含的文字；服务器2将所述文字转换为所述目标语言后得到翻译文字；将所述翻译文字添加到所述页面图片中，并根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片；服务器2将所述目标页面图片发送给用户终端1。

图2是本申请实施例提供的应用程序多语言支持方法的流程示意图。如图所示，该方法包括以下步骤S1-S6。

S1，接收用户终端发送的页面翻译请求，所述页面翻译请求包括页面图片以及目标语言。

具体实施中，在需要对应用的页面进行翻译时，用户向用户终端输入翻译指令。用户终端弹出语言列表。用户选中目标语言。之后用户终端截取当前的页面图片，并向服务器发送页面翻译请求，所述页面翻译请求包括页面图片、以及目标语言。

相应地，服务器接收用户终端发送的页面翻译请求。所述页面翻译请求包括页面图片以及目标语言。

S2，通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，所述目标检测模型由标注了文字区域的页面样本图片训练得到。

目标检测模型可例如为YOLO。YOLO(You Only Look Once)是一种基于深度神经网络的目标检测模型。YOLO的版本目前总共有三种，分别为YOLO V1、YOLO V2以及YOLO V3。

需要说明的是，YOLO仅仅是目标检测模型的一个示例，本领域技术人员还可以采用其他目标检测模型，则并不会超出本申请的保护范围。

首先，预先通过大量经过标注文字区域的页面图片来对目标检测模型进行训练，使得目标检测模型具有识别文字区域的能力。可以理解地，训练样本越多，目标检测模型的识别效果越好。

之后，将所述页面图片输入到训练后的目标检测模型中，以通过训练后的目标检测模型来检测识别页面图片中的文字区域，并标注文字区域的坐标。

参见图3，在一实施例中，以上步骤S2具体包括如下步骤S21-S22。

S21，获取所述页面图片的特征图，并将所述特征图输入所述目标检测模型中。

具体实施中，获取所述页面图片的特征图，并将所述特征图输入所述目标检测模型中。

页面图片是由多个像素组成的，像素的颜色由红(Red)、绿(Green)、蓝(Blue)三原色的色光以不同的比例相加得到。则每个像素可表示为(a，b，c)，其中a为红的比例，b为绿的比例，c为蓝的比例。则分别提取每个像素的a、b、c值可得到三个特征矩阵。此三个特征矩阵组成的三维张量即为页面图片的特征图。特征图为目标检测模型能够识别的数据。

S22，接收所述目标检测模型输出的检测结果，所述检测结果包含所述目标检测模型在所述页面图片中检测到的文字区域以及文字区域的坐标。

具体实施中，接收所述目标检测模型输出的检测结果，所述检测结果包含所述目标检测模型在所述页面图片中检测到的文字区域以及文字区域的坐标。

文字区域的坐标可通过位置特征向量A(x，y，w，h)表示。其中，(x，y)为文字区域中心的坐标。w为文字区域的宽度。h为文字区域的高度。

S3，将所述文字区域从所述页面图片中分离，并通过预设的OCR文字识别插件识别所述文字区域包含的文字。

具体实施中，将所述文字区域从所述页面图片中裁剪分离出来得到文字区域图片，从而可去除页面图片中没有文字的背景，避免背景的干扰。

在裁剪出文字区域得到文字区域图片后，通过OCR(Optical Character Recognition，光学字符识别)扫描的方式获取所述文字区域图片包含的文字。

需要说明的是，在剪裁页面图片之前，会对页面图片做备份。

参见图4，在一实施例中，以上步骤S3具体包括如下步骤S31-S32。

S31，将所述文字区域输入到预设的OCR文字识别插件中。

具体实施中，将所述页面图片输入到预设的OCR文字识别插件中。以由OCR文字识别插件来扫描，获取所述页面图片包含的文字。

OCR文字识别插件，是一种利用OCR(Optical Character Recognition，光学字符识别)技术，识别图片、照片上的文字以及定位文字坐标的插件。

S32，接收所述OCR文字识别插件输出的文字识别结果，所述文字识别结果包含从所述文字区域中识别到的文字。

具体实施中，接收所述OCR文字识别插件输出的文字识别结果，所述文字识别结果包含从所述文字区域中识别到的文字。并从所述OCR文字识别插件输出的文字识别结果中提取文字。

S4，将所述文字转换为所述目标语言后得到翻译文字。

具体实施中，将所述文字转换为所述目标语言后得到翻译文字。

具体地，如果所述页面图片中包含多处文字，则逐一对各文字进行翻译。或者采用多线程技术同时对多个文字进行翻译。

可通过翻译模型或者翻译插件来对文字进行翻译，或者采用其他方式来对文字进行翻译，对此，本申请不作具体限定。

参见图5，在一实施例中，以上步骤S4具体包括如下步骤：S41-S44。

S41，判断预设的多语言库中是否存在所述文字对应所述目标语言的翻译文字。

具体实施中，判断预设的多语言库中是否存在所述文字对应所述目标语言的翻译文字。

需要说明的是，多语言库是指用于储存页面图片中的文字的多种语言的翻译结果的数据库。多语言库预先由运维人员建立，并实时更新。

参见图6在一实施例中，以上步骤S41具体包括如下步骤：S311-S313。

S411，向所述多语言库发送查询请求，所述查询请求包含所述文字以及所述目标语言。

具体实施中，向所述多语言库发送查询请求，所述查询请求包含所述文字以及所述目标语言。

多语言库在接收到所述查询请求时，请查询是否存在所述文字对应所述目标语言的翻译文字。

若存在，多语言库向服务器返回查询结果。若不存在，多语言库向服务器返回无查询结果提示消息。

S412，若接收到所述多语言库返回的查询结果，则判定所述多语言库中存在所述文字对应所述目标语言的翻译文字。

具体实施中，如果接收到所述多语言库返回的查询结果，则判定所述多语言库中存在所述文字对应所述目标语言的翻译文字。

S413，若接收到所述多语言库返回的无查询结果提示消息，则判定所述多语言库中不存在所述文字对应所述目标语言的翻译文字。

具体实施中，若接收到所述多语言库返回的无查询结果提示消息，则判定所述多语言库中不存在所述文字对应所述目标语言的翻译文字。

S42，若所述多语言库中存在所述文字对应所述目标语言的翻译文字，则从所述多语言库中获取所述文字对应所述目标语言的翻译文字。

具体实施中，若所述多语言库中存在所述文字对应所述目标语言的翻译文字，则从所述多语言库中获取所述文字对应所述目标语言的翻译文字。

具体地，从所述多语言库返回的查询结果中查询所述文字对应所述目标语言的翻译文字。

S43，若所述多语言库中不存在所述文字对应所述目标语言的翻译文字，向预设的翻译插件发送翻译请求，所述翻译请求包含所述文字以及所述目标语言。

具体实施中，若所述多语言库中不存在所述文字对应所述目标语言的翻译文字，向预设的翻译插件发送翻译请求，所述翻译请求包含所述文字以及所述目标语言。

翻译插件是指用于翻译文字的插件，例如Google翻译插件以及百度翻译插件等。需要说明的是，翻译插件通过预训练的LSTM(Long Short-Term Memory，长短期记忆网络)模型来实现翻译工作。首先将获取文本的词向量，然后将词向量输入到LSTM模型中，以由LSTM模型预测所述文本对应目标语言的翻译结果。

S44，接收所述翻译插件返回的翻译结果，所述翻译结果包含所述文字对应所述目标语言的翻译文字。

具体实施中，接收所述翻译插件返回的翻译结果，所述翻译结果包含所述文字对应所述目标语言的翻译文字。

在一实施例中，在步骤S44之后，所述方法还包括：将所述文字对应所述目标语言的翻译文字储存到所述多语言库中。

具体实施中，将所述文字、所述目标语言以及所述文字对应所述目标语言的翻译文字储存到所述多语言库中，以实现对多语言库的更新。

之后，可直接从所述多语言库中查询所述文字对应所述目标语言的翻译文字，提高了效率。

S5，将所述翻译文字添加到所述页面图片中，并根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片。

具体实施中，将所述翻译文字添加到所述页面图片中，并根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片。由此，可让用户快速准确看到文字的翻译结果。

需要说明的是，该页面图片是指未经剪裁的页面图片(即保留了文字区域的页面图片)，页面图片原始的文字信息是保留的。

参见图7，在一实施例中，以上步骤S5具体包括如下步骤：S51-S53。

S51，根据文字区域的坐标在所述文字区域的一侧设置文本框。

具体实施中，根据文字区域的坐标在所述文字区域的一侧设置文本框。

具体地，首先根据文字区域的坐标确定文本框的坐标。然后根据文本框的坐标设置文本框。

S52，将所述翻译文字添加到所述文本框中。

具体实施中，将所述翻译文字添加到所述文本框中，以得到所述目标页面图片。

参见图15，图15展示了本申请一实施例的最终得到的目标页面图片。

S6，将所述目标页面图片发送给用户终端。

具体实施中，将所述目标页面图片发送给用户终端。

用户终端相应展示所述目标页面图片，从而用户可看到该目标页面图片，并快速准确看到文字的翻译结果。

通过应用本申请的技术方案，接收用户终端发送的页面翻译请求，所述页面翻译请求包括页面图片以及目标语言；通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，所述目标检测模型由标注了文字区域的页面样本图片训练得到；将所述文字区域从所述页面图片中分离，并通过预设的OCR文字识别插件识别所述文字区域包含的文字；将所述文字转换为所述目标语言后得到翻译文字；将所述翻译文字添加到所述页面图片中，并根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片；将所述目标页面图片发送给用户终端。本申请通过服务器实现了统一的多语言管理，避免了在终端侧进行多语言维护，终端处无需设置多语言库，无需进行语言版本的调换，从而简化了终端的代码，减少了应用程序的内存占用，提高了应用程序的运行速度。通过预训练的目标检测模型定位页面图片中文字区域的位置，然后将文字区域从页面图片中分离出来，可有效避免无效背景对文字识别的干扰，提高识别的准确性。

图8是本申请实施例提供的一种应用程序多语言支持装置70的示意性框图。如图8所示，对应于以上应用程序多语言支持方法，本申请还提供一种应用程序多语言支持装置70。该应用程序多语言支持装置70包括用于执行上述应用程序多语言支持方法的单元，该应用程序多语言支持装置70可以被配置于服务器中。具体地，请参阅图8，该应用程序多语言支持装置70包括第一接收单元71、第一获取单元72、识别单元73、转换单元74、第一添加单元75以及第一发送单元76。

第一接收单元71，用于接收用户终端发送的页面翻译请求，所述页面翻译请求包括页面图片以及目标语言；

第一获取单元72，用于通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，所述目标检测模型由标注了文字区域的页面样本图片训练得到；

识别单元73，用于将所述文字区域从所述页面图片中分离，并通过预设的OCR文字识别插件识别所述文字区域包含的文字；

转换单元74，用于将所述文字转换为所述目标语言后得到翻译文字；

第一添加单元75，用于将所述翻译文字添加到所述页面图片中，并根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片；

第一发送单元76，用于将所述目标页面图片发送给用户终端。

在一实施例中，如图9所示，所述第一获取单元72包括第一输入单元721以及第一接收单元722。

第一输入单元721，用于获取所述页面图片的特征图，并将所述特征图输入所述目标检测模型中；

第二接收单元722，用于接收所述目标检测模型输出的检测结果，所述检测结果包含所述目标检测模型在所述页面图片中检测到的文字区域以及文字区域的坐标。

在一实施例中，如图10所示，所述识别单元73包括第二输入单元731以及第三接收单元732。

第二输入单元731，用于将所述文字区域输入到预设的OCR文字识别插件中；

第三接收单元732，用于接收所述OCR文字识别插件输出的文字识别结果，所述文字识别结果包含从所述文字区域中识别到的文字。

在一实施例中，如图11所示，所述转换单元74包括判断单元741、第二获取单元742、第二发送单元743以及第四接收单元744。

判断单元741，用于判断预设的多语言库中是否存在所述文字对应所述目标语言的翻译文字；

第二获取单元742，用于若所述多语言库中存在所述文字对应所述目标语言的翻译文字，则从所述多语言库中获取所述文字对应所述目标语言的翻译文字；

第二发送单元743，用于若所述多语言库中不存在所述文字对应所述目标语言的翻译文字，向预设的翻译插件发送翻译请求，所述翻译请求包含所述文字以及所述目标语言；

第四接收单元744，用于接收所述翻译插件返回的翻译结果，所述翻译结果包含所述文字对应所述目标语言的翻译文字。

在一实施例中，如图12所示，所述判断单元741包括第三发送单元7411、第一判定单元7412以及第二判定单元7413。

第三发送单元7411，用于向所述多语言库发送查询请求，所述查询请求包含所述文字以及所述目标语言；

第一判定单元7412，用于若接收到所述多语言库返回的查询结果，则判定所述多语言库中存在所述文字对应所述目标语言的翻译文字；

第二判定单元7413，用于若接收到所述多语言库返回的无查询结果提示消息，则判定所述多语言库中不存在所述文字对应所述目标语言的翻译文字。

在一实施例中，如图13所示，所述第一添加单元75包括设置单元751以及第二添加单元752。

设置单元751，用于根据文字区域的坐标在所述文字区域的一侧设置文本框；

第二添加单元752，用于将所述翻译文字添加到所述文本框中。

需要说明的是，所属领域的技术人员可以清楚地了解到，上述应用程序多语言支持装置70和各单元的具体实现过程，可以参考前述方法实施例中的相应描述，为了描述的方便和简洁，在此不再赘述。

上述应用程序多语言支持装置70可以实现为一种计算机程序的形式，该计算机程序可以在如图14所示的计算机设备上运行。

请参阅图14，图14是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500是服务器。服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

参阅图14，该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时，可使得处理器502执行一种应用程序多语言支持方法。

该处理器502用于提供计算和控制能力，以支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行一种应用程序多语言支持方法。

该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解，图14中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现本申请实施例所描述的所述应用程序多语言支持方法。

应当理解，在本申请实施例中，处理器502可以是中央处理单元(Central ProcessingUnit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中，该存储介质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行，以实现上述方法的实施例的流程步骤。

因此，本申请还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序。该计算机程序被处理器执行时使处理器执行以上各实施例中所描述的所述应用程序多语言支持方法的步骤。

所述存储介质为实体的、非瞬时性的存储介质，例如可以是U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的实体存储介质。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种应用程序多语言支持方法，包括：

接收用户终端发送的页面翻译请求，所述页面翻译请求包括页面图片以及目标语言；

通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，所述目标检测模型由标注了文字区域的页面样本图片训练得到；

将所述文字区域从所述页面图片中分离，并通过预设的OCR文字识别插件识别所述文字区域包含的文字；

将所述文字转换为所述目标语言后得到翻译文字；

将所述翻译文字添加到所述页面图片中，并根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片；

将所述目标页面图片发送给用户终端。
根据权利要求1所述的应用程序多语言支持方法，其中，所述通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，包括：

获取所述页面图片的特征图，并将所述特征图输入所述目标检测模型中；

接收所述目标检测模型输出的检测结果，所述检测结果包含所述目标检测模型在所述页面图片中检测到的文字区域以及文字区域的坐标。
根据权利要求1所述的应用程序多语言支持方法，其中，所述通过预设的OCR文字识别插件识别所述文字区域包含的文字，包括：

将所述文字区域输入到预设的OCR文字识别插件中；

接收所述OCR文字识别插件输出的文字识别结果，所述文字识别结果包含从所述文字区域中识别到的文字。
根据权利要求1所述的应用程序多语言支持方法，其中，所述将所述文字转换为所述目标语言后得到翻译文字，包括：

判断预设的多语言库中是否存在所述文字对应所述目标语言的翻译文字；

若所述多语言库中存在所述文字对应所述目标语言的翻译文字，则从所述多语言库中获取所述文字对应所述目标语言的翻译文字。
根据权利要求4所述的应用程序多语言支持方法，其中，所述将所述文字转换为所述目标语言后得到翻译文字，还包括：

若所述多语言库中不存在所述文字对应所述目标语言的翻译文字，向预设的翻译插件发送翻译请求，所述翻译请求包含所述文字以及所述目标语言；

接收所述翻译插件返回的翻译结果，所述翻译结果包含所述文字对应所述目标语言的翻译文字。
根据权利要求4所述的应用程序多语言支持方法，其中，所述判断预设的多语言库中是否存在所述文字对应所述目标语言的翻译文字，包括：

向所述多语言库发送查询请求，所述查询请求包含所述文字以及所述目标语言；

若接收到所述多语言库返回的查询结果，则判定所述多语言库中存在所述文字对应所述目标语言的翻译文字；

若接收到所述多语言库返回的无查询结果提示消息，则判定所述多语言库中不存在所述文字对应所述目标语言的翻译文字。
根据权利要求1所述的应用程序多语言支持方法，其中，所述根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片，包括：

根据文字区域的坐标在所述文字区域的一侧设置文本框；

将所述翻译文字添加到所述文本框中。
一种应用程序多语言支持装置，包括：

第一接收单元，用于接收用户终端发送的页面翻译请求，所述页面翻译请求包括页面图片以及目标语言；

第一获取单元，用于通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，所述目标检测模型由标注了文字区域的页面样本图片训练得到；

识别单元，用于将所述文字区域从所述页面图片中分离，并通过预设的OCR文字识别插件识别所述文字区域包含的文字；

转换单元，用于将所述文字转换为所述目标语言后得到翻译文字；

第一添加单元，用于将所述翻译文字添加到所述页面图片中，并根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片；

第一发送单元，用于将所述目标页面图片发送给用户终端。
一种计算机设备，所述计算机设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现如下步骤：

接收用户终端发送的页面翻译请求，所述页面翻译请求包括页面图片以及目标语言；

通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，所述目标检测模型由标注了文字区域的页面样本图片训练得到；

将所述文字区域从所述页面图片中分离，并通过预设的OCR文字识别插件识别所述文字区域包含的文字；

将所述文字转换为所述目标语言后得到翻译文字；

将所述翻译文字添加到所述页面图片中，并根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片；

将所述目标页面图片发送给用户终端。
根据权利要求9所述的计算机设备，其中，所述通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，包括：

获取所述页面图片的特征图，并将所述特征图输入所述目标检测模型中；

接收所述目标检测模型输出的检测结果，所述检测结果包含所述目标检测模型在所述页面图片中检测到的文字区域以及文字区域的坐标。
根据权利要求9所述的计算机设备，其中，所述通过预设的OCR文字识别插件识别所述文字区域包含的文字，包括：

将所述文字区域输入到预设的OCR文字识别插件中；

接收所述OCR文字识别插件输出的文字识别结果，所述文字识别结果包含从所述文字区域中识别到的文字。
根据权利要求9所述的计算机设备，其中，所述将所述文字转换为所述目标语言后得到翻译文字，包括：

判断预设的多语言库中是否存在所述文字对应所述目标语言的翻译文字；

若所述多语言库中存在所述文字对应所述目标语言的翻译文字，则从所述多语言库中获取所述文字对应所述目标语言的翻译文字。
根据权利要求12所述的计算机设备，其中，所述将所述文字转换为所述目标语言后得到翻译文字，还包括：

若所述多语言库中不存在所述文字对应所述目标语言的翻译文字，向预设的翻译插件发送翻译请求，所述翻译请求包含所述文字以及所述目标语言；

接收所述翻译插件返回的翻译结果，所述翻译结果包含所述文字对应所述目标语言的翻译文字。
根据权利要求12所述的计算机设备，其中，所述判断预设的多语言库中是否存在所述文字对应所述目标语言的翻译文字，包括：

向所述多语言库发送查询请求，所述查询请求包含所述文字以及所述目标语言；

若接收到所述多语言库返回的查询结果，则判定所述多语言库中存在所述文字对应所述目标语言的翻译文字；

若接收到所述多语言库返回的无查询结果提示消息，则判定所述多语言库中不存在所述文字对应所述目标语言的翻译文字。
根据权利要求9所述的计算机设备，其中，所述根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片，包括：

根据文字区域的坐标在所述文字区域的一侧设置文本框；

将所述翻译文字添加到所述文本框中。
一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序当被处理器执行时可实现如下步骤：接收用户终端发送的页面翻译请求，所述页面翻译请求包括页面图片以及目标语言；

通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，所述目标检测模型由标注了文字区域的页面样本图片训练得到；

将所述文字区域从所述页面图片中分离，并通过预设的OCR文字识别插件识别所述文字区域包含的文字；

将所述文字转换为所述目标语言后得到翻译文字；

将所述翻译文字添加到所述页面图片中，并根据所述文字区域的坐标将所述翻译文字设置在所述文字区域的一侧以得到目标页面图片；

将所述目标页面图片发送给用户终端。
根据权利要求16所述的计算机可读存储介质，其中，所述通过预训练的目标检测模型获取所述页面图片包含的文字区域以及文字区域的坐标，包括：

获取所述页面图片的特征图，并将所述特征图输入所述目标检测模型中；

接收所述目标检测模型输出的检测结果，所述检测结果包含所述目标检测模型在所述页面图片中检测到的文字区域以及文字区域的坐标。
根据权利要求16所述的计算机可读存储介质，其中，所述通过预设的OCR文字识别插件识别所述文字区域包含的文字，包括：

将所述文字区域输入到预设的OCR文字识别插件中；

接收所述OCR文字识别插件输出的文字识别结果，所述文字识别结果包含从所述文字区域中识别到的文字。
根据权利要求16所述的计算机可读存储介质，其中，所述将所述文字转换为所述目标语言后得到翻译文字，包括：

判断预设的多语言库中是否存在所述文字对应所述目标语言的翻译文字；

若所述多语言库中存在所述文字对应所述目标语言的翻译文字，则从所述多语言库中获取所述文字对应所述目标语言的翻译文字。
根据权利要求19所述的计算机可读存储介质，其中，所述将所述文字转换为所述目标语言后得到翻译文字，还包括：

若所述多语言库中不存在所述文字对应所述目标语言的翻译文字，向预设的翻译插件发送翻译请求，所述翻译请求包含所述文字以及所述目标语言；

接收所述翻译插件返回的翻译结果，所述翻译结果包含所述文字对应所述目标语言的翻译文字。