CN106570001A

CN106570001A - 一种音译文字的方法及装置

Info

Publication number: CN106570001A
Application number: CN201610937652.7A
Authority: CN
Inventors: 庄正中; 刘勇; 陈传艺; 李祖辉
Original assignee: Guangzhou Kugou Computer Technology Co Ltd
Current assignee: Guangzhou Kugou Computer Technology Co Ltd
Priority date: 2016-10-24
Filing date: 2016-10-24
Publication date: 2017-04-19
Anticipated expiration: 2036-10-24
Also published as: CN106570001B

Abstract

本发明公开了一种音译文字的方法及装置，属于信息处理领域。所述方法包括：从存储文件包括的至少一个文字中获取待音译文字；根据音译字典，确定所述待音译文字的罗马拼音，所述音译字典对应的语言与所述待音译文字对应的语言相同，所述音译字典包括所述语言的各文字和所述各文字对应的罗马拼音；在所述存储文件中，使用所述待音译文字的罗马拼音标注所述待音译文字。所述装置包括：获取模块、确定模块和标注模块。本发明能够提高音译文字的效率。

Description

一种音译文字的方法及装置

技术领域

本发明涉及信息处理领域，特别涉及一种音译文字的方法及装置。

背景技术

目前有很多外文歌曲在我国很受欢迎，例如有很多日文歌曲或韩文歌曲很爱欢迎，以至于存在部分用户想要学唱。为了方便用户学唱可以在歌词文件中为每个外文文字标记罗马拼音，这样播放器显示歌词时同时显示每个歌词对应的罗马拼音，方便用学唱。

对于歌词文件，需要事先音译歌词文件中的每个外文文字，得到每个外文文字的罗马拼音，然后在歌词文件中为每个外文文字标记对应的罗马拼音。目前在音译外文文字时，需要熟练掌握外文语言的技术人员来音译外文文字并在外文文字上标记罗马拼音。

在实现本发明的过程中，发明人发现现有技术至少存在以下问题：

目前在对外文文字进行音译时，需要熟练掌握外文语言的技术人员来进行音译外文文字的工作，导致音译效率低下。

发明内容

为了提高音译效率，本发明提供了一种音译文件的方法及装置。所述技术方案如下：

一方面，提供了一种音译文字的方法，所述方法包括：

从存储文件包括的至少一个文字中获取待音译文字；

根据音译字典，确定所述待音译文字的罗马拼音，所述音译字典对应的语言与所述待音译文字对应的语言相同，所述音译字典包括所述语言的各文字和所述各文字对应的罗马拼音；

在所述存储文件中，使用所述待音译文字的罗马拼音标注所述待音译文字。

可选的，所述根据音译字典，确定所述待音译文字的罗马拼音，包括：

根据所述待音译文字，从所述音译字典中获取对应的M个罗马拼音；

如果M为1，则将所述获取的一个罗马拼音确定为所述待音译文字的罗马拼音。

可选的，所述方法还包括：

如果M为大于或等于2的整数，则从所述存储文件中获取所述待音译文字的上下文信息，所述上下文信息包括在所述待音译文字之前且与所述待音译文字相邻的N个文字和在所述待音译文字之后且与所述待音译文字相邻的N个文字，N为大于或等于1的整数；

根据所述上下文信息，从所述M个罗马拼音中确定所述待音译文字的罗马拼音。

可选的，如果所述上下文信息中不包括多音字，且所述音译字典中还包括所述M个罗马拼音中的每个罗马拼音的字向量；

所述根据所述上下文信息，从所述M个罗马拼音中确定所述待音译文字的罗马拼音，包括：

获取所述上下文信息包括的每个文字对应的预设字向量；

根据所述每个文字对应的预设字向量，通过预设的语言模型计算出所述待音译文字的字向量；

从所述M个罗马拼音中选择字向量与所述所述待音译文字的字向量最相似的罗马拼音，所述选择的罗马拼音为所述待音译文字的罗马拼音。

可选的，如果所述上下文信息中包括多音字，且所述音译字典中还包括所述M个罗马拼音中的每个罗马拼音的字向量；

获取所述上下文信息包括的除所述多音字以外的每个其他文字对应的预设字向量和预设空格符对应的预设字向量；

根据所述每个其他文字对应的预设字向量和预设空格符对应的预设字向量，通过预设的语言模型计算出所述待音译文字的字向量；

可选的，如果所述上下文信息中包括多音字，所述多音字对应E个罗马拼音，E为大于或等于2的整数，且所述音译字典中还包括所述M个罗马拼音中的每个罗马拼音的字向量；

所述根据所述上下文信息，从所述获取到的多个罗马拼音中确定所述待音译文字的罗马拼音，包括：

获取所述上下文信息包括的除所述多音字以外的每个其他文字对应的预设字向量和所述E个罗马拼音中的每个罗马拼音对应的预设字向量；

根据所述每个其他文字对应的预设字向量和所述每个罗马拼音对应的预设字向量，确定所述多音字的读音分别为所述每个罗马拼音时的字向量和联合概率；

选择最大联合概率对应的罗马拼音，将所述多音字的读音为所述选择的罗马拼音时的字向量确定为所述待音译文字的罗马拼音；

可选的，所述根据所述每个其他文字对应的预设字向量和所述每个罗马拼音对应的预设字向量，确定所述多音字的读音分别为所述每个罗马拼音时的字向量和联合概率，包括：

根据所述每个其他文字对应的预设字向量和第一罗马拼音对应的预设字向量，通过预设的语言模型计算所述多音字为所述第一罗马拼音时的字向量和联合概率，所述第一罗马拼音是所述E个罗马拼音中的任一罗马拼音。

另一方面，提供了一种音译文字的装置，所述装置包括：

获取模块，用于从存储文件包括的至少一个文字中获取待音译文字；

确定模块，用于根据音译字典，确定所述待音译文字的罗马拼音，所述音译字典对应的语言与所述待音译文字对应的语言相同，所述音译字典包括所述语言的各文字和所述各文字对应的罗马拼音；

标注模块，用于在所述存储文件中，使用所述待音译文字的罗马拼音标注所述待音译文字。

可选的，所述确定模块包括：

获取单元，用于根据所述待音译文字，从所述音译字典中获取对应的M个罗马拼音；

确定单元，用于如果M为1，则将所述获取的一个罗马拼音确定为所述待音译文字的罗马拼音。

可选的，所述获取单元，还用于如果M为大于或等于2的整数，则从所述存储文件中获取所述待音译文字的上下文信息，所述上下文信息包括在所述待音译文字之前且与所述待音译文字相邻的N个文字和在所述待音译文字之后且与所述待音译文字相邻的N个文字，N为大于或等于1的整数；

所述确定单元，还用于根据所述上下文信息，从所述M个罗马拼音中确定所述待音译文字的罗马拼音。

所述获取单元，还用于获取所述上下文信息包括的每个文字对应的预设字向量；根据所述每个文字对应的预设字向量，通过预设的语言模型计算出所述待音译文字的字向量；

所述确定单元，还用于从所述M个罗马拼音中选择字向量与所述所述待音译文字的字向量最相似的罗马拼音，并将所述选择的罗马拼音确定为所述待音译文字的罗马拼音。

所述获取单元，还用于获取所述上下文信息包括的除所述多音字以外的每个其他文字对应的预设字向量和预设空格符对应的预设字向量；根据所述每个其他文字对应的预设字向量和预设空格符对应的预设字向量，通过预设的语言模型计算出所述待音译文字的字向量；

所述确定单元，用于从所述M个罗马拼音中选择字向量与所述所述待音译文字的字向量最相似的罗马拼音，并将所述选择的罗马拼音确定为所述待音译文字的罗马拼音。

所述获取单元，还用于获取所述上下文信息包括的除所述多音字以外的每个其他文字对应的预设字向量和所述E个罗马拼音中的每个罗马拼音对应的预设字向量；根据所述每个其他文字对应的预设字向量和所述每个罗马拼音对应的预设字向量，确定所述多音字的读音分别为所述每个罗马拼音时的字向量和联合概率；

所述确定单元，还用于选择最大联合概率对应的罗马拼音，将所述多音字的读音为所述选择的罗马拼音时的字向量确定为所述待音译文字的罗马拼音；从所述M个罗马拼音中选择字向量与所述所述待音译文字的字向量最相似的罗马拼音，并将所述选择的罗马拼音确定为所述待音译文字的罗马拼音。

可选的，所述确定单元，用于根据所述每个其他文字对应的预设字向量和第一罗马拼音对应的预设字向量，通过预设的语言模型计算所述多音字为所述第一罗马拼音时的字向量和联合概率，所述第一罗马拼音是所述E个罗马拼音中的任一罗马拼音。

本发明提供的技术方案的有益效果是：

通过音译字典确定待音译文字的罗马拼音，由于音译字典包括待音译文字对应语言的各文字和各文字对应的罗马拼音，从而可以实现自动音译文字，提高音译文字效率。

附图说明

图1是本发明实施例一提供的一种音译文字的方法流程图；

图2是本发明实施例二提供的一种音译文字的方法流程图；

图3是本发明实施例三提供的一种音译文字的装置结构示意图；

图4是本发明实施例四提供的一种终端结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

目前用户看到文字时可能存在不知道文字读音的情况，然而用户往往具有获取该文字读音的需求。例如，对于中文用户来说，韩文或日文是外文文字，在当前有很多韩文歌曲、日文歌曲在国内很流行，用户往往想知道韩文歌词中的每个韩文文字的读音或日文歌词中的每个日文文字的读音，以方便自己学唱。

在本发明实施例中，通过对文字进行音译，音译出该文字的罗马拼音。用户可以通过查看该文字的罗马拼音可以获知该文字的读音。例如，对于韩文文字通过本发明实施例提供的音译方法对该韩文字进行音译，得到该韩文字的罗马拼音为“ko”；然后可以显示这样用户通过显示的罗马拼音“ko”获知该韩文文字的读音。其中，对于本发明实施例提供的音译文字的详细过程可以见如下任一实施例。

实施例一

参见图1，本发明实施例提供了一种音译文字的方法，包括：

步骤101：从存储文件包括的至少一个文字中获取待音译文字。

步骤102：根据音译字典，确定待音译文字的罗马拼音，该音译字典对应的语言与待音译文字对应的语言相同，该音译字典包括该语言的各文字和各文字对应的罗马拼音。

步骤103：在存储文件中，使用待音译文字的罗马拼音标注待音译文字。

在本发明实施例中，通过音译字典确定待音译文字的罗马拼音，由于音译字典包括待音译文字对应语言的各文字和各文字对应的罗马拼音，从而可以实现自动音译文字，提高音译文字效率。

实施例二

本发明实施例提供了一种音译文字的方法。本实施例的执行主体可以为终端设备，例如可以为计算机、笔记本电脑等。参见图2，该方法包括：

步骤201：从存储文件包括的至少一个文字中获取待音译文字。

存储文件可以为文本文件或者为终端设备内存中的存储区域。存储文件中存储的至少一个文字是需要音译的文字。可以从存储文件存储的第一个文字开始一个一个地读取文字，每读取到一个文字，将该文字作为待音译文字，并通过如下流程音译待音译文字。

在本实施例中，可以对歌词文件中的歌词进行音译，由于歌词文件的格式往往是非文本格式，所以可以先将歌词文件的格式转换为文本格式，或者，将该歌词文件中的歌词加载到终端设备内存中的某个存储区域中，然后再开始执行本步骤。

步骤202：根据待音译文字，从音译字典中获取对应的M个罗马拼音。

该音译字典的语言与待音译文字的语言相同，且该音译字典中至少包括属于该语言的各文字和各文字对应的至少一个罗马拼音。如果某个文字为多音字，即该文字对应多个罗马拼音，该音译字典还包括该文字对应的多个罗马拼音中的每个罗马拼音的预设字向量。如果某个文字不是多音字，即该文字对应一个罗马拼音，该音译字典还可包括该文字对应的一个罗马拼音的预设字向量。

其中，对于任一个罗马拼音对应的字向量，该字向量包括在一种上下文信息中该待音译文字的读音为该罗马拼音的概率，该概率至少包括一个。

其中，该音译字典中的各文字对应的至少一个罗马拼音可以是技术人员事先设置的。

例如，假设存储文件中包括的文字都为韩文文字，则待音译文字的语言和音译字典的语言都为韩语。如下表1所示，该音译字典包括各韩文文字和各韩文文字对应的至少一个罗马拼音；对于多音字的韩文文字，如对于韩文文字该韩文文字对应两个罗马拼音，分别为“zong”和“gang”，表1所示的音译字典中还可以包括罗马拼音“zong”对应的预设字向量[-0.12,0.5,-0.3,0.4]和罗马拼音“gang”对应的预设字向量[0.9,-0.42,0.75,0.6]。对于不是多音字的韩文文字，如对于韩文文字表1所示的音译字典中还可以包括该韩文文字对应的预设字向量[0,0.73,0.1,-0.26]。

表1

本步骤可以为：根据待音译文字，从音译字典中获取对应的M个罗马拼音。如果待音译文字为多音字，则获取的M个罗马拼音为多个，即M为大于或等于2的整数，还进一步地从音译字典中获取该M个罗马拼音中的每个罗马拼音对应的预设字向量；如果待音译文字不是多音字，则获取的M个罗马拼音为一个，即M＝1。

例如，假设待音译文字为韩文文字根据该韩文文字从如表1所示的音译字典中获取对应的两个罗马拼音，该两个罗马拼音分别为“zong”和“gang”；还进一步从如表1所示的音译字典中获取罗马拼音“zong”对应的预设字向量[-0.12,0.5,-0.3,0.4]和罗马拼音“gang”对应的预设字向量[0.9,-0.42,0.75,0.6]。或者，假设待音译文字为韩文文字根据该韩文文字从如表1所示的音译字典中获取对应的一个罗马拼音，该一个罗马拼音为“ko”。

步骤203：如果M为1，即获取到一个罗马拼音，将该一个罗马拼音确定为待音译文字的罗马拼音，执行步骤210。

如果获取到一个罗马拼音，表明待音译文字不是一个多音字，只有一个读音，该读音就是音译字典中待音译文字对应的罗马拼音。例如，假设待音译文字为韩文文字获取到一个罗马拼音“ko”，该韩文文字只有一个读音且该读音为罗马拼音“ko”，所以可以将获取的该罗马拼音“ko”作为该韩文文字的罗马拼音。

步骤204：如果M为大于或等于2的整数，即获取到多个罗马拼音，从存储文件中获取待音译文字的上下文信息。

本步骤可以为：在存储文件中读取在待音译文字之前且与待音译文字相邻的N个文字，N为预设数值且为大于或等于1的整数，以及读取在待音译文字之后且与待音译文字相邻的N个文字，其中待音译文字的上下文信息包括读取的2N个文字。

其中，需要说明的是：在存储文件中，如果在待音译文字之前的文字不超过N个，则直接读取在待音译文字之前的所有文字；或者，如果在待音译文字之后的文字不超过N个，则直接读取在待音译文字之后的所有文字。

例如，假设待音译的文字为韩文文字获取到两个罗马拼音，分别为“zong”和“gang”，所以该韩文文字是一个多音字且有两个读音。假设存储文件中存储的一段内容为且预设数值N为2；相应的，从该存储文件中读取在该韩文文字之前且与该韩文文字相邻的两个文字为以及读取在该韩文文字之后且与该韩文文字相邻的两个文字为获取的该四个文字即为该韩文文字的上下文信息。

步骤205：确定获取的上下文信息中是否包括多音字，如果不包括多音字，则执行步骤206，如果包括多音字，则执行步骤208。

具体地，对于该上下文信息中的任一个文字，根据该文字从音译字典中获取该文字对应的E个罗马拼音，如果获取的E个罗马拼音为一个罗马拼音，确定该文字不是多音字，如果获取的E个罗马拼音为多个罗马拼音，确定该文字是多音字。对该上下文信息中的每个文字执行上述过程，从而得出该上下文信息中是否包括多音字，如果包括多音字，并得到包括的各多音字。

例如，在步骤204中获取的上下文信息为对于该上下文信息中的第一个文字根据该文字从如表1所示的音译字典中获取对应的罗马拼音为“go”，包括一个罗马拼音，因此可以确定该文字不是多音字。按上述方式确定文字均不是多音字，从而得出该上下文信息不包括多音字。

步骤206：获取该上下文信息中的每个文字对应的预设字向量，根据每个文字对应的预设字向量通过预设语言模型计算待音译文字的字向量，执行步骤209。

其中，在本步骤中可以根据该上下文信息中的每个文字，从音译字典中获取每个文字对应的预设字向量，然后将每个文字对应的预设字向量输入到预设语言模型，通过预设语言模型计算待音译文字的字向量。该预设语言模型可以为CBOW网络模型。

例如，对于上下文信息中包括的文字根据文字从如表1所示的音译字典中分别获取文字对应的字向量[-0.05,-0.31,0.25,0.3]，文字对应的字向量[0,0.73,0.1,-0.26]，文字对应的字向量[0.1,0.23,0.14,0.22]，文字对应的字向量[-0.05,-0.31,0.25,0.3]。然后将文字对应的字向量[-0.05,-0.31,0.25,0.3]，文字对应的字向量[0,0.73,0.1,-0.26]，文字对应的字向量[0.1,0.23,0.14,0.22]，文字对应的字向量[-0.05,-0.31,0.25,0.3]输入到CBOW模型，通过CBOW模型计算待音译文字的字向量，假设计算出待音译文字的字向量为[-0.10,0.5,-0.3,0.4]。

步骤207：获取该上下文信息中除该多音字以外的每个其他文字对应的预设字向量和预设空格符对应的字向量。

可以根据每个其他文字，从音译字典中获取每个其他文字对应的字向量。

步骤208：根据每个其他文字对应的预设字向量和预设空格符对应的字向量，计算待音译文字的字向量。

本步骤可以为：将每个其他文字对应的预设字向量和预设空格符对应的字向量输入到预设语言模型，通过预设语言模型计算待音译文字的字向量。

对于该上下文信息中包括多音字的情况，除了使用步骤207和208的方式来计算待音译文字的字向量，还可以通过如下方式来计算待音译文字的字向量，具体为：

首先，根据该上下文信息包括的除该多音字以外的每个其他文字，从音译字典中获取每个其他文字对应的预设字向量，以及根据该多音字和该多音字对应的E个罗马拼音中的每个罗马拼音，从该音译字典中获取每个罗马拼音对应的预设字向量。

根据每个其他文字对应的预设字向量和每个罗马拼音对应的预设字向量，确定该多音字的读音分别为每个罗马拼音时的字向量和联合概率；选择最大联合概率对应的罗马拼音，将该多音字的读音为选择的罗马拼音时的字向量确定为待音译文字的罗马拼音。

例如，对于上下文信息中的多音字，假设音译字典中包括该多音字对应的两个罗马拼音，分别为罗马拼音1和罗马拼音2；根据每个其他文字对应的预设字向量和罗马拼音1对应的预设字向量，确定该多音字的读音为罗马拼音1时的字向量1和联合概率1；根据每个其他文字对应的预设字向量和罗马拼音2对应的预设字向量，确定该多音字的读音为罗马拼音2时的字向量2和联合概率2；假设联合概率1小于联合概率2，选择最大联合概率2对应的罗马拼音2，将该多音字的读音为选择的罗马拼音2时的字向量2确定为待音译文字的罗马拼音。

可选的，根据每个其他文字对应的预设字向量和每个罗马拼音对应的预设字向量，确定该多音字的读音分别为每个罗马拼音时的字向量和联合概率的操作，可以为：

根据每个其他文字对应的预设字向量和第一罗马拼音对应的预设字向量，通过预设的语言模型计算该多音字为第一罗马拼音时的字向量和联合概率，第一罗马拼音是该E个罗马拼音中的任一罗马拼音。

步骤209：从该M个罗马拼音中选择字向量与待音译文字的字向量最相似的罗马拼音，将选择的罗马拼音确定为待音译文字的罗马拼音。

本步骤可以为：根据该M个罗马拼音中的每个罗马拼音对应的字向量和待音译文字的字向量，计算每个罗马拼音对应的字向量和待音译文字的字向量之间的相似度，选择和待音译文字的字向量之间的相似度最大的罗马拼音，将选择的罗马拼音确定为待音译文字的罗马拼音。在本实施例中，两个字向量的相似度可以为该两个字向量之间的余弦距离。

例如，在步骤202中获取到罗马拼音“zong”对应的预设字向量[-0.12,0.5,-0.3,0.4]和罗马拼音“gang”对应的预设字向量[0.9,-0.42,0.75,0.6]。根据罗马拼音“zong”对应的预设字向量[-0.12,0.5,-0.3,0.4]和待音译文字的字向量[-0.10,0.5,-0.3,0.4]，计算该两个字向量之间的相似度1；根据罗马拼音“gang”对应的预设字向量[0.9,-0.42,0.75,0.6]待音译文字的字向量[-0.10,0.5,-0.3,0.4]，计算该两个字向量之间的相似度2；假设相似度1小于相似度2，所以选择较小的相似度1对应的罗马拼音“gang”作为待音译文字的罗马拼音。

步骤210：在存储文件中，使用待音译文字的罗马拼音标注待音译文字。

其中，执行完步骤210后，如果存储文件中还存在没有音译的文字，则可以从该存储文字中读取没有音译的一个文字作为待音译文字，然后从步骤202开始执行。

可选的，在存储文件中可以将待音译文字的罗马拼音存储在待音译文字之后。例如，标注后的存储文件的内容可以为在标注后的存储文件中，每个文字的罗马拼音分别存储在每个文字之后的括号内。

在本发明实施例中，对于待音译文字，通过音译字典查询待音译文字的罗马拼音，如果查询到一个罗马拼音，则直接该罗马拼音作为待音译文字的读音，提高了音译文字的效率；如果查询到多个罗马拼音，根据音译字典中的该多个罗马拼音中的每个罗马拼音的字向量和待音译文字的上下文信息，确定该待译音文件的罗马拼音，提高了音译文字的准确性。

实施例三

参见图3，本发明实施例提供了一种音译文字的装置300，所述装置300包括：

获取模块301，用于从存储文件包括的至少一个文字中获取待音译文字；

确定模块302，用于根据音译字典，确定所述待音译文字的罗马拼音，所述音译字典对应的语言与所述待音译文字对应的语言相同，所述音译字典包括所述语言的各文字和所述各文字对应的罗马拼音；

标注模块303，用于在所述存储文件中，使用所述待音译文字的罗马拼音标注所述待音译文字。

可选的，所述确定模块302包括：

实施例四

请参考图4，其示出了本发明一个实施例提供的终端400的结构示意图。该终端400可以执行上述音译文字的方法。具体来讲：

终端400可以包括RF(Radio Frequency，射频)电路410、包括有一个或一个以上计算机可读存储介质的存储器420、输入单元430、显示单元440、传感器450、音频电路460、WiFi(wireless fidelity，无线保真)模块470、包括有一个或者一个以上处理核心的处理器480、以及电源490等部件。本领域技术人员可以理解，图4中示出的电子设备结构并不构成对电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

RF电路410可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，交由一个或者一个以上处理器480处理；另外，将涉及上行的数据发送给基站。通常，RF电路410包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier，低噪声放大器)、双工器等。此外，RF电路410还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议，包括但不限于GSM(Global System of Mobile communication，全球移动通讯系统)、GPRS(General Packet Radio Service，通用分组无线服务)、CDMA(CodeDivision Multiple Access，码分多址)、WCDMA(Wideband Code Division MultipleAccess,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(ShortMessaging Service，短消息服务)等。

存储器420可用于存储软件程序以及模块，处理器480通过运行存储在存储器420的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器420可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据终端400的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器420可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器420还可以包括存储器控制器，以提供处理器480和输入单元430对存储器420的访问。

输入单元430可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地，输入单元430可包括图像输入设备431以及其他输入设备432。图像输入设备431可以是摄像头，也可以是光电扫描设备。除了图像输入设备431，输入单元430还可以包括其他输入设备432。具体地，其他输入设备432可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元440可用于显示由用户输入的信息或提供给用户的信息以及终端400的各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元440可包括显示面板441，可选的，可以采用LCD(Liquid Crystal Display，液晶显示器)、OLED(Organic Light-Emitting Diode，有机发光二极管)等形式来配置显示面板441。

终端400还可包括至少一种传感器450，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板441的亮度，接近传感器可在终端400移动到耳边时，关闭显示面板441和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于终端400还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路460、扬声器461，传声器462可提供用户与终端400之间的音频接口。音频电路460可将接收到的音频数据转换后的电信号，传输到扬声器461，由扬声器461转换为声音信号输出；另一方面，传声器462将收集的声音信号转换为电信号，由音频电路460接收后转换为音频数据，再将音频数据输出处理器480处理后，经RF电路410以发送给比如另一电子设备，或者将音频数据输出至存储器420以便进一步处理。音频电路460还可能包括耳塞插孔，以提供外设耳机与终端400的通信。

WiFi属于短距离无线传输技术，终端400通过WiFi模块470可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图4示出了WiFi模块470，但是可以理解的是，其并不属于终端400的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器480是终端400的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器420内的软件程序和/或模块，以及调用存储在存储器420内的数据，执行终端400的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器480可包括一个或多个处理核心；优选的，处理器480可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器480中。

终端400还包括给各个部件供电的电源490(比如电池)，优选的，电源可以通过电源管理系统与处理器480逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源490还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

尽管未示出，终端400还可以包括蓝牙模块等，在此不再赘述。

具体在本实施例中，终端400还包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行。上述一个或者一个以上程序包含用于进行以下操作的指令：

从存储文件包括的至少一个文字中获取待音译文字；

可选的，还包括：

获取所述上下文信息包括的每个文字对应的预设字向量；

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种音译文字的方法，其特征在于，所述方法包括：

从存储文件包括的至少一个文字中获取待音译文字；

2.如权利要求1所述的方法，其特征在于，所述根据音译字典，确定所述待音译文字的罗马拼音，包括：

3.如权利要求2所述的方法，其特征在于，所述方法还包括：

4.如权利要求3所述的方法，其特征在于，如果所述上下文信息中不包括多音字，且所述音译字典中还包括所述M个罗马拼音中的每个罗马拼音的字向量；

获取所述上下文信息包括的每个文字对应的预设字向量；

5.如权利要求3所述的方法，其特征在于，如果所述上下文信息中包括多音字，且所述音译字典中还包括所述M个罗马拼音中的每个罗马拼音的字向量；

6.如权利要求3所述的方法，其特征在于，如果所述上下文信息中包括多音字，所述多音字对应E个罗马拼音，E为大于或等于2的整数，且所述音译字典中还包括所述M个罗马拼音中的每个罗马拼音的字向量；

7.如权利要求6所述的方法，其特征在于，所述根据所述每个其他文字对应的预设字向量和所述每个罗马拼音对应的预设字向量，确定所述多音字的读音分别为所述每个罗马拼音时的字向量和联合概率，包括：

8.一种音译文字的装置，其特征在于，所述装置包括：

9.如权利要求8所述的装置，其特征在于，所述确定模块包括：

10.如权利要求9所述的装置，其特征在于，

所述获取单元，还用于如果M为大于或等于2的整数，则从所述存储文件中获取所述待音译文字的上下文信息，所述上下文信息包括在所述待音译文字之前且与所述待音译文字相邻的N个文字和在所述待音译文字之后且与所述待音译文字相邻的N个文字，N为大于或等于1的整数；

11.如权利要求10所述的装置，其特征在于，如果所述上下文信息中不包括多音字，且所述音译字典中还包括所述M个罗马拼音中的每个罗马拼音的字向量；

12.如权利要求10所述的装置，其特征在于，如果所述上下文信息中包括多音字，且所述音译字典中还包括所述M个罗马拼音中的每个罗马拼音的字向量；

13.如权利要求10所述的装置，其特征在于，如果所述上下文信息中包括多音字，所述多音字对应E个罗马拼音，E为大于或等于2的整数，且所述音译字典中还包括所述M个罗马拼音中的每个罗马拼音的字向量；

14.如权利要求13所述的装置，其特征在于，所述确定单元，用于根据所述每个其他文字对应的预设字向量和第一罗马拼音对应的预设字向量，通过预设的语言模型计算所述多音字为所述第一罗马拼音时的字向量和联合概率，所述第一罗马拼音是所述E个罗马拼音中的任一罗马拼音。