CN108763521B

CN108763521B - 存储歌词注音的方法和装置

Info

Publication number: CN108763521B
Application number: CN201810545601.9A
Authority: CN
Inventors: 冯穗豫
Original assignee: Tencent Music Entertainment Technology Shenzhen Co Ltd
Current assignee: Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date: 2018-05-25
Filing date: 2018-05-25
Publication date: 2022-02-25
Anticipated expiration: 2038-05-25
Also published as: SG11202011731PA; WO2019223268A1; CN108763521A

Abstract

本申请提供了一种存储歌词注音的方法和装置，属于计算机技术领域。所述方法包括：服务器可以接收目标歌词的注音存储请求，然后获取目标歌词中多音字词的读音，并获取多音字词的读音的展示信息，展示信息用于指示多音字词的读音的播放时间，最后将多音字词的读音，以及多音字词的读音的展示信息与目标歌词对应存储。采用申请，可以提高显示歌词注音的效率。

Description

存储歌词注音的方法和装置

技术领域

本发明涉及计算机技术领域，特别涉及一种存储歌词注音的方法和装置。

背景技术

随着计算机技术的发展，音频应用程序逐渐全球化，可以播放中文歌曲、英文歌曲和日文歌曲等，在播放歌曲时，为了使歌曲听起来更有艺术感，通常会出现某些多音字词的读音与最常用的读音不相同的情况，例如，在日文歌曲中，“宿命”一词常见的读音是“しゅくめい”，在歌曲中的读音是“さだめ”，所以为了显示歌词中多音字词的正确读音，一般会为特殊读音的多音字词标注正确读音。

相关技术中，在播放歌曲时，一般会实时查找歌词的读音，然后进行标注，这样，需要实时在词典中查询读音，并进行标注读音(可以简称为注音)，有可能导致显示歌词注音比较慢。

发明内容

为了解决现有技术的问题，本发明实施例提供了一种存储歌词注音的方法和装置。所述技术方案如下：

第一方面，提供了一种存储歌词注音的方法，所述方法包括：

接收目标歌词的注音存储请求；

获取所述目标歌词中多音字词的读音，并确定所述多音字词的读音中各振假名的播放时长；

对于所述多音字词中任一多音字词，如果所述多音字词的读音中各振假名的播放时长不相同，则获取所述多音字词的读音中每个振假名的开始播放标识，确定为所述多音字词的读音的展示信息，如果所述多音字词的读音中各振假名的播放时长相同，则获取所述多音字词的读音中第一个振假名的开始播放标识，确定为所述多音字词的读音的展示信息；

将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息与所述目标歌词对应存储。

可选的，所述将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息与所述目标歌词对应存储，包括：

将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息，存储至所述目标歌词正文的附加部分。

可选的，所述将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息，存储至所述目标歌词正文的附加部分，包括：

确定所述目标歌词中每行歌词中多音字词的读音、以及所述每行歌词中多音字词的读音的展示信息；

将所述每行歌词中多音字词的读音、以及所述每行歌词中多音字词的读音的展示信息，分别存储至所述目标歌词正文的附加部分。

将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息，存储至所述目标歌词对应的注音文件。

第二方面，提供了一种存储歌词注音的方法，所述方法包括：

接收目标歌词的注音存储请求；

获取所述目标歌词中多音字词的读音，并确定所述目标歌词的多音字词的读音中各振假名的播放时长；

对于所述多音字词中任一多音字词，如果所述多音字词的读音中各振假名的播放时长不相同，则获取所述多音字词中汉字的数目、以及所述多音字词的读音中每个振假名的开始播放标识，确定为所述多音字词的读音的展示信息；如果所述多音字词的读音中各振假名的播放时长相同，则获取所述多音字词中汉字的数目，确定为所述多音字词的读音的展示信息；

第三方面，提供了一种存储歌词注音的装置，所述装置包括：

接收模块，用于接收目标歌词的注音存储请求；

获取模块，用于获取所述目标歌词中多音字词的读音，并确定所述多音字词的读音中各振假名的播放时长；

确定模块，用于对于所述多音字词中任一多音字词，如果所述多音字词的读音中各振假名的播放时长不相同，则获取所述多音字词的读音中每个振假名的开始播放标识，确定为所述多音字词的读音的展示信息，如果所述多音字词的读音中各振假名的播放时长相同，则获取所述多音字词的读音中第一个振假名的开始播放标识，确定为所述多音字词的读音的展示信息；

存储模块，用于将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息与所述目标歌词对应存储。

可选的，所述存储模块，用于：

第四方面，提供了一种存储歌词注音的装置，所述装置包括：

第一接收模块，用于接收目标歌词的注音存储请求；

第一获取模块，用于获取所述目标歌词中多音字词的读音，并确定所述目标歌词的多音字词的读音中各振假名的播放时长；

第一确定模块，用于对于所述多音字词中任一多音字词，如果所述多音字词的读音中各振假名的播放时长不相同，则获取所述多音字词中汉字的数目、以及所述多音字词的读音中每个振假名的开始播放标识，确定为所述多音字词的读音的展示信息；如果所述多音字词的读音中各振假名的播放时长相同，则获取所述多音字词中汉字的数目，确定为所述多音字词的读音的展示信息；

第一存储模块，用于将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息与所述目标歌词对应存储。

可选的，所述第一存储模块，用于：

可选的，所述第一存储模块，用于

本发明实施例提供的技术方案带来的有益效果至少包括：

本发明实施例中，将歌词中多音字词的读音、以及读音的展示信息与歌词对应存储，这样，后续在播放歌曲时，直接基于歌词，就可以获取到多音字词的读音和读音的展示信息，而无需实时查询，所以提高了显示歌词注音的效率。

附图说明

图1是本发明实施例提供的一种存储歌词注音的方法流程图；

图2是本发明实施例提供的一种附加部分的示意图；

图3是本发明实施例提供的一种存储歌词注音的示意图；

图4是本发明实施例提供的一种存储歌词注音的示意图；

图5是本发明实施例提供的一种存储歌词注音的方法流程图；

图6是本发明实施例提供的一种存储歌词注音的装置的结构示意图；

图7是本发明实施例提供的一种存储歌词注音的装置的结构示意图；

图8是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

本发明实施例提供了一种存储歌词注音的方法，该方法的执行主体为服务器，服务器可以是音频应用程序的后台服务器。服务器可以用于存储目标音频的音频文件，音频文件中包括音频数据和歌词数据等，歌词数据中包括歌词正文和附加部分，附加部分用于存储作者、演唱者等内容。

服务器中可以设置有处理器、存储器和收发器等，处理器可以用于存储歌词的过程的处理，存储器可以用于存储歌词的过程中需要的数据以及产生的数据，收发器可以用于接收以及发送数据。

首先介绍一下本发明实施例的应用场景，一般音频应用程序在播放歌曲时，会显示歌词，歌词一般是音频应用程序的工作人员将歌词数据，上传至音频应用程序的后台服务器(后续可以称为是服务器)，服务器可以将歌词数据与歌曲的音频数据对应存储。由于某些歌曲，该歌曲的歌词中某些词语是多音字词，在显示歌词时，会通过查找词典，找到多音字词的多音，对多音字词进行标注，由于需要查字典，有可能导致显示歌词比较慢，所以针对此，提供了预先存储歌词注音的方式。例如，某些日语歌曲，为了达到艺术效果，歌词中某些词语的读音与最常用的读音不相同(“宿命”一词最常用的读音为“しゅくめい”，但是在歌词中读音为“さだめ”)。

另外，介绍一下本发明实施例中，歌词正文的存储方式：

[第一行开始播放标识][开始播放标识]第一行第一个词<开始播放标识>第一行第二个词<开始播放标识>...第一行最后一个词。

本发明实施例提供了一种存储歌词注音的方法，歌词以日语歌词为例，如图1所示，该方法的处理步骤可以如下：

步骤101，接收目标歌词的注音存储请求。

其中，注音包括读音和读音的展示信息。

在实施中，用户(一般是音频应用程序的工作人员)可以在终端中安装音频应用程序，音频应用程序可以为用户提供接口，供编辑歌词、以及多音字词的读音。对于某首歌曲的歌词(后续可以称为目标歌词)，用户可以为目标歌词中的多音字词标注读音，以及每个读音中各振假名的开始时间戳，然后点击提交按键，终端则会生成注音存储请求，并在其中携带目标歌词的标识、多音字词的读音、以及每个读音中各振假名的开始时间戳。然后向服务器发送目标歌词的注音存储请求。服务器接收到终端发送的注音存储请求后，可以从中解析得到目标歌词的标识、多音字词的读音、以及每个读音中各振假名的开始时间戳。

或者，音频应用程序为用户提供添加注音选项，用户想为某首歌曲的歌词(后续可以称为目标歌词)添加注音，可以点击该注音选项，终端则会检测到注音选项的点击指令，生成注音存储请求，并且在注音存储请求中携带目标歌词的标识，服务器接收到注音请求后，可以从中解析到目标歌词的标识。

步骤102，获取目标歌词中多音字词的读音，并确定多音字词的读音中各振假名的播放时长。

其中，播放时长用于在渲染歌词时的染色时长。开始播放标识用于指示振假名开始播放，可以是开始播放时间戳等。振假名是日语中为表示多音字词，而在其上方或周围附注的假名符号。例如，“絆”(中文意思是“牵绊”)，对应的读音的振假名为“きずな”。

在实施中，服务器可以从注音存储请求中，获取到目标歌词中多音字词的读音和每个读音中各振假名的开始时间戳。或者，服务器从注音存储请求中，解析得到目标歌词的标识后，可以使用目标歌词的标识，查找到目标歌词，然后将目标歌词，输入注音确定程序中，得到目标歌词的多音字词中，每个读音中各振假名的开始时间戳(在后面详细说明)。

对于目标歌词中的任一多音字词，可以将多音字词的读音中连续两个振假名的开始时间戳相减，得到该多音字词的读音中除最后一个振假名之外的其它振假名的时间戳，最后一个振假名的时间戳，可以将该多音字词的后一个字的开始时间戳与最后一个振假名的开始时间戳作差，差值即为最后一个振假名的播放时长。这样，就可以得到多音字词的读音中各振假名的播放时长。例如，“絆”(中文意思是“牵绊”)，对应的读音的振假名为“きずな”，“き”的开始时间戳为0ms，“ず”的开始时间戳为10ms，“な”的开始时间戳为30ms，“き”的播放时长为10ms-0ms，为10ms，“ず”的播放时长为30ms-10ms，为20ms，“絆”后一个字词的开始时间戳为55ms，则“な”的播放时长为55ms-30ms，为25ms。

步骤103，对于多音字词中任一多音字词，如果多音字词的读音中各振假名的播放时长不相同，则获取多音字词的读音中每个振假名的开始播放标识，确定为多音字词的读音的展示信息，如果多音字词的读音中各振假名的播放时长相同，则获取多音字词的读音中第一个振假名的开始播放标识，确定为多音字词的读音的展示信息。

在实施中，对于多音字词中的任一多音字词，可以确定各振假名的播放时长是否相同，如果不相同，则可以将该多音字词的读音中每个振假名的开始播放标识，确定为多音字词的读音的展示信息。如果相同，则可以将该多音字词的读音中第一个振假名的开始播放标识，确定为该多音字词的读音的展示信息，这样，对于目标歌词中每个多音字词都可以按照这样的方法确定。

需要说明的是，在上述任一多音字词的读音中，如果各振假名的播放时长一样，只要使用第一个振假名的开始播放标识，就可以知道每个振假名的开始播放标识，例如，日语中“絆”，对应的读音的振假名为“きずな”，“絆”对应的读音中每个振假名的播放时长都是相同的，所以可以只存储“き”的开始播放时间戳，后续在播放歌曲的过程中，渲染振假名时，使用“き”的开始播放标识和“絆”的后一个字的开始播放时间戳，可以确定“きずな”总共时长，可以除以3，就可以得到每个振假名的播放时长。这样，不需要存储每个振假名的开始播放标识，所以可以节约存储资源。而如果各振假名的播放时长不一样，只有标注了每个振假名的开始播放标识，才能确定出何时渲染振假名。

步骤104，将目标歌词中多音字词的读音，以及目标歌词中多音字词的读音的展示信息与目标歌词对应存储。

在实施中，服务器确定目标歌词的注音后，可以基于目标歌词的标识，将多音字词的读音、以及多音字词的读音的展示信息与目标歌词对应存储。这样，后续可以基于目标歌词，获取到目标歌词的读音、以及多音字词的读音的展示信息。

可选的，对应存储的方式可以有多种，以下给出两种可行的方式：

方式一：将多音字词的读音，以及多音字词的读音的展示信息，存储至目标歌词正文的附加部分。

其中，目标歌词正文的附加部分可以是歌词Meta段，指与歌词渲染内容无关，用于记载歌词的附加部分，例如，如图2所示，在LRC(lyric)格式的歌词中，在歌词正文的前面，有如下内容al:本歌所在的唱片集，ar:演出者-歌手，au：歌词作者-作曲家，by:LRC(lyric)文件的创建者等。

在实施中，服务器可以基于目标歌词的标识，获取到目标歌词正文的附加部分，然后在附加部分中，按照附加部分的记录格式，将多音字词的读音、以及多音字词的读音的展示信息，存储在目标歌词正文的附加部分，例如，如图3所示，可以以“kana(中文意思是“假名”)：[开始播放标识]振假名[开始播放标识]振假名……”的格式存储。

这样，在原Meta段中追加读音的相关信息，由于Meta段解析机制比较宽松，所以即使在原Meta段中追加读音的相关信息，也不会影响格式的变化，不会引起音频应用程序的异常。

可选的，可以按照歌词正文中的每行歌词与读音相对应，相应处理可以如下：

确定目标歌词中每行歌词中多音字词的读音、以及每行歌词中多音字词的读音的展示信息；将每行歌词中多音字词的读音、以及每行歌词中多音字词的读音的展示信息，分别存储至目标歌词正文的附加部分。

在实施中，服务器可以基于目标歌词的标识，查找到目标歌词正文中每行歌词，然后确定每行歌词中多音字词的读音、以及每个读音的展示信息，然后将每行歌词中多音字词的读音、以及每个读音的展示信息分别存储至目标歌词正文的附加部分。例如，如图4所示，可以按照以下格式存储：

“[kana2:读音、以及读音的展示信息]

[kana6:读音、以及读音的展示信息]

[……]”其中。

其中，2表示第二行歌词对应的多音字词的注音，6表示第六行歌词对应的多音字词的注音，注音中包括读音、以及读音的展示信息。

方式二：将目标歌词中多音字词的读音，以及目标歌词中多音字词的读音的展示信息，存储至目标歌词对应的注音文件。

其中，注音文件是用于存储多音字词的读音、以及读音的展示信息的文件，每个歌词对应有一个注音文件，使用歌词的标识进行区分。在没有存储读音以及读音的展示信息时，注音文件依然存储，只不过是空的，或者，在没有存储读音以及读音的展示信息时，没有注音文件，在存储时新建。

在实施中，服务器可以基于目标歌词的标识，获取目标歌词的注音文件，然后在注音文件中，按照文本的记录格式，将多音字词的读音、以及多音字词的读音的展示信息，存储在注音文件中，例如，可以以“kana：[开始播放标识]振假名[开始播放标识]振假名……”的格式存储。

需要说明的是，对于步骤103中，展示信息为每个振假名的开始播放标识，多音字词为“雨の空港”(中文意思是“雨中的机场”)，歌词正文中存储的是“(39112)雨(39803)の(40356)空(40606)港(41176)”。“雨の空港”的读音为“あめのくうこう”，可以在附加部分或注音文件中存储“kana：(39112)あ(39921)め(40356)くう(40606)こう”，“()”中的内容表示紧跟的内容的开始播放标识，如(39921)表示“あ”开始播放标识。这样，基于开始播放标识可以获取到读音，(39112)与“雨”、“あめ”相对应，(40356)与“空”、“くう”相对应等。这样，后续在播放歌曲过程中，可以直接基于开始播放标识获取到读音。

对于步骤103中，展示信息为第一个振假名的开始播放标识，多音字词为“絆”(中文意思是“牵绊”)，歌词正文中存储的是“(40576)絆”。“絆”的读音为“きずな”，可以在附加部分或注音文件中存储“kana：(40576)きずな”，由于三个振假名的播放时长相同，可以基于(40576)和“絆”后一个字的开始播放标识(如果开始播放标识是时间戳，两个时间戳之差的绝对值即为三个振假名的总播放时长)，确定出三个振假名的总播放时长，然后除以三，得到三个振假名中每个振假名的播放时长。这样，后续在播放歌曲过程中，可以基于第一个振假名的开始播放标识，获取到读音，例如，使用(40576)就可以查找到读音是“きずな”，将“絆”与“きずな”相对应。

还需要说明的是，展示信息为每个振假名的开始播放标识或第一个振假名的开始播放标识时，后续在播放歌曲过程中，获取歌词时可以使用歌词正文中多音字词的开始播放标识，在注音文件或附加信息中，查找到该开始播放标识对应的读音，然后进行显示，这样，可以实现多音字词与读音相对应。

本发明另一实施例提供了隐式存储注音的方法，如图5所示，相应的步骤可以如下：

步骤501，接收目标歌词的注音存储请求。

其中，注音包括读音和读音的展示信息。

在实施中，用户可以在终端中安装音频应用程序，音频应用程序可以为用户提供接口，供编辑歌词、以及多音字词的读音。对于某首歌曲的歌词(后续可以称为目标歌词)，用户可以为目标歌词中的多音字词标注读音，以及每个读音中各振假名的开始时间戳，然后点击提交按键，终端则会生成注音存储请求，并在其中携带目标歌词的标识、多音字词的读音、以及每个读音中各振假名的开始时间戳。然后向服务器发送目标歌词的注音存储请求。服务器接收到终端发送的注音存储请求后，可以从中解析得到目标歌词的标识、多音字词的读音、以及每个读音中各振假名的开始时间戳。

步骤502，获取目标歌词中多音字词的读音，并确定多音字词的读音中各振假名的播放时长。

步骤502的处理可以参见步骤102的处理，此处不再赘述。

步骤503，对于多音字词中任一多音字词，如果多音字词的读音中各振假名的播放时长不相同，则获取多音字词中汉字的数目、以及多音字词的读音中每个振假名的开始播放标识，确定为多音字词的读音的展示信息；如果多音字词的读音中各振假名的播放时长相同，则获取多音字词中汉字的数目，确定为多音字词的读音的展示信息。

在实施中，对于目标歌词中多音字词中的任一多音字词，可以确定各振假名的播放时长是否相同，如果不相同，则可以确定该多音字词中汉字的数目，以及该多音字词的读音中每个振假名的开始播放标识，将其确定多音字词的读音为展示信息。如果相同，则可以确定该多音字词中包含汉字的数目，确定为多音字词的读音的展示信息。

需要说明的是，这是隐式标注读音，例如，日语中“欠片の絆”(中文意思是“碎片的牵绊”)，读音可以是“2かけら1きずな”，“2”表示后面是两个字的读音，即“欠片”，“1”表示后面是一个字的读音，即“絆”的读音，由于多音字词“欠片”的读音中三个振假名的播放时长不相同，“欠片”的注音可以是“2か(1000)け(1500)ら(2000)1きずな”，“1000”、“1500”“2000”表示开始播放标识，对于多音字词“絆”的读音中三个振假名的播放时长相同，可以仅标注汉字的数目。另外，对于振假名的播放时长不相同时，还可以标注播放时长，例如，欠片”的展示信息可以是“2か(1000,500)け(1500,500)ら(2000,1000)”，500、500、1000分别表示“か”、“け”、“ら”的播放时长。这样，对于播放时长相同的振假名，可以省去播放时间标识，可以节约存储资源。

步骤504，将目标歌词中多音字词的读音，以及目标歌词中多音字词的读音的展示信息与目标歌词对应存储。

步骤504的处理可以参见步骤104的处理，此处不再赘述。

可选的，对于多音字词的读音的展示信息包括多音字词中汉字的数目的情况，在存储时，需要按照多音字词在正文中的顺序，存储多音字词的读音。例如，多音字词有“欠片の絆”(中文意思是“碎片的牵绊”)，在存储读音时，由于“欠片”在“絆”之前，存储顺序是“欠片”的读音在“絆”之前，也即是“2かけら1きずな”。

其中，目标歌词正文的附加部分可以是歌词Meta段，指与歌词渲染内容无关，用于记载歌词的附加部分，例如，图2中，在LRC(lyric)格式的歌词中，在歌词正文的前面，有如下内容al:本歌所在的唱片集，ar:演出者-歌手，au：歌词作者-作曲家，by:LRC(lyric)文件的创建者等。

在实施中，服务器可以基于目标歌词的标识，获取到目标歌词正文的附加部分，然后在附加部分中，按照附加部分的记录格式，将多音字词的读音、以及多音字词的读音的展示信息，存储在目标歌词正文的附加部分，例如，图3中，可以以“kana(中文意思是“假名”)：[开始播放标识]振假名[开始播放标识]振假名……”的格式存储。

在实施中，服务器可以基于目标歌词的标识，查找到目标歌词正文中每行歌词，然后确定每行歌词中多音字词的读音、以及每个读音的展示信息，然后将每行歌词中多音字词的读音、以及每个读音的展示信息分别存储至目标歌词正文的附加部分。例如，图4中，可以按照以下格式存储：

“[kana2:读音、以及读音的展示信息]

[kana6:读音、以及读音的展示信息]

[……]”其中。

需要说明的是，对于步骤503中，展示信息为多音字词中汉字的数目。多音字词为“絆”(中文意思是“牵绊”)，歌词正文中存储的是“(40576)絆”，“絆”的读音为“きずな”，可以在附加部分或注音文件中存储“kana：1きずな”，“1”表示是一个字的读音，也就是“絆”的读音，由于三个振假名的播放时长相同，可以基于歌词正文中“絆”的开始播放标识与“絆”后一个字的开始播放标识(如果开始播放标识是时间戳，两个时间戳之差的绝对值即为三个振假名的总播放时长)，确定出三个振假名的总播放时长，然后除以三，得到三个振假名中每个振假名的播放时长。

对于步骤503中，展示信息为多音字词中汉字的数目、以及多音字词的读音中每个振假名的开始播放标识，多音字词为“欠片”(中文意思是“碎片”)，歌词正文中存储的是“(40569)欠片”。“欠片”读音为“かけら”，可以在附加部分或注音文件中存储“kana：2か(1000)け(1500)ら(2000)”，“2”表示是两个字的读音，也就是“欠片”的读音，由于三个振假名的播放时长不相同，可以为每个振假名标记开始播放标识，“1000”、“1500”“2000”表示开始播放标识。另外，附加部分或注音文件中存储的还可以是“kana：2か(1000,500)け(1500,500)ら(2000,1000)”，500、500、1000分别表示“か”、“け”、“ら”的播放时长。

需要说明的是，对于展示信息为多音字词中汉字的数目、以及多音字词的读音中每个振假名的开始播放标识，或多音字词的汉字的数目，后续在使用过程中，在获取目标歌词时，服务器可以获取目标歌词的歌词正文的编码，然后根据获取到的编码，确定目标歌词正文中哪些词是多音字词，需要标注读音，确定目标歌词正文中第一个多音字词，然后确定第一个多音字词中汉字的数目为“kana：”中第一个数目，将第一个多音字词与“kana：”中的第一个读音对应，并确定目标歌词正文中第二个多音字词，第二个多音字词中汉字的数目为“kana：”中第二个数目，将第二个多音字词与“kana：”中的二个读音对应，依次类推。例如，在目标歌词正文中确定出的第一个多音字词为“欠片”，汉字数目为2，在注音中第一个读音为2かけら，可以将“かけら”确定为“欠片”的读音。

另外，在本发明上述两个实施例中，还提供了服务器自己确定多音字词的读音的方法，相应的处理可以如下：

服务器中设置有词典，词典中记录有多个多音字词的读音、原型以及词性，以及与不同的词相邻时，不同的读音，例如，日语中“思出”，在“思い出を”(中文意思是“把回忆”)中“思”的读音为“おも”，“出”的读音为“で”，在“思い出し”(中文意思是“请想起回忆”)中“思”的读音为“おも”，“出”的读音为“だ”。所以在实际查找词典时，可以使用最长匹配原则，查看多音字词的后一个字或多个字，得到该多用词的读音。另外，还可以使用其它方式进行确定对多音，此处仅为一种可行的方式。

另外，对于本发明上述两个实施例中，在附加部分中，存储读音时，不一定是“kana：[开始播放标识]振假名[开始播放标识]振假名……”，还可以使用“[syllables(中文意思是“音节”):[开始播放标识]振假名[开始播放标识]振假名……”或“[syll(中文意思是“音节”):[开始播放标识]振假名[开始播放标识]振假名……”，或者其它方式。歌词正文的附加部分一般是设置在歌词正文的前面，同理还可以设置歌词正文的后面。

还需要说明的是，本发明上述两个实施例中的存储方式可以应用于使用卡拉OK格式的歌词。本发明实施例中，用日语中的歌曲进行方案的描述，同样可以用于其他语言歌词中多音字词的渲染，如法语、英语等。

基于相同的技术构思，本发明实施例还提供了一种存储歌词注音的装置，如图6所示，该装置包括：

接收模块610，用于接收目标歌词的注音存储请求；

获取模块620，用于获取所述目标歌词中多音字词的读音，并确定所述多音字词的读音中各振假名的播放时长；

确定模块630，用于对于所述多音字词中任一多音字词，如果所述多音字词的读音中各振假名的播放时长不相同，则获取所述多音字词的读音中每个振假名的开始播放标识，确定为所述多音字词的读音的展示信息，如果所述多音字词的读音中各振假名的播放时长相同，则获取所述多音字词的读音中第一个振假名的开始播放标识，确定为所述多音字词的读音的展示信息；

存储模块640，用于将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息与所述目标歌词对应存储。

可选的，所述存储模块640，用于：

基于相同的技术构思，本发明实施例还提供了一种存储歌词注音的装置，如图7所示，该装置包括：

第一接收模块710，用于接收目标歌词的注音存储请求；

第一获取模块720，用于获取所述目标歌词中多音字词的读音，并确定所述目标歌词的多音字词的读音中各振假名的播放时长；

第一确定模块730，用于对于所述多音字词中任一多音字词，如果所述多音字词的读音中各振假名的播放时长不相同，则获取所述多音字词中汉字的数目、以及所述多音字词的读音中每个振假名的开始播放标识，确定为所述多音字词的读音的展示信息；如果所述多音字词的读音中各振假名的播放时长相同，则获取所述多音字词中汉字的数目，确定为所述多音字词的读音的展示信息；

第一存储模块740，用于将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息与所述目标歌词对应存储。

可选的，所述第一存储模块740，用于：

可选的，所述第一存储模块740，用于

需要说明的是：上述实施例提供的存储歌词注音的装置在存储歌词注音时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的存储歌词注音的装置与存储注音的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图8示出了本发明一个示例性实施例提供的终端800的结构框图。该终端800可以是：智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio LayerIV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端800包括有：处理器801和存储器802。

处理器801可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器801可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器801还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器802可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器801所执行以实现本申请中方法实施例提供的存储歌词注音的方法。

在一些实施例中，终端800还可选包括有：外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地，外围设备包括：射频电路804、触摸显示屏805、摄像头806、音频电路807、定位组件808和电源809中的至少一种。

外围设备接口803可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中，处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上；在一些其他实施例中，处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路804用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路804包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路804还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏805用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时，显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时，显示屏805还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏805可以为一个，设置终端800的前面板；在另一些实施例中，显示屏805可以为至少两个，分别设置在终端800的不同表面或呈折叠设计；在再一些实施例中，显示屏805可以是柔性显示屏，设置在终端800的弯曲表面上或折叠面上。甚至，显示屏805还可以设置成非矩形的不规则图形，也即异形屏。显示屏805可以采用LCD(LiquidCrystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件806用于采集图像或视频。可选地，摄像头组件806包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器801进行处理，或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路807还可以包括耳机插孔。

定位组件808用于定位终端800的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件808可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。

电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端800还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于：加速度传感器811、陀螺仪传感器812、压力传感器813、指纹传感器814、光学传感器815以及接近传感器816。

加速度传感器811可以检测以终端800建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号，控制触摸显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器812可以检测终端800的机体方向及转动角度，陀螺仪传感器812可以与加速度传感器811协同采集用户对终端800的3D动作。处理器801根据陀螺仪传感器812采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器813可以设置在终端800的侧边框和/或触摸显示屏805的下层。当压力传感器813设置在终端800的侧边框时，可以检测用户对终端800的握持信号，由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在触摸显示屏805的下层时，由处理器801根据用户对触摸显示屏805的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器814用于采集用户的指纹，由处理器801根据指纹传感器814采集到的指纹识别用户的身份，或者，由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器801授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置终端800的正面、背面或侧面。当终端800上设置有物理按键或厂商Logo时，指纹传感器814可以与物理按键或厂商Logo集成在一起。

光学传感器815用于采集环境光强度。在一个实施例中，处理器801可以根据光学传感器815采集的环境光强度，控制触摸显示屏805的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏805的显示亮度；当环境光强度较低时，调低触摸显示屏805的显示亮度。在另一个实施例中，处理器801还可以根据光学传感器815采集的环境光强度，动态调整摄像头组件806的拍摄参数。

接近传感器816，也称距离传感器，通常设置在终端800的前面板。接近传感器816用于采集用户与终端800的正面之间的距离。在一个实施例中，当接近传感器816检测到用户与终端800的正面之间的距离逐渐变小时，由处理器801控制触摸显示屏805从亮屏状态切换为息屏状态；当接近传感器816检测到用户与终端800的正面之间的距离逐渐变大时，由处理器801控制触摸显示屏805从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图8中示出的结构并不构成对终端800的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种存储歌词注音的方法，其特征在于，所述方法包括：

接收目标歌词的注音存储请求；

2.根据权利要求1所述的方法，其特征在于，所述将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息与所述目标歌词对应存储，包括：

3.根据权利要求2所述的方法，其特征在于，所述将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息，存储至所述目标歌词正文的附加部分，包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息与所述目标歌词对应存储，包括：

5.一种存储歌词注音的方法，其特征在于，所述方法包括：

接收目标歌词的注音存储请求；

6.根据权利要求5所述的方法，其特征在于，所述将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息与所述目标歌词对应存储，包括：

7.根据权利要求6所述的方法，其特征在于，所述将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息，存储至所述目标歌词正文的附加部分，包括：

8.根据权利要求5所述的方法，其特征在于，所述将所述目标歌词中多音字词的读音，以及所述目标歌词中多音字词的读音的展示信息与所述目标歌词对应存储，包括：

9.一种存储歌词注音的装置，其特征在于，所述装置包括：

接收模块，用于接收目标歌词的注音存储请求；

10.根据权利要求9所述的装置，其特征在于，所述存储模块，用于：

11.根据权利要求10所述的装置，其特征在于，所述存储模块，用于：

12.根据权利要求9所述的装置，其特征在于，所述存储模块，用于：

13.一种存储歌词注音的装置，其特征在于，所述装置包括：

第一接收模块，用于接收目标歌词的注音存储请求；

14.根据权利要求13所述的装置，其特征在于，所述第一存储模块，用于：

15.根据权利要求14所述的装置，其特征在于，所述第一存储模块，用于：

16.根据权利要求13所述的装置，其特征在于，所述第一存储模块，用于