CN111859014A - 数据标注方法及装置 - Google Patents

数据标注方法及装置 Download PDF

Info

Publication number
CN111859014A
CN111859014A CN202010605963.XA CN202010605963A CN111859014A CN 111859014 A CN111859014 A CN 111859014A CN 202010605963 A CN202010605963 A CN 202010605963A CN 111859014 A CN111859014 A CN 111859014A
Authority
CN
China
Prior art keywords
playing time
determining
time length
note
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010605963.XA
Other languages
English (en)
Inventor
刘腾飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202010605963.XA priority Critical patent/CN111859014A/zh
Publication of CN111859014A publication Critical patent/CN111859014A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

本申请实施例提供了一种数据标注方法及装置,属于数据处理技术领域。数据标注方法包括:获取目标歌曲的目标数据,其中,目标数据包括播放总时长、简谱和歌词;根据播放总时长和简谱包含的乐理规律,确定简谱中每个音符的第一播放时长;根据第一播放时长,标注歌词中每个文字的起始播放时间。本申请实施例提供的数据标注方法及装置,能够提高歌词标注效率。

Description

数据标注方法及装置
技术领域
本申请属于数据处理技术领域,具体涉及一种数据标注方法及装置。
背景技术
数据标注是对数据进行加工、处理的一种行为。目前对数据进行标注主要采用人工方式进行标注。比如,采用人工方式标注歌曲的歌词中每一个文字对应的时间戳,以便音乐播放程序在播放该歌曲时,可以根据播放进度依靠时间戳精确定位到歌曲演唱到哪个文字,便于在界面上进行歌词进度显示。
但是,在实现本申请过程中,发明人发现相关技术中至少存在如下问题:标注歌曲的歌词中每一个文字对应的时间戳,歌词标注时间长,歌词标注效率较低。
发明内容
本申请实施例的目的是提供一种数据标注方法及装置,能够解决歌词标注效率较低的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种数据标注方法,包括:
获取目标歌曲的目标数据,其中,目标数据包括播放总时长、简谱和歌词;
根据播放总时长和简谱包含的乐理规律,确定简谱中每个音符的第一播放时长;
根据第一播放时长,标注歌词中每个文字的起始播放时间。
第二方面,本申请实施例提供了一种数据标注装置,包括:
第一获取模块,用于获取目标歌曲的目标数据,其中,目标数据包括播放总时长、简谱和歌词;
第一确定模块,用于根据播放总时长和简谱包含的乐理规律,确定简谱中每个音符的第一播放时长;
标注模块,用于根据第一播放时长,标注歌词中每个文字的起始播放时间。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法的步骤。
在本申请实施例中,通过歌曲的播放总时长及包含乐理规律的简谱,即可自动对该歌曲的歌词中每个文字的播放时间全部进行标注,而相关技术中需要用户多次标注才能将歌曲的歌词中每个文字的播放时间全部进行标注。因此,通过本申请实施例,能够缩短歌词标注时间,提高歌词标注效率。
附图说明
图1是本申请实施例提供的数据标注方法的流程示意图;
图2是本申请实施例提供的歌曲“祝你生日快乐”的简谱;
图3是本申请实施例提供的简谱中的每个音符的第一播放时长的示意图;
图4是本申请实施例提供的简谱中的每个音符的起始播放时间的示意图;
图5是本申请实施例提供的歌词标注的结果示意图;
图6是本申请实施例提供的数据标注装置的流程示意图;
图7是本申请实施例提供的一种电子设备的示意图;
图8是实现本申请实施例的一种电子设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的数据标注方法及装置进行详细地说明。
图1是本申请实施例提供的一种数据标注方法的流程示意图。数据标注方法可以包括:
S101:获取目标歌曲的目标数据。
其中,目标数据包括播放总时长、简谱和歌词,即目标歌曲对应的播放总时长、简谱和歌词。
S102:根据播放总时长和简谱包含的乐理规律,确定简谱中每个音符的第一播放时长。
S103:根据第一播放时长,标注歌词中每个文字的起始播放时间。
上述各步骤的具体实现方式将在下文中进行详细描述。
在本申请实施例中,通过歌曲的播放总时长及包含乐理规律的简谱,即可自动的一次性对该歌曲的歌词中每个文字的播放时间全部进行标注,而相关技术中需要用户多次标注才能将歌曲的歌词中每个文字的播放时间全部进行标注。因此,通过本申请实施例,能够缩短歌词标注时间,提高歌词标注效率。
示例性的,下面以S101中的目标歌曲为“祝你生日快乐”为例进行说明。
歌曲“祝你生日快乐”的播放总时长为33000毫秒(ms),歌曲“祝你生日快乐”的简谱如图2所示。图2是本申请实施例提供的歌曲“祝你生日快乐”的简谱。歌曲“祝你生日快乐”的歌词为:祝你生日快乐祝你生日快乐祝你生日快乐祝你生日快乐。
在本申请实施例的一些可能实现中,S102可以包括:根据乐理规律,确定目标歌曲的总节拍数;根据播放总时长和总节拍数,确定单个节拍的第一时长;根据第一时长,确定简谱中每个音符的第一播放时长。
示例性的,还以目标歌曲为“祝你生日快乐”为例进行说明。
根据歌曲“祝你生日快乐”的简谱的乐谱规律,确定歌曲“祝你生日快乐”的总节拍数为11,则歌曲“祝你生日快乐”的单个节拍的第一时长为:33000ms/11=3000ms。根据歌曲“祝你生日快乐”的单个节拍的第一时长3000ms,确定歌曲“祝你生日快乐”的简谱中每个音符的第一播放时长。
在本申请实施例的一些可能实现中,根据第一时长,确定简谱中每个音符的第一播放时长,可以包括:根据乐理规律,确定单个节拍包括的音节数;针对目标节拍,根据乐理规律,确定目标节拍的音符数;根据第一时长、音符数和音节数,确定目标节拍中每个音符的第一播放时长。
示例性的,还以目标歌曲为“祝你生日快乐”为例进行说明。
根据歌曲“祝你生日快乐”的简谱的乐谱规律,确定单个节拍包括的音节数为3,即每个节拍包括3个音节。
在本申请实施例的一些可能实现中,根据第一时长、音符数和音节数,确定目标节拍中每个音符的第一播放时长,可以包括:在音符数不大于音节数的情况下,确定目标节拍中每个音符的第一播放时长为第二播放时长;其中,第二播放时长为第一时长与音符数的比值;在音符数大于音节数的情况下,确定目标节拍中第一音符的第一播放时长为第三播放时长,并确定目标节拍中第二音符的第一播放时长为第四播放时长;其中,第一音符对应一个音节,多个第二音符对应一个音节,第三播放时长为第一时长与音节数的比值,第四播放时长为第三播放时长与对应一个音节的第二音符的数量的比值。
示例性的,还以目标歌曲为“祝你生日快乐”为例进行说明。
节拍“55”对应3个音节,两个音符(5和5)。节拍“55”音符数小于音节数,则确定节拍“55”中每个音符的第一播放时长为第一时长3000ms/2=1500ms。
节拍“
Figure BDA0002561064790000051
”对应3个音节,三个音符(6、5和
Figure BDA0002561064790000052
)。节拍“
Figure BDA0002561064790000053
”音符数等于音节数,则确定节拍“
Figure BDA0002561064790000054
”中每个音符的第一播放时长为第一时长3000ms/3=1000ms。
节拍“76-”对应3个音节,三个音符(6、5和-)。其中,节拍“76-”中“-”为占位符。节拍“76-”音符数等于音节数,则确定节拍“76-”中每个音符的第一播放时长为第一时长3000ms/3=1000ms。
节拍“
Figure BDA0002561064790000055
”对应3个音节,四个音符(0、0、
Figure BDA0002561064790000056
Figure BDA0002561064790000057
)。其中,节拍“
Figure BDA0002561064790000058
”中“0”为休止符,每一个音符0对应一个音节,两个音符“
Figure BDA00025610647900000510
”对应一个音节。节拍“
Figure BDA0002561064790000059
”音符数大于音节数,其中,则确定节拍“
Figure BDA00025610647900000511
”中第一个音符0的第一播放时长为第一时长3000ms/3=1000ms,第二个音符0的第一播放时长为第一时长3000ms/3=1000ms,每个音符“
Figure BDA00025610647900000512
”的第一播放时长为1000ms/2=500ms。
通过上述,可以确定出歌曲“祝你生日快乐”简谱中每个音符的第一播放时长。歌曲“祝你生日快乐”简谱中每个音符的第一播放时长如图3所示。图3是本申请实施例提供的简谱中的每个音符的第一播放时长的示意图。
当确定出目标歌曲的简谱中每个音符的第一播放时长后,可以确定出目标歌曲的简谱中每个音符的起始播放时间。
示例性的,歌曲“祝你生日快乐”的第一个音符“5”的起始播放时间为第0ms。第一个音符“5”的第一播放时长为1500ms,则第二个音符“5”的起始播放时间为第1500ms。第二个音符“5”的第一播放时长为1500ms,则第三个音符“6”的起始播放时间为第3000ms,依次类推,可以确定出歌曲“祝你生日快乐”简谱中每个音符的起始播放时间,如图4所示。图4是本申请实施例提供的简谱中的每个音符的起始播放时间的示意图。
在本申请实施例的一些可能实现中,S103中的文字指汉字。简谱中的音符“-”和“0”等不对应汉字,音符“1”、“2”、“3”、“4”、“5”、“6”和“7”分别对应一个汉字,但出现连音符时,仅连音符对应的第一个音符(“1”、“2”、“3”、“4”、“5”、“6”或“7”)对应一个汉字。
在本申请实施例的一些可能实现中,S103可以包括:根据目标文字的起始播放时间和第一播放时长,标注歌词中每个文字的起始播放时间。
在本申请实施例的一些可能实现中,目标文字,可以包括以下所列项中的任意一种:
歌词中的第一个文字、歌词中的最后一个文字和用户指定的歌词中的文字。
在本申请实施例的一些可能实现中,在目标文字包括用户指定的歌词中的文字的情况下,在根据目标文字的起始播放时间和第一播放时长,标注歌词中每个文字的起始播放时间之前,本申请实施例提供的数据标注方法还可以包括:接收用户指定目标文字的参考播放时间的第一输入;响应于第一输入,根据参考播放时间,确定对应参考播放时间的音符的第一起始播放时间;将第一起始播放时间,确定为目标文字的起始播放时间。
可以理解的是,用户指定的文字可以为歌词中的任意一个文字,包括但不限于歌词中的第一个文字、歌词中的最后一个文字。
示例性的,还以目标歌曲为“祝你生日快乐”为例进行说明。
假设用户指定歌曲“祝你生日快乐”的歌词中第一个“乐”字的参考播放时间为第6600ms。则根据歌曲“祝你生日快乐”的歌词中第一个“乐”字的参考播放时间第6600ms,简谱中的音符“7”的起始播放时间为第6000ms,播放时间为1000ms,则简谱中的音符“7”的终止播放时间为第7000ms。参考播放时间第6600ms在第6000ms到第7000ms之间,也就是说,参考播放时间第6600ms对应简谱中的音符“7”,则将歌曲“祝你生日快乐”的歌词中第一个“乐”字的起始播放时间确定为第6000ms。当将歌曲“祝你生日快乐”的歌词中第一个“乐”字的起始播放时间确定为第6000ms后,可以根据歌曲“祝你生日快乐”的歌词中第一个“乐”字的起始播放时间和第一播放时长,标注歌词中每个文字的起始播放时间。
示例性的,对于歌曲“祝你生日快乐”的歌词中第一个“乐”字前的“快”字对应音符“7”前的音符“
Figure BDA0002561064790000071
”,则标注歌曲“祝你生日快乐”的歌词中第一个“乐”字前的“快”字的起始播放时间为音符“7”前的音符“
Figure BDA0002561064790000072
”的起始播放时间第5000ms,依次类推。
对于歌曲“祝你生日快乐”的歌词中第一个“乐”字后的“祝”字,音符7后面为占位符“-”,不对应文字,则歌曲“祝你生日快乐”的歌词中第一个“乐”字后的“祝”字对应占位符“-”后的音符“5”,则标注歌曲“祝你生日快乐”的歌词中第一个“乐”字后的“祝”字的起始播放时间为占位符“-”后的音符“5”的起始播放时间第8000ms,依次类推。
通过本申请实施例,用户指定歌词中任意一个文字的参考播放时间,均可对歌词的每个文字的起始播放时间进行标注。便于用户操作,能够提高用户体验。
在本申请实施例的一些可能实现中,歌词中预设位置的文字可以包括:歌词中的第一个文字或最后一个文字。
在本申请实施例的一些可能实现中,在目标文字包括目标歌曲的歌词中的第一个文字的情况下,在根据目标文字的起始播放时间和第一播放时长,标注歌词中每个文字的起始播放时间之前,本申请实施例提供的数据标注方法还可以包括:获取歌词中第一句歌词的第二起始播放时间;将第二起始播放时间,确定为第一个文字的起始播放时间。
示例性的,还以目标歌曲为“祝你生日快乐”为例进行说明。
歌曲“祝你生日快乐”的歌词为:祝你生日快乐祝你生日快乐祝你生日快乐祝你生日快乐。歌曲“祝你生日快乐”的歌词包括四句歌词,四句歌词分别为“祝你生日快乐”、“祝你生日快乐”、“祝你生日快乐”和“祝你生日快乐”。
在已经实现逐句播放歌词的情况下,可以获取到歌词中每句歌词的起始播放时间。
假设获取到歌曲“祝你生日快乐”的歌词中的第一句歌词的起始播放时间为第0ms。则将歌曲“祝你生日快乐”的歌词中第一个文字(“祝”字)的起始播放时间确定为第0ms。当将歌曲“祝你生日快乐”的歌词中第一个文字(“祝”字)的起始播放时间确定为第0ms后,可以根据歌曲“祝你生日快乐”的歌词中第一个文字(“祝”字)的起始播放时间(“第0ms”)和第一播放时长,标注歌词中每个文字的起始播放时间。
示例性的,对于歌曲“祝你生日快乐”的歌词中第一个“祝”字后的“你”字对应音符“5”后的音符“5”,则标注歌曲“祝你生日快乐”的歌词中第一个“祝”字后的“你”字的起始播放时间为音符“5”后的音符“5”的起始播放时间第1500ms,依次类推。
对于歌曲“祝你生日快乐”的歌词中第一个“乐”字后的“祝”字,音符7后面为占位符“-”,不对应文字,则歌曲“祝你生日快乐”的歌词中第一个“乐”字后的“祝”字对应占位符“-”后的音符“5”,则标注歌曲“祝你生日快乐”的歌词中第一个“乐”字后的“祝”字的起始播放时间为占位符“-”后的音符“5”的起始播放时间第8000ms,依次类推。
通过本申请实施例,无需用户输入,即可对歌词的每个文字的起始播放时间进行标注。能够提高歌词标注效率。
在本申请实施例的一些可能实现中,在目标文字包括目标歌曲的歌词中的最后一个文字的情况下,在根据目标文字的起始播放时间和第一播放时长,标注歌词中每个文字的起始播放时间之前,本申请实施例提供的数据标注方法还可以包括:获取歌词中最后一句歌词的终止播放时间;将终止播放时间对应的音符的起始播放时间,确定为最后一个文字的起始播放时间。
在已经实现逐句播放歌词的情况下,可以获取到歌词中每句歌词的终止播放时间。
示例性的,还以目标歌曲为“祝你生日快乐”为例进行说明。
歌曲“祝你生日快乐”的歌词为:祝你生日快乐祝你生日快乐祝你生日快乐祝你生日快乐。歌曲“祝你生日快乐”的歌词包括四句歌词,四句歌词分别为“祝你生日快乐”、“祝你生日快乐”、“祝你生日快乐”和“祝你生日快乐”。
假设获取到歌曲“祝你生日快乐”的歌词中的最后一句歌词的终止播放时间为第28000ms。获取到第28000ms对应的音符为:起始播放时间为第27000ms,播放时长为1000ms的音符“
Figure BDA0002561064790000091
”。则将该音符“
Figure BDA0002561064790000092
”的起始播放时间第27000ms确定为歌曲“祝你生日快乐”的歌词中最后一个文字(“乐”字)的起始播放时间。当将歌曲“祝你生日快乐”的歌词中最后一个文字(“乐”字)的起始播放时间确定为第27000ms后,可以根据歌曲“祝你生日快乐”的歌词中最后一个文字(“乐”字)的起始播放时间(“第27000ms”)和第一播放时长,标注歌词中每个文字的起始播放时间。
示例性的,对于歌曲“祝你生日快乐”的歌词中最后一个文字(“乐”字)前的“快”字对应音符“
Figure BDA0002561064790000093
”前的音符“
Figure BDA0002561064790000094
”,则标注歌曲“祝你生日快乐”的歌词中最后一个文字(“乐”字)前的“快”字的起始播放时间为音符“
Figure BDA0002561064790000096
”前的音符“
Figure BDA0002561064790000095
”的起始播放时间第26000ms,依次类推。
通过本申请实施例,无需用户输入,即可对歌词的每个文字的起始播放时间进行标注。能够提高歌词标注效率。
在本申请实施例的一些可能实现中,根据第一播放时长,标注歌词中每个文字的起始播放时间,可以包括:根据歌词中每句歌词的起始播放时间和第一播放时长,标注每句歌词中每个文字的起始播放时间;或,根据歌词中每句歌词的终止播放时间和第一播放时长,标注每句歌词中每个文字的起始播放时间。
在已经实现逐句播放歌词的情况下,可以获取到歌词中每句歌词的起始播放时间和终止播放时间。
示例性的,还以目标歌曲为“祝你生日快乐”为例进行说明。
歌曲“祝你生日快乐”的歌词为:祝你生日快乐祝你生日快乐祝你生日快乐祝你生日快乐。歌曲“祝你生日快乐”的歌词包括四句歌词,四句歌词分别为“祝你生日快乐”、“祝你生日快乐”、“祝你生日快乐”和“祝你生日快乐”。
假设获取到歌曲“祝你生日快乐”的歌词中的第一句歌词“祝你生日快乐”的起始播放时间为第0ms。获取到歌曲“祝你生日快乐”的歌词中的第二句歌词“祝你生日快乐”的起始播放时间为第8000ms。获取到歌曲“祝你生日快乐”的歌词中的第三句歌词“祝你生日快乐”的起始播放时间为第14000ms。获取到歌曲“祝你生日快乐”的歌词中的第四句歌词“祝你生日快乐”的起始播放时间为第23000ms。
根据歌曲“祝你生日快乐”的歌词中的第一句歌词“祝你生日快乐”的起始播放时间(第0ms)和第一播放时长,标注第一句歌词“祝你生日快乐”中每个文字(“祝”字、“你”字、“生”字、“日”字、“快”字和“乐”字)的起始播放时间。
根据歌曲“祝你生日快乐”的歌词中的第二句歌词“祝你生日快乐”的起始播放时间(第8000ms)和第一播放时长,标注第二句歌词“祝你生日快乐”中每个文字(“祝”字、“你”字、“生”字、“日”字、“快”字和“乐”字)的起始播放时间。
根据歌曲“祝你生日快乐”的歌词中的第三句歌词“祝你生日快乐”的起始播放时间(第14000ms)和第一播放时长,标注第三句歌词“祝你生日快乐”中每个文字(“祝”字、“你”字、“生”字、“日”字、“快”字和“乐”字)的起始播放时间。
根据歌曲“祝你生日快乐”的歌词中的第四句歌词“祝你生日快乐”的起始播放时间(第23000ms)和第一播放时长,标注第四句歌词“祝你生日快乐”中每个文字(“祝”字、“你”字、“生”字、“日”字、“快”字和“乐”字)的起始播放时间。
具体标注过程与上述过程相同,本申请实施例在此不对其进行赘述,具体可以参考上述标注过程。
再示例性的,还以目标歌曲为“祝你生日快乐”为例进行说明。
歌曲“祝你生日快乐”的歌词为:祝你生日快乐祝你生日快乐祝你生日快乐祝你生日快乐。歌曲“祝你生日快乐”的歌词包括四句歌词,四句歌词分别为“祝你生日快乐”、“祝你生日快乐”、“祝你生日快乐”和“祝你生日快乐”。
假设获取到歌曲“祝你生日快乐”的歌词中的第一句歌词“祝你生日快乐”的终止播放时间为第8000ms。获取到歌曲“祝你生日快乐”的歌词中的第二句歌词“祝你生日快乐”的终止播放时间为第14000ms。获取到歌曲“祝你生日快乐”的歌词中的第三句歌词“祝你生日快乐”的终止播放时间为第23000ms。获取到歌曲“祝你生日快乐”的歌词中的第四句歌词“祝你生日快乐”的终止播放时间为第33000ms。
根据歌曲“祝你生日快乐”的歌词中的第一句歌词“祝你生日快乐”的终止播放时间(第8000ms)和第一播放时长,标注第一句歌词“祝你生日快乐”中每个文字(“祝”字、“你”字、“生”字、“日”字、“快”字和“乐”字)的起始播放时间。
根据歌曲“祝你生日快乐”的歌词中的第二句歌词“祝你生日快乐”的终止播放时间(第14000ms)和第一播放时长,标注第二句歌词“祝你生日快乐”中每个文字(“祝”字、“你”字、“生”字、“日”字、“快”字和“乐”字)的起始播放时间。
根据歌曲“祝你生日快乐”的歌词中的第三句歌词“祝你生日快乐”的终止播放时间(第23000ms)和第一播放时长,标注第三句歌词“祝你生日快乐”中每个文字(“祝”字、“你”字、“生”字、“日”字、“快”字和“乐”字)的起始播放时间。
根据歌曲“祝你生日快乐”的歌词中的第四句歌词“祝你生日快乐”的终止播放时间(第33000ms)和第一播放时长,标注第四句歌词“祝你生日快乐”中每个文字(“祝”字、“你”字、“生”字、“日”字、“快”字和“乐”字)的起始播放时间。
具体标注过程与上述过程相同,本申请实施例在此不对其进行赘述,具体可以参考上述标注过程。
通过本申请实施例,无需用户输入,即可对歌词的每个文字的起始播放时间进行标注,能够提高歌词标注效率。并且,相比于相关技术,本申请实施例提供的数据标注方法准确度较高。
上述的歌词标注结果如图5所示。图5是本申请实施例提供的歌词标注的结果示意图。
在本申请实施例的一些可能实现中,在根据第一播放时长,标注歌词中每个文字的起始播放时间之后,本申请实施例提供的数据标注方法还可以包括:接收第二输入;响应于第二输入,修改标注错误的起始播放时间。
在本申请实施例的一些可能实现中,某些歌曲可能存在较长的前奏、间奏和尾奏,通过上述标注的歌词中可能存在错误,此时,用户可以对标注的歌词文字的起始播放时间进行修改。
比如,按照上述的过程对某一歌曲的歌词标注完成后,用户发现某部分歌词标注错误,此时,用户可以听该歌曲和看标注错误的歌词部分的起始播放时间,进而可以输入标注错误的歌词部分的起始播放时间,基于该输入对标注错误的起始播放时间进行修改。
在本申请实施例中,能够对标注错误的起始播放时间进行修改,能够提高歌曲标准的准确性。并且,用户仅需关注少量的标注位置,即可快速完成一首歌曲的歌词每个文字的播放时间全部进行标注,能够缩短歌词标注时间,提高歌词标注效率。
需要说明的是,上述与目标歌曲为歌曲“祝你生日快乐”为例进行说明,仅为本申请实施例的一具体实例,并不构成对本申请的限定。
需要说明的是,本申请实施例提供的数据标注方法,执行主体可以为数据标注装置,或者该数据标注装置中的用于执行数据标注方法的控制模块。本申请实施例中以数据标注装置执行数据标注方法为例,说明本申请实施例提供的数据标注装置。
图6是本申请实施例提供的数据标注装置的流程示意图。数据标注装置可以包括:
第一获取模块601,用于获取目标歌曲的目标数据,其中,目标数据包括播放总时长、简谱和歌词;
第一确定模块602,用于根据播放总时长和简谱包含的乐理规律,确定简谱中每个音符的第一播放时长;
标注模块603,用于根据第一播放时长,标注歌词中每个文字的起始播放时间。
在本申请实施例中,通过歌曲的播放总时长及包含乐理规律的简谱,即可一次性对该歌曲的歌词中每个文字的播放时间全部进行标注,而相关技术中需要用户多次标注才能将歌曲的歌词中每个文字的播放时间全部进行标注。因此,通过本申请实施例,能够缩短歌词标注时间,提高歌词标注效率。
在本申请实施例的一些可能实现中,第一确定模块602,可以包括:
第一确定子模块,用于根据乐理规律,确定目标歌曲的总节拍数;
第二确定子模块,用于根据播放总时长和总节拍数,确定单个节拍的第一时长;
第三确定子模块,用于根据第一时长,确定简谱中每个音符的第一播放时长。
在本申请实施例的一些可能实现中,第三确定子模块,可以包括:
第一确定单元,用于根据乐理规律,确定单个节拍包括的音节数;
第二确定单元,用于针对目标节拍,根据乐理规律,确定目标节拍的音符数;
第三确定单元,用于根据第一时长、音符数和音节数,确定目标节拍中每个音符的第一播放时长。
在本申请实施例的一些可能实现中,第三确定单元,具体可以用于:
在音符数不大于音节数的情况下,确定目标节拍中每个音符的第一播放时长为第二播放时长;其中,第二播放时长为第一时长与音符数的比值;
在音符数大于音节数的情况下,确定目标节拍中第一音符的第一播放时长为第三播放时长,并确定目标节拍中第二音符的第一播放时长为第四播放时长;其中,第一音符对应一个音节,多个第二音符对应一个音节,第三播放时长为第一时长与音节数的比值,第四播放时长为第三播放时长与对应一个音节的第二音符的数量的比值。
在本申请实施例的一些可能实现中,标注模块603,具体用于:
根据目标文字的起始播放时间和第一播放时长,标注歌词中每个文字的起始播放时间。
在本申请实施例的一些可能实现中,本申请实施例提供的数据标注装置还可以包括:
第一接收模块,用于接收用户指定目标文字的参考播放时间的第一输入;
第二确定模块,用于响应于第一输入,根据参考播放时间,确定对应参考播放时间的音符的第一起始播放时间;
第三确定模块,用于将第一起始播放时间,确定为目标文字的起始播放时间。
本申请实施例中的数据标注装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的数据标注装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的数据标注装置能够实现图1至图5的数据标注方法实施例中的各个过程,为避免重复,这里不再赘述。
可选的,如图7所示,本申请实施例还提供一种电子设备700,包括处理器701,存储器702,存储在存储器702上并可在所述处理器701上运行的程序或指令,该程序或指令被处理器701执行时实现上述数据标注方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要注意的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图8是实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备800包括但不限于:射频单元801、网络模块802、音频输出单元803、输入单元804、传感器805、显示单元806、用户输入单元807、接口单元808、存储器809、以及处理器810等部件。
本领域技术人员可以理解,电子设备800还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器810逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图8中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器810,用于获取目标歌曲的目标数据,其中,目标数据包括播放总时长、简谱和歌词;根据播放总时长和简谱包含的乐理规律,确定简谱中每个音符的第一播放时长;根据第一播放时长,标注歌词中每个文字的起始播放时间。
在本申请实施例中,通过歌曲的播放总时长及包含乐理规律的简谱,即可一次性对该歌曲的歌词中每个文字的播放时间全部进行标注,而相关技术中需要用户多次标注才能将歌曲的歌词中每个文字的播放时间全部进行标注。因此,通过本申请实施例,能够缩短歌词标注时间,提高歌词标注效率。
在本申请实施例的一些可能实现中,处理器810,具体可以用于:
根据乐理规律,确定目标歌曲的总节拍数;
根据播放总时长和总节拍数,确定单个节拍的第一时长;
根据第一时长,确定简谱中每个音符的第一播放时长。
在本申请实施例的一些可能实现中,处理器810,具体可以用于:
根据乐理规律,确定单个节拍包括的音节数;
针对目标节拍,根据乐理规律,确定目标节拍的音符数;
根据第一时长、音符数和音节数,确定目标节拍中每个音符的第一播放时长。
在本申请实施例的一些可能实现中,处理器810,具体可以用于:
在音符数不大于音节数的情况下,确定目标节拍中每个音符的第一播放时长为第二播放时长;其中,第二播放时长为第一时长与音符数的比值;
在音符数大于音节数的情况下,确定目标节拍中第一音符的第一播放时长为第三播放时长,确定目标节拍中第二音符的第一播放时长为第四播放时长;其中,第一音符对应一个音节,多个第二音符对应一个音节,第三播放时长为第一时长与音节数的比值,第四播放时长为第三播放时长与对应一个音节的第二音符的数量的比值。
在本申请实施例的一些可能实现中,处理器810,具体可以用于:
根据目标文字的起始播放时间和第一播放时长,标注歌词中每个文字的起始播放时间。
在本申请实施例的一些可能实现中,用户输入单元807,用于接收用户指定目标文字的参考播放时间的第一输入;
处理器810,还可以用于响应于第一输入,根据参考播放时间,确定对应参考播放时间的音符的第一起始播放时间;将第一起始播放时间,确定为目标文字的起始播放时间。
应理解的是,本申请实施例中,输入单元804可以包括图形处理器(GraphicsProcessing Unit,GPU)8041和麦克风8042,图形处理器8041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元806可包括显示面板8061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板8061。用户输入单元807包括触控面板8071以及其他输入设备8072。触控面板8071,也称为触摸屏。触控面板8071可包括触摸检测装置和触摸控制器两个部分。其他输入设备8072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器809可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器810可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器810中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述数据标注方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述数据标注方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (12)

1.一种数据标注方法,其特征在于,所述方法包括:
获取目标歌曲的目标数据,其中,所述目标数据包括播放总时长、简谱和歌词;
根据所述播放总时长和所述简谱包含的乐理规律,确定所述简谱中每个音符的第一播放时长;
根据所述第一播放时长,标注所述歌词中每个文字的起始播放时间。
2.根据权利要求1所述的方法,其特征在于,所述根据所述播放总时长和所述简谱包含的乐理规律,确定所述简谱中每个音符的第一播放时长,包括:
根据所述乐理规律,确定所述目标歌曲的总节拍数;
根据所述播放总时长和所述总节拍数,确定单个节拍的第一时长;
根据所述第一时长,确定所述简谱中每个音符的第一播放时长。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一时长,确定所述简谱中每个音符的第一播放时长,包括:
根据所述乐理规律,确定单个节拍包括的音节数;
针对目标节拍,根据所述乐理规律,确定所述目标节拍的音符数;
根据所述第一时长、所述音符数和所述音节数,确定所述目标节拍中每个音符的第一播放时长。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一时长、所述音符数和所述音节数,确定所述目标节拍中每个音符的第一播放时长,包括:
在所述音符数不大于所述音节数的情况下,确定所述目标节拍中每个音符的第一播放时长为第二播放时长;其中,所述第二播放时长为所述第一时长与所述音符数的比值;
在所述音符数大于所述音节数的情况下,确定所述目标节拍中第一音符的第一播放时长为第三播放时长,并确定所述目标节拍中第二音符的第一播放时长为第四播放时长;其中,所述第一音符对应一个音节,多个所述第二音符对应一个音节,所述第三播放时长为所述第一时长与所述音节数的比值,所述第四播放时长为所述第三播放时长与对应一个音节的第二音符的数量的比值。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一播放时长,标注所述歌词中每个文字的起始播放时间,包括:
根据目标文字的起始播放时间和所述第一播放时长,标注所述歌词中每个文字的起始播放时间。
6.根据权利要求5所述的方法,其特征在于,在所述根据目标文字的起始播放时间和所述第一播放时长,标注所述歌词中每个文字的起始播放时间之前,所述方法还包括:
接收用户指定所述目标文字的参考播放时间的第一输入;
响应于所述第一输入,根据所述参考播放时间,确定对应所述参考播放时间的音符的第一起始播放时间;
将所述第一起始播放时间,确定为所述目标文字的起始播放时间。
7.一种数据标注装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标歌曲的目标数据,其中,所述目标数据包括播放总时长、简谱和歌词;
第一确定模块,用于根据所述播放总时长和所述简谱包含的乐理规律,确定所述简谱中每个音符的第一播放时长;
标注模块,用于根据所述第一播放时长,标注所述歌词中每个文字的起始播放时间。
8.根据权利要求7所述的装置,其特征在于,所述第一确定模块,包括:
第一确定子模块,用于根据所述乐理规律,确定所述目标歌曲的总节拍数;
第二确定子模块,用于根据所述播放总时长和所述总节拍数,确定单个节拍的第一时长;
第三确定子模块,用于根据所述第一时长,确定所述简谱中每个音符的第一播放时长。
9.根据权利要求8所述的装置,其特征在于,所述第三确定子模块,包括:
第一确定单元,用于根据所述乐理规律,确定单个节拍包括的音节数;
第二确定单元,用于针对目标节拍,根据所述乐理规律,确定所述目标节拍的音符数;
第三确定单元,用于根据所述第一时长、所述音符数和所述音节数,确定所述目标节拍中每个音符的第一播放时长。
10.根据权利要求9所述的装置,其特征在于,所述第三确定单元,具体用于:
在所述音符数不大于所述音节数的情况下,确定所述目标节拍中每个音符的第一播放时长为第二播放时长;其中,所述第二播放时长为所述第一时长与所述音符数的比值;
在所述音符数大于所述音节数的情况下,确定所述目标节拍中第一音符的第一播放时长为第三播放时长,确定所述目标节拍中第二音符的第一播放时长为第四播放时长;其中,所述第一音符对应一个音节,多个所述第二音符对应一个音节,所述第三播放时长为所述第一时长与所述音节数的比值,所述第四播放时长为所述第三播放时长与对应一个音节的第二音符的数量的比值。
11.根据权利要求6所述的装置,其特征在于,所述标注模块,具体用于:
根据目标文字的起始播放时间和所述第一播放时长,标注所述歌词中每个文字的起始播放时间。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第一接收模块,用于接收用户指定所述目标文字的参考播放时间的第一输入;
第二确定模块,用于响应于所述第一输入,根据所述参考播放时间,确定对应所述参考播放时间的音符的第一起始播放时间;
第三确定模块,用于将所述第一起始播放时间,确定为所述目标文字的起始播放时间。
CN202010605963.XA 2020-06-29 2020-06-29 数据标注方法及装置 Pending CN111859014A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010605963.XA CN111859014A (zh) 2020-06-29 2020-06-29 数据标注方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010605963.XA CN111859014A (zh) 2020-06-29 2020-06-29 数据标注方法及装置

Publications (1)

Publication Number Publication Date
CN111859014A true CN111859014A (zh) 2020-10-30

Family

ID=72988178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010605963.XA Pending CN111859014A (zh) 2020-06-29 2020-06-29 数据标注方法及装置

Country Status (1)

Country Link
CN (1) CN111859014A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1489369A (zh) * 2003-08-11 2004-04-14 安凯(广州)软件技术有限公司 用于无线网络和无线手持式设备的卡拉ok制作方法和播放方法
KR20050108831A (ko) * 2004-05-13 2005-11-17 주식회사 금영 노래반주기의 이미지가사 디스플레이방법
CN101567184A (zh) * 2009-03-24 2009-10-28 广州酷狗计算机科技有限公司 一种卡拉ok动感歌词的制作方法
CN107220339A (zh) * 2017-05-26 2017-09-29 北京酷我科技有限公司 一种歌词逐字显示方法
CN109063069A (zh) * 2018-07-23 2018-12-21 天翼爱音乐文化科技有限公司 歌曲标签确定方法、装置、计算机设备和可读存储介质
CN109543064A (zh) * 2018-11-30 2019-03-29 北京微播视界科技有限公司 歌词显示处理方法、装置、电子设备及计算机存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1489369A (zh) * 2003-08-11 2004-04-14 安凯(广州)软件技术有限公司 用于无线网络和无线手持式设备的卡拉ok制作方法和播放方法
KR20050108831A (ko) * 2004-05-13 2005-11-17 주식회사 금영 노래반주기의 이미지가사 디스플레이방법
CN101567184A (zh) * 2009-03-24 2009-10-28 广州酷狗计算机科技有限公司 一种卡拉ok动感歌词的制作方法
CN107220339A (zh) * 2017-05-26 2017-09-29 北京酷我科技有限公司 一种歌词逐字显示方法
CN109063069A (zh) * 2018-07-23 2018-12-21 天翼爱音乐文化科技有限公司 歌曲标签确定方法、装置、计算机设备和可读存储介质
CN109543064A (zh) * 2018-11-30 2019-03-29 北京微播视界科技有限公司 歌词显示处理方法、装置、电子设备及计算机存储介质

Similar Documents

Publication Publication Date Title
RU2684665C2 (ru) Способ, устройство и компьютерный программный продукт для прокрутки партитуры
US10777096B2 (en) System for assisting in foreign language learning
CN102591520B (zh) 具备手写数学式识别功能的电子设备
JP5948671B2 (ja) マルチメディア情報検索方法及び電子機器
US10580394B2 (en) Method, client and computer storage medium for processing information
WO2019223394A1 (zh) 生成歌词、显示歌词的方法、装置、电子设备及存储介质
EP3120343A1 (en) Method of providing a user with feedback on performance of a karaoke song
EP2442299B1 (en) Information processing apparatus, information processing method, and program
CN110808065A (zh) 副歌检测方法、装置、电子设备及存储介质
CN112416229A (zh) 音频内容调整方法、装置和电子设备
CN103098124B (zh) 用于文本到语音转换的方法和系统
US20200410967A1 (en) Method for displaying triggered by audio, computer apparatus and storage medium
CN111880668A (zh) 输入显示方法、装置及电子设备
CN104102659A (zh) 搜索音乐的方法及终端
CN107945802A (zh) 语音识别结果处理方法及装置
CN112989109A (zh) 一种音乐结构分析方法、电子设备及存储介质
CN113158642A (zh) 信息处理方法、装置、电子设备及存储介质
CN109948155B (zh) 一种多意图的选择方法及装置、终端设备
CN112598961A (zh) 钢琴演奏学习方法、电子设备及计算机可读存储介质
CN111935552A (zh) 信息标注方法、装置、设备及介质
CN111859014A (zh) 数据标注方法及装置
US9176958B2 (en) Method and apparatus for music searching
WO2022100622A1 (zh) 候选词显示方法、装置和电子设备
CN109712443A (zh) 一种内容跟读方法、装置、存储介质及电子设备
CN112882680A (zh) 语音识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination