CN110688517A - 音频分配方法、装置及存储介质 - Google Patents
音频分配方法、装置及存储介质 Download PDFInfo
- Publication number
- CN110688517A CN110688517A CN201910826025.XA CN201910826025A CN110688517A CN 110688517 A CN110688517 A CN 110688517A CN 201910826025 A CN201910826025 A CN 201910826025A CN 110688517 A CN110688517 A CN 110688517A
- Authority
- CN
- China
- Prior art keywords
- labeling
- audio
- party
- user information
- distributed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/61—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/686—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Library & Information Science (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请实施例公开了一种音频分配方法、装置及存储介质,其中方法包括:获取待标注音频的第一用户信息和音频属性以及多个标注方中每一标注方的第二用户信息和处理属性;根据所述第一用户信息和每一所述第二用户信息从所述音频属性对应的预设评分列表中确定每一所述标注方的安全值;根据每一所述标注方的安全值从所述多个标注方中选取安全值大于第一阈值的标注方以得到多个待分配标注方;根据所述音频属性和每一所述待分配标注方的处理属性从所述多个待分配标注方中选取目标标注方;将所述待标注音频对应的标注任务分配给所述目标标注方。采用本申请,可提高分配音频标注任务的准确性和安全性。
Description
技术领域
本申请涉及计算机技术领域,主要涉及了一种音频分配方法、装置及存储介质。
背景技术
在现有技术中,音频标注任务基本上是基于任务量需求进行分发的,即首先统计需要进行音频标注的任务数量,再根据标注方的数量对需要进行音频标注的任务进行平均分发。然而,不同的音频标注任务对应的安全等级不同,平均分发可能导致音频标注任务分配的不准确,从而影响音频的安全性。
发明内容
本申请实施例提供了一种音频分配方法、装置及存储介质,可提高分配音频标注任务的准确性和安全性。
第一方面,本申请实施例提供一种音频分配方法,包括:
获取待标注音频的第一用户信息和音频属性,以及获取多个标注方中每一标注方的第二用户信息和处理属性;
根据所述第一用户信息和每一所述第二用户信息,从所述音频属性对应的预设评分列表中确定每一所述标注方的安全值;所述预设评分列表中的信息用于描述所述第一用户信息、所述第二用户信息以及所述安全值之间的对应关系;
根据每一所述标注方的安全值,从所述多个标注方中选取安全值大于第一阈值的标注方,以得到多个待分配标注方;
根据所述音频属性和每一所述待分配标注方的处理属性,从所述多个待分配标注方中选取目标标注方;
将所述待标注音频对应的标注任务分配给所述目标标注方。
第二方面,本申请实施例提供一种音频分配装置,其中:
处理单元,用于获取待标注音频的第一用户信息和音频属性,以及获取多个标注方中每一标注方的第二用户信息和处理属性;根据所述第一用户信息和每一所述第二用户信息,从所述音频属性对应的预设评分列表中确定每一所述标注方的安全值;所述预设评分列表中的信息用于描述所述第一用户信息、所述第二用户信息以及所述安全值之间的对应关系;根据每一所述标注方的安全值,从所述多个标注方中选取安全值大于第一阈值的标注方,以得到多个待分配标注方;根据所述音频属性和每一所述待分配标注方的处理属性,从所述多个待分配标注方中选取目标标注方;
通信单元,用于将所述待标注音频对应的标注任务分配给所述目标标注方。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,所述程序包括用于如第一方面中所描述的部分或全部步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,将具有如下有益效果:
采用了上述的音频分配方法、装置及存储介质之后,先获取待标注音频的第一用户信息和音频属性,以及多个标注方中每一标注方的第二属性信息和处理属性。然后根据第一用户信息和每一第二用户信息从音频属性对应的预设评分列表中确定每一标注方的安全值,再将安全值大于第一阈值的标注方作为待分配标注方。然后根据待标注音频的音频属性和每一待分配标注方的处理属性确定目标标注方,并将待标注音频对应的标注任务分配给目标标注方。如此,可提高分配音频标注任务的准确性和安全性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为本申请实施例提供的一种音频分配方法的流程示意图;
图2为本申请实施例提供的一种音频分配装置的结构示意图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。根据本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面对本申请实施例进行详细介绍。
请参照图1,本申请实施例提供一种音频分配方法的流程示意图。该音频分配方法应用于电子设备,本申请实施例所涉及到的电子设备可以包括各种具有无线通信功能的手持设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(user equipment,UE),移动台(mobile station,MS),终端设备(terminaldevice)等等。为方便描述,上面提到的设备统称为电子设备。
具体的,如图1所示,一种音频分配方法,应用于电子设备,其中:
S101:获取待标注音频的第一用户信息和音频属性,以及获取多个标注方中每一标注方的第二用户信息和处理属性。
在本申请实施例中,待标注音频可以为未进行标注的音频文件,也可以是用于标注方的训练过程中使用的已经标注完成的音频文件,在此不做限定。
待标注音频的第一用户信息是指该待标注音频对应的录入人员的用户信息,也就是说,录入该待标注音频的人员的用户信息。该第一用户信息可以包括该录入人员的籍贯、所在地区、年龄、职业、性别、教育背景、工作经历等相关信息,在此不做限定。
待标注音频的音频属性可包括音频类型、音频容量、音频来源、音频内容等。其中,音频容量用于描述待标注音频的数据大小。音频来源用于描述待标注音频的上传信息,例如:音频来源为微信账号,则表示该待标注音频为录入人员在微信应用中输入的音频。音频内容可包括音频对应的摘要信息。音频类型可以按照应用类型进行分类,例如:浏览器、即时通讯应用、金融管理应用等。该音频类型也可按照语种类型进行分类,例如:中文、英语、普通话、方言等。该音频类型还可以按照输入类型进行分类,例如:搜索、语音聊天等,或者音频类型还可以按照音频内容进行分类,例如:对话场景、身份验证场景等,在此也不做限定。
在本申请实施例中,标注方可以是在电子设备中音频标注系统中注册,且可处理音频标注任务的人员。该标注方的第二用户信息是指该标注方的用户信息,例如,该标注方的籍贯、所在地区、年龄、职业、性别、教育背景、工作经历等,在此不做限定。
在本申请实施例中,标注方也可以是电子设备,即基于电子设备中的计算机程序处理音频标注任务。该标注方的第二用户信息是指该标注方的硬件信息,例如,容量、剩余内存大小、物理地址、网络速度等,在此也不做限定。
标注方的处理属性可包括处理音频类型、平均标注速率等。其中,处理音频类型包括标注方已训练完成的音频类型。平均标注速率为该标注方的处理音频标注任务的平均速率。进一步的,不同类型的音频标注任务对应的处理效率不同,该平均标注速率可分为各个音频类型对应的平均标注速率。
S102:根据所述第一用户信息和每一所述第二用户信息,从所述音频属性对应的预设评分列表中确定每一所述标注方的安全值。
在本申请实施例中,安全值用于描述标注方处理待标注音频的安全性,安全值越大,则标注方处理该待标注音频越安全。预设评分列表中的信息用于描述所述第一用户信息、所述第二用户信息以及所述安全值之间的对应关系。其中,预设评分列表可详细描述了各种可能遇到的信息,或者两者对应的信息,例如,待标注音频对应的录入人员和标注方之间的关联值。
举例来说,假设与音频属性对应的预设评分列表如下表1所示,预设评分列表可分为评分标准和信息类型两项,该评分标准描述了第一用户信息和第二用户信息之间所在地区和职业对应的评分值。当第一用户信息中待标注音频对应的录入人员的所在地区为深圳,职业为教师,且第二用户信息中标注方所在地区为重庆,职业为医生时,则根据表1将所在地区和职业对应的评分值进行求和得到安全值为4。
表1
信息类型 | 评分标准 |
所在地区 | 同一地区为0,不同地区为2 |
职业 | 同一职业为0,相关职业为1,不相关职业为2 |
在一种可能的示例中,所述预设评分列表包括多个预设评分维度,步骤S102的具体实施方式包括步骤A1-A2,其中:
A1、根据所述第一用户信息和所述第二用户信息,确定每一所述预设评分维度对应的评价值。
在该示例中,预设评分维度可以是第一用户信息和第二用户信息之间的各项信息类型,也可包括各项信息类型对应的关联信息,例如:待标注音频对应的录入人员和标注方之间的关联值,录入人员和标注方之间的距离,录入人员和标注方之间的相似值等。
A2、根据每一所述预设评分维度对应的预设权值和评价值,确定每一所述标注方的安全值。
在该示例中,可预先设置不同预设评分维度对应的权值,例如,当预设评分维度为录入人员和标注方之间的关联值时,该预设评分维度对应的预设权值为0.5。当预设评分维度为录入人员和标注方之间的距离时,该预设评分维度对应的预设权值为0.2。当预设评分维度为录入人员和标注方之间的相似值时,该预设评分维度对应的预设权值为0.3等。
在该示例中,可对每一所述预设评分维度对应的预设权值和评价值进行加权求和,以得到每一标注方的安全值。举例来说,假设与音频属性对应的预设评分列表如下表2所示,根据表2可知,当录入人员和标注方之间的关联值为0.3时,对应的评价值为2。当录入人员和标注方之间的距离为2万米时,对应的评价值为3。当录入人员和标注方之间的相似值为0.5时,对应的评价值为3。假设录入人员和标注方之间的关联值对应的预设权值为0.5,录入人员和标注方之间的距离对应的预设权值为0.2,录入人员和标注方之间的相似值对应的预设权值为0.3,则对每一所述预设评分维度对应的预设权值和评价值进行加权求和,即0.5*2+0.2*3+0.3*3,可得到安全值为2.5。
表2
可以理解,在步骤A1和步骤A2中,根据第一用户信息和第二用户信息确定每一预设评分维度对应的评价值,再结合每一评分维度对应的预设权值确定各个标注方的安全值,提高了确定安全值的准确性。
S103:根据每一所述标注方的安全值,从所述多个标注方中选取安全值大于第一阈值的标注方,以得到多个待分配标注方。
在本申请实施例中,第一阈值不做限定。在一种可能的示例中,所述方法还包括:根据所述音频属性确定音频类型,将所述音频类型对应的预设标注时长作为所述第一阈值。
本申请可直接从音频属性中获取音频类型,还可根据音频内容和/或音频场景进行确定音频类型,也可按照应用类型和/或输入类型进行确定音频类型。可以理解,音频属性可体现音频类型,根据音频属性确定待标注音频的音频类型,可提高确定音频类型的准确性。
可以理解,在该可能的示例中,根据待标注音频的音频类型对应的预设标注时长作为第一阈值。如此,可依据音频类型选取不同的待分配标注方,提高了选取待分配标注方的准确性。
S104:根据所述音频属性和每一所述待分配标注方的处理属性,从所述多个待分配标注方中选取目标标注方。
在本申请实施例中,目标标注方为待分配待标注音频对应的标注任务对应的标注方,即该目标标注方在接收该标注任务之后,处理该标注任务。可以理解,根据音频属性、每一标注方的安全值和处理属性选取目标标注方,可提高处理待标注音频对应的标注任务的安全性和处理效率。
本申请对于选取目标标注方的方法不做限定,在一种可能的示例中,步骤S104的具体实施方式包括步骤B1-B5,其中:
B1、获取每一所述待分配标注方对应的标注进度。
其中,标注进度为待分配标注方完成当前音频任务的进度。本申请对于获取标注进度的方法不做限定,在一种可能的示例中,步骤B1的具体实施方式包括步骤B11-B14,其中:
B11、获取每一所述待分配标注方对应的分配列表,以得到多个分配列表。
其中,分配列表用于记录为各个待分配标注方所分配的音频,以及各个已分配音频的第一用户信息和音频属性。
B12、获取预先存储的每一所述待分配标注方对应的平均标注速率,以得到多个平均标注速率。
其中,平均标注速率用于描述各个待分配标注方的标注效率,可通过各个待分配标注方的音频容量以及完成时间进行分析得到。
B13、根据所述多个分配列表获取每一所述待分配标注方对应的标注数据大小,以得到多个标注数据大小。
其中,标注数据大小用于描述已分配音频的任务量,可通过各个已分配音频的容量进行获取。
B14、根据所述多个标注数据大小和所述多个平均标注速率获取每一所述待分配标注方对应的标注进度,以得到多个标注进度。
可以理解,在步骤B11-B14中,先获取各个待分配标注方的分配列表以及平均标注速率,再根据各个分配列表获取各个待分配标注方对应的标注数据大小,最后根据各个待分配标注方对应的标注数据大小和平均标注速率获取该待分配标注方对应的标注进度。如此,根据已分配的标注任务和待分配标注方的平均标注速率获取标注进度,可提高获取标注进度的准确性。
B2、根据所述音频属性和每一所述待分配标注方的处理属性确定每一所述待分配标注方的分配概率。
其中,分配概率用于描述各个待分配标注方的处理待标注音频的概率。具体的,可根据音频属性所要求的业务类型,与待分配标注方的处理属性中的业务能力进行获取,例如,多个待分配标注方包括第一待分配标注方、第二待分配标注方和第三待分配标注方。音频属性为英语,第一待分配标注方处理英语音频的平均标注速率为每分钟2个单词,第二待分配标注方处理英语音频的平均标注速率为每分钟5个单词,第三待分配标注方处理英语音频的平均标注速率为每分钟4个单词。如此,可确定第一待分配标注方的分配概率为0.5,第二待分配标注方的分配概率为0.8,第三待分配标注方的分配概率为0.7。
B3、根据每一所述待分配标注方对应的标注进度和分配概率确定每一所述待分配标注方的评价值,以得到多个评价值。
其中,评价值用于描述将待标注音频分配给待分配标注方的排列顺序。本申请对于确定评价值的方法不做限定,可分别设置标注进度和分配概率对应的权值,再与标注进度和分配概率进行加权,以得到各个待分配标注方的评价值。举例来说,假设待分配标注方的标注进度为60%,分配概率为0.5。当标注进度和分配概率对应的权值分别为0.5和0.5时,评价值为0.55。
B4、将所述多个标注进度中的最大值对应的所述待分配标注方作为目标标注方。
可以理解,在步骤B1-B4中,根据各个待分配标注方对应的标注进度和分配概率确定各个待分配标注方的评价值,再将评价值中的最大值作为目标标注方。如此,可提高标注效率。
S105:将所述待标注音频对应的标注任务分配给所述目标标注方。
可以理解,在如图1所示的音频分配方法中,先获取待标注音频的第一用户信息和音频属性,以及多个标注方中每一标注方的第二属性信息和处理属性。然后根据第一用户信息和每一第二用户信息从音频属性对应的预设评分列表中确定每一标注方的安全值,再将安全值大于第一阈值的标注方作为待分配标注方。然后根据待标注音频的音频属性和每一待分配标注方的处理属性确定目标标注方,并将待标注音频对应的标注任务分配给目标标注方。如此,可提高分配音频标注任务的准确性和安全性。
在一种可能的示例中,步骤S105的具体实施方式包括步骤C1和步骤C2,其中:
C1、对所述待标注音频进行分离,以得到多个音频片段。
其中,待标注音频的分离方法可通过声纹识别的方法,即识别待标注音频中的用户,每一音频片段对应一个用户。待标注音频的分离方法也可通过声道分离的方法,即将不同拾取设备获取的音频片段进行分类,例如:双声道分为2个音频片段,三声道分为3个音频片段,在此不做限定。
在一种可能的示例中,所述音频属性包括音频类型,步骤C1的具体实施方式包括步骤C11-C13,其中:
C11、对所述待标注音频进行语音识别,以得到文本信息。
语音识别技术,是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
C12、对所述文本信息进行分割,以得到多个文本片段。
在该示例中,可按照语句的完整性进行分割,即同一段文字划分为一个文本片段。
C13、根据每一所述文本片段的时间信息,对所述待标注音频进行分离,以得到多个音频片段。
可以理解,在步骤C11-C13中,先对待标注音频进行语音识别以得到文本信息,再对文本信息进行分割以得到多个文本片段,如此,可提高分割文本片段的准确性。然后根据每一文本片段的时间信息,对待标注音频进行分离以得到多个音频片段,从而可提高分割音频片段的准确性。
C2、将所述多个音频片段对应的标注任务分配给所述目标标注方。
可以理解,在步骤C1和步骤C2中,将待标注音频进行分类以得到多个音频片段,再将多个音频片段对应的标注任务分配给目标标注方,如此,目标标注方可单独标注音频片段,并结合上下语义进行标注,便于提高标注的效率和准确性。
在一种可能的示例中,在步骤S105之后,还可执行步骤D1-D3,其中:
D1、接收所述目标标注方对应的标注设备针对所述标注任务发送的目标标注文件。
其中,目标标注文件为目标标注方对待标注音频进行标注得到的文件。该目标标注文件可包括对待标注音频的文字翻译、语速、情绪、角色、性别、身份等,在此不做限定。
D2、对所述目标标注文件和所述待标注音频对应的参考标注文件进行比对,以得到识别率。
其中,参考标注文件为预先存储的标准标注文件。识别率用于描述目标标注文件的识别准确率。
D3、若所述识别率小于第二阈值,则向所述标注设备发送提示信息,所述提示信息用于提示所述目标标注方重新标注所述待标注音频。
本申请第二阈值不做限定,可依据训练进行设定。
可以理解,在步骤D1-D3中,接收目标标注方通过标注设备发送的目标标注文件,再将该目标标注文件与参考标注文件进行比对以得到识别率。然后将识别率与第二阈值进行比对,若小于第二阈值,则向标注设备发送提示信息,以提示目标标注方重新标注该待标注音频。如此,通过校验的方式提高目标标注方的标注业务能力。
与图1的实施例一致,请参照图2,图2是本申请实施例提供的一种音频分配装置的结构示意图,所述装置应用于电子设备。如图2所示,上述音频分配装置200包括:
处理单元201,用于获取待标注音频的第一用户信息和音频属性,以及获取多个标注方中每一标注方的第二用户信息和处理属性;根据所述第一用户信息和每一所述第二用户信息,从所述音频属性对应的预设评分列表中确定每一所述标注方的安全值;所述预设评分列表中的信息用于描述所述第一用户信息、所述第二用户信息以及所述安全值之间的对应关系;根据每一所述标注方的安全值,从所述多个标注方中选取安全值大于第一阈值的标注方,以得到多个待分配标注方;根据所述音频属性和每一所述待分配标注方的处理属性,从所述多个待分配标注方中选取目标标注方;
通信单元202,用于将所述待标注音频对应的标注任务分配给所述目标标注方。
可以理解,先获取待标注音频的第一用户信息和音频属性,以及多个标注方中每一标注方的第二属性信息和处理属性。然后根据第一用户信息和每一第二用户信息从音频属性对应的预设评分列表中确定每一标注方的安全值,再将安全值大于第一阈值的标注方作为待分配标注方。然后根据待标注音频的音频属性和每一待分配标注方的处理属性确定目标标注方,并将待标注音频对应的标注任务分配给目标标注方。如此,可提高分配音频标注任务的准确性和安全性。
在一个可能的示例中,在所述根据所述音频属性和每一所述待分配标注方的处理属性,从所述多个待分配标注方中选取目标标注方方面,所述处理单元201具体用于获取每一所述待分配标注方对应的标注进度,以得到多个标注进度;根据所述音频属性和每一所述待分配标注方的处理属性确定每一所述待分配标注方的分配概率;根据每一所述待分配标注方对应的标注进度和分配概率确定每一所述待分配标注方的评价值,以得到多个评价值;将所述多个评价值中的最大值对应的所述待分配标注方作为目标标注方。
在一个可能的示例中,在所述获取每一所述待分配标注方对应的标注进度,以得到多个标注进度方面,所述处理单元201具体用于获取每一所述待分配标注方对应的分配列表,以得到多个分配列表;获取预先存储的每一所述待分配标注方对应的平均标注速率,以得到多个平均标注速率;根据所述多个分配列表获取每一所述待分配标注方对应的标注数据大小,以得到多个标注数据大小;根据所述多个标注数据大小和所述多个平均标注速率获取每一所述待分配标注方对应的标注进度,以得到多个标注进度。
在一个可能的示例中,所述预设评分列表包括多个预设评分维度,在所述根据所述第一用户信息和每一所述第二用户信息,从所述音频属性对应的预设评分列表中确定每一所述标注方的安全值方面,所述处理单元201具体用于根据所述第一用户信息和所述第二用户信息,确定每一所述预设评分维度对应的评价值;根据每一所述预设评分维度对应的预设权值和评价值,确定每一所述标注方的安全值。
标注方在一个可能的示例中,所述处理单元201还用于对所述待标注音频进行分离,以得到多个音频片段;所述通信单元202具体用于将所述多个音频片段对应的标注任务分配给所述目标标注方。
在一个可能的示例中,在所述对所述待标注音频进行分离,以得到多个音频片段方面,所述处理单元201具体用于对所述待标注音频进行语音识别,以得到文本信息;对所述文本信息进行分割,以得到多个文本片段;根据每一所述文本片段的时间信息,对所述待标注音频进行分离,以得到多个音频片段。
在一个可能的示例中,在所述将所述待标注音频对应的标注任务分配给所述目标标注方之后,所述通信单元202还用于接收所述目标标注方对应的标注设备针对所述标注任务发送的目标标注文件;所述处理单元202还用于对所述目标标注文件和所述待标注音频对应的参考标注文件进行比对,以得到识别率;所述通信单元202还用于若所述识别率小于第二阈值,则向所述标注设备发送提示信息,所述提示信息用于提示所述目标标注方重新标注所述待标注音频。
与图1的实施例一致,请参照图3,图3是本申请实施例提供的一种电子设备的结构示意图。如图3所示,该电子设备300包括处理器310、存储器320、通信接口330以及一个或多个程序340,其中,上述一个或多个程序340被存储在上述存储器320中,并且被配置由上述处理器310执行,上述程序340包括用于执行以下步骤的指令:
获取待标注音频的第一用户信息和音频属性,以及获取多个标注方中每一标注方的第二用户信息和处理属性;
根据所述第一用户信息和每一所述第二用户信息,从所述音频属性对应的预设评分列表中确定每一所述标注方的安全值;所述预设评分列表中的信息用于描述所述第一用户信息、所述第二用户信息以及所述安全值之间的对应关系;
根据每一所述标注方的安全值,从所述多个标注方中选取安全值大于第一阈值的标注方,以得到多个待分配标注方;
根据所述音频属性和每一所述待分配标注方的处理属性,从所述多个待分配标注方中选取目标标注方;
将所述待标注音频对应的标注任务分配给所述目标标注方。
可以理解,先根据待标注音频的第一用户信息和每一标注方的第二用户信息,从音频属性对应的预设评分列表中确定每一标注方的安全值,再将安全值大于第一阈值的标注方作为待分配标注方。然后根据待标注音频的音频属性和每一待分配标注方的处理属性确定目标标注方,并将待标注音频对应的标注任务分配给目标标注方。如此,可提高分配音频标注任务的准确性和安全性。
在一个可能的示例中,在所述根据所述音频属性和每一所述待分配标注方的处理属性,从所述多个待分配标注方中选取目标标注方方面,所述程序340具体用于执行以下步骤的指令:
获取每一所述待分配标注方对应的标注进度,以得到多个标注进度;
根据所述音频属性和每一所述待分配标注方的处理属性确定每一所述待分配标注方的分配概率;
根据每一所述待分配标注方对应的标注进度和分配概率确定每一所述待分配标注方的评价值,以得到多个评价值;
将所述多个评价值中的最大值对应的所述待分配标注方作为目标标注方。
在一个可能的示例中,在所述获取每一所述待分配标注方对应的标注进度,以得到多个标注进度方面,所述程序340具体用于执行以下步骤的指令:
获取每一所述待分配标注方对应的分配列表,以得到多个分配列表;
获取预先存储的每一所述待分配标注方对应的平均标注速率,以得到多个平均标注速率;
根据所述多个分配列表获取每一所述待分配标注方对应的标注数据大小,以得到多个标注数据大小;
根据所述多个标注数据大小和所述多个平均标注速率获取每一所述待分配标注方对应的标注进度,以得到多个标注进度。
在一个可能的示例中,所述预设评分列表包括多个预设评分维度,在所述根据所述第一用户信息和每一所述第二用户信息,从所述音频属性对应的预设评分列表中确定每一所述标注方的安全值方面,所述程序340具体用于执行以下步骤的指令:
根据所述第一用户信息和所述第二用户信息,确定每一所述预设评分维度对应的评价值;
根据每一所述预设评分维度对应的预设权值和评价值,确定每一所述标注方的安全值。
标注方在一个可能的示例中,在所述将所述待标注音频对应的标注任务分配给所述目标标注方方面,所述程序340具体用于执行以下步骤的指令:
对所述待标注音频进行分离,以得到多个音频片段;
将所述多个音频片段对应的标注任务分配给所述目标标注方。
在一个可能的示例中,在所述对所述待标注音频进行分离,以得到多个音频片段方面,所述程序340具体用于执行以下步骤的指令:
对所述待标注音频进行语音识别,以得到文本信息;
对所述文本信息进行分割,以得到多个文本片段;
根据每一所述文本片段的时间信息,对所述待标注音频进行分离,以得到多个音频片段。
在一个可能的示例中,在所述将所述待标注音频对应的标注任务分配给所述目标标注方之后,所述程序340还用于执行以下步骤的指令:
接收所述目标标注方对应的标注设备针对所述标注任务发送的目标标注文件;
对所述目标标注文件和所述待标注音频对应的参考标注文件进行比对,以得到识别率;
若所述识别率小于第二阈值,则向所述标注设备发送提示信息,所述提示信息用于提示所述目标标注方重新标注所述待标注音频。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于存储计算机程序,该计算机程序使得计算机执行如方法实施例中记载的任一方法的部分或全部步骤,计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机程序可操作来使计算机执行如方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模式并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模式的形式实现。
集成的单元如果以软件程序模式的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。根据这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(randomaccess memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种音频分配方法,其特征在于,包括:
获取待标注音频的第一用户信息和音频属性,以及获取多个标注方中每一标注方的第二用户信息和处理属性;
根据所述第一用户信息和每一所述第二用户信息,从所述音频属性对应的预设评分列表中确定每一所述标注方的安全值;所述预设评分列表中的信息用于描述所述第一用户信息、所述第二用户信息以及所述安全值之间的对应关系;
根据每一所述标注方的安全值,从所述多个标注方中选取安全值大于第一阈值的标注方,以得到多个待分配标注方;
根据所述音频属性和每一所述待分配标注方的处理属性,从所述多个待分配标注方中选取目标标注方;
将所述待标注音频对应的标注任务分配给所述目标标注方。
2.根据权利要求1所述的方法,其特征在于,所述根据所述音频属性和每一所述待分配标注方的处理属性,从所述多个待分配标注方中选取目标标注方,包括:获取每一所述待分配标注方对应的标注进度;
根据所述音频属性和每一所述待分配标注方的处理属性确定每一所述待分配标注方的分配概率;
根据每一所述待分配标注方对应的标注进度和分配概率确定每一所述待分配标注方的评价值,以得到多个评价值;
将所述多个评价值中的最大值对应的所述待分配标注方作为目标标注方。
3.根据权利要求2所述的方法,其特征在于,所述获取每一所述待分配标注方对应的标注进度,以得到多个标注进度,包括:
获取每一所述待分配标注方对应的分配列表,以得到多个分配列表;
获取预先存储的每一所述待分配标注方对应的平均标注速率,以得到多个平均标注速率;
根据所述多个分配列表获取每一所述待分配标注方对应的标注数据大小,以得到多个标注数据大小;
根据所述多个标注数据大小和所述多个平均标注速率获取每一所述待分配标注方对应的标注进度,以得到多个标注进度。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述预设评分列表包括多个预设评分维度,所述根据所述第一用户信息和每一所述第二用户信息,从所述音频属性对应的预设评分列表中确定每一所述标注方的安全值,包括:
根据所述第一用户信息和所述第二用户信息,确定每一所述预设评分维度对应的评价值;
根据每一所述预设评分维度对应的预设权值和评价值,确定每一所述标注方的安全值。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述将所述待标注音频对应的标注任务分配给所述目标标注方,包括:
对所述待标注音频进行分离,以得到多个音频片段;
将所述多个音频片段对应的标注任务分配给所述目标标注方。
6.根据权利要求5所述的方法,其特征在于,所述对所述待标注音频进行分离,以得到多个音频片段,包括:
对所述待标注音频进行语音识别,以得到文本信息;
对所述文本信息进行分割,以得到多个文本片段;
根据每一所述文本片段的时间信息,对所述待标注音频进行分离,以得到多个音频片段。
7.根据权利要求1-3任一项所述的方法,其特征在于,在所述将所述待标注音频对应的标注任务分配给所述目标标注方之后,所述方法还包括:
接收所述目标标注方对应的标注设备针对所述标注任务发送的目标标注文件;
对所述目标标注文件和所述待标注音频对应的参考标注文件进行比对,以得到识别率;
若所述识别率小于第二阈值,则向所述标注设备发送提示信息,所述提示信息用于提示所述目标标注方重新标注所述待标注音频。
8.一种音频分配装置,其特征在于,包括:
处理单元,用于获取待标注音频的第一用户信息和音频属性,以及获取多个标注方中每一标注方的第二用户信息和处理属性;根据所述第一用户信息和每一所述第二用户信息,从所述音频属性对应的预设评分列表中确定每一所述标注方的安全值;所述预设评分列表中的信息用于描述所述第一用户信息、所述第二用户信息以及所述安全值之间的对应关系;根据每一所述标注方的安全值,从所述多个标注方中选取安全值大于第一阈值的标注方,以得到多个待分配标注方;根据所述音频属性和每一所述待分配标注方的处理属性,从所述多个待分配标注方中选取目标标注方;
通信单元,用于将所述待标注音频对应的标注任务分配给所述目标标注方。
9.一种电子设备,其特征在于,包括处理器、存储器、通信接口以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行权利要求1-7任一项方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,其用于存储计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-7任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910826025.XA CN110688517B (zh) | 2019-09-02 | 2019-09-02 | 音频分配方法、装置及存储介质 |
PCT/CN2020/112510 WO2021043101A1 (zh) | 2019-09-02 | 2020-08-31 | 音频分配方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910826025.XA CN110688517B (zh) | 2019-09-02 | 2019-09-02 | 音频分配方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110688517A true CN110688517A (zh) | 2020-01-14 |
CN110688517B CN110688517B (zh) | 2023-05-30 |
Family
ID=69108895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910826025.XA Active CN110688517B (zh) | 2019-09-02 | 2019-09-02 | 音频分配方法、装置及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110688517B (zh) |
WO (1) | WO2021043101A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111462725A (zh) * | 2020-04-17 | 2020-07-28 | 北京灵伴即时智能科技有限公司 | 录音编辑管理方法及系统 |
WO2021043101A1 (zh) * | 2019-09-02 | 2021-03-11 | 平安科技(深圳)有限公司 | 音频分配方法、装置及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110109747A1 (en) * | 2009-11-12 | 2011-05-12 | Siemens Industry, Inc. | System and method for annotating video with geospatially referenced data |
US20140310587A1 (en) * | 2013-04-16 | 2014-10-16 | Electronics And Telecommunications Research Institute | Apparatus and method for processing additional media information |
US9460457B1 (en) * | 2013-03-14 | 2016-10-04 | Google Inc. | Automatically annotating content items with an entity |
CN106407407A (zh) * | 2016-09-22 | 2017-02-15 | 江苏通付盾科技有限公司 | 一种文件标注系统及方法 |
CN108170845A (zh) * | 2018-01-17 | 2018-06-15 | 腾讯音乐娱乐科技(深圳)有限公司 | 多媒体数据处理方法、装置及存储介质 |
WO2018192406A1 (zh) * | 2017-04-20 | 2018-10-25 | 腾讯科技(深圳)有限公司 | 身份验证方法及装置、存储介质 |
CN109151023A (zh) * | 2018-08-21 | 2019-01-04 | 平安科技(深圳)有限公司 | 任务分配方法、装置及存储介质 |
CN109359798A (zh) * | 2018-08-21 | 2019-02-19 | 平安科技(深圳)有限公司 | 任务分配方法、装置及存储介质 |
CN110138865A (zh) * | 2019-05-17 | 2019-08-16 | 南方科技大学 | 空间众包任务分配方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110688517B (zh) * | 2019-09-02 | 2023-05-30 | 平安科技(深圳)有限公司 | 音频分配方法、装置及存储介质 |
-
2019
- 2019-09-02 CN CN201910826025.XA patent/CN110688517B/zh active Active
-
2020
- 2020-08-31 WO PCT/CN2020/112510 patent/WO2021043101A1/zh active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110109747A1 (en) * | 2009-11-12 | 2011-05-12 | Siemens Industry, Inc. | System and method for annotating video with geospatially referenced data |
US9460457B1 (en) * | 2013-03-14 | 2016-10-04 | Google Inc. | Automatically annotating content items with an entity |
US20140310587A1 (en) * | 2013-04-16 | 2014-10-16 | Electronics And Telecommunications Research Institute | Apparatus and method for processing additional media information |
CN106407407A (zh) * | 2016-09-22 | 2017-02-15 | 江苏通付盾科技有限公司 | 一种文件标注系统及方法 |
WO2018192406A1 (zh) * | 2017-04-20 | 2018-10-25 | 腾讯科技(深圳)有限公司 | 身份验证方法及装置、存储介质 |
CN108170845A (zh) * | 2018-01-17 | 2018-06-15 | 腾讯音乐娱乐科技(深圳)有限公司 | 多媒体数据处理方法、装置及存储介质 |
CN109151023A (zh) * | 2018-08-21 | 2019-01-04 | 平安科技(深圳)有限公司 | 任务分配方法、装置及存储介质 |
CN109359798A (zh) * | 2018-08-21 | 2019-02-19 | 平安科技(深圳)有限公司 | 任务分配方法、装置及存储介质 |
CN110138865A (zh) * | 2019-05-17 | 2019-08-16 | 南方科技大学 | 空间众包任务分配方法、装置、设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021043101A1 (zh) * | 2019-09-02 | 2021-03-11 | 平安科技(深圳)有限公司 | 音频分配方法、装置及存储介质 |
CN111462725A (zh) * | 2020-04-17 | 2020-07-28 | 北京灵伴即时智能科技有限公司 | 录音编辑管理方法及系统 |
CN111462725B (zh) * | 2020-04-17 | 2021-01-12 | 北京灵伴即时智能科技有限公司 | 录音编辑管理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2021043101A1 (zh) | 2021-03-11 |
CN110688517B (zh) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10777192B2 (en) | Method and apparatus of recognizing field of semantic parsing information, device and readable medium | |
US10354677B2 (en) | System and method for identification of intent segment(s) in caller-agent conversations | |
CN110795919A (zh) | 一种pdf文档中的表格抽取方法、装置、设备及介质 | |
CN102043843A (zh) | 一种用于基于目标应用获取目标词条的方法与获取设备 | |
CN112733042A (zh) | 推荐信息的生成方法、相关装置及计算机程序产品 | |
CN111324713A (zh) | 对话自动回复方法、装置、存储介质和计算机设备 | |
WO2021043101A1 (zh) | 音频分配方法、装置及存储介质 | |
CN111190946A (zh) | 报告生成方法、装置、计算机设备和存储介质 | |
CN110633475A (zh) | 基于计算机场景的自然语言理解方法、装置、系统和存储介质 | |
US11423219B2 (en) | Generation and population of new application document utilizing historical application documents | |
CN113051380A (zh) | 信息生成方法、装置、电子设备和存储介质 | |
CN111179904A (zh) | 混合文语转换方法及装置、终端和计算机可读存储介质 | |
CN114141235A (zh) | 语音语料库生成方法、装置、计算机设备和存储介质 | |
CN112307183A (zh) | 搜索数据识别方法、装置、电子设备以及计算机存储介质 | |
CN110705308B (zh) | 语音信息的领域识别方法、装置、存储介质及电子设备 | |
CN113378555B (zh) | 个股的智能关联方法及相关产品 | |
CN107656627B (zh) | 信息输入方法和装置 | |
CN113505293B (zh) | 信息推送方法、装置、电子设备及存储介质 | |
CN112115229A (zh) | 文本意图识别方法、装置、系统以及文本分类系统 | |
CN114528851A (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN115374793A (zh) | 基于服务场景识别的语音数据处理方法及相关装置 | |
CN112926297B (zh) | 处理信息的方法、装置、设备和存储介质 | |
CN110276001B (zh) | 盘点页识别方法、装置、计算设备和介质 | |
CN111931480B (zh) | 文本主要内容的确定方法、装置、存储介质及计算机设备 | |
CN110704617B (zh) | 新闻文本的分类方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |