CN110970038B

CN110970038B - 语音解码方法及装置

Info

Publication number: CN110970038B
Application number: CN201911179311.8A
Authority: CN
Inventors: 滕义伟
Original assignee: Unisound Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd
Priority date: 2019-11-27
Filing date: 2019-11-27
Publication date: 2023-04-18
Anticipated expiration: 2039-11-27
Also published as: CN110970038A

Abstract

本发明是关于语音解码方法及装置。该方法包括：抽取语音元数据；在抽取的同时，基于所述语音元数据生成语音解码作业信息；在生成的同时，执行解码任务，所述解码任务用于解码所述语音解码作业信息。通过本发明的技术方案，实现了解码服务由PUSH模式到PULL模式的转换，实现了解码计算能力的弹性扩展以及解码效率。

Description

语音解码方法及装置

技术领域

本发明涉及语音技术领域，尤其涉及语音解码方法及装置。

背景技术

目前，在大数据平台原始语音元数据进行解码时，通常解码步骤都是串行耦合的，比如前一个步骤执行完才能进行下一个步骤，如原始语音元数据抽取完才能生成语音解码作业信息然后进行下一步，然而这种解码方式会使得解码效率比较低，尤其是在作业高峰期，作业太多导致语音解码服务完全不可用。

发明内容

本发明实施例提供了语音解码方法及装置。所述技术方案如下：

根据本发明实施例的第一方面，提供一种语音解码方法，包括：

抽取语音元数据；

在抽取的同时，基于所述语音元数据生成语音解码作业信息；

在生成的同时，执行解码任务，所述解码任务用于解码所述语音解码作业信息。

在一个实施例中，所述方法还包括：

在生成所述语音解码作业信息后，按照指定的语音数量对所述语音解码作业信息进行切分，获得多个解码任务。

在一个实施例中，所述方法还包括：

在获得多个解码任务后，将所述多个解码任务对应的解码语音存储至NFS文件系统中的指定目录下。

在一个实施例中，所述解码任务包括多个，所述方法还包括：

在执行多个所述解码任务的同时，获取每个解码任务的状态并更新作业进度信息。

在一个实施例中，所述方法还包括：

当所述每个解码任务的状态为完成时，基于所述每个解码任务对应的解码语音生成目标解码语音；

生成所述目标解码语音对应的下载链接。

根据本发明实施例的第二方面，提供一种语音解码装置，包括：

抽取模块，用于抽取语音元数据；

第一生成模块，用于在抽取的同时，基于所述语音元数据生成语音解码作业信息；

执行模块，用于在生成的同时，执行解码任务，所述解码任务用于解码所述语音解码作业信息。

在一个实施例中，所述装置还包括：

切分模块，用于在生成所述语音解码作业信息后，按照指定的语音数量对所述语音解码作业信息进行切分，获得多个解码任务。

在一个实施例中，所述装置还包括：

存储模块，用于在获得多个解码任务后，将所述多个解码任务对应的解码语音存储至NFS文件系统中的指定目录下。

在一个实施例中，所述解码任务包括多个，所述装置还包括：

获取模块，用于在执行多个所述解码任务的同时，获取每个解码任务的状态并更新作业进度信息。

在一个实施例中，所述装置还包括：

第二生成模块，用于当所述每个解码任务的状态为完成时，基于所述每个解码任务对应的解码语音生成目标解码语音；

第三生成模块，用于生成所述目标解码语音对应的下载链接。

本发明的实施例提供的技术方案可以包括以下有益效果：

在抽取语音元数据的同时，可基于已经抽取的语音元数据生成语音解码作业信息，并在生成语音解码作业信息的同时，可执行解码任务，从而可同时执行上述步骤，将语音解码过程抽象为作业调度、解码执行这些异步、解耦的步骤，实现了解码服务由PUSH模式到PULL模式的转换，实现了解码计算能力的弹性扩展以及解码效率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种语音解码方法的流程图。

图2是根据一示例性实施例示出的另一种语音解码方法的流程图。

图3是根据一示例性实施例示出的一种语音解码装置的框图。

图4是根据一示例性实施例示出的另一种语音解码装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

为了解决上述技术问题，本发明实施例提供了一种语音解码方法，该方法可用于语音解码程序、系统或装置中，且该方法对应的执行主体可以是终端或服务器，如图1所示，该方法包括步骤S101至步骤S103：

步骤S101，抽取语音元数据；

步骤S102，在抽取的同时，基于所述语音元数据生成语音解码作业信息；

步骤S103，在生成的同时，执行解码任务，所述解码任务用于解码所述语音解码作业信息。

在抽取语音元数据的同时，可基于已经抽取的语音元数据生成语音解码作业信息，并在生成语音解码作业信息的同时，可执行解码任务，从而可同时执行上述步骤S101至步骤S103，即将解码过程分成多个不同的解耦步骤，具体地将语音解码过程抽象为作业调度、解码执行这些异步、解耦的步骤，实现了解码服务由PUSH模式到PULL模式的转换，实现了解码计算能力的弹性扩展以及解码效率的提高。

在一个实施例中，所述方法还包括：

指定的语音数量用于指示将语音解码作业信息切分为多少段，在生成语音解码作业信息后，可按照该指定的语音数量对整个语音解码作业信息进行切换，从而获得多个解码任务，以便于分别对执行多个解码任务，即分段解码语音，加快解码过程。

在一个实施例中，所述方法还包括：

当存在多个解码任务后，可将多个解码任务存储至NFS(Network File System，即网络文件系统)文件系统的指定目录下，以便于后期快速读取各解码任务。

每个解码任务的状态即每个解码任务是否完成，作业进度信息即每个解码任务的执行百分比。

在一个实施例中，所述方法还包括：

生成所述目标解码语音对应的下载链接。

当所述每个解码任务的状态为完成时，说明所有的解码任务均完成，因而，可基于所述每个解码任务对应的解码语音生成目标解码语音，如将每个解码任务对应的解码语音进行合并以得到一个总的解码语音，并生成该目标解码语音对应的下载链接，供用户进行语音的下载。

而通过本发明的技术方案将语音解码过程抽象为作业调度、任务调度、解码执行和作业汇总四个异步、解耦的步骤，实现了解码服务由PUSH模式到PULL模式的转换，实现了语音解码任务并行度和解码能力的自适应，实现了在用户提交语音解码作业高峰情况下的解码服务的平稳运行。同时，本发明通过简单、无感知的水平增加解码执行节点数量就能实现解码计算能力的弹性扩展。

下面将进一步详细说明本发明的技术方案：

第1步：原始语音元数据抽取

大数据计算平台解析用户提交的语音提取SQL(Structured Query Language，结构化查询语言)，生成分布式执行任务，抽取出原始语音文件的元数据VoiceMetaInfo(timestamp,userId,voiceId,audioFormat,encodeFormat)文件，写入NFS文件系统；

第2步：语音解码作业信息的生成

读取NFS上抽取的语音元数据VoiceMetaInfo，生成语音解码作业信息VoiceDecodeJob(timestamp，userId,JobId,voiceCount,VoiceMetaInfoPath),并将VoiceDecodeJob发送到MQ系统的voice-decode-job topic中；

第3步：语音解码任务生成

语音解码任务调度器订阅voice-decode-job topic，消费MQ系统中的VoiceDecodeJob消息。按照指定的语音数量对作业进行语音解码任务的切分VoiceDecodeTask(timestamp，userId,JobId,taskId,VoiceMetaInfoPath,startRow,taskSize)。每个切分完成VoiceDecodeTask发送到MQ系统的voice-decode-task topic中；

第4步：执行解码并上报任务执行状态

解码任务执行器订阅voice-decode-task topic，获取解码任务VoiceDecodeTask。解析并执行解码任务，将解码后WAV格式语音写入NFS特定目录(/data/voice/userId/JobId/taskId.zip)。解码任务执行完成后，将任务执行状态VoiceDecodeStatus(timestamp,userid,jobId,task Size,status)发送到MQ系统的voice-decode-task-status topic中；

第5步：任务状态更新和汇总

作业进度监控器订阅voice-decode-task-status topic，获取获取每个解码任务的状态并更新作业进度信息。当作业进度100％时，合并NFS文件系统中作业目录下的所有task生成的解码语音，在NFS文件系统中生成作业解码语音的统一的下载链接/data/voice/userId/JobId.zip,供用户进行语音的下载。

最后，需要明确的是：本领域技术人员可根据实际需求，将上述多个实施例进行自由组合。

对应本发明实施例提供的上述语音解码方法，本发明实施例还提供一种语音解码装置，如图3所示，该装置包括：

抽取模块301，用于抽取语音元数据；

第一生成模块302，用于在抽取的同时，基于所述语音元数据生成语音解码作业信息；

执行模块303，用于在生成的同时，执行解码任务，所述解码任务用于解码所述语音解码作业信息。

在一个实施例中，所述装置还包括：

如图4所示，在一个实施例中，所述装置还包括：

第二生成模块401，用于当所述每个解码任务的状态为完成时，基于所述每个解码任务对应的解码语音生成目标解码语音；

第三生成模块402，用于生成所述目标解码语音对应的下载链接。

本领域技术人员在考虑说明书及实践这里发明的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种语音解码方法，其特征在于，包括：

抽取语音元数据；

在生成的同时，执行解码任务，所述解码任务用于解码所述语音解码作业信息；

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，所述解码任务包括多个，所述方法还包括：

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：

生成所述目标解码语音对应的下载链接。

5.一种语音解码装置，其特征在于，包括：

抽取模块，用于抽取语音元数据；

执行模块，用于在生成的同时，执行解码任务，所述解码任务用于解码所述语音解码作业信息；

6.根据权利要求5所述的装置，其特征在于，所述装置还包括：

7.根据权利要求6所述的装置，其特征在于，所述解码任务包括多个，所述装置还包括：

8.根据权利要求5至7中任一项所述的装置，其特征在于，所述装置还包括：