CN110970038B - 语音解码方法及装置 - Google Patents

语音解码方法及装置 Download PDF

Info

Publication number
CN110970038B
CN110970038B CN201911179311.8A CN201911179311A CN110970038B CN 110970038 B CN110970038 B CN 110970038B CN 201911179311 A CN201911179311 A CN 201911179311A CN 110970038 B CN110970038 B CN 110970038B
Authority
CN
China
Prior art keywords
decoding
voice
task
tasks
operation information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911179311.8A
Other languages
English (en)
Other versions
CN110970038A (zh
Inventor
滕义伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Unisound Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Intelligent Technology Co Ltd filed Critical Unisound Intelligent Technology Co Ltd
Priority to CN201911179311.8A priority Critical patent/CN110970038B/zh
Publication of CN110970038A publication Critical patent/CN110970038A/zh
Application granted granted Critical
Publication of CN110970038B publication Critical patent/CN110970038B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明是关于语音解码方法及装置。该方法包括:抽取语音元数据;在抽取的同时,基于所述语音元数据生成语音解码作业信息;在生成的同时,执行解码任务,所述解码任务用于解码所述语音解码作业信息。通过本发明的技术方案,实现了解码服务由PUSH模式到PULL模式的转换,实现了解码计算能力的弹性扩展以及解码效率。

Description

语音解码方法及装置
技术领域
本发明涉及语音技术领域,尤其涉及语音解码方法及装置。
背景技术
目前,在大数据平台原始语音元数据进行解码时,通常解码步骤都是串行耦合的,比如前一个步骤执行完才能进行下一个步骤,如原始语音元数据抽取完才能生成语音解码作业信息然后进行下一步,然而这种解码方式会使得解码效率比较低,尤其是在作业高峰期,作业太多导致语音解码服务完全不可用。
发明内容
本发明实施例提供了语音解码方法及装置。所述技术方案如下:
根据本发明实施例的第一方面,提供一种语音解码方法,包括:
抽取语音元数据;
在抽取的同时,基于所述语音元数据生成语音解码作业信息;
在生成的同时,执行解码任务,所述解码任务用于解码所述语音解码作业信息。
在一个实施例中,所述方法还包括:
在生成所述语音解码作业信息后,按照指定的语音数量对所述语音解码作业信息进行切分,获得多个解码任务。
在一个实施例中,所述方法还包括:
在获得多个解码任务后,将所述多个解码任务对应的解码语音存储至NFS文件系统中的指定目录下。
在一个实施例中,所述解码任务包括多个,所述方法还包括:
在执行多个所述解码任务的同时,获取每个解码任务的状态并更新作业进度信息。
在一个实施例中,所述方法还包括:
当所述每个解码任务的状态为完成时,基于所述每个解码任务对应的解码语音生成目标解码语音;
生成所述目标解码语音对应的下载链接。
根据本发明实施例的第二方面,提供一种语音解码装置,包括:
抽取模块,用于抽取语音元数据;
第一生成模块,用于在抽取的同时,基于所述语音元数据生成语音解码作业信息;
执行模块,用于在生成的同时,执行解码任务,所述解码任务用于解码所述语音解码作业信息。
在一个实施例中,所述装置还包括:
切分模块,用于在生成所述语音解码作业信息后,按照指定的语音数量对所述语音解码作业信息进行切分,获得多个解码任务。
在一个实施例中,所述装置还包括:
存储模块,用于在获得多个解码任务后,将所述多个解码任务对应的解码语音存储至NFS文件系统中的指定目录下。
在一个实施例中,所述解码任务包括多个,所述装置还包括:
获取模块,用于在执行多个所述解码任务的同时,获取每个解码任务的状态并更新作业进度信息。
在一个实施例中,所述装置还包括:
第二生成模块,用于当所述每个解码任务的状态为完成时,基于所述每个解码任务对应的解码语音生成目标解码语音;
第三生成模块,用于生成所述目标解码语音对应的下载链接。
本发明的实施例提供的技术方案可以包括以下有益效果:
在抽取语音元数据的同时,可基于已经抽取的语音元数据生成语音解码作业信息,并在生成语音解码作业信息的同时,可执行解码任务,从而可同时执行上述步骤,将语音解码过程抽象为作业调度、解码执行这些异步、解耦的步骤,实现了解码服务由PUSH模式到PULL模式的转换,实现了解码计算能力的弹性扩展以及解码效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种语音解码方法的流程图。
图2是根据一示例性实施例示出的另一种语音解码方法的流程图。
图3是根据一示例性实施例示出的一种语音解码装置的框图。
图4是根据一示例性实施例示出的另一种语音解码装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
为了解决上述技术问题,本发明实施例提供了一种语音解码方法,该方法可用于语音解码程序、系统或装置中,且该方法对应的执行主体可以是终端或服务器,如图1所示,该方法包括步骤S101至步骤S103:
步骤S101,抽取语音元数据;
步骤S102,在抽取的同时,基于所述语音元数据生成语音解码作业信息;
步骤S103,在生成的同时,执行解码任务,所述解码任务用于解码所述语音解码作业信息。
在抽取语音元数据的同时,可基于已经抽取的语音元数据生成语音解码作业信息,并在生成语音解码作业信息的同时,可执行解码任务,从而可同时执行上述步骤S101至步骤S103,即将解码过程分成多个不同的解耦步骤,具体地将语音解码过程抽象为作业调度、解码执行这些异步、解耦的步骤,实现了解码服务由PUSH模式到PULL模式的转换,实现了解码计算能力的弹性扩展以及解码效率的提高。
在一个实施例中,所述方法还包括:
在生成所述语音解码作业信息后,按照指定的语音数量对所述语音解码作业信息进行切分,获得多个解码任务。
指定的语音数量用于指示将语音解码作业信息切分为多少段,在生成语音解码作业信息后,可按照该指定的语音数量对整个语音解码作业信息进行切换,从而获得多个解码任务,以便于分别对执行多个解码任务,即分段解码语音,加快解码过程。
在一个实施例中,所述方法还包括:
在获得多个解码任务后,将所述多个解码任务对应的解码语音存储至NFS文件系统中的指定目录下。
当存在多个解码任务后,可将多个解码任务存储至NFS(Network File System,即网络文件系统)文件系统的指定目录下,以便于后期快速读取各解码任务。
在一个实施例中,所述解码任务包括多个,所述方法还包括:
在执行多个所述解码任务的同时,获取每个解码任务的状态并更新作业进度信息。
每个解码任务的状态即每个解码任务是否完成,作业进度信息即每个解码任务的执行百分比。
在一个实施例中,所述方法还包括:
当所述每个解码任务的状态为完成时,基于所述每个解码任务对应的解码语音生成目标解码语音;
生成所述目标解码语音对应的下载链接。
当所述每个解码任务的状态为完成时,说明所有的解码任务均完成,因而,可基于所述每个解码任务对应的解码语音生成目标解码语音,如将每个解码任务对应的解码语音进行合并以得到一个总的解码语音,并生成该目标解码语音对应的下载链接,供用户进行语音的下载。
而通过本发明的技术方案将语音解码过程抽象为作业调度、任务调度、解码执行和作业汇总四个异步、解耦的步骤,实现了解码服务由PUSH模式到PULL模式的转换,实现了语音解码任务并行度和解码能力的自适应,实现了在用户提交语音解码作业高峰情况下的解码服务的平稳运行。同时,本发明通过简单、无感知的水平增加解码执行节点数量就能实现解码计算能力的弹性扩展。
下面将进一步详细说明本发明的技术方案:
第1步:原始语音元数据抽取
大数据计算平台解析用户提交的语音提取SQL(Structured Query Language,结构化查询语言),生成分布式执行任务,抽取出原始语音文件的元数据VoiceMetaInfo(timestamp,userId,voiceId,audioFormat,encodeFormat)文件,写入NFS文件系统;
第2步:语音解码作业信息的生成
读取NFS上抽取的语音元数据VoiceMetaInfo,生成语音解码作业信息VoiceDecodeJob(timestamp,userId,JobId,voiceCount,VoiceMetaInfoPath),并将VoiceDecodeJob发送到MQ系统的voice-decode-job topic中;
第3步:语音解码任务生成
语音解码任务调度器订阅voice-decode-job topic,消费MQ系统中的VoiceDecodeJob消息。按照指定的语音数量对作业进行语音解码任务的切分VoiceDecodeTask(timestamp,userId,JobId,taskId,VoiceMetaInfoPath,startRow,taskSize)。每个切分完成VoiceDecodeTask发送到MQ系统的voice-decode-task topic中;
第4步:执行解码并上报任务执行状态
解码任务执行器订阅voice-decode-task topic,获取解码任务VoiceDecodeTask。解析并执行解码任务,将解码后WAV格式语音写入NFS特定目录(/data/voice/userId/JobId/taskId.zip)。解码任务执行完成后,将任务执行状态VoiceDecodeStatus(timestamp,userid,jobId,task Size,status)发送到MQ系统的voice-decode-task-status topic中;
第5步:任务状态更新和汇总
作业进度监控器订阅voice-decode-task-status topic,获取获取每个解码任务的状态并更新作业进度信息。当作业进度100%时,合并NFS文件系统中作业目录下的所有task生成的解码语音,在NFS文件系统中生成作业解码语音的统一的下载链接/data/voice/userId/JobId.zip,供用户进行语音的下载。
最后,需要明确的是:本领域技术人员可根据实际需求,将上述多个实施例进行自由组合。
对应本发明实施例提供的上述语音解码方法,本发明实施例还提供一种语音解码装置,如图3所示,该装置包括:
抽取模块301,用于抽取语音元数据;
第一生成模块302,用于在抽取的同时,基于所述语音元数据生成语音解码作业信息;
执行模块303,用于在生成的同时,执行解码任务,所述解码任务用于解码所述语音解码作业信息。
在一个实施例中,所述装置还包括:
切分模块,用于在生成所述语音解码作业信息后,按照指定的语音数量对所述语音解码作业信息进行切分,获得多个解码任务。
在一个实施例中,所述装置还包括:
存储模块,用于在获得多个解码任务后,将所述多个解码任务对应的解码语音存储至NFS文件系统中的指定目录下。
在一个实施例中,所述解码任务包括多个,所述装置还包括:
获取模块,用于在执行多个所述解码任务的同时,获取每个解码任务的状态并更新作业进度信息。
如图4所示,在一个实施例中,所述装置还包括:
第二生成模块401,用于当所述每个解码任务的状态为完成时,基于所述每个解码任务对应的解码语音生成目标解码语音;
第三生成模块402,用于生成所述目标解码语音对应的下载链接。
本领域技术人员在考虑说明书及实践这里发明的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (8)

1.一种语音解码方法,其特征在于,包括:
抽取语音元数据;
在抽取的同时,基于所述语音元数据生成语音解码作业信息;
在生成的同时,执行解码任务,所述解码任务用于解码所述语音解码作业信息;
在生成所述语音解码作业信息后,按照指定的语音数量对所述语音解码作业信息进行切分,获得多个解码任务。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在获得多个解码任务后,将所述多个解码任务对应的解码语音存储至NFS文件系统中的指定目录下。
3.根据权利要求1所述的方法,其特征在于,所述解码任务包括多个,所述方法还包括:
在执行多个所述解码任务的同时,获取每个解码任务的状态并更新作业进度信息。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
当所述每个解码任务的状态为完成时,基于所述每个解码任务对应的解码语音生成目标解码语音;
生成所述目标解码语音对应的下载链接。
5.一种语音解码装置,其特征在于,包括:
抽取模块,用于抽取语音元数据;
第一生成模块,用于在抽取的同时,基于所述语音元数据生成语音解码作业信息;
执行模块,用于在生成的同时,执行解码任务,所述解码任务用于解码所述语音解码作业信息;
切分模块,用于在生成所述语音解码作业信息后,按照指定的语音数量对所述语音解码作业信息进行切分,获得多个解码任务。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
存储模块,用于在获得多个解码任务后,将所述多个解码任务对应的解码语音存储至NFS文件系统中的指定目录下。
7.根据权利要求6所述的装置,其特征在于,所述解码任务包括多个,所述装置还包括:
获取模块,用于在执行多个所述解码任务的同时,获取每个解码任务的状态并更新作业进度信息。
8.根据权利要求5至7中任一项所述的装置,其特征在于,所述装置还包括:
第二生成模块,用于当所述每个解码任务的状态为完成时,基于所述每个解码任务对应的解码语音生成目标解码语音;
第三生成模块,用于生成所述目标解码语音对应的下载链接。
CN201911179311.8A 2019-11-27 2019-11-27 语音解码方法及装置 Active CN110970038B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911179311.8A CN110970038B (zh) 2019-11-27 2019-11-27 语音解码方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911179311.8A CN110970038B (zh) 2019-11-27 2019-11-27 语音解码方法及装置

Publications (2)

Publication Number Publication Date
CN110970038A CN110970038A (zh) 2020-04-07
CN110970038B true CN110970038B (zh) 2023-04-18

Family

ID=70031734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911179311.8A Active CN110970038B (zh) 2019-11-27 2019-11-27 语音解码方法及装置

Country Status (1)

Country Link
CN (1) CN110970038B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109873912A (zh) * 2019-02-21 2019-06-11 广州维实信息科技有限公司 基于软交换的语音控制方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100489043B1 (ko) * 2000-12-20 2005-05-11 엘지전자 주식회사 이동 통신 시스템에서 이동 단말기간 음성 호 연결시데이터 포맷방법
JP4330346B2 (ja) * 2002-02-04 2009-09-16 富士通株式会社 音声符号に対するデータ埋め込み/抽出方法および装置並びにシステム
JP2004117761A (ja) * 2002-09-26 2004-04-15 Hitachi Kokusai Electric Inc 復号方法及び音声復号装置
JP2005073057A (ja) * 2003-08-26 2005-03-17 Sanyo Electric Co Ltd デジタル通話装置
EP1763748A1 (en) * 2004-05-27 2007-03-21 Koninklijke Philips Electronics N.V. Signal processing apparatus
CN101366079B (zh) * 2006-08-15 2012-02-15 美国博通公司 用于子带预测编码的基于全带音频波形外插的包丢失隐藏
RU2343563C1 (ru) * 2007-05-21 2009-01-10 Федеральное государственное унитарное предприятие "ПЕНЗЕНСКИЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ЭЛЕКТРОТЕХНИЧЕСКИЙ ИНСТИТУТ" (ФГУП "ПНИЭИ") Способ передачи и приема закодированной речи
CN102461173B (zh) * 2009-06-09 2015-09-09 汤姆森特许公司 解码装置、解码方法以及编辑装置
US9508347B2 (en) * 2013-07-10 2016-11-29 Tencent Technology (Shenzhen) Company Limited Method and device for parallel processing in model training
CN104572297B (zh) * 2014-12-24 2018-04-24 西安工程大学 一种基于遗传算法的Hadoop作业调度方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109873912A (zh) * 2019-02-21 2019-06-11 广州维实信息科技有限公司 基于软交换的语音控制方法

Also Published As

Publication number Publication date
CN110970038A (zh) 2020-04-07

Similar Documents

Publication Publication Date Title
CN105677469B (zh) 定时任务执行方法及装置
CN108280023B (zh) 任务执行方法、装置和服务器
CN102880503A (zh) 数据分析系统及数据分析方法
US20140365827A1 (en) Architecture for end-to-end testing of long-running, multi-stage asynchronous data processing services
CN110321383A (zh) 大数据平台数据同步方法、装置、计算机设备及存储介质
CN111611622A (zh) 基于区块链的文件存储方法和电子设备
CN112115113B (zh) 数据存储系统、方法、装置、设备以及存储介质
CN108829802B (zh) 关联日志回放方法及装置
CN111553652A (zh) 业务处理方法及装置
CN111210340A (zh) 一种自动任务处理方法、装置、服务器及存储介质
CN110970038B (zh) 语音解码方法及装置
CN113326150A (zh) 一种联机小批量消息处理方法和装置
CN116661978B (zh) 一种分布式的流程处理方法、装置及分布式业务流程引擎
CN111488243B (zh) MongoDB数据库的备份、恢复方法、装置、电子设备及存储介质
CN112948096A (zh) 一种批量调度方法、装置和设备
CN110990476B (zh) 数据导入方法、装置、服务器及存储介质
CN110019045B (zh) 日志落地方法及装置
CN110750362A (zh) 生物信息的分析方法、装置和存储介质
CN112825525A (zh) 用于处理事务的方法和装置
CN113360558A (zh) 数据处理方法、数据处理装置、电子设备及存储介质
CN111563123A (zh) 一种hive仓库元数据实时同步方法
CN112965939A (zh) 一种文件合并方法、装置和设备
CN111241191A (zh) 一种数据库的同步方法及装置
CN111552561B (zh) 一种任务处理方法及装置
CN116821250B (zh) 一种分布式图数据处理方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant