CN109545200A

CN109545200A - 编辑语音内容的方法及存储装置

Info

Publication number: CN109545200A
Application number: CN201811286068.5A
Authority: CN
Inventors: 李福文; 朱庆春; 朱佳齐
Original assignee: Shenzhen Dapu Microelectronics Co Ltd
Current assignee: Shenzhen Dapu Microelectronics Co Ltd
Priority date: 2018-10-31
Filing date: 2018-10-31
Publication date: 2019-03-29

Abstract

本发明提供一种编辑语音内容的方法，包括步骤：处理器将编辑指令解码并发送至语音搜索处理模块；语音搜索处理模块接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索，判断待编辑音频数据中是否存在敏感词语音；若待编辑音频数据中存在敏感词语音，则语音搜索处理模块根据编辑指令对待编辑音频数据中的敏感词语音进行编辑，并暂存于内存中。本发明还提供一种编辑语音内容的存储装置，包括存储控制器及存储介质；所述存储介质用于储存音频数据；所述存储控制器包括处理器、语音搜索处理模块及内存。本发明通过设置语音搜索处理模块对音频数据进行搜索和编辑处理，以提高大数据处理效率，可节省大量处理器资源。

Description

编辑语音内容的方法及存储装置

【技术领域】

本发明属于存储技术领域，尤其涉及一种编辑语音内容的方法及存储装置。

【背景技术】

目前，存储设备用来储存用户的资料，其中包括电影、音乐、电视节目等具有音频文件的资料，用户往往需要过滤其中的部分音频，例如，在剪辑电视节目时屏蔽不雅语言以“哔”声代替。此过程需要观看或者聆听完后，才能判断其中是否包括不适当内容，再通过人工搜索来一一替换并保存，效率极低，浪费时间和人力成本。且用户需要通过存储设备连接主机并利用主机来搜索所需要的资料，当存储设备中存在大量资料需要处理时，会导致主机端处理器资源占用率高，同时人工搜索和替换的准确性也较低。鉴于此，实有必要提供一种编辑语音内容的方法及存储装置以克服上述缺陷。

【发明内容】

本发明提出一种编辑语音内容的方法及存储装置，在存储设备中自动搜索不适当语音，有效提高语音替换的处理效率。

为解决上述技术问题，本申请采用的一个技术方案是：提供一种编辑语音内容的方法，包括以下步骤：

处理器将用户的编辑指令解码并发送至语音搜索处理模块；

语音搜索处理模块接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索，判断待编辑音频数据中是否存在敏感词语音；

若待编辑音频数据中存在敏感词语音，则语音搜索处理模块根据编辑指令对待编辑音频数据中的敏感词语音进行编辑，并暂存于内存中。

在一个优选实施方式中，所述方法还包括步骤：

语音搜索处理模块将待编辑音频数据中的敏感词语音编辑完成后发送中断请求至处理器；

处理器将内存中编辑完成的音频数据储存于存储介质中。

在一个优选实施方式中，所述语音搜索处理模块根据编辑指令对敏感词语音进行编辑的步骤包括：所述语音搜索处理模块将待编辑音频数据中的敏感词语音采用预设声音或静音进行替换。

在一个优选实施方式中，所述语音搜索处理模块判断待编辑音频数据中的敏感词语音的时间长度，并复制相同时间长度的预设声音或静音取代所述待编辑音频数据中的敏感词语音。

在一个优选实施方式中，所述编辑指令包括待编辑音频数据、敏感词样本和操作命令。

在一个优选实施方式中，所述语音搜索处理模块接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索，判断待编辑音频数据中是否存在敏感词语音的步骤包括：

从待编辑音频数据中解析语音；

将解析的语音进行识别；

将识别的语音与敏感词样本进行对比，判断是否存在敏感词语音。

为解决上述技术问题，本申请采用的另一个技术方案是：提供一种编辑语音内容的存储装置，包括存储控制器及存储介质；所述存储介质用于储存音频数据；所述存储控制器包括处理器、语音搜索处理模块及内存；所述处理器用于将编辑指令解码并发送至语音搜索处理模块；所述语音搜索处理模块用于接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索，判断待编辑音频数据中是否存在敏感词语音，且当判断待编辑音频数据中存在敏感词语音时，根据编辑指令对待编辑音频数据中的敏感词语音进行编辑；所述内存用于储存语音搜索处理模块编辑完成后的音频数据。

在一个优选实施方式中，所述语音搜索处理模块包括语音解析单元、语音识别单元、语音对比单元及语音编辑单元；所述语音解析单元用于从待编辑音频数据中解析语音；所述语音识别单元用于对解析的语音进行识别；所述语音对比单元用于将识别的语音与敏感词样本进行对比，判断音频数据中是否存在敏感词语音；所述语音编辑单元用于当语音对比单元判断出存在敏感词语音时将敏感词语音进行编辑。

在一个优选实施方式中，所述语音搜索处理模块还用于在对待编辑音频数据中的敏感词语音编辑完成后发送中断请求至处理器。

在一个优选实施方式中，所述语音搜索处理模块还包括结果返回单元，所述结果返回单元用于在语音编辑单元将敏感词语音编辑完成后发送中断请求至处理器。

与现有技术相比，本发明的有益效果在于：通过设置语音搜索处理模块对音频数据进行搜索和编辑处理，以提高大数据处理效率，可节省大量处理器资源，同时有利于节省人工和时间成本。

【附图说明】

图1为本发明较佳实施例提供的编辑语音内容的方法的流程图。

图2为图1中对待编辑音频数据进行搜索和判断的子流程图。

图3为本发明较佳实施例提供的编辑语音内容的存储装置的结构框图。

图4为本发明较佳实施例提供的语音搜索处理模块的结构框图。

【具体实施方式】

为了使本发明的目的、技术方案和有益技术效果更加清晰明白，以下结合附图和具体实施方式，对本发明进行进一步详细说明。应当理解的是，本说明书中描述的具体实施方式仅仅是为了解释本发明，并不是为了限定本发明。

请参阅图1，本发明提供一种编辑语音内容的方法，该方法包括以下步骤：

步骤S100、处理器将编辑指令解码并发送至语音搜索处理模块。

在步骤S100之前，用户在主机输入编辑指令，主机将编辑指令编码成数据包再发送至处理器。该编辑指令应包括待编辑音频数据、敏感词样本和操作命令。敏感词样本为用户不希望在待编辑音频数据中出现的语音内容，操作命令可以是将待编辑音频数据中包含的敏感词采用预设声音或静音进行替换，具体根据用户的需要而设定，从而实现对待编辑音频数据中不适当的语音进行不同编辑方式。前述的待编辑音频数据储存于存储介质中，可以为电影、音乐、电视节目等具有音频文件的资料。

步骤S200、语音搜索处理模块接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索，判断待编辑音频数据中是否存在敏感词语音。

在一个实施例中，请一并参阅图2，步骤S200具体包括以下子步骤：

步骤S201、从待编辑音频数据中解析语音；

步骤S202、将解析的语音进行识别；

步骤S203、将识别的语音与敏感词样本进行对比，判断是否存在敏感词语音。

本实施例中，可利用端点侦测技术对音频数据中哪些区段是有声段，那些是属于无声段或背景噪声进行判断。当找到有声段后，利用强波处理技术补偿语音讯号中浊音讯号的衰减，以提高辨识的准确率，然后利用数字滤波器组来处理语音讯号，将每个滤波器的频谱能量值利用线性倒频谱系数转换成为声音的特征值，从而与编辑指令中的敏感词样本进行对比，以判断音频数据中是否存在敏感词语音。

步骤S300、若待编辑音频数据中存在敏感词语音，则语音搜索处理模块根据编辑指令对音频数据中的敏感词语音进行编辑，并暂存于内存中。

本步骤中，语音搜索处理模块根据编辑指令对敏感词语音进行编辑的步骤包括：语音搜索处理模块将敏感词语音采用预设声音或静音进行替换。例如用户希望将某个音频数据中出现的“外星人”这一敏感词进行替换时，则在编辑指令内应预先设置包括“外星人”的声音样本和替换声音，替换声音可以是“哔哔”声。

在一个实施例中，语音搜索处理模块采用预设声音或静音进行替换的步骤可以包括：语音搜索处理模块判断待编辑音频数据中的敏感词语音的时间长度，并复制相同时间长度的预设声音或静音取代待编辑音频数据中的敏感词语音。其中，敏感词语音的时间长度为由第一个字至最后一个字播放敏感词所需的时间。

在其他实施例中，语音搜索处理模块采用预设声音或静音进行替换的步骤也可以包括：语音搜索处理模块先将待编辑音频数据中的敏感词语音删除并在删除位置设置标记位，再按标记位插入预设声音或静音与带标记位的音频数据进行合并，从而保证音频数据播放的流畅性。

进一步地，上述的方法还包括：

步骤S400、语音搜索处理模块将待编辑音频数据中的敏感词语音编辑完成后发送中断请求至处理器。

本实施方式中，语音搜索处理模块发送中断请求至处理器，以提示处理器优先处理，从而提高编辑语音内容的效率。

步骤S500、处理器将内存中编辑完成的音频数据储存于存储介质中。

本实施方式中，处理器直接将内存中编辑完成的音频数据储存于存储介质中。在其他的实施方式中，处理器还可以发送通知提示给主机，以便于让用户确认是否将编辑完成后的音频数据储存，例如用户在主机上进行试听；若用户通过主机确认储存，则处理器再将内存中编辑完成的音频数据储存于存储介质中。

请参阅图3，本发明还提供一种编辑语音内容的存储装置600，包括存储控制器10及存储介质20。存储介质20用于储存音频数据且由存储控制器10来控制存储介质20上数据的读写，存储介质20可以为Flash阵列。存储控制器10包括处理器11、语音搜索处理模块12及内存13。处理器11用于将编辑指令解码并发送至语音搜索处理模块12。语音搜索处理模块12用于提取存储介质20中的待编辑音频数据根据编辑指令进行语音识别搜索，当判断待编辑音频数据中存在敏感词语音时，根据编辑指令对待编辑音频数据中的敏感词语音进行编辑。内存13用于储存语音搜索处理模块12编辑完成后的音频数据。

具体地，存储装置600与主机700电性连接，用户可以在主机700输入编辑指令，通常主机700将编辑指令编码成数据包并通过总线发送至处理器11，再由处理器11进行解码。主机700可以为电脑、平板、服务器等终端设备。主机700与存储装置600内部通过总线进行通信。前述的总线可以为AHB总线、AXI总线、SATA总线、MSATA总线、M.2总线、PCIE总线或USB总线等。前述的存储装置100可以为SSD(Solid State Disk，固态硬盘)，所述存储装置100可以设置在主机700上，也可以和主机700分离设置。

本实施例中，语音搜索处理模块12可以是FPGA(Field-Programmable GateArray，现场可编程门阵列)、DSP(Digital Signal Processing，数字信号处理)、ASIC(Application Specific Integrated Circuit，专用集成电路)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

请一并参阅图4，在一个实施例中，前述的语音搜索处理模块12，进一步包括语音解析单元121、语音识别单元122、语音对比单元123及语音编辑单元124。语音解析单元121用于从待编辑音频数据中解析语音。语音识别单元122用于对解析的语音进行识别。语音对比单元123用于将识别的语音与敏感词样本进行对比，判断待编辑音频数据中是否存在敏感词语音。语音编辑单元124用于当语音对比单元判断出存在敏感词语音时将敏感词语音进行编辑。

优选的，前述的语音搜索处理模块12还用于在对待编辑音频数据中的敏感词语音编辑完成后发送中断请求至处理器11。进一步地，所述语音搜索处理模块12还包括结果返回单元125。结果返回单元125用于在语音编辑单元124将敏感词语音编辑完成后发送中断请求至处理器11，以提示处理器11尽快处理，处理器11再发送通知提示给主机700以提示用户，便于用户使用。

本发明提供的编辑语音内容的方法及存储装置，通过设置语音搜索处理模块12对音频数据进行搜索和编辑处理，以提高大数据处理效率，可节省大量处理器资源，同时有利于节省人工和时间成本。

以上所述仅为本发明的较佳实施例而已，是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施局限于这些说明。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围内。

Claims

1.一种编辑语音内容的方法，其特征在于，包括以下步骤：

处理器将编辑指令解码并发送至语音搜索处理模块；

2.如权利要求1所述的编辑语音内容的方法，其特征在于，所述方法还包括步骤：

处理器将内存中编辑完成的音频数据储存于存储介质中。

3.如权利要求1所述的编辑语音内容的方法，其特征在于，所述语音搜索处理模块根据编辑指令对敏感词语音进行编辑的步骤包括：所述语音搜索处理模块将待编辑音频数据中的敏感词语音采用预设声音或静音进行替换。

4.如权利要求3所述的编辑语音内容的方法，其特征在于，所述语音搜索处理模块判断待编辑音频数据中的敏感词语音的时间长度，并复制相同时间长度的预设声音或静音取代所述待编辑音频数据中的敏感词语音。

5.如权利要求1所述的编辑语音内容的方法，其特征在于，所述编辑指令包括待编辑音频数据、敏感词样本和操作命令。

6.如权利要求5所述的编辑语音内容的方法，其特征在于，所述语音搜索处理模块接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索，判断待编辑音频数据中是否存在敏感词语音的步骤包括：

从待编辑音频数据中解析语音；

将解析的语音进行识别；

7.一种编辑语音内容的存储装置，其特征在于，包括存储控制器及存储介质；所述存储介质用于储存音频数据；所述存储控制器包括处理器、语音搜索处理模块及内存；所述处理器用于将编辑指令解码并发送至语音搜索处理模块；所述语音搜索处理模块用于接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索，判断待编辑音频数据中是否存在敏感词语音，且当判断待编辑音频数据中存在敏感词语音时，根据编辑指令对待编辑音频数据中的敏感词语音进行编辑；所述内存用于储存语音搜索处理模块编辑完成后的音频数据。

8.如权利要求7所述的编辑语音内容的存储装置，其特征在于，所述语音搜索处理模块包括语音解析单元、语音识别单元、语音对比单元及语音编辑单元；所述语音解析单元用于从待编辑音频数据中解析语音；所述语音识别单元用于对解析的语音进行识别；所述语音对比单元用于将识别的语音与敏感词样本进行对比，判断音频数据中是否存在敏感词语音；所述语音编辑单元用于当语音对比单元判断出存在敏感词语音时将敏感词语音进行编辑。

9.如权利要求8所述的编辑语音内容的存储装置，其特征在于，所述语音搜索处理模块还用于在对待编辑音频数据中的敏感词语音编辑完成后发送中断请求至处理器。

10.如权利要求9所述的编辑语音内容的存储装置，其特征在于，所述语音搜索处理模块还包括结果返回单元，所述结果返回单元用于在语音编辑单元将敏感词语音编辑完成后发送中断请求至处理器。