CN109545200A - 编辑语音内容的方法及存储装置 - Google Patents

编辑语音内容的方法及存储装置 Download PDF

Info

Publication number
CN109545200A
CN109545200A CN201811286068.5A CN201811286068A CN109545200A CN 109545200 A CN109545200 A CN 109545200A CN 201811286068 A CN201811286068 A CN 201811286068A CN 109545200 A CN109545200 A CN 109545200A
Authority
CN
China
Prior art keywords
voice
audio data
edited
sensitive word
processing module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811286068.5A
Other languages
English (en)
Inventor
李福文
朱庆春
朱佳齐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Dapu Microelectronics Co Ltd
Original Assignee
Shenzhen Dapu Microelectronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Dapu Microelectronics Co Ltd filed Critical Shenzhen Dapu Microelectronics Co Ltd
Priority to CN201811286068.5A priority Critical patent/CN109545200A/zh
Publication of CN109545200A publication Critical patent/CN109545200A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/285Memory allocation or algorithm optimisation to reduce hardware requirements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Abstract

本发明提供一种编辑语音内容的方法,包括步骤:处理器将编辑指令解码并发送至语音搜索处理模块;语音搜索处理模块接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索,判断待编辑音频数据中是否存在敏感词语音;若待编辑音频数据中存在敏感词语音,则语音搜索处理模块根据编辑指令对待编辑音频数据中的敏感词语音进行编辑,并暂存于内存中。本发明还提供一种编辑语音内容的存储装置,包括存储控制器及存储介质;所述存储介质用于储存音频数据;所述存储控制器包括处理器、语音搜索处理模块及内存。本发明通过设置语音搜索处理模块对音频数据进行搜索和编辑处理,以提高大数据处理效率,可节省大量处理器资源。

Description

编辑语音内容的方法及存储装置
【技术领域】
本发明属于存储技术领域,尤其涉及一种编辑语音内容的方法及存储装置。
【背景技术】
目前,存储设备用来储存用户的资料,其中包括电影、音乐、电视节目等具有音频文件的资料,用户往往需要过滤其中的部分音频,例如,在剪辑电视节目时屏蔽不雅语言以“哔”声代替。此过程需要观看或者聆听完后,才能判断其中是否包括不适当内容,再通过人工搜索来一一替换并保存,效率极低,浪费时间和人力成本。且用户需要通过存储设备连接主机并利用主机来搜索所需要的资料,当存储设备中存在大量资料需要处理时,会导致主机端处理器资源占用率高,同时人工搜索和替换的准确性也较低。鉴于此,实有必要提供一种编辑语音内容的方法及存储装置以克服上述缺陷。
【发明内容】
本发明提出一种编辑语音内容的方法及存储装置,在存储设备中自动搜索不适当语音,有效提高语音替换的处理效率。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种编辑语音内容的方法,包括以下步骤:
处理器将用户的编辑指令解码并发送至语音搜索处理模块;
语音搜索处理模块接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索,判断待编辑音频数据中是否存在敏感词语音;
若待编辑音频数据中存在敏感词语音,则语音搜索处理模块根据编辑指令对待编辑音频数据中的敏感词语音进行编辑,并暂存于内存中。
在一个优选实施方式中,所述方法还包括步骤:
语音搜索处理模块将待编辑音频数据中的敏感词语音编辑完成后发送中断请求至处理器;
处理器将内存中编辑完成的音频数据储存于存储介质中。
在一个优选实施方式中,所述语音搜索处理模块根据编辑指令对敏感词语音进行编辑的步骤包括:所述语音搜索处理模块将待编辑音频数据中的敏感词语音采用预设声音或静音进行替换。
在一个优选实施方式中,所述语音搜索处理模块判断待编辑音频数据中的敏感词语音的时间长度,并复制相同时间长度的预设声音或静音取代所述待编辑音频数据中的敏感词语音。
在一个优选实施方式中,所述编辑指令包括待编辑音频数据、敏感词样本和操作命令。
在一个优选实施方式中,所述语音搜索处理模块接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索,判断待编辑音频数据中是否存在敏感词语音的步骤包括:
从待编辑音频数据中解析语音;
将解析的语音进行识别;
将识别的语音与敏感词样本进行对比,判断是否存在敏感词语音。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种编辑语音内容的存储装置,包括存储控制器及存储介质;所述存储介质用于储存音频数据;所述存储控制器包括处理器、语音搜索处理模块及内存;所述处理器用于将编辑指令解码并发送至语音搜索处理模块;所述语音搜索处理模块用于接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索,判断待编辑音频数据中是否存在敏感词语音,且当判断待编辑音频数据中存在敏感词语音时,根据编辑指令对待编辑音频数据中的敏感词语音进行编辑;所述内存用于储存语音搜索处理模块编辑完成后的音频数据。
在一个优选实施方式中,所述语音搜索处理模块包括语音解析单元、语音识别单元、语音对比单元及语音编辑单元;所述语音解析单元用于从待编辑音频数据中解析语音;所述语音识别单元用于对解析的语音进行识别;所述语音对比单元用于将识别的语音与敏感词样本进行对比,判断音频数据中是否存在敏感词语音;所述语音编辑单元用于当语音对比单元判断出存在敏感词语音时将敏感词语音进行编辑。
在一个优选实施方式中,所述语音搜索处理模块还用于在对待编辑音频数据中的敏感词语音编辑完成后发送中断请求至处理器。
在一个优选实施方式中,所述语音搜索处理模块还包括结果返回单元,所述结果返回单元用于在语音编辑单元将敏感词语音编辑完成后发送中断请求至处理器。
与现有技术相比,本发明的有益效果在于:通过设置语音搜索处理模块对音频数据进行搜索和编辑处理,以提高大数据处理效率,可节省大量处理器资源,同时有利于节省人工和时间成本。
【附图说明】
图1为本发明较佳实施例提供的编辑语音内容的方法的流程图。
图2为图1中对待编辑音频数据进行搜索和判断的子流程图。
图3为本发明较佳实施例提供的编辑语音内容的存储装置的结构框图。
图4为本发明较佳实施例提供的语音搜索处理模块的结构框图。
【具体实施方式】
为了使本发明的目的、技术方案和有益技术效果更加清晰明白,以下结合附图和具体实施方式,对本发明进行进一步详细说明。应当理解的是,本说明书中描述的具体实施方式仅仅是为了解释本发明,并不是为了限定本发明。
请参阅图1,本发明提供一种编辑语音内容的方法,该方法包括以下步骤:
步骤S100、处理器将编辑指令解码并发送至语音搜索处理模块。
在步骤S100之前,用户在主机输入编辑指令,主机将编辑指令编码成数据包再发送至处理器。该编辑指令应包括待编辑音频数据、敏感词样本和操作命令。敏感词样本为用户不希望在待编辑音频数据中出现的语音内容,操作命令可以是将待编辑音频数据中包含的敏感词采用预设声音或静音进行替换,具体根据用户的需要而设定,从而实现对待编辑音频数据中不适当的语音进行不同编辑方式。前述的待编辑音频数据储存于存储介质中,可以为电影、音乐、电视节目等具有音频文件的资料。
步骤S200、语音搜索处理模块接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索,判断待编辑音频数据中是否存在敏感词语音。
在一个实施例中,请一并参阅图2,步骤S200具体包括以下子步骤:
步骤S201、从待编辑音频数据中解析语音;
步骤S202、将解析的语音进行识别;
步骤S203、将识别的语音与敏感词样本进行对比,判断是否存在敏感词语音。
本实施例中,可利用端点侦测技术对音频数据中哪些区段是有声段,那些是属于无声段或背景噪声进行判断。当找到有声段后,利用强波处理技术补偿语音讯号中浊音讯号的衰减,以提高辨识的准确率,然后利用数字滤波器组来处理语音讯号,将每个滤波器的频谱能量值利用线性倒频谱系数转换成为声音的特征值,从而与编辑指令中的敏感词样本进行对比,以判断音频数据中是否存在敏感词语音。
步骤S300、若待编辑音频数据中存在敏感词语音,则语音搜索处理模块根据编辑指令对音频数据中的敏感词语音进行编辑,并暂存于内存中。
本步骤中,语音搜索处理模块根据编辑指令对敏感词语音进行编辑的步骤包括:语音搜索处理模块将敏感词语音采用预设声音或静音进行替换。例如用户希望将某个音频数据中出现的“外星人”这一敏感词进行替换时,则在编辑指令内应预先设置包括“外星人”的声音样本和替换声音,替换声音可以是“哔哔”声。
在一个实施例中,语音搜索处理模块采用预设声音或静音进行替换的步骤可以包括:语音搜索处理模块判断待编辑音频数据中的敏感词语音的时间长度,并复制相同时间长度的预设声音或静音取代待编辑音频数据中的敏感词语音。其中,敏感词语音的时间长度为由第一个字至最后一个字播放敏感词所需的时间。
在其他实施例中,语音搜索处理模块采用预设声音或静音进行替换的步骤也可以包括:语音搜索处理模块先将待编辑音频数据中的敏感词语音删除并在删除位置设置标记位,再按标记位插入预设声音或静音与带标记位的音频数据进行合并,从而保证音频数据播放的流畅性。
进一步地,上述的方法还包括:
步骤S400、语音搜索处理模块将待编辑音频数据中的敏感词语音编辑完成后发送中断请求至处理器。
本实施方式中,语音搜索处理模块发送中断请求至处理器,以提示处理器优先处理,从而提高编辑语音内容的效率。
步骤S500、处理器将内存中编辑完成的音频数据储存于存储介质中。
本实施方式中,处理器直接将内存中编辑完成的音频数据储存于存储介质中。在其他的实施方式中,处理器还可以发送通知提示给主机,以便于让用户确认是否将编辑完成后的音频数据储存,例如用户在主机上进行试听;若用户通过主机确认储存,则处理器再将内存中编辑完成的音频数据储存于存储介质中。
请参阅图3,本发明还提供一种编辑语音内容的存储装置600,包括存储控制器10及存储介质20。存储介质20用于储存音频数据且由存储控制器10来控制存储介质20上数据的读写,存储介质20可以为Flash阵列。存储控制器10包括处理器11、语音搜索处理模块12及内存13。处理器11用于将编辑指令解码并发送至语音搜索处理模块12。语音搜索处理模块12用于提取存储介质20中的待编辑音频数据根据编辑指令进行语音识别搜索,当判断待编辑音频数据中存在敏感词语音时,根据编辑指令对待编辑音频数据中的敏感词语音进行编辑。内存13用于储存语音搜索处理模块12编辑完成后的音频数据。
具体地,存储装置600与主机700电性连接,用户可以在主机700输入编辑指令,通常主机700将编辑指令编码成数据包并通过总线发送至处理器11,再由处理器11进行解码。主机700可以为电脑、平板、服务器等终端设备。主机700与存储装置600内部通过总线进行通信。前述的总线可以为AHB总线、AXI总线、SATA总线、MSATA总线、M.2总线、PCIE总线或USB总线等。前述的存储装置100可以为SSD(Solid State Disk,固态硬盘),所述存储装置100可以设置在主机700上,也可以和主机700分离设置。
本实施例中,语音搜索处理模块12可以是FPGA(Field-Programmable GateArray,现场可编程门阵列)、DSP(Digital Signal Processing,数字信号处理)、ASIC(Application Specific Integrated Circuit,专用集成电路)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
请一并参阅图4,在一个实施例中,前述的语音搜索处理模块12,进一步包括语音解析单元121、语音识别单元122、语音对比单元123及语音编辑单元124。语音解析单元121用于从待编辑音频数据中解析语音。语音识别单元122用于对解析的语音进行识别。语音对比单元123用于将识别的语音与敏感词样本进行对比,判断待编辑音频数据中是否存在敏感词语音。语音编辑单元124用于当语音对比单元判断出存在敏感词语音时将敏感词语音进行编辑。
优选的,前述的语音搜索处理模块12还用于在对待编辑音频数据中的敏感词语音编辑完成后发送中断请求至处理器11。进一步地,所述语音搜索处理模块12还包括结果返回单元125。结果返回单元125用于在语音编辑单元124将敏感词语音编辑完成后发送中断请求至处理器11,以提示处理器11尽快处理,处理器11再发送通知提示给主机700以提示用户,便于用户使用。
本发明提供的编辑语音内容的方法及存储装置,通过设置语音搜索处理模块12对音频数据进行搜索和编辑处理,以提高大数据处理效率,可节省大量处理器资源,同时有利于节省人工和时间成本。
以上所述仅为本发明的较佳实施例而已,是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施局限于这些说明。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围内。

Claims (10)

1.一种编辑语音内容的方法,其特征在于,包括以下步骤:
处理器将编辑指令解码并发送至语音搜索处理模块;
语音搜索处理模块接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索,判断待编辑音频数据中是否存在敏感词语音;
若待编辑音频数据中存在敏感词语音,则语音搜索处理模块根据编辑指令对待编辑音频数据中的敏感词语音进行编辑,并暂存于内存中。
2.如权利要求1所述的编辑语音内容的方法,其特征在于,所述方法还包括步骤:
语音搜索处理模块将待编辑音频数据中的敏感词语音编辑完成后发送中断请求至处理器;
处理器将内存中编辑完成的音频数据储存于存储介质中。
3.如权利要求1所述的编辑语音内容的方法,其特征在于,所述语音搜索处理模块根据编辑指令对敏感词语音进行编辑的步骤包括:所述语音搜索处理模块将待编辑音频数据中的敏感词语音采用预设声音或静音进行替换。
4.如权利要求3所述的编辑语音内容的方法,其特征在于,所述语音搜索处理模块判断待编辑音频数据中的敏感词语音的时间长度,并复制相同时间长度的预设声音或静音取代所述待编辑音频数据中的敏感词语音。
5.如权利要求1所述的编辑语音内容的方法,其特征在于,所述编辑指令包括待编辑音频数据、敏感词样本和操作命令。
6.如权利要求5所述的编辑语音内容的方法,其特征在于,所述语音搜索处理模块接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索,判断待编辑音频数据中是否存在敏感词语音的步骤包括:
从待编辑音频数据中解析语音;
将解析的语音进行识别;
将识别的语音与敏感词样本进行对比,判断是否存在敏感词语音。
7.一种编辑语音内容的存储装置,其特征在于,包括存储控制器及存储介质;所述存储介质用于储存音频数据;所述存储控制器包括处理器、语音搜索处理模块及内存;所述处理器用于将编辑指令解码并发送至语音搜索处理模块;所述语音搜索处理模块用于接收编辑指令并提取存储介质中的待编辑音频数据进行语音识别搜索,判断待编辑音频数据中是否存在敏感词语音,且当判断待编辑音频数据中存在敏感词语音时,根据编辑指令对待编辑音频数据中的敏感词语音进行编辑;所述内存用于储存语音搜索处理模块编辑完成后的音频数据。
8.如权利要求7所述的编辑语音内容的存储装置,其特征在于,所述语音搜索处理模块包括语音解析单元、语音识别单元、语音对比单元及语音编辑单元;所述语音解析单元用于从待编辑音频数据中解析语音;所述语音识别单元用于对解析的语音进行识别;所述语音对比单元用于将识别的语音与敏感词样本进行对比,判断音频数据中是否存在敏感词语音;所述语音编辑单元用于当语音对比单元判断出存在敏感词语音时将敏感词语音进行编辑。
9.如权利要求8所述的编辑语音内容的存储装置,其特征在于,所述语音搜索处理模块还用于在对待编辑音频数据中的敏感词语音编辑完成后发送中断请求至处理器。
10.如权利要求9所述的编辑语音内容的存储装置,其特征在于,所述语音搜索处理模块还包括结果返回单元,所述结果返回单元用于在语音编辑单元将敏感词语音编辑完成后发送中断请求至处理器。
CN201811286068.5A 2018-10-31 2018-10-31 编辑语音内容的方法及存储装置 Pending CN109545200A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811286068.5A CN109545200A (zh) 2018-10-31 2018-10-31 编辑语音内容的方法及存储装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811286068.5A CN109545200A (zh) 2018-10-31 2018-10-31 编辑语音内容的方法及存储装置

Publications (1)

Publication Number Publication Date
CN109545200A true CN109545200A (zh) 2019-03-29

Family

ID=65846090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811286068.5A Pending CN109545200A (zh) 2018-10-31 2018-10-31 编辑语音内容的方法及存储装置

Country Status (1)

Country Link
CN (1) CN109545200A (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1976390A (zh) * 2006-11-03 2007-06-06 中山大学 一种实现数字电视画面图文信息保存的方法
CN101877223A (zh) * 2009-04-29 2010-11-03 鸿富锦精密工业(深圳)有限公司 影音编辑系统、方法及具有该影音编辑系统的电子设备
US20100280828A1 (en) * 2009-04-30 2010-11-04 Gene Fein Communication Device Language Filter
CN102740162A (zh) * 2012-06-19 2012-10-17 深圳Tcl新技术有限公司 电视机及其视频编辑方法、装置
WO2013182118A1 (zh) * 2012-12-27 2013-12-12 中兴通讯股份有限公司 一种语音数据的传输方法及装置
CN104166850A (zh) * 2014-08-07 2014-11-26 和汇投资集团股份有限公司 一种语音识别应用系统的解决敏感词未知性的方法
CN105244026A (zh) * 2015-08-24 2016-01-13 陈娟 一种语音处理方法及装置
CN105390135A (zh) * 2015-10-12 2016-03-09 四川长虹电器股份有限公司 游戏语音控制系统
CN105895102A (zh) * 2015-11-15 2016-08-24 乐视移动智能信息技术(北京)有限公司 录音编辑方法及录音装置
CN106888308A (zh) * 2017-03-31 2017-06-23 维沃移动通信有限公司 一种语音处理方法及移动终端
CN107133102A (zh) * 2017-05-04 2017-09-05 深圳大普微电子科技有限公司 一种数据处理系统和方法
CN107659538A (zh) * 2016-07-25 2018-02-02 北京优朋普乐科技有限公司 一种视频处理的方法及设备
CN107766268A (zh) * 2017-10-27 2018-03-06 郑州云海信息技术有限公司 存储设备的中断发送方法、装置、系统、设备及存储介质
CN107885134A (zh) * 2017-12-25 2018-04-06 成都实时技术股份有限公司 一种基于航电设备的故障数据记录方法及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1976390A (zh) * 2006-11-03 2007-06-06 中山大学 一种实现数字电视画面图文信息保存的方法
CN101877223A (zh) * 2009-04-29 2010-11-03 鸿富锦精密工业(深圳)有限公司 影音编辑系统、方法及具有该影音编辑系统的电子设备
US20100280828A1 (en) * 2009-04-30 2010-11-04 Gene Fein Communication Device Language Filter
CN102740162A (zh) * 2012-06-19 2012-10-17 深圳Tcl新技术有限公司 电视机及其视频编辑方法、装置
WO2013182118A1 (zh) * 2012-12-27 2013-12-12 中兴通讯股份有限公司 一种语音数据的传输方法及装置
CN104166850A (zh) * 2014-08-07 2014-11-26 和汇投资集团股份有限公司 一种语音识别应用系统的解决敏感词未知性的方法
CN105244026A (zh) * 2015-08-24 2016-01-13 陈娟 一种语音处理方法及装置
CN105390135A (zh) * 2015-10-12 2016-03-09 四川长虹电器股份有限公司 游戏语音控制系统
CN105895102A (zh) * 2015-11-15 2016-08-24 乐视移动智能信息技术(北京)有限公司 录音编辑方法及录音装置
CN107659538A (zh) * 2016-07-25 2018-02-02 北京优朋普乐科技有限公司 一种视频处理的方法及设备
CN106888308A (zh) * 2017-03-31 2017-06-23 维沃移动通信有限公司 一种语音处理方法及移动终端
CN107133102A (zh) * 2017-05-04 2017-09-05 深圳大普微电子科技有限公司 一种数据处理系统和方法
CN107766268A (zh) * 2017-10-27 2018-03-06 郑州云海信息技术有限公司 存储设备的中断发送方法、装置、系统、设备及存储介质
CN107885134A (zh) * 2017-12-25 2018-04-06 成都实时技术股份有限公司 一种基于航电设备的故障数据记录方法及装置

Similar Documents

Publication Publication Date Title
CN104143329B (zh) 进行语音关键词检索的方法及装置
EP2700071B1 (en) Speech recognition using multiple language models
EP1650744A1 (en) Invalid command detection in speech recognition
US9412359B2 (en) System and method for cloud-based text-to-speech web services
WO2020233363A1 (zh) 语音识别的方法、装置、电子设备和存储介质
US20080065368A1 (en) Spoken Translation System Using Meta Information Strings
US20120095752A1 (en) Leveraging back-off grammars for authoring context-free grammars
CN111798833A (zh) 一种语音测试方法、装置、设备和存储介质
CN110853628A (zh) 一种模型训练方法、装置、电子设备及存储介质
KR101426214B1 (ko) 텍스트 대 스피치 변환을 위한 방법 및 시스템
CN114330371A (zh) 基于提示学习的会话意图识别方法、装置和电子设备
WO2023272616A1 (zh) 一种文本理解方法、系统、终端设备和存储介质
CN106710587A (zh) 一种语音识别数据预处理方法
CN106531202A (zh) 一种音频处理方法及装置
Le et al. Better evaluation of ASR in speech translation context using word embeddings
CN109545200A (zh) 编辑语音内容的方法及存储装置
CN114974240A (zh) 财务系统的语音控制方法、装置、存储介质及设备
CN113516963B (zh) 音频数据的生成方法、装置、服务器和智能音箱
CN113053390A (zh) 基于语音识别的文本处理方法、装置、电子设备及介质
CN112329484A (zh) 自然语言的翻译方法及装置
US20030216921A1 (en) Method and system for limited domain text to speech (TTS) processing
Skadina et al. Towards the first dictation system for Latvian Language
US20060074638A1 (en) Speech file generating system and method
Ferreiros et al. Controlling a HIFI with a continuous speech understanding system.
CN116052635A (zh) 一种音频敏感信息自动屏蔽方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination