CN105006230A - 一种面向非特定人的语音敏感信息检测和过滤方法 - Google Patents

一种面向非特定人的语音敏感信息检测和过滤方法 Download PDF

Info

Publication number
CN105006230A
CN105006230A CN201510320065.9A CN201510320065A CN105006230A CN 105006230 A CN105006230 A CN 105006230A CN 201510320065 A CN201510320065 A CN 201510320065A CN 105006230 A CN105006230 A CN 105006230A
Authority
CN
China
Prior art keywords
voice
sensitive word
sensitive
feature
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510320065.9A
Other languages
English (en)
Inventor
苏兆品
张国富
岳峰
齐美彬
蒋建国
胡东辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201510320065.9A priority Critical patent/CN105006230A/zh
Publication of CN105006230A publication Critical patent/CN105006230A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种面向非特定人的语音敏感信息检测和过滤方法,可以实现对实时语音和语音文件的检测和过滤。首先采用改进的双门限端点检测算法对原始语音进行端点检测,提取语音的Mel频率倒谱系数特征,采用自学习的动态时间归整算法训练出合适的语音特征模板,存入数据库。然后采用改进的双门限端点检测算法对原始语音进行端点检测,提取MFCC特征,然后采用粗匹配与细匹配相结合的方法将提取的语音特征与敏感词特征模板数据库中的模板进行比对,从而检测出输入语音中的敏感词,并将检测出的敏感词进行过滤。

Description

一种面向非特定人的语音敏感信息检测和过滤方法
技术领域
本发明涉及多媒体内容安全技术,具体是一种面向非特定人的语音敏感信息检测和过滤方法。
背景技术
随着电信网络技术的发展,电话语音、网络音频为首的语音应用日渐成熟。但是,含有敏感信息、非法信息的语音传播不利于社会和谐稳定和和国家长治久安。如何从海量的语音数据中检测敏感信息已经成为亟待解决的问题。
传统的方法是采用人工聆听,这种方式仅适用于处理少量语音,而对海量语音信息进行人工检测时,其效率低下,往往耗费巨大的人力物力,却难以达到令人满意的检测准确率。随着语音识别技术的发展,人们首先将语音识别成文字,再采用文本过滤的方法检测出敏感词并对文字进行处理,然后返回到相应的语音帧将其过滤。虽然该方法采用计算机自动处理,避免了人力资源浪费,但是语音识别过程缓慢,很难应用于电视、广播等实时互动语音节目、语音聊天室等对实时性要求较高的场合。
综上,现有技术中,面向非特定人的语音敏感信息检测和过滤方法局限性大,漏检率、误检率高,很难满足实时性需求。
发明内容
本发明的目的是提供一种面向非特定人的语音敏感信息检测和过滤方法,以解决现有技术存在的问题。
为了达到上述目的,本发明所采用的技术方案为:
一种面向非特定人的语音敏感信息检测和过滤方法,其特征在于:首先对敏感词语音进行采集,提取语音特征,生成敏感词特征模板,创建敏感词特征模板数据库;
然后接收待处理的实时语音或语音文件,提取实时语音或语音文件的特征;
最后采用粗匹配与细匹配相结合的方法,将提取的待处理的实时语音或语音文件的语音特征与敏感词特征模板数据库中的模板进行比对,检测出实时语音或语音文件中的敏感词,并将检测出的敏感词进行过滤。
所述的一种面向非特定人的语音敏感信息检测和过滤方法,其特征在于:对敏感词语音进行语音特征提取的过程为:对敏感词语音进行信号处理,采用端点检测判断出语音信号的开始帧和结束帧,提取频域39维语音特征向量,提取的语音特征具有唯一性。
所述的一种面向非特定人的语音敏感信息检测和过滤方法,其特征在于:敏感词特征模板的生成过程为:采集多段非特定人的敏感词语音,提取语音特征,采用自学习机制迭代更新敏感词特征模板,直至敏感词特征模板不再变化为止。
所述的一种面向非特定人的语音敏感信息检测和过滤方法,其特征在于:所述对待处理的语音特征与敏感词特征模板数据库中的模板进行比对的过程为:提取待处理的实时语音或语音文件的语音特征后,先采用粗匹配方法确定是否存在敏感词,若存在,则采用细匹配方法确定敏感词的具体位置,以便于进行过滤处理;
粗匹配时,依次从敏感词特征模板数据库中的每个特征模板前五帧放入待处理语音帧头开始直接比对,若高于粗匹配阈值,则认为该处不存在该敏感词;若低于粗匹配阈值,则认为该处可能存在当前正在匹配的敏感词,并进入细匹配模式;
细匹配时,从当前语音帧开始,以当前敏感词为模板,继续粗匹配若干帧,寻找语音距离最小的帧号标记为敏感词开始,以该敏感词全部帧长为中心,并变长地计算与该敏感词的欧氏距离,判断其最小值是否高于细匹配阈值。若最小值高于细匹配阈值,则判断不存在该词;若最小值低于细匹配阈值,则判断存在该敏感词,而且敏感词的长度即为该语音距离所对应的帧长。
所述的一种面向非特定人的语音敏感信息检测和过滤方法,其特征在于:粗匹配时,敏感词特征模板数据库中的每个特征模板前五帧放入待处理语音帧头进行比对时,采用计算待处理语音帧的语音特征与敏感词特征模板之间的语音距离的方法,度量方法可以采用欧氏距离方法、曼哈顿距离方法。
所述的一种面向非特定人的语音敏感信息检测和过滤方法,其特征在于:粗匹配和细匹配阈值的选择是根据敏感信息检测的误判率和漏判率进行调整。
本发明中,首先建立敏感词特征模板数据库;当需要对实时语音或语音文件进行敏感词检测和过滤时,先对待处理的实时语音或语音文件提取具有唯一性的语音特征,然后与敏感词特征模板数据库中的特征进行匹配,检测出敏感词,并进行过滤。
采用本发明,对待处理的语音特征进行敏感词的依次匹配,采用多线程方法进行。
采用本发明,根据实际需要,建立不同规模的敏感词特征模板数据库。
采用本发明,根据敏感词检测方法的正确率,设置粗匹配和细匹配的阈值,并进行微调。
与已有技术相比,本发明有益效果体现在:
(1)本发明是基于语音特征实现敏感词的检测和过滤,保证了本发明是面向非特定人的,只与说话人说话的内容有关;
(2)本发明采用了自学习机制迭代生成敏感词特征模板的方法,保证了语音特征模板的准确性,提高敏感词检测的正确率。
(3)本发明采用了粗匹配和细匹配相结合的匹配方法,提高了敏感词检测的速度,保证了本发明实施的实时性。
(4)本发明可运用于电视、广播等语音直播互动节目、语音聊天室、大型网络游戏等场合中语音敏感词检测和过滤;也可运用于电视、广播、互联网等引进节目的敏感信息检测。
附图说明
图1为本发明进行敏感词检测和过滤的方法示意性流程图。
图2为本发明设计的敏感词特征模板生成方法示意图。
图3为本发明设计的敏感词匹配方法示意图。
具体实施方式
本发明构建敏感词特征模板数据库,并基于敏感词特征模板数据库实现对实时语音或语音文件中敏感词的检测和过滤。
参见图1,为本发明进行敏感词检测和过滤的方法示意性流程图。该方法通过特征模板训练模块构建敏感词特征模板数据库;然后通过检测和过滤模块实现对实时语音和语音文件中敏感词的检测和过滤。
本发明中的敏感词可以包括脏话等不文明词汇、涉及到国家安全等的涉密词汇等。
图1的流程包括以下步骤:
步骤101,接受敏感词语音输入,对其进行端点检测。根据语音的统计特性,语音段分为清音、浊音以及静音(含背景噪声)三种。但由于清音能量较小,采用短时能量检测会因为低于能量门限而被误判为静音。因此,在本发明中,利用短时能量检测浊音和静音,利用短时过零率检测静音和清音。
实现时,本步骤具体包括:对接受到的敏感词语音进行分帧,计算每帧的短时能量,确定短时能量的高门限值EH和低门限值EL;计算每帧的短时过零率,确定短时过零率的高门限值ZH和低门限值ZL;检测每一帧的短时能量和短时过零率,当某一帧的短时能量高于EH而且短时平均过零率高于ZH时,则该帧标记为语音开始帧;当某一帧的短时能量低于EL而且短时过零率低于ZL时,则该帧标记为语音结束帧。
上述端点检测步骤应用于敏感词的端点检测时,需要进行循环检测,找到一个语音文件的第一个开始帧和最后一个结束帧;同时,如果检测到的语音段长度小于一定的帧数,则认为语音段出错。
上述端点检测步骤中,短时能量的高门限值EH和低门限值EL,以及短时过零率的高门限值ZH和低门限值ZL可以根据场景进行设置,并经过实验进行微调。
例如,在本发明的一个实施实例中,设置EH=4,EL=1,ZH=4,ZL=2,经过多次实验微调为EH=4.2,EL=1.1,ZH=4,ZL=1.9。
步骤102,对端点检测后的语音进行特征提取,提取频域39维的MFCC语音特征向量,提取的语音特征具有唯一性。
步骤103,参见图2,用提取的语音特征不断更新敏感词特征模板,直至敏感词特征模板不再变化为止。
实现时,本步骤具体包括:采用动态时间规整方法将新提取的语音特征归整为与敏感词特征模板相同长度的特征;然后通过计算新语音帧与已有语音帧之间的最佳路径,找到已有语音每一帧所对应的新语音帧最后,对于每一对应帧,按照公式(1)更新每一帧的特征值,其中λ为已训练次数。
T → i = λ T → i λ + 1 + R → k λ + 1 - - - ( 1 )
步骤104,将训练的敏感词特征模板存入到敏感词特征数据库中。
实现时,敏感词特征数据库表的字段可以包括敏感词序号、敏感词、敏感词特征模板等信息。
在本发明的实施例中,可以根据实际需要设置敏感词特征数据库中敏感词的数目。
在本发明的实施例中,可以敏感词特征数据库进行更新,从而保证敏感词汇的丰富、正确和实时性。
步骤105,接受实时语音或者语音文件的输入,对其进行端点检测。采用的方法与步骤101中的方法相同。
步骤106,对端点检测后的语音进行特征提取。采用的方法与步骤102中的方法相同。
步骤107,在提取的语音特征中通过匹配方法确定是否存在特征数据库中的敏感词(参见图3)。采用的方法是先采用粗匹配方法确定是否存在敏感词,若存在,则采用细匹配方法确定敏感词的具体位置,以便于敏感信息的过滤。
实现时,步骤107所述的粗匹配方法包括:依次从敏感词特征模板数据库中的每个特征模板前五帧放入待处理语音帧头开始直接比对(采用欧式距离作为语音距离的度量方法),若高于粗匹配阈值,则认为该处不存在该敏感词;若低于粗匹配阈值,则认为该处可能存在当前正在匹配的敏感词,并进入细匹配模式。
实现时,步骤107所述的细匹配方法包括:从当前语音帧开始,以当前敏感词为模板,继续粗匹配若干帧,寻找语音距离最小的帧号标记为敏感词开始,以该敏感词全部帧长为中心,并变长地计算与该敏感词的DTW距离,判断其最小值是否高于细匹配阈值。若最小值高于细匹配阈值,则判断不存在该词;若最小值低于细匹配阈值,则判断存在该敏感词,而且敏感词的长度即为该语音距离所对应的帧长。
例如,在本发明的一个实施实例中,设置粗匹配阈值为3.0,细匹配阈值为1.25。
步骤108,对检测出的敏感信息进行过滤,采用的方法包括:对敏感信息进行静音,或者替换成“bibo”“didi”等其他声音。
根据本发明实施例的面向非特定人的语音敏感信息检测和过滤方法能够对任何语音信息中的敏感词汇进行自动检测,并过滤掉敏感词汇,从而确保健康、安全的沟通环境。相对已有的敏感词检测和过滤方法,本发明可以免除了大量的人力劳动,有效降低了成本,并且准确率高,实时性好,可以运用于电视、广播等语音直播互动节目、语音聊天室、大型网络游戏等场合中语音敏感词检测和过滤;也可运用于电视、广播、互联网等引进节目的敏感信息检测。

Claims (6)

1.一种面向非特定人的语音敏感信息检测和过滤方法,其特征在于:首先对敏感词语音进行采集,提取语音特征,生成敏感词特征模板,创建敏感词特征模板数据库;
然后接收待处理的实时语音或语音文件,提取实时语音或语音文件的特征;
最后采用粗匹配与细匹配相结合的方法,将提取的待处理的实时语音或语音文件的语音特征与敏感词特征模板数据库中的模板进行比对,检测出实时语音或语音文件中的敏感词,并将检测出的敏感词进行过滤。
2.根据权利要求1所述的一种面向非特定人的语音敏感信息检测和过滤方法,其特征在于:对敏感词语音进行语音特征提取的过程为:对敏感词语音进行信号处理,采用端点检测判断出语音信号的开始帧和结束帧,提取频域39维语音特征向量,提取的语音特征具有唯一性。
3.根据权利要求1所述的一种面向非特定人的语音敏感信息检测和过滤方法,其特征在于:敏感词特征模板的生成过程为:采集多段非特定人的敏感词语音,提取语音特征,采用自学习机制迭代更新敏感词特征模板,直至敏感词特征模板不再变化为止。
4.根据权利要求1所述的一种面向非特定人的语音敏感信息检测和过滤方法,其特征在于:所述对待处理的语音特征与敏感词特征模板数据库中的模板进行比对的过程为:提取待处理的实时语音或语音文件的语音特征后,先采用粗匹配方法确定是否存在敏感词,若存在,则采用细匹配方法确定敏感词的具体位置,以便于进行过滤处理;
粗匹配时,依次从敏感词特征模板数据库中的每个特征模板前五帧放入待处理语音帧头开始直接比对,若高于粗匹配阈值,则认为该处不存在该敏感词;若低于粗匹配阈值,则认为该处可能存在当前正在匹配的敏感词,并进入细匹配模式;
细匹配时,从当前语音帧开始,以当前敏感词为模板,继续粗匹配若干帧,寻找语音距离最小的帧号标记为敏感词开始,以该敏感词全部帧长为中心,并变长地计算与该敏感词的欧氏距离,判断其最小值是否高于细匹配阈值;若最小值高于细匹配阈值,则判断不存在该词;若最小值低于细匹配阈值,则判断存在该敏感词,而且敏感词的长度即为该语音距离所对应的帧长。
5.根据权利要求4所述的一种面向非特定人的语音敏感信息检测和过滤方法,其特征在于:粗匹配时,敏感词特征模板数据库中的每个特征模板前五帧放入待处理语音帧头进行比对时,采用计算待处理语音帧的语音特征与敏感词特征模板之间的语音距离的方法,度量方法可以采用欧氏距离方法、曼哈顿距离方法。
6.根据权利要求4所述的一种面向非特定人的语音敏感信息检测和过滤方法,其特征在于:粗匹配和细匹配阈值的选择是根据敏感信息检测的误判率和漏判率进行调整。
CN201510320065.9A 2015-06-10 2015-06-10 一种面向非特定人的语音敏感信息检测和过滤方法 Pending CN105006230A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510320065.9A CN105006230A (zh) 2015-06-10 2015-06-10 一种面向非特定人的语音敏感信息检测和过滤方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510320065.9A CN105006230A (zh) 2015-06-10 2015-06-10 一种面向非特定人的语音敏感信息检测和过滤方法

Publications (1)

Publication Number Publication Date
CN105006230A true CN105006230A (zh) 2015-10-28

Family

ID=54378877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510320065.9A Pending CN105006230A (zh) 2015-06-10 2015-06-10 一种面向非特定人的语音敏感信息检测和过滤方法

Country Status (1)

Country Link
CN (1) CN105006230A (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105895088A (zh) * 2016-05-27 2016-08-24 京东方科技集团股份有限公司 智能可穿戴设备及语音纠错系统
CN106601230A (zh) * 2016-12-19 2017-04-26 苏州金峰物联网技术有限公司 基于连续混合高斯hmm模型的物流分拣地名语音识别方法、系统及物流分拣系统
CN106789949A (zh) * 2016-11-30 2017-05-31 广东欧珀移动通信有限公司 一种语音数据的发送方法、装置及终端
CN106971711A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种自适应的声纹识别方法及系统
CN106971729A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种基于声音特征范围提高声纹识别速度的方法及系统
CN107068152A (zh) * 2017-04-06 2017-08-18 杭州图南电子股份有限公司 一种基于应急广播的智能语音识别安全监测方法
CN108682413A (zh) * 2018-04-24 2018-10-19 上海师范大学 一种基于语音转换的情感疏导系统
CN108831456A (zh) * 2018-05-25 2018-11-16 深圳警翼智能科技股份有限公司 一种通过语音识别对视频标记的方法、装置及系统
CN108922561A (zh) * 2018-06-04 2018-11-30 平安科技(深圳)有限公司 语音区分方法、装置、计算机设备及存储介质
CN108920937A (zh) * 2018-07-03 2018-11-30 广州视源电子科技股份有限公司 投屏系统、投屏方法和装置
CN109637533A (zh) * 2018-12-25 2019-04-16 深圳市道通智能航空技术有限公司 无人飞行器、其语音系统及语音交互方法
CN109637520A (zh) * 2018-10-16 2019-04-16 平安科技(深圳)有限公司 基于语音分析的敏感内容识别方法、装置、终端及介质
CN110277105A (zh) * 2019-07-05 2019-09-24 广州酷狗计算机科技有限公司 消除背景音频数据的方法、装置和系统
WO2019242132A1 (zh) * 2018-06-19 2019-12-26 平安科技(深圳)有限公司 信息过滤方法、装置、计算机设备及存储介质
CN110853668A (zh) * 2019-09-06 2020-02-28 南京工程学院 基于多种特征融合的语音篡改检测方法
CN111031329A (zh) * 2018-10-10 2020-04-17 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111105788A (zh) * 2019-12-20 2020-05-05 北京三快在线科技有限公司 敏感词分数检测方法、装置、电子设备及存储介质
CN111107380A (zh) * 2018-10-10 2020-05-05 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN112331188A (zh) * 2019-07-31 2021-02-05 武汉Tcl集团工业研究院有限公司 一种语音数据处理方法、系统及终端设备
CN112634881A (zh) * 2020-12-30 2021-04-09 广州博士信息技术研究院有限公司 一种基于科技成果数据库的语音智能识别方法及系统
CN113223558A (zh) * 2021-04-30 2021-08-06 广州虎牙科技有限公司 音频数据消音方法、装置、电子设备和存储介质
CN113724735A (zh) * 2021-09-01 2021-11-30 广州博冠信息科技有限公司 语音流处理方法及装置、计算机可读存储介质、电子设备
CN113889142A (zh) * 2021-10-14 2022-01-04 鹰潭市广播电视传媒集团有限责任公司 基于公共播音喇叭的播音监控系统、方法、装置和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6073095A (en) * 1997-10-15 2000-06-06 International Business Machines Corporation Fast vocabulary independent method and apparatus for spotting words in speech
CN102376305A (zh) * 2011-11-29 2012-03-14 安徽科大讯飞信息科技股份有限公司 语音识别方法及系统
CN102572839A (zh) * 2010-12-14 2012-07-11 中国移动通信集团四川有限公司 一种控制语音通信的方法和系统
CN103971700A (zh) * 2013-08-01 2014-08-06 哈尔滨理工大学 语音监控方法及装置
CN104505090A (zh) * 2014-12-15 2015-04-08 北京国双科技有限公司 敏感词的语音识别方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6073095A (en) * 1997-10-15 2000-06-06 International Business Machines Corporation Fast vocabulary independent method and apparatus for spotting words in speech
CN102572839A (zh) * 2010-12-14 2012-07-11 中国移动通信集团四川有限公司 一种控制语音通信的方法和系统
CN102376305A (zh) * 2011-11-29 2012-03-14 安徽科大讯飞信息科技股份有限公司 语音识别方法及系统
CN103971700A (zh) * 2013-08-01 2014-08-06 哈尔滨理工大学 语音监控方法及装置
CN104505090A (zh) * 2014-12-15 2015-04-08 北京国双科技有限公司 敏感词的语音识别方法和装置

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971711A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种自适应的声纹识别方法及系统
CN106971729A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种基于声音特征范围提高声纹识别速度的方法及系统
CN105895088A (zh) * 2016-05-27 2016-08-24 京东方科技集团股份有限公司 智能可穿戴设备及语音纠错系统
CN106789949A (zh) * 2016-11-30 2017-05-31 广东欧珀移动通信有限公司 一种语音数据的发送方法、装置及终端
CN106789949B (zh) * 2016-11-30 2019-11-26 Oppo广东移动通信有限公司 一种语音数据的发送方法、装置及终端
CN106601230A (zh) * 2016-12-19 2017-04-26 苏州金峰物联网技术有限公司 基于连续混合高斯hmm模型的物流分拣地名语音识别方法、系统及物流分拣系统
CN107068152B (zh) * 2017-04-06 2020-06-16 杭州图南电子股份有限公司 一种基于应急广播的智能语音识别安全监测方法
CN107068152A (zh) * 2017-04-06 2017-08-18 杭州图南电子股份有限公司 一种基于应急广播的智能语音识别安全监测方法
CN108682413A (zh) * 2018-04-24 2018-10-19 上海师范大学 一种基于语音转换的情感疏导系统
CN108682413B (zh) * 2018-04-24 2020-09-29 上海师范大学 一种基于语音转换的情感疏导系统
CN108831456B (zh) * 2018-05-25 2022-04-15 深圳警翼智能科技股份有限公司 一种通过语音识别对视频标记的方法、装置及系统
CN108831456A (zh) * 2018-05-25 2018-11-16 深圳警翼智能科技股份有限公司 一种通过语音识别对视频标记的方法、装置及系统
CN108922561A (zh) * 2018-06-04 2018-11-30 平安科技(深圳)有限公司 语音区分方法、装置、计算机设备及存储介质
WO2019242132A1 (zh) * 2018-06-19 2019-12-26 平安科技(深圳)有限公司 信息过滤方法、装置、计算机设备及存储介质
CN108920937A (zh) * 2018-07-03 2018-11-30 广州视源电子科技股份有限公司 投屏系统、投屏方法和装置
CN111031329A (zh) * 2018-10-10 2020-04-17 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111107380A (zh) * 2018-10-10 2020-05-05 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111031329B (zh) * 2018-10-10 2023-08-15 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111107380B (zh) * 2018-10-10 2023-08-15 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN109637520B (zh) * 2018-10-16 2023-08-22 平安科技(深圳)有限公司 基于语音分析的敏感内容识别方法、装置、终端及介质
CN109637520A (zh) * 2018-10-16 2019-04-16 平安科技(深圳)有限公司 基于语音分析的敏感内容识别方法、装置、终端及介质
CN109637533A (zh) * 2018-12-25 2019-04-16 深圳市道通智能航空技术有限公司 无人飞行器、其语音系统及语音交互方法
CN110277105B (zh) * 2019-07-05 2021-08-13 广州酷狗计算机科技有限公司 消除背景音频数据的方法、装置和系统
CN110277105A (zh) * 2019-07-05 2019-09-24 广州酷狗计算机科技有限公司 消除背景音频数据的方法、装置和系统
CN112331188A (zh) * 2019-07-31 2021-02-05 武汉Tcl集团工业研究院有限公司 一种语音数据处理方法、系统及终端设备
CN110853668A (zh) * 2019-09-06 2020-02-28 南京工程学院 基于多种特征融合的语音篡改检测方法
CN111105788B (zh) * 2019-12-20 2023-03-24 北京三快在线科技有限公司 敏感词分数检测方法、装置、电子设备及存储介质
CN111105788A (zh) * 2019-12-20 2020-05-05 北京三快在线科技有限公司 敏感词分数检测方法、装置、电子设备及存储介质
CN112634881A (zh) * 2020-12-30 2021-04-09 广州博士信息技术研究院有限公司 一种基于科技成果数据库的语音智能识别方法及系统
CN112634881B (zh) * 2020-12-30 2023-08-11 广州博士信息技术研究院有限公司 一种基于科技成果数据库的语音智能识别方法及系统
CN113223558A (zh) * 2021-04-30 2021-08-06 广州虎牙科技有限公司 音频数据消音方法、装置、电子设备和存储介质
CN113223558B (zh) * 2021-04-30 2024-03-15 广州虎牙科技有限公司 音频数据消音方法、装置、电子设备和存储介质
CN113724735A (zh) * 2021-09-01 2021-11-30 广州博冠信息科技有限公司 语音流处理方法及装置、计算机可读存储介质、电子设备
CN113889142A (zh) * 2021-10-14 2022-01-04 鹰潭市广播电视传媒集团有限责任公司 基于公共播音喇叭的播音监控系统、方法、装置和介质

Similar Documents

Publication Publication Date Title
CN105006230A (zh) 一种面向非特定人的语音敏感信息检测和过滤方法
CN108564942B (zh) 一种基于敏感度可调的语音情感识别方法及系统
US10013977B2 (en) Smart home control method based on emotion recognition and the system thereof
CN106601259B (zh) 一种基于声纹搜索的信息推荐方法及装置
CN102723078B (zh) 基于自然言语理解的语音情感识别方法
CN105374352B (zh) 一种语音激活方法及系统
CN105206271A (zh) 智能设备的语音唤醒方法及实现所述方法的系统
CN110299142B (zh) 一种基于网络融合的声纹识别方法及装置
CN110706690A (zh) 语音识别方法及其装置
CN110570873B (zh) 声纹唤醒方法、装置、计算机设备以及存储介质
CN103810994B (zh) 基于情感上下文的语音情感推理方法及系统
CN104575504A (zh) 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN108766441A (zh) 一种基于离线声纹识别和语音识别的语音控制方法及装置
CN107369439A (zh) 一种语音唤醒方法和装置
CN109119070A (zh) 一种语音端点检测方法、装置、设备及存储介质
CN106709804A (zh) 一种交互式财富规划咨询机器人系统
CN109785832A (zh) 一种适用于重口音的老人机顶盒智能语音识别方法
CN101887722A (zh) 快速声纹认证方法
CN103871417A (zh) 一种移动手机特定连续语音过滤方法及过滤装置
CN111986656A (zh) 教学视频自动字幕处理方法与系统
CN104103272A (zh) 语音识别方法、装置和蓝牙耳机
CN104157294B (zh) 一种农产品市场要素信息采集的鲁棒性语音识别方法
CN106297769B (zh) 一种应用于语种识别的鉴别性特征提取方法
CN105869622B (zh) 中文热词检测方法和装置
CN112584238A (zh) 影视资源匹配方法、装置及智能电视

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151028