CN104505090A - 敏感词的语音识别方法和装置 - Google Patents

敏感词的语音识别方法和装置 Download PDF

Info

Publication number
CN104505090A
CN104505090A CN201410778052.1A CN201410778052A CN104505090A CN 104505090 A CN104505090 A CN 104505090A CN 201410778052 A CN201410778052 A CN 201410778052A CN 104505090 A CN104505090 A CN 104505090A
Authority
CN
China
Prior art keywords
audio
mark
word
measured
marked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410778052.1A
Other languages
English (en)
Other versions
CN104505090B (zh
Inventor
刘粉香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201410778052.1A priority Critical patent/CN104505090B/zh
Publication of CN104505090A publication Critical patent/CN104505090A/zh
Application granted granted Critical
Publication of CN104505090B publication Critical patent/CN104505090B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种敏感词的语音识别方法和装置。其中,敏感词的语音识别方法包括:获取待测音频;利用预先建立的敏感词训练模型对待测音频中的音频片段进行标记,将待测音频中的包含有目标敏感词的音频片段标记为第一预设标识,其中,敏感词训练模型为根据标记有第一预设标识的包含有目标敏感词的音频数据进行训练得到的模型,敏感词训练模型用于检测目标敏感词的语音;以及从标记的待测音频中提取具有第一预设标识的音频段,作为目标敏感词的音频。通过本发明,解决了现有技术中语音敏感词识别的准确性低的问题,达到了提高语音敏感词识别的准确性的效果。

Description

敏感词的语音识别方法和装置
技术领域
本发明涉及语音检测领域,具体而言,涉及一种敏感词的语音识别方法和装置。
背景技术
目前,敏感词的语音识别技术主要基于建立的语音敏感词语料库,用匹配分析的方式对敏感词进行识别,其缺点是需要提前建立语音敏感词语料库,对于多语种则要建立多个语料库;部分语音敏感词分析过程中,需要先翻译为文本再根据文本语料库匹配敏感词,定位敏感词语音位置,这样的语音敏感词的识别准确性较低。
针对现有技术中语音敏感词识别的准确性低的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种敏感词的语音识别方法和装置,以解决现有技术中语音敏感词识别的准确性低的问题。
为了实现上述目的,根据本发明实施例的一个方面,提供了一种敏感词的语音识别方法。根据本发明的敏感词的语音识别方法包括:获取待测音频;利用预先建立的敏感词训练模型对所述待测音频中的音频片段进行标记,将所述待测音频中的包含有目标敏感词的音频片段标记为第一预设标识,其中,所述敏感词训练模型为根据标记有所述第一预设标识的包含有所述目标敏感词的音频数据进行训练得到的模型,所述敏感词训练模型用于检测所述目标敏感词的语音;以及从待测音频中提取具有所述第一预设标识的音频段,作为所述目标敏感词的音频。
进一步地,通过以下方式建立所述敏感词训练模型:收集包含有所述目标敏感词的音频数据;从所述音频数据中剪切出预设时间长度的包含有所述目标敏感词的第一音频片段;添加所述第一音频片段的标记为所述第一预设标识;对标记有所述第一预设标识的第一音频片段进行训练,得到所述敏感词训练模型。
进一步地,在收集包含有所述目标敏感词的音频数据之后,所述语音识别方法还包括:从所述音频数据中剪切出所述预设时间长度的不包含有所述目标敏感词的第二音频片段;添加所述第二音频片段的标记为第二预设标识,其中,使用支持向量机对标记有所述第一预设标识的第一音频片段和标记有所述第二预设标识的第二音频片段进行训练,得到所述敏感词训练模型。
进一步地,使用支持向量机对标记有所述第一预设标识的第一音频片段和标记有所述第二预设标识的第二音频片段进行训练,得到所述敏感词训练模型包括:使用所述支持向量机并添加高斯核函数和松弛因子对标记有所述第一预设标识的第一音频片段和标记有所述第二预设标识的第二音频片段进行训练,得到所述敏感词训练模型。
进一步地,利用预先建立的敏感词训练模型对所述待测音频中的音频片段进行标记包括:按照所述预设时间长度对所述待测音频进行划分,得到多个待测音频段;利用所述敏感词训练模型对所述多个待测音频段进行标记,将包含有所述目标敏感词的待测音频段标记为所述第一预设标识,将不包含有所述目标敏感词的待测音频段标记为所述第二预设标识。
为了实现上述目的,根据本发明实施例的另一方面,提供了一种敏感词的语音识别装置。根据本发明的敏感词的语音识别装置包括:获取单元,用于获取待测音频;标记单元,用于利用预先建立的敏感词训练模型对所述待测音频中的音频片段进行标记,将所述待测音频中的包含有目标敏感词的音频片段标记为第一预设标识,其中,所述敏感词训练模型为根据标记有所述第一预设标识的包含有所述目标敏感词的音频数据进行训练得到的模型,所述敏感词训练模型用于检测所述目标敏感词的语音;以及提取单元,用于从标记的待测音频中提取具有所述第一预设标识的音频段,作为所述目标敏感词的音频。
进一步地,所述语音识别装置还包括:收集单元,用于收集包含有所述目标敏感词的音频数据;第一剪切单元,用于从所述音频数据中剪切出预设时间长度的包含有所述目标敏感词的第一音频片段;第一添加单元,用于添加所述第一音频片段的标记为所述第一预设标识;训练单元,用于对标记有所述第一预设标识的第一音频片段进行训练,得到所述敏感词训练模型。
进一步地,所述语音识别装置还包括:第二剪切单元,用于在收集包含有所述目标敏感词的音频数据之后,从所述音频数据中剪切出所述预设时间长度的不包含有所述目标敏感词的第二音频片段;第二添加单元,用于添加所述第二音频片段的标记为第二预设标识,所述训练单元还用于使用支持向量机对标记有所述第一预设标识的第一音频片段和标记有所述第二预设标识的第二音频片段进行训练,得到所述敏感词训练模型。
进一步地,所述训练单元包括:训练模块,用于使用所述支持向量机并添加高斯核函数和松弛因子对标记有所述第一预设标识的第一音频片段和标记有所述第二预设标识的第二音频片段进行训练,得到所述敏感词训练模型。
进一步地,所述标记单元包括:划分模块,用于按照所述预设时间长度对所述待测音频进行划分,得到多个待测音频段;标记模块,用于利用所述敏感词训练模型对所述多个待测音频段进行标记,将包含有所述目标敏感词的待测音频段标记为所述第一预设标识,将不包含有所述目标敏感词的待测音频段标记为所述第二预设标识。
根据本发明实施例,通过利用预先建立的敏感词训练模型对待测音频中的音频片段进行标记,将待测音频中的包含有目标敏感词的音频片段标记为第一预设标识,无需进行文本翻译,相对于建立语料库进行匹配方式其准确性得到明显提高,解决了现有技术中语音敏感词识别的准确性低的问题,达到了提高语音敏感词识别的准确性的效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的敏感词的语音识别方法的流程图;以及
图2是根据本发明实施例的敏感词的语音识别装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种敏感词的语音识别方法。
图1是根据本发明实施例的敏感词的语音识别方法的流程图。如图1所示,该敏感词的语音识别方法包括步骤如下:
步骤S102,获取待测音频。
该待测音频可以是包含有目标敏感词语音的音频,当然,该待测音频还可以包含非语音的背景音以及非目标敏感词语音的其他语音。获取该待测音频,以便于从该待测音频中检测出目标敏感词语音。
步骤S104,利用预先建立的敏感词训练模型对待测音频中的音频片段进行标记,将待测音频中的包含有目标敏感词的音频片段标记为第一预设标识。其中,敏感词训练模型为根据标记有第一预设标识的包含有目标敏感词的音频数据进行训练得到的模型,敏感词训练模型用于检测目标敏感词的语音。
敏感词训练模型的建立可以是根据将目标敏感词语音标记为第一预设标识的音频数据训练得到的用于检测目标敏感词语音的训练模型,具体地,可以是先采集大量的包含有目标敏感词的音频数据,作为语音训练集数据。然后从采集的音频数据剪切出目标敏感词的语音并进行标记,将音频数据中包含有目标敏感词的音频段标记为第一预设标识。最后,从标记的音频数据中选择合适的样本进行训练,得到敏感词训练模型,从而可以利用该敏感词训练模型来识别待测音频中的目标敏感词的语音。
当将获取到的待测音频输入到敏感词训练模型之后,该敏感词训练模型根据训练得到的参数从所述待测音频中识别出目标敏感词语音,并将其标记上第一预设标识。
步骤S106,从标记的待测音频中提取具有第一预设标识的音频片段,作为目标敏感词的音频。
在利用敏感词训练模型对待测音频中的音频片段进行标记之后,从标记的待测音频中提取具有第一预设标识的音频片段,作为目标敏感词的音频,从而定位到目标敏感词的位置。
根据本发明实施例,通过利用预先建立的敏感词训练模型对待测音频中的音频片段进行标记,将待测音频中的包含有目标敏感词的音频片段标记为第一预设标识,无需进行文本翻译,相对于建立语料库进行匹配方式其准确性得到明显提高,解决了现有技术中语音敏感词识别的准确性低的问题,达到了提高语音敏感词识别的准确性的效果。
优选地,通过以下方式建立敏感词训练模型:收集包含有目标敏感词的音频数据;从音频数据中剪切出预设时间长度的包含有目标敏感词的第一音频片段;添加第一音频片段的标记为第一预设标识;对标记有第一预设标识的第一音频片段进行训练,得到敏感词训练模型。
通过收集包含有目标敏感词的音频数据,作为训练集。从收集的音频数据中剪切出第一音频片段,即包含有目标敏感词的音频片段,具体地,可以先利用语音端点检测方法检测出音频数据中语音段,再选择合适的预设时间长度,从该语音段中剪切出包含有目标敏感词的第一音频片段。其中,预设时间长度根据目标敏感词的语音长度来选择,例如,当目标敏感词为“天安门”时,人们通常只需花大概两秒的时间就能完整地说出“天安门”,考虑到一些语速较慢,或者,不同口音说出的时间可能相对长一点,那么在以“天安门”为目标名词时,可以选择预设时间长度为5秒,这基本上能够覆盖绝大部分“天安门”语音的长度。
在剪切出第一音频片段之后,将该第一音频片段标记上第一预设标识,例如“1”,然后将标记有第一预设标识的第一音频片段作为样本,对其进行训练,得到上述敏感词训练模型,这样,训练出的训练模型就能够根据训练得到的参数识别出目标敏感词的语音,并将其标记为第一预设标识。
进一步地,在收集包含有目标敏感词的音频数据之后,语音识别方法还包括:从音频数据中剪切出预设时间长度的不包含有目标敏感词的第二音频片段;添加第二音频片段的标记为第二预设标识,其中,使用支持向量机对标记有第一预设标识的第一音频片段和标记有第二预设标识的第二音频片段进行训练,得到敏感词训练模型。
为了使得敏感词训练模型更加准确地识别出目标敏感词,本发明实施例中,在收集到音频数据之后,按照一定规则或者随机从音频数据中剪切出预设时间长度的不包含有目标敏感词的音频片段即第二音频片段,并将其标记上第二预设标识,例如“-1”。
在使用支持向量机训练敏感词训练模型的时候,以标记有第一预设标识的第一音频片段作为正样本,以标记有第二预设标识的第二音频片段作为负样本,训练模型。这样,在利用训练得到的敏感词训练模型进行目标敏感词语音的识别过程中,可以迅速地将包含有目标敏感词的音频片段标记为第一预设标识,将不包含有目标敏感词的音频片段标记为第二预设标识,提高目标敏感词识别的准确性。
进一步地,使用支持向量机对标记有第一预设标识的第一音频片段和标记有第二预设标识的第二音频片段进行训练,得到敏感词训练模型包括:使用支持向量机并添加高斯核函数和松弛因子对标记有第一预设标识的第一音频片段和标记有第二预设标识的第二音频片段进行训练,得到敏感词训练模型。
本发明实施例中,为了使敏感词训练模型具有语音抗噪功能,减少由于语音不连续性对敏感词训练模型的参数的影响,并使得敏感词训练模型快速稳定,在使用支持向量机训练模型时,向模型中加入高斯函数和松弛因子,从而进一步提高敏感词语音识别的准确性。
优选地,利用预先建立的敏感词训练模型对待测音频中的音频片段进行标记包括:按照预设时间长度对待测音频进行划分,得到多个待测音频段;利用敏感词训练模型对多个待测音频段进行标记,将包含有目标敏感词的待测音频段标记为第一预设标识,将不包含有目标敏感词的待测音频段标记为第二预设标识。
本发明实施例中,将在利用敏感词训练模型对待测音频进行标记时,先按照之前训练得到敏感词训练模型时的规则对待测音频进行划分,即按照上述中预设时间长度来对待测音频进行划分,得到多个待测音频段。然后,利用敏感词训练模型训练得到的参数来确定划分得到的多个待测音频段中每个音频段标记的标识,即第一预设标识和第二预设标识,实现对待测音频的标记。
本发明实施例还提供了一种敏感词的语音识别装置。该装置可以通过计算机设备实现其功能。需要说明的是,本发明实施例的敏感词的语音识别装置可以用于执行本发明实施例所提供的敏感词的语音识别方法,本发明实施例的敏感词的语音识别方法也可以通过本发明实施例所提供的敏感词的语音识别装置来执行。
图2是根据本发明实施例的敏感词的语音识别装置的示意图。如图2所示,该敏感词的语音识别装置包括:获取单元10、标记单元20和提取单元30。
获取单元10用于获取待测音频。
该待测音频可以是包含有目标敏感词语音的音频,当然,该待测音频还可以包含非语音的背景音以及非目标敏感词语音的其他语音。获取该待测音频,以便于从该待测音频中检测出目标敏感词语音。
标记单元20用于利用预先建立的敏感词训练模型对待测音频中的音频片段进行标记,将待测音频中的包含有目标敏感词的音频片段标记为第一预设标识,其中,敏感词训练模型为根据标记有第一预设标识的包含有目标敏感词的音频数据进行训练得到的模型,敏感词训练模型用于检测目标敏感词的语音。
敏感词训练模型的建立可以是根据将目标敏感词语音标记为第一预设标识的音频数据训练得到的用于检测目标敏感词语音的训练模型,具体地,可以是先采集大量的包含有目标敏感词的音频数据,作为语音训练集数据。然后从采集的音频数据剪切出目标敏感词的语音并进行标记,将音频数据中包含有目标敏感词的音频段标记为第一预设标识。最后,从标记的音频数据中选择合适的样本进行训练,得到敏感词训练模型,从而可以利用该敏感词训练模型来识别待测音频中的目标敏感词的语音。
当将获取到的待测音频输入到敏感词训练模型之后,该敏感词训练模型根据训练得到的参数从所述待测音频中识别出目标敏感词语音,并将其标记上第一预设标识。
提取单元30用于从标记的待测音频中提取具有第一预设标识的音频段,作为目标敏感词的音频。
在利用敏感词训练模型对待测音频中的音频片段进行标记之后,从标记的待测音频中提取具有第一预设标识的音频片段,作为目标敏感词的音频,从而定位到目标敏感词的位置。
根据本发明实施例,通过利用预先建立的敏感词训练模型对待测音频中的音频片段进行标记,将待测音频中的包含有目标敏感词的音频片段标记为第一预设标识,无需进行文本翻译,相对于建立语料库进行匹配方式其准确性得到明显提高,解决了现有技术中语音敏感词识别的准确性低的问题,达到了提高语音敏感词识别的准确性的效果。
优选地,语音识别装置还包括:收集单元,用于收集包含有目标敏感词的音频数据;第一剪切单元,用于从音频数据中剪切出预设时间长度的包含有目标敏感词的第一音频片段;第一添加单元,用于添加第一音频片段的标记为第一预设标识;训练单元,用于对标记有第一预设标识的第一音频片段进行训练,得到敏感词训练模型。通过上述单元来建立敏感词训练模型。
具体地,收集包含有目标敏感词的音频数据,作为训练集。从收集的音频数据中剪切出第一音频片段,即包含有目标敏感词的音频片段,具体地,可以先利用语音端点检测方法检测出音频数据中语音段,再选择合适的预设时间长度,从该语音段中剪切出包含有目标敏感词的第一音频片段。其中,预设时间长度根据目标敏感词的语音长度来选择,例如,当目标敏感词为“天安门”时,人们通常只需花大概两秒的时间就能完整地说出“天安门”,考虑到一些语速较慢,或者,不同口音说出的时间可能相对长一点,那么在以“天安门”为目标名词时,可以选择预设时间长度为5秒,这基本上能够覆盖绝大部分“天安门”语音的长度。
在剪切出第一音频片段之后,将该第一音频片段标记上第一预设标识,例如“1”,然后将标记有第一预设标识的第一音频片段作为样本,对其进行训练,得到上述敏感词训练模型,这样,训练出的训练模型就能够根据训练得到的参数识别出目标敏感词的语音,并将其标记为第一预设标识。
进一步地,语音识别装置还包括:第二剪切单元,用于在收集包含有目标敏感词的音频数据之后,从音频数据中剪切出预设时间长度的不包含有目标敏感词的第二音频片段;第二添加单元,用于添加第二音频片段的标记为第二预设标识,训练单元还用于使用支持向量机对标记有第一预设标识的第一音频片段和标记有第二预设标识的第二音频片段进行训练,得到敏感词训练模型。
为了使得敏感词训练模型更加准确地识别出目标敏感词,本发明实施例中,在收集到音频数据之后,按照一定规则或者随机从音频数据中剪切出预设时间长度的不包含有目标敏感词的音频片段即第二音频片段,并将其标记上第二预设标识,例如“-1”。
在使用支持向量机训练敏感词训练模型的时候,以标记有第一预设标识的第一音频片段作为正样本,以标记有第二预设标识的第二音频片段作为负样本,训练模型。这样,在利用训练得到的敏感词训练模型进行目标敏感词语音的识别过程中,可以迅速地将包含有目标敏感词的音频片段标记为第一预设标识,将不包含有目标敏感词的音频片段标记为第二预设标识,提高目标敏感词识别的准确性。
进一步地,训练单元包括:训练模块,用于使用支持向量机并添加高斯核函数和松弛因子对标记有第一预设标识的第一音频片段和标记有第二预设标识的第二音频片段进行训练,得到敏感词训练模型。
本发明实施例中,为了使敏感词训练模型具有语音抗噪功能,减少由于语音不连续性对敏感词训练模型的参数的影响,并使得敏感词训练模型快速稳定,在使用支持向量机训练模型时,向模型中加入高斯函数和松弛因子,从而进一步提高敏感词语音识别的准确性。
优选地,标记单元包括:划分模块,用于按照预设时间长度对待测音频进行划分,得到多个待测音频段;标记模块,用于利用敏感词训练模型对多个待测音频段进行标记,将包含有目标敏感词的待测音频段标记为第一预设标识,将不包含有目标敏感词的待测音频段标记为第二预设标识。
本发明实施例中,将在利用敏感词训练模型对待测音频进行标记时,先按照之前训练得到敏感词训练模型时的规则对待测音频进行划分,即按照上述中预设时间长度来对待测音频进行划分,得到多个待测音频段。然后,利用敏感词训练模型训练得到的参数来确定划分得到的多个待测音频段中每个音频段标记的标识,即第一预设标识和第二预设标识,实现对待测音频的标记。
综上,本发明实施例的敏感词的语音识别方法基于标记的语音敏感词,采用支持向量机分类的方法进行敏感词的语音分析,反复训练样本,得到语音模型,比基于匹配的方法抗噪性、鲁棒性更好。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、移动终端、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种敏感词的语音识别方法,其特征在于,包括:
获取待测音频;
利用预先建立的敏感词训练模型对所述待测音频中的音频片段进行标记,将所述待测音频中的包含有目标敏感词的音频片段标记为第一预设标识,其中,所述敏感词训练模型为根据标记有所述第一预设标识的包含有所述目标敏感词的音频数据进行训练得到的模型,所述敏感词训练模型用于检测所述目标敏感词的语音;以及
从标记的待测音频中提取具有所述第一预设标识的音频段,作为所述目标敏感词的音频。
2.根据权利要求1所述的语音识别方法,其特征在于,通过以下方式建立所述敏感词训练模型:
收集包含有所述目标敏感词的音频数据;
从所述音频数据中剪切出预设时间长度的包含有所述目标敏感词的第一音频片段;
添加所述第一音频片段的标记为所述第一预设标识;
对标记有所述第一预设标识的第一音频片段进行训练,得到所述敏感词训练模型。
3.根据权利要求2所述的语音识别方法,其特征在于,在收集包含有所述目标敏感词的音频数据之后,所述语音识别方法还包括:
从所述音频数据中剪切出所述预设时间长度的不包含有所述目标敏感词的第二音频片段;
添加所述第二音频片段的标记为第二预设标识,
其中,使用支持向量机对标记有所述第一预设标识的第一音频片段和标记有所述第二预设标识的第二音频片段进行训练,得到所述敏感词训练模型。
4.根据权利要求3所述的语音识别方法,其特征在于,使用支持向量机对标记有所述第一预设标识的第一音频片段和标记有所述第二预设标识的第二音频片段进行训练,得到所述敏感词训练模型包括:
使用所述支持向量机并添加高斯核函数和松弛因子对标记有所述第一预设标识的第一音频片段和标记有所述第二预设标识的第二音频片段进行训练,得到所述敏感词训练模型。
5.根据权利要求3所述的语音识别方法,其特征在于,利用预先建立的敏感词训练模型对所述待测音频中的音频片段进行标记包括:
按照所述预设时间长度对所述待测音频进行划分,得到多个待测音频段;
利用所述敏感词训练模型对所述多个待测音频段进行标记,将包含有所述目标敏感词的待测音频段标记为所述第一预设标识,将不包含有所述目标敏感词的待测音频段标记为所述第二预设标识。
6.一种敏感词的语音识别装置,其特征在于,包括:
获取单元,用于获取待测音频;
标记单元,用于利用预先建立的敏感词训练模型对所述待测音频中的音频片段进行标记,将所述待测音频中的包含有目标敏感词的音频片段标记为第一预设标识,其中,所述敏感词训练模型为根据标记有所述第一预设标识的包含有所述目标敏感词的音频数据进行训练得到的模型,所述敏感词训练模型用于检测所述目标敏感词的语音;以及
提取单元,用于从标记的待测音频中提取具有所述第一预设标识的音频段,作为所述目标敏感词的音频。
7.根据权利要求6所述的语音识别装置,其特征在于,所述语音识别装置还包括:
收集单元,用于收集包含有所述目标敏感词的音频数据;
第一剪切单元,用于从所述音频数据中剪切出预设时间长度的包含有所述目标敏感词的第一音频片段;
第一添加单元,用于添加所述第一音频片段的标记为所述第一预设标识;
训练单元,用于对标记有所述第一预设标识的第一音频片段进行训练,得到所述敏感词训练模型。
8.根据权利要求7所述的语音识别装置,其特征在于,所述语音识别装置还包括:
第二剪切单元,用于在收集包含有所述目标敏感词的音频数据之后,从所述音频数据中剪切出所述预设时间长度的不包含有所述目标敏感词的第二音频片段;
第二添加单元,用于添加所述第二音频片段的标记为第二预设标识,
所述训练单元还用于使用支持向量机对标记有所述第一预设标识的第一音频片段和标记有所述第二预设标识的第二音频片段进行训练,得到所述敏感词训练模型。
9.根据权利要求8所述的语音识别装置,其特征在于,所述训练单元包括:
训练模块,用于使用所述支持向量机并添加高斯核函数和松弛因子对标记有所述第一预设标识的第一音频片段和标记有所述第二预设标识的第二音频片段进行训练,得到所述敏感词训练模型。
10.根据权利要求8所述的语音识别装置,其特征在于,所述标记单元包括:
划分模块,用于按照所述预设时间长度对所述待测音频进行划分,得到多个待测音频段;
标记模块,用于利用所述敏感词训练模型对所述多个待测音频段进行标记,将包含有所述目标敏感词的待测音频段标记为所述第一预设标识,将不包含有所述目标敏感词的待测音频段标记为所述第二预设标识。
CN201410778052.1A 2014-12-15 2014-12-15 敏感词的语音识别方法和装置 Active CN104505090B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410778052.1A CN104505090B (zh) 2014-12-15 2014-12-15 敏感词的语音识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410778052.1A CN104505090B (zh) 2014-12-15 2014-12-15 敏感词的语音识别方法和装置

Publications (2)

Publication Number Publication Date
CN104505090A true CN104505090A (zh) 2015-04-08
CN104505090B CN104505090B (zh) 2017-11-14

Family

ID=52946832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410778052.1A Active CN104505090B (zh) 2014-12-15 2014-12-15 敏感词的语音识别方法和装置

Country Status (1)

Country Link
CN (1) CN104505090B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105006230A (zh) * 2015-06-10 2015-10-28 合肥工业大学 一种面向非特定人的语音敏感信息检测和过滤方法
CN105335483A (zh) * 2015-10-14 2016-02-17 广州市畅运信息科技有限公司 一种文本敏感词过滤系统和方法
CN106504744A (zh) * 2016-10-26 2017-03-15 科大讯飞股份有限公司 一种语音处理方法及装置
CN106782508A (zh) * 2016-12-20 2017-05-31 美的集团股份有限公司 语音音频的切分方法和语音音频的切分装置
CN107241617A (zh) * 2016-03-29 2017-10-10 北京新媒传信科技有限公司 视频文件的识别方法及装置
CN107680590A (zh) * 2017-09-18 2018-02-09 北京小蓦机器人技术有限公司 一种用于处理自然语言命令的方法、设备与存储介质
CN109637520A (zh) * 2018-10-16 2019-04-16 平安科技(深圳)有限公司 基于语音分析的敏感内容识别方法、装置、终端及介质
CN109670190A (zh) * 2018-12-25 2019-04-23 北京百度网讯科技有限公司 翻译模型构建方法和装置
CN110534113A (zh) * 2019-08-26 2019-12-03 深圳追一科技有限公司 音频数据脱敏方法、装置、设备和存储介质
CN110737770A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 文本数据敏感性识别方法、装置、电子设备及存储介质
CN111107380A (zh) * 2018-10-10 2020-05-05 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111415654A (zh) * 2019-01-07 2020-07-14 北京嘀嘀无限科技发展有限公司 一种音频识别方法和装置、以及声学模型训练方法和装置
CN111639157A (zh) * 2020-05-13 2020-09-08 广州国音智能科技有限公司 音频标记方法、装置、设备及可读存储介质
CN111640420A (zh) * 2020-06-10 2020-09-08 上海明略人工智能(集团)有限公司 音频数据的处理方法和装置、存储介质
CN112885371A (zh) * 2021-01-13 2021-06-01 北京爱数智慧科技有限公司 音频脱敏的方法、装置、电子设备以及可读存储介质
CN114339292A (zh) * 2021-12-31 2022-04-12 安徽听见科技有限公司 一种直播流的审查干预方法、装置、存储介质及设备
CN115910045A (zh) * 2023-03-10 2023-04-04 北京建筑大学 一种语音唤醒词的模型训练方法和识别方法

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080193017A1 (en) * 2007-02-14 2008-08-14 Wilson Kevin W Method for detecting scene boundaries in genre independent videos
CN101345704A (zh) * 2008-08-15 2009-01-14 南京邮电大学 基于支持向量机的对等网络流量检测方法
CN101562012A (zh) * 2008-04-16 2009-10-21 创而新(中国)科技有限公司 语音分级测定方法及系统
CN101593519A (zh) * 2008-05-29 2009-12-02 夏普株式会社 检测语音关键词的方法和设备及检索方法和系统
CN102014278A (zh) * 2010-12-21 2011-04-13 四川大学 一种基于语音识别技术的智能视频监控方法
CN102194454A (zh) * 2010-03-05 2011-09-21 富士通株式会社 用于检测连续语音中的关键词的设备和方法
CN103020230A (zh) * 2012-12-14 2013-04-03 中国科学院声学研究所 一种语义模糊匹配方法
CN103035135A (zh) * 2012-11-27 2013-04-10 北京航空航天大学 基于增强现实技术的儿童认知系统及认知方法
CN103077720A (zh) * 2012-12-19 2013-05-01 中国科学院声学研究所 一种说话人识别方法及系统
US20130155026A1 (en) * 2011-12-16 2013-06-20 International Business Machines Corporation New kind of multi-touch input device
CN103336862A (zh) * 2012-10-23 2013-10-02 西安电子科技大学 基于支持向量机的夹层微带天线结构设计方法
CN103366753A (zh) * 2013-06-28 2013-10-23 宁波大学 一种相同码率下的mp3音频双压缩检测方法
CN103559881A (zh) * 2013-11-08 2014-02-05 安徽科大讯飞信息科技股份有限公司 语种无关的关键词识别方法及系统
CN103699625A (zh) * 2013-12-20 2014-04-02 北京百度网讯科技有限公司 基于关键词进行检索的方法及装置
CN103793717A (zh) * 2012-11-02 2014-05-14 阿里巴巴集团控股有限公司 判断图像主体显著性及训练其分类器的方法和系统
CN103942274A (zh) * 2014-03-27 2014-07-23 东莞中山大学研究院 一种基于lda的生物医疗图像的标注系统及方法
US20140337024A1 (en) * 2013-05-13 2014-11-13 Canon Kabushiki Kaisha Method and system for speech command detection, and information processing system

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080193017A1 (en) * 2007-02-14 2008-08-14 Wilson Kevin W Method for detecting scene boundaries in genre independent videos
CN101562012A (zh) * 2008-04-16 2009-10-21 创而新(中国)科技有限公司 语音分级测定方法及系统
CN101593519A (zh) * 2008-05-29 2009-12-02 夏普株式会社 检测语音关键词的方法和设备及检索方法和系统
CN101345704A (zh) * 2008-08-15 2009-01-14 南京邮电大学 基于支持向量机的对等网络流量检测方法
CN102194454A (zh) * 2010-03-05 2011-09-21 富士通株式会社 用于检测连续语音中的关键词的设备和方法
CN102014278A (zh) * 2010-12-21 2011-04-13 四川大学 一种基于语音识别技术的智能视频监控方法
US20130155026A1 (en) * 2011-12-16 2013-06-20 International Business Machines Corporation New kind of multi-touch input device
CN103336862A (zh) * 2012-10-23 2013-10-02 西安电子科技大学 基于支持向量机的夹层微带天线结构设计方法
CN103793717A (zh) * 2012-11-02 2014-05-14 阿里巴巴集团控股有限公司 判断图像主体显著性及训练其分类器的方法和系统
CN103035135A (zh) * 2012-11-27 2013-04-10 北京航空航天大学 基于增强现实技术的儿童认知系统及认知方法
CN103020230A (zh) * 2012-12-14 2013-04-03 中国科学院声学研究所 一种语义模糊匹配方法
CN103077720A (zh) * 2012-12-19 2013-05-01 中国科学院声学研究所 一种说话人识别方法及系统
US20140337024A1 (en) * 2013-05-13 2014-11-13 Canon Kabushiki Kaisha Method and system for speech command detection, and information processing system
CN103366753A (zh) * 2013-06-28 2013-10-23 宁波大学 一种相同码率下的mp3音频双压缩检测方法
CN103559881A (zh) * 2013-11-08 2014-02-05 安徽科大讯飞信息科技股份有限公司 语种无关的关键词识别方法及系统
CN103699625A (zh) * 2013-12-20 2014-04-02 北京百度网讯科技有限公司 基于关键词进行检索的方法及装置
CN103942274A (zh) * 2014-03-27 2014-07-23 东莞中山大学研究院 一种基于lda的生物医疗图像的标注系统及方法

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105006230A (zh) * 2015-06-10 2015-10-28 合肥工业大学 一种面向非特定人的语音敏感信息检测和过滤方法
CN105335483A (zh) * 2015-10-14 2016-02-17 广州市畅运信息科技有限公司 一种文本敏感词过滤系统和方法
CN105335483B (zh) * 2015-10-14 2018-11-09 广州市畅运信息科技有限公司 一种文本敏感词过滤系统和方法
CN107241617A (zh) * 2016-03-29 2017-10-10 北京新媒传信科技有限公司 视频文件的识别方法及装置
CN106504744B (zh) * 2016-10-26 2020-05-01 科大讯飞股份有限公司 一种语音处理方法及装置
CN106504744A (zh) * 2016-10-26 2017-03-15 科大讯飞股份有限公司 一种语音处理方法及装置
CN106782508A (zh) * 2016-12-20 2017-05-31 美的集团股份有限公司 语音音频的切分方法和语音音频的切分装置
CN107680590A (zh) * 2017-09-18 2018-02-09 北京小蓦机器人技术有限公司 一种用于处理自然语言命令的方法、设备与存储介质
CN107680590B (zh) * 2017-09-18 2020-10-02 北京小蓦机器人技术有限公司 一种用于处理自然语言命令的方法、设备与存储介质
CN110737770A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 文本数据敏感性识别方法、装置、电子设备及存储介质
CN110737770B (zh) * 2018-07-03 2023-01-20 百度在线网络技术(北京)有限公司 文本数据敏感性识别方法、装置、电子设备及存储介质
CN111107380A (zh) * 2018-10-10 2020-05-05 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN111107380B (zh) * 2018-10-10 2023-08-15 北京默契破冰科技有限公司 一种用于管理音频数据的方法、设备和计算机存储介质
CN109637520A (zh) * 2018-10-16 2019-04-16 平安科技(深圳)有限公司 基于语音分析的敏感内容识别方法、装置、终端及介质
CN109637520B (zh) * 2018-10-16 2023-08-22 平安科技(深圳)有限公司 基于语音分析的敏感内容识别方法、装置、终端及介质
CN109670190B (zh) * 2018-12-25 2023-05-16 北京百度网讯科技有限公司 翻译模型构建方法和装置
CN109670190A (zh) * 2018-12-25 2019-04-23 北京百度网讯科技有限公司 翻译模型构建方法和装置
CN111415654A (zh) * 2019-01-07 2020-07-14 北京嘀嘀无限科技发展有限公司 一种音频识别方法和装置、以及声学模型训练方法和装置
CN111415654B (zh) * 2019-01-07 2023-12-08 北京嘀嘀无限科技发展有限公司 一种音频识别方法和装置、以及声学模型训练方法和装置
CN110534113A (zh) * 2019-08-26 2019-12-03 深圳追一科技有限公司 音频数据脱敏方法、装置、设备和存储介质
CN111639157A (zh) * 2020-05-13 2020-09-08 广州国音智能科技有限公司 音频标记方法、装置、设备及可读存储介质
CN111639157B (zh) * 2020-05-13 2023-10-20 广州国音智能科技有限公司 音频标记方法、装置、设备及可读存储介质
CN111640420B (zh) * 2020-06-10 2023-05-12 上海明略人工智能(集团)有限公司 音频数据的处理方法和装置、存储介质
CN111640420A (zh) * 2020-06-10 2020-09-08 上海明略人工智能(集团)有限公司 音频数据的处理方法和装置、存储介质
CN112885371A (zh) * 2021-01-13 2021-06-01 北京爱数智慧科技有限公司 音频脱敏的方法、装置、电子设备以及可读存储介质
CN114339292A (zh) * 2021-12-31 2022-04-12 安徽听见科技有限公司 一种直播流的审查干预方法、装置、存储介质及设备
CN115910045A (zh) * 2023-03-10 2023-04-04 北京建筑大学 一种语音唤醒词的模型训练方法和识别方法
CN115910045B (zh) * 2023-03-10 2023-06-06 北京建筑大学 一种语音唤醒词的模型训练方法和识别方法

Also Published As

Publication number Publication date
CN104505090B (zh) 2017-11-14

Similar Documents

Publication Publication Date Title
CN104505090A (zh) 敏感词的语音识别方法和装置
CN104409080A (zh) 语音端点检测方法和装置
US10692480B2 (en) System and method of reading environment sound enhancement based on image processing and semantic analysis
CN106815192B (zh) 模型训练方法及装置和语句情感识别方法及装置
CN105931644B (zh) 一种语音识别方法及移动终端
CN107657048B (zh) 用户识别方法及装置
EP2851895A3 (en) Speech recognition using variable-length context
CN110390946A (zh) 一种语音信号处理方法、装置、电子设备和存储介质
CN102663139A (zh) 一种情感词典构建方法及系统
CN105426759A (zh) Url的合法性识别方法及装置
CN104538034A (zh) 一种语音识别方法及系统
CN108228421A (zh) 数据监测方法、装置、计算机及存储介质
CN104866308A (zh) 一种场景图像的生成方法及装置
CN106528655A (zh) 文本主题识别方法和装置
CN105354327A (zh) 一种基于大数据分析的接口api推荐方法及系统
CN109471932A (zh) 基于学习模型的谣言检测方法、系统及存储介质
CN106815193A (zh) 模型训练方法及装置和错别字识别方法及装置
CN104572717A (zh) 信息搜索方法和装置
CN108269122A (zh) 广告的相似度处理方法和装置
CN103500158A (zh) 批注电子文档的方法和装置
CN103246648A (zh) 语音输入控制方法及装置
CN105609116A (zh) 一种语音情感维度区域的自动识别方法
CN104281694A (zh) 一种文本情感倾向分析系统
CN103399737B (zh) 基于语音数据的多媒体处理方法及装置
CN106653029A (zh) 一种音频批量分割方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method and device for voice recognizing sensitive words

Effective date of registration: 20190531

Granted publication date: 20171114

Pledgee: Shenzhen Black Horse World Investment Consulting Co., Ltd.

Pledgor: Beijing Guoshuang Technology Co.,Ltd.

Registration number: 2019990000503

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: Beijing Guoshuang Technology Co.,Ltd.