CN104679729B - 录音留言有效性处理方法及系统 - Google Patents
录音留言有效性处理方法及系统 Download PDFInfo
- Publication number
- CN104679729B CN104679729B CN201510082541.8A CN201510082541A CN104679729B CN 104679729 B CN104679729 B CN 104679729B CN 201510082541 A CN201510082541 A CN 201510082541A CN 104679729 B CN104679729 B CN 104679729B
- Authority
- CN
- China
- Prior art keywords
- message
- module
- recorded
- audio
- factor information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Abstract
录音留言有效性处理方法及系统,该方法包括步骤A:对录音留言音频进行音质异常检测,并相应优化录音留言音频的音质;步骤B:从录音留言音频中提取出语音音频;步骤C:从语音音频中提取出有效语音段;步骤D:将有效语音段转换为文本信息;步骤E:判断文本信息是否含有预设敏感词库内的敏感词,若是,执行步骤F;若否,执行步骤G;步骤F:提取文本信息中对应的敏感词,再输出不包含敏感词的文本信息;以及步骤G:输出文本信息。本发明可对录音留言的音质进行优化,提高用户服务体验,且可对敏感词进行审核把关,能够对敏感词进行有效过滤。
Description
技术领域
本发明涉及一种录音留言有效性处理方法及系统。
背景技术
语音信箱是针对电信运营商传统语音信箱的使用复杂、操作门槛高等弊端优化升级的一款通信服务。用户可以通过安装客户端使用语音信箱服务,也可以通过传统指令方法进行设置更新,之后,可通过手机网络免费接收和发送语音留言、文字等消息,具有语音和文字两种记录方式,是一款融合了语音(IVR)、手机、网站的综合通信服务,致力于为用户带来全新的通信体验。
然而,现有的语音信箱对于留言全部录音,若录音留言中的用户语音包括敏感话题,容易导致泄密及侵犯个人隐私等,安全性低。另外,录音留言还包括背景音和噪音,甚至还包括挂机音等,使得录音留言质量较低,降低用户服务体验。
发明内容
针对现有技术的不足,本发明旨在于提供一种可解决上述技术问题的录音留言有效性处理方法及系统。
为实现上述目的,本发明采用如下技术方案:
一种录音留言有效性处理方法,其包括以下步骤:
步骤A:对录音留言音频进行音质异常检测,并相应优化录音留言音频的音质;
步骤B:从录音留言音频中提取出语音音频;
步骤C:从语音音频中提取出有效语音段;
步骤D:将有效语音段转换为文本信息;
步骤E:判断文本信息是否含有预设敏感词库内的敏感词,若是,执行步骤F;若否,执行步骤G;
步骤F:提取文本信息中对应的敏感词,再输出不包含敏感词的文本信息;以及
步骤G:输出文本信息。
优选地,步骤A包括以下子步骤:
步骤A1:对录音留言音频中幅度超过采样阈值的帧进行截幅处理;
步骤A2:从录音留言音频提取包络,获取每一包络的平均音量值,根据各包络的平均音量获取录音留言音频的平均音量值;以及
步骤A3:去除录音留言音频的噪声。
优选地,步骤C包括以下子步骤:
步骤C1:从语音音频中获取各个因子信息;
步骤C2:判断因子信息是否符合预设的因子信息模板,若是,执行步骤C3;若否,执行步骤C4;
步骤C3:提取出对应的因子信息,以组成有效语音段;以及
步骤C4:忽略对应的因子信息。
优选地,本方法在步骤D或步骤E或步骤F或步骤G之后还包括步骤H:根据所输入的关键词从录音留言音频中获取对应的检索结果。
优选地,步骤H包括以下子步骤:
步骤H1:通过倒排索引方式将混淆网络形式的文本信息进行合并存档;以及
步骤H2:根据所输入的关键词和存档的索引通过令牌传递检索方式获取相关的检索结果。
一种录音留言有效性处理系统,其包括以下模块:
音质优化模块:对录音留言音频进行音质异常检测,并相应优化录音留言音频的音质;
语音音频提取模块:从录音留言音频中提取出语音音频;
有效语音段提取模块:从语音音频中提取出有效语音段;
语音文本转换模块:将有效语音段转换为文本信息;
敏感词审核模块:判断文本信息是否含有预设敏感词库内的敏感词,若是,执行第一输出模块;若否,执行第二输出模块;
第一输出模块:提取文本信息中对应的敏感词,再输出不包含敏感词的文本信息;以及
第二输出模块:输出文本信息。
优选地,音质优化模块包括以下子模块:
截幅处理模块:对录音留言音频中幅度超过采样阈值的帧进行截幅处理;
音量优化模块:从录音留言音频提取包络,获取每一包络的平均音量值,根据各包络的平均音量获取录音留言音频的平均音量值;以及
去噪模块:去除录音留言音频的噪声。
优选地,有效语音段提取模块包括以下子模块:
因子信息获取模块:从语音音频中获取各个因子信息;
因子信息判定模块:判断因子信息是否符合预设的因子信息模板,若是,执行有效语音段生成模块;若否,执行因子信息忽略模块;
有效语音段生成模块:提取出对应的因子信息,以组成有效语音段;以及
因子信息忽略模块:忽略对应的因子信息。
优选地,本系统在语音文本转换模块或敏感词审核模块或第一输出模块或第二输出模块之后还包括关键词检索模块:根据所输入的关键词从录音留言音频中获取对应的检索结果。
优选地,关键词检索模块包括以下子模块:
索引建立模块:通过倒排索引方式将混淆网络形式的文本信息进行合并存档;以及
检索模块:根据所输入的关键词和存档的索引通过令牌传递检索方式获取相关的检索结果。
本发明的有益效果至少如下:
本发明可对录音留言的音质进行优化,提高用户服务体验,且可对敏感词进行审核把关,能够对敏感词进行有效过滤。
附图说明
图1为本发明录音留言有效性处理方法的较佳实施方式的主要流程图。
图2为本发明录音留言有效性处理系统的较佳实施方式的主要结构图。
具体实施方式
下面将结合附图以及具体实施方式,对本发明做进一步描述:
请参见图1,本发明涉及一种录音留言有效性处理方法,其较佳实施方式包括以下步骤:
步骤A:对录音留言音频进行音质异常检测,并相应优化录音留言音频的音质。
本步骤具体包括以下子步骤:
步骤A1:对录音留言音频中幅度超过采样阈值的帧进行截幅处理;
步骤A2:从录音留言音频提取包络,获取每一包络的平均音量值,根据各包络的平均音量获取录音留言音频的平均音量值。录音留言音频的原始音量可能会忽大忽小,本步骤可使得录音留言音频以较为均匀的音量输出,提高用户服务体验。以及
步骤A3:去除录音留言音频的噪声;具体可采用PLP(Linear Predictive Coding,线性预测分析)特征提取方式基于GMM(Gaussian Mixture Model,高斯混合模型)模型进行去噪处理。其中,噪声可指类似与白噪声、褐色噪声之类的稳定噪声,其可能由音频传输过程中某些设备所引起的,如后端的挂机音。
步骤B:从录音留言音频中提取出语音音频;
具体地,通过VAD(Voice Activity Detection,语音动态检测)算法从录音留言音频中提取出语音音频;其中,VAD算法,又称端点检测算法,用于在一段音频信号中对语音信号和非语音信号(包括无声段或背景噪声)进行划分,以提取出语音音频部分。
步骤C:从语音音频中提取出有效语音段;这里有效语音段可指说话人的语音信号、音乐等;
具体地,步骤C包括以下子步骤:
步骤C1:从语音音频中获取各个因子信息;
步骤C2:判断因子信息是否符合预设的因子信息模板,若是,执行步骤C3;若否,执行步骤C4;
步骤C3:提取出对应的因子信息,以组成有效语音段;以及
步骤C4:忽略对应的因子信息。
步骤D:将有效语音段转换为文本信息;
具体地,采用DNN(Deep Neural Network,深度神经网络)建立声学模型,再根据声学模型和维特比算法对有效语音段进行识别解码,以生成混淆网络形式的文本信息,以方便后续的关键词检索。
步骤E:判断文本信息是否含有预设敏感词库内的敏感词,若是,执行步骤F;若否,执行步骤G;其中,敏感词包括词汇和词组。
步骤F:提取文本信息中对应的敏感词,再输出不包含敏感词的文本信息;以及
步骤G:输出文本信息。
如此,本发明可保证用户最终听到的录音留言音质佳且安全性高。
本实施例中,本方法在步骤D或步骤E或步骤F或步骤G之后还包括步骤H:根据所输入的关键词从录音留言音频中获取对应的检索结果,以方便用户采用关键词查询语音记录,其中,该检索结果可为语音形式或文本形式。
具体地,步骤H包括以下子步骤:
步骤H1:通过倒排索引方式将混淆网络形式的文本信息进行合并存档;以及
步骤H2:根据所输入的关键词和存档的索引通过令牌传递检索方式获取相关的检索结果。
优选地,为方便集外词的查询,可将关键词进行全切分分词和前后缀扩展处理,再和存档的索引通过令牌传递检索方式获取相关的检索结果。集外词是指语音识别词典中不包括的词语;由于汉语的每个集外词均可拆分成集内词的序列,故将关键词进行全切分分词和前后缀扩展处理再进行检索,可避免漏掉检索结果,提高检索准确率。
本发明可对录音留言的音质进行优化,提高用户服务体验,且可对敏感词进行审核把关,防止泄露用户的隐私信息,提高安全性。
参见图2,本发明还涉及一种录音留言有效性处理系统,其包括以下模块:
音质优化模块:对录音留言音频进行音质异常检测,并相应优化录音留言音频的音质;
语音音频提取模块:从录音留言音频中提取出语音音频;
有效语音段提取模块:从语音音频中提取出有效语音段;
语音文本转换模块:将有效语音段转换为文本信息;
敏感词审核模块:判断文本信息是否含有预设敏感词库内的敏感词,若是,执行第一输出模块;若否,执行第二输出模块;
第一输出模块:提取文本信息中对应的敏感词,再输出不包含敏感词的文本信息;以及
第二输出模块:输出文本信息。
优选地,音质优化模块包括以下子模块:
截幅处理模块:对录音留言音频中幅度超过采样阈值的帧进行截幅处理;
音量优化模块:从录音留言音频提取包络,获取每一包络的平均音量值,根据各包络的平均音量获取录音留言音频的平均音量值;以及
去噪模块:去除录音留言音频的噪声。
优选地,有效语音段提取模块包括以下子模块:
因子信息获取模块:从语音音频中获取各个因子信息;
因子信息判定模块:判断因子信息是否符合预设的因子信息模板,若是,执行有效语音段生成模块;若否,执行因子信息忽略模块;
有效语音段生成模块:提取出对应的因子信息,以组成有效语音段;以及
因子信息忽略模块:忽略对应的因子信息。
优选地,本系统在语音文本转换模块或敏感词审核模块或第一输出模块或第二输出模块之后还包括关键词检索模块:根据所输入的关键词从录音留言音频中获取对应的检索结果。
优选地,关键词检索模块包括以下子模块:
索引建立模块:通过倒排索引方式将混淆网络形式的文本信息进行合并存档;以及
检索模块:根据所输入的关键词和存档的索引通过令牌传递检索方式获取相关的检索结果。
对于本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及变形,而所有的这些改变以及变形都应该属于本发明权利要求的保护范围之内。
Claims (6)
1.一种录音留言有效性处理方法,其特征在于:其包括以下步骤:
步骤A:对录音留言音频进行音质异常检测,并相应优化录音留言音频的音质;
步骤B:从录音留言音频中提取出语音音频;
步骤C:从语音音频中提取出有效语音段;
步骤D:将有效语音段转换为文本信息;其采用深度神经网络建立声学模型,再根据声学模型和维特比算法对有效语音段进行识别解码以文本信息;
步骤E:判断文本信息是否含有预设敏感词库内的敏感词,若是,执行步骤F;若否,执行步骤G;
步骤F:提取文本信息中对应的敏感词,再输出不包含敏感词的文本信息;以及
步骤G:输出文本信息;
在步骤D或步骤E或步骤F或步骤G之后还包括步骤H:根据所输入的关键词从录音留言音频中获取对应的检索结果;步骤H包括以下子步骤:
步骤H1:通过倒排索引方式将混淆网络形式的文本信息进行合并存档;以及
步骤H2:根据所输入的关键词和存档的索引通过令牌传递检索方式获取相关的检索结果。
2.如权利要求1所述的录音留言有效性处理方法,其特征在于:步骤A包括以下子步骤:
步骤A1:对录音留言音频中幅度超过采样阈值的帧进行截幅处理;
步骤A2:从录音留言音频提取包络,获取每一包络的平均音量值,根据各包络的平均音量获取录音留言音频的平均音量值;以及
步骤A3:去除录音留言音频的噪声。
3.如权利要求1所述的录音留言有效性处理方法,其特征在于:步骤C包括以下子步骤:
步骤C1:从语音音频中获取各个因子信息;
步骤C2:判断因子信息是否符合预设的因子信息模板,若是,执行步骤C3;若否,执行步骤C4;
步骤C3:提取出对应的因子信息,以组成有效语音段;以及
步骤C4:忽略对应的因子信息。
4.一种录音留言有效性处理系统,其特征在于:其包括以下模块:
音质优化模块:对录音留言音频进行音质异常检测,并相应优化录音留言音频的音质;
语音音频提取模块:从录音留言音频中提取出语音音频;
有效语音段提取模块:从语音音频中提取出有效语音段;
语音文本转换模块:将有效语音段转换为文本信息;其采用深度神经网络建立声学模型,再根据声学模型和维特比算法对有效语音段进行识别解码以文本信息;
敏感词审核模块:判断文本信息是否含有预设敏感词库内的敏感词,若是,执行第一输出模块;若否,执行第二输出模块;
第一输出模块:提取文本信息中对应的敏感词,再输出不包含敏感词的文本信息;以及
第二输出模块:输出文本信息;
在语音文本转换模块或敏感词审核模块或第一输出模块或第二输出模块之后还包括关键词检索模块:根据所输入的关键词从录音留言音频中获取对应的检索结果;关键词检索模块包括以下子模块:
索引建立模块:通过倒排索引方式将混淆网络形式的文本信息进行合并存档;以及
检索模块:根据所输入的关键词和存档的索引通过令牌传递检索方式获取相关的检索结果。
5.如权利要求4所述的录音留言有效性处理系统,其特征在于:音质优化模块包括以下子模块:
截幅处理模块:对录音留言音频中幅度超过采样阈值的帧进行截幅处理;
音量优化模块:从录音留言音频提取包络,获取每一包络的平均音量值,根据各包络的平均音量获取录音留言音频的平均音量值;
以及
去噪模块:去除录音留言音频的噪声。
6.如权利要求4所述的录音留言有效性处理系统,其特征在于:有效语音段提取模块包括以下子模块:
因子信息获取模块:从语音音频中获取各个因子信息;
因子信息判定模块:判断因子信息是否符合预设的因子信息模板,若是,执行有效语音段生成模块;若否,执行因子信息忽略模块;有效语音段生成模块:提取出对应的因子信息,以组成有效语音段;以及
因子信息忽略模块:忽略对应的因子信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510082541.8A CN104679729B (zh) | 2015-02-13 | 2015-02-13 | 录音留言有效性处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510082541.8A CN104679729B (zh) | 2015-02-13 | 2015-02-13 | 录音留言有效性处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104679729A CN104679729A (zh) | 2015-06-03 |
CN104679729B true CN104679729B (zh) | 2018-06-26 |
Family
ID=53314793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510082541.8A Active CN104679729B (zh) | 2015-02-13 | 2015-02-13 | 录音留言有效性处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104679729B (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105679310A (zh) * | 2015-11-17 | 2016-06-15 | 乐视致新电子科技(天津)有限公司 | 一种用于语音识别方法及系统 |
CN105933289A (zh) * | 2016-04-08 | 2016-09-07 | 苏州花坞信息科技有限公司 | 一种在线广播平台 |
CN106100777B (zh) * | 2016-05-27 | 2018-08-17 | 西华大学 | 基于语音识别技术的广播保障方法 |
CN106101819A (zh) * | 2016-06-21 | 2016-11-09 | 武汉斗鱼网络科技有限公司 | 一种基于语音识别的直播视频敏感内容过滤方法及装置 |
CN106897422A (zh) * | 2017-02-23 | 2017-06-27 | 百度在线网络技术(北京)有限公司 | 文本处理方法、装置及服务器 |
CN107068152B (zh) * | 2017-04-06 | 2020-06-16 | 杭州图南电子股份有限公司 | 一种基于应急广播的智能语音识别安全监测方法 |
CN107276777B (zh) * | 2017-07-27 | 2020-05-29 | 苏州科达科技股份有限公司 | 会议系统的音频处理方法及装置 |
CN107729315A (zh) * | 2017-09-28 | 2018-02-23 | 努比亚技术有限公司 | 音频文件的显示方法、终端和计算机存储介质 |
US10453447B2 (en) * | 2017-11-28 | 2019-10-22 | International Business Machines Corporation | Filtering data in an audio stream |
CN108228760A (zh) * | 2017-12-25 | 2018-06-29 | 湛江正信科技服务有限公司 | 敏感词过滤的方法、装置、移动终端及存储介质 |
CN108847241B (zh) * | 2018-06-07 | 2022-09-13 | 平安科技(深圳)有限公司 | 将会议语音识别为文本的方法、电子设备及存储介质 |
CN110677377B (zh) * | 2018-07-03 | 2022-03-04 | 中兴通讯股份有限公司 | 录音处理、播放方法、装置、服务器、终端及存储介质 |
CN109087648B (zh) * | 2018-08-21 | 2023-10-20 | 平安科技(深圳)有限公司 | 柜台语音监控方法、装置、计算机设备及存储介质 |
CN109213468B (zh) * | 2018-08-23 | 2020-04-28 | 阿里巴巴集团控股有限公司 | 一种语音播放方法和装置 |
CN110299133B (zh) * | 2019-07-03 | 2021-05-28 | 四川大学 | 基于关键字判定非法广播的方法 |
CN111341301B (zh) * | 2020-05-19 | 2020-09-04 | 北京小米移动软件有限公司 | 一种录音处理方法 |
CN113873085B (zh) * | 2020-06-12 | 2023-09-29 | 腾讯科技(深圳)有限公司 | 一种语音开场白的生成方法及相关装置 |
CN114125506B (zh) * | 2020-08-28 | 2024-03-19 | 上海哔哩哔哩科技有限公司 | 语音审核方法及装置 |
CN113516997A (zh) * | 2021-04-26 | 2021-10-19 | 常州分音塔科技有限公司 | 一种语音事件识别装置和方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103065629A (zh) * | 2012-11-20 | 2013-04-24 | 广东工业大学 | 一种仿人机器人的语音识别系统 |
CN103179122A (zh) * | 2013-03-22 | 2013-06-26 | 马博 | 一种基于语音语义内容分析的防电信电话诈骗方法和系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104243729A (zh) * | 2013-06-18 | 2014-12-24 | 殷程 | 话务管家 |
CN104199810A (zh) * | 2014-08-29 | 2014-12-10 | 科大讯飞股份有限公司 | 一种基于自然语言交互的智能服务方法及系统 |
-
2015
- 2015-02-13 CN CN201510082541.8A patent/CN104679729B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103065629A (zh) * | 2012-11-20 | 2013-04-24 | 广东工业大学 | 一种仿人机器人的语音识别系统 |
CN103179122A (zh) * | 2013-03-22 | 2013-06-26 | 马博 | 一种基于语音语义内容分析的防电信电话诈骗方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104679729A (zh) | 2015-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104679729B (zh) | 录音留言有效性处理方法及系统 | |
US10013977B2 (en) | Smart home control method based on emotion recognition and the system thereof | |
CN102723078B (zh) | 基于自然言语理解的语音情感识别方法 | |
CN102122506B (zh) | 一种语音识别的方法 | |
Zhou et al. | Efficient audio stream segmentation via the combined T/sup 2/statistic and Bayesian information criterion | |
CN102723080B (zh) | 一种语音识别测试系统及方法 | |
CN103634472B (zh) | 根据通话语音判断用户心情及性格的方法、系统及手机 | |
CN111128223A (zh) | 一种基于文本信息的辅助说话人分离方法及相关装置 | |
CN102903361A (zh) | 一种通话即时翻译系统和方法 | |
CN103151039A (zh) | 一种基于向量机svm的说话者年龄段识别方法 | |
CN103700370A (zh) | 一种广播电视语音识别系统方法及系统 | |
CN110070875B (zh) | 一种基于语音关键词检测和声纹的反电信诈骗方法 | |
CN107886951B (zh) | 一种语音检测方法、装置及设备 | |
CN107845381A (zh) | 一种机器人语义处理的方法及系统 | |
CN111105785B (zh) | 一种文本韵律边界识别的方法及装置 | |
CN108364650A (zh) | 语音识别结果的调整装置及方法 | |
CN111489765A (zh) | 一种基于智能语音技术的话务服务质检方法 | |
CN110890096A (zh) | 一种基于语音分析的智能语音系统及方法 | |
CN113192535B (zh) | 一种语音关键词检索方法、系统和电子装置 | |
CN111489743A (zh) | 一种基于智能语音技术的运营管理分析系统 | |
CN110689906A (zh) | 一种基于语音处理技术的执法检测方法及系统 | |
CN110705907A (zh) | 一种基于音频语音处理技术的课堂教学辅助督导方法及系统 | |
CN110931016A (zh) | 一种离线质检用语音识别方法及系统 | |
EP2913822B1 (en) | Speaker recognition | |
CN110933236B (zh) | 一种基于机器学习的空号识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |