CN111179938A - 一种基于人工智能的语音识别垃圾分类系统 - Google Patents

一种基于人工智能的语音识别垃圾分类系统 Download PDF

Info

Publication number
CN111179938A
CN111179938A CN201911369125.0A CN201911369125A CN111179938A CN 111179938 A CN111179938 A CN 111179938A CN 201911369125 A CN201911369125 A CN 201911369125A CN 111179938 A CN111179938 A CN 111179938A
Authority
CN
China
Prior art keywords
voice
module
controller
sound source
artificial intelligence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911369125.0A
Other languages
English (en)
Inventor
任牡玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Renhao Intelligent Technology Co ltd
Original Assignee
Anhui Renhao Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Renhao Intelligent Technology Co ltd filed Critical Anhui Renhao Intelligent Technology Co ltd
Priority to CN201911369125.0A priority Critical patent/CN111179938A/zh
Publication of CN111179938A publication Critical patent/CN111179938A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及垃圾分类系统,具体涉及一种基于人工智能的语音识别垃圾分类系统,包括控制器,控制器与用于采集语音的语音采集模块相连,控制器与用于对语音采集模块采集语音的声源进行定位的声源定位模块相连,控制器与用于根据声源定位模块的定位信息判断声源准确位置坐标的声源方向判定模块相连,控制器与用于根据声源方向判定模块的判定结果对语音采集模块采集语音进行处理的语音处理模块相连,语音处理模块将处理后得到的语音输入声学模型,控制器与用于提取来自声学模型处理后得到语音中关键字的关键字提取模块相连;本发明提供的技术方案能够有效克服现有技术所存在的不支持语音识别功能、语音识别不准确、不具备自主学习功能的缺陷。

Description

一种基于人工智能的语音识别垃圾分类系统
技术领域
本发明涉及垃圾分类系统,具体涉及一种基于人工智能的语音识别垃圾分类系统。
背景技术
现阶段,政府正在大力推进垃圾分类试点工作,居民在投递垃圾时需要自主完成分类。但对于普通居民,因为垃圾分类的习惯还没有养成,自行判断垃圾所属类别会比较困难,所以市面上出现了人工输入垃圾名称,自动判断垃圾所属类别的系统终端。
但是,现有的系统终端不支持语音识别功能,并且由于噪声源干扰,会出现语音识别不准确的情况。此外,现有的系统不具备自主学习的功能,通常需要人工扩展识别范围。
发明内容
(一)解决的技术问题
针对现有技术所存在的上述缺点,本发明提供了一种基于人工智能的语音识别垃圾分类系统,能够有效克服现有技术所存在的不支持语音识别功能、语音识别不准确、不具备自主学习功能的缺陷。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
一种基于人工智能的语音识别垃圾分类系统,包括控制器,所述控制器与用于采集语音的语音采集模块相连,所述控制器与用于对所述语音采集模块采集语音的声源进行定位的声源定位模块相连,所述控制器与用于根据所述声源定位模块的定位信息判断声源准确位置坐标的声源方向判定模块相连;
所述控制器与用于根据所述声源方向判定模块的判定结果对所述语音采集模块采集语音进行处理的语音处理模块相连,所述语音处理模块将处理后得到的语音输入声学模型,所述控制器与用于提取来自所述声学模型处理后得到语音中关键字的关键字提取模块相连,所述控制器与存储各类垃圾包含垃圾的语音的垃圾分类数据库相连,所述控制器与用于在所述垃圾分类数据库中查询所述关键字提取模块提取关键字相对应垃圾类型的对比查询模块相连;
所述控制器通过数据传输模块将没有在所述垃圾分类数据库中查询到的关键字发送给人工客服平台,所述人工客服平台通过无线通信模块将垃圾类型发送给所述控制器,所述控制器与用于根据所述对比查询模块的查询结果、所述人工客服平台的传输数据进行语音播报的语音输出模块相连。
优选地,所述语音采集模块包括阵列分布设置的话筒,所述控制器中存储有每个话筒的位置坐标。
优选地,所述声源定位模块根据所述语音采集模块中话筒的位置坐标及声音强度计算声源位置坐标。
优选地,所述声源方向判定模块根据所述声源定位模块计算的声源位置坐标与系统终端的相对位置判定声源方向。
优选地,所述语音处理模块通过调整波束形成器的时延补偿权值对来自声源方向的语音进行增强处理,并对非声源方向的语音进行削弱处理。
优选地,所述声学模型的建立过程包括以下步骤:
S1、对于每个语种对应的语料,将提取得到的语音特征输入第一输入层;
S2、在第一输入层基于预设的第一权重矩阵计算向第一隐藏层输出的输出值;
S3、在第一隐藏层包括的多个子隐层中,接收相邻的第一输入层或前一个子隐层的输出值,使用相应的第二权重矩阵进行加权计算,并将结果输出至相邻的第一输出层或后一个子隐层;
S4、迭代调整第一权重矩阵、第二权重矩阵,得到满足预设条件的声学模型。
优选地,所述控制器接收到来自所述人工客服平台的传输数据时,所述控制器将没有在所述垃圾分类数据库中查询到的关键字及对应传输数据存储到所述垃圾分类数据库中。
优选地,所述垃圾分类数据库基于不同城市的垃圾分类规则进行设置。
(三)有益效果
与现有技术相比,本发明所提供的一种基于人工智能的语音识别垃圾分类系统,具有以下有益效果:
1、语音采集模块采集语音,声源定位模块对语音采集模块采集语音的声源进行定位,声源方向判定模块根据声源定位模块的定位信息判断声源准确位置坐标,语音处理模块通过调整波束形成器的时延补偿权值对来自声源方向的语音进行增强处理,并对非声源方向的语音进行削弱处理,语音处理模块将处理后得到的语音输入声学模型,关键字提取模块提取来自声学模型处理后得到语音中关键字,对比查询模块在垃圾分类数据库中查询关键字提取模块提取关键字相对应垃圾类型,再通过语音输出模块进行语音播报,一方面能够识别语音,通过语音识别输出对应垃圾类型的语音,方便人们使用,另一方面通过对非声源方向的语音进行削弱处理,减小噪声源的干扰,保证语音识别的准确度;
2、数据传输模块将没有在垃圾分类数据库中查询到的关键字发送给人工客服平台,人工客服平台通过无线通信模块将垃圾类型发送给控制器,控制器接收到来自人工客服平台的传输数据时,控制器将没有在垃圾分类数据库中查询到的关键字及对应传输数据存储到垃圾分类数据库中,从而能够进行自主学习,高效扩大识别范围。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明系统示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于人工智能的语音识别垃圾分类系统,如图1所示,包括控制器,控制器与用于采集语音的语音采集模块相连,控制器与用于对语音采集模块采集语音的声源进行定位的声源定位模块相连,控制器与用于根据声源定位模块的定位信息判断声源准确位置坐标的声源方向判定模块相连;
控制器与用于根据声源方向判定模块的判定结果对语音采集模块采集语音进行处理的语音处理模块相连,语音处理模块将处理后得到的语音输入声学模型,控制器与用于提取来自声学模型处理后得到语音中关键字的关键字提取模块相连,控制器与存储各类垃圾包含垃圾的语音的垃圾分类数据库相连,控制器与用于在垃圾分类数据库中查询关键字提取模块提取关键字相对应垃圾类型的对比查询模块相连;
控制器通过数据传输模块将没有在垃圾分类数据库中查询到的关键字发送给人工客服平台,人工客服平台通过无线通信模块将垃圾类型发送给控制器,控制器与用于根据对比查询模块的查询结果、人工客服平台的传输数据进行语音播报的语音输出模块相连。
语音采集模块包括阵列分布设置的话筒,控制器中存储有每个话筒的位置坐标。
声源定位模块根据语音采集模块中话筒的位置坐标及声音强度计算声源位置坐标。
声源方向判定模块根据声源定位模块计算的声源位置坐标与系统终端的相对位置判定声源方向。
语音处理模块通过调整波束形成器的时延补偿权值对来自声源方向的语音进行增强处理,并对非声源方向的语音进行削弱处理。
声学模型的建立过程包括以下步骤:
S1、对于每个语种对应的语料,将提取得到的语音特征输入第一输入层;
S2、在第一输入层基于预设的第一权重矩阵计算向第一隐藏层输出的输出值;
S3、在第一隐藏层包括的多个子隐层中,接收相邻的第一输入层或前一个子隐层的输出值,使用相应的第二权重矩阵进行加权计算,并将结果输出至相邻的第一输出层或后一个子隐层;
S4、迭代调整第一权重矩阵、第二权重矩阵,得到满足预设条件的声学模型。
控制器接收到来自人工客服平台的传输数据时,控制器将没有在垃圾分类数据库中查询到的关键字及对应传输数据存储到垃圾分类数据库中。
垃圾分类数据库基于不同城市的垃圾分类规则进行设置。
语音采集模块采集语音,声源定位模块对语音采集模块采集语音的声源进行定位,声源方向判定模块根据声源定位模块的定位信息判断声源准确位置坐标,语音处理模块通过调整波束形成器的时延补偿权值对来自声源方向的语音进行增强处理,并对非声源方向的语音进行削弱处理,语音处理模块将处理后得到的语音输入声学模型,关键字提取模块提取来自声学模型处理后得到语音中关键字,对比查询模块在垃圾分类数据库中查询关键字提取模块提取关键字相对应垃圾类型,再通过语音输出模块进行语音播报,一方面能够识别语音,通过语音识别输出对应垃圾类型的语音,方便人们使用,另一方面通过对非声源方向的语音进行削弱处理,减小噪声源的干扰,保证语音识别的准确度。
语音采集模块包括阵列分布设置的话筒,控制器中存储有每个话筒的位置坐标。
声源定位模块根据语音采集模块中话筒的位置坐标及声音强度计算声源位置坐标。
声源方向判定模块根据声源定位模块计算的声源位置坐标与系统终端的相对位置判定声源方向。
声学模型的建立过程包括以下步骤:
S1、对于每个语种对应的语料,将提取得到的语音特征输入第一输入层;
S2、在第一输入层基于预设的第一权重矩阵计算向第一隐藏层输出的输出值;
S3、在第一隐藏层包括的多个子隐层中,接收相邻的第一输入层或前一个子隐层的输出值,使用相应的第二权重矩阵进行加权计算,并将结果输出至相邻的第一输出层或后一个子隐层;
S4、迭代调整第一权重矩阵、第二权重矩阵,得到满足预设条件的声学模型。
数据传输模块将没有在垃圾分类数据库中查询到的关键字发送给人工客服平台,人工客服平台通过无线通信模块将垃圾类型发送给控制器,控制器接收到来自人工客服平台的传输数据时,控制器将没有在垃圾分类数据库中查询到的关键字及对应传输数据存储到垃圾分类数据库中,从而能够进行自主学习,高效扩大识别范围。
垃圾分类数据库基于不同城市的垃圾分类规则进行设置。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种基于人工智能的语音识别垃圾分类系统,其特征在于:包括控制器,所述控制器与用于采集语音的语音采集模块相连,所述控制器与用于对所述语音采集模块采集语音的声源进行定位的声源定位模块相连,所述控制器与用于根据所述声源定位模块的定位信息判断声源准确位置坐标的声源方向判定模块相连;
所述控制器与用于根据所述声源方向判定模块的判定结果对所述语音采集模块采集语音进行处理的语音处理模块相连,所述语音处理模块将处理后得到的语音输入声学模型,所述控制器与用于提取来自所述声学模型处理后得到语音中关键字的关键字提取模块相连,所述控制器与存储各类垃圾包含垃圾的语音的垃圾分类数据库相连,所述控制器与用于在所述垃圾分类数据库中查询所述关键字提取模块提取关键字相对应垃圾类型的对比查询模块相连;
所述控制器通过数据传输模块将没有在所述垃圾分类数据库中查询到的关键字发送给人工客服平台,所述人工客服平台通过无线通信模块将垃圾类型发送给所述控制器,所述控制器与用于根据所述对比查询模块的查询结果、所述人工客服平台的传输数据进行语音播报的语音输出模块相连。
2.根据权利要求1所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述语音采集模块包括阵列分布设置的话筒,所述控制器中存储有每个话筒的位置坐标。
3.根据权利要求1所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述声源定位模块根据所述语音采集模块中话筒的位置坐标及声音强度计算声源位置坐标。
4.根据权利要求1所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述声源方向判定模块根据所述声源定位模块计算的声源位置坐标与系统终端的相对位置判定声源方向。
5.根据权利要求1所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述语音处理模块通过调整波束形成器的时延补偿权值对来自声源方向的语音进行增强处理,并对非声源方向的语音进行削弱处理。
6.根据权利要求1所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述声学模型的建立过程包括以下步骤:
S1、对于每个语种对应的语料,将提取得到的语音特征输入第一输入层;
S2、在第一输入层基于预设的第一权重矩阵计算向第一隐藏层输出的输出值;
S3、在第一隐藏层包括的多个子隐层中,接收相邻的第一输入层或前一个子隐层的输出值,使用相应的第二权重矩阵进行加权计算,并将结果输出至相邻的第一输出层或后一个子隐层;
S4、迭代调整第一权重矩阵、第二权重矩阵,得到满足预设条件的声学模型。
7.根据权利要求1所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述控制器接收到来自所述人工客服平台的传输数据时,所述控制器将没有在所述垃圾分类数据库中查询到的关键字及对应传输数据存储到所述垃圾分类数据库中。
8.根据权利要求7所述的基于人工智能的语音识别垃圾分类系统,其特征在于:所述垃圾分类数据库基于不同城市的垃圾分类规则进行设置。
CN201911369125.0A 2019-12-26 2019-12-26 一种基于人工智能的语音识别垃圾分类系统 Pending CN111179938A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911369125.0A CN111179938A (zh) 2019-12-26 2019-12-26 一种基于人工智能的语音识别垃圾分类系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911369125.0A CN111179938A (zh) 2019-12-26 2019-12-26 一种基于人工智能的语音识别垃圾分类系统

Publications (1)

Publication Number Publication Date
CN111179938A true CN111179938A (zh) 2020-05-19

Family

ID=70652190

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911369125.0A Pending CN111179938A (zh) 2019-12-26 2019-12-26 一种基于人工智能的语音识别垃圾分类系统

Country Status (1)

Country Link
CN (1) CN111179938A (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106898360A (zh) * 2017-04-06 2017-06-27 北京地平线信息技术有限公司 音频信号处理方法、装置和电子设备
CN107248410A (zh) * 2017-07-19 2017-10-13 浙江联运知慧科技有限公司 声纹识别垃圾箱开门的方法
CN108172218A (zh) * 2016-12-05 2018-06-15 中国移动通信有限公司研究院 一种语音建模方法及装置
CN108447483A (zh) * 2018-05-18 2018-08-24 深圳市亿道数码技术有限公司 语音识别系统
CN108831483A (zh) * 2018-09-07 2018-11-16 马鞍山问鼎网络科技有限公司 一种人工智能语音识别系统
CN109256120A (zh) * 2018-08-31 2019-01-22 深圳市研本品牌设计有限公司 一种语音垃圾箱及存储介质
CN109817213A (zh) * 2019-03-11 2019-05-28 腾讯科技(深圳)有限公司 用于自适应语种进行语音识别的方法、装置及设备
CN110282288A (zh) * 2019-07-22 2019-09-27 深圳绎趣智能科技有限公司 一种智能语音垃圾分类器及分类方法
CN110310640A (zh) * 2019-07-26 2019-10-08 上海头趣科技有限公司 一种基于语音系统的智能垃圾分类系统
CN110342134A (zh) * 2019-07-23 2019-10-18 珠海市一微半导体有限公司 一种基于双目视觉的垃圾分类识别系统及其方法
CN110473526A (zh) * 2018-05-11 2019-11-19 三星电子株式会社 对语音识别模型进行个性化的装置和方法及电子装置
CN110516768A (zh) * 2019-08-29 2019-11-29 中新智擎科技有限公司 一种垃圾分类管理的方法、装置及人工智能机器人
CN110570856A (zh) * 2019-09-03 2019-12-13 杭州任你说智能科技有限公司 基于语音交互辅助分类投放的智能垃圾箱及辅助投放方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108172218A (zh) * 2016-12-05 2018-06-15 中国移动通信有限公司研究院 一种语音建模方法及装置
CN106898360A (zh) * 2017-04-06 2017-06-27 北京地平线信息技术有限公司 音频信号处理方法、装置和电子设备
CN107248410A (zh) * 2017-07-19 2017-10-13 浙江联运知慧科技有限公司 声纹识别垃圾箱开门的方法
CN110473526A (zh) * 2018-05-11 2019-11-19 三星电子株式会社 对语音识别模型进行个性化的装置和方法及电子装置
CN108447483A (zh) * 2018-05-18 2018-08-24 深圳市亿道数码技术有限公司 语音识别系统
CN109256120A (zh) * 2018-08-31 2019-01-22 深圳市研本品牌设计有限公司 一种语音垃圾箱及存储介质
CN108831483A (zh) * 2018-09-07 2018-11-16 马鞍山问鼎网络科技有限公司 一种人工智能语音识别系统
CN109817213A (zh) * 2019-03-11 2019-05-28 腾讯科技(深圳)有限公司 用于自适应语种进行语音识别的方法、装置及设备
CN110491382A (zh) * 2019-03-11 2019-11-22 腾讯科技(深圳)有限公司 基于人工智能的语音识别方法、装置及语音交互设备
CN110282288A (zh) * 2019-07-22 2019-09-27 深圳绎趣智能科技有限公司 一种智能语音垃圾分类器及分类方法
CN110342134A (zh) * 2019-07-23 2019-10-18 珠海市一微半导体有限公司 一种基于双目视觉的垃圾分类识别系统及其方法
CN110310640A (zh) * 2019-07-26 2019-10-08 上海头趣科技有限公司 一种基于语音系统的智能垃圾分类系统
CN110516768A (zh) * 2019-08-29 2019-11-29 中新智擎科技有限公司 一种垃圾分类管理的方法、装置及人工智能机器人
CN110570856A (zh) * 2019-09-03 2019-12-13 杭州任你说智能科技有限公司 基于语音交互辅助分类投放的智能垃圾箱及辅助投放方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
董仕著: "《基于流记录的网络流量识别关键技术研究》", 31 July 2017 *

Similar Documents

Publication Publication Date Title
CN106202476B (zh) 一种基于知识图谱的人机对话的方法及装置
CN105374356B (zh) 语音识别方法、语音评分方法、语音识别系统及语音评分系统
CN107945790B (zh) 一种情感识别方法和情感识别系统
US20020169600A1 (en) Multi-stage large vocabulary speech recognition system and method
US20170242847A1 (en) Apparatus and method for translating a meeting speech
CN109767769A (zh) 一种语音识别方法、装置、存储介质及空调
CN103295575B (zh) 一种语音识别方法和客户端
CN107293309B (zh) 一种基于客户情绪分析提升舆情监控效率的方法
CN102236639B (zh) 更新语言模型的系统和方法
CN110019838B (zh) 智能问答系统及智能终端
CN110110049A (zh) 服务咨询方法、装置、系统、服务机器人及存储介质
CN112053007B (zh) 一种配网故障抢修预测分析系统和方法
CN106356054A (zh) 一种基于语音识别的农产品信息采集方法和系统
CN111581348A (zh) 一种基于知识图谱的查询分析系统
CN110085217A (zh) 语音导航方法、装置及终端设备
CN111292723A (zh) 一种语音识别系统
CN113177101A (zh) 用户轨迹识别方法、装置、设备及存储介质
CN113609264A (zh) 电力系统节点的数据查询方法、装置
CN114449105A (zh) 基于语音的电力客户服务话务质检系统
CN106844734B (zh) 一种自动生成会话回复内容的方法
CN106776557B (zh) 情感机器人的情感状态记忆识别方法及装置
CN111179938A (zh) 一种基于人工智能的语音识别垃圾分类系统
CN110688473A (zh) 一种机器人动态获取信息的方法
CN113128216A (zh) 一种语言识别方法、系统及装置
CN113053416A (zh) 一种基于知识图谱的语音情感识别系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200519