CN107195077A - 瓶子智能回收机 - Google Patents
瓶子智能回收机 Download PDFInfo
- Publication number
- CN107195077A CN107195077A CN201710589325.1A CN201710589325A CN107195077A CN 107195077 A CN107195077 A CN 107195077A CN 201710589325 A CN201710589325 A CN 201710589325A CN 107195077 A CN107195077 A CN 107195077A
- Authority
- CN
- China
- Prior art keywords
- voice
- door
- casing
- bottle
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004064 recycling Methods 0.000 title claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 24
- 239000010813 municipal solid waste Substances 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims description 39
- 230000007246 mechanism Effects 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 19
- 238000005516 engineering process Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 15
- 238000013139 quantization Methods 0.000 claims description 9
- 230000001934 delay Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 6
- 238000013480 data collection Methods 0.000 claims description 5
- 230000001755 vocal effect Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 238000004088 simulation Methods 0.000 claims 1
- 238000011084 recovery Methods 0.000 abstract description 3
- 230000008901 benefit Effects 0.000 abstract description 2
- 230000010354 integration Effects 0.000 description 7
- 241000209140 Triticum Species 0.000 description 6
- 235000021307 Triticum Nutrition 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000004568 cement Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07F—COIN-FREED OR LIKE APPARATUS
- G07F7/00—Mechanisms actuated by objects other than coins to free or to actuate vending, hiring, coin or paper currency dispensing or refunding apparatus
- G07F7/06—Mechanisms actuated by objects other than coins to free or to actuate vending, hiring, coin or paper currency dispensing or refunding apparatus by returnable containers, i.e. reverse vending systems in which a user is rewarded for returning a container that serves as a token of value, e.g. bottles
- G07F7/0609—Mechanisms actuated by objects other than coins to free or to actuate vending, hiring, coin or paper currency dispensing or refunding apparatus by returnable containers, i.e. reverse vending systems in which a user is rewarded for returning a container that serves as a token of value, e.g. bottles by fluid containers, e.g. bottles, cups, gas containers
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C9/00—Individual registration on entry or exit
- G07C9/00174—Electronically operated locks; Circuits therefor; Nonmechanical keys therefor, e.g. passive or active electrical keys or other data carriers without mechanical keys
- G07C9/00563—Electronically operated locks; Circuits therefor; Nonmechanical keys therefor, e.g. passive or active electrical keys or other data carriers without mechanical keys using personal physical data of the operator, e.g. finger prints, retinal images, voicepatterns
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C9/00—Individual registration on entry or exit
- G07C9/00174—Electronically operated locks; Circuits therefor; Nonmechanical keys therefor, e.g. passive or active electrical keys or other data carriers without mechanical keys
- G07C9/00896—Electronically operated locks; Circuits therefor; Nonmechanical keys therefor, e.g. passive or active electrical keys or other data carriers without mechanical keys specially adapted for particular uses
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/08—Use of distortion metrics or a particular distance between probe pattern and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Refuse Collection And Transfer (AREA)
Abstract
本发明涉及环保设备领域。瓶子智能回收机,包括壳体,壳体上设有投放门和声纹识别开门系统,用户通过声纹识别的方法使用声纹识别开门系统打开投放门,壳体内设有控制器、盛放瓶子的第一箱体和盛放其它垃圾的第二箱体;声纹识别开门系统、感应器、摄像头和自动开关均连接控制器;所述声纹识别的方法依次包括语音注册、语音开门和逻辑决策。该瓶子智能回收机的优点是使用时用户不用近距离对着声纹识别开门系统发声仍然可以准确采集声音信号,在声音嘈杂的环境下仍然可以准确识别用户,打开投放门,并且可以准确的识别投入其内的物品是否为瓶子并将物品放入对应的箱体,提高瓶子的回收利用率。
Description
技术领域
本发明涉及环保设备领域,尤其涉及智能分类垃圾箱。
背景技术
随着资源匮乏现象的日益严重,再生能源回收工程越来越被社会所重视,而垃圾分类是再生能源回收的先前条件之一,也是相对垃圾收集处置传统方式的改革,还是对垃圾进行有效处置的一种科学管理方法。智能垃圾箱已经广泛的使用,目前的智能垃圾箱将瓶子和其它垃圾分开也需要用户手动选择,使用不方便。智能垃圾箱使用时先给用户进行身份登记,对用户投放后的垃圾重量进行称重并积分,当积分累积打一定值,用户可以用积分进行兑换商品。通过对用户进行身份认证的方法开启垃圾箱箱门,目前常规是通过扫二维码的方式,需要用户带着印有二维码的卡片或者有包含用户信息的二维码的手机进行扫
码,这就需要用户随身携带着卡片和手机,尤其是当手持垃圾时再扫码使用不方便,给用户的使用带来不便。
发明内容
为了解决上述问题,本发明的目的在于提供一种可以区分瓶子和其它垃圾并自动分开存放,使用方便,用户识别准确率高的瓶子智能回收机。
为了实现上述的目的,本发明采用了以下的技术方案:瓶子智能回收机,包括壳体,壳体上设有投放门和声纹识别开门系统,用户通过声纹识别的方法使用声纹识别开门系统打开投放门,壳体内设有控制器、盛放瓶子的第一箱体和盛放其它垃圾的第二箱体;壳体内设有瓶子识别装置,瓶子识别装置包括下料管及与下料管位置匹配的感应器和摄像头,摄像头朝向下料管;下料管顶部连接投放门,下料管底部处于第一箱体和第二箱体上方,下料管底部设有控制下料管底部是否打开的自动开关,通过自动开关控制下料管底部开口朝向第一箱体或第二箱体;声纹识别开门系统、感应器、摄像头和自动开关均连接控制器;所述声纹识别的方法依次包括语音注册、语音开门和逻辑决策,语音注册依次包括如下步骤:(1)采集注册语音,通过麦克风阵列技术对注册语音进行采集,并且采用固定波束形成算法通过延时控制来补偿声源延时;(2)特征提取,通过模拟和数字处理,采用MFCC特征提取方式从注册语音中提取表征注册用户特征的语音信息;(3)模型训练,建立注册用户语音模型,模型训练方法选择最小分类错误准则即MCE准则进行区分训练;所述语音开门依次包括如下步骤:(1)采集开门语音,通过麦克风阵列技术对开门语音进行采集,并且采用固定波束形成算法通过延时控制来补偿声源延时;(2)特征提取,通过模拟和数字处理技术,采用MFCC特征提取方式从开门语音中选择和提取表征开门用户特征的语音信息;(3)模型训练,建立开门用户语音模型,模型训练方法选择最小分类错误准则即MCE准则进行区分训练;所述逻辑决策依次包括模式匹配和进行决策步骤,模式匹配是将注册用户语音模型与开门用户语音模型进行匹配,计算二者的对数似然比,得出对数似然比得分;进行决策是计算匹配得分,达到设定阈值,声纹识别开门系统将开门信号发送给控制器,控制器控制投放门打开;达不到设定阈值投放门不打开。
作为优选,动开关包括挡板和驱动部件,挡板处于下料管底部,驱动部件带动挡板移动实现下料管底部是否打开,驱动部件连接控制器。结构合理,使用方便。
作为优选,下料管底部连在挡板上,通过挡板带动下料管底部开口朝向第一箱体或第二箱体,使用时挡板首先起到控制下料管开或关的功能,完成开或关的功能后挡板继续移动还起到控制下料管内物品流向的作用,即物品最终放入第一箱体或第二箱体内。感应器安装在下料管上,下料管截面呈C形,摄像头朝向C形的下料管的开口端,有利于摄像头更加清晰的拍摄下料管内的瓶子,提高识别率。
作为优选,挡板下方设有第一导向机构和第二导向机构,第一导向机构底部朝向第一箱体,第二导向机构底部朝向第二箱体。使用时挡板不仅起到控制下料管开或关的功能,同时按照开口位置的不同还起到控制下料管内物品流向的作用,即物品最终放入第一箱体或第二箱体内。感应器安装在下料管上,下料管截面呈C形,摄像头朝向C形的下料管的开口端,有利于摄像头更加清晰的拍摄下料管内的瓶子,提高识别率。
作为优选,壳体上还设有二维码、扫描器、触摸屏和无线发射装置,控制器通过无线发射装置连接服务器,服务器或控制器通过用户扫描二维码或扫描器扫用户信息的方式确认用户信息;触摸屏与控制器相连,触摸屏用于显示用户信息、投入垃圾信息和输入开门密码;多种开门方式并存,为用户提供更多的选择。
作为优选,壳体上设有打印机,打印机连接控制器,可以打印用户的投放信息;壳体外侧设有投放图像采集装置;摄像头旁设置补光灯,用来增强亮度使摄像头采集图像时更清晰;第一箱体上部设有第一溢满感应器,其它箱体上部设有第二溢满感应器,第一溢满感应器和第二溢满感应器均连接控制器,瓶子放满时第一溢满感应器报警,提醒操作人员更换第一箱体,或其它放满时第二溢满感应器报警,提醒操作人员更换第二箱体,操作更加方便。
作为优选,通过多个麦克风阵列技术对注册语音和开门语音信息进行采集;语音注册中的MFCC特征提取方式是指将采集的注册语音转换为模拟语音信号,对语音信号进行采样量化,量化后进行预加重处理、加汉明窗处理,最后输出语音帧序列;语音开门中的MFCC特征提取方式是指将采集的开门语音转换为模拟语音信号,对语音信号进行采样量化,量化后进行预加重处理、加汉明窗处理,最后输出语音帧序列。
作为优选,固定波束形成算法其中,xi(t)为麦克风接收到的信号,权系数为wi(k),k为麦克风的数目,τi为时延估计得到的时延。
作为优选,语音注册中的模型训练是先将注册用户模型分成非重叠和共性重叠部分,利用注册用户语音数据集建立注册用户语音GMM模型;语音开门中的模型训练是先将开门用户模型分成非重叠和共性重叠部分,利用开门语音数据集建立开门用户语音GMM模型。
作为优选,所有的模型进行SVM支持向量机训练,通过计算其在所有说话人模型上的相似度,即对应最大相似度和最小相似度之比小于一个阈值,则归为共性重叠部分,否则归为非重叠部分;注册用户语音GMM模型和开门用户语音GMM模型的训练过程算法是:p=(maxPr(xj|Mi)/minPr(xj|Mk)),i=1,...,S,K=1,...,S,,p为向量在说话人模型上的最大相似度与最小相似度之比,S为说话人个数,xj第j个训练输入向量,j=1,...,N,N为训练特征向量个数,p小于阈值T,则该向量Xj→Q,属于共性重叠部分向量;p大于阈值T,则该向量Xj→P,属于说话人非重叠部分向量集。
采用上述技术方案的瓶子智能回收机,用户通过声纹识别的方法使用声纹识别开门系统打开投放门,采集注册语音和采集开门语音时,通过麦克风阵列技术对注册语音进行采集,并且采用固定波束形成算法通过延时控制来补偿声源延时,特征提取时采用MFCC特征提取方式,模型训练方法选择最小分类错误准则即MCE准则进行区分训练。投放门打开后,物品通过投放门进入下料管,自动开关将物品拦在下料管内,感应器识别到物品处于下料管内,摄像头拍摄物品识别物品是否为瓶子并将识别信息传给控制器,并根据识别的结果将物品放入盛放瓶子的第一箱体或盛放其它垃圾的第二箱体。该瓶子智能回收机的优点是使用时用户不用近距离对着声纹识别开门系统发声仍然可以准确采集声音信号,在声音嘈杂的环境下仍然可以准确识别用户,打开投放门,并且可以准确的识别投入其内的物品是否为瓶子并将物品放入对应的箱体,通过控制器记录用户的投放信息,提高瓶子的回收利用率。
附图说明
图1是本发明实施例中瓶子智能回收机的正面示意图。
图2是本发明实施例1中瓶子智能回收机的示意图。
图3是本发明实施例2中瓶子智能回收机的示意图。
图4是本发明实施例中麦克风阵列示意图。
图5是本发明实施例中固定波束形成示意图。
图6是本发明实施例中MFCC特征提取流程示意图。
具体实施方式
下面结合附图1、图2、图3、图4、图5和图6对本发明作进一步详细的说明。
实施例1
如图1、图2、图4、图5和图6所示的瓶子智能回收机,包括壳体1,壳体1上设有投放门3、触摸屏2、打印机4、声纹识别开门系统5。壳体1内设有盛放瓶子的第一箱体13、盛放其它垃圾的第二箱体14、瓶子识别装置、控制器6和和无线发射装置,控制器6通过无线发射装置连接服务器。壳体1外侧的顶部设有投放图像采集装置,具体是高清摄像头,用于采集用户员投放过程的影像。打印机4用于打印投放信息。用户通过声纹识别的方法使用声纹识别开门系统5打开投放门3。
瓶子识别装置包括下料管7、感应器9和摄像头8,下料管7顶部连接投放门3,下料管7和投放门3之间通过开门机构31控制连通或关闭。下料管7截面呈C形,C形的下料管7的开口端朝上,摄像头8朝向C形的下料管7的开口端,即摄像头8位置处于开口端之上,有利于摄像头8更加清晰的拍摄下料管内的投入物品。如果是全封闭的下料管,摄像头需要安装在下料管内,因此截面呈C形的下料管使用摄像头拍摄时识别率更精确。上述摄像头8是高清摄像头,通过摄像头来图像识别所投的物品是否是瓶子,摄像头8旁设置补光灯,用来增强亮度使摄像头采集图像时更清晰,摄像头8不仅用于识别投入的物品是否为瓶子,还用来识别投放瓶子的种类,即是什么样的瓶子,以便于后续积分奖励的差别化处理。
下料管7底部设有控制下料管底部是否打开的自动开关,自动开关包括挡板10和驱动部件11,驱动部件11具体是电机。挡板10处于下料管7底部,驱动部件11带动挡板10移动实现下料管7底部是否打开,驱动部件11连接控制器。
下料管7底部处于第一箱体13或第二箱体14的上方,通过自动开关控制下料管7底部开口朝向第一箱体13或第二箱体14,下料管7底部连在挡板10上,挡板10移动不仅实现下料管7底部打开,而且带动下料管7底部开口朝向第一箱体13或第二箱体14。
感应器9安装在下料管上,感应器9一般处于下料管7下部,当投入的物品被挡板挡10在于下料管底部时,感应器9感应到有物品投入,并通知控制器6控制摄像头8拍摄投入的物品,通过比对判断投入的物品是否为瓶子。感应器9是检测瓶子位置和重量的感应器,可以进一步确认瓶子的体积或者材质,便于后续积分奖励的差别化。
箱体13上部设有溢满感应器12,溢满感应器12连接控制器6,瓶子放满时可以溢满报警,提醒操作人员更换箱体,提高使用效率。
壳体1上除声纹识别开门系统5外,还可以选择设置其它开门方式,例如二维码、扫描器,用户通过手机扫码自动开门、扫描用户卡或扫描用户的识别码开门等。
投放门3呈圆形,投放门3内侧设置开门机构31,开门机构31连接控制器6,即控制器6控制开门机构31开或关投放门3。
触摸屏2、打印机4、声纹识别开门系统5、开门机构31、感应器9、摄像头8、驱动部件11和溢满感应器12均连接控制器6,控制器6控制各部件的动作。上述第二箱体14可以是一个,也可以是多个,例如按垃圾种类不同区分。上述触摸屏2可以显示用户信息、投入垃圾信息和输入开门密码等,触摸屏2还可以进行智能交换信息,例如投放垃圾、视频宣传、积分兑换、个人信息等。
上述声纹识别的方法依次包括语音注册、语音开门和逻辑决策步骤。
语音注册依次包括如下步骤:
(1)采集语音注册,语音注册时,录入一段一定时长的用户的声音,重复多遍;通过多个麦克风阵列技术对注册用户语音进行采集,并且采用固定波束形成算法通过延时控制来补偿声源延时;用户在一定距离范围内朝双麦阵列录入音,通过声波抵达阵列中每个麦克风之间的微小时差的相互作用,得到更好的指向性,可以有效降低周边的环境噪音的影响。双麦阵列通过时延估计、时延补偿、加权求和。麦克风阵列有2麦、4麦、6麦,对应麦数越多,降噪和语音增强的效果越好,麦克风1接收到的信号为X1(t)、麦克风2接收到的信号为X2(t),由于麦克风阵元空间位置的差异,各阵元接收到的信号存在时延,Xi(k)经延时估计得到的麦克风时延为τi,在对信号进行处理之前进行时延补偿,保证各阵元待处理数据的一致性。使阵列指向期望的方向。再乘以加权系数Wi(k),进行加权同相相加,使得波束形成器的输出得到最大输出。
(2)特征提取,通过模拟和数字处理,采用MFCC特征提取方式从注册用户语音中提取表征注册用户特征的语音信息;
(3)模型训练,估计特征参数分布,建立注册用户语音模型。模型训练方法选择最小分类错误准则即MCE准则进行区分训练。
语音开门依次包括如下步骤:
(1)采集开门语音信息,通过麦克风阵列技术对开门语音进行采集,并且采用固定波束形成算法通过延时控制来补偿声源延时;
(2)特征提取,通过模拟和数字处理技术,采用MFCC特征提取方式从开门语音中选择和提取表征开门用户特征的语音信息;
(3)模型训练,估计特征参数分布,建立开门用户语音模型,模型训练方法选择最小分类错误准则即MCE准则进行区分训练;
逻辑决策是比对语音注册和语音开门,判断是否开门,依次包括如下步骤:
(1)模式匹配,将注册用户语音模型与开门用户语音模型进行匹配,计算二者的对数似然比,得出对数似然比得分;
(2)进行决策,对匹配的得分进行判决,确定发出开门语音的人是否为语音注册用户,与语音注册匹配达到设定阈值得分,投放门开启,否则投放门不会打开。
给逻辑决策判决设定一个阈值分数,通过得出的对数似然比得分与设定的阈值分数进行比较,达到预设获高于预设分数,则逻辑决策判决开门语音属于注册人,控制器控制开门机构31打开投放门3;否则开门机构31不动作即投放门3不打开。
上述采集语音注册和语音开门信息,必须有采集语音的硬件设备,因为垃圾箱会有异味,用户不会近距离靠近麦克风进行语音注册和语音开门,所以需要有远距离采集注册语音的硬件设备,因此采用麦克风阵列技术采集语音信息。采样距离变远了,在目标语音的实际拾取过程中,不可避免受到外界环境噪声和其他说话人的干扰,这些干扰共同作用,严重影响了声纹语音的采集,利用麦克风阵列技术尤其是多麦阵列能够充分利用语音信号的空时信息,具有灵活的波束控制,较高的空间分辨率、高的信号增益和较强的抗干扰能力等特点。麦克风阵列如图4所示。用户语音注册和语音开门发声后,固定波束形成算法通过延时控制来补偿从声源到每个麦克风的延时,对每个麦克风接收到的信号进行延时补偿,然后使麦克风阵列波束指向有最大输出功率的方向,以此解决不用靠近麦克风,又能良好采样声音的特定的垃圾箱声纹识别场景需求。延迟求和-波束形成输出,其中,xi(t)为麦克风接收到的信号,权系数为wi(k),k为麦克风的数目,τi为时延估计得到的时延,波束形成如图5所示。
上述MFCC特征提取流程如图6所示。首先将注册语音和语音开门的语音进行前端处理,将声音转换为模拟语音信号进行采样,并对其振幅值进行量化编码,从而转化为数字信号,模拟语音信号经采样量化获得语音信号的波形。其次,由于唇端辐射导致语音信号的高频能量损耗,为了去除口唇辐射的影响,将经采样量化后得到的语音信号波形进行预加重处理,增加语音信号的高频分辨率,加强语音高频信号能量,使其适用于统一的分析处理。基于语音的短时平稳特性,即短时段的语音信号对应的声道形状、激励性质基本不会发生改变,将经预加重处理的波形再进行加汉明窗处理,即采用汉明窗对语音进行重叠分帧处理,使语音特征更加明显、清晰,易于观察,最终输出语音帧序列。对加汉明窗分帧后获得的语音帧序列进行时域和频域分析,并采用相应的特征参数描述。MFCC特征参数是一种听觉感知频域倒普参数,该参数依据人耳对声音频率高低的非线性心里感觉构造语音短时幅度谱特征。对输入的语音帧信号作离散傅里叶变换。计算频谱幅度的平方,得到能量谱。将能量谱通过Mel三角滤波器组。计算每个滤波器组输出的对数能量。经离散余弦变换得到MFCC参数和特征向量序列。
上述模型训练是区分“目标”和“冒认者”的训练,由于声纹密码的任务是对两类最小错误进行分类,实现短句上说话人确认错误的最小化。因此选择最小分类错误准则即MCE准则进行区分训练。通过对训练集合总体平均错误率的平滑近似策略,实现最小化识别(分类)错误率的目的。在描述相同密码文本说话人语音特征分布空间中,相同说话人对应的特征向量分布集中,不同说话人对应的特征向量分布相对分散,距离具有区分“目标”和“冒认”的能力。因此设计一种表征距离度量的新特征用以表示区分性训练中正反例样本。如果直接将测试语音Y相对注册语音X的距离D(X,Y)设定为Y的新特征,则将分别产生目标语音新特征和冒认语音新特征,记作Ztar和Zim,此时与原始声学特征不同,所有注册者对应的Ztar和Zim可以被组合成统一的正例集合P和反例集合N。
训练过程首先将用户模型分成非重叠和共性重叠部分,利用用户语音数据集建立GMM模型(高斯混合模型);根据相似度计算和GMM模型确定特征向量的类别,如果两个竞争的说话人模型有公共重叠部分,则其相应特征向量就被归于此部分;对于所有的模型进行SVM支持向量机训练,通过计算其在所有说话人模型上的相似度,若对应最大相似度和最小相似度之比小于一个阈值,则归为共性重叠部分,否则归为非重叠部分。基于重新分类过的特征向量,对每个说话人重新建立模型,即产生了一个共性重叠模型和各自说话人的非重叠模型。假设有S个说话人,则训练过程算法实现过程如下:(1)xj第j个训练输入向量,j=1,...,N,N为训练特征向量个数。p=(maxPr(xj|Mi)/minPr(xj|Mk)),i=1,...,S,K=1,...,S,p为向量在说话人模型上的最大相似度与最小相似度之比。如果p小于一定的阈值T,则该向量Xj→Q,属于共性重叠部分向量。否则Xj→P,属于说话人非重叠部分向量集。
使用时,用户朝着声纹识别开门系统说出开门密码,对数似然比得分达到设定阈值,声纹识别开门系统将开门信号发送给控制器,控制器控制开门机构31打开投放门3,达不到设定阈值投放门不打开。投放门3打开后触摸屏2上显示用户的身份信息。用户将物品投入投放门3,物品进入下料管7,并被挡板10挡在下料管7内。感应器9识别到下料管内有物品,感应器9给控制器6信号,控制器6控制摄像头8开始拍摄,摄像头8采集物品的图像特征,与数据库比对确认物品是不是瓶子,不是瓶子,驱动部件11通过挡板10带动下料管7底部移动至第二箱体14上方,然后挡板10移动实现下料管7底部打开,物品落入第二箱体14内,触摸屏2显示投入物品不是瓶子,此次投放没有积分或者按其它垃圾的设置给予积分,积分形式可以预先设置。
与服务器比对确认物品是瓶子,驱动部件11通过挡板10带动下料管7底部移动至第一箱体13上方,然后挡板10移动实现下料管7底部打开,物品落入第一箱体13内,按感应器9和摄像头8采集的图像特征确定瓶子的种类,给予用户相应奖励的分数,在触摸屏2上显示,上述信息通过控制器6传给服务器平台保存,上述信息可以通过打印机4可以打印。
本专利的瓶子智能回收机,首先通过声纹识别开门系统识别用户是否注册,即是否有资格使用瓶子智能回收机,然后识别用户投入的物品是否为瓶子并投入不同的箱体中,同时记录用户的身份信息和投放信息,以此给用户积分奖励,积分奖励信息通过控制器传给至服务器并进行保持,积分后续可以兑换物品,例如在垃圾袋发放机上兑换垃圾袋或其它日用品等,通过积分鼓励人们将瓶子投入专门的瓶子回收机上,提高瓶子的回收率。
上述实施方式仅为本专利较佳的方式,上述所有信息均可保存在控制器上,也可以由控制器传至服务器进行保持;例如感应器9不安装在下料管上而是安装在下料管的外侧,只要是用于监测下料管内是否有物品的方式均可。摄像头8安装在下料管下方等。
实施例2
如图1和图3所示的瓶子智能回收机,控制下料管7底部开口朝向第一箱体13或第二箱体14的自动开关与实施例1不同,其它均与实施例1相同。
具体的本专利的自动开关包括挡板10和驱动部件11,挡板10处于下料管7底部,挡板10下方设有第一导向机构15和第二导向机构16,第一导向机构15底部朝向第一箱体13,第二导向机构16底部朝向第二箱体14。使用时挡板10不仅起到控制下料管7开或关的功能,同时按挡板10开口位置的不同还起到控制下料管7内物品流向的作用,即物品最终通过第一导向机构15放入第一箱体或通过第二导向机构16第二箱体内。
Claims (10)
1.瓶子智能回收机,包括壳体,壳体上设有投放门和声纹识别开门系统,用户通过声纹识别的方法使用声纹识别开门系统打开投放门,壳体内设有控制器、盛放瓶子的第一箱体和盛放其它垃圾的第二箱体;其特征在于壳体内设有瓶子识别装置,瓶子识别装置包括下料管及与下料管位置匹配的感应器和摄像头,摄像头朝向下料管;下料管顶部连接投放门,下料管底部处于第一箱体和第二箱体上方,下料管底部设有控制下料管底部是否打开的自动开关,通过自动开关控制下料管底部开口朝向第一箱体或第二箱体;声纹识别开门系统、感应器、摄像头和自动开关均连接控制器;所述声纹识别的方法依次包括语音注册、语音开门和逻辑决策,语音注册依次包括如下步骤:
(1)采集注册语音,通过麦克风阵列技术对注册语音进行采集,并且采用固定波束形成算法通过延时控制来补偿声源延时;
(2)特征提取,通过模拟和数字处理,采用MFCC特征提取方式从注册语音中提取表征注册用户特征的语音信息;
(3)模型训练,建立注册用户语音模型,模型训练方法选择最小分类错误准则即MCE准则进行区分训练;
所述语音开门依次包括如下步骤:
(1)采集开门语音,通过麦克风阵列技术对开门语音进行采集,并且采用固定波束形成算法通过延时控制来补偿声源延时;
(2)特征提取,通过模拟和数字处理技术,采用MFCC特征提取方式从开门语音中选择和提取表征开门用户特征的语音信息;
(3)模型训练,建立开门用户语音模型,模型训练方法选择最小分类错误准则即MCE准则进行区分训练;
所述逻辑决策依次包括模式匹配和进行决策步骤,模式匹配是将注册用户语音模型与开门用户语音模型进行匹配,计算二者的对数似然比,得出对数似然比得分;进行决策是计算匹配得分,达到设定阈值,声纹识别开门系统将开门信号发送给控制器,控制器控制投放门打开;达不到设定阈值投放门不打开。
2.根据权利要求1所述的瓶子智能回收机,其特征在于自动开关包括挡板和驱动部件,挡板处于下料管底部,驱动部件带动挡板移动实现下料管底部是否打开,驱动部件连接控制器。
3.根据权利要求2所述的瓶子智能回收机,其特征在于下料管底部连在挡板上,通过挡板带动下料管底部开口朝向第一箱体或第二箱体;感应器安装在下料管上,下料管截面呈C形,摄像头朝向C形的下料管的开口端。
4.根据权利要求2所述的瓶子智能回收机,其特征在于挡板下方设有第一导向机构和第二导向机构,第一导向机构底部朝向第一箱体,第二导向机构底部朝向第二箱体;感应器安装在下料管上,下料管截面呈C形,摄像头朝向C形的下料管的开口端。
5.根据权利要求1或2或3或4所述的瓶子智能回收机,其特征在于壳体上还设有二维码、扫描器、触摸屏和无线发射装置,控制器通过无线发射装置连接服务器,服务器或控制器通过用户扫描二维码或扫描器扫用户信息的方式确认用户信息;触摸屏与控制器相连,触摸屏用于显示用户信息、投入垃圾信息和输入开门密码。
6.根据权利要求1或2或3或4所述的瓶子智能回收机,其特征在于壳体上设有打印机,打印机连接控制器;壳体外侧设有投放图像采集装置;摄像头旁设置补光灯;第一箱体上部设有第一溢满感应器,其它箱体上部设有第二溢满感应器,第一溢满感应器和第二溢满感应器均连接控制器。
7.根据权利要求1所述的瓶子智能回收机,其特征在于通过多个麦克风阵列技术对注册语音和开门语音信息进行采集;语音注册中的MFCC特征提取方式是指将采集的注册语音转换为模拟语音信号,对语音信号进行采样量化,量化后进行预加重处理、加汉明窗处理,最后输出语音帧序列;语音开门中的MFCC特征提取方式是指将采集的开门语音转换为模拟语音信号,对语音信号进行采样量化,量化后进行预加重处理、加汉明窗处理,最后输出语音帧序列。
8.根据权利要求1所述的瓶子智能回收机,其特征在于固定波束形成算法其中,xi(t)为麦克风接收到的信号,权系数为wi(k),k为麦克风的数目,τi为时延估计得到的时延。
9.根据权利要求1所述的瓶子智能回收机,其特征在于语音注册中的模型训练是先将注册用户模型分成非重叠和共性重叠部分,利用注册用户语音数据集建立注册用户语音GMM模型;语音开门中的模型训练是先将开门用户模型分成非重叠和共性重叠部分,利用开门语音数据集建立开门用户语音GMM模型。
10.根据权利要求9所述的瓶子智能回收机,其特征在于对于所有的模型进行SVM支持向量机训练,通过计算其在所有说话人模型上的相似度,即对应最大相似度和最小相似度之比小于一个阈值,则归为共性重叠部分,否则归为非重叠部分;注册用户语音GMM模型和开门用户语音GMM模型的训练过程算法是:p=(maxPr(xj|Mi)/minPr(xj|Mk)),i=1,...,S,K=1,...,S,,p为向量在说话人模型上的最大相似度与最小相似度之比,S为说话人个数,xj第j个训练输入向量,j=1,...,N,N为训练特征向量个数,p小于阈值T,则该向量Xj→Q,属于共性重叠部分向量;p大于阈值T,则该向量Xj→P,属于说话人非重叠部分向量集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710589325.1A CN107195077B (zh) | 2017-07-19 | 2017-07-19 | 瓶子智能回收机 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710589325.1A CN107195077B (zh) | 2017-07-19 | 2017-07-19 | 瓶子智能回收机 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107195077A true CN107195077A (zh) | 2017-09-22 |
CN107195077B CN107195077B (zh) | 2020-09-18 |
Family
ID=59883732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710589325.1A Active CN107195077B (zh) | 2017-07-19 | 2017-07-19 | 瓶子智能回收机 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107195077B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107886122A (zh) * | 2017-11-06 | 2018-04-06 | 郑州云海信息技术有限公司 | 一种基于云管理平台的人工智能废品回收系统及方法 |
CN108163418A (zh) * | 2017-12-27 | 2018-06-15 | 贵州大学 | 一种基于互联网的公益性废物回收箱 |
CN109332192A (zh) * | 2018-08-03 | 2019-02-15 | 小黄狗环保科技有限公司 | 一种用于易拉罐和饮料瓶分类的图像识别方法 |
CN109399007A (zh) * | 2018-11-08 | 2019-03-01 | 安徽省儿童医院(安徽省新华医院、安徽省儿科医学研究所) | 一种自动计数的静脉输液后空输液瓶收集器 |
CN109658589A (zh) * | 2018-12-11 | 2019-04-19 | 小黄狗环保科技有限公司 | 一种智能垃圾分类回收机投递回收流程 |
CN109801438A (zh) * | 2019-01-18 | 2019-05-24 | 创新奇智(南京)科技有限公司 | 一种基于人脸识别和语音交互的智能售货柜 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2261096A (en) * | 1991-10-16 | 1993-05-05 | Prior Consulting Limited | Waste receptacle |
US20100044481A1 (en) * | 2008-08-25 | 2010-02-25 | Charles Eric Green | Plastic autogenetic recycle machine (green machine) |
CN102820033A (zh) * | 2012-08-17 | 2012-12-12 | 南京大学 | 一种声纹识别方法 |
CN103247197A (zh) * | 2013-03-29 | 2013-08-14 | 上海众实科技发展有限公司 | 一种基于声纹识别的用户在线学习监测方法 |
CN205293813U (zh) * | 2015-12-28 | 2016-06-08 | 浙江联运知慧科技有限公司 | 一种自动开门的智能分类回收垃圾箱 |
CN106115106A (zh) * | 2016-07-05 | 2016-11-16 | 齐鲁工业大学 | 一种智能垃圾分类分选装置 |
CN106251874A (zh) * | 2016-07-27 | 2016-12-21 | 深圳市鹰硕音频科技有限公司 | 一种语音门禁和安静环境监控方法及系统 |
CN205916602U (zh) * | 2016-08-17 | 2017-02-01 | 肖名鸣 | 一种自动分类垃圾桶 |
CN106448684A (zh) * | 2016-11-16 | 2017-02-22 | 北京大学深圳研究生院 | 基于深度置信网络特征矢量的信道鲁棒声纹识别系统 |
-
2017
- 2017-07-19 CN CN201710589325.1A patent/CN107195077B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2261096A (en) * | 1991-10-16 | 1993-05-05 | Prior Consulting Limited | Waste receptacle |
US20100044481A1 (en) * | 2008-08-25 | 2010-02-25 | Charles Eric Green | Plastic autogenetic recycle machine (green machine) |
CN102820033A (zh) * | 2012-08-17 | 2012-12-12 | 南京大学 | 一种声纹识别方法 |
CN103247197A (zh) * | 2013-03-29 | 2013-08-14 | 上海众实科技发展有限公司 | 一种基于声纹识别的用户在线学习监测方法 |
CN205293813U (zh) * | 2015-12-28 | 2016-06-08 | 浙江联运知慧科技有限公司 | 一种自动开门的智能分类回收垃圾箱 |
CN106115106A (zh) * | 2016-07-05 | 2016-11-16 | 齐鲁工业大学 | 一种智能垃圾分类分选装置 |
CN106251874A (zh) * | 2016-07-27 | 2016-12-21 | 深圳市鹰硕音频科技有限公司 | 一种语音门禁和安静环境监控方法及系统 |
CN205916602U (zh) * | 2016-08-17 | 2017-02-01 | 肖名鸣 | 一种自动分类垃圾桶 |
CN106448684A (zh) * | 2016-11-16 | 2017-02-22 | 北京大学深圳研究生院 | 基于深度置信网络特征矢量的信道鲁棒声纹识别系统 |
Non-Patent Citations (3)
Title |
---|
于娴 等: ""基于GMM 模型的声纹识别模式匹配研究"", 《通信技术》 * |
王华鹏: ""声纹识别特征MFCC的提取方法研究"", 《中国人民公安大学学报(自然科学版)》 * |
肖星星: ""短时语音说话人识别方法及应用"", 《中国优秀硕士学位论文全文数据库,信息科技辑》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107886122A (zh) * | 2017-11-06 | 2018-04-06 | 郑州云海信息技术有限公司 | 一种基于云管理平台的人工智能废品回收系统及方法 |
CN108163418A (zh) * | 2017-12-27 | 2018-06-15 | 贵州大学 | 一种基于互联网的公益性废物回收箱 |
CN109332192A (zh) * | 2018-08-03 | 2019-02-15 | 小黄狗环保科技有限公司 | 一种用于易拉罐和饮料瓶分类的图像识别方法 |
CN109399007A (zh) * | 2018-11-08 | 2019-03-01 | 安徽省儿童医院(安徽省新华医院、安徽省儿科医学研究所) | 一种自动计数的静脉输液后空输液瓶收集器 |
CN109399007B (zh) * | 2018-11-08 | 2021-04-23 | 安徽省儿童医院(安徽省新华医院、安徽省儿科医学研究所) | 一种自动计数的静脉输液后空输液瓶收集器 |
CN109658589A (zh) * | 2018-12-11 | 2019-04-19 | 小黄狗环保科技有限公司 | 一种智能垃圾分类回收机投递回收流程 |
CN109801438A (zh) * | 2019-01-18 | 2019-05-24 | 创新奇智(南京)科技有限公司 | 一种基于人脸识别和语音交互的智能售货柜 |
Also Published As
Publication number | Publication date |
---|---|
CN107195077B (zh) | 2020-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107195077A (zh) | 瓶子智能回收机 | |
CN107416387A (zh) | 智能分类垃圾箱 | |
CN106251874B (zh) | 一种语音门禁和安静环境监控方法及系统 | |
CN108305615A (zh) | 一种对象识别方法及其设备、存储介质、终端 | |
CN107808659A (zh) | 智能语音信号模式识别系统装置 | |
TWI297486B (en) | Intelligent classification of sound signals with applicaation and method | |
CN104751321B (zh) | 一种嵌入特定人群识别的公交智能支付系统及其实现方法 | |
CN109684979A (zh) | 一种基于图像识别技术的垃圾分类方法、装置及电子设备 | |
CN102324232A (zh) | 基于高斯混合模型的声纹识别方法及系统 | |
CN105976809A (zh) | 基于语音和面部表情的双模态情感融合的识别方法及系统 | |
CN110697273A (zh) | 一种基于迭代学习控制的生活垃圾智能识别与自动分类系统及方法 | |
CN115438708A (zh) | 一种基于卷积神经网络和多模态融合的分类识别方法 | |
WO2021012761A1 (zh) | 垃圾分类方法、装置、设备及存储介质 | |
CN206921189U (zh) | 瓶子智能回收机 | |
CN110880328B (zh) | 到站提醒方法、装置、终端及存储介质 | |
CN100356446C (zh) | 近端讲话人检测方法 | |
CN107248410A (zh) | 声纹识别垃圾箱开门的方法 | |
CN108182418A (zh) | 一种基于多维声波特征的键击识别方法 | |
CN108845324A (zh) | 障碍物识别方法、装置、设备及存储介质 | |
WO2021115232A1 (zh) | 到站提醒方法、装置、终端及存储介质 | |
CN108596087A (zh) | 一种基于双网络结果的驾驶疲劳程度检测回归模型 | |
CN111930336A (zh) | 音频设备的音量调节方法、设备及存储介质 | |
CN107221324A (zh) | 语音处理方法及装置 | |
CN116524612B (zh) | 一种基于rPPG的人脸活体检测系统及方法 | |
CN117465862A (zh) | 智能垃圾桶管理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |