CN105609110A - 一种应用在网络设备中的语音识别方法及系统 - Google Patents
一种应用在网络设备中的语音识别方法及系统 Download PDFInfo
- Publication number
- CN105609110A CN105609110A CN201610048589.1A CN201610048589A CN105609110A CN 105609110 A CN105609110 A CN 105609110A CN 201610048589 A CN201610048589 A CN 201610048589A CN 105609110 A CN105609110 A CN 105609110A
- Authority
- CN
- China
- Prior art keywords
- speech data
- default
- data
- monitoring target
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012544 monitoring process Methods 0.000 claims abstract description 158
- 238000004458 analytical method Methods 0.000 claims abstract description 40
- 241001465754 Metazoa Species 0.000 claims description 77
- 230000003595 spectral effect Effects 0.000 claims description 24
- 239000011159 matrix material Substances 0.000 claims description 23
- 238000007405 data analysis Methods 0.000 claims description 19
- 230000008901 benefit Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 17
- 238000010230 functional analysis Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 241000208340 Araliaceae Species 0.000 description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 235000008434 ginseng Nutrition 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000009776 industrial production Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0861—Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种应用在网络设备中的语音识别方法,包括:步骤S10获取监测人员所选择的语音采集方式;步骤S20根据已获取的语音采集方式,在该语音采集方式下采集监测对象所发出的语音数据;步骤S30将已采集的语音数据与由预设对象所发出的预设语音数据进行比对分析;步骤S40识别发出该语音数据的监测对象与所述预设对象是否相同。本发明根据不同的监测对象,设置不同的语音采集方式,在监测对象所对应的语音采集方式下采集该监测对象的语音数据,对监测到的语音数据与预设语音数据进行比对分析,从而实现识别出监测对象的真实身份,以及安全访问网络设备的目的。此外,本发明还具有安全性高、灵活性强、应用广泛等优点。
Description
技术领域
本发明涉及一种应用在网络设备中的语音识别方法及系统。
背景技术
随着网络技术的飞速发展,由于网络具有远程传输数据、传输速度快等优点,而被广泛应用于人类日常生活、动物保护、工业生产中。用于承载网络技术的载体为网络设备,网络设备包括网关、智能终端(手机、平板电脑等)、机顶盒、路由器等。其中,安全访问该网络设备以及识别网络设备访问者至关重要。
目前,在日常生活中,通常利用账户密码及效验码进行网络设备的安全访问以及识别访问者的身份。然而,这种识别方式存在安全性低、无法识别访问者的真实身份等缺陷。另外,这种识别方式的适用性受到局限,由于无法识别访问者的真实身份,而不能用于监测动物。因此,本领域亟需实现安全性高、适用性更广的识别方式。
发明内容
本发明提供的技术方案如下:
本发明提供的一种应用在网络设备中的语音识别方法,包括:步骤S10获取监测人员所选择的语音采集方式;步骤S20根据已获取的语音采集方式,在该语音采集方式下采集监测对象所发出的语音数据;步骤S30将已采集的语音数据与由预设对象所发出的预设语音数据进行比对分析;步骤S40识别发出该语音数据的监测对象与所述预设对象是否相同。
进一步,本语音识别方法还包括:步骤S41识别发出该语音数据的监测对象当前所处工作状态。
进一步,所述步骤S10获取监测人员所选择的语音采集方式是指:人类语音采集方式、动物语音采集方式和设备语音采集方式。
进一步,所述步骤S30还包括:步骤S31利用频谱矩阵分析计算出所述语音数据的特征值;步骤S32判断该语音数据的特征值是否达到预设阀值,所述预设阀值是指:所述预设语音数据的特征值的预设百分比;所述步骤S40或步骤S41还包括:步骤S42所述语音数据的特征值已达到预设阀值,则识别发出该语音数据的监测对象为预设对象或该监测对象当前所处工作状态后,跳转至步骤S44;步骤S43所述语音数据的特征值未达到预设阀值,则不能识别发出该语音数据的监测对象或该监测对象当前所处工作状态;步骤S44更新该监测对象的语音数据时间戳和/或记录该监测对象的语音数据。
进一步,本语音识别方法还包括:步骤S50当步骤S43中不能识别发出该语音数据的监测对象时,传输所述语音数据至云端;步骤S51在云端中查找是否存储有与该监测对象相关的历史数据;步骤S52若云端中存储有该监测对象相关的历史数据,结合该监测对象相关的历史数据,分析发出该语音数据的监测对象的相关信息;步骤S53若云端中没有存储该监测对象相关的历史数据,记录该监测对象所发出的语音数据。
进一步,本语音识别方法还包括:步骤S60根据识别结果、在云端中的分析的相关信息及记录结果,反馈发送识别结果、相关信息及记录结果至所述监测人员所持智能终端上。
进一步,在所述步骤S10之前还包括:步骤S01录制由所述预设对象发出的预设语音数据,以及录制由所述预设对象处于不同工作状态所发出的预设语音数据;步骤S02利用频谱矩阵分析计算出该预设语音数据的特征值,并保存该预设语音数据及该预设语音数据的特征值。
本发明提供的一种应用在网络设备中的语音识别系统,包括:获取模块,该获取模块获取监测人员所选择的语音采集方式;采集模块,该采集模块接收所述获取模块输出的语音采集方式,在该语音采集方式下采集监测对象所发出的语音数据;数据分析模块,该数据分析模块接收所述采集模块输出的语音数据,将已采集的语音数据与由预设对象所发出的预设语音数据进行比对分析;识别模块,该识别模块接收所述数据分析模块输出的分析结果,识别发出该语音数据的监测对象与所述预设对象是否相同。
进一步,本语音识别系统,还包括:传输模块,该传输模块接收所述识别模块输出的不能识别发出该语音数据的监测对象的识别结果,传输所述语音数据至云端;查找模块,该查找模块在云端中查找是否存储有与该监测对象相关的历史数据;信息分析模块,该信息分析模块接收所述查找模块输出的云端中存储有该监测对象相关的历史数据,结合该监测对象相关的历史数据,分析发出该语音数据的监测对象的相关信息;记录模块,该记录模块接收所述查找模块输出的云端中没有存储该监测对象相关的历史数据,记录该监测对象所发出的语音数据。
进一步,本语音识别系统还包括:反馈发送模块,该反馈发送模块接收所述识别模块输出的识别结果、所述信息分析模块输出的相关信息及所述记录模块输出的记录结果,反馈发送识别结果、相关信息及记录结果至所述监测人员所持智能终端上。
与现有技术相比,本发明提供的语音识别方法,根据不同的监测对象,设置不同的语音采集方式,在监测对象所对应的语音采集方式下采集该监测对象的语音数据,对监测到的语音数据与预设语音数据进行比对分析,从而实现识别出监测对象的真实身份,以及安全访问网络设备的目的。此外,本发明还具有安全性高、灵活性强、应用广泛等优点。
本发明应用在日常生活中时,可识别被监测用户是否为预设用户,从而保障用户安全访问网络设备;若是未知用户,可结合历史数据,分析出相关信息,并发送相关提醒信息给监测人员。
本发明应用在动物保护中,可识别被监测动物是否为预设动物,从而得到预设动物相关的监控信息;若不是预设动物,可结合历史数据,分析出该监测动物的物种,滤除该物种动物的监控信息。
本发明应用在工业生产中,可识别被监测设备当前所处工作状态,从而得到该设备生产进度,对设备的工作过程进行监控,提高了管控效率,降低了设备的制造成本。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种应用在网络设备中的语音识别方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种语音识别方法的流程示意图;
图2是本发明另一种语音识别方法的流程示意图;
图3是本发明再一种语音识别方法的流程示意图;
图4是本发明又一种语音识别方法的流程示意图;
图5是本发明又又一种语音识别方法的流程示意图;
图6是本发明中一种语音识别系统的组成结构示意图。
附图标号说明:
10、获取模块,20、采集模块,30、数据分析模块,40、识别模块,
50、传输模块,60、查找模块,70、信息分析模块,80、记录模块,
90、反馈发送模块。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
图1是本发明一种应用在网络设备中的语音识别方法的流程示意图。如图1所示,根据本发明的一个实施例,一种应用在网络设备中的语音识别方法,包括:步骤S10获取监测人员所选择的语音采集方式;所述语音采集方式根据检测对象的区别分为人类语音采集方式、动物语音采集方式和设备语音采集方式;由于人类、动物、设备所发出的声音的音频大小不同,所以采用不同的语音采集方式;步骤S20根据已获取的语音采集方式,在该语音采集方式下采集监测对象所发出的语音数据;步骤S30将已采集的语音数据与由预设对象所发出的预设语音数据进行比对分析;该对比分析是采集到的语音数据与预设语音数据之间的相似度分析;步骤S40识别发出该语音数据的监测对象与所述预设对象是否相同;若是监测对象为设备,优选的,还包括步骤S41识别发出该语音数据的监测对象当前所处工作状态。
图2是本发明另一种应用在网络设备中的语音识别方法的流程示意图。如图2所示,根据本发明的另一个实施例,一种应用在网络设备中的语音识别方法,包括:步骤S10获取监测人员所选择的语音采集方式;所述语音采集方式根据检测对象的区别分为人类语音采集方式、动物语音采集方式和设备语音采集方式;由于人类、动物、设备所发出的声音的音频大小不同,所以采用不同的语音采集方式;步骤S20根据已获取的语音采集方式,在该语音采集方式下采集监测对象所发出的语音数据;步骤S31利用频谱矩阵分析计算出所述语音数据的特征值,还可以是利用傅里叶函数或其他函数分析计算出语音数据的参考值;步骤S32判断该语音数据的特征值(参考值)是否达到预设阀值,所述预设阀值是指:所述预设语音数据的特征值(参考值)的预设百分比;也即语音数据的特征值(参考值)与预设语音数据的特征值(参考值)的相似百分比是否达到预设百分比;步骤S42所述语音数据的特征值(参考值)已达到预设阀值,则识别发出该语音数据的监测对象为预设对象,或识别发出该语音数据的监测对象当前所处工作状态后,跳转至步骤S44;步骤S43所述语音数据的特征值(参考值)未达到预设阀值,则不能识别发出该语音数据的监测对象,或不能识别发出该语音数据的监测对象当前所处工作状态;步骤S44更新该监测对象的语音数据时间戳和/或记录该监测对象的语音数据;其中,监测对象为设备时,由于预设设备在每个工作状态所发出的状态语音不同,将获取的语音数据与该预设设备在每个工作阶段所发出的预设状态语音数据进行比对分析后,判断该监测设备当前所处工作状态。
图3是本发明再一种应用在网络设备中的语音识别方法的流程示意图。如图3所示,根据本发明的再一个实施例,一种应用在网络设备中的语音识别方法,包括:优选的,还包括步骤S01录制由所述预设对象(预设用户、预设动物)发出的预设语音数据(预设用户语音数据、预设动物语音数据),以及录制由所述预设对象(预设设备)处于不同工作状态所发出的预设语音数据(预设设备状态语音数据);
优选的,还包括步骤S02利用频谱矩阵(傅里叶函数或其他函数)分析计算出该预设语音数据(预设用户语音数据、预设动物语音数据、预设设备状态语音数据)的特征值(参考值),并保存该预设语音数据(预设用户语音数据、预设动物语音数据、预设设备状态语音数据)及该预设语音数据的特征值(参考值);
步骤S10获取监测人员所选择的语音采集方式;所述语音采集方式根据检测对象的区别分为人类语音采集方式、动物语音采集方式和设备语音采集方式;由于人类、动物、设备所发出的声音的音频大小不同,所以采用不同的语音采集方式;
步骤S20根据已获取的语音采集方式为人类语音采集方式,在该语音采集方式下采集监测对象(被监测用户)所发出的语音数据;
步骤S31利用频谱矩阵分析计算出所述语音数据的特征值,还可以是利用傅里叶函数或其他函数分析计算出语音数据的参考值;
步骤S32判断该语音数据的特征值(参考值)是否达到预设阀值,所述预设阀值是预设语音数据(预设用户语音数据)的特征值(参考值)的预设百分比(70%、80%、90%),也即:语音数据的特征值(参考值)与预设语音数据(预设用户语音数据)的特征值(参考值)的相似度是否达到70%,语音数据的特征值(参考值)与预设语音数据(预设用户语音数据)的特征值(参考值)的相似度是否达到80%、语音数据的特征值(参考值)与预设语音数据(预设用户语音数据)的特征值(参考值)的相似度是否达到90%等;
步骤S42所述语音数据的特征值(参考值)已达到预设阀值,则识别发出该语音数据的监测对象(被监测用户)为预设对象(预设用户)后,跳转至步骤S44;
步骤S43所述语音数据的特征值(参考值)未达到预设阀值,则不能识别发出该语音数据的监测对象(被监测用户),该监测对象(被监测用户)为未知用户;
步骤S44更新该监测对象的语音数据时间戳和/或记录该监测对象的语音数据,即记录该监测对象(被监测用户)即预设用户的关于访问时间、访问次数等访问信息;
优选的,还包括步骤S50当步骤S43中不能识别发出该语音数据的监测对象(被监测用户)时,传输所述语音数据至云端;
优选的,还包括步骤S51在云端中查找是否存储有与该监测对象(被监测用户)相关的历史数据;
优选的,还包括步骤S52若云端中存储有该监测对象(被监测用户)相关的历史数据,结合该监测对象(被监测用户)相关的历史数据,分析发出该语音数据的监测对象的相关信息;该相关信息是指:该被监测用户的访问过多少次,或者结合其他信息推定该被监测用户可能是谁;
优选的,还包括步骤S53若云端中没有存储该监测对象(被监测用户)相关的历史数据,记录该监测对象(被监测用户)所发出的语音数据;
优选的,还包括步骤S60根据识别结果、在云端中的分析的相关信息及记录结果,反馈发送识别结果、相关信息及记录结果至所述监测人员所持智能终端上;即:反馈发送预设用户正在访问的识别结果、及预设用户访问次数及每次访问的时间或者未知用户访问的记录结果至所述监测人员所持智能终端上。
图4是本发明又一种语音识别方法的流程示意图。如图4所示,根据本发明的又一个实施例,一种应用在网络设备中的语音识别方法,包括:
优选的,还包括步骤S01录制由所述预设对象(预设用户、预设动物)发出的预设语音数据(预设用户语音数据、预设动物语音数据),以及录制由所述预设对象(预设设备)处于不同工作状态所发出的预设语音数据(预设设备状态语音数据);
优选的,还包括步骤S02利用频谱矩阵(傅里叶函数或其他函数)分析计算出该预设语音数据(预设用户语音数据、预设动物语音数据、预设设备状态语音数据)的特征值(参考值),并保存该预设语音数据(预设用户语音数据、预设动物语音数据、预设设备状态语音数据)及该预设语音数据的特征值(参考值);
步骤S10获取监测人员所选择的语音采集方式;所述语音采集方式根据检测对象的区别分为人类语音采集方式、动物语音采集方式和设备语音采集方式;由于人类、动物、设备所发出的声音的音频大小不同,所以采用不同的语音采集方式;
步骤S20根据已获取的语音采集方式为动物语音采集方式,在该语音采集方式下采集监测对象(被监测动物)所发出的语音数据;
步骤S31利用频谱矩阵分析计算出所述语音数据的特征值,还可以是利用傅里叶函数或其他函数分析计算出语音数据的参考值;
步骤S32判断该语音数据的特征值(参考值)是否达到预设阀值,所述预设阀值是预设语音数据(预设动物语音数据)的特征值(参考值)的预设百分比(70%、80%、90%),例如:语音数据的特征值(参考值)与预设语音数据(预设动物语音数据)的特征值(参考值)的相似度是否达到70%,语音数据的特征值(参考值)与预设语音数据(预设动物语音数据)的特征值(参考值)的相似度是否达到80%,语音数据的特征值(参考值)与预设语音数据(预设动物语音数据)的特征值(参考值)的相似度是否达到90%等;
步骤S42所述语音数据的特征值(参考值)已达到预设阀值,则识别发出该语音数据的监测对象(被监测动物)为预设对象(预设动物)后,跳转至步骤S44;
步骤S43所述语音数据的特征值(参考值)未达到预设阀值,则不能识别发出该语音数据的监测对象(被监测动物),该监测对象(被监测动物)为未知动物;
步骤S44更新该监测对象的语音数据时间戳和/或记录该监测对象的语音数据,即记录该监测对象(被监测动物)即预设动物的关于访问时间的访问信息,还可结合GPS定位,得到被监测动物的踪迹;
步骤S50当步骤S43中不能识别发出该语音数据的监测对象(被监测动物)时,传输所述语音数据至云端;
步骤S51在云端中查找是否存储有与该监测对象(被监测动物)相关的历史数据;该历史数据还可以是通过其他方式获得,例如预先存储方式;
步骤S52若云端中存储有该监测对象(被监测动物)相关的历史数据,结合该监测对象(被监测动物)相关的历史数据,分析发出该语音数据的监测对象的相关信息;该相关信息是指:结合其他信息推定该被监测动物的物种;
步骤S53若云端中没有存储该监测对象(被监测动物)相关的历史数据,记录该监测对象(被监测动物)所发出的语音数据;
优选的,还包括步骤S60根据识别结果、在云端中的分析的相关信息及记录结果,反馈发送识别结果、相关信息及记录结果至所述监测人员所持智能终端上;即:反馈发送监测对象为预设动物的识别结果、及预设动物的访问时间或者推测物种动物访问的记录结果至所述监测人员所持智能终端上。
图5是本发明又又一种语音识别方法的流程示意图。如图5所示,根据本发明的又又一个实施例,一种应用在网络设备中的语音识别方法,包括:优选的,还包括步骤S01录制由所述预设对象(预设用户、预设动物)发出的预设语音数据(预设用户语音数据、预设动物语音数据),以及录制由所述预设对象(预设设备)处于不同工作状态所发出的预设语音数据(预设设备状态语音数据);
优选的,还包括步骤S02利用频谱矩阵(傅里叶函数或其他函数)分析计算出该预设语音数据(预设用户语音数据、预设动物语音数据、预设设备状态语音数据)的特征值,并保存该预设语音数据(预设用户语音数据、预设动物语音数据、预设设备状态语音数据)及该预设语音数据的特征值(参考值);
步骤S10获取监测人员所选择的语音采集方式;所述语音采集方式根据检测对象的区别分为人类语音采集方式、动物语音采集方式和设备语音采集方式;由于人类、动物、设备所发出的声音的音频大小不同,所以采用不同的语音采集方式;
步骤S20根据已获取的语音采集方式为设备语音采集方式,在该语音采集方式下采集监测对象(被监测设备)所发出的语音数据;
步骤S31利用频谱矩阵分析计算出所述语音数据的特征值,还可以是利用傅里叶函数或其他函数分析计算出语音数据的参考值;
步骤S32判断该语音数据的特征值(参考值)是否达到预设阀值,所述预设阀值是预设语音数据(预设设备状态语音数据)的特征值(参考值)的预设百分比(70%、80%、90%),例如:语音数据的特征值(参考值)与预设语音数据(预设设备状态语音数据)的特征值(参考值)的相似度是否达到70%,语音数据的特征值(参考值)与预设语音数据(预设设备状态语音数据)的特征值(参考值)的相似度是否达到80%,语音数据的特征值(参考值)与预设语音数据(预设设备状态语音数据)的特征值(参考值)的相似度是否达到90%等;
步骤S42所述语音数据的特征值(参考值)已达到预设阀值,则识别发出该语音数据的监测对象(被监测设备)当前所处工作状态后,跳转至步骤S44;
步骤S43所述语音数据的特征值(参考值)未达到预设阀值,则不能识别发出该语音数据的监测对象(被监测设备)当前所处工作状态;
步骤S44更新该监测对象的语音数据时间戳和/或记录该监测对象的语音数据,即记录该监测对象(被监测设备)即预设设备的访问信息;
步骤S60根据识别结果、在云端中的分析的相关信息及记录结果,反馈发送识别结果、相关信息及记录结果至所述监测人员所持智能终端上;即:反馈发送被监测设备当前所处工作状态的识别结果至所述监测人员所持智能终端上。
根据本发明的一个实施例,一种应用在网络设备中的语音识别方法的语音识别系统,包括:获取模块10,该获取模块10获取监测人员所选择的语音采集方式;所述语音采集方式根据检测对象的区别分为人类语音采集方式、动物语音采集方式和设备语音采集方式;由于人类、动物、设备所发出的声音的音频大小不同,所以采用不同的语音采集方式;采集模块20,该采集模块20接收所述获取模块10输出的语音采集方式,在该语音采集方式下采集监测对象所发出的语音数据;数据分析模块30,该数据分析模块30接收所述采集模块20输出的语音数据,将已采集的语音数据与由预设对象所发出的预设语音数据进行比对分析;识别模块40,该识别模块40接收所述数据分析模块30输出的分析结果,识别发出该语音数据的监测对象与所述预设对象是否相同。
图6是本发明中一种语音识别系统的组成结构示意图。如图6所示,根据本发明的另一个实施例,一种应用在网络设备中的语音识别方法的语音识别系统,包括:获取模块10,该获取模块10获取监测人员所选择的语音采集方式;所述语音采集方式根据检测对象的区别分为人类语音采集方式、动物语音采集方式和设备语音采集方式;由于人类、动物、设备所发出的声音的音频大小不同,所以采用不同的语音采集方式;采集模块20,该采集模块20接收所述获取模块10输出的语音采集方式,在该语音采集方式下采集监测对象所发出的语音数据;数据分析模块30,该数据分析模块30接收所述采集模块20输出的语音数据,将已采集的语音数据与由预设对象所发出的预设语音数据进行比对分析;识别模块40,该识别模块40接收所述数据分析模块30输出的分析结果,识别发出该语音数据的监测对象与所述预设对象是否相同;传输模块50,该传输模块50接收所述识别模块40输出的不能识别发出该语音数据的监测对象的识别结果,传输所述语音数据至云端;查找模块60,该查找模块60在云端中查找是否存储有与该监测对象相关的历史数据;信息分析模块70,该信息分析模块70接收所述查找模块60输出的云端中存储有该监测对象相关的历史数据,结合该监测对象相关的历史数据,分析发出该语音数据的监测对象的相关信息;记录模块80,该记录模块80接收所述查找模块60输出的云端中没有存储该监测对象相关的历史数据,记录该监测对象所发出的语音数据;优选的,还包括反馈发送模块90,该反馈发送模块90接收所述识别模块40输出的识别结果、所述信息分析模块70输出的相关信息及所述记录模块80输出的记录结果,反馈发送识别结果、相关信息及记录结果至所述监测人员所持智能终端上。
结合图1~图6,根据本发明的又一个实施例,一种应用在网络设备中的语音识别方法,包括:优选的,还包括采集模块20,录制由所述预设对象(预设用户、预设动物)发出的预设语音数据(预设用户语音数据、预设动物语音数据),以及录制由所述预设对象(预设设备)处于不同工作状态所发出的预设语音数据(预设设备状态语音数据);
优选的,还包括数据分析模块30,利用频谱矩阵(傅里叶函数或其他函数)分析计算出该预设语音数据(预设用户语音数据、预设动物语音数据、预设设备状态语音数据)的特征值(参考值),并保存该预设语音数据(预设用户语音数据、预设动物语音数据、预设设备状态语音数据)及该预设语音数据的特征值(参考值)至存储模块;
获取模块10,获取监测人员所选择的语音采集方式;所述语音采集方式根据检测对象的区别分为人类语音采集方式、动物语音采集方式和设备语音采集方式;由于人类、动物、设备所发出的声音的音频大小不同,所以采用不同的语音采集方式;
采集模块20,根据已获取的语音采集方式为设备语音采集方式,在该语音采集方式下采集监测对象(被监测设备)所发出的语音数据;
数据分析模块30,利用频谱矩阵分析计算出所述语音数据的特征值,还可以是利用傅里叶函数或其他函数分析计算出语音数据的参考值;
数据分析模块30,判断该语音数据的特征值(参考值)是否达到预设阀值,所述预设阀值是预设语音数据(预设设备状态语音数据)的特征值(参考值)的预设百分比(70%、80%、90%),例如:语音数据的特征值(参考值)与预设语音数据(预设设备状态语音数据)的特征值(参考值)的相似度是否达到70%,语音数据的特征值(参考值)与预设语音数据(预设设备状态语音数据)的特征值(参考值)的相似度是否达到80%,语音数据的特征值(参考值)与预设语音数据(预设设备状态语音数据)的特征值(参考值)的相似度是否达到90%等;
识别模块40,所述语音数据的特征值(参考值)已达到预设阀值,则识别发出该语音数据的监测对象(被监测用户、被监测动物)为预设对象(预设用户、预设动物),或识别发出该语音数据的监测对象(被监测设备)当前所处工作状态后;更新模块,更新该监测对象的语音数据时间戳和/或记录该监测对象的语音数据至记录模块80中;
识别模块40,所述语音数据的特征值(参考值)未达到预设阀值,则不能识别发出该语音数据的监测对象(被监测用户、被监测动物)为预设对象(预设用户、预设动物),或不能识别发出该语音数据的监测对象(被监测设备)当前所处工作状态;
当中不能识别发出该语音数据的监测对象(被监测用户、被监测动物)时,传输模块50,传输所述语音数据至云端;
查找模块60,在云端中查找是否存储有与该监测对象(被监测用户、被监测动物)相关的历史数据;该历史数据还可以是通过其他方式获得,例如预先存储方式;
若云端中存储有该监测对象(被监测用户、被监测动物)相关的历史数据,信息分析模块70结合该监测对象(被监测用户、被监测动物)相关的历史数据,分析发出该语音数据的监测对象的相关信息;
若云端中没有存储该监测对象(被监测用户、被监测动物)相关的历史数据,记录模块80记录该监测对象(被监测用户、被监测动物)所发出的语音数据至存储模块中;
反馈发送模块90,根据识别结果、在云端中的分析的相关信息及记录结果,反馈发送识别结果、相关信息及记录结果至所述监测人员所持智能终端上;即:反馈发送监测对象为预设动物的识别结果、及预设动物的访问时间或者推测物种动物访问的记录结果至所述监测人员所持智能终端上。
根据本发明的一个实施例,一种应用在网络设备中的语音识别方法,包括:网络设备的语音识别功能,应用进程内存进行语音数据采集,设备管理员录制合法账户的语音数据;设备后台完成频谱矩阵的计算,根据频谱矩阵计算计算其特征值和时间戳将被传输到云端服务器数据库;设备管理员开启语音识别功能,选择频谱特征的采样范围,例如:人体语音数据采集、动物语音数据采集、电器语音数据采集;
人体语音数据采集,采样周期内过滤噪音得到频谱矩阵,计算该频谱矩阵的特征值,与合法账户的特征值进行比对,如果两者的相似度超过80%,则认为合法并更新时间戳;如果两者的相似度低于80%,则将频谱矩阵传到云端做大数据分析,记录保存模糊或精确分析的结果;在管理员的手机应用终端,给出消息通知或振动告警。
动物语音数据采集,采样周期内过滤噪音得到频谱矩阵,计算该频谱矩阵的特征值,与监控物种的特征值进行比对,如果两者的相似度超过80%,则认为符合并更新时间戳;如果两者的相似度低于80%,则将频谱矩阵传到云端做大数据分析,记录保存模糊或精确分析的结果;在管理员的手机应用终端,给出物种访问时间的消息通知,管理员也可以过滤其他非监控物种的消息通知。
电器语音数据采集,采样周期内过滤噪音得到频谱矩阵,计算该频谱矩阵的特征值,与监控电器的特征值进行比对,如果两者的相似度超过80%,则认为符合并更新时间戳;在管理员的手机应用终端,给出监控电器的生产时间进度通知,提高了物联网管控效率,降低了部分嵌入式设备的物联网改造成本。
本实施例中网络设备包括三个处理模块:语音数据采集、频谱矩阵计算、相似度分析。将已知监控对象的更新时间戳传输到云端,将未知监控对象的频谱矩阵传输到云端做大数据分析,手机应用可以实时获得更新通知或告警提示。设备管理员在手机应用中可以实时查看。
网络设备包括网关、手机、机顶盒、路由器等,进行网络数据包的转发处理。在物联网领域,还是重要的应用数据采集终端。核心网络设备的安全访问,除了账户密码校验,还需要人脸/指纹识别功能。本发明可以动态实时地采集语音数据,计算频谱矩阵并做匹配分析,满足公安系统、环境保护、工业生产的应用需求。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种应用在网络设备中的语音识别方法,其特征在于,包括:
步骤S10获取监测人员所选择的语音采集方式;
步骤S20根据已获取的语音采集方式,在该语音采集方式下采集监测对象所发出的语音数据;
步骤S30将已采集的语音数据与由预设对象所发出的预设语音数据进行比对分析;
步骤S40识别发出该语音数据的监测对象与所述预设对象是否相同。
2.如权利要求1所述的应用在网络设备中的语音识别方法,其特征在于,还包括:
步骤S41识别发出该语音数据的监测对象当前所处工作状态。
3.如权利要求1所述的应用在网络设备中的语音识别方法,其特征在于:
所述步骤S10获取监测人员所选择的语音采集方式是指:人类语音采集方式、动物语音采集方式和设备语音采集方式。
4.如权利要求2所述的应用在网络设备中的语音识别方法,其特征在于,所述步骤S30还包括:
步骤S31利用频谱矩阵分析计算出所述语音数据的特征值;
步骤S32判断该语音数据的特征值是否达到预设阀值,所述预设阀值是指:所述预设语音数据的特征值的预设百分比;
所述步骤S40或步骤S41还包括:
步骤S42所述语音数据的特征值已达到预设阀值,则识别发出该语音数据的监测对象为预设对象或该监测对象当前所处工作状态后,跳转至步骤S44;
步骤S43所述语音数据的特征值未达到预设阀值,则不能识别发出该语音数据的监测对象或该监测对象当前所处工作状态;
步骤S44更新该监测对象的语音数据时间戳和/或记录该监测对象的语音数据。
5.如权利要求4所述的应用在网络设备中的语音识别方法,其特征在于,还包括:
步骤S50当步骤S43中不能识别发出该语音数据的监测对象时,传输所述语音数据至云端;
步骤S51在云端中查找是否存储有与该监测对象相关的历史数据;
步骤S52若云端中存储有该监测对象相关的历史数据,结合该监测对象相关的历史数据,分析发出该语音数据的监测对象的相关信息;
步骤S53若云端中没有存储该监测对象相关的历史数据,记录该监测对象所发出的语音数据。
6.如权利要求5所述的应用在网络设备中的语音识别方法,其特征在于,还包括:
步骤S60根据识别结果、在云端中的分析的相关信息及记录结果,反馈发送识别结果、相关信息及记录结果至所述监测人员所持智能终端上。
7.如权利要求1~3中任意一项所述的应用在网络设备中的语音识别方法,其特征在于,在所述步骤S10之前还包括:
步骤S01录制由所述预设对象发出的预设语音数据,以及录制由所述预设对象处于不同工作状态所发出的预设语音数据;
步骤S02利用频谱矩阵分析计算出该预设语音数据的特征值,并保存该预设语音数据及该预设语音数据的特征值。
8.一种应用在如权利要求1~7中任意一项所述的应用在网络设备中的语音识别方法的语音识别系统,其特征在于,包括:
获取模块,该获取模块获取监测人员所选择的语音采集方式;
采集模块,该采集模块接收所述获取模块输出的语音采集方式,在该语音采集方式下采集监测对象所发出的语音数据;
数据分析模块,该数据分析模块接收所述采集模块输出的语音数据,将已采集的语音数据与由预设对象所发出的预设语音数据进行比对分析;
识别模块,该识别模块接收所述数据分析模块输出的分析结果,识别发出该语音数据的监测对象与所述预设对象是否相同。
9.如权利要求8所述的应用在网络设备中的语音识别系统,其特征在于,还包括:
传输模块,该传输模块接收所述识别模块输出的不能识别发出该语音数据的监测对象的识别结果,传输所述语音数据至云端;
查找模块,该查找模块在云端中查找是否存储有与该监测对象相关的历史数据;
信息分析模块,该信息分析模块接收所述查找模块输出的云端中存储有该监测对象相关的历史数据,结合该监测对象相关的历史数据,分析发出该语音数据的监测对象的相关信息;
记录模块,该记录模块接收所述查找模块输出的云端中没有存储该监测对象相关的历史数据,记录该监测对象所发出的语音数据。
10.如权利要求9所述的应用在网络设备中的语音识别系统,其特征在于,还包括:
反馈发送模块,该反馈发送模块接收所述识别模块输出的识别结果、所述信息分析模块输出的相关信息及所述记录模块输出的记录结果,反馈发送识别结果、相关信息及记录结果至所述监测人员所持智能终端上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610048589.1A CN105609110A (zh) | 2016-01-25 | 2016-01-25 | 一种应用在网络设备中的语音识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610048589.1A CN105609110A (zh) | 2016-01-25 | 2016-01-25 | 一种应用在网络设备中的语音识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105609110A true CN105609110A (zh) | 2016-05-25 |
Family
ID=55988993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610048589.1A Pending CN105609110A (zh) | 2016-01-25 | 2016-01-25 | 一种应用在网络设备中的语音识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105609110A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107997738A (zh) * | 2017-10-31 | 2018-05-08 | 努比亚技术有限公司 | 一种生理信号处理方法、装置及计算机可读存储介质 |
CN108717851A (zh) * | 2018-03-28 | 2018-10-30 | 深圳市三诺数字科技有限公司 | 一种语音识别方法及装置 |
CN113434738A (zh) * | 2020-03-23 | 2021-09-24 | 未来穿戴技术有限公司 | 可穿戴设备的数据处理方法、装置、计算机设备和介质 |
CN115460031A (zh) * | 2022-11-14 | 2022-12-09 | 深圳市听见时代科技有限公司 | 一种基于物联网的智能音响控制监管系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682771A (zh) * | 2012-04-27 | 2012-09-19 | 厦门思德电子科技有限公司 | 一种适用于云平台的多语音控制方法 |
CN103985383A (zh) * | 2014-05-30 | 2014-08-13 | 上海斐讯数据通信技术有限公司 | 婴儿或宠物保姆方法及适用该方法的保姆系统和保姆机 |
CN104021790A (zh) * | 2013-02-28 | 2014-09-03 | 联想(北京)有限公司 | 声控解锁方法以及电子设备 |
CN104022879A (zh) * | 2014-05-29 | 2014-09-03 | 金蝶软件(中国)有限公司 | 语音安全校验的方法及装置 |
CN104464735A (zh) * | 2014-12-12 | 2015-03-25 | 宇龙计算机通信科技(深圳)有限公司 | 语音信息识别方法、语音信息识别装置与终端 |
CN105244038A (zh) * | 2015-09-30 | 2016-01-13 | 金陵科技学院 | 一种基于hmm的选矿设备故障异常音频分析与识别方法 |
-
2016
- 2016-01-25 CN CN201610048589.1A patent/CN105609110A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682771A (zh) * | 2012-04-27 | 2012-09-19 | 厦门思德电子科技有限公司 | 一种适用于云平台的多语音控制方法 |
CN104021790A (zh) * | 2013-02-28 | 2014-09-03 | 联想(北京)有限公司 | 声控解锁方法以及电子设备 |
CN104022879A (zh) * | 2014-05-29 | 2014-09-03 | 金蝶软件(中国)有限公司 | 语音安全校验的方法及装置 |
CN103985383A (zh) * | 2014-05-30 | 2014-08-13 | 上海斐讯数据通信技术有限公司 | 婴儿或宠物保姆方法及适用该方法的保姆系统和保姆机 |
CN104464735A (zh) * | 2014-12-12 | 2015-03-25 | 宇龙计算机通信科技(深圳)有限公司 | 语音信息识别方法、语音信息识别装置与终端 |
CN105244038A (zh) * | 2015-09-30 | 2016-01-13 | 金陵科技学院 | 一种基于hmm的选矿设备故障异常音频分析与识别方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107997738A (zh) * | 2017-10-31 | 2018-05-08 | 努比亚技术有限公司 | 一种生理信号处理方法、装置及计算机可读存储介质 |
CN108717851A (zh) * | 2018-03-28 | 2018-10-30 | 深圳市三诺数字科技有限公司 | 一种语音识别方法及装置 |
CN108717851B (zh) * | 2018-03-28 | 2021-04-06 | 深圳市三诺数字科技有限公司 | 一种语音识别方法及装置 |
CN113434738A (zh) * | 2020-03-23 | 2021-09-24 | 未来穿戴技术有限公司 | 可穿戴设备的数据处理方法、装置、计算机设备和介质 |
CN115460031A (zh) * | 2022-11-14 | 2022-12-09 | 深圳市听见时代科技有限公司 | 一种基于物联网的智能音响控制监管系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105609110A (zh) | 一种应用在网络设备中的语音识别方法及系统 | |
Obrist et al. | Variability in echolocation call design of 26 Swiss bat species: consequences, limits and options for automated field identification with a synergetic pattern recognition approach | |
CN110110575A (zh) | 一种人员脱岗检测方法及装置 | |
CN110070155B (zh) | 一种基于可穿戴设备的服刑人员综合行为识别方法及系统 | |
CN103812577A (zh) | 非正常无线电信号的自动识别系统及其方法 | |
CN109765539A (zh) | 室内用户行为监测方法和装置、电器设备和家居监控系统 | |
CN104869630B (zh) | 基于离线指纹库的伪基站快速定位方法与系统 | |
CN106529373A (zh) | 人脸识别监控报警方法、系统 | |
CN106936517A (zh) | 一种异常无线电信号的自动识别系统及其方法 | |
CN111294728A (zh) | 同行分析方法及装置 | |
CN105974223B (zh) | 一种用于在线检测用电设备工作状态的方法及系统 | |
CN105208528A (zh) | 一种用于识别同行人员的系统及方法 | |
CN109992484A (zh) | 一种网络告警相关性分析方法、装置和介质 | |
CN113572757B (zh) | 服务器访问风险监测方法及装置 | |
CN114371353A (zh) | 一种基于声纹识别的电力设备异常监测方法及系统 | |
CN106027174A (zh) | 无线电监测无人值机系统及该系统的信号分析与识别方法 | |
CN110519231A (zh) | 一种跨域数据交换监管系统及方法 | |
CN105185381A (zh) | 智能机器人声音识别系统 | |
CN117390528A (zh) | 一种高压开关工作参数异常监测方法及系统 | |
CN108280950B (zh) | 一种基于高频能量分布的防区型光纤周界防护算法 | |
CN107730697A (zh) | 可进行身份识别的门禁方法 | |
CN204929052U (zh) | 一种互联网安防监控智能管理系统 | |
CN104978837B (zh) | 一种面向用户端变电所的报警系统及其实现方法 | |
CN103812676A (zh) | 一种实现日志数据实时关联装置及方法 | |
CN110443187A (zh) | 特征信息的记录方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160525 |
|
WD01 | Invention patent application deemed withdrawn after publication |