CN112562694A - 一种语音唤醒工业触摸屏的方法及装置 - Google Patents
一种语音唤醒工业触摸屏的方法及装置 Download PDFInfo
- Publication number
- CN112562694A CN112562694A CN202011389883.1A CN202011389883A CN112562694A CN 112562694 A CN112562694 A CN 112562694A CN 202011389883 A CN202011389883 A CN 202011389883A CN 112562694 A CN112562694 A CN 112562694A
- Authority
- CN
- China
- Prior art keywords
- voice
- condition
- wake
- awakening
- industrial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000012790 confirmation Methods 0.000 claims description 17
- 230000002618 waking effect Effects 0.000 claims description 8
- 230000003993 interaction Effects 0.000 abstract description 8
- 230000032683 aging Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种语音唤醒工业触摸屏的方法及装置,涉及人机交互技术领域,其中语音唤醒工业触摸屏的方法包括以下步骤:在处理器中设置唤醒条件;当处理器接收到语音信号后,将其与设置的唤醒条件进行比对并当语音信号与设置的唤醒条件一致时控制执行模块控制工业设备工作。语音唤醒工业触摸屏的方法旨在提高工业产品的人机交互能力。
Description
技术领域
本发明涉及人机交互技术领域,尤其涉及一种语音唤醒工业触摸屏的方法及装置。
背景技术
现有工业触摸屏一般都是通过按键启动设备控制的,长期按键会加快设备的老化。另一种方式就是使工业触摸屏在不启动时处于休眠状态,此时处理器仍然在运行,监测是否有触发唤醒的事件发生,这种模式会增加设备的功耗。随着人机交互技术的发展,如何简化设备的操作是业内亟待解决的技术问题。
发明内容
本发明提出一种语音唤醒工业触摸屏的方法及装置,以提高工业产品的人机交互能力。
本发明提出一种语音唤醒工业设备的方法,包括以下步骤:
在处理器中设置唤醒条件;
当处理器接收到语音信号后,将其与设置的唤醒条件进行比对并当语音信号与设置的唤醒条件一致时控制执行模块控制工业设备工作。
优选地,所述的唤醒条件包括:唤醒人身份确认条件和唤醒词确认条件。
优选地,所述唤醒人身份确认条件包括:语音的响度、音调和/或音色特征。
本发明还提出一种语音唤醒工业设备的装置,包括:
语音接收模块,用于接收唤醒语音;
处理器,用于设置唤醒条件、将接收到的语音信号与设置的唤醒条件进行比对并当语音信号与设置的唤醒条件一致时向执行模块下发控制指令;
执行模块,用于接收处理器下发的指令控制工业设备启动。
优选地,语音唤醒工业设备的装置还包括寄存器,用于存储唤醒条件。
优选地,所述的语音接收模块采用麦克风 。
优选地,所述处理器采用Linux操作系统。
优选地,所述执行模块为工业触摸屏电源开关。
与现有技术相比,本发明能提高工业设备的人机交互能力和用户体验,降低工业触摸屏的按键老化,延长使用周期,同时,降低设备运行成本。
附图说明
以下结合附图和具体实施例对本发明进行详细说明,其中:
图1为本发明的流程示意图;
图2为本发明的结构示意流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚,以下结合附图和实施例对本发明进行详细的说明。应当理解,以下具体实施例仅用以解释本发明,并不对本发明构成限制。
本发明的核心在于,在工业设备上设置语音唤醒模块,通过语音唤醒达到启动设备的目的,避免目前长期按键加快设备老化的问题,简化设备的操作。
如图1所示,本发明提出的语音唤醒工业设备的方法,包括以下步骤:
S10:在处理器200中设置唤醒条件;
S20:当处理器200接收到语音信号后,将其与设置的唤醒条件进行比对并当语音信号与设置的唤醒条件一致时控制执行模块300控制工业设备工作。
在进行语音唤醒工业设备之前,在处理器200中预设语音的唤醒条件,例如输入操作人员的语音命令,将操作人员的语音命令根据GMM-UBM建立特征模型,并在模型中将语音命令根据不同类别进行分类,其中语音命令的类别包括语音命令的音色、响度、音调、或者唤醒词中的至少一个。
在处理模块录入语音唤醒条件后,实时检测并获取语音信息,提取语音信息中特征,将语音信息中的特征与模型中的特征进行比对,当语音信号与录入的语音唤醒条件一致时,验证通过,即控制执行模块300控制工业设备工作。当获取的语音信号与录入的语音唤醒条件不一致时,验证未通过,即执行模块300不进行任何操作。
采用上述技术方案,提高工业设备的人机交互能力和用户体验,降低工业触摸屏的按键老化,延长使用周期,同时,降低设备运行成本。
优选地,所述的唤醒条件包括:唤醒人身份确认条件和唤醒词确认条件。
实时检测并获取语音信息,提取语音信息中的特征,首先对唤醒人的身份进行确认,当唤醒人的身份不匹配时,继续实时检测并获取语音信息;当唤醒人的身份匹配时,判断语音信息中是否包含唤醒词,若包含唤醒词,则执行模块300控制工业设备工作,若不包含唤醒词,则执行模块300不控制工业设备工作。可以想到的是,唤醒词确认条件与唤醒人身份确认条件的顺序可互相调换,即先判断获取的语音信息中是否包含有唤醒词,如果包含唤醒词,则再对唤醒人的身份进行确认。采用上述技术方案,通过唤醒人的身份确认条件和唤醒词的确认条件,确保只有相应操作权限的人才能操作工业设备,保证设备运行的安全,避免工业设备的误运行。
优选地,所述唤醒人身份确认条件包括:语音的响度、音调和/或音色特征。
唤醒人身份确认条件为唤醒人的语音特征参数,该语音特征参数包括语音的响度、音调以及音色。其中,语音的响度会随着声音与声音接收模块的距离发生变化,越靠近声音接收模块声音的响度越大,越远离声音接收模块响度就越小,通过确认获取的语音信息是否满足语音唤醒响度条件,即可保证使用者处在声音接收的有效范围内控制工业设备的工作,避免误操作。
音调是指声音的频率的变化,其和声音的响度互相关联,通过响度和音调,可以实现语音接收模块100准确的识别声音。音色是指不同声音表现在波形上总是有不同的特性,同样不同的物体振动也有明显的区别。
因此进行唤醒人身份的确认时,先获取语音的响度参数,当语音的响度参数满足条件时,继续判断语音的音调参数是否满足条件,当语音的音调参数满足条件时,继续判断语音的音色参数是否满足条件,当响度、音调、音色均满足预设的唤醒条件时,既可确认唤醒人身份,避免出现认证偏差,保证认证的精准性。
如图2所示,本发明还提出一种语音唤醒工业设备的装置,包括:
语音接收模块100,用于接收唤醒语音;
处理器200,用于设置唤醒条件、将接收到的语音信号与设置的唤醒条件进行比对并当语音信号与设置的唤醒条件一致时向执行模块300下发控制指令;
执行模块300,用于接收处理器200下发的指令控制工业设备启动。
具体的,语音接收模块100采用现有技术中常用的麦克风进行语音采集,麦克风的数量可以为一个或者多个,为了提高工业设备语音检测的灵敏度,麦克风的数量优选为多个,分别设置在工业设备操作端的不同位置。
语音接收模块100与麦克风通信连接,语音接收模块100接收麦克风采集的唤醒语音。
处理器200获取语音接收模块100中的唤醒语音,并将唤醒语音与设置的唤醒条件进行比对,当唤醒语音与设置的唤醒条件一致时,下发控制指令,该控制指令可以为开启、参数修改、重启、关闭等。
执行模块300与处理通信连接,执行模块300获取处理器200下发的控制指令对工业设备进行控制。
采用上述技术方案,能提高工业设备的人机交互能力和用户体验,降低工业触摸屏的按键老化,延长使用周期,同时,降低设备运行成本。
优选地,语音唤醒工业设备的装置还包括寄存器,用于存储唤醒条件。
寄存器采用电子盘、采用电子盘,存储和读取速度快。
优选地,所述的语音接收模块100采用麦克风。
现有技术中的麦克风,成本低,识别精度高。同时本实施例中优选的麦克风的数量为多个。
优选地,所述处理器200采用Linux操作系统。
Linux操作系统,具有内核小,运行快,同时具备强大的网络功能,其源代码完全开源,保障了Linux在使用过程中的安全性。
优选地,所述执行模块300为工业触摸屏电源开关。
通过控制工业触摸屏电源开关,可实现工业设备的开、关以及重启。
以上所述仅为本发明的具体实施方式。应当指出的是,凡在本发明构思的精神和框架内所做出的任何修改、等同替换和变化,都应包含在本发明的保护范围之内。
Claims (10)
1.一种语音唤醒工业设备的方法,其特征在于,包括以下步骤:
在处理器中设置唤醒条件;
当处理器接收到语音信号后,将其与设置的唤醒条件进行比对并当语音信号与设置的唤醒条件一致时控制执行模块控制工业设备工作。
2.如权利要求1所述的方法,其特征在于,所述的唤醒条件包括:唤醒人身份确认条件和唤醒词确认条件。
3.如权利要求2所述的方法,其特征在于,所述唤醒人身份确认条件包括:语音的响度、音调和/或音色特征。
4.一种语音唤醒工业设备的装置,其特征在于,包括:
语音接收模块,用于接收唤醒语音;
处理器,用于设置唤醒条件、将接收到的语音信号与设置的唤醒条件进行比对并当语音信号与设置的唤醒条件一致时向执行模块下发控制指令;
执行模块,用于接收处理器下发的指令控制工业设备启动。
5.如权利要求4所述的装置,其特征在于,所述的唤醒条件包括:唤醒人身份确认条件和唤醒词确认条件。
6.如权利要求5所述的方法,其特征在于,所述唤醒人身份确认条件包括:语音的响度、音调和/或音色特征。
7.如权利要求4所述的装置,其特征在于,还包括寄存器,用于存储唤醒条件。
8.如权利要求4所述的控制方法,其特征在于,所述的语音接收模块采用麦克风 。
9.如权利要求4所述的控制方法,其特征在于,所述处理器采用Linux操作系统。
10.如权利要求4所述的控制方法,其特征在于,所述执行模块为工业触摸屏电源开关。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011389883.1A CN112562694A (zh) | 2020-12-02 | 2020-12-02 | 一种语音唤醒工业触摸屏的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011389883.1A CN112562694A (zh) | 2020-12-02 | 2020-12-02 | 一种语音唤醒工业触摸屏的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112562694A true CN112562694A (zh) | 2021-03-26 |
Family
ID=75047823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011389883.1A Pending CN112562694A (zh) | 2020-12-02 | 2020-12-02 | 一种语音唤醒工业触摸屏的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112562694A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103729193A (zh) * | 2014-01-11 | 2014-04-16 | 苏州思必驰信息科技有限公司 | 一种人机交互方法及装置 |
CN209181285U (zh) * | 2018-12-11 | 2019-07-30 | 厦门华联电子股份有限公司 | 一种暖风机控制器及暖风机 |
CN110956968A (zh) * | 2019-11-20 | 2020-04-03 | 深圳传音控股股份有限公司 | 语音唤醒以及触发语音唤醒功能的方法及装置、终端设备 |
CN111198733A (zh) * | 2018-11-19 | 2020-05-26 | 阿里巴巴集团控股有限公司 | 开机画面显示方法、终端设备及存储介质 |
CN111508486A (zh) * | 2020-04-13 | 2020-08-07 | 安徽中科新辰技术有限公司 | 一种语音控制大屏展示系统 |
-
2020
- 2020-12-02 CN CN202011389883.1A patent/CN112562694A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103729193A (zh) * | 2014-01-11 | 2014-04-16 | 苏州思必驰信息科技有限公司 | 一种人机交互方法及装置 |
CN111198733A (zh) * | 2018-11-19 | 2020-05-26 | 阿里巴巴集团控股有限公司 | 开机画面显示方法、终端设备及存储介质 |
CN209181285U (zh) * | 2018-12-11 | 2019-07-30 | 厦门华联电子股份有限公司 | 一种暖风机控制器及暖风机 |
CN110956968A (zh) * | 2019-11-20 | 2020-04-03 | 深圳传音控股股份有限公司 | 语音唤醒以及触发语音唤醒功能的方法及装置、终端设备 |
CN111508486A (zh) * | 2020-04-13 | 2020-08-07 | 安徽中科新辰技术有限公司 | 一种语音控制大屏展示系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106463112B (zh) | 语音识别方法、语音唤醒装置、语音识别装置及终端 | |
CN111161714B (zh) | 一种语音信息处理方法、电子设备及存储介质 | |
CN105009204A (zh) | 语音识别功率管理 | |
KR20150012577A (ko) | 음성 인식 기능을 지원하는 전자 기기의 음성 입력 제어 방법 및 장치 장치 | |
CN109671426B (zh) | 一种语音控制方法、装置、存储介质及空调 | |
CN105575395A (zh) | 语音唤醒方法及装置、终端及其处理方法 | |
CN108806673B (zh) | 一种智能设备控制方法、装置及智能设备 | |
CN105679310A (zh) | 一种用于语音识别方法及系统 | |
CN106981290A (zh) | 语音控制装置和语音控制方法 | |
CN110942768A (zh) | 设备唤醒的测试方法、装置、移动终端和存储介质 | |
CN109686368B (zh) | 语音唤醒应答处理方法及装置、电子设备及存储介质 | |
CN103870356A (zh) | 一种信息处理方法及电子设备 | |
CN111128155B (zh) | 一种智能设备的唤醒方法、装置、设备及介质 | |
CN112634897B (zh) | 设备唤醒方法、装置和存储介质及电子装置 | |
EP4226363A1 (en) | Adapting hotword recognition based on personalized negatives | |
WO2019227370A1 (zh) | 一种多语音助手控制方法、装置、系统及计算机可读存储介质 | |
CN111862965A (zh) | 唤醒处理方法、装置、智能音箱及电子设备 | |
CN112207811B (zh) | 一种机器人控制方法、装置、机器人及存储介质 | |
CN112562694A (zh) | 一种语音唤醒工业触摸屏的方法及装置 | |
WO2018227475A1 (zh) | 指纹芯片检测方法、装置及系统 | |
CN111710339A (zh) | 一种基于数据可视化展示技术的语音识别交互系统及方法 | |
CN111161745A (zh) | 一种智能设备的唤醒方法、装置、设备及介质 | |
CN108108196B (zh) | 一种唤醒设备、唤醒系统、唤醒方法及装置 | |
CN107423593B (zh) | 指纹解锁控制方法和装置 | |
CN111105794B (zh) | 设备的语音识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210326 |