CN104200807A - 一种erp语音控制方法 - Google Patents

一种erp语音控制方法 Download PDF

Info

Publication number
CN104200807A
CN104200807A CN201410478889.4A CN201410478889A CN104200807A CN 104200807 A CN104200807 A CN 104200807A CN 201410478889 A CN201410478889 A CN 201410478889A CN 104200807 A CN104200807 A CN 104200807A
Authority
CN
China
Prior art keywords
voice command
vocal print
template
voice
accent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410478889.4A
Other languages
English (en)
Other versions
CN104200807B (zh
Inventor
曹毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou University
Original Assignee
Chengdu Biz United Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Biz United Information Technology Co Ltd filed Critical Chengdu Biz United Information Technology Co Ltd
Priority to CN201410478889.4A priority Critical patent/CN104200807B/zh
Publication of CN104200807A publication Critical patent/CN104200807A/zh
Application granted granted Critical
Publication of CN104200807B publication Critical patent/CN104200807B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

为了便于ERP用户能够方便、安全地从远程访问ERP服务,本发明提供了一种ERP语音控制方法,包括以下步骤:(1)预存储语音命令、语音命令集以及操作指令三者之间的映射关系;(2)音频通信设备接收语音命令,并传输给音频收发设备;(3)音频收发设备接收所述语音命令;(4)对所接收的语音命令生成语音命令模板;(5)将语音命令的模板与预存储的语音命令集进行匹配;如果相匹配,则根据所述映射关系获取相匹配的语音命令对应的操作指令后执行该操作指令;否则,向音频通信设备提示语音命令无效。本发明通过语音可以判断出当前操作人员是否是合法的操作人员,避免了非法操作人员的非法操作,提高了安全性。

Description

一种ERP语音控制方法
技术领域
本发明涉及一种语音识别技术领域,尤其是涉及一种应用于ERP的语音控制方法。
背景技术
随着科技的日新月异,IT厂商所生产的外围装置,例如扫描器,均以能够让使用者方便使用为目标。一般控制外围装置的方式一般是利用键盘、滑鼠或触控屏输入控制命令。
在利用操作指令控制设备运行的应用场合,常常是通过输入操作指令的方式来启动设备的运行。一旦非法人员获取了操作指令,便可以冒充合法身份来操作设备,安全性较差。
如果采用语音来控制设备的运行,不但无需输入操作指令,而且兼具身份识别的能力,无疑能够提高系统的安全性和便利性。现有的语音识别系统能够识别出语音的语义内容,但识别过程较为复杂,识别效率也相对较低,仅适合在ERP系统的终端现场使用。例如,对于ERP系统的采购子系统,当操作人员输入正确的密码后,采购子系统便会进行查询、输入、输出等操作,无法远程地进行操作,尤其是无法仅仅使用普通的手机、座机来实现远程操作指令的下达。
发明内容
针对现有技术中存在的缺陷,本发明所要解决的技术问题是提供一种操作方便、安全性好的应用于ERP系统的语音控制方法。
为解决上述技术问题,本发明采用的技术方案如下:
一种ERP语音控制方法,包括以下步骤:
(1)预存储语音命令、语音命令集以及操作指令三者之间的映射关系;
(2)音频通信设备接收语音命令,并传输给音频收发设备;
(3)音频收发设备接收所述语音命令;
(4)对所接收的语音命令生成语音命令模板;
(5)将语音命令的模板与预存储的语音命令集进行匹配;如果相匹配,则根据所述映射关系获取相匹配的语音命令对应的操作指令后执行该操作指令;否则,向音频通信设备提示语音命令无效。
进一步地,其中,所述语音命令集包括多个参考语音模板,所述参考语音模板是根据对同一命令在声调、发音长短和口音这三方面的多种变化的各种语音产生的。
进一步地,步骤(5)中所述将语音命令的模板与预存储的语音命令集进行匹配的方法如下:
(a)获得语音命令模板中的第一声纹;
(b)获取所述语音命令集中各个参考语音模板的第二声纹;
(c)比较所述第一声纹和所述第二声纹,如果相匹配,则匹配成功;否则,匹配失败。
进一步地,在步骤(3)和步骤(4)之间,还包括对接收到的语音命令进行降噪处理。
进一步地,在步骤(1)中,将所述语音命令分成若干节,存储每一节语音命令的模板。
进一步地,步骤(3)中,如果每一节语音命令的模板均与预存储的相对应节的语音命令的模板相匹配,则获取该语音命令对应的操作指令。
进一步地,获得所述第一声纹包括:获得基于语音命令模板中的声调和口音的声纹,或者获得基于语音命令模板中的发音长短与口音的声纹,或者获得基于声调、发音长短和口音的声纹。
进一步地,获得所述第二声纹包括:获得基于语音命令模板中的声调和口音的声纹,或者获得基于语音命令模板中的发音长短与口音的声纹,或者获得基于声调、发音长短和口音的声纹。
进一步地,比较所述第一声纹和所述第二声纹包括:比较基于语音命令模板和语音命令集中的基于声调和口音的声纹,如果匹配,则继续比较基于语音命令模板中的发音长短与口音的声纹,如果匹配,再比较基于声调、发音长短和口音的声纹;其中任何匹配不成功都不再继续进行后续比较。
本发明所述方法,无需手动输入操作指令,通过语音便可控制设备的启动或运行,操作方便。而且,通过语音可以判断出当前操作人员是否是合法的操作人员,避免了非法操作人员的非法操作,提高了安全性。
附图说明
图1是具体实施方式中ERP语音控制方法的流程图。
具体实施方式
下面结合具体实施方式和附图对本发明进行详细描述。
如图1所示,本实施方式中ERP系统的语音控制方法包括以下步骤:
(1)预存储语音命令、语音命令集以及操作指令三者之间的映射关系。预存的语音命令包括表示ERP系统的各种操作动作(例如:打开、打印、发送邮件给、添加附件、查询)的动词、表示ERP系统的操作动作的各种参数(例如:起始日期、终止日期、文件位置、数据类型)的名词等。操作指令为预先编制好的ERP系统内部执行的指令,这些指令可以采用机器语言编制,通常采用软件编程的方式产生和维护。所述语音命令集包括多个参考语音模板,所述参考语音模板是根据对同一命令在声调、发音长短和口音这三方面的多种变化的各种语音产生的。在一个优选的实施例中,上述参考语音模板将所述声调、发音长短(单位采用微秒)和口音设置成三维数组。
对于口音的处理,本发明采用的是通过预先记录各地口音对于汉语字母的声母、韵母的发音规则实现的:这种处理已经是本领域公知技术,在此不再详述。例如,预先分析使用者发出声音的各个字符的发音长短、是否卷舌、是否带有声调、若带有声调时的具体声调。
(2)音频通信设备接收语音命令,并传输给音频收发设备。
在优选的实施例中,所述的音频通信设备包括手机,尤其是非智能手机,还可以包括固定电话。更广泛地,可以使用包括智能手机在内的任何既具有语音接收功能又具有将所接收到的语音通过通信网络发送出去,并接收外部语音、文字和/或图像等信息反馈功能的设备。
(3)音频收发设备接收所述语音命令。这里的音频收发设备优选地为ERP系统终端附近的音频收发设备。该设备接收来自上述音频通信设备发送来的语音信息。
(4)对所接收的语音命令生成语音命令模板。具体地,在所接收到的语音信息中,根据本发明的优选实施例,首先进行降噪的操作,尽可能地去除语音信号中的噪声。然后,利用STT(Speech To Text)技术得到语音信息中包括的语音命令,并在同时分析得到各个文字的声调、各个字符的发音长短时间和各个字符对应的声母、韵母的发音规则(例如,发音长短、是否卷舌、是否带有声调、若带有声调时的具体声调),进而形成由声调、发音长短和口音组成的三维数组。
(5)将语音命令的模板与预存储的语音命令集进行匹配;如果相匹配,则根据所述映射关系获取相匹配的语音命令对应的操作指令后执行该操作指令;否则,向音频通信设备提示语音命令无效。
这一步骤中,具体包括:
(a)获得语音命令模板中的第一声纹;
(b)获取所述语音命令集中各个参考语音模板的第二声纹;
(c)比较所述第一声纹和所述第二声纹,如果相匹配,则匹配成功;否则,匹配失败。
在其他的实施例中,可以在步骤(1)中将所述语音命令分成若干节,存储每一节语音命令的模板,而不是像上述实施例中那样采用字符为单位进行分析和语音处理。此时,在步骤(3)中,如果每一节语音命令的模板均与预存储的相对应节的语音命令的模板相匹配,则获取该语音命令对应的操作指令。
根据本发明的优选实施例,获得所述第一声纹包括:获得基于语音命令模板中的声调和口音的声纹,或者获得基于语音命令模板中的发音长短与口音的声纹,或者获得基于声调、发音长短和口音的声纹。获得所述第二声纹包括:获得基于语音命令模板中的声调和口音的声纹,或者获得基于语音命令模板中的发音长短与口音的声纹,或者获得基于声调、发音长短和口音的声纹。
在确定了声纹的数据处理对象(或称数据来源)后,上述声纹的获取步骤为:将语音信号波形的k个样点的每一帧,或有k个参数的每一参数帧,构成k维空间中的一个矢量,然后对矢量进行量化。量化时,将k维无限空间划分为M个区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。当然,也可以采用HMM(隐马尔可夫法)实现对于声纹的特征提取。
根据本发明的优选实施例,比较所述第一声纹和所述第二声纹包括:比较基于语音命令模板和语音命令集中的基于声调和口音的声纹,如果匹配,则继续比较基于语音命令模板中的发音长短与口音的声纹,如果匹配,再比较基于声调、发音长短和口音的声纹;其中任何匹配不成功都不再继续进行后续比较。
上述比较过程中,如果基于语音命令模板的声纹和语音命令集中的声纹的方差在预定的阈值之内,则认为上述语音命令模板中包括的语音命令是可以被执行的,此时,ERP系统将根据该语音命令集中对应的操作指令进行处理,执行相应的操作。否则,上述音频通信设备将收到由ERP系统终端附近的音频收发设备发出的语音命令无法被执行的信息。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其同等技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种ERP语音控制方法,其特征在于,包括以下步骤:
(1)预存储语音命令、语音命令集以及操作指令三者之间的映射关系;
(2)音频通信设备接收语音命令,并传输给音频收发设备;
(3)音频收发设备接收所述语音命令;
(4)对所接收的语音命令生成语音命令模板;
(5)将语音命令的模板与预存储的语音命令集进行匹配;如果相匹配,则根据所述映射关系获取相匹配的语音命令对应的操作指令后执行该操作指令;否则,向音频通信设备提示语音命令无效。
2.根据权利要求1所述的方法,其特征在于,所述语音命令集包括多个参考语音模板,所述参考语音模板是根据对同一命令在声调、发音长短和口音这三方面的多种变化的各种语音产生的。
3.根据权利要求1所述的方法,其特征在于,步骤(5)中所述将语音命令的模板与预存储的语音命令集进行匹配的方法如下:
(a)获得语音命令模板中的第一声纹;
(b)获取所述语音命令集中各个参考语音模板的第二声纹;
(c)比较所述第一声纹和所述第二声纹,如果相匹配,则匹配成功;否则,匹配失败。
4.根据权利要求1所述的方法,其特征在于,在步骤(3)和步骤(4)之间,还包括对接收到的语音命令进行降噪处理。
5.根据权利要求1所述的方法,其特征在于,在步骤(1)中,将所述语音命令分成若干节,存储每一节语音命令的模板。
6.根据权利要求5所述的方法,其特征在于,步骤(3)中,如果每一节语音命令的模板均与预存储的相对应节的语音命令的模板相匹配,则获取该语音命令对应的操作指令。
7.根据权利要求3所述的方法,其特征在于,获得所述第一声纹包括:获得基于语音命令模板中的声调和口音的声纹,或者获得基于语音命令模板中的发音长短与口音的声纹,或者获得基于声调、发音长短和口音的声纹。
8.根据权利要求3所述的方法,其特征在于,获得所述第二声纹包括:获得基于语音命令模板中的声调和口音的声纹,或者获得基于语音命令模板中的发音长短与口音的声纹,或者获得基于声调、发音长短和口音的声纹。
9.根据权利要求3所述的方法,其特征在于,比较所述第一声纹和所述第二声纹包括:比较基于语音命令模板和语音命令集中的基于声调和口音的声纹,如果匹配,则继续比较基于语音命令模板中的发音长短与口音的声纹,如果匹配,再比较基于声调、发音长短和口音的声纹;其中任何匹配不成功都不再继续进行后续比较。
CN201410478889.4A 2014-09-18 2014-09-18 一种erp语音控制方法 Expired - Fee Related CN104200807B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410478889.4A CN104200807B (zh) 2014-09-18 2014-09-18 一种erp语音控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410478889.4A CN104200807B (zh) 2014-09-18 2014-09-18 一种erp语音控制方法

Publications (2)

Publication Number Publication Date
CN104200807A true CN104200807A (zh) 2014-12-10
CN104200807B CN104200807B (zh) 2017-11-17

Family

ID=52086089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410478889.4A Expired - Fee Related CN104200807B (zh) 2014-09-18 2014-09-18 一种erp语音控制方法

Country Status (1)

Country Link
CN (1) CN104200807B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106549947A (zh) * 2016-10-19 2017-03-29 陆腾蛟 一种即时更新的声纹认证方法及系统
CN106920557A (zh) * 2015-12-24 2017-07-04 中国电信股份有限公司 一种基于小波变换的分布声纹识别方法和装置
CN107863098A (zh) * 2017-12-07 2018-03-30 广州市艾涛普电子有限公司 一种语音识别控制方法和装置
CN109063165A (zh) * 2018-08-15 2018-12-21 深圳市诺信连接科技有限责任公司 一种erp文件查询管理系统
CN110570120A (zh) * 2019-09-06 2019-12-13 Oppo(重庆)智能科技有限公司 Erp智能下单方法、装置、系统以及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040101112A1 (en) * 2002-11-26 2004-05-27 Lite-On Technology Corporation Voice identification method for cellular phone and cellular phone with voiceprint password
US20080154599A1 (en) * 2006-12-22 2008-06-26 International Business Machines Corporation Spoken free-form passwords for light-weight speaker verification using standard speech recognition engines
CN101441869A (zh) * 2007-11-21 2009-05-27 联想(北京)有限公司 语音识别终端用户身份的方法及终端
CN101947152A (zh) * 2010-09-11 2011-01-19 山东科技大学 仿人形义肢的脑电-语音控制系统及工作方法
CN102568478A (zh) * 2012-02-07 2012-07-11 合一网络技术(北京)有限公司 一种基于语音识别的视频播放控制方法和系统
CN103366745A (zh) * 2012-03-29 2013-10-23 三星电子(中国)研发中心 基于语音识别保护终端设备的方法及其终端设备
US20130321400A1 (en) * 2012-06-05 2013-12-05 Apple Inc. 3D Map Views for 3D Maps
US20130325342A1 (en) * 2012-06-05 2013-12-05 Apple Inc. Navigation application with adaptive instruction text
CN103561104A (zh) * 2013-11-11 2014-02-05 北京百纳威尔科技有限公司 智能手机语音控制系统及其语音识别方法
CN103581724A (zh) * 2012-08-09 2014-02-12 纬创资通股份有限公司 控制方法与影音播放系统
CN103646646A (zh) * 2013-11-27 2014-03-19 联想(北京)有限公司 一种语音控制方法及电子设备
CN203721183U (zh) * 2013-12-25 2014-07-16 安徽科大讯飞信息科技股份有限公司 一种语音唤醒装置
CN104269170A (zh) * 2014-09-17 2015-01-07 成都博智维讯信息技术有限公司 一种erp权限语音识别方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040101112A1 (en) * 2002-11-26 2004-05-27 Lite-On Technology Corporation Voice identification method for cellular phone and cellular phone with voiceprint password
US20080154599A1 (en) * 2006-12-22 2008-06-26 International Business Machines Corporation Spoken free-form passwords for light-weight speaker verification using standard speech recognition engines
CN101441869A (zh) * 2007-11-21 2009-05-27 联想(北京)有限公司 语音识别终端用户身份的方法及终端
CN101947152A (zh) * 2010-09-11 2011-01-19 山东科技大学 仿人形义肢的脑电-语音控制系统及工作方法
CN102568478A (zh) * 2012-02-07 2012-07-11 合一网络技术(北京)有限公司 一种基于语音识别的视频播放控制方法和系统
CN103366745A (zh) * 2012-03-29 2013-10-23 三星电子(中国)研发中心 基于语音识别保护终端设备的方法及其终端设备
US20130321400A1 (en) * 2012-06-05 2013-12-05 Apple Inc. 3D Map Views for 3D Maps
US20130325342A1 (en) * 2012-06-05 2013-12-05 Apple Inc. Navigation application with adaptive instruction text
CN103581724A (zh) * 2012-08-09 2014-02-12 纬创资通股份有限公司 控制方法与影音播放系统
CN103561104A (zh) * 2013-11-11 2014-02-05 北京百纳威尔科技有限公司 智能手机语音控制系统及其语音识别方法
CN103646646A (zh) * 2013-11-27 2014-03-19 联想(北京)有限公司 一种语音控制方法及电子设备
CN203721183U (zh) * 2013-12-25 2014-07-16 安徽科大讯飞信息科技股份有限公司 一种语音唤醒装置
CN104269170A (zh) * 2014-09-17 2015-01-07 成都博智维讯信息技术有限公司 一种erp权限语音识别方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106920557A (zh) * 2015-12-24 2017-07-04 中国电信股份有限公司 一种基于小波变换的分布声纹识别方法和装置
CN106549947A (zh) * 2016-10-19 2017-03-29 陆腾蛟 一种即时更新的声纹认证方法及系统
CN107863098A (zh) * 2017-12-07 2018-03-30 广州市艾涛普电子有限公司 一种语音识别控制方法和装置
CN109063165A (zh) * 2018-08-15 2018-12-21 深圳市诺信连接科技有限责任公司 一种erp文件查询管理系统
CN109063165B (zh) * 2018-08-15 2022-04-19 深圳市诺信连接科技有限责任公司 一种erp文件查询管理系统
CN110570120A (zh) * 2019-09-06 2019-12-13 Oppo(重庆)智能科技有限公司 Erp智能下单方法、装置、系统以及存储介质

Also Published As

Publication number Publication date
CN104200807B (zh) 2017-11-17

Similar Documents

Publication Publication Date Title
US10621968B2 (en) Method and apparatus to synthesize voice based on facial structures
CN105895103B (zh) 一种语音识别方法及装置
CN104269170B (zh) 一种erp权限语音识别方法
CN104200807A (zh) 一种erp语音控制方法
CN106558307A (zh) 智能对话处理设备、方法和系统
US9349370B2 (en) Speech recognition terminal device, speech recognition system, and speech recognition method
CN103106061A (zh) 语音输入方法和装置
US20230419957A1 (en) User profile linking
US9653074B2 (en) Wireless photographic device and voice setup method therefor
CN110908631A (zh) 情感交互方法、装置、设备及计算机可读存储介质
CN104240698A (zh) 一种语音识别的方法
KR20140049922A (ko) 사용자 정보를 이용한 다국어 자동통역기의 언어인식 장치
CN103903623B (zh) 一种信息处理方法及电子设备
KR20160138613A (ko) 이모티콘을 이용한 자동통역 방법 및 이를 이용한 장치
CN106057197B (zh) 一种语音定时操作方法、装置及系统
CN111128127A (zh) 一种语音识别处理方法及装置
KR102373247B1 (ko) 네트워크를 이용한 사용자 적응 음성 명령 인식 방법 및 그 장치
KR102622350B1 (ko) 전자 장치 및 그 제어 방법
KR20210098250A (ko) 전자 장치 및 이의 제어 방법
KR102034220B1 (ko) 인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법
KR102417899B1 (ko) 차량의 음성인식 시스템 및 방법
CN105118507A (zh) 声控系统及其控制方法
JP2010197709A (ja) 音声認識応答方法、音声認識応答システム、及びそのプログラム
CN117238275B (zh) 基于常识推理的语音合成模型训练方法、装置及合成方法
JP6680125B2 (ja) ロボットおよび音声対話方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Ye Xindong

Inventor before: Cao Yi

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20171017

Address after: 325000 Zhejiang, Ouhai, South East Road, No. 38, Wenzhou National University Science Park Incubator

Applicant after: Wenzhou University

Address before: 610000 No. 25 Qin Fang street, hi tech Development Zone, Sichuan, Chengdu

Applicant before: CHENGDU BIZ-UNITED INFORMATION TECHNOLOGY CO., LTD.

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171117

Termination date: 20180918