CN108492822A - 一种基于工业应用的语音识别方法 - Google Patents
一种基于工业应用的语音识别方法 Download PDFInfo
- Publication number
- CN108492822A CN108492822A CN201810155407.XA CN201810155407A CN108492822A CN 108492822 A CN108492822 A CN 108492822A CN 201810155407 A CN201810155407 A CN 201810155407A CN 108492822 A CN108492822 A CN 108492822A
- Authority
- CN
- China
- Prior art keywords
- equipment end
- message
- commercial application
- unit
- audio recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000006243 chemical reaction Methods 0.000 claims abstract description 7
- 238000007689 inspection Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 7
- 238000013519 translation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于工业应用的语音识别方法,包括以下步骤:(1)通过服务器端发送具体的任务消息给设备端;(2)设备端通过对消息的转化、信号降噪处理,通过语音的形式播放出来;所述设备端接收单元接收消息完成,控制单元会输出操控指令给播报单元,通过播报单元将接收的消息进行语音播报;(3)设备端通过语音识别模块对语音进行识别、信号处理、信号转化,通过对语音解析,转化成文字或命令执行操作;所述设备端通过语音控制接口,发送语音指令,通过接收模块识别语音指令,输出单元对指令进行执行。本发明的方法有效的减轻了在工业运行过程中工作人员工作量,提高了运行人员在操作繁杂的系统时的工作效率。
Description
技术领域
本发明涉及一种语音识别方法,具体是一种基于工业应用的语音识别方法。
背景技术
语音识别技术,也被称为自动语音识别(英语:Automatic Speech Recognition,ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
语音识别方法主要是模式匹配法。在训练阶段,用户将词汇表中的每一词依次说一遍,并且将其特征矢量作为模板存入模板库。在识别阶段,将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。
目前语音识别技术在工业运行过程中工作人员工作量大,运行人员在操作繁杂的系统时工作效率低下。
发明内容
本发明的目的在于提供一种基于工业应用的语音识别方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于工业应用的语音识别方法,包括以下步骤:
(1)通过服务器端发送具体的任务消息给设备端;
(2)设备端通过对消息的转化、信号降噪处理,通过语音的形式播放出来;
(3)设备端通过语音识别模块对语音进行识别、信号处理、信号转化,通过对语音解析,转化成文字或命令执行操作。
作为本发明进一步的方案:步骤(1)中所述服务器端通过发送端口发送具体巡点检指令给设备端。
作为本发明再进一步的方案:步骤(2)中所述设备端接收单元接收消息完成,控制单元会输出操控指令给播报单元,通过播报单元将接收的消息进行语音播报。
作为本发明再进一步的方案:步骤(3)中所述设备端通过语音控制接口,发送语音指令,通过接收模块识别语音指令,输出单元对指令进行执行。
与现有技术相比,本发明的有益效果是:本方法有效的减轻了在工业运行过程中工作人员工作量,提高了运行人员在操作繁杂的系统时的工作效率。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中,一种基于工业应用的语音识别方法,包括以下步骤:
(1)通过服务器端发送具体的任务消息给设备端;所述服务器端通过发送端口发送具体巡点检指令给设备端;
(2)设备端通过对消息的转化、信号降噪处理,通过语音的形式播放出来;所述设备端接收单元接收消息完成,控制单元会输出操控指令给播报单元,通过播报单元将接收的消息进行语音播报;
(3)设备端通过语音识别模块对语音进行识别、信号处理、信号转化,通过对语音解析,转化成文字或命令执行操作;所述设备端通过语音控制接口,发送语音指令,通过接收模块识别语音指令,输出单元对指令进行执行。
本发明的方法有效的减轻了在工业运行过程中工作人员工作量,提高了运行人员在操作繁杂的系统时的工作效率。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (4)
1.一种基于工业应用的语音识别方法,其特征在于,包括以下步骤:
(1)通过服务器端发送具体的任务消息给设备端;
(2)设备端通过对消息的转化、信号降噪处理,通过语音的形式播放出来;
(3)设备端通过语音识别模块对语音进行识别、信号处理、信号转化,通过对语音解析,转化成文字或命令执行操作。
2.根据权利要求1所述的基于工业应用的语音识别方法,其特征在于,步骤(1)中所述服务器端通过发送端口发送具体巡点检指令给设备端。
3.根据权利要求1所述的基于工业应用的语音识别方法,其特征在于,步骤(2)中所述设备端接收单元接收消息完成,控制单元会输出操控指令给播报单元,通过播报单元将接收的消息进行语音播报。
4.根据权利要求1所述的基于工业应用的语音识别方法,其特征在于,步骤(3)中所述设备端通过语音控制接口,发送语音指令,通过接收模块识别语音指令,输出单元对指令进行执行。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810155407.XA CN108492822A (zh) | 2018-02-23 | 2018-02-23 | 一种基于工业应用的语音识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810155407.XA CN108492822A (zh) | 2018-02-23 | 2018-02-23 | 一种基于工业应用的语音识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108492822A true CN108492822A (zh) | 2018-09-04 |
Family
ID=63340913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810155407.XA Pending CN108492822A (zh) | 2018-02-23 | 2018-02-23 | 一种基于工业应用的语音识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108492822A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827828A (zh) * | 2019-11-27 | 2020-02-21 | 云南电网有限责任公司电力科学研究院 | 一种电力设备用语音交互系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2672992Y (zh) * | 2003-08-21 | 2005-01-19 | 闭耀 | 多功能电话巡测报警监听控制器 |
WO2009111957A1 (zh) * | 2008-03-10 | 2009-09-17 | 华为技术有限公司 | 一种线路状态检测方法、装置和预测式外呼系统 |
CN103220181A (zh) * | 2013-04-27 | 2013-07-24 | 北京百度网讯科技有限公司 | 数据中心移动巡检系统、服务器、终端设备 |
CN104167207A (zh) * | 2014-06-20 | 2014-11-26 | 国家电网公司 | 一种基于变电站巡检机器人的设备声音识别方法 |
WO2016127550A1 (zh) * | 2015-02-13 | 2016-08-18 | 百度在线网络技术(北京)有限公司 | 人机语音交互方法和装置 |
CN106228986A (zh) * | 2016-07-26 | 2016-12-14 | 北京奇虎科技有限公司 | 一种语音识别引擎的自动化测试方法、装置和系统 |
US20180007210A1 (en) * | 2016-06-29 | 2018-01-04 | Paypal, Inc. | Voice-controlled audio communication system |
-
2018
- 2018-02-23 CN CN201810155407.XA patent/CN108492822A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2672992Y (zh) * | 2003-08-21 | 2005-01-19 | 闭耀 | 多功能电话巡测报警监听控制器 |
WO2009111957A1 (zh) * | 2008-03-10 | 2009-09-17 | 华为技术有限公司 | 一种线路状态检测方法、装置和预测式外呼系统 |
CN103220181A (zh) * | 2013-04-27 | 2013-07-24 | 北京百度网讯科技有限公司 | 数据中心移动巡检系统、服务器、终端设备 |
CN104167207A (zh) * | 2014-06-20 | 2014-11-26 | 国家电网公司 | 一种基于变电站巡检机器人的设备声音识别方法 |
WO2016127550A1 (zh) * | 2015-02-13 | 2016-08-18 | 百度在线网络技术(北京)有限公司 | 人机语音交互方法和装置 |
US20180007210A1 (en) * | 2016-06-29 | 2018-01-04 | Paypal, Inc. | Voice-controlled audio communication system |
CN106228986A (zh) * | 2016-07-26 | 2016-12-14 | 北京奇虎科技有限公司 | 一种语音识别引擎的自动化测试方法、装置和系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827828A (zh) * | 2019-11-27 | 2020-02-21 | 云南电网有限责任公司电力科学研究院 | 一种电力设备用语音交互系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021159688A1 (zh) | 声纹识别方法、装置、存储介质、电子装置 | |
JP4902617B2 (ja) | 音声認識システム、音声認識方法、音声認識クライアントおよびプログラム | |
CN110992932B (zh) | 一种自学习的语音控制方法、系统及存储介质 | |
CN109741754A (zh) | 一种会议语音识别方法及系统、存储介质及终端 | |
KR101237799B1 (ko) | 문맥 종속형 음성 인식기의 환경적 변화들에 대한 강인성을 향상하는 방법 | |
CN111477216A (zh) | 一种用于对话机器人的音意理解模型的训练方法及系统 | |
JPH01102599A (ja) | 音声認識方法 | |
CN109147768A (zh) | 一种基于深度学习的语音识别方法及系统 | |
Qian et al. | A two-pass framework of mispronunciation detection and diagnosis for computer-aided pronunciation training | |
US11763801B2 (en) | Method and system for outputting target audio, readable storage medium, and electronic device | |
CN112420050B (zh) | 一种语音识别方法、装置和电子设备 | |
CN104882141A (zh) | 一种基于时延神经网络和隐马尔可夫模型的串口语音控制投影系统 | |
CN115249479A (zh) | 基于brnn的电网调度复杂语音识别方法、系统及终端 | |
CN109036387A (zh) | 视频语音识别方法及系统 | |
CN108492822A (zh) | 一种基于工业应用的语音识别方法 | |
CN109859746B (zh) | 一种基于tts的语音识别语料库生成方法及系统 | |
Mirishkar et al. | CSTD-Telugu corpus: Crowd-sourced approach for large-scale speech data collection | |
JP2545914B2 (ja) | 音声認識方法 | |
CN108717854A (zh) | 基于优化gfcc特征参数的说话人识别方法 | |
JP3039399B2 (ja) | 非母国語音声認識装置 | |
CN110085212A (zh) | 一种用于cnc程序控制器的语音识别方法 | |
Qi et al. | Robust Automatic Speech Recognition via WavAugment Guided Phoneme Adversarial Training | |
CN114155856A (zh) | 一种日语语音识别系统及识别方法 | |
Effendi et al. | Weakly-Supervised Speech-to-Text Mapping with Visually Connected Non-Parallel Speech-Text Data Using Cyclic Partially-Aligned Transformer. | |
Jin et al. | W-GVKT: Within-Global-View Knowledge Transfer for Speaker Verification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180904 |