CN108962242A - 一种工业搬运机器人语义识别方法 - Google Patents
一种工业搬运机器人语义识别方法 Download PDFInfo
- Publication number
- CN108962242A CN108962242A CN201810684962.1A CN201810684962A CN108962242A CN 108962242 A CN108962242 A CN 108962242A CN 201810684962 A CN201810684962 A CN 201810684962A CN 108962242 A CN108962242 A CN 108962242A
- Authority
- CN
- China
- Prior art keywords
- recognition methods
- human speech
- carrying machine
- machine human
- voice signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000010276 construction Methods 0.000 claims abstract description 6
- 239000008188 pellet Substances 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 4
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种工业搬运机器人语义识别方法,包括以下步骤:步骤S1,将所有指令构建成本体模型,本体模型包括类、对象和实例;步骤S2,当操作人员发出语音指令时,机器人采集此语音信号;步骤S3,对语音信号进行识别以获得整个语句;步骤S4,基于本体模型对语句进行语义推理,识别出语句对应的指令;步骤S5,机器人根据此语音指令进行相应的操作。本发明通过构建本体模型并且利用本体推理机来进行语义解析,提升语义识别效果。
Description
技术领域
本发明涉及工业智能机器人技术领域,具体涉及一种工业搬运机器人语义识别方法。
背景技术
搬运机器人作为最早应用于生产的两种工业机器人之一,在工业生产自动化中,一直扮演着非常重要角色。并且在现有的工业机器人已装机总数中,搬运机器人也占着较大的比例。伴随着工业机器人应用范围的不断扩展,搬运机器人呈现向食品饮料、家用电器、半导体晶圆、液晶面板等多元行业发展的趋势,成为工业机器人领域发展的一个新增长点。
在现代自动化生产的过程中,工业搬运机器人应用的引导控制系统原理主要有语义识别,就是让工业搬运机器人有听觉功能,能理解操作员发出的语音指令,并迅速做出反应,从而实现人机交互。随着现有技术中语义识别技术的发展,通过语音指令来控制机器人进行相应的操作已经取得实质性的突破。但是用于工业搬运的机器人,其能够识别的语音指令都是事先设定好的,操作人员在进行操作之前,都会进行培训,使用已经编程好的语音指令去操作机器人。对于未设定的语音指令,机器人识别率很低。
综上所述,如何提高用于工业搬运机器人的语义识别效果,成为亟待解决的技术问题。
发明内容
本发明的目的在于克服现有技术中的不足,提出一种工业搬运机器人语义识别方法,解决现有技术中机器人语义识别效果差的技术问题。
为解决上述技术问题,本发明提供了一种工业搬运机器人语义识别方法,其特征是,包括以下步骤:
步骤S1,将所有指令构建成本体模型,本体模型包括类、对象和实例;
步骤S2,当操作人员发出语音指令时,机器人采集此语音信号;
步骤S3,对语音信号进行识别以获得整个语句;
步骤S4,基于本体模型对语句进行语义推理,识别出语句对应的指令;
步骤S5,机器人根据此语音指令进行相应的操作。
优选的,对操作人员发出的语音信号进行采样的采样率为8KHz或16KHz。
优选的,对操作人员的语音信号进行去噪处理。
优选的,去噪处理时采用小波去噪方法。
优选的,语音识别采用模版匹配法。
优选的,语义推理时采用pellet推理机进行推理。
与现有技术相比,本发明所达到的有益效果是:本发明采用小波去噪的方法来去除语音信号中大部分噪声,大大提高对操作人员语音指令的识别率,通过对指令构建本体模型并且利用本体推理机来进行语义解析,提升语义识别效果。
附图说明
图1为本发明方法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明的一种工业搬运机器人语义识别方法,如图1所示,包括以下步骤:
步骤S1,将所有指令构建成本体模型,本体模型包括类、对象和实例。
本体(Ontology)是对某领域内客观存在的概念、概念的属性及其相互之间的关系的显示说明或表示。将机器人的所有指令构建成本体模型,并且包括指令的同义词、近义词等都囊括在本体模型中,以便在构建好的本体基础上进行语义推理。本体模型构建方法可以现有现有技术中较成熟的七步法或Methontology方法。
步骤S2,当操作人员发出语音指令时,机器人采集此语音信号。
对操作人员发出的语音信号进行采样的采样率可以为8KHz或16KHz,本实施例中采样频率为8KHz。由于机器人的工作环境嘈杂,存在环境噪声,为了更好的提高语义识别效果,需要对操作人员的语音信号进行去噪处理,以提高语义识别的效率。本实施例中采用小波去噪的方法来去除语音信号中大部分噪声,大大提高对操作人员语音指令的识别率。
采用小波去噪方法进行去噪的原理是,对带噪的语音信号进行小波变换,得到各个不同频带的子波信号通过频率的高低,可以将语音信号和白噪声粗略地分开,用小波变换就可以去除高频部分的噪声。其实质上就是减少噪声产生的小波系统,保留真实信号的系数。
步骤S3,对语音信号进行识别以获得整个语句;
语音识别可以采用现有技术中的模版匹配法、随机模型法或概率语法分析法。本发明中采用模版匹配法。采用模版匹配法时,在训练阶段,操作人员将所有指令中的每一个指令词依次说一遍,并且将其特征向量作为模板存入模板 库。在识别阶段,将输入语音的特征向量序列,依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。
步骤S4,基于本体模型对语句进行语义推理,识别出语句对应的指令。
语义推理时采用pellet推理机进行推理,得出操作人员发出语句中对应的指令。
步骤S5,机器人根据此语音指令进行相应的操作。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。
Claims (6)
1.一种工业搬运机器人语义识别方法,其特征是,包括以下步骤:
步骤S1,将所有指令构建成本体模型,本体模型包括类、对象和实例;
步骤S2,当操作人员发出语音指令时,机器人采集此语音信号;
步骤S3,对语音信号进行识别以获得整个语句;
步骤S4,基于本体模型对语句进行语义推理,识别出语句对应的指令;
步骤S5,机器人根据此语音指令进行相应的操作。
2.根据权利要求1所述的一种工业搬运机器人语义识别方法,其特征是,对操作人员发出的语音信号进行采样的采样率为8KHz或16KHz。
3.根据权利要求1所述的一种工业搬运机器人语义识别方法,其特征是,对操作人员的语音信号进行去噪处理。
4.根据权利要求3所述的一种工业搬运机器人语义识别方法,其特征是,去噪处理时采用小波去噪方法。
5.根据权利要求1所述的一种工业搬运机器人语义识别方法,其特征是,语音识别采用模版匹配法。
6.根据权利要求1所述的一种工业搬运机器人语义识别方法,其特征是,语义推理时采用pellet推理机进行推理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810684962.1A CN108962242A (zh) | 2018-06-28 | 2018-06-28 | 一种工业搬运机器人语义识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810684962.1A CN108962242A (zh) | 2018-06-28 | 2018-06-28 | 一种工业搬运机器人语义识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108962242A true CN108962242A (zh) | 2018-12-07 |
Family
ID=64487307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810684962.1A Pending CN108962242A (zh) | 2018-06-28 | 2018-06-28 | 一种工业搬运机器人语义识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108962242A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020095286A1 (en) * | 2001-01-12 | 2002-07-18 | International Business Machines Corporation | System and method for relating syntax and semantics for a conversational speech application |
US20020173960A1 (en) * | 2001-01-12 | 2002-11-21 | International Business Machines Corporation | System and method for deriving natural language representation of formal belief structures |
CN102394061A (zh) * | 2011-11-08 | 2012-03-28 | 中国农业大学 | 基于语义检索的文语转换方法及系统 |
CN105632494A (zh) * | 2015-12-29 | 2016-06-01 | 青岛海尔智能家电科技有限公司 | 智能家电设备的控制方法及装置 |
CN105869642A (zh) * | 2016-03-25 | 2016-08-17 | 海信集团有限公司 | 一种语音文本的纠错方法及装置 |
CN106649672A (zh) * | 2016-12-14 | 2017-05-10 | 华南师范大学 | 一种基于语义网的安全数据语义分析方法及系统 |
CN106970906A (zh) * | 2016-01-14 | 2017-07-21 | 芋头科技(杭州)有限公司 | 一种基于语句分段的语义分析方法 |
CN106970908A (zh) * | 2016-01-14 | 2017-07-21 | 芋头科技(杭州)有限公司 | 一种语音内容分析方法 |
-
2018
- 2018-06-28 CN CN201810684962.1A patent/CN108962242A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020095286A1 (en) * | 2001-01-12 | 2002-07-18 | International Business Machines Corporation | System and method for relating syntax and semantics for a conversational speech application |
US20020173960A1 (en) * | 2001-01-12 | 2002-11-21 | International Business Machines Corporation | System and method for deriving natural language representation of formal belief structures |
CN102394061A (zh) * | 2011-11-08 | 2012-03-28 | 中国农业大学 | 基于语义检索的文语转换方法及系统 |
CN105632494A (zh) * | 2015-12-29 | 2016-06-01 | 青岛海尔智能家电科技有限公司 | 智能家电设备的控制方法及装置 |
CN106970906A (zh) * | 2016-01-14 | 2017-07-21 | 芋头科技(杭州)有限公司 | 一种基于语句分段的语义分析方法 |
CN106970908A (zh) * | 2016-01-14 | 2017-07-21 | 芋头科技(杭州)有限公司 | 一种语音内容分析方法 |
CN105869642A (zh) * | 2016-03-25 | 2016-08-17 | 海信集团有限公司 | 一种语音文本的纠错方法及装置 |
CN106649672A (zh) * | 2016-12-14 | 2017-05-10 | 华南师范大学 | 一种基于语义网的安全数据语义分析方法及系统 |
Non-Patent Citations (1)
Title |
---|
曾向阳等: "《图形与多媒体技术在装备IETM中的应用》", 西北工业大学出版社 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190035385A1 (en) | User-provided transcription feedback and correction | |
Renkens | Capsule networks for low resource spoken language understanding | |
CN107972028A (zh) | 人机交互方法、装置及电子设备 | |
US11468892B2 (en) | Electronic apparatus and method for controlling electronic apparatus | |
Sharma et al. | Leveraging acoustic and linguistic embeddings from pretrained speech and language models for intent classification | |
Zeng | Implementation of Embedded Technology-Based English Speech Identification and Translation System. | |
CN108962242A (zh) | 一种工业搬运机器人语义识别方法 | |
Masumura et al. | Phoneme-to-Grapheme Conversion Based Large-Scale Pre-Training for End-to-End Automatic Speech Recognition. | |
Shi et al. | An end-to-end conformer-based speech recognition model for mandarin radiotelephony communications in civil aviation | |
Liu et al. | Exploring a unified attention-based pooling framework for speaker verification | |
Jain et al. | Voice automated mobile robot | |
Tufis et al. | Making pepper understand and respond in romanian | |
CN106910498A (zh) | 提高语音控制命令词识别率的方法 | |
Ultes et al. | A theoretical framework for a user-centered spoken dialog manager | |
CN109147775A (zh) | 一种基于神经网络的语音识别方法及装置 | |
Fasola et al. | Modeling dynamic spatial relations with global properties for natural language-based human-robot interaction | |
Sutherland et al. | Inferring robot actions from verbal commands using shallow semantic parsing | |
Gonsior et al. | Towards a dialog strategy for handling miscommunication in human-robot dialog | |
Zhu et al. | Convenience of voice interaction design in the 5g era to adapt to agricultural machinery | |
Kumar et al. | Comparative Analysis of Features In a Speech Emotion Recognition System using Convolutional Neural Networks | |
Takahashi et al. | Operating a robot by nonverbal voice based on ranges of formants | |
Lopes et al. | From robust spoken language understanding to knowledge acquisition and management. | |
Chang et al. | Design and Implementation of Wake-on-Voice and Command Recognition Algorithm | |
CN116994586A (zh) | 语音识别模型的训练方法及装置、电子设备和存储介质 | |
Okomba et al. | Development of a speech controlled water tap and fan system using linear predictive coefficient for feature extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181207 |