CN106373562A - 一种基于自然语言处理的机器人语音识别方法 - Google Patents
一种基于自然语言处理的机器人语音识别方法 Download PDFInfo
- Publication number
- CN106373562A CN106373562A CN201610788475.0A CN201610788475A CN106373562A CN 106373562 A CN106373562 A CN 106373562A CN 201610788475 A CN201610788475 A CN 201610788475A CN 106373562 A CN106373562 A CN 106373562A
- Authority
- CN
- China
- Prior art keywords
- voice
- natural language
- robot
- language processing
- characteristic parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000003058 natural language processing Methods 0.000 title claims abstract description 12
- 238000000605 extraction Methods 0.000 claims abstract description 7
- 238000001514 detection method Methods 0.000 claims abstract description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000005311 autocorrelation function Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims 1
- 238000001914 filtration Methods 0.000 abstract 1
- 230000008901 benefit Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Manipulator (AREA)
Abstract
本发明提供了一种基于自然语言处理的机器人语音识别方法,其包括以下步骤:S1:将自然语言待作为识别对象经过机器人的话筒转化为电信号语音信号后加在机器人的识别系统输入端;S2:对所述电语音信号经过预处理,包括抗混叠滤波、预加重和端点检测;S3:进行特征提取,对特征参数的要求是提取的特征参数能有效地代表语音特征;S4:语音特征参数的时间序列便构成了语音的模式,将其与己经获得的参考模式逐一进行比较,获得最佳匹配由判决规则决定的参考模式便是识别结果。本发明提供的基于自然语言处理的机器人语音识别方法可以迅速的识别出语音数据,具有极高的识别准确性与识别速度。
Description
技术领域
本发明涉及到语音识别技术,特别是一种基于自然语言处理的机器人语音识别方法。
背景技术
语音识别技术是利用计算机对语音信号进行分析,从而实现对人类语音自动理解的一门学科。语音识别技术己经成为信息科学中一个十分活跃的研究领域,作为一门交叉学科,它正逐步成为信息技术中人机交互的关键技术。
语音识别技术与语音合成技术相结合,能使人们最终甩掉键盘,通过语音命令进行操作。语音技术的应用己经成为一个具有竞争性的新兴高技术产业。与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的愿望。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。近十年来,语音识别技术取得了显著进步,开始从实验室走向市场。当然,在短期内还不可能造出具有和人相比拟的语音识别系统,要建成这样一个系统仍然是人类面临的一个巨大的挑战。
发明内容
为解决上述技术问题,本发明提供了一种基于自然语言处理的机器人语音识别方法,其包括以下步骤:
S1:将自然语言待作为识别对象经过机器人的话筒转化为电信号语音信号后加在机器人的识别系统输入端;
S2:对所述电语音信号经过预处理,包括抗混叠滤波、预加重和端点检测;
S3::进行特征提取,对特征参数的要求是提取的特征参数能有效地代表语音特征,具有很好的区分性各阶参数之间有良好的独立性特征参数要计算方便,以保证语音识别的实时实现;
S4:语音特征参数的时间序列便构成了语音的模式,将其与己经获得的参考模式逐一进行比较,获得最佳匹配由判决规则决定的参考模式便是识别结果,所述参考模式是事先获得并存储,通过提取己知信号的特征作为参考模式。
较佳地,所述特征参数包括短时平均能量或幅度、短时平均过零率、短时自相关函数、线性预测系数、短时傅里叶变换和倒谱。
较佳地,所述机器人在特征提取前需要将电语音信号进行离散化处理。
本发明具有以下有益效果:
本发明提供的基于自然语言处理的机器人语音识别方法可以迅速的识别出语音数据,具有极高的识别准确性与识别速度。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于自然语言处理的机器人语音识别方法示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种基于自然语言处理的机器人语音识别方法,其包括以下步骤:
S1:将自然语言待作为识别对象经过机器人的话筒转化为电信号语音信号后加在机器人的识别系统输入端;
S2:对所述电语音信号经过预处理,包括抗混叠滤波、预加重和端点检测;
S3::进行特征提取,对特征参数的要求是提取的特征参数能有效地代表语音特征,具有很好的区分性各阶参数之间有良好的独立性特征参数要计算方便,以保证语音识别的实时实现;
S4:语音特征参数的时间序列便构成了语音的模式,将其与己经获得的参考模式逐一进行比较,获得最佳匹配由判决规则决定的参考模式便是识别结果,所述参考模式是事先获得并存储,通过提取己知信号的特征作为参考模式。
其中所述特征参数包括短时平均能量或幅度、短时平均过零率、短时自相关函数、线性预测系数、短时傅里叶变换和倒谱。
本实施例中所述机器人在特征提取前需要将电语音信号进行离散化处理。
本发明提供的基于自然语言处理的机器人语音识别方法可以迅速的识别出语音数据,具有极高的识别准确性与识别速度。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (3)
1.一种基于自然语言处理的机器人语音识别方法,其特征在于,包括以下步骤:
S1:将自然语言待作为识别对象经过机器人的话筒转化为电信号语音信号后加在机器人的识别系统输入端;
S2:对所述电语音信号经过预处理,包括抗混叠滤波、预加重和端点检测;
S3::进行特征提取,对特征参数的要求是提取的特征参数能有效地代表语音特征,具有很好的区分性各阶参数之间有良好的独立性特征参数要计算方便,以保证语音识别的实时实现;
S4:语音特征参数的时间序列便构成了语音的模式,将其与己经获得的参考模式逐一进行比较,获得最佳匹配由判决规则决定的参考模式便是识别结果,所述参考模式是事先获得并存储,通过提取己知信号的特征作为参考模式。
2.如权利要求1所述的基于自然语言处理的机器人语音识别方法,其特征在于,所述特征参数包括短时平均能量或幅度、短时平均过零率、短时自相关函数、线性预测系数、短时傅里叶变换和倒谱。
3.如权利要求1所述的基于自然语言处理的机器人语音识别方法,其特征在于,所述机器人在特征提取前需要将电语音信号进行离散化处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610788475.0A CN106373562A (zh) | 2016-08-31 | 2016-08-31 | 一种基于自然语言处理的机器人语音识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610788475.0A CN106373562A (zh) | 2016-08-31 | 2016-08-31 | 一种基于自然语言处理的机器人语音识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106373562A true CN106373562A (zh) | 2017-02-01 |
Family
ID=57898702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610788475.0A Pending CN106373562A (zh) | 2016-08-31 | 2016-08-31 | 一种基于自然语言处理的机器人语音识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106373562A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108172229A (zh) * | 2017-12-12 | 2018-06-15 | 天津津航计算技术研究所 | 一种基于语音识别的身份验证及可靠操控的方法 |
CN109036385A (zh) * | 2018-10-19 | 2018-12-18 | 北京旋极信息技术股份有限公司 | 一种语音指令识别方法、装置及计算机存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101923855A (zh) * | 2009-06-17 | 2010-12-22 | 复旦大学 | 文本无关的声纹识别系统 |
CN103065629A (zh) * | 2012-11-20 | 2013-04-24 | 广东工业大学 | 一种仿人机器人的语音识别系统 |
CN104078039A (zh) * | 2013-03-27 | 2014-10-01 | 广东工业大学 | 基于隐马尔科夫模型的家用服务机器人语音识别系统 |
CN104700843A (zh) * | 2015-02-05 | 2015-06-10 | 海信集团有限公司 | 一种年龄识别的方法及装置 |
CN105261356A (zh) * | 2015-10-30 | 2016-01-20 | 桂林信通科技有限公司 | 一种语音识别系统及方法 |
-
2016
- 2016-08-31 CN CN201610788475.0A patent/CN106373562A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101923855A (zh) * | 2009-06-17 | 2010-12-22 | 复旦大学 | 文本无关的声纹识别系统 |
CN103065629A (zh) * | 2012-11-20 | 2013-04-24 | 广东工业大学 | 一种仿人机器人的语音识别系统 |
CN104078039A (zh) * | 2013-03-27 | 2014-10-01 | 广东工业大学 | 基于隐马尔科夫模型的家用服务机器人语音识别系统 |
CN104700843A (zh) * | 2015-02-05 | 2015-06-10 | 海信集团有限公司 | 一种年龄识别的方法及装置 |
CN105261356A (zh) * | 2015-10-30 | 2016-01-20 | 桂林信通科技有限公司 | 一种语音识别系统及方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108172229A (zh) * | 2017-12-12 | 2018-06-15 | 天津津航计算技术研究所 | 一种基于语音识别的身份验证及可靠操控的方法 |
CN109036385A (zh) * | 2018-10-19 | 2018-12-18 | 北京旋极信息技术股份有限公司 | 一种语音指令识别方法、装置及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Singh et al. | An approach to extract feature using MFCC | |
CN106448654A (zh) | 一种机器人语音识别系统及其工作方法 | |
CN104570835B (zh) | 飞机驾驶舱语音指令控制系统及其操作方法 | |
CN108399923A (zh) | 多人发言中发言人识别方法以及装置 | |
CN102737629A (zh) | 一种嵌入式语音情感识别方法及装置 | |
CN104538034A (zh) | 一种语音识别方法及系统 | |
CN109256139A (zh) | 一种基于Triplet-Loss的说话人识别方法 | |
CN109935226A (zh) | 一种基于深度神经网络的远场语音识别增强系统及方法 | |
CN106448657A (zh) | 一种用于餐厅机器人服务员的连续语音识别系统 | |
CN106782503A (zh) | 基于发音过程中生理信息的自动语音识别方法 | |
CN106373562A (zh) | 一种基于自然语言处理的机器人语音识别方法 | |
CN111128240B (zh) | 一种基于对抗语义擦除的语音情感识别方法 | |
CN108172220A (zh) | 一种新型语音除噪方法 | |
CN105869636A (zh) | 一种语音识别装置及其方法、一种智能电视及其控制方法 | |
CN104240698A (zh) | 一种语音识别的方法 | |
Krishna et al. | Emotion recognition using dynamic time warping technique for isolated words | |
CN104424942A (zh) | 一种提高文字语音输入准确率的方法 | |
CN103903623B (zh) | 一种信息处理方法及电子设备 | |
CN106887226A (zh) | 一种基于人工智能识别的语音识别算法 | |
CN111105798B (zh) | 基于语音识别的设备控制方法 | |
CN104036421A (zh) | 基于语音识别电话号码的银行业务申请书生成系统 | |
Goyal et al. | Issues and challenges of voice recognition in pervasive environment | |
CN106448676A (zh) | 一种基于自然语言处理的机器人语音识别系统 | |
RU2296376C2 (ru) | Способ распознавания слов речи | |
CN114049879A (zh) | 一种基于人工智能算法的语音识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170201 |
|
RJ01 | Rejection of invention patent application after publication |