CN106448676A - 一种基于自然语言处理的机器人语音识别系统 - Google Patents
一种基于自然语言处理的机器人语音识别系统 Download PDFInfo
- Publication number
- CN106448676A CN106448676A CN201610944701.XA CN201610944701A CN106448676A CN 106448676 A CN106448676 A CN 106448676A CN 201610944701 A CN201610944701 A CN 201610944701A CN 106448676 A CN106448676 A CN 106448676A
- Authority
- CN
- China
- Prior art keywords
- module
- voice
- voice signal
- natural language
- robot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003058 natural language processing Methods 0.000 title claims abstract description 12
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 8
- 238000001914 filtration Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000009432 framing Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 6
- 238000007781 pre-processing Methods 0.000 abstract description 3
- 238000004140 cleaning Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Manipulator (AREA)
Abstract
本发明公开了一种基于自然语言处理的机器人语音识别系统,包括依次连接的语音输入模块、预处理模块、特征提取模块、模式匹配模块和识别结果输出模块,模式匹配模块的输入端还连接有模型库,模型库的输入端与特征提取模块的输出端相连。本发明通过对自然语言进行预处理、特征提取、模型训练和模式匹配等一系列的处理,从而使得机器人对自然语言进行语音识别,提高了识别的准确度和效率;通过滤波等处理措施,提高了语音信号的清晰度,从而便于识别;通过该语音识别方法,提高了机器人的智能化水平。
Description
技术领域
本发明属于语音识别技术领域,特别是涉及一种基于自然语言处理的机器人语音识别系统。
背景技术
随着科学技术的发展,语音识别技术正逐步形成一套比较完善的理论体系,其应用产品也相继推出,具有识别自认语音的机器人就是其中一种。在机器人通信系统中加入自然语言和语音识别技术,可完全转变传统机器人通信服务形式。使用具有语音处理和语音技术能力的通信网络,机器人可以非常便捷地从远端的数据库系统中查询与提取有关的信息。自然语言处理技术和语音识别技术正逐步成为信息技术中人机接口的关键技术,在不久的将来,通过语音识别技术与语音合成技术的结合,人们就能够通过语音命令来进行原需要利用按钮控制才可以进行的操作。
发明内容
本发明的目的在于提供一种基于自然语言处理的机器人语音识别系统,通过该系统的应用,解决了现有的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种基于自然语言处理的机器人语音识别系统,包括依次连接的语音输入模块、预处理模块、特征提取模块、模式匹配模块和识别结果输出模块,所述模式匹配模块的输入端还连接有模型库,所述模型库的输入端与特征提取模块的输出端相连。
进一步地,所述语音输入模块用于接收自然语言的语音信号并将其传送至预处理模块;所述预处理模块用于对接收到的语音信号进行预处理并将处理后的语音信号传至特征提取模块,其中预处理包括语音信号的预滤波、语音信号的数字化、语音信号的预加重、语音信号的加窗分帧、语音信号的噪声抑制和语音信号的端点检测;所述特征提取模块用于对语音信号进行语音特征参数的提取,继而将提取到的语音特征参数分别传至模式匹配模块和模型库,其中语音特征包括帧特征矢量;所述模型库用于对收到的语音特征参数进行模型训练,模型训练用于使机器人从大量的真实语音中获取模型参数,继而形成语音参考模式库;所述模式匹配模块用于将待识别的语音特征与模型库中的模型参数进行匹配,继而根据匹配距离输出语音识别结果,并将语音识别结果传至识别结果输出模块;所述识别结果输出模块用于输出语音识别结果。
进一步地,所述语音输入模块包括话筒。
本发明具有以下有益效果:
本发明通过对自然语言进行预处理、特征提取、模型训练和模式匹配等一系列的处理,从而使得机器人对自然语言进行语音识别,提高了识别的准确度和效率;通过滤波等处理措施,提高了语音信号的清晰度,从而便于识别;通过该语音识别方法,提高了机器人的智能化水平。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种基于自然语言处理的机器人语音识别系统的组成框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为一种基于自然语言处理的机器人语音识别系统,包括依次连接的语音输入模块、预处理模块、特征提取模块、模式匹配模块和识别结果输出模块,模式匹配模块的输入端还连接有模型库,模型库的输入端与特征提取模块的输出端相连。
其中,语音输入模块用于接收自然语言的语音信号并将其传送至预处理模块;预处理模块用于对接收到的语音信号进行预处理并将处理后的语音信号传至特征提取模块,其中预处理包括语音信号的预滤波、语音信号的数字化、语音信号的预加重、语音信号的加窗分帧、语音信号的噪声抑制和语音信号的端点检测;特征提取模块用于对语音信号进行语音特征参数的提取,继而将提取到的语音特征参数分别传至模式匹配模块和模型库,其中语音特征包括帧特征矢量;模型库用于对收到的语音特征参数进行模型训练,模型训练用于使机器人从大量的真实语音中获取模型参数,继而形成语音参考模式库;模式匹配模块用于将待识别的语音特征与模型库中的模型参数进行匹配,继而根据匹配距离输出语音识别结果,并将语音识别结果传至识别结果输出模块;识别结果输出模块用于输出语音识别结果。
其中,语音输入模块为话筒。
其中,语音信号的预滤波是采用带通滤波器,预滤波用于抑制输入信号各频域分量中频率超出采样频率一半的所有分量以及抑制50Hz或60Hz的电源工频信号。
其中,语音信号的数字化包括语音信号的采样和语音信号的量化,即首先对语音信号进行采样,然后再对语音信号进行量化,继而得到离散时域的语音信号。
其中,语音信号的预加重是用于提升语音信号中的高频信号的能量,以弥补声音的在唇部辐射时产生的高频部分能量的损失。
其中,语音信号的加窗分帧是将语音信号经过加窗分帧后被处理为短时语音帧,继而把每个短时语音帧看作平稳的随机信号,然后逐帧提取语音信号的特征矢量,最后得到由每一帧参数组成的语音特征参数序列。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
最后需要说明的是,以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (3)
1.一种基于自然语言处理的机器人语音识别系统,其特征在于:包括依次连接的语音输入模块、预处理模块、特征提取模块、模式匹配模块和识别结果输出模块,所述模式匹配模块的输入端还连接有模型库,所述模型库的输入端与特征提取模块的输出端相连。
2.根据权利要求1所述的一种基于自然语言处理的机器人语音识别系统,其特征在于:
所述语音输入模块用于接收自然语言的语音信号并将其传送至预处理模块;
所述预处理模块用于对接收到的语音信号进行预处理并将处理后的语音信号传至特征提取模块,其中预处理包括语音信号的预滤波、语音信号的数字化、语音信号的预加重、语音信号的加窗分帧、语音信号的噪声抑制和语音信号的端点检测;
所述特征提取模块用于对语音信号进行语音特征参数的提取,继而将提取到的语音特征参数分别传至模式匹配模块和模型库,其中语音特征包括帧特征矢量;
所述模型库用于对收到的语音特征参数进行模型训练,模型训练用于使机器人从大量的真实语音中获取模型参数,继而形成语音参考模式库;
所述模式匹配模块用于将待识别的语音特征与模型库中的模型参数进行匹配,继而根据匹配距离输出语音识别结果,并将语音识别结果传至识别结果输出模块;
所述识别结果输出模块用于输出语音识别结果。
3.根据权利要求1所述的一种基于自然语言处理的机器人语音识别系统,其特征在于:所述语音输入模块包括话筒。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610944701.XA CN106448676A (zh) | 2016-10-26 | 2016-10-26 | 一种基于自然语言处理的机器人语音识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610944701.XA CN106448676A (zh) | 2016-10-26 | 2016-10-26 | 一种基于自然语言处理的机器人语音识别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106448676A true CN106448676A (zh) | 2017-02-22 |
Family
ID=58177641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610944701.XA Pending CN106448676A (zh) | 2016-10-26 | 2016-10-26 | 一种基于自然语言处理的机器人语音识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106448676A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107424602A (zh) * | 2017-05-25 | 2017-12-01 | 合肥泽诺信息科技有限公司 | 一种基于语音识别和人体姿态的人机交互式游戏引擎 |
CN111179925A (zh) * | 2019-12-04 | 2020-05-19 | 北京永洪商智科技有限公司 | 一种基于语音识别的报告版面设计系统及其方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1499484A (zh) * | 2002-11-06 | 2004-05-26 | 北京天朗语音科技有限公司 | 汉语连续语音识别系统 |
CN101923855A (zh) * | 2009-06-17 | 2010-12-22 | 复旦大学 | 文本无关的声纹识别系统 |
US20120203547A1 (en) * | 2007-06-20 | 2012-08-09 | At&T Intellectual Property Ii, L.P. | System and method for improving robustness of speech recognition using vocal tract length normalization codebooks |
CN103065629A (zh) * | 2012-11-20 | 2013-04-24 | 广东工业大学 | 一种仿人机器人的语音识别系统 |
CN103474062A (zh) * | 2012-08-06 | 2013-12-25 | 苏州沃通信息科技有限公司 | 一种语音识别方法 |
-
2016
- 2016-10-26 CN CN201610944701.XA patent/CN106448676A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1499484A (zh) * | 2002-11-06 | 2004-05-26 | 北京天朗语音科技有限公司 | 汉语连续语音识别系统 |
US20120203547A1 (en) * | 2007-06-20 | 2012-08-09 | At&T Intellectual Property Ii, L.P. | System and method for improving robustness of speech recognition using vocal tract length normalization codebooks |
CN101923855A (zh) * | 2009-06-17 | 2010-12-22 | 复旦大学 | 文本无关的声纹识别系统 |
CN103474062A (zh) * | 2012-08-06 | 2013-12-25 | 苏州沃通信息科技有限公司 | 一种语音识别方法 |
CN103065629A (zh) * | 2012-11-20 | 2013-04-24 | 广东工业大学 | 一种仿人机器人的语音识别系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107424602A (zh) * | 2017-05-25 | 2017-12-01 | 合肥泽诺信息科技有限公司 | 一种基于语音识别和人体姿态的人机交互式游戏引擎 |
CN111179925A (zh) * | 2019-12-04 | 2020-05-19 | 北京永洪商智科技有限公司 | 一种基于语音识别的报告版面设计系统及其方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106448654A (zh) | 一种机器人语音识别系统及其工作方法 | |
CN108847238B (zh) | 一种服务机器人语音识别方法 | |
CN106448657A (zh) | 一种用于餐厅机器人服务员的连续语音识别系统 | |
CN102737629B (zh) | 一种嵌入式语音情感识别方法及装置 | |
CN106685478B (zh) | 基于信号时频图像信息提取的跳频信号参数估计方法 | |
CN105261356A (zh) | 一种语音识别系统及方法 | |
CN106128465A (zh) | 一种声纹识别系统及方法 | |
CN105810213A (zh) | 一种典型异常声音检测方法及装置 | |
CN103514883B (zh) | 一种自适应实现男女声切换方法 | |
AU1740801A (en) | Methods and apparatuses for signal analysis | |
CN107507623A (zh) | 基于麦克风阵列语音交互的自助服务终端 | |
CN106205623A (zh) | 一种声音转换方法及装置 | |
CN106898361A (zh) | 基于反馈变分模式分解的单通道盲源分离方法 | |
CN108172220B (zh) | 一种新型语音除噪方法 | |
CN106448676A (zh) | 一种基于自然语言处理的机器人语音识别系统 | |
CN105931637A (zh) | 一种可自定义指令识别的语音拍照系统 | |
CN106653020A (zh) | 一种基于深度学习的智慧视听设备多业务控制方法及系统 | |
CN103888606A (zh) | 移动终端及其解锁方法 | |
CN111105798B (zh) | 基于语音识别的设备控制方法 | |
CN112017658A (zh) | 一种基于智能人机交互的操作控制系统 | |
CN106354112A (zh) | 一种用于智能家居设备的语音识别控制系统 | |
CN106782592A (zh) | 一种用于消除网络声音传输的回音和啸叫的系统和方法 | |
CN105070291A (zh) | 基于动态时间规整技术的声控门系统 | |
CN108091327A (zh) | 一种智能语音设备控制方法 | |
CN106887226A (zh) | 一种基于人工智能识别的语音识别算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170222 |
|
RJ01 | Rejection of invention patent application after publication |