CN106653015A - 一种机器人语音识别方法及装置 - Google Patents

一种机器人语音识别方法及装置 Download PDF

Info

Publication number
CN106653015A
CN106653015A CN201610969690.0A CN201610969690A CN106653015A CN 106653015 A CN106653015 A CN 106653015A CN 201610969690 A CN201610969690 A CN 201610969690A CN 106653015 A CN106653015 A CN 106653015A
Authority
CN
China
Prior art keywords
keyword
standard commands
order
word
commands
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610969690.0A
Other languages
English (en)
Inventor
张运军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Double Monkey Technology Co Ltd
Original Assignee
Hainan Double Monkey Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan Double Monkey Technology Co Ltd filed Critical Hainan Double Monkey Technology Co Ltd
Priority to CN201610969690.0A priority Critical patent/CN106653015A/zh
Publication of CN106653015A publication Critical patent/CN106653015A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施方式公开了一种机器人语音识别方法,包括:接收语音命令;解析所述语音命令获得语音特征;获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作。区别于现有技术的情况,本发明提供的语音操控方法,识别解析语音命令更灵活,可以解析获得多个标准命令,克服了一次只能接受识别一个标准命令,导致用户要请求一个较为复杂的功能时,只能不断通过与系统交互,才能最终完成想要的功能的缺陷,提高用户体验。

Description

一种机器人语音识别方法及装置
技术领域
本发明实施方式涉及领域,特别是涉及。
背景技术
一般的,在酒店大堂、机场大厅、客运站等人流秘籍的地方都需要设置供游客咨询的咨询台,咨询台的人员负责解决游客的问题。但是在人流量大的地方,游客数量多,需要解决的问题也多,这样的需要咨询台的人员也多,需要投入大量的人力。游客多了之后,提出的问题也多了,同时也对咨询人员的知识面提出了一些挑战。
发明内容
本发明实施方式主要解决的技术问题是提供一种,能够。
为解决上述技术问题,本发明实施方式采用的一个技术方案是:提供一种机器人语音识别方法,包括:
接收语音命令;
解析所述语音命令获得语音特征;
获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作。
为解决上述技术问题,本发明实施方式采用的另一个技术方案是:提供一种机器人语音装置,包括:
接收单元,用于接收语音命令;
解析单元,用于解析所述语音命令获得语音特征;
操作单元,用于获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作。
本发明实施方式的有益效果是:区别于现有技术的情况,本发明提供的语音操控方法,识别解析语音命令更灵活,可以解析获得多个标准命令,克服了一次只能接受识别一个标准命令,导致用户要请求一个较为复杂的功能时,只能不断通过与系统交互,才能最终完成想要的功能的缺陷,提高用户体验。
附图说明
图1是本发明提供的一种机器人语音识别方法的流程图;
图2是本发明提供的一种机器人语音识别装置的结构示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
如图1所示,本发明实施例提供一种机器人语音识别方法,包括:
11、接收语音命令。
12、解析所述语音命令获得至少一语音特征,所述语音特征包括命令词和/或关键词。
13、获得所述至少一语音特征对应的操作指令,并执行所述操作指令对应的操作。
本发明实施例语音导航方法的执行主体可以是智能机器人。
上述步骤11中接收语音命令的方式可以包括:
(1)智能机器人接收“语音识别”功能按键的触发指令后进入语音识别模式,获取所述语音命令。
(2)在默认状态下,智能机器人识别到预设的语音模式进入指令后进入语音识别模式,获取语音命令。示例的,智能机器人在预设状态下,识别到“HELLO!”的语音识别模式进入指令,进入语音识别模式后接收语音命令。
上述步骤12中,解析语音命令获得语音特征的方法为现有技术,在此不做赘述。
上述步骤13中,操作指令包括标准命令和/或关键词,识别出语音特征中的命令词对应的标准命令和关键词,所述关键词为所述命令词的执行对象。
在存储的标准命令库中查找得到与所述至少一命令词匹配对应的至少一标准命令,获得标准命令,所述标准命令库包括语音库和/或文本库,匹配方式包括以下至少一种:
方式1:识别出语音命令的命令词语音;在标准命令库中的语音库中匹配与所述语音特征对应的标准命令。
方式2:识别出语音命令对应的命令词文本信息;在标准命令库中的文本库中匹配与所述文本信息对应的标准命令。
命令词、标准命令包括但不限于上述表格中所列的内容。
获取的语音特征为:“去..”、“开车去..”等时,在命令库中查找到匹配的标准命令为“导航至..”。
获取的语音特征为:“附近的..”、“找附近的..”、“找附近的..”等时,在命令库中查找到匹配的标准命令为“搜索附近的..兴趣点”。
获取的语音特征为:“预定”、“订酒店”、“开房”等时,在命令库中查找到匹配的标准命令为“预定酒店”。
在关键词库中匹配与所述至少一关键词,将所述至少一关键词设为命令词的执行对象。所述标关键词库包括语音库和/或文本库,匹配方式包括以下至少一种:
方式1:识别出语音命令的关键词语音;在关键词库中的语音库中匹配与所述关键词语音对应的预设关键词。
方式2:识别出语音命令对应的关键词文本信息;在关键词库的文本库中匹配与所述关键词文本信息对应的的预设关键词。
可选的,所述标准语音库可以在存储在智能电子设备本地,也可以存储在在服务器端。存储在服务器端时,由智能电子设备将语音命令(或者语音特征)发送给服务器,由服务器在服务器侧查找并返回。
上述步骤12、13中,解析获得的命令词和关键词为一个时,在标准命令库中找到与之对应的标准命令,在关键词库中找到与关键词匹配的关键词,将该关键词设为标准命令的执行对象并执行与所述标准命令对应的操作。在解析获得的命令词和关键词为二个或者多个时,在标准命令库中找到与所述二个或多个命令词对应的二个或多个操作指令,在关键词库中找到与二个或多个关键词匹配的预设关键词,将该二个或多个关键词设为二个或多个标准命令的执行对象并执行与所述操作指令对应的操作。
执行所述所述二个或多个操作指令对应的操作的方式包括:在多个步骤中依次执行二个或多个操作指令对应的操作,或者在一个步骤中执行所述二个或多个操作命令对应的操作。
示例性的,语音命令为“找会展中心找附近的餐馆”,进行语音命令解析,得到命令词为“找”和“找附近的”,关键词为“会展中心”和“餐馆”。在标准命令库中查找到与命令词对应的标准命令为“寻找”和“搜索..附近的兴趣点”,则该语音命令的执行步骤为:找到“会展中心”的地点并搜索“会展中心”附近的餐馆。语音命令中包含二个操作指令,在二个步骤中依次执行找到到“会展中心”的地点和搜索“会展中心”附近的餐馆的操作。
示例性的,语音命令为“我要预定会展中心附近的酒店”,进行语音命令解析,得到命令词为“预定”和“附近的”,关键词为“会展中心”和“酒店”。在标准命令库中查找到与命令词对应的标准命令为“预定酒店”和“找到”,则该语音命令的执行步骤为:找到“会展中心”的地点搜索可预定的酒店,显示可预定酒店的信息。语音命令中包含二个操作指令,在一个步骤中执行找到地点并显示预定信息的操作。
可见,与现有技术先比,本发明提供的语音操控方法,识别解析语音命令更灵活,可以解析获得多个标准命令,克服了一次只能接受识别一个标准命令,导致用户要请求一个较为复杂的功能时,只能不断通过与系统交互,才能最终完成想要的功能的缺陷,提高用户体验。
如图2所示,本发明实施例提供一种机器人语音识别装置,包括:
接收单元21,用于接收语音命令。
解析单元22,用于解析所述语音命令获得至少一语音特征,所述语音特征包括命令词和/或关键词。
操作单元23,用于获得所述至少一语音特征对应的操作指令,并执行所述操作指令对应的操作。
接收单元21还可以用于:
(1)接收“语音识别”功能按键的触发指令后进入语音识别模式,获取所述语音命令。
(2)在默认状态下,识别到预设的语音模式进入指令后进入语音识别模式,获取语音命令。示例的,智能机器人在预设状态下,识别到“HELLO!”的语音识别模式进入指令,进入语音识别模式后接收语音命令。
解析语音命令获得语音特征的方法为现有技术,在此不做赘述。
解析单元22,还用于识别出语音特征中的命令词对应的标准命令和关键词,所述关键词为所述命令词的执行对象。
在存储的标准命令库中查找得到与所述至少一命令词匹配对应的至少一标准命令,获得标准命令,所述标准命令库包括语音库和/或文本库,匹配方式包括以下至少一种:
方式1:识别出语音命令的命令词语音;在标准命令库中的语音库中匹配与所述语音特征对应的标准命令。
方式2:识别出语音命令对应的命令词文本信息;在标准命令库中的文本库中匹配与所述文本信息对应的标准命令。
获取的语音特征为:“去..”、“开车去..”等时,在命令库中查找到匹配的标准命令为“导航至..”。
获取的语音特征为:“附近的..”、“找附近的..”、“找附近的..”等时,在命令库中查找到匹配的标准命令为“搜索附近的..兴趣点”。
获取的语音特征为:“预定”、“订酒店”、“开房”等时,在命令库中查找到匹配的标准命令为“预定酒店”。
解析单元22还用于在关键词库中匹配与所述至少一关键词,将所述至少一关键词设为命令词的执行对象。所述标关键词库包括语音库和/或文本库,匹配方式包括以下至少一种:
方式1:识别出语音命令的关键词语音;在关键词库中的语音库中匹配与所述关键词语音对应的预设关键词。
方式2:识别出语音命令对应的关键词文本信息;在关键词库的文本库中匹配与所述关键词文本信息对应的的预设关键词。
可选的,所述标准语音库可以在存储在智能电子设备本地,也可以存储在在服务器端。存储在服务器端时,由智能电子设备将语音命令(或者语音特征)发送给服务器,由服务器在服务器侧查找并返回。
操作单元23,还用于解析获得的命令词和关键词为一个时,在标准命令库中找到与之对应的标准命令,在关键词库中找到与关键词匹配的预设关键词,将该预设关键词设为标准命令的执行对象并执行与所述标准命令对应的操作。在解析获得的命令词和关键词为二个或者多个时,在标准命令库中找到与所述二个或多个命令词对应的二个或多个操作指令,在关键词库中找到与二个或多个关键词匹配的预设关键词,将该二个或多个预设关键词设为二个或多个标准命令的执行对象并执行与所述操作指令对应的操作。
操作单元23,还用于执行所述所述二个或多个操作指令对应的操作的方式包括:在多个步骤中依次执行二个或多个操作指令对应的操作,或者在一个步骤中执行所述二个或多个操作命令对应的操作。
示例性的,语音命令为“找会展中心找附近的餐馆”,进行语音命令解析,得到命令词为“找”和“找附近的”,关键词为“会展中心”和“餐馆”。在标准命令库中查找到与命令词对应的标准命令为“寻找”和“搜索..附近的兴趣点”,则该语音命令的执行步骤为:找到“会展中心”的地点并搜索“会展中心”附近的餐馆。语音命令中包含二个操作指令,在二个步骤中依次执行找到到“会展中心”的地点和搜索“会展中心”附近的餐馆的操作。
示例性的,语音命令为“我要预定会展中心附近的酒店”,进行语音命令解析,得到命令词为“预定”和“附近的”,关键词为“会展中心”和“酒店”。在标准命令库中查找到与命令词对应的标准命令为“预定酒店”和“找到”,则该语音命令的执行步骤为:找到“会展中心”的地点搜索可预定的酒店,显示可预定酒店的信息。语音命令中包含二个操作指令,在一个步骤中执行找到地点并显示预定信息的操作。
可见,与现有技术先比,本发明提供的语音操控方法,识别解析语音命令更灵活,可以解析获得多个标准命令,克服了一次只能接受识别一个标准命令,导致用户要请求一个较为复杂的功能时,只能不断通过与系统交互,才能最终完成想要的功能的缺陷,提高用户体验。
以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种机器人语音识别方法,其特征在于,包括:
接收语音命令;
解析所述语音命令获得语音特征;
获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作。
2.根据权利要求1所述的方法,其特征在于,所述语音特征包括命令词和/或关键词,所述关键词为所述命令词的执行对象;所述操作指令包括标准命令和/或预设关键词。
3.根据权利要求2所述的方法,其特征在于,在存储的标准命令库中查找得到与所述命令词匹配对应的标准命令,获得标准命令;在关键词库中匹配与所述关键词相匹配的预设关键词。
4.根据权利要求3所述的方法,其特征在于,在解析获得的命令词和关键词为至少二个时,在标准命令库中找到与所述至少二个命令词对应的至少二个标准命令,在关键词库中找到与所述至少二个关键词匹配的预设关键词。
5.根据权利要求4所述的方法,其特征在于,执行所述至少二个操作指令对应的操作的方式包括:在多个步骤中依次执行操作指令对应的操作,或者在一个步骤中执行所述至少二个操作指令对应的操作。
6.一种机器人语音装置,其特征在于,包括:
接收单元,用于接收语音命令;
解析单元,用于解析所述语音命令获得语音特征;
操作单元,用于获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作。
7.根据权利要求1所述的方法,其特征在于,所述解析单元解析获得的语音特征包括命令词和/或关键词,所述关键词为所述命令词的执行对象;所述操作指令包括标准命令和/或预设关键词。
8.根据权利要求1所述的方法,其特征在于,操作单元用于在存储的标准命令库中查找得到与所述命令词匹配对应的标准命令,获得标准命令;在关键词库中匹配与所述关键词相匹配的预设关键词,将所述预设关键词设为标准命令的执行对象。
9.根据权利要求8所述的方法,其特征在于,操作单元在解析获得的命令词和关键词为至少二个时,在标准命令库中找到与所述至少二个命令词对应的至少二个标准命令,在关键词库中找到与至少二个关键词,将该至少二个预设关键词设为至少二个或多个标准命令对应的操作。
10.根据权利要求9所述的方法,其特征在于,操作单元执行所述所述至少二个操作指令对应的操作的方式包括:在多个步骤中依次执行操作指令对应的操作,或者在一个步骤中执行所述至少二个操作指令对应的操作。
CN201610969690.0A 2016-10-28 2016-10-28 一种机器人语音识别方法及装置 Pending CN106653015A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610969690.0A CN106653015A (zh) 2016-10-28 2016-10-28 一种机器人语音识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610969690.0A CN106653015A (zh) 2016-10-28 2016-10-28 一种机器人语音识别方法及装置

Publications (1)

Publication Number Publication Date
CN106653015A true CN106653015A (zh) 2017-05-10

Family

ID=58820863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610969690.0A Pending CN106653015A (zh) 2016-10-28 2016-10-28 一种机器人语音识别方法及装置

Country Status (1)

Country Link
CN (1) CN106653015A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107360066A (zh) * 2017-06-29 2017-11-17 深圳奥比中光科技有限公司 一种家居服务机器人及智能家居系统
CN109147764A (zh) * 2018-09-20 2019-01-04 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备及计算机可读介质
CN110853645A (zh) * 2019-12-02 2020-02-28 三星电子(中国)研发中心 一种识别语音命令的方法及装置
CN113362818A (zh) * 2021-05-08 2021-09-07 山西三友和智慧信息技术股份有限公司 一种基于人工智能的语音交互指导系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593048A (zh) * 2013-10-28 2014-02-19 浙江大学 动物机器人系统的语音导航系统及方法
CN105856243A (zh) * 2016-06-28 2016-08-17 湖南科瑞特科技股份有限公司 一种移动智能机器人
CN105955698A (zh) * 2016-05-04 2016-09-21 深圳市凯立德科技股份有限公司 一种语音操控方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593048A (zh) * 2013-10-28 2014-02-19 浙江大学 动物机器人系统的语音导航系统及方法
CN105955698A (zh) * 2016-05-04 2016-09-21 深圳市凯立德科技股份有限公司 一种语音操控方法及装置
CN105856243A (zh) * 2016-06-28 2016-08-17 湖南科瑞特科技股份有限公司 一种移动智能机器人

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107360066A (zh) * 2017-06-29 2017-11-17 深圳奥比中光科技有限公司 一种家居服务机器人及智能家居系统
CN109147764A (zh) * 2018-09-20 2019-01-04 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备及计算机可读介质
CN110853645A (zh) * 2019-12-02 2020-02-28 三星电子(中国)研发中心 一种识别语音命令的方法及装置
CN113362818A (zh) * 2021-05-08 2021-09-07 山西三友和智慧信息技术股份有限公司 一种基于人工智能的语音交互指导系统及方法

Similar Documents

Publication Publication Date Title
CN108388638B (zh) 语义解析方法、装置、设备及存储介质
CN110459210A (zh) 基于语音分析的问答方法、装置、设备及存储介质
CN106682090A (zh) 主动交互实现装置、方法及智能语音交互设备
CN106653015A (zh) 一种机器人语音识别方法及装置
CN106407178A (zh) 一种会话摘要生成方法及装置
CN104485107B (zh) 名称的语音识别方法、语音识别系统和语音识别设备
JP6675788B2 (ja) 検索結果表示装置、検索結果表示方法、及びプログラム
CN106528613B (zh) 智能问答方法及装置
CN110168535A (zh) 一种信息处理方法及终端、计算机存储介质
US7412383B1 (en) Reducing time for annotating speech data to develop a dialog application
CN103591947B (zh) 移动终端的语音后台导航方法及移动终端
CN107369439A (zh) 一种语音唤醒方法和装置
CN107562760A (zh) 一种语音数据处理方法及装置
KR101934280B1 (ko) 발화내용 분석 장치 및 방법
CN107943914A (zh) 语音信息处理方法和装置
CN106021273A (zh) 面向问答机器人的信息处理方法及系统
CN112269862B (zh) 文本角色标注方法、装置、电子设备和存储介质
CN102855317A (zh) 一种基于演示视频的多模式索引方法及系统
CN110866100A (zh) 一种话术泛化方法、装置及电子设备
CN112951275A (zh) 语音质检方法、装置、电子设备及介质
CN109101538A (zh) 一种面向中文专利文本的实体抽取方法和系统
CN112035630A (zh) 结合rpa和ai的对话交互方法、装置、设备及存储介质
CN107832035A (zh) 一种智能终端的语音输入方法
CN111399629B (zh) 一种终端设备的操作引导方法、终端设备及存储介质
CN108710653A (zh) 一种绘本朗读点播方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170510

WD01 Invention patent application deemed withdrawn after publication