CN105955698A - 一种语音操控方法及装置 - Google Patents

一种语音操控方法及装置 Download PDF

Info

Publication number
CN105955698A
CN105955698A CN201610287720.XA CN201610287720A CN105955698A CN 105955698 A CN105955698 A CN 105955698A CN 201610287720 A CN201610287720 A CN 201610287720A CN 105955698 A CN105955698 A CN 105955698A
Authority
CN
China
Prior art keywords
standard commands
interest
point
order
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610287720.XA
Other languages
English (en)
Other versions
CN105955698B (zh
Inventor
张文星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Careland Technology Co Ltd
Original Assignee
Shenzhen Careland Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Careland Technology Co Ltd filed Critical Shenzhen Careland Technology Co Ltd
Priority to CN201610287720.XA priority Critical patent/CN105955698B/zh
Publication of CN105955698A publication Critical patent/CN105955698A/zh
Application granted granted Critical
Publication of CN105955698B publication Critical patent/CN105955698B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种语音操控方法及装置,其特征在于,包括:接收语音命令;解析所述语音命令获得至少一语音特征;获得所述至少一语音特征对应的操作指令,并执行所述操作指令对应的操作。与现有技术先比,本发明提供的语音操控方法,识别解析语音命令更灵活,可以解析获得多个标准命令,克服了一次只能接受识别一个标准命令,导致用户要请求一个较为复杂的功能时,只能不断通过与系统交互,才能最终完成想要的功能的缺陷,提高导航效果以及用户体验。

Description

一种语音操控方法及装置
技术领域
本发明涉及电子技术领域,尤其涉及一种语音操控方法及装置。
背景技术
在传统的操控技术中,往往是通过触发实体装置产生某种指令,而后执行该指令所对应的操作,该种方法有着其便利性,但是必须得通过接触按键来进行触发操作。在某些场景,如开车,在这种场景中,由于不方便触发按键进行指令输入,往往会对操控造成很大的不便利行。
通过语音识别操控的方式能够很好地解决在某些场景中操控不方便的问题,电子设备识别出入的语音命令,通过解析该语音命令执行相关的操作。但是现有的语音识别操控方法只能够识别出语音命令中的单一命令指令,在需要执行多条命令时,需要多次进行语音命令的输入,对使用造成很大的不方便。
发明内容
本发明的目的是提供一种语音操控及装置,能够识别语音命令中的多条指令并执行。
本发明的目的是通过以下技术方案实现的:
一种语音操控方法,其特征在于,包括:接收语音命令;解析所述语音命令获得语音特征;获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作。
一种语音操控装置,其特征在于,包括:接收单元,用于接收语音命令;解析单元,用于解析所述语音命令获得语音特征;操作单元,用于获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作。
与现有技术先比,本发明提供的语音操控方法,识别解析语音命令更灵活,可以解析获得多个标准命令,克服了一次只能接受识别一个标准命令,导致用户要请求一个较为复杂的功能时,只能不断通过与系统交互,才能最终完成想要的功能的缺陷,提高导航效果以及用户体验。
由上述本发明提供的技术方案可以看出,确定语音命令的语义与标准命令的语义属于相同语义,则可以根据标准命令进行导航,语音命令更灵活,不需要用户说出标准命令也可以进行导航,提高导航效果以及用户体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的语音操控方法的流程示意图。
图2为本发明实施例提供的语音操控装置的构成示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
如图1所示,本发明实施例提供一种语音导航方法,包括:
11、接收语音命令。
12、解析所述语音命令获得至少一语音特征,所述语音特征包括命令词和/或关键词。
13、获得所述至少一语音特征对应的操作指令,并执行所述操作指令对应的操作。
本发明实施例语音导航方法的执行主体可以是智能电子设备。所述智能电子设备包括:手机、平板电脑、PND、车机、行车记录仪、智能后视镜、电子狗等。
上述步骤11中接收语音命令的方式可以包括:
(1)智能电子设备接收“语音识别”功能按键的触发指令后进入语音识别模式,获取所述语音命令。
(2)在默认状态下,智能电子设备识别到预设的语音模式进入指令后进入语音识别模式,获取语音命令。示例的,智能电子设备在导航功能状态下,识别到“HELLO,小K!”的语音识别模式进入指令,进入语音识别模式后接收语音命令。
上述步骤12中,解析语音命令获得语音特征的方法为现有技术,在此不做赘述。
上述步骤13中,操作指令包括标准命令和/或兴趣点,识别出语音特征中的命令词对应的标准命令和关键词对应的兴趣点,所述关键词为所述命令词的执行对象。
在存储的标准命令库中查找得到与所述至少一命令词匹配对应的至少一标准命令,获得标准命令,所述标准命令库包括语音库和/或文本库,匹配方式包括以下至少一种:
方式1:识别出语音命令的命令词语音;在标准命令库中的语音库中匹配与所述语音特征对应的标准命令。
方式2:识别出语音命令对应的命令词文本信息;在标准命令库中的文本库中匹配与所述文本信息对应的标准命令。
示例的,如表1所述,语音特征命令词对应的标准命令:
表1
命令词、标准命令包括但不限于上述表格中所列的内容。
获取的语音特征为:“去..”、“导航至..”“开车去..”等时,在命令库中查找到匹配的标准命令为“导航至..”。
获取的语音特征为:“从..到..”、“走..”、“经过..”等时,在命令库中查找到匹配的标准命令为“设置..为经由地”。
获取的语音特征为:“附近的..”、“找附近的..”、“找附近的..”等时,在命令库中查找到匹配的标准命令为“搜索附近的..兴趣点”。
在兴趣点库中匹配与所述至少一关键词相匹配的至少一兴趣点,将所述至少一兴趣点设为命令词的执行对象。所述标兴趣点库包括语音库和/或文本库,匹配方式包括以下至少一种:
方式1:识别出语音命令的关键词语音;在兴趣点库中的语音库中匹配与所述关键词语音对应的兴趣点。
方式2:识别出语音命令对应的关键词文本信息;在兴趣点库的文本库中匹配与所述关键词文本信息对应的的兴趣点。
可选的,所述标准语音库可以在存储在智能电子设备本地,也可以存储在在服务器端。存储在服务器端时,由智能电子设备将语音命令(或者语音特征)发送给服务器,由服务器在服务器侧查找并返回。
上述步骤12、13中,解析获得的命令词和关键词为一个时,在标准命令库中找到与之对应的标准命令,在兴趣点库中找到与关键词匹配的兴趣点,将该兴趣点设为标准命令的执行对象并执行与所述标准命令对应的操作。
在解析获得的命令词和关键词为二个或者多个时,在标准命令库中找到与所述二个或多个命令词对应的二个或多个操作指令,在兴趣点库中找到与二个或多个关键词匹配的兴趣点,将该二个或多个兴趣点设为二个或多个标准命令的执行对象并执行与所述操作指令对应的操作。执行所述所述二个或多个操作指令对应的操作的方式包括:在多个步骤中依次执行二个或多个操作指令对应的操作,或者在一个步骤中执行所述二个或多个操作命令对应的操作。
示例性的,语音命令为“去会展中心找附近的餐馆”,进行语音命令解析,得到命令词为“去”和“找附近的”,关键词为“会展中心”和“餐馆”。在标准命令库中查找到与命令词对应的标准命令为“导航至”和“搜索..附近的兴趣点”,则该语音命令的执行步骤为:规划一条到“会展中心”的导航路径并搜索“会展中心”附近的餐馆。语音命令中包含二个操作指令,在二个步骤中依次执行规划到“会展中心”的导航路径和搜索“会展中心”附近的餐馆的操作。
示例性的,语音命令为“走深南大道去上海宾馆”,进行语音命令解析,得到命令词为“走”和“去”,关键词为“深南大道”和“上海宾馆”。在标准命令库中查找到与命令词对应的标准命令为“导航至”和“设置...为经由地”,则该语音命令的执行步骤为:规划一条以“深南大道”为经由地的到“上海宾馆”的导航路径。语音命令中包含二个操作指令,在一个步骤中执行规划一条以“深南大道”为经由地的到“上海宾馆”的导航路径的操作。
可见,与现有技术先比,本发明提供的语音操控方法,识别解析语音命令更灵活,可以解析获得多个标准命令,克服了一次只能接受识别一个标准命令,导致用户要请求一个较为复杂的功能时,只能不断通过与系统交互,才能最终完成想要的功能的缺陷,提高导航效果以及用户体验。
如图2所示,对应上述实施例的语音导航方法,本发明实施例提供一种语音导航装置,包括:
接收单元21,用于接收语音命令。
解析单元22,用于解析所述接收的语音命令获得至少一语音特征,所述语音特征包括命令词与关键词。
操作单元23,用于获得所述至少一语音特征对应的操作指令,并执行所述操作指令对应的操作。操作指令包括标准命令和兴趣点。
其中,对应上述实施例所述方法,操作指令获得单元22,可以用于:
识别出语音特征中的命令词对应的标准命令和关键词对应的兴趣点,所述关键词为所述命令词的执行对象。
在存储的标准命令库中查找得到与所述至少一命令词匹配对应的至少一标准命令,获得标准命令,所述标准命令库包括语音库和/或文本库,匹配方式包括以下至少一种:
方式1:识别出语音命令的命令词语音;在标准命令库中的语音库中匹配与所述语音特征对应的标准命令。
方式2:识别出语音命令对应的命令词文本信息;在标准命令库中的文本库中匹配与所述文本信息对应的标准命令。
示例的,如表1所述,语音特征命令词对应的标准命令:
表1
命令词、标准命令包括但不限于上述表格中所列的内容。
获取的语音特征为:“去..”、“导航至..”“开车去..”等时,在命令库中查找到匹配的标准命令为“导航至..”。
获取的语音特征为:“从..到..”、“走..”、“经过..”等时,在命令库中查找到匹配的标准命令为“设置..为经由地”。
获取的语音特征为:“附近的..”、“找附近的..”、“找附近的..”等时,在命令库中查找到匹配的标准命令为“搜索附近的..兴趣点”。
操作指令获得单元22,还可以用于在兴趣点库中匹配与所述至少一关键词相匹配的至少一兴趣点,将所述至少一兴趣点设为命令词的执行对象。所述标兴趣点库包括语音库和/或文本库,匹配方式包括以下至少一种:
方式1:识别出语音命令的关键词语音;在兴趣点库中的语音库中匹配与所述关键词语音对应的兴趣点。
方式2:识别出语音命令对应的关键词文本信息;在兴趣点库的文本库中匹配与所述关键词文本信息对应的的兴趣点。
可选的,所述标准语音库可以在存储在智能电子设备本地,也可以存储在在服务器端。存储在服务器端时,由智能电子设备将语音命令(或者语音特征)发送给服务器,由服务器在服务器侧查找并返回。
操作单元23可以用于在解析获得的语音特征为一个时,在标准命令库中找到与之对应的标准命令并执行与所述标准命令对应的操作。
操作单元23还用于在解析获得的语音特征为二个或者多个时,在标准命令库中找到与所述二个或多个语音特征对应的二个或多个操作指令,执行所述二个或多个标准命令对应的操作。执行所述所述二个或多个操作指令对应的操作的方式包括:在多个步骤中依次执行操作指令对应的操作,或者在一个步骤中执行所述二个或多个操作指令对应的操作。
本发明实施例语音导航装置及其构成,可以对应上述实施例的语音导航方法得以理解,在此不作赘述。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。

Claims (10)

1.一种语音操控方法,其特征在于,包括:
接收语音命令;
解析所述语音命令获得语音特征;
获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作。
2.根据权利要求1所述的方法,其特征在于,所述语音特征包括命令词和/或关键词,所述关键词为所述命令词的执行对象;所述操作指令包括标准命令和/或兴趣点。
3.根据权利要求2所述的方法,其特征在于,在存储的标准命令库中查找得到与所述命令词匹配对应的标准命令,获得标准命令;在兴趣点库中匹配与所述关键词相匹配的兴趣点。
4.根据权利要求3所述的方法,其特征在于,在解析获得的命令词和关键词为至少二个时,在标准命令库中找到与所述至少二个命令词对应的至少二个标准命令,在兴趣点库中找到与所述至少二个关键词匹配的兴趣点。
5.根据权利要求4所述的方法,其特征在于,执行所述至少二个操作指令对应的操作的方式包括:在多个步骤中依次执行操作指令对应的操作,或者在一个步骤中执行所述至少二个操作指令对应的操作。
6.一种语音操控装置,其特征在于,包括:
接收单元,用于接收语音命令;
解析单元,用于解析所述语音命令获得语音特征;
操作单元,用于获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作。
7.根据权利要求1所述的方法,其特征在于,所述解析单元解析获得的语音特征包括命令词和/或关键词,所述关键词为所述命令词的执行对象;所述操作指令包括标准命令和/或兴趣点。
8.根据权利要求1所述的方法,其特征在于,操作单元用于在存储的标准命令库中查找得到与所述命令词匹配对应的标准命令,获得标准命令;在兴趣点库中匹配与所述关键词相匹配的兴趣点,将所述兴趣点设为标准命令的执行对象。
9.根据权利要求8所述的方法,其特征在于,操作单元在解析获得的命令词和关键词为至少二个时,在标准命令库中找到与所述至少二个命令词对应的至少二个标准命令,在兴趣点库中找到与至少二个关键词匹配的兴趣点,将该至少二个兴趣点设为至少二个或多个标准命令对应的操作。
10.根据权利要求9所述的方法,其特征在于,操作单元执行所述所述至少二个操作指令对应的操作的方式包括:在多个步骤中依次执行操作指令对应的操作,或者在一个步骤中执行所述至少二个操作指令对应的操作。
CN201610287720.XA 2016-05-04 2016-05-04 一种语音操控方法及装置 Active CN105955698B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610287720.XA CN105955698B (zh) 2016-05-04 2016-05-04 一种语音操控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610287720.XA CN105955698B (zh) 2016-05-04 2016-05-04 一种语音操控方法及装置

Publications (2)

Publication Number Publication Date
CN105955698A true CN105955698A (zh) 2016-09-21
CN105955698B CN105955698B (zh) 2021-09-24

Family

ID=56913648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610287720.XA Active CN105955698B (zh) 2016-05-04 2016-05-04 一种语音操控方法及装置

Country Status (1)

Country Link
CN (1) CN105955698B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106512393A (zh) * 2016-10-14 2017-03-22 上海异界信息科技有限公司 适用于虚拟现实环境中应用语音控制的方法和系统
CN106653015A (zh) * 2016-10-28 2017-05-10 海南双猴科技有限公司 一种机器人语音识别方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063901A (zh) * 2010-12-02 2011-05-18 深圳市凯立德欣软件技术有限公司 位置服务设备的语音识别方法及位置服务设备
CN102636171A (zh) * 2012-04-27 2012-08-15 深圳市凯立德科技股份有限公司 一种语音导航方法及装置
CN103595869A (zh) * 2013-11-15 2014-02-19 华为终端有限公司 一种终端语音控制方法、装置及终端
CN104111077A (zh) * 2014-06-30 2014-10-22 广西瀚特信息产业股份有限公司 基于移动端的一键语音导航的系统和方法
CN104538030A (zh) * 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
US20150242186A1 (en) * 2012-10-16 2015-08-27 Facebook, Inc. Voice commands for online social networking systems
WO2015174623A1 (ko) * 2014-05-16 2015-11-19 삼성전자주식회사 입력 처리 장치 및 방법
CN105100455A (zh) * 2015-07-06 2015-11-25 珠海格力电器股份有限公司 语音控制接听来电通话的方法和装置
CN105138110A (zh) * 2014-05-29 2015-12-09 中兴通讯股份有限公司 语音交互方法及装置
CN105404161A (zh) * 2015-11-02 2016-03-16 百度在线网络技术(北京)有限公司 智能语音交互方法和装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063901A (zh) * 2010-12-02 2011-05-18 深圳市凯立德欣软件技术有限公司 位置服务设备的语音识别方法及位置服务设备
CN102636171A (zh) * 2012-04-27 2012-08-15 深圳市凯立德科技股份有限公司 一种语音导航方法及装置
US20150242186A1 (en) * 2012-10-16 2015-08-27 Facebook, Inc. Voice commands for online social networking systems
CN103595869A (zh) * 2013-11-15 2014-02-19 华为终端有限公司 一种终端语音控制方法、装置及终端
WO2015174623A1 (ko) * 2014-05-16 2015-11-19 삼성전자주식회사 입력 처리 장치 및 방법
CN105138110A (zh) * 2014-05-29 2015-12-09 中兴通讯股份有限公司 语音交互方法及装置
CN104111077A (zh) * 2014-06-30 2014-10-22 广西瀚特信息产业股份有限公司 基于移动端的一键语音导航的系统和方法
CN104538030A (zh) * 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
CN105100455A (zh) * 2015-07-06 2015-11-25 珠海格力电器股份有限公司 语音控制接听来电通话的方法和装置
CN105404161A (zh) * 2015-11-02 2016-03-16 百度在线网络技术(北京)有限公司 智能语音交互方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NICHOLAS MULHERN; NEIL MCCAFFREY; NICHOLAS BERETTA: ""Designing Android Applications Using Voice Controlled Commands: For Hands Free Interaction with Common Household Devices"", 《2013 39TH ANNUAL NORTHEAST BIOENGINEERING CONFERENCE》 *
李俊: ""中文语音控制系统的设计及应用研究"", 《中国优秀硕士学位论文全文数据库》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106512393A (zh) * 2016-10-14 2017-03-22 上海异界信息科技有限公司 适用于虚拟现实环境中应用语音控制的方法和系统
CN106653015A (zh) * 2016-10-28 2017-05-10 海南双猴科技有限公司 一种机器人语音识别方法及装置

Also Published As

Publication number Publication date
CN105955698B (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN109003624B (zh) 情绪识别方法、装置、计算机设备及存储介质
CN107300970B (zh) 虚拟现实交互方法和装置
CN110926486B (zh) 一种路线确定方法、装置、设备和计算机存储介质
CN104240700B (zh) 一种面向车载终端设备的全局语音交互方法及系统
KR20120011010A (ko) 수기 인식 방법 및 장치
CN102568478A (zh) 一种基于语音识别的视频播放控制方法和系统
US10347243B2 (en) Apparatus and method for analyzing utterance meaning
CN103489444A (zh) 一种语音识别方法和装置
CN107293294A (zh) 一种语音识别处理方法及装置
CN110070859A (zh) 一种语音识别方法及装置
CN111506770B (zh) 一种采访视频集锦生成方法和系统
CN106653015A (zh) 一种机器人语音识别方法及装置
CN105955698A (zh) 一种语音操控方法及装置
CN101308030A (zh) 一种汉字联想方法及使用了此方法的汉字联想装置
CN104484355A (zh) 一种阅读前后辅助用户进行生字巩固的方法和终端
US20220114367A1 (en) Communication system, display apparatus, and display control method
CN110456922A (zh) 输入方法、输入装置、输入系统和电子设备
US9405744B2 (en) Method and apparatus for managing image data in electronic device
CN106372203A (zh) 一种智能终端的信息响应方法、装置和智能终端
JP5844375B2 (ja) 物体検索システムおよび物体検索方法
US9641740B2 (en) Apparatus and method for auto-focusing in device having camera
CN104125334A (zh) 一种信息处理方法及电子设备
CN110377790B (zh) 一种基于多模态私有特征的视频自动标注方法
KR100919227B1 (ko) 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치
CN109949186B (zh) 一种知识产权非结构化语义智能处理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant