CN105955698B - 一种语音操控方法及装置 - Google Patents

一种语音操控方法及装置 Download PDF

Info

Publication number
CN105955698B
CN105955698B CN201610287720.XA CN201610287720A CN105955698B CN 105955698 B CN105955698 B CN 105955698B CN 201610287720 A CN201610287720 A CN 201610287720A CN 105955698 B CN105955698 B CN 105955698B
Authority
CN
China
Prior art keywords
command
voice
standard
library
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610287720.XA
Other languages
English (en)
Other versions
CN105955698A (zh
Inventor
张文星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Careland Technology Co Ltd
Original Assignee
Shenzhen Careland Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Careland Technology Co Ltd filed Critical Shenzhen Careland Technology Co Ltd
Priority to CN201610287720.XA priority Critical patent/CN105955698B/zh
Publication of CN105955698A publication Critical patent/CN105955698A/zh
Application granted granted Critical
Publication of CN105955698B publication Critical patent/CN105955698B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)
  • Navigation (AREA)

Abstract

一种语音操控方法及装置,其特征在于,包括:接收语音命令;解析所述语音命令获得至少一语音特征;获得所述至少一语音特征对应的操作指令,并执行所述操作指令对应的操作。与现有技术先比,本发明提供的语音操控方法,识别解析语音命令更灵活,可以解析获得多个标准命令,克服了一次只能接受识别一个标准命令,导致用户要请求一个较为复杂的功能时,只能不断通过与系统交互,才能最终完成想要的功能的缺陷,提高导航效果以及用户体验。

Description

一种语音操控方法及装置
技术领域
本发明涉及电子技术领域,尤其涉及一种语音操控方法及装置。
背景技术
在传统的操控技术中,往往是通过触发实体装置产生某种指令,而后执行该指令所对应的操作,该种方法有着其便利性,但是必须得通过接触按键来进行触发操作。在某些场景,如开车,在这种场景中,由于不方便触发按键进行指令输入,往往会对操控造成很大的不便利行。
通过语音识别操控的方式能够很好地解决在某些场景中操控不方便的问题,电子设备识别出入的语音命令,通过解析该语音命令执行相关的操作。但是现有的语音识别操控方法只能够识别出语音命令中的单一命令指令,在需要执行多条命令时,需要多次进行语音命令的输入,对使用造成很大的不方便。
发明内容
本发明的目的是提供一种语音操控及装置,能够识别语音命令中的多条指令并执行。
本发明的目的是通过以下技术方案实现的:
一种语音操控方法,其特征在于,包括:接收语音命令;解析所述语音命令获得语音特征;获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作。
一种语音操控装置,其特征在于,包括:接收单元,用于接收语音命令;解析单元,用于解析所述语音命令获得语音特征;操作单元,用于获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作。
与现有技术先比,本发明提供的语音操控方法,识别解析语音命令更灵活,可以解析获得多个标准命令,克服了一次只能接受识别一个标准命令,导致用户要请求一个较为复杂的功能时,只能不断通过与系统交互,才能最终完成想要的功能的缺陷,提高导航效果以及用户体验。
由上述本发明提供的技术方案可以看出,确定语音命令的语义与标准命令的语义属于相同语义,则可以根据标准命令进行导航,语音命令更灵活,不需要用户说出标准命令也可以进行导航,提高导航效果以及用户体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的语音操控方法的流程示意图。
图2为本发明实施例提供的语音操控装置的构成示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
如图1所示,本发明实施例提供一种语音导航方法,包括:
11、接收语音命令。
12、解析所述语音命令获得至少一语音特征,所述语音特征包括命令词和/或关键词。
13、获得所述至少一语音特征对应的操作指令,并执行所述操作指令对应的操作。
本发明实施例语音导航方法的执行主体可以是智能电子设备。所述智能电子设备包括:手机、平板电脑、PND、车机、行车记录仪、智能后视镜、电子狗等。
上述步骤11中接收语音命令的方式可以包括:
(1)智能电子设备接收“语音识别”功能按键的触发指令后进入语音识别模式,获取所述语音命令。
(2)在默认状态下,智能电子设备识别到预设的语音模式进入指令后进入语音识别模式,获取语音命令。示例的,智能电子设备在导航功能状态下,识别到“HELLO,小K!”的语音识别模式进入指令,进入语音识别模式后接收语音命令。
上述步骤12中,解析语音命令获得语音特征的方法为现有技术,在此不做赘述。
上述步骤13中,操作指令包括标准命令和/或兴趣点,识别出语音特征中的命令词对应的标准命令和关键词对应的兴趣点,所述关键词为所述命令词的执行对象。
在存储的标准命令库中查找得到与所述至少一命令词匹配对应的至少一标准命令,获得标准命令,所述标准命令库包括语音库和/或文本库,匹配方式包括以下至少一种:
方式1:识别出语音命令的命令词语音;在标准命令库中的语音库中匹配与所述语音特征对应的标准命令。
方式2:识别出语音命令对应的命令词文本信息;在标准命令库中的文本库中匹配与所述文本信息对应的标准命令。
示例的,如表1所述,语音特征命令词对应的标准命令:
Figure 355969DEST_PATH_IMAGE001
表1
命令词、标准命令包括但不限于上述表格中所列的内容。
获取的语音特征为:“去..”、“导航至..”“开车去..”等时,在命令库中查找到匹配的标准命令为“导航至..”。
获取的语音特征为:“从..到..”、“走..”、“经过..”等时,在命令库中查找到匹配的标准命令为“设置..为经由地”。
获取的语音特征为:“附近的..”、“找附近的..”、“找附近的..”等时,在命令库中查找到匹配的标准命令为“搜索附近的..兴趣点”。
在兴趣点库中匹配与所述至少一关键词相匹配的至少一兴趣点,将所述至少一兴趣点设为命令词的执行对象。所述标兴趣点库包括语音库和/或文本库,匹配方式包括以下至少一种:
方式1:识别出语音命令的关键词语音;在兴趣点库中的语音库中匹配与所述关键词语音对应的兴趣点。
方式2:识别出语音命令对应的关键词文本信息;在兴趣点库的文本库中匹配与所述关键词文本信息对应的的兴趣点。
可选的,所述标准语音库可以在存储在智能电子设备本地,也可以存储在在服务器端。存储在服务器端时,由智能电子设备将语音命令(或者语音特征)发送给服务器,由服务器在服务器侧查找并返回。
上述步骤12、13中,解析获得的命令词和关键词为一个时,在标准命令库中找到与之对应的标准命令,在兴趣点库中找到与关键词匹配的兴趣点,将该兴趣点设为标准命令的执行对象并执行与所述标准命令对应的操作。
在解析获得的命令词和关键词为二个或者多个时,在标准命令库中找到与所述二个或多个命令词对应的二个或多个操作指令,在兴趣点库中找到与二个或多个关键词匹配的兴趣点,将该二个或多个兴趣点设为二个或多个标准命令的执行对象并执行与所述操作指令对应的操作。执行所述所述二个或多个操作指令对应的操作的方式包括:在多个步骤中依次执行二个或多个操作指令对应的操作,或者在一个步骤中执行所述二个或多个操作命令对应的操作。
示例性的,语音命令为“去会展中心找附近的餐馆”,进行语音命令解析,得到命令词为“去”和“找附近的”,关键词为“会展中心”和“餐馆”。在标准命令库中查找到与命令词对应的标准命令为“导航至”和“搜索..附近的兴趣点”,则该语音命令的执行步骤为:规划一条到“会展中心”的导航路径并搜索“会展中心”附近的餐馆。语音命令中包含二个操作指令,在二个步骤中依次执行规划到“会展中心”的导航路径和搜索“会展中心”附近的餐馆的操作。
示例性的,语音命令为“走深南大道去上海宾馆”,进行语音命令解析,得到命令词为“走”和“去”,关键词为“深南大道”和“上海宾馆”。在标准命令库中查找到与命令词对应的标准命令为“导航至”和“设置...为经由地”,则该语音命令的执行步骤为:规划一条以“深南大道”为经由地的到“上海宾馆”的导航路径。语音命令中包含二个操作指令,在一个步骤中执行规划一条以“深南大道”为经由地的到“上海宾馆”的导航路径的操作。
可见,与现有技术先比,本发明提供的语音操控方法,识别解析语音命令更灵活,可以解析获得多个标准命令,克服了一次只能接受识别一个标准命令,导致用户要请求一个较为复杂的功能时,只能不断通过与系统交互,才能最终完成想要的功能的缺陷,提高导航效果以及用户体验。
如图2所示,对应上述实施例的语音导航方法,本发明实施例提供一种语音导航装置,包括:
接收单元21,用于接收语音命令。
解析单元22,用于解析所述接收的语音命令获得至少一语音特征,所述语音特征包括命令词与关键词。
操作单元23,用于获得所述至少一语音特征对应的操作指令,并执行所述操作指令对应的操作。操作指令包括标准命令和兴趣点。
其中,对应上述实施例所述方法,操作指令获得单元22,可以用于:
识别出语音特征中的命令词对应的标准命令和关键词对应的兴趣点,所述关键词为所述命令词的执行对象。
在存储的标准命令库中查找得到与所述至少一命令词匹配对应的至少一标准命令,获得标准命令,所述标准命令库包括语音库和/或文本库,匹配方式包括以下至少一种:
方式1:识别出语音命令的命令词语音;在标准命令库中的语音库中匹配与所述语音特征对应的标准命令。
方式2:识别出语音命令对应的命令词文本信息;在标准命令库中的文本库中匹配与所述文本信息对应的标准命令。
示例的,如表1所述,语音特征命令词对应的标准命令:
Figure 563484DEST_PATH_IMAGE001
表1
命令词、标准命令包括但不限于上述表格中所列的内容。
获取的语音特征为:“去..”、“导航至..”“开车去..”等时,在命令库中查找到匹配的标准命令为“导航至..”。
获取的语音特征为:“从..到..”、“走..”、“经过..”等时,在命令库中查找到匹配的标准命令为“设置..为经由地”。
获取的语音特征为:“附近的..”、“找附近的..”、“找附近的..”等时,在命令库中查找到匹配的标准命令为“搜索附近的..兴趣点”。
操作指令获得单元22,还可以用于在兴趣点库中匹配与所述至少一关键词相匹配的至少一兴趣点,将所述至少一兴趣点设为命令词的执行对象。所述标兴趣点库包括语音库和/或文本库,匹配方式包括以下至少一种:
方式1:识别出语音命令的关键词语音;在兴趣点库中的语音库中匹配与所述关键词语音对应的兴趣点。
方式2:识别出语音命令对应的关键词文本信息;在兴趣点库的文本库中匹配与所述关键词文本信息对应的的兴趣点。
可选的,所述标准语音库可以在存储在智能电子设备本地,也可以存储在在服务器端。存储在服务器端时,由智能电子设备将语音命令(或者语音特征)发送给服务器,由服务器在服务器侧查找并返回。
操作单元23可以用于在解析获得的语音特征为一个时,在标准命令库中找到与之对应的标准命令并执行与所述标准命令对应的操作。
操作单元23还用于在解析获得的语音特征为二个或者多个时,在标准命令库中找到与所述二个或多个语音特征对应的二个或多个操作指令,执行所述二个或多个标准命令对应的操作。执行所述所述二个或多个操作指令对应的操作的方式包括:在多个步骤中依次执行操作指令对应的操作,或者在一个步骤中执行所述二个或多个操作指令对应的操作。
本发明实施例语音导航装置及其构成,可以对应上述实施例的语音导航方法得以理解,在此不作赘述。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。

Claims (2)

1.一种语音操控方法,其特征在于,包括:
接收语音命令;
解析所述语音命令获得语音特征;
获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作;
所述语音特征包括命令词和/或关键词,所述关键词为所述命令词的执行对象;所述操作指令包括标准命令和/或兴趣点;
在存储的标准命令库中查找得到与所述命令词匹配对应的标准命令,获得标准命令;在兴趣点库中匹配与所述关键词相匹配的兴趣点;
在解析获得的命令词和关键词为至少二个时,在标准命令库中找到与所述至少二个命令词对应的至少二个标准命令,在兴趣点库中找到与所述至少二个关键词匹配的兴趣点;
执行所述至少二个操作指令对应的操作的方式包括:在多个步骤中依次执行操作指令对应的操作,或者在一个步骤中执行所述至少二个操作指令对应的操作。
2.一种语音操控装置,其特征在于,包括:
接收单元,用于接收语音命令;
解析单元,用于解析所述语音命令获得语音特征;
操作单元,用于获得所述语音特征对应的操作指令,并执行所述操作指令对应的操作;
所述解析单元解析获得的语音特征包括命令词和/或关键词,所述关键词为所述命令词的执行对象;所述操作指令包括标准命令和/或兴趣点;
操作单元用于在存储的标准命令库中查找得到与所述命令词匹配对应的标准命令,获得标准命令;在兴趣点库中匹配与所述关键词相匹配的兴趣点,将所述兴趣点设为标准命令的执行对象;
操作单元在解析获得的命令词和关键词为至少二个时,在标准命令库中找到与所述至少二个命令词对应的至少二个标准命令,在兴趣点库中找到与至少二个关键词匹配的兴趣点,将该至少二个兴趣点设为至少二个或多个标准命令对应的操作;
操作单元执行所述至少二个操作指令对应的操作的方式包括:在多个步骤中依次执行操作指令对应的操作,或者在一个步骤中执行所述至少二个操作指令对应的操作。
CN201610287720.XA 2016-05-04 2016-05-04 一种语音操控方法及装置 Active CN105955698B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610287720.XA CN105955698B (zh) 2016-05-04 2016-05-04 一种语音操控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610287720.XA CN105955698B (zh) 2016-05-04 2016-05-04 一种语音操控方法及装置

Publications (2)

Publication Number Publication Date
CN105955698A CN105955698A (zh) 2016-09-21
CN105955698B true CN105955698B (zh) 2021-09-24

Family

ID=56913648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610287720.XA Active CN105955698B (zh) 2016-05-04 2016-05-04 一种语音操控方法及装置

Country Status (1)

Country Link
CN (1) CN105955698B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106512393A (zh) * 2016-10-14 2017-03-22 上海异界信息科技有限公司 适用于虚拟现实环境中应用语音控制的方法和系统
CN106653015A (zh) * 2016-10-28 2017-05-10 海南双猴科技有限公司 一种机器人语音识别方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063901A (zh) * 2010-12-02 2011-05-18 深圳市凯立德欣软件技术有限公司 位置服务设备的语音识别方法及位置服务设备
CN102636171A (zh) * 2012-04-27 2012-08-15 深圳市凯立德科技股份有限公司 一种语音导航方法及装置
CN103595869A (zh) * 2013-11-15 2014-02-19 华为终端有限公司 一种终端语音控制方法、装置及终端
CN104111077A (zh) * 2014-06-30 2014-10-22 广西瀚特信息产业股份有限公司 基于移动端的一键语音导航的系统和方法
CN104538030A (zh) * 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
CN105100455A (zh) * 2015-07-06 2015-11-25 珠海格力电器股份有限公司 语音控制接听来电通话的方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9043703B2 (en) * 2012-10-16 2015-05-26 Facebook, Inc. Voice commands for online social networking systems
KR102265143B1 (ko) * 2014-05-16 2021-06-15 삼성전자주식회사 입력 처리 장치 및 방법
CN105138110A (zh) * 2014-05-29 2015-12-09 中兴通讯股份有限公司 语音交互方法及装置
CN105404161A (zh) * 2015-11-02 2016-03-16 百度在线网络技术(北京)有限公司 智能语音交互方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063901A (zh) * 2010-12-02 2011-05-18 深圳市凯立德欣软件技术有限公司 位置服务设备的语音识别方法及位置服务设备
CN102636171A (zh) * 2012-04-27 2012-08-15 深圳市凯立德科技股份有限公司 一种语音导航方法及装置
CN103595869A (zh) * 2013-11-15 2014-02-19 华为终端有限公司 一种终端语音控制方法、装置及终端
CN104111077A (zh) * 2014-06-30 2014-10-22 广西瀚特信息产业股份有限公司 基于移动端的一键语音导航的系统和方法
CN104538030A (zh) * 2014-12-11 2015-04-22 科大讯飞股份有限公司 一种可以通过语音控制家电的控制系统与方法
CN105100455A (zh) * 2015-07-06 2015-11-25 珠海格力电器股份有限公司 语音控制接听来电通话的方法和装置

Also Published As

Publication number Publication date
CN105955698A (zh) 2016-09-21

Similar Documents

Publication Publication Date Title
EP3251115B1 (en) Updating language understanding classifier models for a digital personal assistant based on crowd-sourcing
US11017770B2 (en) Vehicle having dialogue system and control method thereof
KR102281178B1 (ko) 멀티-레벨 음성 인식 방법 및 장치
EP2518447A1 (en) System and method for fixing user input mistakes in an in-vehicle electronic device
KR20140089863A (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
CN110060674B (zh) 表格管理方法、装置、终端和存储介质
CN110070859B (zh) 一种语音识别方法及装置
US11881209B2 (en) Electronic device and control method
US10515634B2 (en) Method and apparatus for searching for geographic information using interactive voice recognition
EP2863385B1 (en) Function execution instruction system, function execution instruction method, and function execution instruction program
US10741178B2 (en) Method for providing vehicle AI service and device using the same
US20130297210A1 (en) Route guidance apparatus and method with voice recognition
CN113421561B (zh) 语音控制方法、语音控制装置、服务器和存储介质
CN105955698B (zh) 一种语音操控方法及装置
CN111667824A (zh) 智能体装置、智能体装置的控制方法及存储介质
CN106653015A (zh) 一种机器人语音识别方法及装置
US20040010410A1 (en) System and method for processing voice command
JP5844375B2 (ja) 物体検索システムおよび物体検索方法
CN112489639A (zh) 音频信号处理方法及装置、系统、电子设备、可读介质
US11164578B2 (en) Voice recognition apparatus, voice recognition method, and non-transitory computer-readable storage medium storing program
CN107545895B (zh) 信息处理方法和电子设备
CN115500085A (zh) 语音交互的方法和装置
CN107967308B (zh) 一种智能交互的处理方法、装置、设备和计算机存储介质
KR20210098250A (ko) 전자 장치 및 이의 제어 방법
JP2002268667A (ja) プレゼンテーションシステムおよびその制御方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant