CN107591153A - 一种利用语音控制设备的方法 - Google Patents
一种利用语音控制设备的方法 Download PDFInfo
- Publication number
- CN107591153A CN107591153A CN201610531836.3A CN201610531836A CN107591153A CN 107591153 A CN107591153 A CN 107591153A CN 201610531836 A CN201610531836 A CN 201610531836A CN 107591153 A CN107591153 A CN 107591153A
- Authority
- CN
- China
- Prior art keywords
- operational order
- voice signal
- display interface
- current display
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种利用语音控制设备的方法,获取用户的语音信号并通过语音识别得到操作指令,再截取当前显示界面,通过图像识别获取操作指令的目标在当前显示界面的位置,模拟相应的触屏动作完成操作指令。通过本发明的一种利用语音控制设备的方法,用户可以利用语音来控制设备并且无需对安装在设备上的各种应用软件进行修改,提高了操作的便捷性,增加了易用性。
Description
【技术领域】
本发明涉及通信技术领域,尤其涉及一种利用语音控制设备的方法。
【背景技术】
随着技术的不断发展,手机、电脑、电视等电子设备的功能越来越强大,人们随时随地都可以用到它们。当人们不方便使用双手对电子设备进行操作时,语音控制就成了非常适合的操作方式。现有的语音控制技术通常需要对软件进行修改,这样才能够使软件支持语音控制。
因此迫切需要一种利用语音控制设备的方法,能够不对现有软件进行修改,就可以通过语音进行控制。
【发明内容】
本发明要解决的技术问题是:提供一种利用语音控制设备的方法,能够不对现有软件进行修改,就可以通过语音进行控制设备上安装的各种软件。
为解决上述的技术问题,本发明是通过以下技术方案来实现的:
一种利用语音控制设备的方法,所述的设备具有操作系统,利用语音控制设备的方法包括:
获取语音信号;
对所述语音信号进行识别,得到操作指令;
确定所述操作指令的目标在当前显示界面的位置;
完成所述操作指令。
如上所述的利用语音控制设备的方法,确定所述操作指令的目标在当前显示界面的位置,包括:
截取当前显示界面;
在当前显示界面中找到所述操作指令的目标;
获取所述目标在当前显示界面的位置坐标。
如上所述的利用语音控制设备的方法,对所述的语音信号进行识别,包括:
从所述语音信号中提取特征矢量;
对提取的特征矢量进行比对,得到识别结果。
如上所述的利用语音控制设备的方法,还包括在对所述语音信号进行识别之前,对语音信号进行噪声去除及语音增强。
如上所述的利用语音控制设备的方法,完成所述操作指令包括:根据所述操作指令模拟并执行相应的触屏动作。
综上所述,本发明提供了一种利用语音控制设备的方法,获取用户的语音信号并通过语音识别得到操作指令,再截取当前显示界面,通过图像识别获取操作指令的目标在当前显示界面的位置,模拟相应的触屏动作完成操作指令。通过本发明的一种利用语音控制设备的方法,用户可以利用语音来控制设备并且无需对安装在设备上的各种应用软件进行修改,提高了操作的便捷性,增加了易用性。
【附图说明】
图1是利用语音控制设备的方法流程图。
图2是步骤S12的流程图。
图3是步骤S13的流程图。
【具体实施方式】
为进一步阐述本发明达成预定目的所采取的技术手段及功效,以下结合附图及实施例,对本发明的具体实施方式,详细说明如下。
图1为本发明一种利用语音控制设备的方法流程图。本方法可以应用在智能手机、平板电脑、笔记本电脑、台式机、智能电视等等具有操作系统的设备之上。如图1所示,本方法包含如下步骤:
S11:获取语音信号。
通过设备上的声音获取装置获取用户的语音信号。如果所处的环境噪声较大,还需要对获取的语音信号进行去除噪声。此外,如果获取的语音信号强度过小,还需要对语音信号进行语音增强。这些对语音信号所进行去除噪声和语音增强都是现有技术,在此不作详细叙述。
S12:对语音信号进行识别,得到操作指令。
利用语音识别技术对获取的语音信号进行识别,得到用户想通过语音发出的操作指令。例如:用户通过语音发出“点击XXX”的指令。对用户的语音进行识别,得到操作指令“点击XXX”,点击是指令的动作,XXX是指令的目标。
S13:确定操作指令的目标在当前显示界面的位置。
截取当前的显示界面,通过图像识别技术得到操作指令的目标在当前显示界面中是否存在,如果存在再确定其在当前显示界面中的位置。
S14:完成操作指令。
完成所述的操作指令。根据S12和S13得到的结果,模拟触屏动作从而完成操作指令。
本发明的一种利用语音控制设备的方法,通过获取用户的语音信号并对其进行语音识别得到用户想要发出的操作指令,然后截取当前显示界面并通过图像识别技术从中找出操作指令的目标,并进一步地确定其在当前显示界面的位置,之后模拟触屏动作完成用户的操作指令。使用户能够通过语音对设备进行操作,并且不需要对安装在设备上的各种应用软件进行修改。
图2为步骤S12的流程图。步骤S12包括:
S121:从语音信号中提取特征矢量。
S122:对提取的特征矢量进行比对,得到识别结果。
通过步骤S12,可以对语音信号进行识别从而得到用户想要发出的操作指令,例如“点击XXX”或者“下一页”等等。
图3为步骤S13的流程图。步骤S13包括:
S131:截取当前显示界面。
S132:在当前显示界面中找到操作指令的目标。
S133:获取目标在当前显示界面的位置坐标。
在通过语音识别获得操作指令后,截取当前显示界面,然后利用图像识别技术在当前显示界面中找到操作指令的目标。进一步的,计算出操作指令的目标在当前显示界面的位置坐标。
本发明的一种在上述所举的实施例仅用以说明本发明的原理,而非用以限制本发明,凡此种种依据本发明或现有技术的等效变换是本领域的技术人员所显而易见地得知,理应在本发明所公开保护的范畴之内。
Claims (5)
1.一种利用语音控制设备的方法,其特征在于:所述的设备具有操作系统,利用语音控制设备的方法包括:
获取语音信号;
对所述语音信号进行识别,得到操作指令;
确定所述操作指令的目标在当前显示界面的位置;
完成所述操作指令。
2.根据权利要求1所述的方法,其特征在于:所述的确定所述操作指令的目标在当前显示界面的位置,包括:
截取当前显示界面;
在当前显示界面中找到所述操作指令的目标;
获取所述目标在当前显示界面的位置坐标。
3.根据权利要求1所述的方法,其特征在于:对所述的语音信号进行识别,包括:
从所述语音信号中提取特征矢量;
对提取的特征矢量进行比对,得到识别结果。
4.根据权利要求1所述的方法,其特征在于:还包括在对所述语音信号进行识别之前,对语音信号进行噪声去除及语音增强。
5.根据权利要求1所述的方法,其特征在于:完成所述操作指令包括:
根据所述操作指令模拟并执行相应的触屏动作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610531836.3A CN107591153A (zh) | 2016-07-06 | 2016-07-06 | 一种利用语音控制设备的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610531836.3A CN107591153A (zh) | 2016-07-06 | 2016-07-06 | 一种利用语音控制设备的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107591153A true CN107591153A (zh) | 2018-01-16 |
Family
ID=61045582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610531836.3A Pending CN107591153A (zh) | 2016-07-06 | 2016-07-06 | 一种利用语音控制设备的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107591153A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110428832A (zh) * | 2019-07-26 | 2019-11-08 | 苏州蜗牛数字科技股份有限公司 | 一种自定义语音实现屏幕控制的方法 |
CN113741770A (zh) * | 2020-05-29 | 2021-12-03 | 比亚迪股份有限公司 | 基于图像识别的控制方法和系统及车辆、存储介质 |
CN116088992A (zh) * | 2023-02-13 | 2023-05-09 | 润芯微科技(江苏)有限公司 | 一种基于图像识别和语音识别的点击控制方法及系统 |
-
2016
- 2016-07-06 CN CN201610531836.3A patent/CN107591153A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110428832A (zh) * | 2019-07-26 | 2019-11-08 | 苏州蜗牛数字科技股份有限公司 | 一种自定义语音实现屏幕控制的方法 |
CN113741770A (zh) * | 2020-05-29 | 2021-12-03 | 比亚迪股份有限公司 | 基于图像识别的控制方法和系统及车辆、存储介质 |
CN116088992A (zh) * | 2023-02-13 | 2023-05-09 | 润芯微科技(江苏)有限公司 | 一种基于图像识别和语音识别的点击控制方法及系统 |
CN116088992B (zh) * | 2023-02-13 | 2024-02-02 | 润芯微科技(江苏)有限公司 | 一种基于图像识别和语音识别的点击控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220405986A1 (en) | Virtual image generation method, device, terminal and storage medium | |
JP2019102063A (ja) | ページ制御方法および装置 | |
JP2018536952A (ja) | スマートデバイスを制御するための方法および装置、ならびにコンピュータ記憶媒体 | |
CN108965981B (zh) | 视频播放方法、装置、存储介质及电子设备 | |
WO2019146942A1 (ko) | 전자 장치 및 그의 제어방법 | |
US20160065731A1 (en) | Electronic device and method for displaying call information thereof | |
KR102193029B1 (ko) | 디스플레이 장치 및 그의 화상 통화 수행 방법 | |
CN106504748A (zh) | 一种语音控制方法和装置 | |
EP3734598A1 (en) | Interfacing device and method for supporting speech dialogue | |
US11328711B2 (en) | User adaptive conversation apparatus and method based on monitoring of emotional and ethical states | |
CN111984180B (zh) | 终端读屏方法、装置、设备及计算机可读存储介质 | |
CN107591153A (zh) | 一种利用语音控制设备的方法 | |
CN106873937A (zh) | 语音输入方法和装置 | |
CN112286411A (zh) | 显示模式的控制方法、装置、存储介质以及电子设备 | |
CN116127485A (zh) | 数据库数据的加密方法、存储介质与计算机设备 | |
CN112165627A (zh) | 信息处理方法、装置、存储介质、终端及系统 | |
CN109302528A (zh) | 一种拍照方法、移动终端及计算机可读存储介质 | |
CN110825475A (zh) | 一种输入方法及电子设备 | |
CN109739462A (zh) | 一种内容输入的方法及装置 | |
CN116088992B (zh) | 一种基于图像识别和语音识别的点击控制方法及系统 | |
US11397858B2 (en) | Utilizing widget content by virtual agent to initiate conversation | |
CN106155513B (zh) | 一种投影触屏的控制方法及装置 | |
CN111597435A (zh) | 一种语音搜索方法、装置及电子设备 | |
CN111045560A (zh) | 图片的发送方法及电子设备 | |
US20230015797A1 (en) | User terminal and control method therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180116 |
|
WD01 | Invention patent application deemed withdrawn after publication |