CN111475241A - 一种界面的操作方法、装置、电子设备及可读存储介质 - Google Patents
一种界面的操作方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN111475241A CN111475241A CN202010256674.3A CN202010256674A CN111475241A CN 111475241 A CN111475241 A CN 111475241A CN 202010256674 A CN202010256674 A CN 202010256674A CN 111475241 A CN111475241 A CN 111475241A
- Authority
- CN
- China
- Prior art keywords
- interface
- voice
- screen
- information
- voice instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 29
- 238000011017 operating method Methods 0.000 claims abstract description 7
- 238000004590 computer program Methods 0.000 claims description 7
- 230000009191 jumping Effects 0.000 claims description 6
- 230000006978 adaptation Effects 0.000 abstract description 12
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000010365 information processing Effects 0.000 abstract description 2
- 238000010408 sweeping Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请涉及信息处理技术领域,尤其涉及一种界面的操作方法、装置、电子设备及可读存储介质。本申请在接收用户发出的语音指令时,对当前的屏幕界面进行截屏,并从截屏图片中确定是否存在与语音指令相匹配的目标界面控件,若存在目标界面控件,控制目标界面控件执行语音指令对应的第一操作;若不存在目标界面控件,根据语音指令中的语音信息,确定控制屏幕界面的第二操作,并控制屏幕界面执行第二操作。这样,通过截屏图片和语音指令,对于电视终端中安装的任何应用程序都可以通过语音指令来进行控制,在省去了对应用程序的适配工作量的同时,还可以提升语音识别的准确率。
Description
技术领域
本申请涉及信息处理技术领域,尤其涉及一种界面的操作方法、装置、电子设备及可读存储介质。
背景技术
随着科学进步和时代的发展,电视终端具有的功能越来越多,其中,带有语音识别功能的电视终端,由于用户通过语音指令便可以实现对其进行操控,解放了用户的双手,而深受广大用户的欢迎。
通常,电视终端在投放市场前,需要事先对电视终端上配置的应用程序进行适配工作,这样,用户才可以实现对配置的应用程序进行语音控制,但是,对于用户后期自行安装的应用程序,由于没有进行适配,将无法通过语音指令进行控制,而适配过程繁琐,用户很难自行操作。
发明内容
有鉴于此,本申请实施例的目的在于提供一种界面的操作方法及装置,可以省去对第三方应用程序的适配工作量的同时,还可以提升语音识别的准确率。
主要包括以下几个方面:
第一方面,本申请实施例提供一种界面的操作方法,所述界面的操作方法包括:
在接收用户发出的语音指令时,对当前的屏幕界面进行截屏,得到截屏图片;
确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件;
若存在,控制所述目标界面控件执行所述语音指令对应的第一操作;
若不存在,根据所述语音指令中的语音信息,确定控制所述屏幕界面的第二操作,并控制所述屏幕界面执行所述第二操作。
在一种可能的实施方式中,根据以下步骤确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件:
从所述截屏图片中,识别出至少一个候选界面控件;
判断所述至少一个候选界面控件中,是否存在与所述语音指令相匹配的界面控件;
若存在,则将该界面控件确定为所述目标界面控件。
在一种可能的实施方式中,所述根据所述语音指令中的语音信息,确定控制所述屏幕界面的第二操作,包括:
将所述语音信息与语句库中存储的语句信息进行匹配;所述语句库中存储有多个语句信息和每个语句信息对应的操作;
若所述语句库中存在与所述语音信息匹配的语句信息,则获取该语句信息对应的操作,并将该操作确定为控制所述屏幕界面的第二操作。
在一种可能的实施方式中,在所述将所述语音信息与语句库中存储的语句信息进行匹配之后,所述操作方法还包括:
若所述语句库中不存在与所述语音信息匹配的语句信息,则从所述语音信息中提取出动词;
基于所述动词和所述语音指令,确定控制所述屏幕界面的第二操作。
在一种可能的实施方式中,所述基于所述动词和所述语音指令,确定控制所述屏幕界面的第二操作,包括:
从所述语句库中,确定包含所述动词的至少一个语句信息;
获取所述至少一个语句信息中每个语句信息对应的操作;
从所述至少一个语句信息对应的操作中,确定与所述语音指令匹配的操作,并将该操作确定为控制所述屏幕界面的第二操作。
在一种可能的实施方式中,若所述第二操作为跳转操作,所述控制所述屏幕界面执行所述第二操作,包括:
从所述当前的屏幕界面跳转到所述语音指令对应的界面。
第二方面,本申请实施例还提供一种界面的操作装置,所述界面的操作装置包括:
截屏模块,用于在接收用户发出的语音指令时,对当前的屏幕界面进行截屏,得到截屏图片;
第一确定模块,用于确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件;
控制模块,用于若存在,控制所述目标界面控件执行所述语音指令对应的第一操作;
第二确定模块,用于若不存在,根据所述语音指令中的语音信息,确定控制所述屏幕界面的第二操作,并控制所述屏幕界面执行所述第二操作。
在一种可能的实施方式中,所述第一确定模块用于根据以下步骤确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件:
从所述截屏图片中,识别出至少一个候选界面控件;
判断所述至少一个候选界面控件中,是否存在与所述语音指令相匹配的界面控件;
若存在,则将该界面控件确定为所述目标界面控件。
在一种可能的实施方式中,所述第二确定模块包括:
匹配单元,用于将所述语音信息与语句库中存储的语句信息进行匹配;所述语句库中存储有多个语句信息和每个语句信息对应的操作;
第一确定单元,用于若所述语句库中存在与所述语音信息匹配的语句信息,则获取该语句信息对应的操作,并将该操作确定为控制所述屏幕界面的第二操作。
在一种可能的实施方式中,所述第二确定模块还包括:
提取单元,用于若所述语句库中不存在与所述语音信息匹配的语句信息,则从所述语音信息中提取出动词;
第二确定单元,用于基于所述动词和所述语音指令,确定控制所述屏幕界面的第二操作。
在一种可能的实施方式中,所述第二确定单元用于根据以下步骤确定控制所述屏幕界面的第二操作:
从所述语句库中,确定包含所述动词的至少一个语句信息;
获取所述至少一个语句信息中每个语句信息对应的操作;
从所述至少一个语句信息对应的操作中,确定与所述语音指令匹配的操作,并将该操作确定为控制所述屏幕界面的第二操作。
在一种可能的实施方式中,若所述第二操作为跳转操作,所述第二确定模块用于根据以下步骤控制所述屏幕界面执行所述第二操作:
从所述当前的屏幕界面跳转到所述语音指令对应的界面。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的界面的操作方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的界面的操作方法的步骤。
本申请实施例中,在接收用户发出的语音指令时,对当前的屏幕界面进行截屏,并从截屏图片中确定是否存在与语音指令相匹配的目标界面控件,若存在,控制目标界面控件执行语音指令对应的第一操作,通过在当前屏幕界面确定目标界面控件,并控制目标界面执行第一操作,在任何应用程序中都可以通过语音指令控制当前的界面,免去对第三方应用程序的适配工作,若不存在,根据语音指令中的语音信息,确定控制屏幕界面的第二操作,并控制屏幕界面执行第二操作,实现了可以对所有语音指令进行识别,并执行语音指令对应的操作的效果。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种界面的操作方法的流程图;
图2示出了本申请实施例所提供的一种界面的操作装置的结构示意图之一;
图3示出了本申请实施例所提供的一种界面的操作装置的结构示意图之二;
图4示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中的附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例,都属于本申请保护的范围。
值得注意的是,在本申请提出之前,通常,电视终端在投放市场前,需要事先对电视终端上配置的应用程序进行适配工作,这样,用户才可以实现对配置的应用程序进行语音控制,但是,对于用户后期自行安装的应用程序,由于没有进行适配,将无法通过语音指令进行控制,而适配过程繁琐,用户很难自行操作。
针对上述问题,本申请实施例在接收用户发出的语音指令时,对当前的屏幕界面进行截屏,并从截屏图片中确定是否存在与语音指令相匹配的目标界面控件,若存在目标界面控件,控制目标界面控件执行语音指令对应的第一操作;若不存在目标界面控件,根据语音指令中的语音信息,确定控制屏幕界面的第二操作,并控制屏幕界面执行第二操作。这样,通过截屏图片和语音指令,对于电视终端中安装的任何应用程序都可以通过语音指令来进行控制,在省去了对应用程序的适配工作量的同时,还可以提升语音识别的准确率。
需要说明的是,本申请适用的智能设备可以是带有智能语音识别功能的电视终端,并且本发明中带有智能语音识别功能的电视终端可以通过物联网技术与住宅中的各种智能设备进行交互,实现智能家居。
为便于对本申请进行理解,下面结合具体实施例对本申请提供的技术方案进行详细说明。
图1为本申请实施例一所提供的一种界面的操作方法的流程图。所述界面的操作方法,包括以下步骤:
S101:在接收用户发出的语音指令时,对当前的屏幕界面进行截屏,得到截屏图片。
该步骤中,在接收用户发出的语音指令之后,就对当前的屏幕界面进行截屏,就可以得到当前屏幕界面对应的截屏图片。
S102:确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件。
该步骤中,在S101中获取到的截屏图片中,筛选出是否存在有与接收到用户的语音指令相匹配的目标界面控件,其中,界面控件可以是特殊图案类别的界面控件,也可以是单纯的是文字类别的界面控件,通过点击界面控件,便可以控制界面控件对应的操作,或者跳转到界面控件对应的界面。
一示例中,界面控件可以是特殊图形类别的界面控件,如在视频软件中,“下一集”的界面控件是一个倒着的三角形和一个竖杠的特殊图形,界面控件也可以是单纯文字类别的界面控件,如在网页中,“热点新闻”这几个字,就可以通过点击跳转到对应的热点新闻。
S103:若存在,控制所述目标界面控件执行所述语音指令对应的第一操作。
该步骤中,如果截屏图片中有与语音指令相匹配的目标界面控件,也就是当前屏幕界面中有与语音指令相匹配的目标界面控件,就控制目标界面控件执行与语音指令相对应的操作。
一示例中,假设电视终端的当前界面是在播放一首歌,此时用户想要切换下一首,对着电视终端发出“播放下一首音乐”,所以在当前界面对应的截屏图片中,确定出与“下一首”对应的目标界面控件,确定出“下一首”对应的目标界面控件之后,控制“下一首”对应的目标界面控件进行点击,实现通过语音输入播放下一首的效果。
其中,对当前的屏幕界面进行截屏,得到当前界面对应的截屏图片,因为当前的屏幕与对应的截屏图片是等比例缩小或者放大,所以在截屏图片中确定出目标界面控件的位置之后,在当前的屏幕的相对位置也可以精准地确定出目标界面控件的位置。
需要说明的是,本发明预先建立一个语音指令库,其中存储着各个应用程序中存在的界面控件的名称和对应的图形,以便无论当前的屏幕界面在哪一个应用程序中,都可以确定出与语音指令相匹配的目标界面控件,假设不同的音乐播放器中“下一首”对应的界面控件都略有不同,所以预先存储好各个应用程序中界面控件的名称以及对应的图形,在识别目标界面控件的时候,不用适配第三方应用程序的界面控件,可以直接识别,省去了对应用程序的适配工作量。
S104:若不存在,根据所述语音指令中的语音信息,确定控制所述屏幕界面的第二操作,并控制所述屏幕界面执行所述第二操作。
该步骤中,如果截屏图片中没有与语音指令相匹配的目标界面控件,也就是当前屏幕界面中没有与语音指令相匹配的目标界面控件,那么根据接收到的语音指令确定出当前屏幕界面要执行的第二操作,其中第二操作可以包括跳转其他屏幕界面,控制其它屏幕界面执行操作或者在当前屏幕界面执行语音指令相关的操作,因此,本申请不仅通过截屏来识别与语音指令相匹配的目标界面控件,在没有目标界面控件时,通过识别语音指令中的语音信息,来确定控制屏幕界面的操作,可以提升语音识别的准确率。
进一步地,本发明中的电视终端设备不仅通过语音指令对当前屏幕界面进行控制,也可以通过该设备向其他设备进行控制,达到智能家居的效果,强化了电视终端的功能。
在本申请实施例中,在接收用户发出的语音指令时,对当前的屏幕界面进行截屏,并从截屏图片中确定是否存在与语音指令相匹配的目标界面控件,若存在目标界面控件,控制目标界面控件执行语音指令对应的第一操作;若不存在目标界面控件,根据语音指令中的语音信息,确定控制屏幕界面的第二操作,并控制屏幕界面执行第二操作。这样,通过截屏图片和语音指令,对于电视终端中安装的任何应用程序都可以通过语音指令来进行控制,在省去了对应用程序的适配工作量的同时,还可以提升语音识别的准确率。
在一种可能的实施方式中,在S102中所述确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件,包括以下步骤:
步骤(2A):从所述截屏图片中,识别出至少一个候选界面控件。
该步骤中,在得到的当前屏幕界面对应的截屏图片中,可能存在有多个功能各异的候选界面控件,假设在音乐播放器的屏幕界面中,就可能存在有“上一首”、“下一首”、“播放”/“暂停”和“播放模式”等多个候选界面控件,从截屏图片中可能存在的多个候选界面控件都识别出来。
步骤(2B):判断所述至少一个候选界面控件中,是否存在与所述语音指令相匹配的界面控件。
步骤(2C):若存在,则将该界面控件确定为所述目标界面控件。
该步骤中,将从截屏图片中识别出的至少一个候选界面控件与语音指令相匹配,并判断是否存在有与语音指令相匹配的界面控件,假设,语音指令为“播放下一首”,那么识别出的至少一个候选界面控件中与语音指令相匹配的界面控件是“下一首”,所以“下一首”对应的界面控件就是目标界面控件。
在一种可能的实施方式中,在S104中所述根据所述语音指令中的语音信息,确定控制所述屏幕界面的第二操作,包括以下步骤:
步骤(3A):将所述语音信息与语句库中存储的语句信息进行匹配;所述语句库中存储有多个语句信息和每个语句信息对应的操作。
该步骤中,提取语音指令中的语音信息,再将语音信息与语句库中存储的语音信息进行匹配,其中,语句库中存储着多个语句信息,以及每个语句信息对应的操作。
步骤(3B):若所述语句库中存在与所述语音信息匹配的语句信息,则获取该语句信息对应的操作,并将该操作确定为控制所述屏幕界面的第二操作。
该步骤中,如果从语句库中匹配到与语音信息相匹配的语句信息,则在语句库中获取该语句信息对应的操作,并将该操作作为当前的屏幕界面应该执行的第二操作。
一示例中,假设电视终端当前的屏幕界面处在某个音乐播放器中,此时接收到用户发来的“启动扫地机器人”的语音指令,在与当前的屏幕界面对应的截屏图片匹配之后,没有发现与“启动扫地机器人”相匹配的目标界面控件,那么将“启动扫地机器人”这一语音信息与语句库做匹配,找出语句库中存储着“扫地机器人”这一语句信息,所以再配合着语音信息中的“启动”,使电视终端的界面跳转到“扫地机器人”界面中,并在“扫地机器人”的界面中执行“启动”的指令。
需要说明的是,如上述例子中,在电视终端收到“启动扫地机器人”的语音指令之后,电视终端可以通过从语句库中找出与“扫地机器人”相关的操作,再跳转到电视终端中“扫地机器人”的界面,再截屏,从当前的屏幕界面中找出“执行”的目标界面控件,也可以直接向扫地机器人发送启动的命令。
在一种可能的实施方式中,在步骤(3A)中所述将所述语音信息与语句库中存储的语句信息进行匹配之后,还包括以下步骤:
步骤(4A):若所述语句库中不存在与所述语音信息匹配的语句信息,则从所述语音信息中提取出动词。
步骤(4B):基于所述动词和所述语音指令,确定控制所述屏幕界面的第二操作。
该步骤中,如果语句库中不存在与语音信息匹配的语句信息,则从接收到的语音信息中提取出动词,如“阅读”这样的动词,根据提取出的动词,以及语音信息,控制当前的屏幕界面执行第二操作。
一示例中,假设当前的界面是某一新闻的文字信息,用户不想用眼睛看,想听到新闻,所以向电视终端发出“阅读第二段”的语音指令,当电视终端接收到语音指令后,对当前的屏幕界面进行截图,并从语音信息中提取出“阅读”这样的动词,结合语音指令中的“第二段”,对当前的屏幕界面对应的截屏图片中的第二段用预先存储的模拟人声进行播放。
在一种可能的实施方式中,在步骤(4B)中所述基于所述动词和所述语音指令,确定控制所述屏幕界面的第二操作,包括以下步骤:
步骤(5A):从所述语句库中,确定包含所述动词的至少一个语句信息。
该步骤中,根据从语音指令中提取出的动词与语句库进行匹配,从语句库中找出包含该动词的至少一个语句信息。
一示例中,假设接收的语音指令为“阅读第二段”,从该语音信息中提取出的动词为“阅读”,将“阅读”这个动词与语句库中各个语句信息进行匹配,找出的包含“阅读”的语句信息包括:“阅读当前屏幕界面的段落”、“阅读下一屏幕界面的段落”以及“阅读上一屏幕界面的段落”。
步骤(5B):获取所述至少一个语句信息中每个语句信息对应的操作。
步骤(5C):从所述至少一个语句信息对应的操作中,确定与所述语音指令匹配的操作,并将该操作确定为控制所述屏幕界面的第二操作。
该步骤中,获取包含动词的至少一个语句信息,以及每个语句信息对应的操作,并将每个语句信息与接收到的语音指令进行匹配,从至少一个语句信息中确定出与语音指令相匹配的语句信息,并将该语句信息对应的操作,确定为控制当前屏幕界面的第二操作。
一示例中,通过将动词与语句库进行匹配,匹配到的语句信息有“阅读当前屏幕界面的段落”、“阅读下一屏幕界面的段落”以及“阅读上一屏幕界面的段落”,若接收到的语音指令是“阅读第二段”,用该语音指令与从语句库中匹配出的三个语句信息进一步匹配,确定出“阅读当前屏幕界面的段落”是与语音指令最匹配的,将“阅读当前屏幕界面”对应的操作确定为控制当前屏幕界面的第二操作。
在一种可能的实施方式中,若所述第二操作为跳转操作,所述控制所述屏幕界面执行所述第二操作,包括:
从所述当前的屏幕界面跳转到所述语音指令对应的界面。
该步骤中,若第二操作为跳转操作,那么控制当前屏幕界面执行该第二操作包括控制当前屏幕界面跳转到与语音指令相匹配的界面。
其中,第二操作还包括通过提取语音信息中的动词,以及通过获取该动词对应的操作而确定出控制当前屏幕界面的第二操作。
一示例中,若当前屏幕界面是在一个音乐播放器中,若此时接收到的语音指令是“启动洗衣机”,那么当前的屏幕界面就跳转到应用程序为“洗衣机”的屏幕界面,并对“洗衣机”的屏幕界面进行控制。
基于同一申请构思,本申请实施例中还提供了与上述实施例提供的一种界面的操作方法对应的界面的操作装置,由于本申请实施例中的装置解决问题的原理与本申请上述实施例的界面的操作方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参见图2所示,为本申请实施例提供的一种界面的操作装置200的结构示意图之一,参见图3所示,为本申请实施例提供的一种界面的操作装置200的结构示意图之二,其中,如图2和图3所示,本申请实施例提供的界面的操作装置200,包括:
截屏模块210,用于在接收用户发出的语音指令时,对当前的屏幕界面进行截屏,得到截屏图片;
第一确定模块220,用于确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件;
控制模块230,用于若存在,控制所述目标界面控件执行所述语音指令对应的第一操作;
第二确定模块240,用于若不存在,根据所述语音指令中的语音信息,确定控制所述屏幕界面的第二操作,并控制所述屏幕界面执行所述第二操作。
本申请在接收用户发出的语音指令时,通过截屏模块210对当前的屏幕界面进行截屏,并通过第一确定模块220从截屏图片中确定是否存在与语音指令相匹配的目标界面控件,若存在,通过控制模块230控制目标界面控件执行语音指令对应的第一操作,若不存在,根据语音指令中的语音信息,通过第二确定模块240确定控制屏幕界面的第二操作,并控制屏幕界面执行第二操作。这样,通过截屏图片和语音指令,对于电视终端中安装的任何应用程序都可以通过语音指令来进行控制,在省去了对应用程序的适配工作量的同时,还可以提升语音识别的准确率。
在一种可能的实施方式中,所述第一确定模块220用于根据以下步骤确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件:
从所述截屏图片中,识别出至少一个候选界面控件;
判断所述至少一个候选界面控件中,是否存在与所述语音指令相匹配的界面控件;
若存在,则将该界面控件确定为所述目标界面控件。
在一种可能的实施方式中,如图3所示,所述第二确定模块240包括:
匹配单元241,用于将所述语音信息与语句库中存储的语句信息进行匹配;所述语句库中存储有多个语句信息和每个语句信息对应的操作;
第一确定单元242,用于若所述语句库中存在与所述语音信息匹配的语句信息,则获取该语句信息对应的操作,并将该操作确定为控制所述屏幕界面的第二操作。
在一种可能的实施方式中,如图3所示,所述第二确定模块240还包括:
提取单元243,用于若所述语句库中不存在与所述语音信息匹配的语句信息,则从所述语音信息中提取出动词;
第二确定单元244,用于基于所述动词和所述语音指令,确定控制所述屏幕界面的第二操作。
在一种可能的实施方式中,所述第二确定单元244用于根据以下步骤确定控制所述屏幕界面的第二操作:
从所述语句库中,确定包含所述动词的至少一个语句信息;
获取所述至少一个语句信息中每个语句信息对应的操作;
从所述至少一个语句信息对应的操作中,确定与所述语音指令匹配的操作,并将该操作确定为控制所述屏幕界面的第二操作。
在一种可能的实施方式中,若所述第二操作为跳转操作,所述第二确定模块240用于根据以下步骤控制所述屏幕界面执行所述第二操作:
从所述当前的屏幕界面跳转到所述语音指令对应的界面。
基于同一申请构思,参见图4所示,为本申请实施例提供的一种电子设备400的结构示意图,包括:处理器410、存储器420和总线430,所述存储器420存储有所述处理器410可执行的机器可读指令,当电子设备400运行时,所述处理器410与所述存储器420之间通过所述总线430进行通信,所述机器可读指令被所述处理器410运行时执行如上述实施例所述的界面的操作界面的操作方法的步骤。
具体地,所述机器可读指令被所述处理器410执行时可以执行如下处理:
在接收用户发出的语音指令时,对当前的屏幕界面进行截屏,得到截屏图片;
确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件;
若存在,控制所述目标界面控件执行所述语音指令对应的第一操作;
若不存在,根据所述语音指令中的语音信息,确定控制所述屏幕界面的第二操作,并控制所述屏幕界面执行所述第二操作。
本申请实施例中,在接收用户发出的语音指令时,对当前的屏幕界面进行截屏,并从截屏图片中确定是否存在与语音指令相匹配的目标界面控件,若存在目标界面控件,控制目标界面控件执行语音指令对应的第一操作;若不存在目标界面控件,根据语音指令中的语音信息,确定控制屏幕界面的第二操作,并控制屏幕界面执行第二操作。这样,通过截屏图片和语音指令,对于电视终端中安装的任何应用程序都可以通过语音指令来进行控制,在省去了对应用程序的适配工作量的同时,还可以提升语音识别的准确率。
基于同一申请构思,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例中提供的一种界面的操作方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应所述理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者所述技术方案的部分可以以软件产品的形式体现出来,所述计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种界面的操作方法,其特征在于,所述操作方法包括:
在接收用户发出的语音指令时,对当前的屏幕界面进行截屏,得到截屏图片;
确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件;
若存在,控制所述目标界面控件执行所述语音指令对应的第一操作;
若不存在,根据所述语音指令中的语音信息,确定控制所述屏幕界面的第二操作,并控制所述屏幕界面执行所述第二操作。
2.根据权利要求1所述的操作方法,其特征在于,根据以下步骤确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件:
从所述截屏图片中,识别出至少一个候选界面控件;
判断所述至少一个候选界面控件中,是否存在与所述语音指令相匹配的界面控件;
若存在,则将该界面控件确定为所述目标界面控件。
3.根据权利要求1所述的操作方法,其特征在于,所述根据所述语音指令中的语音信息,确定控制所述屏幕界面的第二操作,包括:
将所述语音信息与语句库中存储的语句信息进行匹配;所述语句库中存储有多个语句信息和每个语句信息对应的操作;
若所述语句库中存在与所述语音信息匹配的语句信息,则获取该语句信息对应的操作,并将该操作确定为控制所述屏幕界面的第二操作。
4.根据权利要求3所述的操作方法,其特征在于,在所述将所述语音信息与语句库中存储的语句信息进行匹配之后,所述操作方法还包括:
若所述语句库中不存在与所述语音信息匹配的语句信息,则从所述语音信息中提取出动词;
基于所述动词和所述语音指令,确定控制所述屏幕界面的第二操作。
5.根据权利要求4所述的操作方法,其特征在于,所述基于所述动词和所述语音指令,确定控制所述屏幕界面的第二操作,包括:
从所述语句库中,确定包含所述动词的至少一个语句信息;
获取所述至少一个语句信息中每个语句信息对应的操作;
从所述至少一个语句信息对应的操作中,确定与所述语音指令匹配的操作,并将该操作确定为控制所述屏幕界面的第二操作。
6.根据权利要求1所述的操作方法,其特征在于,若所述第二操作为跳转操作,所述控制所述屏幕界面执行所述第二操作,包括:
从所述当前的屏幕界面跳转到所述语音指令对应的界面。
7.一种界面的操作装置,其特征在于,所述操作装置包括:
截屏模块,用于在接收用户发出的语音指令时,对当前的屏幕界面进行截屏,得到截屏图片;
第一确定模块,用于确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件;
控制模块,用于若存在,控制所述目标界面控件执行所述语音指令对应的第一操作;
第二确定模块,用于若不存在,根据所述语音指令中的语音信息,确定控制所述屏幕界面的第二操作,并控制所述屏幕界面执行所述第二操作。
8.根据权利要求7所述的操作装置,其特征在于,所述第一确定模块用于根据以下步骤确定所述截屏图片中是否存在与所述语音指令相匹配的目标界面控件:
从所述截屏图片中,识别出至少一个候选界面控件;
判断所述至少一个候选界面控件中,是否存在与所述语音指令相匹配的界面控件;
若存在,则将该界面控件确定为所述目标界面控件。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至6任一项所述的一种界面的操作方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至6任一项所述的一种界面的操作方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010256674.3A CN111475241B (zh) | 2020-04-02 | 2020-04-02 | 一种界面的操作方法、装置、电子设备及可读存储介质 |
PCT/CN2020/126480 WO2021196609A1 (zh) | 2020-04-02 | 2020-11-04 | 一种界面的操作方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010256674.3A CN111475241B (zh) | 2020-04-02 | 2020-04-02 | 一种界面的操作方法、装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111475241A true CN111475241A (zh) | 2020-07-31 |
CN111475241B CN111475241B (zh) | 2022-03-11 |
Family
ID=71750466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010256674.3A Active CN111475241B (zh) | 2020-04-02 | 2020-04-02 | 一种界面的操作方法、装置、电子设备及可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111475241B (zh) |
WO (1) | WO2021196609A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113314120A (zh) * | 2021-07-30 | 2021-08-27 | 深圳传音控股股份有限公司 | 处理方法、处理设备及存储介质 |
CN113438360A (zh) * | 2021-06-18 | 2021-09-24 | 当代世界(北京)信息科技研究院 | 一种安卓客户端基于人工智能与语音识别的截屏方法 |
WO2021196609A1 (zh) * | 2020-04-02 | 2021-10-07 | 深圳创维-Rgb电子有限公司 | 一种界面的操作方法、装置、电子设备及可读存储介质 |
CN114025210A (zh) * | 2021-11-01 | 2022-02-08 | 深圳小湃科技有限公司 | 弹窗屏蔽方法、设备、存储介质及装置 |
CN114090148A (zh) * | 2021-11-01 | 2022-02-25 | 深圳Tcl新技术有限公司 | 信息同步方法、装置、电子设备及计算机可读存储介质 |
CN114237479A (zh) * | 2021-12-08 | 2022-03-25 | 阿波罗智联(北京)科技有限公司 | 一种应用程序的控制方法、装置及电子设备 |
WO2023000698A1 (zh) * | 2021-07-23 | 2023-01-26 | 北京百度网讯科技有限公司 | 通过语音方式控制程序的方法、设备及程序产品 |
CN116382615A (zh) * | 2023-03-17 | 2023-07-04 | 深圳市同行者科技有限公司 | 语音操作app应用的方法、系统及相关设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010286914A (ja) * | 2009-06-09 | 2010-12-24 | Toshiba Corp | メニュー画面表示制御装置及びメニュー画面表示制御方法 |
CN105354017A (zh) * | 2015-09-28 | 2016-02-24 | 小米科技有限责任公司 | 信息处理方法及装置 |
CN106101789A (zh) * | 2016-07-06 | 2016-11-09 | 深圳Tcl数字技术有限公司 | 终端的语音交互方法及装置 |
CN109471678A (zh) * | 2018-11-07 | 2019-03-15 | 苏州思必驰信息科技有限公司 | 基于图像识别的语音中控方法及装置 |
CN110060672A (zh) * | 2019-03-08 | 2019-07-26 | 华为技术有限公司 | 一种语音控制方法及电子设备 |
CN110085224A (zh) * | 2019-04-10 | 2019-08-02 | 深圳康佳电子科技有限公司 | 智能终端全程语音操控处理方法、智能终端及存储介质 |
CN110570846A (zh) * | 2018-06-05 | 2019-12-13 | 青岛海信移动通信技术股份有限公司 | 一种语音控制方法、装置及手机 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7559027B2 (en) * | 2006-02-28 | 2009-07-07 | Palm, Inc. | Master multimedia software controls |
JP6124594B2 (ja) * | 2013-01-08 | 2017-05-10 | 三菱電機株式会社 | 電力系統監視制御装置およびその制御プログラム |
CN103853355A (zh) * | 2014-03-17 | 2014-06-11 | 吕玉柱 | 电子设备操作方法及其操控设备 |
CN110018858B (zh) * | 2019-04-02 | 2022-03-01 | 杭州蓦然认知科技有限公司 | 一种基于语音控制的应用管理方法、装置 |
CN110457105B (zh) * | 2019-08-07 | 2021-11-09 | 腾讯科技(深圳)有限公司 | 界面操作方法、装置、设备及存储介质 |
CN111475241B (zh) * | 2020-04-02 | 2022-03-11 | 深圳创维-Rgb电子有限公司 | 一种界面的操作方法、装置、电子设备及可读存储介质 |
-
2020
- 2020-04-02 CN CN202010256674.3A patent/CN111475241B/zh active Active
- 2020-11-04 WO PCT/CN2020/126480 patent/WO2021196609A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010286914A (ja) * | 2009-06-09 | 2010-12-24 | Toshiba Corp | メニュー画面表示制御装置及びメニュー画面表示制御方法 |
CN105354017A (zh) * | 2015-09-28 | 2016-02-24 | 小米科技有限责任公司 | 信息处理方法及装置 |
CN106101789A (zh) * | 2016-07-06 | 2016-11-09 | 深圳Tcl数字技术有限公司 | 终端的语音交互方法及装置 |
CN110570846A (zh) * | 2018-06-05 | 2019-12-13 | 青岛海信移动通信技术股份有限公司 | 一种语音控制方法、装置及手机 |
CN109471678A (zh) * | 2018-11-07 | 2019-03-15 | 苏州思必驰信息科技有限公司 | 基于图像识别的语音中控方法及装置 |
CN110060672A (zh) * | 2019-03-08 | 2019-07-26 | 华为技术有限公司 | 一种语音控制方法及电子设备 |
CN110085224A (zh) * | 2019-04-10 | 2019-08-02 | 深圳康佳电子科技有限公司 | 智能终端全程语音操控处理方法、智能终端及存储介质 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021196609A1 (zh) * | 2020-04-02 | 2021-10-07 | 深圳创维-Rgb电子有限公司 | 一种界面的操作方法、装置、电子设备及可读存储介质 |
CN113438360A (zh) * | 2021-06-18 | 2021-09-24 | 当代世界(北京)信息科技研究院 | 一种安卓客户端基于人工智能与语音识别的截屏方法 |
WO2023000698A1 (zh) * | 2021-07-23 | 2023-01-26 | 北京百度网讯科技有限公司 | 通过语音方式控制程序的方法、设备及程序产品 |
CN113314120A (zh) * | 2021-07-30 | 2021-08-27 | 深圳传音控股股份有限公司 | 处理方法、处理设备及存储介质 |
CN114025210A (zh) * | 2021-11-01 | 2022-02-08 | 深圳小湃科技有限公司 | 弹窗屏蔽方法、设备、存储介质及装置 |
CN114090148A (zh) * | 2021-11-01 | 2022-02-25 | 深圳Tcl新技术有限公司 | 信息同步方法、装置、电子设备及计算机可读存储介质 |
CN114237479A (zh) * | 2021-12-08 | 2022-03-25 | 阿波罗智联(北京)科技有限公司 | 一种应用程序的控制方法、装置及电子设备 |
CN116382615A (zh) * | 2023-03-17 | 2023-07-04 | 深圳市同行者科技有限公司 | 语音操作app应用的方法、系统及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111475241B (zh) | 2022-03-11 |
WO2021196609A1 (zh) | 2021-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111475241B (zh) | 一种界面的操作方法、装置、电子设备及可读存储介质 | |
CN110090444B (zh) | 游戏中行为记录创建方法、装置、存储介质及电子设备 | |
US10860345B2 (en) | System for user sentiment tracking | |
CN108986564B (zh) | 一种基于智能交互的报读控制方法及电子设备 | |
JP2019185062A (ja) | 音声インタラクション方法、端末機器及びコンピュータ読み取り可能な記憶媒体 | |
CN106648535A (zh) | 直播客户端语音输入方法及终端设备 | |
CN105045411A (zh) | 一种对象控制方法及终端 | |
CN108304762B (zh) | 一种人体姿态匹配方法及其设备、存储介质、终端 | |
CN109165336B (zh) | 一种信息输出控制方法及家教设备 | |
CN111901665B (zh) | 教学资源播放方法、设备及存储介质 | |
CN109086590B (zh) | 一种电子设备的界面显示方法及电子设备 | |
CN111862280A (zh) | 虚拟角色控制方法、系统、介质及电子设备 | |
CN111077996A (zh) | 一种基于点读的信息推荐方法及学习设备 | |
CN110302535B (zh) | 游戏线索记录方法、装置、设备和可读存储介质 | |
CN112631814A (zh) | 游戏剧情对白播放方法和装置、存储介质、电子设备 | |
CN114449327A (zh) | 视频片段的分享方法、装置、电子设备及可读存储介质 | |
CN111343508B (zh) | 信息显示控制方法及装置、电子设备、存储介质 | |
CN104866477B (zh) | 一种信息处理方法及电子设备 | |
CN111028591B (zh) | 一种听写控制方法及学习设备 | |
US11775070B2 (en) | Vibration control method and system for computer device | |
CN112951013B (zh) | 一种学习交互方法、装置、电子设备以及存储介质 | |
CN111176535B (zh) | 一种基于智能音箱的分屏方法及智能音箱 | |
CN111090383B (zh) | 一种指令识别方法及电子设备 | |
CN111028590B (zh) | 一种听写过程中引导用户书写的方法及学习设备 | |
CN114931747B (zh) | 一种游戏控制器和智能语音控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |