CN110968375B - 界面控制方法、装置、智能终端及计算机可读存储介质 - Google Patents
界面控制方法、装置、智能终端及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110968375B CN110968375B CN201811150626.5A CN201811150626A CN110968375B CN 110968375 B CN110968375 B CN 110968375B CN 201811150626 A CN201811150626 A CN 201811150626A CN 110968375 B CN110968375 B CN 110968375B
- Authority
- CN
- China
- Prior art keywords
- control
- application
- image
- interface
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000004088 simulation Methods 0.000 claims abstract description 40
- 230000011218 segmentation Effects 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 19
- 238000009434 installation Methods 0.000 claims description 9
- 238000012544 monitoring process Methods 0.000 claims description 9
- 238000011900 installation process Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000009471 action Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
- Character Input (AREA)
Abstract
本发明实施例适用于界面控制技术领域,公开了一种界面控制方法、装置、智能终端及计算机可读存储介质,其中,方法包括:当接收到控制语音时,对当前界面执行截屏操作,得到待识别界面图像;划分待识别界面图像得到每个控件的控件子图像;遍历所有控件子图像,得到各个控件子图像内的文字信息;将控制语音对应的文字信息与各控件的控件文字信息进行匹配,判断是否一致;当控制语音对应的文字信息与控件的控件文字信息一致,向控件发送模拟按键控制指令,以对控件进行模拟控制。本发明实施例可以在界面控件包含图片且图片内有文字的场景下,实现界面控件的控制。
Description
技术领域
本发明属于界面控制技术领域,尤其涉及一种界面控制方法、装置、智能终端及计算机可读存储介质。
背景技术
随着终端技术的不断发展,智能终端的应用也越来越广泛。
目前,手机、平板电脑、智能电视等终端一般是基于Android操作系统的。智能终端可以通过语音控制,即,用户输入语音,智能终端根据语音执行相应的控制操作。其中,智能终端在接收到用户语音后,将语音内容转换为文字内容,然后在终端界面或应用界面上搜寻与该语音内容一致的控件,再发送模拟按键指令来操作相应控件,以实现语音控制界面。但是,现有的语音控制界面的方法只能控制界面上单纯包含文字的控件,对于一些包含图片,且图片中有文字的界面控件,由于无法识别出图片中的文字内容,无法实现对该界面控件的语音控制,实现界面控制。
发明内容
有鉴于此,本发明实施例提供了一种界面控制方法、装置、智能终端及计算机可读存储介质,以解决现有在控制界面包含图片且图片中有文字的场景下无法实现对该界面进行控制的问题。
本发明实施例的第一方面提供了一种界面控制方法,包括:当接收到控制语音时,对当前界面执行截屏操作,得到待识别界面图像;划分所述待识别界面图像得到每个控件的控件子图像;遍历所有所述控件子图像,得到各个所述控件子图像内的文字信息;将所述控制语音对应的文字信息与各所述控件的控件文字信息进行匹配,判断是否一致;当所述控制语音对应的文字信息与所述控件的控件文字信息一致,向所述控件发送模拟按键控制指令,以对所述控件进行模拟控制。
可选地,所述遍历所有所述控件子图像,得到各个所述控件子图像内的文字信息,包括:遍历所有所述待识别界面图像中所有控件子图像;对所遍历到的任意一个所述控件子图像执行以下步骤:
将所述控件子图像作为当前控件子图像;
对所述当前控件子图像进行灰度化和二值化处理,得到所述当前控件子图像的灰度图像;
分别对所述灰度图像进行水平投影和垂直投影,对所述灰度图像进行字符分割,并获取分割后单个字符的信息,获得所述当前控件子图像的文字信息。
可选地,所述向所述控件发送模拟按键控制指令,以对所述控件进行模拟控制,包括:从预建立的控件数据库获取与所述控件文字信息对应的所述控件的界面位置信息;根据所述界面位置信息,向所述控件发送模拟按键控制指令,以对所述进行模拟控制。
可选地,所述划分所述待识别界面图像得到每个控件的控件子图像,包括:获取当前界面包信息;根据所述当前界面包信息,从预建立的控件数据库获取当前界面各控件的控件属性信息;根据所述控件属性信息,通过划分所述待识别界面图像得到每个所述控件的控件子图像。
可选地,在所述当接收到控制语音时,对当前界面执行截屏操作,得到待识别界面图像之前,还包括:调用应用程序管理服务,获取智能终端上已安装应用的应用程序文件;通过反汇编工具对所述应用程序文件进行反汇编,得到应用程序资源文件;解析各个所述应用程序资源文件,获得每一个应用程序的应用信息;其中,所述应用信息包括应用包名、应用界面包包名以及应用界面的控件信息;根据所述应用信息,建立控件数据库。
可选地,还包括:通过监听器实时监听所述智能终端是否有新应用安装操作或者应用卸载操作;当监听到有新应用安装操作,在新应用安装过程中调用所述应用程序管理服务对所述新应用进行解析,获得所述新应用的应用信息,并将所述新应用的应用信息存储在所述控件数据库;当监听到有应用卸载操作时,在应用卸载过程中调用所述应用程序管理服务对卸载应用进行解析,获得所述卸载应用的应用信息,并根据所述卸载应用的应用信息,从所述控件数据库删除所述卸载应用的应用信息。
本发明实施例的第二方面提供了一种界面控制装置,包括:
截屏模块,用于当接收到控制语音时,对当前界面执行截屏操作,得到待识别界面图像;
划分模块,用于划分所述待识别界面图像得到每个控件的控件子图像;
遍历模块,用于遍历所有所述控件子图像,得到各个所述控件子图像内的文字信息;
匹配模块,用于将所述控制语音对应的文字信息与各所述控件的控件文字信息进行匹配,判断是否一致;
模拟控制模块,用于当所述控制语音对应的文字信息与所述控件的控件文字信息一致,向所述控件发送模拟按键控制指令,以对所述控件进行模拟控制。
可选地,所述遍历模块包括:
遍历单元,用于遍历所有所述待识别界面图像中所有控件子图像;对所遍历到的任意一个所述控件子图像执行以下步骤:
将所述控件子图像作为当前控件子图像;
对所述当前控件子图像进行灰度化和二值化处理,得到所述当前控件子图像的灰度图像;
分别对所述灰度图像进行水平投影和垂直投影,对所述灰度图像进行字符分割,并获取分割后单个字符的信息,获得所述当前控件子图像的文字信息。
本发明实施例的第三方面提供了一种智能终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面任一项所述方法的步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面任一项所述方法的步骤。
本发明实施例与现有技术相比存在的有益效果是:
本发明实施例在控制语音输入时,截取当前界面图像得到待识别截面图像,然后划分待识别界面图像,得到每个控件的控件子图像,再通过遍历各个控件子图像获取各个控件子图像上的文字信息,根据控件文字信息和控制语音对应的文字信息,发送相应的模拟按键控制指令,以在界面上的控件包含图片且图片内有文字的场景下,实现对界面控件的控制。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种界面控制方法的流程示意图;
图2为本发明实施例提供的界面控制方法的另一种流程示意框图;
图3为本发明实施例提供的控件子图像的文字信息获取过程的具体流程示意图;
图4为本发明实施例提供的步骤S303的具体流程示意图;
图5为本发明实施例提供的步骤S410的具体流程示意图;
图6为本发明实施例提供的一种界面控制方法的另一种流程示意图;
图7为本发明实施例提供的一种界面控制方法的又一流程示意图;
图8为本发明实施例提供的应用界面示意图;
图9为本发明实施例提供的一种界面控制装置的结构示意框图;
图10为本发明实施例提供的智能终端的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
在介绍本发明实施例提供的技术方案之前,首先对本发明实施例可能涉及的应用场景进行介绍说明。
本发明实施例的技术方案可以具体应用于基于Android操作系统的智能终端,该智能终端可以包括但不限于智能手机、平板电脑、智能电视等。智能终端上安装有多个应用程序,每个应用程序均有相应的应用界面,每个应用界面上有一个或多个的控件节点。这些控件节点可以单纯包含文字,也可以包含图片,图片里包含有相应的文字信息。用户可以点击这些控件节点,对该界面进行相应的控制操作。
现有技术中可以通过语音控制应用界面中的文字控件节点,但是,对于一些包含图片,且图片包含文字信息的控件,目前无法对其进行界面控制。本发明实施例提供的技术方案可以实现在控件包含图片,且图片包含文字信息的场景下的界面控制。在介绍完本发明实施例可能涉及的应用场景后,下面将对本发明实施例的技术方案进行详细介绍。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一
请参见图1,为本发明实施例提供的一种界面控制方法的流程示意图,该方法可以应用于基于安卓操作系统的智能终端,该界面控制方法可以包括:
步骤S101、当接收到控制语音时,对当前界面执行截屏操作,得到待识别界面图像。
具体地,当用户输入控制语音时,即Android智能终端接收到语音内容时,可以将该语音内容转化为相应的文字内容;并通过Android截屏接口对当前界面执行截屏操作,得到当前界面的图像,可以将该截屏图像保存为待识别界面图像。
需要说明的是,上述当前界面可以指的是智能终端上已安装应用的应用界面,该应用界面内可以包括若干个控件。
步骤S102、划分待识别界面图像得到每个控件的控件子图像。
可以理解的是,对待识别界面图像进行划分后,可以得到该界面上每个控件的控件子图像,即,每个控件对应一个图像。例如,当待识别界面图像上有5个控件时,划分待识别界面图像后可以得到5个控件子图像,分别对应5个控件。
具体地,可以通过Android图像处理接口,利用控件的宽度、高度等信息,对该待识别界面图像进行宽度和高度处理,以获得每个控件的控件子图像,并可以对所获得的控件子图像进行保存。
步骤S103、遍历所有控件子图像,得到各个控件子图像内的文字信息。
可以理解的是,待识别界面图像中可能有一个控件,也可以能有多个控件,因此,划分所得的控件子图像可能有一个或多个。划分操作后,可以遍历所得的控件子图像,以获得每个控件子图像中的文字信息。
任意一个的控件子图像的处理过程可以具体为:对该控件子图像进行图像灰度化和二值化处理,得到灰度图像,然后可以对该灰度图像分别进行水平投影和垂直投影,以进行字符分割,获取每个字符的信息。
其中,由于目前的应用界面一般是彩色,故控件子图像相应为彩色图像。彩色图像中往往存储有大量的颜色信息,彩色图像较之灰度图像,数据量更大,且这些颜色信息可以能对后续的处理结果起反作用,降低处理效率。因此,通过对图像进行灰度化的目的是为了除去图像中多数无用的色彩信息,改善图像的画面质量。图像二值化可以将图像中感兴趣的目标与图像的背景进行分离,经过二值化处理后的图像,边缘轮廓较清楚,可以突出目标、淡化背景。
在进行图像灰度化和二值化后,可以得到控件子图像的灰度图像。一般情况下,灰度图像包括背景像素点和字符像素点。像素值为255的像素点可以为图像背景,相应地,像素值为0的像素点为字符。而如果某行或某列为背景的话,该行或该列投影后为白色,字符与字符之间存在间隔,因此可以通过字符与字符之间的投影是白色的规律,实现控件图像中的字符与字符之间的分离。
字符分割指的是将控件子图像对应的灰度图像中的多个字符分割成多个单个字符图像,这样可以尽可能地去除字符边缘的背景信息,从而准确地获取到每个字符的信息。字符分割过程中,可以通过水平投影和垂直投影,分别进行行、列字符的分割,最终获得单个字符的信息。
需要说明的是,图像灰度化和二值化的具体技术手段有多种,只要能实现灰度化和二值化即可,在此不作限定。除此之外,还可以进行图像滤波、图像增强等图像预处理操作。
当控件子图像有多个时,可以先将全部控件子图像进行灰度化和二值化处理后,再基于灰度图像进行字符分割,以获取各个控件子图像的文字信息。也可以是一幅一幅图像地处理,即,先对其中任意一个控件子图像进行灰度化、二值化,然后进行字符分割,获取该控件子图像的文字信息,然后再对下一幅控件子图像进行相应处理,依此循环。
需要说明的是,上述每个字符的信息可以包括但不限于字符的界面位置信息(例如,开始坐标信息和结束坐标信息)、字符个数、字符次序(例如,该字符是某一行或某一列中第几个字符)以及文字内容信息等。
步骤S104、将控制语音对应的文字信息与各控件的控件文字信息进行匹配,判断是否一致。
具体地,遍历各个控件子图像,获取到各控件子图像的文字信息之后,可以根据所获取到的控件文字信息,判断当前待识别界面图像中是否有与控制语音对应的文字信息所对应的文字信息。例如,控制语音对应的文字信息为“AAAB”,每个英文单词具体表示一个汉字,将“AAAB”与所获得的各个控件的文字信息进行匹配,以判断当前应用界面上是否有相应的控件,如果有,则可以通过发送模拟按键指令,对该控件进行模拟控制。
在获得各个控件子图像的文字信息后,可以建立一个界面文字信息列表,用于存储所获取的控件文字信息,这样,则可以将语音对应的文字信息与该界面文字信息列表中的每一个控件子图像的文字信息进行比对,判断是否一致,以确定当前应用界面上是否有与语音控制对应的控件。
步骤S105、当控制语音对应的文字信息与控件的控件文字信息一致,向控件发送模拟按键控制指令,以对控件进行模拟控制。
其中,智能终端根据用户的控制语音,对相应的控件进行模拟点击,不用人实际接触智能终端界面,通过语音实现对界面的控制。具体地,通过获取应用界面上各个控件子图像中包含的文字信息,以根据此对界面进行控制,解决了现有技术中界面控件包含图片,且图片中包含文字信息的场景下不能对界面进行控制的问题。
本实施例在控制语音输入时,截取当前界面图像得到待识别截面图像,然后划分待识别界面图像,得到每个控件的控件子图像,再通过遍历各个控件子图像获取各个控件子图像上的文字信息,根据控件文字信息和控制语音对应的文字信息,发送相应的模拟按键控制指令,以在界面上的控件包含图片且图片内有文字的场景下,实现对界面控件的控制。
实施例二
请参见图2,为本发明实施例提供的界面控制方法的另一种流程示意框图,该方法可以包括以下步骤:
步骤S201、当接收到控制语音时,对当前界面执行截屏操作,得到待识别界面图像。
步骤S202、获取当前界面包信息,根据当前界面包信息,从预建立的控件数据库获取当前界面各控件的控件属性信息。
需要说明的是,上述当前界面可以指的是智能终端上已安装应用的应用界面,该应用界面内可以包括若干个控件。上述当前界面包信息可以包括但不限于当前界面包名称,该当前界面包信息可以预先通过解析应用程序文件得到的。
上述控件数据库可以包括但不限于应用包名、应用界面包名、应用界面对应的布局文件名称、应用界面对应的布局文件中的控件名称、控件坐标、控件属性信息等。控件数据库中的信息可以具体通过利用反汇编工具对应用文件进行反汇编,并对应用文件进行解析后得到的。其中,上述布局文件指的是Android系统中的包括每一个应用界面内所需展示的元素的文件,即,应用的每一个界面对应由一个布局文件,每一个界面内展示的元素都位于对应的布局文件中,而布局文件中的元素对应布局文件中的控件。通过解析应用文件,可以获得各个应用的应用界面的控件的相关信息。
上述控件属性信息可以包括但不限于控件的宽度信息和高度信息,当然,还可以包括控件的界面坐标信息。
步骤S203、根据控件属性信息,通过划分待识别界面图像得到每个控件的控件子图像。
步骤S204、遍历所有所述控件子图像,得到各个所述控件子图像内的文字信息。
在一实施例中,遍历所有待识别界面图像中所有控件子图像;对所遍历到的任意一个控件子图像执行以下步骤:将控件子图像作为当前控件子图像;对当前控件子图像进行灰度化和二值化处理,得到当前控件子图像的灰度图像;分别对灰度图像进行水平投影和垂直投影,对灰度图像进行字符分割,并获取分割后单个字符的信息,获得当前控件子图像的文字信息。
遍历所有控件子图像,对每个控件子图像进行灰度化和二值化处理后,并对处理后的控件子图像进行字符分割,获取分割后每个字符的信息,得到各个控件子图像内的文字信息。
步骤S205、将控制语音对应的文字信息与各控件的控件文字信息进行匹配,判断是否一致。
步骤S206、当控制语音对应的文字信息与控件文字信息一致,从预建立控件数据库获取控件文字信息对应的控件的界面位置信息,根据界面位置信息,向控件发送模拟按键控制指令,以对控件进行模拟控制。
需要说明的是,上述界面位置信息指的是目标控件在当前界面上的坐标信息。通过该目标控件的界面位置信息,向该界面位置发送touch指令、click指令或者是其它控制指令,以对该控件位置进行模拟点击,以进行界面控制。
本实施例在控制语音输入时,截取当前界面图像得到待识别截面图像,然后划分待识别界面图像,得到每个控件的控件子图像,再通过遍历各个控件子图像获取各个控件子图像上的文字信息,根据控件文字信息和控制语音对应的文字信息,发送相应的模拟按键控制指令,以在界面上的控件包含图片且图片内有文字的场景下,实现对界面控件的控制。
实施例三
本实施例将对控件子图像的文字信息获取过程进行介绍说明。
请参见图3,为本发明实施例提供的控件子图像的文字信息获取过程的具体流程示意图。具体过程可以包括以下步骤:
步骤S301、获取任意一个控件子图像,将控件子图像作为当前控件子图像。
步骤S302、对当前控件子图像进行灰度化和二值化处理,得到当前控件子图像的灰度图像。
本实施例中,图像灰度化可以采用加权平均值法进行灰度化处理。具体地,赋予R分量、G分量、B分量不同的权值WR、WG、WB,再计算加权平均值根据加权平均值进行灰度化处理。其中,权值WR、WG、WB可以根据实际应用场景进行设定,在此不作限定。通过图像灰度化,可以减少数据处理量,更适合Android移动终端资源、处理能力有限的特点。
图像二值化过程中,可以设定一个像素阈值,当某个像素点大于该阈值时,该像素点的灰度值为255,反之,当某个像素点的灰度值小于该阈值时,该形式点的灰度值则为0。其中,该像素阈值可以根据实际应用场景进行设定,在此不作限定。
步骤S303、分别对灰度图像进行水平投影和垂直投影,对灰度图像进行字符分割,并获取分割后单个字符的信息,获得当前控件子图像的文字信息。
步骤S304、判断是否遍历完待识别界面图像中所有控件子图像。如果没有遍历完待识别界面图像中所有控件子图像,返回获取任意一个控件子图像,将控件子图像作为当前控件子图像的步骤,即,返回上述步骤S201。
步骤S305、如果已遍历完待识别界面图像中所有控件子图像,执行将控制语音对应的文字信息与各控件的控件文字信息进行匹配,判断是否一致的步骤,即进入上述实施例一的步骤S105。
字符分割可以将控件子图像中的多个字符分割成多个单字符图像,这样可以可能地去除字符边缘的背景信息。具体可以采用基于投影法进行字符分割。投影法指的是数字图像在某一个方向上进行像素累加。由于二值化后的字符图像在水平方向上的像素分布图中行与行之间有较大的空隙,以此可以作为行切分的标准,行切分之后可以利用垂直投影法进行字切分。
通过字符分割可以将多个字符分割成单个字符,而在字符分割过程中,可以先列分割,再行分割,此时,可以先进行垂直投影,在进行水平投影;也可以先行分割,再列分割,此时,可以先进行水平投影,再进行垂直投影。当然,也可以并行执行。
水平投影后,进行第一次切分,确定控件子图像中的字符行数,然后进行垂直投影即第二次切分,第二次切分是对第一次切分结果进行切分,即对每一行进行字符分割,以获取到该行的每一个字符。
在本发明的一些实施例中,可以先水平投影,再垂直投影。参见图4示出的上述步骤S303的具体流程示意图,上述步骤S303,即,上述分别对灰度图像进行水平投影和垂直投影,对灰度图像进行字符分割,并获取分割后单个字符的信息,获得当前控件子图像的文字信息的具体过程可以包括以下步骤:
步骤S401、将灰度图像进行水平投影,统计投影后的图像的每一行的像素点的灰度值之和。
具体应用中,可以将所统计的各行的灰度值之和存储在一个数组中。
步骤S402、依次判断各行的像素点的灰度值之和与第一预设阈值间的大小。
步骤S403、将行参数加一后,判断行参数是否大于控件子图像宽度参数;若行参数大于等于控件子图像宽度参数,进入步骤S410;若行参数小于控件子图像宽度参数,进入步骤S404。
步骤S404、判断当前行的像素点的灰度值之和是否小于第一预设阈值;若当前行的像素点的灰度值之和小于等于第一预设阈值,表明当前行为背景区域,进入步骤S405;若当前行的像素点的灰度值之和大于第一预设阈值,表明当前行为字符区域,进入步骤S408。
步骤S405、判断当前行的字符区域的开始位置参数是否等于零;若开始位置参数等于零,表明当前行不是字符区域,返回上述步骤S403;若开始位置参数不等于零,进入步骤S406。
步骤S406、当前行为背景区域和字符区域的分界处,判断当前行的字符区域的开始位置参数是否等于结束位置参数;若当前若开始位置参数不等于结束位置参数,进入步骤S407;若开始位置参数等于结束位置参数,进入步骤S410;
步骤S407、更新行参数和开始位置参数,返回步骤S303,直到遍历完所有的行为止。
步骤S408、判断开始位置参数是否为零;若开始位置参数为零,进入步骤S409,若开始位置参数不为零,表明当前行还在字符区域内,则返回上述步骤S403
步骤S409、当前行为字符区域的开始位置,则将开始位置参数的值赋给行参数后,返回上述步骤S403。
步骤S410、将灰度图像水平投影后的每一行进行垂直投影,统计每一列的像素点的灰度值之和,并分割每列的字符,获取每个字符的信息,获取当前控件子图像的文字信息。
在进行水平投影之后,再对水平投影后的每一行进行垂直投影,再进行字符分割,以获取到每个字符的相关信息。
进一步地,参见图5示出的步骤S410的具体流程示意图,上述步骤S410,即,上述将灰度图像水平投影后的每一行进行垂直投影,统计每一列的像素点的灰度值之和,并分割每列的字符,获取每个字符的信息,获取当前控件子图像的文字信息的具体过程可以包括:
步骤S501、将灰度图像水平投影后的每一行进行垂直投影,统计每一列的像素点的灰度值之和。
步骤S502、依次判断各列的像素点的灰度值之和与第二预设阈值间的大小。
步骤S503、将列参数加一后,判断列参数是否大于控件子图像宽度参数。若列参数大于等于控件子图像宽度参数,则退出循环;若列参数小于控件子图像宽度参数,进入步骤S504。
步骤S504、判断当前列的像素点的灰度值之和是否大于第二预设阈值,若当前列的像素点的灰度值之和小于等于第二预设阈值,表明此列为背景区域,进入步骤S505。若当前列的像素点的灰度值之和大于第二预设阈值,表明此列为字符区域,进入步骤S508。
步骤S505、判断当前列的字符区域的开始位置参数是否等于零;若当前列的字符区域的开始位置参数为零,表明此列不是字符区域,则返回上述步骤S503;若当前列的字符区域的开始位置参数不为零,表明此列为背景与字符区域的分界处,进入步骤S506。
步骤S506、判断当前列的字符区域的开始位置参数是否等于结束位置参数。若当前列的开始位置参数不等于结束位置参数,进入步骤S507;若当前列的开始位置参数等于结束位置参数,退出循环。
步骤S507、记录字符以及字符的界面坐标信息(开始坐标和结束坐标),并更新当前列的开始位置参数和列参数,返回步骤S503,直到遍历完该行的所有列。
步骤S508、判断当前列的开始位置参数是否为零。若当前列的开始位置参数为零,则当前列为字符区域的开始位置,进入步骤S509;若开始位置参数不为零,则返回上述步骤S503。
步骤S509、将开始位置参数的值赋给列参数后,返回上述步骤S503。
至此,获取到控件子图像的文字内容信息、界面坐标信息等相关信息。依此可以获得各个控件子图像的文字内容信息,然后可以将所获得的控件文字信息存储在界面文字列表中。
需要说明的是,上述第一预设阈值和第二预设阈值可以根据实际应用需求进行设定,在此不作限定。
其中,开始位置参数指的是单行或单列字符区域的开始位置,结束位置参数指的是单行或单列字符区域的结束位置。
本实施例中,通过水平投影和垂直投影,获得控件子图像的文字信息,以便于后续实现获取界面控件包含图片,且图片中包含文字内容的场景下的界面控制。
实施例三
请参见图6,为本发明实施例提供的一种界面控制方法的另一种流程示意图,该方法可以包括以下步骤:
步骤S601、调用应用程序管理服务,获取智能终端上已安装应用的应用程序文件。
步骤S602、通过反汇编工具对应用程序文件进行反汇编,得到应用程序资源文件。
步骤S603、解析各个应用程序资源文件,获得每一个应用程序的应用信息;其中,应用信息包括应用包名、应用界面包包名以及应用界面的控件信息。
步骤S604、根据应用信息,建立控件数据库。
需要说明的是,上述应用程序管理服务为Android系统中的一个服务,该服务负责扫描系统中特定的目录,获取到应用程序文件,即,获取以apk为后缀名的文件;然后解析应用程序文件,得到应用程序的相关信息。
具体地,可以利用反汇编共建apktool反汇编apk文件得到应用程序的smali代码、图片、XML配置文件等资源文件,反汇编中,还可以得到R.class文件;解析这些应用资源文件,可以得到应用的每一个界面以及每一个界面加载的布局文件;从应用程序的布局文件中可以获得应用包名、应用界面包名、应用界面对应的布局名称、应用界面对应的控件名称、控件坐标、控件属性等应用信息。然后根据这些应用信息,建立控件数据库。
步骤S605、在当接收到控制语音时,获取当前界面包信息,并对当前界面执行截屏操作,得到待识别界面图像。
步骤S606、根据当前界面包信息,从预建立的控件数据库获取当前界面各控件的控件属性信息。
步骤S607、根据控件属性信息,通过划分待识别界面图像得到每个控件的控件子图像。
可选地,在一实施例中,本步骤可以例如为:根据待识别界面图像上的控件的宽度信息和高度信息,通过划分待识别界面图像,得到每个控件的控件子图像。
步骤S608、遍历所有控件子图像,对每个控件子图像进行灰度化和二值化处理后,并对处理后的控件子图像进行字符分割,获取分割后每个字符的信息,得到各个控件子图像内的文字信息。
步骤S609、将控制语音对应的文字信息与各控件的控件文字信息进行匹配,判断是否一致。
步骤S610、当控制语音对应的文字信息与控件文字信息一致,从控件数据库获取控件文字信息对应的目标控件的界面位置信息,根据界面位置信息,向目标控件发送模拟按键控制指令,以对目标控件进行模拟控制。
可以理解的是,步骤S605~S610与实施例一中的步骤S201~S206相同,具体请参见上文相应内容,在此不再赘述。
具体应用中,用户可能会安装新应用,或者是卸载应用。为了保证控件数据库中的数据准确性,可以在安装或卸载应用时,相应地更新控件数据库。
在本发明的一些实施例中,参见图7示出的一种界面控制方法的又一流程示意图,上述界面控制方法还可以包括:
步骤S701、通过监听器实时监听智能终端是否有新应用安装操作或者应用卸载操作。该监听器是为了实现监听功能新增加的。
步骤S702、当监听到有新应用安装操作,在新应用安装过程中调用应用程序管理服务对新应用进行解析,获得新应用的应用信息,并将新应用的应用信息存储在控件数据库。
步骤S703、当监听到有应用卸载操作时,在应用卸载过程中调用应用程序管理服务对卸载应用进行解析,获得卸载应用的应用信息,并根据卸载应用的应用信息,从控件数据库删除卸载应用的应用信息。
为了更好地介绍本发明实施例提供的技术方案,下面将结合图7示出的应用界面示意图进行举例介绍说明。
以智能电视为例,图8所示的应用界面包括12个控件,对截屏得到的应用界面图像进行灰度化、二值化处理,划分成12个控件子图像,分别为,图片1、图片2、图片3、图片4、图片5、图片6、图片7、文字1、文字2、文字3、文字4、文字5。图片里包含着文字信息。其中,假设图片1中包含“动作电影”的文字信息。对图片1进行字符分割,获取到单个字符“动”、“作”、“电”、“影”四个字符,以获取到字符文字信息以及坐标信息等其它信息;然后即可获得图片1的控件内的文字信息为“动作电影”。如果用户输入的语音所对应的文字信息也是“动作电影”的,则可以向图片1对应的界面控件发送模拟控制指令,以对该界面控件进行模拟控制操作,实现界面控制。
本实施例中,在控制语音输入时,截取当前界面图像得到待识别截面图像,然后划分待识别界面图像,得到每个控件的控件子图像,再通过字符分割获取各个控件子图像上的文字信息,根据控件文字信息和控制语音对应的文字信息,发送相应的模拟按键控制指令,以在界面上的控件包含图片且图片内有文字的场景下,实现对界面控件的控制。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例四
请参见图9,为本发明实施例提供的一种界面控制装置的结构示意框图,该装置可以包括:
截屏模块91,用于当接收到控制语音时,对当前界面执行截屏操作,得到待识别界面图像;
划分模块92,用于划分待识别界面图像得到每个控件的控件子图像;
遍历模块93,用于遍历所有控件子图像,得到各个控件子图像内的文字信息;
匹配模块94,用于将控制语音对应的文字信息与各控件的控件文字信息进行匹配,判断是否一致;
模拟控制模块95,用于当控制语音对应的文字信息与控件的控件文字信息一致,向控件发送模拟按键控制指令,以对控件进行模拟控制。
在本发明的一些实施例中,遍历模块包括:
遍历单元,用于遍历所有待识别界面图像中所有控件子图像;对所遍历到的任意一个控件子图像执行以下步骤:
将控件子图像作为当前控件子图像;
对当前控件子图像进行灰度化和二值化处理,得到当前控件子图像的灰度图像;
分别对灰度图像进行水平投影和垂直投影,对灰度图像进行字符分割,并获取分割后单个字符的信息,获得当前控件子图像的文字信息。
可选地,模拟控制模块包括:
第一获取单元,用于从预建立的控件数据库获取与所述控件文字信息对应的所述控件的界面位置信息;
发送单元,用于根据所述界面位置信息,向所述控件发送模拟按键控制指令,以对所述进行模拟控制。
在本发明的一些实施例中,划分模块包括:
第二获取单元,用于获取当前界面包信息;
第三获取单元,用于根据所述当前界面包信息,从预建立的控件数据库获取当前界面各控件的控件属性信息;
划分单元,用于根据所述控件属性信息,通过划分所述待识别界面图像得到每个所述控件的控件子图像。
在本发明的一些实施例中,上述装置还可以包括:
调用模块,用于调用应用程序管理服务,获取智能终端上已安装应用的应用程序文件;
反汇编模块,用于通过反汇编工具对应用程序文件进行反汇编,得到应用程序资源文件;
解析模块,用于解析各个应用程序资源文件,获得每一个应用程序的应用信息;其中,应用信息包括应用包名、应用界面包包名以及应用界面的控件信息;
建立模块,用于根据应用信息,建立控件数据库。
在本发明的一些实施例中,上述装置还可以包括:
监听模块,用于通过监听器实时监听智能终端是否有新应用安装操作或者应用卸载操作;
第一更新模块,用于当监听到有新应用安装操作,在新应用安装过程中调用应用程序管理服务对新应用进行解析,获得新应用的应用信息,并将新应用的应用信息存储在控件数据库;
第二更新模块,用于当监听到有应用卸载操作时,在应用卸载过程中调用应用程序管理服务对卸载应用进行解析,获得卸载应用的应用信息,并根据卸载应用的应用信息,从控件数据库删除卸载应用的应用信息。
本实施例在控制语音输入时,截取当前界面图像得到待识别截面图像,然后划分待识别界面图像,得到每个控件的控件子图像,再通过遍历各个控件子图像获取各个控件子图像上的文字信息,根据控件文字信息和控制语音对应的文字信息,发送相应的模拟按键控制指令,以在界面上的控件包含图片且图片内有文字的场景下,实现对界面控件的控制。
实施例五
图10是本发明一实施例提供的智能终端的示意图。如图10所示,该实施例的智能终端10包括:处理器100、存储器101以及存储在所述存储器101中并可在所述处理器100上运行的计算机程序102。所述处理器100执行所述计算机程序102时实现上述各个界面控制方法实施例中的步骤,例如图1所示的步骤S101至S105。或者,所述处理器100执行所述计算机程序102时实现上述各装置实施例中各模块或单元的功能,例如图9所示模块91至96的功能。
示例性的,所述计算机程序102可以被分割成一个或多个模块或单元,所述一个或者多个模块或单元被存储在所述存储器101中,并由所述处理器100执行,以完成本发明。所述一个或多个模块或单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序102在所述智能终端10中的执行过程。例如,所述计算机程序102可以被分割成截屏模块、划分模块、遍历模块、匹配模块、模拟控制模块,各模块具体功能如下:
截屏模块,用于当接收到控制语音时,对当前界面执行截屏操作,得到待识别界面图像;划分模块,用于划分待识别界面图像得到每个控件的控件子图像;遍历模块,用于遍历所有控件子图像,得到各个控件子图像内的文字信息;匹配模块,用于将控制语音对应的文字信息与各控件的控件文字信息进行匹配,判断是否一致;模拟控制模块,用于当控制语音对应的文字信息与控件的控件文字信息一致,向控件发送模拟按键控制指令,以对控件进行模拟控制。
所述智能终端10可以是智能手机、平板电脑、智能电视等设备。所述智能终端可包括,但不仅限于,处理器100、存储器101。本领域技术人员可以理解,图10仅仅是智能终端10的示例,并不构成对智能终端10的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述智能终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器100可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器101可以是所述智能终端10的内部存储单元,例如智能终端10的硬盘或内存。所述存储器101也可以是所述智能终端10的外部存储设备,例如所述智能终端10上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器101还可以既包括所述智能终端10的内部存储单元也包括外部存储设备。所述存储器101用于存储所述计算机程序以及所述智能终端所需的其他程序和数据。所述存储器101还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置、终端和方法,可以通过其它的方式实现。例如,以上所描述的装置、终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块或单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种界面控制方法,其特征在于,包括:
当接收到控制语音时,对当前界面执行截屏操作,得到待识别界面图像;
根据预先建立的控件数据库,划分所述待识别界面图像得到每个控件的控件子图像;
遍历所有所述控件子图像,得到各个所述控件子图像内的控件文字信息,所述控件子图像内包含文字信息;
将所述控制语音对应的文字信息与各所述控件的控件文字信息进行匹配,判断是否一致;
当所述控制语音对应的文字信息与目标控件的控件文字信息一致,根据所述控件数据库,向所述目标控件发送模拟按键控制指令,以对所述目标控件进行模拟控制;
其中,所述方法还包括:
通过监听器实时监听智能终端是否有新应用安装操作或者应用卸载操作;
当监听到有新应用安装操作,在新应用安装过程中调用应用程序管理服务对所述新应用进行解析,获得所述新应用的应用信息,并将所述新应用的应用信息存储在所述控件数据库;
当监听到有应用卸载操作时,在应用卸载过程中调用所述应用程序管理服务对卸载应用进行解析,获得所述卸载应用的应用信息,并根据所述卸载应用的应用信息,从所述控件数据库删除所述卸载应用的应用信息。
2.如权利要求1所述的方法,其特征在于,所述遍历所有所述控件子图像,得到各个所述控件子图像内的控件文字信息,包括:
遍历所有所述待识别界面图像中所有控件子图像;对所遍历到的任意一个所述控件子图像执行以下步骤:
将所述控件子图像作为当前控件子图像;
对所述当前控件子图像进行灰度化和二值化处理,得到所述当前控件子图像的灰度图像;
分别对所述灰度图像进行水平投影和垂直投影,对所述灰度图像进行字符分割,并获取分割后单个字符的信息,获得所述当前控件子图像内的控件文字信息。
3.如权利要求1所述的方法,其特征在于,所述根据所述控件数据库,向所述目标控件发送模拟按键控制指令,以对所述目标控件进行模拟控制,包括:
从所述控件数据库获取与所述目标控件的控件文字信息对应的所述控件的界面位置信息;
根据所述界面位置信息,向所述目标控件发送模拟按键控制指令,以对所述目标控件进行模拟控制。
4.如权利要求1所述的方法,其特征在于,所述根据预先建立的控件数据库,划分所述待识别界面图像得到每个控件的控件子图像,包括:
获取当前界面包信息;
根据所述当前界面包信息,从所述控件数据库获取当前界面各控件的控件属性信息;
根据所述控件属性信息,通过划分所述待识别界面图像得到每个所述控件的控件子图像。
5.如权利要求1至4任一项所述的方法,其特征在于,在所述当接收到控制语音时,对当前界面执行截屏操作,得到待识别界面图像之前,还包括:
调用应用程序管理服务,获取智能终端上已安装应用的应用程序文件;
通过反汇编工具对所述应用程序文件进行反汇编,得到应用程序资源文件;
解析各个所述应用程序资源文件,获得每一个应用程序的应用信息;其中,所述应用信息包括应用包名、应用界面包包名以及应用界面的控件信息;
根据所述应用信息,建立所述控件数据库。
6.一种界面控制装置,其特征在于,包括:
截屏模块,用于当接收到控制语音时,对当前界面执行截屏操作,得到待识别界面图像;
划分模块,用于根据预先建立的控件数据库,划分所述待识别界面图像得到每个控件的控件子图像;
遍历模块,用于遍历所有所述控件子图像,得到各个所述控件子图像内的控件文字信息,所述控件子图像内包含文字信息;
匹配模块,用于将所述控制语音对应的文字信息与各所述控件的控件文字信息进行匹配,判断是否一致;
模拟控制模块,用于当所述控制语音对应的文字信息与目标控件的控件文字信息一致,根据所述控件数据库,向所述目标控件发送模拟按键控制指令,以对所述目标控件进行模拟控制;
其中,所述装置还包括:
监听模块,用于通过监听器实时监听智能终端是否有新应用安装操作或者应用卸载操作;
第一更新模块,用于当监听到有新应用安装操作,在新应用安装过程中调用应用程序管理服务对所述新应用进行解析,获得所述新应用的应用信息,并将所述新应用的应用信息存储在所述控件数据库;
第二更新模块,用于当监听到有应用卸载操作时,在应用卸载过程中调用所述应用程序管理服务对卸载应用进行解析,获得所述卸载应用的应用信息,并根据所述卸载应用的应用信息,从所述控件数据库删除所述卸载应用的应用信息。
7.如权利要求6所述的装置,其特征在于,所述遍历模块包括:
遍历单元,用于遍历所有所述待识别界面图像中所有控件子图像;对所遍历到的任意一个所述控件子图像执行以下步骤:
将所述控件子图像作为当前控件子图像;
对所述当前控件子图像进行灰度化和二值化处理,得到所述当前控件子图像的灰度图像;
分别对所述灰度图像进行水平投影和垂直投影,对所述灰度图像进行字符分割,并获取分割后单个字符的信息,获得所述当前控件子图像内的控件文字信息。
8.如权利要求6所述的装置,其特征在于,所述模拟控制模块包括:
第一获取单元,用于从所述控件数据库获取与所述目标控件的控件文字信息对应的所述控件的界面位置信息;
发送单元,用于根据所述界面位置信息,向所述目标控件发送模拟按键控制指令,以对所述目标控件进行模拟控制。
9.一种智能终端,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811150626.5A CN110968375B (zh) | 2018-09-29 | 2018-09-29 | 界面控制方法、装置、智能终端及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811150626.5A CN110968375B (zh) | 2018-09-29 | 2018-09-29 | 界面控制方法、装置、智能终端及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110968375A CN110968375A (zh) | 2020-04-07 |
CN110968375B true CN110968375B (zh) | 2023-01-31 |
Family
ID=70028034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811150626.5A Active CN110968375B (zh) | 2018-09-29 | 2018-09-29 | 界面控制方法、装置、智能终端及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110968375B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113741769A (zh) * | 2020-05-29 | 2021-12-03 | 比亚迪股份有限公司 | 基于图像识别的控制方法和系统及车辆、存储介质 |
CN111772641B (zh) * | 2020-07-03 | 2022-12-16 | 佛山博智医疗科技有限公司 | 一种言语测听装置及测听方法 |
CN112988185A (zh) * | 2021-02-09 | 2021-06-18 | 北京爱奇艺科技有限公司 | 云应用更新方法、装置、系统、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014106986A1 (en) * | 2013-01-07 | 2014-07-10 | Samsung Electronics Co., Ltd. | Electronic apparatus controlled by a user's voice and control method thereof |
CN104599669A (zh) * | 2014-12-31 | 2015-05-06 | 乐视致新电子科技(天津)有限公司 | 一种语音控制方法和装置 |
CN106446889A (zh) * | 2015-08-10 | 2017-02-22 | Tcl集团股份有限公司 | 一种台标的本地识别方法和装置 |
CN106604089A (zh) * | 2016-10-25 | 2017-04-26 | 北京小米移动软件有限公司 | 智能电视的截屏分享方法及装置 |
CN108228421A (zh) * | 2017-12-26 | 2018-06-29 | 东软集团股份有限公司 | 数据监测方法、装置、计算机及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107948698A (zh) * | 2017-12-14 | 2018-04-20 | 深圳市雷鸟信息科技有限公司 | 智能电视的语音控制方法、系统及智能电视 |
-
2018
- 2018-09-29 CN CN201811150626.5A patent/CN110968375B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014106986A1 (en) * | 2013-01-07 | 2014-07-10 | Samsung Electronics Co., Ltd. | Electronic apparatus controlled by a user's voice and control method thereof |
CN104599669A (zh) * | 2014-12-31 | 2015-05-06 | 乐视致新电子科技(天津)有限公司 | 一种语音控制方法和装置 |
CN106446889A (zh) * | 2015-08-10 | 2017-02-22 | Tcl集团股份有限公司 | 一种台标的本地识别方法和装置 |
CN106604089A (zh) * | 2016-10-25 | 2017-04-26 | 北京小米移动软件有限公司 | 智能电视的截屏分享方法及装置 |
CN108228421A (zh) * | 2017-12-26 | 2018-06-29 | 东软集团股份有限公司 | 数据监测方法、装置、计算机及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110968375A (zh) | 2020-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111507958B (zh) | 目标检测方法、检测模型的训练方法及电子设备 | |
CN110968375B (zh) | 界面控制方法、装置、智能终端及计算机可读存储介质 | |
CN111950543A (zh) | 一种目标检测方法和装置 | |
CN110705511A (zh) | 模糊图像的识别方法、装置、设备及存储介质 | |
EP3127086A1 (en) | Method and apparatus for processing a video file | |
CN115272182B (zh) | 车道线检测方法、装置、电子设备和计算机可读介质 | |
CN111783777B (zh) | 图像处理方法、装置、电子设备和计算机可读介质 | |
CN109272526B (zh) | 图像处理方法、系统及电子设备 | |
CN110599520B (zh) | 一种旷场实验数据分析方法、系统及终端设备 | |
CN111428740A (zh) | 网络翻拍照片的检测方法、装置、计算机设备及存储介质 | |
CN113439227A (zh) | 放大图像的捕获和存储 | |
CN111352957A (zh) | 远程字典服务优化方法及相关设备 | |
CN110633383A (zh) | 一种重复房源的识别方法、装置、电子设备及可读介质 | |
CN113658196A (zh) | 红外图像中船舶的检测方法、装置、电子设备和介质 | |
CN113808134B (zh) | 油罐布局信息生成方法、装置、电子设备、介质 | |
CN110874814A (zh) | 一种图像处理方法、图像处理装置及终端设备 | |
CN113807410B (zh) | 图像识别方法、装置以及电子设备 | |
CN114155545A (zh) | 表格识别方法、装置、可读介质及电子设备 | |
CN110796144B (zh) | 车牌检测方法、装置、设备及存储介质 | |
KR20230072787A (ko) | 정렬 보정 정확도가 개선된 이미지 정렬 처리 장치 및 그 동작 방법 | |
CN111784710B (zh) | 图像处理方法、装置、电子设备和介质 | |
CN111626919B (zh) | 图像合成方法、装置、电子设备及计算机可读存储介质 | |
CN113886745B (zh) | 页面图片测试方法、装置及电子设备 | |
CN111918137B (zh) | 一种基于视频特征的推送方法、装置、存储介质及终端 | |
US12020482B2 (en) | Live streaming sampling method and apparatus, and electronic device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 516006 TCL science and technology building, No. 17, Huifeng Third Road, Zhongkai high tech Zone, Huizhou City, Guangdong Province Applicant after: TCL Technology Group Co.,Ltd. Address before: 516006 Guangdong province Huizhou Zhongkai hi tech Development Zone No. nineteen District Applicant before: TCL Corp. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |