CN116304431A - 一种网页自动化方法、装置、计算机设备及存储介质 - Google Patents

一种网页自动化方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN116304431A
CN116304431A CN202310283257.1A CN202310283257A CN116304431A CN 116304431 A CN116304431 A CN 116304431A CN 202310283257 A CN202310283257 A CN 202310283257A CN 116304431 A CN116304431 A CN 116304431A
Authority
CN
China
Prior art keywords
browser
plug
page element
json
target browser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310283257.1A
Other languages
English (en)
Inventor
张宇阳
韦方宇
魏筱峰
柯家健
幸勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yuanguang Software Co Ltd
Original Assignee
Yuanguang Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yuanguang Software Co Ltd filed Critical Yuanguang Software Co Ltd
Priority to CN202310283257.1A priority Critical patent/CN116304431A/zh
Publication of CN116304431A publication Critical patent/CN116304431A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请实施例属于数据处理领域,涉及网页自动化方法、装置、计算机设备及存储介质,该方法包括:通过WebDriver启动目标浏览器;启动与目标浏览器相对应的目标浏览器插件;根据目标浏览器插件获取与目标浏览器相对应的页面元素定位内容;判断页面元素定位内容是否属于json数组且json数组的数量大于1;若页面元素定位内容属于json数组且json数组的数量大于1,则根据目标浏览器插件对页面元素定位内容进行网页自动化操作;若页面元素定位内容不属于json数组或者属于json数组但json数组的数量等于1,则根据WebDriver对页面元素定位内容进行网页自动化操作。本申请不仅能使用webDriver复杂的xpath,cssSelector匹配语法;还能使用插件防爬虫等能力,另外,调用浏览器原生接口,有效提高执行效率。

Description

一种网页自动化方法、装置、计算机设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种网页自动化方法、装置、计算机设备及存储介质。
背景技术
随着互联网技术的迅猛发展,互联网产品呈指数级增长,其中网页(web)应用产品增长尤为快速,在产品快速迭代增长的同时,web产品质量的保障日益重要。在web应用快速迭代的过程中,为了保障质量,要求测试回归的工作量日益增长,因此急需web的自动化测试替代手工测试,从而大大提升测试效率。
针对组件设计应用实现的网页自动化功能,目前存在一种基于webDriver的实现方法,然而,申请人发现,webDriver的技术门槛较高,对初级开发者并不友善,同时,有些网页是进行了防爬虫处理,导致这些网页无法正常兼容webDriver技术,由此可见,传统基于webDriver的网页自动化方法存在兼容性较低的问题。
发明内容
本申请实施例的目的在于提出一种网页自动化方法、装置、计算机设备及存储介质,以解决传统基于webDriver的网页自动化方法存在兼容性较低的问题。
为了解决上述技术问题,本申请实施例提供一种网页自动化方法,采用了如下所述的技术方案:
通过WebDriver启动目标浏览器;
启动与所述目标浏览器相对应的目标浏览器插件;
根据所述目标浏览器插件获取与所述目标浏览器相对应的页面元素定位内容;
判断所述页面元素定位内容是否属于json数组且所述json数组的数量大于1;
若所述页面元素定位内容属于json数组且所述json数组的数量大于1,则根据所述目标浏览器插件对所述页面元素定位内容进行网页自动化操作;
若所述页面元素定位内容不属于所述json数组或者属于所述json数组但所述json数组的数量等于1,则根据所述WebDriver对所述页面元素定位内容进行网页自动化操作。
进一步的,所述目标浏览器可以为谷歌浏览器或者搜狗浏览器,所述启动与所述目标浏览器相对应的目标浏览器插件的步骤,具体包括下述步骤:
若所述目标浏览器为所述谷歌浏览器,则启动谷歌浏览器插件,其中,所述谷歌浏览器插件的通信机制为nativeMessage;
若所述目标浏览器为所述搜狗浏览器,则启动搜狗浏览器插件,其中,所述搜狗浏览器插件的通信机制为websocket。
进一步的,所述根据所述目标浏览器插件获取与所述目标浏览器相对应的页面元素定位内容的步骤,具体包括下述步骤:
当用户在组件设计应用中激活选择器时,获取所述目标浏览器中鼠标的定位信息;
将所述定位信息发送至所述目标浏览器插件的浏览器前后台;
接收所述浏览器前后台发送的元素内容信息,得到所述页面元素定位内容。
进一步的,在所述根据所述目标浏览器插件获取与所述目标浏览器相对应的页面元素定位内容的步骤之后,还包括下述步骤:
若所述页面元素定位内容的json数据异常,则根据所述WebDriver对所述页面元素定位内容进行网页自动化操作。
为了解决上述技术问题,本申请实施例还提供一种网页自动化装置,采用了如下所述的技术方案:
浏览器启动模块,用于通过WebDriver启动目标浏览器;
插件启动模块,用于启动与所述目标浏览器相对应的目标浏览器插件;
定位内容获取模块,用于根据所述目标浏览器插件获取与所述目标浏览器相对应的页面元素定位内容;
Json数组判断模块,用于判断所述页面元素定位内容是否属于json数组且所述json数组的数量大于1;
第一自动化操作模块,用于若所述页面元素定位内容属于json数组且所述json数组的数量大于1,则根据所述目标浏览器插件对所述页面元素定位内容进行网页自动化操作;
第二自动化操作模块,用于若所述页面元素定位内容不属于所述json数组或者属于所述json数组但所述json数组的数量等于1,则根据所述WebDriver对所述页面元素定位内容进行网页自动化操作。
进一步的,所述目标浏览器可以为谷歌浏览器或者搜狗浏览器,所述插件启动模块包括:
第一插件启动子模块,用于若所述目标浏览器为所述谷歌浏览器,则启动谷歌浏览器插件,其中,所述谷歌浏览器插件的通信机制为nativeMessage;
第二插件启动子模块,用于若所述目标浏览器为所述搜狗浏览器,则启动搜狗浏览器插件,其中,所述搜狗浏览器插件的通信机制为websocket。
进一步的,所述定位内容获取模块包括:
定位信息获取子模块,用于当用户在组件设计应用中激活选择器时,获取所述目标浏览器中鼠标的定位信息;
定位信息发送子模块,用于将所述定位信息发送至所述目标浏览器插件的浏览器前后台;
定位内容获取子模块,用于接收所述浏览器前后台发送的元素内容信息,得到所述页面元素定位内容。
进一步的,所述装置还包括:
数据异常模块,用于若所述页面元素定位内容的json数据异常,则根据所述WebDriver对所述页面元素定位内容进行网页自动化操作。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的网页自动化方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的网页自动化方法的步骤。
本申请提供了一种网页自动化方法,包括:通过WebDriver启动目标浏览器;启动与所述目标浏览器相对应的目标浏览器插件;根据所述目标浏览器插件获取与所述目标浏览器相对应的页面元素定位内容;判断所述页面元素定位内容是否属于json数组且所述json数组的数量大于1;若所述页面元素定位内容属于json数组且所述json数组的数量大于1,则根据所述目标浏览器插件对所述页面元素定位内容进行网页自动化操作;若所述页面元素定位内容不属于所述json数组或者属于所述json数组但所述json数组的数量等于1,则根据所述WebDriver对所述页面元素定位内容进行网页自动化操作。与现有技术相比,本申请使用浏览器插件和webDriver方式相结合来实现RPA,除了能使用webDriver的能力,如复杂的xpath,cssSelector匹配语法;还能使用插件的能力,如防爬虫等能力,另外,调用浏览器原生接口,有效提高执行效率。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是本申请实施例一提供的网页自动化方法的实现流程图;
图3是图2中步骤S202的一种具体实施方式的流程图;
图4是图2中步骤S203的一种具体实施方式的流程图;
图5是图2中步骤S203之后的一种具体实施方式的流程图;
图6是本申请实施例二提供的网页自动化装置的结构示意图;
图7是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的网页自动化方法一般由服务器/终端设备执行,相应地,网页自动化装置一般设置于服务器/终端设备中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
实施例一
继续参考图2,示出了本申请实施例一提供的网页自动化方法的实现流程图,为了便于说明,仅示出与本申请相关的部分。
上述的网页自动化方法,包括:步骤S201、步骤S202、步骤S203、步骤S204、步骤S205以及步骤S206。
在步骤S201中,通过WebDriver启动目标浏览器。
在步骤S202中,启动与目标浏览器相对应的目标浏览器插件。
在步骤S203中,根据目标浏览器插件获取与目标浏览器相对应的页面元素定位内容。
在本申请实施例中,获取页面元素定位内容还可以是预先缓存webDriver对象,并生成唯一标识sessionId,当后续接收到请求后,只要带上相同的sessionId,则会从缓存中获取webDriver对象,从而使用。
在步骤S204中,判断页面元素定位内容是否属于json数组且json数组的数量大于1。
在步骤S205中,若页面元素定位内容属于json数组且json数组的数量大于1,则根据目标浏览器插件对页面元素定位内容进行网页自动化操作。
在本申请实施例中,使用浏览器插件的方式,会通过本地通信应用,作业务的解析和数据组装,发送到浏览器的插件,调用浏览器的原生api,实现操作页面元素。
在步骤S206中,若页面元素定位内容不属于json数组或者属于json数组但json数组的数量等于1,则根据WebDriver对页面元素定位内容进行网页自动化操作。
在本申请实施例中,使用webDriver方式,会使用xpath作为定位标识,实现操作页面元素。
在本申请实施例中,根据选择器选择元素后生成的内容,先匹配是否属于json数组,如果是json数组,且数量大于1,代表是有iframe结构,则会使用插件的方式,否则使用webDriver的方式。
在本实施例的一些可选的实现方式中,也可以在每个组件的executeType参数明确指定运行模式。
在本实施例的一些可选的实现方式中,当使用webDriver的方式时,需要进一步解析定位内容属于webDriver的哪种定位模式,如"/","("开头的认为是xpath模式,除此之类,定位内容包含"#",".","[","'","\"","=","",">","+","(",":"),则认为是cssSelector,其他则默认为id,此处可以适配大部分的情况,也可以使用json格式,明确指定定位内容属于webDriver的哪种定位模式。
在本申请实施例中,提供了一种网页自动化方法,包括:通过WebDriver启动目标浏览器;启动与目标浏览器相对应的目标浏览器插件;根据目标浏览器插件获取与目标浏览器相对应的页面元素定位内容;判断页面元素定位内容是否属于json数组且json数组的数量大于1;若页面元素定位内容属于json数组且json数组的数量大于1,则根据目标浏览器插件对页面元素定位内容进行网页自动化操作;若页面元素定位内容不属于json数组或者属于json数组但json数组的数量等于1,则根据WebDriver对页面元素定位内容进行网页自动化操作。与现有技术相比,本申请使用浏览器插件和webDriver方式相结合来实现RPA,除了能使用webDriver的能力,如复杂的xpath,cssSelector匹配语法;还能使用插件的能力,如防爬虫等能力,另外,调用浏览器原生接口,有效提高执行效率。
继续参阅图3,示出了图2中步骤S202的一种具体实施方式的流程图,为了便于说明,仅示出与本申请相关的部分。
在本实施例的一些可选的实现方式中,目标浏览器可以为谷歌浏览器或者搜狗浏览器,步骤S202具体包括:步骤S301或步骤S302。
在步骤S301中,若目标浏览器为谷歌浏览器,则启动谷歌浏览器插件,其中,谷歌浏览器插件的通信机制为nativeMessage。
在步骤S302中,若目标浏览器为搜狗浏览器,则启动搜狗浏览器插件,其中,搜狗浏览器插件的通信机制为websocket。
在本申请实施例中,谷歌浏览器插件的前台js负责在具体网页执行的js方法块,操作页面的DOM元素;插件的后台js负责与本地应用通信,调用谷歌浏览器的原生API接口和实现页面跨域的js调度。
在本申请实施例中,通过开发基于nativeMessage通信机制的谷歌浏览器插件,与组件设计应用相结合,实现下述选择器的功能。
在本申请实施例中,针对搜狗浏览器不支持nativeMessage通信机制,通过开发基于websocket通信机制的搜狗浏览器插件,与组件设计应用相结合,实现下述选择器的功能。
在本申请实施例中,使用java语言开发本地通信应用,一方面与谷歌浏览器插件基于nativeMessage方式通信;一方面基于http请求的方式,与外部通信,接收到外部请求后,作业务的解析和数据组装,发送到谷歌浏览器的后台js。针对搜狗浏览器,则使用websocket的方式通信。
继续参阅图4,示出了图2中步骤S203的一种具体实施方式的流程图,为了便于说明,仅示出与本申请相关的部分。
在本实施例的一些可选的实现方式中,步骤S203具体包括:步骤S401、步骤S402以及步骤S403。
在步骤S401中,当用户在组件设计应用中激活选择器时,获取目标浏览器中鼠标的定位信息。
在步骤S402中,将定位信息发送至目标浏览器插件的浏览器前后台。
在步骤S403中,接收浏览器前后台发送的元素内容信息,得到页面元素定位内容。
在本申请实施例中,组件设计应用中的选择器获取鼠标位置,经本地应用的算法,传入到谷歌浏览器插件,从而拾取到鼠标所在位置的元素,生成选中框作标识,并返回html标签和xpath,从而保存到组件设计应用的设计流程中。
在本申请实施例中,用户可以通过可视化选取指定浏览器里的网页元素,并且能便捷选取页面里的元素,从而进行控制,极大降低用户的使用门槛。
继续参阅图5,示出了图2中步骤S203之后的一种具体实施方式的流程图,为了便于说明,仅示出与本申请相关的部分。
在本实施例的一些可选的实现方式中,在步骤S203之后,还包括:步骤S501。
在步骤S501中,若页面元素定位内容的json数据异常,则根据WebDriver对页面元素定位内容进行网页自动化操作。
在本申请实施例中,如果元素内容的解析json异常,则认为是简单的定位模式写法,仍可以使用webDriver的方式对页面元素定位内容进行网页自动化操作。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
实施例二
进一步参考图6,作为对上述图2所示方法的实现,本申请提供了一种网页自动化装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例的网页自动化装置200包括:浏览器启动模块210、插件启动模块220、定位内容获取模块230、Json数组判断模块240、第一自动化操作模块250以及第二自动化操作模块260。其中:
浏览器启动模块210,用于通过WebDriver启动目标浏览器;
插件启动模块220,用于启动与目标浏览器相对应的目标浏览器插件;
定位内容获取模块230,用于根据目标浏览器插件获取与目标浏览器相对应的页面元素定位内容;
Json数组判断模块240,用于判断页面元素定位内容是否属于json数组且json数组的数量大于1;
第一自动化操作模块250,用于若页面元素定位内容属于json数组且json数组的数量大于1,则根据目标浏览器插件对页面元素定位内容进行网页自动化操作;
第二自动化操作模块260,用于若页面元素定位内容不属于json数组或者属于json数组但json数组的数量等于1,则根据WebDriver对页面元素定位内容进行网页自动化操作。
在本申请实施例中,获取页面元素定位内容还可以是预先缓存webDriver对象,并生成唯一标识sessionId,当后续接收到请求后,只要带上相同的sessionId,则会从缓存中获取webDriver对象,从而使用。
在本申请实施例中,使用浏览器插件的方式,会通过本地通信应用,作业务的解析和数据组装,发送到浏览器的插件,调用浏览器的原生api,实现操作页面元素。
在本申请实施例中,使用webDriver方式,会使用xpath作为定位标识,实现操作页面元素。
在本申请实施例中,根据选择器选择元素后生成的内容,先匹配是否属于json数组,如果是json数组,且数量大于1,代表是有iframe结构,则会使用插件的方式,否则使用webDriver的方式。
在本实施例的一些可选的实现方式中,也可以在每个组件的executeType参数明确指定运行模式。
在本实施例的一些可选的实现方式中,当使用webDriver的方式时,需要进一步解析定位内容属于webDriver的哪种定位模式,如"/","("开头的认为是xpath模式,除此之类,定位内容包含"#",".","[","'","\"","=","",">","+","(",":"),则认为是cssSelector,其他则默认为id,此处可以适配大部分的情况,也可以使用json格式,明确指定定位内容属于webDriver的哪种定位模式。
在本申请实施例中,提供了一种网页自动化装置200,包括:浏览器启动模块210,用于通过WebDriver启动目标浏览器;插件启动模块220,用于启动与目标浏览器相对应的目标浏览器插件;定位内容获取模块230,用于根据目标浏览器插件获取与目标浏览器相对应的页面元素定位内容;Json数组判断模块240,用于判断页面元素定位内容是否属于json数组且json数组的数量大于1;第一自动化操作模块250,用于若页面元素定位内容属于json数组且json数组的数量大于1,则根据目标浏览器插件对页面元素定位内容进行网页自动化操作;第二自动化操作模块260,用于若页面元素定位内容不属于json数组或者属于json数组但json数组的数量等于1,则根据WebDriver对页面元素定位内容进行网页自动化操作。与现有技术相比,本申请使用浏览器插件和webDriver方式相结合来实现RPA,除了能使用webDriver的能力,如复杂的xpath,cssSelector匹配语法;还能使用插件的能力,如防爬虫等能力,另外,调用浏览器原生接口,有效提高执行效率。
在本实施例的一些可选的实现方式中,上述插件启动模块220包括:第一插件启动子模块以及第二插件启动子模块,其中:
第一插件启动子模块,用于若目标浏览器为谷歌浏览器,则启动谷歌浏览器插件,其中,谷歌浏览器插件的通信机制为nativeMessage;
第二插件启动子模块,用于若目标浏览器为搜狗浏览器,则启动搜狗浏览器插件,其中,搜狗浏览器插件的通信机制为websocket。
在本申请实施例中,谷歌浏览器插件的前台js负责在具体网页执行的js方法块,操作页面的DOM元素;插件的后台js负责与本地应用通信,调用谷歌浏览器的原生API接口和实现页面跨域的js调度。
在本申请实施例中,通过开发基于nativeMessage通信机制的谷歌浏览器插件,与组件设计应用相结合,实现下述选择器的功能。
在本申请实施例中,针对搜狗浏览器不支持nativeMessage通信机制,通过开发基于websocket通信机制的搜狗浏览器插件,与组件设计应用相结合,实现下述选择器的功能。
在本申请实施例中,使用java语言开发本地通信应用,一方面与谷歌浏览器插件基于nativeMessage方式通信;一方面基于http请求的方式,与外部通信,接收到外部请求后,作业务的解析和数据组装,发送到谷歌浏览器的后台js。针对搜狗浏览器,则使用websocket的方式通信。
在本实施例的一些可选的实现方式中,上述定位内容获取模块230包括:定位信息获取子模块、定位信息发送子模块以及定位内容获取子模块,其中:
定位信息获取子模块,用于当用户在组件设计应用中激活选择器时,获取目标浏览器中鼠标的定位信息;
定位信息发送子模块,用于将定位信息发送至目标浏览器插件的浏览器前后台;
定位内容获取子模块,用于接收浏览器前后台发送的元素内容信息,得到页面元素定位内容。
在本申请实施例中,组件设计应用中的选择器获取鼠标位置,经本地应用的算法,传入到谷歌浏览器插件,从而拾取到鼠标所在位置的元素,生成选中框作标识,并返回html标签和xpath,从而保存到组件设计应用的设计流程中。
在本申请实施例中,用户可以通过可视化选取指定浏览器里的网页元素,并且能便捷选取页面里的元素,从而进行控制,极大降低用户的使用门槛。
在本实施例的一些可选的实现方式中,上述网页自动化装置100还包括:数据异常模块,其中:
数据异常模块,用于若页面元素定位内容的json数据异常,则根据WebDriver对页面元素定位内容进行网页自动化操作。
在本申请实施例中,如果元素内容的解析json异常,则认为是简单的定位模式写法,仍可以使用webDriver的方式对页面元素定位内容进行网页自动化操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图7,图7为本实施例计算机设备基本结构框图。
所述计算机设备300包括通过系统总线相互通信连接存储器310、处理器320、网络接口330。需要指出的是,图中仅示出了具有组件310-330的计算机设备300,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器310至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器310可以是所述计算机设备300的内部存储单元,例如该计算机设备300的硬盘或内存。在另一些实施例中,所述存储器310也可以是所述计算机设备300的外部存储设备,例如该计算机设备300上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器310还可以既包括所述计算机设备300的内部存储单元也包括其外部存储设备。本实施例中,所述存储器310通常用于存储安装于所述计算机设备300的操作系统和各类应用软件,例如网页自动化方法的计算机可读指令等。此外,所述存储器310还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器320在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器320通常用于控制所述计算机设备300的总体操作。本实施例中,所述处理器320用于运行所述存储器310中存储的计算机可读指令或者处理数据,例如运行所述网页自动化方法的计算机可读指令。
所述网络接口330可包括无线网络接口或有线网络接口,该网络接口330通常用于在所述计算机设备300与其他电子设备之间建立通信连接。
本申请提供的计算机设备,使用浏览器插件和webDriver方式相结合来实现RPA,除了能使用webDriver的能力,如复杂的xpath,cssSelector匹配语法;还能使用插件的能力,如防爬虫,另外,调用浏览器原生接口,有效提高执行效率。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的网页自动化方法的步骤。
本申请提供的计算机可读存储介质,使用浏览器插件和webDriver方式相结合来实现RPA,除了能使用webDriver的能力,如复杂的xpath,cssSelector匹配语法;还能使用插件的能力,如防爬虫,另外,调用浏览器原生接口,有效提高执行效率。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种网页自动化方法,其特征在于,包括下述步骤:
通过WebDriver启动目标浏览器;
启动与所述目标浏览器相对应的目标浏览器插件;
根据所述目标浏览器插件获取与所述目标浏览器相对应的页面元素定位内容;
判断所述页面元素定位内容是否属于json数组且所述json数组的数量大于1;
若所述页面元素定位内容属于json数组且所述json数组的数量大于1,则根据所述目标浏览器插件对所述页面元素定位内容进行网页自动化操作;
若所述页面元素定位内容不属于所述json数组或者属于所述json数组但所述json数组的数量等于1,则根据所述WebDriver对所述页面元素定位内容进行网页自动化操作。
2.根据权利要求1所述的网页自动化方法,其特征在于,所述目标浏览器可以为谷歌浏览器或者搜狗浏览器,所述启动与所述目标浏览器相对应的目标浏览器插件的步骤,具体包括下述步骤:
若所述目标浏览器为所述谷歌浏览器,则启动谷歌浏览器插件,其中,所述谷歌浏览器插件的通信机制为nativeMessage;
若所述目标浏览器为所述搜狗浏览器,则启动搜狗浏览器插件,其中,所述搜狗浏览器插件的通信机制为websocket。
3.根据权利要求1所述的网页自动化方法,其特征在于,所述根据所述目标浏览器插件获取与所述目标浏览器相对应的页面元素定位内容的步骤,具体包括下述步骤:
当用户在组件设计应用中激活选择器时,获取所述目标浏览器中鼠标的定位信息;
将所述定位信息发送至所述目标浏览器插件的浏览器前后台;
接收所述浏览器前后台发送的元素内容信息,得到所述页面元素定位内容。
4.根据权利要求1所述的网页自动化方法,其特征在于,在所述根据所述目标浏览器插件获取与所述目标浏览器相对应的页面元素定位内容的步骤之后,还包括下述步骤:
若所述页面元素定位内容的json数据异常,则根据所述WebDriver对所述页面元素定位内容进行网页自动化操作。
5.一种网页自动化装置,其特征在于,包括:
浏览器启动模块,用于通过WebDriver启动目标浏览器;
插件启动模块,用于启动与所述目标浏览器相对应的目标浏览器插件;
定位内容获取模块,用于根据所述目标浏览器插件获取与所述目标浏览器相对应的页面元素定位内容;
Json数组判断模块,用于判断所述页面元素定位内容是否属于json数组且所述json数组的数量大于1;
第一自动化操作模块,用于若所述页面元素定位内容属于json数组且所述json数组的数量大于1,则根据所述目标浏览器插件对所述页面元素定位内容进行网页自动化操作;
第二自动化操作模块,用于若所述页面元素定位内容不属于所述json数组或者属于所述json数组但所述json数组的数量等于1,则根据所述WebDriver对所述页面元素定位内容进行网页自动化操作。
6.根据权利要求5所述的网页自动化装置,其特征在于,所述目标浏览器可以为谷歌浏览器或者搜狗浏览器,所述插件启动模块包括:
第一插件启动子模块,用于若所述目标浏览器为所述谷歌浏览器,则启动谷歌浏览器插件,其中,所述谷歌浏览器插件的通信机制为nativeMessage;
第二插件启动子模块,用于若所述目标浏览器为所述搜狗浏览器,则启动搜狗浏览器插件,其中,所述搜狗浏览器插件的通信机制为websocket。
7.根据权利要求5所述的网页自动化装置,其特征在于,所述定位内容获取模块包括:
定位信息获取子模块,用于当用户在组件设计应用中激活选择器时,获取所述目标浏览器中鼠标的定位信息;
定位信息发送子模块,用于将所述定位信息发送至所述目标浏览器插件的浏览器前后台;
定位内容获取子模块,用于接收所述浏览器前后台发送的元素内容信息,得到所述页面元素定位内容。
8.根据权利要求5所述的网页自动化装置,其特征在于,所述装置还包括:
数据异常模块,用于若所述页面元素定位内容的json数据异常,则根据所述WebDriver对所述页面元素定位内容进行网页自动化操作。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至4中任一项所述的网页自动化方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至4中任一项所述的网页自动化方法的步骤。
CN202310283257.1A 2023-03-21 2023-03-21 一种网页自动化方法、装置、计算机设备及存储介质 Pending CN116304431A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310283257.1A CN116304431A (zh) 2023-03-21 2023-03-21 一种网页自动化方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310283257.1A CN116304431A (zh) 2023-03-21 2023-03-21 一种网页自动化方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN116304431A true CN116304431A (zh) 2023-06-23

Family

ID=86792213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310283257.1A Pending CN116304431A (zh) 2023-03-21 2023-03-21 一种网页自动化方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN116304431A (zh)

Similar Documents

Publication Publication Date Title
US20170163753A1 (en) Method and apparatus for controlling play device to play video
CN112162965B (zh) 一种日志数据处理的方法、装置、计算机设备及存储介质
US10534425B2 (en) Processing method and device for saving power, mobile terminal and cloud server
CN113254445B (zh) 实时数据存储方法、装置、计算机设备及存储介质
US10193989B2 (en) Visualization of user behavior
CN111552463A (zh) 一种页面跳转方法、装置、计算机设备及存储介质
CN110795180A (zh) 二维码管理方法、系统、电子设备及存储介质
US20100223272A1 (en) Methods and Systems for Aggregating Content in an Instant Messaging System
CN113778581A (zh) 页面加载方法、电子设备和存储介质
CN112307386A (zh) 信息监控方法、系统、电子设备及计算机可读存储介质
CN116974927A (zh) 性能自动化测试方法、系统、计算机设备及存储介质
CN109446451B (zh) 网页展示的方法、装置、介质和计算设备
CN116661936A (zh) 页面数据的处理方法、装置、计算机设备及存储介质
CN116112457A (zh) 消息通知的方法、装置、计算机设备及存储介质
CN116304431A (zh) 一种网页自动化方法、装置、计算机设备及存储介质
CN110796137A (zh) 一种识别图像的方法和装置
CN116467145A (zh) 页面性能数据采集方法、装置、计算机设备及存储介质
KR101553539B1 (ko) 동적 링크 제공 방법 및 이를 수행하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
CN116108814B (zh) 甘特图处理方法、装置、计算机设备及存储介质
CN118113376A (zh) 用于控制矿灯的应用程序启动方法及相关设备
CN117873831A (zh) Sql性能监控方法、装置、计算机设备及存储介质
CN117591190A (zh) 一种应用数据加载优化方法、装置、设备及其存储介质
CN117170547A (zh) 一种服务平台处理方法、装置、设备及其存储介质
CN116894736A (zh) 一种函件管理方法、装置、计算机设备及存储介质
CN117828221A (zh) 一种基于埋点技术的页面事件统计方法及其相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Wei Fangyu

Inventor after: Zhang Yuyang

Inventor after: Wei Xiaofeng

Inventor after: Ke Jiajian

Inventor after: Xing Xun

Inventor before: Zhang Yuyang

Inventor before: Wei Fangyu

Inventor before: Wei Xiaofeng

Inventor before: Ke Jiajian

Inventor before: Xing Xun