CN112433752A - 页面解析方法、装置、介质及电子设备 - Google Patents

页面解析方法、装置、介质及电子设备 Download PDF

Info

Publication number
CN112433752A
CN112433752A CN202011308856.7A CN202011308856A CN112433752A CN 112433752 A CN112433752 A CN 112433752A CN 202011308856 A CN202011308856 A CN 202011308856A CN 112433752 A CN112433752 A CN 112433752A
Authority
CN
China
Prior art keywords
page
page document
user
service request
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011308856.7A
Other languages
English (en)
Other versions
CN112433752B (zh
Inventor
李杨盼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Taikang Online Property Insurance Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Taikang Online Property Insurance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd, Taikang Online Property Insurance Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN202011308856.7A priority Critical patent/CN112433752B/zh
Publication of CN112433752A publication Critical patent/CN112433752A/zh
Application granted granted Critical
Publication of CN112433752B publication Critical patent/CN112433752B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/72Code refactoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/38Creation or generation of source code for implementing user interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种页面解析方法,包括:第二系统接收第一系统的业务请求;所述第二系统根据所述第一系统的业务请求确定与所述业务请求对应的页面文档,并向所述第一系统发送所述页面文档;所述第一系统根据所述页面文档的页面标识确定用于解析所述页面文档的可配置化模板;所述第一系统基于所述可配置化模板对所述页面文档进行解析,获取所述页面文档的数据;所述第一系统基于所述页面文档的数据生成目标页面文档,以此方式在第一系统上对第二系统的页面文档解析无需修改第一系统的业务代码,一定程度上减少了运维成本,提高了系统迭代开发的速度。本发明还提供了一种页面解析装置、介质以及电子设备。

Description

页面解析方法、装置、介质及电子设备
技术领域
本发明涉及页面处理的技术领域,具体而言,涉及一种页面解析方法、装置、介质及电子设备。
背景技术
目前,随着互联网技术的快速发展,企业内部为了将各种业务转至上处理,开发人员需要针对各种业务开发业务系统。有时在一些业务场景中两个不同的业务系统可以进行功能移植。但是,在两个业务系统进行功能移植之前,需要由开发人员了解被移植的业务系统的业务代码并重构业务代码,尤其是需要重构用户界面的代码,用于解析被移植的页面,以此方式解析被移植的页面增加了运维成本,降低了业务系统迭代开的速度。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种页面解析方法、装置、介质及电子设备,进而至少可以在一定程度上减少了运维成本,提高了系统迭代开发的速度。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的第一方面,提供了一种页面解析方法,包括:第二系统接收第一系统的业务请求,所述第二系统和所述第一系统相关联,且所述第二系统的系统架构和所述第一系统的系统架构不同;所述第二系统根据所述第一系统的业务请求确定与所述业务请求对应的页面文档,并向所述第一系统发送所述页面文档;所述第一系统根据所述页面文档的页面标识确定用于解析所述页面文档的可配置化模板,所述可配置化模板中包含可扩展样式语言;所述第一系统基于所述可配置化模板对所述页面文档进行解析,获取所述页面文档的数据;所述第一系统基于所述页面文档的数据生成目标页面文档。
在本发明的一些实施例中,该方法还包括:所述第一系统对所述目标页面文档进行数据处理,获取预设格式的数据;在所述第一系统中展示所述预设格式的数据。
在本发明的一些实施例中,在所述第二系统接收所述第一系统的业务请求之前,该方法还包括:所述第二系统接收所述第一系统的用户登录请求;所述第二系统响应所述用户登录请求,并根据所述用户登录请求确定所述用户的鉴权信息;所述第二系统根据所述用户的鉴权信息确定所述用户可访问的页面标识,并将所述用户可访问的页面标识发送至所述第一系统。
在本发明的一些实施例中,该方法还包括:所述第一系统接收用户业务操作;所述第一系统基于所述用户业务操作和所述用户可访问的页面标识生成所述业务请求;所述第一系统向所述第二系统发送所述业务请求。
在本发明的一些实施例中,所述第二系统根据所述第一系统的业务请求确定与所述业务请求对应的页面文档包括:所述第二系统从所述业务请求中提取所述用户业务操作和所述用户可访问的页面标识;所述第二系统根据所述用户业务操作从所述用户可访问的页面标识中确定与所述用户业务操作相关联的页面标识;所述第二系统根据与所述用户业务操作相关联的页面标识确定与所述业务请求对应的页面文档。
在本发明的一些实施例中,所述可扩展样式语言为XPath语言,所述页面文档的格式为HTML格式,该方法还包括:所述第一系统通过预设工具将HTML格式的页面文档转换为XML格式的页面文档;所述第一系统接收利用XPath语言描述所述XML格式的页面文档中元素和属性的XPath语句;所述第一系统基于所述XPath语句生成用于解析所述页面文档的可配置化模板。
在本发明的一些实施例中,所述第一系统基于所述可配置化模板对所述页面文档进行解析,获取所述页面文档的数据包括:所述第一系统基于所述可配置化模板中的XPath语句对所述XML格式的页面文档进行解析,获取所述XML格式的页面文档的数据。
根据本发明实施例的第二方面,提供了一种页面解析装置,所述页面解析装置包括第一系统和第二系统,所述第二系统和所述第一系统相关联,且所述第二系统的系统架构和所述第一系统的系统架构不同;所述第二系统用于接收所述第一系统的业务请求;所述第二系统用于根据所述第一系统的业务请求确定与所述业务请求对应的页面文档,并向所述第一系统发送所述页面文档;所述第一系统用于根据所述页面文档的页面标识确定用于解析所述页面文档的可配置化模板,所述可配置化模板中包含可扩展样式语言;所述第一系统用于基于所述可配置化模板对所述页面文档进行解析,获取所述页面文档的数据;所述第一系统用于基于所述页面文档的数据生成目标页面文档。
在本发明的一些实施例中,所述第一系统还用于:对所述目标页面文档进行数据处理,获取预设格式的数据;展示所述预设格式的数据。
在本发明的一些实施例中,所述第二系统还用于:接收所述第一系统的用户登录请求;响应所述用户登录请求,并根据所述用户登录请求确定所述用户的鉴权信息;根据所述用户的鉴权信息确定所述用户可访问的页面标识,并将所述用户可访问的页面标识发送至所述第一系统。
在本发明的一些实施例中,所述第一系统还用于:接收用户业务操作;基于所述用户业务操作和所述用户可访问的页面标识生成所述业务请求;向所述第二系统发送所述业务请求。
在本发明的一些实施例中,所述第二系统还用于:从所述业务请求中提取所述用户业务操作和所述用户可访问的页面标识;根据所述用户业务操作从所述用户可访问的页面标识中确定与所述用户业务操作相关联的页面标识;根据与所述用户业务操作相关联的页面标识确定与所述业务请求对应的页面文档。
在本发明的一些实施例中,所述可扩展样式语言为XPath语言,所述页面文档的格式为HTML格式,所述第一系统还用于:通过预设工具将HTML格式的页面文档转换为XML格式的页面文档;接收利用XPath语言描述所述XML格式的页面文档中元素和属性的XPath语句;基于所述XPath语句生成用于解析所述页面文档的可配置化模板。
在本发明的一些实施例中,所述第一系统用于基于所述可配置化模板对所述页面文档进行解析,获取所述页面文档的数据包括:所述第一系统用于基于所述可配置化模板中的XPath语句对所述XML格式的页面文档进行解析,获取所述XML格式的页面文档的数据。
根据本发明实施例的第三方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的页面解析方法。
根据本发明实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的页面解析方法。
本发明实施例提供的技术方案可以包括以下有益效果:
在本发明的一些实施例所提供的技术方案中,通过第二系统接收第一系统的业务请求,然后第二系统根据第一系统的业务请求确定与所述业务请求对应的页面文档,并向第一系统发送所页面文档,在这种情况下,第一系统可以根据页面文档的页面标识确定用于解析页面文档的可配置化模板,使得第一系统能够基于该可配置化模板对页面文档进行解析,以获取该页面文档的数据,最后第一系统基于页面文档的数据生成目标页面文档,以此方式在第一系统上对第二系统的页面文档解析无需修改第一系统的业务代码,一定程度上减少了运维成本,提高了系统迭代开发的速度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1A示出了可以应用本发明实施例的页面解析方法或页面解析装置的示例性系统架构的示意图;
图1B示出了系统架构应用到本发明实施例的场景图;
图2示意性示出了根据本发明的实施例的页面解析方法的流程图;
图3示意性示出了根据本发明的另一个实施例的页面解析方法的流程图;
图4示意性示出了根据本发明的另一个实施例的页面解析方法的流程图;
图5示意性示出了根据本发明的另一个实施例的页面解析方法的流程图;
图6示意性示出了根据本发明的另一个实施例的页面解析方法的流程图;
图7示意性示出了根据本发明的另一个实施例的页面解析方法的流程图;
图8示意性示出了根据本发明的实施例的页面解析装置的方框图;
图9示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1A示出了可以应用本发明实施例的页面解析方法或页面解析装置的示例性系统架构的示意图。
如图1所示,系统架构100可以包括服务器101、网络102和服务器103。网络102用以在服务器101和服务器102之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
应该理解,图1中的网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的网络和服务器。比如服务器101和服务器102可以是多个服务器组成的服务器集群等。或者,服务器101和服务器102是属于服务器集群的部分服务器,用于实现本公开的页面解析方法。
用户可以使用服务器101通过网络102与服务器103交互,以接收或发送消息等。服务器101和服务器102可以是部署有第一系统或第二系统的服务器,其中,所述第二系统和所述第一系统相关联,且所述第二系统的系统架构和所述第一系统的系统架构不同。
例如,服务器101中部署有第一系统,服务器103中部署有第二系统,通过网络102可以将第二系统的页面移植在第一系统上展示,具体可以包括以下步骤,如图1B所示:
S1:第一系统用户可以通过账号和密码或者其他登录方式登录第一系统。
S2:在第一系统用户登录第一系统的同时,将登录请求发送至第二系统,第二系统响应该登录请求并登录第二系统,然后基于该登录请求确定该第一系统用户的用户鉴权信息,以及将该用户鉴权信息发送至第一系统,该用户鉴权信息用于表示用户身份和用户访问权限。
S3:在登录第一系统之后,第一系统可以接收第一系统用户的业务操作,例如,业务操作为列表查询等等,但不限于此。第一系统响应该业务操作,基于该业务操作和上述用户鉴权信息可以生成业务请求,将该业务请求发送至第二系统。
S4:第二系统基于业务请求中的业务操作和用户鉴权信息抓取与该业务请求相关的页面文档,并将页面文档发送至第一系统。
S5:在第一系统接收到页面文档之后,可以先识别该页面文档的格式,如果该页面文档的格式为HTML格式,则将该页面文档的格式转化为XML。
S6:第一系统利用可配置化模板对XML格式的页面文档进行解析,获取页面文档中的详情数据、业务数据、以及按钮链接URL。
S7:将详情数据在第一系统页面上展示。
S8:在第一系统页面上对按钮链接URL进行操作时,将该操作对应的URL发送至第二系统,或者跳到S10。
S9:第二系统可以根据该URL重定向跳转到与URL对应的页面,从而可以在第二系统上抓取该页面的页面文档。
S10:第一系统响应用户针对按钮链接URL的操作请求,在第一系统上展示与URL相关的数据。
图2示意性示出了根据本发明的实施例的页面解析方法的流程图。
如图2所示,页面解析方法可以包括步骤S210~步骤S250。
在步骤S210中,第二系统接收第一系统的业务请求,所述第二系统和所述第一系统相关联,且所述第二系统的系统架构和所述第一系统的系统架构不同。
在步骤S220中,第二系统根据第一系统的业务请求确定与上述业务请求对应的页面文档,并向第一系统发送页面文档。
在步骤S230中,第一系统根据页面文档的页面标识确定用于解析页面文档的可配置化模板,所述可配置化模板中包含可扩展样式语言。
在步骤S240中,第一系统基于可配置化模板对页面文档进行解析,获取页面文档的数据。
在步骤S250中,第一系统基于页面文档的数据生成目标页面文档。
该方法可以通过第二系统接收第一系统的业务请求,然后第二系统根据第一系统的业务请求确定与所述业务请求对应的页面文档,并向第一系统发送所页面文档,在这种情况下,第一系统可以根据页面文档的页面标识确定用于解析页面文档的可配置化模板,使得第一系统能够基于该可配置化模板对页面文档进行解析,以获取该页面文档的数据,最后第一系统基于页面文档的数据生成目标页面文档,以此方式在第一系统上对第二系统的页面文档解析无需修改第一系统的业务代码,一定程度上减少了运维成本,提高了系统迭代开发的速度。
在本发明的一个实施例中,上述第一系统和第二系统可以某领域的业务系统。第二系统和第一系统相关联,例如,同一用户的账号和密码既可以登录第一系统,也可以登录第二系统。或者其他登录方式登录第二系统和第一系统。另外,第一系统的业务数据和第二系统的业务数据也相关联。在本实施例中,第一系统的系统架构可以是基于分布式计算技术的应用和工具搭建的,第二系统的系统架构可以是基于Structs1和JSP技术搭建的。
在本发明的一个实施例中,第一系统的数据源和第二系统的数据源不同。例如,第二系统的部分业务数据在第一系统的数据源中无落库。在这种情况下,如果用户想在第一系统上浏览该部分业务数据时,相关技术中须通过调用Rest接口完成数据传输,并构建详情页面,然后对构建后的页面进行展示,但是在构建详情页面时,需与第二系统的开发人员共同进行大量数据字段的比对,因此较为繁琐,影响系统的迭代效率,而且在构建页面之后还需要重启机器才能实现在第一系统上展示部分业务数据。根据本发明的实施例,第一系统可以基于预设配置的可配置化模板对页面文档进行解析,获取页面文档的数据,并在第一系统上进行展示该页面文档的数据,以此方式移植第二系统的业务数据在第一系统上展示无需构建详情页面,即在第一系统上对第二系统的页面文档解析无需修改第一系统的业务代码,一定程度上减少了运维成本,提高了系统迭代开发的速度,而且无需重启机器。
在本发明的一个实施例中,第一系统的业务请求可以是第一系统基于用户业务操作和用户可访问的页面标识生成的业务请求。例如,用户想要在第一系统上查询业务的列表数据,此时可以基于该查询操作和该用户可访问的页面标识生成的查询请求。
在本发明的一个实施例中,由于上述列表数据在第一系统数据源中无落库,而在第二系统数据源中包含该列表数据,所以需要将上述业务请求发送至第二系统,第二系统可以根据第一系统的业务请求确定与该业务请求对应的页面文档,然后向第一系统发送该页面文档,并由第一系统对其进行解析。
在本发明的一个实施例中,上述可配置化模板可以预先根据第二系统的业务数据进行配置,然后将完成配置的可配置化模板发送至第一系统,以使得第一系统可以根据可配置化模板解析第二系统的页面文档,以此方式对第二系统的页面文档进行解析,无需构建详情页面,即无需重构用户界面的代码。
图3示意性示出了根据本发明的另一个实施例的页面解析方法的流程图。
如图3所示,上述方法还包括步骤S310和步骤S320。
在步骤S310中,第一系统对目标页面文档进行数据处理,获取预设格式的数据。
在步骤S320中,在第一系统中展示预设格式的数据。
该方法可以通过第一系统对目标页面文档进行数据处理,获取预设格式的数据,并在第一系统中展示预设格式的数据,实现了无需重构用户界面的业务代码的情况下也可以将第二系统的数据展示在第一系统上。而且通过对目标页面文档进行数据处理,可以以多种数据格式的数据在第一系统上展示。
在本发明的一个实施例中,上述可配置化模板可以是可扩展样式表转换语言模板,简写XSLT(Extensible Stylesheet Language Transformations,简称XSLT)模板。通过XSLT模板对页面文档解析之后可以获取到格式为XLM的目标页面文档。由于第一系统所需的数据可能是多种多样的,因此可以使用javax.xml工具包和fastJson工具包对格式为XLM的目标页面文档进行处理,即完成XML文件到其他数据格式的转换,例如:将格式为XLM的目标页面文档中的数据转换为json格式、纯文本格式、url超链接、反序列化成为JsonObject、以及第一系统定义的DTO实体类等等。
图4示意性示出了根据本发明的另一个实施例的页面解析方法的流程图。
在上述步骤S210之前,该方法还包括步骤S410~步骤S430,如图4所示。
在步骤S410中,第二系统接收第一系统的用户登录请求。
在步骤S420中,第二系统响应用户登录请求,并根据用户登录请求确定用户的鉴权信息。
在步骤S430中,第二系统根据用户的鉴权信息确定用户可访问的页面标识,并将用户可访问的页面标识发送至第一系统。
该方法可以通过响应用户登录请求,并根据用户登录请求确定用户的鉴权信息,然后第二系统根据用户的鉴权信息确定用户可访问的页面标识,并将用户可访问的页面标识发送至第一系统,以便于后续在第一系统上可以基于用户的业务操作和用户可访问的页面标识生成业务请求,这样第二系统可以基于该业务请求准备快速的定位到与该业务请求相关的页面文档。
在本发明的一个实施例中,在用户登录第一系统时,可以将用户输入的登录信息(例如,用户账号和密码、用户指纹、用户虹膜等等)发送至第二系统,以使得第二系统基于该用户输入的登录信息登录第二系统。
在本发明的一个实施例中,在第二系统基于该用户输入的登录信息登入第二系统之后,第二系统可以根据该用户输入的登录信息确定该用户的鉴权信息,该用户的鉴权信息可以是用户的身份信息和用户的访问页面的权限信息。在本实施例中,第二系统根据用户的鉴权信息可以确定出该用户可访问的页面标识。例如,根据用户的身份信息和用户的访问页面的权限信息可以从数据库中确定出该用户可访问的页面标识。
图5示意性示出了根据本发明的另一个实施例的页面解析方法的流程图。
如图5所示,上述方法还包括步骤S510~步骤S530。
在步骤S510中,第一系统接收用户业务操作。
在步骤S520中,第一系统基于用户业务操作和用户可访问的页面标识生成业务请求。
在步骤S530中,第一系统向第二系统发送业务请求。
该方法可以通过第一系统基于用户业务操作和用户可访问的页面标识生成业务请求,然后向第二系统发送业务请求,以便于后续第二系统可以基于该业务请求准备快速的定位到与该业务请求相关的页面文档。
在本发明的一个实施例中,第一系统基于用户业务操作和用户可访问的页面标识可以生成业务请求。例如,第一系统基于用户业务操作和用户可访问的页面标识按照第二系统的要求构建请求参数和请求头,这样可以避免权限校验及跨域问题。
图6示意性示出了根据本发明的另一个实施例的页面解析方法的流程图。
如图6所示,上述步骤S220中的根据第一系统的业务请求确定与业务请求对应的页面文档包括步骤S610~步骤S630。
在步骤S610中,第二系统从业务请求中提取用户业务操作和用户可访问的页面标识。
在步骤S620中,第二系统根据用户业务操作从用户可访问的页面标识中确定与用户业务操作相关联的页面标识。
在步骤S630中,第二系统根据与用户业务操作相关联的页面标识确定与业务请求对应的页面文档。
该方法可以通过第二系统从业务请求中提取用户业务操作和用户可访问的页面标识,然后根据用户业务操作从用户可访问的页面标识中确定与用户业务操作相关联的页面标识,并根据与用户业务操作相关联的页面标识确定与业务请求对应的页面文档,以此方式可以准备快速的定位到与该业务请求相关的页面文档。
在本发明的一个实施例中,上述XSLT模板中包含由可扩展样式语言构成的语句。例如,可扩展样式语言为XPath语言,即XML路径语言(XML Path Language)。在本实施例中,通过修改XSLT模板中的XPath语句可以实现灵活兼容不同页面的解析逻辑,从而实现解析服务的可配置化。另外,XPath语言无需通过编译器编译就可以生效,因此修改XSLT模板中的XPath语句后无需重启服务器,对第一系统维护升级极为方便高效。而且XPath语句并非业务代码,即与第一系统的业务逻辑无关系,使得配置模板的过程可以做到无业务代码侵入,操作轻量,利于第一系统的快速迭代开发。
在本发明的一个实施例中,从第二系统确定出的页面文档的文档格式可以是HTML格式,或其他文档格式。如果第一系统接收到的页面文档为HTML格式的页面文档,则需要将HTML格式的页面文档转换为XML格式的页面文档,这样方便利用XSLT模板对其进行解析。
图7示意性示出了根据本发明的另一个实施例的页面解析方法的流程图。
如图7所示,上述方法还包括步骤S710~步骤S730。
在步骤S710中,第一系统通过预设工具将HTML格式的页面文档转换为XML格式的页面文档。
在步骤S720中,第一系统接收利用XPath语言描述XML格式的页面文档中元素和属性的XPath语句。
在步骤S730中,第一系统基于XPath语句生成用于解析页面文档的可配置化模板。
该方法可以通过第一系统接收利用XPath语言描述XML格式的页面文档中元素和属性的XPath语句,并基于XPath语句生成用于解析页面文档的可配置化模板,由于XPath语言无需通过编译器编译就可以生效,因此修改XSLT模板中的XPath语句后无需重启服务器,这样对第一系统维护升级极为方便高效。而且XPath语句并非业务代码,即与第一系统的业务逻辑无关系,使得配置模板的过程可以做到无业务代码侵入,操作轻量,利于第一系统的快速迭代开发。
在本发明的一个实施例中,第一系统通过预设工具可以将HTML格式的页面文档转换为XML格式的页面文档。例如,第一系统通过org.w3c.tidy.Tidy工具包实现将HTML格式的页面文档转换为XML格式的页面文档。
在本发明的一个实施例中,上述第一系统基于可配置化模板对页面文档进行解析,获取页面文档的数据包括:第一系统基于可配置化模板中的XPath语句对XML格式的页面文档进行解析,获取XML格式的页面文档的数据。例如,将XML格式的页面文档和可配置化模板输入解析器,在解析器中,根据XPath语句中的元素和属性进行导航来定位并摘取上述目标XML的数据,然后形成XML格式的目标页面文档。
下面通过保险领域的业务页面移植的场景描述上述页面解析方法。
例如,保险领域的第一系统为核保系统,第二系统为核心系统。通过上述页面解析方法可以将核心系统的核心赔案信息查询页面移植到核保系统上展示。具体地,核心系统用户在核保系统的登录页面输入登录信息,核保系统响应登录请求进入核保系统,在核保系统用户登录核保系统的同时,将登录请求发送至核心系统,核心系统响应该登录请求并登录核心系统,然后基于该登录请求确定该核保系统用户的用户鉴权信息,以及将该用户鉴权信息发送至核保系统。此时如果核心系统用户想在核保系统中查询核心赔案信息,可以在核保系统上执行查询操作,核心系统响应该查询操作,将基于该查询操作和用户鉴权信息生成的查询请求发送至核心系统,核心系统可以基于该查询请求抓取相应的页面文档,并将抓取到的页面文档发送至核保系统,核保系统基于XSLT模板中的XPath语句对该页面文档进行解析,获取该页面文档的详情数据,并在核保系统上展示该详情数据,实现了将核心系统的核心赔案信息查询页面移植到核保系统上展示。
图8示意性示出了根据本发明的实施例的页面解析装置的方框图。
如图8所示,页面解析装置800包括第一系统810和第二系统820。其中,第二系统820和第一系统810相关联,且第二系统820的系统架构和第一系统810的系统架构不同。
具体地,第二系统820用于接收第一系统810的业务请求;
第二系统820用于根据第一系统810的业务请求确定与业务请求对应的页面文档,并向第一系统810发送所述页面文档;
第一系统810用于根据页面文档的页面标识确定用于解析页面文档的可配置化模板,所述可配置化模板中包含可扩展样式语言;
第一系统810用于基于所述可配置化模板对页面文档进行解析,获取页面文档的数据;
第一系统810用于基于页面文档的数据生成目标页面文档。
该页面解析装置800可以通过第二系统接收第一系统的业务请求,然后第二系统根据第一系统的业务请求确定与所述业务请求对应的页面文档,并向第一系统发送所页面文档,在这种情况下,第一系统可以根据页面文档的页面标识确定用于解析页面文档的可配置化模板,使得第一系统能够基于该可配置化模板对页面文档进行解析,以获取该页面文档的数据,最后第一系统基于页面文档的数据生成目标页面文档,以此方式在第一系统上对第二系统的页面文档解析无需修改第一系统的业务代码,一定程度上减少了运维成本,提高了系统迭代开发的速度。
根据本发明的实施例,该页面解析装置800可以用于实现图2实施例描述的页面解析方法。
在本发明的一些实施例中,第一系统810还用于:对目标页面文档进行数据处理,获取预设格式的数据;展示预设格式的数据。
在本发明的一些实施例中,第二系统820还用于:接收第一系统810的用户登录请求;响应用户登录请求,并根据用户登录请求确定用户的鉴权信息;根据用户的鉴权信息确定用户可访问的页面标识,并将用户可访问的页面标识发送至第一系统810。
在本发明的一些实施例中,第一系统810还用于:接收用户业务操作;基于用户业务操作和用户可访问的页面标识生成业务请求;向第二系统发送业务请求。
在本发明的一些实施例中,第二系统820还用于:从业务请求中提取用户业务操作和用户可访问的页面标识;根据用户业务操作从用户可访问的页面标识中确定与用户业务操作相关联的页面标识;根据与用户业务操作相关联的页面标识确定与业务请求对应的页面文档。
在本发明的一些实施例中,所述可扩展样式语言为XPath语言,所述页面文档的格式为HTML格式,第一系统810还用于:通过预设工具将HTML格式的页面文档转换为XML格式的页面文档;接收利用XPath语言描述XML格式的页面文档中元素和属性的XPath语句;基于XPath语句生成用于解析页面文档的可配置化模板。
在本发明的一些实施例中,第一系统810用于基于可配置化模板对页面文档进行解析,获取页面文档的数据包括:第一系统810用于基于可配置化模板中的XPath语句对XML格式的页面文档进行解析,获取XML格式的页面文档的数据。
由于本发明的示例实施例的页面解析装置800的各个系统可以用于实现上述2~图7描述的页面解析方法的示例实施例的步骤,因此对于本发明装置实施例中未披露的细节,请参照本发明上述的页面解析方法的实施例。
下面参考图9,其示出了适于用来实现本发明实施例的电子设备的计算机系统900的结构示意图。图9示出的电子设备的计算机系统900仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图9所示,计算机系统900包括中央处理单元(CPU)901,其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。在RAM 903中,还存储有系统操作所需的各种程序和数据。CPU901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
以下部件连接至I/O接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的页面解析方法。
例如,所述的电子设备可以实现如图2中所示的:在步骤S210中,第二系统接收第一系统的业务请求,所述第二系统和所述第一系统相关联,且所述第二系统的系统架构和所述第一系统的系统架构不同。在步骤S220中,第二系统根据第一系统的业务请求确定与上述业务请求对应的页面文档,并向第一系统发送页面文档。在步骤S230中,第一系统根据页面文档的页面标识确定用于解析页面文档的可配置化模板,所述可配置化模板中包含可扩展样式语言。在步骤S240中,第一系统基于可配置化模板对页面文档进行解析,获取页面文档的数据。在步骤S250中,第一系统基于页面文档的数据生成目标页面文档。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种页面解析方法,其特征在于,包括:
第二系统接收第一系统的业务请求,所述第二系统和所述第一系统相关联,且所述第二系统的系统架构和所述第一系统的系统架构不同;
所述第二系统根据所述第一系统的业务请求确定与所述业务请求对应的页面文档,并向所述第一系统发送所述页面文档;
所述第一系统根据所述页面文档的页面标识确定用于解析所述页面文档的可配置化模板,所述可配置化模板中包含可扩展样式语言;
所述第一系统基于所述可配置化模板对所述页面文档进行解析,获取所述页面文档的数据;
所述第一系统基于所述页面文档的数据生成目标页面文档。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
所述第一系统对所述目标页面文档进行数据处理,获取预设格式的数据;
在所述第一系统中展示所述预设格式的数据。
3.根据权利要求1所述的方法,其特征在于,在所述第二系统接收所述第一系统的业务请求之前,该方法还包括:
所述第二系统接收所述第一系统的用户登录请求;
所述第二系统响应所述用户登录请求,并根据所述用户登录请求确定所述用户的鉴权信息;
所述第二系统根据所述用户的鉴权信息确定所述用户可访问的页面标识,并将所述用户可访问的页面标识发送至所述第一系统。
4.根据权利要求3所述的方法,其特征在于,该方法还包括:
所述第一系统接收用户业务操作;
所述第一系统基于所述用户业务操作和所述用户可访问的页面标识生成所述业务请求;
所述第一系统向所述第二系统发送所述业务请求。
5.根据权利要求4所述的方法,其特征在于,所述第二系统根据所述第一系统的业务请求确定与所述业务请求对应的页面文档包括:
所述第二系统从所述业务请求中提取所述用户业务操作和所述用户可访问的页面标识;
所述第二系统根据所述用户业务操作从所述用户可访问的页面标识中确定与所述用户业务操作相关联的页面标识;
所述第二系统根据与所述用户业务操作相关联的页面标识确定与所述业务请求对应的页面文档。
6.根据权利要求1所述的方法,其特征在于,所述可扩展样式语言为XPath语言,所述页面文档的格式为HTML格式,该方法还包括:
所述第一系统通过预设工具将HTML格式的页面文档转换为XML格式的页面文档;
所述第一系统接收利用XPath语言描述所述XML格式的页面文档中元素和属性的XPath语句;
所述第一系统基于所述XPath语句生成用于解析所述页面文档的可配置化模板。
7.根据权利要求6所述的方法,其特征在于,所述第一系统基于所述可配置化模板对所述页面文档进行解析,获取所述页面文档的数据包括:
所述第一系统基于所述可配置化模板中的XPath语句对所述XML格式的页面文档进行解析,获取所述XML格式的页面文档的数据。
8.一种页面解析装置,其特征在于,所述页面解析装置包括第一系统和第二系统,所述第二系统和所述第一系统相关联,且所述第二系统的系统架构和所述第一系统的系统架构不同;
所述第二系统用于接收所述第一系统的业务请求;
所述第二系统用于根据所述第一系统的业务请求确定与所述业务请求对应的页面文档,并向所述第一系统发送所述页面文档;
所述第一系统用于根据所述页面文档的页面标识确定用于解析所述页面文档的可配置化模板,所述可配置化模板中包含可扩展样式语言;
所述第一系统用于基于所述可配置化模板对所述页面文档进行解析,获取所述页面文档的数据;
所述第一系统用于基于所述页面文档的数据生成目标页面文档。
9.一种电子设备,包括:
一个或多个处理器;以及
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现根据权利要求1~7中任意一项所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现根据权利要求1~7中任意一项所述的方法。
CN202011308856.7A 2020-11-20 2020-11-20 页面解析方法、装置、介质及电子设备 Active CN112433752B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011308856.7A CN112433752B (zh) 2020-11-20 2020-11-20 页面解析方法、装置、介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011308856.7A CN112433752B (zh) 2020-11-20 2020-11-20 页面解析方法、装置、介质及电子设备

Publications (2)

Publication Number Publication Date
CN112433752A true CN112433752A (zh) 2021-03-02
CN112433752B CN112433752B (zh) 2023-11-17

Family

ID=74693094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011308856.7A Active CN112433752B (zh) 2020-11-20 2020-11-20 页面解析方法、装置、介质及电子设备

Country Status (1)

Country Link
CN (1) CN112433752B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204621A (zh) * 2021-05-12 2021-08-03 北京百度网讯科技有限公司 文档入库、文档检索方法,装置,设备以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101984438A (zh) * 2010-11-27 2011-03-09 杭州万格网络科技有限公司 一种在线自助建站、创建应用服务与开发在线软件的方法
CN110134391A (zh) * 2019-04-28 2019-08-16 苏宁易购集团股份有限公司 一种用于移动化页面的适配方法及装置
CN110347390A (zh) * 2018-04-03 2019-10-18 武汉斗鱼网络科技有限公司 一种快速生成web页面的方法、存储介质、设备及系统
US20200081703A1 (en) * 2017-08-16 2020-03-12 Alibaba Group Holding Limited Page update method and apparatus

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101984438A (zh) * 2010-11-27 2011-03-09 杭州万格网络科技有限公司 一种在线自助建站、创建应用服务与开发在线软件的方法
US20200081703A1 (en) * 2017-08-16 2020-03-12 Alibaba Group Holding Limited Page update method and apparatus
CN110347390A (zh) * 2018-04-03 2019-10-18 武汉斗鱼网络科技有限公司 一种快速生成web页面的方法、存储介质、设备及系统
CN110134391A (zh) * 2019-04-28 2019-08-16 苏宁易购集团股份有限公司 一种用于移动化页面的适配方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204621A (zh) * 2021-05-12 2021-08-03 北京百度网讯科技有限公司 文档入库、文档检索方法,装置,设备以及存储介质
CN113204621B (zh) * 2021-05-12 2024-05-07 北京百度网讯科技有限公司 文档入库、文档检索方法,装置,设备以及存储介质

Also Published As

Publication number Publication date
CN112433752B (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
US8745641B1 (en) Automatic verification and anomaly detection in a representational state transfer (REST) application programming interface
CN108040040A (zh) 一种应用协议报文的自动化解析方法和装置
CN112187558B (zh) 数据校验方法、装置、电子设备
CN109144567B (zh) 跨平台的网页渲染方法、装置、服务器及存储介质
CN109359194B (zh) 用于预测信息类别的方法和装置
CN108984202B (zh) 一种电子资源分享方法、装置和存储介质
CN110858172A (zh) 一种自动化测试代码生成方法和装置
CN111949419A (zh) 一种跨环境资源获取方法、装置和电子设备
CN111600920B (zh) 基于js的数据请求代理方法、装置、设备及可读存储介质
CN112948306B (zh) 扩展系统接口的方法和装置
CN112433752B (zh) 页面解析方法、装置、介质及电子设备
CN116346660A (zh) 基于依赖替换服务的数据处理方法、装置、设备及介质
CN113672233B (zh) 一种基于Redfish的服务器带外管理方法、装置及设备
CN113032586B (zh) 对文本中的时间信息进行提取的方法、装置及电子设备
CN115640279A (zh) 一种数据血缘关系的构建方法和装置
CN111783006B (zh) 页面的生成方法、装置、电子设备及计算机可读介质
CN111400623B (zh) 用于搜索信息的方法和装置
US20180203748A1 (en) Validation and parsing performance using subtree caching
US8549494B2 (en) Techniques for parsing electronic files
CN108076067B (zh) 一种授权爬虫配置化模拟登录的方法及系统
CN111475403A (zh) 测试脚本的动态生成方法及相关装置
CN112287097B (zh) 标记语言文本解析方法及装置、存储介质、电子设备
CN115865898B (zh) 多个业务系统间数据信息的处理方法、装置、设备及介质
CN111090485B (zh) 面向多集群的帮助数据处理方法及装置、介质和设备
CN116400959A (zh) 一种前端功能扩展装置、方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant