CN112328838B - 一种报文解析预处理方法、系统及存储介质 - Google Patents

一种报文解析预处理方法、系统及存储介质 Download PDF

Info

Publication number
CN112328838B
CN112328838B CN202011195334.0A CN202011195334A CN112328838B CN 112328838 B CN112328838 B CN 112328838B CN 202011195334 A CN202011195334 A CN 202011195334A CN 112328838 B CN112328838 B CN 112328838B
Authority
CN
China
Prior art keywords
processed
message
tree structure
content
character pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011195334.0A
Other languages
English (en)
Other versions
CN112328838A (zh
Inventor
李一鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Travelsky Technology Co Ltd
Original Assignee
China Travelsky Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Travelsky Technology Co Ltd filed Critical China Travelsky Technology Co Ltd
Priority to CN202011195334.0A priority Critical patent/CN112328838B/zh
Publication of CN112328838A publication Critical patent/CN112328838A/zh
Application granted granted Critical
Publication of CN112328838B publication Critical patent/CN112328838B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种报文解析预处理方法及其相关装置,该方法在获取待处理报文后,首先确定解析深度参数和待处理报文的初始读取位置,然后根据解析深度参数确定待处理报文中待处理的树形结构层数,即在后续的解析过程中仅对待处理报文中部分内容进行处理,实现定制化解析待处理报文部分内容,对待处理报文的内容进行局部解析和处理的目的,减少由于第三方解析工具对内容全部序列化损耗的多余资源和时间上的浪费,以达到最小细粒度的内容处理,保证服务端提供高性能的服务能力。另外在内容解析过程中,仅记录关键属性位置信息以及属性值位置信息作为待处理报文的预处理结果,无需提取关键属性和属性值本身内容,有利于进一步提高该方法的处理效率。

Description

一种报文解析预处理方法、系统及存储介质
技术领域
本申请涉及计算机应用技术领域,更具体地说,涉及一种报文解析预处理方法、系统及存储介质。
背景技术
随着航空业务的快速发展和竞争的激烈性,航空公司为提高服务质量,在同一始发地和目的地之间,推出了多种出行方式的机票信息,使消费者购买机票时可以进行多种选择,而在机票量增多的同时,也加大了航司机票查询系统和消费者对机票的筛选的时间。
目前航司系统对机票的筛选功能支持并不完善,存在大量的人工筛选操作,不仅筛选效率较低,而且由于机票查询内容的业务复杂性,人工筛选难度高、耗时长、易出错且不可控。因此航空公司希望能够对机票查询内容上做定制化筛选功能,以满足国际机票查询业务的发展需要。当前机票系统查询时,仅支持内容的打分筛选,第一视觉查找到的机票信息则略显单一,不能够提现出航司售票的一些优惠策略和销售策略,同时对消费者也没有更贴切的优化推荐,使得消费者可能拿到的不是性价比更好的机票,机票查询添加了人工核对等操作,减低查票的质量等问题。
目前机票查询的报文内容较多,存在5-8M甚至容量更大的大容量报文,这些大容量报文在服务端处理过程中的数据并发量过大,导致服务端的处理压力过大且处理速度过慢,难以满足用户实时查询的要求。
发明内容
为解决上述技术问题,本申请提供了一种报文解析预处理方法、系统及存储介质,以解决对待处理报文全部序列化解析导致的多余资源损耗和时间上的浪费问题,提高服务端的报文处理能力。
为实现上述技术目的,本申请实施例提供了如下技术方案:
一种报文解析预处理方法,包括:
获取待处理报文,所述待处理报文包括的内容以树形结构设置;
确定解析深度参数和所述待处理报文的初始读取位置;
根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数;
根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结果,所述预处理结果包括所述待处理报文待处理的树形结构层数中的关键属性位置信息以及属性值位置信息。
可选的,所述确定解析深度参数和所述待处理报文的初始读取位置包括:
根据待处理报文确定所述解析深度参数和所述待处理报文的初始读取位置,所述解析深度参数包括树形结构的前N层,N大于或等于1。
可选的,所述根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数包括:
将所述待处理报文中以树形结构设置的内容的前N层确定为待处理的树形结构层数。
可选的,所述根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结构包括:
自所述待处理报文的初始读取位置起,读取所述待处理报文的待处理的树形结构层数中的第一类字符对,提取所述第一类字符对之间的信息作为关键属性信息;
读取所述关键属性信息中第一层的第二类字符对,记录第一层的第二类字符对的位置索引值;
读取第一层的第二类字符对之间的内容包括的第一类字符对和第二类字符对,并以树形结构记录读取的第一类字符对和第二类字符对的位置索引值;
根据记录的第一层的第二类字符对的位置索引值和以树形结构记录的第一类字符对和第二类字符对的位置索引值,生成所述待处理报文的预处理结果。
可选的,所述第一类字符对包括大括号字符对;
所述第二类字符对包括开始符和结束符字符对。
一种报文解析预处理系统,包括:
报文获取模块,用于获取待处理报文,所述待处理报文包括的内容以树形结构设置;
参数确定模块,用于确定解析深度参数和所述待处理报文的初始读取位置;
内容确定模块,用于根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数;
内容解析模块,用于根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结果,所述预处理结果包括所述待处理报文待处理的树形结构层数中的关键属性位置信息以及属性值位置信息。
可选的,所述参数确定模块具体用于根据待处理报文确定所述解析深度参数和所述待处理报文的初始读取位置,所述解析深度参数包括树形结构的前N层,N大于或等于1。
可选的,所述内容确定模块具体用于,将所述待处理报文中以树形结构设置的内容的前N层确定为待处理的树形结构层数。
可选的,所述内容解析模块具体用于,自所述待处理报文的初始读取位置起,读取所述待处理报文的待处理的树形结构层数中的第一类字符对,提取所述第一类字符对之间的信息作为关键属性信息;
读取所述关键属性信息中第一层的第二类字符对,记录第一层的第二类字符对的位置索引值;
读取第一层的第二类字符对之间的内容包括的第一类字符对和第二类字符对,并以树形结构记录读取的第一类字符对和第二类字符对的位置索引值;
根据记录的第一层的第二类字符对的位置索引值和以树形结构记录的第一类字符对和第二类字符对的位置索引值,生成所述待处理报文的预处理结果。
可选的,所述第一类字符对包括大括号字符对;
所述第二类字符对包括开始符和结束符字符对。
一种报文解析预处理系统,包括:存储器和处理器;
所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,所述程序代码用于执行上述任一项所述的报文解析预处理方法。
一种存储介质,所述存储介质上存储有程序代码,所述程序代码被执行时实现上述任一项所述的报文解析预处理方法。
从上述技术方案可以看出,本申请实施例提供了一种报文解析预处理方法、系统及存储介质,其中,所述报文解析预处理方法在获取待处理报文后,首先确定解析深度参数和所述待处理报文的初始读取位置,然后根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数,即在后续的解析过程中仅对待处理报文中的待处理的树形结构层数对应的内容进行处理,实现定制化解析待处理报文部分内容,对待处理报文的内容进行局部解析和处理的目的,减少由于第三方解析工具对内容全部序列化损耗的多余资源和时间上的浪费,以达到最小细粒度的内容处理,保证服务端提供高性能的服务能力。
另外,在根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析的过程中,仅记录所述待处理报文待处理的树形结构层数中的关键属性位置信息以及属性值位置信息作为所述待处理报文的预处理结果,无需提取关键属性和属性值本身内容,有利于进一步提高该方法的处理效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请的一个实施例提供的一种报文解析预处理方法的流程示意图;
图2为本申请的另一个实施例提供的一种报文解析预处理方法的流程示意图;
图3为本申请的又一个实施例提供的一种报文解析预处理方法的流程示意图;
图4为本申请的一个实施例提供的一种待处理报文的示意图;
图5为本申请的一个实施例提供的从待处理报文中读取第一类字符对时的示意图;
图6为本申请的一个实施例提供的从待处理报文中读取第二类字符对时的示意图;
图7为本申请的一个实施例提供的一种报文解析预处理系统的结构示意图;
图8为本申请的另一个实施例提供的一种报文解析预处理系统的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本申请实施例提供了一种报文解析预处理方法,如图1所示,包括:
S101:获取待处理报文,所述待处理报文包括的内容以树形结构设置;
S102:确定解析深度参数和所述待处理报文的初始读取位置;
S103:根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数;
S104:根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结果,所述预处理结果包括所述待处理报文待处理的树形结构层数中的关键属性位置信息以及属性值位置信息。
在本实施例中,所述报文解析预处理方法在获取待处理报文后,首先确定解析深度参数和所述待处理报文的初始读取位置,然后根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数,即在后续的解析过程中仅对待处理报文中的待处理的树形结构层数对应的内容进行处理,实现定制化解析待处理报文部分内容,对待处理报文的内容进行局部解析和处理的目的,减少由于第三方解析工具对内容全部序列化损耗的多余资源和时间上的浪费,以达到最小细粒度的内容处理,保证服务端提供高性能的服务能力。
另外,在根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析的过程中,仅记录所述待处理报文待处理的树形结构层数中的关键属性位置信息以及属性值位置信息作为所述待处理报文的预处理结果,无需提取关键属性和属性值本身内容,有利于进一步提高该方法的处理效率。
下面对本申请实施例提供的报文解析预处理方法的各个步骤的可行执行过程进行描述。
在上述实施例的基础上,在本申请的一个实施例中,如图2所示,所述确定解析深度参数和所述待处理报文的初始读取位置包括:
S1021:根据待处理报文确定所述解析深度参数和所述待处理报文的初始读取位置,所述解析深度参数包括树形结构的前N层,N大于或等于1。
所述根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数包括:
S1031:将所述待处理报文中以树形结构设置的内容的前N层确定为待处理的树形结构层数。
在本实施例中,在根据所述待处理报文确定所述解析深度参数和所述待处理报文的初始读取位置的过程中,可以是根据所述待处理报文的业务类型确定所述解析深度参数和所述待处理报文的初始读取位置,也可以是根据所述待处理报文的树形结构的深度确定所述解析深度参数和所述待处理报文的初始读取位置,本申请对此并不做限定,具体视实际情况而定。
假设当一个所述待处理报文的树形结构包括5层时,N的取值可以为1、2、3或4,即N的取值小于所述待处理报文的树形结构的最大层数。
在上述实施例的基础上,在本申请的另一个实施例中,参考图3,所述根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结构包括:
S1041:自所述待处理报文的初始读取位置起,读取所述待处理报文的待处理的树形结构层数中的第一类字符对,提取所述第一类字符对之间的信息作为关键属性信息;
S1042:读取所述关键属性信息中第一层的第二类字符对,记录第一层的第二类字符对的位置索引值;
S1043:读取第一层的第二类字符对之间的内容包括的第一类字符对和第二类字符对,并以树形结构记录读取的第一类字符对和第二类字符对的位置索引值;
S1044:根据记录的第一层的第二类字符对的位置索引值和以树形结构记录的第一类字符对和第二类字符对的位置索引值,生成所述待处理报文的预处理结果。
可选的,所述第一类字符对包括大括号字符对;
所述第二类字符对包括开始符和结束符字符对。所述开始符可以是[,所述结束符可以是],在一个待处理报文中,相对应的开始符和结束符字符对对应着一个层级的关键属性。
结合参考图4、图5和图6,图4为读取到的一个待处理报文的报文片段,图5中,当读取到结束符’]’和开始符’{’两个字符时,认为中间部分的debugInformation是关键属性,进行信息提取,处理掉双引号’”’和冒号’:’,即所得关键属性。
参考图6,继续读取时,遇到大括号字符’{’,’}’这样成对出现的,认为两个字符中间部分为关键属性的值信息,记录’{’的位置索引值和’}’的位置索引值,是数值类型,当属性值中还存在多个’{’,’}’成对的字符时,采用计数的方式,就能找到最后的’}’结束符的位置,如果内部还存在大括号或者中括号的字符,会深入读取内部的关键属性和属性值,判断逻辑不变。
最终读取到的关键属性和属性值可组成一个节点信息,节点属性包括属性字符串、开始索引位置和结束索引位置,节点信息下可包括子节点集合,这些节点信息和子节点集合可组成一个树形结构,便于属性的查找和内容的替换。
下面对本申请实施例提供的报文解析预处理系统进行描述,下文描述的报文解析预处理系统可与上文描述的报文解析预处理方法相互对应参照。
相应的,本申请实施例提供了一种报文解析预处理系统,如图7所示,包括:
报文获取模块10,用于获取待处理报文,所述待处理报文包括的内容以树形结构设置;
参数确定模块20,用于确定解析深度参数和所述待处理报文的初始读取位置;
内容确定模块30,用于根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数;
内容解析模块40,用于根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结果,所述预处理结果包括所述待处理报文待处理的树形结构层数中的关键属性位置信息以及属性值位置信息。
可选的,所述参数确定模块20具体用于根据待处理报文确定所述解析深度参数和所述待处理报文的初始读取位置,所述解析深度参数包括树形结构的前N层,N大于或等于1。
可选的,所述内容确定模块30具体用于,将所述待处理报文中以树形结构设置的内容的前N层确定为待处理的树形结构层数。
可选的,所述内容解析模块40具体用于,自所述待处理报文的初始读取位置起,读取所述待处理报文的待处理的树形结构层数中的第一类字符对,提取所述第一类字符对之间的信息作为关键属性信息;
读取所述关键属性信息中第一层的第二类字符对,记录第一层的第二类字符对的位置索引值;
读取第一层的第二类字符对之间的内容包括的第一类字符对和第二类字符对,并以树形结构记录读取的第一类字符对和第二类字符对的位置索引值;
根据记录的第一层的第二类字符对的位置索引值和以树形结构记录的第一类字符对和第二类字符对的位置索引值,生成所述待处理报文的预处理结果。
可选的,所述第一类字符对包括大括号字符对;
所述第二类字符对包括开始符和结束符字符对。
相应的,本申请实施例还提供了一种报文解析预处理系统,如图8所示,包括:存储器100和处理器200;
所述存储器100用于存储程序代码,所述处理器200用于调用所述程序代码,所述程序代码用于:
获取待处理报文,所述待处理报文包括的内容以树形结构设置;
确定解析深度参数和所述待处理报文的初始读取位置;
根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数;
根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结果,所述预处理结果包括所述待处理报文待处理的树形结构层数中的关键属性位置信息以及属性值位置信息。
相应的,本申请实施例还提供了一种存储介质,所述存储介质上存储有程序代码,所述程序代码被执行时实现上述任一实施例所述的报文解析预处理方法。
在本公开的上下文中,存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。存储介质可以是机器可读信号介质或机器可读储存介质。存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
需要说明的是,本公开上述的存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。存储介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述存储介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
根据本申请公开的一个或多个实施例,示例1提供了一种报文解析预处理方法,包括:
获取待处理报文,所述待处理报文包括的内容以树形结构设置;
确定解析深度参数和所述待处理报文的初始读取位置;
根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数;
根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结果,所述预处理结果包括所述待处理报文待处理的树形结构层数中的关键属性位置信息以及属性值位置信息。
根据本申请公开的一个或多个实施例中,示例2提供了示例1的报文解析预处理方法,所述确定解析深度参数和所述待处理报文的初始读取位置包括:
根据待处理报文确定所述解析深度参数和所述待处理报文的初始读取位置,所述解析深度参数包括树形结构的前N层,N大于或等于1。
根据本申请公开的一个或多个实施例中,示例3提供了示例1的报文解析预处理方法,所述根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数包括:
将所述待处理报文中以树形结构设置的内容的前N层确定为待处理的树形结构层数。
根据本申请公开的一个或多个实施例中,示例4提供了示例1的报文解析预处理方法,所述根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结构包括:
自所述待处理报文的初始读取位置起,读取所述待处理报文的待处理的树形结构层数中的第一类字符对,提取所述第一类字符对之间的信息作为关键属性信息;
读取所述关键属性信息中第一层的第二类字符对,记录第一层的第二类字符对的位置索引值;
读取第一层的第二类字符对之间的内容包括的第一类字符对和第二类字符对,并以树形结构记录读取的第一类字符对和第二类字符对的位置索引值;
根据记录的第一层的第二类字符对的位置索引值和以树形结构记录的第一类字符对和第二类字符对的位置索引值,生成所述待处理报文的预处理结果。
根据本申请公开的一个或多个实施例中,示例5提供了示例1的报文解析预处理方法,所述第一类字符对包括大括号字符对;
所述第二类字符对包括开始符和结束符字符对。
根据本申请公开的一个或多个实施例中,示例6提供了报文解析预处理系统,包括:
报文获取模块,用于获取待处理报文,所述待处理报文包括的内容以树形结构设置;
参数确定模块,用于确定解析深度参数和所述待处理报文的初始读取位置;
内容确定模块,用于根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数;
内容解析模块,用于根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结果,所述预处理结果包括所述待处理报文待处理的树形结构层数中的关键属性位置信息以及属性值位置信息。
根据本申请公开的一个或多个实施例中,示例7提供了示例1的报文解析预处理系统,所述参数确定模块具体用于根据待处理报文确定所述解析深度参数和所述待处理报文的初始读取位置,所述解析深度参数包括树形结构的前N层,N大于或等于1。
根据本申请公开的一个或多个实施例中,示例8提供了示例1的报文解析预处理系统,所述内容确定模块具体用于,将所述待处理报文中以树形结构设置的内容的前N层确定为待处理的树形结构层数。
根据本申请公开的一个或多个实施例中,示例9提供了示例1的报文解析预处理系统,所述内容解析模块具体用于,自所述待处理报文的初始读取位置起,读取所述待处理报文的待处理的树形结构层数中的第一类字符对,提取所述第一类字符对之间的信息作为关键属性信息;
读取所述关键属性信息中第一层的第二类字符对,记录第一层的第二类字符对的位置索引值;
读取第一层的第二类字符对之间的内容包括的第一类字符对和第二类字符对,并以树形结构记录读取的第一类字符对和第二类字符对的位置索引值;
根据记录的第一层的第二类字符对的位置索引值和以树形结构记录的第一类字符对和第二类字符对的位置索引值,生成所述待处理报文的预处理结果。
根据本申请公开的一个或多个实施例中,示例10提供了示例1的报文解析预处理系统,所述第一类字符对包括大括号字符对;
所述第二类字符对包括开始符和结束符字符对。
根据本申请公开的一个或多个实施例中,示例11提供了一种报文解析预处理系统,包括:存储器和处理器;
所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,所述程序代码用于执行上述任一实施例所述的报文解析预处理方法。
根据本申请公开的一个或多个实施例中,示例12提供了一种存储介质,所述存储介质上存储有程序代码,所述程序代码被执行时实现上述任一实施例所述的报文解析预处理方法的各个步骤。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (8)

1.一种报文解析预处理方法,其特征在于,包括:
获取待处理报文,所述待处理报文包括的内容以树形结构设置;
确定解析深度参数和所述待处理报文的初始读取位置;
根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数;
根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结果,所述预处理结果包括所述待处理报文待处理的树形结构层数中的关键属性位置信息以及属性值位置信息;
所述根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结构包括:
自所述待处理报文的初始读取位置起,读取所述待处理报文的待处理的树形结构层数中的第一类字符对,提取所述第一类字符对之间的信息作为关键属性信息;
读取所述关键属性信息中第一层的第二类字符对,记录第一层的第二类字符对的位置索引值;
读取第一层的第二类字符对之间的内容包括的第一类字符对和第二类字符对,并以树形结构记录读取的第一类字符对和第二类字符对的位置索引值;
根据记录的第一层的第二类字符对的位置索引值和以树形结构记录的第一类字符对和第二类字符对的位置索引值,生成所述待处理报文的预处理结果;
所述第一类字符对包括大括号字符对;
所述第二类字符对包括开始符和结束符字符对。
2.根据权利要求1所述的方法,其特征在于,所述确定解析深度参数和所述待处理报文的初始读取位置包括:
根据待处理报文确定所述解析深度参数和所述待处理报文的初始读取位置,所述解析深度参数包括树形结构的前N层,N大于或等于1。
3.根据权利要求2所述的方法,其特征在于,所述根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数包括:
将所述待处理报文中以树形结构设置的内容的前N层确定为待处理的树形结构层数。
4.一种报文解析预处理系统,其特征在于,包括:
报文获取模块,用于获取待处理报文,所述待处理报文包括的内容以树形结构设置;
参数确定模块,用于确定解析深度参数和所述待处理报文的初始读取位置;
内容确定模块,用于根据所述解析深度参数确定所述待处理报文中待处理的树形结构层数;
内容解析模块,用于根据所述初始读取位置和待处理的树形结构层数,对所述待处理报文的内容进行解析,以获取所述待处理报文的预处理结果,所述预处理结果包括所述待处理报文待处理的树形结构层数中的关键属性位置信息以及属性值位置信息;
所述内容解析模块具体用于,自所述待处理报文的初始读取位置起,读取所述待处理报文的待处理的树形结构层数中的第一类字符对,提取所述第一类字符对之间的信息作为关键属性信息;
读取所述关键属性信息中第一层的第二类字符对,记录第一层的第二类字符对的位置索引值;
读取第一层的第二类字符对之间的内容包括的第一类字符对和第二类字符对,并以树形结构记录读取的第一类字符对和第二类字符对的位置索引值;
根据记录的第一层的第二类字符对的位置索引值和以树形结构记录的第一类字符对和第二类字符对的位置索引值,生成所述待处理报文的预处理结果;
所述第一类字符对包括大括号字符对;
所述第二类字符对包括开始符和结束符字符对。
5.根据权利要求4所述的系统,其特征在于,所述参数确定模块具体用于根据待处理报文确定所述解析深度参数和所述待处理报文的初始读取位置,所述解析深度参数包括树形结构的前N层,N大于或等于1。
6.根据权利要求5所述的系统,其特征在于,所述内容确定模块具体用于,将所述待处理报文中以树形结构设置的内容的前N层确定为待处理的树形结构层数。
7.一种报文解析预处理系统,其特征在于,包括:存储器和处理器;
所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,所述程序代码用于执行权利要求1-3任一项所述的报文解析预处理方法。
8.一种存储介质,其特征在于,所述存储介质上存储有程序代码,所述程序代码被执行时实现权利要求1-3任一项所述的报文解析预处理方法。
CN202011195334.0A 2020-10-30 2020-10-30 一种报文解析预处理方法、系统及存储介质 Active CN112328838B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011195334.0A CN112328838B (zh) 2020-10-30 2020-10-30 一种报文解析预处理方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011195334.0A CN112328838B (zh) 2020-10-30 2020-10-30 一种报文解析预处理方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN112328838A CN112328838A (zh) 2021-02-05
CN112328838B true CN112328838B (zh) 2024-01-26

Family

ID=74322889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011195334.0A Active CN112328838B (zh) 2020-10-30 2020-10-30 一种报文解析预处理方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN112328838B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104753891A (zh) * 2013-12-31 2015-07-01 中国移动通信集团湖南有限公司 一种xml报文解析方法及装置
CN108076010A (zh) * 2016-11-10 2018-05-25 中国移动通信集团广东有限公司 一种xml报文解析方法及服务器
CN111082980A (zh) * 2019-12-10 2020-04-28 深圳市英威腾自动控制技术有限公司 一种解析拓扑结构的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8032826B2 (en) * 2008-02-21 2011-10-04 International Business Machines Corporation Structure-position mapping of XML with fixed length data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104753891A (zh) * 2013-12-31 2015-07-01 中国移动通信集团湖南有限公司 一种xml报文解析方法及装置
CN108076010A (zh) * 2016-11-10 2018-05-25 中国移动通信集团广东有限公司 一种xml报文解析方法及服务器
CN111082980A (zh) * 2019-12-10 2020-04-28 深圳市英威腾自动控制技术有限公司 一种解析拓扑结构的方法及装置

Also Published As

Publication number Publication date
CN112328838A (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
CN110362544A (zh) 日志处理系统、日志处理方法、终端及存储介质
CN111008321A (zh) 基于逻辑回归推荐方法、装置、计算设备、可读存储介质
CN111079408B (zh) 一种语种识别方法、装置、设备及存储介质
CN107870928A (zh) 文件读取方法和装置
CN110516203B (zh) 争议焦点分析方法、装置、电子设备及计算机可存储介质
CN103176996A (zh) 基于图片特征信息的图片搜索方法及图片搜索引擎服务器
CN108228664B (zh) 非结构化数据处理方法及装置
CN109412832B (zh) 用户服务提供方法及系统
CN110533456A (zh) 一种优惠券信息推送方法、系统及服务器
CN105550179A (zh) 一种网页收藏方法和浏览器插件
CN112328838B (zh) 一种报文解析预处理方法、系统及存储介质
CN104899203A (zh) 一种网页页面的生成方法、装置及终端设备
CN105009115A (zh) 获取网络资源的方法和装置
CN113139377A (zh) 推送信息的方法、装置、设备和计算机可读介质
CN117271584A (zh) 数据处理方法及装置、计算机可读存储介质和电子设备
CN111723063A (zh) 一种离线日志数据处理的方法和装置
CN106503198A (zh) 一种基于hadoop元数据的冷数据识别方法及系统
CN113965408B (zh) 一种http报文的提取方法、装置、介质及设备
CN103139227B (zh) 一种应用于移动终端的应用程序数据传输系统和方法
CN111382258A (zh) 电子阅读对象章节的确定方法及其装置
CN104978404B (zh) 一种视频专辑名称的生成方法及装置
CN105939222B (zh) 一种基于开放网络和位置采集App信息的方法
CN109005469A (zh) 一种消息格式的转换方法、装置、存储介质及安卓终端
CN109657184B (zh) 富文本处理方法、装置、服务器及计算机可读介质
CN113852835A (zh) 直播音频处理方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant