CN111178044A - 一种确定目标文本要素的方法及装置 - Google Patents

一种确定目标文本要素的方法及装置 Download PDF

Info

Publication number
CN111178044A
CN111178044A CN201911424034.2A CN201911424034A CN111178044A CN 111178044 A CN111178044 A CN 111178044A CN 201911424034 A CN201911424034 A CN 201911424034A CN 111178044 A CN111178044 A CN 111178044A
Authority
CN
China
Prior art keywords
text element
text
rule
target
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911424034.2A
Other languages
English (en)
Other versions
CN111178044B (zh
Inventor
吕鹏
陈婉玲
洪艺婉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN201911424034.2A priority Critical patent/CN111178044B/zh
Publication of CN111178044A publication Critical patent/CN111178044A/zh
Application granted granted Critical
Publication of CN111178044B publication Critical patent/CN111178044B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供的确定目标文本要素的方法及装置,针对每个文本要素,如果文本要素中存在第一解析规则,则依据第一解析规则对文本要素进行解析,否则,则从预设的解析规则库,获取第二解析规则,并依据第二解析规则对文本要素进行解析,从而确定文本要素的目标文本要素。因为针对不常见的文本要素,可以预先在该文本要素中置入第一解析规则,使可以依据第一解析规则对该不常见的文本要素进行解析,而对于常见的文本要素,可以预先在解析规则库中存储解析该常见类型的文本要素的第二解析规则,使可以依据第二解析规则对该文本要素进行解析。综上所述,可见,本申请提供的技术方案,可以对所有的文本要素进行解析,从而得到文本要素的目标文本要素。

Description

一种确定目标文本要素的方法及装置
技术领域
本申请涉及数据处理领域,尤其涉及一种确定目标文本要素的方法及装置。
背景技术
在企业的各个业务系统中,上线的各项业务由对应的业务数据文本得到,业务数据文本由不同的文本要素构成,文本要素为各种不同的脚本、页面以及报文等,各个文本要素之间存在调用关系,例如,页面可以调用不同的脚本或报文等。
为了便于对文本要素的管理,通常需要对文本要素进行解析,以确定该文本具体调用的文本要素。现有的文本要素解析工具,只能对一些常用的文本要素类型(如脚本、页面和报文等)进行解析,无法对一些不常见类型的文本要素进行解析,所以导致对于一些不常见类型的文本要素,无法分析其调用的文本要素。
发明内容
本申请提供了一种方法及装置,目的在于解决如何实现解析不同类型的文本要素,以得到该文本要素所调用的其他文本要素的问题。
为了实现上述目的,本申请提供了以下技术方案:
一种确定目标文本要素的方法,包括:
获取预先存储的多个文本要素;
针对每个所述文本要素,判断所述文本要素中是否存在预设的第一解析规则;所述第一解析规则被配置在不常见的文本要素中;
如果所述文本要素中存在所述第一解析规则,则依据所述第一解析规则对所述文本要素进行解析,得到所述文本要素中记录的目标文本要素的信息,并依据所述目标文本要素的信息确定所述目标文本要素,所述目标文本要素为所述文本要素所调用的文本要素;
如果所述文本要素中不存在所述第一解析规则,则确定所述文本要素的文本要素类型,从预设的解析规则库,获取与所述文本要素对应的第二解析规则,并依据所述第二解析规则对所述文本要素进行解析,得到所述文本要素中记录的所述目标文本要素的信息,并依据所述目标文本要素的信息确定所述目标文本要素,所述解析规则库用于存储常见的文本要素的解析规则。
上述的方法,可选的,所述针对每个所述文本要素,判断所述文本要素中是否存在预设的第一解析规则,包括:
判断所述文本要素中是否存在预设的第一解析规则的解析标识;如果存在,则确定所述文本要素中存在所述第一解析规则。
上述的方法,可选的,依据所述第一解析规则或所述第二解析规则对所述文本要素进行解析,得到所述文本要素中记录的目标文本要素的信息,并依据所述目标文本要素的信息确定所述目标文本要素,包括:
确定所述第一解析规则或所述第二解析中所有的规则节点;
针对每个所述规则节点,按照所述规则节点的解析规则,对所述文本要素进行解析,得到所述目标文本要素的标识码;
依据所述目标文本要素的标识码,确定所述目标文本要素。
上述的方法,可选的,确定所述目标文本要素之后,还包括:
在每个所述文本要素与所述目标文本要素之间建立有向连接边,得到调用关系图谱,所述调用关系图谱用于指示每个所述文本要素与其他文本要素之间的调用关系。
上述的方法,可选的,存储所述多个文本要素之前,还包括:
针对每对所述文本要素,判断所述文本要素对应的文本要素类型是否为目标文本要素类型,如果是所述预设的文本要素类型,则存储所述文本要素;所述目标文本要素类型为预先设定的文本要素类型;
如果不是所述目标文本要素类型,则发送所述文本要素为不符合目标文本要素类型的提示信息,使用户依据所述提示信息将所述第一解析规则置入所述文本要素中,并在接收到置入所述第一解析规则的文本要素后,存储该文本要素。
一种确定目标文本要素的装置,包括:
获取单元,用于获取预先存储的多个文本要素;
判断单元,用于针对每个所述文本要素,判断所述文本要素中是否存在预设的第一解析规则;所述第一解析规则被配置在不常见的文本要素中;
解析单元,用于如果所述文本要素中存在所述第一解析规则,则依据所述第一解析规则对所述文本要素进行解析,得到所述文本要素中记录的目标文本要素的信息,并依据所述目标文本要素的信息确定所述目标文本要素,所述目标文本要素为所述文本要素所调用的文本要素;如果所述文本要素中不存在所述第一解析规则,则确定所述文本要素的类型,从预设的解析规则库,获取与所述文本要素对应的第二解析规则,并依据所述第二解析规则对所述文本要素进行解析,得到所述文本要素中记录的所述目标文本要素的信息,并依据所述目标文本要素的信息确定所述目标文本要素,所述解析规则库用于存储常见的文本要素的解析规则。
上述的装置,可选的,所述判断单元,用于针对每个所述文本要素,判断所述文本要素中是否存在预设的第一解析规则,包括:
所述判断单元具体用于,判断所述文本要素中是否存在预设的第一解析规则的解析标识;如果存在,则确定所述文本要素中存在所述第一解析规则。
上述的装置,可选的,所述解析单元用于依据所述第一解析规则或第二解析规则对所述文本要素进行解析,得到所述文本要素中记录的的目标文本要素的信息,并依据所述目标文本要素的信息确定所述目标文本要素,包括:
所述解析单元具体用于,确定所述第一解析规则或所述第二解析中所有的规则节点;针对每个所述规则节点,按照所述规则节点的解析规则,对所述文本要素进行解析,得到所述目标文本要素的标识码;依据所述目标文本要素的标识码,确定所述目标文本要素。
上述的装置,可选的,连接单元,用于在每个所述文本要素与所述目标文本要素之间建立有向连接边,得到调用关系图谱,所述调用关系图谱用于指示每个所述文本要素与其他文本要素之间的调用关系。
上述的装置,可选的,存储单元,用于:针对每个所述文本要素,判断所述文本要素对应的文本要素类型是否为预设的文本要素类型,如果是所述预设的文本要素类型,则存储所述文本要素;如果不是所述预设的文本要素类型,则发送所述文本要素为不符合预设的文本要素类型的提示信息,使用户依据所述提示信息将所述第一解析规则置入所述文本要素中,并在接收到置入所述第一解析规则的文本要素后,存储该文本要素。
本申请所述的方法及装置,针对每个文本要素,判断文本要素中是否存在预设的第一解析规则,如果存在第一解析规则,则依据第一解析规则对文本要素进行解析,得到文本要素的目标文本要素,其中,目标文本要素为所述文本要素所调用的文本要素,如果文本要素中不存在第一解析规则,则确定文本要素的类型,从预设的解析规则库,获取与文本要素对应的第二解析规则,并依据第二解析规则对文本要素进行解析,得到文本要素中记录的目标文本要素的信息。因为针对不常见的文本要素,可以预先在该文本要素中置入第一解析规则,使可以依据第一解析规则对该不常见的文本要素进行解析,而对于常见的文本要素,可以预先在解析规则库中存储解析该常见类型的文本要素的第二解析规则,使可以依据第二解析规则对该文本要素进行解析。综上所述,可见,本申请提供的技术方案,可以对所有的文本要素进行解析,从而得到文本要素的目标文本要素。
另外,由于不常见的文本要素种类比较繁杂,无法一一收集总结,所以,难以在解析规则库中预先设定不常见的文本要素的解析规则,而针对不常见的文本要素,将文本要素的解析规则置入该文本要素中,更易于实现对文本要素的解析,因此,在不常见的文本要素中预先置入解析规则,不仅可以解析不常见的文本要素,还更易于实现。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种确定目标文本要素的方法的流程图;
图2为本申请实施例提供的又一种确定目标文本要素的方法流程图;
图3为本申请实施例提供的一种调用关系图谱的示意图;
图4为本申请实施例提供的一种确定目标文本要素的装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供的方法,其执行主体可以是具有对文本要素进行解析功能的服务器,图1为本申请实施例提供的一种确定目标文本要素的方法,可以包括以下步骤:
S101、获取预先存储的多个文本要素。
文本要素包括常见的文本要素以及不常见的文本要素,本实施例中,常见的文本要素为符合目标文本要素类型的文本要素,不常见的文本要素为不符合目标文本要素类型的文本要素,目标文本要素类型为预先设定的文本要素类型,每一种目标文本要素类型为:预先存储的文本要素中第一数量的文本要素对应的同一种文本要素类型,其中,第一数量可以自行设定。本实施例中,目标文本要素类型可以是脚本、页面和工作流等。
S102、针对每个文本要素,判断文本要素中是否存在预设的第一解析规则。如果存在第一解析规则,则执行S103。如果不存在第一解析规则,则执行S104。
第一解析规则是针对不常见的文本要素进行解析的规则,第一解析规则被配置在不常见的文本要素中,不同的文本要素,配置的第一解析规则不同,第一解析规则由开发人员依据文本要素的具体内容自行设定。
判断文本要素中是否存在预设的第一解析规则的一种方式可以是:判断文本要素中是否存在预设的第一解析规则的解析标识,如果存在,则确定文本要素中存在第一解析规则。本实施例中,可以在文本要素的起始位置置入第一解析规则,并且为第一解析规则添加解析标识,以使根据解析标识能够确定第一解析规则。进一步的,解析标识可以由起始标识与终止标识组成,起始标识与终止标识之间的内容为第一解析规则,通过起始标识和终止标识即可确定第一解析规则。
S103、依据第一解析规则对文本要素进行解析,得到文本要素中记录的目标文本要素的信息,并依据目标文本要素的信息确定目标文本要素。
目标文本要素为文本要素所调用的文本要素,实现本步骤的一种方式可以是:确定第一解析规则中所有的规则节点,针对每个规则节点,按照规则节点的解析规则,对文本要素进行解析,得到目标文本要素的标识码,并依据目标文本要素的标识码,确定目标文本要素。
第一解析规则中包括多个规则节点,每个规则节点中都包括节点标识,依据节点标识,可以确定第一解析规则的中的各个规则节点。规则节点描述解析文本要素的流程方法,依据规则节点对文本要素进行解析,得到解析结果。本实施例中,解析结果为目标文本要素的标识码,例如目标文本要素的编号,因为目标文本要素的标识码具有唯一性,所以依据标识码即可确定对应的目标文本要素。
需要说明的是,一个文本要素的目标文本要素可以是单个,也可以是多个,也就是说,一个文本要素可以调用单个或多个文本要素。
S104、确定文本要素的文本要素类型,从预设的解析规则库,获取与文本要素对应的第二解析规则,并依据第二解析规则对文本要素进行解析,得到文本要素中记录的目标文本要素的信息,并依据目标文本要素的信息确定目标文本要素。
解析规则库用于存储常见的文本要素的解析规则,在解析规则库中包括各种不同文本要素类型的解析规则。
实现本步骤的一种方式可以是,依据文本要素中预设的文本要素类型的标识,确定该文本要素的类型,从预设的解析规则库中获取与该文本要素的类型对应的第二解析规则,并采用第二解析规则对该文本要素进行解析,得到目标文本要素的信息,并根据目标文本要素的信息确定目标文本要素。其中,第二解析规则的数据结构与第一解析相同,都是由多个规则节点组成。依据第二解析规则对文本要素进行解析的过程与依据第一解析规则对文本要素进行解析的过程一致,此处不再赘述。
本实施例提供的方法,针对每个文本要素,如果文本要素中存在第一解析规则,则依据第一解析规则对文本要素进行解析,如果文本要素中不存在第一解析规则,则从预设的解析规则库,获取与该文本要素对应的第二解析规则,并依据第二解析规则对文本要素进行解析,从而确定文本要素的目标文本要素。因为针对不常见的文本要素,可以预先在该文本要素中置入第一解析规则,使可以依据第一解析规则对该不常见的文本要素进行解析,而对于常见的文本要素,可以预先在解析规则库中存储解析该常见类型的文本要素的第二解析规则,使可以依据第二解析规则对该文本要素进行解析。综上所述,可见,本申请提供的技术方案,可以对所有的文本要素进行解析,从而得到文本要素的目标文本要素。
同时,由于不常见的文本要素种类比较繁杂,无法一一收集总结,所以,难以在解析规则库中预先设定不常见的文本要素的解析规则,而针对不常见的文本要素,将文本要素的解析规则置入该文本要素中,更易于实现对文本要素的解析,因此,在不常见的文本要素中预先置入解析规则,不仅可以解析不常见的文本要素,还更易于实现。
另外,随着在业务系统日渐复杂且功能增多,相应的,文本要素的种类也会增加,在这样的情况下,只需更新解析规则库,或在新增种类的文本要素中配置对应的解析规则,即可实现对新增种类的文本要素进行解析,所以本实施例提供的方法,具有良好的适应性和拓展性。
上述的实施例中,在存储文本要素之前,还包括:针对每个文本要素,判断文本要素对应的文本要素类型是否为目标文本要素类型,如果是预设的目标文本要素类型,则存储该文本要素,如果不是目标文本要素类型,则发送文本要素为不符合目标文本要素类型的提示信息,使用户依据提示信息将所述第一解析规则置入文本要素中,并在接收到置入第一解析规则的文本要素后,存储该文本要素。其中,目标文本要素类型为预先设定的文本要素类型。
具体的,服务器接收到文本要素后,先判断文本要素对应的类型是否为目标文本要素类型,其中,目标文本要素类型预先存储在服务器中,如果是目标文本要素类型,说明该文本要素为常见的文本要素,无需在该文本要素中置入第一解析规则,则可直接存储该文本要素。如果不是目标文本要素类型,说明该文本要素为不常见的文本要素,则可通过用户前端界面,向用户发送文本要素为不符合目标文本要素类型的提示信息,提示信息中包括该文本要素的标识,使用户依据提示信息,确定该文本要素,并将第一解析规则置入文本要素中,并接收到用户输入的置入第一解析规则的文本要素后,存储该文本要素。
因为文本要素之间存在相互的调用关系,当某个文本要素发生改变后,很有可能对调用该文本要素的其他文本要素产生影响,从而可能需要相应的对调用该文本要素的其他文本要素进行修改,所以,在这种情况下,需要分析出所有调用该文本要素的其他文本要素。为此,结合图1,参考图2,提供了本申请实施例提供的又一种确定目标文本要素的方法。本实施例提供的方法为在图1所示的流程步骤的基础上,增加步骤S105。
步骤S105为:在每个文本要素与目标文本要素之间建立有向连接边,得到调用关系图谱。
其中,调用关系图谱用于指示每个文本要素与其他文本要素之间的调用关系,有向连接边的指向用于指示文本要素之间的调用与被调用的关系,例如,文本要素A的调用文本要素B,则有向连接边的指向可以是由文本要素A指向文本要素B。
本实施例中,例如,文本要素A调用的文本要素为文本要素B和文本要素C,文本要素B的调用文本要素C和文本要素D,则得到的调用关系图谱如图3所示,图3中,文本要素A发出的有向边指向文本要素B和文本要素B,说明文本要素A调用文本要素B和文本要素C。若文本要素C发生改变,根据调用关系图谱,可知调用文本要素C的文本要素为文本要素A和文本要素B。
综上,本实施提供的方法,在文本要素发生改变后,可以通过调用关系图谱快速的确定调用该文本要素的其他文本要素,从而确定文本要素发生改变后的影响范围。
与上述本发明实施例提供的一种确定目标文本要素的方法相对应,参考图4,示出了本发明实施例提供的一种确定目标文本要素的装置400的结构示意图,包括:
获取单元401,用于获取预先存储的多个文本要素;
判断单元402,用于针对每个文本要素,判断文本要素中是否存在预设的第一解析规则;第一解析规则被配置在不常见的文本要素中;
解析单元403,用于如果文本要素中存在第一解析规则,则依据第一解析规则对文本要素进行解析,得到文本要素中记录的目标文本要素的信息,并依据目标文本要素的信息确定目标文本要素,目标文本要素为文本要素所调用的文本要素;如果文本要素中不存在第一解析规则,则确定文本要素的文本要素类型,从预设的解析规则库,获取与文本要素对应的第二解析规则,并依据第二解析规则对文本要素进行解析,得到文本要素中记录的目标文本要素的信息,并依据目标文本要素的信息确定目标文本要素,解析规则库用于存储常见的文本要素的解析规则。
连接单元404,用于在每个文本要素与目标文本要素之间建立有向连接边,得到调用关系图谱,调用关系图谱用于指示每个文本要素与其他文本要素之间的调用关系。
存储单元405,用于针对每个文本要素,判断文本要素对应的文本要素类型是否为预设的文本要素类型,如果是预设的文本要素类型,则存储该文本要素;如果不是预设的文本要素类型,则发送文本要素为不符合预设的文本要素类型的提示信息,使用户依据所述提示信息将第一解析规则置入所述文本要素中,并在接收到置入第一解析规则的文本要素后,存储该文本要素。
其中,判断单元403针对每个所述文本要素,判断所述文本要素中是否存在预设的第一解析规则的具体实现方式为:判断文本要素中是否存在预设的第一解析规则的解析标识,如果存在,则确定文本要素中存在所述第一解析规则。
解析单元403依据第一解析规则或第二解析规则对文本要素进行解析,得到文本要素中记录的目标文本要素的信息,并依据目标文本要素的信息确定目标文本要素的具体实现方式为:确定第一解析规则或第二解析中所有的规则节点;针对每个规则节点,按照规则节点的解析规则,对文本要素进行解析,得到目标文本要素的标识码;依据目标文本要素的标识码,确定目标文本要素。
本申请实施例提供的装置,针对每个文本要素,如果文本要素中存在第一解析规则,则依据第一解析规则对文本要素进行解析,如果文本要素中不存在第一解析规则,则从预设的解析规则库,获取与该文本要素对应的第二解析规则,并依据第二解析规则对文本要素进行解析,从而确定文本要素的目标文本要素。因为针对不常见的文本要素,可以预先在该文本要素中置入第一解析规则,使可以依据第一解析规则对该不常见的文本要素进行解析,而对于常见的文本要素,可以预先在解析规则库中存储解析该常见类型的文本要素的第二解析规则,使可以依据第二解析规则对该文本要素进行解析。综上所述,可见,本申请提供的技术方案,可以对所有的文本要素进行解析,从而得到文本要素的目标文本要素。
同时,由于不常见的文本要素种类比较繁杂,无法一一收集总结,所以,难以在解析规则库中预先设定不常见的文本要素的解析规则,而针对不常见的文本要素,将文本要素的解析规则置入该文本要素中,更易于实现对文本要素的解析,因此,在不常见的文本要素中预先置入解析规则,不仅可以解析不常见的文本要素,还更易于实现。
另外,随着在业务系统日渐复杂且功能增多,相应的,文本要素的种类也会增加,在这样的情况下,只需更新解析规则库,或在新增种类的文本要素中配置对应的解析规则,即可实现对新增种类的文本要素进行解析,所以本实施例提供的方法,具有良好的适应性和拓展性。
本发明实施例还提供了一种电子设备,其结构示意图如图5所示,具体包括:处理器501和存储器502,存储器502用于存储程序;处理器501用于运行程序,以实现本申请实施例中确定目标文本要素的方法。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行本申请实施例中确定目标文本要素的方法。
本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种确定目标文本要素的方法,其特征在于,包括:
获取预先存储的多个文本要素;
针对每个所述文本要素,判断所述文本要素中是否存在预设的第一解析规则;所述第一解析规则被配置在不常见的文本要素中;
如果所述文本要素中存在所述第一解析规则,则依据所述第一解析规则对所述文本要素进行解析,得到所述文本要素中记录的目标文本要素的信息,并依据所述目标文本要素的信息确定所述目标文本要素,所述目标文本要素为所述文本要素所调用的文本要素;
如果所述文本要素中不存在所述第一解析规则,则确定所述文本要素的文本要素类型,从预设的解析规则库,获取与所述文本要素对应的第二解析规则,并依据所述第二解析规则对所述文本要素进行解析,得到所述文本要素中记录的所述目标文本要素的信息,并依据所述目标文本要素的信息确定所述目标文本要素,所述解析规则库用于存储常见的文本要素的解析规则。
2.根据权利要求1所述的方法,其特征在于,所述针对每个所述文本要素,判断所述文本要素中是否存在预设的第一解析规则,包括:
判断所述文本要素中是否存在预设的第一解析规则的解析标识;如果存在,则确定所述文本要素中存在所述第一解析规则。
3.根据权利要求1所述的方法,其特征在于,依据所述第一解析规则或所述第二解析规则对所述文本要素进行解析,得到所述文本要素中记录的目标文本要素的信息,并依据所述目标文本要素的信息确定所述目标文本要素,包括:
确定所述第一解析规则或所述第二解析中所有的规则节点;
针对每个所述规则节点,按照所述规则节点的解析规则,对所述文本要素进行解析,得到所述目标文本要素的标识码;
依据所述目标文本要素的标识码,确定所述目标文本要素。
4.根据权利要求1所述的方法,其特征在于,确定所述目标文本要素之后,还包括:
在每个所述文本要素与所述目标文本要素之间建立有向连接边,得到调用关系图谱,所述调用关系图谱用于指示每个所述文本要素与其他文本要素之间的调用关系。
5.根据权利要求1所述的方法,其特征在于,存储所述多个文本要素之前,还包括:
针对每个所述文本要素,判断所述文本要素对应的文本要素类型是否为目标文本要素类型,如果是所述预设的文本要素类型,则存储所述文本要素;所述目标文本要素类型为预先设定的文本要素类型;
如果不是所述目标文本要素类型,则发送所述文本要素为不符合目标文本要素类型的提示信息,使用户依据所述提示信息将所述第一解析规则置入所述文本要素中,并在接收到置入所述第一解析规则的文本要素后,存储该文本要素。
6.一种确定目标文本要素的装置,其特征在于,包括:
获取单元,用于获取预先存储的多个文本要素;
判断单元,用于针对每个所述文本要素,判断所述文本要素中是否存在预设的第一解析规则;所述第一解析规则被配置在不常见的文本要素中;
解析单元,用于如果所述文本要素中存在所述第一解析规则,则依据所述第一解析规则对所述文本要素进行解析,得到所述文本要素中记录的目标文本要素的信息,并依据所述目标文本要素的信息确定所述目标文本要素,所述目标文本要素为所述文本要素所调用的文本要素;如果所述文本要素中不存在所述第一解析规则,则确定所述文本要素的文本要素类型,从预设的解析规则库,获取与所述文本要素对应的第二解析规则,并依据所述第二解析规则对所述文本要素进行解析,得到所述文本要素中记录的所述目标文本要素的信息,并依据所述目标文本要素的信息确定所述目标文本要素,所述解析规则库用于存储常见的文本要素的解析规则。
7.根据权利要求6所述的装置,其特征在于,所述判断单元,用于针对每个所述文本要素,判断所述文本要素中是否存在预设的第一解析规则,包括:
所述判断单元具体用于,判断所述文本要素中是否存在预设的第一解析规则的解析标识;如果存在,则确定所述文本要素中存在所述第一解析规则。
8.根据权利要求6所述的装置,其特征在于,所述解析单元用于依据所述第一解析规则或第二解析规则对所述文本要素进行解析,得到所述文本要素中记录的目标文本要素的信息,并依据所述目标文本要素的信息确定所述目标文本要素,包括:
所述解析单元具体用于,确定所述第一解析规则或所述第二解析中所有的规则节点;针对每个所述规则节点,按照所述规则节点的解析规则,对所述文本要素进行解析,得到所述目标文本要素的标识码;依据所述目标文本要素的标识码,确定所述目标文本要素。
9.根据权利要求6所述的装置,其特征在于,还包括,连接单元,用于在每个所述文本要素与所述目标文本要素之间建立有向连接边,得到调用关系图谱,所述调用关系图谱用于指示每个所述文本要素与其他文本要素之间的调用关系。
10.根据权利要求6所述的装置,其特征在于,还包括,存储单元,用于:针对每个所述文本要素,判断所述文本要素对应的文本要素类型是否为预设的文本要素类型,如果是所述预设的文本要素类型,则存储所述文本要素;如果不是所述预设的文本要素类型,则发送所述文本要素为不符合预设的文本要素类型的提示信息,使用户依据所述提示信息将所述第一解析规则置入所述文本要素中,并在接收到置入所述第一解析规则的文本要素后,存储该文本要素。
CN201911424034.2A 2019-12-31 2019-12-31 一种确定目标文本要素的方法及装置 Active CN111178044B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911424034.2A CN111178044B (zh) 2019-12-31 2019-12-31 一种确定目标文本要素的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911424034.2A CN111178044B (zh) 2019-12-31 2019-12-31 一种确定目标文本要素的方法及装置

Publications (2)

Publication Number Publication Date
CN111178044A true CN111178044A (zh) 2020-05-19
CN111178044B CN111178044B (zh) 2023-04-18

Family

ID=70657698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911424034.2A Active CN111178044B (zh) 2019-12-31 2019-12-31 一种确定目标文本要素的方法及装置

Country Status (1)

Country Link
CN (1) CN111178044B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6411974B1 (en) * 1998-02-04 2002-06-25 Novell, Inc. Method to collate and extract desired contents from heterogeneous text-data streams
US20080288526A1 (en) * 2007-05-15 2008-11-20 Microsoft Corporation Composition of electronic document layout
US20110173597A1 (en) * 2010-01-12 2011-07-14 Gheorghe Calin Cascaval Execution of dynamic languages via metadata extraction
US20150082151A1 (en) * 2012-05-31 2015-03-19 Uc Mobile Limited Page display method and device
WO2018001041A1 (zh) * 2016-06-27 2018-01-04 中兴通讯股份有限公司 接口实现方法、装置、机顶盒及存储介质
CN108196925A (zh) * 2017-12-29 2018-06-22 山大地纬软件股份有限公司 一种多图标多状态的管理系统及实施方法
CN110147411A (zh) * 2019-05-20 2019-08-20 平安科技(深圳)有限公司 数据同步方法、装置、计算机设备及存储介质
CN110442682A (zh) * 2019-08-09 2019-11-12 科大讯飞(苏州)科技有限公司 一种文本解析方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6411974B1 (en) * 1998-02-04 2002-06-25 Novell, Inc. Method to collate and extract desired contents from heterogeneous text-data streams
US20080288526A1 (en) * 2007-05-15 2008-11-20 Microsoft Corporation Composition of electronic document layout
US20110173597A1 (en) * 2010-01-12 2011-07-14 Gheorghe Calin Cascaval Execution of dynamic languages via metadata extraction
US20150082151A1 (en) * 2012-05-31 2015-03-19 Uc Mobile Limited Page display method and device
WO2018001041A1 (zh) * 2016-06-27 2018-01-04 中兴通讯股份有限公司 接口实现方法、装置、机顶盒及存储介质
CN108196925A (zh) * 2017-12-29 2018-06-22 山大地纬软件股份有限公司 一种多图标多状态的管理系统及实施方法
CN110147411A (zh) * 2019-05-20 2019-08-20 平安科技(深圳)有限公司 数据同步方法、装置、计算机设备及存储介质
CN110442682A (zh) * 2019-08-09 2019-11-12 科大讯飞(苏州)科技有限公司 一种文本解析方法及装置

Also Published As

Publication number Publication date
CN111178044B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN108427731B (zh) 页面代码的处理方法、装置、终端设备及介质
CN110704521A (zh) 接口数据接入方法及系统
CN108038665B (zh) 业务规则管理方法、装置、设备及计算机可读存储介质
CN111225018A (zh) 一种请求报文处理方法、装置和电子设备
CN108415998B (zh) 应用依赖关系更新方法、终端、设备及存储介质
CN106528066B (zh) 一种业务流程运行方法及装置
CN110784358A (zh) 网络调用关系拓扑图的构建方法及装置
CN108650123B (zh) 故障信息记录方法、装置、设备和存储介质
CN107633080B (zh) 一种用户任务处理方法及装置
CN112671878B (zh) 一种区块链的信息订阅方法、装置、服务器和存储介质
CN111178044B (zh) 一种确定目标文本要素的方法及装置
CN112052267B (zh) 一种数据查询方法、设备、服务器及存储介质
CN110008291B (zh) 数据预警方法、装置、存储介质及电子设备
CN113342647A (zh) 一种测试数据的生成方法及装置
CN111190575A (zh) 一种构造接口的方法、系统、介质及设备
CN111158746B (zh) 一种调用关系的获取方法及装置
CN112417324A (zh) 基于Chrome的URL拦截方法、装置及计算机设备
CN111125110A (zh) 非主键字段的检查方法、装置、计算机设备及存储介质
CN114090112B (zh) 配置文件的加载方法和装置、存储介质及电子装置
KR101811728B1 (ko) Dbms 기반의 dds 토픽 저장 방법
CN109063206B (zh) 文章监控方法及装置
CN114610414A (zh) 一种调用整合接口的方法、装置、计算机设备和存储介质
CN112181539A (zh) 文件处理方法、装置、设备及介质
CN115145658A (zh) 应用程序编程接口api的识别方法、装置和电子设备
CN113836088A (zh) 基于深度扫描的文件处理方法、系统、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant