CN115543927A - 造价文件的字段信息提取方法及装置、设备、存储介质 - Google Patents
造价文件的字段信息提取方法及装置、设备、存储介质 Download PDFInfo
- Publication number
- CN115543927A CN115543927A CN202211347471.0A CN202211347471A CN115543927A CN 115543927 A CN115543927 A CN 115543927A CN 202211347471 A CN202211347471 A CN 202211347471A CN 115543927 A CN115543927 A CN 115543927A
- Authority
- CN
- China
- Prior art keywords
- information
- node
- query
- field information
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明提供了造价文件的字段信息提取方法及装置、设备、存储介质,该方法包括:获取目标字段信息的节点查询条件和属性查询条件;根据节点查询条件对造价文件的字段信息进行节点路径查询,得到符合节点查询条件的目标节点路径;根据属性查询条件对目标节点路径的多个属性信息进行筛选,将符合属性查询条件的属性信息进行提取,得到目标字段信息。本发明不需要对代码进行改动,避免了现有技术中需要反复修改代码、编写大量的字段提取代码以及可能出现代码遗漏等问题,同时提高了字段信息的提取效率。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种造价文件的字段信息提取方法及装置、设备、存储介质。
背景技术
工程项目建设一般分为决策阶段、设计阶段、施工阶段和营运阶段,每个阶段的每个环节都有对应的造价文件用于记录投资控制和造价管理。
现有技术中,为了对工程项目进行投资控制和造价管理,对造价文件进行字段信息提取时,通常采用硬编码和固定的可扩充标记语言的路径节点识别进行解析提取。但每当需要多提取一个字段信息时,就需要对代码进行改动,重新确定字段信息提取逻辑,导致对造价文件进行字段信息提取时存在开发成本高、提取效率低的问题。
针对上述相关技术中对造价文件进行字段信息提取存在开发成本高、提取效率低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种造价文件的字段信息提取方法及装置、设备、存储介质,用以克服相关技术中对造价文件进行字段信息提取存在开发成本高、提取效率低的问题。
为了实现上述目的,本发明实施例的第一方面,提供一种造价文件的字段信息提取方法,包括:
获取目标字段信息的节点查询条件和属性查询条件;
根据所述节点查询条件对造价文件的字段信息进行节点路径查询,得到符合节点查询条件的目标节点路径;
根据所述属性查询条件对所述目标节点路径的多个属性信息进行筛选,将符合属性查询条件的属性信息进行提取,得到所述目标字段信息。
本发明提供的造价文件的字段信息提取方法,通过节点查询条件对造价文件中的节点路径查询得到目标节点路径,以及通过属性查询条件从目标节点路径的属性信息中提取出目标字段信息,不需要对代码进行改动,避免了现有技术中需要反复修改代码、编写大量的字段提取代码以及可能出现代码遗漏等问题,同时提高了字段信息的提取效率。
可选地,在第一方面的一种可能实现方式中,所述属性信息包括数值信息和类型信息;所述将符合属性查询条件的属性信息进行提取,得到所述目标字段信息,包括:
若筛选得到的属性信息为数值信息时,则根据所述数值信息的预设映射关系对所述数值信息进行替换,得到类型信息,以作为目标字段信息;其中所述预设映射关系用于表示数值信息与类型信息的关系。
本发明提供的造价文件的字段信息提取方法,通过数值信息的预设映射关系对所述数值信息进行替换得到类型信息作为目标字段信息,能够灵活应对造价文件中的所有字段信息,以适配多种字段信息的提取,提高了字段信息的提取效率,也同时简化了代码量。
可选地,在第一方面的一种可能实现方式中,所述根据所述节点查询条件对造价文件的字段信息进行节点路径查询,包括:
判断造价文件的文件格式;
若所述造价文件为第一预设后缀格式的数据文件,则根据所述节点查询条件对造价文件的字段信息进行节点路径查询;
若所述造价文件为第二预设后缀格式的数据文件,则对所述造价文件进行重命名和解压处理,并根据所述节点查询条件对处理后的造价文件的字段信息进行节点路径查询。
本发明提供的造价文件的字段信息提取方法,能够应对不同后缀格式的造价文件进行字段信息的提取,其适用范围广,用户体验较佳。
可选地,在第一方面的一种可能实现方式中,所述根据所述节点查询条件对造价文件的字段信息进行节点路径查询,得到符合节点查询条件的目标节点路径,包括:
当所述节点查询条件包括一级节点查询信息时,则将所述造价文件的字段信息中与所述一级节点查询信息对应的节点路径作为目标节点路径;
当所述节点查询条件包括多级节点查询信息时,则根据所述多级节点查询信息对所述造价文件的字段信息进行逐级节点查询,直至确定出与最后一级的节点查询信息对应的节点路径,以查询得到的所有节点路径作为目标节点路径。
本发明提供的造价文件的字段信息提取方法,通过设置一级节点查询信息和多级查询信息用于目标节点路径的查询,能够明确目标字段信息的所处节点(即最后一级的节点),以及目标节点路径所包含的各个节点,有助于提高字段信息的提取效率,以及提取准确率。
可选地,在第一方面的一种可能实现方式中,所述根据所述多级节点查询信息对所述造价文件的字段信息进行逐级节点查询,包括:
当根据所述多级节点查询信息的任一级节点查询信息在所述造价文件的字段信息中查询出多个同级的相同节点路径时,根据与当前级的节点查询信息对应的附属筛选条件对所述查询出多个同级的相同节点路径进行筛选,得到当前级的目标节点路径。
本发明提供的造价文件的字段信息提取方法,通过设置附属筛选条件,能够从多个同级的相同节点路径中筛选得到当前级的目标节点路径,有助于提高每一级目标节点选择的准确性,继而提高得到符合节点查询条件的目标节点路径(目标节点路径由每一级目标节点构成)的准确性,从而达到提高字段信息提取准确性的目的。
可选地,在第一方面的一种可能实现方式中,所述得到当前级的目标节点路径之后,还包括:
根据所述当前级的目标节点路径和多级节点查询信息的剩余级的节点查询信息进行后续逐级节点查询,直至确定出与最后一级的节点查询信息对应的节点路径,作为目标节点路径。
可选地,在第一方面的一种可能实现方式中,
所述节点查询条件包括:项目信息、单项工程信息、单位工程信息及分部分项工程信息;
所述属性查询条件包括:项目信息的项目总造价、地区类别及工程类型,单项工程信息的金额、规模单位、建设规模及占整个项目费用比率,单位工程信息的金额、规模单位、建设规模、占整个项目费用比率及计价类型,分部分项工程信息的编码、特征、单位、工程量、金额及指标。
本发明实施例的第二方面,提供一种造价文件的字段信息提取装置,包括:
查询条件获取模块,用于获取目标字段信息的节点查询条件和属性查询条件;
节点查询模块,用于根据所述节点查询条件对造价文件的字段信息进行节点路径查询,得到符合节点查询条件的目标节点路径;
字段信息提取模块,用于根据所述属性查询条件对所述目标节点路径的多个属性信息进行筛选,将符合属性查询条件的属性信息进行提取,得到所述目标字段信息。
本发明实施例的第三方面,提供一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述各个方法实施例中的步骤。
本发明实施例的第四方面,提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现本发明第一方面及第一方面各种可能设计的所述方法的步骤。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1的字段信息提取方法的流程示意图。
图2为本发明至少一个实施例中的目标节点路径的示意图。
图3为有关项目信息的目标节点路径和属性信息的示意图。
图4为有关单项工程信息的目标节点路径和属性信息的示意图。
图5为有关单位工程信息的目标节点路径和属性信息的示意图。
图6为有关分部分项工程信息的目标节点路径和属性信息的示意图。
图7为本发明实施例2的造价文件的字段信息提取装置的原理框图。
图8为本发明实施例3中计算机设备的结构图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
本实施例提供一种字段信息提取方法,如图1所示,该字段信息提取方法包括如下步骤但不限于步骤S1至步骤S3。
S1:获取目标字段信息的节点查询条件和属性查询条件。
可选地,本发明至少一个实施例中的节点查询条件包括:项目信息、单项工程信息、单位工程信息及分部分项工程信息;属性查询条件包括:项目信息的项目总造价、地区类别及工程类型,单项工程信息的金额、规模单位、建设规模及占整个项目费用比率,单位工程信息的金额、规模单位、建设规模、占整个项目费用比率及计价类型,分部分项工程信息的编码、特征、单位、工程量、金额及指标。
本发明提供的造价文件的字段信息提取方法,在用户为了对工程项目进行投资管理和造价管理,对造价文件进行指定字段信息提取,以及多个字段信息提取时,只需要输入节点查询条件和属性查询条件即可实现对用户想要提取的目标字段信息的快速准确查询,不需要对代码进行改动以及重新确定目标字段的提取逻辑,具有开发成本低和字段提取效率高的技术效果。
S2:根据节点查询条件对造价文件的字段信息进行节点路径查询,得到符合节点查询条件的目标节点路径。
优选地,在对造价文件的字段信息进行节点路径查询之前,需要判断上传的造价文件的文件格式,若造价文件为第一预设后缀格式的数据文件,则根据节点查询条件对造价文件的字段信息进行节点路径查询;若造价文件为第二预设后缀格式的数据文件,则对造价文件进行重命名和解压处理,并根据节点查询条件对重命名和解压处理后的造价文件的字段信息进行节点路径查询;其中第一预设后缀格式可以为可扩展标记语言后缀格式,即xml文件后缀格式;第二预设后缀格式可以为cos文件后缀格式。
本发明提供的造价文件的字段信息提取方法,能够应对不同后缀格式的造价文件进行字段信息的提取,其适用范围广,用户体验较佳。
优选地,在根据节点查询条件对造价文件的字段信息进行节点路径查询,得到符合节点查询条件的目标节点路径的过程中,还包括如下步骤:
S2.1:当节点查询条件包括一级节点查询信息时,则将造价文件的字段信息中与一级节点查询信息对应的节点路径作为目标节点路径。
S2.2:当节点查询条件包括多级节点查询信息时,则根据多级节点查询信息对造价文件的字段信息进行逐级节点查询,直至确定出与最后一级的节点查询信息对应的节点路径,以查询得到的所有节点路径作为目标节点路径。
具体地,对于节点查询条件的选择,即是选择一级节点查询信息还是选择多级节点查询信息,这取决于用户想要查询的字段信息。例如:当想要知道某个项目的工程类型有哪些,建设规模有多大,以及该项目的总造价有多少时,用户只需要在节点查询条件中选择一级节点查询信息,即项目信息(例如可通过Projects表示),其对应的节点路径Projects则作为目标节点路径。而当用户想要知道某个分部分项工程的编码、工程量、特征以及金额时,则需要在节点查询条件中选择多级节点查询信息,即项目信息Projects、单项工程信息(例如可通过ProjectGroup表示)和单位工程信息(例如可通过ProjectItem表示),分部分项工程信息(例如可通过BillTable表示),其对应的目标节点路径例如可以对应为Projects-ProjectGroup-ProjectItem-BillTable,如图2所示。
本发明提供的造价文件的字段信息提取方法,通过设置一级节点查询信息和多级查询信息用于目标节点路径的查询,能够明确目标字段信息的所处节点(即最后一级的节点),以及目标节点路径所包含的各个节点,有助于提高字段信息的提取效率,以及提取准确率。
优选地,根据多级节点查询信息对造价文件的字段信息进行逐级节点查询,包括:
S2.2.1:当根据多级节点查询信息的任一级节点查询信息在造价文件的字段信息中查询出多个同级的相同节点路径时,根据与当前级的节点查询信息对应的附属筛选条件对查询出多个同级的相同节点路径进行筛选,得到当前级的目标节点路径。
举例对上述步骤S2.2.1进行说明:预先选择的多级节点查询信息可以为项目信息(例如“广大附中实验学校建设项目”)-单项工程信息(例如“广大附中-土建装饰工程”)-单位工程信息(例如“教学楼”)-分部分项工程信息,在根据上述多级节点查询信息实际进行逐级节点查询时可能得到多个同级的相同节点路径,即节点路径1:广大附中实验学校建设项目”-“广大附中-土建装饰工程”-“教学楼1”;节点路径2:广大附中实验学校建设项目”-“广大附中-土建装饰工程”-“教学楼2”;节点路径3:“广大附中实验学校建设项目”-“广大附中-土建装饰工程”-“教学楼3”,则需要再对当前级的节点查询信息(教学楼)设置对应的附属筛选条件(教学楼3),从而对多个同级的相同节点路径进行筛选,得到当前级的目标节点路径,即节点路径3。
具体地,对于上述步骤S2.2.1还可以理解为:当根据多级节点查询信息的任一级节点查询信息在造价文件的字段信息中查询出多个同级的相同节点时,根据与当前级的节点查询信息对应的附属筛选条件对查询出多个同级的相同节点进行筛选,得到当前级的目标节点;然后通过每一级的目标节点构成符合节点查询条件的目标节点路径。
本发明提供的造价文件的字段信息提取方法,通过设置附属筛选条件,能够从多个同级的相同节点路径中筛选得到当前级的目标节点路径,有助于提高每一级目标节点选择的准确性,继而提高得到符合节点查询条件的目标节点路径(目标节点路径由每一级目标节点构成)的准确性,从而达到提高字段信息提取准确性的目的。
优选地,得到当前级的目标节点路径之后,还包括:
S2.2.2:根据当前级的目标节点路径和多级节点查询信息的剩余级的节点查询信息进行后续逐级节点查询,直至确定出与最后一级的节点查询信息对应的节点路径,作为目标节点路径。
具体地,以上述步骤S2.2.1的示例对步骤S2.2.2进行说明:对当前级的节点查询信息(教学楼)设置对应的附属筛选条件(教学楼3),从而对多个同级的相同节点路径进行筛选,得到当前级的目标节点路径,即节点路径3:“广大附中实验学校建设项目”-“广大附中-土建装饰工程”-“教学楼3”后,需要根据多级节点查询信息的剩余级的节点查询信息(即分部分项工程信息)进行后续逐级节点查询,直至确定出与最后一级的节点查询信息(即分项工程信息)对应的节点路径,作为目标节点路径(即“广大附中实验学校建设项目”-“广大附中-土建装饰工程”-“教学楼3”-分部分项工程信息)。如果后续逐级节点查询过程中,存在多个同级的相同节点路径时,则采取上述S2.2.1步骤对进行多个同级的相同节点路径进行筛选。
S3:根据属性查询条件对目标节点路径的多个属性信息进行筛选,将符合属性查询条件的属性信息进行提取,得到目标字段信息。
具体地,目标节点路径以及目标节点路径的属性信息取决于最后一级的节点查询信息,当最后一级的节点查询信息为某个项目,则目标节点路径(即读取路径)为项目信息(Projects),目标节点路径的属性信息可以为该项目信息的经济指标、地区类别、工程类型和建设单元等,具体如图3所示;当最后一级的节点查询信息为某个单项工程信息,则目标节点路径(即读取路径)为项目信息-单项工程信息(Projects-ProjectGroup),目标节点路径的属性信息可以为该单项工程信息的金额、规模单位、建设规模及占整个项目费用比率,具体如图4所示;当最后一级的节点查询信息为某个单位工程信息,则目标节点路径(即读取路径)为项目信息-单项工程信息-单位工程信息(Projects-ProjectGroup-ProjectItem),目标节点路径的属性信息可以为该单位工程信息的金额、专业、规模单位、建设规模及占整个项目费用比率,具体如图5所示;当最后一级的节点查询信息为某个分部分项工程信息,则目标节点路径为项目信息-单项工程信息-单位工程信息-分部分项工程信息,目标节点路径的属性信息可以为分部分项工程信息的编码、特征、单位、工程量、金额及指标,具体如图6所示。
优选地,属性信息包括数值信息和类型信息;将符合属性查询条件的属性信息进行提取,得到目标字段信息,包括:若筛选得到的属性信息为数值信息时,则根据数值信息的预设映射关系对数值信息进行替换,得到类型信息,以作为目标字段信息;其中预设映射关系用于表示数值信息与类型信息的关系。
具体地,属性信息中的数值信息可以理解为1、2、3等等无实际意义的自然数,属性信息中的类型信息可以理解为有实际意义的数字、文字、符号等。预设映射关系可以理解为数值信息与类型信息的指代关系,例如1-房屋建筑与装饰、2-单独装饰、3-安装。
具体地,当根据属性查询条件(例如工程类型)对目标节点路径(例如项目信息-单项工程信息-单位工程信息)的多个属性信息进行筛选,将符合属性查询条件的属性信息进行提取得到数值信息1,则根据数值信息1所对应的预设映射关系(1-房屋工程)对数值信息进行替换,将“房屋工程”作为目标字段信息输出。
本发明提供的造价文件的字段信息提取方法,通过数值信息的预设映射关系对数值信息进行替换得到类型信息作为目标字段信息,能够灵活应对造价文件中的所有字段信息,以适配多种字段信息的提取,提高了字段信息的提取效率,也同时简化了代码量。
实施例2
本施例提供一种造价文件的字段信息提取装置,如图7所示,包括:
查询条件获取模块,用于获取目标字段信息的节点查询条件和属性查询条件;
节点查询模块,用于根据节点查询条件对造价文件的字段信息进行节点路径查询,得到符合节点查询条件的目标节点路径;
字段信息提取模块,用于根据属性查询条件对目标节点路径的多个属性信息进行筛选,将符合属性查询条件的属性信息进行提取,得到目标字段信息。
优选地,属性信息包括数值信息和类型信息;字段信息提取模块,包括:
替换单元,用于若筛选得到的属性信息为数值信息时,则根据数值信息的预设映射关系对数值信息进行替换,得到类型信息,以作为目标字段信息;其中预设映射关系用于表示数值信息与类型信息的关系。
优选地,节点查询模块,包括:
判断单元,用于判断造价文件的文件格式;
第一节点路径查询单元,用于若造价文件为第一预设后缀格式的数据文件,则根据节点查询条件对造价文件的字段信息进行节点路径查询;
第二节点路径查询单元,用于若造价文件为第二预设后缀格式的数据文件,则对造价文件进行重命名和解压处理,并根据节点查询条件对处理后的造价文件的字段信息进行节点路径查询。
优选地,节点查询模块,包括:
一级节点查询单元,用于当节点查询条件包括一级节点查询信息时,则将造价文件的字段信息中与一级节点查询信息对应的节点路径作为目标节点路径;
多级节点查询单元,用于当节点查询条件包括多级节点查询信息时,则根据多级节点查询信息对造价文件的字段信息进行逐级节点查询,直至确定出与最后一级的节点查询信息对应的节点路径,以查询得到的所有节点路径作为目标节点路径。
优选地,多级节点查询单元,用于当根据多级节点查询信息的任一级节点查询信息在造价文件的字段信息中查询出多个同级的相同节点路径时,根据与当前级的节点查询信息对应的附属筛选条件对查询出多个同级的相同节点路径进行筛选,得到当前级的目标节点路径。
优选地,多级节点查询单元,还用于根据当前级的目标节点路径和多级节点查询信息的剩余级的节点查询信息进行后续逐级节点查询,直至确定出与最后一级的节点查询信息对应的节点路径,作为目标节点路径。
优选地,节点查询条件包括:项目信息、单项工程信息、单位工程信息及分部分项工程信息;属性查询条件包括:项目信息的项目总造价、地区类别及工程类型,单项工程信息的金额、规模单位、建设规模及占整个项目费用比率,单位工程信息的金额、规模单位、建设规模、占整个项目费用比率及计价类型,分部分项工程信息的编码、特征、单位、工程量、金额及指标。
实施例3
本发明还提供一种计算机设备,如图8所示,包括存储器和处理器,存储器存储有可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的各种实施方式提供的造价文件的字段信息提取方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的各种实施方式提供的造价文件的字段信息提取方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (10)
1.一种造价文件的字段信息提取方法,其特征在于,包括:
获取目标字段信息的节点查询条件和属性查询条件;
根据所述节点查询条件对造价文件的字段信息进行节点路径查询,得到符合节点查询条件的目标节点路径;
根据所述属性查询条件对所述目标节点路径的多个属性信息进行筛选,将符合属性查询条件的属性信息进行提取,得到所述目标字段信息。
2.根据权利要求1所述的造价文件的字段信息提取方法,其特征在于,所述属性信息包括数值信息和类型信息;所述将符合属性查询条件的属性信息进行提取,得到所述目标字段信息,包括:
若筛选得到的属性信息为数值信息,则根据预设映射关系对所述数值信息进行替换,得到目标信息,以作为目标字段信息;
其中,所述预设映射关系用于表示数值信息与目标信息的关系;所述目标信息为所述类型信息,或者所述数值信息与所述类型信息的组合。
3.根据权利要求1或2所述的造价文件的字段信息提取方法,其特征在于,所述根据所述节点查询条件对造价文件的字段信息进行节点路径查询,包括:
判断造价文件的文件格式;
若所述造价文件为第一预设后缀格式的数据文件,则根据所述节点查询条件对造价文件的字段信息进行节点路径查询;
若所述造价文件为第二预设后缀格式的数据文件,则对所述造价文件进行重命名和解压处理,并根据所述节点查询条件对处理后的造价文件的字段信息进行节点路径查询。
4.根据权利要求1或2所述的造价文件的字段信息提取方法,其特征在于,所述根据所述节点查询条件对造价文件的字段信息进行节点路径查询,得到符合节点查询条件的目标节点路径,包括:
当所述节点查询条件包括一级节点查询信息时,则将所述造价文件的字段信息中与所述一级节点查询信息对应的节点路径作为目标节点路径;
当所述节点查询条件包括多级节点查询信息时,则根据所述多级节点查询信息对所述造价文件的字段信息进行逐级节点查询,直至确定出与最后一级的节点查询信息对应的节点路径,以查询得到的所有节点路径作为目标节点路径。
5.根据权利要求4所述的造价文件的字段信息提取方法,其特征在于,
所述根据所述多级节点查询信息对所述造价文件的字段信息进行逐级节点查询,包括:
当根据所述多级节点查询信息的任一级节点查询信息在所述造价文件的字段信息中查询出多个同级的相同节点路径时,根据与当前级的节点查询信息对应的附属筛选条件对所述查询出多个同级的相同节点路径进行筛选,得到当前级的目标节点路径。
6.根据权利要求5所述的造价文件的字段信息提取方法,其特征在于,所述得到当前级的目标节点路径之后,还包括:
根据所述当前级的目标节点路径和多级节点查询信息的剩余级的节点查询信息进行后续逐级节点查询,直至确定出与最后一级的节点查询信息对应的节点路径,作为目标节点路径。
7.根据权利要求1所述的造价文件的字段信息提取方法,其特征在于,
所述节点查询条件包括:项目信息、单项工程信息、单位工程信息及分部分项工程信息;
所述属性查询条件包括:项目信息的项目总造价、地区类别及工程类型,单项工程信息的金额、规模单位、建设规模及占整个项目费用比率,单位工程信息的金额、规模单位、建设规模、占整个项目费用比率及计价类型,分部分项工程信息的编码、特征、单位、工程量、金额及指标。
8.一种造价文件的字段信息提取装置,其特征在于,包括:
查询条件获取模块,用于获取目标字段信息的节点查询条件和属性查询条件;
节点查询模块,用于根据所述节点查询条件对造价文件的字段信息进行节点路径查询,得到符合节点查询条件的目标节点路径;
字段信息提取模块,用于根据所述属性查询条件对所述目标节点路径的多个属性信息进行筛选,将符合属性查询条件的属性信息进行提取,得到所述目标字段信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的造价文件的字段信息提取方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的造价文件的字段信息提取方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211347471.0A CN115543927B (zh) | 2022-10-31 | 2022-10-31 | 造价文件的字段信息提取方法及装置、设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211347471.0A CN115543927B (zh) | 2022-10-31 | 2022-10-31 | 造价文件的字段信息提取方法及装置、设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115543927A true CN115543927A (zh) | 2022-12-30 |
CN115543927B CN115543927B (zh) | 2023-06-30 |
Family
ID=84719409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211347471.0A Active CN115543927B (zh) | 2022-10-31 | 2022-10-31 | 造价文件的字段信息提取方法及装置、设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115543927B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116680444A (zh) * | 2023-08-03 | 2023-09-01 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080306910A1 (en) * | 2007-06-08 | 2008-12-11 | Hardeep Singh | Method and process for end users to query hierarchical data |
CN104516813A (zh) * | 2013-09-26 | 2015-04-15 | 腾讯科技(北京)有限公司 | 网络页面的测试节点的选取方法和装置 |
CN113515544A (zh) * | 2021-06-23 | 2021-10-19 | 金蝶软件(中国)有限公司 | 一种数据属性查询方法及数据属性查询装置 |
CN113779029A (zh) * | 2021-09-06 | 2021-12-10 | 中国银行股份有限公司 | 一种数据查询的方法及装置 |
-
2022
- 2022-10-31 CN CN202211347471.0A patent/CN115543927B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080306910A1 (en) * | 2007-06-08 | 2008-12-11 | Hardeep Singh | Method and process for end users to query hierarchical data |
CN104516813A (zh) * | 2013-09-26 | 2015-04-15 | 腾讯科技(北京)有限公司 | 网络页面的测试节点的选取方法和装置 |
CN113515544A (zh) * | 2021-06-23 | 2021-10-19 | 金蝶软件(中国)有限公司 | 一种数据属性查询方法及数据属性查询装置 |
CN113779029A (zh) * | 2021-09-06 | 2021-12-10 | 中国银行股份有限公司 | 一种数据查询的方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116680444A (zh) * | 2023-08-03 | 2023-09-01 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备及存储介质 |
CN116680444B (zh) * | 2023-08-03 | 2024-01-19 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115543927B (zh) | 2023-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738027B (zh) | 生成电子表格公式的计算机实现的方法、设备和存储介质 | |
US8788509B2 (en) | Method and device for coding a hierarchized document | |
CN115543927A (zh) | 造价文件的字段信息提取方法及装置、设备、存储介质 | |
US20200326694A1 (en) | Apparatus, method, and program | |
JP2007164591A (ja) | 財務情報の分析支援方法及びシステム | |
CN110955661A (zh) | 数据融合方法、装置、可读存储介质及电子设备 | |
CN109697279A (zh) | 一种a2l变量地址处理方法和装置 | |
CN110489131B (zh) | 一种灰度用户选取方法及装置 | |
EP3418889A1 (en) | Software analysis apparatus and software analysis method | |
KR20070099689A (ko) | 데이터베이스 관리 장치 및 데이터베이스 관리 방법 | |
CN104636471A (zh) | 一种程序代码的查找方法及装置 | |
CN116304189A (zh) | 一种excel文件中图像提取方法和电子设备 | |
CN110531968B (zh) | 一种自动抽离web前端功能代码生成独立模板的方法 | |
CN113001538B (zh) | 一种命令解析方法及系统 | |
US10515051B2 (en) | Data analysis supporting apparatus | |
CN113641523A (zh) | 一种日志处理方法及装置 | |
CN112434650A (zh) | 一种多光谱图像建筑物变化检测方法及系统 | |
CN111124471A (zh) | 基于数据类型模板的仿真模型注册方法及计算机存储介质 | |
CN115544985B (zh) | 基于地理计算语言的统计图制作方法、装置、设备及介质 | |
CN111399830A (zh) | 一种应用程序容量监控方法、装置、电子设备及存储介质 | |
CN113609279B (zh) | 一种物料型号提取方法、装置及计算机设备 | |
CN112560344B (zh) | 一种构建模型伺服系统的方法和装置 | |
WO2017085921A1 (ja) | ログ分析システム、方法およびプログラム | |
CN109905475B (zh) | 一种基于sql以规定格式输出云计算监控数据的方法 | |
CN114090721B (zh) | 基于自然语言数据进行查询、数据更新的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |