CN115577078A - 一种工程造价审计信息检索方法、系统、设备及存储介质 - Google Patents
一种工程造价审计信息检索方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN115577078A CN115577078A CN202211442729.5A CN202211442729A CN115577078A CN 115577078 A CN115577078 A CN 115577078A CN 202211442729 A CN202211442729 A CN 202211442729A CN 115577078 A CN115577078 A CN 115577078A
- Authority
- CN
- China
- Prior art keywords
- retrieval
- information
- retrieval data
- keywords
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000012550 audit Methods 0.000 title claims abstract description 51
- 238000010276 construction Methods 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims 1
- 238000002372 labelling Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000004566 building material Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及计算机技术领域,具体涉及一种工程造价审计信息检索方法、系统、设备及存储介质,通过获取输入的工程造价信息表,依据工程造价信息表中属性项权重对信息表中每个表格记录的信息依次进行文字识别,得到信息文本;根据预存的关键词数据库对每个表格对应的信息文本进行关键词识别,并根据关键词在检索数据库中检索,得到检索数据集,行相似度对比后得到检索数据列表,提取检索数据列表中检索数据批注于对应的表格中;能够快速的对输入的工程造价信息表中的每个表格项所包含的关键词进行识别,并将检索数据列表批注于每个表格中,便于工程造价审计人员根据批注的检索数据列表直接调用所需的检索数据,操作方便快捷,检索精确且便捷。
Description
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种工程造价审计信息检索方法、系统、设备及存储介质。
背景技术
随着计算机技术的不断发展,各个行业开始大量依赖计算机系统进行线上处理。在每个行业的业务在计算机发展的过程中也在不断被简化,基于计算机系统处理时更加高效便捷。在进行业务处理时,如何高效便捷对计算机应用于各个行业具有重要意义,其是决策支持和前景分析的基础。
计算机在应用时,基于其强大的信息存储功能可以将涉及的业务相关信息进行保存。例如,包括工程造价中建筑材料、装修材料、安装材料、人工工资、施工机械等相关的价格信息、工程造价指数。当工程造价信息达到一定规模后,通常会存在大量相关的信息,不便于信息管理。尤其是在针对工程造价信息检索时,导致信息无法准确检索。
发明内容
有鉴于此,本发明的目的在于提供一种工程造价审计信息检索方法、系统、设备及存储介质,以信息表的方式进行检索并进行检索数据批注保存,无需逐一单元格检索查询,用以解决现有技术中存储的工程造价信息量大导致信息无法准确检索的问题。
为实现上述目的,本发明提供了以下技术方案:
根据本发明的第一方面,提供了一种工程造价审计信息检索方法,该检索方法应用于预先设定属性项和每个属性项权重的信息表中工程造型信息的检索;所述方法包括:
获取输入的工程造价信息表,所述信息表包括多个表格的属性项,每个属性项包含属性项权重;
依据所述属性项权重对所述信息表中每个表格记录的信息依次进行文字识别,得到信息文本;
根据预存的关键词数据库对每个表格对应的信息文本进行关键词识别,并根据关键词在检索数据库中检索,得到检索数据集,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列表;
按照预设检索条数提取检索数据列表中检索数据批注于所述工程造价信息表中的表格中。
作为本发明的进一步方案,所述工程造价信息检索方法,还包括:
根据用户选定的工程造价信息表的表格进行文字识别,得到信息文本;
根据预存的关键词数据库对选定表格对应的信息文本进行关键词识别,根据关键词在检索数据库中检索,得到检索数据。
作为本发明的进一步方案,所述工程造价信息检索方法包括如下步骤:
基于关键词搜索页面获取用户输入的关键词进行检索;
根据获取的关键词在所述检索数据库中检索,得到检索数据集;
基于预先设定属性项区分所述检索数据集的数据类型,并按照特定的数据类型属性划分至信息表的对应表格中;
发送包含检索数据集的信息表到用户,基于表格内的索引列表展开所述表格内的检索数据。
第二方面,提供了一种工程造价审计信息检索系统,该系统包括:
检索信息获取模块,用于获取输入的工程造价信息表,所述信息表包括多个表格的属性项,每个属性项包含属性项权重;
信息文本生成模块,用于依据所述属性项权重对所述信息表中每个表格记录的信息依次进行文字识别,得到信息文本;
关键词检索模块,用于根据预存的关键词数据库对每个表格对应的信息文本进行关键词识别,并根据关键词在检索数据库中检索,得到检索数据集,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列;
检索数据批注模块,用于按照预设检索条数提取检索数据列表中检索数据批注于所述工程造价信息表中的表格中。
第三方面,本发明提供了一种电子设备,包括存储器、处理器及存在处理器上运行的计算机程序,处理器执行程序时实现上述工程造价审计信息检索方法的步骤。
第四方面,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述工程造价审计信息检索方法的步骤。
本发明实施例提供的技术方案可以包括以下有益效果:
本发明所提供的工程造价审计信息检索方法、系统、设备及存储介质,应用于预先设定属性项和每个属性项权重的信息表中工程造型信息的检索。通过获取输入的工程造价信息表,依据工程造价信息表中属性项权重对所述信息表中每个表格记录的信息依次进行文字识别,得到信息文本;根据预存的关键词数据库对每个表格对应的信息文本进行关键词识别,并根据关键词在检索数据库中检索,得到检索数据集,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列表;按照预设检索条数提取检索数据列表中检索数据批注于所述工程造价信息表中的表格中。本发明以信息表的方式进行检索并进行检索数据批注保存,无需逐一单元格检索查询,能够快速的对输入的工程造价信息表中的每个表格项所包含的关键词进行识别,以此进行检索得到检索数据集,按照与表格中的信息文本的相似度进行排序,并将检索数据列表批注于每个表格中,便于工程造价审计人员根据批注的检索数据列表直接调用所需的检索数据,操作方便快捷,检索精确且便捷。
本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例。在附图中:
图1示意性示出本发明示例性实施例中一种工程造价审计信息检索方法的流程图;
图2示意性示出本发明示例性实施例中一种工程造价审计信息检索方法中选定表格进行工程造价信息检索的流程图;
图3示意性示出本发明示例性实施例中一种工程造价审计信息检索方法中得到检索数据集的流程图;
图4示意性示出本发明示例性实施例中一种工程造价审计信息检索方法中按照属性项区分检索结果的流程图;
图5示意性示出本发明示例性实施例中一种工程造价审计信息检索系统的结构框图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面,结合附图以及具体实施方式,对本申请做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
由于当工程造价信息达到一定规模后,通常会存在大量相关的信息,不便于信息管理。尤其是在针对工程造价信息检索时,导致信息无法准确检索。鉴于此,本发明的目的在于提供一种工程造价审计信息检索方法、系统、设备及存储介质,用以解决现有技术中存储的工程造价信息量大导致信息无法准确检索的问题。
在一些实施方式中,工程造价审计信息检索方法、系统、设备及存储介质可以应用在计算机设备,该计算机设备可以是PC、便携计算机、移动终端等具有显示和处理功能的设备,当然也不限于此。
请参照图1,图1为本申请工程造价审计信息检索方法的流程图,本申请的实施例中,该检索方法应用于预先设定属性项和每个属性项权重的信息表中工程造型信息的检索,所述工程造价审计信息检索方法包括以下步骤:
步骤S10、获取输入的工程造价信息表,所述信息表包括多个表格的属性项,每个属性项包含属性项权重;
步骤S20、依据所述属性项权重对所述信息表中每个表格记录的信息依次进行文字识别,得到信息文本;
步骤S30、根据预存的关键词数据库对每个表格对应的信息文本进行关键词识别,并根据关键词在检索数据库中检索,得到检索数据集,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列表;
步骤S40、按照预设检索条数提取检索数据列表中检索数据批注于所述工程造价信息表中的表格中。
在本申请的工程造价审计信息检索方法中,以信息表的方式进行检索并进行检索数据批注保存,无需逐一单元格检索查询,基于工程造价审计信息检索的界面进行工程造价信息表的上传或导入,由设置的检索器或搜索引擎读取工程造价信息表的属性信息。其中,工程造价信息表的属性信息即为所包含的表格的属性项,其中,每个表格的属性项还设置有属性项权重,在本申请的实施例中,属性项权重为该表格在所对应的工程造价信息表中的重要程度,以便在进行读取工程造价信息表内容时按照先后顺序依次进行。
在本申请的实施例中,依据所述属性项权重对所述信息表中每个表格记录的信息依次进行文字识别时,即可以单独对每个表格进行文字识别,也可以结合文字检测和文字识别进行合并表格、并列表格或拆分表格的文字识别,识别结果按照“&”字符或“/”字符的方式进行区分。
在一些实施例中,若表格中插入有图片时,基于OCR进行文字检测,定位图片中的文本区域,将图像信息转换为文字信息,与此同时,基于OCR的第二阶段进行表格内的文本检测,将图像信息对的文字信息进行插入,可识别规则文本识别和不规则文本识别。
在一些的实施例中,参见图2所示,所述工程造价信息检索方法,还包括:
步骤S201、根据用户选定的工程造价信息表的表格进行文字识别,得到信息文本;
步骤S202、根据预存的关键词数据库对选定表格对应的信息文本进行关键词识别,根据关键词在检索数据库中检索,得到检索数据。
在本实施例中,还可以通过用户选定的特定表格进行有针对性识别,并对选定表格进行检索,在基于工程造价信息表全文检索的基础上,划定检索区域,所述用户选定的工程造价信息表的表格时,基于工程造价审计信息检索的界面进行在线框选,以此来选定待检索的区域,操作方便快捷。
在本申请一些的实施例中,根据关键词在检索数据库中检索时,还包括通过用户输入设定的关键字进行检索,获取输入的工程造价信息表的检索数据集。
与基于工程造价信息表全文检索以及在线框选进行特定表格进行有针对性识别不同,用户还可以在不上传或导入表格的基础上,在检索器或搜索引擎中输入关键词的方式进行有针对性的检索,直接获取所需的检索数据集。
在本申请的实施例中,所述预存的关键词数据库为采集工程造价平台的审计资源信息以形成原始资源数据库,对所述原始资源数据库中审计资源信息标注以形成关键词数据库。
在本申请的实施例中,参见图3所示,根据关键词在检索数据库中检索,得到检索数据集,还包括:
步骤S301、获取关键词检索的检索数据集,提取所述检索数据集中若干检索数据对应的原始资源数据库的原始关键词,对所述原始关键词进行清洗得到审计关键词;
步骤S302、将所述审计关键词与每个表格对应的信息文本的关键词进行对比,获取审计关键词相对于所述信息文本的关键词的覆盖率,将覆盖率大于设定覆盖率阈值的检索数据作为检索结果,并按照覆盖率大小进行排序,生成预检索数据列表。
在本申请的实施例中,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列表,还包括:
步骤S303、将信息文本与检索数据集进行相似度对比,根据相似度的大小进行排序,生成相似度数据列表;
步骤S304、将预检索数据列表与相似度数据列表按照权重占比进行加权求和,得到检索数据列表。
本实施例中,通过对获得的检索数据集进行关键词识别,获取检索数据集对应的审计关键词,利用审计关键词相对于信息文本的关键词的覆盖率确定检索数据集与信息文本的接近程度,并将信息文本与检索数据集进行内容上的相似度对比,双重结合方式得到最终的检索数据列表,提高检索结果的准确度,使得检索数据列表按照相关程度进行排列,按照预设检索条数提取检索数据列表中检索数据批注于所述工程造价信息表中的表格中后,保证每个表格的检索数据均为最接近用户或表格内容意向的有效数据。
在本申请的实施例中,参见图4所示,所述工程造价信息检索方法包括如下步骤:
步骤S101、基于关键词搜索页面获取用户输入的关键词进行检索;
步骤S102、根据获取的关键词在所述检索数据库中检索,得到检索数据集;
步骤S103、基于预先设定属性项区分所述检索数据集的数据类型,并按照特定的数据类型属性划分至信息表的对应表格中;
步骤S104、发送包含检索数据集的信息表到用户,基于表格内的索引列表展开所述表格内的检索数据。
在本实施例中,在进行关键词检索时,将检索的结果按照属性项区分,自动将检索数据集进行分类对应到表格中,无需人为对检索数据集中每条检索数据进行划分对应的表格项,将检索数据集以信息表的方式反馈给用户,便于用户展开所述表格内的检索数据,直接调用所需的检索数据即可。
本发明所提供的工程造价审计信息检索方法,应用于预先设定属性项和每个属性项权重的信息表中工程造型信息的检索。通过获取输入的工程造价信息表,依据工程造价信息表中属性项权重对所述信息表中每个表格记录的信息依次进行文字识别,得到信息文本;根据预存的关键词数据库对每个表格对应的信息文本进行关键词识别,并根据关键词在检索数据库中检索,得到检索数据集,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列表;按照预设检索条数提取检索数据列表中检索数据批注于所述工程造价信息表中的表格中。能够快速的对输入的工程造价信息表中的每个表格项所包含的关键词进行识别,以此进行检索得到检索数据集,按照与表格中的信息文本的相似度进行排序,并将检索数据列表批注于每个表格中,便于工程造价审计人员根据批注的检索数据列表直接调用所需的检索数据,操作方便快捷,检索精确且便捷。
请参照图5,图5为本申请工程造价审计信息检索系统的结构示意图。本申请的实施例中,所述工程造价审计信息检索系统,包括检索信息获取模块100、信息文本生成模块200、关键词检索模块300以及检索数据批注模块400。
其中,所述检索信息获取模块100,用于获取输入的工程造价信息表,所述信息表包括多个表格的属性项,每个属性项包含属性项权重;
所述信息文本生成模块200用于依据所述属性项权重对所述信息表中每个表格记录的信息依次进行文字识别,得到信息文本;
所述关键词检索模块300,用于根据预存的关键词数据库对每个表格对应的信息文本进行关键词识别,并根据关键词在检索数据库中检索,得到检索数据集,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列;
所述检索数据批注模块400,用于按照预设检索条数提取检索数据列表中检索数据批注于所述工程造价信息表中的表格中。
由于本发明的示例实施例的工程造价审计信息检索系统的各个功能模块与上述工程造价审计信息检索方法的示例实施例的步骤对应,因此对于本发明装置实施例中未披露的细节,请参照本发明上述的工程造价审计信息检索方法的实施例。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,在本发明的示例性实施例中,还提供了一种能够实现上述工程造价审计信息检索方法的计算机设备。所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“系统”。计算机设备也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该计算机设备交互的设备通信,和/或与使得该计算机设备能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口进行。并且,计算机设备还可以通过网络适配器与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器通过总线603与计算机设备的其它模块通信。应当明白,可以结合计算机设备使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本发明实施例的工程造价信息检索方法,该检索方法应用于预先设定属性项和每个属性项权重的信息表中工程造型信息的检索;所述方法包括:
获取输入的工程造价信息表,所述信息表包括多个表格的属性项,每个属性项包含属性项权重;
依据所述属性项权重对所述信息表中每个表格记录的信息依次进行文字识别,得到信息文本;
根据预存的关键词数据库对每个表格对应的信息文本进行关键词识别,并根据关键词在检索数据库中检索,得到检索数据集,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列表;
按照预设检索条数提取检索数据列表中检索数据批注于所述工程造价信息表中的表格中。
在一些实施例中,所述工程造价信息检索方法,还包括:
根据用户选定的工程造价信息表的表格进行文字识别,得到信息文本;
根据预存的关键词数据库对选定表格对应的信息文本进行关键词识别,根据关键词在检索数据库中检索,得到检索数据。
在一些实施例中,所述工程造价信息检索方法包括如下步骤:
基于关键词搜索页面获取用户输入的关键词进行检索;
根据获取的关键词在所述检索数据库中检索,得到检索数据集;
基于预先设定属性项区分所述检索数据集的数据类型,并按照特定的数据类型属性划分至信息表的对应表格中;
发送包含检索数据集的信息表到用户,基于表格内的索引列表展开所述表格内的检索数据。
在本发明的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例中工程造价信息检索方法,该检索方法应用于预先设定属性项和每个属性项权重的信息表中工程造型信息的检索;所述方法包括:
获取输入的工程造价信息表,所述信息表包括多个表格的属性项,每个属性项包含属性项权重;
依据所述属性项权重对所述信息表中每个表格记录的信息依次进行文字识别,得到信息文本;
根据预存的关键词数据库对每个表格对应的信息文本进行关键词识别,并根据关键词在检索数据库中检索,得到检索数据集,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列表;
按照预设检索条数提取检索数据列表中检索数据批注于所述工程造价信息表中的表格中。
在一些实施例中,所述工程造价信息检索方法,还包括:
根据用户选定的工程造价信息表的表格进行文字识别,得到信息文本;
根据预存的关键词数据库对选定表格对应的信息文本进行关键词识别,根据关键词在检索数据库中检索,得到检索数据。
在一些实施例中,所述工程造价信息检索方法包括如下步骤:
基于关键词搜索页面获取用户输入的关键词进行检索;
根据获取的关键词在所述检索数据库中检索,得到检索数据集;
基于预先设定属性项区分所述检索数据集的数据类型,并按照特定的数据类型属性划分至信息表的对应表格中;
发送包含检索数据集的信息表到用户,基于表格内的索引列表展开所述表格内的检索数据。
在本发明的示例性实施例中,描述了根据本发明的实施例的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本发明所提供的工程造价审计信息检索方法、系统、设备及存储介质,应用于预先设定属性项和每个属性项权重的信息表中工程造型信息的检索。通过获取输入的工程造价信息表,依据工程造价信息表中属性项权重对所述信息表中每个表格记录的信息依次进行文字识别,得到信息文本;根据预存的关键词数据库对每个表格对应的信息文本进行关键词识别,并根据关键词在检索数据库中检索,得到检索数据集,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列表;按照预设检索条数提取检索数据列表中检索数据批注于所述工程造价信息表中的表格中。
本发明以信息表的方式进行检索并进行检索数据批注保存,无需逐一单元格检索查询,能够快速的对输入的工程造价信息表中的每个表格项所包含的关键词进行识别,以此进行检索得到检索数据集,按照与表格中的信息文本的相似度进行排序,并将检索数据列表批注于每个表格中,便于工程造价审计人员根据批注的检索数据列表直接调用所需的检索数据,操作方便快捷,检索精确且便捷。
以上仅为本申请的优选实施例,并非因此限制本申请的保护范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的保护范围内。
Claims (10)
1.一种工程造价审计信息检索方法,其特征在于,该检索方法应用于预先设定属性项和每个属性项权重的信息表中工程造型信息的检索;所述方法包括:
获取输入的工程造价信息表,所述信息表包括多个表格的属性项,每个属性项包含属性项权重;
依据所述属性项权重对所述信息表中每个表格记录的信息依次进行文字识别,得到信息文本;
根据预存的关键词数据库对每个表格对应的信息文本进行关键词识别,并根据关键词在检索数据库中检索,得到检索数据集,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列表;
按照预设检索条数提取检索数据列表中检索数据批注于所述工程造价信息表中的表格中。
2.根据权利要求1所述的工程造价审计信息检索方法,其特征在于,所述工程造价信息检索方法,还包括:
根据用户选定的工程造价信息表的表格进行文字识别,得到信息文本;
根据预存的关键词数据库对选定表格对应的信息文本进行关键词识别,根据关键词在检索数据库中检索,得到检索数据。
3.根据权利要求2所述的工程造价审计信息检索方法,其特征在于,根据关键词在检索数据库中检索时,还包括通过用户输入设定的关键字进行检索,获取输入的工程造价信息表的检索数据集。
4.根据权利要求2所述的工程造价审计信息检索方法,其特征在于,所述预存的关键词数据库为采集工程造价平台的审计资源信息以形成原始资源数据库,对所述原始资源数据库中审计资源信息标注以形成关键词数据库。
5.根据权利要求4所述的工程造价审计信息检索方法,其特征在于,根据关键词在检索数据库中检索,得到检索数据集,还包括:
获取关键词检索的检索数据集,提取所述检索数据集中若干检索数据对应的原始资源数据库的原始关键词,对所述原始关键词进行清洗得到审计关键词;
将所述审计关键词与每个表格对应的信息文本的关键词进行对比,获取审计关键词相对于所述信息文本的关键词的覆盖率,将覆盖率大于设定覆盖率阈值的检索数据作为检索结果,并按照覆盖率大小进行排序,生成预检索数据列表。
6.根据权利要求5所述的工程造价审计信息检索方法,其特征在于,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列表,还包括:
将信息文本与检索数据集进行相似度对比,根据相似度的大小进行排序,生成相似度数据列表;
将预检索数据列表与相似度数据列表按照权重占比进行加权求和,得到检索数据列表。
7.根据权利要求1所述的工程造价审计信息检索方法,其特征在于,所述工程造价信息检索方法包括如下步骤:
基于关键词搜索页面获取用户输入的关键词进行检索;
根据获取的关键词在所述检索数据库中检索,得到检索数据集;
基于预先设定属性项区分所述检索数据集的数据类型,并按照特定的数据类型属性划分至信息表的对应表格中;
发送包含检索数据集的信息表到用户,基于表格内的索引列表展开所述表格内的检索数据。
8.一种工程造价审计信息检索系统,其特征在于,该系统包括:
检索信息获取模块,用于获取输入的工程造价信息表,所述信息表包括多个表格的属性项,每个属性项包含属性项权重;
信息文本生成模块,用于依据所述属性项权重对所述信息表中每个表格记录的信息依次进行文字识别,得到信息文本;
关键词检索模块,用于根据预存的关键词数据库对每个表格对应的信息文本进行关键词识别,并根据关键词在检索数据库中检索,得到检索数据集,基于所述信息文本与对应的所述检索数据集进行相似度对比,得到检索数据列;
检索数据批注模块,用于按照预设检索条数提取检索数据列表中检索数据批注于所述工程造价信息表中的表格中。
9.一种计算机设备,其特征在于,所述计算机设备包括多个计算机设备,各计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述多个计算机设备的处理器执行所述计算机程序时共同实现权利要求1-7任一所述工程造价审计信息检索方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述存储介质存储的所述计算机程序被处理器执行时实现权利要求1-7任一所述工程造价审计信息检索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211442729.5A CN115577078B (zh) | 2022-11-18 | 2022-11-18 | 一种工程造价审计信息检索方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211442729.5A CN115577078B (zh) | 2022-11-18 | 2022-11-18 | 一种工程造价审计信息检索方法、系统、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115577078A true CN115577078A (zh) | 2023-01-06 |
CN115577078B CN115577078B (zh) | 2023-06-02 |
Family
ID=84589799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211442729.5A Active CN115577078B (zh) | 2022-11-18 | 2022-11-18 | 一种工程造价审计信息检索方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115577078B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104881480A (zh) * | 2015-06-03 | 2015-09-02 | 北京科技大学 | 基于数据库的批注方法和装置 |
US20160034569A1 (en) * | 2014-07-30 | 2016-02-04 | Kabushiki Kaisha Toshiba | Search device |
CN110196675A (zh) * | 2019-04-17 | 2019-09-03 | 华为技术有限公司 | 一种添加批注的方法及电子设备 |
US20200410291A1 (en) * | 2018-04-06 | 2020-12-31 | Dropbox, Inc. | Generating searchable text for documents portrayed in a repository of digital images utilizing orientation and text prediction neural networks |
CN112650839A (zh) * | 2021-01-12 | 2021-04-13 | 深圳市鹰硕技术有限公司 | 检索信息优化方法以及装置 |
CN114386119A (zh) * | 2021-01-13 | 2022-04-22 | 万翼科技有限公司 | 车位信息展示方法及其相关产品 |
-
2022
- 2022-11-18 CN CN202211442729.5A patent/CN115577078B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160034569A1 (en) * | 2014-07-30 | 2016-02-04 | Kabushiki Kaisha Toshiba | Search device |
CN104881480A (zh) * | 2015-06-03 | 2015-09-02 | 北京科技大学 | 基于数据库的批注方法和装置 |
US20200410291A1 (en) * | 2018-04-06 | 2020-12-31 | Dropbox, Inc. | Generating searchable text for documents portrayed in a repository of digital images utilizing orientation and text prediction neural networks |
CN110196675A (zh) * | 2019-04-17 | 2019-09-03 | 华为技术有限公司 | 一种添加批注的方法及电子设备 |
CN112650839A (zh) * | 2021-01-12 | 2021-04-13 | 深圳市鹰硕技术有限公司 | 检索信息优化方法以及装置 |
CN114386119A (zh) * | 2021-01-13 | 2022-04-22 | 万翼科技有限公司 | 车位信息展示方法及其相关产品 |
Non-Patent Citations (2)
Title |
---|
CHUFAN LAI 等: "Automatic Annotation Synchronizing with Textual Description for Visualization", 《CHI \'20: PROCEEDINGS OF THE 2020 CHI CONFERENCE ON HUMAN FACTORS IN COMPUTING SYSTEMS》, pages 1 - 13 * |
蒋红星: "社会化批注的研究与实践", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 11, pages 139 - 204 * |
Also Published As
Publication number | Publication date |
---|---|
CN115577078B (zh) | 2023-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107256267B (zh) | 查询方法和装置 | |
US10146862B2 (en) | Context-based metadata generation and automatic annotation of electronic media in a computer network | |
US9208219B2 (en) | Similar document detection and electronic discovery | |
US9626622B2 (en) | Training a question/answer system using answer keys based on forum content | |
US20120203584A1 (en) | System and method for identifying potential customers | |
CN110647614A (zh) | 智能问答方法、装置、介质及电子设备 | |
CN107436875A (zh) | 文本分类方法及装置 | |
CN107085583B (zh) | 一种基于内容的电子文档管理方法及装置 | |
US20160314122A1 (en) | Identifying experts and areas of expertise in an organization | |
CN114722137A (zh) | 基于敏感数据识别的安全策略配置方法、装置及电子设备 | |
CN111475725A (zh) | 用于搜索内容的方法、装置、设备和计算机可读存储介质 | |
CN110941702A (zh) | 一种法律法规和法条的检索方法及装置、可读存储介质 | |
CN111553556A (zh) | 业务数据分析方法、装置、计算机设备及存储介质 | |
CN113190687A (zh) | 知识图谱的确定方法、装置、计算机设备及存储介质 | |
CN109902152B (zh) | 用于检索信息的方法和装置 | |
CN116049379A (zh) | 知识推荐方法、装置、电子设备和存储介质 | |
CN112417996B (zh) | 工业图纸的信息处理方法、装置、电子设备和存储介质 | |
KR20160120583A (ko) | 지식 관리 시스템 및 이의 지식 구조 기반의 자료 관리 방법 | |
CN112214615A (zh) | 基于知识图谱的政策文件处理方法、装置和存储介质 | |
CN116541578A (zh) | 资产数字化多维度管理方法及系统 | |
CN114742062B (zh) | 文本关键词提取处理方法及系统 | |
CN114780712B (zh) | 一种基于质量评价的新闻专题生成方法及装置 | |
CN104240107A (zh) | 社群数据筛选系统及其方法 | |
Eken et al. | Predicting defects with latent and semantic features from commit logs in an industrial setting | |
CN115617980A (zh) | 一种诉讼案例检索报告生成方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |