CN114707507B - 一种基于人工智能算法的清单信息检测方法及装置 - Google Patents

一种基于人工智能算法的清单信息检测方法及装置 Download PDF

Info

Publication number
CN114707507B
CN114707507B CN202210340901.XA CN202210340901A CN114707507B CN 114707507 B CN114707507 B CN 114707507B CN 202210340901 A CN202210340901 A CN 202210340901A CN 114707507 B CN114707507 B CN 114707507B
Authority
CN
China
Prior art keywords
word
list
phrase
different
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210340901.XA
Other languages
English (en)
Other versions
CN114707507A (zh
Inventor
周舜英
张雪贞
林玉茹
董礼伟
丁洁
赖铭华
庄承荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yongdao Engineering Consulting Co ltd
Original Assignee
Yongdao Engineering Consulting Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yongdao Engineering Consulting Co ltd filed Critical Yongdao Engineering Consulting Co ltd
Priority to CN202210340901.XA priority Critical patent/CN114707507B/zh
Publication of CN114707507A publication Critical patent/CN114707507A/zh
Application granted granted Critical
Publication of CN114707507B publication Critical patent/CN114707507B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于人工智能算法的清单信息检测方法及装置,所述方法包括:通过人工智能算法调用清单材料库的清单信息建立若干个不同的词库,每个词库对应一种词性;获取待质检清单,并对所述待质检清单进行分词,得到若干个分词词组;调用所述若干个不同的词库对每个所述分词词组进行逻辑匹配,得到若干个匹配结果;若所述若干个匹配结果均为相同时,则确定所述待质检清单检测通过;若有至少一个匹配结果为不相同时,则确定所述待质检清单检测不通过。可以利用人工智能算法构建不同词性的词库,利用多个不同的词库对清单内的信息进行不同逻辑的质检,以缩短质检时间,提高质检效率和准确率。

Description

一种基于人工智能算法的清单信息检测方法及装置
背景技术
随着经济的发展,各种各样的工程项目也逐渐增多。在工程项目上,为了保证造价文件的准确性,需要对工程的各种造价文件或清单文件实行多阶段的审核、复核,对编制的造价文件的各类信息进行检查,保证造价文件的数据质量。
传统的检测方式是人工重复质检,通过多个质检人员对清单中各项编制内容的核对,各级复核人、项目负责人等需一一审核造价文件,再通过相应软件打开待审核的造价文件查阅或者导出造价文件报表,核对各检查项是否正确。
但上述质检的方法有如下技术问题:人工质检需要聘请多位质检人员,质检成本高,且审核的工作量巨大,重复性工作多,不但需花费大量的时间和精力,还容易遗漏问题,无法保证准确性,效率低下。
发明内容
本发明提出一种基于人工智能算法的清单信息检测方法及装置,所述方法可以利用人工智能算法构建不同词性的词库,利用多个不同的词库对清单内的信息进行不同逻辑的质检,以缩短质检时间,提高质检效率和准确率。
本发明实施例的第一方面提供了一种基于人工智能算法的清单信息检测方法,所述方法包括:
通过人工智能算法调用清单材料库的清单信息建立若干个不同的词库,每个词库对应一种词性;
获取待质检清单,并对所述待质检清单进行分词,得到若干个分词词组;
调用所述若干个不同的词库对每个所述分词词组进行逻辑匹配,得到若干个匹配结果;
若所述若干个匹配结果均为相同时,则确定所述待质检清单检测通过;
若有至少一个匹配结果为不相同时,则确定所述待质检清单检测不通过。
在第一方面的一种可能的实现方式中,所述分词词组包括有主规格词组,其中,所述有主规格词组所包含的分词是指相邻两边具有名词的规格词;
所述调用所述若干个不同的词库对所述待质检清单的分词词组进行逻辑匹配,包括:
若所述分词词组为有主规格词组,确定所述有主规格词组内的分词与所述若干个不同的词库内的规格词是否相同;
若所述有主规格词组内的分词与所述若干个不同的词库内的规格词相同,则匹配结果为相同;
否则,则匹配结果为不相同。
在第一方面的一种可能的实现方式中,所述分词词组还包括无主规格词组,其中,所述无主规格词组所包含的分词是指相邻两边无有名词的规格词;
所述调用所述若干个不同的词库对所述待质检清单的分词词组进行逻辑匹配,还包括:
若所述分词词组为无主规格词组,计算所述无主规格词组的分词与所述若干个不同的词库的相似度;
若所述相似度大于预设相似度,则匹配结果为相同;
否则,则匹配结果为不相同。
在第一方面的一种可能的实现方式中,所述分词词组还包括无规格名词组,其中,所述无规格名词组所包含的分词是指没有描述规格的名称词;
所述调用所述若干个不同的词库对所述待质检清单的分词词组进行逻辑匹配,还包括:
若所述分词词组为无规格名词组,确定所述若干个不同的词库内是否存有所述无规格名词组的分词;
若所述若干个不同的词库存有所述无规格名词组的分词,则匹配结果为相同;
否则,则匹配结果为不相同。
在第一方面的一种可能的实现方式中,所述对所述待质检清单进行分词,得到若干个分词词组,包括:
采用预定的分词模型对所述待质检清单进行分词,得到多个分词,其中,预设的分词模型是基于检查词库的词性和统计特征对清单对应的描述特征进行分词建模后,通过训练与学习建立得到;
按照规格词的词性将所述多个分词划分成规则词词组和无规格名词组;
按照规格词相邻两侧包含主语的状态,将所述规则词词组的多个分词换分成有主规格词组和无主规格词组。
在第一方面的一种可能的实现方式中,所述通过人工智能算法调用清单材料库的清单信息建立若干个不同的词库,包括:
调用人工智能算法,在清单材料库中查找若干个清单特征,所述清单特征包括材料名称、规格型号、计量单位;
通过预设的识别模型按照清单特征的词性将若干个所述清单特征进行聚合分类,构建得到若干个不同的词库,其中,预设的识别模型是利用清单历史数据进行模型学习训练建立得到。
在第一方面的一种可能的实现方式中,所述清单材料库,包括:计价清单的材料大类、小类、品目、材料编码、材料名称、计量单位和材料别名信息。
本发明实施例的第二方面提供了一种基于人工智能算法的清单信息检测装置,所述装置包括:
建立模块,用于通过人工智能算法调用清单材料库的清单信息建立若干个不同的词库,每个词库对应一种词性;
分词模块,用于获取待质检清单,并对所述待质检清单进行分词,得到若干个分词词组;
匹配模块,用于调用所述若干个不同的词库对每个所述分词词组进行逻辑匹配,得到若干个匹配结果;
通过模块,用于若所述若干个匹配结果均为相同时,则确定所述待质检清单检测通过;
不通过模块,用于若有至少一个匹配结果为不相同时,则确定所述待质检清单检测不通过。
相比于现有技术,本发明实施例提供的一种基于人工智能算法的清单信息检测方法及装置,其有益效果在于:本发明可以利用人工智能算法构建不同词性的词库,利用多个不同的词库对清单内的信息进行不同逻辑的质检,以缩短质检时间,提高质检效率和准确率。
附图说明
图1是本发明一实施例提供的一种基于人工智能算法的清单信息检测方法的流程示意图;
图2是本发明一实施例提供的一种基于人工智能算法的清单信息检测方法的操作流程图;
图3是本发明一实施例提供的一种基于人工智能算法的清单信息检测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前的清单质检方法有如下技术问题:人工质检需要聘请多位质检人员,质检成本高,且审核的工作量巨大,重复性工作多,不但需花费大量的时间和精力,还容易遗漏问题,无法保证准确性,效率低下。
为了解决上述问题,下面将通过以下具体的实施例对本申请实施例提供的一种基于人工智能算法的清单信息检测方法进行详细介绍和说明。
参照图1,示出了本发明一实施例提供的一种基于人工智能算法的清单信息检测方法的流程示意图。
其中,作为示例的,所述基于人工智能算法的清单信息检测方法,可以包括:
S11、通过人工智能算法调用清单材料库的清单信息建立若干个不同的词库,每个词库对应一种词性。
在一实施例中,通过人工智能算法可以快速建立不同词性的词库,从而可以利用不同的词库对清单进行识别,以提高质检效率。其中,词库对应的词性可以是名词、动词、形容词、量词等等,也可以是同义词,近义词等等。
需要说明的是,用户也可以根据其实际需求建立相应的词库,词库的词性也可以根据实际需求进行调整。
例如,可以必查词库、规格词库、计量词库、分隔符词库和错词库等。
必查词库可以通过新增必查词及对应的同义必查词建立得到,当计价文件中出现必查词时,一定会对其进行数据检查。规格词库可以是按照规格词的特征(由英文字母、阿拉伯数字、运算符组成的字符串)以及中文的商标或品牌名称,建立规格词库。计量词库可以是按照计量词的特征,建立材料计量词库,例如:厚度、高度、宽度、强度等。分隔符词库可以是按照分隔符的特征,建立分隔符词库,包括空格、逗号、冒号、顿号等符号。错词库可以是基于在先识别的错词建立的词库。
为了快速建立各种不同的词库,其中,作为示例的,步骤S11可以包括以下子步骤:
子步骤S111、调用人工智能算法,在清单材料库中查找若干个清单特征,所述清单特征包括材料名称、规格型号、计量单位。
其中,所述清单材料库,可以包括:计价清单的材料大类、小类、品目、材料编码、材料名称、计量单位和材料别名等信息。
子步骤S112、通过预设的识别模型按照清单特征的词性将若干个所述清单特征进行聚合分类,构建得到若干个不同的词库,其中,预设的识别模型是利用清单历史数据进行模型学习训练建立得到。
具体地,可以使用人工智能NLP算法,在材料库中根据材料名称、规格型号、计量单位等特征点进行学习,利用历史学习的数据建立识别模型,对材料进行相似材料的查找,判断出相似材料,并自动建立词库。
在一实施例中,可以利用NLP算法建立同义词组和错词组,通过自动学习不断优化和及时更新,避免因人工更新不及时而造成检查遗漏。
S12、获取待质检清单,并对所述待质检清单进行分词,得到若干个分词词组。
在一实施例中,待质检清单可以是用户上传的需要进行质检的清单。可以对待质检清单进行分词,然后对分词进行检测,以确定清单是否出错。
具体可以对每一条清单中的每一个表格(包括清单名称、清单特征、材料名称)都进行分词。
由于清单主要记录项目的行为或内容、数量和处理人这三种,为了能根据清单的实际内容进行分词,在一可选的实施例中,步骤S12可以包括以下子步骤:
子步骤S121、采用预定的分词模型对所述待质检清单进行分词,得到多个分词,其中,预设的分词模型是基于检查词库的词性和统计特征对清单对应的描述特征进行分词建模后,通过训练与学习建立得到。
在一实施例中,基于检查词库的词性和统计特征,对清单和材料的名称、特征等的描述进行分词建模,并不断训练模型参数,提高分词准确性。
子步骤S122、按照规格词的词性将所述多个分词划分成规则词词组和无规格名词组。
子步骤S123、按照规格词相邻两侧包含主语的状态,将所述规则词词组的多个分词换分成有主规格词组和无主规格词组。
具体地,可以先判断分词是否为规格词(例如,谓语),若是规格词,则将其划分为规则词词组,若不是规格词,则将其划分为无规格名词组。然后再对规则词词组内的各个规格词再进行分类,此分类规格为该规格词的左右两侧,是否包含主语,若该规格词左右两侧有主语,则划分该规格词为有主规格词组,反之,则划分该规格词为无主规格词组,从而得到三个不同的分词词组。
通过划分三个不同的词组,可以方便对每个词组内的分词进行质检,以提高检测的准确率。
S13、调用所述若干个不同的词库对每个所述分词词组进行逻辑匹配,得到若干个匹配结果。
由于在先建立的若干个不同的词库,可以调用若干个不同的词库对该分词词组内的分词进行逻辑匹配,以确定词组内的分词是否符合词库的要求。
在一实施例中,所述分词词组包括有主规格词组、无主规格词组和无规格名词组。其中,所述有主规格词组所包含的分词是指相邻两边具有名词的规格词;所述无主规格词组所包含的分词是指相邻两边无有名词的规格词;所述无规格名词组所包含的分词是指没有描述规格的名称词。
在其中一种的实施例中,步骤S13可以包括以下子步骤:
子步骤S131、若所述分词词组为有主规格词组,确定所述有主规格词组内的分词与所述若干个不同的词库内的规格词是否相同。
子步骤S132、若所述有主规格词组内的分词与所述若干个不同的词库内的规格词相同,则匹配结果为相同。
子步骤S133、否则,则匹配结果为不相同。
在其中一种的实施例中,步骤S13还可以包括以下子步骤:
子步骤S134、若所述分词词组为无主规格词组,计算所述无主规格词组的分词与所述若干个不同的词库的相似度。
子步骤S135、若所述相似度大于预设相似度,则匹配结果为相同。
子步骤S136、否则,则匹配结果为不相同。
在其中一种的实施例中,步骤S13还可以包括以下子步骤:
子步骤S137、若所述分词词组为无规格名词组,确定所述若干个不同的词库内是否存有所述无规格名词组的分词。
子步骤S138、若所述若干个不同的词库存有所述无规格名词组的分词,则匹配结果为相同。
子步骤S139、否则,则匹配结果为不相同。
根据不同的词组调用若干个词库进行不同的逻辑匹配,可以有效提高质检的准确率,降低出错的概率。
在本实施例中,对不同的分词词组进行不同的逻辑匹配,可以规范检查行为,提高清单材料一致性检查的准确性和效率。
S14、若所述若干个匹配结果均为相同时,则确定所述待质检清单检测通过。
S15、若有至少一个匹配结果为不相同时,则确定所述待质检清单检测不通过。
具体地,若有主规格词组、无主规格词组和无规格名词组的匹配结果均为相同时,则确定该待质检清单检测通过,若有主规格词组、无主规格词组或无规格名词组中任意一个的匹配结果为不相同时,则确定该待质检清单检测不通过。
参照图2,示出了本发明一实施例提供的一种基于人工智能算法的清单信息检测方法的操作流程图。
具体地,可以先建立清单材料库和词库,然后采用预设的分词模型对待质检清单进行分词,接着利用词库对不同的分词进行不同的逻辑匹配,当多个分词的逻辑匹配结果均为相同时,则确定清单质检通过。
在本实施例中,本发明实施例提供了一种基于人工智能算法的清单信息检测方法,其有益效果在于:本发明可以利用人工智能算法构建不同词性的词库,利用多个不同的词库对清单内的信息进行不同逻辑的质检,以缩短质检时间,提高质检效率和准确率。
本发明实施例还提供了一种基于人工智能算法的清单信息检测装置,参见图3,示出了本发明一实施例提供的一种基于人工智能算法的清单信息检测装置的结构示意图。
其中,作为示例的,所述基于人工智能算法的清单信息检测装置可以包括:
建立模块301,用于通过人工智能算法调用清单材料库的清单信息建立若干个不同的词库,每个词库对应一种词性;
分词模块302,用于获取待质检清单,并对所述待质检清单进行分词,得到若干个分词词组;
匹配模块303,用于调用所述若干个不同的词库对每个所述分词词组进行逻辑匹配,得到若干个匹配结果;
通过模块304,用于若所述若干个匹配结果均为相同时,则确定所述待质检清单检测通过;
不通过模块305,用于若有至少一个匹配结果为不相同时,则确定所述待质检清单检测不通过。
可选地,所述分词词组包括有主规格词组,其中,所述有主规格词组所包含的分词是指相邻两边具有名词的规格词;
所述匹配模块用于:
若所述分词词组为有主规格词组,确定所述有主规格词组内的分词与所述若干个不同的词库内的规格词是否相同;
若所述有主规格词组内的分词与所述若干个不同的词库内的规格词相同,则匹配结果为相同;
否则,则匹配结果为不相同。
可选地,所述分词词组还包括无主规格词组,其中,所述无主规格词组所包含的分词是指相邻两边无有名词的规格词;
所述匹配模块用于:
若所述分词词组为无主规格词组,计算所述无主规格词组的分词与所述若干个不同的词库的相似度;
若所述相似度大于预设相似度,则匹配结果为相同;
否则,则匹配结果为不相同。
可选地,所述分词词组还包括无规格名词组,其中,所述无规格名词组所包含的分词是指没有描述规格的名称词;
所述匹配模块用于:
若所述分词词组为无规格名词组,确定所述若干个不同的词库内是否存有所述无规格名词组的分词;
若所述若干个不同的词库存有所述无规格名词组的分词,则匹配结果为相同;
否则,则匹配结果为不相同。
可选地,所述分词模块还用于:
采用预定的分词模型对所述待质检清单进行分词,得到多个分词,其中,预设的分词模型是基于检查词库的词性和统计特征对清单对应的描述特征进行分词建模后,通过训练与学习建立得到;
按照规格词的词性将所述多个分词划分成规则词词组和无规格名词组;
按照规格词相邻两侧包含主语的状态,将所述规则词词组的多个分词换分成有主规格词组和无主规格词组。
可选地,所述建立模块还用于:
调用人工智能算法,在清单材料库中查找若干个清单特征,所述清单特征包括材料名称、规格型号、计量单位;
通过预设的识别模型按照清单特征的词性将若干个所述清单特征进行聚合分类,构建得到若干个不同的词库,其中,预设的识别模型是利用清单历史数据进行模型学习训练建立得到。
可选地,所述清单材料库,包括:计价清单的材料大类、小类、品目、材料编码、材料名称、计量单位和材料别名信息。
所属技术领域的技术人员可以清楚地了解到,为方便的描述和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
进一步的,本申请实施例还提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例所述的基于人工智能算法的清单信息检测方法。
进一步的,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上述实施例所述的基于人工智能算法的清单信息检测方法。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (9)

1.一种基于人工智能算法的清单信息检测方法,其特征在于,所述方法包括:
通过人工智能算法调用清单材料库的清单信息建立若干个不同的词库,每个词库对应一种词性;
获取待质检清单,并对所述待质检清单进行分词,得到若干个分词词组;
调用所述若干个不同的词库对每个所述分词词组进行逻辑匹配,得到若干个匹配结果;
若所述若干个匹配结果均为相同时,则确定所述待质检清单检测通过;
若有至少一个匹配结果为不相同时,则确定所述待质检清单检测不通过;
所述分词词组包括有主规格词组,其中,所述有主规格词组所包含的分词是指相邻两边具有名词的规格词;
所述调用所述若干个不同的词库对所述待质检清单的分词词组进行逻辑匹配,包括:
若所述分词词组为有主规格词组,确定所述有主规格词组内的分词与所述若干个不同的词库内的规格词是否相同;
若所述有主规格词组内的分词与所述若干个不同的词库内的规格词相同,则匹配结果为相同;
否则,则匹配结果为不相同。
2.根据权利要求1所述的基于人工智能算法的清单信息检测方法,其特征在于,所述分词词组还包括无主规格词组,其中,所述无主规格词组所包含的分词是指相邻两边无有名词的规格词;
所述调用所述若干个不同的词库对所述待质检清单的分词词组进行逻辑匹配,还包括:
若所述分词词组为无主规格词组,计算所述无主规格词组的分词与所述若干个不同的词库的相似度;
若所述相似度大于预设相似度,则匹配结果为相同;
否则,则匹配结果为不相同。
3.根据权利要求2所述的基于人工智能算法的清单信息检测方法,其特征在于,所述分词词组还包括无规格名词组,其中,所述无规格名词组所包含的分词是指没有描述规格的名称词;
所述调用所述若干个不同的词库对所述待质检清单的分词词组进行逻辑匹配,还包括:
若所述分词词组为无规格名词组,确定所述若干个不同的词库内是否存有所述无规格名词组的分词;
若所述若干个不同的词库存有所述无规格名词组的分词,则匹配结果为相同;
否则,则匹配结果为不相同。
4.根据权利要求3所述的基于人工智能算法的清单信息检测方法,其特征在于,所述对所述待质检清单进行分词,得到若干个分词词组,包括:
采用预定的分词模型对所述待质检清单进行分词,得到多个分词,其中,预设的分词模型是基于检查词库的词性和统计特征对清单对应的描述特征进行分词建模后,通过训练与学习建立得到;
按照规格词的词性将所述多个分词划分成规则词词组和无规格名词组;
按照规格词相邻两侧包含主语的状态,将所述规则词词组的多个分词换分成有主规格词组和无主规格词组。
5.根据权利要求1-4任意一项所述的基于人工智能算法的清单信息检测方法,其特征在于,所述通过人工智能算法调用清单材料库的清单信息建立若干个不同的词库,包括:
调用人工智能算法,在清单材料库中查找若干个清单特征,所述清单特征包括材料名称、规格型号、计量单位;
通过预设的识别模型按照清单特征的词性将若干个所述清单特征进行聚合分类,构建得到若干个不同的词库,其中,预设的识别模型是利用清单历史数据进行模型学习训练建立得到。
6.根据权利要求5所述的基于人工智能算法的清单信息检测方法,其特征在于,所述清单材料库,包括:计价清单的材料大类、小类、品目、材料编码、材料名称、计量单位和材料别名信息。
7.一种基于人工智能算法的清单信息检测装置,其特征在于,所述装置包括:
建立模块,用于通过人工智能算法调用清单材料库的清单信息建立若干个不同的词库,每个词库对应一种词性;
分词模块,用于获取待质检清单,并对所述待质检清单进行分词,得到若干个分词词组;
匹配模块,用于调用所述若干个不同的词库对每个所述分词词组进行逻辑匹配,得到若干个匹配结果;
通过模块,用于若所述若干个匹配结果均为相同时,则确定所述待质检清单检测通过;
不通过模块,用于若有至少一个匹配结果为不相同时,则确定所述待质检清单检测不通过;
所述分词词组包括有主规格词组,其中,所述有主规格词组所包含的分词是指相邻两边具有名词的规格词;
所述匹配模块,还用于:
若所述分词词组为有主规格词组,确定所述有主规格词组内的分词与所述若干个不同的词库内的规格词是否相同;
若所述有主规格词组内的分词与所述若干个不同的词库内的规格词相同,则匹配结果为相同;
否则,则匹配结果为不相同。
8.一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6任意一项所述的基于人工智能算法的清单信息检测方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1-6任意一项所述的基于人工智能算法的清单信息检测方法。
CN202210340901.XA 2022-04-02 2022-04-02 一种基于人工智能算法的清单信息检测方法及装置 Active CN114707507B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210340901.XA CN114707507B (zh) 2022-04-02 2022-04-02 一种基于人工智能算法的清单信息检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210340901.XA CN114707507B (zh) 2022-04-02 2022-04-02 一种基于人工智能算法的清单信息检测方法及装置

Publications (2)

Publication Number Publication Date
CN114707507A CN114707507A (zh) 2022-07-05
CN114707507B true CN114707507B (zh) 2023-04-07

Family

ID=82172542

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210340901.XA Active CN114707507B (zh) 2022-04-02 2022-04-02 一种基于人工智能算法的清单信息检测方法及装置

Country Status (1)

Country Link
CN (1) CN114707507B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115545773B (zh) * 2022-09-30 2023-07-28 永道工程咨询有限公司 一种建设投资换算方法、电子设备及可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423264A (zh) * 2017-07-10 2017-12-01 广东华联建设投资管理股份有限公司 一种工程材料专业特征提取方法
CN109800307B (zh) * 2019-01-18 2022-08-02 深圳壹账通智能科技有限公司 产品评价的分析方法、装置、计算机设备及存储介质
CN112487178A (zh) * 2019-09-10 2021-03-12 广州狸筑科技有限公司 基于词性和主从关系的建设工程材料信息分类方法及系统
CN111339166A (zh) * 2020-02-29 2020-06-26 深圳壹账通智能科技有限公司 基于词库的匹配推荐方法、电子装置及存储介质
CN112084302B (zh) * 2020-08-24 2024-04-30 江苏易达捷信数字科技有限公司 造价文件的清单数据检测方法、系统、装置及存储介质

Also Published As

Publication number Publication date
CN114707507A (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
CN109697162B (zh) 一种基于开源代码库的软件缺陷自动检测方法
Steidl et al. Feature-based detection of bugs in clones
CN113672931B (zh) 一种基于预训练的软件漏洞自动检测方法及装置
CN111427775B (zh) 一种基于Bert模型的方法层次缺陷定位方法
CN112651296A (zh) 一种无先验知识数据质量问题自动探查方法及系统
US12014140B2 (en) Utilizing machine learning and natural language processing to determine mappings between work items of various tools
CN110969015B (zh) 一种基于运维脚本的标签自动化识别方法和设备
CN112288079A (zh) 图神经网络模型训练方法、软件缺陷检测方法及系统
CN113407694A (zh) 客服机器人知识库歧义检测方法、装置及相关设备
CN115510500B (zh) 一种文本内容的敏感分析方法及系统
CN112507376B (zh) 一种基于机器学习的敏感数据检测方法及装置
CN113779590B (zh) 一种基于多维度表征的源代码漏洞检测方法
CN114707507B (zh) 一种基于人工智能算法的清单信息检测方法及装置
CN115408190A (zh) 故障诊断方法和装置
CN116756041A (zh) 代码缺陷预测与定位方法、装置、存储介质及计算机设备
CN113778875B (zh) 一种系统测试缺陷分类方法、装置、设备及存储介质
CN117648931A (zh) 一种代码审查方法、装置、电子设备及介质
CN117807481B (zh) 故障识别方法、模型的训练方法、装置、设备以及介质
CN113312258A (zh) 一种接口测试方法、装置、设备及存储介质
CN116932753A (zh) 日志分类方法、装置、计算机设备、存储介质和程序产品
CN108021595A (zh) 检验知识库三元组的方法及装置
CN115759049A (zh) 文本检测方法、装置、设备、介质和程序产品
CN114610882A (zh) 一种基于电力短文本分类的异常设备编码检测方法和系统
KR102217092B1 (ko) 애플리케이션의 품질 정보 제공 방법 및 장치
CN110443289A (zh) 检测偏离分布样本的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant