CN115759964A - 一种投标文件通用资格验证的方法、系统及设备 - Google Patents

一种投标文件通用资格验证的方法、系统及设备 Download PDF

Info

Publication number
CN115759964A
CN115759964A CN202211387358.5A CN202211387358A CN115759964A CN 115759964 A CN115759964 A CN 115759964A CN 202211387358 A CN202211387358 A CN 202211387358A CN 115759964 A CN115759964 A CN 115759964A
Authority
CN
China
Prior art keywords
qualification
text
bid
universal
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211387358.5A
Other languages
English (en)
Inventor
董若烟
张克贤
卢妤
谈灏珩
王翔波
王文果
王漠
刘可
廖兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN202211387358.5A priority Critical patent/CN115759964A/zh
Publication of CN115759964A publication Critical patent/CN115759964A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明公开了一种投标文件通用资格验证的方法、系统及设备,包括:获取招标文件中的通用资格要求,形成通用资格审查列表;提取投标文件中各项通用资格材料的图片;对图片进行识别得到字符区域和文本区域,并判断ISO 9000质量管理认证材料是否符合通用资格要求;若是,则投标文件的通用资格审核通过;若否,则对文本信息进行定位,并提取各项通用资格材料的文本;判断文本是否有效;若无效,则通用资格审核不通过;若有效,则通用资格审核通过,并将录入评标系统。本发明提的方法,提取招标文件中需要的通用资格要求,使得评标的通用资格审查列表与招标文件中的通用资格要求一一对应,辅助评标专家快速、高效的完成评标工作。

Description

一种投标文件通用资格验证的方法、系统及设备
技术领域
本发明属于信息处理技术领域,尤其涉及一种投标文件通用资格验证的方法、系统及设备。
背景技术
招标文件中的通用资格要求主要常见的有投标人的有效证照、ISO9000质量管理体系认证证书、《财务状况承诺函》、《无行贿犯罪记录承诺书》、《无诚信不良记录承诺函》、《关联企业情况声明》等。
针对ISO 9000质量管理体系认证材料要求包括:提供ISO 9000质量管理体系认证是国内认证机构颁布且发证期超过12个月的,需对认证证书进行监督审核,应提供以下证明材料之一:①认证证书上有有效监督审核合格标志(二维码不作为证明),监督审核应至少每个日历年(应进行再次认证的年份除外)进行一次,两次监督审核的时间间隔不得超过15个月;②提供ISO 9000质量管理体系认证监审合格的证明材料,监督审核应至少每个日历年(应进行再次认证的年份除外)进行一次,两次监督审核的时间间隔不得超过15个月;③提供国家认证认可监督管理委员会网站监审合格的网站截图(截图中证书状态为“有效”),监督审核应至少每个日历年(应进行再次认证的年份除外)进行一次,两次监督审核的时间间隔不得超过15个月。
由于对每份投标文件的以上通用资格审核种类多,在投标文件数量众多的情况下,会加大审核人力和时间,不利于快速、高效的完成工作。
发明内容
本发明要解决的技术问题是:提供一种投标文件通用资格验证的方法、系统及设备,以解决现有技术对每份投标文件的以上通用资格审核种类多,在投标文件数量众多的情况下,会加大审核人力和时间,不利于快速、高效的完成工作
本发明的技术方案:
一种投标文件通用资格验证的方法,包括:
获取招标文件中的通用资格要求,形成通用资格审查列表;
根据通用资格审查列表提取投标文件中各项通用资格材料的图片;图片包括ISO9000质量管理认证材料;
对图片进行识别得到字符区域和文本区域,并根据通用资格审查列表判断ISO9000质量管理认证材料是否符合通用资格要求;通用资格要求包括国内认证机构颁发、发生期满12个月、认证书上具有有效监督审核标志、证书未过期;
若ISO 9000质量管理认证材料不符合通用资格要求,则投标文件的通用资格审核不通过,并记录投标文件的不通过信息;
若ISO 9000质量管理认证材料符合通用资格要求,则对投标文件中的文本信息进行定位,并根据通用资格审查列表提取投标文件中各项通用资格材料的文本;所述文本包括各类承诺函、情况说明书;
根据通用资格审查列表判断文本是否有效;
若文本无效,则投标文件的通用资格审核不通过,并记录投标文件的不通过信息;
若文本有效,则投标文件的通用资格审核通过,并将投标文件的通用资格审查结果录入评标系统。
对投标文件中的文本信息进行定位,并根据通用资格审查列表提取投标文件中各项通用资格材料的文本的步骤,包括:
对投标文件进行扫描或拍照,获取投标文件的材料图片;投标文件的材料图片包括投标文件中每一页的扫描图片;
对投标文件的材料图片进行二值化,以对材料图片进行增强;
对增强后的材料图片采用FASText关键点检测,以对增强后的材料图片进行文本局部定位;
利用投标文件的文本特性对进行局部定位后的材料图片去除伪关键点;
对材料图片进行非最大值压制,以得到材料图片的文本候选区域;
采用文本分类器对文本候选区域进行双阈值分类,得到强文本集、弱文本集和非文本集;
在弱文本集中根据文本相似的特征查找与强文本集相似的文本,并与强文本集组合,得到投标文件中文本信息的定位结果;
根据投标文件中文本信息的定位结果和通用资格审查列表,提取投标文件中各项通用资格材料的文本。
所述对投标文件的材料图片进行二值化,以对材料图片进行增强的步骤,包括:
采用形态学闭运算对材料图片进行处理,得到背景估计图像;
利用背景估计图像减去所述材料图片,以消除背景对所述材料图片的影响,得到背景消除图像;
采用双边滤波去除噪声,并对背景消除图像进行Ostu二值化处理,得到第一二值化图像;
采用Sauvola算法对材料图片进行二值化处理,得到第二二值化图像;
对第一二值化图像和第二二值化图像进行与运算,得到所述材料图片的最终二值化图像,以对材料图片进行增强。
所述利用投标文件的文本特性对进行局部定位后的材料图片去除伪关键点的步骤,包括:
统计材料图片中每行的行关键点数目,当行关键点数目超过第一设定数值时,将所述行关键点数目对应的行的关键点滤除;
在材料图片中以关键点为中心,大小为25×25材料图片子块中,当关键点数目小于第二设定值时,将该关键点滤除;
利用材料图片中文本色彩相近的特性,任意选择图像中两个像素点
Figure BDA0003930537280000031
作为初始颜色聚类中心;其中,t为迭代次数,i∈[1,2];
计算每个像素P(Rp,Gp,Bp)与第i个聚类中心的颜色距离Di,对像素P所属的类别进行判定;
计算每一类像素点集合的颜色均值,并将其作为新的聚类中心
Figure BDA0003930537280000032
重复计算每个像素P与第i个聚类中心的颜色距离Di、每一类像素点集合的颜色均值,直到每个聚类中心颜色均值分量不再改变。
所述对像素P所属的类别进行判定的步骤中,公式为:
Figure BDA0003930537280000033
Figure BDA0003930537280000034
且i,j∈[1,2]
其中,
Figure BDA0003930537280000035
表示第t次迭代后,第i类像素点的集合。
对材料图片进行非最大值压制,以得到材料图片的文本候选区域的步骤,包括:
获取关键点的位置信息,在材料图像的总二值化图像中以关键点为种子点采用漫水填充算法获取初始文本候选区域;
对初始文本候选区域进行非最大值压制,得到所述材料图片的文本候选区域,公式为:
Figure BDA0003930537280000041
其中,Rt,Rt+1分别为由第i级、第i+1级降采样子图检测出的关键点形成的文本候选区域,当S(Rt,Rt+1)大于第三设定值时,保留Rt,Rt+1面积大于第四设定值的区域,删除另一区域。
在投标文件的通用资格审核不通过,并记录投标文件的不通过信息的步骤之后,还包括:
标记通用资格审核不通过的投标文件的异常位置;
将通用资格审核不通过的带有异常位置标记的投标文件存储在人工复核数据表中以进行人工复核。
一种投标文件通用资格验证的系统,包括:
获取模块,用于获取招标文件中的通用资格要求,形成通用资格审查列表;
提取模块,用于根据通用资格审查列表提取投标文件中各项通用资格材料的图片;图片包括ISO 9000质量管理认证材料;
识别模块,用于对图片进行识别得到字符区域和文本区域,并根据通用资格审查列表判断ISO 9000质量管理认证材料是否符合通用资格要求;通用资格要求包括国内认证机构颁发、发生期满12个月、认证书上具有有效监督审核标志及证书未过期;
第一记录模块,用于在ISO 9000质量管理认证材料不符合通用资格要求时,投标文件的通用资格审核不通过,并记录投标文件的不通过信息;
定位模块,用于在ISO 9000质量管理认证材料符合通用资格要求时,对投标文件中的文本信息进行定位,并根据通用资格审查列表提取投标文件中各项通用资格材料的文本;文本包括各类承诺函、情况说明书;
判断模块,用于根据通用资格审查列表判断所述文本是否有效;
第二记录模块,用于在文本无效时,投标文件的通用资格审核不通过,并记录所述投标文件的不通过信息;
录入模块,用于在文本有效时,投标文件的通用资格审核通过,并将投标文件的通用资格审查结果录入评标系统。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任一项所述的方法的步骤。
本发明有益效果:
本发明解决投标文件中通用资格要求的审查,针对不同招标项目,提取招标文件中的通用资格要求,形成通知资格审查列表,快速定位投标文件中的通用资格进行快速审查,反馈通过资格审查结果,对于不满足通用资格的投标人,评标专家人工复验后,做出废标处理;实现对投标人的通用资格进行快速预审查,在评标专家正式评标前,得到通用资格审查表报,辅助评标专家了解表报中的异常项复核情况,以便快速、高效完成评标工作。
附图说明
图1为本发明一实施例的方法流程示意图。
图2为本发明一实施例的装置结构示意图。
图3为本发明一实施例的计算机设备内部结构示意图。
具体实施方式
如图1所示,本发明提供了一种投标文件通用资格验证的方法,包括:
S1、获取招标文件中的通用资格要求,形成通用资格审查列表;
S2、根据所述通用资格审查列表提取所述投标文件中各项通用资格材料的图片;其中,所述图片包括ISO 9000质量管理认证材料;
S3、对所述图片进行识别得到字符区域和文本区域,并根据所述通用资格审查列表判断所述ISO 9000质量管理认证材料是否符合通用资格要求;其中,所述通用资格要求包括国内认证机构颁发、发生期满12个月、认证书上具有有效监督审核标志、证书未过期;即,判断是否提供了ISO 9000质量管理认证材料,对已提交的,识别ISO 9000质量管理认证材料的文本候选区域,判断是否为国内认证机构颁发,发证期是否满12个月,认证证书上有无有效监督审核标志,证书是否过期等情况。实际投标文件:因提交的ISO 9000质量管理体系认证材料出现异常问题,导致不少废标的情况,如:投标人未提供的ISO 9000质量管理体系认证材料;或提供的ISO 9000质量管理体系认证材料非国内认证机构颁发,国内认证机构颁发但发证期未满12个月,认证证书上没有有效监督审核标志,证书过期等情况,做废标处理,未提交其他有效的承诺函或声明。
S4、若所述ISO 9000质量管理认证材料不符合通用资格要求,则所述投标文件的通用资格审核不通过,并记录所述投标文件的不通过信息;
S401、标记通用资格审核不通过的所述投标文件的异常位置;
S402、将通用资格审核不通过的带有异常位置标记的所述投标文件存储在人工复核数据表中以进行人工复核。
S5、若所述ISO 9000质量管理认证材料符合通用资格要求,则对所述投标文件中的文本信息进行定位,并根据所述通用资格审查列表提取所述投标文件中各项通用资格材料的文本;以判断投标人是否提供完整的通用资格材料,判断材料的有效性。其中,所述文本包括各类承诺函、情况说明书;如,确定文本候选区域后,对文本候选区进行光学字符识别,确定投标人有无提供《投标保证金》(如有),《投标人廉洁承诺书》,《无行贿犯罪记录承诺书》,《财务状况承诺函》等资料。
步骤S5具体包括:
S51、对所述投标文件进行扫描或拍照,获取所述投标文件的材料图片;其中,所述投标文件的材料图片包括所述投标文件中每一页的扫描图片;
S52、对所述投标文件的材料图片进行二值化,以对所述材料图片进行增强;由于材料图片扫描和拍照状况的影响,材料图片可能会出现背景文本的渗透、阴影、污点、文本的对比度较弱等现象,为减少材料图片图像的质量对文本定位的影响,采用二值化算法对材料图片进行增强处理。
步骤S52具体包括:
S521、采用形态学闭运算对所述材料图片进行处理,得到背景估计图像;
S522、利用所述背景估计图像减去所述材料图片,以消除背景对所述材料图片的影响,得到背景消除图像;
S523、采用双边滤波去除噪声,并对所述背景消除图像进行Ostu二值化处理,得到第一二值化图像;
S524、采用Sauvola算法对所述材料图片进行二值化处理,得到第二二值化图像;
S525、对所述第一二值化图像和第二二值化图像进行与运算,得到所述材料图片的最终二值化图像,以对所述材料图片进行增强。
S53、对增强后的所述材料图片采用FASText关键点检测,以对增强后的所述材料图片进行文本局部定位;Fast关键点检测器仅能检测出文本笔画宽度为两个或者三个像素的文本,为了检测出不同尺度图像中的文本,需要对二值化后的图片进行多级降采样处理,在每一级降采样子图中进行关键点检测,降采样的系数设置为1.6;根据图片中文本笔画宽度的变化范围较小的特性,为减少文本的重复检测,计算每一级子图上关键点的数目,保留关键点数目最多的子图及它上两级和下两级子图中的关键点。
S54、利用所述投标文件的文本特性对进行局部定位后的所述材料图片去除伪关键点;基于扫描或拍照获取的文档图像往往处于不同的背景中,在背景中检测出的关键点对文本检测造成一定的干扰,由于文本中的关键点的分布比较集中且具有一定的规律,结合文本的特性,对关键点进行过滤。
步骤S54具体包括:
S541、统计所述材料图片中每行的行关键点数目,当所述行关键点数目超过第一设定数值(设定为5,可根据具体情况进行调整)时,将所述行关键点数目对应的行的关键点滤除;
S542、为了防止成片的噪音对文本检测的干扰,在所述材料图片中以关键点为中心,大小为25×25材料图片子块中,当关键点数目小于第二设定值(设置为3,可根据具体需要进行调整)时,将该关键点滤除;
S543、利用所述材料图片中文本色彩相近的特性,采用K均值聚类算法在原材料图片中对关键点进行聚类,进一步对关键点进行滤除,具体为:任意选择图像中两个像素点
Figure BDA0003930537280000071
作为初始颜色聚类中心;其中,t为迭代次数,i∈[1,2];
S544、计算每个像素P(Rp,Gp,Bp)与第i个聚类中心的颜色距离Di,对像素P所属的类别进行判定;公式为:
Figure BDA0003930537280000072
Figure BDA0003930537280000073
且i,j∈[1,2]
其中,
Figure BDA0003930537280000074
表示第t次迭代后,第i类像素点的集合。
S545、计算每一类像素点集合的颜色均值,并将其作为新的聚类中心
Figure BDA0003930537280000075
S546、重复计算每个像素P与第i个聚类中心的颜色距离Di、每一类像素点集合的颜色均值,即重复步骤S545-S546,直到每个聚类中心颜色均值分量不再改变。
S55、对所述材料图片进行非最大值压制,以得到所述材料图片的文本候选区域;
步骤S55具体包括:
S551、获取关键点的位置信息,在所述材料图像的总二值化图像中以关键点为种子点采用漫水填充算法获取初始文本候选区域;
S552、应用Fast关键点算法检测文本的关键点时,同一个文本在不同级的降采样子图中可能均会被检测出关键点,出现文本被重复检测的现象,为保持文本检测的独特性,对所述初始文本候选区域进行非最大值压制,得到所述材料图片的文本候选区域,其公式为:
Figure BDA0003930537280000081
其中,Rt,Rt+1分别为由第i级、第i+1级降采样子图检测出的关键点形成的文本候选区域,当S(Rt,Rt+1)大于第三设定值(设定为0.8,可根据具体情况进行调整)时,保留Rt,Rt+1面积大于第四设定值的区域,删除另一区域。
S56、采用文本分类器对所述文本候选区域进行双阈值分类,得到强文本集、弱文本集和非文本集;为了提高文本定位的召回率和精度,应用Adaboost算法训练多级联分类器,该分类器有两个级联分类器组成,第一个级联分类器为高精度Adaboost分类器,使用占空比、HOG特征、文本笔画面积比例和平均二值化模型特征进行训练,对样本集的分精度为99%。第二个级联分类器为低精度Adaboost分类器,使用占空比、HOG特征、文本笔画面积比例等特征进行训练,对样本集的分精度为87%。在双阈值分类中,高精度分类器对应的是高阈值,低精度分类器对应的是低阈值。候选文本集经过第一级分类器后,被分类为强文本集和非强文本集,由于高精度分类器的分类精度高,非强文本集中可能存在文本集。为了提高文本定位的精度,非强文本集经过第二级分类器进行分类,被分类为弱文本集和非文本集。
S57、在所述弱文本集中根据文本相似的特征查找与强文本集相似的文本,并将其与强文本集组合,得到所述投标文件中文本信息的定位结果;由于强文本集对应高精度分类器,所以将强文本集作为检测结果集的一部分。而弱文本集是低精度分类器检测的结果,存在一定的误检区域,需对弱文本集进一步处理。为了满足高召回率的要求,对强文本集中的任一强文本,在弱文本集中追踪该强文本的邻近文本。若该强文本与邻近文本具有相似的文本属性,则将邻近文本的状态置为强文本,遍历查询强文本集所有元素的相似文本。当两文本满足以下条件时,两文本为相似文本:1、两文本的空间距离不超过两文本中长和宽最大值的2倍;2、两文本对应的HSV模型各通道的差值最大不超过20;3、两文本的笔画宽度之比不超过1.5;4、两文本对应的长或宽之比不应超过2。
S58、根据所述投标文件中文本信息的定位结果和所述通用资格审查列表,提取所述投标文件中各项通用资格材料的文本。
S6、根据所述通用资格审查列表判断所述文本是否有效;
S7、若所述文本无效,则所述投标文件的通用资格审核不通过,并记录所述投标文件的不通过信息;
S701、标记通用资格审核不通过的所述投标文件的异常位置;
S702、将通用资格审核不通过的带有异常位置标记的所述投标文件存储在人工复核数据表中以进行人工复核。
S8、若所述文本有效,则所述投标文件的通用资格审核通过,并将所述投标文件的通用资格审查结果录入评标系统。
本发明解决投标文件中通用资格要求的审查,针对不同招标项目,提取招标文件中的通用资格要求,形成通知资格审查列表,快速定位投标文件中的通用资格进行快速审查,反馈通过资格审查结果,对于不满足通用资格的投标人,评标专家人工复验后,做出废标处理;实现对投标人的通用资格进行快速预审查,在评标专家正式评标前,得到通用资格审查表报,,辅助评标专家了解表报中的异常项复核情况,以便快速、高效完成评标工作。
如图2所示,本发明提供了一种投标文件通用资格验证的系统,包括:
获取模块1,用于获取招标文件中的通用资格要求,形成通用资格审查列表;
提取模块2,用于根据所述通用资格审查列表提取所述投标文件中各项通用资格材料的图片;其中,所述图片包括ISO 9000质量管理认证材料;
识别模块3,用于对所述图片进行识别得到字符区域和文本区域,并根据所述通用资格审查列表判断所述ISO 9000质量管理认证材料是否符合通用资格要求;其中,所述通用资格要求包括国内认证机构颁发、发生期满12个月、认证书上具有有效监督审核标志、证书未过期;
第一记录模块4,用于在所述ISO 9000质量管理认证材料不符合通用资格要求时,所述投标文件的通用资格审核不通过,并记录所述投标文件的不通过信息;
定位模块5,用于在所述ISO 9000质量管理认证材料符合通用资格要求时,对所述投标文件中的文本信息进行定位,并根据所述通用资格审查列表提取所述投标文件中各项通用资格材料的文本;其中,所述文本包括各类承诺函、情况说明书;
判断模块6,用于根据所述通用资格审查列表判断所述文本是否有效;
第二记录模块7,用于在所述文本无效时,所述投标文件的通用资格审核不通过,并记录所述投标文件的不通过信息;
录入模块8,用于在所述文本有效时,所述投标文件的通用资格审核通过,并将所述投标文件的通用资格审查结果录入评标系统。
在一个实施例中,定位模块5,包括:
材料图片单元,用于对所述投标文件进行扫描或拍照,获取所述投标文件的材料图片;其中,所述投标文件的材料图片包括所述投标文件中每一页的扫描图片;
二值化单元,用于对所述投标文件的材料图片进行二值化,以对所述材料图片进行增强;
关键点检测单元,用于对增强后的所述材料图片采用FASText关键点检测,以对增强后的所述材料图片进行文本局部定位;
去除单元,用于利用所述投标文件的文本特性对进行局部定位后的所述材料图片去除伪关键点;
非最大值压制单元,用于对所述材料图片进行非最大值压制,以得到所述材料图片的文本候选区域;
双阈值分类单元,用于采用文本分类器对所述文本候选区域进行双阈值分类,得到强文本集、弱文本集和非文本集;
查找单元,用于在所述弱文本集中根据文本相似的特征查找与强文本集相似的文本,并将其与强文本集组合,得到所述投标文件中文本信息的定位结果;
文本提取单元,用于根据所述投标文件中文本信息的定位结果和所述通用资格审查列表,提取所述投标文件中各项通用资格材料的文本。
在一个实施例中,二值化单元,包括:
运算子单元,用于采用形态学闭运算对所述材料图片进行处理,得到背景估计图像;
消除子单元,用于利用所述背景估计图像减去所述材料图片,以消除背景对所述材料图片的影响,得到背景消除图像;
噪声去除子单元,用于采用双边滤波去除噪声,并对所述背景消除图像进行Ostu二值化处理,得到第一二值化图像;
二值化处理子单元,用于采用Sauvola算法对所述材料图片进行二值化处理,得到第二二值化图像;
与运算子单元,用于对所述第一二值化图像和第二二值化图像进行与运算,得到所述材料图片的最终二值化图像,以对所述材料图片进行增强。
在一个实施例中,去除单元,包括:
统计子单元,用于统计所述材料图片中每行的行关键点数目,当所述行关键点数目超过第一设定数值时,将所述行关键点数目对应的行的关键点滤除;
滤除子单元,用于在所述材料图片中以关键点为中心,大小为25×25材料图片子块中,当关键点数目小于第二设定值时,将该关键点滤除;
选择子单元,用于利用所述材料图片中文本色彩相近的特性,任意选择图像中两个像素点
Figure BDA0003930537280000101
作为初始颜色聚类中心;其中,t为迭代次数,i∈[1,2];
第一计算子单元,用于计算每个像素P(Rp,Gp,Bp)与第i个聚类中心的颜色距离Di,对像素P所属的类别进行判定;
第二计算子单元,用于计算每一类像素点集合的颜色均值,并将其作为新的聚类中心
Figure BDA0003930537280000111
重复计算子单元,用于重复计算每个像素P与第i个聚类中心的颜色距离Di、每一类像素点集合的颜色均值,直到每个聚类中心颜色均值分量不再改变。
在一个实施李子红,第一计算子单元中,公式为:
Figure BDA0003930537280000112
Figure BDA0003930537280000113
且i,j∈[1,2]
其中,
Figure BDA0003930537280000114
表示第t次迭代后,第i类像素点的集合。
在一个实施例中,非最大值压制单元,包括:
位置信息获取子单元,用于获取关键点的位置信息,在所述材料图像的总二值化图像中以关键点为种子点采用漫水填充算法获取初始文本候选区域;
压制子单元,用于对所述初始文本候选区域进行非最大值压制,得到所述材料图片的文本候选区域,其公式为:
Figure BDA0003930537280000115
其中,Rt,Rt+1分别为由第i级、第i+1级降采样子图检测出的关键点形成的文本候选区域,当S(Rt,Rt+1)大于第三设定值时,保留Rt,Rt+1面积大于第四设定值的区域,删除另一区域。
在一个实施例中,还包括:
标记模块,用于标记通用资格审核不通过的所述投标文件的异常位置;
存储模块,用于将通用资格审核不通过的带有异常位置标记的所述投标文件存储在人工复核数据表中以进行人工复核。
上述各模块、单元、子单元均是用于对应执行上述投标文件通用资格验证的方法中的各个步骤,其具体实现方式参照上述方法实施例所述,在此不再进行赘述。
如图3所示,本发明还提供了一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储投标文件通用资格验证的方法的过程需要的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现投标文件通用资格验证的方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一个投标文件通用资格验证的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

Claims (10)

1.一种投标文件通用资格验证的方法,其特征在于,包括:
获取招标文件中的通用资格要求,形成通用资格审查列表;
根据通用资格审查列表提取投标文件中各项通用资格材料的图片;图片包括ISO 9000质量管理认证材料;
对图片进行识别得到字符区域和文本区域,并根据通用资格审查列表判断ISO 9000质量管理认证材料是否符合通用资格要求;通用资格要求包括国内认证机构颁发、发生期满12个月、认证书上具有有效监督审核标志、证书未过期;
若ISO 9000质量管理认证材料不符合通用资格要求,则投标文件的通用资格审核不通过,并记录投标文件的不通过信息;
若ISO 9000质量管理认证材料符合通用资格要求,则对投标文件中的文本信息进行定位,并根据通用资格审查列表提取投标文件中各项通用资格材料的文本;所述文本包括各类承诺函、情况说明书;
根据通用资格审查列表判断文本是否有效;
若文本无效,则投标文件的通用资格审核不通过,并记录投标文件的不通过信息;
若文本有效,则投标文件的通用资格审核通过,并将投标文件的通用资格审查结果录入评标系统。
2.根据权利要求1所述的投标文件通用资格验证的方法,其特征在于,对投标文件中的文本信息进行定位,并根据通用资格审查列表提取投标文件中各项通用资格材料的文本的步骤,包括:
对投标文件进行扫描或拍照,获取投标文件的材料图片;投标文件的材料图片包括投标文件中每一页的扫描图片;
对投标文件的材料图片进行二值化,以对材料图片进行增强;
对增强后的材料图片采用FASText关键点检测,以对增强后的材料图片进行文本局部定位;
利用投标文件的文本特性对进行局部定位后的材料图片去除伪关键点;
对材料图片进行非最大值压制,以得到材料图片的文本候选区域;
采用文本分类器对文本候选区域进行双阈值分类,得到强文本集、弱文本集和非文本集;
在弱文本集中根据文本相似的特征查找与强文本集相似的文本,并与强文本集组合,得到投标文件中文本信息的定位结果;
根据投标文件中文本信息的定位结果和通用资格审查列表,提取投标文件中各项通用资格材料的文本。
3.根据权利要求2所述的投标文件通用资格验证的方法,其特征在于,所述对投标文件的材料图片进行二值化,以对材料图片进行增强的步骤,包括:
采用形态学闭运算对材料图片进行处理,得到背景估计图像;
利用背景估计图像减去所述材料图片,以消除背景对所述材料图片的影响,得到背景消除图像;
采用双边滤波去除噪声,并对背景消除图像进行Ostu二值化处理,得到第一二值化图像;
采用Sauvola算法对材料图片进行二值化处理,得到第二二值化图像;
对第一二值化图像和第二二值化图像进行与运算,得到所述材料图片的最终二值化图像,以对材料图片进行增强。
4.根据权利要求3所述的投标文件通用资格验证的方法,其特征在于,所述利用投标文件的文本特性对进行局部定位后的材料图片去除伪关键点的步骤,包括:
统计材料图片中每行的行关键点数目,当行关键点数目超过第一设定数值时,将所述行关键点数目对应的行的关键点滤除;
在材料图片中以关键点为中心,大小为25×25材料图片子块中,当关键点数目小于第二设定值时,将该关键点滤除;
利用材料图片中文本色彩相近的特性,任意选择图像中两个像素点
Figure FDA0003930537270000021
作为初始颜色聚类中心;其中,t为迭代次数,i∈[1,2];
计算每个像素P(Rp,Gp,Bp)与第i个聚类中心的颜色距离Di,对像素P所属的类别进行判定;
计算每一类像素点集合的颜色均值,并将其作为新的聚类中心
Figure FDA0003930537270000022
重复计算每个像素P与第i个聚类中心的颜色距离Di、每一类像素点集合的颜色均值,直到每个聚类中心颜色均值分量不再改变。
5.根据权利要求4所述的投标文件通用资格验证的方法,其特征在于,所述对像素P所属的类别进行判定的步骤中,公式为:
Figure FDA0003930537270000023
Figure FDA0003930537270000031
其中,
Figure FDA0003930537270000032
表示第t次迭代后,第i类像素点的集合。
6.根据权利要求4所述的投标文件通用资格验证的方法,其特征在于,对材料图片进行非最大值压制,以得到材料图片的文本候选区域的步骤,包括:
获取关键点的位置信息,在材料图像的总二值化图像中以关键点为种子点采用漫水填充算法获取初始文本候选区域;
对初始文本候选区域进行非最大值压制,得到所述材料图片的文本候选区域,公式为:
Figure FDA0003930537270000033
其中,Rt,Rt+1分别为由第i级、第i+1级降采样子图检测出的关键点形成的文本候选区域,当S(Rt,Rt+1)大于第三设定值时,保留Rt,Rt+1面积大于第四设定值的区域,删除另一区域。
7.根据权利要求1所述的投标文件通用资格验证的方法,其特征在于,在投标文件的通用资格审核不通过,并记录投标文件的不通过信息的步骤之后,还包括:
标记通用资格审核不通过的投标文件的异常位置;
将通用资格审核不通过的带有异常位置标记的投标文件存储在人工复核数据表中以进行人工复核。
8.一种投标文件通用资格验证的系统,其特征在于,包括:
获取模块,用于获取招标文件中的通用资格要求,形成通用资格审查列表;
提取模块,用于根据通用资格审查列表提取投标文件中各项通用资格材料的图片;图片包括ISO 9000质量管理认证材料;
识别模块,用于对图片进行识别得到字符区域和文本区域,并根据通用资格审查列表判断ISO 9000质量管理认证材料是否符合通用资格要求;通用资格要求包括国内认证机构颁发、发生期满12个月、认证书上具有有效监督审核标志及证书未过期;
第一记录模块,用于在ISO 9000质量管理认证材料不符合通用资格要求时,投标文件的通用资格审核不通过,并记录投标文件的不通过信息;
定位模块,用于在ISO 9000质量管理认证材料符合通用资格要求时,对投标文件中的文本信息进行定位,并根据通用资格审查列表提取投标文件中各项通用资格材料的文本;文本包括各类承诺函、情况说明书;
判断模块,用于根据通用资格审查列表判断所述文本是否有效;
第二记录模块,用于在文本无效时,投标文件的通用资格审核不通过,并记录所述投标文件的不通过信息;
录入模块,用于在文本有效时,投标文件的通用资格审核通过,并将投标文件的通用资格审查结果录入评标系统。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202211387358.5A 2022-11-07 2022-11-07 一种投标文件通用资格验证的方法、系统及设备 Pending CN115759964A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211387358.5A CN115759964A (zh) 2022-11-07 2022-11-07 一种投标文件通用资格验证的方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211387358.5A CN115759964A (zh) 2022-11-07 2022-11-07 一种投标文件通用资格验证的方法、系统及设备

Publications (1)

Publication Number Publication Date
CN115759964A true CN115759964A (zh) 2023-03-07

Family

ID=85357234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211387358.5A Pending CN115759964A (zh) 2022-11-07 2022-11-07 一种投标文件通用资格验证的方法、系统及设备

Country Status (1)

Country Link
CN (1) CN115759964A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117808441A (zh) * 2024-03-01 2024-04-02 江苏省港口集团有限公司 一种投标信息核查方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117808441A (zh) * 2024-03-01 2024-04-02 江苏省港口集团有限公司 一种投标信息核查方法及系统
CN117808441B (zh) * 2024-03-01 2024-05-10 江苏省港口集团有限公司 一种投标信息核查方法及系统

Similar Documents

Publication Publication Date Title
US11450152B2 (en) Detection of manipulated images
Raghunandan et al. Riesz fractional based model for enhancing license plate detection and recognition
US6507670B1 (en) System and process for removing a background pattern from a binary image
US20080013803A1 (en) Method and apparatus for determining print image quality
CN108830275B (zh) 点阵字符、点阵数字的识别方法及装置
CN113569863B (zh) 一种单据稽查的方法、系统、电子设备及存储介质
CN113963147B (zh) 一种基于语义分割的关键信息提取方法及系统
EP3742340A1 (en) Methods and a system for verifying the authenticity of a mark
US20230147685A1 (en) Generalized anomaly detection
US6415062B1 (en) System and process for repairing a binary image containing discontinuous segments of a character
CN115759964A (zh) 一种投标文件通用资格验证的方法、系统及设备
CN112149401A (zh) 一种基于ocr的文档对比识别方法和系统
US11580758B2 (en) Method for processing image, electronic device, and storage medium
CN114241463A (zh) 签名验证方法、装置、计算机设备和存储介质
Wang et al. Fourier-residual for printer identification
Bhat et al. Investigating inconsistencies in prnu-based camera identification
CN117454426A (zh) 一种理赔资料信息脱敏采集方法、装置及系统
CN108205670B (zh) 一种车牌识别方法及装置
CN111178347B (zh) 证件图像的模糊度检测方法、装置、设备及存储介质
CN110516547B (zh) 一种基于加权非负矩阵分解的套牌车辆检测方法
CN112200789A (zh) 一种图像识别的方法及装置、电子设备和存储介质
CN111213156A (zh) 字符识别锐度确定
US20230069960A1 (en) Generalized anomaly detection
WO2010113217A1 (ja) 文字認識装置及び文字認識方法
CN116168407A (zh) 一种身份证影像质量检验方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Dong Ruoyan

Inventor after: Zhang Kexian

Inventor after: Lu Yu

Inventor after: Tan Haohang

Inventor after: Wang Xiangbo

Inventor after: Li Zhiyuan

Inventor after: Liu Ke

Inventor after: Liao Xing

Inventor after: Wang Hao

Inventor before: Dong Ruoyan

Inventor before: Zhang Kexian

Inventor before: Lu Yu

Inventor before: Tan Haohang

Inventor before: Wang Xiangbo

Inventor before: Wang Wenguo

Inventor before: Wang Mo

Inventor before: Liu Ke

Inventor before: Liao Xing