CN111583000A - 围标串标行为识别方法、装置、计算机设备及存储介质 - Google Patents

围标串标行为识别方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111583000A
CN111583000A CN202010495161.8A CN202010495161A CN111583000A CN 111583000 A CN111583000 A CN 111583000A CN 202010495161 A CN202010495161 A CN 202010495161A CN 111583000 A CN111583000 A CN 111583000A
Authority
CN
China
Prior art keywords
information
credit investigation
bidder
label
bidding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010495161.8A
Other languages
English (en)
Other versions
CN111583000B (zh
Inventor
陶立春
尹桂军
阮建勇
陈磊
宦叶青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Xinzhichain Technology Information Co ltd
Original Assignee
Nanjing Xinzhichain Technology Information Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Xinzhichain Technology Information Co ltd filed Critical Nanjing Xinzhichain Technology Information Co ltd
Priority to CN202010495161.8A priority Critical patent/CN111583000B/zh
Publication of CN111583000A publication Critical patent/CN111583000A/zh
Application granted granted Critical
Publication of CN111583000B publication Critical patent/CN111583000B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0611Request for offers or quotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种围标串标行为识别方法、装置、计算机设备及存储介质,属于电子招标技术领域,其中,所述方法包括:获取各投标人的征信信息;对所述征信信息进行预处理;基于预设维度对预处理后的征信信息进行分类提取,得到各投标人的多个维度信息;若不同投标人的同一维度信息具有相同关键词,则判定存在围标串标行为。本发明解决了现有的招投标系统不能对围标串标行为进行高效、准确的识别的问题。本发明能够对围标串标行为进行高效、准确的识别。

Description

围标串标行为识别方法、装置、计算机设备及存储介质
技术领域
本发明涉及招投标技术领域,尤其是涉及一种围标串标行为识别方法、装置、计算机设备及存储介质。
背景技术
招投标是一种国际惯例,是应用技术、经济的方法和市场经济的竞争机制的作用,有组织开展的一种择优成交的方式。招标人在组织投标人的资格审查时,一般的流程是发布资格预审公告或招标文件,明确对投标人的资格要求,投标人根据要求准备相应的资质材料,如营业执照、资格证书等,招标人再对投标人提交的资料进行符合性审查。
目前,招标人在组织投标人的资格审查时还存在一些问题。投标人之间采用不正当手段,对招标投标事项进行串通,通过限制竞争,排挤其他投标人,使某个利益相关者中标,从而谋取利益,扰乱市场秩序,这种行为被称为围标串标行为。而现有的招投标系统不能对招投标过程中的围标串标行为进行高效、准确的识别,因此,亟需一种可以对围标串标行为进行高效、准且识别的方法。
发明内容
本发明目的一是提供一种围标串标行为识别方法,能够高效、准确的识别招投标中围标串标行为。
本发明的上述发明目的一是通过以下技术方案得以实现的:
获取各投标人的征信信息;
对所述征信信息进行预处理;
基于预设维度对预处理后的征信信息进行分类提取,得到各投标人的多个维度信息;
若不同投标人的同一维度信息具有相同关键词,则判定存在围标串标行为。
通过采用上述技术方案,对各投标人的征信信息进行对比,及时发现各投标人之间是否存在关联,从而高效、准确地识别招投标中的围标串标行为,防止损害招标人、其他投标人的合法权益,保证招投标的公平公正,保障良好的市场秩序。
本发明在一较佳示例中可以进一步配置为:所述获取各投标人的征信信息,包括:
调用征信平台接口,通过网页爬取获取各投标人的征信信息。
通过采用上述技术方案,通过征信平台接口调用以及网页爬取技术可以快速、最大范围地获取各投标人的有效征信信息。
本发明在一较佳示例中可以进一步配置为:所述调用征信平台接口,包括:
获取所述征信平台接口的标识;
根据所述征信平台接口的标识获取对应的接口协议;
根据所述接口协议调用所述征信平台接口。
通过采用上述技术方案,根据接口协议调用征信平台接口,实现了同时兼容调用多个不同征信平台接口的功能,从而无需针对不同的征信平台重复开发与征信平台接口协议相匹配的接口。
本发明在一较佳示例中可以进一步配置为:所述通过网页爬取获取各投标人的征信信息,包括:
根据调用的征信平台接口获取待爬取网页的URL地址,根据所述URL地址获取所述待爬取网页的cookies,获取cookies中存储的登录数据;
根据所述登录数据,从IP地址库中随机选取可用的IP地址;
在待爬取网站服务器对所述登录数据和IP地址验证成功后,爬取所述待爬取网页,获取所述征信信息。
通过采用上述技术方案,只有随机获取的IP地址和登录数据验证成功后才能成功登录,从而避免因多个账户通过同一个服务器进行登录时会触发待爬取网页的风控机制而导致服务器被列入黑名单。
本发明在一较佳示例中可以进一步配置为:所述对所述征信信息进行预处理,包括:
对所述征信信息进行清洗、数据格式化。
通过采用上述技术方案,通过清洗、数据格式化处理,可以对征信信息进行筛选,保留需要的征信信息留下,过滤不需要的征信信息,减轻了后续的数据处理压力。
本发明在一较佳示例中可以进一步配置为:所述预设维度包括股东情况、主要管理人员、工商变更、企业对外投资、法人股权投资信息、法定代表人在外任职信息、行政处罚、商标信息、专利信息、著作权信息、被执行信息、动产抵押、股权出质、失信信息、经营异常信息、法院判决和法院公告中的至少一种。
通过采用上述技术方案,按照股东情况、主要管理人员、工商变更、企业对外投资等信息将各投标人的征信信息进行维度分类,针对每个维度进行关键词比对,有助于判断各投标人之间是否存在关联,进而判断是否存在围标串标行为。
本发明在一较佳示例中可以进一步配置为:所述若不同投标人的同一维度信息具有相同关键词,则判定存在围标串标行为,包括:
设置各预设维度的优先级;
按照优先级对不同投标人的同一维度信息进行关键词比对,判断当前优先级的维度信息中是否检测到相同关键词,若是,则停止关键词比对,判定存在围标串标行为;否则进行下一优先级的维度信息的关键词比对。
通过采用上述技术方案,对所有维度设置不同的比对优先级,当在先优先级的维度比对发现相同关键词时,可以立即停止关键词比对,无需在后优先级的维度比对,可以减少计算机的运算量,加快比对处理速度。
本发明目的二是提供一种围标串标行为识别装置,能够识别投标人是否存在围标串标行为,避免投标人围标串标,提高招标质量。
本发明的上述发明目的二是通过以下技术方案得以实现的:
一种围标串标行为识别装置,包括:
获取模块,用于获取各投标人的征信信息;
预处理模块,用于对所述征信信息进行预处理;
分类提取模块,用于基于预设维度对预处理后的征信信息进行分类提取,得到各投标人的多个维度信息;以及
判定模块,若不同投标人的同一维度信息具有相同关键词,则判定存在围标串标行为。
通过采用上述技术方案,基于预设维度对预处理后的征信信息进行分类提取,得到各投标人的多个维度信息,判断不同投标人的同一维度信息是否具有相同关键词,若有,则判定存在围标串标行为,从而识别投标人是否存在围标串标行为,避免投标人围标串标,提高招标质量。
本发明目的三是提供一种计算机设备,能够避免投标人围标串标,提高招标质量。
本发明的上述发明目的三是通过以下技术方案得以实现的:
一种计算机设备,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行的本发明提供的任一种围标串标行为识别方法的计算机程序。
通过采用上述技术方案,对各投标人的征信信息进行对比,及时发现各投标人之间是否存在关联,从而高效、准确地识别招投标中的围标串标行为,防止损害招标人、其他投标人的合法权益,保证招投标的公平公正,保障良好的市场秩序。
本发明目的四是提供一种计算机可读存储介质,能够存储相应的程序,具有便于实现避免投标人围标串标,提高招标质量的特点。
本发明的上述发明目的四是通过以下技术方案得以实现的:
一种计算机可读存储介质,存储有能够被处理器加载并执行上述任一种围标串标行为识别方法的计算机程序。
通过采用上述技术方案,对各投标人的征信信息进行对比,及时发现各投标人之间是否存在关联,从而高效、准确地识别招投标中的围标串标行为,防止损害招标人、其他投标人的合法权益,保证招投标的公平公正,保障良好的市场秩序。
综上所述,本发明包括以下至少一种有益技术效果:
1. 对各投标人的征信信息进行对比,及时发现各投标人之间是否存在关联,从而高效、准确地识别招投标中的围标串标行为,防止损害招标人、其他投标人的合法权益,保证招投标的公平公正,保障良好的市场秩序;
2. 通过清洗、数据格式化处理,可以对征信信息进行筛选,保留需要的征信信息留下,过滤不需要的征信信息,减轻了后续的数据处理压力;
3. 对所有维度设置不同的比对优先级,当在先优先级的维度比对发现相同关键词时,可以立即停止关键词比对,无需在后优先级的维度比对,可以减少计算机的运算量,加快比对处理速度。
附图说明
图1是本发明实施例一提供的围标串标行为识别方法的流程示意图。
图2是本发明实施例一中步骤S101的子步骤的流程示意图。
图3是本发明实施例一中步骤S104的子步骤的流程示意图。
图4是本发明实施例二提供的围标串标行为识别装置的结构框图。
图5是本发明实施例三提供的计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
实施例一
本实施例提供一种围标串标行为识别方法,如图1所示,该方法的主要流程描述如下(步骤S101~S104):
步骤S101:获取各投标人的征信信息。
具体的,先调用征信平台接口,再通过网页爬取获取各投标人的征信信息。如图2所示,其具体步骤如下:
步骤S1011:获取征信平台接口的标识。
标识接口是没有任何方法和属性的接口。标识接口不对实现它的类有任何语义上的要求,它仅仅表明实现它的类属于一个特定的类型。在Java语言中,比如java.io.Serializable和java.rmi.Remote等接口便是标识接口。当一个类实现了一个标识接口之后就像是给自己打了个标签,通过标签能快速识别它所在的平台。所以,当有多个合作的征信平台时,每个征信平台都有属于自己唯一确定的标识,在与征信平台建立合作关系时,为征信平台分配标识,之后,建立并存储标识与征信平台之间的映射关系。由于待调用接口是征信平台的接口,因此,待调用接口的标识与提供此待调用接口的征信平台的标识是相同的。确定了待调用接口后,获取待调用接口的标识。
步骤S1012:根据征信平台接口的标识获取对应的接口协议。
待调用接口与为征信平台分配的标识之间具有映射关系,待调用接口与接口协议之间也具有映射关系,且每个待调用接口的接口协议是不同的,所以能通过征信平台待调用接口的标识,获取与之对应的接口协议。
步骤S1013:根据接口协议调用征信平台接口。
根据征信平台待调用接口获取征信平台接口的标识,根据标识获取与之对应的接口协议,所以,反过来,根据接口协议能调用征信平台的待调用接口。
步骤S1014:根据调用的征信平台接口获取待爬取网页的URL地址,根据URL地址获取待爬取网页的cookies,获取cookies中存储的登录数据。
每个网页都有对应的唯一的标识,通过这个标识能获取需要的征信网络地址,本发明用URL地址作为爬取网页需要获取的地址,根据调用的征信平台接口获取待爬取网页的URL地址,cookies存储在待爬取网页的平台中,根据URL地址获取待爬取网页,从而获取cookies。在cookies中存储有登录数据,而cookies可以存储在网页数据爬取的征信平台中,所以根据URL地址能获取待爬取网页的cookies,从而获取cookies中存储的登录数据。
步骤S1015:根据登录数据,从IP地址库中随机选取可用的IP地址。
IP地址库存储有各征信平台不同的IP地址,当登录数据正确且经过征信网络服务器匹配成功后,从IP地址库中随机选取可用的IP地址,,对选取的IP地址进行标记作为正在使用的IP地址,下次爬取网页时选取未被标记的IP地址,当这次IP地址使用完毕后,对其标记进行删除。
步骤S1016:在待爬取网站服务器对登录数据和IP地址验证成功后,爬取待爬取网页,获取征信信息。
登录网页成功需要保证登录数据和IP地址的验证成功,例如,登录数据包括用户名和密码,当用户名和密码正确且经过征信网络服务器匹配成功,从IP地址库中选取的IP地址经过征信网络服务器也验证成功后,可以对征信平台网页进行爬取,获取各投标人的征信信息。根据登录数据和IP地址,登录待爬取网页,每次登录时都可以随机选取可用的IP地址,从而防止多个账户通过同一个服务器进行登录时,会触发待爬取网页的风控机制,导致服务器被列入黑名单。
步骤S102:对征信信息进行预处理。
本实施例中,对各投标人的征信信息进行清洗、数据格式化。对征信平台网页进行爬取,获取各投标人的征信信息后,这些信息并不是完美无缺的,有些信息存在缺陷,有些信息是重复的,有些信息是无效的或不需要的,所以要对获取征信信息进行识别和检查,然后对这些存在缺陷、重复、无效或不需要的信息进行清洗。将清洗后信息处理为所需的格式,例如将电子表格转换为CSV格式、将电子表格转换为JSON格式或将CSV格式转换JSON格式。完成征信信息的清洗转换后,根据国家相关信用标准规范,对清洗转换后的征信信息进行格式上的规范化和标准化处理。
步骤S103:基于预设维度对预处理后的征信信息进行分类提取,得到各投标人的多个维度信息。
本实施例中,预设维度可以包括股东情况、主要管理人员、工商变更、企业对外投资、法人股权投资信息、法定代表人在外任职信息、行政处罚、商标信息、专利信息、著作权信息、被执行信息、动产抵押、股权出质、失信信息、经营异常信息、法院判决和法院公告中的至少一种。通过数据库,按照预设维度对预处理后的征信信息进行分类提取,得到各投标人的多个维度信息,将这些维度信息存储在数据库中,并建立各投标人的维度信息数据库表。例如,预设维度为股东情况和主要管理人员,从每个投标人征信信息中提取股东情况和主要管理人员这些维度信息,并存储在维度信息数据库表中。
步骤S104:若不同投标人的同一维度信息具有相同关键词,则判定存在围标串标行为。
下面以甲、乙、丙三个投标人为例,参照图3,对步骤S104进行具体说明。
步骤S1041,设置各预设维度的优先级。
预先设置股东情况、主要管理人员、工商变更和企业对外投资这四个维度,并设置优先级顺序由高到低为股东情况、主要管理人员、工商变更和企业对外投资。
步骤S1042,按照优先级由高到低对不同投标人的同一维度信息进行关键词比对,若当前优先级的维度信息中具有相同关键词,则停止关键词比对,判定存在围标串标行为,否则进行下一优先级的维度信息的关键词比对。
现将投标人甲和投标人乙进行关键词比对,首先进行优先级最高的股东情况维度比对。投标人甲的股东情况维度的关键词为张三、李四和王五,投标人乙的股东情况维度的关键词为李四、赵六和王五,由于各投标人的征信信息在数据库中可以以表格形式存在,所以接下来以简化的表格形式进行关键词比对说明。
将投标人甲与投标人乙的股东情况这一维度信息建立比对表,见表1。表中,投标人甲的股东情况的关键词写入第一行,投标人乙的股东情况的关键词写入第一列,若第一行与第一列中有相同关键词,则显示该相同关键词,若没有相同关键词,则用“---”表示。
表1
张三 李四 王五
李四 --- 李四 ---
赵六 --- --- ---
王五 --- --- 王五
由表1可知,投标人甲和投标人乙的股东情况维度有相同的关键词李四和王五,说明投标人甲与投标人乙存在关联,应停止关键词比对,直接判定投标人甲和投标人乙之间存在围标串标行为。
如果投标人甲和投标人乙的股东情况维度中没有检测到相同关键词,就进行投标人甲和投标人乙的主要管理人员的关键词比对,以此类推。如果所有维度信息的关键词比对结束后,都没有检测到相同关键词,则说明投标人甲与投标人乙之间不存在关联,判定投标人甲和投标人乙之间不存在围标串标行为。
另外,除了比对投标人甲与投标人乙之间的维度信息的关键词比对,还要对投标人甲与投标人丙、投标人乙与投标人丙之间维度信息的关键词比对,即将所有投标人的同一分类的维度信息进行两两比对。
实施例二
为了更好地实施以上方法,本发明实施例提供了一种围标串标行为识别装置,该围标串标行为识别装置具体可以集成在网络设备中,例如终端或服务器等设备中,该终端可以包括手机、平板电脑或台式电脑等设备。
图4为本发明实施例提供的一种围标串标行为识别装置的结构框图。如图4所示,该围标串标行为识别装置主要包括:
获取模块201,用于获取各投标人的征信信息;
预处理模块202,用于对征信信息进行预处理;
分类提取模块203,用于基于预设维度对预处理后的征信信息进行分类提取,得到各投标人的多个维度信息;以及
判定模块204,若不同投标人的同一维度信息具有相同关键词,则判定存在围标串标行为。
可选的,获取模块201,具体用于调用征信平台接口,通过网页爬取获取各投标人的征信信息。
可选的,获取模块201,具体用于获取征信平台接口的标识;根据征信平台接口的标识获取对应的接口协议;根据接口协议调用征信平台接口。
可选的,获取模块201,具体用于调用的征信平台接口获取待爬取网页的URL地址,根据URL地址获取待爬取网页的cookies,获取cookies中存储的登录数据;根据登录数据,从IP地址库中随机选取可用的IP地址;在待爬取网站服务器对登录数据和IP地址验证成功后,爬取待爬取网页,获取征信信息。
可选的,预处理模块202,具体用于对征信信息进行清洗、数据格式化。
可选的,分类提取模块203,具体用于设置各预设维度的优先级;按照优先级对不同投标人的同一维度信息进行关键词比对,判断当前优先级的维度信息中是否检测到相同关键词,若是,则停止关键词比对,判定存在围标串标行为;否则进行下一优先级的维度信息的关键词比对。
可选的,判定模块204,具体用于设置各预设维度的优先级;按照优先级对不同投标人的同一维度信息进行关键词比对;判断当前优先级的维度信息中是否检测到相同关键词,若是,则停止关键词比对,判定存在围标串标行为;否则进行下一优先级的维度信息的关键词比对。
实施例一提供的方法中的各种变化方式和具体实例同样适用于本实施例的围标串标行为识别装置,通过前述对围标串标行为识别方法的详细描述,本领域技术人员可以清楚的知道本实施例中的围标串标行为识别装置的实施方法,为了说明书的简洁,在此不再详述。
实施例三
为了更好地执行上述方法的程序,本发明实施例提供一种计算机设备,该计算机设备可以是服务器,也可以是终端。如图5所示,该计算机设备300包括存储器301和处理器302。
存储器301存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器302加载并执行以实现上述实施例一围标串标行为识别方法。
存储器301可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器301还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器301中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器302所执行以实现上述实施例一所述围标串标行为识别方法。
处理器302可以包括一个或者多个处理核心。处理器302通过运行或执行存储在存储器301内的指令、程序、代码集或指令集,,调用存储在存储器301内的数据,执行本发明的各种功能和处理数据。处理器302可以为特定用途集成电路(Application SpecificIntegrated Circuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、数字信号处理装置(Digital Signal Processing Device,DSPD)、可编程逻辑装置(ProgrammableLogic Device,PLD)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、中央处理器(Central Processing Unit,CPU)、控制器、微控制器和微处理器中的至少一种。可以理解地,对于不同的设备,用于实现上述处理器功能的电子器件还可以为其它,本发明实施例不作具体限定。
实施例四
本发明实施例提供一种计算机可读存储介质,例如包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。该计算机可读存储介质存储有能够被处理器加载并执行上述实施例一所述围标串标行为识别方法的计算机程序。
本发明具体实施例仅仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本发明的权利要求范围内都受到专利法的保护。

Claims (10)

1.一种围标串标行为识别方法,其特征在于,包括:
获取各投标人的征信信息;
对所述征信信息进行预处理;
基于预设维度对预处理后的征信信息进行分类提取,得到各投标人的多个维度信息;
若不同投标人的同一维度信息具有相同关键词,则判定存在围标串标行为。
2.根据权利要求1所述的方法,其特征在于,所述获取各投标人的征信信息,包括:
调用征信平台接口,通过网页爬取获取各投标人的征信信息。
3.根据权利要求2所述的方法,其特征在于,所述调用征信平台接口,包括:
获取所述征信平台接口的标识;
根据所述征信平台接口的标识获取对应的接口协议;
根据所述接口协议调用所述征信平台接口。
4.根据权利要求3所述的方法,其特征在于,所述通过网页爬取获取各投标人的征信信息,包括:
根据调用的征信平台接口获取待爬取网页的URL地址,根据所述URL地址获取所述待爬取网页的cookies,获取cookies中存储的登录数据;
根据所述登录数据,从IP地址库中随机选取可用的IP地址;
在待爬取网站服务器对所述登录数据和IP地址验证成功后,爬取所述待爬取网页,获取所述征信信息。
5.根据权利要求1所述的方法,其特征在于,所述对所述征信信息进行预处理,包括:
对所述征信信息进行清洗、数据格式化。
6.根据权利要求1所述的方法,其特征在于,所述预设维度包括股东情况、主要管理人员、工商变更、企业对外投资、法人股权投资信息、法定代表人在外任职信息、行政处罚、商标信息、专利信息、著作权信息、被执行信息、动产抵押、股权出质、失信信息、经营异常信息、法院判决和法院公告中的至少一种。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述若不同投标人的同一维度信息具有相同关键词,则判定存在围标串标行为,包括:
设置各预设维度的优先级;
按照优先级对不同投标人的同一维度信息进行关键词比对,判断当前优先级的维度信息中是否检测到相同关键词,若是,则停止关键词比对,判定存在围标串标行为;否则进行下一优先级的维度信息的关键词比对。
8.一种围标串标行为识别装置,其特征在于,包括:
获取模块,用于获取各投标人的征信信息;
预处理模块,用于对所述征信信息进行预处理;
分类提取模块,用于基于预设维度对预处理后的征信信息进行分类提取,得到各投标人的多个维度信息;以及
判定模块,若不同投标人的同一维度信息具有相同关键词,则判定存在围标串标行为。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1至7中任一种方法的计算机程序。
10.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1至7中任一种方法的计算机程序。
CN202010495161.8A 2020-06-03 2020-06-03 围标串标行为识别方法、装置、计算机设备及存储介质 Active CN111583000B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010495161.8A CN111583000B (zh) 2020-06-03 2020-06-03 围标串标行为识别方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010495161.8A CN111583000B (zh) 2020-06-03 2020-06-03 围标串标行为识别方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN111583000A true CN111583000A (zh) 2020-08-25
CN111583000B CN111583000B (zh) 2022-07-19

Family

ID=72122346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010495161.8A Active CN111583000B (zh) 2020-06-03 2020-06-03 围标串标行为识别方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN111583000B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112258303A (zh) * 2020-11-16 2021-01-22 北京筑龙信息技术有限责任公司 围串标预警分析方法、装置、电子设备及存储介质
CN112561670A (zh) * 2020-12-11 2021-03-26 南方电网物资有限公司 一种用于围标串标的智能识别系统
CN117114720A (zh) * 2023-10-25 2023-11-24 湖南华菱电子商务有限公司 基于互联网的电商平台管理系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002053244A1 (en) * 2000-12-29 2002-07-11 Count Fausto Terlizzi Display apparatus
CN106503929A (zh) * 2016-11-14 2017-03-15 西安交通大学 一种智能分析围标与串标行为的方法
CN106897889A (zh) * 2017-02-27 2017-06-27 山东浪潮云服务信息科技有限公司 一种管理招标的方法和装置、一种可读介质和存储控制器
CN107239891A (zh) * 2017-05-26 2017-10-10 山东省科学院情报研究所 一种基于大数据的招投标审核方法
CN107704497A (zh) * 2017-08-25 2018-02-16 上海壹账通金融科技有限公司 网页数据爬取方法、装置、网页数据爬取平台及存储介质
CN109034717A (zh) * 2018-06-05 2018-12-18 王振 一种识别招标过程中围标串标行为的方法
CN110046973A (zh) * 2019-04-17 2019-07-23 成都市审计局 一种基于关联关系大数据分析的围标串标检测方法
CN110992059A (zh) * 2019-11-22 2020-04-10 浙江招天下招投标交易平台有限公司 一种基于大数据的围串标行为识别分析方法
CN111091259A (zh) * 2019-09-20 2020-05-01 上海同在互联网科技有限公司 电子招标采购异常行为识别方法、系统、设备及存储介质
CN111191903A (zh) * 2019-12-24 2020-05-22 中科金审(北京)科技有限公司 监控投标文件的预警方法、装置、服务器及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002053244A1 (en) * 2000-12-29 2002-07-11 Count Fausto Terlizzi Display apparatus
CN106503929A (zh) * 2016-11-14 2017-03-15 西安交通大学 一种智能分析围标与串标行为的方法
CN106897889A (zh) * 2017-02-27 2017-06-27 山东浪潮云服务信息科技有限公司 一种管理招标的方法和装置、一种可读介质和存储控制器
CN107239891A (zh) * 2017-05-26 2017-10-10 山东省科学院情报研究所 一种基于大数据的招投标审核方法
CN107704497A (zh) * 2017-08-25 2018-02-16 上海壹账通金融科技有限公司 网页数据爬取方法、装置、网页数据爬取平台及存储介质
CN109034717A (zh) * 2018-06-05 2018-12-18 王振 一种识别招标过程中围标串标行为的方法
CN110046973A (zh) * 2019-04-17 2019-07-23 成都市审计局 一种基于关联关系大数据分析的围标串标检测方法
CN111091259A (zh) * 2019-09-20 2020-05-01 上海同在互联网科技有限公司 电子招标采购异常行为识别方法、系统、设备及存储介质
CN110992059A (zh) * 2019-11-22 2020-04-10 浙江招天下招投标交易平台有限公司 一种基于大数据的围串标行为识别分析方法
CN111191903A (zh) * 2019-12-24 2020-05-22 中科金审(北京)科技有限公司 监控投标文件的预警方法、装置、服务器及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112258303A (zh) * 2020-11-16 2021-01-22 北京筑龙信息技术有限责任公司 围串标预警分析方法、装置、电子设备及存储介质
CN112258303B (zh) * 2020-11-16 2024-04-30 北京筑龙信息技术有限责任公司 围串标预警分析方法、装置、电子设备及存储介质
CN112561670A (zh) * 2020-12-11 2021-03-26 南方电网物资有限公司 一种用于围标串标的智能识别系统
CN112561670B (zh) * 2020-12-11 2022-01-28 南方电网物资有限公司 一种用于围标串标的智能识别系统
CN117114720A (zh) * 2023-10-25 2023-11-24 湖南华菱电子商务有限公司 基于互联网的电商平台管理系统
CN117114720B (zh) * 2023-10-25 2024-02-20 湖南华菱电子商务有限公司 基于互联网的电商平台管理系统

Also Published As

Publication number Publication date
CN111583000B (zh) 2022-07-19

Similar Documents

Publication Publication Date Title
CN111583000B (zh) 围标串标行为识别方法、装置、计算机设备及存储介质
CN108063759B (zh) Web漏洞扫描方法
CN108334417B (zh) 确定数据异常的方法和装置
US8615516B2 (en) Grouping similar values for a specific attribute type of an entity to determine relevance and best values
CN111062013B (zh) 一种账号过滤方法、装置、电子设备及机器可读存储介质
CN110602029A (zh) 一种用于识别网络攻击的方法和系统
CN107784205B (zh) 一种用户产品审核的方法、装置、服务器和存储介质
CN108629375B (zh) 电力客户分类方法、系统、终端及计算机可读存储介质
CN113052676A (zh) 一种智能风控决策方法、装置、设备及可读存储介质
CN113535823B (zh) 异常访问行为检测方法、装置及电子设备
CN113076961B (zh) 一种图像特征库更新方法、图像检测方法和装置
CN108650123B (zh) 故障信息记录方法、装置、设备和存储介质
CN110888799B (zh) 一种软件测试方法及装置
CN117495544A (zh) 一种基于沙箱的风控评估方法、系统、终端及存储介质
CN111931186A (zh) 软件风险识别方法及装置
CN111324463A (zh) 一种工程文件清标方法、系统、装置及存储介质
CN115221893A (zh) 基于规则与语义分析的质检规则自动化配置方法及装置
CN111460268B (zh) 数据库查询请求的确定方法、装置和计算机设备
CN111680974B (zh) 电子化承保流程的问题定位方法及装置
CN108920700B (zh) 一种虚假图片识别方法及装置
CN112488562A (zh) 一种业务实现方法及装置
CN111209397A (zh) 一种确定企业产业类别的方法
CN110647454A (zh) 确定系统用户访问信息的方法及装置
CN112732948B (zh) 身份验证方法、装置及存储介质
US20230334158A1 (en) Data processing systems and methods for automatically detecting target data transfers and target data processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant