CN110728453A - 一种基于大数据的政策自动匹配分析系统及方法 - Google Patents

一种基于大数据的政策自动匹配分析系统及方法 Download PDF

Info

Publication number
CN110728453A
CN110728453A CN201910974753.5A CN201910974753A CN110728453A CN 110728453 A CN110728453 A CN 110728453A CN 201910974753 A CN201910974753 A CN 201910974753A CN 110728453 A CN110728453 A CN 110728453A
Authority
CN
China
Prior art keywords
policy
enterprise
information
priority
enterprise information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910974753.5A
Other languages
English (en)
Other versions
CN110728453B (zh
Inventor
李现法
李佳佳
郑永华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Jiaxi Information Technology Co Ltd
Original Assignee
Shandong Jiaxi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Jiaxi Information Technology Co Ltd filed Critical Shandong Jiaxi Information Technology Co Ltd
Priority to CN201910974753.5A priority Critical patent/CN110728453B/zh
Publication of CN110728453A publication Critical patent/CN110728453A/zh
Application granted granted Critical
Publication of CN110728453B publication Critical patent/CN110728453B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本发明一种基于大数据的政策自动匹配分析系统及方法包括政策输入模块、政策数据库、第一企业等级构建模块、第二企业等级构建模块、判断模块,其用于根据所述用户的企业信息判断其是否符合第二企业等级,若是,则将所述政策名称以第一优先级输出,若否,则将政策名称以第三优先级输出并标记并非弱于或等于的企业支信息。本发明通过上述方式可通过已经通过上述政策审核的企业信息的众数和最差值来分析政策并作为用户的企业选择政策去申报的参考标准,从而通过大数据的分析将适合企业申报的政策来作为优先推荐,以降低企业申报政策的风险以及提高企业申报政策的效率,并辅助用户的企业匹配相关政策,从而实现了企业和政府时间的共赢。

Description

一种基于大数据的政策自动匹配分析系统及方法
技术领域
本发明涉及一种大数据技术,特别是涉及一种用于基于大数据的政策自动匹配分析系统。
背景技术
申报政策例如:科技型中小企业在成长与发展的过程当中,会有相关的政府部门,比如科委、发改委、商务委等部门对科技型中小企业进行一定的政策扶持,符合相关部门条件的企业则可以根据自己企业的情况,申报相关的政策扶持,以壮大自己企业,更快发展自己企业。
但是在政策扶持方面,经常有些企业无法得知自己的企业如何申报政策,而且政策过多也无法正确选择适应其的政策来申报,造成了政府与企业之间产生了巨大的鸿沟。而为了促进企业能够积极申报项目,目前亟需一种通过大数据来分析匹配政策的系统,实现企业和政府的共赢。
发明内容
本发明要解决的技术问题是提供一种通过大数据来分析匹配政策的系统。
本发明一种基于大数据的政策自动匹配分析系统及方法,包括
政策输入模块,其用于获取政策名称、政策信息和符合所述政策名称的企业信息、用户的企业信息,其中,所述政策信息包括多个政策支信息,所述企业信息包括多个企业支信息;
政策数据库,其用于存储获取政策名称、政策信息和符合所述政策名称的企业信息;
第一企业等级构建模块,其用于根据符合所述政策名称的企业信息的企业支信息的最差值构建第一企业等级;
第二企业等级构建模块,其用于根据符合所述政策名称的企业信息的企业支信息的众数构建第二企业等级;
判断模块,其用于根据所述用户的企业信息判断其是否符合第二企业等级,若是,则将所述政策名称以第一优先级输出,若否,则判断其是否符合第一企业等级,若是,则搜索除用户的企业信息以外的所述企业信息中是否有一个企业信息的每个企业支信息均弱于或等于用户的企业信息的企业支信息,若是,则将政策名称以第二优先级输出,若否,则将政策名称以第三优先级输出并标记并非弱于或等于的企业支信息;
输出模块,其用于按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端。
本发明一种基于大数据的政策自动匹配分析系统,其中所述输出模块在所述第一优先等级、第二优先等级、第三优先等级中,按照如下方式排列相同优先等级的政策名称:
根据政策数据库的企业信息,搜索与所述用户的企业信息的相似度低于预设阈值的政策数据库中存储的除用户的企业信息以外的企业信息作为第一企业信息;
将第一企业信息中符合的政策名称按由多至少作为排序列表;
在相同优先等级的政策名称按所述排序列表排列。
本发明一种基于大数据的政策自动匹配分析系统,其中所述输出模块在所述第一优先等级、第二优先等级、第三优先等级中,按照如下方式排列相同优先等级的政策名称:
根据政策数据库的企业信息,搜索与所述用户的企业信息的相似度低于预设阈值的政策数据库中存储的除用户的企业信息以外的企业信息作为第一企业信息;
将第一企业信息中的政策名称,根据近N年内的每年的补贴变化幅度X,按如下公式计算总体方差P2
Figure BDA0002233225180000031
P2为总体方差,X为后一年是前一千的变量的百分比,
Figure BDA0002233225180000032
为X的平均值;
根据每个政策名称的总体方差P2的大小,按由小到大作为排序列表;
在相同优先等级的政策名称按所述排序列表排列。
本发明一种基于大数据的政策自动匹配分析系统,其中所述政策输入模块以爬虫软件搜索政府网站并截取政策文件图片,通过图像识别软件将红色标题的文件识别为预输入文件,将所述与输入文件中搜索企业支信息的名称,若搜索到的企业支信息的名称的数量超过第一预设阈值,则将所述与输入文件转化为终输入文件,再通过管理员将所述终输入文件中的作为政策判定条件;
若用户的企业支信息均满足所述政策判定条件,将所述政策判定条件所属的政策名称的优先级调整为第一优先级。
本发明一种基于大数据的政策自动匹配分析系统的方法,包括如下步骤:
获取政策名称、政策信息和符合所述政策名称的企业信息、用户的企业信息,其中,所述政策信息包括多个政策支信息,所述企业信息包括多个企业支信息;
存储获取政策名称、政策信息和符合所述政策名称的企业信息;
根据符合所述政策名称的企业信息的企业支信息的最差值构建第一企业等级;
根据符合所述政策名称的企业信息的企业支信息的众数构建第二企业等级;
根据所述用户的企业信息判断其是否符合第二企业等级,若是,则将所述政策名称以第一优先级输出,若否,则判断其是否符合第一企业等级,若是,则搜索除用户的企业信息以外的所述企业信息中是否有一个企业信息的每个企业支信息均弱于或等于用户的企业信息的企业支信息,若是,则将政策名称以第二优先级输出,若否,则将政策名称以第三优先级输出并标记并非弱于或等于的企业支信息;
按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端。
本发明一种基于大数据的政策自动匹配分析系统的方法,包括如下步骤:
按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端的步骤中,还包括:在所述第一优先等级、第二优先等级、第三优先等级中,按照如下方式排列相同优先等级的政策名称:
根据政策数据库的企业信息,搜索与所述用户的企业信息的相似度低于预设阈值的政策数据库中存储的除用户的企业信息以外的企业信息作为第一企业信息;
将第一企业信息中符合的政策名称按由多至少作为排序列表;
在相同优先等级的政策名称按所述排序列表排列。
本发明一种基于大数据的政策自动匹配分析系统的方法,包括如下步骤:
按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端的步骤中,还包括:在所述第一优先等级、第二优先等级、第三优先等级中,按照如下方式排列相同优先等级的政策名称:
根据政策数据库的企业信息,搜索与所述用户的企业信息的相似度低于预设阈值的政策数据库中存储的除用户的企业信息以外的企业信息作为第一企业信息;
将第一企业信息中的政策名称,根据近N年内的每年的补贴变化幅度X,按如下公式计算总体方差P2
Figure BDA0002233225180000051
P2为总体方差,X为后一年是前一千的变量的百分比,
Figure BDA0002233225180000052
为X的平均值;
根据每个政策名称的总体方差P2的大小,按由小到大作为排序列表;
在相同优先等级的政策名称按所述排序列表排列。
本发明一种基于大数据的政策自动匹配分析系统的方法,包括如下步骤:
按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端的步骤中,还包括:
以爬虫软件搜索政府网站并截取政策文件图片,通过图像识别软件将红色标题的文件识别为预输入文件,将所述与输入文件中搜索企业支信息的名称,若搜索到的企业支信息的名称的数量超过第一预设阈值,则将所述与输入文件转化为终输入文件,再通过管理员将所述终输入文件中的作为政策判定条件;
若用户的企业支信息均满足所述政策判定条件,将所述政策判定条件所属的政策名称的优先级调整为第一优先级。
本发明一种基于大数据的政策自动匹配分析系统及方法与现有技术不同之处在于本发明一种基于大数据的政策自动匹配分析系统本发明通过已经通过上述政策审核的企业信息的众数和最差值来分析政策并作为用户的企业选择政策去申报的参考标准,从而通过大数据的分析将适合企业申报的政策来作为优先推荐,以降低企业申报政策的风险以及提高企业申报政策的效率,并辅助用户的企业匹配相关政策。并且,某些政策是用户的企业信息还未能达到,但是有希望能达到的,还可通过标记并非弱于或等于的企业支信息而推荐至用户终端,以指导企业更好地完成更多的政策申报,从而实现了企业和政府时间的共赢。
下面结合附图对本发明的一种基于大数据的政策自动匹配分析系统及方法作进一步说明。
附图说明
图1是一种基于大数据的政策自动匹配分析系统的方法的流程图。
具体实施方式
如图1所示,本发明一种基于大数据的政策自动匹配分析系统包括
政策输入模块,其用于获取政策名称、政策信息和符合所述政策名称的企业信息、用户的企业信息,其中,所述政策信息包括多个政策支信息,所述企业信息包括多个企业支信息;
政策数据库,其用于存储获取政策名称、政策信息和符合所述政策名称的企业信息;
第一企业等级构建模块,其用于根据符合所述政策名称的企业信息的企业支信息的最差值构建第一企业等级;
第二企业等级构建模块,其用于根据符合所述政策名称的企业信息的企业支信息的众数构建第二企业等级;
判断模块,其用于根据所述用户的企业信息判断其是否符合第二企业等级,若是,则将所述政策名称以第一优先级输出,若否,则判断其是否符合第一企业等级,若是,则搜索除用户的企业信息以外的所述企业信息中是否有一个企业信息的每个企业支信息均弱于或等于用户的企业信息的企业支信息,若是,则将政策名称以第二优先级输出,若否,则将政策名称以第三优先级输出并标记并非弱于或等于的企业支信息;
输出模块,其用于按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端。
本发明通过上述方式可通过已经通过上述政策审核的企业信息的众数和最差值来分析政策并作为用户的企业选择政策去申报的参考标准,从而通过大数据的分析将适合企业申报的政策来作为优先推荐,以降低企业申报政策的风险以及提高企业申报政策的效率,并辅助用户的企业匹配相关政策。并且,某些政策是用户的企业信息还未能达到,但是有希望能达到的,还可通过标记并非弱于或等于的企业支信息而推荐至用户终端,以指导企业更好地完成更多的政策申报,从而实现了企业和政府时间的共赢。
其中,根据所述用户的企业信息判断其是否符合第二企业等级可为:将构建第二企业等级的企业支信息的众数来构建为一个虚拟的企业信息,若强于或等于这个虚拟的企业信息,则代表符合,若不强于,则代表不符合。其中,有些数据例如:纳税额越多越强,犯罪记录、异常信息越少越强。
其中,若否,则将政策名称以第三优先级输出并标记并非弱于或等于的企业支信息,的步骤中,还可包括:将并非弱于或等于的企业支信息与用户的企业支信息之间的差值。
其中,搜索除用户的企业信息以外的所述企业信息中是否有一个企业信息的每个企业支信息均弱于或等于用户的企业信息的企业支信息,可理解为,在数据库中,多个企业信息中,是否有一个最为擦边通过上述政策信息的企业信息,而这个企业信息每一项的企业支信息均比用户的企业支信息更加不符合政策要求或与用户的企业支信息相同,从而在数据库中找到了一个比用户的企业信息还弱或相同的企业信息,此时可认为用户的企业信息完全满足政策信息,而提高其优先级。
其中,判断用户的企业信息是否符合第一企业等级或第二企业等级,则应将用户的企业信息的每一项企业支信息与第一企业等级、第二企业等级的企业支信息进行对比,若均大于或均强于,则判定符合。
其中,企业支信息的最差值包括企业名称,企业支信息的最差值可忽略企业名称。
其中,政策信息所指的是政策的内容或者说政策的要求,其由管理员根据政策内容而生成。
例如,政策名称:湖南省高新技术企业,政策信息包括6个政策支信息,分别为:要求研发经费大于20万、研发人员均为本科以上、知识产权数量大于一个发明或六个新型、每年研发投资递增、每年研发费用递增、每年净利润增长幅度超过30%。
企业信息包括6个企业支信息,分别为:湖南省信必可科技有限公司、研发经费50万、研发人员均为本科以上、知识产权数量大于三个发明、每年研发投资递增、每年净利润增长幅度超过50%。
其中,上述政策信息、企业信息还可包括但不限于:年纳税总额、年毛利润、年净利润、员工数量、是否为一般纳税人、是否具备独立办公场所、年营业额、知识产权、专利、商标、学历、人数、时间、户口、残疾人个数、企业所在省、企业所在市、企业所在区等。
进一步的说,所述输出模块在所述第一优先等级、第二优先等级、第三优先等级中,按照如下方式排列相同优先等级的政策名称:
根据政策数据库的企业信息,搜索与所述用户的企业信息的相似度低于预设阈值的政策数据库中存储的除用户的企业信息以外的企业信息作为第一企业信息;
将第一企业信息中符合的政策名称按由多至少作为排序列表;
在相同优先等级的政策名称按所述排序列表排列。
本发明基于蚂蚁算法的从众思想而将与用户的企业信息差不多的第一企业信息作为参考,而将其申报过的、已经符合的政策名称优先在同一优先等级上推荐给用户,从而更加符合用户的要求,也更加能够让用户认识政策,并提高政策申报成功率。
例如,上述排序列表可为:在第一企业信息中,具有5个省高新,3个国家高新,2个贯标。那么在第一优先等级中,排列省高新、国家高新、贯标的顺序就应为:先省高新,再国家高新,再贯标。
其中,搜索与所述用户的企业信息的相似度低于预设阈值的企业信息,可为每一个企业支信息的相似度均为预设阈值10%左右,例如,用户的企业信息为:年纳税额100万,净利润1000万,年研发费用100万。政策数据库中存储的除用户的企业信息以外的企业信息就应为:年纳税额90~110万,净利润990~1100万,年研发费用90~110万。政策数据库中存储的除用户的企业信息以外的企业支信息在均满足上述要求的情况下,可以继续进行判定。
其中,第一优先等级、第二优先等级、第三优先等级代表三个优先等级,每个优先等级内的排序按照上述方式排序,从而使排序更加直观。
进一步的说,所述输出模块在所述第一优先等级、第二优先等级、第三优先等级中,按照如下方式排列相同优先等级的政策名称:
根据政策数据库的企业信息,搜索与所述用户的企业信息的相似度低于预设阈值的政策数据库中存储的除用户的企业信息以外的企业信息作为第一企业信息;
将第一企业信息中的政策名称,根据近N年内的每年的补贴变化幅度X,按如下公式计算总体方差P2
Figure BDA0002233225180000091
P2为总体方差,X为后一年是前一千的变量的百分比,
Figure BDA0002233225180000092
为X的平均值;
根据每个政策名称的总体方差P2的大小,按由小到大作为排序列表;
在相同优先等级的政策名称按所述排序列表排列。
本发明引入了概率论中的总体平方差概念,即,总体平方差越大,代表越不稳定,而代表了政策拨动较大,从而越应该作为不推荐的政策名称推送至用户终端,从而在概率上增加了用户申报政策成功的概率。
例如,N为5,即5年内的省高新的补贴为5万、5万、3万、3万、1万。那么,每年的补贴变化幅度X就为:0%、-40%、0%、-66%。X为-26.5%。而由于5年内的变化次数是4次,因此分母N-1是4。总体方差P2为7.8675%。并将其与其他政策名称的总体方差P2作比较,并按由小到大排序相同优先级的政策名称。
进一步的说,所述政策输入模块以爬虫软件搜索政府网站并截取政策文件图片,通过图像识别软件将红色标题的文件识别为预输入文件,将所述与输入文件中搜索企业支信息的名称,若搜索到的企业支信息的名称的数量超过第一预设阈值,则将所述与输入文件转化为终输入文件,再通过管理员将所述终输入文件中的作为政策判定条件;
若用户的企业支信息均满足所述政策判定条件,将所述政策判定条件所属的政策名称的优先级调整为第一优先级。
本发明通过爬虫软件抓取政策信息并识别其是否为红头文件,并为了判定其是用于考察企业情况的,因此搜索其内容是否出现了超过第一预设阈值的企业支信息的名称的关键词,从而判断其是否是较为有用的信息。最后,让管理员将其转化为政策判定条件,若符合,则将这个政策名称调整为第一优先级,从而实时地适应政策的调整和政策的变更,而为用户推送最新的、最符合用户需求的政策信息。
其中,所述企业支信息的名称可为:年纳税总额、年毛利润、年净利润、员工数量、是否为一般纳税人、是否具备独立办公场所、年营业额、知识产权、专利、商标、学历、人数、时间、户口、残疾人个数、企业所在省、企业所在市、企业所在区等。
本发明可出现的变形是:政策输入模块由管理员直接输入政策判定条件和符合判定条件的企业的企业支信息。
政策判定条件可为:政策支信息。
本发明一种基于大数据的政策自动匹配分析系统的方法,包括如下步骤:
获取政策名称、政策信息和符合所述政策名称的企业信息、用户的企业信息,其中,所述政策信息包括多个政策支信息,所述企业信息包括多个企业支信息;
存储获取政策名称、政策信息和符合所述政策名称的企业信息;
根据符合所述政策名称的企业信息的企业支信息的最差值构建第一企业等级;
根据符合所述政策名称的企业信息的企业支信息的众数构建第二企业等级;
根据所述用户的企业信息判断其是否符合第二企业等级,若是,则将所述政策名称以第一优先级输出,若否,则判断其是否符合第一企业等级,若是,则搜索除用户的企业信息以外的所述企业信息中是否有一个企业信息的每个企业支信息均弱于或等于用户的企业信息的企业支信息,若是,则将政策名称以第二优先级输出,若否,则将政策名称以第三优先级输出并标记并非弱于或等于的企业支信息;
按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端。
进一步的说,按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端的步骤中,还包括:在所述第一优先等级、第二优先等级、第三优先等级中,按照如下方式排列相同优先等级的政策名称:
根据政策数据库的企业信息,搜索与所述用户的企业信息的相似度低于预设阈值的政策数据库中存储的除用户的企业信息以外的企业信息作为第一企业信息;
将第一企业信息中符合的政策名称按由多至少作为排序列表;
在相同优先等级的政策名称按所述排序列表排列。
当然,本发明的一种变形还可为,按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端的步骤中,还包括:在所述第一优先等级、第二优先等级、第三优先等级中,按照如下方式排列相同优先等级的政策名称:
根据政策数据库的企业信息,搜索与所述用户的企业信息的相似度低于预设阈值的政策数据库中存储的除用户的企业信息以外的企业信息作为第一企业信息;
将第一企业信息中的政策名称,根据近N年内的每年的补贴变化幅度X,按如下公式计算总体方差P2
Figure BDA0002233225180000121
P2为总体方差,X为后一年是前一千的变量的百分比,
Figure BDA0002233225180000122
为X的平均值;
根据每个政策名称的总体方差P2的大小,按由小到大作为排序列表;
在相同优先等级的政策名称按所述排序列表排列。
进一步的说,按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端的步骤中,还包括:
以爬虫软件搜索政府网站并截取政策文件图片,通过图像识别软件将红色标题的文件识别为预输入文件,将所述与输入文件中搜索企业支信息的名称,若搜索到的企业支信息的名称的数量超过第一预设阈值,则将所述与输入文件转化为终输入文件,再通过管理员将所述终输入文件中的作为政策判定条件;
若用户的企业支信息均满足所述政策判定条件,将所述政策判定条件所属的政策名称的优先级调整为第一优先级。
以上所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (8)

1.一种基于大数据的政策自动匹配分析系统,其特征在于:包括
政策输入模块,其用于获取政策名称、政策信息和符合所述政策名称的企业信息、用户的企业信息,其中,所述政策信息包括多个政策支信息,所述企业信息包括多个企业支信息;
政策数据库,其用于存储获取政策名称、政策信息和符合所述政策名称的企业信息;
第一企业等级构建模块,其用于根据符合所述政策名称的企业信息的企业支信息的最差值构建第一企业等级;
第二企业等级构建模块,其用于根据符合所述政策名称的企业信息的企业支信息的众数构建第二企业等级;
判断模块,其用于根据所述用户的企业信息判断其是否符合第二企业等级,若是,则将所述政策名称以第一优先级输出,若否,则判断其是否符合第一企业等级,若是,则搜索除用户的企业信息以外的所述企业信息中是否有一个企业信息的每个企业支信息均弱于或等于用户的企业信息的企业支信息,若是,则将政策名称以第二优先级输出,若否,则将政策名称以第三优先级输出并标记并非弱于或等于的企业支信息;
输出模块,其用于按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端。
2.根据权利要求1所述的一种基于大数据的政策自动匹配分析系统,其特征在于:所述输出模块在所述第一优先等级、第二优先等级、第三优先等级中,按照如下方式排列相同优先等级的政策名称:
根据政策数据库的企业信息,搜索与所述用户的企业信息的相似度低于预设阈值的政策数据库中存储的除用户的企业信息以外的企业信息作为第一企业信息;
将第一企业信息中符合的政策名称按由多至少作为排序列表;
在相同优先等级的政策名称按所述排序列表排列。
3.根据权利要求1所述的一种基于大数据的政策自动匹配分析系统,其特征在于:所述输出模块在所述第一优先等级、第二优先等级、第三优先等级中,按照如下方式排列相同优先等级的政策名称:
根据政策数据库的企业信息,搜索与所述用户的企业信息的相似度低于预设阈值的政策数据库中存储的除用户的企业信息以外的企业信息作为第一企业信息;
将第一企业信息中的政策名称,根据近N年内的每年的补贴变化幅度X,按如下公式计算总体方差P2
Figure FDA0002233225170000021
P2为总体方差,X为后一年是前一千的变量的百分比,
Figure FDA0002233225170000022
为X的平均值;
根据每个政策名称的总体方差P2的大小,按由小到大作为排序列表;
在相同优先等级的政策名称按所述排序列表排列。
4.根据权利要求3所述的一种基于大数据的政策自动匹配分析系统,其特征在于:所述政策输入模块以爬虫软件搜索政府网站并截取政策文件图片,通过图像识别软件将红色标题的文件识别为预输入文件,将所述与输入文件中搜索企业支信息的名称,若搜索到的企业支信息的名称的数量超过第一预设阈值,则将所述与输入文件转化为终输入文件,再通过管理员将所述终输入文件中的作为政策判定条件;
若用户的企业支信息均满足所述政策判定条件,将所述政策判定条件所属的政策名称的优先级调整为第一优先级。
5.用于权利要求1所述的一种基于大数据的政策自动匹配分析系统的方法,其特征在于包括如下步骤:
获取政策名称、政策信息和符合所述政策名称的企业信息、用户的企业信息,其中,所述政策信息包括多个政策支信息,所述企业信息包括多个企业支信息;
存储获取政策名称、政策信息和符合所述政策名称的企业信息;
根据符合所述政策名称的企业信息的企业支信息的最差值构建第一企业等级;
根据符合所述政策名称的企业信息的企业支信息的众数构建第二企业等级;
根据所述用户的企业信息判断其是否符合第二企业等级,若是,则将所述政策名称以第一优先级输出,若否,则判断其是否符合第一企业等级,若是,则搜索除用户的企业信息以外的所述企业信息中是否有一个企业信息的每个企业支信息均弱于或等于用户的企业信息的企业支信息,若是,则将政策名称以第二优先级输出,若否,则将政策名称以第三优先级输出并标记并非弱于或等于的企业支信息;
按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端。
6.根据权利要求5所述的一种基于大数据的政策自动匹配分析系统的方法,其特征在于:按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端的步骤中,还包括:在所述第一优先等级、第二优先等级、第三优先等级中,按照如下方式排列相同优先等级的政策名称:
根据政策数据库的企业信息,搜索与所述用户的企业信息的相似度低于预设阈值的政策数据库中存储的除用户的企业信息以外的企业信息作为第一企业信息;
将第一企业信息中符合的政策名称按由多至少作为排序列表;
在相同优先等级的政策名称按所述排序列表排列。
7.根据权利要求6所述的一种基于大数据的政策自动匹配分析系统的方法,其特征在于:按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端的步骤中,还包括:在所述第一优先等级、第二优先等级、第三优先等级中,按照如下方式排列相同优先等级的政策名称:
根据政策数据库的企业信息,搜索与所述用户的企业信息的相似度低于预设阈值的政策数据库中存储的除用户的企业信息以外的企业信息作为第一企业信息;
将第一企业信息中的政策名称,根据近N年内的每年的补贴变化幅度X,按如下公式计算总体方差P2
Figure FDA0002233225170000041
P2为总体方差,X为后一年是前一千的变量的百分比,
Figure FDA0002233225170000042
为X的平均值;
根据每个政策名称的总体方差P2的大小,按由小到大作为排序列表;
在相同优先等级的政策名称按所述排序列表排列。
8.根据权利要求7所述的一种基于大数据的政策自动匹配分析系统,其特征在于:按照第一优先级、第二优先级、第三优先级的顺序将政策名称构建数据列表发送至用户终端的步骤中,还包括:
以爬虫软件搜索政府网站并截取政策文件图片,通过图像识别软件将红色标题的文件识别为预输入文件,将所述与输入文件中搜索企业支信息的名称,若搜索到的企业支信息的名称的数量超过第一预设阈值,则将所述与输入文件转化为终输入文件,再通过管理员将所述终输入文件中的作为政策判定条件;
若用户的企业支信息均满足所述政策判定条件,将所述政策判定条件所属的政策名称的优先级调整为第一优先级。
CN201910974753.5A 2019-10-14 2019-10-14 一种基于大数据的政策自动匹配分析系统 Active CN110728453B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910974753.5A CN110728453B (zh) 2019-10-14 2019-10-14 一种基于大数据的政策自动匹配分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910974753.5A CN110728453B (zh) 2019-10-14 2019-10-14 一种基于大数据的政策自动匹配分析系统

Publications (2)

Publication Number Publication Date
CN110728453A true CN110728453A (zh) 2020-01-24
CN110728453B CN110728453B (zh) 2020-11-17

Family

ID=69221135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910974753.5A Active CN110728453B (zh) 2019-10-14 2019-10-14 一种基于大数据的政策自动匹配分析系统

Country Status (1)

Country Link
CN (1) CN110728453B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111654853A (zh) * 2020-08-04 2020-09-11 索信达(北京)数据技术有限公司 一种基于用户信息的数据分析方法
CN112685638A (zh) * 2020-12-30 2021-04-20 深圳市华傲数据技术有限公司 数据处理方法、设备及存储介质
CN113617695A (zh) * 2021-08-13 2021-11-09 苏州鼎纳自动化技术有限公司 一种产品分料料盒及其检测分离方法
CN114694154A (zh) * 2022-04-11 2022-07-01 平安国际智慧城市科技股份有限公司 文件解析方法、系统及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101398916A (zh) * 2007-09-29 2009-04-01 上海市高新技术成果转化服务中心 智能政策专家系统构建方法
CN104375998A (zh) * 2013-08-13 2015-02-25 王建平 一种智能化的项目匹配分析工具及其实现方法
CN105373602A (zh) * 2015-11-09 2016-03-02 宁波市软件与服务外包产业园管理服务中心 一种政策推送管理系统
CN106383876A (zh) * 2016-09-09 2017-02-08 上海润吧信息技术有限公司 一种智能化的项目匹配系统
CN107944718A (zh) * 2017-11-29 2018-04-20 北京洪泰同创信息技术有限公司 一种企业政策评估系统及方法
CN109062984A (zh) * 2018-06-29 2018-12-21 深圳市彬讯科技有限公司 一种基于标签的数据分析方法及分析系统
CN109242326A (zh) * 2018-09-19 2019-01-18 江苏风云科技服务有限公司 一种基于大数据和人工智能的政策共享系统
CN109408683A (zh) * 2018-10-31 2019-03-01 广州高企云信息科技有限公司 一种政策智能匹配系统及方法
WO2019059717A1 (ko) * 2017-09-22 2019-03-28 김민준 기업 분석 기반 연계 서비스 매칭 플랫폼 제공 시스템
CN109902225A (zh) * 2019-01-22 2019-06-18 广州高企云信息科技有限公司 一种基于大数据的政策信息查询推送系统及方法
CN110297892A (zh) * 2019-05-08 2019-10-01 八戒科技服务有限公司 一种基于政策及客户大数据精准匹配的方法及设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101398916A (zh) * 2007-09-29 2009-04-01 上海市高新技术成果转化服务中心 智能政策专家系统构建方法
CN104375998A (zh) * 2013-08-13 2015-02-25 王建平 一种智能化的项目匹配分析工具及其实现方法
CN105373602A (zh) * 2015-11-09 2016-03-02 宁波市软件与服务外包产业园管理服务中心 一种政策推送管理系统
CN106383876A (zh) * 2016-09-09 2017-02-08 上海润吧信息技术有限公司 一种智能化的项目匹配系统
WO2019059717A1 (ko) * 2017-09-22 2019-03-28 김민준 기업 분석 기반 연계 서비스 매칭 플랫폼 제공 시스템
CN107944718A (zh) * 2017-11-29 2018-04-20 北京洪泰同创信息技术有限公司 一种企业政策评估系统及方法
CN109062984A (zh) * 2018-06-29 2018-12-21 深圳市彬讯科技有限公司 一种基于标签的数据分析方法及分析系统
CN109242326A (zh) * 2018-09-19 2019-01-18 江苏风云科技服务有限公司 一种基于大数据和人工智能的政策共享系统
CN109408683A (zh) * 2018-10-31 2019-03-01 广州高企云信息科技有限公司 一种政策智能匹配系统及方法
CN109902225A (zh) * 2019-01-22 2019-06-18 广州高企云信息科技有限公司 一种基于大数据的政策信息查询推送系统及方法
CN110297892A (zh) * 2019-05-08 2019-10-01 八戒科技服务有限公司 一种基于政策及客户大数据精准匹配的方法及设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111654853A (zh) * 2020-08-04 2020-09-11 索信达(北京)数据技术有限公司 一种基于用户信息的数据分析方法
CN112685638A (zh) * 2020-12-30 2021-04-20 深圳市华傲数据技术有限公司 数据处理方法、设备及存储介质
CN113617695A (zh) * 2021-08-13 2021-11-09 苏州鼎纳自动化技术有限公司 一种产品分料料盒及其检测分离方法
CN114694154A (zh) * 2022-04-11 2022-07-01 平安国际智慧城市科技股份有限公司 文件解析方法、系统及存储介质

Also Published As

Publication number Publication date
CN110728453B (zh) 2020-11-17

Similar Documents

Publication Publication Date Title
CN110728453B (zh) 一种基于大数据的政策自动匹配分析系统
US20180075138A1 (en) Electronic document management using classification taxonomy
US9058581B2 (en) Systems and methods for managing information associated with legal, compliance and regulatory risk
US9063985B2 (en) Method, system, apparatus, program code and means for determining a redundancy of information
US8996481B2 (en) Method, system, apparatus, program code and means for identifying and extracting information
US8762191B2 (en) Systems, methods, apparatus, and schema for storing, managing and retrieving information
US9519883B2 (en) Automatic project content suggestion
EP3451201A1 (en) Processing malicious communications
AU2010249253B2 (en) A method for automatically indexing documents
US20050044037A1 (en) Systems and methods for automated political risk management
US8589419B2 (en) System and method for establishing relevance of objects in an enterprise system
US20140244524A1 (en) System and method for identifying potential legal liability and providing early warning in an enterprise
US7386439B1 (en) Data mining by retrieving causally-related documents not individually satisfying search criteria used
US7519587B2 (en) Method, system, apparatus, program code, and means for determining a relevancy of information
US20050004922A1 (en) Device, System and Method for Converting Specific-Case Information to General-Case Information
US9002842B2 (en) System and method for computerized batching of huge populations of electronic documents
CN111553137B (zh) 报告生成方法、装置、存储介质及计算机设备
CN113486158B (zh) 基于案情比对的类案检索方法、装置、设备及存储介质
KR101803150B1 (ko) 빅데이터를 이용한 중요 판례 추출 및 정리 방법
CN116384889A (zh) 基于自然语言处理技术的情报大数据智能分析方法
CN111191123A (zh) 业务信息推送方法、装置、可读存储介质和计算机设备
CN112182184B (zh) 一种基于审计数据库的精准匹配搜索方法
CN115471042A (zh) 一种企业法务风险评估方法及系统
CN114495138A (zh) 一种智能文档识别与特征提取方法、装置平台和存储介质
Monaco Methods for in-sourcing authority control with MarcEdit, SQL, and regular expressions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant