CN110544023A - 一种企业区域性贡献力的数据化评估系统及其评估方法 - Google Patents
一种企业区域性贡献力的数据化评估系统及其评估方法 Download PDFInfo
- Publication number
- CN110544023A CN110544023A CN201910757225.4A CN201910757225A CN110544023A CN 110544023 A CN110544023 A CN 110544023A CN 201910757225 A CN201910757225 A CN 201910757225A CN 110544023 A CN110544023 A CN 110544023A
- Authority
- CN
- China
- Prior art keywords
- data
- enterprise
- contribution
- evaluation
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种企业区域性贡献力的数据化评估系统,涉及企业评估技术领域,所述企业区域性贡献力的数据化评估系统包括数据获取单元、数据处理单元以及建模计算单元。本发明还公开了采用所述企业区域性贡献力的数据化评估系统的评估方法。本发明通过数据获取单元、数据处理单元以及建模计算单元构建了个性化、多维度的企业评估体系,使评估模型满足不同区域的多样化评估需求,并利用机器学习算法获得评估模型参数,减少了人为参与,评估结果更加客观,可以有效满足区域性企业管理机构的企业评估分析需求,分析结果也可为企业管理机构后续的政策精准投放、精准招商等管理工作提供有效帮助,具有广阔的市场前景。
Description
技术领域
本发明涉及企业评估技术领域,具体是一种企业区域性贡献力的数据化评估系统及其评估方法。
背景技术
企业作为开展经济活动的重要主体,涉及到社会经济的各个方面。由于企业具有一定的区域性,即某个区域范围(例如市县、城区、园区等)内的企业构成了一个企业集合,由区域对应的管理机构统一管理(例如地方政府机构、园区管委会等),因此,区域性管理机构在管理辖区内的企业时,在管理上有着不同于单个企业分析的特殊需求。
从分析角度来说,企业对其自身的经营、管理、产品、舆情等方面更为重视,而从企业管理机构的角度来看,企业对本区域的税收、投资收益、就业、创新、产业建设、环保等方面的贡献度则是企业管理机构更为关注的方面。另外,评估一个企业对区域的贡献,不仅和企业自身有关,同一个企业,在不同区域的企业团体中,体现出来的价值也是不同的,而且不同的区域对辖区内企业的衡量标准也不同。
目前,现有的企业评估分析方法多是从企业利税、风险评估、经营状况等某个单独的方面对企业进行定性分析,这样的分析结果难以全面准确评估企业的贡献情况,而且,由于采用同一模型来评估不同区域的企业贡献力,进而导致无法满足区域管理的个性化要求。因此,设计出一种企业区域性贡献力的数据化评估系统,成为亟需解决的问题。
发明内容
本发明的目的在于提供一种企业区域性贡献力的数据化评估系统及其评估方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种企业区域性贡献力的数据化评估系统,包括:
数据获取单元,用于采集区域内企业的政务数据和公开的互联网数据并得到多维度数据,通过获取政务数据和公开的互联网数据来得到企业的多维度数据,综合考虑企业和区域管理者的关注重点以及数据获取代价,以便确定模型维度,并不断根据实际使用效果反馈调整优化模型;
数据处理单元,用于接收数据获取单元得到的多维度数据并进行整合、清洗与预处理,同时将预处理后得到的企业大数据分别存储到数据库中对应的数据表中,供后续分析使用;
建模计算单元,用于获取数据处理单元存储到数据库中的企业大数据并利用机器学习算法计算模型参数得到个性化的企业区域性贡献力评估模型,同时将企业的各维度数据输入模型中得到企业的各维度贡献值及总贡献值。
作为本发明进一步的方案:所述采集包括政务数据对接和互联网数据爬取;所述政务数据对接为对接区域内企业的非公开数据,例如纳税、产值、就业等相关数据,这些数据可以从区域管理机构获得;所述互联网数据爬取为利用爬虫技术抓取互联网上的区域内企业公开数据,包括但不限于企业基本信息、企业司法信息、经营信息、舆情、产品、市场情况等数据。
作为本发明再进一步的方案:所述数据获取单元包括数据对接子单元与数据爬取子单元;所述数据对接子单元用于对接区域内企业的非公开数据,例如纳税、产值、就业等相关数据;所述数据爬取子单元用于利用爬虫技术抓取互联网上的区域内企业公开数据,包括但不限于企业基本信息、企业司法信息、经营信息、舆情、产品、市场情况等数据。
作为本发明再进一步的方案:所述数据处理单元包括:
数据整合子单元,用于接收数据获取单元得到的多维度数据并根据企业的标识字段进行数据整合获得以企业为单位的高维度数据集合;
数据清洗子单元,用于对高维度数据集合进行重复数据删除、异常值处理、缺失值填充、量纲统一等操作,得到初步处理数据;
数据预处理子单元,用于对初步处理数据进行字段拆分和添加衍生字段等预处理操作;
数据存储子单元,用于将预处理后得到的企业大数据分别存储到数据库中对应的数据表中,供后续分析使用。
作为本发明再进一步的方案:所述建模计算单元包括:
建模分析子单元,用于获取数据处理单元存储到数据库中的企业大数据,并根据企业大数据利用机器学习算法进行模型训练,得到模型指标对应的参数,进而获得企业区域性贡献力评估模型,需要说明的是,该单元中使用的机器学习方法依据获取得到的数据量不同可以采用不同模型,若训练样本较少,则可采用多元线性回归模型,若训练样本较多则可尝试使用多项式回归模型;
贡献力计算子单元,用于将企业的各维度数据输入训练好的企业区域性贡献力评估模型中,输出得到企业的各维度贡献值及总贡献值。
一种采用上述的企业区域性贡献力的数据化评估系统的评估方法,步骤如下:
1)确定模型维度:选取企业区域性贡献力评估模型的主要维度和次要维度;其中所述主要维度包括企业利税、投资效益、人力资源、创新能力、产业优势和环保指数六大方面,是决定企业的区域贡献力的重要维度,为评估模型的必选维度,通过选取这六个维度作为模型的主要维度;所述次要维度包括企业品牌信息、投融资情况、经营状况、公司风险等,在实际使用中,根据各个区域的企业管理不同需求,需要结合区域管理者实际需求和数据获取情况等综合考虑;
2)企业数据采集:根据步骤1)中选取的企业区域性贡献力评估模型的主要维度和次要维度,通过数据获取单元采集区域内企业的政务数据和公开的互联网数据,进而得到企业多维度数据;
3)数据整合及存储:通过数据处理单元接收步骤2)中数据获取单元得到的多维度数据并进行整合、清洗与预处理,同时将预处理后得到的企业大数据分别存储到数据库中对应的数据表中供后续分析使用,为后续企业区域性贡献力评估提供基础;
4)模型训练及计算:通过建模计算单元获取步骤3)中存储到数据库中的企业大数据并利用机器学习算法计算模型参数得到个性化的企业区域性贡献力评估模型,同时将企业的各维度数据输入模型中得到企业的各维度贡献值及总贡献值。
一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现上述方法的步骤。
与现有技术相比,本发明的有益效果是:
本发明设置了数据获取单元、数据处理单元以及建模计算单元,通过数据获取单元、数据处理单元以及建模计算单元构建了个性化、多维度的企业评估体系,使评估模型满足不同区域的多样化评估需求,并利用机器学习算法获得评估模型参数,减少了人为参与,评估结果更加客观,可以有效满足区域性企业管理机构的企业评估分析需求,分析结果也可为企业管理机构后续的政策精准投放、精准招商等管理工作提供有效帮助,具有广阔的市场前景。
附图说明
图1为企业区域性贡献力的数据化评估系统的框图。
图2为采用企业区域性贡献力的数据化评估系统的评估方法的流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细地说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
请参阅图1,在本发明提供的一个实施例中,一种企业区域性贡献力的数据化评估系统,包括:
数据获取单元,用于采集区域内企业的政务数据和公开的互联网数据并得到多维度数据,通过获取政务数据和公开的互联网数据来得到企业的多维度数据,综合考虑企业和区域管理者的关注重点以及数据获取代价,以便确定模型维度,并不断根据实际使用效果反馈调整优化模型;
数据处理单元,用于接收数据获取单元得到的多维度数据并进行整合、清洗与预处理,同时将预处理后得到的企业大数据分别存储到数据库中对应的数据表中,供后续分析使用;
建模计算单元,用于获取数据处理单元存储到数据库中的企业大数据并利用机器学习算法计算模型参数得到个性化的企业区域性贡献力评估模型,同时将企业的各维度数据输入模型中得到企业的各维度贡献值及总贡献值。
进一步的,在本发明实施例中,所述数据获取单元、数据处理单元以及建模计算单元依次连接;所述多维度数据包括主要维度数据和次要维度数据,所述主要维度数据包含企业利税、投资效益、人力资源、创新能力、产业优势、环保指数六大方面的数据,主要维度是决定企业的区域贡献力的重要维度,为评估模型的必选维度;所述次要维度数据可包含企业品牌信息、投融资情况、经营状况、公司风险等,在实际使用中需结合区域管理者实际需求和数据获取情况等综合考虑。
进一步的,在本发明实施例中,所述采集包括政务数据对接和互联网数据爬取;所述政务数据对接为对接区域内企业的非公开数据,例如纳税、产值、就业等相关数据,这些数据可以从区域管理机构获得;所述互联网数据爬取为利用爬虫技术抓取互联网上的区域内企业公开数据,包括但不限于企业基本信息、企业司法信息、经营信息、舆情、产品、市场情况等数据。
进一步的,在本发明实施例中,所述数据获取单元包括数据对接子单元与数据爬取子单元;所述数据对接子单元用于对接区域内企业的非公开数据,例如纳税、产值、就业等相关数据,这些数据可以从区域管理机构获得;所述数据爬取子单元用于利用爬虫技术抓取互联网上的区域内企业公开数据,包括但不限于企业基本信息、企业司法信息、经营信息、舆情、产品、市场情况等数据。
进一步的,在本发明实施例中,所述数据处理单元包括:
数据整合子单元,用于接收数据获取单元得到的多维度数据并根据企业的标识字段进行数据整合获得以企业为单位的高维度数据集合,即将原始的以业务维度组织的数据整合为以企业为单位的数据,具体的,通过数据整合子单元将不同来源的企业多维度数据按照企业唯一标识等关键信息进行匹配和整合,具体包括:利用数据中的企业纳税人识别号、企业名称、简称、股票代码等字段将数据以企业为单位进行整合,最终获得以企业为单位的高维度数据集合;
数据清洗子单元,用于对高维度数据集合进行重复数据删除、异常值处理、缺失值填充、量纲统一等操作,得到初步处理数据,此过程中重点处理通过利用爬虫技术抓取的互联网上的区域内企业公开数据;
数据预处理子单元,用于对初步处理数据进行字段拆分和添加衍生字段等预处理操作;
数据存储子单元,用于将预处理后得到的企业大数据分别存储到数据库中对应的数据表中,供后续分析使用。
进一步的,在本发明实施例中,所述建模计算单元包括:
建模分析子单元,用于获取数据处理单元存储到数据库中的企业大数据,并根据企业大数据利用机器学习算法进行模型训练,得到模型指标对应的参数,进而获得企业区域性贡献力评估模型,需要说明的是,该单元中使用的机器学习方法依据获取得到的数据量不同可以采用不同模型,若训练样本较少,则可采用多元线性回归模型,若训练样本较多则可尝试使用多项式回归模型;
贡献力计算子单元,用于将企业的各维度数据输入训练好的企业区域性贡献力评估模型中,输出得到企业的各维度贡献值及总贡献值。
请参阅图2,在本发明提供的另一个实施例中,一种采用上述企业区域性贡献力的数据化评估系统的评估方法,步骤如下:
1)确定模型维度:选取企业区域性贡献力评估模型的主要维度和次要维度;其中所述主要维度包括企业利税、投资效益、人力资源、创新能力、产业优势和环保指数六大方面,是决定企业的区域贡献力的重要维度,为评估模型的必选维度,通过选取这六个维度作为模型的主要维度;所述次要维度包括企业品牌信息、投融资情况、经营状况、公司风险等,在实际使用中,根据各个区域的企业管理不同需求,需要结合区域管理者实际需求和数据获取情况等综合考虑。
需要说明的是,由于企业区域性贡献力评估模型构建是一个不断优化的过程,在实际构建中需要根据实际使用情况不断调整以获得模型的效果、代价和复杂度的最优平衡,具体的,可以选取工商、经营、风险、财务、舆情、行政监管、信用等次要维度中的一项或多项加入到评估模型中,综合考虑区域管理者的关注重点以及数据获取代价,确定模型维度,并不断根据实际使用效果反馈调整优化模型。
可以理解的,所述企业区域性贡献力评估模型的主要维度共有六个,包括:
企业利税,包括企业年度的国税、地税纳税额;
投资效益,对投入和产出的分析,包括企业总投资、投资强度、产值,并根据基础数据计算得到亩均投资、亩均产值、人均产出等指标;
人力资源,主要考察企业对于解决地方就业及吸引人才等方面所做的贡献,具体包括就业总人数、本科人数、硕士人数、博士人数,以及领军人才、院士等高级人才的人数等;
创新能力,主要考察企业的科技含量,主要数据包括:是否高新认证企业、专利数量、研发经费支出、销售收入等,根据研发经费支出和销售收入计算研发经费投入强度;
产业优势,考察企业所属行业的前景和在园区内的聚集程度,包括:所属产业类型、是否为区域内重点发展产业、同行业企业数量、企业在同行业排名、上下游配套企业数量、所属产业在区域内的龙头企业数量;
环保指数,考察企业耗能、污染排放量等,主要采集数据包括:主要污染物排放当量、是否重点排污企业、企业发生的一般、较大和重大突发环境事件次数等。
另外,除了这六大类主要维度,还可根据实际需要,选择其他次要维度加入到评估模型中,具体次要维度可以包括企业工商信息、经营信息、产品口碑信息、舆情信息、信用信息等。
2)企业数据采集:根据步骤1)中选取的企业区域性贡献力评估模型的主要维度和次要维度,通过数据获取单元采集区域内企业的政务数据和公开的互联网数据,进而得到企业多维度数据。
其中,所述采集包括政务数据对接和互联网数据爬取,从数据来源来看,区域内企业相关的数据可以分为非公开的政务数据和公开的互联网数据;
所述政务数据是指通过行政手段依法获取并用于政务活动的大数据,例如企业税务、财务、人力等数据;对于不同的区域类型和数据维度,企业非公开数据的所属机构不同,例如,对于开发区、工业园区,企业相关数据的管理部门包括园区管委会、园区所属区域的相关政府部门,这一类企业数据的数据质量较高,可靠性高,可通过与企业数据管理部门合作的方法获取;
所述公开的互联网数据是指可以在互联网上搜索访问得到的企业数据,这一类数据作为企业政务数据的重要补充,数据种类丰富,来源广泛,但与企业政务数据相比,数据质量较低,可靠性低。这类数据主要包括企业经营信息、发展情况、品牌及市场、网络舆情等各个方面;而且,这一类数据需要利用网络爬虫技术(例如python的scrapy、pyspider、sola等框架)以分布式爬取各种类型的网页信息,例如爬取动态页面,以及涉及状态转换、反爬虫机制、高并发等较为复杂的爬取需求;利用上述技术可以获取到大量企业的互联网大数据。
需要说明的是,此步骤中获取的数据维度取决于步骤1)中确定的模型维度,模型维度越多,则对应的需要采集的数据维度也越多,数据获取代价越大。
3)数据整合及存储:通过数据处理单元接收步骤2)中数据获取单元得到的多维度数据并进行整合、清洗与预处理,同时将预处理后得到的企业大数据分别存储到数据库中对应的数据表中供后续分析使用,为后续企业区域性贡献力评估提供基础。
具体的,通过步骤2)中两种途径获取到的企业原始数据由于是孤立、分散的,还可能存在重复、数据格式非法、数据量纲不统一、不规范编码等问题,因此上述原始数据还不能直接使用,需要进行数据预处理,以提高数据质量,统一数据标准。
进一步的,所述整合为将不同来源的多维度数据按照企业唯一标识等关键信息进行匹配和整合。具体包括:利用数据中的企业纳税人识别号、企业名称、简称、股票代码等字段将数据以企业为单位整合进行整合,最终获得以企业为单位的高维度数据集合。
进一步的,所述清洗为对高维度数据集合进行重复数据删除、异常值处理、缺失值填充、量纲统一等操作,得到初步处理数据,此过程中重点处理通过利用爬虫技术抓取的互联网上的区域内企业公开数据。
进一步的,所述预处理为对初步处理数据进行字段拆分和添加衍生字段等预处理操作。
进一步的,所述存储为将预处理后得到的企业大数据分别存储到数据库中对应的数据表中,供后续分析使用。
4)模型训练及计算:通过建模计算单元获取步骤3)中存储到数据库中的企业大数据并利用机器学习算法计算模型参数得到个性化的企业区域性贡献力评估模型,同时将企业的各维度数据输入模型中得到企业的各维度贡献值及总贡献值。
具体的,利用机器学习算法计算模型参数,得到企业区域性贡献力评估模型,将有标注的企业大数据划分为训练集和测试集,并利用交叉验证进行模型训练,得到评估模型对应的参数值,从而确定个性化的区域内企业贡献力评估模型,并依据模型计算企业的贡献值输出得到园区企业最终分析结果,即企业的各维度贡献值及总贡献值,其中,所述机器学习算法可以是现有技术中的线性回归、逻辑回归、线性判别分析、分类与回归树分析、朴素贝叶斯、K最近邻算法、学习矢量量化、支持向量机等。
进一步的,在本发明实施例中,所述模型训练及计算包括以下步骤:
根据指标计算公式计算得到评估体系中的各维度二级指标;
将区域内企业的二级指标数据进行归一化处理,并将已有的一级指标数据作为训练数据集,代入到机器学习模型中训练,得到二级指标参数权重和一级指标参数权重,然后利用训练好的评估模型,将企业的各维度数据输入模型中,输出得到企业的各维度贡献值及总贡献值。
需要说明的是,利用机器学习方法获取的各个区域的评估模型对应的指标权重各不相同,体现了不同区域对企业贡献力的考察重点不同,例如,对于环保要求较高的区域,评估模型中环保指数维度对应的权重更高;而对于重点发展产业较为明确的区域,产业优势维度对应的权重更高。
除非本文中有明确的说明,上述实施例方法中的步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,其中至少一部分步骤并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤也不必然是依次进行,而是可以与其它步骤轮流或者交替地执行。
本发明的有益效果是:本发明设置了数据获取单元、数据处理单元以及建模计算单元,通过数据获取单元、数据处理单元以及建模计算单元构建了个性化、多维度的企业评估体系,使评估模型满足不同区域的多样化评估需求,并利用机器学习算法获得评估模型参数,减少了人为参与,评估结果更加客观,可以有效支持区域性企业管理机构的企业评估分析需求,分析结果也可为企业管理机构后续的政策精准投放、精准招商等管理工作提供有效帮助;同时,本发明通过设计一个面向限定区域(城市、县区、园区等)的企业贡献力评估分析模型,不同的区域对应不同的个性化评估模型,有不同的评估维度和模型参数,而不是所有区域采用完全相同的通用模型,更符合不同区域各自的特点,满足区域管理的个性化要求;而且,本发明利用大量数据训练评估模型以确定模型参数,而不是专家凭借经验确定参数,模型结果更加科学和客观,同以往的企业评估分析方法相比,本发明从区域管理者的角度构建企业评估模型的主要维度和次要维度,并利用机器学习算法确定模型参数,进而为每一个区域构建其特有的企业贡献力评估模型,从而为不同区域的个性化企业管理工作提供有力支撑。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,例如,本发明相关的算法通过现有产品中的软件系统《HCR大数据企业分析平台》完成实施,该系统由python语言开发,通过编程实现本发明方法的相关算法,即完成了基于新方法评估企业区域性贡献力的全部处理过程,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为随机存储器、闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等。
上面对本发明的较佳实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明的保护范围之中。
Claims (8)
1.一种企业区域性贡献力的数据化评估系统,其特征在于,包括:
数据获取单元,用于采集区域内企业的政务数据和公开的互联网数据并得到多维度数据;
数据处理单元,用于接收数据获取单元得到的多维度数据并进行整合、清洗与预处理,同时将预处理后得到的企业大数据分别存储到数据库中对应的数据表中;
建模计算单元,用于获取数据处理单元存储到数据库中的企业大数据并利用机器学习算法计算模型参数得到个性化的企业区域性贡献力评估模型,同时将企业的各维度数据输入模型中得到企业的各维度贡献值及总贡献值。
2.根据权利要求1所述的企业区域性贡献力的数据化评估系统,其特征在于,所述采集包括政务数据对接和互联网数据爬取。
3.根据权利要求2所述的企业区域性贡献力的数据化评估系统,其特征在于,所述政务数据对接为对接区域内企业的非公开数据;
所述互联网数据爬取为利用爬虫技术抓取互联网上的区域内企业公开数据。
4.根据权利要求1-3任一所述的企业区域性贡献力的数据化评估系统,其特征在于,所述数据获取单元包括数据对接子单元与数据爬取子单元;
所述数据对接子单元用于对接区域内企业的非公开数据,所述数据爬取子单元用于利用爬虫技术抓取互联网上的区域内企业公开数据。
5.根据权利要求4所述的企业区域性贡献力的数据化评估系统,其特征在于,所述数据处理单元包括:
数据整合子单元,用于接收数据获取单元得到的多维度数据并根据企业的标识字段进行数据整合获得以企业为单位的高维度数据集合;
数据清洗子单元,用于对高维度数据集合进行重复数据删除、异常值处理、缺失值填充和量纲统一,得到初步处理数据;
数据预处理子单元,用于对初步处理数据进行字段拆分和添加衍生字段操作以获得预处理后得到的企业大数据;
数据存储子单元,用于将预处理后得到的企业大数据分别存储到数据库中对应的数据表中以供后续分析使用。
6.根据权利要求4所述的企业区域性贡献力的数据化评估系统,其特征在于,所述建模计算单元包括:
建模分析子单元,用于获取数据处理单元存储到数据库中的企业大数据,并根据企业大数据利用机器学习算法进行模型训练,得到模型指标对应的参数,进而获得个性化的企业区域性贡献力评估模型;
贡献力计算子单元,用于将企业的各维度数据输入企业区域性贡献力评估模型中,并输出得到企业的各维度贡献值及总贡献值。
7.一种采用如权利要求1-6任一所述企业区域性贡献力的数据化评估系统的评估方法,其特征在于,步骤如下:
1)确定模型维度:选取企业区域性贡献力评估模型的主要维度和次要维度;
2)企业数据采集:根据步骤1)中选取的企业区域性贡献力评估模型的主要维度和次要维度,通过数据获取单元采集区域内企业的政务数据和公开的互联网数据,进而得到企业多维度数据;
3)数据整合及存储:通过数据处理单元接收步骤2)中数据获取单元得到的多维度数据并进行整合、清洗与预处理,同时将预处理后得到的企业大数据分别存储到数据库中对应的数据表中供后续分析使用;
4)模型训练及计算:通过建模计算单元获取步骤3)中存储到数据库中的企业大数据并利用机器学习算法计算模型参数得到个性化的企业区域性贡献力评估模型,同时将企业的各维度数据输入模型中得到企业的各维度贡献值及总贡献值。
8.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求7中所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910757225.4A CN110544023A (zh) | 2019-08-16 | 2019-08-16 | 一种企业区域性贡献力的数据化评估系统及其评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910757225.4A CN110544023A (zh) | 2019-08-16 | 2019-08-16 | 一种企业区域性贡献力的数据化评估系统及其评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110544023A true CN110544023A (zh) | 2019-12-06 |
Family
ID=68711421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910757225.4A Pending CN110544023A (zh) | 2019-08-16 | 2019-08-16 | 一种企业区域性贡献力的数据化评估系统及其评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110544023A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112085476A (zh) * | 2020-09-15 | 2020-12-15 | 江西现代职业技术学院 | 一种企业管理综合评价系统 |
CN113642757A (zh) * | 2021-06-01 | 2021-11-12 | 北京慧辰资道资讯股份有限公司 | 一种基于人工智能的物联网充电桩建设规划的方法及系统 |
CN113673870A (zh) * | 2021-08-23 | 2021-11-19 | 杭州安恒信息技术股份有限公司 | 一种企业数据分析方法及相关组件 |
CN116779095A (zh) * | 2023-04-27 | 2023-09-19 | 西南交通大学 | 一种知识数据双驱动的合理用药预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160321587A1 (en) * | 2015-05-01 | 2016-11-03 | Bki Software Solutions | Project analysis, data driven recommendations, alert generation and project user interface generation system |
CN107464037A (zh) * | 2017-07-05 | 2017-12-12 | 九次方大数据信息集团有限公司 | 基于多指标维度模型的企业画像方法及系统 |
CN108572967A (zh) * | 2017-03-09 | 2018-09-25 | 神州数码系统集成服务有限公司 | 一种创建企业画像的方法及装置 |
CN109636242A (zh) * | 2019-01-03 | 2019-04-16 | 深圳壹账通智能科技有限公司 | 企业评分方法、装置、介质及电子设备 |
CN110119413A (zh) * | 2019-04-30 | 2019-08-13 | 京东城市(南京)科技有限公司 | 数据融合的方法和装置 |
-
2019
- 2019-08-16 CN CN201910757225.4A patent/CN110544023A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160321587A1 (en) * | 2015-05-01 | 2016-11-03 | Bki Software Solutions | Project analysis, data driven recommendations, alert generation and project user interface generation system |
CN108572967A (zh) * | 2017-03-09 | 2018-09-25 | 神州数码系统集成服务有限公司 | 一种创建企业画像的方法及装置 |
CN107464037A (zh) * | 2017-07-05 | 2017-12-12 | 九次方大数据信息集团有限公司 | 基于多指标维度模型的企业画像方法及系统 |
CN109636242A (zh) * | 2019-01-03 | 2019-04-16 | 深圳壹账通智能科技有限公司 | 企业评分方法、装置、介质及电子设备 |
CN110119413A (zh) * | 2019-04-30 | 2019-08-13 | 京东城市(南京)科技有限公司 | 数据融合的方法和装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112085476A (zh) * | 2020-09-15 | 2020-12-15 | 江西现代职业技术学院 | 一种企业管理综合评价系统 |
CN113642757A (zh) * | 2021-06-01 | 2021-11-12 | 北京慧辰资道资讯股份有限公司 | 一种基于人工智能的物联网充电桩建设规划的方法及系统 |
CN113642757B (zh) * | 2021-06-01 | 2024-02-27 | 北京慧辰资道资讯股份有限公司 | 一种基于人工智能的物联网充电桩建设规划的方法及系统 |
CN113673870A (zh) * | 2021-08-23 | 2021-11-19 | 杭州安恒信息技术股份有限公司 | 一种企业数据分析方法及相关组件 |
CN113673870B (zh) * | 2021-08-23 | 2024-04-30 | 杭州安恒信息技术股份有限公司 | 一种企业数据分析方法及相关组件 |
CN116779095A (zh) * | 2023-04-27 | 2023-09-19 | 西南交通大学 | 一种知识数据双驱动的合理用药预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dzwigol et al. | An entrepreneurship model for assessing the investment attractiveness of regions | |
CN110544023A (zh) | 一种企业区域性贡献力的数据化评估系统及其评估方法 | |
US7930242B2 (en) | Methods and systems for multi-credit reporting agency data modeling | |
CN112182246B (zh) | 通过大数据分析建立企业画像的方法、系统、介质及应用 | |
Nermend | Vector calculus in regional development analysis: Comparative regional analysis using the example of Poland | |
Papagiannidis et al. | Identifying industrial clusters with a novel big-data methodology: Are SIC codes (not) fit for purpose in the Internet age? | |
KR102121901B1 (ko) | 정책자금 온라인 심사평가 시스템 | |
US20060004701A1 (en) | System and method for adaptive decision making analysis and assessment | |
CN114077980A (zh) | 智能供应商管理系统及智能供应商管理方法 | |
Jeong et al. | A systemic approach to exploring an essential patent linking standard and patent maps: Application of generative topographic mapping (GTM) | |
Grander et al. | Big data as a value generator in decision support systems: A literature review | |
Zhu et al. | Research on relationship between government innovation funding and firms value creation using clustering-rough sets | |
Zhou et al. | DEA models with undesirable inputs, intermediates, and outputs | |
Feng | Data analysis and prediction modeling based on deep learning in E-commerce | |
Wang et al. | Study on the influence of COVID-19 on the growth of China’s small and medium-sized construction enterprises | |
CN112506930B (zh) | 一种基于机器学习技术的数据洞察系统 | |
Mahalle et al. | Data Acquisition and Preparation | |
Bacci et al. | Insights from the co-authorship network of the Italian academic statisticians | |
CN116308158B (zh) | 一种国有资产监督管理系统 | |
Simbürger | Filter methods for MRIO tables: an evaluation | |
NL2029769B1 (en) | Method and system for generating credit rating of agricultural specialized service provider | |
US20230394582A1 (en) | User interface for guiding actions for desired impact | |
Furtado et al. | Machine Learning Simulates Agent-Based Model Towards Policy | |
Babour et al. | Automatic Generation of a Metric Report: A Case Study of Scientometric Analytics | |
CN113723924A (zh) | 企业画像构建方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191206 |