CN114819618A - 辅助政府投资决策的企业画像模型的构建方法 - Google Patents
辅助政府投资决策的企业画像模型的构建方法 Download PDFInfo
- Publication number
- CN114819618A CN114819618A CN202210433077.2A CN202210433077A CN114819618A CN 114819618 A CN114819618 A CN 114819618A CN 202210433077 A CN202210433077 A CN 202210433077A CN 114819618 A CN114819618 A CN 114819618A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- negative
- evaluation
- index
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 19
- 238000011156 evaluation Methods 0.000 claims abstract description 94
- 238000000034 method Methods 0.000 claims abstract description 83
- 239000011159 matrix material Substances 0.000 claims abstract description 54
- 238000012797 qualification Methods 0.000 claims description 18
- 238000013139 quantization Methods 0.000 claims description 14
- 239000002131 composite material Substances 0.000 claims description 12
- 230000000694 effects Effects 0.000 claims description 11
- 238000011161 development Methods 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 6
- 238000013508 migration Methods 0.000 claims description 4
- 230000005012 migration Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012827 research and development Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 239000010754 BS 2869 Class F Substances 0.000 claims description 2
- 238000012552 review Methods 0.000 claims description 2
- 238000013515 script Methods 0.000 claims description 2
- 230000008859 change Effects 0.000 abstract description 3
- 230000000737 periodic effect Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 7
- 230000018109 developmental process Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000011066 ex-situ storage Methods 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241001529849 Dracocephalum Species 0.000 description 1
- 241000377209 Unicorn Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了辅助政府投资决策的企业画像模型的构建方法,其包括以下步骤:构建企业标签体系、科学选取评价指标、量化企业画像模型,其中,量化企业画像模型时,首先建立评价指标与标签的关系矩阵,然后基于AHP‑CRITIC主客观赋权法计算企业画像模型的指标权重,最后将经企业标签层确定的企业评价结果与通过AHP‑CRITIC方法获得综合权重相乘得到综合得分,从而量化正面维度的和负面维度的企业画像模型。在政府投资决策领域,本发明首次将企业标签体系融合运用于企业评价体系,不仅实现了企业评价因素根据政策的变化进行周期性调整,而且可以支撑多维度企业画像,帮助政府筛选出正面优质企业或负面风险企业。
Description
技术领域
本发明涉及企业画像模型及其构建方法,具体涉及辅助政府投资决策的企业画像模型及其构建方法,属于数据处理技术领域。
背景技术
政府投资决策首先要解决的是企业评价,而现有企业评价指标体系主要从企业财务、企业效益方面进行考量,涉及企业评价的角度不够全面,企业画像是企业形象的标签化,可从多角度快速反映企业情况,用以支撑政府投资决策所需的多方面评价需求。
企业画像的宗旨是对企业情况的客观的、多方面的、数字化的反映,最终用于支撑企业评价。
企业画像构建的核心是企业标签体系的构建,企业标签的选取既要考虑现有数据的可获得性,也要能够支撑企业评价工作。企业标签体系的构建过程也是企业画像模型的构建过程。
发明内容
本发明的目的在于:通过对影响政府投资决策的各类因素进行分析,确定企业标签的选取原则,并在此基础上,通过主客观相结合的标签量化方法,构建出辅助政府投资决策的企业画像模型。
为了实现上述目标,本发明采用如下的技术方案:
辅助政府投资决策的企业画像模型的构建方法,其特征在于,包括以下步骤:
Step1、构建企业标签体系
在企业注册层面、经营层面、成果层面、信用层面、风评层面和发展层面,从现有数据中选取连续、完整并且能够支撑企业数字化形象描绘、企业筛选与企业评价的企业定量标签和定性标签,构建出企业标签体系;
Step2、科学选取评价指标
评价指标包括:正面维度评价指标、负面维度评价指标和相关因素评价指标,其中,正面维度评价指标通过LDA模型确定,负面维度评价指标通过市场监督管理、媒体和评定确定,相关因素评价指标为企业外迁倾向;
Step3、量化企业画像模型
首先,建立评价指标与标签的关系矩阵,具体如下:
设企业评价指标集矩阵为C,Ci是每个评价指标,则企业评价指标集矩阵C的表示具体如下:
C=[C1 C2 … Cn]
设每个评价指标Ci对应的指标值为ci,则指标值矩阵c的表示具体如下:
c=[c1 c2 … cn]
设某一企业的标签集矩阵为T,tik是每个标签项的值,列值为空处补0,则某一企业的标签集矩阵T的表示具体如下:
建立每个指标值ci与企业每个标签项的值tik的量化规则矩阵Zi,量化规则矩阵Zi的表示具体如下:
ci=max(Zi)
则得到某一企业在某一维度上的指标值矩阵c,c的表示具体如下:
c=[max(Z1) max(Z2) … max(Zn)]
然后,基于AHP-CRITIC主客观赋权法计算企业画像模型的指标权重,具体如下:
通过AHP主观赋权法获得专家经验判断,通过CRITIC客观赋权法获得客观权重,将通过AHP方法得到的权重结果αi与通过CRITIC方法得到的权重结果βi相结合得到综合权重ωi:
最后,量化正面维度的和负面维度的企业画像模型,分别如下:
(1)量化正面维度的企业画像模型
将经企业标签层确定的企业正面维度的评价结果ci-正面与通过AHP-CRITIC方法获得的正面维度的综合权重ωi-正面相乘,得到正面维度的综合得分W正面:
其中:
ci-正面=max(Zi-正面)
设置正面维度的综合得分W正面的合理阈值,筛选出正面优质企业;
(2)量化负面维度的企业画像模型
将经企业标签层确定的企业负面维度的评价结果ci-负面与通过AHP-CRITIC方法获得负面维度的综合权重ωi-负面相乘,得到负面维度的综合得分W负面:
其中:
ci-负面=max(Zi-负面)
设置负面维度的综合得分W负面的合理阈值,筛选出负面风险企业。
本发明的有益之处在于:
(1)在政府投资决策领域,首次将企业标签体系融合运用于企业评价体系,不仅实现了企业评价因素根据政策的变化进行周期性调整,而且可以支撑多维度企业画像,帮助政府筛选出正面优质企业或负面风险企业;
(2)将企业画像模型分为总体目标层、中间层、评价指标层、标签层四层结构,从而将评价指标与企业标签有机融合,进而实现了企业评价指标体系的快速构建;
(3)引入了CRITIC客观赋权法,用来修正评价指标的AHP层次分析结果,解决了企业评价时由于专家打分带来的主观偏差问题;
(4)创新性地提出了基于AHP-CRITIC主客观赋权的企业画像模型的量化算法,实现了企业画像模型的量化,可以很好的支撑企业评价;
(5)按照本发明给出的方法构建出的企业画像模型有助于优质企业发现、高风险企业识别与外迁企业提早预知,从而辅助政府投资决策,促进政府数字化转型与智慧城市建设。
附图说明
图1(a)是JIEBA分词后输出主题的辨识性对比图;
图1(b)是HANLP短语切分后输出主题的辨识性对比图;
图2是主题困惑度图;
图3是主题距离图;
图4是企业画像模型的层次架构图。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
政府投资重点维度的企业画像模型的构建过程,也是企业标签体系的设计、采集、处理、算法设计与实现过程。
本发明提供的辅助政府投资决策的企业画像模型的构建方法,其整体思路是:
首先,明确企业标签的选取原则与选取依据,在此基础上构建企业标签体系;
然后,基于现有政策文本,通过LDA主题聚类工具,了解政府投资对象的能力要求,明确辅助政府投资决策所需的企业评价指标;
最后,结合企业标签体系和评价指标体系,构建企业画像模型的层次架构,以企业标签来支撑企业评价,基于AHP-CRITIC主客观赋权方法,设计适合企业画像模型的量化算法,并量化企业画像模型,评出正面优质或负面风险企业。
一、构建企业标签体系
1、企业标签选取的原则
(1)标签数据可获得性
企业画像的构建首先要立足现有数据的基础上之上。政务大数据的汇聚与共享是一个长期过程,目前该项工作虽已逐步进入正轨,但个体企业数据,尤其是企业财务与研发数据始终为企业战略性核心数据,无论何时都难以充分共享。因此,企业画像一定要充分利用现有数据进行挖掘与设计。
(2)标签数据完整性
支撑某一企业标签生成的某类原始数据一定要连续、完整,不要有断档或缺项。经常会遇到企业为申报某一资金,而上报某个年度的企业财报数据,该类数据虽然很有价值,但该类财报数据从企业数量上数据覆盖不完整,从时间维度上数据不连续,因此该类年度财报数据无法支撑标签生成。
(3)标签数据功能性
企业标签不是越多越好,而是要能够支撑企业数字化形象描绘、企业筛选与企业评价等核心功能。如暂无实际应用场景,即使符合数据可获得性、数据完整性要求,也可暂不选用,以免为用户造成信息过载问题。
(4)定性与定量相结合
通过统计、规则方法从原始数据中获得的企业标签多为定量标签,是对企业基本情况的描述,但无法满足企业评价要求,因此还需要综合利用AI技术,按需生成一些企业定性标签,支撑企业画像构建。
2、企业标签选取的依据
(1)企业注册层面
根据国务院发布的《企业信息公示暂行条例》,企业需公示企业注册登记、备案信息。主要包括:企业名称、统一社会信用代码、企业注册号、企业类型、企业状态、注册地址、法定代表人、登记机关、注册资本(万元)、成立日期、核准日期、注销日期、吊销日期、经营范围、行业代码、币种、国籍等16种。
(2)企业经营层面
根据国务院发布的《企业信息公示暂行条例》,企业年度报告中的企业从业人数、资产总额、负债总额、对外提供保证担保、所有者权益合计、营业总收入、主营业务收入、利润总额、净利润、纳税总额等信息能够反映企业经营状况,但该类信息由企业选择是否向社会公示。
(3)企业成果层面
企业成果一般包括专利、标准、资质、奖励、著作权等。
(4)企业信用层面
(i)黑名单
根据国务院发布的《市场监督管理严重违法失信名单管理办法》,对于严重违法失信的企业,将在申请行政许可、资质、资格、委托承担政府采购项目、工程招投标时受到限制。
(ii)红名单
与失信黑名单相对,守信红名单为信用状况良好的诚信企业,可用于政府部门参考使用。
(iii)行政处罚信息
行政处罚是指行政机关依法对违反行政管理秩序的公民、法人或者其他组织,以减损权益或者增加义务的方式予以惩戒的行为。
(iv)经营异常名录
未按规定的期限公示年度报告或者未按照工商行政管理部门责令的期限公示有关企业信息的;或存在隐瞒真实情况、弄虚作假的企业均会纳入经营异常名录。
(5)企业风评层面
企业舆情是企业发展状态的重要风向标,尤其是大规模爆发的企业负面舆情有时会直接导致企业倒闭。
(6)企业发展层面
企业发展跟地域、政策、行业、市场等多方面因素有关,其中企业外迁,即企业区位调整的一种特殊形式,它是改变企业在市场中的位置、消费者偏好、环境规则、技术进步的重要途径。
3、构建企业标签体系
按照上面给出的企业标签选择原则及依据,本具体实施例以在北京市注册登记的企业为研究对象,归纳总结了6大类(A类、B类、C类、D类、E类、F类)25种75个企业标签,作为企业画像标签体系的备用标签,这些企业标签具体如下:
A类——企业基本信息:包括企业名称、国籍、地区、注册时间、注册状态、注册资本、法定代表人、所属行业和企业类型共计9种企业标签,其中,所属行业又包括统计口径的行业代码、工商注册口径的行业代码和是否为高精尖产业领域共计3个企业标签,企业类型又包括国有企业、民营企业和其他共计3个企业标签。
B类——企业经营:包括从业人数、主营业务、主营产品、业务活动和企业贡献共计5种企业标签,其中,主营业务又包括软件产品检测机构、重点应急企业、报废汽车回收企业、老字号餐饮、拍卖企业、口罩生产企业、防护服生产企业、防爆企业和其他共计9个企业标签,业务活动又包括高精尖专项资金支持、投资备案项目数量和其他共计3个企业标签,企业贡献又包括年税收税额、服务贡献不匹配企业和其他共计3个企业标签。
C类——企业成果:包括研发成果和企业资质共计2种企业标签,其中,研发成果又包括专利数和其他共计2个企业标签,企业资质又包括A股上市、新三板、两化融合企业、高精尖产业设计中心、中小企业公共服务平台、智能制造关键技术装备供应商、智能制造标杆、高新技术企业、绿色工厂、企业技术中心、国家级企业技术中心、北京市高精尖设计中心、国家质量标杆、专精特新“小巨人”、国家制造业创新中心、北京市产业创新中心、工业企业知识产权运用标杆、世界500强、国家级工业设计中心、国家技术创新示范企业、独角兽企业、北京市制造业单项冠军、专精特新中小企业、产业链龙头企业和其他共计25个企业标签。
D类——企业信用:包括黑名单、红名单、行政处罚数量和经营异常共计4种企业标签。
E类——企业风评:仅包括负面舆情这1种企业标签。
F类——企业发展:包括企业规模、生命周期、适宜政策和外迁情况共计4种企业标签,其中,企业规模又包括大型企业、中型企业、小型企业、微型企业、规模以上工业企业和规模以上软件和信息服务也企业共计6个企业标签,生命周期又包括初创期、成长期、成熟期和衰退期共计4个企业标签,外迁情况又包括迁往市外和外迁倾向共计2个企业标签。
二、科学选取企业评价指标
1、确定正面维度评价指标
为政策选择优质企业是政府投资决策的核心任务。企业正面维度的评价指标要围绕政府投资对象要求来选取。
虽然政府投资方向会根据实际需要进行一定调整,但对投资对象的主体要求,还是存在一定相似性。通过调查问卷不足以科学客观地总结政府投资对象要求的整体情况,本发明构建了政策实施对象要求语料库,将LDA模型与分词工具结合,研究出政府投资决策时核心的企业评价指标要求。
(1)采集数据
本具体实施例采集了2012年至2021年北京市政府相关部门面向企业发布的征集资质、项目、资金、基金类的政策文件5500件,剔除公示、通告、通告类等非申报类政策文件后为2696件,归并每年重复申报项目后,保留具有申报主体要求的政策共计320件,利用Python脚本将政策文件中申报条件按照标点符号规则分割为句子,并保留政策文件、句子之间的对应关系。
(2)抽取短语
首先尝试利用JIEBA分词,并结合停用词表进行数据规范化预处理,发现按照关键词分词后再进行LDA建模,构建的LDA模型的输出主题的辨识性不强,如图1(a)所示。
然后尝试利用HANLP进行短语提取,去掉停用词,建立WORD2ID词典,完成数据预处理,发现构建的LDA模型的输出主题的辨识性较前者强很多,如图1(b)所示。
故选用HANLP进行短语提取,去掉停用词,建立WORD2ID词典,完成数据预处理。
(3)构建LDA模型
采用词袋方法构建LDA模型。本发明将预处理后的文本数据利用Gensim封装的Doc2Bow方法创建语料库corpus,并基于此语料库不断迭代与训练LDA模型。在训练过程中发现,当迭代数Niters=200时,LDA模型达到稳定。在该参数下,当主题个数K=10时,LDA模型困惑度(perplexity)最小(如图2所示),主题距离分布合理,主题交叠最小(如图3所示),因此设定最优主题个数K=10。
(4)确定正面维度评价指标
通过LDA模型的词项分布(表1)可以看出,政府投资决策重点关注企业的行业地位、企业信用、研发条件、创新能力、成果转化能力、企业效益、团队能力、基础设施和管理水平这9个方面。
表1基于LDA主题-词项分布
基于LDA主题模型,每个政策P都会产生一个关于政策申报主体要求的主题矩阵Pt,主题矩阵Pt的表示具体如下:
Pt=[t1 t2 … tn]
其中,ti代表政策P是否包含了第i个主题方面的申报要求,ti的值域为(0,1)。
以政府投资决策重点关注的方面作为正面维度评价指标。
表2正面维度评价指标
2、确定负面维度评价指标
企业的负面信息主要来自市场监督管理过程中产生的行政处罚、经营异常、严重失信等信息;来自媒体的企业负面新闻信息;以及经评定投资贡献不匹配等信息。因此企业的负面维度评价指标如下:
表3负面维度评价指标
三、量化企业画像模型
企业画像模型是企业标签体系与企业评价体系的结合体,是可支撑多维度企业评价的方法体系。
企业画像模型的层次架构是实现量化算法的基础,本发明将企业画像模型分为总体目标层(Goal Layer,GL)、中间层(Middle Layer,ML)、评价指标层(Core Index Layer,CIL)和标签层(Tag Layer,TL)四层结构(如图4所示),其中:
总体目标层是最终的决策任务,即为政策推荐优质企业;
中间层是最终决策任务分解出来的子决策任务,本发明按照政府投资决策业务,将中间层设置为正面维度、负面维度、外迁维度的企业画像任务;
评价指标层为子决策任务对应的指标项集合;
标签层为可支撑各指标项计算的标签集合。
本发明提供的量化企业画像模型的方法具体包括以下步骤:
1、建立评价指标与标签的关系矩阵
企业标签不仅有定量标签,如注册资金、从业人数、税收金额等,还有很多定性标签,如企业资质等。传统企业评价方法主要基于定量指标进行的企业评价,本发明结合企业画像特点,将包含定性、定量的企业标签集做为企业评价的重要数据来源。
设企业评价指标集矩阵为C,Ci是每个评价指标,则企业评价指标集矩阵C的表示具体如下:
C=[C1 C2 … Cn]
设每个评价指标Ci对应的指标值为ci,则指标值矩阵c的表示具体如下:
c=[c1 c2 … cn]
设某一企业的标签集矩阵为T,tik是每个标签项的值,列值为空处补0,则某一企业的标签集矩阵T的表示具体如下:
为实现指标层对标签层的数据调用,本发明设计并建立了每个指标值ci与企业每个标签项的值tik的量化规则矩阵Zi,因正向、负向等指标不同,故指标与标签的对应量化规则也不同,具体的:
经研究发现,企业资质标签与政策文件具有很强的联系,政府会按照政策文件要求为企业评定资质,政策申报条件中会明确提出企业经营、创新、基础条件等各方面的基本要求,这些基本要求体现了获得此项资质的企业所拥有的共同能力。因此本发明创新性地将企业资质类标签与政策文本主题挖掘进行关联研究,将政策文件资质申报条件中的企业能力要求对应到该类资质企业具备的基本能力,即用政策申报要求主题矩阵Pt作为该类资质企业标签的主题矩阵;
除企业资质类标签外,其他标签与对应指标上的值结合行业标准及专家经验进行量化。
量化规则矩阵Zi表示每个指标值ci在某一企业所有标签项上的对应值所组成的矩阵,量化规则矩阵Zi的表示具体如下:
ci=max(Zi)
则得到某一企业在某一维度上的指标值矩阵c,c的表示具体如下:
c=[max(Z1) max(Z2) … max(Zn)]
在本具体实施方式中,正向维度的标签和负向维度的标签与评价指标量化规则分别如下:
(1)正向维度的标签与评价指标量化规则
(2)负向维度的标签与评价指标量化规则
2、基于AHP-CRITIC主客观赋权法计算企业画像模型的指标权重本发明利用AHP-CRITIC主客观赋权法,对企业画像模型的指标权重进行计算,既采纳了专家的实际经验,又通过客观数据对指标权重进行修正。
基于AHP-CRITIC主客观赋权法计算企业画像模型的指标权重的方法具体如下:
(1)通过AHP主观赋权法获得专家经验判断
层次分析法(Analytic Hierarchy Process,AHP)是由美国T.L Satie教授提出一种主观赋权法。该方法常表现为一个包含目标、一个或多个准则和备选方案的决策树。本发明通过AHP方法对各项指标的权重进行主观赋权。
首先,通过专家打分,评估指标C1至Cn两两指标的相对重要程度,构建判断矩阵Cp:
其中cij表示指标ci相较于指标cj的重要程度,如果ci与cj的重要程度相同,则cij=1。在cij不为0时,cij=1/cji,因此矩阵C为可互反转矩阵。本发明采用1-9标度来确定每个要素的相对重要程度。
然后,使用求根法计算特征向量cij的近似值,得到标准化权重向量α:
α=(α1,α2,...,αm)T
其中:
为保证判断矩阵Cp的准确性,需要进行一致性测试,以判断随机一致性比值(CR)的大小;CR越小,一致性越高,准确性越高,与真实性越一致。CR<0.1表示判断矩阵Cp符合一致性测试要求,属于可接受范围。否则,判断矩阵Cp不符合一致性测试的要求,无法获得结果。CR的计算公式具体如下:
其中:
RI为平均随机一致性指标。
(2)通过CRITIC客观赋权法获得客观权重
APH层次分析法是通过专家打分的主观评价结果,指标的权重难免会带有主观偏差,本发明引入CRITIC客观赋权法,通过企业相关指标的实际数据来计算指标权重,重点关注指标的对比强度与冲突性。指标之间的对比强度越大或冲突性越强,指标的权重越大。
首先,对指标对应的原始企业数据进行同向化、归一化处理,计算出相关指标的标准差Si以及指标与指标之间的相关系数ρji,其中:
然后,计算指标中所含的信息量Ii:
最后,计算指标的权重系数βi:
(3)通过AHP-CRITIC方法获得综合权重
AHP在计算指标权重时相当主观,仅依靠专家经验,不考虑实际企业数据情况。相比之下,CRITIC方法考虑实际企业数据,在计算指标权重时明显客观。本发明在保留前人研究方法优点的基础上,将通过AHP方法得到的权重结果αi与通过CRITIC方法得到的权重结果βi相结合,得到综合权重ωi:
3、量化企业画像模型
(1)量化正面维度的企业画像模型
将经企业标签层确定的企业正面维度的评价结果ci-正面与通过AHP-CRITIC方法获得的正面维度的综合权重ωi-正面相乘,得到正面维度的综合得分W正面:
其中:
ci-正面=max(Zi-正面)
正面维度的综合得分W正面越高,代表正面维度的企业能力越强。设置正面维度的综合得分W正面的合理阈值,筛选出正面优质企业。
(2)量化负面维度的企业画像模型
将经企业标签层确定的企业负面维度的评价结果ci-负面与通过AHP-CRITIC方法获得负面维度的综合权重ωi-负面相乘,得到负面维度的综合得分W负面:
其中:
ci-负面=max(Zi-负面)
负面维度的综合得分W负面越高,代表企业负面风险越大。设置负面维度的综合得分W负面的合理阈值,筛选出负面风险企业。
为了使上述量化正面维度和负面维度的企业画像模型的过程更加明了易懂,本具体实施例选取了工业与软件规模以上企业6968家以及申请到资金项目的企业268家(规模以上企业及申请到资金项目的企业均为政府投资的重点对象,可作为客观数据),共计7236家企业作为样本数据进行详细的说明。
(1)量化正面维度的企业画像模型
首先,利用AHP层次分析法,通过专家打分确定企业9项评价指标权重。得到的判断矩阵最大特征值为9.8613,CI值为0.1077,RI值为1.451,CR值为0.0742,CR<0.1,判断矩阵一致性验证通过,证明该结果可用。AHP法的权重计算结果如下:
然后,将这7236家企业的标签数据与正向评价指标关系降维后的矩阵c作为输入,利用CRITIC客观赋权法,计算企业9项评价指标权重。CRITIC法的权重计算结果如下:
由上表可以看出,指标权重最大值为成果转化能力(24.002%),说明企业成果数据的差异性较大;指标权重最小值为企业效益(1.879%),说明通过企业标签获得的企业效益指标数据的差异性不大。
接下来,利用AHP-CRITIC方法获得综合权重,计算结果如下:
通过上表可以看到:通过客观数据的差异性与冲突性获得的CRITIC权重可以修正通过专家打分获得的AHP权重,使得指标的权重更为合理。
正面维度的综合得分越高,代表正面维度的企业能力越强,从7236家企业样本数据可以看到,正面维度的综合得分W正面基本都在0.5至1之间,也就是说,优质企业的综合得分应大于0.5,故正面维度的综合得分的阈值宜定为0.5。
2、构建负面维度的企业画像模型
首先,利用AHP层次分析法,通过专家打分确定企业5项评价指标权重。得到的判断矩阵最大特征值为5.1846,CI值为0.0461,RI值为1.11,CR值为0.0416,CR<0.1,判断矩阵一致性验证通过,证明该结果可用。AHP法的权重计算结果如下:
然后,利用CRITIC客观赋权法,将申请到资金项目的268家企业的标签数据与负向评价指标关系降维后的矩阵c作为输入,利用CRITIC客观赋权法,计算企业5项评价指标权重。CRITIC法的权重计算结果如下:
由上表可以看出,指标权重最大值为经营异常(31.475%),说明企业经营异常的差异性较大;指标权重最小值为负面新闻(11.099%),说明企业负面新闻数据的差异性不大。
接下来,利用AHP-CRITIC方法获得综合权重,计算结果如下:
通过上表可以看到:通过客观数据的差异性与冲突性获得的CRITIC权重可以修正通过专家打分获得的AHP权重,使得指标的权重更为合理。
需要说明的是,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无法对所有的实施方式予以穷举。凡是属于本发明技术方案所引伸出的显而易见变化或变动仍处于本发明的保护范围之列。
Claims (6)
1.辅助政府投资决策的企业画像模型的构建方法,其特征在于,包括以下步骤:
Step1、构建企业标签体系
在企业注册层面、经营层面、成果层面、信用层面、风评层面和发展层面,从现有数据中选取连续、完整并且能够支撑企业数字化形象描绘、企业筛选与企业评价的企业定量标签和定性标签,构建出企业标签体系;
Step2、科学选取评价指标
评价指标包括:正面维度评价指标、负面维度评价指标和相关因素评价指标,其中,正面维度评价指标通过LDA模型确定,负面维度评价指标通过市场监督管理、媒体和评定确定,相关因素评价指标为企业外迁倾向;
Step3、量化企业画像模型
首先,建立评价指标与标签的关系矩阵,具体如下:
设企业评价指标集矩阵为C,Ci是每个评价指标,则企业评价指标集矩阵C的表示具体如下:
C=[C1 C2 … Cn]
设每个评价指标Ci对应的指标值为ci,则指标值矩阵c的表示具体如下:
c=[c1 c2 … cn]
设某一企业的标签集矩阵为T,tik是每个标签项的值,列值为空处补0,则某一企业的标签集矩阵T的表示具体如下:
建立每个指标值ci与企业每个标签项的值tik的量化规则矩阵Zi,量化规则矩阵Zi的表示具体如下:
ci值为稀疏矩阵Zi各行各列的最大值,ci的表示具体如下:
ci=max(Zi)
则得到某一企业在某一维度上的指标值矩阵c,c的表示具体如下:
c=[max(Z1) max(Z2) … max(Zn)]
然后,基于AHP-CRITIC主客观赋权法计算企业画像模型的指标权重,具体如下:
通过AHP主观赋权法获得专家经验判断,通过CRITIC客观赋权法获得客观权重,将通过AHP方法得到的权重结果αi与通过CRITIC方法得到的权重结果βi相结合得到综合权重ωi:
最后,量化正面维度的和负面维度的企业画像模型,分别如下:
(1)量化正面维度的企业画像模型
将经企业标签层确定的企业正面维度的评价结果ci-正面与通过AHP-CRITIC方法获得的正面维度的综合权重ωi-正面相乘,得到正面维度的综合得分W正面:
其中:
ci-正面=max(Zi-正面)
设置正面维度的综合得分W正面的合理阈值,筛选出正面优质企业;
(2)量化负面维度的企业画像模型
将经企业标签层确定的企业负面维度的评价结果ci-负面与通过AHP-CRITIC方法获得负面维度的综合权重ωi-负面相乘,得到负面维度的综合得分W负面:
其中:
ci-负面=max(Zi-负面)
设置负面维度的综合得分W负面的合理阈值,筛选出负面风险企业。
2.根据权利要求1所述的辅助政府投资决策的企业画像模型的构建方法,其特征在于,在Step1中,构建的企业标签体系包括6大类25种企业标签,具体如下:
A类——企业基本信息:包括企业名称、国籍、地区、注册时间、注册状态、注册资本、法定代表人、所属行业和企业类型共计9种企业标签;
B类——企业经营:包括从业人数、主营业务、主营产品、业务活动和企业贡献共计5种企业标签;
C类——企业成果:包括研发成果和企业资质共计2种企业标签;
D类——企业信用:包括黑名单、红名单、行政处罚数量和经营异常共计4种企业标签;
E类——企业风评:仅包括负面舆情这1种企业标签;
F类——企业发展:包括企业规模、生命周期、适宜政策和外迁情况共计4种企业标签。
3.根据权利要求1所述的辅助政府投资决策的企业画像模型的构建方法,其特征在于,在Step2中,通过LDA模型确定正面维度评价指标的方法具体包括以下步骤:
首先,采集政府相关部门面向企业发布的征集资质、项目、资金和基金的申报类政策文件,归并每年重复申报项目,保留具有申报主体要求的政策,利用Python脚本将政策文件中申报条件按照标点符号规则分割为句子,并保留政策文件、句子之间的对应关系;
然后,利用HANLP进行短语提取,去掉停用词,建立WORD2ID词典,完成数据预处理;
之后,将预处理后的文本数据利用Gensim封装的Doc2Bow方法创建语料库corpus,并基于此语料库不断迭代与训练LDA模型,直至LDA模型达到稳定,然后根据LDA模型的困惑度以及主题距离分布情况确定最优主题个数;
最后,根据LDA模型的词项分布确定政府投资决策重点关注企业的方面,并以此作为正面维度评价指标。
4.根据权利要求1所述的辅助政府投资决策的企业画像模型的构建方法,其特征在于,在Step2中,企业的负面维度评价指标包括:来自市场监督管理过程中产生的行政处罚、经营异常和严重失信信息,来自媒体的企业负面新闻信息,以及经评定投资贡献不匹配信息。
5.根据权利要求1所述的辅助政府投资决策的企业画像模型的构建方法,其特征在于,在Step3中,通过AHP主观赋权法获得专家经验判断的方法具体包括以下步骤:
首先,通过专家打分,评估指标C1至Cn两两指标的相对重要程度,构建判断矩阵Cp:
其中cij表示指标ci相较于指标cj的重要程度,如果ci与cj的重要程度相同,则cij=1,采用1-9标度来确定每个要素的相对重要程度;
然后,使用求根法计算特征向量cij的近似值,得到标准化权重向量α:
α=(α1,α2,...,αm)T
其中:
最后,进行一致性测试,判断CR的大小,CR<0.1表示判断矩阵符合一致性测试要求,属于可接受范围,否则,判断矩阵不符合一致性测试的要求,无法获得结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210433077.2A CN114819618A (zh) | 2022-04-24 | 2022-04-24 | 辅助政府投资决策的企业画像模型的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210433077.2A CN114819618A (zh) | 2022-04-24 | 2022-04-24 | 辅助政府投资决策的企业画像模型的构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114819618A true CN114819618A (zh) | 2022-07-29 |
Family
ID=82506830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210433077.2A Pending CN114819618A (zh) | 2022-04-24 | 2022-04-24 | 辅助政府投资决策的企业画像模型的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114819618A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115907308A (zh) * | 2023-01-09 | 2023-04-04 | 佰聆数据股份有限公司 | 基于用户画像的电力物资供应商评价方法及装置 |
CN117195004A (zh) * | 2023-11-03 | 2023-12-08 | 苏州市吴江区盛泽镇人民政府 | 一种融合行业分类和wvLDA主题模型的政策匹配方法 |
CN117436737A (zh) * | 2023-09-28 | 2024-01-23 | 重庆市信息通信咨询设计院有限公司 | 基于灰色模型的产业评价方法、计算机设备及存储介质 |
-
2022
- 2022-04-24 CN CN202210433077.2A patent/CN114819618A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115907308A (zh) * | 2023-01-09 | 2023-04-04 | 佰聆数据股份有限公司 | 基于用户画像的电力物资供应商评价方法及装置 |
CN117436737A (zh) * | 2023-09-28 | 2024-01-23 | 重庆市信息通信咨询设计院有限公司 | 基于灰色模型的产业评价方法、计算机设备及存储介质 |
CN117195004A (zh) * | 2023-11-03 | 2023-12-08 | 苏州市吴江区盛泽镇人民政府 | 一种融合行业分类和wvLDA主题模型的政策匹配方法 |
CN117195004B (zh) * | 2023-11-03 | 2024-02-06 | 苏州市吴江区盛泽镇人民政府 | 一种融合行业分类和wvLDA主题模型的政策匹配方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Fraud detection for financial statements of business groups | |
Garegnani et al. | Scoring firms’ codes of ethics: An explorative study of quality drivers | |
CN114819618A (zh) | 辅助政府投资决策的企业画像模型的构建方法 | |
Franceschetti et al. | Do bankrupt companies manipulate earnings more than the non-bankrupt ones? | |
Ho et al. | Are corporate social responsibility reports informative? Evidence from textual analysis of banks in China | |
CN109492097B (zh) | 一种企业新闻数据风险分类方法 | |
Bernini et al. | The digitalization-reputation link: a multiple case-study on Italian banking groups | |
Tian et al. | A dataset on corporate sustainability disclosure | |
Boobyer | Leasing and asset finance: the comprehensive guide for practitioners | |
Njoku | The impact of corporate governance on working capital management in Nigerian organizations | |
Horak et al. | Creating a comprehensive method for the evaluation of a company | |
Mehrotra et al. | Extent and gaps in intellectual capital disclosure in the Indian industry | |
Hardeck et al. | The impact of tax avoidance and environmental performance on tax disclosure in CSR reports | |
Li et al. | Textual analysis and detection of financial fraud: Evidence from Chinese manufacturing firms | |
Hajek et al. | Predicting M&A targets using news sentiment and topic detection | |
Locatelli et al. | Artificial Intelligence and Credit Risk | |
Mraović | Relevance of data mining for accounting: social implications | |
Schoonwinkel | Towards Fair Presentation of DAO Treasuries: An Evaluation of Native Governance Token Reporting Practices | |
Okegbe et al. | Environmental management reporting and corporate performance: evidence from natural resources, agriculture, oil and gas firms in Nigeria | |
Wei | [Retracted] A Hybrid Intelligent System for Company Financial Risk Detection Based on Tree‐Based Model and Deep Neural Network | |
Xiaoyu et al. | A Literature Review on Financial Fraud | |
Dell'Era et al. | Policy and artificial intelligence advent | |
Qian et al. | Research on Patent Value Analysis System based on P2P Lending | |
FIRICA et al. | HOW TO APPRAISE THE DATA ASSETS OF A COMPANY? | |
Karina et al. | The power of stakeholders in the management compliance with environmental responsibility issues in Indonesia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |