CN112256762B - 基于产业地图的企业画像方法、系统、设备及介质 - Google Patents
基于产业地图的企业画像方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN112256762B CN112256762B CN202011158719.XA CN202011158719A CN112256762B CN 112256762 B CN112256762 B CN 112256762B CN 202011158719 A CN202011158719 A CN 202011158719A CN 112256762 B CN112256762 B CN 112256762B
- Authority
- CN
- China
- Prior art keywords
- enterprise
- data
- information
- index
- industrial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000004458 analytical method Methods 0.000 claims abstract description 15
- 238000004519 manufacturing process Methods 0.000 claims abstract description 14
- 230000008569 process Effects 0.000 claims abstract description 11
- 238000007726 management method Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims description 17
- 238000005516 engineering process Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 12
- 238000011161 development Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 238000007621 cluster analysis Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 230000008451 emotion Effects 0.000 claims description 4
- 238000002076 thermal analysis method Methods 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 4
- 238000003058 natural language processing Methods 0.000 claims description 3
- 238000013278 delphi method Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Technology Law (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种基于产业地图的企业画像方法、系统、设备及介质,该方法包括:获取企业标识信息,根据所述企业标识信息采集企业数据;所述企业数据包括工商信息、采购信息、生产信息、销售信息、财务信息、技术信息与公司治理信息;预处理所述企业数据中的结构化数据与非结构化数据,将所述非结构化数据转换为结构化数据,根据指标类型选择相应算法处理所述结构化数据得到指标分值;根据企业的指标分值生成所述企业的企业画像。本申请通过知识图谱嵌入和推理,提供专业的竞争分析和决策分析。对海量企业同步画像,打破传统企业画像立足于单一目标企业的模式,准确反映企业在不同区域市场中的表现差异,为用户提供了准确、专业和实用的企业画像。
Description
技术领域
本申请属于数据分析技术领域,特别是涉及一种基于产业地图的企业画像方法、系统、设备及介质。
背景技术
随着大数据信息时代的到来以及大数据处理技术的日益发展,从海量冗杂的企业活动数据中准确挖掘有价值的数据难度越来越大。而政府、咨询、银行、券商、会计师、律师、投资方、企业自身等行业对于企业360度全方位的信息需求也越来越大。包括发现和挖掘企业之间的关联关系,找寻未知关系以促进企业合作,识别企业资本行为,构造企业风险评估模型等等。
然而,现有企业画像方法大多聚焦于目标企业本身数据,即使运用了知识图谱的画像方法其关注重点仍是企业股权的上下穿透关系,缺少对可比企业的横向关注,更缺少将可比企业放在不同市场平台的比较以及深入行业的竞争分析。
发明内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供一种基于产业地图的企业画像方法、系统、设备及介质,用于解决现有技术中无法在产业地图指定范围内对行业内企业同步画像的问题。
为实现上述目的及其他相关目的,本申请提供一种基于产业地图的企业画像方法,包括:
步骤S1,获取企业标识信息,根据所述企业标识信息采集企业数据;所述企业数据包括工商信息、采购信息、生产信息、销售信息、财务信息、技术信息与公司治理信息;
步骤S2,预处理所述企业数据中的结构化数据与非结构化数据,将所述非结构化数据转换为结构化数据,根据指标类型选择相应算法处理所述结构化数据得到指标分值;
步骤S3,根据所述企业的指标分值生成所述企业的企业画像。
本申请的目的在于提供一种基于产业地图的企业画像系统,包括:
数据采集模块,用于获取企业标识信息,根据所述企业标识信息采集企业数据;所述企业数据包括工商信息、采购信息、生产信息、销售信息、财务信息、技术信息与公司治理信息;
数据处理模块,用于预处理所述企业数据中的结构化数据与非结构化数据,将所述非结构化数据转换为结构化数据,根据指标类型选择相应算法处理所述结构化数据得到指标分值;
画像生成模块,用根据所述企业的指标分值生成所述企业的企业画像。
本申请另一目的在于提供一种电子设备,包括:
一个或多个处理装置;
存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置执行所述基于产业地图的企业画像方法。
本申请还一目的在于提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于使所述计算机执行所述基于产业地图的企业画像方法。
如上所述,本申请的基于产业地图的企业画像方法、系统、设备及介质,具有以下有益效果:
本申请通过在产业地图对海量企业同步画像,打破传统企业画像立足于单一目标企业的模式,通过采集多维度信息根据指标类型选择相应算法处理数据信息得到指标分值从而生成企业画像,为用户提供了准确、专业和实用的企业画像。
附图说明
图1显示为本申请提供的一种基于产业地图的企业画像方法流程图;
图2显示为本申请提供的一种基于产业地图的企业画像方法中步骤S2流程图;
图3显示为本申请提供的一种基于产业地图的企业画像方法中步骤S3流程图;
图4显示为本申请提供的一种基于产业地图的企业画像方法一实施例流程图;
图5显示为本申请提供的一种基于产业地图的企业画像方法中查看示意图;
图6显示为本申请提供的一种基于产业地图的企业画像方法一效果示意图;
图7显示为本申请提供的一种基于产业地图的企业画像方法另一效果示意图;
图8显示为本申请提供的一种基于产业地图的企业画像系统结构框图;
图9显示为本申请提供的一种电子设备的结构示意图。
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本申请的基本构想,遂图式中仅显示与本申请中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
命名实体识别(NER)(也称为实体识别、实体分块和实体提取)是信息提取的一个子任务,旨在将文本中的命名实体定位并分类为预先定义的类别,如人员、组织、位置、时间表达式、数量、货币值、百分比等
文本情感分析(Sentiment Analysis)是指利用自然语言处理和文本挖掘技术,对带有情感色彩的主观性文本进行分析、处理和抽取的过程。
请参阅图1,为本申请提供的一种基于产业地图的企业画像系统结构框图,包括:
步骤S1,获取企业标识信息,根据所述企业标识信息采集企业数据;所述企业数据包括工商信息、采购信息、生产信息、销售信息、财务信息、技术信息与公司治理信息;
其中,产业地图上的多个企业可以是所有企业,也可是指定区域范围内的部分企业,在此不做限定;企业数据包括从工商信息、采购信息、生产信息、销售信息、财务信息、技术信息与公司治理信息等多个维度采集反映企业生产活动的信息,例如,所述工商信息包括以下画像元素:企业名称、企业类型、注册资本、经营范围、存续状态、成立年限。所述采购信息包括以下画像元素:主要供应商采购比例、进货网络迁徙图、原材料采购价格和数量等。所述生产信息包括以下画像元素:分品种的产品产能、产品产量、产品成本。所述销售信息包括以下画像元素:产品销量、销售收入、平均售价、主要客户销售占比、主营业务构成、销售网络迁徙图。所述财务信息包括以下画像元素:资产负债率、流动比率、三费比率、存货周转率、毛利率、ROE等关键财务指标。所述技术信息包括以下画像元素:能耗水平、研发投入、根据行业确定的技术经济指标。所述公司治理信息包括以下画像元素:股东份额、股权穿透、管理效率、重大事项、ESG评级等。
具体地,根据企业标识信息从采购、生产、制造与研发等多个维度获取企业数据,更加全面的采集信息可以真实反映出企业的真实状况,避免了数据遗漏的现象。
步骤S2,预处理所述企业数据中的结构化数据与非结构化数据,将所述非结构化数据转换为结构化数据,根据指标类型选择相应算法处理所述结构化数据得到指标分值;
其中,结构化数据为高度组织和整齐格式化的数据,可以放入表格和电子表格中的数据类型,例如,日期、财务金额、电话号码、地址、产品名称等;非结构化数据,为结构化数据之外的一切数据,即,字段可变的的数据;例如,邮件数据、社交媒体数据、网站数据、通讯数据等。
请参阅图2,为本申请提供的一种基于产业地图的企业画像方法中步骤S2流程图,详述如下:
步骤S21,利用Python预处理所述企业数据中的结构化数据与非结构化数据;
具体地,使用Python作为处理工具预处理数据(结构化数据与非结构化数据),分别进行去除/补全缺失数据、去除/修改格式和内容错误的数据、去除/修改逻辑错误的数据、去除不需要的数据、进行关联性验证,利用插补法、替换法、删除法清洗数据,确保了数据的完整性、有效性。
步骤S22,利用命名实体识别技术提取所述非结构化数据中实体边界与实体类别得到文本实体;
具体地,利用命名实体识别技术(Named Entity Recognition,简称NER)处理非结构化数据,通过实体边界识别、确定实体类别,识别文本中具有特定意义的实体,例如,对句子“小明早上8点去学校上课”进行命名实体识别,应该能提取实体,人名:小明,时间:早上8点,地点:学校。
步骤S23,利用自然语言处理中的情感分析技术将所述文本实体转换为具有倾向性分值的结构化数据;
具体地,通过该算法能够将文本实体转换为具有倾向性分值的结构化数据,例如,倾向性分值可以通过分值标识正面或负面倾向的结论,从而将文本实体转换为表示倾向性的分值,与其他结构化数据一起用作后续程序的数据输入。
步骤S24,根据指标的相应类型选择AHP(层次分析法)法、delphi(德尔菲法)法或熵值法分别计算多个维度的指标;
具体地,指标的类型根据采购信息、生产信息、销售信息、财务信息、技术信息与公司治理信息六个维度确定,例如,采购信息对应的指标为一级指标,而采购信息所包括供应商采购比例、进货网络迁徙图、原材料采购价格和数量等元素为二级指标,这些元素通过对应的算法计算出每个二级指标,使用加权系数叠加所有二级指标即可得到一级指标。
通过上述方式能够精准的计算到企业所对应的每类指标,依靠数字化形式展示每类指标不同,有利于后续指标准确分值化。
步骤S25,利用百分比法计算每个所述企业的指标分值。
在本实施例中,将所述指标所对应的企业从高至低排序,利用百分比法赋予指标最高的企业分数,根据指标实际形成的比例数值,对该指标下所有的企业赋值得到每个所述企业的指标分值。
步骤S3,根据所述企业的指标分值生成所述企业的企业画像。
请参阅图3,为本申请提供的一种基于产业地图的企业画像方法中步骤S3流程图,详述如下:
步骤S31,将所述指标分值标注在产业地图上选定的区域范围内;
具体地,如图4所示,根据步骤S0,利用地域划分或自由绘制的方式在所述产业地图上指定区域以选择待做企业画像的企业范围和企业数量,将所述指标分值标注在产业地图选定的区域范围内,例如,选择方式包括但不限于按国别、按省、自由绘制等,选定区域后仅对区域内的企业进行对比(即只对比业务辐射范围内的企业),更具有实际研究价值,更符合业务研究实际。
步骤S32,利用选定的区域范围内样本总体修正所述指标分值;
具体地,由于指标分值是依据该公司所对应的全行业生成的,不具有区域代表性,无法真实反映本地区域的企业状况,而通过筛选选定区域的样本总体,重新计算该区域范围内的指标分值,从而达到修正所述指标分值的目的。
步骤S33,在所述区域范围内生成所述企业的企业画像,根据输入指令展示所述企业的画像结果。
步骤331,当输入指令为单一指标时,根据所述产业地图上区域范围显示不同企业间的分布;
利用空间搜索实现指标在选定区域内的横向对比;利用热力分析或聚类分析展示不同区域内不同企业之间的竞争强度差异。
步骤332,当输入指令为单一企业时,根据所述单一企业的各项指标标识展示企业之间的知识图谱。
利用六维雷达评分图刻画当前企业的表现水平;其中,六维信息包括采购信息、生产信息、销售信息、财务信息、技术信息与公司治理信息,通过六个维度的指标化展示,能够良好刻画当前企业的表现水平。
利用知识图谱技术展示所述企业多源异构数据,梳理企业股权架构、关联方、上下游及各种指标之间的关系;其中,采用产业地图对海量企业同步画像,打破传统企业画像立足于单一目标企业的模式,并通过知识图谱实现不同企业之间的关联,通过在选定区域查找企业,就可以清晰地看到企业多层上下游关系、多层股权关系、高管信息、舆情数据等等,通过这些综合信息,对企业评级做出考量。
利用知识图谱嵌入技术将特定词汇向量化,通过相似匹配寻找可比公司实现竞争分析;例如,通过相似匹配帮助识别可比公司,用于竞争分析。
利用知识图谱推理技术将目标企业和对标企业发展阶段进行匹配,根据对标企业发展路径建立风险预警模型生成所述目标企业的决策分析,根据目标企业的所属行业,按照行业内对标企业的发展阶段形成风险预警模型,生成相关的决策分析供目标企业的发展中借鉴。
在本实施例中,企业画像是可视化展示于产业地图之上的。可以选择两种查看方式,一是在产业地图上查看单一指标在不同企业间的分布;二是查看单一企业的各项指标表现以及企业之间的知识图谱。例如,如图5所示,如果选择查看单个指标(如利润),则会在每个点的位置显示利润水平得分;如果选择查看单个企业,点击地图上的点进入企业详情,查看详细报告,此时的报告所有同行业对比数据都是根据选定的区域确定的。
例如,如图6所示,利用空间搜索实现指标在选定区域内的横向对比,如图7所示,利用热力分析或聚类分析展示不同区域内不同企业之间的竞争强度差异,可根据选择的不同范围出具不同的画像结论,从而更加准确反映企业在不同区域市场中的表现差异,提供准确、专业和实用的企业画像。
请参阅图8,为本申请提供的一种基于产业地图的企业画像系统结构框图,包括:
数据采集模块1,用于获取企业标识信息,根据所述企业标识信息采集企业数据;所述企业标识信息包括工商信息、采购信息、生产信息、销售信息、财务信息、技术信息与公司治理信息;
数据处理模块2,用于预处理所述企业数据中的结构化数据与非结构化数据,将所述非结构化数据转换为结构化数据,根据指标类型选择相应算法处理所述结构化数据得到指标分值;
画像生成模块3,用根据所述企业的指标分值生成所述企业的企业画像。
其中,需要说明的是,基于产业地图的企业画像系统与基于产业地图的企业画像方法为一一对应关系,因此,两者所涉及的技术细节与技术效果完全相同,在此不一一赘述,请参照上述基于产业地图的企业画像方法。
下面参考图9,其示出了适于用来实现本实施例的电子设备(例如终端设备或服务器900的结构示意图。本实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图9示出的电子设备仅仅是一个示例,不应对本实施例的功能和使用范围带来任何限制。
如图9所示,电子设备900可以包括处理装置(例如中央处理器、图形处理器等)901,其可以根据存储在只读存储器(ROM)902中的程序或者从存储装置908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。在RAM903中,还存储有电子设备900操作所需的各种程序和数据。处理装置901、ROM902以及RAM903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
通常,以下装置可以连接至I/O接口905:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置906;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置907;包括例如磁带、硬盘等的存储装置908;以及通信装置909。通信装置909可以允许电子设备900与其他设备进行无线或有线通信以交换数据。虽然图9示出了具有各种装置的电子设备900,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置909从网络上被下载和安装,或者从存储装置908被安装,或者从ROM902被安装。在该计算机程序被处理装置901执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行图1至图4中的方法流程图。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本申请通过在产业地图对海量企业同步画像,打破传统企业画像立足于单一目标企业的模式,通过采集多维度信息根据指标类型选择相应算法处理数据信息得到指标分值从而生成企业画像,准确反映企业在不同区域市场中的表现差异,为用户提供了准确、专业和实用的企业画像。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。
Claims (7)
1.一种基于产业地图的企业画像方法,其特征在于,包括:
步骤S1,获取企业标识信息,根据所述企业标识信息采集企业数据;所述企业数据包括工商信息、采购信息、生产信息、销售信息、财务信息、技术信息与公司治理信息;
步骤S2,预处理所述企业数据中的结构化数据与非结构化数据,将所述非结构化数据转换为结构化数据,根据指标类型选择相应算法处理所述结构化数据得到指标分值;
步骤S3,根据所述企业的指标分值生成所述企业的企业画像;其中,当输入指令为单一指标时,根据所述产业地图上区域范围显示不同企业间的分布;利用空间搜索实现指标在选定区域内的横向对比;利用热力分析或聚类分析展示不同区域内不同企业之间的竞争强度差异;
当输入指令为单一企业时,根据所述单一企业的各项指标标识展示企业之间的知识图谱;利用六维雷达评分图刻画当前企业的表现水平;利用知识图谱技术展示所述企业多源异构数据,梳理企业股权架构、关联方、上下游及各种指标之间的关系;利用知识图谱嵌入技术将特定词汇向量化,通过相似匹配寻找可比公司实现竞争分析;利用知识图谱推理技术将目标企业和对标企业发展阶段进行匹配,根据对标企业发展路径建立风险预警模型生成所述目标企业的决策分析。
2.根据权利要求1所述的基于产业地图的企业画像方法,其特征在于,所述步骤S2包括:
利用Python预处理所述企业数据中的结构化数据与非结构化数据;
利用命名实体识别技术提取所述非结构化数据中实体边界与实体类别得到文本实体;
利用自然语言处理中的情感分析技术将所述文本实体转换为具有倾向性分值的结构化数据;
根据指标的相应类型选择AHP法、delphi法或熵值法分别计算多个维度的指标;
利用百分比法计算每个所述企业的指标分值。
3.根据权利要求1所述的基于产业地图的企业画像方法,其特征在于,还包括:利用地域划分或自由绘制的方式在产业地图上指定区域以选择待做企业画像的企业范围和企业数量。
4.根据权利要求3所述的基于产业地图的企业画像方法,其特征在于,所述步骤S3包括:
将所述指标分值标注在产业地图上选定的区域范围内;利用选定的区域范围内样本总体修正该区域范围内所述指标分值;
在所述区域范围内生成所述企业的企业画像,根据输入指令展示所述企业的画像结果。
5.一种基于产业地图的企业画像系统,其特征在于,包括:
数据采集模块,用于获取企业标识信息,根据所述企业标识信息采集企业数据;所述企业数据包括工商信息、采购信息、生产信息、销售信息、财务信息、技术信息与公司治理信息;
数据处理模块,用于预处理所述企业数据中的结构化数据与非结构化数据,将所述非结构化数据转换为结构化数据,根据指标类型选择相应算法处理所述结构化数据得到指标分值;
画像生成模块,用根据所述企业的指标分值生成所述企业的企业画像;其中,当输入指令为单一指标时,根据所述产业地图上区域范围显示不同企业间的分布;利用空间搜索实现指标在选定区域内的横向对比;利用热力分析或聚类分析展示不同区域内不同企业之间的竞争强度差异;当输入指令为单一企业时,根据所述单一企业的各项指标标识展示企业之间的知识图谱;利用六维雷达评分图刻画当前企业的表现水平;利用知识图谱技术展示所述企业多源异构数据,梳理企业股权架构、关联方、上下游及各种指标之间的关系;利用知识图谱嵌入技术将特定词汇向量化,通过相似匹配寻找可比公司实现竞争分析;利用知识图谱推理技术将目标企业和对标企业发展阶段进行匹配,根据对标企业发展路径建立风险预警模型生成所述目标企业的决策分析。
6.一种电子设备,其特征在于:包括:
一个或多个处理装置;
存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现权利要求1至4中任一所述的基于产业地图的企业画像方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序用于使所述计算机执行权利要求1至4中任一所述的基于产业地图的企业画像方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011158719.XA CN112256762B (zh) | 2020-10-26 | 2020-10-26 | 基于产业地图的企业画像方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011158719.XA CN112256762B (zh) | 2020-10-26 | 2020-10-26 | 基于产业地图的企业画像方法、系统、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112256762A CN112256762A (zh) | 2021-01-22 |
CN112256762B true CN112256762B (zh) | 2024-03-29 |
Family
ID=74262419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011158719.XA Active CN112256762B (zh) | 2020-10-26 | 2020-10-26 | 基于产业地图的企业画像方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112256762B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113032496A (zh) * | 2021-04-19 | 2021-06-25 | 北京华数云网科技有限公司 | 一种基于产业知识图谱的产业大脑数据分析系统 |
CN113095051B (zh) * | 2021-04-28 | 2024-03-19 | 企查查科技股份有限公司 | 应标企业报告生成方法、装置、计算机设备和存储介质 |
CN113220773B (zh) * | 2021-05-28 | 2023-09-01 | 华中师范大学 | 一种学生评测数据画像的地图可视化方法及系统 |
CN113641828A (zh) * | 2021-07-01 | 2021-11-12 | 福建亿榕信息技术有限公司 | 一种基于知识图谱的电网供应商画像成像方法和存储设备 |
CN114004456B (zh) * | 2021-10-09 | 2024-04-09 | 金蝶征信有限公司 | 数据标签的计算方法、装置、计算机设备和存储介质 |
CN116776006B (zh) * | 2023-08-24 | 2023-10-27 | 中资科技(江苏)有限公司 | 用于企业融资的客户画像构建方法及系统 |
CN118012988B (zh) * | 2024-02-29 | 2024-08-02 | 领先未来科技集团有限公司 | 基于云计算技术的企业资源利用监管系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934712A (zh) * | 2017-03-16 | 2017-07-07 | 深圳微众税银信息服务有限公司 | 一种企业画像数据处理方法及系统 |
WO2019062009A1 (zh) * | 2017-09-30 | 2019-04-04 | 深圳壹账通智能科技有限公司 | 电子装置、信贷风险控制方法及存储介质 |
CN109766359A (zh) * | 2018-12-26 | 2019-05-17 | 科大国创软件股份有限公司 | 一种信用主体综合分析管理系统及方法 |
CN110990474A (zh) * | 2019-11-28 | 2020-04-10 | 泰华智慧产业集团股份有限公司 | 一种区域性产业画像分析的方法及装置 |
CN111178747A (zh) * | 2019-12-26 | 2020-05-19 | 金蝶征信有限公司 | 企业画像生成方法、装置、计算机设备和存储介质 |
CN111368009A (zh) * | 2019-12-18 | 2020-07-03 | 北京市长城企业战略研究所 | 一种区域创新创业主体画像模型软件系统和方法 |
-
2020
- 2020-10-26 CN CN202011158719.XA patent/CN112256762B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934712A (zh) * | 2017-03-16 | 2017-07-07 | 深圳微众税银信息服务有限公司 | 一种企业画像数据处理方法及系统 |
WO2019062009A1 (zh) * | 2017-09-30 | 2019-04-04 | 深圳壹账通智能科技有限公司 | 电子装置、信贷风险控制方法及存储介质 |
CN109766359A (zh) * | 2018-12-26 | 2019-05-17 | 科大国创软件股份有限公司 | 一种信用主体综合分析管理系统及方法 |
CN110990474A (zh) * | 2019-11-28 | 2020-04-10 | 泰华智慧产业集团股份有限公司 | 一种区域性产业画像分析的方法及装置 |
CN111368009A (zh) * | 2019-12-18 | 2020-07-03 | 北京市长城企业战略研究所 | 一种区域创新创业主体画像模型软件系统和方法 |
CN111178747A (zh) * | 2019-12-26 | 2020-05-19 | 金蝶征信有限公司 | 企业画像生成方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
大数据技术在乡村画像中的应用研究;李望月;刘瑾;陈娜;;大数据(01);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112256762A (zh) | 2021-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112256762B (zh) | 基于产业地图的企业画像方法、系统、设备及介质 | |
Meng et al. | What makes an online review more helpful: an interpretation framework using XGBoost and SHAP values | |
US11995112B2 (en) | System and method for information recommendation | |
US20160350765A1 (en) | System and interface for viewing modularized and taxonomy-based classification of regulatory obligations qualitative data | |
US20110289010A1 (en) | Apparatuses, methods and systems for an activity tracking and property transaction facilitating hub user interface | |
US20110289161A1 (en) | Apparatuses, Methods and Systems For An Intelligent Inbox Coordinating HUB | |
CN113592568B (zh) | 一种商机挖掘方法、装置、计算机设备及存储介质 | |
CN111949643A (zh) | 基于业务建模的数据处理方法及系统 | |
CN113283795B (zh) | 基于二分类模型的数据处理方法及装置、介质、设备 | |
CN117743543A (zh) | 基于大语言模型的语句生成方法、装置及电子设备 | |
CN115759014A (zh) | 一种动态智能化分析方法、系统及电子设备 | |
CN114706996A (zh) | 一种基于多元异构数据挖掘的供应链在线知识图谱构建方法 | |
Richardson | Exposing the many biases in machine learning | |
CN117876083A (zh) | 商机智能分析方法、装置、计算机设备及存储介质 | |
CN112950359A (zh) | 一种用户识别方法和装置 | |
CN116756281A (zh) | 知识问答方法、装置、设备和介质 | |
Wang et al. | Effective decision making: Data envelopment analysis for efficiency evaluation in the cloud computing marketplaces | |
CN115841365A (zh) | 基于自然语言处理的选型及报价方法、系统、设备及介质 | |
CN116703515A (zh) | 基于人工智能的推荐方法、装置、计算机设备及存储介质 | |
Wujec | Analysis of the financial information contained in the texts of current reports: A deep learning approach | |
CN114996579A (zh) | 信息推送方法、装置、电子设备和计算机可读介质 | |
CN114943563A (zh) | 一种权益推送方法、装置、计算机设备及存储介质 | |
CN114429384A (zh) | 基于电商平台的产品智能推荐方法及系统 | |
Mansyur et al. | Research Trend On Fintech Adoption Over the Years: A Bibliometric Analysis | |
Iswari et al. | User-Generated Content Extraction: A Bibliometric Analysis of the Research Literature (2007–2022) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |