CN115827934A - 基于统一社会信用代码的企业画像智能分析系统及方法 - Google Patents

基于统一社会信用代码的企业画像智能分析系统及方法 Download PDF

Info

Publication number
CN115827934A
CN115827934A CN202310141187.6A CN202310141187A CN115827934A CN 115827934 A CN115827934 A CN 115827934A CN 202310141187 A CN202310141187 A CN 202310141187A CN 115827934 A CN115827934 A CN 115827934A
Authority
CN
China
Prior art keywords
enterprise
data
portrait
intelligent
intelligent analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310141187.6A
Other languages
English (en)
Other versions
CN115827934B (zh
Inventor
丁春利
杨弋
杨显化
王铮
牛颢
髙屹嵩
龙树全
姚晗
王舒
魏兵兵
李�浩
廖建雄
周文安
唐山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Institute Of Standardization
SICHUAN INSTITUTE OF COMPUTER SCIENCES
Original Assignee
Sichuan Institute Of Standardization
SICHUAN INSTITUTE OF COMPUTER SCIENCES
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Institute Of Standardization, SICHUAN INSTITUTE OF COMPUTER SCIENCES filed Critical Sichuan Institute Of Standardization
Priority to CN202310141187.6A priority Critical patent/CN115827934B/zh
Publication of CN115827934A publication Critical patent/CN115827934A/zh
Application granted granted Critical
Publication of CN115827934B publication Critical patent/CN115827934B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于统一社会信用代码的企业画像智能分析系统及方法,解决的是效率低、复杂、准确度不高的技术问题,通过采用分布并联设置的主观数据采集处理单元和客观数据采集处理单元,主观数据采集处理单元和客观数据采集处理单元均连接到企业画像数据存储单元,企业画像数据存储单元连接云数据存储单元和企业画像智能分析单元,企业画像智能分析单元连接企业画像输出单元的技术方案,较好的解决了该问题,可用于企业画像智能分析中。

Description

基于统一社会信用代码的企业画像智能分析系统及方法
技术领域
本发明涉及企业智能化管理领域,具体涉及一种基于统一社会信用代码的企业画像智能分析系统及方法。
背景技术
企业画像又称企业角色,作为一种勾画目标企业、联系企业诉求与设计方向的有效工具,企业画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将企业的属性、行为与期待的数据转化联结起来。作为实际企业的虚拟代表,企业画像所形成的企业角色并不是脱离产品和市场之外所构建出来的,形成的企业角色需要有代表性,能代表产品的主要受众和目标群体。
现有的企业画像智能分析系统及方法存在效率低、复杂、准确度不高的技术问题。本发明提供一种基于统一社会信用代码的企业画像智能分析系统及方法,用以解决上述技术问题。
发明内容
本发明所要解决的技术问题是现有技术中存在的效率低、复杂、准确度不高的技术问题。提供一种新的基于统一社会信用代码的企业画像智能分析系统及方法,该基于统一社会信用代码的企业画像智能分析系统及方法具有效率高、简单、准确度高的特点。
为解决上述技术问题,采用的技术方案如下:
一种基于统一社会信用代码的企业画像智能分析系统,所述基于统一社会信用代码的企业画像智能分析系统包括:
分布并联设置的主观数据采集处理单元和客观数据采集处理单元,主观数据采集处理单元和客观数据采集处理单元均连接到企业画像数据存储单元,企业画像数据存储单元连接云数据存储单元和企业画像智能分析单元,企业画像智能分析单元连接企业画像输出单元;
客观数据采集处理单元包括数据预处理单元,身份特征关联单元;
数据预处理子单元用于预处理处理根据作为企业身份标识特征的统一社会信用代码,采集的与企业身份标识相关的身份数据;身份数据包括企业名称、法定代表人、企业成员;客观数据采集处理单元还用于采集处理与企业身份标识特征关联的企业客观数据,企业客观数据包括注册资本、成立时间、注册地址、经营范围;
主观数据采集处理单元用于采集企业自主主观行为数据,所述企业自主主观行为数据为企业自主行为产生的主观行为数据,其中包括自我主观行为数据和非我主观行为数据;
企业画像数据存储单元,包数据分类子单元依据数据存储子单元,分类子单元用于将企业客观数据,企业自主主观行为数据中的自我主观行为数据和非我主观行为数据进行分类;数据存储子单元用于根据分类结果分开存储数据;
企业画像智能分析单元包括企业分类归集子单元、二级数据集、一级数据集、企业画像智能分析算法模型以及组合加权子单元;
企业分类归集子单元用于调用待画像企业的企业客观数据,在企业画像历史库中进行企业分类归集;
二级数据库存储的是初级企业画像智能分析结果,包括与待画像企业同类企业的历史画像智能分析结果,和企业画像智能分析算法模型的实时分析结果;
企业画像智能分析算法模型中,与待画像企业关联的企业产生的非我主观行为数据、待画像企业的企业自主主观行为数据作为收入,输出为企业画像智能分析实时结果;
组合加权子单元用于将二级数据库的初级企业画像智能分析结果进行加权计算,得出最终的企业画像智能分析结果。
本发明的工作原理:本发明将用于企业画像的数据分为客观数据和主观行为数据,将客观数据分为身份数据和其他客观数据。身份数据包括企业统一社会信用代码,在对企业统一社会信用代码进行数据采集时,就内部解析,判断该企业的登记部门、企业类型、行政区域、以及身份标识码。同时,接受企业关于其他能够锚定企业身份的数据,比如企业成员、企业名称、企业简称等。在此,将企业身份数据统一虚化为一个虚拟的身份标签。
同时,为了减少企业画像的数据传输失密和数据传输的网络开销,本发明将采用边缘计算存储、云服务计算存储的架构结合。将企业画像数据存储单元设置在企业端,利用企业本身的存储设备和数据库。在云服务器端,设置了云存储器用作企业画像的历史画像结果存储,以及当前画像的数据调用,在画像结束后,可以按照倒序将接收时间靠前的数据丢弃,减少存储压力。
本发明对于企业行为数据进行分类,分为自我主观行为数据和非我主观行为数据,在企业被定义为待画像企业时,云服务器可以调用全部数据。但在企业被定性为配合其他企业进行企业画像时,仅需要被调用涉他数据即可。
本发明在企业画像历史库中进行企业分类归集,并在企业分类归集的基础上,将同类企业的历史画像智能分析结果作为二级数据集;调用待画像企业的企业自主主观行为数据,以及与待画像企业关联的其他企业产生的非我主观行为数据组成数据集,根据企业画像智能分析模型,对待画像企业进行企业画像智能分析,得到企业画像智能分析实时结果,将企业画像智能分析实时结果加入二级数据集,根据二级数据集做加权计算,得到企业画像智能分析结果,能够提供较高精度的企业画像分析结果。
上述方案中,为优化,进一步地,对待画像企业进行企业画像智能分析,得到企业画像智能分析实时结果,将企业画像智能分析实时结果加入二级数据集,根据二级数据集做加权计算包括:
步骤a,采用m种企业画像智能分析方法,得到m个企业画像智能分析实时结果集合;
步骤b,采用n种加权计算方法得到n个组合分析结果;
步骤c,将n个组合分析结果与m个企业画像智能分析实时结果进行相似度计算,选择相似度最高的组合分析结果作为最优结果,作为企业画像智能分析结果。
优选方案更进一步地提高了企业画像结果的精度,同时为了防止组合加权计算的失真,将采用多种组合,并将组合结果与原始多种画像结果相似率、相似度最高的加权结果作为最优的企业画像结果,用以输出。
进一步地,所述与待画像企业关联的其他企业判定包括:
(1)判定待画像企业与任一其他企业的企业客观数据之间的关联性程度;
(2)判定待画像企业与任一其他企业的企业非我主观行为数据的交集性程度;
(3)综合加权计算待画像企业与任一其他企业相关度;
(4)对相关性程度值进行排序,将相关性程度值排序高于阈值的企业判定为与待画像企业关联。
在判定待画像企业的关联企业时,既要保证广度,又要防止不恰当的广度带来的额外流量消耗和分析效率减低。本发明通过从客观数据和主观数据二重严重的角度出发,既将客观关系存在交叉的企业纳入,又将业务或者是行为数据交叉超过阈值的企业纳入关联企业范畴。兼顾了分析精度和效率。
进一步地,主观数据采集处理单元采集企业自主主观行为数据包括:
(a)采用滑动窗口对企业自主主观行为数据进行采集;定义窗口样本数据点为
Figure SMS_1
,计算窗口样本数据点为
Figure SMS_2
与其他N-1个窗口样本数据点之间的欧式距离
Figure SMS_3
,确定与
Figure SMS_4
距离排序值由小到大排序小于预定义阈值的K个点作为其紧邻点;
(b)计算数据点
Figure SMS_5
与紧邻点之间的权重
Figure SMS_6
;定义函数
Figure SMS_7
Figure SMS_8
,计算出
Figure SMS_9
的最小值作为最优权值矩阵W;其中,
Figure SMS_10
表示第j个数据点对重构第
Figure SMS_11
个数据点的权值;
Figure SMS_12
Figure SMS_13
Figure SMS_14
为奇异矩阵,r为正则化参数,I为一个K×K的单位矩阵;
(c)计算当前窗口样本数据的本征维度dw和历史窗口的临近本征维度
Figure SMS_15
之间的差值,差值小于预设的阈值则采用临近本征维度
Figure SMS_16
,否则将本征维度dw更新为临近本征维度
Figure SMS_17
后,执行步骤(d);
(d)
Figure SMS_18
Figure SMS_19
的输出向量,通过求解映射函数
Figure SMS_20
,将矩阵M最小的
Figure SMS_21
个非零特征值所对应的特征向量为
Figure SMS_22
Figure SMS_23
为本征维数;
其中,
Figure SMS_24
为损失函数值,矩阵
Figure SMS_25
Figure SMS_26
Figure SMS_27
,I为m×m的单位矩阵。
企业自主行为数据具有时效性,本发明通过窗口模式对该种数据进行时序采集,并实时处理存储。这种方式能够大大降低数据处理的难度,提高效率。同时将多源异构数据进行降维统一化,满足企业画像的高效需要。
本发明还提供一种基于统一社会信用代码的企业画像智能分析方法,所述方法基于前述系统,方法包括:
步骤一,客观数据采集处理单元采集处理作为企业身份标识特征的统一社会信用代码,并采集与企业身份标识相关的身份数据进行处理,将身份数据与统一社会信用代码进行关联处理后存储在企业画像数据存储单元;
步骤二,主观数据采集处理单元采集企业自主主观行为数据,企业自主主观行为数据是由企业自主行为产生的主观行为数据,其中包括自我主观行为数据和非我主观行为数据;企业画像数据存储单元时,将企业客观数据,企业自主主观行为数据中的自我主观行为数据和非我主观行为数据分类存储;
步骤三,企业画像智能分析单元调用待画像企业的企业客观数据,在企业画像历史库中进行企业分类归集,并在企业分类归集的基础上,将同类企业的历史画像智能分析结果作为二级数据集,存在云数据存储单元;
步骤四,企业画像智能分析单元调用待画像企业的企业自主主观行为数据,以及与待画像企业关联的其他企业产生的非我主观行为数据组成数据集,根据企业画像智能分析模型,对待画像企业进行企业画像智能分析,得到企业画像智能分析实时结果,存在云数据存储单元;将企业画像智能分析实时结果并入二级数据集,对更新后二级数据集做加权计算,得到企业画像智能分析结果。
进一步地,步骤四包括:
步骤a,采用m种企业画像智能分析方法,得到m个企业画像智能分析实时结果集合;
步骤b,采用n种加权计算方法得到n个组合分析结果;
步骤c,将n个组合分析结果与m个企业画像智能分析实时结果进行相似度计算,选择相似度最高的组合分析结果作为最优结果,作为企业画像智能分析结果。
进一步地,与待画像企业关联的其他企业的判定包括:
(1)判定待画像企业与任一其他企业的企业客观数据之间的关联性程度;
(2)判定待画像企业与任一其他企业的企业非我主观行为数据的交集性程度;
(3)综合加权计算待画像企业与任一其他企业相关度;
(4)对相关性程度值进行排序,将相关性程度值排序高于阈值的企业判定为与待画像企业关联。
进一步地,采集企业自主主观行为数据包括:
(a)采用滑动窗口对企业自主主观行为数据进行采集;定义窗口样本数据点为
Figure SMS_28
,计算窗口样本数据点为
Figure SMS_29
与其他N-1个窗口样本数据点之间的欧式距离
Figure SMS_30
,确定与
Figure SMS_31
距离排序值由小到大排序小于预定义阈值的K个点作为其紧邻点;
(b)计算数据点
Figure SMS_32
与紧邻点之间的权重
Figure SMS_33
;定义函数
Figure SMS_34
Figure SMS_35
,计算出
Figure SMS_36
的最小值作为最优权值矩阵W;其中,
Figure SMS_37
表示第j个数据点对重构第
Figure SMS_38
个数据点的权值;
Figure SMS_39
Figure SMS_40
Figure SMS_41
为奇异矩阵,r为正则化参数,I为一个K×K的单位矩阵;
(c)计算当前窗口样本数据的本征维度dw和历史窗口的临近本征维度
Figure SMS_42
之间的差值,差值小于预设的阈值则采用临近本征维度
Figure SMS_43
,否则将本征维度dw更新为临近本征维度
Figure SMS_44
后,执行步骤(d);
(d)
Figure SMS_45
Figure SMS_46
的输出向量,通过求解映射函数
Figure SMS_47
,将矩阵M最小的
Figure SMS_48
个非零特征值所对应的特征向量为
Figure SMS_49
Figure SMS_50
为本征维数;
其中,
Figure SMS_51
为损失函数值,矩阵
Figure SMS_52
Figure SMS_53
Figure SMS_54
,I为m×m的单位矩阵。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1,基于统一社会信用代码的企业画像智能分析系统框架图。
图2,基于统一社会信用代码的企业画像智能分析方法示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例1
本实施例提供一种基于统一社会信用代码的企业画像智能分析系统,如图1,所述基于统一社会信用代码的企业画像智能分析系统包括:
分布并联设置的主观数据采集处理单元和客观数据采集处理单元,主观数据采集处理单元和客观数据采集处理单元均连接到企业画像数据存储单元,企业画像数据存储单元连接云数据存储单元和企业画像智能分析单元,企业画像智能分析单元连接企业画像输出单元;
客观数据采集处理单元包括数据预处理单元,身份特征关联单元;
数据预处理子单元用于预处理处理根据作为企业身份标识特征的统一社会信用代码,采集的与企业身份标识相关的身份数据;身份数据包括企业名称、法定代表人、企业成员;客观数据采集处理单元还用于采集处理与企业身份标识特征关联的企业客观数据,企业客观数据包括注册资本、成立时间、注册地址、经营范围;
主观数据采集处理单元用于采集企业自主主观行为数据,所述企业自主主观行为数据为企业自主行为产生的主观行为数据,其中包括自我主观行为数据和非我主观行为数据;
企业画像数据存储单元,包数据分类子单元依据数据存储子单元,分类子单元用于将企业客观数据,企业自主主观行为数据中的自我主观行为数据和非我主观行为数据进行分类;数据存储子单元用于根据分类结果分开存储数据;
企业画像智能分析单元包括企业分类归集子单元、二级数据集、一级数据集、企业画像智能分析算法模型以及组合加权子单元;
企业分类归集子单元用于调用待画像企业的企业客观数据,在企业画像历史库中进行企业分类归集;
二级数据库存储的是初级企业画像智能分析结果,包括与待画像企业同类企业的历史画像智能分析结果,和企业画像智能分析算法模型的实时分析结果;
企业画像智能分析算法模型中,与待画像企业关联的企业产生的非我主观行为数据、待画像企业的企业自主主观行为数据作为收入,输出为企业画像智能分析实时结果;
组合加权子单元用于将二级数据库的初级企业画像智能分析结果进行加权计算,得出最终的企业画像智能分析结果。企业画像输出单元以及其他未详述的模块单元,可采用现有的技术实现。
本实施例的工作原理:本实施例将用于企业画像的数据分为客观数据和主观行为数据,将客观数据分为身份数据和其他客观数据。身份数据包括企业统一社会信用代码,在对企业统一社会信用代码进行数据采集时,就内部解析,判断该企业的登记部门、企业类型、行政区域、以及身份标识码。同时,接受企业关于其他能够锚定企业身份的数据,比如企业成员、企业名称、企业简称等。在此,将企业身份数据统一虚化为一个虚拟的身份标签。
同时,为了减少企业画像的数据传输失密和数据传输的网络开销,本发明将采用边缘计算存储、云服务计算存储的架构结合。将企业画像数据存储单元设置在企业端,利用企业本身的存储设备和数据库。在云服务器端,设置了云存储器用作企业画像的历史画像结果存储,以及当前画像的数据调用,在画像结束后,可以按照倒序将接收时间靠前的数据丢弃,减少存储压力。
本实施例对于企业行为数据进行分类,分为自我主观行为数据和非我主观行为数据,在企业被定义为待画像企业时,云服务器可以调用全部数据。但在企业被定性为配合其他企业进行企业画像时,仅需要被调用涉他数据即可。
本实施例在企业画像历史库中进行企业分类归集,并在企业分类归集的基础上,将同类企业的历史画像智能分析结果作为二级数据集;调用待画像企业的企业自主主观行为数据,以及与待画像企业关联的其他企业产生的非我主观行为数据组成数据集,根据企业画像智能分析模型,对待画像企业进行企业画像智能分析,得到企业画像智能分析实时结果,将企业画像智能分析实时结果加入二级数据集,根据二级数据集做加权计算,得到企业画像智能分析结果,能够提供较高精度的企业画像分析结果。
上述方案中,为优化,进一步地,对待画像企业进行企业画像智能分析,得到企业画像智能分析实时结果,将企业画像智能分析实时结果加入二级数据集,根据二级数据集做加权计算包括:
步骤a,采用m种企业画像智能分析方法,得到m个企业画像智能分析实时结果集合;
步骤b,采用n种加权计算方法得到n个组合分析结果;
步骤c,将n个组合分析结果与m个企业画像智能分析实时结果进行相似度计算,选择相似度最高的组合分析结果作为最优结果,作为企业画像智能分析结果。
优选方案更进一步地提高了企业画像结果的精度,同时为了防止组合加权计算的失真,将采用多种组合,并将组合结果与原始多种画像结果相似率、相似度最高的加权结果作为最优的企业画像结果,用以输出。
进一步地,所述与待画像企业关联的其他企业判定包括:
(1)判定待画像企业与任一其他企业的企业客观数据之间的关联性程度;
(2)判定待画像企业与任一其他企业的企业非我主观行为数据的交集性程度;
(3)综合加权计算待画像企业与任一其他企业相关度;
(4)对相关性程度值进行排序,将相关性程度值排序高于阈值的企业判定为与待画像企业关联。
在判定待画像企业的关联企业时,既要保证广度,又要防止不恰当的广度带来的额外流量消耗和分析效率减低。本发明通过从客观数据和主观数据二重严重的角度出发,既将客观关系存在交叉的企业纳入,又将业务或者是行为数据交叉超过阈值的企业纳入关联企业范畴。兼顾了分析精度和效率。
进一步地,主观数据采集处理单元采集企业自主主观行为数据包括:
(a)采用滑动窗口对企业自主主观行为数据进行采集;定义窗口样本数据点为
Figure SMS_55
,计算窗口样本数据点为
Figure SMS_56
与其他N-1个窗口样本数据点之间的欧式距离
Figure SMS_57
,确定与
Figure SMS_58
距离排序值由小到大排序小于预定义阈值的K个点作为其紧邻点;
(b)计算数据点
Figure SMS_59
与紧邻点之间的权重
Figure SMS_60
;定义函数
Figure SMS_61
Figure SMS_62
,计算出
Figure SMS_63
的最小值作为最优权值矩阵W;其中,
Figure SMS_64
表示第j个数据点对重构第
Figure SMS_65
个数据点的权值;
Figure SMS_66
Figure SMS_67
Figure SMS_68
为奇异矩阵,r为正则化参数,I为一个K×K的单位矩阵;
(c)计算当前窗口样本数据的本征维度dw和历史窗口的临近本征维度
Figure SMS_69
之间的差值,差值小于预设的阈值则采用临近本征维度
Figure SMS_70
,否则将本征维度dw更新为临近本征维度
Figure SMS_71
后,执行步骤(d);
(d)
Figure SMS_72
Figure SMS_73
的输出向量,通过求解映射函数
Figure SMS_74
,将矩阵M最小的
Figure SMS_75
个非零特征值所对应的特征向量为
Figure SMS_76
Figure SMS_77
为本征维数;
其中,
Figure SMS_78
为损失函数值,矩阵
Figure SMS_79
Figure SMS_80
Figure SMS_81
,I为m×m的单位矩阵。
企业自主行为数据具有时效性,本发明通过窗口模式对该种数据进行时序采集,并实时处理存储。这种方式能够大大降低数据处理的难度,提高效率。同时将多源异构数据进行降维统一化,满足企业画像的高效需要。
本实施例还提供一种基于统一社会信用代码的企业画像智能分析方法,所述方法基于前述系统,如图2所示,方法包括:
步骤一,客观数据采集处理单元采集处理作为企业身份标识特征的统一社会信用代码,并采集与企业身份标识相关的身份数据进行处理,将身份数据与统一社会信用代码进行关联处理后存储在企业画像数据存储单元;
步骤二,主观数据采集处理单元采集企业自主主观行为数据,企业自主主观行为数据是由企业自主行为产生的主观行为数据,其中包括自我主观行为数据和非我主观行为数据;企业画像数据存储单元时,将企业客观数据,企业自主主观行为数据中的自我主观行为数据和非我主观行为数据分类存储;
步骤三,企业画像智能分析单元调用待画像企业的企业客观数据,在企业画像历史库中进行企业分类归集,并在企业分类归集的基础上,将同类企业的历史画像智能分析结果作为二级数据集,存在云数据存储单元;
步骤四,企业画像智能分析单元调用待画像企业的企业自主主观行为数据,以及与待画像企业关联的其他企业产生的非我主观行为数据组成数据集,根据企业画像智能分析模型,对待画像企业进行企业画像智能分析,得到企业画像智能分析实时结果,存在云数据存储单元;将企业画像智能分析实时结果并入二级数据集,对更新后二级数据集做加权计算,得到企业画像智能分析结果。
进一步地,步骤四包括:
步骤a,采用m种企业画像智能分析方法,得到m个企业画像智能分析实时结果集合;
步骤b,采用n种加权计算方法得到n个组合分析结果;
步骤c,将n个组合分析结果与m个企业画像智能分析实时结果进行相似度计算,选择相似度最高的组合分析结果作为最优结果,作为企业画像智能分析结果。
进一步地,与待画像企业关联的其他企业的判定包括:
(1)判定待画像企业与任一其他企业的企业客观数据之间的关联性程度;
(2)判定待画像企业与任一其他企业的企业非我主观行为数据的交集性程度;
(3)综合加权计算待画像企业与任一其他企业相关度;
(4)对相关性程度值进行排序,将相关性程度值排序高于阈值的企业判定为与待画像企业关联。
进一步地,采集企业自主主观行为数据包括:
(a)采用滑动窗口对企业自主主观行为数据进行采集;定义窗口样本数据点为
Figure SMS_82
,计算窗口样本数据点为
Figure SMS_83
与其他N-1个窗口样本数据点之间的欧式距离
Figure SMS_84
,确定与
Figure SMS_85
距离排序值由小到大排序小于预定义阈值的K个点作为其紧邻点;
(b)计算数据点
Figure SMS_86
与紧邻点之间的权重
Figure SMS_87
;定义函数
Figure SMS_88
Figure SMS_89
,计算出
Figure SMS_90
的最小值作为最优权值矩阵W;其中,
Figure SMS_91
表示第j个数据点对重构第
Figure SMS_92
个数据点的权值;
Figure SMS_93
Figure SMS_94
Figure SMS_95
为奇异矩阵,r为正则化参数,I为一个K×K的单位矩阵;
(c)计算当前窗口样本数据的本征维度dw和历史窗口的临近本征维度
Figure SMS_96
之间的差值,差值小于预设的阈值则采用临近本征维度
Figure SMS_97
,否则将本征维度dw更新为临近本征维度
Figure SMS_98
后,执行步骤(d);
(d)
Figure SMS_99
Figure SMS_100
的输出向量,通过求解映射函数
Figure SMS_101
,将矩阵M最小的
Figure SMS_102
个非零特征值所对应的特征向量为
Figure SMS_103
Figure SMS_104
为本征维数;
其中,
Figure SMS_105
为损失函数值,矩阵
Figure SMS_106
Figure SMS_107
Figure SMS_108
,I为m×m的单位矩阵。
本实施例为列明的部分,是可以采用现有的技术内容,迫于篇幅,本实施例不再赘述。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员能够理解本发明,但是本发明不仅限于具体实施方式的范围,对本技术领域的普通技术人员而言,只要各种变化只要在所附的权利要求限定和确定的本发明精神和范围内,一切利用本发明构思的发明创造均在保护之列。

Claims (8)

1.一种基于统一社会信用代码的企业画像智能分析系统,其特征在于:所述基于统一社会信用代码的企业画像智能分析系统包括:
分布并联设置的主观数据采集处理单元和客观数据采集处理单元,主观数据采集处理单元和客观数据采集处理单元均连接到企业画像数据存储单元,企业画像数据存储单元连接云数据存储单元和企业画像智能分析单元,企业画像智能分析单元连接企业画像输出单元;
客观数据采集处理单元包括数据预处理单元,身份特征关联单元;
数据预处理子单元用于预处理处理根据作为企业身份标识特征的统一社会信用代码,采集的与企业身份标识相关的身份数据;身份数据包括企业名称、法定代表人、企业成员;客观数据采集处理单元还用于采集处理与企业身份标识特征关联的企业客观数据,企业客观数据包括注册资本、成立时间、注册地址、经营范围;
主观数据采集处理单元用于采集企业自主主观行为数据,所述企业自主主观行为数据为企业自主行为产生的主观行为数据,其中包括自我主观行为数据和非我主观行为数据;
企业画像数据存储单元,包数据分类子单元依据数据存储子单元,分类子单元用于将企业客观数据,企业自主主观行为数据中的自我主观行为数据和非我主观行为数据进行分类;数据存储子单元用于根据分类结果分开存储数据;
企业画像智能分析单元包括企业分类归集子单元、二级数据集、一级数据集、企业画像智能分析算法模型以及组合加权子单元;
企业分类归集子单元用于调用待画像企业的企业客观数据,在企业画像历史库中进行企业分类归集;
二级数据库存储的是初级企业画像智能分析结果,包括与待画像企业同类企业的历史画像智能分析结果,和企业画像智能分析算法模型的实时分析结果;
企业画像智能分析算法模型中,与待画像企业关联的企业产生的非我主观行为数据、待画像企业的企业自主主观行为数据作为收入,输出为企业画像智能分析实时结果;
组合加权子单元用于将二级数据库的初级企业画像智能分析结果进行加权计算,得出最终的企业画像智能分析结果。
2.根据权利要求1所述的基于统一社会信用代码的企业画像智能分析系统,其特征在于:组合加权子单元控制企业画像智能分析算法模型、二级数据库,共同执行如下步骤,完成初级企业画像智能分析结果的加权计算:
步骤a,采用m种企业画像智能分析方法,得到m个企业画像智能分析实时结果集合;
步骤b,采用n种加权计算方法得到n个组合分析结果;
步骤c,将n个组合分析结果与m个企业画像智能分析实时结果进行相似度计算,选择相似度最高的组合分析结果作为最优结果,作为企业画像智能分析结果。
3.根据权利要求2所述的基于统一社会信用代码的企业画像智能分析系统,其特征在于:所述与待画像企业关联的其他企业判定包括:
(1)判定待画像企业与任一其他企业的企业客观数据之间的关联性程度;
(2)判定待画像企业与任一其他企业的企业非我主观行为数据的交集性程度;
(3)综合加权计算待画像企业与任一其他企业相关度;
(4)对相关性程度值进行排序,将相关性程度值排序高于阈值的企业判定为与待画像企业关联。
4.根据权利要求2所述的基于统一社会信用代码的企业画像智能分析系统,其特征在于:主观数据采集处理单元采集企业自主主观行为数据包括:
(a)采用滑动窗口对企业自主主观行为数据进行采集;定义窗口样本数据点为
Figure QLYQS_1
,计算窗口样本数据点为
Figure QLYQS_2
与其他N-1个窗口样本数据点之间的欧式距离
Figure QLYQS_3
,确定与
Figure QLYQS_4
距离排序值由小到大排序小于预定义阈值的K个点作为其紧邻点;
(b)计算数据点
Figure QLYQS_5
与紧邻点之间的权重
Figure QLYQS_6
;定义函数
Figure QLYQS_7
Figure QLYQS_8
,计算出
Figure QLYQS_9
的最小值作为最优权值矩阵W;其中,
Figure QLYQS_10
表示第j个数据点对重构第
Figure QLYQS_11
个数据点的权值;
Figure QLYQS_12
Figure QLYQS_13
Figure QLYQS_14
为奇异矩阵,r为正则化参数,I为一个K×K的单位矩阵;
(c)计算当前窗口样本数据的本征维度dw和历史窗口的临近本征维度
Figure QLYQS_15
之间的差值,差值小于预设的阈值则采用临近本征维度
Figure QLYQS_16
,否则将本征维度dw更新为临近本征维度
Figure QLYQS_17
后,执行步骤(d);
(d)
Figure QLYQS_18
Figure QLYQS_19
的输出向量,通过求解映射函数
Figure QLYQS_20
,将矩阵M最小的
Figure QLYQS_21
个非零特征值所对应的特征向量为
Figure QLYQS_22
Figure QLYQS_23
为本征维数;
其中,
Figure QLYQS_24
为损失函数值,矩阵
Figure QLYQS_25
Figure QLYQS_26
Figure QLYQS_27
,I为m×m的单位矩阵。
5.一种基于统一社会信用代码的企业画像智能分析方法,其特征在于:所述基于统一社会信用代码的企业画像智能分析方法基于权利要求1-4任一所述的基于统一社会信用代码的企业画像智能分析系统,方法包括:
步骤一,客观数据采集处理单元采集处理作为企业身份标识特征的统一社会信用代码,并采集与企业身份标识相关的身份数据进行处理,将身份数据与统一社会信用代码进行关联处理后存储在企业画像数据存储单元;
步骤二,主观数据采集处理单元采集企业自主主观行为数据,企业自主主观行为数据是由企业自主行为产生的主观行为数据,其中包括自我主观行为数据和非我主观行为数据;企业画像数据存储单元时,将企业客观数据,企业自主主观行为数据中的自我主观行为数据和非我主观行为数据分类存储;
步骤三,企业画像智能分析单元调用待画像企业的企业客观数据,在企业画像历史库中进行企业分类归集,并在企业分类归集的基础上,将同类企业的历史画像智能分析结果作为二级数据集,存在云数据存储单元;
步骤四,企业画像智能分析单元调用待画像企业的企业自主主观行为数据,以及与待画像企业关联的其他企业产生的非我主观行为数据组成数据集,根据企业画像智能分析模型,对待画像企业进行企业画像智能分析,得到企业画像智能分析实时结果,存在云数据存储单元;将企业画像智能分析实时结果并入二级数据集,对更新后二级数据集做加权计算,得到企业画像智能分析结果。
6.根据权利要求5所述的基于统一社会信用代码的企业画像智能分析方法,其特征在于:步骤四包括:
步骤a,采用m种企业画像智能分析方法,得到m个企业画像智能分析实时结果集合;
步骤b,采用n种加权计算方法得到n个组合分析结果;
步骤c,将n个组合分析结果与m个企业画像智能分析实时结果进行相似度计算,选择相似度最高的组合分析结果作为最优结果,作为企业画像智能分析结果。
7.根据权利要求5所述的基于统一社会信用代码的企业画像智能分析方法,其特征在于:与待画像企业关联的其他企业的判定包括:
(1)判定待画像企业与任一其他企业的企业客观数据之间的关联性程度;
(2)判定待画像企业与任一其他企业的企业非我主观行为数据的交集性程度;
(3)综合加权计算待画像企业与任一其他企业相关度;
(4)对相关性程度值进行排序,将相关性程度值排序高于阈值的企业判定为与待画像企业关联。
8.根据权利要求5所述的基于统一社会信用代码的企业画像智能分析方法,其特征在于:采集企业自主主观行为数据包括:
(a)采用滑动窗口对企业自主主观行为数据进行采集;定义窗口样本数据点为
Figure QLYQS_28
,计算窗口样本数据点为
Figure QLYQS_29
与其他N-1个窗口样本数据点之间的欧式距离
Figure QLYQS_30
,确定与
Figure QLYQS_31
距离排序值由小到大排序小于预定义阈值的K个点作为其紧邻点;
(b)计算数据点
Figure QLYQS_32
与紧邻点之间的权重
Figure QLYQS_33
;定义函数
Figure QLYQS_34
Figure QLYQS_35
,计算出
Figure QLYQS_36
的最小值作为最优权值矩阵W;其中,
Figure QLYQS_37
表示第j个数据点对重构第
Figure QLYQS_38
个数据点的权值;
Figure QLYQS_39
Figure QLYQS_40
Figure QLYQS_41
为奇异矩阵,r为正则化参数,I为一个K×K的单位矩阵;
(c)计算当前窗口样本数据的本征维度dw和历史窗口的临近本征维度
Figure QLYQS_42
之间的差值,差值小于预设的阈值则采用临近本征维度
Figure QLYQS_43
,否则将本征维度dw更新为临近本征维度
Figure QLYQS_44
后,执行步骤(d);
(d)
Figure QLYQS_45
Figure QLYQS_46
的输出向量,通过求解映射函数
Figure QLYQS_47
,将矩阵M最小的
Figure QLYQS_48
个非零特征值所对应的特征向量为
Figure QLYQS_49
Figure QLYQS_50
为本征维数;
其中,
Figure QLYQS_51
为损失函数值,矩阵
Figure QLYQS_52
Figure QLYQS_53
Figure QLYQS_54
,I为m×m的单位矩阵。
CN202310141187.6A 2023-02-21 2023-02-21 基于统一社会信用代码的企业画像智能分析系统及方法 Active CN115827934B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310141187.6A CN115827934B (zh) 2023-02-21 2023-02-21 基于统一社会信用代码的企业画像智能分析系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310141187.6A CN115827934B (zh) 2023-02-21 2023-02-21 基于统一社会信用代码的企业画像智能分析系统及方法

Publications (2)

Publication Number Publication Date
CN115827934A true CN115827934A (zh) 2023-03-21
CN115827934B CN115827934B (zh) 2023-05-09

Family

ID=85522009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310141187.6A Active CN115827934B (zh) 2023-02-21 2023-02-21 基于统一社会信用代码的企业画像智能分析系统及方法

Country Status (1)

Country Link
CN (1) CN115827934B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070100724A1 (en) * 2005-11-03 2007-05-03 Hollas Judd E Electronic enterprise capital marketplace and monitoring apparatus and method
US20070118892A1 (en) * 2005-11-21 2007-05-24 Sastry Hari V N Method and apparatus for associating a digital certificate with an enterprise profile
US20140108314A1 (en) * 2012-10-12 2014-04-17 Nec Laboratories America, Inc. Integrated approach to model time series dynamics in complex physical systems
CN106339806A (zh) * 2016-08-24 2017-01-18 北京创业公社征信服务有限公司 一种面向企业信息的行业全息画像构建方法及系统
CN108509569A (zh) * 2018-03-26 2018-09-07 河北省科学院应用数学研究所 企业画像的生成方法、装置、电子设备以及存储介质
CN109726905A (zh) * 2018-12-20 2019-05-07 北交金科金融信息服务有限公司 一种企业价值画像评价的方法和系统
CN111027854A (zh) * 2019-12-10 2020-04-17 重庆撼地大数据有限公司 一种基于企业大数据的综合画像指数生成方法及相关设备
CN111861262A (zh) * 2020-07-30 2020-10-30 国网山东省电力公司寿光市供电公司 一种基于能源大数据的企业透视画像方法及终端
CN112328849A (zh) * 2020-11-02 2021-02-05 腾讯科技(深圳)有限公司 用户画像的构建方法、基于用户画像的对话方法及装置
CN112465622A (zh) * 2020-09-16 2021-03-09 西安科技大学 企业综合信用信息查验方法、系统、介质、计算机设备
WO2021147557A1 (zh) * 2020-08-28 2021-07-29 平安科技(深圳)有限公司 客户画像方法、装置、计算机可读存储介质及终端设备
CN114090736A (zh) * 2021-11-18 2022-02-25 西南科技大学 一种基于文本相似度的企业行业识别系统及识别方法
CN114723492A (zh) * 2022-04-15 2022-07-08 山东浪潮爱购云链信息科技有限公司 一种企业画像的生成方法及设备
CN115456745A (zh) * 2022-09-14 2022-12-09 江苏银承网络科技股份有限公司 小微企业画像构建方法及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070100724A1 (en) * 2005-11-03 2007-05-03 Hollas Judd E Electronic enterprise capital marketplace and monitoring apparatus and method
US20070118892A1 (en) * 2005-11-21 2007-05-24 Sastry Hari V N Method and apparatus for associating a digital certificate with an enterprise profile
US20140108314A1 (en) * 2012-10-12 2014-04-17 Nec Laboratories America, Inc. Integrated approach to model time series dynamics in complex physical systems
CN106339806A (zh) * 2016-08-24 2017-01-18 北京创业公社征信服务有限公司 一种面向企业信息的行业全息画像构建方法及系统
CN108509569A (zh) * 2018-03-26 2018-09-07 河北省科学院应用数学研究所 企业画像的生成方法、装置、电子设备以及存储介质
CN109726905A (zh) * 2018-12-20 2019-05-07 北交金科金融信息服务有限公司 一种企业价值画像评价的方法和系统
CN111027854A (zh) * 2019-12-10 2020-04-17 重庆撼地大数据有限公司 一种基于企业大数据的综合画像指数生成方法及相关设备
CN111861262A (zh) * 2020-07-30 2020-10-30 国网山东省电力公司寿光市供电公司 一种基于能源大数据的企业透视画像方法及终端
WO2021147557A1 (zh) * 2020-08-28 2021-07-29 平安科技(深圳)有限公司 客户画像方法、装置、计算机可读存储介质及终端设备
CN112465622A (zh) * 2020-09-16 2021-03-09 西安科技大学 企业综合信用信息查验方法、系统、介质、计算机设备
CN112328849A (zh) * 2020-11-02 2021-02-05 腾讯科技(深圳)有限公司 用户画像的构建方法、基于用户画像的对话方法及装置
CN114090736A (zh) * 2021-11-18 2022-02-25 西南科技大学 一种基于文本相似度的企业行业识别系统及识别方法
CN114723492A (zh) * 2022-04-15 2022-07-08 山东浪潮爱购云链信息科技有限公司 一种企业画像的生成方法及设备
CN115456745A (zh) * 2022-09-14 2022-12-09 江苏银承网络科技股份有限公司 小微企业画像构建方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FRANKLIN L. QUILUMBA等: "Using Smart Meter Data to Improve the Accuracy of Intraday Load Forecasting Considering Customer Behavior Similarities", 《IEEE TRANSACTIONS ON SMART GRID》 *
曹丽娜等: "基于深度学习的中小微企业综合质量画像构建研究", 《数据分析与知识发现》 *
杨弋: "四川省社会信用体系建设的SWOT分析与思考", 《标准科学》 *

Also Published As

Publication number Publication date
CN115827934B (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
CN112949673B (zh) 一种基于全局注意力的特征融合目标检测与识别方法
CN112308158A (zh) 一种基于部分特征对齐的多源领域自适应模型及方法
CN106228398A (zh) 基于c4.5决策树算法的特定用户挖掘系统及其方法
CN107766929A (zh) 模型分析方法及装置
CN112926429B (zh) 机审模型训练、视频机审方法、装置、设备及存储介质
CN113326377A (zh) 一种基于企业关联关系的人名消歧方法及系统
CN111970400B (zh) 骚扰电话识别方法及装置
CN113762377B (zh) 网络流量识别方法、装置、设备及存储介质
CN112785441B (zh) 数据处理方法、装置、终端设备及存储介质
CN118484313B (zh) 基于数据特征的智能算力调用管理系统及方法
CN116721414A (zh) 一种医学图像细胞分割与跟踪方法
CN116633601A (zh) 一种基于网络流量态势感知的检测方法
CN114169506A (zh) 一种基于工业物联网平台的深度学习边缘计算系统框架
CN110855474B (zh) Kqi数据的网络特征提取方法、装置、设备及存储介质
CN117473415A (zh) 基于融合特征和自适应权重的物联网流量分类方法
CN112215574A (zh) 车驾管业务工单的生成方法、装置、设备及存储介质
CN115827934A (zh) 基于统一社会信用代码的企业画像智能分析系统及方法
CN115146653B (zh) 对话剧本构建方法、装置、设备及存储介质
CN113742495B (zh) 基于预测模型的评级特征权重确定方法及装置、电子设备
CN115861956A (zh) 一种基于解耦头部的Yolov3道路垃圾检测方法
CN115544250A (zh) 一种数据处理方法及系统
CN114519343A (zh) 基于95598的重复来电预处理方法、装置、设备及存储介质
CN109308565B (zh) 人群绩效等级识别方法、装置、存储介质及计算机设备
CN118568144A (zh) 一种大数据智能分析系统及方法
CN113191569A (zh) 一种基于大数据的企业管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Ding Chunli

Inventor after: Wei Bingbing

Inventor after: Li Hao

Inventor after: Liao Jianxiong

Inventor after: Zhou Wenan

Inventor after: Tang Shan

Inventor after: Yang Ge

Inventor after: Yang Xianhua

Inventor after: Wang Zheng

Inventor after: Niu Hao

Inventor after: Gao Yisong

Inventor after: Long Shuquan

Inventor after: Yao Han

Inventor after: Wang Shu

Inventor before: Ding Chunli

Inventor before: Wei Bingbing

Inventor before: Li Hao

Inventor before: Liao Jianxiong

Inventor before: Zhou Wenan

Inventor before: Tang Shan

Inventor before: Yang Ge

Inventor before: Yang Xianhua

Inventor before: Wang Zheng

Inventor before: Niu Hao

Inventor before: Gao Yisong

Inventor before: Long Shuquan

Inventor before: Yao Han

Inventor before: Wang Shu

CB03 Change of inventor or designer information