CN112287016B - 一种企业视图的构建方法及系统 - Google Patents

一种企业视图的构建方法及系统 Download PDF

Info

Publication number
CN112287016B
CN112287016B CN202011118882.3A CN202011118882A CN112287016B CN 112287016 B CN112287016 B CN 112287016B CN 202011118882 A CN202011118882 A CN 202011118882A CN 112287016 B CN112287016 B CN 112287016B
Authority
CN
China
Prior art keywords
data
enterprise
information
label
multiple dimensions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011118882.3A
Other languages
English (en)
Other versions
CN112287016A (zh
Inventor
马正祥
史志杰
刘晓亮
李惠贞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianzhu Science & Technology Co ltd
Original Assignee
Tianzhu Science & Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianzhu Science & Technology Co ltd filed Critical Tianzhu Science & Technology Co ltd
Priority to CN202011118882.3A priority Critical patent/CN112287016B/zh
Publication of CN112287016A publication Critical patent/CN112287016A/zh
Application granted granted Critical
Publication of CN112287016B publication Critical patent/CN112287016B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Abstract

本发明的实施例提供一种企业视图的构建方法及系统。其中,方法包括:获取与企业关联的多个维度的企业数据信息;对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据;对每一类别的数据添加至少一个标签,所述至少一个标签共同标识一个类别的数据;根据所述标签,生成企业视图。本发明的方案可以整合不同类型的用户数据,通过多维数据集成,打破企业数据孤岛,建立准确、完备、客观的企业信息管理。

Description

一种企业视图的构建方法及系统
技术领域
本发明涉及建筑企业的信息处理技术领域,特别是指一种企业视图的构建方法及系统。
背景技术
为顺应信息技术发展趋势的需要,建筑业作为国民经济支柱产业,通过加快信息化和工业化深度融合,全面提高建筑业信息化水平,加快转型升级势在必行。建筑业是一个拥有大数据的行业,包含建筑勘测、施工、设计、装修、维护与管理等多个行业,涉及人群庞大、公众繁多、建材多样等多个方面。
目前建筑市场信息发育不完善,现有的建筑业画像描述多是对企业的某个单一方面进行描写,例如企业的基本信息、资质信息、信用信息等。
建筑市场上各行业、各个方面的信息获取多依靠人工整理、线下直接客户拜访,项目工程信息记录多是依靠纸质办公,各个管理环节信息分散,没有完整地模型供各参与方使用且缺少信息共享机制。
随着数字经济的崛起,全面增强建筑业信息化水平,加强信息技术在建筑业中的应用,实现产业链各参与方之间在各阶段、各环节协同应用十分迫切,而建筑业生产的复杂性、管理的粗放性,使其数据获取、信息管理极其困难,多数建筑企业缺乏大数据思维,难以意识到大数据对于企业发展的重要性,存在一个建筑项目完成后与之相关的数据资料也被废弃或遗忘的现象,多数信息因没有电子化存储而不能再发挥其利用价值。针对企业信息目前仅能获取其基本信息,多数信息并不全面且来源真实性有待考究;对于单个企业来说,企业内部信息例如资质资格、工程项目信息、信用评价等无从获取,不完善的数据分析会误导用户决策判断;对于同等类型的多个企业来说,外界无法了解企业的真实水平,用户对于企业信息的获取周期长、效率不高,给用户选择带来不便。在对企业数据获取整理方面需要解决信息来源获取、数据重复采集、数据缺失、真实性核查等问题。
在产业链长、发展粗放的建筑领域,为贯彻推进信息化发展相关政策,推动建筑业数字化、网络化进展,加快信息技术与建筑业发展深度融合,充分发挥信息化的引领和支撑作用,同时针对上述提到的问题,建立全面完善的信息管理和评估体系极其重要。
发明内容
本发明要解决的技术问题是提供一种企业视图的构建方法及系统。整合不同类型的用户数据,通过多维数据集成,打破企业数据孤岛,建立准确、完备、客观的企业信息管理。
为解决上述技术问题,本发明的技术方案如下:
一种企业视图的构建方法,包括:
获取与企业关联的多个维度的企业数据信息;
对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据;
对每一类别的数据添加至少一个标签,所述至少一个标签共同标识一个类别的数据;
根据所述标签,生成企业视图。
可选的,获取与企业关联的多个维度的企业数据信息,包括:
获取与企业关联的企业基本信息数据、公共信息数据、经济信息数据、企业管理数据中的至少一项,所述企业基本信息数据、公共信息数据、经济信息数据、企业管理数据为异构数据。
可选的,所述企业数据信息包括:建筑企业的建筑勘测信息、设计信息、施工信息、装修信息、维护与管理信息中的至少一项。
可选的,对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据,包括:
获取多个维度的企业数据信息进行格式转换处理,得到统一结构的数据;
对所述数据进行分析,确定所述多个维度的企业数据信息之间的关联关系;
根据所述关联关系,对所述多个维度的企业数据信息进行分类整理,得到多个类别的数据。
可选的,对所述数据进行分析,确定所述多个维度的企业数据信息之间的关联关系,包括:
对所述数据的描述语料进行分析,得到多个关键词;
根据所述关键词的频度,确定多个维度的企业数据信息之间的关联关系。
可选的,对每一类别的数据添加至少一个标签,包括:
对每一类别的数据添加内部数据标签、业务特征标签、外部来源数据标签、事实标签、模型标签、预测标签中的至少一种。
可选的,企业视图的构建方法,还包括:根据所述每一类别的数据的标签,对所述多个维度的企业数据信息进行信息查询、个性化需求洞察以及风险用户评级的分析。
可选的,根据所述标签,生成企业视图,包括:根据所述标签,按照预设图例的布局方式,生成企业视图。
可选的,所述图例的布局方式包括:企业名称,与企业名称关联的多个类别的数据,每个类别的数据用多个标签进行标识。
本发明的实施例还提供一种企业视图的构建系统,包括:
获取模块,用于获取与企业关联的多个维度的企业数据信息;
处理模块,用于对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据;对每一类别的数据添加至少一个标签,所述至少一个标签共同标识一个类别的数据;根据所述标签,生成企业视图。
本发明的上述方案至少包括以下有益效果:
本发明的上述方案,通过获取与企业关联的多个维度的企业数据信息;对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据;对每一类别的数据添加至少一个标签,所述至少一个标签共同标识一个类别的数据;根据所述标签,生成企业视图。本发明的方案通过多维数据集成,打破企业数据孤岛,建立准确、完备、客观的企业信息管理。
附图说明
图1是本发明的企业视图的构建方法的流程示意图;
图2是本发明的企业视图的一种实现示意图;
图3是本发明的企业视图的构建系统的模块示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,一种企业视图的构建方法,包括:
步骤11,获取与企业关联的多个维度的企业数据信息;
步骤12,对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据;
步骤13,对每一类别的数据添加至少一个标签,所述至少一个标签共同标识一个类别的数据;
步骤14,根据所述标签,生成企业视图。
本发明的该实施例通过获取与企业关联的多个维度的企业数据信息;对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据;对每一类别的数据添加至少一个标签,所述至少一个标签共同标识一个类别的数据;根据所述标签,生成企业视图。本发明的方案通过多维数据集成,打破企业数据孤岛,建立准确、完备、客观的企业信息管理。
本发明一可选的实施例中,步骤11可以包括:
步骤11,获取与企业关联的企业基本信息数据、公共信息数据、经济信息数据、企业管理数据中的至少一项,所述企业基本信息数据、公共信息数据、经济信息数据、企业管理数据为异构数据。
这里,企业基本信息数据可以包括企业名称、信用代码、注册地、经济类型、经营范围等信息;
企业管理数据可以包括:税务信息、财务信息、建设项目信息、经营状况信息、企业资质信息、行政许可信息中的至少一项;
上述企业基本信息数据、公共信息数据、经济信息数据以及企业管理数据为异构数据,具体的,这些数据的存储管理机制不同,可以是关系型数据库系统,如:Oracle、SQLServer、DB2等,也可以是文件行二维数据,如:txt、CSV、XLS等。
本发明的一可选的实施例中,企业可以是建筑行业的企业,建筑行业的信息包括:建筑勘测信息、设计信息、施工信息、装修信息、维护与管理等多个信息;建筑行业的企业的所述企业数据信息包括:建筑行业的企业的建筑勘测信息、设计信息、施工信息、装修信息、维护与管理信息中的至少一项。
其中,上述企业基本信息数据可以是建筑行业的企业的基本信息数据,公共信息数据也可以是建筑业务的企业的公共信息数据、经济信息数据也可以是建筑行业的企业的经济信息数据、企业管理数据也可以是建筑行业的企业的企业管理数据;
上述建筑勘测信息、设计信息、施工信息、装修信息、维护与管理信息中的至少一项,可以是建筑行业的企业的企业管理数据中的信息。
本发明的一可选的实施例中,步骤12可以包括:
步骤121,获取多个维度的企业数据信息进行格式转换处理,得到统一结构的数据;
步骤122,对所述数据进行分析,确定所述多个维度的企业数据信息之间的关联关系;
步骤123,根据所述关联关系,对所述多个维度的企业数据信息进行分类整理,得到多个类别的数据。
本发明的该实施例中,步骤121具体实现时,对上述各个维度的企业数据进行格式转换处理时,可以采用XML结合JDBC(Java DataBase Connectivity)实现各个维度的企业数据之间的格式转换,Java与数据库接口规范JDBC是支持SQL功能的一个通用的应用程序编程接口,它在不同的数据库功能模块的层次上提供了一统一的用户界面,利用JDBC接口从源与目标DBMS中读取DBMS所支持的数据类型,找出源与目标数据类型的对应关系,将该对应关系存入指定的XML文档中;具体来说,利用SQL语句得到源表数据结果集,再根据JDBC的ResultSMetaData接口得到源表字段数据类型所对应的JDBC类型的常量值;根据得到的JDBC类型的常量值决定使用何种获取方法获得源表数据;开成导入目标表数据的SQL语句,执行SQL语句;这样源表的数据就被导入到目标表中。XML具有较好的自描述性,可适用于不同应用间的数据交换,这种交换不以数据结构为前提,具有较强的开放性。
本发明的一可选的实施例中,上述步骤122可以包括:
步骤1221,对所述数据的描述语料进行分析,得到多个关键词;
步骤1222,根据所述关键词的频度,确定多个维度的企业数据信息之间的关联关系。
该实施例中,基于亲和图方法,对上述转换后统一格式的数据进行语料进行分析,得到多个关键词;比如,对于企业基本信息数据、公共信息数据、经济信息数据、企业管理数据中的每一种数据进行分析,若企业基本信息数据进行分析后,得到的关键词为A、B、C、D;若企业公共信息数据进行分析后,得到的关键词为B、C、F、G;企业的经济信息数据进行分析后,得到的关键词为B、C、E、H;对企业管理数据进行分析后,得到的关键词为B、C、I、M、M;可见B和C两个关键词出现有频度已经超过一预设值,这里是在每个维度的数据中都出现,因此,可以为认为这几个维度的数据之间存在较强的关联关系,由于企业的多维度数据不仅包括上述几种数据,还可能包括其它维度的数据,在进行企业视图进行布局时,可以基于这几种关键词优先展示包含这几种关键词的维度的数据。
本发明的一可选的实施例中,上述步骤123可以包括:
基于亲和图算法,对所述多个维度的企业数据信息进行分类整理,得到多个类别的数据。
具体实现时,将上述关联关系的关联度大于一预设值的企业数据信息,按照其相近性进行归纳整理,比如,将上述关键词,通过A型图进行汇总,并按照其相互亲和性归纳整理这些资料,从而得到多个类别的数据,比如,企业的客户实力、客户关系、信用情况、发展潜力、经济活动、服务等类别。
本发明的一可选的实施例中,步骤13可以包括:
步骤131,对每一类别的数据添加内部数据标签、业务特征标签、外部来源数据标签、事实标签、模型标签、预测标签中的至少一种。
该实施例中,具体实现时,比如,对于客户实力可以添加客户资产、从业人员、行业资质、服务对象、业务规模、资质信息、中标业绩、专项登记信息等标签,这里的标签可以是该客户实力的内部标签。当然,也有一些标签为该类别的外部来源数据标签等。
本发明的一可选的实施例中,企业视图的构建方法,还可以包括:
步骤132,根据所述每一类别的数据的标签,对所述多个维度的企业数据信息进行信息查询、个性化需求洞察以及风险用户评级的分析。
本发明的一可选的实施例中,步骤14可以包括:
根据所述标签,按照预设图例的布局方式,生成企业视图。
如图2所示,所述图例的布局方式可以包括:企业名称,与企业名称关联的多个类别的数据,每个类别的数据用多个标签进行标识。
当然,图2仅为举例说明,并不限于上述企业视图的图例的布局方式。
获取与企业关联的多个维度的企业数据信息为企业的全量数据;结合对企业特征的识别、分析,基于对全量信息的分析,构建标签体系实现了企业立体画像。
基于此标签体系,结合企业的业务特征及外部数据进行企业信息查询、客户定制化需求洞察、风险用户评级等关键业务分析。
设计数据总量庞大、类型繁多,该方法研究建筑业企业多层次多维属性之间的复杂关联交互行为,数据采集不仅仅是获取企业的基本信息,还需通过多渠道的数据接入,使用数据的异构抽取采集获取企业画像所需要的典型特征数据。
获取建筑业企业信息时应采用全量采集而不是抽样数据采集,通过动态采集不断更新数据实现随需而变的信息查询,动态获取的数据需满足可用性、可靠性、鲁棒性及容错性等多方面因素。
结合不同类型企业不同的特征通过定性分析挖掘企业用户的需求变化规律,结合定量分析对企业用户各项指标、特性、相互关系进行比较分析,基于ETL对数据进行清洗、去重、降噪操作,通过分析企业数据特征结合具体业务场景为处理后的数据信息划分类型。
基于亲和图特性根据实际情况将多种类型的数据分层分类归纳整理,清晰数据结构、减少重复开发,通过数据分层实现数据出口统一。
将采集到的企业数据赋予体系化标签能力,得到企业画像所需的典型特征数据包括基本信息数据、公共信息数据、经济信息数据、企业管理数据,这些标签分为内部数据标签、业务特征标签、外部来源数据标签,实现三维一体的标签管理体系。
通过张量融合基于亲和图特性形成企业画像框架,按照一定的规则确定企业画像优先级,构建大数据技术下基于亲和图特征实现的平台服务主体的企业画像。
结合图例对本方法做出具体阐述。在实际应用中构建的建筑企业画像通过分析个体企业用户的特性、类型、与其他企业的关联关系等信息,通过各种渠道采集企业数据,基于ETL对这些数据进行处理并分析其特征后划分类型,并定义需要的标签,如企业基本信息(名称、信用代码、注册地、经济类型、经营范围等信息)、税务信息、财务信息、建设项目信息、经营状况信息、企业资质信息、行政许可信息等标签,这些标签包括事实标签、模型标签和预测标签,通过张量融合形成六大标签体系构成企业画像视图。
具体张量融合时,可以将相关数据信息,通过向量和余向量通过张量积组合成张量,即
Figure BDA0002731305170000081
V表示矢量空间,V*是对应的对偶空间,m是V*的个数,n是V的个数。也就是说,将上述各个类别的数据在形成企业视图时,可以利用该张量融合的方式实现。
本发明的上述实施例,通过企业内部自身数据、业务数据及外部来源数据多维数据集成,分析不同企业画像群体的分布特征,建立完善的企业信息打破建筑业企业数据孤岛,改善建筑业企业信息获取困难,信息不完善问题。通过该方法改变原有的纯粹依赖人工查询、收集、分析数据、效率低、覆盖率低的方式,帮助用户快速识别价值客户、发现潜在商机、评估营销风险,全方位的了解企业信息。方便为社会各监管部门、企业、个体等人群提供多维度、全面的信息支撑。
如图3所示,本发明的实施例还提供一种企业视图的构建系统30,包括:
获取模块31,用于获取与企业关联的多个维度的企业数据信息;
处理模块32,用于对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据;对每一类别的数据添加至少一个标签,所述至少一个标签共同标识一个类别的数据;根据所述标签,生成企业视图。
可选的,获取与企业关联的多个维度的企业数据信息,包括:
获取与企业关联的企业基本信息数据、公共信息数据、经济信息数据、企业管理数据中的至少一项,所述企业基本信息数据、公共信息数据、经济信息数据、企业管理数据为异构数据。
可选的,所述企业数据信息包括:建筑企业的建筑勘测信息、设计信息、施工信息、装修信息、维护与管理信息中的至少一项。
可选的,对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据,包括:
获取多个维度的企业数据信息进行格式转换处理,得到统一结构的数据;
对所述数据进行分析,确定所述多个维度的企业数据信息之间的关联关系;
根据所述关联关系,对所述多个维度的企业数据信息进行分类整理,得到多个类别的数据。
可选的,对所述数据进行分析,确定所述多个维度的企业数据信息之间的关联关系,包括:
对所述数据的描述语料进行分析,得到多个关键词;
根据所述关键词的频度,确定多个维度的企业数据信息之间的关联关系。
可选的,对每一类别的数据添加至少一个标签,包括:
对每一类别的数据添加内部数据标签、业务特征标签、外部来源数据标签、事实标签、模型标签、预测标签中的至少一种。
可选的,处理模块还用于根据所述每一类别的数据的标签,对所述多个维度的企业数据信息进行信息查询、个性化需求洞察以及风险用户评级的分析。
可选的,根据所述标签,生成企业视图,包括:根据所述标签,按照预设图例的布局方式,生成企业视图。
可选的,所述图例的布局方式包括:企业名称,与企业名称关联的多个类别的数据,每个类别的数据用多个标签进行标识。
需要说明的是,上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
本发明的实施例还提供一种计算机可读存储介质,包括指令,当所述指令在计算机运行时,使得计算机执行如上所述的方法。上述方法实施例中的所有实现方式均适用于该实施例中,也能达到相同的技术效果。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种企业视图的构建方法,其特征在于,包括:
获取与企业关联的多个维度的企业数据信息;
对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据;
对每一类别的数据添加至少一个标签,所述至少一个标签共同标识一个类别的数据;
根据所述标签,生成企业视图;
其中,对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据,包括:
获取多个维度的企业数据信息进行格式转换处理,得到统一结构的数据;
对所述数据进行分析,确定所述多个维度的企业数据信息之间的关联关系;
根据所述关联关系,对所述多个维度的企业数据信息进行分类整理,得到多个类别的数据;
其中,对所述数据进行分析,确定所述多个维度的企业数据信息之间的关联关系,包括:
对所述数据的描述语料进行分析,得到多个关键词;
根据所述关键词的频度,确定多个维度的企业数据信息之间的关联关系;
其中,根据所述关联关系,对所述多个维度的企业数据信息进行分类整理,得到多个类别的数据,包括:
基于亲和图算法,对所述多个维度的企业数据信息进行分类整理,得到多个类别的数据;具体的,将上述关联关系的关联度大于一预设值的企业数据信息,按照其相近性进行归纳整理,得到多个类别的数据。
2.根据权利要求1所述的企业视图的构建方法,其特征在于,获取与企业关联的多个维度的企业数据信息,包括:
获取与企业关联的企业基本信息数据、公共信息数据、经济信息数据、企业管理数据中的至少一项,所述企业基本信息数据、公共信息数据、经济信息数据、企业管理数据为异构数据。
3.根据权利要求1所述的企业视图的构建方法,其特征在于,所述企业数据信息包括:
建筑企业的建筑勘测信息、设计信息、施工信息、装修信息、维护与管理信息中的至少一项。
4.根据权利要求1所述的企业视图的构建方法,其特征在于,对每一类别的数据添加至少一个标签,包括:
对每一类别的数据添加内部数据标签、业务特征标签、外部来源数据标签、事实标签、模型标签、预测标签中的至少一种。
5.根据权利要求1所述的企业视图的构建方法,其特征在于,还包括:
根据所述每一类别的数据的标签,对所述多个维度的企业数据信息进行信息查询、个性化需求洞察以及风险用户评级的分析。
6.根据权利要求1所述的企业视图的构建方法,其特征在于,根据所述标签,生成企业视图,包括:
根据所述标签,按照预设图例的布局方式,生成企业视图。
7.根据权利要求6所述的企业视图的构建方法,其特征在于,所述图例的布局方式包括:企业名称,与企业名称关联的多个类别的数据,每个类别的数据用多个标签进行标识。
8.一种企业视图的构建系统,其特征在于,包括:
获取模块,用于获取与企业关联的多个维度的企业数据信息;
处理模块,用于对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据;对每一类别的数据添加至少一个标签,所述至少一个标签共同标识一个类别的数据;根据所述标签,生成企业视图;
其中,对所述多个维度的企业数据信息,采用亲和图算法进行处理,得到多个类别的数据,包括:
获取多个维度的企业数据信息进行格式转换处理,得到统一结构的数据;
对所述数据进行分析,确定所述多个维度的企业数据信息之间的关联关系;
根据所述关联关系,对所述多个维度的企业数据信息进行分类整理,得到多个类别的数据;
其中,对所述数据进行分析,确定所述多个维度的企业数据信息之间的关联关系,包括:
对所述数据的描述语料进行分析,得到多个关键词;
根据所述关键词的频度,确定多个维度的企业数据信息之间的关联关系;
其中,根据所述关联关系,对所述多个维度的企业数据信息进行分类整理,得到多个类别的数据,包括:
基于亲和图算法,对所述多个维度的企业数据信息进行分类整理,得到多个类别的数据;具体的,将上述关联关系的关联度大于一预设值的企业数据信息,按照其相近性进行归纳整理,得到多个类别的数据。
CN202011118882.3A 2020-10-19 2020-10-19 一种企业视图的构建方法及系统 Active CN112287016B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011118882.3A CN112287016B (zh) 2020-10-19 2020-10-19 一种企业视图的构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011118882.3A CN112287016B (zh) 2020-10-19 2020-10-19 一种企业视图的构建方法及系统

Publications (2)

Publication Number Publication Date
CN112287016A CN112287016A (zh) 2021-01-29
CN112287016B true CN112287016B (zh) 2022-03-11

Family

ID=74497539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011118882.3A Active CN112287016B (zh) 2020-10-19 2020-10-19 一种企业视图的构建方法及系统

Country Status (1)

Country Link
CN (1) CN112287016B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934712A (zh) * 2017-03-16 2017-07-07 深圳微众税银信息服务有限公司 一种企业画像数据处理方法及系统
CN107527151A (zh) * 2017-08-31 2017-12-29 郑州云海信息技术有限公司 一种构建企业画像的方法及系统
CN108509569A (zh) * 2018-03-26 2018-09-07 河北省科学院应用数学研究所 企业画像的生成方法、装置、电子设备以及存储介质
CN108805383A (zh) * 2018-03-20 2018-11-13 东华大学 一种基于服装洗护大数据的用户画像平台及应用
CN109658478A (zh) * 2017-10-10 2019-04-19 爱信诺征信有限公司 一种提供企业画像的方法及系统
CN111027854A (zh) * 2019-12-10 2020-04-17 重庆撼地大数据有限公司 一种基于企业大数据的综合画像指数生成方法及相关设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080201643A1 (en) * 2007-02-01 2008-08-21 7 Billion People, Inc. System for creating customized web content based on user behavioral portraits
CN107464037A (zh) * 2017-07-05 2017-12-12 九次方大数据信息集团有限公司 基于多指标维度模型的企业画像方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934712A (zh) * 2017-03-16 2017-07-07 深圳微众税银信息服务有限公司 一种企业画像数据处理方法及系统
CN107527151A (zh) * 2017-08-31 2017-12-29 郑州云海信息技术有限公司 一种构建企业画像的方法及系统
CN109658478A (zh) * 2017-10-10 2019-04-19 爱信诺征信有限公司 一种提供企业画像的方法及系统
CN108805383A (zh) * 2018-03-20 2018-11-13 东华大学 一种基于服装洗护大数据的用户画像平台及应用
CN108509569A (zh) * 2018-03-26 2018-09-07 河北省科学院应用数学研究所 企业画像的生成方法、装置、电子设备以及存储介质
CN111027854A (zh) * 2019-12-10 2020-04-17 重庆撼地大数据有限公司 一种基于企业大数据的综合画像指数生成方法及相关设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于大数据平台的企业画像研究综述;田娟等;《计算机科学》;20181130;全文 *

Also Published As

Publication number Publication date
CN112287016A (zh) 2021-01-29

Similar Documents

Publication Publication Date Title
AU2017255561B2 (en) Learning from historical logs and recommending database operations on a data-asset in an ETL tool
CN112182246B (zh) 通过大数据分析建立企业画像的方法、系统、介质及应用
CN103605651A (zh) 一种基于olap多维分析的数据处理展现方法
EP2396720A1 (en) Creation of a data store
Sharma et al. Data mining techniques: A tool for knowledge management system in agriculture
CN116384889A (zh) 基于自然语言处理技术的情报大数据智能分析方法
CN116089495A (zh) 一种基于大数据的自助分析平台
Qatawneh The influence of data mining on accounting information system performance: a mediating role of information technology infrastructure
Fraihat et al. Business Intelligence Framework Design and Implementation: A Real-estate Market Case Study
Abd Al-Rahman et al. Design and implementation of the web (extract, transform, load) process in data warehouse application
CN112287016B (zh) 一种企业视图的构建方法及系统
CN116028467A (zh) 智能服务大数据建模方法、系统、存储介质及计算机设备
CN112506930B (zh) 一种基于机器学习技术的数据洞察系统
Skyrius et al. Business intelligence technologies
CN113886465A (zh) 一种用于汽车物流的大数据分析平台
Chen et al. Pattern filtering and classification for market basket analysis with profit‐based measures
CN112632405B (zh) 一种推荐方法、装置、设备及存储介质
Molnár Proposal for Application of Data Science Methods in E-Government: A Case-Study About the Application of Available Techniques for Performance Measurement with the Help of Data Science
Dongsheng et al. Design and implementation of university educational decision support system on the students satisfaction survey
AU2021103329A4 (en) The investigation technique of object using machine learning and system.
Ayyavaraiah Data Mining For Business Intelligence
Renganathan Business Intelligence: An overview
TW202133003A (zh) 智慧分析系統之應用方法
US20150379534A1 (en) Contact Engagement Analysis for Target Group Definition
Muntjir Novice Evaluation and Comparative Survey on Database Management System, Data Warehousing and Data Mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant