CN112286921A - 一种基于多源异构数据的动态企业画像生成方法 - Google Patents

一种基于多源异构数据的动态企业画像生成方法 Download PDF

Info

Publication number
CN112286921A
CN112286921A CN202011175316.6A CN202011175316A CN112286921A CN 112286921 A CN112286921 A CN 112286921A CN 202011175316 A CN202011175316 A CN 202011175316A CN 112286921 A CN112286921 A CN 112286921A
Authority
CN
China
Prior art keywords
enterprise
feature
data
characteristic
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011175316.6A
Other languages
English (en)
Inventor
黄梦醒
林嘉锋
冯文龙
冯思玲
张雨
吴迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan University
Original Assignee
Hainan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan University filed Critical Hainan University
Priority to CN202011175316.6A priority Critical patent/CN112286921A/zh
Publication of CN112286921A publication Critical patent/CN112286921A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/244Grouping and aggregation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于多源异构数据的动态企业画像生成方法,包括下列步骤:S1、采集目标企业的信息数据,并对所述企业信息数据进行预处理;S2、构建企业画像模型,所述企业画像模型由企业基本属性、企业经营范围、企业主要产品、企业内外关联、企业行业评价五个维度特征组成,从预处理后的企业信息数据中提取特征项,并填充至对应的维度特征,实现企业信息向量化,标签化;S3、若目标企业的信息数据出现变动,根据变动的企业信息数据,形成新的特征项,并将维度特征中的旧的特征项进行替换更新,形成新的企业画像。

Description

一种基于多源异构数据的动态企业画像生成方法
技术领域
本发明涉及数据分析技术领域,尤其涉及一种基于多源异构数据的动态企业画像生成方法。
背景技术
目前现有的企业画像生成方法为:先获取与企业画像在互联网的相关的数据,并对数据进行清洗,分析不同企业的特征数据,对企业进行标签提取,构建企业画像。主要存在三个方面的问题,首先是数据源较为单一,源数据或为简单的网络信息,或为企业报表,数据量无法充分支撑企业画像的丰富度;其次是企业画像描述较为简单,忽略其他方面的信息,没有从多个维度进行企业画像的构建;以及传统的企业画像构建没有考虑到后续标签信息更新的问题,无法实现动态的企业画像。
发明内容
本发明的目的在于提供一种基于多源异构数据的动态企业画像生成方法,以解决上述背景技术中提出的问题。
本发明是通过以下技术方案实现的:一种基于多源异构数据的动态企业画像生成方法,包括下列步骤:
S1、采集目标企业的信息数据,并对所述企业信息数据进行预处理;
S2、构建企业画像模型,所述企业画像模型由企业基本属性、企业经营范围、企业主要产品、企业内外关联、企业行业评价五个维度特征组成,从预处理后的企业信息数据中提取特征项,并填充至对应的维度特征,实现企业信息向量化,标签化;
S3、若目标企业的信息数据出现变动,根据变动的企业信息数据,形成新的特征项,并将维度特征中的旧的特征项进行替换更新,形成新的企业画像。
优选的,通过数据库导出、网络爬虫选取、人工输入的方式对目标企业的信息数据进行采集。
优选的,所述目标企业的信息数据采集通道包括政府信息数据库、企业数据库、网络信息数据库中的一种或多种。
优选的,所述预处理方式包括:对目标企业的信息数据进行数据清洗、数据聚合、数据删减;
将数据删减后的所述信息数据从文本数据转换为结构化数据,并消除结构化数据中存在的数据缺失、数据重复以及同名异义问题。
优选的,提取特征项的方式包括:
对于企业基本属性特征、企业主要产品特征、企业行业评价特征,提取目标企业的信息数据中的关键词作为特征项;
对于企业经营范围特征、企业关联分析特征,提取目标企业的信息数据中的关键词作为特征项,同时采用TF-IDF以及LDA特征分析的权重计算法对特征项的权重进行计算,其特征项以及特征项的权重被填充至企业经营范围特征、企业关联分析特征中;
所述企业基本属性的特征项包括企业名称、成立日期、注册资本、法定代表人和企业地址;
所述企业经营范围的特征项包括企业经营方向、企业经营相关度;
所述企业主要产品的特征项包括企业主营产品的名称;
所述企业关联分析的特征项包括企业股权占比、企业股权类型、企业参股控股对象;
所述企业行业评价的特征项包括企业获得的荣誉。
优选的,若目标企业的信息数据出现变动,根据变动的企业信息数据,提取关键词,形成新的特征项,将新的特征项与原维度特征中的特征项进行对比;
若新的特征项的类别属于企业基本属性特征、企业主要产品特征、企业行业评价特征之一,并且新的特征项在企业基本属性特征、企业主要产品特征、企业行业评价特征之一中存在,则企业基本属性特征、企业主要产品特征、企业行业评价特征中的特征项保持不变;
若新的特征项在企业基本属性特征、企业主要产品特征、企业行业评价特征之一中不存在,则将新的特征项填充至相应的纬度特征中。
优选的,若新的特征项类别属于企业经营范围特征,企业关联分析特征之一,并且新的特征项在企业经营范围特征,企业关联分析特征之一中存在,计算新的特征项的权重值,并对旧的特征项的权重值进行替换更新;
并且新的特征项在企业经营范围特征,企业关联分析特征之一中不存在,计算新的特征项的权重值,并将计算后的权重值以及新的特征项对应的权重值填充至对应的纬度特征中。
优选的,通过下式计算新的特征项的权重值:
w'=e-λ(t′-t)*w(t)+Δni
其中,w'为新的权重值,t′新的特征项的采集时间,t为旧的特征项的采集时间,λ为时间衰减因子,Δni为新的特征项对应的权重,w(t)为t时刻旧的特征项的权重。
与现有技术相比,本发明达到的有益效果如下:
本发明提供的一种基于多源异构数据的动态企业画像生成方法,通过采集权威机构数据源为基础,融合多源异构数据,分别从企业基本属性、企业经营范围、企业主要产品、企业关联分析,企业行业评价五个方面,利用自然语言处理实现特征分析和标签提取。同时在目标企业的信息数据出现变动时,根据变动的企业信息数据,形成新的特征项,将新的特征项与原维度特征中的特征项进行对比,实现对标签信息的动态更新,最终实现企业画像的动态构建。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的优选实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种基于多源异构数据的动态企业画像生成方法的流程图。
具体实施方式
为了更好理解本发明技术内容,下面提供具体实施例,并结合附图对本发明做进一步的说明。
参见图1,一种基于多源异构数据的动态企业画像生成方法,以全国企业信用信息公示系统、国家中小企业发展基金旗下官方备案企业征信机构、相关合作单位提供数据、企业官网、天眼查、企查查等数据源为基础,融合多源异构数据,分别从企业基本属性、企业经营范围、企业主要产品、企业关联分析,企业行业评价五个方面,利用自然语言处理实现特征分析和标签提取,同时,引入时间衰减因子,实现对标签信息的动态更新,以此来构建基于多源异构数据的动态企业画像。具体实施步骤如下:
S1、采集目标企业的信息数据,并对所述企业信息数据进行预处理;
企业信息数据的采集通道包括全国企业信用信息公示系统数据库、国家中小企业发展基金旗下官方备案企业征信机构数据库、相关合作单位数据库、企业官网数据库、天眼查数据库、企查查数据库中的一种或多种,其采集方式包括数据库导出、爬虫爬取、人工采集输入;
所述目标企业的信息数据按分类分别为企业基本属性数据、企业经营范围数据、企业主要产品数据、企业内外关联数据,企业行业评价数据。
其中,企业基本属性数据包括企业名称、成立日期、注册资本、法定代表人、企业地址;企业经营范围数据是企业生产和经营的商品类别、品种及服务项目,反映企业业务活动的内容和生产经营方向;企业主要产品数据是本企业主要生产的产品,也包括市面上销售的企业代表产品,是对企业生产的进一步具体的描述;企业内外关联数据包括企业持股控股公司,企业被持股控股公司;企业行业评价数据包括企业所获得的相关奖项。具体信息如表1所示:
表1
Figure BDA0002748547250000051
Figure BDA0002748547250000061
对所采集的企业信息数据进行预处理方式的包括:对目标企业的信息数据进行数据清洗、数据聚合、数据删减;
将数据删减后的所述信息数据从文本数据转换为结构化数据,在将信息数据从文本数据转换为结构化数据时,需要对文本中的命名实体进行识别。命名实体主要包括名字实体(公司名、人名、地名)、时间表达式(日期、时间)和数字表达式(货币值、百分数等)。其中,针对公司名、人名和地名的识别,通过基于规则的方法、基于统计的机器学习方法以及基于深度学习的方法,以及调用国内开源的中文语言处理工具NLPIR实现命名实体识别,从文本中进行信息抽取;
结构化数据中存在有数据缺失、数据重复以及同名异义的问题。对于数据缺失问题可通过搜索引擎或暂时置空后续补充等途径对该信息进行补充或完善;对于数据重复问题,则需删除冗余信息,保证数据的唯一性,余下的信息相互补充;对于同名异义问题,需要通过消歧来解决,消歧采用的方法有基于聚类的消歧和基于实体链接的消歧。同时针对原始数据中不同来源的信息采用的元数据标准不同的问题,对企业信息进行了统一的描述,并且进行数据集成,将多个数据源中的数据整合进行统一存储,通过上述方式消除结构化数据中存在的数据缺失、数据重复以及同名异义问题。
S2、构建企业画像模型,所述企业画像模型由企业基本属性、企业经营范围、企业主要产品、企业内外关联、企业行业评价五个维度特征组成,从预处理后的企业信息数据中提取特征项,并填充至对应的维度特征;
在本实施方式中,企业画像是一个多维度、多层次的用户模型,根据目标企业的信息数据的类型,定义了一个向量空间作为企业画像,组成企业画像的维度特征包括企业基本属性、企业经营范围、企业主要产品、企业关联分析、企业行业评价,具体模型结构如下:
Enterprise=<BaseInfo,BusiScope,MainProduct,Relation,Comments>
其中,BaseInfo代表企业基本属性,BusiScope表示企业经营范围,MainProduct代表企业主要产品,Relation代表企业关联分析,Comments代表企业行业评价,该五元组特征标签共同构成企业画像。
从预处理后的企业信息数据中提取特征项,并填充至对应的维度特征,可获得如下结果:
BaseInfo=<Name,EstabliDate,RegistCapital,LegalRepre,OrgaAddr>,分别表示企业名称、成立日期、注册资本、法定代表人和企业地址,企业基本属性特征对企业进行最基本的了解和刻画,该项特征较为明确且相对规范,基础信息表示精炼,可以直接采用数据库中的信息作为特征项;
BusiScope={(Top1,t1),(Top2,t2),(Top3,t3),…,(Topn,tn)}其中,Topn表示企业的第n个经营方向,tn表示企业对第n个方向的经营相关度,tn越大,表示企业对应的经营相关度越高,企业经营范围特征则使用关键词作为经营范围的主要表征,所提取的关键词是对企业经营方向的高度凝练和概括。
其提取关键词的过程包括:使用TF-IDF对企业信息库中针对经营范围介绍的文本进行文档的预处理,以获得更合理的更能代表描述文档特点的向量,转化成文档向量后,依据权值大小进行关键字提取。
除此之外,针对企业经营关键字进行主题分析,采用的方法主要有LDA文档主题生成模型,对企业经营范围特征进行分析。
MainProduct=<p1,p2,p3,…,pn>,其中p代表目标公司主要代表产品,企业主要产品特征直接采用企业主营产品,以及市面上该企业主要销售商品的名称作为特征项,一定程度增强公众对于企业产品线的认识。
Relation=<type,object,percent>其中,type为企业参股控股或者被参股控股类型,object为企业参股控股或被参股控股对象,percent为股权占比,企业关联分析特征,采用企业信息库中的数据,根据该企业参股控股或被参股控股的类型,依据股权穿透的计算方式,逐一遍历计算该企业与相关企业的股权关联。该维度特征使用相关公司名称作为特征项,股权占比作为权重,直观反映该企业的内外关联。
Comments=<c1,c2,c3,…,cn>,其中c表示企业所获得的相关荣誉奖项,企业行业评价特征直接采用该企业所获得的荣誉奖项作为特征项,同时也作为优秀企业对外的展示。
另外需要说明的是,在以上的五个维度特征中,企业基本属性特征、企业主要产品特征、企业行业评价特征中的特征项不具备权重因子;
而企业经营范围特征,企业关联分析特征中的特征项具备权重因子,需要基于TF-IDF以及LDA特征分析的权重来实现特征项的权重计算。
S3、企业的信息不是一成不变的,可能会发生新增或变动,所以需要对企业画像进行动态更新,若目标企业的信息数据出现变动,根据变动的企业信息数据,用支持向量机SVM和词特征相结合的方法进行新词识别和提取,形成新的特征项;
若新的特征项的类别属于企业基本属性特征、企业主要产品特征、企业行业评价特征之一,并且新的特征项在企业基本属性特征、企业主要产品特征、企业行业评价特征之一中存在,则企业基本属性特征、企业主要产品特征、企业行业评价特征中的特征项保持不变;
若新的特征项在企业基本属性特征、企业主要产品特征、企业行业评价特征之一中不存在,则将新的特征项填充至相应的纬度特征中。
若新的特征项类别属于企业经营范围特征,企业关联分析特征之一,并且新的特征项在企业经营范围特征,企业关联分析特征之一中存在,通过下式计算新的特征项的权重值:
w'=e-λ(t′-t)(w(t)+Δni
其中,w'为新的权重值,t′新的特征项的采集时间,t为旧的特征项的采集时间,λ为时间衰减因子,表示旧权重的衰减速度,λ越大,随时间衰减的越快。公司信息的变更相对较为慎重,且更新频率较为不频繁,在本实施方式中,λ取值为0.015至0.02区间时,能够为构建企业画像以及提高模型结果提供很大的帮助,Δni为新的特征项的权重,w(t)为t时刻旧的特征项的权重;
并对旧的特征项的权重值进行替换更新;
若新的特征项在企业经营范围特征,企业关联分析特征之一中不存在,计算新的特征项的权重值,并将计算后的权重值以及新的特征项对应的权重值填充至对应的纬度特征中。
对比新的特征项与旧的特征项的权重值,选取权重值大的特征项加入其对应的维度特征,形成新的企业画像。
对于所形成的企业画像,依据预设的纬度特征权重值,以图文的形式对企业画像进行展示,方便用户对企业的了解。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同更新、改进等,均应包含在本发明保护的范围之内。

Claims (8)

1.一种基于多源异构数据的动态企业画像生成方法,其特征在于,包括下列步骤:
S1、采集目标企业的信息数据,并对所述企业信息数据进行预处理;
S2、构建企业画像模型,所述企业画像模型由企业基本属性、企业经营范围、企业主要产品、企业内外关联、企业行业评价五个维度特征组成,从预处理后的企业信息数据中提取特征项,并填充至对应的维度特征,实现企业信息向量化,标签化;
S3、若目标企业的信息数据出现变动,根据变动的企业信息数据,形成新的特征项,并将维度特征中的旧的特征项进行替换更新,形成新的企业画像。
2.根据权利要求1所述的一种基于多源异构数据的动态企业画像生成方法,其特征在于,通过数据库导出、网络爬虫选取、人工输入的方式对目标企业的信息数据进行采集。
3.根据权利要求2所述的一种基于多源异构数据的动态企业画像生成方法,其特征在于,所述目标企业的信息数据采集通道包括政府信息数据库、企业数据库、网络信息数据库中的一种或多种。
4.根据权利要求3所述的一种基于多源异构数据的动态企业画像生成方法,其特征在于,所述预处理方式包括:对目标企业的信息数据进行数据清洗、数据聚合、数据删减;
将数据删减后的所述信息数据从文本数据转换为结构化数据,并消除结构化数据中存在的数据缺失、数据重复以及同名异义问题。
5.根据权利要求4所述的一种基于多源异构数据的动态企业画像生成方法,其特征在于,提取特征项的方式包括:
对于企业基本属性特征、企业主要产品特征、企业行业评价特征,提取目标企业的信息数据中的关键词作为特征项;
对于企业经营范围特征、企业关联分析特征,提取目标企业的信息数据中的关键词作为特征项,同时采用TF-IDF以及LDA特征分析的权重计算法对特征项的权重进行计算,其特征项以及特征项的权重被填充至企业经营范围特征、企业关联分析特征中;
所述企业基本属性的特征项包括企业名称、成立日期、注册资本、法定代表人和企业地址;
所述企业经营范围的特征项包括企业经营方向、企业经营相关度;
所述企业主要产品的特征项包括企业主营产品的名称;
所述企业关联分析的特征项包括企业股权占比、企业股权类型、企业参股控股对象;
所述企业行业评价的特征项包括企业获得的荣誉。
6.根据权利要求5所述的一种基于多源异构数据的动态企业画像生成方法,其特征在于,若目标企业的信息数据出现变动,根据变动的企业信息数据,提取关键词,形成新的特征项,将新的特征项与原维度特征中的特征项进行对比;
若新的特征项的类别属于企业基本属性特征、企业主要产品特征、企业行业评价特征之一,并且新的特征项在企业基本属性特征、企业主要产品特征、企业行业评价特征之一中存在,则企业基本属性特征、企业主要产品特征、企业行业评价特征中的特征项保持不变;
若新的特征项在企业基本属性特征、企业主要产品特征、企业行业评价特征之一中不存在,则将新的特征项填充至相应的纬度特征中。
7.根据权利要求6所述的一种基于多源异构数据的动态企业画像生成方法,其特征在于,若新的特征项类别属于企业经营范围特征,企业关联分析特征之一,并且新的特征项在企业经营范围特征,企业关联分析特征之一中存在,计算新的特征项的权重值,并对旧的特征项的权重值进行替换更新;
并且新的特征项在企业经营范围特征,企业关联分析特征之一中不存在,计算新的特征项的权重值,并将计算后的权重值以及新的特征项对应的权重值填充至对应的纬度特征中。
8.根据权利要求7所述的一种基于多源异构数据的动态企业画像生成方法,其特征在于,通过下式计算新的特征项的权重值:
w'=e-λ(t′-t)*w(t)+Δni
其中,w'为新的权重值,t′新的特征项的采集时间,t为旧的特征项的采集时间,λ为时间衰减因子,Δni为新的特征项对应的权重,w(t)为t时刻旧的特征项的权重。
CN202011175316.6A 2020-10-29 2020-10-29 一种基于多源异构数据的动态企业画像生成方法 Pending CN112286921A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011175316.6A CN112286921A (zh) 2020-10-29 2020-10-29 一种基于多源异构数据的动态企业画像生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011175316.6A CN112286921A (zh) 2020-10-29 2020-10-29 一种基于多源异构数据的动态企业画像生成方法

Publications (1)

Publication Number Publication Date
CN112286921A true CN112286921A (zh) 2021-01-29

Family

ID=74373732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011175316.6A Pending CN112286921A (zh) 2020-10-29 2020-10-29 一种基于多源异构数据的动态企业画像生成方法

Country Status (1)

Country Link
CN (1) CN112286921A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377742A (zh) * 2021-06-02 2021-09-10 浪潮软件股份有限公司 一种基于法人综合数据资源库的企业空间数据应用方法
CN113516454A (zh) * 2021-08-02 2021-10-19 广东富状元科技有限公司 一种基于云计算平台的企业信息管理系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107464037A (zh) * 2017-07-05 2017-12-12 九次方大数据信息集团有限公司 基于多指标维度模型的企业画像方法及系统
CN107527151A (zh) * 2017-08-31 2017-12-29 郑州云海信息技术有限公司 一种构建企业画像的方法及系统
CN107730269A (zh) * 2017-07-21 2018-02-23 南通大学 一种基于行为分析的用电客户画像方法
CN109658478A (zh) * 2017-10-10 2019-04-19 爱信诺征信有限公司 一种提供企业画像的方法及系统
CN110705855A (zh) * 2019-09-23 2020-01-17 清华苏州环境创新研究院 一种企业环境画像评价方法及系统
CN110990474A (zh) * 2019-11-28 2020-04-10 泰华智慧产业集团股份有限公司 一种区域性产业画像分析的方法及装置
CN111768828A (zh) * 2020-09-03 2020-10-13 成都索贝数码科技股份有限公司 基于院内外数据的患者体征画像构建系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107464037A (zh) * 2017-07-05 2017-12-12 九次方大数据信息集团有限公司 基于多指标维度模型的企业画像方法及系统
CN107730269A (zh) * 2017-07-21 2018-02-23 南通大学 一种基于行为分析的用电客户画像方法
CN107527151A (zh) * 2017-08-31 2017-12-29 郑州云海信息技术有限公司 一种构建企业画像的方法及系统
CN109658478A (zh) * 2017-10-10 2019-04-19 爱信诺征信有限公司 一种提供企业画像的方法及系统
CN110705855A (zh) * 2019-09-23 2020-01-17 清华苏州环境创新研究院 一种企业环境画像评价方法及系统
CN110990474A (zh) * 2019-11-28 2020-04-10 泰华智慧产业集团股份有限公司 一种区域性产业画像分析的方法及装置
CN111768828A (zh) * 2020-09-03 2020-10-13 成都索贝数码科技股份有限公司 基于院内外数据的患者体征画像构建系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377742A (zh) * 2021-06-02 2021-09-10 浪潮软件股份有限公司 一种基于法人综合数据资源库的企业空间数据应用方法
CN113516454A (zh) * 2021-08-02 2021-10-19 广东富状元科技有限公司 一种基于云计算平台的企业信息管理系统及方法

Similar Documents

Publication Publication Date Title
CN111428053B (zh) 一种面向税务领域知识图谱的构建方法
CN106649272B (zh) 一种基于混合模型的命名实体识别方法
CN110489560A (zh) 基于知识图谱技术的小微企业画像生成方法及装置
Hoch et al. Geolinguistics: The incorporation of geographic information systems and science
CN109522562B (zh) 一种基于文本图像融合识别的网页知识抽取方法
CN112131872A (zh) 一种文献作者重名消歧方法和构建系统
CN111709235A (zh) 一种基于自然语言处理的文本数据统计分析系统及方法
CN111967761A (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
CN112364172A (zh) 一种政务公文领域知识图谱构建方法
CN111241410B (zh) 一种行业新闻推荐方法及终端
CN112286921A (zh) 一种基于多源异构数据的动态企业画像生成方法
CN104050243A (zh) 一种将搜索与社交相结合的网络搜索方法及其系统
CN110929134A (zh) 投融资数据管理方法、装置、计算机设备及存储介质
CN114896423A (zh) 一种企业基本信息知识图谱的构建方法及系统
CN112989811B (zh) 一种基于BiLSTM-CRF的历史典籍阅读辅助系统及其控制方法
CN115203337A (zh) 一种数据库元数据关系知识图谱生成方法
CN114077705A (zh) 一种对社交平台上的媒体账号进行画像的方法和系统
CN102460440B (zh) 搜索方法和设备
Wormell Critical aspects of the Danish welfare state—as revealed by issue tracking
Gong et al. The construction of knowledge graph for personalized online teaching
Chen et al. Research on Data Analysis and Visualization of Recruitment Positions Based on Text Mining
Khekare et al. Design of Automatic Key Finder for Search Engine Optimization in Internet of Everything
CN103049442A (zh) 手机网络检索用语简称-全称转换识别方法及装置
CN109446424B (zh) 一种无效地址网页过滤方法及系统
CN107528763A (zh) 一种基于Spark与YARN的邮件内容分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination