CN115795052A - 一种产业链地图构建方法、装置及电子设备 - Google Patents

一种产业链地图构建方法、装置及电子设备 Download PDF

Info

Publication number
CN115795052A
CN115795052A CN202211572681.XA CN202211572681A CN115795052A CN 115795052 A CN115795052 A CN 115795052A CN 202211572681 A CN202211572681 A CN 202211572681A CN 115795052 A CN115795052 A CN 115795052A
Authority
CN
China
Prior art keywords
enterprise
industry
data
target
enterprises
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211572681.XA
Other languages
English (en)
Inventor
王柏村
朱凯凌
谢海波
杨华勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202211572681.XA priority Critical patent/CN115795052A/zh
Publication of CN115795052A publication Critical patent/CN115795052A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明涉及一种产业链地图构建方法、装置及电子设备,包括:获取目标行业的产业链上不同节点的节点数据;对每一类型的企业的第一原始企业数据进行预处理,获取与每一类型的企业对应的目标结构化企业数据;根据目标结构化企业数据,从目标行业的不同类型的企业中分别选取每一类型的目标企业;基于目标企业的目标结构化企业数据,创建三元关系组;根据三元关系组创建产业知识图谱,构建目标行业的产业链地图。该过程中,目标结构化企业数据可以体现出企业间的业务交流关系,创建的产业链地图更加直观的展示产业分布及不同企业节点之间的相互业务关系。决策者可以根据本发明的产业链地图,了解行业的产业链现状,进而进行战略部署。

Description

一种产业链地图构建方法、装置及电子设备
技术领域
本发明实施例涉及数据挖掘与处理技术领域,尤其涉及一种产业链地图构建方法、装置及电子设备。
背景技术
在行业的发展中,可以使用产业链地图的方法对产业链的地理分布进行宏观查询。
产业链是一个包含价值链、企业链、供需链和空间链四个维度的概念。这四个维度在相互对接的均衡过程中形成了产业链,这种“对接机制”是产业链形成的内模式,作为一种客观规律,它像一只“无形之手”调控着产业链的形成。
产业链地图是搭建起满足各类应用场景需求的结构化数据体系,并在数据的广度与深度上都形成了足够厚的竞争壁垒。运用先进人工智能引擎,以自然语言识别技术进行数据结构化归类,形成丰富的产业知识图谱,在此基础上以精细化人工运营进行二次深度加工,确保了数据的真实、准确性。
但是,传统的产业链地图较少呈现企业间的业务交流关系,或是单一呈现产业的地理分布或业务交流关系,无法将两种层次的产业链信息进行整合呈现。
同时当产业链地图呈现的信息涉及到企业间的业务交流关系时,产业链地图在视觉效果上会变得非常复杂,使用者无法通过该工具直观地了解到全产业链层面的宏观信息,该信息包括产业链层面上的区域产业分布情况和产业链中容易导致风险的企业节点。
决策者根据现有的产业链地图,难以多角度、全面地了解某个行业的产业链现状,也就难以从战略层面对该产业链进行规划、调整。
发明内容
本发明提供了一种产业链地图构建方法、装置及电子设备,以解决现有技术中部分或全部的技术问题。
根据本发明的第一方面,本发明提供了一种产业链地图构建方法,该方法包括:
获取目标行业的产业链上不同节点的节点数据,节点数据用以指示目标行业的不同类型的企业的第一原始企业数据;
分别对每一类型的企业的第一原始企业数据进行预处理后,获取与每一类型的企业对应的目标结构化企业数据;
根据目标结构化企业数据,从目标行业的不同类型的企业中,分别选取每一类型的目标企业;
基于目标企业的目标结构化企业数据,创建三元关系组;
根据三元关系组创建产业知识图谱,并根据所述产业知识图谱,构建目标行业的产业链地图。
可选的,分别对每一类型的企业的第一原始企业数据进行预处理后,获取与每一类型的企业对应的目标结构化企业数据,具体包括:
当第一原始企业数据为第一类型的企业的结构化企业数据时,直接对第一原始企业数据进行清洗,以获取与第一类型的企业对应的目标结构化企业数据;
或,当第一原始企业数据为第二类型的企业的非结构化企业数据时,将第一原始企业数据转换为半结构化企业数据;利用预构建的机器学习模型,将半结构化企业数据转换为目标结构化企业数据;或者,当第一原始企业数据为第二类型的企业的结构化企业数据时,通过筛选所述第一原始企业数据,获取目标结构化企业数据;
或,当第一原始企业数据为第三类型的企业的结构化企业数据时,对第一原始企业数据进行文字识别,获取目标结构化企业数据。
可选的,获取目标行业的产业链上不同节点的节点数据之后,方法还包括:
通过第三方渠道获取目标行业的不同类型的企业的第二原始企业数据;
对第二原始企业数据进行预处理,以便后续对目标结构化企业数据进行修正。
可选的,目标结构化企业数据至少包括如下内容:
企业名称、企业位置、企业类型、主营业务、营业规模、营业额以及企业所处产业链数据。
可选的,根据目标结构化企业数据,从目标行业的不同类型的企业中,分别选取每一类型的目标企业,具体包括:
从目标行业的第i个类型的企业中,选取目标结构化企业数据完整度高于预设阈值的候选企业;
从所有的候选企业按照营业额进行排序;
按照排序顺序,选取前n个企业作为目标企业,其中,前n个企业的营业额,与所有候选企业的营业额之间的比例超过预设比例阈值,其中,i和n均为正整数。
可选的,在构建产业链地图后,该方法还包括:
当检测到第一操作指令后,识别与第一操作指令对应的第一触发位置;
当确定第一触发位置为产业链地图中与第一企业对应的标识位置时,展示与第一企业对应的目标结构化企业数据,其中,第一企业为产业链中的任一企业。
可选的,方法还包括:
在产业链地图上,通过预设线段和预设指向,展示与第一企业具有产业链关系的企业,以及各企业之间的产业链流向。
可选的,在构建产业链地图后,该方法还包括:
当检测到第二操作指令时,识别与第二操作指令对应的第二触发位置;
当确定第二触发位置为产业链地图中与第二企业对应的标识位置时,在产业链地图上,确定与第二企业具有关联关系的企业中的风险企业;
当确定存在风险企业时,识别风险企业的风险类型,并生成告警信息,告警信息包括风险企业的风险类型,以及风险企业的企业信息。
可选的,当确定第二触发位置为产业链地图中与第二企业对应的标识位置时,利用预构建的网络中心度模型在产业链地图上,确定与第二企业具有关联关系的企业中的风险企业,具体包括:
利用预构建的网络中心度模型中的度中心性衡量体系,分别确定与第二企业具有关联关系的企业中每一个企业,与第二企业之间的供应链稳定性;
和/或,利用预构建的网络中心度模型中的特征向量中心度衡量体系,分别确定与第二企业具有关联关系的企业中每一个企业,与第二企业之间的产业链稳定性;
和/或,利用预构建的网络中心度模型中的中介中心度衡量体系,分别确定与第二企业具有关联关系的企业中每一个企业,与第二企业之间的产业链传播稳定性;
根据供应链稳定性,和/或产业链稳定性,和/或产业链传播稳定性,在产业链地图上,确定与第二企业具有关联关系的企业中的风险企业。
根据本发明的第二方面,本发明提供了一种产业链地图构建装置,包括:
获取模块,用于获取目标行业的产业链上不同节点的节点数据,节点数据用以指示目标行业的不同类型的企业的第一原始企业数据;
处理模块,用于分别对每一类型的企业的第一原始企业数据进行预处理后,获取与每一类型的企业对应的目标结构化企业数据;
选择模块,用于根据目标结构化企业数据,从目标行业的不同类型的企业中,分别选取每一类型的目标企业;
创建模块,用于基于目标企业的目标结构化企业数据,创建三元关系组;
构建模块,用于根据三元关系组创建产业知识图谱,并根据所述产业知识图谱,构建目标行业的产业链地图。
根据本发明的第三方面,本发明提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面任一项实施例的产业链地图构建方法的步骤。
根据本发明的第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如第一方面任一项实施例的产业链地图构建方法的步骤。
本发明实施例提供的上述技术方案与现有技术相比至少具有如下优点:
本发明实施例提供的方法,获取目标行业的产业链上不同节点的节点数据,该节点数据用以指示目标行业的不同类型的企业的第一原始企业数据。将第一原始企业数据进行预处理后,获取与每一类型的企业分别对应的目标结构化企业数据。然后根据目标结构化企业数据,从模板行业的不同类型的企业中,分别选取每一类型的目标企业,进而根据目标企业的结构化企业数据,创建三元关系组。最终根据三元关系组创建产业知识图谱,并根据所述产业知识图谱,构建目标行业的产业链地图。在上述实施方式中,从第一原始企业数据中,提炼出目标结构化企业数据,该目标结构化企业数据可以展示企业的属性数据,例如企业的名称、位置、类型、主营业务、营业规模,企业所处的产业链数据等等。通过目标结构化企业数据,从不同类型的企业中选取具有代表性的目标企业,并基于目标企业的结构化企业数据,创建三元关系组。进而根据三元关系组创建产业知识图谱,并根据所述产业知识图谱,创建目标行业的产业链地图。该过程中,创建产业链地图的基础是利用目标结构化企业数据,而目标结构化企业数据可以体现出企业间的业务交流关系,创建的产业链地图,则可以更加直观的展示产业分布情况,以及不同企业节点之间的相互业务关系。从而使得决策者可以根据本发明实施例构建的产业链地图,多角度,全面地了解行业的产业链现状,进而对产业链的战略进行调整。
附图说明
图1为本发明实施例提供的一种产业链地图构建方法流程示意图;
图2为本发明提供的获取第二原始企业数据的方法流程示意图;
图3为本发明提供的从目标行业的不同类型的企业中,分别选取每一类型的目标企业的方法流程示意图;
图4本发明提供的展示与第一企业对应的目标结构化企业数据的方法流程示意图;
图5为本发明提供的实现产业链中节点风险预警的方法流程示意图;
图6为本发明提供的确定与第二企业具有关联关系的企业中的风险企业的方法流程示意图;
图7为本发明实施例提供的一种产业链地图构建装置的结构示意图;
图8为本发明实施例提供的一种电子设备的结构示意图。
图9为本发明实施例所构建的产业链地图的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
针对背景技术中所提及的技术问题,本发明实施例提供了一种产业链地图构建方法,具体参见图1所示,图1为本发明实施例提供的一种产业链地图构建方法流程示意图。本发明实施例可以适用于任意一种行业构建产业链地图的应用场景。在一个具体的例子中,例如应用场景为汽车产业。本发明实施例的具体方法步骤,具体可以参见如下:
步骤110,获取目标行业的产业链上不同节点的节点数据。
具体的,节点数据用以指示目标行业的不同类型的企业的第一原始企业数据。
在一个具体的例子中,首先需要根据不同的行业定义不同的企业类型。例如汽车行业,可以将企业类型划分为汽车品牌企业,汽车零部件供应企业和汽车经销企业。而在获取不同类型的企业的第一原始企业数据时,不同企业类型,数据寻找的方式与数据源网站也需要进行一定的区别。不过,获取数据的常规手段,例如可以通过爬虫技术,以及人工搜集补充的方式可以实现。其中,在数据源网站搜集企业实体数据,搜集到的数据包括结构化企业数据、半结构化企业数据和非结构化企业数据。
在一个具体的例子中,例如通过人工整理,搜集涉及汽车品牌的企业名录网站,获取企业名录网页。然后利用爬虫技术爬取相应的网页获取文本数据,该文本数据中至少包括汽车品牌商名称等数据。
通过人工整理,搜集涉及汽车供应商企业名录的网站,利用爬虫技术爬取相应的网页,获取文本数据,该文本数据中至少包括汽车供应商企业名称、企业规模、企业主营业务数据等数据。
通过人工或其他手段整理各汽车品牌商官网中的经销商页面,然后通过爬虫技术的方式爬取文本数据,该文本数据中包括各汽车品牌商的经销商数据,例如获取汽车经销商名称等。
当然,也可以通过某些数据查询应用程序、上市车企公开财报等其他公开网站的数据,采用人工搜集或者爬虫技术的方式,进一步对搜集到企业的数据进行进一步完善。
最终获得包含企业地址,企业规模、主营业务、供应商名称、供应商交易额等第一原始企业数据,其中数据可以是结构化、非结构化和半结构化的数据。
步骤120,分别对每一类型的企业的第一原始企业数据进行预处理后,获取与每一类型的企业对应的目标结构化企业数据。
具体的,预处理可以包括数据清洗、数据筛选、以及数据识别等手段。
在一个具体的例子中,对于第一原始企业数据进行预处理,可以通过如下方式实现,该方法步骤包括:
当第一原始企业数据为第一类型的企业的结构化企业数据时,直接对第一原始企业数据进行清洗,以获取与第一类型的企业对应的目标结构化企业数据;
或,当第一原始企业数据为第二类型的企业的非结构化企业数据时,将第一原始企业数据转换为半结构化企业数据;利用预构建的机器学习模型,将半结构化企业数据转换为目标结构化企业数据;或者,当第一原始企业数据为第二类型的企业的结构化企业数据时,通过筛选所述第一原始企业数据,获取目标结构化企业数据;
或,当第一原始企业数据为第三类型的企业的结构化企业数据时,对第一原始企业数据进行文字识别,获取目标结构化企业数据。
在一个具体的例子中,例如第一类型的企业为汽车品牌企业,也即是汽车品牌商。在爬取企业名录网站获得的结构化企业数据中,筛选出汽车产业的品牌商名称数据。
当第二类型的企业为汽车供应企业,也即是汽车供应商,当第一原始企业数据为第二类型的企业的结构化企业数据时,在利用爬虫技术爬取涉及汽车供应商企业名录的网站获得的网页文本数据中,通过筛选所述第一原始企业数据,规范数据格式,最终获得包括供应商企业名称,供应商简介中涉及的上游企业,供应商简介中涉及到的主营业务,供应商规模等数据。
或者,当第一原始企业数据为第二类型的企业的非结构化企业数据时,在利用爬虫技术爬取涉及汽车供应商企业名录的网站获得的网页文本数据中,对获得的非结构化企业数据,采用python中的jieba.analyse库,筛选并提取出分割词,进行数据分块,将非结构化企业数据转化为半结构化的数据,如在文本“A(汽车供应商名称)在中国生产和销售汽车零配件和售后市场产品、在中国销售额达到1093亿人民币。”中将“生产”“销售额”作为分隔词,提取“A生产汽车零配件销售额 1093亿人民币”。对于处理后的数据与爬取的半结构化企业数据使用sklearn库,构建机器学习模型,处理为结构化企业数据,如文本“A生产汽车零配件销售额 1093亿人民币”处理为“A 汽车配件”“A 销售额 1093亿人民币”的结构化企业数据,并依据格式保存在数据库中。
当第三类型的企业为汽车经销企业,也即是汽车经销商时,则在通过例如,爬虫技术的方式获取各汽车品牌商的经销商数据中,通过自然语言处理和机器学习算法筛选数据,数据包括经销商名称以及经销商地址信息等。
进一步可选的,除了上述方式可以获取目标行业的产业链上不同节点的节点数据以外,还可以通过如下方式对节点数据进行完善和修正,具体参见图2所示,图2中示出获取第二原始企业数据的方法流程示意图。
具体的,该方法步骤包括:
步骤210,通过第三方渠道获取目标行业的不同类型的企业的第二原始企业数据。
步骤220,对第二原始企业数据进行预处理,以便后续对目标结构化企业数据进行修正。
在一个具体的例子中,可以通过在获取第三方应用程序、上市车企公开财报等其他公开网站的数据后,通过上述类似的方法,对第三方应用程序所属的企业信息网站,根据html页面的元素定位,可以定位出企业地址、主营业务数据。对于上市企业财报,可以使用如词频-逆向文件频率(term frequency–inverse document frequency,简称TF-IDF)的机器学习算法对网页数据进行分类,设置停用词,在爬取后的数据中筛选出企业规模、供应商名称和供应商交易额等数据。也能够在其他涉及企业信息的网站中重复上述方法,补全企业数据。
将上述搜集并处理好的数据,采用人工输入函数处理,进行数据转换,包括数据的重命名,数据格式的统一和去除空值,标准化数据内容。再进行数据融合,可以使用实体相似度计算和属性相似度计算,对收集和处理后的数据中同一个企业的属性数据进行整合,并删除重复数据。规范数据格式后,最终获取目标结构化企业数据。在一个可选的例子中,目标结构数据至少包括如下内容:企业名称、企业位置、企业类型、主营业务、营业规模、营业额以及企业所处产业链数据。
其中,企业类型,例如可以包括:品牌商、供应商和经销商。
企业所处产业链数据包括:企业所处产业链上游企业数据和/或企业所处产业链下游企业数据。
企业所处产业链上游企业数据包括:企业所处产业链上游企业名、企业所处产业链上游企业交易额、企业所处产业链上游企业业务信息。
企业所处产业链下游企业数据包括:企业所处产业链下游企业名、企业所处产业链下游企业交易额、企业所处产业链下游企业业务信息。
其中,当企业类型为品牌商或供应商时,企业所处产业链上游企业数据可为空。当企业类型为经销商时,企业所处产业链下游企业数据可为空。
步骤130,根据目标结构化企业数据,从目标行业的不同类型的企业中,分别选取每一类型的目标企业。
具体的,考虑到每一类型的企业可能都包括很多,但是有部分企业的数据可能不够完善,或者对于构建产业链地图而言,作用不是很大,如果将这类企业也考虑在构建产业链地图的范围内,不仅仅会导致产业链地图的精确度降低,还可能增加算法的复杂度,降低工作效率。
因此,可以根据目标结构化企业数据,从模板行业的不同类型的企业中,分别选取每一类型的目标企业。
具体实现过程参见图3所示,图3示出从目标行业的不同类型的企业中,分别选取每一类型的目标企业的方法流程示意图。
步骤310,从目标行业的第i个类型的企业中,选取目标结构化企业数据完整度高于预设阈值的候选企业。
步骤320,从所有的候选企业按照营业额进行排序。
步骤330,按照排序顺序,选取前n个企业作为目标企业。
具体的,例如首先从目标行业的第i个类型的企业中,选取与目标结构数据完整度高于90%的候选企业。
然后,按照营业额,对所有的候选企业按照营业额的高低进行排序。并选取营业额由高到低累计营业额之和占总营业额80%以上的企业作为目标企业。
举个例子,例如候选企业包括10个,而前5个候选企业的营业额之和,已经能够占到10个候选企业的总营业额的85%。也是累计之和与总营业额之间的比例超过80%,且企业数量最少的组合。那么,则选择前5个候选企业作为该类型的目标企业。当然,如果选择出的目标企业数量太少,也可以根据实际情况人为适当增加企业的数量,用以适应实际需求,进而获取符合实际需求的目标企业。
例如汽车企业可以分为3个类型,那么则需要利用类似上述方法,分别针对每一个类型,选取出相应的目标企业。
步骤140,基于目标企业的目标结构化企业数据,创建三元关系组。
具体的,使用实体与关系训练数据集进行机器学习,构建三元关系组学习模型。将所有目标企业的目标结构化企业数据,输入到该学习模型中,对目标结构化企业数据进行学习,用以构建三元关系组。
三元关系组,是产业知识图谱中知识表示的基本单位,被用来表示实体与实体之间的关系,或者用来表示实体某个属性的属性值。在本实施例中,该三元关系组能体现企业的属性数据,如企业名、地址、企业主营业务等属性数据,同时能表达企业间的产业关系,如表现某家企业的上下游企业。例如包括B-“品牌”-整车,整车-“部件”-底盘,底盘-“供应”-A(部件供应商名称)等。
具体地,上述三元关系组可以根据数据类型,采取不同的构建方法实现,其中:
对于结构化数据,可使用D2R工具进行转换,D2R(Database to RDF)是将关系型数据库映射到RDF(Resource Description Framework基本组成单位为三元关系组)的一种方式。该方法是将关系型数据库的数据库表名直接映射到RDF中的类,字段映射到类的属性,类之间的关系可以从表示关系的表中得出。通过该方式可以构建企业与其属性字段的三元关系组。例如:获得了字段名为企业名与企业规模的表格,则采用该工具将三元组关系划分为“企业名-规模-xxx”,如“企业A-规模-10000人”。
对于非结构化数据,可采用Pipeline模式提取三元关系组。Pipeline模式即管道式方法,这种方法就是将三元关系组的抽取拆成两个步骤:实体抽取和关系识别。这两个步骤串联进行,对于一条非结构化数据文本,先使用实体抽取器识别出各个实体,然后对抽取出来的实体进行组合,并使用关系识别器对原文本中输入进行关系识别,并将关系和两输入实体进行整合。所述实体抽取,即抽取非结构化数据中的实体信息元素,在本实施例中包含抽取企业名、主营业务、下游企业名、营业额、企业位置等数据。使用对于企业名、下游企业等数据内容可以使用分词断句的方式,设定截断词进行筛选分句,分离出实体;例如:输入为“A企业供应B主机厂产品C”,设置“供应”为截断词,将A企业和B企业进行分离抽取;对于与营业额等数据采用触发词的方式分离出实体,例如:输入为“A企业2020年营业额2000万”,触发词为营业额,分离出“2000万”;对于主营业务等数据可以通过与数据词典进行词典匹配的方式,将词典中的规范化数据作为对照分离实体,即提前准备机械制造行业的产品库,当产品库与输入重合时抽取,例如:输入为“A企业是球笼行业全国前三的企业”,该输入中包含词典里的“球笼”故将此抽离。
所述关系抽取,是指从相关语料中提取出实体之间的关联关系,并通过关系将实体联系起来,进而形成网状的知识结构。本实施例中由于实体间关系类型较为确定,抽取的实体类型相对确定,因此采用基于规则的关系抽取方法,即通过自定义正则表达式来抽取出实体之间的关系。在该流程中通过机器学习与训练识别实体类型,并将实体类型的组合与定义的正则表达式对应,得到二者关系并组成三元组。例如在实体为“A汽车零部件公司”与“1230万”识别二者类型为“企业名”与“营业额”,在正则表达式规则中定义其规则为“年营收”,组成“A汽车零部件公司-年营收-1230万”的三元关系组。
将上述形成的三元关系组输入到图数据库中形成产业知识图谱,将抽象产业知识图谱根据位置数据在地图上实现可视化,并通过点击命令与小窗口视图关联具象地图图谱与抽象产业知识图谱,该图谱结果拥有下列特征:
(1)主视图为企业节点在地图上的可视化表达,用以显示产业链交易流向,如在地图中显示从各供应商出发至主机厂总装至经销商出售的全产业链地图;
(2)可通过在主视图地图中使用限定地图范围指令,显示单独省份或地区的区域企业总数、区域企业规模总额、区域企业类型占比等数据结果;
(3)对节点进行点击指令,可以弹出抽象产业知识图谱的小窗视图,显示该节点的所有详细数据格式以及该节点的抽象产业链关系;
(4)在小窗视角,显示在企业链路上的风险瓶颈供应商,若该企业非经销商或链头部供应商,可根据其输入的产品需求为其提供推荐供应商名单。
步骤150,根据三元关系组创建产业知识图谱,并根据所述产业知识图谱,构建目标行业的产业链地图(如图9所示)。该产业链地图采用双视图的模式,将抽象的产业知识图谱与具象的地理地图分布结合。其特点是:在地图视角能够直观展现各企业的地理位置信息,并展示企业的地域分布特征和具体区域范围内的产业集群分布情况,同时能借由地图还能够展示现实中的物流信息情况。在产业知识图谱视角能够详细展示企业的各项属性值,同时能够更直观查询企业间的供求关系,产业链上下流关系,并可以借助图谱进行网络复杂度指标计算,借由结果判断产业链上的瓶颈企业,并可以借由图谱实现供应商推荐
在一个具体的例子中,可以根据三元关系组,创建产业知识图谱;然后根据产业知识图谱,构建目标行业的产业链地图。
例如,采用NEO4J图数据库构建产业知识图谱,在完成NEO4J配置后进行图谱的设计与数据的输入,进行可视化展示,完成图谱的构建。其中,NEO4J是一个高性能的NOSQL图形数据库,它将结构化企业数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化企业数据存储在网络(从数学角度叫做图)上而不是表中。NEO4J也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。而利用NEO4J构建产业知识图谱的技术较为成熟,因此在本发明中不进行过多描述。
具体而言,对产业知识图谱进行可视化,以此来构建产业链的地图时,可以通过如下方式实现:
在Python中采用folium接口进行企业位置的坐标的构建,例如获取企业位置的经纬度数据。其中,folium是js上地理信息可视化库leafet.js为Python提供的接口,通过它进行地图数据的可视化,制作可交互地图。利用数据库中各企业的经纬度数据对其进行坐标在地图页面中的可视化。
本发明实施例提供的产业链地图构建方法,获取目标行业的产业链上不同节点的节点数据,该节点数据用以指示目标行业的不同类型的企业的第一原始企业数据。将第一原始企业数据进行预处理后,获取与每一类型的企业分别对应的目标结构化企业数据。然后根据目标结构化企业数据,从模板行业的不同类型的企业中,分别选取每一类型的目标企业,进而根据目标企业的结构化企业数据,创建三元关系组。最终根据三元关系组创建产业知识图谱,并根据所述产业知识图谱,构建目标行业的产业链地图。在上述实施方式中,从第一原始企业数据中,提炼出目标结构化企业数据,该目标结构化企业数据可以展示企业的属性数据,例如企业的名称、位置、类型、主营业务、营业规模,企业所处的产业链数据等等。通过目标结构化企业数据,从不同类型的企业中选取具有代表性的目标企业,并基于目标企业的结构化企业数据,创建三元关系组。进而根据三元关系组创建产业知识图谱,并根据所述产业知识图谱,创建目标行业的产业链地图。该过程中,创建产业链地图的基础是利用目标结构化企业数据,而目标结构化企业数据可以体现出企业间的业务交流关系,创建的产业链地图,则可以更加直观的展示产业分布情况,以及不同企业节点之间的相互业务关系。从而使得决策者可以根据本发明实施例构建的产业链地图,多角度,全面地了解行业的产业链现状,进而对产业链的战略进行调整。
可选的,在上述实施例的基础上,在构建产业链地图后,该方法还可以包括如下内容,具体参见图4所示。
步骤410,当检测到第一操作指令后,识别与第一操作指令对应的第一触发位置。
步骤420,当确定第一触发位置为产业链地图中与第一企业对应的标识位置时,展示与第一企业对应的目标结构化企业数据。
具体的,例如当检测到用户通过人机交互模式,在当前展示的产业链地图上的某个位置触发第一操作指令后,第一操作指令对应的第一触发位置。当识别到第一触发位置为产业链地图中与第一企业对应的标识位置时,即可展示展示与第一企业对应的目标结构化企业数据,其中,第一企业为产业链中的任一企业。
具体实现原理为,采用Markers函数,实现单击各企业坐标后的标签弹出,在标签中展示企业在数据库中的各项数据,展示数据包括:企业名、企业位置、企业类型、主营业务、营业规模等,进一步可选的,还可以在标签页中提供产业知识图谱页面链接。通过该方式,方便用户更加清晰的了解每一个企业的属性数据。
进一步可选的,除了可以展示企业属性数据以外,还可以展示与第一企业具有产业链关系的企业,以及各企业之间的产业链流向。用以辅助用户了解与第一企业相关的整个产业链的动态流向。
具体而言,可以通过有向线段对数据库中企业所处产业链数据中的企业所处产业链上下游企业交易额数据进行可视化。
首先根据数据库中的企业名和企业所处产业链下游企业名为有向线段端点,如以(企业名:A;企业所处产业链下游企业:B)为例,有向线段端点为A所在坐标和B所在坐标。
其次确定有向线段方向,线段方向为企业指向产业链下游企业名,如以(企业名:A;企业所处产业链下游企业:B)为例,线段方向为A指向B。
再次,确定有向线段线宽。对选取所有企业交易额平均值作为基准,定义基准线宽x,当交易额数据大于平均值时,有向线段线宽d=交易额/平均值x,定义有向线段线宽的边界为x≤d≤3x。
在定义完成有向线段端点、线段方向与线宽后,采用Python中basemap包进行有向线段的绘制,对目标行业的产业链流动进行可视化。
可选的,在上述任一实施例的基础上,本发明实施例还提供了实现产业链中节点风险预警的方法,具体参见图5所示,该方法步骤包括:
步骤510,当检测到第二操作指令时,识别与第二操作指令对应的第二触发位置。
步骤520,当确定第二触发位置为产业链地图中与第二企业对应的标识位置时,在产业链地图上,确定与第二企业具有关联关系的企业中的风险企业。
具体而言,当确定第二触发位置为产业链地图中与第二企业对应的标识位置时,利用预构建的网络中心度模型在产业链地图上,确定与第二企业具有关联关系的企业中的风险企业,可以通过如图6所示的方法步骤实现,包括:
步骤610,利用预构建的网络中心度模型中的度中心性衡量体系,分别确定与第二企业具有关联关系的企业中每一个企业,与第二企业之间的供应链稳定性。
和/或,步骤620,利用预构建的网络中心度模型中的特征向量中心度衡量体系,分别确定与第二企业具有关联关系的企业中每一个企业,与第二企业之间的产业链稳定性。
和/或,步骤630,利用预构建的网络中心度模型中的中介中心度衡量体系,分别确定与第二企业具有关联关系的企业中每一个企业,与第二企业之间的产业链传播稳定性。
企业节点对产业链传播稳定性的影响主要体现在,链上企业由于现实原因所导致的节点中断会对全产业链造成影响。企业节点中断所导致的对产业链稳定性的影响方式可以由以下两个方面体现:
一种是直接影响,即企业在链网络中的合作企业数量多少以及它合作企业的重要性,可以通过此判断它对于整个供应网络的影响大小。
其次是供应商的层级影响,若企业联系的合作企业较少但是它们却处于链中关键的中介位置,属于不同产业链流动中的必须经过一个环节,则其对产业链稳定性的影响也会很大。
通过对产业链传播稳定性影响的分析,可以定义以下三类风险企业:
(1)联系企业,直接的业务伙伴数量多,本身重要性高,它的业务波动会对大企造成影响成影响;
(2)重要合作企业,和产业链网络中高重要性的企业合作,会对产业链中的重要企业造成影响;
(3)中间企业,在链结构具有独特的中介地位,是多条链必须经过的企业,是产业链流转重要中介节。
上述三类企业是对产业链稳定性将造成重大隐患的风险企业。
步骤640,根据供应链稳定性,和/或产业链稳定性,和/或产业链传播稳定性,在产业链地图上,确定与第二企业具有关联关系的企业中的风险企业。
在一个具体的例子中,首先通过点击产业链地图中的某一个节点,进入企业产业知识图谱界面,在产业知识图谱页面中点击瓶颈节点计算指令按钮,也即是第二操作指令。
系统接收到第二操作指令后,将在后台计算基于网络中心度模型的节点价值计算。包括度中心性的计算,特征向量中心度的计算和中介中心度的计算。其中,度中心性的计算,用以确定与该节点企业(第二企业)具有业务关系的企业的数量,通过该节点企业在供应链中的重要性判断供应链的稳定性;特征向量中心度的计算,用以确定该节点企业和与该节点企业(第二企业)具有业务关系的企业之间的产业链稳定性;中介中心度的计算,用以确定该节点企业和与该节点企业(第二企业)具有业务关系的企业之间的产业链传播稳定性。
其中,度中心性
Figure 279381DEST_PATH_IMAGE001
,用于计算与该企业与有业务合作的企业的数量,其中𝐴𝑖𝑗是联系矩阵,在供应链环境下表现为与该节点有业务联系的企业数量与业务金额的乘积并进行归一化处理,𝐷𝑖是N节点(即该企业所在的产业链节点)的度中心性。该指标可以表示不稳定的高度中心性节点(即当度中心性高的企业,当该企业出现瓶颈时容易对产业链网络产生更大的影响)对供应链网络稳定性的影响。
特征向量中心度
Figure 70620DEST_PATH_IMAGE002
,用于计算联系节点(即连接多家企业的企业节点)的重要性,𝐴𝑖𝑗是指联系矩阵,而𝐷𝑗则指代相邻节点(即该企业节点的连接企业)的度中心性。当相邻节点具有更多联系时,该节点的特征向量中心度越高(如该企业节点只存在三个连接节点,但其中存在两个连接节点的企业都各自与其余五家企业存在业务联系,则说明该企业节点的特征向量中心度高),高特征向量中心度的节点存在瓶颈问题时会破坏整条供应链的结构,造成产业链的不稳定。
中介中心度
Figure 211751DEST_PATH_IMAGE003
,用于衡量节点处在其他成员最短路径上占据程度(即计算从产业链最上游至产业链最下游的最短路径中,经过该企业的路径占所有路径的比例)。d𝑗,𝑘指的是j,k(产业链最上游和产业链最下游)之间的最短路径的数量,d𝑗,𝑘(𝑖)最短路径经过i点(进行计算的企业节点)的数量。中介中心度展示了产业链传播和切断的影响。中介中心度越高,经过该企业节点的路径数量就越多,因此关键程度也就越高。
Figure 774975DEST_PATH_IMAGE004
为上述三个指标的风险预警阈值,所述三个指标是指度中心性、特征向量中心度和中介中心度,其中,n=1为度中心性阈值,n=2为特征向量中心度阈值,n=3为中介中心度阈值;t=1为各指标第一预警值,t=2为各指标第二预警值。当三个指标
Figure 343360DEST_PATH_IMAGE005
均小于第一预警值时,该企业节点无风险;当三个指标中任一落在第一预警值至第二预警值内则该企业节点有预警风险;当三个指标中任一大于第二预警值时,则该节点具有重大风险。
Figure 28419DEST_PATH_IMAGE006
的取值与该节点企业主营业务国内全年营收,该节点企业所在产业链全年国内总产值,该节点企业总产值月度同比变化,专家与技术人员判断等因素有关。风险判定如下:
Figure 973241DEST_PATH_IMAGE007
Figure 388042DEST_PATH_IMAGE008
Figure 392907DEST_PATH_IMAGE009
在本发明中,企业的综合推荐指数R的算法为:
Figure 893159DEST_PATH_IMAGE010
计算过程中,将单独遍历计算该企业的所有合作供应商企业。
其中,n为合作供应商企业与需求企业前三年内的交易总额;
q为需求企业节点的往期交易额在该合作供应商企业节点的交易额排名的对于系数,q的对应关系如下:往期交易额位次为1,q为0.7;位次为2-3,q为0.5;位次为4-5,q为0.3;位次大于5,q为0.1;
Q为需求企业节点的往期交易额占该合作供应商企业节点所有交易额的比例;
Figure 110513DEST_PATH_IMAGE005
分别为合作企业的度中心性,特征向量中心度和中介中心度;
j为大供应商意愿指数,用以表示需求企业对采用大供应商的态度,修正取值在0.8与1之间,由企业技术人员根据需求企业供应商多样性程度等诸多因素进行判断取值,默认为1;
p为风险意愿指数,用以表示需求企业对于风险企业的接受程度,修正取值在0.8与1之间,由企业技术人员根据需求企业供应链抗风险能力与订单紧迫程度等因素进行判断取值,默认为1。
遍历计算需求企业所有供应商后,根据R的取值,降序排列出推荐给该企业的前十供应商供需求企业选择,R值越大则推荐度越高。
对产业链上节点企业使用将上述三个指标进行单独衡量,根据操作方需求设定指标的正常范围(例如,指标上限为1,指标数值越大说明该企业节点越容易成为瓶颈),在案例中,设定上述三个指标的正常范围为0-0.7。在输入产业链数据形成产业链地图时,核算图中企业的三项指标,对于任一单独指标高于0.7的企业节点,在地图中设定标签颜色进行标黄,对于指标高于0.9的企业,在地图中设定标签颜色进行标红。点击风险企业标签,系统将根据三项指标数值分别进行弹窗说明其存在的风险(一类为节点自身与其他企业联系过高的风险,二类为节点连接过多存在一类风险的企业,三类为节点在网络层面上具有较高复杂性,会对产业链造成重大影响),对超出合理范围的节点进行弹窗警示,并展示其风险类型。
步骤530,当确定存在风险企业时,识别风险企业的风险类型,并生成告警信息。
即,根据风险类型和风险企业的企业信息,生成告警信息,用以告知工作人员及时规避风险,或者优化产业链。
根据上述企业风险指标,本申请还提供一种基于风险指标的合作企业推荐方法。
在系统中点击企业节点标签,在标签详情页中点击合作企业推荐按钮。
系统计算与该企业节点有直接业务往来的企业的综合推荐指数并根据计算结果对企业排序,在排序页呈现推荐位次,企业名,往期业务交易总额,企业综合推荐指数分,企业度中心性,企业特征向量中心度和企业中介中心度的数据信息。
在本发明中,企业的综合推荐指数R的算法为:
Figure 645400DEST_PATH_IMAGE011
其中,n为合作企业往期交易总额,q为原企业节点的往期交易额在该合作企业节点的交易额排名指数,Q为原企业节点的往期交易额占该合作企业节点所有交易额的比例,
Figure 614974DEST_PATH_IMAGE012
分别为合作企业的度中心性,特征向量中心度和中介中心度。
q的对应关系如下:往期交易额位次为1,q为0.7;位次为2-3,q为0.5;位次为4-5,q为0.3;位次大于5,q为0.1。
除了上述本发明实施例所提出的风险预警的应用场景外,本申请还提供了针对上述方法的几种具体应用场景的应用实例。
例如在产业链地图上进行区域产值查看。
首先在数据库中建立各省市的坐标范围数据。操作者在前端交互页面中缩小产业链地图,将会隐藏具体企业坐标与产业链流动线段,同时发送指令在数据库中以省为范围进行筛选,返回该省内的企业数量与产业总产值,最后以文字的形式展示在产业地图界面中展示。
或者,可以在产业链地图上根据企业信息进行筛选查看。
具体的,首先在产业链地图上构建筛选指令按钮,根据企业位置,企业类型,主营业务信息进行筛选查看。确定筛选条件后点击筛选按钮,将会整合筛选条件,并发送指令在数据库中进行查询,将查询结果以构建产业链地图的方式展示在产业链地图中。
或者,利用产业链地图查询企业之间的联系。
对单击企业坐标节点后弹出的标签页中展示产业知识图谱页面链接,在单击该链接后进入该企业所处产业知识图谱的可视化页面中。
该页面的可视化实现方法如下:
在地图上使用folium实现点击标记点出现弹窗功能,在弹窗中展示该企业相关的产业链产业知识图谱。整合点击标记点的企业名形成筛选条件,发送该筛选条件整合成cypher 语句与图数据库交互,实现筛选功能,使用筛选后的结果搭建该企业的产业知识图谱,该产业知识图谱通过HTML接口与可视化前端进行交互,展示在弹窗界面中。在点击标记点出现的弹窗中设置返回指令按钮,通过单击返回指令按钮关闭产业知识图谱界面,并回到产业链地图页面。
或者,导出静态产业链地图。
具体的,首先在产业链地图中设定筛选条件,点击查看指令按钮,筛选指令发送至图数据库后将筛选结果返回在产业链地图视图中。之后点击导出静态产业链地图指令按钮,发送指令至系统后端,使用PIL包中的ImageGrab.grab方法,截图保存当前界面,并将图像发送至前端展示,同时弹出保存地址选项,在设置保存地址后将产业链地图保存至本地。
或者,实现供应商的推荐。
具体的,首先通过点击产业地图节点,进入企业产业知识图谱页面,在产业知识图谱页面中输入需求供应商的条件,依次包括产品类型,交易额,交期时间与设定运输方式。
在首次采用该模块时,系统将要求输入交易额、交期与成本优先排序。其中交易额为企业规模与企业历史交易额量化值,交期为企业距离与运输方式量化值,成本为历史交易额、企业距离与运输方式综合量化值。
系统根据需求条件与加权排序计算首批供应商名录,依据量化分数呈现在前端界面中。
企业在做出供应商选择后,将会为供应商最终量化分数添加企业喜好加权量化制,该量化方式将引入企业、产品与供应商之间的向量,并通过RippleNet机器学习模型方法,计算向量相关度关系,优化供应商排序,提供符合企业喜好的供应商排名。
以上,为本申请所提供的产业链地图构建几个方法实施例,下文中则介绍说明本申请所提供的产业链地图构建其他实施例,具体参见如下。
图7为本发明实施例提供的一种产业链地图构建装置的结构示意图,该装置包括:获取模块710、处理模块720、选择模块730、创建模块740,以及构建模块750。
获取模块710,用于获取目标行业的产业链上不同节点的节点数据,节点数据用以指示目标行业的不同类型的企业的第一原始企业数据;
处理模块720,用于分别对每一类型的企业的第一原始企业数据进行预处理后,获取与每一类型的企业对应的目标结构化企业数据;
选择模块730,用于根据目标结构化企业数据,从目标行业的不同类型的企业中,分别选取每一类型的目标企业;
创建模块740,用于基于目标企业的目标结构化企业数据,创建三元关系组;
构建模块750,用于根据三元关系组创建产业知识图谱,并根据所述产业知识图谱,构建目标行业的产业链地图。
可选的,处理模块720,具体用于当第一原始企业数据为第一类型的企业的结构化企业数据时,直接对第一原始企业数据进行清洗,以获取与第一类型的企业对应的目标结构化企业数据;
或,当第一原始企业数据为第二类型的企业的非结构化企业数据时,将第一原始企业数据转换为半结构化企业数据;利用预构建的机器学习模型,将半结构化企业数据转换为目标结构化企业数据;或者,当第一原始企业数据为第二类型的企业的结构化企业数据时,通过筛选所述第一原始企业数据,获取目标结构化企业数据;
或,当第一原始企业数据为第三类型的企业的结构化企业数据时,对第一原始企业数据进行文字识别,获取目标结构化企业数据。
可选的,获取模块710,还用于通过第三方渠道获取目标行业的不同类型的企业的第二原始企业数据;
处理模块720,还用于对第二原始企业数据进行预处理,以便后续对目标结构化企业数据进行修正。
可选的,目标结构化企业数据至少包括如下内容:
企业名称、企业位置、企业类型、主营业务、营业规模、营业额以及企业所处产业链数据。
可选的,选择模块730,具体用于从目标行业的第i个类型的企业中,选取目标结构化企业数据完整度高于预设阈值的候选企业;
从所有的候选企业按照营业额进行排序;
按照排序顺序,选取前n个企业作为目标企业,其中,前n个企业的营业额,与所有候选企业的营业额之间的比例超过预设比例阈值,其中,i和n均为正整数。
可选的,构建模块750,具体用于根据三元关系组,创建产业知识图谱;
根据产业知识图谱,构建目标行业的产业链地图。
可选的,该装置还包括:检测模块760和展示模块770;
检测模块760,用于检测第一操作指令;
处理模块720,还用于当检测模块760检测到第一操作指令后,识别与第一操作指令对应的第一触发位置;
当确定第一触发位置为产业链地图中与第一企业对应的标识位置时,控制展示模块770展示与第一企业对应的目标结构化企业数据,其中,第一企业为产业链中的任一企业。
可选的,展示模块770,还用于在产业链地图上,通过预设线段和预设指向,展示与第一企业具有产业链关系的企业,以及各企业之间的产业链流向。
可选的,检测模块760还用于检测第二操作指令;
处理模块720,还用于当检测到第二操作指令时,识别与第二操作指令对应的第二触发位置;
当确定第二触发位置为产业链地图中与第二企业对应的标识位置时,在产业链地图上,确定与第二企业具有关联关系的企业中的风险企业;
当确定存在风险企业时,识别风险企业的风险类型,并生成告警信息,告警信息包括风险企业的风险类型,以及风险企业的企业信息。
可选的,处理模块720,具体用于利用预构建的网络中心度模型中的度中心性衡量体系,分别确定与第二企业具有关联关系的企业中每一个企业,与第二企业之间的供应链稳定性;
和/或,利用预构建的网络中心度模型中的特征向量中心度衡量体系,分别确定与第二企业具有关联关系的企业中每一个企业,与第二企业之间的产业链稳定性;
和/或,利用预构建的网络中心度模型中的中介中心度衡量体系,分别确定与第二企业具有关联关系的企业中每一个企业,与第二企业之间的产业链传播稳定性;
根据供应链稳定性,和/或产业链稳定性,和/或产业链传播稳定性,在产业链地图上,确定与第二企业具有关联关系的企业中的风险企业。
本发明实施例提供的产业链地图构建装置中各部件所执行的功能均已在上述任一方法实施例中做了详细的描述,因此这里不再赘述。
本发明实施例提供的一种产业链地图构建装置,获取目标行业的产业链上不同节点的节点数据,该节点数据用以指示目标行业的不同类型的企业的第一原始企业数据。将第一原始企业数据进行预处理后,获取与每一类型的企业分别对应的目标结构化企业数据。然后根据目标结构化企业数据,从模板行业的不同类型的企业中,分别选取每一类型的目标企业,进而根据目标企业的结构化企业数据,创建三元关系组。最终根据三元关系组创建产业知识图谱,并根据所述产业知识图谱,构建目标行业的产业链地图。在上述实施方式中,从第一原始企业数据中,提炼出目标结构化企业数据,该目标结构化企业数据可以展示企业的属性数据,例如企业的名称、位置、类型、主营业务、营业规模,企业所处的产业链数据等等。通过目标结构化企业数据,从不同类型的企业中选取具有代表性的目标企业,并基于目标企业的结构化企业数据,创建三元关系组。进而根据三元关系组创建产业知识图谱,并根据所述产业知识图谱,创建目标行业的产业链地图。该过程中,创建产业链地图的基础是利用目标结构化企业数据,而目标结构化企业数据可以体现出企业间的业务交流关系,创建的产业链地图,则可以更加直观的展示产业分布情况,以及不同企业节点之间的相互业务关系。从而使得决策者可以根据本发明实施例构建的产业链地图,多角度,全面地了解行业的产业链现状,进而对产业链的战略进行调整。
如图8所示,本发明实施例提供了一种电子设备,包括处理器111、通信接口112、存储器113和通信总线114,其中,处理器111,通信接口112,存储器113通过通信总线114完成相互间的通信。
存储器113,用于存放计算机程序;
在本发明一个实施例中,处理器111,用于执行存储器113上所存放的程序时,实现前述任意一个方法实施例提供的产业链地图构建方法,包括:
获取目标行业的产业链上不同节点的节点数据,节点数据用以指示目标行业的不同类型的企业的第一原始企业数据;
分别对每一类型的企业的第一原始企业数据进行预处理后,获取与每一类型的企业对应的目标结构化企业数据;
根据目标结构化企业数据,从目标行业的不同类型的企业中,分别选取每一类型的目标企业;
基于目标企业的目标结构化企业数据,创建三元关系组;
根据三元关系组创建产业知识图谱,并根据所述产业知识图谱,构建目标行业的产业链地图。
可选的,分别对每一类型的企业的第一原始企业数据进行预处理后,获取与每一类型的企业对应的目标结构化企业数据,具体包括:
当第一原始企业数据为第一类型的企业的结构化企业数据时,直接对第一原始企业数据进行清洗,以获取与第一类型的企业对应的目标结构化企业数据;
或,当第一原始企业数据为第二类型的企业的非结构化企业数据时,将第一原始企业数据转换为半结构化企业数据;利用预构建的机器学习模型,将半结构化企业数据转换为目标结构化企业数据;或者,当第一原始企业数据为第二类型的企业的结构化企业数据时,通过筛选所述第一原始企业数据,获取目标结构化企业数据;
或,当第一原始企业数据为第三类型的企业的结构化企业数据时,对第一原始企业数据进行文字识别,获取目标结构化企业数据。
可选的,获取目标行业的产业链上不同节点的节点数据之后,方法还包括:
通过第三方渠道获取目标行业的不同类型的企业的第二原始企业数据;
对第二原始企业数据进行预处理,以便后续对目标结构化企业数据进行修正。
可选的,目标结构化企业数据至少包括如下内容:
企业名称、企业位置、企业类型、主营业务、营业规模、营业额以及企业所处产业链数据。
可选的,根据目标结构化企业数据,从目标行业的不同类型的企业中,分别选取每一类型的目标企业,具体包括:
从目标行业的第i个类型的企业中,选取目标结构化企业数据完整度高于预设阈值的候选企业;
从所有的候选企业按照营业额进行排序;
按照排序顺序,选取前n个企业作为目标企业,其中,前n个企业的营业额,与所有候选企业的营业额之间的比例超过预设比例阈值,其中,i和n均为正整数。
可选的,根据三元关系组创建产业知识图谱,并根据所述产业知识图谱,构建目标行业的产业链地图,具体包括:
根据三元关系组,创建产业知识图谱;
根据产业知识图谱,构建目标行业的产业链地图。
可选的,方法还包括:
当检测到第一操作指令后,识别与第一操作指令对应的第一触发位置;
当确定第一触发位置为产业链地图中与第一企业对应的标识位置时,展示与第一企业对应的目标结构化企业数据,其中,第一企业为产业链中的任一企业。
可选的,方法还包括:
在产业链地图上,通过预设线段和预设指向,展示与第一企业具有产业链关系的企业,以及各企业之间的产业链流向。
可选的,方法还包括:当检测到第二操作指令时,识别与第二操作指令对应的第二触发位置;
当确定第二触发位置为产业链地图中与第二企业对应的标识位置时,在产业链地图上,确定与第二企业具有关联关系的企业中的风险企业;
当确定存在风险企业时,识别风险企业的风险类型,并生成告警信息,告警信息包括风险企业的风险类型,以及风险企业的企业信息。
可选的,当确定第二触发位置为产业链地图中与第二企业对应的标识位置时,利用预构建的网络中心度模型在产业链地图上,确定与第二企业具有关联关系的企业中的风险企业,具体包括:
利用预构建的网络中心度模型中的度中心性衡量体系,分别确定与第二企业具有关联关系的企业中每一个企业,与第二企业之间的供应链稳定性;
和/或,利用预构建的网络中心度模型中的特征向量中心度衡量体系,分别确定与第二企业具有关联关系的企业中每一个企业,与第二企业之间的产业链稳定性;
和/或,利用预构建的网络中心度模型中的中介中心度衡量体系,分别确定与第二企业具有关联关系的企业中每一个企业,与第二企业之间的产业链传播稳定性;
根据供应链稳定性,和/或产业链稳定性,和/或产业链传播稳定性,在产业链地图上,确定与第二企业具有关联关系的企业中的风险企业。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如前述任意一个方法实施例提供的产业链地图构建方法的步骤。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (12)

1.一种产业链地图构建方法,其特征在于,所述方法包括:
获取目标行业的产业链上不同节点的节点数据,所述节点数据用以指示所述目标行业的不同类型的企业的第一原始企业数据;
分别对每一类型的企业的第一原始企业数据进行预处理,获取与每一类型的企业对应的目标结构化企业数据;
根据所述目标结构化企业数据,从所述目标行业的不同类型的企业中,分别选取每一类型的目标企业;
基于所述目标企业的目标结构化企业数据,创建三元关系组;
根据所述三元关系组创建产业知识图谱,并根据所述产业知识图谱,构建所述目标行业的产业链地图。
2.根据权利要求1所述的方法,其特征在于,所述分别对每一类型的企业的第一原始企业数据进行预处理,获取与每一类型的企业对应的目标结构化企业数据,具体包括:
当所述第一原始企业数据为第一类型的企业的结构化企业数据时,直接对所述第一原始企业数据进行清洗,以获取与所述第一类型的企业对应的目标结构化企业数据;或,
当所述第一原始企业数据为第二类型的企业的非结构化企业数据时,将所述第一原始企业数据转换为半结构化企业数据;利用预构建的机器学习模型,将所述半结构化企业数据转换为所述目标结构化企业数据;或者,当所述第一原始企业数据为第二类型的企业的结构化企业数据时,通过筛选所述第一原始企业数据,获取所述目标结构化企业数据;或,
当所述第一原始企业数据为第三类型的企业的结构化企业数据时,对所述第一原始企业数据进行文字识别,获取所述目标结构化企业数据。
3.根据权利要求1所述的方法,其特征在于,在所述获取目标行业的产业链上不同节点的节点数据之后,所述方法还包括:
通过第三方渠道获取所述目标行业的不同类型的企业的第二原始企业数据;
对所述第二原始企业数据进行预处理,以便后续对所述目标结构化企业数据进行修正。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述目标结构化企业数据至少包括:
企业名称、企业位置、企业类型、主营业务、营业规模、营业额以及企业所处产业链数据。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标结构化企业数据,从所述目标行业的不同类型的企业中,分别选取每一类型的目标企业,包括:
从所述目标行业的第i个类型的企业中,选取所述目标结构化企业数据完整度高于预设阈值的候选企业;
从所有的候选企业按照所述营业额进行排序;
按照排序顺序,选取前n个企业作为所述目标企业,其中,前n个企业的营业额,与所述所有的候选企业的营业额之间的比例超过预设比例阈值,其中,i和n均为正整数。
6.根据权利要求1-3任一项所述的方法,其特征在于,在构建产业链地图后,所述方法还包括:
当检测到第一操作指令后,识别与所述第一操作指令对应的第一触发位置;
当确定所述第一触发位置为所述产业链地图中与第一企业对应的标识位置时,展示与所述第一企业对应的所述目标结构化企业数据,其中,所述第一企业为所述产业链中的任一企业。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
在所述产业链地图上,通过预设线段和预设指向,展示与所述第一企业具有产业链关系的企业,以及各企业之间的产业链流向。
8.根据权利要求1-3任一项所述的方法,其特征在于,在构建产业链地图后,所述方法还包括:
当检测到第二操作指令时,识别与所述第二操作指令对应的第二触发位置;
当确定所述第二触发位置为所述产业链地图中与第二企业对应的标识位置时,在所述产业链地图上,确定与所述第二企业具有关联关系的企业中的风险企业;
当确定存在所述风险企业时,识别所述风险企业的风险类型,并生成告警信息,所述告警信息包括所述风险企业的风险类型,以及所述风险企业的企业信息。
9.根据权利要求8所述的方法,其特征在于,当确定所述第二触发位置为所述产业链地图中与第二企业对应的标识位置时,利用预构建的网络中心度模型在所述产业链地图上,确定与所述第二企业具有关联关系的企业中的风险企业,包括:
利用预构建的网络中心度模型中的度中心性衡量体系,分别确定与所述第二企业具有关联关系的企业中每一个企业,与所述第二企业之间的供应链稳定性;和/或,
利用预构建的网络中心度模型中的特征向量中心度衡量体系,分别确定与所述第二企业具有关联关系的企业中每一个企业,与所述第二企业之间的产业链稳定性;和/或,
利用预构建的网络中心度模型中的中介中心度衡量体系,分别确定与所述第二企业具有关联关系的企业中每一个企业,与所述第二企业之间的产业链传播稳定性;
根据所述供应链稳定性,和/或所述产业链稳定性,和/或所述产业链传播稳定性,在所述产业链地图上,确定与所述第二企业具有关联关系的企业中的风险企业。
10.一种产业链地图构建装置,其特征在于,所述装置包括:
获取模块,用于获取目标行业的产业链上不同节点的节点数据,所述节点数据用以指示所述目标行业的不同类型的企业的第一原始企业数据;
处理模块,用于分别对每一类型的企业的第一原始企业数据进行预处理后,获取与每一类型的企业对应的目标结构化企业数据;
选择模块,用于根据所述目标结构化企业数据,从所述目标行业的不同类型的企业中,分别选取每一类型的目标企业;
创建模块,用于基于所述目标企业的目标结构化企业数据,创建三元关系组;
构建模块,用于根据所述三元关系组创建产业知识图谱,并根据所述产业知识图谱,构建所述目标行业的产业链地图。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-9任一项所述的产业链地图构建方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-9任一项所述的产业链地图构建方法的步骤。
CN202211572681.XA 2022-12-08 2022-12-08 一种产业链地图构建方法、装置及电子设备 Pending CN115795052A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211572681.XA CN115795052A (zh) 2022-12-08 2022-12-08 一种产业链地图构建方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211572681.XA CN115795052A (zh) 2022-12-08 2022-12-08 一种产业链地图构建方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN115795052A true CN115795052A (zh) 2023-03-14

Family

ID=85418019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211572681.XA Pending CN115795052A (zh) 2022-12-08 2022-12-08 一种产业链地图构建方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN115795052A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595698A (zh) * 2023-06-01 2023-08-15 华中科技大学 一种匹配区域产业链空间的交通网络优化方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595698A (zh) * 2023-06-01 2023-08-15 华中科技大学 一种匹配区域产业链空间的交通网络优化方法及系统

Similar Documents

Publication Publication Date Title
CN110704572B (zh) 疑似非法集资风险的预警方法、装置、设备和存储介质
US9990356B2 (en) Device and method for analyzing reputation for objects by data mining
CN104756106B (zh) 表征数据存储系统中的数据源
CN103491205B (zh) 一种基于视频搜索的关联资源地址的推送方法和装置
CN107657267B (zh) 产品潜在用户挖掘方法及装置
CN106067094A (zh) 一种动态评估方法及系统
CN111125343A (zh) 适用于人岗匹配推荐系统的文本解析方法及装置
CN112163424A (zh) 数据的标注方法、装置、设备和介质
CN111708774B (zh) 一种基于大数据的产业分析系统
CN103488746A (zh) 一种获取业务信息的方法及装置
CN107102993A (zh) 一种用户诉求分析方法和装置
CN103544299B (zh) 一种商业智能云计算系统的构建方法
CN108268624A (zh) 用户数据可视化方法及系统
CN111369294B (zh) 软件造价估算方法及装置
CN105975547A (zh) 基于内容与位置特征的近似web文档检测方法
CN116384889A (zh) 基于自然语言处理技术的情报大数据智能分析方法
CN101350019B (zh) 基于预定义槽间向量模型的网页信息抽取方法
CN115795052A (zh) 一种产业链地图构建方法、装置及电子设备
CN115312183A (zh) 医学检验报告智能解读方法及系统
CN115114448A (zh) 智能多模态融合用电检查方法、装置、系统、设备及介质
CN113592197A (zh) 一种家政服务推荐系统及方法
CN105138552A (zh) 一种挖掘在线销售数据的时尚趋势分析系统
CN109992723B (zh) 一种基于社交网络的用户兴趣标签构建方法及相关设备
CN115858598A (zh) 基于企业大数据的目标信息筛选匹配方法及相关设备
CN115544272A (zh) 基于注意力机制的化工事故原因知识图谱构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination