CN113590835A - 纺织行业数据的知识图谱构建方法、装置及处理器 - Google Patents
纺织行业数据的知识图谱构建方法、装置及处理器 Download PDFInfo
- Publication number
- CN113590835A CN113590835A CN202110842072.0A CN202110842072A CN113590835A CN 113590835 A CN113590835 A CN 113590835A CN 202110842072 A CN202110842072 A CN 202110842072A CN 113590835 A CN113590835 A CN 113590835A
- Authority
- CN
- China
- Prior art keywords
- data
- graph
- knowledge
- production
- textile industry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 239000004753 textile Substances 0.000 title claims abstract description 55
- 238000004519 manufacturing process Methods 0.000 claims abstract description 67
- 238000003860 storage Methods 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 230000008859 change Effects 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims description 34
- 239000002994 raw material Substances 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 13
- 238000011144 upstream manufacturing Methods 0.000 claims description 13
- 238000012544 monitoring process Methods 0.000 claims description 6
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000012800 visualization Methods 0.000 abstract description 4
- 230000000875 corresponding effect Effects 0.000 description 35
- 239000000047 product Substances 0.000 description 30
- 238000010586 diagram Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 230000003068 static effect Effects 0.000 description 4
- 238000013075 data extraction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012038 vulnerability analysis Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010225 co-occurrence analysis Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Software Systems (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Manufacturing & Machinery (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供一种纺织行业数据的知识图谱构建方法、装置、处理器及存储介质。方法包括:获取纺织行业的已有数据;对已有数据进行预处理,得到预处理后的已有数据;抽取预处理后的已有数据中的半结构化数据;利用信息抽取模型抽取预处理后的已有数据中的非结构化数据;根据预设业务问题确定半结构数据和非结构化数据中包含的概念、实体以及实体之间的关系,以构建对应的知识图谱。将生产关系和人工建模规则知识加入到图谱中,构建基于生产关系的动态图谱,使得对整个生产关系的变化能动态把握风险点,通过人工建模的推理知识实现关联搜索,通过全图或子图节点遍历实现全网络或子网络的可视化功能。
Description
技术领域
本申请涉及计算机技术领域,具体地涉及一种纺织行业数据的知识图谱构建方法、装置、存储介质及处理器。
背景技术
知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。现有技术中,往往采用传统数据库中的相对静态或缓慢更新的数据进行构建,但这些方式对一个动态系统来说参考意义非常有限,这是因为静态数据代表的是先验知识,对业务有一定的指导意义,但是对变化快速的经济行为无法快速反应。且,现有的知识图谱中并没有涉及到纺织行业的数据,导致无法可视化地对纺织行业的数据进行分析等。
发明内容
本申请实施例的目的是提供一种纺织行业数据的知识图谱构建方法、装置、存储介质及处理器。
为了实现上述目的,本申请第一方面提供一种纺织行业数据的知识图谱构建方法,包括:
获取纺织行业的已有数据;
对已有数据进行预处理,得到预处理后的已有数据;
抽取预处理后的已有数据中的半结构化数据;
利用信息抽取模型抽取预处理后的已有数据中的非结构化数据;
根据预设业务问题确定半结构数据和非结构化数据中包含的概念、实体以及实体之间的关系,以构建对应的知识图谱。
可选地,在一个实施例中,方法还包括:获取纺织行业的生产数据流;对生产数据流进行归集操作,以产生与预设业务问题对应的业务数据流;根据业务数据流对知识图谱进行更新。
可选地,对生产数据流进行归集操作包括:按照预设规则对生产数据流进行归并,以产生与预设业务问题对应的业务数据流;根据业务数据流确定知识图谱的计量数据,计量数据包括知识图谱的节点、边、权重和属性中的至少一者。
可选地,生产数据流为实时产生的生产数据;根据业务数据流对知识图谱进行更新包括:设置定时更新时间;按照定时更新时间,根据业务数据流对知识图谱进行更新。
可选地,对已有数据进行预处理,得到预处理后的已有数据包括:对已有数据中,字段存在缺失异常的数据进行缺失处理,缺失异常至少包括以下情况中的任意一者:字段存在缺失值;冗余字段存在缺失列;由于数据间的关联产生的冗余数据。
可选地,已有数据包括纺织行业中生产交易环节产生的交易数据,交易数据包括生产订单、交易订单、产品数据库中包含的交易上下游数据、生产的上下游、订单对应的原材料以及订单中包含的产品之间的关系中的至少一者。
可选地,方法还包括:根据已有数据中包含的交易数据;
确定交易数据对应的加工企业和采购商;获取加工企业和采购商的经营信息;根据经营信息的变化数据确定加工企业和采购商的风险因子;在风险因子超过预设阈值的情况下,监控知识图谱中与风险因子对应的产品。
本申请第二方面提供一种处理器,被配置成执行上述的纺织行业数据的知识图谱构建方法。
本申请第三方面提供一种纺织行业数据的知识图谱构建装置,包括上述的处理器。
本申请第四方面提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令在被处理器执行时使得所述处理器被配置成执行上述的纺织行业数据的知识图谱构建方法。
上述纺织行业数据的知识图谱构建方法,通过获取纺织行业的已有数据,对已有数据进行预处理,得到预处理后的已有数据,抽取预处理后的已有数据中的半结构化数据,利用信息抽取模型抽取预处理后的已有数据中的非结构化数据,根据预设业务问题确定半结构数据和非结构化数据中包含的概念、实体以及实体之间的关系,以构建对应的知识图谱。通过纺织知识图谱描述企业与产品之间以供求关系为主线的多种关系,包含产品、原料、买卖、企业等多个方面,基于该知识图谱及平台分析功能,决策者能够完成产品、原料来源和去向查询、产品、原料重要性辅助决策、企业重要性辅助决策等任务。同时,还将生产关系和人工建模规则知识加入到图谱中,构建基于生产关系的动态图谱,使得对整个生产关系的变化能动态把握风险点,通过人工建模的推理知识实现关联搜索,通过全图或子图节点遍历实现全网络或子网络的可视化功能。
本申请实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本申请实施例,但并不构成对本申请实施例的限制。在附图中:
图1示意性示出了根据本申请实施例的纺织行业数据的知识图谱构建方法的流程示意图;
图2示意性示出了根据本申请实施例的纺织行业数据的知识图谱构建装置的结构框图;
图3示意性示出了根据本申请实施例的计算机设备的内部结构图。
具体实施方式
以下结合附图对本申请实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本申请实施例,并不用于限制本申请实施例。
图1示意性示出了根据本申请实施例的纺织行业数据的知识图谱构建方法的流程示意图。如图1所示,在本申请一实施例中,提供了一种纺织行业数据的知识图谱构建方法,包括以下步骤:
步骤101,获取纺织行业的已有数据。
步骤102,对已有数据进行预处理,得到预处理后的已有数据。
步骤103,抽取预处理后的已有数据中的半结构化数据。
步骤104,利用信息抽取模型抽取预处理后的已有数据中的非结构化数据。
步骤105,根据预设业务问题确定半结构数据和非结构化数据中包含的概念、实体以及实体之间的关系,以构建对应的知识图谱。
知识图谱可以分为通用知识图谱和行业知识图谱。本申请中涉及的知识图谱指的是行业知识图谱。可以获取的是纺织行业的已有数据,已有数据可以是指生产交易环节所产生的数据,包括从生产订单、交易订单、产品类库中抽取的交易上下游、生产上下游、原材料与产品关系等数据。节点包括采购商、加工厂、产品及其概念节点(布料知识、原料知识)。在获取到纺织行业的已有数据后,可以对已有数据进行预处理,以得到预处理后的已有数据。
在一个实施例中,对已有数据进行预处理,得到预处理后的已有数据包括:对已有数据中,字段存在缺失异常的数据进行缺失处理,缺失异常至少包括以下情况中的任意一者:字段存在缺失值;冗余字段存在缺失列;由于数据间的关联产生的冗余数据。
在获取到纺织行业的已有数据后,可以对数据进行整合,对数据内部进行关联,并对数据进行加工处理。具体地,可以针对字段存在缺失值的数据,或冗余字段存在缺失列的数据,或由于数据间的关联产生的冗余数据等,进行缺失处理。例如根据业务逻辑进行填充或对冗余数据进行删除等。
进一步地,由于获取到的已有数据可以分为三类,分别为结构化数据、半结构化数据和非结构化数据。通常,结构化数据存储在关系型数据库及非关系型数据库中,可以通过d2r技术将结构化数据转化为rdf数据,以完成知识图谱的构建。半结构化数据指的是具有一定的数据结构、需要进一步分析才能获取的数据,比如百科数据、网页数据等。对于这类数据,可以定制化地分析数据结构,采用正则表达式或网页的爬取分析手段,将数据转化为结构化数据,从而形成知识图谱。而对于非结构数据,因为其数据的非结构化,一般不能直接通过简单地分析转化为结构化数据。通常,对于非结构化数据,通过设计信息抽取模型,可以提取出其中的实体,比如人名、地名、组织结构名、时间等,以及各个实体之间的关系,从而尝试着形成知识图谱,作为一种数据的补充。
因此,可以针对预处理后的已有数据中的半结构化数据进行数据抽取,例如可以构建网络采集引擎,构建网页提取器对半结构化数据进行抽取。并利用信息抽取模型抽取预处理后的已有数据中的非结构化数据,同时根据预设的业务问题确定出半结构数据和非结构化数据中包含的概念、实体以及实体之间的关系,以构建出纺织行业的行业知识所对应的知识图谱。其中,预设的业务问题可以包括但不限于可视化链路关系、别名查询、企业脆弱性分析、产品脆弱性分析、转折点分析、原料或产品涨价影响分析、不一致性检验、企业相似性等。
在一个实施例中,方法还包括:获取纺织行业的生产数据流;对生产数据流进行归集操作,以产生与预设业务问题对应的业务数据流;根据业务数据流对知识图谱进行更新。
在生产过程中,时刻都在产生数据,即数据会实时进行更新。处理器可以依据设定的逻辑将流水数据进行归并,即进行归集操作,统计成图谱所需的计量数据,即可产生产生与预设业务问题对应的业务数据流,如次数、比例等,最终表现为图谱中的点、边、权重、属性,即可以根据业务数据流对知识图谱进行更新。进一步地,对生产数据流进行归集操作包括:按照预设规则对生产数据流进行归并,以产生与预设业务问题对应的业务数据流;根据业务数据流确定知识图谱的计量数据,计量数据包括知识图谱的节点、边、权重和属性中的至少一者。具体地,生产数据流为实时产生的生产数据;根据业务数据流对知识图谱进行更新包括:设置定时更新时间;按照定时更新时间,根据业务数据流对知识图谱进行更新。
在一个实施例中,方法还包括:根据已有数据中包含的交易数据;
确定交易数据对应的加工企业和采购商;获取加工企业和采购商的经营信息;根据经营信息的变化数据确定加工企业和采购商的风险因子;在风险因子超过预设阈值的情况下,监控知识图谱中与风险因子对应的产品。
具体地,还可以从生产交易环节所产生的数据中能提取出加工企业、采购商,这两种节点结合从互联网获取的企业商事信息,将经营信息的时序变化(如异常信息的数量)建模成风险因子,以此可以监控其平台以外的经营状态。交易生产环节还可提取出产品信息,通过引入专家知识,将产品解构成上游原料成份信息,形成概念,这种解构的方式,结合产品在生产交易网络中的位置,能更好地衡量产品间的相近性。
上述纺织行业数据的知识图谱构建方法,通过获取纺织行业的已有数据,对已有数据进行预处理,得到预处理后的已有数据,抽取预处理后的已有数据中的半结构化数据,利用信息抽取模型抽取预处理后的已有数据中的非结构化数据,根据预设业务问题确定半结构数据和非结构化数据中包含的概念、实体以及实体之间的关系,以构建对应的知识图谱。通过纺织知识图谱描述企业与产品之间以供求关系为主线的多种关系,包含产品、原料、买卖、企业等多个方面,基于该知识图谱及平台分析功能,决策者能够完成产品、原料来源和去向查询、产品、原料重要性辅助决策、企业重要性辅助决策等任务。同时,还将生产关系和人工建模规则知识加入到图谱中,构建基于生产关系的动态图谱,使得对整个生产关系的变化能动态把握风险点,通过人工建模的推理知识实现关联搜索,通过全图或子图节点遍历实现全网络或子网络的可视化功能。
在一个实施例中,如图2所示,提供了一种纺织行业数据的知识图谱构建装置,包括:
数据获取模块201,用于获取纺织行业的已有数据。
数据处理模块202,用于对已有数据进行预处理,得到预处理后的已有数据。
数据抽取模块203,用于抽取预处理后的已有数据中的半结构化数据;利用信息抽取模型抽取预处理后的已有数据中的非结构化数据;
知识图谱建立模块204,用于根据预设业务问题确定半结构数据和非结构化数据中包含的概念、实体以及实体之间的关系,以构建对应的知识图谱。
在一个实施例中,上述纺织行业数据的知识图谱构建装置还包括数据更新模块(图中未示出),用于获取纺织行业的生产数据流;对生产数据流进行归集操作,以产生与预设业务问题对应的业务数据流;根据业务数据流对知识图谱进行更新。
在一个实施例中,数据更新模块还用于按照预设规则对生产数据流进行归并,以产生与预设业务问题对应的业务数据流;根据业务数据流确定知识图谱的计量数据,计量数据包括知识图谱的节点、边、权重和属性中的至少一者。
在一个实施例中,生产数据流为实时产生的生产数据。数据更新模块还用于设置定时更新时间;按照定时更新时间,根据业务数据流对知识图谱进行更新。
在一个实施例中,数据处理模块202还用于对已有数据中,字段存在缺失异常的数据进行缺失处理,缺失异常至少包括以下情况中的任意一者:字段存在缺失值;冗余字段存在缺失列;由于数据间的关联产生的冗余数据。
在一个实施例中,已有数据包括纺织行业中生产交易环节产生的交易数据,交易数据包括生产订单、交易订单、产品数据库中包含的交易上下游数据、生产的上下游、订单对应的原材料以及订单中包含的产品之间的关系中的至少一者。
在一个实施例中,数据获取模块201还用于根据已有数据中包含的交易数据;确定交易数据对应的加工企业和采购商;获取加工企业和采购商的经营信息;根据经营信息的变化数据确定加工企业和采购商的风险因子;在风险因子超过预设阈值的情况下,监控知识图谱中与风险因子对应的产品。
纺织行业数据的知识图谱构建装置包括处理器和存储器,上述数据获取模块、数据处理模块、数据抽取模块和知识图谱建立模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序模块中实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现纺织行业数据的知识图谱构建方法。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现上述纺织行业数据的知识图谱构建方法。
本申请实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述纺织行业数据的知识图谱构建方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器A01、网络接口A02、存储器(图中未示出)和数据库(图中未示出)。其中,该计算机设备的处理器A01用于提供计算和控制能力。该计算机设备的存储器包括内存储器A03和非易失性存储介质A04。该非易失性存储介质A04存储有操作系统B01、计算机程序B02和数据库(图中未示出)。该内存储器A03为非易失性存储介质A04中的操作系统B01和计算机程序B02的运行提供环境。该计算机设备的数据库用于存储纺织行业的已有数据。该计算机设备的网络接口A02用于与外部的终端通过网络连接通信。该计算机程序B02被处理器A01执行时以实现一种纺织行业数据的知识图谱构建方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本申请实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取纺织行业的已有数据;对已有数据进行预处理,得到预处理后的已有数据;抽取预处理后的已有数据中的半结构化数据;利用信息抽取模型抽取预处理后的已有数据中的非结构化数据;根据预设业务问题确定半结构数据和非结构化数据中包含的概念、实体以及实体之间的关系,以构建对应的知识图谱。
在一个实施例中,方法还包括:获取纺织行业的生产数据流;对生产数据流进行归集操作,以产生与预设业务问题对应的业务数据流;根据业务数据流对知识图谱进行更新。
在一个实施例中,对生产数据流进行归集操作包括:按照预设规则对生产数据流进行归并,以产生与预设业务问题对应的业务数据流;根据业务数据流确定知识图谱的计量数据,计量数据包括知识图谱的节点、边、权重和属性中的至少一者。
在一个实施例中,生产数据流为实时产生的生产数据;根据业务数据流对知识图谱进行更新包括:设置定时更新时间;按照定时更新时间,根据业务数据流对知识图谱进行更新。
在一个实施例中,对已有数据进行预处理,得到预处理后的已有数据包括:对已有数据中,字段存在缺失异常的数据进行缺失处理,缺失异常至少包括以下情况中的任意一者:字段存在缺失值;冗余字段存在缺失列;由于数据间的关联产生的冗余数据。
在一个实施例中,已有数据包括纺织行业中生产交易环节产生的交易数据,交易数据包括生产订单、交易订单、产品数据库中包含的交易上下游数据、生产的上下游、订单对应的原材料以及订单中包含的产品之间的关系中的至少一者。
在一个实施例中,方法还包括:根据已有数据中包含的交易数据;
确定交易数据对应的加工企业和采购商;获取加工企业和采购商的经营信息;根据经营信息的变化数据确定加工企业和采购商的风险因子;在风险因子超过预设阈值的情况下,监控知识图谱中与风险因子对应的产品。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取纺织行业的已有数据;对已有数据进行预处理,得到预处理后的已有数据;抽取预处理后的已有数据中的半结构化数据;利用信息抽取模型抽取预处理后的已有数据中的非结构化数据;根据预设业务问题确定半结构数据和非结构化数据中包含的概念、实体以及实体之间的关系,以构建对应的知识图谱。
在一个实施例中,方法还包括:获取纺织行业的生产数据流;对生产数据流进行归集操作,以产生与预设业务问题对应的业务数据流;根据业务数据流对知识图谱进行更新。
在一个实施例中,对生产数据流进行归集操作包括:按照预设规则对生产数据流进行归并,以产生与预设业务问题对应的业务数据流;根据业务数据流确定知识图谱的计量数据,计量数据包括知识图谱的节点、边、权重和属性中的至少一者。
在一个实施例中,生产数据流为实时产生的生产数据;根据业务数据流对知识图谱进行更新包括:设置定时更新时间;按照定时更新时间,根据业务数据流对知识图谱进行更新。
在一个实施例中,对已有数据进行预处理,得到预处理后的已有数据包括:对已有数据中,字段存在缺失异常的数据进行缺失处理,缺失异常至少包括以下情况中的任意一者:字段存在缺失值;冗余字段存在缺失列;由于数据间的关联产生的冗余数据。
在一个实施例中,已有数据包括纺织行业中生产交易环节产生的交易数据,交易数据包括生产订单、交易订单、产品数据库中包含的交易上下游数据、生产的上下游、订单对应的原材料以及订单中包含的产品之间的关系中的至少一者。
在一个实施例中,方法还包括:根据已有数据中包含的交易数据;
确定交易数据对应的加工企业和采购商;获取加工企业和采购商的经营信息;根据经营信息的变化数据确定加工企业和采购商的风险因子;在风险因子超过预设阈值的情况下,监控知识图谱中与风险因子对应的产品。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种纺织行业数据的知识图谱构建方法,其特征在于,所述方法包括:
获取纺织行业的已有数据;
对所述已有数据进行预处理,得到预处理后的已有数据;
抽取所述预处理后的已有数据中的半结构化数据;
利用信息抽取模型抽取所述预处理后的已有数据中的非结构化数据;
根据预设业务问题确定所述半结构数据和所述非结构化数据中包含的概念、实体以及实体之间的关系,以构建对应的知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述纺织行业的生产数据流;
对所述生产数据流进行归集操作,以产生与所述预设业务问题对应的业务数据流;
根据所述业务数据流对所述知识图谱进行更新。
3.根据权利要求2所述的方法,其特征在于,所述对所述生产数据流进行归集操作包括:
按照预设规则对所述生产数据流进行归并,以产生与所述预设业务问题对应的业务数据流;
根据业务数据流确定所述知识图谱的计量数据,所述计量数据包括所述知识图谱的节点、边、权重和属性中的至少一者。
4.根据权利要求3所述的方法,其特征在于,所述生产数据流为实时产生的生产数据;所述根据所述业务数据流对所述知识图谱进行更新包括:
设置定时更新时间;
按照所述定时更新时间,根据所述业务数据流对所述知识图谱进行更新。
5.根据权利要求1所述的方法,其特征在于,所述对所述已有数据进行预处理,得到预处理后的已有数据包括:
对所述已有数据中,字段存在缺失异常的数据进行缺失处理,所述缺失异常至少包括以下情况中的任意一者:
字段存在缺失值;
冗余字段存在缺失列;
由于数据间的关联产生的冗余数据。
6.根据权利要求1所述的方法,其特征在于,所述已有数据包括纺织行业中生产交易环节产生的交易数据,所述交易数据包括生产订单、交易订单、产品数据库中包含的交易上下游数据、生产的上下游、订单对应的原材料以及订单中包含的产品之间的关系中的至少一者。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
根据所述已有数据中包含的交易数据;
确定所述交易数据对应的加工企业和采购商;
获取所述加工企业和所述采购商的经营信息;
根据所述经营信息的变化数据确定所述加工企业和所述采购商的风险因子;
在所述风险因子超过预设阈值的情况下,
监控所述知识图谱中与所述风险因子对应的产品。
8.一种处理器,其特征在于,被配置成执行根据权利要求1至7中任意一项所述的纺织行业数据的知识图谱构建方法。
9.一种纺织行业数据的知识图谱构建装置,其特征在于,包括根据权利要求8所述的处理器。
10.一种机器可读存储介质,该机器可读存储介质上存储有指令,其特征在于,该指令在被处理器执行时使得所述处理器被配置成执行根据权利要求1至7中任一项所述的纺织行业数据的知识图谱构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110842072.0A CN113590835A (zh) | 2021-07-28 | 2021-07-28 | 纺织行业数据的知识图谱构建方法、装置及处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110842072.0A CN113590835A (zh) | 2021-07-28 | 2021-07-28 | 纺织行业数据的知识图谱构建方法、装置及处理器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113590835A true CN113590835A (zh) | 2021-11-02 |
Family
ID=78249930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110842072.0A Pending CN113590835A (zh) | 2021-07-28 | 2021-07-28 | 纺织行业数据的知识图谱构建方法、装置及处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113590835A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117009452A (zh) * | 2023-07-25 | 2023-11-07 | 浪潮智慧科技有限公司 | 一种水文业务数据获取方法、设备及介质 |
CN117648975A (zh) * | 2023-12-19 | 2024-03-05 | 北京侏罗纪软件股份有限公司 | 一种基于石油业务模型的油气企业知识图谱构建方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197280A (zh) * | 2019-05-20 | 2019-09-03 | 中国银行股份有限公司 | 一种知识图谱构建方法、装置及系统 |
CN110503236A (zh) * | 2019-07-08 | 2019-11-26 | 中国平安人寿保险股份有限公司 | 基于知识图谱的风险预测方法、装置、设备以及存储介质 |
WO2020143326A1 (zh) * | 2019-01-11 | 2020-07-16 | 平安科技(深圳)有限公司 | 知识数据存储方法、装置、计算机设备和存储介质 |
CN111832922A (zh) * | 2020-06-30 | 2020-10-27 | 北方工业大学 | 基于知识图谱推理的食品安全事件风险研判方法及装置 |
WO2020253358A1 (zh) * | 2019-06-18 | 2020-12-24 | 深圳壹账通智能科技有限公司 | 业务数据的风控分析处理方法、装置和计算机设备 |
CN112507136A (zh) * | 2020-12-18 | 2021-03-16 | 南京摄星智能科技有限公司 | 一种知识驱动的业务操作图谱构建方法 |
CN112580831A (zh) * | 2020-11-19 | 2021-03-30 | 国网江苏省电力有限公司信息通信分公司 | 一种基于知识图谱的电力通信网智能辅助运维方法及系统 |
-
2021
- 2021-07-28 CN CN202110842072.0A patent/CN113590835A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020143326A1 (zh) * | 2019-01-11 | 2020-07-16 | 平安科技(深圳)有限公司 | 知识数据存储方法、装置、计算机设备和存储介质 |
CN110197280A (zh) * | 2019-05-20 | 2019-09-03 | 中国银行股份有限公司 | 一种知识图谱构建方法、装置及系统 |
WO2020253358A1 (zh) * | 2019-06-18 | 2020-12-24 | 深圳壹账通智能科技有限公司 | 业务数据的风控分析处理方法、装置和计算机设备 |
CN110503236A (zh) * | 2019-07-08 | 2019-11-26 | 中国平安人寿保险股份有限公司 | 基于知识图谱的风险预测方法、装置、设备以及存储介质 |
CN111832922A (zh) * | 2020-06-30 | 2020-10-27 | 北方工业大学 | 基于知识图谱推理的食品安全事件风险研判方法及装置 |
CN112580831A (zh) * | 2020-11-19 | 2021-03-30 | 国网江苏省电力有限公司信息通信分公司 | 一种基于知识图谱的电力通信网智能辅助运维方法及系统 |
CN112507136A (zh) * | 2020-12-18 | 2021-03-16 | 南京摄星智能科技有限公司 | 一种知识驱动的业务操作图谱构建方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117009452A (zh) * | 2023-07-25 | 2023-11-07 | 浪潮智慧科技有限公司 | 一种水文业务数据获取方法、设备及介质 |
CN117648975A (zh) * | 2023-12-19 | 2024-03-05 | 北京侏罗纪软件股份有限公司 | 一种基于石油业务模型的油气企业知识图谱构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11327935B2 (en) | Intelligent data quality | |
US10564993B2 (en) | Contextual digital twin runtime environment | |
US20190340518A1 (en) | Systems and methods for enriching modeling tools and infrastructure with semantics | |
JP2016015124A (ja) | コンピュータ装置、処理方法及びコンピュータプログラム | |
US20170109636A1 (en) | Crowd-Based Model for Identifying Executions of a Business Process | |
JP2016517984A (ja) | Javaヒープ使用量の季節的傾向把握、予想、異常検出、エンドポイント予測 | |
US10185714B2 (en) | Smart terminology marker system for a language translation system | |
CN113590835A (zh) | 纺织行业数据的知识图谱构建方法、装置及处理器 | |
US20170109639A1 (en) | General Model for Linking Between Nonconsecutively Performed Steps in Business Processes | |
US11093535B2 (en) | Data preprocessing using risk identifier tags | |
Jun et al. | Cloud-based big data analytics platform using algorithm templates for the manufacturing industry | |
KR101888637B1 (ko) | 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템 | |
Bourezza et al. | Towards a platform to implement an intelligent and predictive maintenance in the context of industry 4.0 | |
CN114780798A (zh) | 基于bim的知识图谱系统 | |
Idris et al. | Managing Data Source quality for data warehouse in manufacturing services | |
US20170109637A1 (en) | Crowd-Based Model for Identifying Nonconsecutive Executions of a Business Process | |
US20170109670A1 (en) | Crowd-Based Patterns for Identifying Executions of Business Processes | |
Grambau et al. | Reference Architecture framework for enhanced social media data analytics for Predictive Maintenance models | |
Paim et al. | Enhancing Data Warehouse Design with the NFR Framework. | |
CN115730086A (zh) | 构建工程机械故障诊断知识图谱本体的方法及装置 | |
Schmidt et al. | Enterprise architecture analytics and decision support | |
Penttinen et al. | Advanced fault tree analysis for improved quality and risk assessment | |
Cacciabue | Dynamic reliability and human factors for safety assessment of technological systems: a modern science rooted in the origin of mankind | |
CN113743695A (zh) | 基于大数据的国际工程项目投标报价风险管理方法 | |
US20200090185A1 (en) | Product declaration validation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |