CN115455192B - 一种基于定制柜体工艺知识图谱的数据处理方法以及系统 - Google Patents
一种基于定制柜体工艺知识图谱的数据处理方法以及系统 Download PDFInfo
- Publication number
- CN115455192B CN115455192B CN202210982244.9A CN202210982244A CN115455192B CN 115455192 B CN115455192 B CN 115455192B CN 202210982244 A CN202210982244 A CN 202210982244A CN 115455192 B CN115455192 B CN 115455192B
- Authority
- CN
- China
- Prior art keywords
- product
- attribute
- knowledge graph
- data
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0621—Item configuration or customization
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于定制柜体工艺知识图谱的数据处理方法以及系统,方法包括:获取家居产品定制的历史产品信息,历史产品信息包括各类产品的多维度属性数据和生产工艺数据;针对每一类产品的历史产品信息,进行名词对齐并提取出产品的主要内容;根据产品的主要内容进行知识图谱建模,利用条件逻辑词对数据中的规则限制进行分词,然后将分词得到的规则限制编码成知识图谱上的边进行表述,得到家居产品知识图谱;根据家居产品知识图谱进行家居产品数据管理。本发明能够改善产品数据的查询和管理耗时,降低柜类产品数据的维护难度,可广泛应用于计算机技术领域。
Description
技术领域
本发明涉及计算机技术领域,尤其是一种基于定制柜体工艺知识图谱的数据处理方法以及系统。
背景技术
随着生活水平的不断提高,人们对于家居环境的生活体验越来越重视,个性化定制的家居产品成为了新时代宠儿。但在数字化的今天,个性化定制家居产品的工艺、配套、自定义属性等数据信息过于繁杂,仅依靠传统的关系型数据进行记录和备案,既不便于管理端的维护,也不利于生产端的使用。
目前上面上大部分的产品知识图谱,在自底向上构建时都需要依靠大量的人工操作才能完成数据的实体关系提取,其中《一种产品知识图谱构建和查询方法及系统》提供了一种提取产品数据中的多个概念信息、概念属性及多个概念之间的关系信息的知识图谱构建方法,并实现了查询应用。但是,该方法也仅仅能够处理无复杂工艺的产品,在柜类产品中,亦无法很好地处理其工艺限制等规则。在特定领域里,例如《司法知识图谱构建以及基于司法知识图谱搜索方法与装置》提供了一种构建司法知识图谱和搜索的方法;《基于金融产品知识图谱实现关联搜索的方法、装置、处理器及其存储介质》提供了一种构建金融产品知识图谱和搜索的方法;《医疗知识图谱建立方法及装置、医疗知识图谱查询方法及装置》则是提供了一种构建医疗知识图谱和搜索的方法。
尽管上述知识图谱的构建和查询方法及系统在流程上大同小异,但他们更多的只是将已有的产品数据转换成知识图谱的形式,从而实现易于展示和实现简单的一级查询,这些方法对于定制家居的场景中具有复杂工艺规则限制的定制柜类产品数据则作用有限,它们都无法很好地表达出复杂的工艺规则限制,以及难以进行具有多级限制条件的查询功能。
发明内容
有鉴于此,本发明实施例提供一种基于定制柜体工艺知识图谱的数据处理方法以及系统,以改善产品数据的查询和管理耗时,降低柜类产品数据的维护难度。
本发明实施例的一方面提供了一种基于定制柜体工艺知识图谱的数据处理方法,包括:
获取家居产品定制的历史产品信息,所述历史产品信息包括各类产品的多维度属性数据和生产工艺数据;
针对每一类产品的历史产品信息,进行名词对齐并提取出产品的主要内容;
根据所述产品的主要内容进行知识图谱建模,利用条件逻辑词对数据中的规则限制进行分词,然后将分词得到的规则限制编码成知识图谱上的边进行表述,得到家居产品知识图谱;
根据所述家居产品知识图谱进行家居产品数据管理;
其中,所述家居产品数据管理包括以下至少之一:基于可视化的知识图谱的宏观数据分析和管理、基于知识图谱的柜体定制搜索、基于知识图谱的柜体定制属性修改。
可选地,所述获取家居产品定制的历史产品信息,包括:
获取全屋定制设计方案和家居单独定制方案中家居产品的生产销售信息;
从所述生产销售信息中提取家居产品的产品逻辑表和工艺数据记录。
可选地,所述针对每一类产品的历史产品信息,进行名词对齐并提取出产品的主要内容,具体为:针对每一份产品逻辑表和工艺数据记录,进行名词对齐并提取出相关产品的主要内容,该步骤包括:
将所有基础属性信息和规则限制分别以键值对的方式存储到不同位置;其中,产品逻辑表以表格的形式存在,产品逻辑表内的每一行是一个具体的产品实例,每一列表述了该产品的属性信息,所述属性信息包括以下至少之一:类型、名称、图示、编码、尺寸、材质、颜色;每个柜体都有自己的属性可选项规则限制;
利用命名实体识别模型对工艺数据记录中的工艺信息条例进行分词提取,获取实体语料,其中,实体语料包括产品实体和产品属性;
对存在一意多词类型的名词进行对齐,将对齐后的产品逻辑表和工艺数据串联起来;
汇总得到各个产品的产品数据表,所述产品数据表的结构格式为:序号+一级品类+二级种类+三级产品+三级属性键值+二级属性名称+一级属性类别+规则限制。
可选地,所述根据所述产品的主要内容进行知识图谱建模,包括:
准备六种不同类型的节点,其中,六种类型分别是:一级品类、二级种类、三级产品、三级属性键值、二级属性名称、一级属性类别;
遍历所述产品的主要内容描述的结果,创建每种类型的节点;
合并每个意义相同的节点;
将一级品类节点和二级种类节点进行连边处理、将二级种类节点和三级产品节点进行连边处理、将三级产品节点和三级属性键值节点进行连边处理、将三级属性键值节点和二级属性名称节点进行连边处理,将二级属性名称节点和一级属性类别节点进行连边处理;
筛查知识图谱中冗余或错误的地方,并对冗余或错误的地方进行修正;
将一意多词的多个名词合并成一个具有共同意思的节点,将所述多个名词作为该节点的属性进行储存,实现向历史数据的兼容;
完成产品基础知识图谱构建。
可选地,所述利用条件逻辑词对数据中的规则限制进行分词,包括:
将所述产品基础知识图谱与所述产品数据表中一意多词的各个名词进行合并;
遍历所述产品数据表中保留包含规则限制的结果,得到所有针对属性的规则限制列表。
可选地,所述将分词得到的规则限制编码成知识图谱上的边进行表述,得到家居产品知识图谱,包括:
配置条件逻辑词,所述条件逻辑词包括:“当”、“和”、“且”、“或”、“时”;
根据所述条件逻辑词,对规则限制在所述产品基础知识图谱上加入条件限制边;
根据条件限制边的加入结果,得到家居产品知识图谱;
其中,所述规则限制中的工艺限制包括以下六种:
(1)当属性A被选中时,可选属性T;
(2)当属性A被选中时,不可选属性T;
(3)当属性A和属性B被选中时,可选属性T;
(4)当属性A和属性B被选中时,不可选属性T;
(5)当属性A或属性B被选中时,可选属性T;
(6)当属性A或属性B被选中时,不可选属性T。
可选地,所述基于可视化的知识图谱的宏观数据分析和管理,包括:
利用可视化的知识图谱直观显示目前的柜体种类、柜体数量以各个柜体系列之间的联系;
利用可视化的知识图谱显示持续推出的新品和淘汰柜体的单品和系类;
所述基于知识图谱的柜体定制搜索,包括:
搜索到需要定制的柜体,建立产品属性列表;
遍历对应节点所有连接的可选项边和默认选项边,加入到所述产品属性列表上;
遍历所有默认选项边,查看它们所连接的条件限制边,得到它们所指向的限制属性,从所述产品属性列表中移除这些被限制的属性,完成搜索;
所述基于知识图谱的柜体定制属性修改,包括:
修改其中一个属性;
在知识图谱上搜索该属性节点;
查看该属性所连接的条件限制边,得到它所指向的限制属性,从产品属性列表中移除这些被限制的属性,完成修改。
本发明实施例的另一方面还提供了一种基于定制柜体工艺知识图谱的数据处理系统,包括:
第一模块,用于获取家居产品定制的历史产品信息,所述历史产品信息包括各类产品的多维度属性数据和生产工艺数据;
第二模块,用于针对每一类产品的历史产品信息,进行名词对齐并提取出产品的主要内容;
第三模块,用于根据所述产品的主要内容进行知识图谱建模,利用条件逻辑词对数据中的规则限制进行分词,然后将分词得到的规则限制编码成知识图谱上的边进行表述,得到家居产品知识图谱;
第四模块,用于根据所述家居产品知识图谱进行家居产品数据管理;
其中,所述家居产品数据管理包括以下至少之一:基于可视化的知识图谱的宏观数据分析和管理、基于知识图谱的柜体定制搜索、基于知识图谱的柜体定制属性修改。
本发明实施例的另一方面还提供了一种电子设备,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如前面所述的方法。
本发明实施例的另一方面还提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现如前面所述的方法。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
本发明的实施例获取家居产品定制的历史产品信息,所述历史产品信息包括各类产品的多维度属性数据和生产工艺数据;针对每一类产品的历史产品信息,进行名词对齐并提取出产品的主要内容;根据所述产品的主要内容进行知识图谱建模,利用条件逻辑词对数据中的规则限制进行分词,然后将分词得到的规则限制编码成知识图谱上的边进行表述,得到家居产品知识图谱;根据所述家居产品知识图谱进行家居产品数据管理;其中,所述家居产品数据管理包括以下至少之一:基于可视化的知识图谱的宏观数据分析和管理、基于知识图谱的柜体定制搜索、基于知识图谱的柜体定制属性修改。本发明能够改善产品数据的查询和管理耗时,降低柜类产品数据的维护难度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的整体步骤流程图;
图2为本发明实施例提供的柜类工艺知识构建流程图;
图3为本发明实施例提供的家居产品知识图谱的示例图;
图4为本发明实施例提供的知识图谱的管理和查询过程的流程图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
针对现有技术存在的问题,本发明实施例的一方面提供了一种基于定制柜体工艺知识图谱的数据处理方法,如图1所示,方法包括:
获取家居产品定制的历史产品信息,所述历史产品信息包括各类产品的多维度属性数据和生产工艺数据;
针对每一类产品的历史产品信息,进行名词对齐并提取出产品的主要内容;
根据所述产品的主要内容进行知识图谱建模,利用条件逻辑词对数据中的规则限制进行分词,然后将分词得到的规则限制编码成知识图谱上的边进行表述,得到家居产品知识图谱;
根据所述家居产品知识图谱进行家居产品数据管理;
其中,所述家居产品数据管理包括以下至少之一:基于可视化的知识图谱的宏观数据分析和管理、基于知识图谱的柜体定制搜索、基于知识图谱的柜体定制属性修改。
可选地,所述获取家居产品定制的历史产品信息,包括:
获取全屋定制设计方案和家居单独定制方案中家居产品的生产销售信息;
从所述生产销售信息中提取家居产品的产品逻辑表和工艺数据记录。
可选地,所述针对每一类产品的历史产品信息,进行名词对齐并提取出产品的主要内容,具体为:针对每一份产品逻辑表和工艺数据记录,进行名词对齐并提取出相关产品的主要内容,该步骤包括:
将所有基础属性信息和规则限制分别以键值对的方式存储到不同位置;其中,产品逻辑表以表格的形式存在,产品逻辑表内的每一行是一个具体的产品实例,每一列表述了该产品的属性信息,所述属性信息包括以下至少之一:类型、名称、图示、编码、尺寸、材质、颜色;每个柜体都有自己的属性可选项规则限制;
利用命名实体识别模型对工艺数据记录中的工艺信息条例进行分词提取,获取实体语料,其中,实体语料包括产品实体和产品属性;
对存在一意多词类型的名词进行对齐,将对齐后的产品逻辑表和工艺数据串联起来;
汇总得到各个产品的产品数据表,所述产品数据表的结构格式为:序号+一级品类+二级种类+三级产品+三级属性键值+二级属性名称+一级属性类别+规则限制。
可选地,所述根据所述产品的主要内容进行知识图谱建模,包括:
准备六种不同类型的节点,其中,六种类型分别是:一级品类、二级种类、三级产品、三级属性键值、二级属性名称、一级属性类别;
遍历所述产品的主要内容描述的结果,创建每种类型的节点;
合并每个意义相同的节点;
将一级品类节点和二级种类节点进行连边处理、将二级种类节点和三级产品节点进行连边处理、将三级产品节点和三级属性键值节点进行连边处理、将三级属性键值节点和二级属性名称节点进行连边处理,将二级属性名称节点和一级属性类别节点进行连边处理;
筛查知识图谱中冗余或错误的地方,并对冗余或错误的地方进行修正;
将一意多词的多个名词合并成一个具有共同意思的节点,将所述多个名词作为该节点的属性进行储存,实现向历史数据的兼容;
完成产品基础知识图谱构建。
可选地,所述利用条件逻辑词对数据中的规则限制进行分词,包括:
将所述产品基础知识图谱与所述产品数据表中一意多词的各个名词进行合并;
遍历所述产品数据表中保留包含规则限制的结果,得到所有针对属性的规则限制列表。
可选地,所述将分词得到的规则限制编码成知识图谱上的边进行表述,得到家居产品知识图谱,包括:
配置条件逻辑词,所述条件逻辑词包括:“当”、“和”、“且”、“或”、“时”;
根据所述条件逻辑词,对规则限制在所述产品基础知识图谱上加入条件限制边;
根据条件限制边的加入结果,得到家居产品知识图谱;
其中,所述规则限制中的工艺限制包括以下六种:
(1)当属性A被选中时,可选属性T;
(2)当属性A被选中时,不可选属性T;
(3)当属性A和属性B被选中时,可选属性T;
(4)当属性A和属性B被选中时,不可选属性T;
(5)当属性A或属性B被选中时,可选属性T;
(6)当属性A或属性B被选中时,不可选属性T。
可选地,所述基于可视化的知识图谱的宏观数据分析和管理,包括:
利用可视化的知识图谱直观显示目前的柜体种类、柜体数量以各个柜体系列之间的联系;
利用可视化的知识图谱显示持续推出的新品和淘汰柜体的单品和系类;
所述基于知识图谱的柜体定制搜索,包括:
搜索到需要定制的柜体,建立产品属性列表;
遍历对应节点所有连接的可选项边和默认选项边,加入到所述产品属性列表上;
遍历所有默认选项边,查看它们所连接的条件限制边,得到它们所指向的限制属性,从所述产品属性列表中移除这些被限制的属性,完成搜索;
所述基于知识图谱的柜体定制属性修改,包括:
修改其中一个属性;
在知识图谱上搜索该属性节点;
查看该属性所连接的条件限制边,得到它所指向的限制属性,从产品属性列表中移除这些被限制的属性,完成修改。
本发明实施例的另一方面还提供了一种基于定制柜体工艺知识图谱的数据处理系统,包括:
第一模块,用于获取家居产品定制的历史产品信息,所述历史产品信息包括各类产品的多维度属性数据和生产工艺数据;
第二模块,用于针对每一类产品的历史产品信息,进行名词对齐并提取出产品的主要内容;
第三模块,用于根据所述产品的主要内容进行知识图谱建模,利用条件逻辑词对数据中的规则限制进行分词,然后将分词得到的规则限制编码成知识图谱上的边进行表述,得到家居产品知识图谱;
第四模块,用于根据所述家居产品知识图谱进行家居产品数据管理;
其中,所述家居产品数据管理包括以下至少之一:基于可视化的知识图谱的宏观数据分析和管理、基于知识图谱的柜体定制搜索、基于知识图谱的柜体定制属性修改。
本发明实施例的另一方面还提供了一种电子设备,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如前面所述的方法。
本发明实施例的另一方面还提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现如前面所述的方法。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
下面结合说明书附图,对本发明的具体实施过程进行详细描述:
目前,家居产品的数据管理主要采用关系型数据结构来进行归纳和整理,针对具体产品的组成部分和工艺链条很难高效地显示地进行表述。首先,在关系型数据结构中,记录某一类产品实例的时候需要将该产品的组成部件和配套工艺逐一记录在一条数据中,而组成部件和配套工艺的详细属性信息需要分别进一步去查询才能获得,因此在进行产品信息调用的时候会经过大量而频繁的查询过程,其中所涉及到的关系型数据表都需要进行连接,因此时间和资源开销是不可忽视的;其次,因为庞大的信息在分类存储的情况下,即使是相关程度较高的配件或工艺信息也要分别记录在不同的数据表中,削弱了彼此之间的信息关联,在数据修改和调整时容易产生同步错误;最后,在定制产品的工艺链条中上下游组件间的尺寸对接需要进行多次计算,关系型数据表中对此类数据的处理会建立临时表来计算,引入复杂的查询。
在上述问题客观存在的前提下,本发明发现采用图型数据结构组织和管理家居产品数据更加符合数据的实际运用需求,构建家居产品知识图谱可以高效快速地进行数据管理。一方面,知识图谱中的节点连接可以便捷地对产品的组成部件和配套工艺进行串联,可视化的产品的图谱使得属性信息一目了然,满足了产品多维信息描述的同时减少了数据在空间上的冗余;另一方面,图谱中的每个节点都按照类型和方向记录了一个关系列表,可以在很大程度上加快关联数据之间的查询和计算速度,并且可以通过关系来检查和校正相连节点的数据出入。
因此,本发明从数据管理的角度出发,提出一种家居产品知识图谱的建模和数据管理方法,该方法为实际生产生活中的家居产品提供一个高效地组织和管理模式,满足生产端和决策端的数据运用需求。
本实施例阐述了一种基于知识图谱建模来组织家居产品数据并进行查询和管理的方法,该方法涉及到建模和管理两个部分,具体的建模流程和管理方法如下:
首先,产品知识图谱的数据建模流程如下:
1.数据准备。
a.数据来源。这部分数据主要包括家居产品的分类逻辑表和工艺数据记录是从过往的全屋定制设计方案和家居单独定制方案中家居产品的生产销售信息中归纳总结出来的。这些产品信息完整地包含了各类产品的多维度属性数据和具体生产工艺,可以全面地表达各类家居产品在生产端和销售端所需要的信息。
b.数据预处理。针对每一份产品逻辑表和工艺数据,进行名词对齐并提取出相关产品的主要内容:
i.产品逻辑表以表格的形式存在,产品逻辑表内的每一行是一个具体的产品实例,每一列表述了该产品的(例如类型、名称、图示、编码、尺寸、材质、颜色等)属性信息,特别地,每个柜体都有自己的属性可选项,以及大量的规则限制。本实施例将所有基础属性信息以键值对的方式转存,而规则限制则另外存储;
ii.工艺表以文档的形式存在,文档记录的是高度抽象的可读性较弱的工艺信息条例,需要利用命名实体识别模型对工艺信息条例进行分词提取,获取实体语料,其中实体语料包括两类,一类是产品实体,另一类是产品属性;
iii.由于数据记录跨越时间较长,而且产品更新迭代较快,大量的逻辑表和工艺表内的名词存在“一意多词”现象,所以需要根据人为干涉来进行此类名词的对齐,将对齐后的产品逻辑表和工艺数据串联起来。
iv.最终,经过人为参与修正的数据结果为:(序号、一级品类、二级种类、三级产品、三级属性键值、二级属性名称、一级属性类别、规则限制),所有产品一起汇总成所需的数据表。
2.参考图2,家居产品知识图谱建模:
a.产品基础知识图谱建模。
i.按照流程1的数据表描述的结构,准备六种不同类型的节点,该六种类型分别是:一级品类、二级种类、三级产品、三级属性键值、二级属性名称、一级属性类别;
ii.遍历上述数据表描述的结果,创建每种类型的节点;
iii.合并每个意义相同的节点;
iv.分别连接如下边:一级品类和二级种类、二级种类和三级产品、三级产品和三级属性键值、一级属性类别和二级属性名称、二级属性名称和三级属性键值。
v.人为筛查知识图谱中冗余或错误的地方,手工进行修正;
vi.对于“一意多词”现象,合并成“一意”节点,“多词”作为节点的属性储存,实现向历史数据兼容;
vii.完成产品基础知识图谱构建。
b.利用条件逻辑词对数据中的“规则限制”进行分词。
i.根据经过合并修正的产品基础知识图谱,合并流程1的数据表的“一意多词”结果。
ii.遍历上述数据表中保留包含“规则限制”的结果,最终保留所有针对属性的“规则限制”列表
c.将“规则限制”编码成知识图谱上的边进行表述。
i.定义条件逻辑词:当、和、且、或、时等等;
ii.按照条件逻辑词对上述列表的“规则限制”在a中完成的知识图谱上加入条件[限制]边:
1)已有工艺限制可总结为如下6种:
(C1)当属性A被选中时,可选属性T;
(C2)当属性A被选中时,不可选属性T;
(C3)当属性A和属性B被选中时,可选属性T;
(C4)当属性A和属性B被选中时,不可选属性T;
(C5)当属性A或属性B被选中时,可选属性T;
(C6)当属性A或属性B被选中时,不可选属性T;
2)工艺限制处理:
(C1)转换成“当非属性A被选中时,不可选属性T”,即作为一次C2进行处理;
(C2)建立条件[限制]边,由属性A指向属性T;
(C3)转换成“当非属性A被选中时,不可选属性T”和“当非属性B被选中时,不可选属性T”,即作为两次C2进行处理;
(C4)建立条件[限制]边,第一条由属性A指向属性T且边上加入属性B,第二条由属性B指向属性T且边上加入属性A;
(C5)转换成“当属性A被选中时,可选属性T”和“当属性B被选中时,可选属性T”,即作为两次C1进行处理;
(C6)转换成“当属性A被选中时,不可选属性T”和“当属性B被选中时,不可选属性T”,即作为两次C2进行处理;
iii.完成条件[限制]边的加入。
d.至此,本实施例完成了家居产品知识图谱的构建。本发明实施例的家居产品知识图谱的示例如图3所示。
其次,参考图4,本发明实施例的知识图谱的管理和查询方法如下:
3.基于知识图谱的家居产品数据管理
a.基于可视化知识图谱的宏观数据分析和管理方法:
i.首先,利用可视化的知识图谱可以直观地目前的柜体种类、数量以各个柜体系列之间的联系,方便管理者实现整个柜体产品体系的宏观管理和决策;
ii.其次,对于持续推出的新品和不断增加淘汰柜体单品和系类,在整个知识图谱中可以高效地表示相应产品的生命周期,满足生产端和销售端的需求。
iii.最后,可视化管理提升了柜体产品间联动性,有利于柜体产品的设计和生产布局。
b.基于柜类工艺知识图谱的柜体定制搜索流程:
i.搜索到需要定制的柜体(三级产品),建立产品属性列表;
ii.遍历该节点所有连接的可选项边和默认选项边,加入到产品属性列表上;
iii.遍历所有默认选项边,查看它们所连接的条件[限制]边,得到它们所指向的限制属性,从产品属性列表中移除这些被限制的属性;
iv.完成搜索。
c.基于柜类工艺知识图谱的柜体定制属性修改流程:
i.修改其中一个属性;
ii.在知识图谱上搜索该属性节点;
iii.查看它所连接的条件[限制]边,得到它所指向的限制属性,从产品属性列表中移除这些被限制的属性;
iv.完成修改。
综上所述,相较于现有技术,本发明对以往知识图谱的应用方法进行改进,针对定制家具行业里,柜类产品的复杂工艺处理问题,将工艺的规则限制编码成知识图谱中的条件判断边,实现对复杂工艺的知识图谱表达,从而解决了工艺规则在知识图谱上的管理与搜索问题。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置)、便携式计算机盘盒(磁装置)、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编辑只读存储器(EPROM或闪速存储器)、光纤装置以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (8)
1.一种基于定制柜体工艺知识图谱的数据处理方法,其特征在于,包括:
获取家居产品定制的历史产品信息,所述历史产品信息包括各类产品的多维度属性数据和生产工艺数据;
针对每一类产品的历史产品信息,进行名词对齐并提取出产品的主要内容,具体为:针对每一份产品逻辑表和工艺数据记录,进行名词对齐并提取出相关产品的主要内容,该步骤包括:
将所有基础属性信息和规则限制分别以键值对的方式存储到不同位置;其中,产品逻辑表以表格的形式存在,产品逻辑表内的每一行是一个具体的产品实例,每一列表述了该产品的属性信息,所述属性信息包括以下至少之一:类型、名称、图示、编码、尺寸、材质、颜色;每个柜体都有自己的属性可选项规则限制;
利用命名实体识别模型对工艺数据记录中的工艺信息条例进行分词提取,获取实体语料,其中,实体语料包括产品实体和产品属性;
对存在一意多词类型的名词进行对齐,将对齐后的产品逻辑表和工艺数据串联起来;
汇总得到各个产品的产品数据表,所述产品数据表的结构格式为:序号+一级品类+二级种类+三级产品+三级属性键值+二级属性名称+一级属性类别+规则限制;
根据所述产品的主要内容进行知识图谱建模,利用条件逻辑词对数据中的规则限制进行分词,然后将分词得到的规则限制编码成知识图谱上的边进行表述,得到家居产品知识图谱;
所述根据所述产品的主要内容进行知识图谱建模,包括:准备六种不同类型的节点,其中,六种类型分别是:一级品类、二级种类、三级产品、三级属性键值、二级属性名称、一级属性类别;
遍历所述产品的主要内容描述的结果,创建每种类型的节点;
合并每个意义相同的节点;
将一级品类节点和二级种类节点进行连边处理、将二级种类节点和三级产品节点进行连边处理、将三级产品节点和三级属性键值节点进行连边处理、将三级属性键值节点和二级属性名称节点进行连边处理,将二级属性名称节点和一级属性类别节点进行连边处理;
筛查知识图谱中冗余或错误的地方,并对冗余或错误的地方进行修正;
将一意多词的多个名词合并成一个具有共同意思的节点,将所述多个名词作为该节点的属性进行储存,实现向历史数据的兼容;
完成产品基础知识图谱构建;
根据所述家居产品知识图谱进行家居产品数据管理;
其中,所述家居产品数据管理包括以下至少之一:基于可视化的知识图谱的宏观数据分析和管理、基于知识图谱的柜体定制搜索、基于知识图谱的柜体定制属性修改。
2.根据权利要求1所述的一种基于定制柜体工艺知识图谱的数据处理方法,其特征在于,所述获取家居产品定制的历史产品信息,包括:
获取全屋定制设计方案和家居单独定制方案中家居产品的生产销售信息;
从所述生产销售信息中提取家居产品的产品逻辑表和工艺数据记录。
3.根据权利要求1所述的一种基于定制柜体工艺知识图谱的数据处理方法,其特征在于,所述利用条件逻辑词对数据中的规则限制进行分词,包括:
将所述产品基础知识图谱与所述产品数据表中一意多词的各个名词进行合并;
遍历所述产品数据表中保留包含规则限制的结果,得到所有针对属性的规则限制列表。
4.根据权利要求3所述的一种基于定制柜体工艺知识图谱的数据处理方法,其特征在于,所述将分词得到的规则限制编码成知识图谱上的边进行表述,得到家居产品知识图谱,包括:
配置条件逻辑词,所述条件逻辑词包括:“当”、“和”、“且”、“或”、“时”;
根据所述条件逻辑词,对规则限制在所述产品基础知识图谱上加入条件限制边;
根据条件限制边的加入结果,得到家居产品知识图谱;
其中,所述规则限制中的工艺限制包括以下六种:
(1)当属性A被选中时,可选属性T;
(2)当属性A被选中时,不可选属性T;
(3)当属性A和属性B被选中时,可选属性T;
(4)当属性A和属性B被选中时,不可选属性T;
(5)当属性A或属性B被选中时,可选属性T;
(6)当属性A或属性B被选中时,不可选属性T。
5.根据权利要求1所述的一种基于定制柜体工艺知识图谱的数据处理方法,其特征在于,所述基于可视化的知识图谱的宏观数据分析和管理,包括:
利用可视化的知识图谱直观显示目前的柜体种类、柜体数量以各个柜体系列之间的联系;
利用可视化的知识图谱显示持续推出的新品和淘汰柜体的单品和系类;
所述基于知识图谱的柜体定制搜索,包括:
搜索到需要定制的柜体,建立产品属性列表;
遍历对应节点所有连接的可选项边和默认选项边,加入到所述产品属性列表上;
遍历所有默认选项边,查看它们所连接的条件限制边,得到它们所指向的限制属性,从所述产品属性列表中移除这些被限制的属性,完成搜索;
所述基于知识图谱的柜体定制属性修改,包括:
修改其中一个属性;
在知识图谱上搜索该属性的对应节点;
查看该属性的对应节点所连接的可选项边和默认选项边,查看所述默认选项边所连接的条件限制边,得到它所指向的限制属性,从产品属性列表中移除这些被限制的属性,完成修改。
6.一种基于定制柜体工艺知识图谱的数据处理系统,其特征在于,包括:
第一模块,用于获取家居产品定制的历史产品信息,所述历史产品信息包括各类产品的多维度属性数据和生产工艺数据;
第二模块,用于针对每一类产品的历史产品信息,进行名词对齐并提取出产品的主要内容,具体为:针对每一份产品逻辑表和工艺数据记录,进行名词对齐并提取出相关产品的主要内容,该步骤包括:
将所有基础属性信息和规则限制分别以键值对的方式存储到不同位置;其中,产品逻辑表以表格的形式存在,产品逻辑表内的每一行是一个具体的产品实例,每一列表述了该产品的属性信息,所述属性信息包括以下至少之一:类型、名称、图示、编码、尺寸、材质、颜色;每个柜体都有自己的属性可选项规则限制;
利用命名实体识别模型对工艺数据记录中的工艺信息条例进行分词提取,获取实体语料,其中,实体语料包括产品实体和产品属性;
对存在一意多词类型的名词进行对齐,将对齐后的产品逻辑表和工艺数据串联起来;
汇总得到各个产品的产品数据表,所述产品数据表的结构格式为:序号+一级品类+二级种类+三级产品+三级属性键值+二级属性名称+一级属性类别+规则限制;
第三模块,用于根据所述产品的主要内容进行知识图谱建模,利用条件逻辑词对数据中的规则限制进行分词,然后将分词得到的规则限制编码成知识图谱上的边进行表述,得到家居产品知识图谱;
所述根据所述产品的主要内容进行知识图谱建模,包括:准备六种不同类型的节点,其中,六种类型分别是:一级品类、二级种类、三级产品、三级属性键值、二级属性名称、一级属性类别;
遍历所述产品的主要内容描述的结果,创建每种类型的节点;
合并每个意义相同的节点;
将一级品类节点和二级种类节点进行连边处理、将二级种类节点和三级产品节点进行连边处理、将三级产品节点和三级属性键值节点进行连边处理、将三级属性键值节点和二级属性名称节点进行连边处理,将二级属性名称节点和一级属性类别节点进行连边处理;
筛查知识图谱中冗余或错误的地方,并对冗余或错误的地方进行修正;
将一意多词的多个名词合并成一个具有共同意思的节点,将所述多个名词作为该节点的属性进行储存,实现向历史数据的兼容;
完成产品基础知识图谱构建;
第四模块,用于根据所述家居产品知识图谱进行家居产品数据管理;
其中,所述家居产品数据管理包括以下至少之一:基于可视化的知识图谱的宏观数据分析和管理、基于知识图谱的柜体定制搜索、基于知识图谱的柜体定制属性修改。
7.一种电子设备,其特征在于,包括处理器以及存储器;
所述存储器用于存储程序;
所述处理器执行所述程序实现如权利要求1至5中任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1至5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210982244.9A CN115455192B (zh) | 2022-08-16 | 2022-08-16 | 一种基于定制柜体工艺知识图谱的数据处理方法以及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210982244.9A CN115455192B (zh) | 2022-08-16 | 2022-08-16 | 一种基于定制柜体工艺知识图谱的数据处理方法以及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115455192A CN115455192A (zh) | 2022-12-09 |
CN115455192B true CN115455192B (zh) | 2023-06-16 |
Family
ID=84299415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210982244.9A Active CN115455192B (zh) | 2022-08-16 | 2022-08-16 | 一种基于定制柜体工艺知识图谱的数据处理方法以及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115455192B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113987212A (zh) * | 2021-11-17 | 2022-01-28 | 武汉理工大学 | 一种数控加工领域工艺数据的知识图谱构建方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110334939B (zh) * | 2019-07-01 | 2022-03-15 | 济南大学 | 门窗定制物料信息快速配置方法、系统、设备及介质 |
CN111177404A (zh) * | 2019-12-16 | 2020-05-19 | 江苏艾佳家居用品有限公司 | 家装知识的知识图谱构建方法、装置、计算机设备 |
WO2022061518A1 (zh) * | 2020-09-22 | 2022-03-31 | 西门子股份公司 | 用于生成和利用制造仿真模型的知识图谱的方法和装置 |
CN113743009B (zh) * | 2021-08-31 | 2022-07-01 | 广州极点三维信息科技有限公司 | 基于表示学习的柜类智能设计方法、装置、设备及介质 |
-
2022
- 2022-08-16 CN CN202210982244.9A patent/CN115455192B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113987212A (zh) * | 2021-11-17 | 2022-01-28 | 武汉理工大学 | 一种数控加工领域工艺数据的知识图谱构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115455192A (zh) | 2022-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Korom | A bibliometric visualization of the economics and sociology of wealth inequality: a world apart? | |
US7739257B2 (en) | Search engine | |
US8655869B2 (en) | System and method for information retrieval from object collections with complex interrelationships | |
CN109446221B (zh) | 一种基于语义分析的交互式数据探查方法 | |
US20180039692A1 (en) | Information Query Method And Device | |
US8676859B2 (en) | Method and system for analyzing data stored in a database | |
US20120078940A1 (en) | Analysis of object structures such as benefits and provider contracts | |
Khan et al. | Data tweening: incremental visualization of data transforms | |
CN116097241A (zh) | 使用语义角色的数据准备 | |
CN103425740A (zh) | 一种面向物联网的基于语义聚类的物资信息检索方法 | |
Chu et al. | Automatic data extraction of websites using data path matching and alignment | |
US20080313153A1 (en) | Apparatus and method for abstracting data processing logic in a report | |
CN115455192B (zh) | 一种基于定制柜体工艺知识图谱的数据处理方法以及系统 | |
JP2007012039A (ja) | 検索システムおよびコンピュータプログラム | |
Soussi | Querying and extracting heterogeneous graphs from structured data and unstrutured content | |
Rigby et al. | Plant exit and US imports from low-wage countries | |
Azabou et al. | Diamond multidimensional model and aggregation operators for document OLAP | |
Jong et al. | An integrated application for historical knowledge management with mould design navigating process | |
Li et al. | Hierarchical representation and similarity assessment for reuse of sheet metal parts | |
Hsu et al. | Similarity search over personal process description graph | |
Wang et al. | Topic hypergraph: hierarchical visualization of thematic structures in long documents | |
Li et al. | How institutions communicate change: Casuistry and loosely coupled change in China’s market transformation | |
Perrin | Prompt-viz: Ontology version comparison visualizations with treemaps | |
CN115879441B (zh) | 文本新颖性检测方法、装置、电子设备及可读存储介质 | |
Behringer | Interactive, Explorative and User-Centric Data Analysis: Concepts, Systems, Evaluations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |