CN112784064B - 一种面向社交网络的层次化超维知识图谱构建方法 - Google Patents
一种面向社交网络的层次化超维知识图谱构建方法 Download PDFInfo
- Publication number
- CN112784064B CN112784064B CN202110117804.XA CN202110117804A CN112784064B CN 112784064 B CN112784064 B CN 112784064B CN 202110117804 A CN202110117804 A CN 202110117804A CN 112784064 B CN112784064 B CN 112784064B
- Authority
- CN
- China
- Prior art keywords
- knowledge
- concept
- representing
- layer
- instance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title abstract description 16
- 238000013507 mapping Methods 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims description 32
- 238000000605 extraction Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 2
- 230000008520 organization Effects 0.000 abstract description 5
- 238000006243 chemical reaction Methods 0.000 abstract description 2
- 239000010410 layer Substances 0.000 description 133
- 230000001364 causal effect Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 235000019580 granularity Nutrition 0.000 description 5
- 238000003860 storage Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 238000012098 association analyses Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于知识图谱技术领域,其公开了一种面向社交网络的层次化超维知识图谱构建方法。社交网络中商品相关信息错综复杂,利用现有知识图谱难以有效转化。本发明首先分析社交网络中各类信息的组成结构,定义对应超维知识图谱架构;然后抽取出有关商品推荐的特定知识,按照其性质进行概念分层,并根据其对应关系建立层与层之间的关联映射;再将获取到的知识按照已构建的结构模式进行组织,实现多元组的转换;最后利用得到的社交网络知识图谱,结合具体用户的个人喜好信息,推荐与之匹配度较高的商品,提高了社交网络中与商品相关知识的描述和组织能力,提高了对复杂多元社交网络实体关系的表达能力,实现了对社交网络商品推荐明确、有效支撑。
Description
技术领域
本发明属于知识图谱技术领域,具体涉及一种面向社交网络的层次化超维知识图谱构建方法。
背景技术
随着互联网和大数据的发展,越来越多的用户选择在网络上进行消费,而个性化的商品推荐,是直接影响用户消费体验和意愿的关键因素。与此同时,社交网络所产生的海量信息与知识,为个性化的推荐提供了重要的依据。面对丰富多样的知识,需要一种高效且简洁的方式来对这些知识进行组织和存储,以便于后续对知识的使用,即商品推荐。
知识图谱是一种以图结构或拓扑结构模型来整合数据的知识数据库,由一系列相互连接的实体(物体、事件、情景等)和它们的属性构成。知识图谱能够允许人或计算机以一种高效且没有歧义的方式对网络中的数据进行处理和使用。知识图谱的组织和存储形式多种多样,其中最常用的是由W3C提出的资源描述框架RDF,该框架以三元组<主体-关系-客体>的形式表达实体之间的关系,这种存储形式为知识图谱的构建和存储提供了很大的便利。另一方面,事理图谱(Event Logic Graph,缩写ELG)是一个事理逻辑知识库,是一种特殊的知识图谱,描述了事件之间的演化规律和模式。结构上,事理图谱是一个有向有环图,其中节点代表事件,有向边代表事件之间的顺承、因果、条件和上下位等事理逻辑关系。
然而,随着社交网络中的知识复杂程度日益上升,网络中商品、用户、商家等实体之间各种关系的时间和空间变化常常对知识推理产生重大影响,而传统的三元组的形式不足以表示社交网络关系的时空约束,而且三元组是为表示实体二元关系设计的,但社交网络中存在大量的多元关系,这是传统的三元组无法表示的。同时单层的知识图谱没有区分不同类型的实体(如:实例、概念、事件等),由于社交网络的复杂性,如果不对不同类型的实体加以区分,后续的商品推荐的难度将会大大增加。另一方面,单独使用实体知识图谱和事理知识图谱,难以把社交网中的实体和事件相联系,在全面、个性化的社交网络商品推荐这一应用中具有一定的局限性。
发明内容
本发明所要解决的技术问题是:提供一种面向社交网络的层次化超维知识图谱构建方法,提高对社交网络中多种知识的描述和组织能力,提高对社交网络中带有时空属性且错综复杂的多元关系的表达能力,为个性化的商品推荐提供明确、有效的技术支撑。
本发明解决上述技术问题采用的技术方案是:
一种面向社交网络的层次化超维知识图谱构建方法,包括以下步骤:
A、基于输入的包含社交网络及商品知识的知识元组定义超维知识图谱架构;
B、基于知识元组中的实例知识,构建实例知识图谱层;
C、基于知识元组中的概念知识,结合所构建的实例知识图谱层,构建概念知识图谱层;
D、基于知识元组中的事理知识,结合所构建的概念知识图谱层,构建知识事理知识图谱层;
E、基于知识元组中包含的实例、概念关联知识,结合语义信息,建立实例知识图谱层与概念知识图谱层间的关联映射;
F、基于知识元组中包含的概念、事理关联知识,结合语义信息,建立概念知识图谱层与事理知识图谱层间的关联映射。
作为进一步优化,步骤A具体包括:
将知识节点及关联的类型基于其内涵的表达粒度,设计为实例知识层、概念知识层、事理知识层三个层次;然后通过对不同种类知识节点间的关联进行归类,设计跨层关系,表示实例、概念、事理节点间的关联;最后,添加时间空间维度属性信息表示知识实体及关联的适用情境;最终设计的超维知识图谱总体结构为:G={GO,GF,GE,EOFE,ST};GO表示实例知识层、GF表示概念知识层、GE表示事理知识层,EOFE表示跨层关系,ST表示时间空间维度属性信息。
作为进一步优化,步骤B具体包括:
首先设计实例知识图谱层基本结构,然后提取实例知识,构建实体结点,并提取实体之间的多元关系及时空约束,以超图的形式构建实例知识图谱。
具体的,所述实例知识图谱层基本结构为:GO={VO,LO,EO},VO表示实例实体集合,LO表示实例知识标签及属性信息集,超边关系EO表示实例实体之间的多元关系及时空约束的集合,定义其中的每一个多元关系为四元组HOi表示关系包含的实例实体,ROi表示实体之间的关系,表示生效时间,σOi表示生效空间。
作为进一步优化,步骤C具体包括:
首先设计概念知识图谱层基本结构,然后从实例知识层分离出概念实体和概念关系,结合原知识元组中的概念知识,形成概念结点和超边,并以超图的形式构建概念知识图谱。
具体的,所述概念知识图谱层基本结构为:GF={VF,LF,EF},VF表示概念实体集合,LF表示概念知识标签及属性信息集,超边关系EF表示概念实体之间的关系及时空约束的集合,其中的超边依次定义为HFi表示关系包含的概念实体,RFi表示概念之间的多元关系类型,表示生效时间,σFi表示生效空间。
作为进一步优化,步骤D具体包括:
首先设计事理知识图谱层基本结构,然后从概念知识层分离出事理知识,结合原知识元组中的事理知识,获取事件知识,构建事件结点,并提取事件之间的逻辑关联,以超边或有向边的形式表达事理逻辑,构建事理知识图谱。
具体的,所述事理知识图谱层基本结构为:GE={VE,LE,EE},VE表示事件实体及情境要素集合,LE表示定义在事件、要素及其关联之上的标签信息集合;超边关系EE表示定义在事件要素集之上的关系集合,即表示不同事件间的逻辑关联,定义其中的每一个多元关系为四元组HOi表示关系包含的事理实体,rEi表示实体之间的关系,表示生效时间,σEi表示生效空间。
作为进一步优化,步骤E具体包括:
对实例、概念知识的语料进行实例-概念映射抽取,发现实例实体的概念内涵,结合原有实例、概念关联知识,以映射边的形式建立实例知识层和概念知识层的关联映射。
作为进一步优化,步骤F具体包括:
对概念、事理知识的语料进行事件-概念映射抽取,发现事件和概念的关系,结合原有概念、事理关联知识,以映射边的形式建立事理知识层和概念知识层的关联映射。
本发明的有益效果是:
(1)通过层次化的知识表达,弥补了简单RDF知识三元组难以对复杂的社交网络中多种类型和粒度的知识进行有效记录和表达的缺陷,提高了针对社交网络中多种知识的描述和组织能力。
(2)通过超边关系、时空维度属性等结构的社交,提升了知识图谱对社交网络中错综复杂的多元知识的表达能力,能够从多个维度全面刻画和呈现社交网络中某些特定商品各方面属性,为后续的个性化商品推荐打下更为坚实的基础。
(3)通过超维知识图谱的构建过程,能够发现社交网络中不同类型、粒度的社交网络知识之间的隐含信息,实现知识对社交网络商品推荐的明确有效支撑。
附图说明
图1为本发明中的层次化超维知识图谱构建方法流程图;
图2为本发明中的实例知识层结构示意图;
图3为本发明中的概念知识层结构示意图;
图4为本发明中的事理知识层结构示意图;
图5为本发明中的跨层映射结构示意图;
图6为本发明实施例中的实例知识层结构示意图;
图7为本发明实施例中的概念知识层结构示意图。
图8为本发明实施例中的事理知识层结构示意图。
具体实施方式
本发明旨在提供一种面向社交网络的层次化超维知识图谱构建方法,提高对社交网络中多种知识的描述和组织能力,提高对复杂多元知识的表达能力,实现知识对社交网络商品推荐的明确、有效支撑。本发明中,首先进行超维知识图谱架构的定义,然后将复杂多维的社交网络及商品知识进行概念分层表达,并建立层与层知识之间的关联映射,再将获取的知识按照已构建的结构模式进行组织,实现知识多元组的转换,最终完成超维知识图谱的构建。
在具体实现上,本发明中的面向社交网络的层次化超维知识图谱构建方法流程如图1所示,其包括以下步骤:
步骤一、定义超维知识图谱总体架构:
本步骤首先设计超维知识图谱总体五元组结构,将知识内容进行分层,并设计跨层的关联映射,最后添加时间空间维度属性。
具体而言,针对RDF知识三元组中包含的多种知识和信息,构建超维知识图谱表达的基本结构:首先,为了覆盖RDF中知识的种类,将知识节点及关联的类型,基于其内涵的表达粒度,设计为实例知识层GO、概念知识层GF、事理知识层GE三个层次;随后,通过对不同种类知识节点间的关联进行归类,设计跨层关系EOFE,表示实例、概念、事理节点间的关联;最后,添加时间空间维度属性信息ST表示知识实体及关联的适用情境,最终定义的超维知识图谱总体结构为G={GO,GF,GE,EOFE,ST}。
步骤二、构建实例知识图谱层:
本步骤首先设计实例知识图谱层基本结构,随后提取实例知识,构建实体结点,并提取实体之间的多元关系及时空约束,以超图的形式构建实例知识图谱,如图2所示。
具体而言,包括步骤2.1-2.3:
步骤2.1、针对RDF知识三元组中包含的实例类知识及其属性信息,设计实例知识图谱层基本结构为Go={VO,LO,EO},实现实例知识表示。具体的,采用Vo表示实例实体集合,采用LO表示实例知识标签及属性信息集;使用超边关系EO表示实例实体之间的多元关系及时空约束的集合,定义其中的每一个多元关系为四元组用HOi表示关系包含的实例实体,用ROi表示实体之间的关系,表示生效时间,σOi表示生效空间。
步骤2.2、针对步骤2.1中的实例实体集合VO及标签集LO,构建实例知识图谱层实体:首先,遍历RDF知识三元组中的知识实体,通过实体类型规则匹配,从实体集合中提取人名、地名等命名实体,以及表示用户、商品、商家等独立个体实例的实体;其次,将所得实体集合表示为实例知识层三元组中的VO,并将这些实体在原知识中包含的相关标签及属性表达为三元组中的LO;最后,将{VO,LO}作为结点添加到实例知识图谱层中。
步骤2.3、基于步骤2.2构建的实体集合VO及标签集合LO,构建步骤2.1中的实例实体关系首先,采用超边二元组(HOi,ROi)对关系进行表示,HOi表示超边中的知识节点集合,即构成该多元关系的实例实体集,例如一本畅销图书的共同作者,ROi表示多元关系的类型,例如作者间的共著关系。其次,枚举VO中节点数不少于2的子集合;针对每一个集合,比较其中每一对节点间的关系;若关系相同,则进一步比较节点间的属性及语义相似度;若其中最小相似度满足阈值要求,则将其作为一条超边关系,节点构成HOi,公共的关系构成ROi;若子集中节点个数为2,则将超边转化为普通边。最后,合并HOi中实体的时间和空间集合,取公共部分,构成完成实例实体关系的提取。
步骤三、构建概念知识图谱层:
本步骤首先设计概念知识图谱层基本结构,随后从实例知识层分离出概念实体和概念关系,结合原知识元组中的概念知识,形成概念结点和超边,并以超图的形式构建概念知识图谱,如图3所示。
具体而言,包括步骤3.1-3.3:
步骤3.1、针对RDF知识三元组中包含的概念类知识及其属性信息,设计概念知识图谱层基本结构为GF={VF,LF,EF},实现概念知识的表示。具体的,采用VF表示概念实体集合,采用LF表示概念知识标签及属性信息集。其次,使用超边关系EF表示概念实体之间的关系及时空约束的集合,其中的超边依次定义为用HFi表示关系包含的概念实体,用RFi表示概念之间的多元关系类型,表示生效时间,σFi表示生效空间。
步骤3.2、针对步骤3.1中的概念实体集合VF及标签集LF,构建概念知识图谱层实体。首先,利用步骤二获得的实例知识层,提取其中的实例实体,存入集合V,将实体对应的属性信息存入集合L,将其语义信息存入T;其次,采用基于属性的概念实体抽取,计算每一对实体的属性重合度及语义相似度,并随机选择若干组归一化线性加权距离相近的实体集,估计其标准模块性,若满足阈值,则提取属性中的公共内容作为概念实体,例如从基于多个“球衣”商品,总结出“球迷版球衣”和“球员版球衣”等概念实体;随后,基于规则匹配,从原RDF 知识实体集合中提取表示抽象实体、类别、组织性概念等知识的实体,例如书籍、日常用品、食品、以及品牌名称等,形成概念实体集合;最后,将两部分概念实体进行融合,合并重复的概念知识,并且将相应的概念实体所包含的相关标签及属性表达为LF;最后,将{VF,LF}添加到概念知识图谱层中。
步骤3.3、基于步骤3.2构造的概念实体集合VF及标签集LF,构建步骤3.1中的概念实体关系首先,采用超边二元组EFi=(HFi,RFi)对关系进行表示,其中HFi表示构成该多元关系的概念结点的集合,RFi表示多元关系的类型。其次,枚举概念实体集合VF中节点数不少于2的子集,针对每一个子集,对比其中每一对实体:
1)若其中的概念实体均来自于原RDF知识集合,则将从属关系依次转化为实体间的拓扑关系;
2)若其中的概念实体为步骤3.2中抽取出的概念实体,则基于对应实例层实体间的多元关系,进行这些实例关系的聚合,统计关系出现次数,并且采用阈值过滤,提取概念实体间的关联关系。
随后,比较子集内部的实体关联关系:
1)若同属于“从属关系”,则保留概念实体间的从属关系,并构成包含实体子集的超边 EFi=(HFi,RFi),其中RFi为该类实体的公共标签或属性;
2)若属于其它关系,则将这些关系直接变为概念实体关联,构成普通边。最后,合并每条边中实体的时间和空间范围,取公共部分作为概念实体关系成立的时空条件,完成概念实体关系的构建。
步骤四、构建事理知识图谱层:
本步骤首先设计事理知识图谱层基本结构,随后从概念知识层分离出事理知识,结合原知识元组中的事理知识,获取事件知识,构建事件结点。并提取事件之间的逻辑关联,以超边或有向边的形式表达事理逻辑,构建事理知识图谱,如图4所示。
具体而言,包括步骤4.1-4.4:
步骤4.1、针对RDF知识三元组中包含的事理类知识及其关联信息,设计事理知识图谱层基本结构为GE={VE,LE,EE},实现事理知识表示。具体的,采用VE表示事件实体及情境要素集合,采用LE表示定义在事件、要素及其关联之上的标签信息集合;使用超边关系EE表示定义在事件要素集之上的关系集合,表示不同事件间的逻辑关联,定义其中的每一个多元关系为四元组用HOi表示关系包含的事理实体,用rEi表示实体之间的关系,表示生效时间,σEi表示生效空间。
步骤4.2、针对步骤4.1中的事件实体集合VE及标签集LE,构建事理知识图谱层实体。首先,利用事理规则匹配,从原RDF知识集合中,提取出谓词性事件及其内外(空间,时间域)联系中获取的动态的事件、环境因素、情景条件等,作为事理知识节点,例如用户在某个时间、地点浏览过某个商品,或者用户在某个时间、地点与其朋友讨论过某个商品等;其次,将步骤三获得的概念知识层,提取其中的概念实体,结合事件描述模板,通过搜索方法,发现满足模板的概念实体及关联序列,统计模板匹配次数,将次数满足阈值的事件转化为事理知识节点,例如家电与家具类的概念实体在浏览或购买顺序上存在顺承关系等;然后,将两部分节点进行融合,合并重复的事件节点,并且将相应的事理知识节点所包含的标签及属性表达为LE;最后,将{VE,LE}添加到事理知识图谱层中。
步骤4.3、基于步骤4.2构造的事理知识实体集合VE及标签集LE,构建步骤4.1中的事理实体关系首先,针对从原RDF知识集合中抽取的事理知识实体,直接从原集合中提取其关联关系;针对从概念知识层抽取的事理知识实体,通过事件对应的概念知识集合中的实体对依次进行关联分析,统计其关联性,若总体关联性超过阈值,则事理知识实体存在关联。随后,将事件按照时间、空间进行划分,并两两比较每一组关联事件对;若两组事件处于同一时空范围内(或时空区间间隔小于阈值),且有公共事件,则将两组事件合并,并用超边连接,重复上述过程,直至无法进一步合并,将每一个事件集合表达为HEi,事件关联表达为REi。最后,合并每个超边中的时间、空间属性,取其全集,表示为事件关联发生的时空属性。
1)若事件间的关系为因果关系,则用(h,rcausal,t,(τs,τe),σ)表示事件h的发生是导致事件 t发生的原因,rcausal表示因果关系的标签;
2)若事件间的关系为偏序关系,则用(h,rsequential,t,(τs,τe),σ)表示事件h和事件t的在时间上的偏序关系,即前者与后者在时间上的先后逻辑,rsequential是表示偏序关系的标签。
随后,进一步枚举超边内部的事件子集,针对同一事件的原因或前序事件,若为并列或关联关系,则在各自的标签因果关系标签rcausal上追加与标签rand,若原因或前序事件不存在关联,则在各自的标签因果关系标签rcausal上追加或标签ror。最后,枚举已标记的因果关联事件对(h,rcausal,t,(τs,τe),σ),若存在非关系,即条件不出现时,结果出现,则设置条件事件的否定节点h′,建立因果关系(h′,rcausal,t,(τs,τe),σ),并删除(h,rcausal,t,(τs,τe),σ)。
步骤五、构建实例知识层与概念知识层间的关联映射:
本步骤对实例、概念知识的语料进行实例-概念映射抽取,发现实例实体的概念内涵,结合原有实例、概念关联知识,以映射边的形式建立实例知识层和概念知识层的关联映射。
具体而言,包括步骤5.1-5.2:
步骤5.1、基于原RDF知识集合,结合步骤二获得的实例知识及步骤三获得的概念知识,设计概念层与实例层映射为即定义实例实体和概念实体间的映射集合及其标签。V′O表示实例实体集合,V′F表示实例实体对应的概念实体集合。LOF包含实体的类别信息、归属信息等。
步骤5.2、基于步骤5.1所得映射构建实例层和概念层之间的关系。具体的,遍历步骤三所得概念实体,若概念实体从实例层获取,则直接用普通边或超边结构连接概念实体和实例实体(集);若概念实体直接从原RDF知识集合中获得,则比较与第一类概念实体的相似性,以及与实例实体的语义关联性,当任一性质超过阈值时,进行实体的连接。随后,用超边结构EOFi={HOF,ROFi,[τs,τe],σOFi}表示上述关系,用[τs,τe]表示生效时间以及用σOFi表示生效空间,分别通过计算概念、实例实体的公共时间及空间获得。最后,检查实例实体是否存在相同时空内归属多个概念实体的情况,若存在,则删除其中相似性较低的关系。
步骤六、构建概念知识层与事理知识层间的关联映射:
本步骤对概念、事理知识的语料进行事件-概念映射抽取,发现事件和概念的关系,结合原有概念、事理关联知识,以映射边的形式建立事理知识层和概念知识层的关联映射。
具体而言,包括步骤6.1-6.2:
步骤6.1、基于原RDF知识集合,结合步骤三获得的概念知识及步骤四获得的事理知识,设计概念层与事件层映射为V′OF表示实例实体对应的概念实体集合(及其蕴含实例实体),V′E表示概念实体涉及的事件实体集合, LOFE表示跨层之间的映射集合及其标签。
步骤6.2、基于步骤6.1所得映射构建概念层和事理层之间的关系。根据步骤三获得的概念实体,以及步骤四获取的事理知识节点,发现每个事件所属的人物,地点,时间等要素,并建立关系,用EOFE表示概念和事件之间的关联及时空约束。具体地,EOFQi={RFEi,[τs,τe],σOEFi}分别采用超边结构RFEi表示定义在概念与事件之间的连接映射,采用[τs,τe]和σOEFi表示生效时间以及生效空间。
通过步骤五和步骤六,本发明就建立了各层之间的映射关系,如图5所示。
实施例:
本实施例中的面向社交网络商品推荐的层次化超维知识图谱构建方法包括以下步骤:
步骤一:超维知识图谱架构构建:
设计超维知识图谱总体结构为G={GO,GF,GE,EOFE,ST};将网络购物相关知识内容基于粒度,设计为实例知识层GO、概念知识层GF、事理知识层GE三个层次。其中实例知识层主要包含具体的客户、店铺、商品等实例结点,以及它们之间的多元关系;概念层则包含总体的“客户”、“店铺”、“商品”等概念结点,及其多元关系,上述的实例知识层结点即是这些概念的具体实例;事理知识层则包含如下单购买、客商沟通、客户退货、商家退款、客户发布好(差) 评等网络购物中会发生的一系列事件结点,以及它们之间的事理逻辑关系。EOFE表示网络中上述实例、概念和事件的映射关系。
步骤二:实例知识图谱层构建:
2.1.设计实例知识图谱层基本结构为GO={Vo,LO,EO},其中VO表示实例结点集合,即网络购物中客观存在的各实例实体,如:具体客户、具体店铺、具体商品等;LO表示上述实例结点的标签和属性集合,如:客户的姓名、性别、年龄、工作类型等;EO表示各实例结点之间的多元关系集合,具体地,每个多元关系以超边的形式表示,即四元组 其中HOi表示构成该多元关系的结点的集合,该集合可包含多种类型的结点,如可同时包含相应客户、店铺和商品等;ROi表示该多元关系的具体类型,如某客户喜欢某几个店铺、某店铺售卖某些商品、某些商品有着相似的用途等;表示多元关系的生效时间,如某关系只在某一特定的促销活动时间成立;σOi表示多元关系的生效空间,如某些商品只在某些特定区域销售。
2.2.设计实例知识图谱层实体构成,利用规则匹配,从实体集合中抽取用户名、商品名、店铺名、地名等命名实体,将所得实体集合表示为实例知识层中VO,并提取各实体的相关属性,表示为LO。如附图6所示,将{VO,LO}作为实例知识结点添加到网络购物实例知识层的知识图谱中。
2.3.构建实例知识图谱层关系,采用超边二元组(HOi,ROi)对关系进行表示,其中HOi表示构成该多元关系的客户、店铺、商品等结点的集合,ROi表示该多元关系的具体类型,如附图 6所示,以超边的形式将该多元关系添加到网络购物实例知识层的知识图谱中。实际运用中,如该多元关系有一定指向性,可在关系结点上添加相应label以区分其在该多元关系中扮演的角色。当该多元关系只涉及两个实体时,可将该超边转化为普通边进行存储。
本实施例中通过上述步骤构建的实例知识图谱层结构如图6所示。
步骤三:概念知识图谱层构建:
3.1.设计概念知识图谱层基本结构为GF={VF,LF,EF},其中VF表示实例结点集合,即“商品”、“客户”、“店铺”、“第三方平台”等总体概念,而上述实例知识层的结点是这些概念的具体实例;LF表示上述实例结点的标签和属性集合,如客户的群体分布、性别比例、年龄分布,抑或是店铺的总销售额、好评率等;EF表示各概念结点间的多元关系集合,具体地,每个多元关系以超边的形式表示,即四元组其中HFi表示构成该多元关系的概念结点的集合,RFi表示该多元关系的具体类型,如客户对各第三方支付平台的依赖程度等;表示该多元关系的生效时间,如客户在某一特定季节对某类商品有较大兴趣;σFi表示该多元关系的生效空间,如某一地区的客户偏爱某些品牌。
3.2设计概念知识图谱层实体构成。将实例知识层获取得到的关系四元组中的H提取出来, 将名称代号等表示为V,其余属性表示为L;将所有实体汇聚到一个集合中{V,L},依据L中的属性,对V中实体进行概念实体的抽取,如从“冰箱”、“彩电”、“冰箱”等实例提取出概念“家电”。将上述概念实体集合同实体集合中抽取的概念实体进行融合,如附图7所示,构成概念知识结点{VF,LF},将{VF,LF}添加到网络购物的概念知识图谱层中。
3.3构建概念知识图谱层关系,采用超边二元组EFi=(HFi,RFi)对网络购物的概念实体关系进行表示,其中HFi表示构成该多元关系的概念结点的集合,RFi表示多元关系的类型。基于实例知识层的多元关系,通过聚合和阈值过滤法,提取概念实体间的关联关系,将上述关系同实体集合中的概念实体关系进行融合,如附图7所示,构成超边,添加到网络购物的概念知识图谱层中。
本实施例中通过上述步骤构建的概念知识图谱层结构如图7所示。
步骤四:事理知识图谱层构建:
4.1针对RDF知识三元组中包含的事理类知识及其关联信息,设计事理知识图谱层基本结构为GE={VE,LE,EE},采用VE表示事件实体及情境要素集合,如客户的一次下单购买、店铺与客户的一次沟通、客户的一次退货等,采用LE表示定义在事件、要素及其关联之上的标签信息集合;使用超边关系EE表示定义在事件要素集之上的关系集合,表示不同事件间的逻辑关联,如客商沟通与下单购买之间的顺承关系、客户退货与商家退款之间的因果关系等,定义其中的每一个多元关系为四元组用rEi表示实体之间的具体关系类型,表示生效时间,如某些事理逻辑只在某促销活动期间成立,而其他时候不成立,σEi表示生效空间,如某些地区的店铺可能对特定偏远地区的订单选择拒绝发货。
4.2针对4.1中的事件实体集合VE及标签集LE,构建事理知识图谱层实体。首先,利用事理规则匹配,从原RDF知识集合中,提取出谓词性事件及其内外(空间,时间域)联系中获取的动态的事件、环境因素、情景条件等,作为事理知识节点,如客户的一次下单购买,店铺与客户的一次退货等;其次,将步骤三获得的概念知识层,提取其中的概念实体,结合事件描述模板,通过搜索方法,发现满足模板的概念实体及关联序列,统计模板匹配次数,将次数满足阈值的事件转化为事理知识节点;然后,将两部分节点进行融合,合并重复的事件节点,并且将相应的事理知识节点所包含的标签及属性表达为LE;最后,将{VE,LE}添加到事理知识图谱层中。
4.3基于4.2构造的事理知识实体集合VE及标签集LE,构建4.1中的事理实体关系 首先,针对从原RDF知识集合中抽取的事理知识实体,直接从原集合中提取其关联关系;针对从概念知识层抽取的事理知识实体,通过事件对应的概念知识集合中的实体对依次进行关联分析,统计其关联性,若总体关联性超过阈值,则事理知识实体存在关联,如客商沟通与下单购买之间的顺承关系、客户退货与商家退款之间的因果关系等。随后,将事件按照时间、空间进行划分,并两两比较每一组关联事件对;若两组事件处于同一时空范围内(或时空区间间隔小于阈值),且有公共事件,则将两组事件合并,并用超边连接,重复上述过程,直至无法进一步合并,将每一个事件集合表达为HEi,事件关联表达为REi。最后,合并每个超边中的时间、空间属性,取其全集,表示为事件关联发生的时空属性。
4.4基于4.3构造的事理实体关系构建超边内部事件关系的表达。具体的,遍历每条超边中的事件对:1)若事件间的关系为因果关系,如商品打折可能是某客户想要购买商品的重要原因,则用(h,rcausal,t,(τs,τe),σ)表示事件h的发生是导致事件 t发生的原因,rcausal表示因果关系的标签;2)若事件间的关系为偏序关系,则用 (h,rsequential,t,(τs,τe),σ)表示事件h和事件t的在时间上的偏序关系,即前者与后者在时间上的先后逻辑,如买家核对订单信息无误后,卖家方可发货。rsequential是表示偏序关系的标签。随后,进一步枚举超边内部的事件子集,针对同一事件的原因或前序事件,若为并列或关联关系,则在各自的标签因果关系标签rcausal上追加与标签rand,若原因或前序事件不存在关联,则在各自的标签因果关系标签rcausal上追加或标签ror。最后,枚举已标记的因果关联事件对 (h,rcausal,t,(τs,τe),σ),若存在非关系,即条件不出现时,结果出现,则设置条件事件的否定节点h′,建立因果关系(h′,rcausal,t,(τs,τe),σ),并删除(h,rcausal,t,(τs,τe),σ)。
本实施例中通过上述步骤构建的事理知识图谱层结构如图8所示。
步骤五:实例知识层与概念知识层间的关联映射的构建:
5.1设计概念知识层与实例知识层映射为即定义实例实体和概念实体间的映射集合及其标签。V′O表示目标识别出的实例实体集合,如,商品,店铺,客户等。V′F表示实例实体对应的概念实体集合,如,某个商品的功能,质量,价格等特征。通过该结构表达了不同的实例实体或实例实体集合所对应的概念内涵,包含实体的类别信息、归属信息等。同时,引入映射互斥规则,允许实例实体在时空约束LOF下唯一关联一个或者多个概念实体。如,每个店铺生产不同的产品,同样一个店铺里也有功能不同的商品。一个表示商品的实例节点可以对应多个表示商品特征的概念节点,表示这个商品的各种特征。
5.2构建实例层和概念层之间的关系。根据从实例层获取的实例实体和从概念层获取的概念实体的关联关系,用超边结构进行表示。采用EOF表示实体与概念之间的关系及时空约束,具体的EOFi={ROFi,[τs,τe],σOFi},超边结构ROFi表示定义在实体与概念之间的连接映射,用 [τs,τe]表示生效时间以及用σOFi表示生效空间。如,每个商品都有使用期和使用环境,它只能在使用期限和使用环境下才能正常发挥自己的功能。
步骤六:概念层与事件层间的关联映射的构建:
6.1设计概念层与事件层映射为V′OF表示实例实体对应的概念实体集合(及其蕴含实例实体),如,某个商品有关的某些特征, V′E表示概念实体涉及的事件实体集合,如,有关某个商品的有些特征的事件,LOFE表示跨层之间的映射集合及其标签,如,有关某个商品的有些特征之间发生的事件。通过该结构表示实例实体或概念实体对应的事件内涵。
6.2构建概念层和事理层之间的关系:
根据从概念层获取的概念实体,从事理层中获取对应的事件要素,所属事件要素包括:人物,地点,时间等。每个概念节点对应一个或者多个事件要素,也可以把一个事件用几个概念节点来表示。如:一个商品的某个特征能引起有些事件或者某个商品的有些特征能引起一个事件。概念实体和事件实体之间的关联关系,用超边结构进行表示。用EOFE表示概念和事件之间的关联及时空约束,具体地,EOFQi={RFEi,[τs,τe],σOEFi}分别采用超边结构RFEi表示定义在概念与事件之间的连接映射,采用[τs,τe]和σOEFi表示生效时间以及生效空间。某个商品的有些特征在某段时间和环境的条件下能引起某些事件。
Claims (9)
1.一种面向社交网络的层次化超维知识图谱构建方法,其特征在于,
包括以下步骤:
A、基于输入的包含社交网络及商品知识的知识元组定义超维知识图谱架构;
B、基于知识元组中的实例知识,构建实例知识图谱层;
C、基于知识元组中的概念知识,结合所构建的实例知识图谱层,构建概念知识图谱层;
D、基于知识元组中的事理知识,结合所构建的概念知识图谱层,构建知识事理知识图谱层;
E、基于知识元组中包含的实例、概念关联知识,结合语义信息,建立实例知识图谱层与概念知识图谱层间的关联映射;
F、基于知识元组中包含的概念、事理关联知识,结合语义信息,建立概念知识图谱层与事理知识图谱层间的关联映射;
步骤A具体包括:
将知识节点及关联的类型基于其内涵的表达粒度,设计为实例知识层、概念知识层、事理知识层三个层次;然后通过对不同种类知识节点间的关联进行归类,设计跨层关系,表示实例、概念、事理节点间的关联;最后,添加时间空间维度属性信息表示知识实体及关联的适用情境;最终设计的超维知识图谱总体结构为:G={GO,GF,GE,EOFE,ST};GO表示实例知识层,包含具体的客户、店铺、商品实例结点以及它们之间的多元关系;GF表示概念知识层,包含总体的“客户”、“店铺”、“商品”概念结点及其多元关系,实例知识层结点即是概念节点的具体实例;GE表示事理知识层,为网络购物中发生的一系列事件结点以及它们之间的事理逻辑关系,事件结点包含下单购买、客商沟通、客户退货、商家退款、客户发布好/差评;EOFE表示跨层关系,即网络中实例、概念和事件的映射关系;ST表示时间空间维度属性信息。
2.如权利要求1所述的一种面向社交网络的层次化超维知识图谱构建方法,其特征在于,步骤B具体包括:
首先设计实例知识图谱层基本结构,然后提取实例知识,构建实体结点,并提取实体之间的多元关系及时空约束,以超图的形式构建实例知识图谱。
4.如权利要求1所述的一种面向社交网络的层次化超维知识图谱构建方法,其特征在于,步骤C具体包括:
首先设计概念知识图谱层基本结构,然后从实例知识层分离出概念实体和概念关系,结合原知识元组中的概念知识,形成概念结点和超边,并以超图的形式构建概念知识图谱。
6.如权利要求1所述的一种面向社交网络的层次化超维知识图谱构建方法,其特征在于,步骤D具体包括:
首先设计事理知识图谱层基本结构,然后从概念知识层分离出事理知识,结合原知识元组中的事理知识,获取事件知识,构建事件结点,并提取事件之间的逻辑关联,以超边或有向边的形式表达事理逻辑,构建事理知识图谱。
8.如权利要求1所述的一种面向社交网络的层次化超维知识图谱构建方法,其特征在于,步骤E具体包括:
对实例、概念知识的语料进行实例-概念映射抽取,发现实例实体的概念内涵,结合原有实例、概念关联知识,以映射边的形式建立实例知识层和概念知识层的关联映射。
9.如权利要求1所述的一种面向社交网络的层次化超维知识图谱构建方法,其特征在于,步骤F具体包括:
对概念、事理知识的语料进行事件-概念映射抽取,发现事件和概念的关系,结合原有概念、事理关联知识,以映射边的形式建立事理知识层和概念知识层的关联映射。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110117804.XA CN112784064B (zh) | 2021-01-28 | 2021-01-28 | 一种面向社交网络的层次化超维知识图谱构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110117804.XA CN112784064B (zh) | 2021-01-28 | 2021-01-28 | 一种面向社交网络的层次化超维知识图谱构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112784064A CN112784064A (zh) | 2021-05-11 |
CN112784064B true CN112784064B (zh) | 2023-05-12 |
Family
ID=75759344
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110117804.XA Active CN112784064B (zh) | 2021-01-28 | 2021-01-28 | 一种面向社交网络的层次化超维知识图谱构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112784064B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117744786B (zh) * | 2024-02-19 | 2024-05-07 | 中国电子科技集团公司第十研究所 | 一种超事理图网络构建与事件演化分析方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106600065A (zh) * | 2016-12-16 | 2017-04-26 | 中山大学 | 基于有向超图的个性化学习路径的抽取与拼接方法及系统 |
CN106874261A (zh) * | 2017-03-17 | 2017-06-20 | 中国科学院软件研究所 | 一种基于语义三角的领域知识图谱及查询方法 |
CN107609052A (zh) * | 2017-08-23 | 2018-01-19 | 中国科学院软件研究所 | 一种基于语义三角的领域知识图谱的生成方法及装置 |
CN110472065A (zh) * | 2019-07-25 | 2019-11-19 | 电子科技大学 | 基于gcn孪生网络的跨语言知识图谱实体对齐方法 |
CN110968700A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种融合多类事理与实体知识的领域事件图谱构建方法和装置 |
CN111339299A (zh) * | 2020-02-27 | 2020-06-26 | 北京明略软件系统有限公司 | 一种领域知识库的构建方法和装置 |
CN111428053A (zh) * | 2020-03-30 | 2020-07-17 | 西安交通大学 | 一种面向税务领域知识图谱的构建方法 |
CN111538844A (zh) * | 2020-03-20 | 2020-08-14 | 华为技术有限公司 | 目标领域知识库的生成、问题解答方法及装置 |
CN111914569A (zh) * | 2020-08-10 | 2020-11-10 | 哈尔滨安天科技集团股份有限公司 | 基于融合图谱的预测方法、装置、电子设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7958074B2 (en) * | 2002-12-23 | 2011-06-07 | International Business Machines Corporation | Method and structure for domain-independent modular reasoning and relation representation for entity-relation based information structures |
US9996567B2 (en) * | 2014-05-30 | 2018-06-12 | Georgetown University | Process and framework for facilitating data sharing using a distributed hypergraph |
US20200412767A1 (en) * | 2015-10-28 | 2020-12-31 | Qomplx, Inc. | Hybrid system for the protection and secure data transportation of convergent operational technology and informational technology networks |
US10614086B2 (en) * | 2018-07-06 | 2020-04-07 | Accenture Global Solutions Limited | Orchestrated hydration of a knowledge graph |
-
2021
- 2021-01-28 CN CN202110117804.XA patent/CN112784064B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106600065A (zh) * | 2016-12-16 | 2017-04-26 | 中山大学 | 基于有向超图的个性化学习路径的抽取与拼接方法及系统 |
CN106874261A (zh) * | 2017-03-17 | 2017-06-20 | 中国科学院软件研究所 | 一种基于语义三角的领域知识图谱及查询方法 |
CN107609052A (zh) * | 2017-08-23 | 2018-01-19 | 中国科学院软件研究所 | 一种基于语义三角的领域知识图谱的生成方法及装置 |
CN110472065A (zh) * | 2019-07-25 | 2019-11-19 | 电子科技大学 | 基于gcn孪生网络的跨语言知识图谱实体对齐方法 |
CN110968700A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种融合多类事理与实体知识的领域事件图谱构建方法和装置 |
CN111339299A (zh) * | 2020-02-27 | 2020-06-26 | 北京明略软件系统有限公司 | 一种领域知识库的构建方法和装置 |
CN111538844A (zh) * | 2020-03-20 | 2020-08-14 | 华为技术有限公司 | 目标领域知识库的生成、问题解答方法及装置 |
CN111428053A (zh) * | 2020-03-30 | 2020-07-17 | 西安交通大学 | 一种面向税务领域知识图谱的构建方法 |
CN111914569A (zh) * | 2020-08-10 | 2020-11-10 | 哈尔滨安天科技集团股份有限公司 | 基于融合图谱的预测方法、装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
Knowledge Hypergraphs: Extending Knowledge Graphs Beyond Binary Relations;Bahare Fatemi等;《https://arxiv.org/abs/1906.00137v1》;20190101;第1-11页 * |
知识图谱综述——表示、构建、推理与知识超图理论;田玲等;《计算机应用》;20210629;第41卷(第8期);第2161-2186页 * |
雷达及关联装备情报知识图谱构建方法研究;郝瑞哲;《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》;20200215(第2期);第C032-21页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112784064A (zh) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kent | Data construction and data analysis for survey research | |
Changchien et al. | Mining association rules procedure to support on-line recommendation by customers and products fragmentation | |
Panniello et al. | Experimental comparison of pre-vs. post-filtering approaches in context-aware recommender systems | |
Liu et al. | Using context similarity for service recommendation | |
CN101454771A (zh) | 基于使用多媒体调查特征匹配以划分和标记个体的系统和方法 | |
Mohammadi et al. | Using the opinion leaders in social networks to improve the cold start challenge in recommender systems | |
Zhang | Personalised product recommendation model based on user interest | |
CN112784064B (zh) | 一种面向社交网络的层次化超维知识图谱构建方法 | |
CN114723535A (zh) | 一种基于供应链与知识图谱的物品推荐方法、设备及介质 | |
Mohamed et al. | Sparsity and cold start recommendation system challenges solved by hybrid feedback | |
CN112560105B (zh) | 保护多方数据隐私的联合建模方法及装置 | |
Ren et al. | A survey of recommendation techniques based on offline data processing | |
Prabakaran et al. | A survey on recommendation systems using collaborative filtering techniques | |
CN110020918B (zh) | 一种推荐信息生成方法和系统 | |
CN116402569A (zh) | 基于知识图谱的商品推荐方法、装置、系统及存储介质 | |
Liao et al. | A rough set-based association rule approach implemented on a brand trust evaluation model | |
CN114861079A (zh) | 一种融合商品特征的协同过滤推荐方法和系统 | |
Hung | Using Cloud Services to Develop Marketing Information System Applications | |
Chawla et al. | New User Product Recommendation for Q-commerce via Hierarchical Cross-Domain Learning | |
Sun et al. | Feature engineering for search advertising recognition | |
Chen et al. | Pattern filtering and classification for market basket analysis with profit‐based measures | |
Liao et al. | Mining customer knowledge for channel and product segmentation | |
Liu et al. | Using contextual information for service recommendation | |
Li | Research on e-business requirement information resource extraction method in network big data | |
Somya et al. | A hybrid recommender system based on customer behavior and transaction data using generalized sequential pattern algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |