CN111125376A - 知识图谱生成方法、装置、数据处理设备及存储介质 - Google Patents

知识图谱生成方法、装置、数据处理设备及存储介质 Download PDF

Info

Publication number
CN111125376A
CN111125376A CN201911336710.0A CN201911336710A CN111125376A CN 111125376 A CN111125376 A CN 111125376A CN 201911336710 A CN201911336710 A CN 201911336710A CN 111125376 A CN111125376 A CN 111125376A
Authority
CN
China
Prior art keywords
knowledge
graph
data
user
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911336710.0A
Other languages
English (en)
Other versions
CN111125376B (zh
Inventor
吴明平
梁新敏
陈羲
吴明辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Miaozhen Information Technology Co Ltd
Original Assignee
Miaozhen Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Miaozhen Information Technology Co Ltd filed Critical Miaozhen Information Technology Co Ltd
Priority to CN201911336710.0A priority Critical patent/CN111125376B/zh
Publication of CN111125376A publication Critical patent/CN111125376A/zh
Application granted granted Critical
Publication of CN111125376B publication Critical patent/CN111125376B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种知识图谱生成方法、装置、数据处理设备及存储介质。该方法根据第一知识图谱中各用户的特征向量与第二知识图谱中各用户的特征向量,将第一知识图谱中的用户与第二知识图谱中的用户进行融合,继而使得融合后的知识图谱能够统一表示同一用户在第一类型数据以及第二类型数据中的属性信息以及行为信息,继而能够提高基于该融合后的知识图谱的各项策略的执行效果。

Description

知识图谱生成方法、装置、数据处理设备及存储介质
技术领域
本申请涉及数据处理领域,具体而言,涉及一种知识图谱生成方法、装置、数据处理设备及存储介质。
背景技术
随着互联网的发展,网络数据内容呈现爆炸式增长的态势。知识图谱以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础。
例如,通过知识图谱在电商领域进行商品推荐也变得越来越广泛。然而,通过知识图谱在电商领域进行商品推荐时,针对一些不仅拥有线上门店,而且还拥有线下门店的品牌,由于其线下门店与线上门店的销售模式的差异,使得线上门店与线下门店之间,无论是数据的类型还是数据的组织方式都不相同。数据的类型的不同以及数据组织方式的不能导致线下门店的数据与线上门店的数据不能很好的通过知识图谱进行整合用以分析用户的消费行为。
发明内容
为了克服现有技术中的至少一个不足,本申请实施例的目的之一在于提供一种知识图谱生成方法,应用于数据处理设备,所述方法包括:
获取记录有用户属性及行为信息的第一类型数据以及第二类型数据;
生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱;
获取所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量;
根据所述特征向量计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度;
将所述相似度大于预设融合阈值的第一知识图谱中的用户与第二知识图谱中的用户进行融合,获得融合后的知识图谱。
可选地,所述获取所述第一知识图谱中的用户的特征向量与所述第二知识图谱中的用户的特征向量的步骤,包括:
通过图嵌入算法对第一知识图谱中各用户的数据以及第二知识图谱中各用户的数据进行分析,获得所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量。
可选地,所述根据所述特征向量计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度的步骤,包括:
根据所述特征向量,通过余弦相似度算法计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度。
可选地,所述生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱的步骤,包括:
基于预设的数据关系的描述,对所述第一类型数据以及所述第二类型数据进行解析,生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱。
可选地,所述第一类型数据与所述第二类型数据属于同一品牌,其中,第一类型数据为该品牌线上门店的用户访问数据,所述第二类型数据为该品牌线下门店的用户访问数据。
本申请实施例的目的之二在于提供一种知识图谱生成装置,应用于数据处理设备,该知识图谱生成装置包括数据获取模块、图谱生成模块、向量获取模块、相似度计算模块以及用户融合模块;
所述数据获取模块用于获取记录有用户属性及行为信息的第一类型数据以及第二类型数据;
所述图谱生成模块用于生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱;
所述向量获取模块用于获取所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量;
所述相似度计算模块用于根据所述特征向量计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度;
所述用户融合模块用于将所述相似度大于预设融合阈值的第一知识图谱中的用户与第二知识图谱中的用户进行融合,获得融合后的知识图谱。
可选地,所述向量获取模块通过如下方式获取所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量:
通过图嵌入算法对第一知识图谱中各用户的数据以及第二知识图谱中各用户的数据进行分析,获得所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量。
可选地,所述相似度计算模块通过如下方式计算计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度:
根据所述特征向量,通过余弦相似度算法计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度。
本申请实施例的目的之三在于提供一种数据处理设备,所述数据处理设备包括处理器以及存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述机器可执行指令被所述处理器执行时,实现所述的知识图谱生成方法。
本申请实施例的目的之四在于提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现所述的知识图谱生成方法。
相对于现有技术而言,本申请具有以下有益效果:
本申请实施例提供一种知识图谱生成方法、装置、数据处理设备及存储介质。该方法根据第一知识图谱中各用户的特征向量与第二知识图谱中各用户的特征向量,将第一知识图谱中的用户与第二知识图谱中的用户进行融合,继而使得融合后的知识图谱能够统一表示同一用户在第一类型数据以及第二类型数据中的属性信息以及行为信息,继而能够提高基于该融合后的知识图谱的各项策略的执行效果。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的数据处理设备的硬件结构图;
图2为本申请实施例提供的知识图谱生成方法的步骤流程图;
图3为本申请实施例提供的知识图谱的示意图;
图4为本申请实施例提供的知识图谱生成装置的结构示意图。
图标:100-数据处理设备;110-知识图谱生成装置;120-存储器;130-处理器;1101-数据获取模块;1102-图谱生成模块;1103-向量获取模块;1104-相似度计算模块;1105-用户融合模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
如背景技术部分所介绍,针对一些不仅拥有线上门店,而且还拥有线下门店的品牌,由于其线下门店与线上门店的销售模式的差异,使得线上门店与线下门店之间,无论是数据的类型还是数据的组织方式都不相同。数据的类型的不同以及数据组织方式的不能导致线下门店的数据与线上门店的数据不能很好的通过知识图谱进行整合用以分析用户的消费行为
鉴于此,本申请实施例提供给一种知识图谱生成方法,应用于数据处理设备。
其中,该数据处理设备可以是,但不限于,智能手机、个人电脑(personalcomputer,PC)、平板电脑、个人数字助理(personal digital assistant,PDA)、移动上网设备(mobile Internet device,MID)、服务器等。
请参照图1,为本申请实施例提供的数据处理设备100的硬件结构示意图。该数据处理设备100包括知识图谱生成装置110、存储器120以及处理器130。
所述存储器120、处理器130各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述知识图谱生成装置110包括至少一个可以软件或固件(Firmware)的形式存储于所述存储器120中或固化在所述数据处理设备100的操作系统(Operating System,OS)中的软件功能模块。所述处理器130用于执行所述存储器120中存储的可执行模块,例如所述知识图谱生成装置110所包括的软件功能模块及计算机程序等。
其中,所述存储器120可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,存储器120用于存储程序,所述处理器130在接收到执行指令后,执行所述程序。
所述处理器130可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
请参照图1,为应用于图1所示数据处理设备100的知识图谱生成方法的步骤流程图。以下将对所述方法包括各个步骤进行详细阐述。
步骤S100,获取记录有用户属性及行为信息的第一类型数据以及第二类型数据。
步骤S200,生成第一类型数据的第一知识图谱以及第二类型数据的第二知识图谱。
步骤S300,获取第一知识图谱中各用户的特征向量与第二知识图谱中各用户的特征向量。
步骤S400,根据特征向量计算第一知识图谱中的用户与第二知识图谱中的用户之间的相似度。
步骤S500,将相似度大于预设融合阈值的第一知识图谱中的用户与第二知识图谱中的用户进行融合,获得融合后的知识图谱。
通过上述方法,根据第一知识图谱中各用户的特征向量与第二知识图谱中各用户的特征向量,将第一知识图谱中的用户与第二知识图谱中的用户进行融合,继而使得融合后的知识图谱能够统一表示同一用户在第一类型数据以及第二类型数据中的属性信息以及行为信息,继而能够提高基于该融合后的知识图谱的各项策略的执行效果。
针对该第一类型数据以及第二类型数据,作为一种可能的实施方式,该第一类型数据与第二类型数据属于同一品牌,其中,该第一类型数据为该品牌的线上门店的用户访问数据,该第二类型数据为该品牌线下门店的用户访问数据。
应理解,由于线上销售模式与线下销售模式的不同,使得第一类型数据与第二类型数据无论是在数据类型还是数据结构存在一定的不同。例如,线下门店的用户访问数据可以包括用户的个人信息以及在线下门店的购买记录。
其中,用户的个人信息包括该用户在线下门店的会员ID、入会时间、生日、性别以及年龄等信息。线下门店的购买记录包括购买商品的类型、购买时间以及购买数量等信息。
线上门店的用户访问数据可以包括品牌的粉丝群数据、线上门店交易数据以及公众号统计信息。
其中,粉丝群数据包括粉丝群名称、群成员的ID、群成员的聊天记录、群成员的生日、群成员的性别、群成员的年龄及群成员的地域等信息。
线上门店交易数据包括用户的ID、用户订单记录、用户的浏览记录、用户的查询记录、用户的评论信息、用户的年龄、用户的性别以及用户的地域等信息。
同时,值得说明的是,用于同一用户在线上与线下的注册方式采用的方式不一样,导致同一用户在线上的用户标识与线下的用户标识不同。又因为线上门店的用户访问数据与线下门店的用户访问数据在数据类型与数据结构之间的差异,导致不能使用同一套数据关系的描述来描述线上门店的用户访问数据与线下门店的用户访问数据。
基于上述原因,需要预先设计两套数据关系的描述用以描述线上门店的用户访问数据以及线下门店的用户访问数据。该数据处理设备100根据两套数据关系的描述分别生成第一知识图谱与第二知识图谱,其中,第一知识图谱与线上门店的用户访问数据对应,第二知识图谱与线下门店的用户访问数据相互对应。
应理解,该数据关系的描述用于针对不同的数据源抽象出数据源中各类别数据共有的特征。例如,若该数据源为学生的考试成绩数据,则该考试成绩数据的数据关系的描述主要包括学生的班级、学生的年纪、学生的考试成绩以及学生的年纪排名等。
若该数据源为用户的网购消费数据,则该网购消费数据的数据关系的描述主要包括用户购买商品、用户浏览商品、用户的年龄、用户的国籍、用户的地域、被推荐用户以及用户的网购时间等。请参照图3,为本申请基于该网购消费数据的数据关系的描述生成的知识图谱。
针对获取所述第一知识图谱中的用户的特征向量与所述第二知识图谱中的用户的特征向量时,作为一种可能的实施方式,该数据处理设备100通过图嵌入算法对第一知识图谱中各用户的数据以及第二知识图谱中各用户的数据进行分析,获得所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量。
具体的,该数据处理设备100通过图嵌入算法对第一知识图谱中各用户的数据以及第二知识图谱中各用户的数据进行分析,获得所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量。
应理解,该第一知识图谱与第二知识图谱通过图谱的形式展现用户的属性信息以及行为信息。图嵌入算法能够用于提取图谱中的特征信息提取成特征向量以便于进行相似度计算。其中,该数据处理设备100所获得的特征向量携带有用户直接特征以及隐含特征。
例如,该直接特征可以是用户购买了某个类型的化妆品,该隐含特征可以是综合用户对颜色的偏好、年纪、地域以及消费水平等因素,决定该用户可能会喜欢某个类别的化妆品。
在根据所述特征向量计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度时,作为一种可能的实施方式,该数据处理设备100根据所述特征向量,通过余弦相似度算法计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度。
基于该相似度,若该相似度大于预设融合阈值,则说明第一知识图谱中的用户与所述第二知识图谱中的用户为同一个用户,则可以将两者进行融合。
具体的,该余弦相似度算法的形式如下:
Figure BDA0002331152670000091
式中,Xi表示第一图谱中第i个用户的特征向量,Yi表示第二图谱中第i个用户的特征向量。n表示该特征向量的维度。
应理解,相同的用户在线上门店的用户访问数据与线下门店的用户访问数据,虽然数据类型与数据结构存在一些不同,但数据中携带有该用户一些共有的特征。基于此原理,该数据处理设备100先通过图嵌入算法发掘出第一知识图谱与第二知识图谱中用户的特征信息,然后通过余弦相似度算法基于用户的特征信息找出相同用户。
值得说明的是,根据所述特征向量计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度不仅限于上述方式,还可以包括其他方式,本申请实施例不做具体的限定。
基于同一发明构思,本申请实施例还提供一种知识图谱生成装置110。请参照图4,该知识图谱生成装置110包括至少一个可以软件形式存储于存储器120中的功能模块。从功能上划分,该知识图谱生成装置110可以包括数据获取模块1101、图谱生成模块1102、向量获取模块1103、相似度计算模块1104以及用户融合模块1105。
该数据获取模块1101用于获取记录有用户属性及行为信息的第一类型数据以及第二类型数据。
在本申请实施例中,该数据获取模块1101用于执行图2中的步骤S100,关于该数据获取模块1101的详细描述,可以参考步骤S100的详细描述。
该图谱生成模块1102用于生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱。
在本申请实施例中,该图谱生成模块1102用于执行图2中的步骤S200,关于该图谱生成模块1102的详细描述,可以参考步骤S200的详细描述。
该向量获取模块1103用于获取所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量。
在本申请实施例中,该向量获取模块1103用于执行图2中的步骤S300,关于该向量获取模块1103的详细描述,可以参考步骤S300的详细描述。
该相似度计算模块1104用于根据所述特征向量计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度。
在本申请实施例中,该相似度计算模块1104用于执行图2中的步骤S400,关于该相似度计算模块1104的详细描述,可以参考步骤S400的详细描述。
该用户融合模块1105用于将所述相似度大于预设融合阈值的第一知识图谱中的用户与第二知识图谱中的用户进行融合,获得融合后的知识图谱。
在本申请实施例中,该用户融合模块1105用于执行图2中的步骤S500,关于该用户融合模块1105的详细描述,可以参考步骤S500的详细描述。
可选地,所述向量获取模块1103通过如下方式获取所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量:
通过图嵌入算法对第一知识图谱中各用户的数据以及第二知识图谱中各用户的数据进行分析,获得所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量。
可选地,所述相似度计算模块1104通过如下方式计算计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度:
根据所述特征向量,通过余弦相似度算法计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度。
本申请实施例还提供一种数据处理设备100,所述数据处理设备100包括处理器130以及存储器120,所述存储器120存储有能够被所述处理器执行的机器可执行指令,所述机器可执行指令被所述处理器130执行时,实现所述的知识图谱生成方法。
本申请实施例还提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器130执行时,实现所述的知识图谱生成方法。
综上所述,本申请实施例提供给一种知识图谱生成方法、装置、数据处理设备及存储介质。该方法根据第一知识图谱中各用户的特征向量与第二知识图谱中各用户的特征向量,将第一知识图谱中的用户与第二知识图谱中的用户进行融合,继而使得融合后的知识图谱能够统一表示同一用户在第一类型数据以及第二类型数据中的属性信息以及行为信息,继而能够提高基于该融合后的知识图谱的各项策略的执行效果。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述,仅为本申请的各种实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种知识图谱生成方法,其特征在于,应用于数据处理设备,所述方法包括:
获取记录有用户属性及行为信息的第一类型数据以及第二类型数据;
生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱;
获取所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量;
根据所述特征向量计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度;
将所述相似度大于预设融合阈值的第一知识图谱中的用户与第二知识图谱中的用户进行融合,获得融合后的知识图谱。
2.根据权利要求1所述的知识图谱生成方法,其特征在于,所述获取所述第一知识图谱中的用户的特征向量与所述第二知识图谱中的用户的特征向量的步骤,包括:
通过图嵌入算法对第一知识图谱中各用户的数据以及第二知识图谱中各用户的数据进行分析,获得所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量。
3.根据权利要求1所述的知识图谱生成方法,其特征在于,所述根据所述特征向量计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度的步骤,包括:
根据所述特征向量,通过余弦相似度算法计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度。
4.根据权利要求1所述的知识图谱生成方法,其特征在于,所述生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱的步骤,包括:
基于预设的数据关系的描述,对所述第一类型数据以及所述第二类型数据进行解析,生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱。
5.根据权利要求1所述的知识图谱生成方法,其特征在于,所述第一类型数据与所述第二类型数据属于同一品牌,其中,第一类型数据为该品牌线上门店的用户访问数据,所述第二类型数据为该品牌线下门店的用户访问数据。
6.一种知识图谱生成装置,其特征在于,应用于数据处理设备,该知识图谱生成装置包括数据获取模块、图谱生成模块、向量获取模块、相似度计算模块以及用户融合模块;
所述数据获取模块用于获取记录有用户属性及行为信息的第一类型数据以及第二类型数据;
所述图谱生成模块用于生成所述第一类型数据的第一知识图谱以及所述第二类型数据的第二知识图谱;
所述向量获取模块用于获取所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量;
所述相似度计算模块用于根据所述特征向量计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度;
所述用户融合模块用于将所述相似度大于预设融合阈值的第一知识图谱中的用户与第二知识图谱中的用户进行融合,获得融合后的知识图谱。
7.根据权利要求6所述的知识图谱生成装置,其特征在于,所述向量获取模块通过如下方式获取所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量:
通过图嵌入算法对第一知识图谱中各用户的数据以及第二知识图谱中各用户的数据进行分析,获得所述第一知识图谱中各用户的特征向量与所述第二知识图谱中各用户的特征向量。
8.根据权利要求6所述的知识图谱生成装置,其特征在于,所述相似度计算模块通过如下方式计算计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度:
根据所述特征向量,通过余弦相似度算法计算所述第一知识图谱中的用户与所述第二知识图谱中的用户之间的相似度。
9.一种数据处理设备,其特征在于,所述数据处理设备包括处理器以及存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述机器可执行指令被所述处理器执行时,实现如权利要求1-5任一项所述的知识图谱生成方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-5任一项所述的知识图谱生成方法。
CN201911336710.0A 2019-12-23 2019-12-23 知识图谱生成方法、装置、数据处理设备及存储介质 Active CN111125376B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911336710.0A CN111125376B (zh) 2019-12-23 2019-12-23 知识图谱生成方法、装置、数据处理设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911336710.0A CN111125376B (zh) 2019-12-23 2019-12-23 知识图谱生成方法、装置、数据处理设备及存储介质

Publications (2)

Publication Number Publication Date
CN111125376A true CN111125376A (zh) 2020-05-08
CN111125376B CN111125376B (zh) 2023-08-29

Family

ID=70501166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911336710.0A Active CN111125376B (zh) 2019-12-23 2019-12-23 知识图谱生成方法、装置、数据处理设备及存储介质

Country Status (1)

Country Link
CN (1) CN111125376B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625655A (zh) * 2020-05-12 2020-09-04 埃睿迪信息技术(北京)有限公司 基于知识图谱的归并以及分类方法、装置以及存储介质
CN112102029A (zh) * 2020-08-20 2020-12-18 浙江大学 一种基于知识图谱的长尾推荐计算方法
CN112685571A (zh) * 2020-12-28 2021-04-20 中国南方电网有限责任公司超高压输电公司 一种基于大数据的知识图谱生成推荐系统
CN113742531A (zh) * 2020-05-27 2021-12-03 杭州海康威视数字技术股份有限公司 一种图推荐方法、装置及电子设备
CN114741521A (zh) * 2022-03-03 2022-07-12 清华大学 临床研究数据的集成方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484459A (zh) * 2014-12-29 2015-04-01 北京奇虎科技有限公司 一种对知识图谱中的实体进行合并的方法及装置
CN108733798A (zh) * 2018-05-17 2018-11-02 电子科技大学 一种基于知识图谱的个性化推荐方法
CN109597856A (zh) * 2018-12-05 2019-04-09 北京知道创宇信息技术有限公司 一种数据处理方法、装置、电子设备及存储介质
CN109739939A (zh) * 2018-12-29 2019-05-10 颖投信息科技(上海)有限公司 知识图谱的数据融合方法和装置
US20190220752A1 (en) * 2017-12-08 2019-07-18 Beijing Baidu Netcom Science And Technology Co., Ltd. Method, apparatus, server, and storage medium for incorporating structured entity
CN110335112A (zh) * 2019-06-18 2019-10-15 中国平安财产保险股份有限公司 一种产品推荐方法、装置及计算机存储介质
CN110457486A (zh) * 2019-07-05 2019-11-15 中国人民解放军战略支援部队信息工程大学 基于知识图谱的人物实体对齐方法及装置
CN110457502A (zh) * 2019-08-21 2019-11-15 京东方科技集团股份有限公司 构建知识图谱方法、人机交互方法、电子设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484459A (zh) * 2014-12-29 2015-04-01 北京奇虎科技有限公司 一种对知识图谱中的实体进行合并的方法及装置
US20190220752A1 (en) * 2017-12-08 2019-07-18 Beijing Baidu Netcom Science And Technology Co., Ltd. Method, apparatus, server, and storage medium for incorporating structured entity
CN108733798A (zh) * 2018-05-17 2018-11-02 电子科技大学 一种基于知识图谱的个性化推荐方法
CN109597856A (zh) * 2018-12-05 2019-04-09 北京知道创宇信息技术有限公司 一种数据处理方法、装置、电子设备及存储介质
CN109739939A (zh) * 2018-12-29 2019-05-10 颖投信息科技(上海)有限公司 知识图谱的数据融合方法和装置
CN110335112A (zh) * 2019-06-18 2019-10-15 中国平安财产保险股份有限公司 一种产品推荐方法、装置及计算机存储介质
CN110457486A (zh) * 2019-07-05 2019-11-15 中国人民解放军战略支援部队信息工程大学 基于知识图谱的人物实体对齐方法及装置
CN110457502A (zh) * 2019-08-21 2019-11-15 京东方科技集团股份有限公司 构建知识图谱方法、人机交互方法、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
贾中浩;古天龙;宾辰忠;常亮;张伟涛;朱桂明;: "旅游知识图谱特征学习的景点推荐", 智能系统学报, no. 03 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625655A (zh) * 2020-05-12 2020-09-04 埃睿迪信息技术(北京)有限公司 基于知识图谱的归并以及分类方法、装置以及存储介质
CN113742531A (zh) * 2020-05-27 2021-12-03 杭州海康威视数字技术股份有限公司 一种图推荐方法、装置及电子设备
CN113742531B (zh) * 2020-05-27 2023-09-01 杭州海康威视数字技术股份有限公司 一种图推荐方法、装置及电子设备
CN112102029A (zh) * 2020-08-20 2020-12-18 浙江大学 一种基于知识图谱的长尾推荐计算方法
CN112685571A (zh) * 2020-12-28 2021-04-20 中国南方电网有限责任公司超高压输电公司 一种基于大数据的知识图谱生成推荐系统
CN114741521A (zh) * 2022-03-03 2022-07-12 清华大学 临床研究数据的集成方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111125376B (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
CN109559208B (zh) 一种信息推荐方法、服务器及计算机可读介质
CN111125376B (zh) 知识图谱生成方法、装置、数据处理设备及存储介质
JP6615362B2 (ja) ユーザー似顔絵を取得する方法及び装置
US9563705B2 (en) Re-ranking results in a search
US20080270248A1 (en) System and device for social shopping on-line
WO2017157149A1 (zh) 基于社交网络的推荐方法、装置、服务器及存储介质
KR102346200B1 (ko) 온라인 경험들에서의 이모지 이해
CA3115216C (en) Methods, systems, and media for data anonymization
CN112529663B (zh) 商品推荐方法、装置、终端设备及存储介质
AU2013246140B2 (en) Discovering spam merchants using product feed similarity
CN110807669B (zh) 一种跨平台的用户信息管理方法和装置
JP2018045553A (ja) 選択装置、選択方法および選択プログラム
US10489444B2 (en) Using image recognition to locate resources
Najafi et al. Investigation of the correlation between trust and reputation in B2C e-commerce using Alexa ranking
CN111782946A (zh) 书友推荐方法、计算设备及计算机存储介质
CN111787042B (zh) 用于推送信息的方法和装置
CN108596712B (zh) 基于物品序列的单类协同过滤方法、存储介质及服务器
US20190318386A1 (en) Information processing method, program, information processing system, and information processing apparatus
CN113781180B (zh) 一种物品推荐方法、装置、电子设备及存储介质
JP6679415B2 (ja) 選択装置、選択方法および選択プログラム
CN111178974B (zh) 一种提高多平台融合性的方法和装置
JP2017076376A (ja) 算出装置、算出方法および算出プログラム
JP6007300B1 (ja) 算出装置、算出方法および算出プログラム
KR101772665B1 (ko) 온라인 쇼핑몰 제공 방법 및 온라인 쇼핑몰 제공 장치
KR102674221B1 (ko) 의류 사이즈 추천 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant