CN112989030A - 一种相似产品关系的可视化方法和系统 - Google Patents

一种相似产品关系的可视化方法和系统 Download PDF

Info

Publication number
CN112989030A
CN112989030A CN202110275344.3A CN202110275344A CN112989030A CN 112989030 A CN112989030 A CN 112989030A CN 202110275344 A CN202110275344 A CN 202110275344A CN 112989030 A CN112989030 A CN 112989030A
Authority
CN
China
Prior art keywords
product
similar
database
products
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110275344.3A
Other languages
English (en)
Inventor
刘征
王鑫
邵明
王霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Art
Original Assignee
China Academy of Art
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Art filed Critical China Academy of Art
Priority to CN202110275344.3A priority Critical patent/CN112989030A/zh
Publication of CN112989030A publication Critical patent/CN112989030A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种相似产品关系的可视化方法和系统,所述方法包括如下步骤:选定产品的属性种类和数目;建立产品数据库,获取产品数据库中每一产品的属性,根据所述属性建立产品数据库每一产品特征值集合;获取用户选定产品,获取选定产品属性,建立选定产品的特征值集合;计算数据库中产品特征值集合和选定产品特征值集合的余弦相似度;根据所述余弦相似度构建以选中产品为中心的可视化知识图谱。所述方法和系统采用知识图谱向用户展示选中产品的相似产品,可视化的知识图谱可以提高用户的购物体验,所述方法和系统根据选定产品的属性构建特征词的集合,通过计算和特征集合中相同属性的产品个数,并通过余弦相似度判断产品的相似度大小。

Description

一种相似产品关系的可视化方法和系统
技术领域
本发明涉及产品可视化领域,特别涉及一种相似产品关系的可视化方法和系统。
背景技术
在日益数字化的当今世界,海量的产品数据充斥着互联网,而这些海量的信息往往是杂乱无章的。在海量的数据中,也不全是有用的数据。实现产品同类推荐是许多电商网站都有的一个功能,可以适当地吸引消费、提供给消费者更多选择。当需要从以某一产品信息为出发点,找到其类似产品以及这些类似产品的关系网络时,上述的海量信息就成了“推荐类似产品”这一功能实现的阻碍。
因此,需要采取适当的方法来对海量数据进行处理,从中获取类似产品关系网络的相关信息。现有技术中仅仅计算存在的相似产品,并且相似产品之间的相似度关系并未清楚展示,现有电商仅仅是根据用户买过的产品计算用户可能会购买的产品,对于用户新的购物意愿而言,现有技术无法直观的。
发明内容
本发明其中一个发明目的在于提供一种相似产品关系的可视化方法和系统,所述方法和系统采用知识图谱向用户展示选中产品的相似产品,可视化的知识图谱可以提高用户的购物体验。
本发明另一个发明目的在于提供一种相似产品关系的可视化方法和系统,所述方法和系统根据选定产品的属性构建特征词的集合,通过计算和特征集合中相同属性的产品个数,并通过余弦相似度判断产品的相似度大小。
本发明另一个发明目的在于提供一种相似产品关系的可视化方法和系统,所述方法和系统计算和选定产品之间的余弦相似度后,根据余弦相似度的值进行相似产品知识图谱的构建,从而可以清楚展现出选定产品和相似产品的相似度。
为了实现至少一个上述发明目的,本发明进一步提供一种相似产品关系的可视化方法,所述方法包括如下步骤:
选定属性种类和数目;
建立产品数据库,获取产品数据库中每一产品的属性,根据所述属性建立产品数据库每一产品特征值集合;
获取用户选定产品,获取选定产品属性,建立选定产品的特征值集合;
计算数据库中产品特征值集合和选定产品特征值集合的余弦相似度;
根据所述余弦相似度构建以选中产品为中心的可视化知识图谱。
根据本发明其中一个较佳实施例,所述所述属性包括:产品品种、产品品牌、产品价位、上市日期和产品定位,计算并获取选定产品和数据库产品的属性数据,将所述属性数据作为产品特征值保存。
根据本发明另一个较佳实施例,根据用户选定产品属性数据计算用户选定产品的特征值集合,所述特征值集合为0或1的集合,其中0表示选定产品没有该属性数据,1表示存在该属性数据,并保存选定产品的特征值集合。
根据本发明另一个较佳实施例,根据产品数据库中每一产品的属性计算产品数据库中的每一产品特征值集合,所述产品数据库中产品的特征值集合为0或1的集合,其中0表示产品没有该属性数据,1表示存在该属性数据,并产品数据库中每一产品的特征值集合。
根据本发明另一个较佳实施例,根据所述选定产品的特征值集和产品数据库中每一产品的特征值集合计算和选定产品的余弦相似度。
根据本发明另一个较佳实施例,设定余弦相似度阈值,将数据库中产品和所述选定产品之间的余弦相似度值大于所述余弦相似度阈值的产品为相似产品保存,用于构建选定产品的相似产品知识图谱。
根据本发明另一个较佳实施例,采用中心力模型构建选定产品对应的相似产品结构化的知识图谱,将相似产品名称和选定产品名称输入对应的力节点,并将所述知识图谱可视化展示。
根据本发明另一个较佳实施例,选定相似产品和选定产品力节点之间的距离范围,在所述距离范围内根据每一相似产品的余弦相似度大小和所述选定产品节点连线,其中余弦相似度越大,连接距离越短。
为了实现至少一个上述发明目的,本发明进一步提供一种相似产品关系的可视化系统,所述系统采用上述一种相似产品关系的可视化方法。
为了实现至少一个上述发明目的,本发明进一步提供计算机可读存储介质,所述计算机可读存储介质保存上述一种相似产品关系的可视化系统。
附图说明
图1显示的是本发明一种相似产品关系的可视化方法的流程示意图;
图2为本发明一种相似产品关系的可视化方法中的数据预处理流程示意图;
图3为本发明一种相似产品关系的可视化方法中的计算相似度流程示意图;
图4为本发明一种相似产品关系的可视化方法中的知识图谱构建流程示意图;
图5为本发明一种相似产品关系的可视化方法中的知识图谱可视化流程;
图6为本发明一种相似产品关系的可视化方法中的最终效果示意图。
具体实施方式
以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。
本领域技术人员应理解的是,在本发明的揭露中,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系是基于附图所示的方位或位置关系,其仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此上述术语不能理解为对本发明的限制。
请结合图1-6,本发明公开了一种一种相似产品关系的可视化方法和系统、以及应用该方法的计算机可读介质,其中所述方法包括如下步骤:构建产品的数据库;对产品数据库中的产品数据进行特征值提取;根据产品的特征值进行相似度计算;根据相似度结果构建可视化的知识图谱。其中所述数据库可以为目前已经上架的产品,该产品数据库根据已有的产品构建。
在构建产品数据库后对产品数据库中的产品数据进行预处理,所述预处理的过程包括:输入并定义产品数据库中每一产品的属性,所述属性包括但不仅限于:产品品种、产品品牌、产品价位、上市日期和产品定位等。选择产品的需要的特征值种类和个数,所述特征值为每一产品的属性特征,其中所述产品品种可被划分包括但不仅限于水果类、家电类、通讯类、日常用品类等,产品品牌可根据产品对应的商标获取;产品的价位则可设定一定价格档位,每一价格档位作为一种产品价格上的属性,比如可设定价格1-100,100-1000,1000-2000等价格档位,在本发明其中一个较佳实施例中,可针对同一产品的每一价格档位贴上对应的价格标签,用于判断同一产品的价格高低。所述上市日期为每一产品的初次上市时间。所述产品定位可设定为包括但不仅限于低端、中端和高端等定位标签。
在完成所述产品数据预处理后,通过获取用户端输入的文本或语音信息获取选定产品,并进一步计算并配置选定产品的属性种类和个数,举例来说,选定产品A的属性包括:(华为、通讯产品、6000元,高端机),该四个属性均代表A产品的特征。进一步的,本发明构建特征值集合,所述特征值集合为选定属性对应的数值,需要说明的是所述特征值集合为0或1的集合,也就是说特征值集合内只存在0和1。
进一步的根据选定的属性种类和所述产品数据库中的每一产品的属性进行对比,用于构建产品数据库中每一产品的特征值集合,若数据库产品中存在选定属性相同的属性,则在所述数据库产品特征值集合中对应的值为1,若数据库产品中不存在选定属性相同的属性,则将所述数据库产品特征值集合的该属性定值为0。举例来说,产品数据库中的产品B的属性包括:(通讯产品、1500元,中端机),选定的属性包括:(产品品种、产品品牌、产品价位、上市日期和产品定位),则对于产品品种、产品价位和产品定位对应的特征值定值为1,即表示数据库产品存在选定的属性。上述产品上市日期、产品品牌的特征值定值为0,即表示该产品不存在选定属性中的上市日期。因此,所述特征值集合为:(0,1,1,0)。计算用户选定产品的特征值集合,上述选定产品A的特征值集合为(1,1,1,0)。进一步根据所述特征值集合计算产品A和产品B的相似度,用于筛选和选定产品相似度较大的数据库产品。
获取所述选定产品的特征值集合A和产品数据库中产品的特征值集合B,后,将上述A集合和B集合作为特征值的向量进行余弦相似度计算,所述余弦相似度计算公式为:
Figure BDA0002976400490000041
计算所述产品数据库中所有产品的特征值集合和所述选定产品的特征值集合的余弦相似度,设定余弦相似度阈值,若产品数据库中产品的余弦相似度大于设定的余弦相似度阈值,则判定该产品和所述选定产品的相似产品,保存相似产品的相关数据和链接,作为所述选定产品的可视化知识图谱的构建的基本元素。
进一步的,本发明优选采用力中心模型构建选中产品的知识图谱,由于中心力模型的力导向图构建的知识图谱网络结构都将被选定产品制约,不会出现中心偏离,可以使得当前选定产品及相似产品关系更紧凑、简略。并使得当前选定产品及相似产品关系网络的知识图谱可视化更易理解。具体而言,所述选定产品输入到中心节点,相似产品名称输入到其他节点,相似产品的节点和选定产品之间通过连线连接,设定所述连线的长度L,其中L可设定为1cm≤L≤10cm,根据每一相似产品的余弦相似度大小建立不同长度的连线,并且所述连线的建立规则为:产品数据库中产品和选定产品余弦相似度越大,则对应的连线长度越短。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线段、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线段的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线段、电线段、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
可以理解的是,术语“一”应理解为“至少一”或“一个或多个”,即在一个实施例中,一个元件的数量可以为一个,而在另外的实施例中,该元件的数量可以为多个,术语“一”不能理解为对数量的限制。
本领域的技术人员应理解,上述描述及附图中所示的本发明的实施例只作为举例而并不限制本发明,本发明的目的已经完整并有效地实现,本发明的功能及结构原理已在实施例中展示和说明,在没有背离所述原理下,本发明的实施方式可以有任何变形或修改。

Claims (10)

1.一种相似产品关系的可视化方法,其特征在于,所述方法包括如下步骤:
选定属性种类和数目;
建立产品数据库,获取产品数据库中每一产品的属性,根据所述属性建立产品数据库每一产品特征值集合;
获取用户选定产品,获取选定产品属性,建立选定产品的特征值集合;
计算数据库中产品特征值集合和选定产品特征值集合的余弦相似度;
根据所述余弦相似度构建以选中产品为中心的可视化知识图谱。
2.根据权利要求1所述的一种相似产品关系的可视化方法,其特征在于,所述属性包括:产品品种、产品品牌、产品价位、上市日期和产品定位,计算并获取选定产品和数据库产品的属性数据,将所述属性数据作为产品特征值保存。
3.根据权利要求1所述的一种相似产品关系的可视化方法,其特征在于,根据用户选定产品属性数据计算用户选定产品的特征值集合,所述特征值集合为0或1的集合,其中0表示选定产品没有该属性数据,1表示存在该属性数据,并保存选定产品的特征值集合。
4.根据权利要求3所述的一种相似产品关系的可视化方法,其特征在于,根据产品数据库中每一产品的属性计算产品数据库中的每一产品特征值集合,所述产品数据库中产品的特征值集合为0或1的集合,其中0表示产品没有该属性数据,1表示存在该属性数据,并产品数据库中每一产品的特征值集合。
5.根据权利要求4所述的一种相似产品关系的可视化方法,其特征在于,根据所述选定产品的特征值集和产品数据库中每一产品的特征值集合计算和选定产品的余弦相似度。
6.根据权利要求5所述的一种相似产品关系的可视化方法,其特征在于,设定余弦相似度阈值,将数据库中产品和所述选定产品之间的余弦相似度值大于所述余弦相似度阈值的产品为相似产品保存,用于构建选定产品的相似产品知识图谱。
7.根据权利要求6所述的一种相似产品关系的可视化方法,其特征在于,采用中心力模型构建选定产品对应的相似产品结构化的知识图谱,将相似产品名称和选定产品名称输入对应的力节点,并将所述知识图谱可视化展示。
8.根据权利要求7所述的一种相似产品关系的可视化方法,其特征在于,选定相似产品和选定产品力节点之间的距离范围,在所述距离范围内根据每一相似产品的余弦相似度大小和所述选定产品节点连线,其中余弦相似度越大,连接距离越短。
9.一种相似产品关系的可视化系统,其特征在于,所述系统采用上述权利要求1-8中任意一项所述的一种相似产品关系的可视化方法。
10.一种计算机可读存储介质,所述计算机可读存储介质保存上述权利要求9所述的一种相似产品关系的可视化系统。
CN202110275344.3A 2021-03-15 2021-03-15 一种相似产品关系的可视化方法和系统 Pending CN112989030A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110275344.3A CN112989030A (zh) 2021-03-15 2021-03-15 一种相似产品关系的可视化方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110275344.3A CN112989030A (zh) 2021-03-15 2021-03-15 一种相似产品关系的可视化方法和系统

Publications (1)

Publication Number Publication Date
CN112989030A true CN112989030A (zh) 2021-06-18

Family

ID=76335310

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110275344.3A Pending CN112989030A (zh) 2021-03-15 2021-03-15 一种相似产品关系的可视化方法和系统

Country Status (1)

Country Link
CN (1) CN112989030A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116502716A (zh) * 2023-06-27 2023-07-28 深圳大学 一种知识图谱的布局方法、装置、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898459A (zh) * 2018-06-25 2018-11-27 中国联合网络通信集团有限公司 一种商品推荐方法及装置
CN109697641A (zh) * 2017-10-20 2019-04-30 北京京东尚科信息技术有限公司 计算商品相似度的方法和装置
CN109754295A (zh) * 2017-11-06 2019-05-14 北京京东尚科信息技术有限公司 用于输出信息的方法和装置
CN109816482A (zh) * 2019-01-04 2019-05-28 平安科技(深圳)有限公司 电商平台的知识图谱构建方法、装置、设备及存储介质
CN111369318A (zh) * 2020-02-28 2020-07-03 安徽农业大学 一种基于商品知识图谱特征学习的推荐方法及系统
CN111415216A (zh) * 2020-02-11 2020-07-14 广州探途网络技术有限公司 一种商品推荐方法、装置、服务器及存储介质
CN111695022A (zh) * 2019-01-18 2020-09-22 创新奇智(重庆)科技有限公司 一种基于知识图谱可视化的兴趣搜索方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697641A (zh) * 2017-10-20 2019-04-30 北京京东尚科信息技术有限公司 计算商品相似度的方法和装置
CN109754295A (zh) * 2017-11-06 2019-05-14 北京京东尚科信息技术有限公司 用于输出信息的方法和装置
CN108898459A (zh) * 2018-06-25 2018-11-27 中国联合网络通信集团有限公司 一种商品推荐方法及装置
CN109816482A (zh) * 2019-01-04 2019-05-28 平安科技(深圳)有限公司 电商平台的知识图谱构建方法、装置、设备及存储介质
CN111695022A (zh) * 2019-01-18 2020-09-22 创新奇智(重庆)科技有限公司 一种基于知识图谱可视化的兴趣搜索方法
CN111415216A (zh) * 2020-02-11 2020-07-14 广州探途网络技术有限公司 一种商品推荐方法、装置、服务器及存储介质
CN111369318A (zh) * 2020-02-28 2020-07-03 安徽农业大学 一种基于商品知识图谱特征学习的推荐方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116502716A (zh) * 2023-06-27 2023-07-28 深圳大学 一种知识图谱的布局方法、装置、设备及介质
CN116502716B (zh) * 2023-06-27 2023-09-26 深圳大学 一种知识图谱的布局方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
US11367044B2 (en) Method and apparatus for outputting storage position information
US11182840B2 (en) Systems and methods for mapping a predicted entity to a product based on an online query
CN107679217B (zh) 基于数据挖掘的关联内容提取方法和装置
CN108595448B (zh) 信息推送方法和装置
CN112819512B (zh) 一种文本处理方法、装置、设备及介质
CN107193932B (zh) 信息推送方法和装置
CN113986933A (zh) 物化视图的创建方法、装置、存储介质及电子设备
CN112035753B (zh) 推荐页面生成方法、装置、电子设备和计算机可读介质
JP2011227721A (ja) 関心抽出装置、関心抽出方法、及び関心抽出プログラム
CN109711917A (zh) 信息推送方法和装置
CN112132660A (zh) 商品推荐方法、系统、设备及存储介质
CN110059172B (zh) 基于自然语言理解的推荐答案的方法和装置
CN108984735A (zh) 标签词库更新方法、装置及电子设备
CN112989030A (zh) 一种相似产品关系的可视化方法和系统
CN113658597B (zh) 语音下单方法、装置、电子设备和计算机可读介质
CN108959289B (zh) 网站类别获取方法和装置
CN114036397B (zh) 数据推荐方法、装置、电子设备和介质
CN114492370B (zh) 网页识别方法、装置、电子设备和介质
CN112966098A (zh) 一种产品及其配套用品关系可视化方法和系统
CN113468354A (zh) 推荐图表的方法、装置、电子设备及计算机可读介质
CN114493750A (zh) 推荐物品信息发送方法、装置、设备和计算机可读介质
CN112860858A (zh) 一种回答问题的方法及装置
CN113191840A (zh) 物品信息显示方法、装置、电子设备和计算机可读介质
US20150286692A1 (en) Evaluation result display method, evaluation result display apparatus, and non-transitory computer-readable recording medium storing evaluation result display program
CN107885774B (zh) 数据处理方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination