CN117909514A

CN117909514A - 一种文旅产业场景下的知识图谱设计方法及装置

Info

Publication number: CN117909514A
Application number: CN202410082403.9A
Authority: CN
Inventors: 王晓慧; 宋亚梅; 刘刚
Original assignee: Zhongxing Smart Cloud Enterprise Shandong Technology Co ltd
Current assignee: Zhongxing Smart Cloud Enterprise Shandong Technology Co ltd
Priority date: 2024-01-19
Filing date: 2024-01-19
Publication date: 2024-04-19

Abstract

一种文旅产业场景下的知识图谱设计方法及装置，该方法通过关系抽取从文旅产业文本数据集中提取出命名实体之间的关联关系；通过属性抽取从给定信息源中采集指定实体的属性信息；通过实体链接将从文旅产业文本数据集中抽取的命名实体对象链接到知识库中标准实体对象；通过知识合并融合外部知识库和关系数据库；本体抽取包括实体并列关系相似度计算、实体上下位关系抽取和本体生成；通过知识推理对命名实体的关系、属性值，本体的概念层次关系采用预设算法进行推理；采用D3.js对加工后的文旅产业知识进行知识图谱布局，并采用层级布局的方式展示图谱数据。本发明生成的知识图谱展示效果好，可视化的有效信息多，用户的使用体验好，使用效率高。

Description

一种文旅产业场景下的知识图谱设计方法及装置

技术领域

本发明属于知识图谱技术领域，具体涉及一种文旅产业场景下的知识图谱设计方法及装置。

背景技术

知识图谱是人工智能的重要分支，是一种揭示实体之间关系的语义网络，可以对现实世界的事物及其相互关系进行形式化地描述。对于现实世界中实体之间的关联关系，用知识图谱进行描述显得非常合适。正是由于知识图谱的这种优势，这项技术得到迅速普及，目前在搜索、推荐、广告、问答等多个领域都有相应的解决方案。

现阶段，文旅产业的各个业务场景都有个性化定制布局的需求，在文旅产业业务场景中，用户更倾向于采用分层的方式来观察图谱数据，因为这样有利于理解和分析图谱数据。如何进行文旅产业场景下的知识图谱设计，以帮助文旅产业分析人员快速了解链路故障、组件依赖，及进行查询应用具有现实的意义。

发明内容

为此，本发明提供一种文旅产业场景下的知识图谱设计方法及装置，以帮助文旅产业分析人员快速了解链路故障、组件依赖，及进行查询应用。

为了实现上述目的，本发明提供如下技术方案：一种文旅产业场景下的知识图谱设计方法，包括：

执行文旅产业知识抽取，所述知识抽取的对象包括实体抽取、关系抽取和属性抽取；通过所述实体抽取从文旅产业文本数据集中识别出命名实体；通过所述关系抽取从文旅产业文本数据集中提取出命名实体之间的关联关系；通过所述属性抽取从给定信息源中采集指定实体的属性信息；

执行文旅产业知识融合，所述知识融合包括实体链接和知识合并；通过所述实体链接将从文旅产业文本数据集中抽取的命名实体对象链接到知识库中标准实体对象；通过所述知识合并融合外部知识库和关系数据库；

执行文旅产业知识加工，所述知识加工包括本体抽取、知识推理和质量评估；所述本体抽取包括实体并列关系相似度计算、实体上下位关系抽取和本体生成；通过所述知识推理对命名实体的关系、属性值，本体的概念层次关系采用预设算法进行推理；通过所述质量评估舍弃置信度低于预设阈值的知识；

采用D3.js力学布局工具对加工后的文旅产业知识进行知识图谱布局，知识图谱布局过程中采用层级布局的方式展示图谱数据。

作为文旅产业场景下的知识图谱设计方法优选方案，所述实体链接过程中，根据给定的实体“指称项”，从知识库中选出一组候选实体对象，通过相似度计算将“指称项”链接到正确的实体对象。

作为文旅产业场景下的知识图谱设计方法优选方案，还包括文旅产业知识更新，所述知识更新包括概念层更新和数据层更新；

概念层更新过程中，将新增数据的概念添加到知识库的概念层；

数据层更新过程中，选择在数据源中出现频率达到设置值的事实和属性加入知识库。

作为文旅产业场景下的知识图谱设计方法优选方案，层级布局的形式为聚簇层布局，聚簇层布局步骤包括：

获取知识图谱数据，将所述知识图谱数据的中心节点关联的子节点按关联关系归类，生成聚簇边和聚簇边节点，同时将子节点分层；

预设聚簇力，所述聚簇力的参数包括聚簇中心、力的强度和聚簇半径；对每个子节点进行聚簇力初始化，定义每个子节点的聚簇中心和聚簇半径；

计算子节点与聚簇中心节点坐标偏移量，根据坐标偏移量和聚簇半径的差值，判断子节点的受力方向和大小，经过向量计算得出子节点的坐标。

作为文旅产业场景下的知识图谱设计方法优选方案，还包括对知识图谱进行视觉降噪，视觉降噪包括文字处理，文字处理步骤包括：

对文字进行遮挡检测，根据文字的层叠关系，对文字透明度进行调整，使置于底部的文字透明度低于置于顶部的文字透明度；

采用栅格划分的方式对文字画布进行划分，计算出所有文字节点的平均长宽比，根据划分后栅格的长宽比和文字的平均长宽比确定栅格的方向。

作为文旅产业场景下的知识图谱设计方法优选方案，视觉降噪还包括边处理，边处理过程中通过边夹角偏移量计算和节点半径裁剪，将边与中心节点连结处分散排布在节点周围。

作为文旅产业场景下的知识图谱设计方法优选方案，还包括对知识图谱进行交互设计，交互设计包括画布操作、元素操作和数据操作；

还包括对知识图谱进行路径锁定，通过选取指定节点，计算出指定节点之间的路径进行锁定展现；

还包括对知识图谱进行聚焦展现，对于当前不关注的图谱区域的默认布局密集度大于当前关注的图谱区域的密集度。

作为文旅产业场景下的知识图谱设计方法优选方案，还包括对知识图谱进行多屏适配，多屏适配包括非等比缩放、个性化适配和像素级还原；

还包括对知识图谱进行动画脚本自动化，在无人操作知识图谱时，按照配置的动画脚本循环播放动画；

还包括对知识图谱进行可视化叙事探索，可视化叙事探索包括扫光效果处理、SVG渐变处理和动效节奏调试处理。

本发明还提供一种文旅产业场景下的知识图谱设计装置，包括：

知识抽取模块，用于执行文旅产业知识抽取，所述知识抽取的对象包括实体抽取、关系抽取和属性抽取；通过所述实体抽取从文旅产业文本数据集中识别出命名实体；通过所述关系抽取从文旅产业文本数据集中提取出命名实体之间的关联关系；通过所述属性抽取从给定信息源中采集指定实体的属性信息；

知识融合模块，用于执行文旅产业知识融合，所述知识融合包括实体链接和知识合并；通过所述实体链接将从文旅产业文本数据集中抽取的命名实体对象链接到知识库中标准实体对象；通过所述知识合并融合外部知识库和关系数据库；

知识加工模块，用于执行文旅产业知识加工，所述知识加工包括本体抽取、知识推理和质量评估；所述本体抽取包括实体并列关系相似度计算、实体上下位关系抽取和本体生成；通过所述知识推理对命名实体的关系、属性值，本体的概念层次关系采用预设算法进行推理；通过所述质量评估舍弃置信度低于预设阈值的知识；

知识图谱生成模块，用于采用D3.js力学布局工具对加工后的文旅产业知识进行知识图谱布局，知识图谱布局过程中采用层级布局的方式展示图谱数据。

作为文旅产业场景下的知识图谱设计装置优选方案，所述知识融合模块中，根据给定的实体“指称项”，从知识库中选出一组候选实体对象，通过相似度计算将“指称项”链接到正确的实体对象。

作为文旅产业场景下的知识图谱设计装置优选方案，还包括知识更新模块，用于进行文旅产业知识更新，所述知识更新包括概念层更新和数据层更新；概念层更新过程中，将新增数据的概念添加到知识库的概念层；数据层更新过程中，选择在数据源中出现频率达到设置值的事实和属性加入知识库。

作为文旅产业场景下的知识图谱设计装置优选方案，所述知识图谱生成模块中，所述层级布局的形式为聚簇层布局，所述知识图谱生成模块包括：

节点处理子模块，用于获取知识图谱数据，将所述知识图谱数据的中心节点关联的子节点按关联关系归类，生成聚簇边和聚簇边节点，同时将子节点分层；

聚簇分析子模块，用于预设聚簇力，所述聚簇力的参数包括聚簇中心、力的强度和聚簇半径；对每个子节点进行聚簇力初始化，定义每个子节点的聚簇中心和聚簇半径；

子节点坐标生成子模块，用于计算子节点与聚簇中心节点坐标偏移量，根据坐标偏移量和聚簇半径的差值，判断子节点的受力方向和大小，经过向量计算得出子节点的坐标。

作为文旅产业场景下的知识图谱设计装置优选方案，还包括视觉降噪模块，用于对知识图谱进行视觉降噪；

所述视觉降噪模块包括文字处理子模块，所述文字处理子模块用于对文字进行遮挡检测，根据文字的层叠关系，对文字透明度进行调整，使置于底部的文字透明度低于置于顶部的文字透明度；所述文字处理子模块采用栅格划分的方式对文字画布进行划分，计算出所有文字节点的平均长宽比，根据划分后栅格的长宽比和文字的平均长宽比确定栅格的方向；

所述视觉降噪模块包括边处理子模块，所述边处理子模块通过边夹角偏移量计算和节点半径裁剪，将边与中心节点联结处分散排布在节点周围。

作为文旅产业场景下的知识图谱设计装置优选方案，还包括交互设计模块，用于对知识图谱进行交互设计，交互设计包括画布操作、元素操作和数据操作。

作为文旅产业场景下的知识图谱设计装置优选方案，还包括路径锁定模块，用于对知识图谱进行路径锁定，通过选取指定节点，计算出指定节点之间的路径进行锁定展现。

作为文旅产业场景下的知识图谱设计装置优选方案，还包括聚焦展现模块，用于对知识图谱进行聚焦展现，对于当前不关注的图谱区域的默认布局密集度大于当前关注的图谱区域的密集度。

作为文旅产业场景下的知识图谱设计装置优选方案，还包括多屏适配模块，用于对知识图谱进行多屏适配，多屏适配包括非等比缩放、个性化适配和像素级还原。

作为文旅产业场景下的知识图谱设计装置优选方案，还包括动画脚本处理模块，用于对知识图谱进行动画脚本自动化，在无人操作知识图谱时，按照配置的动画脚本循环播放动画。

作为文旅产业场景下的知识图谱设计装置优选方案，还包括叙事探索模块，用于对知识图谱进行可视化叙事探索，可视化叙事探索包括扫光效果处理、SVG渐变处理和动效节奏调试处理。

本发明具有如下优点：执行文旅产业知识抽取，所述知识抽取的对象包括实体抽取、关系抽取和属性抽取；通过所述实体抽取从文旅产业文本数据集中识别出命名实体；通过所述关系抽取从文旅产业文本数据集中提取出命名实体之间的关联关系；通过所述属性抽取从给定信息源中采集指定实体的属性信息；执行文旅产业知识融合，所述知识融合包括实体链接和知识合并；通过所述实体链接将从文旅产业文本数据集中抽取的命名实体对象链接到知识库中标准实体对象；通过所述知识合并融合外部知识库和关系数据库；执行文旅产业知识加工，所述知识加工包括本体抽取、知识推理和质量评估；所述本体抽取包括实体并列关系相似度计算、实体上下位关系抽取和本体生成；通过所述知识推理对命名实体的关系、属性值，本体的概念层次关系采用预设算法进行推理；通过所述质量评估舍弃置信度低于预设阈值的知识；采用D3.js力学布局工具对加工后的文旅产业知识进行知识图谱布局，知识图谱布局过程中采用层级布局的方式展示图谱数据。本发明可以对文旅业务场景中的关系类数据进行可视化展示，帮助分析人员快速了解链路故障、组件依赖等问题；生成的知识图谱展示效果好，可视化的有效信息多，用户的使用体验好，使用效率高。

附图说明

为了更清楚地说明本发明的实施方式或现有技术中的技术方案，下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是示例性的，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图引申获得其它的实施附图。

图1为本发明实施例中提供的文旅产业场景下的知识图谱设计方法流程示意图；

图2为本发明实施例中提供的文旅产业场景下的知识图谱设计方法中聚簇层布局示意图；

图3为本发明实施例中提供的文旅产业场景下的知识图谱设计方法中布局策略调整界面；

图4为本发明实施例中提供的文旅产业场景下的知识图谱设计方法中边处理示意图；

图5为本发明实施例中提供的文旅产业场景下的知识图谱设计装置架构示意图。

具体实施方式

以下由特定的具体实施例说明本发明的实施方式，熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

参见图1，本发明实施例1提供一种文旅产业场景下的知识图谱设计方法，包括以下步骤：

S1、执行文旅产业知识抽取，所述知识抽取的对象包括实体抽取、关系抽取和属性抽取；通过所述实体抽取从文旅产业文本数据集中识别出命名实体；通过所述关系抽取从文旅产业文本数据集中提取出命名实体之间的关联关系；通过所述属性抽取从给定信息源中采集指定实体的属性信息；

S2、执行文旅产业知识融合，所述知识融合包括实体链接和知识合并；通过所述实体链接将从文旅产业文本数据集中抽取的命名实体对象链接到知识库中标准实体对象；通过所述知识合并融合外部知识库和关系数据库；

S3、执行文旅产业知识加工，所述知识加工包括本体抽取、知识推理和质量评估；所述本体抽取包括实体并列关系相似度计算、实体上下位关系抽取和本体生成；通过所述知识推理对命名实体的关系、属性值，本体的概念层次关系采用预设算法进行推理；通过所述质量评估舍弃置信度低于预设阈值的知识；

S4、采用D3.js力学布局工具对加工后的文旅产业知识进行知识图谱布局，知识图谱布局过程中采用层级布局的方式展示图谱数据。

本实施例中，知识抽取是知识图谱构建的第一步，可以从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息的技术。涉及的关键技术包括：实体抽取、关系抽取和属性抽取。实体抽取也称为命名实体识别，可以从文本数据集中自动识别出命名实体。文本语料经过实体抽取之后，得到的是一系列离散的命名实体。为了得到语义信息，还需要从相关语料中提取出实体之间的关联关系，通过关系将实体联系起来，才能够形成网状的知识结构。属性抽取的目标是从不同信息源中采集特定实体的属性信息，如针对某个公众人物，可以从网络公开信息中得到其昵称、生日、国籍、教育背景等信息。

其中，通过知识抽取可以从原始的非结构化和半结构化数据中获取到实体、关系以及实体的属性信息。如果将接下来的过程比喻成拼图，那么这些信息就是拼图碎片，散乱无章甚至还有从其他拼图里得来的碎片，本身就是用来干扰拼图的错误碎片。拼图碎片之间的关系是扁平化的，缺乏层次性和逻辑性；拼图知识中还存在大量冗杂和错误的拼图碎片(信息)，故需要进行知识融合。

具体的，知识融合包括实体链接和知识合并两部分，其中，实体链接是对于从文本中抽取得到的实体对象，将其链接到知识库中对应的正确实体对象的操作。基本思想是首先根据给定的实体“指称项”，从知识库中选出一组候选实体对象，然后通过相似度计算将“指称项”链接到正确的实体对象。

其中，在实体链接中，已经将“实体链接”到知识库中对应的正确实体对象，但需要注意的是，“实体链接”链接的是从半结构化数据和非结构化数据那里通过信息抽取提取出来的数据。除了半结构化数据和非结构化数据以外，还有更方便的数据来源—结构化数据，如外部知识库和关系数据库。对于这部分结构化数据的处理，就是知识融合的内容，一般来说知识融合主要分为两种：合并外部知识库，主要处理数据层和模式层的冲突；合并关系数据库，有RDB2RDF等方法。

本实施例中，通过知识抽取，从原始语料中提取出了实体、关系与属性等知识要素，并且经过知识融合，消除实体指称项与实体对象之间的歧义，得到一系列基本的事实表达。由于事实本身并不等于知识，要想最终获得结构化，网络化的知识体系，还需要经历知识加工的过程。知识加工主要包括三方面内容：本体抽取、知识推理和质量评估。

具体的，本体抽取的本体是工人的概念集合、概念框架，如“人”、“事”、“物”等。本体可以采用人工编辑的方式手动构建(借助本体编辑软件)，也可以以数据驱动的自动化方式构建本体。因为人工方式工作量巨大，且很难找到符合要求的专家，因此当前主流的全局本体库产品，都是从一些面向特定领域的现有本体库出发，采用自动构建技术逐步扩展得到的。

其中，自动化本体构建过程包含三个阶段：实体并列关系相似度计算，实体上下位关系抽取，本体的生成。实体并列关系相似度计算后，知识图谱实际上还是没有一个上下层的概念。因此实体上下位关系抽取需要去完成这样的工作，从而生成第三步的本体，当本体的生成结束后，知识图谱就会明白上下层的概念。

具体的，在完成本体构建这一步之后，一个知识图谱的雏形便已经搭建好了。但在这个时候，知识图谱之间大多数关系都是残缺的，缺失值非常严重，故可以使用知识推理技术，去完成进一步的知识发现。知识推理的对象也并不局限于实体间的关系，也可以是实体的属性值，本体的概念层次关系等。这一块的算法主要可以分为三大类：基于知识表达的关系推理技术；基于概率图模型的关系推理技术路线示意图；基于深度学习的关系推理技术路线示意图。

其中，质量评估也是知识库构建技术的重要组成部分，这一部分存在的意义在于：可以对知识的可信度进行量化，通过舍弃置信度较低的知识来保障知识库的质量。

本实施例中，还包括文旅产业知识更新，所述知识更新包括概念层更新和数据层更新；概念层更新过程中，将新增数据的概念添加到知识库的概念层；数据层更新过程中，选择在数据源中出现频率达到设置值的事实和属性加入知识库。

具体的，概念层的更新主要是在新增数据后获得了新的概念后，需要自动将新的概念添加到知识库的概念层中。数据层的更新主要是新增或更新实体、关系、属性值，对数据层进行更新需要考虑数据源的可靠性、数据的一致性(是否存在矛盾或冗杂等问题)等可靠数据源，并选择在各数据源中出现频率高的事实和属性加入知识库。

本实施例中，采用D3.js力学布局工具对加工后的文旅产业知识进行知识图谱布局。在图关系可视化上，有很多图可视化的框架，由于文旅产业的业务场景中有很多个性化的需求和交互方式，所以选择D3.js力学布局工具作为基础框架，灵活度比较高，且功能拓展非常方便。D3.js提供了力导向图位置计算的基础算法，同时也有很方便的布局干预手段。

其中，D3.js提供的力导向图模块(d3-force)实现一个velocity Verlet数值积分器，用于模拟粒子的物理运动。在不做过多干预的情况下，会根据节点与边的关系模拟物理粒子的随机运动。D3.js的力导向图提供的力学调参项主要包括Centering(向心力)、Collision(碰撞检测)、Links(弹簧力)、Many-Body(电荷力)、Positioning(定位力)。

如何针对不同的节点进行合适的力学干预，是让布局更符合预期的关键。一般来讲，同一业务场景的图谱结构都具有一定的相似性，考虑针对业务特定的数据结构特征来做定制化的力学调优。通过抽象出在树中才有的层级和叶子节点的概念，虽然部分节点会互相成环，不满足树的定义，但是大部分数据是类似于树的结构，这样调试后，展示的关联关系就会比随机布局更加清晰，用户在寻找自己需要的数据时也会更快。文旅产业的各个业务场景都有个性化定制布局的需求，uni-graph能够将力学参数调整的模块独立出来，并且梳理出一些常用的参数预设，可以支撑很多场景的布局优化。

在文旅产业业务场景中，用户更倾向于采用分层的方式来观察图谱数据，因为这样有利于理解和分析图谱数据，比如：根据用户探索路径分层、边关系聚合分层、业务属性归类分层、指定中心点路径分层等等，这些需求对图谱的样式和布局形式提出了更高的要求。故，本实施例中，层级布局的形式为聚簇层布局，聚簇层布局步骤包括：

参见图3，在特定领域的图谱可视化中，通常采用若干布局即可满足用户的展示需求，因为这些场景下的图谱的关系结构相对固定。但作为平台性质的工具，就需要展示多个领域的图谱。为了更清晰地展现出各领域图谱的特点，布局形态就需要跟随图谱而变化。针对这种场景，本实施例实现多项布局参数的配置化，用户可以根据领域图谱的特点优化布局参数，并作为配置保存下来。

在用户使用可视化应用时，文字/节点/边等元素内容混杂在一起，如果没有做好信息的表达和呈现，会直接影响到用户的使用体验和使用效率。经过分析，这是因为在可视化过程中产生的视觉噪声太多，而通过可视化带来的有效信息太少，虽然将知识图谱的数据呈现了出来，但是元素数量非常多，信息杂乱，给用户的观感是“眼花缭乱”。故，本实施例中，还包括对知识图谱进行视觉降噪，视觉降噪包括文字处理，文字处理步骤包括：

具体的，文字主要用在节点和边的描述上，虽然能提供非常重要的信息，但是节点多了后，文字会在所难免的相互重叠，而重叠后的文字很难快速识别出来，不仅起不到传递信息的作用，反而会造成很差的视觉体验。为此，本实施例需要对文字进行遮挡检测，根据文字的层叠关系，将置于底部的文字透明度调低，这样即使多层文字重叠后，置于顶层的文字依然能被快速识别。

由于时间复杂度会随着节点的增多逐渐变得不可控。假如有100个节点，最多需要O(n！)的时间复杂度才能计算完毕。故采用栅格划分的方式来做优化，先对画布进行栅格划分，然后确定节点所在的一个或多个栅格，在进行碰撞检测的时候，只需要和自己同栅格的节点对比即可，因为不同栅格内的节点一定不会出现碰撞的情况。

具体的，栅格划分的理论基础是四叉树碰撞检测，本实施例在此基础上做了进一步的优化。由于需要进行遮挡检测的元素是文字类型的节点，这种节点的特点是长比宽大很多。如果按照传统的四叉树分割算法，就会造成很多文字节点横跨多个栅格，对比的次数较多。在检测前，先计算出所有文字节点的平均长宽比，每次栅格划分是横向还是纵向，取决于哪个方向划分后栅格的长宽比更靠近文字的平均长宽比，这样做就会减少文字节点横跨多个栅格的情况，从而减少了每次需要被碰撞检测的节点数量。

在一种可能的实施例中，视觉降噪还包括边处理，边处理过程中通过边夹角偏移量计算和节点半径裁剪，将边与中心节点连结处分散排布在节点周围。

参见图4，知识图谱中存在包含大量出(入)边的中心节点，在对这些中心节点的边进行可视化展示时，往往会出现边与中心节点联结处(Nexus)重叠交错在一起的情况，进而影响视觉体验。针对这种特殊场景，本实施例设计了一种多边散列排布的算法，通过边夹角偏移量计算和节点半径裁剪，将Nexus分散排布在节点周围，减少边线重叠的情况，以达到更清晰的视觉效果。同时还实现多种类型的边，并通过参数配置的方式来调整边的样式，比如：贝塞尔曲线控制点、弧度、自旋角度等参数，以满足各种复杂图谱的可视化场景。通过多边散列排布，改变边线类型，并调整样式参数，达到优化效果。

在一种可能的实施例中，还包括对知识图谱进行交互设计，交互设计包括画布操作、元素操作和数据操作。

具体的，合适的图谱布局能更好地表达出数据的含义，通过视觉降噪可以进一步让图谱传递出更多的有效信息。但是用户依然需要通过交互找到自己关心的信息，一个图谱可视化工具是否好用，交互功能会起到非常重要的作用。在文旅知识图谱中实现下面的基本交互功能：

画布操作：拖动、缩放、动态延展、布局变换、多节点圈选；元素(节点和边)操作：样式配置、悬浮高亮、元素锁定、单击、双击、右键菜单、折叠/展开、节点拖动、边类型更改；数据操作：节点的增删改查、边的增删改查、子图探索、数据合并、更新重载。除了上述的基础交互功能外，还应用一些特殊场景的交互。在图谱可视化中交互的目的，是为了从庞大的知识图谱中找到自己关心数据的关联关系，同时也能够观察到这些关联关系在全局画布中的位置。

在一种可能的实施例中，还包括对知识图谱进行路径锁定，通过选取指定节点，计算出指定节点之间的路径进行锁定展现。通过选取不同的节点，计算出节点之间的合适路径，做锁定展现，方便观察两个或多个节点的关联关系。

在一种可能的实施例中，还包括对知识图谱进行聚焦展现，对于当前不关注的图谱区域的默认布局密集度大于当前关注的图谱区域的密集度。

具体的，对于当前不关注的知识图谱区域，默认布局可以密集一些，进而节省画布空间，当关注知识图谱的某个区域后，对当前关注的一小块区域重新布局，让节点排布分散一些，方便查看文字的内容。实际上，无论可视化的节点与边的数量有多庞大，当深入到业务细节中的时候，使用者关注的节点数量其实不多，重点是把使用者关心的数据从大量数据中筛选出来，并且做好清晰地呈现表达。

在一种可能的实施例中，还包括对知识图谱进行多屏适配，多屏适配包括非等比缩放、个性化适配和像素级还原。

具体的，文旅知识图谱呈现的终端场景非常复杂，有PC/Mac端屏幕、大屏电视、巨型宽屏等。各个屏幕的尺寸比例都有所不同，为了保持统一观感，不能出现滚动条、不能有边缘留白、不能压缩变形。同时在一些重要场合的巨型宽屏上，还要对细节做特定的适配。通过sass的函数和mixin功能可以较好地完成非等比缩放和个性化适配的需求。

其中，非等比缩放是在长宽都需要考虑的缩放场景中，使用基于视口百分比的单位vh、vw很合适，设计稿尺寸为1920*1080，可以通过转换函数自动计算出对应的vh、vw值。其中为了保证字体大小在不同尺寸的屏幕上更符合预期，会用设计稿里的高为基础单位做rem的指导参数。

其中，个性化适配是在超宽的大屏尺寸下，按照比例自动缩放，在某些元素上视觉效果并不是特别完美，上面的mixin可以很方便地在CSS中对特定尺寸的屏幕做个性化适配。

其中，像素级还原是针对不同尺寸的设计稿校准时，有些元素会带有阴影效果或者是不规则图形，但是设计师只能按照矩形切图，导致Sketch自动标注的数据不准确。这时可以把浏览器的尺寸设置成与设计稿一致，再蒙上一层半透明的设计稿图片，逐个元素对齐，就可以快速对不同尺寸屏幕的设计稿做像素级还原。

在一种可能的实施例中，还包括对知识图谱进行动画脚本自动化，在无人操作知识图谱时，按照配置的动画脚本循环播放动画。

具体的，与静态可视化界面相比，动态可视化或者交互式可视化有更好的视觉效果，并且能传递给观看者更多的信息。当动知识图谱态可视化后，还需要自动播放循环动画，因此存在动画脚本自动化的需求：在无人操作时，按照配置好的动画脚本循环执行；用户与应用交互时，能够自动将动画停止；通过便捷的方式重新运行动画或进行任意场景的跳转。

其中，动画效果具有以下几个特点：动画类型多样化，包含3D类型、DOMAnimation、SVGAnimation、第三方Canvas组件、Vue组件切换。多个动画模块之间有衔接依赖，动画执行可以暂停和开始。不同模块的动画之间需要相互通信。

在一种可能的实施例中，将每个动画都封装成一个函数，初期使用了setTimeout和async function的方案：setTimeout可以管理简单的动画执行，但是只要前面的动画有时间上的变动，后续所有动画setTimeout的delay参数都需要改，非常麻烦。asyncfunction将动画都封装成返回Promise的函数，可以解决多个动画模块依赖的问题，这个方案对不同动画模块开发者的协作效率有很大的提升，但是依然无法暂停和取消动画。asyncfunction的方案虽然比较好用，但是主要问题是一旦执行就不能暂停或取消，因此基于generator function封装成了类async function，可以做到随时暂停或取消，下面是使用封装的异步动画调度器与各种工具helper写的动画模块业务代码：

“main.vue

*actionScript(){

//等待1秒

yield this.$sleep(10ee)；//背景渐入动画

this.mainFrameclass＝FLY_IN；//设置渐入动画的classyield*this.$flyIn('main-frame')；//自动监听CSS动画结束//左右侧动画

yield Promise.all([

this.$bus.$emit('animate-left'),11通知其他的Vue组件执行动画this.$bus.$emit('animate-right')，//通知其他的Vue组件执行动画)；

//主图谱动画

yield this.$bus.$emit("animate-force-graph")；

}

mounted(){

//初始化动画执行器

this.cancelToken＝new this.$ae.CancelToken()；//取消执行器的token

this.aef＝this.$ae(this.actionScript,this.cancelToken)；

this.aef()；

}”。

“*actionScript(){

yield animate1()；

yield animate2()；

yield animate3()；

mounted(){

//初始化动画执行器

this.cancelToken＝new this.$ae.CancelToken()；1/取消执行器的token

this.aef＝this.$ae(this.actionScript,this.cancelToken)；

this.$autoon('animate-left',async()＝>{

awaft this.aef()；

})；

}

beforeDestroy(){

//取消所有动画的执行，根据Vue Hook自动执行，不需要开发者手动写

//this cancelToken.abort()；

//this$bus.$off("animate-left')；”

“const$autoon＝function(eventName,listener){

//this.$bus是定制开发的支持异步的EventEmitter

this.$bus.$on(eventName,listener)；

this.$on("hook:beforeDestroy',()＝>{

//自动取消所有

if(this.cancelToken&&！this.cancelToken.isAbort){

this.cancelToken.abort()；

}

this.$bus.$off(eventName,listener)；)；

})；

}；

vue.prototype.$auto0n＝$autoon；”。

其中，$ae是基于generatorfunction封装的异步工具库async-eraser，CancelToken是停止生成器运行的取消令牌。定制开发了支持异步事件的EventEmitter，emit函数会返回一个Promise，resolve时就会得知emit的动画已经执行完毕，使Vue跨组件的动画调度更容易。Vue组件卸载时会自动off监听的事件，同时也能自动停止当前组件内的动画调度器。监听DOM的transitionend和animationend事件，自动获取CSS动画执行结束的时机。

在一种可能的实施例中，还包括对知识图谱进行可视化叙事探索，可视化叙事探索包括扫光效果处理、SVG渐变处理和动效节奏调试处理。

具体的，数据可视化叙事是通过隐喻对数据进行可视化，并以可视化为手段，向受众讲述数据背后的故事。可视化叙事的形式要比文字更直观，能更清晰地让观看者了解数据背后的故事，还可以通过动效将重点信息呈现，引导用户按照顺序了解故事内容。

其中，扫光效果对视觉观感的提升和视觉重点的强调非常有效，在做扫光效果的轮廓元素上，通过svg渐变或者蒙版来进行实现。采用的蒙版方案进行SVG渐变，更加灵活，渐变性能更好。由于一个动效是否有节奏，对于观看者的体验影响非常大，但是节奏感是一个非常难掌握的东西，故使用两个辅助工具：animejs和贝塞尔调节。这两个工具能够给大家带来很多灵感，同时可以让设计师自己利用工具调试出或者找到期望的动效，降低动画开发的协作成本。

综上所述，本发明执行文旅产业知识抽取，所述知识抽取的对象包括实体抽取、关系抽取和属性抽取；通过所述实体抽取从文旅产业文本数据集中识别出命名实体；通过所述关系抽取从文旅产业文本数据集中提取出命名实体之间的关联关系；通过所述属性抽取从给定信息源中采集指定实体的属性信息；执行文旅产业知识融合，所述知识融合包括实体链接和知识合并；通过所述实体链接将从文旅产业文本数据集中抽取的命名实体对象链接到知识库中标准实体对象；通过所述知识合并融合外部知识库和关系数据库；执行文旅产业知识加工，所述知识加工包括本体抽取、知识推理和质量评估；所述本体抽取包括实体并列关系相似度计算、实体上下位关系抽取和本体生成；通过所述知识推理对命名实体的关系、属性值，本体的概念层次关系采用预设算法进行推理；通过所述质量评估舍弃置信度低于预设阈值的知识；采用D3.js力学布局工具对加工后的文旅产业知识进行知识图谱布局，知识图谱布局过程中采用层级布局的方式展示图谱数据。本发明可以对文旅业务场景中的关系类数据进行可视化展示，帮助分析人员快速了解链路故障、组件依赖等问题；生成的知识图谱展示效果好，可视化的有效信息多，用户的使用体验好，使用效率高。

需要说明的是，本公开实施例的方法可以由单个设备执行，例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下，由多台设备相互配合来完成。在这种分布式场景的情况下，这多台设备中的一台设备可以只执行本公开实施例的方法中的某一个或多个步骤，这多台设备相互之间会进行交互以完成所述的方法。

需要说明的是，上述对本公开的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

实施例2

参见图5，本发明实施例2还提供一种文旅产业场景下的知识图谱设计装置，包括：

知识抽取模块001，用于执行文旅产业知识抽取，所述知识抽取的对象包括实体抽取、关系抽取和属性抽取；通过所述实体抽取从文旅产业文本数据集中识别出命名实体；通过所述关系抽取从文旅产业文本数据集中提取出命名实体之间的关联关系；通过所述属性抽取从给定信息源中采集指定实体的属性信息；

知识融合模块002，用于执行文旅产业知识融合，所述知识融合包括实体链接和知识合并；通过所述实体链接将从文旅产业文本数据集中抽取的命名实体对象链接到知识库中标准实体对象；通过所述知识合并融合外部知识库和关系数据库；

知识加工模块003，用于执行文旅产业知识加工，所述知识加工包括本体抽取、知识推理和质量评估；所述本体抽取包括实体并列关系相似度计算、实体上下位关系抽取和本体生成；通过所述知识推理对命名实体的关系、属性值，本体的概念层次关系采用预设算法进行推理；通过所述质量评估舍弃置信度低于预设阈值的知识；

知识图谱生成模块004，用于采用D3.js力学布局工具对加工后的文旅产业知识进行知识图谱布局，知识图谱布局过程中采用层级布局的方式展示图谱数据。

本实施例中，所述知识融合模块002中，根据给定的实体“指称项”，从知识库中选出一组候选实体对象，通过相似度计算将“指称项”链接到正确的实体对象。

本实施例中，还包括知识更新模块005，用于进行文旅产业知识更新，所述知识更新包括概念层更新和数据层更新；概念层更新过程中，将新增数据的概念添加到知识库的概念层；数据层更新过程中，选择在数据源中出现频率达到设置值的事实和属性加入知识库。

本实施例中，所述知识图谱生成模块004中，所述层级布局的形式为聚簇层布局，所述知识图谱生成模块004包括：

节点处理子模块401，用于获取知识图谱数据，将所述知识图谱数据的中心节点关联的子节点按关联关系归类，生成聚簇边和聚簇边节点，同时将子节点分层；

聚簇分析子模块402，用于预设聚簇力，所述聚簇力的参数包括聚簇中心、力的强度和聚簇半径；对每个子节点进行聚簇力初始化，定义每个子节点的聚簇中心和聚簇半径；

子节点坐标生成子模块403，用于计算子节点与聚簇中心节点坐标偏移量，根据坐标偏移量和聚簇半径的差值，判断子节点的受力方向和大小，经过向量计算得出子节点的坐标。

本实施例中，还包括视觉降噪模块006，用于对知识图谱进行视觉降噪；

所述视觉降噪模块006包括文字处理子模块601，所述文字处理子模块601用于对文字进行遮挡检测，根据文字的层叠关系，对文字透明度进行调整，使置于底部的文字透明度低于置于顶部的文字透明度；所述文字处理子模块采用栅格划分的方式对文字画布进行划分，计算出所有文字节点的平均长宽比，根据划分后栅格的长宽比和文字的平均长宽比确定栅格的方向；

所述视觉降噪模块006包括边处理子模块602，所述边处理子模块602通过边夹角偏移量计算和节点半径裁剪，将边与中心节点联结处分散排布在节点周围。

本实施例中，还包括交互设计模块007，用于对知识图谱进行交互设计，交互设计包括画布操作、元素操作和数据操作。

本实施例中，还包括路径锁定模块008，用于对知识图谱进行路径锁定，通过选取指定节点，计算出指定节点之间的路径进行锁定展现。

本实施例中，还包括聚焦展现模块009，用于对知识图谱进行聚焦展现，对于当前不关注的图谱区域的默认布局密集度大于当前关注的图谱区域的密集度。

本实施例中，还包括多屏适配模块010，用于对知识图谱进行多屏适配，多屏适配包括非等比缩放、个性化适配和像素级还原。

本实施例中，还包括动画脚本处理模块011，用于对知识图谱进行动画脚本自动化，在无人操作知识图谱时，按照配置的动画脚本循环播放动画。

本实施例中，还包括叙事探索模块012，用于对知识图谱进行可视化叙事探索，可视化叙事探索包括扫光效果处理、SVG渐变处理和动效节奏调试处理。

需要说明的是，上述装置各模块之间的信息交互、执行过程等内容，由于与本申请实施例1中的方法实施例基于同一构思，其带来的技术效果与本申请方法实施例相同，具体内容可参见本申请前述所示的方法实施例中的叙述，此处不再赘述。

实施例3

本发明实施例3提供一种非暂态计算机可读存储介质，所述计算机可读存储介质中存储有文旅产业场景下的知识图谱设计方法的程序代码，所述程序代码包括用于执行实施例1或其任意可能实现方式的文旅产业场景下的知识图谱设计方法的指令。

计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(SolidState Disk、SSD))等。

实施例4

本发明实施例4提供一种电子设备，包括：存储器和处理器；

所述处理器和所述存储器通过总线完成相互间的通信；所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行实施例1或其任意可能实现方式的文旅产业场景下的知识图谱设计方法。

具体的，处理器可以通过硬件来实现也可以通过软件来实现，当通过硬件实现时，该处理器可以是逻辑电路、集成电路等；当通过软件来实现时，该处理器可以是一个通用处理器，通过读取存储器中存储的软件代码来实现，该存储器可以集成在处理器中，可以位于所述处理器之外，独立存在。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

虽然，上文中已经用一般性说明及具体实施例对本发明作了详尽的描述，但在本发明基础上，可以对之作一些修改或改进，这对本领域技术人员而言是显而易见的。因此，在不偏离本发明精神的基础上所做的这些修改或改进，均属于本发明要求保护的范围。

Claims

1.一种文旅产业场景下的知识图谱设计方法，其特征在于，包括：

2.根据权利要求1所述的一种文旅产业场景下的知识图谱设计方法，其特征在于，所述实体链接过程中，根据给定的实体“指称项”，从知识库中选出一组候选实体对象，通过相似度计算将“指称项”链接到正确的实体对象。

3.根据权利要求1所述的一种文旅产业场景下的知识图谱设计方法，其特征在于，还包括文旅产业知识更新，所述知识更新包括概念层更新和数据层更新；

4.根据权利要求1所述的一种文旅产业场景下的知识图谱设计方法，其特征在于，层级布局的形式为聚簇层布局，聚簇层布局步骤包括：

5.根据权利要求1所述的一种文旅产业场景下的知识图谱设计方法，其特征在于，还包括对知识图谱进行视觉降噪，视觉降噪包括文字处理，文字处理步骤包括：

6.根据权利要求5所述的一种文旅产业场景下的知识图谱设计方法，其特征在于，视觉降噪还包括边处理，边处理过程中通过边夹角偏移量计算和节点半径裁剪，将边与中心节点联结处分散排布在节点周围。

7.根据权利要求5所述的一种文旅产业场景下的知识图谱设计方法，其特征在于，还包括对知识图谱进行交互设计，交互设计包括画布操作、元素操作和数据操作；

8.根据权利要求7所述的一种文旅产业场景下的知识图谱设计方法，其特征在于，还包括对知识图谱进行多屏适配，多屏适配包括非等比缩放、个性化适配和像素级还原；

9.一种文旅产业场景下的知识图谱设计装置，其特征在于，包括：

10.根据权利要求9所述的一种文旅产业场景下的知识图谱设计装置，其特征在于，所述知识融合模块中，根据给定的实体“指称项”，从知识库中选出一组候选实体对象，通过相似度计算将“指称项”链接到正确的实体对象；

还包括知识更新模块，用于进行文旅产业知识更新，所述知识更新包括概念层更新和数据层更新；概念层更新过程中，将新增数据的概念添加到知识库的概念层；数据层更新过程中，选择在数据源中出现频率达到设置值的事实和属性加入知识库；

所述知识图谱生成模块中，所述层级布局的形式为聚簇层布局，所述知识图谱生成模块包括：

子节点坐标生成子模块，用于计算子节点与聚簇中心节点坐标偏移量，根据坐标偏移量和聚簇半径的差值，判断子节点的受力方向和大小，经过向量计算得出子节点的坐标；

还包括视觉降噪模块，用于对知识图谱进行视觉降噪；

所述视觉降噪模块包括边处理子模块，所述边处理子模块通过边夹角偏移量计算和节点半径裁剪，将边与中心节点联结处分散排布在节点周围；

还包括交互设计模块，用于对知识图谱进行交互设计，交互设计包括画布操作、元素操作和数据操作；

还包括路径锁定模块，用于对知识图谱进行路径锁定，通过选取指定节点，计算出指定节点之间的路径进行锁定展现；

还包括聚焦展现模块，用于对知识图谱进行聚焦展现，对于当前不关注的图谱区域的默认布局密集度大于当前关注的图谱区域的密集度；

还包括多屏适配模块，用于对知识图谱进行多屏适配，多屏适配包括非等比缩放、个性化适配和像素级还原；

还包括动画脚本处理模块，用于对知识图谱进行动画脚本自动化，在无人操作知识图谱时，按照配置的动画脚本循环播放动画；

还包括叙事探索模块，用于对知识图谱进行可视化叙事探索，可视化叙事探索包括扫光效果处理、SVG渐变处理和动效节奏调试处理。