CN110489613A - 协同可视数据推荐方法及装置 - Google Patents
协同可视数据推荐方法及装置 Download PDFInfo
- Publication number
- CN110489613A CN110489613A CN201910689659.5A CN201910689659A CN110489613A CN 110489613 A CN110489613 A CN 110489613A CN 201910689659 A CN201910689659 A CN 201910689659A CN 110489613 A CN110489613 A CN 110489613A
- Authority
- CN
- China
- Prior art keywords
- visualization
- feature
- user terminal
- data
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种协同可视数据推荐方法及装置,包括:获取同步数据和各用户端的可视化特征信息;根据各所述用户端的所述可视化特征信息对所述同步数据处理,获取与各所述用户端对应的可视化数据;向所述用户端发送与各所述用户端对应的所述可视化数据。本方案提高了服务器和多个用户终端之间协同操作的实时性,提高了工作效率,且比较便捷。
Description
技术领域
本发明涉及大数据分析技术,尤其涉及一种协同可视数据推荐方法及装置。
背景技术
随着项目复杂程度的提高,需要多人协同完成同一项目任务,在多人协同作业的过程中,可以通过服务器将项目信息同步分享给多个用户终端,并从各用户终端获取用户操作以完成多人协同工作。
现有技术中完成多人协同工作的方式,通常是捕获服务器显示屏上的像素,对服务器显示屏上显示的图像进行采样,并以视频流的形式将采样得到的图像发送给参与协同分析的多个用户终端,从而达到视频音频同步呈现的效果。
然而,现有技术中服务器和多个用户终端之间协同操作的实时性差。
发明内容
本发明提供一种协同可视数据推荐方法及装置,用以解决现有技术中服务器和多个用户终端之间协同操作的实时性差问题。
本发明实施例的第一方面,提供一种协同可视数据推荐方法,包括:
获取同步数据和各用户端的可视化特征信息;
根据各所述用户端的所述可视化特征信息对所述同步数据处理,获取与各所述用户端对应的可视化数据;
向所述用户端发送与各所述用户端对应的所述可视化数据。
可选地,在第一方面的一种可能实现方式中,所述获取各用户端的可视化特征信息,包括:
根据多个所述用户端的用户请求,获取各用户端的可视化特征信息。
可选地,在第一方面的一种可能实现方式中,所述根据多个所述用户端的用户请求,获取各用户端的可视化特征信息之前,还包括:
接收所述用户端的所述用户请求;
确定所述用户请求对应的可视化资源为可用状态。
可选地,在第一方面的一种可能实现方式中,所述可视化特征信息包括元组数据和用户操作数据;
相应的,所述元组数据以层级结构描述,所述用户操作数据以数组列表描述。
可选地,在第一方面的一种可能实现方式中,所述根据各所述用户端的所述可视化特征信息对所述同步数据处理,获取与各所述用户端对应的可视化数据,包括:
对所述同步数据进行结构化处理,获取知识图谱;
根据所述知识图谱和所述用户端的所述可视化特征信息,获取与各所述用户端对应的可视化数据。
可选地,在第一方面的一种可能实现方式中,所述对所述同步数据进行结构化处理,获取知识图谱,包括:
获取所述同步数据中的实体类基类与实体之间的关系;
根据所述实体类基类与实体之间的关系,获取知识图谱。
可选地,在第一方面的一种可能实现方式中,所述根据所述知识图谱和所述用户端的所述可视化特征信息,获取与各所述用户端对应的可视化数据,包括:
获取所述用户端的所述可视化特征信息的可视化类,并获取所述可视化类中的结构特征数据、标签特征数据和文本特征数据;
对所述结构特征数据、所述标签特征数据和所述文本特征数据处理,获取与各所述用户端对应的可视化数据。
可选地,在第一方面的一种可能实现方式中,所述对所述结构特征数据、所述标签特征数据和所述文本特征数据处理,获取与各所述用户端对应的可视化数据,包括:
对所述结构特征进行独热编码,得到可视化实体结构特征;
利用标签分类模型对所述标签特征进行可视化实体的映射处理,得到可视化实体标签特征;
利用词向量模型对所述文本特征进行词向量化处理,得到可视化实体文本特征;
获取所述知识图谱中分别与所述可视化实体结构特征、所述可视化实体标签特征和所述可视化实体文本特征相似的可视化特征,对所述可视化特征处理,获取与各用户端对应的可视化数据。
可选地,在第一方面的一种可能实现方式中,所述获取所述知识图谱中分别与所述可视化实体结构特征、所述可视化实体标签特征和所述可视化实体文本特征相似的可视化特征,包括:
利用皮尔森距离模型对所述可视化实体结构特征和所述可视化实体标签特征处理,获取所述知识图谱中分别与所述可视化实体结构特征和所述可视化实体标签特征相似的第一特征;
利用词向量相似度量模型对可视化实体文本特征处理,获取所述知识图谱中与所述可视化实体文本特征相似的第二特征;
对所述第一特征和所述第二特征进行加权处理,获取所述可视化特征。
本发明实施例的第二方面,提供一种协同可视数据推荐装置,包括:
数据模块:获取同步数据和各用户端的可视化特征信息;
推荐模块:根据各所述用户端的所述可视化特征信息和所述同步数据处理,获取与各所述用户端对应的可视化数据;
发送模块:向所述用户端发送与各所述用户端对应的所述可视化数据。
可选地,在第二方面的一种可能实现方式中,所述数据模块获取各用户端的可视化特征信息,包括:
根据多个所述用户端的用户请求,获取各用户端的可视化特征信息。
可选地,在第二方面的一种可能实现方式中,所述根据多个所述用户端的用户请求,获取各用户端的可视化特征信息之前,还包括:
接收所述用户端的所述用户请求;
确定所述用户请求对应的可视化资源为可用状态。
可选地,在第二方面的一种可能实现方式中,所述可视化特征信息包括元组数据和用户操作数据;
相应的,所述元组数据以层级结构描述,所述用户操作数据以数组列表描述。
可选地,在第二方面的一种可能实现方式中,所述推荐模块根据各所述用户端的所述可视化特征信息对所述同步数据处理,获取与各所述用户端对应的可视化数据,包括:
对所述同步数据进行结构化处理,获取知识图谱;
根据所述知识图谱和所述用户端的所述可视化特征信息,获取与各所述用户端对应的可视化数据。
可选地,在第二方面的一种可能实现方式中,所述对所述同步数据进行结构化处理,获取知识图谱,包括:
获取所述同步数据中的实体类基类与实体之间的关系;
根据所述实体类基类与实体之间的关系,获取知识图谱。
可选地,在第二方面的一种可能实现方式中,所述根据所述知识图谱和所述用户端的所述可视化特征信息,获取与各所述用户端对应的可视化数据,包括:
获取所述用户端的所述可视化特征信息的可视化类,并获取所述可视化类中的结构特征数据、标签特征数据和文本特征数据;
对所述结构特征数据、所述标签特征数据和所述文本特征数据处理,获取与各所述用户端对应的可视化数据。
可选地,在第二方面的一种可能实现方式中,所述对所述结构特征数据、所述标签特征数据和所述文本特征数据处理,获取与各所述用户端对应的可视化数据,包括:
对所述结构特征进行独热编码,得到可视化实体结构特征;
利用标签分类模型对所述标签特征进行可视化实体的映射处理,得到可视化实体标签特征;
利用词向量模型对所述文本特征进行词向量化处理,得到可视化实体文本特征;
获取所述知识图谱中分别与所述可视化实体结构特征、所述可视化实体标签特征和所述可视化实体文本特征相似的可视化特征,对所述可视化特征处理,获取与各用户端对应的可视化数据。
可选地,在第二方面的一种可能实现方式中,所述获取所述知识图谱中分别与所述可视化实体结构特征、所述可视化实体标签特征和所述可视化实体文本特征相似的可视化特征,包括:
利用皮尔森距离模型对所述可视化实体结构特征和所述可视化实体标签特征处理,获取所述知识图谱中分别与所述可视化实体结构特征和所述可视化实体标签特征相似的第一特征;
利用词向量相似度量模型对可视化实体文本特征处理,获取所述知识图谱中与所述可视化实体文本特征相似的第二特征;
对所述第一特征和所述第二特征进行加权处理,获取所述可视化特征。
本发明实施例的第三方面,提供一种电子设备,包括:存储器、处理器以及计算机程序,所述计算机程序存储在所述存储器中,所述处理器运行所述计算机程序执行本发明第一方面及第一方面各种可能设计的所述方法。
本发明实施例的第四方面,提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现本发明第一方面及第一方面各种可能设计的所述方法。
本发明提供的一种协同可视数据推荐方法及装置,首先获取同步数据和各用户端的可视化特征信息,其中的同步数据是将多个用户端的数据同步后获取到的数据,多个用户端的数据可以是多个用户在通过各种输入设备对系统进行操作产生的数据;各用户端的可视化特征信息可以是用户的屏幕上显示的特征信息,例如可以是屏幕上显示的是X,Y坐标,那么用户现在就会有X,Y轴的一些数据。根据各用户端的可视化特征信息对同步数据处理,获取与各用户端对应的可视化数据,即比如说用户现在有X,Y轴的一些数据,可以对同步数据处理后,给用户推荐二维坐标下的一些的数据分析图像,比如散点图,然后将推荐的散点图发送给对应的用户端,解决能利用其他人的知识来理解用户的分析意图,分析出可视化图表的情景上下文,并筛选出对用户有意义的信息并呈现给用户,协助用户快速定位到数据空间里有意义的趋势、异常、决策依据等信息,此外,本方案中传输的是数据,而不是图像,例如,要画一个散点图,是传输图像,现在是把散点图的特征记下来,变成了数据,而不是图像,提高了效率,由于传输的内容少,那么实时性也会相应的提高。
附图说明
图1是本发明实施例提供的一种协同可视数据推荐方法的流程示意图;
图2是本发明实施例提供的另一种协同可视数据推荐方法的流程示意图;
图3是本发明实施例提供的构建知识图谱的结构示意图;
图4是本发明实施例提供的一种协同可视数据推荐装置的结构示意图;
图5是本发明实施例提供的一种设备的硬件结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本发明具体的应用场景是随着项目复杂程度的提高,需要多人协同完成同一项目任务,在多人协同作业的过程中,可以通过服务器将项目信息同步分享给多个用户终端,并从各用户终端获取用户操作以完成多人协同工作。现有技术中完成多人协同工作的方式,通常是捕获服务器显示屏上的像素,对服务器显示屏上显示的图像进行采样,并以视频流的形式将采样得到的图像发送给参与协同分析的多个用户终端,从而达到视频音频同步呈现的效果。然而,现有技术中服务器和多个用户终端之间协同操作,传输的是图像,其传输内容较多,例如,要画一个散点图,是需要向将散点图首先采集下来,然后将采集的图像以视频流的形式传输,传输的内容较多,导致实时性较差。
本发明提供的协同可视数据推荐方法,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
参见图1,是本发明实施例提供的一种协同可视数据推荐方法的流程示意图,图1所示方法的执行主体可以是软件和/或硬件装置。包括步骤S101至步骤S103,具体如下:
S101,获取同步数据和各用户端的可视化特征信息。
具体地,同步数据可以是将多个用户端的数据同步后获取到的数据,即获取到多个用户端的知识,将多个用户端的知识进行同步操作,在一些实施例中,多个用户端的数据例如可以是多个用户在通过各种输入设备对系统进行操作产生的数据,例如可以是用户通过鼠标、键盘、触摸板等设备对系统进行输入,改变系统的运行状态和可视化的结构。
在一些实施例中,各用户端的可视化特征信息包括元组数据和用户操作数据,相应的,元组数据以层级结构描述,用户操作数据以数组列表描述,将视觉信息转化为文本信息,用以支持用户的事后浏览回溯、认知重构,以及其他用户对主用户的分析过程的场景再现,节省资源,提高同步性。其中的同步数据就是多个用户重新绘制后的可视化平台传送给服务端,由服务器进行一致性检查,若有不同,则同步给其他用户,从而达到多端同步的效果,其中,服务器进行一致性检查,检查的就是元组数据和用户操作数据,是否一致。
可视化特征信息可以是用户的屏幕上显示的特征信息,例如屏幕上显示的是X,Y坐标,那么用户现在就会有X,Y轴的一些数据,这些数据就是对应用户端的可视化特征信息。
S102,根据各用户端的可视化特征信息对同步数据处理,获取与各用户端对应的可视化数据。
具体地,为了实现能利用其他人的知识来理解用户的分析意图,分析出可视化图表的情景上下文,并筛选出对用户有意义的信息并呈现给用户,协助用户快速定位到数据空间里有意义的趋势、异常、决策依据等信息,利用各用户端的可视化特征信息对同步数据处理,获取到对应用户端的可视化数据,例如,用户端的可视化特征信息是有X,Y轴的一些数据,此可视化数据可以是在同步数据里面出对用户有意义的信息并呈现给用户,呈现的方式可以是一些数据分析图像,例如可以是给用户推荐二维坐标下的一些的数据分析图像,比如散点图,可以代替用户自己动手操作,协助用户快速定位到数据空间里有意义的趋势、异常、决策依据等信息。
S103,向用户端发送与各用户端对应的可视化数据。
具体地,在得到对应用户端的可视化数据后,将其发送给对应的用户端进行显示即可,例如显示的可以是散点图,也可以是柱状图等。
上述实施例首先获取同步数据和各用户端的可视化特征信息,然后利用各用户端的可视化特征信息对同步数据进行处理,得到获取与各用户端对应的可视化数据,即比如说用户现在有X,Y轴的一些数据,可以对同步数据处理后,给用户推荐二维坐标下的一些的数据分析图像,比如散点图,然后将推荐的散点图发送给对应的用户端,解决能利用其他人的知识来理解用户的分析意图,分析出可视化图表的情景上下文,并筛选出对用户有意义的信息并呈现给用户,协助用户快速定位到数据空间里有意义的趋势、异常、决策依据等信息,此外,本方案中传输的是数据,而不是图像,例如,要画一个散点图,是传输图像,现在是把散点图的特征记下来,变成了数据,而不是图像,提高了效率,由于传输的内容少,那么实时性也会相应的提高。
由于是多个用户端进行协同操作,多个用户在通过各种输入设备对系统进行操作时,有可能在同一个时间节点进行操作,导致冲突,系统应当能检测出冲突的原因并进行规避。
为了解决以上技术问题,在上述实施例的基础上,参见图2,是本发明实施例提供的另一种协同可视数据推荐方法的流程示意图,图2所示方法的执行主体可以是软件和/或硬件装置。包括步骤S201至步骤S205,具体如下:
S201、接收用户端的用户请求,确定用户请求对应的可视化资源为可用状态。
具体地,多个用户端的用户请求,可以是用户通过鼠标、键盘、触摸板等设备对系统进行输入,改变系统的运行状态和可视化的结构的一些操作,用户在对系统输入时,需要判断用户操作的可视化资源是否为可用状态,例如,当这个可视化资源正在被别的用户占用,那么此可视化资源为不可用状态,从而判断该用户的操作请求无效。
在一些实施例中,可以以有限状态机记录用户的操作,有限状态机以状态存储关于过去的信息,可以将用户的操作,例如点击,鼠标滚动等事件预先定义好,则一个操作可以转化<type:action,target:component,time>的一个三元组进行表示,然后一个利用属性的协同锁机制来进行无效化操作,以下简称PB锁,具体操作如下:
Lock=<owner,changeQuery>,其中的Owner是锁的所有者,changeQuery(更改请求)以图的形式描述了需要改的属性,若更改请求不违反其他锁,则将生成该锁并赋予owner。
PB锁算法执行步骤如下:
1、遍历当前所有的锁,找出所有者不是更改发起人的锁,并置入MSlocks;
2、将changeQuery(更改请求)以事务(transacation)的手段来执行;
3、若changeQuery(更改请求)执行失败,则对事务进行回滚,并释放锁。
PB锁保证了除了锁的所有者,其余人均无法更改和changeQuery中的属性,通过PB锁,能够使产生冲突的操作无效化。当用户进行操作时,相应的可视化资源是否被其他用户占用,从而自动决定该操作是否生效,来实现判断用户的请求是否有效。
S202、根据多个用户端的用户请求,获取各用户端的可视化特征信息。
具体地,用户进行操作后,各用户端的可视化特征信息进行了改变,而服务器对可视化特征进行实时获取。
S203、获取同步数据和各用户端的可视化特征信息。
S204、根据各用户端的可视化特征信息对同步数据处理,获取与各用户端对应的可视化数据。
S205、向用户端发送与各用户端对应的可视化数据。
本实施例中,步骤S203-S205可对应的执行图1实施例中的步骤S101-S103,其其实现原理和技术效果类似,此处不再赘述。
为了实现对各用户端进行推荐可视化数据,在上述实施例的基础上步骤S102(根据各用户端的可视化特征信息对同步数据处理,获取与各用户端对应的可视化数据)的具体实现方式可以是:
对同步数据进行结构化处理,获取知识图谱;根据知识图谱和用户端的可视化特征信息,获取与各用户端对应的可视化数据。
具体地,知识图谱包括有知识库,知识库中包括有数据层和模式层,用于将数据结构化,在获取到同步数据后,对用户产生的知识进行提取、计算和储存,将其存入知识库的数据层和模式层中,将非结构化的知识转化为结构化的知识图谱。
知识图谱是结构化的数据构成的,其中,使用实体表达知识图谱里的节点,用关系表达知识图谱里的边。实体是指现实世界中的事物,关系则用来表达不同实体之间的联系,以一种更加合理的方式组织信息、知识、事件,提高计算机理解知识的能力。
再具体的,对同步数据进行结构化处理,获取知识图谱,包括获取同步数据中的实体类基类与实体之间的关系,根据实体类基类与实体之间的关系,获取知识图谱。
在一些实施例中,根据同步数据中的实体类基类与实体之间的关系建立知识图谱,其中的,实体类基类可以包括数据、可视化、问题、用户和结论五个基本实体类,例如从用户使用协同可视分析平台的过程入手,用户首先进行注册,创建用户信息,从而得到了用户实体;用户描述自己想要分析的问题,得到问题实体;用户上传用于分析该问题的数据,得到了数据实体;用户利用数据实体,创建了一个可视化来进行说明,得到了可视化实体;用户对可视化实体进行总结,得到结论实体。得到所有相应的实体和关系之后,每两个实体(用e1和e2表示)和一个关系(用r表示)可以组成知识图谱三元组<e1,r,e2>,大量的这样的三元组结构化的存储起来构成知识图谱库,通常会存储在专门的图数据库中,例如Neo4j图数据库。在一些实施例中,实体指的是具有可区别性且独立存在的某种事物,在知识图谱中,常见的有用户实体,可视化实体等。
参见图3,图3是本发明实施例提供的构建知识图谱的结构示意图,具体如下:
从同步数据出发,同步数据包括结合结构化数据、半结构化数据和非结构化数据。其中的结构化数据包括可视化图标的逻辑描述或者关系型数据库的各种知识,半结构化知识包括认知循环;非结构化知识包括文本数据和图像数据,其中的文本数据可以是语义情景等,图像数据可以是可视化视觉信息等。
首先通过先验知识,结合结构化数据和半结构化数据对协同可视分析领域的本体行初始化,然后再结合非结构化数据对三元组进行抽取,更新知识图谱。
使用三元组表示知识信息,常见的两种方式有两种方式,即:
Knowledge={entity1,relation,entity2}
Knowledge={entity,attribute,value}
实体(entity)指的是具有可区别性且独立存在的某种事物,在协同可视分析知识图谱中,常见的有用户实体,可视化实体等;关系(relation)是一个函数,它通过将两个实体映射到一个布尔值,来描述两个实体之间的状态;属性(attribute)是对实体的描述,不同的属性类型对应于不同类型属性的边;属性值(value)实体在不同属性下的值。列如,对于用户A上传了数据D这个客观知识,可以用{用户A,上传,数据D}这个三元组来表示。对于用户A是环境学家这个客观知识,则可以用{用户A,身份,环境学家}这个三元组来表示。对于协同可视分析过程中产生的不同种结构知识,抽取三元组:
针对结构化数据和半结构化数据的三元组抽取算法,依赖人工对元数据的标注和抽取,而针对非结构化数据的信息抽取,使用transR模型即一种将实体与关系嵌入到低维向量空间中的简单模型,将实体和关系映射到不同的向量空间,将实体h,t通过一个映射Mr向关系R投影得到hr和tr,使得hr+r≈tr。在transR模型中,对每一个三元组(h,r,t),其中实体h,t∈Rk,关系r∈Rd,对于每一个关系向量r,取一个转移矩阵Mr∈Rk×d,用于将实体向量从实体空间转移到关系空间,根据转移矩阵,定义转以后的实体向量为:
hr=hMr
tr=tMr
则效用函数可以定义为:
对于任意三元组,fr(h,t)越小,则h,t之间r关系成立的可能性就越高。优化目标为:
L(h,r,t)=max(0,fpos-fneg+margin)
通过对L函数进行优化,利用梯度下降算法,即对某个具体函数,梯度的方向即为函数值上升最快的方向,通过不断迭代沿梯度下降的方向求解极小值,来提取三元组。其中fpos为正例,表示关系r成立时的fr(h,t)值;fneg为负例,表示关系不成立时的fr(h,t)值,margin是预设的一个阈值。
在得到知识图谱后,可以根据知识图谱和用户端的可视化特征信息,获取到与各用户端对应的可视化数据,例如说用户现在有X,Y轴的一些数据,知识图谱会给用户推荐二维坐标下的一些的数据分析图像,比如散点图,然后将推荐的散点图发送给对应的用户端,能利用其他人的知识来理解用户的分析意图,分析出可视化图表的情景上下文,并筛选出对用户有意义的信息并呈现给用户,协助用户快速定位到数据空间里有意义的趋势、异常、决策依据等信息,具体如下:
获取用户端的可视化特征信息的可视化类,并获取可视化类中的结构特征数据、标签特征数据和文本特征数据;对结构特征数据、标签特征数据和文本特征数据处理,获取与各用户端对应的可视化数据。
具体的,通过将可视化类中设计结构的数据归为结构特征数据,标签数据归为标签特征数据,文本数据归为文本特征数据,来获取到结构特征数据、标签特征数据和文本特征数据。
再具体的,对结构特征进行独热编码,得到可视化实体结构特征;利用标签分类模型对标签特征进行可视化实体的映射处理,得到可视化实体标签特征;利用词向量模型对文本特征进行词向量化处理,得到可视化实体文本特征。
针对结构特征,在一些实施例中,对结构特征进行独热编码,得到可视化实体结构特征,例如考虑维度信息,其维度信息的储存格式为:(维度ID1,维度ID2,…维度IDn)。
可视化实例V的维度特征向量为:
得到可视化实体结构特征:
feature1={d1,d2,d3}
针对标签特征,在一些实施例中,对于标签特征,需要建立一个将可视化实体映射到多个标签的模型,定义X代表样本空间,L={λ1,λ2……λn}代表一个有限的标签合集,若X中的每一个实例x,都能通过一个变换f,映射为L的一个子集,则称f为X的一个多标签分类器。采用了多标签kNN算法对分类进行处理,改进了kNN聚类算法以适应多标签分类的需求,kNN聚类算法的每个样本都可以用它最接近的k个邻居来代表,是对于每一个可视化实体,距离它最近的k个可视化实体(知识图谱中和该可视化实体层级差不超过某一个阈值的可视化实体)可以首先得到,然后得到这些实例的标签集合,之后通过最大后验概率准则来确定新实例的标签集合,得到可视化实体标签特征,其中的最大后验概率准则如下:
对于未被分类的可视化实体x,用N(x)表征标签集里x的k个最邻近样本合集。结合欧几里得距离,可以得到:
这里,Cx是一个1×n的行向量,它的元素Cx(l)指的是对于标签y,x的k个近邻中有多少个近邻拥有这个标签。
则对于可视化实体t,有假设H0:t属于标签yi;对应的,假设H1:t不属于标签yi,事件Ej为对于标签y,k个近邻中有j个包含这个标签。则根据最大后验概率和贝叶斯公司,有:
Y={yi|argmax(P(Hb)P(Ej|Hb)),b∈{0,1}}
其中P(Hb)代表t是否有标签yi的先验概率,可以用yi标签在整个训练集上出现的次数除以标签总次数来求出:
后验概率P(Ej|Hb)的计算方法为:
其中,c[yi]代表所有的向量中,其k近邻拥有yi标签的个数为j,且自身也有yi标签的向量的个数。表示有yi标签,且其k近邻有p∈{0,1,…q}个拥有yi标签的总和数。
在上式中,若b=1能取到最大,则可视化实体t拥有yi标签,来确定新实例的标签集合。
针对文本特征,在一些实施例中,利用词向量模型对文本特征进行词向量化处理,得到可视化实体文本特征,对于描述可视化实体的短文本c,短文本c就是文本,字符串,例如研究寿命和健康的关系,短文本就可是健康、寿命。则其在向量空间R里的映射为可视化实体的文本特征,表示为
其中Ci是单词i的词向量,Wi=softmax(tfi*idfi),i∈{1,2,…,n}是每个词Ci的权重信息,n是文档中词的个数。
在得到可视化实体结构特征、可视化实体标签特征和可视化实体文本特征之后,需要推荐知识图谱的可视化,具体如下:
获取知识图谱中分别与可视化实体结构特征、可视化实体标签特征和可视化实体文本特征相似的可视化特征,对可视化特征处理,获取与各用户端对应的可视化数据。
针对可视化实体结构特征和可视化实体标签特征,具体的,利用皮尔森距离模型对可视化实体结构特征和可视化实体标签特征处理,获取知识图谱中分别与可视化实体结构特征和可视化实体标签特征相似的第一特征,其中,皮尔森距离模型是对大规模的特征和单独的用户特征对比的算法,看着两个是否很像,如果很像的话,就推荐。
在一些实施例中,皮尔森距离模型如下:
就是X,Y两个变量的协方差与两个变量的标准差之积的比值。X是根据大规模的用户的得到的可视化第一特征向量,Y是针对一个独特用户的可视化第一特征向量。
针对可视化实体文本特征处理,具体的,利用词向量相似度量模型对可视化实体文本特征处理,获取知识图谱中与可视化实体文本特征相似的第二特征。
相应的,假设现在有两个可视化实例的文本特征d1与d2。首先,让特征d1中的每个单词i转移到特征d2中的任一或者多个单词上。定义T∈Rn×n为一个稀疏矩阵,其中Ti,j>0表示特征d1中的单词i转移到特征d2中的单词j的比例。从而,为了使d1中的每个单词都能完全转移到d2中的单词,使特征d1中的单词i的输出流与d1(i)相等,即∑jTij=d1(i),其中d1(i)表示文档d1的第i维。另一方面,对于d2中的每个单词j,其输入流也需要与d2(j)相等,即∑iTji=d2(j)。根据以上分析,得到将特征d1中的单词转移到特征d2中的总转移成本[37],如下:
其中:
则两个文档di与dj之间的相似度可以用转移成本的倒数来决定,定义如下:
综合以上分析,定义可视化实体的相似度为:
S=w1*S1+w2*S2+w3*S3
其中,w1与w2,w3是相应的权重。考虑到S1,S2,S3是在不同度量单位下的相似度定义,需要对权重进行学习以平衡误差。
假定,对于任意两个可视化实例:
则,对于可视化实例对(V1,V2),若g(V1,V2)符合预期,则不更新权重w与阈值θ,若不相符,则按照以下规则更新:
θ:=θ+μL(s(V1,V2),θ)
其中,η和μ是相应的步长,L(s(V1,V2),θ)是两者之差。
在得到第一特征和第二特征后,对第一特征和第二特征进行加权处理,即把两个向量合成一个,将多个向量统一为一个向量的办法,即S=w1*S_1+w2*S_2,w1、w2是权重获取可视化特征。
本实施例中,通过利用同步数据构建知识图谱,然后知识图谱会根据各用户端的可视化特征信息,为各用户端推荐出对应的可视化数据,比如说用户现在有X,Y轴的一些数据,可以对同步数据处理后,给用户推荐二维坐标下的一些的数据分析图像,比如散点图,然后将推荐的散点图发送给对应的用户端,解决能利用其他人的知识来理解用户的分析意图,分析出可视化图表的情景上下文,并筛选出对用户有意义的信息并呈现给用户,协助用户快速定位到数据空间里有意义的趋势、异常、决策依据等信息。
参见图4,图4是本发明实施例提供的一种协同可视数据推荐装置的结构示意图,装置40包括:
数据模块41:获取同步数据和各用户端的可视化特征信息;
推荐模块42:根据各用户端的可视化特征信息和同步数据处理,获取与各用户端对应的可视化数据;
发送模块43:向用户端发送与各用户端对应的可视化数据。
图4所示实施例的协同可视数据推荐装置对应地可用于执行图1所示方法实施例中的步骤,其实现原理和技术效果类似,此处不再赘述。
可选地,数据模块41获取各用户端的可视化特征信息,包括:
根据多个用户端的用户请求,获取各用户端的可视化特征信息。
可选地,根据多个用户端的用户请求,获取各用户端的可视化特征信息之前,还包括:
接收用户端的用户请求;
确定用户请求对应的可视化资源为可用状态。
可选地,可视化特征信息包括元组数据和用户操作数据;
相应的,元组数据以层级结构描述,用户操作数据以数组列表描述。
可选地,推荐模块42根据各用户端的可视化特征信息对同步数据处理,获取与各用户端对应的可视化数据,包括:
对同步数据进行结构化处理,获取知识图谱;
根据知识图谱和用户端的可视化特征信息,获取与各用户端对应的可视化数据。
可选地,对同步数据进行结构化处理,获取知识图谱,包括:
获取同步数据中的实体类基类与实体之间的关系;
根据实体类基类与实体之间的关系,获取知识图谱。
可选地,根据知识图谱和用户端的可视化特征信息,获取与各用户端对应的可视化数据,包括:
获取用户端的可视化特征信息的可视化类,并获取可视化类中的结构特征数据、标签特征数据和文本特征数据;
对结构特征数据、标签特征数据和文本特征数据处理,获取与各用户端对应的可视化数据。
可选地,对结构特征数据、标签特征数据和文本特征数据处理,获取与各用户端对应的可视化数据,包括:
对结构特征进行独热编码,得到可视化实体结构特征;
利用标签分类模型对标签特征进行可视化实体的映射处理,得到可视化实体标签特征;
利用词向量模型对文本特征进行词向量化处理,得到可视化实体文本特征;
获取知识图谱中分别与可视化实体结构特征、可视化实体标签特征和可视化实体文本特征相似的可视化特征,对可视化特征处理,获取与各用户端对应的可视化数据。
可选地,获取知识图谱中分别与可视化实体结构特征、可视化实体标签特征和可视化实体文本特征相似的可视化特征,包括:
利用皮尔森距离模型对可视化实体结构特征和可视化实体标签特征处理,获取知识图谱中分别与可视化实体结构特征和可视化实体标签特征相似的第一特征;
利用词向量相似度量模型对可视化实体文本特征处理,获取知识图谱中与可视化实体文本特征相似的第二特征;
对第一特征和第二特征进行加权处理,获取可视化特征。
参见图5,是本发明实施例提供的一种设备的硬件结构示意图,该设备50包括:处理器51、存储器52和计算机程序;其中
存储器52,用于存储计算机程序,该存储器还可以是闪存(flash)。计算机程序例如是实现上述方法的应用程序、功能模块等。
处理器51,用于执行存储器存储的计算机程序,以实现上述方法中终端执行的各个步骤。具体可以参见前面方法实施例中的相关描述。
可选地,存储器52既可以是独立的,也可以跟处理器51集成在一起。
当存储器52是独立于处理器51之外的器件时,设备还可以包括:
总线53,用于连接存储器52和处理器51。
本发明还提供一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序被处理器执行时用于实现上述的各种实施方式提供的方法。
其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(ApplicationSpecific Integrated Circuits,简称:ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和可读存储介质也可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的动态人脸图像重建方法。
在上述设备的实施例中,应理解,处理器可以是中央处理单元(英文:CentralProcessing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:DigitalSignal Processor,简称:DSP)、专用集成电路(英文:Application Specific IntegratedCircuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种协同可视数据推荐方法,其特征在于,包括:
获取同步数据和各用户端的可视化特征信息;
根据各所述用户端的所述可视化特征信息对所述同步数据处理,获取与各所述用户端对应的可视化数据;
向所述用户端发送与各所述用户端对应的所述可视化数据。
2.根据权利要求1所述的方法,其特征在于,所述获取各用户端的可视化特征信息,包括:
根据多个所述用户端的用户请求,获取各用户端的可视化特征信息。
3.根据权利要求2所述的方法,其特征在于,所述根据多个所述用户端的用户请求,获取各用户端的可视化特征信息之前,还包括:
接收所述用户端的所述用户请求;
确定所述用户请求对应的可视化资源为可用状态。
4.根据权利要求1所述的方法,其特征在于,所述可视化特征信息包括元组数据和用户操作数据;
相应的,所述元组数据以层级结构描述,所述用户操作数据以数组列表描述。
5.根据权利要求1所述的方法,其特征在于,所述根据各所述用户端的所述可视化特征信息对所述同步数据处理,获取与各所述用户端对应的可视化数据,包括:
对所述同步数据进行结构化处理,获取知识图谱;
根据所述知识图谱和所述用户端的所述可视化特征信息,获取与各所述用户端对应的可视化数据。
6.根据权利要求5所述的方法,其特征在于,所述对所述同步数据进行结构化处理,获取知识图谱,包括:
获取所述同步数据中的实体类基类与实体之间的关系;
根据所述实体类基类与实体之间的关系,获取知识图谱。
7.根据权利要求6所述的方法,其特征在于,所述根据所述知识图谱和所述用户端的所述可视化特征信息,获取与各所述用户端对应的可视化数据,包括:
获取所述用户端的所述可视化特征信息的可视化类,并获取所述可视化类中的结构特征数据、标签特征数据和文本特征数据;
对所述结构特征数据、所述标签特征数据和所述文本特征数据处理,获取与各所述用户端对应的可视化数据。
8.根据权利要求7所述的方法,其特征在于,所述对所述结构特征数据、所述标签特征数据和所述文本特征数据处理,获取与各所述用户端对应的可视化数据,包括:
对所述结构特征进行独热编码,得到可视化实体结构特征;
利用标签分类模型对所述标签特征进行可视化实体的映射处理,得到可视化实体标签特征;
利用词向量模型对所述文本特征进行词向量化处理,得到可视化实体文本特征;
获取所述知识图谱中分别与所述可视化实体结构特征、所述可视化实体标签特征和所述可视化实体文本特征相似的可视化特征,对所述可视化特征处理,获取与各用户端对应的可视化数据。
9.根据权利要求8所述的方法,其特征在于,所述获取所述知识图谱中分别与所述可视化实体结构特征、所述可视化实体标签特征和所述可视化实体文本特征相似的可视化特征,包括:
利用皮尔森距离模型对所述可视化实体结构特征和所述可视化实体标签特征处理,获取所述知识图谱中分别与所述可视化实体结构特征和所述可视化实体标签特征相似的第一特征;
利用词向量相似度量模型对可视化实体文本特征处理,获取所述知识图谱中与所述可视化实体文本特征相似的第二特征;
对所述第一特征和所述第二特征进行加权处理,获取所述可视化特征。
10.一种协同可视数据推荐装置,其特征在于,包括:
数据模块:获取同步数据和各用户端的可视化特征信息;
推荐模块:根据各所述用户端的所述可视化特征信息和所述同步数据处理,获取与各所述用户端对应的可视化数据;
发送模块:向所述用户端发送与各所述用户端对应的所述可视化数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910689659.5A CN110489613B (zh) | 2019-07-29 | 2019-07-29 | 协同可视数据推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910689659.5A CN110489613B (zh) | 2019-07-29 | 2019-07-29 | 协同可视数据推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110489613A true CN110489613A (zh) | 2019-11-22 |
CN110489613B CN110489613B (zh) | 2022-04-26 |
Family
ID=68548402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910689659.5A Active CN110489613B (zh) | 2019-07-29 | 2019-07-29 | 协同可视数据推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110489613B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112003887A (zh) * | 2020-07-06 | 2020-11-27 | 北京航空航天大学 | 一种面向工业互联网时序数据预测的云端-边缘协同深度学习装置 |
CN112287043A (zh) * | 2020-12-29 | 2021-01-29 | 成都数联铭品科技有限公司 | 基于领域知识的图编码自动生成方法及系统、电子设备 |
CN112712177A (zh) * | 2020-12-29 | 2021-04-27 | 上海永骁智能技术有限公司 | 一种基于协同处理的知识工程方法与装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101706794A (zh) * | 2009-11-24 | 2010-05-12 | 上海显智信息科技有限公司 | 基于语义实体关系模型和可视化推荐的信息浏览检索方法 |
US20100325076A1 (en) * | 2009-06-19 | 2010-12-23 | Raytheon Company | System and Method for Interactive Knowledge Visualization |
CN103745288A (zh) * | 2013-08-13 | 2014-04-23 | 北京航空航天大学 | 一种基于知识的复杂产品研发过程协同方法 |
CN104794151A (zh) * | 2015-01-30 | 2015-07-22 | 北京东方泰坦科技股份有限公司 | 一种基于协同标绘技术的空间知识服务系统建设方法 |
US20160342604A1 (en) * | 2013-05-30 | 2016-11-24 | ClearStory Data Inc. | Apparatus and Method for Collaboratively Analyzing Data Snapshot Visualizations from Disparate Data Sources Using State Based Visual Data Link Recommendations |
US9721038B1 (en) * | 2013-03-14 | 2017-08-01 | EMC IP Holding Company LLC | Collaborative data visualization |
CN108509479A (zh) * | 2017-12-13 | 2018-09-07 | 深圳市腾讯计算机系统有限公司 | 实体推荐方法及装置、终端及可读存储介质 |
CN109871542A (zh) * | 2019-03-08 | 2019-06-11 | 广东工业大学 | 一种文本知识提取方法、装置、设备及存储介质 |
US20190197168A1 (en) * | 2017-12-27 | 2019-06-27 | Paypal, Inc. | Contextual engine for data visualization |
CN110008251A (zh) * | 2019-03-07 | 2019-07-12 | 平安科技(深圳)有限公司 | 基于时序数据的数据处理方法、装置和计算机设备 |
-
2019
- 2019-07-29 CN CN201910689659.5A patent/CN110489613B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100325076A1 (en) * | 2009-06-19 | 2010-12-23 | Raytheon Company | System and Method for Interactive Knowledge Visualization |
CN101706794A (zh) * | 2009-11-24 | 2010-05-12 | 上海显智信息科技有限公司 | 基于语义实体关系模型和可视化推荐的信息浏览检索方法 |
US9721038B1 (en) * | 2013-03-14 | 2017-08-01 | EMC IP Holding Company LLC | Collaborative data visualization |
US20160342604A1 (en) * | 2013-05-30 | 2016-11-24 | ClearStory Data Inc. | Apparatus and Method for Collaboratively Analyzing Data Snapshot Visualizations from Disparate Data Sources Using State Based Visual Data Link Recommendations |
CN103745288A (zh) * | 2013-08-13 | 2014-04-23 | 北京航空航天大学 | 一种基于知识的复杂产品研发过程协同方法 |
CN104794151A (zh) * | 2015-01-30 | 2015-07-22 | 北京东方泰坦科技股份有限公司 | 一种基于协同标绘技术的空间知识服务系统建设方法 |
CN108509479A (zh) * | 2017-12-13 | 2018-09-07 | 深圳市腾讯计算机系统有限公司 | 实体推荐方法及装置、终端及可读存储介质 |
US20190197168A1 (en) * | 2017-12-27 | 2019-06-27 | Paypal, Inc. | Contextual engine for data visualization |
CN110008251A (zh) * | 2019-03-07 | 2019-07-12 | 平安科技(深圳)有限公司 | 基于时序数据的数据处理方法、装置和计算机设备 |
CN109871542A (zh) * | 2019-03-08 | 2019-06-11 | 广东工业大学 | 一种文本知识提取方法、装置、设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
TAIYANG PENG 等: "A Recommendation System for Collaborative Visualization Platforms", 《2017 5TH INTERNATIONAL CONFERENCE ON ENTERPRISE SYSTEMS (ES)》 * |
任磊 等: "大数据可视分析综述", 《软件学报》 * |
韩鹏飞: "面向协作式众包测试推荐系统的设计与实现", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112003887A (zh) * | 2020-07-06 | 2020-11-27 | 北京航空航天大学 | 一种面向工业互联网时序数据预测的云端-边缘协同深度学习装置 |
CN112287043A (zh) * | 2020-12-29 | 2021-01-29 | 成都数联铭品科技有限公司 | 基于领域知识的图编码自动生成方法及系统、电子设备 |
CN112712177A (zh) * | 2020-12-29 | 2021-04-27 | 上海永骁智能技术有限公司 | 一种基于协同处理的知识工程方法与装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110489613B (zh) | 2022-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Transformer-based dual relation graph for multi-label image recognition | |
Xu et al. | Cross-modal subspace learning for fine-grained sketch-based image retrieval | |
Joshi et al. | A review on explainability in multimodal deep neural nets | |
CN106973244A (zh) | 使用弱监督为图像配字幕 | |
Khan et al. | Advances and trends in real time visual crowd analysis | |
CN110489613A (zh) | 协同可视数据推荐方法及装置 | |
EP3910527A2 (en) | Medical data verification method, apparatus and electronic device | |
CN110612522A (zh) | 实体模型的建立 | |
CN113220861B (zh) | 一种面向专业领域的知识图谱问答系统 | |
US10163036B2 (en) | System and method of analyzing images using a hierarchical set of models | |
Gao et al. | Self-attention driven adversarial similarity learning network | |
JP7242994B2 (ja) | ビデオイベント識別方法、装置、電子デバイス及び記憶媒体 | |
Lowe et al. | Requirements of data visualisation tools to analyse big data: A structured literature review | |
Lu et al. | Visual topic discovering, tracking and summarization from social media streams | |
Lotfi et al. | Storytelling with image data: A systematic review and comparative analysis of methods and tools | |
Yu et al. | Multimodal multitask deep learning for X-ray image retrieval | |
Cortiñas-Lorenzo et al. | Toward explainable affective computing: A review | |
Asaithambi et al. | Proposed big data architecture for facial recognition using machine learning | |
Yang et al. | Student Classroom Behavior Detection Based on YOLOv7+ BRA and Multi-model Fusion | |
Peng et al. | Learning on Multimodal Graphs: A Survey | |
Siddiqi et al. | Face image analysis using machine learning: a survey on recent trends and applications | |
Kozlova et al. | Development of the toolkit to process the internet memes meant for the modeling, analysis, monitoring and management of social processes | |
Li et al. | [Retracted] Human Motion Representation and Motion Pattern Recognition Based on Complex Fuzzy Theory | |
Huang et al. | Dynamic hypergraph convolutional network for multimodal sentiment analysis | |
Mueller et al. | Can computers master the art of communication?: A focus on visual analytics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |