一种基于图数据库的用户画像构建方法、系统及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于图数据库的用户画像构建方法、系统及存储介质。
背景技术
随着社会的发展与进步,用户画像的构建越来越重要,用户画像能够利用数据的多维度视图,客观真实的反映出用户的行为轨迹、习惯特点及服务需求等,为各领域的服务能力提升,数据分析的挖掘提供了必要的技术支撑。而对用户画像的构建和管理,首先是需要明确用户与行为轨迹、习惯特点及服务需求等各种标签的关联关系。
对于关联关系的建立,目前在普通的关系型数据库或者NoSQL类型列数据库、Key-Value数据库中,如果需要人、事、物的三者关联关系表达,需要将数据先进行结构化的设计,然后存储到二维表格中。然而这种建立关联关系的方式所构建的用户画像管理系统,在实际查询起来并不方便,效率并不高,且不利于后期对用户画像管理系统的维护,不支持关联关系的增删补漏等操作。
另外,在查询多层级的关联关系,需要进行多次数据查询交互,才能获得想要的速度,这样会导致查询效率低下,交互步骤繁琐,不利于发掘网状结构的关系网络。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供一种基于图数据库的用户画像构建方法、系统及存储介质。
本发明解决上述技术问题的技术方案如下:
一种基于图数据库的用户画像构建方法,包括以下步骤:
获取用户数据,并对所述用户数据进行识别,得到所述用户数据的多个维度信息;
对多个所述维度信息进行分析,获取所述维度信息相互之间的关联关系,将所述维度信息和所述关联关系存储入图数据库中,并根据所述关联关系构建图数据模型;
接收待查询用户数据,根据所述图数据模型生成用户画像分析报告。
本发明的有益效果是:由于用户数据包含多个维度信息,通过这些维度信息以及维度信息相关之间的关联关系,便于进行图数据库中关联关系的编制,得到图数据模型,因此首先通过识别用户数据得到维度信息,便于后续关联关系的分析和编制,便于构建出图数据模型;对维度信息进行分析,便于获取关联关系,从而便于关联关系的编制,提高通过构建出的图数据模型进行查询待查询用户数据的精度和效率;按照图数据模型的方式建立关联关系,可依赖于图数据库的存储和计算能力,以网状图和文字的方式建立关联关系,直观清晰,并可进行关联关系的增加、删除和更新等交互操作,用户体验感强,有利于网状关联关系网络的扩大发展,交互简单,数据处理能力强,速度快,对待查询用户数据的关联关系的查询效率高,以及得到的用户画像分析报告的准确率高。
在上述技术方案的基础上,本发明还可以做如下改进:
进一步:对所述用户数据进行识别之前还包括以下步骤:
对所述用户数据进行预处理,得到处理用户数据。
上述进一步方案的有益效果是:对用户数据进行预处理,便于对用户数据的识别和分析,便于获取维度信息和对维度信息进行分析,从而获取关联关系;其中,预处理可以包括标准化处理和分词处理,通过标准化处理可以将用户数据统一为同一标准下的数据,再通过分词处理可以便于后续识别处理用户数据中的特征词。
进一步:得到所述维度信息的具体步骤包括:
识别所述处理用户数据中的特征词,根据所述特征词得到所述维度信息。
上述进一步方案的有益效果是:通过识别处理用户数据中的特征词,便于获取维度信息,并便于后续对维度信息进行分析,获取各维度信息之间的关联关系。
进一步:得到所述维度信息之后还包括以下步骤:
对所述维度信息进行分类,得到实体信息以及与所述实体信息对应的属性。
上述进一步方案的有益效果是:通过对维度信息进行分类,便于后续根据分类后的实体信息及对应的属性进行关联关系的分析,并以网状图和文字的方式编制关联关系,构建的图数据模型更准确,通过该图数据模型进行查询待查询用户数据的效率更高,准确度更高,易扩展;其中,可以将包含人、事件或物的维度信息分为实体信息。
进一步:获取所述关联关系的具体步骤包括:
将所述实体信息映射为节点,根据所述节点对应的所述属性确定所述节点相互之间的真实关系,并根据所述真实关系获取所述关联关系。
上述进一步方案的有益效果是:将实体信息映射为节点,根据各节点(即各实体信息)对应的属性确定各节点之间的真实关系,并确定关联关系,从而便于网状结构的关联关系网络的编制,交互简单,而不局限于传统的二维表格结构的关联关系,有利于构建图数据模型,易扩展,适用于多层级关系的用户画像的构建及查询。
进一步:根据所述关联关系构建图数据模型的具体步骤包括:
分别接收包含所述节点的第一输入指令和包含所述属性的第二输入指令,并根据所述关联关系分别对所述第一输入指令和所述第二输入指令进行读写交互,构建所述图数据模型。
上述进一步方案的有益效果是:通过已经获取的关联关系,结合包含节点的第一输入指令和包含属性的第二输入指令,便于各节点相互之间及节点与属性之间的读写交互,基于图数据库的存储和计算能力,构建适用于多层级关系的图数据模型,易扩展,例如:节点的增加、删除和更新,关联关系的增加、删除和更新等,提高待查询用户数据的查询效率和准确度。
进一步:所述图数据库具体包括Neo4j数据库。
上述进一步方案的有益效果是:Neo4j数据库的存储是依赖于图理论的,基于该Neo4j数据库的待查询用户数据的查询,与按照行、列存储关系进行多次交互查询相比,有数量级的优势,能有效提高查询效率和准确度。
依据本发明的另一方面,提供了一种基于图数据库的用户画像构建系统,包括数据获取模块、数据处理模块、存储模块、图数据模型构建模块和查询模块;
所述数据获取模块,用于获取用户数据;
所述数据处理模块,用于对所述用户数据进行识别,得到所述用户数据的多个维度信息;还用于对多个所述维度信息进行分析,获取所述维度信息相互之间的关联关系;
所述存储模块,用于存储所述维度信息和所述关联关系;
所述图数据模型构建模块,用于根据所述关联关系构建图数据模型;
所述查询模块,用于接收待查询用户数据,根据所述图数据模型生成用户画像分析报告。
本发明的有益效果是:通过数据获取模块获取用户数据,通过数据处理模块首先识别用户数据得到维度信息,便于后续关联关系的分析和编制,便于构建出图数据模型;再通过数据处理模块对维度信息进行分析,便于获取关联关系,从而便于关联关系的编制,提高通过构建出的图数据模型进行查询待查询用户数据的精度和效率;按照图数据模型的方式建立关联关系,可依赖于图数据库的存储和计算能力,以网状图和文字的方式建立关联关系,直观清晰,并可进行关联关系的增加、删除和更新等交互操作,用户体验感强,有利于网状关联关系网络的扩大发展,交互简单,数据处理能力强,速度快,对待查询用户数据的关联关系的查询效率高,以及得到的用户画像分析报告的准确率高。
依据本发明的另一方面,提供了一种基于图数据库的用户画像构建系统,包括处理器、存储器和存储在所述存储器中且可运行在所述处理器上的计算机程序,所述计算机程序运行时实现本发明的一种基于图数据库的用户画像构建方法中的步骤。
本发明的有益效果是:通过存储在存储器上的计算机程序,并运行在处理器上,实现本发明的基于图数据库的用户画像构建系统,按照图数据模型的方式建立关联关系,可依赖于图数据库的存储和计算能力,以网状图和文字的方式建立关联关系,直观清晰,并可进行关联关系的增加、删除和更新等交互操作,用户体验感强,有利于网状关联关系网络的扩大发展,交互简单,数据处理能力强,速度快,对待查询用户数据的关联关系的查询效率高,以及得到的用户画像分析报告的准确率高。
依据本发明的另一方面,提供了一种计算机存储介质,所述计算机存储介质包括:至少一个指令,在所述指令被执行时实现本发明的一种基于图数据库的用户画像构建方法中的步骤。
本发明的有益效果是:通过执行包含至少一个指令的计算机存储介质,实现本发明的基于图数据库的用户画像构建方法,按照图数据模型的方式建立关联关系,可依赖于图数据库的存储和计算能力,以网状图和文字的方式建立关联关系,直观清晰,并可进行关联关系的增加、删除和更新等交互操作,用户体验感强,有利于网状关联关系网络的扩大发展,交互简单,数据处理能力强,速度快,对待查询用户数据的关联关系的查询效率高,以及得到的用户画像分析报告的准确率高。
附图说明
图1为本发明一种基于图数据库的用户画像构建方法的流程示意图一;
图2为本发明一种基于图数据库的用户画像构建方法的流程示意图二;
图3为本发明实施例一构建图数据模型中编辑属性的操作界面示意图;
图4为本发明实施例一构建图数据模型中编辑节点的操作界面示意图;
图5为本发明实施例一构建图数据模型中编辑关联关系的操作界面示意图一;
图6为本发明实施例一构建图数据模型中编辑关联关系的操作界面示意图二;
图7为本发明实施例一构建图数据模型中增加属性的操作界面示意图;
图8为本发明实施例一构建图数据模型中删除属性的操作界面示意图;
图9为本发明实施例一构建图数据模型中新增节点的操作界面示意图一;
图10为本发明实施例一构建图数据模型中新增节点的操作界面示意图二;
图11为本发明实施例一构建图数据模型中新增节点的操作界面示意图三;
图12为本发明实施例一构建图数据模型中生成新的节点的界面示意图;
图13为本发明实施例一构建图数据模型中删除节点的操作界面示意图;
图14为本发明实施例一构建图数据模型中增加关联关系的操作界面示意图;
图15为本发明实施例一构建图数据模型中删除关联关系的操作界面示意图;
图16为本发明实施例一中构建的图数据模型的效果示意图;
图17为本发明一种基于图数据库的用户画像构建系统的结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
下面结合附图,对本发明进行说明。
实施例一、如图1所示,一种基于图数据库的用户画像构建方法,包括以下步骤:
S1:获取用户数据,并对所述用户数据进行识别,得到所述用户数据的多个维度信息;
S2:对多个所述维度信息进行分析,获取所述维度信息相互之间的关联关系,将所述维度信息和所述关联关系存储入图数据库中,并根据所述关联关系构建图数据模型;
S3:接收待查询用户数据,根据所述图数据模型生成用户画像分析报告。
本发明首先通过识别用户数据得到维度信息,便于后续关联关系的分析和编制,便于构建出图数据模型;对维度信息进行分析,便于获取关联关系,从而便于关联关系的编制,提高通过构建出的图数据模型进行查询待查询用户数据的精度和效率;按照图数据模型的方式建立关联关系,可依赖于图数据库的存储和计算能力,以网状图和文字的方式建立关联关系,直观清晰,并可进行关联关系的增加、删除和更新等交互操作,用户体验感强,有利于网状关联关系网络的扩大发展,交互简单,数据处理能力强,速度快,对待查询用户数据的关联关系的查询效率高,以及得到的用户画像分析报告的准确率高。
本实施例中从Excel、关系型数据库、NoSQL类型的列式数据库中读取在工程建设中的用户数据,并通过计算机在用户画像构建的操作界面上展示。
优选地,如图2所示,在S1中,对所述用户数据进行识别之前还包括以下步骤:
对所述用户数据进行预处理,得到处理用户数据。
对用户数据进行预处理,便于对用户数据的识别和分析,便于获取维度信息和对维度信息进行分析,从而获取关联关系。
本实施例的预处理分别采用了标准化处理和分词处理,通过标准化处理可以将用户数据统一为同一标准下的数据,再通过分词处理可以便于后续识别处理用户数据中的特征词。
优选地,如图2所示,在S1中,得到所述维度信息的具体步骤包括:
识别所述处理用户数据中的特征词,根据所述特征词得到所述维度信息。
通过识别处理用户数据中的特征词,便于获取维度信息,并便于后续对维度信息进行分析,获取各维度信息之间的关联关系。
本实施例中对工程建设用户数据中的特征词,包括“项目”、“公司”、“人”、“项目名称”、“建设地址”、“建设规模”、“开工时间”、“公司名称”、“公司地址”、“法人”、“高管人员”和“员工”等,还包括上述特征词对应的属性值,也视为特征词。
优选地,如图2所示,在S1中,得到所述维度信息之后还包括以下步骤:
对所述维度信息进行分类,得到实体信息以及与所述实体信息对应的属性。
通过对维度信息进行分类,便于后续根据分类后的实体信息及对应的属性进行关联关系的分析,并以网状图和文字的方式编制关联关系,构建的图数据模型更准确,通过该图数据模型进行查询待查询用户数据的效率更高,准确度更高,易扩展。
本实施例将“项目”、“公司”和“人”分为实体信息,与“项目”对应的“公司名称”、“建设地址”、“建设规模”和“开工时间”分为与“项目”对应的属性,与“公司”对应的“公司地址”和“法人”分为与“公司”对应的属性,与“人”对应的“高管人员”和“员工”分为与“人”对应的属性。
优选地,在S2中,获取所述关联关系的具体步骤包括:
将所述实体信息映射为节点,根据所述节点对应的所述属性确定所述节点相互之间的真实关系,并根据所述真实关系获取所述关联关系。
将实体信息映射为节点,根据各节点(即各实体信息)对应的属性确定各节点之间的真实关系,并确定关联关系,从而便于网状结构的关联关系网络的编制,交互简单,而不局限于传统的二维表格结构的关联关系,有利于构建图数据模型,易扩展,适用于多层级关系的用户画像的构建及查询。
在获取关联关系的过程中,通常将现实世界中的人、物等实体信息映射为图数据库中的节点,而人、物之间的真实关系(即节点与节点之间的真实关系)映射为图数据库中的关联关系,节点与节点之间的真实关系可根据各节点对应的属性来判断。其中,参与关联关系分析的实体信息对应的属性可以按照人、物的方式进行识别,独立成节点。例如:员工1住在Y小区,则“员工1”映射为节点,“Y小区”既可映射为节点,也可视为该员工对应的属性,当需要按照小区分析人员的关联关系,则“Y小区”可独立成为节点,根据“员工1”与“Y小区”之间的真实关系确定关联关系,当不需要按照小区分析人员关系,例如只需要按照公司来分析人员关系时,则“Y小区”即为附属在该人员对应的属性。
本实施例中,对于已经分类的关于工程建设的维度信息,A公司为XX项目的建设单位,B公司为XX项目的设计单位,将“A公司”、“XX项目”和“B公司”分别映射为节点,则节点“A公司”与节点“XX项目”之间的第一真实关系为建设单位,“建设单位”就是“A公司”和“XX项目”的关联关系,同样,节点“B公司”与节点“XX项目”之间的第一真实关系为设计单位,“设计单位”就是“B公司”和“X项目”的关联关系;进一步延伸,A公司有员工1,B公司有员工2,员工1和员工2都住在Z小区,则“员工1”、“员工2”、“Z小区”都属于节点,而节点“员工1”和节点“A公司”的关联关系为“员工”,节点“员工1”和节点“Z小区”的关联关系为“住户”。
优选地,根据所述关联关系构建图数据模型的具体步骤包括:
分别接收包含所述节点的第一输入指令和包含所述属性的第二输入指令,并根据所述关联关系分别对所述第一输入指令和所述第二输入指令进行读写交互,构建所述图数据模型。
通过已经获取的关联关系,结合包含节点的第一输入指令和包含属性的第二输入指令,便于各节点相互之间及节点与属性之间的读写交互,基于图数据库的存储和计算能力,构建适用于多层级关系的图数据模型,易扩展,例如:节点的增加、删除和更新,关联关系的增加、删除和更新等,提高待查询用户数据的查询效率和准确度。
本实施例通过前述步骤已经获取的关于工程建设的用户数据和已经识别分析出的关联关系存储入图数据库中,其中,本实施例所采用的图数据库为Neo4j数据库,通过该图数据库的操作界面,首先对各属性和各节点进行编辑,对各属性进行编辑的操作界面示意图如图3所示,对各节点进行编辑的操作界面示意图如图4所示;并根据已经存储入的关联关系进行编辑,操作界面示意图如图5和图6所示;基于Neo4j数据库,可以对各属性、节点和关联关系进行增加和删除等交互操作,增加属性的操作界面示意图如图7所示,删除属性的操作界面示意图如图8所示,新增节点的操作界面示意图分别如图9~11所示,通过新增节点的交互操作后生成新的节点的示意图如图12所示,删除节点的操作界面示意图如图13所示,新增关联关系和删除关联关系的操作界面示意图分别如图14和图15所示,通过上述交互操作后,构建的图数据库模型如图16所示。
通过图16所示的图数据模型,依赖于图数据库的存储和计算能力,以网状图和文字的方式建立关联关系,直观清晰,并可进行关联关系的增加、删除和更新等交互操作,用户体验感强,有利于网状关联关系网络的扩大发展,交互简单,数据处理能力强,速度快,对待查询用户数据的关联关系的查询效率高,以及得到的用户画像分析报告的准确率高,且所得到的用户画像分析报告以文字和网络图形式展示出,便于查看。
实施例二、如图17所示,一种基于图数据库的用户画像构建系统,包括数据获取模块、数据处理模块、存储模块、图数据模型构建模块和查询模块;
所述数据获取模块,用于获取用户数据;
所述数据处理模块,用于对所述用户数据进行识别,得到所述用户数据的多个维度信息;还用于对多个所述维度信息进行分析,获取所述维度信息相互之间的关联关系;
所述存储模块,用于存储所述维度信息和所述关联关系;
所述图数据模型构建模块,用于根据所述关联关系构建图数据模型;
所述查询模块,用于接收待查询用户数据,根据所述图数据模型生成用户画像分析报告。
通过数据获取模块获取用户数据,通过数据处理模块首先识别用户数据得到维度信息,便于后续关联关系的分析和编制,便于构建出图数据模型;再通过数据处理模块对维度信息进行分析,便于获取关联关系,从而便于关联关系的编制,提高通过构建出的图数据模型进行查询待查询用户数据的精度和效率;按照图数据模型的方式建立关联关系,可依赖于图数据库的存储和计算能力,以网状图和文字的方式建立关联关系,直观清晰,并可进行关联关系的增加、删除和更新等交互操作,用户体验感强,有利于网状关联关系网络的扩大发展,交互简单,数据处理能力强,速度快,对待查询用户数据的关联关系的查询效率高,以及得到的用户画像分析报告的准确率高。
实施例三、基于实施例一和实施例二,本实施例还公开了一种基于图数据库的用户画像构建系统,包括处理器、存储器和存储在所述存储器中且可运行在所述处理器上的计算机程序,所述计算机程序运行时实现如图1所示的以下步骤:
S1:获取用户数据,并对所述用户数据进行识别,得到所述用户数据的多个维度信息;
S2:对多个所述维度信息进行分析,获取所述维度信息相互之间的关联关系,将所述维度信息和所述关联关系存储入图数据库中,并根据所述关联关系构建图数据模型;
S3:接收待查询用户数据,根据所述图数据模型生成用户画像分析报告。
通过存储在存储器上的计算机程序,并运行在处理器上,实现本发明的基于图数据库的用户画像构建系统,按照图数据模型的方式建立关联关系,可依赖于图数据库的存储和计算能力,以网状图和文字的方式建立关联关系,直观清晰,并可进行关联关系的增加、删除和更新等交互操作,用户体验感强,有利于网状关联关系网络的扩大发展,交互简单,数据处理能力强,速度快,对待查询用户数据的关联关系的查询效率高,以及得到的用户画像分析报告的准确率高。
本实施例还提供一种计算机存储介质,所述计算机存储介质上存储有至少一个指令,所述指令被执行时实现所述S1~S3的具体步骤。
通过执行包含至少一个指令的计算机存储介质,实现本发明的基于图数据库的用户画像构建方法,按照图数据模型的方式建立关联关系,可依赖于图数据库的存储和计算能力,以网状图和文字的方式建立关联关系,直观清晰,并可进行关联关系的增加、删除和更新等交互操作,用户体验感强,有利于网状关联关系网络的扩大发展,交互简单,数据处理能力强,速度快,对待查询用户数据的关联关系的查询效率高,以及得到的用户画像分析报告的准确率高。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。