CN109582808A - 一种用户信息查询方法、装置、终端设备和存储介质 - Google Patents

一种用户信息查询方法、装置、终端设备和存储介质 Download PDF

Info

Publication number
CN109582808A
CN109582808A CN201811398135.2A CN201811398135A CN109582808A CN 109582808 A CN109582808 A CN 109582808A CN 201811398135 A CN201811398135 A CN 201811398135A CN 109582808 A CN109582808 A CN 109582808A
Authority
CN
China
Prior art keywords
user
vertex
relationship
information
checked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811398135.2A
Other languages
English (en)
Inventor
张志远
程雨
石志中
张俊杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruian Technology Co Ltd
Original Assignee
Beijing Ruian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruian Technology Co Ltd filed Critical Beijing Ruian Technology Co Ltd
Priority to CN201811398135.2A priority Critical patent/CN109582808A/zh
Publication of CN109582808A publication Critical patent/CN109582808A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用户信息查询方法、装置、终端设备和存储介质。该方法包括:获取待查询用户的用户标识和查询条件;根据用户标识确定图数据库中的查询顶点和查询顶点与其他顶点之间的关系边,顶点之间的关系边为不同用户的相同活动属性信息;根据查询条件筛选所述查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为待查询用户的关联用户。本发明通过图数据库对具有相同活动属性信息的不同用户标识建立关系,提高了关联数据的查询效率。

Description

一种用户信息查询方法、装置、终端设备和存储介质
技术领域
本发明实施例涉及大数据技术,尤其涉及一种用户信息查询方法、装置、终端设备和存储介质。
背景技术
随着计算机和通信技术的不断发展,大数据计算的时代已经到来。在大数据领域中不仅仅限制于对独立数据进行存储并查询,也可以对关联数据进行存储并查询。
目前,对关联数据进行存储,最常见的实现方式是通过关系型数据库(比如,结构化查询语言(Structured Query Language,SQL)、MySQL等)和数据仓库技术对大量数据进行关联。但由于数据仓库是用来存储大量静态数据的,而关系型数据库的执行过程是每次对两个表进行关联,可称为关联表。若两个关联的实体之间拥有多种关系时,需在两个关联的实体之间创建多个关联表,但随着数据量的大幅度增长,在关系型数据库中存储的关联表也大幅度增长,若采用查询语句对关系型数据库中的数据进行关联查询,会大大降低关联数据的查询效率。
发明内容
有鉴于此,本发明提供一种用户信息查询方法、装置、终端设备和存储介质,以提高关联数据的查询效率。
第一方面,本发明实施例提供了一种用户信息查询方法,包括:
获取待查询用户的用户标识和查询条件;
根据所述用户标识确定图数据库中的查询顶点和所述查询顶点与其他顶点之间的关系边,顶点之间的关系边为不同用户的相同活动属性信息;
根据所述查询条件筛选所述查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为所述待查询用户的关联用户。
进一步的,在所述根据所述查询条件筛选所述查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为所述待查询用户的关联用户之后,还包括:
对所述待查询用户和关联用户之间的关系边条数进行统计排序;
将所述关系边条数最多的关联用户确定为待查询用户的目标关联用户。
进一步的,所述活动属性信息包括活动唯一标识、活动发生时间、活动初始位置和活动结束位置。
进一步的,在所述获取待查询用户的用户标识和查询条件之前,还包括:
获取不同用户的原始数据,所述原始数据包括用户标识和活动属性信息;
依据原始数据中的活动唯一标识和活动发生时间对原始数据进行分组,生成具有同一活动的第一活动列表;
对所述第一活动列表中的数据信息进行去重,得到具有相同活动属性的第二活动列表;
将所述第二活动列表中的数据信息输入至图数据库中,以更新不同用户标识之间的连接关系。
进一步的,所述对所述第一活动列表中的数据信息进行去重,得到具有相同活动属性的第二活动列表,包括:
依据活动唯一标识和活动发生时间对所述用户标识、活动初始位置和活动结束位置进行笛卡尔积运算,以得到运算结果;
依据预设去重规则对所述运算结果进行去重过滤,得到具有相同活动属性的第二活动列表。
进一步的,将所述第二活动列表中的数据信息输入至图数据库中,包括:
将所述第二活动列表中的不同用户标识输入至图数据库中,作为图数据库中的各个顶点;
将所述第二活动列表中的不同活动属性信息输入至图数据库中,作为图数据库中的关系边;
通过所述关系边连接具有相同属性信息的两个顶点。
第二方面,本发明实施例还提供了一种用户信息查询装置,包括:
第一获取模块,用于获取待查询用户的用户标识和查询条件;
第一确定模块,用于根据所述用户标识确定图数据库中的查询顶点和所述查询顶点与其他顶点之间的关系边,顶点之间的关系边为不同用户的相同活动属性信息;
筛选模块,用于根据所述查询条件筛选所述查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为所述待查询用户的关联用户。
进一步的,所述用户信息查询装置还包括:
统计排序模块,用于在根据所述查询条件筛选所述查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为所述待查询用户的关联用户之后,对所述待查询用户和关联用户之间的关系边条数进行统计排序;
第二确定模块,用于将所述关系边条数最多的关联用户确定为待查询用户的目标关联用户。
进一步的,所述活动属性信息包括活动唯一标识、活动发生时间、活动初始位置和活动结束位置。
进一步的,所述用户信息查询装置,还包括:
第二获取模块,用于在获取待查询用户的用户标识和查询条件之前,获取不同用户的原始数据,所述原始数据包括用户标识和活动属性信息;
分组模块,用于依据原始数据中的活动唯一标识和活动发生时间对原始数据进行分组,生成具有同一活动的第一活动列表;
去重模块,用于对所述第一活动列表中的数据信息进行去重,得到具有相同活动属性的第二活动列表;
输入模块,用于将所述第二活动列表中的数据信息输入至图数据库中,以更新不同用户标识之间的连接关系。
进一步的,所述去重模块,包括:
运算单元,用于依据活动唯一标识和活动发生时间对所述用户标识、活动初始位置和活动结束位置进行笛卡尔积运算,以得到运算结果;
去重过滤单元,用于依据预设去重规则对所述运算结果进行去重过滤,得到具有相同活动属性的第二活动列表。
进一步的,所述输入模块,包括:
第一输入单元,用于将所述第二活动列表中的不同用户标识输入至图数据库中,作为图数据库中的各个顶点;
第二输入单元,用于将所述第二活动列表中的不同活动属性信息输入至图数据库中,作为图数据库中的关系边;
连接单元,用于通过所述关系边连接具有相同属性信息的两个顶点。
第三方面,本发明实施例还提供了一种终端设备,包括:存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的用户信息查询方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的用户信息查询方法。
本发明通过获取待查询用户的用户标识和查询条件;根据用户标识确定图数据库中的查询顶点和所述查询顶点与其他顶点之间的关系边,顶点之间的关系边为不同用户的相同活动属性信息;根据查询条件筛选查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为待查询用户的关联用户的技术手段,提高了关联数据的查询效率。
附图说明
图1是本发明实施例一提供的用户信息查询方法的流程图;
图2是本发明实施例一提供的一种用户标识和查询条件的显示示意图;
图3是本发明实施例一提供的一种确定查询顶点和关系边的显示示意图;
图4是本发明实施例二提供的一种用户信息查询方法的流程图;
图5是本发明实施例二提供的一种图数据库中的关系子图示意图;
图6是本发明实施例三提供的一种用户信息查询装置的结构框图;
图7是本发明实施例四提供的一种终端设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在此需要说明的是,本方案的实现需要借助大数据并行计算技术和图数据库技术。其中,大数据并行计算技术是将计算引擎部署在多台服务器节点上分别进行并行计算,最后将计算结果加以汇总输出;图数据库是大数据时代的一种新型数据库,是基于数学中图论的算法而实现的高效处理复杂关系网络的新型数据库系统,同时,图数据库善于处理大量的、复杂的、互联的、多变的网状数据,其效率远远高于传统的关系型数据库的百倍、千倍甚至万倍。
实施例一
图1是本发明实施例一提供的用户信息查询方法的流程图,本实施例中提供的用户信息查询方法可以由终端设备执行,该终端设备可以通过软件和/或硬件的方式实现,该终端设备可以是两个或多个物理实体构成,也可以是一个物理实体构成。本实施例中终端设备为服务器。
参考图1,该用户信息查询方法具体包括如下步骤:
S110、获取待查询用户的用户标识和查询条件。
其中,用户标识是用来对用户身份信息进行标记的唯一标识,比如,用户标识可以为用户的身份标识号码。该身份标识号码是某个体系中相对唯一的编码,该身份标识号码一般是不改变的,比如,该身份标识号码可以为员工工号、身份证号码、计算机网址等。在实施例中,该身份标识号码为身份证号码。可以理解为,用户标识即为用户的身份证号码。查询条件可以理解为所要查询并得到的数据信息。在实施例中,用户可通过web前端,在其显示界面输入待查询用户的身份证号码和查询条件,然后点击提交,以将用户所输入的身份证号码和查询条件发送至对应的服务器中,以使服务器获取到待查询用户的用户标识和查询条件。
图2是本发明实施例一提供的一种用户标识和查询条件的显示示意图。示例性地,如图2的左侧图所示,假设用户启动XXX信息查询系统,则在web前端的显示画面出现该界面,在该显示界面上显示有用户标识和查询条件,其中,查询条件可以为查询日期、查询位置等,对此并不进行限定,可根据不同应用场景对该查询条件进行不同的限定。用户可通过图2中左侧图的下拉菜单对查询条件进行选择,假设用户选择查询日期为查询条件,就会出现如图2中右侧图所示的显示界面,在该显示界面中,用户可将待查询用户的身份证号码输入用户标识所对应的显示框中,同时输入所要查询的日期区间,比如,日期区间可以为2018年2月1日-2018年11月1日,然后可点击右下角的“提交”按钮,以将待查询用户的用户标识和查询条件发送至服务器,以使服务器根据该用户标识和查询条件进行信息查询。当然,若用户选择查询位置为查询条件时,在图2中右侧图所示的就为位置区间,比如,位置区间可以为天津-北京。当然,用户也可同时将查询日期和查询位置作为查询条件,对此并不进行限定。
S120、根据用户标识确定图数据库中的查询顶点和查询顶点与其他顶点之间的关系边。
其中,顶点之间的关系边为不同用户的相同活动属性信息。在此需要说明的是,图数据库是一种非关系型数据库,其应用图形理论存储实体之间的关系信息。在一个图数据库中,是由顶点和连接顶点的边组成的。其中,图形中的顶点表示的是实体,并且实体可以为人、物、客观存在的物体等,而关系边表示的是各个实体之间的关系。同时,图形中的顶点都具有顶点属性,比如,顶点属性表示的是实体的属性,比如,顶点属性可以为人的年龄、姓名等;同样地,连接顶点的边也具有边属性,比如,边属性表示的是两个实体之间关系的属性,其中,边属性可根据不同应用场景,以及在不同实体之间的活动而定义。在实施例中,可以理解为,顶点为用户的身份证号码,但没有顶点属性;而关系边为不同用户标识之间的关系。关系边的边属性为活动属性信息。其中,活动属性信息包括活动唯一标识、活动发生时间、活动初始位置和活动结束位置。在实施例中,活动唯一标识用来对活动进行标记的唯一标识,比如,活动唯一标识可以为车次、航班等;活动发生时间可以理解为活动的发生日期;活动初始位置可以理解为活动的起始位置;活动结束位置可以理解为活动的终结位置。示例性地,假设活动唯一标识为T134的火车车次,活动发生时间为2018年10月23日;活动初始位置为大连,活动结束位置为上海。
在实施例中,在服务器接收到用户输入的待查询用户的用户标识和查询条件之后,根据该用户标识查询图数据库中所有的顶点,以查找到该用户标识在图数据库中对应的顶点,记为查询顶点,并根据该查询顶点的顶点属性调取该查询顶点与其它顶点之间的关系边,也可以理解为与查询顶点所对应的用户具有相同的活动属性信息的其它用户。图3是本发明实施例一提供的一种确定查询顶点和关系边的显示示意图。如图3所示,假设待查询用户为用户A,其对应的用户标识为用户标识A,根据该用户标识A查询图数据库,以确定用户标识A所在的查询顶点,然后从图数据库中查询到查询顶点与其他顶点之间的关系边,其中,如图3所示,用户标识A和用户标识B之间有四条关系边,分别为关系边11、关系边12、关系边13和关系边14,用户标识A和用户标识C之间有两条关系边,分别为关系边21和关系边22,用户标识A和用户标识D之间有三条关系边,分别为关系边31、关系边32和关系边33。在此需要说明的是,图3中所示的关系边(包括关系边11、关系边12、关系边13和关系边14、关系边21和关系边22、关系边31、关系边32和关系边33)均为对应的活动属性信息,在图3中只是以关系边进行示出而已。其中,表1为用户标识A和用户标识B之间的相同活动属性信息表;表2是用户标识A和用户标识C之间的相同活动属性信息表;表3是用户标识A和用户标识D之间的相同活动属性信息表。
表1用户标识A和用户标识B之间的相同活动属性信息表
标识A/B 活动唯一标识 活动发生时间 活动初始位置 活动结束位置
关系边11 车次T60 2018年7月6日 天津 北京
关系边12 车次T20 2018年9月6日 天津 杭州
关系边13 车次T30 2018年9月23日 北京 石家庄
关系边14 车次T10 2018年10月8日 北京 天津
表2用户标识A和用户标识C之间的相同活动属性信息表
标识A/C 活动唯一标识 活动发生时间 活动初始位置 活动结束位置
关系边21 车次T40 2018年9月10日 北京 合肥
关系边22 车次T50 2018年9月16日 天津 北京
表3用户标识A和用户标识D之间的相同活动属性信息表
标识A/D 活动唯一标识 活动发生时间 活动初始位置 活动结束位置
关系边31 车次T360 2018年7月10日 深圳 北京
关系边32 车次T220 2018年7月7日 广州 杭州
关系边33 车次T430 2018年5月23日 天津 石家庄
在此需要说明的是,本方案中涉及的所有车次,以及每个车次中对应的车站只是为了对本方案的用户信息查询方法进行说明,并不表示在实际应用中有对应的车次,以及车次中有对应的车站。
当然,本实施例中只是以火车车次为活动唯一标识为例,对用户信息查询方法进行说明。也可应用到其它场景中,比如,对汽车车次、航班的查询等,对此并不进行限定。
S130、根据查询条件筛选查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为待查询用户的关联用户。
其中,查询条件可为查询日期、查询位置等。在此需要说明的是,为了能够获取到与待查询用户有关系的其它用户,在实施例中,根据查询条件对查询顶点与其他顶点之间的关系边进行筛选之后,只要与该查询顶点有一条关系边的其他顶点,就认为是待查询用户的关联用户。在实施例中,以查询日期为例对该步骤进行说明。假设查询日期的区间为2018年9月1日-2018年10月31日,服务器在获取到该查询条件之后,对用户标识A所关联的所有关系边进行筛选,以得到符合查询条件的关系边。在对用户标识A的关系边进行筛选之后,用户标识A和用户标识B之间的关系边变为关系边12、关系边13和关系边14;而用户标识A和用户标识C之间的关系边变为关系边21和关系边22;而用户标识A和用户标识D之间没有符合查询条件的关系边,由于用户标识B和用户标识A之间有三条关系边,而用户标识C和用户标识A之间有两条关系边,可确定用户标识A的关联用户为用户标识B和用户标识C所对应的用户。
当然,在得到与用户标识A对应的关联用户之后,将结果输出至web前端的显示画面中,以使得用户进行查看。表4是用户标识A对应关联用户的相同属性信息表。
表4用户标识A对应关联用户的相同属性信息表
如表4所示,在得到与用户标识A对应的关联用户后,将用户标识A和其它关联用户之间的关系边对应的活动属性信息以表4所示的表格显示在web前端的显示画面中,以便于用户查看。
本实施例的技术方案,通过获取待查询用户的用户标识和查询条件;根据用户标识确定图数据库中的查询顶点和所述查询顶点与其他顶点之间的关系边,顶点之间的关系边为不同用户的相同活动属性信息;根据查询条件筛选查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为待查询用户的关联用户的技术手段,提高了关联数据的查询效率。
在上述实施例的基础上,为了能够获取到与待查询用户关系最密切的关联用户,即目标关联用户,在步骤S130之后,还包括步骤S140-S150:
S140、对待查询用户和关联用户之间的关系边条数进行统计排序。
在此需要说明的是,待查询用户所对应的关联用户的数量并不仅仅限定一个,为了能够统计出所有关联用户中与待查询用户之间关系最密切的关联用户,需对每个关联用户与待查询用户之间的关系边条数进行统计,并按照从大到小的顺序依次排序。示例性地,用户标识A和用户标识B之间的关系边条数为三条;用户标识A和用户标识C之间的关系边条数为两条,按照从大到小的顺序对关系边条数进行排序后,得到用户标识B、用户标识C。
S150、将关系边条数最多的关联用户确定为待查询用户的目标关联用户。
其中,目标关联用户指的是在所有关联用户中与待查询用户之间的关系边条数最多的关联用户。当然,目标关联用户的数量可以为一个,也可以为多个。在实施例中,对关联用户与待查询用户之间的关系条数进行排序之后,将关系边条数最多的关联用户作为待查询用户最密切的关联用户。示例性地,在对用户标识A中所有关联用户的关系边条数进行统计排序之后,得到用户标识B和用户标识A之间的关系边条数为三条,用户标识C和用户标识A之间的关系边条数为两条,可确定与用户标识A之间关系边条数最多的是用户标识B对应的用户,则将用户标识B对应的用户确定为用户A的目标关联用户。当然,若两个或两个以上的用户标识对应的关系边条数是相同的,并且是所有关联用户中最多的,则将这两个或两个以上的用户标识对应的用户都作为待查询用户的目标关联用户。
实施例二
图4是本发明实施例二提供的一种用户信息查询方法的流程图。本实施例是在上述实施例的基础上,对用户信息查询方法作进一步的具体化。本实施例是应用在对包含有用户信息的图数据库进行建立的场景下,参照图4,该用户信息查询方法具体包括如下步骤:
S210、获取不同用户的原始数据。
其中,原始数据包括用户标识和活动属性信息。原始数据可以理解为未输入至图数据库的数据信息。其中,可采用大数据计算引擎Spark读取原始数据,并对读取的原始数据进行非空和合法性校验,以过滤不合法的数据信息。其中,原始数据包括用户标识、活动唯一标识、活动发生时间、活动初始位置和活动结束位置,每个用户标识,和其对应的活动唯一标识、活动发生时间、活动初始位置和活动结束位置构成一个记录。也可理解为,每个记录的用户标识都是不同的。为了便于后续对原始数据的处理,在读取到原始数据之后,需对原始数据进行非空和合法性校验。其中,非空指的是每个记录中的各个字段是有数据信息的,合法性校验指的是每个字段中的数据信息都是符合字符或字符串标准的。在实施例中,用户标识、活动唯一标识、活动发生时间、活动初始位置和活动结束位置均可称为一个字段,即每个记录中包含有五个字段。
S220、依据原始数据中的活动唯一标识和活动发生时间对原始数据进行分组,生成具有同一活动的第一活动列表。
其中,第一活动列表指的是活动唯一标识和活动发生时间是相同的,但活动初始位置和活动结束位置不一定是相同的列表。在实施例中,在读取到原始数据之后,提取原始数据中的活动唯一标识和活动发生时间,并根据活动唯一标识和活动发生时间对原始数据进行分组,使得每组中每个记录中的活动唯一标识和活动发生时间是相同的。其中,在对原始数据进行分组后,原始数据的数据结构变为{活动唯一标识,活动发生时间,[{用户标识1,活动初始位置1,活动结束位置1},{用户标识2,活动初始位置2,活动结束位置2}……{用户标识n,活动初始位置n,活动结束位置n}]},其中,中括号里面的数据信息表示的为分组后原始数据的数组,分别为数组1、数组2……数组n。用户标识、活动初始位置和活动结束位置后面的1、2……n表示的是用户的序号,也可理解为用户的总数量。
S230、对第一活动列表中的数据信息进行去重,得到具有相同活动属性的第二活动列表。
在此需要说明的是,为了在两个不同用户标识之间建立关系,在对第一活动列表中的数据信息进行去重过滤之前,需采用整合规则对第一活动列表中的数据信息进行整合,然后再对整合之后的数据信息进行去重过滤,以得到具有相同活动属性的第二活动列表,该步骤可包括步骤S2301-S2302,具体如下:
S2301、依据活动唯一标识和活动发生时间对用户标识、活动初始位置和活动结束位置进行笛卡尔积运算,以得到运算结果。
在此需要说明的是,在进行笛卡尔积运算时,并非在每个记录中的每个字段之间进行笛卡尔积运算,而是在两个记录之间进行笛卡尔积运算,并且,需在活动唯一标识和活动发生时间相同的两个记录之间进行笛卡尔积运算。示例性地,假设用户1和用户2所对应的活动唯一标识和活动发生时间是相同的,则对用户1对应的数组1(包括用户标识1、活动初始位置1、活动结束位置1),以及用户2对应的数组2(包括用户标识2、活动初始位置2、活动结束位置2)进行笛卡尔积运算时,直接对用户1和用户2所对应的记录进行笛卡尔积运算,可得到运算结果为(用户1,用户2),(用户2,用户1)。
S2302、依据预设去重规则对运算结果进行去重过滤,得到具有相同活动属性的第二活动列表。
其中,预设去重规则可以理解为两个不同的用户标识只能存在于一个组合中,示例性地,若运算结果为(用户1,用户2),(用户2,用户1),由于用户1和用户2分别对应的用户标识1和用户标识2存在于两个集合中,为了减少服务器的占用内存,以及加快数据查询效率,需对这两个集合进行去重,即只保留其中一个集合。当然,若去重之后的运算结果中活动初始位置和活动结束位置只对应一个用户标识,表明在该活动唯一标识和活动发生时间内,不存在该用户标识所关联的其他用户标识,则将该用户标识对应的记录删除,在经过去重过滤之后,得到具有相同活动属性的第二活动列表。可以理解为,在该第二活动列表中,至少两个不同用户标识对应的活动唯一标识、活动发生时间、活动初始位置和活动结束位置是相同的。示例性地,第二活动列表的输出结果可以为{活动唯一标识,活动发生时间,[{用户标识1,活动初始位置1,活动结束位置1},{用户标识2,活动初始位置2,活动结束位置2}]}。其中,活动初始位置1和活动初始位置2是相同的,活动结束位置1和活动结束位置2是相同的。
S240、将第二活动列表中的数据信息输入至图数据库中,以更新不同用户标识之间的连接关系。
在此需要说明的是,在将第二活动列表中的数据信息输入至图数据库之前,需根据业务需求构成Schema表结构,以根据预先设置的Schema表结构的类型和名称对应表将第二活动列表中的数据信息输入至图数据库中。表5是一种图数据库Schema表结构的类型和名称对应表。其中,Schema表结构可以认为是一种表的设计模式。
表5一种图数据库Schema表结构的类型和名称对应表
从表5中可以看出,一个记录中所包含的活动属性信息和用户标识,当然,也可在表5中设置有备注一栏,以可将一些额外附加信息添加至对应的一栏中。
在该步骤中,将第二活动列表中的数据信息输入至图数据库中,具体包括步骤S2401-S2403:
S2401、将第二活动列表中的不同用户标识输入至图数据库中,作为图数据库中的各个顶点。
在实施例中,将第二活动列表中的各个用户标识输入至图数据库中,根据预先设置的图数据库Schema表结构,将用户标识作为图数据库中的各个顶点。
S2402、将第二活动列表中的不同活动属性信息输入至图数据库中,作为图数据库中的关系边。
在实施例中,将第二活动列表中的各个活动唯一标识、活动发生时间、活动初始位置和活动结束位置输入至图数据库中,并根据预先设置的图数据库Schema表结构,将活动唯一标识、活动发生时间、活动初始位置和活动结束位置作为图数据库中的关系边。
S2403、通过关系边连接具有相同属性信息的两个顶点。
在实施例中,在图数据库中确定顶点和关系边之后,通过关系边连接活动唯一标识、活动发生时间、活动初始位置和活动结束位置均相同的两个顶点。
示例性地,图5是本发明实施例二提供的一种图数据库中的关系子图示意图。如图5所示,假设从获取的原始数据分别为用户标识A、用户标识B和用户标识C,以及对应的活动属性信息,在经过分组、整合、去重过滤之后,得到了用户标识A和用户标识B,以及用户标识A和用户标识C之间的关系,如图5所示,将用户标识A、用户标识B和用户标识C分别写入该关系子图中的顶点,并将关系边对应的边属性写入该关系子图中的两个用户标识之间,同时用关系边连接两个具有相同活动属性信息的顶点。当然,本实施例只是示例性地对图数据库中的关系子图进行说明,其可根据业务需求进行相应的调整。
S250、获取待查询用户的用户标识和查询条件。
S260、根据用户标识确定图数据库中的查询顶点和查询顶点与其他顶点之间的关系边。
其中,顶点之间的关系边为不同用户的相同活动属性信息。
S270、根据查询条件筛选查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为待查询用户的关联用户。
本实施例的技术方案,在上述方案的基础上,通过获取不同用户的用户标识和活动属性信息;依据原始数据中的活动唯一标识和活动发生时间对原始数据进行分组,生成具有同一活动的第一活动列表;对第一活动列表中的数据信息进行去重,得到具有相同活动属性的第二活动列表;将第二活动列表中的数据信息输入至图数据库中,以更新不同用户标识之间的连接关系,从而实现了对图数据库中不同用户标识之间的连接关系的实时更新。
实施例三
图6是本发明实施例三提供的一种用户信息查询装置的结构框图。本实施例的用户信息查询装置可配置于服务器中,参考图6,该用户信息查询装置包括:获取模块310、第一确定模块320和筛选模块330。
其中,获取模块310,用于获取待查询用户的用户标识和查询条件;
第一确定模块320,用于根据用户标识确定图数据库中的查询顶点和查询顶点与其他顶点之间的关系边,顶点之间的关系边为不同用户的相同活动属性信息;
筛选模块330,用于根据查询条件筛选查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为待查询用户的关联用户。
本实施例提供的技术方案,通过获取待查询用户的用户标识和查询条件;根据用户标识确定图数据库中的查询顶点和所述查询顶点与其他顶点之间的关系边,顶点之间的关系边为不同用户的相同活动属性信息;根据查询条件筛选查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为待查询用户的关联用户的技术手段,提高了关联数据的查询效率。
在上述实施例的基础上,该用户信息查询装置还包括:
统计排序模块,用于在根据查询条件筛选查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为待查询用户的关联用户之后,对待查询用户和关联用户之间的关系边条数进行统计排序;
第二确定模块,用于将关系边条数最多的关联用户确定为待查询用户的目标关联用户。
进一步的,活动属性信息包括活动唯一标识、活动发生时间、活动初始位置和活动结束位置。
进一步的,该用户信息查询装置,还包括:
第二获取模块,用于在获取待查询用户的用户标识和查询条件之前,获取不同用户的原始数据,该原始数据包括用户标识和活动属性信息;
分组模块,用于依据原始数据中的活动唯一标识和活动发生时间对原始数据进行分组,生成具有同一活动的第一活动列表;
去重模块,用于对第一活动列表中的数据信息进行去重,得到具有相同活动属性的第二活动列表;
输入模块,用于将第二活动列表中的数据信息输入至图数据库中,以更新不同用户标识之间的连接关系。
进一步的,该去重模块,包括:
运算单元,用于依据活动唯一标识和活动发生时间对用户标识、活动初始位置和活动结束位置进行笛卡尔积运算,以得到运算结果;
去重过滤单元,用于依据预设去重规则对运算结果进行去重过滤,得到具有相同活动属性的第二活动列表。
进一步的,该输入模块,包括:
第一输入单元,用于将第二活动列表中的不同用户标识输入至图数据库中,作为图数据库中的各个顶点;
第二输入单元,用于将第二活动列表中的不同活动属性信息输入至图数据库中,作为图数据库中的关系边;
连接单元,用于通过关系边连接具有相同属性信息的两个顶点。
上述用户信息查询装置可执行本发明任意实施例所提供的用户信息查询方法,具备执行方法相应的功能模块和有益效果。
实施例四
图7是本发明实施例四提供的一种终端设备的结构示意图。参考图7,该终端设备包括:处理器410、存储器420、输入装置430以及输出装置440。该终端设备中处理器410的数量可以是一个或者多个,图7中以一个处理器410为例。该终端设备中存储器420的数量可以是一个或者多个,图7中以一个存储器420为例。该终端设备的处理器410、存储器420、输入装置430以及输出装置440可以通过总线或者其他方式连接,图7中以通过总线连接为例。实施例中,该终端设备为服务器。
存储器420作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明任意实施例所述的终端设备对应的程序指令/模块(例如,用户信息查询装置中的获取模块310、第一确定模块320和筛选模块330)。存储器420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器420可进一步包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可用于接收输入的数字或者字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入,还可以是用于获取图像的摄像头以及获取音频数据的拾音设备。输出装置440可以包括扬声器等音频设备。需要说明的是,输入装置430和输出装置440的具体组成可以根据实际情况设定。
处理器410通过运行存储在存储器420中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的用户信息查询方法。
上述提供的终端设备可用于执行上述任意实施例提供的用户信息查询方法,具备相应的功能和有益效果。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种用户信息查询方法,包括:
获取待查询用户的用户标识和查询条件;
根据用户标识确定图数据库中的查询顶点和查询顶点与其他顶点之间的关系边,顶点之间的关系边为不同用户的相同活动属性信息;
根据查询条件筛选查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为待查询用户的关联用户。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的用户信息查询方法操作,还可以执行本发明任意实施例所提供的用户信息查询方法中的相关操作,且具备相应的功能和有益效果。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是机器人,个人计算机,服务器,或者网络设备等)执行本发明任意实施例所述的用户信息查询方法。
值得注意的是,上述用户信息查询装置中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种用户信息查询方法,其特征在于,包括:
获取待查询用户的用户标识和查询条件;
根据所述用户标识确定图数据库中的查询顶点和所述查询顶点与其他顶点之间的关系边,顶点之间的关系边为不同用户的相同活动属性信息;
根据所述查询条件筛选所述查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为所述待查询用户的关联用户。
2.根据权利要求1所述的用户信息查询方法,其特征在于,在所述根据所述查询条件筛选所述查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为所述待查询用户的关联用户之后,还包括:
对所述待查询用户和关联用户之间的关系边条数进行统计排序;
将所述关系边条数最多的关联用户确定为待查询用户的目标关联用户。
3.根据权利要求1所述的用户信息查询方法,其特征在于,所述活动属性信息包括活动唯一标识、活动发生时间、活动初始位置和活动结束位置。
4.根据权利要求3所述的用户信息查询方法,其特征在于,在所述获取待查询用户的用户标识和查询条件之前,还包括:
获取不同用户的原始数据,所述原始数据包括用户标识和活动属性信息;
依据原始数据中的活动唯一标识和活动发生时间对原始数据进行分组,生成具有同一活动的第一活动列表;
对所述第一活动列表中的数据信息进行去重,得到具有相同活动属性的第二活动列表;
将所述第二活动列表中的数据信息输入至图数据库中,以更新不同用户标识之间的连接关系。
5.根据权利要求4所述的用户信息查询方法,其特征在于,所述对所述第一活动列表中的数据信息进行去重,得到具有相同活动属性的第二活动列表,包括:
依据活动唯一标识和活动发生时间对所述用户标识、活动初始位置和活动结束位置进行笛卡尔积运算,以得到运算结果;
依据预设去重规则对所述运算结果进行去重过滤,得到具有相同活动属性的第二活动列表。
6.根据权利要求4所述的用户信息查询方法,其特征在于,包括:将所述第二活动列表中的数据信息输入至图数据库中,包括:
将所述第二活动列表中的不同用户标识输入至图数据库中,作为图数据库中的各个顶点;
将所述第二活动列表中的不同活动属性信息输入至图数据库中,作为图数据库中的关系边;
通过所述关系边连接具有相同属性信息的两个顶点。
7.一种用户信息查询装置,其特征在于,包括:
获取模块,用于获取待查询用户的用户标识和查询条件;
第一确定模块,用于根据所述用户标识确定图数据库中的查询顶点和所述查询顶点与其他顶点之间的关系边,顶点之间的关系边为不同用户的相同活动属性信息;
筛选模块,用于根据所述查询条件筛选所述查询顶点与其他顶点之间的关系边,筛选得到包含有至少一条关系边的其他顶点对应的用户为所述待查询用户的关联用户。
8.根据权利要求1所述的用户信息查询方法,其特征在于,所述装置还包括:
统计排序模块,用于对所述待查询用户和关联用户之间的关系边条数进行统计排序;
第二确定模块,用于将所述关系边条数最多的关联用户确定为待查询用户的目标关联用户。
9.一种终端设备,其特征在于,包括:存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的用户信息查询方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-6中任一所述的用户信息查询方法。
CN201811398135.2A 2018-11-22 2018-11-22 一种用户信息查询方法、装置、终端设备和存储介质 Pending CN109582808A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811398135.2A CN109582808A (zh) 2018-11-22 2018-11-22 一种用户信息查询方法、装置、终端设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811398135.2A CN109582808A (zh) 2018-11-22 2018-11-22 一种用户信息查询方法、装置、终端设备和存储介质

Publications (1)

Publication Number Publication Date
CN109582808A true CN109582808A (zh) 2019-04-05

Family

ID=65923404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811398135.2A Pending CN109582808A (zh) 2018-11-22 2018-11-22 一种用户信息查询方法、装置、终端设备和存储介质

Country Status (1)

Country Link
CN (1) CN109582808A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110413665A (zh) * 2019-07-01 2019-11-05 北京邮电大学 一种数据查询方法及装置
CN110781370A (zh) * 2019-10-16 2020-02-11 杭州云深科技有限公司 一种移动终端信息查询方法和计算机设备
CN111428045A (zh) * 2020-03-06 2020-07-17 北京明略软件系统有限公司 一种构建知识图谱的方法、装置、计算机存储介质及终端
CN111506737A (zh) * 2020-04-08 2020-08-07 北京百度网讯科技有限公司 图数据处理方法、检索方法、装置及电子设备
CN111782966A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 用户分群方法、装置、计算机设备和介质
CN112328658A (zh) * 2020-11-03 2021-02-05 北京百度网讯科技有限公司 用户档案数据处理方法、装置、设备及存储介质
CN112925954A (zh) * 2021-03-05 2021-06-08 北京中经惠众科技有限公司 用于在图数据库中查询数据的方法和装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593433A (zh) * 2013-11-12 2014-02-19 中国科学院信息工程研究所 一种面向海量时序数据的图数据处理方法及系统
CN104899156A (zh) * 2015-05-07 2015-09-09 中国科学院信息工程研究所 一种面向大规模社交网络的图数据存储及查询方法
CN106021377A (zh) * 2016-05-11 2016-10-12 上海点荣金融信息服务有限责任公司 计算机实现的信息处理方法及装置
CN106844407A (zh) * 2015-12-07 2017-06-13 华为技术有限公司 基于数据集相关性的标签网络产生方法和系统
US20170236077A1 (en) * 2016-02-16 2017-08-17 BitSight Technologies, Inc. Relationships among technology assets and services and the entities responsible for them
CN107368605A (zh) * 2017-07-31 2017-11-21 成都四方伟业软件股份有限公司 一种基于图数据库的动态建模方法
CN107657043A (zh) * 2017-09-30 2018-02-02 北京工业大学 一种基于内容的混合图模型图像推荐方法
CN107679160A (zh) * 2017-09-28 2018-02-09 深圳市华傲数据技术有限公司 基于图数据库的数据处理方法及装置
CN108446988A (zh) * 2017-08-21 2018-08-24 深圳萨摩耶互联网金融服务有限公司 基于关系网络的用户识别方法和系统
CN108509610A (zh) * 2018-03-30 2018-09-07 深圳大学 一种活动与同伴的检索方法及系统
CN108509614A (zh) * 2018-04-03 2018-09-07 中山大学 一种基于图数据库的任务履历管理及分析方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593433A (zh) * 2013-11-12 2014-02-19 中国科学院信息工程研究所 一种面向海量时序数据的图数据处理方法及系统
CN104899156A (zh) * 2015-05-07 2015-09-09 中国科学院信息工程研究所 一种面向大规模社交网络的图数据存储及查询方法
CN106844407A (zh) * 2015-12-07 2017-06-13 华为技术有限公司 基于数据集相关性的标签网络产生方法和系统
US20170236077A1 (en) * 2016-02-16 2017-08-17 BitSight Technologies, Inc. Relationships among technology assets and services and the entities responsible for them
CN106021377A (zh) * 2016-05-11 2016-10-12 上海点荣金融信息服务有限责任公司 计算机实现的信息处理方法及装置
CN107368605A (zh) * 2017-07-31 2017-11-21 成都四方伟业软件股份有限公司 一种基于图数据库的动态建模方法
CN108446988A (zh) * 2017-08-21 2018-08-24 深圳萨摩耶互联网金融服务有限公司 基于关系网络的用户识别方法和系统
CN107679160A (zh) * 2017-09-28 2018-02-09 深圳市华傲数据技术有限公司 基于图数据库的数据处理方法及装置
CN107657043A (zh) * 2017-09-30 2018-02-02 北京工业大学 一种基于内容的混合图模型图像推荐方法
CN108509610A (zh) * 2018-03-30 2018-09-07 深圳大学 一种活动与同伴的检索方法及系统
CN108509614A (zh) * 2018-04-03 2018-09-07 中山大学 一种基于图数据库的任务履历管理及分析方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110413665A (zh) * 2019-07-01 2019-11-05 北京邮电大学 一种数据查询方法及装置
CN110781370A (zh) * 2019-10-16 2020-02-11 杭州云深科技有限公司 一种移动终端信息查询方法和计算机设备
CN111428045A (zh) * 2020-03-06 2020-07-17 北京明略软件系统有限公司 一种构建知识图谱的方法、装置、计算机存储介质及终端
CN111506737A (zh) * 2020-04-08 2020-08-07 北京百度网讯科技有限公司 图数据处理方法、检索方法、装置及电子设备
CN111506737B (zh) * 2020-04-08 2023-12-19 北京百度网讯科技有限公司 图数据处理方法、检索方法、装置及电子设备
CN111782966A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 用户分群方法、装置、计算机设备和介质
CN111782966B (zh) * 2020-06-30 2023-07-28 北京百度网讯科技有限公司 用户分群方法、装置、计算机设备和介质
CN112328658A (zh) * 2020-11-03 2021-02-05 北京百度网讯科技有限公司 用户档案数据处理方法、装置、设备及存储介质
CN112328658B (zh) * 2020-11-03 2023-08-08 北京百度网讯科技有限公司 用户档案数据处理方法、装置、设备及存储介质
CN112925954A (zh) * 2021-03-05 2021-06-08 北京中经惠众科技有限公司 用于在图数据库中查询数据的方法和装置
CN112925954B (zh) * 2021-03-05 2024-05-24 北京中经惠众科技有限公司 用于在图数据库中查询数据的方法和装置

Similar Documents

Publication Publication Date Title
CN109582808A (zh) 一种用户信息查询方法、装置、终端设备和存储介质
CN110705683B (zh) 随机森林模型的构造方法、装置、电子设备及存储介质
WO2016101628A1 (zh) 一种数据建模中的数据处理方法及装置
CN107784598A (zh) 一种网络社区发现方法
US20150100596A1 (en) System and method for performing set operations with defined sketch accuracy distribution
CN107180093A (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
CN106326391A (zh) 多媒体资源推荐方法及装置
CN105630972A (zh) 数据处理方法及装置
CN111061758B (zh) 数据存储方法、装置及存储介质
CN110727663A (zh) 数据清洗方法、装置、设备及介质
CN109145003B (zh) 一种构建知识图谱的方法及装置
CN104778237A (zh) 一种基于关键用户的个性化推荐方法和系统
WO2020258772A1 (zh) 样本聚类方法、装置、设备及存储介质
CN110928984A (zh) 一种知识图谱的构建方法、装置、终端及存储介质
CN110727857A (zh) 针对业务对象识别潜在用户的关键特征的方法及装置
CN106874322A (zh) 一种数据表关联方法和装置
CN106991090A (zh) 舆情事件实体的分析方法及装置
CN108829804A (zh) 基于距离划分树的高维数据相似性连接查询方法及装置
CN103186560A (zh) 一种数据排序方法以及相关装置
CN106202126A (zh) 一种用于物流监控的数据分析方法和装置
CN104462347B (zh) 关键词的分类方法及装置
CN106919703A (zh) 电影信息搜索方法及装置
CN108427736A (zh) 一种用于查询数据的方法
CN109684588B (zh) 一种资产管理系统及方法
CN110399746B (zh) 一种基于敏感度分级的匿名数据发布方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190405

RJ01 Rejection of invention patent application after publication