CN105159926A - 建立用户的用户信息关联的方法和装置 - Google Patents

建立用户的用户信息关联的方法和装置 Download PDF

Info

Publication number
CN105159926A
CN105159926A CN201510472717.0A CN201510472717A CN105159926A CN 105159926 A CN105159926 A CN 105159926A CN 201510472717 A CN201510472717 A CN 201510472717A CN 105159926 A CN105159926 A CN 105159926A
Authority
CN
China
Prior art keywords
user
time
locating information
incidence relation
positioning time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510472717.0A
Other languages
English (en)
Other versions
CN105159926B (zh
Inventor
赵继承
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510472717.0A priority Critical patent/CN105159926B/zh
Publication of CN105159926A publication Critical patent/CN105159926A/zh
Application granted granted Critical
Publication of CN105159926B publication Critical patent/CN105159926B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Navigation (AREA)

Abstract

本申请公开了建立用户的用户信息关联的方法和装置。该建立用户的用户信息关联的方法的一具体实施方式包括:通过获取多个用户的定位信息;基于定位信息,查找出具有关联关系的用户的用户信息,关联关系为用户之间相匹配的定位信息的数量大于数量阈值,相匹配的定位信息满足以下匹配条件:定位位置的差值小于距离阈值且定位时间之间的差值小于时间阈值;基于相匹配的定位信息,计算具有关联关系的用户的用户信息之间的关联度参数;基于关联度参数,建立具有关联关系的用户的用户信息之间的关联。实现了充分利用网络资源建立用户的用户信息之间的关联,同时,拓宽了建立用户的用户信息之间关联的方式。

Description

建立用户的用户信息关联的方法和装置
技术领域
本申请涉及计算机领域,具体涉及互联网领域,尤其涉及建立用户的用户信息关联的方法和装置。
背景技术
随着互联网的快速发展,网络社交已经成为用户的主要社交方式之一。在已知的技术中,网络社交主要通过采用以下方式建立用户的用户信息之间的关联:由用户人工添加对方用户的账号,以及将对方用户的相关属性信息输入到备注信息中。然而,当采用上述方式建立用户的用户信息之间的关联时,仅通过用户在线上以人工添加的方式建立用户的用户信息之间的关联,而没有利用与用户的网络行为相关联的数据,导致在建立用户的用户信息之间的关联时,对网络资源的利用率较低,同时无法反映用户之间真实的关联关系。
发明内容
本申请提供了建立用户的用户信息关联的方法和装置,用于解决上述背景技术部分存在的技术问题。
第一方面,本申请提供了建立用户的用户信息关联的方法,该方法包括:获取用户的定位信息,定位信息包括定位位置、定位时间;基于定位信息,查找出具有关联关系的用户的用户信息,关联关系为用户之间相匹配的定位信息的数量大于数量阈值,相匹配的定位信息满足以下匹配条件:定位位置的差值小于距离阈值且定位时间之间的差值小于时间阈值;基于相匹配的定位信息,计算具有关联关系的用户的用户信息之间的关联度参数;基于关联度参数,建立具有关联关系的用户的用户信息之间的关联。
第二方面,本申请提供了建立用户的用户信息关联的装置,该装置包括:获取单元,配置用于获取用户的定位信息,定位信息包括定位位置、定位时间;查找单元,配置用于基于定位信息,查找出具有关联关系的用户的用户信息,关联关系为用户之间相匹配的定位信息的数量大于数量阈值,相匹配的定位信息满足以下匹配条件:定位位置的差值小于距离阈值且定位时间之间的差值小于时间阈值;计算单元,配置用于基于相匹配的定位信息,计算具有关联关系的用户的用户信息之间的关联度参数;关联单元,配置用于基于关联度参数,建立具有关联关系的用户的用户信息之间的关联。
本申请提供的建立用户的用户信息关联的方法和装置,通过获取用户的定位信息;基于定位信息,查找出具有关联关系的用户的用户信息,关联关系为用户之间相匹配的定位信息的数量大于数量阈值,相匹配的定位信息满足以下匹配条件:定位位置之间的差值小于距离阈值且定位时间之间的差值小于时间阈值;基于相匹配的定位信息,计算具有关联关系的用户的用户信息之间的关联度参数;基于关联度参数,建立具有关联关系的用户的用户信息之间的关联。实现了充分利用网络资源建立用户的用户信息之间的关联,同时,拓宽了建立用户的用户信息之间关联的方式。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了根据本申请的建立用户的用户信息关联的方法的一个实施例的流程图;
图2示出了建立具有关联关系的用户的用户信息之间的关联的效果图。
图3示出了根据本申请的建立用户的用户信息关联的方法的另一个实施例的流程图;
图4示出了其示出了用户之间的关联关系的效果图;
图5示出了根据本申请的建立用户的用户信息关联的装置的一个实施例的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参考图1,其示出了根据本申请的建立用户的用户信息关联的方法的一个实施例的流程100。该方法包括以下步骤:
步骤101,获取用户的定位信息,定位信息包括定位位置和定位时间。
在本实施例中,定位位置可以用于表征用户出现过的位置,定位时间可以用于表征用户曾经出现在定位位置时的时间。
在本实施例的一些可选地实现方式中,获取用户的定位信息包括:获取用户的全球定位系统GPS定位数据,GPS定位数据包括GPS坐标以及GPS定位时间;将GPS坐标作为定位位置,以及将GPS定位时间作为定位时间。在本实施例中,可以采用以下方式获取用户的定位信息:首先获取用户在使用全球定位系统(GPS)定位服务的历史定位数据,然后将历史定位数据中用户的GPS坐标作为定位位置,定位时间可以为用户使用GPS服务的时间。
在本实施例的一些可选地实现方式中,获取用户的定位信息包括:获取与用户的网络行为相关联的关联位置和关联时间,关联位置包括以下至少一项:用户接入网络时所接入的网络设备所处的位置、用户访问兴趣点POI时POI所处的位置,关联时间为进行网络行为时对应的时间;将关联位置作为定位位置,以及将关联时间作为定位时间。
在本实施例中,可以通过以下方式获取用户的定位信息:首先获取与用户的网络行为相关联的数据。可以采用以下形式的向量表示与用户的网络行为相关联的数据:<UserId,ResourceId,Time>,其中,UserId为用户标识,ResourceId表示与用户出现的位置相关联的资源点的标识,Time表示用户出现在资源点附近的出现时间。当用户的网络行为为通过路由器接入有线网络或通过WIFI热点接入无线网络时,ResourceId表示路由器标识或WIFI热点标识。当用户的网络行为与访问兴趣点POI相关联的行为时,ResourceId为POI的标识。与访问POI相关联的行为可以为用户在地图产品中搜索兴趣点POI(景点、餐厅)、用户在与商家相关联的POI消费团购券、用户在社交网络中进行POI签到。在获取了与用户的网络行为相关联的数据之后,由于用户在进行上述网络行为时用户的位置距离资源点的距离较近,因此,可以将ResourceId对应的资源点的经纬度作为用户的定位位置。例如当用户通过WIFI热点接入无线网络时,定位位置可以为该WIFI热点所在的位置,定位时间为用户接入该WIFI热点的时间。当用户在地图产品中搜索兴趣点POI(景点、餐厅)时POI的位置,可以将该POI的位置作为用户的定位位置。定位时间为上述网络行为发生的时间。
步骤102,基于定位信息,查找出具有关联关系的用户的用户信息。
在本实施例中,关联关系为用户之间相匹配的定位信息的数量大于数量阈值,相匹配的定位信息满足以下匹配条件:定位位置之间的差值小于距离阈值且定位时间之间的差值小于时间阈值。在本实施例中,用户之间的相匹配的定位信息可以用于表征用户之间的共现,即两个用户在相近的时间内出现在相近的位置上。当用户之间相匹配的定位的信息的数量大于数量阈值时,则可以确定用户多次共现,用户之间具有关联关系。
在本实施例中,在获取到定位信息之后,可以采用以下方式查找出用户之间相匹配的定位信息:当通过获取GPS历史定位数据方式获取定位信息时,定位位置可以应用GPS坐标表示,定位时间可以用GPS定位时间进行表示。可以从获取的定位信息中,将定位位置的差值即GPS坐标的差值小于距离阈值且定位时间的差值即GPS定位时间的差值小于时间阈值的定位信息聚合为一类。在对获取的定位信息进行聚类之后,当两个用户多次出现在不同的聚类中时,则可以确定两个用户具有多个相匹配的定位信息,即两个用户多次共现,则可以确定用户之间具有关联关系。
在本实施例中,还可以采用以下方式查找出用户之间相匹配的定位信息:当通过获取与用户的网络行为相关联的数据的方式获取定位信息时,可以首先将上述与用户的网络行为相关联的数据进行聚类。例如,与用户的网络行为相关联的数据采用向量<UserId,ResourceId,Time>进行表示,可以将ResourceId相同,Time之间的差值小于时间阈值时聚合为一类。以用户通过WIFI热点接入无线网络为例,说明获取用户之间相匹配的定位信息的过程:两个用户User1、User2的网络行为相关联的数据分别用以下向量表示:<User1,WifiId,Time1>,<User2,WifiId,Time2>。其中,当WifiId相同并且Time1与Time2之间的时间差小于时间阈值时,即User1、User2在相近的时间内接入同一WIFI热点,则可以将上述数据聚合为一类。在通过上述方式对与用户的网络行为相关联的数据进行聚类之后,当两个用户多次出现在不同的聚类中时,则可以确定两个用户具有多个相匹配的定位信息,即两个用户多次共现,则可以确定用户之间具有关联关系。其中,定位信息中的定位位置为WifiId对应的WIFI热点所处的位置,定位时间则是用户接入该WIFI热点的时间,即Time1、Time2。
步骤103,基于相匹配的定位信息,计算具有关联关系的用户的用户信息之间的关联度参数。
在本实施例中,可以基于相匹配的定位信息,计算具有共现关系的用户的用户信息之间的关联度参数(也可称之为亲密度参数)。当用户在一定时间范围(也可称之为时间跨度)内,相匹配的定位信息的数量越多,则用户之间的关联度参数值越大。
在本实施例的一些可选地实现方式中,基于相匹配的定位信息,计算具有关联关系的用户的用户信息之间的关联度参数包括:基于相匹配的定位信息中的定位位置,确定出中心点位置,中心点位置为基于定位位置中的所有定位位置确定的几何中心;基于相匹配的定位信息中的定位时间,计算定位时间的平均值,得到定位时间均值;计算定位位置中每个定位位置与中心点位置的距离差值,并对距离差值进行求和,得到位置跨度子参数;计算定位时间中每个定位时间与定位时间均值的时间差值,并对时间差值进行求和,得到时间跨度子参数;基于位置跨度子参数和时间跨度子参数,计算关联度参数。
下面以两个具有关联关系的第一用户和第二用户为例为例,说明计算用户的用户信息之间关联度过程:假设第一用户与第二用户在一定时间段(例如一个月)内总共有k次共现,即第一用户和第二用户在一定时间段内有k次在相近的时间内出现在了相近的位置上。在第一用户与第二用户的第n(1<=n<=k)次共现中,表征第一用户与第二用户之间相匹配的定位信息可以采用以下形式的向量进行表示:<User1,Position_n1,Time_n1>和<User2,Position_n2,Time_n1>。其中,User1、User2分别表示第一用户与第二用户的标识。Position_n1表示第一用户的定位位置,Time_n1表示第一用户的定位时间。在User1和User2的k次共现中,多个定位位置的空间中心(也可称之为中心点位置)为AverageResouce_User1_User2,多个定位时间的定位时间均值为AverageTime_User1_User2。由于在每一次共现中,用户之间相匹配的定位信息中的定位位置Position_n1和Position_n2距离很近,同时定位时间Time_n1和Time_n2在时间上也很近,因此,可以利用相匹配的定位信息中的其中一个用户的定位信息来进行关联度的计算。假设以采用第一用户的定位信息为例,可以采用以下公式计算第一用户与第二用户之间的关联度参数:
Re l a t i o n ( u 1 , u 2 ) = &Sigma; j = 1 k D i s tan c e ( P o s i t i o n _ j 1 , A v e r a g e Re s o u c e _ U s e r 1 _ U s e r 2 ) + A l p h a * &Sigma; j = 1 k D i s tan c e 1 ( T i m e _ j 1 , A v e r a g e T i m e _ u 1 _ u 2 ) .
其中,Relation(u1,u2)表示User1和User2的关联度参数。Position_j1表示User1与User2的第j次共现中,User1的定位位置。Time_j1表示User1与User2的第j次共现中,User1的定位时间。Distance函数的作用为计算User1在第j次共现的定位位置与中心点位置的距离差值,Distance1函数的作用为计算User1在第j次共现的定位时间与定位时间均值的时间差值。Alpha为用于平衡定位位置和定位时间的权重值。
步骤104,基于关联度参数,建立具有关联关系的用户的用户信息之间的关联。
在本实施例中,可以基于用户的用户信息之间的关联度,建立用户的用户信息之间的关联。例如,将计算出的关联度参数以拓扑形式进行显示,同时,还可以同时显示用户的标识信息。
请参考图2,其示出了建立具有关联关系的用户的用户信息之间的关联的效果图。在图2,每一个用户的用户信息在上述拓扑结构中可以称之为一个节点。节点之间的连线上标注有表征用户的用户信息之间的关联关系的关联度以及用户之间的共现次数。
在本实施例的一些可选地实现方式中,还包括:确定与用户的用户信息建立关联的其他用户的用户信息的数量;当数量大于预设阈值时,按预设比例分别降低用户的用户信息与其他用户的用户信息之间的关联度参数的参数值。在本实施例中,当一个用户的用户信息与其他用户的用户信息建立关联关系的数量大于数量阈值时,可以分别降低用户的用户信息与其他用户的用户信息之间的关联度参数。
下面以调整两个用户之间的关联度为例,说明调整用户之间的关联度的过程:两个用户当前权重分别为与用户连接的各个边的权重之和,可以利用该当前权重表征用户的活跃度。当一个用户的用户信息建立关联的其他用户的用户信息的数量大于预设阈值时,该用户的活跃度会得到提升,此时,可以减少该用户和其他用户之间的关联度参数。下面以两个用户user1和user2为例,说明对用户的关联度参数进行调节的过程:
首先利用以下公式分别计算出user1和user的活跃度值: W &prime; u s e r 1 = &Sigma; k = 1 n W u s e r 1 _ u s e r k , W &prime; u s e r 2 = &Sigma; k = 1 n W u s e r 2 _ u s e r k , 其中,W′user1表示用户user1的活跃度值,Wuser1_userk表示user1与userk之间的关联度。W′user2表示user2的活跃度值,Wuser2_userk表示user2与userk之间的关联度。在计算得到user1的活跃度值以及user2的活跃度值之后,可以采用以下公式对user1和user2之间的关联度参数进行调整: W &prime; u s e r 1 _ u s e r 2 = W u s e r 1 _ u s e r 2 W &prime; u s e r 1 * W &prime; u s e r 2 , W′user1_user2表示调整后的user1和user2之间的关联度参数。
在本实施例中,通过获取多个用户的定位信息;基于定位信息,查找出具有关联关系的用户的用户信息,关联关系为用户之间相匹配的定位信息的数量大于数量阈值,相匹配的定位信息满足以下匹配条件:定位位置之间的差值小于距离阈值且定位时间之间的差值小于时间阈值;基于相匹配的定位信息,计算具有关联关系的用户的用户信息之间的关联度参数;基于关联度参数,建立具有关联关系的用户的用户信息之间的关联。实现了充分利用网络资源建立用户的用户信息之间的关联,同时,拓宽了建立用户的用户信息之间关联的方式。
请参考图3,其示出了根据本申请的建立用户的用户信息关联的方法的另一个实施例的流程300。该方法包括以下步骤:
步骤301,获取用户的定位信息,定位信息包括定位位置和定位时间。
在本实施例中,定位位置可以用于表征用户出现过的位置,定位时间可以用于表征用户曾经出现在定位位置时的时间。
步骤302,基于定位信息,查找出具有关联关系的用户的用户信息。
在本实施例中,关联关系为用户之间相匹配的定位信息的数量大于数量阈值,相匹配的定位信息满足以下匹配条件:定位位置的差值小于距离阈值且定位时间之间的差值小于时间阈值。
步骤303,基于相匹配的定位信息,计算具有关联关系的用户的用户信息之间的关联度参数。
在本实施例中,可以基于相匹配的定位信息,计算具有共现关系的用户的用户信息之间的关联度参数(也可称之为亲密度参数)。当用户在一定时间范围(也可称之为时间跨度)内,相匹配的定位信息的数量越多,则用户之间的关联度参数值越大。
步骤304,基于关联度参数,建立具有关联关系的用户的用户信息之间的关联。
在本实施例中,可以基于用户的用户信息之间的关联度参数,建立用户的用户信息之间的关联。例如,将计算出的关联度参数以拓扑形式进行显示,同时,还可以同时显示用户的标识信息。
步骤305,基于相匹配的定位信息与用户的活动半径,确定用户之间的关联关系,关联关系包括以下之一:同事关系、亲属关系。
在本实施例中,可以基于相匹配的定位信息与活动半径的关联关系,进一步确定用户之间的关联关系,例如,当用户之间的关联关系为同事关系时,则两个用户在一定时间段(时间段)内,虽然多次共现,但在每一次共现时,相匹配的定位位置与相邻的一次共现中的相匹配定位位置之间位置变化量较小,即两个用户的共现主要集中在一个区域,从而可以确定用户之间的关联关系为同事关系。
在本实施例的一些可选地实现方式中,确定用户的关联关系包括:基于用户的定位信息中的定位位置,确定用户的活动半径;基于相匹配的定位信息中的定位位置,得到中间定位位置;当中间定位位置中任意两个中间定位位置之间的距离与用户的活动半径的差值均小于距离阈值时,则确定用户之间的关联关系为同事关系;当中间定位位置中存在两个中间定位位置之间的距离与用户的活动半径的差值均大于距离阈值时,则确定用户之间的关联关系为亲属关系。
在本实施例中,可以首先基于用户的多个定位位置,确定用户的活动半径。用户的活动半径可以采用以下方式进行确定:以多个定位位置中一个定位为基准定位位置,例如以用户在一个社区的POI的位置为基准定位位置,分别计算其他定位位置与该基准位置的差值,然后对多个差值进行求和,计算出平均值,将该平均值作为用户的活动半径。在计算出用户的活动半径之后,可以采用以下方式确定用户之间的关联关系:可以预先选取定位时间位于一定时间段(也可称之为时间跨度)内的用户之间相匹配的定位信息,然后确定相匹配的定位信息中的定位位置对应的中间位置(也可称之为共现位置),该共现位置可以用户表征用户在本次共现中相遇的位置。在得到用户之间多个共现位置之后,可以进一步判断用户之间的关联关系。
在本实施例中,当共现位置中任意两个共现位置之间的距离与用户的活动半径的差值均小于距离阈值时,可以确定与用户的活动半径相比,用户之间的多次共现定位位置发生变化的变化量较小,即用户的共现主要集中在一个范围(也可称之为位置跨度)较小的区域。因此,可以确定用户之间的关联关系为同事关系。当中间位置中任意两个共现位置之间的距离与用户的活动半径的差值大于距离阈值时,用户之间的多次共现定位位置用户的活动半径分布在较宽的位置跨度上,则确定用户之间的关联关系为亲属关系。
在本实施例中,还可以确定用户之间的除了同事关系以及亲属关系之外的关联关系,例如服务关系。可以根据用户处于工作时间这一时间段内的定位位置来判断是否存在服务关联。例如,当两个用户的频繁共现中,其中一个用户频繁地出现在一个位置上即,即在一定时间跨度内,对应同一定位位置,则可以确定用户之间的关联关系为服务关系。
请参考图4,其示出了用户之间的关联关系的效果图。在图4中,示出了两个表征用户1和用户2的用户节点1和用户节点2,在用户节点1和用户节点2之间的连线表征用户之间关联关系,即亲属关系。同时,还可以在该连线上标注与用户节点1和用户节点2相关联POI信息,例如POI信息可以为社区、超市,该POI信息指示用户1和用户2在一定时间跨度内频繁共现的地点,即用户1和用户2一起出现在社区、超市等地点的次数较多,因此可以确定用户1和用户2之间的关联关系为亲属关系。此外,还可以分别增加标注有用户属性信息的属性节点,然后将属性节点与相应的用户节点相连接。可以根据属性节点标注的属性信息,进一步判断用户之间的关联关系。例如,属性节点标注的属性信息为性别、年龄段。假设与用户节点1连接的属性节点标注的属性信息中性别为男性,年龄段为青年,与用户节点2连接的属性节点标注的属性信息中性别为男性,年龄段为中年,则可以进一步确定用户1和用户2之间的关联关系为亲属关系中的父子关系。
在本实施例中,可以在判断出用户之间的关联关系的基础上,利用POI信息,属性信息进一步判断用户之间的关联关系(例如亲属关系中的父子关系)。在本实施例中,可以结合已经确定的用户之间关联关系、用户的属性信息以及POI信息,通过神经网络对上述数据进行训练,生成关联关系识别模型,从而可以根据该关联关系识别模型对其他用户的用户信息之间的关联关系进行识别。
请参考图5,图5示出了根据本申请的建立用户的用户信息关联的装置的一个实施例的结构示意图。如图5所示,装置500包括:获取单元501,查找单元502,计算单元503,关联单元504。其中,获取单元501配置用于获取用户的定位信息,定位信息包括定位位置、定位时间;查找单元502配置用于基于定位信息,查找出具有关联关系的用户的用户信息,关联关系为用户之间相匹配的定位信息的数量大于数量阈值,相匹配的定位信息满足以下匹配条件:定位位置的差值小于距离阈值且定位时间之间的差值小于时间阈值;计算单元503配置用于基于相匹配的定位信息,计算具有关联关系的用户的用户信息之间的关联度参数;关联单元504配置用于基于关联度参数,建立具有关联关系的用户的用户信息之间的关联。
在本实施例的一些可选地实现方式中,获取单元501包括:第一获取子单元(未示出),配置用于获取用户的全球定位系统GPS定位数据,GPS定位数据包括GPS坐标以及GPS定位时间;将GPS坐标作为定位位置,以及将GPS定位时间作为定位时间。
在本实施例的一些可选地实现方式中,获取单元501还包括:第二获取子单元(未示出),配置用于获取与用户的网络行为相关联的关联位置和关联时间,关联位置包括以下至少一项:用户接入网络时所接入的网络设备所处的位置、用户访问兴趣点POI时POI所处的位置,关联时间为进行网络行为时对应的时间;将关联位置作为定位位置,以及将关联时间作为定位时间。
在本实施例的一些可选地实现方式中,计算单元503包括:中心点位置确定子单元(未示出),配置用于基于相匹配的定位信息中的定位位置,确定出中心点位置,中心点位置为基于定位位置中的所有定位位置确定的几何中心;时间均值计算子单元(未示出),配置用于基于相匹配的定位信息中的定位时间,计算定位时间的平均值,得到定位时间均值;位置跨度计算子单元(未示出),配置用于计算定位位置中每个定位位置与中心点位置的距离差值,并对距离差值进行求和,得到位置跨度子参数;时间跨度计算子单元(未示出),配置用于计算定位时间中每个定位时间与定位时间均值的时间差值,并对时间差值进行求和,得到时间跨度子参数;关联度参数计算子单元,配置用于基于位置跨度子参数和时间跨度子参数,计算关联度参数。
在本实施例的一些可选地实现方式中,装置500还包括:关联数量确定子单元(未示出),配置用于确定与用户的用户信息建立关联的其他用户的用户信息的数量;关联度参数调整子单元(未示出),配置用于当数量大于预设数量阈值时,分别降低用户的用户信息与其他用户的用户信息之间的关联度参数值。
在本实施例的一些可选地实现方式中,装置500还包括:活动半径确定子单元(未示出),配置用于基于用户的定位信息中的定位位置,确定用户的活动半径;中间位置确定子单元(未示出),配置用于确定相匹配的定位信息中的定位位置对应的中间位置;第一关联关系确定子单元(未示出),配置用于当中间位置中任意两个中间位置之间的距离与用户的活动半径的差值均小于距离阈值时,则确定用户之间的关联关系为同事关系;第二关联关系确定子单元(未示出),配置用于当中间位置中任意两个中间位置之间的距离与用户的活动半径的差值大于距离阈值时,则确定用户之间的关联关系为亲属关系。
本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元,查找单元,计算单元,关联单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,查找单元还可以被描述为“配置用于获取多个用户的定位信息”。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端中的计算机可读存储介质。所述计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本申请的建立用户的用户信息关联的方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种建立用户的用户信息关联的方法,其特征在于,所述方法包括:
获取用户的定位信息,所述定位信息包括定位位置、定位时间;
基于所述定位信息,查找出具有关联关系的用户的用户信息,所述关联关系为用户之间相匹配的定位信息的数量大于数量阈值,所述相匹配的定位信息满足以下匹配条件:定位位置之间的差值小于距离阈值且定位时间之间的差值小于时间阈值;
基于所述相匹配的定位信息,计算具有关联关系的用户的用户信息之间的关联度参数;
基于所述关联度参数,建立所述具有关联关系的用户的用户信息之间的关联。
2.根据权利要求1所述的方法,其特征在于,所述获取用户的定位信息包括:
获取用户的全球定位系统GPS定位数据,所述GPS定位数据包括GPS坐标以及GPS定位时间;
将所述GPS坐标作为所述定位位置,以及将所述GPS定位时间作为所述定位时间。
3.根据权利要求1所述的方法,其特征在于,所述获取用户的定位信息包括:
获取与用户的网络行为相关联的关联位置和关联时间,所述关联位置包括以下至少一项:用户接入网络时所接入的网络设备所处的位置、用户访问兴趣点POI时所述POI所处的位置,所述关联时间为进行所述网络行为时对应的时间;
将所述关联位置作为所述定位位置,以及将所述关联时间作为所述定位时间。
4.根据权利要求1-3之一所述的方法,其特征在于,所述基于所述相匹配的定位信息,计算具有关联关系的用户的用户信息之间的关联度参数包括:
基于相匹配的定位信息中的定位位置,确定出中心点位置,所述中心点位置为基于定位位置中的所有定位位置而确定的几何中心;
基于相匹配的定位信息中的定位时间,计算定位时间的平均值,得到定位时间均值;
计算所述定位位置中每个定位位置与所述中心点位置的距离差值,并对所述距离差值进行求和,得到位置跨度子参数;
计算所述定位时间中每个定位时间与所述定位时间均值的时间差值,并对所述时间差值进行求和,得到时间跨度子参数;
基于所述位置跨度子参数和时间跨度子参数,计算所述关联度参数。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
确定与用户的用户信息建立关联的其他用户的用户信息的数量;
当所述数量大于数量阈值时,分别降低用户的用户信息与所述其他用户的用户信息之间的关联度参数值。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
基于用户的定位信息中的定位位置,确定用户的活动半径;
确定所述相匹配的定位信息中的定位位置对应的中间位置;
当所述中间位置中任意两个中间位置之间的距离与用户的活动半径的差值均小于距离阈值时,则确定用户之间的关联关系为同事关系;
当所述中间位置中任意两个中间位置之间的距离与用户的活动半径的差值大于距离阈值时,则确定用户之间的关联关系为亲属关系。
7.一种建立用户的用户信息关联的装置,其特征在于,所述装置包括:
获取单元,配置用于获取用户的定位信息,所述定位信息包括定位位置、定位时间;
查找单元,配置用于基于所述定位信息,查找出具有关联关系的用户的用户信息,所述关联关系为用户之间相匹配的定位信息的数量大于数量阈值,所述相匹配的定位信息满足以下匹配条件:定位位置之间的差值小于距离阈值且定位时间之间的差值小于时间阈值;
计算单元,配置用于基于所述相匹配的定位信息,计算具有关联关系的用户的用户信息之间的关联度参数;
关联单元,配置用于基于所述关联度参数,建立所述具有关联关系的用户的用户信息之间的关联。
8.根据权利要求7所述的装置,其特征在于,所述获取单元包括:
第一获取子单元,配置用于获取用户的全球定位系统GPS定位数据,所述GPS定位数据包括GPS坐标以及GPS定位时间;将所述GPS坐标作为所述定位位置,以及将所述GPS定位时间作为所述定位时间。
9.根据权利要求7所述的装置,其特征在于,所述获取单元还包括:
第二获取子单元,配置用于获取与用户的网络行为相关联的关联位置和关联时间,所述关联位置包括以下至少一项:用户接入网络时所接入的网络设备所处的位置、用户访问兴趣点POI时所述POI所处的位置,所述关联时间为进行所述网络行为时对应的时间;将所述关联位置作为所述定位位置,以及将所述关联时间作为所述定位时间。
10.根据权利要求7-9之一所述的装置,其特征在于,所述计算单元包括:
中心点位置确定子单元,配置用于基于相匹配的定位信息中的定位位置,确定出中心点位置,所述中心点位置为基于定位位置中的所有定位位置而确定的几何中心;
时间均值计算子单元,配置用于基于相匹配的定位信息中的定位时间,计算定位时间的平均值,得到定位时间均值;
位置跨度计算子单元,配置用于计算所述定位位置中每个定位位置与所述中心点位置的距离差值,并对所述距离差值进行求和,得到位置跨度子参数;
时间跨度计算子单元,配置用于计算所述定位时间中每个定位时间与定位时间均值的时间差值,并对所述时间差值进行求和,得到时间跨度子参数;
关联度参数计算子单元,配置用于基于所述位置跨度子参数和时间跨度子参数,计算所述关联度参数。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
关联数量确定子单元,配置用于确定与用户的用户信息建立关联的其他用户的用户信息的数量;
关联度参数调整子单元,配置用于当所述数量大于数量阈值时,分别降低用户的用户信息与其他用户的用户信息之间的关联度参数值。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
活动半径确定子单元,配置用于基于用户的定位信息中的定位位置,确定用户的活动半径;
中间位置确定子单元,配置用于确定所述相匹配的定位信息中的定位位置对应的中间位置;
第一关联关系确定子单元,配置用于当所述中间位置中任意两个中间位置之间的距离与用户的活动半径的差值均小于距离阈值时,则确定用户之间的关联关系为同事关系;
第二关联关系确定子单元,配置用于当所述中间位置中任意两个中间位置之间的距离与用户的活动半径的差值均大于距离阈值时,则确定用户之间的关联关系为亲属关系。
CN201510472717.0A 2015-08-04 2015-08-04 建立用户的用户信息关联的方法和装置 Active CN105159926B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510472717.0A CN105159926B (zh) 2015-08-04 2015-08-04 建立用户的用户信息关联的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510472717.0A CN105159926B (zh) 2015-08-04 2015-08-04 建立用户的用户信息关联的方法和装置

Publications (2)

Publication Number Publication Date
CN105159926A true CN105159926A (zh) 2015-12-16
CN105159926B CN105159926B (zh) 2019-04-16

Family

ID=54800783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510472717.0A Active CN105159926B (zh) 2015-08-04 2015-08-04 建立用户的用户信息关联的方法和装置

Country Status (1)

Country Link
CN (1) CN105159926B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608179A (zh) * 2015-12-22 2016-05-25 百度在线网络技术(北京)有限公司 确定用户标识的关联性的方法和装置
CN105824921A (zh) * 2016-03-16 2016-08-03 广州彩瞳网络技术有限公司 用户社会关系识别装置和方法
WO2017107729A1 (zh) * 2015-12-23 2017-06-29 北京奇虎科技有限公司 地理位置监测方法及设备
CN107016033A (zh) * 2016-12-26 2017-08-04 阿里巴巴集团控股有限公司 一种社交网络用户信息关联方法及装置
CN107423406A (zh) * 2017-07-27 2017-12-01 电子科技大学 一种校园学生关系网络的构建方法
CN107689991A (zh) * 2017-08-24 2018-02-13 阿里巴巴集团控股有限公司 信息推送方法和装置、服务器
CN108366012A (zh) * 2018-03-08 2018-08-03 北京奇艺世纪科技有限公司 一种社交关系建立方法、装置及电子设备
CN108616415A (zh) * 2018-03-16 2018-10-02 新华三大数据技术有限公司 数据关联方法及装置
CN108881388A (zh) * 2018-05-17 2018-11-23 镇江国中亿家科技有限公司 一种位置数据的处理方法和装置
CN109388684A (zh) * 2018-10-23 2019-02-26 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN110458394A (zh) * 2019-07-05 2019-11-15 阿里巴巴集团控股有限公司 一种基于对象关联度的指标测算方法及装置
CN110598122A (zh) * 2018-06-13 2019-12-20 百度在线网络技术(北京)有限公司 社交群体挖掘方法、装置、设备及存储介质
CN111160471A (zh) * 2019-12-30 2020-05-15 腾讯云计算(北京)有限责任公司 一种兴趣点数据处理方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110083101A1 (en) * 2009-10-06 2011-04-07 Sharon Eyal M Sharing of Location-Based Content Item in Social Networking Service
CN102547556A (zh) * 2010-12-27 2012-07-04 腾讯科技(深圳)有限公司 一种用户关联关系添加方法、移动终端和服务器
US20140106785A1 (en) * 2012-06-22 2014-04-17 Google Inc. Labeling visited locations based on contact information
CN104636354A (zh) * 2013-11-07 2015-05-20 华为技术有限公司 一种位置兴趣点聚类方法和相关装置
CN104636439A (zh) * 2015-01-04 2015-05-20 中国联合网络通信集团有限公司 一种分析用户社会关系的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110083101A1 (en) * 2009-10-06 2011-04-07 Sharon Eyal M Sharing of Location-Based Content Item in Social Networking Service
CN102547556A (zh) * 2010-12-27 2012-07-04 腾讯科技(深圳)有限公司 一种用户关联关系添加方法、移动终端和服务器
US20140106785A1 (en) * 2012-06-22 2014-04-17 Google Inc. Labeling visited locations based on contact information
CN104636354A (zh) * 2013-11-07 2015-05-20 华为技术有限公司 一种位置兴趣点聚类方法和相关装置
CN104636439A (zh) * 2015-01-04 2015-05-20 中国联合网络通信集团有限公司 一种分析用户社会关系的方法及装置

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608179B (zh) * 2015-12-22 2019-03-12 百度在线网络技术(北京)有限公司 确定用户标识的关联性的方法和装置
CN105608179A (zh) * 2015-12-22 2016-05-25 百度在线网络技术(北京)有限公司 确定用户标识的关联性的方法和装置
WO2017107729A1 (zh) * 2015-12-23 2017-06-29 北京奇虎科技有限公司 地理位置监测方法及设备
CN105824921A (zh) * 2016-03-16 2016-08-03 广州彩瞳网络技术有限公司 用户社会关系识别装置和方法
WO2017157047A1 (zh) * 2016-03-16 2017-09-21 广州优视网络科技有限公司 用户社会关系识别装置、方法及终端设备
US10860595B2 (en) 2016-03-16 2020-12-08 Guangzhou Uc Network Technology Co., Ltd. User social-relationship identification apparatus, method, and terminal device
CN107016033A (zh) * 2016-12-26 2017-08-04 阿里巴巴集团控股有限公司 一种社交网络用户信息关联方法及装置
CN107423406A (zh) * 2017-07-27 2017-12-01 电子科技大学 一种校园学生关系网络的构建方法
CN107423406B (zh) * 2017-07-27 2021-02-05 电子科技大学 一种校园学生关系网络的构建方法
CN107689991B (zh) * 2017-08-24 2020-11-20 创新先进技术有限公司 信息推送方法和装置、服务器
CN107689991A (zh) * 2017-08-24 2018-02-13 阿里巴巴集团控股有限公司 信息推送方法和装置、服务器
CN108366012A (zh) * 2018-03-08 2018-08-03 北京奇艺世纪科技有限公司 一种社交关系建立方法、装置及电子设备
CN108616415A (zh) * 2018-03-16 2018-10-02 新华三大数据技术有限公司 数据关联方法及装置
CN108881388A (zh) * 2018-05-17 2018-11-23 镇江国中亿家科技有限公司 一种位置数据的处理方法和装置
CN110598122A (zh) * 2018-06-13 2019-12-20 百度在线网络技术(北京)有限公司 社交群体挖掘方法、装置、设备及存储介质
CN110598122B (zh) * 2018-06-13 2022-04-01 百度在线网络技术(北京)有限公司 社交群体挖掘方法、装置、设备及存储介质
CN109388684A (zh) * 2018-10-23 2019-02-26 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
US10845485B2 (en) 2018-10-23 2020-11-24 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for generating information
CN110458394A (zh) * 2019-07-05 2019-11-15 阿里巴巴集团控股有限公司 一种基于对象关联度的指标测算方法及装置
CN110458394B (zh) * 2019-07-05 2023-08-22 创新先进技术有限公司 一种基于对象关联度的指标测算方法及装置
CN111160471A (zh) * 2019-12-30 2020-05-15 腾讯云计算(北京)有限责任公司 一种兴趣点数据处理方法、装置、电子设备和存储介质
CN111160471B (zh) * 2019-12-30 2023-04-07 腾讯云计算(北京)有限责任公司 一种兴趣点数据处理方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN105159926B (zh) 2019-04-16

Similar Documents

Publication Publication Date Title
CN105159926A (zh) 建立用户的用户信息关联的方法和装置
He et al. An exchange market approach to mobile crowdsensing: pricing, task allocation, and walrasian equilibrium
Chen et al. Bayesian fusion for indoor positioning using bluetooth fingerprints
US9515889B2 (en) Geographic location system and method
JP5688075B2 (ja) 複数ユーザの場所情報間の類似性に基づく推奨の生成
US9143541B1 (en) Systems, computer-implemented methods, and computer-readable media to target internet-based services on a geographic location
CA2539285C (en) Methods and systems for improving a search ranking using location awareness
US8825683B2 (en) Generating geographical keywords for geotargeting search engine-offered advertisements
Zhou et al. Providing location services within a radio cellular network using ellipse propagation model
US20090248663A1 (en) Online target location detection
Xuan et al. Voronoi-based multi-level range search in mobile navigation
WO2014113709A2 (en) Searching and determining active area
US20160034480A1 (en) Determining Labels from Similar Geographic Features
US20170206559A1 (en) Associating a single entity with multiple electronic devices
CN105592120A (zh) 提供地理位置信息的方法及装置
KR101934420B1 (ko) 지도 중의 후보 주소 정보를 획득하기 위한 방법 및 장치
CN113758496B (zh) 路径的规划方法、装置、电子设备及存储介质
Kim et al. K-nearest neighbor query processing algorithms for a query region in road networks
US8566425B1 (en) Identifying social profiles of entities
US20150227583A1 (en) Managing search results
Uzun et al. Semantic positioning-an innovative approach for providing location-based services based on the web of data
Chen et al. Node-gosper curve-based unknown sensor localization using single mobile anchor in wireless sensor networks
Chen et al. Hybrid TOA/AOA geometrical positioning schemes for mobile location
CN107766881A (zh) 一种基于基础分类器的寻路方法、设备及存储设备
Bok et al. A Social Search Scheme Considering User Preferences and Popularities in Mobile Environments

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant