CN111753214A - 基于行为轨迹的数据推送方法、系统和计算机设备 - Google Patents
基于行为轨迹的数据推送方法、系统和计算机设备 Download PDFInfo
- Publication number
- CN111753214A CN111753214A CN202010588495.XA CN202010588495A CN111753214A CN 111753214 A CN111753214 A CN 111753214A CN 202010588495 A CN202010588495 A CN 202010588495A CN 111753214 A CN111753214 A CN 111753214A
- Authority
- CN
- China
- Prior art keywords
- target
- data
- track
- user
- target location
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 239000013598 vector Substances 0.000 claims abstract description 120
- 238000013145 classification model Methods 0.000 claims abstract description 18
- 230000001960 triggered effect Effects 0.000 claims abstract description 10
- 230000006399 behavior Effects 0.000 claims description 84
- 238000004590 computer program Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种基于行为轨迹的数据推送方法,所述方法包括:接收目标用户通过目标用户终端触发的数据推送指令;根据数据推送指令从行为日志系统中获取目标用户的目标历史行为数据;根据目标历史行为数据的构建目标用户的目标轨迹图;根据目标轨迹图提取目标用户的目标轨迹特征向量;将目标轨迹特征向量输入到召回模型中以得到多个初始推送数据;将多个初始推送数据输入到分类模型中以得到多个目标推送数据;及将多个目标推送数据推送到前端进行展示。本发明根据用户的行为轨迹为用户构建轨迹图,并通过对分类模型和回归模型对用户的轨迹进行相识度匹配,提高了数据推荐的准确率和效率。
Description
技术领域
本发明实施例涉及数据分析领域,尤其涉及一种基于行为轨迹的数据推送方法、系统、计算机设备及计算机可读存储介质。
背景技术
目前,社会网络服务已经成为重要的互联网服务之一。社会性网络服务使得人们足不出户也能和朋友交流、互动,同时也能结交更多的好友来扩大朋友圈。像微博、Twitter、facebook这样的网络服务提供商都在致力于提供更好的交友服务。
但是,现有的好友推荐几乎均只关注两个用户的年龄、性别、兴趣爱好等人物基本属性,没有挖掘更多的人物信息。因此,如何挖掘更多的人物信息,从而进一步提升好友推荐的准确性,成为目前亟需解决的技术问题之一。
发明内容
有鉴于此,有必要提供一种基于行为轨迹的数据推送方法、系统、计算机设备及计算机可读存储介质,以解决当前好友推荐条件单一、没有挖掘更多的人物信息以及用户数据推荐的准确性低等技术问题。
为实现上述目的,本发明实施例提供了一种基于行为轨迹的数据推送方法,所述方法步骤包括:
接收目标用户通过目标用户终端触发的数据推送指令;
根据所述数据推送指令从行为日志系统中获取目标用户的目标历史行为数据;
根据所述目标历史行为数据的构建所述目标用户的目标轨迹图;
根据所述目标轨迹图提取所述目标用户的目标轨迹特征向量;
将所述目标轨迹特征向量输入到召回模型中,以通过所述召回模型从多个用户中召回多个初始推送数据;
将所述多个初始推送数据输入到所述分类模型中;
通过所述分类模型对所述多个初始推送数据进行关联关系排序,以得到多个目标推送数据;及
将所述多个目标推送数据推送到前端进行展示。
示例性的,所述根据所述目标历史行为数据的构建所述目标用户的目标轨迹图,包括:
从所述目标历史行为数据中获取多个目标地点数据:l1、l2、l3...ln和所述多个目标地点数据对应的多个目标时间数据:t1、t2、t3...tn;及
根据所述多个目标时间数据的时间顺序为所述目标用户u构建目标轨迹图:Cu={(u,t1,l1),(u,t2,l2)...(u,tn,ln)},其中,l1、l2和ln分别为第一个目标地点数据、第二个目标地点数据和第n个目标地点数据,t1、t2和tn分别为第一个目标地点数据对应的目标时间数据、第二个目标地点数据对应的目标时间数据和第n个目标地点数据对应的目标时间数据。
示例性的,所述根据所述目标轨迹图提取所述目标用户的目标轨迹特征向量,包括:
根据每个目标地点数据和每个目标地点数据所对应的目标时间数据提取每个目标地点的目标地点特征向量,以得到多个目标地点特征向量E1、E2、E3...En;及
示例性的,还包括:
判断所述目标用户是否为特殊用户;及
如果所述目标用户为特殊用户时,则通过预定的规则计算未出现的地点的向量。
示例性的,还包括:训练召回模型的步骤:
获取多个用户对应的多个历史行为数据;
根据所述多个历史行为数据提取每个用户的轨迹特征向量;
将多个轨迹特征向量作为预先获取的待训练召回模型的输入,与每个轨迹特征向量具有相似轨迹的轨迹特征向量作为所述待训练召回模型的输出,来对所述待训练召回模型进行训练,直至损失函数收敛;
将每个轨迹特征向量作为训练后的待训练召回模型的输入,以获得与每个轨迹特征向量对应的多个相识轨迹特征向量;及
判断每个轨迹特征向量召回的相识轨迹特征向量的准确率及召回率是否达到检测准确阈值及检测召回阈值,若达到,则训练后的待训练召回模型则为初始召回模型。
示例性的,所述提取模块,还用于:
所述根据每个目标地点数据和每个目标地点数据所对应的目标时间数据提取每个目标地点的目标地点特征向量,以得到多个目标地点特征向量E1、E2、E3...En;及
为实现上述目的,本发明实施例还提供了一种基于行为轨迹的数据推送系统,包括:
接收模块,用于接收目标用户通过目标用户终端触发的数据推送指令;
获取模块,用于根据所述数据推送指令从行为日志系统中获取目标用户的目标历史行为数据;
构建模块,用于根据所述目标历史行为数据的构建所述目标用户的目标轨迹图;
提取模块,用于根据所述目标轨迹图提取所述目标用户的目标轨迹特征向量;
召回模块,用于将所述目标轨迹特征向量输入到召回模型中,以通过所述召回模型从多个用户中召回多个初始推送数据;
分类模块,用于将所述多个初始推送数据输入到所述分类模型中;
排序模块,用于通过所述分类模型对所述多个初始推送数据进行关联关系排序,以得到多个目标推送数据;及
推送模块,用于将所述多个目标推送数据推送到前端进行展示。
示例性的,所述构建模块,还用于:
从所述目标历史行为数据中获取多个目标地点数据:l1、l2、l3...ln和所述多个目标地点数据对应的多个目标时间数据:t1、t2、t3...tn;及
根据所述多个目标时间数据的时间顺序为所述目标用户u构建目标轨迹图:Cu={(u,t1,l1),(u,t2,l2)...(u,tn,ln)},其中,l1、l2和ln分别为第一个目标地点数据、第二个目标地点数据和第n个目标地点数据,t1、t2和tn分别为第一个目标地点数据对应的目标时间数据、第二个目标地点数据对应的目标时间数据和第n个目标地点数据对应的目标时间数据。
为实现上述目的,本发明实施例还提供了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被处理器执行时实现如上述的基于行为轨迹的数据推送方法的步骤。
为实现上述目的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如上述的基于行为轨迹的数据推送方法的步骤。
本发明实施例提供的基于行为轨迹的数据推送方法、系统、计算机设备及计算机可读存储介质,为用户提供了更为精准更为个性化的数据推送方法;本发明根据用户的行为轨迹为用户构建轨迹图,并通过对分类模型和回归模型对用户的轨迹进行相识度匹配,丰富了用户的数据推荐条件,提高了数据推荐的准确率和效率。
附图说明
图1为本发明实施例基于行为轨迹的数据推送方法的流程示意图。
图2为本发明基于行为轨迹的数据推送方法的目标轨迹图。
图3为本发明基于行为轨迹的数据推送方法的轨迹全图。
图4为本发明基于行为轨迹的数据推送方法的Skip-gram模型的结构图。
图5为本发明基于行为轨迹的数据推送方法的召回阶段的流程图。
图6为本发明基于行为轨迹的数据推送系统实施例二的程序模块示意图。
图7为本发明计算机设备实施例三的硬件结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
以下实施例中,将以计算机设备2为执行主体进行示例性描述。
实施例一
参阅图1,示出了本发明实施例之基于行为轨迹的数据推送方法的步骤流程图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备2为执行主体进行示例性描述。具体如下。
步骤S100,接收目标用户通过目标用户终端触发的数据推送指令。
示例性的,所述数据推送指令可以通过数据推送系统中的数据推送组件触发。例如,所述目标用户可以通过目标用户终端访问数据推送系统,并点击所述数据推送系统中的数据推送按钮就可以触发所述数据推送组件;其中,在所述数据推送组件被触发时,所述数据推送系统可以接收到一个数据推送指令。
步骤S102,根据所述数据推送指令从行为日志系统中获取目标用户的目标历史行为数据。
所述目标用户在访问数据推送系统前需要先登录所述数据推送系统,所述数据推送系统可以根据所述数据推送指令获取当前触发数据推送组件的目标用户身份信息,在所述目标用户身份信息得到确认后,所述数据推送系统可以根据所述目标用户身份信息从所述行为日志系统中获取目标用户的目标历史行为数据,所述目标历史行为数据包括目标用户历史访问停留地点(经纬度)及历史访问时间(工作日/非工作日)。
在一些实施例中,所述数据推送系统还可以根据所述目标用户身份信息获取目标用户的自定义行为数据,所述自定义行为数据包括目标用户自定义的访问停留地点(经纬度)及访问时间(工作日/非工作日)。
步骤S104,根据所述目标历史行为数据的构建所述目标用户的目标轨迹图。
示例性的,所述步骤S104还可以进一步的包括:
步骤S104a,从所述目标历史行为数据中获取多个目标地点数据:l1、l2、l3...ln和所述多个目标地点数据对应的多个目标时间数据:t1、t2、t3...tn。
步骤S104b,根据所述多个目标时间数据的时间顺序为所述目标用户u构建目标轨迹图:Cu={(u,t1,l1),(u,t2,l2)...(u,tn,ln)},其中,l1、l2和ln分别为第一个目标地点数据、第二个目标地点数据和第n个目标地点数据,t1、t2和tn分别为第一个目标地点数据对应的目标时间数据、第二个目标地点数据对应的目标时间数据和第n个目标地点数据对应的目标时间数据。
示例性的,所述目标历史行为数据包括所述目标用户所访问过的多个访问地点对应的多个目标地点数据:l1、l2、l3...ln和所述多个目标地点数据对应的多个目标时间数据:t1、t2、t3...tn。所述目标用户的可以根据对所述多个访问地点的访问时间顺序构成一个目标轨迹图Cu={(u,t1,l1),(u,t2,l2)...(u,tn,ln)}。
如图2所示,所述图2中的节点表示访问的地点,箭头表示访问的先后顺序,因此该用户的访问顺序为l1、l2、l1、l2、l3。在一些实施例中,将所有人的轨迹全部放入图中,可构成轨迹全图,如图3所示。
步骤S106,根据所述目标轨迹图提取所述目标用户的目标轨迹特征向量。
示例性的,所述步骤S106还可以进一步的包括:
步骤S106a,根据每个目标地点数据和每个目标地点数据所对应的目标时间数据提取每个目标地点的目标地点特征向量,以得到多个目标地点特征向量E1、E2、E3...En;步骤S106b,根据所述多个目标地点特征向量,确定所述目标用户u的目标轨迹特征向量:并将目标轨迹特征向量上传至区块链中,其中,Ei为所述目标用户u的第i个目标地点特征向量,Eu为所述目标用户u的目标轨迹特征向量。
示例性的,所述目标用户u的轨迹为Cu={(u,t1,l1),(u,t2,l2)...(u,tn,ln)},表示所述目标用户u共访问过n个地点,通过Skip-gram模型训练得到为E1、E2、E3...En。则目标用户u代表的目标轨迹特征向量为:其中,所述Skip-gram是word2vec模型的一种,其结构如图4所示。
示例性的,将目标轨迹特征向量上传至区块链可保证其安全性和对用户的公正透明性。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
步骤S108,将所述目标轨迹特征向量输入到召回模型中,以通过所述召回模型从多个用户中召回多个初始推送数据。
示例性的,根据所述目标轨迹向量通过所述召回模型从多个用户中召回多个初始推送数据。所述召回是为了从千万级数据中锁定小部分的候选集,已将被锁定的候选集作为对推荐列表的初步筛选。常见的召回方法是协同过滤算法,而该方法只适合用于用户较少的场景,不适合用于千万级数据量的场景下。在本实施例中可以先采Graph embedding(网络表示学习,又称图嵌入)的方法,将每个人转化为一个向量,通过召回模型计算两个向量的相似度,相似度高则表示两人的轨迹相似度高,越有可能是好友关系。其中,召回阶段的流程如图5所示。
通过计算目标轨迹特征向量Eu和其他轨迹特征向量Eu′的余弦相似性,判断轨迹相似性,相似性越高表示两人越可能有关系,将相似性靠前的多个用户作为初始推送数据,所述相似性靠前的多个用户的数量为预设的数量。在一些实施例中,所述初始推送数据可以是与所述目标用户行为轨迹相识的用户。
示例性的,所述步骤S108还包括进一步的包括:步骤S108a,判断所述目标用户是否为特殊用户;及步骤S108b,如果所述目标用户为特殊用户时,则通过预定的规则计算未出现的地点的向量。
示例性的,所述特殊用户为轨迹图中有一部分或全部未被Skip-gram(神经网络结构)模型训练过的用户。例如,POI(Point of Information信息点)是地理系统中常见的地点信息,表示某个地点的类别,可能是美食店、服装店、健身店等等。爬取大众点评的数据,POI一共分为17种,包括“美食”、“教育学校”、“机构团体”、“汽车”、“娱乐休闲”、“生活服务”、“运动健身”、“房产小区”、“基础设施”、“酒店宾馆”、“购物”、“医疗保健”、“旅游景点”、“文化场馆”、“公司企业”、“银行金融”和“地名地址”。通过Skip-gram模型训练得到的每个地点均表示某一种POI,因此17种POI的embedding(连续向量)向量分为别:其中,在计算未出现的地点的向量时,只需要判断新地点的POI类型,再用该类POI的embedding向量近似代替。
示例性的,所述方法还可以进一步的包括:
步骤S200,获取多个用户对应的多个历史行为数据;步骤S202,根据所述多个历史行为数据提取每个用户的轨迹特征向量;步骤S204,将多个轨迹特征向量作为预先获取的待训练召回模型的输入,与每个轨迹特征向量具有相似轨迹的轨迹特征向量作为所述待训练召回模型的输出,来对所述待训练召回模型进行训练,直至损失函数收敛;步骤S206,将每个轨迹特征向量作为训练后的待训练召回模型的输入,以获得与每个轨迹特征向量对应的多个相识轨迹特征向量;及步骤S208,判断每个轨迹特征向量召回的相识轨迹特征向量的准确率及召回率是否达到检测准确阈值及检测召回阈值,若达到,则训练后的待训练召回模型则为初始召回模型。
步骤S110,将所述多个初始推送数据输入到所述分类模型中。
示例性的,在所述召回阶段结束后,所述多个初始推送数据仅仅与所述目标用户轨迹相似,为了进一步筛选出与所述目标用户具有较强的关联关系的数据,本方案通过将所述多个初始推送数据输入到所述分类模型中,以得到与所述目标用户具有较强的关联关系的多个目标推送数据。在一些实施例中,所述目标推送数据可以是与所述目标用户具有较强的关联关系的用户,例如,两个用户在某个地铁站或者火车站共同出现,则相似度较高。但不以证明他们有朋友关系,有可能他们擦肩而过。因此还需要进一步分类。
步骤S112,通过所述分类模型对所述多个初始推送数据进行关联关系排序,以得到多个目标推送数据。
示例性的,所述分类模型可以基于预先设定的因素对所述多个初始推送数据进行关联关系排序,并将排序靠前的多个初始推送数据作为所述目标推送数据。其中,所述预先设定的因素包括位置熵、时间间隔序列和时间维度。
示例性的,所述目标用户与所述多个初始推送数据的关联关系的大小,可以根据所述位置熵来判断,而所述位置熵的大小可以根据区域热门程度来判断,例如,火车站这样的热门地点,很多人都共同出现过;而如果两个人经常出现在某个非热门区域,比如某小区,则表示两人有较强的关系。因此在分类过程中需要判断两人共同访问过的地点热门程度,来确定所述位置熵。
位置熵Hl越大表示该位置越热门,其中pl(u)是用户u去过地点l的概率。pl(u)的分子为用户u去过地点l的次数,分母为所有用户去过地点l的次数。以上海为例,位置熵较高的地点如下表。可以发现位置熵较高的都是人流量较大的火车站或者地铁站。如表1所示:
地点 | H<sub>l</sub> |
31.2335,121.4745(人民广场) | 8.19999 |
31.2385,121.4155(曹杨路地铁站) | 7.59356 |
31.2375,121.4845(南京东路地铁站) | 7.59340 |
31.2295,121.5265(世纪大道) | 7.54229 |
31.1945,121.3205(上海虹桥站) | 7.3237 |
表1
考虑到实际情况:没有关系的用户倾向于共同访问热门的地点,有关系的用户也可能共同访问不热门的地点,比如住宅小区等。因此在位置熵的基础上引伸出“共现地点位置熵”和“共现频次位置熵”两个特征。
如表2所示:
表2
表2列出了4对用户,分别为pair1、pair2、pair3、pair4,每对用户均共同访问过4个不同的地址:l1、l2、l3、l4,可以发现pair1的4个地址位置熵较小,因此“共现地点位置熵”和“共现频次位置熵”较大,两人可能有关系。而pair4的两个用户访问过的地址位置上均较大,可能为某个地铁站或者商圈,因此两人的“共现地点位置熵”和“共现频次位置熵”较小,两人可能没有关系。
示例性的,所述目标用户与所述多个初始推送数据的关联关系的大小,还可以根据所述时间间隔序列来判断,所述时间间隔序列是用于判断所述两个用户访问同一地点的时间间隔,其中,时间间隔为0则表示两人同时访问某个地点,例如,用户u和u′均访问过地点l,u的访问行为为<u,tu,1,l>、<u,tu42,l>、…<u,tu,m,l>,u′的访问行为为<u,tu′,1,l>、<u,tu′,2,l>、…<u,tu′,n,l>,表示u和u′都在多个时间下访问地点l。则可以构建两人的最大时间间序列和最小时间间隔序列,分别为
实际两人的共现地址会有多个,而且两人访问同一地点的次数也不尽相同,因此需要先对地点l的时间序列平均化得到u和u′关于l的平均时间间隔,再对u和u′的所有共现地址的时间间隔平均化。即
其中Lu,u′,为用户u和u′都访问过的地点。
示例性的,所述目标用户与所述多个初始推送数据的关联关系的大小,还可以根据所述时间维度来判断,为了拓展维度,可以在不同时间纬度下建立特征,时间分为工作日、非工作日以及所有时间。因此全部特征共15个,如表3所示:
表3
全部特征构建好后,需要放入二分类Lightgbm模型中,通过贝叶斯参数寻优找到合适的参数进行预测。
步骤S114,将所述多个目标推送数据推送到前端进行展示。
在本实施例中,通过前后端交互的系统将经过召回、分类后处理后得到的多个目标推送数据再传给前端进行展示。在一些实施例中,所述前端可以采用HTML和Javascript编写,所述HTML是一种用于创建网页的标准标记语言,所述JavaScript是一种属于网络的脚本语言。前后端交互采用Flask和Ajax编写,Flask是一个轻量级Web应用框架,Ajax是一种创建交互式网页应用的网页开发技术,可以实现在不重新加载整个网页的情况下,对网页的某部分进行更新。
在本实施例中,基于目标轨迹特征向量可以得到对应的多个目标推送数据,具体来说,通过将所述目标轨迹特征向量输入到训练好的召回模型中,然后将召回模型输出的结果输入到分类模型中可以得到所述多个目标推送数据。将目标轨迹特征向量上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该目标轨迹特征向量,以便查证多个目标推送数据是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
实施例二
图6为本发明基于行为轨迹的数据推送系统实施例二的程序模块示意图。基于行为轨迹的数据推送系统20可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述基于行为轨迹的数据推送方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述基于行为轨迹的数据推送系统20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
接收模块200,用于接收模块,用于接收目标用户通过目标用户终端触发的数据推送指令。
获取模块202,用于根据所述数据推送指令从行为日志系统中获取目标用户的目标历史行为数据。
构建模块204,用于根据所述目标历史行为数据的构建所述目标用户的目标轨迹图。
示例性的,所述构建模块204还用于:从所述目标历史行为数据中获取多个目标地点数据:l1、l2、l3...ln和所述多个目标地点数据对应的多个目标时间数据:t1、t2、t3...tn;及根据所述多个目标时间数据的时间顺序为所述目标用户u构建目标轨迹图:Cu={(u,t1,l1),(u,t2,l2)...(u,tn,ln)}。
提取模块206,用于根据所述目标轨迹图提取所述目标用户的目标轨迹特征向量。
示例性的,所述提取模块206还用于:根据每个目标地点数据和每个目标地点数据所对应的目标时间数据提取每个目标地点的目标地点特征向量,以得到多个目标地点特征向量E1、E2、E3...En;及
召回模块208,用于将所述目标轨迹特征向量输入到召回模型中,以通过所述召回模型从多个用户中召回多个初始推送数据。
分类模块210,用于将所述多个初始推送数据输入到所述分类模型中。
排序模块212,用于通过所述分类模型对所述多个初始推送数据进行关联关系排序,以得到多个目标推送数据。
推送模块214,用于将所述多个目标推送数据推送到前端进行展示。
示例性的,所述基于行为轨迹的数据推送系统20还包括训练模块,所述训练模块用于:获取多个用户对应的多个历史行为数据;根据所述多个历史行为数据提取每个用户的轨迹特征向量;及将多个轨迹特征向量作为预先获取的待训练召回模型的输入,与每个轨迹特征向量具有相似轨迹的轨迹特征向量作为所述待训练召回模型的输出,来对所述待训练召回模型进行训练,直至损失函数收敛;将每个轨迹特征向量作为训练后的待训练召回模型的输入,以获得与每个轨迹特征向量对应的多个相识轨迹特征向量;判断每个轨迹特征向量召回的相识轨迹特征向量的准确率及召回率是否达到检测准确阈值及检测召回阈值,若达到,则训练后的待训练召回模型则为初始召回模型。
实施例三
参阅图7,是本发明实施例三之计算机设备的硬件架构示意图。本实施例中,所述计算机设备2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图所示,所述计算机设备2至少包括,但不限于,可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及基于行为轨迹的数据推送系统20。
本实施例中,存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件,例如实施例二的基于行为轨迹的数据推送系统20的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行基于行为轨迹的数据推送系统20,以实现实施例一的基于行为轨迹的数据推送方法。
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在所述计算机设备2与其他电子装置之间建立通信连接。例如,所述网络接口23用于通过网络将所述计算机设备2与外部终端相连,在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(WidebandCode Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图7仅示出了具有部件20-23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器21中的基于行为轨迹的数据推送系统20还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器22)所执行,以完成本发明。
例如,图6示出了本发明实施例二之所述实现基于行为轨迹的数据推送系统20的程序模块示意图,该实施例中,所述基于行为轨迹的数据推送系统20可以被划分为接收模块200、获取模块202、构建模块204、提取模块206、召回模块208、分类模块210、排序模块212和推送模块214。其中,本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述基于行为轨迹的数据推送系统20在所述计算机设备2中的执行过程。所述程序模块200-214的具体功能在实施例二中已有详细描述,在此不再赘述。
实施例四
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于基于行为轨迹的数据推送系统20,被处理器执行时实现实施例一的基于行为轨迹的数据推送方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于行为轨迹的数据推送方法,其特征在于,所述方法包括:
接收目标用户通过目标用户终端触发的数据推送指令;
根据所述数据推送指令从行为日志系统中获取目标用户的目标历史行为数据;
根据所述目标历史行为数据的构建所述目标用户的目标轨迹图;
根据所述目标轨迹图提取所述目标用户的目标轨迹特征向量;
将所述目标轨迹特征向量输入到召回模型中,以通过所述召回模型从多个用户中召回多个初始推送数据;
将所述多个初始推送数据输入到所述分类模型中;
通过所述分类模型对所述多个初始推送数据进行关联关系排序,以得到多个目标推送数据;及
将所述多个目标推送数据推送到前端进行展示。
2.如权利要求1所述的基于行为轨迹的数据推送方法,其特征在于,所述根据所述目标历史行为数据的构建所述目标用户的目标轨迹图,包括:
从所述目标历史行为数据中获取多个目标地点数据:l1、l2、l3...ln和所述多个目标地点数据对应的多个目标时间数据:t1、t2、t3...tn;及
根据所述多个目标时间数据的时间顺序为所述目标用户u构建目标轨迹图:Cu={(u,t1,l1),(u,t2,l2)...(u,tn,ln)},其中,l1、l2和ln分别为第一个目标地点数据、第二个目标地点数据和第n个目标地点数据,t1、t2和tn分别为第一个目标地点数据对应的目标时间数据、第二个目标地点数据对应的目标时间数据和第n个目标地点数据对应的目标时间数据。
4.如权利要求3所述的基于行为轨迹的数据推送方法,其特征在于,还包括:
判断所述目标用户是否为特殊用户;及
如果所述目标用户为特殊用户时,则通过预定的规则计算未出现的地点的向量。
5.如权利要求1所述的基于行为轨迹的数据推送方法,其特征在于,还包括:训练召回模型的步骤:
获取多个用户对应的多个历史行为数据;
根据所述多个历史行为数据提取每个用户的轨迹特征向量;
将多个轨迹特征向量作为预先获取的待训练召回模型的输入,与每个轨迹特征向量具有相似轨迹的轨迹特征向量作为所述待训练召回模型的输出,来对所述待训练召回模型进行训练,直至损失函数收敛;
将每个轨迹特征向量作为训练后的待训练召回模型的输入,以获得与每个轨迹特征向量对应的多个相识轨迹特征向量;及
判断每个轨迹特征向量召回的相识轨迹特征向量的准确率及召回率是否达到检测准确阈值及检测召回阈值,若达到,则训练后的待训练召回模型则为初始召回模型。
6.一种基于行为轨迹的数据推送系统,其特征在于,包括:
接收模块,用于接收目标用户通过目标用户终端触发的数据推送指令;
获取模块,用于根据所述数据推送指令从行为日志系统中获取目标用户的目标历史行为数据;
构建模块,用于根据所述目标历史行为数据的构建所述目标用户的目标轨迹图;
提取模块,用于根据所述目标轨迹图提取所述目标用户的目标轨迹特征向量;
召回模块,用于将所述目标轨迹特征向量输入到召回模型中,以通过所述召回模型从多个用户中召回多个初始推送数据;
分类模块,用于将所述多个初始推送数据输入到所述分类模型中;
排序模块,用于通过所述分类模型对所述多个初始推送数据进行关联关系排序,以得到多个目标推送数据;及
推送模块,用于将所述多个目标推送数据推送到前端进行展示。
7.如权利要求6所述的基于行为轨迹的数据推送系统,其特征在于,所述构建模块,还用于:
从所述目标历史行为数据中获取多个目标地点数据:l1、l2、l3...ln和所述多个目标地点数据对应的多个目标时间数据:t1、t2、t3...tn;及
根据所述多个目标时间数据的时间顺序为所述目标用户u构建目标轨迹图:Cu={(u,t1,l1),(u,t2,l2)...(u,tn,ln)},其中,l1、l2和ln分别为第一个目标地点数据、第二个目标地点数据和第n个目标地点数据,t1、t2和tn分别为第一个目标地点数据对应的目标时间数据、第二个目标地点数据对应的目标时间数据和第n个目标地点数据对应的目标时间数据。
9.一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的基于行为轨迹的数据推送方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如权利要求1至5中任一项所述的基于行为轨迹的数据推送方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010588495.XA CN111753214B (zh) | 2020-06-24 | 2020-06-24 | 基于行为轨迹的数据推送方法、系统和计算机设备 |
PCT/CN2021/097278 WO2021259007A1 (zh) | 2020-06-24 | 2021-05-31 | 基于行为轨迹的数据推送方法、系统和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010588495.XA CN111753214B (zh) | 2020-06-24 | 2020-06-24 | 基于行为轨迹的数据推送方法、系统和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111753214A true CN111753214A (zh) | 2020-10-09 |
CN111753214B CN111753214B (zh) | 2024-07-19 |
Family
ID=72677088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010588495.XA Active CN111753214B (zh) | 2020-06-24 | 2020-06-24 | 基于行为轨迹的数据推送方法、系统和计算机设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111753214B (zh) |
WO (1) | WO2021259007A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021259007A1 (zh) * | 2020-06-24 | 2021-12-30 | 平安科技(深圳)有限公司 | 基于行为轨迹的数据推送方法、系统和计算机设备 |
CN113868532A (zh) * | 2021-09-30 | 2021-12-31 | 北京百度网讯科技有限公司 | 一种地点推荐方法、装置、电子设备及存储介质 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114418093B (zh) * | 2022-01-19 | 2023-08-25 | 北京百度网讯科技有限公司 | 训练路径表征模型、输出信息的方法和装置 |
CN114785852B (zh) * | 2022-04-07 | 2024-04-09 | 北京达佳互联信息技术有限公司 | 一种推送内容确定方法、装置、电子设备及存储介质 |
CN114925920B (zh) * | 2022-05-25 | 2024-05-03 | 中国平安财产保险股份有限公司 | 离线位置预测方法、装置、电子设备及存储介质 |
CN116049565A (zh) * | 2022-09-15 | 2023-05-02 | 亢颖灏 | 基于人工智能的兴趣轨迹追踪方法及大数据服务系统 |
CN117975071B (zh) * | 2024-03-28 | 2024-06-18 | 浙江大华技术股份有限公司 | 图像聚类方法、计算机设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108335138A (zh) * | 2018-02-01 | 2018-07-27 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN109242553A (zh) * | 2018-08-22 | 2019-01-18 | 平安科技(深圳)有限公司 | 一种用户行为数据推荐方法、服务器及计算机可读介质 |
CN109934704A (zh) * | 2019-03-22 | 2019-06-25 | 深圳乐信软件技术有限公司 | 信息推荐方法、装置、设备和存储介质 |
CN110781342A (zh) * | 2019-10-09 | 2020-02-11 | 上海麦克风文化传媒有限公司 | 一种基于用户行为序列和数据融合的推荐系统召回方法及系统 |
CN111061946A (zh) * | 2019-11-15 | 2020-04-24 | 汉海信息技术(上海)有限公司 | 场景化内容推荐方法、装置、电子设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015188324A1 (zh) * | 2014-06-11 | 2015-12-17 | 华为技术有限公司 | 移动终端位置预测方法及装置 |
CN105279207B (zh) * | 2014-07-25 | 2019-04-30 | 腾讯科技(深圳)有限公司 | 一种用户推荐方法、装置和系统 |
CN106022934A (zh) * | 2016-05-05 | 2016-10-12 | 北京邮电大学 | 一种基于移动轨迹模式的潜在好友发现方法及系统 |
CN108733692A (zh) * | 2017-04-18 | 2018-11-02 | 腾讯科技(深圳)有限公司 | 一种社交信息推荐方法和装置 |
CN111753214B (zh) * | 2020-06-24 | 2024-07-19 | 平安科技(深圳)有限公司 | 基于行为轨迹的数据推送方法、系统和计算机设备 |
-
2020
- 2020-06-24 CN CN202010588495.XA patent/CN111753214B/zh active Active
-
2021
- 2021-05-31 WO PCT/CN2021/097278 patent/WO2021259007A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108335138A (zh) * | 2018-02-01 | 2018-07-27 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN109242553A (zh) * | 2018-08-22 | 2019-01-18 | 平安科技(深圳)有限公司 | 一种用户行为数据推荐方法、服务器及计算机可读介质 |
CN109934704A (zh) * | 2019-03-22 | 2019-06-25 | 深圳乐信软件技术有限公司 | 信息推荐方法、装置、设备和存储介质 |
CN110781342A (zh) * | 2019-10-09 | 2020-02-11 | 上海麦克风文化传媒有限公司 | 一种基于用户行为序列和数据融合的推荐系统召回方法及系统 |
CN111061946A (zh) * | 2019-11-15 | 2020-04-24 | 汉海信息技术(上海)有限公司 | 场景化内容推荐方法、装置、电子设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021259007A1 (zh) * | 2020-06-24 | 2021-12-30 | 平安科技(深圳)有限公司 | 基于行为轨迹的数据推送方法、系统和计算机设备 |
CN113868532A (zh) * | 2021-09-30 | 2021-12-31 | 北京百度网讯科技有限公司 | 一种地点推荐方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111753214B (zh) | 2024-07-19 |
WO2021259007A1 (zh) | 2021-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753214B (zh) | 基于行为轨迹的数据推送方法、系统和计算机设备 | |
Li et al. | Multiple location profiling for users and relationships from social network and content | |
CN107798557B (zh) | 电子装置、基于lbs数据的服务场所推荐方法及存储介质 | |
Xiao et al. | Inferring social ties between users with human location history | |
Yin et al. | Modeling location-based user rating profiles for personalized recommendation | |
Vu et al. | Travel diaries analysis by sequential rule mining | |
CN105532030B (zh) | 用于分析目标实体的移动的装置、系统和方法 | |
Wan et al. | A hybrid ensemble learning method for tourist route recommendations based on geo-tagged social networks | |
Zhang et al. | Distance and friendship: A distance-based model for link prediction in social networks | |
Yamaguchi et al. | Landmark-based user location inference in social media | |
CN112861972B (zh) | 一种展业区域的选址方法、装置、计算机设备和介质 | |
US11341109B2 (en) | Method and system for detecting and using locations of electronic devices of users in a specific space to analyze social relationships between the users | |
CN113139140B (zh) | 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法 | |
CN109891190B (zh) | 基于衍生社交网络对个人进行地理定位 | |
CN107291784B (zh) | 地理围栏类别的获取方法、装置及业务设备 | |
Tang et al. | Discovering Travel Community for POI Recommendation on Location‐Based Social Networks | |
Wachtel et al. | Planning for tourist urban evacuation routes: A framework for improving the data collection and evacuation processes | |
Luan et al. | Collaborative tensor factorization and its application in POI recommendation | |
JPWO2019234827A1 (ja) | 情報処理装置、判定方法、及びプログラム | |
US20140046727A1 (en) | Method, device, and system for generating online social community profiles | |
Ashley-Dejo et al. | A context-aware proactive recommender system for tourist | |
CN111951351B (zh) | 一种位置热力图的生成方法、装置、电子设备及存储介质 | |
CN113987333A (zh) | 一种目的地区域的推荐方法和装置 | |
Kim et al. | Personalized POI embedding for successive POI recommendation with large-scale smart card data | |
Han et al. | Tourism2vec: An Adaptation of Word2vec to Investigate Tourism Spatio-Temporal Behaviour |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |