CN109670853B - 用户特征数据的确定方法、装置、设备及可读存储介质 - Google Patents

用户特征数据的确定方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN109670853B
CN109670853B CN201811128667.4A CN201811128667A CN109670853B CN 109670853 B CN109670853 B CN 109670853B CN 201811128667 A CN201811128667 A CN 201811128667A CN 109670853 B CN109670853 B CN 109670853B
Authority
CN
China
Prior art keywords
poi
pois
user
determining
preset period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811128667.4A
Other languages
English (en)
Other versions
CN109670853A (zh
Inventor
蔡健
张海文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811128667.4A priority Critical patent/CN109670853B/zh
Publication of CN109670853A publication Critical patent/CN109670853A/zh
Application granted granted Critical
Publication of CN109670853B publication Critical patent/CN109670853B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种用户特征数据的确定方法、装置、设备及可读存储介质,所述方法包括:读取用户在预设周期内去各种类型POI的POI概率,并根据各POI概率,确定用户在预设周期内去各种类型POI的POI频次值;统计在预设周期内去各种类型POI的第一总人数,以及去所有类型POI的第二总人数,根据各第一总人数和第二总人数,确定在预设周期内去各种类型POI的POI均值;根据各POI频次值和各POI均值,确定用户在预设周期内去各种类型POI的特性系数,并根据各特性系数确定用户特征数据。本方案由特性系数确定的特征数据形成用户和大众区别的个性化数据,可准确反映用户的个性需求,提高了用户特征数据的精准性。

Description

用户特征数据的确定方法、装置、设备及可读存储介质
技术领域
本发明主要涉及信息技术领域,具体地说,涉及一种用户特征数据的确定方法、装置、设备及可读存储介质。
背景技术
目前各企业在进行产品营销时,为了实现精准营销,通常结合用户的特征数据进行,向用户推荐由特征数据所表征的用户感兴趣类型的产品信息和/或避免向用户推荐其不感兴趣类型的产品信息,以满足用户的个性需求,避免用户错过其感兴趣类型的产品信息。因满足用户个性需求的产品信息推荐,与用户特征数据的精准性具有很大的相关性,使得所确定的用户特征数据的精准性在产品信息推荐过程中占有非常重要的地位。现有技术中所确定的用户特征数据,在使用过程中并不能满足预期的精准性需求,如何提升所确定用户特征数据的精准性是现有技术中亟待解决的技术问题。
发明内容
本发明的主要目的是提供一种用户特征数据的确定方法、装置、设备及可读存储介质,旨在解决现有技术中所确定的用户特征数据的精准性较低的问题。
为实现上述目的,本发明提供一种用户特征数据的确定方法,所述用户特征数据的确定方法包括以下步骤:
读取用户在预设周期内去各种类型POI的POI概率,并根据各所述POI概率,确定所述用户在所述预设周期内去各种类型POI的POI频次值;
统计在所述预设周期内去各种类型POI的第一总人数,以及去所有类型POI的第二总人数,根据各所述第一总人数和所述第二总人数,确定在所述预设周期内去各种类型POI的POI均值;
根据各所述POI频次值和各所述POI均值,确定所述用户在所述预设周期内去各种类型POI的特性系数,并根据各所述特性系数确定用户特征数据。
优选地,所述根据各所述POI概率,确定所述用户在所述预设周期内去各种类型POI的POI频次值的步骤包括:
对各所述POI概率进行累加,生成所述用户在所述预设周期内去所有类型POI的POI总概率;
将各所述POI概率依次和所述POI总概率做比值,生成所述用户在所述预设周期内去各种类型POI的POI频次值。
优选地,所述根据各所述第一总人数和所述第二总人数,确定在所述预设周期内去各种类型POI的POI均值的步骤包括:
将各所述第一总人数依次和所述第二总人数形成多个人数组,并将多个所述人数组依次传输到预设公式中,生成在所述预设周期内去各种类型POI的POI均值;
其中,所述预设公式为:yi=log(a/(x i+1));
其中,y表示POI均值、x表示第一总人数、a表示第二总人数、log表示对数运算、i表示各个POI类型,且取值为自然数。
优选地,所述根据各所述POI频次值和各所述POI均值,确定所述用户在所述预设周期内去各种类型POI的特性系数的步骤包括:
读取各所述POI频次值中的第一标识符和各所述POI均值中的第二标识符,并当所述第一标识符和所述第二标识符一致时,将所述第一标识符和所述第二标识符确定为目标标识符;
将与所述目标标识符对应的所述POI频次值以及所述POI均值形成类型组,并将各所述类型组中的所述POI频次值和所述POI均值做乘积,生成所述用户在所述预设周期内去各种类型POI的特性系数。
优选地,所述根据各所述特性系数确定用户特征数据的步骤包括:
将各所述特性系数按照数值大小进行排序,确定排列在预设位的目标特性系数;
读取各所述目标特性系数对应POI类型所具有的属性数据,并将所述属性数据确定为所述用户的特征数据。
优选地,所述读取用户在预设周期内去各种类型POI的POI概率的步骤之前包括:
读取所述用户在预设周期内各个子周期去各种类型POI的POI子概率,以及各所述POI子概率中所携带的类型标识符;
对具有相同所述类型标识符的所述POI子概率进行累加,生成所述用户在预设周期内去各种类型POI的POI概率,并存储各所述POI概率。
优选的,所述读取所述用户在预设周期内各个子周期去各种类型POI的POI子概率的步骤之前包括:
读取所述用户在预设周期内各个子周期的位置信息,并统计以各所述位置信息为中心的预设范围内的POI;
根据各所述POI的类型,确定用户从各子周期的各位置信息去各类所述POI的POI子概率,并存储各所述POI子概率。
此外,为实现上述目的,本发明还提出一种用户特征数据的确定装置,所述用户特征数据的确定装置包括:
读取模块,用于读取用户在预设周期内去各种类型POI的POI概率,并根据各所述POI概率,确定所述用户在所述预设周期内去各种类型POI的POI频次值;
统计模块,用于统计在所述预设周期内去各种类型POI的第一总人数,以及去所有类型POI的第二总人数,根据各所述第一总人数和所述第二总人数,确定在所述预设周期内去各种类型POI的POI均值;
确定模块,用于根据各所述POI频次值和各所述POI均值,确定所述用户在所述预设周期内去各种类型POI的特性系数,并根据各所述特性系数确定用户特征数据。
此外,为实现上述目的,本发明还提出一种用户特征数据的确定设备,所述用户特征数据的确定设备包括:存储器、处理器、通信总线以及存储在所述存储器上的用户特征数据的确定程序;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行所述用户特征数据的确定程序,以实现以下步骤:
读取用户在预设周期内去各种类型POI的POI概率,并根据各所述POI概率,确定所述用户在所述预设周期内去各种类型POI的POI频次值;
统计在所述预设周期内去各种类型POI的第一总人数,以及去所有类型POI的第二总人数,根据各所述第一总人数和所述第二总人数,确定在所述预设周期内去各种类型POI的POI均值;
根据各所述POI频次值和各所述POI均值,确定所述用户在所述预设周期内去各种类型POI的特性系数,并根据各所述特性系数确定用户特征数据。
此外,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序可被一个或者一个以上的处理器执行以用于:
读取用户在预设周期内去各种类型POI的POI概率,并根据各所述POI概率,确定所述用户在所述预设周期内去各种类型POI的POI频次值;
统计在所述预设周期内去各种类型POI的第一总人数,以及去所有类型POI的第二总人数,根据各所述第一总人数和所述第二总人数,确定在所述预设周期内去各种类型POI的POI均值;
根据各所述POI频次值和各所述POI均值,确定所述用户在所述预设周期内去各种类型POI的特性系数,并根据各所述特性系数确定用户特征数据。
本实施例的用户特征数据的确定方法,先根据用户在预设周期内去各种类型POI的POI概率,确定用户在预设周期内去各种类型POI的POI频次值;各种类型POI反映了用户的不同需求,所确定的各POI频次值反映用户在预设周期内去各种类型POI的频次大小,即说明用户对各类POI的需求大小,其中需求越大的POI越能反映用户的特征;再根据统计的预设周期内去各种类型POI的第一总人数以及去所有类型POI的第二总人数,确定预设周期内去各种类型POI的POI均值;此POI均值反映了在预设周期内,去各种类型POI人数所占去所有类型POI人数的比率,当某类POI的比率越低,则说明很少有人去此类POI;而若用户在此类POI的频次很高,则判定用户和大众对此类POI的需求不一样,此类POI可用于反映用户的特征;从而根据用户去各类POI频次值和各POI均值,确定用户在预设周期内去各种类型POI的特性系数,用此特性系数表征用户和大众对各类POI的需求程度;进而从各特性系数中确定用户的特征数据,即将各特性系数中表征用户和大众所需求POI类型一样的特性系数剔除,而从表征不一样POI类型的特性系数中确定用户的特征数据;使得确定的特征数据形成用户和大众区别的个性化数据,可准确反映用户的个性需求,提高了用户特征数据的精准性。
附图说明
图1是本发明的用户特征数据的确定方法第一实施例的流程示意图;
图2是本发明的用户特征数据的确定方法第二实施例的流程示意图;
图3是本发明的用户特征数据的确定方法第三实施例的流程示意图;
图4是本发明的用户特征数据的确定装置第一实施例的功能模块示意图;
图5是本发明实施例方法涉及的硬件运行环境的设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种用户特征数据的确定方法。
请参照图1,图1为本发明用户特征数据的确定方法第一实施例的流程示意图。在本实施例中,所述用户特征数据的确定方法包括:
步骤S10,读取用户在预设周期内去各种类型POI的POI概率,并根据各所述POI概率,确定所述用户在所述预设周期内去各种类型POI的POI频次值;
本发明的用户特征数据的确定方法应用于服务器,适用于通过服务器确定表征用户个性化需求的特征数据。具体地,服务器中预先生成并存储有用户在预设周期内去各种类型POI的POI概率,POI(Point of Interest,兴趣点)是可以抽象为点的地理对象,尤其是一些与人们生活密切相关的地理实体,如学校、银行、餐馆、加油站、医院和超市等;用户去不同类型的POI反映了用户的不同需求,且需求大小由POI概率决定。服务器对用户在预设周期内的位置信息检测,确定位置信息周围所具有的POI,进而生成用户在预设周期内去各类POI的POI概率。其中预设周期为预先设置的一段时间范围,且为了使反映用户需求的特征信息更为准确,此预设周期通常为以天为单位的较长时间,以使各类POI概率依据用户多天内出行的位置信息生成,使得各类POI概率更为准确的反映用户需求。此预设周期可以是月、季、年等,优选为年;即在此以年作为预设周期的时间范围内实时检测用户的位置信息,通过一年内用户的各个位置信息,生成反映用户需求的各类POI概率。
在生成反映用户预设周期内对各类POI需求的POI概率后,因用户对各类POI需求的大小不一样,而使得所生成各类POI概率的大小不一样;对于用户需求高的POI类型,可能用户去具有此类POI的位置的次数较多,所生成的此类POI概率较大。但考虑到概率大的POI类型也可能是用户日常生活所必须去的POI,如餐馆;因用户可能每天都需要到餐馆用餐,而导致其POI类型为餐馆的POI概率较大,难以形成其与其他大众的个性化特征。从而为了更好的确定用户与其他大众的区别,本实施例对用户的各类POI概率进行归一化处理,其中归一化处理可依据TF-IDF(termfrequency–inversedocumentfrequency)进行,TF-IDF是一种统计方法,其主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现(IDF值高),则认为此词或者短语具有很好的类别区分能力,适合用来分类。本实施例用用户去各类POI概率以及去所有类型POI的总概率来反映用户对各类POI的需求大小,即TF。读取用户在预设周期内去各种类型POI的POI概率,并根据此各种类型POI概率,确定用户在预设周期内去各种类型POI的POI频次值,用POI频次值来表征用户对各类POI的需求大小,其中POI频次值越大,说明用户去此类POI的概率越大。因用户在预设周期内去到POI的类型有限,而使得去到所有类型POI的POI总概率有限;当某一类型POI的POI概率占POI总概率的比例较大时,则说明用户去此类型POI的概率较大,此各类型POI的POI概率在POI总概率的占比即为频次值。具体地,根据各POI概率,确定用户在预设周期内去各种类型POI的POI频次值的步骤包括:
步骤S11,对各所述POI概率进行累加,生成所述用户在所述预设周期内去所有类型POI的POI总概率;
可理解地,因频次值表征各类型POI的POI概率在POI总概率中的占比,而POI总概率为用户在预设周期内去所有类型POI的POI概率,从而将预设周期内各种类型POI的POI概率进行累加,累加所得到的结果即为用户在预设周期内去所有类型POI的POI总概率。如用户在预设周期内所去到的POI类型有a1、a2和a3,且对应的POI概率分别为b1、b2和b3,则其去所有类型POI的POI总概率为(b1+b2+b3)。
步骤S12,将各所述POI概率依次和所述POI总概率做比值,生成所述用户在所述预设周期内去各种类型POI的POI频次值。
进一步地,确定用户在预设周期内去所有类型POI的POI概率后,再用各类型POI的POI概率与此POI总概率做比值,比值的结果即为用户在预设周期内去各种类型POI的POI频次值。即各种类型POI的POI频次值可用公式(1)进行表示:
其中,k表示POI频次值、x表示POI概率、j表示所有POI的类型、i表示各POI的类型,且i的取值为自然数。
如对于上述POI类型a1、a2、a3,则a1的频次值k1=(b1)/(b1+b2+b3),a2的频次值k2=(b2)/(b1+b2+b3),a3的频次值k3=(b3)/(b1+b2+b3)。因POI总概率(b1+b2+b3)一定,使得各类型POI的POI频次值与各类型POI的POI概率正相关,POI概率越大的POI类型,所具有的POI频次值也越大,用户在预设周期内对此类POI的需求越大。
步骤S20,统计在所述预设周期内去各种类型POI的第一总人数,以及去所有类型POI的第二总人数,根据各所述第一总人数和所述第二总人数,确定在所述预设周期内去各种类型POI的POI均值;
进一步地,在依据TF-IDF对各类POI概率进行归一化处理的过程中,为了避免用户所去到的POI频次值大的POI类型为与大众一致的POI类型,还需要确定各种POI的IDF,因IDF其实质为表征去各类POI的人数多少,其中当去某一类POI的人数少,而用户在此类POI频次值高,则说明此类POI为用户区别与大众的个性化POI。本实施例用POI均值表示IDF,统计在预设周期内去各种类型POI的第一总人数,以及去所有类型POI的第二总人数;如POI类型包括C1、C2、C3、C4、C5,统计到一年时间内去C1、C2、C3、C4、C5类型POI的总人数为C,且去C1、C2、C3、C4、C5类型的人数分别为c1、c2、c3、c4、c5;则去C1类POI的第一总人数为c1,去C2类POI的第一总人数为c2,去C3类POI的第一总人数为c3,去C4类POI的第一总人数为c4,去C5类POI的第一总人数为c5,而第二总人数为C。需要说明的是,第二总人数中不包括去几类POI的重复人数部分,如对于POI类型p1和p2,去到p1类POI的总人数为5,而去到p2类POI的总人数为9,但去p1和p2的人数中有4个人是重复的,即去p1的5个人中存在4个人还去了p2中,使得去p1和p2类POI的第二总人数为5-4+9=10。通过此统计的各个第一总人数和第二总人数,进一步确定去各种类型POI的POI均值,以表征去各类POI的人数多少。具体地,根据各第一总人数和第二总人数,确定在预设周期内去各种类型POI的POI均值的步骤包括:
将各所述第一总人数依次和所述第二总人数形成多个人数组,并将多个所述人数组依次传输到预设公式中,生成在所述预设周期内去各种类型POI的POI均值;
其中,所述预设公式为:yi=log(a/(xi+1));
其中,y表示POI均值、x表示第一总人数、a表示第二总人数、log表示对数运算、i表示各个POI类型,且取值为自然数。
更进一步地,为了确定各种类型POI的POI均值,本实施例预先设置有预设公式,预设公式如公式(2)所示:
yi=log(a/(xi+1)) (2)
在公式(2)中,y表示POI均值、x表示第一总人数、a表示第二总人数、log表示对数运算、i表示各个POI类型,且取值为自然数。
先将统计所得到的各个第一总人数和第二总人数依次形成多个人数组,再将所形成的多个人数组依次传输到公式(2)中进行计算,计算所得到的结果即为各种类型POI的POI均值。如对于上述C1、C2、C3、C4、C5类型POI,所形成的人数组分别为[c1、C]、[c2、C]、[c3、C]、[c4、C]、[c5、C],将此人数组分别传输到公式(2)中,得到C1类POI的POI均值y1=log(C/(c1+1)),C2类POI的POI均值y2=log(C/(c2+1)),C3类POI的POI均值y3=log(C/(c3+1)),C4类POI的POI均值y4=log(C/(c4+1)),C5类POI的POI均值y5=log(C/(c5+1))。因去所有类型POI的第二总人数C一定,使得各类型POI的POI均值与去各类型POI的第一总人数相关。因在底数为10的对数运算中,因变量与自变量为正相关,作为自变量的a/(xi+1)变大时,因变量y相应变大;而因第二总人数一定,使得第一总人数的数值越高,自变量的数值越小,第一总人数的数值越低,自变量的数值越大;即去某类POI的第一总人数越多时,此类POI的POI均值越小,表征去此类POI的大众人数越多;而去某类POI的第一总人数越少时,此类POI的POI均值越大,表征去此类POI的大众人数越少。
步骤S30,根据各所述POI频次值和各所述POI均值,确定所述用户在所述预设周期内去各种类型POI的特性系数,并根据各所述特性系数确定用户特征数据。
进一步地,在确定预设周期内用户去各类POI的POI频次值,表征用户去各类POI的需求大小,以及大众去各类POI的POI均值,表征去各类POI的大众人数后,通过此各个POI频次值以及各个POI均值,可确定用户在预设周期内去各种类型POI的特性系数,表征用户和大众对各类POI的需求程度。当用户去某一类型POI的POI频次值较大,表征用户去此类POI的需求较大;而大众去此类POI的POI均值越大,表征去此类POI的大众人数较小时;则说明由此类POI的POI频次值以及POI均值所确定的特性系数,可反映用户的个性化特征,从而依据此特性系数确定用户的特征数据。因其他大众并不具有此特征数据,可准确体现用户的个性需求,此特征数据具有很高的精准性。
本实施例的用户特征数据的确定方法,先根据用户在预设周期内去各种类型POI的POI概率,确定用户在预设周期内去各种类型POI的POI频次值;各种类型POI反映了用户的不同需求,所确定的各POI频次值反映用户在预设周期内去各种类型POI的频次大小,即说明用户对各类POI的需求大小,其中需求越大的POI越能反映用户的特征;再根据统计的预设周期内去各种类型POI的第一总人数以及去所有类型POI的第二总人数,确定预设周期内去各种类型POI的POI均值;此POI均值反映了在预设周期内,去各种类型POI人数所占去所有类型POI人数的比率,当某类POI的比率越低,则说明很少有人去此类POI;而若用户在此类POI的频次很高,则判定用户和大众对此类POI的需求不一样,此类POI可用于反映用户的特征;从而根据用户去各类POI频次值和各POI均值,确定用户在预设周期内去各种类型POI的特性系数,用此特性系数表征用户和大众对各类POI的需求程度;进而从各特性系数中确定用户的特征数据,即将各特性系数中表征用户和大众所需求POI类型一样的特性系数剔除,而从表征不一样POI类型的特性系数中确定用户的特征数据;使得确定的特征数据形成用户和大众区别的个性化数据,可准确反映用户的个性需求,提高了用户特征数据的精准性。
进一步地,在本发明用户特征数据的确定方法另一实施例中,所述根据各所述POI频次值和各所述POI均值,确定所述用户在所述预设周期内去各种类型POI的特性系数的步骤包括:
步骤S31,读取各所述POI频次值中的第一标识符和各所述POI均值中的第二标识符,并当所述第一标识符和所述第二标识符一致时,将所述第一标识符和所述第二标识符确定为目标标识符;
可理解地,用户所可能去到的POI类型以及市面上所具有的POI类型均众多,在根据各POI频次值以及各POI均值,确定用户去各类POI特性系数时,需要POI频次值与POI均值均针对同一类型POI;即表征用户去某一类型POI需求大小的POI频次值,以及表征去某一类型POI的大众人数的POI均值,所针对的POI类型为相同的类型。为了确保POI频次值和POI均值针对同一类型POI,针对不同类型的POI设置有不同的标识符,且各类型POI频次值用第一标识符表示,如f1、f2、f3等,各类型的POI均值用第二标识符表示,如g1、g2、g3等,且第一标识符和第二标识符之间设置有对应关系,以表征两者为同一类型POI,如f1与g1对应表征同一类型POI的POI频次值以及POI均值。读取各类型POI频次值中的第一标识符以及各类型POI均值中的第二标识符,并将各个第一标识符依次和第二标识符对比,确定与各个第一标识符具有对应关系的第二标识符。在将第一标识符和第二标识符确定为具有对应关系时,将此第一标识符和第二标识符判断为一致,而将两者确定为目标标识符。如第一标识符和第二标识符之间的对应关系为f1与g1对应、f2与g2对应、f3与g3对应、f4与g4对应、f5与g5对应、f6与g6对应;在读取到第一标识符为f3和f6,第二标识符为g3和g6时,先将f3与g3对比,因f3与g3具有对应关系,而判定两者一致,将两者确定为目标标识符;再将f6与g3对比,因f6与g3不具有对应关系,而判定两者不一致,继续将f6与g6对比,因f6与g6具有对应关系,而判定两者一致,将两者确定为目标标识符。
步骤S32,将与所述目标标识符对应的所述POI频次值以及所述POI均值形成类型组,并将各所述类型组中的所述POI频次值和所述POI均值做乘积,生成所述用户在所述预设周期内去各种类型POI的特性系数。
进一步地,在由第一标识符和第二标识符确定目标标识符之后,将与目标标识符对应的POI频次值以及POI均值形成类型组,即将作为目标标识符的第一标识符对应的POI频次值,以及作为目标标识符的第二标识符对应的POI均值形成类型组;并将各类型组中的POI频次值和POI均值做乘积,乘积所得的结果即为用户在预设周期内去各种类型POI的特性系数。即各种类型POI的特性系数可用公式(3)进行表示:
mi=ki×yi (3)
其中,m表示特性系数、k表示POI频次值、y表示POI均值、i表示各个POI类型,且取值为自然数。
如对于上述目标标识符f3与g3、f6与g6,对应的POI频次值分别为F3和F6,对应的POI均值分别为G3和G6,所形成的的类型组为[F3、G3]和[F6、G6],则对应的特性系数分别为F3*G3和F6*G6。
进一步地,在本发明用户特征数据的确定方法另一实施例中,所述根据各所述特性系数确定用户特征数据的步骤包括:
步骤S33,将各所述特性系数按照数值大小进行排序,确定排列在预设位的目标特性系数;
可理解地,因用户去各类POI的需求大小不一样,且去各类POI的大众人数也不一样,即各POI频次值、各POI均值均不一样,而使得所生成的用户去各类型POI的特性系数存在差异。考虑到某类POI频次值越大说明用户去此类POI的需求越大,而某类POI均值越大说明去此类POI的大众人数越少。从而当某类POI的POI频次值越大、且POI均值也越大时,两者相乘所得到的特性系数越大;表征用户对此类POI的需求较大,而大众对此类POI的需求较小。在生成表征用户和大众去各类POI需求大小的各个特性系数后,将各个特性系数按照数值的大小进行排序,并预先设置预设位,此预设位表征用户所涉及的各类POI中,占用户需求较大的几类。将在排序中排列在前预设位的特性系数确定为目标特性系数,以表征用户和大众的需求差异性。如设定预设位为3,而特性系数的数值大小排列顺序为m5、m2、m3、m8、m6···,则将m5、m2和m3确定为目标特性系数。因各特性系数由各类型POI的POI频次值和POI均值相乘生成,若某类POI的POI频次值和POI均值均大,表征用户对此类POI的需求较大,而大众对此类POI的需求较小时,则此两者相乘的特性系数也大;如当POI频次值为0.7,而POI均值为8,则特性系数为5.6,若其排序在预设位之内,则可将此作为目标特性系数。但当某类POI的的POI频次值小,而POI均值大,表征用户对此类POI的需求较小,而大众对此类POI的需求也小时,则此两者相乘的特性系数与POI频次值和POI均值均大的POI类型的特性系数之间的大小关系具有不确定性;如当POI频次值为0.2,而POI均值为40,则特性系数为8。此时虽然用户去此类POI的需求较小,但去类型POI的大众更少,使得两者的乘积的特性系数大于POI频次值和POI均值均大的POI类型的乘积特性系数,从而仍然可用此POI的特性系数作为用户的目标特性系数。
步骤S34,读取各所述目标特性系数对应POI类型所具有的属性数据,并将所述属性数据确定为所述用户的特征数据。
进一步地,因特性系数由某一类型POI的POI频次值以及POI均值生成,与用户所去的POI类型相关;所确定的表征用户和大众需求差异性的目标特性系数相应的由POI频次值和POI均值生成,而可将具有此POI频次值和POI均值的POI类型作为目标特性系数对应的POI类型。不同的POI类型具有不同的属性数据,如餐厅类型POI的属性数据包括菜系、价位、位置等,护肤品类型POI的属性数据包括类型、价位、国别等。读取与各目标特性系数对应POI类型所具有的属性数据,此属性数据可表征用户的需求特征;如属性数据为对应健身房类型POI的数据,则说明用户比较注重健康或体型,若属性数据中的价位较高,则表明用户的经济实力较好等;将属性数据确定为用户的特征数据,以表征用户的特征需求。进而可根据此特征数据所表征的用户特征实现用户的精准营销,更好的向用户推荐其所需求的产品。
进一步地,请参照图2,在本发明用户特征数据的确定方法第一实施例的基础上,提出本发明用户特征数据的确定方法第二实施例,在第二实施例中,所述读取用户在预设周期内去各种类型POI的POI概率的步骤之前包括:
步骤S40,读取所述用户在预设周期内各个子周期去各种类型POI的POI子概率,以及各所述POI子概率中所携带的类型标识符;
可理解地,因各类POI概率依据用户在预设周期内的各个位置信息进行生成,且预设周期是预先设定的一段时间范围,考虑到用户在各时间范围中所去到的位置虽然不完全相同,却具有相似性,如工作日早上从居住地到工作地的上班路线中的位置信息,或者休息日下午去超市购物、健身房的位置信息等。从而为了在预设周期中准确的检测用户的位置信息,可将预设周期划分为多个子周期,在各个子周期中检测用户的位置信息,并生成用户去各位置信息周围POI的POI子概率。具体地,在将预设周期划分为多个子周期时,可按照星期划分,也可以按照月份划分、或者按照天划分;考虑到用户在预设周期中的位置相似性主要以天为单位进行周期性相似,从而子周期优选为以天为单位划分;即按照每天的日期界限将一年划分为多天,使一个子周期与一天对应,生成用户每天去各种类型POI的POI子概率。同时针对不同类型POI设置有不同的类型标识符,在生成各类POI子概率的过程中,为各类POI子概率添加类型标识符,以区分各类POI的POI子概率。当用户在预设周期中所有子周期去各种类型POI的POI子概率均生成完成后,读取此各个POI子概率,以及各个POI子概率中所携带的类型标识符,以通过类型标识符确定各子周期中各类POI所对应的POI子概率大小。
步骤S50,对具有相同所述类型标识符的所述POI子概率进行累加,生成用所述户在预设周期内去各种类型POI的POI概率,并存储各所述POI概率。
进一步地,因用户在预设周期去各类POI的POI概率其实质为各子周期去各类POI的POI子概率之和,从而在读取到用户在各子周期去各类POI的POI子概率以及各子概率所携带的类型标识符之后,相同的类型标识符表示POI类型相同,从而将具有相同类型标识符的POI子概率累加,累加所得到的结果即为用户在预设周期内去各种类型POI的POI概率。如对于子周期M1和M2,用户在此M1和M2中所去到的POI类型分别为[p1、p2、q1、q2]和[p1、q1、q2],对应的子概率分别为[w1、w2、w3、w4]和[w5、w6、w7];且p1、p2、q1和q2所携带的类型标识符分别为f1、f2、f1和f3;从而使得子周期M1中包括3种类型POI,其中p1和q1属于同一类型,POI子概率累加为w1+w3;子周期M2包括2种类型POI,其中p1和q1属于同一类型,POI子概率累加为w5+w6。使得在子周期M1和M2中,具有类型标识符f1的POI子概率为W1+W3+W5+W6,具有类型标识符f2的POI子概率为w2,具有类型标识符f3的POI子概率为w4+w7,依次对各子周期中的各子概率进行累加,生成用户在预设周期内去各种类型POI的POI概率。将此累加所生成的各POI概率进行存储,以便后续根据此各POI概率确定用户去各种类型POI的POI频次值;且在存储的过程中依据各类POI所具有的类型标识符,为各类POI概率添加类型标识符,以区分各POI概率所属的POI类型。
进一步地,请参照图3,在本发明用户特征数据的确定方法第二实施例的基础上,提出本发明用户特征数据的确定方法第三实施例,在第三实施例中,所述读取所述用户在预设周期内各个子周期去各种类型POI的POI子概率的步骤之前包括:
步骤S60,读取所述用户在预设周期内各个子周期的位置信息,并统计以各所述位置信息为中心的预设范围内的POI;
可理解,不同位置周围所具有的POI不相同,且用户在不同时间所去的位置不相同;从而在生成用户各子周期去各类型POI的POI子概率时,通过GPS(Global PositioningSystem,全球定位系统)定位服务或基站定位服务获取用户在预设周期中各个子周期的位置信息,并统计以各个位置信息为中心的预设范围内的POI。其中读取位置信息和统计POI操作可以是在子周期中的实时操作,也可以是在预设周期完成后的统一操作;对于实时操作,GPS或基站对用户的位置信息进行实时定位,并将所定位的位置信息进行存储;在各子周期中实时读取此定位的位置信息,统计以此位置信息为中心的预设范围内的POI;对于统一操作,则在预设周期的时间完成后,统一读取用户在各子周期所去到的位置信息,统计以各位置信息为中心的预设范围内的POI。考虑到虽然各位置信息周围的POI众多,但用户所去的POI有限,且距离各位置信息越远的POI,用户所去的可能性越小;从而预先根据多个历史数据中用户以位置信息为中心所去到POI的距离范围设定此预设范围,以使预设范围满足大部分人的出行需求。对各子周期位置信息的此预设范围内的POI统计,表征用户从各子周期的各位置信息对应位置所可能去到的各个POI。
步骤S70,根据各所述POI的类型,确定用户从各子周期的各位置信息去各类所述POI的POI子概率,并存储各所述POI子概率。
进一步地,对于在预设范围内的各个POI,用户可根据需求去到其需要去的POI,用户去各个POI的概率相同,且去各个POI的总概率之和为1;但是预设范围内可能涉及到多种类型的POI,使得用户去各种类型POI的概率不相同,且去各类型POI的概率由预设范围内各类型POI所具有的POI数量决定。从而在统计到各子周期各位置信息的预设范围内所具有的POI后,根据各POI的类型,确定用户在各子周期的各位置信息去各类POI的POI子概率。具体地,统计预设范围内各POI中为类型相同的POI数量,并用各类型POI的数量与预设范围内具有的POI总数量做比值,比值的结果即为用户从某一子周期的某位置信息去此位置信息预设范围内中各类POI的POI子概率;如某一子周期的某位置信息预设范围内有5个POI,则去各个POI的概率均为1/5,若5个POI中有2个属于同一类型,则用户去此类型POI的概率为2/5。依照此方式对用户从各子周期的各位置信息去到预设范围内各类POI的POI子概率进行计算,直到所有子周期的所有位置信息的预设范围内的各类POI子概率均经计算确定,同时在计算过程中为了对各种类型POI的POI子概率进行区分,对计算的各类POI子概率添加类型标识符。将此计算的用户从各子周期的各位置信息去预设范围内各类POI的POI子概率进行存储,以便后续根据此各POI子概率确定用户去各种类型POI的POI概率。
此外,考虑到预设范围内不同POI与位置信息之间的距离不一样,不同的距离对用户从位置信息去各POI的概率有影响;其中距离位置信息越远的POI,用户所去到的可能性越小,从而降低了用户去此POI的概率;使得用户从位置信息去各类POI的POI子概率除了与POI类型相关外还与各类POI和位置信息之间的距离相关。具体地,在确定POI子概率时,将预设范围划分为多个远近区域,不同远近区域与位置信息的距离不相同。因距离位置信息较近的远近区域,用户去到此区域的概率相对较大,而去到距离位置信息较远的远近区域的概率相对较小,从而依据远近区域与位置信息的距离关系,为各远近区域分配不同的区域概率,表征用户去预设范围内各远近区域的可能性大小。在确定预设范围内各远近区域的区域概率之后,在此各区域概率的基础上,进一步确定POI子概率。具体地,先统计位于远近区域内的POI中为相同类型的POI数量,并用各类型POI的数量与远近区域内具有的POI总数量做比值,再用比值的结果与远近区域所具有的区域概率相乘,相乘的结果即为用户在位置信息去远近区域中各类POI的POI子概率,再将预设范围内所有远近区域中各类POI的POI子概率相加,即为用户从位置信息去预设范围内各类型POI的POI子概率;依照此方式对用户从各子周期的各位置信息去到预设范围内各远近区域的各类POI的POI子概率进行计算,直到所有子周期的所有位置信息的预设范围内的各类POI子概率均经计算完成。通过将预范围继续细分为多个远近区域,使所确定的POI子概率更为准确,而更精准的反映了用户在各子周期中各位置信息的POI需求。
此外,请参照图4,本发明提供一种用户特征数据的确定装置,在本发明用户特征数据的确定装置第一实施例中,所述用户特征数据的确定装置包括:
读取模块10,用于读取用户在预设周期内去各种类型POI的POI概率,并根据各所述POI概率,确定所述用户在所述预设周期内去各种类型POI的POI频次值;
统计模块20,用于统计在所述预设周期内去各种类型POI的第一总人数,以及去所有类型POI的第二总人数,根据各所述第一总人数和所述第二总人数,确定在所述预设周期内去各种类型POI的POI均值;
确定模块30,用于根据各所述POI频次值和各所述POI均值,确定所述用户在所述预设周期内去各种类型POI的特性系数,并根据各所述特性系数确定用户特征数据。
本实施例的用户特征数据的确定装置,先由读取模块10根据用户在预设周期内去各种类型POI的POI概率,确定用户在预设周期内去各种类型POI的POI频次值;各种类型POI反映了用户的不同需求,所确定的各POI频次值反映用户在预设周期内去各种类型POI的频次大小,即说明用户对各类POI的需求大小,其中需求越大的POI越能反映用户的特征;再由统计模块20根据统计的预设周期内去各种类型POI的第一总人数以及去所有类型POI的第二总人数,确定预设周期内去各种类型POI的POI均值;此POI均值反映了在预设周期内,去各种类型POI人数所占去所有类型POI人数的比率,当某类POI的比率越低,则说明很少有人去此类POI;而若用户在此类POI的频次很高,则判定用户和大众对此类POI的需求不一样,此类POI可用于反映用户的特征;从而由确定模块30根据用户去各类POI频次值和各POI均值,确定用户在预设周期内去各种类型POI的特性系数,用此特性系数表征用户和大众对各类POI的需求程度;进而从各特性系数中确定用户的特征数据,即将各特性系数中表征用户和大众所需求POI类型一样的特性系数剔除,而从表征不一样POI类型的特性系数中确定用户的特征数据;使得确定的特征数据形成用户和大众区别的个性化数据,可准确反映用户的个性需求,提高了用户特征数据的精准性。
进一步地,在本发明用户特征数据的确定装置另一实施例中,所述读取模块包括:
累加单元,用于对各所述POI概率进行累加,生成所述用户在所述预设周期内去所有类型POI的POI总概率;
生成单元,用于将各所述POI概率依次和所述POI总概率做比值,生成所述用户在所述预设周期内去各种类型POI的POI频次值。
进一步地,在本发明用户特征数据的确定装置另一实施例中,所述统计模块包括:
传输单元,用于将各所述第一总人数依次和所述第二总人数形成多个人数组,并将多个所述人数组依次传输到预设公式中,生成在所述预设周期内去各种类型POI的POI均值;
其中,所述预设公式为:yi=log(a/(xi+1));
其中,y表示POI均值、x表示第一总人数、a表示第二总人数、log表示对数运算、i表示各个POI类型,且取值为自然数。
进一步地,在本发明用户特征数据的确定装置另一实施例中,所述确定模块包括:
读取单元,用于读取各所述POI频次值中的第一标识符和各所述POI均值中的第二标识符,并当所述第一标识符和所述第二标识符一致时,将所述第一标识符和所述第二标识符确定为目标标识符;
乘积单元,用于将与所述目标标识符对应的所述POI频次值以及所述POI均值形成类型组,并将各所述类型组中的所述POI频次值和所述POI均值做乘积,生成所述用户在所述预设周期内去各种类型POI的特性系数。
进一步地,在本发明用户特征数据的确定装置另一实施例中,所述确定模块还包括:
排序单元,用于将各所述特性系数按照数值大小进行排序,确定排列在预设位的目标特性系数;
确定单元,用于读取各所述目标特性系数对应POI类型所具有的属性数据,并将所述属性数据确定为所述用户的特征数据。
进一步地,在本发明用户特征数据的确定装置另一实施例中,所述用户特征数据的确定装置还包括:
第一获取模块,用于读取所述用户在预设周期内各个子周期去各种类型POI的POI子概率,以及各所述POI子概率中所携带的类型标识符;
生成模块,用于对具有相同所述类型标识符的所述POI子概率进行累加,生成所述用户在预设周期内去各种类型POI的POI概率,并存储各所述POI概率。
进一步地,在本发明用户特征数据的确定装置另一实施例中,所述用户特征数据的确定装置还包括:
第二获取模块,用于读取所述用户在预设周期内各个子周期的位置信息,并统计以各所述位置信息为中心的预设范围内的POI;
存储模块,用于根据各所述POI的类型,确定用户从各子周期的各位置信息去各类所述POI的POI子概率,并存储各所述POI子概率。
其中,上述用户特征数据的确定装置的各虚拟功能模块存储于图5所示用户特征数据的确定设备的存储器1005中,处理器1001执行用户特征数据的确定程序时,实现图4所示实施例中各个模块的功能。
参照图5,图5是本发明实施例方法涉及的硬件运行环境的设备结构示意图。
本发明实施例用户特征数据的确定设备可以是PC(personal computer,个人计算机),也可以是智能手机、平板电脑、电子书阅读器、便携计算机等终端设备。
如图5所示,该用户特征数据的确定设备可以包括:处理器1001,例如CPU(CentralProcessing Unit,中央处理器),存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM(random accessmemory,随机存取存储器),也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,该用户特征数据的确定设备还可以包括用户接口、网络接口、摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi(Wireless Fidelity,无线宽带)模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图5中示出的用户特征数据的确定设备结构并不构成对用户特征数据的确定设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图5所示,作为一种可读存储介质的存储器1005中可以包括操作系统、网络通信模块以及用户特征数据的确定程序。操作系统是管理和控制用户特征数据的确定设备硬件和软件资源的程序,支持用户特征数据的确定程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与用户特征数据的确定设备中其它硬件和软件之间通信。
在图5所示的用户特征数据的确定设备中,处理器1001用于执行存储器1005中存储的用户特征数据的确定程序,实现上述用户特征数据的确定方法各实施例中的步骤。
本发明提供了一种可读存储介质,所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述用户特征数据的确定方法各实施例中的步骤。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (6)

1.一种用户特征数据的确定方法,其特征在于,所述用户特征数据的确定方法包括以下步骤:
读取用户在预设周期内去各种类型兴趣点POI的POI概率,并根据各所述POI概率,确定所述用户在所述预设周期内去各种类型POI的POI频次值;
统计在所述预设周期内去各种类型POI的第一总人数,以及去所有类型POI的第二总人数,根据各所述第一总人数和所述第二总人数,确定在所述预设周期内去各种类型POI的POI均值,其中,第二总人数中不包括去相应类别 POI的重复人数部分;
根据各所述POI频次值和各所述POI均值,确定所述用户在所述预设周期内去各种类型POI的特性系数,并根据各所述特性系数确定用户特征数据;
所述根据各所述第一总人数和所述第二总人数,确定在所述预设周期内去各种类型POI的POI均值的步骤包括:
将各所述第一总人数依次和所述第二总人数形成多个人数组,并将多个所述人数组依次传输到预设公式中,生成在所述预设周期内去各种类型POI的POI均值;
其中,所述预设公式为:
其中,y表示POI均值、x表示第一总人数、a表示第二总人数、log表示对数运算、i表示各个POI类型,且取值为自然数;
所述根据各所述POI概率,确定所述用户在所述预设周期内去各种类型POI的POI频次值的步骤包括:
对各所述POI概率进行累加,生成所述用户在所述预设周期内去所有类型POI的POI总概率;
将各所述POI概率依次和所述POI总概率做比值,生成所述用户在所述预设周期内去各种类型POI的POI频次值;
所述根据各所述POI频次值和各所述POI均值,确定所述用户在所述预设周期内去各种类型POI的特性系数的步骤包括:
读取各所述POI频次值中的第一标识符和各所述POI均值中的第二标识符,并当所述第一标识符和所述第二标识符一致时,将所述第一标识符和所述第二标识符确定为目标标识符;
将与所述目标标识符对应的所述POI频次值以及所述POI均值形成类型组,并将各所述类型组中的所述POI频次值和所述POI均值做乘积,生成所述用户在所述预设周期内去各种类型POI的特性系数;
所述根据各所述特性系数确定用户特征数据的步骤包括:
将各所述特性系数按照数值大小进行排序,确定排列在预设位的目标特性系数;
读取各所述目标特性系数对应POI类型所具有的属性数据,并将所述属性数据确定为所述用户的特征数据。
2.如权利要求1所述的用户特征数据的确定方法,其特征在于,所述读取用户在预设周期内去各种类型POI的POI概率的步骤之前包括:
读取所述用户在预设周期内各个子周期去各种类型POI的POI子概率,以及各所述POI子概率中所携带的类型标识符;
对具有相同所述类型标识符的所述POI子概率进行累加,生成所述用户在预设周期内去各种类型POI的POI概率,并存储各所述POI概率。
3.如权利要求2所述的用户特征数据的确定方法,其特征在于,所述读取所述用户在预设周期内各个子周期去各种类型POI的POI子概率的步骤之前包括:
读取所述用户在预设周期内各个子周期的位置信息,并统计以各所述位置信息为中心的预设范围内的POI;
根据各所述POI的类型,确定用户从各子周期的各位置信息去各类所述POI的POI子概率,并存储各所述POI子概率。
4.一种用户特征数据的确定装置,其特征在于,所述用户特征数据的确定装置包括:
读取模块,用于读取用户在预设周期内去各种类型POI的POI概率,并根据各所述POI概率,确定所述用户在所述预设周期内去各种类型POI的POI频次值;
统计模块,用于统计在所述预设周期内去各种类型POI的第一总人数,以及去所有类型POI的第二总人数,根据各所述第一总人数和所述第二总人数,确定在所述预设周期内去各种类型POI的POI均值,其中,第二总人数中不包括去相应类别 POI的重复人数部分;
确定模块,用于根据各所述POI频次值和各所述POI均值,确定所述用户在所述预设周期内去各种类型POI的特性系数,并根据各所述特性系数确定用户特征数据;
所述用户特征数据的确定装置用于实现:
将各所述第一总人数依次和所述第二总人数形成多个人数组,并将多个所述人数组依次传输到预设公式中,生成在所述预设周期内去各种类型POI的POI均值;
其中,所述预设公式为:
其中,y表示POI均值、x表示第一总人数、a表示第二总人数、log表示对数运算、i表示各个POI类型,且取值为自然数;
所述用户特征数据的确定装置用于实现:
对各所述POI概率进行累加,生成所述用户在所述预设周期内去所有类型POI的POI总概率;
将各所述POI概率依次和所述POI总概率做比值,生成所述用户在所述预设周期内去各种类型POI的POI频次值;
所述根据各所述POI频次值和各所述POI均值,确定所述用户在所述预设周期内去各种类型POI的特性系数的步骤包括:
读取各所述POI频次值中的第一标识符和各所述POI均值中的第二标识符,并当所述第一标识符和所述第二标识符一致时,将所述第一标识符和所述第二标识符确定为目标标识符;
将与所述目标标识符对应的所述POI频次值以及所述POI均值形成类型组,并将各所述类型组中的所述POI频次值和所述POI均值做乘积,生成所述用户在所述预设周期内去各种类型POI的特性系数;
所述用户特征数据的确定装置用于实现:
将各所述特性系数按照数值大小进行排序,确定排列在预设位的目标特性系数;
读取各所述目标特性系数对应POI类型所具有的属性数据,并将所述属性数据确定为所述用户的特征数据。
5.一种用户特征数据的确定设备,其特征在于,所述用户特征数据的确定设备包括:存储器、处理器、通信总线以及存储在所述存储器上的用户特征数据的确定程序;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行所述用户特征数据的确定程序,以实现如权利要求1-3中任一项所述的用户特征数据的确定方法的步骤。
6.一种可读存储介质,其特征在于,所述可读存储介质上存储有用户特征数据的确定程序,所述用户特征数据的确定程序被处理器执行时实现如权利要求1-3中任一项所述的用户特征数据的确定方法的步骤。
CN201811128667.4A 2018-09-25 2018-09-25 用户特征数据的确定方法、装置、设备及可读存储介质 Active CN109670853B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811128667.4A CN109670853B (zh) 2018-09-25 2018-09-25 用户特征数据的确定方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811128667.4A CN109670853B (zh) 2018-09-25 2018-09-25 用户特征数据的确定方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN109670853A CN109670853A (zh) 2019-04-23
CN109670853B true CN109670853B (zh) 2023-09-19

Family

ID=66142638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811128667.4A Active CN109670853B (zh) 2018-09-25 2018-09-25 用户特征数据的确定方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN109670853B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399444A (zh) * 2019-07-24 2019-11-01 阿里巴巴集团控股有限公司 一种用户地理位置特征生成方法、装置及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391853A (zh) * 2014-09-25 2015-03-04 深圳大学 Poi推荐方法、poi信息处理方法及服务器
CN106777169A (zh) * 2016-12-21 2017-05-31 北京车网互联科技有限公司 一种基于车联网数据的用户出行喜好分析方法
CN107526800A (zh) * 2017-08-20 2017-12-29 平安科技(深圳)有限公司 信息推荐的装置、方法及计算机可读存储介质
CN108182253A (zh) * 2017-12-29 2018-06-19 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN108255980A (zh) * 2017-12-28 2018-07-06 百度在线网络技术(北京)有限公司 兴趣点采全率评估方法、装置、计算机设备及存储介质
CN108427679A (zh) * 2017-02-13 2018-08-21 腾讯科技(深圳)有限公司 一种人流分布处理方法及其设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391853A (zh) * 2014-09-25 2015-03-04 深圳大学 Poi推荐方法、poi信息处理方法及服务器
CN106777169A (zh) * 2016-12-21 2017-05-31 北京车网互联科技有限公司 一种基于车联网数据的用户出行喜好分析方法
CN108427679A (zh) * 2017-02-13 2018-08-21 腾讯科技(深圳)有限公司 一种人流分布处理方法及其设备
CN107526800A (zh) * 2017-08-20 2017-12-29 平安科技(深圳)有限公司 信息推荐的装置、方法及计算机可读存储介质
CN108255980A (zh) * 2017-12-28 2018-07-06 百度在线网络技术(北京)有限公司 兴趣点采全率评估方法、装置、计算机设备及存储介质
CN108182253A (zh) * 2017-12-29 2018-06-19 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置

Also Published As

Publication number Publication date
CN109670853A (zh) 2019-04-23

Similar Documents

Publication Publication Date Title
US11748379B1 (en) Systems and methods for generating and implementing knowledge graphs for knowledge representation and analysis
US11270324B2 (en) Location-based analytic platform and methods
CN112069281B (zh) 兴趣点位置的确定方法、装置、计算机设备及存储介质
US20180310121A1 (en) Branching mobile-device to system-namespace identifier mappings
CN105701108B (zh) 一种信息推荐方法、装置及服务器
CN110020221B (zh) 职住分布确认方法、装置、服务器及计算机可读存储介质
CN109658192A (zh) 一种房源推荐方法及服务器
CA3064137A1 (en) Method and device for recommending information
CN108182253B (zh) 用于生成信息的方法和装置
CN108446944B (zh) 一种常驻城市的确定方法、装置及电子设备
KR20180101472A (ko) 사용자가 위치되는 지리적 위치의 유형을 식별하기 위한 방법 및 디바이스
WO2019153889A1 (zh) 地理位置服务的实现
CN109711917B (zh) 信息推送方法和装置
CN111242709A (zh) 一种消息推送方法及其装置、设备、存储介质
CN112819544A (zh) 基于大数据的广告投放方法、装置、设备及存储介质
CN114581175A (zh) 商品推送方法、装置、存储介质及电子设备
CN104751345A (zh) 一种基于位置的数据处理方法以及装置
CN109685573A (zh) 一种商圈数据的处理方法、装置、电子设备和存储介质
CN115391666A (zh) 医院在线推荐方法、装置、计算机设备和存储介质
CN104135718B (zh) 一种位置信息的获取方法及装置
CN111538909A (zh) 一种信息推荐方法及装置
CN109670853B (zh) 用户特征数据的确定方法、装置、设备及可读存储介质
CN105681089B (zh) 网络用户行为聚类方法、装置及终端
US20200311761A1 (en) System and method for analyzing the effectiveness and influence of digital online content
WO2022196542A1 (ja) クラスタ生成装置、クラスタ生成方法及びクラスタ生成プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant