CN108664552A - 一种用户偏好挖掘方法及装置 - Google Patents
一种用户偏好挖掘方法及装置 Download PDFInfo
- Publication number
- CN108664552A CN108664552A CN201810284963.7A CN201810284963A CN108664552A CN 108664552 A CN108664552 A CN 108664552A CN 201810284963 A CN201810284963 A CN 201810284963A CN 108664552 A CN108664552 A CN 108664552A
- Authority
- CN
- China
- Prior art keywords
- user
- selection
- accounting
- selective type
- preference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种用户偏好挖掘方法及装置,应用于多用户平台,其中方法包括:根据多用户平台中在第一预设历史周期内多个用户的多条选择记录确定多用户平台对于每种选择类型的先验偏好;选择记录包括用户每次选择的选择类型;针对任一用户,获取用户在第二预设历史周期内的多条选择记录,根据用户在第二预设历史周期内的多条选择记录对每种选择类型的先验偏好进行修正,确定用户对每种选择类型的用户偏好值。先验偏好有利于提高对长尾用户偏好挖掘的准确性,用户偏好值对每一个用户更具有针对性,用户偏好挖掘结果既可以提高对长尾用户偏好挖掘的准确性,又对每一个用户个体具有一定的针对性。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用户偏好挖掘方法及装置。
背景技术
用户偏好挖掘对于提高用户的使用体验具有非常重要的意义,准确挖掘用户偏好便可向用户精准推荐产品或服务,从而为用户提供高质量个性化的定制服务。
现有的用户偏好挖掘方法主要有直接计算和显眼计算两种方式。以外卖平台用户偏好挖掘为例,对于直接计算,指的是针对单一用户,统计该用户在一段时间内的下单历史,统计该用户在各类别食物上的下单情况,例如,用户一共下了10单,其中面食6单,米饭3单,汤1单,则该用户对于面食、米饭、汤的偏好值分别为0.6、0.3、0.1。直接计算的准确度需要以用户大量的下单历史为基础,然而,不论何种应用都会存在着大量的长尾用户,此类用户下单数量少,使得对长尾用户采用直接计算所确定的偏好往往出现偏差。对于先验计算,以外卖平台全部用户在一段时间内的下单历史为整体进行统计,计算出用户群体对各类食物的偏好,并以此作为每个用户的偏好,例如,外卖平台全部用户在一段时间内的下单历史中,面食订单数占50%,米饭订单数占30%,汤订单数占20%,则外卖平台上所有用户对各类食物的偏好值统一为面食0.5、米饭0.3、汤0.2。先验计算对于长尾用户,其偏好挖掘可以具有一定的准确度,然而,又缺乏了对用户个体的针对性,存在千人一面的问题,因此对于实际应用并没有太大帮助。
发明内容
本发明提供一种用户偏好挖掘方法及装置,用以提高用户偏好挖掘效果。
本发明实施例提供一种用户偏好挖掘方法,应用于多用户平台,所述方法包括:
根据所述多用户平台中在第一预设历史周期内多个用户的多条选择记录确定所述多用户平台对于每种选择类型的先验偏好;所述选择记录包括用户每次选择的选择类型;
针对任一用户,获取所述用户在第二预设历史周期内的多条选择记录,根据所述用户在第二预设历史周期内的多条选择记录对每种选择类型的先验偏好进行修正,确定所述用户对每种选择类型的用户偏好值。
可选的,根据所述多用户平台中第一预设历史周期内多个用户的多条选择记录确定所述多用户平台对于每种选择类型的先验偏好,包括:
针对每一种选择类型,执行:
针对每一个用户,根据所述用户在所述第一预设历史周期内的多条选择记录,确定所述用户对所述选择类型的选择占比;
根据每一个用户对所述选择类型的选择占比,确定每个选择占比区间中的用户数量在总用户数量中的用户占比;
根据所述选择占比区间和所述用户占比之间的对应关系,确定所述多用户平台在所述第一预设历史周期内对于所述选择类型的先验偏好。
可选的,针对任一用户,获取所述用户在第二预设历史周期内的多条选择记录,根据所述用户在第二预设历史周期内的多条选择记录对每种选择类型的先验偏好进行修正,确定所述用户对每种选择类型的用户偏好值,包括:
对于任一选择类型,执行:
获取所述多用户平台针对所述选择类型的先验偏好;所述选择类型的先验偏好包括多个选择占比区间和用户占比之间的对应关系;
针对任一选择占比区间,根据所述用户在所述第二预设历史周期内的多条选择记录修正所述选择占比区间对应的用户占比,获得用户概率;
根据所述选择占比区间和所述用户概率确定所述用户对所述选择类型的用户偏好值。
可选的,针对任一选择占比区间,根据所述用户在所述第二预设历史周期内的多条选择记录修正所述选择占比区间对应的用户占比,获得用户概率,包括:
针对任一选择占比区间,确定所述选择占比区间对应的选择概率;所述选择概率为所述选择占比区间对应的用户选择所述选择类型的概率;
通过所述选择概率确定所述用户在所述第二预设历史周期内的多条选择记录发生的事件概率;
根据所述事件概率修正所述用户占比,获得所述用户概率。
可选的,根据所述选择占比区间和所述用户概率确定所述用户选择所述选择类型的用户偏好值,包括:
确定每一个选择占比区间对应的选择概率;
根据每一个选择占比区间对应的选择概率和该占比区间对应的用户概率进行加权计算,获取所述选择类型的偏好值。
本发明实施例提供一种用户偏好挖掘装置,应用于多用户平台,所述装置包括:
处理单元,用于根据所述多用户平台中在第一预设历史周期内多个用户的多条选择记录确定所述多用户平台对于每种选择类型的先验偏好;所述选择记录包括用户每次选择的选择类型;
所述处理单元,还用于针对任一用户,获取所述用户在第二预设历史周期内的多条选择记录,根据所述用户在第二预设历史周期内的多条选择记录对每种选择类型的先验偏好进行修正,确定所述用户对每种选择类型的用户偏好值。
可选的,所述处理单元具体用于:
针对每一种选择类型,执行:
针对每一个用户,根据所述用户在所述第一预设历史周期内的多条选择记录,确定所述用户对所述选择类型的选择占比;
根据每一个用户对所述选择类型的选择占比,确定每个选择占比区间中的用户数量在总用户数量中的用户占比;
根据所述选择占比区间和所述用户占比之间的对应关系,确定所述多用户平台在所述第一预设历史周期内对于所述选择类型的先验偏好。
可选的,所述处理单元具体用于:
对于任一选择类型,执行:
获取所述多用户平台针对所述选择类型的先验偏好;所述选择类型的先验偏好包括多个选择占比区间和用户占比之间的对应关系;
针对任一选择占比区间,根据所述用户在所述第二预设历史周期内的多条选择记录修正所述选择占比区间对应的用户占比,获得用户概率;
根据所述选择占比区间和所述用户概率确定所述用户对所述选择类型的用户偏好值。
可选的,所述处理单元具体用于:
针对任一选择占比区间,确定所述选择占比区间对应的选择概率;所述选择概率为所述选择占比区间对应的用户选择所述选择类型的概率;
通过所述选择概率确定所述用户在所述第二预设历史周期内的多条选择记录发生的事件概率;
根据所述事件概率修正所述用户占比,获得所述用户概率。
可选的,所述处理单元具体用于:
确定每一个选择占比区间对应的选择概率;
根据每一个选择占比区间对应的选择概率和该占比区间对应的用户概率进行加权计算,获取所述选择类型的偏好值。
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行如上述任一项所述的方法。
本发明实施例提供一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如上述任一项所述的方法。
综上所述,本发明实施例提供一种用户偏好挖掘方法及装置,应用于多用户平台,其中方法包括:根据多用户平台中在第一预设历史周期内多个用户的多条选择记录确定多用户平台对于每种选择类型的先验偏好;选择记录包括用户每次选择的选择类型;针对任一用户,获取用户在第二预设历史周期内的多条选择记录,根据用户在第二预设历史周期内的多条选择记录对每种选择类型的先验偏好进行修正,确定用户对每种选择类型的用户偏好值。根据多用户平台中多个用户的多条选择记录确定的先验偏好,能够体现出多用户平台中用户群体的群体偏好,有利于提高对长尾用户偏好挖掘的准确性。同时,针对任一用户,根据用户在第二预设历史周期内的多条选择记录对先验偏好进行修正所确定的用户偏好值对每一个用户更具有针对性,用户偏好挖掘结果更符合每一位用户的实际选择情况。因此,本发明实施例所提供的用户偏好挖掘结果既可以提高对长尾用户偏好挖掘的准确性,又对每一个用户个体具有一定的针对性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种用户偏好挖掘方法流程示意图;
图2为本发明实施例提供的一种可行的确定选择类型的先验偏好的方法流程示意图;
图3为本发明实施例提供的一种用户偏好挖掘装置结构示意图;
图4为本发明实施例提供的一种计算设备结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种用户偏好挖掘方法流程示意图,如图1所示,包括以下步骤:
S101:根据多用户平台中在第一预设历史周期内多个用户的多条选择记录确定多用户平台对于每种选择类型的先验偏好;选择记录包括用户每次选择的选择类型。
S102:针对任一用户,获取用户在第二预设历史周期内的多条选择记录,根据用户在第二预设历史周期内的多条选择记录对每种选择类型的先验偏好进行修正,确定用户对每种选择类型的用户偏好值。
具体实施过程中,多用户平台为用户提供多种选择类型的平台,多用户平台通过用户所选择的选择类型为用户提供对应服务。例如,多用户平台可以是订餐平台,订餐平台为用户提供了多种选择类型,如汤、面食、米饭等。应理解,对于选择类型的划分可以根据实际应用情况而定,例如,上例中的面食还可以进一步划分为馒头、花卷、面条等选择类型,上例中的面食和米饭也可以合并为主食这一个选择类型,在具体实施过程中,可以根据实际应用情况灵活划分选择类型,本发明实施例对此并不作具体限定。用户的选择会以选择记录的形式保存,每个选择记录中只记录用户对一种选择类型的选择,对于一次性选择多种选择类型的情况,则相应生产多条选择记录。例如,用户同时订购了汤和面食,则分别生产了一条该用户关于汤的选择记录和一条该用户关于面食的选择记录。
在S101中,多用户平台中的每一个用户在第一预设历史周期内中都可能产生一定数量的选择记录,可以根据多用户平台中多个用户在第一预设历史周期内所产生的所有选择记录确定多用户平台中用户群体对每种选择类型的选择偏好,即多用户平台对于每种选择类型的先验偏好。可选的,为了避免长尾用户对先验偏好准确性的影响,只根据在第一预设历史周期内选择记录数量高于预设阈值的用户的选择记录,确定多用户平台的先验偏好。由于多用户平台的先验偏好是根据多个用户的多条选择记录确定的,多用户平台的先验偏好对于多用户平台中的每一个用户都是一样的,先验偏好能够在一定程度上反应用户群体对每一种选择类型的偏好程度。
通过S101,能够获得多用户平台对于每一种选择类型的先验偏好。在S102 中,对于多用户平台中的任一用户,根据该用户在第二预设历史周期内的多条选择记录对每种类型的先验偏好进行修正,可以确定该用户对于每种选择类型的用户偏好值。用户在第二预设历史周期内的多条选择记录为用户在第二预设历史周期内的实际选择情况,采用用户的实际选择情况对每种选择类型的先验偏好进行修正,可以使获得的用户偏好值更符合用户的实际选择情况,对于用户个体的针对性更强,准确性也更高。可选的,第二预设历史周期和第一预设历史周期为同一周期。对于任一用户,其在第二预设历史周期和第一预设历史周期为同一周期时,该用户的多条选择记录对先验偏好的修正效果更强,使获得的用户偏好值更加准确。
根据多用户平台中多个用户的多条选择记录确定的先验偏好,能够体现出多用户平台中用户群体的群体偏好,有利于提高对长尾用户偏好挖掘的准确性。同时,针对任一用户,根据用户在第二预设历史周期内的多条选择记录对先验偏好进行修正所确定的用户偏好值对每一个用户更具有针对性,用户偏好挖掘结果更符合每一位用户的实际选择情况。因此,本发明实施例所提供的用户偏好挖掘结果既可以提高对长尾用户偏好挖掘的准确性,又对每一个用户个体具有一定的针对性。
可选的,本发明实施例还提供一种S101具体可行的实现方法。图2为本发明实施例提供的一种可行的确定选择类型的先验偏好的方法流程示意图,图 2针对每一种选择类型,包括以下步骤:
S201:针对每一个用户,根据用户在第一预设历史周期内的多条选择记录,确定用户对选择类型的选择占比。
S202:根据每一个用户对选择类型的选择占比,确定每个选择占比区间中的用户数量在总用户数量中的用户占比。
S203:根据选择占比区间和用户占比之间的对应关系,确定多用户平台在第一预设历史周期内对于选择类型的先验偏好。
在S201中,用户在第一预设历史周期内可能会选择多种选择类型,针对所要确定先验偏好的选择类型,确定每一个用户选择该选择类型的选择记录在该用户在第一预设历史周期内所有选择记录中的占比,即选择占比。举例说明,多用户平台共提供了选择类型a、选择类型b和选择类型c三种选择类型。在确定选择类型c的先验偏好时,需要在S201中确定每一个用户第一预设历史周期内的所有选择记录中选择类型c所对应的选择记录所占比例,假设用户A 在第一预设历史周期内生成了10条选择记录,其中3条是关于选择类型a的选择记录,4条是关于选择类型b的选择记录,3条是关于选择类型c的选择记录,则在确定选择类型c的先验偏好时,可以确定对于用户A对选择类型c 的选择占比为0.3。
在S202中,对多用户平台中的多个用户重复S201的操作,可以获得多个用户对于所要确定先验偏好的选择类型的选择占比。选择占比区间可以是根据经验预设的占比区间,对于同一种选择类型会预设有多个选择占比区间,多个选择占比区间一同覆盖了0~1之间的所有可能出现的比例,各个选择占比区间的大小可以均分,也可以根据经验或统计结果,将用户集中的区间细分,而用户分散的区间可以采用较大的区间跨度。在实际设定选择占比区间时,还可以考虑处理资源大小以及精度要求等指标进行设定等等。根据每一个用户对选择类型的选择占比确定每个占比区间中的用户数量在总用户数量中的用户占比,例如,多用户平台共有用户A、用户B、用户C以及用户D四个用户,对于选择类型c,共预设了区间1和区间2两个占比区间,其中区间1为0≤x<0.5,区间2为0.5≤x≤1,x为任一用户对于选择类型的选择占比。对于选择类型c,假设用户A的选择占比为0.3,用户B的选择占比为0.6,用户C的选择占比为0.8,用户D的选择占比为0.5,则可以确定区间1的用户占比为0.25,区间 2的用户占比为0.75。
在S203中,选择类型的先验偏好包括了选择占比区间和用户占比之间的对应关系,正如上例中,对于选择类型c,区间1与用户占比0.25,以及区间 2与用户占比0.75之间的对应关系。可选的,在确定了多用户平台中选择占比区间和用户占比之间的对应关系之后,还可以以此为基础挖掘多用户平台用户群体特征等,本发明实施例对此并不多作赘述,但这些挖掘结果也可以包含于本发明实施例所提供先验偏好之中。
在本发明实施例所提供的用户偏好挖掘方法中,还会针对任一个用户,利用该用户在第二预设历史周期内的多条选择记录修正对每种选择类型的先验偏好,从而获得用户偏好值。可选的,本发明实施例提供一种具体可行的确定用户对每种选择类型的用户偏好值的方法,针对任一选择类型,包括:
步骤一:获取多用户平台针对该选择类型的先验偏好;该选择类型的先验偏好包括多个选择占比区间和用户占比之间的对应关系。
步骤二:针对任一选择占比区间,根据用户在第二预设历史周期内的多条选择记录修正选择占比区间对应的用户占比,获得用户概率。
多用户平台中,任一选择类型中选择占比区间所对应的用户占比可以理解为,用户以该占比区间中的概率选择该选择类型的概率,这是基于用户平台中多个用户在第一预设历史周期中的多个选择记录确定的,缺乏对用户个体的针对性。根据用户在第二预设历史周期内的多条选择记录修正选择占比,使修正后的选择占比更符合用户的实际选择情况,修正后的选择占比即是用户概率。
步骤三:根据选择占比区间和用户概率确定用户对选择类型的用户偏好值。
在步骤三的具体实施过程中,可选的,确定每一个选择占比区间对应的选择概率;根据每一个选择占比区间对应的选择概率和该占比区间对应的用户概率进行加权计算,获取选择类型的偏好值。一般,选择占比区间的中心值可以在较高程度上反应选择占比区间的相对大小,可以将选择占比区间的中心值作为该选择占比区间所对应的选择概率。根据每一个选择占比区间对应的选择概率和该占比区间对应的用户概率进行加权计算,所获取的选择类型的用户偏好值,可以反应该用户对该选择类型的偏好程度,进而可以用于预测用户后续选择该选择类型的概率。
可选的,本发明实施例提供一种具体可行的修正选择占比区间对应的用户占比的方法,包括:针对任一选择占比区间,确定选择占比区间对应的选择概率;选择概率为选择占比区间对应的用户选择选择类型的概率;通过选择概率确定用户在第二预设历史周期内的多条选择记录发生的事件概率;根据事件概率修正用户占比,获得用户概率。
一般,可以将选择占比区间的中心值作为选择占比区间对应的选择概率,近似认为,该选择占比区间所对应的用户都以该选择概率选择该选择类型。以用户选择该选择类型的概率为该选择概率为假设,进而计算用户在第二预设历史周期内的多条选择记录能够发生的概率,即事件概率,事件概率可以反应上述假设能够成立的概率,从而通过事件概率修正用户占比,便可以得到该用户以该选择概率选择该选择类型的用户概率。应理解,在计算事件概率时,只判断该用户的多条选择记录是否为该选择类型对应的选择记录,对于非该选择类型对应的选择记录,其具体对应何种选择类型在计算事件概率时并不需要考虑。具体实施过程中,可根据公式一所示运算关系确定该选择占比区间对应的用户概率:
其中,P(θi)为选择占比区间θi的用户概率,P0(θi)为选择占比区间θi对应的用户占比,W1W2...Wn为该用户在最近的第二预设历史周期内的n条选择记录, P(W1W2...Wn|θi)为在该选择占比区间对应的选择概率为用户选择该选择类型的概率的情况下,n条选择记录出现的概率,m为占比区间的总数,为归一化因子。
为了更具体地说明本发明实施例所提供的用户偏好挖掘方法,本发明实施例提供一种可行的具体实现方式。假设订餐平台能够提供面食、汤、米饭三种食物类型选择,为了便于说明,只以计算用户A的面食偏好值为例进行说明,其它选择类型及用户可以以此类推,无需赘述。
步骤一,计算订餐平台在最近的90天(第一预设历史的周期)内多个用户的多条选择记录确定所述多用户平台对于每种选择类型的先验偏好,预设的选择占比区间为0.0≤x<0.2、0.2≤x<0.4、0.4≤x<0.6、0.6≤x<0.8、0.8≤x≤1.0。确定每个用户对于面食的选择占比,并匹配预设的选择占比区间,获得订餐平台中对于面食,选择占比区间与用户占比之间的对应关系,如表一所示。
表一
选择占比区间 | 用户占比 |
0.0≤x<0.2 | 30% |
0.2≤x<0.4 | 40% |
0.4≤x<0.6 | 20% |
0.6≤x<0.8 | 8% |
0.8≤x≤1.0 | 2% |
步骤二:根据用户A在最近的90天(第二预设历史周期与第一预设历史周期为同一周期)内的多条选择记录,对表一中的用户占比进行修正。假设用户A在最近的90天内共产生了3单选择记录,其中1单为面食,则根据公式一对各选择占比区间对应的用户占比进行修正,得到如表二所示的对应关系。其中,选择概率为表一中各选择占比区间的中心值,Z为公式一中的归一化因子。
表二
选择概率 | 用户概率 |
0.1 | 0.3*0.1*(0.9)^2/Z |
0.3 | 0.4*0.3*(0.7)^2/Z |
0.5 | 0.2*0.5*(0.5)^2/Z |
0.7 | 0.08*0.7*(0.3)^2/Z |
0.9 | 0.02*0.9*(0.1)^2/Z |
获得如表二所示的对应关系后,加权求和得到用户A对面食的用户偏好值。
在实际中,可以通过hive数据库的用户定义函数(User-Defined Function, UDF)实现上述步骤二,具体设计可以如下:
double[]bayes_mean_predict(string preProbfile,string clusterName,intpositvieCnt,int totalCnt)
输入:
preProbfile:先验偏好所在的文件路径,放在HDFS上,格式为tab分隔的三列,<选择类型><选择概率><用户占比>,如表一的面食先验偏好第一行可表示如下:
<面食><0.1><0.3>
clusterName:当前计算的选择类型名,如"面食"
positvieCnt:实际动作中的正样本数,即用户A第二预设历史周期内在面食上的下单数量。
totalCnt:实际样本中的总样本数,即用户A第二预设历史周期内所有下单数量。
输出:
double[0]:后验概率的期望值,即用户对于面食的用户偏好值。
double[1]:后验概率的标准差。
在具体应用过程中,申请人通过比对采用本发明实施例所提供的用户偏好挖掘方法确定的用户偏好值,以及直接计算和先验计算获得的偏好值与实际用户下单情况之间的平均平方误差,对以上三种方式的挖掘结果进行了验证。验证结果如表三所示。
表三
计算方式 | 平均平方误差 |
直接计算 | 0.2541 |
先验计算 | 0.2483 |
本发明实施例计算 | 0.2243 |
从表三可以看出,本发明实施例所提供的方法确定的用户偏好值比直接计算和先验计算确定的偏好值的平均平方误差更新,说明本发明实施例所确定的用户偏好值更接近于用户的实际选择情况,其对用户偏好挖掘的准确性更高。
综上所述,本发明实施例提供一种用户偏好挖掘方法,应用于多用户平台,包括:根据多用户平台中在第一预设历史周期内多个用户的多条选择记录确定多用户平台对于每种选择类型的先验偏好;选择记录包括用户每次选择的选择类型;针对任一用户,获取用户在第二预设历史周期内的多条选择记录,根据用户在第二预设历史周期内的多条选择记录对每种选择类型的先验偏好进行修正,确定用户对每种选择类型的用户偏好值。根据多用户平台中多个用户的多条选择记录确定的先验偏好,能够体现出多用户平台中用户群体的群体偏好,有利于提高对长尾用户偏好挖掘的准确性。同时,针对任一用户,根据用户在第二预设历史周期内的多条选择记录对先验偏好进行修正所确定的用户偏好值对每一个用户更具有针对性,用户偏好挖掘结果更符合每一位用户的实际选择情况。因此,本发明实施例所提供的用户偏好挖掘结果既可以提高对长尾用户偏好挖掘的准确性,又对每一个用户个体具有一定的针对性。
基于相同的技术构思,本发明实施例还提供一种用户偏好挖掘装置,该装置可以实现上述任一实施例所提供的用户偏好挖掘方法。图3为本发明实施例提供的一种用户偏好挖掘装置结构示意图,应用于多用户平台,如图3所述,用户偏好挖掘装置300包括处理单元301:
处理单元301,用于根据所述多用户平台中在第一预设历史周期内多个用户的多条选择记录确定所述多用户平台对于每种选择类型的先验偏好;所述选择记录包括用户每次选择的选择类型;
所述处理单元301,还用于针对任一用户,获取所述用户在第二预设历史周期内的多条选择记录,根据所述用户在第二预设历史周期内的多条选择记录对每种选择类型的先验偏好进行修正,确定所述用户对每种选择类型的用户偏好值。
可选的,所述处理单元301具体用于:
针对每一种选择类型,执行:
针对每一个用户,根据所述用户在所述第一预设历史周期内的多条选择记录,确定所述用户对所述选择类型的选择占比;
根据每一个用户对所述选择类型的选择占比,确定每个选择占比区间中的用户数量在总用户数量中的用户占比;
根据所述选择占比区间和所述用户占比之间的对应关系,确定所述多用户平台在所述第一预设历史周期内对于所述选择类型的先验偏好。
可选的,所述处理单元301具体用于:
对于任一选择类型,执行:
获取所述多用户平台针对所述选择类型的先验偏好;所述选择类型的先验偏好包括多个选择占比区间和用户占比之间的对应关系;
针对任一选择占比区间,根据所述用户在所述第二预设历史周期内的多条选择记录修正所述选择占比区间对应的用户占比,获得用户概率;
根据所述选择占比区间和所述用户概率确定所述用户对所述选择类型的用户偏好值。
可选的,所述处理单元301具体用于:
针对任一选择占比区间,确定所述选择占比区间对应的选择概率;所述选择概率为所述选择占比区间对应的用户选择所述选择类型的概率;
通过所述选择概率确定所述用户在所述第二预设历史周期内的多条选择记录发生的事件概率;
根据所述事件概率修正所述用户占比,获得所述用户概率。
可选的,所述处理单元301具体用于:
确定每一个选择占比区间对应的选择概率;
根据每一个选择占比区间对应的选择概率和该占比区间对应的用户概率进行加权计算,获取所述选择类型的偏好值。
基于相同的技术构思,本发明实施例还提供一种计算设备,该计算设备具体可以为桌面计算机、便携式计算机、智能手机、平板电脑、个人数字助理 (Personal DigitalAssistant,PDA)等。如图4所示,为本发明实施例提供的一种计算设备结构示意图,该计算设备可以包括中央处理器401(Center Processing Unit,CPU)、存储器402、输入设备403、输出设备404等,输入设备403可以包括键盘、鼠标、触摸屏等,输出设备404可以包括显示设备,如液晶显示器(Liquid Crystal Display,LCD)、阴极射线管(Cathode Ray Tube, CRT)等。
存储器402可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器提供存储器中存储的程序指令和数据。在本发明实施例中,存储器可以用于存储本发明任一实施例所提供的用户偏好挖掘方法的程序,处理器401 通过调用存储器402存储的程序指令,按照获得的程序指令执行上述任一实施例所公开的用户偏好挖掘方法。
基于相同的技术构思,本发明实施例还提供一种计算机可读存储介质,用于存储为上述计算设备所用的计算机程序指令,其包含用于执行上述任一实施例所公开的方法的程序。
所述计算机存储介质可以是计算机能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、 EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD)) 等。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种用户偏好挖掘方法,其特征在于,应用于多用户平台,所述方法包括:
根据所述多用户平台中在第一预设历史周期内多个用户的多条选择记录确定所述多用户平台对于每种选择类型的先验偏好;所述选择记录包括用户每次选择的选择类型;
针对任一用户,获取所述用户在第二预设历史周期内的多条选择记录,根据所述用户在第二预设历史周期内的多条选择记录对每种选择类型的先验偏好进行修正,确定所述用户对每种选择类型的用户偏好值。
2.如权利要求1所述的方法,其特征在于,根据所述多用户平台中第一预设历史周期内多个用户的多条选择记录确定所述多用户平台对于每种选择类型的先验偏好,包括:
针对每一种选择类型,执行:
针对每一个用户,根据所述用户在所述第一预设历史周期内的多条选择记录,确定所述用户对所述选择类型的选择占比;
根据每一个用户对所述选择类型的选择占比,确定每个选择占比区间中的用户数量在总用户数量中的用户占比;
根据所述选择占比区间和所述用户占比之间的对应关系,确定所述多用户平台在所述第一预设历史周期内对于所述选择类型的先验偏好。
3.如权利要求2所述的方法,其特征在于,针对任一用户,获取所述用户在第二预设历史周期内的多条选择记录,根据所述用户在第二预设历史周期内的多条选择记录对每种选择类型的先验偏好进行修正,确定所述用户对每种选择类型的用户偏好值,包括:
对于任一选择类型,执行:
获取所述多用户平台针对所述选择类型的先验偏好;所述选择类型的先验偏好包括多个选择占比区间和用户占比之间的对应关系;
针对任一选择占比区间,根据所述用户在所述第二预设历史周期内的多条选择记录修正所述选择占比区间对应的用户占比,获得用户概率;
根据所述选择占比区间和所述用户概率确定所述用户对所述选择类型的用户偏好值。
4.如权利要求3所述的方法,其特征在于,针对任一选择占比区间,根据所述用户在所述第二预设历史周期内的多条选择记录修正所述选择占比区间对应的用户占比,获得用户概率,包括:
针对任一选择占比区间,确定所述选择占比区间对应的选择概率;所述选择概率为所述选择占比区间对应的用户选择所述选择类型的概率;
通过所述选择概率确定所述用户在所述第二预设历史周期内的多条选择记录发生的事件概率;
根据所述事件概率修正所述用户占比,获得所述用户概率。
5.如权利要求4所述的方法,其特征在于,根据所述选择占比区间和所述用户概率确定所述用户选择所述选择类型的用户偏好值,包括:
确定每一个选择占比区间对应的选择概率;
根据每一个选择占比区间对应的选择概率和该占比区间对应的用户概率进行加权计算,获取所述选择类型的偏好值。
6.一种用户偏好挖掘装置,其特征在于,应用于多用户平台,所述装置包括:
处理单元,用于根据所述多用户平台中在第一预设历史周期内多个用户的多条选择记录确定所述多用户平台对于每种选择类型的先验偏好;所述选择记录包括用户每次选择的选择类型;
所述处理单元,还用于针对任一用户,获取所述用户在第二预设历史周期内的多条选择记录,根据所述用户在第二预设历史周期内的多条选择记录对每种选择类型的先验偏好进行修正,确定所述用户对每种选择类型的用户偏好值。
7.如权利要求6所述的装置,其特征在于,所述处理单元具体用于:
针对每一种选择类型,执行:
针对每一个用户,根据所述用户在所述第一预设历史周期内的多条选择记录,确定所述用户对所述选择类型的选择占比;
根据每一个用户对所述选择类型的选择占比,确定每个选择占比区间中的用户数量在总用户数量中的用户占比;
根据所述选择占比区间和所述用户占比之间的对应关系,确定所述多用户平台在所述第一预设历史周期内对于所述选择类型的先验偏好。
8.如权利要求7所述的装置,其特征在于,所述处理单元具体用于:
对于任一选择类型,执行:
获取所述多用户平台针对所述选择类型的先验偏好;所述选择类型的先验偏好包括多个选择占比区间和用户占比之间的对应关系;
针对任一选择占比区间,根据所述用户在所述第二预设历史周期内的多条选择记录修正所述选择占比区间对应的用户占比,获得用户概率;
根据所述选择占比区间和所述用户概率确定所述用户对所述选择类型的用户偏好值。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行如权利要求1至5任一项所述的方法。
10.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810284963.7A CN108664552A (zh) | 2018-04-02 | 2018-04-02 | 一种用户偏好挖掘方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810284963.7A CN108664552A (zh) | 2018-04-02 | 2018-04-02 | 一种用户偏好挖掘方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108664552A true CN108664552A (zh) | 2018-10-16 |
Family
ID=63782737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810284963.7A Pending CN108664552A (zh) | 2018-04-02 | 2018-04-02 | 一种用户偏好挖掘方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108664552A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109902214A (zh) * | 2019-02-15 | 2019-06-18 | 重庆邮电大学 | 一种基于改进PageRank算法的用户偏好挖掘方法 |
CN110297974A (zh) * | 2019-06-20 | 2019-10-01 | 百度(中国)有限公司 | 排序处理方法、装置、设备和存储介质 |
CN113781143A (zh) * | 2020-11-05 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 对象推荐方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102364468A (zh) * | 2011-09-29 | 2012-02-29 | 北京亿赞普网络技术有限公司 | 一种用户网络行为分析方法、装置和系统 |
CN102693502A (zh) * | 2012-06-04 | 2012-09-26 | 南京中兴软创科技股份有限公司 | 面向用户消费行为的时间推移数据分析模型的建立方法 |
CN103310003A (zh) * | 2013-06-28 | 2013-09-18 | 华东师范大学 | 一种基于点击日志的新广告点击率预测方法及系统 |
CN103870453A (zh) * | 2012-12-07 | 2014-06-18 | 盛乐信息技术(上海)有限公司 | 数据推荐方法及系统 |
CN103927673A (zh) * | 2014-03-24 | 2014-07-16 | 腾讯科技(深圳)有限公司 | 一种推荐业务信息的方法及装置 |
CN106791964A (zh) * | 2016-12-26 | 2017-05-31 | 中国传媒大学 | 广播电视节目推荐系统及方法 |
-
2018
- 2018-04-02 CN CN201810284963.7A patent/CN108664552A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102364468A (zh) * | 2011-09-29 | 2012-02-29 | 北京亿赞普网络技术有限公司 | 一种用户网络行为分析方法、装置和系统 |
CN102693502A (zh) * | 2012-06-04 | 2012-09-26 | 南京中兴软创科技股份有限公司 | 面向用户消费行为的时间推移数据分析模型的建立方法 |
CN103870453A (zh) * | 2012-12-07 | 2014-06-18 | 盛乐信息技术(上海)有限公司 | 数据推荐方法及系统 |
CN103310003A (zh) * | 2013-06-28 | 2013-09-18 | 华东师范大学 | 一种基于点击日志的新广告点击率预测方法及系统 |
CN103927673A (zh) * | 2014-03-24 | 2014-07-16 | 腾讯科技(深圳)有限公司 | 一种推荐业务信息的方法及装置 |
CN106791964A (zh) * | 2016-12-26 | 2017-05-31 | 中国传媒大学 | 广播电视节目推荐系统及方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109902214A (zh) * | 2019-02-15 | 2019-06-18 | 重庆邮电大学 | 一种基于改进PageRank算法的用户偏好挖掘方法 |
CN109902214B (zh) * | 2019-02-15 | 2021-06-08 | 重庆邮电大学 | 一种基于改进PageRank算法的用户偏好挖掘方法 |
CN110297974A (zh) * | 2019-06-20 | 2019-10-01 | 百度(中国)有限公司 | 排序处理方法、装置、设备和存储介质 |
CN110297974B (zh) * | 2019-06-20 | 2021-07-20 | 百度(中国)有限公司 | 排序处理方法、装置、设备和存储介质 |
CN113781143A (zh) * | 2020-11-05 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 对象推荐方法及装置 |
CN113781143B (zh) * | 2020-11-05 | 2024-05-24 | 北京沃东天骏信息技术有限公司 | 对象推荐方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8032839B2 (en) | User interface experience system | |
US8843498B2 (en) | Interestingness of data | |
Deb et al. | A bi-objective constrained optimization algorithm using a hybrid evolutionary and penalty function approach | |
CN108664552A (zh) | 一种用户偏好挖掘方法及装置 | |
US20100332439A1 (en) | Apparatus and method for supporting cause analysis | |
CN108833458A (zh) | 一种应用推荐方法、装置、介质及设备 | |
CN105912599A (zh) | 终端应用程序的排名方法及终端 | |
US7983946B1 (en) | Systems and methods for identifying high complexity projects | |
CN111144941A (zh) | 商户评分的生成方法、装置、设备及可读存储介质 | |
CN108683605A (zh) | 一种服务调用的限流方法和装置 | |
CN109428760B (zh) | 一种基于运营商数据的用户信用评估方法 | |
US10943691B2 (en) | Cost of healthcare analytics platform | |
CN113626734B (zh) | 用户行为引导方法、装置、电子设备及存储介质 | |
CN109859066A (zh) | 一种确定工艺参数的方法和装置 | |
Mouhib et al. | TSMAA‐TRI: A temporal multi‐criteria sorting approach under uncertainty | |
KR20190017395A (ko) | 자동 셀 병합 기능이 구비된 데이터 관리 서비스 제공 방법 및 이를 수행하는 서비스 제공 서버 | |
CN108932658A (zh) | 数据处理方法、装置和计算机可读存储介质 | |
CN113344513A (zh) | 项目信息管理方法及装置、电子设备、存储介质 | |
CN108961071B (zh) | 自动预测组合业务收益的方法及终端设备 | |
CN112966199B (zh) | 一种页面调整收益的确定方法、装置、电子设备和介质 | |
CN115408297A (zh) | 测试方法、装置、设备及介质 | |
CN109034994A (zh) | 信用评级方法及装置、计算机可读存储介质、终端 | |
CN111164633B (zh) | 一种评分卡模型的调整方法、装置、服务器及存储介质 | |
CN102663006B (zh) | 一种数据筛选方法及装置 | |
JPWO2012132169A1 (ja) | リスクプロファイル生成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181016 |
|
RJ01 | Rejection of invention patent application after publication |