CN117194804B - 一种适用于经营管理系统的引导性推荐方法及系统 - Google Patents

一种适用于经营管理系统的引导性推荐方法及系统 Download PDF

Info

Publication number
CN117194804B
CN117194804B CN202311475350.9A CN202311475350A CN117194804B CN 117194804 B CN117194804 B CN 117194804B CN 202311475350 A CN202311475350 A CN 202311475350A CN 117194804 B CN117194804 B CN 117194804B
Authority
CN
China
Prior art keywords
page
user
recommended
recommendation
plate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311475350.9A
Other languages
English (en)
Other versions
CN117194804A (zh
Inventor
刘晓丹
王之元
于中宝
陈超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank Of Shanghai Co ltd
Original Assignee
Bank Of Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank Of Shanghai Co ltd filed Critical Bank Of Shanghai Co ltd
Priority to CN202311475350.9A priority Critical patent/CN117194804B/zh
Publication of CN117194804A publication Critical patent/CN117194804A/zh
Application granted granted Critical
Publication of CN117194804B publication Critical patent/CN117194804B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种适用于经营管理系统的引导性推荐方法及系统,基于经营管理平台用户操作行为信息、板块和页面所属关系,首先进行数据预处理,构建用户行为网络,挖掘用户画像特征、页面基础特征、浏览链路特征。然后基于时间衰减系数的评分卡模型,计算页面重要性评分。接着,利用TagBasedTFIDF++推荐模型对优质用户的页面评分特征进行训练,计算各板块内待推荐页面的评分并得到各板块推荐待选页面集;最后,利用贪心算法的图链路模型对待选页面集重新排序,得到每个板块的引导性推荐结果。本发明可以针对经营管理信息系统业务流程和用户特征,推荐合适的页面。

Description

一种适用于经营管理系统的引导性推荐方法及系统
技术领域
本发明涉及页面推荐技术领域,特别涉及一种适用于经营管理系统的引导性推荐方法及系统。
背景技术
推荐系统是一种能够从海量信息中挖掘用户偏好,过滤无效信息,提高信息利用效率的信息过滤系统。随着信息技术和互联网的发展,电子商务、社交媒体、新闻、金融等各类行业采用推荐系统,向用户推送他们感兴趣的商品或内容,并给应用它的企业带来了丰厚的利润。
目前,银行的掌上行信息平台整合行内外数据资源,拥有全行海量经营管理信息,却尚未开发推荐系统,新用户难以快速适应系统,找到自身感兴趣、经营管理应当关注的内容,形成业务条线浏览逻辑。经营管理类平台需要有针对性的引导用户关注业务开展相关指标,常见电商平台、社交媒体等推荐系统主要是为用户推荐大量多样化、个性化的内容以及长尾物品,并不适用于经营管理类平台。
因此,有必要提供一种适用于经营管理系统的引导性推荐方法及系统,针对经营管理信息系统业务流程和用户特征,推荐合适的页面。
发明内容
本发明的目的在于提供一种适用于经营管理系统的引导性推荐方法及系统,针对经营管理信息系统业务流程和用户特征,推荐合适的页面。
为了解决现有技术中存在的问题,本发明提供了一种适用于经营管理系统的引导性推荐方法,包括以下步骤:
S1:采集掌上行各板块用户操作行为日志数据,根据所述日志数据和板块页面层级关系梳理用户浏览时的路径;
S2:根据日志数据和路径构建用户行为网络;
S3:根据用户行为网络进行特征处理,得到用户画像特征和页面基础特征,用户画像特征包括用户板块标签、重复路径相似度、周平均登录天数、访问路径相似度、用户组权限标签、科技人员标签以及用户类型标签,页面基础特征包括页面访问频次、页面停留时长、时间衰减系数、链路权重、终点权重以及页面层级;
S4:根据时间衰减系数建立评分卡模型,进行页面重要性评分,用于个性化推荐,建立评分卡模型的方式如下:
其中,Score为页面重要性评分,为时间衰减系数;为特征参数,n为用户数,u 为当前用户,m为页面数量,i为当前页面,为各特征参数的权重系数;
S5:根据用户类型标签筛选出各板块的优质用户,将页面的页面访问频次、页面停留时长、链路权重和终点权重输入TagBasedTFIDF++推荐模型,以加权计算各板块内待推荐页面的评分,方式如下:
其中,为各板块内当前待推荐页面i的评分,B为特征数,b为当前特 征;为当前页面i特征b的加权评分,为各特征参数的权重系数;
S6:根据评分卡模型进行便利性访问推荐,根据待推荐页面的评分为各板块优质用户进行推荐。
可选的,在所述的适用于经营管理系统的引导性推荐方法中,S1中,梳理用户浏览时的路径的方式如下:
将页面层级逐级细分,使第1级为系统入口页面,第2级为功能菜单页面,第3-6级为板块页面,第7级为下钻页面和/或内容页面;
当跳转页面的层级低于当前页面的层级时,视为从当前页面开始新的路径。
可选的,在所述的适用于经营管理系统的引导性推荐方法中,S1中还包括以下步骤:对采集的日志数据进行数据清洗。
可选的,在所述的适用于经营管理系统的引导性推荐方法中,S2中,所述用户行为网络包括两类实体和六类关联边,两类实体分别为用户节点和页面节点,六类关联边分别为用户浏览链路、页面下钻链路、页面板块所属、页面目录所属、用户页面浏览偏好度以及页面逻辑关系。
可选的,在所述的适用于经营管理系统的引导性推荐方法中,S4中,时间衰减系数的计算方式为:
其中,为时间衰减系数,为用户浏览行为的最新日期,为用户u浏览页面j 的日期,为用户偏好程度;特征参数包括页面停留时长、终点权重、链路权重以及页面访 问频次;对应特征参数的权重系数根据实际情况设置。
可选的,在所述的适用于经营管理系统的引导性推荐方法中,页面停留时长的权重系数为0.3,终点权重的权重系数为0.4,链路权重的权重系数为0.15,页面访问频次的权重系数为0.15。
可选的,在所述的适用于经营管理系统的引导性推荐方法中,S5中,根据用户类型标签筛选出各板块的优质用户的方式如下:
用户类型标签中将新用户标记为1,非常用用户标记为2,常用用户标记为3:高质量用户标记为4,选出标记大于等于3的用户为优质用户。
可选的,在所述的适用于经营管理系统的引导性推荐方法中,S5中,当前页面i特征b的加权评分的计算公式如下:
其中,为用户u对页面i的特征b的评分,为所有用户对页面i特征b的评分 加权,n为用户u对页面i的浏览次数,为用户u对所有页面的特征b的评分加权,n为用户 数,u为当前用户。
可选的,在所述的适用于经营管理系统的引导性推荐方法中,S5中,在得到待推荐页面的评分之后,还包括以下步骤:
根据评分将待推荐页面进行排序;
基于贪心算法的图链路模型对排序列表重新排序,形成多个关联链路组合,选取对应板块内Top-N推荐列表作为结果推荐给优质用户。
可选的,在所述的适用于经营管理系统的引导性推荐方法中,基于贪心算法的图链路模型对排序列表重新排序,方式如下:
对页面下钻链路进行统计,按照跳转次数从大到小降序输出,取跳转次数最大值的始页面节点和终页面节点作为第一个关联链路组合;
第一个关联链路组合中将终页面节点作为起始点,寻找起始点的一度关联页面,从一度关联页面中取待推荐页面评分最高的页面作为第一个关联点;寻找第一个关联点的一度关联页面,从本次一度关联页面中取待推荐页面评分最高的页面作为第二个关联点,依次不断补充第三个关联点、……、第 k 个关联点,直至无法查找到新的一度关联页面,形成第一个关联链路组合;
去除第一个关联链路组合已取页面,找到待推荐页面评分最高的页面作为第二个关联链路组合的起始点,寻找起始点的一度关联页面,从一度关联页面
中取待推荐页面评分最高的页面作为第一个关联点;寻找第一个关联点的一度关联页面,从本次一度关联页面中取待推荐页面评分最高的页面作为第二个关联点,依次不断补充第三个关联点、……、第 k 个关联点,直至无法查找到新的一度关联页面,形成第二个关联链路组合;
不断重复第二个关联链路组合的步骤,得到第三个关联链路组合、第四个关联链路组合、……、第 h 个关联链路组合。
可选的,在所述的适用于经营管理系统的引导性推荐方法中,h个关联链路组合按照形成顺序排序,并组成推荐列表。
本发明还提供了一种适用于经营管理系统的引导性推荐系统,包括:
网络构建模块,配置为采集掌上行各板块用户操作行为日志数据,根据所述日志数据和板块页面层级关系梳理用户浏览时的路径;根据日志数据和路径构建用户行为网络;
特征加工模块,配置为根据用户行为网络进行特征处理,得到用户画像特征和页面基础特征,用户画像特征包括用户板块标签、重复路径相似度、周平均登录天数、访问路径相似度、用户组权限标签、科技人员标签以及用户类型标签,页面基础特征包括页面访问频次、页面停留时长、时间衰减系数、链路权重、终点权重以及页面层级;
模型构建模块,配置为构建评分卡模型和推荐模型;
根据时间衰减系数建立评分卡模型,进行页面重要性评分,用于个性化推荐,建立评分卡模型的方式如下:
其中,Score为页面重要性评分,为时间衰减系数;为特征参数,n为用户数,u 为当前用户,m为页面数量,i为当前页面,为各特征参数的权重系数;
根据用户类型标签筛选出各板块的优质用户,将页面的页面访问频次、页面停留时长、链路权重和终点权重输入TagBasedTFIDF++推荐模型,以加权计算各板块内待推荐页面的评分,方式如下:
其中,为各板块内当前待推荐页面i的评分,B为特征数,b为当前特 征;为当前页面i特征b的加权评分,为各特征参数的权重系数;
模型应用模块,配置为应用各模型,根据评分卡模型进行便利性访问推荐,根据待推荐页面的评分为各板块优质用户进行推荐。
在本发明所提供的适用于经营管理系统的引导性推荐方法及系统中,采用用户操作行为日志中的非结构化数据,挖掘高价值用户浏览行为网络,提炼重点浏览链路,并根据评分卡模型进行便利性访问推荐,根据待推荐页面的评分为各板块优质用户进行推荐,还解决了新用户冷启动和缺乏浏览逻辑性等问题,助力全行数据自服务与分析能力的提升。
附图说明
图1为本发明实施例提供的引导性推荐方法的流程图;
图2为本发明实施例提供的建立评分卡模型的流程图;
图3为本发明实施例提供的建立TagBasedTFIDF++推荐模型的流程图;
图4为本发明实施例提供的基于贪心算法的图链路模型的流程图;
图5为本发明实施例提供的引导性推荐方法的技术路线图。
实施方式
下面将结合示意图对本发明的具体实施方式进行更详细的描述。根据下列描述,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。
在下文中,如果本文所述的方法包括一系列步骤,本文所呈现的这些步骤的顺序并非必须是可执行这些步骤的唯一顺序,且一些所述的步骤可被省略和/或一些本文未描述的其他步骤可被添加到该方法。
目前,银行的掌上行信息平台整合行内外数据资源,拥有全行海量经营管理信息,却尚未开发推荐系统,新用户难以快速适应系统,找到自身感兴趣、经营管理应当关注的内容,形成业务条线浏览逻辑。经营管理类平台需要有针对性的引导用户关注业务开展相关指标,常见电商平台、社交媒体等推荐系统主要是为用户推荐大量多样化、个性化的内容以及长尾物品,并不适用于经营管理类平台。
为了解决现有技术中存在的问题,本发明提供了一种适用于经营管理系统的引导性推荐方法,如图1所示,所述方法包括以下步骤:
S1:采集掌上行各板块用户操作行为日志数据,根据所述日志数据和板块页面层级关系梳理用户浏览时的路径;
S11:为了梳理用户浏览页面关系构建行为网络,采集掌上行用户操作行为日志,对非结构化的用户页面跳转记录进行处理。原始用户操作表记录如表1所示。
表1 用户操作日志表示例
OBJ_ID OPER_TYPE OPER_DESC
03 登录系统
enterMobile 06 查看页面【企业手机银行-企业】
channelCpanyPhone 05 快速导航跳转板块【企业手机银行】
Sjyhaliveguei 06 查看页面【获客与活客】
Grsjyhaliveguei 05 主题分析跳转板块【个人手机银行】
netHomePage 06 查看页面【网金业务】
用户操作记录处理原则:(1)识别是否包含中文括号,切分括号内的页面名称;(2)识别是否包含“跳转”、“下钻跳转”等字符,切分该操作描述改为两条记录,跳转前后页面时间设置相差0.1秒;(3)其他页面保留原样。
S12:清洗方式例如为过滤以下记录:(1)重复记录,即相同页面操作;(2)无效的用户登录记录,若单次登录中没有板块列表和内容页面,删除本次登录包含的所有记录。
S13:为了梳理用户浏览层级路径构建关系网络,根据系统应用功能设计以及板块页面层级关系,将用户浏览页面层级逐级细分,以“登录系统”为第0级,区分每次浏览行为。各层页面如下:
第1级为系统入口页面,关键字为主页、新首页、我的收藏、管理报告等。
第2级为功能菜单页面,关键字为主题分析、快速导航、报表分析等,取决于系统功能设置,在数据清洗时通过捕捉跳转关系拆分跳转来源获取第二层页面。
第3-6级为板块页面,包含零售、对公、运营、风险、新兴、网金等六大板块,并根据板块下属分支划分,分支编号从3开始逐级加1到6。
最后一级为下钻页面和/或内容页面,定义没有归属前三类的页面均为内容页,为第7级。
根据板块页面层级关系,梳理用户浏览时的路径。使用错行函数,标记用户每次跳转的起始页面和终点页面,并按照层级进行处理。以页面层级递进不断下钻作为用户的一次浏览路径。当跳转页面的层级低于当前页面的层级时,视为从当前页面开始新的路径,判断用户进入新的分支,重新分析浏览路径。
在一个实施例中,计算新路径起点时,以当前用户浏览记录向前遍历搜索,找到第一个层级高于当前终点页面的记录,作为新路径的起点,删除层级顺序不符的记录。处理后的用户浏览路径如下:用户工号、访问日期、登录时间、起始页面浏览时间、起始页面编号、起始页面名称、起始页面类型、起始页面层级、终点页面浏览时间、终点页面编号、终点页面名称、终点页面类型、终点页面层级、路径编号以及所属板块名称。
S2:根据日志数据和路径构建用户行为网络,所述用户行为网络包括两类实体和六类关联边,两类实体分别为用户节点和页面节点,六类关联边分别为用户浏览链路、页面下钻链路、页面板块所属、页面目录所属、用户页面浏览偏好度以及页面逻辑关系。
两类实体的信息如下:
用户节点包括用户基础信息和用户行为信息,所述用户基础信息包括:用户工号、所属机构、所属部门、帐号状态、页面权限、用户组权限、角色权限;所述用户行为信息:登录时间、操作时间、操作类型、操作编号、操作描述、设备类型。页面节点包括页面信息,所述页面信息包括:页面编号、页面名称、页面类型、所属上级目录名称、上级目录编号、板块名称、板块编号、上级板块编号。
六类关联边的信息如表2:
表2关联边信息表
S3:根据用户行为网络进行特征处理,得到用户画像特征和页面基础特征,用户画像特征包括用户板块标签、重复路径相似度、周平均登录天数、访问路径相似度、用户组权限标签、科技人员标签以及用户类型标签,页面基础特征包括页面访问频次、页面停留时长、时间衰减系数、链路权重、终点权重以及页面层级;
具体的,(1)用户特征
基于掌上行用户操作日志、用户基础信息,对用户浏览链路、重复浏览页面情况、登录使用情况和常浏览板块进行处理,将用户分为四类:新用户、非常用用户、常用用户和高质量用户,形成用户画像并进行标记,便于后续的建模和推荐策略应用。用户特征及计算说明如下:
用户板块标签,计算说明:近3个月操作日志中常访问的页面所属板块,数量≤2个(该字段用于标记用户近3个月经常浏览的板块,若根据日志发现超过3个,只记录2个);
重复路径相似度,计算说明:重复路径(相同的起始页面到目标页面)≥2组;计算方法:重复路径数量/总路径数量;
周平均登录天数,计算说明:近3个月每周有效平均登录天数(剔除仅“登录系统”操作的天数);
访问路径相似度,计算说明:访问路径的有效页面节点≥3个(剔除“主题分析”等无效页面)时,访问路径相似度=长链路数量/总长链路数量;其中长链路的余弦相似度≥0.6,在一个实施例中,余弦相似度计算方式例如:路径1=abc,路径2=bcde,两条路径的词集合为[a,b,c,d,e],路径1=[1,1,1,0,0],路径2=[0,1,1,1,1],余弦相似度=2/(根号3*根号4);
用户组权限标签,计算说明:用户组=1,非用户组=0;
科技人员标签,计算说明:科技人员=1,非科技人员=0;
用户类型标签,计算说明:新用户=1,其登录天数<2,重复路径<0.3,长路径<0.3;非常用用户=2,其登录天数≥2,重复路径<0.3,长路径<0.3;常用用户=3,其他;高质量用户=4,其登录天数≥2,重复路径≥0.3,长路径≥0.3,用户组=1,科技人员=0。
(2)页面特征
基于掌上行用户访问记录,对页面访问频次、停留时长等特征进行加工,并引入热门惩罚系数和时间衰减系数进行优化。页面特征及计算说明如下:
页面访问频次,计算方法:页面访问频次*热门惩罚系数;
热门惩罚系数=为用户u对页面i的浏览次数。
页面停留时长,计算方法:页面停留时长前20%取3,20%~50%取1,50%~100%取0;该特征归一化后数据倾斜情况较为严重,所以采用数据分箱。
时间衰减系数,计算方法: 为时间衰减系数,为用户浏览行 为的最新日期,为用户u浏览页面j的日期,用户偏好程度,一般设置为0.15。
链路权重,计算方法:链路权重=为本次登录浏览链路的顺序 值,该特征体现先浏览的链路重要程度高于后浏览的链路。
终点权重,计算方法:若该页面是用户浏览路径的终节点,取链路权重作为终点权重;若该页面为非路径终节点,取0。
页面层级,计算方法:登录系统=0,入口栏=1,菜单页=2,列表页=3~7,遍历页面全览表。
S4:如图2所示,根据时间衰减系数建立评分卡模型,进行页面重要性评分,用于个性化推荐,建立评分卡模型的方式如下:
;其中,Score为页面重要性评分,为时间衰减系数,用 于调整数据特征权重,因用户近期行为最能体现他当下的兴趣,时间衰减系数随时间递减;为特征参数,n为用户数,u为当前用户,m为页面数量,i为当前页面,为各特征参数的 权重系数;
特征参数包括页面停留时长、终点权重、链路权重以及页面访问频次;
对应特征参数的权重系数根据实际情况设置,在一个实施例中,页面停留时长的权重系数为0.3,终点权重的权重系数为0.4,链路权重的权重系数为0.15,页面访问频次的权重系数为0.15。
本发明通过评分卡模型,对用户浏览行为网络中涉及的页面进行评分,并筛选出每个用户Top-N的页面作为个性化推荐列表,提供便利性访问功能。
S5:如图3所示,建立TagBasedTFIDF++推荐模型;
S51:根据用户类型标签筛选出各板块的优质用户,方式如下:
用户类型标签中将新用户标记为1,非常用用户标记为2,常用用户标记为3:高质量用户标记为4,选出标记大于等于3的用户为优质用户。
S52:将页面的页面访问频次、页面停留时长、链路权重和终点权重输入TagBasedTFIDF++推荐模型,以加权计算各板块内待推荐页面的评分,方式如下:
;其中,为各板块内当前待推荐页面 i的评分,B为特征数,b为当前特征;为当前页面i特征b的加权评分,为各特征参数 的权重系数;
进一步的,当前页面i特征b的加权评分的计算公式如下:
;其中,为用户u对页面i的特征b的评分, 为所有用户对页面i特征b的评分加权,为用户u对页面i的浏览次数,为用户u对 所有页面的特征b的评分加权,n为用户数,u为当前用户。
模型输入、输出流程如图3所示。根据TagBasedTFIDF++模型计算各板块内待推荐页面的评分,按照评分从高到低排序,作为推荐待选页面集合。
在一个实施例中,页面特征如下表3所示:
表3
用户工号 页面ID 特征b1(wb,u) 频次(nu,i) wu (b) wi (b)
uA p1 1 1 1+2 1+1+2
uA p2 1 1 1+2 1+1+2
uA p3 2 2 2+2 1+1+2
uB p1 2 3 1+2 2+2+2
uB p2 2 3 1+2 2+2+2
uB p3 2 3 2+2 2+2+2
页面1中特征b1的评分为:
同理,计算页面2和页面3中特征b1 的评分分别为2.67和3.46。
S53:如图4所示,在得到待推荐页面的评分之后,还包括以下步骤:
根据评分将待推荐页面进行排序;
基于贪心算法的图链路模型对排序列表重新排序,形成多个关联链路组合,选取对应板块内Top-N推荐列表作为结果推荐给优质用户。
基于贪心算法的图链路模型对排序列表重新排序,方式如下:
(1)对页面下钻链路进行统计,按照跳转次数从大到小降序输出,取跳转次数最大值的始页面节点和终页面节点作为第一个关联链路组合;
(2)第一个关联链路组合中将终页面节点作为起始点,寻找起始点的一度关联页面,从一度关联页面中取待推荐页面评分最高的页面作为第一个关联点;寻找第一个关联点的一度关联页面,从本次一度关联页面中取待推荐页面评分最高的页面作为第二个关联点,依次不断补充第三个关联点、……、第k个关联点,直至无法查找到新的一度关联页面,形成第一个关联链路组合;
(3)去除第一个关联链路组合已取页面,找到待推荐页面评分最高的页面作为第二个关联链路组合的起始点,寻找起始点的一度关联页面,从一度关联页面中取待推荐页面评分最高的页面作为第一个关联点;寻找第一个关联点的一度关联页面,从本次一度关联页面中取待推荐页面评分最高的页面作为第二个关联点,依次不断补充第三个关联点、……、第k个关联点,直至无法查找到新的一度关联页面,形成第二个关联链路组合;
(4)不断重复第二个关联链路组合的步骤,得到第三个关联链路组合、第四个关联链路组合、……、第h个关联链路组合。
h个关联链路组合按照形成顺序排序,并组成推荐列表,选取对应板块内Top-N推荐列表作为结果推荐给优质用户。
S6:根据评分卡模型进行便利性访问推荐,根据待推荐页面的评分为各板块优质用户进行推荐。
优选的,本发明为掌上行系统开发了一套适用于经营管理平台的推荐方法,将根据用户操作日志等信息进行模型开发,部署在大数据分析服务中,产出推荐结果表为掌上行服务,技术路线图如图5所示。
(1)对下列表进行开发:用户操作日志表、用户信息表、用户收藏信息表、用户赞踩信息表、页面及条线全览表、页面模块关系表、用户页面权限表、页面全览表、用户组表、户角色关系表。
(2)提交对应的入仓任务,将(1)中所有表入仓。
(3)模型部署在大数据分析服务中,并调用大数据仓库中的信息表。
(4)设置定时任务,运行推荐模型脚本。
(5)推荐结果落表至大数据仓库。
(6)掌上行系统定时调用(5)结果表,在系统首页金刚区推荐展示。
本发明还提供了一种适用于经营管理系统的引导性推荐系统,包括:
网络构建模块,配置为采集掌上行各板块用户操作行为日志数据,根据所述日志数据和板块页面层级关系梳理用户浏览时的路径;根据日志数据和路径构建用户行为网络;
特征加工模块,配置为根据用户行为网络进行特征处理,得到用户画像特征和页面基础特征,用户画像特征包括用户板块标签、重复路径相似度、周平均登录天数、访问路径相似度、用户组权限标签、科技人员标签以及用户类型标签,页面基础特征包括页面访问频次、页面停留时长、时间衰减系数、链路权重、终点权重以及页面层级;
模型构建模块,配置为构建评分卡模型和推荐模型;
根据时间衰减系数建立评分卡模型,进行页面重要性评分,用于个性化推荐,建立评分卡模型的方式如下:
;其中,Score为页面重要性评分,为时间衰减系数;为特征参数,n为用户数,u为当前用户,m为页面数量,i为当前页面,为各特征参数的 权重系数;
根据用户类型标签筛选出各板块的优质用户,将页面的页面访问频次、页面停留时长、链路权重和终点权重输入TagBasedTFIDF++推荐模型,以加权计算各板块内待推荐页面的评分,方式如下:
;其中,为各板块内当前待推荐页面 i的评分,B为特征数,b为当前特征;为当前页面i特征b的加权评分,为各特征参数 的权重系数;
模型应用模块,配置为应用各模型,根据评分卡模型进行便利性访问推荐,根据待推荐页面的评分为各板块优质用户进行推荐。
所述适用于经营管理系统的引导性推荐系统采用所述适用于经营管理系统的引导性推荐方法形成。
采用本发明所提供的适用于经营管理系统的引导性推荐方法及系统进行案例测试:
本发明根据掌上行6大板块分类,筛选常用用户和高频用户的访问路径关联关系和页面评分作为模型依据,对掌上行现运行中页面进行建模分析。以零售板块为例,根据用户画像特征筛选优质用户,构建页面浏览关系网络。
根据优质用户行为网络特征,以跳转频次最高一组作为搜索起始点,利用贪心算法搜索前后路径,以页面重要性评分作为标准,高分页面优先采纳,直至该路径搜索完毕。以此类推搜索其他链路关系,其他页面按评分高低置后排列。最后,根据链路下钻关系重新排序待选页面集,取TopN作为引导性推荐结果。以零售板块为例,根据冲排序后的推荐待选页面集合,筛选前12个页面作为零售板块引导性推荐结果,并分配给具有对应板块标签的用户,作为板块引导性推荐,如表4所示。
表4板块引导页签推荐结果评分表(以零售板块为例)
/>
综上,在本发明所提供的适用于经营管理系统的引导性推荐方法及系统中,采用用户操作行为日志中的非结构化数据,挖掘高价值用户浏览行为网络,提炼重点浏览链路,并根据评分卡模型进行便利性访问推荐,根据待推荐页面的评分为各板块优质用户进行推荐,还解决了新用户冷启动和缺乏浏览逻辑性等问题,助力全行数据自服务与分析能力的提升。
上述仅为本发明的优选实施例而已,并不对本发明起到任何限制作用。任何所属技术领域的技术人员,在不脱离本发明的技术方案的范围内,对本发明揭露的技术方案和技术内容做任何形式的等同替换或修改等变动,均属未脱离本发明的技术方案的内容,仍属于本发明的保护范围之内。

Claims (9)

1.一种适用于经营管理系统的引导性推荐方法,其特征在于,包括以下步骤:
S1:采集掌上行各板块用户操作行为日志数据,根据所述日志数据和板块页面层级关系梳理用户浏览时的路径,梳理用户浏览时的路径的方式如下:将页面层级逐级细分,使第1级为系统入口页面,第2级为功能菜单页面,第3-6级为板块页面,第7级为下钻页面和/或内容页面;当跳转页面的层级低于当前页面的层级时,视为从当前页面开始新的路径;
S2:根据日志数据和路径构建用户行为网络,所述用户行为网络包括两类实体和六类关联边,两类实体分别为用户节点和页面节点,六类关联边分别为用户浏览链路、页面下钻链路、页面板块所属、页面目录所属、用户页面浏览偏好度以及页面逻辑关系;
S3:根据用户行为网络进行特征处理,得到用户画像特征和页面基础特征,用户画像特征包括用户板块标签、重复路径相似度、周平均登录天数、访问路径相似度、用户组权限标签、科技人员标签以及用户类型标签,页面基础特征包括页面访问频次、页面停留时长、时间衰减系数、链路权重、终点权重以及页面层级;
S4:根据时间衰减系数建立评分卡模型,进行页面重要性评分,用于个性化推荐,建立评分卡模型的方式如下:
其中,Score为页面重要性评分,ω为时间衰减系数;rui为特征参数,n为用户数,u为当前用户,m为页面数量,i为当前页面,wb为各特征参数的权重系数;
时间衰减系数的计算方式为:
其中,ω为时间衰减系数,tuj为用户浏览行为的最新日期,tui为用户u浏览页面j的日期,α为用户偏好程度;
特征参数包括页面停留时长、终点权重、链路权重以及页面访问频次;
对应特征参数的权重系数根据实际情况设置;
S5:根据用户类型标签筛选出各板块的优质用户,将页面的页面访问频次、页面停留时长、链路权重和终点权重输入TagBasedTFIDF++推荐模型,以加权计算各板块内待推荐页面的评分,方式如下:
其中,Scorei tagbased为各板块内当前待推荐页面i的评分,B为特征数,b为当前特征;ηi,b为当前页面i特征b的加权评分,wb为各特征参数的权重系数;
S6:根据评分卡模型进行便利性访问推荐,根据待推荐页面的评分为各板块优质用户进行推荐。
2.如权利要求1所述的适用于经营管理系统的引导性推荐方法,其特征在于,S1中还包括以下步骤:对采集的日志数据进行数据清洗。
3.如权利要求1所述的适用于经营管理系统的引导性推荐方法,其特征在于,
页面停留时长的权重系数为0.3,终点权重的权重系数为0.4,链路权重的权重系数为0.15,页面访问频次的权重系数为0.15。
4.如权利要求1所述的适用于经营管理系统的引导性推荐方法,其特征在于,S5中,根据用户类型标签筛选出各板块的优质用户的方式如下:
用户类型标签中将新用户标记为1,非常用用户标记为2,常用用户标记为3:高质量用户标记为4,选出标记大于等于3的用户为优质用户。
5.如权利要求1所述的适用于经营管理系统的引导性推荐方法,其特征在于,S5中,当前页面i特征b的加权评分的计算公式如下:
其中,wb,u为用户u对页面i的特征b的评分,wu (b)为所有用户对页面i特征b的评分加权,nu,i为用户u对页面i的浏览次数,wi (b)为用户u对所有页面的特征b的评分加权,n为用户数,u为当前用户。
6.如权利要求1所述的适用于经营管理系统的引导性推荐方法,其特征在于,S5中,在得到待推荐页面的评分之后,还包括以下步骤:
根据评分将待推荐页面进行排序;
基于贪心算法的图链路模型对排序列表重新排序,形成多个关联链路组合,选取对应板块内Top-N推荐列表作为结果推荐给优质用户。
7.如权利要求6所述的适用于经营管理系统的引导性推荐方法,其特征在于,基于贪心算法的图链路模型对排序列表重新排序,方式如下:
对页面下钻链路进行统计,按照跳转次数从大到小降序输出,取跳转次数最大值的始页面节点和终页面节点作为第一个关联链路组合;
第一个关联链路组合中将终页面节点作为起始点,寻找起始点的一度关联页面,从一度关联页面中取待推荐页面评分最高的页面作为第一个关联点;寻找第一个关联点的一度关联页面,从本次一度关联页面中取待推荐页面评分最高的页面作为第二个关联点,依次不断补充第三个关联点,直至第k个关联点,直至无法查找到新的一度关联页面,形成第一个关联链路组合;
去除第一个关联链路组合已取页面,找到待推荐页面评分最高的页面作为第二个关联链路组合的起始点,寻找起始点的一度关联页面,从一度关联页面中取待推荐页面评分最高的页面作为第一个关联点;寻找第一个关联点的一度关联页面,从本次一度关联页面中取待推荐页面评分最高的页面作为第二个关联点,依次不断补充第三个关联点,直至第k个关联点,直至无法查找到新的一度关联页面,形成第二个关联链路组合;
不断重复第二个关联链路组合的步骤,得到第三个关联链路组合、第四个关联链路组合、直至第h个关联链路组合。
8.如权利要求7所述的适用于经营管理系统的引导性推荐方法,其特征在于,h个关联链路组合按照形成顺序排序,并组成推荐列表。
9.一种适用于经营管理系统的引导性推荐系统,其特征在于,包括:
网络构建模块,配置为采集掌上行各板块用户操作行为日志数据,根据所述日志数据和板块页面层级关系梳理用户浏览时的路径,梳理用户浏览时的路径的方式如下:将页面层级逐级细分,使第1级为系统入口页面,第2级为功能菜单页面,第3-6级为板块页面,第7级为下钻页面和/或内容页面;当跳转页面的层级低于当前页面的层级时,视为从当前页面开始新的路径;根据日志数据和路径构建用户行为网络,所述用户行为网络包括两类实体和六类关联边,两类实体分别为用户节点和页面节点,六类关联边分别为用户浏览链路、页面下钻链路、页面板块所属、页面目录所属、用户页面浏览偏好度以及页面逻辑关系;
特征加工模块,配置为根据用户行为网络进行特征处理,得到用户画像特征和页面基础特征,用户画像特征包括用户板块标签、重复路径相似度、周平均登录天数、访问路径相似度、用户组权限标签、科技人员标签以及用户类型标签,页面基础特征包括页面访问频次、页面停留时长、时间衰减系数、链路权重、终点权重以及页面层级;
模型构建模块,配置为构建评分卡模型和推荐模型;
根据时间衰减系数建立评分卡模型,进行页面重要性评分,用于个性化推荐,建立评分卡模型的方式如下:
其中,Score为页面重要性评分,ω为时间衰减系数;rui为特征参数,n为用户数,u为当前用户,m为页面数量,i为当前页面,wb为各特征参数的权重系数;
时间衰减系数的计算方式为:
其中,ω为时间衰减系数,tuj为用户浏览行为的最新日期,tui为用户u浏览页面j的日期,α为用户偏好程度;
特征参数包括页面停留时长、终点权重、链路权重以及页面访问频次;
对应特征参数的权重系数根据实际情况设置;
根据用户类型标签筛选出各板块的优质用户,将页面的页面访问频次、页面停留时长、链路权重和终点权重输入TagBasedTFIDF++推荐模型,以加权计算各板块内待推荐页面的评分,方式如下:
其中,Scorei tagbased为各板块内当前待推荐页面i的评分,B为特征数,b为当前特征;ηi,b为当前页面i特征b的加权评分,wb为各特征参数的权重系数;
模型应用模块,配置为应用各模型,根据评分卡模型进行便利性访问推荐,根据待推荐页面的评分为各板块优质用户进行推荐。
CN202311475350.9A 2023-11-08 2023-11-08 一种适用于经营管理系统的引导性推荐方法及系统 Active CN117194804B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311475350.9A CN117194804B (zh) 2023-11-08 2023-11-08 一种适用于经营管理系统的引导性推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311475350.9A CN117194804B (zh) 2023-11-08 2023-11-08 一种适用于经营管理系统的引导性推荐方法及系统

Publications (2)

Publication Number Publication Date
CN117194804A CN117194804A (zh) 2023-12-08
CN117194804B true CN117194804B (zh) 2024-01-26

Family

ID=88983675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311475350.9A Active CN117194804B (zh) 2023-11-08 2023-11-08 一种适用于经营管理系统的引导性推荐方法及系统

Country Status (1)

Country Link
CN (1) CN117194804B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008121872A1 (en) * 2007-03-30 2008-10-09 Amazon Technologies, Inc. Cluster-based assessment of user interests
KR20100091669A (ko) * 2009-02-11 2010-08-19 인하대학교 산학협력단 전자상거래 서비스에서의 개인화 추천 시스템
CN102750334A (zh) * 2012-06-01 2012-10-24 北京市农林科学院农业科技信息研究所 一种基于dm的农业信息精准推送的方法
CN103678652A (zh) * 2013-12-23 2014-03-26 山东大学 一种基于Web日志数据的信息个性化推荐方法
CN103988203A (zh) * 2011-09-28 2014-08-13 Ava股份有限公司 根据协作的和/或基于内容的节点相互关系提供推荐的系统和方法
US10891678B1 (en) * 2017-04-18 2021-01-12 Amazon Technologies, Inc. Personalized network content generation and redirection according to time intervals between repeated instances of behavior based on entity size
CN113902534A (zh) * 2021-10-11 2022-01-07 东方财富信息股份有限公司 一种基于股票社区关系图谱的交互风险团伙识别方法
CN116089723A (zh) * 2023-02-22 2023-05-09 河北工程大学 一种推荐系统推荐方法及其设备
CN117010986A (zh) * 2023-07-13 2023-11-07 北京小样科技有限公司 基于用户行为数据的试用装匹配方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8019766B2 (en) * 2007-03-30 2011-09-13 Amazon Technologies, Inc. Processes for calculating item distances and performing item clustering
US8108406B2 (en) * 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
CN105589905B (zh) * 2014-12-26 2019-06-18 中国银联股份有限公司 用户兴趣数据分析和收集系统及其方法
US11082429B2 (en) * 2018-11-05 2021-08-03 Citrix Systems, Inc. Providing access to content within a computing environment

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008121872A1 (en) * 2007-03-30 2008-10-09 Amazon Technologies, Inc. Cluster-based assessment of user interests
KR20100091669A (ko) * 2009-02-11 2010-08-19 인하대학교 산학협력단 전자상거래 서비스에서의 개인화 추천 시스템
CN103988203A (zh) * 2011-09-28 2014-08-13 Ava股份有限公司 根据协作的和/或基于内容的节点相互关系提供推荐的系统和方法
CN102750334A (zh) * 2012-06-01 2012-10-24 北京市农林科学院农业科技信息研究所 一种基于dm的农业信息精准推送的方法
CN103678652A (zh) * 2013-12-23 2014-03-26 山东大学 一种基于Web日志数据的信息个性化推荐方法
US10891678B1 (en) * 2017-04-18 2021-01-12 Amazon Technologies, Inc. Personalized network content generation and redirection according to time intervals between repeated instances of behavior based on entity size
CN113902534A (zh) * 2021-10-11 2022-01-07 东方财富信息股份有限公司 一种基于股票社区关系图谱的交互风险团伙识别方法
CN116089723A (zh) * 2023-02-22 2023-05-09 河北工程大学 一种推荐系统推荐方法及其设备
CN117010986A (zh) * 2023-07-13 2023-11-07 北京小样科技有限公司 基于用户行为数据的试用装匹配方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于用户浏览行为的个性化推荐研究综述";刘华真等;《计算机应用研究》;2268-2277 *
"基于个性化推荐的农业电子商务系统研究";刘海敬;《信息与电脑》;58-63 *

Also Published As

Publication number Publication date
CN117194804A (zh) 2023-12-08

Similar Documents

Publication Publication Date Title
US11615079B1 (en) Graphical user interface for recurring searches
CN100504866C (zh) 一种综合搜索结果的排序系统及方法
CA2685296C (en) System and method for categorizing credit card transaction data
US20150227635A1 (en) Method, apparatus and system of intelligent navigation
US20140236954A1 (en) System and method for automating categorization and aggregation of content from network sites
CN105488697A (zh) 一种基于客户行为特征的潜在客户挖掘方法
US20110029511A1 (en) Keyword assignment to a web page
Daud et al. Finding rising stars in co-author networks via weighted mutual influence
CN106815263A (zh) 法律条文的搜索方法及装置
US20110029505A1 (en) Method and system for characterizing web content
CN113901308A (zh) 基于知识图谱的企业推荐方法及推荐装置、电子设备
CN115905489B (zh) 一种提供招投标信息搜索服务的方法
Han et al. Study on web mining algorithm based on usage mining
CN1937518A (zh) 网络社区中相关讨论区的选取方法及选取装置
CN101986301B (zh) 一种基于逆邻分析的协作过滤推荐系统及方法
US9165053B2 (en) Multi-source contextual information item grouping for document analysis
CN111125561A (zh) 一种网络热度的展示方法及装置
CN117194804B (zh) 一种适用于经营管理系统的引导性推荐方法及系统
CN103123641A (zh) 一种社交搜索的方法和装置
KR20090016043A (ko) 마케팅 정보 생성 방법 및 시스템
CN116431895A (zh) 安全生产知识个性化推荐方法及系统
CN106708851A (zh) 信息处理方法和装置
KR101371318B1 (ko) 문서 순위 결정 시스템 및 방법
Silva et al. Otarios: Optimizing author ranking with insiders/outsiders subnetworks
CN106815196A (zh) 软文展现次数统计方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant