CN116523546A - 智能读者行为分析预测系统数据采集分析的方法和装置 - Google Patents

智能读者行为分析预测系统数据采集分析的方法和装置 Download PDF

Info

Publication number
CN116523546A
CN116523546A CN202310785191.6A CN202310785191A CN116523546A CN 116523546 A CN116523546 A CN 116523546A CN 202310785191 A CN202310785191 A CN 202310785191A CN 116523546 A CN116523546 A CN 116523546A
Authority
CN
China
Prior art keywords
data
recommendation
initial
dimension
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310785191.6A
Other languages
English (en)
Other versions
CN116523546B (zh
Inventor
彭启阳
张立志
吴旭镇
谭百珊
庄若明
张立雄
林颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huato System Co ltd
Original Assignee
Huato System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huato System Co ltd filed Critical Huato System Co ltd
Priority to CN202310785191.6A priority Critical patent/CN116523546B/zh
Publication of CN116523546A publication Critical patent/CN116523546A/zh
Application granted granted Critical
Publication of CN116523546B publication Critical patent/CN116523546B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种智能读者行为分析预测系统数据采集分析的方法和装置,涉及数据分析技术领域。该方法包括:首先,通过预设的数据接口获取读者至少一个维度的源行为数据,并确定每个维度的源行为数据的数据权重占比,并根据数据权重占比的大小,对每个维度的源行为数据进行数据处理,以获得每个维度的标准行为数据。然后,构建读者的至少一个初始画像,并根据数据权重占比筛选出至少一个目标画像;获取第一推荐结果和第二推荐结果,并生成初始推荐方案。最后,根据读者对初始推荐方案的反馈结果,执行不同的初始推荐方案优化策略。解决了现有读者行为分析预测系统对单维度的数据采集分析效果较好,对多维度的数据采集分析效果较差的问题。

Description

智能读者行为分析预测系统数据采集分析的方法和装置
技术领域
本发明涉及数据分析技术领域,尤其涉及一种智能读者行为分析预测系统数据采集分析的方法和装置。
背景技术
智能读者行为分析预测系统是一种利用技术手段来分析和预测读者的行为和偏好的系统。该系统通过收集读者的行为数据,如阅读习惯、浏览历史、兴趣点等,利用机器学习和数据分析算法进行处理和分析,以提取有关读者的特征和模式。然后,基于这些特征和模式,系统可以预测读者未来的行为,如感兴趣的书籍、阅读时间、购买偏好等。智能读者行为分析预测系统可以应用于各种场景,例如图书馆、电子商务平台、新闻媒体等。
相关技术中,智能读者行为分析预测系统往往对单维度的数据采集分析效果较好,对多维度的数据采集分析效果较差。
发明内容
本发明提供了一种智能读者行为分析预测系统数据采集分析的方法和装置,解决了现有读者行为分析预测系统对单维度的数据采集分析效果较好,对多维度的数据采集分析效果较差的问题。
第一方面,本发明实施例提供了一种智能读者行为分析预测系统数据采集分析的方法,应用于智能读者行为分析预测系统,方法包括:
通过预设的数据接口获取读者至少一个维度的源行为数据,并确定每个维度的源行为数据的数据权重占比;
根据数据权重占比的大小,对每个维度的源行为数据进行数据处理,以获得每个维度的标准行为数据;
根据至少一个维度的行为标准数据,构建读者的至少一个初始画像,并根据数据权重占比从至少一个初始画像中筛选出至少一个目标画像;
获取每个目标画像的各自对应的第一推荐结果,以及目标画像任意组合后对应的第二推荐结果,并根据第一推荐结果和第二推荐结果,生成初始推荐方案;
将初始推荐方案发送至读者,并根据读者对初始推荐方案的反馈结果,执行不同的初始推荐方案优化策略。
本申请实施例提供的技术方案至少带来以下有益效果:
首先,采集读者不同维度的行为数据,并根据智能读者行为分析预测系统对不同维度的行为数据的支持能力,确定其数据权重占比,并根据数据权重占比来动态的调整对该维度数据的处理方式,然后根据不同维度标准数据构建的初始画像,以获得用户不同衡量角度的标签信息,从而保证推荐结果的多样性,并根据代表单维度的第一推荐结果和多维度的第二推荐结果,获得对用户进行分析后的多维分析推荐结果,并且通过上述方式,保证了推荐结果的准确性和及时性。
在一种可选的实现方式中,确定每个维度的源行为数据的数据权重占比,包:
确定源行为数据的数据类型标签以及源行为数据在整个数据集中的数据量占比;
根据数据类型标签与智能读者行为分析预测系统预设的数据处理模型的匹配情况,确定数据处理模型对源行为数据的支持能力,并根据支持能力,确定源行为数据的第一数据权重占比;
根据源行为数据的数据量占比,确定源行为数据的第二数据权重占比;
根据第一数据权重占比和第二数据权重占比,确定每源行为数据的数据权重占比。
在一种可选的实现方式中,根据数据权重占比的大小,对每个维度的源行为数据进行数据处理,以获得每个维度的标准行为数据,包括:
根据每个维度的源行为数据的数据权重占比,确定源行为数据对应的数据处理比例,其中,数据处理比例用于指示缩放数据的数值范围;
根据数据处理比例和源行为数据,确定标准行为数据,标准行为数据的计算公式为:
Yi = Xi (Wi / ΣWj);
其中,Yi 表示第i个维度的标准行为数据;Xi 表示第i个维度的源行为数据;Wi表示第i个维度的数据权重占比;ΣWj 表示所有维度的数据权重占比之和。
在一种可选的实现方式中,根据至少一个维度的行为标准数据,构建读者的至少一个初始画像,并根据数据权重占比从至少一个初始画像中筛选出至少一个目标画像,包括:
确定每个维度的行为标准数据的数据特征标签,并根据数据特征标签构建对应的初始画像;
将对应的数据权重占比大于或等于预设阈值的初始画像,确定为目标画像。
在一种可选的实现方式中,获取每个目标画像的各自对应的第一推荐结果,以及目标画像任意组合后对应的第二推荐结果,并根据第一推荐结果和第二推荐结果,生成初始推荐方案,包括:
将每个目标画像输入预设的第一推荐模型,以获得第一推荐结果,其中,第一推荐模型为协同过滤推荐模型;
组合任意目标画像,以获得组合画像,将组合画像输入预设的第二推荐模型,以获得第二推荐结果,其中,第二推荐模型为混合推荐模型;
根据第一推荐结果和第二推荐结果的重合推荐结果,生成初始推荐方案。
在一种可选的实现方式中,反馈结果包括接受指令或替换指令,根据读者对初始推荐方案的反馈结果,执行不同的初始推荐方案优化策略,包括:
在反馈结果为接受指令的情况下,将初始推荐方案确定为最终推荐方案,并进行储存,其中,初始推荐方案至少包括一个初始推荐书籍;
在反馈结果为替换指令的情况下,对初始推荐方案进行调整,以获得优化推荐方案,并执行将优化推荐方案发送至读者的步骤。
在一种可选的实现方式中,对初始推荐方案进行调整,以获得优化推荐方案,包括:
计算初始推荐书籍与备选书籍各个评估维度的关联度分值,其中,维度至少包括在知识图谱模型中的层级结构维度;
获取各个评估维度的权重比值,并根据各个评估维度的权重比值以及关联度分值,计算初始推荐书籍与备选书籍的多维关联度分值,其中,权重比值用于表征维度的重要程度;
根据多维关联度分值的高低对备选书籍进行筛选,以获得替换书籍集合,并根据替换书籍集合,生成优化推荐方案。
在一种可选的实现方式中,计算在知识图谱模型中的层级结构维度的关联度分值,包括:
确定初始推荐书籍在书籍本体中模型中上级分类号的类型和数量,以及备选书籍在书籍本体中模型中上级分类号的类型和数量;
根据初始推荐书籍在书籍本体中模型中上级分类号的类型和备选书籍在书籍本体中模型中上级分类号的类型的对比结果,确定初始推荐书籍与备选书籍中重合上级分类号的数量;
根据初始推荐书籍的上级分类号的数量、备选书籍的上级分类号的数量以及重合上级分类号的数量,计算层级结构维度的关联度分值;
关联度分值的计算公式为:
J = |A ∩ B| / |A ∪ B|;
其中,A代表初始推荐书籍的上级分类号的集合,B代表备选书籍的上级分类号的集合,|A ∩ B|表示重合上级分类号的数量,|A ∪ B|表示初始推荐书籍和备选书籍的上级分类号的总数量。
第二方面,本发明实施例提供了一种智能读者行为分析预测系统数据采集分析装置,装置包括:
数据获取模块,用于通过预设的数据接口获取读者至少一个维度的源行为数据,并确定每个维度的源行为数据的数据权重占比;
数据处理模块,用于根据数据权重占比的大小,对每个维度的源行为数据进行数据处理,以获得每个维度的标准行为数据;
画像构建模块,用于根据至少一个维度的行为标准数据,构建读者的至少一个初始画像,并根据数据权重占比从至少一个初始画像中筛选出至少一个目标画像;
初始推荐模块,用于获取每个目标画像的各自对应的第一推荐结果,以及目标画像任意组合后对应的第二推荐结果,并根据第一推荐结果和第二推荐结果,生成初始推荐方案;
最终推荐模块,用于将初始推荐方案发送至读者,并根据读者对初始推荐方案的反馈结果,执行不同的初始推荐方案优化策略。
在一种可选的实施方式中,数据获取模块包括:
参数确定子模块,用于确定源行为数据的数据类型标签以及源行为数据在整个数据集中的数据量占比;
第一权重确定子模块,用于根据数据类型标签与智能读者行为分析预测系统预设的数据处理模型的匹配情况,确定数据处理模型对源行为数据的支持能力,并根据支持能力,确定源行为数据的第一数据权重占比;
第二权重确定子模块,用于根据源行为数据的数据量占比,确定源行为数据的第二数据权重占比;
最终权重确定子模块,用于根据第一数据权重占比和第二数据权重占比,确定每源行为数据的数据权重占比。
在一种可选的实施方式中,数据处理模块包括,包括:
数据处理比例确定子模块,用于根据每个维度的源行为数据的数据权重占比,确定源行为数据对应的数据处理比例,其中,数据处理比例用于指示缩放数据的数值范围;
标准行为数据确定子模块,用于根据数据处理比例和源行为数据,确定标准行为数据。
在一种可选的实施方式中,画像构建模块,包括:
初始画像构建模块,用于确定每个维度的行为标准数据的数据特征标签,并根据数据特征标签构建对应的初始画像;
目标画像构建模块,用于将对应的数据权重占比大于或等于预设阈值的初始画像,确定为目标画像。
在一种可选的实施方式中,初始推荐模块,包括:
第一推荐子模块,用于将每个目标画像输入预设的第一推荐模型,以获得第一推荐结果,其中,第一推荐模型为协同过滤推荐模型;
第二推荐子模块,用于组合任意目标画像,以获得组合画像,将组合画像输入预设的第二推荐模型,以获得第二推荐结果,其中,第二推荐模型为混合推荐模型;
组合推荐子模块,用于根据第一推荐结果和第二推荐结果的重合推荐结果,生成初始推荐方案。
在一种可选的实施方式中,最终推荐模块包括:
第一推荐策略执行子模块,用于在反馈结果为接受指令的情况下,将初始推荐方案确定为最终推荐方案,并进行储存,其中,初始推荐方案至少包括一个初始推荐书籍;
第二推荐策略执行子模块,用于在反馈结果为替换指令的情况下,对初始推荐方案进行调整,以获得优化推荐方案,并执行将优化推荐方案发送至读者的步骤。
在一种可选的实施方式中,第二推荐策略执行子模块,包括:
单维度关联度分值计算单元,用于计算初始推荐书籍与备选书籍各个评估维度的关联度分值,其中,维度至少包括在知识图谱模型中的层级结构维度;
多维度关联度分值计算单元,用于获取各个评估维度的权重比值,并根据各个评估维度的权重比值以及关联度分值,计算初始推荐书籍与备选书籍的多维关联度分值,其中,权重比值用于表征维度的重要程度;
推荐方案生成单元,用于根据多维关联度分值的高低对备选书籍进行筛选,以获得替换书籍集合,并根据替换书籍集合,生成优化推荐方案。
在一种可选的实施方式中,单维度关联度分值计算单元,包括:
第一确定子单元,用于确定初始推荐书籍在书籍本体中模型中上级分类号的类型和数量,以及备选书籍在书籍本体中模型中上级分类号的类型和数量;
第二确定子单元,用于根据初始推荐书籍在书籍本体中模型中上级分类号的类型和备选书籍在书籍本体中模型中上级分类号的类型的对比结果,确定初始推荐书籍与备选书籍中重合上级分类号的数量;
计算子单元,用于根据初始推荐书籍的上级分类号的数量、备选书籍的上级分类号的数量以及重合上级分类号的数量,计算层级结构维度的关联度分值。
本发明实施例第三方面提出一种电子设备,电子设备包括:
至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本发明实施例第一方面提出方法。
本发明实施例第四方面提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例第一方面提出方法。
附图说明
图1为本发明实施例涉及的硬件运行环境的电子设备结构示意图;
图2是本发明实施例提供的一种智能读者行为分析预测系统数据采集分析的方法的步骤流程图;
图3是本发明实施例提供的一种智能读者行为分析预测系统数据采集分析装置的功能模块示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图对本发明的方案进一步说明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的电子设备结构示意图。
如图1所示,该电子设备可以包括:处理器1001,例如中央处理器(CentralProcessing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作装置、数据存储模块、网络通信模块、用户接口模块以及电子程序。
在图1所示的电子设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明电子设备中的处理器1001、存储器1005可以设置在电子设备中,电子设备通过处理器1001调用存储器1005中存储的智能读者行为分析预测系统数据采集分析装置,并执行本发明实施例提供的智能读者行为分析预测系统数据采集分析的方法。
参照图2,本发明的实施例提供了一种智能读者行为分析预测系统数据采集分析的方法,具体可以包括以下步骤:
S201:通过预设的数据接口获取读者至少一个维度的源行为数据,并确定每个维度的源行为数据的数据权重占比。
首先需要通过预设的数据接口来获取读者的行为数据。这些行为数据可以包括各种与读者行为相关的信息,例如阅读记录、购买记录、搜索记录等。为了更好地理解读者的行为模式并进行预测分析,至少需要选择一个维度的源行为数据进行采集。
每个维度的源行为数据都可以有不同的重要性和对读者行为的贡献程度。因此,在确定数据权重占比时,需要考虑每个维度的相对重要性。确定数据权重占比的目的是确保在后续的数据分析过程中可以更准确地反映读者的行为模式和偏好。
确定好每个维度的源行为数据的数据权重占比后,可以进一步进行数据采集和分析的过程,利用这些数据进行读者行为的分析和预测。通过分析读者的行为模式,可以获得对其偏好、兴趣和需求的深入了解,并根据这些分析结果来提供个性化的推荐和建议。
在一种可选的实施方式中,确定每个维度的源行为数据的数据权重占比的具体步骤,包括:
S2011:确定源行为数据的数据类型标签以及源行为数据在整个数据集中的数据量占比。
首先需要对源行为数据进行分类,即将不同种类的数据进行标记和归类。例如,对于图书馆的读者行为分析,源行为数据可以包括阅读记录、借阅记录、搜索记录等。每一类行为数据都可以被赋予一个特定的数据类型标签,以便在后续的分析和处理中进行识别和区分。
确定数据类型标签的目的是将不同类型的源行为数据进行区分,并为每个类型的数据赋予特定的含义和权重。这样可以更好地理解不同类型数据在读者行为中的作用和重要性。
同时,还需要计算每种类型数据在整个数据集中的数据量占比。这可以通过对数据集进行统计和分析来实现。对于每个数据类型,可以计算该类型数据的数量,并与整个数据集中的总数据量进行比较。这样可以得到每种类型数据在整个数据集中所占的比例。
确定数据量占比的目的是了解每种类型数据的相对重要性和分布情况。通过了解不同类型数据在整个数据集中的比例,可以更好地评估每个数据类型对读者行为分析的贡献程度。
S2012:根据数据类型标签与智能读者行为分析预测系统预设的数据处理模型的匹配情况,确定数据处理模型对源行为数据的支持能力,并根据支持能力,确定源行为数据的第一数据权重占比。
首先需要将已经标记好数据类型的源行为数据与智能读者行为分析预测系统中预设的数据处理模型进行匹配。数据处理模型是一种预定义的模型或算法,用于处理和分析源行为数据,提取有价值的信息。通过将源行为数据与数据处理模型进行匹配,可以确定数据处理模型对不同类型的源行为数据的支持能力。这意味着分析预测系统预设的数据处理模型可能更适合处理某些特定类型的行为数据,而对其他类型的数据的支持能力可能较弱。
根据数据处理模型的支持能力,可以为每个源行为数据类型确定第一数据权重占比。这意味着根据数据处理模型的适用性和重要性,为每个数据类型分配一个相应的权重。具有较高支持能力的数据类型可能被赋予较高的权重,以反映其在分析预测中的重要性和贡献度。当数据处理模型对某一数据类型具有较强的支持能力时,它能够更好地处理和分析该类型的源行为数据,提取有价值的信息并进行准确的预测和分析。这意味着该数据类型在预测模型中的贡献更大,能够更好地揭示读者的行为模式和趋势。因此第一权重与数据处理模型的支持能力呈正相关。
S2013:根据源行为数据的数据量占比,确定源行为数据的第二数据权重占比。
在这一步骤中,需要考虑源行为数据在整个数据集中的数据量占比。通过统计和分析数据集,可以计算每种数据类型的数据量,并将其与整个数据集的总量进行比较。根据数据量占比,可以为每个源行为数据类型确定第二数据权重占比。数据量较大的类型可能被赋予较高的权重,以反映其在整个数据集中的重要性和代表性。
S2014:根据第一数据权重占比和第二数据权重占比,确定每源行为数据的数据权重占比。
首先,将第一数据权重占比和第二数据权重占比相加,得到总权重占比。总权重占比是将两个权重占比相加后的结果,用于后续的计算。
总权重占比 = 第一数据权重占比 + 第二数据权重占比。
然后,针对每个源行为数据类型,按照其所对应的第一数据权重占比和第二数据权重占比,进行加权平均计算。对于每个源行为数据类型,其数据权重占比可以通过以下公式计算:
数据权重占比 = (第一数据权重占比 × 第一数据类型数量)/ 总权重占比 +(第二数据权重占比 × 第二数据类型数量)/ 总权重占比。
其中,第一数据类型数量和第二数据类型数量分别表示该数据类型在整个数据集中的数量。通过这个计算公式,可以根据第一数据权重占比和第二数据权重占比,以及各自数据类型的数量,得到每个源行为数据类型的数据权重占比。
这样做的目的是根据数据类型的重要性和数量,综合考虑第一数据权重和第二数据权重的影响,并为每个源行为数据类型分配适当的权重占比。这样可以确保不同类型的数据在分析和预测中得到适当的权重和贡献度,以更好地反映读者行为模式和预测需求。需要注意的是,数据权重占比是相对的,表示每个源行为数据类型在整个数据集中的相对重要性。权重占比越高,表示该数据类型在分析和预测中的贡献越大。
S202:根据数据权重占比的大小,对每个维度的源行为数据进行数据处理,以获得每个维度的标准行为数据。
在本实施方式中,旨在对源行为数据进行加权处理,以获得在不同维度上具有统一标准的行为数据。由于不同维度的源行为数据可能具有不同的度量单位、数值范围或数据格式。通过进行标准数据处理,可以将所有的源行为数据转化为统一的度量单位或数据格式,从而使它们在不同维度上具有一致的表示方式。这有助于消除由于不同数据表示方式而引起的混淆或误解,并提供一致的基础进行后续的数据分析和预测。通过对源行为数据进行加权处理,可以得到每个维度的标准行为数据。标准行为数据在不同维度上具有一致的处理方式和权重分配,从而确保了数据的统一性和可比性。
在一种可选的实施方式中,其具体的步骤包括:
S2021:根据每个维度的源行为数据的数据权重占比,确定源行为数据对应的数据处理比例,其中,数据处理比例用于指示缩放数据的数值范围;
S2022:根据数据处理比例和源行为数据,确定标准行为数据。
在S2021至S2022的实施方式中,通过使用数据权重占比,为每个维度的源行为数据确定数据处理比例。数据处理比例用于指导对源行为数据进行数据处理操作,以确保数据在不同维度上具有一致的数值范围和尺度。数据处理比例可以根据源行为数据的权重占比进行确定。较高权重占比的源行为数据将被分配较高的数据处理比例,这意味着这些数据在整个数据处理过程中将占据更大的比例,对结果产生更大的影响。而较低权重占比的源行为数据将被分配较低的数据处理比例,对结果的影响较小。
根据之前确定的数据处理比例和源行为数据,对每个维度的源行为数据进行相应的数据处理操作,以生成标准行为数据。数据处理操作可能包括缩放、归一化、离散化等技术,以确保源行为数据在不同维度上具有一致的数值范围和特征表示。通过应用数据处理比例,可以调整源行为数据的数值范围,使得不同维度的标准行为数据具有可比性和一致性。
标准行为数据的计算公式为:
Yi = Xi (Wi / ΣWj);
其中,Yi 表示第i个维度的标准行为数据;Xi 表示第i个维度的源行为数据;Wi表示第i个维度的数据权重占比;ΣWj 表示所有维度的数据权重占比之和。
S203:根据至少一个维度的行为标准数据,构建读者的至少一个初始画像,并根据数据权重占比从至少一个初始画像中筛选出至少一个目标画像。
使用至少一个维度的行为标准数据,可以通过分析和处理这些数据来构建读者的初始画像。行为标准数据可以包括读者在不同维度上的行为特征、偏好、兴趣等信息。通过对行为标准数据的分析和处理,可以识别读者的行为模式、消费偏好、阅读习惯等。这些信息可以用于构建读者的初始画像,帮助理解读者的特征和需求。
根据确定的数据权重占比,从构建的初始画像中筛选出目标画像。较高的数据权重占比意味着该数据类型对于揭示读者行为和需求具有更大的影响力。根据数据权重占比,可以选择具有较高权重的维度或特征,并将其作为目标画像的重要组成部分。这样可以确保目标画像具有更高的准确性和相关性,更好地反映读者的特征和需求。
通过筛选出目标画像,可以将关注点集中在那些对读者行为和预测具有更大影响力的特征上。这有助于提高预测模型的准确性和可靠性,并支持个性化的推荐和建议。
在一种可选的实施方式中,其具体的步骤包括:
S2031:确定每个维度的行为标准数据的数据特征标签,并根据数据特征标签构建对应的初始画像。
针对每个维度的行为标准数据,需要确定相应的数据特征标签。数据特征标签用于描述和表示该维度的行为特征、偏好或其他相关信息。例如,对于阅读行为的维度,可能存在数据特征标签如"阅读频率"、"喜好的图书类型"、"阅读时段"等。根据数据特征标签,可以构建对应的初始画像。初始画像是对读者在每个维度上的行为特征进行描述和概括的综合表达。初始画像可以包括读者在每个维度上的行为特征、偏好、兴趣等信息,用于初步描绘读者的特征和需求。
S2032:将对应的数据权重占比大于或等于预设阈值的初始画像,确定为目标画像。
根据之前确定的数据权重占比和预设阈值,筛选出目标画像。对于每个维度的初始画像,根据数据权重占比,可以确定具有较高权重占比的维度或特征。如果某个维度的数据权重占比大于或等于预设阈值,那么对应的初始画像将被确定为目标画像。目标画像是具有较高数据权重占比的初始画像,它们对于揭示读者行为和需求具有更大的重要性和影响力。通过筛选出目标画像,可以将关注点集中在那些对读者行为和预测具有更大影响力的特征上,从而提高预测模型的准确性和可靠性。
S204:获取每个目标画像的各自对应的第一推荐结果,以及目标画像任意组合后对应的第二推荐结果,并根据第一推荐结果和第二推荐结果,生成初始推荐方案。
第一推荐结果是根据目标画像的特征、偏好和需求,推荐给读者的最相关和最适合的书籍。第二推荐结果是根据组合画像的特征、偏好和需求,推荐给读者的与组合特征相关的书籍。根据所获取的第一推荐结果和第二推荐结果,结合智能读者行为分析预测系统的推荐策略和规则,生成初始推荐方案。初始推荐方案是根据目标画像和组合特征的推荐结果,结合系统规定的推荐逻辑和策略,生成的初步推荐方案。
在一种可选的实施方式中,其具体步骤包括:
S2041:将每个目标画像输入预设的第一推荐模型,以获得第一推荐结果,其中,第一推荐模型为协同过滤推荐模型;
S2042:组合任意目标画像,以获得组合画像,将组合画像输入预设的第二推荐模型,以获得第二推荐结果,其中,第二推荐模型为混合推荐模型;
S2043:根据第一推荐结果和第二推荐结果的重合推荐结果,生成初始推荐方案。
在S2041至S2043的实施方式中,将每个目标画像作为输入,传递给预设的第一推荐模型。第一推荐模型采用协同过滤的方法,通过分析目标画像与其他读者的行为数据之间的关联性,来获得最终的推荐结果。协同过滤推荐模型利用读者之间的行为相似性来进行推荐,它可以根据目标画像的特征和行为历史,找到与之相似的其他读者,然后根据这些相似读者的行为喜好,为目标画像生成第一推荐结果。
将任意组合的目标画像形成组合画像,并将组合画像输入预设的第二推荐模型。第二推荐模型采用混合推荐的方法,通过综合考虑多个目标画像的特征和需求,来获得最终的推荐结果混合推荐模型可以结合不同的推荐算法、特征权重或规则,综合考虑多个目标画像的信息,从而生成更全面和综合的推荐结果。根据第一推荐结果和第二推荐结果的重合推荐结果,生成初始推荐方案。重合推荐结果是指在第一推荐结果和第二推荐结果中都出现的推荐内容、商品或服务。
通过将重合推荐结果作为初始推荐方案的基础,可以确保推荐内容的可靠性和一致性。重合推荐结果反映了不同推荐模型和方法的共同推荐意见。
需要说明的是,需要根据具体场景和数据特征来选择适合的推荐模型。对于单一画像,重点是根据单一画像中的用户行为或偏好进行推荐;而对于组合画像,可以考虑利用更多的用户关系、上下文信息等进行推荐,以提供更准确和个性化的推荐结果。
S205:将初始推荐方案发送至读者,并根据读者对初始推荐方案的反馈结果,执行不同的初始推荐方案优化策略。
根据读者的画像和偏好,生成初始的推荐方案,并将其发送给读者。读者对初始推荐方案进行反馈,例如接受或者替换的形式进行反馈。根据分析的反馈结果,执行不同的初始推荐方案优化策略。这些策略可以根据具体情况进行调整,以满足业务需求和提高用户体验。
其具体的步骤包括:
S2051:在反馈结果为接受指令的情况下,将初始推荐方案确定为最终推荐方案,并进行储存,其中,初始推荐方案至少包括一个初始推荐书籍。
在接收到读者的反馈的接受指令后,系统将初始推荐方案确定为最终的推荐方案。这意味着系统认为初始推荐方案满足了读者的需求和偏好,可以作为最终的推荐结果。将最终推荐方案进行储存,以便后续的使用和参考。这可以是将推荐结果保存在数据库、日志文件或其他存储介质中,以便于后续分析、评估和调整推荐系统。在最终推荐方案中,初始推荐方案至少包括一个初始推荐书籍。通过接受读者的指令和获取反馈,将初始推荐方案确定为最终推荐方案,并进行储存,推荐系统可以不断改进和优化推荐结果,提供更符合读者需求的推荐体验。
S2052:在反馈结果为替换指令的情况下,对初始推荐方案进行调整,以获得优化推荐方案,并执行将优化推荐方案发送至读者的步骤,
在一种可选的实施方式中,S2052具体包括:
S20521:计算初始推荐书籍与备选书籍各个评估维度的关联度分值,其中,维度至少包括在知识图谱模型中的层级结构维度;
S20522:获取各个评估维度的权重比值,并根据各个评估维度的权重比值以及关联度分值,计算初始推荐书籍与备选书籍的多维关联度分值,其中,权重比值用于表征维度的重要程度;
S20523:根据多维关联度分值的高低对备选书籍进行筛选,以获得替换书籍集合,并根据替换书籍集合,生成优化推荐方案。
在S20521至S20523的实施方式中,首先衡量初始推荐书籍与备选书籍在各个评估维度上的相关性,其中包括知识图谱模型中的层级结构维度。关联度分值可以通过不同的计算方法得出,例如相似度计算、向量空间模型等。其次,需要获取各个评估维度的权重比值。权重比值可以通过多种方法获得,例如基于专家判断、数据分析或机器学习模型等。这些权重比值用于确定各个评估维度的重要程度。然后,根据权重比值和关联度分值,计算初始推荐书籍与备选书籍的多维关联度分值。这一步骤可以使用加权求和或其他数学计算方法来实现。
最后,根据计算得到的多维关联度分值,将备选书籍进行筛选。筛选的依据可以是多维关联度分值的高低,高分值表示备选书籍与初始推荐书籍在各个评估维度上的关联度更高。通过筛选,得到替换书籍集合,即在初始推荐方案中将备选书籍替换为更相关的书籍集合。
基于替换书籍集合,可以生成优化的推荐方案。生成过程可能涉及重新排序、调整推荐权重或采用其他推荐算法,以提供更符合读者需求的推荐结果。通过以上步骤的计算和筛选过程,可以得到一个经过优化的推荐方案,以提供更相关和个性化的推荐体验。
在一种可选的实施方式中,计算在知识图谱模型中的层级结构维度的关联度分值,包括:
确定初始推荐书籍在书籍本体中模型中上级分类号的类型和数量,以及备选书籍在书籍本体中模型中上级分类号的类型和数量;
根据初始推荐书籍在书籍本体中模型中上级分类号的类型和备选书籍在书籍本体中模型中上级分类号的类型的对比结果,确定初始推荐书籍与备选书籍中重合上级分类号的数量;
根据初始推荐书籍的上级分类号的数量、备选书籍的上级分类号的数量以及重合上级分类号的数量,计算层级结构维度的关联度分值。
在本实施方式中,定初始推荐书籍在书籍本体模型中的上级分类号的类型和数量,以及备选书籍在书籍本体模型中的上级分类号的类型和数量是为了了解推荐书籍和备选书籍在分类层级上的分布情况。
对比初始推荐书籍在书籍本体模型中的上级分类号类型和备选书籍在书籍本体模型中的上级分类号类型,可以确定初始推荐书籍与备选书籍中重合上级分类号的数量。这意味着在分类层级上,初始推荐书籍和备选书籍中有多少个相同的上级分类号。
根据初始推荐书籍的上级分类号数量、备选书籍的上级分类号数量以及重合上级分类号的数量,可以计算层级结构维度的关联度分值。关联度分值可以用于衡量初始推荐书籍和备选书籍在分类层级上的相关性。
作为示例的,假设初始推荐书籍为书籍A,备选书籍集合包括书籍B、书籍C和书籍D。每本书籍都在书籍本体模型中有对应的上级分类号。
初始推荐书籍A的上级分类号类型为:类型X、类型Y、类型Z,上级分类号数量为3。
备选书籍B的上级分类号类型为:类型X、类型Y,上级分类号数量为2。 备选书籍C的上级分类号类型为:类型Y、类型Z,上级分类号数量为2。 备选书籍D的上级分类号类型为:类型X、类型Z,上级分类号数量为2。
通过对比初始推荐书籍A的上级分类号类型和备选书籍的上级分类号类型,可以确定初始推荐书籍与备选书籍中重合上级分类号的数量为1(类型Y)。
根据初始推荐书籍的上级分类号数量3、备选书籍的上级分类号数量2以及重合上级分类号的数量1,可以计算层级结构维度的关联度分值。
则可以按照公式1计算层级结构维度的关联度分值:
J = |A ∩ B| / |A ∪ B|(1);
其中,J为层级结构维度的关联度分值,A代表初始推荐书籍的上级分类号的集合,B代表备选书籍的上级分类号的集合,|A ∩ B|表示重合上级分类号的数量,|A ∪ B|表示初始推荐书籍和备选书籍的上级分类号的总数量。
在上述示例中,关联度分值 = 1 / (3 + 2 ) = 1/5 = 0.2。这个关联度分值表示初始推荐书籍A与备选书籍B、C、D在层级结构维度上的关联程度为0.25,即它们在分类层级上存在一定的相关性。层级结构维度的关联度分值计算可以帮助评估初始推荐书籍与备选书籍之间在分类层级上的相似度或相关性。根据计算结果,可以更好地理解推荐结果与读者的需求之间的关系,进而进行推荐方案的优化或个性化调整。
本发明实施例还提供了一种智能读者行为分析预测系统数据采集分析装置,参照图3,示出了本发明一种智能读者行为分析预测系统数据采集分析装置300的功能模块图,该装置可以包括以下模块:
数据获取模块301,用于通过预设的数据接口获取读者至少一个维度的源行为数据,并确定每个维度的源行为数据的数据权重占比;
数据处理模块302,用于根据数据权重占比的大小,对每个维度的源行为数据进行数据处理,以获得每个维度的标准行为数据;
画像构建模块303,用于根据至少一个维度的行为标准数据,构建读者的至少一个初始画像,并根据数据权重占比从至少一个初始画像中筛选出至少一个目标画像;
初始推荐模块304,用于获取每个目标画像的各自对应的第一推荐结果,以及目标画像任意组合后对应的第二推荐结果,并根据第一推荐结果和第二推荐结果,生成初始推荐方案;
最终推荐模块305,用于将初始推荐方案发送至读者,并根据读者对初始推荐方案的反馈结果,执行不同的初始推荐方案优化策略。
在一种可选的实施方式中,数据获取模块包括:
参数确定子模块,用于确定源行为数据的数据类型标签以及源行为数据在整个数据集中的数据量占比;
第一权重确定子模块,用于根据数据类型标签与智能读者行为分析预测系统预设的数据处理模型的匹配情况,确定数据处理模型对源行为数据的支持能力,并根据支持能力,确定源行为数据的第一数据权重占比;
第二权重确定子模块,用于根据源行为数据的数据量占比,确定源行为数据的第二数据权重占比;
最终权重确定子模块,用于根据第一数据权重占比和第二数据权重占比,确定每源行为数据的数据权重占比。
在一种可选的实施方式中,数据处理模块包括,包括:
数据处理比例确定子模块,用于根据每个维度的源行为数据的数据权重占比,确定源行为数据对应的数据处理比例,其中,数据处理比例用于指示缩放数据的数值范围;
标准行为数据确定子模块,用于根据数据处理比例和源行为数据,确定标准行为数据。
在一种可选的实施方式中,画像构建模块,包括:
初始画像构建模块,用于确定每个维度的行为标准数据的数据特征标签,并根据数据特征标签构建对应的初始画像;
目标画像构建模块,用于将对应的数据权重占比大于或等于预设阈值的初始画像,确定为目标画像。
在一种可选的实施方式中,初始推荐模块,包括:
第一推荐子模块,用于将每个目标画像输入预设的第一推荐模型,以获得第一推荐结果,其中,第一推荐模型为协同过滤推荐模型;
第二推荐子模块,用于组合任意目标画像,以获得组合画像,将组合画像输入预设的第二推荐模型,以获得第二推荐结果,其中,第二推荐模型为混合推荐模型;
组合推荐子模块,用于根据第一推荐结果和第二推荐结果的重合推荐结果,生成初始推荐方案。
在一种可选的实施方式中,最终推荐模块包括:
第一推荐策略执行子模块,用于在反馈结果为接受指令的情况下,将初始推荐方案确定为最终推荐方案,并进行储存,其中,初始推荐方案至少包括一个初始推荐书籍;
第二推荐策略执行子模块,用于在反馈结果为替换指令的情况下,对初始推荐方案进行调整,以获得优化推荐方案,并执行将优化推荐方案发送至读者的步骤。
在一种可选的实施方式中,第二推荐策略执行子模块,包括:
单维度关联度分值计算单元,用于计算初始推荐书籍与备选书籍各个评估维度的关联度分值,其中,维度至少包括在知识图谱模型中的层级结构维度;
多维度关联度分值计算单元,用于获取各个评估维度的权重比值,并根据各个评估维度的权重比值以及关联度分值,计算初始推荐书籍与备选书籍的多维关联度分值,其中,权重比值用于表征维度的重要程度;
推荐方案生成单元,用于根据多维关联度分值的高低对备选书籍进行筛选,以获得替换书籍集合,并根据替换书籍集合,生成优化推荐方案。
在一种可选的实施方式中,单维度关联度分值计算单元,包括:
第一确定子单元,用于确定初始推荐书籍在书籍本体中模型中上级分类号的类型和数量,以及备选书籍在书籍本体中模型中上级分类号的类型和数量;
第二确定子单元,用于根据初始推荐书籍在书籍本体中模型中上级分类号的类型和备选书籍在书籍本体中模型中上级分类号的类型的对比结果,确定初始推荐书籍与备选书籍中重合上级分类号的数量;
计算子单元,用于根据初始推荐书籍的上级分类号的数量、备选书籍的上级分类号的数量以及重合上级分类号的数量,计算层级结构维度的关联度分值。
基于同一发明构思,本发明另一实施例提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信,
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现本发明的智能读者行为分析预测系统数据采集分析的方法。
上述终端提到的通信总线可以是外设部件互联标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述终端与其他设备之间的通信。存储器可以包括随机存取存储器(Random AccessMemory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
此外,为实现上述目的,本发明的实施例还提出了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现本发明实施例的智能读者行为分析预测系统数据采集分析的方法。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用车辆(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。“”和/或“”表示可以选择两者之中的任意一个,也可以两者都选择。而且,术语“”包括“”“”包含“”或者其任何其他变体意在涵盖非排他性地包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“”包括一个……“”限定的要素,并不排除在包括要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种智能读者行为分析预测系统数据采集分析的方法,其特征在于,应用于智能读者行为分析预测系统,所述方法包括:
通过预设的数据接口获取读者至少一个维度的源行为数据,并确定每个维度的所述源行为数据的数据权重占比;
根据所述数据权重占比的大小,对每个维度的所述源行为数据进行数据处理,以获得每个维度的标准行为数据;
根据所述至少一个维度的行为标准数据,构建读者的至少一个初始画像,并根据所述数据权重占比从所述至少一个初始画像中筛选出至少一个目标画像;
获取每个所述目标画像的各自对应的第一推荐结果,以及所述目标画像任意组合后对应的第二推荐结果,并根据所述第一推荐结果和所述第二推荐结果,生成初始推荐方案;
将所述初始推荐方案发送至所述读者,并根据所述读者对所述初始推荐方案的反馈结果,执行不同的初始推荐方案优化策略。
2.根据权利要求1所述的智能读者行为分析预测系统数据采集分析的方法,其特征在于,
所述确定每个维度的所述源行为数据的数据权重占比,包括:
确定所述源行为数据的数据类型标签以及所述源行为数据在整个数据集中的数据量占比;
根据所述数据类型标签与所述智能读者行为分析预测系统预设的数据处理模型的匹配情况,确定所述数据处理模型对所述源行为数据的支持能力,并根据所述支持能力,确定所述源行为数据的第一数据权重占比;
根据所述源行为数据的数据量占比,确定所述源行为数据的第二数据权重占比;
根据所述第一数据权重占比和所述第二数据权重占比,确定每所述源行为数据的数据权重占比。
3.根据权利要求1所述的智能读者行为分析预测系统数据采集分析的方法,其特征在于,所述根据所述数据权重占比的大小,对每个维度的所述源行为数据进行数据处理,以获得每个维度的标准行为数据,包括:
根据每个维度的所述源行为数据的数据权重占比,确定源行为数据对应的数据处理比例,其中,所述数据处理比例用于指示缩放数据的数值范围;
根据所述数据处理比例和所述源行为数据,确定所述标准行为数据;
所述标准行为数据的计算公式为:
Yi = Xi (Wi / ΣWj);
其中,Yi 表示第i个维度的标准行为数据;Xi 表示第i个维度的源行为数据;Wi 表示第i个维度的数据权重占比;ΣWj 表示所有维度的数据权重占比之和。
4.根据权利要求1所述的智能读者行为分析预测系统数据采集分析的方法,其特征在于,所述根据所述至少一个维度的行为标准数据,构建读者的至少一个初始画像,并根据所述数据权重占比从所述至少一个初始画像中筛选出至少一个目标画像,包括:
确定每个维度的所述行为标准数据的数据特征标签,并根据所述数据特征标签构建对应的初始画像;
将对应的所述数据权重占比大于或等于预设阈值的所述初始画像,确定为所述目标画像。
5.根据权利要求1所述的智能读者行为分析预测系统数据采集分析的方法,其特征在于,获取每个所述目标画像的各自对应的第一推荐结果,以及所述目标画像任意组合后对应的第二推荐结果,并根据所述第一推荐结果和所述第二推荐结果,生成初始推荐方案,包括:
将每个所述目标画像输入预设的第一推荐模型,以获得第一推荐结果,其中,所述第一推荐模型为协同过滤推荐模型;
组合任意所述目标画像,以获得组合画像,将所述组合画像输入预设的第二推荐模型,以获得第二推荐结果,其中,所述第二推荐模型为混合推荐模型;
根据所述第一推荐结果和所述第二推荐结果的重合推荐结果,生成所述初始推荐方案。
6.根据权利要求1所述的智能读者行为分析预测系统数据采集分析的方法,其特征在于,
所述反馈结果包括接受指令或替换指令,所述根据所述读者对所述初始推荐方案的反馈结果,执行不同的初始推荐方案优化策略,包括:
在所述反馈结果为所述接受指令的情况下,将所述初始推荐方案确定为最终推荐方案,并进行储存,其中,所述初始推荐方案至少包括一个初始推荐书籍;
在所述反馈结果为所述替换指令的情况下,对所述初始推荐方案进行调整,以获得优化推荐方案,并执行将所述优化推荐方案发送至所述读者的步骤。
7.根据权利要求6所述的智能读者行为分析预测系统数据采集分析的方法,其特征在于,所述对所述初始推荐方案进行调整,以获得优化推荐方案,包括:
计算所述初始推荐书籍与备选书籍各个评估维度的关联度分值,其中,所述维度至少包括在知识图谱模型中的层级结构维度;
获取所述各个评估维度的权重比值,并根据所述各个评估维度的权重比值以及关联度分值,计算所述初始推荐书籍与所述备选书籍的多维关联度分值,其中,所述权重比值用于表征所述维度的重要程度;
根据所述多维关联度分值的高低对所述备选书籍进行筛选,以获得替换书籍集合,并根据所述替换书籍集合,生成所述优化推荐方案。
8.根据权利要求7所述的智能读者行为分析预测系统数据采集分析的方法,其特征在于,计算在知识图谱模型中的层级结构维度的关联度分值,包括:
确定所述初始推荐书籍在书籍本体中模型中上级分类号的类型和数量,以及所述备选书籍在所述书籍本体中模型中上级分类号的类型和数量;
根据所述初始推荐书籍在书籍本体中模型中上级分类号的类型和所述备选书籍在书籍本体中模型中上级分类号的类型的对比结果,确定所述初始推荐书籍与所述备选书籍中重合上级分类号的数量;
根据所述初始推荐书籍的上级分类号的数量、所述备选书籍的上级分类号的数量以及所述重合上级分类号的数量,计算所述层级结构维度的关联度分值;
所述关联度分值的计算公式为:
J = |A ∩ B| / |A ∪ B|;
其中,J为层级结构维度的关联度分值,A代表初始推荐书籍的上级分类号的集合,B代表备选书籍的上级分类号的集合,|A ∩ B|表示重合上级分类号的数量,|A ∪ B|表示初始推荐书籍和备选书籍的上级分类号的总数量。
9.一种智能读者行为分析预测系统数据采集分析的装置,其特征在于,所述装置包括:
数据获取模块,用于通过预设的数据接口获取读者至少一个维度的源行为数据,并确定每个维度的所述源行为数据的数据权重占比;
数据处理模块,用于根据所述数据权重占比的大小,对每个维度的所述源行为数据进行数据处理,以获得每个维度的标准行为数据;
画像构建模块,用于根据所述至少一个维度的行为标准数据,构建读者的至少一个初始画像,并根据所述数据权重占比从所述至少一个初始画像中筛选出至少一个目标画像;
初始推荐模块,用于获取每个所述目标画像的各自对应的第一推荐结果,以及所述目标画像任意组合后对应的第二推荐结果,并根据所述第一推荐结果和所述第二推荐结果,生成初始推荐方案;
最终推荐模块,用于将所述初始推荐方案发送至所述读者,并根据所述读者对所述初始推荐方案的反馈结果,执行不同的初始推荐方案优化策略。
10.根据权利要求9所述的智能读者行为分析预测系统数据采集分析的装置,其特征在于,所述数据获取模块包括:
参数确定子模块,用于确定所述源行为数据的数据类型标签以及所述源行为数据在整个数据集中的数据量占比;
第一权重确定子模块,用于根据所述数据类型标签与所述智能读者行为分析预测系统预设的数据处理模型的匹配情况,确定所述数据处理模型对所述源行为数据的支持能力,并根据所述支持能力,确定所述源行为数据的第一数据权重占比;
第二权重确定子模块,用于根据所述源行为数据的数据量占比,确定所述源行为数据的第二数据权重占比;
最终权重确定子模块,用于根据所述第一数据权重占比和所述第二数据权重占比,确定每所述源行为数据的数据权重占比。
CN202310785191.6A 2023-06-29 2023-06-29 智能读者行为分析预测系统数据采集分析的方法和装置 Active CN116523546B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310785191.6A CN116523546B (zh) 2023-06-29 2023-06-29 智能读者行为分析预测系统数据采集分析的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310785191.6A CN116523546B (zh) 2023-06-29 2023-06-29 智能读者行为分析预测系统数据采集分析的方法和装置

Publications (2)

Publication Number Publication Date
CN116523546A true CN116523546A (zh) 2023-08-01
CN116523546B CN116523546B (zh) 2023-12-19

Family

ID=87399703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310785191.6A Active CN116523546B (zh) 2023-06-29 2023-06-29 智能读者行为分析预测系统数据采集分析的方法和装置

Country Status (1)

Country Link
CN (1) CN116523546B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017080320A1 (zh) * 2015-11-09 2017-05-18 北京奇虎科技有限公司 书籍库中相似书的挖掘、净化方法和装置
WO2020248843A1 (zh) * 2019-06-14 2020-12-17 平安科技(深圳)有限公司 基于大数据的画像分析方法、装置、计算机设备及存储介质
CN112424763A (zh) * 2019-04-30 2021-02-26 北京字节跳动网络技术有限公司 对象推荐方法及装置、存储介质与终端设备
CN112732787A (zh) * 2021-01-02 2021-04-30 西北工业大学 面向动车组重要部件的设备画像与个性化运维服务方法
CN115098803A (zh) * 2022-08-24 2022-09-23 深圳市华图测控系统有限公司 一种基于移动图书馆的图书推荐算法以及系统
CN115204971A (zh) * 2022-06-23 2022-10-18 平安科技(深圳)有限公司 产品推荐方法、装置、电子设备及计算机可读存储介质
CN115640454A (zh) * 2022-09-09 2023-01-24 中国银行股份有限公司 一种产品推荐方法、系统、电子设备及存储介质
CN115829673A (zh) * 2022-11-02 2023-03-21 深圳市分米智行信息技术有限公司 基于大数据的电子商城用户偏好分析方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017080320A1 (zh) * 2015-11-09 2017-05-18 北京奇虎科技有限公司 书籍库中相似书的挖掘、净化方法和装置
CN112424763A (zh) * 2019-04-30 2021-02-26 北京字节跳动网络技术有限公司 对象推荐方法及装置、存储介质与终端设备
WO2020248843A1 (zh) * 2019-06-14 2020-12-17 平安科技(深圳)有限公司 基于大数据的画像分析方法、装置、计算机设备及存储介质
CN112732787A (zh) * 2021-01-02 2021-04-30 西北工业大学 面向动车组重要部件的设备画像与个性化运维服务方法
CN115204971A (zh) * 2022-06-23 2022-10-18 平安科技(深圳)有限公司 产品推荐方法、装置、电子设备及计算机可读存储介质
CN115098803A (zh) * 2022-08-24 2022-09-23 深圳市华图测控系统有限公司 一种基于移动图书馆的图书推荐算法以及系统
CN115640454A (zh) * 2022-09-09 2023-01-24 中国银行股份有限公司 一种产品推荐方法、系统、电子设备及存储介质
CN115829673A (zh) * 2022-11-02 2023-03-21 深圳市分米智行信息技术有限公司 基于大数据的电子商城用户偏好分析方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘芳;朱沙;: "基于读者画像的高校图书馆精准服务研究", 大学图书情报学刊, no. 01, pages 75 - 77 *
解娜;: "基于用户画像的读者周边好书推荐服务研究", 情报探索, no. 08, pages 109 - 113 *

Also Published As

Publication number Publication date
CN116523546B (zh) 2023-12-19

Similar Documents

Publication Publication Date Title
CN109902708B (zh) 一种推荐模型训练方法及相关装置
Sohnesen et al. Is random forest a superior methodology for predicting poverty? An empirical assessment
CN109145245A (zh) 预测点击率的方法、装置、计算机设备及存储介质
Lee et al. Technology opportunity analysis based on recombinant search: patent landscape analysis for idea generation
CN106251174A (zh) 信息推荐方法及装置
CN111815415A (zh) 一种商品推荐方法、系统及设备
CN110008397B (zh) 一种推荐模型训练方法及装置
CN111242310B (zh) 特征有效性评估方法、装置、电子设备及存储介质
CN105184618A (zh) 新用户的商品个性化推荐方法及系统
CN110427560A (zh) 一种应用于推荐系统的模型训练方法以及相关装置
CN112559900B (zh) 产品推荐方法、装置、计算机设备和存储介质
CN112966189B (zh) 一种基金产品推荐系统
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN112487283A (zh) 训练模型的方法、装置、电子设备及可读存储介质
CN111159563A (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
CN113407854A (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
CN118043802A (zh) 一种推荐模型训练方法及装置
CN115311042A (zh) 商品推荐方法、装置、计算机设备和存储介质
CN117522519A (zh) 产品推荐方法、装置、设备、存储介质和程序产品
CN117892011A (zh) 基于大数据的智能信息推送方法及系统
CN112632275A (zh) 基于个人文本信息的人群聚类数据处理方法、装置及设备
CN116523546B (zh) 智能读者行为分析预测系统数据采集分析的方法和装置
KR20200145346A (ko) 상품 또는 컨텐츠 추천 서비스 제공 프로그램
CN117172851A (zh) 一种互联网广告效果的评估方法、装置及电子设备
CN112581250B (zh) 模型生成方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant