CN116304351B - 一种基于大数据的智能数据信息统计管理系统及方法 - Google Patents
一种基于大数据的智能数据信息统计管理系统及方法 Download PDFInfo
- Publication number
- CN116304351B CN116304351B CN202310316717.6A CN202310316717A CN116304351B CN 116304351 B CN116304351 B CN 116304351B CN 202310316717 A CN202310316717 A CN 202310316717A CN 116304351 B CN116304351 B CN 116304351B
- Authority
- CN
- China
- Prior art keywords
- user
- comment
- information
- data
- preference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000012216 screening Methods 0.000 claims abstract description 9
- 230000006399 behavior Effects 0.000 claims description 91
- 238000007726 management method Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 18
- 238000013507 mapping Methods 0.000 claims description 14
- 230000036651 mood Effects 0.000 claims description 13
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 238000013075 data extraction Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 230000009471 action Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据信息统计管理领域,具体为一种基于大数据的智能数据信息统计管理系统及方法,包括对用户在智能设备产生的每一个历史浏览记录进行分析,筛选出有效历史浏览记录,获取有效历史浏览记录对应的历史行为数据,根据历史行为数据对疑似偏爱值进行计算;对用户疑似偏爱信息内容的所属信息类型进行判定,将信息类型记为用户偏爱信息类型;建立用户评论行为模型,得到偏爱信息类型中各个信息内容对应的评论显示内容;对评论区显示内容进行特征提取,得到评论显示内容对应的特征评论数据;向用户推荐信息类型对应的信息内容,并将含有特征评论数据对应评论内容显示次序进行提高。
Description
技术领域
本发明涉及数据信息统计管理领域,具体为一种基于大数据的智能数据信息统计管理系统及方法。
背景技术
随着互联网发展以及内容的迅速膨胀,在网上会出现很多信息供给用户进行阅读,用户的选择也更加广泛,对于一个网站或软件而言用户黏性对于其具有重要作用,用户黏性是用户对于使用互联网产品产生持续使用的意愿,黏度另一方面也可以体现出用户对于该互联网产品承诺,对于互联网产品来说用户的黏度越高,那么用户对于该互联网产品愿意付出的就越多,对该互联网产品在收益和后续的发展上有巨大的帮助,但是如何提高用户的黏度缺不是那么简单,提高用户对于互联网产品的黏度需要为用户提供用户喜爱的信息,但是如何获取用户喜好的信息并将按照用户偏好对信息排布,面前市面上的解决方法仍然存在不足。
发明内容
本发明的目的在于提供一种基于大数据的智能数据信息统计管理系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的智能数据信息统计管理方法,方法包括:
步骤S100:对用户在智能设备产生的每一个历史浏览记录进行分析,筛选出有效历史浏览记录,对有效历史浏览记录进行数据提取,获取有效历史浏览记录对应的历史行为数据,根据历史行为数据对疑似偏爱值进行计算,将疑似偏爱值大于疑似偏爱值阈值的历史行为数据进行保留,提取历史行为数据对应的信息内容,将信息内容记为用户疑似偏爱信息内容;
步骤S200:对用户疑似偏爱信息内容的所属信息类型进行判定,获得用户疑似偏爱信息内容对应的信息类型,对信息类型相同对应的有效历史浏览记录进行提取,得到信息类型的用户偏向数据;根据用户偏向数据计算用户偏爱值,将用户偏爱值大于用户偏爱值阈值的信息类型进行保留,将信息类型记为用户偏爱信息类型;
步骤S300:对用户偏爱信息类型中各个信息内容中用户评论区行为进行分析,获取用户对应的用户评论行为数据;当用户评论次数大于评论次数阈值时,提取用户偏爱信息类型中各个信息内容评论区的评论显示内容;对评论区显示内容提取表情包数据、评论语气数据,将出现频率次数大于次数阈值的表情包数据或者评论语气数据作为对应用户偏爱信息类型的特征评论数据;
步骤S400:基于用户偏爱信息类型和特征评论数据,向用户推荐用户偏爱信息类型对应的信息内容,并将含有特征评论数据对应评论内容显示次序进行提高。
进一步的,步骤S100包括:
步骤S101:当历史浏览记录中存在用户浏览时间大于浏览时间阈值时,将历史浏览记录进行保留,将保留的历史浏览记录记为有效历史浏览记录,对有效历史浏览记录进行用户行为提取,获取有效历史浏览记录对应的历史行为数据,历史行为数据包括用户对信息内容的浏览时间、滑动次数;对历史行为数据对应的信息内容进行用户疑似偏爱评估;
步骤S102:用户疑似偏爱评估包括,对历史行为数据进行归一化处理,对原始的历史行为数据进行线性变换,将数据映射到[0,1]之间,根据历史行为数据进行归一化处理的映射结果,计算用户的疑似偏爱值V:
V=(d+b)×δ:
其中,d为用户对信息内容浏览时间进行归一化处理后的映射值,b为用户对信息内容滑动次数进行归一化处理后的映射值;δ为疑似偏爱值对应的偏爱影响系数;
步骤S103:当疑似偏爱值大于疑似偏爱值阈值,对历史行为数据进行保留,提取用户的历史行为数据对应的信息内容,将信息内容记为用户疑似偏爱信息内容;
上述步骤中获取用户在互联网上的历史浏览记录,历史浏览记录包括用户对信息内容浏览时间、滑动次数,因为这些数据体现了用户对互联网上信息内容的疑似偏爱程度,当用户对一个信息内容浏览时间越长并且累积滑动次数较多,那么可以认为该用户对该信息内容比较感兴趣,所以将该信息内容作为用户的疑似偏爱信息内容。
进一步的,步骤S200包括:
步骤S201:对用户疑似偏爱信息内容进行所属信息类型判定,其中,判定的过程为对用户疑似偏爱信息内容进行关键字提取汇集,得到用户疑似偏爱信息内容对应的关键字集合,当从两部分用户疑似偏爱信息内容中提取得到的关键字集合之间相似度大于相似度阈值时,判定两部分用户疑似偏爱信息内容属于相同信息类型;对信息类型相同的各个用户疑似偏爱信息内容对应的有效历史浏览记录进行提取,得到对应信息类型的用户偏向数据;用户偏向数据包括信息类型数据包括有效历史浏览记录的总次数、有效历史浏览记录的平均值疑似偏爱值;
步骤S202:计算信息类型对应的用户偏爱值P:
P=h×e×μ;
其中,h为有效历史浏览记录的总次数;e为有效历史浏览记录的平均值疑似偏爱值;μ为信息类型对应的用户偏爱值影响系数;
步骤S203:对信息类型对应的用户偏爱值进行汇集,得到集合U,将集合U中的用户偏爱值大于用户偏爱值阈值对应的信息类型进行保留,将信息类型记为用户偏爱信息类型;
上述步骤中将信息内容按照对应的其对应的信息类型将其分类,是因为需要对用户按照信息类型的不同对,但是如果从这些信息内容进行类型提取,将信息内容中包含同一类型的数据进行分类出来,那么在后面对用户进行信息内容推荐时只需要将包含该信息类型对应的信息内容进行操作就可以了,得到对应信息类型的用户偏向数据;用户偏向数据包括信息类型数据包括有效历史浏览记录的总次数、有效历史浏览记录的平均值疑似偏爱值;是因为在该信息类型上浏览次数越多,那么用户则是越经常浏览该信息类型,用户对该信息类型的信息内容也越感兴趣,平均值疑似偏爱值则是体现出用户用户在该互联网产品中信息类型喜爱情况,也可以表示用户对该信息类型的整体偏爱情况。
进一步的,步骤S300包括:
步骤S301:对用户偏爱信息类型中各个信息内容的用户评论行为进行分析,获取用户对应的用户评论行为数据;用户行为数据包括用户在各个信息内容评论区下的评论次数;当用户偏爱信息类型对应的信息内容评论区中的评论次数大于评论次数阈值时,对信息内容评论区显示内容进行保留;
步骤S302:对保留的各个评论显示内容提取表情包数据、评论语气数据;将出现频率次数大于次数阈值的表情包数据或者评论语气数据作为对应用户偏爱信息类型的特征评论数据;
评论字数都可以体现出评论区对该用户吸引力,对用户在评论区行为进行监测,将出现频率次数大于次数阈值的表情包数据或者评论语气数据作为对应用户偏爱信息类型的特征评论数据,可以吸引用户打开评论区并在评论区进行互动让用户有参与感也是提高用户对于互联网产品黏度的有效手段之一。
进一步的,步骤S400包括:
步骤S401:根据用户偏爱信息类型,对智能设备推荐的内容信息进行数据优化,增加用户偏爱信息类型对应的内容信息的推荐频率;
步骤S402:基于特征评论数据,对信息内容中的评论显示次序进行处理,当评论内容符合特征评论数据,将评论内容显示次序进行提高;当评论内容不符合特征评论数据,对评论内容展现次序不做处理。
为更好的实现上述方法还提出了基于大数据的智能数据信息统计管理系统,系统包括疑似偏爱信息内容模块、偏爱信息类型模块、偏爱评论获取模块、内容展示模块;
疑似偏爱信息内容模块,用于对用户在智能设备产生的每一个历史浏览记录进行分析,筛选出有效历史浏览记录,对有效历史浏览记录进行数据提取,获取有效历史浏览记录对应的历史行为数据,提取历史行为数据对应的信息内容,将信息内容记为用户疑似偏爱信息内容;
偏爱信息类型模块,用于对用户疑似偏爱信息内容的所属信息类型进行判定,获得用户疑似偏爱信息内容对应的信息类型,对信息类型对应的信息类型数据进行提取,根据信息类型数据计算用户偏爱值,将用户偏爱值大于用户偏爱值阈值的信息类型进行保留,将信息类型记为用户偏爱信息类型;
偏爱评论获取模块,用于对用户在信息类型中评论区行为进行数据提取,建立用户评论行为模型,对用户行为数据进行分析,获取信息类型评论区的评论吸引数据,对评论区显示内容进行特征提取,得到评论显示内容对应的特征评论数据;
内容展示模块,用于对基于用户偏爱信息类型和特征评论数据,向用户推荐信息类型对应的信息内容,并将含有特征评论数据对应评论内容显示次序进行提高。
进一步的,疑似偏爱信息内容模块包括疑似偏爱值单元、疑似偏爱信息内容单元;
疑似偏爱值单元,用于根据历史行为数据对历史行为数据对应的信息内容进行用户疑似偏爱评估,得到用户的疑似偏爱值;
疑似偏爱信息内容单元,用于对当疑似偏爱值大于疑似偏爱值阈值,对历史行为数据进行保留,提取用户的历史行为数据对应的信息内容,将信息内容记为用户疑似偏爱信息内容。
进一步的,偏爱信息类型模快包括用户偏爱值单元、偏爱信息类型单元;
用户偏爱值单元,用于对按照信息内容涉及的不同信息类型,对信息内容进行分类,对信息类型相同的各个用户疑似偏爱信息内容对应的有效历史浏览记录进行提取,得到对应信息类型的用户偏向数据,对用户偏爱值进行计算;
偏爱信息类型单元,用于对信息类型对应的用户偏爱值进行汇集,对汇集的数据进行筛选,得到用户偏爱的信息类型。
进一步的,偏爱评论获取模块包括用户行为单元、偏爱特征评论数据单元;
用户行为单元,用于对用户偏爱信息类型中的各个信息内容的用户评论区行为进行分析;
偏爱特征评论数据单元,用于对各个评论显示内容进行关键内容提取,得到信息类型对应的评论内容数据;对评论内容数据进行特征提取,得到评论显示内容对应的特征评论数据。
进一步的,内容展示模块包括内容信息展示单元、评论内容展示单元;
内容信息展示单元,用于对根据用户偏爱信息类型,对智能设备推荐的内容信息进行数据优化,增加用户偏爱信息类型对应的内容信息的推荐频率;
评论内容展示单元,用于对基于特征评论数据,对信息内容中的评论显示次序进行处理,当评论内容符合特征评论数据,将评论内容显示次序进行提高;当评论内容不符合偏爱特征评论数据,对评论内容展现次序不做处理。
与现有技术相比,本发明所达到的有益效果是:本发明可以根据用户的历史浏览记录进行分析,获取用户偏爱的信息类型和偏爱特征评论数据,向用户推荐信息类型对应的信息内容,并将包含偏爱特征评论数据对应评论内容显示次序做出调整,提高用户对互联网产品的黏度,将信息内容中包含同一类型的数据进行分类出来,那么在后面对用户进行信息内容推荐时只需要将包含该信息类型对应的信息内容进行操作就可以了,用户偏向数据包括信息类型数据包括有效历史浏览记录的总次数、有效历史浏览记录的平均值疑似偏爱值;是因为在该信息类型上浏览次数越多,那么用户则是越经常浏览该信息类型,用户对该信息类型的信息内容也越感兴趣,平均值疑似偏爱值则是体现出用户用户在该互联网产品中信息类型喜爱情况,也可以表示用户对该信息类型的整体偏爱情况。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种基于大数据的智能数据信息统计管理系统及方法的方法流程图;
图2是本发明一种基于大数据的智能数据信息统计管理系统及方法的模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图2,本发明提供技术方案:一种基于大数据的智能数据信息统计管理方法,方法包括:
本发明的目的在于提供一种基于大数据的智能数据信息统计管理系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的智能数据信息统计管理方法,方法包括:
步骤S100:对用户在智能设备产生的每一个历史浏览记录进行分析,筛选出有效历史浏览记录,对有效历史浏览记录进行数据提取,获取有效历史浏览记录对应的历史行为数据,根据历史行为数据对疑似偏爱值进行计算,将疑似偏爱值大于疑似偏爱值阈值的历史行为数据进行保留,提取历史行为数据对应的信息内容,将信息内容记为用户疑似偏爱信息内容;
其中,步骤S100包括:
步骤S101:当历史浏览记录中存在用户浏览时间大于浏览时间阈值时,将历史浏览记录进行保留,将保留的历史浏览记录记为有效历史浏览记录,对有效历史浏览记录进行用户行为提取,获取有效历史浏览记录对应的历史行为数据,历史行为数据包括用户对信息内容的浏览时间、滑动次数;对历史行为数据对应的信息内容进行用户疑似偏爱评估;
步骤S102:用户疑似偏爱评估包括,对历史行为数据进行归一化处理,对原始的历史行为数据进行线性变换,将数据映射到[0,1]之间,根据历史行为数据进行归一化处理的映射结果,计算用户的疑似偏爱值V:
V=(d+b)×δ:
其中,d为用户对信息内容浏览时间进行归一化处理后的映射值,b为用户对信息内容滑动次数进行归一化处理后的映射值;δ为疑似偏爱值对应的偏爱影响系数;
例如,用户对信息内容浏览时间进行归一化处理后的映射值d为0.8;用户对信息内容滑动次数进行归一化处理后的映射值b为0.7;疑似偏爱值对应的偏爱影响系数δ为0.4;用户的疑似偏爱值V=(0.7+0.8)×0.4=0.60;
步骤S103:当疑似偏爱值大于疑似偏爱值阈值,对历史行为数据进行保留,提取用户的历史行为数据对应的信息内容,将信息内容记为用户疑似偏爱信息内容;
步骤S200:对用户疑似偏爱信息内容的所属信息类型进行判定,获得用户疑似偏爱信息内容对应的信息类型,对信息类型相同对应的有效历史浏览记录进行提取,得到信息类型的用户偏向数据;根据用户偏向数据计算用户偏爱值,将用户偏爱值大于用户偏爱值阈值的信息类型进行保留,将信息类型记为用户偏爱信息类型;
其中,步骤S200包括:
步骤S201:对用户疑似偏爱信息内容进行所属信息类型判定,其中,判定的过程为对用户疑似偏爱信息内容进行关键字提取汇集,得到用户疑似偏爱信息内容对应的关键字集合,当从两部分用户疑似偏爱信息内容中提取得到的关键字集合之间相似度大于相似度阈值时,判定两部分用户疑似偏爱信息内容属于相同信息类型;对信息类型相同的各个用户疑似偏爱信息内容对应的有效历史浏览记录进行提取,得到对应信息类型的用户偏向数据;用户偏向数据包括信息类型数据包括有效历史浏览记录的总次数、有效历史浏览记录的平均值疑似偏爱值;
步骤S202:计算信息类型对应的用户偏爱值P:
P=h×e×μ;
其中,h为有效历史浏览记录的总次数;e为有效历史浏览记录的平均值疑似偏爱值;μ为信息类型对应的用户偏爱值影响系数;
例如,有效历史浏览记录的总次数h为0.6;有效历史浏览记录的平均值疑似偏爱值e为0.7;信息类型对应的用户偏爱值影响系数μ为0.8;用户偏爱值P=0.8×0.7×0.8=0.448;
步骤S203:对信息类型对应的用户偏爱值进行汇集,得到集合U,将集合U中的用户偏爱值大于用户偏爱值阈值对应的信息类型进行保留,将信息类型记为用户偏爱信息类型;
步骤S300:对用户偏爱信息类型中各个信息内容中用户评论区行为进行分析,获取用户对应的用户评论行为数据;当用户评论次数大于评论次数阈值时,提取用户偏爱信息类型中各个信息内容评论区的评论显示内容;对评论区显示内容提取表情包数据、评论语气数据,将出现频率次数大于次数阈值的表情包数据或者评论语气数据作为对应用户偏爱信息类型的特征评论数据;
其中,步骤S300包括:
步骤S301:对用户偏爱信息类型中各个信息内容的用户评论行为进行分析,获取用户对应的用户评论行为数据;用户行为数据包括用户在各个信息内容评论区下的评论次数;当用户偏爱信息类型对应的信息内容评论区中的评论次数大于评论次数阈值时,对信息内容评论区显示内容进行保留;
步骤S302:对保留的各个评论显示内容提取表情包数据、评论语气数据;将出现频率次数大于次数阈值的表情包数据或者评论语气数据作为对应用户偏爱信息类型的特征评论数据;
步骤S400:基于用户偏爱信息类型和特征评论数据,向用户推荐用户偏爱信息类型对应的信息内容,并将含有特征评论数据对应评论内容显示次序进行提高;
其中,步骤S400包括:
步骤S401:根据用户偏爱信息类型,对智能设备推荐的内容信息进行数据优化,增加用户偏爱信息类型对应的内容信息的推荐频率;
步骤S402:基于特征评论数据,对信息内容中的评论显示次序进行处理,当评论内容符合特征评论数据,将评论内容显示次序进行提高;当评论内容不符合特征评论数据,对评论内容展现次序不做处理;
为更好的实现上述方法还提出了基于大数据的智能数据信息统计管理系统,系统包括疑似偏爱信息内容模块、偏爱信息类型模块、偏爱评论获取模块、内容展示模块;
疑似偏爱信息内容模块,用于对用户在智能设备产生的每一个历史浏览记录进行分析,筛选出有效历史浏览记录,对有效历史浏览记录进行数据提取,获取有效历史浏览记录对应的历史行为数据,提取历史行为数据对应的信息内容,将信息内容记为用户疑似偏爱信息内容;
偏爱信息类型模块,用于对用户疑似偏爱信息内容的所属信息类型进行判定,获得用户疑似偏爱信息内容对应的信息类型,对信息类型对应的信息类型数据进行提取,根据信息类型数据计算用户偏爱值,将用户偏爱值大于用户偏爱值阈值的信息类型进行保留,将信息类型记为用户偏爱信息类型;
偏爱评论获取模块,用于对用户在信息类型中评论区行为进行数据提取,建立用户评论行为模型,对用户行为数据进行分析,获取信息类型评论区的评论吸引数据,对评论区显示内容进行特征提取,得到评论显示内容对应的特征评论数据;
内容展示模块,用于对基于用户偏爱信息类型和特征评论数据,向用户推荐信息类型对应的信息内容,并将含有特征评论数据对应评论内容显示次序进行提高;
其中,疑似偏爱信息内容模块包括疑似偏爱值单元、疑似偏爱信息内容单元;
疑似偏爱值单元,用于根据历史行为数据对历史行为数据对应的信息内容进行用户疑似偏爱评估,得到用户的疑似偏爱值;
疑似偏爱信息内容单元,用于对当疑似偏爱值大于疑似偏爱值阈值,对历史行为数据进行保留,提取用户的历史行为数据对应的信息内容,将信息内容记为用户疑似偏爱信息内容;
其中,偏爱信息类型模快包括用户偏爱值单元、偏爱信息类型单元;
用户偏爱值单元,用于对按照信息内容涉及的不同信息类型,对信息内容进行分类,对信息类型相同的各个用户疑似偏爱信息内容对应的有效历史浏览记录进行提取,得到对应信息类型的用户偏向数据,对用户偏爱值进行计算;
偏爱信息类型单元,用于对信息类型对应的用户偏爱值进行汇集,对汇集的数据进行筛选,得到用户偏爱的信息类型;
其中,偏爱评论获取模块包括用户行为单元、偏爱特征评论数据单元;
用户行为单元,用于对用户偏爱信息类型中的各个信息内容的用户评论区行为进行分析;
偏爱特征评论数据单元,用于对各个评论显示内容进行关键内容提取,得到信息类型对应的评论内容数据;对评论内容数据进行特征提取,得到评论显示内容对应的特征评论数据;
其中,内容展示模块包括内容信息展示单元、评论内容展示单元;
内容信息展示单元,用于对根据用户偏爱信息类型,对智能设备推荐的内容信息进行数据优化,增加用户偏爱信息类型对应的内容信息的推荐频率;
评论内容展示单元,用于对基于特征评论数据,对信息内容中的评论显示次序进行处理,当评论内容符合特征评论数据,将评论内容显示次序进行提高;当评论内容不符合特征评论数据,对评论内容展现次序不做处理。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于大数据的智能数据信息统计管理方法,其特征在于,所述方法包括:
步骤S100:对用户在智能设备产生的每一个历史浏览记录进行分析,筛选出有效历史浏览记录,对所述有效历史浏览记录进行数据提取,获取所述有效历史浏览记录对应的历史行为数据,根据所述历史行为数据对疑似偏爱值进行计算,将疑似偏爱值大于疑似偏爱值阈值的历史行为数据进行保留,提取所述历史行为数据对应的信息内容,将所述信息内容记为用户疑似偏爱信息内容;
所述步骤S100包括:
步骤S101:当所述历史浏览记录中存在用户浏览时间大于浏览时间阈值时,将历史浏览记录进行保留,将保留的历史浏览记录记为有效历史浏览记录,对有效历史浏览记录进行用户行为提取,获取有效历史浏览记录对应的历史行为数据,所述历史行为数据包括用户对信息内容的浏览时间、滑动次数;对历史行为数据对应的信息内容进行用户疑似偏爱评估;
步骤S102:所述用户疑似偏爱评估包括,对所述历史行为数据进行归一化处理,对原始的历史行为数据进行线性变换,将数据映射到[0,1]之间,根据所述历史行为数据进行归一化处理的映射结果,计算用户的疑似偏爱值V:
V=(d+b)×δ:
其中,d为用户对信息内容浏览时间进行归一化处理后的映射值,b为用户对信息内容滑动次数进行归一化处理后的映射值;δ为疑似偏爱值对应的偏爱影响系数;
步骤S103:当疑似偏爱值大于疑似偏爱值阈值,对历史行为数据进行保留,提取用户的历史行为数据对应的信息内容,将所述信息内容记为用户疑似偏爱信息内容;
步骤S200:对用户疑似偏爱信息内容的所属信息类型进行判定,获得所述用户疑似偏爱信息内容对应的信息类型,对信息类型相同的各个用户疑似偏爱信息内容对应的有效历史浏览记录进行提取,得到所述信息类型的用户偏向数据;根据用户偏向数据计算用户偏爱值,将用户偏爱值大于用户偏爱值阈值的信息类型进行保留,记为用户偏爱信息类型;
所述步骤S200包括:
步骤S201:对用户疑似偏爱信息内容进行所属信息类型判定,其中,判定的过程为对用户疑似偏爱信息内容进行关键字提取汇集,得到用户疑似偏爱信息内容对应的关键字集合,当从两部分用户疑似偏爱信息内容中提取得到的关键字集合之间相似度大于相似度阈值时,判定所述两部分用户疑似偏爱信息内容属于相同信息类型;对信息类型相同的各个用户疑似偏爱信息内容对应的有效历史浏览记录进行提取,得到对应信息类型的用户偏向数据;所述用户偏向数据包括信息类型数据包括有效历史浏览记录的总次数、有效历史浏览记录的平均值疑似偏爱值;
步骤S202:计算信息类型对应的用户偏爱值P:
P=h×e×μ;
其中,h为有效历史浏览记录的总次数;e为有效历史浏览记录的平均值疑似偏爱值;μ为信息类型对应的用户偏爱值影响系数;
步骤S203:对信息类型对应的用户偏爱值进行汇集,得到集合U,将集合U中的用户偏爱值大于用户偏爱值阈值对应的信息类型进行保留,将所述信息类型记为用户偏爱信息类型;
步骤S300:对用户偏爱信息类型中各个信息内容中用户评论区行为进行分析,获取用户对应的用户评论行为数据;当用户评论次数大于评论次数阈值时,提取用户偏爱信息类型中各个信息内容评论区的评论显示内容;对所述评论区显示内容提取表情包数据、评论语气数据,将出现频率次数大于次数阈值的表情包数据或者评论语气数据作为对应所述用户偏爱信息类型的特征评论数据;
步骤S400:基于用户偏爱信息类型和特征评论数据,向用户推荐用户偏爱信息类型对应的信息内容,并将含有特征评论数据对应评论内容显示次序进行提高。
2.根据权利要求1所述的一种基于大数据的智能数据信息统计管理方法,其特征在于,所述步骤S300包括:
步骤S301:对所述用户偏爱信息类型中各个信息内容的用户评论行为进行分析,获取用户对应的用户评论行为数据;用户行为数据包括用户在各个信息内容评论区下的评论次数;当用户偏爱信息类型对应的信息内容评论区中的评论次数大于评论次数阈值时,对信息内容评论区显示内容进行保留;
步骤S302:对保留的各个评论显示内容提取表情包数据、评论语气数据;将出现频率次数大于次数阈值的表情包数据或者评论语气数据作为对应所述用户偏爱信息类型的特征评论数据。
3.根据权利要求2所述的一种基于大数据的智能数据信息统计管理方法,其特征在于,所述步骤S400包括:
步骤S401:根据所述用户偏爱信息类型,对所述智能设备推荐的内容信息进行数据优化,增加所述用户偏爱信息类型对应的内容信息的推荐频率;
步骤S402:基于特征评论数据,对信息内容中的评论显示次序进行处理,当评论内容符合特征评论数据,将评论内容显示次序进行提高;当评论内容不符合特征评论数据,对评论内容展现次序不做处理。
4.一种智能数据信息统计管理系统,其应用权利要求1-3中任意一项所述的一种基于大数据的智能数据信息统计管理方法,其特征在于,所述系统包括疑似偏爱信息内容模块、偏爱信息类型模块、偏爱评论获取模块、内容展示模块;
所述疑似偏爱信息内容模块,用于对用户在智能设备产生的每一个历史浏览记录进行分析,筛选出有效历史浏览记录,对所述有效历史浏览记录进行数据提取,获取所述有效历史浏览记录对应的历史行为数据,提取所述历史行为数据对应的信息内容,将所述信息内容记为所述用户疑似偏爱信息内容;
所述偏爱信息类型模块,用于对所述用户疑似偏爱信息内容的所属信息类型进行判定,获得所述用户疑似偏爱信息内容对应的信息类型,对所述信息类型对应的信息类型数据进行提取,根据所述信息类型数据计算用户偏爱值,将所述用户偏爱值大于用户偏爱值阈值的信息类型进行保留,将所述信息类型记为用户偏爱信息类型;
所述偏爱评论获取模块,用于对用户在所述信息类型中评论区行为进行数据提取,建立用户评论行为模型,对用户行为数据进行分析,获取所述信息类型评论区的评论吸引数据,对所述评论区显示内容进行特征提取,得到所述评论显示内容对应的特征评论数据;
所述内容展示模块,用于对基于所述用户偏爱信息类型和所述特征评论数据,向所述用户推荐所述信息类型对应的信息内容,并将含有所述特征评论数据对应评论内容显示次序进行提高。
5.根据权利要求4所述的智能数据信息统计管理系统,其特征在于,所述疑似偏爱信息内容模块包括疑似偏爱值单元、疑似偏爱信息内容单元;
所述疑似偏爱值单元,用于根据历史行为数据对所述历史行为数据对应的信息内容进行用户疑似偏爱评估,得到用户的疑似偏爱值;
所述疑似偏爱信息内容单元,用于对当所述疑似偏爱值大于疑似偏爱值阈值,对所述历史行为数据进行保留,提取所述用户的历史行为数据对应的信息内容,将所述信息内容记为用户疑似偏爱信息内容。
6.根据权利要求4所述的智能数据信息统计管理系统,其特征在于,所述偏爱信息类型模快包括用户偏爱值单元、偏爱信息类型单元;
所述用户偏爱值单元,用于对按照所述信息内容涉及的不同信息类型,对所述信息内容进行分类,对信息类型相同的各个用户疑似偏爱信息内容对应的有效历史浏览记录进行提取,得到对应信息类型的用户偏向数据,对用户偏爱值进行计算;
所述偏爱信息类型单元,用于对所述信息类型对应的用户偏爱值进行汇集,对汇集的数据进行筛选,得到用户偏爱的信息类型。
7.根据权利要求4所述的智能数据信息统计管理系统,其特征在于,所述偏爱评论获取模块包括用户行为单元、偏爱特征评论数据单元;
所述用户行为单元,用于对所述用户偏爱信息类型中的各个信息内容的用户评论区行为进行分析;
所述偏爱特征评论数据单元,用于对各个评论显示内容进行关键内容提取,得到所述信息类型对应的评论内容数据;对所述评论内容数据进行特征提取,得到所述评论显示内容对应的特征评论数据。
8.根据权利要求4所述的智能数据信息统计管理系统,其特征在于,所述内容展示模块包括内容信息展示单元、评论内容展示单元;
所述内容信息展示单元,用于对根据所述用户偏爱信息类型,对所述智能设备推荐的内容信息进行数据优化,增加所述用户偏爱信息类型对应的内容信息的推荐频率;
所述评论内容展示单元,用于对基于所述特征评论数据,对信息内容中的评论显示次序进行处理,当所述评论内容符合特征评论数据,将所述评论内容显示次序进行提高;当所述评论内容不符合所述特征评论数据,对所述评论内容展现次序不做处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310316717.6A CN116304351B (zh) | 2023-03-29 | 2023-03-29 | 一种基于大数据的智能数据信息统计管理系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310316717.6A CN116304351B (zh) | 2023-03-29 | 2023-03-29 | 一种基于大数据的智能数据信息统计管理系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116304351A CN116304351A (zh) | 2023-06-23 |
CN116304351B true CN116304351B (zh) | 2024-02-02 |
Family
ID=86832266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310316717.6A Active CN116304351B (zh) | 2023-03-29 | 2023-03-29 | 一种基于大数据的智能数据信息统计管理系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116304351B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117688250B (zh) * | 2024-02-04 | 2024-04-16 | 国网湖北省电力有限公司信息通信公司 | 适用于电力全场景的统一数据动态服务管理系统及方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030061239A1 (en) * | 2001-09-26 | 2003-03-27 | Lg Electronics Inc. | Multimedia searching and browsing system based on user profile |
US20130212181A1 (en) * | 2010-10-25 | 2013-08-15 | Nec Corporation | Information-processing device, comment-prompting method, and computer-readable recording medium |
CN107145513A (zh) * | 2017-03-31 | 2017-09-08 | 北京猎豹移动科技有限公司 | 一种信息显示方法及装置、终端 |
CN110321478A (zh) * | 2019-05-27 | 2019-10-11 | 腾讯科技(北京)有限公司 | 一种信息推荐方法、装置、设备及介质 |
CN110337012A (zh) * | 2019-05-08 | 2019-10-15 | 未来电视有限公司 | 基于互联网电视平台的智能推荐方法和装置 |
CN110781428A (zh) * | 2019-09-10 | 2020-02-11 | 深圳壹账通智能科技有限公司 | 评论展示方法、装置、计算机设备及存储介质 |
CN112417302A (zh) * | 2020-12-08 | 2021-02-26 | 六晟信息科技(杭州)有限公司 | 一种基于大数据的资讯内容智能分析推荐处理系统 |
CN113282641A (zh) * | 2021-05-29 | 2021-08-20 | 武汉瑞通慧行电子商务有限公司 | 基于用户行为深度分析的网页搜索数据信息智能分类管理方法、系统及计算机存储介质 |
CN114510659A (zh) * | 2022-02-17 | 2022-05-17 | 彭西银 | 一种基于用户分析的旅游攻略智能匹配生成方法、系统及计算机存储介质 |
CN115391669A (zh) * | 2022-10-31 | 2022-11-25 | 江西渊薮信息科技有限公司 | 一种智能推荐方法、装置、电子设备 |
-
2023
- 2023-03-29 CN CN202310316717.6A patent/CN116304351B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030061239A1 (en) * | 2001-09-26 | 2003-03-27 | Lg Electronics Inc. | Multimedia searching and browsing system based on user profile |
US20130212181A1 (en) * | 2010-10-25 | 2013-08-15 | Nec Corporation | Information-processing device, comment-prompting method, and computer-readable recording medium |
CN107145513A (zh) * | 2017-03-31 | 2017-09-08 | 北京猎豹移动科技有限公司 | 一种信息显示方法及装置、终端 |
CN110337012A (zh) * | 2019-05-08 | 2019-10-15 | 未来电视有限公司 | 基于互联网电视平台的智能推荐方法和装置 |
CN110321478A (zh) * | 2019-05-27 | 2019-10-11 | 腾讯科技(北京)有限公司 | 一种信息推荐方法、装置、设备及介质 |
CN110781428A (zh) * | 2019-09-10 | 2020-02-11 | 深圳壹账通智能科技有限公司 | 评论展示方法、装置、计算机设备及存储介质 |
CN112417302A (zh) * | 2020-12-08 | 2021-02-26 | 六晟信息科技(杭州)有限公司 | 一种基于大数据的资讯内容智能分析推荐处理系统 |
CN113282641A (zh) * | 2021-05-29 | 2021-08-20 | 武汉瑞通慧行电子商务有限公司 | 基于用户行为深度分析的网页搜索数据信息智能分类管理方法、系统及计算机存储介质 |
CN114510659A (zh) * | 2022-02-17 | 2022-05-17 | 彭西银 | 一种基于用户分析的旅游攻略智能匹配生成方法、系统及计算机存储介质 |
CN115391669A (zh) * | 2022-10-31 | 2022-11-25 | 江西渊薮信息科技有限公司 | 一种智能推荐方法、装置、电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN116304351A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109685631B (zh) | 一种基于大数据用户行为分析的个性化推荐方法 | |
US7016889B2 (en) | System and method for identifying useful content in a knowledge repository | |
CN101203852A (zh) | 自动广告投放 | |
CN112052394B (zh) | 专业内容信息的推荐方法、系统、终端设备和存储介质 | |
CN116304351B (zh) | 一种基于大数据的智能数据信息统计管理系统及方法 | |
US20110246462A1 (en) | Method and System for Prompting Changes of Electronic Document Content | |
TWI571756B (zh) | 用以分析瀏覽記錄及其文件之方法及其系統 | |
CN102402594A (zh) | 一种富媒体个性化推荐方法 | |
CN115203311B (zh) | 一种基于数据大脑的行业数据分析挖掘方法及系统 | |
CN115760295A (zh) | 一种基于近邻用户和评论信息的商品推荐方法 | |
CN114219586A (zh) | 基于视频的购物推荐方法、装置、设备和存储介质 | |
CN115760202A (zh) | 一种基于人工智能的产品运营管理系统及方法 | |
CN117556065B (zh) | 基于深度学习的大模型数据管理系统及方法 | |
JP2008146293A (ja) | 閲覧対象情報の評価システム、方法、およびプログラム | |
CN116320626B (zh) | 一种计算电商直播热度的方法及系统 | |
CN116304128B (zh) | 基于大数据的多媒体资讯推荐系统 | |
CN113282641A (zh) | 基于用户行为深度分析的网页搜索数据信息智能分类管理方法、系统及计算机存储介质 | |
CN115630173B (zh) | 一种基于兴趣度分析的用户数据管理方法 | |
CN116738045A (zh) | 基于用户浏览行为的精确推送系统 | |
Diwandari et al. | Comparison of classification performance based on dynamic mining of user interest navigation pattern in e-commerce websites | |
CN111597386A (zh) | 一种视频采集方法 | |
CN118313906B (zh) | 一种个性化产品推荐方法 | |
CN116629981B (zh) | 基于用户行为的智慧社区推荐系统及方法 | |
CN117114820A (zh) | 离线用户与在线用户的最优推送指数计算方法和系统 | |
KR20090016297A (ko) | 온라인 광고를 위한 문맥기반의 키워드 추천 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20240107 Address after: 710000 room 10404, floor 4, block a, Xi'an National Digital publishing base, No. 996, Tiangu 7th Road, Yuhua street, high tech Zone, Xi'an, Shaanxi Province Applicant after: Shaanxi Weiner Digital Technology Co.,Ltd. Address before: Floor 15, Liantong Building, 130 Longhua Avenue, Longsha District, Qiqihar City, Heilongjiang Province, 161000 Applicant before: Heilongjiang Qingce Network Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |