CN116070017A - 一种数据推荐方法、装置及电子设备 - Google Patents

一种数据推荐方法、装置及电子设备 Download PDF

Info

Publication number
CN116070017A
CN116070017A CN202211568638.6A CN202211568638A CN116070017A CN 116070017 A CN116070017 A CN 116070017A CN 202211568638 A CN202211568638 A CN 202211568638A CN 116070017 A CN116070017 A CN 116070017A
Authority
CN
China
Prior art keywords
user
determining
tags
tag
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211568638.6A
Other languages
English (en)
Inventor
张宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Digital Intelligence Technology Co Ltd
Original Assignee
China Telecom Digital Intelligence Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Digital Intelligence Technology Co Ltd filed Critical China Telecom Digital Intelligence Technology Co Ltd
Priority to CN202211568638.6A priority Critical patent/CN116070017A/zh
Publication of CN116070017A publication Critical patent/CN116070017A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本公开的实施例公开一种数据推荐方法、装置及电子设备,该方法包括:获取多个用户中每个用户的历史阅读数据,在第一用户的历史阅读数据与第二用户的历史阅读数据中相同的数据超出预设阈值的情况下,将第一用户与第二用户确定为相邻用户,多个用户包括第一用户以及第二用户,基于第一用户以及第二用户分别对应的历史阅读数据将第一用户赋予第一标签组,将第二用户赋予第二标签组,第一标签组以及第二标签组均包含多个标签,且每个标签均对应权重,基于第一标签组确定第一用户对应的第一特征向量,基于第二标签组确定第二用户对应的第二特征向量,将第一用户的历史阅读数据推荐至第二用户,本公开能够提高获取数据的效率,提高用户的体验。

Description

一种数据推荐方法、装置及电子设备
技术领域
本公开涉及计算机技术领域,尤其涉及一种数据推荐方法、装置及电子设备。
背景技术
随着社会的发展,社会逐渐进入信息化时代。在信息化时代中,数据已经变成人们日常生活中,不可获缺的部分。
但是由于终端设备的增多,数据量也逐渐增大,使得当前用户难以在繁杂的数据量中获取需要的数据。如何提高用户获取数据的效率是当前先关技术中亟待解决的问题。
发明内容
有鉴于此,本公开实施例提供一种数据推荐方法、装置及电子设备,能够提高获取数据的效率,提高用户的体验。
第一方面,本公开实施例提供一种数据推荐方法,包括:
获取多个用户中每个用户的历史阅读数据;
在第一用户的历史阅读数据与第二用户的历史阅读数据中相同的数据超出预设阈值的情况下,将第一用户与第二用户确定为相邻用户,多个用户包括第一用户以及第二用户;
基于第一用户以及第二用户分别对应的历史阅读数据将第一用户赋予第一标签组,将第二用户赋予第二标签组,第一标签组以及第二标签组均包含多个标签,且每个标签均对应权重;
基于第一标签组确定第一用户对应的第一特征向量,基于第二标签组确定第二用户对应的第二特征向量;
在第一特征向量与第二特征向量的余弦相似度满足预设条件的情况下,将第一用户的历史阅读数据推荐至第二用户。
根据本公开实施例的一种具体实现方式,基于第一用户以及第二用户分别对应的历史阅读数据将第一用户赋予第一标签组,将第二用户赋予第二标签组,第一标签组以及第二标签组均包含多个标签,且每个标签均对应权重,包括:
基于第一用户的历史阅读数据确定第一用户对应的多个第一标签;
基于第二用户的历史阅读数据确定第二用户对应的多个第二标签;
基于TF-IDF算法以及多个第一标签确定第一标签组,以及第一标签中每个标签对应的权重;
基于TF-IDF算法以及多个第二标签确定第二标签组,以及第二标签中每个标签对应的权重。
根据本公开实施例的一种具体实现方式,基于TF-IDF算法以及多个第一标签确定第一标签组,以及第一标签中每个标签对应的权重,包括:
基于TF-IDF确定多个第一标签中每个第一标签对应的TF-IDF值;
基于每个第一标签对应的TF-IDF值对多个第一标签进行排序,得到第一序列;
基于第一序列获取预设数量个第一标签;
将预设数量个第一标签确定为第一标签组;
基于每个第一标签对应的TF-IDF值以及多个第一标签对应的TF-IDF总值确定第一标签组中每个第一标签对应的权重。
根据本公开实施例的一种具体实现方式,基于TF-IDF算法以及多个第二标签确定第二标签组,以及第二标签中每个标签对应的权重,包括:
基于TF-IDF确定多个第二标签中每个第二标签对应的TF-IDF值;
基于每个第二标签对应的TF-IDF值对多个第二标签进行排序,得到第二序列;
基于第二序列获取预设数量个第二标签;
将预设数量个第二标签确定为第二标签组;
基于每个第二标签对应的TF-IDF值以及多个第二标签对应的TF-IDF总值确定第二标签组中每个第二标签对应的权重。
根据本公开实施例的一种具体实现方式,基于第一标签组确定第一用户对应的第一特征向量,基于第二标签组确定第二用户对应的第二特征向量,包括:
获取第一标签组与第二标签组中不同的标签;
将第一标签组权重最小的不同的标签替换为第二标签组权重最大的不同的标签,得到重新确定的第一标签组;
将第二标签组权重最小的不同的标签替换为第二标签组权重最大的不同的标签,得到重新确定的第二标签组;
基于第一标签组与第二标签组中全部标签构建标准标签组;
基于重新确定的第一标签组、第二标签组与标准标签组的对应关系,确定第一特征向量以及第二特征向量。
第二方面,本公开实施例提供一种数据推荐装置,包括:
获取模块,用于获取多个用户中每个用户的历史阅读数据;
第一确定模块,用于在第一用户的历史阅读数据与第二用户的历史阅读数据中相同的数据超出预设阈值的情况下,将第一用户与第二用户确定为相邻用户,多个用户包括第一用户以及第二用户;
赋予模块,用于基于第一用户以及第二用户分别对应的历史阅读数据将第一用户赋予第一标签组,将第二用户赋予第二标签组,第一标签组以及第二标签组均包含多个标签,且每个标签均对应权重;
第二确定模块,用于基于第一标签组确定第一用户对应的第一特征向量,基于第二标签组确定第二用户对应的第二特征向量;
推荐模块,用于在第一特征向量与第二特征向量的余弦相似度满足预设条件的情况下,将第一用户的历史阅读数据推荐至第二用户。
根据本公开实施例的一种具体实现方式,赋予模块包括:
第一确定单元,用于基于第一用户的历史阅读数据确定第一用户对应的多个第一标签;
第二确定单元,用于基于第二用户的历史阅读数据确定第二用户对应的多个第二标签;
第三确定单元,用于基于TF-IDF算法以及多个第一标签确定第一标签组,以及第一标签中每个标签对应的权重;
第四确定单元,用于基于TF-IDF算法以及多个第二标签确定第二标签组,以及第二标签中每个标签对应的权重。
根据本公开实施例的一种具体实现方式,第三确定单元,包括:
第一确定子单元,用于基于TF-IDF确定多个第一标签中每个第一标签对应的TF-IDF值;
第一排序子单元,用于基于每个第一标签对应的TF-IDF值对多个第一标签进行排序,得到第一序列;
第一获取子单元,用于基于第一序列获取预设数量个第一标签;
第二确定子单元,用于将预设数量个第一标签确定为第一标签组;
第三确定子单元,用于基于每个第一标签对应的TF-IDF值以及多个第一标签对应的TF-IDF总值确定第一标签组中每个第一标签对应的权重。
根据本公开实施例的一种具体实现方式,满足预设条件包括:训练次数满足预设次数和/或数据分类模型对应的损失函数值满足预设阈值。
根据本公开实施例的一种具体实现方式,第四确定单元,还包括:
第四确定子单元,用于基于TF-IDF确定多个第二标签中每个第二标签对应的TF-IDF值;
第二排序子单元,用于基于每个第二标签对应的TF-IDF值对多个第二标签进行排序,得到第二序列;
第二获取子单元,用于基于第二序列获取预设数量个第二标签;
第五确定子单元,用于将预设数量个第二标签确定为第二标签组;
第六确定子单元,用于基于每个第二标签对应的TF-IDF值以及多个第二标签对应的TF-IDF总值确定第二标签组中每个第二标签对应的权重。
根据本公开实施例的一种具体实现方式,第二确定模块,包括:
第一获取单元,用于获取第一标签组与第二标签组中不同的标签;
第一替换单元,用于将第一标签组权重最小的不同的标签替换为第二标签组权重最大的不同的标签,得到重新确定的第一标签组;
第二替换单元,用于将第二标签组权重最小的不同的标签替换为第二标签组权重最大的不同的标签,得到重新确定的第二标签组;
构建单元,用于基于第一标签组与第二标签组中全部标签构建标准标签组;
第五确定单元,用于基于重新确定的第一标签组、第二标签组与标准标签组的对应关系,确定第一特征向量以及第二特征向量。
第三方面,本公开实施例提供一种电子设备,电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述任一实现方式的方法。
第四方面,本公开的实施例还提供一种应用程序,应用程序被执行以实现本公开任一实施方式的方法。
本公开实施例提供的一种数据推荐方法、装置及电子设备,通过获取多个用户中每个用户的历史阅读数据,在多个用户中的第一用户以及第二用户的历史阅读数据中相同的数据超出预设阈值的情况下,将第一用户与第二用户确定为相邻用户,然后基于第一用户于第二用户分别对应的历史阅读数据将第一用户赋予第一标签组,将第二用户赋予第二标签组,每个标签组中的每个标签均对应权重,然后基于第一标签组确定第一用户对应的第一特征向量,基于第二标签组确定第二用户对应的第二特征向量,在第一特征向量与第二特征向量的余弦相似度满足预设条件的情况下,将第一用户的历史阅读数据推荐至第二用户。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本公开实施例一的数据推荐方法的流程示意图;
图2为本公开实施例一的数据推荐方法的流程示意图;
图3为本公开实施例三的数据推荐方法的流程示意图;
图4为本公开实施例四的数据推荐装置的流程示意图;
图5为本公开实施例五的数据推荐方法的流程示意图;
图6为本公开电子设备一个实施例的结构示意图。
具体实施方式
下面结合附图对本公开实施例进行详细描述。应当明确,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本公开保护的范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
需要注意,本公开中提及的“第一”、“第一”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
当今世界经济正在向经济一体化及知识经济方向发展,网络化、虚拟化、数字化、知识化正成为现代经济发展的重要特征,这使企业面临的经营环境日趋复杂多变。
在市场竞争越来越激烈的情况下,知识已成为企业经营的首要资源,企业的竞争优势越来越体现在企业是否拥有雄厚的知识资本以及独特的经营能力,因此,知识管理正在成为企业最核心的管理内容。
但是相关技术中,知识管理的水平较低,难以满足用户的需求。
为了解决上述技术问题,本公开实施例提供了一种数据推荐方法。
图1为本公开实施例一提供的一种数据推荐方法流程图,如图1所示,方法可以包括:
S110,获取多个用户中每个用户的历史阅读数据。
在一些实施例中,用户历史阅读数据可以包括用户历史阅读的文档、书籍、手册等多种形式的数据。
在一些实施例中,用户可以通过用户的终端设备阅读数据。
在一些实施例中,用户的历史阅读数据可以存储在服务器中。
可选地,不同的终端设备中安装的应用程序的客户端是相同的,或基于不同操作系统的同一类型应用程序的客户端。基于终端平台的不同,该应用程序的客户端的具体形态也可以不同,比如,该应用程序客户端可以是手机客户端、PC客户端等。
服务器可以是提供各种服务的服务器,例如对用户利用终端设备所进行操作的装置提供支持的后台管理服务器。后台管理服务器可以对接收到的请求等数据进行分析等处理,并将处理结果反馈给终端设备。
可选地,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,数据分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
本领域技术人员可以知晓,上述终端设备、网络和服务器的数量仅仅是示意性的,根据实际需要,可以具有任意数目的终端设备、网络和服务器。本公开实施例对此不作限定。
可选地,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合)。在一些实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(ExtensibleMarkupLanguage,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(InternetProtocolSecurity,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
S120,在第一用户的历史阅读数据与第二用户的历史阅读数据中相同的数据超出预设阈值的情况下,将第一用户与第二用户确定为相邻用户,多个用户包括第一用户以及第二用户。
在一个实施例中,可以将多个用户中任意两个用户的历史阅读数据进行对比。
在一个实施例中,预设阈值可以包括用户自定义设定的阈值,本公开实施例中不做具体限定。
在一个实施例中,可以以知识图谱的方式确定用户的关系,示例性的,将每个用户视为知识图谱中的一个节点,将以边连接的两个用户视为相邻用户。
S130,基于第一用户以及第二用户分别对应的历史阅读数据将第一用户赋予第一标签组,将第二用户赋予第二标签组,第一标签组以及第二标签组均包含多个标签,且每个标签均对应权重。
在一个实施例中,可以获取用户历史阅读数据中的关检词,将上述关检词确定为用户对应的标签,以上述标签确定标签组。
在一个实施例中,可以基于标签出现的频率确定标签对应的权重出,此处不做具体限定。
S140,基于第一标签组确定第一用户对应的第一特征向量,基于第二标签组确定第二用户对应的第二特征向量。
在一个实施例中,可以将不同的标签按照预设规则进行编码,然后基于上述编码确定第一用户以及第二用户分别对应的特征向量。
S150,在第一特征向量与第二特征向量的余弦相似度满足预设条件的情况下,将第一用户的历史阅读数据推荐至第二用户。
在一些实施例中,也可以将第二用户的历史阅读数据推荐至第一用户。
在一些实施例中,预设条件可以包括确定出的余弦相似度值满足预设阈值。
本公开实施例提供的一种数据推荐方法,通过获取多个用户中每个用户的历史阅读数据,在多个用户中的第一用户以及第二用户的历史阅读数据中相同的数据超出预设阈值的情况下,将第一用户与第二用户确定为相邻用户,然后基于第一用户于第二用户分别对应的历史阅读数据将第一用户赋予第一标签组,将第二用户赋予第二标签组,每个标签组中的每个标签均对应权重,然后基于第一标签组确定第一用户对应的第一特征向量,基于第二标签组确定第二用户对应的第二特征向量,在第一特征向量与第二特征向量的余弦相似度满足预设条件的情况下,将第一用户的历史阅读数据推荐至第二用户
图2为本公开实施例二提供的一种数据推荐方法流程图,如图2所示,方法可以包括:
S210,基于第一用户的历史阅读数据确定第一用户对应的多个第一标签。
S220,基于第二用户的历史阅读数据确定第二用户对应的多个第二标签。
S230,基于TF-IDF算法以及多个第一标签确定第一标签组,以及第一标签中每个标签对应的权重。
S240,基于TF-IDF算法以及多个第二标签确定第二标签组,以及第二标签中每个标签对应的权重。
在一些实施例中,可以基于TF-IDF算法确定每个用户对应的历史数据中,每个关键词对应的TF-IDF值,然后根据每个关键词对应的TF-IDF值与全部关键词对应的TF-IDF总值的比值确定每个关键词对应的权重,其中上述关键词可以被确定为标签组中的标签。
图3为本公开实施例三提供的一种数据推荐方法流程图,如图3所示,方法可以包括:
S310,基于TF-IDF确定多个第一标签中每个第一标签对应的TF-IDF值;
S320,基于每个第一标签对应的TF-IDF值对多个第一标签进行排序,得到第一序列;
S330,基于第一序列获取预设数量个第一标签;
S340,将预设数量个第一标签确定为第一标签组;
在一个实施例中,可以获取每个关键词对应的TF-IDF值,然后将上述TF-IDF值进行排序,然后将预设数量个TF-IDF值较高的关键词确定为标签组中的标签。
S350,基于每个第一标签对应的TF-IDF值以及多个第一标签对应的TF-IDF总值确定第一标签组中每个第一标签对应的权重。
在一些实施例中,确定第二标签组中的标签以及每个标签对应的权重值的方法与上述实施例相同,此处不再赘述。
图4为本公开实施例四提供的一种数据推荐方法流程图,如图4所示,方法可以包括:
S410,获取第一标签组与第二标签组中不同的标签。
在一些实施例中,第一标签组中的标签分别为“5G、医院、大数据、智能、治理”,对应的权重分别为“0.8,0.75,0.65,0.6,0.58”,第二标签组中的标签分别为“5G、公共卫生、大数据、智能、PaaS”,对应的权重分别为“0.85,0.8,0.75,0.7,0.59”,则不同的标签在分别为医院、治理、公共卫生、PaaS。
S420,将第一标签组权重最小的不同的标签替换为第二标签组权重最大的不同的标签,得到重新确定的第一标签组。
在一些实施例中,第一标签组中权重最小的不同标签为治理,第二标签组中权重最大的不同标签为公共卫生,则重新确定的第一标签组为“5G、医院、大数据、智能、公共卫生”
S430,将第二标签组权重最小的不同的标签替换为第二标签组权重最大的不同的标签,得到重新确定的第二标签组。
在一些实施例中,确定第二标签组的方法与确定第一标签组的方法相同,此处不再赘述。
S440,基于第一标签组与第二标签组中全部标签构建标准标签组;
在一些实施例中,在一些实施例中,第一标签组中的标签分别为“5G、医院、大数据、智能、治理”,对应的权重分别为“0.8,0.75,0.65,0.6,0.58”,第二标签组中的标签分别为“5G、公共卫生、大数据、智能、PaaS”,对应的权重分别为“0.85,0.8,0.75,0.7,0.59”,则标准标签组为“5G、医院、大数据、智能、治理、公共卫生、PaaS”。
S450,基于重新确定的第一标签组、第二标签组与标准标签组的对应关系,确定第一特征向量以及第二特征向量。
在一些实施例中,基于标准标签组与第一标签组、第二标签组确定第一标签组对应的第一特征向量以及第二标签组对应的第二特征向量可以包括:
针对第一标签组,在第一标签组与标准标签组包含相同的标签的情况下,将第一标签组内标签的权重确定为第一特征向量的元素,在第一标签组中不包含标准标签组中的标签的情况下,在第一特征向量对应的位置赋予0。
示例性的,第一标签组中的标签分别为“5G、医院、大数据、智能、治理”,对应的权重分别为“0.8,0.75,0.65,0.6,0.58”,第二标签组中的标签分别为“5G、公共卫生、大数据、智能、PaaS”,对应的权重分别为“0.85,0.8,0.75,0.7,0.59”,则标准标签组为“5G、医院、大数据、智能、治理、公共卫生、PaaS”。
则第一特征向量为[0.8,0.75,0.65,0.6,0.58,0,0],第二特征向量为[0.85,0,0.75,0.7,0,0.8,0.59]。
基于相同的发明构思,本公开实施例中还提供了一种数据推荐装置。
图5为本公开实施例五提供的一种数据推荐装置结构图,如图5所示,装置可以包括:
获取模块510,用于获取多个用户中每个用户的历史阅读数据;
第一确定模块520,用于在第一用户的历史阅读数据与第二用户的历史阅读数据中相同的数据超出预设阈值的情况下,将第一用户与第二用户确定为相邻用户,多个用户包括第一用户以及第二用户;
赋予模块530,用于基于第一用户以及第二用户分别对应的历史阅读数据将第一用户赋予第一标签组,将第二用户赋予第二标签组,第一标签组以及第二标签组均包含多个标签,且每个标签均对应权重;
第二确定模块540,用于基于第一标签组确定第一用户对应的第一特征向量,基于第二标签组确定第二用户对应的第二特征向量;
推荐模块550,用于在第一特征向量与第二特征向量的余弦相似度满足预设条件的情况下,将第一用户的历史阅读数据推荐至第二用户。
本公开实施例提供的一种数据推荐装置,通过获取多个用户中每个用户的历史阅读数据,在多个用户中的第一用户以及第二用户的历史阅读数据中相同的数据超出预设阈值的情况下,将第一用户与第二用户确定为相邻用户,然后基于第一用户于第二用户分别对应的历史阅读数据将第一用户赋予第一标签组,将第二用户赋予第二标签组,每个标签组中的每个标签均对应权重,然后基于第一标签组确定第一用户对应的第一特征向量,基于第二标签组确定第二用户对应的第二特征向量,在第一特征向量与第二特征向量的余弦相似度满足预设条件的情况下,将第一用户的历史阅读数据推荐至第二用户。
根据本公开实施例的一种具体实现方式,赋予模块包括:
第一确定单元,用于基于第一用户的历史阅读数据确定第一用户对应的多个第一标签;
第二确定单元,用于基于第二用户的历史阅读数据确定第二用户对应的多个第二标签;
第三确定单元,用于基于TF-IDF算法以及多个第一标签确定第一标签组,以及第一标签中每个标签对应的权重;
第四确定单元,用于基于TF-IDF算法以及多个第二标签确定第二标签组,以及第二标签中每个标签对应的权重。
根据本公开实施例的一种具体实现方式,第三确定单元,包括:
第一确定子单元,用于基于TF-IDF确定多个第一标签中每个第一标签对应的TF-IDF值;
第一排序子单元,用于基于每个第一标签对应的TF-IDF值对多个第一标签进行排序,得到第一序列;
第一获取子单元,用于基于第一序列获取预设数量个第一标签;
第二确定子单元,用于将预设数量个第一标签确定为第一标签组;
第三确定子单元,用于基于每个第一标签对应的TF-IDF值以及多个第一标签对应的TF-IDF总值确定第一标签组中每个第一标签对应的权重。
根据本公开实施例的一种具体实现方式,满足预设条件包括:训练次数满足预设次数和/或数据分类模型对应的损失函数值满足预设阈值。
根据本公开实施例的一种具体实现方式,第四确定单元,还包括:
第四确定子单元,用于基于TF-IDF确定多个第二标签中每个第二标签对应的TF-IDF值;
第二排序子单元,用于基于每个第二标签对应的TF-IDF值对多个第二标签进行排序,得到第二序列;
第二获取子单元,用于基于第二序列获取预设数量个第二标签;
第五确定子单元,用于将预设数量个第二标签确定为第二标签组;
第六确定子单元,用于基于每个第二标签对应的TF-IDF值以及多个第二标签对应的TF-IDF总值确定第二标签组中每个第二标签对应的权重。
根据本公开实施例的一种具体实现方式,第二确定模块,包括:
第一获取单元,用于获取第一标签组与第二标签组中不同的标签;
第一替换单元,用于将第一标签组权重最小的不同的标签替换为第二标签组权重最大的不同的标签,得到重新确定的第一标签组;
第二替换单元,用于将第二标签组权重最小的不同的标签替换为第二标签组权重最大的不同的标签,得到重新确定的第二标签组;
构建单元,用于基于第一标签组与第二标签组中全部标签构建标准标签组;
第五确定单元,用于基于重新确定的第一标签组、第二标签组与标准标签组的对应关系,确定第一特征向量以及第二特征向量。
图6为本公开电子设备一个实施例的结构示意图,可以实现本公开图1-5所示实施例的流程,如图6所示,上述电子设备可以包括:壳体41、处理器42、存储器43、电路板44和电源电路45,其中,电路板44安置在壳体41围成的空间内部,处理器42和存储器43设置在电路板44上;电源电路45,用于为上述电子设备的各个电路或器件供电;存储器43用于存储可执行程序代码;处理器42通过读取存储器43中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述任一实施例的方法的步骤。
处理器42对上述步骤的具体执行过程以及处理器42通过运行可执行程序代码来进一步执行的步骤,可以参见本公开图1-5所示实施例的描述,在此不再赘述。
该电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体数据。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子设备。
第五方面,本公开的实施例还提供一种应用程序,应用程序被执行以实现本公开任一实施例提供的方法。
需要说明的是,在本文中,诸如第一和第一等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
为了描述的方便,描述以上装置是以功能分为各种单元/模块分别描述。当然,在实施本公开时可以把各单元/模块的功能在同一个或多个软件和/或硬件中实现。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种数据推荐方法,其特征在于,所述方法包括:
获取多个用户中每个用户的历史阅读数据;
在第一用户的历史阅读数据与第二用户的历史阅读数据中相同的数据超出预设阈值的情况下,将所述第一用户与所述第二用户确定为相邻用户,所述多个用户包括所述第一用户以及所述第二用户;
基于所述第一用户以及所述第二用户分别对应的历史阅读数据将所述第一用户赋予第一标签组,将所述第二用户赋予第二标签组,所述第一标签组以及所述第二标签组均包含多个标签,且每个标签均对应权重;
基于第一标签组确定所述第一用户对应的第一特征向量,基于第二标签组确定所述第二用户对应的第二特征向量;
在所述第一特征向量与所述第二特征向量的余弦相似度满足预设条件的情况下,将所述第一用户的历史阅读数据推荐至所述第二用户。
2.根据权利要求1所述的数据推荐方法,其特征在于,所述基于所述第一用户以及所述第二用户分别对应的历史阅读数据将所述第一用户赋予第一标签组,将所述第二用户赋予第二标签组,所述第一标签组以及所述第二标签组均包含多个标签,且每个标签均对应权重,包括:
基于所述第一用户的历史阅读数据确定所述第一用户对应的多个第一标签;
基于所述第二用户的历史阅读数据确定所述第二用户对应的多个第二标签;
基于TF-IDF算法以及多个第一标签确定所述第一标签组,以及第一标签中每个标签对应的权重;
基于TF-IDF算法以及多个第二标签确定所述第二标签组,以及第二标签中每个标签对应的权重。
3.根据权利要求2所述的数据推荐方法,其特征在于,所述基于TF-IDF算法以及多个第一标签确定所述第一标签组,以及第一标签中每个标签对应的权重,包括:
基于TF-IDF确定多个第一标签中每个第一标签对应的TF-IDF值;
基于每个第一标签对应的TF-IDF值对多个第一标签进行排序,得到第一序列;
基于所述第一序列获取预设数量个第一标签;
将预设数量个第一标签确定为第一标签组;
基于每个第一标签对应的TF-IDF值以及多个第一标签对应的TF-IDF总值确定第一标签组中每个第一标签对应的权重。
4.根据权利要求2所述的数据推荐方法,其特征在于,所述基于TF-IDF算法以及多个第二标签确定所述第二标签组,以及第二标签中每个标签对应的权重,包括:
基于TF-IDF确定多个第二标签中每个第二标签对应的TF-IDF值;
基于每个第二标签对应的TF-IDF值对多个第二标签进行排序,得到第二序列;
基于所述第二序列获取预设数量个第二标签;
将预设数量个第二标签确定为第二标签组;
基于每个第二标签对应的TF-IDF值以及多个第二标签对应的TF-IDF总值确定第二标签组中每个第二标签对应的权重。
5.根据权利要求1所述的数据推荐方法,其特征在于,所述基于第一标签组确定所述第一用户对应的第一特征向量,基于第二标签组确定所述第二用户对应的第二特征向量,包括:
获取所述第一标签组与所述第二标签组中不同的标签;
将所述第一标签组权重最小的不同的标签替换为所述第二标签组权重最大的不同的标签,得到重新确定的第一标签组;
将所述第二标签组权重最小的不同的标签替换为所述第二标签组权重最大的不同的标签,得到重新确定的第二标签组;
基于所述第一标签组与所述第二标签组中全部标签构建标准标签组;
基于重新确定的第一标签组、第二标签组与所述标准标签组的对应关系,确定第一特征向量以及第二特征向量。
6.一种数据推荐装置,其特征在于,所述装置包括:
获取模块,用于获取多个用户中每个用户的历史阅读数据;
第一确定模块,用于在第一用户的历史阅读数据与第二用户的历史阅读数据中相同的数据超出预设阈值的情况下,将所述第一用户与所述第二用户确定为相邻用户,所述多个用户包括所述第一用户以及所述第二用户;
赋予模块,用于基于所述第一用户以及所述第二用户分别对应的历史阅读数据将所述第一用户赋予第一标签组,将所述第二用户赋予第二标签组,所述第一标签组以及所述第二标签组均包含多个标签,且每个标签均对应权重;
第二确定模块,用于基于第一标签组确定所述第一用户对应的第一特征向量,基于第二标签组确定所述第二用户对应的第二特征向量;
推荐模块,用于在所述第一特征向量与所述第二特征向量的余弦相似度满足预设条件的情况下,将所述第一用户的历史阅读数据推荐至所述第二用户。
7.根据权利要求6所述的装置,其特征在于,所述赋予模块包括:
第一确定单元,用于基于所述第一用户的历史阅读数据确定所述第一用户对应的多个第一标签;
第二确定单元,用于基于所述第二用户的历史阅读数据确定所述第二用户对应的多个第二标签;
第三确定单元,用于基于TF-IDF算法以及多个第一标签确定所述第一标签组,以及第一标签中每个标签对应的权重;
第四确定单元,用于基于TF-IDF算法以及多个第二标签确定所述第二标签组,以及第二标签中每个标签对应的权重。
8.根据权利要求7所述的数据推荐装置,其特征在于,所述第三确定单元,包括:
第一确定子单元,用于基于TF-IDF确定多个第一标签中每个第一标签对应的TF-IDF值;
第一排序子单元,用于基于每个第一标签对应的TF-IDF值对多个第一标签进行排序,得到第一序列;
第一获取子单元,用于基于所述第一序列获取预设数量个第一标签;
第二确定子单元,用于将预设数量个第一标签确定为第一标签组;
第三确定子单元,用于基于每个第一标签对应的TF-IDF值以及多个第一标签对应的TF-IDF总值确定第一标签组中每个第一标签对应的权重。
9.一种电子设备,其特征在于,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述权利要求1至6任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现前述权利要求1至6任一项所述的方法。
CN202211568638.6A 2022-12-08 2022-12-08 一种数据推荐方法、装置及电子设备 Pending CN116070017A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211568638.6A CN116070017A (zh) 2022-12-08 2022-12-08 一种数据推荐方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211568638.6A CN116070017A (zh) 2022-12-08 2022-12-08 一种数据推荐方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN116070017A true CN116070017A (zh) 2023-05-05

Family

ID=86181097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211568638.6A Pending CN116070017A (zh) 2022-12-08 2022-12-08 一种数据推荐方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN116070017A (zh)

Similar Documents

Publication Publication Date Title
CN105051732B (zh) 本地应用内容的排名
CN109471978B (zh) 一种电子资源推荐方法及装置
WO2020093289A1 (zh) 资源推荐方法、装置、电子设备及存储介质
US20230224301A1 (en) Enhanced access to media, systems and methods
CN112231592A (zh) 基于图的网络社团发现方法、装置、设备以及存储介质
JP2013164704A (ja) 情報処理装置、情報処理方法およびプログラム
CN112052399B (zh) 一种数据处理方法、装置和计算机可读存储介质
CN111667018B (zh) 一种对象聚类的方法、装置、计算机可读介质及电子设备
CN113761565B (zh) 数据脱敏方法和装置
US20170161322A1 (en) Method and electronic device for searching resource
CN111209403A (zh) 数据处理方法、装置、介质及电子设备
CN116070017A (zh) 一种数据推荐方法、装置及电子设备
CN114064843B (zh) Rdf数据中天际线位置节点查询方法、装置和设备
CN111368205A (zh) 数据推荐方法、装置、计算机设备及存储介质
CN114338102B (zh) 安全检测方法、装置、电子设备及存储介质
US10460018B1 (en) System for determining layouts of webpages
CN112801053B (zh) 视频数据处理方法、装置
CN115168609A (zh) 一种文本匹配方法、装置、计算机设备和存储介质
US20170171330A1 (en) Method for pushing information and electronic device
CN113010759B (zh) 聚类集合的处理方法、装置、计算机可读介质及电子设备
CN115423030A (zh) 一种设备识别的方法和装置
CN116911304B (zh) 一种文本推荐方法及装置
CN113076450B (zh) 一种目标推荐列表的确定方法和装置
CN113821366B (zh) 基于doris的自动分析异常方法及系统
CN116107738A (zh) 一种资源分配方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination