CN113360803A - 基于用户行为的数据缓存方法、装置、设备及存储介质 - Google Patents
基于用户行为的数据缓存方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113360803A CN113360803A CN202110607878.1A CN202110607878A CN113360803A CN 113360803 A CN113360803 A CN 113360803A CN 202110607878 A CN202110607878 A CN 202110607878A CN 113360803 A CN113360803 A CN 113360803A
- Authority
- CN
- China
- Prior art keywords
- data
- browsing
- subsets
- field
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
- G06F16/9574—Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
Abstract
本发明涉及云存储技术,揭露了一种基于用户行为的数据缓存方法,包括:按照数据类型标签对获取的浏览数据集进行分类,得到多个浏览数据子集;对多个浏览数据子集进行浏览次数提取;对多个浏览数据子集进行时长提取;根据浏览次数提取和浏览时长提取结果计算用户对多个浏览数据子集的偏好权重;确定偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签;获取待缓存数据集,将待缓存数据集中数据标签为所述目标标签的数据进行缓存处理。此外,本发明还涉及区块链技术,所述浏览数据集可存储于区块链的节点。本发明还提出一种基于用户行为的数据缓存装置、设备以及介质。本发明可以减少计算机需要进行缓存的数据量,提高数据缓存效率。
Description
技术领域
本发明涉及云存储技术领域,尤其涉及一种基于用户行为的数据缓存方法、装置、电子设备及计算机可读存储介质。
背景技术
随着互联网的发展与计算机技术的普及,为了提高计算机之间数据加载的效率,大多数计算机系统都使用到缓存,像文件缓存、redis缓存等,缓存可以将数据在前端进行预先的存储,以实现在需要调用数据时直接的调用,减轻后端资源的调用压力,提高数据加载速度。
目前主流的缓存方式为将各种场景中的数据进行统一缓存,存储在前端中指定的网络数据缓存地址或缓存设备中,但由于网络消息的关系速度极快,且数据量庞大,该方法将所有数据进行统一缓存不仅会降低缓存效率,且会占用大量的缓存空间,增加服务器的负载,因此,如何减少需要进行缓存的数据量,提高数据缓存效率成为亟待解决的问题。
发明内容
本发明提供一种基于用户行为的数据缓存方法、装置及计算机可读存储介质,其主要目的在于减少计算机需要进行缓存的数据量,提高数据缓存效率。
为实现上述目的,本发明提供的一种基于用户行为的数据缓存方法,包括:
获取用户的浏览数据集,按照数据类型标签对所述浏览数据集中的浏览数据进行分类,得到多个浏览数据子集;
对所述多个浏览数据子集进行浏览次数提取,得到浏览次数数据集;
对所述多个浏览数据子集进行时长提取,得到浏览时长数据集;
根据所述浏览次数数据集和所述浏览时长数据集计算用户对所述多个浏览数据子集的偏好权重;
确定所述偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签;
获取待缓存数据集,将所述待缓存数据集中数据标签为所述目标标签的数据进行缓存处理。
可选地,所述对所述多个浏览数据子集进行浏览次数提取,包括:
提取所述多个浏览数据子集的浏览次数字段;
对所述浏览次数字段进行字段分割,得到多个分割字段;
对所述多个分割字段进行字段向量化处理,得到多个字段向量;
计算所述多个字段向量的模长,确定所述模长为所述浏览数据子集的浏览次数。
可选地,所述对所述浏览次数字段进行字段分割,得到多个分割字段,包括:
对所述浏览次数字段进行字段拆分处理,得到初始字段集;
对所述初始字段集进行无用字段删除,得到多个分割字段。
可选地,所述对所述多个分割字段进行字段向量化处理,得到多个字段向量,包括:
选取所述多个分割字段中任一分割字段为待转换字段;
将所述待转换字段中的每个字节进行字节编码,得到字节向量集;
将所述字节向量集中的字节向量进行拼接,得到所述待转换字段的字段向量,直至所述多个分割字段中所有分割字段转换为字段向量,得到所述多个字段向量。
可选地,所述按照数据类型标签对所述浏览数据集中的浏览数据进行分类,包括:
随机从所述浏览数据集中选取预设数量的浏览数据作为多个簇心数据子集;
分别计算未选取浏览数据子集中的浏览数据与所述多个簇心数据子集的距离,其中,所述未选取浏览数据子集是所述浏览数据集中未被选取的浏览数据的集合;
依次从所述未选取浏览数据子集中选取浏览数据与待汇集簇心数据子集进行汇集,直至所述未选取浏览数据子集中的所有浏览数据完成汇集,其中,所述待汇集簇心数据子集为所述多个簇心数据子集中与选取的浏览数据之间距离最小的簇心数据子集。
可选地,所述获取待缓存数据集,包括:
查询所述待缓存数据集的网络地址;
检测所述网络地址的调用环境;
通过与所述调用环境对应的编译器编译得到信息调用语句;
执行所述信息调用语句从所述网络地址中获取所述浏览数据集。
可选地,所述将所述待缓存数据集中数据标签为所述目标标签的数据进行缓存处理,包括:
获取所述目标缓存地址的数据传输请求头部;
在所述数据传输请求头部增加扩展字段,其中,所述扩展字段包括所述目标缓存地址的数据传输状态字段;
利用增加所述扩展字段的数据传输请求头部向所述目标缓存地址发送数据传输请求;
接收所述目标缓存地址基于所述数据传输请求返回的数据传输状态;
当所述数据传输状态为可传输状态时,将所述待缓存数据集中数据标签为目标标签的数据存入所述目标缓存地址中。
为了解决上述问题,本发明还提供一种基于用户行为的数据缓存装置,所述装置包括:
数据分类模块,用于获取用户的浏览数据集,按照数据类型标签对所述浏览数据集中的浏览数据进行分类,得到多个浏览数据子集;
次数提取模块,用于对所述多个浏览数据子集进行浏览次数提取,得到浏览次数数据集;
时长提取模块,用于对所述多个浏览数据子集进行时长提取,得到浏览时长数据集;
权重计算模块,用于根据所述浏览次数数据集和所述浏览时长数据集计算用户对所述多个浏览数据子集的偏好权重;
标签筛选模块,用于确定所述偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签;
缓存模块,用于获取待缓存数据集,将所述待缓存数据集中数据标签为所述目标标签的数据进行缓存处理。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述所述的基于用户行为的数据缓存方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的基于用户行为的数据缓存方法。
本发明实施例通过按照数据类型标签对获取的浏览数据集进行分类,得到多个浏览数据子集,对多个浏览数据子集进行浏览次数提取和时长提取,可实现将用户对浏览数据的浏览行为进行数量化,得到用户对各类型的浏览数据子集的浏览次数和浏览时长,有利于提高后续对用户数据进行分析的精确性;根据浏览次数提取和浏览时长提取结果计算用户对多个浏览数据子集的偏好权重,确定偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签,获取待缓存数据集,将待缓存数据集中数据标签为所述目标标签的数据进行缓存处理,利用提取到的浏览时长与浏览次数计算用户对不同类型浏览数据的偏好程度,并根据计算得到的偏好程度选取待缓存数据集中的数据进行缓存,实现了基于用户的行为对数据进行缓存,避免将所有数据进行统一缓存,有利于减少需要缓存的数据量,加快缓存效率。因此本发明提出的基于用户行为的数据缓存方法、装置、电子设备及计算机可读存储介质,可以减少计算机需要进行缓存的数据量,提高数据缓存效率。
附图说明
图1为本发明一实施例提供的基于用户行为的数据缓存方法的流程示意图;
图2为本发明一实施例提供的基于用户行为的数据缓存装置的功能模块图;
图3为本发明一实施例提供的实现所述基于用户行为的数据缓存方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于用户行为的数据缓存方法。所述基于用户行为的数据缓存方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于用户行为的数据缓存方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
参照图1所示,为本发明一实施例提供的基于用户行为的数据缓存方法的流程示意图。在本实施例中,所述基于用户行为的数据缓存方法包括:
S1、获取用户的浏览数据集,按照数据类型标签对所述浏览数据集中的浏览数据进行分类,得到多个浏览数据子集。
本发明实施例中,可利用具有数据抓取功能的python语句从互联网(如,Internet网)中抓取用户的浏览数据集,所述浏览数据集包括多条用户浏览过的数据(例如,用户浏览过的网址等)及所述多条用户浏览过的数据对应的数据类型标签,其中,所述数据类型标签可由网址中的关键词生成。
例如,浏览数据集包括网址A、网址B和网址C,网址A中包括关键词家居、日常用品,则网址A的数据类型标签为生活网址;网址B和网址C中均包括关键词游戏、游戏发布、玩家评测,则网址B和网址C的类型标签均为游戏网址。
本发明实施例中,所述按照数据类型标签对所述浏览数据集中的浏览数据进行分类,包括:
随机从所述浏览数据集中选取预设数量的浏览数据作为多个簇心数据子集;
分别计算未选取浏览数据子集中的浏览数据与所述多个簇心数据子集的距离,其中,所述未选取浏览数据子集是所述浏览数据集中未被选取的浏览数据的集合;
依次从所述未选取浏览数据子集中选取浏览数据与待汇集簇心数据子集进行汇集,直至所述未选取浏览数据子集中的所有浏览数据完成汇集,其中,所述待汇集簇心数据子集为所述多个簇心数据子集中与选取的浏览数据之间距离最小的簇心数据子集。
例如,当所述浏览数据子集中包含a,b,c,d,e,f六个用户浏览过的网址,随机选择a和b作为两个簇心数据子集,分别计算未选取浏览数据子集中c,d,e,f与a和b的距离,当距离计算完成后,随机从所述未选取浏览数据子集中选取目标浏览数据c,若浏览数据c与簇心数据子集a的距离比浏览数据c与簇心数据子集b的距离更近,则将浏览数据c与簇心数据子集a 进行汇集,再随机从所述未选取浏览数据子集中选取浏览数据d,若浏览数据 d与簇心数据子集a的距离比浏览数据d与簇心数据子集b的距离更近,则将浏览数据d与簇心数据子集a进行汇集。
同时,继续随机地从未选取浏览数据子集选取浏览数据e,若浏览数据e 与簇心数据子集b的距离比浏览数据e与簇心数据子集a的距离更近,则将浏览数据e与簇心数据子集b进行汇集,再随机从所述未选取浏览数据子集中选取浏览数据f,若浏览数据f与簇心数据子集b的距离比浏览数据f与簇心数据子集a的距离更近,则将浏览数据f与簇心数据子集b进行汇集。
详细地,所述分别计算未选取浏览数据子集中的浏览数据与所述多个簇心数据子集的距离,包括:
利用如下距离算法计算所述网址集中未被选取的网址与所述簇心数据子集的距离值d(A,B)2:
d(A,B)2=||A-B||2
其中,A为所述未选取浏览数据子集子集中任一浏览数据,B为任一簇心数据子集。
S2、对所述多个浏览数据子集进行浏览次数提取,得到浏览次数数据集。
本发明实施例中,所述对所述多个浏览数据子集进行浏览次数提取,包括:
提取所述多个浏览数据子集的浏览次数字段;
对所述浏览次数字段进行字段分割,得到多个分割字段;
对所述多个分割字段进行字段向量化处理,得到多个字段向量;
计算所述多个字段向量的模长,确定所述模长为所述浏览数据子集的浏览次数。
详细地,本发明实施例利用预先训练完成的卷积神经网络提取多个浏览数据子集中各浏览数据子集的浏览次数字段,所述卷积神经网络包括但不限于BP神经网络,LSTM神经网络。
进一步地,所述对所述浏览次数字段进行字段分割,得到多个分割字段,包括:
对所述浏览次数字段进行字段拆分处理,得到初始字段集;
对所述初始字段集进行无用字段删除,得到多个分割字段。
本发明实施例中,利用分词模型对浏览次数字段进行分词处理,所述分词模型包括但不限于MeCab模型、pyhanlp模型和HMM模型(隐马尔可夫模型,Hidden Markov Model)。
详细地,本发明实施例利用标准字段词词典对分词模型得到的初始分词集进行非字段词删除,例如,标准字段词词典中含有标准字段词:A、B、C、 D和E,初始分词集中包括分词:A、C、E、F和G,则删除初始分词集中的分词F和G,将初始分词集中未被删除的分词:A、C和E作为分割字段。
具体地,所述对所述多个分割字段进行字段向量化处理,得到多个字段向量,包括:
选取所述多个分割字段中任一分割字段为待转换字段;
将所述待转换字段中的每个字节进行字节编码,得到字节向量集;
将所述字节向量集中的字节向量进行拼接,得到所述待转换字段的字段向量,直至所述多个分割字段中所有分割字段转换为字段向量,得到所述多个字段向量。
本发明实施例中,分别计算获取的多个字段向量中每个字段的模长,将模长进行汇集,得到浏览次数数据集,其中,所述浏览次数数据集用于表示用户对多个浏览数据子集中各浏览数据子集浏览的次数。
S3、对所述多个浏览数据子集进行时长提取,得到浏览时长数据集。
本发明实施例中,所述对所述多个浏览数据子集中各浏览数据子集进行时长提取,得到浏览时长数据集,包括:
利用如下时长提取算法对所述多个浏览数据子集中各浏览数据子集进行时长提取:
其中,bu(t)为用户对所述多个浏览数据子集中第u个浏览数据子集的浏览时长,du为所述多个浏览数据子集中第u个浏览数据子集,i为所述多个浏览数据子集中浏览数据子集的个数,t0为所述多个浏览数据子集中第u个浏览数据子集的开始浏览时间,t1为所述多个浏览数据子集中第u个浏览数据子集的结束浏览时间。
本发明实施例中,对多个浏览数据子集中每一个浏览数据子集进行时长提取,并将时长提取的结果汇集为浏览时长数据集,其中,所述浏览时长数据集包括用户对多个浏览数据子集中各浏览数据子集浏览的时长。
S4、根据所述浏览次数数据集和所述浏览时长数据集计算用户对所述多个浏览数据子集的偏好权重。
本发明实施例中,所述根据所述浏览次数数据集和所述浏览时长数据集计算用户对所述多个浏览数据子集中各浏览数据子集的偏好权重,包括:
利用如下特征值算法按计算所述偏好权重:
其中,T(i)为用户对所述多个浏览数据子集中第i个浏览数据子集的偏好权重,m为所述多个浏览数据子集中浏览数据子集的个数,pi为所述多个浏览数据子集中第i个浏览数据子集,fi为所述浏览次数数据集中用户对第i个浏览数据子集的浏览次数数据,bi(t)为所述浏览次数数据集中用户对第i个浏览数据子集的浏览时长。
本发明实施例中,所述偏好权重可表示用户对浏览数据子集的浏览偏好程度,当偏好权重越大,则说明用户对浏览数据子集的浏览偏好程度越大,例如,用户对所述多个浏览数据子集中第r个浏览数据子集的偏好权重为60,用户对所述多个浏览数据子集中第g个浏览数据子集的偏好权重为80,则用户更偏向于浏览第g个浏览数据子集。
S5、确定所述偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签。
例如,存在浏览数据子集1、浏览数据子集2、浏览数据子集3、浏览数据子集4、浏览数据子集5,其中,浏览数据子集1的偏好权重为30,浏览数据子集2的偏好权重为40,浏览数据子集3的偏好权重为50,浏览数据子集 4的偏好权重为60,浏览数据子集5的偏好权重为70,当权重阈值为55时,确定浏览数据子集4和浏览数据子集5对应的数据类型标签为目标标签。
S6、获取待缓存数据集,将所述待缓存数据集中数据标签为所述目标标签的数据进行缓存处理。
本发明实施例中,所述待缓存数据集包括多条未进行缓存的待缓存数据,及这些待缓存数据对应的数据标签。所述待缓存数据是网络中存在的用户未浏览过的数据(例如,用户未浏览过的网址等)。
详细地,所述获取待缓存数据集,包括:
查询所述待缓存数据集的网络地址;
检测所述网络地址的调用环境;
通过与所述调用环境对应的编译器编译得到信息调用语句;
执行所述信息调用语句从所述网络地址中获取所述浏览数据集。
本发明实施例中,可根据待缓存数据集的数据名称等信息利用搜索引擎查询到待缓存数据集的网络地址;并利用具有环境检测功能的python语句检测网络地址的调用环境。
详细地,所述将所述待缓存数据集中数据标签为所述目标标签的数据进行缓存处理,包括:
获取所述目标缓存地址的数据传输请求头部;
在所述数据传输请求头部增加扩展字段,其中,所述扩展字段包括所述目标缓存地址的数据传输状态字段;
利用增加所述扩展字段的数据传输请求头部向所述目标缓存地址发送数据传输请求;
接收所述目标缓存地址基于所述数据传输请求返回的数据传输状态;
当所述数据传输状态为可传输状态时,将所述待缓存数据集中数据标签为目标标签的数据存入所述目标缓存地址中。
详细地,所述目标设备内存的数据传输状态字段为diff-tag,其值可用布尔值False或True表示,其中,True表示数据传输状态为可传输状态,False 表示数据传输状态为不可传输状态。
当所述目标缓存地址接收到所述数据传输请求头部的数据传输请求后,判断当前数据传输状态,若数据传输状态为不可传输状态,则将扩展字段中数据传输状态字段diff-tag赋值为False,若数据传输状态为可传输状态,则将扩展字段中数据传输状态字段diff-tag赋值为True,当所述扩展字段中数据传输状态字段diff-tag赋值完成后,返回所述扩展字段中数据传输状态字段 diff-tag。
本发明实施例通过按照数据类型标签对获取的浏览数据集进行分类,得到多个浏览数据子集,对多个浏览数据子集进行浏览次数提取和时长提取,可实现将用户对浏览数据的浏览行为进行数量化,得到用户对各类型的浏览数据子集的浏览次数和浏览时长,有利于提高后续对用户数据进行分析的精确性;根据浏览次数提取和浏览时长提取结果计算用户对多个浏览数据子集的偏好权重,确定偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签,获取待缓存数据集,将待缓存数据集中数据标签为所述目标标签的数据进行缓存处理,利用提取到的浏览时长与浏览次数计算用户对不同类型浏览数据的偏好程度,并根据计算得到的偏好程度选取待缓存数据集中的数据进行缓存,实现了基于用户的行为对数据进行缓存,避免将所有数据进行统一缓存,有利于减少需要缓存的数据量,加快缓存效率。因此本发明提出的基于用户行为的数据缓存方法,可以减少计算机需要进行缓存的数据量,提高数据缓存效率。
如图2所示,是本发明一实施例提供的基于用户行为的数据缓存装置的功能模块图。
本发明所述基于用户行为的数据缓存装置100可以安装于电子设备中。根据实现的功能,所述基于用户行为的数据缓存装置100可以包括数据分类模块101、次数提取模块102、时长提取模块103、权重计算模块104、标签筛选模块105和缓存模块106。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述数据分类模块101,用于获取用户的浏览数据集,按照数据类型标签对所述浏览数据集中的浏览数据进行分类,得到多个浏览数据子集;
所述次数提取模块102,用于对所述多个浏览数据子集进行浏览次数提取,得到浏览次数数据集;
所述时长提取模块103,用于对所述多个浏览数据子集进行时长提取,得到浏览时长数据集;
所述权重计算模块104,用于根据所述浏览次数数据集和所述浏览时长数据集计算用户对所述多个浏览数据子集的偏好权重;
所述标签筛选模块105,用于确定所述偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签;
所述缓存模块106,用于获取待缓存数据集,将所述待缓存数据集中数据标签为所述目标标签的数据进行缓存处理。
详细地,所述基于用户行为的数据缓存装置100中的各模块在由电子设备的处理器所执行时,可以实现包括下述操作步骤的基于用户行为的数据缓存方法:
步骤一、所述数据分类模块101获取用户的浏览数据集,按照数据类型标签对所述浏览数据集中的浏览数据进行分类,得到多个浏览数据子集。
本发明实施例中,可利用具有数据抓取功能的python语句从互联网(如,Internet网)中抓取用户的浏览数据集,所述浏览数据集包括多条用户浏览过的数据(例如,用户浏览过的网址等)及所述多条用户浏览过的数据对应的数据类型标签,其中,所述数据类型标签可由网址中的关键词生成。
例如,浏览数据集包括网址A、网址B和网址C,网址A中包括关键词家居、日常用品,则网址A的数据类型标签为生活网址;网址B和网址C中均包括关键词游戏、游戏发布、玩家评测,则网址B和网址C的类型标签均为游戏网址。
本发明实施例中,所述数据分类模块101具体用于:
随机从所述浏览数据集中选取预设数量的浏览数据作为多个簇心数据子集;
分别计算未选取浏览数据子集中的浏览数据与所述多个簇心数据子集的距离,其中,所述未选取浏览数据子集是所述浏览数据集中未被选取的浏览数据的集合;
依次从所述未选取浏览数据子集中选取浏览数据与待汇集簇心数据子集进行汇集,直至所述未选取浏览数据子集中的所有浏览数据完成汇集,其中,所述待汇集簇心数据子集为所述多个簇心数据子集中与选取的浏览数据之间距离最小的簇心数据子集。
例如,当所述浏览数据子集中包含a,b,c,d,e,f六个用户浏览过的网址,随机选择a和b作为两个簇心数据子集,分别计算未选取浏览数据子集中c,d,e,f与a和b的距离,当距离计算完成后,随机从所述未选取浏览数据子集中选取目标浏览数据c,若浏览数据c与簇心数据子集a的距离比浏览数据c与簇心数据子集b的距离更近,则将浏览数据c与簇心数据子集a 进行汇集,再随机从所述未选取浏览数据子集中选取浏览数据d,若浏览数据 d与簇心数据子集a的距离比浏览数据d与簇心数据子集b的距离更近,则将浏览数据d与簇心数据子集a进行汇集。
同时,继续随机地从未选取浏览数据子集选取浏览数据e,若浏览数据e 与簇心数据子集b的距离比浏览数据e与簇心数据子集a的距离更近,则将浏览数据e与簇心数据子集b进行汇集,再随机从所述未选取浏览数据子集中选取浏览数据f,若浏览数据f与簇心数据子集b的距离比浏览数据f与簇心数据子集a的距离更近,则将浏览数据f与簇心数据子集b进行汇集。
详细地,所述分别计算未选取浏览数据子集中的浏览数据与所述多个簇心数据子集的距离,包括:
利用如下距离算法计算所述网址集中未被选取的网址与所述簇心数据子集的距离值d(A,B)2:
d(A,B)2=||A-B||2
其中,A为所述未选取浏览数据子集子集中任一浏览数据,B为任一簇心数据子集。
步骤二、所述次数提取模块102对所述多个浏览数据子集进行浏览次数提取,得到浏览次数数据集。
本发明实施例中,所述次数提取模块102具体用于:
提取所述多个浏览数据子集的浏览次数字段;
对所述浏览次数字段进行字段分割,得到多个分割字段;
对所述多个分割字段进行字段向量化处理,得到多个字段向量;
计算所述多个字段向量的模长,确定所述模长为所述浏览数据子集的浏览次数。
详细地,本发明实施例利用预先训练完成的卷积神经网络提取多个浏览数据子集中各浏览数据子集的浏览次数字段,所述卷积神经网络包括但不限于BP神经网络,LSTM神经网络。
进一步地,所述对所述浏览次数字段进行字段分割,得到多个分割字段,包括:
对所述浏览次数字段进行字段拆分处理,得到初始字段集;
对所述初始字段集进行无用字段删除,得到多个分割字段。
本发明实施例中,利用分词模型对浏览次数字段进行分词处理,所述分词模型包括但不限于MeCab模型、pyhanlp模型和HMM模型(隐马尔可夫模型,Hidden Markov Model)。
详细地,本发明实施例利用标准字段词词典对分词模型得到的初始分词集进行非字段词删除,例如,标准字段词词典中含有标准字段词:A、B、C、 D和E,初始分词集中包括分词:A、C、E、F和G,则删除初始分词集中的分词F和G,将初始分词集中未被删除的分词:A、C和E作为分割字段。
具体地,所述对所述多个分割字段进行字段向量化处理,得到多个字段向量,包括:
选取所述多个分割字段中任一分割字段为待转换字段;
将所述待转换字段中的每个字节进行字节编码,得到字节向量集;
将所述字节向量集中的字节向量进行拼接,得到所述待转换字段的字段向量,直至所述多个分割字段中所有分割字段转换为字段向量,得到所述多个字段向量。
本发明实施例中,分别计算获取的多个字段向量中每个字段的模长,将模长进行汇集,得到浏览次数数据集,其中,所述浏览次数数据集用于表示用户对多个浏览数据子集中各浏览数据子集浏览的次数。
步骤三、所述时长提取模块103对所述多个浏览数据子集进行时长提取,得到浏览时长数据集。
本发明实施例中,所述时长提取模块103具体用于:
利用如下时长提取算法对所述多个浏览数据子集中各浏览数据子集进行时长提取:
其中,bu(t)为用户对所述多个浏览数据子集中第u个浏览数据子集的浏览时长,du为所述多个浏览数据子集中第u个浏览数据子集,i为所述多个浏览数据子集中浏览数据子集的个数,t0为所述多个浏览数据子集中第u个浏览数据子集的开始浏览时间,t1为所述多个浏览数据子集中第u个浏览数据子集的结束浏览时间。
本发明实施例中,对多个浏览数据子集中每一个浏览数据子集进行时长提取,并将时长提取的结果汇集为浏览时长数据集,其中,所述浏览时长数据集包括用户对多个浏览数据子集中各浏览数据子集浏览的时长。
步骤四、所述权重计算模块104根据所述浏览次数数据集和所述浏览时长数据集计算用户对所述多个浏览数据子集的偏好权重。
本发明实施例中,所述权重计算模块104具体用于:
利用如下特征值算法按计算所述偏好权重:
其中,T(i)为用户对所述多个浏览数据子集中第i个浏览数据子集的偏好权重,m为所述多个浏览数据子集中浏览数据子集的个数,pi为所述多个浏览数据子集中第i个浏览数据子集,fi为所述浏览次数数据集中用户对第i个浏览数据子集的浏览次数数据,bi(t)为所述浏览次数数据集中用户对第i个浏览数据子集的浏览时长。
本发明实施例中,所述偏好权重可表示用户对浏览数据子集的浏览偏好程度,当偏好权重越大,则说明用户对浏览数据子集的浏览偏好程度越大,例如,用户对所述多个浏览数据子集中第r个浏览数据子集的偏好权重为60,用户对所述多个浏览数据子集中第g个浏览数据子集的偏好权重为80,则用户更偏向于浏览第g个浏览数据子集。
步骤五、所述标签筛选模块105确定所述偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签。
例如,存在浏览数据子集1、浏览数据子集2、浏览数据子集3、浏览数据子集4、浏览数据子集5,其中,浏览数据子集1的偏好权重为30,浏览数据子集2的偏好权重为40,浏览数据子集3的偏好权重为50,浏览数据子集 4的偏好权重为60,浏览数据子集5的偏好权重为70,当权重阈值为55时,确定浏览数据子集4和浏览数据子集5对应的数据类型标签为目标标签。
步骤六、所述缓存模块106获取待缓存数据集,将所述待缓存数据集中数据标签为所述目标标签的数据进行缓存处理。
本发明实施例中,所述待缓存数据集包括多条未进行缓存的待缓存数据,及这些待缓存数据对应的数据标签。所述待缓存数据是网络中存在的用户未浏览过的数据(例如,用户未浏览过的网址等)。
详细地,所述缓存模块106具体用于:
查询所述待缓存数据集的网络地址;
检测所述网络地址的调用环境;
通过与所述调用环境对应的编译器编译得到信息调用语句;
执行所述信息调用语句从所述网络地址中获取所述浏览数据集;
获取所述目标缓存地址的数据传输请求头部;
在所述数据传输请求头部增加扩展字段,其中,所述扩展字段包括所述目标缓存地址的数据传输状态字段;
利用增加所述扩展字段的数据传输请求头部向所述目标缓存地址发送数据传输请求;
接收所述目标缓存地址基于所述数据传输请求返回的数据传输状态;
当所述数据传输状态为可传输状态时,将所述待缓存数据集中数据标签为目标标签的数据存入所述目标缓存地址中。。
本发明实施例中,可根据待缓存数据集的数据名称等信息利用搜索引擎查询到待缓存数据集的网络地址;并利用具有环境检测功能的python语句检测网络地址的调用环境。
详细地,所述目标设备内存的数据传输状态字段为diff-tag,其值可用布尔值False或True表示,其中,True表示数据传输状态为可传输状态,False 表示数据传输状态为不可传输状态。
当所述目标缓存地址接收到所述数据传输请求头部的数据传输请求后,判断当前数据传输状态,若数据传输状态为不可传输状态,则将扩展字段中数据传输状态字段diff-tag赋值为False,若数据传输状态为可传输状态,则将扩展字段中数据传输状态字段diff-tag赋值为True,当所述扩展字段中数据传输状态字段diff-tag赋值完成后,返回所述扩展字段中数据传输状态字段 diff-tag。
本发明实施例通过按照数据类型标签对获取的浏览数据集进行分类,得到多个浏览数据子集,对多个浏览数据子集进行浏览次数提取和时长提取,可实现将用户对浏览数据的浏览行为进行数量化,得到用户对各类型的浏览数据子集的浏览次数和浏览时长,有利于提高后续对用户数据进行分析的精确性;根据浏览次数提取和浏览时长提取结果计算用户对多个浏览数据子集的偏好权重,确定偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签,获取待缓存数据集,将待缓存数据集中数据标签为所述目标标签的数据进行缓存处理,利用提取到的浏览时长与浏览次数计算用户对不同类型浏览数据的偏好程度,并根据计算得到的偏好程度选取待缓存数据集中的数据进行缓存,实现了基于用户的行为对数据进行缓存,避免将所有数据进行统一缓存,有利于减少需要缓存的数据量,加快缓存效率。因此本发明提出的基于用户行为的数据缓存装置,可以减少计算机需要进行缓存的数据量,提高数据缓存效率。
如图3所示,是本发明一实施例提供的实现基于用户行为的数据缓存方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于用户行为的数据缓存程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字 (SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器 11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于用户行为的数据缓存程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10 是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块 (例如基于用户行为的数据缓存程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3 示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源 (比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10 逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器 (Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED 显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的基于用户行为的数据缓存程序 12是多个指令的组合,在所述处理器10中运行时,可以实现:
获取用户的浏览数据集,按照数据类型标签对所述浏览数据集中的浏览数据进行分类,得到多个浏览数据子集;
对所述多个浏览数据子集进行浏览次数提取,得到浏览次数数据集;
对所述多个浏览数据子集进行时长提取,得到浏览时长数据集;
根据所述浏览次数数据集和所述浏览时长数据集计算用户对所述多个浏览数据子集的偏好权重;
确定所述偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签;
获取待缓存数据集,将所述待缓存数据集中数据标签为所述目标标签的数据进行缓存处理。
具体地,所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取用户的浏览数据集,按照数据类型标签对所述浏览数据集中的浏览数据进行分类,得到多个浏览数据子集;
对所述多个浏览数据子集进行浏览次数提取,得到浏览次数数据集;
对所述多个浏览数据子集进行时长提取,得到浏览时长数据集;
根据所述浏览次数数据集和所述浏览时长数据集计算用户对所述多个浏览数据子集的偏好权重;
确定所述偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签;
获取待缓存数据集,将所述待缓存数据集中数据标签为所述目标标签的数据进行缓存处理。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于用户行为的数据缓存方法,其特征在于,所述方法包括:
获取用户的浏览数据集,按照数据类型标签对所述浏览数据集中的浏览数据进行分类,得到多个浏览数据子集;
对所述多个浏览数据子集进行浏览次数提取,得到浏览次数数据集;
对所述多个浏览数据子集进行时长提取,得到浏览时长数据集;
根据所述浏览次数数据集和所述浏览时长数据集计算用户对所述多个浏览数据子集的偏好权重;
确定所述偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签;
获取待缓存数据集,将所述待缓存数据集中数据标签为所述目标标签的数据进行缓存处理。
2.如权利要求1所述的基于用户行为的数据缓存方法,其特征在于,所述对所述多个浏览数据子集进行浏览次数提取,包括:
提取所述多个浏览数据子集的浏览次数字段;
对所述浏览次数字段进行字段分割,得到多个分割字段;
对所述多个分割字段进行字段向量化处理,得到多个字段向量;
计算所述多个字段向量的模长,确定所述模长为所述浏览数据子集的浏览次数。
3.如权利要求2所述的基于用户行为的数据缓存方法,其特征在于,所述对所述浏览次数字段进行字段分割,得到多个分割字段,包括:
对所述浏览次数字段进行字段拆分处理,得到初始字段集;
对所述初始字段集进行无用字段删除,得到多个分割字段。
4.如权利要求2所述的基于用户行为的数据缓存方法,其特征在于,所述对所述多个分割字段进行字段向量化处理,得到多个字段向量,包括:
选取所述多个分割字段中任一分割字段为待转换字段;
将所述待转换字段中的每个字节进行字节编码,得到字节向量集;
将所述字节向量集中的字节向量进行拼接,得到所述待转换字段的字段向量,直至所述多个分割字段中所有分割字段转换为字段向量,得到所述多个字段向量。
5.如权利要求1所述的基于用户行为的数据缓存方法,其特征在于,所述按照数据类型标签对所述浏览数据集中的浏览数据进行分类,包括:
随机从所述浏览数据集中选取预设数量的浏览数据作为多个簇心数据子集;
分别计算未选取浏览数据子集中的浏览数据与所述多个簇心数据子集的距离,其中,所述未选取浏览数据子集是所述浏览数据集中未被选取的浏览数据的集合;
依次从所述未选取浏览数据子集中选取浏览数据与待汇集簇心数据子集进行汇集,直至所述未选取浏览数据子集中的所有浏览数据完成汇集,其中,所述待汇集簇心数据子集为所述多个簇心数据子集中与选取的浏览数据之间距离最小的簇心数据子集。
6.如权利要求1至5中任一项所述的基于用户行为的数据缓存方法,其特征在于,所述获取待缓存数据集,包括:
查询所述待缓存数据集的网络地址;
检测所述网络地址的调用环境;
通过与所述调用环境对应的编译器编译得到信息调用语句;
执行所述信息调用语句从所述网络地址中获取所述浏览数据集。
7.如权利要求1至5中任一项所述的基于用户行为的数据缓存方法,其特征在于,所述将所述待缓存数据集中数据标签为所述目标标签的数据进行缓存处理,包括:
获取所述目标缓存地址的数据传输请求头部;
在所述数据传输请求头部增加扩展字段,其中,所述扩展字段包括所述目标缓存地址的数据传输状态字段;
利用增加所述扩展字段的数据传输请求头部向所述目标缓存地址发送数据传输请求;
接收所述目标缓存地址基于所述数据传输请求返回的数据传输状态;
当所述数据传输状态为可传输状态时,将所述待缓存数据集中数据标签为目标标签的数据存入所述目标缓存地址中。
8.一种基于用户行为的数据缓存装置,其特征在于,所述装置包括:
数据分类模块,用于获取用户的浏览数据集,按照数据类型标签对所述浏览数据集中的浏览数据进行分类,得到多个浏览数据子集;
次数提取模块,用于对所述多个浏览数据子集进行浏览次数提取,得到浏览次数数据集;
时长提取模块,用于对所述多个浏览数据子集进行时长提取,得到浏览时长数据集;
权重计算模块,用于根据所述浏览次数数据集和所述浏览时长数据集计算用户对所述多个浏览数据子集的偏好权重;
标签筛选模块,用于确定所述偏好权重大于权重阈值的浏览数据子集的数据类型标签为目标标签;
缓存模块,用于获取待缓存数据集,将所述待缓存数据集中数据标签为所述目标标签的数据进行缓存处理。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的基于用户行为的数据缓存方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的基于用户行为的数据缓存方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110607878.1A CN113360803A (zh) | 2021-06-01 | 2021-06-01 | 基于用户行为的数据缓存方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110607878.1A CN113360803A (zh) | 2021-06-01 | 2021-06-01 | 基于用户行为的数据缓存方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113360803A true CN113360803A (zh) | 2021-09-07 |
Family
ID=77530686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110607878.1A Pending CN113360803A (zh) | 2021-06-01 | 2021-06-01 | 基于用户行为的数据缓存方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113360803A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113793218A (zh) * | 2021-09-16 | 2021-12-14 | 平安银行股份有限公司 | 用户账户变更行为分析方法、装置、设备及存储介质 |
CN114461685A (zh) * | 2022-04-14 | 2022-05-10 | 天津南大通用数据技术股份有限公司 | 一种灵活扩展数据库字段的方法 |
CN116741346A (zh) * | 2023-05-11 | 2023-09-12 | 无锡蓝影医疗科技有限公司 | 一种基于云计算的医疗智能云影像管理系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101493821A (zh) * | 2008-01-25 | 2009-07-29 | 中兴通讯股份有限公司 | 数据缓存方法和装置 |
CN103246612A (zh) * | 2012-02-13 | 2013-08-14 | 阿里巴巴集团控股有限公司 | 一种数据缓存的方法及装置 |
CN112559923A (zh) * | 2020-12-16 | 2021-03-26 | 平安银行股份有限公司 | 网址资源推荐方法、装置、电子设备及计算机存储介质 |
-
2021
- 2021-06-01 CN CN202110607878.1A patent/CN113360803A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101493821A (zh) * | 2008-01-25 | 2009-07-29 | 中兴通讯股份有限公司 | 数据缓存方法和装置 |
CN103246612A (zh) * | 2012-02-13 | 2013-08-14 | 阿里巴巴集团控股有限公司 | 一种数据缓存的方法及装置 |
CN112559923A (zh) * | 2020-12-16 | 2021-03-26 | 平安银行股份有限公司 | 网址资源推荐方法、装置、电子设备及计算机存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113793218A (zh) * | 2021-09-16 | 2021-12-14 | 平安银行股份有限公司 | 用户账户变更行为分析方法、装置、设备及存储介质 |
CN113793218B (zh) * | 2021-09-16 | 2023-07-25 | 平安银行股份有限公司 | 用户账户变更行为分析方法、装置、设备及存储介质 |
CN114461685A (zh) * | 2022-04-14 | 2022-05-10 | 天津南大通用数据技术股份有限公司 | 一种灵活扩展数据库字段的方法 |
CN114461685B (zh) * | 2022-04-14 | 2022-07-01 | 天津南大通用数据技术股份有限公司 | 一种灵活扩展数据库字段的方法 |
CN116741346A (zh) * | 2023-05-11 | 2023-09-12 | 无锡蓝影医疗科技有限公司 | 一种基于云计算的医疗智能云影像管理系统及方法 |
CN116741346B (zh) * | 2023-05-11 | 2024-03-26 | 无锡蓝影医疗科技有限公司 | 一种基于云计算的医疗智能云影像管理系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022141861A1 (zh) | 情感分类方法、装置、电子设备及存储介质 | |
CN113360803A (zh) | 基于用户行为的数据缓存方法、装置、设备及存储介质 | |
CN112541338A (zh) | 相似文本匹配方法、装置、电子设备及计算机存储介质 | |
CN111666415A (zh) | 话题聚类方法、装置、电子设备及存储介质 | |
CN113449187A (zh) | 基于双画像的产品推荐方法、装置、设备及存储介质 | |
CN114138784A (zh) | 基于存储库的信息溯源方法、装置、电子设备及介质 | |
CN112559923A (zh) | 网址资源推荐方法、装置、电子设备及计算机存储介质 | |
CN112528616A (zh) | 业务表单生成方法、装置、电子设备及计算机存储介质 | |
CN113886708A (zh) | 基于用户信息的产品推荐方法、装置、设备及存储介质 | |
CN113592605A (zh) | 基于相似产品的产品推荐方法、装置、设备及存储介质 | |
CN114416939A (zh) | 智能问答方法、装置、设备及存储介质 | |
CN113869456A (zh) | 采样监测方法、装置、电子设备及存储介质 | |
CN112579781A (zh) | 文本归类方法、装置、电子设备及介质 | |
CN113157739A (zh) | 跨模态检索方法、装置、电子设备及存储介质 | |
CN115409041B (zh) | 一种非结构化数据提取方法、装置、设备及存储介质 | |
CN111538768A (zh) | 基于n元模型的数据查询方法、装置、电子设备及介质 | |
CN116340516A (zh) | 实体关系的聚类提取方法、装置、设备及存储介质 | |
CN115525761A (zh) | 一种文章关键词筛选类别的方法、装置、设备及存储介质 | |
CN115186188A (zh) | 基于行为分析的产品推荐方法、装置、设备及存储介质 | |
CN115018588A (zh) | 产品推荐方法、装置、电子设备及可读存储介质 | |
CN114518993A (zh) | 基于业务特征的系统性能监控方法、装置、设备及介质 | |
CN114513355A (zh) | 恶意域名检测方法、装置、设备及存储介质 | |
CN114219367A (zh) | 用户评分方法、装置、设备及存储介质 | |
CN114139530A (zh) | 同义词提取方法、装置、电子设备及存储介质 | |
CN113806492A (zh) | 基于语义识别的记录生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |