CN112347367A - 信息服务提供方法、装置、电子设备和存储介质 - Google Patents
信息服务提供方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112347367A CN112347367A CN202011413754.1A CN202011413754A CN112347367A CN 112347367 A CN112347367 A CN 112347367A CN 202011413754 A CN202011413754 A CN 202011413754A CN 112347367 A CN112347367 A CN 112347367A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- recommended
- browsing
- information service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 239000013598 vector Substances 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 39
- 238000012549 training Methods 0.000 claims description 36
- 230000015654 memory Effects 0.000 claims description 29
- 230000006399 behavior Effects 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 13
- 230000009467 reduction Effects 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 230000007787 long-term memory Effects 0.000 claims description 5
- 230000006403 short-term memory Effects 0.000 claims description 5
- 238000006467 substitution reaction Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种信息服务提供方法、装置、电子设备和存储介质,其中,该方法包括:根据用户的历史浏览信息集确定资讯偏好特征;根据所述资讯偏好特征确定待推荐资讯对应的推荐概率;根据所述推荐概率为所述用户提供信息服务。本发明实施例,通过用户的历史浏览信息提高待推荐资讯的推荐概率确定的准确性,提高了信息服务的个性化程度,可增强信息服务的服务质量。
Description
技术领域
本发明实施例涉及计算机应用技术领域,尤其涉及一种信息服务提供方法、装置、电子设备和存储介质。
背景技术
随着互联网的发展和移动终端的普及,信息量爆发性增长,如何在海量信息中找到感兴趣的内容,成为了新时代的难点。信息服务商为了提供高质量的信息服务往往需要为用户提供定制化的浏览内容,因此,如何提供准确的推荐信息成为领域内亟待解决的问题。
现有技术中个性化的信息服务往往基于协同过滤等方法实现资讯推荐,但是由于信息服务需要的资讯存在高度时效性以及数据的稀疏性等特点,导致信息服务过程中存在资讯滞后现象,无法满足用户的时效需求,降低了信息服务的质量。
发明内容
本发明提供一种信息服务提供方法、装置、电子设备和存储介质,以实现针对用户的个性化资讯推荐,增强推荐资讯的时效性,提高信息服务质量。
第一方面,本发明实施例提供了一种信息服务提供方法,该方法包括:
根据用户的历史浏览信息集确定资讯偏好特征;
根据所述资讯偏好特征确定待推荐资讯对应的推荐概率;
根据所述推荐概率为所述用户提供信息服务。
第二方面,本发明实施例提供了一种信息服务提供装置,该装置包括:
用户偏好模块,用于根据用户的历史浏览信息集确定资讯偏好特征;
概率确定模块,用于根据所述资讯偏好特征确定待推荐资讯对应的推荐概率;
信息服务模块,用于根据所述推荐概率为所述用户提供信息服务。
第三方面,本发明实施例提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本申请实施例中任一所述的信息服务提供方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本发明实施例中任一所述的信息服务提供方法。
本发明实施例,通过用户的历史浏览信息集确定资讯偏好特征,按照该资讯偏好特征获取到待推荐资讯对应的推荐概率,基于推荐概率为用户提供信息服务,提高了信息服务的个性化程度,增强了信息推荐的准确性,可增强信息服务质量。
附图说明
图1是本发明实施例一提供的一种信息服务提供方法的流程图;
图2是本发明实施例二提供的一种信息服务提供方法的流程图;
图3是本发明实施例二提供的一种LSTM单元格基础结构示意图;
图4是本发明实施例二提供的一种多层感知机的结构示意图;
图5是本发明实施例二提供的一种卷积过程的示例图;
图6是本发明实施例三提供的一种信息服务提供装置的结构示意图;
图7是本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构,此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
图1是本发明实施例一提供的一种信息服务提供方法的流程图,本实施例可适用于提供高时效性资讯信息的情况,该方法可以由信息服务提供装置来执行,该装置可以采用硬件和/或软件的方式来实现,参见图1,本发明实施例提供的方法具体包括如下步骤:
步骤110、根据用户的历史浏览信息集确定资讯偏好特征。
其中,历史浏览信息集可以是用户过去的浏览记录集合,包括一条或者多条浏览记录,历史浏览信息集具体可以包括用户在资讯推荐页面的浏览信息以及软件中的浏览路径等,资讯偏好特征可以是反映用户浏览资讯的喜好特征,例如,经常浏览的资讯信息或者最不喜欢的资讯信息等。可以理解的是,获取到的历史浏览信息可以标签-内容的形式存在,例如:
{Item_Id:593370820652153,
Type_Code:财联社快讯
SEND_DATE:2018-10-30 10:36:06:000
TIT:谷歌、腾讯和京东将向印尼网约车公司Go-Jek投资12亿美元
CONTENT:10月30日讯,据The Information报道,Google、腾讯和京东将向Go-Jek投资12亿美元,这将使这家印度尼西亚的“网约摩的”公司估值达到90亿美元。在世界上互联网市场发展最快的东南亚地区,Go-Jek的对手是Grab,Grab是一家总部位于新加坡的网约车公司,由SoftBank和滴滴支持。
SECU-SHT:谷歌、腾讯、京东、滴滴
TagName:互联网、国际}。
在本申请实施例中,可以通过对用户的历史浏览信息集的处理获取到用户的资讯偏好特征,例如,可以统计历史浏览信息集中浏览次数最多的资讯或者浏览次数最小的资讯作为用户的资讯偏好特征,还可以通过预先训练的神经网络模型对历史浏览信息集进行特征提取获取到资讯偏好特征,其中,神经网络模型可以通过大量的浏览信息进行训练生成。
步骤120、根据所述资讯偏好特征确定待推荐资讯对应的推荐概率。
其中,待推荐资讯可以是服务提供商待推荐的信息,推荐概率可以是待推荐资讯被推荐给用户的概率,推荐概率越大,对应的待推荐资讯被推荐给用户的可能性越大。
具体的,可以通过资讯偏好特征确定出各待推荐资讯的推荐概率,例如,可以对资讯偏好特征中各历史浏览信息进行排序统计确定出每类信息的占比,可以将每类信息的占比作为对应的待推荐资讯的推荐概率,还可以将资讯偏好特征和待推荐资讯作为神经网络模型的输入,并将该神经网络模型的输出作为推荐概率,其中,神经网络模型可以预先通过包含历史浏览信息集的样本集训练生成。
步骤130、根据所述推荐概率为所述用户提供信息服务。
在本申请实施例中,可以通过推荐概率选择待推荐资讯进行推荐实现信息服务,例如,可以选择超过阈值概率的待推荐资讯作为信息服务推荐的信息,也可以根据推荐概率对待推荐资讯从大到小排序,可以在排序中选择阈值数量的待推荐资讯作为信息服务使用的推荐资讯。
本发明实施例,通过用户的历史浏览信息集确定资讯偏好特征,按照该资讯偏好特征获取到待推荐资讯对应的推荐概率,基于推荐概率为用户提供信息服务,提高了信息服务的个性化程度,增强了信息推荐的准确性,可增强信息服务质量。
实施例二
图2是本发明实施例二提供的一种信息服务提供方法的流程图,本发明实施例是在上述发明实施例基础上的具体化,参见图2,本申请实施例提供的方法具体包括如下步骤:
步骤210、对历史浏览信息集中的浏览记录进行处理生成用户行为向量。
其中,浏览记录可以是组成历史留下信息记的信息,浏览记录可以包括用户浏览资讯的时间、路径、标题和标签等信息。用户行为向量可以由浏览记录组成,可以反映出用户对资讯的偏好情况。
在本发明实施例中,可以提取历史浏览信息集中的浏览记录,可以将浏览记录按照预设规则排列生成用户行为向量。进一步的,在获取到浏览记录后,可以对获取的数据进行预处理,例如排序、分词、低频过滤等,以增强用户的资讯浏览特征。
步骤220、通过预设资讯提取模型处理用户行为向量获取至少一个模型处理结果;其中,所述预设资讯提取模型包括通过训练集训练生成的长短期记忆模型,所述训练集包括历史浏览信息集的正样本和随机生成的负样本,所述正样本的推荐概率为1,负样本的推荐概率为0。
其中,预设资讯提取模型可以是提取用户资讯偏好特征的模型,由于用户的历史浏览信息集在时间上具有序列的特点,可以采用循环神经网络(Recurrent Neural Network,RNN)和长短期记忆网络(Long Short-Term Memory,LSTM)对用户的历史浏览信息集进行特征提取,长期端记忆网络模型可以通过正样本和负样本训练生成,正样本可以是用户的历史浏览信息集,用户对历史浏览信息集中的浏览记录的推荐概率可以标记为1,负样本可以是随机生成的资讯信息集,负样本中资讯信息的推荐概率可以标记为0。
在本发明实施例中,可以将用户行为向量输入到预设资讯提取模型获取到模型处理结果,该预设资讯提取模型具体可以包括循环神经网络模型和长短期记忆网络模型等,以预设资讯提取模型为长短期记忆网络模型为例,LSTM模型包括细胞单元和门控机制,其中,每个细胞单元的基本结构如图3所示,在t时刻每个门的表达形式为:
it=σ(Wi·[ht-1,xt]+bi) (1)
ft=σ(Wf·[ht-1,xt]+bf) (2)
ot=σ(Wo·[ht-1,xt]+bo) (3)
Ct=ft·Ct-1+it·tanh(Wc*[ht-1,xt]+bc) (4)
ht=ot·tanh(Ct) (5)
其中it,ft,ot,Ct分别代表t时刻输入门,遗忘门,输出门和细胞状态的输出,xt表示t时刻输入模型的向量,ht表示t时刻区块中隐藏层中的向量,σ表示sigmoid激活函数,W和b分别表示不同门内待训练的权重矩阵和偏置向量。三个具有筛选功能的门结构,其主要功能如下:1)输入门:用当前的信息以及上一个隐藏层传过来的信息作为输入,用来决定流向当前区块的信息,只保留其中有用的信息。2)遗忘门:用来对上一个隐藏层传过来的信息进行过滤,保留其中有用的信息。3)输出门:对上一个隐藏层的信息做进一步筛选,将有用的信息融合到最终的输出中。
示例性的,假设用户i的历史浏览信息集为其中,表示用户i浏览的第j条资讯的标题及标签,表示利用第一节的资讯特征提取模型得到的资讯特征向量表示,之后利用LSTM模型对用户的历史浏览序列进行表示,LSTM层每个时刻的细胞状态都会输出一个向量可以将每个时刻输出的向量作为模型处理结果。
步骤230、将各所述模型处理结果的平均值作为资讯偏好特征。
具体的,预设资讯提取模型生成的模型处理结果对多个,可以各模型处理结果的平均值作为资讯偏好特征。
步骤240、将所述资讯偏好特征和所述待推荐资讯输入进行内积得到的向量输入多层感知机进行降维。
其中,多层感知机是一种前馈人工神经网络模型,其可以将输入的多个数据集映射到单一的输出的数据集上,图4是本发明实施例二提供的一种多层感知机的结构示意图,参见图4,一个多层感知机可以用公式为:
αout(x)=1/(1+e-x) (8)
其中userembedding为资讯偏好特征,newsembedding为待推荐资讯,w和b为多层感知机的神经元内待训练的参数,αout是Sigmoid函数。
在本发明实施例中,可以将资讯偏好特征和待推荐资讯以向量的方式进行表示,例如,用户偏好向量表示资讯偏好特征,资讯表示向量表示待推荐资讯,使用用户偏好向量与资讯表示向量进行内积获取到结果对应的向量。可以将资讯偏好特征和待推荐资讯的向量输入到多层感知机内,通过多层感知机进行处理降维处理,例如,由128维的向量降低到2维。
步骤250、通过激活函数处理所述降维后的所述向量以确定待推荐资讯对应的推荐概率。
具体的,可以通过激活函数将降维后的向量分别映射到0-1之间的一个概率值,可以将获取到的概率值分别作为对应的待推荐资讯的推荐概率,例如,向量中的第一位的元素映射的概率值作为待推荐资讯中第一位的资讯对应的推荐概率。
步骤260、按照所述推荐概率选择对应的待推荐资讯展示给所述用户,其中,所述展示的形式包括图像、文字、时频、语音中至少一种。
在本发明实施例中,当获取到推荐概率后,可以根据推荐概率对应数值从大到小的顺序依次选择对应的待推荐资讯为用户提供信息服务,可以将待推荐资讯以图像、文字、视频、语音等方式中的一种或者多种形式进行展示。
本发明实施例,通过对历史浏览信息集中的浏览记录处理生成用户行为向量,使用约束资讯提取模型处理用户行为向量获取资讯偏好特征,将资讯偏好特征和待推荐资讯输入的内积结果输入多层感知机进行降维并根据激活函数确定待推荐资讯对应的推荐概率,根据推荐概率展示对应的待推荐资讯给用户,实现了信息服务个性化推荐,增强了信息推荐的准确性,可增强信息服务质量。
进一步的,在上述发明实施例的基础上,所述对所述历史浏览信息集中的浏览记录进行处理生成用户行为向量,包括:按照所述浏览记录的先后阅读顺序进行排列,并获取各所述浏览记录对应的标题和/或标签;使用卷积神经网络或者直连法对排列后的所述浏览记录以及对应的标题和/或标签进行处理以生成用户行为向量。
在本发明实施例中,可以提取历史浏览信息集中的浏览记录,并将浏览记录按照各自被用户的阅读时间的先后顺序进行排列,并采集各浏览记录的标题或者标签,可以使用直连法或者卷积神经网络对排序后的浏览进行处理获取到用户行为向量。其中,直连法可以包括直接将浏览记录的词向量进行首尾连接、求和或求平均值,可以将连接后生成的向量作为用户行为向量。卷积神经网络可以包含卷积和池化两种操作,通过对历史浏览信息集的一些特征进行提取,卷积核在输入的浏览记录组成的矩阵上进行平移,每移动一步得到一个输出矩阵的值,每一步卷积的计算公式可以通过将浏览记录组成的矩阵中各个位置对应的元素相乘再相加,卷积操作之后通常会连接一个非线性层,将小于0的值转换为0,使得数据变得稀疏,降低卷积过程中提到消失的问题,图5是本发明实施例二提供的一种卷积过程的示例图,参见图5,一个3*4的矩阵经过一个2*2的卷积核得到卷积结果的过程。池化可以是通过对浏览记录对应的矩阵的局部信息进行压缩,使得其达到降维目的同时也保留浏览记录特征的过程,池化操作至少包括平均、最大值、求和等。
进一步的,在上述发明实施例的基础上,所述将各所述模型处理结果的平均值作为资讯偏好特征,包括:
将所述模型处理结果对应的行为向量和所述待推荐资讯对应的资讯向量进行内积后的归一化结果作为影响权重;基于所述影响权重确定各所述处理结果的加权平均值作为资讯偏好特征。
在本发明实施例中,可以确定模型处理结果的平均值时,为了提高准确性,可以确定出对应待推荐资讯的影响权重。对于用户i历史浏览信息集和待推荐资讯的资讯向量tj,将其向量进行内积得到的结果利用softmax函数进行指数归一化后的结果作为资讯的影响权重。具体的权重计算公式如下:
其中k表示用户历史阅读资讯序列的编号,e(t)表示资讯t利用直连法或CNN得到的行为向量表示,表示所在位置对应的LSTM层细胞状态的输出,计算得到每条资讯的权重Q之后,用户i对于待推荐资讯tj的资讯偏好特征为:
该资讯偏好特征u(i)最大程度的保留了和待推荐资讯tj相关的特征,也在之后的推荐过程中能够实现更加准确且多样化的推荐。
进一步的,在上述发明实施例的基础上,所述通过训练集生成长短期记忆模型,包括:
获取所述用户的历史浏览信息集作为训练集的正样本,并使用随机替换方法生成阈值数量的信息数据集作为训练集的负样本;将所述正样本和所述负样本输入长短期记忆模型进行训练直到所述长短期记忆模型的输出结果满足阈值条件。
其中,正样本可以是用户浏览过的资讯信息集合,负样本可以是用户不会浏览的资讯信息集合,正样本可以为用户的历史浏览信息集,负样本可以是通过随机生成的方式数据量大于阈值数量的信息数据集。阈值条件可以是判断长短期记忆模型训练完成的条件,例如,经过测试集的长短期记忆模型的输出结果满足测试集的要求。
示例性的,以金融资讯对长短期记忆模型的训练为例,随机选取了5000个用户的资讯浏览数据,共包括10333条资讯以及43399条资讯浏览记录。将每位用户的最后一条浏览记录放在测试集中,其余均作为训练集。选取好正样本之后,本文采用随机负采样策略分别对测试集以及训练集进行负采样,对每一条正样本在该用户未阅读的资讯集中随机抽取一定的数量的资讯作为负样本。根据以往阅读论文得到的经验,对训练集的负采样比例一般设置为1:5左右,对测试集一般设置为1:50或1:100,本文设置训练集的负采样比列为1:4,测试集的负采样比例为1:50。最终将正样本和负样本合并生成训练集以及测试集。最终得到的训练集大小为191995,测试集的大小为255000。使用训练集对长短期记忆模型进行训练,然后使用训练集对长短期记忆模型进行测试,当该长短期记忆模型的测试结果符号测试集中正负样本的比例时,确定长短期记忆模型训练完成。
实施例三
图6是本发明实施例三提供的一种信息服务提供装置的结构示意图,可执行本发明任意实施例所提供的信息服务提供方法,具备执行方法相应的功能模块和有益效果。该装置可以由软件和/或硬件实现,具体包括:用户偏好模块301、概率确定模块302和信息服务模块303。
用户偏好模块301,用于根据用户的历史浏览信息集确定资讯偏好特征。
概率确定模块302,用于根据所述资讯偏好特征确定待推荐资讯对应的推荐概率。
信息服务模块303,用于根据所述推荐概率为所述用户提供信息服务。
本发明实施例,通过用户偏好模块按照用户的历史浏览信息集确定资讯偏好特征,概率确定模块按照该资讯偏好特征获取到待推荐资讯对应的推荐概率,信息服务模块基于推荐概率为用户提供信息服务,提高了信息服务的个性化程度,增强了信息推荐的准确性,可增强信息服务质量。
进一步的,在上述发明实施例的基础上,所述用户偏好模块301包括:
预处理单元,用于对所述历史浏览信息集中的浏览记录进行处理生成用户行为向量。
模型处理单元,用于通过预设资讯提取模型处理所述用户行为向量获取至少一个模型处理结果,其中,所述预设资讯提取模型包括通过训练集训练生成的长短期记忆模型,所述训练集包括历史浏览信息集的正样本和随机生成的负样本,所述正样本的推荐概率为1,负样本的推荐概率为0。
特征确定单元,用于将各所述模型处理结果的平均值作为资讯偏好特征。
进一步的,在上述发明实施例的基础上,所述预处理单元具体用于:按照所述浏览记录的先后阅读顺序进行排列,并获取各所述浏览记录对应的标题和/或标签;使用卷积神经网络或者直连法对排列后的所述浏览记录以及对应的标题和/或标签进行处理以生成用户行为向量。
进一步的,在上述发明实施例的基础上,所述特征确定单元具体用于:将所述模型处理结果对应的行为向量和所述待推荐资讯对应的资讯向量进行内积后的归一化结果作为影响权重;基于所述影响权重确定各所述处理结果的加权平均值作为资讯偏好特征。
进一步的,在上述发明实施例的基础上,所述概率确定模块302包括:
降维处理单元,用于将所述资讯偏好特征和所述待推荐资讯输入进行内积得到的向量输入多层感知机进行降维。
概率映射单元,用于通过激活函数处理所述降维后的所述向量以确定待推荐资讯对应的推荐概率。
进一步的,在上述发明实施例的基础上,所述信息服务模块303包括:
展示单元,用于按照所述推荐概率选择对应的待推荐资讯展示给所述用户,其中,所述展示的形式包括图像、文字、视频、语音中至少一种。
进一步的,在上述发明实施例的基础上,所述概率确定模块302还包括:
训练单元,用于获取所述用户的历史浏览信息集作为训练集的正样本,并使用随机替换方法生成阈值数量的信息数据集作为训练集的负样本;将所述正样本和所述负样本输入长短期记忆模型进行训练直到所述长短期记忆模型的输出结果满足阈值条件。
实施例四
图7是本发明实施例四提供的一种电子设备的结构示意图,如图7所示,该电子设备包括处理器70、存储器71、输入装置72和输出装置73;电子设备中处理器70的数量可以是一个或多个,图7中以一个处理器70为例;电子设备中的处理器70、存储器71、输入装置72和输出装置73可以通过总线或其他方式连接,图7中以通过总线连接为例。
存储器71作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的信息服务提供方法对应的程序指令/模块(例如,信息服务提供装置中的用户偏好模块301、概率确定模块302和信息服务模块303)。处理器70通过运行存储在存储器71中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的信息服务提供方法。
存储器71可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器71可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器71可进一步包括相对于处理器70远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置72可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种信息服务提供方法,该方法包括:
根据用户的历史浏览信息集确定资讯偏好特征;
根据所述资讯偏好特征确定待推荐资讯对应的推荐概率;
根据所述推荐概率为所述用户提供信息服务。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的信息服务提供方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述信息服务提供装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种信息服务提供方法,其特征在于,所述方法包括:
根据用户的历史浏览信息集确定资讯偏好特征;
根据所述资讯偏好特征确定待推荐资讯对应的推荐概率;
根据所述推荐概率为所述用户提供信息服务。
2.根据权利要求1所述的方法,其特征在于,所述根据用户的历史浏览信息集确定资讯偏好特征,包括:
对所述历史浏览信息集中的浏览记录进行处理生成用户行为向量;
通过预设资讯提取模型处理所述用户行为向量获取至少一个模型处理结果,其中,所述预设资讯提取模型包括通过训练集训练生成的长短期记忆模型,所述训练集包括历史浏览信息集的正样本和随机生成的负样本,所述正样本的推荐概率为1,负样本的推荐概率为0;
将各所述模型处理结果的平均值作为资讯偏好特征。
3.根据权利要求2所述的方法,其特征在于,所述对所述历史浏览信息集中的浏览记录进行处理生成用户行为向量,包括:
按照所述浏览记录的先后阅读顺序进行排列,并获取各所述浏览记录对应的标题和/或标签;
使用卷积神经网络或者直连法对排列后的所述浏览记录以及对应的标题和/或标签进行处理以生成用户行为向量。
4.根据权利要求2所述的方法,其特征在于,所述将各所述模型处理结果的平均值作为资讯偏好特征,包括:
将所述模型处理结果对应的行为向量和所述待推荐资讯对应的资讯向量进行内积后的归一化结果作为影响权重;
基于所述影响权重确定各所述处理结果的加权平均值作为资讯偏好特征。
5.根据权利要求1所述的方法,其特征在于,所述根据所述资讯偏好特征确定待推荐资讯对应的推荐概率,包括:
将所述资讯偏好特征和所述待推荐资讯输入进行内积得到的向量输入多层感知机进行降维;
通过激活函数处理所述降维后的所述向量以确定待推荐资讯对应的推荐概率。
6.根据权利要求4所述的方法,其特征在于,所述根据所述推荐概率为所述用户提供信息服务,包括:
按照所述推荐概率选择对应的待推荐资讯展示给所述用户,其中,所述展示的形式包括图像、文字、视频、语音中至少一种。
7.根据权利要求2所述的方法,其特征在于,所述通过训练集生成长短期记忆模型,包括:
获取所述用户的历史浏览信息集作为训练集的正样本,并使用随机替换方法生成阈值数量的信息数据集作为训练集的负样本;
将所述正样本和所述负样本输入长短期记忆模型进行训练直到所述长短期记忆模型的输出结果满足阈值条件。
8.一种信息服务提供装置,其特征在于,所述装置包括:
用户偏好模块,用于根据用户的历史浏览信息集确定资讯偏好特征;
概率确定模块,用于根据所述资讯偏好特征确定待推荐资讯对应的推荐概率;
信息服务模块,用于根据所述推荐概率为所述用户提供信息服务。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的信息服务提供方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的信息服务提供方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011413754.1A CN112347367B (zh) | 2020-12-04 | 2020-12-04 | 信息服务提供方法、装置、电子设备和存储介质 |
PCT/CN2021/104655 WO2022116536A1 (zh) | 2020-12-04 | 2021-07-06 | 信息服务提供方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011413754.1A CN112347367B (zh) | 2020-12-04 | 2020-12-04 | 信息服务提供方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112347367A true CN112347367A (zh) | 2021-02-09 |
CN112347367B CN112347367B (zh) | 2024-05-07 |
Family
ID=74427964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011413754.1A Active CN112347367B (zh) | 2020-12-04 | 2020-12-04 | 信息服务提供方法、装置、电子设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112347367B (zh) |
WO (1) | WO2022116536A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022116536A1 (zh) * | 2020-12-04 | 2022-06-09 | 上海帜讯信息技术股份有限公司 | 信息服务提供方法、装置、电子设备和存储介质 |
CN115630173A (zh) * | 2022-09-08 | 2023-01-20 | 武汉谆教教育咨询中心 | 一种基于兴趣度分析的用户数据管理方法 |
CN115955452A (zh) * | 2023-03-15 | 2023-04-11 | 上海帜讯信息技术股份有限公司 | 基于多轮会话意图识别的5g消息推送方法和装置 |
CN116150477A (zh) * | 2022-12-06 | 2023-05-23 | 上海贝耳塔信息技术有限公司 | 一种财经资讯个性化推荐方法、装置、设备及介质 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114861073B (zh) * | 2022-07-06 | 2022-09-20 | 哈尔滨工业大学(威海) | 一种基于大数据和顾客画像的服装个性化定制方法及系统 |
CN115563263B (zh) * | 2022-09-19 | 2023-09-05 | 读书郎教育科技有限公司 | 基于ai的内容推荐方法 |
CN116186420B (zh) * | 2023-05-04 | 2023-06-27 | 南开大学 | 一种基于用户偏好的个性化新闻标题生成方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912550A (zh) * | 2015-12-15 | 2016-08-31 | 乐视网信息技术(北京)股份有限公司 | 一种移动终端的信息推荐方法及装置 |
US20190347708A1 (en) * | 2018-01-10 | 2019-11-14 | Beijing Sensetime Technology Development Co., Ltd | Methods and apparatuses for deep learning-based recommendation, electronic devices, and media |
CN111310056A (zh) * | 2020-03-11 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置、设备及存储介质 |
CN111814044A (zh) * | 2020-06-30 | 2020-10-23 | 广州视源电子科技股份有限公司 | 一种推荐方法、装置、终端设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914159B (zh) * | 2019-05-10 | 2024-03-12 | 招商证券股份有限公司 | 一种信息推荐方法及终端 |
CN112347367B (zh) * | 2020-12-04 | 2024-05-07 | 上海帜讯信息技术股份有限公司 | 信息服务提供方法、装置、电子设备和存储介质 |
-
2020
- 2020-12-04 CN CN202011413754.1A patent/CN112347367B/zh active Active
-
2021
- 2021-07-06 WO PCT/CN2021/104655 patent/WO2022116536A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912550A (zh) * | 2015-12-15 | 2016-08-31 | 乐视网信息技术(北京)股份有限公司 | 一种移动终端的信息推荐方法及装置 |
US20190347708A1 (en) * | 2018-01-10 | 2019-11-14 | Beijing Sensetime Technology Development Co., Ltd | Methods and apparatuses for deep learning-based recommendation, electronic devices, and media |
CN111310056A (zh) * | 2020-03-11 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置、设备及存储介质 |
CN111814044A (zh) * | 2020-06-30 | 2020-10-23 | 广州视源电子科技股份有限公司 | 一种推荐方法、装置、终端设备及存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022116536A1 (zh) * | 2020-12-04 | 2022-06-09 | 上海帜讯信息技术股份有限公司 | 信息服务提供方法、装置、电子设备和存储介质 |
CN115630173A (zh) * | 2022-09-08 | 2023-01-20 | 武汉谆教教育咨询中心 | 一种基于兴趣度分析的用户数据管理方法 |
CN115630173B (zh) * | 2022-09-08 | 2023-08-18 | 湖北华中电力科技开发有限责任公司 | 一种基于兴趣度分析的用户数据管理方法 |
CN116150477A (zh) * | 2022-12-06 | 2023-05-23 | 上海贝耳塔信息技术有限公司 | 一种财经资讯个性化推荐方法、装置、设备及介质 |
CN115955452A (zh) * | 2023-03-15 | 2023-04-11 | 上海帜讯信息技术股份有限公司 | 基于多轮会话意图识别的5g消息推送方法和装置 |
CN115955452B (zh) * | 2023-03-15 | 2023-06-06 | 上海帜讯信息技术股份有限公司 | 基于多轮会话意图识别的5g消息推送方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112347367B (zh) | 2024-05-07 |
WO2022116536A1 (zh) | 2022-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112347367B (zh) | 信息服务提供方法、装置、电子设备和存储介质 | |
CN111198995B (zh) | 一种恶意网页识别方法 | |
CN107391760B (zh) | 用户兴趣识别方法、装置及计算机可读存储介质 | |
CN110069709B (zh) | 意图识别方法、装置、计算机可读介质及电子设备 | |
CN111371806A (zh) | 一种Web攻击检测方法及装置 | |
CN109271627A (zh) | 文本分析方法、装置、计算机设备和存储介质 | |
CN111444326A (zh) | 一种文本数据处理方法、装置、设备以及存储介质 | |
CN109816438B (zh) | 信息推送方法及装置 | |
CN112685539B (zh) | 基于多任务融合的文本分类模型训练方法和装置 | |
CN112015901A (zh) | 文本分类方法及装置、警情分析系统 | |
CN115147130A (zh) | 问题预测方法、设备、存储介质及程序产品 | |
CN111428513A (zh) | 一种基于卷积神经网络的虚假评论分析方法 | |
CN111859967A (zh) | 实体识别方法、装置,电子设备 | |
CN113610156A (zh) | 用于大数据分析的人工智能模型机器学习方法及服务器 | |
CN114996486A (zh) | 一种数据推荐方法、装置、服务器以及存储介质 | |
CN112288554A (zh) | 商品推荐方法和装置、存储介质及电子装置 | |
CN115130542A (zh) | 模型训练方法、文本处理方法、装置及电子设备 | |
CN112801784A (zh) | 一种数字货币交易所的比特币地址挖掘方法及装置 | |
CN114119191A (zh) | 风控方法、逾期预测方法、模型训练方法及相关设备 | |
CN108734011A (zh) | 软件链接检测方法及装置 | |
CN113051607B (zh) | 一种隐私政策信息提取方法 | |
CN114741501A (zh) | 舆情预警方法、装置、可读存储介质及电子设备 | |
CN113837836A (zh) | 模型推荐方法、装置、设备及存储介质 | |
CN113220947A (zh) | 对事件特征进行编码的方法和装置 | |
CN112115300A (zh) | 文本处理方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |