CN116451798A - 一种解释结果的生成方法和装置 - Google Patents
一种解释结果的生成方法和装置 Download PDFInfo
- Publication number
- CN116451798A CN116451798A CN202210005426.0A CN202210005426A CN116451798A CN 116451798 A CN116451798 A CN 116451798A CN 202210005426 A CN202210005426 A CN 202210005426A CN 116451798 A CN116451798 A CN 116451798A
- Authority
- CN
- China
- Prior art keywords
- interpretation
- recommended
- article
- item
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000011156 evaluation Methods 0.000 claims abstract description 51
- 238000012549 training Methods 0.000 claims description 38
- 238000012216 screening Methods 0.000 claims description 30
- 230000008451 emotion Effects 0.000 claims description 28
- 238000000605 extraction Methods 0.000 claims description 23
- 238000010801 machine learning Methods 0.000 claims description 20
- 238000012163 sequencing technique Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 9
- 238000013136 deep learning model Methods 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 15
- 208000025174 PANDAS Diseases 0.000 description 10
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 10
- 240000004718 Panda Species 0.000 description 10
- 235000016496 Panda oleosa Nutrition 0.000 description 10
- 238000013135 deep learning Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000007477 logistic regression Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 210000003371 toe Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种解释结果的生成方法和装置,涉及人工智能技术领域。该方法的一具体实施方式包括:根据目标用户对各个物品的评分,得出各个物品特征的重要性排序;根据所述各个物品特征的重要性排序,从推荐物品的各个物品特征中筛选出解释特征;根据所述推荐物品的评价数据构建解释库,从而提取出所述解释库中各条解释对应的主题;计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度确定所述推荐物品对应的解释结果。该实施方式能够解决难以对模型输出的推荐结果进行解释的技术问题。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种解释结果的生成方法和装置。
背景技术
目前,推荐系统可以分为基于非深度学习的推荐系统与基于深度学习的推荐系统。基于非深度学习的推荐系统主要使用一些简单的机器学习模型(例如GBDT,逻辑回归模型等),其中相关算法有基于协同过滤的方式,基于逻辑回归的方式,基于组合模型的方式等。基于深度学习的推荐系统以多层网络为核心,通过改变网络结构构建深度学习推荐模型,其中相关算法有基于改变特征交叉方式的方法,基于FM模型的深度学习演化方法,序列模型与推荐模型结合的方式等。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
基于非深度学习的推荐系统使用较为简单的机器学习模型,这些机器学习模型由于结构较为简单,有些模型中含有线性模型,使得模型具有一定的解释能力,但是由于结构简单,模型拟合能力较差,因此推荐效果往往不够理想;有些模型中含有非线性模型,因此其推荐结果难以解释。基于深度学习的推荐系统使用深度学习模型,可以大大提高模型推荐效果,但是由于网络层数较多,对于每层网络对应的具体物理意义难以理解,因此难以对模型输出的推荐结果进行解释。
发明内容
有鉴于此,本发明实施例提供一种解释结果的生成方法和装置,以解决难以对模型输出的推荐结果进行解释的技术问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种解释结果的生成方法,包括:
根据目标用户对各个物品的评分,得出各个物品特征的重要性排序;
根据所述各个物品特征的重要性排序,从推荐物品的各个物品特征中筛选出解释特征;
根据所述推荐物品的评价数据构建解释库,从而提取出所述解释库中各条解释对应的主题;
计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度确定所述推荐物品对应的解释结果。
可选地,根据目标用户对各个物品的评分,得出各个物品特征的重要性排序,包括:
采用经过训练的物品推荐模型计算目标用户对各个物品的评分;
采用所述各个物品的物品特征和所述各个物品的评分构建解释训练集;
通过机器学习模型对所述解释训练集进行拟合,得到所述机器学习模型的各个参数对应的权重,从而得到所述各个物品特征的权重;
按照所述各个物品特征的权重的大小对所述各个物品特征进行排序,从而得到所述各个物品特征的重要性排序。
可选地,采用经过训练的物品推荐模型计算目标用户对各个物品的评分之前,还包括:
将样本用户的用户特征和样本物品的物品特征作为输入,所述样本用户对所述样本物品的评分作为输出,训练深度学习模型,从而得到物品推荐模型。
可选地,根据所述各个物品特征的重要性排序,从推荐物品的各个物品特征中筛选出解释特征,包括:
根据所述各个物品特征的重要性排序,确定推荐物品的各个物品特征的排序;
根据特征数量阈值,从所述推荐物品的各个物品特征中筛选出重要性排序靠前的解释特征。
可选地,根据所述推荐物品的评价数据构建解释库,从而提取出所述解释库中各条解释对应的主题,包括:
采用经过训练的情感分析模型对所述推荐物品的每条评价数据进行识别,从而确定所述评价数据的情感为积极或者消极;
采用情感为积极的评价数据构建解释库;
采用主题提取模型对所述解释库中的每条解释进行主题提取,从而得到每条解释对应的主题。
可选地,采用主题提取模型对所述解释库中的每条解释进行主题提取,从而得到每条解释对应的主题之后,还包括:
按照各条解释的支持数量的大小对所述各条解释进行排序,从而得到所述各条解释的支持程度排序。
可选地,计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度确定所述推荐物品对应的解释结果,包括:
计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度;
对于所述解释库中的每条解释,若所述解释对应的主题与所述推荐物品的各个解释特征的相似度均大于相似度阈值,则将所述解释作为所述推荐物品对应的解释结果。
可选地,计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度确定所述推荐物品对应的解释结果,还包括:
若存在相似度均大于相似度阈值的多条解释,则根据所述多条解释的支持程度排序筛选出排序最靠前的目标解释,并将所述目标解释作为所述推荐物品对应的解释结果。
可选地,计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度确定所述推荐物品对应的解释结果,还包括:
若不存在相似度均大于相似度阈值的解释,则根据所述推荐物品的各个解释特征的重要性排筛选出排序最靠前的目标特征,并根据所述目标特征生成所述推荐物品对应的解释结果。
另外,根据本发明实施例的另一个方面,提供了一种解释结果的生成装置,包括:
排序模块,用于根据目标用户对各个物品的评分,得出各个物品特征的重要性排序;
筛选模块,用于根据所述各个物品特征的重要性排序,从推荐物品的各个物品特征中筛选出解释特征;
提取模块,用于根据所述推荐物品的评价数据构建解释库,从而提取出所述解释库中各条解释对应的主题;
计算模块,用于计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度确定所述推荐物品对应的解释结果。
可选地,所述排序模块还用于:
采用经过训练的物品推荐模型计算目标用户对各个物品的评分;
采用所述各个物品的物品特征和所述各个物品的评分构建解释训练集;
通过机器学习模型对所述解释训练集进行拟合,得到所述机器学习模型的各个参数对应的权重,从而得到所述各个物品特征的权重;
按照所述各个物品特征的权重的大小对所述各个物品特征进行排序,从而得到所述各个物品特征的重要性排序。
可选地,还包括训练模块,用于:
将样本用户的用户特征和样本物品的物品特征作为输入,所述样本用户对所述样本物品的评分作为输出,训练深度学习模型,从而得到物品推荐模型。
可选地,所述筛选模块还用于:
根据所述各个物品特征的重要性排序,确定推荐物品的各个物品特征的排序;
根据特征数量阈值,从所述推荐物品的各个物品特征中筛选出重要性排序靠前的解释特征。
可选地,所述提取模块还用于:
采用经过训练的情感分析模型对所述推荐物品的每条评价数据进行识别,从而确定所述评价数据的情感为积极或者消极;
采用情感为积极的评价数据构建解释库;
采用主题提取模型对所述解释库中的每条解释进行主题提取,从而得到每条解释对应的主题。
可选地,所述提取模块还用于:
采用主题提取模型对所述解释库中的每条解释进行主题提取,从而得到每条解释对应的主题之后,按照各条解释的支持数量的大小对所述各条解释进行排序,从而得到所述各条解释的支持程度排序。
可选地,所述计算模块还用于:
计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度;
对于所述解释库中的每条解释,若所述解释对应的主题与所述推荐物品的各个解释特征的相似度均大于相似度阈值,则将所述解释作为所述推荐物品对应的解释结果。
可选地,所述计算模块还用于:
若存在相似度均大于相似度阈值的多条解释,则根据所述多条解释的支持程度排序筛选出排序最靠前的目标解释,并将所述目标解释作为所述推荐物品对应的解释结果。
可选地,所述计算模块还用于:
若不存在相似度均大于相似度阈值的解释,则根据所述推荐物品的各个解释特征的重要性排筛选出排序最靠前的目标特征,并根据所述目标特征生成所述推荐物品对应的解释结果。
根据本发明实施例的另一个方面,还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现上述任一实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
上述发明中的一个实施例具有如下优点或有益效果:因为采用根据各个物品特征的重要性排序从推荐物品的各个物品特征中筛选出解释特征,计算解释库中各条解释对应的主题与各个解释特征的相似度,从而确定推荐物品对应的解释结果的技术手段,所以克服了现有技术中难以对模型输出的推荐结果进行解释的技术问题。本发明实施例通过目标用户对各个物品的评分,得出各个物品特征的重要性排序,不但可以保证数据量足够,还能保证推荐结果的解释性较好,而且通过计算解释特征与评价主题之间的相似度实现通过物品特征与评论数据相结合的方式对推荐结果进行解释,从而提高推荐结果的解释性。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的解释结果的生成方法的主要流程的示意图;
图2是根据本发明实施例的各个物品特征的的权重以及重要性排序;
图3是根据本发明一个可参考实施例的解释结果的生成方法的主要流程的示意图;
图4是根据本发明另一个可参考实施例的解释结果的生成方法的主要流程的示意图;
图5是根据本发明实施例的解释结果的生成装置的主要模块的示意图;
图6是本发明实施例可以应用于其中的示例性系统架构图;
图7是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本发明实施例主要解决当前推荐系统推荐结果难以解释的问题,并通过解释提高用户对于推荐结果的体验。
本发明实施例的场景是在推荐系统输出推荐结果后,对推荐结果进行解释,本发明实施例通过目标用户对各个物品的评分计算各个物品特征的重要性排序,然后通过推荐物品的物品特征与特征重要性排序筛选出可以作为解释的物品特征(即解释特征),接着识别评论数据的情感与主题,并基于情感分析获取可作为解释的评论,从而构建解释库,由于物品特征与整个评论信息难以进行对应,因此计算可解释的物品特征与评论主题的近似程度,通过设定阈值选取合适的评论进行解释,如果没有相应解释,则使用构建的解释库进行解释,输出最终解释结果。
图1是根据本发明实施例的解释结果的生成方法的主要流程的示意图。作为本发明的一个实施例,如图1所示,所述解释结果的生成方法可以包括:
步骤101,根据目标用户对各个物品的评分,得出各个物品特征的重要性排序。
针对待推送的目标用户,获取目标用户对各个物品的评分,然后根据这些评分得出各个物品特征的重要性排序。在本发明的实施例中,各个物品可以是推荐物品所属品类中的各个物品,也可以推荐物品所属品类中的近期热度较高的各个物品,还可以是所有物品中的各个物品,本发明实施例对此不作限制。
可选地,步骤101可以包括:采用经过训练的物品推荐模型计算目标用户对各个物品的评分;采用所述各个物品的物品特征和所述各个物品的评分构建解释训练集;通过机器学习模型对所述解释训练集进行拟合,得到所述机器学习模型的各个参数对应的权重,从而得到所述各个物品特征的权重;按照所述各个物品特征的权重的大小对所述各个物品特征进行排序,从而得到所述各个物品特征的重要性排序。在本发明的实施例中,可以采用经过训练的物品推荐模型(比如基于深度学习的推荐模型)计算出目标用户对各个物品的评分,然后采用各个物品的物品特征和各个物品的评分构建解释训练集,接着使用可解释的机器学习模型(可以是线性模型,例如脊回归模型)对解释训练集进行拟合,可以得到一个可解释的模型,通过该模型的各个参数的权重可以得到各个物品特征的权重,最后按照各个物品特征的权重的大小对各个物品特征进行排序,从而得到各个物品特征的重要性排序。
假设推荐物品是电影《功夫熊猫》,采用经过训练的物品推荐模型计算目标用户对电影《功夫熊猫》所属品类(电影类型)中各个电影的评分,然后采用所述各个电影的物品特征(比如动作片、喜剧片、悬疑片等)和所述各个电影的评分构建解释训练集,接着通过机器学习模型对所述解释训练集进行拟合,得到所述机器学习模型的各个参数对应的权重,从而得到所述各个物品特征的权重,如图2所示,最后按照所述各个物品特征的权重的大小对所述各个物品特征进行排序,从而得到所述各个物品特征的重要性排序。本发明实施例采用机器学习模型对解释训练集进行拟合,可以保证模型的可解释性,从而实现推荐结果可解释。
可选地,采用经过训练的物品推荐模型计算目标用户对各个物品的评分之前,还包括:将样本用户的用户特征和样本物品的物品特征作为输入,所述样本用户对所述样本物品的评分作为输出,训练深度学习模型,从而得到物品推荐模型。为了能够通过物品推荐模型计算出目标用户对各个物品的评分,需要预先训练好物品推荐模型,具体地,可以获取样本用户的用户特征、各个样本用户对样本物品的评分以及各个样本物品的物品特征,通过这些数据构建训练集,然后采用AutoRec模型、Deep Crossing模型、NeuralCF模型或者Wide&Deep模型等进行有监督训练,从而训练得到物品推荐模型。
通常构建解释训练集时使用原始训练集中数据或者构建近似训练集,使用原始训练集中的数据集可能因为训练集相应数据量不够导致训练效果较差;构建近似训练集的方法,虽然保证数据量足够但是不能保证构建的数据真实存在,因此会导致解释效果变差。而本发明实施例提出的使用推荐模型计算目标用户对各个物品评分的方法可以保证物品数据的真实性,并且保证数据量足够,可以保证解释性能较好。
步骤102,根据所述各个物品特征的重要性排序,从推荐物品的各个物品特征中筛选出解释特征。
得到各个物品特征的重要性排序之后,基于该排序从推荐物品的各个物品特征(比如动作片、喜剧片、动画片等)中筛选出排序靠前的若干个物品特征,将这些物品特征作为解释特征。
可选地,步骤102可以包括:根据所述各个物品特征的重要性排序,确定推荐物品的各个物品特征的排序;根据特征数量阈值,从所述推荐物品的各个物品特征中筛选出重要性排序靠前的解释特征。通常来说,重要性排序中包含了推荐物品所属品类中所有物品特征的排序,因此推荐物品的物品特征也必然在该排序中,因此通过重要性排序可以从推荐物品的各个物品特征中筛选出重要性排序比较靠前的解释特征,筛选出来的物品特征可以作为物品特征的解释。可选地,可以预先设定特征数量阈值,比如3个、5个或者10个等,从而筛选出重要性排序靠前的N个解释特征,N等于特征数量阈值。
步骤103,根据所述推荐物品的评价数据构建解释库,从而提取出所述解释库中各条解释对应的主题。
获取推荐物品的评价数据,并根据这些评价数据构建解释库,然后提取出解释库中每条解释(即每条评价)对应的主题。
可选地,步骤103可以包括:采用经过训练的情感分析模型对所述推荐物品的每条评价数据进行识别,从而确定所述评价数据的情感为积极或者消极;采用情感为积极的评价数据构建解释库;采用主题提取模型对所述解释库中的每条解释进行主题提取,从而得到每条解释对应的主题。与步骤101类似,在步骤103之前,需要训练情感分析模型,比如可以采用SVM、GDBT、Logistic Regression或者基于人工构建情感辞典等情感分析算法分析评论中蕴含的情感信息,对每条评论进行分类,分为“积极评价”或者“消极评价”。
例如对于《功夫熊猫》有下述两条评价:
1)昨天晚上边吃晚饭边看的电影。没有让你猜来猜去的剧情,没有让你琢磨再三费尽思量的台词,没有处心积虑安排的小细节,总之就是看着异常轻松的一部电影。
2)我不喜欢一只近乎愚钝、终日喜欢做白日梦的、又好吃懒做的、甚至连几级台阶也爬不上的熊猫。
上述两条评价可以利用情感分析模型将第一条评价识别为”积极评价”,第二条评价识别为”消极评价”。
以SVM模型为例,首先获取评论数据集,对评论数据进行标注,将评论数据标注为积极评价或者消极评价;其次对数据格式进行转换,将句子转换为向量(例如CBOW模型与Skip-gram模型),使得句子转换为机器学习需要的数据类型;最后,使用SVM模型去拟合评论数据集,从而得到评论的情感分析模型。
采用经过训练的情感分析模型可以准确地识别出所述推荐物品的每条评价数据的情感,然后采用积极评价来构建解释库,因此解释库中的解释即为积极评价,解释库用于存储积极的评价,最后采用主题提取模型对解释库中的每条解释分别进行主题提取,从而得到每条解释对应的主题。具体地,可以LDA、TF-IDF或者LSA等主题提取模型提取每条评论蕴含的主题,例如对于《功夫熊猫》电影影评:你能想象一只连自己的脚趾头都看不到的慵懒的大胖熊猫最后会成为一个功夫超群、武艺精湛并拯救人民于危难之中的“龙之武士”吗?《功夫熊猫》就是要打破你对熊猫的这种认知,让你在一个虚拟的动画世界中去想象“Nothing is impossible”的可能性。这条评论可以提取出其主题为:熊猫、功夫、励志。
以LDA算法为例(该算法是一种无监督方法,不需要标注数据只需设定主题数量即可实现主题提取),对评论数据进行处理,主要是去除一些无效的词与停词,例如没、就、才、是、人等,然后设置主题数量(比如2个、5个或者8个等),最后使用LDA算法自动对评论数据进行主题提取。
可选地,采用主题提取模型对所述解释库中的每条解释进行主题提取,从而得到每条解释对应的主题之后,还包括:按照各条解释的支持数量的大小对所述各条解释进行排序,从而得到所述各条解释的支持程度排序。在本发明的实施例中,如果每条评论数据还有点赞数量、关注数量或者收藏数量等能够体现用户支持程度的数据,则可以根据每条评论数据的支持数量的大小对解释库中的解释(即积极评价)进行排序,从而得到解释库中各条解释的支持程度排序。
步骤104,计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度确定所述推荐物品对应的解释结果。
在该步骤中,分别计算解释库中每条解释对应的主题与推荐物品的各个解释特征的相似度,将这些相似度与相似度阈值进行比较,从而从解释库中筛选出最合适的解释作为推荐物品对应的解释结果。
可选地,步骤104可以包括:计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度;对于所述解释库中的每条解释,若所述解释对应的主题与所述推荐物品的各个解释特征的相似度均大于相似度阈值(相似度越大说明越符合要求),则将所述解释作为所述推荐物品对应的解释结果。具体地,可以根据重要性排序依次选取推荐物品的解释特征,将该解释特征与解释库中每条解释对应的主题进行相似度度量(例如使用单词间的距离公式或者计算两个词向量的余弦距离等,其中距离越小代表相似度越大),如果解释特征与某条解释的主题的相似度都超过预设的相似度阈值,则将该解释作为推荐物品对应的解释结果。
在本发明的另一些实施例中,也可以从解释库中筛选出与推荐物品的解释特征最相似的解释,将这条解释作为推荐物品对应的解释结果。具体地,对于解释库中的每个解释,计算该解释的主题与推荐物品的各个解释特征的相似度之和,将相似度之和最大的解释(也就是与解释特征最相似的解释)作为解释结果。
可选地,步骤104还包括:若存在相似度均大于相似度阈值的多条解释,则根据所述多条解释的支持程度排序筛选出排序最靠前的目标解释,并将所述目标解释作为所述推荐物品对应的解释结果。在本发明的一些实施例中,可能会出现多条解释的相似度均大于相似度阈值的情况,若出现这种情况,则根据这些解释的支持程度排序筛选出排序最靠前的解释(目标解释),然后将该条解释作为推荐物品对应的解释结果。
可选地,步骤104还包括:若不存在相似度均大于相似度阈值的解释,则根据所述推荐物品的各个解释特征的重要性排筛选出排序最靠前的目标特征,并根据所述目标特征生成所述推荐物品对应的解释结果。在本发明的一些实施例中,可能会出现没有相似度均大于相似度阈值的解释的情况,若出现这种情况,则根据推荐物品的各个解释特征的重要性排筛选出排序最靠前的特征(即目标特征),然后将该特征填充到解释模板中,从而生成推荐物品对应的解释结果。
例如,针对电影《功夫熊猫》的解释特征“动作片”,将其填充到解释目标“根据您喜欢的__为您推荐”中,从而生成解释结果“根据您喜欢的动作片为您推荐”。
根据上面所述的各种实施例,可以看出本发明实施例通过根据各个物品特征的重要性排序从推荐物品的各个物品特征中筛选出解释特征,计算解释库中各条解释对应的主题与各个解释特征的相似度,从而确定推荐物品对应的解释结果的技术手段,解决了现有技术中难以对模型输出的推荐结果进行解释的技术问题。本发明实施例通过目标用户对各个物品的评分,得出各个物品特征的重要性排序,不但可以保证数据量足够,还能保证推荐结果的解释性较好,而且通过计算解释特征与评价主题之间的相似度实现通过物品特征与评论数据相结合的方式对推荐结果进行解释,从而提高推荐结果的解释性。
图3是根据本发明一个可参考实施例的解释结果的生成方法的主要流程的示意图。作为本发明的又一个实施例,如图3所示,所述解释结果的生成方法可以包括:
步骤301,将样本用户的用户特征和样本物品的物品特征作为输入,所述样本用户对所述样本物品的评分作为输出,训练深度学习模型,从而得到物品推荐模型。
为了能够通过物品推荐模型得出目标用户对各个物品的评分,需要预先训练好物品推荐模型,具体地,可以获取样本用户的用户特征、各个样本用户对样本物品的评分以及各个样本物品的物品特征,通过这些数据构建训练集,然后采用AutoRec模型、DeepCrossing模型、NeuralCF模型或者Wide&Deep模型等进行有监督训练,从而训练得到物品推荐模型。
步骤302,采用经过训练的物品推荐模型计算目标用户对各个物品的评分。
具体地,将目标用户的用户特征和待计算物品的物品特征输入到物品推荐模型中,物品推荐模型就会输出目标用户对该物品的评分。
步骤303,采用所述各个物品的物品特征和所述各个物品的评分构建解释训练集。
步骤304,通过机器学习模型对所述解释训练集进行拟合,得到所述机器学习模型的各个参数对应的权重,从而得到所述各个物品特征的权重。
可选地,可以采用线性模型,例如脊回归模型进行拟合,得到该模型的各个参数对应的权重,从而得到所述各个物品特征的权重。
步骤305,按照所述各个物品特征的权重的大小对所述各个物品特征进行排序,从而得到所述各个物品特征的重要性排序。
步骤306,根据所述各个物品特征的重要性排序,从推荐物品的各个物品特征中筛选出解释特征。
具体地,根据所述各个物品特征的重要性排序,确定推荐物品的各个物品特征的排序;根据特征数量阈值,从所述推荐物品的各个物品特征中筛选出重要性排序靠前的解释特征。通过重要性排序可以从推荐物品的各个物品特征中筛选出重要性排序比较靠前的解释特征,筛选出来的物品特征可以作为物品特征的解释。
步骤307,根据所述推荐物品的评价数据构建解释库,从而提取出所述解释库中各条解释对应的主题。
可选地,可以采用积极的评价构建解释库,对于解释库中的每条解释,可以采用主题提取模型进行主题提取,提取出每条解释对应的主题。
步骤308,计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度。
可选地,可以采用单词间的距离公式或者计算两个词向量的余弦距离等来计算主题与解释特征之间的相似度。
步骤309,对于所述解释库中的每条解释,若所述解释对应的主题与所述推荐物品的各个解释特征的相似度均大于相似度阈值,则将所述解释作为所述推荐物品对应的解释结果。
在本发明的一些实施例中,可能会出现多条解释的相似度均大于相似度阈值的情况,若出现这种情况,则根据这些解释的支持程度排序筛选出排序最靠前的解释,然后将该条解释作为推荐物品对应的解释结果。在本发明的一些实施例中,可能会出现没有相似度均大于相似度阈值的解释的情况,若出现这种情况,则根据推荐物品的各个解释特征的重要性排筛选出排序最靠前的特征,然后将该特征填充到解释模板中,从而生成推荐物品对应的解释结果。
另外,在本发明一个可参考实施例中解释结果的生成方法的具体实施内容,在上面所述解释结果的生成方法中已经详细说明了,故在此重复内容不再说明。
图4是根据本发明另一个可参考实施例的解释结果的生成方法的主要流程的示意图。作为本发明的另一个实施例,如图4所示,所述解释结果的生成方法可以包括:
步骤401,根据目标用户对各个物品的评分,得出各个物品特征的重要性排序。
步骤402,根据所述各个物品特征的重要性排序,确定推荐物品的各个物品特征的排序。
步骤403,根据特征数量阈值,从所述推荐物品的各个物品特征中筛选出重要性排序靠前的解释特征。
步骤404,采用经过训练的情感分析模型对所述推荐物品的每条评价数据进行识别,从而确定所述评价数据的情感为积极或者消极。
步骤405,采用情感为积极的评价数据构建解释库。
步骤406,采用主题提取模型对所述解释库中的每条解释进行主题提取,从而得到每条解释对应的主题。
步骤407,按照各条解释的点赞数量的大小对所述各条解释进行排序,从而得到所述各条解释的点赞排序。
步骤408,计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度确定所述推荐物品对应的解释结果。
另外,在本发明另一个可参考实施例中解释结果的生成方法的具体实施内容,在上面所述解释结果的生成方法中已经详细说明了,故在此重复内容不再说明。
图5是根据本发明实施例的解释结果的生成装置的主要模块的示意图,如图5所示,所述解释结果的生成装置500包括排序模块501、筛选模块502、提取模块503和计算模块504;其中,排序模块501用于根据目标用户对各个物品的评分,得出各个物品特征的重要性排序;筛选模块502用于根据所述各个物品特征的重要性排序,从推荐物品的各个物品特征中筛选出解释特征;提取模块503用于根据所述推荐物品的评价数据构建解释库,从而提取出所述解释库中各条解释对应的主题;计算模块504用于计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度确定所述推荐物品对应的解释结果。
可选地,所述排序模块501还用于:
采用经过训练的物品推荐模型计算目标用户对各个物品的评分;
采用所述各个物品的物品特征和所述各个物品的评分构建解释训练集;
通过机器学习模型对所述解释训练集进行拟合,得到所述机器学习模型的各个参数对应的权重,从而得到所述各个物品特征的权重;
按照所述各个物品特征的权重的大小对所述各个物品特征进行排序,从而得到所述各个物品特征的重要性排序。
可选地,还包括训练模块,用于:
将样本用户的用户特征和样本物品的物品特征作为输入,所述样本用户对所述样本物品的评分作为输出,训练深度学习模型,从而得到物品推荐模型。
可选地,所述筛选模块502还用于:
根据所述各个物品特征的重要性排序,确定推荐物品的各个物品特征的排序;
根据特征数量阈值,从所述推荐物品的各个物品特征中筛选出重要性排序靠前的解释特征。
可选地,所述提取模块503还用于:
采用经过训练的情感分析模型对所述推荐物品的每条评价数据进行识别,从而确定所述评价数据的情感为积极或者消极;
采用情感为积极的评价数据构建解释库;
采用主题提取模型对所述解释库中的每条解释进行主题提取,从而得到每条解释对应的主题。
可选地,所述提取模块503还用于:
采用主题提取模型对所述解释库中的每条解释进行主题提取,从而得到每条解释对应的主题之后,按照各条解释的支持数量的大小对所述各条解释进行排序,从而得到所述各条解释的支持程度排序。
可选地,所述计算模块504还用于:
计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度;
对于所述解释库中的每条解释,若所述解释对应的主题与所述推荐物品的各个解释特征的相似度均大于相似度阈值,则将所述解释作为所述推荐物品对应的解释结果。
可选地,所述计算模块504还用于:
若存在相似度均大于相似度阈值的多条解释,则根据所述多条解释的支持程度排序筛选出排序最靠前的目标解释,并将所述目标解释作为所述推荐物品对应的解释结果。
可选地,所述计算模块504还用于:
若不存在相似度均大于相似度阈值的解释,则根据所述推荐物品的各个解释特征的重要性排筛选出排序最靠前的目标特征,并根据所述目标特征生成所述推荐物品对应的解释结果。
需要说明的是,在本发明所述解释结果的生成装置的具体实施内容,在上面所述解释结果的生成方法中已经详细说明了,故在此重复内容不再说明。
图6示出了可以应用本发明实施例的解释结果的生成方法或解释结果的生成装置的示例性系统架构600。
如图6所示,系统架构600可以包括终端设备601、602、603,网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备601、602、603通过网络604与服务器605交互,以接收或发送消息等。终端设备601、602、603上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器605可以是提供各种服务的服务器,例如对用户利用终端设备601、602、603所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的物品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、物品信息——仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的解释结果的生成方法一般由服务器605执行,相应地,所述解释结果的生成装置一般设置在服务器605中。
应该理解,图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图7,其示出了适于用来实现本发明实施例的终端设备的计算机系统700的结构示意图。图7示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括排序模块、筛选模块、提取模块和计算模块,其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,该设备实现如下方法:根据目标用户对各个物品的评分,得出各个物品特征的重要性排序;根据所述各个物品特征的重要性排序,从推荐物品的各个物品特征中筛选出解释特征;根据所述推荐物品的评价数据构建解释库,从而提取出所述解释库中各条解释对应的主题;计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度确定所述推荐物品对应的解释结果。
根据本发明实施例的技术方案,因为采用根据各个物品特征的重要性排序从推荐物品的各个物品特征中筛选出解释特征,计算解释库中各条解释对应的主题与各个解释特征的相似度,从而确定推荐物品对应的解释结果的技术手段,所以克服了现有技术中难以对模型输出的推荐结果进行解释的技术问题。本发明实施例通过目标用户对各个物品的评分,得出各个物品特征的重要性排序,不但可以保证数据量足够,还能保证推荐结果的解释性较好,而且通过计算解释特征与评价主题之间的相似度实现通过物品特征与评论数据相结合的方式对推荐结果进行解释,从而提高推荐结果的解释性。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (12)
1.一种解释结果的生成方法,其特征在于,包括:
根据目标用户对各个物品的评分,得出各个物品特征的重要性排序;
根据所述各个物品特征的重要性排序,从推荐物品的各个物品特征中筛选出解释特征;
根据所述推荐物品的评价数据构建解释库,从而提取出所述解释库中各条解释对应的主题;
计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度生成所述推荐物品对应的解释结果。
2.根据权利要求1所述的方法,其特征在于,根据目标用户对各个物品的评分,得出各个物品特征的重要性排序,包括:
采用经过训练的物品推荐模型计算目标用户对各个物品的评分;
采用所述各个物品的物品特征和所述各个物品的评分构建解释训练集;
通过机器学习模型对所述解释训练集进行拟合,得到所述机器学习模型的各个参数对应的权重,从而得到所述各个物品特征的权重;
按照所述各个物品特征的权重的大小对所述各个物品特征进行排序,从而得到所述各个物品特征的重要性排序。
3.根据权利要求2所述的方法,其特征在于,采用经过训练的物品推荐模型计算目标用户对各个物品的评分之前,还包括:
将样本用户的用户特征和样本物品的物品特征作为输入,所述样本用户对所述样本物品的评分作为输出,训练深度学习模型,从而得到物品推荐模型。
4.根据权利要求1所述的方法,其特征在于,根据所述各个物品特征的重要性排序,从推荐物品的各个物品特征中筛选出解释特征,包括:
根据所述各个物品特征的重要性排序,确定推荐物品的各个物品特征的排序;
根据特征数量阈值,从所述推荐物品的各个物品特征中筛选出重要性排序靠前的解释特征。
5.根据权利要求1所述的方法,其特征在于,根据所述推荐物品的评价数据构建解释库,从而提取出所述解释库中各条解释对应的主题,包括:
采用经过训练的情感分析模型对所述推荐物品的每条评价数据进行识别,从而确定所述评价数据的情感为积极或者消极;
采用情感为积极的评价数据构建解释库;
采用主题提取模型对所述解释库中的每条解释进行主题提取,从而得到每条解释对应的主题。
6.根据权利要求5所述的方法,其特征在于,采用主题提取模型对所述解释库中的每条解释进行主题提取,从而得到每条解释对应的主题之后,还包括:
按照各条解释的支持数量的大小对所述各条解释进行排序,从而得到所述各条解释的支持程度排序。
7.根据权利要求6所述的方法,其特征在于,计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度生成所述推荐物品对应的解释结果,包括:
计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度;
对于所述解释库中的每条解释,若所述解释对应的主题与所述推荐物品的各个解释特征的相似度均大于相似度阈值,则将所述解释作为所述推荐物品对应的解释结果。
8.根据权利要求7所述的方法,其特征在于,计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度生成所述推荐物品对应的解释结果,还包括:
若存在相似度均大于相似度阈值的多条解释,则根据所述多条解释的支持程度排序筛选出排序最靠前的目标解释,并将所述目标解释作为所述推荐物品对应的解释结果。
9.根据权利要求8所述的方法,其特征在于,计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度生成所述推荐物品对应的解释结果,还包括:
若不存在相似度均大于相似度阈值的解释,则根据所述推荐物品的各个解释特征的重要性排筛选出排序最靠前的目标特征,并根据所述目标特征生成所述推荐物品对应的解释结果。
10.一种解释结果的生成装置,其特征在于,包括:
排序模块,用于根据目标用户对各个物品的评分,得出各个物品特征的重要性排序;
筛选模块,用于根据所述各个物品特征的重要性排序,从推荐物品的各个物品特征中筛选出解释特征;
提取模块,用于根据所述推荐物品的评价数据构建解释库,从而提取出所述解释库中各条解释对应的主题;
计算模块,用于计算所述解释库中各条解释对应的主题与所述推荐物品的各个解释特征的相似度,从而根据所述相似度确定所述推荐物品对应的解释结果。
11.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现如权利要求1-9中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-9中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210005426.0A CN116451798A (zh) | 2022-01-04 | 2022-01-04 | 一种解释结果的生成方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210005426.0A CN116451798A (zh) | 2022-01-04 | 2022-01-04 | 一种解释结果的生成方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116451798A true CN116451798A (zh) | 2023-07-18 |
Family
ID=87118795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210005426.0A Pending CN116451798A (zh) | 2022-01-04 | 2022-01-04 | 一种解释结果的生成方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116451798A (zh) |
-
2022
- 2022-01-04 CN CN202210005426.0A patent/CN116451798A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107193792B (zh) | 基于人工智能的生成文章的方法和装置 | |
KR102131099B1 (ko) | 지식 그래프에 기초한 사용자 인터페이스 요소의 동적 수정 방법 | |
CN106227815B (zh) | 一种多模态线索的个性化应用程序功能推荐方法及其系统 | |
US10891322B2 (en) | Automatic conversation creator for news | |
CN107241260B (zh) | 基于人工智能的新闻推送的方法和装置 | |
CN107145485B (zh) | 用于压缩主题模型的方法和装置 | |
CN107220386A (zh) | 信息推送方法和装置 | |
CN109086439A (zh) | 信息推荐方法及装置 | |
CN107526718B (zh) | 用于生成文本的方法和装置 | |
CN112883731B (zh) | 内容分类方法和装置 | |
CN106354856B (zh) | 基于人工智能的深度神经网络强化搜索方法和装置 | |
CN113434716B (zh) | 一种跨模态信息检索方法和装置 | |
CN107862058B (zh) | 用于生成信息的方法和装置 | |
JP2023017921A (ja) | コンテンツ推薦とソートモデルトレーニング方法、装置、機器、記憶媒体及びコンピュータプログラム | |
CN107924398B (zh) | 用于提供以评论为中心的新闻阅读器的系统和方法 | |
CN111767431A (zh) | 用于视频配乐的方法和装置 | |
CN111883131B (zh) | 语音数据的处理方法及装置 | |
CN111324773A (zh) | 一种背景音乐构建方法、装置、电子设备和存储介质 | |
CN115114395A (zh) | 内容检索及模型训练方法、装置、电子设备和存储介质 | |
CN110162769B (zh) | 文本主题输出方法和装置、存储介质及电子装置 | |
CN110688470B (zh) | 用于发送信息的方法和装置 | |
CN111988668A (zh) | 一种视频推荐方法、装置、计算机设备及存储介质 | |
CN112801053B (zh) | 视频数据处理方法、装置 | |
CN117272056A (zh) | 对象特征构建方法、装置和计算机可读存储介质 | |
CN116451798A (zh) | 一种解释结果的生成方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |