WO2023206960A1

WO2023206960A1 - 基于内容与协同过滤的产品推荐方法、装置及计算机设备

Info

Publication number: WO2023206960A1
Application number: PCT/CN2022/122200
Authority: WO
Inventors: 徐滨
Original assignee: 康键信息技术（深圳）有限公司
Priority date: 2022-04-24
Filing date: 2022-09-28
Publication date: 2023-11-02
Also published as: CN114610859A

Abstract

本申请公开了一种基于内容与协同过滤的产品推荐方法、装置及设备，涉及互联网技术领域，可以解决用户在大量产品中搜索目标产品时准确度低以及无法满足用户个性化偏好的问题。包括：利用预设分词技术与TF-IDF算法计算产品查询文本与预设产品文本的第一相似度，将对应第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；根据推荐产品文本的标识特征词集与描述特征词集计算推荐产品文本与产品查询文本的加权相似值，并按照加权相似值由大到小的顺序形成第一推荐结果；基于协同过滤算法计算查询用户对历史行为集合的评分，并根据评分确定第二推荐结果；根据第一推荐结果与第二推荐结果确定目标产品推荐结果。

Description

基于内容与协同过滤的产品推荐方法、装置及计算机设备

本申请要求于2022年4月24日提交中国专利局、申请号为202210435260.6、申请名称为“基于内容与协同过滤的产品推荐方法、装置、计算机设备及计算机存储介质”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及互联网技术领域，尤其涉及到一种基于内容与协同过滤的产品推荐方法、装置及设备。

背景技术

在医疗行业应用信息化技术的发展过程中，医疗产品库中包括了大量复杂数据，且不同用户偏好不同，因此，从大量数据中难以精确的搜索到符合用户需求的产品。

目前是通过关键词进行模糊搜索，将得到的模糊搜索结果按照其历史被访问次数由高到低的顺序排序并推荐给用户，但是发明人意识到，一方面通过关键词进行模糊查询的方法查询到的产品准确度不高，另一方面按照被访问次数的顺序推荐无法满足用户个性化偏好。

发明内容

有鉴于此，本申请提供了一种基于内容与协同过滤的产品推荐方法、装置及设备，涉及互联网技术领域，可以解决用户在大量产品中搜索目标产品时准确度低以及无法满足用户个性化偏好的问题。

根据本申请的一个方面，提供了一种基于内容与协同过滤的产品推荐方法，该方法包括：

获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算所述产品查询文本与预设产品文本的第一相似度，将对应所述第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；

提取所述推荐产品文本的标识特征词集与描述特征词集，根据所述标识特征词集与所述描述特征词集计算所述推荐产品文本与所述产品查询文本的加权相似值，并按照所述加权相似值由大到小的顺序形成第一推荐结果；

确定与所述查询用户行为相关性高于第一预设阈值的邻居用户，以及所述邻居用户针对产品的历史行为集合，基于协同过滤算法计算所述查询用户对所述历史行为集合的评分，并根据所述评分确定第二推荐结果；

根据所述第一推荐结果与所述第二推荐结果确定目标产品推荐结果。

根据本申请的另一个方面，提供了一种基于内容与协同过滤的产品推荐装置，该装置包括：

筛选模块，用于获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算所述产品查询文本与预设产品文本的第一相似度，将对应所述第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；

第一推荐模块，用于获取所述推荐产品文本的标识特征词集与描述特征词集，根据所述标识特征词集与所述描述特征词集计算所述推荐产品文本与所述产品查询文本的加权相似值，并按照所述加权相似值由大到小的顺序形成第一推荐结果；

第二推荐模块，用于确定与所述查询用户行为相关性高于第一预设阈值的邻居用户，以及所述邻居用户针对产品的历史行为集合，基于协同过滤算法计算所述查询用户对所述历史行为集合的评分，并根据所述评分确定第二推荐结果；

确定模块，用于根据所述第一推荐结果与所述第二推荐结果确定目标产品推荐结果。

根据本申请的又一个方面，提供了一种非易失性可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现上述基于内容与协同过滤的产品推荐方法。

根据本申请的再一个方面，提供了一种计算机设备，包括非易失性可读存储介质、处理器及存储在非易失性可读存储介质上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述基于内容与协同过滤的产品推荐方法。

借由上述技术方案，本申请公开了一种基于内容与协同过滤的产品推荐方法、装置及设备，本申请首先获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算产品查询文本与预设产品文本的第一相似度，将对应第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；进一步的，提取推荐产品文本的标识特征词集与描述特征词集，根据标识特征词集与描述特征词集计算推荐产品文本与产品查询文本的加权相似值，并按照加权相似值由大到小的顺序形成第一推荐结果；此外，确定与查询用户行为相关性高于第一预设阈值的邻居用户，以及邻居用户针对产品的历史行为集合，基于协同过滤算法计算查询用户对历史行为集合的评分，并根据评分确定第二推荐结果；最后，根据第一推荐结果与第二推荐结果确定目标产品推荐结果。通过本申请中的技术方案，从产品查询文本出发得到针对目标产品的第一推荐结果，从与查询用户行为相关性高的邻居用户角度出发得到针对目标产品的第二推荐结果，然后使用第一推荐结果与第二推荐结果共同确定目标产品推荐结果，通过多个维度综合为查询用户推荐，推荐精确度高，且符合查询用户的个性化需求。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本地申请的不当限定。在附图中：

图1示出了本申请实施例提供的一种基于内容与协同过滤的产品推荐方法的流程示意图；

图2示出了本申请实施例提供的另一种基于内容与协同过滤的产品推荐方法的流程示意图；

图3出了本申请实施例提供的一种基于内容与协同过滤的产品推荐装置的结构示意图；

图4出了本申请实施例提供的另一种基于内容与协同过滤的产品推荐装置的结构示意图。

具体实施方式

下文将参考附图并结合实施例来详细说明本申请。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互结合。

针对目前的问题，本申请实施例提供了一种基于内容与协同过滤的产品推荐方法，如图1所示，该方法包括：

101、获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算产品查询文本与预设产品文本的第一相似度，将对应第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本。

其中，目标产品是查询用户需求的产品，产品查询文本是关于目标产品的产品说明书等，预设产品文本存在于产品数据库中，用于与产品查询文本匹配，进而确定出符合第一相似度大于预设相似度阈值的预设产品文本，其中，预设产品文本同样可以是产品说明书等。

对于本实施例，预设分词技术可为任意一种现有分词技术，如CRF分词器、 IKAnalyzer分词器等。通过预设分词技术对产品查询文本进行分词处理，得到包括至少一个产品查询特征词的产品查询特征词集，通过TF-IDF算法计算产品查询特征词集对应的产品查询特征向量，同样的，通过预设分词技术对预设产品文本进行分词处理，得到包括至少一个预设产品特征词的预设产品特征词集，通过TF-IDF算法计算预设产品特征词集对应的预设产品特征向量。

其中，TF-IDF是一种常用的信息加权技术，普遍应用于信息检索和数据挖掘领域。TF-IDF值可以用来评估文本中某个特征词是否为该文本的关键词，TF-IDF值越大，说明该特征词对该文本的重要程度越大，也就是，该特征词是该文本的关键词，某个特征词在该文本中出现的词频高，并不代表就是该文本的关键词，因此TF-IDF值是文本中某个特征词在该文本中出现的词频TF与该特征词对应的逆文档频率IDF的乘积，例如对于最常见的特征词“的、是、在”给予最小的IDF，对于少见的特征词“流感、病毒”等给予较大的IDF。因此，通过TF-IDF算法计算出的产品查询特征向量包括每个产品查询特征词对应的TF-IDF值，通过TF-IDF算法计算出的预设产品特征向量包括每个预设产品特征词对应的TF-IDF值。

进一步的，利用预设相似度计算公式计算产品查询特征向量与预设产品特征向量的第一相似度，预设相似度计算公式可以包括余弦计算公式，余弦计算公式描述为：

公式中，

为产品查询特征向量，

为预设产品特征向量，

为第一相似度。

计算出产品查询特征向量与每个预设产品特征向量的第一相似度后，将对应第一相似度大于预设相似度阈值的预设产品文本筛选出来，并确定为推荐产品文本，从大量预设产品文本中进行初步筛选，以便将初步筛选出的推荐产品文本与产品查询文本进行进一步的匹配，提高了产品推荐效率与精确度。

102、提取推荐产品文本的标识特征词集与描述特征词集，根据标识特征词集与描述特征词集计算推荐产品文本与产品查询文本的加权相似值，并按照加权相似值由大到小的顺序形成第一推荐结果。

其中，对推荐产品文本进行分词处理后的推荐产品特征词按照其属于标识性词语或者描述性词语进行分组，属于标识性词语的推荐产品特征词构成标识特征词集，属于描述性词语的推荐产品特征词构成描述特征词集，例如，推荐产品文本1的第一特征词属于描述性词语，那么将第一特征词归类到描述特征词集，推荐产品文本1的第二特征词属于标识性词语，那么将第二特征词归类到标识特征词集…，因此，推荐产品文本1的标识特征词集{第二特征词、第三特征词、第五特征词…}，推荐产品文本1的描述特征词集{第一特征词、第四特征词、第六特征词…}，其中，标识性词语如“流感、病毒”，描述性词语如“的、在、是”，这样分类的有益效果在于通过赋给每个推荐产品文本的描述性词语较小的占比，赋给每个推荐产品文本的标识性词语较大的占比，来提升第一推荐结果的精确度。

对于本实施例，根据标识特征词集与描述特征词集计算推荐产品文本与产品查询文本的加权相似值，就是进一步的通过赋给描述特征词集较小的占比，赋给标识特征词集较大的占比，再一次的计算每个推荐产品文本与产品查询文本的加权相似值，以便对多个推荐产品文本进行排序得出第一推荐结果。计算加权相似值的实施例步骤可包括：计算标识特征词集与产品查询特征词集的第一交集，以及描述特征词集与产品查询特征词集的第二交集。根据第一交集计算标识特征词集相对于产品查询特征词集的第三权重值，以及根据第二交集计算描述特征词集相对于产品查询特征词集的第四权重值，利用预设系数加权第三权重值与第四权重值得到推荐产品文本与产品查询文本的加权相似值。

第一推荐结果包括每个推荐产品文本与对应的加权相似值，按照加权相似值由大到小的顺序对推荐产品文本进行排序，排在第一推荐结果第一位的是最大的加权相似值对应的推荐产品文本。

103、确定与查询用户行为相关性高于第一预设阈值的邻居用户，以及邻居用户针对产品的历史行为集合，基于协同过滤算法计算查询用户对历史行为集合的评分，并根据评分确定第二推荐结果。

其中，协同过滤算法基于对查询用户的历史行为数据的挖掘发现查询用户的喜好偏向，并预测查询用户需求的产品，主要实现方式包括：计算出与查询用户有着共同需求的邻居用户，根据这些邻居用户的历史行为数据进行推荐。协同过滤算法在不存在产品查询文本或者产品查询文本不够精确时仍然可以帮助查询用户进行推荐。

对于本实施例，与查询用户有着共同需求的邻居用户体现在与查询用户行为相关性高于第一预设阈值的邻居用户，具体的，根据预设相关系数计算公式例如余弦计算公式去计算查询用户与其它用户的相关系数，将计算出来的相关系数与第一预设阈值比较，将相关系数高于第一预设阈值的其它用户作为邻居用户。

邻居用户针对产品的历史行为集合包括：待预测行为集、待预测行为集的相邻行为集，其中，待预测行为集是存在于邻居用户的行为集中，但是不存在于查询用户的行为集中的行为。待预测行为集的相邻行为集的确定具体包括：根据k近邻算法或k-means算法计算待预测行为集与其他行为集的第二相似度，将第二相似度大于第二预设阈值的其他行为集确定为相邻行为集。最后，基于协同过滤算法计算查询用户对历史行为集合的评分，具体包括：基于用户的协同过滤算法计算查询用行为户对待预测集的第一评分，基于项的协同过滤算法计算查询用户对相邻行为集的第二评分，最后，加权计算第一评分与第二评分得到查询用户对历史行为集合的评分，并根据评分确定第二推荐结果。

第二推荐结果包括对评分以及与评分对应的产品的排序，排在第二推荐结果第一位的是最大评分以及与最大评分对应的产品。

104、根据第一推荐结果与第二推荐结果确定目标产品推荐结果。

对于本实施例，作为一种优选的实施方式，可以将第一推荐结果与第二推荐结果加权计算得到目标产品推荐结果。其中，根据预设分词技术与TF-IDF算法计算出的第一推荐结果是基于文本内容得到的，根据协同过滤算法计算出的第二推荐结果是基于用户行为得到的，通过加权的方法将这两个维度得到的推荐结果组合，综合得到目标产品推荐结果，比单一维度下得到的推荐结果更加准确。

本申请公开了一种基于内容与协同过滤的产品推荐方法、装置及设备，首先获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算产品查询文本与预设产品文本的第一相似度，将对应第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；进一步的，提取推荐产品文本的标识特征词集与描述特征词集，根据标识特征词集与描述特征词集计算推荐产品文本与产品查询文本的加权相似值，并按照加权相似值由大到小的顺序形成第一推荐结果；此外，确定与查询用户行为相关性高于第一预设阈值的邻居用户，以及邻居用户针对产品的历史行为集合，基于协同过滤算法计算查询用户对历史行为集合的评分，并根据评分确定第二推荐结果；最后，根据第一推荐结果与第二推荐结果确定目标产品推荐结果。通过本申请中的技术方案，从产品查询文本出发得到针对目标产品的第一推荐结果，从与查询用户行为相关性高的邻居用户角度出发得到针对目标产品的第二推荐结果，然后使用第一推荐结果与第二推荐结果共同确定目标产品推荐结果，通过多个维度综合为查询用户推荐，推荐精确度高，且符合查询用户的个性化需求。

进一步的，作为上述实施例具体实施方式的细化和扩展，为了完整说明本实施例中的具体实施过程，提供了另一种基于内容与协同过滤的产品推荐方法，如图2所示，该方法包括：

201、获取查询用户发送的针对目标产品的产品查询文本，根据预设分词技术对产品查询文本进行分词处理得到产品查询特征词集，对预设产品文本进行分词处理得到预设产品特征词集。

对于本实施例，在具体的应用场景中，产品查询文本可以包括：产品说明书、医疗诊断书等，利用预设分词技术对产品查询文本进行分词处理，具体的：产品查询特征词集{产品查询特征词1，产品查询特征词2，产品查询特征词3…}，例如，医疗诊断书中包括对于病情的详细描述文本，经过分词处理后，得到产品查询特征词集{口腔溃疡，反复发作，面部对称，复发性口疮…}同理，对每一个预设产品文本进行分词处理得到对应的预设产品特征词集{预设产品特征词1，预设产品特征词2，预设产品特征词3…}，例如，预设产品特征词集1{复以性口腔溃疡，疱疹性口腔溃疡，抑制免疫功能…}。

202、利用TF-IDF算法计算产品查询特征词集对应的产品查询特征向量以及预设产品特征词集对应的预设产品特征向量。

对于本实施例，作为一种优选的实施方式，可以包括：计算产品查询特征词集中每个产品查询特征词对产品查询文本的第一权重值以及预设产品特征词集中的每个预设产品特征词对预设产品文本的第二权重值；构建包括产品查询特征词与对应第一权重值的产品查询特征向量，以及构建包括预设产品特征词与对应第二权重值的预设产品特征向量。

具体的，TF-IDF算法包括词频tf计算与逆文档频率idf计算，进一步的，将词频tf与逆文档频率idf相乘得到特征词对文本的权重值。

产品查询特征词的词频表示产品查询特征词在产品查询特征词集中出现的次数，因为每个产品查询文本有长短之分，因此对每个词频进行标准化，因此词频计算公式中除以∑ _kn _k,j。

词频计算公式描述为：

其中，i代表产品查询特征词，j代表产品查询特征词集，tf _i,j表示i在集合j中的词频，n _i,j表示i在集合j中出现的次数，∑ _kn _k,j表示集合j所有词出现的次数总和。

逆文档频率计算公式描述为：

其中，i代表产品查询特征词，j代表产品查询特征词集，idf _i表示i在集合j中的逆文档频率，|D|代表数据库中产品文本总数，|{j:t _j∈d _j}|代表出现产品查询特征词i的产品文本数。|{j:t _j∈d _j}|越小，IDF值越大，产品查询特征词i的文本区分效果越好。相反，IDF值越小则产品查询特征词的文本区分效果越差。

TF-IDF值计算公式描述为：tfidf _i,j＝tf _i,j×idf _i

其中，tfidf _i,j为产品查询特征词i的第一权重值。

利用TF-IDF算法计算每个预设产品特征词的第二权重值的具体实施过程可参考利用TF-IDF算法计算每个产品查询特征词的第一权重值的过程。

构建产品查询特征向量：{(产品查询特征词1，产品查询特征词1的第一权重值)，(产品查询特征词2，产品查询特征词2的第一权重值)，(产品查询特征词3，产品查询特征词3的第一权重值)…}。

同理，构建预设产品特征向量：{(预设产品特征词1，预设产品特征词1的第二权重值)，(预设产品特征词2，预设产品特征词2的第二权重值)，(预设产品特征词3，预设产品特征词3的第二权重值)…}。

203、利用预设相似度计算公式计算产品查询特征向量与预设产品特征向量的第一相似度，将对应第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本。

对于本实施例，预设相似度计算公式可以包括余弦计算公式，余弦计算公式描述为：

公式中，

为产品查询特征向量，

为预设产品特征向量，

为第一相似度。

204、提取推荐产品文本的标识特征词集与描述特征词集，计算标识特征词集与产品查询特征词集的第一交集，以及描述特征词集与产品查询特征词集的第二交集。

对于本实施例，推荐产品文本经过分词处理后得到的推荐产品特征词可以按照其属于标识性词语或者描述性词语进行分组，将推荐产品特征词集分为标识特征词集与描述特征词集，计算标识特征词集与产品查询特征词集的第一交集，以推荐产品文本1为例，如果存在于标识特征词集的第二特征词与产品查询特征词集没有交集，那么第一交集中不包括第二特征词，如果存在于标识特征词集的第三特征词与产品查询特征词集有交集，那么第一交集中包括第三特征词，因此，第一交集为{第三特征词…}，同理，计算描述特征词集与产品查询特征词集的第二交集。

205、根据第一交集计算标识特征词集相对于产品查询特征词集的第三权重值，以及根据第二交集计算描述特征词集相对于产品查询特征词集的第四权重值。

对于本实施例，第三权重值计算过程为：tfidf _w＝∑ _t∈ntf _t,w×idf _t,w

其中，tfidf _w表示标识特征词集w相对于产品查询特征词集j的第三权重值，n表示标识特征词集w与产品查询特征词集j的第一交集。tf _t,w表示w中标识特征词t的TF值，idf _t,w表示w中标识特征词t的IDF值。

第四权重值计算过程为：tfidf _v＝∑ _t∈mtf _t,v×idf _t,v

其中，tfidf _v表示描述特征词集v相对于产品查询特征词集j的第四权重值，m表示描述特征词集v与产品查询特征词集j的第二交集。tf _t,v表示v中的描述特征词t的TF值，idf _t,v表示v中的特征词t的IDF值。

206、利用预设系数加权第三权重值与第四权重值得到推荐产品文本与产品查询文本的加权相似值，并按照加权相似值由大到小的顺序形成第一推荐结果。

对于本实施例，每个推荐产品文本与产品查询文本的加权相似值计算过程为：C＝λtfidf _w+(1-λ)tfidf _v

其中，λ为预设系数，C为加权相似值，tfidf _w表示第三权重值，tfidf _v表示第四权重值。

第一推荐结果包括加权相似值以及与加权相似值对应的推荐产品文本，其中，排在第一推荐结果第一位的是最大的加权相似值以及与最大的加权相似值对应的推荐产品文本，例如，第一推荐结果包括：{(曲安松龙软膏，0.5)，(杜米芬含片，0.3)，(利多卡因凝胶，0.15)...}。

利用预设系数加权第三权重值与第四权重值得到推荐产品文本与产品查询文本的加权相似值的作用在于：通过赋给每个推荐产品文本的描述性词语较小的系数也就是(1-λ)，赋给每个推荐产品文本的标识性词语较大的系数也就是λ，减少描述性词语对第一推荐结果的干扰，从而提升第一推荐结果的精确度。

根据查询用户的产品查询文本作推荐，一方面，与查询用户个人数据无关，因此没有冷启动、新用户问题。另一方面，每个预设产品文本都有被推荐的可能，与预设产品文本信息的入库时间以及先后顺序无关，因此无新项目问题。最后，相较于直接拿关键词到数据库中做模糊查询的方法，此方法基于更加贴近查询用户需要的内容文本搜索，因此第一推荐结果更加准确。

207、确定与查询用户行为相关性高于第一预设阈值的邻居用户，以及邻居用户针对产品的历史行为集合。

其中，历史行为集合包括邻居用户的行为集不同于查询用户的行为集的待预测行为集，以及与待预测行为集相邻的相邻行为集。

对于本实施例，作为一种优选的实施方式，确定与查询用户行为相关性高于第一预设阈值的邻居用户的实施例步骤包括：利用预设相关系数计算公式计算查询用户与其他用户的相关系数，将相关系数大于第一预设阈值的其他用户确定为邻居用户。具体的，预设相关系数计算公式可以表示为：

其中，S(u,b)表示查询用户u和其他用户b的相关系数，I _u∩I _b表示u，b共同调用的产品集合，r _u,p和r _b,p分别表示u和b对共同调用的产品p的历史调用次数，

和

分别表示u和b对I _u∩I _b集合中的产品的平均历史调用次数。

S(u,b)的值越大，表示u和b的相关系数越大。S(u,b)的取值区间一般为[-1，+1]。将S(u,b)大于预设第一阈值的其他用户b确定为邻居用户h。

确定邻居用户的行为集不同于查询用户的行为集的待预测行为集的具体实施例步骤包括：将邻居用户的行为集与查询用户的行为集的差确定为待预测行为集。具体的，待预测行为集存在于邻居用户的行为集中，但是不存在于查询用户的行为集中。

确定与待预测行为集相邻的相邻行为集的具体实施例步骤包括：根据k近邻算法或k-means算法计算待预测行为集与其他行为集的第二相似度，将第二相似度大于第二预设阈值的其他行为集确定为相邻行为集。具体的，k近邻算法或k-means算法可以参见现有技术，在此不再赘述。

208、基于用户的协同过滤算法计算查询用行为户对待预测集的第一评分。

基于用户的协同过滤算法主要思想是：找到与查询用户行为相关性高于第一预设阈值的邻居用户，基于查询用户与邻居用户的历史行为具有相似性，因此，邻居用户有过的历史行为而查询用户没有过的历史行为可能是查询用户会有的历史行为。其中，邻居用户有过的历史行为而查询用户没有过的历史行为在本实施例中体现在待预测集。

对于本实施例，第一评分计算公式描述为：

其中，p(u,i)表示查询用户u对待预测行为集中产品i的第一评分，

表示查询用户u对产品的平均调用次数，s(u,h)表示u与h的相关系数，p _h,q表示邻居用户h对i的评分，n是邻居用户的个数。

209、基于项的协同过滤算法计算查询用户对相邻行为集的第二评分，根据第一评分和/或第二评分确定第二推荐结果。

其中，相邻行为集是与待预测行为集相邻的相邻行为集。对于本实施例，第二评分计算公式描述为：

其中，p(u,i)代表查询用户u对待预测集中产品i的第二评分，

代表邻居用户h对i的平均调用次数，i _k为相邻行为集，

为邻居用户h对相邻行为集i _k的平均调用次数，s(i,i _k)代表i与i _k的第二相似度，

代表查询用户u调用相邻行为集i _k的次数。

作为一种实施方式，第二推荐结果可以只包括第一评分，也可以只包括第二评分，也可以对第一评分与第二评分进行加权计算，加权计算第一评分与第二评分的作用在于：结合了两种协同过滤算法，提高了第二推荐结果的精确度。

加权第一评分与第二评分的计算公式描述为：P＝μp(u,i)+(1-μ)p(u,i)

其中，μ为加权系数，P为评分。

按照评分对相邻行为集对应的产品进行由大到小的排序，得到第二推荐结果，具体的，第二推荐结果为：产品1、评分为16；产品7、评分为10；产品5、评分为3…

进一步的，在按照评分对相邻行为集对应的产品进行由大到小的排序之前，还包括：删除评分小于等于0的产品。因为，查询用户不会搜索评分小于0的产品，所以只保存评分大于0的产品。

210、根据第一推荐结果与第二推荐结果确定目标产品推荐结果。

在将步骤206得到的第一推荐结果与步骤209得到的第二推荐结果进行加权处理之前，还包括：利用归一化将评分压缩到(0，1)范围。

例如，第二推荐结果为：产品1、归一化前评分为16；产品7、归一化前评分为10；产品5、归一化前评分为3…

归一化后的第二推荐结果为：产品1、评分为0.53，产品7、评分为0.33，产品5、评分为0.1…

对于本实施例，作为一种优选实施方式，计算第一推荐结果对应产品与第二推荐结果对应产品的并集产品；利用预设第三系数加权并集产品的加权相似值与评分，得到目标推荐值；根据目标推荐值由大到小的顺序排序得到目标产品推荐结果。

例如，第一推荐结果计算出来的是产品与对应的加权相似值，第二推荐结果计算出来的是产品与对应的评分，比如产品1在第一推荐结果里加权相似值是0.5，产品1在第二推荐结果里评分是0.53，那么目标推荐值是0.5*预设第三系数+0.53*(1-预设第三系数)，如果产品2在第一推荐结果里加权相似值是0.1，但是第二推荐结果里没有产品2，那么目标推荐值是0.1*预设第三系数+0*(1-预设第三系数)。

本申请公开了一种基于内容与协同过滤的产品推荐方法、装置及设备，本申请首先获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算产品查询文本与预设产品文本的第一相似度，将对应第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；进一步的，提取推荐产品文本的标识特征词集与描述特征词集，根据标识特征词集与描述特征词集计算推荐产品文本与产品查询文本的加权相似值，并按照加权相似值由大到小的顺序形成第一推荐结果；此外，确定与查询用户行为相关性高于第一预设阈值的邻居用户，以及邻居用户针对产品的历史行为集合，基于协同过滤算法计算查询用户对历史行为集合的评分，并根据评分确定第二推荐结果；最后，根据第一推荐结果与第二推荐结果确定目标产品推荐结果。通过本申请中的技术方案，从产品查询文本出发得到针对目标产品的第一推荐结果，从与查询用户行为相关性高的邻居用户角度出发得到针对目标产品的第二推荐结果，然后使用第一推荐结果与第二推荐结果共同确定目标产品推荐结果，通过多个维度综合为查询用户推荐，推荐精确度高，且符合查询用户的个性化需求。

进一步的，作为图1和图2所示方法的具体实现，本申请实施例提供了一种基于内容与协同过滤的产品推荐装置，如图3所示，该装置包括：筛选模块31、第一推荐模块32、第二推荐模块33、确定模块34；

筛选模块31，可用于获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算产品查询文本与预设产品文本的第一相似度，将对应第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；

第一推荐模块32，可用于提取推荐产品文本的标识特征词集与描述特征词集，根据标识特征词集与描述特征词集计算推荐产品文本与产品查询文本的加权相似值，并按照加权相似值由大到小的顺序形成第一推荐结果；

第二推荐模块33，可用于确定与查询用户行为相关性高于第一预设阈值的邻居用户，以及邻居用户针对产品的历史行为集合，基于协同过滤算法计算查询用户对历史行为集合的评分，并根据评分确定第二推荐结果；

确定模块34，可用于根据第一推荐结果与第二推荐结果确定目标产品推荐结果。

在具体的应用场景中，为了利用预设分词技术与TF-IDF算法计算产品查询文本与预设产品文本的第一相似度，如图4所示，筛选模块31，具体可包括：分词单元311、第一计算单元312、第二计算单元313；

分词单元311，可用于根据预设分词技术对产品查询文本进行分词处理得到产品查询特征词集，对预设产品文本进行分词处理得到预设产品特征词集；

第一计算单元312，可用于利用TF-IDF算法计算产品查询特征词集对应的产品查询特征向量以及预设产品特征词集对应的预设产品特征向量；

第二计算单元313，可用于利用预设相似度计算公式计算产品查询特征向量与预设产品特征向量的第一相似度。

相应的，为了利用TF-IDF算法计算产品查询特征词集对应的产品查询特征向量以及预设产品特征词集对应的预设产品特征向量，第一计算单元312，具体可用于计算产品查询特征词集中每个产品查询特征词对产品查询文本的第一权重值以及预设产品特征词集中的每个预设产品特征词对预设产品文本的第二权重值；构建包括产品查询特征词与对应第一权重值的产品查询特征向量，以及构建包括预设产品特征词与对应第二权重值的预设产品特征向量。

在具体的应用场景中，根据标识特征词集与描述特征词集计算推荐产品文本与产品查询文本的加权相似值，如图4所示，第一推荐模块32，具体可包括：交集单元321、权重单元322、第一加权单元323；

交集单元321，可用于计算所述标识特征词集与所述产品查询特征词集的第一交集，以及所述描述特征词集与所述产品查询特征词集的第二交集；

权重单元322，可用于根据第一交集计算标识特征词集相对于产品查询特征词集的第三权重值，以及根据第二交集计算描述特征词集相对于产品查询特征词集的第四权重值；

第一加权单元323，可用于利用预设系数加权第三权重值与第四权重值得到推荐产品文本与产品查询文本的加权相似值。

在具体的应用场景中，历史行为集合包括邻居用户的行为集不同于查询用户的行为集的待预测行为集，以及与待预测行为集相邻的相邻行为集，为了确定与查询用户行为相关性高于第一预设阈值的邻居用户，以及邻居用户针对产品的历史行为集合，如图4所示，第二推荐模块33，具体可包括：第一筛选单元331、第一确定单元332、第二筛选单元333；

第一筛选单元331，可用于利用预设相关系数计算公式计算所述查询用户与其他用户的相关系数，将所述相关系数大于第一预设阈值的其他用户确定为邻居用户；

第一确定单元332，可用于将邻居用户的行为集与查询用户的行为集的差确定为待预测行为集；

第二筛选单元333，可用于根据k近邻算法或k-means算法计算待预测行为集与其他行为集的第二相似度，将第二相似度大于第二预设阈值的其他行为集确定为相邻行为集。

在具体的应用场景中，基于协同过滤算法计算查询用户对历史行为集合的评分，并根据评分确定第二推荐结果，如图4所示，第二推荐模块33，具体还可包括：第一评分单元334、第二评分单元335、第二筛选单元336；

第一评分单元334，可用于基于用户的协同过滤算法计算查询用户对待预测行为集的第一评分；

第二评分单元335，可用于基于项的协同过滤算法计算查询用户对相邻行为集的第二评分；

第二确定单元336，可用于根据第一评分和/或第二评分确定第二推荐结果。

在具体的应用场景中，根据第一推荐结果与第二推荐结果确定目标产品推荐结果，如图4所示，确定模块34，具体可包括：并集单元341、第二加权单元342、推荐单元343；

并集单元341，可用于计算第一推荐结果对应产品与第二推荐结果对应产品的并集产品；

第二加权单元342，可用于利用预设第三系数加权并集产品的加权相似值与评分，得到目标推荐值；

推荐单元343，可用于根据目标推荐值由大到小的顺序排序得到目标产品推荐结果。

需要说明的是，本实施例提供的一种基于内容与协同过滤的产品推荐装置所涉及各功能单元的其他相应描述，可以参考图1至图2的对应描述，在此不再赘述。

基于上述如图1至图2所示方法，相应的，本实施例还提供了一种可读存储介质，可读存储介质具体可为易失性或非易失性，其上存储有计算机可读指令，该可读指令被处理器执行时实现上述如图1至图2所示的基于内容与协同过滤的产品推荐方法。

基于这样的理解，本申请的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个可读存储介质(可以是CD-ROM，U盘，移动硬盘等)中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施场景的方法。

基于上述如图1至图2所示的方法和图3、图4所示的虚拟装置实施例，为了实现上述目的，本实施例还提供了一种计算机设备，该计算机设备包括非易失性可读存储介质和处理器；非易失性可读存储介质，用于存储计算机可读指令；处理器，用于执行计算机可读指令以实现上述如图1至图2所示的基于内容与协同过滤的产品推荐方法。

可选的，该计算机设备还可以包括用户接口、网络接口、摄像头、射频(Radio Frequency，RF)电路，传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等，可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。

本领域技术人员可以理解，本实施例提供的一种计算机设备结构并不构成对该实体设备的限定，可以包括更多或更少的部件，或者组合某些部件，或者不同的部件布置。

非易失性可读存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述计算机设备硬件和软件资源的程序，支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现非易失性可读存储介质内部各组件之间的通信，以及与信息处理实体设备中其它硬件和软件之间通信。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现，也可以通过硬件实现。

通过应用本申请的技术方案，与目前现有技术相比，本申请公开了一种基于内容与协同过滤的产品推荐方法、装置及设备，本申请首先获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算产品查询文本与预设产品文本的第一相似度，将对应第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；进一步的，提取推荐产品文本的标识特征词集与描述特征词集，根据标识特征词集与描述特征词集计算推荐产品文本与产品查询文本的加权相似值，并按照加权相似值由大到小的顺序形成第一推荐结果；此外，确定与查询用户行为相关性高于第一预设阈值的邻居用户，以及邻居用户针对产品的历史行为集合，基于协同过滤算法计算查询用户对历史行为集合的评分，并根据评分确定第二推荐结果；最后，根据第一推荐结果与第二推荐结果确定目标产品推荐结果。通过本申请中的技术方案，从产品查询文本出发得到针对目标产品的第一推荐结果，从与查询用户行为相关性高的邻居用户角度出发得到针对目标产品的第二推荐结果，然后使用第一推荐结果与第二推荐结果共同确定目标产品推荐结果，通过多个维度综合为查询用户推荐，推荐精确度高，且符合查询用户的个性化需求。

本领域技术人员可以理解附图只是一个优选实施场景的示意图，附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中，也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

上述本申请序号仅仅为了描述，不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景，但是，本申请并非局限于此，任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims

一种基于内容与协同过滤的产品推荐方法，其中，包括：

获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算所述产品查询文本与预设产品文本的第一相似度，将对应所述第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；

提取所述推荐产品文本的标识特征词集与描述特征词集，根据所述标识特征词集与所述描述特征词集计算所述推荐产品文本与所述产品查询文本的加权相似值，并按照所述加权相似值由大到小的顺序形成第一推荐结果；

确定与所述查询用户行为相关性高于第一预设阈值的邻居用户，以及所述邻居用户针对产品的历史行为集合，基于协同过滤算法计算所述查询用户对所述历史行为集合的评分，并根据所述评分确定第二推荐结果；

根据所述第一推荐结果与所述第二推荐结果确定目标产品推荐结果。
根据权利要求1所述的方法，其中，所述利用预设分词技术与TF-IDF算法计算所述产品查询文本与预设产品文本的第一相似度，包括：

根据预设分词技术对所述产品查询文本进行分词处理得到产品查询特征词集，对所述预设产品文本进行分词处理得到预设产品特征词集；

利用TF-IDF算法计算所述产品查询特征词集对应的产品查询特征向量以及所述预设产品特征词集对应的预设产品特征向量；

利用预设相似度计算公式计算所述产品查询特征向量与所述预设产品特征向量的第一相似度。
根据权利要求2所述的方法，其中，所述利用TF-IDF算法计算所述产品查询特征词集对应的产品查询特征向量以及所述预设产品特征词集对应的预设产品特征向量，包括：

计算所述产品查询特征词集中每个产品查询特征词对所述产品查询文本的第一权重值以及所述预设产品特征词集中的每个预设产品特征词对所述预设产品文本的第二权重值；

构建包括所述产品查询特征词与对应所述第一权重值的产品查询特征向量，以及构建包括所述预设产品特征词与对应所述第二权重值的预设产品特征向量。
根据权利要求2所述的方法，其中，所述根据所述标识特征词集与所述描述特征词集计算所述推荐产品文本与所述产品查询文本的加权相似值，包括：

计算所述标识特征词集与所述产品查询特征词集的第一交集，以及所述描述特征词集与所述产品查询特征词集的第二交集；

根据所述第一交集计算所述标识特征词集相对于所述产品查询特征词集的第三权重值，以及根据所述第二交集计算所述描述特征词集相对于所述产品查询特征词集的第四权重值；

利用预设系数加权所述第三权重值与所述第四权重值得到所述推荐产品文本与所述产品查询文本的加权相似值。
根据权利要求1所述的方法，其中，所述历史行为集合包括所述邻居用户的行为集不同于所述查询用户的行为集的待预测行为集，以及与所述待预测行为集相邻的相邻行为集，所述确定与所述查询用户行为相关性高于第一预设阈值的邻居用户，以及所述邻居用户针对产品的历史行为集合，包括：

利用预设相关系数计算公式计算所述查询用户与其他用户的相关系数，将所述相关系数大于第一预设阈值的其他用户确定为邻居用户；

将所述邻居用户的行为集与所述查询用户的行为集的差确定为待预测行为集；

根据k近邻算法或k-means算法计算所述待预测行为集与其他行为集的第二相似度，将所述第二相似度大于第二预设阈值的其他行为集确定为相邻行为集。
根据权利要求5所述的方法，其中，所述基于协同过滤算法计算所述查询用户对所述历史行为集合的评分，并根据所述评分确定第二推荐结果，包括：

基于用户的协同过滤算法计算所述查询用户对所述待预测行为集的第一评分；

基于项的协同过滤算法计算所述查询用户对所述相邻行为集的第二评分；

根据所述第一评分和/或所述第二评分确定第二推荐结果。
根据权利要求1所述的方法，其中，所述根据所述第一推荐结果与所述第二推荐结果确定目标产品推荐结果，包括：

计算所述第一推荐结果对应产品与所述第二推荐结果对应产品的并集产品；

利用预设第三系数加权所述并集产品的加权相似值与评分，得到目标推荐值；

根据所述目标推荐值由大到小的顺序排序得到目标产品推荐结果。
一种基于内容与协同过滤的产品推荐装置，其特征在于，包括：

筛选模块，用于获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算所述产品查询文本与预设产品文本的第一相似度，将对应所述第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；

第一推荐模块，用于提取所述推荐产品文本的标识特征词集与描述特征词集，根据所述标识特征词集与所述描述特征词集计算所述推荐产品文本与所述产品查询文本的加权相似值，并按照所述加权相似值由大到小的顺序形成第一推荐结果；

第二推荐模块，用于确定与所述查询用户行为相关性高于第一预设阈值的邻居用户，以及所述邻居用户针对产品的历史行为集合，基于协同过滤算法计算所述查询用户对所述历史行为集合的评分，并根据所述评分确定第二推荐结果；

确定模块，用于根据所述第一推荐结果与所述第二推荐结果确定目标产品推荐结果。
一种计算机设备，包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现以下步骤：

获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算所述产品查询文本与预设产品文本的第一相似度，将对应所述第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；

提取所述推荐产品文本的标识特征词集与描述特征词集，根据所述标识特征词集与所述描述特征词集计算所述推荐产品文本与所述产品查询文本的加权相似值，并按照所述加权相似值由大到小的顺序形成第一推荐结果；

确定与所述查询用户行为相关性高于第一预设阈值的邻居用户，以及所述邻居用户针对产品的历史行为集合，基于协同过滤算法计算所述查询用户对所述历史行为集合的评分，并根据所述评分确定第二推荐结果；

根据所述第一推荐结果与所述第二推荐结果确定目标产品推荐结果。
一种计算机可读存储介质，其上存储有计算机程序，其中，所述程序被处理器执行时实现以下步骤：

获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算所述产品查询文本与预设产品文本的第一相似度，将对应所述第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；

提取所述推荐产品文本的标识特征词集与描述特征词集，根据所述标识特征词集与所述描述特征词集计算所述推荐产品文本与所述产品查询文本的加权相似值，并按照所述加权相似值由大到小的顺序形成第一推荐结果；

确定与所述查询用户行为相关性高于第一预设阈值的邻居用户，以及所述邻居用户针对产品的历史行为集合，基于协同过滤算法计算所述查询用户对所述历史行为集合的评分，并根据所述评分确定第二推荐结果；

根据所述第一推荐结果与所述第二推荐结果确定目标产品推荐结果。
根据权利要求10所述的计算机可读存储介质，其中，所述计算机程序被处理器执行时还实现以下步骤：根据预设分词技术对所述产品查询文本进行分词处理得到产品查询特征词集，对所述预设产品文本进行分词处理得到预设产品特征词集；利用TF-IDF算法计算所述产品查询特征词集对应的产品查询特征向量以及所述预设产品特征词集对应的预设产品特征向量；利用预设相似度计算公式计算所述产品查询特征向量与所述预设产品特征向量的第一相似度。
根据权利要求11所述的计算机可读存储介质，其中，所述计算机程序被处理器执行时还实现以下步骤：计算所述产品查询特征词集中每个产品查询特征词对所述产品查询文本的第一权重值以及所述预设产品特征词集中的每个预设产品特征词对所述预设产品文本的第二权重值；构建包括所述产品查询特征词与对应所述第一权重值的产品查询特征向量，以及构建包括所述预设产品特征词与对应所述第二权重值的预设产品特征向量。
根据权利要求11所述的计算机可读存储介质，其中，所述计算机程序被处理器执行时还实现以下步骤：计算所述标识特征词集与所述产品查询特征词集的第一交集，以及所述描述特征词集与所述产品查询特征词集的第二交集；根据所述第一交集计算所述标识特征词集相对于所述产品查询特征词集的第三权重值，以及根据所述第二交集计算所述描述特征词集相对于所述产品查询特征词集的第四权重值；利用预设系数加权所述第三权重值与所述第四权重值得到所述推荐产品文本与所述产品查询文本的加权相似值。
根据权利要求10所述的计算机可读存储介质，其中，所述计算机程序被处理器执行时还实现以下步骤：利用预设相关系数计算公式计算所述查询用户与其他用户的相关系数，将所述相关系数大于第一预设阈值的其他用户确定为邻居用户；将所述邻居用户的行为集与所述查询用户的行为集的差确定为待预测行为集；根据k近邻算法或k-means算法计算所述待预测行为集与其他行为集的第二相似度，将所述第二相似度大于第二预设阈值的其他行为集确定为相邻行为集。
根据权利要求14所述的计算机可读存储介质，其中，所述计算机程序被处理器执行时还实现以下步骤：基于用户的协同过滤算法计算所述查询用户对所述待预测行为集的第一评分；基于项的协同过滤算法计算所述查询用户对所述相邻行为集的第二评分；根据所述第一评分和/或所述第二评分确定第二推荐结果。
根据权利要求10所述的计算机可读存储介质，其中，所述计算机程序被处理器执行时还实现以下步骤：计算所述第一推荐结果对应产品与所述第二推荐结果对应产品的并集产品；利用预设第三系数加权所述并集产品的加权相似值与评分，得到目标推荐值；根据所述目标推荐值由大到小的顺序排序得到目标产品推荐结果。
一种计算机程序产品，包括计算机程序，其中，该计算机程序被处理器执行时实现以下步骤：

获取查询用户发送的针对目标产品的产品查询文本，利用预设分词技术与TF-IDF算法计算所述产品查询文本与预设产品文本的第一相似度，将对应所述第一相似度大于预设相似度阈值的预设产品文本确定为推荐产品文本；

提取所述推荐产品文本的标识特征词集与描述特征词集，根据所述标识特征词集与所述描述特征词集计算所述推荐产品文本与所述产品查询文本的加权相似值，并按照所述加权相似值由大到小的顺序形成第一推荐结果；

确定与所述查询用户行为相关性高于第一预设阈值的邻居用户，以及所述邻居用户针对产品的历史行为集合，基于协同过滤算法计算所述查询用户对所述历史行为集合的评分，并根据所述评分确定第二推荐结果；

根据所述第一推荐结果与所述第二推荐结果确定目标产品推荐结果。
根据权利要求17所述的计算机程序产品，其中，所述计算机程序被处理器执行时实现以下步骤：根据预设分词技术对所述产品查询文本进行分词处理得到产品查询特征词集，对所述预设产品文本进行分词处理得到预设产品特征词集；利用TF-IDF算法计算所述产品查询特征词集对应的产品查询特征向量以及所述预设产品特征词集对应的预设产品特征向量；利用预设相似度计算公式计算所述产品查询特征向量与所述预设产品特征向量的第一相似度。
根据权利要求18所述的计算机程序产品，其中，所述计算机程序被处理器执行时实现以下步骤：计算所述产品查询特征词集中每个产品查询特征词对所述产品查询文本的第一权重值以及所述预设产品特征词集中的每个预设产品特征词对所述预设产品文本的第二权重值；构建包括所述产品查询特征词与对应所述第一权重值的产品查询特征向量，以及构建包括所述预设产品特征词与对应所述第二权重值的预设产品特征向量。
根据权利要求18所述的计算机程序产品，其中，所述计算机程序被处理器执行时实现以下步骤：计算所述标识特征词集与所述产品查询特征词集的第一交集，以及所述描述特征词集与所述产品查询特征词集的第二交集；根据所述第一交集计算所述标识特征词集相对于所述产品查询特征词集的第三权重值，以及根据所述第二交集计算所述描述特征词集相对于所述产品查询特征词集的第四权重值；利用预设系数加权所述第三权重值与所述第四权重值得到所述推荐产品文本与所述产品查询文本的加权相似值。