CN111274393A - 关于物品的知识库的构建方法、装置及计算设备 - Google Patents
关于物品的知识库的构建方法、装置及计算设备 Download PDFInfo
- Publication number
- CN111274393A CN111274393A CN202010054034.4A CN202010054034A CN111274393A CN 111274393 A CN111274393 A CN 111274393A CN 202010054034 A CN202010054034 A CN 202010054034A CN 111274393 A CN111274393 A CN 111274393A
- Authority
- CN
- China
- Prior art keywords
- efficacy
- emotional tendency
- dimension
- component
- text data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000002996 emotional effect Effects 0.000 claims abstract description 179
- 238000011156 evaluation Methods 0.000 claims abstract description 60
- 238000010276 construction Methods 0.000 claims abstract description 3
- 230000008451 emotion Effects 0.000 claims description 64
- 239000013598 vector Substances 0.000 claims description 60
- 230000006399 behavior Effects 0.000 claims description 18
- 238000004891 communication Methods 0.000 claims description 15
- 238000002372 labelling Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 238000009411 base construction Methods 0.000 abstract 1
- 230000007935 neutral effect Effects 0.000 description 10
- 238000012549 training Methods 0.000 description 9
- 230000003020 moisturizing effect Effects 0.000 description 8
- 210000003205 muscle Anatomy 0.000 description 7
- 206010013786 Dry skin Diseases 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000037336 dry skin Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 208000002874 Acne Vulgaris Diseases 0.000 description 2
- 206010039792 Seborrhoea Diseases 0.000 description 2
- 206010000496 acne Diseases 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 230000037312 oily skin Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000036555 skin type Effects 0.000 description 2
- 230000002087 whitening effect Effects 0.000 description 2
- 241000700647 Variola virus Species 0.000 description 1
- 230000003712 anti-aging effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 229940093882 musclecare Drugs 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例涉及知识库构建技术领域,公开了一种关于物品的知识库的构建方法、装置及计算设备,该方法包括:获取目标物品对应的情感倾向文本数据;确定情感倾向文本数据指示的第一功效维度和第一功效维度对应的情感倾向估值;根据目标物品对应的各第一情感倾向文本数据对应的情感倾向估值,确定目标物品在第一功效维度上的功效估值;获取目标物品对应的成分数据,确定成分数据包含的成分标签;确定目标物品在各成分标签维度上的成分标签估值;根据各目标物品在各功效维度上的功效估值,以及,各目标物品在各成分标签维度上的成分标签估值,构建关于各目标物品的成分和功效的知识库。通过上述方式,本发明实施例实现了关于物品的知识库的构建。
Description
技术领域
本发明实施例涉及皮肤护理技术领域,具体涉及一种关于物品的知识库的构建方法、装置及计算设备。
背景技术
美容护肤领域越来越受到重视,选择适合自己需求的护肤品是很多消费者关心的话题。然而,市场上各种护肤品繁多,用户无法选择到自己真正需要的护肤品。商家的过度营销使得用户很难考证护肤品功效的真实性。
发明内容
鉴于上述问题,本发明实施例提供了一种关于物品的知识库的构建方法、装置及计算设备,克服了上述问题或者至少部分地解决了上述问题。
根据本发明实施例的一个方面,提供了一种关于物品的知识库的构建方法,其特征在于,包括:
获取目标物品对应的情感倾向文本数据,所述情感倾向文本数据用于表征用户在一个或多个功效维度上对所述目标物品的情感倾向;
确定所述情感倾向文本数据指示的第一功效维度和所述第一功效维度对应的情感倾向估值;
根据所述目标物品对应的各第一情感倾向文本数据对应的情感倾向估值,确定所述目标物品在所述第一功效维度上的功效估值,所述第一情感倾向文本数据为指示所述第一功效维度的情感倾向文本数据;
获取目标物品对应的成分数据,并确定所述成分数据包含的成分标签;
根据所述成分数据包含的成分标签,确定所述目标物品在各成分标签维度上的成分标签估值;
根据各目标物品在各功效维度上的功效估值,以及,各目标物品在各成分标签维度上的成分标签估值,构建有关于各目标物品的成分和功效的知识库。
可选的,所述根据所述成分数据包含的成分标签,确定所述目标物品在各成分标签维度上的成分标签估值,包括:
统计第一成分数据的数量,所述第一成分数据为所述成分数据中包含有第一成分标签的成分数据,所述第一成分标签为预设的任一成分标签;
将第一成分数据的数量确定为所述目标物品在所述第一成分标签上的成分标签估值。
可选的,所述功效估值包括功能功效估值和用户特征功效估值;
所述根据所述目标物品对应的各第一情感倾向文本数据对应的情感倾向估值,确定所述目标物品在所述第一功效维度上的功效估值,包括:
根据所述目标物品对应的各第一情感倾向文本数据对应的情感倾向估值之和,确定所述目标物品在所述第一功效维度上的功能功效估值;
根据所述目标物品对应的,且符合第一用户特征的用户对应的各第一情感倾向文本数据对应的情感倾向估值之和,确定所述目标物品在所述第一功效维度上的第一特征功效估值,所述第一特征功效估值为所述目标物品在所述第一用户特征上的特征功效估值。
可选的,所述确定所述情感倾向文本数据指示的第一功效维度和所述第一功效维度对应的情感倾向估值,包括:
确定所述情感倾向文本数据对应的字向量和句向量;
根据所述情感倾向文本数据对应的字向量确定所述情感倾向文本数据指示的第一功效维度,并根据所述第一功效维度对应的句向量确定所述第一功效维度对应的情感倾向估值。
可选的,所述确定所述情感倾向文本数据对应的字向量和句向量,包括:
将所述情感倾向文本数据输入编码模型,得到所述情感倾向文本数据对应的字向量和句向量;
所述根据所述情感倾向文本数据对应的字向量确定所述情感倾向文本数据指示的第一功效维度,并根据所述第一功效维度对应的句向量确定所述第一功效维度对应的情感倾向估值,包括:
将所述字向量输入标注模型,得到所述情感倾向文本数据对应的BIO标注,并根据所述BIO标注确定所述情感倾向文本数据指示的第一功效维度;
将所述第一功效维度对应的句向量输入情感分析模型,得到所述第一功效维度对应的情感分类标签估值,将第一功效维度对应的情感分类标签估值之和确定为所述第一功效维度对应的情感倾向估值。
可选的,所述方法还包括:根据用户维度信息和所述知识库,确定所述知识库中各物品的评价分值;
基于所述评价分值向用户推荐所述知识库中的物品。
可选的,所述用户维度信息包括用户喜好信息、用户行为信息、用户所处环境信息以及用户热度信息中的至少一种信息;
所述根据目标用户对应的用户维度信息和所述知识库,确定所述知识库中各物品的评价分值,包括:
根据所述用户喜好信息、用户行为信息、用户所处环境信息以及用户热度信息中的至少一种信息,对知识库中的各物品的功效估值和成分标签估值进行调整和加权,以确定所述知识库中各物品的评价分值。
根据本发明实施例的另一方面,提供了一种关于物品的知识库的构建装置,所述装置包括:
第一获取模块,用于获取目标物品对应的情感倾向文本数据,所述情感倾向文本数据用于表征用户在一个或多个功效维度上对所述目标物品的情感倾向;
第一确定模块,用于确定所述情感倾向文本数据指示的第一功效维度和所述第一功效维度对应的情感倾向估值;
第二确定模块,用于根据所述目标物品对应的各第一情感倾向文本数据对应的情感倾向估值,确定所述目标物品在所述第一功效维度上的功效估值,所述第一情感倾向文本数据为指示所述第一功效维度的情感倾向文本数据;
第二获取模块,用于获取目标物品对应的成分数据,并确定所述成分数据包含的成分标签;
第三确定模块,用于根据所述成分数据包含的成分标签,确定所述目标物品在各成分标签维度上的成分标签估值;
构建模块,用于根据各目标物品在各功效维度上的功效估值,以及,各目标物品在各成分标签维度上的成分标签估值,构建有关于各目标物品的成分和功效的知识库。
根据本发明实施例的又一方面,提供了一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述的一种关于物品的知识库的构建方法的步骤。
根据本发明实施例的又一方面,提供了一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行上述的一种关于物品的知识库的构建方法的步骤。
通过本发明实施例,根据获取的目标物品的情感倾向文本数据确定了目标物品对应的各第一情感倾向文本数据对应的情感倾向估值,根据情感倾向估值确定目标物品在各功效维度上的功效估值;根据目标物品对应的成分数据,确定了目标物品在各成分标签维度上的成分标签估值,根据功效估值和成分标签估值构建了各目标物品的成分和功效的知识库,由于在构建知识库的过程中获取了表征用户的情感倾向的倾向文本数据以确定物品的各种功效,符合用户的情感倾向,使得知识库中的物品功效更为客观真实,便于用户可以根据知识库了解物品的真实功效和成分。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种关于物品的知识库的构建方法的流程图;
图2示出了本发明另一实施例提供的一种关于物品的知识库的构建方法的流程图;
图3示出了本发明实施例提供的一种关于物品的知识库的构建装置的功能框图;
图4示出了本发明实施例提供的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了本发明实施例的一种关于物品的知识库的构建方法的流程图。如图1所示,该方法包括以下步骤:
步骤110:获取目标物品对应的情感倾向文本数据。
其中,目标物品是用于构建知识库的多个物品中的任意一个物品,该知识库为用于存储有关于物品的各种功效和成分的数据库。情感倾向文本数据用于表征用户在一个或多个功效维度上对目标物品的情感倾向。功效维度用于表征目标物品的功效。一个功效维度用于表征目标物品的一个功效。情感倾向用于表征用户对目标物品在一个或多个功效维度上的认可度。在本发明实施例中,情感倾向包括:正向情感、负向情感和中性情感三种。其中,正向情感表示目标物品关于该功效维度所对应的功效显著;负向情感表示目标物品不具有该功效维度所对应的功效,中性情感表示目标物品关于该功效维度所对应的功效一般。
以目标物品为多款护肤产品中任意一款护肤产品为例,功效维度可以为护肤产品具有的功效,例如,一个功效维度可以为“美白”、“清洁”、“保湿”等功效中的任意一个。情感倾向文本数据为用户对该款护肤品的评价。该评价可以从购物网站获取,也可以从针对该款护肤品的问卷调查中获取,本发明实施例并不限定情感倾向文本的获取方式。例如,情感倾向文本数据为“该产品的保湿功效特别强大”,则其中包含的功效维度为“保湿”,发表该评论的用户对“保湿”这一预设的功效维度的情感倾向为正向情感。
步骤120:确定情感倾向文本数据指示的第一功效维度和第一功效维度对应的情感倾向估值。
其中,第一功效维度为情感倾向文本数据中所表征出来的功效温度。例如,情感倾向文本数据为“该产品的保湿功效特别强大”,则该情感倾向文本数据指示的第一功效维度为“保湿”。第一功效维度对应的情感倾向估值为基于该情感倾向文本数据所确定的该情感倾向文本关于第一功效维度的情感倾向得分。在本发明实施例中,同一种情感倾向对应的情感倾向得分相同,不同的情感倾向对应的情感倾向得分不同。例如,正向情感得分为1分,负向情感得分为-1分,中性情感得分为0。
步骤130:根据目标物品对应的各第一情感倾向文本数据对应的情感倾向估值,确定目标物品在第一功效维度上的功效估值。
其中,第一情感倾向文本数据为指示第一功效维度的情感倾向文本数据。在本发明实施例中,功效估值包括功能功效估值和用户特征功效估值。功能功效估值由目标物品对应的各第一情感倾向文本数据对应的情感倾向估值之和确定。从目标物品对应的所有情感倾向文本中筛选出指示第一功效维度的情感倾向文本,根据步骤120确定各第一情感倾向文本对应的情感倾向估值。将各第一情感倾向文本对应的情感倾向估值累加,得到目标物品在第一功效维度上的功能功效估值。例如,目标物品对应的第一倾向文本数据为10个,每一个第一情感倾向文本数据中均包含第一功效维度。其中,关于第一功效维度的情感倾向为正向情感的第一情感倾向文本有6个,关于第一功效维度的情感倾向为负向情感的第一情感倾向文本有2个,关于第一功效维度的情感倾向为中性情感的第一情感倾向文本有2个。正向情感得分为1分,负向情感得分为-1分,中性情感得分为0分。则目标物品在第一功效维度上的功能功效估值为6-2+0=4分。
目标物品在第一功效维度上的第一特征功效估值为目标物品对应的,且符合第一用户特征的用户对应的各第一情感倾向文本数据对应的情感倾向估值之和。第一特征功效估值为目标物品在第一用户特征上的特征功效估值。其中,第一用户特征是本领域技术人员在实施本发明实施例时人为定义的特征。以护肤品为例,第一用户特征可以为用户的肤质中的任一种肤质,例如,油性肤质、干性肤质或中性肤质中的任意一种。第一功效维度为“保湿”,第一情感倾向文本为包含“保湿”这一第一功效维度的情感倾向文本,第一用户特征为“干性肤质”。假设第一情感倾向文本的数量为20个,其中,满足“干性肤质”的用户对应的第一情感倾向文本的数量为8个。8个第一情感倾向文本数据中情感倾向为正向情感的第一情感倾向文本有5个,情感倾向为负向情感的第一情感倾向文本有2个,情感倾向为中性情感的第一情感倾向文本有1个。正向情感得分为1分,负向情感得分为-1分,中性情感得分为0分,则该护肤品在“保湿”功效维度上的第一特征功效估值为5-2+0=3分。
步骤140:获取目标物品对应的成分数据,并确定成分数据包含的成分标签。
在本步骤中,目标物品对应的成分数据为目标物品包含的各个成分,一个成分数据对应于目标物品的一个成分。成分标签是根据目标物品的成分预先定义的。本发明实施例并不限定成分标签的数量以及每一个成分标签表示的具体含义。如果目标物品对应的成分数据中包含至少一个成分标签对应的成分,则确定成分数据包含该至少一个成分标签。以目标物品为护肤品为例,成分标签可以包括:孕妇慎用、敏感肌慎用、痘痘肌慎用等标签。如果一款护肤品中包含痘痘肌慎用的成分,则该护肤品的成分数据包含“痘痘肌慎用”这一成分标签。
步骤150:根据成分数据包含的成分标签,确定目标物品在各成分标签维度上的成分标签估值。
在本步骤中,目标物品在各成分标签维度上的成分标签估值是由成分数据中包含成分标签的成分数据的数量决定的。将统计得到的第一成分数据的数量作为目标物品在第一成分标签上的成分标签估值。其中,第一成分数据为成分数据中包含有第一成分标签的成分数据,第一成分标签为预设的任一成分标签。以目标物品为一款护肤品为例,如果该款护肤品的所有成分中属于“孕妇慎用”的成分有三种,则该款护肤品在“孕妇慎用”这一成分标签的成分标签估值为3分。统计目标物品对应于各成分标签的成分数据的数量,得到目标物品在各成分标签维度上的成分标签估值。
步骤160:根据各目标物品在各功效维度上的功效估值,以及,各目标物品在各成分标签维度上的成分标签估值,构建关于各目标物品的成分和功效的知识库。
在本步骤中,构建的知识库中存储有目标物品、该目标物品在各功效维度上的功效估值以及该目标物品在各成分标签维度上的成分标签估值。其中,功效估值包括功能功效估值和用户特征功效估值。以目标物品为护肤品,功效维度为“孕妇慎用”、“敏感肌慎用”、“痘痘肌慎用慎用”,预设的用户特征包括“干性肤质”、“油性肤质”和“中性肤质”,成分标签维度为“保湿”、“抗衰老”、“美白”为例,构建的表格形式的知识库如下表1所示:
表1
通过本发明实施例,根据获取的目标物品的情感倾向文本数据确定了目标物品对应的各第一情感倾向文本数据对应的情感倾向估值,根据情感倾向估值确定目标物品在各功效维度上的功效估值;根据目标物品对应的成分数据,确定了目标物品在各成分标签维度上的成分标签估值,根据功效估值和成分标签估值构建了各目标物品的成分和功效的知识库,由于在构建知识库的过程中获取了表征用户的情感倾向的倾向文本数据以确定物品的各种功效,符合用户的情感倾向,使得知识库中的物品功效更为客观真实,便于用户可以根据知识库了解物品的真实功效和成分。
在一些实施例中,上述实施例中的步骤120进一步包括如图2所示的如下步骤:
步骤210:确定情感倾向文本数据对应的字向量和句向量。
在本步骤中,将情感倾向文本数据输入编码模型,得到情感倾向文本数据对应的字向量和句向量。其中,编码模型为BERT模型。BERT模型是一种自然语言处理(NaturalLanguage Processing,NLP)模型,该模型用于提取输入的文本中每一个字对应的字向量和句向量。
步骤220:根据情感倾向文本数据对应的字向量和句向量确定情感倾向文本数据指示的第一功效维度,并根据第一功效维度对应的句向量确定第一功效维度对应的情感倾向估值。
在本步骤中,将步骤110得到的字向量输入标注模型,得到情感倾向文本数据对应的BIO标注,并根据BIO标注确定情感倾向文本数据指示的第一功效维度。将第一功效维度对应的句向量输入情感分析模型,得到第一功效维度对应的情感分类标签估值,将第一功效维度对应的情感分类标签估值之和确定为第一功效维度对应的情感倾向估值。
其中,标注模型是通过多组训练数据训练条件随机场(conditional randomfield,CRF)得到的。CRF模型可以在NLP领域对输入文本进行实体标注。在本发明实施例中,实体为各功效维度,对各功效维度使用BIO标注。在BIO标注时,各功效维度的第一个字标注为B,各功效维度的其余字标注为I,各功效维度之外的字标注为O。其中,B和I对应的标注后缀对应的功效维度。例如,一个情感倾向文本数据为“这个产品在保湿方面做得非常好。同时我觉得用了之后皮肤也变得白了一些”,则在将情感倾向文本数据对应的字向量输入标注模型后,得到的标注后的情感倾向文本数据为“这(O)个(O)产(O)品(O)在(O)保(B-保湿)湿(I-保湿)方(O)面(O)做(O)得(O)非(O)常(O)好(O)。同(O)时(O)我(O)觉(O)得(O)用(O)了(O)之(O)后(O)皮(O)肤(O)也(O)变(B-美白)得(I-美白)白(I-美白)了(I-美白)一(O)些(O)”。
在训练CRF模型时,每一组训练数据均包括字向量和该字向量对应的BIO标注。在具体实施过程中,可以通过CRF++工具包进行模型的训练,以得到标注模型。标注模型训练完成后,将情感倾向文本数据对应的字向量输入标注模型中,得到评论文本字向量对应的BIO标注。
第一功效维度对应的句向量是BIO标注中包含B和I的字向量所在句向量。将第一功效维度对应的句向量输入情感分析模型,得到每一个评论文本对应的情感标签。其中,情感分析模型是训练卷积神经网络模型得到的。在进行训练时,训练数据为各第一功效维度对应的句向量及该句向量中包含的功效维度对应的情感分类标签估值。情感分类标签估值用于表示该句向量关于该功效维度的情感倾向,包括正向情感、负向情感和中性情感。训练完成后,得到卷积神经网络每一层神经元之间的参数。包含该参数的卷积神经网络的架构组成情感分析模型。将第一功效维度对应的句向量输入情感分析模型之后,得到该句向量中包含的第一功效维度属于每一种情感分类标签估值的概率,概率最大值对应的情感分类标签估值为第一功效维度所属的句向量对应的情感分类标签估值。
将同一个功效维度对应的所有情感分类标签估值累加,得到每一个功效维度对应的情感倾向估值。例如,第一功效维度中情感标签估值为a1的情感倾向文本数据有m1个,情感标签估值为a2的情感倾向文本数据有m2个,情感标签估值为a3的情感倾向文本数据有m3个,则第一功效维度对应的情感倾向估值为:a1×m1+a2×m2+a3×m3。
通过上述方式,本发明实施例实现了计算情感倾向文本数据指示的各功效维度中每一个功效维度对应的情感倾向估值,且计算过程通过各模型得到,在大量情感倾向文本数据处理中,无需人工操作,节省了人力成本。
在一些实施例中,在构建知识库后,根据用户维度信息和构建的知识库,确定知识库中各物品的评价分值,并基于该评价分值向用户推荐知识库中的物品。其中,用户维度信息包括用户喜好信息、用户行为信息、用户所处环境信息以及用户热度信息中的至少一种信息。用户喜好信息根据用户在购物网站上是否存在负向情感的情感倾向文本数据确定。如果在购物网站上存在该用户对物品负向情感的用户行为信息,则确定用户不喜欢该物品,否则,确定用户喜欢该物品。用户行为信息通过用户在购物网站上浏览各物品时的行为获取,例如,浏览各物品的停留时间、用户是否点赞、用户对各物品的评价星级等。用户所处的环境信息是用户所处的季节,各物品的适用季节是人为进行标注的。用户热度信息是根据各物品的流行趋势确定的。在具体实施过程中,可以从购物网站上获取各样品的热度排名,根据热度排名确定各物品的热度信息。
在确定各物品的评价分值时,每一个用户信息有一个相应的分数。例如,对于用户喜好信息,如果用户不喜欢某一物品,则该物品对应的用户喜好分数为0,否则,该物品对应的用户喜好分数为1。用户行为信息对应的分数通过用户的各个行为确定。每一种用户行为对应一个权重,各用户行为的得分及其对应的权重的加权结果为用户分数。各用户行为的分数可以进行人为设置,每一种用户行为对应的权重也可以人为设置,本发明实施例并不以此为限。例如,用户浏览一个物品的停留时间小于预设时间阈值时对应的停留时间得分为0,用户停留时间大于或等于预设时间阈值时对应的停留时间得分为1。用户点赞时,点赞行为得分为1,用户未点赞时,点赞行为得分为0。用户对物品的评价星级为0-5星,根据用户对物品的评价星级,除以5,得到用户评价星级对应的分数。适用于当前季节的物品的用户所处的环境分数为1,不适用于当前季节的物品的用户所处的环境分数为0。用户热度分数是根据各物品的热度排名分别为1-10,则热度排名第一的物品的热度分数为1,热度排名为10的物品的热度分数为0,中间排名第二的样品至排名第九的物品分数依次为8/9~1/9。各用户维度信息、各物品的功效估值和成分标签估值分别对应一个预设的权重,根据该预设的权重将用户维度信息、各物品的功效估值和成分标签估值进行加权,得到知识库中各物品的评价分值。其中,权重用于表示用户维度信息、功效估值和成分标签估值所占的比重。由于成分标签估值越高,越容易导致使用问题。例如,护肤品中包含“痘痘肌慎用”的成分越多,成分标签估值越高,越容易造成痘痘肌。因此,成分标签估值对应的权重为负值。假设某一物品的用户维度信息对应的分数为s1,功效估值为s2,成分标签估值为s3,用户维度信息、功效估值、成分标签估值对应的权重分别表示为w1、w2和w3,则该物品的评价分值为:s1×w1+s2×w2+s3×w3。通过上述方式,在确定各物品的评价分值时,综合考虑了用户信息和产品信息,便于根据评价分值为用户选择合适的物品。
图3示出了本发明实施例的一种护肤产品推荐装置的功能框图。如图3所示,该装置包括:第一获取模块310、第一确定模块320、第二确定模块330、第二获取模块340、第三确定模块350、构建模块360。
第一获取模块310,第一获取模块,用于获取目标物品对应的情感倾向文本数据,所述情感倾向文本数据用于表征用户在一个或多个功效维度上对所述目标物品的情感倾向;
第一确定模块320,用于确定所述情感倾向文本数据指示的第一功效维度和所述第一功效维度对应的情感倾向估值,所述第一功效维度为所述多个功效维度中的其中一个功效维度;
第二确定模块330,用于根据所述目标物品对应的各第一情感倾向文本数据对应的情感倾向估值,确定所述目标物品在所述第一功效维度上的功效估值,所述第一情感倾向文本数据为指示所述第一功效维度的情感倾向文本数据;
第二获取模块340,用于获取目标物品对应的成分数据,并确定所述成分数据包含的成分标签;
第三确定模块350,用于根据所述成分数据包含的成分标签,确定所述目标物品在各成分标签维度上的成分标签估值;
构建模块360,用于根据各目标物品在各功效维度上的功效估值,以及,各目标物品在各成分标签维度上的成分标签估值,构建有关于各目标物品的成分和功效的知识库。
在一种可选的方式中,第三确定模块350进一步用于:
统计第一成分数据的数量,所述第一成分数据为所述成分数据中包含有第一成分标签的成分数据,所述第一成分标签为预设的任一成分标签;
将第一成分数据的数量确定为所述目标物品在所述第一成分标签上的成分标签估值。
在一种可选的方式中,所述功效估值包括功能功效估值和用户特征功效估值;
所述第一确定模块320进一步用于:
根据所述目标物品对应的各第一情感倾向文本数据对应的情感倾向估值之和,确定所述目标物品在所述第一功效维度上的功能功效估值;
根据所述目标物品对应的,且符合第一用户特征的用户对应的各第一情感倾向文本数据对应的情感倾向估值之和,确定所述目标物品在所述第一功效维度上的第一特征功效估值,所述第一特征功效估值为所述目标物品在所述第一用户特征上的特征功效估值,所述第一用户特征为预设的多个用户特征中的任意一个用户特征。
在一种可选的方式中,第一确定模块320进一步用于:
确定所述情感倾向文本数据对应的字向量和句向量;
根据所述情感倾向文本数据对应的字向量确定所述情感倾向文本数据指示的第一功效维度,并根据所述第一功效维度对应的句向量确定所述第一功效维度对应的情感倾向估值。
在一种可选的方式中,第一确定模块320进一步用于:
将所述情感倾向文本数据输入编码模型,得到所述情感倾向文本数据对应的字向量和句向量;
所述根据所述情感倾向文本数据对应的字向量确定所述情感倾向文本数据指示的第一功效维度,并根据所述第一功效维度对应的句向量确定所述第一功效维度对应的情感倾向估值,包括:
将所述字向量输入标注模型,得到所述情感倾向文本数据对应的BIO标注,并根据所述BIO标注确定所述情感倾向文本数据指示的第一功效维度;
将所述第一功效维度对应的句向量输入情感分析模型,得到所述第一功效维度对应的情感分类标签估值,将第一功效维度对应的情感分类标签估值之和确定为所述第一功效维度对应的情感倾向估值。
在一种可选的方式中,所述装置还包括第四确定模块370,用于根据用户维度信息和所述知识库,确定所述知识库中各物品的评价分值;推荐模块380,用于基于所述评价分值向用户推荐所述知识库中的物品。
在一种可选的方式中,所述用户维度信息包括用户喜好信息、用户行为信息、用户所处环境信息以及用户热度信息中的至少一种信息;
所述第四确定模块370进一步用于:
根据所述用户喜好信息、用户行为信息、用户所处环境信息以及用户热度信息中的至少一种信息,对知识库中的各物品的功效估值和成分标签估值进行调整和加权,以确定所述知识库中各物品的评价分值。
通过本发明实施例,根据获取的目标物品的情感倾向文本数据确定了目标物品对应的各第一情感倾向文本数据对应的情感倾向估值,根据情感倾向估值确定目标物品在各功效维度上的功效估值;根据目标物品对应的成分数据,确定了目标物品在各成分标签维度上的成分标签估值,根据功效估值和成分标签估值构建了各目标物品的成分和功效的知识库,便于用户根据该知识库查询符合需求的目标物品。
本发明实施例提供了一种非易失性计算机可读存储介质,所述计算机可读存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的一种关于物品的知识库的构建方法的步骤。
图4示出了本发明实施例的一种计算设备结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图4所示,该计算设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。处理器402,用于执行程序410,具体可以执行上述用于护肤产品推荐方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行图1中的步骤110~步骤160,图2中的步骤210~步骤220,以及实现图3中的模块310~模块380的功能。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (10)
1.一种关于物品的知识库的构建方法,其特征在于,包括:
获取目标物品对应的情感倾向文本数据,所述情感倾向文本数据用于表征用户在一个或多个功效维度上对所述目标物品的情感倾向;
确定所述情感倾向文本数据指示的第一功效维度和所述第一功效维度对应的情感倾向估值;
根据所述目标物品对应的各第一情感倾向文本数据对应的情感倾向估值,确定所述目标物品在所述第一功效维度上的功效估值,所述第一情感倾向文本数据为指示所述第一功效维度的情感倾向文本数据;
获取目标物品对应的成分数据,并确定所述成分数据包含的成分标签;
根据所述成分数据包含的成分标签,确定所述目标物品在各成分标签维度上的成分标签估值;
根据各目标物品在各功效维度上的功效估值,以及,各目标物品在各成分标签维度上的成分标签估值,构建有关于各目标物品的成分和功效的知识库。
2.根据权利要求1所述的方法,其特征在于,所述根据所述成分数据包含的成分标签,确定所述目标物品在各成分标签维度上的成分标签估值,包括:
统计第一成分数据的数量,所述第一成分数据为所述成分数据中包含有第一成分标签的成分数据,所述第一成分标签为预设的任一成分标签;
将第一成分数据的数量确定为所述目标物品在所述第一成分标签上的成分标签估值。
3.根据权利要求1所述的方法,其特征在于,所述功效估值包括功能功效估值和用户特征功效估值;
所述根据所述目标物品对应的各第一情感倾向文本数据对应的情感倾向估值,确定所述目标物品在所述第一功效维度上的功效估值,包括:
根据所述目标物品对应的各第一情感倾向文本数据对应的情感倾向估值之和,确定所述目标物品在所述第一功效维度上的功能功效估值;
根据所述目标物品对应的,且符合第一用户特征的用户对应的各第一情感倾向文本数据对应的情感倾向估值之和,确定所述目标物品在所述第一功效维度上的第一特征功效估值,所述第一特征功效估值为所述目标物品在所述第一用户特征上的特征功效估值。
4.根据权利要求1所述的方法,其特征在于,所述确定所述情感倾向文本数据指示的第一功效维度和所述第一功效维度对应的情感倾向估值,包括:
确定所述情感倾向文本数据对应的字向量和句向量;
根据所述情感倾向文本数据对应的字向量确定所述情感倾向文本数据指示的第一功效维度,并根据所述第一功效维度对应的句向量确定所述第一功效维度对应的情感倾向估值。
5.根据权利要求4所述的方法,其特征在于,所述确定所述情感倾向文本数据对应的字向量和句向量,包括:
将所述情感倾向文本数据输入编码模型,得到所述情感倾向文本数据对应的字向量和句向量;
所述根据所述情感倾向文本数据对应的字向量确定所述情感倾向文本数据指示的第一功效维度,并根据所述第一功效维度对应的句向量确定所述第一功效维度对应的情感倾向估值,包括:
将所述字向量输入标注模型,得到所述情感倾向文本数据对应的BIO标注,并根据所述BIO标注确定所述情感倾向文本数据指示的第一功效维度;
将所述第一功效维度对应的句向量输入情感分析模型,得到所述第一功效维度对应的情感分类标签估值,将第一功效维度对应的情感分类标签估值之和确定为所述第一功效维度对应的情感倾向估值。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:根据用户维度信息和所述知识库,确定所述知识库中各物品的评价分值;
基于所述评价分值向用户推荐所述知识库中的物品。
7.根据权利要求6所述的方法,其特征在于,所述用户维度信息包括用户喜好信息、用户行为信息、用户所处环境信息以及用户热度信息中的至少一种信息;
所述根据目标用户对应的用户维度信息和所述知识库,确定所述知识库中各物品的评价分值,包括:
根据所述用户喜好信息、用户行为信息、用户所处环境信息以及用户热度信息中的至少一种信息,对知识库中的各物品的功效估值和成分标签估值进行调整和加权,以确定所述知识库中各物品的评价分值。
8.一种关于物品的知识库的构建装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标物品对应的情感倾向文本数据,所述情感倾向文本数据用于表征用户在一个或多个功效维度上对所述目标物品的情感倾向;
第一确定模块,用于确定所述情感倾向文本数据指示的第一功效维度和所述第一功效维度对应的情感倾向估值;
第二确定模块,用于根据所述目标物品对应的各第一情感倾向文本数据对应的情感倾向估值,确定所述目标物品在所述第一功效维度上的功效估值,所述第一情感倾向文本数据为指示所述第一功效维度的情感倾向文本数据;
第二获取模块,用于获取目标物品对应的成分数据,并确定所述成分数据包含的成分标签;
第三确定模块,用于根据所述成分数据包含的成分标签,确定所述目标物品在各成分标签维度上的成分标签估值;
构建模块,用于根据各目标物品在各功效维度上的功效估值,以及,各目标物品在各成分标签维度上的成分标签估值,构建有关于各目标物品的成分和功效的知识库。
9.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行根据权利要求1-7任一项所述的一种关于物品的知识库的构建方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行根据权利要求1-7任一项所述的一种关于物品的知识库的构建方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010054034.4A CN111274393B (zh) | 2020-01-17 | 2020-01-17 | 关于物品的知识库的构建方法、装置及计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010054034.4A CN111274393B (zh) | 2020-01-17 | 2020-01-17 | 关于物品的知识库的构建方法、装置及计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111274393A true CN111274393A (zh) | 2020-06-12 |
CN111274393B CN111274393B (zh) | 2024-04-09 |
Family
ID=71003807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010054034.4A Active CN111274393B (zh) | 2020-01-17 | 2020-01-17 | 关于物品的知识库的构建方法、装置及计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111274393B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469282A (zh) * | 2015-12-01 | 2016-04-06 | 成都知数科技有限公司 | 基于文本评论的线上品牌评估方法 |
CN109408809A (zh) * | 2018-09-25 | 2019-03-01 | 天津大学 | 一种基于词向量的针对汽车产品评论的情感分析方法 |
CN109544394A (zh) * | 2018-11-06 | 2019-03-29 | 北京腾云天下科技有限公司 | 一种旅游地评估方法和计算设备 |
CN109635291A (zh) * | 2018-12-04 | 2019-04-16 | 重庆理工大学 | 一种基于协同训练的融合评分信息和物品内容的推荐方法 |
CN110287341A (zh) * | 2019-06-26 | 2019-09-27 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及可读存储介质 |
-
2020
- 2020-01-17 CN CN202010054034.4A patent/CN111274393B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105469282A (zh) * | 2015-12-01 | 2016-04-06 | 成都知数科技有限公司 | 基于文本评论的线上品牌评估方法 |
CN109408809A (zh) * | 2018-09-25 | 2019-03-01 | 天津大学 | 一种基于词向量的针对汽车产品评论的情感分析方法 |
CN109544394A (zh) * | 2018-11-06 | 2019-03-29 | 北京腾云天下科技有限公司 | 一种旅游地评估方法和计算设备 |
CN109635291A (zh) * | 2018-12-04 | 2019-04-16 | 重庆理工大学 | 一种基于协同训练的融合评分信息和物品内容的推荐方法 |
CN110287341A (zh) * | 2019-06-26 | 2019-09-27 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111274393B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111784455B (zh) | 一种物品推荐方法及推荐设备 | |
CN110647696B (zh) | 一种业务对象的排序方法及装置 | |
CN110008397B (zh) | 一种推荐模型训练方法及装置 | |
CN103678304B (zh) | 为预定网页推送特定内容的方法、装置 | |
CN113722438B (zh) | 基于句向量模型的句向量生成方法、装置及计算机设备 | |
CN109582876A (zh) | 旅游行业用户画像构造方法、装置和计算机设备 | |
CN110580489B (zh) | 一种数据对象的分类系统、方法以及设备 | |
CN110955750A (zh) | 评论区域和情感极性的联合识别方法、装置、电子设备 | |
CN107918778A (zh) | 一种信息匹配方法及相关装置 | |
CN113722583A (zh) | 推荐方法、推荐模型训练方法及相关产品 | |
CN111666757A (zh) | 商品评论情感倾向分析方法、装置、设备和可读存储介质 | |
CN112364236A (zh) | 目标对象推荐系统、方法、装置、数据处理方法及装置 | |
CN112148994B (zh) | 信息推送效果评估方法、装置、电子设备及存储介质 | |
CN113362139A (zh) | 基于双塔结构模型的数据处理方法和装置 | |
CN109885745A (zh) | 一种用户画像方法、装置、可读存储介质及终端设备 | |
CN111125543B (zh) | 书籍推荐排序模型的训练方法、计算设备及存储介质 | |
CN111274393B (zh) | 关于物品的知识库的构建方法、装置及计算设备 | |
CN111783417A (zh) | 文章内容评分方法和装置 | |
CN109033078A (zh) | 语句类别识别方法及装置、存储介质、处理器 | |
CN115238188A (zh) | 一种对象推荐方法和系统及对象推荐模型系统 | |
Gray et al. | Personalized online search for fashion products | |
CN113886697A (zh) | 基于聚类算法的活动推荐方法、装置、设备及存储介质 | |
CN111639989B (zh) | 商品推荐方法和可读存储介质 | |
CN110162614B (zh) | 问题信息提取方法、装置、电子设备和存储介质 | |
CN113744012A (zh) | 一种信息处理方法、装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |