CN107818487B - 一种产品信息处理方法、装置、设备及客户端 - Google Patents
一种产品信息处理方法、装置、设备及客户端 Download PDFInfo
- Publication number
- CN107818487B CN107818487B CN201610817504.1A CN201610817504A CN107818487B CN 107818487 B CN107818487 B CN 107818487B CN 201610817504 A CN201610817504 A CN 201610817504A CN 107818487 B CN107818487 B CN 107818487B
- Authority
- CN
- China
- Prior art keywords
- information
- product
- label
- target
- comment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Abstract
本申请实施例公开了一种产品信息处理方法、装置、设备及客户端,所述方法包括:获取产品的评论信息,对所述评论信息进行预处理得到有效评论信息;对所述有效评论信息进行分词操作得到一个或多个分词词语,确定所述分词词语的属性信息,根据所述分词词语的属性信息,确定与所述产品对应的标签信息;根据所述产品对应的标签信息,建立标签信息与产品的对应关系。可以提高搜索结果的精准度。
Description
技术领域
本申请涉及信息处理技术领域,特别涉及一种产品信息处理方法、装置、设备及客户端。
背景技术
送礼是普通用户日常周期性的强需求,比如在情人节、母亲节、亲人生日、结婚纪念日等节日,用户都可能需要为不同的对象选取不同的礼品。随着互联网技术的发展,电子商务平台的用户数量与日俱增,大量用户在电子商务网站可以方便地挑选和购买合适的节日礼物。为了方便用户快捷地查找到合适的礼物,电子商务平台通过产品信息处理方法可以根据接收到的用户输入的礼品需求,搜索出候选的礼品供用户浏览。
现有的产品信息处理方法可以包括:商家可以在产品标题中填写产品的属性、适用对象和场景等信息。当利用现有的产品信息处理方法处理后的信息为用户推荐产品时,通常是用户输入包括关键词的搜索信息,所述关键词可以是“礼物”“送男生”“女生”“情人节”等;服务器接收到用户输入的搜索信息后,可以通过分词操作得到与该搜索信息对应的多个关键词;再将得到的关键词与产品标题进行比对,可以将包括关键词的产品标题对应的产品作为候选的产品展示给用户,供用户选择。
发明人发现现有技术中至少存在如下问题:产品标题由商家提供,商家为了提高产品被搜索到的概率,常常在标题中堆砌不符合实际的关键词,可能导致搜索出的产品结果不符合用户的需求。同时,部分真正适合的产品可能由于产品标题中未填写相关关键词,导致其在搜索过程中被遗漏。因此,现有的产品信息处理方法可能导致搜索结果不够精准。
发明内容
本申请实施例的目的是提供一种产品信息处理方法、装置、设备及客户端,以提高搜索结果的精准度。
为解决上述技术问题,本申请实施例提供一种产品信息处理方法及装置是这样实现的:
一种产品信息处理方法,包括:
获取产品的评论信息,对所述评论信息进行预处理得到有效评论信息;
对所述有效评论信息进行分词操作得到一个或多个分词词语,确定所述分词词语的属性信息,根据所述分词词语的属性信息,确定与所述产品对应的标签信息;
根据所述产品对应的标签信息,建立标签信息与产品的对应关系。
一种产品信息处理方法,包括:
接收查询信息;
根据所述查询信息和预先建立的统一映射关系确定与所述查询信息对应的目标标签;
根据所述目标标签以及预先建立的标签信息与产品的对应关系,确定与所述查询信息对应的目标产品。
一种网页数据显示方法,包括:
接收用户输入的查询信息,并将所述查询信息发送给服务器;
接收并显示所述服务器反馈的网页数据;所述网页数据包括:与所述查询信息对应的目标产品;所述目标产品根据与所述查询信息对应的目标标签确定;所述目标标签包括:目标对象标签和/或目标场景标签。
一种产品信息处理装置,包括:有效评论信息获取模块、标签信息确定模块和关系建立模块;其中,
所述有效评论信息获取模块,用于获取产品的评论信息,对所述评论信息进行预处理得到有效评论信息;
所述产品标签信息确定模块,用于对所述有效评论信息获取模块得到的有效评论信息进行分词操作得到一个或多个分词词语,确定所述分词词语的属性信息,根据所述分词词语的属性信息,确定与所述产品对应的标签信息;
所述关系建立模块,用于根据所述产品标签信息确定模块确定的产品对应的标签信息,建立标签信息与产品的对应关系。
一种产品信息处理装置,包括:查询信息接收模块、目标标签确定模块和目标产品确定模块;其中,
所述查询信息接收模块,用于接收查询信息;
所述目标标签确定模块,用于根据预先建立的统一映射关系和所述查询信息接收模块接收到的查询信息,确定与所述查询信息对应的目标标签;所述目标标签包括:目标对象标签和/或目标场景标签;
所述目标产品确定模块,用于根据预先建立的标签信息与产品的对应关系以及所述目标标签确定模块确定的目标标签,确定与所述查询信息对应的目标产品。
一种产品信息处理设备,包括:
通信模块,用于进行网络数据通信;
存储器,用于存储数据;
处理器,通过所述通信模块接收查询信息,读取所述存储器存储的预先建立的统一映射关系,根据所述预先建立的统一映射关系和所述查询信息确定与所述查询信息对应的目标标签;读取所述存储器存储的预先建立的标签信息与产品的对应关系,根据预先建立的标签信息与产品的对应关系以及所述目标标签确定模块确定的目标标签,确定与所述查询信息对应的目标产品。
一种客户端,包括:
输入设备,用于数据输入;
通信模块,用于进行网络数据通信;
显示器,用于数据显示;
处理器,通过所述输入设备接收用户输入的查询信息,控制所述通信模块将所述查询信息发送给服务器,通过所述通信模块接收所述服务器反馈的网页数据,并控制所述显示器显示所述网页数据;其中,所述网页数据包括:与所述查询信息对应的目标产品;所述目标产品根据与所述查询信息对应的目标标签确定;所述目标标签包括:目标对象标签和/或目标场景标签。
由以上本申请实施例提供的技术方案可见,本申请实施例提供的一种产品信息处理方法、装置、设备及客户端,通过对用户的评论信息进行处理来确定产品适合的对象及场景,由于评论信息由大量用户提供,因此,评论信息相比于商家提供的产品标题更加真实有效,因此利用本申请实施例提供的产品信息处理方法提供给用户的搜索结果,可以提高搜索结果的精准度。进一步地,本申请实施例中通过对评论信息进行对象标签和场景标签的选取,可以保证搜索的结果更符合用户期望的对象和场景,可以进一步提高来搜索结果的精准度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请产品信息处理方法一个实施例的流程图;
图2是本申请产品信息处理方法另一个实施例的流程图;
图3是本申请产品信息处理装置一个实施例的模块图;
图4是本申请装置实施例中有效评论信息筛选获取的单元图;
图5是本申请产品信息处理装置另一个实施例的模块图;
图6是本申请装置产品信息处理设备一个实施例的结构示意图;
图7是本申请客户端一个实施例的结构示意图。
具体实施方式
本申请实施例提供一种产品信息处理方法、装置、设备及客户端。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
图1是本申请产品信息处理方法一个实施例的流程图。如图1所示,所述产品信息处理方法可以包括:
S101:获取产品的评论信息,对所述评论信息进行预处理得到有效评论信息。
所述产品的评论信息可以与所述产品具有关联关系。具体地,可以是与所述产品具有关联关系的用户输入的,用于评论所述产品的信息。例如,可以是购买该产品的用户输入的评论信息,也可以是使用过该产品的用户输入的评论信息。
所述评论信息可以是用于评论所述产品的文字描述信息。例如“产品很好用”。
所述对评论信息进行预处理得到有效评论信息可以包括:对所述评论信息进行第一预处理操作,以去除所述评论信息中的冗余信息;对所述第一预处理后的评论信息进行第二预处理,得到有效评论信息。
所述冗余信息通常是指产品的评论信息中的无效信息。一般冗余信息不能体现产品的实际使用情况。例如评论信息中的“收到了”可以认为是冗余信息。
所述对评论信息进行第一预处理操作,可以采用基于机器学习的文本分类方法。具体地,可以包括:可以获取标注了“垃圾评价”和“正常评价”的两种类别的样本信息;可以分别确定所述两种类别样本信息的特征信息;基于所述两种类别样本信息的特征信息可以对所述评论信息进行分类,将所述评论信息划分为“垃圾评价”和“正常评价”两种类别的评论信息;可以去除分类为“垃圾评价”的评论信息。
其中,所述样本信息的特征信息可以包括下述中的至少一种:对所述样本信息分词后得到的分词词语的词频、对所述样本信息分词后得到的分词词语的TFIDF分数值、对所述样本信息分词后得到的分词词语的词性。
所述基于两种类别样品信息的特征信息对所述评论信息进行分类具体可以包括:对所述评论信息进行分词处理,得到评论信息的分词词语,分别将所述分词词语与两种类别的两种样本信息中对应的特征信息进行匹配,匹配度较高的类别作为所述评论信息所属的类别。通过对所述获取的产品评论信息进行第一预处理操作,可以有效过滤所述评论信息中的冗余信息,降低服务器的数据处理量。
可以所述对第一预处理后的评论信息进行第二预处理以得到有效评论信息,具体可以包括:可以对第一预处理后的评论信息进行情感分析;根据所述情感分析结果可以将所述第一预处理后的评论信息划分为积极评论和消极评论;可以将所述积极评论作为有效评论信息。
其中,对第一预处理后的评论信息进行情感分析可以采用基于监督学习的文本分类方法或者基于情感词典的规则方法。
所述监督学习的文本分类方法,通常是利用一组已经分类好的样本进行学习,以调整分类器的参数。具体地,在监督学习中,一个输入对象会对应一个期望的输出值,通过多组设置好的输入和输出,可以调整分类器的参数。
所述基于情感词典的规则方法,通常是提供包含正向、负向、中性情感词的词典数据库,再根据预料中包含的正向、负向、中性情感词的数目或其权值等元素来对预料进行情感分类。
通过对情感分析结果可以将所述第一预处理后的评论信息划分为积极评论和消极评论,并将所述积极评论作为有效评论信息。例如,某一个产品,其评论信息A中包含有语句“这个宝贝质量很好”,其评论信息B中包含有语句“这个宝贝性价比很低”,那么,通过情感分析,可以将评论信息A划分为积极评论,可以将评论信息B划分为消极评论。那么评论A可以作为有效评论信息。
通过第二预处理操作,可以选取出肯定所述产品的有效评论信息,根据所述有效评论信息更能准确搜索出用户满意的产品。
S102:对所述有效评论信息进行分词操作得到一个或多个分词词语,确定所述分词词语的属性信息,根据所述分词词语的属性信息,确定与所述产品对应的标签信息。
可以对所述有效评论信息进行分词操作得到一个或多个分词词语。可以确定所述分词词语的属性信息。所述分词词语的属性信息可以根据预设的词语和词语属性来确定。
所述分词词语的属性信息可以包括:时间名词、普通名词、介词或动词。
例如,一个评论信息的内容包括“后天妈妈生日,也当做中秋节送给母亲的礼物”,那么分词操作后得到的分词词语及其属性可以如表1所示。
表1
分词词语 | 分词词语属性 |
后天 | 时间名词 |
妈妈 | 普通名词 |
生日 | 普通名词 |
也当做 | 介词 |
中秋节 | 时间名词 |
送给 | 动词 |
母亲 | 普通名词 |
礼物 | 普通名词 |
根据产品的评论信息对应的所述分词词语的属性信息,可以确定所述产品对应的标签信息。
所述产品对应的标签信息可以包括:所述产品对应的对象标签和/或所述产品对应的场景标签。
根据所述产品的评论信息对应的分词词语的属性信息,确定所述产品对应的标签信息,具体可以包括:将所述分词词语的属性信息与预先建立的统一映射关系相匹配,确定与所述产品对应的标签信息。
所述预先建立的统一映射关系可以包括:人群统一映射关系和场景统一映射关系。当所述分词词语的属性信息与所述人群统一映射关系相匹配时,所述确定的与产品对应的标签信息可以是对象标签信息。当所述分词词语的属性信息与所述场景统一映射关系相匹配时,所述确定的与产品对应的标签信息可以是场景标签信息。
所述人群统一映射关系可以用于表示多个适用人群表述词和统一人群表述词的对应关系。例如,可以如表2所示。
所述场景统一映射关系可以用于表示多个使用场景表述词和统一场景表述词的对应关系。例如,可以如表3所示。
表2
适用人群表述词 | 统一人群表述词 |
妈妈、老妈、婆婆、岳母、母亲 | 妈妈 |
孩子他妈、夫人、老婆、媳妇、太太 | 老婆 |
老人、爷爷、奶奶、外公、外婆、姥姥 | 老人 |
表3
适用场景表述词 | 统一场景表述词 |
七夕、七夕节、情人节 | 情人节 |
六一节、六一儿童节、儿童节 | 六一儿童节 |
那么,对于评论信息“后天妈妈生日,也当做中秋节送给母亲的礼物”,根据表1中示出的分词词语及其属性信息,基于所述预先建立的知识库,可以确定该评论的产品对应的标签信息可以包括:妈妈、生日、中秋节。其中“妈妈”可以为对象标签,“生日”和“中秋节”可以为场景标签。
S103:根据所述产品对应的标签信息,建立标签信息与产品的对应关系。
根据所述产品对应的标签信息,可以确定第一知识库。
所述标签信息与产品的对应关系可以包括:产品与对象标签之间的对应关系,和/或,产品与场景标签之间的对应关系。
所述根据产品对应的标签信息,建立标签信息与产品的对应关系,包括:可以获取每个产品对应的对象标签信息和/或场景标签信息,建立所述产品与对象标签信息之间的对应关系,和/或,产品与场景标签之间的对应关系。一个产品可以对应有一个或多个标签信息。一个标签信息也可以对应有一个或多个产品。
本申请实施例还提供一种产品信息处理方法。所述产品信息处理方法可以采用本申请实施例建立的标签信息与产品的对应关系。参阅图2,所述产品信息处理方法具体可以包括以下步骤。
S201:接收查询信息。
所述查询信息可以是用户通过客户端发来的。所述查询信息可以是体现用户搜索意图的词语或短句。
S202:根据所述查询信息和预先建立的统一映射关系确定与所述查询信息对应的目标标签。
具体地,可以对所述查询信息进行分词操作,得到目标分词词语;根据所述预先建立的统一映射关系,可以确定与所述目标分词词语对应的目标标签。所述目标标签可以为一个或多个。
所述目标标签包括:目标对象标签和/或目标场景标签。
S203:根据所述目标标签以及预先建立的标签信息与产品的对应关系,确定与所述查询信息对应的目标产品。
当所述目标标签为目标对象标签时,可以根据目标对象标签以及所述标签信息与产品的对应关系确定与所述查询信息对应的目标产品。
当所述目标标签为场景对象标签时,可以根据目标对象标签以及所述标签信息与产品的对应关系确定与所述查询信息对应的目标产品。
当所述目标标签包括目标对象标签和目标场景标签时,可以根据所述目标对象标签和所述标签信息与产品的对应关系确定第一候选产品集;根据所述目标场景标签和所述标签信息与产品的对应关系确定第二候选产品集;将所述第一候选产品集合和所述第二候选产品集求交集得到的结果作为与所述查询信息对应的目标产品。
需要说明的是,所述确定第一候选产品集合和确定第二候选产品集合的先后顺序可以为任意顺序,本申请对此并不作出限定。
在一个例子中,接收到的查询信息可以是用户输入的“中秋节送妈妈的礼物”,通过对所述查询信息进行分词操作,可以得到目标分词词语“中秋节、送、妈妈、礼物”,其中,根据表2所示的人群统一映射关系和表3所示的场景统一映射关系,可以确定与所述查询信息对应的目标标签包括:目标对象标签“妈妈”和目标场景标签“中秋节”。假设与目标对象标签“妈妈”对应的第一候选产品集中包括:产品A、产品B和产品C,与场景对象标签“中秋节”对应的第二候选产品集中包括:产品A、产品C和产品D。那么,与所述查询信息“中秋节送妈妈的礼物”对应的目标产品可以为产品A和产品C。可以将产品A和产品C反馈给用户。
本申请实施例还提供一种网页数据显示方法。所述网页数据显示方法具体可以包括以下步骤。
S301:接收用户输入的查询信息,并将所述查询信息发送给服务器;
S302:接收并显示所述服务器反馈的网页数据;所述网页数据包括:与所述查询信息对应的目标产品;所述目标产品根据与所述查询信息对应的目标标签确定;所述目标标签包括:目标对象标签和/或目标场景标签。
上述实施例提供的产品信息处理方法以及网页数据显示方法,通过对用户的评论信息进行处理来确定产品适合的对象及场景,由于评论信息由大量用户提供,因此,评论信息相比于商家提供的产品标题更加真实有效,因此利用本申请实施例提供的产品信息处理方法提供给用户的搜索结果,可以提高搜索结果的精准度。进一步地,本申请实施例中通过对评论信息进行对象标签和场景标签的选取,可以保证搜索的结果更符合用户期望的对象和场景,可以进一步提高来搜索结果的精准度。
本申请实施例还提供一种产品信息处理装置。所述产品信息处理装置可以是一种服务器。
图3是本申请产品信息处理装置实施例的一个模块图。如图3所示,所述产品信息处理服务器可以包括:有效评论信息获取模块301、产品标签信息确定模块302和关系建立模块303。其中,
所述有效评论信息获取模块301,可以用于获取产品的评论信息,对所述评论信息进行预处理得到有效评论信息。
所述产品标签信息确定模块302,可以用于对所述有效评论信息获取模块301得到的有效评论信息进行分词操作得到一个或多个分词词语,确定所述分词词语的属性信息,根据所述分词词语的属性信息,确定与所述产品对应的标签信息。
所述关系建立模块303,可以用于根据所述产品标签信息确定模块302确定的产品对应的标签信息,建立标签信息与产品的对应关系。
图4是本申请装置实施例中有效评论信息获取模块的单元图。图如4所示,所述有效评论信息获取模块301可以包括:原始信息获取单元3011、第一预处理单元3012和第二预处理单元3013。其中,
所述原始信息获取单元3011,可以用于获取与产品关联的评论信息。
所述第一预处理单元3012,可以用于对所述原始信息获取单元3011获取的评论信息进行第一预处理操作,以去除所述评论信息中的冗余信息。所述对评论信息进行第一预处理操作,可以采用基于机器学习的文本分类方法。
所述第二预处理单元3013,可以用于对所述第一预处理单元3012处理后的评论信息进行第二预处理,得到有效评论信息。具体可以用于:可以对第一预处理后的评论信息进行情感分析;根据所述情感分析结果可以将所述第一预处理后的评论信息划分为积极评论和消极评论;可以将所述积极评论作为有效评论信息。
本申请实施例还提供一种产品信息处理装置。参照图5,所述产品信息处理装置可以包括:查询信息接收模块501、目标标签确定模块502和目标产品确定模块503。其中,
所述查询信息接收模块501,可以用于接收查询信息。
所述目标标签确定模块502,可以用于根据预先建立的统一映射关系和所述查询信息接收模块501接收到的查询信息,确定与所述查询信息对应的目标标签。所述目标标签包括:目标对象标签和/或目标场景标签。
所述目标产品确定模块503,可以用于根据预先建立的标签信息与产品的对应关系以及所述目标标签确定模块502确定的目标标签,确定与所述查询信息对应的目标产品。
本申请实施例还提供一种产品信息处理设备。参照图6,所述产品信息处理设备可以包括:通信模块601、处理器602和存储器603。
所述通信模块601,用于进行网络数据通信。所述通信模块601可以依照TCP/IP协议设置,并在该协议框架下进行网络通信。在一种实施方式中,所述服务器通信模块601具体可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
所述存储器603,用于存储数据。所述存储器603可以为计算机可读介质中的存储器。
所述处理器602,通过所述通信模块601接收查询信息,读取所述存储器603存储的预先建立的统一映射关系,根据所述预先建立的统一映射关系和所述查询信息确定与所述查询信息对应的目标标签;读取所述存储器603存储的预先建立的标签信息与产品的对应关系,根据预先建立的标签信息与产品的对应关系以及所述目标标签确定模块确定的目标标签,确定与所述查询信息对应的目标产品。其中,所述目标标签包括:目标对象标签和/或目标场景标签。
在一种实施方式中,所述处理器602可以按任何适当的方式实现。例如,所述处理器602可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本申请并不作限定。
本申请还提供一种客户端。参照图7,所述客户端可以包括:输入设备701、通信模块702、处理器703和显示器704。
所述输入设备701,用于数据输入。所述输入设备701可以是人或外部与计算机进行交互的一种装置。在一种实施方式中,所述输入设备701具体可以为键盘、鼠标、摄像头、扫描仪、光笔、手写输入板等。
所述通信模块702,用于进行网络数据通信。所述通信模块702可以依照TCP/IP协议设置,并在该协议框架下进行网络通信。在一种实施方式中,所述通信模块702具体可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
所述显示器704,用于数据显示。所述显示器704是一种将电子文件通过特定的传输设备显示到屏幕上再反射到人眼的显示工具。在一种实施方式中,所述显示器704具体可以为:阴极射线管显示器(CRT)、等离子显示器(PDP)、液晶显示器(LCD)、LED显示器或3D显示器等。
所述处理器703,通过所述输入设备701接收用户输入的查询信息,控制所述通信模块702将所述查询信息发送给服务器,通过所述通信模块702接收所述服务器反馈的网页数据,并控制所述显示器704显示所述网页数据。其中,所述网页数据包括:与所述查询信息对应的目标产品。所述目标产品根据与所述查询信息对应的目标标签确定。所述目标标签包括:目标对象标签和/或目标场景标签。
在一种实施方式中,所述处理器703可以按任何适当的方式实现。例如,所述处理器703可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本申请并不作限定。
上述实施例提供的产品信息处理装置、设备以及客户端,与本申请的产品信息处理方法实施例相对应,可以实现本申请方法实施例并达到方法实施例的技术效果。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片2。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。该计算机软件产品可以包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。该计算机软件产品可以存储在内存中,内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括短暂电脑可读媒体(transitory media),如调制的数据信号和载波。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施例描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。
Claims (17)
1.一种产品信息处理方法,其特征在于,包括:
获取产品的评论信息,对所述评论信息进行预处理得到有效评论信息;
对所述有效评论信息进行分词操作得到一个或多个分词词语,确定所述分词词语的属性信息,根据所述分词词语的属性信息中的时间名词和普通名词,确定与所述产品对应的标签信息;
根据所述产品对应的标签信息,建立标签信息与产品的对应关系。
2.如权利要求1所述的一种产品信息处理方法,其特征在于,所述对所述评论信息进行预处理得到有效评论信息,包括:
对所述评论信息进行第一预处理操作,以去除所述评论信息中的冗余信息;
对所述第一预处理后的评论信息进行第二预处理,得到有效评论信息。
3.如权利要求2所述的一种产品信息处理方法,其特征在于,对评论信息进行第一预处理操作,具体包括:
获取标注为垃圾评价和正常评价的两种类别的样本信息;
分别确定所述两种类别样本信息的特征信息;
基于所述两种类别样本信息的特征信息,对所述评论信息进行分类,得到垃圾评价和正常评价;
去除分类为垃圾评价的评论信息。
4.如权利要求2所述的一种产品信息处理方法,其特征在于,对所述第一预处理后的评论信息进行第二预处理,得到有效评论信息,具体包括:
对第一预处理后的评论信息进行情感分析;
根据所述情感分析结果将所述第一预处理后的评论信息划分为积极评论和消极评论;
将所述积极评论作为有效评论信息。
5.如权利要求1所述的一种产品信息处理方法,其特征在于,所述产品对应的标签信息包括:所述产品对应的对象标签和/或所述产品对应的场景标签。
6.如权利要求5所述的一种产品信息处理方法,其特征在于,根据属性信息中的时间名词和普通名词确定所述产品对应的标签信息,具体包括:将所述分词词语的属性信息中的时间名词和普通名词与预先建立的统一映射关系相匹配,确定与所述产品对应的标签信息。
7.如权利要求6所述的一种产品信息处理方法,其特征在于,所述预先建立的统一映射关系包括:人群统一映射关系和场景统一映射关系。
8.如权利要求1所述的一种产品信息处理方法,其特征在于,所述标签信息与产品的对应关系包括:产品与对象标签之间的对应关系,和/或,产品与场景标签之间的对应关系。
9.如权利要求8所述的一种产品信息处理方法,其特征在于,所述根据所述产品对应的标签信息,建立标签信息与产品的对应关系,包括:
获取每个产品对应的对象标签信息和/或场景标签信息;
建立所述产品与对象标签信息之间的对应关系,和/或,产品与场景标签之间的对应关系。
10.一种产品信息处理方法,其特征在于,包括:
接收查询信息;
根据所述查询信息和预先建立的统一映射关系确定与所述查询信息对应的目标标签;
根据所述目标标签以及预先建立的标签信息与产品的对应关系,确定与所述查询信息对应的目标产品,其中,产品对应的标签信息是根据产品的评论信息对应的分词词语的属性信息中的时间名词和普通名词确定的。
11.如权利要求10所述的一种产品信息处理方法,其特征在于,所述根据所述查询信息和预先建立的统一映射关系确定与所述查询信息对应的目标标签,包括:
对所述查询信息进行分词操作,得到目标分词词语;
根据所述预先建立的统一映射关系,确定与所述目标分词词语对应的目标标签。
12.如权利要求11所述的一种产品信息处理方法,其特征在于,所述目标标签包括:目标对象标签和/或目标场景标签。
13.如权利要求11所述的一种产品信息处理方法,其特征在于,根据所述目标标签以及预先建立的标签信息与产品的对应关系,确定与所述查询信息对应的目标产品,包括:
当所述目标标签为目标对象标签时,根据目标对象标签以及所述标签信息与产品的对应关系确定与所述查询信息对应的目标产品;或者,
当所述目标标签为场景对象标签时,根据目标对象标签以及所述标签信息与产品的对应关系确定与所述查询信息对应的目标产品;或者,
当所述目标标签包括目标对象标签和目标场景标签时,根据所述目标对象标签和所述标签信息与产品的对应关系确定第一候选产品集;根据所述目标场景标签和所述标签信息与产品的对应关系确定第二候选产品集;将所述第一候选产品集合和所述第二候选产品集求交集得到的结果作为与所述查询信息对应的目标产品。
14.一种产品信息处理装置,其特征在于,包括:
有效评论信息获取模块,用于获取产品的评论信息,对所述评论信息进行预处理得到有效评论信息;
产品标签信息确定模块,用于对所述有效评论信息获取模块得到的有效评论信息进行分词操作得到一个或多个分词词语,确定所述分词词语的属性信息,根据所述分词词语的属性信息中的时间名词和普通名词,确定与所述产品对应的标签信息;
关系建立模块,用于根据所述产品标签信息确定模块确定的产品对应的标签信息,建立标签信息与产品的对应关系。
15.如权利要求14所述的一种产品信息处理装置,其特征在于,所述有效评论信息获取模块包括:原始信息获取单元、第一预处理单元和第二预处理单元;
所述原始信息获取单元,用于获取与产品关联的评论信息;
所述第一预处理单元,用于对所述原始信息获取单元获取的评论信息进行第一预处理操作,以去除所述评论信息中的冗余信息;对评论信息进行第一预处理操作,采用基于机器学习的文本分类方法;
所述第二预处理单元,用于对所述第一预处理单元处理后的评论信息进行第二预处理,得到有效评论信息;具体用于:对第一预处理后的评论信息进行情感分析;根据所述情感分析结果将所述第一预处理后的评论信息划分为积极评论和消极评论;将所述积极评论作为有效评论信息。
16.一种产品信息处理装置,其特征在于,包括:
查询信息接收模块,用于接收查询信息;
目标标签确定模块,用于根据预先建立的统一映射关系和所述查询信息接收模块接收到的查询信息,确定与所述查询信息对应的目标标签;所述目标标签包括:目标对象标签和/或目标场景标签;
目标产品确定模块,用于根据预先建立的标签信息与产品的对应关系以及所述目标标签确定模块确定的目标标签,确定与所述查询信息对应的目标产品,其中,产品对应的标签信息是根据产品的评论信息对应的分词词语的属性信息中的时间名词和普通名词确定的。
17.一种产品信息处理设备,其特征在于,包括:
通信模块,用于进行网络数据通信;
存储器,用于存储数据;
处理器,通过所述通信模块接收查询信息,读取所述存储器存储的预先建立的统一映射关系,根据所述预先建立的统一映射关系和所述查询信息确定与所述查询信息对应的目标标签;读取所述存储器存储的预先建立的标签信息与产品的对应关系,根据预先建立的标签信息与产品的对应关系以及所述目标标签确定模块确定的目标标签,确定与所述查询信息对应的目标产品,其中,产品对应的标签信息是根据产品的评论信息对应的分词词语的属性信息中的时间名词和普通名词确定的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610817504.1A CN107818487B (zh) | 2016-09-12 | 2016-09-12 | 一种产品信息处理方法、装置、设备及客户端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610817504.1A CN107818487B (zh) | 2016-09-12 | 2016-09-12 | 一种产品信息处理方法、装置、设备及客户端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107818487A CN107818487A (zh) | 2018-03-20 |
CN107818487B true CN107818487B (zh) | 2022-03-04 |
Family
ID=61600537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610817504.1A Active CN107818487B (zh) | 2016-09-12 | 2016-09-12 | 一种产品信息处理方法、装置、设备及客户端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107818487B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112334904A (zh) * | 2018-05-18 | 2021-02-05 | 电子湾有限公司 | 处理交易反馈 |
CN109299460B (zh) * | 2018-09-18 | 2022-07-12 | 北京三快在线科技有限公司 | 分析店铺的评价数据的方法、装置、电子设备及存储介质 |
CN109739947A (zh) * | 2018-12-26 | 2019-05-10 | 广东工业大学 | 一种数据处理装置、方法、电子设备和存储介质 |
CN111695344B (zh) * | 2019-02-27 | 2023-05-30 | 阿里巴巴集团控股有限公司 | 文本的标注方法和装置 |
CN111625620A (zh) * | 2019-02-28 | 2020-09-04 | 北京京东尚科信息技术有限公司 | 信息处理方法和装置 |
CN110634017A (zh) * | 2019-08-23 | 2019-12-31 | 深圳市新系区块链技术有限公司 | 信息分类方法、装置及设备 |
CN110781307A (zh) * | 2019-11-06 | 2020-02-11 | 北京沃东天骏信息技术有限公司 | 目标物品关键词和标题生成方法、搜索方法以及相关设备 |
CN113763084A (zh) * | 2020-09-21 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 产品推荐的处理方法、装置、设备及存储介质 |
CN113365091B (zh) * | 2021-06-03 | 2023-03-24 | 上海哔哩哔哩科技有限公司 | 直播间礼物赠送方法及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101206672A (zh) * | 2007-12-25 | 2008-06-25 | 北京科文书业信息技术有限公司 | 商品搜索无结果智能处理系统及方法 |
CN103377216A (zh) * | 2012-04-24 | 2013-10-30 | 苏州引角信息科技有限公司 | 产品信息库的构建方法及系统 |
EP2813989A4 (en) * | 2012-05-08 | 2015-02-25 | Huawei Tech Co Ltd | SEARCH METHOD AND DEVICE BASED ON AN E-COMMERCE PLATFORM |
CN103914492B (zh) * | 2013-01-09 | 2018-02-27 | 阿里巴巴集团控股有限公司 | 查询词融合方法、商品信息发布方法和搜索方法及系统 |
CN103970857B (zh) * | 2014-05-07 | 2017-08-25 | 百度在线网络技术(北京)有限公司 | 推荐内容确定系统和方法 |
CN105117418B (zh) * | 2015-07-30 | 2022-02-18 | 百度在线网络技术(北京)有限公司 | 基于搜索的服务信息管理系统及方法 |
CN105894357A (zh) * | 2016-03-30 | 2016-08-24 | 北京金山安全软件有限公司 | 商品信息推送方法及装置 |
-
2016
- 2016-09-12 CN CN201610817504.1A patent/CN107818487B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107818487A (zh) | 2018-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107818487B (zh) | 一种产品信息处理方法、装置、设备及客户端 | |
CN107038186B (zh) | 生成标题、搜索结果展示、标题展示的方法及装置 | |
CN108509436B (zh) | 一种确定推荐对象的方法、装置及计算机存储介质 | |
CN104239331B (zh) | 一种用于实现评论搜索引擎排序的方法和装置 | |
US9223831B2 (en) | System, method and computer program product for searching summaries of mobile apps reviews | |
US9946703B2 (en) | Title extraction using natural language processing | |
US10002371B1 (en) | System, method, and computer program product for searching summaries of online reviews of products | |
CN107766349B (zh) | 一种生成文本的方法、装置、设备及客户端 | |
US20140188665A1 (en) | CrowdChunk System, Method, and Computer Program Product for Searching Summaries of Online Reviews of Products | |
US10141006B1 (en) | Artificial intelligence system for improving accessibility of digitized speech | |
CN109002432B (zh) | 同义词的挖掘方法及装置、计算机可读介质、电子设备 | |
GB2401972A (en) | Identifying special word usage in a document | |
US9569510B2 (en) | Crowd-powered self-improving interactive visualanalytics for user-generated opinion data | |
CN105824830A (zh) | 一种显示页面的方法、客户端及设备 | |
CN106934006B (zh) | 基于多叉树模型的页面推荐方法及装置 | |
CN110363206B (zh) | 数据对象的聚类、数据处理及数据识别方法 | |
CN107402953A (zh) | 一种页面跳转方法及装置 | |
EP3564833B1 (en) | Method and device for identifying main picture in web page | |
US20170337570A1 (en) | Analytics system for product retention management | |
CN110580313B (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN110019702B (zh) | 数据挖掘方法、装置和设备 | |
CN113239273B (zh) | 用于生成文本的方法、装置、设备以及存储介质 | |
US9563608B1 (en) | Data analysis results authoring and peer review | |
US20210342531A1 (en) | Method, apparatus, and computer-readable medium for transforming a hierarchical document object model to filter non-rendered elements | |
CN111581950B (zh) | 同义名称词的确定方法和同义名称词的知识库的建立方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |