CN103870973B - 基于电子信息的关键词提取的信息推送、搜索方法及装置 - Google Patents

基于电子信息的关键词提取的信息推送、搜索方法及装置 Download PDF

Info

Publication number
CN103870973B
CN103870973B CN201210540338.7A CN201210540338A CN103870973B CN 103870973 B CN103870973 B CN 103870973B CN 201210540338 A CN201210540338 A CN 201210540338A CN 103870973 B CN103870973 B CN 103870973B
Authority
CN
China
Prior art keywords
commodity
evaluating
keyword
evaluation
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210540338.7A
Other languages
English (en)
Other versions
CN103870973A (zh
Inventor
张焱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210540338.7A priority Critical patent/CN103870973B/zh
Priority to TW102107874A priority patent/TWI615724B/zh
Priority to US14/102,353 priority patent/US20140172642A1/en
Priority to JP2015547486A priority patent/JP2016503914A/ja
Priority to PCT/US2013/074280 priority patent/WO2014093433A1/en
Publication of CN103870973A publication Critical patent/CN103870973A/zh
Application granted granted Critical
Publication of CN103870973B publication Critical patent/CN103870973B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本申请提供了一种基于电子信息的关键词提取的信息推送、搜索方法及装置,其中,所述基于电子信息的关键词提取的信息推送方法包括:接收商品的评价查看请求;依据所述商品的评价查看请求,获取对应的商品评价关键词;返回所述对应的商品评价关键词;其中,所述商品评价关键词通过以下步骤获得:获取用于评价所述商品的电子信息;将所述电子信息分割为若干个句子;以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词。本申请能够减轻了访问服务器的负担,减少了网络资源的占用,并提升了用户体验。

Description

基于电子信息的关键词提取的信息推送、搜索方法及装置
技术领域
本申请涉及文本分析应用的技术领域,特别是涉及一种基于电子信息的关键词提取的信息推送方法及装置,一种基于电子信息的评价参数提取的信息推送方法及装置,一种基于电子信息的商品搜索方法及装置,以及,一种客户端。
背景技术
在当前的信息时代,越来越多的信息以电子信息的方式出现。例如随着互联网的快速发展,越来越多的人喜欢在网上发展他们对事情的意见,因而在网络上出现大量包含倾向性的评论信息。人们希望通过信息处理手段来获取这些电子信息中包含的情感倾向性。
例如,在购买商品等产品之前,人们会希望先得知别人对于该产品的评价是好是坏。为满足用户的这种需求,在交易平台,尤其是C2C、B2C模式的电子商务网站中,会设置评价系统,由买家基于该评价系统针对每次的交易行为给卖家进行手动评价。例如,当买家与卖家完成一笔交易后,买家按照评价系统提供的“好评”、“中评”与“差评”的参数选项,选择其中一个评价参数,或进一步给出相应的产品评价说明,如“衣服颜色很好,质量很棒”等。
或如,买家按照电子商务网站中设置的评价参数选项,比如,商品质量、卖家服务态度、物流速度等,在预设的等级中进行选择,以形成针对此次交易行为的打分,然后根据分数对应到关联的评价参数“好评”、“中评”或“差评”,或进一步给出相应的产品评价说明。
这种现有的由买家进行手动评价的方式目前产生出诸多弊端,比如,某些买家在卖家的胁迫下给出好评的评价参数,但在说明栏内给出商品质量恶劣,服务态度差,物流慢的说明信息。
再者,目前网络中会有大量的文章或评论来评价或解说一个产品,如专门的产品试用报告(或产品使用报告),在各论坛中用户针对某些产品的评论等,这些文章或评论,会表达作者的一种观点,这些观点,有正面支持的,有反面反对的,也有中立的,有些评论或者文章,会直接让作者选择自己的观点,如赞或踩之类,但是大部分的文章,比如博客、日志、试用报告等,是没有这种观点选择的。然而,这些文章或评论中的观点,往往是最客观的。
对于用户而言,采用现有的由买家进行手动评价的方式显然无法满足评价客观性的需求,而用户往往在网上购物时,也不可能专门去搜索一些文章,还认真地去通读全文。对于系统而言,如存在与事实不符的评价参数,则会影响到搜索结果的准确性,例如,一些不好的商品信息不会受到说明栏中评论信息的影响,也会基于其所获得的好评的评价参数,与真实的好评的商品信息一同排在搜索结果的前列,导致用户需要时间和精力去分辨,甚至需要重新搜索等,这不但加重了访问服务器的负担,而且浪费了网络资源。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种基于电子信息的关键词提取及处理机制,用以客观、真实地反映产品或服务的评价信息,提高卖家用户监管的有效性,简化买家用户的网上购物操作,并减轻访问服务器的负担,减少网络资源的占用。
发明内容
本申请所要解决的技术问题是提供一种基于电子信息的关键词提取的信息推送方法,一种基于电子信息的评价参数提取的信息推送方法,一种基于电子信息的商品搜索方法,用以客观、真实地反映产品或服务的评价信息,提高卖家用户监管的有效性,简化买家用户的网上购物操作,并减轻访问服务器的负担,减少网络资源的占用。
相应的,本申请还提供了一种基于电子信息的关键词提取的装置,一种基于电子信息的评价参数提取的信息推送装置,一种基于电子信息的商品搜索装置以及一种客户端,用以保证上述方法在实际中的应用。
为了解决上述问题,本申请公开了一种基于电子信息的关键词提取的信息推送方法,包括:
接收商品的评价查看请求;
依据所述商品的评价查看请求,获取对应的商品评价关键词;
返回所述对应的商品评价关键词;
其中,所述商品评价关键词通过以下步骤获得:
获取用于评价所述商品的电子信息;
将所述电子信息分割为若干个句子;
以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词。
较佳地,所述获取用于评价所述商品的电子信息的子步骤进一步包括:
在指定的数据库中收集用于评价所述商品的电子信息;
和/或,
利用爬虫技术抓取用于评价所述商品的电子信息。
较佳地,所述商品指标词库包括自上而下分级的多级词库,所述预置的商品指标词库通过如下子步骤生成:
按照预设的商品主类别分别建立对应的一级商品指标词库;
按照所述商品主类别预设的子类别,分别建立对应的二级商品指标词库;
当所述子类别存在更下一级的从属类别时,分别逐级建立对应的从属级别商品指标词库;
其中,各级商品指标词库中包括相应类别的商品集合的属性特征词,所述属性特征词为描述商品属性指标的词语。
较佳地,所述以句子为单位,将其与商品指标词库中的关键词进行匹配,从中提取出匹配成功的关键词的步骤为,
以句子为单位,将各句子自上而下逐级与各级商品指标词库中的商品评价关键词进行匹配,获得从各级商品指标词库中匹配成功的商品评价关键词。
较佳地,所述商品评价关键词还通过以下步骤获得:
将各个句子与预置的非关键词词库中的非商品评价关键词进行匹配,去除各个句子中匹配成功的非商品评价关键词;
和/或,
去除各个句子中重复的词语。
较佳地,所述方法还包括:
返回所述匹配成功的商品评价关键词所对应的句子或句子中的部分内容。
较佳地,所述方法还包括:
获取各商品对应的商品评价关键词所映射的评价参数。
较佳地,所述方法还包括:
统计各商品评价关键词所映射的不同评价参数分别所占的比例。
较佳地,所述方法还包括:
返回各评价参数及所占比例。
较佳地,所述获取各商品对应的商品评价关键词所映射的评价参数的步骤包括:
预置多个评价参数,及各评价参数对应的商品评价关键词词库;
获取各商品对应的商品评价关键词,分别判断各商品评价关键词所归属的商品评价关键词词库,将所述商品评价关键词词库所对应的评价参数,确定为各商品评价关键词对应的评价参数。
较佳地,所述方法还包括:
依据各评价参数所占的比例提取特征评价参数,所述特征评价参数为所述各商品评价关键词所映射的评价参数所占的比例超过一定阈值的评价参数,和/或,所占比例高于其它评价参数所占比例的评价参数;
参考所述特征评价参数及其所占比例,调整该商品的搜索排序权重。
本申请还公开了一种基于电子信息的评价参数提取的信息推送方法,包括:
接收商品的评价查看请求;
依据所述商品的评价查看请求,获取对应的评价参数;
返回所述对应的评价参数;
其中,所述评价参数通过以下步骤获得:
获取用于评价所述商品的电子信息;
将所述电子信息分割为若干个句子;
以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;
获取各商品对应的商品评价关键词所映射的评价参数。
本申请还公开了一种基于电子信息的商品搜索方法,包括:
接收商品的搜索请求;
依据所述商品的搜索请求,获取对应的商品信息及其搜索排序权重;
按照所述搜索排序权重对所述商品信息进行排序并返回;
其中,所述搜索排序权重参考特征评价参数及其所占比例进行调整,所述特征评价参数及其所占比例通过以下步骤获得:
获取用于评价所述商品信息的电子信息;
将所述电子信息分割为若干个句子;
以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;
获取各商品信息对应的商品评价关键词所映射的评价参数;
统计各商品评价关键词所映射的不同评价参数分别所占的比例;
依据各评价参数所占的比例提取特征评价参数,所述特征评价参数为所述各商品评价关键词所映射的评价参数所占的比例超过一定阈值的评价参数,和/或,所占比例高于其它评价参数所占比例的评价参数。
本申请还公开了一种基于电子信息的关键词提取的信息推送装置,包括:
评价查看请求接收模块,用于接收商品的评价查看请求;
关键词提取模块,用于依据所述商品的评价查看请求,获取对应的商品评价关键词;其中,所述商品评价关键词通过以下方式获得:获取用于评价所述商品的电子信息;将所述电子信息分割为若干个句子;以及,以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;
关键词返回模块,用于返回所述商品评价关键词。
本申请还公开了一种基于电子信息的评价参数提取的信息推送装置,包括:
评价查看请求接收模块,用于接收商品的评价查看请求;
评价参数获取模块,用于依据所述商品的评价查看请求,获取对应的评价参数;其中,所述评价参数通过以下方式获得:获取用于评价所述商品的电子信息;将所述电子信息分割为若干个句子;以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;以及,获取各商品对应的商品评价关键词所映射的评价参数;
评价参数返回模块,用于返回所述对应的评价参数。
本申请还公开了一种基于电子信息的商品搜索装置,包括:
搜索请求接收模块,用于接收商品的搜索请求;
搜索处理模块,用于依据所述商品的搜索请求,获取对应的商品信息及其搜索排序权重;
排序返回模块,用于按照所述搜索排序权重从大至小对所述商品信息进行排序并返回;其中,所述搜索排序权重参考特征评价参数及其所占比例进行调整,所述特征评价参数及其所占比例通过以下方式获得:
获取用于评价所述商品信息的电子信息;
将所述电子信息分割为若干个句子;
以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;
获取各商品信息对应的商品评价关键词所映射的评价参数;
统计各商品评价关键词所映射的不同评价参数分别所占的比例;
依据各评价参数所占的比例提取特征评价参数,所述特征评价参数为所述各商品评价关键词所映射的评价参数所占的比例超过一定阈值的评价参数,和/或,所占比例高于其它评价参数所占比例的评价参数。
本申请还公开了一种客户端,包括:
请求模块,用于向服务器提交请求,所述请求包括商品的评价查看请求,和/或,商品的搜索请求;
结果获取模块,用于接收服务器针对所述请求返回的处理结果,所述针对请求返回处理结果包括针对商品的评价查看请求返回的对应的商品评价关键词和/或评价参数,和/或,针对商品的搜索请求返回的经过排序的商品信息。
与现有技术相比,本申请具有以下优点:
本申请实施例基于用于评价所述商品的电子信息生成商品评价关键词并向用户展示,从而更能客观、真实地反映评价信息,提高卖家监管的有效性,并提升买家的使用体验。并且,采用本申请实施例获得的这种客观、真实的商品评价关键词所形成的评价参数在作用于商品信息时,可以采用特征评价参数及其所占比例调整相应商品的搜索排序权重,能保证在交易平台中的用户获得更为准确的商品信息搜索结果,例如,具有“好评”的特征评价参数,会使商品信息排在搜索结果的前列,具有“差评”的特征评价参数,会使该商品信息排在搜索结果的后面,使用户简单搜索即可获得想要的结果,无需多次提交搜索,也无需仔细辨认其真实评价信息,从而减轻了访问服务器的负担,减少了网络资源的占用,并提升了用户体验。
再者,本申请针对用于评价所述商品的电子信息进行分析,由于其通常使用客观且明确的词语以准确地表达商品的一些属性指标,故能够从中提取到描述商品的某些属性指标的词语,比如外形,质量,大小等等;因此,相对于现有技术提取形容词进行分析的方式,本申请提取的商品评价关键词更具备客观性和准确性,故本申请能够有效克服中文的二义性和不确定性的影响,从而能够有效提高文本分析的准确度。
此外,现有技术需要循环比对以统计所有形容词在整个文章中出现的次数,虽然本申请在对所有句子中商品评价关键词对应的评价参数进行分类判别时也有可能需要统计不同评价参数的频度,但是,由于评价参数的类别十分有限,如仅有“好评”,“中评”,“差评”等,相对于形容词的种类而言是寥寥的,故本申请能够避免现有技术的循环比对,从而能够达到提高文本分析的效率。
附图说明
图1是本申请的一种基于电子信息的关键词提取及处理的方法实施例1的步骤流程图;
图2是本申请的一种基于电子信息的关键词提取及处理的方法实施例2的步骤流程图;
图3是本申请的一种基于电子信息的关键词提取及处理的方法实施例3的步骤流程图;
图4是本申请的一种基于电子信息的评价参数提取的方法实施例的步骤流程图;
图5是本申请的一种基于电子信息的商品搜索方法实施例的步骤流程图;
图6是本申请的一种基于电子信息的关键词提取及处理的装置实施例的结构框图;
图7是本申请的一种基于电子信息的评价参数提取的装置实施例的结构框图;
图8是本申请的一种基于电子信息的商品搜索装置实施例的结构框图;
图9是本申请的一种客户端的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
参考图1,其示出了本申请的一种基于电子信息的关键词提取及处理的方法实施例1的步骤流程图,具体可以包括如下步骤:
步骤101,接收商品的评价查看请求;
所述商品的评价查看请求可以为用户触发的请求,也可以系统自动触发的请求。以在电子商务中的应用为例,用户可以通过在商品的内容展现页面,通过点击“商品评价”的控件选项发起针对某个商品的评价查看请求;或如,商品的内容展现页面的相应位置需要展现该商品评价关键词,在这种情况下,当打开商品的内容展现页面时,系统会自动触发针对当前商品的评价查看请求。
一般而言,所述商品的评价查看请求从客户端或浏览器端提交至服务器,由服务器接收所述商品的评价查看请求。
需要说明的是,在本申请实施例中,所述商品不单指产品,还包括服务,虚拟产品等具有价值和使用价值的所有商品。
步骤102,依据所述商品的评价查看请求,获取对应的商品评价关键词;
在本申请实施例中,所述商品评价关键词具体可以通过以下子步骤获得:
子步骤S1021,获取用于评价所述商品的电子信息;
以下对所述子步骤S1021进一步说明:
在具体实现中,所述用于评价所述商品的电子信息可以包括商品的评价信息,商品的评论内容,商品的试用评论报告或文章,商品的使用评论报告或文章,商品的论坛交流内容等任一种评价、分析或描述该商品的电子信息,本申请对此不作限制。
作为本申请实施例具体应用的一种示例,可以通过在指定的数据库中定向收集用于评价所述商品的电子信息。所述指定的数据库可以包括特定网站的数据库或预先配置的数据库等,本申请对此不作限制。
为使本领域技术人员更好地理解本申请,以下提供两种依据所述商品的评价查看请求,获取用于评价所述商品的电子信息的具体方式
方式1:在指定的数据库中收集用于评价所述商品的电子信息:
例如,某些网站中会设置论坛数据库,即在该论坛数据库中会包括用户讨论,评价某些商品的内容和信息,或如,某些网站中会设置评论数据库,即在该评论数据库中会包括用户针对其买到的商品提交的评价信息,在定向收集时,只需要到指定数据库的位置,在相应的数据库中收集包含所述商品信息的电子信息,即可获得用于评价所述商品的电子信息。
方式2:利用爬虫技术抓取用于评价所述商品的电子信息:
公知的是,爬虫技术是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么利用爬虫技术就可以把互联网上所有的网页都抓取下来。在本实施例中,可以设置一些该商品的关键词,采用利用爬虫技术的搜索引擎,由搜索引擎基于爬虫技术的广度收集原理从网页中提取匹配的搜索结果,即用于评价所述商品的电子信息。
当然,上述依据所述商品的评价查看请求,获取用于评价所述商品的电子信息的具体方式仅仅用作示例,本申请对此不作限制,例如,本领域技术人员还可以利用搜索引擎通过预设的关键字获取相应商品的评论文章,并从所述商品的评论文章中提取出观点明确且满足预置格式内容要求的文章,作为商品的试用评论报告文章。由于试用评论报告文章观点明确,而且有一定的格式内容要求,所以这类文章的分析较其他的文章准确度要高很多,其通常会用一些比较明确且科学的词语,比如颜色、性能、味道、价格等能够准确地表达商品的一些属性指标;故也可以将试用评论报告文章作为所述用于评价所述商品的电子信息。
子步骤S1022,将所述电子信息分割为若干个句子;
以下对所述子步骤S1022进一步说明:
现有技术文本分析方法的前提是分词处理,也即现有技术需要首先根据存在的词库将一个文章分解为若干个词汇,然后提取其中的形容词。而本申请接下来要提取的是商品评价关键词,至于何为商品评价关键词,现有技术所采用的分词处理技术是无从得知的,故如果分词不当则会造成接下来提取商品评价关键词的准确性下降的问题。
在本申请实施例中不是采用分词分析法,而是采用分句分析法,具体而言,即针对所述用于评价所述商品的电子信息,以标点符号为分割点,分割成若干个句子,由于这些句子中的词语是连贯性的,不会对接下来商品评价关键词的提取产生坏的影响,即应用本申请实施例能提高所获取的商品评价关键词的准确性。
子步骤S1023,以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词。
以下对所述子步骤S1023进一步说明:
由于不同商品具有其对应的属性指标,如外形、质量、大小等,由于不同商品的属性指标不一样,故在本申请的一种优选实施例中,所述商品指标词库可以包括自上而下分级的多级词库,所述商品指标词库可以通过如下子步骤生成:
子步骤S231,按照预设的商品主类别分别建立对应的一级商品指标词库;
子步骤S232,按照所述商品主类别预设的子类别,分别建立对应的二级商品指标词库;
子步骤S233,当所述子类别存在更下一级的从属类别时,分别逐级建立对应的从属级别商品指标词库;
其中,各级商品指标词库中包括相应类别的商品集合的属性特征词,所述属性特征词可以理解为描述商品属性指标的词语。例如,对于主类别为电器商品的一级商品指标词库中包括用于描述功率、耗电量、工作电压等属性指标的属性特征词,对于主类别为食品的一级商品指标词库中包括用于描述颜色、口感、味道等属性指标的属性特征词,如相对于“味道”这个属性指标的属性特征词可以包括“甜”,“酸”,“咸”。
应用本申请实施例,对应于不同商品的主类别,首先会建立起一级商品指标词库,这个词库中会包括对应主类别商品集合的属性特征词,例如,针对“手表”的主类别设置一个一级商品指标词库,这个词库中会包括描述手表这类商品的共同属性指标的属性特征词;对于在商品主类别下有细分子类别的商品,还可对应于不同的子类别,建立对应的二级商品指标词库,这个词库中会包括对应子类别商品集合的属性特征词;例如,在手表的主类别下,还包括电子表和机械表两个子类别,则可以针对电子表和机械表两个子类别分别设置两个二级商品指标词库。将电子表和机械表不同的属性特征词分别划分到各自对应的二级商品指标词库中,将电子表和机械表共同的属性特征词,归纳到他们所属的手表主类别的一级商品指标词库中。这种处理方式可以大大减少商品指标词库中数据的冗余。
如果在某个商品的子类别下,还有进一步细分的从属类别,则还可以分别逐级建立对应的从属级别商品指标词库;例如,在“食品”这个商品主类别下,具有“饮料”的子类别,在“饮料”这个子类别下,进一步有“碳酸饮料”这个从属类别,则对应“食品”商品的集合,提取相应的属性特征词,形成一级商品指标词库;对应“饮料”商品的集合,提取相应的属性特征词,形成二级商品指标词库;对于“碳酸饮料”商品的集合,提取相应的属性特征词,形成三级商品指标词库。
本领域技术人员在实际中可以实时或定时更新所述商品指标词库,随着商品指标词库中商品评价关键词的不断添加补充,从句子中提取出匹配成功的商品评价关键词会越来越多,从而能够提高关键词匹配的准确度。
为减少关键词匹配过程中的运算量,细化和结构化关键词提取过程,提高关键词提取的准确率,在本申请的一种优选实施例中,所述商品指标词库采用了自下而下分级的层级结构,在这种情况下,所述子步骤S1023可以为,以句子为单位,将各句子自上而下逐级与各级商品指标词库中的商品评价关键词进行匹配,获得从各级商品指标词库中匹配成功的商品评价关键词。具体而言,可以按照如下方式进行操作:
1)确定当前句子所对应的商品指标词库的层级;
2)将当前句子中的词语与该层级商品指标词库中的商品评价关键词进行匹配,获得匹配成功的商品评价关键词,假设为第一候选商品评价关键词;
3)确定当前句子所对应的商品指标词库的下一层级;
4)将当前句子中的词语与该下一层级商品指标词库中的商品评价关键词进行匹配,获得匹配成功的商品评价关键词,假设为第二候选商品评价关键词;
5)若该下一层级商品指标词库已是最下一级商品指标词库,即该下一层级商品指标词库已无从属级别的商品指标词库,则执行步骤6),否则返回步骤4),继续下一层级商品指标词库的商品评价关键词的匹配及提取。
6)将所述第一候选商品评价关键词和第二候选商品评价关键词组织为当前句子匹配成功的商品评价关键词,即当前句子匹配的关键词提取结果。
例如,假设存在一种商品类别的层级结构为:
食品->饮料->碳酸饮料->口感
应用本申请实施例,生成了如下分成四个层级商品指标词库:
对应“食品”的一级商品指标词库,对应“饮料”的二级商品指标词库,对应“碳酸饮料”的三级商品指标词库,对应“口感”的四级商品指标词库,其中,假设在所述四级商品指标词库中包括3个商品评价关键词,分别是好喝、难喝、酸甜。
应用上述4层级的商品指标词库对句子“今天我给大家介绍一个健力宝公司最新出品的碳酸饮料,名字叫芒果多,这款饮料采用了鲜榨的芒果汁,味道酸甜,非常好喝”进行匹配,可以首先确定当前句子所对应的商品指标词库的层级——“饮料”层,遍历对应“饮料”的二级商品指标词库,提取出匹配的商品评价关键词(假设本例中没有在此层级匹配的关键词),然后,确定当前句子所对应的商品指标词库的下一层级——“碳酸饮料”层,遍历对应“碳酸饮料”的三级商品指标词库,提取出匹配的商品评价关键词(假设本例中没有在此层级匹配的关键词),然后,确定当前句子所对应的商品指标词库的下一层级——“口感”层,遍历对应“口感”的四级商品指标词库,提取出匹配的商品评价关键词“好喝”“酸甜”。
综上,本申请的优选实施例可以根据商品指标词库中的层级去匹配句子,看某一层级的词语能否匹配,如果可以匹配,再去匹配下一层级的词语,直到全部匹配完毕为止。显然这种方式可以有效减少关键词匹配过程中的运算量,大大提高处理效率并节省资源。
当然,所述商品指标词库也可以不采用自上而下分级的多层级结构,而采用一个包含各类型商品的商品评价关键词的数据库,当采用这种词库时,所述句子在词库中的匹配采用一般的遍历及匹配文本提取的方式即可。例如,假设商品指标词库中存储了饮料、味道、甜、碳酸饮料、芒果、酸甜、好喝等商品评价关键词,以句子“这种饮料的味道很甜”为例,则可以从中提取出“饮料”、“味道”和“甜”作为匹配成功的商品评价关键词;以句子“今天我给大家介绍一个健力宝公司最新出品的碳酸饮料,名字叫芒果多,这款饮料采用了鲜榨的芒果汁,味道酸甜,非常好喝”为例,则可以从中提取出“碳酸饮料”、“芒果”、“味道”、“酸甜”、“好喝”作为匹配成功的商品评价关键词。
在实际中,句子的长短是不一样的,对于较短的句子,可以直接将其与商品指标词库进行匹配,查找有没有符合的商品评价关键词。对于较长的句子,如果直接匹配容易增加匹配的运算量。在这种情况下,可以在所述子步骤S1023之前,执行如下子步骤:
子步骤S1023a,将各个句子与预置的非关键词词库中的非商品评价关键词进行匹配,去除各个句子中匹配成功的非商品评价关键词。
本实施例的主要作用是去掉一些干扰语句的非商品评价关键词,比如“啊”、“的”、“你,我,他”等一些语气助词,感叹词,介词等等,使对商品评价关键词的更加地精确,减少匹配的运算量,提高匹配的效率。
在本申请的一种优选实施例中,在所述子步骤S1023之前,还可以执行如下子步骤:
子步骤S1023b,去除每个句子中重复的词语。
在实际中,以句子为一个长度单位,来统计其中有没有重复的词语,如果有重复的先去掉,最后和商品指标词库进行匹配,查找匹配的商品评价关键词。
需要说明的是,上述子步骤S1023a和子步骤S1023b的技术方案可以同时采用或择一采用,在同时采用所述子步骤S1023a和子步骤S1023b的技术方案时,本申请对二者的执行顺序不作限制。
上述子步骤S1021~S1023的处理涉及文本分析的处理过程。本申请实施例中所采用的文本分析处理与现有技术有较大差别,为使本领域技术人员更好地理解本申请,以下对此进行详细对比说明:
现有技术的文本分析方法通常是收集产品的大量评论文章,并对每一文章进行分析,具体的分析过程包括:首先对整个文章进行分词处理,然后提取所有的形容词,再通过一形容词占整个文章的权值来做相应的分析,并把分析结果与词库进行比对,得出该形容词在整个文章的广度和特征值,如此循环直到把所有的形容词都比对完毕,最终得出倾向性的分析结果。
现有技术具有如下缺陷:
一、准确度低:
中文的最大特点是具有二义性和不确定性,而且中文的词语的语义和上下文的环境有着密切的联系,因此,现有技术生硬地提取形容词并不一定能准确地分析倾向,例如,有一句话“这样的人,他怎么能是一个坏人呢?”,其是褒义和赞扬的,但是使用现有技术的方法,其会提取出“坏人”这样的词语,在经过分析,就会得出这是贬义和反对的观点。
二、效率低:
现有技术需要统计所有形容词的词频和权重,也就是说,这个形容词在整个文章中出现了多少次,这个形容词在所有的形容词中排列的位置是多少(高频,低频,中频等),这就需要大量的统计运算,其中还涉及许多重复计算,这个效率是很低的。
相对于现有技术对普通的产品评论文章进行分析,本申请针对用于评价所述商品的电子信息进行分析,由于其通常使用客观且明确的词语以准确地表达商品的一些属性指标,故能够从中提取到描述商品的某些属性指标的词语,比如外形,质量,大小等等;因此,相对于现有技术提取形容词进行分析的方式,本申请提取的商品评价关键词更具备客观性和准确性,故本申请能够有效克服中文的二义性和不确定性的影响,从而能够有效提高文本分析的准确度。
再者,现有技术需要循环比对以统计所有形容词在整个文章中出现的次数,虽然本申请在对所有句子中商品评价关键词对应的评价参数进行分类判别时也有可能需要统计不同评价参数的频度,但是,由于评价参数的类别十分有限,如仅有“好评”,“中评”,“差评”等,相对于形容词的种类而言是寥寥的,故本申请能够避免现有技术的循环比对,从而能够达到提高文本分析的效率。
步骤103,返回所述商品评价关键词;
在具体实现中,可以由服务器进行上述接收商品的评价查看请求,获取对应的商品评价关键词的处理后,向客户端或浏览器或其它对端设备返回所述对应的商品评价关键词。所述商品评价关键词可以预先提取出来保存在某个存储位置,如某个数据库中,当服务器接到商品的评价查看请求在相应的存储位置直接提取商品该请求对应的商品评价关键词并返回给对端设备即可;在实际中,也可由服务器在接到商品的评价查看请求时,即时获取用于评价所述商品的电子信息并按句匹配得到对应的商品评价关键词再返回给对端设备。本领域技术人员根据实际情况采用任一种方案均是可行的,本申请对此无需加以限制。
本申请实施例可由本领域技术人员依据任一种应用场景在各种客户端,web页面,系统界面,应用程序界面等的预设位置展示所述商品评价关键词。例如,在商品的展现页面,或商品评价的展现页面,或商品的推广页面等展示所述商品评价关键词等,本申请对此不作限制。
在具体实现中,本申请实施例还可以包括如下步骤:
返回所述匹配成功的商品评价关键词所对应的句子或句子中的部分内容。
应用本申请实施例,还可以依据实际情况把匹配成功的商品评价关键词及其所在的句子均返回给客户端,浏览器或其它对端设备,由客户端,浏览器或其它对端设备展示商品评价关键词及其所在的句子,以供用户做更为详细的参考。当然,本申请对所述展示的方式不作限制。
进一步而言,还可以依据实际情况向客户端,浏览器或其它对端设备返回所述商品评价关键词及其所在的句子的部分内容,例如,商品评价关键词为“不错”,则可以将其与相应的句子中的部分内容(如主语)组合得到“手机不错”进行展示;又如,商品评价关键词为“正规”,则可以将其与相应的句子中的部分内容(如主语)组合得到“包装正规”进行展示;再如,商品评价关键词为“一般”,则可以将其与相应的句子中的部分内容(如主语)组合得到“配件一般”进行展示,本申请实施例对所述展示的方式及内容均不作限制。
参考图2,其示出了本申请的一种基于电子信息的关键词提取的信息推送方法实施例2的步骤流程图,具体可以包括如下步骤:
步骤201,接收商品的评价查看请求;
步骤202,依据所述商品的评价查看请求,获取对应的商品评价关键词;
本步骤具体包括如下子步骤S2021~S2023:
子步骤S2021,依据所述商品的评价查看请求,获取用于评价所述商品的电子信息;
子步骤S2022,将所述电子信息分割为若干个句子;
子步骤S2023,以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词。
步骤203,返回所述商品评价关键词;
本方法实施例2中步骤201至步骤203与上述方法实施例1的步骤101至步骤103类似,在此不再详述。本方法实施例2还可以包括如下步骤:
步骤204,获取各商品对应的商品评价关键词所映射的评价参数;
作为本申请实施例在电子在交易平台中的应用,所述评价参数可以理解为“好评”、“中评”与“差评”,或“褒义”、“中性”和“贬义”等用以对商品作出评价的参数,在本申请实施例中,所述评价参数可以用于确定作者在句子中表达的观点。
在本申请的一种优选实施例中,所述步骤204可以进一步包括如下子步骤:
子步骤S2041,预置多个评价参数,及各评价参数对应的商品评价关键词词库;
如上例,本申请可以预置“好评”、“中评”与“差评”三个评价参数,或“褒义”、“中立”和“贬义”等诸如此类的评价参数。
子步骤S2042,获取各商品对应的商品评价关键词,分别判断各商品评价关键词所归属的商品评价关键词词库,将所述商品评价关键词词库所对应的评价参数,确定为各商品评价关键词对应的评价参数。
以下提供一种商品评价关键词词库内容的示例,其中,表1为评价参数“好评”所对应的商品评价关键词(词库中部分内容示例);表2为评价参数“中评”所对应的商品评价关键词(词库中部分内容示例)表3为评价参数“差评”所对应的商品评价关键词(词库中部分内容示例)。
表1:
评价参数 商品评价关键词
好评 舒服
好评 美观
好评 大方
好评 实用
好评 效果好
好评 好喝
表2:
评价参数 商品评价关键词
中评 还行
中评 不好不坏
表3:
评价参数 商品评价关键词
差评 难喝
差评 难看
差评 难闻
差评 寿命短
差评 料子差
依据所述商品评价关键词词库中,商品评价关键词与评价参数之间的对应关系,即可获得所述商品评价关键词对应的评价参数。例如,对于从前述示例中提取出的商品评价关键词“好喝”,其对应的评价参数即为“好评”。需要说明的是,一个商品所对应的商品评价关键词所映射的评价参数可以为一个,也可以为多个。
步骤205,统计各商品评价关键词所映射的不同评价参数分别所占的比例;
可以理解,各商品对应的商品评价关键词所映射的评价参数实际上是对商品评价关键词赋予其包括评价参数的属性,即在本申请的一种示例中,可将某个商品对应的商品评价关键词区分为好评关键词,中评关键词和/或差评关键词,所述步骤205实际上就是统计所述好评关键词在该商品对应的所有商品评价关键词中所占的比例,所述中评关键词在该商品对应的所有商品评价关键词中所占的比例,和/或,所述差评关键词在该商品对应的所有商品评价关键词中所占的比例。比如,统计获得某商品A的商品评价关键词所映射的不同评价参数分别所占的比例为,好评:49.72%,差评:25.63%,中评:24.65%。
步骤206,返回各评价参数及所占比例。
应用本申请实施例,可以由服务器将各评价参数及所占比例返回给客户端,浏览器或其它对端设备,由客户端,浏览器或其它对端设备展示各评价参数及所占比例,以供用户参考。本申请实施例可由本领域技术人员依据任一种应用场景在各种客户端,web页面,系统界面,应用程序界面等的预设位置展示所述评价参数及所占比例。例如,在商品的展现页面,或商品评价的展现页面,或商品的推广页面等展示所述评价参数及所占比例等,本申请对此不作限制。应用本申请实施例,本领域技术人员还可以依据实际情况把匹配成功的商品评价关键词及其对应的评价参数和占比在同一页面或不同页面均列举出来,以供用户做更为详细的参考。当然,本申请对所述展示的方式及内容不作限制。
参考图3,其示出了本申请的一种基于电子信息的关键词提取的信息推送方法实施例3的步骤流程图,具体可以包括如下步骤:
步骤301,接收商品的评价查看请求;
步骤302,依据所述商品的评价查看请求,获取对应的商品评价关键词;
本步骤具体包括如下子步骤S3021~S3023:
子步骤S3021,依据所述商品的评价查看请求,获取用于评价所述商品的电子信息;
子步骤S3022,将所述电子信息分割为若干个句子;
子步骤S3023,以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词。
步骤303,展示所述商品评价关键词;
步骤304,获取各商品对应的商品评价关键词所映射的评价参数;
步骤305,统计各商品评价关键词所映射的不同评价参数分别所占的比例;
本方法实施例3中步骤301至步骤303与上述方法实施例1的步骤101至步骤103类似,步骤304至步骤305与上述方法实施例2中的步骤204至步骤205类似,在此不再详述。本方法实施例3还可以包括如下步骤:
步骤306,依据各评价参数所占的比例提取特征评价参数;
其中,所述特征评价参数可以为所述各商品评价关键词所映射的评价参数所占的比例超过一定阈值的评价参数,即在各商品评价关键词所映射的某个评价参数所占的比例超过一定阈值时,将该评价参数提取为特征评价参数,所述阈值可以由本领域技术人员依据实际情况任意设置,如为褒义评价参数所占比例大于40%,或者,褒义、贬义和中立评价参数对应的比例阈值范围分别为>60%,≥50%且≤60%,<50%等。
作为另一示例,所述特征评价参数还可以为,所占比例高于其它评价参数所占比例的评价参数。即在某个评价参数所占比例高于其它评价参数所占比例时,将该评价参数提取为特征评价参数。
上述两个特征评价参数的判断条件可以择一使用或组合使用,本申请对此不作限制。
例如,假设某商品的商品评价关键词映射的评价参数包括“褒义”、“中性”和“贬义”,各评价参数所占的比例为:
褒义:49.72%,贬义:25.63%,中性:24.65%;
由于“褒义”这个评价参数所占的比例49.72%超出一定阈值40%,且高于其它两个评价参数所占的比例,故可以将“褒义”提取为特征评价参数。
步骤307,参考所述特征评价参数及其所占比例,调整该商品的搜索排序权重。
本申请实施例可以用于商品检索的应用场景中。当接收到用户发起的商品搜索请求时,可以依据用户输入的搜索关键词或其它信息获得匹配的商品搜索结果,在向用户返回所述商品搜索结果时,即可针对匹配的商品信息记录,参考该商品对应的特征评价参数及其所占比例对其排序位置进行调整,例如,若在商品搜索结果中,商品A对应的特征评价参数及其所占比例为褒义:49.72%,商品B对应的特征评价参数及其所占比例为褒义:35.72%,则在返回的商品搜索结果中,将商品A的搜索结果记录排在商品B的搜索结果记录之前。或如,若在商品搜索结果中,商品C对应的特征评价参数及其所占比例为贬义:65.82%,则将该商品C的搜索排序权利调整为-1.0等。具体调整商品搜索排序权重的方法由本领域技术人员任意选用即可,本申请对此无需加以限制。
在具体实现中,还可以根据特征评价参数对商品进行标记,如某个商品的特征评价参数为“好评”,则在数据库中对该商品增加“好评”的标记,然后可以向用户提供基于所述特征评价参数的检索条件或选项,当用户选择采用所述特征评价参数进行商品搜索时,可以只针对具有所述特征评价参数标记的商品信息发起搜索,例如,用户想要检索“好评”多的商品,系统就可以自动去搜索标记有“好评”这个特征评价参数的商品。
参考图4,其示出了本申请的一种基于电子信息的评价参数提取的信息推送方法实施例的步骤流程图,具体可以包括如下步骤:
步骤401,接收商品的评价查看请求;
步骤402,依据所述商品的评价查看请求,获取对应的评价参数;其中,所述评价参数通过以下子步骤获得:
子步骤S4021,获取用于评价所述商品的电子信息;
子步骤S4022,将所述电子信息分割为若干个句子;
子步骤S4023,以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;
子步骤S4024,获取各商品对应的商品评价关键词所映射的评价参数;
本方法实施例中步骤401与上述关键词提取及处理的方法实施例1的步骤101类似,本方法实施例中步骤402的子步骤S4021~S4023与上述关键词提取及处理的方法实施例1的子步骤S1021~S1023类似,子步骤S4024与上述关键词提取及处理的方法实施例2中的步骤204类似,在此不再详述。
本申请实施例还可以包括如下步骤:
步骤403,返回所述对应的评价参数。
应用本申请实施例,可以由服务器将各评价参数返回给客户端,浏览器或其它对端设备,由客户端,浏览器或其它对端设备展示各评价参数,以供用户参考。
作为本申请实施例具体应用的一种优选示例,还可以包括如下步骤:
统计各商品评价关键词所映射的不同评价参数分别所占的比例;
返回各评价参数分别所占的比例。
上述新增的步骤与上述关键词提取及处理的方法实施例2中的步骤204至步骤205和206类似,在此不再详述。
参考图5,示出了一种基于电子信息的商品搜索方法实施例的步骤流程图,具体可以包括如下步骤:
步骤501,接收商品的搜索请求;
所述商品的搜索请求可以为由客户端,浏览器或其它对端设备基于用户操作触发的针对商品发起的搜索请求,可以是包含搜索关键词的请求,也可以为包含其它搜索条件的搜索请求,例如,用户在某电子商务网站的站内搜索引擎中输入“冬装新款”,再点击“搜索”的预设控件,就会生成一个商品的搜索请求并提交至服务器。
当然,上述请求的内容及形式仅仅用作示例,本申请对此不作限制。
步骤502,依据所述商品的搜索请求,获取对应的商品信息及其搜索排序权重;
其中,所述搜索排序权重参考特征评价参数及其所占比例进行调整,所述特征评价参数及其所占比例通过以下子步骤获得:
子步骤S5021,获取用于评价所述商品信息的电子信息;
子步骤S5022,将所述电子信息分割为若干个句子;
子步骤S5023,以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;
子步骤S5024,获取各商品信息对应的商品评价关键词所映射的评价参数;
子步骤S5025,统计各商品评价关键词所映射的不同评价参数分别所占的比例;
子步骤S5026,依据各评价参数所占的比例提取特征评价参数,所述特征评价参数为所述各商品评价关键词所映射的评价参数所占的比例超过一定阈值的评价参数,和/或,所占比例高于其它评价参数所占比例的评价参数。
本方法实施例中步骤502的子步骤S5021~S5023与上述关键词提取及处理的方法实施例1的子步骤S1021~S1023类似,本方法实施例中步骤502的子步骤S5024~S5025与上述关键词提取及处理的方法实施例2中的步骤204~205类似,本方法实施例中步骤502的子步骤S5026与上述关键词提取及处理的方法实施例3中的步骤306类似,在此不再详述。
步骤503,按照所述搜索排序权重从大至小对所述商品信息进行排序并返回。
在本申请实施例中,对于依据商品的搜索请求收集的搜索结果(商品信息),会具有搜索排序权重,并且该搜索排序权重参考了商品信息的特征评价参数及其所占的比例,例如,若在商品搜索结果中,商品信息A对应的特征评价参数及其所占比例为褒义:49.72%,商品信息B对应的特征评价参数及其所占比例为褒义:35.72%,则在返回的商品搜索结果中,将商品A的搜索结果记录排在商品B的搜索结果记录之前。针对当次商品的搜索请求所对应的搜索结果全部按照搜索排序权重排序后,服务器会将排序后的搜索结果返回给客户端,浏览器或其它对端设备。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请所必须的。
参照图6,其示出了本申请的一种基于电子信息的关键词提取的信息推送装置实施例的结构框图,具体可以包括如下模块:
评价查看请求接收模块601,用于接收商品的评价查看请求;
关键词提取模块602,用于依据所述商品的评价查看请求,获取对应的商品评价关键词;其中,所述商品评价关键词通过以下方式获得:获取用于评价所述商品的电子信息;将所述电子信息分割为若干个句子;以及,以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;
关键词返回模块603,用于返回所述商品评价关键词。
在本申请的一种优选实施例中,所述用于评价所述商品的电子信息可以在指定的数据库中收集,也可以利用爬虫技术抓取获得。
作为本申请实施例具体应用的一种示例,所述商品指标词库可以包括自上而下分级的多级词库,所述预置的商品指标词库可以通过如下子模块生成:
第一词库建立子模块,用于按照预设的商品主类别分别建立对应的一级商品指标词库;
第二词库建立子模块,用于按照所述商品主类别预设的子类别,分别建立对应的二级商品指标词库;
第三词库建立子模块,用于当所述子类别存在更下一级的从属类别时,分别逐级建立对应的从属级别商品指标词库;
其中,各级商品指标词库中可以包括相应类别的商品集合的属性特征词,所述属性特征词可以为描述商品属性指标的词语。
在这种情况下,所述以句子为单位,将其与商品指标词库中的关键词进行匹配,从中提取出匹配成功的关键词的处理为:
以句子为单位,将各句子自上而下逐级与各级商品指标词库中的商品评价关键词进行匹配;
获得从各级商品指标词库中匹配成功的商品评价关键词。
在本申请的一种优选实施例中,所述关键词提取模块602还可以包括如下子模块:
第一提取子模块,用于将各个句子与预置的非关键词词库中的非商品评价关键词进行匹配,去除各个句子中匹配成功的非商品评价关键词;
第二提取子模块,用于去除各个句子中重复的词语;
在具体实现中,本申请实施例还可以包括如下模块:
内容返回模块,用于返回所述匹配成功的商品评价关键词所对应的句子或句子中的部分内容。
在本申请的另一种优选实施例中,所述装置实施例还可以包括如下模块:
评价参数获取模块,用于获取各商品对应的商品评价关键词所映射的评价参数;
比例统计模块,用于统计各商品评价关键词所映射的不同评价参数分别所占的比例;
比例返回模块,用于展示各评价参数及所占比例,
作为本申请实施例具体应用的一种示例,所述评价参数获取模块还可以包括如下子模块:
预置子模块,用于预置多个评价参数,及各评价参数对应的商品评价关键词词库;
关键词获取子模块,用于获取各商品对应的商品评价关键词,分别判断各商品评价关键词所归属的商品评价关键词词库,将所述商品评价关键词词库所对应的评价参数,确定为各商品评价关键词对应的评价参数。
在本申请的一种优选实施例中,所述装置实施例还可以包括如下模块:
特征评价参数提取模块,用于依据各评价参数所占的比例提取特征评价参数,所述特征评价参数为所述各商品评价关键词所映射的评价参数所占的比例超过一定阈值的评价参数,和/或,所占比例高于其它评价参数所占比例的评价参数;
调整模块,用于参考所述特征评价参数及其所占比例,调整该商品的搜索排序权重。
参考图7,示出了本申请的一种基于电子信息的评价参数提取的信息推送装置实施例的结构框图,具体可以包括如下模块:
评价查看请求接收模块701,用于接收商品的评价查看请求;
评价参数获取模块702,用于依据所述商品的评价查看请求,获取对应的评价参数;其中,所述评价参数通过以下方式获得:获取用于评价所述商品的电子信息;将所述电子信息分割为若干个句子;以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;以及,获取各商品对应的商品评价关键词所映射的评价参数;
评价参数返回模块703,用于返回所述对应的评价参数。
参考图8,示出了本申请的一种基于电子信息的商品搜索装置实施例的结构框图,具体可以包括如下模块:
搜索请求接收模块801,用于接收商品的搜索请求;
搜索处理模块802,用于依据所述商品的搜索请求,获取对应的商品信息及其搜索排序权重;
排序返回模块803,用于按照所述搜索排序权重从大至小对所述商品信息进行排序并返回;
其中,所述搜索排序权重参考特征评价参数及其所占比例进行调整,所述特征评价参数及其所占比例通过以下方式获得:
获取用于评价所述商品信息的电子信息;
将所述电子信息分割为若干个句子;
以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;
获取各商品信息对应的商品评价关键词所映射的评价参数;
统计各商品评价关键词所映射的不同评价参数分别所占的比例;
依据各评价参数所占的比例提取特征评价参数,所述特征评价参数为所述各商品评价关键词所映射的评价参数所占的比例超过一定阈值的评价参数,和/或,所占比例高于其它评价参数所占比例的评价参数。
参考图9,示出了本申请的一种客户端的结构框图,具体可以包括如下模块:
请求模块901,用于向服务器提交请求,所述请求包括商品的评价查看请求,和/或,商品的搜索请求;
结果获取模块902,用于接收服务器针对所述请求返回的处理结果,所述针对请求返回处理结果包括针对商品的评价查看请求返回的对应的商品评价关键词和/或评价参数,和/或,针对商品的搜索请求返回的经过排序的商品信息。
在本申请实施例中,所述对应的商品评价关键词由服务器通过以下方式获得:获取用于评价所述商品的电子信息;将所述电子信息分割为若干个句子;以及,以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;
所述评价参数由服务器通过以下方式获得:获取用于评价所述商品的电子信息;将所述电子信息分割为若干个句子;以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;以及,获取各商品对应的商品评价关键词所映射的评价参数;
所述搜索排序权重由服务器依据特征评价参数及其所占比例进行调整,所述特征评价参数及其所占比例由服务器通过以下方式获得:
获取用于评价所述商品信息的电子信息;
将所述电子信息分割为若干个句子;
以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;
获取各商品信息对应的商品评价关键词所映射的评价参数;
统计各商品评价关键词所映射的不同评价参数分别所占的比例;
依据各评价参数所占的比例提取特征评价参数,所述特征评价参数为所述各商品评价关键词所映射的评价参数所占的比例超过一定阈值的评价参数,和/或,所占比例高于其它评价参数所占比例的评价参数。
由于所述装置实施例基本相应于前述方法实施例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此就不赘述了。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
最后,还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种多数据源的数据集成处理方法,以及,一种多数据源的数据集成装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (17)

1.一种基于电子信息的关键词提取的信息推送方法,其特征在于,包括:
接收商品的评价查看请求;
依据所述商品的评价查看请求,获取对应的商品评价关键词;
返回所述对应的商品评价关键词;
其中,所述商品评价关键词通过以下步骤获得:
获取用于评价所述商品的电子信息;
将所述电子信息分割为若干个句子;
以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;所述商品指标词库包括自上而下分级的多级词库,各级商品指标词库中包括相应类别的商品集合的属性特征词,所述属性特征词为描述商品属性指标的词语。
2.如权利要求1所述的方法,其特征在于,所述获取用于评价所述商品的电子信息的子步骤进一步包括:
在指定的数据库中收集用于评价所述商品的电子信息;
和/或,
利用爬虫技术抓取用于评价所述商品的电子信息。
3.如权利要求1或2所述的方法,其特征在于,所述预置的商品指标词库通过如下子步骤生成:
按照预设的商品主类别分别建立对应的一级商品指标词库;
按照所述商品主类别预设的子类别,分别建立对应的二级商品指标词库;
当所述子类别存在更下一级的从属类别时,分别逐级建立对应的从属级别商品指标词库。
4.如权利要求3所述的方法,其特征在于,所述以句子为单位,将其与商品指标词库中的关键词进行匹配,从中提取出匹配成功的关键词的步骤为,
以句子为单位,将各句子自上而下逐级与各级商品指标词库中的商品评价关键词进行匹配,获得从各级商品指标词库中匹配成功的商品评价关键词。
5.如权利要求4所述的方法,其特征在于,所述商品评价关键词还通过以下步骤获得:
将各个句子与预置的非关键词词库中的非商品评价关键词进行匹配,去除各个句子中匹配成功的非商品评价关键词;
和/或,
去除各个句子中重复的词语。
6.如权利要求1所述的方法,其特征在于,还包括:
返回所述匹配成功的商品评价关键词所对应的句子或句子中的部分内容。
7.如权利要求1所述的方法,其特征在于,还包括:
获取各商品对应的商品评价关键词所映射的评价参数。
8.如权利要求7所述的方法,其特征在于,还包括:
统计各商品评价关键词所映射的不同评价参数分别所占的比例。
9.如权利要求8所述的方法,其特征在于,还包括:
返回各评价参数及所占比例。
10.如权利要求7或8或9所述的方法,其特征在于,所述获取各商品对应的商品评价关键词所映射的评价参数的步骤包括:
预置多个评价参数,及各评价参数对应的商品评价关键词词库;
获取各商品对应的商品评价关键词,分别判断各商品评价关键词所归属的商品评价关键词词库,将所述商品评价关键词词库所对应的评价参数,确定为各商品评价关键词对应的评价参数。
11.如权利要求9所述的方法,其特征在于,还包括:
依据各评价参数所占的比例提取特征评价参数,所述特征评价参数为所述各商品评价关键词所映射的评价参数所占的比例超过一定阈值的评价参数,和/或,所占比例高于其它评价参数所占比例的评价参数;
参考所述特征评价参数及其所占比例,调整该商品的搜索排序权重。
12.一种基于电子信息的评价参数提取的信息推送方法,其特征在于,包括:
接收商品的评价查看请求;
依据所述商品的评价查看请求,获取对应的评价参数;
返回所述对应的评价参数;
其中,所述评价参数通过以下步骤获得:
获取用于评价所述商品的电子信息;
将所述电子信息分割为若干个句子;
以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;所述商品指标词库包括自上而下分级的多级词库,各级商品指标词库中包括相应类别的商品集合的属性特征词,所述属性特征词为描述商品属性指标的词语;
获取各商品对应的商品评价关键词所映射的评价参数。
13.一种基于电子信息的商品搜索方法,其特征在于,包括:
接收商品的搜索请求;
依据所述商品的搜索请求,获取对应的商品信息及其搜索排序权重;
按照所述搜索排序权重对所述商品信息进行排序并返回;
其中,所述搜索排序权重参考特征评价参数及其所占比例进行调整,所述特征评价参数及其所占比例通过以下步骤获得:
获取用于评价所述商品信息的电子信息;
将所述电子信息分割为若干个句子;
以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;所述商品指标词库包括自上而下分级的多级词库,各级商品指标词库中包括相应类别的商品集合的属性特征词,所述属性特征词为描述商品属性指标的词语;
获取各商品信息对应的商品评价关键词所映射的评价参数;
统计各商品评价关键词所映射的不同评价参数分别所占的比例;
依据各评价参数所占的比例提取特征评价参数,所述特征评价参数为所述各商品评价关键词所映射的评价参数所占的比例超过一定阈值的评价参数,和/或,所占比例高于其它评价参数所占比例的评价参数。
14.一种基于电子信息的关键词提取的信息推送装置,其特征在于,包括:
评价查看请求接收模块,用于接收商品的评价查看请求;
关键词提取模块,用于依据所述商品的评价查看请求,获取对应的商品评价关键词;其中,所述商品评价关键词通过以下方式获得:获取用于评价所述商品的电子信息;将所述电子信息分割为若干个句子;以及,以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;所述商品指标词库包括自上而下分级的多级词库,各级商品指标词库中包括相应类别的商品集合的属性特征词,所述属性特征词为描述商品属性指标的词语;
关键词返回模块,用于返回所述商品评价关键词。
15.一种基于电子信息的评价参数提取的信息推送装置,其特征在于,包括:
评价查看请求接收模块,用于接收商品的评价查看请求;
评价参数获取模块,用于依据所述商品的评价查看请求,获取对应的评价参数;其中,所述评价参数通过以下方式获得:获取用于评价所述商品的电子信息;将所述电子信息分割为若干个句子;以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;以及,获取各商品对应的商品评价关键词所映射的评价参数;所述商品指标词库包括自上而下分级的多级词库,各级商品指标词库中包括相应类别的商品集合的属性特征词,所述属性特征词为描述商品属性指标的词语;
评价参数返回模块,用于返回所述对应的评价参数。
16.一种基于电子信息的商品搜索装置,其特征在于,包括:
搜索请求接收模块,用于接收商品的搜索请求;
搜索处理模块,用于依据所述商品的搜索请求,获取对应的商品信息及其搜索排序权重;
排序返回模块,用于按照所述搜索排序权重从大至小对所述商品信息进行排序并返回;其中,所述搜索排序权重参考特征评价参数及其所占比例进行调整,所述特征评价参数及其所占比例通过以下方式获得:
获取用于评价所述商品信息的电子信息;
将所述电子信息分割为若干个句子;
以句子为单位,将其与预置的商品指标词库中的商品评价关键词进行匹配,从中提取出匹配成功的商品评价关键词;
获取各商品信息对应的商品评价关键词所映射的评价参数;所述商品指标词库包括自上而下分级的多级词库,各级商品指标词库中包括相应类别的商品集合的属性特征词,所述属性特征词为描述商品属性指标的词语;
统计各商品评价关键词所映射的不同评价参数分别所占的比例;
依据各评价参数所占的比例提取特征评价参数,所述特征评价参数为所述各商品评价关键词所映射的评价参数所占的比例超过一定阈值的评价参数,和/或,所占比例高于其它评价参数所占比例的评价参数。
17.一种客户端,其特征在于,包括:
请求模块,用于向服务器提交请求,所述请求包括商品的评价查看请求,和/或,商品的搜索请求;
结果获取模块,用于接收服务器针对所述请求返回的处理结果,所述针对请求返回处理结果包括针对商品的评价查看请求返回的对应的商品评价关键词和/或评价参数,和/或,针对商品的搜索请求返回的经过排序的商品信息;所述商品评价关键词为基于用于评价所述商品信息的电子信息包含的句子与预置的商品指标词库中的商品评价关键词之间的匹配得到;所述商品指标词库包括自上而下分级的多级词库,各级商品指标词库中包括相应类别的商品集合的属性特征词,所述属性特征词为描述商品属性指标的词语。
CN201210540338.7A 2012-12-13 2012-12-13 基于电子信息的关键词提取的信息推送、搜索方法及装置 Active CN103870973B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201210540338.7A CN103870973B (zh) 2012-12-13 2012-12-13 基于电子信息的关键词提取的信息推送、搜索方法及装置
TW102107874A TWI615724B (zh) 2012-12-13 2013-03-06 基於電子資訊的關鍵字提取的資訊推送、搜尋方法及裝置
US14/102,353 US20140172642A1 (en) 2012-12-13 2013-12-10 Analyzing commodity evaluations
JP2015547486A JP2016503914A (ja) 2012-12-13 2013-12-11 商品評価の分析
PCT/US2013/074280 WO2014093433A1 (en) 2012-12-13 2013-12-11 Analyzing commodity evaluations

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210540338.7A CN103870973B (zh) 2012-12-13 2012-12-13 基于电子信息的关键词提取的信息推送、搜索方法及装置

Publications (2)

Publication Number Publication Date
CN103870973A CN103870973A (zh) 2014-06-18
CN103870973B true CN103870973B (zh) 2017-12-19

Family

ID=50909485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210540338.7A Active CN103870973B (zh) 2012-12-13 2012-12-13 基于电子信息的关键词提取的信息推送、搜索方法及装置

Country Status (5)

Country Link
US (1) US20140172642A1 (zh)
JP (1) JP2016503914A (zh)
CN (1) CN103870973B (zh)
TW (1) TWI615724B (zh)
WO (1) WO2014093433A1 (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105373553B (zh) * 2014-08-25 2018-11-13 苏宁易购集团股份有限公司 一种发送采集数据的系统和方法
CN105450698B (zh) * 2014-08-25 2019-03-12 苏宁易购集团股份有限公司 一种曝光日志采集系统和方法
TW201619885A (zh) * 2014-11-17 2016-06-01 財團法人資訊工業策進會 電子商務口碑分析系統、方法和其電腦可讀取記錄媒體
CN105740223B (zh) * 2014-12-08 2019-04-26 联想(北京)有限公司 信息处理设备和信息处理方法
CN104463548B (zh) * 2014-12-25 2018-07-13 南京大学 一种多因素影响下的承运量化选择方法
CN104715049B (zh) * 2015-03-26 2017-11-28 无锡中科泛在信息技术研发中心有限公司 基于本体词库的商品评论属性词抽取方法
CN106294361B (zh) * 2015-05-15 2019-05-21 株式会社理光 信息提供方法以及信息提供系统
CN106651415B (zh) * 2015-10-30 2021-06-08 北京国双科技有限公司 关键词质量度检测的方法及装置
CN107203507B (zh) * 2016-03-17 2019-08-13 阿里巴巴集团控股有限公司 特征词汇提取方法及装置
CN107342879B (zh) * 2016-04-29 2020-06-05 北京京东尚科信息技术有限公司 用于确定向网络用户进行服务评价请求的方法、装置和计算机可读存储介质
CN106503258B (zh) * 2016-11-18 2020-05-12 深圳市世强元件网络有限公司 一种网站站内精确搜索方法
JP2018128925A (ja) * 2017-02-09 2018-08-16 富士通株式会社 情報出力プログラム、情報出力方法及び情報出力装置
CN108628818B (zh) * 2017-03-15 2021-10-26 百度在线网络技术(北京)有限公司 信息获取方法和装置
CN108984554B (zh) * 2017-06-01 2021-06-29 北京京东尚科信息技术有限公司 用于确定关键词的方法和装置
CN107330707A (zh) * 2017-06-15 2017-11-07 重庆柚瓣家科技有限公司 居家养老服务商的监管系统
TWI640882B (zh) * 2017-12-26 2018-11-11 七法股份有限公司 法學資料探勘系統及法學資料探勘方法
CN110245997A (zh) * 2018-03-08 2019-09-17 阿里巴巴集团控股有限公司 获取商品信息的方法、装置、系统、设备和存储介质
JP6982546B2 (ja) * 2018-06-06 2021-12-17 ヤフー株式会社 情報提供装置、情報提供方法、およびプログラム
JP6679667B2 (ja) * 2018-07-06 2020-04-15 ヤフー株式会社 生成装置、生成方法及び生成プログラム
CN110929175A (zh) * 2018-08-30 2020-03-27 北京京东尚科信息技术有限公司 对用户评价进行评估的方法、装置、系统及介质
CN113302642A (zh) * 2018-11-22 2021-08-24 Y·尹 基于多语言标签的评价系统
CN111783445A (zh) * 2019-06-26 2020-10-16 北京沃东天骏信息技术有限公司 数据生成方法、装置、介质及电子设备
JP7379174B2 (ja) 2020-01-10 2023-11-14 日産自動車株式会社 評価装置及び評価方法
CN113254796A (zh) * 2020-02-12 2021-08-13 林韦廷 网络物件标签管理方法与系统
CN111428037B (zh) * 2020-03-24 2022-09-20 合肥科捷通科技信息服务有限公司 一种分析行为政策匹配性的方法
WO2021220406A1 (ja) * 2020-04-28 2021-11-04 エーアイエージェント株式会社 商品情報提供システム
CN112257798A (zh) * 2020-10-29 2021-01-22 广州新奥达云科技有限公司 基于电商平台的商品数据预警方法、装置、计算机设备
CN113779371A (zh) * 2020-11-12 2021-12-10 北京京东振世信息技术有限公司 评价对象的方法、装置、设备以及存储介质
US20230419374A1 (en) * 2020-12-11 2023-12-28 Mov Inc. Information processing system
CN113010639A (zh) * 2021-02-26 2021-06-22 济南浪潮高新科技投资发展有限公司 一种基于电商平台的商品分析方法及装置
CN116579351B (zh) * 2023-07-14 2024-03-19 广州淘通科技股份有限公司 一种用户评价信息的分析方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101515269A (zh) * 2008-02-20 2009-08-26 中国科学院自动化研究所 实现观点搜索引擎排序的方法
CN101667194A (zh) * 2009-09-29 2010-03-10 北京大学 基于用户评论文本特征的自动摘要方法及其自动摘要系统
CN101833560A (zh) * 2010-02-02 2010-09-15 哈尔滨工业大学 基于互联网的厂商口碑自动排序系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030101166A1 (en) * 2001-11-26 2003-05-29 Fujitsu Limited Information analyzing method and system
US7962461B2 (en) * 2004-12-14 2011-06-14 Google Inc. Method and system for finding and aggregating reviews for a product
US20070143122A1 (en) * 2005-12-06 2007-06-21 Holloway Lane T Business method for correlating product reviews published on the world wide Web to provide an overall value assessment of the product being reviewed
US8862591B2 (en) * 2006-08-22 2014-10-14 Twitter, Inc. System and method for evaluating sentiment
US7930302B2 (en) * 2006-11-22 2011-04-19 Intuit Inc. Method and system for analyzing user-generated content
US20080215571A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Product review search
AU2009260033A1 (en) * 2008-06-19 2009-12-23 Wize Technologies, Inc. System and method for aggregating and summarizing product/topic sentiment
US20110179009A1 (en) * 2008-09-23 2011-07-21 Sang Hyob Nam Internet-based opinion search system and method, and internet-based opinion search and advertising service system and method
KR101005337B1 (ko) * 2008-09-29 2011-01-04 주식회사 버즈니 웹 문서에서의 의견 추출 및 분석 장치 및 그 방법
WO2011005876A1 (en) * 2009-07-07 2011-01-13 Logix Fusion, Inc. Method of sharing information and positive ratings of products, services, individuals and organizations in a social network
GB2488925A (en) * 2009-12-09 2012-09-12 Ibm Method of searching for document data files based on keywords,and computer system and computer program thereof
JP2012003572A (ja) * 2010-06-18 2012-01-05 Nomura Research Institute Ltd 感性分析システム及びプログラム
JP5541049B2 (ja) * 2010-09-29 2014-07-09 大日本印刷株式会社 データ生成装置、データの生成方法及びデータ生成プログラム
JP5656542B2 (ja) * 2010-10-06 2015-01-21 株式会社クリップス 口コミ情報管理システム及び口コミ情報管理プログラム
EP2745210A4 (en) * 2011-08-15 2014-11-26 Equal Media Ltd SYSTEM AND METHOD FOR MANAGING OPINION NETWORKS WITH INTERACTIVE OPINION FLOWS

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101515269A (zh) * 2008-02-20 2009-08-26 中国科学院自动化研究所 实现观点搜索引擎排序的方法
CN101667194A (zh) * 2009-09-29 2010-03-10 北京大学 基于用户评论文本特征的自动摘要方法及其自动摘要系统
CN101833560A (zh) * 2010-02-02 2010-09-15 哈尔滨工业大学 基于互联网的厂商口碑自动排序系统

Also Published As

Publication number Publication date
WO2014093433A1 (en) 2014-06-19
JP2016503914A (ja) 2016-02-08
CN103870973A (zh) 2014-06-18
TW201423450A (zh) 2014-06-16
TWI615724B (zh) 2018-02-21
US20140172642A1 (en) 2014-06-19

Similar Documents

Publication Publication Date Title
CN103870973B (zh) 基于电子信息的关键词提取的信息推送、搜索方法及装置
Hu et al. Opinion mining from online hotel reviews–a text summarization approach
Zhao et al. Exploring demographic information in social media for product recommendation
JP5421737B2 (ja) コンピュータ実施方法
An et al. Design of recommendation system for tourist spot using sentiment analysis based on CNN-LSTM
CN103778214B (zh) 一种基于用户评论的商品属性聚类方法
CN103914478B (zh) 网页训练方法及系统、网页预测方法及系统
CN104636402B (zh) 一种业务对象的分类、搜索、推送方法和系统
CN111898031B (zh) 一种获得用户画像的方法及装置
Chehal et al. Implementation and comparison of topic modeling techniques based on user reviews in e-commerce recommendations
US20070214133A1 (en) Methods for filtering data and filling in missing data using nonlinear inference
WO2016135905A1 (ja) 情報処理システム及び情報処理方法
US20140229486A1 (en) Method and apparatus for unsupervised learning of multi-resolution user profile from text analysis
US20130173583A1 (en) Keyword index pruning
CN111506831A (zh) 一种协同过滤的推荐模块、方法、电子设备及存储介质
CN108009135A (zh) 生成文档摘要的方法和装置
CN111680131A (zh) 基于语义的文档聚类方法、系统及计算机设备
CN112084307A (zh) 一种数据处理方法、装置、服务器及计算机可读存储介质
CN107908749B (zh) 一种基于搜索引擎的人物检索系统及方法
Zhao et al. Online comments of multi-category commodities based on emotional tendency analysis
Soliman et al. Utilizing support vector machines in mining online customer reviews
CN107766576A (zh) 一种微博用户兴趣特征的提取方法
US20130332440A1 (en) Refinements in Document Analysis
Zhao et al. Dtree2vec: A High-Accuracy and Dynamic Scheme for Real-Time Book Recommendation by Serialized Chapters and Local Fine-Grained Partitioning
Dziczkowski et al. An opinion mining approach for web user identification and clients' behaviour analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1195157

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1195157

Country of ref document: HK