CN103389971B - 一种确定应用对应的评论内容的优质等级的方法与设备 - Google Patents

一种确定应用对应的评论内容的优质等级的方法与设备 Download PDF

Info

Publication number
CN103389971B
CN103389971B CN201310279478.8A CN201310279478A CN103389971B CN 103389971 B CN103389971 B CN 103389971B CN 201310279478 A CN201310279478 A CN 201310279478A CN 103389971 B CN103389971 B CN 103389971B
Authority
CN
China
Prior art keywords
comment content
content
comment
user
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310279478.8A
Other languages
English (en)
Other versions
CN103389971A (zh
Inventor
姚从磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
BEIJING ZHUOYI XUNCHANG TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING ZHUOYI XUNCHANG TECHNOLOGY Co Ltd filed Critical BEIJING ZHUOYI XUNCHANG TECHNOLOGY Co Ltd
Priority to CN201310279478.8A priority Critical patent/CN103389971B/zh
Publication of CN103389971A publication Critical patent/CN103389971A/zh
Application granted granted Critical
Publication of CN103389971B publication Critical patent/CN103389971B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明的目的是提供一种用于确定应用对应的评论内容的优质等级的方法与设备;获取应用中待处理的评论内容;对所述评论内容进行内容分析,以获得与所述评论内容对应的分析结果;根据所述分析结果,并结合用户对所述评论内容的用户行为信息,确定所述评论内容对应的优质等级。与现有技术相比,本发明获取应用中待处理的评论内容,对其进行内容分析并获得对应的分析结果,根据该分析结果,并结合用户对该评论内容的用户行为信息,确定该评论内容对应的优质等级,综合考虑了用户评论行为及评论文本内容等因素,提高了评价评论内容的准确率,提升了用户的使用体验。

Description

一种确定应用对应的评论内容的优质等级的方法与设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于确定应用对应的评论内容的优质等级的技术。
背景技术
人们在使用应用或选择下载应用的过程中,需要查看该应用的评论信息,以做出选择。显然,评论信息的可信度对用户使用该信息有直接的影响。现有技术中,评价一条评论信息的好坏主要基于其他用户对该条评论信息的用户行为操作,例如顶、踩等用户行为操作。然而,该种方式容易受到spam的影响,并且基于该种方式所选择的优质评论在客观性和信息量方面存在较大问题。
因此,如何准确、有效地确定应用对应的评论内容的优质等级,成为本领域技术人员亟需解决的一个问题。
发明内容
本发明的目的是提供一种用于确定应用对应的评论内容的优质等级的方法与设备。
根据本发明的一个方面,提供了一种用于确定应用对应的评论内容的优质等级的方法,其中,该方法包括以下步骤:
a获取应用中待处理的评论内容;
b对所述评论内容进行内容分析,以获得与所述评论内容对应的分析结果;
c根据所述分析结果,并结合用户对所述评论内容的用户行为信息,确定所述评论内容对应的优质等级。
根据本发明的另一方面,还提供了一种用于确定应用对应的评论内容的优质等级的设备,其中,该设备包括:
获取装置,用于获取应用中待处理的评论内容;
分析装置,用于对所述评论内容进行内容分析,以获得与所述评论内容对应的分析结果;
确定装置,用于根据所述分析结果,并结合用户对所述评论内容的用户行为信息,确定所述评论内容对应的优质等级。
与现有技术相比,本发明获取应用中待处理的评论内容,对其进行内容分析并获得对应的分析结果,根据该分析结果,并结合用户对该评论内容的用户行为信息,确定该评论内容对应的优质等级,综合考虑了用户评论行为及评论文本内容等因素,提高了评价评论内容的准确率,提升了用户的使用体验。
进一步地,本发明结合该评论内容与该应用的相关性,来确定该评论内容的分析结果,使得分析结果更为精确,提高了确定评论内容的优质等级的准确率,提升了用户的使用体验。
更进一步地,本发明结合该评论内容中评论词的分布属性,来确定该评论内容的分析结果,使得分析结果更为精确,提高了确定评论内容的优质等级的准确率,提升了用户的使用体验。
进一步地,本发明根据该评论内容对应的发布用户的历史评论行为,确定其对应的权重信息,并最终确定该评论内容对应的优质等级,使得该优质等级的确定更为精确,提高了评价该评论内容的准确性,提升了用户的使用体验。
进一步地,本发明根据该评论内容对应的优质等级,确定该评论内容的优先级,并按照该优先级将该评论内容提供给该应用对应的用户,提升了用户的使用体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的用于确定应用对应的评论内容的优质等级的设备示意图;
图2示出根据本发明一个优选实施例的用于确定应用对应的评论内容的优质等级的设备示意图;
图3示出根据本发明另一个方面的用于确定应用对应的评论内容的优质等级的方法流程图;
图4示出根据本发明一个优选实施例的用于确定应用对应的评论内容的优质等级的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的用于确定应用对应的评论内容的优质等级的设备示意图。设备1包括获取装置101、分析装置102和确定装置103。
其中,获取装置101获取应用中待处理的评论内容。具体地,获取装置101通过与应用的交互,例如,通过一次或多次调用该应用所提供的应用程序接口(API)或其他约定的通信方式,或通过与存储有评论内容的其他第三方设备的交互,获取应用中待处理的评论内容。例如,用户通过其用户设备,在应用中发布了评论内容,该设备1中的获取装置101通过与该用户设备的交互,实时地获取了该用户在该应用中所发布的评论内容,作为待处理的评论内容;或者,该设备1中的获取装置101定期地调用该应用所提供的应用程序接口(API),获取在该段时间内,至少一个用户在该应用中所发布的所有的评论内容,作为待处理的评论内容。
在此,所述“评论”一词包括但不限于,散布在网页上的评论、评价、意见、言论、判断、评估等。此外,它也泛指文字评论信息和包括了静态图像、动态图像、动画、影像等任何多媒体数字文件类型的非文字评论信息。
本领域技术人员应能理解上述获取评论内容的方式仅为举例,其他现有的或今后可能出现的获取评论内容的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
分析装置102对所述评论内容进行内容分析,以获得与所述评论内容对应的分析结果。具体地,分析装置102根据获取装置101所获取的评论内容,对其进行内容分析,例如,通过对该评论内容所使用的评论词汇的分析,或者,通过对该评论内容进行分词处理,对分词处理后所获得的评论词汇进行内容分析,或进一步地,对该分词处理后的评论词汇进行过滤处理,过滤掉诸如“的”、“地”等无实际意义词汇,再对过滤后的评论词汇进行内容分析,获得与该评论内容对应的分析结果。
较佳地,该评论内容还可包括其评论时间,分析装置102通过对该评论内容所使用的评论词汇的分析,综合考虑该评论内容所发布的时间,获得该评论内容对应的分析结果。
在此,该分析装置102可对该评论内容的分析结果进行量化,例如,根据对该评论内容的内容分析,获得对应的打分值,作为与该评论内容对应的分析结果。
本领域技术人员应能理解上述对评论内容进行内容分析的方式仅为举例,其他现有的或今后可能出现的对评论内容进行内容分析的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
确定装置103根据所述分析结果,并结合用户对所述评论内容的用户行为信息,确定所述评论内容对应的优质等级。具体地,确定装置103根据分析装置102所获得的该评论内容的分析结果,再结合其他用户对该评论内容的用户行为信息,如点赞、顶、踩、转发、关注等动作,确定该评论内容对应的优质等级。
在此,其他用户对该评论内容的用户行为信息表明了该评论内容的可参考价值,例如,假设大量其他用户对该评论内容进行了诸如点赞、顶、转发、关注等操作,则表明该评论内容的可参考价值较高,该评论内容对应的优质等级较高。
较佳地,该确定装置103根据该分析装置102所获得的对该评论内容的打分值,再根据用户对该评论内容的用户行为信息确定一个打分值,进一步地,根据该评论内容与该用户行为信息所分别对应的权重值,通过加权计算的方式,得到一个最终的打分值,基于该打分值,确定该评论内容对应的优质等级。
本领域技术人员应能理解上述确定优质等级的方式仅为举例,其他现有的或今后可能出现的确定优质等级的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,设备1的各个装置之间是持续不断工作的。具体地,获取装置101获取应用中待处理的评论内容;分析装置102对所述评论内容进行内容分析,以获得与所述评论内容对应的分析结果;确定装置103根据所述分析结果,并结合用户对所述评论内容的用户行为信息,确定所述评论内容对应的优质等级。在此,本领域技术人员应理解“持续”是指设备1的各装置分别按照设定的或实时调整的工作模式要求进行评论内容的获取、评论内容的分析和优质等级的确定,直至该设备1在较长时间内停止获取应用中待处理的评论内容。
在此,设备1获取应用中待处理的评论内容,对其进行内容分析并获得对应的分析结果,根据该分析结果,并结合用户对该评论内容的用户行为信息,确定该评论内容对应的优质等级,综合考虑了用户评论行为及评论文本内容等因素,提高了评价评论内容的准确率,提升了用户的使用体验。
优选地,该分析装置102对所述评论内容进行内容分析,并结合所述评论内容与所述应用的相关性,获得所述分析结果。具体地,该分析装置102根据获取装置101所获取的评论内容,对其进行内容分析,例如,通过对该评论内容所使用的评论词汇的分析,或者,通过对该评论内容进行分词处理,对分词处理后所获得的评论词汇进行内容分析,或进一步地,对该分词处理后的评论词汇进行过滤处理,过滤掉诸如“的”、“地”等无实际意义词汇,再对过滤后的评论词汇进行内容分析,例如获得一个初步的候选分析结果;进而,该分析装置102再结合该评论内容与该应用的相关性,获得与该评论内容对应的分析结果。
例如,当该分析装置102可对该评论内容的分析结果进行量化时,该评论内容与应用的相关性越大,则其分析结果对应的打分值越大。较佳地,该分析装置102根据对该评论内容的内容分析,获得对应的打分值,再根据该评论内容与该应用的相关度确定一个打分值,进一步地,根据该评论内容与该相关度所分别对应的权重值,通过加权计算的方式,得到一个最终的打分值,并将该最终的打分值作为与该评论内容对应的分析结果。
在此,该评论内容与该应用的相关性例如通过分析该评论内容中的评论词汇与该应用的相关度来得到。
在此,设备1进一步结合该评论内容与该应用的相关性,来确定该评论内容的分析结果,使得分析结果更为精确,进一步提高了确定评论内容的优质等级的准确率,提升了用户的使用体验。
更优选地,分析装置102对所述评论内容进行内容分析,并结合所述评论内容中评论词的分布属性,获得所述分析结果;其中,所述分布属性包括以下至少任一项:
-分布概率;
-分布位置。
具体地,分析装置102根据获取装置101所获取的评论内容,对其进行内容分析,例如,通过对该评论内容所使用的评论词汇的分析,或者,通过对该评论内容进行分词处理,对分词处理后所获得的评论词汇进行内容分析,或进一步地,对该分词处理后的评论词汇进行过滤处理,过滤掉诸如“的”、“地”等无实际意义词汇,再对过滤后的评论词汇进行内容分析,例如获得一个初步的候选分析结果;进而,该分析装置102结合该评论内容中评论词的分布属性,如分布概率、分布位置等,获得与该评论内容对应的分析结果。
例如,该分析装置102对该应用中的其他用户的评论内容进行分词处理,确定各关键词出现的概率,当该待处理的评论内容包括出现概率较高的关键词时,可将该待处理的评论内容判断为优质评论,或者,根据该待处理的评论内容中所出现的关键词的概率,确定该待处理的评论内容的打分值,基于该打分值,确定该待处理的评论内容的优质等级。在此,该打分值例如根据该待处理的评论内容中各关键词所对应的概率与权重,通过加权计算的方式获得。
本领域技术人员应能理解上述分布属性仅为举例,其他现有的或今后可能出现的分布属性如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,设备1更进一步结合该评论内容中评论词的分布属性,来确定该评论内容的分析结果,使得分析结果更为精确,进一步提高了确定评论内容的优质等级的准确率,提升了用户的使用体验。
优选地,该设备1还包括权重装置(未示出),该权重装置根据所述评论内容对应的发布用户的历史评论行为,确定所述发布用户对应的权重信息;其中,确定装置103根据所述分析结果,并结合所述用户行为信息与权重信息,确定所述评论内容对应的优质等级。
例如,假设该发布用户历史多次发布评论内容,且该历史发布的评论内容多为优质评论,即,该历史发布的评论内容的优质等级较高,则该发布用户所对应的权重较高,其这次所发布的评论内容为优质评论的可能性也较高,即,该发布用户该次发布的待处理的评论内容的优质等级较高。
具体地,该权重装置获取该评论内容对应的发布用户的历史评论行为,例如根据该发布用户的ID,获取该发布用户历史所做的所有评论内容,或在预定时间段内所做的评论内容,及这些评论内容对应的优质等级,进而,根据这些评论内容及其优质等级,确定该发布用户对应的权重信息;随后,确定装置103在确定该待处理的评论内容的优质等级时,考虑该发布用户的权重信息,例如将该发布用户的权重信息作为该待处理评论内容的分析结果的权重值,再结合其他用户的用户行为信息及其对应的权重值,通过加权计算的方式,确定该评论内容对应的优质等级。
较佳地,该权重装置还可确定该用户行为信息对应的用户的权重信息,例如,根据这些用户的历史评论行为,确定这些用户对应的权重信息;随后,确定装置103在确定该待处理的评论内容的优质等级时,将这些用户行为信息对应的用户的权重信息,作为该用户行为信息对应的权重值,待处理评论内容的分析结果的权重值,再结合该发布用户的权重信息及该待处理评论内容的分析结果,确定该评论内容对应的优质等级。
在此,设备1根据该评论内容对应的发布用户的历史评论行为,确定其对应的权重信息,并最终确定该评论内容对应的优质等级,使得该优质等级的确定更为精确,进一步提高了评价该评论内容的准确性,提升了用户的使用体验。
优选地,该获取装置101包括获取单元(未示出)和分词单元(未示出)。该获取单元获取所述应用中的候选评论内容;分词单元对所述候选评论内容进行分词处理,以将分词处理后的候选评论内容作为所述待处理的评论内容。
具体地,该获取单元通过与应用的交互,例如,通过一次或多次调用该应用所提供的应用程序接口(API)或其他约定的通信方式,或通过与存储有评论内容的其他第三方设备的交互,获取应用中的候选评论内容;随后,分词单元对该候选评论内容进行分词处理,例如,按照自然语言处理,将该候选评论内容切分成短语或字词,将这些切词处理后获得的短语或字词作为待处理的评论内容。
更优选地,该分词单元对所述候选评论内容进行分词处理,以获得分词处理后的候选评论内容;基于无效词库,对所述分词处理后的候选评论内容进行过滤处理,以确定所述待处理的评论内容。具体地,该分词单元按照自然语言处理,将该候选评论内容切分成短语或字词;接着,基于无效词库,对该切词处理后获得的短语或字词进一步进行过滤处理,过滤掉其中无实际意义的功能字词,如过滤掉该无效词库中所包括的“的、了、得、在”等字词,并将经过滤处理后的词组作为待处理的评论内容。
在此,该无效词库中存储有无实际意义的功能字词,可以是预设的无效词库,也可通过用户反馈建立或更新,该无效词库可位于该设备1中,也可位于与该设备1具有网络连接的第三方设备中。
图2示出根据本发明一个优选实施例的用于确定应用对应的评论内容的优质等级的设备示意图。该设备1还包括优先级装置204。以下参见图2对该优选实施例进行详细描述:具体地,获取装置201获取应用中待处理的评论内容;分析装置202对所述评论内容进行内容分析,以获得与所述评论内容对应的分析结果;确定装置203根据所述分析结果,并结合用户对所述评论内容的用户行为信息,确定所述评论内容对应的优质等级;优先级装置204根据所述评论内容对应的优质等级,确定所述评论内容的优先级;按照所述优先级,将所述评论内容提供给所述应用对应的用户。其中,获取装置201、分析装置202和确定装置203与图1所示对应装置相同或相似,故此处不再赘述,并通过引用的方式包含于此。
其中,优先级装置204根据所述评论内容对应的优质等级,确定所述评论内容的优先级;按照所述优先级,将所述评论内容提供给所述应用对应的用户。具体地,确定装置203根据分析装置202对评论内容的分析结果,并结合用户对该评论内容的用户行为信息,确定该评论内容对应的优质等级;随后,优先级装置204基于该评论内容对应的优质等级,确定该评论内容的优先级,例如,该评论内容的优质等级越高,其优先级越高;接着,该优先级装置204再按照该评论内容的优先级,将该评论内容提供给该应用对应的用户,例如,通过调用ASP、JSP或PHP等网页技术,将该评论内容按照优先级从高到低的顺序,在应用中展现给该用户。
在此,设备1根据该评论内容对应的优质等级,确定该评论内容的优先级,并按照该优先级将该评论内容提供给该应用对应的用户,进一步提升了用户的使用体验。
图3示出根据本发明另一个方面的用于确定应用对应的评论内容的优质等级的方法流程图。
在步骤S301中,设备1获取应用中待处理的评论内容。具体地,在步骤S301中,设备1通过与应用的交互,例如,通过一次或多次调用该应用所提供的应用程序接口(API)或其他约定的通信方式,或通过与存储有评论内容的其他第三方设备的交互,获取应用中待处理的评论内容。例如,用户通过其用户设备,在应用中发布了评论内容,在步骤S301中,设备1通过与该用户设备的交互,实时地获取了该用户在该应用中所发布的评论内容,作为待处理的评论内容;或者,在步骤S301中,设备1定期地调用该应用所提供的应用程序接口(API),获取在该段时间内,至少一个用户在该应用中所发布的所有的评论内容,作为待处理的评论内容。
在此,所述“评论”一词包括但不限于,散布在网页上的评论、评价、意见、言论、判断、评估等。此外,它也泛指文字评论信息和包括了静态图像、动态图像、动画、影像等任何多媒体数字文件类型的非文字评论信息。
本领域技术人员应能理解上述获取评论内容的方式仅为举例,其他现有的或今后可能出现的获取评论内容的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S302中,设备1对所述评论内容进行内容分析,以获得与所述评论内容对应的分析结果。具体地,在步骤S302中,设备1根据在步骤S301中所获取的评论内容,对其进行内容分析,例如,通过对该评论内容所使用的评论词汇的分析,或者,通过对该评论内容进行分词处理,对分词处理后所获得的评论词汇进行内容分析,或进一步地,对该分词处理后的评论词汇进行过滤处理,过滤掉诸如“的”、“地”等无实际意义词汇,再对过滤后的评论词汇进行内容分析,获得与该评论内容对应的分析结果。
较佳地,该评论内容还可包括其评论时间,在步骤S302中,设备1通过对该评论内容所使用的评论词汇的分析,综合考虑该评论内容所发布的时间,获得该评论内容对应的分析结果。
在此,在步骤S302中,设备1可对该评论内容的分析结果进行量化,例如,根据对该评论内容的内容分析,获得对应的打分值,作为与该评论内容对应的分析结果。
本领域技术人员应能理解上述对评论内容进行内容分析的方式仅为举例,其他现有的或今后可能出现的对评论内容进行内容分析的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S303中,设备1根据所述分析结果,并结合用户对所述评论内容的用户行为信息,确定所述评论内容对应的优质等级。具体地,在步骤S303中,设备1根据在步骤S302中所获得的该评论内容的分析结果,再结合其他用户对该评论内容的用户行为信息,如点赞、顶、踩、转发、关注等动作,确定该评论内容对应的优质等级。
在此,其他用户对该评论内容的用户行为信息表明了该评论内容的可参考价值,例如,假设大量其他用户对该评论内容进行了诸如点赞、顶、转发、关注等操作,则表明该评论内容的可参考价值较高,该评论内容对应的优质等级较高。
较佳地,在步骤S303中,设备1根据在步骤S302中所获得的对该评论内容的打分值,再根据用户对该评论内容的用户行为信息确定一个打分值,进一步地,根据该评论内容与该用户行为信息所分别对应的权重值,通过加权计算的方式,得到一个最终的打分值,基于该打分值,确定该评论内容对应的优质等级。
本领域技术人员应能理解上述确定优质等级的方式仅为举例,其他现有的或今后可能出现的确定优质等级的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,设备1的各个步骤之间是持续不断工作的。具体地,在步骤S301中,设备1获取应用中待处理的评论内容;在步骤S302中,设备1对所述评论内容进行内容分析,以获得与所述评论内容对应的分析结果;在步骤S303中,设备1根据所述分析结果,并结合用户对所述评论内容的用户行为信息,确定所述评论内容对应的优质等级。在此,本领域技术人员应理解“持续”是指设备1的各步骤分别按照设定的或实时调整的工作模式要求进行评论内容的获取、评论内容的分析和优质等级的确定,直至该设备1在较长时间内停止获取应用中待处理的评论内容。
在此,设备1获取应用中待处理的评论内容,对其进行内容分析并获得对应的分析结果,根据该分析结果,并结合用户对该评论内容的用户行为信息,确定该评论内容对应的优质等级,综合考虑了用户评论行为及评论文本内容等因素,提高了评价评论内容的准确率,提升了用户的使用体验。
优选地,在步骤S302中,设备1对所述评论内容进行内容分析,并结合所述评论内容与所述应用的相关性,获得所述分析结果。具体地,在步骤S302中,设备1根据在步骤S301中所获取的评论内容,对其进行内容分析,例如,通过对该评论内容所使用的评论词汇的分析,或者,通过对该评论内容进行分词处理,对分词处理后所获得的评论词汇进行内容分析,或进一步地,对该分词处理后的评论词汇进行过滤处理,过滤掉诸如“的”、“地”等无实际意义词汇,再对过滤后的评论词汇进行内容分析,例如获得一个初步的候选分析结果;进而,在步骤S302中,设备1再结合该评论内容与该应用的相关性,获得与该评论内容对应的分析结果。
例如,当在步骤S302中,设备1可对该评论内容的分析结果进行量化时,该评论内容与应用的相关性越大,则其分析结果对应的打分值越大。较佳地,在步骤S302中,设备1根据对该评论内容的内容分析,获得对应的打分值,再根据该评论内容与该应用的相关度确定一个打分值,进一步地,根据该评论内容与该相关度所分别对应的权重值,通过加权计算的方式,得到一个最终的打分值,并将该最终的打分值作为与该评论内容对应的分析结果。
在此,该评论内容与该应用的相关性例如通过分析该评论内容中的评论词汇与该应用的相关度来得到。
在此,设备1进一步结合该评论内容与该应用的相关性,来确定该评论内容的分析结果,使得分析结果更为精确,进一步提高了确定评论内容的优质等级的准确率,提升了用户的使用体验。
更优选地,在步骤S302中,设备1对所述评论内容进行内容分析,并结合所述评论内容中评论词的分布属性,获得所述分析结果;其中,所述分布属性包括以下至少任一项:
-分布概率;
-分布位置。
具体地,在步骤S302中,设备1根据在步骤S301中所获取的评论内容,对其进行内容分析,例如,通过对该评论内容所使用的评论词汇的分析,或者,通过对该评论内容进行分词处理,对分词处理后所获得的评论词汇进行内容分析,或进一步地,对该分词处理后的评论词汇进行过滤处理,过滤掉诸如“的”、“地”等无实际意义词汇,再对过滤后的评论词汇进行内容分析,例如获得一个初步的候选分析结果;进而,在步骤S302中,设备1结合该评论内容中评论词的分布属性,如分布概率、分布位置等,获得与该评论内容对应的分析结果。
例如,在步骤S302中,设备1对该应用中的其他用户的评论内容进行分词处理,确定各关键词出现的概率,当该待处理的评论内容包括出现概率较高的关键词时,可将该待处理的评论内容判断为优质评论,或者,根据该待处理的评论内容中所出现的关键词的概率,确定该待处理的评论内容的打分值,基于该打分值,确定该待处理的评论内容的优质等级。在此,该打分值例如根据该待处理的评论内容中各关键词所对应的概率与权重,通过加权计算的方式获得。
本领域技术人员应能理解上述分布属性仅为举例,其他现有的或今后可能出现的分布属性如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,设备1更进一步结合该评论内容中评论词的分布属性,来确定该评论内容的分析结果,使得分析结果更为精确,进一步提高了确定评论内容的优质等级的准确率,提升了用户的使用体验。
优选地,该方法还包括步骤S305(未示出),在步骤S305中,设备1根据所述评论内容对应的发布用户的历史评论行为,确定所述发布用户对应的权重信息;其中,在步骤S303中,设备1根据所述分析结果,并结合所述用户行为信息与权重信息,确定所述评论内容对应的优质等级。
例如,假设该发布用户历史多次发布评论内容,且该历史发布的评论内容多为优质评论,即,该历史发布的评论内容的优质等级较高,则该发布用户所对应的权重较高,其这次所发布的评论内容为优质评论的可能性也较高,即,该发布用户该次发布的待处理的评论内容的优质等级较高。
具体地,在步骤S305中,设备1获取该评论内容对应的发布用户的历史评论行为,例如根据该发布用户的ID,获取该发布用户历史所做的所有评论内容,或在预定时间段内所做的评论内容,及这些评论内容对应的优质等级,进而,根据这些评论内容及其优质等级,确定该发布用户对应的权重信息;随后,在步骤S303中,设备1在确定该待处理的评论内容的优质等级时,考虑该发布用户的权重信息,例如将该发布用户的权重信息作为该待处理评论内容的分析结果的权重值,再结合其他用户的用户行为信息及其对应的权重值,通过加权计算的方式,确定该评论内容对应的优质等级。
较佳地,在步骤S305中,设备1还可确定该用户行为信息对应的用户的权重信息,例如,根据这些用户的历史评论行为,确定这些用户对应的权重信息;随后,在步骤S303中,设备1在确定该待处理的评论内容的优质等级时,将这些用户行为信息对应的用户的权重信息,作为该用户行为信息对应的权重值,待处理评论内容的分析结果的权重值,再结合该发布用户的权重信息及该待处理评论内容的分析结果,确定该评论内容对应的优质等级。
在此,设备1根据该评论内容对应的发布用户的历史评论行为,确定其对应的权重信息,并最终确定该评论内容对应的优质等级,使得该优质等级的确定更为精确,进一步提高了评价该评论内容的准确性,提升了用户的使用体验。
优选地,步骤S301包括子步骤S301a(未示出)和子步骤S301b(未示出)。在子步骤S301a中,设备1获取所述应用中的候选评论内容;在子步骤S301b中,设备1对所述候选评论内容进行分词处理,以将分词处理后的候选评论内容作为所述待处理的评论内容。
具体地,在子步骤S301a中,设备1通过与应用的交互,例如,通过一次或多次调用该应用所提供的应用程序接口(API)或其他约定的通信方式,或通过与存储有评论内容的其他第三方设备的交互,获取应用中的候选评论内容;随后,在子步骤S301b中,设备1对该候选评论内容进行分词处理,例如,按照自然语言处理,将该候选评论内容切分成短语或字词,将这些切词处理后获得的短语或字词作为待处理的评论内容。
更优选地,在子步骤S301b中,设备1对所述候选评论内容进行分词处理,以获得分词处理后的候选评论内容;基于无效词库,对所述分词处理后的候选评论内容进行过滤处理,以确定所述待处理的评论内容。具体地,在子步骤S301b中,设备1按照自然语言处理,将该候选评论内容切分成短语或字词;接着,基于无效词库,对该切词处理后获得的短语或字词进一步进行过滤处理,过滤掉其中无实际意义的功能字词,如过滤掉该无效词库中所包括的“的、了、得、在”等字词,并将经过滤处理后的词组作为待处理的评论内容。
在此,该无效词库中存储有无实际意义的功能字词,可以是预设的无效词库,也可通过用户反馈建立或更新,该无效词库可位于该设备1中,也可位于与该设备1具有网络连接的第三方设备中。
图4示出根据本发明一个优选实施例的用于确定应用对应的评论内容的优质等级的方法流程图。以下参见图4对该优选实施例进行详细描述:具体地,在步骤S401中,设备1获取应用中待处理的评论内容;在步骤S402中,设备1对所述评论内容进行内容分析,以获得与所述评论内容对应的分析结果;在步骤S403中,设备1根据所述分析结果,并结合用户对所述评论内容的用户行为信息,确定所述评论内容对应的优质等级;在步骤S404中,设备1根据所述评论内容对应的优质等级,确定所述评论内容的优先级;按照所述优先级,将所述评论内容提供给所述应用对应的用户。其中,步骤S401-S403分别与图3所示对应步骤相同或相似,故此处不再赘述,并通过引用的方式包含于此。
在步骤S404中,设备1根据所述评论内容对应的优质等级,确定所述评论内容的优先级;按照所述优先级,将所述评论内容提供给所述应用对应的用户。具体地,在步骤S403中,设备1根据在步骤S402中对评论内容的分析结果,并结合用户对该评论内容的用户行为信息,确定该评论内容对应的优质等级;随后,在步骤S404中,设备1基于该评论内容对应的优质等级,确定该评论内容的优先级,例如,该评论内容的优质等级越高,其优先级越高;接着,在步骤S404中,设备1再按照该评论内容的优先级,将该评论内容提供给该应用对应的用户,例如,通过调用ASP、JSP或PHP等网页技术,将该评论内容按照优先级从高到低的顺序,在应用中展现给该用户。
在此,设备1根据该评论内容对应的优质等级,确定该评论内容的优先级,并按照该优先级将该评论内容提供给该应用对应的用户,进一步提升了用户的使用体验。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (10)

1.一种用于确定应用对应的评论内容的优质等级的方法,其中,该方法包括以下步骤:
a获取应用中待处理的评论内容;
b对所述评论内容进行内容分析,并结合所述评论内容中评论词的分布属性,以获得与所述评论内容对应的分析结果;
根据所述评论内容对应的发布用户的历史评论行为,确定所述发布用户对应的权重信息;
c根据所述分析结果,并结合所述发布用户对应的权重信息,以及用户对所述评论内容的用户行为信息及所述用户行为信息对应的权重信息,确定所述评论内容对应的优质等级;
其中,所述分布属性包括以下至少任一项:
-分布概率;
-分布位置。
2.根据权利要求1所述的方法,其中,所述步骤b包括:
-对所述评论内容进行内容分析,并结合所述评论内容与所述应用的相关性,获得所述分析结果。
3.根据权利要求1或2所述的方法,其中,所述步骤a包括:
a1获取所述应用中的候选评论内容;
a2对所述候选评论内容进行分词处理,以将分词处理后的候选评论内容作为所述待处理的评论内容。
4.根据权利要求3所述的方法,其中,所述步骤a2包括:
-对所述候选评论内容进行分词处理,以获得分词处理后的候选评论内容;
-基于无效词库,对所述分词处理后的候选评论内容进行过滤处理,以确定所述待处理的评论内容。
5.根据权利要求1或2所述的方法,其中,该方法还包括:
-根据所述评论内容对应的优质等级,确定所述评论内容的优先级;
-按照所述优先级,将所述评论内容提供给所述应用对应的用户。
6.一种用于确定应用对应的评论内容的优质等级的设备,其中,该设备包括:
获取装置,用于获取应用中待处理的评论内容;
分析装置,用于对所述评论内容进行内容分析,并结合所述评论内容中评论词的分布属性,以获得与所述评论内容对应的分析结果;
权重装置,根据所述评论内容对应的发布用户的历史评论行为,确定所述发布用户对应的权重信息;
确定装置,用于根据所述分析结果,并结合所述发布用户对应的权重信息,以及用户对所述评论内容的用户行为信息及所述用户行为信息对应的权重信息,确定所述评论内容对应的优质等级;
其中,所述分布属性包括以下至少任一项:
-分布概率;
-分布位置。
7.根据权利要求6所述的设备,其中,所述分析装置用于:
-对所述评论内容进行内容分析,并结合所述评论内容与所述应用的相关性,获得所述分析结果。
8.根据权利要求6或7所述的设备,其中,所述获取装置包括:
获取单元,用于获取所述应用中的候选评论内容;
分词单元,用于对所述候选评论内容进行分词处理,以将分词处理后的候选评论内容作为所述待处理的评论内容。
9.根据权利要求8所述的设备,其中,所述分词单元用于:
-对所述候选评论内容进行分词处理,以获得分词处理后的候选评论内容;
-基于无效词库,对所述分词处理后的候选评论内容进行过滤处理,以确定所述待处理的评论内容。
10.根据权利要求6或7所述的设备,其中,该设备还包括优先级装置,用于:
-根据所述评论内容对应的优质等级,确定所述评论内容的优先级;
-按照所述优先级,将所述评论内容提供给所述应用对应的用户。
CN201310279478.8A 2013-07-04 2013-07-04 一种确定应用对应的评论内容的优质等级的方法与设备 Active CN103389971B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310279478.8A CN103389971B (zh) 2013-07-04 2013-07-04 一种确定应用对应的评论内容的优质等级的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310279478.8A CN103389971B (zh) 2013-07-04 2013-07-04 一种确定应用对应的评论内容的优质等级的方法与设备

Publications (2)

Publication Number Publication Date
CN103389971A CN103389971A (zh) 2013-11-13
CN103389971B true CN103389971B (zh) 2017-03-29

Family

ID=49534247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310279478.8A Active CN103389971B (zh) 2013-07-04 2013-07-04 一种确定应用对应的评论内容的优质等级的方法与设备

Country Status (1)

Country Link
CN (1) CN103389971B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150254680A1 (en) * 2014-03-05 2015-09-10 Pascal Scoles Utilizing product and service reviews
CN105095181B (zh) * 2014-05-19 2017-12-29 株式会社理光 垃圾评论检测方法及设备
CN104536980A (zh) * 2014-12-05 2015-04-22 百度在线网络技术(北京)有限公司 一种确定候评项的质量信息的方法与装置
CN104618813B (zh) * 2015-01-20 2018-02-13 腾讯科技(北京)有限公司 弹幕信息处理方法、客户端及服务平台
CN104866468B (zh) * 2015-04-08 2017-09-29 清华大学深圳研究生院 一种中文虚假顾客评论识别方法
CN104899256A (zh) * 2015-05-18 2015-09-09 联想(北京)有限公司 一种信息处理方法及电子设备
CN106649309B (zh) * 2015-10-29 2020-10-23 重庆邮电大学 信息处理方法和装置、信息显示方法和装置
CN105373887B (zh) * 2015-11-12 2020-12-01 腾讯科技(深圳)有限公司 一种终端应用的质量评估方法和系统
CN106127404B (zh) * 2016-06-30 2022-05-31 联想(北京)有限公司 一种评价方法、电子设备及电子装置
CN106960033B (zh) * 2017-03-22 2021-09-14 阿里巴巴(中国)有限公司 一种给信息流标注标签的方法和装置
CN108874832B (zh) * 2017-05-15 2022-06-10 腾讯科技(深圳)有限公司 目标评论确定方法及装置
CN107613400B (zh) * 2017-09-21 2021-03-26 北京奇艺世纪科技有限公司 一种语音弹幕的实现方法和装置
CN110019720B (zh) * 2017-12-19 2022-02-08 阿里巴巴(中国)有限公司 一种评论的内容分获取方法及系统
CN109948138B (zh) * 2017-12-19 2023-06-20 阿里巴巴(中国)有限公司 一种评论处理方法及系统
CN110087118B (zh) * 2019-04-26 2022-01-21 北京达佳互联信息技术有限公司 评论消息处理方法、装置、终端、服务器及介质
CN110597841B (zh) * 2019-09-29 2021-09-14 腾讯科技(深圳)有限公司 一种基于区块链网络的应用评论信息处理方法及装置
CN111522940B (zh) * 2020-04-08 2023-06-09 百度在线网络技术(北京)有限公司 用于处理评论信息的方法和装置
US11526543B2 (en) 2020-07-14 2022-12-13 International Business Machines Corporation Aggregate comment management from forwarded media content
CN113590903B (zh) * 2021-09-27 2022-01-25 广东电网有限责任公司 一种情报数据的管理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855276A (zh) * 2012-07-20 2013-01-02 北京大学 一种判定评论文本极性的方法及其应用
CN103150378A (zh) * 2013-03-13 2013-06-12 珠海市君天电子科技有限公司 一种鉴定微博广告中虚假好评的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090132349A1 (en) * 2006-10-09 2009-05-21 Splashcast Corp. Targeted-demographic rich-media content, branding, and syndicated user-node distribution
CN101667194A (zh) * 2009-09-29 2010-03-10 北京大学 基于用户评论文本特征的自动摘要方法及其自动摘要系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855276A (zh) * 2012-07-20 2013-01-02 北京大学 一种判定评论文本极性的方法及其应用
CN103150378A (zh) * 2013-03-13 2013-06-12 珠海市君天电子科技有限公司 一种鉴定微博广告中虚假好评的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于影评数据的在线评论有用性影响因素研究;郝媛媛 等;《管理科学学报》;20100831;第13卷(第8期);第81页 *

Also Published As

Publication number Publication date
CN103389971A (zh) 2013-11-13

Similar Documents

Publication Publication Date Title
CN103389971B (zh) 一种确定应用对应的评论内容的优质等级的方法与设备
US10165069B2 (en) Provisioning personalized content recommendations
US10009308B2 (en) Social content features based on user tracking
US11709875B2 (en) Prioritizing survey text responses
US10210867B1 (en) Adjusting user experience based on paralinguistic information
US10770062B2 (en) Adjusting a ranking of information content of a software application based on feedback from a user
CN110297912A (zh) 欺诈识别方法、装置、设备及计算机可读存储介质
US20100049590A1 (en) Method and system for semantic analysis of unstructured data
US20130191395A1 (en) Social media data analysis system and method
US20150169504A1 (en) Layer based reorganization of document components
DE112016000986T5 (de) Bereitstellung vorgeschlagener sprachgestützter Aktionsanfragen
US9817564B2 (en) Managing a display of content based on user interaction topic and topic vectors
CN106716399A (zh) 排序在线社交网络上的外部内容
CN102779114A (zh) 利用自动规则生成的非结构化数据支持
CN109977300A (zh) 企业舆情获取方法、装置、终端及计算机存储介质
AU2014309040A1 (en) Presenting fixed format documents in reflowed format
CN110019389A (zh) 金融非结构化文本分析系统及其方法
US20070233563A1 (en) Web-page sorting apparatus, web-page sorting method, and computer product
CN109190109A (zh) 融合用户信息生成评论摘要的方法及装置
CN103713894A (zh) 一种用于确定用户的访问需求信息的方法与设备
US20140164360A1 (en) Context based look-up in e-readers
KR101543393B1 (ko) 이동 단말기의 사용자의 상황에 적합한 컨텐츠 추천 방법 및 이를 수행하는 컨텐츠 추천 시스템
CN101166211A (zh) 一种提供网络资源信息以及对应服务的方法和系统
CN103970832A (zh) 一种识别垃圾信息的方法与装置
CN102999576A (zh) 用于确定目标页面所对应的页面描述信息的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200527

Address after: 310051 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 100080, room 1, building 3, Haidian Avenue, Haidian District, Beijing,

Patentee before: BEIJING ZHUOYI XUNCHANG SCIENCE & TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right