CN105095181B - 垃圾评论检测方法及设备 - Google Patents

垃圾评论检测方法及设备 Download PDF

Info

Publication number
CN105095181B
CN105095181B CN201410209884.1A CN201410209884A CN105095181B CN 105095181 B CN105095181 B CN 105095181B CN 201410209884 A CN201410209884 A CN 201410209884A CN 105095181 B CN105095181 B CN 105095181B
Authority
CN
China
Prior art keywords
comment
feeling polarities
capture device
image capture
acquisition parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410209884.1A
Other languages
English (en)
Other versions
CN105095181A (zh
Inventor
郑继川
白瑞峰
姜珊珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to CN201410209884.1A priority Critical patent/CN105095181B/zh
Priority to JP2015101200A priority patent/JP6547409B2/ja
Publication of CN105095181A publication Critical patent/CN105095181A/zh
Application granted granted Critical
Publication of CN105095181B publication Critical patent/CN105095181B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

提供了一种图像捕获设备的垃圾评论的检测方法和检测设备。所述检测方法包括:提取一评论中的特征词和情感词,并确定该情感词的第一情感极性;确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词对应的图像特征的第二情感极性;比较所述第一情感极性和所述第二情感极性,并且如果所述第一情感极性和所述第二情感极性不一致,则确定所述评论是垃圾评论。该方法基于评论信息和相关图像等具体事实来评价评论的客观性因而具有较高的检测精度,而且该方法不需要花费大量的人工时间进行处理,因而能够快速地检测出垃圾评论。

Description

垃圾评论检测方法及设备
技术领域
本发明总体涉及网络信息处理,具体涉及针对图像捕获设备的垃圾评论的检测方法及设备。
背景技术
近几年,随着互联网的发展,人们越来越喜欢在网络上表达自己的观点。例如,用户可以在购买商品时在各大商业网站、论坛以及博客发表针对商品的评论。这些评论信息对于产品提供者非常重要,其可以帮助产品提供者了解产品的缺点或不足,进而被用来改善下一代产品。另一方面,这些评论信息对于其他用户也非常重要,其可以帮助其他用户快速了解产品的性能、优缺点等,进而使得他们在挑选产品时可以做出更好的购买决定和选择。
然而,由于网络的开放性,人们可以在网站上任意书写评论,这导致某些评论的客观性低下,从而产生垃圾评论。例如,用户可能由于不了解某产品的功能而认为该产品未能达到其预期,从而导致对该产品的印象不佳并给出了过低的评价。再比如,来自某一公司的员工可能对其公司自己的产品给出过高的评价,而贬低竞争对手的产品。这种客观性低下的垃圾评价一方面使得产品提供者无法获知产品的真实缺陷以进行改善,另一方面影响了其他用户快速了解产品的性能、优缺点,并且可能误导其他潜在用户。因此,希望能够确定哪些评论是垃圾评论,以排除其对于产品提供者和其他潜在用户的干扰。
目前,已经对于如何检测垃圾评价进行了很多研究。这些研究通常使用文字评论信息和评论者信息来判断评论的客观性,从而确定评论是否是垃圾评论。例如,常见的垃圾评论检测技术首先根据评论者先前的评论确定评论者的权威性,然后根据每个评论者的权威性确定其评论是否是垃圾评论。然而,按照这一技术,需要花费大量的时间来人工地标记诸如评论者先前的评论等数据;而且通过例如建立概率模型确定的评论者权威性并不总是可靠的,从而导致垃圾评论的检测精度较低。
发明内容
根据本发明的一个实施例,提供了一种图像捕获设备的垃圾评论的检测方法,包括:提取一评论中的特征词和情感词,并确定该情感词的第一情感极性;确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词对应的图像特征的第二情感极性;比较所述第一情感极性和所述第二情感极性,并且如果所述第一情感极性和所述第二情感极性不一致,则确定所述评论是垃圾评论。
根据本发明的另一实施例,提供了一种图像捕获设备的垃圾评论的检测设备,包括:提取单元,配置为提取一评论中的特征词和情感词,并确定该情感词的第一情感极性;极性确定单元,配置为确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词对应的图像特征的第二情感极性;比较单元,配置为比较所述第一情感极性和所述第二情感极性,并且如果所述第一情感极性和所述第二情感极性不一致,则确定所述评论是垃圾评论。
根据本发明的另一实施例,提供了一种图像捕获设备的垃圾评论的检测方法,包括对于评论中的每个观点进行下述处理:提取该观点中的特征词和情感词,并确定该情感词的第一情感极性;确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词对应的图像特征的第二情感极性;比较所述第一极性强度和所述第二极性强度,并且如果所述第一情感极性和所述第二情感极性不一致,则确定所述观点的客观性为不客观;以及包括对各个观点的客观性进行加权平均,以计算所述评论的客观性并确定该评论是否为垃圾评论,其中权重根据各个观点的重要性来确定。
根据本发明实施例的图像捕获设备的垃圾评论的检测技术基于评论信息和相关图像的一致性来判断评论的客观性,以确定评论是否是垃圾评论,由于其基于具体事实来评价评论的客观性因而具有较高的检测精度。而且,该检测技术不需要花费大量的人工时间进行处理,因而能够快速地检测出垃圾评论。
附图说明
图1例示了一个针对图像捕获设备的评论以及相关的图像;
图2示出了根据本发明第一实施例的图像捕获设备的垃圾评论的检测方法的流程图。
图3例示了另一个针对图像捕获设备的评论以及相关的图像。
图4例示了又一个针对图像捕获设备的评论以及相关的图像。
图5示出了评论中的情感词的第一情感极性与图像特征的第二情感极性的可能的对应关系。
图6示出了当第一情感极性和所述第二情感极性一致并且均为负面时相机参数设置的示例情形。
图7示出了根据本发明实施例的图像捕获设备的垃圾评论的检测设备的功能配置框图。
图8示出了根据本发明实施例的图像捕获设备的垃圾评论的检测系统的总体硬件框图。
具体实施方式
为了使本领域技术人员更好地理解本发明,下面结合附图和具体实施方式对本发明作进一步详细说明。
首先对根据本发明实施例的图像捕获设备的垃圾评论的检测技术的基本思想进行简要的介绍。
图像捕获设备的用户在对图像捕获设备做出评论时,通常都会同时示出由该图像捕获设备捕获的相关图像作为证据来证明其评论中的观点。例如,如图1所示,相机用户的评论为:该相机不好,因为在背光时脸太黑。为了证明这一观点,该用户示出了在背光场景下采用该相机拍摄的照片。鉴于这一情况,在根据本发明实施例的垃圾评论的检测技术中,根据评论与由图像捕获设备捕获的相关图像中的对应图像特征的一致性来确定该评论是否是垃圾评论。具体的,如果评论与相关图像中的对应图像特征的质量不一致,则可以确定所述评论过高或者过低评价了相机因而是不客观的,属于垃圾评论。另一方面,如果评论和对应图像特征的质量一致并且图像质量不佳,则进一步检查造成图像特征质量不佳的原因是否是由于拍摄该相关图像时未正确设置图像捕获设备的拍摄参数造成的;如果是,则可以确定对于图像捕获设备的评论是不客观的,属于垃圾评论。
图像捕获设备可以是相机、摄像机、具有拍摄功能的智能电话等各种电子设备。在下文中,以相机为例进行说明。
<第一实施例>
图2示出了根据本发明第一实施例的图像捕获设备的垃圾评论的检测方法的流程图。
如图2所示,在步骤S201,提取一评论中的特征词和情感词,并确定该情感词的第一情感极性。
情感词是表达情感的词语,其可以是名词、动词、形容词、感叹词以及一些固定用语。情感极性反映情感的趋向,可以包括例如正面情感、中性情感和负面情感。情感词和情感极性均是本领域中的常用术语,此处不进行详细的介绍。
包含单个观点的基本评论可以用一个五元组Oi=(ej,ak,sl,hm,tn)来表示,其中Oi是评论者hm在时间tn发表的、对于目标对象/实体ej的ak特征/方面的意见,sl是意见Oi的情感值。在本实施例中,仅需提取目标对象/实体(相机)的ak特征/方面和相关的情感sl。例如,对于如上文中提到的示例评论“该相机不好,因为在背光时脸太黑”而言,需要提取其中的特征词“脸”和情感词“黑”。
可以采用本领域中任何公知的技术来从评论中提取特征词和情感词并确定情感词的情感极性。例如,可以采用在Liu,B.的“Aspect-based Sentiment Analysis”,Sentiment Analysis and Opinion Mining,2012年(49-78页),Morgan & ClaypoolPublishers或者Pang,B.和Lee,L.的“Opinion Mining and Sentiment Analysis”,Foundations and Trends in Information Retrieval,2008年/1月,1-135页中介绍的方法。为了避免不必要地混淆本发明的发明内容,此处不对该处理进行详细的描述。
在步骤S202,确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词对应的图像特征的第二情感极性。
如前所述,图像捕获设备的用户在对图像捕获设备做出评论时,通常都会同时示出由该图像捕获设备捕获的相关图像作为证据来证明其评论中的观点。因此,该相关图像中具有与评论中的特征词对应的图像特征。在该步骤S202中,将确定与评论中的特征词对应的图像特征,并确定相关图像中该图像特征的情感极性。下面将对该步骤中的具体处理进行详细描述。
首先需要确定与特征词和情感词对应的图像特征到底是哪个图像特征,这可以通过例如查找预先设定的第一映射表来实现。表1示出了该第一映射表的一个示例。
特征词 情感词 图像特征
亮度
背景 不够虚化 对比度
眼睛 红眼
不白 灰度级
表1
该表1是根据例如相机的图像捕获设备的成像原理和功能等预先设定的。表1所示的仅仅是一个示例,图像处理领域的技术人员可以容易地扩展该表。另外,根据目前的研究,用户在评论产品的特征/方面时,使用的特征词和情感词是趋向于一致的,因此可以合理地设置第一映射表以覆盖大多数评论,而不需要准备非常长的、穷举性的映射表以覆盖所有评论。
在确定了所述图像特征后,可以检测所述相关图像中该图像特征的质量,并由此确定该图像特征的情感极性。例如,如果相关图像中该图像特征的质量良好,则情感极性是正面的;如果该图像特征的质量不好,则情感极性是负面的;如果该图像特征的质量一般,则情感极性是中性的。
如何检测相关图像中该图像特征的质量是本领域中公知的,本领域技术人员可以根据具体的图像特征采用各种适当的方式检测其质量。
例如,假设评论者的评论是“室内照片总是很模糊”,并且示出了如图3所示的图像。对于这一情况,首先可以通过例如查找映射表确定对应的图像特征是灰度梯度值,通常灰度梯度值越高,画面的边缘信息越丰富,图像越清晰。因此,在检测图像特征的质量时,可以计算如图3所示的图像中的平均灰度梯度值,并且将其与通过统计多幅图像的灰度梯度值确定的判断阈值进行比较来确定其质量。例如,如果计算得到的平均灰度梯度值小于10则认为其是模糊,即质量不好,如果平均灰度梯度值大于14则认为其是清晰,即质量良好,如果平均灰度梯度值在10和14之间则认为其是清晰度一般,即质量一般。
再比如,假设评论者的评论是“相机拍摄的照片颜色不正,总是偏蓝”,并且示出了如图4所示的图像。对于这一情况,首先可以确定对应的图像特征是颜色分量。因此,在检测图像特征的质量时,可以将如图4所示的RGB图像转变到CIE L*a*b*空间,其中L*表示图像亮度,a*表示图像红/绿分量,b*表示图像黄/蓝分量。由于通常存在色偏的图像,在a*和b*分量上的均值会偏离原点很远,方差也较小,因此通过计算图4所示的图像在a*和b*分量上的均值和方差,就可确定是否存在色偏,进而可以确定图像质量如何。
应当理解,上面所给出的两个例子仅仅是示例性的,而并非是对本发明的限制。本领域技术人员可以根据具体的图像特征采用各种适当的方式检测其质量,并进而根据图像特征的质量的好坏确定其情感极性。
回到图2,在步骤S203,比较所述第一情感极性和所述第二情感极性,并且如果所述第一情感极性和所述第二情感极性不一致,则确定所述评论是垃圾评论。
例如,以图4中所示的图像为例,“相机拍摄的照片颜色不正,总是偏蓝”这一评论的情感极性是负面的;另一方面,假设如前所述通过计算图4所示的图像中颜色分量的均值和方差,检测出该图像中颜色分量的质量一般,并由此确定其情感极性是中性的。在这样的情况下,第一情感极性与第二情感极性不一致,即对于相机的评论与相关图像中的对应图像特征的质量不一致,由此可以确定评论是不客观的,评论者有可能是有意地或者仅仅是因为不喜欢图像的风格而贬低了相机,因此该评论属于垃圾评论。
另一方面,对于相机的评论可能优于相关图像中的对应图像特征的质量。例如评论是“相机拍摄的照片色彩鲜艳,很好看”,即第一情感极性是正面的;而通过检测相关图像中图像特征,发现图像中存在偏色,图像特征的质量不佳,即第二情感极性是负面的。此时,第一情感极性与第二情感极性不一致,评论者有可能是有意地或者仅仅是因为个人喜好而过高评价了相机,因此该评论也属于垃圾评论。
以上详细描述了根据本发明第一实施例的图像捕获设备的垃圾评论的检测方法。在该实施例中,基于评论信息和相关图像的一致性来判断评论的客观性,从而检测出客观性低下的垃圾评论。由于该检测方法基于评论和相关图像等具体事实而不是例如评论者的权威性这一不可靠因素来确定评论的客观性,因而具有较高的检测精度。而且,该检测方法不需要花费大量的人工时间进行处理,因而能够快速地检测出垃圾评论。
<第二实施例>
在根据本发明第一实施例的图像捕获设备的垃圾评论的检测方法中,对于第一情感极性与第二情感极性一致的评论,默认其是客观的评论,即不是垃圾评论。然而事实上,当第一情感极性与第二情感极性一致时,针对图像捕获设备的评论也并不一定是客观的。举例来说,即使针对相机的评论为负面的而且图像特征的质量也较差时(即第一情感极性与第二情感极性一致且均为负面的时),也不能认定该负面评论是客观的,因为图像特征的质量较差有可能是因为在使用相机拍摄图像时不适当的参数设置造成的,此时不应该认定相机是不好的。
具体的,图5示出了评论中的情感词的第一情感极性与图像特征的第二情感极性的可能的对应关系。如图5所示,当第一情感极性与第二情感极性都是中性的或者都是负面的时,不能确定对应的评论是否是客观的,因为第二情感极性未呈现正面有可能是因为在使用相机拍摄图像时不适当的参数设置造成的,即如果正确的设置了参数,图像特征的质量有可能是良好的,从而第二情感极性可能是正面的。
针对上述情况,本实施例提供了一种改进的图像捕获设备的垃圾评论检测方法。根据本实施例的图像捕获设备的垃圾评论的检测方法与第一实施例中描述的检测方法基本相同,其区别仅在于在步骤S203中比较了第一情感极性和所述第二情感极性之后,对于第一情感极性和第二情感极性一致的评论进行进一步的检查,以确定其是否是垃圾评论。具体的,在步骤S204中,在所述第一情感极性和所述第二情感极性一致并且均不是正面的情况下,确定所述图像捕获设备在拍摄所述相关图像时是否正确地设置了各个拍摄参数;如果至少一个所述拍摄参数未正确设置,则确定所述评论是垃圾评论。该步骤S204对于相机的评论是非正面的且图像特征质量不佳(一般或差)的情形进行进一步的检查。在该步骤中对于每一个相关的拍摄参数进行检查,只要有任何一个拍摄参数未能正确设置,就可以确定导致图像质量不佳的原因是相机拍摄参数未能正确设置,因此对于相机的非正面评论是不客观的,属于垃圾评论;而如果每一个拍摄参数都正确设置了,则意味着图像特征质量不佳的问题来自于相机的能力,因此对于相机的非正面评论是客观的,不属于垃圾评论。下面,将对该步骤中的具体处理进行详细的说明。
首先需要确定与评论中的特征词和情感词对应的拍摄参数,这可以通过例如查找预先设定的第二映射表来实现。表2示出了该第二映射表的一个示例。
表2
该表2是根据例如相机的图像捕获设备的成像原理和功能等预先设定的。表2中所示的相机拍摄参数是与情感词一栏中列出的各种负面/中性评价密切相关的拍摄参数,即如果未能正确设置这些相机拍摄参数,则会导致情感词一栏中列出的各种负面/中性评价。表2所示的仅仅是一个示例,图像处理领域的技术人员可以容易地扩展该表,以覆盖更多可能的评论情形。
在确定了所述拍摄参数后,将拍摄时各个拍摄参数的具体设置分别与各自对应的预先设定的合理参数设置进行比较,并确定是否正确地设置了各个拍摄参数。
拍摄时各个拍摄参数的具体设置可以从图像的EXIF信息中获得。众所周知,当通过例如数码相机的图像捕获设备拍摄图像时,数码相机会采集拍摄过程中的一系列拍摄参数信息,并将其嵌入在诸如JPEG/TIFF格式的图像的EXIF中。EXIF中包括了拍摄图像时设置的多个相机参数,例如,光圈、快门、焦距和闪光灯模式等。因此,只要通过例如第二映射表确定了应当检查哪些拍摄参数,就可以直接从EXIF中中提取拍摄时这些拍摄参数的具体设置。
可以采用任何适当的方式来对拍摄时拍摄参数的具体设置与预先设定的合理参数设置进行比较,以确定是否正确地设置了所述拍摄参数。例如,一种可能的方式是将相机拍摄参数按照其类型分为数字类型拍摄参数和种类类型拍摄单数,其中,对于每一个数字类型的拍摄参数,如果在拍摄时设置的数值为预先设定的合理参数设置所设定的图像捕获设备能够达到的最大值/最小值,则确定正确地设置了该拍摄参数;对于每一个种类类型的拍摄参数,如果在拍摄时设置的种类是预先设定的合理参数设置所设定的种类,或者如果在拍摄时设置的种类不是对应的预先设定的合理参数设置所设定的种类、并且图像捕获设备不具备所述合理参数设置所设定的种类,则确定正确地设置了该拍摄参数。下面,将结合图6所示的具体示例对这一处理进行详细说明。
图6示出了当第一情感极性和所述第二情感极性一致并且均为负面时相机参数设置的示例情形。例如,当如图6中的示例1所示,对于相机的评价是负面的“背景不够虚化”、特征词是“背景”、情感词是“不够虚化”时,相关的相机拍摄参数有两个,即数字类型的拍摄参数“光圈”和“焦距”。本领域中公知,为了使得背景尽可能虚化,应当将光圈和焦距都设置为最大值,即预先设定的合理参数设置应当是“图像捕获设备能够达到的最大值”。假设如图6中的示例1所示,相机光圈范围为:F/2.8-F/5.6,焦距范围为:28-560mm(这一数字可以例如从相机的说明书中获知),拍摄时实际的光圈设置为F/3.2,实际的焦距设置为28mm。可以看出,拍摄时光圈未设置成能够达到的最大值F/2.8,即未正确设置光圈。由此可知,图6的示例1所示的图像特征的质量“前景和背景的对比度不够大”并不是由于相机本身不好导致的,而是由于在拍摄时未正确设置相机的拍摄参数(光圈)使得相机的能力没有充分使用所导致的。因此,尽管该示例1中情感词“不够虚化”的第一情感极性和图像特征“对比度”的第二情感极性是一致的(均是负面的),但是对于相机的评论是不客观的,属于垃圾评论。
另外,例如,当如图6中的示例2所示,对于相机的评价是负面的“背光时人脸太黑”、特征词是“脸”,情感词是“黑”时,相关的相机拍摄参数有两个,即种类类型的拍摄参数“测光”和“闪光灯”。本领域中公知,为了避免在光线不足的情况下人脸太黑,应当采用点测光并且最好打开闪光灯,即预先设定的合理参数设置应当是“点测光”和“(闪光灯)开”。假设如图6中的示例2所示,相机具有评价测光、局部测光、点测光、中心加权平均测光4种测光模式,闪光灯具有开和关2种模式(可以例如从相机的说明书中获知),拍摄时实际的测光模式设置为评价测光,实际的闪光灯设置为关。可以看出,拍摄时未正确设置闪光灯和测光拍摄参数。由此可知,图6的示例2所示的图像特征的质量“脸的亮度不正常”并不是由于相机本身不好导致的,而是由于在拍摄时相机拍摄参数(测光和闪光灯)未正确设置使得相机的能力没有充分使用所导致的。因此,尽管该示例1中情感词“黑”的第一情感极性和图像特征“亮度”的第二情感极性是一致的(均是负面的),但是对于相机的评论是不客观的,属于垃圾评论。需要注意的是,如果对于该示例2的情形,相机仅具有评价测光、局部测光、中心加权平均测光3种测光模式,而不具备点测光模式,并且相机也没有安装闪光灯,则应当认为拍摄时已经正确地设置了拍摄参数,也就是说,图像特征的质量“脸的亮度不正常”并不是由于未正确设置参数导致的,而是由于相机本身的功能不足所导致的。因此,对于相机的负面评价是客观的,即不是垃圾评论。
以上描述了根据本发明第二实施例的图像捕获设备的垃圾评论检测方法,其中主要描述了该第二实施例与第一实施例的不同之处。在该实施例中,当针对相机的评论为非正面的而且图像特征的质量也不佳(负面或中性)时,不直接认定该非正面评论是客观的,而是进一步检测图像特征的质量不佳是否是由于在使用相机拍摄图像时不适当的参数设置造成的,从而进一步提高了垃圾评论的检测精度。
<变型>
在以上的两个实施例中,均以一条评论中仅有一个观点为例进行了说明。但是,本发明并不仅适用于这一情况,而是也可以适用于一条评论中包含有诸如“色彩鲜艳,很漂亮”、“背景不够虚化”等多个观点的情况。具体的,在一条评论中包含有多个观点的情况下,可以针对每个观点应用根据本发明上述实施例的检测方法,以检测每个观点的客观性,随后根据各个观点的重要性为其分配权重,并通过对各个观点的客观性进行加权平均来计算包含这些观点的评论的客观性,以确定该评论是否是垃圾评论。
另外,在以上的描述中,通过情感极性来表示情感词的情感趋向,并且将情感极性划分为正面情感、中性情感和负面情感。事实上,本领域技术人员可以根据实际需要,按照极性强度的不同,对情感极性进行进一步的划分。例如将正面情感进一步划分为强正面情感、普通正面情感、弱正面情感,将负面情感进一步划分为强负面情感、普通负面情感、弱负面情感等等。
<图像捕获设备的垃圾评论的检测设备的总体配置>
图7示出了根据本发明实施例的图像捕获设备的垃圾评论的检测设备700的功能配置框图。
如图7所示,垃圾评论检测设备700可以包括:提取单元710,配置为提取一评论中的特征词和情感词,并确定情感词的第一情感极性;极性确定单元720,配置为确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词对应的图像特征的第二情感极性;比较单元730,配置为比较所述第一情感极性和所述第二情感极性,并且如果所述第一情感极性和所述第二情感极性不一致,则确定所述评论是垃圾评论。
上述提取单元710、极性确定单元720和比较单元730的具体功能和操作可以参考上述对图2到图6的相关描述,此处不再重复描述。
可选的,检测设备700还可以包括参数检测单元740,配置为在所述第一情感极性和所述第二情感极性一致并且均不是正面的情况下,确定所述图像捕获设备在拍摄所述被评论图像时是否正确地设置了各个拍摄参数。如果该参数检测单元740确定至少一个所述拍摄参数未正确设置,则所述比较单元730确定所述评论是垃圾评论。参数检测单元740的具体功能和操作可以参考上述对图5和6的相关描述,此处不再重复描述。
<系统硬件配置>
图8示出了根据本发明实施例的图像捕获设备的垃圾评论的检测系统800的总体硬件框图。如图8所示,垃圾评论检测系统800可以包括:输入设备810,用于从外部输入有关图像或信息,例如对图像捕获设备的评论、相关图像等,该输入设备例如可以是键盘、鼠标、相机等等;处理设备820,用于实施上述的按照本发明实施例的垃圾评论检测方法,或者实施为上述的垃圾评论检测设备,该处理设备例如可以是计算机的中央处理器或其它的具有处理能力的芯片等等;输出设备830,用于向外部输出实施上述检测过程所得到的结果,例如带有客观性(垃圾)标记的各条评论等,该输出设备例如可以是显示器、打印机等等;以及存储设备840,用于以易失或非易失的方式存储上述对象跟踪过程所涉及的数据,例如第一映射表、第二映射表、第一情感极性、第二情感极性、预先设定的合理参数设置、拍摄时各个拍摄参数的设置、图像捕获设备的功能说明等等,该存储设备例如可以是随机存取存储器(RAM)、只读存储器(ROM)、硬盘、或半导体存储器等等的各种易失或非易失性存储器。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。
还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (9)

1.一种图像捕获设备的垃圾评论的检测方法,包括:
提取一评论中的特征词和情感词,并确定该情感词的第一情感极性;
确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词对应的图像特征的第二情感极性;
比较所述第一情感极性和所述第二情感极性,并且如果所述第一情感极性和所述第二情感极性不一致,则确定所述评论是垃圾评论。
2.如权利要求1所述的检测方法,还包括:
如果所述第一情感极性和所述第二情感极性一致并且均不是正面的,则确定所述图像捕获设备在拍摄所述相关图像时是否正确地设置了各个拍摄参数;
如果至少一个所述拍摄参数未正确设置,则确定所述评论是垃圾评论。
3.如权利要求1或2所述的检测方法,其中所述确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词对应的图像特征的第二情感极性包括:
根据预先设定的第一映射表,确定与所述特征词和情感词对应的图像特征;
检测所述相关图像中该图像特征的质量,并基于该质量确定该图像特征的第二情感极性。
4.如权利要求2所述的检测方法,其中所述确定所述图像捕获设备在拍摄所述相关图像时是否正确地设置了各个拍摄参数包括:
根据预先设定的第二映射表,确定与所述特征词和情感词对应的各个拍摄参数;
将拍摄时各个拍摄参数的设置分别与各自对应的预先设定的合理参数设置进行比较,并确定是否正确地设置了各个拍摄参数。
5.如权利要求4所述的检测方法,其中将拍摄时各个拍摄参数的设置分别与各自对应的预先设定的合理参数设置进行比较并确定是否正确地设置了各个拍摄参数进一步包括:
对于每一个数字类型的所述拍摄参数,如果在拍摄所述相关图像时设置的数值为预先设定的合理参数设置所设定的图像捕获设备能够达到的最大值或最小值,则确定正确地设置了该拍摄参数。
6.如权利要求4或5所述的检测方法,其中将拍摄时各个拍摄参数的设置分别与各自对应的预先设定的合理参数设置进行比较并确定是否正确地设置了各个拍摄参数进一步包括:
对于每一个种类类型的所述拍摄参数,如果在拍摄所述相关图像时设置的种类是预先设定的合理参数设置所设定的种类,或者如果在拍摄所述相关图像时设置的种类不是预先设定的合理参数设置所设定的种类、并且所述图像捕获设备不具备所述合理参数设置所设定的种类,则确定正确地设置了该拍摄参数。
7.一种图像捕获设备的垃圾评论的检测设备,包括:
提取单元,配置为提取一评论中的特征词和情感词,并确定该情感词的第一情感极性;
极性确定单元,配置为确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词对应的图像特征的第二情感极性;
比较单元,配置为比较所述第一情感极性和所述第二情感极性,并且如果所述第一情感极性和所述第二情感极性不一致,则确定所述评论是垃圾评论。
8.如权利要求7所述的检测设备,还包括:
参数检测单元,配置为在所述第一情感极性和所述第二情感极性一致并且均不是正面的情况下,确定所述图像捕获设备在拍摄所述相关图像时是否正确地设置了各个拍摄参数,
所述比较单元进一步配置为如果该参数检测单元确定至少一个所述拍摄参数未正确设置,则确定所述评论是垃圾评论。
9.一种图像捕获设备的垃圾评论的检测方法,包括:
对于评论中的每个观点进行下述处理:
提取该观点中的特征词和情感词,并确定该情感词的第一情感极性;
确定由所述图像捕获设备拍摄的相关图像中与所述特征词和情感词对应的图像特征的第二情感极性;
比较所述第一情感极性和所述第二情感极性,并且如果所述第一情感极性和所述第二情感极性不一致,则确定所述观点的客观性为不客观;以及
对各个观点的客观性进行加权平均,以计算所述评论的客观性并确定该评论是否为垃圾评论,其中权重根据各个观点的重要性来确定。
CN201410209884.1A 2014-05-19 2014-05-19 垃圾评论检测方法及设备 Expired - Fee Related CN105095181B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410209884.1A CN105095181B (zh) 2014-05-19 2014-05-19 垃圾评论检测方法及设备
JP2015101200A JP6547409B2 (ja) 2014-05-19 2015-05-18 スパムコメントの検出方法及びスパムコメントの検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410209884.1A CN105095181B (zh) 2014-05-19 2014-05-19 垃圾评论检测方法及设备

Publications (2)

Publication Number Publication Date
CN105095181A CN105095181A (zh) 2015-11-25
CN105095181B true CN105095181B (zh) 2017-12-29

Family

ID=54575654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410209884.1A Expired - Fee Related CN105095181B (zh) 2014-05-19 2014-05-19 垃圾评论检测方法及设备

Country Status (2)

Country Link
JP (1) JP6547409B2 (zh)
CN (1) CN105095181B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101785288B1 (ko) 2016-05-25 2017-10-16 (주)망고플레이트 온라인 콘텐츠의 허위 평가 정보 적발 장치, 방법 및 프로그램
CN107807914A (zh) * 2016-09-09 2018-03-16 阿里巴巴集团控股有限公司 情感倾向的识别方法、对象分类方法及数据处理系统
CN106649268A (zh) * 2016-11-30 2017-05-10 北京京东尚科信息技术有限公司 调研样本判断方法及系统、灰名单生成方法及系统
KR101960962B1 (ko) * 2017-09-28 2019-03-22 (주)망고플레이트 빈도의 변화 정보를 이용한 온라인 콘텐츠의 허위 평가 정보 적발 장치 및 방법
KR101960960B1 (ko) * 2017-09-28 2019-03-22 (주)망고플레이트 Hhi를 이용한 온라인 콘텐츠의 허위 평가 정보 적발 장치 및 방법
CN107766550A (zh) * 2017-10-31 2018-03-06 广东欧珀移动通信有限公司 评论信息处理方法、装置、终端设备及存储介质
CN110175851B (zh) * 2019-02-28 2023-09-12 腾讯科技(深圳)有限公司 一种作弊行为检测方法及装置
CN110442798B (zh) * 2019-07-03 2021-10-08 华中科技大学 基于网络表示学习的垃圾评论用户群组检测方法
CN112445908A (zh) * 2019-08-29 2021-03-05 北京京东尚科信息技术有限公司 商品评论信息的展示方法、装置、电子设备和存储介质
KR20220152778A (ko) * 2021-05-10 2022-11-17 엔에이치엔클라우드 주식회사 쇼핑몰 웹 페이지와 연관된 데이터를 제공하는 장치 및 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008276409A (ja) * 2007-04-26 2008-11-13 Olympus Corp データ処理装置、データ処理方法、及びプログラム
CN102279894A (zh) * 2011-09-19 2011-12-14 嘉兴亿言堂信息科技有限公司 基于语义的查找、集成和提供评论信息的方法及搜索系统
US8271902B1 (en) * 2006-07-20 2012-09-18 Adobe Systems Incorporated Communication of emotions with data
CN103389971A (zh) * 2013-07-04 2013-11-13 北京卓易讯畅科技有限公司 一种确定应用对应的评论内容的优质等级的方法与设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8271902B1 (en) * 2006-07-20 2012-09-18 Adobe Systems Incorporated Communication of emotions with data
JP2008276409A (ja) * 2007-04-26 2008-11-13 Olympus Corp データ処理装置、データ処理方法、及びプログラム
CN102279894A (zh) * 2011-09-19 2011-12-14 嘉兴亿言堂信息科技有限公司 基于语义的查找、集成和提供评论信息的方法及搜索系统
CN103389971A (zh) * 2013-07-04 2013-11-13 北京卓易讯畅科技有限公司 一种确定应用对应的评论内容的优质等级的方法与设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Conceptual level similarity measure based review spam detection;Siddu P.Algur et al;《2010 International Conference on Signal and Image Processing》;20101215;第416-423页 *
一种基于内容的广告垃圾图像过滤方法;许洋洋 等;《山东大学学报(理学版)》;20060630;第41卷(第3期);第37-42页 *
中文网络评论的IT产品特征挖掘及情感倾向分析;吴丽华 等;《计算机与数字工程》;20121130;第40卷(第11期);第52-54页 *

Also Published As

Publication number Publication date
JP2015219923A (ja) 2015-12-07
CN105095181A (zh) 2015-11-25
JP6547409B2 (ja) 2019-07-24

Similar Documents

Publication Publication Date Title
CN105095181B (zh) 垃圾评论检测方法及设备
Toulouse et al. Computer vision for wildfire research: An evolving image dataset for processing and analysis
CN105518678B (zh) 搜索方法、搜索装置和用户设备
Fan et al. Estimating EXIF parameters based on noise features for image manipulation detection
ES2388413B1 (es) Método para la clasificación de videos.
Väisänen et al. Exploring human–nature interactions in national parks with social media photographs and computer vision
CN106921829A (zh) 一种拍照方法和装置及拍照设备
CN107590447A (zh) 一种文字标题识别方法及装置
CN109544497A (zh) 用于输电线路检测的图像融合方法及电子设备
Chen et al. Camera model identification with residual neural network
CN108961209B (zh) 行人图像质量评价方法、电子设备及计算机可读介质
Liu et al. Soft prototyping camera designs for car detection based on a convolutional neural network
CN112200844A (zh) 生成图像的方法、装置、电子设备及介质
CN107977437A (zh) 图像处理方法、装置、存储介质和电子设备
Redi et al. Bridging the aesthetic gap: The wild beauty of web imagery
RU2510935C2 (ru) Способ индексации и поиска цифровых изображений
Kuzovkin et al. Image selection in photo albums
Li et al. Distinguishing computer graphics from photographic images using a multiresolution approach based on local binary patterns
CN113076961A (zh) 一种图像特征库更新方法、图像检测方法和装置
CN104598921A (zh) 视频预览图的选取方法及选取装置
Rawat et al. Context-based photography learning using crowdsourced images and social media
Pal et al. How do warm colors affect visual attention?
JP6604413B1 (ja) 画像検索装置、画像検索システム、画像検索方法及びプログラム
CN104021220B (zh) 基于显著性模型的图像检索方法
US20160360079A1 (en) Generation apparatus and method for evaluation information, electronic device and server

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171229

Termination date: 20200519

CF01 Termination of patent right due to non-payment of annual fee