CN104933130A - 评论信息的标注方法及装置 - Google Patents
评论信息的标注方法及装置 Download PDFInfo
- Publication number
- CN104933130A CN104933130A CN201510325108.2A CN201510325108A CN104933130A CN 104933130 A CN104933130 A CN 104933130A CN 201510325108 A CN201510325108 A CN 201510325108A CN 104933130 A CN104933130 A CN 104933130A
- Authority
- CN
- China
- Prior art keywords
- emotion
- emotion word
- comment
- word
- viewpoint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Abstract
本发明实施例提供了一种评论信息的标注方法及装置,所述方法包括:获取多个事件评论的数据;分别对所述多个事件评论划分语句,并且将划分出的语句分别作为评论观点;分别从所述评论观点提取情感词;将在任一评论观点中共同出现的情感词进行关联,构建情感词社区网络;为所述情感词社区网络中的任一情感词社区中的情感词所属的评论观点标注情感性质的数据,所述情感性质是正面、负面或中立,所述情感词社区包括一组直接或间接关联的情感词。本发明实施例的评论信息的标注方法及装置,能够自动地对事件评论进行情感聚类,并为其标注情感性质。
Description
技术领域
本发明涉及网络信息处理技术领域,尤其涉及一种评论信息的标注方法及装置。
背景技术
通常,现有的评论聚类方法多是关于商品评论的,例如天猫,亚马逊等网站中的用户评价。其主要是围绕商品的不同属性对评论进行聚类。一般来说,首先构建属性的类别,其次从评论中挖掘包含的属性,然后把评论归到所包含属性的类别。其中,从评论中挖掘属性常采用例如基于词典、基于机器学习等方法。
然而,事件评论与商品评论有着本质的不同,事件评论大多都没有属性。因此,无法简单地把商品聚类方法照搬到事件评论上。其次,事件评论内容较广,使得常用的基于词典预先构建类别的方法无法适用于事件评论。
发明内容
本发明实施例的目的在于,提供一种评论信息的标注方法及装置,以实现自动地对事件评论进行情感聚类,并为其标注情感性质,提升用户网络体验。
为实现上述发明目的,本发明的实施例提供了一种评论信息的标注方法,包括:获取多个事件评论的数据;分别对所述多个事件评论划分语句,并且将划分出的语句分别作为评论观点;分别从所述评论观点提取情感词;将在任一评论观点中共同出现的情感词进行关联,构建情感词社区网络;为所述情感词社区网络中的任一情感词社区中的情感词所属的评论观点标注情感性质的数据,所述情感性质是正面、负面或中立,所述情感词社区包括一组直接或间接关联的情感词。
优选地,所述分别从所述评论观点提取情感词的处理包括:分别对所述评论观点的语句进行切词,并且通过将切出的分词与预先构建的情感词词典匹配来选取所述情感词,所述情感词词典包括多个情感词以及其情感性质的数据。
优选地,所述将在任一评论观点中共同出现的情感词进行关联,构建情感词社区网络的处理还包括:对于所述情感词社区网络中的任意两个关联的情感词,计算所述两个情感词共同出现在同一评论观点中的共现频度,并且如果计算的共现频度的值低于预定的共现频度阈值,则去除所述两个情感词之间的关联关系。
优选地,所述为所述情感词社区网络中的任一情感词社区中的情感词所属的评论观点标注情感性质的数据的处理包括:根据所述情感词社区中的情感词的情感性质为其所属的评论观点标注情感性质的数据。
优选地,所述情感词词典还包括所述多个情感词的情感强度的数据,所述为所述情感词社区网络中的任一情感词社区中的情感词所属的评论观点标注情感性质的数据的处理还包括:如果任一所述评论观点包括不同情感性质的情感词,则为所述评论观点标注情感强度最强的情感词对应的情感性质的数据。
优选地,所述分别对所述多个事件评论划分语句的处理还包括:去除字数超过预定句长的语句,和/或去除广告性质的语句。
本发明的实施例还提供了一种评论信息的标注装置,包括:评论获取模块,用于获取多个事件评论的数据;评论分句模块,用于分别对所述多个事件评论划分语句,并且将划分出的语句分别作为评论观点;情感词提取模块,用于分别从所述评论观点提取情感词;情感网络构建模块,用于将在任一评论观点中共同出现的情感词进行关联,构建情感词社区网络;情感标注模块,用于为所述情感词社区网络中的任一情感词社区中的情感词所属的评论观点标注情感性质的数据,所述情感性质是正面、负面或中立,所述情感词社区包括一组直接或间接关联的情感词。
优选地,所述情感词提取模块用于分别对所述评论观点的语句进行切词,并且通过将切出的分词与预先构建的情感词词典匹配来选取所述情感词,所述情感词词典包括多个情感词以及其情感性质的数据。
优选地,所述情感网络构建模块用于对于所述情感词社区网络中的任意两个关联的情感词,计算所述两个情感词共同出现在同一评论观点中的共现频度,并且如果计算的共现频度的值低于预定的共现频度阈值,则去除所述两个情感词之间的关联关系。
优选地,所述情感标注模块用于根据所述情感词社区中的情感词的情感性质为其所属的评论观点标注情感性质的数据。
优选地,所述情感词词典还包括所述多个情感词的情感强度的数据,所述情感标注模块还用于如果任一所述评论观点包括不同情感性质的情感词,则为所述评论观点标注情感强度最强的情感词对应的情感性质的数据。
优选地,所述评论分句模块还用于去除字数超过预定句长的语句,和/或去除广告性质的语句。
本发明实施例提供的评论信息的标注方法及装置,通过对获取到的多个事件评论进行分句得到多个评论观点,再以评论观点中包含的情感词为聚类依据,从而自动地对事件评论进行情感聚类,并为其标注情感性质,使得用户能够快速知晓舆情的大体,方便用户阅读,极大丰富了用户体验。
此外,标注了情感性质的数据的评论观点使得用户能够方便了解其他用户关注事件热点的看法。
附图说明
图1是示出本发明实施例一的评论信息的标注方法的流程图;
图2是示出本发明实施例一的评论信息的标注方法的情感词词典的示例图;
图3是示出本发明实施例一的评论信息的标注方法的情感词社区网络的示例图;
图4是示出本发明实施例一的评论信息的标注方法的情感聚类结果的示例图;
图5是示出本发明实施例二的评论信息的标注装置的逻辑框图。
具体实施方式
本发明的基本构思是,在获取到多个事件评论的数据之后,进一步地对事件评论划分语句,并将划分出的语句作为评论观点,采用“情感词”作为评论观点聚类的关键,从而自动地对事件评论进行情感聚类,并为其标注情感性质。所述情感性质可以是,但不限于,正面、负面或中立,最终生成例如正面言论、负面言论以及中立言论的效果,使得用户能够方便、快速地知道其他用户关注事件的各个方面,提升用户网络体验。
此外,本发明适用范围广,类似于新闻资讯类的用户评论尤其适用于所述方法,同时还可为舆情监控提供大量的数据来源。
下面结合附图对本发明实施例一种评论信息的标注方法及装置进行详细描述。
实施例一
图1是示出本发明实施例一的评论信息的标注方法的流程图。可在例如微博服务器上执行所述方法。
参照图1,在步骤S110,获取多个事件评论的数据。
这里,事件评论的数据可以是例如但不限于,微博、贴吧、新闻、论坛等来源用户发表的评论文本。
在步骤S120,分别对所述多个事件评论划分语句,并且将划分出的语句分别作为评论观点。
也就是说,对每个事件评论进行分句,划分出的语句作为一个独立的评论观点。为了更为准确地获得评论观点,根据本发明的可选实施例,步骤S120包括:去除字数超过预定句长的语句,和/或去除广告性质的语句。
在步骤S130,分别从所述评论观点提取情感词。
根据本发明的示例性实施例,步骤S130包括:分别对所述评论观点的语句进行切词,并且通过将切出的分词与预先构建的情感词词典匹配来选取所述情感词。
需要说明的是,现有技术关于情感词抽取一般采用直接匹配的方式,但是直接匹配的方式无法保证抽取效果,有可能会忽略一些情感词,然而,本实施例采用先切词再匹配的方式,也就是说,将一个汉字序列切分成一个一个单独的词语,从而将切出的分词与预先构建的情感词词典进行匹配,匹配到的词语选取为情感词。
这里,所述情感词词典包括多个情感词以及其情感性质的数据。所述情感性质是,但不限于,正面、负面或中立。
图2是示出本发明实施例一的评论信息的标注方法的情感词词典的示例图,其中列出了多个情感词样例,例如博学多才、毒谋、猛然等等。这里仅是示意性得列出部分情感词,实际上情感词词典可包括上万甚至更多情感词以及其情感性质的数据。例如,“博学多才”这个情感词表达的是一种正面的情感,其情感性质的数据为“1”代表正面,同理,“毒谋”这个情感词表达的是负面的情感,其情感性质的数据为“-1”代表负面,而“猛然”这个情感词没有明显的情感倾向,其情感性质的数据为“0”,则代表中立。
在步骤S140,将在任一评论观点中共同出现的情感词进行关联,构建情感词社区网络。
具体地,将情感词是否共同出现作为依据,对任一评论观点中的情感词进行关联,那么事件评论的数据中所有的情感词即可构成一个情感词社区网络。这里,所述情感词社区包括一组直接或间接关联的情感词。
图3是示出本发明实施例一的评论信息的标注方法的情感词社区网络的示例图,其中的每个小圆圈代表一个情感词,两个小圆圈之间的连线代表情感词之间的关联关系,连线长度越短表明情感词之间的关联关系越强,例如情感词a和情感词b是相关联的,三个虚线大圆圈分别代表三个情感词社区。
以关于《亚太城市房地产研究院院长:楼市仍有20年黄金期》的事件评论为例,经过前述步骤S110~S140的处理得到如下的四个情感词社区:
情感词社区1:改革、危机、确实、单纯、计较、不行、你以为自己、遥远、奇怪、差的、什么东西、烦恼、问题、快乐、不知道、健康、应该、经济、发展、负荷、牛逼、想、理解、垃圾、无法、其实;
情感词社区2:皑皑、守候、天真、忠义、敬、痴、硬汉、两肋插刀、解语花、诚、愿、坎坷;
情感词社区3:自然、清新、标准、最高、精装;
情感词社区4:太棒了、最爱、感谢。
为了更为准确地构建情感词社区网络,根据本发明的示例性实施例,步骤S140还包括:对于所述情感词社区网络中的任意两个关联的情感词,计算所述两个情感词共同出现在同一评论观点中的共现频度,并且如果计算的共现频度的值低于预定的共现频度阈值,则去除所述两个情感词之间的关联关系。
在具体的实现方式中,可根据所述两个情感词各自的出现次数及其共现次数,计算所述两个情感词的共现频度。这里,共现次数通常是指两个情感词在同一评论观点中出现的次数,比如“博学多才”和“前程似锦”在某一评论观点中同时出现,那么二者的共现次数为1,倘若“博学多才”和“前程似锦”又在另一评论观点中再次同时出现,它们的共现次数就为2。前述共现频度的计算可通过以下公式执行:
其中,word1为情感词a,word2为情感词b,(word1,word2)为情感词a和情感词b的共现次数,(word1)为情感词a的出现次数,(word2)为情感词b的出现次数,N(word1,word2)为情感词a与情感词b的共现频度。
在获得各个情感词之间的共现频度之后,进一步选取低于预定的共现频度阈值的两个情感词,将符合上述条件的情感词之间的关联关系去除。此外,为了避免个别低频情感词与其他情感词的共现频度过高,还可去除出现次数低于设定出现次数阈值的情感词与其他情感词之间的关联关系。
在步骤S150,为所述情感词社区网络中的任一情感词社区中的情感词所属的评论观点标注情感性质的数据。
具体地,根据所述情感词社区中的情感词的情感性质为其所属的评论观点标注情感性质的数据。也就是说,如果某个情感词的情感性质为正面,那么将所述情感词所属的评论观点的情感性质也标注为正面。
根据本发明的优选实施例,所述情感词词典还可以包括所述多个情感词的情感强度的数据,所述情感强度的数据是对情感性质的量化。
同样参照图2,图中最后一竖列数据代表情感词的情感强度的数据,其数值越大则代表所述情感词的情感越强烈,例如“博学多才”这个情感词,其情感强度数据是“7”,表明“博学多才”体现的正面的情感性质比较重,再例如“前程似锦”这个情感词,其情感强度数据是“9”,根前述“博学多才”的情感强度数据“7”要大,则表明“前程似锦”比“博学多才”表达正面的情感性质更重。
此外,还会出现一些特殊的情况,例如在同一评论观点中出现不同情感性质的情感词时,该如何为所述评论观点标注情感性质,相应地,根据本发明的示例性实施例,步骤S150还包括:如果任一所述评论观点包括不同情感性质的情感词,则为所述评论观点标注情感强度最强的情感词对应的情感性质的数据。
举例来说,假设某一评论观点中包括了“前程似锦”和“怨气”两个情感词,恰好“前程似锦”的情感性质是正面,而“怨气”的情感性质是负面,那就比较二者的情感强度的大小,同样参照图2可知,“前程似锦”的情感强度数据是“9”,“怨气”的情感强度数据是“7”,由此可见,“前程似锦”的情感强度数据比“怨气”的情感强度数据要大,则表明所述评论观点表达正面的情感倾向最强,那么就将所述评论观点的情感性质也标注为正面,其情感性质的数据为“1”。
经过前述步骤S110~S150的处理,最终得到标注了情感性质的数据的评论观点。图4是示出本发明实施例一的评论信息的标注方法的情感聚类结果的示例图,参照图4,同样以关于《亚太城市房地产研究院院长:楼市仍有20年黄金期》的事件评论为例,情感性质为正面的评论观点为一类,即图中所示的正面言论,同理,情感性质为负面的评论观点为一类,即图中所示的负面言论,情感性质为中立的评论观点为一类,即图中所示的中立言论。从而达到了一个类似于正方反方的效果,使得用户方便快速地了解舆情的大体,极大程度地提升了用户网络体验。
本发明实施例提供的评论信息的标注方法,首先,对获取到的多个事件评论进行分句得到多个评论观点,其次,以评论观点中包含的更准确反映用户意见倾向的情感词作为聚类依据,从而自动地对事件评论进行情感聚类,并为其标注情感性质,标注了情感性质的评论观点使得用户更为直观、便捷地了解其他用户关注事件热点的看法,提升了用户体验。本发明实施例适用范围广,适用于任何用户评论的归类,尤其是事件资讯类的用户评论。
实施例二
图5是示出本发明实施例二的评论信息的标注装置的逻辑框图。可用于执行如图1所示实施例的方法步骤。
参照图5,所述评论信息的标注装置包括评论获取模块510、评论分句模块520、情感词提取模块530、情感网络构建模块540和情感标注模块550。
评论获取模块510用于获取多个事件评论的数据。
评论分句模块520用于分别对所述多个事件评论划分语句,并且将划分出的语句分别作为评论观点。
可选地,所述评论分句模块520还用于去除字数超过预定句长的语句,和/或去除广告性质的语句。
情感词提取模块530用于分别从所述评论观点提取情感词。
具体地,所述情感词提取模块530用于分别对所述评论观点的语句进行切词,并且通过将切出的分词与预先构建的情感词词典匹配来选取所述情感词,所述情感词词典包括多个情感词以及其情感性质的数据。
情感网络构建模块540用于将在任一评论观点中共同出现的情感词进行关联,构建情感词社区网络。
优选地,所述情感网络构建模块540用于对于所述情感词社区网络中的任意两个关联的情感词,计算所述两个情感词共同出现在同一评论观点中的共现频度,并且如果计算的共现频度的值低于预定的共现频度阈值,则去除所述两个情感词之间的关联关系。
情感标注模块550用于为所述情感词社区网络中的任一情感词社区中的情感词所属的评论观点标注情感性质的数据,所述情感性质是正面、负面或中立,所述情感词社区包括一组直接或间接关联的情感词。
优选地,所述情感标注模块550用于根据所述情感词社区中的情感词的情感性质为其所属的评论观点标注情感性质的数据。
进一步地,所述情感词词典还包括所述多个情感词的情感强度的数据,所述情感标注模块550还用于如果任一所述评论观点包括不同情感性质的情感词,则为所述评论观点标注情感强度最强的情感词对应的情感性质的数据。
本发明实施例提供的评论信息的标注装置,先对获取到的多个事件评论进行分句得到多个评论观点。进一步以评论观点中包含的情感词作为聚类依据,从而自动地对事件评论进行情感聚类,并为其标注情感性质,使得用户能够快速知晓舆情的大体,方便用户阅读,极大丰富了用户体验。
在本发明所提供的几个实施例中,应该理解到,所公开的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (12)
1.一种评论信息的标注方法,其特征在于,所述方法包括:
获取多个事件评论的数据;
分别对所述多个事件评论划分语句,并且将划分出的语句分别作为评论观点;
分别从所述评论观点提取情感词;
将在任一评论观点中共同出现的情感词进行关联,构建情感词社区网络;
为所述情感词社区网络中的任一情感词社区中的情感词所属的评论观点标注情感性质的数据,所述情感性质是正面、负面或中立,所述情感词社区包括一组直接或间接关联的情感词。
2.根据权利要求1所述的方法,其特征在于,所述分别从所述评论观点提取情感词的处理包括:
分别对所述评论观点的语句进行切词,并且通过将切出的分词与预先构建的情感词词典匹配来选取所述情感词,所述情感词词典包括多个情感词以及其情感性质的数据。
3.根据权利要求2所述的方法,其特征在于,所述将在任一评论观点中共同出现的情感词进行关联,构建情感词社区网络的处理还包括:
对于所述情感词社区网络中的任意两个关联的情感词,计算所述两个情感词共同出现在同一评论观点中的共现频度,并且如果计算的共现频度的值低于预定的共现频度阈值,则去除所述两个情感词之间的关联关系。
4.根据权利要求3所述的方法,其特征在于,所述为所述情感词社区网络中的任一情感词社区中的情感词所属的评论观点标注情感性质的数据的处理包括:
根据所述情感词社区中的情感词的情感性质为其所属的评论观点标注情感性质的数据。
5.根据权利要求4所述的方法,其特征在于,所述情感词词典还包括所述多个情感词的情感强度的数据,
所述为所述情感词社区网络中的任一情感词社区中的情感词所属的评论观点标注情感性质的数据的处理还包括:
如果任一所述评论观点包括不同情感性质的情感词,则为所述评论观点标注情感强度最强的情感词对应的情感性质的数据。
6.根据权利要求1~5中任一项所述的方法,其特征在于,所述分别对所述多个事件评论划分语句的处理还包括:
去除字数超过预定句长的语句,和/或
去除广告性质的语句。
7.一种评论信息的标注装置,其特征在于,所述装置包括:
评论获取模块,用于获取多个事件评论的数据;
评论分句模块,用于分别对所述多个事件评论划分语句,并且将划分出的语句分别作为评论观点;
情感词提取模块,用于分别从所述评论观点提取情感词;
情感网络构建模块,用于将在任一评论观点中共同出现的情感词进行关联,构建情感词社区网络;
情感标注模块,用于为所述情感词社区网络中的任一情感词社区中的情感词所属的评论观点标注情感性质的数据,所述情感性质是正面、负面或中立,所述情感词社区包括一组直接或间接关联的情感词。
8.根据权利要求7所述的装置,其特征在于,所述情感词提取模块用于分别对所述评论观点的语句进行切词,并且通过将切出的分词与预先构建的情感词词典匹配来选取所述情感词,所述情感词词典包括多个情感词以及其情感性质的数据。
9.根据权利要求8所述的装置,其特征在于,所述情感网络构建模块还用于对于所述情感词社区网络中的任意两个关联的情感词,计算所述两个情感词共同出现在同一评论观点中的共现频度,并且如果计算的共现频度的值低于预定的共现频度阈值,则去除所述两个情感词之间的关联关系。
10.根据权利要求9所述的装置,其特征在于,所述情感标注模块用于根据所述情感词社区中的情感词的情感性质为其所属的评论观点标注情感性质的数据。
11.根据权利要求10所述的装置,其特征在于,所述情感词词典还包括所述多个情感词的情感强度的数据,所述情感标注模块还用于如果任一所述评论观点包括不同情感性质的情感词,则为所述评论观点标注情感强度最强的情感词对应的情感性质的数据。
12.根据权利要求7~11中任一项所述的装置,其特征在于,所述评论分句模块还用于去除字数超过预定句长的语句,和/或去除广告性质的语句。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510325108.2A CN104933130A (zh) | 2015-06-12 | 2015-06-12 | 评论信息的标注方法及装置 |
PCT/CN2015/097774 WO2016197577A1 (zh) | 2015-06-12 | 2015-12-17 | 评论信息的标注方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510325108.2A CN104933130A (zh) | 2015-06-12 | 2015-06-12 | 评论信息的标注方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104933130A true CN104933130A (zh) | 2015-09-23 |
Family
ID=54120297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510325108.2A Pending CN104933130A (zh) | 2015-06-12 | 2015-06-12 | 评论信息的标注方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN104933130A (zh) |
WO (1) | WO2016197577A1 (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105824898A (zh) * | 2016-03-14 | 2016-08-03 | 苏州大学 | 一种网络评论的标签提取方法和装置 |
WO2016197577A1 (zh) * | 2015-06-12 | 2016-12-15 | 百度在线网络技术(北京)有限公司 | 评论信息的标注方法、装置和计算机设备 |
CN106874417A (zh) * | 2017-01-22 | 2017-06-20 | 努比亚技术有限公司 | 一种搜索方法及设备 |
CN107220352A (zh) * | 2017-05-31 | 2017-09-29 | 北京百度网讯科技有限公司 | 基于人工智能构建评论图谱的方法和装置 |
CN107704558A (zh) * | 2017-09-28 | 2018-02-16 | 北京车慧互动广告有限公司 | 一种用户意见抽取方法及系统 |
CN109271512A (zh) * | 2018-08-29 | 2019-01-25 | 中国平安保险(集团)股份有限公司 | 舆情评论信息的情感分析方法、装置及存储介质 |
CN109739947A (zh) * | 2018-12-26 | 2019-05-10 | 广东工业大学 | 一种数据处理装置、方法、电子设备和存储介质 |
CN110134938A (zh) * | 2018-02-09 | 2019-08-16 | 优酷网络技术(北京)有限公司 | 评论分析方法及装置 |
CN111027328A (zh) * | 2019-11-08 | 2020-04-17 | 广州坚和网络科技有限公司 | 通过语料训练判断评论情绪正负及感情色彩的方法 |
CN113157899A (zh) * | 2021-05-27 | 2021-07-23 | 东莞心启航联贸网络科技有限公司 | 一种大数据画像分析方法、服务器及可读存储介质 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110175851B (zh) * | 2019-02-28 | 2023-09-12 | 腾讯科技(深圳)有限公司 | 一种作弊行为检测方法及装置 |
CN112528133A (zh) * | 2019-09-18 | 2021-03-19 | 北京国双科技有限公司 | 一种网络数据标注方法、装置、设备和存储介质 |
CN111126035A (zh) * | 2019-12-24 | 2020-05-08 | 深圳视界信息技术有限公司 | 一种电商评论分析场景下细粒度属性分析方法 |
CN111209371A (zh) * | 2019-12-31 | 2020-05-29 | 新华网股份有限公司 | 评论数据处理方法、装置、计算机设备和存储介质 |
CN111260437B (zh) * | 2020-01-14 | 2023-07-11 | 北京邮电大学 | 一种基于商品方面级情感挖掘和模糊决策的产品推荐方法 |
KR102244699B1 (ko) * | 2020-06-15 | 2021-04-27 | 주식회사 크라우드웍스 | 인공지능 학습데이터 생성을 위한 크라우드소싱 기반 프로젝트의 문장 유사도를 이용한 감정 라벨링 방법 |
CN112565824B (zh) * | 2020-12-03 | 2021-09-14 | 腾讯科技(深圳)有限公司 | 一种生成弹幕的方法、装置、终端及存储介质 |
CN115209210A (zh) * | 2022-07-19 | 2022-10-18 | 抖音视界有限公司 | 基于弹幕生成信息的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408883A (zh) * | 2008-11-24 | 2009-04-15 | 电子科技大学 | 一种网络舆情观点收集方法 |
CN102236650A (zh) * | 2010-04-20 | 2011-11-09 | 日电(中国)有限公司 | 用于修正和/或扩展情感词典的方法和装置 |
CN103150367A (zh) * | 2013-03-07 | 2013-06-12 | 宁波成电泰克电子信息技术发展有限公司 | 一种中文微博的情感倾向分析方法 |
US20140067814A1 (en) * | 2012-09-04 | 2014-03-06 | salesforces.com, Inc. | Computer implemented methods and apparatus for identifying a topic for a text |
CN104484437A (zh) * | 2014-12-24 | 2015-04-01 | 福建师范大学 | 一种网络短评情感挖掘方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070294230A1 (en) * | 2006-05-31 | 2007-12-20 | Joshua Sinel | Dynamic content analysis of collected online discussions |
CN101609459A (zh) * | 2009-07-21 | 2009-12-23 | 北京大学 | 一种情感特征词提取系统 |
CN102486771B (zh) * | 2009-11-30 | 2015-07-08 | 国际商业机器公司 | 在网页上发布指定内容的方法和系统 |
CN102375838A (zh) * | 2010-08-17 | 2012-03-14 | 富士通株式会社 | 用于构建极性词素数据库以及确定词的极性的方法和装置 |
CN102999485A (zh) * | 2012-11-02 | 2013-03-27 | 北京邮电大学 | 一种基于公众汉语网络文本的现实情感分析方法 |
CN103699626B (zh) * | 2013-12-20 | 2017-02-01 | 华南理工大学 | 一种微博用户个性化情感倾向分析方法及系统 |
CN104933130A (zh) * | 2015-06-12 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 评论信息的标注方法及装置 |
-
2015
- 2015-06-12 CN CN201510325108.2A patent/CN104933130A/zh active Pending
- 2015-12-17 WO PCT/CN2015/097774 patent/WO2016197577A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408883A (zh) * | 2008-11-24 | 2009-04-15 | 电子科技大学 | 一种网络舆情观点收集方法 |
CN102236650A (zh) * | 2010-04-20 | 2011-11-09 | 日电(中国)有限公司 | 用于修正和/或扩展情感词典的方法和装置 |
US20140067814A1 (en) * | 2012-09-04 | 2014-03-06 | salesforces.com, Inc. | Computer implemented methods and apparatus for identifying a topic for a text |
CN103150367A (zh) * | 2013-03-07 | 2013-06-12 | 宁波成电泰克电子信息技术发展有限公司 | 一种中文微博的情感倾向分析方法 |
CN104484437A (zh) * | 2014-12-24 | 2015-04-01 | 福建师范大学 | 一种网络短评情感挖掘方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016197577A1 (zh) * | 2015-06-12 | 2016-12-15 | 百度在线网络技术(北京)有限公司 | 评论信息的标注方法、装置和计算机设备 |
CN105824898A (zh) * | 2016-03-14 | 2016-08-03 | 苏州大学 | 一种网络评论的标签提取方法和装置 |
CN106874417A (zh) * | 2017-01-22 | 2017-06-20 | 努比亚技术有限公司 | 一种搜索方法及设备 |
US10642938B2 (en) | 2017-05-31 | 2020-05-05 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Artificial intelligence based method and apparatus for constructing comment graph |
CN107220352A (zh) * | 2017-05-31 | 2017-09-29 | 北京百度网讯科技有限公司 | 基于人工智能构建评论图谱的方法和装置 |
CN107220352B (zh) * | 2017-05-31 | 2020-12-08 | 北京百度网讯科技有限公司 | 基于人工智能构建评论图谱的方法和装置 |
CN107704558A (zh) * | 2017-09-28 | 2018-02-16 | 北京车慧互动广告有限公司 | 一种用户意见抽取方法及系统 |
CN110134938A (zh) * | 2018-02-09 | 2019-08-16 | 优酷网络技术(北京)有限公司 | 评论分析方法及装置 |
CN109271512A (zh) * | 2018-08-29 | 2019-01-25 | 中国平安保险(集团)股份有限公司 | 舆情评论信息的情感分析方法、装置及存储介质 |
CN109271512B (zh) * | 2018-08-29 | 2023-11-24 | 中国平安保险(集团)股份有限公司 | 舆情评论信息的情感分析方法、装置及存储介质 |
CN109739947A (zh) * | 2018-12-26 | 2019-05-10 | 广东工业大学 | 一种数据处理装置、方法、电子设备和存储介质 |
CN111027328A (zh) * | 2019-11-08 | 2020-04-17 | 广州坚和网络科技有限公司 | 通过语料训练判断评论情绪正负及感情色彩的方法 |
CN113157899A (zh) * | 2021-05-27 | 2021-07-23 | 东莞心启航联贸网络科技有限公司 | 一种大数据画像分析方法、服务器及可读存储介质 |
CN113157899B (zh) * | 2021-05-27 | 2022-01-14 | 叉烧(上海)新材料科技有限公司 | 一种大数据画像分析方法、服务器及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2016197577A1 (zh) | 2016-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104933130A (zh) | 评论信息的标注方法及装置 | |
CN108052593B (zh) | 一种基于主题词向量和网络结构的主题关键词提取方法 | |
Gokulakrishnan et al. | Opinion mining and sentiment analysis on a twitter data stream | |
Suttles et al. | Distant supervision for emotion classification with discrete binary values | |
CN109740148A (zh) | 一种BiLSTM结合Attention机制的文本情感分析方法 | |
CN104268160A (zh) | 一种基于领域词典和语义角色的评价对象抽取方法 | |
CN105740229B (zh) | 关键词提取的方法及装置 | |
Kawade et al. | Sentiment analysis: machine learning approach | |
Lloret et al. | A novel concept-level approach for ultra-concise opinion summarization | |
CN109657054A (zh) | 摘要生成方法、装置、服务器及存储介质 | |
CN104268200A (zh) | 一种基于深度学习的非监督命名实体语义消歧方法 | |
WO2014005657A4 (en) | A system and method for automatic generation of information-rich content from multiple microblogs, each microblog containing only sparse information | |
CN103399885B (zh) | 兴趣点代表图片的挖掘方法、装置和服务器 | |
CN105844424A (zh) | 基于网络评论的产品质量问题发现及风险评估方法 | |
US20140379719A1 (en) | System and method for tagging and searching documents | |
WO2014206151A1 (en) | System and method for tagging and searching documents | |
CN108763212A (zh) | 一种地址信息提取方法及装置 | |
CN111309910A (zh) | 文本信息挖掘方法及装置 | |
CN104794161A (zh) | 对网络舆情监控的方法 | |
CN104133916A (zh) | 搜索结果信息组织方法和装置 | |
CN104866308A (zh) | 一种场景图像的生成方法及装置 | |
CN107203520A (zh) | 酒店情感词典的建立方法、评论的情感分析方法及系统 | |
CN103544321A (zh) | 用于微博情感信息的数据处理方法和装置 | |
CN110674298B (zh) | 一种深度学习的混合主题模型构建方法 | |
CN104268192A (zh) | 一种网页信息提取方法、装置及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150923 |