CN104272301B - 用于提取一部分文本的方法、计算机可读介质和计算机 - Google Patents
用于提取一部分文本的方法、计算机可读介质和计算机 Download PDFInfo
- Publication number
- CN104272301B CN104272301B CN201380021425.4A CN201380021425A CN104272301B CN 104272301 B CN104272301 B CN 104272301B CN 201380021425 A CN201380021425 A CN 201380021425A CN 104272301 B CN104272301 B CN 104272301B
- Authority
- CN
- China
- Prior art keywords
- text
- evaluation
- expression
- measurement
- evaluation function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000011156 evaluation Methods 0.000 claims abstract description 128
- 230000006870 function Effects 0.000 claims abstract description 90
- 230000014509 gene expression Effects 0.000 claims abstract description 73
- 238000005259 measurement Methods 0.000 claims abstract description 34
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 239000000284 extract Substances 0.000 claims abstract description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 5
- 230000002349 favourable effect Effects 0.000 description 16
- 238000003860 storage Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 208000002874 Acne Vulgaris Diseases 0.000 description 5
- 206010000496 acne Diseases 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- 206010013786 Dry skin Diseases 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 241000272534 Struthio camelus Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 230000037336 dry skin Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 210000004247 hand Anatomy 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000006210 lotion Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002884 skin cream Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Abstract
为了在有限的时间/资源下有效地分析评论文本,提供了一种从大量评论文本中有效地提取人们(分析者)将参考的一部分评论文本的技术。用于由计算机从多个文本中提取一部分文本的方法包括以下步骤:首次评价在每个文本中包括的肯定表达的度量和否定表达的度量;根据多个评价函数来二次评价每个文本,多个评价函数中的至少一部分评价函数使用肯定表达的度量和否定表达的度量作为变量;优先于具有更低等级的评价结果的文本,提取具有更高等级的评价结果的文本,各个评价结果是基于多个评价函数中的相同评价函数。
Description
技术领域
本发明涉及信息处理技术,更具体地,涉及使用信息处理支持声誉分析的技术。
背景技术
随着信息通信技术的进步,已经观察到更多人通过因特网分享观点的模式。例如,已经观察到产品的购买者在邮购网站上发布有关该产品的评论文本的模式,以及餐馆的用户在所谓口口相传的通信网站上发布有关该餐馆的文本评论的模式。在任何模式中,网站的用户可在方便时查看评论文本。这种评论功能或评论网站不仅对网站的用户有用,因为用户被引导在将来购买产品或利用服务,而且对产品或服务的提供者也有用,因为可以从购买者/用户获得有价值的反馈。迄今为止,已经提出了各种技术方案以从大量的评论文本中获取有用的结果(参见专利文献和非专利文献)。
【专利文献】
【专利文献1】公开号为No.2007-299071的日本未审专利申请
【专利文献2】公开号为No.2004-514220的日本未审专利申请(PCT申请的译文)
【专利文献3】公开号为No.10-27181的日本未审专利申请
【专利文献4】公开号为No.2006-146567的日本未审专利申请
【专利文献5】国际公开号为WO2009/060829的国内再出版PCT国际专利申请
【专利文献6】公开号为WO2008/075524的国内再出版PCT国际专利申请
【非专利文献】
【非专利文献1】Turney博士的“Thumbs up or thumbs down?Semanticorientation applied to unsupervised classification of reviews”,计算机语言协会第40次年会的第二次会议记录,2002年7月,第417-424页,计算机语言协会在斯特劳斯堡发布。
发明内容
人们阅读大量评论文本的全部是低效的。相反,如果人们随机阅读某些评论文本,则可能会错过有用的评论文本。
本发明是针对这种问题提出的,本发明的一个目的是提供一种用于有效地从大量的评论文本中提取文本人们(分析者)会参照的一部分评论以便在有限时间/资源下有效地分析评论文本的技术。
为了解决上述问题,经过深入研究,本发明的发明人已经构思出以下的发明。根据本发明,提供了一种用于由计算机从多个文本中提取一部分文本的方法。该方法包括以下步骤:首次评价在每个文本中包括的肯定表达的度量和否定表达的度量;根据多个评价函数来二次评价每个文本,多个评价函数中的至少一部分评价函数使用肯定表达的度量和否定表达的度量作为变量;以及优先于具有更低等级的评价结果的文本,提取具有更高等级的评价结果的文本,各个评价结果是基于多个评价函数中的相同评价函数。
一部分评价函数中的一个评价函数可以是对具有平均的肯定表达度量和平均的否定表达度量的文本输出具有更高等级的评价结果的函数。具体地,可用作该函数的表达式如下:p+nCpαp(1-α)n×(p+n),其中p是肯定表达的数量,n是否定表达的数量,α是在所有文本中包括的肯定表达的数量与肯定表达的数量和否定表达的数量的和的比率。
作为另一个评价函数,可以选择肯定表达的度量与否定表达度量的和或者肯定表达度量与否定表达度量的差。
另外,在首次评价的步骤中,肯定表达的度量和否定表达的度量可以基于在每个文本中包括的肯定表达的数量和否定表达的数量而被首次评价。
另外,在提取的步骤中,具有基于多个评价函数中不同的评价函数的各个评价结果的文本可按预定顺序提取。
另外,该方法还可包括向用户输出所提取的文本的步骤。在这种情况下,哪个评价函数已经对所提取的文本给出评价结果以使得该文本根据评价结果来提取被一起输出给用户。另外,在所提取的文本中包括的肯定表达和否定表达可以不同的表达形式输出。
当然,在掌握本发明作为计算机程序产品或计算机系统的情况下,也可以提供实质上与在上述的掌握本发明作为方法的情况下相同的技术特征。
根据本发明,人们(分析者)会参照的一部分评论文本可以从大量的评论文本中有效地提取。
附图说明
图1是用于说明评论网站系统的示意图。
图2包括用于说明在评论网站服务器中包括的硬盘装置中存储的数据的数据结构的图。
图3是用于说明计算机的硬件配置的框图。
图4是计算机的功能框图。
图5是用于说明计算机所执行的过程的流程图。
图6是用于说明由计算机执行的一部分过程的示意图。
图7是用于说明评价函数的含义的示意图。
图8是表示输出屏幕的例子的图。
具体实施方式
以下将参照附图描述执行本发明的最佳模式。下面给出的实施例并不意味着限制根据权利要求的发明。另外,在实施例中描述的所有特征组合并不必然是本发明的解决手段必不可少的。另外,本发明可以采用许多不同的形式实现,并不应当被解释为限于在此描述的实施例中的内容。在整个实施例的说明中,相同的单元用相同的附图标记表示(除非特别说明)。
图1是用于说明评论网站系统的示意图。该系统包括评论网站服务器2和用户终端,它们被连接以便能够通过因特网4彼此通信。另外,作为用户终端,可以采用具有其中提供了通信功能的任意配置的计算机。例如,除了智能电话31、平板电脑32、和(笔记本)个人计算机33(已示出)以外,还可以采用个人数字助理(PDA)、车载计算机和上网本(未示出)。
图2是用于说明在评论网站服务器2中包括的硬盘装置20和21中存储的数据的数据结构的图。在存储在硬盘装置20的评论表(图2(a))中,包括了指示每个评论文本被发送/发表的日期和时间的发送日期和时间(created_at)、用于标识每个评论文本的评论ID(id)、用于标识已发送了评论文本的用户的用户ID(user_id)、以及作为评论文本的内容的文本(“文本”)。同时,在存储在硬盘装置21的用户表(图2(b))中,包括了用于标识用户的用户ID(user_id)、用于标识用户的性别(“性别”)、年龄(“年龄”)和居住场所(“位置”)的信息。应当注意,用于标识作为评论对象的产品或服务的ID可以被添加到评论ID中。
图3是用于说明个人计算机1的硬件配置的框图。关于计算机1的硬件配置,包括(低速和高速)总线10、CPU(算术和控制单元)11、RAM(随机存取存储器:存储设备)12、ROM(只读存储器:存储设备)13、HDD(硬盘驱动器:存储设备)14、通信接口15和输入/输出接口16,它们被连接到总线10。此外,还包括了鼠标17、平板显示器(显示设备)18、键盘等,其被连接到输入/输出接口16。应当注意,在上述的描述中,对于计算机1使用了典型的个人计算机体系结构。然而,例如针对更高数据处理能力或可用性的需求,可以使用多个CPU 11、多个HDD 14等。另外,可以使用例如包括桌上型的各种类型的计算机系统。
关于计算机1的软件配置,包括提供基本功能的操作系统(OS)、利用OS功能的应用软件、以及用于输入/输出设备的驱动器软件。每个软件连同各种类型的数据一起被加载到RAM 12中,并由CPU 11等执行,由此,计算机1在整体上作为图4所示的功能模块起作用以执行图5所示的过程。
图4是用于说明根据实施例的计算机1的功能模块的功能框图。计算机1实现首次评价模块101、二次评价模块102、提取模块103和输出模块104的功能。
图5是用于说明由计算机1执行的过程的流程图。另外,图6是用于说明图5的流程图中的步骤S101至S103的示意图。首先,获取(S101)多个评论文本D(1)至D(N),它们每一个包括特定专有名词(在此表示为PPP)。需要注意,N是特别大的值,因此,一列评论文本的显示屏并不容易被显示。具体地,从计算机1向评论服务器2传输条件。作为条件,例如,可以设置其中在评论文本中包括作为专用名词的PPP以及评论文本被发送的时间段在特定时间段内的条件。接着,计算机1从评论网站服务器2接收关于满足上述条件的一组评论文本。在这种情况下,接收关于满足上述条件的一组评论文本的数据(见图2(a))以及与这些评论文本相关联的用户的简档(见图2(b))。所接收的数据被存储在计算机1的HDD 14中。另外,上述的时间段可包括将来时间,并且评论文本可从评论网站服务器2传输到计算机1,直到上述的时间段期满。另外,关于不同配置,在大量的关于这组评论文本的数据(见图2(a))和大量的与这些评论文本相关联的用户的简档(见图2(b))被预先存储在计算机1的HDD 14中的情况下,可以从这些数据中搜索满足上述条件的一组评论文本。
接着,在每个评论文本中包括的肯定表达的度量和否定表达的度量被首次评价模块101首次评价(步骤S101)。在此,一列表示有利的有利评语/表达(肯定表达)和一列表示不利的不利评语/表达(否定表达)被预先存储在HDD 14中。对在每个评论文本中包括的有利评语/表达的数量和不利评语/表达的数量进行计数。优选地,这些评价评语/表达预先根据作为评价对象的产品或服务而设置。另外需要注意,例如,对于各个有利评语/表达和各个不利评语/表达,可以分别预先设置与有利程度对应的分数和与不利程度对应的分数,首次评价可以根据这些分数来执行。
下面提供关于化妆品的四个评论文本的首次评价的结果。圆括号内的部分是有利评语/表达,尖括号内的部分是不利评语/表达。
评论文本1:五个有利评语,没有不利评语
该产品是(好的)!原因在于它(量大)而且(便宜)。另外因为它于其它护肤品具有(高兼容性),因此我(感觉使用它是安全的)。
评论文本2:五个有利评语和一个不利评语
我特别(没有粉刺问题),但我买这款产品是因为它(价格合理)。它(刺激性小),并且(特别适合)年轻人。现在,因为我皮肤干燥,甚至当我在皮肤上涂润肤液时,我的皮肤也<不是特别滋润>。所以我现在不用它。它似乎对于有粉刺问题的人是(好)的。
评论文本3:四个有利评语和一个不利评语
我(觉得使用它是安全的)这种产品适用于粗糙或长粉刺皮肤,但我通常使用爽肤水。我很少在脸上涂抹这种产品并拍脸。当在粉刺出现的区域大量使用该产品时,该区域在某些程度上会(变好)。在湿润性方面,具有干性皮肤的人<不适合>该产品,但它刚好适合于油性皮肤(它是很好的润肤露)。
评论文本4:两个有利评语和三个不利评语
我<认为这款产品不是很有效>。我<认为我不需要它>,因为最近我没有粉刺或痤疮。因为它不会刺激皮肤,所以我把它用作爽肤水。我会再次买它吗?我不知道。但它很便宜,不是吗?
接着,由二次评价模块102根据多个评价函数来二次评价评论文本。在此,使用下面的五个评价函数。
评价函数m1:p
评价函数m2:p+n
评价函数m3:p/(p+n)
评价函数m4:p-n
评价函数m5:p+nCpαp(1-α)n×(p+n),其中,α是在所有评论文本中包括的有利评语的数量与评价评语的数量的比率。
各个评价函数的含义如下。评价函数m1评价包括大量有利评语的评论文本,以便给它高等级。评价函数m2评价包含大量评价评语的评论文本,而不管这些评价评语是否是有利评语/不利评语,以便给它高等级。评价函数m3评价有利评语与评价评语的比率高的评论文本,以便给它高等级。评价函数m4通过最小化不利评语的数量来评价包括大量有利评语的评论文本,以便给它高等级。评价函数m5评价具有平均的肯定表达度量和平均的否定表达度量的评论文本,以便给它高等级。另外,评价函数m5根据下面的背景确定。在所有评论文本中包括的评价表达的发生被认为是用等式α=Pall/(Pall+Nall)表示的p比率的伯努利试验。在此,Pall和Nall分别表示在所有评论文本中包括的有利评语的数量和不利评语的数量。通过执行k次试验(k个评价表达)获取的p比率的分布的密度函数变成通过在垂直方向上以1/k收缩二次分布B(k,α)的密度函数而得到的形状。在该分布中,用表达式px/(px+nx)表示的p比率将被观测到的概率被认为是评论文本x的评价表达的索引,其中px和nx分别是在评论文本x中包括的有利评语的数量和不利评语的数量。需要注意,当m和n是大的值时,需要花费大量时间来计算mCn,因此,在需要时,该分布可以用正态分布或泊松分布近似。
图7是用于说明评价函数m1、m2和m5的图。在该二维图中,纵轴表示有利评语的数量p,横轴表示不利评语的数量n。每个文本D使用标记×标示。另外,评价函数m1的轮廓线、评价函数m2的轮廓线和评价函数m5的轮廓线分别用细线、虚线和粗线表示。评论文本包括各种评论文本,诸如包括较少评价论表达的评论文本和包括不满的评论文本。由粉丝撰写的评论文本、包括大量评价表达的评论文本和代表平均意见并包括大量评价表达的评论文本可以分别用评价函数m1、评价函数m2和评价函数m5有效地分类。
接着,由提取模块103提取K个评论文本(步骤S103)。通过评价函数m1至m5,对每个评论文本D给出五个评价分数。对于每个评价函数,提取模块103将各个评论文本从被给予最高分数的评论文本开始按顺序排序。接着,选择被评价函数m1给予最高分数的评论文本、被评价函数m2给予最高分数的评论文本、被评价函数m3给予最高分数的评论文本、被评价函数m4给予最高分数的评论文本和被评价函数m5给予最高分数的评论文本(在消除了重复的情况下最多5个)。接着,选择被评价函数m1给予第二高分数的评论文本、被评价函数m2给予第二高分数的评论文本、被评价函数m3给予第二高分数的评论文本、被评价函数m4给予第二高分数的评论文本和被评价函数m5给予第二高分数的评论文本(在消除了重复的情况下最多5个)。此后同样地,执行评论文本的选择,直到评论文本的数量达到K。
接着,由输出模块104在显示器18上显示所选择的K个评论文本(步骤S104)。图8表示显示屏幕的一个例子。在该屏幕上,显示了所选择的K个评论文本的一部分。注意用粗矩形围绕的部分,显示了评论文本,以使得可以一眼认出哪个评价函数已经对每个评论文本给出高的评价分数,并由此根据该评价分数选择文本。例如,关于显示在屏幕顶部的评论文本,检查框被放置在列m1、m2和m5上。应当理解,评论文本根据通过评价函数m1、m2和m5获取的评价结果来显示。另外,可以移除用户认为不必要的评价函数,而添加新的评价函数。另外,只有通过特定评价函数获得的评价结果可被显示。此外,可以使用图标简化显示评价结果。应当注意,输出模块104还可在显示器18上显示图7中表示的图。
通过执行上述过程,包括有利意见的评价文本可被公平地提取。换句话说,仅包括有利意见的评论文本、另外包括不利意见的评论文本等可被包括在K个评论文本中。因此,增加了用户(分析者)可在用户(分析者)能完成阅读的信息量或者可在显示器上显示为一列的信息量的范围内访问用户(分析者)当然想要抓取的有利信息的概率。另外,当显示信息时,用户(分析者)可以直观地理解顺序不是一维顺序。另外,用户(分析者)可有针对性地参照该用户(分析者)感兴趣的评论文本。
需要注意,本发明可以采用完全硬件实现、完全软件实现和包括软件和硬件单元的实现的形式。在优选实施例中,本发明以软件形式实现,其包括但不限于固件、驻留软件、微码和解析器pico码。
另外,本发明可以采用计算机程序产品或计算机可读介质的形式,其包括用于由计算机或任何指令执行系统或者与计算机或任何指令执行系统一起使用的程序代码。为了说明的目的,计算机可读介质可以是任何包含、存储、传送、传播或传输用于由指令执行系统、装置或设备或者与其一起使用的程序产品的装置。具体地,上述的解析器控制模块构成指令执行系统或这种意义上的“计算机”。
介质可以是电的、磁的、光的、电磁的、红外的、或半导体系统(或装置或设备)或传播介质。计算机可读介质的例子包括半导体或固态存储器、磁带、可移动计算机硬盘、随机存取存储器(RAM)、只读存储器(ROM)、刚性磁盘和光盘。光盘的当前例子包括只读光盘(CD-ROM)、读/写光盘(CD-R/W)和DVD。
适合于存储和/或执行程序代码的数据处理系统可包括至少一个直接或者通过系统总线间接连接到存储器单元的处理器。存储器单元可包括在程序代码的实际执行期间使用的本地存储器、大容量存储设备和高速缓存器,其提供至少一些程序代码的临时存储以便减少代码在执行期间必须从大容量存储设备读取的次数。
附图标记
1:个人计算机;11:CPU(算术和控制单元);12:RAM(随机存取存储器:存储设备);13:ROM(只读存储器:存储设备);14:HDD(硬盘:存储设备);15:通信接口;16:输入/输出接口;17:鼠标;18:平板显示器(显示设备);2:评论网站服务器;20、21:硬盘装置;31:智能电话;32:平板电脑;33:(笔记本)个人计算机;101:首次评价模块;102:二次评价模块;103:提取模块;104:输出模块。
Claims (10)
1.一种由计算机从多个文本中提取一部分文本的方法,包括:
首次评价在所述多个文本中的每个文本中包括的肯定表达的度量和否定表达的度量,其中所述肯定表达的度量和所述否定表达的度量基于在每个文本中包括的肯定表达的数量和否定表达的数量而被首次评价;
根据多个评价函数,二次评价每个文本,所述多个评价函数中的至少一部分评价函数使用所述肯定表达的度量和所述否定表达的度量作为变量;
基于由所述多个评价函数中的每个评价函数对每个文本给出的评价分数,对所述每个文本给出等级;
优先于具有更低等级的评价结果的文本,提取具有更高等级的评价结果的文本,所述各个评价结果是基于所述多个评价函数中的同一个评价函数;以及
向用户输出所提取的文本中的每个,其中所提取的文本中的每个被显示用于识别哪个评价函数对所提取的文本中的每个给出更高的评价分数。
2.根据权利要求1所述的方法,其中,所述一部分评价函数中的一个评价函数是对具有平均的肯定表达的度量和平均的否定表达的度量的文本输出更高等级的评价结果的函数。
3.根据权利要求1所述的方法,其中,所述一部分评价函数中的一个评价函数用表达式p+nCpαp(1-α)n×(p+n)表示,其中p是肯定表达的数量,n是否定表达的数量,α是在所有文本中包括的肯定表达的数量与肯定表达的数量和否定表达的数量的和的比率。
4.根据权利要求1所述的方法,其中,所述一部分评价函数中的一个评价函数用所述肯定表达的度量与所述否定表达的度量的和表示。
5.根据权利要求1所述的方法,其中,所述一部分评价函数中的一个评价函数用所述肯定表达的度量与所述否定表达的度量的差表示。
6.根据权利要求1所述的方法,其中,在所述提取的步骤中,具有基于所述多个评价函数中不同的评价函数的各个评价结果的文本按预定顺序提取。
7.根据权利要求1所述的方法,其中,在所述输出的步骤中,哪个评价函数已经对所提取的文本给出评价结果以使得所述文本根据所述评价结果而提取被一起输出给所述用户。
8.根据权利要求1所述的方法,其中,在所述输出的步骤中,在所提取的文本中包括的所述肯定表达和所述否定表达以不同的表达形式输出。
9.一种计算机可读介质,其包括计算机程序,所述计算机程序使计算机执行在根据权利要求1的方法中包括的各个步骤。
10.一种用于从多个文本中提取一部分文本的计算机,包括:
用于首次评价在所述多个文本中每个文本中包括的肯定表达的度量和否定表达的度量的装置,其中所述肯定表达的度量和所述否定表达的度量基于在每个文本中包括的肯定表达的数量和否定表达的数量而被首次评价;
用于根据多个评价函数来二次评价每个文本的装置,所述多个评价函数中的至少一部分评价函数使用所述肯定表达的度量和所述否定表达的度量作为变量;
用于基于由所述多个评价函数中的每个评价函数对每个文本给出的评价分数,对所述每个文本给出等级的装置;
用于优先于具有更低等级的评价结果的文本,提取具有更高等级的评价结果的文本的装置,所述各个评价结果是基于所述多个评价函数中的同一个评价函数;以及
用于向用户输出所提取的文本中的每个的装置,其中所提取的文本中的每个被显示用于识别哪个评价函数对所提取的文本中的每个给出更高的评价分数。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012100288 | 2012-04-25 | ||
JP2012-100288 | 2012-04-25 | ||
PCT/JP2013/059472 WO2013161510A1 (ja) | 2012-04-25 | 2013-03-29 | 評価の極性に基づいた文章の分類方法、コンピュータ・プログラム、コンピュータ |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104272301A CN104272301A (zh) | 2015-01-07 |
CN104272301B true CN104272301B (zh) | 2018-01-23 |
Family
ID=49478065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380021425.4A Expired - Fee Related CN104272301B (zh) | 2012-04-25 | 2013-03-29 | 用于提取一部分文本的方法、计算机可读介质和计算机 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9740681B2 (zh) |
JP (1) | JP5607859B2 (zh) |
CN (1) | CN104272301B (zh) |
DE (1) | DE112013002187T5 (zh) |
WO (1) | WO2013161510A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6906430B2 (ja) * | 2017-11-20 | 2021-07-21 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
JP6993955B2 (ja) * | 2018-12-06 | 2022-01-14 | ヤフー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1384452A (zh) * | 2001-04-30 | 2002-12-11 | 索尼电脑娱乐美国公司 | 用于对基于文本的产品进行评估的方法和系统 |
CN101894102A (zh) * | 2010-07-16 | 2010-11-24 | 浙江工商大学 | 一种主观性文本情感倾向性分析方法和装置 |
CN102163189A (zh) * | 2010-02-24 | 2011-08-24 | 富士通株式会社 | 从评论性文本中提取评价性信息的方法和装置 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1027181A (ja) | 1996-07-11 | 1998-01-27 | Fuji Xerox Co Ltd | 文書評価装置 |
JP2002140465A (ja) | 2000-08-21 | 2002-05-17 | Fujitsu Ltd | 自然文処理装置及び自然文処理用プログラム |
US6622140B1 (en) | 2000-11-15 | 2003-09-16 | Justsystem Corporation | Method and apparatus for analyzing affect and emotion in text |
US7058566B2 (en) * | 2001-01-24 | 2006-06-06 | Consulting & Clinical Psychology, Ltd. | System and method for computer analysis of computer generated communications to produce indications and warning of dangerous behavior |
US7346492B2 (en) * | 2001-01-24 | 2008-03-18 | Shaw Stroz Llc | System and method for computerized psychological content analysis of computer and media generated communications to produce communications management support, indications, and warnings of dangerous behavior, assessment of media images, and personnel selection support |
JP3962382B2 (ja) * | 2004-02-20 | 2007-08-22 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 表現抽出装置、表現抽出方法、プログラム及び記録媒体 |
JP4148522B2 (ja) | 2004-11-19 | 2008-09-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 表現検出システム、表現検出方法、及びプログラム |
US20070078670A1 (en) * | 2005-09-30 | 2007-04-05 | Dave Kushal B | Selecting high quality reviews for display |
JP2007299071A (ja) | 2006-04-27 | 2007-11-15 | Fuji Xerox Co Ltd | 評判情報処理システム、評判情報処理方法及び評判情報処理プログラム |
CN101641693A (zh) | 2006-12-18 | 2010-02-03 | 日本电气株式会社 | 极性估计系统、信息传输系统、极性估计方法、极性估计程序以及评价极性估计程序 |
JP5168961B2 (ja) * | 2007-03-19 | 2013-03-27 | 富士通株式会社 | 最新評判情報通知プログラム、記録媒体、装置及び方法 |
US7996210B2 (en) * | 2007-04-24 | 2011-08-09 | The Research Foundation Of The State University Of New York | Large-scale sentiment analysis |
US20080288481A1 (en) * | 2007-05-15 | 2008-11-20 | Microsoft Corporation | Ranking online advertisement using product and seller reputation |
US8280885B2 (en) * | 2007-10-29 | 2012-10-02 | Cornell University | System and method for automatically summarizing fine-grained opinions in digital text |
JP5229504B2 (ja) | 2007-11-05 | 2013-07-03 | 日本電気株式会社 | 広告提示方法、広告提示システム及びプログラム |
US20100318526A1 (en) * | 2008-01-30 | 2010-12-16 | Satoshi Nakazawa | Information analysis device, search system, information analysis method, and information analysis program |
US8117207B2 (en) * | 2008-04-18 | 2012-02-14 | Biz360 Inc. | System and methods for evaluating feature opinions for products, services, and entities |
WO2010036012A2 (ko) * | 2008-09-23 | 2010-04-01 | 주식회사 버즈니 | 인터넷을 이용한 의견 검색 시스템, 의견 검색 및 광고 서비스 시스템과 그 방법 |
JP4683394B2 (ja) * | 2008-09-26 | 2011-05-18 | Necビッグローブ株式会社 | 情報処理装置、情報処理方法およびプログラム |
JP5359399B2 (ja) * | 2009-03-11 | 2013-12-04 | ソニー株式会社 | テキスト分析装置および方法、並びにプログラム |
US20110082687A1 (en) * | 2009-10-05 | 2011-04-07 | Marcelo Pham | Method and system for taking actions based on analysis of enterprise communication messages |
JP5273735B2 (ja) * | 2009-10-13 | 2013-08-28 | 日本電信電話株式会社 | テキスト要約方法、その装置およびプログラム |
US8990124B2 (en) * | 2010-01-14 | 2015-03-24 | Microsoft Technology Licensing, Llc | Assessing quality of user reviews |
US8402035B2 (en) * | 2010-03-12 | 2013-03-19 | General Sentiment, Inc. | Methods and systems for determing media value |
US20110320542A1 (en) * | 2010-06-28 | 2011-12-29 | Bank Of America Corporation | Analyzing Social Networking Information |
US8949211B2 (en) * | 2011-01-31 | 2015-02-03 | Hewlett-Packard Development Company, L.P. | Objective-function based sentiment |
US8650023B2 (en) * | 2011-03-21 | 2014-02-11 | Xerox Corporation | Customer review authoring assistant |
US20120246054A1 (en) * | 2011-03-22 | 2012-09-27 | Gautham Sastri | Reaction indicator for sentiment of social media messages |
WO2012143069A1 (en) * | 2011-04-21 | 2012-10-26 | Sony Corporation | A method for determining a sentiment from a text |
US20120290910A1 (en) * | 2011-05-11 | 2012-11-15 | Searchreviews LLC | Ranking sentiment-related content using sentiment and factor-based analysis of contextually-relevant user-generated data |
US20120290606A1 (en) * | 2011-05-11 | 2012-11-15 | Searchreviews LLC | Providing sentiment-related content using sentiment and factor-based analysis of contextually-relevant user-generated data |
US8600796B1 (en) * | 2012-01-30 | 2013-12-03 | Bazaarvoice, Inc. | System, method and computer program product for identifying products associated with polarized sentiments |
-
2013
- 2013-03-29 DE DE112013002187.0T patent/DE112013002187T5/de not_active Ceased
- 2013-03-29 WO PCT/JP2013/059472 patent/WO2013161510A1/ja active Application Filing
- 2013-03-29 CN CN201380021425.4A patent/CN104272301B/zh not_active Expired - Fee Related
- 2013-03-29 JP JP2014512437A patent/JP5607859B2/ja not_active Expired - Fee Related
- 2013-04-12 US US13/861,430 patent/US9740681B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1384452A (zh) * | 2001-04-30 | 2002-12-11 | 索尼电脑娱乐美国公司 | 用于对基于文本的产品进行评估的方法和系统 |
CN102163189A (zh) * | 2010-02-24 | 2011-08-24 | 富士通株式会社 | 从评论性文本中提取评价性信息的方法和装置 |
CN101894102A (zh) * | 2010-07-16 | 2010-11-24 | 浙江工商大学 | 一种主观性文本情感倾向性分析方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
US9740681B2 (en) | 2017-08-22 |
JP5607859B2 (ja) | 2014-10-15 |
WO2013161510A1 (ja) | 2013-10-31 |
JPWO2013161510A1 (ja) | 2015-12-24 |
US20130289978A1 (en) | 2013-10-31 |
DE112013002187T5 (de) | 2015-01-08 |
CN104272301A (zh) | 2015-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Araque et al. | MoralStrength: Exploiting a moral lexicon and embedding similarity for moral foundations prediction | |
Clarke | France in the Age of Organization: Factory, Home and Nation from the 1920s to Vichy | |
CN102612691B (zh) | 给文本评分的方法和系统 | |
CN109408826A (zh) | 一种文本信息提取方法、装置、服务器及存储介质 | |
Freedberg | Iconoclasm | |
Chang et al. | Recognizing important factors of influencing trust in O2O models: an example of OpenTable | |
Fan et al. | Analyzing sentiments in Web 2.0 social media data in Chinese: experiments on business and marketing related Chinese Web forums | |
KR101007284B1 (ko) | 인터넷을 이용한 의견 검색 시스템 및 그 방법 | |
CN105809476A (zh) | 一种设置对象特征参数的方法和装置 | |
CN104272301B (zh) | 用于提取一部分文本的方法、计算机可读介质和计算机 | |
Paul et al. | TexTonic: Interactive visualization for exploration and discovery of very large text collections | |
Yin et al. | Exploring Sentiment Analysis on E-Commerce Business: Lazada and Shopee | |
Schirone | Field, capital, and habitus: The impact of Pierre Bourdieu on bibliometrics | |
Bhattacharyya et al. | An emoticon-based sentiment aggregation on metaverse related tweets | |
CN104520784A (zh) | 动态内容预览 | |
Simeon et al. | Evaluating the Effectiveness of Hashtags as Predictors of the Sentiment of Tweets | |
JP2016009426A (ja) | トレンド分析装置、及びトレンド分析方法 | |
Choi | Finding “just right” books for children: analyzing sentiments in online book reviews | |
Declercq | Between Legal Action and Performance: The firmatio of Charters in the Early Middle Ages | |
Gunawan et al. | The Impact of Brand Authenticity, Brand Experience, and Self-Congruity Toward Brand Loyalty as Mediated by Brand Love: A Case of Apple Inc. | |
Nakayama | The classification and visualization of Twitter trending topics considering time series variation | |
Sun | Linear programming approaches for multiple-class discriminant and classification analysis | |
Diana et al. | Measuring user experience of a potential shipment tracking application | |
CN107545470A (zh) | 数据处理方法及系统 | |
Heidecker | Charters as texts and as objects in judicial actions: The example of the Carolingian private charters of St Gall |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180123 |
|
CF01 | Termination of patent right due to non-payment of annual fee |