CN101901230A - 信息检索方法和用户评论处理方法及其系统 - Google Patents

信息检索方法和用户评论处理方法及其系统 Download PDF

Info

Publication number
CN101901230A
CN101901230A CN2009101418998A CN200910141899A CN101901230A CN 101901230 A CN101901230 A CN 101901230A CN 2009101418998 A CN2009101418998 A CN 2009101418998A CN 200910141899 A CN200910141899 A CN 200910141899A CN 101901230 A CN101901230 A CN 101901230A
Authority
CN
China
Prior art keywords
emotion
theme
product
service
objective data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009101418998A
Other languages
English (en)
Inventor
蔡柯柯
张小洵
马瑞
祝慧佳
苏中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN2009101418998A priority Critical patent/CN101901230A/zh
Priority to US12/787,870 priority patent/US20100306123A1/en
Publication of CN101901230A publication Critical patent/CN101901230A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种用户评论处理方法及其系统、信息检索方法及其系统。其中所述用户评论处理方法包括:接收产品或者服务的特征的客观数据以及对产品或者服务的用户评论;从产品或者服务的用户评论中识别与产品或服务的特征相关联的用户评论;识别与产品或服务的特征相关联的用户评论中的情感描述主题;建立情感描述主题与产品或者服务对应的特征的客观数据之间的关联关系,并且计算与客观数据相关联的情感描述主题出现的频度;根据所述关联关系以及与客观数据关联的情感描述主题出现的频度形成情感描述主题与客观数据的关联规则。本发明可以准确和深刻地反映用户情感与产品或者服务的客观数据之间的关联关系和关联规则。

Description

信息检索方法和用户评论处理方法及其系统
技术领域
本发明总体上涉及一种检索方法和用户评论的处理方法及其系统,特别地,涉及一种对相关产品或者服务的用户评论进行处理的方法、系统,以及基于对相关产品或者服务的用户评论的处理所获得的知识而进行产品或者服务的检索方法。
背景技术
目前,大量用户希望通过互联网了解需要购买的产品或者服务的情况。一种比较典型的途径是相关厂商或者网络服务提供者(如数码产品网站、酒店预定网站、咨询服务网站等)向用户提供如图1所示的检索方式,相关厂商或者网络服务提供者列出用户可能关心的产品或者服务的特征(feature)以及它们对应的相关数据,由购买者去设定相关数据选项,从而有针对性地向用户推荐相关产品。但是产品描述往往偏行业术语,普通人难以将行业术语和真实使用习惯相联系。另外还可能存在一定的商家过分宣传的问题。仅根据这些客观表述来判断真实的产品性能和服务水平是不够的。而且对于用户,尤其是一些初级用户,往往对于自己感兴趣的产品或者服务只是具有一些情感上的概念,比如对于一个手机用户,其往往是想“我需要一部重量轻、时尚、价钱适当、女性......的手机”,另外这些情感上的概念往往会随时间、地域等发生改变。普通的客观数据往往无法给用户推荐合适的产品。另一种典型的途径是用户通过如图2所示的搜索引擎通过输入关键词“大屏幕手机”(“big screen cell phone”)来检索,现有的搜索引擎往往只是将具有相关关键词的产品或者服务呈现给用户。而这种检索结果往往是片面和不准确的,而且检索到的产品或者服务的数量巨大,使得用户有时无法确定究竟应当选择何种产品或者服务来满足自己的需求。
此外,对于已有的产品和服务,存在大量的如图3所示的用户评论。现在有对用户评论进行分析以提供对产品或者服务的特征的极性判断的技术。其一般处理流程为:
步骤1.识别用户评论中的特定产品的特征(比如“屏幕”);
步骤2.识别用户评论中产品的特征关联的用户评价(大/好/差);
步骤3.进行用户评价的极性判断(正面评价(大/好)/反面评价(差));
步骤4.产生对该特定产品的特定特征的极性评价。
这种分析模式为用户提供了特定产品特征级的总体印象,有一定的好处。但考虑到用户个体的差异,即使用户对于某一特定产品特征的评价都是正面的,其原因或许也各不相同。譬如,对于屏幕的积极评价,用户A可能是因为尺寸足够大,用户B因为屏幕色彩鲜艳,而用户C则满意屏幕像素。而现有技术完全忽视了这种不同,从而无法获得更多对用户有用的信息。
发明内容
本发明提供一种用户评论处理方法及其系统、信息检索方法以及相关程序产品。本发明一方面提供一种用户评论处理方法,该方法包括:接收产品或者服务的特征的客观数据以及对产品或者服务的用户评论;从产品或者服务的用户评论中识别与产品或服务的特征相关联的用户评论;识别与产品或服务的特征相关联的用户评论中的情感描述主题;建立情感描述主题与产品或者服务对应的特征的客观数据之间的关联关系,并且计算与客观数据相关联的情感描述主题出现的频度;根据所述关联关系以及与客观数据关联的情感描述主题出现的频度形成情感描述主题与客观数据的关联规则。
本发明另一方面提供一种信息检索方法,所述方法包括:接收用户的检索请求;至少根据上述形成的关联规则并结合用户的检索请求检索相关的产品或服务的信息;向用户发送检索到的产品或者服务的信息。
本发明另一方面提供一种用户评论处理系统,包括:接收装置,用于接收产品或者服务的特征的客观数据以及对产品或者服务的用户评论;特征识别装置,用于从产品或者服务的用户评论中识别与产品或服务的特征相关联的用户评论;情感识别装置,用于识别与产品或服务的特征相关联的用户评论中的情感描述主题;关联和频度计算装置,用于将情感描述主题与产品或者服务对应的特征的客观数据相关联,并且计算与客观数据相关联的情感描述主题出现的频度;关联规则生成装置,根据情感描述主题与客观数据之间的关联关系以及与客观数据关联的情感描述主题出现的频度形成情感描述主题与客观数据的关联规则。
利用本发明提供的方法或者系统,可以准确和深刻地反映用户情感与产品或者服务的客观数据之间的关联关系和关联规则。另一方面,利用这种关联关系和关联规则,可以为用户更准确定位用户所需要了解产品或者服务的信息,并且为新产品或者服务的开发和研制提供了很好的参考信息。
附图说明
为了对本发明实施例的特征和优点进行详细说明,将参照以下附图。如果可能的话,在附图和描述中使用相同或者类似的参考标号以指代相同或者类似的部分。其中:
图1示出了给出产品或者服务特征数据进行查询的方法的示意图;
图2示出了利用搜索引擎进行产品或服务的查询的检索结果;
图3示出了用户对产品或者服务的相关评论;
图4示出了厂商或者服务商提供的有关产品或者服务的客观数据;
图5示出了本发明用户评论处理方法的流程示意图;
图6示出了本发明识别产品或者服务的特征的流程示意图;
图7示出了本发明识别情感描述主题及其情感极性的流程示意图;
图8示出了对情感描述主题进行极性总结的示意图;
图9示出了本发明估计概率函数的流程示意图;
图10示出了本发明的作为关联规则的概率函数的示意图;
图11示出了本发明的信息检索方法的流程示意图;
图12示出了本发明的用户评论处理系统的结构示意图;
图13示出了本发明的信息检索系统的结构示意图。
具体实施方式
现在将参考本发明的示例性实施例进行详细的描述,在附图中图解说明了所述实施例的示例,其中相同的参考数字始终指示相同的元件。应当理解,本发明并不限于所公开的示例实施例。还应当理解,并非所述方法和设备的每个特征对于实施任一权利要求所要求保护的本发明都是必要的。此外,在整个公开中,当显示或描述处理或方法时,方法的步骤可以以任何顺序或者同时执行,除非从上下文中能清楚一个步骤依赖于先执行的另一步骤。此外,步骤之间可以有显著的时间间隔。
下面参照图5详细描述本发明的实施方式。在步骤501中,接收产品或者服务的特征的客观数据以及对产品或者服务的用户评论。一般而言,生产出来的产品都配有原厂出具的详细的规格说明、物理参数、使用说明等产品设计书和使用说明书,如对手机、数码相机等电子产品的物理参数、规格、型号价格等,例如图4。而软件产品也会配置相应的说明书或者用户手册等。对于服务行业,如电子商务、娱乐业、旅游、餐饮、酒店预订、机票预定等服务也都有相应的客观表述指标,如酒店的星级、价格、配套设施、交通、位置等。这些真实的客观数据都可以作为上述产品或者服务的特征的客观数据的来源。而用户评论可以来自于互联网中对相关产品或者服务的评论,也可以来自报刊杂志甚至厂商或者服务商的市场调查,或者专家的评论等。本发明并不限制用户评论的具体来源。另外优选地,所述产品或者服务可以是同一厂商或者服务商提供的同类但不同型号的产品或者同类但不同等级的服务,也可以是来自不同厂商或者服务商的同类产品或同类服务。另外各种不同的产品或者服务对应着不同的客观数据。当然也可以对只是同一款产品或者服务的客观数据以及用户评论进行处理。
进行到步骤503,从产品或者服务的用户评论中抽取与产品或服务的特征相关联的用户评论。其中,可以采用现有的任何一种产品或者服务特征的识别方法。识别出特征,也就自然而然确定了与特征相关联的用户评论。而图6则示出了本发明优选的识别含有产品或者服务特征的用户评论的方法,后面将详述该方法。
在步骤505中,则识别与产品或服务的特征相关联的用户评论中的情感描述主题(opinion facet)。其中,为有利于理解上述产品特征(feature)和情感描述主题,举例如下:
例1:
产品特征:重量
情感描述主题:机器非常轻;易于携带;机型较小,适合女性;外形薄。
例2:
产品特征:屏幕
情感描述主题:色彩清晰;尺寸大;像素很高。
其中可以采用多种学习模型来分析和提取和识别与产品或服务的特征相关联的用户评论中的情感描述主题,如K-means聚类模型,Bayesian分类模型等。作为优选,可以采用主题模型(Topic models)来对所述与产品或服务的特征相关联的用户评论进行分析以识别对该产品或者服务的情感描述主题。图7详细示出了如何利用主题模型算法进行情感描述主题的识别。在步骤505中,识别完情感描述主题后可以选择生成例如<产品/服务特征;情感描述主题>的二元组,比如<重量;机器非常轻>,<重量;易于携带>,<重量;适合女性>,<重量;外形薄>......。当然可以用其它任何适合的数据结构来描述产品特征与对应情感描述主题。另外应当考虑对所述二元组附加特定产品或者服务的标识,以表明该二元组对应的特定产品或者服务。作为优选,还可以对特征相关评论的极性进行判断,极性的判断可以采用任何现有的极性判断方法进行,比如,基于情感词典的极性判别,基于监督学习的极性判别等,从而形成诸如<产品特征,情感描述主题,极性>的三元组。而作为优选,可以根据特定产品或者服务中对特征评价的极性的百分比分布,从而对评价进行可信度处理:用户对于一个特定产品或者服务所持有的观点不同,评价也不尽相同。一般来说,绝大多数上观点的一致性对于其他用户是具有指导意义的。通过分析,我们可以了解到对于一个产品或者服务的特性,用户的情感是怎么分布的。以图8为例,80%的用户对某特定产品的重量有正面的评价,仅有20%的用户具有负面的评价。因此,积极的评价对于“重量”这一特性是有意义的,可信度较高,而消极的评价可信度较低。因此,通过情感分析结果,我们能够识别出情感评价的可信度。作为优选,可以考虑将该情感分布呈现给用户。另外也可以除去对某特定产品或者服务的特性的分布比率小的情感评论,比如除去图8中出现概率小的有关负面的情感评价,而只输出分布百分比率大的情感评价为后续步骤使用。比如可以考虑除去百分比率低于20%的情感极性对应的情感描述主题,这个可以根据用户的经验进行调整。这样做的有益效果在于比较正确反映了一般人对该产品或者服务的相关特征的情感描述。如果考虑到判断情感的极性,则在存在多种产品或者服务进行处理时,优选对各个特定产品或者服务的用户评论分别集中处理,然后在后续步骤中综合处理所有的<产品特征,情感描述主题,极性>的三元组。
进行到步骤507,建立情感描述主题与产品或者服务对应的特征的客观数据之间的关联关系,并且计算与客观数据相关联的情感描述主题出现的频度。其中,在步骤505中会得到产品或者服务特征与情感描述主题的信息。则将各个特定产品或者服务的特征对应的客观数据与相应的产品或者服务特征与情感描述主题的信息相结合,就可以得到相应的三元组<产品/服务特征;客观数据;情感描述主题>,同理可以采用其它任何适合的数据结构形式来描述产品/服务特征、客观数据、情感描述主题之间的关联。以手机的重量特征为例,对于一款特定的手机,就可以得到如下三元组:<重量;106.4克;机器非常轻>,<重量;106.4克;易于携带>,<重量;106.4克;适合女性>,<重量;106.4克;外形薄>。综合相同类型的产品或者服务的相关特征的所有相同情感描述主题,分别累加该特征对应的不同的客观数据对应的相同情感描述主题出现的次数就获得了相应相同情感描述主题出现的总数N(v,s),即N(v,s)指的是对特定客观数据v的情感描述主题为s的用户评论的个数,然后再计算对于具有特定客观数据v的产品的用户评论的总数N(v)(这些用户评价中,有些可能没有涉及对该特征进行评论,比如该特征为重量,则讨论该具有重量特定客观数据v的产品的颜色的用户评论也可以计算在N(v)内),然后可以采用下式计算相关相同情感描述主题的频度f(s):
f(s)=N(v,s)/N(v)
比如以产品或服务为手机为例,现在评估各个类型的手机的特征-重量以及相同情感描述主题为“轻”,则统计频度分布如表1(数值仅是示例性的)。
  物理值(克)   频度(%)
  80   30
  102.4   27
  115.2   20
  146.4   10
  160   8
  180   2
表1
作为计算相同情感描述主题的频度变通的方式,在获得上述N(v,s)后,可以将其除以只是对具有特定客观数据v的产品的该特征进行评论的用户评论总数,或者除以与所有产品特征相关的用户评论总数,或者甚至所有的用户评论总数。总之计算相同情感描述主题的频度存在多种方法。
进行到步骤509,则根据情感描述主题与客观数据之间的关联关系以及与客观数据关联的相同情感描述主题出现的频度形成情感描述主题与客观数据的关联规则。在获得了情感描述主题与客观数据之间的关联关系以及客观数据关联的相同情感描述主题出现的总数或者频度信息后,可以根据上述信息的情况而形成不同的关联规则。当存在大量的有关该情感描述主题的评论时,可以采用建立生成模型(generative model)的方式来形成关联规则。其目的是通过建立在大量样本上的分析,学习出在什么样的模型下,根据已知的客观参数,可以得到用户目前的评论。这样做的一个明显好处是,当得知新产品/服务时,可以根据生成模型推测出用户的评论,从而获得用户的情感观点,这样无论是在基于评论的新产品检索,还是基于用户反馈的新产品设计,都是具有指导意义的。同时,这样的生成模型是可以动态调整的,当样本数据新增时,可以再学习出新的模型参数,使得模型总是能比较贴切地反映出最新的用户评价和观点。因为用户的情感描述主题往往会随时间、空间的变化而发生改变,针对不同时期或者不同地域等的数据建立不同的生成模型显然最能反映当今用户的普遍性看法。生成模型的选择是多样的,很多恰当的离散或者连续的函数都可以适用于恰当的样本,譬如,指数函数,泊松分布函数等。由生成模型产生关联规则的一般流程为:以情感描述主题的频度与客观数据的关联关系构建样本集,训练用于描述情感描述主题的频度与客观数据的关联关系的模型并计算模型参数,并以训练后的生成模型作为关联规则输出。事实上,有很多概率函数都可以作为生成模型的函数原型,可设定函数原型的参数空间为Θ。基于以上如表1所获得的某产品或者服务的某一特征的客观数据为X={x1,x2,……xn},其相关的相同情感描述主题的频度(或者总数)为Y={f1,f2,...,fn},n是某产品或者服务的某一特征的不同客观数据的个数。Y基本都服从某概率分布,如常见的Gauss分布,混合Gauss分布,多项式分布、Beta分布、二项分布χ2等。已知概率函数形式和样本,再进一步利用学习函数进行参数的估计,如最为常用的最大期望(EM,Expectation Maximization)算法以及最大似然估计MLE(Maximum LikelihoodEstimated)算法或最大后验估计MAP(Maximum A Posteriori)算法等。下面参照图9说明利用生成模型的方法产生关联规则。其中,在步骤901中,以情感描述主题出现的频度以及对应的客观数据构建样本集。例如形成类似如表1所示的上述X-Y的对应关系。在步骤903中,确定生成模型的函数原型和函数的参数空间。一般根据数据分布,根据曲线分布的状态利用经验估计选择概率函数。函数确定了,函数的参数也就相应的确定了。也可以采用试探法将上述常见的概率函数作为函数原型以进行试探,并确定其函数的参数空间Θ,然后在后续的步骤检测其正确性。在步骤905中,则根据情感描述主题出现的频度以及对应的客观数据在参数空间中估计函数的参数并获得概率函数,并以该概率函数作为关联规则。其中根据输入的X,Y,通过常用的最大似然估计MLE算法或者最大后验概率MAP算法或者其它任何现有的算法在参数空间Θ中估计概率函数F的参数θ。下面以EM算法和MLE算法为例简要说明估计概率函数F的参数的过程。
最大似然估计MLE(Maximum LikelihoodEstimated)是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。概率函数F的参数为θ,是我们要估计的参数。对θ的估计是从概率函数F中抽出一个具有n个值的采样X={X1,X2,...,Xn),然后用这些采样数据来估计θ.在我们的例子中,我们所抽取出的对于某个特征在不同取值上的情感描述主题的频度Y={f1,f2,...,fn}就是这样一组采样数据,我们能够从中获得关于θ的估计。最大似然估计的实现首先要定义可能性,即似然函数:
L(θ;X)=F(X1,X2,...,Xn|θ)
并且在所有θ的所有取值上,使这个函数最大化。这个使似然函数最大的被称为θ的最大似然估计。在统计计算中,最大期望(EM,Expectation-Maximization)算法是在概率(probabilistic)模型中寻找参数最大似然估计或最大后验估计,它具有很好的收敛性质和广泛的应用背景。最大期望EM算法经过以下两个步骤交替进行迭代计算,来估计函数的参数。
E-Step:根据当前的参数估计,计算对数似然函数的期望Q(θ|θ(t)),定义为:
Q ( &theta; | &theta; ( t ) ) = E X , &theta; ( t ) [ log L ( &theta; ; X ) ]
其中,log是求自然对数,E是求分布函数的期望。t是迭代次数,θ(t)是在t次迭代后参数θ的估值
M-Step:计算使该对数期望函数最大的参数估计
&theta; ( t + 1 ) = arg max &theta; Q ( &theta; | &theta; ( t ) )
其中,θ(t+1)表示参数θ在t+1次迭代后的估值。
M-step上找到的参数然后用于另外一个E-step计算,这个过程不断交替进行,直到参数θ的估计值不再变化,从而确定出函数空间的具体概率函数的参数。
确定函数参数后,将实际数值X作为输入,计算概率函数F输出结果。计算函数输出结果和真实结果Y的误差,利用常用的I型错误或者其它常用的校验方法对获得的概率函数进行校验,如果满足校验标准,则将该概率函数作为所述相同情感描述主题与客观数据的关联规则。否则就重复执行步骤903和905。其中I型错误指的是:如果拒绝了实际上成立的函数H0,通常用α表示为“弃真”的错误概率。假设检验时可以根据需要确定α值大小,一般规定α=0.05或α=0.01。在函数H0为正确的前提下,根据统计数的一定分布律(如样本平均数的抽样分布,样本平均数差数的抽样分布等),计算实得差异由误差造成的概率,检验接受或拒绝所选择的概率函数,如果该“弃真”概率大于α,则说明否定H0尚证据不足,即应当接受所确定的函数H0。由于EM算法、MAP算法以及I型错误校验等都属于现有常用的方法,在此不再赘述。
其中每一个情感描述主题都会对应一个具体的函数作为关联规则。图10示出了基于表1所示的关联关系所获得的作为关联规则的概率函数,其为Poisson分布:
Figure B2009101418998D0000091
以表1为例,其中,x是输入参数,代表重量等客观数据;g为基本单位,即情感描述词“轻””相关样本的客观数据的平均值;λ为情感描述主题(如“轻”)在所有样本中出现的概率。这里,函数F的输入是产品或者服务的实际客观数据,输出是情感描述主题频度,即情感描述对于实际客观数据的描述概率。例如,用户查询“重量轻的手机”,那么如果一款手机的重量是170克,通过上述学习函数,其为轻的概率很小,因此这样的手机就不满足用户的查询需求,应当从检索结果中剃除,或者不将其优先呈现给用户。而对于新的产品或者服务,即使没有任何用户评论或者厂商推荐,也可以根据新的产品或者服务的相关客观数据,通过上述函数-关联规则的运算而将其推荐给用户,这显然具有显著的技术效果。
作为另一种实施方式,在样本稀疏的情况下(比如颜色特征、只有“是/否”选择的特征等),即相同的情感描述主题相对较少,只能得到零散的统计值,对样本的分布进行学习的效果并不好或者不适合进行样本学习,或者只是为了处理简单,这时可以只需要记录一些类似于表1所示的简单的规则,将情感描述主题及其出现的频度与产品或者服务的说明书中的产品或者服务的特征的对应客观数据之间的一一对应关系作为关联规则输出。比如可以考虑输出<特征的客观数据,情感描述主题,情感描述主题出现的频度>这样的三元组规则、或者对应关系列表等。这些对应关系在用户进行检索时进行比对,为用户提供了比对,对大量不恰当的信息进行了过滤,同样产生了显著的技术效果效果。
获得的关联规则可以选择性地呈现给用户,或者作为检索规则使用。
现在参考图6对产品或者服务的特征识别方法进行说明。在步骤601中,对用户评论进行以句子为单位的文本分割,主要利用文本中出现的标点符号做为句子的边界判断;在步骤603中,对句子进行过滤,保留包含有用户观点词语的句子;在步骤605中,对过滤后的句子做词性标注。即标明其为名词或者动词等其它词性,可利用自然语言处理算法实现,如基于隐马尔科夫模型的词性标注;在步骤607中,选择词性为名词的词语做为产品或者服务的特征的候选者;在步骤609中,则利用如统计挖掘的方法,例如现有的TF-IDF算法或者Apriori算法进行高频特征词语识别,获得出现频率较高的词并将其识别为产品或者服务的特征。
图7则详细示出了如何利用现有的主题模型(Topic models)进行情感描述主题的识别。主题模型是一种概率生成模型,用于分析对象集合中潜在的主题分布。通过词语出现的上下文信息,主题模型能够将具有相同主题的词语归类到统一个主题(topic)下,而将具有不同主题的词语区分开来。以产品或者服务的特征F关联的用户评论的生成为例,应用主题模型可将每一个特征视为由多个不同情感描述主题组成的混合体,词语wi对于特征F的生成概率可描述为:
P ( w i | F ) = &Sigma; j = 1 T p ( w i | z j ) * p ( z j | F )
其中,p(wi|zj)是词语wi对于情感描述主题zj的生成概率,p(zj|F)是情感描述主题zj对于特征F的生成概率.其中i为词语的序列号,j为情感描述主题的序号,T为情感描述主题的总数。在步骤701中,基于已经获得的包含产品或者服务的特征的用户评论,应用主题模型计算词语对于情感描述主题的概率分布p(w|θ)而确定情感描述主题,其中w∈{w1,w2,...,wn},θ∈{z1,z2,...,zn},n为词语的个数。在主题模型处理过程中,对情感描述主题的概率分布p(wi|zj)的识别,通常基于上述EM算法或者现在通用的Gibbs Sampling算法进行迭代估计。每次迭代,需要相应的更新p(zj|F)及p(zj|F)参数值,直至达到收敛。以“轻”为例,基于已经获得的包含特征评价“重量”(F)相关的用户评论,首先计算每条评论中词语wi(例如轻)的tf*idf值(其中tf为“轻”在单条评论中的概率分布p(w),idf为“轻”在所有文档中的反文档频率),作为主题模型中词语wi的计算权值。使用主题模型可计算出“重量”评论中情感描述主题(主题)的分布p(zj|F)和情感描述主题中词语w的分布p(wi|zj)。为此,通过p(zj|F)可获得词语所属主题。例如,评论“手机易于携带”、“可方便携带”等根据计算其主题分布的最大概率可知均属于主题i,“机型小,适合女性”、“女性喜欢这种小巧的机型”等则属于主题j;i,j分为主题模型中的主题序号,不同主题下的评论分属于不同的情感描述主题。由于主题模型方法属于现有技术,为节省篇幅在此不作更为详细的介绍。而作为可选的,还可以对情感描述主题的情感极性进行判断:在步骤703中,利用现有的方法,比如,基于情感词典的极性判别和基于监督学习的极性判别,分析与产品或者服务的特征相关评论的情感极性;在步骤705中,合并关于产品或者服务的特征的各个情感描述主题的情感极性,从而获得如图8所示产品或者服务的特征、极性以及情感描述主题的关系。总结图计算了“好(positive)”和“坏(negtive)”的百分比率,获得了上述情感极性总结图,可以选择呈现给用户,也可以考虑到在后续步骤中作为参考。
另外参照图11详细描述一种信息检索的方法。在步骤1101中,接收用户的查询请求。用户的查询请求中包括了一些情感描述性的关键词,比如用户输入“重量轻适合女性手机”这样的估计语句;在步骤1103中,则根据上述多个实施方式所形成的关联规则并结合用户的查询请求检索相关的产品或服务的信息。所述关联规则可以预先存储在存储器中,在检索时对这些预先存储的关联规则进行访问并利用。当然也可以根据最新生成的关联规则进行检索。其中,比如以上面形成的概率函数作为关联规则为例,对于情感描述主题“轻”、“适合女性”都形成了各自的概率函数作为关联规则,另外为简单起见,假设这里只讨论手机的重量,则由上述情感描述主题“轻”、“适合女性”的概率函数输出各自的各种重量对应的分布概率,选择情感描述主题“轻”、“适合女性”的分布概率较高的各种重量,求情感描述主题“轻”、“适合女性”的分布概率较高的各种重量的交集,比如“轻”对应的重量范围为[80g 140g],“适合女性”对应的重量范围为[90g 160g],则综合的重量范围交集就为[90g 140g],由于手机厂商都会提供相关的产品物理参数,则就可以对重量范围为[90g 140g]的手机进行检索。这种检索可以将没有任何厂商以及用户评论的新手机也会作为检索对象,技术效果非常显著。而在步骤1105中,则向用户发送检索到的产品或者服务的信息。作为变通的方式,可以在检索结果中还包括根据所述关联规则之外的规则进行检索得到的产品或者服务,在这种情况下,则将根据所述关联规则检索到的产品或者服务优先呈现给用户。另一种实施方式是可以在现有估计工具的结果中根据所述关联规则进行二次检索,并将该二次检索结果优先呈现给用户。
作为本发明的另外一个实施方式,图12详细描述了对用户评论进行处理的用户评论处理系统1201。该系统包括有接收装置1203、特征识别装置1205、情感识别装置1206、关联和频度计算装置1207以及关联规则生成装置1209。其中接收装置1203用于接收产品或者服务的特征的客观数据以及对产品或者服务的用户评论。特征识别装置1205用于从产品或者服务的用户评论中识别与产品或服务的特征相关联的用户评论。情感识别装置1206用于识别与产品或服务的特征相关联的用户评论中的情感描述主题。而关联和频度计算装置1207则用于将情感描述主题与产品或者服务对应的特征的客观数据相关联,并且计算与客观数据关联的相同情感描述主题出现的频度。而关联规则生成装置1209用于根据情感描述主题与客观数据之间的关联关系以及与客观数据关联的相同情感描述主题出现的频度形成情感描述主题与客观数据的关联规则。上述相关装置所采用的相关方法与上面有关方法的实施方式相同,在此为节省篇幅不再赘述。
另一方面,所述关联规则生成装置1209包括以客观数据、情感描述主题以及情感描述主题出现的频度之间的一一对应关系作情感描述主题与客观数据的关联规则的装置。用户评论处理系统1201还可以包括:获取新产品或者新服务的特征的客观数据的装置,其中所述新产品或者新服务没有相关用户评论;根据所述关联规则确定所述新产品或者新服务的情感描述主题及情感描述主题出现的频度的装置。所述情感识别装置1206包括基于已经获得的包含产品或者服务的特征的用户评论,应用主题模型算法计算与产品或者服务的特征相关的情感描述主题的装置。用户评论处理系统1201还可以进一步包括:分析与产品或者服务的特征相关的情感描述主题的情感极性的装置;合并关于产品或者服务的特征的各个情感描述主题的情感极性并计算情感极性对应的百分比率的装置;以及除去因为百分比率偏低而可信度不高的情感极性对应的情感描述主题的装置。所述关联和频度计算装置1207包括计算包括所述客观数据对应的情感描述主题的用户评论的总数,并且计算对于具有所述客观数据的产品或者服务的用户评论的总数,将包括所述客观数据对应的情感描述主题的用户评论的总数除以对于具有所述客观数据的产品或者服务的用户评论的总数以得到与客观数据相关联的情感描述主题出现的频度的装置。
另一方面,本发明还提供如图13所示的信息检索系统1301。所述信息检索系统1301包括检索请求接收装置1303、检索装置1305以及检索结果发送装置1307。其中检索请求接收装置1303用于接收用户的查询请求。检索装置1305则用于根据利用上述实施方式生成的关联规则结合用户的查询请求检索相关的产品或服务。而检索结果发送装置1307则用于向用户发送检索到的产品或者服务。其中所述相关的产品或者服务可以包括新产品或者新服务,其中所述新产品和新服务没有相关用户评论。
另外,根据本发明的用户评论的处理方法以及信息检索方法还可以通过计算机程序产品来实施,该计算机程序产品包括用于当在计算机上运行所述计算机程序产品时执行以实施本发明的仿真方法的软件代码部分。
还可以通过在计算机可读记录介质中记录一计算机程序来实施本发明,该计算机程序包括用于当在计算机上运行所述计算机程序时执行以实施根据本发明的仿真方法的软件代码部分。即,根据本发明的仿真方法的过程能够以计算机可读介质中的指令的形式和各种其它形式分发,而不管实际用来执行分发的信号承载介质的特定类型。计算机可读介质的例子包括诸如EPROM、ROM、磁带、纸、软盘、硬盘驱动器、RAM和CD-ROM的介质以及诸如数字和模拟通信链路的传输型介质。
尽管参考本发明的优选实施例具体展示和描述了本发明,但是本领域一般技术人员应该明白,在不脱离所附权利要求限定的本发明的精神和范围的情况下,可以对其进行形式和细节上的各种修改。

Claims (20)

1.一种用户评论处理方法,该方法包括:
接收产品或者服务的特征的客观数据以及对产品或者服务的用户评论;
从产品或者服务的用户评论中识别与产品或服务的特征相关联的用户评论;
识别与产品或服务的特征相关联的用户评论中的情感描述主题;
建立情感描述主题与产品或者服务对应的特征的客观数据之间的关联关系,并且计算与客观数据相关联的情感描述主题出现的频度;
根据所述关联关系以及与客观数据关联的情感描述主题出现的频度形成情感描述主题与客观数据的关联规则。
2.一种如权利要求1所述的方法,其中所述根据所述关联关系以及与客观数据关联的情感描述主题出现的频度形成情感描述主题与客观数据的关联规则的步骤包括:
以情感描述主题出现的频度以及对应的客观数据构建样本集;
确定概率函数原型和该概率函数原型的参数空间;以及
根据所述样本集中的情感描述主题出现的频度以及对应的客观数据在参数空间中估计函数原型的参数以获得概率函数,并以该概率函数作为情感描述主题与客观数据的关联规则。
3.一种如权利要求2所述的方法,其中所述根据情感描述主题出现的频度以及对应的客观数据在参数空间中估计函数原型的参数以获得概率函数,并以该概率函数作为情感描述主题与客观数据的关联规则的步骤还包括:
以情感描述主题出现的频度以及对应的客观数据对获得的概率函数进行校验,并且当检验结果不合格时重复执行所述确定概率函数原型和该概率函数原型的参数空间的步骤和所述根据情感描述主题出现的频度以及对应的客观数据在参数空间中估计函数原型的参数以获得概率函数,并以该概率函数作为关联规则的步骤。
4.一种如权利要求1所述的方法,其中所述根据所述关联关系以及与客观数据关联的相同情感描述主题出现的频度形成情感描述主题与客观数据的关联规则的步骤包括:
以客观数据、情感描述主题以及情感描述主题出现的频度之间的一一对应关系作情感描述主题与客观数据的关联规则。
5.一种如权利要求1-4任一项所述的方法,所述方法还包括:
获取新产品或者新服务的特征的客观数据,其中所述新产品或者新服务没有相关用户评论;
根据所述关联规则确定所述新产品或者新服务的情感描述主题及情感描述主题出现的频度。
6.一种如权利要求1-4任一项所述的方法,所述识别与产品或服务的特征相关联的用户评论中的情感描述主题的步骤包括:
基于已经获得的包含产品或者服务的特征的用户评论,应用主题模型方法计算与产品或者服务的特征相关的情感描述主题。
7.一种如权利要求6所述的方法,其中还进一步包括:
分析与产品或者服务的特征相关的情感描述主题的情感极性;
合并关于产品或者服务的特征的各个情感描述主题的情感极性并计算情感极性对应的百分比率;以及
除去百分比率偏低的情感极性所对应的情感描述主题。
8.一种如权利要求1-4任一项所述的方法,其中所述计算与客观数据相关联的情感描述主题出现的频度的步骤包括:
计算包括所述客观数据对应的情感描述主题的用户评论的总数,并且计算对于具有所述客观数据的产品或者服务的用户评论的总数,将包括所述客观数据对应的情感描述主题的用户评论的总数除以对于具有所述客观数据的产品或者服务的用户评论的总数以得到与客观数据相关联的情感描述主题出现的频度。
9.一种信息检索方法,所述方法包括:
接收用户的检索请求;
至少根据权利要求1-8所述的任一项方法所形成的关联规则并结合用户的检索请求检索相关的产品或服务的信息;
向用户发送检索到的产品或者服务的信息。
10.如权利要求9所述的方法,所述方法还包括:
如果检索结果中还包括根据关联规则之外的规则进行检索得到的产品或者服务,则将根据权利要求1-8所述的任一项方法所形成的关联规则检索到的产品或者服务优先呈现给用户。
11.如权利要求9所述的方法,所述方法还包括:
相关的产品或者服务包括新产品或者新服务,其中所述新产品和新服务没有相关用户评论。
12.一种用户评论处理系统,包括:
接收装置,用于接收产品或者服务的特征的客观数据以及对产品或者服务的用户评论;
特征识别装置,用于从产品或者服务的用户评论中识别与产品或服务的特征相关联的用户评论;
情感识别装置,用于识别与产品或服务的特征相关联的用户评论中的情感描述主题;
关联和频度计算装置,用于建立情感描述主题与产品或者服务对应的特征的客观数据之间的关联关系,并且计算与客观数据相关联的情感描述主题出现的频度;
关联规则生成装置,根据所述关联关系以及与客观数据关联的情感描述主题出现的频度形成情感描述主题与客观数据的关联规则。
13.一种如权利要求12所述的系统,其中所述关联规则生成装置包括:
以情感描述主题出现的频度以及对应的客观数据构建样本集的装置;
确定概率函数原型和概率函数原型的参数空间装置;以及
根据情感描述主题出现的频度以及对应的客观数据在参数空间中估计函数原型的参数以获得概率函数,并以该概率函数作为情感描述主题与客观数据的关联规则的装置。
14.一种如权利要求12所述的系统,其中所述关联规则生成装置包括:
以客观数据、情感描述主题以及情感描述主题出现的频度之间的一一对应关系作情感描述主题与客观数据的关联规则的装置。
15.一种如权利要求12-14任一项所述的系统,所述系统还包括:
获取新产品或者新服务的特征的客观数据的装置,其中所述新产品或者新服务没有相关用户评论;
根据所述关联规则确定所述新产品或者新服务的情感描述主题及情感描述主题出现的频度的装置。
16.一种如权利要求12-14任一项所述的系统,所述情感识别装置包括:
基于已经获得的包含产品或者服务的特征的用户评论,应用主题模型算法计算与产品或者服务的特征相关的情感描述主题的装置。
17.一种如权利要求16所述的系统,其中还进一步包括:
分析与产品或者服务的特征相关的情感描述主题的情感极性的装置;
合并关于产品或者服务的特征的各个情感描述主题的情感极性并计算情感极性对应的百分比率的装置;以及
除去因为百分比率偏低而可信度不高的情感极性对应的情感描述主题的装置。
18.一种如权利要求12-14任一项所述的系统,其中所述关联和频度计算装置包括:
计算包括所述客观数据对应的情感描述主题的用户评论的总数,并且计算对于具有所述客观数据的产品或者服务的用户评论的总数,将包括所述客观数据对应的情感描述主题的用户评论的总数除以对于具有所述客观数据的产品或者服务的用户评论的总数以得到与客观数据相关联的情感描述主题出现的频度的装置。
19.一种信息检索系统,所述系统包括:
检索请求接收装置,用于接收用户的检索请求;
检索装置,用于至少根据权利要求1-8所述的任一项方法所形成的关联规则并结合用户的检索请求检索相关的产品或服务的信息;
检索结果发送装置,用于向用户发送检索到的产品或者服务的信息。
20.如权利要求19所述的信息检索系统,其中所述相关的产品或者服务包括新产品或者新服务,其中所述新产品和新服务没有相关用户评论。
CN2009101418998A 2009-05-31 2009-05-31 信息检索方法和用户评论处理方法及其系统 Pending CN101901230A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2009101418998A CN101901230A (zh) 2009-05-31 2009-05-31 信息检索方法和用户评论处理方法及其系统
US12/787,870 US20100306123A1 (en) 2009-05-31 2010-05-26 Information retrieval method, user comment processing method, and systems thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101418998A CN101901230A (zh) 2009-05-31 2009-05-31 信息检索方法和用户评论处理方法及其系统

Publications (1)

Publication Number Publication Date
CN101901230A true CN101901230A (zh) 2010-12-01

Family

ID=43221341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101418998A Pending CN101901230A (zh) 2009-05-31 2009-05-31 信息检索方法和用户评论处理方法及其系统

Country Status (2)

Country Link
US (1) US20100306123A1 (zh)
CN (1) CN101901230A (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760264A (zh) * 2011-04-29 2012-10-31 国际商业机器公司 为互联网上的评论生成摘录的计算机实现的方法和系统
CN103577452A (zh) * 2012-07-31 2014-02-12 国际商业机器公司 用于丰富网站内容的方法和装置、网站服务器
CN103582898A (zh) * 2011-05-26 2014-02-12 创慧株式会社 市场评价的调查装置以及调查方法
CN103679462A (zh) * 2012-08-31 2014-03-26 阿里巴巴集团控股有限公司 一种评论数据处理方法和装置、一种搜索方法和系统
CN103823893A (zh) * 2014-03-11 2014-05-28 北京大学 一种基于用户评论的产品检索方法及产品检索系统
CN103885994A (zh) * 2012-12-24 2014-06-25 腾讯科技(深圳)有限公司 一种产品对比方法和装置
CN104239331A (zh) * 2013-06-19 2014-12-24 阿里巴巴集团控股有限公司 一种用于实现评论搜索引擎排序的方法和装置
CN104572623A (zh) * 2015-01-12 2015-04-29 上海交通大学 一种在线lda模型的高效数据总结分析方法
CN104679769A (zh) * 2013-11-29 2015-06-03 国际商业机器公司 对产品的使用场景进行分类的方法及装置
CN104809635A (zh) * 2015-05-13 2015-07-29 苏州市千尺浪信息技术服务有限公司 一种互联网动态点评分析方法
CN105005552A (zh) * 2014-04-22 2015-10-28 北京四维图新科技股份有限公司 一种信息处理方法及装置
CN105095302A (zh) * 2014-05-15 2015-11-25 财团法人工业技术研究院 面向口碑分析与检视系统、装置及方法
CN105335347A (zh) * 2014-05-30 2016-02-17 富士通株式会社 确定针对特定话题的情绪及其原因的方法和设备
CN106295811A (zh) * 2016-07-29 2017-01-04 上海华力微电子有限公司 设备定期保养效果分析方法
CN106384245A (zh) * 2016-09-06 2017-02-08 合肥工业大学 产品特征分析方法和系统
CN108038205A (zh) * 2017-12-15 2018-05-15 福州大学 针对中文微博的观点分析原型系统
CN108197100A (zh) * 2017-12-07 2018-06-22 东软集团股份有限公司 情感分析方法、装置、计算机可读存储介质及电子设备
CN108874874A (zh) * 2018-04-27 2018-11-23 合肥工业大学 产品市场定位方法和系统、存储介质
CN108958710A (zh) * 2018-07-05 2018-12-07 北方工业大学 基于情感因素对项目进展的协方差相关性提取方法
CN109933648A (zh) * 2019-02-28 2019-06-25 北京学之途网络科技有限公司 一种真实用户评论的区分方法和区分装置
CN110060132A (zh) * 2019-04-24 2019-07-26 吉林大学 基于细粒度数据的可解释商品推荐方法
CN110555109A (zh) * 2019-06-28 2019-12-10 西安理工大学 基于个人计算机电商评论的多粒度观点挖掘方法
CN113496330A (zh) * 2020-04-01 2021-10-12 逸驾智能科技有限公司 用于评估站点服务质量的方法、设备和介质
CN115048491A (zh) * 2022-06-18 2022-09-13 哈尔滨工业大学 在异构语义空间中基于假设检验的软件跨模态检索方法
CN115406670A (zh) * 2022-08-16 2022-11-29 中国第一汽车股份有限公司 车辆性能的测试方法、装置、电子设备以及一种车辆

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9633113B2 (en) * 2010-08-06 2017-04-25 Yahoo! Inc. Socializing via search
US9208552B2 (en) * 2011-04-26 2015-12-08 Kla-Tencor Corporation Method and system for hybrid reticle inspection
US9060062B1 (en) 2011-07-06 2015-06-16 Google Inc. Clustering and classification of recent customer support inquiries
EP2546760A1 (en) * 2011-07-11 2013-01-16 Accenture Global Services Limited Provision of user input in systems for jointly discovering topics and sentiment
US9098600B2 (en) 2011-09-14 2015-08-04 International Business Machines Corporation Deriving dynamic consumer defined product attributes from input queries
US8600796B1 (en) * 2012-01-30 2013-12-03 Bazaarvoice, Inc. System, method and computer program product for identifying products associated with polarized sentiments
US8965897B2 (en) 2012-02-29 2015-02-24 International Business Machines Corporation Intelligent product feedback analytics tool
KR101700820B1 (ko) * 2012-07-11 2017-02-01 한국전자통신연구원 사용자 코멘트 기반 개인화 컨텐츠 검색 장치 및 방법
US9501469B2 (en) 2012-11-21 2016-11-22 University Of Massachusetts Analogy finder
KR20140078312A (ko) * 2012-12-17 2014-06-25 한국전자통신연구원 텍스트 기반 감성 분석 결과를 제공하기 위한 장치, 시스템 및 그 방법
US9177554B2 (en) * 2013-02-04 2015-11-03 International Business Machines Corporation Time-based sentiment analysis for product and service features
CN103279460B (zh) * 2013-05-24 2017-02-08 北京尚友通达信息技术有限公司 网购评论的分析处理方法
US9256687B2 (en) * 2013-06-28 2016-02-09 International Business Machines Corporation Augmenting search results with interactive search matrix
US10706367B2 (en) * 2013-09-10 2020-07-07 Facebook, Inc. Sentiment polarity for users of a social networking system
US20150170243A1 (en) * 2013-12-13 2015-06-18 International Business Machines Corporation Creating a house of quality for product design
US9525899B2 (en) * 2014-04-28 2016-12-20 Rovi Guides, Inc. Methods and systems for preventing a user from terminating services based on a consumption rate of the user
US20160048768A1 (en) * 2014-08-15 2016-02-18 Here Global B.V. Topic Model For Comments Analysis And Use Thereof
US20160364733A1 (en) * 2015-06-09 2016-12-15 International Business Machines Corporation Attitude Inference
CN105512191A (zh) * 2015-11-25 2016-04-20 南京莱斯信息技术股份有限公司 一种具备人工行为学习能力的行业特征分析器
CN108121734A (zh) * 2016-11-29 2018-06-05 北京国双科技有限公司 文本的情感倾向判断方法及装置
CN110033294A (zh) * 2018-01-12 2019-07-19 腾讯科技(深圳)有限公司 一种业务分值的确定方法、业务分值确定装置及介质
CN110321436B (zh) * 2019-07-04 2020-06-16 中国人民解放军国防科技大学 一种基于社交注意力机制表示学习的冷启动欺诈评论检测方法
CN110688455A (zh) * 2019-09-09 2020-01-14 深圳壹账通智能科技有限公司 基于人工智能过滤无效评论的方法、介质及计算机设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8200477B2 (en) * 2003-10-22 2012-06-12 International Business Machines Corporation Method and system for extracting opinions from text documents
WO2006039566A2 (en) * 2004-09-30 2006-04-13 Intelliseek, Inc. Topical sentiments in electronically stored communications
US20060143158A1 (en) * 2004-12-14 2006-06-29 Ruhl Jan M Method, system and graphical user interface for providing reviews for a product
US7558769B2 (en) * 2005-09-30 2009-07-07 Google Inc. Identifying clusters of similar reviews and displaying representative reviews from multiple clusters
US7895127B2 (en) * 2006-09-29 2011-02-22 Weiser Anatoly S Rating-based sorting and displaying of reviews
US7930302B2 (en) * 2006-11-22 2011-04-19 Intuit Inc. Method and system for analyzing user-generated content
US20080215571A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Product review search
US20090048823A1 (en) * 2007-08-16 2009-02-19 The Board Of Trustees Of The University Of Illinois System and methods for opinion mining

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760264A (zh) * 2011-04-29 2012-10-31 国际商业机器公司 为互联网上的评论生成摘录的计算机实现的方法和系统
CN103582898A (zh) * 2011-05-26 2014-02-12 创慧株式会社 市场评价的调查装置以及调查方法
CN103577452A (zh) * 2012-07-31 2014-02-12 国际商业机器公司 用于丰富网站内容的方法和装置、网站服务器
CN103679462B (zh) * 2012-08-31 2019-01-15 阿里巴巴集团控股有限公司 一种评论数据处理方法和装置、一种搜索方法和系统
CN103679462A (zh) * 2012-08-31 2014-03-26 阿里巴巴集团控股有限公司 一种评论数据处理方法和装置、一种搜索方法和系统
CN103885994A (zh) * 2012-12-24 2014-06-25 腾讯科技(深圳)有限公司 一种产品对比方法和装置
CN103885994B (zh) * 2012-12-24 2018-11-23 腾讯科技(深圳)有限公司 一种产品对比方法和装置
CN104239331A (zh) * 2013-06-19 2014-12-24 阿里巴巴集团控股有限公司 一种用于实现评论搜索引擎排序的方法和装置
CN104239331B (zh) * 2013-06-19 2018-10-09 阿里巴巴集团控股有限公司 一种用于实现评论搜索引擎排序的方法和装置
CN104679769A (zh) * 2013-11-29 2015-06-03 国际商业机器公司 对产品的使用场景进行分类的方法及装置
CN104679769B (zh) * 2013-11-29 2018-04-06 国际商业机器公司 对产品的使用场景进行分类的方法及装置
CN103823893A (zh) * 2014-03-11 2014-05-28 北京大学 一种基于用户评论的产品检索方法及产品检索系统
CN105005552A (zh) * 2014-04-22 2015-10-28 北京四维图新科技股份有限公司 一种信息处理方法及装置
CN105005552B (zh) * 2014-04-22 2019-01-08 北京四维图新科技股份有限公司 一种信息处理方法及装置
CN105095302B (zh) * 2014-05-15 2019-05-17 财团法人工业技术研究院 面向口碑分析与检视系统、装置及方法
CN105095302A (zh) * 2014-05-15 2015-11-25 财团法人工业技术研究院 面向口碑分析与检视系统、装置及方法
CN105335347A (zh) * 2014-05-30 2016-02-17 富士通株式会社 确定针对特定话题的情绪及其原因的方法和设备
CN104572623A (zh) * 2015-01-12 2015-04-29 上海交通大学 一种在线lda模型的高效数据总结分析方法
CN104809635A (zh) * 2015-05-13 2015-07-29 苏州市千尺浪信息技术服务有限公司 一种互联网动态点评分析方法
CN106295811A (zh) * 2016-07-29 2017-01-04 上海华力微电子有限公司 设备定期保养效果分析方法
CN106295811B (zh) * 2016-07-29 2019-08-23 上海华力微电子有限公司 设备定期保养效果分析方法
CN106384245A (zh) * 2016-09-06 2017-02-08 合肥工业大学 产品特征分析方法和系统
CN108197100A (zh) * 2017-12-07 2018-06-22 东软集团股份有限公司 情感分析方法、装置、计算机可读存储介质及电子设备
CN108038205A (zh) * 2017-12-15 2018-05-15 福州大学 针对中文微博的观点分析原型系统
CN108038205B (zh) * 2017-12-15 2021-12-21 福州大学 针对中文微博的观点分析原型系统
CN108874874A (zh) * 2018-04-27 2018-11-23 合肥工业大学 产品市场定位方法和系统、存储介质
CN108958710A (zh) * 2018-07-05 2018-12-07 北方工业大学 基于情感因素对项目进展的协方差相关性提取方法
CN108958710B (zh) * 2018-07-05 2021-07-16 北方工业大学 基于情感因素对项目进展的协方差相关性提取方法
CN109933648A (zh) * 2019-02-28 2019-06-25 北京学之途网络科技有限公司 一种真实用户评论的区分方法和区分装置
CN110060132B (zh) * 2019-04-24 2021-09-24 吉林大学 基于细粒度数据的可解释商品推荐方法
CN110060132A (zh) * 2019-04-24 2019-07-26 吉林大学 基于细粒度数据的可解释商品推荐方法
CN110555109A (zh) * 2019-06-28 2019-12-10 西安理工大学 基于个人计算机电商评论的多粒度观点挖掘方法
CN113496330A (zh) * 2020-04-01 2021-10-12 逸驾智能科技有限公司 用于评估站点服务质量的方法、设备和介质
CN115048491A (zh) * 2022-06-18 2022-09-13 哈尔滨工业大学 在异构语义空间中基于假设检验的软件跨模态检索方法
CN115406670A (zh) * 2022-08-16 2022-11-29 中国第一汽车股份有限公司 车辆性能的测试方法、装置、电子设备以及一种车辆

Also Published As

Publication number Publication date
US20100306123A1 (en) 2010-12-02

Similar Documents

Publication Publication Date Title
CN101901230A (zh) 信息检索方法和用户评论处理方法及其系统
CN109918673B (zh) 语义仲裁方法、装置、电子设备和计算机可读存储介质
CN110196901B (zh) 对话系统的构建方法、装置、计算机设备和存储介质
CN107818781B (zh) 智能交互方法、设备及存储介质
CN110032639B (zh) 将语义文本数据与标签匹配的方法、装置及存储介质
US9196245B2 (en) Semantic graphs and conversational agents
US8694304B2 (en) Semantic clustering and user interfaces
US8719192B2 (en) Transfer of learning for query classification
US20150052098A1 (en) Contextually propagating semantic knowledge over large datasets
CN104471568A (zh) 对自然语言问题的基于学习的处理
CN109086265B (zh) 一种语义训练方法、短文本中多语义词消歧方法
CN104350490A (zh) 用于组织与产品相关的数据的方法、装置以及计算机可读介质
KR20200007713A (ko) 감성 분석에 의한 토픽 결정 방법 및 장치
CN104615608A (zh) 一种数据挖掘处理系统及方法
CN108596637B (zh) 一种电商服务问题自动发现系统
CN105956053A (zh) 一种基于网络信息的搜索方法及装置
CN109145301B (zh) 信息分类方法及装置、计算机可读存储介质
CN111090771A (zh) 歌曲搜索方法、装置及计算机存储介质
Liu et al. Open intent discovery through unsupervised semantic clustering and dependency parsing
TW202034207A (zh) 使用意圖偵測集成學習之對話系統及其方法
CN111611358A (zh) 信息交互方法、装置、电子设备及存储介质
CN112417132A (zh) 一种利用谓宾信息筛选负样本的新意图识别方法
CN116798417B (zh) 语音意图识别方法、装置、电子设备及存储介质
CN113535928A (zh) 基于注意力机制下长短期记忆网络的服务发现方法及系统
CN111523311B (zh) 一种搜索意图识别方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20101201