CN107342879A - 用于确定向网络用户进行服务评价请求的方法和装置 - Google Patents

用于确定向网络用户进行服务评价请求的方法和装置 Download PDF

Info

Publication number
CN107342879A
CN107342879A CN201610279975.1A CN201610279975A CN107342879A CN 107342879 A CN107342879 A CN 107342879A CN 201610279975 A CN201610279975 A CN 201610279975A CN 107342879 A CN107342879 A CN 107342879A
Authority
CN
China
Prior art keywords
feature
mrow
text
weighted value
msub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610279975.1A
Other languages
English (en)
Other versions
CN107342879B (zh
Inventor
邹波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201610279975.1A priority Critical patent/CN107342879B/zh
Publication of CN107342879A publication Critical patent/CN107342879A/zh
Application granted granted Critical
Publication of CN107342879B publication Critical patent/CN107342879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5061Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
    • H04L41/5064Customer relationship management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5061Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
    • H04L41/5067Customer-centric QoS measurements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5061Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
    • H04L41/507Filtering out customers affected by service problems

Landscapes

  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了用于确定向网络用户进行服务评价请求的方法和装置。所述方法包括:从所述网络用户接收至少一个评论消息,所述评论消息指示所述网络用户在用户端输入的文本;将所述至少一个评论消息中的每一个中包括的文本分割成至少一个特征;将所述至少一个特征中的每一个与参考特征列表中的参考特征进行匹配,所述参考特征列表中的每个参考特征具有权重值;针对存在匹配的特征,根据与其匹配的参考特征的权重值确定该特征的权重值;基于所有存在匹配的特征的权重值,确定所述网络用户的评价值;以及在所述评价值大于阈值的情况下,确定向所述网络用户提出服务评价请求。

Description

用于确定向网络用户进行服务评价请求的方法和装置
技术领域
本发明涉及互联网领域,具体地涉及一种用于确定向网络用户进行服务评价请求的方法和装置。
背景技术
在互联网领域,尤其是电商产品中,人机对话广泛地用于网络用户查询、投诉和售后等方面。在人机对话过程中,“机器人”(比如京东机器人JIMI)能否切实帮助用户解决实际问题,是否能够向用户提供令其满意的服务,是衡量“机器人”系统是否完善的重要指标。判断该指标是否达成的一大依据是用户在人机对话后的反馈,这同时也是对“机器人”系统进行改进的重要资源。因此,对用户所反馈的评价进行收集是非常重要的。
在现有系统中,邀请用户评价(简称“邀评”)是一种比较常用的方式。在传统的人工客服体系中,接线员可以自行判断是否已经解决了用户的问题。此外,接线员还能凭感觉判断用户是否对自己的服务感到满意(与问题是否解决并非完全相关)。当判断用户满意的情况下,接线员会触发系统进行邀评,从而保证收集到的好评率比较高。但在人机对话系统中,只能由“机器人”通过会话内容判断中是否应该弹出邀评提示以及何时弹出邀评提示,这在技术上很有挑战性。
现有的人机对话中的邀评方式,基本是根据用户在回答中输入的文字是否包含关键词来判断的。比如,用户输入了“谢谢”、“非常感谢”这类关键词,可以理解为用户的问题已经得到了解决,用户表示感谢。此时弹出的邀评提示,获得用户好评的概率相对较高。又如,用户的问题中多次提到“您好”、“请”等关键词,可以认为用户比较有礼貌,向这类用户进行邀评获得好评的概率也比较高。在这种方式中,可以根据经验设置关键词库,并针对用户的每此输入进行关键词匹配。一旦用户 的输入命中关键词,则弹出邀评提示。
此外,现有技术中还存在一些基于统计的方法,其实现流程是:
1.获取一段时间内的所有给过好评的用户聊天日志;
2.依次将用户聊天的每一句话做切词处理(常用的切词方法包括n-gram切词方法),从而将句子转化为词的形式;
3.生成汇总词列表,记录每个词出现的次数,并取其中高频词,加入到关键词库。
综上所述,目前业界比较常用的使用关键词库的判断方法,词库的建设可以基于个人经验,也可以基于统计。最终,用户的问题一旦命中关键词,则弹出邀评提示,以此保证收集到较高的好评率。
基于关键词的方法,只能解决非常特殊的情况,如果用户的问题中没有包含词库中的关键词,那这种方法就很难判断出机器人是否解决了用户的问题,也不知道用户的评价倾向。此外,通过观察历史人机对话日志信息得知,大部分给出好评的用户,并没有使用这些非常有限的标示。因此,仅仅根据一些关键词去做出邀评判断,是有一定局限性的。
发明内容
为了解决现有技术中存在的上述问题,本发明提出了一种用于确定向网络用户进行服务评价请求的方法和装置。
根据本发明的一个方面,提出了一种用于确定向网络用户进行服务评价请求的方法。所述方法包括:从所述网络用户接收至少一个评论消息,所述评论消息指示所述网络用户在用户端输入的文本;将所述至少一个评论消息中的每一个中包括的文本分割成至少一个特征;将所述至少一个特征中的每一个与参考特征列表中的参考特征进行匹配,所述参考特征列表中的每个参考特征具有权重值;针对存在匹配的特征,根据与其匹配的参考特征的权重值确定该特征的权重值;基于所有存在匹配的特征的权重值,确定所述网络用户的评价值;以及在所述评价值大于阈值的情况下,确定向所述网络用户提出服务评价请求。
优选地,所述参考特征列表是由从特征库中选出的特征组成的列表,其中,所述特征库由对历史文本进行分割得到的特征组成,所述历史文 本包括正向历史文本和负向历史文本,所述正向历史文本是由最终对相应服务做出积极评价的用户针对该相应服务输入的文本,所述负向历史文本是由最终对相应服务做出消极评价的用户针对该相应服务输入的文本。
优选地,针对特征库中的特征x,通过以下公式来计算x的权重值w(x):
其中,m为正向历史文本的数量,Ti为第i个正向历史文本中的特征总数,Ai(x)为x在第i个正向历史文本中出现的次数,n为负向历史文本的数量,Sj为第j个负向历史文本中的特征总数,Bj(x)为x在第j个负向历史文本中出现的次数。
优选地,所述参考特征列表是由所述特征库中具有较高权重值的特征组成的列表。
优选地,所述特征库中滤除了噪声特征,所述噪声特征是预先指定的。
优选地,所述根据与其匹配的参考特征的权重值确定该特征的权重值包括:将与存在匹配的特征相匹配的参考特征的权重值确定为该存在匹配的特征的权重值。
优选地,所述基于所有存在匹配的特征的权重值确定所述网络用户的评价值包括:通过预先指定的运算规则,从所有存在匹配的特征的权重值计算出所述评价值。
优选地,所述阈值是预先指定的并且能够被更新。
优选地,在将所述至少一个特征中的每一个与参考特征列表中的参考特征进行匹配之前,所述方法还包括:将所述至少一个特征中的每一个与特定特征集合进行匹配;当所述至少一个特征中存在与所述特定特征集合中的特定特征匹配的特征时,确定向所述网络用户提出服务评价请求。
根据本发明的另一方面,提出了一种用于确定向网络用户进行服务评价请求的装置。所述装置包括:用户接口,用于从所述网络用户接收 至少一个评论消息,所述评论消息指示所述网络用户在用户端输入的文本;分割单元,用于将所述至少一个评论消息中的每一个中包括的文本分割成至少一个特征;以及确定单元。所述确定单元包括第一匹配模块,用于将所述至少一个特征中的每一个与参考特征列表中的参考特征进行匹配,所述参考特征列表中的每个参考特征具有权重值;权重值确定模块,用于针对存在匹配的特征,根据与其匹配的参考特征的权重值确定该特征的权重值;评价值确定模块,用于基于所有存在匹配的特征的权重值,确定所述网络用户的评价值;以及判断模块,在所述评价值大于阈值的情况下,确定向所述网络用户提出服务评价请求。
优选地,所述装置还包括:存储单元,用于存储历史文本库和特征库,其中所述历史文本库包括正向历史文本和负向历史文本,所述正向历史文本是由最终对相应服务做出积极评价的用户针对该相应服务输入的文本,所述负向历史文本是由最终对相应服务做出消极评价的用户针对该相应服务输入的文本,所述特征库包括对所述历史文本库中的历史文本进行分割得到的特征;计算单元,用于为所述特征库中的每个特征计算权重值;列表生成单元,用于基于所述计算单元的计算结果,从特征库中的特征生成所述参考特征列表。
优选地,所述计算单元被配置为:针对特征库中的特征x,通过以下公式来计算x的权重值w(x):
其中,m为历史文本库中正向历史文本的数量,Ti为第i个正向历史文本中的特征总数,Ai(x)为x在第i个正向历史文本中出现的次数,n为历史文本库中负向历史文本的数量,Sj为第j个负向历史文本中的特征总数,Bj(x)为x在第j个负向历史文本中出现的次数。
优选地,所述列表生成单元被配置为从所述特征库中选择具有较高权重值的特征组成所述参考特征列表。
优选地,所述特征库中滤除了噪声特征,所述噪声特征是预先指定的。
优选地,所述权重值确定模块被配置为:将与存在匹配的特征相匹配的参考特征的权重值确定为该存在匹配的特征的权重值。
优选地,所述评价值确定模块被配置为:通过预先指定的运算规则,从所有存在匹配的特征的权重值计算出所述评价值。
优选地,所述阈值是预先指定的并且能够被更新。
优选地,所述确定单元还包括第二匹配模块,所述第二匹配模块被配置为将所述至少一个特征中的每一个与特定特征集合进行匹配,并且所述判断模块还被配置为:当所述至少一个特征中存在与所述特定特征集合中的特定特征匹配的特征时,确定向所述网络用户提出服务评价请求。
通过使用向网络用户进行服务评价请求的方法和装置,能够在一定程度上解决现有技术的局限性,并且在很大程度上排除了邀请判断的偶然性。本发明的方法提高了判断的准确率,并进而实现了更高的好评率。
附图说明
图1示出了根据本发明的一种实施例的用于确定向网络用户进行服务评价请求的方法的流程图;
图2示出了根据本发明的一种实施例的用于确定向网络用户进行服务评价请求的装置的结构框图;
图3示出了根据本发明的一种优选实施例的用于确定向网络用户进行服务评价请求的装置的结构框图。
具体实施方式
以下参考附图对本发明进行具体描述。
首先,图1示出了根据本发明的一种实施例的用于确定向网络用户进行服务评价请求的方法100的流程图。所述方法100开始于步骤S110,在步骤S110中,从所述网络用户接收至少一个评论消息,所述评论消息指示所述网络用户在用户端输入的文本。然后,在步骤S120中,将所述至少一个评论消息中的每一个中包括的文本分割成至少一个特征。接下来,在步骤S130中,将所述至少一个特征中的每一个与参考特征列表中的参考特征进行匹配,所述参考特征列表中的每个参考特征具有权重值。接下来,在步骤S140中,针对存在匹配的特征,根据与其匹配的参考特征的权重值确定该特征的权重值。接下来,在步骤S150中,基于所有存在匹配的特征的权重值,确定所述网络用户的评价值。最后,在步骤S160中,在所述评价值大于阈值的情况下,确定向所述网络用户提出服务评价请求。
在步骤S110中,从所述网络用户接收用户输入的文本,所述文本以评论消息的形式传输并被接收。用户输入的文本包括用户输入的所有文字、表情、符号等,是用来判断用户是否满意以及进而是否向其发送评价请求的依据。
接下来,在步骤S120中,用户输入的文本分割成特征。特征是构成文本的元素,包括但不限于,字、词、词组、固定搭配等。
在一个实施例中,采用常用的切词方法(比如n-gram切词方法)来分割,但应该理解的是,本发明中将文本分割成特征的方法不限于此。
接下来,在步骤S130中,将经过分割得到的特征与参考特征列表中的参考特征进行匹配。参考特征列表是由经过预先选择的参考特征组成的列表,并且其中的每个参考特征具有相应的权重值。
所述参考特征列表中的参考特征是由从特征库中选出的。特征库是通过对历史文本(比如从系统日志、聊天记录等中得到的)进行分割得到的特征组成。在使用本发明所要求保护的方法之前,需要首先收集用户(所有用户或特定的部分用户,比如金牌及以上用户)在特定时间段(比如6个月)内的评论历史,并从中提取出所需的历史文本。采用与步骤S120中一样的分割方法对这些历史文本进行分割,得到众多的特征。然后,这些历史文本(历史文本库)和分割得到的特征(特征库)均被存储在服务器上。
所述历史文本包括正向历史文本和负向历史文本。正向历史文本是由最终对相应服务做出积极评价的用户针对该相应服务输入的文本,即如果某一用户在收到评价请求后对某一服务给出了好评,则在其针对该服务进行咨询时所输入的文字便被认为是正向历史文本。相反地,负向 历史文本是由最终对相应服务做出消极评价的用户针对该相应服务输入的文本,即如果某一用户在收到评价请求后对某一服务给出了差评,则在其针对该服务进行咨询时所输入的文字便被认为是负向历史文本。
在如上生成特征库之前,可以先对历史文本进行筛选。这样,可以控制得到的历史文本库和特征库的规模,避免占用过多的系统资源。优选地,筛选出的正向历史文本和负向历史文本的数量应尽量接近。例如,可以选择例如8000个正向历史文本和8000个负向历史文本。
特征库中的特征只是用户输入过的文字,不同的特征对确定是否发出评价请求的贡献各不相同。需要对不同特征的作用进行估计。
在本发明的一个实施例中,通过权重值来表示特征对所述确定的作用。具体来讲,针对特征库中的某一特征x,通过以下公式来计算x的权重值w(x):
其中,m为正向历史文本的数量,Ti为第i个正向历史文本中的特征总数,Ai(x)为x在第i个正向历史文本中出现的次数,n为负向历史文本的数量,Sj为第j个负向历史文本中的特征总数,Bj(x)为x在第j个负向历史文本中出现的次数。可见,按如上公式计算出的权重值越高,说明其与好评结果有着更大的一致性,从而如果该特征在某一文本中出现的次数越多,便在一定程度上预示输入该文本的客户更有可能对相应的服务给予好评。
优选地,在针对特征库中的特征进行权重值计算之前,需要剔除掉其中的噪声特征。所述噪声特征包括冗余、不相关、对最终结果没有影响甚至有负向影响的特征,比如,助词(例如“的”、“了”、“吗”等)、相关商品名称、用户信息等。这些噪声特征是预先确定的,或者可通过预先确定的规则来遍历特征库,得到经过优化的特征库。
此外,为了进一步节约系统资源,并且提高效率,在应用已经计算过权重值的特征之前,还可以进一步对特征库中的特征进行选择,形成步骤S130中所提到的参考特征列表。当然,如果不考虑这一点,参考特征列表可以等同于整个特征库。
在一个实施例中,可以预先设定参考特征列表中参考特征的数量,比如2000。
优选地,所述参考特征列表可以是由所述特征库中具有较高权重值的特征组成的列表。比如,可以令特征库中权重值最高的前2000个特征组成参考特征列表。
备选地,所述参考特征列表可以是由所述特征库中具有最高权重值的特征和具有最低权重值的特征组成的列表。比如,可以令特征库中权重值最高的前1000个特征和权重值最低的前1000个特征组成参考特征列表。
需要指出的是,虽然上文中对参考特征列表的来由进行了描述,但本发明中的参考特征列表不限于此。任何包括参考特征与权重值对的参考特征列表都适用于本发明的技术方案。比如,本领域技术人员可以任意指定其认为能够反映用户对服务的评价的特征作为参考特征,并为该参考特征指定相应的权重值。
接下来,在步骤S140中,针对存在匹配的特征,根据与其匹配的参考特征的权重值确定该特征的权重值。在一个实施例中,将与存在匹配的特征相匹配的参考特征的权重值确定为该存在匹配的特征的权重值。
从而,在步骤S150中,基于所有存在匹配的特征的权重值,可以确定发出所述文本的所述网络用户的评价值。所述评价值是通过预先指定的运算规则从所有存在匹配的特征的权重值计算得到的。所述运算规则可以是四则运算,例如加法。
应该理解的是,所述运算规则还可以通过特定算法或程序来实现,本发明的发明人在实践中还采用中国台湾大学的Chih-Jen Lin博士开发的Liblinear工具实现算法,并进而得到所述评价值。
最后,在步骤S160中,在所述评价值大于阈值的情况下,确定向所述网络用户提出服务评价请求。优选地,所述阈值是预先指定的。此外,系统可以根据所述方法的结果随时对所述阈值进行更新。
关于图1所述的方法100,在一个实施例中,首先在步骤S110中接收用户输入的文本,当接收到用户针对特定问题的答复时,才开始进行后续步骤S120-S160。比如,系统可以在适当时刻向用户发出询问消息,例 如“请问,您还需要其他帮助吗?”。当用户针对该询问消息给出否定应答时,比如“不需要了!”,则系统此时开始执行后续步骤。
在另一实施例中,可以在不断地接收用户输入的文本的同时(即,人机对话的同时)针对已经接收到的部分文本进行步骤S120-S160中的一部分步骤,比如步骤S120-S140。在接收到足够的文本之后或在接收到如上所述针对特定问题的答复时,再执行步骤剩余步骤,比如步骤S150-S160。
在一个实施例中,可以在执行步骤S130之前,执行以下操作:将所述至少一个特征中的每一个与特定特征集合进行匹配;当所述至少一个特征中存在与所述特定特征集合中的特定特征匹配的特征时,确定向所述网络用户提出服务评价请求。
所述特定特征集合是预先制定的集合,该集合中的任一特征都足以预示用户将对服务给予好评,比如,所述集合中可包括“非常满意”、“十分感谢”等特征。当从用户接收的文本包括上述任一特征时,可以认为用户很有可能会对服务给予好评。从而,在此情况下,可以直接确定向所述网络用户提出服务评价请求,而不再执行剩余步骤S130-S160。
接下来,参见图2。图2示出了根据本发明的一种实施例的用于确定向网络用户进行服务评价请求的装置200的结构框图。所述装置200包括用户接口210、分割单元220和确定单元230。
所述用户接口210用于从所述网络用户接收至少一个评论消息,所述评论消息指示所述网络用户在用户端输入的文本。用户输入的文本包括用户输入的所有文字、表情、符号等,是用来判断用户是否满意以及进而是否向其发送评价请求的依据。
所述分割单元220用于将所述至少一个评论消息中的每一个中包括的文本分割成至少一个特征。特征是构成文本的元素,包括但不限于,字、词、词组、固定搭配等。
在一个实施例中,所述分割单元220采用常用的切词方法(比如n-gram切词方法)来分割,但应该理解的是,本发明中将文本分割成特征的方法不限于此。
所述确定单元230包括第一匹配模块232、权重值确定模块234、评价值确定模块236和判断模块238。
所述第一匹配模块232用于将所述至少一个特征中的每一个与参考特征列表中的参考特征进行匹配。参考特征列表是由经过预先选择的参考特征组成的列表,并且其中的每个参考特征具有相应的权重值。
所述权重值确定模块234用于针对存在匹配的特征,根据与其匹配的参考特征的权重值确定该特征的权重值。优选地,所述权重值确定模块234被配置为将与存在匹配的特征相匹配的参考特征的权重值确定为该存在匹配的特征的权重值。
所述评价值确定模块236用于基于所有存在匹配的特征的权重值,确定所述网络用户的评价值。优选地,所述评价值是通过预先指定的运算规则从所有存在匹配的特征的权重值计算得到的。所述运算规则可以是四则运算,例如加法。
所述判断模块238用于在所述评价值大于阈值的情况下,确定向所述网络用户提出服务评价请求。优选地,所述阈值是预先指定的。此外,系统可以根据所述方法的结果随时对所述阈值进行更新。
优选地,所述装置200还包括用于产生所述参考特征列表的组件。图3示出了根据本发明的一种优选实施例的用于确定向网络用户进行服务评价请求的装置300的结构框图。所述装置300还附加地包括存储单元240、计算单元250和列表生成单元260。
所述存储单元240用于存储历史文本库和特征库。其中,所述历史文本库存储历史文本,所述历史文本可以从例如系统日志、聊天记录等中收集。历史文本包括正向历史文本和负向历史文本。正向历史文本是由最终对相应服务做出积极评价的用户针对该相应服务输入的文本,即如果某一用户在收到评价请求后对某一服务给出了好评,则在其针对该服务进行咨询时所输入的文字便被认为是正向历史文本。相反地,负向历史文本是由最终对相应服务做出消极评价的用户针对该相应服务输入的文本,即如果某一用户在收到评价请求后对某一服务给出了差评,则在其针对该服务进行咨询时所输入的文字便被认为是负向历史文本。
特征库是通过对历史文本进行分割得到的特征组成。在使用本发明 所要求保护的装置之前,需要首先收集用户(所有用户或特定的部分用户,比如金牌及以上用户)在特定时间段(比如6个月)内的评论历史,并从中提取出所需的历史文本。通过分割单元(比如图2中的分割单元220)对这些历史文本进行分割,得到众多的特征(该过程如图3中的虚线所示)。然后,这些历史文本(历史文本库)和分割得到的特征(特征库)均被存储在存储单元240上。
所述计算单元250用于为所述特征库中的每个特征计算权重值。
优选地,所述计算单元250被配置为:针对特征库中的特征x,通过以下公式来计算x的权重值w(x):
其中,m为历史文本库中正向历史文本的数量,Ti为第i个正向历史文本中的特征总数,Ai(x)为x在第i个正向历史文本中出现的次数,n为历史文本库中负向历史文本的数量,Sj为第j个负向历史文本中的特征总数,Bj(x)为x在第j个负向历史文本中出现的次数。
所述列表生成单元260用于基于所述计算单元250的计算结果从特征库中的特征生成所述参考特征列表。优选地,所述列表生成单元260被配置为从所述特征库中选择具有较高权重值的特征组成所述参考特征列表。
优选地,在通过计算单元250对特征库中的特征进行权重值计算之前,需要剔除掉其中的噪声特征。所述噪声特征包括冗余、不相关、对最终结果没有影响甚至有负向影响的特征,比如,助词(例如“的”、“了”、“吗”等)、相关商品名称、用户信息等。这些噪声特征是预先确定的,或者可通过预先确定的规则来遍历特征库,得到经过优化的特征库。
在一种优选实施例中,所述确定单元230还可包括第二匹配模块。所述第二匹配模块被配置为将所述至少一个特征中的每一个与特定特征集合进行匹配。并且,所述判断模块238还被配置为:当所述至少一个特征中存在与所述特定特征集合中的特定特征匹配的特征时,确定向所述网络用户提出服务评价请求。
所述特定特征集合是预先制定的集合,该集合中的任一特征都足以 预示用户将对服务给予好评,比如,所述集合中可包括“非常满意”、“十分感谢”等特征。当从用户接收的文本包括上述任一特征时,可以认为用户很有可能会对服务给予好评。从而,在此情况下,可以直接确定向所述网络用户提出服务评价请求,而省略其他模块的后续操作。
在以上针对方法100和装置200和/或300分别进行描述的过程中,有可能只在针对方法100的描述(或针对装置200和/或300的描述)中对某些特征或细节有所提及。但应该理解的是,这些特征或细节同样适用于针对装置200和/或300的描述(或针对方法100的描述)。
尽管以上已经结合本发明的优选实施例示出了本发明,但是本领域的技术人员将会理解,在不脱离本发明的精神和范围的情况下,可以对本发明进行各种修改、替换和改变。因此,本发明不应由上述实施例来限定,而应由所附权利要求及其等价物来限定。

Claims (18)

1.一种用于确定向网络用户进行服务评价请求的方法,包括:
从所述网络用户接收至少一个评论消息,所述评论消息指示所述网络用户在用户端输入的文本;
将所述至少一个评论消息中的每一个中包括的文本分割成至少一个特征;
将所述至少一个特征中的每一个与参考特征列表中的参考特征进行匹配,所述参考特征列表中的每个参考特征具有权重值;
针对存在匹配的特征,根据与其匹配的参考特征的权重值确定该特征的权重值;
基于所有存在匹配的特征的权重值,确定所述网络用户的评价值;以及
在所述评价值大于阈值的情况下,确定向所述网络用户提出服务评价请求。
2.根据权利要求1所述的方法,其中,所述参考特征列表是由从特征库中选出的特征组成的列表,其中,所述特征库由对历史文本进行分割得到的特征组成,所述历史文本包括正向历史文本和负向历史文本,所述正向历史文本是由最终对相应服务做出积极评价的用户针对该相应服务输入的文本,所述负向历史文本是由最终对相应服务做出消极评价的用户针对该相应服务输入的文本。
3.根据权利要求2所述的方法,其中,针对特征库中的特征x,通过以下公式来计算x的权重值w(x):
<mrow> <mi>w</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>log</mi> <mn>2</mn> </msub> <mfrac> <mrow> <msub> <mi>A</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> </mrow> <msub> <mi>T</mi> <mi>i</mi> </msub> </mfrac> <mo>)</mo> </mrow> <mo>-</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>log</mi> <mn>2</mn> </msub> <mfrac> <mrow> <msub> <mi>B</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> </mrow> <msub> <mi>S</mi> <mi>j</mi> </msub> </mfrac> <mo>)</mo> </mrow> </mrow>
其中,m为正向历史文本的数量,Ti为第i个正向历史文本中的特征总数,Ai(x)为x在第i个正向历史文本中出现的次数,n为负向历史文本的数量,Sj为第j个负向历史文本中的特征总数,Bj(x)为x在第j个负向历史文本中出现的次数。
4.根据权利要求3所述的方法,其中,所述参考特征列表是由所述特征库中具有较高权重值的特征组成的列表。
5.根据权利要求2所述的方法,其中,所述特征库中滤除了噪声特征,所述噪声特征是预先指定的。
6.根据权利要求1所述的方法,其中,所述根据与其匹配的参考特征的权重值确定该特征的权重值包括:
将与存在匹配的特征相匹配的参考特征的权重值确定为该存在匹配的特征的权重值。
7.根据权利要求1所述的方法,其中,所述基于所有存在匹配的特征的权重值确定所述网络用户的评价值包括:
通过预先指定的运算规则,从所有存在匹配的特征的权重值计算出所述评价值。
8.根据权利要求1所述的方法,其中,所述阈值是预先指定的并且能够被更新。
9.根据权利要求1所述的方法,其中,在将所述至少一个特征中的每一个与参考特征列表中的参考特征进行匹配之前,所述方法还包括:
将所述至少一个特征中的每一个与特定特征集合进行匹配;
当所述至少一个特征中存在与所述特定特征集合中的特定特征匹配的特征时,确定向所述网络用户提出服务评价请求。
10.一种用于确定向网络用户进行服务评价请求的装置,包括:
用户接口,用于从所述网络用户接收至少一个评论消息,所述评论消息指示所述网络用户在用户端输入的文本;
分割单元,用于将所述至少一个评论消息中的每一个中包括的文本分割成至少一个特征;
确定单元,包括
第一匹配模块,用于将所述至少一个特征中的每一个与参考特征列表中的参考特征进行匹配,所述参考特征列表中的每个参考特征具有权重值;
权重值确定模块,用于针对存在匹配的特征,根据与其匹配的参考特征的权重值确定该特征的权重值;
评价值确定模块,用于基于所有存在匹配的特征的权重值,确定所述网络用户的评价值;以及
判断模块,在所述评价值大于阈值的情况下,确定向所述网络用户提出服务评价请求。
11.根据权利要求10所述的装置,还包括:
存储单元,用于存储历史文本库和特征库,其中所述历史文本库包括正向历史文本和负向历史文本,所述正向历史文本是由最终对相应服务做出积极评价的用户针对该相应服务输入的文本,所述负向历史文本是由最终对相应服务做出消极评价的用户针对该相应服务输入的文本,所述特征库包括对所述历史文本库中的历史文本进行分割得到的特征;
计算单元,用于为所述特征库中的每个特征计算权重值;
列表生成单元,用于基于所述计算单元的计算结果,从特征库中的特征生成所述参考特征列表。
12.根据权利要求11所述的装置,其中,所述计算单元被配置为:
针对特征库中的特征x,通过以下公式来计算x的权重值w(x):
<mrow> <mi>w</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>log</mi> <mn>2</mn> </msub> <mfrac> <mrow> <msub> <mi>A</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> </mrow> <msub> <mi>T</mi> <mi>i</mi> </msub> </mfrac> <mo>)</mo> </mrow> <mo>-</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>log</mi> <mn>2</mn> </msub> <mfrac> <mrow> <msub> <mi>B</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> </mrow> <msub> <mi>S</mi> <mi>j</mi> </msub> </mfrac> <mo>)</mo> </mrow> </mrow>
其中,m为历史文本库中正向历史文本的数量,Ti为第i个正向历史文本中的特征总数,Ai(x)为x在第i个正向历史文本中出现的次数,n为历史文本库中负向历史文本的数量,Sj为第j个负向历史文本中的特征总数,Bj(x)为x在第j个负向历史文本中出现的次数。
13.根据权利要求11所述的装置,其中,所述列表生成单元被配置为从所述特征库中选择具有较高权重值的特征组成所述参考特征列表。
14.根据权利要求11所述的装置,其中,所述特征库中滤除了噪声特征,所述噪声特征是预先指定的。
15.根据权利要求10所述的装置,其中,所述权重值确定模块被配置为:
将与存在匹配的特征相匹配的参考特征的权重值确定为该存在匹配的特征的权重值。
16.根据权利要求10所述的装置,其中,所述评价值确定模块被配置为:
通过预先指定的运算规则,从所有存在匹配的特征的权重值计算出所述评价值。
17.根据权利要求10所述的装置,其中,所述阈值是预先指定的并且能够被更新。
18.根据权利要求10所述的装置,其中,所述确定单元还包括第二匹配模块,所述第二匹配模块被配置为将所述至少一个特征中的每一个与特定特征集合进行匹配,并且所述判断模块还被配置为:当所述至少一个特征中存在与所述特定特征集合中的特定特征匹配的特征时,确定向所述网络用户提出服务评价请求。
CN201610279975.1A 2016-04-29 2016-04-29 用于确定向网络用户进行服务评价请求的方法、装置和计算机可读存储介质 Active CN107342879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610279975.1A CN107342879B (zh) 2016-04-29 2016-04-29 用于确定向网络用户进行服务评价请求的方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610279975.1A CN107342879B (zh) 2016-04-29 2016-04-29 用于确定向网络用户进行服务评价请求的方法、装置和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN107342879A true CN107342879A (zh) 2017-11-10
CN107342879B CN107342879B (zh) 2020-06-05

Family

ID=60221837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610279975.1A Active CN107342879B (zh) 2016-04-29 2016-04-29 用于确定向网络用户进行服务评价请求的方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN107342879B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112866492A (zh) * 2019-11-26 2021-05-28 北京沃东天骏信息技术有限公司 一种智能邀评的方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103200277A (zh) * 2013-04-24 2013-07-10 东南大学 一种基于日志的云计算服务可信度评估方法
CN103870973A (zh) * 2012-12-13 2014-06-18 阿里巴巴集团控股有限公司 基于电子信息的关键词提取的信息推送、搜索方法及装置
CN104574126A (zh) * 2013-10-17 2015-04-29 阿里巴巴集团控股有限公司 一种用户特征识别方法及装置
CN105260815A (zh) * 2015-09-18 2016-01-20 国网辽宁省电力有限公司鞍山供电公司 基于大数据的电力系统缴费渠道评价方法
CN105512335A (zh) * 2015-12-29 2016-04-20 腾讯科技(深圳)有限公司 一种摘要搜索方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870973A (zh) * 2012-12-13 2014-06-18 阿里巴巴集团控股有限公司 基于电子信息的关键词提取的信息推送、搜索方法及装置
CN103200277A (zh) * 2013-04-24 2013-07-10 东南大学 一种基于日志的云计算服务可信度评估方法
CN104574126A (zh) * 2013-10-17 2015-04-29 阿里巴巴集团控股有限公司 一种用户特征识别方法及装置
CN105260815A (zh) * 2015-09-18 2016-01-20 国网辽宁省电力有限公司鞍山供电公司 基于大数据的电力系统缴费渠道评价方法
CN105512335A (zh) * 2015-12-29 2016-04-20 腾讯科技(深圳)有限公司 一种摘要搜索方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112866492A (zh) * 2019-11-26 2021-05-28 北京沃东天骏信息技术有限公司 一种智能邀评的方法和装置

Also Published As

Publication number Publication date
CN107342879B (zh) 2020-06-05

Similar Documents

Publication Publication Date Title
US11659050B2 (en) Discovering signature of electronic social networks
CN104778173B (zh) 目标用户确定方法、装置及设备
CN102708131B (zh) 将消费者自动分类到微细分中
Krauss et al. Predicting movie success and academy awards through sentiment and social network analysis
CN110266745B (zh) 基于深度网络的信息流推荐方法、装置、设备及存储介质
CN108073568A (zh) 关键词提取方法和装置
US9223775B2 (en) User question processing method and system
EP2960849A1 (en) Method and system for recommending an item to a user
CN102789449B (zh) 对评论文本进行评价的方法和装置
CN110971659A (zh) 推荐消息的推送方法、装置及存储介质
CN108269125A (zh) 评论信息质量评估方法及系统、评论信息处理方法及系统
CN110334356A (zh) 文章质量的确定方法、文章筛选方法、以及相应的装置
CN110633410A (zh) 信息处理方法及装置、存储介质、电子装置
Wang et al. Boosting election prediction accuracy by crowd wisdom on social forums
Elbaghazaoui et al. Data profiling and machine learning to identify influencers from social media platforms
Krause et al. To play or not to play: Interactions between response quality and task complexity in games and paid crowdsourcing
CN107342879A (zh) 用于确定向网络用户进行服务评价请求的方法和装置
CN116049549A (zh) 一种基于多粒度特征融合的活动推荐方法
CN114548263A (zh) 标注数据的校验方法、装置、计算机设备及存储介质
AĞCA ANALYZING VIDEO GAME CONTENT AND SENTIMENT: A STUDY ON CATEGORIES, EMOTIONAL RESPONSES, AND SUCCESS FACTORS
CN111859146A (zh) 信息挖掘方法、装置及电子设备
US20130191113A1 (en) User opinion extraction method using social network
De Kock et al. Survival text regression for time-to-event prediction in conversations
Timm et al. Dynamic analysis of communication processes using twitter data
Chen et al. Identifying high-quality chinese news comments based on multi-target text matching model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant