CN103678720B - 用户反馈数据处理方法和装置 - Google Patents

用户反馈数据处理方法和装置 Download PDF

Info

Publication number
CN103678720B
CN103678720B CN201410001108.2A CN201410001108A CN103678720B CN 103678720 B CN103678720 B CN 103678720B CN 201410001108 A CN201410001108 A CN 201410001108A CN 103678720 B CN103678720 B CN 103678720B
Authority
CN
China
Prior art keywords
sentence
user
emotion
word
feedback data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410001108.2A
Other languages
English (en)
Other versions
CN103678720A (zh
Inventor
蔡华利
康键
崔艳武
吴芳
王立志
杨利飞
刘碧松
许应成
杨跃翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China National Institute of Standardization
Original Assignee
China National Institute of Standardization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China National Institute of Standardization filed Critical China National Institute of Standardization
Priority to CN201410001108.2A priority Critical patent/CN103678720B/zh
Publication of CN103678720A publication Critical patent/CN103678720A/zh
Application granted granted Critical
Publication of CN103678720B publication Critical patent/CN103678720B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及信息处理领域,具体而言,涉及用户反馈数据处理方法及和装置。该方法,包括:利用标点符号对用户反馈数据进行切分;以每一个切分得到的语句为单位,进行操作:按照关键词词库对所述语句进行筛选处理,得到语句中包含的关键词,按照主题标签树,将包含关键词的设定级标签的标识度T加1,按照用户情感词库对经过筛选处理的所述语句进行处理,确定语句的情感,根据语句的情感确定设定级标签的极性,并将极性值加1,极性包括:批评P、表扬B、建议J;当所有切分得到的语句均进行以上操作后,根据每一个设定级标签的标识度T和P、B、J计算批评率、表扬率、建议率,得到处理结果。本发明处理数据快速、方便。

Description

用户反馈数据处理方法和装置
技术领域
本发明涉及信息处理领域,具体而言,涉及用户反馈数据处理方法和装置。
背景技术
很多企业在售出产品或者服务后,会接到消费者大量的反馈意见。这些意见中,有的是表扬或者认可的,有的是批评或者抱怨的,还有一部分是即包括表扬又包括批评的,这些意见是实现企业信息闭环、提高产品/服务质量的最好的信息源。然而,随着企业销售量的不断增加,会积累海量的意见数据,现有技术中,只能通过人为进行逐条辨别,费时又费力,导致企业基本没有利用好这部分反馈数据。
发明内容
本发明的目的在于提供用户反馈数据处理方法和装置,以解决用户反馈数据难以快速处理的问题。
在本发明的实施例中提供了一种用户反馈数据处理方法,包括:
利用标点符号对用户反馈数据进行切分;
以每一个切分得到的语句为处理单位,进行如下操作:
按照预先构建的关键词词库对所述语句进行筛选处理,得到所述语句中包含的关键词,
按照预先构建的主题标签树,将包含所述关键词的设定级标签的标识度T加1,
按照预先构建的用户情感词库对经过筛选处理的所述语句进行处理,确定所述语句的情感,根据所述语句的情感确定所述设定级标签的极性,并将所述极性值加1,所述极性包括:批评P、表扬B、建议J;
当所有切分得到的语句均进行以上操作后,根据所述用户反馈数据中对应的每一个所述设定级标签的标识度T和P、B、J,按照批评率=P/T×100%,表扬率=B/T×100%,建议率=J/T×100%分别计算,得到处理结果,所述处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
在一些实施例中,优选为,所述标点符号包括以下任一种:句号、分号、感叹号。
在一些实施例中,优选为,所述关键词词库的预先构建包括:采集用户评价文本;抽取所述用户评价文本中的形容词、动词、象声词,构成关键词词库。
在一些实施例中,优选为,所述主题标签树的预先构建包括:采集用户评价文本;提取所述用户评价文本中的特征词;根据预设的主题类别分类体系,构建包含所述特征词的主题标签树。
在一些实施例中,优选为,所述用户情感词库的预先构建包括:采集用户评价文本;根据情感词库对所述用户评价文本进行提取情感词;将所有提取的情感词构成用户情感词库。
在一些实施例中,优选为,所述语句的情感的确定包括:按照预先设置的用户情感词库对所述语句进行处理;如果所述语句中含有否定词,则,定义所述语句的情感为批评;如果所述语句中不含有否定词,含有表扬词,则,定义该语句的情感为表扬;如果所述语句中不含有否定词,含有建议词,则,定义该语句的情感为建议;
所述设定级标签的极性的确定包括:当所述语句的情感为批评时,所述设定级标签的极性确定为批评;当所述语句的情感为表扬时,所述设定级标签的极性确定为表扬;当所述语句的情感为建议时,所述设定级标签的极性确定为建议。
本发明实施例中提供了一种上述用户反馈数据处理方法的用户反馈数据处理装置,包括:
切分模块,用于利用标点符号对用户反馈数据进行切分;
筛选模块,用于按照预先构建的关键词词库对所述语句进行筛选处理,得到所述语句中包含的关键词;
标识度生成模块,用于按照预先构建的主题标签树,将包含所述关键词的设定级标签的标识度T加1;
情感生成模块,用于按照预先构建的用户情感词库对经过筛选处理的所述语句进行处理,确定所述语句的情感;
极性生成模块,用于根据所述语句的情感确定所述设定级标签的极性,并将所述极性值加1,所述极性包括:批评P、表扬B、建议J;
处理结果生成模块,用于当所有切分得到的语句均进行以上操作后,根据所述用户反馈数据中对应的每一个所述设定级标签的标识度T和P、B、J,按照批评率=P/T×100%,表扬率=B/T×100%,建议率=J/T×100%分别计算,得到处理结果,所述处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
在一些实施例中,优选为,所述筛选模块包括:第一采集单元,用于采集用户评价文本;抽取单元,用于抽取所述用户评价文本中的形容词、动词、象声词,构成关键词词库。
在一些实施例中,优选为,所述标识度生成模块包括:第二采集单元,用于采集用户评价文本;第二提取单元,用于提取所述用户评价文本中的特征词;第二构建单元,用于根据预设的主题类别分类体系,构建包含所述特征词的主题标签树。
在一些实施例中,优选为,所述情感生成模块包括:第三采集单元,用于采集用户评价文本;第三提取单元,用于根据情感词库对所述用户评价文本进行提取情感词;第三构建单元,用于将所有提取的情感词构成用户情感词库。
本发明实施例提供的用户反馈数据处理方法和装置,与现有技术相比,对用户反馈数据进行切分,对切分的语句进行处理,先提取语句中的关键词,根据关键词获取包含关键词的设定级标签,并改变设定级标签的标识度;同时采用用户情感词库对语句中的情感进行分析,获取设定级标签的极性。然后通过计算公式能够得出用户反馈数据中包含的批评率、表扬率、建议率,完成用户反馈数据的处理结果。通过该方法能够处理上万条用户反馈数据,操作简单,处理方便、实用。
附图说明
图1为本发明一个实施例中用户反馈数据处理方法的制备示意图;
图2为本发明一个实施例中用户反馈数据处理装置的结构示意图。
具体实施方式
下面通过具体的实施例子并结合附图对本发明做进一步的详细描述。
考虑到众多用户反馈数据没有被处理,本发明提供一个用户反馈数据的处理方法。
本发明实施例提供的用户反馈数据处理方法,包括:
利用标点符号对用户反馈数据进行切分;
以每一个切分得到的语句为处理单位,进行如下操作:
按照预先构建的关键词词库对语句进行筛选处理,得到语句中包含的关键词,
按照预先构建的主题标签树,将包含关键词的设定级标签的标识度T加1,
按照预先构建的用户情感词库对经过筛选处理的语句进行处理,确定语句的情感,根据语句的情感确定设定级标签的极性,并将极性值加1,极性包括:批评P、表扬B、建议J;
当所有切分得到的语句均进行以上操作后,根据用户反馈数据中对应的每一个设定级标签的标识度T和P、B、J,按照批评率=P/T×100%,表扬率=B/T×100%,建议率=J/T×100%分别计算,得到处理结果,处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
对应上述用户反馈数据处理方法的用户反馈数据处理装置,包括:
切分模块,用于利用标点符号对用户反馈数据进行切分;
筛选模块,用于按照预先构建的关键词词库对语句进行筛选处理,得到语句中包含的关键词;
标识度生成模块,用于按照预先构建的主题标签树,将包含关键词的设定级标签的标识度T加1;
情感生成模块,用于按照预先构建的用户情感词库对经过筛选处理的语句进行处理,确定语句的情感;
极性生成模块,用于根据语句的情感确定设定级标签的极性,并将极性值加1,极性包括:批评P、表扬B、建议J;
处理结果生成模块,用于当所有切分得到的语句均进行以上操作后,根据用户反馈数据中对应的每一个设定级标签的标识度T和P、B、J,按照批评率=P/T×100%,表扬率=B/T×100%,建议率=J/T×100%分别计算,得到处理结果,处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
对用户反馈数据进行切分,对切分的语句进行处理,先提取语句中的关键词,根据关键词获取包含关键词的设定级标签,并改变设定级标签的标识度;同时采用用户情感词库对语句中的情感进行分析,获取设定级标签的极性。然后通过计算公式能够得出用户反馈数据中包含的批评率、表扬率、建议率,完成用户反馈数据的处理结果。通过该方法能够处理上万条用户反馈数据,操作简单,处理方便、实用。
接下来,本发明将详细描述该用户反馈数据处理方法,具体为,如图1所示:
步骤102,构建关键词词库;
考虑到后续需要从用户反馈数据处理需要提取关键词,而目前,已有的许多关键词词库并不符合用户反馈数据处理的需要,针对性差,提取的关键词不符合要求,因此,本发明针对服务、产品产生的用户评价进行提取构成关键词数据库,提高用户反馈数据处理中关键词数据库的针对性、准确程度。比如:对冰箱来说“滴滴声”,则是说明冰箱出现了问题,但是,在普通的词库中则作为一个普通的象声词处理。
具体包括:
采集用户评价文本;
抽取用户评价文本中的形容词、动词、象声词,构成关键词词库。
之所以抽取形容词、动词、象声词,是充分考虑了用户在描述某一项服务、某一个产品的使用效果时,通常会采用形容的词汇、象声词、以及动作类词来描述,因此,这种提取的关键词较为准确和全面。
步骤104,构建主题标签树;
考虑用户的反馈内容是多样化的,内容繁杂,有时一个相同的问题会出现多种表达的方式,因此,需要对多种表达进行汇总,且总结出一个合理的概括性主题,并将概括性的主题进行分层管理,形成标签树。
同时又鉴于目前的多种标签树仅是针对大众化来使用,无关于产品或服务的标签树,造成通过关键词找寻相应标签树时无所依从,因此,需要根据客户的评价文本建立针对性更强的主题标签树,并且需要将其中一级的标签树定义为标识级标签树,从而,在后续数据处理过程中进行标识度的增加,以便后续做批评率,表扬率,建议率的计算。构建主题标签书的具体操作为:
采集用户评价文本;
提取用户评价文本中的特征词;
根据预设的主题类别分类体系,构建包含特征词的主题标签树。
以电视为例,其标签树的一部分如表1:
表1电视领域产品使用方便的标签树
注:
1、一个顿号代表一个关键词;2、带有@@的是说必须前后组合关键词才可以作为一个关键词,如“说明书@@介绍”中,只提“介绍”不能归类到说明书的“说明书容易理解”,必须与“说明书”进行关联才可以。
步骤106,构建用户情感词库;
考虑到用户的反馈数据是用户针对服务或针对产品的语言反馈,其中包含了众多的情感表达词,这些词中包含了用户对服务或产品的情绪,包括批评、表扬、建议;而这些情绪的表达是多样性的,需要进行汇总,以达到尽可能全面覆盖。
同时,也要考虑到目前现有的情感词库毕竟是大众化的使用工具,具备普遍性,但不具备针对性,需要针对服务的情绪表达词、针对产品使用的情绪表达词具备独特性,通过分析用户评价文本将这些具备独特性的词也进行汇总,才能构建针对性强、准确度高、覆盖面广的用户情感词库。
具体操作为:
采集用户评价文本;
根据情感词库对用户评价文本进行提取情感词;
将所有提取的情感词构成用户情感词库。
步骤108,获取用户反馈数据;
该用户反馈数据来自用户对产品、或用户的反馈数据。这些反馈数据以文本形式存在。
比如:“我于今年2月16日购买了一台BCD-225SKCM冰箱,18日下午货送到后,发现冷冻室的玻璃面板全面破碎,致电售后,售后给予极大关注,并于19日下午上门鉴定,开具鉴定书。当天下午我把鉴定书送达商场,商场答应换机。20日上午,新机送到,开箱检验发现,冷藏室的玻璃面板显要处有苍蝇大小的凹处。售后于21日上午上门鉴定并开具鉴定书。家庭内部经过商量,决定更换卡萨帝318WSL,我于下午把鉴定书送达商场并补交货款。23日下午货送到后,根据预约售后上门安装,到此整个流程基本结束。本次购买活动损失也很大,首先是我们全家的生活和心理受到影响,其次冰箱搬来搬去商家或厂家运输费用的损失。”
步骤110,利用标点符号对用户反馈数据进行切分;
考虑到后续处理的语句必须是能够完整表达一个意思,因此,标点符号包括:分号、顿号、句号,通过这些标点符号对用户反馈数据进行切分,能够得到多个意思完整的语句。
基于上述各步骤开始对切分的每一个语句进行如下处理,需要强调的是,以每一个切分得到的语句为处理单位进行操作:
步骤112-2,按照预先构建的关键词词库对切分的语句进行筛选处理,得到语句中包含的关键词,
关键词是语句中普遍含有的,因为关键词最贴近服务、产品使用效果、具体情况的表达,是用户认为最直接的描述,因此,先从筛选关键词来处理用户反馈数据,不会出现信息的遗漏,并且更加准确。
步骤112-4,按照预先构建的主题标签树,将包含关键词的设定级标签的标识度T加1;
如上文表达,关键词是千变万化的,较为复杂,且不统一,因此,需要对筛选出关键词找寻其所属的标签链,并对设定级标签的标识度加1,相当于对用户反馈数据中的信息进行了系统化、上位性标定,注明该设定级标签反应的主题被用户提到。
步骤112-6,按照预先构建的用户情感词库对经过筛选处理的语句进行处理,确定语句的情感;
接下来,需要挑出用户反馈数据中的情感表达词,以表明用户真正要表达的情绪:批评、或表扬、或建议。
此处,需要考虑到有些用户出于对服务提供商或产品提供商付出辛勤劳动的体量,或者鉴于其他的压力,通常会表扬一下,但是,随后则是一些批评或建议,而这些批评或建议才是用户真正要表达的内容,是真正的情绪表达,因此,在确定语句的情感时,需要进行如下的操作:
按照预先设置的用户情感词库对语句进行处理;
如果语句中含有否定词,则,定义语句的情感为批评;
如果语句中不含有否定词,并含有表扬词,则,定义该语句的情感为表扬;
如果语句中不含有否定词,并含有建议词,则,定义该语句的情感为建议。
也就是说,有批评则“一票否决”制。
步骤112-8,根据语句的情感确定设定级标签的极性,并将极性值加1,极性包括:批评P、表扬B、建议J;
语句的情感表达是一种广泛性概括,对数据处理来说还不具有统计效果,因此,需要将语句的情感反应到设定级标签的极性上,设定级标签的极性依从于语句的情感,当语句的情感为批评时,设定级标签的极性则定义为批评,当语句的情感为表扬时,设定级标签的极性则定义为表扬,当语句的情感为建议时,设定级标签的极性则定义为建议。
且鉴于同一个设定级标签会在一个完整的用户情感词库中多次出现,但每次出现呈现的极性有可能不同,因此,将设定级标签的极性分为,批评P、表扬B、建议J。P、B、J可以根据相应情况进行增加。比如,语句的情感是批评,则对应该语句的设定级标签的极性--批评P+1;如果语句的情感是表扬,则对应该语句的设定级标签的极性—表扬B+1;建议J雷同处理。
步骤112-10,输出该语句;
输出该语句是为了方便查找用户具体的反馈信息。
通过该操作能够对统计性处理数据做完善,呈现更直接的表达。
需要说明的是,鉴于对用户数据处理的主要目的是改进服务,改进产品特性,因此,更加注重批评情绪的语句,所以,为了更加节省语句的阅读时间,可以仅在语句的情感为批评或建议时输出该语句。
步骤114,当所有切分得到的语句均进行以上操作后,根据用户反馈数据中对应的每一个设定级标签的标识度T和P、B、J,计算批评率、表扬率、建议率;
T、P、B、J均是设定级标签在用户反馈数据完整处理后获取的值。
考虑到用户反馈数据处理需要给出一个相对概括性的处理结果,因此,在计算了T、P、B、J后,还需要进行更加统计性的计算,得出整体批评率、表扬率、建议率。
批评率的计算方式为:批评率=P/T×100%,表扬率=B/T×100%,建议率=J/T×100%。
最后得出的用户反馈数据处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。如表2:
表2用户反馈数据处理结果
标识级标签 T(个) B(个) 表扬率(%) P(个) 批评率(%)
电话中心服务 235 46 19.57 114 48.51
服务及时性 323 77 23.84 175 54.18
培训服务规范 395 228 57.72 158 40
投诉处理 98 2 2.04 96 97.96
备件 42 6 14.29 30 71.43
收费服务 132 32 24.24 63 47.73
延保增值 33 8 24.24 15 45.45
用户服务体验 174 70 40.23 71 40.80
废旧家电服务 29 15 51.72 14 48.28
鉴于每一个方法均需要一个执行的系统或装置,本发明也是,本发明的用户反馈数据处理装置可以为一个处理芯片。如图2所示,具体包括:
切分模块02,用于利用标点符号对用户反馈数据进行切分;
筛选模块04,用于按照预先构建的关键词词库对语句进行筛选处理,得到语句中包含的关键词;
标识度生成模块06,用于按照预先构建的主题标签树,将包含关键词的设定级标签的标识度T加1;
情感生成模块08,用于按照预先构建的用户情感词库对经过筛选处理的语句进行处理,确定语句的情感;
极性生成模块010,用于根据语句的情感确定设定级标签的极性,并将极性值加1,极性包括:批评P、表扬B、建议J;
处理结果生成模块012,用于当所有切分得到的语句均进行以上操作后,根据用户反馈数据中对应的每一个设定级标签的标识度T和P、B、J,按照批评率=P/T×100%,表扬率=B/T×100%,建议率=J/T×100%分别计算,得到处理结果,处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
其中,筛选模块包括:第一采集单元,用于采集用户评价文本;抽取单元,用于抽取用户评价文本中的形容词、动词、象声词,构成关键词词库。
其中,标识度生成模块包括:第二采集单元,用于采集用户评价文本;第二提取单元,用于提取用户评价文本中的特征词;第二构建单元,用于根据预设的主题类别分类体系,构建包含特征词的主题标签树。
其中,情感生成模块包括:第三采集单元,用于采集用户评价文本;第三提取单元,用于根据情感词库对用户评价文本进行提取情感词;第三构建单元,用于将所有提取的情感词构成用户情感词库。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用户反馈数据处理方法,其特征在于,包括:
利用标点符号对用户反馈数据进行切分;
以每一个切分得到的语句为处理单位,进行如下操作:
按照预先构建的关键词词库对所述语句进行筛选处理,得到所述语句中包含的关键词,所述关键词词库包括:用户评价文本中的形容词、动词、象声词,
按照预先构建的主题标签树,对语句中筛选出的关键词找寻所属标签链,包含所述关键词的设定级标签的标识度T加1,
按照预先构建的用户情感词库对经过筛选处理的所述语句进行处理,确定所述语句的情感,所述语句的情感的确定包括:按照预先设置的用户情感词库对所述语句进行处理;如果所述语句中含有否定词,则,定义所述语句的情感为批评;如果所述语句中不含有否定词,并含有表扬词,则,定义该语句的情感为表扬;如果所述语句中不含有否定词,并含有建议词,则,定义该语句的情感为建议;
根据所述语句的情感确定所述设定级标签的极性,并将所述极性值加1,所述极性包括:批评P、表扬B、建议J;
当所有切分得到的语句均进行以上操作后,根据所述用户反馈数据中对应的每一个所述设定级标签的标识度T终和P终、B终、J终,按照批评率=P终/T终×100%,表扬率=B终/T终×100%,建议率=J终/T终×100%分别计算,得到处理结果,所述处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
2.根据权利要求1所述的用户反馈数据处理方法,其特征在于,所述标点符号包括以下任一种:句号、分号、感叹号。
3.根据权利要求1所述的用户反馈数据处理方法,其特征在于,所述关键词词库的预先构建包括:
采集用户评价文本;
抽取所述用户评价文本中的形容词、动词、象声词,构成关键词词库。
4.根据权利要求1所述的用户反馈数据处理方法,其特征在于,所述主题标签树的预先构建包括:
采集用户评价文本;
提取所述用户评价文本中的特征词;
根据预设的主题类别分类体系,构建包含所述特征词的主题标签树。
5.根据权利要求1所述的用户反馈数据处理方法,其特征在于,所述用户情感词库的预先构建包括:
采集用户评价文本;
根据情感词库对所述用户评价文本进行提取情感词;
将所有提取的情感词构成用户情感词库。
6.根据权利要求1-5任一项所述的用户反馈数据处理方法,其特征在于,
所述语句的情感的确定包括:按照预先设置的用户情感词库对所述语句进行处理;如果所述语句中含有否定词,则,定义所述语句的情感为批评;如果所述语句中不含有否定词,并含有表扬词,则,定义该语句的情感为表扬;如果所述语句中不含有否定词,并含有建议词,则,定义该语句的情感为建议;
所述设定级标签的极性的确定包括:当所述语句的情感为批评时,所述设定级标签的极性确定为批评;当所述语句的情感为表扬时,所述设定级标签的极性确定为表扬;当所述语句的情感为建议时,所述设定级标签的极性确定为建议。
7.一种权利要求1-6任一项所述的用户反馈数据处理方法的用户反馈数据处理装置,其特征在于,包括:
切分模块,用于利用标点符号对用户反馈数据进行切分;
筛选模块,用于按照预先构建的关键词词库对所述语句进行筛选处理,得到所述语句中包含的关键词,所述关键词词库包括:用户评价文本中的形容词、动词、象声词;
标识度生成模块,用于按照预先构建的主题标签树,对语句中筛选出的关键词找寻所属标签链,将包含所述关键词的设定级标签的标识度T加1;
情感生成模块,用于按照预先构建的用户情感词库对经过筛选处理的所述语句进行处理,确定所述语句的情感,所述语句的情感的确定包括:按照预先设置的用户情感词库对所述语句进行处理;如果所述语句中含有否定词,则,定义所述语句的情感为批评;如果所述语句中不含有否定词,并含有表扬词,则,定义该语句的情感为表扬;如果所述语句中不含有否定词,并含有建议词,则,定义该语句的情感为建议;
极性生成模块,用于根据所述语句的情感确定所述设定级标签的极性,并将所述极性值加1,所述极性包括:批评P、表扬B、建议J;
处理结果生成模块,用于当所有切分得到的语句均进行以上操作后,根据所述用户反馈数据中对应的每一个所述设定级标签的标识度T终和P终、B终、J终,按照批评率=P终/T终×100%,表扬率=B终/T终×100%,建议率=J终/T终×100%分别计算,得到处理结果,所述处理结果包括:所有设定级标签和所有设定级标签的批评率、表扬率、建议率。
8.根据权利要求7所述的用户反馈数据处理装置,其特征在于,所述筛选模块包括:
第一采集单元,用于采集用户评价文本;
抽取单元,用于抽取所述用户评价文本中的形容词、动词、象声词,构成关键词词库。
9.根据权利要求7所述的用户反馈数据处理装置,其特征在于,所述标识度生成模块包括:
第二采集单元,用于采集用户评价文本;
第二提取单元,用于提取所述用户评价文本中的特征词;
第二构建单元,用于根据预设的主题类别分类体系,构建包含所述特征词的主题标签树。
10.根据权利要求7-9任一项所述的用户反馈数据处理装置,其特征在于,所述情感生成模块包括:
第三采集单元,用于采集用户评价文本;
第三提取单元,用于根据情感词库对所述用户评价文本进行提取情感词;
第三构建单元,用于将所有提取的情感词构成用户情感词库。
CN201410001108.2A 2014-01-02 2014-01-02 用户反馈数据处理方法和装置 Expired - Fee Related CN103678720B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410001108.2A CN103678720B (zh) 2014-01-02 2014-01-02 用户反馈数据处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410001108.2A CN103678720B (zh) 2014-01-02 2014-01-02 用户反馈数据处理方法和装置

Publications (2)

Publication Number Publication Date
CN103678720A CN103678720A (zh) 2014-03-26
CN103678720B true CN103678720B (zh) 2017-02-22

Family

ID=50316264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410001108.2A Expired - Fee Related CN103678720B (zh) 2014-01-02 2014-01-02 用户反馈数据处理方法和装置

Country Status (1)

Country Link
CN (1) CN103678720B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528519B (zh) * 2015-09-09 2019-04-30 佳能信息技术(北京)有限公司 文本挖掘的方法和装置
CN107305567A (zh) * 2016-04-21 2017-10-31 北京智能管家科技有限公司 一种基于双层trie树的语句查询方法及装置
CN109145301B (zh) * 2018-08-29 2023-01-24 上海汽车集团股份有限公司 信息分类方法及装置、计算机可读存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127042A (zh) * 2007-09-21 2008-02-20 浙江大学 一种基于语言模型的情感分类方法
CN101634983A (zh) * 2008-07-21 2010-01-27 华为技术有限公司 一种文本分类方法和装置
CN102073687A (zh) * 2010-12-21 2011-05-25 上海莱希信息科技有限公司 通过文本倾向性分析鉴别客户服务质量的方法和装置
CN102385579A (zh) * 2010-08-30 2012-03-21 腾讯科技(深圳)有限公司 互联网信息分类方法和系统
CN102682130A (zh) * 2012-05-17 2012-09-19 苏州大学 一种文本情感分类方法及系统
CN102682124A (zh) * 2012-05-16 2012-09-19 苏州大学 一种文本的情感分类方法及装置
CN102708164A (zh) * 2012-04-26 2012-10-03 苏州大学 电影期望值的计算方法及系统
EP2515242A2 (en) * 2011-04-21 2012-10-24 Palo Alto Research Center Incorporated Incorporating lexicon knowledge to improve sentiment classification
CN102929861A (zh) * 2012-10-22 2013-02-13 杭州东信北邮信息技术有限公司 一种文本情感指数计算方法和系统
CN103034626A (zh) * 2012-12-26 2013-04-10 上海交通大学 情感分析系统及方法
CN103049435A (zh) * 2013-01-04 2013-04-17 浙江工商大学 文本细粒度情感分析方法及装置
CN103116637A (zh) * 2013-02-08 2013-05-22 无锡南理工科技发展有限公司 一种面向中文Web评论的文本情感分类方法
CN103123620A (zh) * 2012-12-11 2013-05-29 中国互联网新闻中心 一种基于命题逻辑的网络文本情感分析方法
CN103150367A (zh) * 2013-03-07 2013-06-12 宁波成电泰克电子信息技术发展有限公司 一种中文微博的情感倾向分析方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127042A (zh) * 2007-09-21 2008-02-20 浙江大学 一种基于语言模型的情感分类方法
CN101634983A (zh) * 2008-07-21 2010-01-27 华为技术有限公司 一种文本分类方法和装置
CN102385579A (zh) * 2010-08-30 2012-03-21 腾讯科技(深圳)有限公司 互联网信息分类方法和系统
CN102073687A (zh) * 2010-12-21 2011-05-25 上海莱希信息科技有限公司 通过文本倾向性分析鉴别客户服务质量的方法和装置
EP2515242A2 (en) * 2011-04-21 2012-10-24 Palo Alto Research Center Incorporated Incorporating lexicon knowledge to improve sentiment classification
CN102708164A (zh) * 2012-04-26 2012-10-03 苏州大学 电影期望值的计算方法及系统
CN102682124A (zh) * 2012-05-16 2012-09-19 苏州大学 一种文本的情感分类方法及装置
CN102682130A (zh) * 2012-05-17 2012-09-19 苏州大学 一种文本情感分类方法及系统
CN102929861A (zh) * 2012-10-22 2013-02-13 杭州东信北邮信息技术有限公司 一种文本情感指数计算方法和系统
CN103123620A (zh) * 2012-12-11 2013-05-29 中国互联网新闻中心 一种基于命题逻辑的网络文本情感分析方法
CN103034626A (zh) * 2012-12-26 2013-04-10 上海交通大学 情感分析系统及方法
CN103049435A (zh) * 2013-01-04 2013-04-17 浙江工商大学 文本细粒度情感分析方法及装置
CN103116637A (zh) * 2013-02-08 2013-05-22 无锡南理工科技发展有限公司 一种面向中文Web评论的文本情感分类方法
CN103150367A (zh) * 2013-03-07 2013-06-12 宁波成电泰克电子信息技术发展有限公司 一种中文微博的情感倾向分析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
中文微博情感分析技术研究;喻琦;《中国优秀硕士学位论文全文数据库 信息科技辑》;20130915(第09期);I138-526 *
产品评论的意见倾向分类技术研究;苏庭波;《中国优秀硕士学位论文全文数据库 信息科技辑》;20111215(第12期);I138-1238 *
文本情感分析;赵妍妍等;《软件学报》;20100815(第08期);第1834-1848页 *

Also Published As

Publication number Publication date
CN103678720A (zh) 2014-03-26

Similar Documents

Publication Publication Date Title
CN104281622B (zh) 一种社交媒体中的信息推荐方法和装置
CN103729359B (zh) 一种推荐搜索词的方法及系统
US9934293B2 (en) Generating search results
US10002371B1 (en) System, method, and computer program product for searching summaries of online reviews of products
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
CN104463630A (zh) 一种基于网购保险产品特性的产品推荐方法及系统
CN103838789A (zh) 一种文本相似度计算方法
CN107730346A (zh) 物品聚类的方法和装置
CN103631859A (zh) 一种面向科技项目的评审专家智能推荐方法
CN103606097A (zh) 一种基于可信度评价的产品信息推荐方法及系统
CN104462327B (zh) 语句相似度的计算、搜索处理方法及装置
CN103377249A (zh) 关键词投放方法及系统
CN103886501B (zh) 一种基于语义情感分析的贷后风险预警系统
CN103970801B (zh) 微博广告博文识别方法及装置
CN105468649B (zh) 一种待展示对象匹配的判断方法及其装置
CN103177129A (zh) 互联网实时信息推荐预测系统
CN114387061A (zh) 产品推送方法、装置、电子设备及可读存储介质
CN109902157A (zh) 一种训练样本有效性检测方法及装置
CN103678720B (zh) 用户反馈数据处理方法和装置
CN109165274A (zh) 一种在线自动客服方法、系统及电子设备
CN101937432A (zh) 一种按照供需信息进行两方撮合的系统与方法
CN107545505A (zh) 保险理财产品信息的识别方法及系统
CN105931055A (zh) 一种面向众包平台的服务商特征建模方法
CN103425705B (zh) 一种否定关键词的获取方法及装置和搜索方法及装置
CN105654125A (zh) 一种视频相似度的计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Cai Huali

Inventor after: Kang Jian

Inventor after: Cui Yanwu

Inventor after: Wu Fang

Inventor after: Wang Lizhi

Inventor after: Yang Lifei

Inventor after: Liu Bisong

Inventor after: Xu Yingcheng

Inventor after: Yang Yuexiang

Inventor before: Cai Huali

Inventor before: Kang Jian

Inventor before: Cui Yanwu

Inventor before: Wu Fang

Inventor before: Wang Lizhi

Inventor before: Yang Lifei

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170222

Termination date: 20220102