CN114117021A - 一种确定回复内容的方法、装置及电子设备 - Google Patents

一种确定回复内容的方法、装置及电子设备 Download PDF

Info

Publication number
CN114117021A
CN114117021A CN202210076588.3A CN202210076588A CN114117021A CN 114117021 A CN114117021 A CN 114117021A CN 202210076588 A CN202210076588 A CN 202210076588A CN 114117021 A CN114117021 A CN 114117021A
Authority
CN
China
Prior art keywords
reply
word
current
evaluation
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210076588.3A
Other languages
English (en)
Other versions
CN114117021B (zh
Inventor
张晶
张雪冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing xinqitian E-Commerce Technology Co.,Ltd.
Original Assignee
Beijing Shuzhi Xintian Information Technology Consulting Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shuzhi Xintian Information Technology Consulting Co ltd filed Critical Beijing Shuzhi Xintian Information Technology Consulting Co ltd
Priority to CN202210076588.3A priority Critical patent/CN114117021B/zh
Publication of CN114117021A publication Critical patent/CN114117021A/zh
Application granted granted Critical
Publication of CN114117021B publication Critical patent/CN114117021B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Abstract

本发明提供了一种确定回复内容的方法、装置及电子设备,其中,该方法包括:获取当前评价词集合;基于当前评价词集合中的评价词与回复词库中的回复词,确定当前评价词集合与回复词库是否相匹配,并将与当前评价词集合相匹配的回复词库作为当前回复词库;每个回复词库对应多个候选回复,且回复词库包括从对应的多个候选回复中提取出的多个回复词;从当前回复词库对应的多个候选回复中选取一个候选回复作为回复评价文本的回复内容。通过本发明实施例提供的确定回复内容的方法、装置及电子设备,在候选回复数量较大的情况下,能够减少数据处理量,智能且自动化地针对评价文本获得回复内容,提高回复效率。

Description

一种确定回复内容的方法、装置及电子设备
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种确定回复内容的方法、装置、电子设备及计算机可读存储介质。
背景技术
目前,很多用户在进行网络购物的时候,最看重的便是已购用户的评价,通过浏览这些评价,能够确定该商品是否满足自己的需求,从而决定是否购买该商品。尤其在评价中存在差评的情况时,若卖家并未对这类差评进行合理地解释,则该用户无法确定已购用户所反映的情况是否属实或属于事出有因的极个别情况,可能导致该用户不会购买该商品,对该商品的销售造成影响。因此,卖家针对已购用户的评价进行及时回复是十分重要的。
通常情况下,针对已购用户的评价需要由客服针对每一条评价进行一一操作,人工投入成本较高,效率低;并且,由于客服的业务水平参差不齐,以及客服易受主观情绪因素的影响,容易导致回复的内容偏差较大,不准确。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种确定回复内容的方法、装置、电子设备及计算机可读存储介质。
第一方面,本发明实施例提供了一种确定回复内容的方法,包括:获取当前评价词集合,所述当前评价词集合包括从待回复的评价文本中所提取出的多个评价词;基于所述当前评价词集合中的评价词与回复词库中的回复词,确定所述当前评价词集合与所述回复词库是否相匹配,并将与所述当前评价词集合相匹配的回复词库作为当前回复词库;每个所述回复词库对应多个候选回复,且所述回复词库包括从对应的多个候选回复中提取出的多个回复词;从所述当前回复词库对应的多个候选回复中选取一个候选回复作为回复所述评价文本的回复内容。
可选地,在所述基于所述当前评价词集合中的评价词与回复词库中的回复词,确定所述当前评价词集合与所述回复词库是否相匹配之前,该方法还包括:从具有相同重点词的多个所述候选回复中提取多个候选词,所述候选词包括所述重点词和多个第一非名词,所述重点词为多个所述候选回复共同具有的名词;以及对所述候选词中的所述重点词进行复制扩展,将多个所述第一非名词和扩展后的多个所述重点词作为所述回复词,生成与多个所述候选回复对应的包含多个所述回复词的回复词库;所述获取当前评价词集合包括:对所述评价文本提取多个当前关键词,所述当前关键词包括至少一个当前名词和至少一个第二非名词,对所述当前关键词中的所述当前名词进行复制扩展,将至少一个所述第二非名词和扩展后的多个所述当前名词作为所述评价词,生成包含多个所述评价词的所述当前评价词集合。
可选地,对所述评价文本提取多个当前关键词包括:为每个所述回复词库中的所述重点词分别预设一个相似词库,每个所述相似词库包括与对应的所述重点词互为近义词或相关的词汇;提取出所述评价文本中的多个关键词,在为名词的关键词不同于任何一个所述回复词库中的所述重点词的情况下,将所述为名词的关键词变换为:包含所述为名词的关键词的所述相似词库对应的所述重点词,并将变换后的为名词的关键词作为所述当前名词。
可选地,确定所述当前评价词集合与所述回复词库是否相匹配,并将与所述当前评价词集合相匹配的回复词库作为当前回复词库,包括:令所述当前评价词集合与每个所述回复词库进行比较,若所述回复词库中包含最多所述当前评价词集合中的元素,确定所述当前评价词集合与所述回复词库相匹配,将与所述当前评价词集合相匹配的回复词库作为当前回复词库。
可选地,确定所述当前评价词集合与所述回复词库是否相匹配,并将与所述当前评价词集合相匹配的回复词库作为当前回复词库,包括:计算所述当前评价词集合分别与每个所述回复词库之间的相似度
Figure 100002_DEST_PATH_IMAGE002
,且
Figure 100002_DEST_PATH_IMAGE004
,得到多个所述相似度;其中,
Figure 100002_DEST_PATH_IMAGE006
表示所述当前评价词集合;
Figure 100002_DEST_PATH_IMAGE008
表示所述回复词库;
Figure 100002_DEST_PATH_IMAGE010
表示所述当前评价词集合与所述回复词库中相同的元素;
Figure 100002_DEST_PATH_IMAGE012
表示所述当前评价词集合与所述回复词库中的所有元素;
Figure 100002_DEST_PATH_IMAGE014
表示计算括号中集合所对应的元素数量;将多个所述相似度中的最大相似度对应的所述回复词库作为所述当前回复词库。
可选地,该方法中:每个所述候选回复具有一种情感类别,所述情感类别包括正向情感、负向情感或者中性情感;具有相同重点词的多个所述候选回复的情感类别涵盖所述正向情感、所述负向情感和所述中性情感;所述获取当前评价词集合包括:处理所述评价文本,得到所述当前评价词集合的情感类别;所述从所述当前回复词库对应的多个候选回复中选取一个候选回复作为回复所述评价文本的回复内容,包括:将所述当前回复词库对应的候选回复中与所述当前评价词集合的情感类别相同的候选回复作为所述回复内容。
第二方面,本发明实施例提供了一种确定回复内容的装置,包括:获取模块、处理模块以及选取模块。
获取模块用于获取当前评价词集合,所述当前评价词集合包括从待回复的评价文本中所提取出的多个评价词。
处理模块用于基于所述当前评价词集合中的评价词与回复词库中的回复词,确定所述当前评价词集合与所述回复词库是否相匹配,并将与所述当前评价词集合相匹配的回复词库作为当前回复词库;每个所述回复词库对应多个候选回复,且所述回复词库包括从对应的多个候选回复中提取出的多个回复词。
选取模块用于从所述当前回复词库对应的多个候选回复中选取一个候选回复作为回复所述评价文本的回复内容。
可选地,该装置还包括:提取模块和扩展模块。
所述提取模块用于从具有相同重点词的多个所述候选回复中提取多个候选词,所述候选词包括所述重点词和多个第一非名词,所述重点词为多个所述候选回复共同具有的名词;以及所述扩展模块用于对所述候选词中的所述重点词进行复制扩展,将多个所述第一非名词和扩展后的多个所述重点词作为所述回复词,生成与多个所述候选回复对应的包含多个所述回复词的回复词库。
所述获取模块包括:复制单元。
所述复制单元用于对所述评价文本提取多个当前关键词,所述当前关键词包括至少一个当前名词和至少一个第二非名词,对所述当前关键词中的所述当前名词进行复制扩展,将至少一个所述第二非名词和扩展后的多个所述当前名词作为所述评价词,生成包含多个所述评价词的所述当前评价词集合。
第三方面,本发明实施例提供了一种电子设备,包括:总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述收发器、所述存储器和所述处理器通过所述总线相连,所述计算机程序被所述处理器执行时实现如上所述的确定回复内容的方法中的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,包括:可读存储介质上存储的计算机程序;所述计算机程序被处理器执行时实现如上所述的确定回复内容的方法中的步骤。
本发明实施例提供的确定回复内容的方法、装置、电子设备及计算机可读存储介质,通过预设回复词库,能够将多个候选回复所包括的回复词聚集在同一个回复词库中,使多个候选回复可以对应同一个回复词库;在利用当前评价词库中的评价词选择具体的候选回复时,无需用该当前评价词库中的评价词与多个候选回复进行一一比较和判断,仅需要将该当前评价词库中的评价词与数量较少的回复词库分别进行比较,即可确定哪些候选回复可以作为该评价文本的回复内容。该方法在候选回复数量较大的情况下,能够减少数据处理量,智能且自动化地针对评价文本获得回复内容,减少人工操作成本,提高回复效率。
附图说明
为了更清楚地说明本发明实施例或背景技术中的技术方案,下面将对本发明实施例或背景技术中所需要使用的附图进行说明。
图1示出了本发明实施例所提供的一种确定回复内容的方法的流程图;
图2示出了本发明实施例所提供的确定回复内容的方法的具体方法流程图;
图3示出了本发明实施例所提供的一种确定回复内容的装置的结构示意图;
图4示出了本发明实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面结合本发明实施例中的附图对本发明实施例进行描述。
图1示出了本发明实施例所提供的一种确定回复内容的方法的流程图。如图1所示,该方法包括以下步骤101-103。
步骤101:获取当前评价词集合,当前评价词集合包括从待回复的评价文本中所提取出的多个评价词。
其中,评价文本可以是从网络平台上获取的文本,例如,其可以是利用网络爬虫工具从电商平台获取的、用户购买某商品后所反馈的评价。在获取到该评价文本后,需要对该评价文本进行针对性地回复,此时,可以将该评价文本作为待回复的评价文本。本发明实施例中,可以使用自然语言处理的软件库,对该待回复的评价文本进行分词处理,将分词处理后所得到的多个词汇可以直接作为评价词,该评价词是能够表示该评价文本的词汇;或者,也可以对分词处理后得到的词汇进行处理,将处理后的词作为评价词。例如使用python的jieba工具库(一种中文分词第三方库)将一段评价文本直接拆分转化为多个词汇,该分词后的词汇即可称为评价词,进而可以将包括该多个评价词的集合作为当前评价词集合。
例如,待回复的评价文本为“物流太慢了,等了许多天才到货!”,针对该评价文本可以使用自然语言处理技术从中提取出多个评价词,如“物流”、“慢”、“许多天”、“到货”等,可以对所提取出的多个评价词生成当前评价词集合,即该当前评价词集合可以是{物流、慢、许多天、到货}。
步骤102:基于当前评价词集合中的评价词与回复词库中的回复词,确定当前评价词集合与回复词库是否相匹配,并将与当前评价词集合相匹配的回复词库作为当前回复词库;每个回复词库对应多个候选回复,且回复词库包括从对应的多个候选回复中提取出的多个回复词。
其中,可以预设多个用于回复评价文本的候选回复,这些候选回复可以是基于人工经验所得到的文本,通过自然语言处理技术对这些候选回复进行处理,可以得到每个候选回复对应的回复词,进而可以生成包含多个回复词的回复词库。其中,某一部分候选回复对应的回复词可以生成一个回复词库,即该部分候选回复可以对应同一个回复词库;或者,某一个候选回复对应的回复词可以分别包含于不同的回复词库中,即该候选回复可以同时对应不同的回复词库。例如,预设有候选回复A、候选回复B、候选回复C和候选回复D,通过对这些候选回复进行处理,能够得到候选回复A所具有的回复词为A1、A2、A3,候选回复B所具有的回复词为B1、B2、B3,候选回复C所具有的回复词为C1、C2、C3,候选回复D所具有的回复词为D1、D2、D3。此时可以生成两个回复词库,这两个回复词库可以是包含回复词A1、A2、A3、B1、B2、B3的回复词库1,以及包含回复词C1、C2、C3、D1、D2、D3的回复词库2,由此可知,该回复词库1对应候选回复A和候选回复B,而回复词库2对应候选回复C和候选回复D。或者,上述的回复词库1也可以包含回复词A1、A2、A3、B1、B2、B3、C1、C2、C3,即该候选回复C与两个回复词库均对应。
本发明实施例中,可以将当前评价词集合中的评价词与预设的回复词库中的回复词进行比较,能够得到当前评价词集合与每个回复词库之间的匹配度,进而确定与当前评价词集合匹配度最高的某个回复词库,是与该当前评价词集合相匹配的回复词库,即可将该回复词库作为当前回复词库。例如,可以通过计算当前评价词与每一个回复词库之间的相似度(如欧式距离等),得到该当前评价词集合与每一个回复词库之间的匹配度,进而确定哪一个回复词库是与该当前评价词集合相匹配的回复词库,将该回复词库作为当前回复词库。
步骤103:从当前回复词库对应的多个候选回复中选取一个候选回复作为回复评价文本的回复内容。
其中,在确定某一回复词库是当前评价词集合所对应的当前回复词库之后,可以从该当前回复词库所对应的多个候选回复中随机选择某一个候选回复,将该候选回复作为针对待回复的评价文本的回复内容;或者,也可以从该当前回复词库所对应的多个候选回复中选取字数最多的某一个候选回复,将该字数最多的候选回复作为针对该待回复的评价文本的回复内容;或者,可以进一步确定回复词库与候选回复之间的匹配度,将匹配度对最高的候选回复作为针对该待回复的评价文本的回复内容。
本发明实施例通过预设回复词库,能够将多个候选回复所包括的回复词聚集在同一个回复词库中,使多个候选回复可以对应同一个回复词库;在利用当前评价词库中的评价词选择具体的候选回复时,无需用该当前评价词库中的评价词与多个候选回复进行一一比较和判断,仅需要将该当前评价词库中的评价词与数量较少的回复词库分别进行比较,即可确定哪些候选回复可以作为该评价文本的回复内容。该方法在候选回复数量较大的情况下,能够减少数据处理量,智能且自动化地针对评价文本获得回复内容,减少人工操作成本,提高回复效率。
可选地,在基于当前评价词集合中的评价词与回复词库中的回复词,确定当前评价词集合与回复词库是否相匹配之前,该方法还包括步骤A1-A2。
步骤A1:从具有相同重点词的多个候选回复中提取多个候选词,候选词包括重点词和多个第一非名词,重点词为多个候选回复共同具有的名词。
通常情况下,由于每一个候选回复都是针对某一方面的评价所做出的回复,因此,一个候选回复的内容一般只围绕一个主语,且该主语通常是名词。本发明实施例中,若多个候选回复具有一个相同的名词,可以将该共同具有的名词作为重点词。其中,可以对所有的候选回复分别进行分词处理,提取出每个候选回复中的名词和非名词,该非名词为除名词之外的词,例如动词、形容词、副词等;在其中多个候选回复均包含某名词的情况下,将该名词即为多个候选回复的重点词;并且,多个候选回复的分词结果中还包括多个非名词,即第一非名词,本实施例将该重点词和第一非名词均称为候选词。
例如,候选回复分别为“很抱歉物流环节出现问题,没能及时将货物安全送达”、“感谢您对物流公司的肯定”以及“很抱歉因物流太慢给您所带来的不好体验,我们将对物流进行更严格管控”,在这三个候选回复中均包含名词“物流”的情况下,该名词“物流”即可作为重点词,并可以从这三个候选回复中提取出多个第一非名词作为候选词,这些候选词中包括上述三个候选回复均包含的名词“物流”,以及除该名词“物流”以外的其他词汇,如“很抱歉”、“环节”、“出现”、“问题”、“没能”、“及时”、“安全”、“送达”、“感谢”、“肯定”、“慢”、“不好”、“体验”、“严格”、“管控”等。
步骤A2:对候选词中的重点词进行复制扩展,将多个第一非名词和扩展后的多个重点词作为回复词,生成与多个候选回复对应的包含多个回复词的回复词库。
其中,可以针对候选词中的重点词进行复制扩展,该复制扩展顾名思义是将重点词进行多次复制,将候选词中仅有的一个重点词扩展为多个同样的重点词。将扩展后得到的多个同样的重点词与该候选词中原本包含的多个第一非名词作为回复词,并基于该回复词生成回复词库,即该回复词库是包括该多个同样的重点词与多个第一非名词的集合,且该回复词库能与提取出上述回复词的多个候选回复相对应。
如上述步骤A1中所举的例子所示,此时候选词包括重点词“物流”以及多个第一非名词“很抱歉”、“环节”、“出现”、“问题”、“没能”、“及时”、“安全”、“送达”、“感谢”、“肯定”、“慢”、“不好”、“体验”、“严格”、“管控”。将该候选词中的重点词“物流”进行复制扩展,如复制10次,得到10个相同的重点词“物流”,将这10个重点词“物流”与多个第一非名词作为回复词,即该回复词包括10个“物流”以及“很抱歉”、“环节”、“出现”、“问题”、“没能”、“及时”、“安全”、“送达”、“感谢”、“肯定”、“慢”、“不好”、“体验”、“严格”、“管控”,并生成包含这些回复词的回复词库,该回复词库能够与提取出上述回复词的三个候选回复相对应。
并且,获取当前评价词集合包括步骤B。
步骤B:对评价文本提取多个当前关键词,当前关键词包括至少一个当前名词和至少一个第二非名词,对当前关键词中的当前名词进行复制扩展,将至少一个第二非名词和扩展后的多个当前名词作为评价词,生成包含多个评价词的当前评价词集合。
其中,在获取到待回复的评价文本之后,还可以利用自然语言处理技术从该评价文本中先提取出多个当前关键词,通过对该多个当前关键词进行处理,进一步得到多个评价词。所提取出的当前关键词可以包括至少一个当前名词和至少一个第二非名词,该当前名词可以是该评价文本中所包含的某一个名词,该第二非名词可以是除该当前名词以外的其他词性的词,如动词、形容词、副词等。例如,该评价文本为“物流太慢了,等好多天才送达”,可以从该评价文本中提取多个当前关键词,当前关键词包括当前名词“物流”,以及多个第二非名词“太慢”、“等”、“好多天”、“送达”。本发明实施例中,可以针对该当前名词进行复制扩展,即将该当前关键词中的一个当前名词或者多个当前名词进行复制扩展,将每个当前名词由数量为一个扩展为数量为多个,将扩展后得到的所有当前名词与该当前关键词中原本包含的多个第二非名词作为评价词,并基于该评价词生成当前评价词集合。例如,将上述当前关键词中的当前名词“物流”进行10次复制扩展,得到数量为10的当前名词“物流”,将该10个当前名词“物流”与第二非名词“太慢”、“等”、“好多天”、“送达”作为评价词,将包括这些评价词的集合{“物流”(10个)、“太慢”、“等”、“好多天”、“送达”}作为当前评价词集合。
本发明实施例通过对具有相同重点词的多个候选回复提取候选词,将该候选词中的重点词进行复制扩展,生成回复词库,通过增加该重点词的数量从而提高该重点词在该回复词库中的权重;同时,针对待回复的评价文本提取当前关键词,将该当前关键词中的当前名词进行复制扩展,生成当前评价词集合,进而也可以提高该当前名词在该当前评价词集合中的权重,在后续比较当前评价词集合与回复词库时,能够更准确地确定二者是否匹配。
可选地,对评价文本提取多个当前关键词包括步骤B1-B2。
步骤B1:为每个回复词库中的重点词分别预设一个相似词库,每个相似词库包括与对应的重点词互为近义词或相关的词汇。
其中,可以在提取出多个当前关键词之前,提前预设多个相似词库,每个相似词库分别对应一个重点词,即某一相似词库是针对某一重点词而建立的词库。该相似词库中可以包括与其所对应的重点词互为近义词的词汇,或者是与其对应的重点词相关联的词汇。例如,基于多个候选回复提取出三个重点词“物流”、“质量”和“服务”,可以针对这三个重点词分别预设三个相似词库,即与重点词“物流”相对应的相似词库1,与重点词“质量”相对应的相似词库2,以及与重点词“服务”相对应的相似词库3。其中,该相似词库1中可以包括与重点词“物流”相关的词,如各种物流公司的名称、包裹、货物、运输等,还可以包括“物流”的近义词,如快递、速递、货运等。该相似词库2中可以包括与重点词“质量”相关的词,如衣服、裤子等,也可以包括重点词“质量”的近义词,如品质、质地、质感等。该相似词库3中可以包括与“服务”相关的词,如态度、回复、语气、脾气等,也可以包括重点词“服务”的近义词,如客服等。其中,与重点词相关的词汇也可以是该重点词对应的易错词。
步骤B2:提取出评价文本中的多个关键词,在为名词的关键词不同于任何一个回复词库中的重点词的情况下,将为名词的关键词变换为:包含为名词的关键词的相似词库对应的重点词,并将变换后的为名词的关键词作为当前名词。
本发明实施例中,还可以针对待回复的评价文本提取出多个关键词,并通过对该多个关键词进行处理,得到所需的当前名词,进而通过该当前名词确定评价词。其中,从该评价文本中所提取出的多个关键词可以包括词性是名词的关键词(为名词的关键词),以及词性不是名词的关键词(第二非名词),若任何一个回复词库所包含的重点词与该多个关键词中词性是名词的关键词(为名词的关键词)均不相同,则可以基于预设的相似词库,对该词性是名词的关键词(为名词的关键词)进行变换,其中,所使用的相似词库是包含该词性是名词的关键词(为名词的关键词)的相似词库,可以将该词性是名词的关键词(为名词的关键词)变换为所使用的相似词库所对应的重点词,并将已经变换成所使用的相似词库对应的重点词的为名词的关键词做为当前名词。若某一个回复词库所包含的重点词与该多个关键词中词性是名词的关键词(为名词的关键词)相同,将为名词的关键词直接作为当前关键词。
例如,待回复的评价文本为“快递太慢了,等了好几天才到货”,可以从该评价文本中提取出多个关键词,如“快递”、“太慢”、“等”、“好几天”、“到货”,针对这些关键词,从中识别出词性是名词的关键词“快递”,将该将该关键词“快递”是为名词的关键词,其余的关键词如“太慢”、“等”、“好几天”、“到货”可以作为第二非名词。若多个回复词库所分别包含的重点词中并没有一个重点词是与该为名词的关键词“快递”相一致的词,则可以对该为名词的关键词“快递”进行变换,从多个预设的相似词库中找到包含该为名词的关键词“快递”的相似词库,确定该相似词库所对应的重点词为“物流”,并将该为名词的关键词“快递”变换为该相似词库所对应的重点词“物流”,将“物流”作为当前名词。
并且,对当前关键词中的当前名词进行复制扩展,包括步骤B3。
步骤B3:将当前名词的个数扩展为与回复词库中重点词的个数相同。
其中,可以将经过变换得到的当前名词进行复制扩展,即将该当前名词由数量为一个扩展为数量为多个,且扩展后的当前名词的数量可以与回复词库中扩展后的重点词的数量相同。例如,在生成某回复词库时,对重点词复制扩展10次,得到具有10个相同重点词的某回复词库。在得到当前名词之后,可以将该当前名词同样进行10次复制扩展,得到与回复词库中重点词的数量一致的10个当前名词。
本发明实施例针对每个重点词分别预设与之相对应的相似词库,可以在所提取的为名词的关键词与任何一个回复词库中的重点词均不相同的情况下,根据该为名词的关键词所属的相似词库,将该为名词的关键词变为与该相似词库相对应的重点词,将变换为重点词的为名词的关键词作为当前名词,并对该当前名词进行复制扩展,直至该当前名词的数量与回复词库中包含的重点词的数量一致。该方法通过引入相似词库,解决了当所提取的关键词中并不存在某一关键词与所有回复词库中包含的重点词相同的情况下,无法对该评价文本进行进一步识别和处理,进而导致无法确定为该评价文本选取哪一个候选回复作为回复内容的问题。该方法在重点词数量有限、回复词库数量有限的情况下,可以囊括更多与重点词相似的词汇,提高识别的成功率。
可选地,确定当前评价词集合与回复词库是否相匹配,并将与当前评价词集合相匹配的回复词库作为当前回复词库,包括步骤C。
步骤C:令当前评价词集合与每个回复词库进行比较,若回复词库中包含最多当前评价词集合中的元素,确定当前评价词集合与回复词库相匹配,将与当前评价词集合相匹配的回复词库作为当前回复词库。
其中,在确定当前评价词集合与某个回复词库是否相匹配时,可以用该当前评价词集合依次与每一个回复词库相比较,即,将该当前评价词集合中的每一个元素(每一个评价词)分别与每一个回复词库中的每一个元素(每一个回复词)相比较,若通过该种比较方法发现,某一个回复词库所包含的元素(回复词)中存在与该当前评价词集合中的元素(评价词)相同的元素,且该相同的元素的数量是最多的,即其他回复词库中包含该当前评价词集合的元素的数量均不高于该回复词库,此时可以将该包含最多当前评价词集合中的元素的回复词库作为当前回复词库。
例如,当前评价词集合为包含三个相同当前名词的集合,如{物流、物流、物流、太慢、好几天、送达},具有两个回复词库,回复词库1为包含三个相同重点词“物流”的集合{物流、物流、物流、很抱歉、太慢、没能、及时、送达},回复词库2为包含三个相同重点词“服务”的集合{服务、服务、服务、很高兴、抱歉、带来、良好、体验}。通过将当前评价词集合中的每一个评价词分别与两个回复词库中的回复词进行比较,确定回复词库1中具有5个与当前评价词集合中的评价词相同的回复词,而回复词库2中没有与当前评价词集合中的评价词相同的回复词,因此该回复词库1中所包含的与当前评价词库中相同的元素的数量最多,可以将该回复词库1作为当前回复词库。
本发明实施例通过将当前评价词集合中的每一个元素分别与每一个回复词库中的元素相比较,选择二者之间具有相同元素数量最多的回复词库作为当前回复词库,该方法能够较为准确地识别到该当前评价词集合对应的回复词库,且操作方式简单易行。
可选地,确定当前评价词集合与回复词库是否相匹配,并将与当前评价词集合相匹配的回复词库作为当前回复词库,还可以包括以下步骤D1-D2。
步骤D1:计算当前评价词集合分别与每个回复词库之间的相似度
Figure 248303DEST_PATH_IMAGE002
,且
Figure 103126DEST_PATH_IMAGE004
,得到多个相似度;其中,
Figure 820546DEST_PATH_IMAGE006
表示当前评价词集合;
Figure 215756DEST_PATH_IMAGE008
表示回复词库;
Figure 469276DEST_PATH_IMAGE010
表示当前评价词集合与回复词库中相同的元素;
Figure 229421DEST_PATH_IMAGE012
表示当前评价词集合与回复词库中的所有元素;
Figure 434138DEST_PATH_IMAGE014
表示计算括号中集合所对应的元素数量。
其中,在确定当前评价词集合与某个回复词库是否相匹配时,可以通过计算该当前评价词集合与每个回复词库之间的相似度,进而基于多个相似度确定当前评价词集合与哪一个回复词库相匹配,该相似度是能够表示当前评价词集合与某个回复词库之间的匹配程度的依据。本发明实施例中,将当前评价词集合表示为A,将每个回复词库表示为B,二者之间的相似度可以用
Figure 633038DEST_PATH_IMAGE002
来表示,且
Figure 239600DEST_PATH_IMAGE004
。其中,
Figure DEST_PATH_IMAGE016
表示A与B之间做交集计算后所包含的元素个数,即当前评价词集合与某一回复词库之间共同具有的元素的个数;
Figure DEST_PATH_IMAGE018
表示A与B之间取并集后所包含的元素个数,即当前评价词集合与某一回复词库所具有的全部元素的个数。通过计算该当前评价词集合A与某一回复词库B中具有的相同元素的个数,在该当前评价词集合A与某一回复词库B具有的全部元素的个数中的比值,可以确定该当前评价词集合A与某一回复词库B之间的相似度,该相似度用来表示该当前评价词集合A与某一回复词库B之间的匹配程度。本发明实施例可以依照该计算公式依次求出该当前评价词集合与每一个回复词库之间的相似度。
例如,当前评价词集合中共有10个评价词,某一回复词库中共有15个回复词,计算二者交集得到二者之间相同的词汇共有5个,则二者并集得到全部词汇共有20个,基于上述公式可以确定当前评价词集合与该回复词库之间的相似度为0.25。
步骤D2:将多个相似度中的最大相似度对应的回复词库作为当前回复词库。
其中,在得到该当前评价词集合与每一个回复词库之间的相似度之后,从这些相似度中选取出最大相似度,该最大相似度能够表示该当前评价词集合与该回复词库之间的匹配程度最高,即该回复词库是与当前评价词集合相匹配的回复词库,可以将该最大相似度对应的回复词库作为当前回复词库。例如,可以将所得到的多个相似度由小到大进行排序,从中选取相似度数值最大的作为最大相似度,将该最大相似度对应的回复词库作为当前回复词库。
本发明实施例在确定当前评价词集合与某个回复词库是否相匹配时,通过更具体的计算公式,能够将二者之间的匹配程度进行量化,引入相似度来表示当前评价词集合与回复词库之间的匹配程度,计算得到的相似度更加准确,进而能够准确地选取最大相似度所对应的回复词库作为与当前评价词集合最匹配的回复词库。在对当前名词和重点词均进行复制扩展的情况下,基于上述公式可以更准确地命中当前名词和重点词相同的情况,进而可以更准确地确定与当前评价词集合最匹配的回复词库。
可选地,该方法中:每个候选回复具有一种情感类别,情感类别包括正向情感、负向情感或者中性情感;具有相同重点词的多个候选回复的情感类别涵盖正向情感、负向情感和中性情感。
通常情况下,每个候选回复具有一种情感类别,可以直接对候选回复进行情感分析,从而确定该候选回复的情感类别。该情感类别可以是正向情感、负向情感或者中性情感。例如,候选回复分别为候选回复1:“很抱歉物流环节出现问题,没能及时将货物安全送达”、候选回复2:“感谢您对物流公司的肯定”以及候选回复3:“希望您下次继续光顾本店”。可以确定候选回复1是带有负向情感的内容,因此得到该候选回复1的情感类别是负向情感;候选回复2是带有正向情感的内容,因此得到该候选回复2的情感类别是正向情感;而候选回复3是带有中性情感的内容,因此可以确定该候选回复3的情感类别是中性情感。
或者,候选回复的情感类别可以基于其能够回复的文本(该文本也可以是一种评价文本)所确定,即通过分析该能够回复的文本的情感类别,可以确定该候选回复的情感类别与该能够回复的文本的情感类别相同。其中,正向情感表示该候选回复与其能够回复的文本都是较为积极且能表达愉快、认同、感激等情绪的情感类别;负向情感表示该候选回复与其能够回复的文本都是较为消极且能表达沮丧、失落、抱歉等情绪的情感类别;此外,中性情感表示该候选回复与其能够回复的文本是较为平淡的情感类别,例如,该能够回复的文本是不具有实质性内容的默认好评,此时,可以针对该种评价文本对应回复具有中性情感的某些固定的候选回复。
本发明实施例中,还可以令具有相同重点词的多个候选回复的情感类别覆盖上述每一种情感类别,即具有相同重点词的多个候选回复中,既包括具有正向情感的候选回复,也包括具有负向情感和中性情感的候选回复。
并且,获取当前评价词集合包括步骤E1。
步骤E1:处理评价文本,得到当前评价词集合的情感类别。
其中,在获取当前评价词集合时,可以通过分析评价文本的语义语境、识别该评价文本中评价词的含义,确定该评价文本的情感类别,该评价文本的情感类别也能够表示该当前评价词集合的情感类别。具体可以采用自然语言处理的相关方法得到评价文本的情感类别,此处不再赘述。
并且,从当前回复词库对应的多个候选回复中选取一个候选回复作为回复评价文本的回复内容包括步骤E2。
步骤E2:将当前回复词库对应的候选回复中与当前评价词集合的情感类别相同的候选回复作为回复内容。
其中,在确定了与当前评价词集合相对应的当前回复词库之后,在该当前回复词库中选取与该当前评价词集合的情感类别相一致的候选回复,若该当前回复词库中与该当前评价词集合的情感类别相同的候选回复的数量仅为一个,可以将该与当前评价词集合的情感类别相同的候选回复作为回复内容;若该当前回复词库中与该当前评价词集合的情感类别相同的候选回复的数量不止一个,可以从多个与当前评价词集合的情感类别相同的候选回复中随机选取一个作为回复内容。
本发明实施例通过对评价文本进行处理得到该评价文本的情感类别,并且,对候选回复也进行情感类别的划分,使得每个回复词库所对应的候选回复能够覆盖每一种情感类别,经过这样的处理,可以在选取候选回复时,基于评价文本的情感类别,确定在该回复词库对应的多个候选回复中选取哪一个情感类别的候选回复更为合适。避免出现当评价文本为具有负面情感的差评时,不合时宜的回复具有正面情感的回复的问题。该方法使得候选回复的选取更加人性化,可以提高用户对回复者(如卖家)的好感度。
下面通过一个实施例详细介绍该确定回复内容的方法流程。参见图2所示,该方法包括以下步骤201-210。
步骤201:获取多个候选回复,每个候选回复具有一种情感类别。
其中,情感类别包括:正向情感、负向情感或者中性情感。
步骤202:提取多个候选回复中具有同一重点词的候选回复,从具有同一重点词的候选回复中选取该重点词以及第一非名词作为候选词。
其中,该重点词是名词,该第一非名词是具有同一重点词的候选回复中除该重点词以外的词,如除名词以外的动词、形容词等;并且,具有相同重点词的多个候选回复的情感类别涵盖正向情感、负向情感和中性情感。
步骤203:将该候选词中的重点词进行复制扩展,得到由多个重点词与第一非名词组成的回复词,并生成与具有同一重点词的候选回复相对应的回复词库。
步骤204:针对每个回复词库中的重点词预设对应的相似词库。
其中,可以基于上述步骤B1所描述的方法预设相似词库,此处不再赘述。
步骤205:获取待回复的评价文本,从该待回复的评价文本中提取关键词。
其中,该关键词中包括为名词的关键词和第二非名词,该第二非名词是该评价文本中除该为名词的关键词以外的关键词,如除名词以外的动词、形容词等。
步骤206:判断多个回复词库的重点词中是否存在与该为名词的关键词相同的词,若存在,则执行步骤207;否则,执行步骤208。
步骤207:将该为名词的关键词作为当前名词,对该当前名词进行复制扩展,得到由多个当前名词和第二非名词组成的评价词,生成当前评价词集合,并确定该当前评价词集合的情感类别,继续执行步骤209。
步骤208:基于预设的相似词库,将该为名词的关键词变换为包含该为名词的关键词的相似词库对应的重点词,并将变换后的结果作为当前名词,对该当前名词进行复制扩展,得到多个当前名词和第二非名词组成的评价词,并生成当前评价词集合,并确定该当前评价词集合的情感类别,继续执行步骤209。
步骤209:通过计算该当前评价词集合与每个回复词库之间的相似度,确定与该当前评价词集合相匹配的回复词库,将该回复词库作为当前回复词库。
其中,可以基于上述步骤D1-2所描述的方法,计算该当前评价词集合与每个回复词库之间的相似度,并确定与该当前评价词集合相匹配的回复词库,此处不再赘述。
步骤210:从当前回复词库所对应的多个候选回复中,选择情感类别与该当前评价词集合的情感类别一致的候选回复作为最终的回复内容。
上文详细描述了本发明实施例提供的确定回复内容的方法,该方法也可以通过相应的装置实现,下面详细描述本发明实施例提供的确定回复内容的装置。
本发明实施例提供了一种确定回复内容的装置,参见图3所示,该装置包括:获取模块31、处理模块32及选取模块33。
获取模块31用于获取当前评价词集合,所述当前评价词集合包括从待回复的评价文本中所提取出的多个评价词;
处理模块32用于基于所述当前评价词集合中的评价词与回复词库中的回复词,确定所述当前评价词集合与所述回复词库是否相匹配,并将与所述当前评价词集合相匹配的回复词库作为当前回复词库;每个所述回复词库对应多个候选回复,且所述回复词库包括从对应的多个候选回复中提取出的多个回复词;
选取模块33用于从所述当前回复词库对应的多个候选回复中选取一个候选回复作为回复所述评价文本的回复内容。
可选地,该装置还包括:提取模块和扩展模块。
提取模块用于从具有相同重点词的多个所述候选回复中提取多个候选词,所述候选词包括所述重点词和多个第一非名词,所述重点词为多个所述候选回复共同具有的名词。
扩展模块用于对所述候选词中的所述重点词进行复制扩展,将多个所述第一非名词和扩展后的多个所述重点词作为所述回复词,生成与多个所述候选回复对应的包含多个所述回复词的回复词库;
获取模块31包括:复制单元。
复制单元用于对所述评价文本提取多个当前关键词,所述当前关键词包括至少一个当前名词和至少一个第二非名词,对所述当前关键词中的所述当前名词进行复制扩展,将至少一个所述第二非名词和扩展后的多个所述当前名词作为所述评价词,生成包含多个所述评价词的所述当前评价词集合。
可选地,复制单元包括:相似词库子单元和变换子单元。
相似词库子单元用于为每个所述回复词库中的所述重点词分别预设一个相似词库,每个所述相似词库包括与对应的所述重点词互为近义词或相关的词汇。
变换子单元用于提取出所述评价文本中的多个关键词,在为名词的关键词不同于任何一个所述回复词库中的所述重点词的情况下,将所述为名词的关键词变换为:包含所述为名词的关键词的所述相似词库对应的所述重点词,并将变换后的为名词的关键词作为所述当前名词。
可选地,处理模块32包括:比较单元。
比较单元用于令所述当前评价词集合与每个所述回复词库进行比较,若所述回复词库中包含最多所述当前评价词集合中的元素,确定所述当前评价词集合与所述回复词库相匹配,将与所述当前评价词集合相匹配的回复词库作为当前回复词库。
可选地,处理模块32还包括:计算单元和确定单元。
计算单元用于计算所述当前评价词集合分别与每个所述回复词库之间的相似度
Figure 606865DEST_PATH_IMAGE002
,且
Figure 298878DEST_PATH_IMAGE004
,得到多个所述相似度;其中,
Figure 973572DEST_PATH_IMAGE006
表示所述当前评价词集合;
Figure 496958DEST_PATH_IMAGE008
表示所述回复词库;
Figure 365950DEST_PATH_IMAGE010
表示所述当前评价词集合与所述回复词库中相同的元素;
Figure 545259DEST_PATH_IMAGE012
表示所述当前评价词集合与所述回复词库中的所有元素;
Figure 820382DEST_PATH_IMAGE014
表示计算括号中集合所对应的元素数量。
确定单元用于将多个所述相似度中的最大相似度对应的所述回复词库作为所述当前回复词库。
可选地,该装置中:每个所述候选回复具有一种情感类别,所述情感类别包括正向情感、负向情感或者中性情感;具有相同重点词的多个所述候选回复的情感类别涵盖所述正向情感、所述负向情感和所述中性情感。
获取模块31还包括:情感获取单元。
情感获取单元用于处理所述评价文本,得到所述当前评价词集合的情感类别。
选取模块33包括:选择单元。
选择单元用于将所述当前回复词库对应的候选回复中与所述当前评价词集合的情感类别相同的候选回复作为所述回复内容。
本发明实施例提供的确定回复内容的装置,通过预设回复词库,能够将多个候选回复所包括的回复词聚集在同一个回复词库中,使多个候选回复可以对应同一个回复词库;在利用当前评价词库中的评价词选择具体的候选回复时,无需用该当前评价词库中的评价词与多个候选回复进行一一比较和判断,仅需要将该当前评价词库中的评价词与数量较少的回复词库分别进行比较,即可确定哪些候选回复可以作为该评价文本的回复内容。该装置在候选回复数量较大的情况下,能够减少数据处理量,智能且自动化地针对评价文本获得回复内容,减少人工操作成本,提高回复效率。
此外,本发明实施例还提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该收发器、该存储器和处理器分别通过总线相连,计算机程序被处理器执行时实现上述确定回复内容的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
具体的,参见图4所示,本发明实施例还提供了一种电子设备,该电子设备包括总线1110、处理器1120、收发器1130、总线接口1140、存储器1150和用户接口1160。
在本发明实施例中,该电子设备还包括:存储在存储器1150上并可在处理器1120上运行的计算机程序,计算机程序被处理器1120执行时实现上述确定回复内容的方法实施例的各个过程。
收发器1130,用于在处理器1120的控制下接收和发送数据。
本发明实施例中,总线架构(用总线1110来代表),总线1110可以包括任意数量互联的总线和桥,总线1110将包括由处理器1120代表的一个或多个处理器与存储器1150代表的存储器的各种电路连接在一起。
总线1110表示若干类型的总线结构中的任何一种总线结构中的一个或多个,包括存储器总线以及存储器控制器、外围总线、加速图形端口(Accelerate Graphical Port,AGP)、处理器或使用各种总线体系结构中的任意总线结构的局域总线。作为示例而非限制,这样的体系结构包括:工业标准体系结构(Industry Standard Architecture,ISA)总线、微通道体系结构(Micro Channel Architecture,MCA)总线、扩展ISA(Enhanced ISA,EISA)总线、视频电子标准协会(Video Electronics Standards Association,VESA)、外围部件互连(Peripheral Component Interconnect,PCI)总线。
处理器1120可以是一种集成电路芯片,具有信号处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中硬件的集成逻辑电路或软件形式的指令完成。上述的处理器包括:通用处理器、中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)、复杂可编程逻辑器件(Complex Programmable LogicDevice,CPLD)、可编程逻辑阵列(Programmable Logic Array,PLA)、微控制单元(Microcontroller Unit,MCU)或其他可编程逻辑器件、分立门、晶体管逻辑器件、分立硬件组件。可以实现或执行本发明实施例中公开的各方法、步骤及逻辑框图。例如,处理器可以是单核处理器或多核处理器,处理器可以集成于单颗芯片或位于多颗不同的芯片。
处理器1120可以是微处理器或任何常规的处理器。结合本发明实施例所公开的方法步骤可以直接由硬件译码处理器执行完成,或者由译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存取存储器(Random Access Memory,RAM)、闪存(FlashMemory)、只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、寄存器等本领域公知的可读存储介质中。所述可读存储介质位于存储器中,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
总线1110还可以将,例如外围设备、稳压器或功率管理电路等各种其他电路连接在一起,总线接口1140在总线1110和收发器1130之间提供接口,这些都是本领域所公知的。因此,本发明实施例不再对其进行进一步描述。
收发器1130可以是一个元件,也可以是多个元件,例如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。例如:收发器1130从其他设备接收外部数据,收发器1130用于将处理器1120处理后的数据发送给其他设备。取决于计算机系统的性质,还可以提供用户接口1160,例如:触摸屏、物理键盘、显示器、鼠标、扬声器、麦克风、轨迹球、操纵杆、触控笔。
应理解,在本发明实施例中,存储器1150可进一步包括相对于处理器1120远程设置的存储器,这些远程设置的存储器可以通过网络连接至服务器。上述网络的一个或多个部分可以是自组织网络(ad hoc network)、内联网(intranet)、外联网(extranet)、虚拟专用网(VPN)、局域网(LAN)、无线局域网(WLAN)、广域网(WAN)、无线广域网(WWAN)、城域网(MAN)、互联网(Internet)、公共交换电话网(PSTN)、普通老式电话业务网(POTS)、蜂窝电话网、无线网络、无线保真(Wi-Fi)网络以及两个或更多个上述网络的组合。例如,蜂窝电话网和无线网络可以是全球移动通信(GSM)系统、码分多址(CDMA)系统、全球微波互联接入(WiMAX)系统、通用分组无线业务(GPRS)系统、宽带码分多址(WCDMA)系统、长期演进(LTE)系统、LTE频分双工(FDD)系统、LTE时分双工(TDD)系统、先进长期演进(LTE-A)系统、通用移动通信(UMTS)系统、增强移动宽带(Enhance Mobile Broadband,eMBB)系统、海量机器类通信(massive Machine Type of Communication,mMTC)系统、超可靠低时延通信(UltraReliable Low Latency Communications,uRLLC)系统等。
应理解,本发明实施例中的存储器1150可以是易失性存储器或非易失性存储器,或可包括易失性存储器和非易失性存储器两者。其中,非易失性存储器包括:只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存(Flash Memory)。
易失性存储器包括:随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如:静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本发明实施例描述的电子设备的存储器1150包括但不限于上述和任意其他适合类型的存储器。
在本发明实施例中,存储器1150存储了操作系统1151和应用程序1152的如下元素:可执行模块、数据结构,或者其子集,或者其扩展集。
具体而言,操作系统1151包含各种系统程序,例如:框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序1152包含各种应用程序,例如:媒体播放器(Media Player)、浏览器(Browser),用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序1152中。应用程序1152包括:小程序、对象、组件、逻辑、数据结构以及其他执行特定任务或实现特定抽象数据类型的计算机系统可执行指令。
此外,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述确定回复内容的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
计算机可读存储介质包括:永久性和非永久性、可移动和非可移动媒体,是可以保留和存储供指令执行设备所使用指令的有形设备。计算机可读存储介质包括:电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备以及上述任意合适的组合。计算机可读存储介质包括:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带存储、磁带磁盘存储或其他磁性存储设备、记忆棒、机械编码装置(例如在其上记录有指令的凹槽中的穿孔卡或凸起结构)或任何其他非传输介质、可用于存储可以被计算设备访问的信息。按照本发明实施例中的界定,计算机可读存储介质不包括暂时信号本身,例如无线电波或其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如穿过光纤电缆的光脉冲)或通过导线传输的电信号。
在本申请所提供的几个实施例中,应该理解到,所披露的装置、电子设备和方法,可以通过其他的方式实现。例如,以上描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的、机械的或其他的形式连接。
所述作为分离部件说明的单元可以是或也可以不是物理上分开的,作为单元显示的部件可以是或也可以不是物理单元,既可以位于一个位置,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或全部单元来解决本发明实施例方案要解决的问题。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术作出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(包括:个人计算机、服务器、数据中心或其他网络设备)执行本发明各个实施例所述方法的全部或部分步骤。而上述存储介质包括如前述所列举的各种可以存储程序代码的介质。
在本发明实施例的描述中,所属技术领域的技术人员应当知道,本发明实施例可以实现为方法、装置、电子设备及计算机可读存储介质。因此,本发明实施例可以具体实现为以下形式:完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、硬件和软件结合的形式。此外,在一些实施例中,本发明实施例还可以实现为在一个或多个计算机可读存储介质中的计算机程序产品的形式,该计算机可读存储介质中包含计算机程序代码。
上述计算机可读存储介质可以采用一个或多个计算机可读存储介质的任意组合。计算机可读存储介质包括:电、磁、光、电磁、红外或半导体的系统、装置或器件,或者以上任意的组合。计算机可读存储介质更具体的例子包括:便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、闪存(Flash Memory)、光纤、光盘只读存储器(CD-ROM)、光存储器件、磁存储器件或以上任意组合。在本发明实施例中,计算机可读存储介质可以是任意包含或存储程序的有形介质,该程序可以被指令执行系统、装置、器件使用或与其结合使用。
上述计算机可读存储介质包含的计算机程序代码可以用任意适当的介质传输,包括:无线、电线、光缆、射频(Radio Frequency,RF)或者以上任意合适的组合。
可以以汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路配置数据或以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,例如:Java、Smalltalk、C++,还包括常规的过程式程序设计语言,例如:C语言或类似的程序设计语言。计算机程序代码可以完全的在用户计算机上执行、部分的在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行以及完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括:局域网(LAN)或广域网(WAN),可以连接到用户计算机,也可以连接到外部计算机。
本发明实施例通过流程图和/或方框图描述所提供的方法、装置、电子设备。
应当理解,流程图和/或方框图的每个方框以及流程图和/或方框图中各方框的组合,都可以由计算机可读程序指令实现。这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而生产出一种机器,这些计算机可读程序指令通过计算机或其他可编程数据处理装置执行,产生了实现流程图和/或方框图中的方框规定的功能/操作的装置。
也可以将这些计算机可读程序指令存储在能使得计算机或其他可编程数据处理装置以特定方式工作的计算机可读存储介质中。这样,存储在计算机可读存储介质中的指令就产生出一个包括实现流程图和/或方框图中的方框规定的功能/操作的指令装置产品。
也可以将计算机可读程序指令加载到计算机、其他可编程数据处理装置或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其他可编程数据处理装置上执行的指令能够提供实现流程图和/或方框图中的方框规定的功能/操作的过程。
以上所述,仅为本发明实施例的具体实施方式,但本发明实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明实施例披露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明实施例的保护范围之内。因此,本发明实施例的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种确定回复内容的方法,其特征在于,包括:
获取当前评价词集合,所述当前评价词集合包括从待回复的评价文本中所提取出的多个评价词;
基于所述当前评价词集合中的评价词与回复词库中的回复词,确定所述当前评价词集合与所述回复词库是否相匹配,并将与所述当前评价词集合相匹配的回复词库作为当前回复词库;每个所述回复词库对应多个候选回复,且所述回复词库包括从对应的多个候选回复中提取出的多个回复词;
从所述当前回复词库对应的多个候选回复中选取一个候选回复作为回复所述评价文本的回复内容。
2.根据权利要求1所述的方法,其特征在于,在所述基于所述当前评价词集合中的评价词与回复词库中的回复词,确定所述当前评价词集合与所述回复词库是否相匹配之前,还包括:
从具有相同重点词的多个所述候选回复中提取多个候选词,所述候选词包括所述重点词和多个第一非名词,所述重点词为多个所述候选回复共同具有的名词;以及
对所述候选词中的所述重点词进行复制扩展,将多个所述第一非名词和扩展后的多个所述重点词作为所述回复词,生成与多个所述候选回复对应的包含多个所述回复词的回复词库;
所述获取当前评价词集合包括:
对所述评价文本提取多个当前关键词,所述当前关键词包括至少一个当前名词和至少一个第二非名词,对所述当前关键词中的所述当前名词进行复制扩展,将至少一个所述第二非名词和扩展后的多个所述当前名词作为所述评价词,生成包含多个所述评价词的所述当前评价词集合。
3.根据权利要求2所述的方法,其特征在于,所述对所述评价文本提取多个当前关键词包括:
为每个所述回复词库中的所述重点词分别预设一个相似词库,每个所述相似词库包括与对应的所述重点词互为近义词或相关的词汇;
提取出所述评价文本中的多个关键词,在为名词的关键词不同于任何一个所述回复词库中的所述重点词的情况下,将所述为名词的关键词变换为:包含所述为名词的关键词的所述相似词库对应的所述重点词,并将变换后的为名词的关键词作为所述当前名词。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述确定所述当前评价词集合与所述回复词库是否相匹配,并将与所述当前评价词集合相匹配的回复词库作为当前回复词库,包括:
令所述当前评价词集合与每个所述回复词库进行比较,若所述回复词库中包含最多所述当前评价词集合中的元素,确定所述当前评价词集合与所述回复词库相匹配,将与所述当前评价词集合相匹配的回复词库作为当前回复词库。
5.根据权利要求1-3任意一项所述的方法,其特征在于,所述确定所述当前评价词集合与所述回复词库是否相匹配,并将与所述当前评价词集合相匹配的回复词库作为当前回复词库,包括:
计算所述当前评价词集合分别与每个所述回复词库之间的相似度
Figure DEST_PATH_IMAGE002
,且
Figure DEST_PATH_IMAGE004
,得到多个所述相似度;
其中,
Figure DEST_PATH_IMAGE006
表示所述当前评价词集合;
Figure DEST_PATH_IMAGE008
表示所述回复词库;
Figure DEST_PATH_IMAGE010
表示所述当前评价词集合与所述回复词库中相同的元素;
Figure DEST_PATH_IMAGE012
表示所述当前评价词集合与所述回复词库中的所有元素;
Figure DEST_PATH_IMAGE014
表示计算括号中集合所对应的元素数量;
将多个所述相似度中的最大相似度对应的所述回复词库作为所述当前回复词库。
6.根据权利要求2所述的方法,其特征在于,每个所述候选回复具有一种情感类别,所述情感类别包括正向情感、负向情感或者中性情感;具有相同重点词的多个所述候选回复的情感类别涵盖所述正向情感、所述负向情感和所述中性情感;
所述获取当前评价词集合包括:处理所述评价文本,得到所述当前评价词集合的情感类别;
所述从所述当前回复词库对应的多个候选回复中选取一个候选回复作为回复所述评价文本的回复内容,包括:
将所述当前回复词库对应的候选回复中与所述当前评价词集合的情感类别相同的候选回复作为所述回复内容。
7.一种确定回复内容的装置,其特征在于,包括:获取模块、处理模块和选取模块;
所述获取模块用于获取当前评价词集合,所述当前评价词集合包括从待回复的评价文本中所提取出的多个评价词;
所述处理模块用于基于所述当前评价词集合中的评价词与回复词库中的回复词,确定所述当前评价词集合与所述回复词库是否相匹配,并将与所述当前评价词集合相匹配的回复词库作为当前回复词库;每个所述回复词库对应多个候选回复,且所述回复词库包括从对应的多个候选回复中提取出的多个回复词;
所述选取模块用于从所述当前回复词库对应的多个候选回复中选取一个候选回复作为回复所述评价文本的回复内容。
8.根据权利要求7所述的装置,其特征在于,该装置还包括:提取模块和扩展模块;
所述提取模块用于从具有相同重点词的多个所述候选回复中提取多个候选词,所述候选词包括所述重点词和多个第一非名词,所述重点词为多个所述候选回复共同具有的名词;以及
所述扩展模块用于对所述候选词中的所述重点词进行复制扩展,将多个所述第一非名词和扩展后的多个所述重点词作为所述回复词,生成与多个所述候选回复对应的包含多个所述回复词的回复词库;
所述获取模块包括:复制单元;
所述复制单元用于对所述评价文本提取多个当前关键词,所述当前关键词包括至少一个当前名词和至少一个第二非名词,对所述当前关键词中的所述当前名词进行复制扩展,将至少一个所述第二非名词和扩展后的多个所述当前名词作为所述评价词,生成包含多个所述评价词的所述当前评价词集合。
9.一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在于,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的确定回复内容的方法中的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的确定回复内容的方法中的步骤。
CN202210076588.3A 2022-01-24 2022-01-24 一种确定回复内容的方法、装置及电子设备 Active CN114117021B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210076588.3A CN114117021B (zh) 2022-01-24 2022-01-24 一种确定回复内容的方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210076588.3A CN114117021B (zh) 2022-01-24 2022-01-24 一种确定回复内容的方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN114117021A true CN114117021A (zh) 2022-03-01
CN114117021B CN114117021B (zh) 2022-04-01

Family

ID=80361001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210076588.3A Active CN114117021B (zh) 2022-01-24 2022-01-24 一种确定回复内容的方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114117021B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114840658A (zh) * 2022-07-06 2022-08-02 浙江口碑网络技术有限公司 评价回复方法、电子设备及计算机存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020156817A1 (en) * 2001-02-22 2002-10-24 Volantia, Inc. System and method for extracting information
US20090112828A1 (en) * 2006-03-13 2009-04-30 Answers Corporation Method and system for answer extraction
CN103914570A (zh) * 2014-04-25 2014-07-09 北京中讯爱乐科技有限公司 基于字符串相似度算法的智能客服搜索方法与系统
CN105912734A (zh) * 2016-06-22 2016-08-31 北京金山安全软件有限公司 一种用户反馈自动回复方法及装置
CN107436709A (zh) * 2016-05-25 2017-12-05 富泰华工业(深圳)有限公司 一种具有辅助回复功能的电子装置及辅助回复方法
CN110069612A (zh) * 2019-04-28 2019-07-30 河北省讯飞人工智能研究院 一种回复生成方法及装置
CN110096567A (zh) * 2019-03-14 2019-08-06 中国科学院自动化研究所 基于qa知识库推理的多轮对话回复选择方法、系统
WO2019167281A1 (ja) * 2018-03-02 2019-09-06 富士通株式会社 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム
CN111026855A (zh) * 2019-12-06 2020-04-17 易小博(武汉)科技有限公司 智能客服应答方法、系统以及控制器和介质
CN111414462A (zh) * 2020-02-21 2020-07-14 网易(杭州)网络有限公司 一种对话语句确定方法、装置、计算机设备和介质
CN111797898A (zh) * 2020-06-03 2020-10-20 武汉大学 一种基于深度语义匹配的在线评论自动回复方法
CN112118169A (zh) * 2019-06-21 2020-12-22 腾讯科技(深圳)有限公司 消息回复方法、装置、终端及存储介质
CN112241448A (zh) * 2019-07-18 2021-01-19 阿里巴巴集团控股有限公司 应答信息生成方法、装置、设备及存储介质
US20210049195A1 (en) * 2018-05-14 2021-02-18 Fujitsu Limited Computer-readable recording medium recording answering program, answering method, and answering device
CN113411246A (zh) * 2020-03-16 2021-09-17 北京搜狗科技发展有限公司 一种回复处理方法、装置和用于回复处理的装置
CN113641937A (zh) * 2021-08-17 2021-11-12 杭州时趣信息技术有限公司 一种评论自动回复方法、系统及存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020156817A1 (en) * 2001-02-22 2002-10-24 Volantia, Inc. System and method for extracting information
US20090112828A1 (en) * 2006-03-13 2009-04-30 Answers Corporation Method and system for answer extraction
CN103914570A (zh) * 2014-04-25 2014-07-09 北京中讯爱乐科技有限公司 基于字符串相似度算法的智能客服搜索方法与系统
CN107436709A (zh) * 2016-05-25 2017-12-05 富泰华工业(深圳)有限公司 一种具有辅助回复功能的电子装置及辅助回复方法
CN105912734A (zh) * 2016-06-22 2016-08-31 北京金山安全软件有限公司 一种用户反馈自动回复方法及装置
WO2019167281A1 (ja) * 2018-03-02 2019-09-06 富士通株式会社 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム
US20210049195A1 (en) * 2018-05-14 2021-02-18 Fujitsu Limited Computer-readable recording medium recording answering program, answering method, and answering device
CN110096567A (zh) * 2019-03-14 2019-08-06 中国科学院自动化研究所 基于qa知识库推理的多轮对话回复选择方法、系统
CN110069612A (zh) * 2019-04-28 2019-07-30 河北省讯飞人工智能研究院 一种回复生成方法及装置
CN112118169A (zh) * 2019-06-21 2020-12-22 腾讯科技(深圳)有限公司 消息回复方法、装置、终端及存储介质
CN112241448A (zh) * 2019-07-18 2021-01-19 阿里巴巴集团控股有限公司 应答信息生成方法、装置、设备及存储介质
CN111026855A (zh) * 2019-12-06 2020-04-17 易小博(武汉)科技有限公司 智能客服应答方法、系统以及控制器和介质
CN111414462A (zh) * 2020-02-21 2020-07-14 网易(杭州)网络有限公司 一种对话语句确定方法、装置、计算机设备和介质
CN113411246A (zh) * 2020-03-16 2021-09-17 北京搜狗科技发展有限公司 一种回复处理方法、装置和用于回复处理的装置
CN111797898A (zh) * 2020-06-03 2020-10-20 武汉大学 一种基于深度语义匹配的在线评论自动回复方法
CN113641937A (zh) * 2021-08-17 2021-11-12 杭州时趣信息技术有限公司 一种评论自动回复方法、系统及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨开平等: "基于网络回复的律师评价方法", 《计算机科学》 *
林旭东等: "基于Web的中文开放式问题回答系统", 《计算机科学》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114840658A (zh) * 2022-07-06 2022-08-02 浙江口碑网络技术有限公司 评价回复方法、电子设备及计算机存储介质

Also Published As

Publication number Publication date
CN114117021B (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
CN109408526B (zh) Sql语句生成方法、装置、计算机设备及存储介质
US11783197B2 (en) Using meta-information in neural machine translation
US11403680B2 (en) Method, apparatus for evaluating review, device and storage medium
US11645458B2 (en) Systems and methods for automatically scrubbing sensitive data
US20220351487A1 (en) Image Description Method and Apparatus, Computing Device, and Storage Medium
KR20190131065A (ko) 대화 중 미션 변경의 검출
KR20190039572A (ko) 다음 사용자 프롬프트 유형 선택하기
CN106897439A (zh) 文本的情感识别方法、装置、服务器以及存储介质
US20210056169A1 (en) Example based entity extraction, slot filling and value recommendation
CN114580382A (zh) 文本纠错方法以及装置
CN111144120A (zh) 一种训练语句的获取方法、装置、存储介质及电子设备
US10380261B2 (en) Conversational language and informational response systems and methods
CN111310440A (zh) 文本的纠错方法、装置和系统
CN111078842A (zh) 查询结果的确定方法、装置、服务器及存储介质
CN112163067A (zh) 一种语句答复方法、语句答复装置及电子设备
US11960842B2 (en) Methods and apparatus for natural language understanding in conversational systems using machine learning processes
US20160140634A1 (en) System, method and non-transitory computer readable medium for e-commerce reputation analysis
CA3009699A1 (en) Method and apparatus for determining expense category distance between transactions via transaction signatures
CN107590130A (zh) 场景确定方法及装置、存储介质和电子设备
CN109710951A (zh) 基于翻译历史的辅助翻译方法、装置、设备及存储介质
CN110348007A (zh) 一种文本相似度确定方法及装置
CN114117021B (zh) 一种确定回复内容的方法、装置及电子设备
CN111737978A (zh) 一种购物评价情感分析的方法、装置及电子设备
CN112527967A (zh) 文本匹配方法、装置、终端和存储介质
CN108268602A (zh) 分析文本话题点的方法、装置、设备和计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220630

Address after: 100040 rooms m1805, m1807 and m1809, 18 / F, China Ruida building, 74 Lugu Road, Shijingshan District, Beijing

Patentee after: Beijing xinqitian E-Commerce Technology Co.,Ltd.

Address before: 100040 rooms m1805, m1807 and m1809, 18 / F, China Ruida building, 74 Lugu Road, Shijingshan District, Beijing

Patentee before: Beijing Shuzhi Xintian Information Technology Consulting Co.,Ltd.

TR01 Transfer of patent right