CN113626573A - 一种销售会话异议及应对提取方法及系统 - Google Patents
一种销售会话异议及应对提取方法及系统 Download PDFInfo
- Publication number
- CN113626573A CN113626573A CN202110920147.2A CN202110920147A CN113626573A CN 113626573 A CN113626573 A CN 113626573A CN 202110920147 A CN202110920147 A CN 202110920147A CN 113626573 A CN113626573 A CN 113626573A
- Authority
- CN
- China
- Prior art keywords
- session
- sales
- conversation
- fragment
- role
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004044 response Effects 0.000 title claims abstract description 136
- 238000000605 extraction Methods 0.000 title claims description 42
- 239000012634 fragment Substances 0.000 claims abstract description 170
- 238000000034 method Methods 0.000 claims abstract description 50
- 230000010485 coping Effects 0.000 claims abstract description 6
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 21
- 238000012795 verification Methods 0.000 description 16
- 230000011218 segmentation Effects 0.000 description 9
- 238000013145 classification model Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 208000031361 Hiccup Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种销售会话异议及应对提取方法,属于自然语言处理技术领域,解决了现有销售会话无法准确识别客户异议及销售代表应对的问题。该方法包括以下步骤:获取销售会话,确定销售会话涉及的会话主体;基于会话主体的切换切分所述销售会话,得到按会话顺序排序的多个文本格式的会话片段;识别每一会话片段的角色标签,并基于每一会话片段的角色标签和会话主体,得到每一会话片段的角色信息;对全部会话片段进行主题提取,并基于提取出的主题,对会话片段进行段落划分,并确定每一段落的段落主题;对每一段落内的客户及销售会话片段进行应答匹配,提取出异议及应对匹配结果。
Description
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种销售会话异议及应对提取方法及系统。
背景技术
在销售会话中,客户提出异议、销售代表正确应对客户提出的异议是促使交易达成的重要步骤。因此,从海量销售会话中识别出客户提出的异议、以及销售代表针对该异议的应对,是对销售过程进行复盘、并最终提升交易成功率的有效方法。
现有技术主要包括以下两种识别客户提出的异议、以及销售代表针对该异议的应对的方法:
第一、人工提取方法;
人工提取方法对执行提取过程的工作人员的业务能力具备很高要求,需要其能够准确识别异议,并能够辨别出哪些会话是针对该异议的应对;人工提取方法效率极低,无法处理海量会话;
第二、关键词匹配方法:
获取销售会话语音文件,通过语音识别方式将语音文件转录成文本文件,对文本文件进行异议关键词匹配,若文本文件中的文本内容匹配于预设的异议关键词,则认定为客户提出异议,并选取匹配于预设的异议关键词的文本内容附近的上下文作为销售应对。
关键词匹配方法的缺陷是,其只能定位到异议的具体位置,而无法完整地提取出异议及针对该异议的应对,从而无法对海量异议和应对进行综合分析。
综上,现有销售会话无法准确识别客户异议及销售代表应对。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种销售会话异议及应对提取方法及系统,用以解决现有销售会话无法准确识别客户异议及销售代表应对的问题。
一方面,本发明公开了一种销售会话异议及应对提取方法,包括以下步骤:
获取销售会话,确定所述销售会话涉及的会话主体;基于所述会话主体的切换切分所述销售会话,得到按会话顺序排序的多个文本格式的会话片段;其中,一个会话片段唯一对应一个会话主体;
识别每一会话片段的角色标签,并基于每一会话片段的角色标签和会话主体,得到每一会话片段的角色信息;所述角色信息为销售和客户;
对全部会话片段进行主题提取,并基于提取出的主题,对会话片段进行段落划分,并确定每一段落的段落主题;
将角色为客户的会话片段作为客户会话片段,将角色为销售的会话片段作为销售会话片段;对每一段落内的客户及销售会话片段进行应答匹配,提取出异议及应对匹配结果。
在上述方案的基础上,本发明还做出了如下改进:
进一步,其特征在于,通过执行以下操作得到每一会话片段的角色信息:
将全部会话片段输入至角色识别模型,得到每一会话片段的角色标签,所述角色标签为销售、客户或不确定。
进一步,通过执行以下操作得到每一会话片段的角色信息:
将销售会话涉及的两个会话主体中的一个作为第一会话主体、另一个作为第二会话主体;
获取第一会话主体中角色标签为销售或客户的会话片段的总数,记为N1;获取第一会话主体中角色标签为销售的会话片段的总数,记为N11;
获取第二会话主体中角色标签为销售或客户的会话片段的总数,记为N2;获取第二会话主体中角色标签为销售的会话片段的总数,记为N21;
若N11/N1大于N21/N2,表明第一会话主体为销售的概率更高,此时,可以确定:第一会话主体的角色为销售,第二会话主体的角色为客户;否则,第一会话主体的角色为客户,第二会话主体的角色为销售;
将所述会话主体的角色作为对应于该会话主体的会话片段的角色信息。
进一步,通过执行以下操作对会话片段进行段落划分:
将完整会话片段与主题库中的主题进行匹配,并在匹配成功的会话片段中提取出匹配的主题,得到提取主题的完整会话片段;
确定提取主题的完整会话片段中每一个会话片段所属的主题、属于该主题的概率以及属于上一个会话片段所属主题的概率;
依次读取每一会话片段属于上一会话片段所属主题的概率,若该会话片段属于上一会话片段所属主题的概率大于设定阈值,则将该会话片段划分至同一段落,否则,将该会话片段划分至下一段落。
进一步,通过执行以下操作确定每一段落的段落主题:
在每一段落中,对于该段落中所有会话片段的每一主题,累加每一会话片段属于该主题的概率,将累加概率之和最高的主题作为该段落的段落主题。
进一步,通过执行以下操作提取出异议及应对匹配结果:
对于每一段落,依次获取段落中的每一客户会话片段;每获取一个客户会话片段,均执行以下过程:
依次获取该客户会话片段之后的销售会话片段,每获取一个销售会话片段,对获取到的客户会话片段与销售会话片段进行应答匹配判断:
若匹配成功,则该客户会话片段与销售会话片段构成一个应答对;
若匹配失败,则接着获取下一条销售会话片段,并重新执行应答匹配的判断过程,直至匹配成功或遍历完所有销售会话片段;
并跳转至获取下一条客户会话片段;
对每一段落中提取出的全部应答对进行分类;
将标记分类类别的应答对作为最终的异议及应对匹配结果。
进一步,所述方法还包括:
结合段落主题,从应答匹配结果中识别出应答实体及对应的实体意见。
进一步,对于应答匹配结果中的每一应答对,
若匹配于预设的实体词库中的实体词,则将匹配的实体词作为该应答对的应答实体;之后,判断该应答对中是否还存在该应答实体对应的实体意见,若存在,则提取该应答对对应的实体意见;
若应答对不匹配于预设的实体库中的实体词,则先判断应答对中是否包含实体意见,若包含,则进一步判断该实体意见与应答对所在段落的段落主题是否匹配,若匹配,则将该段落主题作为该应答对的应答实体。
进一步,所述方法还包括:
对识别出的应答实体及对应的实体意见进行结构化存储。
另一方面,本发明还公开了一种销售会话异议及应对提取系统,包括:
会话片段获取模块,用于获取销售会话,确定所述销售会话涉及的会话主体;基于所述会话主体的切换切分所述销售会话,得到按会话顺序排序的多个文本格式的会话片段;其中,一个会话片段唯一对应一个会话主体;
会话片段角色信息确定模块,用于识别每一会话片段的角色标签,并基于每一会话片段的角色标签和会话主体,得到每一会话片段的角色信息;所述角色信息为销售和客户;
段落划分模块,用于对全部会话片段进行主题提取,并基于提取出的主题,对会话片段进行段落划分,并确定每一段落的段落主题;
异议及应对提取模块,用于将角色为客户的会话片段作为客户会话片段,将角色为销售的会话片段作为销售会话片段;对每一段落内的客户及销售会话片段进行应答匹配,提取出异议及应对匹配结果。
与现有技术相比,本发明至少可实现如下有益效果之一:
本发明提供的一种销售会话异议及应对提取方法及系统,提供了一种自动获取销售会话异议及应对的方式,有效解决了人工提取方式提取效率较低、无法处理海量会话的问题。
在本发明的方案中,对销售会话依次进行会话片段生成、角色确定及段落划分,从而将同一主题的会话片段划分至同一段落中;然后,对每一段落内的客户及销售会话片段进行应答匹配,提取出异议及应对匹配结果。由于同一段落内的销售会话围绕同一段落主题展开,因此,通过先进行段落划分、然后执行每一段落内的应答匹配,能够提升应答匹配的成功率和准确率,同时便于用户快速与各段落主题相关的异议及应对匹配。
综上,本发明提供的销售会话异议及应对提取方法及系统,可以对海量的销售会话进行分析,从中提取出客户异议和销售应对,并进行结构化存储,能够帮助销售团队快速高效地对销售过程进行复盘,从中挑选出典型的有效应对和无效应对。根据异议和应对内部员工进行培训,最终提升交易成功率。
本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为本发明实施例1中的销售会话异议及应对提取方法流程图;
图2为本发明实施例1中增加角色标记前、后的会话片段示例;
图3为本发明实施例1中主题识别模型处理前后示意图;
图4为本发明实施例1中由主题识别模型处理输出的每一会话片段的主题及相关概率示例;
图5为本发明实施例1中基于应答对提取模型确定应答对的过程;
图6为本发明实施例1中应答对类型的确定过程;
图7为本发明实施例2中的销售会话异议及应对提取系统结构示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
实施例1
本发明的具体实施例1,公开了一种销售会话异议及应对提取方法,流程图如图1所示,该方法包括如下步骤:
步骤S1:获取销售会话,确定所述销售会话涉及的会话主体;基于所述会话主体的切换切分所述销售会话,得到按会话顺序排序的多个文本格式的会话片段;其中,一个会话片段唯一对应一个会话主体;
优选地,本实施例中的销售会话为音频、视频、文本或IM等多种格式;同时,该销售会话可以是口语会话,也可以正式会话。
优选地,步骤S1具体包括:
步骤S11:确定所述销售会话涉及的会话主体;具体地,
当销售会话为音频或视频格式时,可利用人声分离模型确定销售会话涉及的会话主体;
当销售会话为文本或IM格式时,文本或IM文件中直接体现出销售会话涉及的会话主体;
步骤S12:基于所述会话主体的切换切分所述销售会话,得到按会话顺序排序的多个文本格式的会话片段;
以会话主体的切换为节点,将所述销售会话切分成按会话顺序排序的多个文本格式的会话片段。
需要说明的是,由于销售会话是以对答形式展开,因此,大部分场景下,销售会话涉及两个会话主体,且会存在多次会话主体的切换,形如会话主体A-会话主体B-会话主体A-会话主体B-......
当销售会话为音频或者视频格式,且切换至一个会话主体时,通过执行以下操作获得当前会话主体下的会话片段:
步骤S121:预设短句切分时间阈值及子段落切分时间阈值;
步骤S122:在基于人声分离模型将音频或视频转换录文本格式的过程中,若会话间隔时间大于短句切分时间阈值,则基于短句切分时间阈值切分当前会话主体下的销售会话,得到按照会话顺序排序的多个文本格式的会话语句,并记录每一会话语句的开始时间、结束时间;
步骤S123:分析得到的会话语句,若前一会话语句的结束时间与后一会话语句的开始时间的时间差大于子段落切分时间阈值,则将前一会话语句和后一会话语句划分到不同的子段落中;否则,将前一会话语句与后一会话语句拼接成为连续的两个会话语句,并划分到同一子段落中;划分完成后,得到当前会话主体下的会话片段。
示例性地,短句切分时间阈值及子段落切分时间阈值均用于描述两句会话之间的时间间隔,且短句切分时间阈值小于子段落切分时间阈值,两个时间阈值可根据具体情况相应设置;
优选地,在本实施例中,人声分离模型还通过以下方式进行改善:
设置热词子模型:考虑到不同行业的高频专业词汇不同,根据销售会话所属的行业,向热词表中增加该行业的高频专业词汇;在利用人声分离模型将音频或视频转录成文本格式的过程中,还基于热词子模型进行专业词汇的转录,从而进行提升专业词汇的转录效果;
设置自学习语言子模型:考虑到不同行业会有不同的专业话术,根据销售会话所属的行业,通过该行业的专业话术文本训练的自学习语言子模型;在利用人声分离模型将音频或视频转录成文本格式的过程中,还基于自学习语言子模型进行专业话术的转录,从而有效提升销售对话的转录效果。
在得到按会话顺序排序的多个文本格式的会话片段后,为提升后续处理过程的准确度和速度,还可以包括预处理会话片段的步骤;优选地,所述预处理方式包括:纠错处理、删除多余的语气词和/或删除多余叠词。
具体地,步骤S13:通过执行以下操作预处理所述会话片段:
纠错处理,用于优化会话片段,以供后续文本分析流程使用;具体地,包括:
分析会话片段内的标点符号及分句是否合理,若不合理,则调整标点符号及分句。示例性地,转录出的文本中问句的标点符号可能存在不合理的情况,如,问句不是以“?”结束。此时,可以先识别出问句,将问句结尾的标点符号统一为“?”;同时,在步骤S123中,简单通过时间阈值进行断句的方式容易导致一个会话语句被拆分为多个会话语句的情况;因此,对于每一会话片段,还要依次判断每一会话片段中的相邻的会话语句是否构成一个完整的会话语句,若是,则将该相邻的会话语句拼接成一个会话语句。
删除多余的语气词,用于删除会话片段中多余的语气词,便于数据分析和产品交互展示;由于销售会话可以是口语会话,因此,销售会话中可能存在很多语气词,这些语气词同样会体现在会话片段中。例如:嗯、啊、呃等,这些词汇对会话分析没有帮助,因此,需要删除多余的语气词。本实施例中删除语气词过程为:若一个会话片段中只有语气词,没有其他词汇,则保留第一个语气词;否则,删除语气词,保留其他信息。
删除多余叠词,用于删除会话片段中多余的词汇,便于数据分析和产品交互展示;本实施例中删除多余叠词过程为:查找相邻的重复词汇,判断重复词汇是否在排除词表中,若不在排除词表中,则对相邻词汇进行去重,仅保留一个;示例性地,若会话片段的内容为“我觉得觉得价格太贵了”,这里,“觉得觉得”就是多余叠词(即,相邻的重复词汇),此时,保留一个“觉得”即可,删除多余叠词后,得到的会话片段为“我觉得价格太贵了”。
基于预处理后的会话片段,执行后续(步骤S2及之后)的处理过程。
步骤S2:识别每一会话片段的角色标签,并基于每一会话片段的角色标签和会话主体,得到每一会话片段的角色信息;所述角色信息为销售和客户;具体地,
步骤S21:将全部会话片段输入至角色识别模型,得到每一会话片段的角色标签,所述角色标签为销售、客户或不确定;
由于销售和客户的会话术语存在比较明显的差别,例如:销售提及较多的词如“性价比很高”、“特惠价”及“业内第一”等,客户提及较多的词如“太贵了”、“便宜点”及“质量不好”等。从列举出来的部分词汇可以看出,销售和客户提及的词汇有很大区别。同时,也有一些术语是销售和客户都有可能提及的,如,“您好”、“再看一下”、“我知道了”等。因此,基于销售会话的上述特点,本实施例构建了如下角色识别模型:
获取标准销售会话(将具备代表性的销售会话作为标准销售会话)对应的会话片段样本,并标记每一会话片段样本的角色标签,角色标签为销售、客户或不确定;将部分会话片段样本及其角色标签作为角色识别模型的训练集,将剩余会话片段样本及其角色标签作为角色识别模型的验证集;
基于角色识别模型的训练集训练角色识别模型,基于角色识别模型的验证集验证角色识别模型,并得到验证通过的角色识别模型。
为保证训练及验证效果,训练集和验证集中的会话片段样本数量应足够大,各标签对应的会话片段样本应均匀分布。
步骤S22:基于每一会话片段的角色标签及会话主体,识别所述会话主体的角色;
将销售会话涉及的两个会话主体中的一个作为第一会话主体、另一个作为第二会话主体;
获取第一会话主体中角色标签为销售或客户的会话片段的总数,记为N1;获取第一会话主体中角色标签为销售的会话片段的总数,记为N11;
获取第二会话主体中角色标签为销售或客户的会话片段的总数,记为N2;获取第二会话主体中角色标签为销售的会话片段的总数,记为N21;
若N11/N1大于N21/N2,表明第一会话主体为销售的概率更高,此时,可以确定:第一会话主体的角色为销售,第二会话主体的角色为客户;否则,第一会话主体的角色为客户,第二会话主体的角色为销售。
或者,
获取第一会话主体中角色标签为客户的会话片段的总数,记为N12;
获取第二会话主体中角色标签为客户的会话片段的总数,记为N22;
若N12/N1大于N22/N2,表明第一会话主体为客户的概率更高,此时,可以确定:第一会话主体的角色为客户,第二会话主体的角色为销售;否则,第一会话主体的角色为销售,第二会话主体的角色为客户。
将所述会话主体的角色作为对应于该会话主体的会话片段的角色信息。
基于上述操作,即可得到每一会话主体的角色,从而得到每一会话片段的角色信息。增加角色标记前、后的会话片段示例如图2所示。
步骤S3:对全部会话片段进行主题提取,并基于提取出的主题,对会话片段进行段落划分,并确定每一段落的段落主题;
步骤S31:将完整会话片段与主题库中的主题进行匹配,并在匹配成功的会话片段中提取出匹配的主题,得到提取主题的完整会话片段;
优选地,考虑到完整会话片段中提取出的各主题的出现频率并不相同,主题的出现频率越高,表明会话片段与该主题的关联度越高;主题的出现频率越低,表明会话片段与该主题的关联度越低。因此,将完整会话片段与主题库中的主题进行匹配时,还计算每一匹配的主题的出现频率,若主题的出现频率高于主题频率阈值,则该主题匹配成功,否则,该主题匹配不成功。
步骤S32:确定提取主题的完整会话片段中每一个会话片段所属的主题、属于该主题的概率以及属于上一个会话片段所属主题的概率;
具体地,将完整会话片段输入至主题识别模型,由主题识别模型处理后输出每一会话片段属于各主题的概率,以及属于上一个会话片段所属主题的概率。其中,每一会话片段所属的主题为一个或多个。由于第一句会话片段没有上文信息,因此,第一个会话片段属于上一个会话片段所属主题的概率为100%。
主题识别模型通过如下方式确定:
获取标准销售会话对应的、提取(标记)主题的、连续的会话片段样本,并标记每一会话片段样本的主题识别标签,这里的主题识别标签包括主题标签及关联标签,其中,主题标签为:会话片段样本所属的主题标签;关联标签为:属于上一会话片段所属主题的标签,或,不属于上一会话片段所属主题的标签。将部分连续的会话片段样本及其主题是被标签作为主题识别模型的训练集,将剩余连续的会话片段样本及其主题识别标签作为主题识别模型的验证集;
基于主题识别模型的训练集训练主题识别模型,基于主题识别模型的验证集验证主题识别模型,并得到验证通过的主题识别模型。
为保证训练及验证效果,训练集和验证集中的会话片段样本数量应足够大,各主题识别标签对应的会话片段样本应均匀分布。
示例性地,训练主题识别模型时,
模型输入为:会话片段样本;以及,每一会话片段样本主题识别标签;其中,主题标签为各主题对应的标签,如:
主题:交付时间,主题标签:1;
主题:价格,主题标签:2;
主题:下一步,主题标签:3;
关联标签可按照如下方式设置:
0:不属于上一主题;
1:属于上一主题。
基于上述话片段样本以及每一会话片段样本主题标签对主题识别模型进行训练及验证。
模型输出为:每一会话片段样本所属的主题标签,以及,属于该主题的概率,实质上是多分类输出;还包括:该会话片段样本属于上一会话片段样本中主题的概率,实质上是一个二分类。
步骤S33:依次读取每一会话片段属于上一会话片段所属主题的概率,若该会话片段属于上一会话片段所属主题的概率大于设定阈值,则将该会话片段划分至同一段落,否则,将该会话片段划分至下一段落。
主题识别模型处理前后示意图如图3所示。由主题识别模型处理输出的每一会话片段的主题及相关概率示例如图4所示。
步骤S34:在每一段落中,对于该段落中所有会话片段的每一主题,累加每一会话片段属于该主题的概率,将累加概率之和最高的主题作为该段落的段落主题。
步骤S4:将角色为客户的会话片段作为客户会话片段,将角色为销售的会话片段作为销售会话片段;对每一段落内的客户及销售会话片段进行应答匹配,提取出异议及应对匹配结果;具体地,
步骤S41:对于每一段落,依次获取段落中的每一客户会话片段;
每获取一个客户会话片段,均执行以下过程:
依次获取该客户会话片段之后的销售会话片段,每获取一个销售会话片段,对获取到的客户会话片段与销售会话片段进行应答匹配判断:
若匹配成功,则该客户会话片段与销售会话片段构成一个应答对;
若匹配失败,则接着获取下一条销售会话片段,并重新执行应答匹配的判断过程,直至匹配成功或遍历完所有销售会话片段;
并跳转至获取下一条客户会话片段。
在上述过程中,基于应答对提取模型进行应答匹配判断,具体地,
将客户会话片段与销售会话片段输入至应答对提取模型,由应答对提取模型处理后输出匹配成功或匹配失败的结果。
通过执行以上操作,可以得到该段落中所有的客户和销售的应答对;
本实施例构建了如下应答对提取模型:
获取标准销售会话对应的段落会话样本,该段落会话样本中包括了多条客户和销售的会话片段样本,并标记每一客户和销售的会话片段样本的应答标签,其中,应答标签为:属于同一应答对的标签,或,不属于同一应答对的标签。将部分客户和销售会话片段样本及其应答标签作为应答对提取模型的训练集,将剩余客户和销售会话片段样本及其标签作为应答对提取模型的验证集;基于应答对提取模型的训练集训练应答对提取模型,基于应答对提取模型的验证集验证应答对提取模型,并得到验证通过的应答对提取模型。
基于应答对提取模型确定应答对的过程如图5所示。
步骤S42:对每一段落中提取出的全部应答对进行分类,示例性地,应答对类型包括回答疑问、质疑应对、挑战应对和拒绝应对。
将每一应答对依次输入至应答对分类模型中,从而获得应答对的类型信息。
通过以下方式构建应答对分类模型:
获取标准销售会话对应的应答对样本,并标记应答对样本的应答对类型标签,应答对类型标签包括:回答疑问标签、质疑应对标签、挑战应对标签及拒绝应对标签。将部分应答对及其应答对类型标签作为应答对分类模型的训练集,将剩余应答对及其应答对类型标签作为应答对分类模型的验证集;基于应答对分类模型的训练集训练应答对提取模型,基于应答对分类模型的验证集验证应答对分类模型,并得到验证通过的应答对分类模型。
这里要保证不同类别样本数据量足够大,并且要类别均衡。模型预测时,模型输入信息为会话问答对,输出信息为对应的标签概率。到这里即可知晓应答对的具体类别。
应答对类型的确定过程如图6所示。
步骤S43:将标记分类类别的应答对作为最终的异议及应对匹配结果。
步骤S5:结合段落主题,从应答匹配结果中识别出应答实体及对应的实体意见;具体地,
对于应答匹配结果中的每一应答对,若匹配于预设的实体词库中的实体词,则将匹配的实体词作为该应答对的应答实体;
之后,判断该应答对中是否还存在该应答实体对应的实体意见,若存在,则提取该应答对对应的实体意见。
这里,可以预先构建应答实体与意见之间的映射关系表,用于描述客户对于每一应答实体可能的意见;此时,可通过将应答对与应答实体与意见之间的映射关系表进行匹配,以确定是否存在应答实体对应的实体意见的判断。
示例性地,形如“价格太贵了”的会话片段,“价格”是应答实体,“太贵了”是应答实体对应的实体意见。再例如,“不喜欢这种户型”,“户型”是应答实体,“不喜欢”是应答实体对应的实体意见。例如:贵、便宜、划算等,这类表述都是对价格实体的意见描述词;差、坏、不好等,这类表述都是对质量实体的意见描述词。基于上述描述,可以预先构建实体词库、以及应答实体与意见之间的映射关系表,以便更好地执行步骤S5中的内容。
此外,若应答对不匹配于预设的实体库中的实体词,则先判断应答对中是否包含实体意见,若包含,则进一步判断该实体意见与应答对所在段落的段落主题是否匹配,若匹配,则将该段落主题作为该应答对的应答实体。例如,在主题为价格讨论的会话段落中,客户只说了“太贵了”,可以通过“贵”匹配到实体是“价格”,结合起来就是“价格太贵了”。
步骤S6:对识别出的应答实体及对应的实体意见进行结构化存储。为销售进行复盘、培训、提升用户体验提供支持。如表1所示。
表1应答实体及对应的实体意见结构化存储示意表
会话ID | 段落主题 | 实体 | 客户意见 | 销售应对 |
10896 | 价格 | 价格 | 太贵了 | 我给您介绍一下收费的明细 |
10896 | 产品 | 户型 | 不喜欢 | 我再给您推荐其它户型的 |
综上,本实施例提供的销售会话异议及应对提取方法,可以对海量的销售会话进行分析,提取出客户意见和销售应对,并进行结构化存储,帮助销售团队快速高效地对销售过程进行复盘,挑选出典型的有效应对和无效应对。根据异议和应对内部员工进行培训,最终提升交易成功率。
实施例2
本发明实施例2公开了一种销售会话异议及应对提取系统,与实施例1中的方法相对应,该系统的结构示意图如图7所示,包括:
会话片段获取模块,用于获取销售会话,确定所述销售会话涉及的会话主体;基于所述会话主体的切换切分所述销售会话,得到按会话顺序排序的多个文本格式的会话片段;其中,一个会话片段唯一对应一个会话主体;
会话片段角色信息确定模块,用于识别每一会话片段的角色标签,并基于每一会话片段的角色标签和会话主体,得到每一会话片段的角色信息;所述角色信息为销售和客户;
段落划分模块,用于对全部会话片段进行主题提取,并基于提取出的主题,对会话片段进行段落划分,并确定每一段落的段落主题;
异议及应对提取模块,用于将角色为客户的会话片段作为客户会话片段,将角色为销售的会话片段作为销售会话片段;对每一段落内的客户及销售会话片段进行应答匹配,提取出异议及应对匹配结果。
此外,还可以包括:
应答实体及实体意见识别模块,用于结合段落主题,从应答匹配结果中识别出应答实体及对应的实体意见。
结构化存储模块,用于对识别出的应答实体及对应的实体意见进行结构化存储。
本发明的系统实施例的具体实施过程参见上述方法实施例即可,本实施例在此不再赘述。
由于本系统实施例与上述方法实施例原理相同,所以本系统也具有上述方法实施例相应的技术效果。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种销售会话异议及应对提取方法,其特征在于,包括以下步骤:
获取销售会话,确定所述销售会话涉及的会话主体;基于所述会话主体的切换切分所述销售会话,得到按会话顺序排序的多个文本格式的会话片段;其中,一个会话片段唯一对应一个会话主体;
识别每一会话片段的角色标签,并基于每一会话片段的角色标签和会话主体,得到每一会话片段的角色信息;所述角色信息为销售和客户;
对全部会话片段进行主题提取,并基于提取出的主题,对会话片段进行段落划分,并确定每一段落的段落主题;
将角色为客户的会话片段作为客户会话片段,将角色为销售的会话片段作为销售会话片段;对每一段落内的客户及销售会话片段进行应答匹配,提取出异议及应对匹配结果。
2.根据权利要求1所述的销售会话异议及应对提取方法,其特征在于,通过执行以下操作识别每一会话片段的角色标签:
将全部会话片段输入至角色识别模型,得到每一会话片段的角色标签,所述角色标签为销售、客户或不确定。
3.根据权利要求2所述的销售会话异议及应对提取方法,其特征在于,通过执行以下操作得到每一会话片段的角色信息:
将销售会话涉及的两个会话主体中的一个作为第一会话主体、另一个作为第二会话主体;
获取第一会话主体中角色标签为销售或客户的会话片段的总数,记为N1;获取第一会话主体中角色标签为销售的会话片段的总数,记为N11;
获取第二会话主体中角色标签为销售或客户的会话片段的总数,记为N2;获取第二会话主体中角色标签为销售的会话片段的总数,记为N21;
若N11/N1大于N21/N2,表明第一会话主体为销售的概率更高,此时,可以确定:第一会话主体的角色为销售,第二会话主体的角色为客户;否则,第一会话主体的角色为客户,第二会话主体的角色为销售;
将所述会话主体的角色作为对应于该会话主体的会话片段的角色信息。
4.根据权利要求1-3中任一项所述的销售会话异议及应对提取方法,其特征在于,通过执行以下操作对会话片段进行段落划分:
将完整会话片段与主题库中的主题进行匹配,并在匹配成功的会话片段中提取出匹配的主题,得到提取主题的完整会话片段;
确定提取主题的完整会话片段中每一个会话片段所属的主题、属于该主题的概率以及属于上一个会话片段所属主题的概率;
依次读取每一会话片段属于上一会话片段所属主题的概率,若该会话片段属于上一会话片段所属主题的概率大于设定阈值,则将该会话片段划分至同一段落,否则,将该会话片段划分至下一段落。
5.根据权利要求4所述的销售会话异议及应对提取方法,其特征在于,通过执行以下操作确定每一段落的段落主题:
在每一段落中,对于该段落中所有会话片段的每一主题,累加每一会话片段属于该主题的概率,将累加概率之和最高的主题作为该段落的段落主题。
6.根据权利要求5所述的销售会话异议及应对提取方法,其特征在于,通过执行以下操作提取出异议及应对匹配结果:
对于每一段落,依次获取段落中的每一客户会话片段;每获取一个客户会话片段,均执行以下过程:
依次获取该客户会话片段之后的销售会话片段,每获取一个销售会话片段,对获取到的客户会话片段与销售会话片段进行应答匹配判断:
若匹配成功,则该客户会话片段与销售会话片段构成一个应答对;
若匹配失败,则接着获取下一条销售会话片段,并重新执行应答匹配的判断过程,直至匹配成功或遍历完所有销售会话片段;
并跳转至获取下一条客户会话片段;
对每一段落中提取出的全部应答对进行分类;
将标记分类类别的应答对作为最终的异议及应对匹配结果。
7.根据权利要求6所述的销售会话异议及应对提取方法,其特征在于,所述方法还包括:
结合段落主题,从应答匹配结果中识别出应答实体及对应的实体意见。
8.根据权利要求7所述的销售会话异议及应对提取方法,其特征在于,对于应答匹配结果中的每一应答对,
若匹配于预设的实体词库中的实体词,则将匹配的实体词作为该应答对的应答实体;之后,判断该应答对中是否还存在该应答实体对应的实体意见,若存在,则提取该应答对对应的实体意见;
若应答对不匹配于预设的实体库中的实体词,则先判断应答对中是否包含实体意见,若包含,则进一步判断该实体意见与应答对所在段落的段落主题是否匹配,若匹配,则将该段落主题作为该应答对的应答实体。
9.根据权利要求7或8所述的销售会话异议及应对提取方法,其特征在于,所述方法还包括:
对识别出的应答实体及对应的实体意见进行结构化存储。
10.一种销售会话异议及应对提取系统,其特征在于,包括:
会话片段获取模块,用于获取销售会话,确定所述销售会话涉及的会话主体;基于所述会话主体的切换切分所述销售会话,得到按会话顺序排序的多个文本格式的会话片段;其中,一个会话片段唯一对应一个会话主体;
会话片段角色信息确定模块,用于识别每一会话片段的角色标签,并基于每一会话片段的角色标签和会话主体,得到每一会话片段的角色信息;所述角色信息为销售和客户;
段落划分模块,用于对全部会话片段进行主题提取,并基于提取出的主题,对会话片段进行段落划分,并确定每一段落的段落主题;
异议及应对提取模块,用于将角色为客户的会话片段作为客户会话片段,将角色为销售的会话片段作为销售会话片段;对每一段落内的客户及销售会话片段进行应答匹配,提取出异议及应对匹配结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110920147.2A CN113626573B (zh) | 2021-08-11 | 2021-08-11 | 一种销售会话异议及应对提取方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110920147.2A CN113626573B (zh) | 2021-08-11 | 2021-08-11 | 一种销售会话异议及应对提取方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113626573A true CN113626573A (zh) | 2021-11-09 |
CN113626573B CN113626573B (zh) | 2022-09-27 |
Family
ID=78384659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110920147.2A Active CN113626573B (zh) | 2021-08-11 | 2021-08-11 | 一种销售会话异议及应对提取方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113626573B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114118060A (zh) * | 2021-11-10 | 2022-03-01 | 北京深维智信科技有限公司 | 一种从销售会话中自动识别关键事件的方法及系统 |
CN114118080A (zh) * | 2021-11-10 | 2022-03-01 | 北京深维智信科技有限公司 | 一种从销售会话中自动识别客户意向的方法及系统 |
CN114186559A (zh) * | 2021-12-09 | 2022-03-15 | 北京深维智信科技有限公司 | 一种从销售会话中确定会话主体角色标签的方法及系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102411611A (zh) * | 2011-10-15 | 2012-04-11 | 西安交通大学 | 一种面向即时交互文本的事件识别与跟踪方法 |
CN106874452A (zh) * | 2017-02-13 | 2017-06-20 | 长沙军鸽软件有限公司 | 一种获取会话回复内容的方法 |
CN107609058A (zh) * | 2017-08-25 | 2018-01-19 | 维沃移动通信有限公司 | 一种销售方法、机器人客服端、人工客服端及用户端 |
US20190005385A1 (en) * | 2017-06-30 | 2019-01-03 | Microsoft Technology Licensing, Llc | Inquiry-based deep learning |
CN110472017A (zh) * | 2019-08-21 | 2019-11-19 | 佰聆数据股份有限公司 | 一种话术分析和话题点识别匹配的方法及系统 |
CN111583906A (zh) * | 2019-02-18 | 2020-08-25 | 中国移动通信有限公司研究院 | 一种语音会话的角色识别方法、装置及终端 |
CN111753062A (zh) * | 2019-11-06 | 2020-10-09 | 北京京东尚科信息技术有限公司 | 一种会话应答方案确定方法、装置、设备及介质 |
CN112182197A (zh) * | 2020-11-09 | 2021-01-05 | 北京明略软件系统有限公司 | 话术推荐方法、装置、设备及计算机可读介质 |
CN112417128A (zh) * | 2021-01-21 | 2021-02-26 | 中国平安人寿保险股份有限公司 | 话术推荐方法、装置、计算机设备及存储介质 |
CN112507072A (zh) * | 2020-12-07 | 2021-03-16 | 上海明略人工智能(集团)有限公司 | 基于对话的销售考评方法、系统及电子设备 |
WO2021114682A1 (zh) * | 2019-12-10 | 2021-06-17 | 平安国际智慧城市科技股份有限公司 | 会话任务生成方法、装置、计算机设备和存储介质 |
CN112988948A (zh) * | 2021-02-05 | 2021-06-18 | 支付宝(杭州)信息技术有限公司 | 业务处理方法以及装置 |
-
2021
- 2021-08-11 CN CN202110920147.2A patent/CN113626573B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102411611A (zh) * | 2011-10-15 | 2012-04-11 | 西安交通大学 | 一种面向即时交互文本的事件识别与跟踪方法 |
CN106874452A (zh) * | 2017-02-13 | 2017-06-20 | 长沙军鸽软件有限公司 | 一种获取会话回复内容的方法 |
US20190005385A1 (en) * | 2017-06-30 | 2019-01-03 | Microsoft Technology Licensing, Llc | Inquiry-based deep learning |
CN107609058A (zh) * | 2017-08-25 | 2018-01-19 | 维沃移动通信有限公司 | 一种销售方法、机器人客服端、人工客服端及用户端 |
CN111583906A (zh) * | 2019-02-18 | 2020-08-25 | 中国移动通信有限公司研究院 | 一种语音会话的角色识别方法、装置及终端 |
CN110472017A (zh) * | 2019-08-21 | 2019-11-19 | 佰聆数据股份有限公司 | 一种话术分析和话题点识别匹配的方法及系统 |
CN111753062A (zh) * | 2019-11-06 | 2020-10-09 | 北京京东尚科信息技术有限公司 | 一种会话应答方案确定方法、装置、设备及介质 |
WO2021114682A1 (zh) * | 2019-12-10 | 2021-06-17 | 平安国际智慧城市科技股份有限公司 | 会话任务生成方法、装置、计算机设备和存储介质 |
CN112182197A (zh) * | 2020-11-09 | 2021-01-05 | 北京明略软件系统有限公司 | 话术推荐方法、装置、设备及计算机可读介质 |
CN112507072A (zh) * | 2020-12-07 | 2021-03-16 | 上海明略人工智能(集团)有限公司 | 基于对话的销售考评方法、系统及电子设备 |
CN112417128A (zh) * | 2021-01-21 | 2021-02-26 | 中国平安人寿保险股份有限公司 | 话术推荐方法、装置、计算机设备及存储介质 |
CN112988948A (zh) * | 2021-02-05 | 2021-06-18 | 支付宝(杭州)信息技术有限公司 | 业务处理方法以及装置 |
Non-Patent Citations (2)
Title |
---|
YINPEI DAI: "A Survey on Dialog Management:Recent Advances and Challenges", 《ARXIV》 * |
袁周敏: "顺应论视角下医药咨询顾问语用身份建构的实证研究", 《中国博士学位论文全文数据库》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114118060A (zh) * | 2021-11-10 | 2022-03-01 | 北京深维智信科技有限公司 | 一种从销售会话中自动识别关键事件的方法及系统 |
CN114118080A (zh) * | 2021-11-10 | 2022-03-01 | 北京深维智信科技有限公司 | 一种从销售会话中自动识别客户意向的方法及系统 |
CN114118080B (zh) * | 2021-11-10 | 2022-09-13 | 北京深维智信科技有限公司 | 一种从销售会话中自动识别客户意向的方法及系统 |
CN114118060B (zh) * | 2021-11-10 | 2022-09-27 | 北京深维智信科技有限公司 | 一种从销售会话中自动识别关键事件的方法及系统 |
CN114186559A (zh) * | 2021-12-09 | 2022-03-15 | 北京深维智信科技有限公司 | 一种从销售会话中确定会话主体角色标签的方法及系统 |
CN114186559B (zh) * | 2021-12-09 | 2022-09-13 | 北京深维智信科技有限公司 | 一种从销售会话中确定会话主体角色标签的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113626573B (zh) | 2022-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110096570B (zh) | 一种应用于智能客服机器人的意图识别方法及装置 | |
CN113626573B (zh) | 一种销售会话异议及应对提取方法及系统 | |
CN107122416B (zh) | 一种中文事件抽取方法 | |
CN104503998B (zh) | 针对用户查询句的类型识别方法及装置 | |
US20230069935A1 (en) | Dialog system answering method based on sentence paraphrase recognition | |
CN113254574A (zh) | 一种机关公文辅助生成方法、装置以及系统 | |
CN112256845A (zh) | 意图识别方法、装置、电子设备和计算机可读存储介质 | |
CN111613214A (zh) | 一种用于提升语音识别能力的语言模型纠错方法 | |
CN110209790A (zh) | 问答匹配方法和装置 | |
CN114118080B (zh) | 一种从销售会话中自动识别客户意向的方法及系统 | |
CN111881297A (zh) | 语音识别文本的校正方法及装置 | |
CN111737424A (zh) | 一种问题的匹配方法、装置、设备及存储介质 | |
CN114492396A (zh) | 用于汽车专有名词的文本错误纠正方法及可读存储介质 | |
CN116127015A (zh) | 基于人工智能自适应的nlp大模型分析系统 | |
CN117332789A (zh) | 一种面向对话场景的语义分析方法及系统 | |
CN114297359A (zh) | 一种对话意图识别方法、装置、电子设备及可读存储介质 | |
CN115983285A (zh) | 问卷稽核方法、装置、电子设备和存储介质 | |
CN107886233B (zh) | 客服的服务质量评价方法和系统 | |
US20120197894A1 (en) | Apparatus and method for processing documents to extract expressions and descriptions | |
CN115391506A (zh) | 针对多段式回复的问答内容标准性检测方法及装置 | |
CN111310457B (zh) | 词语搭配不当识别方法、装置、电子设备和存储介质 | |
CN114328902A (zh) | 文本标注模型构建方法和装置 | |
CN112597295A (zh) | 摘要提取方法、装置、计算机设备和存储介质 | |
CN114078470A (zh) | 模型处理方法及装置、语音识别方法及装置 | |
CN111159360A (zh) | 获得讯询问话题分类模型、讯询问话题分类的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |