CN114118080B - 一种从销售会话中自动识别客户意向的方法及系统 - Google Patents
一种从销售会话中自动识别客户意向的方法及系统 Download PDFInfo
- Publication number
- CN114118080B CN114118080B CN202111327801.5A CN202111327801A CN114118080B CN 114118080 B CN114118080 B CN 114118080B CN 202111327801 A CN202111327801 A CN 202111327801A CN 114118080 B CN114118080 B CN 114118080B
- Authority
- CN
- China
- Prior art keywords
- session
- intention
- conversation
- sales
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 239000012634 fragment Substances 0.000 claims abstract description 172
- 230000004044 response Effects 0.000 claims abstract description 56
- 230000008451 emotion Effects 0.000 claims abstract description 39
- 230000011218 segmentation Effects 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 16
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 18
- 238000012795 verification Methods 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 14
- 238000000605 extraction Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 9
- 238000000926 separation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006854 communication Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 208000031361 Hiccup Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Machine Translation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种从销售会话中自动识别客户意向的方法及系统,属于自然语言处理技术领域,解决了现有客户意向识别方法存在的准确率及召回率低等问题。一种从销售会话中自动识别客户意向的方法,包括:切分所述销售会话,得到多个标识角色标签的会话片段;对全部会话片段进行应答匹配,得到具备应答关系的上下文会话片段;将除上下文片段外的每一会话片段均作为独立会话片段,分别判断每一上下文会话片段及独立会话片段是否存在意向点,若存在,还识别当前上下文会话片段或独立会话片段的客户意向情感;汇总全部上下文会话片段及独立会话片段的意向点和客户意向情感,作为所述销售会话的客户意向识别结果。
Description
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种从销售会话中自动识别客户意向的方法及系统。
背景技术
在销售会话中,客户表达购买意向,销售根据客户的购买意向进行介绍和精准推荐,可以有效促使交易达成。从海量会话中识别客户意向和销售代表的及时应对,是对销售过程进行辅助、并提升交易成功率的有效方法。
现有的客户意向识别方式包括以下两种:
人工识别法:人工进行客户意向识别的方法效率较低,无法应对海量会话分析处理。
关键词识别法:获取销售会话语音文件,将语音文件转换成文字文本;接着,通过关键词或分类模型对文本进行预测,判断客户是否存在意向。然而,关键词和分类模型预测过程中存在以下问题:
第一、未进行上下文信息关联,导致客户意向召回率低。
销售场景会话属于口语交流会话,销售和客户之间的沟通基本都是问答式的。一方面,单纯对客户的语句进行意向识别,则会漏掉交互式的意向;另一方面,当销售询问客户关于商品的意向时,客户会对销售的问题进行回答,回答中通常只会出现简单的词汇,这种情况会被漏识别,从而导致召回率低。
第二、仅判断客户是否有意向,无法做到对客户精准追踪和推荐。
如果只对客户是否有意向进行判断,无法有效获知客户的意向类别。客户购买商品时,通常会关注商品的某些特征,而不是整个商品。如果无法知悉客户的意向点(如性价比、质量、外观等),则无法有效组织话术,对客户进行精准推荐,在交流过程中不能很好地打动客户,导致成单难度大。
第三、缺少客户意向的详细信息,无法从更精细的维度对大量数据进行分析。当客户很多的时候,单独对这些客户分析是否有意向,并不能够有效的利用这些大量的会话信息。对于同一款商品,不同年龄、不同性别及不同行业的客户的意向点通常是不一样的。如果可以从不同维度进行分析,当遇到一个新的客户时,可以从大量数据中获取信息,做到更好的应对。
因此,通过关键词识别客户意向的方法存在无法分辨出具体的意向内容、准确率和召回率较低、实际应用效果差等问题。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种从销售会话中自动识别客户意向的方法及系统,用以解决现有客户意向识别方法存在的准确率及召回率低等问题。
一方面,本发明公开了一种从销售会话中自动识别客户意向的方法,包括:
切分所述销售会话,得到多个标识角色标签的会话片段;
对全部会话片段进行应答匹配,得到具备应答关系的上下文会话片段;
将除上下文片段外的每一会话片段均作为独立会话片段,分别判断每一上下文会话片段及独立会话片段是否存在意向点,若存在,还识别当前上下文会话片段或独立会话片段的客户意向情感;
汇总全部上下文会话片段及独立会话片段的意向点和客户意向情感,作为所述销售会话的客户意向识别结果。
在上述方案的基础上,本发明还做出了如下改进:
进一步,对于每一上下文会话片段及每一独立会话片段,通过执行以下确定意向点:
对当前上下文会话片段或独立会话片段进行分词、去除停用词处理,生成分词特征;
将分词特征中匹配于行业字典树的分词作为销售产品信息;
将分词特征中匹配于客户意向命名实体的分词作为意向实体;
将销售产品信息和、或意向实体作为所述意向点。
进一步,所述行业字典树,用于存储当前销售会话所属行业的各类销售产品的属性信息;
所述客户意向命名实体,用于存储当前销售会话所属行业的各类销售产品对应的客户意向的实体类别。
进一步,对于每一上下文会话片段及每一独立会话片段,通过执行以下确定客户意向情感:
将当前上下文会话片段或独立会话片段对应的分词特征输入至意向判断模型,由意向判断模型处理并输出意向情感判断结果,所述意向情感判断结果为正向情感或负向情感。
进一步,在汇总全部上下文会话片段及独立会话片段的意向点和客户意向情感的过程中,若当前上下文会话片段或独立会话片段的意向点仅包括销售产品信息和意向实体中的一项,则通过检索所述销售产品信息和意向实体中的一项,补齐所述销售产品信息和意向实体中的另一项;并对补齐之后的销售会话的客户意向识别结果进行结构化存储。
进一步,所述切分所述销售会话,得到多个标识角色标签的会话片段,包括:
获取销售会话,确定所述销售会话涉及的会话主体;基于所述会话主体的切换切分所述销售会话,得到按会话顺序排序的多个文本格式的会话片段;其中,一个会话片段唯一对应一个会话主体;
识别每一会话片段的角色标签,并基于每一会话片段的角色标签和会话主体,得到每一会话片段的角色信息;所述角色信息为销售和客户。
进一步,所述对全部会话片段进行应答匹配,得到具备应答关系的上下文会话片段,包括:
对全部会话片段进行主题提取,并基于提取出的主题,对会话片段进行段落划分,并确定每一段落的段落主题;
将角色为客户的会话片段作为客户会话片段,将角色为销售的会话片段作为销售会话片段;对每一段落内的客户及销售会话片段进行应答匹配,得到具备应答关系的上下文会话片段。
进一步,通过执行以下操作对会话片段进行段落划分:
将完整会话片段与主题库中的主题进行匹配,并在匹配成功的会话片段中提取出匹配的主题,得到提取主题的完整会话片段;
确定提取主题的完整会话片段中每一个会话片段所属的主题、属于该主题的概率以及属于上一个会话片段所属主题的概率;
依次读取每一会话片段属于上一会话片段所属主题的概率,若该会话片段属于上一会话片段所属主题的概率大于设定阈值,则将该会话片段划分至同一段落,否则,将该会话片段划分至下一段落。
进一步,通过执行以下操作得到具备应答关系的上下文会话片段:
对于每一段落,依次获取段落中的每一客户会话片段;每获取一个客户会话片段,均执行以下过程:
依次获取该客户会话片段之后的销售会话片段,每获取一个销售会话片段,对获取到的客户会话片段与销售会话片段进行应答匹配判断:
若匹配成功,则该客户会话片段与销售会话片段具备应答关系,将该客户会话片段与销售会话片段作为一个上下文会话片段;
若匹配失败,则接着获取下一条销售会话片段,并重新执行应答匹配的判断过程,直至匹配成功或遍历完所有销售会话片段;
并跳转至获取下一条客户会话片段。
另一方面,本发明还公开了一种从销售会话中自动识别客户意向的系统,包括:
会话片段获取模块,用于切分所述销售会话,得到多个标识角色标签的会话片段;
应答匹配模块,用于对全部会话片段进行应答匹配,得到具备应答关系的上下文会话片段;
客户意向识别模块,用于将除上下文片段外的每一会话片段均作为独立会话片段,分别判断每一上下文会话片段及独立会话片段是否存在意向点,若存在,还识别当前上下文会话片段或独立会话片段的客户意向情感;还用于汇总全部上下文会话片段及独立会话片段的意向点和客户意向情感,作为所述销售会话的客户意向识别结果。
与现有技术相比,本发明至少可实现如下有益效果之一:
本发明提供的一种从销售会话中自动识别客户意向的方法及系统,通过处理销售会话得到上下文片段和独立会话片段,并对上下文片段和独立会话片段分别进行客户意向的识别,该过程能够有效缩小客户意向识别的范围、提升客户意向识别的针对性、准确率及召回率;具体地,在上下文片段的确定过程中,对销售会话依次进行会话片段生成、角色确定及段落划分,从而将同一主题的会话片段划分至同一段落中;然后,对每一段落内的客户及销售会话片段进行应答匹配,从而确定上下文片段。由于同一段落内的销售会话围绕同一段落主题展开,因此,通过先进行段落划分、然后执行每一段落内的应答匹配,能够提升应答匹配的成功率和准确率。
同时,本发明通过对每一上下文片段和独立会话片段进行意向点和意向情感,能够获取到客户意向的详细信息,便于从更精细的维度对大量数据进行分析。大量实例表明,该方法具备较好的实际应用效果。根据大量的客户意向识别结果进行分析,能够根据客户痛点组织销售话术,更好地提升交易成功率。
本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为本发明实施例1中的从销售会话中自动识别客户意向的方法流程图;
图2为本发明实施例1中增加角色标记前、后的会话片段示例;
图3为本发明实施例1中主题识别模型处理前后示意图;
图4为本发明实施例1中由主题识别模型处理输出的每一会话片段的主题及相关概率示例;
图5为本发明实施例1中基于应答对提取模型确定应答对的过程;
图6为本发明实施例1中的客户意向识别示例;
图7为本发明实施例2中的从销售会话中自动识别客户意向的系统结构示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
实施例1
本发明的一个具体实施例,公开了一种从销售会话中自动识别客户意向的方法,流程图如图1所示,该方法包括如下步骤:
步骤S1:切分所述销售会话,得到多个标识角色标签的会话片段;具体地,包括:
步骤S11:获取销售会话,确定所述销售会话涉及的会话主体;基于所述会话主体的切换切分所述销售会话,得到按会话顺序排序的多个文本格式的会话片段;其中,一个会话片段唯一对应一个会话主体;
优选地,本实施例中的销售会话为音频、视频、文本或IM等多种格式;同时,该销售会话可以是口语会话,也可以正式会话。
优选地,步骤S11具体包括:
步骤S111:确定所述销售会话涉及的会话主体;具体地,
当销售会话为音频或视频格式时,可利用人声分离模型确定销售会话涉及的会话主体;
当销售会话为文本或IM格式时,文本或IM文件中直接体现出销售会话涉及的会话主体;
步骤S112:基于所述会话主体的切换切分所述销售会话,得到按会话顺序排序的多个文本格式的会话片段;
以会话主体的切换为节点,将所述销售会话切分成按会话顺序排序的多个文本格式的会话片段。
需要说明的是,由于销售会话是以对答形式展开,因此,大部分场景下,销售会话涉及两个会话主体,且会存在多次会话主体的切换,形如会话主体A-会话主体B-会话主体A-会话主体B-......
当销售会话为音频或者视频格式,且切换至一个会话主体时,通过执行以下操作获得当前会话主体下的会话片段:
步骤S1121:预设短句切分时间阈值及子段落切分时间阈值;
步骤S1122:在基于人声分离模型将音频或视频转换录文本格式的过程中,若会话间隔时间大于短句切分时间阈值,则基于短句切分时间阈值切分当前会话主体下的销售会话,得到按照会话顺序排序的多个文本格式的会话语句,并记录每一会话语句的开始时间、结束时间;
步骤S1123:分析得到的会话语句,若前一会话语句的结束时间与后一会话语句的开始时间的时间差大于子段落切分时间阈值,则将前一会话语句和后一会话语句划分到不同的子段落中;否则,将前一会话语句与后一会话语句拼接成为连续的两个会话语句,并划分到同一子段落中;划分完成后,得到当前会话主体下的会话片段。
示例性地,短句切分时间阈值及子段落切分时间阈值均用于描述两句会话之间的时间间隔,且短句切分时间阈值小于子段落切分时间阈值,两个时间阈值可根据具体情况相应设置;
优选地,在本实施例中,人声分离模型还通过以下方式进行改善:
设置热词子模型:考虑到不同行业的高频专业词汇不同,根据销售会话所属的行业,向热词表中增加该行业的高频专业词汇;在利用人声分离模型将音频或视频转录成文本格式的过程中,还基于热词子模型进行专业词汇的转录,从而进行提升专业词汇的转录效果;
设置自学习语言子模型:考虑到不同行业会有不同的专业话术,根据销售会话所属的行业,通过该行业的专业话术文本训练的自学习语言子模型;在利用人声分离模型将音频或视频转录成文本格式的过程中,还基于自学习语言子模型进行专业话术的转录,从而有效提升销售对话的转录效果。
在得到按会话顺序排序的多个文本格式的会话片段后,为提升后续处理过程的准确度和速度,还可以包括预处理会话片段的步骤;优选地,所述预处理方式包括:纠错处理、删除多余的语气词和/或删除多余叠词。
具体地,步骤S113:通过执行以下操作预处理所述会话片段:
纠错处理,用于优化会话片段,以供后续文本分析流程使用;具体地,包括:
分析会话片段内的标点符号及分句是否合理,若不合理,则调整标点符号及分句。示例性地,转录出的文本中问句的标点符号可能存在不合理的情况,如,问句不是以“?”结束。此时,可以先识别出问句,将问句结尾的标点符号统一为“?”;同时,在步骤S1123中,简单通过时间阈值进行断句的方式容易导致一个会话语句被拆分为多个会话语句的情况;因此,对于每一会话片段,还要依次判断每一会话片段中的相邻的会话语句是否构成一个完整的会话语句,若是,则将该相邻的会话语句拼接成一个会话语句。
删除多余的语气词,用于删除会话片段中多余的语气词,便于数据分析和产品交互展示;由于销售会话可以是口语会话,因此,销售会话中可能存在很多语气词,这些语气词同样会体现在会话片段中。例如:嗯、啊、呃等,这些词汇对会话分析没有帮助,因此,需要删除多余的语气词。本实施例中删除语气词过程为:若一个会话片段中只有语气词,没有其他词汇,则保留第一个语气词;否则,删除语气词,保留其他信息。
删除多余叠词,用于删除会话片段中多余的词汇,便于数据分析和产品交互展示;本实施例中删除多余叠词过程为:查找相邻的重复词汇,判断重复词汇是否在排除词表中,若不在排除词表中,则对相邻词汇进行去重,仅保留一个;示例性地,若会话片段的内容为“我觉得觉得价格太贵了”,这里,“觉得觉得”就是多余叠词(即,相邻的重复词汇),此时,保留一个“觉得”即可,删除多余叠词后,得到的会话片段为“我觉得价格太贵了”。
基于预处理后的会话片段,执行后续(步骤S12及之后)的处理过程。
步骤S12:识别每一会话片段的角色标签,并基于每一会话片段的角色标签和会话主体,得到每一会话片段的角色信息;所述角色信息为销售和客户;具体地,
步骤S121:将全部会话片段输入至角色识别模型,得到每一会话片段的角色标签,所述角色标签为销售、客户或不确定;
由于销售和客户的会话术语存在比较明显的差别,例如:销售提及较多的词如“性价比很高”、“特惠价”及“业内第一”等,客户提及较多的词如“太贵了”、“便宜点”及“质量不好”等。从列举出来的部分词汇可以看出,销售和客户提及的词汇有很大区别。同时,也有一些术语是销售和客户都有可能提及的,如,“您好”、“再看一下”、“我知道了”等。因此,基于销售会话的上述特点,本实施例构建了如下角色识别模型:
获取标准销售会话(将具备代表性的销售会话作为标准销售会话)对应的会话片段样本,并标记每一会话片段样本的角色标签,角色标签为销售、客户或不确定;将部分会话片段样本及其角色标签作为角色识别模型的训练集,将剩余会话片段样本及其角色标签作为角色识别模型的验证集;
基于角色识别模型的训练集训练角色识别模型,基于角色识别模型的验证集验证角色识别模型,并得到验证通过的角色识别模型。
为保证训练及验证效果,训练集和验证集中的会话片段样本数量应足够大,各标签对应的会话片段样本应均匀分布。
步骤S122:基于每一会话片段的角色标签及会话主体,识别所述会话主体的角色;
将销售会话涉及的两个会话主体中的一个作为第一会话主体、另一个作为第二会话主体;
获取第一会话主体中角色标签为销售或客户的会话片段的总数,记为N1;获取第一会话主体中角色标签为销售的会话片段的总数,记为N11;
获取第二会话主体中角色标签为销售或客户的会话片段的总数,记为N2;获取第二会话主体中角色标签为销售的会话片段的总数,记为N21;
若N11/N1大于N21/N2,表明第一会话主体为销售的概率更高,此时,可以确定:第一会话主体的角色为销售,第二会话主体的角色为客户;否则,第一会话主体的角色为客户,第二会话主体的角色为销售。
或者,
获取第一会话主体中角色标签为客户的会话片段的总数,记为N12;
获取第二会话主体中角色标签为客户的会话片段的总数,记为N22;
若N12/N1大于N22/N2,表明第一会话主体为客户的概率更高,此时,可以确定:第一会话主体的角色为客户,第二会话主体的角色为销售;否则,第一会话主体的角色为销售,第二会话主体的角色为客户。
将所述会话主体的角色作为对应于该会话主体的会话片段的角色信息。
基于上述操作,即可得到每一会话主体的角色,从而得到每一会话片段的角色信息。增加角色标记前、后的会话片段示例如图2所示。
步骤S2:对全部会话片段进行应答匹配,得到具备应答关系的上下文会话片段;包括:
步骤S21:对全部会话片段进行主题提取,并基于提取出的主题,对会话片段进行段落划分,并确定每一段落的段落主题;
步骤S211:将完整会话片段与主题库中的主题进行匹配,并在匹配成功的会话片段中提取出匹配的主题,得到提取主题的完整会话片段;
优选地,考虑到完整会话片段中提取出的各主题的出现频率并不相同,主题的出现频率越高,表明会话片段与该主题的关联度越高;主题的出现频率越低,表明会话片段与该主题的关联度越低。因此,将完整会话片段与主题库中的主题进行匹配时,还计算每一匹配的主题的出现频率,若主题的出现频率高于主题频率阈值,则该主题匹配成功,否则,该主题匹配不成功。
步骤S212:确定提取主题的完整会话片段中每一个会话片段所属的主题、属于该主题的概率以及属于上一个会话片段所属主题的概率;
具体地,将完整会话片段输入至主题识别模型,由主题识别模型处理后输出每一会话片段属于各主题的概率,以及属于上一个会话片段所属主题的概率。其中,每一会话片段所属的主题为一个或多个。由于第一句会话片段没有上文信息,因此,第一个会话片段属于上一个会话片段所属主题的概率为100%。
主题识别模型通过如下方式确定:
获取标准销售会话对应的、提取(标记)主题的、连续的会话片段样本,并标记每一会话片段样本的主题识别标签,这里的主题识别标签包括主题标签及关联标签,其中,主题标签为:会话片段样本所属的主题标签;关联标签为:属于上一会话片段所属主题的标签,或,不属于上一会话片段所属主题的标签。将部分连续的会话片段样本及其主题是被标签作为主题识别模型的训练集,将剩余连续的会话片段样本及其主题识别标签作为主题识别模型的验证集;
基于主题识别模型的训练集训练主题识别模型,基于主题识别模型的验证集验证主题识别模型,并得到验证通过的主题识别模型。
为保证训练及验证效果,训练集和验证集中的会话片段样本数量应足够大,各主题识别标签对应的会话片段样本应均匀分布。
示例性地,训练主题识别模型时,
模型输入为:会话片段样本;以及,每一会话片段样本主题识别标签;其中,主题标签为各主题对应的标签,如:
主题:交付时间,主题标签:1;
主题:价格,主题标签:2;
主题:下一步,主题标签:3;
关联标签可按照如下方式设置:
0:不属于上一主题;
1:属于上一主题。
基于上述话片段样本以及每一会话片段样本主题标签对主题识别模型进行训练及验证。
模型输出为:每一会话片段样本所属的主题标签,以及,属于该主题的概率,实质上是多分类输出;还包括:该会话片段样本属于上一会话片段样本中主题的概率,实质上是一个二分类。
步骤S213:依次读取每一会话片段属于上一会话片段所属主题的概率,若该会话片段属于上一会话片段所属主题的概率大于设定阈值,则将该会话片段划分至同一段落,否则,将该会话片段划分至下一段落。
主题识别模型处理前后示意图如图3所示。由主题识别模型处理输出的每一会话片段的主题及相关概率示例如图4所示。
步骤S214:在每一段落中,对于该段落中所有会话片段的每一主题,累加每一会话片段属于该主题的概率,将累加概率之和最高的主题作为该段落的段落主题。
步骤S22:将角色为客户的会话片段作为客户会话片段,将角色为销售的会话片段作为销售会话片段;对每一段落内的客户及销售会话片段进行应答匹配,得到具备应答关系的上下文会话片段。
具体地,对于每一段落,依次获取段落中的每一客户会话片段;每获取一个客户会话片段,均执行以下过程:
依次获取该客户会话片段之后的销售会话片段,每获取一个销售会话片段,对获取到的客户会话片段与销售会话片段进行应答匹配判断:
若匹配成功,则该客户会话片段与销售会话片段具备应答关系,将该客户会话片段与销售会话片段作为一个上下文会话片段;
若匹配失败,则接着获取下一条销售会话片段,并重新执行应答匹配的判断过程,直至匹配成功或遍历完所有销售会话片段;
并跳转至获取下一条客户会话片段。
在上述过程中,基于应答对提取模型进行应答匹配判断,具体地,
将客户会话片段与销售会话片段输入至应答对提取模型,由应答对提取模型处理后输出匹配成功或匹配失败的结果。
通过执行以上操作,可以得到该段落中所有具备应答关系的客户会话片段与销售会话片段;
本实施例构建了如下应答对提取模型:
获取标准销售会话对应的段落会话样本,该段落会话样本中包括了多条客户和销售的会话片段样本,并标记每一客户和销售的会话片段样本的应答标签,其中,应答标签为:属于同一应答对的标签,或,不属于同一应答对的标签。将部分客户和销售会话片段样本及其应答标签作为应答对提取模型的训练集,将剩余客户和销售会话片段样本及其标签作为应答对提取模型的验证集;基于应答对提取模型的训练集训练应答对提取模型,基于应答对提取模型的验证集验证应答对提取模型,并得到验证通过的应答对提取模型。
基于应答对提取模型确定具备应答关系的客户会话片段与销售会话片段的过程如图5所示。
步骤S3:将除上下文片段外的每一会话片段均作为独立会话片段,分别判断每一上下文会话片段及独立会话片段是否存在意向点,若存在,还识别当前上下文会话片段或独立会话片段的客户意向情感;
具体地,在该步骤中,对于每一上下文会话片段及每一独立会话片段,通过执行以下确定意向点:
步骤S31:对当前上下文会话片段或独立会话片段进行分词、去除停用词处理,生成分词特征;
步骤S32:将分词特征中匹配于行业字典树的分词作为销售产品信息;其中,所述行业字典树,用于存储当前销售会话所属行业的各类销售产品的属性信息;以销售车辆为例,产品的属性信息为是否新车、品牌、车系、车型、型号等;
步骤S33:将分词特征中匹配于客户意向命名实体的分词作为意向实体;其中,所述客户意向命名实体,用于存储当前销售会话所属行业的各类销售产品对应的客户意向的实体类别,如价格、性价比及质量等。具体地,可以采用命名实体识别与句法分析结合的方式确定具体的意向实体。示例性地,销售行业对话中不可避免的会提及价钱,通过命名实体识别(NER)的方式可以获取到价格实体。单独的价格实体信息并不能充分发挥其效果,利用已经获得的价格实体,通过依存句法分析获取价格的相关描述和限制找到价格的详细信息。例如,对于“预算在50w以内”这句话,通过命名实体识别可以识别到“50w”,然后通过依存句法分析可以获得“预算50w以内”这个短语,得到实体相关详细信息。当然如果有其他的实体内容需要提取,也可以沿用该方法,例如通过实体识别到地点信息,然后通过句法分析获取地点远近等信息。
在本实施例中,将销售产品信息和、或意向实体作为所述意向点。具体地,若匹配得到销售产品信息和意向实体,则将销售产品信息和意向实体同时作为意向点;若仅匹配到销售产品信息和意向实体中的一项,将匹配的一项的作为作为意向点。
具体地,在该步骤中,对于每一上下文会话片段及每一独立会话片段,若存在意向点,还通过执行以下确定客户意向情感:
步骤S34:将当前上下文会话片段或独立会话片段对应的分词特征输入至意向判断模型,由意向判断模型处理并输出意向情感判断结果,所述意向情感判断结果为正向情感或负向情感。
本实施例构建了如下意向判断模型:
获取标准销售会话对应的多条上下文会话片段及独立会话片段,并标记每一上下文会话片段及独立会话片段对应的意向标签,其中,意向标签为:正向情感或负向情感。
将部分上下文会话片段及独立会话片段及其意向标签作为意向判断模型的训练集,将剩余上下文会话片段及独立会话片段及其意向标签作为意向判断模型的验证集;基于意向判断模型的训练集训练意向判断模型,基于意向判断模型的验证集验证意向判断模型,并得到验证通过的意向判断模型。
客户意向识别示例如图6所示。
步骤S4:汇总全部上下文会话片段及独立会话片段的意向点和客户意向情感,作为所述销售会话的客户意向识别结果。
在汇总全部上下文会话片段及独立会话片段的意向点和客户意向情感的过程中,若当前上下文会话片段或独立会话片段的意向点仅包括销售产品信息和意向实体中的一项,则通过检索所述销售产品信息和意向实体中的一项,补齐所述销售产品信息和意向实体中的另一项;并对补齐之后的销售会话的客户意向识别结果进行结构化存储。
在补齐的过程中,可以通过行业知识图谱进行匹配查找,具体地:根据已知的销售产品信息和意向实体中的一项信息,在知识图谱中进行节点匹配查询,可以命中某个或某几个产品节点,然后查看该产品节点的属性信息,并补齐客户意向识别结果。
为便于本领域技术人员更好地理解本方案,本实施例还给出了以下示例:
示例1:
销售:您好,您有心仪的车子吗?如果没有的话我可以给您介绍几款。
客户:我打算购买一辆宝马suv,预算在50w以内。您可以给我介绍一下。
示例2:
销售:目前国内新能源汽车里面销量最好的是特斯拉model3,我可以给您介绍一下。
客户:不用了,我想看下其他品牌的汽车。
表1客户意向识别结果示例
会话 | 是否新车 | 品牌 | 车系 | 车型 | 型号 | 价格 | 意向情感 |
示例1 | 新车 | 宝马 | SUV | 50w | 正向 | ||
示例2 | 新车 | 特斯拉 | 新能源 | 轿车 | Model3 | 23.56w | 负向 |
上表中,示例1中的车系和型号,从对话中不能获取到更多的信息,从知识图谱中查到的结果不是唯一,这里未具体举例。示例2中的车型、价格都是从行业产品知识图谱中查询,然后将结果进行扩充、并进行结构化存储。
综上,本发明提供的一种从销售会话中自动识别客户意向的方法及系统,通过处理销售会话得到上下文片段和独立会话片段,并对上下文片段和独立会话片段分别进行客户意向的识别,该过程能够有效缩小客户意向识别的范围、提升客户意向识别的针对性、准确率及召回率;具体地,在上下文片段的确定过程中,对销售会话依次进行会话片段生成、角色确定及段落划分,从而将同一主题的会话片段划分至同一段落中;然后,对每一段落内的客户及销售会话片段进行应答匹配,从而确定上下文片段。由于同一段落内的销售会话围绕同一段落主题展开,因此,通过先进行段落划分、然后执行每一段落内的应答匹配,能够提升应答匹配的成功率和准确率。
同时,本发明通过对每一上下文片段和独立会话片段进行意向点和意向情感,能够获取到客户意向的详细信息,便于从更精细的维度对大量数据进行分析。大量实例表明,该方法具备较好的实际应用效果。根据大量的客户意向识别结果进行分析,能够根据客户痛点组织销售话术,更好地提升交易成功率。
实施例2
本发明实施例2公开了一种从销售会话中自动识别客户意向的系统,与实施例1中的方法相对应,该系统的结构示意图如图7所示,包括:
会话片段获取模块,用于切分所述销售会话,得到多个标识角色标签的会话片段;
应答匹配模块,用于对全部会话片段进行应答匹配,得到具备应答关系的上下文会话片段;
客户意向识别模块,用于将除上下文片段外的每一会话片段均作为独立会话片段,分别判断每一上下文会话片段及独立会话片段是否存在意向点,若存在,还识别当前上下文会话片段或独立会话片段的客户意向情感;还用于汇总全部上下文会话片段及独立会话片段的意向点和客户意向情感,作为所述销售会话的客户意向识别结果。
本发明的系统实施例的具体实施过程参见上述方法实施例即可,本实施例在此不再赘述。
由于本系统实施例与上述方法实施例原理相同,所以本系统也具有上述方法实施例相应的技术效果。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种从销售会话中自动识别客户意向的方法,其特征在于,包括:
切分所述销售会话,得到多个标识角色标签的会话片段;
对全部会话片段进行应答匹配,得到具备应答关系的上下文会话片段;
将除上下文片段外的每一会话片段均作为独立会话片段,分别判断每一上下文会话片段及独立会话片段是否存在意向点,若存在,还识别当前上下文会话片段或独立会话片段的客户意向情感;
汇总全部上下文会话片段及独立会话片段的意向点和客户意向情感,作为所述销售会话的客户意向识别结果;
对于每一上下文会话片段及每一独立会话片段,通过执行以下确定意向点:
对当前上下文会话片段或独立会话片段进行分词、去除停用词处理,生成分词特征;
将分词特征中匹配于行业字典树的分词作为销售产品信息;
将分词特征中匹配于客户意向命名实体的分词作为意向实体;所述客户意向命名实体,用于存储当前销售会话所属行业的各类销售产品对应的客户意向的实体类别;
将销售产品信息和、或意向实体作为所述意向点;
对于每一上下文会话片段及每一独立会话片段,通过执行以下确定客户意向情感:
将当前上下文会话片段或独立会话片段对应的分词特征输入至意向判断模型,由意向判断模型处理并输出意向情感判断结果,所述意向情感判断结果为正向情感或负向情感。
2.根据权利要求1所述的从销售会话中自动识别客户意向的方法,其特征在于,
所述行业字典树,用于存储当前销售会话所属行业的各类销售产品的属性信息;
所述客户意向命名实体,用于存储当前销售会话所属行业的各类销售产品对应的客户意向的实体类别。
3.根据权利要求2所述的从销售会话中自动识别客户意向的方法,其特征在于,在汇总全部上下文会话片段及独立会话片段的意向点和客户意向情感的过程中,若当前上下文会话片段或独立会话片段的意向点仅包括销售产品信息和意向实体中的一项,则通过检索所述销售产品信息和意向实体中的一项,补齐所述销售产品信息和意向实体中的另一项;并对补齐之后的销售会话的客户意向识别结果进行结构化存储。
4.根据权利要求1所述的从销售会话中自动识别客户意向的方法,其特征在于,所述切分所述销售会话,得到多个标识角色标签的会话片段,包括:
获取销售会话,确定所述销售会话涉及的会话主体;基于所述会话主体的切换切分所述销售会话,得到按会话顺序排序的多个文本格式的会话片段;其中,一个会话片段唯一对应一个会话主体;
识别每一会话片段的角色标签,并基于每一会话片段的角色标签和会话主体,得到每一会话片段的角色信息;所述角色信息为销售和客户。
5.根据权利要求1所述的从销售会话中自动识别客户意向的方法,其特征在于,所述对全部会话片段进行应答匹配,得到具备应答关系的上下文会话片段,包括:
对全部会话片段进行主题提取,并基于提取出的主题,对会话片段进行段落划分,并确定每一段落的段落主题;
将角色为客户的会话片段作为客户会话片段,将角色为销售的会话片段作为销售会话片段;对每一段落内的客户及销售会话片段进行应答匹配,得到具备应答关系的上下文会话片段。
6.根据权利要求5所述的从销售会话中自动识别客户意向的方法,其特征在于,通过执行以下操作对会话片段进行段落划分:
将完整会话片段与主题库中的主题进行匹配,并在匹配成功的会话片段中提取出匹配的主题,得到提取主题的完整会话片段;
确定提取主题的完整会话片段中每一个会话片段所属的主题、属于该主题的概率以及属于上一个会话片段所属主题的概率;
依次读取每一会话片段属于上一会话片段所属主题的概率,若该会话片段属于上一会话片段所属主题的概率大于设定阈值,则将该会话片段划分至同一段落,否则,将该会话片段划分至下一段落。
7.根据权利要求6所述的从销售会话中自动识别客户意向的方法,其特征在于,通过执行以下操作得到具备应答关系的上下文会话片段:
对于每一段落,依次获取段落中的每一客户会话片段;每获取一个客户会话片段,均执行以下过程:
依次获取该客户会话片段之后的销售会话片段,每获取一个销售会话片段,对获取到的客户会话片段与销售会话片段进行应答匹配判断:
若匹配成功,则该客户会话片段与销售会话片段具备应答关系,
将该客户会话片段与销售会话片段作为一个上下文会话片段;
若匹配失败,则接着获取下一条销售会话片段,并重新执行应答匹配的判断过程,直至匹配成功或遍历完所有销售会话片段;并跳转至获取下一条客户会话片段。
8.一种从销售会话中自动识别客户意向的系统,其特征在于,包括:
会话片段获取模块,用于切分所述销售会话,得到多个标识角色标签的会话片段;
应答匹配模块,用于对全部会话片段进行应答匹配,得到具备应答关系的上下文会话片段;
客户意向识别模块,用于将除上下文片段外的每一会话片段均作为独立会话片段,分别判断每一上下文会话片段及独立会话片段是否存在意向点,若存在,还识别当前上下文会话片段或独立会话片段的客户意向情感;还用于汇总全部上下文会话片段及独立会话片段的意向点和客户意向情感,作为所述销售会话的客户意向识别结果;
对于每一上下文会话片段及每一独立会话片段,通过执行以下确定意向点:
对当前上下文会话片段或独立会话片段进行分词、去除停用词处理,生成分词特征;
将分词特征中匹配于行业字典树的分词作为销售产品信息;
将分词特征中匹配于客户意向命名实体的分词作为意向实体;所述客户意向命名实体,用于存储当前销售会话所属行业的各类销售产品对应的客户意向的实体类别;
将销售产品信息和、或意向实体作为所述意向点;
对于每一上下文会话片段及每一独立会话片段,通过执行以下确定客户意向情感:
将当前上下文会话片段或独立会话片段对应的分词特征输入至意向判断模型,由意向判断模型处理并输出意向情感判断结果,所述意向情感判断结果为正向情感或负向情感。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111327801.5A CN114118080B (zh) | 2021-11-10 | 2021-11-10 | 一种从销售会话中自动识别客户意向的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111327801.5A CN114118080B (zh) | 2021-11-10 | 2021-11-10 | 一种从销售会话中自动识别客户意向的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114118080A CN114118080A (zh) | 2022-03-01 |
CN114118080B true CN114118080B (zh) | 2022-09-13 |
Family
ID=80378141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111327801.5A Active CN114118080B (zh) | 2021-11-10 | 2021-11-10 | 一种从销售会话中自动识别客户意向的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114118080B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116610790B (zh) * | 2023-07-18 | 2023-10-10 | 阿里健康科技(中国)有限公司 | 应答数据的获取方法、装置、设备和介质 |
CN118051582A (zh) * | 2024-01-05 | 2024-05-17 | 深圳市六度人和科技有限公司 | 基于电话语音分析的潜客识别方法、装置、设备及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107967261A (zh) * | 2017-11-17 | 2018-04-27 | 康成投资(中国)有限公司 | 智能客服中交互式问句语义理解方法 |
CN110096570A (zh) * | 2019-04-09 | 2019-08-06 | 苏宁易购集团股份有限公司 | 一种应用于智能客服机器人的意图识别方法及装置 |
CN110334201A (zh) * | 2019-07-18 | 2019-10-15 | 中国工商银行股份有限公司 | 一种意图识别方法、装置及系统 |
CN111368085A (zh) * | 2020-03-05 | 2020-07-03 | 北京明略软件系统有限公司 | 一种对话意图的识别方法、装置、电子设备及存储介质 |
CN112256854A (zh) * | 2020-11-05 | 2021-01-22 | 云南电网有限责任公司 | 一种基于ai自然语言理解的智能ai会话方法及装置 |
CN113239147A (zh) * | 2021-05-12 | 2021-08-10 | 平安科技(深圳)有限公司 | 基于图神经网络的智能会话方法、系统及介质 |
CN113626573A (zh) * | 2021-08-11 | 2021-11-09 | 北京深维智信科技有限公司 | 一种销售会话异议及应对提取方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10540357B2 (en) * | 2016-03-21 | 2020-01-21 | Ebay Inc. | Dynamic topic adaptation for machine translation using user session context |
-
2021
- 2021-11-10 CN CN202111327801.5A patent/CN114118080B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107967261A (zh) * | 2017-11-17 | 2018-04-27 | 康成投资(中国)有限公司 | 智能客服中交互式问句语义理解方法 |
CN110096570A (zh) * | 2019-04-09 | 2019-08-06 | 苏宁易购集团股份有限公司 | 一种应用于智能客服机器人的意图识别方法及装置 |
CN110334201A (zh) * | 2019-07-18 | 2019-10-15 | 中国工商银行股份有限公司 | 一种意图识别方法、装置及系统 |
CN111368085A (zh) * | 2020-03-05 | 2020-07-03 | 北京明略软件系统有限公司 | 一种对话意图的识别方法、装置、电子设备及存储介质 |
CN112256854A (zh) * | 2020-11-05 | 2021-01-22 | 云南电网有限责任公司 | 一种基于ai自然语言理解的智能ai会话方法及装置 |
CN113239147A (zh) * | 2021-05-12 | 2021-08-10 | 平安科技(深圳)有限公司 | 基于图神经网络的智能会话方法、系统及介质 |
CN113626573A (zh) * | 2021-08-11 | 2021-11-09 | 北京深维智信科技有限公司 | 一种销售会话异议及应对提取方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114118080A (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11403680B2 (en) | Method, apparatus for evaluating review, device and storage medium | |
US20090326947A1 (en) | System and method for spoken topic or criterion recognition in digital media and contextual advertising | |
CN113626573B (zh) | 一种销售会话异议及应对提取方法及系统 | |
US20160210962A1 (en) | Methods and systems for analyzing communication situation based on dialogue act information | |
US20230069935A1 (en) | Dialog system answering method based on sentence paraphrase recognition | |
CN114118080B (zh) | 一种从销售会话中自动识别客户意向的方法及系统 | |
CN111881297B (zh) | 语音识别文本的校正方法及装置 | |
CN112233680A (zh) | 说话人角色识别方法、装置、电子设备及存储介质 | |
CN113408287B (zh) | 实体识别方法、装置、电子设备及存储介质 | |
CN112256845A (zh) | 意图识别方法、装置、电子设备和计算机可读存储介质 | |
Dufour et al. | Characterizing and detecting spontaneous speech: Application to speaker role recognition | |
CN116244410B (zh) | 一种基于知识图谱和自然语言的指标数据分析方法及系统 | |
CN111180025A (zh) | 表示病历文本向量的方法、装置及问诊系统 | |
CN116610815A (zh) | 一种知识图谱的关系预测方法、装置、设备及存储介质 | |
CN115983285A (zh) | 问卷稽核方法、装置、电子设备和存储介质 | |
CN116127011A (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN115391506A (zh) | 针对多段式回复的问答内容标准性检测方法及装置 | |
Le et al. | Automatic quality estimation for speech translation using joint ASR and MT features | |
CN112071304B (zh) | 一种语意分析方法及装置 | |
CN114078470A (zh) | 模型处理方法及装置、语音识别方法及装置 | |
Chandramouli et al. | Unsupervised paradigm for information extraction from transcripts using BERT | |
Henderson et al. | Data-driven methods for spoken language understanding | |
CN114118060B (zh) | 一种从销售会话中自动识别关键事件的方法及系统 | |
US20240126991A1 (en) | Automated interaction processing systems | |
Hillard | Automatic sentence structure annotation for spoken language processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Room 805, floor 8, No. 23, Zhichun Road, Haidian District, Beijing 100191 Applicant after: Beijing Shenwei Zhixin Technology Co.,Ltd. Address before: Room 1508b, floor 15, No. 23, Zhichun Road, Haidian District, Beijing 100191 Applicant before: Beijing Shenwei Zhixin Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |