CN111639484A - 坐席通话内容的分析方法 - Google Patents
坐席通话内容的分析方法 Download PDFInfo
- Publication number
- CN111639484A CN111639484A CN202010413148.3A CN202010413148A CN111639484A CN 111639484 A CN111639484 A CN 111639484A CN 202010413148 A CN202010413148 A CN 202010413148A CN 111639484 A CN111639484 A CN 111639484A
- Authority
- CN
- China
- Prior art keywords
- conversation
- text
- analysis
- voice text
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5175—Call or contact centers supervision arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Educational Administration (AREA)
- Signal Processing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
Abstract
本发明提供了一种坐席通话内容的分析方法,该方法包括:采集坐席呼出通话或接入通话时所进行的对话的语音数据;将所述语音数据进行文本转录处理以获得语音文本;调用对话分析模型对所述语音文本进行通话整体分析和局部信息抽取,所述通话整体分析用于识别出所述语音文本对应的至少一个对话描述属性,所述局部信息抽取用于抽取所述语音文本中的至少一个关键片段;创建所述对话描述属性和所述关键片段与所述语音文本之间的标引映射。此外,本发明还提供相应的计算机介质。实施本发明可相比现有技术更加全面地为坐席通话的业务办理效果提供评价参考,使得呼叫中心的运营者能更客观全面地了解坐席沟通绩效、客户需求和业务热点。
Description
技术领域
本发明涉及呼叫中心的话务智能化处理领域,尤其涉及一种坐席通话内容的分析方法。
背景技术
目前,呼叫中心已经成为企业提供线上综合业务信息的重要方式,呼叫中心的坐席根据企业的需求开展外呼或呼入的话务业务,以受理客户的意见反馈、咨询建议等业务,或针对企业的产品进行市场调查、电话销售、售后跟踪等业务。
一般地,都会考虑记录和评价坐席通话中所进行的业务的办理效果,以便于呼叫中心根据所记录的办理效果执行业务管理、质量考核、热点分析等后续步骤,进一步提升服务质量。上述办理效果包含可被评价的多个角度,从结果角度来看是考察是客户意图、服务满意度、业务完成度等因素,判断是否产生了积极的效益或解决了客户的诉求,从过程角度来看是考察坐席在通话中所表现出来的沟通技巧、沟通效率、内容完整性、服务规范性等因素,判断坐席的表达是否规范完整。
现有技术中一些记录和评价上述办理效果的解决方案是:在坐席通话结束之后,结合客户的反馈数据人工选择已定义的呼叫完成码来标记办理效果,使所述办理效果与所选择的呼叫完成码相对应,用来标记出办理效果的类型,并通过呼叫完成码实现沟通历史的简单分类,而该解决方案的缺点也很明显,依靠坐席人工选择出办理效果的类型的方法具有明显的主观性和局限性,并且仅从结果角度评价了所述办理效果,未能客观地从过程角度评价所述办理效果。
现有技术中另一些记录和评价办理效果的解决方案是:在坐席通话结束后,根据所选择的关键词对坐席通话的局部具体语句内容进行简单聚类统计以得到统计结果,并通过该统计结果来评价所述办理效果,该解决方案也依然具有明显的缺陷,由于关键词的选取难以完全覆盖日常对话中可能出现的各种可能,而且依靠该关键词仅能统计出坐席通话的局部具体语句,无法实现对坐席通话的整体认知,导致对所述办理效果的评价的准确性难以令人满意。
发明内容
为了克服现有技术中的上述缺陷,本发明提供了一种坐席通话内容的分析方法,该方法包括:
采集坐席呼出通话或接入通话时所进行的对话的语音数据;
将所述语音数据进行文本转录处理以获得语音文本;
调用对话分析模型对所述语音文本进行通话整体分析和局部信息抽取,所述通话整体分析用于识别出所述语音文本对应的至少一个对话描述属性,所述局部信息抽取用于抽取所述语音文本中的至少一个关键片段;
创建所述对话描述属性和所述关键片段与所述语音文本之间的标引映射。
根据本发明的一个方面,该方法还包括:触发所述对话描述属性和所述关键片段对应的响应事件。
根据本发明的另一个方面,该方法中所述响应事件包括:向所述坐席推送话术信息、告警信息和进度信息。
根据本发明的另一个方面,该方法中所述创建所述对话描述属性和所述关键片段与所述语音文本之间的标引映射的步骤包括:从预设的标签库中选择与所述对话描述属性相对应的对话描述标签,并将所述语音文本标引至所述对话描述标签,以及根据所述关键片段创建关键片段标签,并将所述语音文本标引至所述关键片段标签。
根据本发明的另一个方面,该方法中所述创建所述对话描述属性和所述关键片段与所述语音文本之间的标引映射的步骤还包括:根据预定质检规则为所述对话描述属性和所述关键片段创建质检指标标签,并将所述语音文本标引至所述质检指标标签。
根据本发明的另一个方面,该方法中所述通话整体分析包括:基于自然语音处理实现的对话场景识别、客户意图识别、呼叫结果识别。
根据本发明的另一个方面,该方法中所述局部信息抽取包括:基于自然语言处理实现的业务实体抽取、命名实体抽取、关键字抽取。
根据本发明的另一个方面,该方法中所述自然语言处理包括:角色分析、分词、词性标注、命名实体识别、业务实体识别、实体关系识别、依存句法分析、局部事件识别、关键事件识别、话术信息识别和情感分析;以及自动分类、文本相似度计算和自动摘要。
根据本发明的另一个方面,该方法中所述对话描述属性包括:对话场景、客户意图和呼叫结果。
根据本发明的另一个方面,该方法中所述关键片段包括:从所述语音文本中抽取的业务实体、命名实体和关键字。
根据本发明的另一个方面,该方法还包括:根据所述标引映射对所述语音文本进行自动评分。
相应地,本发明还提供了一个或多个存储计算机可执行指令的计算机可读介质,所述指令在由一个或多个计算机设备使用时使得一个或多个计算机设备执行如前文所述的坐席通话内容的分析方法。
本发明提供的坐席通话内容的分析方法通过对文本转录获得的语音文本进行通话整体分析和局部信息抽取,可以获得所述语音文本对应的对话描述属性和关键片段,最终创建所述对话描述属性和所述关键片段与所述语音文本之间的标引映射,该标引映射可用作评价所述语音文本的依据。实施本发明提供的坐席通话内容的分析方法实现了从整体和局部两个角度对语音文本的可利用信息进行了数据挖掘,相比现有技术更加全面地为坐席通话的业务办理效果提供了评价参考,使得呼叫中心的运营者能更客观全面地了解坐席沟通绩效、客户需求和业务热点。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是根据本发明的坐席通话内容的分析方法的一个具体实施方式的流程示意图;
图2是图1示出的步骤S400的可选实施例的流程示意图;
图3是根据本发明的坐席通话内容的分析方法的一个优选具体实施方式的流程示意图;
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
为了更好地理解和阐释本发明,下面将结合附图对本发明作进一步的详细描述。本发明并不仅仅局限于这些具体实施方式。相反,对本发明进行的修改或者等同替换,均应涵盖在本发明的权利要求范围当中。
需要说明的是,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有这些具体细节,本发明同样可以实施。在下文给出的多个具体实施方式中,对于本领域熟知的结构和部件未作详细描述,以便于凸显本发明的主旨。
本发明提供了一种坐席通话内容的分析方法,请参考图1,图1是根据本发明的坐席通话内容的分析方法的一个具体实施方式的流程示意图,该方法包括:
步骤S100,采集坐席呼出通话或接入通话时所进行的对话的语音数据;
步骤S200,将所述语音数据进行文本转录处理以获得语音文本;
步骤S300,调用对话分析模型对所述语音文本进行通话整体分析和局部信息抽取,所述通话整体分析用于识别出所述语音文本对应的至少一个对话描述属性,所述局部信息抽取用于抽取所述语音文本中的至少一个关键片段;
步骤S400,创建所述对话描述属性和所述关键片段与所述语音文本之间的标引映射。
具体地,无论是呼叫中心的坐席呼出通话还是接入通话,一旦话务搭接成功后,坐席和其通话对象进行所述对话即会产生实时语音流,该实时语音流所涉及的沟通主题往往围绕着坐席所需针对客户提供的业务,例如电话销售、售后回访、市场调查、疑难解答等沟通主题。执行步骤S100正是为了采集所述实时语音流所对应的所述语音数据,更具体而言,该语音数据是用于记录所述对话的数字信号,而通常该数字信号是使用所述实时语音流的模拟信号转换所得。
在步骤S200中,执行所述文本转录的主体通常是一经过训练过的语音识别引擎,该语音识别引擎向提供一面向呼叫中心的识别接口,呼叫中心的坐席通过调用该识别接口将所述语音数据中的语言文字转换为字符类型的语音文本,进一步在步骤S300中处理该语音文本。需要说明的是,由于所述语音数据是伴随着所述坐席的通话而持续生成的,而单位时间内所述识语音识别引擎可处理的数据量有限,在必要的情况下,一次完整的所述通话的过程中可能会产生多个所述语音数据,或将一条所述语音数据切分为多个数据切块,此时可能会出现多个步骤S200并行执行的情况。无论如何,所述语音数据最终都会转换为所述语音文本。
执行步骤S300的目的之一是为了尽可能全面地对所述语音文本进行分析,以便于从各个维度挖掘出所述语音文本中能用于反应和评价步骤S100中所述对话的评价因子。对此,步骤S300所采用的手段是分别对所述语音文本进行通话整体分析和局部信息抽取。
其中,所述通话整体分析侧重于从所述对话中剥离出一些逻辑属性,该逻辑属性对应人类对所述对话携带的整体性信息进行阅读理解的所得成果,在此将其称之为对话描述属性,因此所述通话整体分析是用于识别出所述语音文本对应的至少一个所述对话描述属性,典型地,所述通话整体分析包括:基于自然语音处理实现的对话场景识别、客户意图识别、呼叫结果识别。相应地所述对话描述属性包括:对话场景、客户意图和呼叫结果。
所述局部信息抽取侧重于从所述对话中抽取出一些具有自然语言含义的片段信息,该片段信息对应人类对所述对话携带的局部性信息进行阅读理解的所得成果,在此将其称之为关键片段,因此所述局部信息抽取是用于抽取所述语音文本中的至少一个所述关键片段,典型地,所述局部信息抽取包括:基于自然语言处理实现的业务实体抽取、命名实体抽取、关键字抽取。相应地所述关键片段包括:从所述语音文本中抽取的业务实体、命名实体和关键字。
无论是所述通话整体分析还是所述局部信息抽取,其所处理的对象均是所述语音文本,而处理的过程中均需要使用自然语言处理的技术,典型地,所述自然语言处理包括但不限于:角色分析、分词、词性标注、命名实体识别、业务实体识别、实体关系识别、依存句法分析、局部事件识别、关键事件识别、话术信息识别和情感分析;以及自动分类、文本相似度计算和自动摘要。
具体地,所述角色分析可以分别判断出所述语音文本中多个语音讲述者(也即所述坐席或其通话对象)的角色,并对所述语音文本各个句子按照角色、句子等类别进行切分或合并后创建索引;所述分词通常是借助概率模型将所述语音文本中连续的句子拆分成合乎对话逻辑的词汇;所述词性标注可以为所述词汇指派词性,实现对所述语音文本的词性标注。
所述命名实体识别可以分析出所述语音文本中的语义实体,通过识别出所述语音文本中的动词词组、名词词组、虚词等句法成分,以进一步提取出与特定领域相关的各类命名实体,例如包括:人名、地名、组织机构名、商品品牌、事件、专有名词、数值、日期、时间、金额、标志类字串符等,可选地,所述命名实体识别可以分步实现,首先识别出所述语音文本中的各个相对逻辑独立的单独实体,然后根据预定义的事件模式或其他规则,将同类型的单独实体按照出现的时序及向量位置进行组合拼接,以生成具有逻辑意义的实体集合;所述业务实体识别可以分析出所述语音文本中所提及的业务实体(例如业务的类型是咨询、投诉或推广);所述实体关系识别可以标注不同词汇所代表的实体之间的关系来确保语言识别的准确度;所述依存句法分析可以根据句子的上下文信息进一步提升所述词汇的识别率。
所述局部事件识别在本具体实施方式中指的是基于浅层句法分析和指代消解从一个语句中抽取事件信息,所述语句通常是对所述语音文本进行分句标注后所获得的,由于语句是完整描述一个事实的基本语法单元,不同语句间存在话题转移,因此将抽取范围限定在一个所述语句中,在对所述语句执行抽取时,识别所述语句中各个实体的之间的关系,根据抽取任务的设定将相关的信息抽取出来,填充到输出模板的各个特征值槽中以形成所述事件信息;所述关键事件识别指的是利用统计学原理识别出所述语音文本中与沟通内容相关的关键事件,典型地,所述语音文本中可能识别出多个事件,而该其中一些事件可能在几个不同的语句中被多次叙述,且每次叙述表达的信息点不一定相同,在前文中局部事件识别的基础上,通过去重、合并、推理等算法处理,以生成最终的实体或事实,例如事件去重与合并可以通过比较分散事件实例来实现,如果两个事件的特征值槽相同或近似,则可将该两个事件认定为相同事件从而合并或去重。
所述话术信息识别指的是根据预定义的规则抽取所述语音文本中的特征,例如从质检、业务评价、服务质量等角度设定抽取规则,而所述特征有可能是字符串、实体信息或事件信息;所述情感分析可以根据所述语音文本中的词汇判断出讲述者的情感表达倾向。
所述自动分类指的是根据预定规则将前文中自然语言处理的各个步骤的输出结果进行自动分类处理,以提升数据聚合度;所述文本相似度计算指的是通过文本相似度比较,将文本中冗余的数据进行去重处理;所述自动摘要指的是将从所述语音文本中识别出来的各类信息按照预定规则生成文本摘要,并可以进一步将该文本摘要进行关联化标注。
所述自然语言处理还优选地包括通话记录标准格式预处理步骤,该通话记录标准格式预处理可以将所述语音文本整理为可被识别的通话记录标准格式。
本领域技术人员可理解,在面对更为复杂的对话内容时,所述自然语言处理可能还针对性地包含不同于上述步骤的额外步骤,无论如何,其目的都是为了借助所述自然语言处理达到实现所述通话整体分析和所述局部信息抽取的目的,常见地,可由一经过训练的自然语言处理神经网络执行所述自然语言处理的各个步骤。在本具体实施方式中,由于所述自然语言处理已根据实施需求对所述语音文本进行了结构化、碎片化处理,所述通话整体分析和所述局部信息抽取是对所述自然语言处理的处理结果数据进行再加工,以获得所述对话描述属性和所述关键片段。所述自然语言处理可以包含在所述通话整体分析和所述局部信息抽取的整体步骤内,也可以作为所述通话整体分析和所述局部信息抽取的前序步骤。
以所述通话整体分析中的所述对话场景识别为例,根据所定义的对话场景模板的类型,可以直接将从所述语音文本中提取出的语句特征数据与配置好的对话场景模板进行语义相似度计算或正则表达式匹配计算,以确定相似度最高的对话场景模板,从而确定所述语音文本所对应的对话场景的类型。以所述通话整体分析中所述客户意图识别为例,根据所定义的客户意图模板的类型,可以直接将从所述语音文本中提取出的客户语言特征数据与配置好的对话场景模板进行语义相似度计算或正则表达式匹配计算,以确定相似度最高的客户意图模板,从而确定所述语音文本所对应的客户意图的类型。以所述通话整体分析中的所述呼叫结果识别为例,一个典型的实现所述呼叫结果识别的流程是:识别所述语音文本所对应的所有所述对话场景的类型,识别所述语音文本所对应的所有所述客户意图的类型,根据预定呼叫分类的规则集,确定所述语音文本所对应的呼叫分类的最终类型。本领域技术人员可以理解,借助于神经网络、人工智能等计算机技术,实现所述对话场景识别、所述客户意图识别、所述呼叫结果分类的流程不仅限于前文中所记载的示例性流程。
所述局部信息抽取中的所述业务实体抽取、所述命名实体抽取、所述关键字抽取这些步骤,其目的均是从所述自然语言处理的处理结构中获得与所述语音文本分析相关度最高的片段信息,上述各类抽取步骤可在预定规则下使用领域知识库所提供的术语来达成,所述领域知识库包含了与特定领域相关的业务实体术语、命名实体术语、关键字术语等术语数据,可以使用爬虫技术持续地丰富所述领域知识库中存储的术语数据。
优选地,在步骤S300中获得所述对话描述属性和所述关键片段后,还可以执行一优选的步骤,即触发所述对话描述属性和所述关键片段对应的响应事件,所述响应事件例如是向所述坐席推送话术信息、告警信息和进度信息等。例如所述对话描述属性是对话场景时,则所述响应事件是向所述坐席推送所述话术信息或进度信息,该话术信息是预设的与所述对话场景相匹配的标准话术脚本,便于所述坐席规范地按照该话术信息进行通话交流,所述进度信息是用于提示所述坐席在当前对话场景下所需完成的业务进度的提示数据,便于所述坐席遗忘所需提供的业务种类;若配置额外的质检服务对所述关键片段进行监控,一旦发现所述关键片段中存在不规范内容,则向所述坐席推送所述告警信息。本具体实施方式的实施者可以根据实施需求,自由灵活地定义所述触发事件的具体流程,本发明对此不作限定。
当获得所述对话描述属性和所述关键片段后,需要将这些信息与所述语音文本进行关联,才能直观、快速地标记出所述语音文本的分析结果,这也是执行步骤S400的意义所在。在步骤S400中,创建所述对话描述属性和所述关键片段与所述语音文本之间的标引映射,所述标引映射指的是将所述对话描述属性和所述关键片段相关联的数据类型与所述语音文本进行标引绑定。典型地,请参考图2,图2是图1示出的步骤S400的可选实施例的流程示意图,步骤S400进一步包括:
步骤S410,从预设的标签库中选择与所述对话描述属性相对应的对话描述标签,并将所述语音文本标引至所述对话描述标签;以及
步骤S420,根据所述关键片段创建关键片段标签,并将所述语音文本标引至所述关键片段标签;
步骤S430,根据预定质检规则为所述对话描述属性和所述关键片段创建质检指标标签,并将所述语音文本标引至所述质检指标标签。
具体地,所述预设的标签库中存储了根据所述对话描述属性的类型所定义的多个对话描述标签,例如所述对话描述标签可以是不同类型的对话场景标签、不同类型的客户意图标签或不同类型的呼叫结果标签;所述关键片段标签是根据从所述关键片段中提取出来的文本字符所创建的标签,例如不同类型的业务实体标签、不同类型的命名实体标签或不同类型的关键字标签;所述质检指标标签例如是使用所述预定质检规则对所述对话描述属性和所述关键片段执行质检操作后而创建的标签,通常用来表达所述对话描述属性和所述关键片段的内容规范性,例如扣分标签、加分标签、合格标签等。根据步骤S300中所述对话描述属性和所述关键片段的产生顺序,步骤S410至步骤S430并不仅限于图2示出的顺序执行方式,相反,步骤S410至步骤S430更多情况下是并行执行的。
通过对图1示出的具体实施方式进行多次实施的实验可发现,选择所述对话描述属性和所述关键片段已从多个维度提供了所述语音文本的分析依据,足以满足较多对话分析场景中的分析精确度要求。如果还有进一步提升所述分析精确度的意愿,可以扩充所述对话描述属性和所述关键片段的所包含的数据类型,使得对所述语音文本的标引概括更为全面。当然,可进一步考虑对将所述标引映射作为所述语音文本的侧写数据进行存储。
优选地,由于步骤S400中已经获得所述标引映射,可以直接使用该标引映射来对所述语音文本进行评分,实现量化地分析和评价所述语音文本的目的,从而帮助呼叫中心的运营者直观了解坐席的业务办理效果。请参考图3,图3是根据本发明的坐席通话内容的分析方法的一个优选具体实施方式的流程示意图,与图1示出的具体实施方式的不同之处在于,图3示出的优选具体实施方式中根据本发明提供的坐席通话内容的分析方法还包括如下步骤:
步骤S500,根据所述标引映射对所述语音文本进行自动评分。
具体地,所述标引映射可实施为标签集合,可以预先根据预定规则设置一评分模板,并为所述标引映射中包含的多个标签分别赋予合适的分值,将所述多个标签作为变量输入至该评分模板内计算出所述语音文本的得分。所述预定规则包括但不限于是根据营销漏斗分析规则、绩效帕累托分析规则等评分标准相制定的。
需要说明的是,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
相应地,本发明还公开了一个或多个存储计算机可执行指令的计算机可读介质,所述指令在由一个或多个计算机设备使用时使得一个或多个计算机设备执行如前文所述的坐席通话内容的分析方法,例如图1示出的坐席通话内容的分析方法。所述计算机可读介质可以是可由计算机设备访问的任何可用介质,且包括用任何方法和技术实现的用于存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的易失性和非易失性介质、可移动和不可移动介质。计算机可读介质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光存储、盒式磁带、磁带、磁盘存储或其它磁存储设备,或者可用于存储所需信息并且可由计算设备访问的任何其它介质。上述的任意组合也应包含在计算机可读介质的范围内。
本发明提供的坐席通话内容的分析方法中涉及软件逻辑的部分可以使用可编程逻辑器件来实现,也可以实施为计算机程序产品,该程序产品使计算机执行用于所示范的方法。所述计算机程序产品包括计算机可读存储介质,该介质上包含计算机程序逻辑或代码部分,用于实现上述涉及软件逻辑的部分的各个步骤。所述计算机可读存储介质可以是被安装在计算机中的内置介质或者可从计算机主体拆卸的可移动介质(例如可热拔插的存储设备)。所述内置介质包括但不限于可重写的非易失性存储器,例如RAM、ROM和硬盘。所述可移动介质包括但不限于:光存储媒体(例如CD-ROM和DVD)、磁光存储媒体(例如MO)、磁存储媒体(例如磁带或移动硬盘)、具有内置的可重写的非易失性存储器的媒体(例如存储卡)和具有内置ROM的媒体(例如ROM盒)。
本领域技术人员应当理解,任何具有适当编程装置的计算机系统都能够执行包含在计算机程序产品中的本发明的方法的诸步骤。尽管本说明书中描述的多数具体实施方式都侧重于软件程序,但是以硬件方式实现本发明提供的方法的替代实施例同样在本发明要求保护的范围之内。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,在权利要求的等同要件的含义和范围内的所有变化均涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他部件、单元或步骤,单数不排除复数。权利要求中陈述的多个部件、单元或装置也可以由一个部件、单元或装置通过软件或者硬件来实现。
本发明提供的坐席通话内容的分析方法通过对文本转录获得的语音文本进行通话整体分析和局部信息抽取,可以获得所述语音文本对应的对话描述属性和关键片段,最终创建所述对话描述属性和所述关键片段与所述语音文本之间的标引映射,该标引映射可用作评价所述语音文本的依据。实施本发明提供的坐席通话内容的分析方法实现了从整体和局部两个角度对语音文本的可利用信息进行了数据挖掘,相比现有技术更加全面地为坐席通话的业务办理效果提供了评价参考,使得呼叫中心的运营者能更客观全面地了解坐席沟通绩效、客户需求和业务热点。
以上所披露的仅为本发明的一些较佳实施例,不能以此来限定本发明之权利范围,依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (12)
1.一种坐席通话内容的分析方法,该方法包括:
采集坐席呼出通话或接入通话时所进行的对话的语音数据;
将所述语音数据进行文本转录处理以获得语音文本;
调用对话分析模型对所述语音文本进行通话整体分析和局部信息抽取,所述通话整体分析用于识别出所述语音文本对应的至少一个对话描述属性,所述局部信息抽取用于抽取所述语音文本中的至少一个关键片段;
创建所述对话描述属性和所述关键片段与所述语音文本之间的标引映射。
2.根据权利要求1所述的坐席通话内容的分析方法,该方法还包括:
触发所述对话描述属性和所述关键片段对应的响应事件。
3.根据权利要求2所述的坐席通话内容的分析方法,其中,所述响应事件包括:
向所述坐席推送话术信息、告警信息和进度信息。
4.根据权利要求1所述的坐席通话内容的分析方法,其中,所述创建所述对话描述属性和所述关键片段与所述语音文本之间的标引映射的步骤包括:
从预设的标签库中选择与所述对话描述属性相对应的对话描述标签,并将所述语音文本标引至所述对话描述标签;以及
根据所述关键片段创建关键片段标签,并将所述语音文本标引至所述关键片段标签。
5.根据权利要求4所述的坐席通话内容的分析方法,其中所述创建所述对话描述属性和所述关键片段与所述语音文本之间的标引映射的步骤还包括:
根据预定质检规则为所述对话描述属性和所述关键片段创建质检指标标签,并将所述语音文本标引至所述质检指标标签。
6.根据权利要求1所述的坐席通话内容的分析方法,其中,所述通话整体分析包括:
基于自然语音处理实现的对话场景识别、客户意图识别、呼叫结果识别。
7.根据权利要求1所述的坐席通话内容的分析方法,其中,所述局部信息抽取包括:
基于自然语言处理实现的业务实体抽取、命名实体抽取、关键字抽取。
8.根据权利要求6或7所述的坐席通话内容的分析方法,其中,所述自然语言处理包括:
角色分析、分词、词性标注、命名实体识别、业务实体识别、实体关系识别、依存句法分析、局部事件识别、关键事件识别、话术信息识别和情感分析;以及
自动分类、文本相似度计算和自动摘要。
9.根据权利要求1、2、4或5任一项所述的坐席通话内容的分析方法,其中,所述对话描述属性包括:
对话场景、客户意图和呼叫结果。
10.根据权利要求1、2、4或5任一项所述的坐席通话内容的分析方法,其中,所述关键片段包括:
从所述语音文本中抽取的业务实体、命名实体和关键字。
11.根据权利要求1所述的坐席通话内容的分析方法,该方法还包括:
根据所述标引映射对所述语音文本进行自动评分。
12.一个或多个存储计算机可执行指令的计算机可读介质,所述指令在由一个或多个计算机设备使用时使得一个或多个计算机设备执行如权利要求1至11任一项所述的坐席通话内容的分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010413148.3A CN111639484A (zh) | 2020-05-15 | 2020-05-15 | 坐席通话内容的分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010413148.3A CN111639484A (zh) | 2020-05-15 | 2020-05-15 | 坐席通话内容的分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111639484A true CN111639484A (zh) | 2020-09-08 |
Family
ID=72330886
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010413148.3A Pending CN111639484A (zh) | 2020-05-15 | 2020-05-15 | 坐席通话内容的分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111639484A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984779A (zh) * | 2020-09-10 | 2020-11-24 | 支付宝(杭州)信息技术有限公司 | 一种对话文本分析方法、装置、设备和可读介质 |
CN112784572A (zh) * | 2021-01-19 | 2021-05-11 | 上海明略人工智能(集团)有限公司 | 一种营销场景话术分析方法和系统 |
CN112786041A (zh) * | 2020-12-23 | 2021-05-11 | 平安普惠企业管理有限公司 | 语音处理方法及相关设备 |
CN112804400A (zh) * | 2020-12-31 | 2021-05-14 | 中国工商银行股份有限公司 | 客服呼叫语音质检方法、装置、电子设备及存储介质 |
CN113129866A (zh) * | 2021-04-13 | 2021-07-16 | 重庆度小满优扬科技有限公司 | 语音处理方法、装置、存储介质及计算机设备 |
CN113160805A (zh) * | 2021-04-27 | 2021-07-23 | 中国建设银行股份有限公司深圳市分行 | 一种消息识别方法、装置、电子设备及存储介质 |
CN113723767A (zh) * | 2021-08-10 | 2021-11-30 | 上海浦东发展银行股份有限公司 | 一种基于语音交互数据的业务流程质检方法和装置 |
CN114363466A (zh) * | 2022-03-22 | 2022-04-15 | 长沙居美网络科技有限公司 | 基于ai的智呼云系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003150185A (ja) * | 2001-11-16 | 2003-05-23 | Fujitsu Ltd | 音声合成システムとその方法及びそれを実現するためのプログラム |
CN105373531A (zh) * | 2015-12-09 | 2016-03-02 | 微梦创科网络科技(中国)有限公司 | 一种基于社交网络的短话题文本识别方法及装置 |
CN108038205A (zh) * | 2017-12-15 | 2018-05-15 | 福州大学 | 针对中文微博的观点分析原型系统 |
CN108415972A (zh) * | 2018-02-08 | 2018-08-17 | 合肥工业大学 | 文本情感处理方法 |
US20200019807A1 (en) * | 2017-09-12 | 2020-01-16 | Tencent Technology (Shenzhen) Company Limited | Training method of image-text matching model, bi-directional search method, and relevant apparatus |
-
2020
- 2020-05-15 CN CN202010413148.3A patent/CN111639484A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003150185A (ja) * | 2001-11-16 | 2003-05-23 | Fujitsu Ltd | 音声合成システムとその方法及びそれを実現するためのプログラム |
CN105373531A (zh) * | 2015-12-09 | 2016-03-02 | 微梦创科网络科技(中国)有限公司 | 一种基于社交网络的短话题文本识别方法及装置 |
US20200019807A1 (en) * | 2017-09-12 | 2020-01-16 | Tencent Technology (Shenzhen) Company Limited | Training method of image-text matching model, bi-directional search method, and relevant apparatus |
CN108038205A (zh) * | 2017-12-15 | 2018-05-15 | 福州大学 | 针对中文微博的观点分析原型系统 |
CN108415972A (zh) * | 2018-02-08 | 2018-08-17 | 合肥工业大学 | 文本情感处理方法 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984779A (zh) * | 2020-09-10 | 2020-11-24 | 支付宝(杭州)信息技术有限公司 | 一种对话文本分析方法、装置、设备和可读介质 |
CN111984779B (zh) * | 2020-09-10 | 2024-05-28 | 支付宝(杭州)信息技术有限公司 | 一种对话文本分析方法、装置、设备和可读介质 |
CN112786041A (zh) * | 2020-12-23 | 2021-05-11 | 平安普惠企业管理有限公司 | 语音处理方法及相关设备 |
CN112786041B (zh) * | 2020-12-23 | 2023-11-24 | 光禹莱特数字科技(上海)有限公司 | 语音处理方法及相关设备 |
CN112804400A (zh) * | 2020-12-31 | 2021-05-14 | 中国工商银行股份有限公司 | 客服呼叫语音质检方法、装置、电子设备及存储介质 |
CN112784572A (zh) * | 2021-01-19 | 2021-05-11 | 上海明略人工智能(集团)有限公司 | 一种营销场景话术分析方法和系统 |
CN113129866A (zh) * | 2021-04-13 | 2021-07-16 | 重庆度小满优扬科技有限公司 | 语音处理方法、装置、存储介质及计算机设备 |
CN113129866B (zh) * | 2021-04-13 | 2022-08-02 | 重庆度小满优扬科技有限公司 | 语音处理方法、装置、存储介质及计算机设备 |
CN113160805A (zh) * | 2021-04-27 | 2021-07-23 | 中国建设银行股份有限公司深圳市分行 | 一种消息识别方法、装置、电子设备及存储介质 |
CN113723767A (zh) * | 2021-08-10 | 2021-11-30 | 上海浦东发展银行股份有限公司 | 一种基于语音交互数据的业务流程质检方法和装置 |
CN114363466A (zh) * | 2022-03-22 | 2022-04-15 | 长沙居美网络科技有限公司 | 基于ai的智呼云系统 |
CN114363466B (zh) * | 2022-03-22 | 2022-06-10 | 长沙居美网络科技有限公司 | 基于ai的智呼云系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111639484A (zh) | 坐席通话内容的分析方法 | |
CN112804400B (zh) | 客服呼叫语音质检方法、装置、电子设备及存储介质 | |
US10642889B2 (en) | Unsupervised automated topic detection, segmentation and labeling of conversations | |
US20200105280A1 (en) | Diarization using linguistic labeling | |
US9014363B2 (en) | System and method for automatically generating adaptive interaction logs from customer interaction text | |
US8412530B2 (en) | Method and apparatus for detection of sentiment in automated transcriptions | |
CN111640436B (zh) | 向坐席提供通话对象的动态客户画像的方法 | |
CN112487140A (zh) | 问答对话评测方法、装置、设备及存储介质 | |
US20230069935A1 (en) | Dialog system answering method based on sentence paraphrase recognition | |
US11914963B2 (en) | Systems and methods for determining and using semantic relatedness to classify segments of text | |
CN112233680A (zh) | 说话人角色识别方法、装置、电子设备及存储介质 | |
JP6208794B2 (ja) | 会話分析装置、方法及びコンピュータプログラム | |
CN112765974A (zh) | 一种业务辅助方法、电子设备及可读存储介质 | |
CN111737424A (zh) | 一种问题的匹配方法、装置、设备及存储介质 | |
CN112800269A (zh) | 会议记录的生成方法及装置 | |
US20240037941A1 (en) | Search results within segmented communication session content | |
US20230230585A1 (en) | System and method for generating wrap up information | |
Lopes et al. | The spedial datasets: datasets for spoken dialogue systems analytics | |
CN114118080B (zh) | 一种从销售会话中自动识别客户意向的方法及系统 | |
CN114117047A (zh) | 一种基于c4.5算法对非法语音进行分类的方法及系统 | |
CN112836517A (zh) | 一种基于自然语言处理挖掘风险信号的方法 | |
CN113094471A (zh) | 交互数据处理方法和装置 | |
KR20210069298A (ko) | 대화 분절 문장의 복원을 위한 장치 및 방법 | |
JP6743108B2 (ja) | パターン認識モデル及びパターン学習装置、その生成方法、それを用いたfaqの抽出方法及びパターン認識装置、並びにプログラム | |
CN117271778B (zh) | 基于生成式大模型的保险外呼会话信息输出方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |