CN113657773A - 话术质检方法、装置、电子设备及存储介质 - Google Patents
话术质检方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113657773A CN113657773A CN202110955419.2A CN202110955419A CN113657773A CN 113657773 A CN113657773 A CN 113657773A CN 202110955419 A CN202110955419 A CN 202110955419A CN 113657773 A CN113657773 A CN 113657773A
- Authority
- CN
- China
- Prior art keywords
- quality inspection
- text
- quality
- feature extraction
- strategy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Educational Administration (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Machine Translation (AREA)
Abstract
本申请适用于人工智能技术领域,提供一种话术质检方法、装置、电子设备及存储介质,该方法包括:根据待质检文本的业务类型获取话术质检所需的特征提取规则;基于获取的特征提取规则配置待质检文本的质检策略,质检策略根据该获取的特征提取规则的种类确定,使不同的业务类型对应配置不同的质检策略;根据质检策略对待质检文本进行话术质检处理,以判断待质检文本是否话术合规。该方法根据待质检文本的业务类型来确定特征提取规则,以及根据特征提取规则来配置质检策略,以采用配置的质检策略对该待质检文本进行自动质检,效率高、成本低,而且,可以实现按照业务类型对待质检文本进行分类质检,使得质检结果与业务类型强相关,提高质检的准确性。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种话术质检方法、装置、电子设备及存储介质。
背景技术
随着互联网通信技术的不断发展,客服服务成为了企业提供向上综合业务信息的重要方式,通过根据企业的需求开展外呼或呼入的话务业务,可以针对企业的产品进行市场调查、电话销售、售后跟踪等业务。随着市场竞争越来越激烈,保险行业对销售过程中的合规性有着严格的要求,严禁通过虚假描述、偷换概念等方式提高销售业绩,特别是在线上互联网保险的销售领域。目前,通常采用的质检方法是人工质检,通过人工质检的方式来对互联网保险的在线销售过程进行质检,然而,由于销售过程冗长,人工质检难以实现全部覆盖,之间的准确性低,且费时费力、成本高昂,无法满足现有的质检需求。
发明内容
有鉴于此,本申请实施例提供了一种话术质检方法、装置、电子设备及存储介质,可以让话术质检的结果与业务关注点强相关,提高质检准确性。
本申请实施例的第一方面提供了一种话术质检方法,包括:
根据待质检文本的业务类型获取话术质检所需的特征提取规则,其中,一种业务类型对应一种或多种特征提取规则;
基于获取的所述话术质检所需的特征提取规则配置所述待质检文本的质检策略,其中,所述质检策略根据所述话术质检所需的特征提取规则的种类确定,以使不同的业务类型对应配置不同的质检策略;
根据所述质检策略对所述待质检文本进行话术质检处理,以判断所述待质检文本是否话术合规。
结合第一方面,在第一方面的第一种可能实现方式中,所述根据所述质检策略对所述待质检文本进行话术质检处理,以判断所述待质检文本是否话术合规的步骤,包括:
按照所述特征提取规则对所述待质检文本进行特征提取处理,获取表征所述待质检文本的文本特征集;
采用所述质检策略对所述文本特征集中的文本特征进行合规评价,获得评价结果;
根据所述评价结果判断所述待质检文本是否话术合规。
结合第一方面或第一方面的第一种可能实现方式,在第一方面的第二种可能实现方式中,所述基于获取的所述话术质检所需的特征提取规则配置所述待质检文本的质检策略的步骤之前,还包括:
构建多任务的质检模型训练框架,所述质检模型框架中包含有多个任务分类器;
通过对所述质检模型框架中的多个任务分类器进行联合训练获得分类质检模型,以使所述分类质检模型中的每个所述任务分类器各自被训练作为一种质检策略,分别用于对不同业务类型的待质检文本进行话术质检处理。
结合第一方面的第二种可能实现方式,在第一方面的第三种可能实现方式中,所述通过对所述质检模型框架中的多个任务分类器进行联合训练获得分类质检模型,以使所述分类质检模型中的每个所述任务分类器各自被训练作为一种质检策略,分别用于对不同业务类型的待质检文本进行话术质检处理的步骤,包括:
基于业务类型为所述多个任务分类器配置各自关联的特征提取规则,其中,一种业务类型对应一个任务分类器;
触发目标任务分类器根据其关联的特征提取规则对训练样本文本进行特征提取处理,获得目标文本特征集,所述目标任务分类器为所述多个任务分类器中的任意一个;
触发目标任务分类器利用门控机制对所述目标文本特征集中的文本特征进行融合计算,以学习获得所述目标文本特征集中各文本特征的输出概率;
基于所述目标文本特征集中各文本特征的输出概率训练所述目标任务分类器,以使所述目标任务分类器被训练作为一个质检策略,用于对所述目标任务分类器对应的业务类型的文本进行话术质检处理。
结合第一方面的第三种可能实现方式,在第一方面的第四种可能实现方式中,所述触发目标任务分类器利用门控机制对所述目标文本特征集中的文本特征进行融合计算,以学习获得所述目标文本特征集中各文本特征的输出概率的步骤中,对所述目标文本特征集中的文本特征融合计算的公式表示为:
gk(x)=softmax(Wgkx)
其中,gk(x)为第k个目标任务分类器中文本特征x的输出概率,Wgk为文本特征x的训练权重值。
结合第一方面的第四种可能实现方式,在第一方面的第五种可能实现方式中,所述基于所述目标文本特征集中各文本特征的输出概率训练所述目标任务分类器,以使所述目标任务分类器被训练作为一种质检策略的步骤中,所述目标任务分类器的输出表示为:
yk=hk(fk(x))
其中,yk为所述目标任务分类器k输出的分类质检结果,表示为基于训练文本输入所述目标任务分类器k后获得的文本特征的概率分布;hk为目标任务分类器k采用的分类模型;fi(x)为特征变换函数;i为第i个文本特征;n为文本特征的数量。
结合第一方面或第一方面的第一种可能实现方式,在第一方面的第六种可能实现方式中,所述基于获取的所述话术质检所需的特征提取规则配置所述待质检文本的质检策略的步骤之前,还包括:
基于业务类型,通过定义违规话术的方式编排各业务类型各自对应的质检策略,其中,所述质检策略表征为定义的违规话术内容。
本申请实施例的第二方面提供了一种话术质检装置,所述话术质检装置包括:
规则确定模块,用于根据待质检文本的业务类型获取话术质检所需的特征提取规则,其中,一种业务类型对应一种或多种特征提取规则;
质检策略配置模块,用于基于获取的所述话术质检所需的特征提取规则配置所述待质检文本的质检策略,其中,所述质检策略根据所述话术质检所需的特征提取规则的种类确定,以使不同的业务类型对应配置不同的质检策略;
质检处理模块;用于根据所述质检策略对所述待质检文本进行话术质检处理,以判断所述待质检文本是否话术合规。
本申请实施例的第三方面提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在电子设备上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面提供的话术质检方法的各步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面提供的话术质检方法的各步骤。
本申请实施例提供的一种话术质检方法、装置、电子设备及存储介质,具有以下有益效果:
本申请所述方法根据待质检文本的业务类型确定特征提取规则;按照所述特征提取规则获取所述待质检文本的文本特征;根据所述特征提取规则配置所述待质检文本的质检策略,以按照所述质检策略对所述文本特征进行话术质检处理。由于该方法根据待质检文本的业务类型来确定特征提取规则以及根据特征提取规则来配置质检策略,可以实现采用配置的质检策略对该待质检文本进行自动质检,效率高、成本低,而且,可以实现按照业务类型对待质检文本进行分类质检,使得质检结果与业务类型强相关,提高质检的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种话术质检方法的实现流程图;
图2为本申请实施例提供的话术质检方法中进行话术质检处理的一种方法流程示意图;
图3为本实施例提供的话术质检方法中构建质检策略时的一种方法流程示意图;
图4为本申请实施例提供的话术质检方法中构建质检策略时的另一种方法流程示意图;
图5为本申请实施例提供的话术质检方法中对多个任务分类器进行联合训练时的一种训练过程示意图;
图6为本申请实施例提供的一种话术质检装置的基本结构框图;
图7为本申请实施例提供的一种电子设备的基本结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
请参阅图1,图1为本申请实施例提供的一种话术质检方法的实现流程图。
详述如下:
步骤S11:根据待质检文本的业务类型获取话术质检所需的特征提取规则,其中,一种业务类型对应一种或多种特征提取规则。
本实施例中,用户采用话务服务进行线上业务处理时会产生会话数据,将这些会话数据转化为文本形式进行记录和存储,这些文本即为待质检文本。在本实施例中,针对不同的业务,例如市场调查业务、电话销售业务、售后跟踪服务等,结合不同服务的会话谈论到的业务关注点和关键词存在较大的差别,而对于同一业务的会话谈论到的业务关注点和关键词相同或相似的特点,根据不同业务类型对应配置不同的特征提取规则,一种业务类型可对应配置一种或多种特征提取规则,由此确定的特征提取规则可以使得提取待质检文本的特征时更关注于业务关注点。在本实施例中,待质检文本的业务类型可以通过识别待质检文本的存储路径获得。
本申请的一些实施例中,特征提取规则可以包括但不限于依存分析处理、规则引擎处理、N元模型(ngrams)处理、意图识别处理、黑白名单识别处理、指代消解处理中的一种或多种。其中,依存分析处理可以分析文本中共用主谓语等情况下的语法结构特征;规则引擎处理可以按需求提取文本中需要关注的字段;N元模型(ngrams)处理可以提取文本中的序列语义特征,示例性的,N元模型中的N配置为3;意图识别处理可以判断文本中是否包含有特定意图的字段,例如索要客户私人手机号码的字段;黑白名单识别处理可以判定文本所对应的操作用户为黑名单用户还是白名单用户;指代消解处理可以将文本中表征同一事物的指代词和指代实体进行聚合。在本实施例中,根据业务需求,可以建立一个业务类型与特征提取规则对应的配置关系表,其中,一种业务类型可以配置一种或多种特征提取规则。根据业务类型配置的特征提取规则来构建各业务类型的文本对应的文本特征,以此构建出来的文本特征可以准确地表达出业务的关注点,同时也更具备可解释性。由此,在本实施例中,可以通过识别待质检文本的业务类型,然后根据待质检文本的业务类型来查询根据业务需求建立的配置关系表,即可获得话术质检所需的特征提取规则。
步骤S12:基于获取的所述话术质检所需的特征提取规则配置所述待质检文本的质检策略,其中,所述质检策略根据所述话术质检所需的特征提取规则的种类确定,以使不同的业务类型对应配置不同的质检策略。
本实施例中,根据待质检文本的业务类型可以获得一种或多种特征提取规则。在本实施例中,可以根据具体获得的特征提取规则来配置待质检文本的质检策略,实现针对不同业务类型的待质检文本进行分类质检的目的。其中,不同的业务类型对应配置得到不同的质检策略,质检策略根据特征提取规则的种类来确定。示例性的,例如基于业务类型确定的特征提取规则包含有意图识别处理规则和黑白名单识别处理规则,则根据该意图识别处理规则和黑白名单识别处理规则配置出一个对应于该两个特征提取规则的质检策略,又例如基于业务类型确定的特征提取规则包含有依存分析处理规则、规则引擎处理规则、N元模型(ngrams)处理规则和意图识别处理规则,那么此时则根据该依存分析处理规则、规则引擎处理规则、N元模型(ngrams)处理规则和意图识别处理规则配置出一个对应于该四个特征提取规则的质检策略。在本实施例中,配置待质检文本的质检策略时,可以通过基于业务类型进行神经网络模型训练获得质检策略,也可以通过基于业务类型按分类进行编排获得质检策略。
步骤S13:根据所述质检策略对所述待质检文本进行话术质检处理,以判断所述待质检文本是否话术合规。
本实施例中,不同的业务类型,其对应的质检策略对话术违规的关注点会有所不同。在本实施例中,配置的待质检文本的质检策略与业务类型强相关,易于理解待质检文本中的业务关注点,具备较强的可解释性。在对待质检文本进行话术质检处理时,可以按照确定的特征提取规则对待质检文本进行特征提取处理,获得文本特征,进而采用配置的质检策略对获得的文本特征进行合规评价,以基于业务类型判断该待质检文本是否话术合规。示例性的,可以在该质检策略中,建立有基于该业务类型的违规话术数据,将获得的文本特征与建立的违规话术数据进行相似度计算,从而根据相似度确定该获得的文本特征是否属于违规话术。若从待质检文本中提取到的文本特征都不属于违规话术,则判断该待质检文本话术合规,否则判断该待质检文本话术不合规。
上述实施例提供的话术质检方法根据待质检文本的业务类型来确定特征提取规则以及基于特征提取规则配置质检策略,可以实现采用配置的质检策略对该待质检文本进行自动质检,效率高、成本低,而且,通过根据具体确定的特征提取规则来配置待质检文本的质检策略,实现了针对不同业务类型的待质检文本进行分类质检的目的,使得质检结果与业务类型强相关,提高了质检的准确性。
本申请的一些实施例中,请参阅图2,图2为本申请实施例提供的话术质检方法中进行话术质检处理的一种方法流程示意图。详细如下:
步骤S21:按照所述特征提取规则对所述待质检文本进行特征提取处理,获取表征所述待质检文本的文本特征集;
步骤S22:采用所述质检策略对所述文本特征集中的文本特征进行合规评价,获得评价结果;
步骤S23:根据所述评价结果判断所述待质检文本是否话术合规。
本实施例中,若根据待质检文本的业务类型确定的特征提取规则只有一种时,按照该特征提取规则从待质检文本中获取文本特征,将获取得到的文本特征进行打包集合在一起,得到用于表征该待质检文本的文本特征集。若根据业务类型确定待质检文本的特征提取规则有多种时,则按照每一种特征提取规则分别对待质检文本进行特征提取处理,将每一种特征提取规则提取到的文本特征进行一并打包集合在一起,得到用于表征该待质检文本的文本特征集。示例性的,假设一待质检文本所属的业务类型对应配置有3种特征提取规则,其中,第1种特征提取规则12个文本特征,第2种特征提取规则提取到7个文本特征,第3种特征提取规则提取到16个文本特征。那么此时,该待质检文本的文本特征即为含有该12+7+16种文本特征的文本特征集,表示为{F1、F2、F3、...、F35}。获得文本特征集后,采用此前配置好的质检策略对该文本特征集中的文本特征进行合规评价,以生成评价结果。在本实施例中,进行合规评价的评价结果可以表示为文本特征集中各文本特征与违规话术数据之间的相似度。根据评价结果判断待质检文本是否话术合规时,可以通过设置相似度阈值,当评价结果中得到的相似度超过设置的相似度阈值时,判断该待质检文本话术合规。
本申请的一些实施例中,请参阅图3,图3为本实施例提供的话术质检方法中构建质检策略时的一种方法流程示意图。详细如下:
步骤S31:构建多任务的质检模型训练框架,所述质检模型框架中包含有多个任务分类器;
步骤S32:通过对所述质检模型框架中的多个任务分类器进行联合训练获得分类质检模型,以使所述分类质检模型中的每个所述任务分类器各自被训练作为一种质检策略,分别用于对不同业务类型的待质检文本进行话术质检处理。
本实施例中,质检策略通过神经网络模型训练获得。在本实施例中,通过构建一个多任务的质检模型训练框架,即在构建的质检模型训练框架中设置多个任务分类器,其中,任务分类器的配置数量大于等于业务类型的数量。进而通过对质检模型训练框架中的多个任务分类器进行联合训练,获得分类质检模型。在训练好的分类质检模型中,每个任务分类器各自被训练作为一种质检策略,分别用于对不同业务类型的待质检文本进行话术质检处理,即每个任务分类器分别被训练用于针对一种业务类型的文本进行话术质检处理。在本实施例中,各任务分类器的结构可以是逻辑回归模型结构或深度学习模型结构或树模型结构等。
本申请的一些实施例中,请参阅图4,图4为本申请实施例提供的话术质检方法中构建质检策略时的另一种方法流程示意图。详细如下:
步骤S41:基于业务类型为所述多个任务分类器配置各自关联的特征提取规则,其中,一种业务类型对应一个任务分类器;
步骤S42:触发目标任务分类器根据其关联的特征提取规则对训练样本文本进行特征提取处理,获得目标文本特征集,所述目标任务分类器为所述多个任务分类器中的任意一个;
步骤S43:触发目标任务分类器利用门控机制对所述目标文本特征集中的文本特征进行融合计算,以学习获得所述目标文本特征集中各文本特征的输出概率;
步骤S44:基于所述目标文本特征集中各文本特征的输出概率训练所述目标任务分类器,以使所述目标任务分类器被训练作为一个质检策略,用于对所述目标任务分类器对应的业务类型的文本进行话术质检处理。
本实施例中,业务类型可以根据用户的实际业务需求进行设置。构建一个多任务的质检模型训练框架时,一个业务类型对应配置一个任务分类器。在本实施例中,通过根据业务类型所对应的业务需求,为各个任务分类器配置各自关联的特征提取规则。举例说明,例如针对于某个业务类型,若该类型的业务对于话术质检的要求为只需要执行黑白名单方面的质检,则该业务类型配置关联的特征提取规则为黑白名单识别处理;若该类型的业务对于话术质检的要求为需要执行依存分析、N元模型(ngrams)、意图识别以及黑白名单等方面的质检,则该业务类型配置关联的特征提取规则包括依存分析处理、N元模型(ngrams)处理、意图识别处理以及黑白名单处理。在本实施例中,令该质检模型训练框架中的多个任务分类器都配置有各自对应关联的特征提取规则后,可以通过触发各任务分类器根据其各自关联的特征提取规则对训练样本文本进行特征提取处理,获得各自对应的文本特征集。然后,针对该质检模型训练框架中的任意一个任务分类器,令其作为目标分类器,触发该目标任务分类器利用门控机制对其获得的文本特征集中的文本特征进行融合计算,使得目标任务分类器学习到其对应获得的文本特征集中各文本特征的输出概率。最后,由该学习到的输出概率训练该目标任务分类器,以使得目标任务分类器被训练作为一个质检策略,用于对目标任务分类器所对应的业务类型的文本进行话术质检处理。
示例性的,请参阅图5,图5为本申请实施例提供的话术质检方法中对多个任务分类器进行联合训练时的一种训练过程示意图。如图5所示,对质检模型框架中的多个任务分类器进行联合训练的过程具体包括:采用多种不同的特征提取规则对训练样本文本分别进行特征提取处理,得到多组文本特征集,例如特征集A1-An、特征集B1-Bn、特征集C1-Cn...等。在本实施例中,质检模型训练框架中的各个任务分类器,均基于业务类型为该各任务分类器配置有各自关联的特征提取规则,使得各个任务分类器分别用于针对不同业务类型的待质检文本进行话术质检处理。在本实施例中,模型训练过程中,基于任务分类器各自关联的特征提取规则,可以利用门控机制获取各任务分类器各自关联的特征提取规则提取得到的文本特征进行融合。示例性的,假设一任务分类器K基于其关联的特征提取规则获得n个文本特征x,x=f1、f2、...、fn。此时,门控机制的输出为:
gk(x)=softmax(Wgkx)
其中,gk(x)为第k个分类器中特征x的输出概率,Wgk为文本特征x的训练权重值。
由此,根据上述门控机制的输出结果训练该任务分类器K,以使得任务分类器K的输出表示为:
yk=hk(fk(x))
其中,yk为分类器k输出的分类质检结果,一般可以表示为基于训练文本输入该分类器k的各特征的概率分布。hk为分类器k采用的分类模型,在本实施例中,该分类模型一般可以采用sigmoid函数或是softmax(wx+b)函数(w为权重矩阵)表示。fi(x)为特征变换函数,该特征变换函数一般可以采用W*x形式(W为变换矩阵)或embedding形式表示。i为第i个文本特征。n为文本特征的数量。
基于上述训练过程训练质检模型训练框架中的各个任务分类器至收敛状态,即可获得分类质检模型。在本实施例中,训练好的分类质检模型被训练用于对待质检文本进行话术质检处理,例如评价从待质检文本中提取到的文本特征,以此判断该待质检文本是否话术合规。
本申请的一些实施例中,通过联合训练获得分类质检模型之前,可以通过疑似违规文本召回的方式构建获得一个违规文本召回池,进而从违规文本召回池中收集大量不合规的话术关键字段,例如收集“购买xx保险……就像存钱”,“退保……没有损失”,“这个保险是送给你的”,“我们的保险最好”等带有诱导性质的关键文本片段。获得这些关键文本片段后,通过标注的方式对这些关键文本片段进行分类处理,采用这些经分类处理后获得的带有分类标注的关键文本片段来构建训练样本文本。在本实施例中,针对召回到违规文本召回池中的文本,构建训练样本文本之前,还可以预先对违规文本召回池中的文本进行预处理,其中预处理包括但不限于去停用词、同义词改写、纠错、文本降噪、分词等处理。经过上述一系列的预处理可以使得训练样本文本更具有效性,从而提高分类质检模型的训练效率和质检准确性。其中,由于文本基本都偏口语化,会存在大量的停用词,例如“啊”,“吧”,“么”,“一下”等,通过去停用词处理可以减少这些无实质意义的词语对模型训练的干扰,在本实施例中,去停用词处理过程中所使用的停用词表可以根据业务数据进行定制。同义词改写处理可以用来标准化文本,防止后续特征提取环节出现特征模板爆炸性增长。由于键盘输入本身会引入错别字输入,而且以拼音纠错为主,纠错处理可以减少文本中错词对模型训练的干扰。分词处理可以便于语义理解。文本降噪处理可以防止业务人员故意通过引入噪音符号等方式来规避合规审查,例如故意用标点符号来隔开电话号码。
本申请的一些实施例中,质检策略还可以基于业务类型进行编排获得。示例性的,在本实施例中,首先划分业务类型,其中,业务类型可以根据业务的性质、特性进行划分,例如市场调查业务、电话销售业务、售后跟踪服务等等。针对各业务类型,按照各业务类型的性质、特性等来进行话术的违规定义,再根据违规定义确定用于从文本中提取该违规定义的内容所用的特征提取规则,并且将这些违规定义的内容编排成质检策略。其中,不同的业务类型,对应确定的特征提取规则也不同。在本实施例中,进行话术质检处理时,基于待质检文本的业务类型,按照由该业务类型确定的特征提取规则提取待质检文本中的文本特征,然后按照该编排成的质检策略将该提取得到的文本特征与质检策略中按业务类型编排的违规定义的内容进行比对,以根据比对结果来确定待质检文本是否合规。
可以理解的是,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本申请的一些实施例中,请参阅图6,图6为本申请实施例提供的一种话术质检装置的基本结构框图。本实施例中该装置包括的各单元用于执行上述方法实施例中的各步骤。具体请参阅上述方法实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。如图6所示,话术质检装置包括:规则确定模块61、质检策略配置模块62以及质检处理模块63。其中:所述规则确定模块61用于根据待质检文本的业务类型获取话术质检所需的特征提取规则,其中,一种业务类型对应一种或多种特征提取规则。所述质检策略配置模块62用于基于获取的所述话术质检所需的特征提取规则配置所述待质检文本的质检策略,其中,所述质检策略根据所述话术质检所需的特征提取规则的种类确定,以使不同的业务类型对应配置不同的质检策略。所述质检处理模块63用于根据所述质检策略对所述待质检文本进行话术质检处理,以判断所述待质检文本是否话术合规。
应当理解的是,上述话术质检装置,与上述的话术质检方法一一对应,此处不再赘述。
本申请的一些实施例中,请参阅图7,图7为本申请实施例提供的一种电子设备的基本结构框图。如图7所示,该实施例的电子设备7包括:处理器71、存储器72以及存储在所述存储器72中并可在所述处理器71上运行的计算机程序73,例如话术质检方法的程序。处理器71执行所述计算机程序73时实现上述各个话术质检方法各实施例中的步骤。或者,所述处理器71执行所述计算机程序73时实现上述话术质检装置对应的实施例中各模块的功能。具体请参阅实施例中的相关描述,此处不赘述。
示例性的,所述计算机程序73可以被分割成一个或多个模块(单元),所述一个或者多个模块被存储在所述存储器72中,并由所述处理器71执行,以完成本申请。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序73在所述电子设备7中的执行过程。例如,所述计算机程序73可以被分割成规则确定模块、质检策略配置模块以及质检处理模块,各模块具体功能如上所述。
所述转台设备可包括,但不仅限于,处理器71、存储器72。本领域技术人员可以理解,图7仅仅是电子设备7的示例,并不构成对电子设备7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述转台设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器71可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器72可以是所述电子设备7的内部存储单元,例如电子设备7的硬盘或内存。所述存储器72也可以是所述电子设备7的外部存储设备,例如所述电子设备7上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器72还可以既包括所述电子设备7的内部存储单元也包括外部存储设备。所述存储器72用于存储所述计算机程序以及所述转台设备所需的其他程序和数据。所述存储器72还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。在本实施例中,所述计算机可读存储介质可以是非易失性,也可以是易失性。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种话术质检方法,其特征在于,包括:
根据待质检文本的业务类型获取话术质检所需的特征提取规则,其中,一种业务类型对应一种或多种特征提取规则;
基于获取的所述话术质检所需的特征提取规则配置所述待质检文本的质检策略,其中,所述质检策略根据所述话术质检所需的特征提取规则的种类确定,以使不同的业务类型对应配置不同的质检策略;
根据所述质检策略对所述待质检文本进行话术质检处理,以判断所述待质检文本是否话术合规。
2.根据权利要求1所述的话术质检方法,其特征在于,所述根据所述质检策略对所述待质检文本进行话术质检处理,以判断所述待质检文本是否话术合规的步骤,包括:
按照所述特征提取规则对所述待质检文本进行特征提取处理,获取表征所述待质检文本的文本特征集;
采用所述质检策略对所述文本特征集中的文本特征进行合规评价,获得评价结果;
根据所述评价结果判断所述待质检文本是否话术合规。
3.根据权利要求1或2所述的话术质检方法,其特征在于,所述基于获取的所述话术质检所需的特征提取规则配置所述待质检文本的质检策略的步骤之前,还包括:
构建多任务的质检模型训练框架,所述质检模型框架中包含有多个任务分类器;
通过对所述质检模型框架中的多个任务分类器进行联合训练获得分类质检模型,以使所述分类质检模型中的每个所述任务分类器各自被训练作为一种质检策略,分别用于对不同业务类型的待质检文本进行话术质检处理。
4.根据权利要求3所述的话术质检方法,其特征在于,所述通过对所述质检模型框架中的多个任务分类器进行联合训练获得分类质检模型,以使所述分类质检模型中的每个所述任务分类器各自被训练作为一种质检策略,分别用于对不同业务类型的待质检文本进行话术质检处理的步骤,包括:
基于业务类型为所述多个任务分类器配置各自关联的特征提取规则,其中,一种业务类型对应一个任务分类器;
触发目标任务分类器根据其关联的特征提取规则对训练样本文本进行特征提取处理,获得目标文本特征集,所述目标任务分类器为所述多个任务分类器中的任意一个;
触发目标任务分类器利用门控机制对所述目标文本特征集中的文本特征进行融合计算,以学习获得所述目标文本特征集中各文本特征的输出概率;
基于所述目标文本特征集中各文本特征的输出概率训练所述目标任务分类器,以使所述目标任务分类器被训练作为一个质检策略,用于对所述目标任务分类器对应的业务类型的文本进行话术质检处理。
5.根据权利要求4所述的话术质检方法,其特征在于,所述触发目标任务分类器利用门控机制对所述目标文本特征集中的文本特征进行融合计算,以学习获得所述目标文本特征集中各文本特征的输出概率的步骤中,对所述目标文本特征集中的文本特征融合计算的公式表示为:
gk(x)=softmax(Wgkx)
其中,gk(x)为第k个目标任务分类器中文本特征x的输出概率,Wgk为文本特征x的训练权重值。
7.根据权利要求1或2所述的话术质检方法,其特征在于,所述基于获取的所述话术质检所需的特征提取规则配置所述待质检文本的质检策略的步骤之前,还包括:
基于业务类型,通过定义违规话术的方式编排各业务类型各自对应的质检策略,其中,所述质检策略表征为定义的违规话术内容。
8.一种话术质检装置,其特征在于,包括:
规则确定模块,用于根据待质检文本的业务类型获取话术质检所需的特征提取规则,其中,一种业务类型对应一种或多种特征提取规则;
质检策略配置模块,用于基于获取的所述话术质检所需的特征提取规则配置所述待质检文本的质检策略,其中,所述质检策略根据所述话术质检所需的特征提取规则的种类确定,以使不同的业务类型对应配置不同的质检策略;
质检处理模块;用于根据所述质检策略对所述待质检文本进行话术质检处理,以判断所述待质检文本是否话术合规。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110955419.2A CN113657773B (zh) | 2021-08-19 | 2021-08-19 | 话术质检方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110955419.2A CN113657773B (zh) | 2021-08-19 | 2021-08-19 | 话术质检方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113657773A true CN113657773A (zh) | 2021-11-16 |
CN113657773B CN113657773B (zh) | 2023-08-29 |
Family
ID=78492416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110955419.2A Active CN113657773B (zh) | 2021-08-19 | 2021-08-19 | 话术质检方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113657773B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114418542A (zh) * | 2022-01-20 | 2022-04-29 | 京东科技信息技术有限公司 | 业务操作流程的检验方法、装置、设备及存储介质 |
CN115115291A (zh) * | 2022-08-30 | 2022-09-27 | 深圳市星网信通科技有限公司 | 会话信息质检方法、装置及计算机可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150032515A1 (en) * | 2012-06-26 | 2015-01-29 | Huawei Technologies Co., Ltd. | Quality Inspection Processing Method and Device |
JP2018041295A (ja) * | 2016-09-08 | 2018-03-15 | アズビル株式会社 | 管理業務品質評価システムおよび方法 |
CN108446388A (zh) * | 2018-03-22 | 2018-08-24 | 平安科技(深圳)有限公司 | 文本数据质检方法、装置、设备及计算机可读存储介质 |
CN108737667A (zh) * | 2018-05-03 | 2018-11-02 | 平安科技(深圳)有限公司 | 语音质检方法、装置、计算机设备及存储介质 |
CN110929011A (zh) * | 2019-11-28 | 2020-03-27 | 北京思特奇信息技术股份有限公司 | 一种对话分析方法、装置和设备 |
CN111160017A (zh) * | 2019-12-12 | 2020-05-15 | 北京文思海辉金信软件有限公司 | 关键词抽取方法、话术评分方法以及话术推荐方法 |
CN112183594A (zh) * | 2020-09-17 | 2021-01-05 | 微民保险代理有限公司 | 票据图像的处理方法和装置、存储介质及电子设备 |
-
2021
- 2021-08-19 CN CN202110955419.2A patent/CN113657773B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150032515A1 (en) * | 2012-06-26 | 2015-01-29 | Huawei Technologies Co., Ltd. | Quality Inspection Processing Method and Device |
JP2018041295A (ja) * | 2016-09-08 | 2018-03-15 | アズビル株式会社 | 管理業務品質評価システムおよび方法 |
CN108446388A (zh) * | 2018-03-22 | 2018-08-24 | 平安科技(深圳)有限公司 | 文本数据质检方法、装置、设备及计算机可读存储介质 |
CN108737667A (zh) * | 2018-05-03 | 2018-11-02 | 平安科技(深圳)有限公司 | 语音质检方法、装置、计算机设备及存储介质 |
CN110929011A (zh) * | 2019-11-28 | 2020-03-27 | 北京思特奇信息技术股份有限公司 | 一种对话分析方法、装置和设备 |
CN111160017A (zh) * | 2019-12-12 | 2020-05-15 | 北京文思海辉金信软件有限公司 | 关键词抽取方法、话术评分方法以及话术推荐方法 |
CN112183594A (zh) * | 2020-09-17 | 2021-01-05 | 微民保险代理有限公司 | 票据图像的处理方法和装置、存储介质及电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114418542A (zh) * | 2022-01-20 | 2022-04-29 | 京东科技信息技术有限公司 | 业务操作流程的检验方法、装置、设备及存储介质 |
CN115115291A (zh) * | 2022-08-30 | 2022-09-27 | 深圳市星网信通科技有限公司 | 会话信息质检方法、装置及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113657773B (zh) | 2023-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110147726B (zh) | 业务质检方法和装置、存储介质及电子装置 | |
CN110781276B (zh) | 文本抽取方法、装置、设备及存储介质 | |
US11709854B2 (en) | Artificial intelligence based smart data engine | |
CN109872162B (zh) | 一种处理用户投诉信息的风控分类识别方法及系统 | |
US20200241861A1 (en) | Software component defect prediction using classification models that generate hierarchical component classifications | |
US20150269142A1 (en) | System and method for automatically generating a dataset for a system that recognizes questions posed in natural language and answers with predefined answers | |
WO2022156065A1 (zh) | 一种文本情感分析方法、装置、设备及存储介质 | |
CN111460250A (zh) | 用于画像的数据的清洗方法、装置、介质及电子设备 | |
CN113657773B (zh) | 话术质检方法、装置、电子设备及存储介质 | |
CN110348471B (zh) | 异常对象识别方法、装置、介质及电子设备 | |
US20220131975A1 (en) | Method And Apparatus For Predicting Customer Satisfaction From A Conversation | |
CN116611074A (zh) | 安全信息审查方法、设备、存储介质及装置 | |
KR20200125526A (ko) | 인공 신경망을 이용한 상담 서비스 품질 보증 방법과 상기 방법을 수행할 수 있는 컴퓨터 프로그램 | |
CN117520503A (zh) | 基于llm模型的金融客服对话生成方法、装置、设备及介质 | |
CN115687980A (zh) | 数据表的脱敏分类方法、分类模型训练方法及装置 | |
CN116628163A (zh) | 客服服务处理方法、装置、设备及存储介质 | |
CN117540803A (zh) | 基于大模型的决策引擎配置方法、装置、电子设备及介质 | |
CN113434630B (zh) | 客服服务评估方法、装置、终端设备及介质 | |
CN113836297B (zh) | 文本情感分析模型的训练方法及装置 | |
CN114595318A (zh) | 一种客服回复质量评价方法及系统 | |
CN114356982A (zh) | 营销合规性检查方法、装置、计算机设备及存储介质 | |
CN114186048A (zh) | 基于人工智能的问答回复方法、装置、计算机设备及介质 | |
CN112784034A (zh) | 摘要生成方法、装置及计算机设备 | |
CN112015858B (zh) | 信息的检测方法、设备及存储介质 | |
CN116911313B (zh) | 一种语义漂移文本的识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |