CN114399379A - 基于人工智能的催收行为识别方法、装置、设备及介质 - Google Patents

基于人工智能的催收行为识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN114399379A
CN114399379A CN202210028106.7A CN202210028106A CN114399379A CN 114399379 A CN114399379 A CN 114399379A CN 202210028106 A CN202210028106 A CN 202210028106A CN 114399379 A CN114399379 A CN 114399379A
Authority
CN
China
Prior art keywords
target
collection
information
dialogue information
cases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210028106.7A
Other languages
English (en)
Inventor
徐筱莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN202210028106.7A priority Critical patent/CN114399379A/zh
Publication of CN114399379A publication Critical patent/CN114399379A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请为人工智能技术的神经网络技术领域,本申请提供了一种基于人工智能的催收行为识别方法、装置、设备及介质,其中,所述方法包括:获取预设时间段内的所有催收案件,根据预设筛选规则对所有催收案件进行筛选,得到至少两个第一催收案件,根据用户信息查询每个第一催收案件的用户风险等级,从至少两个第一催收案件中筛选出用户风险等级最高的目标催收案件,获取目标催收案件对应的目标对话信息,根据目标对话信息确定目标催收案件所属的业务类型,查询业务类型对应的目标话术识别模型,将目标对话信息输入目标话术识别模型中,得到对目标对话信息的识别结果,以精确识别对话信息中是否存在违规,同时避免了大量的质检工作,提高了违规行为识别效率。

Description

基于人工智能的催收行为识别方法、装置、设备及介质
技术领域
本申请涉及人工智能技术的神经网络技术领域,具体而言,本申请涉及一种基于人工智能的催收行为识别方法、装置、设备及介质。
背景技术
金融类产品行业中,催收人员的催收行为,需严格符合国家法律法规,因此公司需要对催收人员的行为进行管理约束,各家催收公司均需实时识别催收人员催收后产生的催收案件,以判断催收人员的催收行为是否可能违规。但现有的催收行为识别方法,在催收案件较多时,识别效率则较低。
发明内容
本申请的主要目的为提供一种基于人工智能的催收行为识别方法、装置、设备及介质,以提高催收行为的识别效率。
为了实现上述发明目的,本申请提供一种基于人工智能的催收行为识别方法,其包括:
获取预设时间段内的所有催收案件,根据预设筛选规则对所有所述催收案件进行筛选,得到至少两个第一催收案件;其中,所述第一催收案件携带有逾期用户的用户信息及催收人员催收所述逾期用户时的对话信息;
根据所述用户信息查询每个所述第一催收案件的用户风险等级,从所述至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件;
获取所述目标催收案件对应的对话信息,得到目标对话信息,根据所述目标对话信息确定所述目标催收案件所属的业务类型;
查询所述业务类型对应的话术识别模型,得到目标话术识别模型;其中,每种业务类型的话术识别模型对应识别该种业务类型的催收案件的对话信息中催收人员是否存在违规行为;
将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果;其中,所述识别结果包括所述目标对话信息中的催收人员存在违规行为或不存在违规行为。
进一步地,所述将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果之后,还包括:
当确定所述识别结果为所述目标对话信息中的催收人员存在违规行为时,提取所述目标对话信息的多个关键词;
将所述多个关键词与预设的违规词集合进行匹配,筛选出与违规词集合中的违规词相匹配的关键词,得到多个目标关键词;其中,所述违规词集合包括至少一个违规词;
查询每个所述目标关键词对应的违规等级;
将每个所述目标关键词对应的违规等级进行累加后,得到目标违规等级;
根据所述目标违规等级制定相应的惩罚方案,基于所述惩罚方案对所述目标对话信息中的催收人员进行惩罚。
优选地,所述将所述多个关键词与预设的违规词集合进行匹配,筛选出与违规词集合中的违规词相匹配的关键词,得到多个目标关键词,包括:
将所述多个关键词分别转换为词向量,得到每个所述关键词对应的第一词向量;
将所述违规词集合中的每个违规词转换为词向量,得到每个违规词对应的第二词向量;
分别计算每个所述第一词向量与每个所述第二词向量的余弦距离,将余弦距离大于预设阈值的第一词向量作为目标词向量;
查询每个所述目标词向量对应的关键词,得到多个目标关键词。
优选地,所述将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果,包括:
将所述目标对话信息输入所述目标话术识别模型中,根据预置至所述目标话术识别模型的违规规则对所述目标对话信息进行关键词提取,得到参考关键词;
根据预设的近义词匹配规则,对所述目标对话信息的参考关键词进行违禁用语质检,得到违禁用语质检结果;
根据所述违禁用语质检结果判断所述目标对话信息是否存在违禁用语;
若是,则生成所述目标对话信息中的催收人员存在违规行为的识别结果;
若否,则生成所述目标对话信息中的催收人员不存在违规行为的识别结果。
优选地,所述根据预设筛选规则对所有所述催收案件进行筛选,得到至少两个第一催收案件,包括:
提取每个所述催收案件携带的逾期用户的用户信息;
根据所述用户信息查询每个所述逾期用户的逾期次数,按照所述逾期次数由多到少的顺序对所有所述催收案件进行排序,筛选出排在前N位的催收案件作为第一催收案件;其中,所述N>1。
进一步地,所述查询所述业务类型对应的话术识别模型之前,还包括:
获取不同业务类型的对话信息样本,并确定每个对话信息样本对应的参考识别结果;
构建多个神经网络模型,将同种业务类型的对话信息样本及对应的参考识别结果输入同一个神经网络模型中进行训练,得到每个神经网络模型的训练结果;
在每个神经网络模型的训练结果满足要求后,得到每种业务类型对应的话术识别模型。
进一步地,所述根据所述用户信息查询每个所述第一催收案件的用户风险等级,包括:
根据所述用户信息查询所述第一催收案件的逾期用户的逾期次数及逾期天数;
获取预先为所述逾期次数设置的第一权重、为所述逾期天数设置的第二权重;
将所述逾期次数乘以第一权重后,得到第一数值;
将所述逾期天数乘以第二权重后,得到第二数值;
将所述第一数值与所述第二数值进行相加后,得到用户风险评估值;
根据所述用户风险评估值确定所述第一催收案件的用户风险等级。
本申请还提供一种基于人工智能的催收行为识别装置,其包括:
获取模块,用于获取预设时间段内的所有催收案件,根据预设筛选规则对所有所述催收案件进行筛选,得到至少两个第一催收案件;其中,所述第一催收案件携带有逾期用户的用户信息及催收人员催收所述逾期用户时的对话信息;
第一查询模块,用于根据所述用户信息查询每个所述第一催收案件的用户风险等级,从所述至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件;
确定模块,用于获取所述目标催收案件对应的对话信息,得到目标对话信息,根据所述目标对话信息确定所述目标催收案件所属的业务类型;
第二查询模块,用于查询所述业务类型对应的话术识别模型,得到目标话术识别模型;其中,每种业务类型的话术识别模型对应识别该种业务类型的催收案件的对话信息中催收人员是否存在违规行为;
输入模块,用于将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果;其中,所述识别结果包括所述目标对话信息中的催收人员存在违规行为或不存在违规行为。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。
本申请所提供的一种基于人工智能的催收行为识别方法、装置、设备及介质,通过获取预设时间段内的所有催收案件,根据预设筛选规则对所有催收案件进行筛选,得到至少两个第一催收案件,根据用户信息查询每个第一催收案件的用户风险等级,从至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件,获取目标催收案件对应的对话信息,得到目标对话信息,根据目标对话信息确定目标催收案件所属的业务类型,查询业务类型对应的话术识别模型,得到目标话术识别模型,将目标对话信息输入目标话术识别模型中,得到目标话术识别模型对目标对话信息的识别结果,从而基于不同业务类型的对话信息,采用相应的话术识别模型进行识别,精确识别对话信息中是否存在违规,并根据筛选规则从大量催收案件中筛选出违规可能性最高的目标催收案件,针对目标催收案件的目标对话信息进行违规分析,无需对所有催收案件进行违规行为识别,避免了大量的质检工作,提高了违规行为识别效率。
附图说明
图1为本申请一实施例的基于人工智能的催收行为识别方法的流程示意图;
图2为本申请一实施例的基于人工智能的催收行为识别装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提出一种基于人工智能的催收行为识别方法,本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Art i f i c i a l I nte l li gence,A I)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请提出的一种基于人工智能的催收行为识别方法,以服务器为执行主体,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content De l i veryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
该基于人工智能的催收行为识别方法用于解决当前的催收行为识别方式,在催收案件较多时,识别效率则较低的技术问题。参考图1,其中一个实施例中,该基于人工智能的催收行为识别方法包括如下步骤:
S11、获取预设时间段内的所有催收案件,根据预设筛选规则对所有所述催收案件进行筛选,得到至少两个第一催收案件;其中,所述第一催收案件携带有逾期用户的用户信息及催收人员催收所述逾期用户时的对话信息;
S12、根据所述用户信息查询每个所述第一催收案件的用户风险等级,从所述至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件;
S13、获取所述目标催收案件对应的对话信息,得到目标对话信息,根据所述目标对话信息确定所述目标催收案件所属的业务类型;
S14、查询所述业务类型对应的话术识别模型,得到目标话术识别模型;其中,每种业务类型的话术识别模型对应识别该种业务类型的催收案件的对话信息中催收人员是否存在违规行为;
S15、将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果;其中,所述识别结果包括所述目标对话信息中的催收人员存在违规行为或不存在违规行为。
如上述步骤S11所述,本实施例获取到每个催收人员在预设时间段内处理的催收案件,根据预设筛选规则对所有催收案件进行筛选,该筛选规则可自定义设置,例如,可获取每个催收案件的催收时间,依照催收时间的先后顺序对所有催收案件进行筛选,筛选出催收时间较前的催收案件,将其作为第一催收案件,如筛选出催收时间排在前10位的催收案件作为第一催收案件。
如上述步骤S12所述,催收案件中携带有逾期用户的用户信息,该用户信息包括用户姓名、身份证号码、逾期次数、逾期金额、手机号码等信息;此外,催收案件中还携带有对应催收人员催收逾期用户时的对话信息,对话信息可以是语音信息、视频信息或文本信息的形式。
本实施例可根据用户信息查询每个第一催收案件的用户风险等级,该用户风险等级可用于评估该逾期用户逾期不还的概率,从至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件,以精确获取用户风险等级最高的催收案件,对其进行违规话术分析,而无需对所有催收案件进行违规行为识别,避免了大量的质检工作,提高了违规行为识别效率。
如上述步骤S13所述,每个催收案件都含有催收过程中的对话信息,获取目标催收案件对应的目标对话信息,并基于目标对话信息的内容确定对话信息所属的业务类型,该业务类型包括贷款业务、分期业务、租赁业务等业务类型。例如,当目标对话信息中含有贷款、贷款利率、贷款金额等对话内容时,则可确定该目标对话信息所对应的目标催收案件所属的业务类型为贷款业务。
如上述步骤S14所述,由于不同业务类型的违规标准可能不同,因此,本实施例为每种业务类型的对话信息训练得到一种话术识别模型,然后查询业务类型对应的话术识别模型,得到目标话术识别模型,以适应多家不同业务公司的对话信息质检标准,用于保障违规质检的准确性。其中,目标话术识别模型为预先训练好的神经网络模型,用于识别对话信息中的催收人员是否存在违规行为,并输出识别结果。
如上述步骤S15所述,本实施例在确定目标话术识别模型后,将目标对话信息输入目标话术识别模型中,得到该对话信息的识别结果,识别结果包括对话信息中的催收人员存在违规行为或不存在违规行为,从而基于不同业务类型的对话信息,采用相应的话术识别模型进行识别,精确识别对话信息中是否存在违规。例如,当对话信息中含有违禁词,且该违禁词来自催收人员时,则可确定催收人员存在违规行为;又如,可提取对话信息中催收人员的多个音调,根据多个音调确定催收人员在催收过程中情绪较为激昂或含有威胁的语调时,则可确定催收人员存在违规行为。
本申请所提供的一种基于人工智能的催收行为识别方法,通过获取预设时间段内的所有催收案件,根据预设筛选规则对所有催收案件进行筛选,得到至少两个第一催收案件,根据用户信息查询每个第一催收案件的用户风险等级,从至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件,获取目标催收案件对应的对话信息,得到目标对话信息,根据目标对话信息确定目标催收案件所属的业务类型,查询业务类型对应的话术识别模型,得到目标话术识别模型,将目标对话信息输入目标话术识别模型中,得到目标话术识别模型对目标对话信息的识别结果,从而基于不同业务类型的对话信息,采用相应的话术识别模型进行识别,精确识别对话信息中是否存在违规,并根据筛选规则从大量催收案件中筛选出违规可能性最高的目标催收案件,针对目标催收案件的目标对话信息进行违规分析,无需对所有催收案件进行违规行为识别,避免了大量的质检工作,提高了违规行为识别效率。
在一实施例中,所述将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果之后,还可包括:
当确定所述识别结果为所述目标对话信息中的催收人员存在违规行为时,提取所述目标对话信息的多个关键词;
将所述多个关键词与预设的违规词集合进行匹配,筛选出与违规词集合中的违规词相匹配的关键词,得到多个目标关键词;其中,所述违规词集合包括至少一个违规词;
查询每个所述目标关键词对应的违规等级;
将每个所述目标关键词对应的违规等级进行累加后,得到目标违规等级;
根据所述目标违规等级制定相应的惩罚方案,基于所述惩罚方案对所述目标对话信息中的催收人员进行惩罚。
在本实施例中,在确定识别结果为目标对话信息中的催收人员存在违规行为时,则提取目标对话信息中的多个关键词,该关键词一般为名词。
然后将多个关键词与预设的违规词集合中的违规词进行一一匹配,并从多个关键词中筛选出与违规词集合中的任意一个违规词相匹配的关键词,得到多个目标关键词,并从预先构建的违规等级列表中,查询每个目标关键词在违规等级列表中对应的违规等级,该违规等级用于评估每个目标关键词的违规程度,最后将每个目标关键词对应的违规等级进行累加后,得到目标违规等级,根据目标违规等级制定相应的惩罚方案,基于惩罚方案对目标对话信息对应的催收人员进行惩罚,如当催收人员的目标违规等级较高时,则对对应的催收人员进行降级处理。
其中,违规等级列表中记录了每个关键词对应的违规等级,每个关键词对应的违规等级可通过机器为人工的方式设置。
在一实施例中,所述将所述多个关键词与预设的违规词集合进行匹配,筛选出与违规词集合中的违规词相匹配的关键词,得到多个目标关键词,可具体包括:
将所述多个关键词分别转换为词向量,得到每个所述关键词对应的第一词向量;
将所述违规词集合中的每个违规词转换为词向量,得到每个违规词对应的第二词向量;
分别计算每个所述第一词向量与每个所述第二词向量的余弦距离,将余弦距离大于预设阈值的第一词向量作为目标词向量;
查询每个所述目标词向量对应的关键词,得到多个目标关键词。
在本实施例中,可利用词向量工具word2vec将每个关键词分别转换为词向量,得到每个关键词对应的第一词向量,同时利用词向量工具word2vec将违规词集合中的每个违规词转换为词向量,得到每个违规词对应的第二词向量。
然后分别计算每个第一词向量与其他第二词向量的余弦距离,将余弦距离大于预设阈值的第一词向量作为目标词向量,查询每个目标词向量对应的关键词,得到多个目标关键词。例如,当预设阈值设置为0.8,第一词向量为A、B、C,第二词向量为a、b、c时,第一词向量A与其他第二词向量a、b、c的余弦距离为0.9、0.5、0.4,则存在与第二词向量a大于预设阈值的第一词向量A,将第一词向量A作为目标词向量。同理,其他第一词向量也可通过该方式进行确定是否为目标词向量,在此不做赘述。
其中,词向量是为了让计算机能够处理的一种词的表示。自然语言处理相关任务中,要将自然语言交给机器学习中的算法来处理,通常需要首先将语言数学化,以使机器能够识别处理。向量是人把自然界的东西抽象出来交给机器处理的东西,基本上可以说向量是人对机器输入的主要方式。
Word2vec输出的词向量可以被用来做很多自然语言处理相关的工作,比如聚类、找同义词、词性分析等等。如果把词当做特征,则Word2vec就可以把特征映射到K维向量空间,可以为文本数据寻求更加深层次的特征表示。具体的,Word2vec将一个词所在的上下文中的词作为输入,而那个词本身作为输出,也就是说,看到一个上下文,希望大概能猜出这个词和它的意思。通过在一个大的语料库训练,得到一个从输入层到隐含层的权重模型,训练完成后,就得到了每个词到隐含层的每个维度的权重,就是每个词的向量。
在一实施例中,所述将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果,包括:
将所述目标对话信息输入所述目标话术识别模型中,根据预置至所述目标话术识别模型的违规规则对所述目标对话信息进行关键词提取,得到参考关键词;
根据预设的近义词匹配规则,对所述目标对话信息的参考关键词进行违禁用语质检,得到违禁用语质检结果;
根据所述违禁用语质检结果判断所述目标对话信息是否存在违禁用语;
若是,则生成所述目标对话信息中的催收人员存在违规行为的识别结果;
若否,则生成所述目标对话信息中的催收人员不存在违规行为的识别结果。
在本实施例中,每个话术识别模型的违规规则都不同,每个违规规则中都记录了哪些属于违规用语,哪些不属于违规用语,因此可根据预置至目标话术识别模型的违规规则,对目标对话信息进行关键词提取,得到参考关键词,该参考关键词为基于违规规则预测出的最有可能是违规用语的词,并根据近义词匹配规则,对所述目标对话信息的参考关键词进行违禁用语质检,并根据违禁用语质检结果确定目标对话信息是否存在违禁用语,生成相应的识别结果。其中,近义词匹配规则用于对目标对话信息的所有参考关键词与预设违规词进行匹配,以确定目标对话信息是否存在违禁用语。
在一实施例中,所述根据预设筛选规则对所有所述催收案件进行筛选,得到至少两个第一催收案件,包括:
提取每个所述催收案件携带的逾期用户的用户信息;
根据所述用户信息查询每个所述逾期用户的逾期次数,按照所述逾期次数由多到少的顺序对所有所述催收案件进行排序,筛选出排在前N位的催收案件作为第一催收案件;其中,所述N>1。
在本实施例中,由于逾期次数较多的逾期用户所对应的催收人员的话术违规的可能性较高,因此本申请可获取每个催收案件携带的逾期用户的用户信息,根据所述用户信息查询每个逾期用户的逾期次数,按照逾期次数对所有催收案件进行排序,筛选出排在前列的催收案件作为第一催收案件,以针对逾期次数较多的逾期用户所对应的第一催收案件进行违规分析,以精确找到违规可能性较高的催收案件,提高催收行为识别的效率。
在一实施例中,所述查询所述业务类型对应的话术识别模型之前,还包括:
获取不同业务类型的对话信息样本,并确定每个对话信息样本对应的参考识别结果;
构建多个神经网络模型,将同种业务类型的对话信息样本及对应的参考识别结果输入同一个神经网络模型中进行训练,得到每个神经网络模型的训练结果;
在每个神经网络模型的训练结果满足要求后,得到每种业务类型对应的话术识别模型。
在本实施例中,可获取不同业务类型的对话信息样本,以及确定每个对话信息样本对应的参考识别结果,该参考识别结果包括对应对话信息样本的催收人员存在违规或不存在违规,该参考识别结果可通过人工的方式确定。然后构建多个神经网络模型,每个神经网络模型对应一种业务类型的对话信息样本,将同种业务类型的对话信息样本及对应的参考识别结果输入同一个神经网络模型中,并判断每个神经网络模型的训练结果是否满足要求,若否,则调整神经网络模型的参数,对其进行再次训练,直至训练结果满足要求,在每个神经网络模型的训练结果满足要求后,将训练结果满足要求的神经网络模型作为话术识别模型,以得到每种业务类型对应的话术识别模型,从而根据不同业务类型的对话信息样本单独训练得到不同的话术识别模型,提高每个话术识别模型的催收行为识别的准确性。
在一实施例中,所述根据所述用户信息查询每个所述第一催收案件的用户风险等级,包括:
根据所述用户信息查询所述第一催收案件的逾期用户的逾期次数及逾期天数;
获取预先为所述逾期次数设置的第一权重、为所述逾期天数设置的第二权重;
将所述逾期次数乘以第一权重后,得到第一数值;
将所述逾期天数乘以第二权重后,得到第二数值;
将所述第一数值与所述第二数值进行相加后,得到用户风险评估值;
根据所述用户风险评估值确定所述第一催收案件的用户风险等级。
本实施例可预先为逾期次数设置第一权重、为逾期天数设置第二权重;其中,第一权重大于第二权重。在确定第一催收案件的用户风险等级时,获取第一催收案件的用户信息,根据用户信息查询第一催收案件的逾期用户的逾期次数及逾期天数,将逾期次数乘以第一权重、逾期天数乘以第二权重并进行相加后,得到用户风险评估值,根据用户风险评估值确定第一催收案件的用户风险等级。其中,用户风险评估值与用户风险等级成正相关,逾期用户的用户风险评估值越高,则逾期用户对应的第一催收案件的用户风险等级也越高。
参照图2,本申请实施例中还提供一种基于人工智能的催收行为识别装置,包括:
获取模块11,用于获取预设时间段内的所有催收案件,根据预设筛选规则对所有所述催收案件进行筛选,得到至少两个第一催收案件;其中,所述第一催收案件携带有逾期用户的用户信息及催收人员催收所述逾期用户时的对话信息;
第一查询模块12,用于根据所述用户信息查询每个所述第一催收案件的用户风险等级,从所述至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件;
确定模块13,用于获取所述目标催收案件对应的对话信息,得到目标对话信息,根据目标对话信息确定所述目标催收案件所属的业务类型;
第二查询模块14,用于查询所述业务类型对应的话术识别模型,得到目标话术识别模型;其中,每种业务类型的话术识别模型对应识别该种业务类型的催收案件的对话信息中催收人员是否存在违规行为;
输入模块15,用于将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果;其中,所述识别结果包括所述目标对话信息中的催收人员存在违规行为或不存在违规行为。
本实施例获取到每个催收人员在预设时间段内处理的催收案件,根据预设筛选规则对所有催收案件进行筛选,该筛选规则可自定义设置,例如,可获取每个催收案件的催收时间,依照催收时间的先后顺序对所有催收案件进行筛选,筛选出催收时间较前的催收案件,将其作为第一催收案件,如筛选出催收时间排在前10位的催收案件作为第一催收案件。
催收案件中携带有逾期用户的用户信息,该用户信息包括用户姓名、身份证号码、逾期次数、逾期金额、手机号码等信息;此外,催收案件中还携带有对应催收人员催收逾期用户时的对话信息,对话信息可以是语音信息、视频信息或文本信息的形式。
本实施例可根据用户信息查询每个第一催收案件的用户风险等级,该用户风险等级可用于评估该逾期用户逾期不还的概率,从至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件,以精确获取用户风险等级最高的催收案件,对其进行违规话术分析,而无需对所有催收案件进行违规行为识别,避免了大量的质检工作,提高了违规行为识别效率。
每个催收案件都含有催收过程中的对话信息,获取目标催收案件对应的目标对话信息,并基于目标对话信息的内容确定对话信息所属的业务类型,该业务类型包括贷款业务、分期业务、租赁业务等业务类型。例如,当目标对话信息中含有贷款、贷款利率、贷款金额等对话内容时,则可确定该目标对话信息所对应的目标催收案件所属的业务类型为贷款业务。
由于不同业务类型的违规标准可能不同,因此,本实施例为每种业务类型的对话信息训练得到一种话术识别模型,然后查询业务类型对应的话术识别模型,得到目标话术识别模型,以适应多家不同业务公司的对话信息质检标准,用于保障违规质检的准确性。其中,目标话术识别模型为预先训练好的神经网络模型,用于识别对话信息中的催收人员是否存在违规行为,并输出识别结果。
本实施例在确定目标话术识别模型后,将目标对话信息输入目标话术识别模型中,得到该对话信息的识别结果,识别结果包括对话信息中的催收人员存在违规行为或不存在违规行为,从而基于不同业务类型的对话信息,采用相应的话术识别模型进行识别,精确识别对话信息中是否存在违规。例如,当对话信息中含有违禁词,且该违禁词来自催收人员时,则可确定催收人员存在违规行为;又如,可提取对话信息中催收人员的多个音调,根据多个音调确定催收人员在催收过程中情绪较为激昂或含有威胁的语调时,则可确定催收人员存在违规行为。
如上所述,可以理解地,本申请中提出的所述基于人工智能的催收行为识别装置的各组成部分可以实现如上所述基于人工智能的催收行为识别方法任一项的功能,具体结构不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储所述基于人工智能的催收行为识别方法的相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的催收行为识别方法。
上述处理器执行上述的基于人工智能的催收行为识别方法,包括:
获取预设时间段内的所有催收案件,根据预设筛选规则对所有所述催收案件进行筛选,得到至少两个第一催收案件;其中,所述第一催收案件携带有逾期用户的用户信息及催收人员催收所述逾期用户时的对话信息;
根据所述用户信息查询每个所述第一催收案件的用户风险等级,从所述至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件;
获取所述目标催收案件对应的对话信息,得到目标对话信息,根据所述目标对话信息确定所述目标催收案件所属的业务类型;
查询所述业务类型对应的话术识别模型,得到目标话术识别模型;其中,每种业务类型的话术识别模型对应识别该种业务类型的催收案件的对话信息中催收人员是否存在违规行为;
将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果;其中,所述识别结果包括所述目标对话信息中的催收人员存在违规行为或不存在违规行为。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于人工智能的催收行为识别方法,包括步骤:
获取预设时间段内的所有催收案件,根据预设筛选规则对所有所述催收案件进行筛选,得到至少两个第一催收案件;其中,所述第一催收案件携带有逾期用户的用户信息及催收人员催收所述逾期用户时的对话信息;
根据所述用户信息查询每个所述第一催收案件的用户风险等级,从所述至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件;
获取所述目标催收案件对应的对话信息,得到目标对话信息,根据所述目标对话信息确定所述目标催收案件所属的业务类型;
查询所述业务类型对应的话术识别模型,得到目标话术识别模型;其中,每种业务类型的话术识别模型对应识别该种业务类型的催收案件的对话信息中催收人员是否存在违规行为;
将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果;其中,所述识别结果包括所述目标对话信息中的催收人员存在违规行为或不存在违规行为。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synch l i nk)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
综上所述,本申请的最大有益效果在于:
本申请所提供的一种基于人工智能的催收行为识别方法、装置、设备及介质,通过获取预设时间段内的所有催收案件,根据预设筛选规则对所有催收案件进行筛选,得到至少两个第一催收案件,根据用户信息查询每个第一催收案件的用户风险等级,从至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件,获取目标催收案件对应的对话信息,得到目标对话信息,根据目标对话信息确定目标催收案件所属的业务类型,查询业务类型对应的话术识别模型,得到目标话术识别模型,将目标对话信息输入目标话术识别模型中,得到目标话术识别模型对目标对话信息的识别结果,从而基于不同业务类型的对话信息,采用相应的话术识别模型进行识别,精确识别对话信息中是否存在违规,并根据筛选规则从大量催收案件中筛选出违规可能性最高的目标催收案件,针对目标催收案件的目标对话信息进行违规分析,无需对所有催收案件进行违规行为识别,避免了大量的质检工作,提高了违规行为识别效率。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种基于人工智能的催收行为识别方法,其特征在于,包括:
获取预设时间段内的所有催收案件,根据预设筛选规则对所有所述催收案件进行筛选,得到至少两个第一催收案件;其中,所述第一催收案件携带有逾期用户的用户信息及催收人员催收所述逾期用户时的对话信息;
根据所述用户信息查询每个所述第一催收案件的用户风险等级,从所述至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件;
获取所述目标催收案件对应的对话信息,得到目标对话信息,根据所述目标对话信息确定所述目标催收案件所属的业务类型;
查询所述业务类型对应的话术识别模型,得到目标话术识别模型;其中,每种业务类型的话术识别模型对应识别该种业务类型的催收案件的对话信息中催收人员是否存在违规行为;
将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果;其中,所述识别结果包括所述目标对话信息中的催收人员存在违规行为或不存在违规行为。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果之后,还包括:
当确定所述识别结果为所述目标对话信息中的催收人员存在违规行为时,提取所述目标对话信息的多个关键词;
将所述多个关键词与预设的违规词集合进行匹配,筛选出与违规词集合中的违规词相匹配的关键词,得到多个目标关键词;其中,所述违规词集合包括至少一个违规词;
查询每个所述目标关键词对应的违规等级;
将每个所述目标关键词对应的违规等级进行累加后,得到目标违规等级;
根据所述目标违规等级制定相应的惩罚方案,基于所述惩罚方案对所述目标对话信息中的催收人员进行惩罚。
3.根据权利要求2所述的方法,其特征在于,所述将所述多个关键词与预设的违规词集合进行匹配,筛选出与违规词集合中的违规词相匹配的关键词,得到多个目标关键词,包括:
将所述多个关键词分别转换为词向量,得到每个所述关键词对应的第一词向量;
将所述违规词集合中的每个违规词转换为词向量,得到每个违规词对应的第二词向量;
分别计算每个所述第一词向量与每个所述第二词向量的余弦距离,将余弦距离大于预设阈值的第一词向量作为目标词向量;
查询每个所述目标词向量对应的关键词,得到多个目标关键词。
4.根据权利要求1所述的方法,其特征在于,所述将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果,包括:
将所述目标对话信息输入所述目标话术识别模型中,根据预置至所述目标话术识别模型的违规规则对所述目标对话信息进行关键词提取,得到参考关键词;
根据预设的近义词匹配规则,对所述目标对话信息的参考关键词进行违禁用语质检,得到违禁用语质检结果;
根据所述违禁用语质检结果判断所述目标对话信息是否存在违禁用语;
若是,则生成所述目标对话信息中的催收人员存在违规行为的识别结果;
若否,则生成所述目标对话信息中的催收人员不存在违规行为的识别结果。
5.根据权利要求1所述的方法,其特征在于,所述根据预设筛选规则对所有所述催收案件进行筛选,得到至少两个第一催收案件,包括:
提取每个所述催收案件携带的逾期用户的用户信息;
根据所述用户信息查询每个所述逾期用户的逾期次数,按照所述逾期次数由多到少的顺序对所有所述催收案件进行排序,筛选出排在前N位的催收案件作为第一催收案件;其中,所述N>1。
6.根据权利要求1所述的方法,其特征在于,所述查询所述业务类型对应的话术识别模型之前,还包括:
获取不同业务类型的对话信息样本,并确定每个对话信息样本对应的参考识别结果;
构建多个神经网络模型,将同种业务类型的对话信息样本及对应的参考识别结果输入同一个神经网络模型中进行训练,得到每个神经网络模型的训练结果;
在每个神经网络模型的训练结果满足要求后,得到每种业务类型对应的话术识别模型。
7.根据权利要求1所述的方法,其特征在于,所述根据所述用户信息查询每个所述第一催收案件的用户风险等级,包括:
根据所述用户信息查询所述第一催收案件的逾期用户的逾期次数及逾期天数;
获取预先为所述逾期次数设置的第一权重、为所述逾期天数设置的第二权重;
将所述逾期次数乘以第一权重后,得到第一数值;
将所述逾期天数乘以第二权重后,得到第二数值;
将所述第一数值与所述第二数值进行相加后,得到用户风险评估值;
根据所述用户风险评估值确定所述第一催收案件的用户风险等级。
8.一种基于人工智能的催收行为识别装置,其特征在于,包括:
获取模块,用于获取预设时间段内的所有催收案件,根据预设筛选规则对所有所述催收案件进行筛选,得到至少两个第一催收案件;其中,所述第一催收案件携带有逾期用户的用户信息及催收人员催收所述逾期用户时的对话信息;
第一查询模块,用于根据所述用户信息查询每个所述第一催收案件的用户风险等级,从所述至少两个第一催收案件中筛选出用户风险等级最高的第一催收案件,得到目标催收案件;
确定模块,用于获取所述目标催收案件对应的对话信息,得到目标对话信息,根据所述目标对话信息确定所述目标催收案件所属的业务类型;
第二查询模块,用于查询所述业务类型对应的话术识别模型,得到目标话术识别模型;其中,每种业务类型的话术识别模型对应识别该种业务类型的催收案件的对话信息中催收人员是否存在违规行为;
输入模块,用于将所述目标对话信息输入所述目标话术识别模型中,得到所述目标话术识别模型对所述目标对话信息的识别结果;其中,所述识别结果包括所述目标对话信息中的催收人员存在违规行为或不存在违规行为。
9.一种计算机设备,其特征在于,包括:
处理器;
存储器;
其中,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的基于人工智能的催收行为识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1-7任一项所述的基于人工智能的催收行为识别方法。
CN202210028106.7A 2022-01-11 2022-01-11 基于人工智能的催收行为识别方法、装置、设备及介质 Pending CN114399379A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210028106.7A CN114399379A (zh) 2022-01-11 2022-01-11 基于人工智能的催收行为识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210028106.7A CN114399379A (zh) 2022-01-11 2022-01-11 基于人工智能的催收行为识别方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114399379A true CN114399379A (zh) 2022-04-26

Family

ID=81231686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210028106.7A Pending CN114399379A (zh) 2022-01-11 2022-01-11 基于人工智能的催收行为识别方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114399379A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114969293A (zh) * 2022-05-31 2022-08-30 支付宝(杭州)信息技术有限公司 数据处理方法、装置及设备
CN115392233A (zh) * 2022-08-24 2022-11-25 上海恒格信息科技有限公司 基于中心句识别和Bert意图识别的智能催收辅助系统
CN116561668A (zh) * 2023-07-11 2023-08-08 深圳传趣网络技术有限公司 聊天会话的风险等级划分方法、装置、设备及存储介质
CN116862668A (zh) * 2023-09-05 2023-10-10 杭州度言软件有限公司 一种提升催收效率的智能催收方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109064315A (zh) * 2018-08-02 2018-12-21 平安科技(深圳)有限公司 逾期账单智能催收方法、装置、计算机设备及存储介质
CN110570295A (zh) * 2019-07-25 2019-12-13 深圳壹账通智能科技有限公司 资源催收方法、装置、计算机设备和存储介质
CN113438369A (zh) * 2021-06-24 2021-09-24 平安普惠企业管理有限公司 基于业务电话录音的违规质检方法、装置及相关设备
CN113903363A (zh) * 2021-09-29 2022-01-07 平安银行股份有限公司 基于人工智能的违规行为检测方法、装置、设备及介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109064315A (zh) * 2018-08-02 2018-12-21 平安科技(深圳)有限公司 逾期账单智能催收方法、装置、计算机设备及存储介质
CN110570295A (zh) * 2019-07-25 2019-12-13 深圳壹账通智能科技有限公司 资源催收方法、装置、计算机设备和存储介质
CN113438369A (zh) * 2021-06-24 2021-09-24 平安普惠企业管理有限公司 基于业务电话录音的违规质检方法、装置及相关设备
CN113903363A (zh) * 2021-09-29 2022-01-07 平安银行股份有限公司 基于人工智能的违规行为检测方法、装置、设备及介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114969293A (zh) * 2022-05-31 2022-08-30 支付宝(杭州)信息技术有限公司 数据处理方法、装置及设备
CN115392233A (zh) * 2022-08-24 2022-11-25 上海恒格信息科技有限公司 基于中心句识别和Bert意图识别的智能催收辅助系统
CN116561668A (zh) * 2023-07-11 2023-08-08 深圳传趣网络技术有限公司 聊天会话的风险等级划分方法、装置、设备及存储介质
CN116862668A (zh) * 2023-09-05 2023-10-10 杭州度言软件有限公司 一种提升催收效率的智能催收方法
CN116862668B (zh) * 2023-09-05 2023-11-24 杭州度言软件有限公司 一种提升催收效率的智能催收方法

Similar Documents

Publication Publication Date Title
CN114399379A (zh) 基于人工智能的催收行为识别方法、装置、设备及介质
CN109872162B (zh) 一种处理用户投诉信息的风控分类识别方法及系统
CN111259625A (zh) 意图识别方法、装置、设备及计算机可读存储介质
CN112732871B (zh) 一种机器人催收获取客户意向标签的多标签分类方法
CN111522916B (zh) 一种语音服务质量检测方法、模型训练方法及装置
CN108038208B (zh) 上下文信息识别模型的训练方法、装置和存储介质
CN112632989A (zh) 一种合同文本中风险信息的提示方法、装置及设备
CN114678014A (zh) 意图识别方法、装置、计算机设备及计算机可读存储介质
CN114399382A (zh) 用户欺诈风险的检测方法、装置、计算机设备及存储介质
CN113779969A (zh) 基于人工智能的案件信息处理方法、装置、设备及介质
CN110389963B (zh) 基于大数据的渠道效果识别方法、装置、设备和存储介质
CN112562736A (zh) 一种语音数据集质量评估方法和装置
CN116150651A (zh) 基于ai的深度合成检测方法和系统
CN110750626B (zh) 一种基于场景的任务驱动的多轮对话方法及系统
CN116644183B (zh) 文本分类方法、装置及存储介质
CN117763126A (zh) 知识检索方法、设备、存储介质及装置
CN116167674A (zh) 物流投诉单的录入方法、装置、设备及存储介质
CN113343699B (zh) 日志安全风险的监测方法、装置、电子设备及介质
CN113010664B (zh) 一种数据处理方法、装置及计算机设备
CN111159360B (zh) 获得讯询问话题分类模型、讯询问话题分类的方法和装置
CN111666469B (zh) 语句库构建方法、装置、设备和存储介质
CN116341990B (zh) 一种基础设施工程的知识管理评价方法及系统
CN117575601A (zh) 交易行为的识别方法、装置、电子设备及存储介质
CN115757774B (zh) 行业领域识别方法、装置、电子设备及存储介质
CN117575602A (zh) 交易行为的识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination