CN109670148A - 基于语音识别的催收辅助方法、装置、设备和存储介质 - Google Patents

基于语音识别的催收辅助方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN109670148A
CN109670148A CN201811127099.6A CN201811127099A CN109670148A CN 109670148 A CN109670148 A CN 109670148A CN 201811127099 A CN201811127099 A CN 201811127099A CN 109670148 A CN109670148 A CN 109670148A
Authority
CN
China
Prior art keywords
collection
information
text
strategy
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201811127099.6A
Other languages
English (en)
Inventor
孙建波
叶松
李有慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811127099.6A priority Critical patent/CN109670148A/zh
Publication of CN109670148A publication Critical patent/CN109670148A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于语音识别的催收辅助方法,包括以下步骤:终端接收催收辅助请求,基于预设语音采集装置采集客户语音信息;对采集的所述客户语音信息进行识别,得到目标文本信息,并将所述目标文本信息转换为标准文本信息;获取所述标准文本信息对应的文本标签,查询预设策略库,得到所述文本标签对应的催收策略;输出所述催收策略,以供催员按所述催收策略进行催收。本发明还公开了一种基于语音识别的催收辅助装置、设备和存储介质。本发明基于客户语音识别确定客户意图,给出对应的催收话术,实现辅助催员进行催收,提高催收的效率。

Description

基于语音识别的催收辅助方法、装置、设备和存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及基于语音识别的催收辅助方法、装置、设备和存储介质。
背景技术
随着语音识别技术的不断发展,语音识别技术的应用也越来越广泛,例如,通过语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
现有的语音识别主要是针对语音转文字,即,将采集到的语音信息装换为文字信息,简单地语音识别在一下特殊的应用场景下并不能达到预想的效果,例如,电催员,电催员是指通过电话进行催款,在实际的电催员工作过程中,总会出现由于沟通不顺,导致催收效率低的问题,如何有效地通过语音识别辅助电催员的工作,提高催收效率成为的当前亟待解决的技术问题。
发明内容
本发明的主要目的在于提供一种基于语音识别的催收辅助方法、装置、设备和存储介质,旨在基于语音识别辅助电催员工作,提高催收效率。
为实现上述目的,本发明提供基于语音识别的催收辅助方法,所述基于语音识别的催收辅助方法包括以下步骤:
接收催收辅助请求,基于预设语音采集装置采集客户语音信息;
对采集的所述客户语音信息进行识别,得到目标文本信息,并将所述目标文本信息转换为标准文本信息;
获取所述标准文本信息对应的文本标签,查询预设策略库,得到所述文本标签对应的催收策略;
输出所述催收策略,以供催员按所述催收策略进行催收。
可选地,所述对采集的所述客户语音信息进行识别,得到目标文本信息的步骤之前,包括:
分别采集通过不同方言和普通话的语音信息,按预处理规则处理所述语音信息,并提取经预处理后的所述语音信息的语音特征数据;
利用所述语音特征数据迭代训练预设的初始语音识别模型,得到预设语音识别模型;
所述对采集的所述客户语音信息进行识别,得到目标文本信息的步骤,包括:
将所述客户语音信息输入至所述预设语音识别模型,通过所述预设语音识别模型识别所述客户语音信息,得到目标文本信息。
可选地,所述将所述目标文本信息转换为标准文本信息的步骤包括:
将所述目标文本信息按预设分词算法进行分词处理,得到目标文本信息对应的分词集合;
去除所述分词集合中的噪音词,保留所述目标文本信息的特征词;
将各所述特征词进行组合,形成所述目标文本信息对应的标准文本信息。
可选地,所述将所述目标文本信息转换为标准文本信息的步骤包括:
按预设哈希算法处理所述目标文本信息,得到所述目标文本信息对应的文本哈希值;
将所述文本哈希值与预设标准文本数据库中各预设文本关联的哈希值进行比较;
获取与所述文本哈希值匹配的目标哈希值,并将所述目标哈希值对应的预设文本作为所述目标文本信息的标准文本信息。
可选地,所述获取所述标准文本信息对应的文本标签,查询预设策略库,得到所述文本标签对应的催收策略的步骤包括:
获取所述标准文本信息对应的文本标签,将所述文本标签与预设策略库中的预设标签进行比对;
获取与所述文本标签匹配的目标标签,并将所述目标标签对应的处理规则作为所述文本标签对应的催收策略。
可选地,所述输出所述催收策略,以供催员按所述催收策略进行催收的步骤之后,包括:
在监测到所述催收策略输出完成后,采集所述催员的催收语音信息;
对所述催收语音信息进行识别得到催收文本,将所述催收文本与所述催收策略中的催收推荐信息进行比对;
若所述催收文本与所述催收推荐信息不匹配,则输出未按所述催收策略进行催收的提示信息;
若所述催收文本与所述催收推荐信息匹配,则获取所述催收辅助请求对应的催收账户及所述催收账户的账户关联信息;
判断所述账户关联信息中是否包含账户还款信息,若所述账户关联信息中包含所述账户还款信息,则输出催收成功并标记所述催收策略,若所述账户关联信息中不包含所述账户还款信息,则输出催收失败并调整所述催收策略。
可选地,所述输出所述催收策略,以供催员按所述催收策略进行催收的步骤之后,包括:
统计所述催收账户的催收次数,在所述催收次数超过预设阈值时,将所述催收账户对应客户添加至黑名单。
此外,为实现上述目的,本发明还提供一种基于语音识别的催收辅助装置,所述基于语音识别的催收辅助装置包括:
信息采集模块,用于接收催收辅助请求,基于预设语音采集装置采集客户语音信息;
信息识别模块,用于对采集的所述客户语音信息进行识别,得到目标文本信息,并将所述目标文本信息转换为标准文本信息;
策略确定模块,用于获取所述标准文本信息对应的文本标签,查询预设策略库,得到所述文本标签对应的催收策略;
催收执行模块,用于输出所述催收策略,以供催员按所述催收策略进行催收。
此外,为实现上述目的,本发明还提供一种基于语音识别的催收辅助设备;
所述基于语音识别的催收辅助设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述计算机程序被所述处理器执行时实现如上所述的基于语音识别的催收辅助方法的步骤。
此外,为实现上述目的,本发明还提供计算机存储介质;
所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的基于语音识别的催收辅助方法的步骤。
本发明实施例提出的一种基于语音识别的催收辅助方法、装置、设备和介质,终端接收催收辅助请求,基于预设语音采集装置采集客户语音信息;对采集的所述客户语音信息进行识别,得到目标文本信息,并将所述目标文本信息转换为标准文本信息;获取所述标准文本信息对应的文本标签,查询预设策略库,得到所述文本标签对应的催收策略;输出所述催收策略,以供催员按所述催收策略进行催收。本申请中催员在催收终端上触发催收辅助请求,终端通过对债务人的客户语音信息的进行识别,得到客户语音信息对应的文本信息,以实时地了解客户的意图,进一步地,终端将识别得到的文本信息转换为标准文本信息,并获取标准文本信息对应的催收策略(催收话术),使得催收员按照催收策略进行催收,降低了催员技能要求,减少企业人力成本,同时,按照催收策略进行催收使得催收过程更加规范,有效地提高了催收的效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明基于语音识别的催收辅助方法第一实施例的流程示意图;
图3为本发明基于语音识别的催收辅助装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
催收是指借款方(债权人),向借贷方(债务人)追讨借款的行为,例如,银行设置有催收岗,催收岗的催收人员通过电话进行催收,但是,如果出现债权到期或即将到期时,债务人暂无能力偿还的情况,由于现有技术中并不存在催收策略的问题,催收员和债务人往往会出现“客户抱怨”、“超长电话”等,导致催收员的离职率高,催收效率低。
本发明提供一种解决方案,催员在终端上触发催收辅助请求,终端预设语音采集装置采集客户语音信息,本申请中催员在催收终端上触发催收辅助请求,终端通过对客户(债务人)语音信息的进行识别,得到客户语音信息对应的文本信息,以实现实时地了解客户的意图,进一步地,终端根据识别得到的文本信息确定对应的催收策略(催收话术),使得催收员按照催收策略进行催收,降低催员技能要求,减少企业人力成本,同时,按照催收策略进行催收使得催收过程更加规范,有效地提高了催收的效率,提供统一标准的服务。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端(又叫基于语音识别的催收辅助设备,其中,基于语音识别的催收辅助设备可以是由单独的基于语音识别的催收辅助装置构成,也可以是由其他装置与基于语音识别的催收辅助装置组合形成)结构示意图。
本发明实施例终端可以固定终端,也可以是移动终端,如,带联网功能的智能空调、智能电灯、智能电源、智能音箱、自动驾驶汽车、PC(personalcomputer)个人计算机、智能手机、平板电脑、电子书阅读器、便携计算机等。
如图1所示,该终端可以包括:处理器1001,例如,中央处理器CentralProcessingUnit,CPU),网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WIFI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如,磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块;输入单元,比显示屏,触摸屏;网络接口可选除无线接口中除WiFi外,蓝牙、探针等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,该计算机软件产品存储在一个存储介质(存储介质:又叫计算机存储介质、计算机介质、可读介质、可读存储介质、计算机可读存储介质或者直接叫介质等,如RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的计算机程序,并执行本发明以下实施例提供的基于语音识别的催收辅助方法中的步骤。
参照图2,本发明一种基于语音识别的催收辅助方法的第一实施例中,所述基于语音识别的催收辅助方法包括:
步骤S10,接收催收辅助请求,基于预设语音采集装置采集客户语音信息。
在催员(催收员)与债务人沟通时,催员可以触发催收辅助请求,终端接收催收辅助请求,并利用终端上预设的语音采集装置采集客户语音信息,以将采集到的客户语音信息进行分析识别,确定客户的意图,其中,预设语音采集装置是指预先在终端上安装的语音采集装置,如,终端的录音装置或者终端麦克风装置。本实施例中终端只采集客户语音信息,只处理客户语音信息,减少了语音信息处理量,提高了处理效率。
步骤S20,对采集的所述客户语音信息进行识别,得到目标文本信息,并将所述目标文本信息转换为标准文本信息。
终端对采集的客户语音信息进行识别,得到客户语音信息对应的文本信息,本实施例中对客户语音信息进行识别,可以采集不同的实现方式,例如,通过语音识别模型识别客户语音信息,具体地包括:终端将所述客户语音信息输入至所述预设语音识别模型,通过所述预设语音识别模型识别所述客户语音信息,得到目标文本信息。
即,终端将所述客户语音信息输入至所述预设语音识别模型(预设语音识别模型是指预先设置的语音识别算法),预设语音识别模型通过利用信号处理技术对对客户语音信息进行处理,降低环境噪声、信道、说话人等因素,以提取客户语音信息中的语音特征数据,进一步地,预设语音识别模型根据声学、语言模型及词典,寻找能够以最大概率输出该语音特征数据对应的词串,并将词串作为客户语音信息对应的目标文本信息。
其中,预设语音识别模型是指预先设置的用于识别用户声音的算法,例如,隐含马尔科夫模型,预设语音识别模型目的在于识别语音波形对应的语音内容,具体地,预设语音识别模型从语音波形中提取反映语音特征的相关信息,例如,预设语音识别模型可以是根据人听觉系统的心理学模型提取语音特征的相关信息,也可根据人声道原理来提取语音特征的相关信息;终端将所述客户语音信息输入预设语音识别模型之后,得到所述客户语音信息对应的目标文本信息(又叫语义信息)。
在本实施例中利用预设语音识别模型对客户语音信息进行识别,得到客户语音信息对应的目标文本信息,以实现机器识别客户意图的目的,使得客户语音信息识别更加准确。
在得到目标文本信息之后,终端还需要将所述目标文本信息转换为标准文本信息,以根据标准文本信息确定催收策略,即,本实施例的步骤之前,在终端上设置了不同的标准文本信息,标准文本信息中对应设置了催收策略,在本实施例中在得到目标文本信息之后,目标文本信息中可能存在催收无关的冗余信息,因此,终端需要将目标文本信息转化为标准文本信息,以得到催收策略,终端将目标文本信息转化为标准文本信息可以通过不同的实现方式;
实现方式一:终端将目标文本信息中进行分词处理,其中,终端中预先设置了分词算法,得到目标文本信息对应的分词集合,终端将目标文本信息对应的分词集合中的噪音词去除,保留反映客户意图的特征词,然后,终端将特征词进行组合,得到目标文本信息对应的标准文本信息。
实现方式二:终端将目标文本信息与预设的标准文本集合中的各个预设文本进行比对,即,终端通过模糊匹配的方式,将目标文本信息与预设的标准文本集合中的各个预设文本进行比对,终端将与目标文本信息相似度最高的预设文本作为目标文本信息的标准文本信息。
本实施例中由于终端中预先设置标准文本信息,并在设置了标准文本信息的对应催收策略,终端将所述目标文本信息转换为标准文本信息,可以使得客户意图更加清晰,以查找对应的催收策略。
步骤S30,获取所述标准文本信息对应的文本标签,查询预设策略库,得到所述文本标签对应的催收策略。
本实施例中在标准文本信息中预先设置为文本标签,终端获取所述标准文本信息对应的文本标签,终端可以基于文本标签中的信息查询预设策略库(预设策略库是指预先设置的催收策略数据集合,即,本申请中将客户的与语音信息进行规范化整理得到标准文本信息,并将标准文本信息中预先设置了不同的催收策略),终端获取预设策略库中所述文本标签对应的催收策略,具体地:
步骤a,获取所述标准文本信息对应的文本标签,将所述文本标签与预设策略库中的预设标签进行比对;
步骤b,获取与所述文本标签匹配的目标标签,并将所述目标标签对应的处理规则作为所述文本标签对应的催收策略。
例如,标准本信息中记录“月底再还款”终端获取“月底再还款”的文本标签,终端将根据文本标签与预设策略库中的预设标签进行比对,得到与所述文本标签匹配的目标标签,终端获取目标标签对应的催收策略:请你遵守你的承诺,我们将在月底再次查账,终端将“请你遵守你的承诺,我们将在月底再次查账”作为“月底再还款”对应的催收策略。
本实施例中根据文本标签获取对应的催收策略,可以降低催收员的专业技能,只需要一个普通学历社会检验的人就可以进行催收工作,有效地降低了人力资源的浪费。
步骤S40,输出所述催收策略,以供催员按所述催收策略进行催收。
终端将所述催收策略进行输出显示,催收员可以按显示的催收策略进行催收,既可以减少客户的失联率,保证正常的催收流程。
在本实施例中催员在催收终端上触发催收辅助请求,终端通过对债务人的客户语音信息的进行识别,得到客户语音信息对应的文本信息,以实时地了解客户的意图,进一步地,终端将识别得到的文本信息转换为标准文本信息,并获取标准文本信息对应的催收策略(催收话术),使得催收员按照催收策略进行催收,降低了催员技能要求,减少企业人力成本,同时,按照催收策略进行催收使得催收过程更加规范,有效地提高了催收的效率。
进一步地,在第一实施例中基础上提出了本发明的第二实施例,本实施例是在第一实施例步骤S20之前的步骤,即在将客户语音信息输入至预设语音识别模型之前,需要先建立语音识别模型,本实施例中给出了预设语音识别模型的训练方法,具体地:
步骤S01,分别采集通过不同方言和普通话的语音信息,按预处理规则处理所述语音信息,并提取经预处理后的所述语音信息的语音特征数据;
其中,在建立语音识别模型之前需要首先采集普通话、北京话、东北方言、吴方言、赣方言、湘方言、客家方言、闽方言、粤方言和蜀方言的语音信息,终端将采集到的语音信息按预处理规则进行处理得到语音特征数据,其中,预处理主要包括预加重、加窗分帧处理、端点检测和降噪处理四个过程。预加重处理是利用信号特性和噪声特性的差别来有效地对信号进行处理,对语音的高频部分进行加重,去除口鼻辐射的影响,增加语音的高频分辨率。加窗分帧处理包括加窗和分帧,其中,一般的分帧方法为交叠分段的方法,前一帧和后一帧的交叠部分称为帧移,而分帧是采用可移动的有限长度的窗口进行加权的方法来实现的,即用一定的窗函数,从而形成加窗语音信号,其中窗函数一般采用汉明窗和矩形窗。端点检测是从一段给定的语音信号中找出语音的起始点和结束点,正确、有效的进行端点检测不仅可以减少计算量和缩短处理时间,而且还能排除无声段的噪声干扰、提高语音识别的正确率。
步骤S02,利用所述语音特征数据迭代训练预设的初始语音识别模型,得到预设语音识别模型;
接着,终端提取经预处理后的语音特征数据,利用语音特征数据对初始语音识别模型进行训练,初始语音识别模型是基于HMM(Hidden MarkovModel,隐马尔可夫模型)建立的,隐马尔可夫模型实质就是对语音特征数据中表征语音信息的特征进行建模,通过对语音特征数据中的语音特征进行了大量的统计而得到模型参数,而迭代算法可以采用Baum–Welch(鲍姆韦尔奇)算法,也可以采用经K均值算法改进后的Baum–Welch算法,可提高模型的准确性。具体的,语音识别模型的训练过程如下:1)基于HMM模型构建语音是被模型,并设置语音识别模型的参数初始值,参数初始值可以通过等划分状态或者根据经验估计设置;2)设置最大的迭代次数和收敛阈值;3)采用Viterbi算法(Viterbi Algorithm,维特比算法)对输入的语音特征数据进行状态的分段操作;4)通过迭代算法(Baum-welch算法)对该语音识别模型的参数进行更新,并对语音特征数据进行迭代训练,不断地循环迭代,直到达到先前设置的迭代次数或已经收敛,此时,可得到该语音识别模型的最优模型参数,进而根据该最优模型参数获得训练好的预设语音识别模型。在本实施例中通过训练语音识别模型实现客户语音信息的准确识别。
进一步的,在本发明上述实施例的基础上,提出了本发明基于语音识别的催收辅助方法的本实施例。
本实施例是本发明第一实施例的步骤S30的细化,本实施例中终端可以将客户语音信息对应的目标文本信息转化为标准文本信息,以通过标准文本信息确定催收策略。本实施例中给出了两种具体的实现方式;
实现方式一:通过分词处理去除目标文本信息中的噪音词,得到标准文本信息;具体地包括:
步骤S31,将所述目标文本信息按预设分词算法进行分词处理,得到目标文本信息对应的分词集合。
本实施例中终端将所述目标文本信息按预设分词算法进行分词处理,得到目标文本信息对应的分词集合。
其中,预设分词算法是指预先设置的将目标文本信息中的汉字序列切分成一个个单独的词。预设分词算法包括:基于字符串匹配的分词方法(又叫做机械分词方法,是按照一定的策略将待分析的汉字串与一个"充分大的"机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功识别出一个词)、基于理解的分词方法(即,通过计算机模拟人对句子的理解,在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象)和基于统计的分词方法(是对语料中相邻共现的各个字的组合的频度进行统计,确定汉字之间结合关系的紧密程度,当紧密程度高于某一个阈值时,便可认为此字组可能构成了一个词)等。
步骤S32,去除所述分词集合中的噪音词,保留所述目标文本信息的特征词。
在终端得到分词集合之后,终端去除所述分词集合中的噪音词,保留反映所述目标文本信息的特征词。其中,本实施例中可以通过设置权重的方式确定噪音词和特征词,即,终端根据分词集合中各个词的频率得到各个词的权重,进一步确定特征词和噪音词。
步骤S33,将各所述特征词进行组合,形成所述目标文本信息对应的标准文本信息。
本实施例中终端将各所述特征词进行组合,形成目标文本信息对应的标准文本信息,本实施例中采用分词处理的技术确定目标文本信息对应的标准文本信息,以准确地识别用户意图。
实现方式二:通过模糊匹配的方法得到目标文本信息对应的标准文本信息;具体地包括:
步骤S34,按预设哈希算法处理所述目标文本信息,得到所述目标文本信息对应的文本哈希值。
终端按预设哈希算法处理所述目标文本信息,其中,预设哈希算法是指预先设置的将目标文本信息转化为固定长度的较小二进制值的算法。终端将目标文本信息处理后,得到所述目标文本信息对应的文本哈希值。
步骤S35,将所述文本哈希值与预设标准文本数据库中各预设文本关联的哈希值进行比较。
终端将所述文本哈希值与预设标准文本数据库中各预设文本关联的哈希值进行比较,其中,预设标准文本数据库是指预先设置的预设文本集合,终端通过将文本哈希值与预设标准文本数据库中各预设文本关联的哈希值进行比较,以通过模糊匹配根据比较结果确定目标文本对应的标准文本信息。
步骤S36,获取与所述文本哈希值匹配的目标哈希值,并将所述目标哈希值对应的预设文本作为所述目标文本信息的标准文本信息。
本实施例中终端获取与所述文本哈希值匹配的目标哈希值,并将所述目标哈希值对应的预设文本作为所述目标文本信息的标准文本信息,本实施例中预先设置了标准文本,通过哈希值比较的方法确定目标文本信息的标准文本信息,实现准确地信息转换。
进一步的,本发明基于语音识别的催收辅助方法的第三实施例中,在得到催收策略之后,终端还需要监测催员是否按催收策略进行催收,催员按所述催收策略进行催收得到的催收结果,以确定催收策略是否有效,具体地,所述基于语音识别的催收辅助方法包括:
步骤S50,在监测到所述催收策略输出完成后,采集所述催员的催收语音信息;
在监测到所述催收策略输出完成后,终端采集催员的催收语音信息,以根据催收语音信息判断催员是否按所述催收策略进行催收。
步骤S60,对所述催收语音信息进行识别得到催收文本,将所述催收文本与所述催收策略中的催收推荐信息进行比对;
终端对所述催收语音信息进行识别得到催收文本,其中,本实施例中对催收语音信息进行识别得到催收文本可以利用第二实施例中训练的预设语音识别模型进行识别,具体地,针对预设语音识别模型的训练和语音识别方式本实施例中不作赘述,在得到催收文本之后,终端将所述催收文本与所述催收策略中的催收推荐信息进行比对,即,终端通过将所述催收文本与所述催收策略中的催收推荐信息的比对结果,判断催员是否按照催收策略进行催收。
步骤S70,若所述催收文本与所述催收推荐信息不匹配,则输出未按所述催收策略进行催收的提示信息。
若终端所述催收文本与所述催收推荐信息不匹配,即,催员未按催收策略进行催收,则终端输出提示信息,以提示催员按所述催收策略进行催收。
步骤S80,若所述催收文本与所述催收推荐信息匹配,则获取所述催收辅助请求对应的催收账户及所述催收账户的账户关联信息。
若终端确定所述催收文本与所述催收推荐信息匹配,则判定催员按所述催收策略进行催收,进一步地,终端采集按所述催收策略进行催收的催收成果,即,债务人是否进行还款,具体地:终端获取催收辅助请求对应的催收账户及所述催收账户的账户关联信息,以根据账户关联信息中是否包含还款信息确定债务人是否还款。例如,终端获取该客户的信用卡账户,并获取该信用卡的关联信息,其中,关联信息包含消费信息和还款信息。
步骤S90,判断所述账户关联信息中是否包含账户还款信息,若所述账户关联信息中包含所述账户还款信息,则输出催收成功并标记所述催收策略,若所述账户关联信息中不包含所述账户还款信息,则输出催收失败并调整所述催收策略。
终端判断所述账户关联信息中是否包含账户还款信息,若账户关联信息中包含账户还款信息,则终端判定该客户进行了还款操作,终端输出催收成功并标记所述催收策略,以提示催员按所述催收策略进行催收,若账户关联信息中不包含账户还款信息,即该客户没有进行还款,则输出催收失败并调整所述催收策略,与此同时,催员还需要进行跟催。
在本实施例中在催收完成之后,终端采用催员的语音信息,确定催员是否按催收策略进行催收,在终端确定催员按所述催收策略进行催收时,终端还需要进行催收结果跟踪,即,本实施例中可以根据终端中催收策略的标记次数确定催收策略的效率,实现催收策略的调整。
进一步的,本发明基于语音识别的催收辅助方法的第四实施例中,所述基于语音识别的催收辅助方法包括:
步骤S80,统计所述催收账户的催收次数,在所述催收次数超过预设阈值时,将所述催收账户对应客户添加至黑名单。
终端统计催员对催收账户的催收次数,在终端检测到催收账户的所述催收次数超过预设阈值(预设阈值根据是指预先设置的催收临界值,预设阈值可以根据具体情况设置,例如,设置为10次)时,终端将催收账户对应客户添加至黑名单,在本实施例中可以对催收账户进行监控,在催收账户再次进行信贷申请时,调整该信贷账户的考核标准。
此外,参照图3,本发明实施例还提出一种基于语音识别的催收辅助装置,所述基于语音识别的催收辅助装置包括:
信息采集模块10,用于接收催收辅助请求,基于预设语音采集装置采集客户语音信息;
信息识别模块20,用于对采集的所述客户语音信息进行识别,得到目标文本信息,并将所述目标文本信息转换为标准文本信息;
策略确定模块30,用于获取所述标准文本信息对应的文本标签,查询预设策略库,得到所述文本标签对应的催收策略;
催收执行模块40,用于输出所述催收策略,以供催员按所述催收策略进行催收。
可选地,基于语音识别的催收辅助装置,包括:
语音采集模块,用于分别采集通过不同方言和普通话的语音信息,按预处理规则处理所述语音信息,并提取经预处理后的所述语音信息的语音特征数据;
模型建立模块,用于利用所述语音特征数据迭代训练预设的初始语音识别模型,得到预设语音识别模型;
信息识别模块20,还用于将所述客户语音信息输入至所述预设语音识别模型,通过所述预设语音识别模型识别所述客户语音信息,得到目标文本信息。
可选地,所述信息识别模块20,包括:
分词单元,用于将所述目标文本信息按预设分词算法进行分词处理,得到目标文本信息对应的分词集合;
特征词提取单元,用于去除所述分词集合中的噪音词,保留所述目标文本信息的特征词;
标准文本生成单元,用于将各所述特征词进行组合,形成所述目标文本信息对应的标准文本信息。
可选地,所述信息识别模块20,包括:
哈希值确定单元,用于按预设哈希算法处理所述目标文本信息,得到所述目标文本信息对应的文本哈希值;
哈希比对单元,用于将所述文本哈希值与预设标准文本数据库中各预设文本关联的哈希值进行比较;
标准文本确定单元,用于获取与所述文本哈希值匹配的目标哈希值,并将所述目标哈希值对应的预设文本作为所述目标文本信息的标准文本信息。
可选地,策略确定模块30,包括:
获取比对单元,用于获取所述标准文本信息对应的文本标签,将所述文本标签与预设策略库中的预设标签进行比对;
获取策略单元,用于获取与所述文本标签匹配的目标标签,并将所述目标标签对应的处理规则作为所述文本标签对应的催收策略。
可选地,基于语音识别的催收辅助装置,包括:
监测获取模块,用于在监测到所述催收策略输出完成后,采集所述催员的催收语音信息;
识别比对模块,用于对所述催收语音信息进行识别得到催收文本,将所述催收文本与所述催收策略中的催收推荐信息进行比对;
输出提示模块,用于若所述催收文本与所述催收推荐信息不匹配,则输出未按所述催收策略进行催收的提示信息;
匹配获取模块,用于若所述催收文本与所述催收推荐信息匹配,则获取所述催收辅助请求对应的催收账户及所述催收账户的账户关联信息;
标记调整模块,用于判断所述账户关联信息中是否包含账户还款信息,若所述账户关联信息中包含所述账户还款信息,则输出催收成功并标记所述催收策略,若所述账户关联信息中不包含所述账户还款信息,则输出催收失败并调整所述催收策略。
可选地,基于语音识别的催收辅助装置,包括:
统计模块,用于统计所述催收账户的催收次数,在所述催收次数超过预设阈值时,将所述催收账户对应客户添加至黑名单。
其中,基于语音识别的催收辅助装置的各个功能模块实现的步骤可参照本发明基于语音识别的催收辅助方法的各个实施例,此处不再赘述。
此外,本发明实施例还提出一种计算机存储介质。
所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的基于语音识别的催收辅助方法中的操作。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于语音识别的催收辅助方法,其特征在于,所述基于语音识别的催收辅助方法包括以下步骤:
接收催收辅助请求,基于预设语音采集装置采集客户语音信息;
对采集的所述客户语音信息进行识别,得到目标文本信息,并将所述目标文本信息转换为标准文本信息;
获取所述标准文本信息对应的文本标签,查询预设策略库,得到所述文本标签对应的催收策略;
输出所述催收策略,以供催员按所述催收策略进行催收。
2.如权利要求1所述的基于语音识别的催收辅助方法,其特征在于,
所述对采集的所述客户语音信息进行识别,得到目标文本信息的步骤之前,包括:
分别采集通过不同方言和普通话的语音信息,按预处理规则处理所述语音信息,并提取经预处理后的所述语音信息的语音特征数据;
利用所述语音特征数据迭代训练预设的初始语音识别模型,得到预设语音识别模型;
所述对采集的所述客户语音信息进行识别,得到目标文本信息的步骤,包括:
将所述客户语音信息输入至所述预设语音识别模型,通过所述预设语音识别模型识别所述客户语音信息,得到目标文本信息。
3.如权利要求1所述的基于语音识别的催收辅助方法,其特征在于,所述将所述目标文本信息转换为标准文本信息的步骤包括:
将所述目标文本信息按预设分词算法进行分词处理,得到目标文本信息对应的分词集合;
去除所述分词集合中的噪音词,保留所述目标文本信息的特征词;
将各所述特征词进行组合,形成所述目标文本信息对应的标准文本信息。
4.如权利要求1所述的基于语音识别的催收辅助方法,其特征在于,所述将所述目标文本信息转换为标准文本信息的步骤包括:
按预设哈希算法处理所述目标文本信息,得到所述目标文本信息对应的文本哈希值;
将所述文本哈希值与预设标准文本数据库中各预设文本关联的哈希值进行比较;
获取与所述文本哈希值匹配的目标哈希值,并将所述目标哈希值对应的预设文本作为所述目标文本信息的标准文本信息。
5.如权利要求1至4任意一项所述的基于语音识别的催收辅助方法,其特征在于,所述获取所述标准文本信息对应的文本标签,查询预设策略库,得到所述文本标签对应的催收策略的步骤,包括:
获取所述标准文本信息对应的文本标签,将所述文本标签与预设策略库中的预设标签进行比对;
获取与所述文本标签匹配的目标标签,并将所述目标标签对应的处理规则作为所述文本标签对应的催收策略。
6.如权利要求1所述的基于语音识别的催收辅助方法,其特征在于,所述输出所述催收策略,以供催员按所述催收策略进行催收的步骤之后,包括:
在监测到所述催收策略输出完成后,采集所述催员的催收语音信息;
对所述催收语音信息进行识别得到催收文本,将所述催收文本与所述催收策略中的催收推荐信息进行比对;
若所述催收文本与所述催收推荐信息不匹配,则输出未按所述催收策略进行催收的提示信息;
若所述催收文本与所述催收推荐信息匹配,则获取所述催收辅助请求对应的催收账户及所述催收账户的账户关联信息;
判断所述账户关联信息中是否包含账户还款信息,若所述账户关联信息中包含所述账户还款信息,则输出催收成功并标记所述催收策略,若所述账户关联信息中不包含所述账户还款信息,则输出催收失败并调整所述催收策略。
7.如权利要求6所述的基于语音识别的催收辅助方法,其特征在于,所述输出所述催收策略,以供催员按所述催收策略进行催收的步骤之后,包括:
统计所述催收账户的催收次数,在所述催收次数超过预设阈值时,将所述催收账户对应客户添加至黑名单。
8.一种基于语音识别的催收辅助装置,其特征在于,所述基于语音识别的催收辅助装置包括:
信息采集模块,用于接收催收辅助请求,基于预设语音采集装置采集客户语音信息;
信息识别模块,用于对采集的所述客户语音信息进行识别,得到目标文本信息,并将所述目标文本信息转换为标准文本信息;
策略确定模块,用于获取所述标准文本信息对应的文本标签,查询预设策略库,得到所述文本标签对应的催收策略;
催收执行模块,用于输出所述催收策略,以供催员按所述催收策略进行催收。
9.一种基于语音识别的催收辅助设备,其特征在于,所述基于语音识别的催收辅助设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于语音识别的催收辅助方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于语音识别的催收辅助方法的步骤。
CN201811127099.6A 2018-09-26 2018-09-26 基于语音识别的催收辅助方法、装置、设备和存储介质 Withdrawn CN109670148A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811127099.6A CN109670148A (zh) 2018-09-26 2018-09-26 基于语音识别的催收辅助方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811127099.6A CN109670148A (zh) 2018-09-26 2018-09-26 基于语音识别的催收辅助方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN109670148A true CN109670148A (zh) 2019-04-23

Family

ID=66142605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811127099.6A Withdrawn CN109670148A (zh) 2018-09-26 2018-09-26 基于语音识别的催收辅助方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN109670148A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110232914A (zh) * 2019-05-20 2019-09-13 平安普惠企业管理有限公司 一种语义识别方法、装置以及相关设备
CN111339757A (zh) * 2020-02-13 2020-06-26 上海凯岸信息科技有限公司 一种催收场景下语音识别结果的纠错方法
WO2021051592A1 (zh) * 2019-09-19 2021-03-25 平安科技(深圳)有限公司 基于人工智能处理数据的方法、装置及存储介质
CN112732871A (zh) * 2021-01-12 2021-04-30 上海畅圣计算机科技有限公司 一种机器人催收获取客户意向标签的多标签分类方法
CN113516546A (zh) * 2021-04-23 2021-10-19 武汉赢联数据技术股份有限公司 基于业务监控技术的智能催收管理系统
CN114745472A (zh) * 2022-03-29 2022-07-12 京东科技控股股份有限公司 一种催收业务处理方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107507087A (zh) * 2017-07-25 2017-12-22 厦门快商通科技股份有限公司 一种面向客户的业务信息收集方法及系统
CN107609103A (zh) * 2017-09-12 2018-01-19 电子科技大学 一种基于推特的事件检测方法
CN107784110A (zh) * 2017-11-03 2018-03-09 北京锐安科技有限公司 一种索引建立方法及装置
CN107945789A (zh) * 2017-12-28 2018-04-20 努比亚技术有限公司 语音识别方法、装置及计算机可读存储介质
CN108205525A (zh) * 2016-12-20 2018-06-26 阿里巴巴集团控股有限公司 基于用户语音信息确定用户意图的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108205525A (zh) * 2016-12-20 2018-06-26 阿里巴巴集团控股有限公司 基于用户语音信息确定用户意图的方法和装置
CN107507087A (zh) * 2017-07-25 2017-12-22 厦门快商通科技股份有限公司 一种面向客户的业务信息收集方法及系统
CN107609103A (zh) * 2017-09-12 2018-01-19 电子科技大学 一种基于推特的事件检测方法
CN107784110A (zh) * 2017-11-03 2018-03-09 北京锐安科技有限公司 一种索引建立方法及装置
CN107945789A (zh) * 2017-12-28 2018-04-20 努比亚技术有限公司 语音识别方法、装置及计算机可读存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110232914A (zh) * 2019-05-20 2019-09-13 平安普惠企业管理有限公司 一种语义识别方法、装置以及相关设备
WO2021051592A1 (zh) * 2019-09-19 2021-03-25 平安科技(深圳)有限公司 基于人工智能处理数据的方法、装置及存储介质
CN111339757A (zh) * 2020-02-13 2020-06-26 上海凯岸信息科技有限公司 一种催收场景下语音识别结果的纠错方法
CN112732871A (zh) * 2021-01-12 2021-04-30 上海畅圣计算机科技有限公司 一种机器人催收获取客户意向标签的多标签分类方法
CN113516546A (zh) * 2021-04-23 2021-10-19 武汉赢联数据技术股份有限公司 基于业务监控技术的智能催收管理系统
CN114745472A (zh) * 2022-03-29 2022-07-12 京东科技控股股份有限公司 一种催收业务处理方法和系统

Similar Documents

Publication Publication Date Title
CN109389971B (zh) 基于语音识别的保险录音质检方法、装置、设备和介质
US10515627B2 (en) Method and apparatus of building acoustic feature extracting model, and acoustic feature extracting method and apparatus
CN109670148A (zh) 基于语音识别的催收辅助方法、装置、设备和存储介质
US10943582B2 (en) Method and apparatus of training acoustic feature extracting model, device and computer storage medium
CN110096570B (zh) 一种应用于智能客服机器人的意图识别方法及装置
CN108564941B (zh) 语音识别方法、装置、设备及存储介质
CN109920415A (zh) 基于语音识别的人机问答方法、装置、设备和存储介质
CN109885810A (zh) 基于语义解析的人机问答方法、装置、设备和存储介质
CN109670166A (zh) 基于语音识别的催收辅助方法、装置、设备和存储介质
CN109920414A (zh) 人机问答方法、装置、设备和存储介质
CN103810998B (zh) 基于移动终端设备的离线语音识别方法以及实现方法
CN109087667B (zh) 语音流利度识别方法、装置、计算机设备及可读存储介质
CN110503956B (zh) 语音识别方法、装置、介质及电子设备
CN110277088A (zh) 智能语音识别方法、装置及计算机可读存储介质
CN113129867B (zh) 语音识别模型的训练方法、语音识别方法、装置和设备
CN111798118B (zh) 企业经营风险监控方法及装置
CN105677636A (zh) 智能问答系统的信息处理方法及信息处理装置
CN115359799A (zh) 语音识别方法、训练方法、装置、电子设备及存储介质
CN111354354B (zh) 一种基于语义识别的训练方法、训练装置及终端设备
CN112037772B (zh) 基于多模态的响应义务检测方法、系统及装置
CN112669850A (zh) 语音质量检测方法、装置、计算机设备及存储介质
CN116741155A (zh) 语音识别方法、语音识别模型的训练方法、装置及设备
CN112466286A (zh) 数据处理方法及装置、终端设备
CN116305257A (zh) 隐私信息监测装置和隐私信息监测方法
CN110851572A (zh) 会话标注方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20190423