CN117456981B

CN117456981B - 一种基于rnn语音识别的实时语音风控系统

Info

Publication number: CN117456981B
Application number: CN202311788413.6A
Authority: CN
Inventors: 郑亚珂
Original assignee: Beijing Miaoxin Technology Co ltd
Current assignee: Beijing Miaoxin Technology Co ltd
Priority date: 2023-12-25
Filing date: 2023-12-25
Publication date: 2024-03-05
Anticipated expiration: 2043-12-25
Also published as: CN117456981A

Abstract

本发明提供了一种基于RNN语音识别的实时语音风控系统，包括：语音检测模块用于采集用户当前通讯的双向通讯语音，并进行预处理后获得有效双向通讯语音；语音处理模块用于基于RNN语音识别模型对双向通讯语音进行识别整理，获得双向通讯文本并提取文本语义特征以及关联语义特征；风险检测模块用于基于文本语义特征以及关联语义特征对用户的当前通讯进行风险检测并根据风险检测结果，生成对应的风险控制信号；风险控制模块用于基于风险控制信号对当前通讯进行对应的风控处理。本发明有利于帮助用户及时识别并发现潜在风险，降低用户受骗概率，保护用户的利益和安全，同时，也有利于及时发现泄密行为，降低事件的泄露几率，提高信息安全。

Description

一种基于RNN语音识别的实时语音风控系统

技术领域

本发明涉及语音识别技术领域，特别涉及一种基于RNN语音识别的实时语音风控系统。

背景技术

随着信息技术的迅猛发展和通讯技术的普及，语音通信已成为人们重要的沟通方式之一，越来越多的人开始使用语音对话进行沟通和交流。然而，一些不法分子可能会利用语音通信进行欺诈、诈骗、暴力等违法犯罪活动，给社会安全和个人财产造成重大威胁，给互联网的通话风险检测也带来了一些风险和挑战，传统的文字风险检测已经无法满足风险检测需求，如何快速准确地识别和分析语音内容，成为当前亟待解决的问题，因此本发明提出一种基于RNN语音识别的实时语音风控系统。

发明内容

本发明提供一种基于RNN语音识别的实时语音风控系统，通过语音识别以及风险检测实现了语音通讯的自动检测，并自动将语音通讯内容与文字通讯内容进行结合，实现了通讯过程的完整检测，有利于及时发现当前通讯中的隐藏套路，帮助用户及时识别并发现潜在风险，降低用户受骗概率，保护用户的利益和安全，可以及时发现泄密行为，降低保密事件的泄露几率，提高信息安全。

本发明提供一种基于RNN语音识别的实时语音风控系统，包括：

语音检测模块，用于采集当前用户当前通讯的双向通讯语音，并进行预处理后获得有效双向通讯语音；

语音处理模块，用于基于RNN语音识别模型对双向通讯语音进行识别整理，获得双向通讯文本，并提取双向通讯文本的文本语义特征以及关联语义特征；

风险检测模块，用于基于文本语义特征以及关联语义特征对用户的当前通讯进行风险检测，并根据风险检测结果，生成对应的风险控制信号；

风险控制模块，用于基于风险控制信号，对当前通讯进行对应的风控处理。

优选的，在一种基于RNN语音识别的实时语音风控系统中，语音检测模块，包括：

语音采集单元，用于当前用户当前通讯双方的语音进行采集，获得双向通讯语音；

预处理单元，用于基于双向通讯语音的接听关系，将双向通讯语音进行分组，获得第一语音和第二语音，并分别对第一语音和第二语音进行预处理。

优选的，在一种基于RNN语音识别的实时语音风控系统中，预处理单元，包括：

语音降噪子单元，用于基于预设算法对应第一语音以及第二语音进行语音降噪，获得第一去噪语音和第二去噪语音；

语音分离子单元，用于获取当前第一语音对应的多个第一历史语音，基于第一历史语音进行语音特征提取，获得第一参考特征并发送至第一参考特征列表进行存储，根据第一参考特征对第一语音进行人声净化，获得第一有效语音；

获取当前第二语音对应的多个第二历史语音，基于第二历史语音进行语音特征提取，获得第二参考特征并发送至第二参考特征列表进行存储，根据第二参考特征对第二语音进行人声净化，获得第二有效语音；

语音发送单元，用于将第一有效语音和第二有效语音作为有效双向通讯语音，发送至语音处理模块。

优选的，在一种基于RNN语音识别的实时语音风控系统中，语音分离子单元，包括：

参考更新子单元，用于获取预设时间内的多条单方通讯语音对应的语音特征，并与其对应的参考特征列表中的参考特征进行对比，判断单方通讯语音人声是否存在语音异常；

其中，单方通讯语音为第一语音或者第二语音；

当单方通讯语音人声存在语音异常时，将与其对应的参考特征不一样的单方通讯语音作为异常语音，计算同一类型异常语音在预设时间段内的使用频率，基于所述使用频率，预测异常语音的使用连续程度；

当使用连续程度大于预设值时，判定异常语音为常用语音，将常用语音对应的语音特征作为参考特征，并对单方通讯语音对应的参考特征列表进行更新；

否则，判定异常语音为非常用语音。

优选的，在一种基于RNN语音识别的实时语音风控系统中，语音处理模块，包括：

语音识别单元，用于基于RNN语音识别模型对有效双向通讯语音进行识别，获得语音识别结果，并结合当前通讯中的文字对话，生成双向通讯文本；

第一提取单元，用于基于双向通讯语音的接听关系，将双向通讯文本进行文本分组，获得第一文本组和第二文本组，并对分别对第一文本组和第二文本组进行提取，获得文本语义特征；

第二提取单元，用于对双向通讯文本进行对话逻辑识别，并基于对话逻辑识别结果，对双向通讯文本进行顺序整理，获得整理文本，并将整理文本与双向通讯文本进行对比，获得关联语义特征。

优选的，在一种基于RNN语音识别的实时语音风控系统中，第二提取单元，包括：

逻辑识别子单元，用于按照原对话顺序，通过RNN语音识别模型对双向通讯文本进行语义识别，根据语义识别结果，分别确定当前通讯中的多个对话话题的话题首句，基于对话问答特征以及话题首句关键词，对当前剩余文本语句与各个话题首句的相关性进行判断，根据判断结果，确定每个对话话题对应的全部通讯文本，得到双向通讯文本的对话逻辑；

文本整理子单元，用于基于所述对话逻辑，对双向通讯文本进行顺序调整，将同一对话话题对应的全部通讯文本调整成连续对话文本，获得多个双向通讯文本段，并基于原对话中各个对话话题的出现顺序，对多个双向通讯文本段进行拼接形成完整的新双向通讯文本，获得整理文本；

特征提取子单元，用于将整理文本与双向通讯文本进行对比，确定双向通讯语音中的对话话题穿插关系以及对话话题更换频率，基于对话话题穿插关系以及对话话题更换频率，生成关联语义特征。

优选的，在一种基于RNN语音识别的实时语音风控系统中，风险检测模块，包括：

第一检测单元，用于将独立通讯文本的文本语义特征与预设风险列表中的多个风险词汇对应的语义特征进行对比，若文本语义特征与任意风险词汇对应的语义特征相同时，判定所述文本语义特征对应的独立通讯文本为疑似风险文本；

并截取疑似风险文本所在的双向通讯文本段，获取所述双向通讯文本段对应的关联语义特征，提取对话情景关键词，基于对话情景关键词，确定疑似风险文本的对话情景，参考预设风险列表，判断疑似风险文本的对话情景与其对应的风险词汇的风险情景是否匹配；

若匹配，则判定疑似风险文本为风险文本，并生成第一控制信号；

若不匹配，则判定疑似风险文本为正常语音；

第二检测单元，用于基于关联语义特征，确定当前通讯的对话话题切换复杂程度，当对话话题切换复杂程度大于预设值时，判断当前通讯是否为多方对话，若是，判断当前通讯正常；

否则，判定当前通讯异常，并将当前通讯对应的整理文本发送至风险确定单元；

风险确定单元，用于判断当前通讯是否存在敏感话题，若存在，则判定当前通讯为风险通讯，生成第二控制信号；

若不存在，则向当前通讯添加可疑标签，基于关联语义特征，确定当前通讯对应的当前对话架构，将当前对话构架与多方对话风险判断参考列表中的风险构架进行对比，若当前对话构架与任意风险构架相同，则判定当前通讯为风险通讯，并生成第二控制信号；

否则，将当前通讯对应的双向通讯文本发送至管理端等待人工判定。

优选的，在一种基于RNN语音识别的实时语音风控系统中，风险控制模块，包括：

信号识别单元，用于对接收到的风险控制信号进行类型识别；

第一控制单元，用于在确定接收到的风险控制信号为第一控制信号时，对存在风险的语音或者文本进行拦截并限制发送权限，生成风险控制日志，并获取当前通讯中风险文本的占比，当所述占比到达阈值时，生成第二控制信号；

第二控制单元，用于在确定接收到的风险控制信号为第二控制信号时，终止当前通讯并生成风险报警信号发送至管理端，并对当前通讯对应的双向通讯文本进行保存存储，生成风险控制日志。

优选的，在一种基于RNN语音识别的实时语音风控系统中，风险确定单元，还包括：

结果获取子单元，用于采集带有可疑标签的当前通讯的人工判定结果；

标签修改子单元，用于当人工判定当前通讯存在风险时，将当前通讯对应的标签修改为风险标签，并生成第二控制信号；

当人工判定当前通讯不存在风险时，当前通讯对应的标签修改为正常标签；

列表更新子单元，用于获取多个从可疑标签修改为风险标签的通讯记录，基于通讯记录对应的对话话题切换复杂程度对通讯记录进行分类，获得多个记录集合，分别对每个记录集合中多个通讯记录对应的关联语义特征进行对比，确定不同对话话题切换复杂程度对应的风险对话架构，基于所述风险对话构架对多方对话风险判断参考列表进行更新。

优选的，在一种基于RNN语音识别的实时语音风控系统中，还包括：模型训练模块，用于对RNN识别模型进行训练得到RNN语音识别模型，包括：

样本采集单元，用于获取多种风险词汇以及风险词汇相似词汇的风险文本，以及所述风险文本对应的多种方言语音，并将所述风险文本和方言语音作为训练语音；

第一处理单元，用于根据训练语音中包含的风险词汇的分类，将训练语音进行分组，获得多个风险训练组；

模型训练模块，用于基于风险训练组生成训练集，对RNN识别模型进行训练，获得RNN语音识别模型。

与现有技术相比，本发明至少存在以下有益效果：

本发明通过语音检测模块采集用户当前通讯的双向通讯语音，并进行预处理后获得有效双向通讯语音，实现对通话语音采集以及处理，有效提高语音识别的准确性；通过语音处理模块基于RNN语音识别模型对双向通讯语音进行识别整理，获得双向通讯文本，并提取有效双向通讯语音的文本语义特征以及关联语义特征；然后通过风险检测模块基于文本语义特征以及关联语义特征对用户的当前通讯进行风险检测，并根据风险检测结果，生成对应的风险控制信号，完成对语音对话的智能检测以及风险分类有助于快速确定风险文本的控制方式，最后通过风险控制模块基于风险控制信号，对当前通讯进行对应的风控处理，实现了风险对话的自动处理。本发明通过语音识别以及风险检测实现了语音通讯的自动检测，并自动将语音通讯内容与文字通讯内容进行结合，实现了通讯过程的完整检测，有利于及时发现当前通讯中的隐藏套路，帮助用户及时识别并发现潜在风险，降低用户受骗概率，保护用户的利益和安全，同时，对用户通讯语音进行检测也有利于及时发现泄密行为，降低保密事件的泄露几率，提高信息安全。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在本申请文件中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明一种基于RNN语音识别的实时语音风控系统的示意图；

图2为本发明一种基于RNN语音识别的实时语音风控系统语音检测模块的示意图；

图3为本发明一种基于RNN语音识别的实时语音风控系统语音处理模块的示意图；

图4为本发明一种基于RNN语音识别的实时语音风控系统风险检测模块的示意图；

图5为本发明一种基于RNN语音识别的实时语音风控系统风险控制模块的示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

实施例1：本发明提供一种基于RNN语音识别的实时语音风控系统，如图1所示，包括：

本实施例中，双向通信语音是语音发出方和语音接听方两个方向对话语音。

本实施例中，有效双向通讯语音是指剔除噪音或者其他干扰语音（例如。电视播放声音、路人声音等）的只包含语音发送人人声的双向通信语音。

本实施例中，双向通讯文本是指既包含了双向通讯语音识别结果由办好了当前通讯中的全部文字对话内容的文本。

本实施例中，文本语义特征是指双向通讯语音中每个单独语音的语义。

本实施例中，关联语义特征是指在当前通讯中各个单元语音之间的关联关系。

本实施例中，风控处理包括语音拦截、风险报警、对话限制（包括强制结束通话）以及风险记录等。

上述技术方案的有益效果：本发明通过语音检测模块采集用户当前通讯的双向通讯语音，并进行预处理后获得有效双向通讯语音，实现对通话语音采集以及处理，有效提高语音识别的准确性；通过语音处理模块基于RNN语音识别模型对双向通讯语音进行识别整理，获得双向通讯文本，并提取有效双向通讯语音的文本语义特征以及关联语义特征；然后通过风险检测模块基于文本语义特征以及关联语义特征对用户的当前通讯进行风险检测，并根据风险检测结果，生成对应的风险控制信号，完成对语音对话的智能检测以及风险分类有助于快速确定风险文本的控制方式，最后通过风险控制模块基于风险控制信号，对当前通讯进行对应的风控处理，实现了风险对话的自动处理。本发明通过语音识别以及风险检测实现了语音通讯的自动检测，并自动将语音通讯内容与文字通讯内容进行结合，实现了通讯过程的完整检测，有利于及时发现当前通讯中的隐藏套路，帮助用户及时识别并发现潜在风险，降低用户受骗概率，保护用户的利益和安全，同时，对用户通讯语音进行检测也有利于及时发现泄密行为，降低保密事件的泄露几率，提高信息安全。

实施例2：在实施例1的基础上，语音检测模块，如图2所示，包括：

本实施例中，接听关系是指语音接听以及语音发送。语音发送以及接收都是从当前用户的角度确定的，当前用户即为语音发送方，当前用户接收到的语音对应的发送者即为语音接听方。

本实施例中，第一语音是指用户发送的语音；第二语音是指用户接收到的语音。

上述技术方案的有益效果：本发明通过语音采集单元实现了用户通讯语音的采集，然后通过预处理单元基于接听关系，完成双向通讯语音的接听和发送关系的分类，方便RNN语音识别模型进行单句语音的语义识别。

实施例3：在实施例2的基础上，预处理单元，包括：

本实施例中，第一去噪语音是指进行去噪的第一语音；第二去噪语音是指进行去噪的第二语音。

本实施例中，预设算法包括但不限于Conv-TasNet。

本实施例中，第一历史语音是指语音发送方发送的历史语音。

本实施例中，第二历史语音是指语义发放方接收的同一语音发送人的历史语音。

本实施例中，第一参考特征是指第一历史语音的语音特征，包括声音频率、能量等；第二参考特征是指第二历史语音的语音特征，包括声音频率、能量等。

本实施例中，第一参考特征列表是指语音发送方的多个常用声音的声音特征生成的列表；第二参考特征列表是指同一语音接听方的多个常用声音的声音特征生成的列表。

本实施例中，第一有效语音是指只保留了语音发送方人声的第二语音；第二有效语音是指只保留了语音接听方人声的第二语音。

本实施例中，非常用语音被消声过滤后，语音发送人可通过后台身份验证设置进行恢复。

上述技术方案的有益效果：本发明首先通过语音降噪子单元对第一语音以及第二语音进行降噪，去除噪音干扰，然后通过语音分离模块建立第一参考特征列表以及第二参考特征列表，然后基于第一参考特征列表以及第二参考特征列表，对第一语音以及第二语音中的人声进行分离，保留有效人声，避免操作环境中通讯对通讯语音识别的干扰的同时，也实现了通讯语音的初步筛查，有效降低盗取账号实施违法事件的发生概率，可存储多种常用声音语音特征的第一参考特征列表以及第二参考特征列表的建立，实现了在同账号多人使用的情况下（例如，不同的客服使用同一账号为用户进行问题答复）异常语音的及时过滤。

实施例4：在实施例3的基础上，语音分离子单元，包括：

其中，单方通讯语音为第一语音或者第二语音；

否则，判定异常语音为非常用语音。

本实施例中，当为多方通讯时，第二语音对应的单方通讯语音为同一语音接听方对应的第二语音。

本实施例中，异常语音是的多条单方通讯语音中与其对应的参考特征列表中的参考特征不一样的语音。

本实施例中，同一类型异常语音是指同一账号在预设时间段内发出的异常语音。

本实施例中，使用频率是指同一账号在预设时间段内发出的异常语音占其在预设时间内发出的全部对话消息（包括语音消息、文本消息和图片消息）的比例。

本实施例中，当前通讯包含多个通讯过程。

上述技术方案的有益效果：本发明基于参考更新子单元对预设时间内的多条单方通讯语音进行异常判断，确定异常声音发送的语音（即异常语音）然后根据异常语音在预设时间内的使用频率判断异常语音是否为常用语音，实现参考特征列表的自动更新，从而完成不同通话账号的语音权限的自动变更与更新，确保在某个通讯账号的使用人正常发生变更时，也可以正常使用语音通话功能。

实施例5：在实施例3的基础上，语音处理模块，如图3所示，包括：

本实施例中，第一文本组是在当前用户发送的消息的文本内容；第二文本组是指用户接收到的消息的文本内容。

本实施例中，整理文本是指根据对话话题对文本进行分组归类然后根据对话话题开始顺序进行排列形成的新的双向通讯文本。

上述技术方案的有益效果：本发明通过语音识别单元RNN语音识别模型对有效双向通讯语音进行识别，获得语音识别结果，完成了当前通讯中语音通话转化，然后将语音的文字转化结果与当前通讯中的文字对话进行结合，生成双向通讯文本，获得完整的语言交流文本，有利于对整个通讯过程中对话逻辑的理解；基于第一提取单元以及第二提取单元分别对当前通讯内容的单条消息内容以及完整聊天内容进行语义特征的提取，有利于及时发现当前通讯过程中风险词汇的同时，也有利于发现潜在隐藏风险（例如，汇款诱导、信息套取等）。

实施例6：在实施例5的基础上，第二提取单元，包括：

逻辑识别子单元，用于通过RNN语音识别模型对双向通讯文本进行语义识别，根据语义识别结果，分别确定当前通讯中的多个对话话题的话题首句，基于对话问答特征以及话题首句关键词，对当前剩余文本语句与各个话题首句的相关性进行判断，根据判断结果，确定每个对话话题对应的全部通讯文本，得到双向通讯文本的对话逻辑；

本实施例中，话题首句是指每个对话话题的发起对应的文本。

本实施例中，对话问答特征是指对话一般是指话题发起方和话题其他参与者交替对话。

本实施例中，话题首句关键词是指话题首句中的话题关键词，例如，话题首句为询问某件物品的价格，其中，物品名称以及价格即为该话题首句的关键词。

本实施例中，当前剩余文本语句是指当前通讯中除了话题首句的其他通讯文本。

本实施例中，通讯文本是指当前通讯中的每个单条消息对应的文本内容。

本实施例中，对话逻辑指的是双向通讯文本各条消息对应的文本内容之间的相关性。

本实施例中，连续对话文本是指同一对话话题对应的全部通讯文本形成双向通讯文本段，一个对话话题对应一个双向通讯文本段。

本实施例中，对话话题穿插关系是指在当前通讯中消息接收双方聊天话题的交叉关系，例如，双方在聊某个物品价格的同时，也在聊哪里买比较好以及已买的该物品的使用效果如何。

本实施例中，对话话题更换频率是指在当前通讯过程中对话话题的平均更换频率，例如，平均5句话更换一个对话话题。

上述技术方案的有益效果：本发明通过逻辑识别子单元按照原对话顺序，基于RNN语音识别模型对双向通讯文本进行语义识别，根据语义识别结果，分别确定当前通讯中的多个对话话题的话题首句，基于对话问答特征以及话题首句关键词，对当前剩余文本语句与各个话题首句的相关性进行判断，根据判断结果，确定每个对话话题对应的全部通讯文本，得到双向通讯文本的对话逻辑；然后通过文本整理子单元基于所述对话逻辑，对双向通讯文本进行顺序调整，将同一对话话题对应的全部通讯文本调整成连续对话文本，获得多个双向通讯文本段，并基于原对话中各个对话话题的出现顺序，对多个双向通讯文本段进行拼接形成完整的新双向通讯文本，获得整理文本；基于特征提取子单元将整理文本与双向通讯文本进行对比，确定双向通讯语音中的对话话题穿插关系以及对话话题更换频率，基于对话话题穿插关系以及对话话题更换频率，生成关联语义特征，实现了对当前通讯过程中对话构架的识别，有利于及时发现套路性诱导用户进行风险性操作的通讯行为，有效提升了系统对潜在通讯风险的辨别确认能力，提高了系统的智能性。

实施例7：在实施例1的基础上，风险检测模块，如图4所示，包括：

若不匹配，则判定疑似风险文本为正常语音；

本实施例中，预设风险列表是指存储了多种风险词汇以及各个风险词汇对应的存在风险的场景或者领域的数据列表，该风险词汇可根据用户的实际风险检测需求进行自行设置。

本实施例中，独立通讯文本是指当前通讯中任意一个单条消息对应的通讯文本。

本实施例中，疑似风险文本是指存在风险词汇的独立通讯文本。

本实施例中，对话情景关键词是指对话内容中体现对话场景或者对话内容领域的词汇。

本实施例中，对话情景指双向通讯文本段对应的对话场景或者对话内容领域。

本实施例中，风险文本是指存在风险的独立通讯文本。

本实施例中，对话话题切换复杂程度是指对话话题更换的复杂程度，通过关联语义特征体系。对话话题更换频率越频繁、穿插越紧密对话话题切换复杂程度越高。

本实施例中，第一控制信号是指单条通讯消息存在风险生成的风险控制信号；第二控制信号是指当前通讯整个存在风险生成的风险控制信号。

本实施例中，敏感话题是指预设风险列表中存在风险的场景或者领域。

上述技术方案的有益效果：本发明将独立通讯文本的文本语义特征与预设风险列表中的多个风险词汇对应的语义特征进行对比，若文本语义特征与任意风险词汇对应的语义特征相同时，判定所述文本语义特征对应的独立通讯文本为疑似风险文本；并截取疑似风险文本所在的双向通讯文本段，获取所述双向通讯文本段对应的关联语义特征，提取对话情景关键词，基于对话情景关键词，确定疑似风险文本的对话情景，参考预设风险列表，判断疑似风险文本的对话情景与其对应的风险词汇的风险情景是否匹配；若匹配，则判定疑似风险文本为风险文本，并生成第一控制信号；若不匹配，则判定疑似风险文本为正常语音；然后基于关联语义特征，确定当前通讯的对话话题切换复杂程度，当对话话题切换复杂程度大于预设值时，判断当前通讯是否为多方对话，若是，判断当前通讯正常；否则，判定当前通讯异常，并通过风险确定单元判断当前通讯是否存在敏感话题，若存在，则判定当前通讯为风险通讯，生成第二控制信号；若不存在，则向当前通讯添加可疑标签，基于关联语义特征，确定当前通讯对应的当前对话架构，将当前对话构架与多方对话风险判断参考列表中的风险构架进行对比，若当前对话构架与任意风险构架相同，则判定当前通讯为风险通讯，并生成第二控制信号；否则，将当前通讯对应的双向通讯文本发送至管理端等待人工判定，实现了对单个通讯消息风险检测的同时，又对整个通讯的逻辑进行检测，通过当前通讯涉及的话题对应的场景或者领域，以及对应的对话框架对潜在聊天风险进行检测，实现了通讯过程的全方位检测，提高系统的聊天风险检测能力的同时，也提高了对用户合法权益的保护能力，有效降低用户信息泄露以及被欺骗概率。

实施例8：在实施例1的基础上，风险控制模块，如图5所示，包括：

在确定接收到的风险控制信号为第一控制信号时，对存在风险的语音或者文本进行拦截并限制发送权限，生成风险控制日志，并获取当前通讯中风险文本的占比，当所述占比到达阈值时，生成第二控制信号；

本实施例中，风险控制日志是指在对当前通讯进行风险控制的过程中自动生成的日志。

上述技术方案的有益效果：本发明对接收到的风险控制信号进行类型识别，并根据不同类型的风险控制信号对当前通信做出不同程度的处理，实现了不同通讯风险的针对性处理，在确定接收到的风险控制信号为第一控制信号时，对存在风险的语音进行拦截并限制发送权限，并获取当前通讯中风险文本的占比，当所述占比到达阈值时，生成第二控制信号，实现对当前通信风险程度的自动更新，有利于提高系统的风险管控能力；在确定接收到的风险控制信号为第二控制信号时，终止当前通讯并生成风险报警信号发送至管理端，对较为验证的风险及时进行制止，保护用户合法权益以及隐私安全的同时避免更多的信息泄露，在对当前通信进行风险管理控制的同时生成风险控制日志，为后续相关部门的追责提供依据，有效提高风险追责的工作效率。

实施例9：在实施例7的基础上，风险确定单元，还包括：

本实施例中，风险标签是指被人工判定存在风险的当前通讯对应的通讯记录携带的标签。

本实施例中，正常标签是指被人工判定不存在风险的当前通讯对应的通讯记录携带的标签。

本实施例中，对话话题切换复杂程度一样的通讯记录在同一个记录集合中。

本实施例中，风险对话架构是指同一对话话题切换复杂程度的通讯中不同对话话题的穿插交替进行形成的对话套路构架。

本实施例中，多方对话风险判断参考列表是指保存了在多人通话的前提下，的多种风险对话套路的列表，该列表是多方通讯对话风险判断的参考。

上述技术方案的有益效果：本发明通过结果获取子单元实现了对人工判定的采集，确保系统及时接收到人工判定结果，当人工判定当前通讯存在风险时，将当前通讯对应的标签修改为风险标签，并生成第二控制信号，确保风险通讯及时处理，保护用户或者用户所在单位的财产以及信息安全；通过列表更新子单元获取多个从可疑标签修改为风险标签的通讯记录，基于通讯记录对应的对话话题切换复杂程度对通讯记录进行分类，获得多个记录集合，分别对每个记录集合中多个通讯记录对应的关联语义特征进行对比，确定不同对话话题切换复杂程度对应的风险对话架构，基于所述风险对话构架对多方对话风险判断参考列表进行更新，实现了多方通讯对话风险判断的参考的自动更新，有利于提高系统对套路式对话风险识别能力。

实施例10：在实施例1的基础上，一种基于RNN语音识别的实时语音风控系统，还包括：

模型训练模块，用于对RNN识别模型进行训练得到RNN语音识别模型，包括：

本实施例中，方言语音的种类可根据系统的实际使用地区进行选择。

本实施例中，风险训练组是指用于存放同一风险词汇对应的全部训练语音的数据分组。

上述技术方案的有益效果：本发明获取多种风险词汇以及风险词汇相似词汇的风险文本，以及所述风险文本对应的多种方言语音，并将所述风险文本和方言语音作为训练语音，为模型训练提供多种语音，确保RNN语音识别模型可以识别普通话的同时也可以识别多种方言，为提高RNN语音识别模型的语音识别能力提供基础；然后根据训练语音中包含的风险词汇的分类，将训练语音进行分组，获得多个风险训练组，实现了不同风险词汇的多种语音的分组，基于风险训练组生成训练集，对RNN识别模型进行训练，获得RNN语音识别模型，实现了对RNN语音识别模型进行针对性训练，确保模型可以在多种语音环境中的精准识别到风险词汇，有效提高RNN语音识别模型的泛化能力以及语音识别的准确性。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于RNN语音识别的实时语音风控系统，其特征在于，包括：

风险控制模块，用于基于风险控制信号，对当前通讯进行对应的风控处理；

其中，语音检测模块，包括：

预处理单元，用于基于双向通讯语音的接听关系，将双向通讯语音进行分组，获得第一语音和第二语音，并分别对第一语音和第二语音进行预处理；

其中，预处理单元，包括：

语音发送单元，用于将第一有效语音和第二有效语音作为有效双向通讯语音，发送至语音处理模块；

其中，语音分离子单元，包括：

其中，单方通讯语音为第一语音或者第二语音；

否则，判定异常语音为非常用语音。

2.根据权利要求1所述的一种基于RNN语音识别的实时语音风控系统，其特征在于，语音处理模块，包括：

3.根据权利要求2所述的一种基于RNN语音识别的实时语音风控系统，其特征在于，第二提取单元，包括：

4.根据权利要求1所述的一种基于RNN语音识别的实时语音风控系统，其特征在于，风险检测模块，包括：

若不匹配，则判定疑似风险文本为正常语音；

5.根据权利要求1所述的一种基于RNN语音识别的实时语音风控系统，其特征在于，风险控制模块，包括：

6.根据权利要求4所述的一种基于RNN语音识别的实时语音风控系统，其特征在于，风险确定单元，还包括：

7.根据权利要求1所述的一种基于RNN语音识别的实时语音风控系统，其特征在于，还包括：模型训练模块，用于对RNN识别模型进行训练得到RNN语音识别模型，包括：