CN112988991B

CN112988991B - 一种通过人机对话进行反欺诈干预的方法和系统

Info

Publication number: CN112988991B
Application number: CN202110153307.5A
Authority: CN
Inventors: 王子豪; 杨明晖
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2021-02-04
Filing date: 2021-02-04
Publication date: 2023-04-18
Anticipated expiration: 2041-02-04
Also published as: CN112988991A

Abstract

本说明书公开了一种通过人机对话进行反欺诈干预的方法和系统，所述方法包括：获取来自人机对话的对话文本，所述人机对话由用户的目标操作触发，所述对话文本包括当前用户话语；基于对话文本确定用户的行为意图；基于行为意图以及对话文本确定当前用户话语对应的回复策略类型以及与目标操作相关的风险信息；基于回复策略类型以及风险信息确定一条或多条候选机器人话术；对一条或多条候选机器人话术进行筛选，获得应答机器人话术；基于应答机器人话术回复当前用户话语。

Description

一种通过人机对话进行反欺诈干预的方法和系统

技术领域

本说明书涉及计算机技术领域，特别涉及一种通过人机对话进行反欺诈干预的方法和系统。

背景技术

随着数字金融和电子支付行业的蓬勃发展，金融欺诈也随之增多。金融平台可以在识别欺诈风险后，通过阻断用户操作来阻止用户被欺诈。然而，用户可能因为无法感知到被欺诈，从而在阻断操作后通过其他方式继续交易。

因此，希望提供一种通过人机对话进行反欺诈干预的方法和系统，可以使用户感知到被欺诈的风险，从而降低用户资金损失。

发明内容

本说明书一个方面提供一种通过人机对话进行反欺诈干预的方法，所述方法包括：获取来自人机对话的对话文本，所述人机对话由用户的目标操作触发，所述对话文本包括当前用户话语；基于对话文本确定用户的行为意图；基于行为意图以及对话文本确定当前用户话语对应的回复策略类型以及与目标操作相关的风险信息；基于回复策略类型以及风险信息确定一条或多条候选机器人话术；对一条或多条候选机器人话术进行筛选，获得应答机器人话术；基于应答机器人话术回复当前用户话语；其中，所述基于行为意图以及对话文本确定当前用户话语对应的回复策略类型，进一步包括：基于对话文本提取对话文本的第一特征信息，其中，所述对话文本的第一特征信息包括对话文本中字符的字符特征信息以及字符对应的对话方信息；基于行为意图以及对话文本的第一特征信息确定当前用户话语对应的回复策略类型。

本说明书另一个方面提供一种通过人机对话进行反欺诈干预的系统，所述系统包括：对话文本获取模块，用于获取来自人机对话的对话文本，所述人机对话由用户的目标操作触发，所述对话文本包括当前用户话语；用户行为意图确定模块，用于基于对话文本确定用户的行为意图；回复策略类型和风险信息确定模块，用于基于行为意图以及对话文本确定当前用户话语对应的回复策略类型以及与目标操作相关的风险信息；候选话术确定模块，用于基于回复策略类型以及风险信息确定一条或多条候选机器人话术；机器人话术获取模块，用于对一条或多条候选机器人话术进行筛选，获得应答机器人话术；用户话语回复模块，用于基于应答机器人话术回复当前用户话语；其中，回复策略类型和风险信息确定模块进一步用于：基于对话文本提取对话文本的第一特征信息，其中，对话文本的第一特征信息包括对话文本中字符的字符特征信息以及字符对应的对话方信息；基于行为意图以及对话文本的第一特征信息确定当前用户话语对应的回复策略类型。

本说明书另一个方面提供一种用于人机对话的策略分类方法，所述方法包括：获取对话文本，所述对话文本包括当前用户话语；基于对话文本提取对话文本的第一特征信息，其中，对话文本的第一特征信息包括对话文本中字符的字符特征信息以及字符对应的对话方信息；基于对话文本的第一特征信息确定当前用户话语对应的回复策略类型。

本说明书另一个方面提供一种用于人机对话的策略分类系统，所述系统包括：对话文本获取模块，用于获取对话文本，所述对话文本包括当前用户话语；第一特征信息提取模块，用于基于对话文本提取对话文本的第一特征信息，其中，对话文本的第一特征信息包括对话文本中字符的字符特征信息以及字符对应的对话方信息；策略类型确定模块，用于基于对话文本的第一特征信息确定当前用户话语对应的回复策略类型。

本说明书另一个方面提供一种计算机可读存储介质，其特征在于，所述存储介质存储计算机指令，当所述计算机指令被处理器执行时实现通过人机对话进行反欺诈干预的方法和用于人机对话的策略分类的方法。

附图说明

本说明书将以示例性实施例的方式进一步说明，这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的，在这些实施例中，相同的编号表示相同的结构，其中：

图1是根据本说明书一些实施例所示的通过人机对话进行反欺诈干预的系统的应用场景示意图；

图2是根据本说明书一些实施例所示的通过人机对话进行反欺诈干预的方法的示例性流程图；

图3是根据本说明书一些实施例所示的一种用于人机对话的策略分类方法的示例性流程图；

图4是根据本说明书一些实施例所示的策略克隆模型的示例性示意图。

具体实施方式

为了更清楚地说明本说明书实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本说明书的一些示例或实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明，图中相同标号代表相同结构或操作。

应当理解，本说明书中所使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而，如果其他词语可实现相同的目的，则可通过其他表达来替换所述词语。

如本说明书和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其它的步骤或元素。

本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是，前面或后面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各个步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。

随着数字金融和电子支付行业的蓬勃发展，欺诈者通过金融平台对用户进行的金融欺诈也随之增多。例如，欺诈者冒充用户好友，通过支付平台诱导用户向欺诈者的银行账户转账。又例如，欺诈者在银行系统上通过手机号码登录用户的账户，骗取用户收到的手机验证码，从而操作用户的银行账户，盗取用户的资金。

金融平台可以通过用户的操作识别出欺诈风险，并通过阻断用户操作来阻止用户被欺诈。例如，金融平台监测到用户丙向A账户进行转账，该账户还在同日接收了多个账户的大额转账，则识别该账户可能为可疑账户，从而阻断用户操作。

然而，用户操作的场景变化较多，金融平台通过用户操作识别欺诈风险可能导致对用户的无风险操作进行误判。例如，前述场景中，A账户为用户丙的好友丁的账户，用户丙和其他多个账户的大额转账是为了请丁帮忙代购奢侈品。此外，用户可能因为无法感知到被欺诈，从而在阻断操作后通过其他方式继续交易。例如，用户在被阻断操作后，误以为是金融平台故障，从而通过其他金融平台转账。

由此可见，金融平台需要结合具体场景对用户的操作进行进一步的风险识别，同时在识别出风险后，需要对用户进行风险提示。因此，金融平台可以通过人机对话进行反欺诈干预。

图1是根据本说明书一些实施例所示的通过人机对话进行反欺诈干预的系统的应用场景示意图。

如图1所示，通过人机对话进行反欺诈干预的系统100可以包括处理设备110、网络120、存储设备130、和用户终端140。

在一些实施例中，处理设备110可以获取对话文本，确定用户的行为意图，确定当前用户话语对应的回复策略类型以及与目标操作相关的风险信息，确定一条或多条候选机器人话术，获得应答机器人话术等。在处理过程中，处理设备110可以将数据(如回复策略类型以及风险信息)保存到存储设备130或从存储设备130获取数据(如候选机器人话术)，也可以通过网络120从用户终端140等其他来源读取数据(如对话文本)或将数据(如应答机器人话术)输出至用户终端140。

处理设备110可以用于处理来自系统100的至少一个组件或外部数据源(例如，云数据中心)的数据和/或信息。在一些实施例中，处理设备110可以是单一服务器或服务器组。该服务器组可以是集中式或分布式的(例如，处理设备110可以是分布式系统)。在一些实施例中，处理设备110可以是区域的或者远程的。在一些实施例中，处理设备110可以在云平台上实施，或者以虚拟方式提供。仅作为示例，云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。

存储设备130可以用于存储数据(如训练样本等)和/或指令。存储设备130可以包括一个或多个存储组件，每个存储组件可以是一个独立的设备，也可以是其他设备的一部分。在一些实施例中，存储设备130可包括随机存取存储器(RAM)、只读存储器(ROM)、大容量存储器、可移动存储器、易失性读写存储器等或其任意组合。示例性地，大容量储存器可以包括磁盘、光盘、固态磁盘等。在一些实施例中，存储设备130可在云平台上实现。仅作为示例，云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。在一些实施例中，存储设备130可以集成或包括在系统100的一个或多个其他组件(例如，处理设备110、用户终端140或其他可能的组件)中。

用户终端140指用户所使用的一个或多个终端设备或软件。在一些实施例中，用户可以使用用户终端140通过网络120与处理设备110通信，将人机对话的对话文本发送到处理设备110，并接收处理设备110反馈的应答机器人话术。例如，用户可以通过用户终端140接收处理设备110发起的智能外呼，收听应答机器人话术以及将用户话语通过网络120发送到处理设备110。在一些实施例中，用户终端140可以是移动设备140-1、平板计算机140-2、膝上型计算机140-3、台式计算机140-4、其他具有输入和/或输出功能的设备等或其任意组合。上述示例仅用于说明所述用户终端140设备范围的广泛性而非对其范围的限制。

网络120可以连接系统的各组成部分和/或连接系统与外部部分。网络120使得系统各组成部分之间以及与系统与外部部分之间可以进行通讯，促进数据和/或信息的交换。在一些实施例中，网络120可以是有线网络或无线网络中的任意一种或多种。例如，网络120可以包括电缆网络、光纤网络、电信网络、互联网、局域网络(LAN)、广域网络(WAN)、无线局域网络(WLAN)、城域网(MAN)、公共交换电话网络(PSTN)、蓝牙网络、紫蜂网络(ZigBee)、近场通信(NFC)、设备内总线、设备内线路、线缆连接等或其任意组合。在一些实施例中，系统各部分之间的网络连接可以采用上述一种方式，也可以采取多种方式。在一些实施例中，网络120可以是点对点的、共享的、中心式的等各种拓扑结构或者多种拓扑结构的组合。在一些实施例中，网络120可以包括一个或以上网络接入点。例如，网络120可以包括有线或无线网络接入点，例如基站和/或网络交换点120-1、120-2、…，通过这些网络接入点，系统100的一个或多个组件可连接到网络120以交换数据和/或信息。

图2是根据本说明书一些实施例所示的通过人机对话进行反欺诈干预的方法的示例性流程图。图2所示的方法200可以在处理设备110上实现。

如图2所示，通过人机对话进行反欺诈干预的方法200可以包括：

步骤210，获取来自人机对话的对话文本。

具体地，该步骤210可以由第一对话文本获取模块执行。

人机对话是指用户和机器人的对话。在一些实施例中，人机对话的形式可以是书面信息。例如，在即时聊天工具中的对话框中以文字消息和图片消息等形式进行。在一些实施例中，人机对话的形式也可以是语音信息。例如，语音消息。在一些实施例中，人机对话的形式还可以是实时通话。例如，电话通信、语音通信和视频通信等。

在一些实施例中，人机对话由用户的目标操作触发。目标操作是指可能在用户被欺诈下做出的操作，或者指可能会给用户带来财产安全危害的操作。例如，用户进行大额转账、购买虚拟产品和给可疑账户转账等操作。在一些实施例中，可以预先设置一种或多种目标操作，当对话文本获取模块监测到用户执行了目标操作，则触发人机对话。

示例性地，以电话通信形式的人机对话为例，当对话文本获取模块监测到用户给可疑账户进行转账操作时，可以拨打目标用户的电话，触发人机对话。

又一示例性地，以语音消息形式的人机对话为例，当对话文本获取模块监测到用户大额转账并购买虚拟产品时，可以在用户终端界面弹出发送语音消息的对话框，触发人机对话。

在一些实施例中，人机对话可以包括一轮或多轮用户和机器人的对话。其中，一轮用户和机器人的对话至少包括一次机器人话术和一次用户话语。机器人话术是指机器人在人机对话中的发言。例如，机器人询问用户、回答用户和/或提醒用户。用户话语是指用户在人机对话中的发言。例如，用户回答机器人和/或询问机器人。

示例性地，以图2示例的人机对话为例，该人机对话由三轮用户和机器人的对话构成，其中，机器人话术“您好，请问是甲吗？”和用户话语“是的，你是谁？”为一轮对话(即第一轮对话)；机器人话术“我是A平台客服。请问您正在向乙的账户转账吗？”和用户话语“是的。”为一轮对话(即第二轮对话)；机器人话术“请问您认识乙本人吗？”和用户话语“我不认识。”为一轮对话(即第三轮对话)。

对话文本是文字形式的一轮或多轮人机对话。在一些实施例中，对话文本获取模块可以直接从文字消息获取对话文本。在一些实施例中，对话文本获取模块可以基于文字识别技术从图片消息获取对话文本。在一些实施例中，对话文本还可以基于自动语音识别(Automatic Speech Recognition，ASR)技术从语音信息或实时通话中获取对话文本。

在一些实施例中，对话文本包括当前用户话语。当前用户话语是最近一轮对话中的用户话语，或者指处理设备正在处理的一轮对话中的用户话语。如图3所示，当前用户话语为第三轮对话中的用户话语“我不认识。”。

在一些实施例中，对话文本还包括发生在当前用户话语前的用户历史话语和/或机器人话术。

发生在当前用户话语前的用户历史话语指最近一轮对话之前的任意一轮或多轮对话中的用户话语。在一些实施例中，对话文本获取模块可以指定最近一轮对话之前的全部对话中的用户话语为发生在当前用户话语前的用户历史话语。如图3所示，发生在当前用户话语前的用户历史话语包括第一轮对话中的用户话语“是的，你是谁？”和第二轮对话中的用户话语“是的。”。在一些实施例中，对话文本获取模块可以指定最近一轮对话之前的N轮对话中的用户话语为发生在当前用户话语前的用户历史话语。例如，对话文本获取模块可以指定最近一轮对话之前的一轮对话中的用户话语为发生在当前用户话语前的用户历史话语。如图3所示，发生在当前用户话语前的用户历史话语仅包括第二轮对话中的用户话语“是的。”。

发生在当前用户话语前的机器人话术是指最近一轮对话之前的任意一轮或多轮对话中的机器人话术。在一些实施例中，对话文本获取模块可以指定最近一轮对话之前的全部对话中的机器人话术为发生在当前用户话语前的机器人话术。继续以图3为例，发生在当前用户话语前的机器人话术包括第一轮对话中的机器人话术“您好，请问是甲吗？”、第二轮对话中的机器人话术“我是A平台客服。请问您正在向乙的账户转账吗？”和第三轮对话中的机器人话术“请问您认识乙本人吗？”。在一些实施例中，对话文本获取模块可以指定最近一轮对话之前的M轮对话中的机器人话术为发生在当前用户话语前的机器人话术。例如，对话文本获取模块可以指定最近一轮对话之前的两轮对话中的用户话语为发生在当前用户话语前的用户历史话语。继续以图3为例，发生在当前用户话语前的机器人话术仅包括第三轮对话中的机器人话术“请问您认识乙本人吗？”和第二轮对话中的机器人话术“我是A平台客服。请问您正在向乙的账户转账吗？”。

步骤220，基于对话文本确定用户的行为意图。

具体地，该步骤220可以由用户行为意图确定模块执行。

用户行为意图可以反映用户目标操作的意图。

在一些实施例中，用户行为意图的类型可以反映目标操作双方关系、目标操作标的物、目标操作账户和目标操作金额等。用户行为意图还是可以是其他能够反映目标操作目的、属性或内容的标识，以便为后续处理提供上下文环境。

例如，用户给可疑账户进行转账操作，则用户行为意图可以包括“目标操作账户：【可疑账户】”。又例如，用户大额转账并购买虚拟产品，则用户行为意图可以包括“目标操作标的物：【虚拟产品】”和“目标操作金额：【大额】”。

在一些实施例中，用户行为意图确定模块可以基于对话文本中的机器人话术和用户话语来确定用户行为意图。

可以理解，机器人话术可以包含对用户行为意图的询问。如图3所示，机器对人话术“我是A平台客服。请问您正在向乙的账户转账吗？”可以包含对“目标操作账户”类型的用户行为意图的询问，机器人话术“请问您认识乙本人吗？”可以包含对“目标操作双方关系”类型的用户行为意图的询问。

相应地，用户话语可以包含对用户行为意图询问的回答。继续以图3为例，用户话语“是的。”包含对“目标操作账户”的回答；用户话语“我不认识。”包含对“目标操作双方关系”的回答。因此，用户行为意图确定模块可以基于对话文本中包含的对用户行为意图的询问和回答来确定用户行为意图。

在一些实施例中，用户行为意图确定模块可以通过意图分类模型处理对话文本，获得用户的行为意图。

在一些实施例中，意图分类模型可以包括但不限于支持向量机模型、Logistic回归模型、朴素贝叶斯分类模型、高斯分布贝叶斯分类模型、决策树模型、随机森林模型、KNN分类模型、神经网络模型等。

在一些实施例中，神经网络模型可以是但不限于卷积神经网络(ConvolutionalNeural Network，CNN)模型、循环神经网络(Recurrent Neural Network，RNN)模型、长短期记忆网络(Long Short Term Memory Network，LSTM)模型和BERT模型等。

示例性地，以意图分类模型为BERT模型(为避免与本说明书其他部分涉及的BERT模型混淆，不妨称为第二BERT模型)为例，意图分类模型可以从对话文本中提取对用户行为意图的询问和回答；然后基于对用户行为意图的询问和回答获取对话文本特征向量；再通过多个编码器(Encoder)对对话文本特征向量进行编码，得到融合了对用户行为意图的询问和回答信息的行为意图特征向量；进一步地，将行为意图特征向量映射成数值或概率，再基于数值或概率得到用户的行为意图。例如，可以基于第二BERT模型构建多标签分类模型，多个标签类别与预先设置多个用户行为意图一一对应，第二BERT模型可以对对话文本进行处理，以确定该对话文本在不同用户行为意图类别下的概率，最后将概率值最大的用户行为意图确定为该用户的行为意图。关于第二BERT模型的结构可以参见后文中对第一BERT模型的详细说明，在此不再赘述。

如图3所示，用户行为意图确定模块可以基于对话文本“【我是A平台客服。请问您正在向乙的账户转账吗？】…【我不认识。】”确定用户的行为意图包括【可疑账户】和【陌生人】。

在一些实施例中，可以基于大量带有标识的训练样本训练意图分类模型。具体的，训练样本可以是历史对话文本，标识可以是基于历史对话文本人工标注的行为意图标签，每条训练样本可以有多个行为意图标签。可以将训练样本输入意图分类模型，以获得模型预测的分类结果。基于模型预测的分类结果与该训练样本的标识构建损失函数，并基于损失函数调整模型参数，以减小模型预测的分类结果与该训练样本的标识之间的差异。如此进行模型参数的多轮迭代更新，获得训练好的意图分类模型。

步骤230，基于行为意图以及对话文本确定当前用户话语对应的回复策略类型以及与目标操作相关的风险信息。

具体地，该步骤230可以由回复策略类型和风险信息确定模块执行。

回复策略类型可以反映机器人回复对应的用户话语的策略或目的。

在一些实施例中，回复策略类型可以包括继续询问用户行为意图。例如，【询问目标操作双方关系】、【询问目标操作标的物】、【询问目标操作账户】和【询问目标操作金额】等。

在一些实施例中，回复策略类型也可以包括回答用户问题。例如，【解释发起人机对话原因】、【自我介绍】、【结束对话】等。

在一些实施例中，回复策略类型和风险信息确定模块可以基于行为意图以及对话文本确定当前用户话语对应的回复策略类型。

示例性地，继续沿用前述示例，回复策略类型和风险信息确定模块可以基于意图分类模型输出的行为意图【可疑账户】、【陌生人】和对话文本“【我是A平台客服。请问您正在向乙的账户转账吗？】…【我不认识。】”，确定回复策略类型为【询问目标操作标的物】。

在一些实施例中，回复策略类型和风险信息确定模块可以先基于对话文本提取对话文本的第一特征信息。

对话文本的第一特征信息是表示对话文本字符特征的信息。在一些实施例中，对话文本的第一特征信息可以包括对话文本中字符的字符特征信息以及字符对应的对话方信息。

字符特征信息包含对话文本中每个字符的特征信息。例如，对话文本“【我是A平台客服。请问您正在向乙的账户转账吗？】…【我不认识。】”的字符特征信息可以包含【我】【是】【A】…【不】【认】【识】等每个字符的特征信息。

对话方信息包含对话文本中每个字符发起者的信息。例如，前述对话文本中的对话方信息可以包含信息：【我】【是】【A】…【转】【账】【吗】等字符的发起者为机器人，【我】【不】【认】【识】等字符的发起者为用户。

进一步地，回复策略类型和风险信息确定模块可以基于行为意图以及对话文本的第一特征信息确定当前用户话语对应的回复策略类型。

在一些实施例中，回复策略类型和风险信息确定模块可以通过神经网络模型处理行为意图以及对话文本的第一特征信息，获得回复策略类型。

在一些实施例中，神经网络模型可以基于行为意图以及对话文本的第一特征信息生成回复策略向量，再基于回复策略向量确定回复策略类型。

示例性地，回复策略类型和风险信息确定模块可以通过第一BERT模型处理行为意图以及对话文本的第一特征信息，获取回复策略类型。

在一些实施例中，字符特征信息和对话方信息可以以向量形式表征。

字符向量是表征对话文本的字符特征信息的向量，如token embedding。在一些实施例中，字符向量可以通过查询词表获得。在词表中，可以包含某一或多种语种(英文、中文、日文等)的字符集，以及每个字符的向量表示，不同字符的向量表示不同。如图4所示，对话文本中的第一轮机器人话术包括的x个字符【w_r1】【w_r2】…【w_rx】的特征信息可以分别用x个字符向量表示

表征。仅作为示例，字符【我】的特征信息可以用字符向量表示[2,3,3]表征。在实际应用场景中，向量表示的维度可以更高。

在一些实施例中，字符的字符向量表示还可以通过词嵌入模型获取。在一些实施例中，词嵌入模型可以包括但不限于：Word2vec模型、词频-逆向文件频率模型(TermFrequency–Inverse Document Frequency，TF-IDF)或SSWE-C(skip-gram basedcombined-sentiment word embedding)模型等。

对话方向量是表征对话文本的对话方信息的向量，如token type embedding。在一些实施例中，可以使用不同的对话方向量表征不同的对话方。如图4所示，第一轮对话中机器人话术的x个字符的对话方信息“机器人”都可以用对话方向量表示[0,0,1]表征，第一轮对话中用户话语的y个字符和第N轮对话中用户话语的z个字符的对话方信息“用户”都可以用对话方向量表示[0,0,0]表征。

在一些实施例中，对话文本的第一特征信息还可以包括字符在其所属分段(如句子)中的位置向量表示，如position embedding，以及字符所属分段(或句子)的分段向量表示，如segment embedding。其中，字符的位置向量表示反映该字符在其所属分段中的位置，如指示该字符是分段中的第1个字符，或第2个字符等。分段向量表示可以标识该字符所在的分段，其中不同的分段使用不同的向量表示区分。

在一些实施例中，在获取字符的各种向量表示之前，可以对对话文本做如下处理：在第一轮机器人话术之前添加[CLS]；在机器人话术和用户话语之间通过分隔符[SEP]分割，以区分机器人话术和用户话语。例如，对话文本“【我是A平台客服。请问您正在向乙的账户转账吗？】【是的】…【我不认识。】”处理后为“[CLS]我是A平台客服。请问您正在向乙的账户转账吗[SEP]是的[SEP]…[SEP]我不认识”。

在一些实施例中，对话文本的第一特征信息包括对话文本中各字符的各类向量表示对应相加的结果。各类向量表示可以同维，对应相加可以是各向量表示按位相加。例如，可以是各字符的字符向量表示与各字符的对话方向量表示对应相加的结果。还可以是，各字符的字符向量表示、对话方向量表示、位置向量表示和分段向量表示对应相加的结果。

在一些实施例中，行为意图也可以以向量形式表征。第二特征信息可以是表征行为意图的向量。可以采取与得到第一特征信息类似的手段得到行为意图的第二特征信息，第二特征信息可以至少包括行为意图中各字符的字符向量表示。在一些实施例中，为了便于统一处理，可以给行为意图中的各字符赋予统一的对话方向量表示，如[0,0,2]。在一些实施例中，还可以参照处理第一特征信息的手段，确定行为意图中各字符的位置向量表示和分段向量表示。此时，一种行为意图可以对应一个分段。获取第二特征信息的更多细节可以参见获取第一特征信息，在此不再赘述。

其中，行为意图中字符的对话方向量表示并不具有实际含义，且行为意图中各字符的对话方向量表示应该与机器人话术和用户话术的字符的对话方向量表示均不同。例如，用户意图中的【可】【疑】【账】【户】【陌】【生】【人】7个字符的对话方信息“用户意图”都可以用统一的对话方向量表示[0,0,2]表征。

第一BERT模型是基于Transformers的双向编码器，可以通过编码将多个文本特征信息融合为一个向量。

在一些实施例中，第一BERT模型可以通过多个编码器(Encoder)对第一特征信息和第二特征信息进行编码，在[CLS]对应的位置得到融合了对话文本信息和用户意图信息的回复策略向量。如图4所示，第一BERT模型可以对第一特征信息

和第二特征信息“【T_[SEP]】【T_a1】【T_a2】…【T_as】”进行编码，在[CLS]对应的位置获取答复策略向量【e_[CLS]】。

在一些实施例中，第一BERT模型可以基于该回复策略向量确定回复策略分别属于一个或多个预设类别中的每一个的概率值。进一步地，第一BERT模型可以将概率最大值对应的预设类型作为回复策略类型。

例如，第一BERT模型基于回复策略向量【e_[CLS]】确定回复策略属于【询问目标操作双方关系】、【询问目标操作标的物】、…【自我介绍】的概率值分别0、0.7、…0.1，然后将概率最大值0.7对应的【询问目标操作标的物】作为答复策略类型。

在一些实施例中，第一BERT模型也可以通过多个编码器(Encoder)对第一特征信息进行编码，得到融合了对话文本信息的回复策略向量。进一步地，第一BERT模型可以基于该回复策略向量确定回复策略分别属于一个或多个预设类别中的每一个的概率值。更进一步地，第一BERT模型可以将概率值排序前K位对应的预设类型作为候选回复策略类型，再基于用户意图从候选回复策略类型中筛选出最终的回复策略类型。

例如，第一BERT模型可以对第一特征信息

进行编码，在[CLS]对应的位置获取答复策略向量【e_[CLS]】；然后基于回复策略向量【e_[CLS]】确定回复策略属于【询问目标操作双方关系】、【询问目标操作标的物】、…【自我介绍】的概率值分别0.5、0.7、…0.1，然后将概率值排序前两位0.5和0.7对应的【询问目标操作双方关系】和【询问目标操作标的物】作为候选答复策略类型；进一步地，基于用户意图【陌生人】排除【询问目标操作双方关系】，筛选出【询问目标操作标的物】为最终的答复策略类型。

在一些实施例中，可以基于大量带有标识的训练样本训练第一BERT模型。具体的，将带有标识的训练样本输入第一BERT模型，通过训练更新第一BERT模型的参数。在一些实施例中，训练样本可以是历史对话文本和基于历史对话文本人工标注的行为意图，标识可以是基于历史对话文本人工标注的答复策略类型标签(一个训练样本可以包括多个答复策略类型标签)。在一些替代实施例中，基于历史对话文本人工标注的行为意图可以省略。关于第一BERT模型训练的更多细节可以参见意图分类模型的训练方式。

在一些可替代的实施例中，基于对话文本的第一特征信息，也可以确定当前用户话语对应的回复策略类型。关于基于对话文本的第一特征信息，确定回复策略类型的详细描述可以参见图3及其相关描述，在此不再赘述。

与目标操作相关的风险信息可以反映用户可能被欺诈的风险信息。在一些实施例中，风险信息可以包括风险类型和风险等级。

风险类型是指目标操作对应的欺诈风险的类别。

在一些实施例中，风险类型可以包括但不限于贷款风险、理财风险和冒充身份转账风险等。贷款风险指欺诈者以帮用户办理贷款的名义，骗取用户的手续费等。理财风险指欺诈者利用高额利息引诱用户购买理财产品，骗取用户的投资资本。冒充身份转账风险指欺诈者冒充用户好友或官方机构，诱导用户进行大额转账。例如，用户大额转账并购买虚拟产品时，则风险类型可能是理财风险。又例如，用户给陌生人的可疑账户进行转账操作，则风险类型可能是贷款风险和冒充身份转账风险。

在一些实施例中，风险类型还可以包括无风险。例如，当用户给好友转账小额金额时，则风险类型可能是无风险。

在一些实施例中，风险类型还可以包括待定。例如，当用户给可疑账户转账，用户的行为意图暂不明确，则风险类型可能是待定。

风险等级是指发生风险的可能性。

在一些实施例中，风险等级可以用发生风险的概率表示。例如，用户给陌生人的可疑账户进行转账操作，贷款风险的风险等级是0.7，冒充身份转账风险的风险等级是0.6。

在一些实施例中，风险等级还可以用与发生风险的概率对应的符号来表示。例如，风险等级可以用Ⅰ级、Ⅱ级、Ⅲ级、Ⅳ级和Ⅴ级表示，分别对应发生风险的概率0～0.2、0.2～0.4、0.4～0.6、0.6～0.8和0.8～1。

在一些实施例中，回复策略类型和风险信息确定模块可以通过风险识别模型处理行为意图以及对话文本，确定与目标操作相关的风险类别和/或风险等级。

在一些实施例中，风险识别模型的输入可以包括行为意图和对话文本。例如，风险识别模型的输入可以包括行为意图【可疑账户】【陌生人】和对话文本“【我是A平台客服。请问您正在向乙的账户转账吗？】…【我不认识。】”。

在一些实施例中，风险识别模型的输出可以是风险类型。例如，风险识别模型的输出可以是【无风险】。在一些实施例中，风险识别模型的输出可以是风险等级。例如，风险识别模型的输出可以是【I级】。在一些实施例中，风险识别模型的输出可以是至少一种风险类型和对应的风险等级。例如，风险识别模型的输出可以是【贷款风险-风险等级：0.7】和【冒充身份转账风险-风险等级:0.6】。

在一些实施例中，风险识别模型可以包括但不限于支持向量机模型、Logistic回归模型、朴素贝叶斯分类模型、高斯分布贝叶斯分类模型、决策树模型、随机森林模型、KNN分类模型、神经网络模型等。

示例性地，以风险识别模型为第三BERT模型为例，风险识别模型可以通过多个编码器(Encoder)对第一特征信息和第二特征信息进行编码，在[CLS]对应的位置得到融合了对话文本信息和用户意图信息的风险信息向量，再基于该风险信息向量确定风险信息分别属于一个或多个预设类别中的每一个的概率值。进一步地，第一BERT模型可以将概率最大值或满足阈值的预设类型作为回复策略类型。关于第三BERT模型的详细描述可以参见第一BERT模型的描述，在此不再赘述。

例如，风险识别模型基于风险信息向量确定风险类型属于【贷款风险】、【理财风险】…【冒充身份转账风险】的概率值分别0.7、0.1、…0.6，然后将概率值大于阈值0.5的【贷款风险】和【冒充身份转账风险】作为风险信息。

在一些实施例中，可以基于大量带有标识的训练样本单独训练风险识别模型。具体的，将带有标识的训练样本输入风险识别模型，通过训练更新风险识别模型的参数。在一些实施例中，训练样本可以是历史对话文本和基于历史对话文本人工标注的行为意图。在一些实施例中，标识可以是基于历史对话文本人工标注的风险信息标签。

步骤240，基于回复策略类型以及风险信息确定一条或多条候选机器人话术。

具体地，该步骤240可以由候选话术确定模块执行。

第一条件可以是目标操作导致用户账户不安全的条件。

在一些实施例中，第一条件可以根据风险信息的形式设置。例如，当风险信息只包括风险类型时，第一条件可以是风险类型不为【无风险】和【待定】。又例如，当风险信息包括风险等级时，第一条件可以是风险等级大于阈值。

风险应对话术库是风险应对话术的集合。风险应对话术是提醒用户目标操作会导致的用户账户不安全的话术。例如，风险应对话术库可以包括【你转账的账户为可疑账户，你可能正在遭受冒充身份转账风险，请通过其他方式确认账户身份】、【你购买的虚拟产品链接不安全，你可能正在遭受理财风险，请通过正规渠道购买理财产品】等。

在一些实施例中，当风险信息满足第一条件时，候选话术确定模块可以从风险应对话术库选择一条或多条候选机器人话术。

具体地，候选话术确定模块可以基于风险应对话术库中各风险信息和风险应对话术的映射关系，选择该风险信息对应的风险应对话术。

例如，风险信息为【贷款风险-风险等级：0.7】和【冒充身份转账风险-风险等级:0.6】，第一条件为风险等级大于0.5，则候选话术确定模块可以从风险应对话术库中选择和【贷款风险-风险等级：0.7】对应的风险应对话术【你转账的账户为可疑账户，你可能正在遭受贷款风险，请通过其他方式正规渠道办理贷款】、以及和【冒充身份转账风险-风险等级:0.6】对应的风险应对话术【你转账的账户为可疑账户，你可能正在遭受冒充身份转账风险，请通过其他方式确认账户身份】作为候选机器人话术。

在一些实施例中，候选话术确定模块也可以基于用户的行为意图和风险应对话术的映射关系，选择候选机器人话术。基于行为意图选择候选机器人话术的相关描述可以参见基于行为意图选择候选机器人话术，在此不再赘述。

对话应答话术库是对话应答话术的集合。对话应答话术是响应用户话语的话术。在一些实施例中，每种回复策略类型可以对应一个对话应答话术库。

如前所述，回复策略类型可以包括继续询问用户行为意图。例如，【询问目标操作标的物】、【询问目标操作金额】等。示例性地，【询问目标操作标的物】对应的对话应答话术库可以包括【请问您转账给该账户的目的是什么呢？】、【请问您转账购买什么商品呢？】等。

如前所述，回复策略类型还可以包括回答用户问题。例如，【解释发起人机对话原因】、【自我介绍】、【结束对话】等。示例性地，【结束对话】对应的对话应答话术库可以包括【抱歉打扰了，祝您生活愉快】、【该操作没有风险，请您继续操作】等。

在一些实施例中，当风险信息不满足第一条件时，候选话术确定模块可以从回复策略类型对应的对话应答话术库中选择一条或多条候选机器人话术。

在一些实施例中，候选话术确定模块可以将回复策略类型对应的对话应答话术库中所有对话应答话术作为候选机器人话术。

例如，风险信息为【无风险】，第一条件为风险类型不为【无风险】和【待定】，回复策略类型为【结束对话】，则候选话术确定模块可以将【结束对话】对应的对话应答话术库中全部的对话应答话术【抱歉打扰了，祝您生活愉快】、【该操作没有风险，请您继续操作】等作为候选机器人话术。

在一些实施例中，候选话术确定模块也可以基于用户的行为意图和对话应答话术的映射关系，选择对应的对话应答话术。例如，在【结束对话】对应的对话应答话术库中，存在用户的行为意图和对话应答话术的映射关系：“行为意图【熟人】【借款转账】——对话应答话术【抱歉打扰了，祝您生活愉快】”、“行为意图【陌生人】【购买家电】——对话应答话术【该操作没有风险，请您继续操作】”…，则候选话术确定模块可以基于对话文本的行为意图【陌生人】【购买家电】，从【结束对话】对应的对话应答话术库中选择【该操作没有风险，请您继续操作】作为候选机器人话术。

步骤260，对一条或多条候选机器人话术进行筛选，获得应答机器人话术。

具体地，该步骤可以由机器人话术获取模块执行。

在一些实施例中，机器人话术获取模块可以获取用户特征信息；将对话文本以及多条候选机器人话术中的每一条进行组合，得到多条组合文本；利用排序模型分别处理用户特征信息与多条组合文本中的每一条，得到多个排序权重；将排序权重最大的组合文本中的候选机器人话术作为应答机器人话术。

用户特征信息是指表征用户特征的相关信息。在一些实施例中，用户特征信息可以包括用户的年龄、性别和地域等。例如，用户A的用户特征信息可以包括：“年龄18、性别女、四川”，用户B的用户特征信息可以包括：“年龄60、性别男、北京”。在一些实施例中，机器人话术获取模块可以从用户从平台的注册信息中获取用户特征信息。

可以理解，用户特征信息可以帮助排序模型在排序时考虑候选机器人话术的表述更符合用户的特征。例如，候选机器人话术【小姐姐，您转账的目的是啥子喃？】和【先生，您的转账是为了什么呢？】中，前者更符合用户A的特征，后者更符合用户B的特征。

组合文本是对话文本分别和每条候选机器人话术的组合。例如，对话文本为“【我是A平台客服。请问您正在向乙的账户转账吗？】…【我不认识。】”，候选机器人话术包括：【小姐姐，您转账的目的是啥子喃？】、【先生，您的转账是为了什么呢？】、【小哥哥，请问您转账金额是多少呢？】，则组合文本包括：“组合文本甲【我是A平台客服。请问您正在向乙的账户转账吗？】…【我不认识。】【小姐姐，您转账的目的是啥子喃？】”、“组合文本乙【我是A平台客服。请问您正在向乙的账户转账吗？】…【我不认识。】【先生，您的转账是为了什么呢？】”和“组合文本丙【我是A平台客服。请问您正在向乙的账户转账吗？】…【我不认识。】【小哥哥，请问您转账金额是多少呢？】”。

排序权重是组合文本中候选机器人话术作为应答机器人话术的概率。可以理解，候选机器人话术作为应答机器人话术的概率越高，则排序权重越大。

在一些实施例中，排序模型的输入可以包括用户特征信息与每一条组合文本，输出可以是每一条组合文本中候选机器人话术对应的排序权重。

在一些实施例中，排序模型可以包括但不限于Text Rank模型、Logistic回归模型、朴素贝叶斯分类模型、高斯分布贝叶斯分类模型、决策树模型、随机森林模型、KNN分类模型、神经网络模型等。

例如，排序模型可以分别处理用户A的用户特征和组合文本甲，用户A的用户特征和组合文本乙，以及用户A的用户特征和组合文本丙，分别获取组合文本甲、组合文本乙和组合文本丙中的候选机器人话术【小姐姐，您转账的目的是啥子喃？】、【先生，您的转账是为了什么呢？】、【小哥哥，请问您转账金额是多少呢？】的排序权重为：0.6、0.3和0.1。

在一些可替代的实施例中，排序模型的输入也可以将用户特征信息替换为用户的行为意图或者在排序模型的输入中增加用户的行为意图。

进一步地，排序模型可以将排序权重最大的组合文本中的候选机器人话术作为应答机器人话术。例如，将组合文本甲中的候选机器人话术【小姐姐，您转账的目的是啥子喃？】作为应答机器人话术。

在一些实施例中，可以基于大量带有标识的训练样本单独训练排序模型。具体的，将带有标识的训练样本输入排序模型，通过训练更新排序模型的参数。在一些实施例中，训练样本可以是历史用户特征、历史对话文本和回应话术。在一些实施例中，标识可以是从人工客户话术中人工筛选的应答机器人话术，标签可以是真(1)或假(0)。示例性的，当训练样本中回应话术确实为其中历史对话文本的下文，则标识可以是真或1，当训练样本中回应话术不是其中历史对话文本的下文，如在其他对话中截取了一句话术作为回应话术，则该训练样本对应的标识可以是假或0。

步骤270，基于应答机器人话术回复当前用户话语。

具体地，该步骤可以由用户话语回复模块执行。

在一些实施例中，用户话语回复模块可以直接输出应答机器人话术的文本来回复当前用户话语。例如，书面信息形式的人机对话中，用户话语回复模块可以直接输出应答机器人话术的文本。

在一些实施例中，用户话语回复模块可以将应答机器人话术转换为语音，并播报。例如，语音信息和实时通话形式的人家对话中，用户话语回复模块可以先将应答机器人话术转换为语音，再向用户播报语音。

在一些实施例中，用户话语回复模块可以基于文本转语音(Text To Speech，TTS)技术将应答机器人话术转换为语音。

图3是根据本说明书一些实施例所示的一种用于人机对话的策略分类方法的示例性流程图。

步骤310，获取对话文本。

具体地，该步骤310可以由对话文本获取模块执行。

对话文本是文字形式的一轮或多轮人机对话。关于对话文本的详细描述可以参见步骤210，在此不再赘述。

在一些实施例中，对话文本还包括发生在当前用户话语前的用户历史话语和/或机器人话术。其中，发生在当前用户话语前的用户历史话语指最近一轮对话之前的任意一轮或多轮对话中的用户话语。发生在当前用户话语前的机器人话术是指最近一轮对话之前的任意一轮或多轮对话中的机器人话术。关于发生在当前用户话语前的用户历史话语和/或机器人话术的详细描述可以参见步骤210，在此不再赘述。

步骤320，基于对话文本提取对话文本的第一特征信息。

具体地，该步骤320可以由第一特征信息提取模块执行。

对话文本的第一特征信息是表示对话文本字符特征的信息。在一些实施例中，对话文本的第一特征信息可以包括对话文本中字符的字符特征信息以及字符对应的对话方信息。其中，字符特征信息是包含对话文本中每个字符语义特征的信息。对话方信息是包含对话文本中每个字符发起者的信息。

字符向量是表征对话文本的字符特征信息的向量。在一些实施例中，字符向量可以包括多个字符向量表示。其中，每个字符向量表示可以表征对话文本中的一个字符特征信息。

对话方向量是表征对话文本的对话方信息的向量。在一些实施例中，对话方向量可以包括多个对话向量表示。其中，每个对话向量表示可以表征对话文本中的一个字符的对话方信息。

在一些实施例中，在获取字符向量和对话方向量之前，可以对对话文本做如下处理：在第一轮机器人话术之前添加[CLS]；在机器人话术和用户话语之间通过分隔符[SEP]分割，以区分机器人话术和用户话语。

在一些实施例中，对话文本的第一特征信息包括对话文本中各字符的字符向量表示与各字符的对话方向量表示对应相加的结果。

关于提取第一特征信息的详细描述可以参见步骤220，在此不再赘述。

步骤330，基于对话文本的第一特征信息确定当前用户话语对应的回复策略类型。

具体地，该步骤可以由回复策略类型确定模块执行。

回复策略类型是机器人回复对应的用户话语的目的。

在一些实施例中，回复策略类型确定模块可以基于对话文本确定当前用户话语对应的回复策略类型。

示例性地，如图3所示，回复策略类型确定模块可以基于对话文本“【我是A平台客服。请问您正在向乙的账户转账吗？】…【我不认识。】”，确定回复策略类型为【询问目标操作标的物】。

在一些实施例中，回复策略类型确定模块可以通过神经网络模型处理对话文本的第一特征信息，获得回复策略类型。

在一些实施例中，神经网络模型可以基于对话文本的第一特征信息生成回复策略向量，再基于回复策略向量确定回复策略类型。

示例性地，第一BERT模型为例，在一些实施例中，第一BERT模型可以通过多个编码器(Encoder)对第一特征信息进行编码，在[CLS]对应的位置得到融合了对话文本信息的回复策略向量。

例如，第一BERT模型基于回复策略向量【e[CLS]】确定回复策略属于【询问目标操作双方关系】、【询问目标操作标的物】、…【自我介绍】的概率值分别0、0.7、…0.1，然后将概率最大值0.7对应的【询问目标操作标的物】作为答复策略类型。

本说明书实施例还提供一种计算机可读存储介质。所述存储介质存储计算机指令，当计算机读取存储介质中的计算机指令后，计算机实现前述的通过人机对话进行反欺诈干预的方法和用于人机对话的策略分类方法。

本说明书实施例可能带来的有益效果包括但不限于：(1)风险识别模型基于人机对话，可以判断用户是否存在被欺诈风险并识别出具体的风险类型，从而减少对无欺诈风险的目标操作的误判；(2)针对不同的风险信息，分别从风险应对话术库和对话应答话术库中选择候选机器人话术，使得应答机器人话术的精准度更高，从而提升用户体验；(3)在识别欺诈风险后，精准给出相应风险类型的应答机器人话术，可以有效劝阻用户，从而提高用户的欺诈风险防范意识；(4)第一BERT模型基于用户的行为意图以及对话文本的第一特征信息，可以确定用户话语对应的回复策略类型，其中第一特征信息还包括对话方信息，从而提高第一BERT模型获取当前用户话语对应的回复策略类型的效率及准确性；(5)基于历史对话文本训练意图分类模型、第一BERT模型、风险识别模型和排序模型，使得应答机器人话术可以有效引导用户说出可能的欺诈风险信息，同时减少配置机器人应答流程的运营负担。需要说明的是，不同实施例可能产生的有益效果不同，在不同的实施例里，可能产生的有益效果可以是以上任意一种或几种的组合，也可以是其他任何可能获得的有益效果。

上文已对基本概念做了描述，显然，对于本领域技术人员来说，上述详细披露仅仅作为示例，而并不构成对本说明书的限定。虽然此处并没有明确说明，本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议，所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。

同时，本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此，应强调并注意的是，本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外，本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外，本领域技术人员可以理解，本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述，包括任何新的和有用的工序、机器、产品或物质的组合，或对他们的任何新的和有用的改进。相应地，本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外，本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品，该产品包括计算机可读程序编码。

计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号，例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式，包括电磁形式、光形式等，或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质，该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播，包括无线电、电缆、光纤电缆、RF、或类似介质，或任何上述介质的组合。

本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写，包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等，常规程序化编程语言如C语言、Visual Basic、Fortran2003、Perl、COBOL2002、PHP、ABAP，动态编程语言如Python、Ruby和Groovy，或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下，远程计算机可以通过任何网络形式与用户计算机连接，比如局域网(LAN)或广域网(WAN)，或连接至外部计算机(例如通过因特网)，或在云计算环境中，或作为服务使用如软件即服务(SaaS)。

此外，除非权利要求中明确说明，本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用，并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例，但应当理解的是，该类细节仅起到说明的目的，附加的权利要求并不仅限于披露的实施例，相反，权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如，虽然以上所描述的系统组件可以通过硬件设备实现，但是也可以只通过软件的解决方案得以实现，如在现有的处理设备或移动设备上安装所描述的系统。

同理，应当注意的是，为了简化本说明书披露的表述，从而帮助对一个或多个发明实施例的理解，前文对本说明书实施例的描述中，有时会将多种特征归并至一个实施例、附图或对其的描述中。但是，这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上，实施例的特征要少于上述披露的单个实施例的全部特征。

一些实施例中使用了描述成分、属性数量的数字，应当理解的是，此类用于实施例描述的数字，在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明，“大约”、“近似”或“大体上”表明所述数字允许有±20％的变化。相应地，在一些实施例中，说明书和权利要求中使用的数值参数均为近似值，该近似值根据个别实施例所需特点可以发生改变。在一些实施例中，数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值，在具体实施例中，此类数值的设定在可行范围内尽可能精确。

针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料，如文章、书籍、说明书、出版物、文档等，特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外，对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是，如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方，以本说明书的描述、定义和/或术语的使用为准。

最后，应当理解的是，本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此，作为示例而非限制，本说明书实施例的替代配置可视为与本说明书的教导一致。相应地，本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims

1.一种通过人机对话进行反欺诈干预的方法，包括：

获取来自人机对话的对话文本，所述人机对话由用户的目标操作触发，所述对话文本包括当前用户话语；

基于所述对话文本确定用户的行为意图；

基于所述行为意图以及所述对话文本确定所述当前用户话语对应的回复策略类型以及与所述目标操作相关的风险信息；

基于所述回复策略类型以及所述风险信息确定一条或多条候选机器人话术；

对所述一条或多条候选机器人话术进行筛选，获得应答机器人话术；

基于所述应答机器人话术回复所述当前用户话语；

其中，基于所述行为意图以及所述对话文本确定所述当前用户话语对应的回复策略类型，进一步包括：

基于所述对话文本提取对话文本的第一特征信息，其中，所述对话文本的第一特征信息包括对话文本中字符的字符特征信息以及字符对应的对话方信息；

基于所述行为意图以及所述对话文本的第一特征信息确定所述当前用户话语对应的回复策略类型。

2.如权利要求1所述的方法，所述对话文本还包括发生在所述当前用户话语前的用户历史话语和/或机器人话术。

3.如权利要求1所述的方法，所述基于所述对话文本确定用户的行为意图，包括：

通过意图分类模型处理所述对话文本，获得用户的行为意图。

4.如权利要求1所述的方法，所述字符特征信息与所述对话方信息均以向量形式表征；所述对话文本的第一特征信息包括对话文本中各字符的字符向量表示与各字符的对话方向量表示对应相加的结果；

所述基于所述行为意图以及所述对话文本的第一特征信息确定所述当前用户话语对应的回复策略类型包括：

通过第一BERT模型处理所述行为意图以及所述对话文本的第一特征信息，获得所述回复策略类型。

5.如权利要求1所述的方法，基于所述行为意图以及所述对话文本确定与所述目标操作相关的风险信息，包括：

通过风险识别模型处理所述行为意图以及所述对话文本，确定与所述目标操作相关的风险类别和/或风险等级。

6.如权利要求1所述的方法，所述基于所述回复策略类型以及所述风险信息确定一条或多条候选机器人话术，包括：

当所述风险信息满足第一条件时，从风险应对话术库选择一条或多条候选机器人话术，否则从所述回复策略类型对应的对话应答话术库中选择一条或多条候选机器人话术。

7.如权利要求1所述的方法，所述对所述一条或多条候选机器人话术进行筛选，获得应答机器人话术，包括：

获取用户特征信息；

将所述对话文本以及所述多条候选机器人话术中的每一条进行组合，得到多条组合文本；

利用排序模型分别处理所述用户特征信息与所述多条组合文本中的每一条，得到多个排序权重；

将排序权重最大的组合文本中的候选机器人话术作为应答机器人话术。

8.如权利要求1所述的方法，所述人机对话通过语音通话形式进行，所述基于所述应答机器人话术回复所述当前用户话语，包括：

将所述应答机器人话术转换为语音，并播报。

9.一种通过人机对话进行反欺诈干预的系统，包括：

第一对话文本获取模块，用于获取来自人机对话的对话文本，所述人机对话由用户的目标操作触发，所述对话文本包括当前用户话语；

用户行为意图确定模块，用于基于所述对话文本确定用户的行为意图；

回复策略类型和风险信息确定模块，用于基于所述行为意图以及所述对话文本确定所述当前用户话语对应的回复策略类型以及与所述目标操作相关的风险信息；

候选话术确定模块，用于基于所述回复策略类型以及所述风险信息确定一条或多条候选机器人话术；

机器人话术获取模块，用于对所述一条或多条候选机器人话术进行筛选，获得应答机器人话术；

用户话语回复模块，用于基于所述应答机器人话术回复所述当前用户话语；

其中，回复策略类型和风险信息确定模块进一步用于：

10.一种用于人机对话的策略分类方法，包括：

获取对话文本，所述对话文本包括当前用户话语；

基于所述对话文本提取对话文本的第一特征信息，其中，所述对话文本的第一特征信息包括对话文本中字符的字符特征信息以及字符对应的对话方信息；所述字符对应的对话方信息包含所述对话文本中每个字符发起者的信息；

基于所述对话文本的第一特征信息确定所述当前用户话语对应的回复策略类型。

11.如权利要求10所述的方法，所述对话文本还包括发生在所述当前用户话语前的用户历史话语和/或机器人话术。

12.如权利要求10所述的方法，所述字符特征信息与所述对话方信息均以向量形式表征；所述对话文本的第一特征信息包括对话文本中各字符的字符向量表示与各字符的对话方向量表示对应相加的结果；

所述基于所述对话文本的第一特征信息确定所述当前用户话语对应的回复策略类型包括：

通过第一BERT模型处理所述对话文本的第一特征信息，获得所述回复策略类型。

13.一种用于人机对话的策略分类系统，包括：

第二对话文本获取模块，用于获取对话文本，所述对话文本包括当前用户话语；

第一特征信息提取模块，用于基于所述对话文本提取对话文本的第一特征信息，其中，所述对话文本的第一特征信息包括对话文本中字符的字符特征信息以及字符对应的对话方信息；所述字符对应的对话方信息包含所述对话文本中每个字符发起者的信息；

策略类型确定模块，用于基于所述对话文本的第一特征信息确定所述当前用户话语对应的回复策略类型。

14.一种通过人机对话进行反欺诈干预的方法，包括：

基于所述对话文本确定用户的行为意图；

基于所述应答机器人话术回复所述当前用户话语。

15.一种通过人机对话进行反欺诈干预的系统，包括：

用户行为意图确定模块，用于基于对话文本确定用户的行为意图；

回复策略类型和风险信息确定模块，用于基于所述行为意图以及所述对话文本确定所述当前用户话语对应的回复策略类型以及与目标操作相关的风险信息；

候选话术确定模块，用于基于回复策略类型以及风险信息确定一条或多条候选机器人话术；

机器人话术获取模块，用于对一条或多条候选机器人话术进行筛选，获得应答机器人话术；

用户话语回复模块，用于基于应答机器人话术回复当前用户话语。

16.一种计算机可读存储介质，其特征在于，所述存储介质存储计算机指令，当所述计算机指令被处理器执行时实现如权利要求1～8、10～12和14中任一项所述的方法。