CN117216618A - 基于ai模型的反欺诈识别方法、装置、设备及存储介质 - Google Patents

基于ai模型的反欺诈识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117216618A
CN117216618A CN202310262718.7A CN202310262718A CN117216618A CN 117216618 A CN117216618 A CN 117216618A CN 202310262718 A CN202310262718 A CN 202310262718A CN 117216618 A CN117216618 A CN 117216618A
Authority
CN
China
Prior art keywords
target user
user
sample
target
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310262718.7A
Other languages
English (en)
Inventor
吴秉哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202310262718.7A priority Critical patent/CN117216618A/zh
Publication of CN117216618A publication Critical patent/CN117216618A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于AI模型的反欺诈识别方法、装置、设备及存储介质,涉及AI技术领域。所述方法包括:通过AI分类模型对目标用户的用户信息进行特征提取,得到目标用户的特征表示;根据第一关系图和目标用户的特征表示,构建第二关系图;根据第二关系图,确定目标用户的校准温度;根据目标用户的校准温度,对AI分类模型得到的目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果,置信度用于表征目标用户属于欺诈识别类别的预测概率。通过上述方法,可以为每个目标用户提供一个对应的校准温度,使得每个目标用户都能取得较好的校准性能,保证置信度校准的准确性和可靠性,进而提高基于AI模型得到的欺诈识别结果的准确性。

Description

基于AI模型的反欺诈识别方法、装置、设备及存储介质
技术领域
本申请实施例涉及AI(Artificial Intelligence,人工智能)技术领域,特别涉及一种基于AI模型的反欺诈识别方法、装置、设备及存储介质。
背景技术
随着AI技术的发展,AI模型的应用也日益多样化。例如,在基于AI没写的反欺诈识别场景下,AI模型可以根据目标用户在多个欺诈识别类别下的置信度,对目标用户进行分类。
AI模型产生的目标用户在多个欺诈识别类别下的置信度可能是不准确的,需要对目标用户在多个欺诈识别类别下的置信度进行校准。相关技术中提供了一种基于AI模型的反欺诈识别方法,可以为AI模型配置一个校准温度,通过该校准温度,对AI模型产生的目标用户在多个欺诈识别类别下的置信度进行调整,基于调整后的置信度得到最终的欺诈识别结果。
然而,上述方法中,最终得到的欺诈识别结果准确性较差。
发明内容
本申请实施例提供了一种基于AI模型的反欺诈识别方法、装置、设备及存储介质。本申请实施例提供的技术方案如下。
根据本申请实施例的一个方面,提供了一种基于AI模型的反欺诈识别方法,所述方法包括:
通过AI分类模型对目标用户的用户信息进行特征提取,得到所述目标用户的特征表示;
根据第一关系图和所述目标用户的特征表示,构建第二关系图;其中,所述第一关系图用于表征至少两个样本用户之间的关联关系,所述第二关系图用于表征所述目标用户与所述第一关系图中包含的样本用户之间的关联关系;
根据所述第二关系图,确定所述目标用户的校准温度;其中,所述目标用户的校准温度,用于对所述AI分类模型针对所述目标用户的欺诈识别结果进行校准;
根据所述目标用户的校准温度,对所述AI分类模型得到的所述目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果,所述置信度用于表征所述目标用户属于所述欺诈识别类别的预测概率。
根据本申请实施例的一个方面,提供了一种基于AI模型的反欺诈识别装置,所述装置包括:
提取模块,用于通过AI分类模型提取目标用户的特征表示;
构建模块,用于根据第一关系图和所述目标用户的特征表示,构建第二关系图;其中,所述第一关系图用于表征至少两个样本用户之间的关联关系,所述第二关系图用于表征所述目标用户与所述第一关系图中包含的样本用户之间的关联关系;
确定模块,用于根据所述第二关系图,确定所述目标用户的校准温度;其中,所述目标用户的校准温度,用于对所述AI分类模型针对所述目标用户的欺诈识别结果进行校准;
校准模块,用于根据所述目标用户的校准温度,对所述AI分类模型得到的所述目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果,所述置信度用于表征所述目标用户属于所述欺诈识别类别的预测概率。
根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以实现上述基于AI模型的反欺诈识别方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现上述基于AI模型的反欺诈识别方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序由处理器加载并执行以实现上述基于AI模型的反欺诈识别方法。
本申请实施例提供的技术方案可以带来如下有益效果:
通过根据目标用户的特征表示,构建第二关系图,并根据第二关系图中表征的目标用户与样本用户之间的关联关系,确定目标用户的校准温度,根据目标用户的校准温度,对AI分类模型得到的目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果。通过上述方法,可以为每个目标用户提供一个对应的校准温度,使得每个目标用户都能取得较好的校准性能,保证置信度校准的准确性和可靠性,进而提高基于AI模型得到的欺诈识别结果的准确性。
附图说明
图1是本申请一个实施例提供的方案实施环境的示意图;
图2是本申请一个实施例提供的基于AI模型的反欺诈识别方法的示意图;
图3是本申请一个实施例提供的基于AI模型的反欺诈识别方法的流程图;
图4是本申请一个实施例提供的第一关系图的示意图;
图5是本申请另一个实施例提供的基于AI模型的反欺诈识别方法的流程图;
图6是本申请一个实施例提供的AI分类模型的示意图;
图7是本申请另一个实施例提供的基于AI模型的反欺诈识别方法的流程图;
图8是本申请一个实施例提供的图神经网络的示意图;
图9是本申请一个实施例提供的基于AI模型的反欺诈识别装置的框图;
图10是本申请另一个实施例提供的基于AI模型的反欺诈识别装置的框图;
图11是本申请一个实施例提供的计算机设备的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的机器学习技术,具体通过如下实施例进行说明。
请参考图1,其示出了本申请一个实施例提供的方案实施环境的示意图。该方案实施环境可以实现成为基于AI模型的反欺诈识别方法的系统架构。该方案实施环境可以包括:AI模型部署设备100和方法执行设备200。
在一些实施例中,AI模型为AI分类模型,AI分类模型用于根据目标用户的用户信息对目标用户进行AI推理和决策,得到目标用户的欺诈识别结果;目标用户的欺诈识别结果包括目标用户所属的欺诈识别类别,置信度用于表征目标用户属于欺诈识别类别的预测概率。对于第c个欺诈识别类别,目标用户在第c个欺诈识别类别下的置信度,是指目标用户属于第c个欺诈识别类别的预测概率。
AI分类模型可以是神经网络模型,例如CNN(Convolutional Neural Network,卷积神经网络)模型、RNN(Recurrent Neural Network,循环神经网络)模型等。AI模型部署设备100可以是终端设备101,也可以是服务器102,本申请对此不作限定。终端101可以是诸如PC(Personal Computer,个人计算机)、平板电脑、手机、医疗设备等电子设备。终端设备101中部署有AI分类模型,AI分类模型可以应用于风险敏感领域,例如AI分类模型应用于AI反欺诈识别领域。示例性地,AI分类模型用于对目标用户是否为疑似欺诈进行预测。在一些实施例中,除反欺诈识别外,本申请实施例还可以用于其他领域,例如本申请实施例可以用于医疗样本的分类。示例性地,AI分类模型为AI医疗模型。例如,该AI医疗模型用于医疗样本的分类,医疗样本是指包含了用户的诊疗记录的文本信息。
服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。服务器102可以是上述终端设备101的服务器,用于为终端设备101提供服务。
终端设备101和服务器102之间可以通过网络进行通信,如有线或无线网络。
方法执行设备200可以对AI分类模型产生的欺诈识别结果进行校准,保证AI模型的欺诈识别结果的准确性与可靠性。
方法执行设备200可以与AI模型部署设备100为同一台计算机设备,也可以与AI模型部署设备100为不同的计算机设备,本申请对此不作限定。所述计算机设备是指具备数据计算、处理和存储能力的电子设备。示例性地,AI模型部署设备100与方法执行设备200均为终端设备101。示例性地,AI模型部署设备100为服务器102中,方法执行设备200为不同于服务器102的其他服务器。
本申请实施例提供的基于AI模型的反欺诈识别方法,各步骤的执行主体可以是计算机设备,所述计算机设备是指具备数据计算、处理和存储能力的电子设备。以图1所示的方案实施环境为例,可以由终端执行该基于AI模型的反欺诈识别方法,也可以由服务器执行该基于AI模型的反欺诈识别方法,或者由终端和服务器交互配合执行该基于AI模型的反欺诈识别方法,本申请对此不作限定。为了便于说明,在下文方法实施例中,仅以基于AI模型的反欺诈识别方法的各步骤执行主体为计算机设备进行介绍说明。
AI模型得到的目标用户在多个欺诈识别类别下的置信度可能是不准确的,因此需要对AI模型的欺诈识别结果进行校准。相关技术中,提供了一种基于AI模型的反欺诈识别方法,可以为AI模型配置一个校准温度,通过校准温度,对AI模型得到的目标用户的欺诈识别结果进行校准。
上述方法对于不同的目标用户均采用相同的校准温度,然而,不同的目标用户通常会存在较大差异,使用相同的校准温度对不同的目标用户进行校准,AI模型产生的欺诈识别结果的准确率较差。
如图2所示,其示出了本申请一个实施例提供的一种基于AI模型的反欺诈识别方法的示意图。AI模型210包括输入层211、隐藏层212和输出层213。对于一个目标用户x,根据AI模型210的隐藏层212得到的目标用户x对应的特征表示h,以及各个样本用户Vi分别对应的特征表示hVi,可以构建第二关系图,第二关系图用于表征目标用户x与各个样本用户Vi之间的关联关系。图神经网络220可以根据第二关系图、AI模型210产生的目标用户x在各个欺诈识别类别下对应的置信度Px,以及各个样本用户Vi分别对应的真实类别的置信度PVi,确定目标用户x对应的校准温度T,根据校准温度T对AI模型210产生的目标用户x在各个欺诈识别类别下对应的置信度Px进行校准,得到目标用户x对应的校准后欺诈识别结果P。其中,TVi为样本用户Vi对应的校准温度。
本申请实施例提供的方法,可以为每个目标用户提供一个对应的校准温度,使得每个目标用户都能取得较好的校准性能,保证置信度校准的准确性和可靠性,进而提高基于AI模型得到的欺诈识别结果的准确性。
请参考图3,其示出了本申请一个实施例提供的基于AI模型的反欺诈识别方法的流程图。该方法可以包括如下步骤310~340中的至少一个步骤。
步骤310,通过AI分类模型对目标用户的用户信息进行特征提取,得到目标用户的特征表示。
目标用户是指待预测的样本用户。AI分类模型可以用于预测目标用户所属的欺诈识别类别。目标用户的用户信息是指与目标用户是否为疑似欺诈相关的信息,例如与目标用户的行为相关的信息。例如,上述反欺诈识别为识别目标用户是否疑似电信诈骗,目标用户的用户信息可以包括目标用户的通话频率、通话时长、号码标注信息(如诈骗电话、外卖快递)、号码归属地等。例如,上述反欺诈识别为识别目标用户是否疑似被电信诈骗,目标用户的用户信息可以包括目标用户接听的号码归属地、目标用户接听的号码认证信息、目标用户接听的号码的标注信息(如诈骗电话、外卖快递)等。
需要进行说明的是,本申请在收集用户的相关数据之前以及在收集用户的相关数据的过程中,都可以显示提示界面、弹窗或输出语音提示信息,该提示界面、弹窗或语音提示信息用于提示用户当前正在搜集其相关数据,使得本申请仅仅在获取到用户对该提示界面或者弹窗发出的确认操作后,才开始执行获取用户相关数据的相关步骤,否则(即未获取到用户对该提示界面或者弹窗发出的确认操作时),结束获取用户相关数据的相关步骤,即不获取用户的相关数据。换句话说,本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,上述目标用户的用户信息是在充分授权的情况下获取的。
目标用户的特征表示是指目标用户的隐藏层特征。在一些实施例中,目标用户的特征表示为一个特征向量。在一些实施例中,目标用户的特征表示是一个高维特征向量。目标用户的特征表示用于进一步产生针对目标用户的欺诈识别结果。示例性地,AI模型包括输入层、隐藏层和输出层。AI模型可以包括至少一个隐藏层。目标用户的特征表示可以是AI模型的任意一个隐藏层得到的特征向量,本申请对此不作限定。
目标用户的特征表示用于表征影响目标用户的欺诈识别结果的特征。
步骤320,根据第一关系图和目标用户的特征表示,构建第二关系图;其中,第一关系图用于表征至少两个样本用户之间的关联关系,第二关系图用于表征目标用户与第一关系图中包含的样本用户之间的关联关系。
第一关系图表征至少两个样本用户之间的关联关系的关联图。在一些实施例中,第一关系图可以是“节点-节点”形式的关联图。示例性地,如图4所示,图中一个圆圈表示一个节点,一个节点对应一个样本用户,圆圈之间的连线表示两个节点之间具有关联关系。例如节点410与节点420之间具有连线,表示节点410对应的样本用户,与节点420对应的样本用户之间具有关联关系。再例如,节点410与节点430之间不具有连线,表示节点410对应的样本用户,与节点430对应的样本用户之间不具有关联关系。
在一些实施例中,第一关系图是根据第一关系图中包含的各个样本用户分别对应的特征表示来构建的。样本用户的特征表示是采用AI分类模型提取得到的。样本用户的特征表示与目标用户的特征表示的形式相同。例如样本用户的特征表示与目标用户的特征表示均为高维特征向量。
在一些实施例中,AI模型中包括多个隐藏层,样本用户的特征表示与目标用户的特征表示为同一隐藏层得到的特征向量。例如,样本用户的特征表示与目标用户的特征表示均为第3层隐藏层得到的特征向量。
示例性地,可以根据两个样本用户分别对应的特征表示之间的相似度,来确定两个样本用户之间是否具有关联关系。
在一些实施例中,根据第一关系图和目标用户的特征表示,构建第二关系图,即为根据目标用户的特征表示,在第一关系图中添加目标用户对应的节点,以及该节点与第一关系图中包含的各个节点之间的关联关系,得到第二关系图。
示例性地,可以根据目标用户对应的特征表示,与各个样本用户分别对应的特征表示之间的相似度,确定目标用户与各个样本用户之间的关联关系,进而构建第二关系图。
在一些实施例中,若两个用户对应的特征表示之间的相似度超过相似度阈值,则认为两个用户之间具有关联关系。该两个样本可以是样本用户与样本用户,也可以是目标用户与样本用户,还可以是目标用户与目标用户,本申请对此不作限定。
对于上述相似度阈值的具体取值,本申请不作限定。示例性地,相似度阈值可以是根据经验设置的。例如,根据经验将相似度阈值设置为80%。示例性地,相似度阈值可以是根据AI分类模型的使用场景设置的。例如,场景一中将相似度阈值设置为80%,场景二中将相似度阈值设置为90%。
步骤330,根据第二关系图,确定目标用户的校准温度;其中,目标用户的校准温度,用于对AI分类模型针对目标用户的欺诈识别结果进行校准。
在一些实施例中,根据第二关系图中,目标用户与样本用户之间的关联关系,确定目标用户的校准温度。
在一些实施例中,根据目标用户对应的节点特征、第二关系图、第二关系图中包含的与目标用户具有关联关系的样本用户对应的节点特征,确定目标用户的校准温度。
目标用户对应的节点特征是指AI分类模型得到的目标用户对应的预测类别的置信度。目标用户对应的预测类别是指AI分类模型得到的目标用户的欺诈识别结果,该欺诈识别结果为未经过校准温度校准的欺诈识别结果。置信度用于表征目标用户属于欺诈识别类别的预测概率。对于第c个欺诈识别类别,目标用户在第c个欺诈识别类别下的置信度,是指目标用户属于第c个欺诈识别类别的预测概率。
样本用户对应的节点特征是指AI分类模型得到的样本用户对应的真实类别的置信度。样本用户的真实类别是指根据样本用户对应的标签确定的样本用户实际所属的欺诈识别类别。样本用户对应的标签用于表征样本用户的真实分类结果,该真实分类结果为样本用户的实际所属欺诈识别类别。
在一些实施例中,根据AI分类模型,确定目标用户对应的节点特征,目标用户对应的节点特征用于表示AI分类模型得到的目标用户对应的预测类别的置信度;根据AI分类模型和样本用户对应的标签,确定样本用户对应的节点特征;其中,样本用户对应的标签用于表征样本用户的真实分类结果,样本用户对应的节点特征用于表示AI分类模型得到的样本用户对应的真实类别的置信度;根据目标用户对应的节点特征、第二关系图中包含的各个样本用户分别对应的节点特征和第二关系图,确定目标用户的校准温度。
步骤340,根据目标用户的校准温度,对AI分类模型得到的目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果,置信度用于表征目标用户属于欺诈识别类别的预测概率。
在一些实施例中,欺诈识别类别可以包括两种,一种为目标用户为疑似欺诈,另一种为目标用户为非疑似欺诈。不同的场景中,欺诈识别类别的实际含义可能不同。例如,在识别目标用户是否为电信诈骗的场景下,疑似欺诈是指目标用户疑似为电信诈骗,非疑似欺诈是指目标用户非疑似电信诈骗。例如,在识别目标用户是否被电信诈骗的场景下,疑似欺诈是指目标用户疑似被电信诈骗,非疑似欺诈是指目标用户非疑似被电信诈骗。
在一些实施例中,欺诈识别类别可以包括三种或三种以上。每种欺诈识别类别对应一个欺诈识别等级。欺诈识别等级可以根据目标用户为潜在疑似欺诈的概率进行划分。示例性地,欺诈识别类别包括三种,分别对应高、中、低三个欺诈识别等级,其中高欺诈识别等级是指为疑似欺诈的概率超过60%的目标用户;中等级是指为疑似欺诈的概率超过30%,低于60%的目标用户;低等级是指为疑似欺诈的概率低于30%的目标用户。当然,欺诈识别类别也可以采用其他的划分方式进行划分,此处仅为示例性说明。
在一些实施例中,根据目标用户的校准温度,对AI分类模型得到的目标用户在多个欺诈识别类别下的置信度进行校准,得到目标用户在多个欺诈识别类别下的校准后置信度;根据目标用户在多个欺诈识别类别下的校准后置信度,得到校准后的欺诈识别结果。
在一些实施例中,将目标用户在多个欺诈识别类别下的校准后置信度中,置信度最高的欺诈识别类别,确定为校准后的欺诈识别结果。
在一些实施例中,AI分类模型根据目标用户对应的特征表示,确定目标用户在多个欺诈识别类别下的置信度。
在一些实施例中,通过AI分类模型的全连接层,获取目标用户的特征表示对应的特征映射结果;根据特征映射结果与目标用户的校准温度的比值,确定目标用户在多个欺诈识别类别下校准后的置信度,得到校准后的欺诈识别结果。
在一些实施例中,AI模型包括特征提取层和决策层,决策层包括全连接层与分类层(或称为分类器)。特征提取层用于提取目标用户的特征表示。全连接层用于获取目标用户的特征表示对应的特征映射结果。分类层用于根据特征映射结果与目标用户的校准温度的比值,确定目标用户在多个欺诈识别类别下校准后的置信度。
本申请实施例提供的技术方案,通过根据目标用户的特征表示,构建第二关系图,并根据第二关系图中表征的目标用户与样本用户之间的关联关系,确定目标用户的校准温度,根据目标用户的校准温度,对AI分类模型得到的目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果。通过上述方法,可以为每个目标用户提供一个对应的校准温度,使得每个目标用户都能取得较好的校准性能,保证置信度校准的准确性和可靠性,进而提高基于AI模型得到的欺诈识别结果的准确性。
请参考图5,其示出了本申请另一个实施例提供的基于AI模型的反欺诈识别方法的流程图。该方法可以包括如下步骤510~580中的至少一个步骤。
步骤510,通过AI分类模型对目标用户的用户信息进行调整提取,得到目标用户的特征表示。
在一些实施例中,上述AI分类模型为训练后的AI分类模型。
在一些实施例中,AI分类模型包括特征提取层,通过特征提取层,提取目标用户的特征表示。
在一些实施例中,通过如下公式提取目标用户的特征表示。
h=f(x;θ)
其中,h是指目标用户的特征表示,x是指目标用户,θ是指AI分类模型的参数。
步骤520,获取第一关系图。
在一些实施例中,第一关系图用于表征至少两个样本用户之间的关联关系。示例性地,如图4所示,图中一个圆圈代表一个节点,一个节点对应一个样本用户,节点之间的连线表示两个节点对应的样本用户之间具有关联关系。
在一些实施例中,通过样本用户的特征表示,构建第一关系图。
在一些实施例中,通过AI分类模型提取样本用户的特征表示。
在一些实施例中,根据样本用户的特征表示的相似度,确定样本用户之间的关联关系,进而构建第一关系图。
在一些实施例中,通过AI分类模型提取n个样本用户分别对应的特征表示,n为大于1的整数;对于n个样本用户中的第p个样本用户和第q个样本用户,计算第p个样本用户的特征表示和第q个样本用户的特征表示之间的相似度,得到第p个样本用户与第q个样本用户之间的相似度,p、q为小于或等于n的整数,p不等于q;若第p个样本用户与第q个样本用户之间的相似度大于第一阈值,则确定第p个样本用户与第q个样本用户之间存在关联关系;若第p个样本用户与第q个样本用户之间的相似度小于第一阈值,则确定第p个样本用户与第q个样本用户之间不存在关联关系;根据n个样本用户之间的关联关系,构建第一关系图。
在一些实施例中,AI分类模型包括特征提取层,通过特征提取层,提取目标用户的特征表示。
在一些实施例中,通过如下公式提取目标用户的特征表示。
hp=(xp;)
hq=(xq;)
其中,hp是指第p个样本用户的特征表示,hq是指第q个样本用户的特征表示,xp是指第p个样本用户,xq是指第q个样本用户,θ是指AI分类模型的参数。
在一些实施例中,第一阈值与上述实施例中提到的相似度阈值为同一阈值。
对于第一阈值的具体数值,本申请不作限定。可以是根据经验设置的,也可以是根据场景设置的。示例性地,样本区别度较小的场景,第一阈值的数值设置的较大,而样本区别度较大的场景,第一阈值的数值设置较小。
在一些实施例中,可以采用余弦相似度算法来计算第p个样本用户的特征表示和第q个样本用户的特征表示之间的相似度,也可以采用其他相似度算法来计算第p个样本用户的特征表示和第q个样本用户的特征表示之间的相似度,本申请对此不作限定。例如,可以采用欧几里得距离、皮尔森相关性、曼哈顿距离等算法来计算第p个样本用户的特征表示和第q个样本用户的特征表示之间的相似度。
在一些实施例中,采用余弦相似度算法来计算第p个样本用户的特征表示和第q个样本用户的特征表示之间的相似度。
示例性地,可以采用如下公式计算第p个样本用户的特征表示和第q个样本用户的特征表示之间的相似度:
sim(xp,xq)=hp·hq/hp||·||hq||
其中,hp是指第p个样本用户的特征表示,hq是指第q个样本用户的特征表示,xp是指第p个样本用户,xq是指第q个样本用户,||hp||表示hp的范数,||hq||表示hq的范数,sim(xp,xq)表示第p个样本用户的特征表示和第q个样本用户的特征表示之间的余弦相似度。
在一些实施例中,在第p个样本用户与第q个样本用户之间的相似度等于第一阈值的情况下,可以认为第p个样本用户与第q个样本用户之间具有关联关系,也可以认为第p个样本用户与第q个样本用户之间不具有关联关系,本申请对此不作限定。
示例性地,n=3,p=1,q=2,第一阈值为80%。通过AI分类模型提取3个样本用户分别对应的特征表示;对于3个样本用户中的第1个样本用户和第2个样本用户,计算第1个样本用户的特征表示和第2个样本用户的特征表示之间的相似度,得到第1个样本用户与第2个样本用户之间的相似度;若第1个样本用户与第2个样本用户之间的相似度大于80%,则确定第1个样本用户与第2个样本用户之间存在关联关系;若第1个样本用户与第2个样本用户之间的相似度小于80%,则确定第1个样本用户与第2个样本用户之间不存在关联关系;根据3个样本用户之间的关联关系,构建第一关系图。
例如,第1个样本用户与第2个样本用户之间的相似度为90%,第2个样本用户与第3个样本用户之间的相似度为75%,第1个样本用户与第3个样本用户之间的相似度为85%,则认为第1个样本用户与第2个样本用户之间具有关联关系,第1个样本用户与第3个样本用户之间具有关联关系,第2个样本用户与第3个样本用户之间不具有关联关系。
通过上述方法,构建第一关系图,使得第一关系图能够表征至少两个样本用户之间的关联关系,且采用与目标用户相同的计算方法,使得最终得到的校准温度,能够更好的用于对目标用户对应的置信度的校准。
步骤530,对于第一关系图中包含的第i个样本用户,计算目标用户对应的特征表示和第i个样本用户的特征表示之间的相似度,得到目标用户与第i个样本用户之间的相似度,i为正整数。
在一些实施例中,目标用户对应的特征表示和第i个样本用户的特征表示之间的相似度的计算方法,与上述第p个样本用户与第q个样本用户之间的相似度的计算方法相同,本申请在此不再赘述。
步骤540,根据目标用户与第一关系图中包含的各个样本用户之间的相似度,构建第二关系图。
在一些实施例中,若目标用户与第i个样本用户之间的相似度大于第一阈值,则确定目标用户与第i个样本用户之间存在关联关系;若目标用户与第i个样本用户之间的相似度小于第一阈值,则确定目标用户与第i个样本用户之间不存在关联关系;根据目标用户与第一关系图中包含的各个样本用户之间的关联关系,构建第二关系图。
示例性地,第一阈值为80%。若目标用户与第i个样本用户之间的相似度大于80%,则确定目标用户与第i个样本用户之间存在关联关系;若目标用户与第i个样本用户之间的相似度小于80%,则确定目标用户与第i个样本用户之间不存在关联关系;根据目标用户与第一关系图中包含的各个样本用户之间的关联关系,构建第二关系图。例如,目标用户与第i个样本用户之间的相似度为90%,则确定目标用户与第i个样本用户之间存在关联关系。再例如,目标用户与第i个样本用户之间的相似度为75%,则确定目标用户与第i个样本用户之间不存在关联关系。
通过上述方法,确定目标用户与各个样本用户之间的关联关系,得到目标用户与样本用户之间的多层次的关联关系,能够更好的用于后续校准温度的计算。
步骤550,根据AI分类模型,确定目标用户对应的节点特征,目标用户对应的节点特征用于表示AI分类模型得到的目标用户对应的预测类别的置信度。
在一些实施例中,根据AI分类模型,确定目标用户在各个欺诈识别类别下的置信度,根据目标用户在各个欺诈识别类别下的置信度,确定目标用户对应的预测类别的置信度。
在一些实施例中,AI分类模型包括特征提取层和决策层,通过特征提取层得到目标用户对应的特征表示,通过决策层得到目标用户对应的欺诈识别结果。
在一些实施例中,决策层包括全连接层和分类层。全连接层用于根据目标用户对应的特征表示,确定目标用户对应的特征映射结果(logits);分类层用于根据目标用户对应的特征映射结果(logits)确定目标用户对应的欺诈识别结果。
示例性地,如图6所示,AI分类模型600包括特征提取层610和决策层620,决策层620包括全连接层621和分类层622。
在一些实施例中,通过如下公式,确定目标用户对应的特征映射结果(logits)。
z=W·h
其中,z是指目标用户对应的特征映射结果(logits),W是指决策层参数矩阵,h是指目标用户对应的特征表示。
在一些实施例中,通过分类器确定目标用户对应的欺诈识别结果。对于分类器的种类,本申请不作限定。例如,可以选择Softmax分类器。
示例性地,通过如下公式确定目标用户对应的欺诈识别结果。
其中,pi是指目标用户在第i个欺诈识别类别下的置信度,C是指欺诈识别类别的数量,zi是指目标用户在第i个欺诈识别类别对应的特征映射结果(logits)。
在一些实施例中,目标用户的预测类别的置信度是指目标用户在各个欺诈识别类别下分别对应的置信度的最大值。示例性地,conf=max pi,i=1,2,…,C,其中conf是指目标用户的置信度,pi是指目标用户在第i个欺诈识别类别下的置信度,C是指欺诈识别类别的数量。
在一些实施例中,通过如下公式确定目标用户对应的节点特征:
ax=g(x;θ)[y]
其中,ax表示目标用户对应的节点特征,x表示目标用户,g(x;θ)表示目标用户在各个欺诈识别类别下的置信度,[y]表示目标用户对应的预测类别,θ表示AI模型的参数。
通过上述方法,采用AI分类模型处理得到的目标用户在各个欺诈识别类别下的置信度,确定目标用户对应的节点特征,考虑AI分类模型对目标用户的处理,使得得到的校准温度更加准确。
步骤560,根据AI分类模型和样本用户对应的标签,确定样本用户对应的节点特征;其中,样本用户对应的标签用于表征样本用户的真实分类结果,样本用户对应的节点特征用于表示AI分类模型得到的样本用户对应的真实类别的置信度。
在一些实施例中,根据AI分类模型确定样本用户在各个欺诈识别类别下的置信度,根据样本用户对应的标签,确定样本用户对应的节点特征。
在一些实施例中,根据AI分类模型确定的样本用户在各个欺诈识别类别下的置信度,为根据样本用户对应的校准温度校准后的置信度。
在一些实施例中,AI分类模型包括特征提取层和决策层,通过特征提取层得到目标用户对应的特征表示,通过决策层得到目标用户对应的欺诈识别结果。
在一些实施例中,决策层包括全连接层和分类层。全连接层用于根据目标用户对应的特征表示,确定样本用户对应的特征映射结果(logits);分类层用于根据样本用户对应的特征映射结果(logits)确定样本用户对应的欺诈识别结果。
在一些实施例中,通过如下公式,确定目标用户对应的特征映射结果(logits)。
z=W·h
其中,z是指样本用户对应的特征映射结果(logits),W是指决策层参数矩阵,h是指样本用户对应的特征表示。
在一些实施例中,通过分类器确定样本用户对应的欺诈识别结果。对于分类器的种类,本申请不作限定。例如,可以选择Softmax分类器。
示例性地,通过如下公式确定样本用户对应的欺诈识别结果。
其中,pi是指样本用户在第i个欺诈识别类别下的置信度,C是指欺诈识别类别的数量,zi是指样本用户在第i个欺诈识别类别对应的特征映射结果(logits)。
在一些实施例中,根据样本用户对应的校准温度对样本用户对应的欺诈识别结果进行校准,得到样本用户对应的校准后的欺诈识别结果。
在一些实施例中,根据样本用户对应的校准温度与样本用户对应的特征映射结果(logits)的比值,对样本用户对应的欺诈识别结果进行校准,得到样本用户对应的校准后的欺诈识别结果。
例如,通过如下公式,对样本用户对应的欺诈识别结果进行校准,得到样本用户对应的校准后的欺诈识别结果。
其中,pi是指样本用户在第i个欺诈识别类别下的校准后的置信度,T是指样本用户对应的校准温度,C是指欺诈识别类别的数量,zi是指样本用户在第i个欺诈识别类别对应的特征映射结果(logits)。此时,T的取值不能为0。
在一些实施例中,样本用户的真实类别的置信度是指样本用户在各个欺诈识别类别下分别对应的校准后的置信度的最大值。示例性地,conf=max pi,i=1,2,…,C,其中conf是指样本用户的真实类别的置信度,pi是指样本用户在第i个欺诈识别类别下的校准后的置信度,C是指欺诈识别类别的数量。
在一些实施例中,样本用户对应的标签指示的样本用户对应的真实分类结果,与样本用户的在各个欺诈识别类别下分别对应的校准后的置信度的最大值可以相同,也可以不同,本申请对此不作限定。
在一些实施例中,采用如下公式确定样本用户对应的节点特征:
ax=g(x;θ)[y]
其中,ax表示样本用户对应的节点特征,x表示样本用户,g(x;θ)表示样本用户在各个欺诈识别类别下的校准后的置信度,[y]表示样本用户对应的真实类别,θ表示AI模型的参数。
通过上述方法,采用样本用户的真实分类结果,确定样本用户对应的节点特征,避免AI分类模型的误差对后续校准温度的计算造成影响。
步骤570,根据目标用户对应的节点特征、第二关系图中包含的各个样本用户分别对应的节点特征和第二关系图,确定目标用户的校准温度。
在一些实施例中,根据目标用户对应的节点特征、第二关系图中包含的各个样本用户分别对应的节点特征和第二关系图,确定目标用户对应的隐层特征;其中,隐层特征用于表征目标用户与目标用户的邻居节点之间的关系,目标用户的邻居节点是指第二关系图中与目标用户具有关联关系的样本用户;根据目标用户对应的隐层特征,确定目标用户的校准温度。
通过上述方法,充分提取目标用户与第二关系图中包含的各个样本用户之间的关联关系,进而确定目标用户的校准温度,使得目标用户的校准温度更加准确。
步骤580,根据目标用户的校准温度,对AI分类模型得到的目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果,置信度用于表征目标用户属于欺诈识别类别的预测概率。
在一些实施例中,根据目标用户的校准温度与AI分类模型针对目标用户的特征映射结果(logits)的比值,对AI分类模型得到的目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果。
例如,通过如下公式,对AI分类模型得到的目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果。
其中,pi是指目标用户在第i个欺诈识别类别下的校准后的置信度,T是指目标用户的校准温度,C是指欺诈识别类别的数量,zi是指目标用户在第i个欺诈识别类别对应的特征映射结果(logits)。此时,T的取值不能为0。
本申请实施例提供的技术方案,通过第二关系图中包含的目标用户与样本用户之间的关联关系,以及目标用户对应的节点特征、样本用户对应的节点特征,确定目标用户的校准温度,通过校准温度对AI分类模型产生的欺诈识别结果进行校准,得到校准后的欺诈识别结果。根据目标用户与各个样本用户之间的关联关系。为每个目标用户赋予一个对应的校准温度,使得每个目标用户都能取得较好的校准性能,保证置信度校准的准确性和可靠性,进而提高基于AI模型得到的欺诈识别结果的准确性。
请参考图7,其示出了本申请一个实施例提供的校准温度确定方法的流程图。该方法可以包括如下步骤710~720中的至少一个步骤。
步骤710,根据目标用户对应的节点特征、第二关系图中包含的各个样本用户分别对应的节点特征和第二关系图,确定目标用户对应的隐层特征;其中,隐层特征用于表征目标用户与目标用户的邻居节点之间的关系,目标用户的邻居节点是指第二关系图中与目标用户具有关联关系的样本用户。
步骤720,根据目标用户对应的隐层特征,确定目标用户的校准温度。
在一些实施例中,根据第二关系图确定第二关系图中包含的与目标用户具有关联关系的样本用户,根据上述与目标用户具有关联关系的样本用户的节点特征,和目标用户对应的节点特征,确定目标用户对应的隐层特征。
在一些实施例中,根据目标用户对应的节点特征、第二关系图中包含的各个样本用户分别对应的节点特征和第二关系图,确定目标用户对应的第1阶隐层特征;根据第m-1阶隐层特征、第二关系图中包含的各个样本用户分别对应的节点特征和第二关系图,确定目标用户对应的第m阶隐层特征,m为大于1的整数。
在一些实施例中,将第二关系图中与目标用户具有关联关系的样本用户对应的节点称为目标用户对应的一阶邻居节点,将与目标用户对应的一阶邻居节点具有关联关系的节点称为二阶邻居节点,以此类推。
在一些实施例中,根据目标用户对应的节点特征和目标用户的一阶邻居节点对应的节点特征,确定目标用户对应的第1阶隐层特征;根据第m-1阶隐层特征、目标用户对应的m阶邻居节点,确定目标用户对应的第m阶隐层特征。
在一些实施例中,通过如下公式确定目标用户对应的第1阶隐层特征:
其中,表示第1阶隐层特征,xi表示目标用户,K(yi,yj,eij)表示消息聚合函数,yi表示目标用户对应的节点特征,yj表示样本用户对应的节点特征,N(xi)表示目标用户对应的一阶邻居节点的集合,eij表示目标用户与样本用户之间的关联关系。
在一些实施例中,将上述公式中目标用户对应的节点特征替换为目标用户对应的第m-1阶隐层特征,样本用户对应的节点特征替换为m-1阶邻居节点对应的节点特征,即可得到目标用户对应的第m阶隐层特征。
在一些实施例中,若目标用户与样本用户之间具有关联关系,则eij=1,若目标用户与样本用户之间不具有关联关系,则eij=0。
在一些实施例中,若目标用户与样本用户之间具有关联关系,则可以将消息聚合函数K(yi,yj,eij)设置为目标用户对应的节点特征与样本用户对应的节点特征的平均值。
通过上述方法,提取第二关系图中包含的样本用户与目标用户之间的多阶邻居关系,考虑不同样本用户对目标用户的影响,进而确定目标用户的校准温度,使得得到的校准温度更加准确。
在一些实施例中,目标用户的校准温度由图神经网络确定,通过图神经网络,根据第一关系图和第一关系图中包含的各个样本用户分别对应的节点特征,确定各个样本用户分别对应的校准温度;根据各个样本用户分别对应的校准温度和各个样本用户分别对应的标签,对图神经网络进行训练。
在一些实施例中,图神经网络包括M个图卷积层(GConv),第1层图卷积层用于根据目标用户对应的节点特征、第二关系图中包含的各个样本用户分别对应的节点特征和第二关系图,确定目标用户对应的第1阶隐层特征;第m层图卷积层用于根据第m-1阶隐层特征、第二关系图中包含的各个样本用户分别对应的节点特征和第二关系图,确定目标用户对应的第m阶隐层特征,m为大于1小于或等于M的整数,M为大于1的整数。
示例性地,如图8所示,图神经网络800包括M个图卷积层,其中第1层图卷积层810用于根据目标用户对应的节点特征、第二关系图中包含的各个样本用户分别对应的节点特征和第二关系图,确定目标用户对应的第1阶隐层特征第2层图卷积层820用于根据第1阶隐层特征/>第二关系图中包含的各个样本用户分别对应的节点特征和第二关系图,确定目标用户对应的第2阶隐层特征/>
在一些实施例中,当m的值达到第二阈值时,将第m阶隐层特征确定为目标用户的校准温度。
在一些实施例中,第二阈值是指图神经网络中包含的图卷积层的数量,例如图神经网络中包含M个图卷积层,则第二阈值为M。对于第二阈值的具体取值,本申请不作限定。
在一些实施例中,根据各个样本用户分别对应的校准温度和各个样本用户分别对应的标签,计算损失函数值;根据损失函数值,对图神经网络的参数进行调整。
在一些实施例中,通过如下公式计算损失函数值:
L(GV;)=∑-log((i;θ)/i)[yi]
其中,L(GV;)是指损失函数值,GV是指第一关系图,W是指图神经网络的参数,xi是指第i个样本用户,Ti是指第i个样本用户对应的校准温度,g(xi;)是指AI分类模型得到的第i个样本用户在各个欺诈识别类别下的置信度,[i]是指第i个样本用户对应的真实类别。
在一些实施例中,可以通过反向传播算法,根据损失函数值,对图神经网络的参数进行调整。
在一些实施例中,通过如下公式对图神经网络的参数进行调整:
其中,W表示图神经网络模型的参数,α表示梯度,L(GV;)表示损失函数值,GV表示第一关系图。
通过上述方法,对图神经网络的参数进行调整,使得图神经网络得到的校准温度更加准确。
本申请实施例提供的技术方案,通过图神经网络提取目标用户对应的多阶隐层特征,最后得到校准温度,能够联合多阶邻居节点对目标用户的影响,使得得到的校准温度更加准确。
上述实施例是以在反欺诈识别场景下的基于AI模型的分类方法进行说明的,本申请提供的技术方案还可以应用在其他场景中。基于AI模型的分类方法可以包括如下几个步骤中的至少一个步骤。
步骤1:通过AI分类模型提取测试样本的特征表示。
步骤2:根据样本关系图和测试样本的特征表示,构建测试样本图;其中,样本关系图用于表征至少两个验证样本之间的关联关系,测试样本图用于表征测试样本与样本关系图中包含的验证样本之间的关联关系。
步骤3:根据测试样本图,确定测试样本对应的校准温度;其中,测试样本的校准温度,用于对AI分类模型针对测试样本的分类结果进行校准。
步骤4:根据测试样本的校准温度,对AI分类模型得到的测试样本在多个类别下的置信度进行校准,得到校准后的分类结果,置信度用于表征测试样本属于类别的预测概率。
上述样本(测试样本和验证样本)可以是图像、文本、语音等形式的样本。示例性地,若应用在图像分类领域,测试样本可以是图像样本,AI分类模型可以用于预测图像样本中是否含有目标对象,例如预测图像样本中是否含有花朵。示例性地,若应用在文本分类领域,测试样本可以是文本样本,AI分类模型可以用于预测文本样本的主题是否符合要求,例如预测文本样本的主题是否为学校。示例性地,若应用在语音分类领域,测试样本可以是语音样本,AI分类模型可以用于预测语音样本的语种,例如预测语音样本的语种为中文还是英文。此处仅对AI分类模型的应用场景进行了示例性说明,对于AI分类模型的具体应用场景,本申请不作限定。
测试样本的特征表示可以根据测试样本的形式不同或者根据分类场景的不同,发生改变。示例性地,在图像分类领域,测试样本为图像样本,图像样本的特征表示可以用于表征图像样本的图像特征,例如图像样本的特征表示用于表征图像样本的色彩数量特征(例如用于区分图像是黑白图像还是彩色图像),再例如图像样本的特征表示用于表征图像样本中包含的对象的特征(例如图像样本中是否含有花朵)。示例性地,在语音分类领域,测试样本为语音样本,语音样本的特征表示可以用于表征语音样本的语音特征,例如语音样本的特征表示用于表征语音样本的语种特征(例如用于语音语种的分类,比如中文语音、英文语音等)。示例性地,在文本分类领域,测试样本为文本样本,文本样本的特征表示可以用于表示文本样本的文本特征,例如文本样本的特征表示可以用于表征文本样本的语义特征(例如,用于文本主题的分类,比如文本的主题是否为学校)。
除上述反欺诈识别场景外,本申请实施例提供的技术方案,还可以用于其他场景中。以下对本申请实施例提供的技术方案可能的应用场景进行示例性说明。
在一些实施例中,AI分类模型可以用于根据目标帐户的帐户信息,对目标帐户进行分类,得到目标帐户的分类结果。
目标帐户的帐户信息可以根据分类场景的不同进行设置。例如,兴趣推荐模型中,推荐内容为游戏的情况下,目标帐户的帐户信息可以包括目标帐户关联的其他游戏帐户的种类、目标帐户在各个游戏下的平均时长等;推荐内容为商品的情况下,目标帐户的帐户信息可以包括目标帐户浏览的商品种类、目标帐户的历史购物情况、目标帐户设置的商品筛选条件等。
示例性地,AI分类模型为兴趣推荐模型,兴趣推荐模型可以根据目标帐户的信息,对目标帐户进行分类,得到目标帐户的兴趣分类结果。例如,将目标帐户划分为感兴趣帐户、不感兴趣帐户等。本申请实施例提供的基于AI模型的分类方法,可以在兴趣推荐模型的基础上,对兴趣推荐模型产生的目标帐户在多个兴趣类别下的置信度进行校准,得到校准后的分类结果,使得兴趣推荐模型得到的分类结果的准确度更高。
在一些实施例中,AI分类模型可以用于根据医疗样本的样本信息,对医疗样本进行分类,得到医疗样本的分类结果。医疗样本是指包含了用户的诊疗记录的文本信息。
示例性地,AI分类模型为医疗模型,可以用于医疗样本的分类。医疗模型可以根据医疗样本的信息,对医疗样本进行分类,得到医疗样本的分类结果。例如,将医疗样本划分为科室1医疗样本、科室2医疗样本等。本申请实施例提供的基于AI模型的分类方法,可以在医疗模型的基础上,对医疗模型产生的医疗样本在多个类别下的置信度进行校准,得到校准后的分类结果,使得医疗模型得到的分类结果的准确度更高。
需要说明的是,上述应用场景仅为示例性说明,本申请实施例提供的技术方案可以应用但不限于下述形式的样本分类模型中:文本、语音、图像。以图像形式样本对应的AI分类模型为例,本申请实施例提供的技术方案也可以应用于针对其他图像的分类方法中,例如自动驾驶领域根据采集的车辆行驶图像对车辆行驶状态进行分类(例如,直行、左拐、右拐等),标签识别领域对图像标签进行分类(例如,条形码、二维码等)。当然,本申请实施例提供的技术方案也可以应用于文本的分类方法中和语音的分类方法中。示例性地,本申请方案可以应用于语义识别领域。例如,根据文章内容对文本的创作形式进行分类(例如,散文、小说、诗歌等);再例如,根据文章内容对文章的主题进行分类(例如,文章主题为工作、学校等)。示例性地,本申请还可以应用于音频分离技术领域。例如,将带伴奏的歌曲音频分离为人声音频与伴奏音频;再例如,将音频分类为带噪音的音频与不带噪音的音频。本申请实施例提供的技术方案并不局限于上述应用场景,任何基于AI分类模型对样本进行分类的场景,都可适用于本申请方案。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图9,其示出了本申请一个实施例提供的基于AI模型的反欺诈识别装置的框图。该装置具有实现上述方法示例的功能,所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该装置可以是上文介绍的计算机设备,也可以设置在计算机设备中。如图9所示,该装置900包括:提取模块910、构建模块920、确定模块930和校准模块940。
提取模块910,用于通过AI分类模型对目标用户的用户信息进行特征提取,得到所述目标用户的特征表示。
构建模块920,用于根据第一关系图和所述目标用户的特征表示,构建第二关系图;其中,所述第一关系图用于表征至少两个样本用户之间的关联关系,所述第二关系图用于表征所述目标用户与所述第一关系图中包含的样本用户之间的关联关系。
确定模块930,用于根据所述第二关系图,确定所述目标用户的校准温度;其中,所述目标用户的校准温度,用于对所述AI分类模型针对所述目标用户的欺诈识别结果进行校准。
校准模块940,用于根据所述目标用户的校准温度,对所述AI分类模型得到的所述目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果,所述置信度用于表征所述目标用户属于所述欺诈识别类别的预测概率。
在一些实施例中,所述构建模块920,用于获取所述第一关系图;对于所述第一关系图中包含的第i个样本用户,计算所述目标用户对应的特征表示和所述第i个样本用户的特征表示之间的相似度,得到所述目标用户与所述第i个样本用户之间的相似度,i为正整数;根据所述目标用户与所述第一关系图中包含的各个样本用户之间的相似度,构建所述第二关系图。
在一些实施例中,所述构建模块920,用于若所述目标用户与所述第i个样本用户之间的相似度大于第一阈值,则确定所述目标用户与所述第i个样本用户之间存在关联关系;若所述目标用户与所述第i个样本用户之间的相似度小于所述第一阈值,则确定所述目标用户与所述第i个样本用户之间不存在关联关系;根据所述目标用户与所述第一关系图中包含的各个样本用户之间的关联关系,构建所述第二关系图。
在一些实施例中,所述构建模块920,用于通过所述AI分类模型提取n个样本用户分别对应的特征表示,n为大于1的整数;对于所述n个样本用户中的第p个样本用户和第q个样本用户,计算所述第p个样本用户的特征表示和所述第q个样本用户的特征表示之间的相似度,得到所述第p个样本用户与所述第q个样本用户之间的相似度,p、q为小于或等于n的整数,p不等于q;若所述第p个样本用户与所述第q个样本用户之间的相似度大于第一阈值,则确定所述第p个样本用户与所述第q个样本用户之间存在关联关系;若所述第p个样本用户与所述第q个样本用户之间的相似度小于所述第一阈值,则确定所述第p个样本用户与所述第q个样本用户之间不存在关联关系;根据所述n个样本用户之间的关联关系,构建所述第一关系图。
在一些实施例中,所述确定模块930,用于根据所述AI分类模型,确定所述目标用户对应的节点特征,所述目标用户对应的节点特征用于表示所述AI分类模型得到的所述目标用户对应的预测类别的置信度;根据所述AI分类模型和所述样本用户对应的标签,确定所述样本用户对应的节点特征;其中,所述样本用户对应的标签用于表征所述样本用户的真实分类结果,所述样本用户对应的节点特征用于表示所述AI分类模型得到的所述样本用户对应的真实类别的置信度;根据所述目标用户对应的节点特征、所述第二关系图中包含的各个样本用户分别对应的节点特征和所述第二关系图,确定所述目标用户的校准温度。
在一些实施例中,所述确定模块930,用于根据所述目标用户对应的节点特征、所述第二关系图中包含的各个样本用户分别对应的节点特征和所述第二关系图,确定所述目标用户对应的隐层特征;其中,所述隐层特征用于表征所述目标用户与所述目标用户的邻居节点之间的关系,所述目标用户的邻居节点是指所述第二关系图中与所述目标用户具有关联关系的所述样本用户;根据所述目标用户对应的隐层特征,确定所述目标用户的校准温度。
在一些实施例中,所述确定模块930,用于根据所述目标用户对应的节点特征、所述第二关系图中包含的各个样本用户分别对应的节点特征和所述第二关系图,确定所述目标用户对应的第1阶隐层特征;根据第m-1阶隐层特征、所述第二关系图中包含的各个样本用户分别对应的节点特征和所述第二关系图,确定所述目标用户对应的第m阶隐层特征,m为大于1的整数。
在一些实施例中,所述确定模块930,用于当m的值达到第二阈值时,将所述第m阶隐层特征确定为所述目标用户的校准温度。
在一些实施例中,所述目标用户的校准温度由图神经网络确定,如图10所示,所述装置900还包括:训练模块950。
所述训练模块950,用于通过所述图神经网络,根据所述第一关系图和所述第一关系图中包含的各个样本用户分别对应的节点特征,确定各个所述样本用户分别对应的校准温度;根据各个所述样本用户分别对应的校准温度和各个所述样本用户分别对应的标签,对所述图神经网络进行训练。
在一些实施例中,所述训练模块950,用于根据各个所述样本用户分别对应的校准温度和各个所述样本用户分别对应的标签,计算损失函数值;根据所述损失函数值,对所述图神经网络的参数进行调整。
在一些实施例中,所述校准模块940,用于通过所述AI分类模型的全连接层,获取所述目标用户的特征表示对应的特征映射结果;根据所述特征映射结果与所述目标用户的校准温度的比值,确定所述目标用户在所述多个欺诈识别类别下校准后的置信度,得到所述校准后的欺诈识别结果。
在一些实施例中,所述AI分类模型还用于根据目标帐户的信息,对所述目标帐户进行分类,得到所述目标帐户的分类结果;或者,所述AI分类模型还用于根据医疗样本,对所述医疗样本进行分类,得到所述医疗样本的分类结果。
本申请实施例提供的技术方案,通过根据目标用户的特征表示,构建第二关系图,并根据第二关系图中表征的目标用户与样本用户之间的关联关系,确定目标用户的校准温度,根据目标用户的校准温度,对AI分类模型得到的目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果。通过上述方法,可以为每个目标用户提供一个对应的校准温度,使得每个目标用户都能取得较好的校准性能,保证置信度校准的准确性和可靠性,进而提高基于AI模型得到的欺诈识别结果的准确性。
需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各个功能模块的划分进行举例说明,实际应用中,可以根据实际需要而将上述功能分配由不同的功能模块完成,即将设备的内容结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
请参考图11,其示出了本申请一个实施例提供的终端设备的结构示意图。该终端设备可以是任何具备数据计算、处理和存储功能的电子设备。该终端设备可用于实施上述实施例中提供的基于AI模型的反欺诈识别方法。具体来讲:
该终端设备1100包括中央处理单元(如CPU(Central Processing Unit,中央处理器)、GPU(Graphics Processing Unit,图形处理器)和FPGA(Field Programmable GateArray,现场可编程逻辑门阵列)等)1101、包括RAM(Random-Access Memory,随机存储器)1102和ROM(Read-Only Memory,只读存储器)1103的系统存储器1104,以及连接系统存储器1104和中央处理单元1101的系统总线1105。该终端设备1100还包括帮助服务器内的各个器件之间传输信息的基本输入/输出系统(Input Output System,I/O系统)1106,和用于存储操作系统1113、应用程序1114和其他程序模块1115的大容量存储设备1107。
在一些实施例中,该基本输入/输出系统1106包括有用于显示信息的显示器1108和用于用户输入信息的诸如鼠标、键盘之类的输入设备1109。其中,该显示器1108和输入设备1109都通过连接到系统总线1105的输入输出控制器1110连接到中央处理单元1101。该基本输入/输出系统1106还可以包括输入输出控制器1110以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器1110还提供输出到显示屏、打印机或其他类型的输出设备。
该大容量存储设备1107通过连接到系统总线1105的大容量存储控制器(未示出)连接到中央处理单元1101。该大容量存储设备1107及其相关联的计算机可读介质为终端设备1100提供非易失性存储。也就是说,该大容量存储设备1107可以包括诸如硬盘或者CD-ROM(Compact Disc Read-Only Memory,只读光盘)驱动器之类的计算机可读介质(未示出)。
不失一般性,该计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦写可编程只读存储器)、闪存或其他固态存储技术,CD-ROM、DVD(Digital Video Disc,高密度数字视频光盘)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知该计算机存储介质不局限于上述几种。上述的系统存储器1104和大容量存储设备1107可以统称为存储器。
根据本申请实施例,该终端设备1100还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即终端设备1100可以通过连接在该系统总线1105上的网络接口单元1111连接到网络1112,或者说,也可以使用网络接口单元1111来连接到其他类型的网络或远程计算机系统(未示出)。
所述存储器还包括计算机程序,该计算机程序存储于存储器中,且经配置以由一个或者一个以上处理器执行,以实现上述基于AI模型的反欺诈识别方法。
在示例性实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有计算机程序、所述计算机程序在被终端设备的处理器执行时实现上述基于AI模型的反欺诈识别方法。
可选地,该计算机可读存储介质可以包括:ROM(Read-Only Memory,只读存储器)、RAM(Random-Access Memory,随机存储器)、SSD(Solid State Drives,固态硬盘)或光盘等。其中,随机存取记忆体可以包括ReRAM(Resistance Random Access Memory,电阻式随机存取记忆体)和DRAM(Dynamic Random Access Memory,动态随机存取存储器)。
在示例性实施例中,还提供了一种计算机程序产品,该计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。终端设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该终端设备执行上述基于AI模型的反欺诈识别方法。
需要进行说明的是,本申请在收集用户的相关数据之前以及在收集用户的相关数据的过程中,都可以显示提示界面、弹窗或输出语音提示信息,该提示界面、弹窗或语音提示信息用于提示用户当前正在搜集其相关数据,使得本申请仅仅在获取到用户对该提示界面或者弹窗发出的确认操作后,才开始执行获取用户相关数据的相关步骤,否则(即未获取到用户对该提示界面或者弹窗发出的确认操作时),结束获取用户相关数据的相关步骤,即不获取用户的相关数据。换句话说,本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本申请中涉及到的目标用户的用户信息、目标帐户的帐户信息、医疗样本(用户的诊疗记录)等都是在充分授权的情况下获取的。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种基于人工智能AI模型的反欺诈识别方法,其特征在于,所述方法包括:
通过AI分类模型对目标用户的用户信息进行特征提取,得到所述目标用户的特征表示;
根据第一关系图和所述目标用户的特征表示,构建第二关系图;其中,所述第一关系图用于表征至少两个样本用户之间的关联关系,所述第二关系图用于表征所述目标用户与所述第一关系图中包含的样本用户之间的关联关系;
根据所述第二关系图,确定所述目标用户的校准温度;其中,所述目标用户的校准温度用于对所述AI分类模型针对所述目标用户的欺诈识别结果进行校准;
根据所述目标用户的校准温度,对所述AI分类模型得到的所述目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果,所述置信度用于表征所述目标用户属于所述欺诈识别类别的预测概率。
2.根据权利要求1所述的方法,其特征在于,所述根据第一关系图和所述目标用户的特征表示,构建第二关系图,包括:
获取所述第一关系图;
对于所述第一关系图中包含的第i个样本用户,计算所述目标用户对应的特征表示和所述第i个样本用户的特征表示之间的相似度,得到所述目标用户与所述第i个样本用户之间的相似度,i为正整数;
根据所述目标用户与所述第一关系图中包含的各个样本用户之间的相似度,构建所述第二关系图。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标用户与所述第一关系图中包含的各个样本用户之间的相似度,构建所述第二关系图,包括:
若所述目标用户与所述第i个样本用户之间的相似度大于第一阈值,则确定所述目标用户与所述第i个样本用户之间存在关联关系;
若所述目标用户与所述第i个样本用户之间的相似度小于所述第一阈值,则确定所述目标用户与所述第i个样本用户之间不存在关联关系;
根据所述目标用户与所述第一关系图中包含的各个样本用户之间的关联关系,构建所述第二关系图。
4.根据权利要求2所述的方法,其特征在于,所述获取所述第一关系图,包括:
通过所述AI分类模型提取n个样本用户分别对应的特征表示,n为大于1的整数;
对于所述n个样本用户中的第p个样本用户和第q个样本用户,计算所述第p个样本用户的特征表示和所述第q个样本用户的特征表示之间的相似度,得到所述第p个样本用户与所述第q个样本用户之间的相似度,p、q为小于或等于n的整数,p不等于q;
若所述第p个样本用户与所述第q个样本用户之间的相似度大于第一阈值,则确定所述第p个样本用户与所述第q个样本用户之间存在关联关系;
若所述第p个样本用户与所述第q个样本用户之间的相似度小于所述第一阈值,则确定所述第p个样本用户与所述第q个样本用户之间不存在关联关系;
根据所述n个样本用户之间的关联关系,构建所述第一关系图。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第二关系图,确定所述目标用户的校准温度,包括:
根据所述AI分类模型,确定所述目标用户对应的节点特征,所述目标用户对应的节点特征用于表示所述AI分类模型得到的所述目标用户对应的预测类别的置信度;
根据所述AI分类模型和所述样本用户对应的标签,确定所述样本用户对应的节点特征;其中,所述样本用户对应的标签用于表征所述样本用户的真实分类结果,所述样本用户对应的节点特征用于表示所述AI分类模型得到的所述样本用户对应的真实类别的置信度;
根据所述目标用户对应的节点特征、所述第二关系图中包含的各个样本用户分别对应的节点特征和所述第二关系图,确定所述目标用户的校准温度。
6.根据权利要求5所述的方法,其特征在于,所述根据所述目标用户对应的节点特征、所述第二关系图中包含的各个样本用户分别对应的节点特征和所述第二关系图,确定所述目标用户的校准温度,包括:
根据所述目标用户对应的节点特征、所述第二关系图中包含的各个样本用户分别对应的节点特征和所述第二关系图,确定所述目标用户对应的隐层特征;其中,所述隐层特征用于表征所述目标用户与所述目标用户的邻居节点之间的关系,所述目标用户的邻居节点是指所述第二关系图中与所述目标用户具有关联关系的所述样本用户;
根据所述目标用户对应的隐层特征,确定所述目标用户的校准温度。
7.根据权利要求6所述的方法,其特征在于,所述根据所述目标用户对应的节点特征、所述第二关系图中包含的各个样本用户分别对应的节点特征和所述第二关系图,确定所述目标用户对应的隐层特征,包括:
根据所述目标用户对应的节点特征、所述第二关系图中包含的各个样本用户分别对应的节点特征和所述第二关系图,确定所述目标用户对应的第1阶隐层特征;
根据第m-1阶隐层特征、所述第二关系图中包含的各个样本用户分别对应的节点特征和所述第二关系图,确定所述目标用户对应的第m阶隐层特征,m为大于1的整数。
8.根据权利要求7所述的方法,其特征在于,所述根据所述目标用户对应的隐层特征,确定所述目标用户的校准温度,包括:
当m的值达到第二阈值时,将所述第m阶隐层特征确定为所述目标用户的校准温度。
9.根据权利要求1所述的方法,其特征在于,所述目标用户的校准温度由图神经网络确定,所述方法还包括:
通过所述图神经网络,根据所述第一关系图和所述第一关系图中包含的各个样本用户分别对应的节点特征,确定各个所述样本用户分别对应的校准温度;
根据各个所述样本用户分别对应的校准温度和各个所述样本用户分别对应的标签,对所述图神经网络进行训练。
10.根据权利要求9所述的方法,其特征在于,所述根据各个所述样本用户分别对应的校准温度和各个所述样本用户分别对应的标签,对所述图神经网络进行训练,包括:
根据各个所述样本用户分别对应的校准温度和各个所述样本用户分别对应的标签,计算损失函数值;
根据所述损失函数值,对所述图神经网络的参数进行调整。
11.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户的校准温度,对所述AI分类模型得到的所述目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果,包括:
通过所述AI分类模型的全连接层,获取所述目标用户的特征表示对应的特征映射结果;
根据所述特征映射结果与所述目标用户的校准温度的比值,确定所述目标用户在所述多个欺诈识别类别下校准后的置信度,得到所述校准后的欺诈识别结果。
12.一种基于人工智能AI模型的反欺诈识别装置,其特征在于,所述装置包括:
提取模块,用于通过AI分类模型对目标用户的用户信息进行特征提取,得到所述目标用户的特征表示;
构建模块,用于根据第一关系图和所述目标用户的特征表示,构建第二关系图;其中,所述第一关系图用于表征至少两个样本用户之间的关联关系,所述第二关系图用于表征所述目标用户与所述第一关系图中包含的样本用户之间的关联关系;
确定模块,用于根据所述第二关系图,确定所述目标用户的校准温度;其中,所述目标用户的校准温度,用于对所述AI分类模型针对所述目标用户的欺诈识别结果进行校准;
校准模块,用于根据所述目标用户的校准温度,对所述AI分类模型得到的所述目标用户在多个欺诈识别类别下的置信度进行校准,得到校准后的欺诈识别结果,所述置信度用于表征所述目标用户属于所述欺诈识别类别的预测概率。
13.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以实现如权利要求1至11任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至11任一项所述的方法。
15.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至11任一项所述的方法。
CN202310262718.7A 2023-03-10 2023-03-10 基于ai模型的反欺诈识别方法、装置、设备及存储介质 Pending CN117216618A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310262718.7A CN117216618A (zh) 2023-03-10 2023-03-10 基于ai模型的反欺诈识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310262718.7A CN117216618A (zh) 2023-03-10 2023-03-10 基于ai模型的反欺诈识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117216618A true CN117216618A (zh) 2023-12-12

Family

ID=89039578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310262718.7A Pending CN117216618A (zh) 2023-03-10 2023-03-10 基于ai模型的反欺诈识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117216618A (zh)

Similar Documents

Publication Publication Date Title
CN110267119B (zh) 视频精彩度的评价方法及相关设备
CN110472675B (zh) 图像分类方法、图像分类装置、存储介质与电子设备
CN110659723B (zh) 基于人工智能的数据处理方法、装置、介质及电子设备
CN111352965B (zh) 序列挖掘模型的训练方法、序列数据的处理方法及设备
CN110321845B (zh) 一种从视频中提取表情包的方法、装置及电子设备
CN112990294B (zh) 行为判别模型的训练方法、装置、电子设备及存储介质
CN111125658B (zh) 识别欺诈用户的方法、装置、服务器和存储介质
CN111241992B (zh) 人脸识别模型构建方法、识别方法、装置、设备及存储介质
CN113722474A (zh) 文本分类方法、装置、设备及存储介质
CN111523421A (zh) 基于深度学习融合各种交互信息的多人行为检测方法及系统
CN114330499A (zh) 分类模型的训练方法、装置、设备、存储介质及程序产品
EP4394723A1 (en) Label generation method and apparatus, image classification model method and apparatus, and image classification method and apparatus
CN112749737A (zh) 图像分类方法及装置、电子设备、存储介质
CN117217807B (zh) 一种基于多模态高维特征的不良资产估值方法
CN117036834B (zh) 基于人工智能的数据分类方法、装置及电子设备
CN116541507A (zh) 一种基于动态语义图神经网络的视觉问答方法及系统
CN116956171A (zh) 基于ai模型的分类方法、装置、设备及存储介质
CN115240647A (zh) 声音事件检测方法、装置、电子设备及存储介质
CN114818900A (zh) 一种半监督特征提取方法及用户信用风险评估方法
CN117216618A (zh) 基于ai模型的反欺诈识别方法、装置、设备及存储介质
CN115410250A (zh) 阵列式人脸美丽预测方法、设备及存储介质
CN111582404B (zh) 内容分类方法、装置及可读存储介质
CN114492657A (zh) 植物疾病分类方法、装置、电子设备及存储介质
CN113610080A (zh) 基于跨模态感知的敏感图像识别方法、装置、设备及介质
CN111611981A (zh) 信息识别方法和装置及信息识别神经网络训练方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication