CN117523683B

CN117523683B - 一种基于生物特征识别的欺诈视频检测方法

Info

Publication number: CN117523683B
Application number: CN202410018469.1A
Authority: CN
Inventors: 张志坚; 陈友斌; 申意萍; 徐一波
Original assignee: Hubei Micropattern Technology Development Co ltd
Current assignee: Hubei Micropattern Technology Development Co ltd
Priority date: 2024-01-05
Filing date: 2024-01-05
Publication date: 2024-03-29
Anticipated expiration: 2044-01-05
Also published as: CN117523683A

Abstract

本发明公开一种基于生物特征识别的欺诈视频检测方法，涉及欺诈视频检测技术领域，建立欺诈数据库，欺诈数据库包括欺诈视频子库、第二欺诈生物特征识别特征子库、第三欺诈生物特征识别特征子库和第四欺诈生物特征识别特征子库；对待检测视频文件进行欺诈检测，分别提取待检测视频文件的第二、三、四生物特征识别特征，并在第二、三、四欺诈生物特征识别特征子库中进行查询。本发明针对用户数量庞大的应用场景，对AIGC生成的高质量伪造视频文件有很好的识别准确率。

Description

一种基于生物特征识别的欺诈视频检测方法

技术领域

本发明涉及欺诈视频检测技术领域，尤其是涉及一种基于生物特征识别的欺诈视频检测方法。

背景技术

自2022年以来，AIGC（Artificial Intelligence Generated Content，人工智能生成内容）生成视频的技术已经获得了长足的进展，这类技术使用深度学习和神经网络技术生成高质量、逼真的视频内容。具体而言，AIGC生成视频技术在以下几个方面取得了进展：1）在图像素材方面，研究者已经发现可以通过在大型数据集中进行深度学习，生成高质量的虚拟人物，这些人物具有逼真的面部表情、头发和服饰等特征。2）在语音合成方面，利用深度学习生成高质量、逼真的语音已成为企业的核心竞争力之一。3）在视频素材方面，通过对现有视频进行分析、处理和重新组合，已经可以生成高质量、逼真的视频内容。这些算法能够自然地模拟物理世界中的光照和材质，使生成视频的质量得到了显著提高。4）在流媒体领域，AIGC生成技术已被广泛应用于视频流的压缩和优化，并在视频直播、VR/AR等领域开辟了新的应用场景。

随着我国数字经济的蓬勃发展和互联网的普及，网络消费作为一种方便快捷的消费方式，已经成为社会大众的基本选择。与此同时，网络消费也面临着各种欺诈行为的威胁，尤其是随着AIGC的快速发展，不法分子利用AIGC生成的视频对网络消费构成了更大的威胁。这些行为包括信用卡盗刷、身份诈骗、虚假交易等，给消费者、金融机构和整个金融系统都带来了一系列的问题和风险。首先，对于消费者来说，网络消费欺诈对其个人和财产安全构成了直接威胁。信用卡盗刷和身份诈骗等行为可能导致个人敏感信息泄露、财务损失以及身份盗用，给消费者带来经济和心理上的损失。虚假交易也常常让消费者陷入虚假宣传、欺诈销售和商品质量问题等纠纷中，丧失信任和购买欲望，对其网络消费体验产生负面影响。

其次，金融机构自身也承受着网络消费欺诈的压力。金融机构需要承担着网络支付的风险管理责任，以保障客户的资金安全。信用卡盗刷、虚假交易等行为给金融机构带来了巨大的经济损失，同时也增加了其风控措施和技术投入的成本。这些欺诈行为还会对金融机构的声誉和客户信任产生负面影响，加剧了金融行业的稳定性风险。

在这种背景下，如何及时有效地检测和识别这些使用AIGC生成的虚假视频内容就显得至关重要。AIGC检测的方法主要包括基于深度学习的方法和基于传统图像处理的方法。基于卷积神经网络（CNN）的检测方法：利用CNN强大的特征提取能力，对原始图像和篡改图像进行分类或回归，以检测AIGC。这种方法通常需要大量的训练数据，并且需要对模型进行调优以获得更好的性能。基于频域分析的方法：通过对图像进行傅里叶变换等频域分析，寻找AIGC图像在频域上的异常特征，如频谱的不一致性等，以此来检测AIGC。

这些方法存在一个共同的特点，只对某个特定的AIGC生成的视频进行检测。遗憾的是，AIGC技术能够生成高质量、高分辨率的视频文件，这些文件在视觉和听觉效果上几乎与真实内容无异。AIGC生成的视频文件在内容上也可能具有高度逼真性。这使得单一的AIGC检测方法可能无法准确检测出这些高质量的伪造内容。

由于现有的AIGC技术需要大量的计算资源（如GPU、TPU）、数据资源、存储资源进行训练和执行才能生成逼真的视频和音频，并且仍然存在模型的泛化能力不足的缺陷，即对未见过的数据进行生成时表现不佳。不法分子往往不具备AIGC技术需要的大量计算、数据、存储资源，因此不法分子可以使用的AIGC生成的人体图像、人脸图像和声音的数量有限，不得不反复使用获得的AIGC生成的人体图像、人脸图像和声音。不法分子也不一定能获得所有AIGC技术，例如有可能只获得了AIGC生成人脸的技术，却没有获得AIGC生成声音的技术，只能提供不法分子本人的声音。这导致异常现象发生，即存在两个视频文件，具有相同的第一生物特征识别特征，但是却具备不同的第二生物特征识别特征、第三生物特征识别特征或第四生物特征识别特征。本发明充分利用这一异常现象，针对任何的用户数量庞大的应用场景，公开一种基于生物特征识别的欺诈视频检测方法。该方法具备两个主要功能：建立欺诈数据库、对线上新的视频文件进行实时的欺诈检测。

发明内容

为了解决现有技术的缺陷，本发明提供一种基于生物特征识别的欺诈视频检测方法。采用如下的技术方案：

一种基于生物特征识别的欺诈视频检测方法，包括以下步骤：

步骤1，建立欺诈数据库，欺诈数据库包括欺诈视频子库、第一欺诈生物特征识别特征子库、第二欺诈生物特征识别特征子库、第三欺诈生物特征识别特征子库和第四欺诈生物特征识别特征子库；

收集历史视频文件构建历史视频数据库，提取第一生物特征识别特征并进行聚类得到第一欺诈生物特征识别特征子库，对于视频文件数大于1的类别计算第二生物特征识别特征，并获取两两相比的相似度的统计特征，用相似度的统计特征作为判断此类别包含的视频文件是否为欺诈视频的依据，并据此建立第二欺诈生物特征识别特征子库；采用相同的方法分别建立第三欺诈生物特征识别特征子库和第四欺诈生物特征识别特征子库。

步骤2，对待检测视频文件进行欺诈检测，分别提取待检测视频文件的第二、三、四生物特征识别特征，并在第二、三、四欺诈生物特征识别特征子库中进行查询。

不法分子往往不具备AIGC技术需要的大量计算、数据、存储资源，因此不法分子可以使用的AIGC生成的人体图像、人脸图像和声音的数量有限，不得不反复使用获得的AIGC生成的人体图像、人脸图像和声音，这导致异常现象发生，即存在两个视频文件，具有相同的第一生物特征识别特征，但是却具备不同的第二生物特征识别特征、第三生物特征识别特征或第四生物特征识别特征。

通过采用上述技术方案，可以充分利用这一异常现象，针对用户数量庞大的应用场景，采用建立多个不同生物特征识别特征子库，对高度逼真的AIGC生成视频文件能很好的进行识别。

步骤1包括以下子步骤：

步骤11，保存业务系统（不限业务系统的种类，适用于任何在办理业务过程中出示两种及其以上的生物特征识别特征的业务场景）获得的历史视频文件，构成历史视频数据库，提取视频数据库中的所有视频文件中包含的第一生物特征识别特征，设有N个视频文件，每个视频文件中有且只有1个主人公，即共提取了N个第一生物特征识别特征，记为/>，其中/>是视频/>的主人公的第一生物特征识别特征，一般是一个是实数向量；对N个第一生物特征识别特征/>进行聚类得到第一欺诈生物特征识别特征子库，聚类结果为/>，M表示N个视频文件中包含的人数，设/>为第j类中包含的视频数，M<N,/>；

步骤12，对步骤11获取的M类视频文件，逐类别进行如下处理，获得第二欺诈视频子库，将对应的第二生物特征存入第二欺诈生物特征识别特征子库，记为，其中，表示中的第二生物特征识别特征的数量，表示中的第i个第二生物特征识别特征；

步骤121，提取第j类的个视频文件对应的第二生物特征识别特征，记为，其中，表示第j类的第i个视频的第二生物特征识别特征，第二生物特征识别特征与第一生物特征识别特征不同，对上述第j类的个第二生物特征识别特征进行两两比对，获取的两两之间的相似度，并获取所有相似度的最小值；

步骤122，若相似度的最小值，相似度越大表示越相似，/>为阈值，则第j类的个视频文件具有相同的第一生物特征识别特征，但是具有不同的第二生物特征识别特征，判定第j类的/>个视频文件都是欺诈视频，将欺诈视频文件存储到第二欺诈视频子库，将对应的第二生物特征存入第二欺诈生物特征识别特征子库/>；

步骤13，采用步骤12方法建立第三欺诈生物特征识别特征子库和第三欺诈视频子库/>、第四欺诈生物特征识别特征子库/>和第四欺诈视频子库/>。

实际上，同一个人会多次使用同一个业务系统，每次使用时都会提供自己的第一生物特征识别特征，步骤11的目的是利用第一生物特征识别特征把具备相同的第一生物特征的视频聚类为同一类，也就是把属于同一个人的视频汇总聚集在一起。

可选的，若在获取视频文件的过程中已经获取了身份信息，可直接依据身份信息将所有的视频文件分为M类，其中每一类都具备相同的身份信息。

可选的，采用步骤11到步骤13方法，利用业务系统获得的新增的视频文件，更新欺诈数据库。通过这样的方式，可以不断地发现业务系统中新增的欺诈视频。

步骤2的具体方法是：

采用第二生物特征识别特征对线上新的待检测视频文件进行欺诈检测，对待检测视频文件提取第二生物特征识别特征p，第二欺诈生物特征识别特征子库表示为，其中，/>表示/>中的第二生物特征识别特征的数量，/>表示/>中的第i个第二生物特征识别特征，把最大值max设定为0，计算待检测视频文件的第二生物特征识别特征p和/>之间的相似度，如果计算得到的相似度大于当前的最大值max则更新max为当前相似度，设定一个阈值thresh来进行比较，检查最大值max是否大于阈值thresh，若大于阈值thresh，则判断待检测视频文件为欺诈视频，反之则判断为非欺诈视频。

可选的，若利用第二生物特征识别特征判断待检测视频文件为非欺诈视频，则采用同样的方法利用第三生物特征识别特征判断待检测视频文件是否是欺诈视频。

可选的，若利用第三生物特征识别特征判断待检测视频文件为非欺诈视频，则采用同样的方法利用第四生物特征识别特征判断待检测视频文件是否是欺诈视频。

不法分子在利用AIGC技术时，可能是生成虚假人脸、虚假语音、虚假签名、虚假人体中的任何一种，或者是任意几种的组合。通过采用上述技术方案，针对不同的生物特征识别，构建不同的欺诈生物特征识别特征子库，可以灵活地处理使用单一种类虚假信息或者任意种类虚假信息的组合。

可选的，第一生物特征识别特征是常见生物特征中的任何一个，常见生物特征是人脸、虹膜、声纹、步态、人体或签名笔迹。特殊的，也可以是客户主动提供的身份信息。

可选的，第二生物特征识别特征是第一生物特征识别特征以外的任意一个生物特征；第三生物特征识别特征是第一、第二生物特征识别特征以外的任意一个生物特征；第四生物特征识别特征是第一、第二、第三生物特征识别特征以外的任意一个生物特征。

综上所述，本发明包括以下至少有益技术效果：

本发明能提供一种基于生物特征识别的欺诈视频检测方法，不法分子受AIGC技术对计算、数据、存储资源的高要求所限，不得不反复使用数量有限的AIGC生成的人体图像、人脸图像和声音，这导致存在大量的视频文件对具有相同的第一生物特征识别特征，但是却具备不同的第二生物特征识别特征、第三生物特征识别特征或第四生物特征识别特征。本发明充分利用这一异常现象，针对任何的用户数量庞大的应用场景，公开一种基于生物特征识别的欺诈视频检测方法。该方法具备三个主要功能：1）建立欺诈数据库，检测历史视频文件中存在的欺诈视频、2）定期更新欺诈数据库，发现新增的欺诈视频；3）对线上新的视频文件进行实时的欺诈检测。该方法的有益技术效果在于：1）可以检测AIGC生成的很高质量的人眼都难以分辨真伪的视频，2）可以检测各种不同的AIGC方法生成的视频。

附图说明

图1是本发明一种基于生物特征识别的欺诈视频检测方法的流程示意图；

图2是本发明建立第二欺诈生物特征识别特征子库和第二欺诈视频子库的流程示意图。

具体实施方式

以下结合附图对本发明作进一步详细说明。

本发明实施例公开一种基于生物特征识别的欺诈视频检测方法。

参照图1和图2，一种基于生物特征识别的欺诈视频检测方法，包括以下步骤：

收集历史视频文件构建历史视频数据库，提取第一生物特征识别特征并进行聚类得到第一欺诈生物特征识别特征子库，对于视频文件数大于1的类别计算第二生物特征识别特征，并获取两两相比的相似度的统计特征，用相似度的统计特征作为判断此类别包含的视频文件是否为欺诈视频的依据，并据此建立第二欺诈生物特征识别特征子库；采用相同的方法分别建立第三欺诈生物特征识别特征子库和第四欺诈生物特征识别特征子库；

不法分子往往不具备AIGC技术需要的大量计算、数据、存储资源，因此不法分子可以使用的AIGC生成的人体图像、人脸图像和声音的数量有限，不得不反复使用获得的AIGC生成的人体图像、人脸图像和声音，这导致异常现象发生，即存在两个视频文件，具有相同的第一生物特征识别特征，但是却具备不同的第二生物特征识别特征、第三生物特征识别特征或第四生物特征识别特征。充分利用这一异常现象，针对用户数量庞大的应用场景，采用建立多个生物特征的不同生物特征识别特征子库，对高度逼真的AIGC生成视频文件能很好的进行识别。

步骤1包括以下子步骤：

步骤11，保存业务系统（不限业务系统的种类，适用于任何在办理业务过程中出示多种生物特征识别特征的业务场景）获得的历史视频文件，构成历史视频数据库，提取视频数据库中的所有视频文件中包含的第一生物特征识别特征，设有N个视频文件，每个视频文件中有且只有1个主人公，即共提取了N个第一生物特征识别特征，记为/>，其中/>是视频/>的主人公的第一生物特征识别特征；需要特殊说明的是，出示多种生物特征识别特征可以是显示的也可以是隐式的。例如，可以显示的要求客户用语音回答某个问题达到采集声纹这一生物特征的目的，也可以无感的采集客户的人脸图像以获得人脸这一生物识别特征。

对N个第一生物特征识别特征进行聚类得到第一欺诈生物特征识别特征子库，聚类结果为/>，M表示N个视频文件中包含的人数，设/>为第j类/>中包含的视频数，M<N,/>；

步骤12，对步骤11获取的M类视频文件，逐类别进行如下处理，获得第二欺诈视频子库，将对应的第二生物特征存入第二欺诈生物特征识别特征子库/>，记为，其中，/>表示/>中的第二生物特征识别特征的数量，/>表示/>中的第i个第二生物特征识别特征，一般是一个实数向量；

步骤121，提取第j类的个视频文件对应的第二生物特征识别特征，记为，其中，/>表示第j类/>的第i个视频的第二生物特征识别特征，一般是一个实数向量，第二生物特征识别特征与第一生物特征识别特征不同，对上述第j类的/>个第二生物特征识别特征/>进行两两比对，获取/>的两两之间的相似度，并获取所有相似度的最小值/>；

若在获取视频文件的过程中已经获取了身份信息，可直接依据身份信息将所有的视频文件分为M类，其中每一类都具备相同的身份信息。

采用步骤11到步骤13方法，利用业务系统获得的新增的视频文件，更新欺诈数据库。通过这样的方式，可以不断地发现新增的欺诈视频。

步骤2的具体方法是：

采用第二生物特征识别特征对线上新的待检测视频文件进行欺诈检测，对待检测视频文件提取第二生物特征识别特征p，第二欺诈生物特征识别特征子库表示为，其中，/>表示/>中的第二生物特征识别特征的数量，/>表示/>中的第i个第二生物特征识别特征，最大值max设定为0，计算第二生物特征识别特征p和/>之间的相似度，如果计算得到的相似度大于当前的最大值max则更新max为当前相似度，设定一个阈值thresh来进行比较，检查最大值max是否大于阈值thresh，若大于阈值thresh，则判断待检测视频文件为欺诈视频，反之则判断为非欺诈视频。

若采用第二生物特征识别特征判断待检测视频文件为非欺诈视频，则采用同样的方法利用第三生物特征识别特征判断待检测视频文件是否是欺诈视频。

若采用第三生物特征识别特征判断待检测视频文件为非欺诈视频，则采用同样的方法利用第四生物特征识别特征判断待检测视频文件是否是欺诈视频。

不法分子在利用AIGC技术时，可能是生成虚假人脸、虚假语音、虚假签名、虚假人体中的任何一种，或者是任意几种的组合。针对不同的生物特征识别，构建不同的欺诈生物特征识别特征子库，可以灵活的处理使用单一种类虚假信息或者任意种类虚假信息的组合。

第一生物特征识别特征是常见生物特征中的任何一个，常见生物特征是人脸、虹膜、声纹、步态、人体或签名笔迹。特殊的，也可以是客户主动提供的身份信息。

第二生物特征识别特征是第一生物特征识别特征以外的任意一个生物特征；第三生物特征识别特征是第一、第二生物特征识别特征以外的任意一个生物特征；第四生物特征识别特征是第一、第二、第三生物特征识别特征以外的任意一个生物特征。

具体给出该方法在自助双录领域的应用。自助双录是指客户在选购金融产品的过程中，通过自助式的方式进行视频录制、身份认证、风险揭示、电子签署协议等一体的整个认证留档过程。这个过程无需座席客服人员，客户可以随时随地办理业务，节省了人力成本。自助双录产品通过视频以及对应的AI技术手段，为客户提供多场景、全终端的自助双录通道。自助双录应用涉及大量的现金交易，并且具备海量的客户来源，因此容易被AIGC生成的视频所攻击。

在自助双录过程中，要求提供提供自己的身份信息，并且需要客户的人脸自始至终出现在摄像头中，语音回答若干问题，在手机屏幕上签字，并且会记录客户的身份信息、姓名等身份信息，因此选择人脸、声纹、签字笔迹这三种生物特征识别，人脸作为第二生物特征识别特征，声纹作为第三生物特征识别特征，签字笔迹作为第四生物特征识别特征。

首先建立欺诈数据库，具体步骤如下：

保存自助双录系统获得的历史视频文件，构成视频数据库。

由于记录了客户身份信息，“提取视频数据库中的所有视频文件中包含的第一生物特征识别特征”这一步骤跳过不做。

由于记录了客户身份信息，“对N个第一生物特征识别特征进行聚类”这一步骤跳过不做。

上述步骤可以跳过，直接依据身份信息将所有的视频文件分为M类。

使用人脸特征建立第二欺诈生物特征识别特征子库和第二欺诈视频子库。

对上述依据身份信息获得的结果的每一类，设中有个视频，如果>0，则，如图2所示；

提取第j类的个视频文件对应的人脸识别特征，记为/>，其中/>表示第j类/>的第i个视频的人脸识别特征。不限定人脸检测的具体算法，例如可以使用传统方法（如boosting）或深度学习方法（如yolov5），；不限定人脸特征提取算法的种类，例如可以使用传统方法（如FisherFace）或深度学习方法（如VGGNet）；

对上述第j类的个人脸识别特征/>进行两两比对，获取两两之间的相似度，并获取所有相似度的最小值/>。相似度越大表示越相似。不限定采用的人脸特征相似度计算方法，例如使用余弦距离计算相似度。

如果相似度的最小值<0.8，则判定第j类的/>个视频文件都是欺诈视频，将欺诈视频文件存储到第二欺诈视频子库/>，并将对应的人脸识别特征存入第二欺诈生物特征识别特征子库/>。

选用声纹特征作为第三生物特征识别特征，用类似的方法建立第三欺诈生物特征识别特征子库和第三欺诈视频子库/>。

选用签字笔迹特征作为第四生物特征识别特征，利用类似的方法建立第四欺诈生物特征识别特征子库和第四欺诈视频子库/>。

求、/>、/>的并集，得到欺诈视频库/>。

可以每个月重复一次上述过程，利用新增的视频文件，更新欺诈数据库。

对线上新的视频文件进行实时的欺诈检测的步骤如下：

利用人脸作为第二生物特征识别特征，判断线上新的视频文件是否是欺诈视频。

对线上的视频文件提取人脸识别特征p，第二欺诈生物特征识别特征子库表示为/>，其中，/>表示/>中的人脸识别特征的数量，/>表示/>中的第i个人脸识别特征，是一个128维的实数向量，判断是否为欺诈视频的检测代码如下：

max=0

For i in 0,1,...,

if similarity(p, ) > max

max = similarity(p, )

If max > thresh

线上的视频文件为欺诈视频

else

线上的视频文件为非欺诈视频

上述代码的含义为：用于计算两个向量p和之间的相似度，并设定一个阈值thresh来进行比较。以下是代码的详细解释：

初始化一个最大值max为0。这个最大值将用于存储计算得到的相似度的最大值。

使用一个for循环，从0开始，递增到。这个循环的目的是遍历所有可能的向量，即遍历第二欺诈生物特征识别特征子库/>中的所有元素。

在循环中，使用一个相似度度量函数similarity计算向量p与当前遍历到的向量之间的相似度，本实施采用余弦距离计算相似度。

如果计算得到的相似度大于当前的最大值max，将max更新为当前的相似度。这样，max将始终存储到目前为止计算得到的最大相似度。

循环结束后，检查最大值max是否大于阈值thresh。如果是，说明存在一个向量与p的相似度大于阈值，代码执行完毕。

如果步骤1的结果为非欺诈视频，那么声纹作为第三生物特征识别特征，用同样的方法判断线上新的视频文件是否是欺诈视频。

如果步骤2的结果为非欺诈视频，那么签字作为第四生物特征识别特征，用同样的方法判断线上新的视频文件是否是欺诈视频。

以上均为本发明的较佳实施例，并非以此限制本发明的保护范围，故：凡依本发明的结构、形状、原理所做的等效变化，均应涵盖于本发明的保护范围之内。

Claims

1.一种基于生物特征识别的欺诈视频检测方法，其特征在于，包括以下步骤：

步骤1，建立欺诈数据库，欺诈数据库包括欺诈视频子库、第二欺诈生物特征识别特征子库、第三欺诈生物特征识别特征子库和第四欺诈生物特征识别特征子库；

收集历史视频文件构建历史视频数据库，提取第一生物特征识别特征并进行聚类得到第一欺诈生物特征识别特征子库，对于视频文件数大于1的类别计算第二生物特征识别特征，并获取两两相比的相似度的统计特征，用相似度的统计特征作为判断此类别包含的视频文件是否为欺诈视频的依据，并据此建立第二欺诈生物特征识别特征子库，采用相同的方法分别建立第三欺诈生物特征识别特征子库和第四欺诈生物特征识别特征子库；

步骤2，对待检测视频文件进行欺诈检测，分别提取待检测视频文件的第二、三、四生物特征识别特征，并在第二、三、四欺诈生物特征识别特征子库中进行查询；

步骤1包括以下子步骤：

步骤11，保存业务系统获得的历史视频文件，构成历史视频数据库，提取历史视频数据库中的所有视频文件中包含的第一生物特征识别特征，设有N个视频文件，每个视频文件中有且只有1个主人公，即共提取了N个第一生物特征识别特征，记为/>，其中/>是视频/>的主人公的第一生物特征识别特征；

对N个第一生物特征识别特征进行聚类得到第一欺诈生物特征识别特征子库，聚类结果为/>，M表示类别数，即N个视频文件中包含的人数，设/>为第j类/>中包含的视频数，M<N,/>；

步骤12，对步骤11获取的M类视频文件，逐类别进行如下处理：获得第二欺诈视频子库，将对应的第二生物特征存入第二欺诈生物特征识别特征子库/>，记为；

其中，表示/>中的第二生物特征识别特征的数量，/>表示/>中的第i个第二生物特征识别特征；

步骤121，提取第j类的个视频文件对应的第二生物特征识别特征，记为，其中，/>表示第j类/>的第i个视频的第二生物特征识别特征，第二生物特征识别特征与第一生物特征识别特征不同，对上述第j类的/>个第二生物特征识别特征/>进行两两比对，获取/>的两两之间的相似度，并获取所有相似度的最小值/>；

步骤122，若相似度的最小值</>,/>为阈值，则第j类的/>个视频文件具有相同的第一生物特征识别特征，但是具有不同的第二生物特征识别特征，判定第j类的/>个视频文件都是欺诈视频，将欺诈视频文件存储到第二欺诈视频子库/>，将对应的第二生物特征存入第二欺诈生物特征识别特征子库/>；

步骤13，采用步骤12方法建立第三欺诈生物特征识别特征子库和第三欺诈视频子库/>、第四欺诈生物特征识别特征子库/>和第四欺诈视频子库/>；

步骤2的具体方法是：

采用第二生物特征识别特征对线上新的待检测视频文件进行欺诈检测，对待检测视频文件提取第二生物特征识别特征p，第二欺诈生物特征识别特征子库表示为，其中，/>表示/>中的第二生物特征识别特征的数量，/>表示中的第i个第二生物特征识别特征，将最大值max初始化为0，计算待检测视频文件的第二生物特征识别特征p和/>之间的相似度，如果计算得到的相似度大于当前的最大值max则更新max为当前相似度，设定一个阈值thresh来进行比较，检查最大值max是否大于阈值thresh，若大于阈值thresh，则判断待检测视频文件为欺诈视频，反之则判断为非欺诈视频；

若利用第二生物特征识别特征判断待检测视频文件为非欺诈视频，则采用同样的方法利用第三生物特征识别特征判断待检测视频文件是否是欺诈视频；

若利用第三生物特征识别特征判断待检测视频文件为非欺诈视频，则采用同样的方法利用第四生物特征识别特征判断待检测视频文件是否是欺诈视频；

第二生物特征识别特征是第一生物特征识别特征以外的任意一个生物特征识别特征，第三生物特征识别特征是第一、第二生物特征识别特征以外的任意一个生物特征识别特征，第四生物特征识别特征是第一、第二、第三生物特征识别特征以外的任意一个生物特征识别特征。

2.根据权利要求1所述的一种基于生物特征识别的欺诈视频检测方法，其特征在于：若在获取视频文件的过程中已经获取了身份信息，可不使用第一生物特征识别特征，直接依据身份信息将所有的视频文件分为M类。

3.根据权利要求1所述的一种基于生物特征识别的欺诈视频检测方法，其特征在于：采用步骤11到步骤13方法，利用新增的视频文件，更新欺诈数据库。

4.根据权利要求1所述的一种基于生物特征识别的欺诈视频检测方法，其特征在于：第一生物特征识别特征是常见生物特征中的任何一个，常见生物特征是人脸、虹膜、声纹、步态、人体或签名笔迹。