CN115134450B - 一种基于身份信息鉴别的骚扰诈骗电话的防范方法及系统 - Google Patents

一种基于身份信息鉴别的骚扰诈骗电话的防范方法及系统 Download PDF

Info

Publication number
CN115134450B
CN115134450B CN202211060892.5A CN202211060892A CN115134450B CN 115134450 B CN115134450 B CN 115134450B CN 202211060892 A CN202211060892 A CN 202211060892A CN 115134450 B CN115134450 B CN 115134450B
Authority
CN
China
Prior art keywords
identity information
information
calling
organization
network element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211060892.5A
Other languages
English (en)
Other versions
CN115134450A (zh
Inventor
陈晓莉
潘昊
严涛
赵祥廷
聂宜君
林建洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Ponshine Information Technology Co ltd
Original Assignee
Zhejiang Ponshine Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Ponshine Information Technology Co ltd filed Critical Zhejiang Ponshine Information Technology Co ltd
Priority to CN202211060892.5A priority Critical patent/CN115134450B/zh
Publication of CN115134450A publication Critical patent/CN115134450A/zh
Application granted granted Critical
Publication of CN115134450B publication Critical patent/CN115134450B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/667Preventing unauthorised calls from a telephone set
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/57Arrangements for indicating or recording the number of the calling subscriber at the called subscriber's set
    • H04M1/575Means for retrieving and displaying personal data about calling party

Abstract

本发明涉及一种基于身份信息鉴别的骚扰诈骗电话的防范方法及系统,方法包括:S1、采集以电话号码为核心的名片信息,包括电话号码信息、组织身份信息和组织内的个人身份信息;并根据电话号码信息对组织身份信息和个人身份信息进行验证,以形成可信名片库;S2、主叫号码发起呼叫前,采集主叫号码对应的人脸信息并判断其与可信名片库的个人身份信息是否匹配;若是,则转至步骤S3;S3、主叫号码对应的客户端发起原始呼叫请求,判断主叫网元、被叫网元接收的呼叫请求是否与原始呼叫请求一致;若是,则被叫终端进行主叫号码对应的名片展示。本发明基于通信全流程进行身份信息鉴别,最终被叫终端接收验证过的身份信息,从而防范骚扰诈骗电话。

Description

一种基于身份信息鉴别的骚扰诈骗电话的防范方法及系统
技术领域
本发明属于电信诈骗识别技术领域,具体涉及一种基于身份信息鉴别的骚扰诈骗电话的防范方法及系统。
背景技术
现有技术中,对于骚扰诈骗电话的防范,预先设置黑名单;而很多骚扰诈骗电话往往不在黑名单列表中,故而无法有效地防止骚扰诈骗电话。另外,目前主要通过在被叫端进行骚扰诈骗电话的防范,并未从主叫源头端进行有效遏制。
发明内容
基于现有技术中存在的上述缺点和不足,本发明的目的之一是至少解决现有技术中存在的上述问题之一或多个,换言之,本发明的目的之一是提供满足前述需求之一或多个的一种基于身份信息鉴别的骚扰诈骗电话的防范方法及系统。
为了达到上述发明目的,本发明采用以下技术方案:
一种基于身份信息鉴别的骚扰诈骗电话的防范方法,包括以下步骤:
S1、采集以电话号码为核心的名片信息,包括电话号码信息、组织身份信息和组织内的个人身份信息;并根据电话号码信息对组织身份信息和个人身份信息进行验证,以形成可信名片库;
S2、在主叫号码发起呼叫之前,采集主叫号码对应的人脸信息并判断其与可信名片库的个人身份信息是否匹配;若是,则转至步骤S3;
S3、主叫号码对应的客户端发起原始呼叫请求,判断主叫网元、被叫网元接收的呼叫请求是否与原始呼叫请求一致;若是,则在被叫终端进行主叫号码对应的名片展示。
作为优选方案,所述步骤S1中,电话号码信息包括号码及其对应的开户主体证明文件;
组织身份信息包括组织名称、所属行业类型和营业执照;
个人身份信息包括姓名及其对应的人脸图片、身份证号码。
作为优选方案,所述根据电话号码信息对名片信息中的组织身份信息和个人身份信息进行验证,包括:
验证号码对应的开户主体证明文件的开户名与组织身份信息的组织名称或个人身份信息的姓名一致;
验证组织身份信息的营业执照在有效时间内且经营状态正常;
验证组织身份信息的营业执照的经营范围与所属行业类型一致;
验证个人身份信息的姓名、身份证件号及人脸图片一致。
作为优选方案,所述步骤S2中,判断主叫号码对应的人脸信息与可信名片库的个人身份信息是否匹配,包括:
S21、将可信名片库中的个人身份信息的人脸图片作为样本数据集输入Resnet50进行特征提取,之后采用Arcface Loss进行预训练,得到初始权重;
S22、将初始权重作为预训练权重进行Triplet Loss的训练,得到特征提取器;
S23、将可信名片库中的个人身份信息的同一个人的数张人脸图片输入特征提取器进行向量提取并进行聚类,得到个人中心向量;
S24、对所有个人的个人中心向量进行聚类,得到各个簇的聚类中心向量;
S25、将主叫号码对应的人脸信息输入特征提取器进行向量提取并与聚类中心向量进行聚类,以确定目标簇;之后与目标簇内的所有个人中心向量进行距离比对,匹配距离最小的样本并判断最小距离是否小于阈值;若是,则匹配成功。
作为优选方案,所述步骤S3中,判断主叫网元、被叫网元接收的呼叫请求是否与原始呼叫请求一致,包括以下步骤:
S31、客户端与主叫网元之间约定密钥,客户端利用约定密钥对原始呼叫请求进行签名加密后发送至主叫网元进行校验,校验通过后生成唯一会话标识并返回至客户端;原始呼叫请求包括主叫号码和被叫号码;
S32、客户端将唯一会话标识以及原始呼叫请求进行国密算法加密,得到第一加密数据;
S33、主叫网元对接收的呼叫请求和唯一会话标识进行国密算法加密,得到第二加密数据;
S34、对第一加密数据和第二加密数据进行解密,并根据唯一会话标识判断是否属于同一呼叫请求;若是,则转至步骤S35;
S35、根据主叫号码、被叫号码、唯一会话标识和主叫网元私钥加载生成主叫网元标识,并发送至被叫网元;
S36、被叫网元接收呼叫请求并对其进行国密算法加密,得到第三加密数据;
S37、对第三加密数据进行解密,解析主叫网元标识并根据唯一会话标识判断与原始呼叫请求是否属于同一呼叫请求;若是,则在被叫终端进行主叫号码对应的名片展示。
作为优选方案,所述国密算法采用国密SM4算法。
作为优选方案,所述步骤S3之后,还包括以下步骤:
S4、被叫终端反馈主叫号码对应的组织身份信息,根据被叫终端反馈的组织身份信息对可信名片库的名片进行更新。
作为优选方案,所述被叫终端反馈的组织身份信息为本次通话所属行业类型;
根据被叫终端反馈的组织身份信息对可信名片库的名片进行更新包括:若本次通话所属行业类型与名片中的所属行业类型不一致,则将本次通话对应的名片信息从可信名片库中剔除。
本发明还提供一种基于身份信息鉴别的骚扰诈骗电话的防范系统,应用如上任一项方案所述的防范方法,所述防范系统包括:
采集模块,用于采集以电话号码为核心的名片信息,包括电话号码信息、组织身份信息和组织内的个人身份信息;
验证模块,用于根据电话号码信息对组织身份信息和个人身份信息进行验证,以形成可信名片库;
人脸识别模块,用于在主叫号码发起呼叫之前,采集主叫号码对应的人脸信息并判断其与可信名片库的个人身份信息是否匹配;
策略中心,用于在主叫号码对应的客户端发起原始呼叫请求之后,判断主叫网元、被叫网元接收的呼叫请求是否与原始呼叫请求一致;若是,则在被叫终端进行主叫号码对应的名片展示。
本发明与现有技术相比,有益效果是:
本发明的基于身份信息鉴别的骚扰诈骗电话的防范方法及系统,基于通信全流程进行身份信息鉴别,最终被叫终端接收验证过的身份信息,从而防范骚扰诈骗电话。
附图说明
图1是本发明实施例1的基于身份信息鉴别的骚扰诈骗电话的防范方法的流程示意图;
图2是本发明实施例1的特征提取器的训练构架图;
图3是本发明实施例1的呼叫请求一致性验证的原理图
图4是本发明实施例1的基于身份信息鉴别的骚扰诈骗电话的防范系统的构架图。
具体实施方式
为了更清楚地说明本发明实施例,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
实施例1:
如图1所示,本实施例的基于身份信息鉴别的骚扰诈骗电话的防范方法,包括以下步骤:
S0、采集以电话号码为核心的名片信息,包括电话号码信息、组织身份信息和组织内的个人身份信息。
具体地,通过组织和个人分别自主提交的方式,收集以电话号码为核心要素的名片信息,包括电话号码信息、组织身份信息和个人身份信息,从而实现所有信息的采集。
其中,本实施例的电话号码信息,主要包括号码和组织自主提交的号码开户主体证明文件;
本实施例的组织身份信息,主要包括组织自主提交的组织名称及其他信息,其他信息包括所属行业类型与组织机构运营相关证明文件(即营业执照);
本实施例的个人身份信息,即个人自主提交的通过视频流获取人脸照片及其他信息,通过照片提取脸部生物特征供后续脸部对比使用;其他信息包括姓名和身份证件号。
上述的电话号码信息和组织身份信息主要由组织指定的管理员自主提交信息获得。
上述的个人身份信息主要由号码的使用者自主提交信息获得。
S1、根据电话号码信息对名片信息中的组织身份信息和人员身份信息进行验证,包括对组织身份信息的验证、对组织内相关人员的个人身份信息的验证,形成可信名片库。
具体地,本实施例的验证电话号码信息包括:验证号码开户主体证明文件上的开户名与提交的组织名称或个人姓名一致,文件上的号码与提交的电话号码一致;
本实施例的验证组织身份信息包括:确认组织机构运营相关证明文件(即营业执照)在有效时间内且运营状态正常;验证组织机构运营相关证明文件(即营业执照)上的组织主体名称与提交的组织名称一致,经营范围与所属行业类型一致。
本实施例的验证个人身份信息包括:验证姓名、身份证件号和照片一致。
S2、在主叫号码发起呼叫之前,采集主叫号码对应的人脸信息并判断其与可信名片库的个人身份信息是否匹配(AI人脸对比);若是,才能发起呼叫。即需完成操作人的人脸信息与可信名片库中名片信息的一致性验证才能呼出。
其中,判断主叫号码对应的人脸信息与可信名片库的个人身份信息是否匹配(即进行人脸识别),具体包括以下步骤:
S21、将可信名片库中的个人身份信息的人脸图片作为样本数据集输入Resnet50进行特征提取,之后采用Arcface Loss进行预训练,得到初始权重;
其中,人脸识别模块的模型需要支持对开集的人脸进行识别,由于数据集较为庞大,传统的Triplet Loss的训练方式对数据集要求比较高,收敛速度比较慢。因此,如图2所示,先采用Arcface Loss对已有可信名片库的样本数据集进行特征嵌入的预训练,降低Triplet Loss的训练难度;
首先,backbone选用resnet50进行特征提取,获取到的人脸特征层的神经元数为1000;
接着,采用Arcface Loss模型训练,其具体步骤如下:
Arcface Loss在原来softmax的交叉熵Loss上进行改进,将softmax的权重w i 和分类全连接层的输出x j 的乘积—即x j w i 进行角度控制,使模型能进一步学习样本特征,使得类内距离接近,类间距离较远,具体公式如下:
Figure 312214DEST_PATH_IMAGE001
其中,N为样本数量,n为类别数量,b j 为softmax的偏置。
b j 为0,得到:
Figure 268800DEST_PATH_IMAGE002
因为x j w i 为向量相乘,将x j w i 转换为
Figure 526606DEST_PATH_IMAGE003
,并将两向量均归一化到模为1,并乘以半径缩放系数s得到:
Figure 425291DEST_PATH_IMAGE004
其中,θw i x j 向量夹角。
加入附加的边界惩罚项,得到最终的Arcface Loss:
Figure 401338DEST_PATH_IMAGE005
其中,m为附加的边界惩罚项。
S22、将初始权重作为预训练权重进行Triplet Loss的训练,得到特征提取器;
具体地,将Arcface Loss的模型去掉最后的分类层,其他部分作为Triplet Loss模型训练的特征提取器,由于Arcface Loss已经对权重进行了预训练,因此Triplet的训练难度被降低,主要进行fine tune微调训练。
Triplet loss就是将需要进行识别的数据进入到特征提取器中,得到对应的特征向量,再计算向量之间的距离,定义基准样本Anchor,正例样本Positive和反例样本Negative,我们期望通过缩减Anchor和Positive的距离,增加Anchor和Negative的距离来缩减类内距离,增大类间距离,达到高内聚低耦合的效果。
Triplet的样本选取需要严谨挑选,如果Anchor和negative本来距离就很远,那么训练的效率就会很低,且由于样本多,Triplet样本枚举出来的量是巨大的,所以必须要有样本筛选机制。由于之前使用了Arcface Loss进行预训练,模型已经可以提供每张图片的特征,因此在每轮训练前,把当前batch的数据进行配对,获取Anchor和距离最远的Positive以及距离最近的Negative作为Hard example进行模型训练,使得模型收敛速度快,学习的程度也深。
S23、将可信名片库中的个人身份信息的同一个人的数张人脸图片输入特征提取器进行向量提取并进行聚类,得到个人中心向量;
S24、对所有个人的个人中心向量进行聚类,得到各个簇的聚类中心向量;
S25、将主叫号码对应的人脸信息输入特征提取器进行向量提取并与聚类中心向量进行聚类,以确定目标簇;之后与目标簇内的所有个人中心向量进行距离比对,匹配距离最小的样本并判断最小距离是否小于阈值;若是,则匹配成功。
即对已经存在可信名片库里的每个人的样本中心点(即个人中心向量)进行聚类,得到聚类中心向量。通过训练好的特征提取器对上传的图片进行向量提取,先进行其与聚类中心向量的比对,根据距离最小的点确定所在簇的位置,随后对簇内的每个人的样本中心点进行距离比对,若存在距离最小的样本且最小距离小于阈值时,则命中(即匹配成功);否则,输出没有命中(即匹配失败)。
S3、在号码发起呼叫时,对客户端请求命令与双方之间通信数据进行一致性校验,即判断主叫网元、被叫网元接收的呼叫请求是否与原始呼叫请求一致;校验通过后才能展示可信名片。
本实施例的数据校验在数据传输中使用国密SM4算法完成加解密,首先定义编码格式“UTF-8”,再定义分组加密模式,使用加密算法/分组加密模式/分组填充方式即定义“SM4/ECB/PKCS5Padding”,其中,PKCS5Padding是以8个字节为一组进行分组加密,最后定义16位密钥字符串。
其中,如图3所示,判断主叫网元、被叫网元接收的呼叫请求是否与原始呼叫请求一致,具体包括以下步骤:
S31、客户端与主叫网元之间约定密钥,客户端利用约定密钥对原始呼叫请求进行签名加密后发送至主叫网元进行校验,校验通过后生成唯一会话标识并返回至客户端;原始呼叫请求包括主叫号码和被叫号码;
具体地,客户端发起原始呼叫请求,其中携带主叫号码、被叫号码、请求token;主叫网元通过token和请求来源地址校验请求合法性和安全性。
为了防止接口地址和参数结构被抓包,从而模拟请求,针对客户端与主叫网元之间进行以下操作:1、双方约定密钥,保存双方服务器,只参与签名,不参与网络传输;2、加入签名方法,请求时将所有参数名称以及参数值(系统级参数sign除外)加入签名传输;3、签名时,根据参数名称,除签名(sign)外所有请求参数按照字母先后顺序排序:key+value.....。如果首字母相同则对第二个字母排序,以此类推,value无需编码,对于一些非必选参数,若无value值,也参与签名。
校验通过后,通过主叫号码、被叫号码、请求token和一组固定key值,生成32位唯一会话标识并返回至客户端。
S32、客户端将唯一会话标识以及原始呼叫请求进行国密算法加密,得到第一加密数据并发送至策略中心;
具体地,客户端对请求数据以及唯一会话标识进行国密SM4算法加密,将加密后的数据(即第一加密数据)推送至策略中心。例如,通过密钥字符串、加解密算法、编码字符集生成密钥,通过加解密算法、密钥及明文即请求数据、编码字符集生成加密字符串,并进行base64编码,得出密文,将密文封装请求发送到策略中心;其中,加解密的过程可以参考现有技术,在此不赘述。
S33、主叫网元对接收的呼叫请求和唯一会话标识进行国密算法加密,得到第二加密数据;
具体地,主叫网元对呼叫请求数据(包括主叫号码、被叫号码和唯一会话标识)通过国密SM4算法进行加密,并将加密后的密文(即第二加密数据)推送至策略中心。
S34、对第一加密数据和第二加密数据进行解密,并根据唯一会话标识判断是否属于同一呼叫请求;若是,则转至步骤S35;
具体地,策略中心会对第一加密数据和第二加密数据进行解密,并针对请求中的主叫数据进行检索可信名片库,将检索到的媒体数据同步到被叫网元,同时会将媒体文件的url通过MD5加密加载进请求中,并把当前呼叫请求中的主被叫用户信息保存在缓存中;
策略中心通过解密拿到主叫号码、被叫号码和唯一会话标识,并去缓存中查询对比唯一会话标识、号码信息是否与客户端的原始呼叫请求一致;若一致,则为同一通呼叫请求。
S35、根据主叫号码、被叫号码、唯一会话标识和主叫网元私钥加载生成主叫网元标识,并发送至被叫网元。
具体地,策略中心根据主叫号码、被叫号码、唯一会话标识和主叫网元私钥,二次加载生成主叫网元标识,并写入缓存中,同时将新数据推送下一个网元,即被叫网元。
S36、被叫网元接收呼叫请求并对其进行国密算法加密,得到第三加密数据;
具体地,呼叫请求到达被叫网元,被叫网元将请求数据通过国密SM4算法进行加密得到第三加密数据,并推送至策略中心。
S37、对第三加密数据进行解密,解析主叫网元标识并根据唯一会话标识判断与原始呼叫请求是否属于同一呼叫请求;若是,则在被叫终端进行主叫号码对应的名片展示
策略中心对第三加密数据进行解密,得到主叫号码、被叫号码、主叫网元标识;通过主叫网元标识查询缓存中数据,验证当前请求是否与主叫网元请求一致;解析主叫网元标识,获取到唯一会话标识查询缓存中是否与客户端的原始呼叫请求一致;验证通过,则进行下一步步骤S38;
S38、获取被叫终端信息,并根据终端设备的类型向被叫终端展示主叫号码对应的名片信息。
S4、被叫终端反馈主叫号码对应的组织身份信息,根据被叫终端反馈的组织身份信息对可信名片库的名片进行更新。
具体地,被叫终端反馈的组织身份信息为本次通话所属行业类型。
根据被叫终端反馈的组织身份信息对可信名片库的名片进行更新包括:若本次通话所属行业类型与名片中的所属行业类型不一致,则将本次通话对应的名片信息从可信名片库中剔除;若本次通话所属行业类型与名片中的所属行业类型一致,则无需更新。
基于本实施例的上述防范方法,如图4所示,本实施例的基于身份信息鉴别的骚扰诈骗电话的防范系统包括采集模块、验证模块、人脸识别模块、策略中心和更新模块。
具体地,本实施例的采集模块用于采集以电话号码为核心的名片信息,包括电话号码信息、组织身份信息和组织内的个人身份信息。
通过组织和个人分别自主提交的方式,收集以电话号码为核心要素的名片信息,包括电话号码信息、组织身份信息和个人身份信息,从而实现所有信息的采集。
其中,本实施例的电话号码信息,主要包括号码和组织自主提交的号码开户主体证明文件;
本实施例的组织身份信息,主要包括组织自主提交的组织名称及其他信息,其他信息包括所属行业类型与组织机构运营相关证明文件(即营业执照);
本实施例的个人身份信息,即个人自主提交的通过视频流获取人脸照片及其他信息,通过照片提取脸部生物特征供后续脸部对比使用;其他信息包括姓名和身份证件号。
上述的电话号码信息和组织身份信息主要由组织指定的管理员自主提交信息获得。
上述的个人身份信息主要由号码的使用者自主提交信息获得。
本实施例的验证模块用于根据电话号码信息对组织身份信息和个人身份信息进行验证,以形成可信名片库。
具体地,本实施例的验证电话号码信息包括:验证号码开户主体证明文件上的开户名与提交的组织名称或个人姓名一致,文件上的号码与提交的电话号码一致;
本实施例的验证组织身份信息包括:确认组织机构运营相关证明文件(即营业执照)在有效时间内且运营状态正常;验证组织机构运营相关证明文件(即营业执照)上的组织主体名称与提交的组织名称一致,经营范围与所属行业类型一致。
本实施例的验证个人身份信息包括:验证姓名、身份证件号和照片一致。
本实施例的人脸识别模块,用于在主叫号码发起呼叫之前,采集主叫号码对应的人脸信息并判断其与可信名片库的个人身份信息是否匹配(AI人脸对比),即进行人脸识别。以下对人脸识别模块的构架以及具体识别过程进行详细描述:
(1)将可信名片库中的个人身份信息的人脸图片作为样本数据集输入Resnet50进行特征提取,之后采用Arcface Loss进行预训练,得到初始权重;
具体地,人脸识别模块的模型需要支持对开集的人脸进行识别,由于数据集较为庞大,传统的Triplet Loss的训练方式对数据集要求比较高,收敛速度比较慢。因此,如图2所示,先采用Arcface Loss对已有可信名片库的样本数据集进行特征嵌入的预训练,降低Triplet Loss的训练难度;
首先,backbone选用resnet50进行特征提取,获取到的人脸特征层的神经元数为1000;
接着,采用Arcface Loss模型训练,其具体步骤如下:
Arcface Loss在原来softmax的交叉熵Loss上进行改进,将softmax的权重w i 和分类全连接层的输出x j 的乘积—即x j w i 进行角度控制,使模型能进一步学习样本特征,使得类内距离接近,类间距离较远,具体公式如下:
Figure 410882DEST_PATH_IMAGE001
其中,N为样本数量,n为类别数量,b j 为softmax的偏置。
b j 为0,得到:
Figure 772462DEST_PATH_IMAGE002
因为x j w i 为向量相乘,将x j w i 转换为
Figure 842049DEST_PATH_IMAGE003
,并将两向量均归一化到模为1,并乘以半径缩放系数s得到:
Figure 305392DEST_PATH_IMAGE004
其中,θw i x j 向量夹角。
加入附加的边界惩罚项,得到最终的Arcface Loss:
Figure 853048DEST_PATH_IMAGE005
其中,m为附加的边界惩罚项。
(2)将初始权重作为预训练权重进行Triplet Loss的训练,得到特征提取器;
具体地,将Arcface Loss的模型去掉最后的分类层,其他部分作为Triplet Loss模型训练的特征提取器,由于Arcface Loss已经对权重进行了预训练,因此Triplet的训练难度被降低,主要进行fine tune微调训练。
Triplet loss就是将需要进行识别的数据进入到特征提取器中,得到对应的特征向量,再计算向量之间的距离,定义基准样本Anchor,正例样本Positive和反例样本Negative,我们期望通过缩减Anchor和Positive的距离,增加Anchor和Negative的距离来缩减类内距离,增大类间距离,达到高内聚低耦合的效果。
Triplet的样本选取需要严谨挑选,如果Anchor和negative本来距离就很远,那么训练的效率就会很低,且由于样本多,Triplet样本枚举出来的量是巨大的,所以必须要有样本筛选机制。由于之前使用了Arcface Loss进行预训练,模型已经可以提供每张图片的特征,因此在每轮训练前,把当前batch的数据进行配对,获取Anchor和距离最远的Positive以及距离最近的Negative作为Hard example进行模型训练,使得模型收敛速度快,学习的程度也深。
(3)将可信名片库中的个人身份信息的同一个人的数张人脸图片输入特征提取器进行向量提取并进行聚类,得到个人中心向量;
(4)对所有个人的个人中心向量进行聚类,得到各个簇的聚类中心向量;
(5)将主叫号码对应的人脸信息输入特征提取器进行向量提取并与聚类中心向量进行聚类,以确定目标簇;之后与目标簇内的所有个人中心向量进行距离比对,匹配距离最小的样本并判断最小距离是否小于阈值;若是,则匹配成功。
即对已经存在可信名片库里的每个人的样本中心点(即个人中心向量)进行聚类,得到聚类中心向量。通过训练好的特征提取器对上传的图片进行向量提取,先进行其与聚类中心向量的比对,根据距离最小的点确定所在簇的位置,随后对簇内的每个人的样本中心点进行距离比对,若存在距离最小的样本且最小距离小于阈值时,则命中(即匹配成功);否则,输出没有命中(即匹配失败)。
本实施例的策略中心,用于在主叫号码对应的客户端发起原始呼叫请求之后,判断主叫网元、被叫网元接收的呼叫请求是否与原始呼叫请求一致,即对客户端请求命令与双方之间通信数据进行一致性校验;若是,则在被叫终端进行主叫号码对应的名片展示,即校验通过后才能展示可信名片。
以下对策略中心与客户端、主叫网元、被叫网元、被叫终端的交互进行详细说明:
本实施例的数据校验在数据传输中使用国密SM4算法完成加解密,首先定义编码格式“UTF-8”,再定义分组加密模式,使用加密算法/分组加密模式/分组填充方式即定义“SM4/ECB/PKCS5Padding”,其中,PKCS5Padding是以8个字节为一组进行分组加密,最后定义16位密钥字符串。
其中,如图3所示,判断主叫网元、被叫网元接收的呼叫请求是否与原始呼叫请求一致,具体过程如下:
(a)客户端与主叫网元之间约定密钥,客户端利用约定密钥对原始呼叫请求进行签名加密后发送至主叫网元进行校验,校验通过后生成唯一会话标识并返回至客户端;原始呼叫请求包括主叫号码和被叫号码;
具体地,客户端发起原始呼叫请求,其中携带主叫号码、被叫号码、请求token;主叫网元通过token和请求来源地址校验请求合法性和安全性。
为了防止接口地址和参数结构被抓包,从而模拟请求,针对客户端与主叫网元之间进行以下操作:1、双方约定密钥,保存双方服务器,只参与签名,不参与网络传输;2、加入签名方法,请求时将所有参数名称以及参数值(系统级参数sign除外)加入签名传输;3、签名时,根据参数名称,除签名(sign)外所有请求参数按照字母先后顺序排序:key+value.....。如果首字母相同则对第二个字母排序,以此类推,value无需编码,对于一些非必选参数,若无value值,也参与签名。
校验通过后,通过主叫号码、被叫号码、请求token和一组固定key值,生成32位唯一会话标识并返回至客户端。
(b)客户端将唯一会话标识以及原始呼叫请求进行国密算法加密,得到第一加密数据并发送至策略中心;
具体地,客户端对请求数据以及唯一会话标识进行国密SM4算法加密,将加密后的数据(即第一加密数据)推送至策略中心。例如,通过密钥字符串、加解密算法、编码字符集生成密钥,通过加解密算法、密钥及明文即请求数据、编码字符集生成加密字符串,并进行base64编码,得出密文,将密文封装请求发送到策略中心;其中,加解密的过程可以参考现有技术,在此不赘述。
(c)主叫网元对接收的呼叫请求和唯一会话标识进行国密算法加密,得到第二加密数据;
具体地,主叫网元对呼叫请求数据(包括主叫号码、被叫号码和唯一会话标识)通过国密SM4算法进行加密,并将加密后的密文(即第二加密数据)推送至策略中心。
(d)对第一加密数据和第二加密数据进行解密,并根据唯一会话标识判断是否属于同一呼叫请求;若是,则转至下一步;
具体地,策略中心会对第一加密数据和第二加密数据进行解密,并针对请求中的主叫数据进行检索可信名片库,将检索到的媒体数据同步到被叫网元,同时会将媒体文件的url通过MD5加密加载进请求中,并把当前呼叫请求中的主被叫用户信息保存在缓存中;
策略中心通过解密拿到主叫号码、被叫号码和唯一会话标识,并去缓存中查询对比唯一会话标识、号码信息是否与客户端的原始呼叫请求一致;若一致,则为同一通呼叫请求。
(e)根据主叫号码、被叫号码、唯一会话标识和主叫网元私钥加载生成主叫网元标识,并发送至被叫网元。
具体地,策略中心根据主叫号码、被叫号码、唯一会话标识和主叫网元私钥,二次加载生成主叫网元标识,并写入缓存中,同时将新数据推送下一个网元,即被叫网元。
(f)被叫网元接收呼叫请求并对其进行国密算法加密,得到第三加密数据;
具体地,呼叫请求到达被叫网元,被叫网元将请求数据通过国密SM4算法进行加密得到第三加密数据,并推送至策略中心。
(g)对第三加密数据进行解密,解析主叫网元标识并根据唯一会话标识判断与原始呼叫请求是否属于同一呼叫请求;若是,则在被叫终端进行主叫号码对应的名片展示
策略中心对第三加密数据进行解密,得到主叫号码、被叫号码、主叫网元标识;通过主叫网元标识查询缓存中数据,验证当前请求是否与主叫网元请求一致;解析主叫网元标识,获取到唯一会话标识查询缓存中是否与客户端的原始呼叫请求一致;验证通过,则进行下一步;
(h)获取被叫终端信息,并根据终端设备的类型向被叫终端展示主叫号码对应的名片信息。
本实施例的更新模块,用于根据被叫终端反馈的组织身份信息对可信名片库的名片进行更新。具体地,被叫终端反馈的组织身份信息为本次通话所属行业类型。
若本次通话所属行业类型与名片中的所属行业类型不一致,则将本次通话对应的名片信息从可信名片库中剔除;若本次通话所属行业类型与名片中的所属行业类型一致,则无需更新。
实施例2:
本实施例的基于身份信息鉴别的骚扰诈骗电话的防范方法与实施例1的不同之处在于:
省略上述步骤S4的反馈以及更新过程,简化防范方法的流程,满足不同应用场景的需求;
其他步骤可以参考实施例1;
本实施例的基于身份信息鉴别的骚扰诈骗电话的防范系统与实施例1的不同之处在于:
省略上述更新模块,简化系统的构架,满足不同应用场景的需求;
其他构架可以参考实施例1。
以上所述仅是对本发明的优选实施例及原理进行了详细说明,对本领域的普通技术人员而言,依据本发明提供的思想,在具体实施方式上会有改变之处,而这些改变也应视为本发明的保护范围。

Claims (8)

1.一种基于身份信息鉴别的骚扰诈骗电话的防范方法,其特征在于,包括以下步骤:
S1、采集以电话号码为核心的名片信息,包括电话号码信息、组织身份信息和组织内的个人身份信息;并根据电话号码信息对组织身份信息和个人身份信息进行验证,以形成可信名片库;
S2、在主叫号码发起呼叫之前,采集主叫号码对应的人脸信息并判断其与可信名片库的个人身份信息是否匹配;若是,则转至步骤S3;
S3、主叫号码对应的客户端发起原始呼叫请求,判断主叫网元、被叫网元接收的呼叫请求是否与原始呼叫请求一致;若是,则在被叫终端进行主叫号码对应的名片展示;
所述步骤S1中,电话号码信息包括号码及其对应的开户主体证明文件;
组织身份信息包括组织名称、所属行业类型和营业执照;
个人身份信息包括姓名及其对应的人脸图片、身份证号码。
2.根据权利要求1所述的一种基于身份信息鉴别的骚扰诈骗电话的防范方法,其特征在于,所述根据电话号码信息对名片信息中的组织身份信息和个人身份信息进行验证,包括:
验证号码对应的开户主体证明文件的开户名与组织身份信息的组织名称或个人身份信息的姓名一致;
验证组织身份信息的营业执照在有效时间内且经营状态正常;
验证组织身份信息的营业执照的经营范围与所属行业类型一致;
验证个人身份信息的姓名、身份证件号及人脸图片一致。
3.根据权利要求2所述的一种基于身份信息鉴别的骚扰诈骗电话的防范方法,其特征在于,所述步骤S2中,判断主叫号码对应的人脸信息与可信名片库的个人身份信息是否匹配,包括:
S21、将可信名片库中的个人身份信息的人脸图片作为样本数据集输入Resnet50进行特征提取,之后采用Arcface Loss进行预训练,得到初始权重;
S22、将初始权重作为预训练权重进行Triplet Loss的训练,得到特征提取器;
S23、将可信名片库中的个人身份信息的同一个人的数张人脸图片输入特征提取器进行向量提取并进行聚类,得到个人中心向量;
S24、对所有个人的个人中心向量进行聚类,得到各个簇的聚类中心向量;
S25、将主叫号码对应的人脸信息输入特征提取器进行向量提取并与聚类中心向量进行聚类,以确定目标簇;之后与目标簇内的所有个人中心向量进行距离比对,匹配距离最小的样本并判断最小距离是否小于阈值;若是,则匹配成功。
4.根据权利要求1-3任一项所述的一种基于身份信息鉴别的骚扰诈骗电话的防范方法,其特征在于,所述步骤S3中,判断主叫网元、被叫网元接收的呼叫请求是否与原始呼叫请求一致,包括以下步骤:
S31、客户端与主叫网元之间约定密钥,客户端利用约定密钥对原始呼叫请求进行签名加密后发送至主叫网元进行校验,校验通过后生成唯一会话标识并返回至客户端;原始呼叫请求包括主叫号码和被叫号码;
S32、客户端将唯一会话标识以及原始呼叫请求进行国密算法加密,得到第一加密数据;
S33、主叫网元对接收的呼叫请求和唯一会话标识进行国密算法加密,得到第二加密数据;
S34、对第一加密数据和第二加密数据进行解密,并根据唯一会话标识判断是否属于同一呼叫请求;若是,则转至步骤S35;
S35、根据主叫号码、被叫号码、唯一会话标识和主叫网元私钥加载生成主叫网元标识,并发送至被叫网元;
S36、被叫网元接收呼叫请求并对其进行国密算法加密,得到第三加密数据;
S37、对第三加密数据进行解密,解析主叫网元标识并根据唯一会话标识判断与原始呼叫请求是否属于同一呼叫请求;若是,则在被叫终端进行主叫号码对应的名片展示。
5.根据权利要求4所述的一种基于身份信息鉴别的骚扰诈骗电话的防范方法,其特征在于,所述国密算法采用国密SM4算法。
6.根据权利要求1-3任一项所述的一种基于身份信息鉴别的骚扰诈骗电话的防范方法,其特征在于,所述步骤S3之后,还包括以下步骤:
S4、被叫终端反馈主叫号码对应的组织身份信息,根据被叫终端反馈的组织身份信息对可信名片库的名片进行更新。
7.根据权利要求6所述的一种基于身份信息鉴别的骚扰诈骗电话的防范方法,其特征在于,所述被叫终端反馈的组织身份信息为本次通话所属行业类型;
根据被叫终端反馈的组织身份信息对可信名片库的名片进行更新包括:若本次通话所属行业类型与名片中的所属行业类型不一致,则将本次通话对应的名片信息从可信名片库中剔除。
8.一种基于身份信息鉴别的骚扰诈骗电话的防范系统,应用如权利要求1-7任一项所述的防范方法,其特征在于,所述防范系统包括:
采集模块,用于采集以电话号码为核心的名片信息,包括电话号码信息、组织身份信息和组织内的个人身份信息;其中,电话号码信息包括号码及其对应的开户主体证明文件;组织身份信息包括组织名称、所属行业类型和营业执照;个人身份信息包括姓名及其对应的人脸图片、身份证号码;
验证模块,用于根据电话号码信息对组织身份信息和个人身份信息进行验证,以形成可信名片库;
人脸识别模块,用于在主叫号码发起呼叫之前,采集主叫号码对应的人脸信息并判断其与可信名片库的个人身份信息是否匹配;
策略中心,用于在主叫号码对应的客户端发起原始呼叫请求之后,判断主叫网元、被叫网元接收的呼叫请求是否与原始呼叫请求一致;若是,则在被叫终端进行主叫号码对应的名片展示。
CN202211060892.5A 2022-08-31 2022-08-31 一种基于身份信息鉴别的骚扰诈骗电话的防范方法及系统 Active CN115134450B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211060892.5A CN115134450B (zh) 2022-08-31 2022-08-31 一种基于身份信息鉴别的骚扰诈骗电话的防范方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211060892.5A CN115134450B (zh) 2022-08-31 2022-08-31 一种基于身份信息鉴别的骚扰诈骗电话的防范方法及系统

Publications (2)

Publication Number Publication Date
CN115134450A CN115134450A (zh) 2022-09-30
CN115134450B true CN115134450B (zh) 2023-01-03

Family

ID=83387218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211060892.5A Active CN115134450B (zh) 2022-08-31 2022-08-31 一种基于身份信息鉴别的骚扰诈骗电话的防范方法及系统

Country Status (1)

Country Link
CN (1) CN115134450B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018099105A1 (zh) * 2016-12-02 2018-06-07 深圳市中兴微电子技术有限公司 一种通信号码处理方法、装置、终端及存储介质
CN114710591A (zh) * 2022-06-01 2022-07-05 浙江鹏信信息科技股份有限公司 一种骚扰诈骗电话的防范方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103518366A (zh) * 2011-05-09 2014-01-15 林仲宇 可对网络发信主叫电话号码验证与恶意网络发信侦测的方法及其系统
CN106130956A (zh) * 2016-06-03 2016-11-16 谢渤 一种电话验证方法和装置
CN109600752B (zh) * 2018-11-28 2022-01-14 国家计算机网络与信息安全管理中心 一种深度聚类诈骗检测的方法和装置
CN110312031A (zh) * 2018-12-27 2019-10-08 华为终端有限公司 来电号码处理方法及电子设备
CN111131629A (zh) * 2019-12-31 2020-05-08 宇龙计算机通信科技(深圳)有限公司 骚扰电话的处理方法、装置、存储介质以及终端

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018099105A1 (zh) * 2016-12-02 2018-06-07 深圳市中兴微电子技术有限公司 一种通信号码处理方法、装置、终端及存储介质
CN114710591A (zh) * 2022-06-01 2022-07-05 浙江鹏信信息科技股份有限公司 一种骚扰诈骗电话的防范方法及系统

Also Published As

Publication number Publication date
CN115134450A (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
CN109962784B (zh) 一种基于数字信封多证书的数据加解密及恢复方法
CN105516104B (zh) 一种基于tee的动态口令的身份验证方法及系统
AU2003212617B2 (en) A biometric authentication system and method
CN109150548A (zh) 一种数字证书签名、验签方法及系统、数字证书系统
CN106330850A (zh) 一种基于生物特征的安全校验方法及客户端、服务器
JP2001512654A (ja) ネットワーク環境での私用鍵の管理及び利用法
CN112329519B (zh) 一种安全的在线指纹匹配方法
CN108462696B (zh) 一种去中心化的区块链智能身份认证系统
CN110516435B (zh) 一种基于生物特征的私钥管理方法及装置
CN108540470A (zh) 基于电子认证标记的认证系统及方法
CN107517217A (zh) 一种基于指纹识别的多因子无线密钥填充系统
CN109327446A (zh) 身份认证方法、服务器、客户端及系统
Bathen et al. Selfis: Self-sovereign biometric ids
CN114996727A (zh) 基于掌纹掌静脉识别的生物特征隐私加密方法及系统
WO2020040634A1 (en) Integration of biometric and challenge response authentication
CN116545774B (zh) 一种音视频会议安全保密方法及系统
CN115134450B (zh) 一种基于身份信息鉴别的骚扰诈骗电话的防范方法及系统
CN112733179A (zh) 一种轻量级非交互隐私保护数据聚合方法
CN115051812A (zh) 一种基于二维码和生物特征的用户身份双重识别方法
CN110752932B (zh) 一种适用于第三方审计的高效云数据完整验证方法
CN108416592A (zh) 一种高速语音识别方法
Lin et al. A user authentication system using back-propagation network
CN107454044A (zh) 一种电子书阅读权限保护方法及系统
Durak et al. BioLocker: A practical biometric authentication mechanism based on 3D fingervein
CN110650012A (zh) 一种改进的sdn网络攻击检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant