CN114928498A - 一种欺诈信息识别方法、装置及计算机可读存储介质 - Google Patents

一种欺诈信息识别方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN114928498A
CN114928498A CN202210675326.9A CN202210675326A CN114928498A CN 114928498 A CN114928498 A CN 114928498A CN 202210675326 A CN202210675326 A CN 202210675326A CN 114928498 A CN114928498 A CN 114928498A
Authority
CN
China
Prior art keywords
information
plaintext
fraud
data information
desensitized data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210675326.9A
Other languages
English (en)
Inventor
王智明
徐雷
陶冶
边林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202210675326.9A priority Critical patent/CN114928498A/zh
Publication of CN114928498A publication Critical patent/CN114928498A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • H04L63/0442Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload wherein the sending and receiving network entities apply asymmetric encryption, i.e. different keys for encryption and decryption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0861Generation of secret information including derivation or calculation of cryptographic keys or passwords
    • H04L9/0869Generation of secret information including derivation or calculation of cryptographic keys or passwords involving random numbers or seeds
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/30Public key, i.e. encryption algorithm being computationally infeasible to invert or user's encryption keys not requiring secrecy
    • H04L9/3066Public key, i.e. encryption algorithm being computationally infeasible to invert or user's encryption keys not requiring secrecy involving algebraic varieties, e.g. elliptic or hyper-elliptic curves

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Analysis (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种欺诈信息识别方法、装置及计算机可读存储介质,所述方法包括:获取待发送的明文信息;对所述明文信息进行脱敏处理,得到脱敏后的数据信息;将脱敏后的数据信息与预存的敏感词特征库进行比较,输出所述脱敏后的数据信息是否为欺诈信息的判断结果。该方法、装置及计算机可读存储介质能够解决现有的欺诈信息识别方法容易产生事后处理、欺诈判断准确度低、隐私机密度低的问题。

Description

一种欺诈信息识别方法、装置及计算机可读存储介质
技术领域
本发明涉及信息安全技术领域,尤其涉及一种欺诈信息识别方法、装置及计算机可读存储介质。
背景技术
目前,个人隐私信息保护反欺诈系统中欺诈信息识别主要依托情报收集、作恶信息收集、用户业务层数据行为分析、异常信息(IP和手机号)库等技术手段,容易产生事后处理、欺诈判断准确度低、隐私机密度低等问题。
发明内容
本发明所要解决的技术问题是针对现有技术的上述不足,提供一种欺诈信息识别方法、装置及计算机可读存储介质,能够实现事前处理且隐私机密度高。
第一方面,本发明提供一种欺诈信息识别方法,包括:
获取待发送的明文信息;
对所述明文信息进行脱敏处理,得到脱敏后的数据信息;
将脱敏后的数据信息与预存的敏感词特征库进行比较,输出所述脱敏后的数据信息是否为欺诈信息的判断结果。
进一步地,所述对所述明文信息进行脱敏处理,得到脱敏后的数据信息,具体包括:
对所述明文信息按字节进行分隔,得到分隔后的明文字节流;
采用非对称随机数椭圆曲线流加密方法对所述分隔后的明文字节流进行加密,得到脱敏后的数据信息。
进一步地,所述采用非对称随机数椭圆曲线流加密方法对所述分隔后的明文字节流进行加密,得到脱敏后的数据信息,具体包括:
选定一条椭圆曲线,并随机选取所述椭圆曲线上的一点作为基点P(x,y);
随机选择一个正整数K作为私钥,并生成公钥Q=KP;
将Q和P发送给接收所述明文信息的用户;
将所述分隔后的明文字节流编码到椭圆曲线的M点,并产生一个随机整数R;
采用公钥对所述分隔后的明文字节流进行加密,得到脱敏后的数据信息C={RP,M+RQ}。
进一步地,所述椭圆曲线满足如下条件:
y2=x3+sx+t
s,t∈{负整数,0,正整数},且满足4us3+27ut2≠0
u∈{自然数}
式中,y为Y轴坐标,x为X轴坐标,s为随机参数。
进一步地,所述敏感词特征库中的敏感词是基于贝叶斯特征分类及提取的,提取敏感词特征向量的过程如下:
Figure BDA0003696276570000021
式中,n为预设上限阀值,取值范围为1,2,3,…,L,L为敏感词特征库中敏感词数量,P(wi)为特征wi的出现概率;P(cj/wi)为出现特征wi的前提下在第cj个文本中的概率;P(cj)为cj个文本的概率,P(wi/cj)为cj个文本中出现特征wi的文本数,P(dx/cj)为cj个文本中出现特征wi的概率。
进一步地,所述将脱敏后的数据信息与预存的敏感词特征库进行比较,输出所述脱敏后的数据信息是否为欺诈信息的判断结果,具体包括:
对脱敏后的数据信息进行向量化,得到脱敏后的字节流向量;
将脱敏后的字节流向量与预存的敏感词特征库进行比较,若存在f(w)-η≥0,则判断所述脱敏后的数据信息为正常信息,否则,判断所述脱敏后的数据信息为欺诈信息,其中,η为调整系数,f(w)的计算公式如下:
Figure BDA0003696276570000031
式中,L为敏感词特征库中敏感词数量,
Figure BDA0003696276570000032
Figure BDA0003696276570000033
的转置,
Figure BDA0003696276570000034
为脱敏后的字节流向量,
Figure BDA0003696276570000035
为敏感词特征库中的第x个敏感词特征向量,f(w)为第x个字节流向量匹配函数值。
进一步地,所述明文信息包括:明文短信信息、明文微信信息或明文邮件信息。
进一步地,所述输出所述脱敏后的数据信息是否为欺诈信息的判断结果之后,所述方法还包括:
若所述脱敏后的数据信息为欺诈信息,则将所述明文信息发送给内容和服务提供商/运营商,以使所述内容和服务提供商/运营商拦截所述明文信息,或者将所述明文信息发送至接收终端欺诈文件夹。
第二方面,本发明提供一种欺诈信息识别装置,包括:
信息获取模块,用于获取待发送的明文信息;
脱敏处理模块,与所述信息获取模块连接,用于对所述明文信息进行脱敏处理,得到脱敏后的数据信息;
欺诈识别模块,与所述脱敏处理模块连接,用于将脱敏后的数据信息与预存的敏感词特征库进行比较,输出所述脱敏后的数据信息是否为欺诈信息的判断结果。
第三方面,本发明提供一种欺诈信息识别装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现上述第一方面所述的欺诈信息识别方法。
第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的欺诈信息识别方法。
本发明提供的欺诈信息识别方法、装置及计算机可读存储介质,通过获取待发送的明文信息;并对所述明文信息进行脱敏处理,得到脱敏后的数据信息;以及将脱敏后的数据信息与预存的敏感词特征库进行比较,能够输出所述脱敏后的数据信息是否为欺诈信息的判断结果,由于本发明在发送明文信息之前对明文信息进行欺诈识别,且在识别过程中对明文信息进行脱敏处理,因此,能够实现事前处理且隐私机密度高,同时,通过与预存的敏感词特征库进行比较,能够提高欺诈判断的准确度,解决了现有的欺诈信息识别方法容易产生事后处理、欺诈判断准确度低、隐私机密度低的问题。
附图说明
图1为本发明实施例1的一种欺诈信息识别方法的流程图;
图2为本发明实施例的存储模型;
图3为本发明实施例2的一种欺诈信息识别装置的结构示意图;
图4为本发明实施例3的一种欺诈信息识别装置的结构示意图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面将结合附图对本发明实施方式作进一步地详细描述。
可以理解的是,此处描述的具体实施例和附图仅仅用于解释本发明,而非对本发明的限定。
可以理解的是,在不冲突的情况下,本发明中的各实施例及实施例中的各特征可相互组合。
可以理解的是,为便于描述,本发明的附图中仅示出了与本发明相关的部分,而与本发明无关的部分未在附图中示出。
可以理解的是,本发明的实施例中所涉及的每个单元、模块可仅对应一个实体结构,也可由多个实体结构组成,或者,多个单元、模块也可集成为一个实体结构。
可以理解的是,在不冲突的情况下,本发明的流程图和框图中所标注的功能、步骤可按照不同于附图中所标注的顺序发生。
可以理解的是,本发明的流程图和框图中,示出了按照本发明各实施例的系统、装置、设备、方法的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可代表一个单元、模块、程序段、代码,其包含用于实现规定的功能的可执行指令。而且,框图和流程图中的每个方框或方框的组合,可用实现规定的功能的基于硬件的系统实现,也可用硬件与计算机指令的组合来实现。
可以理解的是,本发明实施例中所涉及的单元、模块可通过软件的方式实现,也可通过硬件的方式来实现,例如单元、模块可位于处理器中。
实施例1:
本实施例提供一种欺诈信息识别方法,如图1所示,该方法包括:
步骤S101:获取待发送的明文信息。
在本实施例中,明文信息包括:明文短信信息、明文微信信息或明文邮件信息等,为了打击移动消息垃圾短信/邮件/微信,当发送终端通过运营商网络发出明文短信、微信或邮件时,运营商先获取待发送的明文信息,以便对该明文信息进行欺诈识别。
步骤S102:对所述明文信息进行脱敏处理,得到脱敏后的数据信息。
在本实施例中,为了保护用户的个人隐私信息,获取待发送的明文信息后,先对所述明文信息进行脱敏处理。
可选地,所述对所述明文信息进行脱敏处理,得到脱敏后的数据信息,具体包括:
对所述明文信息按字节进行分隔,得到分隔后的明文字节流;
采用非对称随机数椭圆曲线流加密方法对所述分隔后的明文字节流进行加密,得到脱敏后的数据信息。
在本实施例中,为了更好地保护用户个人隐私,对所述明文信息进行脱敏处理可以基于同态加密技术,同态加密(Fully homomorphic encryption,FHE)允许信息在计算和处理过程中仍然是加密的,而与管理数据的基础设施和云技术无关。比如,数据可以在不被查看、不以明文形式出现的情况下在不同参与方和云之间传输、分析和返回,同态加密使用不同的数学算法来进行加密,而且在过去10年间不断发展,本发明为了提高同态加密的效率,同态加密的过程包括:对所述明文信息按字节进行分隔,得到分隔后的明文字节流,再采用非对称随机数椭圆曲线流加密方法对所述分隔后的明文字节流进行加密(实现脱敏)。
具体地,将明文短信/微信/邮件信息分隔成一个一个字节,再使用非对称随机数椭圆曲线流加密方法对短信/微信/邮件明文字节流进行加密,将短信/微信/邮件明文的字节逐个加密。
可选地,所述采用非对称随机数椭圆曲线流加密方法对所述分隔后的明文字节流进行加密,得到脱敏后的数据信息,具体包括:
选定一条椭圆曲线,并随机选取所述椭圆曲线上的一点作为基点P(x,y);
随机选择一个正整数K作为私钥,并生成公钥Q=KP;
将Q和P发送给接收所述明文信息的用户;
将所述分隔后的明文字节流编码到椭圆曲线的M点,并产生一个随机整数R;
采用公钥对所述分隔后的明文字节流进行加密,得到脱敏后的数据信息C={RP,M+RQ}。
在本实施例中,随机整数R具体可以是随机数+当前时间构成的序列,当前时间可以精确到毫秒,在采用公钥对所述分隔后的明文字节流进行加密之后,接收所述明文信息的用户可以采用私钥K进行解密,得到明文M={RQ,C+KRP}。
具体地,所述椭圆曲线满足如下条件:
y2=x3+sx+t
s,t∈{负整数,0,正整数},且满足4us3+27ut2≠0
u∈{自然数}
式中,y为Y轴坐标,x为X轴坐标,s为随机参数。
在本实施例中,脱敏后的数据信息即是具有机密性的短信/微信/邮件密文。
步骤S103:将脱敏后的数据信息与预存的敏感词特征库进行比较,输出所述脱敏后的数据信息是否为欺诈信息的判断结果。
在本实施例中,为了对短信/微信/邮件进行甄别,本发明采用贝叶斯决策来对待过滤和分析的短信/微信/邮件进行过滤和分析,提取短信/微信/邮件特征向量,得到敏感词特征库。
可选地,所述敏感词特征库中的敏感词是基于贝叶斯特征分类及提取的,提取敏感词特征向量的过程如下:
Figure BDA0003696276570000071
式中,n为预设上限阀值,取值范围为1,2,3,…,L,L为敏感词特征库中敏感词数量,P(wi)为特征wi的出现概率;P(cj/wi)为出现特征wi的前提下在第cj个文本中的概率;P(cj)为cj个文本的概率,P(wi/cj)为cj个文本中出现特征wi的文本数,P(dx/cj)为cj个文本中出现特征wi的概率。
在本实施例中,敏感词是指带有欺诈倾向的词,x的取值范围是1,2,3,...L,L是敏感词特征库中敏感词数量,i是特征的个数,j是文本的个数。
可选地,所述将脱敏后的数据信息与预存的敏感词特征库进行比较,输出所述脱敏后的数据信息是否为欺诈信息的判断结果,具体包括:
对脱敏后的数据信息进行向量化,得到脱敏后的字节流向量;
将脱敏后的字节流向量与预存的敏感词特征库进行比较,若存在f(w)-η≥0,则判断所述脱敏后的数据信息为正常信息,否则,判断所述脱敏后的数据信息为欺诈信息,其中,η为调整系数,f(w)的计算公式如下:
Figure BDA0003696276570000081
式中,L为敏感词特征库中敏感词数量,
Figure BDA0003696276570000082
Figure BDA0003696276570000083
的转置,
Figure BDA0003696276570000084
为脱敏后的字节流向量,
Figure BDA0003696276570000085
为敏感词特征库中的第x个敏感词特征向量,f(w)为第x个字节流向量匹配函数值。
在本实施例中,将短信/微信/邮件加密后的字节流向量作为输入量,查询敏感词特征库,判断短信/微信/邮件是否为欺诈,若f(w)-η≥0,则判断该短信/微信/邮件为正常短信/微信/邮件,否则为欺诈短信/微信/邮件。
可选地,所述输出所述脱敏后的数据信息是否为欺诈信息的判断结果之后,所述方法还包括:
若所述脱敏后的数据信息为欺诈信息,则将所述明文信息发送给内容和服务提供商/运营商,以使所述内容和服务提供商/运营商拦截所述明文信息,或者将所述明文信息发送至接收终端欺诈文件夹。
在本实施例中,若判断出待发送的短信/微信/邮件为欺诈短信/微信/邮件,则将该欺诈短信/微信/邮件以及判断结果传送给内容和服务提供商/运营商做标记。内容和服务提供商/运营商可以拦截该欺诈短信/微信/邮件,或者将该欺诈短信/微信/邮件发送至接收终端的欺诈文件夹,接收终端可以删除或在安全状态下查看该欺诈短信/微信/邮件。
在本实施例中,如图2所示,欺诈短信/微信/邮件可以以三维向量的形式存储,欺诈短信/微信/邮件的判断结果可以采用稀疏矩阵存储。
在本实施例中,若判断出待发送的短信/微信/邮件为正常短信/微信/邮件,则将该正常短信/微信/邮件发送给接收终端。
本发明实施例提供的欺诈信息识别方法,通过获取待发送的明文信息;并对所述明文信息进行脱敏处理,得到脱敏后的数据信息;以及将脱敏后的数据信息与预存的敏感词特征库进行比较,能够输出所述脱敏后的数据信息是否为欺诈信息的判断结果,由于本发明在发送明文信息之前对明文信息进行欺诈识别,且在识别过程中对明文信息进行脱敏处理,因此,能够实现事前处理且隐私机密度高,同时,通过与预存的敏感词特征库进行比较,能够提高欺诈判断的准确度,解决了现有的欺诈信息识别方法容易产生事后处理、欺诈判断准确度低、隐私机密度低的问题。
实施例2:
如图3所示,本实施例提供一种欺诈信息识别装置,用于执行上述欺诈信息识别方法,包括:
信息获取模块11,用于获取待发送的明文信息;
脱敏处理模块12,与所述信息获取模块11连接,用于对所述明文信息进行脱敏处理,得到脱敏后的数据信息;
欺诈识别模块13,与所述脱敏处理模块12连接,用于将脱敏后的数据信息与预存的敏感词特征库进行比较,输出所述脱敏后的数据信息是否为欺诈信息的判断结果。
可选地,所述脱敏处理模块12具体包括:
字节分隔单元,用于对所述明文信息按字节进行分隔,得到分隔后的明文字节流;
椭圆加密单元,用于采用非对称随机数椭圆曲线流加密方法对所述分隔后的明文字节流进行加密,得到脱敏后的数据信息。
可选地,所述椭圆加密单元具体包括:
曲线选定单元,用于选定一条椭圆曲线,并随机选取所述椭圆曲线上的一点作为基点P(x,y);
公私钥生成单元,用于随机选择一个正整数K作为私钥,并生成公钥Q=KP;
发送单元,用于将Q和P发送给接收所述明文信息的用户;
编码单元,用于将所述分隔后的明文字节流编码到椭圆曲线的M点,并产生一个随机整数R;
字节流加密单元,用于采用公钥对所述分隔后的明文字节流进行加密,得到脱敏后的数据信息C={RP,M+RQ}。
可选地,所述椭圆曲线满足如下条件:
y2=x3+sx+t
s,t∈{负整数,0,正整数},且满足4us3+27ut2≠0
u∈{自然数}
式中,y为Y轴坐标,x为X轴坐标,s为随机参数。
可选地,所述敏感词特征库中的敏感词是基于贝叶斯特征分类及提取的,提取敏感词特征向量的过程如下:
Figure BDA0003696276570000101
式中,n为预设上限阀值,取值范围为1,2,3,…,L,L为敏感词特征库中敏感词数量,P(wi)为特征wi的出现概率;P(cj/wi)为出现特征wi的前提下在第cj个文本中的概率;P(cj)为cj个文本的概率,P(wi/cj)为cj个文本中出现特征wi的文本数,P(dx/cj)为cj个文本中出现特征wi的概率。
可选地,所述欺诈识别模块13具体包括:
向量化单元,用于对脱敏后的数据信息进行向量化,得到脱敏后的字节流向量;
比较单元,用于将脱敏后的字节流向量与预存的敏感词特征库进行比较,若存在f(w)-η≥0,则判断所述脱敏后的数据信息为正常信息,否则,判断所述脱敏后的数据信息为欺诈信息,其中,η为调整系数,f(w)的计算公式如下:
Figure BDA0003696276570000102
式中,L为敏感词特征库中敏感词数量,
Figure BDA0003696276570000103
Figure BDA0003696276570000104
的转置,
Figure BDA0003696276570000105
为脱敏后的字节流向量,
Figure BDA0003696276570000106
为敏感词特征库中的第x个敏感词特征向量,f(w)为第x个字节流向量匹配函数值。
可选地,所述明文信息包括:明文短信信息、明文微信信息或明文邮件信息。
可选地,所述装置还包括:
信息发送模块,用于若所述脱敏后的数据信息为欺诈信息,则将所述明文信息发送给内容和服务提供商/运营商,以使所述内容和服务提供商/运营商拦截所述明文信息,或者将所述明文信息发送至接收终端欺诈文件夹。
实施例3:
参考图4,本实施例提供一种欺诈信息识别装置,包括存储器21和处理器22,存储器21中存储有计算机程序,处理器22被设置为运行所述计算机程序以执行实施例1中的欺诈信息识别方法。
其中,存储器21与处理器22连接,存储器21可采用闪存或只读存储器或其他存储器,处理器22可采用中央处理器或单片机。
实施例4:
本实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例1中的欺诈信息识别方法。
该计算机可读存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、计算机程序模块或其他数据)的任何方法或技术中实施的易失性或非易失性、可移除或不可移除的介质。计算机可读存储介质包括但不限于RAM(Random Access Memory,随机存取存储器),ROM(Read-Only Memory,只读存储器),EEPROM(Electrically ErasableProgrammable read only memory,带电可擦可编程只读存储器)、闪存或其他存储器技术、CD-ROM(Compact Disc Read-Only Memory,光盘只读存储器),数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。
实施例2至实施例4提供的欺诈信息识别装置及计算机可读存储介质,通过获取待发送的明文信息;并对所述明文信息进行脱敏处理,得到脱敏后的数据信息;以及将脱敏后的数据信息与预存的敏感词特征库进行比较,能够输出所述脱敏后的数据信息是否为欺诈信息的判断结果,由于本发明在发送明文信息之前对明文信息进行欺诈识别,且在识别过程中对明文信息进行脱敏处理,因此,能够实现事前处理且隐私机密度高,同时,通过与预存的敏感词特征库进行比较,能够提高欺诈判断的准确度,解决了现有的欺诈信息识别方法容易产生事后处理、欺诈判断准确度低、隐私机密度低的问题。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

Claims (11)

1.一种欺诈信息识别方法,其特征在于,包括:
获取待发送的明文信息;
对所述明文信息进行脱敏处理,得到脱敏后的数据信息;
将脱敏后的数据信息与预存的敏感词特征库进行比较,输出所述脱敏后的数据信息是否为欺诈信息的判断结果。
2.根据权利要求1所述的欺诈信息识别方法,其特征在于,所述对所述明文信息进行脱敏处理,得到脱敏后的数据信息,具体包括:
对所述明文信息按字节进行分隔,得到分隔后的明文字节流;
采用非对称随机数椭圆曲线流加密方法对所述分隔后的明文字节流进行加密,得到脱敏后的数据信息。
3.根据权利要求2所述的欺诈信息识别方法,其特征在于,所述采用非对称随机数椭圆曲线流加密方法对所述分隔后的明文字节流进行加密,得到脱敏后的数据信息,具体包括:
选定一条椭圆曲线,并随机选取所述椭圆曲线上的一点作为基点P(x,y);
随机选择一个正整数K作为私钥,并生成公钥Q=KP;
将Q和P发送给接收所述明文信息的用户;
将所述分隔后的明文字节流编码到椭圆曲线的M点,并产生一个随机整数R;
采用公钥对所述分隔后的明文字节流进行加密,得到脱敏后的数据信息C={RP,M+RQ}。
4.根据权利要求3所述的欺诈信息识别方法,其特征在于,所述椭圆曲线满足如下条件:
y2=x3+sx+t
s,t∈{负整数,0,正整数},且满足4us3+27ut2≠0
u∈{自然数}
式中,y为Y轴坐标,x为X轴坐标,s为随机参数。
5.根据权利要求1所述的欺诈信息识别方法,其特征在于,所述敏感词特征库中的敏感词是基于贝叶斯特征分类及提取的,提取敏感词特征向量的过程如下:
Figure FDA0003696276560000021
式中,n为预设上限阀值,取值范围为1,2,3,…,L,L为敏感词特征库中敏感词数量,P(wi)为特征wi的出现概率;P(cj/wi)为出现特征wi的前提下在第cj个文本中的概率;P(cj)为cj个文本的概率,P(wi/cj)为cj个文本中出现特征wi的文本数,P(dx/cj)为cj个文本中出现特征wi的概率。
6.根据权利要求1所述的欺诈信息识别方法,其特征在于,所述将脱敏后的数据信息与预存的敏感词特征库进行比较,输出所述脱敏后的数据信息是否为欺诈信息的判断结果,具体包括:
对脱敏后的数据信息进行向量化,得到脱敏后的字节流向量;
将脱敏后的字节流向量与预存的敏感词特征库进行比较,若存在f(w)-η≥0,则判断所述脱敏后的数据信息为正常信息,否则,判断所述脱敏后的数据信息为欺诈信息,其中,η为调整系数,f(w)的计算公式如下:
Figure FDA0003696276560000022
x=1,2,3,…,L.
式中,L为敏感词特征库中敏感词数量,
Figure FDA0003696276560000023
Figure FDA0003696276560000024
的转置,
Figure FDA0003696276560000025
为脱敏后的字节流向量,
Figure FDA0003696276560000026
为敏感词特征库中的第x个敏感词特征向量,f(w)为第x个字节流向量匹配函数值。
7.根据权利要求1所述的欺诈信息识别方法,其特征在于,所述明文信息包括:明文短信信息、明文微信信息或明文邮件信息。
8.根据权利要求1所述的欺诈信息识别方法,其特征在于,所述输出所述脱敏后的数据信息是否为欺诈信息的判断结果之后,所述方法还包括:
若所述脱敏后的数据信息为欺诈信息,则将所述明文信息发送给内容和服务提供商/运营商,以使所述内容和服务提供商/运营商拦截所述明文信息,或者将所述明文信息发送至接收终端欺诈文件夹。
9.一种欺诈信息识别装置,其特征在于,包括:
信息获取模块,用于获取待发送的明文信息;
脱敏处理模块,与所述信息获取模块连接,用于对所述明文信息进行脱敏处理,得到脱敏后的数据信息;
欺诈识别模块,与所述脱敏处理模块连接,用于将脱敏后的数据信息与预存的敏感词特征库进行比较,输出所述脱敏后的数据信息是否为欺诈信息的判断结果。
10.一种欺诈信息识别装置,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现如权利要求1-8中任一项所述的欺诈信息识别方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-8中任一项所述的欺诈信息识别方法。
CN202210675326.9A 2022-06-15 2022-06-15 一种欺诈信息识别方法、装置及计算机可读存储介质 Pending CN114928498A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210675326.9A CN114928498A (zh) 2022-06-15 2022-06-15 一种欺诈信息识别方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210675326.9A CN114928498A (zh) 2022-06-15 2022-06-15 一种欺诈信息识别方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN114928498A true CN114928498A (zh) 2022-08-19

Family

ID=82815138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210675326.9A Pending CN114928498A (zh) 2022-06-15 2022-06-15 一种欺诈信息识别方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN114928498A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132392A (zh) * 2023-10-23 2023-11-28 蓝色火焰科技成都有限公司 车辆贷款欺诈风险预警方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107135494A (zh) * 2017-04-24 2017-09-05 北京小米移动软件有限公司 垃圾短信识别方法及装置
CN107155178A (zh) * 2016-03-03 2017-09-12 深圳市新悦蓝图网络科技有限公司 一种基于智能算法的垃圾短信过滤方法
CN111079171A (zh) * 2019-11-11 2020-04-28 重庆邮电大学 一种基于区块链的医疗数据隐私保护方法及存储介质
CN111198947A (zh) * 2020-01-06 2020-05-26 南京中新赛克科技有限责任公司 基于朴素贝叶斯优化下的卷积神经网络诈骗短信分类方法和系统
CN111651598A (zh) * 2020-05-28 2020-09-11 上海勃池信息技术有限公司 一种通过中心向量相似度匹配的垃圾文本审核装置和方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107155178A (zh) * 2016-03-03 2017-09-12 深圳市新悦蓝图网络科技有限公司 一种基于智能算法的垃圾短信过滤方法
CN107135494A (zh) * 2017-04-24 2017-09-05 北京小米移动软件有限公司 垃圾短信识别方法及装置
CN111079171A (zh) * 2019-11-11 2020-04-28 重庆邮电大学 一种基于区块链的医疗数据隐私保护方法及存储介质
CN111198947A (zh) * 2020-01-06 2020-05-26 南京中新赛克科技有限责任公司 基于朴素贝叶斯优化下的卷积神经网络诈骗短信分类方法和系统
CN111651598A (zh) * 2020-05-28 2020-09-11 上海勃池信息技术有限公司 一种通过中心向量相似度匹配的垃圾文本审核装置和方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李围围: "《垃圾短信识别的探索与研究》", 《全国优秀硕士学位论文电子期刊》, pages 51 - 53 *
王金栋: "《智能识别内容的垃圾短信系统设计》", 《内江科技》, pages 3 *
钱萍: "《无线传感器网络隐私保护方法》", 《电信科学》, pages 4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132392A (zh) * 2023-10-23 2023-11-28 蓝色火焰科技成都有限公司 车辆贷款欺诈风险预警方法及系统
CN117132392B (zh) * 2023-10-23 2024-01-30 蓝色火焰科技成都有限公司 车辆贷款欺诈风险预警方法及系统

Similar Documents

Publication Publication Date Title
Pouliot et al. The shadow nemesis: Inference attacks on efficiently deployable, efficiently searchable encryption
US10430598B2 (en) Secure generalized bloom filter
EP3046286A1 (en) Information processing method, program, and information processing apparatus
CN109766707B (zh) 基于区块链的数据处理方法、装置、设备和介质
CN110224808B (zh) 基于区块链的银行数据共享方法、装置、计算机设备和存储介质
CN111756522A (zh) 数据处理方法及系统
CN111522973B (zh) 一种融合压缩感知的隐私保护图像检索方法
CN114928498A (zh) 一种欺诈信息识别方法、装置及计算机可读存储介质
Huang et al. Efficiently secure data privacy on hybrid cloud
Alia et al. Cryptography based authentication methods
CN112437060A (zh) 一种数据传输方法、装置、计算机设备及存储介质
CN111475690B (zh) 字符串的匹配方法和装置、数据检测方法、服务器
CN113918977A (zh) 基于物联网和大数据分析的用户信息传输装置
CN116108497B (zh) 一种基于身份匿名的医疗数据轻量级云存储方法及装置
CN115632777B (zh) 数据处理方法及电子设备
WO2023059501A1 (en) Statistically private oblivious transfer from cdh
CN114422230B (zh) 一种基于数据加密的信息传输系统
CN110149210A (zh) 一种数据传输方法及装置
Zhou et al. Android malware classification approach based on host-level encrypted traffic shaping
CN110868499B (zh) 话单生成、校验方法、装置及设备、存储介质
CN110598426A (zh) 基于信息安全的数据通信方法、装置、设备和存储介质
CN114500580B (zh) 一种基于区块链的分布式存储系统及方法
Choorod et al. Classifying tor traffic encrypted payload using machine learning
CN114337983B (zh) 数据处理方法、装置、计算机设备及存储介质
US11809588B1 (en) Protecting membership in multi-identification secure computation and communication

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination