CN113992797B - 一种欺诈防控平台及方法 - Google Patents

一种欺诈防控平台及方法 Download PDF

Info

Publication number
CN113992797B
CN113992797B CN202110934852.8A CN202110934852A CN113992797B CN 113992797 B CN113992797 B CN 113992797B CN 202110934852 A CN202110934852 A CN 202110934852A CN 113992797 B CN113992797 B CN 113992797B
Authority
CN
China
Prior art keywords
fraud
sentences
sentence
sensitive words
sensitive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110934852.8A
Other languages
English (en)
Other versions
CN113992797A (zh
Inventor
锺一磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Xiaoyi Information Technology Co ltd
Original Assignee
Zhejiang Xiaoyi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Xiaoyi Information Technology Co ltd filed Critical Zhejiang Xiaoyi Information Technology Co ltd
Priority to CN202110934852.8A priority Critical patent/CN113992797B/zh
Publication of CN113992797A publication Critical patent/CN113992797A/zh
Application granted granted Critical
Publication of CN113992797B publication Critical patent/CN113992797B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M11/00Telephonic communication systems specially adapted for combination with other electrical systems
    • H04M11/04Telephonic communication systems specially adapted for combination with other electrical systems with alarm systems, e.g. fire, police or burglar alarm systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Technology Law (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种欺诈防控平台及方法,已有欺诈事件,将当前通讯请求的呼叫号码、当前通讯业务的声音信号与存储有已有欺诈事件发起端号码的号码识别库、存储有已有欺诈事件音频信息的音频识别库进行对比,判断当前通讯请求的呼叫号码、当前通讯业务的声音信号是否疑似欺诈;根据已有欺诈事件中出现的敏感词句的相关性,筛选出权重高的敏感词句进行可能欺诈句式的随机组合,通过将通话内容与可能的欺诈句式的比对,判断当前通话内容是否涉及欺诈内容。本申请有效利用了以往事件的经验教训,避免同样的欺诈手段在不同对象上的反复利用,对于欺诈事件的识别和制止起到了重要的防范预警作用。

Description

一种欺诈防控平台及方法
技术领域
本发明涉及防欺诈领域,尤其指一种欺诈防控平台及方法。
背景技术
随着网络技术的发展速度越来越快,欺诈事件的发生也越来越频频繁。某些 动机不纯人员通过技术手段盗取用户的个人信息,拨打电话骗取用户的财产,给 个人、社会造成巨大损失,在“成功”实施之后,从用户意识自己被骗,到向有 关部门报警、立案、调查取证,再到结果反馈,这一系列的时间节点跨度大(月 度计量),取证困难,有效追查效率低,且最终调查结果不理想。从服务商侧来 看,目前通话录音普遍在若干小时后同步质检平台,从机器拦截到人工复检使得 质检效率不足,无法在事中拦截风险,仅能在事后追回损失。
发明内容
本发明目的在于利用已有欺诈事件,通过分析已有欺诈事件的关联性,预判当前通话 是否涉嫌欺诈,从而提前做出欺诈预判的一种欺诈防控平台及方法。
一种欺诈防控方法,包括:
采用报备机制,建立报备信息库,所述报备信息库用于存储通讯端报备信息;
S10,接收到通讯请求时,提取通讯业务的呼叫号码,识别所述呼叫号码是否疑似欺诈, 若是,则转入S60,否则转入下一步;
S20,提取通讯业务的声音信号,判断所述声音信号是否疑似欺诈,若是,则转入S60, 否则转入下一步;
S30,提取通讯业务的通话内容,判断所述通话内容是否涉及欺诈内容,若是,则转入 下一步,否则作为正常通话处理;
S60,在信令保持的同时接入人工监听,若确定通话涉及欺诈则联动报警,并判断外呼 请求的发出方是否位于报备信息库内,若所述外呼请求的发出方位于报备信息库内,则根 据所述报备信息确定对应通讯端;否则,锁定所述呼叫号码,并根据所述通话内容,实施 第二预警操作。
进一步地,所述判断通话是否涉及欺诈,包括:建立已有欺诈事件库A, A={A1,A2,...,An},每个欺诈事件Am包括通话发起端号码Am1、音频信息Am2以及通话内容Am3,提取所述欺诈事件Am中每次通话的通话发起端号码加入号码识别库;将所述音频信 息Am2,加入音频识别库;根据所述通话内容Am3建立欺诈语句检测模型。
进一步地,所述判断所述呼叫号码是否疑似欺诈的方法为:判断所述呼叫号码是否存 在于号码识别库中,若存在,则判断该呼叫号码疑似欺诈;
判断所述声音信号是否疑似欺诈的方法为:提取所述声音信号中的音色信号、振幅信 号以及频率信号与音频识别库中的音色信号、振幅信号以及频率信号进行对比,如出现任 意两种信号对比相同的情况,则判断所述声音信号疑似欺诈;
判断所述通话内容是否涉及欺诈内容的方法为:进行实时语音识别,提取音频信号转 成文字信号输入欺诈语句检测模型进行欺诈识别,若欺诈检测模型输出的检测结果为疑似 欺诈。
进一步地,所述欺诈语句检测模型的建立包括:
计算欺诈事件Am和欺诈事件Ap之间的第一相关性指标
Figure BDA0003212620340000021
其中m、p∈[1,n],
Figure BDA0003212620340000022
大于 1且
Figure BDA0003212620340000023
从所述欺诈事件Am中的通话内容Am3,从通话内容Am3中提取i个敏感词句,标记为敏感词句αm,αm=[αm1,...,αmi];
计算各个所述敏感词句αmj之间的第二相关性指标γmjk;其中γmjk表示αmj和αmk之间的 第二相关性,其中k∈[1,i],γmjk≤1且γmjk=γmkj
当欺诈事件Am中的某两个敏感词句同时出现在同一欺诈事件Ap中时,更新该两个敏感 词句的第二相关性:
Figure BDA0003212620340000024
当欺诈事件Am中的某两个敏感词句同时出现在多个欺诈事件Ax、Ay、Az、……中时,更新该两个敏感词句的第二相关性:
Figure BDA0003212620340000025
筛选出已有欺诈事件库A中的某个敏感词句作为标定对象;
以所述标定对象为基准,对所述已有欺诈事件库A中的所有敏感词句进行相关性标定, 以每个敏感词句与所述标定对象的第二相关性为每个敏感词句赋予相应的权重μo,组成权 重矩阵μ=[μ12,...,μr],其中o∈[1,r];
将所述权重μo超过设定阈值的敏感词句放入第一库存;
对所述第一库存中的敏感词句进行组合,生成可能的欺诈句式;
将所述欺诈句式加入欺诈语句检测模型。
进一步地,根据所述欺诈事件对应的欺诈号码、声音信号以及敏感词句的重合率,计 算欺诈事件Am和欺诈事件Ap之间的第一相关性指标
Figure BDA0003212620340000031
Figure BDA0003212620340000032
其中κ1、κ2、κ3分别对应敏感词句的重合率、欺诈号码的相关性、声音信号的相似性,且κ1、 κ2、κ3均小于1,λ1、λ2、λ3分别对应所述敏感词句的重合率、欺诈号码的相关性、声音 信号的相似性对于欺诈相关性的影响因子,且λ123=1。
进一步地,计算各个所述敏感词句αmj之间的第二相关性指标γmjk:将已有欺诈事件库A 中出现的敏感词句进行同语义归类,生成多个词句库;当敏感词句αmj和αmk属于同一词句 库时,则γmjk=1;当敏感词句αmj和αmk不属于同一词句库时,则对敏感词句αmj对应的词句 库和敏感词句αmk对应的词句库进行语义逻辑判断,根据语义逻辑的相关性得到αmj和αmk的 第二相关性指标γmjk
进一步地,述标定对象为已有欺诈事件库A中出现频次最高的敏感词句。
本申请还提供了一种欺诈防控平台,包括:
报备信息库,用于存储通讯端报备信息;所述报备信息包括实名认证、业务登记和节 点报备;
通讯信息提取单元,用于提取通讯业务中的通讯信息,所述通讯信息包括呼叫号码、 声音信号以及通话内容;
通讯信息识别单元,用于判断所述通讯信息是否涉及欺诈;
监听系统,用于对当前通话内容进行监听,当确认所述通话信息涉及欺诈时联动报警;
报警系统,用于接收到报警信号时,判断外呼请求的发出方是否位于报备信息库内, 若所述外呼请求的发出方位于所述报备信息库内,则根据所述报备信息确定对应通讯端, 实施第一预警操作;若否,则锁定所述呼叫号码,并根据所述通话内容,实施第二预警操 作。
进一步地,所述通讯信息识别单元包括号码识别库,音频识别库以及欺诈语句检测模 型。
进一步地,所述判断所述通讯信息是否涉及欺诈包括:判断所述呼叫号码是否疑似欺 诈:判断所述呼叫号码是否存在于号码识别库中,若存在,则判断该呼叫号码疑似欺诈; 判断所述声音信号是否疑似欺诈:提取所述声音信号中的音色信号、振幅信号以及频率信 号与音频识别库中音频信息的音色信号、振幅信号以及频率信号进行对比,如出现任意两 种信号对比相同的情况,则判断所述声音信号疑似欺诈;判断所述通话内容是否涉及欺诈 内容:进行实时语音识别,提取音频信号转成文字信号输入欺诈语句检测模型进行欺诈识 别,若欺诈检测模型输出的检测结果为疑似欺诈。
与现有技术相比,本申请的有益效果为:本申请结合已有欺诈事件,将当前通讯请求 的呼叫号码、当前通讯业务的声音信号与存储有已有欺诈事件发起端号码的号码识别库、 存储有已有欺诈事件音频信息的音频识别库进行对比,判断当前通讯请求的呼叫号码、当 前通讯业务的声音信号是否疑似欺诈;根据已有欺诈事件中出现的敏感词句的相关性,筛 选出权重高的敏感词句进行可能欺诈句式的随机组合,通过将通话内容与可能的欺诈句式 的比对,判断当前通话内容是否涉及欺诈内容;对于疑似欺诈或涉及欺诈内容的通话接入 人工监听,再次确认通话是否涉及欺诈,并采取相应操作。本申请将通讯欺诈(或电信欺 诈)通话过程的每一步与已有欺诈事件的相应信息进行对比,有效利用了以往事件的经验 教训,避免同样的欺诈手段在不同对象上的反复利用,对于欺诈事件的识别和制止起到了 重要的防范预警作用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技 术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明 的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以 根据这些附图获得其他的附图。
图1为欺诈防控平台示意图;
图2为欺诈防控方法流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施 例进行详细描述。
一种欺诈防控平台,如图1所示,包括:
报备信息库100,用于存储通讯端报备信息,报备信息包括实名认证、业务登记和节点 报备;
通讯信息提取单元200,用于提取通讯业务中的通讯信息,通讯信息包括呼叫号码、声 音信号以及通话内容;
通讯信息识别单元300,用于判断通讯信息是否涉及欺诈;通讯信息识别单元300包括 号码识别库310,音频识别库320以及欺诈语句检测模型330。
监听系统400,用于对当前通话内容进行监听,当确认通话信息涉及欺诈时联动报警;
报警系统500,用于接收到报警信号时,判断外呼请求的发出方是否位于报备信息库内, 若外呼请求的发出方位于报备信息库内,则根据报备信息确定对应通讯端,实施第一预警 操作;若否,则锁定呼叫号码,并根据通话内容,实施第二预警操作。
判断通讯信息是否涉及欺诈包括:判断呼叫号码是否疑似欺诈:判断呼叫号码是否存 在于号码识别库中,若存在,则判断该呼叫号码疑似欺诈;判断声音信号是否疑似欺诈: 提取声音信号中的音色信号、振幅信号以及频率信号与音频识别库中的音色信号、振幅信 号以及频率信号进行对比,如出现任意两种信号对比相同的情况,则判断声音信号疑似欺 诈;判断通话内容是否涉及欺诈内容:进行实时语音识别,提取音频信号转成文字信号输 入欺诈语句检测模型进行欺诈识别,若欺诈检测模型输出的检测结果为疑似欺诈。
基于上述欺诈防控平台的欺诈防控方法,包括:
首先,采用报备机制,建立报备信息库,报备信息库用于存储通讯端报备信息。报备 信息包括实名认证、业务登记和节点报备。对企业、法人、经办人的业务资格进行实名核验,保证风险发生时有责可追。分析接入用户的业务安全性,剔除或加大对高风险业务的监控,保证通讯环境的安全性。对用户来源节点、网关节点的信息收录,每个节点进行实 名认证,落实责任。
其次,建立已有欺诈事件库A,A={A1,A2,...,An},每个欺诈事件Am包括通话发起端号 码Am1、音频信息Am2以及通话内容Am3,提取所述欺诈事件Am中每次通话的通话发起端号 码加入号码识别库;将所述音频信息Am2,加入音频识别库;根据所述通话内容Am3建立欺诈语句检测模型。有时一个欺诈事件的发生往往包括环环相扣的多次通话,每次通话的发起端不尽相同,通话人和通信内容也不近相同,为了防止同一个发起端多次发起欺诈通话,侵害更多人的利益,有必要将欺诈事件中每次通话的发起端号码进行汇总,加入到号码识别库中。同样的,考虑到每个人的声音都具有差异性,而实施欺诈通话的人员有限,必然 是一个人要进行多次欺诈通话,同类型的通话内容也具有一定的相似性,因此,对欺诈事 件中通话录音中的音频信息进行分析,提取音频信息中的音色信号、振幅信号以及频率信号,加入音频识别库,对通话内容中的敏感词句进行拆解再组合,建立欺诈语句检测模型。
实施欺诈防控的步骤包括:
S10,接收到通讯请求时,提取通讯业务的呼叫号码,识别所述呼叫号码是否疑似欺诈, 若是,则转入S60,否则转入下一步;
判断呼叫号码是否疑似欺诈的方法为:判断呼叫号码是否存在于号码识别库中,若存 在,则判断该呼叫号码疑似欺诈;
S20,提取通讯业务的声音信号,判断所述声音信号是否疑似欺诈,若是,则转入S60, 否则转入下一步;
判断声音信号是否疑似欺诈的方法为:提取声音信号中的音色信号、振幅信号以及频 率信号与音频识别库中音频信号的音色信号、振幅信号以及频率信号进行对比,如出现任 意两种信号对比相同的情况,则判断该声音信号疑似欺诈。由于人的声音是由喉部的肌肉 收缩引起声带震动,再经过口腔、鼻腔的共鸣后发出。每个人的声带及其共鸣器官的结构 特征不一样,震动时发出的音色(声谱)就像人的指纹一样,相同的概率是非常低的。因 此,通过声音信号可以识别出发出呼叫的人员是否曾参与过欺诈。
S30,提取通讯业务的通话内容,判断所述通话内容是否涉及欺诈内容,若是,则转入 下一步,否则作为正常通话处理,作为正常通话处理不排除对于通话进行其他方式的监控 和处理。
判断通话内容是否涉及欺诈内容的方法为:进行实时语音识别,提取音频信号转成文 字信号输入欺诈语句检测模型进行欺诈识别,若欺诈检测模型输出的检测结果为疑似欺诈。
欺诈语句检测模型的建立是根据同一欺诈事件中出现的敏感词句的关联性以及不同欺 诈事件的关联性,得出存在相关性的多组敏感词句及其用相关性指标表示的相关度,选择 一敏感词句作为标定对象,按照每个敏感词句与该标定对象的相关性,对所有敏感对象的 相关性指标进行归一化处理后,得到相应的权重,设定权重阈值,将超过该阈值的敏感词 句筛选出来,进行逻辑组合,生成可能的欺诈句式,由所有可能的欺诈句式生成欺诈语句 检测模型。具体包括:
计算欺诈事件Am和欺诈事件Ap之间的第一相关性指标
Figure BDA0003212620340000061
其中m、p∈[1,n],
Figure BDA0003212620340000062
大于1且
Figure BDA0003212620340000071
两个欺诈事件的第一相关性指标越大,表示这两个欺诈事件属于同类欺诈的 可能性越高,两个欺诈事件中涉及到的敏感词句的重合性越高,当然这里的重合性是根据 敏感词句的语义特征来判断的。
从欺诈事件Am中的通话内容Am3,从通话内容Am3中提取i个敏感词句,标记为敏感词句αm,αm=[αm1,...,αmi]。
计算各个敏感词句αmj之间的第二相关性指标γmjk;其中γmjk表示αmj和αmk之间的第二 相关性,其中k∈[1,i],γmjk≤1且γmjk=γmkj;各个敏感词句之间是存在相关性的,比如“出 车祸”与“急需用钱”在电信欺诈中语义逻辑的相关性非常高,“借钱”与“借点钱”就 是属于同语义词句。
当欺诈事件Am中的某两个敏感词句同时出现在同一欺诈事件Ap中时,更新该两个敏感 词句的第二相关性:
Figure BDA0003212620340000072
当欺诈事件Am中的某两个敏感词句同时出现在多个欺诈事件Ax、Ay、Az、……中时,更新该两个敏感词句的第二相关性:
Figure BDA0003212620340000073
当不同欺诈事件中同时都出现某 两个敏感词句时,说明这两个敏感词句的相关性相对于只出现在一个欺诈事件的其他敏感 词句的相关性更高,不仅要考虑两个敏感词句的相关性还要考虑不同欺诈事件之间的相关 性。
筛选出已有欺诈事件库A中的某个敏感词句作为标定对象,其中标定对象可选择已有 欺诈事件库A中出现频次最高的敏感词句;以标定对象为基准,对已有欺诈事件库A中的所 有敏感词句进行相关性标定,以每个敏感词句与标定对象的第二相关性为每个敏感词句赋 予相应的权重μo,组成权重矩阵μ=[μ12,...,μr],其中o∈[1,r]。这一步是对对所有敏感 对象的相关性指标进行归一化处理后,目的是便于在同一基准下对所有敏感词句进行权重 排序,从而选择出与欺诈事件相关性更高的敏感词句。
将权重μo超过设定阈值的敏感词句放入第一库存;对第一库存中的敏感词句进行组合, 生成可能的欺诈句式;将欺诈句式加入欺诈语句检测模型。
其中,根据欺诈事件对应的欺诈号码、声音信号以及敏感词句的重合率,计算欺诈事 件Am和欺诈事件Ap之间的第一相关性指标
Figure BDA0003212620340000081
Figure BDA0003212620340000082
其中κ1、κ2、κ3分别对应敏感词句的重合率、欺诈号码的相关性、声音信号的相似性,且κ1、κ2、κ3均 小于1,λ1、λ2、λ3分别对应敏感词句的重合率、欺诈号码的相关性、声音信号的相似性 对于欺诈相关性的影响因子,且λ123=1。
其中,计算各个敏感词句αmj之间的第二相关性指标γmjk:将已有欺诈事件库A中出现 的敏感词句进行同语义归类,生成多个词句库;当敏感词句αmj和αmk属于同一词句库时,则γmjk=1;当敏感词句αmj和αmk不属于同一词句库时,则对敏感词句αmj对应的词句库和敏感词句αmk对应的词句库进行语义逻辑判断,根据语义逻辑的相关性得到αmj和αmk的第二相关性指标γmjk
S60,在信令保持的同时接入人工监听,若确定通话涉及欺诈则联动报警,并判断外呼 请求的发出方是否位于报备信息库内,若外呼请求的发出方位于报备信息库内,则根据报 备信息确定对应通讯端;否则,锁定呼叫号码,并根据通话内容,实施第二预警操作。具 体的第一预警操作、第二预警操作内容具有多样性,本申请不予限制。
应该理解的是,本发明所公开的实施例不限于这里所公开的特定结构、处理步骤,而 应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是,在 此使用的术语仅用于描述特定实施例的目的,而并不意味着限制。
虽然本发明所公开的实施方式如上,但的内容只是为了便于理解本发明而采用的实施 方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所 公开的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发 明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (4)

1.一种欺诈防控方法,其特征在于,包括:
采用报备机制,建立报备信息库,所述报备信息库用于存储通讯端报备信息;
S10,接收到通讯请求时,提取通讯业务的呼叫号码,识别所述呼叫号码是否疑似欺诈,若是,则转入S60,否则转入下一步;
S20,提取通讯业务的声音信号,判断所述声音信号是否疑似欺诈,若是,则转入S60,否则转入下一步;
S30,提取通讯业务的通话内容,判断所述通话内容是否涉及欺诈内容,若是,则转入下一步,否则作为正常通话处理;
S60,在信令保持的同时接入人工监听,若确定通话涉及欺诈则联动报警,并判断外呼请求的发出方是否位于报备信息库内,若所述外呼请求的发出方位于报备信息库内,则根据所述报备信息确定对应通讯端;否则,锁定所述呼叫号码,并根据所述通话内容,实施第二预警操作;
所述判断通话是否涉及欺诈,包括:
建立已有欺诈事件库A,A={A1,A2,...,An},每个欺诈事件Am包括通话发起端号码Am1、音频信息Am2以及通话内容Am3,提取所述欺诈事件Am中每次通话的通话发起端号码加入号码识别库;将所述音频信息Am2,加入音频识别库;根据所述通话内容Am3建立欺诈语句检测模型;
所述判断所述呼叫号码是否疑似欺诈的方法为:判断所述呼叫号码是否存在于号码识别库中,若存在,则判断该呼叫号码疑似欺诈;
判断所述声音信号是否疑似欺诈的方法为:提取所述声音信号中的音色信号、振幅信号以及频率信号与音频识别库中音频信息的音色信号、振幅信号以及频率信号进行对比,如出现任意两种信号对比相同的情况,则判断所述声音信号疑似欺诈;
判断所述通话内容是否涉及欺诈内容的方法为:进行实时语音识别,提取音频信号转成文字信号输入欺诈语句检测模型进行欺诈识别,若欺诈检测模型输出的检测结果为疑似欺诈;
所述欺诈语句检测模型的建立包括:
计算欺诈事件Am和欺诈事件Ap之间的第一相关性指标
Figure FDA0003618187210000011
其中m、p∈[1,n],
Figure FDA0003618187210000021
大于1且
Figure FDA0003618187210000022
从所述欺诈事件Am中的通话内容Am3,从通话内容Am3中提取i个敏感词句,标记为敏感词句αm,αm=[αm1,...,αmi];
计算各个所述敏感词句αmj之间的第二相关性指标γmjk;其中γmjk表示αmj和αmk之间的第二相关性,其中k∈[1,i],γmjk≤1且γmjk=γmkj
当欺诈事件Am中的某两个敏感词句同时出现在同一欺诈事件Ap中时,更新该两个敏感词句的第二相关性:
Figure FDA0003618187210000023
当欺诈事件Am中的某两个敏感词句同时出现在多个欺诈事件Ax、Ay、Az、……中时,更新该两个敏感词句的第二相关性:
Figure FDA0003618187210000024
筛选出已有欺诈事件库A中的某个敏感词句作为标定对象;
以所述标定对象为基准,对所述已有欺诈事件库A中的所有敏感词句进行相关性标定,以每个敏感词句与所述标定对象的第二相关性为每个敏感词句赋予相应的权重μo,组成权重矩阵μ=[μ12,...,μr],其中o∈[1,r];
将所述权重μo超过设定阈值的敏感词句放入第一库存;
对所述第一库存中的敏感词句进行组合,生成可能的欺诈句式;
将所述欺诈句式加入欺诈语句检测模型。
2.根据权利要求1所述的一种欺诈防控方法,其特征在于,根据所述欺诈事件对应的欺诈号码、声音信号以及敏感词句的重合率,计算欺诈事件Am和欺诈事件Ap之间的第一相关性指标
Figure FDA0003618187210000025
其中κ1、κ2、κ3分别对应敏感词句的重合率、欺诈号码的相关性、声音信号的相似性,且κ1、κ2、κ3均小于1,λ1、λ2、λ3分别对应所述敏感词句的重合率、欺诈号码的相关性、声音信号的相似性对于欺诈相关性的影响因子,且λ123=1。
3.根据权利要求1所述的一种欺诈防控方法,其特征在于,计算各个所述敏感词句αmj之间的第二相关性指标γmjk
将已有欺诈事件库A中出现的敏感词句进行同语义归类,生成多个词句库;
当敏感词句αmj和αmk属于同一词句库时,则γmjk=1;
当敏感词句αmj和αmk不属于同一词句库时,则对敏感词句αmj对应的词句库和敏感词句αmk对应的词句库进行语义逻辑判断,根据语义逻辑的相关性得到αmj和αmk的第二相关性指标γmjk
4.根据权利要求3所述的一种欺诈防控方法,其特征在于,所述标定对象为已有欺诈事件库A中出现频次最高的敏感词句。
CN202110934852.8A 2021-08-16 2021-08-16 一种欺诈防控平台及方法 Active CN113992797B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110934852.8A CN113992797B (zh) 2021-08-16 2021-08-16 一种欺诈防控平台及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110934852.8A CN113992797B (zh) 2021-08-16 2021-08-16 一种欺诈防控平台及方法

Publications (2)

Publication Number Publication Date
CN113992797A CN113992797A (zh) 2022-01-28
CN113992797B true CN113992797B (zh) 2022-08-23

Family

ID=79735163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110934852.8A Active CN113992797B (zh) 2021-08-16 2021-08-16 一种欺诈防控平台及方法

Country Status (1)

Country Link
CN (1) CN113992797B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117523683B (zh) * 2024-01-05 2024-03-29 湖北微模式科技发展有限公司 一种基于生物特征识别的欺诈视频检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104469025A (zh) * 2014-11-26 2015-03-25 杭州东信北邮信息技术有限公司 一种基于聚类算法的实时拦截诈骗电话的方法和系统
CN106550155A (zh) * 2016-11-25 2017-03-29 上海欣方智能系统有限公司 对可疑号码进行诈骗样本甄别归类及拦截的方法及系统
CN107958215A (zh) * 2017-11-23 2018-04-24 深圳市分期乐网络科技有限公司 一种防欺诈识别方法、装置、服务器及存储介质
CN110177369A (zh) * 2019-04-15 2019-08-27 深圳壹账通智能科技有限公司 智能通讯监控方法、装置及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9692885B2 (en) * 2015-11-17 2017-06-27 Microsoft Technology Licensing, Llc Determining scam risk during a voice call

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104469025A (zh) * 2014-11-26 2015-03-25 杭州东信北邮信息技术有限公司 一种基于聚类算法的实时拦截诈骗电话的方法和系统
CN106550155A (zh) * 2016-11-25 2017-03-29 上海欣方智能系统有限公司 对可疑号码进行诈骗样本甄别归类及拦截的方法及系统
CN107958215A (zh) * 2017-11-23 2018-04-24 深圳市分期乐网络科技有限公司 一种防欺诈识别方法、装置、服务器及存储介质
CN110177369A (zh) * 2019-04-15 2019-08-27 深圳壹账通智能科技有限公司 智能通讯监控方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN113992797A (zh) 2022-01-28

Similar Documents

Publication Publication Date Title
CN106550155B (zh) 对可疑号码进行诈骗样本甄别归类及拦截的方法及系统
US8219404B2 (en) Method and apparatus for recognizing a speaker in lawful interception systems
US10069966B2 (en) Multi-party conversation analyzer and logger
US20180082690A1 (en) Methods and system for reducing false positive voice print matching
US12015731B2 (en) Call classification through analysis of DTMF events
AU2011276467B2 (en) Systems and methods for detecting call provenance from call audio
McKemmish When is digital evidence forensically sound?
US8145562B2 (en) Apparatus and method for fraud prevention
US8886663B2 (en) Multi-party conversation analyzer and logger
CN109615116A (zh) 一种电信诈骗事件检测方法和检测系统
US20150317641A1 (en) Evaluation of voice communications
CN110493476B (zh) 一种检测方法、装置、服务器及存储介质
CN113992797B (zh) 一种欺诈防控平台及方法
CN107257419A (zh) 一种基于贝叶斯分析人际关系量化估值方法
CN115102789A (zh) 一种反通信网络诈骗研判预警拦截综合平台
CN114971627A (zh) 一种基于计算机网络的数据监控系统及方法
CN111935269B (zh) 一种数据交换方法及系统
Yadav et al. Compression Robust Synthetic Speech Detection Using Patched Spectrogram Transformer
EP4336390A1 (en) Method for tracking content in a user data signal
US12010260B2 (en) Detecting synthetic sounds in call audio
CN115314657B (zh) 一种公安执法智能中枢系统
CN115938370A (zh) 一种诈骗用户识别方法、装置、电子设备和存储介质
CN115689298A (zh) 一种电信诈骗风险预测方法、系统、设备及可读存储介质
CN117793248A (zh) 电信诈骗集团聚类、诈骗证据提取及实时反诈方法、系统
CN112988324A (zh) 一种基于cpu信息的安卓模拟器识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant