CN111429918A - 一种基于声纹识别和意图分析的访电话诈骗方法和系统 - Google Patents

一种基于声纹识别和意图分析的访电话诈骗方法和系统 Download PDF

Info

Publication number
CN111429918A
CN111429918A CN202010224867.0A CN202010224867A CN111429918A CN 111429918 A CN111429918 A CN 111429918A CN 202010224867 A CN202010224867 A CN 202010224867A CN 111429918 A CN111429918 A CN 111429918A
Authority
CN
China
Prior art keywords
fraud
voice
voiceprint
intention
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010224867.0A
Other languages
English (en)
Inventor
黄辉中
林晓纯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Xiamen Yunzhixin Intelligent Technology Co Ltd
Original Assignee
Unisound Intelligent Technology Co Ltd
Xiamen Yunzhixin Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Intelligent Technology Co Ltd, Xiamen Yunzhixin Intelligent Technology Co Ltd filed Critical Unisound Intelligent Technology Co Ltd
Priority to CN202010224867.0A priority Critical patent/CN111429918A/zh
Publication of CN111429918A publication Critical patent/CN111429918A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/663Preventing unauthorised calls to a telephone set

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明提供了一种基于声纹识别和意图分析的访电话诈骗方法和装置。在电话通话时,对通话语音进行预处理,确定声纹特征;将所述声纹特征与预设诈骗声纹特征进行对比,判断所述声纹特征是否存在诈骗记录;如果存在诈骗记录,发出第一报警信息;如果没有诈骗记录,根据所述声纹特征,获取通话语意;根据所述通话语意,获取语音意图;将所述语音意图与预设诈骗意图进行对比,判断所述语音意图是否为诈骗意图;如果存在诈骗意图,发出第二报警信息,并将所述诈骗意图对应的声纹特征标记为诈骗声纹特征;如果没有诈骗意图,在结束通话时,发出安全声纹提示。

Description

一种基于声纹识别和意图分析的访电话诈骗方法和系统
技术领域
本发明涉及防诈骗技术领域,特别涉及一种基于声纹识别和意图分析的访电话诈骗方法和系统。
背景技术
目前,电信诈骗是一种常见且时常发生的诈骗手段。因为一些老人或者年轻学生的防范意识不强,这种诈骗手段经常会在老人或者年轻学生身上产生作用。现在很多的电话防诈骗方面主要靠人自我的警觉性,但是人的自觉性在不同的年龄段会有不同的体现。因此通过科技手段进行防诈骗,是我们需要研究的方向。
发明内容
本发明提供一种基于声纹识别和意图分析的访电话诈骗方法和系统,用以解决很多老年人或者缺乏相关经验的人很容易上当受骗的情况。
一种基于声纹识别和意图分析的访电话诈骗方法,其特征在于,包括:
在电话通话时,对通话语音进行预处理,确定声纹特征;
将所述声纹特征与预设诈骗声纹特征进行对比,判断所述声纹特征是否存在诈骗记录;
如果存在诈骗记录,发出第一报警信息;
如果没有诈骗记录,根据所述声纹特征,获取通话语意;
根据所述通话语意,获取语音意图;
将所述语音意图与预设诈骗意图进行对比,判断所述语音意图是否为诈骗意图;
如果存在诈骗意图,发出第二报警信息,并将所述诈骗意图对应的声纹特征标记为诈骗声纹特征;
如果没有诈骗意图,在结束通话时,发出安全声纹提示。
作为本发明的一种实施例:所述在电话通话时,对通话语音进行预处理,确定声纹特征,包括:
基于大数据采集语音分离数据,构建语音分离模型;
将所述通话语音导入语音分离模型,获取多个语音片段;
采集所述多个语音片段中每个语音片段的语音属性;其中,
所述语音属性包括:语意、语速、声音性别、声音维度、声波和音频;
根据所述语音属性,确定所述多个语音片段的声波频率;
根据所述声波频率,确定声纹特征。
作为本发明的一种实施例:其特征在于,所述将所述声纹特征与预设诈骗声纹特征进行对比,判断所述声纹特征是否存在诈骗记录,包括:
采集诈骗人员的语音信息,基于LSTM神经网络构建诈骗声纹的相似度矩阵;
通过GE2E loss对所述相似度矩阵进行优化,得到最小损失函数;
将所述声纹特征导入所述最小损失函数,得到最小损失函数的函数值;
将所述函数值转化分百分制数值进行表示,根据所述百分制数值判断所述声纹特征是否存在诈骗记录;其中,
当所述百分之数值大于等于1时,所述声纹特征存在诈骗记录,当所述百分之数值小于1时,所述声纹特征不存在诈骗记录。
作为本发明的一种实施例:所述采集诈骗人员的语音信息,基于LSTM神经网络构建诈骗声纹的相似度矩阵,包括以下步骤:
采集N个诈骗人员,每个诈骗人员M句诈骗语音,排列组成Batch;
根据所述Batch,基于LSTM神经网络提取N*M句话的embeddings,然后求取每个embedding和每个人平均embedding的相似度;
根据所述每个embedding和每个人平均embedding的相似度,得到相似度矩阵:;
Sji,k=w·cos(eji,ck)+b;
其中,(1<=j<=N;1<=i<=M;1<=k<=N)
所述eji中表示第i人第j句话对应的embedding,w和b是要训练的参数,CK是第k人的embedding,由M句话的embeddings求平均得到,即:
Figure BDA0002427312910000031
其中,所述ekm表示第k的第m句话对应的embedding。
作为本发明的一种实施例:所述通过GE2E loss对所述相似度矩阵进行优化,得到最小损失函数,包括:
获取第K人的embedding和第j人的embedding;
将所述第K人的embedding和第j人的embedding带入softmax loss公式,得到最小损失函数:
Figure BDA0002427312910000041
所述Sji表示第i人第j句话的相似度。
一种基于声纹识别和意图分析的访电话诈骗系统,其特征在于,包括:
第一处理模块:用于在电话通话时,对通话语音进行预处理,确定声纹特征;
第一判断模块:用于将所述声纹特征与预设诈骗声纹特征进行对比,判断所述诈骗声纹特征是否存在诈骗记录;
第一报警模块:用于在存在诈骗记录时,发出第一报警信息;
第二处理模块:用于在没有诈骗记录时,根据所述声纹特征,获取通话语意;
第一获取模块:用于通过所述通话语意,获取语音意图;
第二判断模块:用于将所述语音意图与预设诈骗意图进行对比,判断所述语音意图是否为诈骗意图;
第二报警模块:用于在存在诈骗意图时,发出第二报警信息,并将所述诈骗意图对应的声纹特征标记为诈骗声纹特征;
第三处理模块:用于在没有诈骗意图情况下,在结束通话时,发出安全声纹提示。
作为本发明的一种实施例,所述第一处理模块包括:
第一建模单元:用于根据大数据采集语音分离数据,构建语音分离模型;
第一获取单元:用于将所述通话语音导入语音分离模型,获取多个语音片段;
第一采集单元:用于采集所述多个语音片段中每段语音的语音属性;其中,
所述语音属性包括:语意、语速、声音性别、声音维度、声波和音频;
根据所述语音属性,确定所述多个语音片段的声波频率;
第一确定单元:根据所述声波频率,确定声纹特征。
作为本发明的一种实施例:所述第一判断模块包括:
第一建模单元:用于采集诈骗人员的语音信息,基于LSTM神经网络构建诈骗声纹的相似度矩阵;
第一处理单元:用于通过GE2E loss对所述相似度矩阵进行优化,得到最小损失函数;
第二获取单元:用于将所述声纹特征导入所述最小损失函数,得到最小损失函数的函数值;
第一判断单元:用于将所述函数值转化分百分制数值进行表示,根据所述百分制数值判断所述声纹特征是否存在诈骗记录;其中,
当所述百分之数值大于等于1时,所述声纹特征存在诈骗记录,当所述百分之数值小于1时,所述声纹特征不存在诈骗记录。
作为本发明的一种实施例,所述第一建模单元通过以下步骤获得相似度矩阵:
步骤1:采集N个诈骗人员,每个诈骗人员M句诈骗语音,排列组成Batch;
步骤2:根据所述Batch,基于LSTM神经网络提取N*M句话的embeddings,然后求取每个embedding和每个人平均embedding的相似度;
根据所述每个embedding和每个人平均embedding的相似度,得到相似度矩阵:Sji,k=w·cos(eji,ck)+b;
其中,(1<=j<=N;1<=i<=M;1<=k<=N)
所述eji中表示第i人第j句话对应的embedding,w和b是要训练的参数,CK是第k人的embedding,由M句话的embeddings求平均得到,即:
Figure BDA0002427312910000061
其中,所述ekm表示第k的第m句话对应的embedding。
作为本发明的一种实施例,所述第一处理单元通过以下步骤获得最小损失函数:
获取第K人的embedding和第j人的embedding;
将所述第K人的embedding和第j人的embedding带入softmax loss公式,得到最小损失函数:
Figure BDA0002427312910000062
所述Sji表示第i人第j句话的相似度。
本发明的有益效果在于:本发明通过根据声学特征和语音意图判断通话语音中是否存在诈骗人员,然后发出提醒。可以在绝大部分情况下过滤掉电话诈骗语音诈骗,保护了缺乏警觉性的人。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
在附图中:
图1为本发明实施例中一种基于声纹识别和意图分析的访电话诈骗方法的方法流程图;
图2为本发明实施例中一种基于声纹识别和意图分析的访电话诈骗方法和系统的流程图;
图3为本发明的实施例中一种基于声纹识别和意图分析的访电话诈骗系统的系统结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明适用于通过语音通话的设备,不局限于手机、电脑、固定电话等。
如附图1所示本发明的一种基于声纹识别和意图分析的访电话诈骗方法,包括:
步骤100:在电话通话时,对通话语音进行预处理,确定声纹特征;
步骤101:将所述声纹特征与预设诈骗声纹特征进行对比,判断所述声纹特征是否存在诈骗记录;
步骤102:如果存在诈骗记录,发出第一报警信息;
步骤103:如果没有诈骗记录,根据所述声纹特征,获取通话语意;
步骤104:根据所述通话语意,获取语音意图;
步骤105:将所述语音意图与预设诈骗意图进行对比,判断所述语音意图是否为诈骗意图;
步骤106:如果存在诈骗意图,发出第二报警信息,并将所述诈骗意图对应的声纹特征标记为诈骗声纹特征;
步骤107:如果没有诈骗意图,在结束通话时,发出安全声纹提示。
本发明的原理在于:本发明根据对通话时的语音进行处理,得到通话人员的声纹特征;基于现有技术采集诈骗人员的语音,在具体实施时可以对接公安系统以及媒体采访诈骗人员的语音系统等;通过这些语音声纹特征,可以判断通话的人员中是否存在诈骗人员,作为第一次判断。
当第一次判断,不存在诈骗人员时,说明通话的人员都不存在诈骗记录,这时,根据语意进行第二次判断,同样基于现有的公安系统以及媒体采访诈骗人员的语音系统采集诈骗时,诈骗人员语音的语意,第二次判断不仅可以根据已经诈骗人员在诈骗时的语音,还可以根据预测的诈骗人员可能存在的语音的语意进行判断,作为第二次判断结果。
当第二次判断之后,如果存在诈骗意图,进行报警。当不存在诈骗意图时,在通话结束后,记录为安全声纹,并进行提示。
本发明的有益效果在于:本发明根据诈骗人员的声纹特征,以及语意意图通过两次的判断,判断通话语音是否存在诈骗人员。通过声纹特征可以根据现有的诈骗人员的声纹特征判断通话的人员中是否存在有诈骗记录的人,如果通话的人中有诈骗记录的人可以进行提醒。在第一次判断之后。通过语意意图再进行第二次判断,语意意图的判断可以防止没有通话记录的人员实行诈骗。双重检测判断,对于防诈骗来说也具有双重保障。
附图2为本发明的其中一种实施例:通过语音监控,获取通话人的语音特征,然后通过预设系统的语音特征进行匹配,预设系统连接公安或者媒体网络,收集已经存在诈骗现象的人的语音特征,当没有匹配的语音特征时,导入系统特征库,当能够匹配上预设系统的声纹特征时,发出警告。并对意图进行分析,对比历史骗人套路和意图判断是否存在骗人意图。有骗人意图发出警告,没有骗人意图,结束聊天。
作为本发明的一种实施例:所述在电话通话时,对通话语音进行预处理,确定声纹特征,包括:
基于大数据采集语音分离数据,构建语音分离模型;
将所述通话语音导入语音分离模型,获取多个语音片段;
采集所述多个语音片段中每个语音片段的语音属性;其中,
所述语音属性包括:语意、语速、声音性别、声音维度、声波和音频;
根据所述语音属性,确定所述多个语音片段的声波频率;
根据所述声波频率,确定声纹特征。
本发明的原理在于:本发明在语音预处理时,通过构建语音分离模型,通过每个语音片段的语意、语速、声音性别、声音维度、声波和音频多方面确定声波频率;最后根据声波频率作为声纹特征,这也是本发明对声纹的一次过滤过程。
本发明的有益效果在于:本发明通过语音属性得到通话语音的声纹特征。而根据声纹特征可以对已诈骗人员的声纹特征进行对比。
作为本发明的一种实施例:其特征在于,所述将所述声纹特征与预设诈骗声纹特征进行对比,判断所述声纹特征是否存在诈骗记录,包括:
采集诈骗人员的语音信息,基于LSTM神经网络构建诈骗声纹的相似度矩阵;
通过GE2E loss公式对所述相似度矩阵进行优化,得到最小损失函数;
将所述声纹特征导入所述最小损失函数,得到最小损失函数的函数值;
将所述函数值转化分百分制数值进行表示,根据所述百分制数值判断所述声纹特征是否存在诈骗记录;其中,
当所述百分之数值大于等于1时,所述声纹特征存在诈骗记录,当所述百分之数值小于1时,所述声纹特征不存在诈骗记录。
本发明的原理在于:本发明通过LSTM神经网络构建诈骗声纹的相似度矩阵,然后得到最小损失函数,通过输入通话语音的来判断通话的语音的声纹特征判断是不是存在诈骗记录,具有诈骗记录在进行提醒。
本名的有益效果在于:本发明通过构建相似度矩阵,再通过优化后的最小损失函数,对通话的声纹特征进行计算,判断出通话的人中是不是存在具有诈骗记录的人。
作为本发明的一种实施例:所述采集诈骗人员的语音信息,基于LSTM神经网络构建诈骗声纹的相似度矩阵,包括以下步骤:
采集N个诈骗人员,每个诈骗人员M句诈骗语音,排列组成Batch;
根据所述Batch,基于LSTM神经网络提取N*M句话的embeddings,然后求取每个embedding和每个人平均embedding的相似度;
根据所述每个embedding和每个人平均embedding的相似度,得到相似度矩阵:;
Sji,k=w·cos(eji,ck)+b;
其中,(1<=j<=N;1<=i<=M;1<=k<=N)
所述eji中表示第i人第j句话对应的embedding,w和b是要训练的参数,CK是第k人的embedding,由M句话的embeddings求平均得到,即:
Figure BDA0002427312910000111
其中,所述ekm表示第k的第m句话对应的embedding。
本发明的原理在于:embeddings表示用一个低维的向量表示一个物体,或者语句。在本发明中可以作为声纹特征进行表示。从而得到声纹特征的相似度矩阵。
本发明的有益效果在于:本发明通过LSTM神经网络提取的embeddings,最后通过embeddings得到相似度矩阵。使得声纹特征可以作为向量进行计算。
作为本发明的一种实施例:所述通过GE2E loss对所述相似度矩阵进行优化,得到最小损失函数,包括:
获取第K人的embedding和第j人的embedding;
将所述第K人的embedding和第j人的embedding带入softmax loss公式,得到最小损失函数:
Figure BDA0002427312910000121
所述Sji表示第i人第j句话的相似度。
本发明的原理在于:本发明基于相似度矩阵通过把通话语音的embedding输入相似度矩阵,最后通过softmax loss公式得到最小损失函数,计算出相似度。
本发明的有益效果在于:本发明通过最小损失函数在最小损失的情况下,得到通话语音和预设诈骗通话语音的相似情况,从而判断实施时的通话语音是不是又诈骗记录。
一种基于声纹识别和意图分析的访电话诈骗系统,其特征在于,包括:
第一处理模块:用于在电话通话时,对通话语音进行预处理,确定声纹特征;
第一判断模块:用于将所述声纹特征与预设诈骗声纹特征进行对比,判断所述声纹特征是否存在诈骗记录;
第一报警模块:用于在存在诈骗记录时,发出第一报警信息;
第二处理模块:用于在没有诈骗记录时,根据所述声纹特征,获取通话语意;
第一获取模块:用于通过所述通话语意,获取语音意图;
第二判断模块:用于将所述语音意图与预设诈骗意图进行对比,判断所述语音意图是否为诈骗意图;
第二报警模块:用于在存在诈骗意图时,发出第二报警信息,并将所述诈骗意图对应的声纹特征标记为诈骗声纹特征;
第三处理模块:用于在没有诈骗意图情况下,在结束通话时,发出安全声纹提示。
本发明的原理在于:本发明根据对通话时的语音进行处理,得到通话人员的声纹特征;基于现有技术采集诈骗人员的语音,在具体实施时可以对接公安系统以及媒体采访诈骗人员的语音系统等;通过这些语音声纹特征,可以判断通话的人员中是否存在诈骗人员,作为第一次判断。
当第一次判断,不存在诈骗人员时,说明通话的人员都不存在诈骗记录,这时,根据语意进行第二次判断,同样基于现有的公安系统以及媒体采访诈骗人员的语音系统采集诈骗时,诈骗人员语音的语意,第二次判断不仅可以根据已经诈骗人员在诈骗时的语音,还可以根据预测的诈骗人员可能存在的语音的语意进行判断,作为第二次判断结果。
当第二次判断之后,如果存在诈骗意图,进行报警。当不存在诈骗意图时,在通话结束后,记录为安全声纹,并进行提示。
本发明的有益效果在于:本发明根据诈骗人员的声纹特征,以及语意意图通过两次的判断,判断通话语音是否存在诈骗人员。通过声纹特征可以根据现有的诈骗人员的声纹特征判断通话的人员中是否存在有诈骗记录的人,如果通话的人中有诈骗记录的人可以进行提醒。在第一次判断之后。通过语意意图再进行第二次判断,语意意图的判断可以防止没有通话记录的人员实行诈骗。双重检测判断,对于防诈骗来说也具有双重保障。
作为本发明的一种实施例:所述第一判断模块包括:
第一建模单元:用于采集诈骗人员的语音信息,基于LSTM神经网络构建诈骗声纹的相似度矩阵;
第一处理单元:用于通过GE2E loss对所述相似度矩阵进行优化,得到最小损失函数;
第二获取单元:用于将所述声纹特征导入所述最小损失函数,得到最小损失函数的函数值;
第一判断单元:用于将所述函数值转化分百分制数值进行表示,根据所述百分制数值判断所述声纹特征是否存在诈骗记录;其中,
当所述百分之数值大于等于1时,所述声纹特征存在诈骗记录,当所述百分之数值小于1时,所述声纹特征不存在诈骗记录。
本发明的原理在于:本发明通过LSTM神经网络构建诈骗声纹的相似度矩阵,然后得到最小损失函数,通过输入通话语音的来判断通话的语音的声纹特征判断是不是存在诈骗记录,具有诈骗记录在进行提醒。
本名的有益效果在于:本发明通过构建相似度矩阵,再通过优化后的最小损失函数,对通话的声纹特征进行计算,判断出通话的人中是不是存在具有诈骗记录的人。
作为本发明的一种实施例,所述第一建模单元通过以下步骤获得相似度矩阵:
步骤1:采集N个诈骗人员,每个诈骗人员M句诈骗语音,排列组成Batch;
步骤2:根据所述Batch,基于LSTM神经网络提取N*M句话的embeddings,然后求取每个embedding和每个人平均embedding的相似度;
根据所述每个embedding和每个人平均embedding的相似度,得到相似度矩阵:Sji,k=w·cos(eji,ck)+b;
其中,(1<=j<=N;1<=i<=M;1<=k<=N)
所述eji中表示第i人第j句话对应的embedding,w和b是要训练的参数,CK是第k人的embedding,由M句话的embeddings求平均得到,即:
Figure BDA0002427312910000151
其中,所述ekm表示第k的第m句话对应的embedding。
本发明的原理在于:embeddings表示用一个低维的向量表示一个物体,或者语句。在本发明中可以作为声纹特征进行表示。从而得到声纹特征的相似度矩阵。
本发明的有益效果在于:本发明通过LSTM神经网络提取的embeddings,最后通过embeddings得到相似度矩阵。使得声纹特征可以作为向量进行计算。
作为本发明的一种实施例,所述第一处理单元通过以下步骤获得最小损失函数:
获取第K人的embedding和第j人的embedding;
将所述第K人的embedding和第j人的embedding带入softmax loss公式,得到最小损失函数:
Figure BDA0002427312910000161
所述Sji表示第i人第j句话的相似度。
本发明的原理在于:本发明基于相似度矩阵通过把通话语音的embedding输入相似度矩阵,最后通过softmax loss公式得到最小损失函数,计算出相似度。
本发明的有益效果在于:本发明通过最小损失函数在最小损失的情况下,得到通话语音和预设诈骗通话语音的相似情况,从而判断实施时的通话语音是不是又诈骗记录。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于声纹识别和意图分析的访电话诈骗方法,其特征在于,包括:
在电话通话时,对通话语音进行预处理,确定声纹特征;
将所述声纹特征与预设诈骗声纹特征进行对比,判断所述声纹特征是否存在诈骗记录;
如果存在诈骗记录,发出第一报警信息;
如果没有诈骗记录,根据所述声纹特征,获取通话语意;
根据所述通话语意,获取语音意图;
将所述语音意图与预设诈骗意图进行对比,判断所述语音意图是否为诈骗意图;
如果存在诈骗意图,发出第二报警信息,并将所述诈骗意图对应的声纹特征标记为诈骗声纹特征;
如果没有诈骗意图,在结束通话时,发出安全声纹提示。
2.根据权利要求1所述的一种基于声纹识别和意图分析的访电话诈骗方法,其特征在于,所述在电话通话时,对通话语音进行预处理,确定声纹特征,包括:
基于大数据采集语音分离数据,构建语音分离模型;
将所述通话语音导入语音分离模型,获取多个语音片段;
采集所述多个语音片段中每个语音片段的语音属性;其中,
所述语音属性包括:语意、语速、声音性别、声音维度、声波和音频;
根据所述语音属性,确定所述多个语音片段的声波频率;
根据所述声波频率,确定声纹特征。
3.根据权利要求1所述的一种基于声纹识别和意图分析的访电话诈骗方法,其特征在于,所述将所述声纹特征与预设诈骗声纹特征进行对比,判断所述声纹特征是否存在诈骗记录,包括:
采集诈骗人员的语音信息,基于LSTM神经网络构建诈骗声纹的相似度矩阵;
通过GE2Eloss公式对所述相似度矩阵进行优化,得到最小损失函数;
将所述声纹特征导入所述最小损失函数,得到最小损失函数的函数值;
将所述函数值转化分百分制数值进行表示,根据所述百分制数值判断所述声纹特征是否存在诈骗记录;其中,
当所述百分之数值大于等于1时,所述声纹特征存在诈骗记录,当所述百分之数值小于1时,所述声纹特征不存在诈骗记录。
4.根据权利要求3所述的一种基于声纹识别和意图分析的访电话诈骗方法,其特征在于,所述采集诈骗人员的语音信息,基于LSTM神经网络构建诈骗声纹的相似度矩阵,包括以下步骤:
采集N个诈骗人员,每个诈骗人员M句诈骗语音,排列组成Batch;
根据所述Batch,基于LSTM神经网络提取N*M句话的embeddings,然后求取每个embedding和每个人平均embedding的相似度;
根据所述每个embedding和每个人平均embedding的相似度,得到相似度矩阵:;
Sji,k=w·cos(eji,ck)+b;
其中,(1<=j<=N;1<=i<=M;1<=k<=N)
所述eji中表示第i人第j句话对应的embedding,w和b是要训练的参数,CK是第k人的embedding,由M句话的embeddings求平均得到,即:
Figure FDA0002427312900000031
其中,所述ekm表示第k的第m句话对应的embedding。
5.根据权利要求3所述的一种基于声纹识别和意图分析的访电话诈骗方法,其特征在于,所述通过GE2Eloss对所述相似度矩阵进行优化,得到最小损失函数,包括:
获取第K人的embedding和第j人的embedding;
将所述第K人的embedding和第j人的embedding带入softmax loss公式,得到最小损失函数:
Figure FDA0002427312900000032
所述Sji表示第i人第j句话的相似度。
6.一种基于声纹识别和意图分析的访电话诈骗系统,其特征在于,包括:
第一处理模块:用于在电话通话时,对通话语音进行预处理,确定声纹特征;
第一判断模块:用于将所述声纹特征与预设诈骗声纹特征进行对比,判断所述声纹特征是否存在诈骗记录;
第一报警模块:用于在存在诈骗记录时,发出第一报警信息;
第二处理模块:用于在没有诈骗记录时,根据所述声纹特征,获取通话语意;
第一获取模块:用于通过所述通话语意,获取语音意图;
第二判断模块:用于将所述语音意图与预设诈骗意图进行对比,判断所述语音意图是否为诈骗意图;
第二报警模块:用于在存在诈骗意图时,发出第二报警信息,并将所述诈骗意图对应的声纹特征标记为诈骗声纹特征;
第三处理模块:用于在没有诈骗意图情况下,在结束通话时,发出安全声纹提示。
7.根据权利要求6所述的一种基于声纹识别和意图分析的访电话诈骗方法,其特征在于,所述第一处理模块包括:
第一建模单元:用于根据大数据采集语音分离数据,构建语音分离模型;
第一获取单元:用于将所述通话语音导入语音分离模型,获取多个语音片段;
第一采集单元:用于采集所述多个语音片段中每段语音的语音属性;其中,
所述语音属性包括:语意、语速、声音性别、声音维度、声波和音频;
根据所述语音属性,确定所述多个语音片段的声波频率;
第一确定单元:根据所述声波频率,确定声纹特征。
8.根据权利要求6所述的一种基于声纹识别和意图分析的访电话诈骗方法,其特征在于,所述第一判断模块包括:
第一建模单元:用于采集诈骗人员的语音信息,基于LSTM神经网络构建诈骗声纹的相似度矩阵;
第一处理单元:用于通过GE2Eloss公式对所述相似度矩阵进行优化,得到最小损失函数;
第二获取单元:用于将所述声纹特征导入所述最小损失函数,得到最小损失函数的函数值;
第一判断单元:用于将所述函数值转化分百分制数值进行表示,根据所述百分制数值判断所述声纹特征是否存在诈骗记录;其中,
当所述百分之数值大于等于1时,所述声纹特征存在诈骗记录,当所述百分之数值小于1时,所述声纹特征不存在诈骗记录。
9.根据权利要求8所述的一种基于声纹识别和意图分析的访电话诈骗方法,其特征在于,所述第一建模单元通过以下步骤获得相似度矩阵:
步骤1:采集N个诈骗人员,每个诈骗人员M句诈骗语音,排列组成Batch;
步骤2:根据所述Batch,基于LSTM神经网络提取N*M句话的embeddings,然后求取每个embedding和每个人平均embedding的相似度;
根据所述每个embedding和每个人平均embedding的相似度,得到相似度矩阵:Sji,k=w·cos(eji,ck)+b;
其中,(1<=j<=N;1<=i<=M;1<=k<=N)
所述eji中表示第i人第j句话对应的embedding,w和b是要训练的参数,CK是第k人的embedding,由M句话的embeddings求平均得到,即:
Figure FDA0002427312900000051
其中,所述ekm表示第k的第m句话对应的embedding。
10.根据权利要求8所述的一种基于声纹识别和意图分析的访电话诈骗方法,其特征在于,所述第一处理单元通过以下步骤获得最小损失函数:
获取第K人的embedding和第j人的embedding;
将所述第K人的embedding和第j人的embedding带入softmax loss公式,得到最小损失函数:
Figure FDA0002427312900000061
所述Sji表示第i人第j句话的相似度。
CN202010224867.0A 2020-03-26 2020-03-26 一种基于声纹识别和意图分析的访电话诈骗方法和系统 Pending CN111429918A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010224867.0A CN111429918A (zh) 2020-03-26 2020-03-26 一种基于声纹识别和意图分析的访电话诈骗方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010224867.0A CN111429918A (zh) 2020-03-26 2020-03-26 一种基于声纹识别和意图分析的访电话诈骗方法和系统

Publications (1)

Publication Number Publication Date
CN111429918A true CN111429918A (zh) 2020-07-17

Family

ID=71555677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010224867.0A Pending CN111429918A (zh) 2020-03-26 2020-03-26 一种基于声纹识别和意图分析的访电话诈骗方法和系统

Country Status (1)

Country Link
CN (1) CN111429918A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114641003A (zh) * 2022-01-26 2022-06-17 广州理工学院 一种防诈骗系统及方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105120068A (zh) * 2015-07-16 2015-12-02 百度在线网络技术(北京)有限公司 一种语音通信的接听方法及装置
CN105516989A (zh) * 2015-11-27 2016-04-20 努比亚技术有限公司 一种识别不良通话的方法和装置
CN105872185A (zh) * 2016-04-20 2016-08-17 乐视控股(北京)有限公司 信息提示方法、装置及系统
CN106210239A (zh) * 2016-09-14 2016-12-07 北京奇虎科技有限公司 恶意来电者声纹的自动识别方法、装置和移动终端
CN106341539A (zh) * 2016-09-14 2017-01-18 北京奇虎科技有限公司 恶意来电者声纹的自动取证方法、装置和移动终端
CN107197463A (zh) * 2017-07-10 2017-09-22 北京亿赛通网络安全技术有限公司 一种电话诈骗的检测方法、存储介质及电子设备
CN107370865A (zh) * 2016-05-12 2017-11-21 中兴通讯股份有限公司 骚扰电话的识别方法、装置及终端
CN107547718A (zh) * 2017-08-22 2018-01-05 电子科技大学 基于深度学习的电信诈骗识别与防御系统
CN107680602A (zh) * 2017-08-24 2018-02-09 平安科技(深圳)有限公司 语音欺诈识别方法、装置、终端设备及存储介质
CN107872590A (zh) * 2016-09-26 2018-04-03 北京搜狗科技发展有限公司 一种电话识别的方法、装置和设备
CN108848507A (zh) * 2018-05-31 2018-11-20 厦门快商通信息技术有限公司 一种不良电信用户信息采集方法
CN110223699A (zh) * 2019-05-15 2019-09-10 桂林电子科技大学 一种说话人身份确认方法、装置及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105120068A (zh) * 2015-07-16 2015-12-02 百度在线网络技术(北京)有限公司 一种语音通信的接听方法及装置
CN105516989A (zh) * 2015-11-27 2016-04-20 努比亚技术有限公司 一种识别不良通话的方法和装置
CN105872185A (zh) * 2016-04-20 2016-08-17 乐视控股(北京)有限公司 信息提示方法、装置及系统
CN107370865A (zh) * 2016-05-12 2017-11-21 中兴通讯股份有限公司 骚扰电话的识别方法、装置及终端
CN106210239A (zh) * 2016-09-14 2016-12-07 北京奇虎科技有限公司 恶意来电者声纹的自动识别方法、装置和移动终端
CN106341539A (zh) * 2016-09-14 2017-01-18 北京奇虎科技有限公司 恶意来电者声纹的自动取证方法、装置和移动终端
CN107872590A (zh) * 2016-09-26 2018-04-03 北京搜狗科技发展有限公司 一种电话识别的方法、装置和设备
CN107197463A (zh) * 2017-07-10 2017-09-22 北京亿赛通网络安全技术有限公司 一种电话诈骗的检测方法、存储介质及电子设备
CN107547718A (zh) * 2017-08-22 2018-01-05 电子科技大学 基于深度学习的电信诈骗识别与防御系统
CN107680602A (zh) * 2017-08-24 2018-02-09 平安科技(深圳)有限公司 语音欺诈识别方法、装置、终端设备及存储介质
CN108848507A (zh) * 2018-05-31 2018-11-20 厦门快商通信息技术有限公司 一种不良电信用户信息采集方法
CN110223699A (zh) * 2019-05-15 2019-09-10 桂林电子科技大学 一种说话人身份确认方法、装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI WAN ET AL: "GENERALIZED END-TO-END LOSS FOR SPEAKER VERIFICATION" *
丹浩宇: "浅析计算机科学技术如何实现生物识别等智能应用" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114641003A (zh) * 2022-01-26 2022-06-17 广州理工学院 一种防诈骗系统及方法

Similar Documents

Publication Publication Date Title
US10410636B2 (en) Methods and system for reducing false positive voice print matching
CA2524226A1 (en) Speaker recognition in a multi-speaker environment and comparison of several voice prints to many
US6463415B2 (en) 69voice authentication system and method for regulating border crossing
US8972266B2 (en) User intent analysis extent of speaker intent analysis system
US7386105B2 (en) Method and apparatus for fraud detection
US5414755A (en) System and method for passive voice verification in a telephone network
US8005675B2 (en) Apparatus and method for audio analysis
CN106790054A (zh) 基于人脸识别和声纹识别的交互式认证系统及方法
CN110349586B (zh) 电信诈骗检测方法及装置
CN103258535A (zh) 基于声纹识别的身份识别方法及系统
US20160118050A1 (en) Non-standard speech detection system and method
CN108985776A (zh) 基于多重信息验证的信用卡安全监测方法
CN1291324A (zh) 检测录制声音的系统和方法
CN108694958A (zh) 一种安防报警方法及装置
CN104410973B (zh) 一种播放录音的诈骗电话识别方法和系统
CN108848507A (zh) 一种不良电信用户信息采集方法
CN113191787A (zh) 电信数据的处理方法、装置电子设备及存储介质
CN109346085B (zh) 一种基于声纹识别的监狱监管平台
CN108012037A (zh) 一种监狱外拨电话管理系统
CN110517697A (zh) 用于交互式语音应答的提示音智能打断装置
CN114971627A (zh) 一种基于计算机网络的数据监控系统及方法
CN111429918A (zh) 一种基于声纹识别和意图分析的访电话诈骗方法和系统
JP2010273130A (ja) 詐欺進行度判定装置、辞書生成装置、詐欺進行度判定方法及び辞書生成方法
CN114677634A (zh) 面签识别方法、装置、电子设备及存储介质
EP0643520B1 (en) System and method for passive voice verification in a telephone network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200717

RJ01 Rejection of invention patent application after publication