CN109728928A - 事件识别方法和终端、模型生成方法和服务器及存储介质 - Google Patents

事件识别方法和终端、模型生成方法和服务器及存储介质 Download PDF

Info

Publication number
CN109728928A
CN109728928A CN201711042315.2A CN201711042315A CN109728928A CN 109728928 A CN109728928 A CN 109728928A CN 201711042315 A CN201711042315 A CN 201711042315A CN 109728928 A CN109728928 A CN 109728928A
Authority
CN
China
Prior art keywords
training
information
neural
event
weight coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711042315.2A
Other languages
English (en)
Other versions
CN109728928B (zh
Inventor
張瑋杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201711042315.2A priority Critical patent/CN109728928B/zh
Publication of CN109728928A publication Critical patent/CN109728928A/zh
Application granted granted Critical
Publication of CN109728928B publication Critical patent/CN109728928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供一种事件识别方法,其包括:收集移动终端的终端信息日志;按预设规则,将终端信息日志转换为对应的事件识别信息;根据事件识别信息以及预设模型生成移动终端的恶意事件概率;当恶意事件概率大于第一设定值时,进行恶意事件告警操作。本发明还提供一种事件识别模型生成方法、事件识别终端以及事件识别模型生成服务器。本发明的事件识别方法及终端、事件识别模型生成方法及服务器通过在服务器上生成对应的恶意事件识别模型,并将该恶意事件识别模型发送至对应的移动终端上,从而提高了移动终端对恶意事件的识别以及告警能力。

Description

事件识别方法和终端、模型生成方法和服务器及存储介质
技术领域
本发明涉及数据处理领域,特别是涉及一种事件识别方法及终端、事件识别模型生成方法及服务器、以及存储介质。
背景技术
随着科技的发展,人们使用移动终端进行交互的频率越来越高,通过移动终端进行电信诈骗的事件发生频率也越来越高。现在的电信诈骗事件的识别一般是通过对诈骗短信以及诈骗电话进行识别以及拦截,即对伪基站传播的诈骗短信以及特定号码的电话进行防御拦截。
如恶意用户a使用某个电话号码发送电信诈骗短信或电信诈骗电话,如有用户举报该电话号码,经查实后可将该电话号码发送给其他用户的短信以及电话进行拦截操作,从而避免恶意用户继续使用该电话号码进行电信诈骗操作。
但是随着网络电话以及电话改号软件的出现,恶意用户可以通过变更电话号码的方式来躲避上述号码拦截,从而进行电信诈骗操作。由于可变更的电话号码的数量较大且恶意用户的电话号码变更频率也较高,如将所有相关的电话号码进行拦截,则恶意电话以及恶意信息的拦截难度较大。
发明内容
本发明实施例提供一种可方便的对恶意事件进行识别以及告警操作的事件识别方法及终端、事件识别模型生成方法及服务器;以解决现有的移动终端对恶意电话以及恶意信息的识别以及拦截难度较大的技术问题。
本发明实施例提供一种事件识别方法,其包括:
收集移动终端的终端信息日志;
按预设规则,将所述终端信息日志转换为对应的事件识别信息;
根据所述事件识别信息以及预设模型生成所述移动终端的恶意事件概率;以及
当所述恶意事件概率大于第一设定值时,进行恶意事件告警操作;
其中通过以下步骤生成所述预设模型:
创建机器训练神经元模块;
按时间顺序创建对多个机器训练神经元模块进行串联,以形成机器训练神经元序列;
根据每个所述机器训练神经元模块输出的隐含层概率值以及期望概率值,计算每个机器训练神经元模块的累积误差值;
根据机器训练神经元模块的累积误差值,获得对应机器训练神经元模块的输入门权重系数误差、遗忘门权重系数误差、输出门权重系数误差、状态参数值误差以及机器训练神经元序列的累计误差值;以及
根据所述机器训练神经元模块的输入门权重系数误差,遗忘门权重系数误差,输出门权重系数误差以及状态参数值权重系数误差,对所述机器训练神经元序列进行更新:返回计算每个机器训练神经元模块的累积误差值的步骤,直至所述机器训练神经元序列的累积误差值小于第二设定值。
本发明实施例还提供一种事件识别模型生成方法,其包括:
接收训练信息日志;
按预设规则,将所述训练信息日志转换为对应的训练识别信息;以及
使用所述训练识别信息进行机器训练,以生成预设模型。
本发明实施例还提供一种事件识别终端,其包括:
终端信息日志收集模块,用于收集移动终端的终端信息日志;
事件识别信息转换模块,用于按预设规则,将所述终端信息日志转换为对应的事件识别信息;
恶意事件概率生成模块,用于根据所述事件识别信息以及预设模型生成所述移动终端的恶意事件概率;以及
恶意事件告警模块,用于当所述恶意事件概率大于第一设定值时,进行恶意事件告警操作;
其中通过机器训练模块生成所述预设模型,所述机器训练模块包括:
神经元模块创建单元,用于创建机器训练神经元模块;
神经元序列形成单元,用于按时间顺序创建对多个机器训练神经元模块进行串联,以形成机器训练神经元序列;
累计误差值计算单元,用于根据每个所述机器训练神经元模块输出的隐含层概率值以及期望概率值,计算每个机器训练神经元模块的累积误差值;
误差参数计算单元,用于根据机器训练神经元模块的累积误差值,获得对应机器训练神经元模块的输入门权重系数误差、遗忘门权重系数误差、输出门权重系数误差、状态参数值误差以及机器训练神经元序列的累计误差值;以及
神经元序列更新单元,用于根据所述机器训练神经元模块的输入门权重系数误差,遗忘门权重系数误差,输出门权重系数误差以及状态参数值权重系数误差,对所述机器训练神经元序列进行更新:返回累计误差值计算单元,直至所述机器训练神经元序列的累积误差值小于第二设定值。
本发明实施例还提供一种事件识别模型生成服务器,其包括:
训练信息日志接收模块,用于接收训练信息日志;
训练识别信息转换模块,用于按预设规则,将所述训练信息日志转换为对应的训练识别信息;以及
机器训练模块,用于使用所述训练识别信息进行机器训练,以生成所述预设模型。
本发明实施例还提供一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行上述任一的事件识别方法或执行上述任一的事件识别模型生成方法。
相较于现有技术,本发明的事件识别方法及终端、事件识别模型生成方法及服务器通过在服务器上生成对应的恶意事件识别模型,并将该恶意事件识别模型发送至对应的移动终端上,从而提高了移动终端对恶意事件的识别以及告警能力;有效的解决了现有的移动终端对恶意电话以及恶意信息的识别以及拦截难度较大的技术问题。
附图说明
图1为本发明的事件识别方法的实施例的流程图;
图2为本发明的事件识别模型生成方法的实施例的流程图;
图3为本发明的事件识别模型生成方法的实施例的步骤S203的流程图;
图4为本发明的事件识别模型生成方法的实施例的机器训练神经元序列的示意图;
图5为本发明的事件识别终端的实施例的结构示意图;
图6为本发明的事件识别模型生成服务器的实施例的结构示意图;
图7为本发明的事件识别模型生成服务器的实施例的机器训练模块的结构示意图;
图8A为本发明的事件识别终端和事件识别服务器的结构示意图
图8B为本发明的事件识别方法及终端、事件识别模型生成方法及服务器的具体实施例的结构示意图;
图9为本发明的事件识别方法及终端、事件识别模型生成方法及服务器的具体实施例的恶意事件识别流程图
图10为本发明的事件识别终端以及事件识别模块生成服务器所在的电子设备的工作环境结构示意图。
具体实施方式
请参照图式,其中相同的组件符号代表相同的组件,本发明的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本发明具体实施例,其不应被视为限制本发明未在此详述的其它具体实施例。
在以下的说明中,本发明的具体实施例将参考由一部或多部计算机所执行之作业的步骤及符号来说明,除非另有述明。因此,其将可了解到这些步骤及操作,其中有数次提到为由计算机执行,包括了由代表了以一结构化型式中的数据之电子信号的计算机处理单元所操纵。此操纵转换该数据或将其维持在该计算机之内存系统中的位置处,其可重新配置或另外以本领域技术人员所熟知的方式来改变该计算机之运作。该数据所维持的数据结构为该内存之实体位置,其具有由该数据格式所定义的特定特性。但是,本发明原理以上述文字来说明,其并不代表为一种限制,本领域技术人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
请参照图8A,图8A为本发明的事件识别终端和事件识别服务器的结构示意图,本发明的事件识别终端81可设置在任何电子设备中,用于对电子设备上的恶意事件进行识别以及告警操作。该电子设备包括但不限于可穿戴设备、头戴设备、医疗健康平台、个人计算机、服务器计算机、手持式或膝上型设备、移动设备(比如移动电话、个人数字助理(PDA)、媒体播放器等等)、多处理器系统、消费型电子设备、小型计算机、大型计算机、包括上述任意系统或设备的分布式计算环境,等等。如图8A所示,该电子设备优选为具有通信功能的个人移动终端。
本发明的事件识别模型生成服务器82可设置在任何电子设备中,用于创建恶意事件识别模型。该电子设备包括但不限于可穿戴设备、头戴设备、医疗健康平台、个人计算机、服务器计算机、手持式或膝上型设备、移动设备(比如移动电话、个人数字助理(PDA)、媒体播放器等等)、多处理器系统、消费型电子设备、小型计算机、大型计算机、包括上述任意系统或设备的分布式计算环境,等等。如图8A所示,该电子设备优选为与多个移动终端连接的后台服务器。其中该后台服务器可同时与多个个人移动终端连接。
本发明的事件识别方法及终端、事件识别模型生成方法及服务器通过在服务器上生成对应的恶意事件识别模型,并将该恶意事件识别模型发送至对应的移动终端上,从而提高了移动终端对恶意事件的识别以及告警能力;有效的解决了现有的移动终端对恶意电话以及恶意信息的识别以及拦截难度较大的技术问题。
请参照图1,图1为本发明的事件识别方法的实施例的流程图。本实施例的事件识别方法可使用上述的个人移动终端等电子设备进行实施。本实施例的事件识别方法包括:
步骤S101,收集移动终端的终端信息日志;
步骤S102,按预设规则,将终端信息日志转换为对应的事件识别信息;
步骤S103,根据事件识别信息以及预设模型生成移动终端的恶意事件概率;
步骤S104,当恶意事件概率大于第一设定值时,进行恶意事件告警操作;
步骤S105,获取恶意事件告警操作的反馈,并根据反馈确定事件识别信息对应的事件是否为恶意事件;
步骤S106,根据事件识别信息以及对应的反馈,对预设模型进行修正。
下面详细说明本实施例的事件识别方法的各步骤的具体流程。
在步骤S101中,事件识别终端(即移动终端)收集移动终端的终端信息日志。这里的终端信息日志为记录该移动终端通过内置应用与其他终端或服务器进行通信操作的日志。
该终端信息日志包括但不限于通话记录日志、短信记录日志以及应用调用日志。
通话记录日志为记录该移动终端与其他移动终端的通话信息,该通话记录日志包括通话时间信息(如早上10点23分开始通话)、通话时长信息(如通话时间为10分钟)以及通话号码信息(其他移动终端的电话号码,该电话号码是否在通讯录存储等)。
短信记录日志为记录该移动终端与其他移动终端的短信信息,该短信记录日志包括短信号码信息(其他移动终端的电话号码)以及短信内容信息(发送至其他移动终端的短信内容或从其他移动终端接收的短信内容)。
应用调用日志为记录该移动终端中应用的应用使用信息,该应用调用日志包括应用使用时间信息(如早上10点23分开始使用该应用)以及应用使用时长信息(如应用使用时间为10分钟)。
在步骤S102中,事件识别终端按预设规则,将步骤S101获取的终端信息日志转换为对应的事件识别信息,即对所有的终端信息日志统一进行数字编码化处理,以便预设模型对事件识别信息进行识别。
具体的,事件识别终端可将通话时间信息转换为通话Unix时间戳识别信息(如表示通话时间信息的编码等),可将通话号码信息转换为通话号码哈希值识别信息(如表示通话号码信息的二进制编码等),可将通话时长信息转换为通话时长识别信息(如以秒为单位的时长信息等),可将短信号码信息转换为短信号码哈希值识别信息(如表示短信号码信息的二进制编码等),可将短信内容信息转换为短信文本矢量识别信息(如表示短信内容信息的文本矢量编码等),可将应用使用时长信息转换为应用使用时长识别信息(如以秒为单位的时长信息等)。
优选的,将短信内容信息转换为短信文本矢量识别信息时,事件识别终端可先使用正则匹配方式对短信内容信息中的个人信息(如姓名、身份证号码以及银行卡号码等)进行过滤,然后事件识别终端对过滤后的短信内容信息进行矢量化,以得到短信文本矢量识别信息。
在步骤S103中,事件识别终端根据步骤S102生成的事件识别信息以及预设模型生成移动终端的恶意事件概率。
其中该预设模型可为一机器训练神经元序列,步骤S102获取的事件识别信息为该机器训练神经元序列的输入数据,移动终端的恶意事件概率为该机器训练神经元的输出数据。这样事件识别终端将事件识别信息输入到机器训练神经元序列,以输出恶意事件概率(如大于0小于1的概率)。
预设模型的具体生成方法可参见事件识别模型生成方法的实施例中的具体描述。
在步骤S104中,当步骤S103获取的移动终端的恶意事件概率大于第一设定值时,事件识别终端进行恶意事件告警操作,以防止移动终端的用户受到恶意电话或恶意信息的骚扰。
在步骤S105中,事件识别终端获取用户对该恶意事件告警操作的反馈,该反馈可为用户确认该终端信息日志对应的事件为恶意事件或确定该终端信息日志对应的事件不是恶意事件。因此事件识别终端可根据该反馈确定事件识别新信息对应的事件是否为恶意事件。
在步骤S106中,事件识别终端将步骤S102获取的事件识别信息以及步骤S105获取的反馈发送至对应的服务器;服务器将上述事件识别信息以及反馈作为训练识别信息对预设模型进行修正,以便移动终端对预设模型进行及时更新。
当然如果预设模型由事件识别终端生成,则事件识别终端可根据上述事件识别信息以及反馈对预设模型直接进行修正。
上述步骤S105和步骤S106非必要步骤,用户可根据需要进行设置。
这样即完成了本实施例的事件识别方法的恶意事件识别以及告警流程。
本实施例的事件识别方法通过在服务器上生成对应的恶意事件识别模型,并将该恶意事件识别模型发送至对应的移动终端上,从而提高了移动终端对恶意事件的识别以及告警能力。
本发明还提用一种事件识别模型生成方法,请参照图2,图2为本发明的事件识别模型生成方法的实施例的流程图。本实施例的事件识别模型生成方法可使用上述的后台服务器等电子设备进行实施。本实施例的事件识别模型生成方法包括:
步骤S201,接收训练信息日志;
步骤S202,按预设规则,将训练信息日志转换为对应的训练识别信息;
步骤S203,使用训练识别信息进行机器训练,以生成预设模型。
下面详细说明本实施例的事件识别模型生成方法的各步骤的具体流程。
在步骤S201中,事件识别模型生成装置(即后台服务器)接收训练信息日志。这里的训练信息日志为移动终端通过内置应用与其他终端或服务器进行通信操作的日志,用于生成预设模型。
该训练信息日志包括但不限于训练通话时间信息(如早上10点23分开始通话)、训练通话时长信息(如通话时间为10分钟)、训练通话号码信息(其他移动终端的电话号码,该电话号码是否在通讯录存储等)、训练短信号码信息(其他移动终端的电话号码)、训练短信内容信息(发送至其他移动终端的短信内容或从其他移动终端接收的短信内容)、训练应用使用时间信息(如早上10点23分开始使用该应用)、训练应用使用时长信息(如应用使用时间为10分钟)以及训练事件结果信息(该训练信息日志对应的事件是否为恶意事件)。
在步骤S202中,事件识别模型生成装置按预设规则,将步骤S201获取的训练信息日志转换为对应的训练识别信息,即对所有的训练信息日志统一进行数字编码化处理,以便创建预设模型。
具体的,事件识别模型生成装置可将训练通话时间信息转换为训练通话Unix时间戳识别信息(如表示训练通话时间信息的编码等),可将训练通话号码信息转换为训练通话号码哈希值识别信息(如表示训练通话号码信息的二进制编码等),可将训练通话时长信息转换为训练通话时长识别信息(如以秒为单位的时长信息等),可将训练短信号码信息转换为训练短信号码哈希值识别信息(如表示训练短信号码信息的二进制编码等),可将训练短信内容信息转换为训练短信文本矢量识别信息(如表示训练短信内容信息的文本矢量编码等),可将训练应用使用时长信息转换为训练应用使用时长识别信息(如以秒为单位的时长信息等)。训练事件结果信息可使用1来表示该事件为恶意事件,0来表示该事件为非恶意事件。
这里的训练通话时间信息与事件识别方法中的通话时间信息对应,训练通话号码信息与事件识别方法中的通话号码信息对应,训练通话时长信息与事件识别方法中的通话时长信息对应,训练短信号码信息与事件识别方法中的短信号码信息对应,训练通话时长信息与事件识别方法中的通话时长信息对应,训练短信内容信息与事件识别方法中的短信内容信息对应,训练应用使用时长信息与事件识别方法中的应用使用时长信息对应,训练时间结果信息与事件识别方法中的事件识别的类型对应。
在步骤S203中,事件识别模型生成装置使用步骤S202获取的训练识别信息进行机器训练,以生成预设模型。
该预设模型的生成过程请参见图3,图3为本发明的事件识别模型生成方法的实施例的步骤S203的流程图。该步骤S203包括:
步骤S301,创建机器训练神经元模块;
步骤S302,按时间顺序创建对多个机器训练神经元模块进行串联,以形成机器训练神经元序列;
步骤S303,对机器训练神经元模块的输入门权重系数、遗忘门权重系数、输出门权重系数、非隐含层概率值以及隐含层概率值进行初始化操作;
步骤S304,根据每个所述机器训练神经元模块输出的隐含层概率值以及期望概率值,计算每个机器训练神经元模块的累积误差值;
步骤S305,根据机器训练神经元模块的累积误差值,获得对应机器训练神经元模块的输入门权重系数误差、遗忘门权重系数误差、输出门权重系数误差、状态参数值误差以及机器训练神经元序列的累计误差值;
步骤S306,根据机器训练神经元模块的输入门权重系数误差,遗忘门权重系数误差,输出门权重系数误差以及状态参数值权重系数误差,对机器训练神经元序列进行更新:返回步骤S304,直至所述机器训练神经元序列的累积误差值小于第二设定值。
具体的,在步骤S301中,事件识别模型生成装置按以下递归神经网络的创建公式创建机器训练神经元模块:
it=sigmoid(Wxixt+Whiht-1+bi);
ft=sigmoid(Wxfxt+Whfht-1+bf);
ot=sigmoid(Wxoxt+Whoht-1+bo);
ct'=tanh(Wxcxt+Whcht-1+bc);
其中xt为时间t对应的神经元模块的训练识别信息,it为时间t对应的神经元模块的输入门,ft为时间t对应的神经元模块的遗忘门,ot为时间t对应的神经元模块的输出门,ht为时间t对应的神经元模块输出的隐含层概率值,ct'为时间t对应的神经元模块的状态参数值,ct为时间t对应的神经元模块输出的非隐含层概率值,Wxi、Whi、bi为输入门权重系数,Wxf、Whf、bf为遗忘门权重系数,Wxo、Who、bo为输出门权重系数,Wxc、Whc、bc为状态参数值权重系数。
即每个机器训练神经元模块输入当前时间t对应的训练识别信息,上一个机器训练神经元模块在前一个时间t-1输出的隐含层概率值以及上一个机器训练神经元模块在前一个时间t-1输出的非隐含层概率值。
每个机器训练元模块输出当前时间t对应隐含层概率值以及当前时间t对应的非隐含层概率值。
在步骤S302中,事件识别模型生成装置按时间顺序创建对多个机器训练神经元模块进行串联,以形成机器训练神经元序列,具体如图4所示,图4为本发明的事件识别模型生成方法的实施例的机器训练神经元序列的示意图。这样机器训练神经元序列的最后一个机器训练神经元模块输出的隐含层概率值即为该训练识别信息对应的事件的恶意事件概率。
在步骤S303中,事件识别模型生成装置对步骤S302中创建的机器训练神经元序列的所有机器训练神经元模块的输入门权重系数、遗忘门权重系数、输出门权重系数、非隐含层概率值以及隐含层概率值进行初始化操作。如将上述输入门权重系数、遗忘门权重系数、输出门权重系数、非隐含层概率值以及隐含层概率值均设置成一接近0的数字,如0.012等,以便给机器训练神经元序列形成一预设模型框架。当然这里也可直接对所有机器训练神经元模块的输入门权重系数、遗忘门权重系数、输出门权重系数、非隐含层概率值以及隐含层概率值进行预先设置。
在步骤S304中,事件识别模型生成装置基于步骤S303的预设值,根据每个机器训练神经元模块输出的隐含层概率值以及期望概率值,计算每个机器训练神经元模块的累积误差值Et
(通过均方误差计算累计误差值);或
(通过混合信息熵计算累计误差值)
其中hpt为时间t对应的机器训练神经元模块的期望概率值,n为机器训练神经元模块的编号。
在步骤S305中,事件识别模型生成装置根据步骤S304获取的机器训练神经元模块的累积误差值,计算每个机器训练神经元模块中各个系数的误差,即
时间t对应的机器训练神经元的累计误差值为:
时间t对应的机器训练神经元的输入门误差为:
时间t对应的机器训练神经元的遗忘门误差为:
时间t对应的机器训练神经元的状态参数值误差为:
时间t对应的机器训练神经元的输出门误差为:
neti,t=Wxixt+Whiht-1+bi
netf,t=Wxfxt+Whfht-1+bf
neto,t=Wxoxt+Whoht-1+bo
netc',t=Wxcxt+Whcht-1+bc
计算可得:
其中为机器训练神经元序列的累计误差值,为时间t对应的机器训练神经元模块的误差值,为时间t对应的机器训练神经元模块的输出门误差,为时间t对应的机器训练神经元模块的遗忘门误差,为时间t对应的机器训练神经元模块的输入门误差,为时间t对应的机器训练神经元模块的状态参数值误差。
这样事件识别模型生成装置可获得每个机器训练神经元模块的输入门权重系数误差、遗忘门权重系数误差、输出门权重系数误差、状态参数值误差以及机器训练神经元序列的累计误差值,具体如下:
其中x11、x3、x7为输入门权重系数误差;x10、x2、x6为遗忘门权重系数误差;x9、x1、x5为输出门权重系数误差;x12、x4、x8为状态参数值权重系数误差。
在步骤S306中,事件识别模型生成装置使用以下公式,根据机器训练神经元模块的输入门权重系数误差,遗忘门权重系数误差,输出门权重系数误差以及状态参数值权重系数误差,对机器训练神经元序列进行更新:
Woh'=Woh+α*x1
Wfh'=Wfh+α*x2
Wih'=Wih+α*x3
Wch'=Wch+α*x4
bo'=bo+α*x5
bf'=bf+α*x6
bi'=bi+α*x7
bc'=bc+α*x8
Wox'=Wox+α*x9
Wfx'=Wfx+α*x10
Wix'=Wix+α*x11
Wcx'=Wcx+α*x12
其中Wix'、Wih'、bi'为更新后的输入门权重系数;Wfx'、Wfh'、bf'为更新后的遗忘门权重系数;Wox'、Woh'、bo'为更新后的输出门权重系数;Wcx'、Wch'、bc'为更新后的状态参数值权重系数,α取值范围为0-1的学习率。这里Wxc和Wcx、Wxo和Wox、Wxf和Wfx、Wxi和Wix、Whc和Wch、Who和Woh、Whf和Wfh、Whi和Wih互为逆矩阵。
随后事件识别模型生成装置返回步骤S304,直至机器训练神经元序列的累积误差值小于第二设定值,即建立的机器训练神经元序列的模型的准确度达到用户要求。
这样即完成了本实施例的事件识别模型生成方法的事件识别模型创建流程。
本实施例的事件识别模型创建方法在后台服务器上采用递归神经网络的向后传播算法进行事件识别模型的创建,并将上述事件识别模型发送至对应的移动终端上,以进行移动终端的恶意事件的识别以及告警操作,从而提高了移动终端对恶意事件的识别以及告警能力。
本发明还提供一种事件识别终端,请参照图5,图5为本发明的事件识别终端的实施例的结构示意图。本实施例的事件识别终端可使用上述的事件识别方法的实施例进行实施,本实施例的事件识别终端50包括终端信息日志收集模块51、事件识别信息转换模块52、恶意事件概率生成模块53、恶意事件告警模块54、反馈获取模块55以及模型修正模块56。
终端信息日志收集模块51用于收集移动终端的终端信息日志;事件识别信息转换模块52用于按预设规则,将终端信息日志转换为对应的事件识别信息;恶意事件概率生成模块53用于根据事件识别信息以及预设模型生成移动终端的恶意事件概率;恶意事件告警模块54用于当恶意事件概率大于第一设定值时,进行恶意事件告警操作;反馈获取模块55用于获取恶意事件告警操作的反馈,并根据反馈确定事件识别信息对应的事件是否为恶意事件;模型修正模块56用于根据事件识别信息以及对应的反馈,对预设模型进行修正。
本实施例的事件识别终端50使用时,首先终端信息日志收集模块51收集移动终端的终端信息日志。这里的终端信息日志为记录该移动终端通过内置应用与其他终端或服务器进行通信操作的日志。
该终端信息日志包括但不限于通话记录日志、短信记录日志以及应用调用日志。
通话记录日志为记录该移动终端与其他移动终端的通话信息,该通话记录日志包括通话时间信息、通话时长信息以及通话号码信息。短信记录日志为记录该移动终端与其他移动终端的短信信息,该短信记录日志包括短信号码信息以及短信内容信息。应用调用日志为记录该移动终端中应用的应用使用信息,该应用调用日志包括应用使用时间信息以及应用使用时长信息。
随后事件识别信息转换模块52按预设规则,将终端信息日志收集模块51获取的终端信息日志转换为对应的事件识别信息,即对所有的终端信息日志统一进行数字编码化处理,以便预设模型对事件识别信息进行识别。
具体的,事件识别信息转换模块52可将通话时间信息转换为通话Unix时间戳识别信息,可将通话号码信息转换为通话号码哈希值识别信息,可将通话时长信息转换为通话时长识别信息,可将短信号码信息转换为短信号码哈希值识别信息,可将短信内容信息转换为短信文本矢量识别信息,可将应用使用时长信息转换为应用使用时长识别信息。
优选的,将短信内容信息转换为短信文本矢量识别信息时,事件识别信息转换模块可先使用正则匹配方式对短信内容信息中的个人信息(如姓名、身份证号码以及银行卡号码等)进行过滤,然后事件识别信息转换模块对过滤后的短信内容信息进行矢量化,以得到短信文本矢量识别信息。
然后,恶意事件概率生成模块53根据事件识别信息转换模块52生成的事件识别信息以及预设模型生成移动终端的恶意事件概率。
其中该预设模型可为一机器训练神经元序列,事件识别信息转换模块获取的事件识别信息为该机器训练神经元序列的输入数据,移动终端的恶意事件概率为该机器训练神经元的输出数据。这样恶意事件概率生成模块将事件识别信息输入到机器训练神经元序列,以输出恶意事件概率(如大于0小于1的概率)。
随后当恶意事件概率生成模块53获取的移动终端的恶意事件概率大于第一设定值时,恶意事件告警模块54进行恶意事件告警操作,以防止移动终端的用户受到恶意电话或恶意信息的骚扰。
然后反馈获取模块55获取用户对该恶意事件告警操作的反馈,该反馈可为用户确认该终端信息日志对应的事件为恶意事件或确定该终端信息日志对应的事件不是恶意事件。因此事件识别终端50可根据该反馈确定事件识别新信息对应的事件是否为恶意事件。
最后模型修正模块56将事件识别信息转换模块52获取的事件识别信息以及反馈获取模块55获取的反馈发送至对应的服务器;服务器将上述事件识别信息以及反馈作为训练识别信息对预设模型进行修正,以便移动终端对预设模型进行及时更新。
当然如果预设模型由事件识别终端50生成,则事件识别终端50可根据上述事件识别信息以及反馈对预设模型直接进行修正。
上述反馈获取模块55和模型修正模块56可根据用户需要进行设置。
这样即完成了本实施例的事件识别终端50的恶意事件识别以及告警流程。
本实施例的事件识别终端通过在服务器上生成对应的恶意事件识别模型,并将该恶意事件识别模型发送至对应的移动终端上,从而提高了移动终端对恶意事件的识别以及告警能力。
本发明还提供一种事件识别模型生成服务器,请参照图6,图6为本发明的事件识别模型生成服务器的实施例的结构示意图。本实施例的事件识别模型生成服务器可使用上述的事件识别模型生成方法的实施例进行实施,本实施例的事件识别模型生成服务器60包括训练信息日志接收模块61、训练识别信息转换模块62以及机器训练模块63。
训练信息日志接收模块61用于接收训练信息日志;训练识别信息转换模块62用于按预设规则,将训练信息日志转换为对应的训练识别信息;机器训练模块63用于使用训练识别信息进行机器训练,以生成预设模型。
请参照图7,图7为本发明的事件识别模型生成服务器的实施例的机器训练模块的结构示意图。该机器训练模块63包括神经元模块创建单元631、神经元序列形成单元632、初始化操作单元633、累计误差值计算单元634、误差参数计算单元635以及神经元序列更新单元636。
神经元模块创建单元631用于创建机器训练神经元模块;神经元序列形成单元632用于按时间顺序创建对多个机器训练神经元模块进行串联,以形成机器训练神经元序列;初始化操作单元633用于对机器训练神经元模块的输入门权重系数、遗忘门权重系数、输出门权重系数、非隐含层概率值以及隐含层概率值进行初始化操作;累计误差值计算单元634用于根据每个机器训练神经元模块输出的隐含层概率值以及期望概率值,计算每个机器训练神经元模块的累积误差值;误差参数计算单元635用于根据机器训练神经元模块的累积误差值,获得对应机器训练神经元模块的输入门权重系数误差、遗忘门权重系数误差、输出门权重系数误差、状态参数值误差以及机器训练神经元序列的累计误差值;神经元序列更新单元636用于根据机器训练神经元模块的输入门权重系数误差,遗忘门权重系数误差,输出门权重系数误差以及状态参数值权重系数误差,对机器训练神经元序列进行更新:返回累计误差值计算单元,直至机器训练神经元序列的累积误差值小于第二设定值。
本实施例的事件识别模型生成服务器60使用时,首先训练信息日志接收模块61接收训练信息日志。这里的训练信息日志为移动终端通过内置应用与其他终端或服务器进行通信操作的日志,用于生成预设模型。
该训练信息日志包括但不限于训练通话时间信息、训练通话时长信息、训练通话号码信息、训练短信号码信息、训练短信内容信息、训练应用使用时间信息、训练应用使用时长信息以及训练事件结果信息。
随后训练识别信息转换模块62按预设规则,将训练信息日志接收模块61获取的训练信息日志转换为对应的训练识别信息,即对所有的训练信息日志统一进行数字编码化处理,以便创建预设模型。
具体的,训练识别信息转换模块62可将训练通话时间信息转换为训练通话Unix时间戳识别信息,可将训练通话号码信息转换为训练通话号码哈希值识别信息,可将训练通话时长信息转换为训练通话时长识别信息,可将训练短信号码信息转换为训练短信号码哈希值识别信息,可将训练短信内容信息转换为训练短信文本矢量识别信息,可将训练应用使用时长信息转换为训练应用使用时长识别信息。训练事件结果信息可使用1来表示该事件为恶意事件,0来表示该事件为非恶意事件。
最后机器训练模块63使用训练识别信息转换模块62获取的训练识别信息进行机器训练,以生成预设模型。
该预设模型的生成过程具体包括:
机器训练模块63的神经元模块创建单元631按以下递归神经网络的创建公式创建机器训练神经元模块:
it=sigmoid(Wxixt+Whiht-1+bi);
ft=sigmoid(Wxfxt+Whfht-1+bf);
ot=sigmoid(Wxoxt+Whoht-1+bo);
ct'=tanh(Wxcxt+Whcht-1+bc);
其中xt为时间t对应的神经元模块的训练识别信息,it为时间t对应的神经元模块的输入门,ft为时间t对应的神经元模块的遗忘门,ot为时间t对应的神经元模块的输出门,ht为时间t对应的神经元模块输出的隐含层概率值,ct'为时间t对应的神经元模块的状态参数值,ct为时间t对应的神经元模块输出的非隐含层概率值,Wxi、Whi、bi为输入门权重系数,Wxf、Whf、bf为遗忘门权重系数,Wxo、Who、bo为输出门权重系数,Wxc、Whc、bc为状态参数值权重系数。
即每个机器训练神经元模块输入当前时间t对应的训练识别信息,上一个机器训练神经元模块在前一个时间t-1输出的隐含层概率值以及上一个机器训练神经元模块在前一个时间t-1输出的非隐含层概率值。
每个机器训练元模块输出当前时间t对应隐含层概率值以及当前时间t对应的非隐含层概率值。
机器训练模块63的神经元序列形成单元632按时间顺序创建对多个机器训练神经元模块进行串联,以形成机器训练神经元序列,具体如图4所示。这样机器训练神经元序列的最后一个机器训练神经元模块输出的隐含层概率值即为该训练识别信息对应的事件的恶意事件概率。
机器训练模块63的初始化操作单元633对神经元序列形成单元632创建的机器训练神经元序列的所有机器训练神经元模块的输入门权重系数、遗忘门权重系数、输出门权重系数、非隐含层概率值以及隐含层概率值进行初始化操作。如将上述输入门权重系数、遗忘门权重系数、输出门权重系数、非隐含层概率值以及隐含层概率值均设置成一接近0的数字,如0.012等,以便给机器训练神经元序列形成一预设模型框架。当然这里也可直接对所有机器训练神经元模块的输入门权重系数、遗忘门权重系数、输出门权重系数、非隐含层概率值以及隐含层概率值进行预先设置。
机器训练模块63的累计误差值计算单元634基于初始化操作单元633设置的预设值,根据每个机器训练神经元模块输出的隐含层概率值以及期望概率值,计算每个机器训练神经元模块的累积误差值Et
(通过均方误差计算累计误差值);或
(通过混合信息熵计算累计误差值)
其中hpt为时间t对应的机器训练神经元模块的期望概率值,n为机器训练神经元模块的编号。
机器训练模块63的误差参数计算单元635根据累计误差值计算单元634获取的机器训练神经元模块的累积误差值,计算每个机器训练神经元模块中各个系数的误差,即
时间t对应的机器训练神经元的累计误差值为:
时间t对应的机器训练神经元的输入门误差为:
时间t对应的机器训练神经元的遗忘门误差为:
时间t对应的机器训练神经元的状态参数值误差为:
时间t对应的机器训练神经元的输出门误差为:
neti,t=Wxixt+Whiht-1+bi
netf,t=Wxfxt+Whfht-1+bf
neto,t=Wxoxt+Whoht-1+bo
netc',t=Wxcxt+Whcht-1+bc
计算可得:
其中为机器训练神经元序列的累计误差值,为时间t对应的机器训练神经元模块的误差值,为时间t对应的机器训练神经元模块的输出门误差,为时间t对应的机器训练神经元模块的遗忘门误差,为时间t对应的机器训练神经元模块的输入门误差,为时间t对应的机器训练神经元模块的状态参数值误差。
这样误差参数计算单元635可获得每个机器训练神经元模块的输入门权重系数误差、遗忘门权重系数误差、输出门权重系数误差、状态参数值误差以及机器训练神经元序列的累计误差值,具体如下:
其中x11、x3、x7为输入门权重系数误差;x10、x2、x6为遗忘门权重系数误差;x9、x1、x5为输出门权重系数误差;x12、x4、x8为状态参数值权重系数误差。
机器训练模块63的神经元序列更新单元636使用以下公式,根据机器训练神经元模块的输入门权重系数误差,遗忘门权重系数误差,输出门权重系数误差以及状态参数值权重系数误差,对机器训练神经元序列进行更新:
Woh'=Woh+α*x1
Wfh'=Wfh+α*x2
Wih'=Wih+α*x3
Wch'=Wch+α*x4
bo'=bo+α*x5
bf'=bf+α*x6
bi'=bi+α*x7
bc'=bc+α*x8
Wox'=Wox+α*x9
Wfx'=Wfx+α*x10
Wix'=Wix+α*x11
Wcx'=Wcx+α*x12
其中Wix'、Wih'、bi'为更新后的输入门权重系数;Wfx'、Wfh'、bf'为更新后的遗忘门权重系数;Wox'、Woh'、bo'为更新后的输出门权重系数;Wcx'、Wch'、bc'为更新后的状态参数值权重系数,α取值范围为0-1的学习率。这里Wxc和Wcx、Wxo和Wox、Wxf和Wfx、Wxi和Wix、Whc和Wch、Who和Woh、Whf和Wfh、Whi和Wih互为逆矩阵。
随后神经元序列更新单元636返回神经元序列更新单元634,直至机器训练神经元序列的累积误差值小于第二设定值,即建立的机器训练神经元序列的模型的准确度达到用户要求。
这样即完成了本实施例的事件识别模型生成服务器60的事件识别模型创建流程。
本实施例的事件识别模型生成服务器采用递归神经网络的向后传播算法进行事件识别模型的创建,并将上述事件识别模型发送至对应的移动终端上,以进行移动终端的恶意事件的识别以及告警操作,从而提高了移动终端对恶意事件的识别以及告警能力。
下面通过一具体实施例说明本发明的事件识别方法及终端、事件识别模型生成方法及服务器的具体工作原理。请参照图8B和图9,图8B为本发明的事件识别方法及终端、事件识别模型生成方法及服务器的具体实施例的结构示意图。图9为本发明的事件识别方法及终端、事件识别模型生成方法及服务器的具体实施例的恶意事件识别流程图。
该事件识别方法通过事件识别终端81进行实施,事件识别模型生成方法通过事件识别模型生成服务器82进行实施。本具体实施例的恶意事件识别过程包括:
步骤S901,事件识别模型生成服务器82的数据库821接收外部输入的训练识别信息,该训练识别信息可为用户反馈数据等。该训练识别信息包括训练通话时长识别信息、训练短信号码哈希值识别信息以及训练通话Unix时间戳识别信息等统一进行数字编码化处理的数字信息。
步骤S902,事件识别模型生成服务器82的机器训练模块822使用上述训练识别信息,进行机器训练,以生成对应的预设模型,并将该预设模型发送至事件识别终端。
步骤S903,事件识别终端81的终端信息日志收集模块811收集事件识别终端的通话记录日志、短信记录日志以及应用调用日志等终端信息日志,并将上述终端信息日志统一进行数字编码化处理,生成对应的通话Unix时间戳识别信息、通话时长识别信息、短信文本矢量识别信息以及应用使用时长识别信息等事件识别信息。
步骤S904,事件识别终端81的恶意事件概率生成模块812基于事件识别模型生成服务器发送的预设模型,对上述事件识别信息进行计算,得到上述事件识别信息对应的恶意事件概率。
步骤S905,事件识别终端81的恶意事件告警模块813基于恶意事件概率生成模块812生成的恶意事件概率进行恶意事件告警操作。即根据恶意事件概率判断该事件识别信息对应的事件为恶意事件,则恶意事件告警模块813调用告警界面警示用户当前风险,否则不做任何操作。
步骤S906,事件识别终端81的反馈获取模块814获取用户对上述恶意事件告警操作的反馈,以判断上述恶意事件告警操作是否准确。由于并非所有的恶意事件告警均为准确的恶意事件告警操作,因此这里会基于用户的反馈对步骤S905生成恶意事件告警操作的准确性进行判断。
步骤S907,事件识别终端81的模型修正模块815将上述事件识别信息以及对应的反馈发送至事件识别模型生成服务器82的数据库821,以便事件识别模型生成服务器82的机器训练模块822对预设模型进行修正。这里的反馈包括正确的恶意事件告警操作的反馈以及错误的恶意事件告警操作的反馈。
步骤S908,事件识别模型生成服务器82的机器训练模块822将修正后的预设模型发送至事件识别终端81。
这样即完成了本具体实施例的事件识别方法及终端、事件识别模型生成方法及服务器的恶意事件识别流程。
本发明的事件识别方法及终端、事件识别模型生成方法及服务器综合用户的短信、电话以及手机应用行为等行为记录,通过对用户反馈的历史行为数据进行预设模型建立,从而给出用户接收到的电话或信息是否为恶意电话或恶意信息,以防止用户遭受电信诈骗。
因此本发明的事件识别方法及终端、事件识别模型生成方法及服务器通过在服务器上生成对应的恶意事件识别模型,并将该恶意事件识别模型发送至对应的移动终端上,从而提高了移动终端对恶意事件的识别以及告警能力;有效的解决了现有的移动终端对恶意电话以及恶意信息的识别以及拦截难度较大的技术问题。
如本申请所使用的术语“组件”、“模块”、“系统”、“接口”、“进程”等等一般地旨在指计算机相关实体:硬件、硬件和软件的组合、软件或执行中的软件。例如,组件可以是但不限于是运行在处理器上的进程、处理器、对象、可执行应用、执行的线程、程序和/或计算机。通过图示,运行在控制器上的应用和该控制器二者都可以是组件。一个或多个组件可以有在于执行的进程和/或线程内,并且组件可以位于一个计算机上和/或分布在两个或更多计算机之间。
图10和随后的讨论提供了对实现本发明所述的事件识别终端以及事件识别模块生成服务器所在的电子设备的工作环境的简短、概括的描述。图10的工作环境仅仅是适当的工作环境的一个实例并且不旨在建议关于工作环境的用途或功能的范围的任何限制。实例电子设备1012包括但不限于可穿戴设备、头戴设备、医疗健康平台、个人计算机、服务器计算机、手持式或膝上型设备、移动设备(比如移动电话、个人数字助理(PDA)、媒体播放器等等)、多处理器系统、消费型电子设备、小型计算机、大型计算机、包括上述任意系统或设备的分布式计算环境,等等。
尽管没有要求,但是在“计算机可读指令”被一个或多个电子设备执行的通用背景下描述实施例。计算机可读指令可以经由计算机可读介质来分布(下文讨论)。计算机可读指令可以实现为程序模块,比如执行特定任务或实现特定抽象数据类型的功能、对象、应用编程接口(API)、数据结构等等。典型地,该计算机可读指令的功能可以在各种环境中随意组合或分布。
图10图示了包括本发明的事件识别终端以及事件识别模块生成服务器中的一个或多个实施例的电子设备1012的实例。在一种配置中,电子设备1012包括至少一个处理单元1016和存储器1018。根据电子设备的确切配置和类型,存储器1018可以是易失性的(比如RAM)、非易失性的(比如ROM、闪存等)或二者的某种组合。该配置在图10中由虚线1014图示。
在其他实施例中,电子设备1012可以包括附加特征和/或功能。例如,设备1012还可以包括附加的存储装置(例如可移除和/或不可移除的),其包括但不限于磁存储装置、光存储装置等等。这种附加存储装置在图10中由存储装置1020图示。在一个实施例中,用于实现本文所提供的一个或多个实施例的计算机可读指令可以在存储装置1020中。存储装置1020还可以存储用于实现操作系统、应用程序等的其他计算机可读指令。计算机可读指令可以载入存储器1018中由例如处理单元1016执行。
本文所使用的术语“计算机可读介质”包括计算机存储介质。计算机存储介质包括以用于存储诸如计算机可读指令或其他数据之类的信息的任何方法或技术实现的易失性和非易失性、可移除和不可移除介质。存储器1018和存储装置1020是计算机存储介质的实例。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字通用盘(DVD)或其他光存储装置、盒式磁带、磁带、磁盘存储装置或其他磁存储设备、或可以用于存储期望信息并可以被电子设备1012访问的任何其他介质。任意这样的计算机存储介质可以是电子设备1012的一部分。
电子设备1012还可以包括允许电子设备1012与其他设备通信的通信连接1026。通信连接1026可以包括但不限于调制解调器、网络接口卡(NIC)、集成网络接口、射频发射器/接收器、红外端口、USB连接或用于将电子设备1012连接到其他电子设备的其他接口。通信连接1026可以包括有线连接或无线连接。通信连接1026可以发射和/或接收通信媒体。
术语“计算机可读介质”可以包括通信介质。通信介质典型地包含计算机可读指令或诸如载波或其他传输机构之类的“己调制数据信号”中的其他数据,并且包括任何信息递送介质。术语“己调制数据信号”可以包括这样的信号:该信号特性中的一个或多个按照将信息编码到信号中的方式来设置或改变。
电子设备1012可以包括输入设备1024,比如键盘、鼠标、笔、语音输入设备、触摸输入设备、红外相机、视频输入设备和/或任何其他输入设备。设备1012中也可以包括输出设备1022,比如一个或多个显示器、扬声器、打印机和/或任意其他输出设备。输入设备1024和输出设备1022可以经由有线连接、无线连接或其任意组合连接到电子设备1012。在一个实施例中,来自另一个电子设备的输入设备或输出设备可以被用作电子设备1012的输入设备1024或输出设备1022。
电子设备1012的组件可以通过各种互连(比如总线)连接。这样的互连可以包括外围组件互连(PCI)(比如快速PCI)、通用串行总线(USB)、火线(IEEE1394)、光学总线结构等等。在另一个实施例中,电子设备1012的组件可以通过网络互连。例如,存储器1018可以由位于不同物理位置中的、通过网络互连的多个物理存储器单元构成。
本领域技术人员将认识到,用于存储计算机可读指令的存储设备可以跨越网络分布。例如,可经由网络1028访问的电子设备1030可以存储用于实现本发明所提供的一个或多个实施例的计算机可读指令。电子设备1012可以访问电子设备1030并且下载计算机可读指令的一部分或所有以供执行。可替代地,电子设备1012可以按需要下载多条计算机可读指令,或者一些指令可以在电子设备1012处执行并且一些指令可以在电子设备1030处执行。
本文提供了实施例的各种操作。在一个实施例中,所述的一个或多个操作可以构成一个或多个计算机可读介质上存储的计算机可读指令,其在被电子设备执行时将使得计算设备执行所述操作。描述一些或所有操作的顺序不应当被解释为暗示这些操作必需是顺序相关的。本领域技术人员将理解具有本说明书的益处的可替代的排序。而且,应当理解,不是所有操作必需在本文所提供的每个实施例中存在。
而且,尽管已经相对于一个或多个实现方式示出并描述了本公开,但是本领域技术人员基于对本说明书和附图的阅读和理解将会想到等价变型和修改。本公开包括所有这样的修改和变型,并且仅由所附权利要求的范围限制。特别地关于由上述组件(例如元件、资源等)执行的各种功能,用于描述这样的组件的术语旨在对应于执行所述组件的指定功能(例如其在功能上是等价的)的任意组件(除非另外指示),即使在结构上与执行本文所示的本公开的示范性实现方式中的功能的公开结构不等同。此外,尽管本公开的特定特征已经相对于若干实现方式中的仅一个被公开,但是这种特征可以与如可以对给定或特定应用而言是期望和有利的其他实现方式的一个或多个其他特征组合。而且,就术语“包括”、“具有”、“含有”或其变形被用在具体实施方式或权利要求中而言,这样的术语旨在以与术语“包含”相似的方式包括。
本发明实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。上述的各装置或系统,可以执行相应方法实施例中的方法。
综上所述,虽然本发明已以实施例揭露如上,实施例前的序号仅为描述方便而使用,对本发明各实施例的顺序不造成限制。并且,上述实施例并非用以限制本发明,本领域的普通技术人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,因此本发明的保护范围以权利要求界定的范围为准。

Claims (17)

1.一种事件识别方法,其特征在于,包括:
收集移动终端的终端信息日志;
按预设规则,将所述终端信息日志转换为对应的事件识别信息;
根据所述事件识别信息以及预设模型生成所述移动终端的恶意事件概率;以及
当所述恶意事件概率大于第一设定值时,进行恶意事件告警操作;
其中通过以下步骤生成所述预设模型:
创建机器训练神经元模块;
按时间顺序创建对多个机器训练神经元模块进行串联,以形成机器训练神经元序列;
根据每个所述机器训练神经元模块输出的隐含层概率值以及期望概率值,计算每个机器训练神经元模块的累积误差值;
根据机器训练神经元模块的累积误差值,获得对应机器训练神经元模块的输入门权重系数误差、遗忘门权重系数误差、输出门权重系数误差、状态参数值误差以及机器训练神经元序列的累计误差值;以及
根据所述机器训练神经元模块的输入门权重系数误差,遗忘门权重系数误差,输出门权重系数误差以及状态参数值权重系数误差,对所述机器训练神经元序列进行更新:返回计算每个机器训练神经元模块的累积误差值的步骤,直至所述机器训练神经元序列的累积误差值小于第二设定值。
2.根据权利要求1所述的事件识别方法,其特征在于,所述移动终端的终端信息日志包括通话记录日志、短信记录日志以及应用调用日志;
其中所述通话记录日志包括通话时间信息、通话时长信息以及通话号码信息;所述短信记录日志包括短信号码信息以及短信内容信息;所述应用调用日志包括应用使用时间信息以及应用使用时长信息;
其中所述按预设规则,将所述终端信息日志转换为对应的事件识别信息的步骤为:
按所述预设规则,将所述终端信息日志进行统一的数字编码化处理,以转换为对应的事件识别信息。
3.根据权利要求2所述的事件识别方法,其特征在于,所述按所述预设规则,将所述终端信息日志进行统一的数字编码化处理,以转换为对应的事件识别信息的步骤包括:
使用正则匹配方式对所述短信内容信息中的个人信息进行过滤;以及
对过滤后的短信内容信息进行矢量化,以得到短信内容信息对应的事件识别信息。
4.根据权利要求1所述的事件识别方法,其特征在于,所述事件识别方法还包括:
获取所述恶意事件告警操作的反馈,并根据所述反馈确定所述事件识别信息对应的事件是否为恶意事件;以及
根据所述事件识别信息以及对应的反馈,对所述预设模型进行修正。
5.一种事件识别模型生成方法,其特征在于,包括:
接收训练信息日志;
按预设规则,将所述训练信息日志转换为对应的训练识别信息;以及
使用所述训练识别信息进行机器训练,以生成预设模型。
6.根据权利要求5所述的事件识别模型生成方法,其特征在于,所述训练信息日志包括训练通话时间信息、训练通话时长信息、训练通话号码信息、训练短信号码信息、训练短信内容信息、训练应用使用时间信息、训练应用使用时长信息以及训练事件结果信息;
其中所述按预设规则,将所述训练信息日志转换为对应的训练识别信息的步骤为:
按所述预设规则,将所述终端信息日志进行统一的数字编码化处理,以转换为对应的事件识别信息。
7.根据权利要求5所述的事件识别模型生成方法,其特征在于,所述使用所述训练识别信息进行机器训练,生成所述预设模型的步骤包括:
创建机器训练神经元模块;
按时间顺序创建对多个机器训练神经元模块进行串联,以形成机器训练神经元序列;
根据每个所述机器训练神经元模块输出的隐含层概率值以及期望概率值,计算每个机器训练神经元模块的累积误差值;
根据机器训练神经元模块的累积误差值,获得对应机器训练神经元模块的输入门权重系数误差、遗忘门权重系数误差、输出门权重系数误差、状态参数值误差以及机器训练神经元序列的累计误差值;以及
根据所述机器训练神经元模块的输入门权重系数误差,遗忘门权重系数误差,输出门权重系数误差以及状态参数值权重系数误差,对所述机器训练神经元序列进行更新:返回计算每个机器训练神经元模块的累积误差值的步骤,直至所述机器训练神经元序列的累积误差值小于第二设定值。
8.根据权利要求7所述的事件识别模型生成方法,其特征在于,所述形成机器训练神经元序列的步骤之后,所述计算每个机器训练神经元模块的累积误差值的步骤之前还包括:
对所述机器训练神经元模块的输入门权重系数、遗忘门权重系数、输出门权重系数、非隐含层概率值以及隐含层概率值进行初始化操作。
9.一种事件识别终端,其特征在于,包括:
终端信息日志收集模块,用于收集移动终端的终端信息日志;
事件识别信息转换模块,用于按预设规则,将所述终端信息日志转换为对应的事件识别信息;
恶意事件概率生成模块,用于根据所述事件识别信息以及预设模型生成所述移动终端的恶意事件概率;以及
恶意事件告警模块,用于当所述恶意事件概率大于第一设定值时,进行恶意事件告警操作;
其中通过机器训练模块生成所述预设模型,所述机器训练模块包括:
神经元模块创建单元,用于创建机器训练神经元模块;
神经元序列形成单元,用于按时间顺序创建对多个机器训练神经元模块进行串联,以形成机器训练神经元序列;
累计误差值计算单元,用于根据每个所述机器训练神经元模块输出的隐含层概率值以及期望概率值,计算每个机器训练神经元模块的累积误差值;
误差参数计算单元,用于根据机器训练神经元模块的累积误差值,获得对应机器训练神经元模块的输入门权重系数误差、遗忘门权重系数误差、输出门权重系数误差、状态参数值误差以及机器训练神经元序列的累计误差值;以及
神经元序列更新单元,用于根据所述机器训练神经元模块的输入门权重系数误差,遗忘门权重系数误差,输出门权重系数误差以及状态参数值权重系数误差,对所述机器训练神经元序列进行更新:返回累计误差值计算单元,直至所述机器训练神经元序列的累积误差值小于第二设定值。
10.根据权利要求9所述的事件识别终端,其特征在于,所述移动终端的终端信息日志包括通话记录日志、短信记录日志以及应用调用日志;
其中所述通话记录日志包括通话时间信息、通话时长信息以及通话号码信息;所述短信记录日志包括短信号码信息以及短信内容信息;所述应用调用日志包括应用使用时间信息以及应用使用时长信息;
所述事件识别信息转换模块用于按所述预设规则,将所述终端信息日志进行统一的数字编码化处理,以转换为对应的事件识别信息。
11.根据权利要求10所述的事件识别终端,其特征在于,所述事件识别信息转换模块还用于:
使用正则匹配方式对所述短信内容信息中的个人信息进行过滤;以及
对过滤后的短信内容信息进行矢量化,以得到短信内容信息对应的事件识别信息。
12.根据权利要求9所述的事件识别终端,其特征在于,所述事件识别终端还包括:
反馈获取模块,用于获取所述恶意事件告警操作的反馈,并根据所述反馈确定所述事件识别信息对应的事件是否为恶意事件;以及
模型修正模块,用于根据所述事件识别信息以及对应的反馈,对所述预设模型进行修正。
13.一种事件识别模型生成服务器,其特征在于,包括:
训练信息日志接收模块,用于接收训练信息日志;
训练识别信息转换模块,用于按预设规则,将所述训练信息日志转换为对应的训练识别信息;以及
机器训练模块,用于使用所述训练识别信息进行机器训练,以生成所述预设模型。
14.根据权利要求13所述的事件识别模型生成服务器,其特征在于,所述训练信息日志包括训练通话时间信息、训练通话时长信息、训练通话号码信息、训练短信号码信息、训练短信内容信息、训练应用使用时间信息、训练应用使用时长信息以及训练事件结果信息;
其中所述按预设规则,将所述训练信息日志转换为对应的训练识别信息的步骤为:
按所述预设规则,将所述终端信息日志进行统一的数字编码化处理,以转换为对应的事件识别信息。
15.根据权利要求13所述的事件识别模型生成服务器,其特征在于,所述机器训练模块包括:
神经元模块创建单元,用于创建机器训练神经元模块;
神经元序列形成单元,用于按时间顺序创建对多个机器训练神经元模块进行串联,以形成机器训练神经元序列;
累计误差值计算单元,用于根据每个所述机器训练神经元模块输出的隐含层概率值以及期望概率值,计算每个机器训练神经元模块的累积误差值;
误差参数计算单元,用于根据机器训练神经元模块的累积误差值,获得对应机器训练神经元模块的输入门权重系数误差、遗忘门权重系数误差、输出门权重系数误差、状态参数值误差以及机器训练神经元序列的累计误差值;以及
神经元序列更新单元,用于根据所述机器训练神经元模块的输入门权重系数误差,遗忘门权重系数误差,输出门权重系数误差以及状态参数值权重系数误差,对所述机器训练神经元序列进行更新:返回累计误差值计算单元,直至所述机器训练神经元序列的累积误差值小于第二设定值。
16.根据权利要求15所述的事件识别模型生成服务器,其特征在于,所述机器训练模块还包括:
初始化操作单元,用于对所述机器训练神经元模块的输入门权重系数、遗忘门权重系数、输出门权重系数、非隐含层概率值以及隐含层概率值进行初始化操作。
17.一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行如权利要求1-4中任一的事件识别方法或执行如权利要求5-8中任一的事件识别模型生成方法。
CN201711042315.2A 2017-10-30 2017-10-30 事件识别方法和终端、模型生成方法和服务器及存储介质 Active CN109728928B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711042315.2A CN109728928B (zh) 2017-10-30 2017-10-30 事件识别方法和终端、模型生成方法和服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711042315.2A CN109728928B (zh) 2017-10-30 2017-10-30 事件识别方法和终端、模型生成方法和服务器及存储介质

Publications (2)

Publication Number Publication Date
CN109728928A true CN109728928A (zh) 2019-05-07
CN109728928B CN109728928B (zh) 2021-05-07

Family

ID=66293024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711042315.2A Active CN109728928B (zh) 2017-10-30 2017-10-30 事件识别方法和终端、模型生成方法和服务器及存储介质

Country Status (1)

Country Link
CN (1) CN109728928B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111294332A (zh) * 2020-01-13 2020-06-16 交通银行股份有限公司 一种流量异常检测与dns信道异常检测系统及方法
CN113423079A (zh) * 2021-06-18 2021-09-21 中国农业银行股份有限公司 信息编码方法、装置、设备、存储介质及程序产品

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102269972A (zh) * 2011-03-29 2011-12-07 东北大学 基于遗传神经网络的管道压力缺失数据补偿方法及装置
CN102622418A (zh) * 2012-02-21 2012-08-01 北京联合大学 一种基于bp神经网络的预测装置及设备
CN104301896A (zh) * 2014-10-15 2015-01-21 上海欣方智能系统有限公司 诈骗短信智能监控告警系统和方法
CN105631049A (zh) * 2016-02-17 2016-06-01 北京奇虎科技有限公司 一种识别诈骗短信的方法和系统
US20170076196A1 (en) * 2015-06-05 2017-03-16 Google Inc. Compressed recurrent neural network models
CN106791220A (zh) * 2016-11-04 2017-05-31 国家计算机网络与信息安全管理中心 防止电话诈骗的方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102269972A (zh) * 2011-03-29 2011-12-07 东北大学 基于遗传神经网络的管道压力缺失数据补偿方法及装置
CN102622418A (zh) * 2012-02-21 2012-08-01 北京联合大学 一种基于bp神经网络的预测装置及设备
CN104301896A (zh) * 2014-10-15 2015-01-21 上海欣方智能系统有限公司 诈骗短信智能监控告警系统和方法
US20170076196A1 (en) * 2015-06-05 2017-03-16 Google Inc. Compressed recurrent neural network models
CN105631049A (zh) * 2016-02-17 2016-06-01 北京奇虎科技有限公司 一种识别诈骗短信的方法和系统
CN106791220A (zh) * 2016-11-04 2017-05-31 国家计算机网络与信息安全管理中心 防止电话诈骗的方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111294332A (zh) * 2020-01-13 2020-06-16 交通银行股份有限公司 一种流量异常检测与dns信道异常检测系统及方法
CN113423079A (zh) * 2021-06-18 2021-09-21 中国农业银行股份有限公司 信息编码方法、装置、设备、存储介质及程序产品

Also Published As

Publication number Publication date
CN109728928B (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN109558748B (zh) 数据处理方法、装置、电子设备及存储介质
CN104067289B (zh) 隐藏加速度计信号
CN106453245B (zh) 验证身份的方法及装置
CN108694238A (zh) 基于区块链的业务数据处理方法、装置及存储介质
CN106131057B (zh) 基于虚拟现实场景的认证和装置
CN106791233B (zh) 一种用于提供ivr服务流程的方法及ivr系统
CN107645562A (zh) 数据传输处理方法、装置、设备及系统
US9131374B1 (en) Knowledge-based authentication for restricting access to mobile devices
CN110780847B (zh) 随机数生成方法、随机数生成装置及电子设备
CN107077547A (zh) 使用针对高效连续认证的行为分析的方法和系统
CN105512545B (zh) 访问权限管理方法和装置
CN108364224A (zh) 信贷风险联控方法、装置、设备及可读存储介质
CN112468646A (zh) 紧急呼叫方法、装置、计算机设备和存储介质
JP2014067366A (ja) 情報処理装置、情報処理方法、及び、プログラム
CN112235303A (zh) 一种账号注销方法、装置和计算机设备
CN108984234A (zh) 一种移动终端与摄像装置的调用提示方法
CN111708927A (zh) 信息推荐方法、装置及电子设备
CN104346550A (zh) 一种信息处理方法以及一种电子设备
CN109728928A (zh) 事件识别方法和终端、模型生成方法和服务器及存储介质
CN107066536B (zh) 评论确定方法及装置
CN109600520A (zh) 骚扰电话号码识别方法、装置及设备
CN108255967A (zh) 存储过程的调用方法、装置、存储介质及终端
US20240073204A1 (en) Computer-based systems involving enhanced one-time passcode (otp) messaging and methods of use thereof
CN109522457A (zh) 数据获取方法及装置
CN108777749A (zh) 一种诈骗电话识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant