CN112801237B - 暴恐内容识别模型的训练方法、训练装置及可读存储介质 - Google Patents

暴恐内容识别模型的训练方法、训练装置及可读存储介质 Download PDF

Info

Publication number
CN112801237B
CN112801237B CN202110403864.8A CN202110403864A CN112801237B CN 112801237 B CN112801237 B CN 112801237B CN 202110403864 A CN202110403864 A CN 202110403864A CN 112801237 B CN112801237 B CN 112801237B
Authority
CN
China
Prior art keywords
riot
terrorist
category
training
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110403864.8A
Other languages
English (en)
Other versions
CN112801237A (zh
Inventor
白世杰
吴富章
赵宇航
王秋明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yuanjian Information Technology Co Ltd
Original Assignee
Beijing Yuanjian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yuanjian Information Technology Co Ltd filed Critical Beijing Yuanjian Information Technology Co Ltd
Priority to CN202110403864.8A priority Critical patent/CN112801237B/zh
Publication of CN112801237A publication Critical patent/CN112801237A/zh
Application granted granted Critical
Publication of CN112801237B publication Critical patent/CN112801237B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请提供了一种暴恐内容识别模型的训练方法、训练装置及可读存储介质,针对于每种暴恐类别,基于该暴恐类别在多张样本暴恐图像中的出现次数以及多张样本暴恐图像中全部暴恐类别的总出现次数,确定该暴恐类别的初始频率权重;基于多张训练该暴恐类别对应的类别识别网络的训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练类别识别网络,得到训练好的暴恐识别子模型,以及暴恐识别子模型的目标频率权重;基于每种暴恐类别的暴恐识别子模型以及每个暴恐识别子模型的目标频率权重,构建得到暴恐识别模型。这样,便能够通过多个暴恐识别子模型有针对性的对每种暴恐类别进行识别,有助于提高暴恐内容的识别准确率。

Description

暴恐内容识别模型的训练方法、训练装置及可读存储介质
技术领域
本申请涉及图像识别技术领域,尤其是涉及一种暴恐内容识别模型的训练方法、训练装置及可读存储介质。
背景技术
近年来,随着网络的不断发展,越来越多存在有暴恐内容的图像暴露于网络之中,无形之间已经对社会的稳定造成了一定影响,各网络平台以及监管部门通常需要安排专门的负责人员,对网络中存在的暴恐图像进行人为的删除或者处理,但是,随着图像数量的不断增加,人为操作已经很难将所有的暴恐图像快速的从互联网中去除,因此,如何有效识别并进行溯源监管互联网中的暴恐图像一直是亟待解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种暴恐内容识别模型的训练方法、训练装置及可读存储介质,通过多个暴恐识别子模型有针对性的对每种暴恐类别进行识别,有助于提高暴恐内容的识别准确率,进而,可以有效抑制含有暴恐内容的图像在网络中传播,具有一定的维护社会稳定的价值。
本申请实施例提供了一种暴恐内容识别模型的训练方法,所述训练方法包括:
确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数;
针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重;
从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像,确定每张训练暴恐图像的类别标签;
基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重;
基于每种暴恐类别对应的暴恐识别子模型以及每种暴恐识别子模型对应的目标频率权重,构建得到暴恐识别模型。
进一步的,所述确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数,包括:
获取多张样本暴恐图像;
确定每张样本暴恐图像中出现的每个暴恐内容所属的暴恐类别;
统计所述多张样本暴恐图像中每种暴恐类别的出现次数以及所述多张样本暴恐图像中全部暴恐类别的总出现次数。
进一步的,针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重,包括:
针对于每种暴恐类别,将所述多张样本暴恐图像中该暴恐类别的出现次数与所述总出现次数之间的商,确定为该暴恐类别的初始频率权重。
进一步的,所述从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像,包括:
将所述多张样本暴恐图像中出现了属于该暴恐类别的暴恐内容的样本暴恐图像以及未出现任何暴恐内容的样本暴恐图像,确定为用于训练该暴恐类别对应的类别识别网络的训练暴恐图像。
进一步的,所述基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重,包括:
将确定出的多张训练暴恐图像以及该暴恐类别的初始频率权重作为输入特征,将每张训练暴恐图像的类别标签作为输出特征,训练该暴恐类别对应的类别识别网络;
在训练该暴恐类别对应的类别识别网络的过程中,调节该暴恐类别的初始频率权重,得到训练好的暴恐识别子模型以及所述暴恐识别子模型的目标频率权重。
进一步的,所述暴恐类别包括:暴恐旗帜、暴恐标识、暴恐现象、治安人员、聚集方式、暴恐武器以及暴恐文字中的一种或多种。
进一步的,在所述基于每种暴恐类别对应的暴恐识别子模型以及每种暴恐识别子模型对应的目标频率权重,构建得到暴恐识别模型之后,所述训练方法还包括:
获取待识别图像;
将所述待识别图像输入至所述暴恐识别模型中,通过所述暴恐识别模型中的各个暴恐识别子模型,确定所述待识别图像为暴恐图像的概率。
本申请实施例还提供了一种暴恐内容识别模型的训练装置,所述训练装置包括:
次数统计模块,用于确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数;
权重确定模块,用于针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重;
图像确定模块,用于从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像,确定每张训练暴恐图像的类别标签;
模型训练模块,用于基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重;
模型构建模块,用于基于每种暴恐类别对应的暴恐识别子模型以及每种暴恐识别子模型对应的目标频率权重,构建得到暴恐识别模型。
进一步的,所述次数统计模块在用于确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数时,所述次数统计模块用于:
获取多张样本暴恐图像;
确定每张样本暴恐图像中出现的每个暴恐内容所属的暴恐类别;
统计所述多张样本暴恐图像中每种暴恐类别的出现次数以及所述多张样本暴恐图像中全部暴恐类别的总出现次数。
进一步的,所述权重确定模块在用于针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重时,所述权重确定模块用于:
针对于每种暴恐类别,将所述多张样本暴恐图像中该暴恐类别的出现次数与所述总出现次数之间的商,确定为该暴恐类别的初始频率权重。
进一步的,所述图像确定模块在用于从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像时,所述图像确定模块用于:
将所述多张样本暴恐图像中出现了属于该暴恐类别的暴恐内容的样本暴恐图像以及未出现任何暴恐内容的样本暴恐图像,确定为用于训练该暴恐类别对应的类别识别网络的训练暴恐图像。
进一步的,所述模型训练模块在用于基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重时,所述模型训练模块用于:
将确定出的多张训练暴恐图像以及该暴恐类别的初始频率权重作为输入特征,将每张训练暴恐图像的类别标签作为输出特征,训练该暴恐类别对应的类别识别网络;
在训练该暴恐类别对应的类别识别网络的过程中,调节该暴恐类别的初始频率权重,得到训练好的暴恐识别子模型以及所述暴恐识别子模型的目标频率权重。
进一步的,所述暴恐类别包括:暴恐旗帜、暴恐标识、暴恐现象、治安人员、聚集方式、暴恐武器以及暴恐文字中的一种或多种。
进一步的,所述训练装置还包括图像识别模块,所述图像识别模块用于:
获取待识别图像;
将所述待识别图像输入至所述暴恐识别模型中,通过所述暴恐识别模型中的各个暴恐识别子模型,确定所述待识别图像为暴恐图像的概率。
本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的暴恐内容识别模型的训练方法的步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的暴恐内容识别模型的训练方法的步骤。
本申请实施例提供的暴恐内容识别模型的训练方法、训练装置及可读存储介质,确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数;针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重;从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像,确定每张训练暴恐图像的类别标签;基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重;基于每种暴恐类别对应的暴恐识别子模型以及每种暴恐识别子模型对应的目标频率权重,构建得到暴恐识别模型。这样,便能够通过多个暴恐识别子模型有针对性的对每种暴恐类别进行识别,有助于提高暴恐内容的识别准确率,进而,可以有效抑制含有暴恐内容的图像在网络中传播,具有一定的维护社会稳定的价值。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种暴恐内容识别模型的训练方法的流程图;
图2为暴恐类别次数统计流程示意图;
图3为本申请实施例所提供的一种暴恐内容识别模型的训练装置的结构示意图之一;
图4为本申请实施例所提供的一种暴恐内容识别模型的训练装置的结构示意图之二;
图5为本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
经研究发现,近年来,随着网络的不断发展,越来越多存在有暴恐内容的图像暴露于网络之中,无形之间已经对社会的稳定造成了一定影响,各网络平台以及监管部门通常需要安排专门的负责人员,对网络中存在的暴恐图像进行人为的删除或者处理,但是,随着图像数量的不断增加,人为操作已经很难将所有的暴恐图像快速的从互联网中去除,因此,如何有效识别并进行溯源监管互联网中的暴恐图像一直是亟待解决的问题。
基于此,本申请实施例提供了一种暴恐内容识别模型的训练方法,可以有效抑制含有暴恐内容的图像在网络中传播,具有一定的维护社会稳定的价值。
请参阅图1,图1为本申请实施例所提供的一种暴恐内容识别模型的训练方法的流程图。如图1中所示,本申请实施例提供的暴恐内容识别模型的训练方法,包括:
S101、确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数。
该步骤中,获取多张样本暴恐图像,并确定出每张样本暴恐图像中所存在的暴恐内容的暴恐类别,统计在多张样本暴恐图像中每种暴恐类别的出现次数;以及全部的暴恐类别在多张样本暴恐图像中所出现的总出现次数。
这里,暴恐类别包括暴恐旗帜、暴恐标识、暴恐现象、治安人员、聚集方式、暴恐武器以及暴恐文字中的一种或多种。
其中,暴恐旗帜是指包含有暴恐文字和/或暴恐标识的旗帜,或者是在暴恐活动中出现过的旗帜。暴恐标识是指暴恐集体和/或暴恐组织的特有标识,暴恐组织中的组员所佩戴或者携带的标识,例如,牌匾、横幅或纸张等标识性物品。暴恐现象是指打、砸、抢、烧等暴力现象。治安人员是指维护治安的警察、志愿者等相关人员。聚集方式是指人群聚集、车辆聚集等聚集情况。暴恐武器是指枪支、弹炮、棍棒等具有伤害性的武器。暴恐文字是指包含有暴恐内容的文字、词语、长短句、宣传口号等文字信息。
示例性的,有3张样本暴恐图片,其中第一张样本暴恐图片含有的暴恐类别为暴恐旗帜、暴恐标识、暴恐现象,则在第一张样本暴恐图像中暴恐类别的出现次数为n1=3;第二张样本暴恐图片含有的暴恐类别为暴恐现象以及暴恐武器,则在第二张样本暴恐图像中暴恐类别的出现次数为n2=2;第三张样本暴恐图片含有的暴恐类别为暴恐标识、暴恐现象、治安人员、聚集方式、暴恐武器以及暴恐文字,则在第三张样本暴恐图像中暴恐类别的出现次数为n3=6;则总出现次数为N=n1+n2+n3=3+2+6=11;在三张样本暴恐图像中“暴恐标识”这一暴恐类别的出现次数便为2。
进一步的,如图2所示,图2为暴恐类别次数统计流程示意图,步骤S101包括:S1011、获取多张样本暴恐图像;S1012、确定每张样本暴恐图像中出现的每个暴恐内容所属的暴恐类别;S1013、统计所述多张样本暴恐图像中每种暴恐类别的出现次数以及所述多张样本暴恐图像中全部暴恐类别的总出现次数。
在步骤S1011至步骤S1013中,获取多张样本暴恐图像,确定每张样本暴恐图像中出现的暴恐内容,同时,确定该样本暴恐图像中所出现的每个暴恐内容所属的暴恐类别;针对于每种暴恐类别,统计该暴恐类别在多张样本暴恐图像中出现次数;进而,统计得到在多张样本暴恐图像中全部暴恐类别出现的总出现次数。
具体的,通过以下公式计算多张样本暴恐图像中全部暴恐类别出现的总出现次数:
Figure DEST_PATH_IMAGE001
其中,N为多张样本暴恐图像中全部暴恐类别出现的总出现次数,p为多张样本暴恐图像的数量,nj为第j个暴恐类别在多张样本暴恐图像中的出现次数。
S102、针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重。
该步骤中,针对于样本暴恐图像中有可能存在的每种暴恐类别,基于该暴恐类别在多张样本暴恐图像中的出现次数,以及全部暴恐类别在多张样本暴恐图像中的总出现次数,计算得到该暴恐类别的初始频率权重。
进一步的,步骤S102包括:针对于每种暴恐类别,将所述多张样本暴恐图像中该暴恐类别的出现次数与所述总出现次数之间的商,确定为该暴恐类别的初始频率权重。
该步骤中,针对于每种暴恐类别,计算多张样本暴恐图像中该暴恐类别的出现次数与多张样本暴恐图像中全部暴恐类别出现的总出现次数之间的商,并将上述两者之间的商确定为该暴恐类别的初始频率权重。
具体的,通过以下公式计算每种暴恐类别的初始频率权重:
Figure 187268DEST_PATH_IMAGE002
其中,Wi为第i个暴恐类别的初始频率权重,ti为第i个暴恐类别在多张样本暴恐图像中的出现次数,N为多张样本暴恐图像中全部暴恐类别出现的总出现次数。
S103、从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像,确定每张训练暴恐图像的类别标签。
该步骤中,对多张样本暴恐图像进行聚类处理,从多张样本暴恐图像中确定出用于训练每个暴恐类别对应的类别识别网络的训练暴恐图像,具体的,针对于每个暴恐类别,从多张暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像,同时,确定每张训练暴恐图像的类别标签。
进一步的,步骤S103包括:将所述多张样本暴恐图像中出现了属于该暴恐类别的暴恐内容的样本暴恐图像以及未出现任何暴恐内容的样本暴恐图像,确定为用于训练该暴恐类别对应的类别识别网络的训练暴恐图像。
该步骤中,针对于每种暴恐类别,将多张样本暴恐图像中出现了属于该暴恐类别的暴恐内容的样本暴恐图像,以及多张样本暴恐图像中未出现任何暴恐内容的样本暴恐图像,确定为用于训练该暴恐类别对应的类别识别网络的训练暴恐图像。
S104、基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重。
该步骤中,基于确定出的用于训练该暴恐类别对应的类别识别网络的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练得到该暴恐类别对应的类别识别网络,得到训练好的用于识别该暴恐类别的暴恐识别子模型,以及该暴恐识别子模型对应的目标频率权重。
进一步的,步骤S104包括:将确定出的多张训练暴恐图像以及该暴恐类别的初始频率权重作为输入特征,将每张训练暴恐图像的类别标签作为输出特征,训练该暴恐类别对应的类别识别网络;在训练该暴恐类别对应的类别识别网络的过程中,调节该暴恐类别的初始频率权重,得到训练好的暴恐识别子模型以及所述暴恐识别子模型的目标频率权重。
该步骤中,将确定出的用于训练该暴恐类别对应的类别识别网络的多张训练暴恐图像以及该暴恐类别的初始频率权重作为输入特征,将用于训练该暴恐类别对应的类别识别网络的每张训练暴恐图像的类别标签作为输出特征,训练该暴恐类别对应的类别识别网络。
在训练该暴恐类别对应的类别识别网络的过程中,调节该暴恐类别的初始频率权重,得到训练好的可以用于识别该包括类别的暴恐识别子模型以及该暴恐识别子模型的目标频率权重。
这里,类别标签表示训练暴恐图像中是否存在该暴恐类别的暴恐内容,若训练暴恐图像中存在该暴恐类别的暴恐内容,则该训练暴恐图像的类别标签为1;否则,该训练暴恐图像的类别标签为0。
其中,类别识别网络可以为任意的神经网络,也可以是以resnet-18模型为基础的网络。
S105、基于每种暴恐类别对应的暴恐识别子模型以及每种暴恐识别子模型对应的目标频率权重,构建得到暴恐识别模型。
该步骤中,基于训练得到的每种暴恐类别对应的暴恐识别子模型,以及每个暴恐识别子模型对应的目标频率权重,构建得到用于识别各种暴恐类别的暴恐识别模型。
具体的,通过以下公式构建暴恐识别模型:
Figure 1640DEST_PATH_IMAGE003
其中,y为待识别图像为暴恐图像的概率,L i 为第i个暴恐类别的目标频率权重,M i 为第i个暴恐识别子模型的识别结果,n为构建暴恐识别模型时所使用到的暴恐识别子模型的数量。
这里,
Figure 824102DEST_PATH_IMAGE004
进一步的,在所述基于每种暴恐类别对应的暴恐识别子模型以及每种暴恐识别子模型对应的目标频率权重,构建得到暴恐识别模型之后,所述训练方法还包括:获取待识别图像;将所述待识别图像输入至所述暴恐识别模型中,通过所述暴恐识别模型中的各个暴恐识别子模型,确定所述待识别图像为暴恐图像的概率。
该步骤中,获取待识别图像,将待识别图像输入至训练好的包括识别模型中,通过暴恐识别模型中的每个暴恐识别子模型,确定该待识别图像中存在的暴恐内容的暴恐类别,基于各个暴恐识别子模型的目标频率权重,确定该待识别图像为暴恐图像的概率。
具体的,针对于每个暴恐识别子模型,若待识别图像中存在该暴恐识别子模型对应的暴恐类别的暴恐内容,则该暴恐识别子模型的输出值为“1”,反之,则为“0”;基于各个暴恐识别子模型的输出值,以及每个暴恐识别子模型的目标频率权重,确定该待识别图像为暴恐图像的概率。
本申请实施例提供的暴恐内容识别模型的训练方法,确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数;针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重;从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像,确定每张训练暴恐图像的类别标签;基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重;基于每种暴恐类别对应的暴恐识别子模型以及每种暴恐识别子模型对应的目标频率权重,构建得到暴恐识别模型。这样,便能够通过多个暴恐识别子模型有针对性的对每种暴恐类别进行识别,有助于提高暴恐内容的识别准确率,进而,可以有效抑制含有暴恐内容的图像在网络中传播,具有一定的维护社会稳定的价值。
请参阅图3、图4,图3为本申请实施例所提供的一种暴恐内容识别模型的训练装置的结构示意图之一,图4为本申请实施例所提供的一种暴恐内容识别模型的训练装置的结构示意图之二。如图3中所示,所述训练装置300包括:
次数统计模块310,用于确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数;
权重确定模块320,用于针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重;
图像确定模块330,用于从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像,确定每张训练暴恐图像的类别标签;
模型训练模块340,用于基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重;
模型构建模块350,用于基于每种暴恐类别对应的暴恐识别子模型以及每种暴恐识别子模型对应的目标频率权重,构建得到暴恐识别模型。
进一步的,如图4所示,所述训练装置300还包括图像识别模块360,所述图像识别模块360用于:
获取待识别图像;
将所述待识别图像输入至所述暴恐识别模型中,通过所述暴恐识别模型中的各个暴恐识别子模型,确定所述待识别图像为暴恐图像的概率。
进一步的,所述次数统计模块310在用于确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数时,所述次数统计模块310用于:
获取多张样本暴恐图像;
确定每张样本暴恐图像中出现的每个暴恐内容所属的暴恐类别;
统计所述多张样本暴恐图像中每种暴恐类别的出现次数以及所述多张样本暴恐图像中全部暴恐类别的总出现次数。
进一步的,所述权重确定模块320在用于针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重时,所述权重确定模块320用于:
针对于每种暴恐类别,将所述多张样本暴恐图像中该暴恐类别的出现次数与所述总出现次数之间的商,确定为该暴恐类别的初始频率权重。
进一步的,所述图像确定模块330在用于从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像时,所述图像确定模块330用于:
将所述多张样本暴恐图像中出现了属于该暴恐类别的暴恐内容的样本暴恐图像以及未出现任何暴恐内容的样本暴恐图像,确定为用于训练该暴恐类别对应的类别识别网络的训练暴恐图像。
进一步的,所述模型训练模块340在用于基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重时,所述模型训练模块340用于:
将确定出的多张训练暴恐图像以及该暴恐类别的初始频率权重作为输入特征,将每张训练暴恐图像的类别标签作为输出特征,训练该暴恐类别对应的类别识别网络;
在训练该暴恐类别对应的类别识别网络的过程中,调节该暴恐类别的初始频率权重,得到训练好的暴恐识别子模型以及所述暴恐识别子模型的目标频率权重。
进一步的,所述暴恐类别包括:暴恐旗帜、暴恐标识、暴恐现象、治安人员、聚集方式、暴恐武器以及暴恐文字中的一种或多种。
本申请实施例提供的暴恐内容识别模型的训练装置,确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数;针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重;从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像,确定每张训练暴恐图像的类别标签;基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重;基于每种暴恐类别对应的暴恐识别子模型以及每种暴恐识别子模型对应的目标频率权重,构建得到暴恐识别模型。这样,便能够通过多个暴恐识别子模型有针对性的对每种暴恐类别进行识别,有助于提高暴恐内容的识别准确率,进而,可以有效抑制含有暴恐内容的图像在网络中传播,具有一定的维护社会稳定的价值。
请参阅图5,图5为本申请实施例所提供的一种电子设备的结构示意图。如图5中所示,所述电子设备500包括处理器510、存储器520和总线530。
所述存储器520存储有所述处理器510可执行的机器可读指令,当电子设备500运行时,所述处理器510与所述存储器520之间通过总线530通信,所述机器可读指令被所述处理器510执行时,可以执行如上述图1以及图2所示方法实施例中的暴恐内容识别模型的训练方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的暴恐内容识别模型的训练方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种暴恐内容识别模型的训练方法,其特征在于,所述训练方法包括:
确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数;
针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重;
从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像,确定每张训练暴恐图像的类别标签;
基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重;
基于每种暴恐类别对应的暴恐识别子模型以及每种暴恐识别子模型对应的目标频率权重,构建得到暴恐识别模型;
其中,所述针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重,包括:
针对于每种暴恐类别,将所述多张样本暴恐图像中该暴恐类别的出现次数与所述总出现次数之间的商,确定为该暴恐类别的初始频率权重;
通过以下公式构建暴恐识别模型:
Figure 230067DEST_PATH_IMAGE001
其中,y为待识别图像为暴恐图像的概率,L i 为第i个暴恐类别的目标频率权重,M i 为第i个暴恐识别子模型的识别结果,n为构建暴恐识别模型时所使用到的暴恐识别子模型的数量;针对于每个暴恐识别子模型,若待识别图像中存在该暴恐识别子模型对应的暴恐类别的暴恐内容,则该暴恐识别子模型的输出值为“1”,反之,则为“0”。
2.根据权利要求1所述的训练方法,其特征在于,所述确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数,包括:
获取多张样本暴恐图像;
确定每张样本暴恐图像中出现的每个暴恐内容所属的暴恐类别;
统计所述多张样本暴恐图像中每种暴恐类别的出现次数以及所述多张样本暴恐图像中全部暴恐类别的总出现次数。
3.根据权利要求1所述的训练方法,其特征在于,所述从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像,包括:
将所述多张样本暴恐图像中出现了属于该暴恐类别的暴恐内容的样本暴恐图像以及未出现任何暴恐内容的样本暴恐图像,确定为用于训练该暴恐类别对应的类别识别网络的训练暴恐图像。
4.根据权利要求1所述的训练方法,其特征在于,所述基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重,包括:
将确定出的多张训练暴恐图像以及该暴恐类别的初始频率权重作为输入特征,将每张训练暴恐图像的类别标签作为输出特征,训练该暴恐类别对应的类别识别网络;
在训练该暴恐类别对应的类别识别网络的过程中,调节该暴恐类别的初始频率权重,得到训练好的暴恐识别子模型以及所述暴恐识别子模型的目标频率权重。
5.根据权利要求1所述的训练方法,其特征在于,所述暴恐类别包括:暴恐旗帜、暴恐标识、暴恐现象、治安人员、聚集方式、暴恐武器以及暴恐文字中的一种或多种。
6.根据权利要求1所述的训练方法,其特征在于,在所述基于每种暴恐类别对应的暴恐识别子模型以及每种暴恐识别子模型对应的目标频率权重,构建得到暴恐识别模型之后,所述训练方法还包括:
获取待识别图像;
将所述待识别图像输入至所述暴恐识别模型中,通过所述暴恐识别模型中的各个暴恐识别子模型,确定所述待识别图像为暴恐图像的概率。
7.一种暴恐内容识别模型的训练装置,其特征在于,所述训练装置包括:
次数统计模块,用于确定在获取到的多张样本暴恐图像中每种暴恐类别的出现次数,以及所述多张样本暴恐图像中全部暴恐类别的总出现次数;
权重确定模块,用于针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重;
图像确定模块,用于从所述多张样本暴恐图像中确定出用于训练该暴恐类别对应的类别识别网络的训练暴恐图像,确定每张训练暴恐图像的类别标签;
模型训练模块,用于基于确定出的多张训练暴恐图像、该暴恐类别的初始频率权重以及每张训练暴恐图像的类别标签,训练该暴恐类别对应的类别识别网络,得到训练好的暴恐识别子模型,以及所述暴恐识别子模型的目标频率权重;
模型构建模块,用于基于每种暴恐类别对应的暴恐识别子模型以及每种暴恐识别子模型对应的目标频率权重,构建得到暴恐识别模型;
其中,所述权重确定模块在用于针对于每种暴恐类别,基于该暴恐类别的出现次数以及所述总出现次数,确定该暴恐类别的初始频率权重时,所述权重确定模块用于:
针对于每种暴恐类别,将所述多张样本暴恐图像中该暴恐类别的出现次数与所述总出现次数之间的商,确定为该暴恐类别的初始频率权重;
所述模型构建模块用于通过以下公式构建暴恐识别模型:
Figure 491284DEST_PATH_IMAGE002
其中,y为待识别图像为暴恐图像的概率,L i 为第i个暴恐类别的目标频率权重,M i 为第i个暴恐识别子模型的识别结果,n为构建暴恐识别模型时所使用到的暴恐识别子模型的数量;针对于每个暴恐识别子模型,若待识别图像中存在该暴恐识别子模型对应的暴恐类别的暴恐内容,则该暴恐识别子模型的输出值为“1”,反之,则为“0”。
8.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行如权利要求1至6任一所述的暴恐内容识别模型的训练方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至6任一所述的暴恐内容识别模型的训练方法的步骤。
CN202110403864.8A 2021-04-15 2021-04-15 暴恐内容识别模型的训练方法、训练装置及可读存储介质 Active CN112801237B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110403864.8A CN112801237B (zh) 2021-04-15 2021-04-15 暴恐内容识别模型的训练方法、训练装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110403864.8A CN112801237B (zh) 2021-04-15 2021-04-15 暴恐内容识别模型的训练方法、训练装置及可读存储介质

Publications (2)

Publication Number Publication Date
CN112801237A CN112801237A (zh) 2021-05-14
CN112801237B true CN112801237B (zh) 2021-07-23

Family

ID=75811416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110403864.8A Active CN112801237B (zh) 2021-04-15 2021-04-15 暴恐内容识别模型的训练方法、训练装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN112801237B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002330830A1 (en) * 2002-08-22 2004-03-11 Agency For Science, Technology And Reseach Prediction by collective likelihood from emerging patterns
US8706656B1 (en) * 2011-08-26 2014-04-22 Google Inc. Multi-label modeling using a plurality of classifiers
CN104700843A (zh) * 2015-02-05 2015-06-10 海信集团有限公司 一种年龄识别的方法及装置
CN107194433A (zh) * 2017-06-14 2017-09-22 电子科技大学 一种基于深度自编码网络的雷达一维距离像目标识别方法
CN108090503A (zh) * 2017-11-28 2018-05-29 东软集团股份有限公司 多分类器的在线调整方法、装置、存储介质及电子设备
CN109902722A (zh) * 2019-01-28 2019-06-18 北京奇艺世纪科技有限公司 分类器、神经网络模型训练方法、数据处理设备及介质
WO2019225251A1 (ja) * 2018-05-21 2019-11-28 日本電信電話株式会社 学習方法、学習装置及び学習プログラム
CN111291841A (zh) * 2020-05-13 2020-06-16 腾讯科技(深圳)有限公司 图像识别模型训练方法、装置、计算机设备和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107533671B (zh) * 2015-05-11 2021-02-23 株式会社东芝 模式识别装置、模式识别方法以及记录介质
CN108875764A (zh) * 2017-07-12 2018-11-23 北京旷视科技有限公司 模型训练方法、装置、系统和计算机可读介质
CN109325538B (zh) * 2018-09-29 2020-12-22 北京京东尚科信息技术有限公司 目标检测方法、装置和计算机可读存储介质
CN111832588A (zh) * 2019-04-18 2020-10-27 四川大学 一种基于集成分类的暴恐图像标注方法
CN110852360A (zh) * 2019-10-30 2020-02-28 腾讯科技(深圳)有限公司 图像情感识别方法、装置、设备及存储介质
CN112052911A (zh) * 2020-09-23 2020-12-08 恒安嘉新(北京)科技股份公司 识别图像中暴恐内容的方法、装置、电子设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002330830A1 (en) * 2002-08-22 2004-03-11 Agency For Science, Technology And Reseach Prediction by collective likelihood from emerging patterns
US8706656B1 (en) * 2011-08-26 2014-04-22 Google Inc. Multi-label modeling using a plurality of classifiers
CN104700843A (zh) * 2015-02-05 2015-06-10 海信集团有限公司 一种年龄识别的方法及装置
CN107194433A (zh) * 2017-06-14 2017-09-22 电子科技大学 一种基于深度自编码网络的雷达一维距离像目标识别方法
CN108090503A (zh) * 2017-11-28 2018-05-29 东软集团股份有限公司 多分类器的在线调整方法、装置、存储介质及电子设备
WO2019225251A1 (ja) * 2018-05-21 2019-11-28 日本電信電話株式会社 学習方法、学習装置及び学習プログラム
CN109902722A (zh) * 2019-01-28 2019-06-18 北京奇艺世纪科技有限公司 分类器、神经网络模型训练方法、数据处理设备及介质
CN111291841A (zh) * 2020-05-13 2020-06-16 腾讯科技(深圳)有限公司 图像识别模型训练方法、装置、计算机设备和存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
"A novel multi-stream method for violent interaction detection using deep learning";Hongchang Li等;《Measurement and Control》;20200501;第53卷(第5-6期);全文 *
"Fusion strategies for recognition of violence actions";W. Lejmi等;《2017 IEEE/ACS 14th International Conference on Computer Systems and Applications (AICCSA)》;20180312;全文 *
"The Use of Ensemble Models for Multiple Class and Binary Class Classification for Improving Intrusion Detection Systems";Iwendi C等;《sensors》;20200430;第20卷(第9期);全文 *
"基于类别信息的分类器集成方法Cagging";刘风等;《计算机应用》;20081215;第28卷(第S2期);全文 *
"基于集成分类的暴恐图像自动标注方法";严靓等;《太赫兹科学与电子信息学报》;20200425;第18卷(第2期);全文 *

Also Published As

Publication number Publication date
CN112801237A (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
CN107742100B (zh) 一种考生身份验证方法及终端设备
Goebel Social unrest in China: a bird’s-eye view
CN112446025A (zh) 联邦学习防御方法、装置、电子设备及存储介质
Carr et al. Love thy neighbour? brexit and hate crime
CN112107866A (zh) 用户行为数据处理方法、装置、设备及存储介质
CN110493179A (zh) 基于时间序列的网络安全态势感知模型和方法
CN111353014A (zh) 职位关键词提取、岗位需求更新的方法和装置
CN109840676B (zh) 基于大数据的风控方法、装置、计算机设备及存储介质
Devlin et al. The numbers behind NUMB3RS: Solving crime with mathematics
CN112669187A (zh) 身份识别方法、装置、电子设备及相关产品
CN112801237B (zh) 暴恐内容识别模型的训练方法、训练装置及可读存储介质
CN107885754B (zh) 基于lda模型从交易数据中提取信用变量的方法和装置
CN111177771B (zh) 一种人员简历的生成方法及装置
Kritzer A theory of unconventional political action: the dynamics of confrontation
Amiri et al. The representation of Islamophobia: A critical discourse analysis of Yahoo news
Yuille Meaningful research in the police context
Bryce et al. 12 Digital games and the violence debate
CN112101192B (zh) 基于人工智能的伪装检测方法、装置、设备及介质
CN113274737B (zh) 一种信息推荐的方法、装置、计算机设备和介质
CN114359783A (zh) 一种异常事件检测方法、装置及设备
CN112396452A (zh) 举报奖励系统及方法
CN113704622A (zh) 一种书籍推荐方法、装置、计算机设备及存储介质
CN113673870A (zh) 一种企业数据分析方法及相关组件
CN111291150A (zh) 一种待搜索信息的确定方法、确定装置及可读存储介质
CN113011576A (zh) 识别案件类型的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant