CN114154001A

CN114154001A - 虚假媒体内容挖掘与识别的方法和系统

Info

Publication number: CN114154001A
Application number: CN202111431383.4A
Authority: CN
Inventors: 苏长君; 曾祥禄
Original assignee: Beijing Zhimei Internet Technology Co ltd
Current assignee: Beijing Zhimei Internet Technology Co ltd
Priority date: 2021-11-29
Filing date: 2021-11-29
Publication date: 2022-03-08

Abstract

本发明提供一种虚假媒体内容挖掘与识别的方法和系统，通过将获取的网络多媒体数据流进行维度转换，使得原本不可分的数据在高维空间中变得可分，再经过两重视频采样，得到携带有边界和区域局部特征的高维信号集合，从而可以分离其中维度发生跳跃的特征，查询出对应的多媒体数据，检测该多媒体数据是否合规，实现识别虚假信息的目的。

Description

虚假媒体内容挖掘与识别的方法和系统

技术领域

本申请涉及网络多媒体领域，尤其涉及一种虚假媒体内容挖掘与识别的方法和系统。

背景技术

随着网络的快速发展，信息的高速流动带来了生后的便捷，却也带来了越来越多的虚假内容，不法分子炮制虚假信息的门槛非常低，越来越成为社会问题。

因此，急需一种针对性的虚假媒体内容挖掘与识别的方法和系统。

发明内容

本发明的目的在于提供一种虚假媒体内容挖掘与识别的方法和系统，通过将获取的网络多媒体数据流进行维度转换，使得原本不可分的数据在高维空间中变得可分，再经过两重视频采样，得到携带有边界和区域局部特征的高维信号集合，从而可以分离其中维度发生跳跃的特征，查询出对应的多媒体数据，检测该多媒体数据是否合规，实现识别虚假信息的目的。

第一方面，本申请提供一种虚假媒体内容挖掘与识别的方法，所述方法包括：

服务器获取网络多媒体数据流，将所述网络多媒体数据流进行采样，向量化采样结果，并进行维度转换，将接收的P*Q维度的多媒体信号转换为M*N维度的多媒体信号，其中P*Q是信号传输通道的维度，M*N是服务器负载处理的维度，P、Q、M、N均为非零正整数；

将所述维度转换后的多媒体信号根据用户标识重组为第一数据流，输入到两个单向的变体模型GRU，提取第一特征，将所述第一特征进行编码后，输入到N层卷积单元，根据所述N层卷积单元的输出结果，得到第一中间结果；

所述第一中间结果的每一个点生成一个锚点，锚点的值是由每个点的特征与四周相邻点的特征加权平均计算得到的；若干个锚点组成一个滑动窗，组成该滑动窗所需的锚点数目由最中间锚点所属的点的特征大小决定；

使用所述滑动窗再次采样所述第一数据流，提到第二特征，将所述第二特征再次进行编码后，输入到N层卷积单元，根据所述N层卷积单元的输出结果，得到第二中间结果；

对所述第二中间结果进行平滑处理，得到携带有边界和区域局部特征的高维信号集合，分析该高维信号集合，分离其中维度发生跳跃的特征，查询所述维度发生跳跃的特征对应的多媒体数据，检测出该多媒体数据是否合规，如果不合规则认定该网络多媒体数据流包含虚假信息，生成报警。

结合第一方面，在第一方面第一种可能的实现方式中，所述N层卷积单元是由N个依次连接的卷积运算模块组成，N的值反映服务器负载处理的能力。

结合第一方面，在第一方面第二种可能的实现方式中，所述用户标识是网络多媒体数据流携带的。

结合第一方面，在第一方面第三种可能的实现方式中，所述分离其中维度发生跳跃的特征的过程中采用了神经网络模型。

第二方面，本申请提供一种虚假媒体内容挖掘与识别的系统，所述系统包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行第一方面四种可能中任一项所述的方法。

第三方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面四种可能中任一项所述的方法。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明方法的流程图。

具体实施方式

下面结合附图对本发明的优选实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域技术人员理解，从而对本发明的保护范围做出更为清楚明确的界定。

图1为本申请提供的虚假媒体内容挖掘与识别的方法的流程图，包括：

在一些优选实施例中，所述N层卷积单元是由N个依次连接的卷积运算模块组成，N的值反映服务器负载处理的能力。

在一些优选实施例中，所述用户标识是网络多媒体数据流携带的。

在一些优选实施例中，所述分离其中维度发生跳跃的特征的过程中采用了神经网络模型。

本申请提供一种虚假媒体内容挖掘与识别的系统，所述系统包括：所述系统包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行第一方面所有实施例中任一项所述的方法。

本申请提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面所有实施例中任一项所述的方法。

具体实现中，本发明还提供一种计算机存储介质，其中，该计算机存储介质可以存储有程序，该程序执行时可包括本发明各个实施例中的部分或全部步骤。所述的存储介质可以为磁碟、光盘、只读存储记忆体(简称：ROM)或随机存储记忆体(简称：RAM)等。

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明实施例中的技术方案本质上或者对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书各个实施例之间相同相似的部分互相参见即可。尤其，对于实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例中的说明即可。

以上所述的本发明实施方式并不构成对本发明保护范围的限定。

Claims

1.一种虚假媒体内容挖掘与识别的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于：所述N层卷积单元是由N个依次连接的卷积运算模块组成，N的值反映服务器负载处理的能力。

3.根据权利要求1-2任一项所述的方法，其特征在于：所述用户标识是网络多媒体数据流携带的。

4.根据权利要求1-3任一项所述的方法，其特征在于：所述分离其中维度发生跳跃的特征的过程中采用了神经网络模型。

5.一种虚假媒体内容挖掘与识别的系统，其特征在于，所述系统包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行实现权利要求1-4任一项所述的方法。

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行实现权利要求1-4任一项所述的方法。