CN114154001A - 虚假媒体内容挖掘与识别的方法和系统 - Google Patents

虚假媒体内容挖掘与识别的方法和系统 Download PDF

Info

Publication number
CN114154001A
CN114154001A CN202111431383.4A CN202111431383A CN114154001A CN 114154001 A CN114154001 A CN 114154001A CN 202111431383 A CN202111431383 A CN 202111431383A CN 114154001 A CN114154001 A CN 114154001A
Authority
CN
China
Prior art keywords
characteristic
multimedia data
data stream
dimension
convolution unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111431383.4A
Other languages
English (en)
Inventor
苏长君
曾祥禄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhimei Internet Technology Co ltd
Original Assignee
Beijing Zhimei Internet Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhimei Internet Technology Co ltd filed Critical Beijing Zhimei Internet Technology Co ltd
Priority to CN202111431383.4A priority Critical patent/CN114154001A/zh
Publication of CN114154001A publication Critical patent/CN114154001A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种虚假媒体内容挖掘与识别的方法和系统,通过将获取的网络多媒体数据流进行维度转换,使得原本不可分的数据在高维空间中变得可分,再经过两重视频采样,得到携带有边界和区域局部特征的高维信号集合,从而可以分离其中维度发生跳跃的特征,查询出对应的多媒体数据,检测该多媒体数据是否合规,实现识别虚假信息的目的。

Description

虚假媒体内容挖掘与识别的方法和系统
技术领域
本申请涉及网络多媒体领域,尤其涉及一种虚假媒体内容挖掘与识别的方法和系统。
背景技术
随着网络的快速发展,信息的高速流动带来了生后的便捷,却也带来了越来越多的虚假内容,不法分子炮制虚假信息的门槛非常低,越来越成为社会问题。
因此,急需一种针对性的虚假媒体内容挖掘与识别的方法和系统。
发明内容
本发明的目的在于提供一种虚假媒体内容挖掘与识别的方法和系统,通过将获取的网络多媒体数据流进行维度转换,使得原本不可分的数据在高维空间中变得可分,再经过两重视频采样,得到携带有边界和区域局部特征的高维信号集合,从而可以分离其中维度发生跳跃的特征,查询出对应的多媒体数据,检测该多媒体数据是否合规,实现识别虚假信息的目的。
第一方面,本申请提供一种虚假媒体内容挖掘与识别的方法,所述方法包括:
服务器获取网络多媒体数据流,将所述网络多媒体数据流进行采样,向量化采样结果,并进行维度转换,将接收的P*Q维度的多媒体信号转换为M*N维度的多媒体信号,其中P*Q是信号传输通道的维度,M*N是服务器负载处理的维度,P、Q、M、N均为非零正整数;
将所述维度转换后的多媒体信号根据用户标识重组为第一数据流,输入到两个单向的变体模型GRU,提取第一特征,将所述第一特征进行编码后,输入到N层卷积单元,根据所述N层卷积单元的输出结果,得到第一中间结果;
所述第一中间结果的每一个点生成一个锚点,锚点的值是由每个点的特征与四周相邻点的特征加权平均计算得到的;若干个锚点组成一个滑动窗,组成该滑动窗所需的锚点数目由最中间锚点所属的点的特征大小决定;
使用所述滑动窗再次采样所述第一数据流,提到第二特征,将所述第二特征再次进行编码后,输入到N层卷积单元,根据所述N层卷积单元的输出结果,得到第二中间结果;
对所述第二中间结果进行平滑处理,得到携带有边界和区域局部特征的高维信号集合,分析该高维信号集合,分离其中维度发生跳跃的特征,查询所述维度发生跳跃的特征对应的多媒体数据,检测出该多媒体数据是否合规,如果不合规则认定该网络多媒体数据流包含虚假信息,生成报警。
结合第一方面,在第一方面第一种可能的实现方式中,所述N层卷积单元是由N个依次连接的卷积运算模块组成,N的值反映服务器负载处理的能力。
结合第一方面,在第一方面第二种可能的实现方式中,所述用户标识是网络多媒体数据流携带的。
结合第一方面,在第一方面第三种可能的实现方式中,所述分离其中维度发生跳跃的特征的过程中采用了神经网络模型。
第二方面,本申请提供一种虚假媒体内容挖掘与识别的系统,所述系统包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面四种可能中任一项所述的方法。
第三方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面四种可能中任一项所述的方法。
本发明提供一种虚假媒体内容挖掘与识别的方法和系统,通过将获取的网络多媒体数据流进行维度转换,使得原本不可分的数据在高维空间中变得可分,再经过两重视频采样,得到携带有边界和区域局部特征的高维信号集合,从而可以分离其中维度发生跳跃的特征,查询出对应的多媒体数据,检测该多媒体数据是否合规,实现识别虚假信息的目的。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法的流程图。
具体实施方式
下面结合附图对本发明的优选实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
图1为本申请提供的虚假媒体内容挖掘与识别的方法的流程图,包括:
服务器获取网络多媒体数据流,将所述网络多媒体数据流进行采样,向量化采样结果,并进行维度转换,将接收的P*Q维度的多媒体信号转换为M*N维度的多媒体信号,其中P*Q是信号传输通道的维度,M*N是服务器负载处理的维度,P、Q、M、N均为非零正整数;
将所述维度转换后的多媒体信号根据用户标识重组为第一数据流,输入到两个单向的变体模型GRU,提取第一特征,将所述第一特征进行编码后,输入到N层卷积单元,根据所述N层卷积单元的输出结果,得到第一中间结果;
所述第一中间结果的每一个点生成一个锚点,锚点的值是由每个点的特征与四周相邻点的特征加权平均计算得到的;若干个锚点组成一个滑动窗,组成该滑动窗所需的锚点数目由最中间锚点所属的点的特征大小决定;
使用所述滑动窗再次采样所述第一数据流,提到第二特征,将所述第二特征再次进行编码后,输入到N层卷积单元,根据所述N层卷积单元的输出结果,得到第二中间结果;
对所述第二中间结果进行平滑处理,得到携带有边界和区域局部特征的高维信号集合,分析该高维信号集合,分离其中维度发生跳跃的特征,查询所述维度发生跳跃的特征对应的多媒体数据,检测出该多媒体数据是否合规,如果不合规则认定该网络多媒体数据流包含虚假信息,生成报警。
在一些优选实施例中,所述N层卷积单元是由N个依次连接的卷积运算模块组成,N的值反映服务器负载处理的能力。
在一些优选实施例中,所述用户标识是网络多媒体数据流携带的。
在一些优选实施例中,所述分离其中维度发生跳跃的特征的过程中采用了神经网络模型。
本申请提供一种虚假媒体内容挖掘与识别的系统,所述系统包括:所述系统包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面所有实施例中任一项所述的方法。
本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面所有实施例中任一项所述的方法。
具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可以存储有程序,该程序执行时可包括本发明各个实施例中的部分或全部步骤。所述的存储介质可以为磁碟、光盘、只读存储记忆体(简称:ROM)或随机存储记忆体(简称:RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书各个实施例之间相同相似的部分互相参见即可。尤其,对于实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
以上所述的本发明实施方式并不构成对本发明保护范围的限定。

Claims (6)

1.一种虚假媒体内容挖掘与识别的方法,其特征在于,所述方法包括:
服务器获取网络多媒体数据流,将所述网络多媒体数据流进行采样,向量化采样结果,并进行维度转换,将接收的P*Q维度的多媒体信号转换为M*N维度的多媒体信号,其中P*Q是信号传输通道的维度,M*N是服务器负载处理的维度,P、Q、M、N均为非零正整数;
将所述维度转换后的多媒体信号根据用户标识重组为第一数据流,输入到两个单向的变体模型GRU,提取第一特征,将所述第一特征进行编码后,输入到N层卷积单元,根据所述N层卷积单元的输出结果,得到第一中间结果;
所述第一中间结果的每一个点生成一个锚点,锚点的值是由每个点的特征与四周相邻点的特征加权平均计算得到的;若干个锚点组成一个滑动窗,组成该滑动窗所需的锚点数目由最中间锚点所属的点的特征大小决定;
使用所述滑动窗再次采样所述第一数据流,提到第二特征,将所述第二特征再次进行编码后,输入到N层卷积单元,根据所述N层卷积单元的输出结果,得到第二中间结果;
对所述第二中间结果进行平滑处理,得到携带有边界和区域局部特征的高维信号集合,分析该高维信号集合,分离其中维度发生跳跃的特征,查询所述维度发生跳跃的特征对应的多媒体数据,检测出该多媒体数据是否合规,如果不合规则认定该网络多媒体数据流包含虚假信息,生成报警。
2.根据权利要求1所述的方法,其特征在于:所述N层卷积单元是由N个依次连接的卷积运算模块组成,N的值反映服务器负载处理的能力。
3.根据权利要求1-2任一项所述的方法,其特征在于:所述用户标识是网络多媒体数据流携带的。
4.根据权利要求1-3任一项所述的方法,其特征在于:所述分离其中维度发生跳跃的特征的过程中采用了神经网络模型。
5.一种虚假媒体内容挖掘与识别的系统,其特征在于,所述系统包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行实现权利要求1-4任一项所述的方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行实现权利要求1-4任一项所述的方法。
CN202111431383.4A 2021-11-29 2021-11-29 虚假媒体内容挖掘与识别的方法和系统 Pending CN114154001A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111431383.4A CN114154001A (zh) 2021-11-29 2021-11-29 虚假媒体内容挖掘与识别的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111431383.4A CN114154001A (zh) 2021-11-29 2021-11-29 虚假媒体内容挖掘与识别的方法和系统

Publications (1)

Publication Number Publication Date
CN114154001A true CN114154001A (zh) 2022-03-08

Family

ID=80784301

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111431383.4A Pending CN114154001A (zh) 2021-11-29 2021-11-29 虚假媒体内容挖掘与识别的方法和系统

Country Status (1)

Country Link
CN (1) CN114154001A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150199351A1 (en) * 2014-01-15 2015-07-16 Microsoft Corporation Automated Multimedia Content Recognition
US20150304188A1 (en) * 2014-04-22 2015-10-22 Shenzhen Development Promotion Centre For Enterprises Method and apparatus for detecting multimedia content change, and resource propagation system
CN107295401A (zh) * 2017-08-10 2017-10-24 四川长虹电器股份有限公司 一种检测自媒体音视频内容中的违规信息的方法
US20180032862A1 (en) * 2016-07-29 2018-02-01 Splunk, Inc. Automated anomaly detection for event-based system
CN107992746A (zh) * 2017-12-14 2018-05-04 华中师范大学 恶意行为挖掘方法及装置
DE102017220131A1 (de) * 2017-11-13 2019-05-16 Robert Bosch Gmbh Erkennung von Anomalien in einem Netzwerkdatenstrom
CN110287341A (zh) * 2019-06-26 2019-09-27 腾讯科技(深圳)有限公司 一种数据处理方法、装置以及可读存储介质
CN111858973A (zh) * 2020-07-30 2020-10-30 北京达佳互联信息技术有限公司 多媒体事件信息的检测方法、装置、服务器及存储介质
CN112468461A (zh) * 2020-11-13 2021-03-09 北京明略昭辉科技有限公司 多维度异常流量识别方法、装置及计算机设备
CN112565301A (zh) * 2019-12-26 2021-03-26 北京航空航天大学 基于小样本学习的服务器运行网络流量异常数据检测方法
CN113689291A (zh) * 2021-09-22 2021-11-23 杭银消费金融股份有限公司 基于异常移动的反欺诈识别方法及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150199351A1 (en) * 2014-01-15 2015-07-16 Microsoft Corporation Automated Multimedia Content Recognition
US20150304188A1 (en) * 2014-04-22 2015-10-22 Shenzhen Development Promotion Centre For Enterprises Method and apparatus for detecting multimedia content change, and resource propagation system
US20180032862A1 (en) * 2016-07-29 2018-02-01 Splunk, Inc. Automated anomaly detection for event-based system
CN107295401A (zh) * 2017-08-10 2017-10-24 四川长虹电器股份有限公司 一种检测自媒体音视频内容中的违规信息的方法
DE102017220131A1 (de) * 2017-11-13 2019-05-16 Robert Bosch Gmbh Erkennung von Anomalien in einem Netzwerkdatenstrom
CN107992746A (zh) * 2017-12-14 2018-05-04 华中师范大学 恶意行为挖掘方法及装置
CN110287341A (zh) * 2019-06-26 2019-09-27 腾讯科技(深圳)有限公司 一种数据处理方法、装置以及可读存储介质
CN112565301A (zh) * 2019-12-26 2021-03-26 北京航空航天大学 基于小样本学习的服务器运行网络流量异常数据检测方法
CN111858973A (zh) * 2020-07-30 2020-10-30 北京达佳互联信息技术有限公司 多媒体事件信息的检测方法、装置、服务器及存储介质
CN112468461A (zh) * 2020-11-13 2021-03-09 北京明略昭辉科技有限公司 多维度异常流量识别方法、装置及计算机设备
CN113689291A (zh) * 2021-09-22 2021-11-23 杭银消费金融股份有限公司 基于异常移动的反欺诈识别方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
姜洪海;王婷婷;左进;: "基于数据流挖掘的网络边界防护技术研究", 计算机与数字工程, no. 07, 20 July 2016 (2016-07-20) *
李双琴;谢锐;曹文琛;邹妍;刘凤屿;: "基于多维分层采样的时间维度型大数据流整合系统设计", 现代电子技术, no. 05, 1 March 2020 (2020-03-01) *

Similar Documents

Publication Publication Date Title
CN112580328A (zh) 事件信息的抽取方法及装置、存储介质、电子设备
CN110008192A (zh) 一种数据文件压缩方法、装置、设备及可读存储介质
CN113332729A (zh) 基于深度学习的云游戏漏洞检测方法及人工智能服务器
CN116978011B (zh) 一种用于智能目标识别的图像语义通信方法及系统
CN116170027B (zh) 一种毒检设备数据管理系统及处理方法
CN116361256B (zh) 基于日志解析的数据同步方法及系统
CN112800919A (zh) 一种检测目标类型视频方法、装置、设备以及存储介质
CN114332500A (zh) 图像处理模型训练方法、装置、计算机设备和存储介质
CN112379859A (zh) 二值采样的处理方法及装置、对抗样本的生成方法及装置
CN111488813A (zh) 视频的情感标注方法、装置、电子设备及存储介质
CN115062709A (zh) 模型优化方法、装置、设备、存储介质及程序产品
CN113687773A (zh) 数据压缩模型训练方法及装置、存储介质
CN114154001A (zh) 虚假媒体内容挖掘与识别的方法和系统
CN110135465B (zh) 模型参数表示空间大小估计方法及装置、推荐方法
CN115529475A (zh) 视频流量内容检测与风控的方法和系统
CN113312619B (zh) 基于小样本学习的恶意进程检测方法、装置、电子设备及存储介质
CN111104484B (zh) 文本相似度检测方法、装置及电子设备
CN111143554A (zh) 基于大数据平台的数据采样方法及装置
CN115525833A (zh) 基于单层分离的虚假媒体识别的方法和系统
CN115019235B (zh) 一种场景划分和内容检测的方法和系统
CN113257239B (zh) 语音识别方法、装置、电子设备及存储介质
CN113595557B (zh) 一种数据处理的方法和装置
CN112966282B (zh) 一种部件直方图的文本无载体隐写方法与装置
CN114155461A (zh) 微小视频内容过滤与净化的方法和系统
EP4379599A1 (en) Word segmentation method and apparatus for text, and computer device and storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 607a, 6 / F, No. 31, Fuchengmenwai street, Xicheng District, Beijing 100037

Applicant after: Beijing Guorui Digital Intelligence Technology Co.,Ltd.

Address before: 607a, 6 / F, No. 31, Fuchengmenwai street, Xicheng District, Beijing 100037

Applicant before: Beijing Zhimei Internet Technology Co.,Ltd.