CN115525833A - 基于单层分离的虚假媒体识别的方法和系统 - Google Patents

基于单层分离的虚假媒体识别的方法和系统 Download PDF

Info

Publication number
CN115525833A
CN115525833A CN202111609752.4A CN202111609752A CN115525833A CN 115525833 A CN115525833 A CN 115525833A CN 202111609752 A CN202111609752 A CN 202111609752A CN 115525833 A CN115525833 A CN 115525833A
Authority
CN
China
Prior art keywords
data stream
multimedia data
dimension
multimedia
layer separation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111609752.4A
Other languages
English (en)
Inventor
苏长君
曾祥禄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhimei Internet Technology Co ltd
Original Assignee
Beijing Zhimei Internet Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhimei Internet Technology Co ltd filed Critical Beijing Zhimei Internet Technology Co ltd
Priority to CN202111609752.4A priority Critical patent/CN115525833A/zh
Publication of CN115525833A publication Critical patent/CN115525833A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种基于单层分离的虚假媒体识别的方法和系统,通过将获取的网络多媒体数据流进行维度转换,并使用带有注意力机制的双向门控循环单元模型和分层注意力网络模型对数据流进行收敛,根据张量计算结果进行单层分离,挖掘出正反面态度,再经过语义分析得到词分量,根据词分量断点的值的变化进行二次采样,可以分离其中维度发生跳跃的特征,从而更快检测多媒体数据是否合规,实现识别虚假信息的目的。

Description

基于单层分离的虚假媒体识别的方法和系统
技术领域
本申请涉及网络多媒体领域,尤其涉及一种基于单层分离的虚假媒体识别的方法和系统。
背景技术
现有网络媒体中存在大量词汇,为了能够跟上网络词汇的发展,需要不断地训练系统,以及为了方便系统调用相应的词向量,还必须将每个词汇和训练好的词向量逐个对应,这个过程会耗费大量的资源。甚至评论文本中同一句评论可能表达的意思是相反的。
因此,急需一种针对性的基于单层分离的虚假媒体识别的方法和系统。
发明内容
本发明的目的在于提供一种基于单层分离的虚假媒体识别的方法和系统,通过将获取的网络多媒体数据流进行维度转换,并使用带有注意力机制的双向门控循环单元模型和分层注意力网络模型对数据流进行收敛,根据张量计算结果进行单层分离,挖掘出正反面态度,再经过语义分析得到词分量,根据词分量断点的值的变化进行二次采样,可以分离其中维度发生跳跃的特征,从而更快检测多媒体数据是否合规,实现识别虚假信息的目的。
第一方面,本申请提供一种基于单层分离的虚假媒体识别的方法,所述方法包括:
服务器获取网络多媒体数据流,将所述网络多媒体数据流进行采样,向量化采样结果,并进行维度转换,将接收的P*Q维度的多媒体信号转换为M*N维度的多媒体信号,其中P*Q是信号传输通道的维度,M*N是服务器负载处理的维度,P、Q、M、N均为非零正整数;
将所述维度转换后的多媒体信号根据用户标识重组为第一数据流,输入到带有注意力机制的双向门控循环单元模型和分层注意力网络模型,所述双向门控循环单元模型和分层注意力网络模型分别对第一数据流进行收敛,待收敛后完成各自的张量计算,提取注意力层的输出向量进行拼接,得到第一中间结果;
再次使用分层注意力网络模型识别所述第一中间结果,挖掘出第一数据流中的正反面态度,语义分析所述正反面态度对应的词分量,得到对应的词含义;
检测所述词分量中每一个断点的值,所述断点的值是由每个断点的特征与四周相邻断点的特征加权平均计算得到的,在断点的值发生跳跃处设置锚点;
在所述锚点处再次采样所述第一数据流,提到第二特征,将所述第二特征进行编码后,输入到N层卷积单元,根据所述N层卷积单元的输出结果,得到第二中间结果;
对所述第二中间结果进行平滑处理,得到携带有边界和区域局部特征的高维信号集合,分析该高维信号集合,分离其中维度发生跳跃的特征,查询所述维度发生跳跃的特征对应的多媒体数据,检测出该多媒体数据是否合规,如果不合规则认定该网络多媒体数据流包含虚假信息,生成报警。
结合第一方面,在第一方面第一种可能的实现方式中,所述N层卷积单元是由N个依次连接的卷积运算模块组成,N的值反映服务器负载处理的能力。
结合第一方面,在第一方面第二种可能的实现方式中,所述用户标识是网络多媒体数据流携带的。
结合第一方面,在第一方面第三种可能的实现方式中,所述分离其中维度发生跳跃的特征的过程中采用了神经网络模型。
第二方面,本申请提供一种基于单层分离的虚假媒体识别的系统,所述系统包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面四种可能中任一项所述的方法。
第三方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面四种可能中任一项所述的方法。
本发明提供一种基于单层分离的虚假媒体识别的方法和系统,通过将获取的网络多媒体数据流进行维度转换,并使用带有注意力机制的双向门控循环单元模型和分层注意力网络模型对数据流进行收敛,根据张量计算结果进行单层分离,挖掘出正反面态度,再经过语义分析得到词分量,根据词分量断点的值的变化进行二次采样,可以分离其中维度发生跳跃的特征,从而更快检测多媒体数据是否合规,实现识别虚假信息的目的。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法的流程图。
具体实施方式
下面结合附图对本发明的优选实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
图1为本申请提供的基于单层分离的虚假媒体识别的方法的流程图,包括:
服务器获取网络多媒体数据流,将所述网络多媒体数据流进行采样,向量化采样结果,并进行维度转换,将接收的P*Q维度的多媒体信号转换为M*N维度的多媒体信号,其中P*Q是信号传输通道的维度,M*N是服务器负载处理的维度,P、Q、M、N均为非零正整数;
将所述维度转换后的多媒体信号根据用户标识重组为第一数据流,输入到带有注意力机制的双向门控循环单元模型和分层注意力网络模型,所述双向门控循环单元模型和分层注意力网络模型分别对第一数据流进行收敛,待收敛后完成各自的张量计算,提取注意力层的输出向量进行拼接,得到第一中间结果;
再次使用分层注意力网络模型识别所述第一中间结果,挖掘出第一数据流中的正反面态度,语义分析所述正反面态度对应的词分量,得到对应的词含义;
检测所述词分量中每一个断点的值,所述断点的值是由每个断点的特征与四周相邻断点的特征加权平均计算得到的,在断点的值发生跳跃处设置锚点;
在所述锚点处再次采样所述第一数据流,提到第二特征,将所述第二特征进行编码后,输入到N层卷积单元,根据所述N层卷积单元的输出结果,得到第二中间结果;
对所述第二中间结果进行平滑处理,得到携带有边界和区域局部特征的高维信号集合,分析该高维信号集合,分离其中维度发生跳跃的特征,查询所述维度发生跳跃的特征对应的多媒体数据,检测出该多媒体数据是否合规,如果不合规则认定该网络多媒体数据流包含虚假信息,生成报警。
在一些优选实施例中,所述N层卷积单元是由N个依次连接的卷积运算模块组成,N的值反映服务器负载处理的能力。
在一些优选实施例中,所述用户标识是网络多媒体数据流携带的。
在一些优选实施例中,所述分离其中维度发生跳跃的特征的过程中采用了神经网络模型。
本申请提供一种基于单层分离的虚假媒体识别的系统,所述系统包括:所述系统包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面所有实施例中任一项所述的方法。
本申请提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面所有实施例中任一项所述的方法。
具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可以存储有程序,该程序执行时可包括本发明各个实施例中的部分或全部步骤。所述的存储介质可以为磁碟、光盘、只读存储记忆体(简称:ROM)或随机存储记忆体(简称:RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书各个实施例之间相同相似的部分互相参见即可。尤其,对于实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
以上所述的本发明实施方式并不构成对本发明保护范围的限定。

Claims (6)

1.一种基于单层分离的虚假媒体识别的方法,其特征在于,所述方法包括:
服务器获取网络多媒体数据流,将所述网络多媒体数据流进行采样,向量化采样结果,并进行维度转换,将接收的P*Q维度的多媒体信号转换为M*N维度的多媒体信号,其中P*Q是信号传输通道的维度,M*N是服务器负载处理的维度,P、Q、M、N均为非零正整数;
将所述维度转换后的多媒体信号根据用户标识重组为第一数据流,输入到带有注意力机制的双向门控循环单元模型和分层注意力网络模型,所述双向门控循环单元模型和分层注意力网络模型分别对第一数据流进行收敛,待收敛后完成各自的张量计算,提取注意力层的输出向量进行拼接,得到第一中间结果;
再次使用分层注意力网络模型识别所述第一中间结果,挖掘出第一数据流中的正反面态度,语义分析所述正反面态度对应的词分量,得到对应的词含义;
检测所述词分量中每一个断点的值,所述断点的值是由每个断点的特征与四周相邻断点的特征加权平均计算得到的,在断点的值发生跳跃处设置锚点;
在所述锚点处再次采样所述第一数据流,提到第二特征,将所述第二特征进行编码后,输入到N层卷积单元,根据所述N层卷积单元的输出结果,得到第二中间结果;
对所述第二中间结果进行平滑处理,得到携带有边界和区域局部特征的高维信号集合,分析该高维信号集合,分离其中维度发生跳跃的特征,查询所述维度发生跳跃的特征对应的多媒体数据,检测出该多媒体数据是否合规,如果不合规则认定该网络多媒体数据流包含虚假信息,生成报警。
2.根据权利要求1所述的方法,其特征在于:所述N层卷积单元是由N个依次连接的卷积运算模块组成,N的值反映服务器负载处理的能力。
3.根据权利要求1-2任一项所述的方法,其特征在于:所述用户标识是网络多媒体数据流携带的。
4.根据权利要求1-3任一项所述的方法,其特征在于:所述分离其中维度发生跳跃的特征的过程中采用了神经网络模型。
5.一种基于单层分离的虚假媒体识别的系统,其特征在于,所述系统包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行实现权利要求1-4任一项所述的方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行实现权利要求1-4任一项所述的方法。
CN202111609752.4A 2021-12-27 2021-12-27 基于单层分离的虚假媒体识别的方法和系统 Pending CN115525833A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111609752.4A CN115525833A (zh) 2021-12-27 2021-12-27 基于单层分离的虚假媒体识别的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111609752.4A CN115525833A (zh) 2021-12-27 2021-12-27 基于单层分离的虚假媒体识别的方法和系统

Publications (1)

Publication Number Publication Date
CN115525833A true CN115525833A (zh) 2022-12-27

Family

ID=84693932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111609752.4A Pending CN115525833A (zh) 2021-12-27 2021-12-27 基于单层分离的虚假媒体识别的方法和系统

Country Status (1)

Country Link
CN (1) CN115525833A (zh)

Similar Documents

Publication Publication Date Title
GB2604552A (en) Fusing multimodal data using recurrent neural networks
CN112613306B (zh) 抽取实体关系的方法、装置、电子设备、及存储介质
CN110851761A (zh) 基于区块链的侵权检测方法、装置、设备及存储介质
CN113705315B (zh) 视频处理方法、装置、设备及存储介质
CN117112744B (zh) 大语言模型的评估方法、装置及电子设备
CN116304748B (zh) 一种文本相似度计算方法、系统、设备及介质
CN113986950A (zh) 一种sql语句处理方法、装置、设备及存储介质
CN116055293A (zh) 路由器的远程故障监控方法及路由器
CN114036283A (zh) 一种文本匹配的方法、装置、设备和可读存储介质
CN115761839A (zh) 人脸活体检测模型的训练方法、人脸活体检测方法及装置
CN115329176A (zh) 搜索请求的处理方法、装置、计算机设备及存储介质
CN114742016A (zh) 一种基于多粒度实体异构图的篇章级事件抽取方法及装置
CN118260439A (zh) 密集架系统的信息管理系统及方法
KR20220105792A (ko) 동적 텍스트 소스를 활용한 ai 기반 의사결정지원 시스템
CN115114627B (zh) 一种恶意软件检测方法及装置
CN115525833A (zh) 基于单层分离的虚假媒体识别的方法和系统
CN114266240A (zh) 一种基于机器人的多意图识别方法及装置
CN112818688B (zh) 文本处理方法、装置、设备及存储介质
CN112559713B (zh) 文本相关性判断方法及装置、模型、电子设备、可读介质
CN115080745A (zh) 基于人工智能的多场景文本分类方法、装置、设备及介质
CN114254622A (zh) 一种意图识别方法和装置
CN114416923A (zh) 一种基于富文本特征的新闻实体链接方法和系统
CN112632229A (zh) 文本聚类方法及装置
CN114154001B (zh) 虚假媒体内容挖掘与识别的方法和系统
CN117909505B (zh) 事件论元的抽取方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 607a, 6 / F, No. 31, Fuchengmenwai street, Xicheng District, Beijing 100037

Applicant after: Beijing Guorui Digital Intelligence Technology Co.,Ltd.

Address before: 607a, 6 / F, No. 31, Fuchengmenwai street, Xicheng District, Beijing 100037

Applicant before: Beijing Zhimei Internet Technology Co.,Ltd.

CB02 Change of applicant information