CN113221020A - 一种社交媒体平台虚假信息识别方法 - Google Patents

一种社交媒体平台虚假信息识别方法 Download PDF

Info

Publication number
CN113221020A
CN113221020A CN202110501506.0A CN202110501506A CN113221020A CN 113221020 A CN113221020 A CN 113221020A CN 202110501506 A CN202110501506 A CN 202110501506A CN 113221020 A CN113221020 A CN 113221020A
Authority
CN
China
Prior art keywords
data
social media
media platform
module
false information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110501506.0A
Other languages
English (en)
Inventor
何森兴
汤志雄
谭毅彬
林冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN MUSEN TECHNOLOGY CO LTD
Original Assignee
SHENZHEN MUSEN TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN MUSEN TECHNOLOGY CO LTD filed Critical SHENZHEN MUSEN TECHNOLOGY CO LTD
Priority to CN202110501506.0A priority Critical patent/CN113221020A/zh
Publication of CN113221020A publication Critical patent/CN113221020A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种社交媒体平台虚假信息识别方法,所述社交媒体平台虚假信息识别方法包括社交媒体平台数据采集模块、社交媒体平台数据校验模块、社交媒体平台数据监测模块和社交媒体平台数据处理模块,社交媒体平台数据采集模块中包括数据采集单元和数据上传单元,数据采集单元对社交媒体平台数据进行采集,数据上传单元对采集的数据进行上传。本发明通过对社交媒体平台信息的文字数据、音频数据、图像数据和视频数据进行采集,并对采集的数据通过对比单元与存储在数据库中虚假信息进行对比,并通过关键字对采集数据进行查找,生成相似度图表,判断是否为虚假信息,保证社交媒体平台信息的交互的安全性。

Description

一种社交媒体平台虚假信息识别方法
技术领域
本发明涉及一种虚假信息识别方法,特别涉及一种社交媒体平台虚假信息识别方法,属于互联网技术领域。
背景技术
社交媒体指互联网上基于用户关系的内容生产与交换平台,社交媒体是人们彼此之间用来分享意见、见解、经验和观点的工具和平台,现阶段主要包括社交网站、微博、微信、博客、论坛、播客等等。社交媒体在互联网的沃土上蓬勃发展,爆发出令人眩目的能量,其传播的信息已成为人们浏览互联网的重要内容,不仅制造了人们社交生活中争相讨论的一个又一个热门话题,更进而吸引传统媒体争相跟进。
现有的社交媒体在运用的过程中掺杂了大量的虚假信息,目前社交媒体对虚假信息无法辨识,容易造成用户上当受骗,影响用户的体验,因此需要设计一种社交媒体平台虚假信息识别方法。
发明内容
本发明的目的在于提供一种社交媒体平台虚假信息识别方法,以解决上述背景技术中提出的现有的社交媒体在运用的过程中掺杂了大量的虚假信息,目前社交媒体对虚假信息无法辨识,容易造成用户上当受骗,影响用户的体验的问题。
为实现上述目的,本发明提供如下技术方案:所述社交媒体平台虚假信息识别方法包括社交媒体平台数据采集模块、社交媒体平台数据校验模块、社交媒体平台数据监测模块和社交媒体平台数据处理模块;
社交媒体平台数据采集模块中包括数据采集单元和数据上传单元,数据采集单元对社交媒体平台数据进行采集,数据上传单元对采集的数据进行上传;
社交媒体平台数据校验模块包括数据接收单元、数据对比单元和数据查找单元,数据接收单元对上传的数据进行接收,数据对比单元对接收的数据进行与存储的虚假信息进行对比,数据查找单元查找接收数据的虚假信息关键字;
社交媒体平台数据监测模块包括动态跟踪模块,对社交媒体平台实时监测,对传输的数据通过动态跟踪模块进行跟踪;
社交媒体平台数据处理模块包括数据分类模块、数据存储模块和数据分析模块,所述分类模块对图像类数据、文字类数据、音频类数据和视频类数据进行分类处理,数据存储模块对社交媒体平台数据进行存储,数据分析模块对存储的模块进行分析处理;
社交媒体平台数据共享模块包括共享模块、加密模块和数据传输模块,所述共享模块,对社交媒体授权可公开的视频数据、音频数据和文字数据进行公开分享链接,所述加密模块对含有用户信息的或重要文件信息进行加密处理,避免数据泄露,数据传输模块对多个社交媒体平台之间的数据共享。
作为本发明的一种优选技术方案,所述数据采集单元包括社交媒体平台文字采集,社交媒体平台图像采集、社交媒体平台音频采集和社交媒体平台视频采集,
社交媒体平台文字采集:包括弹幕采集和聊天信息采集;
社交媒体平台图像采集:包括图像人物采集和图像关键字采集;
社交媒体平台视频采集:包括直播视频采集和短视频采集。
作为本发明的一种优选技术方案,所述数据上传单元对采集数据进行整理压缩,数据上传单元与数据校验模块中的数据接收单元建立安全通信信道,数据接收单元对上传的数据进行接收解压。
作为本发明的一种优选技术方案,所述数据对比单元包括以下步骤:
第一步:将数据接收单元解压数据导入至数据对比单元的对比模块;
第二步:对比模块调用虚假信息存储数据库,通过数据库中的虚假信息与导入的数据进行对比,查看重复度;
第三步:调用echats图表,生成图表,并将图表反馈至社交媒体平台数据监测模块。
作为本发明的一种优选技术方案,所述数据查找单元通过关键字对数据接收单元解压的数据中虚假信息关键字进行查找,关键字为一个词组或多个词组组合。
作为本发明的一种优选技术方案,所述存储的虚假信息为常见的虚假信息数据和验证不通过的虚假信息。
作为本发明的一种优选技术方案,所述社交媒体平台数据监测模块通过对社交媒体平台的交互数据、视频、音频进行实时监测,并对监测的数据进行数据清洗。
作为本发明的一种优选技术方案,所述数据清洗包括以下步骤:
数据预处理:将数据导入到处理工具当中,通过工具自动“查看”采集到的元数据信息,然后人工查看数据,归纳总结工具处理可能存在的遗漏或偏差;
数据分析处理:缺失值清洗,通过去重除噪、缺失值处理、通过其他渠道重新获取丢失的重要数据进行数据填充及补全;
校验:对数据清洗的结论进行效验,如格式效验和数据关联性效验。
作为本发明的一种优选技术方案,所述数据存储模块对社交媒体平台数据进行存储至数据库中。
与现有技术相比,本发明的有益效果是:
1.本发明一种社交媒体平台虚假信息识别方法,通过对社交媒体平台信息的文字数据、音频数据、图像数据和视频数据进行采集,并对采集的数据通过对比单元与存储在数据库中虚假信息进行对比,并通过关键字对采集数据进行查找,生成相似度图表,判断是否为虚假信息,保证社交媒体平台信息的交互的安全性。
2.本发明一种社交媒体平台虚假信息识别方法,通过设有的社交媒体平台信息数据监测单元对社交媒体平台信息实时监测和跟踪,并对跟踪的数据进行清洗,确保了社交媒体平台信息安全性。
附图说明
图1为本发明的模块框图;
图2本发明的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,本发明提供了一种社交媒体平台虚假信息识别方法的技术方案:
根据图1所示,社交媒体平台虚假信息识别方法包括社交媒体平台数据采集模块、社交媒体平台数据校验模块、社交媒体平台数据监测模块和社交媒体平台数据处理模块;
社交媒体平台数据采集模块中包括数据采集单元和数据上传单元,数据采集单元对社交媒体平台数据进行采集,数据上传单元对采集的数据进行上传,数据在上传的过程中通过对上传数据进行压缩,保证上传的速率,提高运行效率;
社交媒体平台数据校验模块包括数据接收单元、数据对比单元和数据查找单元,数据接收单元对上传的数据进行接收,数据对比单元对接收的数据进行与存储的虚假信息进行对比,数据查找单元查找接收数据的虚假信息关键字,关键字为虚假信息关键字,可以为多个关键字同时检索;
社交媒体平台数据监测模块包括动态跟踪模块,对社交媒体平台实时监测,对传输的数据通过动态跟踪模块进行跟踪,通过对传输数据进行动态跟踪,在确定为虚假信息时,能够及时的进行删除清理,避免了虚假信息的传播;
社交媒体平台数据处理模块包括数据分类模块、数据存储模块和数据分析模块,分类模块对图像类数据、文字类数据、音频类数据和视频类数据进行分类处理,数据存储模块对社交媒体平台数据进行存储,数据分析模块对存储的模块进行分析处理,数据分析模块根据校验模块校验生产的图表,在大于设定值使对信息进行校验,确定是否为虚假信息;
社交媒体平台数据共享模块包括共享模块、加密模块和数据传输模块,所述共享模块,对社交媒体授权可公开的视频数据、音频数据和文字数据进行公开分享链接,所述加密模块对含有用户信息的或重要文件信息进行加密处理,避免数据泄露,数据传输模块对多个社交媒体平台之间的数据共享,通过社交媒体平台之间的数据共享,有效的提高社交媒体视频的传播,对于积极向上的视频进行推广,提高社交媒体平台的辨识度。
数据采集单元包括社交媒体平台文字采集,社交媒体平台图像采集、社交媒体平台音频采集和社交媒体平台视频采集,
社交媒体平台文字采集:包括弹幕采集和聊天信息采集;
社交媒体平台图像采集:包括图像人物采集和图像关键字采集;
社交媒体平台视频采集:包括直播视频采集和短视频采集。
数据上传单元对采集数据进行整理压缩,数据上传单元与数据校验模块中的数据接收单元建立安全通信信道,数据接收单元对上传的数据进行接收解压。
数据对比单元包括以下步骤:
第一步:将数据接收单元解压数据导入至数据对比单元的对比模块;
第二步:对比模块调用虚假信息存储数据库,通过数据库中的虚假信息与导入的数据进行对比,查看重复度;
第三步:调用echats图表,生成图表,并将图表反馈至社交媒体平台数据监测模块。
数据查找单元通过关键字对数据接收单元解压的数据中虚假信息关键字进行查找,关键字为一个词组或多个词组组合。
存储的虚假信息为常见的虚假信息数据和验证不通过的虚假信息。
社交媒体平台数据监测模块通过对社交媒体平台的交互数据、视频、音频进行实时监测,并对监测的数据进行数据清洗。
数据清洗包括以下步骤:
数据预处理:将数据导入到处理工具当中,通过工具自动“查看”采集到的元数据信息,然后人工查看数据,归纳总结工具处理可能存在的遗漏或偏差;
数据分析处理:缺失值清洗,通过去重除噪、缺失值处理、通过其他渠道重新获取丢失的重要数据进行数据填充及补全;
校验:对数据清洗的结论进行效验,如格式效验和数据关联性效验。
数据存储模块对社交媒体平台数据进行存储至数据库中,数据库对社交媒体平台数据分类存储,便于实时的查找。
在本发明的描述中,需要理解的是,指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明中,除非另有明确的规定和限定,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (9)

1.一种社交媒体平台虚假信息识别方法,其特征在于,所述社交媒体平台虚假信息识别方法包括社交媒体平台数据采集模块、社交媒体平台数据校验模块、社交媒体平台数据监测模块、社交媒体平台数据处理模块和社交媒体平台数据共享模块;
社交媒体平台数据采集模块中包括数据采集单元和数据上传单元,数据采集单元对社交媒体平台数据进行采集,数据上传单元对采集的数据进行上传;
社交媒体平台数据校验模块包括数据接收单元、数据对比单元和数据查找单元,数据接收单元对上传的数据进行接收,数据对比单元对接收的数据进行与存储的虚假信息进行对比,数据查找单元查找接收数据的虚假信息关键字;
社交媒体平台数据监测模块包括动态跟踪模块,对社交媒体平台实时监测,对传输的数据通过动态跟踪模块进行跟踪;
社交媒体平台数据处理模块包括数据分类模块、数据存储模块和数据分析模块,所述分类模块对图像类数据、文字类数据、音频类数据和视频类数据进行分类处理,数据存储模块对社交媒体平台数据进行存储,数据分析模块对存储的模块进行分析处理;
社交媒体平台数据共享模块包括共享模块、加密模块和数据传输模块,所述共享模块,对社交媒体授权可公开的视频数据、音频数据和文字数据进行公开分享链接,所述加密模块对含有用户信息的或重要文件信息进行加密处理,避免数据泄露,数据传输模块对多个社交媒体平台之间的数据共享。
2.根据权利要求1所述的一种社交媒体平台虚假信息识别方法,其特征在于:所述数据采集单元包括社交媒体平台文字采集,社交媒体平台图像采集、社交媒体平台音频采集和社交媒体平台视频采集,
社交媒体平台文字采集:包括弹幕采集和聊天信息采集;
社交媒体平台图像采集:包括图像人物采集和图像关键字采集;
社交媒体平台视频采集:包括直播视频采集和短视频采集。
3.根据权利要求1所述的一种社交媒体平台虚假信息识别方法,其特征在于:所述数据上传单元对采集数据进行整理压缩,数据上传单元与数据校验模块中的数据接收单元建立安全通信信道,数据接收单元对上传的数据进行接收解压。
4.根据权利要求1所述的一种社交媒体平台虚假信息识别方法,其特征在于:所述数据对比单元包括以下步骤:
第一步:将数据接收单元解压数据导入至数据对比单元的对比模块;
第二步:对比模块调用虚假信息存储数据库,通过数据库中的虚假信息与导入的数据进行对比,查看重复度;
第三步:调用echats图表,生成图表,并将图表反馈至社交媒体平台数据监测模块。
5.根据权利要求1所述的一种社交媒体平台虚假信息识别方法,其特征在于:所述数据查找单元通过关键字对数据接收单元解压的数据中虚假信息关键字进行查找,关键字为一个词组或多个词组组合。
6.根据权利要求1所述的一种社交媒体平台虚假信息识别方法,其特征在于:所述存储的虚假信息为常见的虚假信息数据和验证不通过的虚假信息。
7.根据权利要求1所述的一种社交媒体平台虚假信息识别方法,其特征在于:所述社交媒体平台数据监测模块通过对社交媒体平台的交互数据、视频、音频进行实时监测,并对监测的数据进行数据清洗。
8.根据权利要求1所述的一种社交媒体平台虚假信息识别方法,其特征在于:所述数据清洗包括以下步骤:
数据预处理:将数据导入到处理工具当中,通过工具自动“查看”采集到的元数据信息,然后人工查看数据,归纳总结工具处理可能存在的遗漏或偏差;
数据分析处理:缺失值清洗,通过去重除噪、缺失值处理、通过其他渠道重新获取丢失的重要数据进行数据填充及补全;
校验:对数据清洗的结论进行效验,如格式效验和数据关联性效验。
9.根据权利要求1所述的一种社交媒体平台虚假信息识别方法,其特征在于:所述数据存储模块对社交媒体平台数据进行存储至数据库中。
CN202110501506.0A 2021-05-08 2021-05-08 一种社交媒体平台虚假信息识别方法 Withdrawn CN113221020A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110501506.0A CN113221020A (zh) 2021-05-08 2021-05-08 一种社交媒体平台虚假信息识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110501506.0A CN113221020A (zh) 2021-05-08 2021-05-08 一种社交媒体平台虚假信息识别方法

Publications (1)

Publication Number Publication Date
CN113221020A true CN113221020A (zh) 2021-08-06

Family

ID=77094090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110501506.0A Withdrawn CN113221020A (zh) 2021-05-08 2021-05-08 一种社交媒体平台虚假信息识别方法

Country Status (1)

Country Link
CN (1) CN113221020A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114491443A (zh) * 2022-01-14 2022-05-13 北京国信网联科技有限公司 一种网络通信中的信息安全装置
CN115086354A (zh) * 2022-05-31 2022-09-20 北京融讯智晖技术有限公司 一种融合视频云用用户数据管理系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114491443A (zh) * 2022-01-14 2022-05-13 北京国信网联科技有限公司 一种网络通信中的信息安全装置
CN115086354A (zh) * 2022-05-31 2022-09-20 北京融讯智晖技术有限公司 一种融合视频云用用户数据管理系统

Similar Documents

Publication Publication Date Title
US10109023B2 (en) Social media events detection and verification
KR101605430B1 (ko) 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법
CN113221020A (zh) 一种社交媒体平台虚假信息识别方法
CN103593371A (zh) 推荐搜索关键词的方法和装置
CN102622375A (zh) 第三方律师推荐智能匹配系统和方法
CN110489527A (zh) 基于语音交互的银行业务智能咨询以及办理方法和系统
CN103020140A (zh) 一种对互联网用户评论内容自动过滤的方法和装置
Shah et al. Multimodal fake news detection using a Cultural Algorithm with situational and normative knowledge
CN102045268A (zh) 一种电子邮件数据恢复方法及装置
CN105512300B (zh) 信息过滤方法及系统
CN110750679A (zh) 一种基于关键词的视频搜索方法、系统、装置及存储介质
Lee et al. An automatic topic ranking approach for event detection on microblogging messages
CN105045882A (zh) 一种热词处理方法及装置
CN110929683A (zh) 一种基于人工智能的视频舆情监测方法及系统
Shangguan et al. Trend and thoughts: Understanding climate change concern using machine learning and social media data
CN110941836A (zh) 一种分布式垂直爬虫方法及终端设备
CN114724072A (zh) 智能推题方法、装置、设备及存储介质
Litou et al. Pythia: A system for online topic discovery of social media posts
KR101913284B1 (ko) 소셜 네트워크 서비스에서 스팸 탐지 방법 및 장치
Alsafrjalani An extensible, modular framework for classifying YouTube videos using web and social media
CN113076355A (zh) 一种数据安全流动态势感知的方法
Roedler et al. Content driven profile matching across online social networks
CN113722540A (zh) 基于视频字幕的知识图谱构建方法、装置及计算设备
CN117556112B (zh) 电子档案信息智能管理系统
Liu et al. FakeNewsGPT4: Advancing Multimodal Fake News Detection through Knowledge-Augmented LVLMs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210806