CN112182392A - 一种基于大数据的信息分析方法 - Google Patents

一种基于大数据的信息分析方法 Download PDF

Info

Publication number
CN112182392A
CN112182392A CN202011063327.5A CN202011063327A CN112182392A CN 112182392 A CN112182392 A CN 112182392A CN 202011063327 A CN202011063327 A CN 202011063327A CN 112182392 A CN112182392 A CN 112182392A
Authority
CN
China
Prior art keywords
server
information
user
screening
big data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011063327.5A
Other languages
English (en)
Inventor
雷印兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Kuangwen Technology Consulting Co ltd
Original Assignee
Chongqing Kuangwen Technology Consulting Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Kuangwen Technology Consulting Co ltd filed Critical Chongqing Kuangwen Technology Consulting Co ltd
Priority to CN202011063327.5A priority Critical patent/CN112182392A/zh
Publication of CN112182392A publication Critical patent/CN112182392A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Abstract

本发明涉及大数据技术领域,具体是一种基于大数据的信息分析方法,S1、用户发布数据;S2、大数据信息接收并传输到云存储;S3、发送到筛选服务器;S4、筛选数据信息;S5、发送到服务器分类保存到资源盘;S6、用户提交资源获取请求;S7、服务器提取资源盘对应信息提交到用户手中。本发明基于大数据的信息分析方法,信息分析方法通过服务器首次筛选后,对通过文案再次筛审核的机会,且有五次人工审核,能把筛选后不合格的文案云盘保存三个月然后作废,增加使用的人性化,对争议文案人工审核,避免合规优质文案得不到发表,且对涉嫌抄袭重复的文案剔除,避免制作的网页或服务器出现较多相同文案。

Description

一种基于大数据的信息分析方法
技术领域
本发明涉及大数据技术领域,具体是一种基于大数据的信息分析方法。
背景技术
大数据,IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,基于大数据的信息分析方法,为便于信息分析效率。
中国专利公开了一种基于大数据的信息分析方法,(授权公告号CN105447113B),该专利技术可以实现网络中的大数据资源进行内容过滤、分析、分类存储以及可视化展示,提升了用户体验,但是,目前市场上的信息分析方法一般通过服务器直接筛选,把筛选后不合格的文案直接作废,对发布用户来说不够人性化,导致发布用户的积极性较低,造成网页或服务器不被使用者喜欢,造成用户下降,智能审核过程容易造成合规优质文案得不到发表,大多信息分析不对涉嫌抄袭重复的文案剔除,导致制作的网页或服务器,出现较多相同文案,不利于用户快速找寻需要的文案,造成网页杂乱,有效文案被挤到网页靠后的位置,找寻不便。因此,本领域技术人员提供了一种基于大数据的信息分析方法,以解决上述背景技术中提出的问题。
发明内容
本发明的目的在于提供一种基于大数据的信息分析方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于大数据的信息分析方法,其信息分析方法为以下步骤:
S1、用户发布数据:用户登录对应的大数据客户端,把想提交发布的信息,编撰成文案提交,等待后续的审核;
S2、大数据信息接收并传输到云存储:大数据端接收文案,并存储到云存储;
S3、发送到筛选服务器:把接收的文案发送到筛选服务器,筛选服务器运行;
S4、筛选数据信息:通过筛选服务器筛分,剔除系统判定违规重复的文案,文案未判定违规重复直接进入下一步,文案判定违规重复,如用户不再次提交,文案作废并保存到云存储,如用户再次提交后,进入大数据的信息分析人工审核区,如通过人工审核直接进入下一步,如人工审核未通过,文案作废并保存到云存储;
S5、发送到服务器分类保存到资源盘:把筛分后合格的文案发送到服务器,服务器根据类目进行资源分类整理,分类整理后保存到资源盘;
S6、用户提交资源获取请求:用户需要资源时,登录客户端,发送资源获取请求;
S7、服务器提取资源盘对应信息提交到用户手中:服务器根据搜索关键字提取资源盘对应信息并推荐给用户,用户根据需要选取需要的资源。
作为本发明进一步的方案:所述S2与S4中的云存储为临时存储数据信息,接收时间往后推迟三个月为数据信息有效时间,三个月后自动删除数据信息,做出垃圾清理操作。
作为本发明再进一步的方案:所述S4中筛选不过关的文案可有五次再次提交的机会,五次再次提交人工审核不通过,用户应该重新撰写文案,重新发布数据。
作为本发明再进一步的方案:所述S4中人工审核,采用半人工审核,首先通过二级筛选服务器,筛分出明确违规重复的文案,所述二级筛选服务器的筛分限定值小于筛选服务器的筛分限定值,最大限度的避免剔除出错,二级筛选服务器筛分后,人工客服审核文案。
与现有技术相比,本发明的有益效果是:本发明基于大数据的信息分析方法,信息分析方法通过服务器首次筛选后,对通过文案再次筛审核的机会,且有五次人工审核,能把筛选后不合格的文案云盘保存三个月然后作废,便于用户对不合格文案的修改、重写,增加使用的人性化,增加发布用户的积极性,避免用户下降,审核机会较多,且对争议文案人工审核,避免合规优质文案得不到发表,且对涉嫌抄袭重复的文案剔除,避免制作的网页或服务器出现较多相同文案,有利于用户快速找寻需要的文案,避免网页杂乱。
附图说明
图1为一种基于大数据的信息分析方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中,一种基于大数据的信息分析方法,其信息分析方法为以下步骤:
S1、用户发布数据:用户登录对应的大数据客户端,登录时,需要进行账号填写、短信验证或邮箱验证,最后输入登录密码,即可进入网页客户端,用户打开信息发布页面,把想提交发布的信息,编撰成文案提交,等待后续的审核;
S2、大数据信息接收并传输到云存储:用户发布的文案被客户端大数据端接收,并把数据信息存储到云存储,且以草稿的形式保存,未审核前用户需要对文案进行修改时,可通过客户端草稿页面,提取文案进行修改,修改后再次交发布的信息,避免做出不避要的后续筛选过程节约时间;
S3、发送到筛选服务器:当S2中云存储内部文案到达设定筛选时间时,把接收的文案发送到筛选服务器,当服务器一次接受的文案到达设定数量后,文案停止发送,筛选服务器运行,准备下一次工作;
S4、筛选数据信息:服务器对设定数量批次的文案进行筛分,剔除系统判定违规重复的文案,违规文件包括侵权、恐吓谩骂言论、设黄、有损国家尊严、涉及国家安全等文案,重复文件相似度超过90%、段落置换、换标题、换图片等涉及重复的文案,未判定违规重复的直接进入下一步,文案判定违规重复,如用户不再次提交,文案作废并保存到云存储,如用户再次提交后,进入大数据的信息分析人工审核区,如通过人工审核直接进入下一步,如人工审核未通过,文案作废并保存到云存储,此云存储与S2的云存储相同为草稿形式保存;
S5、发送到服务器分类保存到资源盘:把筛分后合格的文案发送到服务器,此服务器为文案展示服务器,服务器根据类目进行资源分类整理,分类整理后保存到资源盘,分类与一般网页的分类相同,生活、餐饮、住房、娱乐等详细类目;
S6、用户提交资源获取请求:用户需要资源时,登录对应的大数据客户端,登录时可使用市面上百度、搜狗、谷歌、QQ等程序登录,登录需要进行账号申请、账号填写、短信验证或邮箱验证最后输入登录密码,即可进入网页客户端,在网页内搜索页面,发送资源获取请求;
S7、服务器提取资源盘对应信息提交到用户手中:服务器根据搜索关键字提取资源盘对应信息并推荐给用户,用户可根据搜索设定,设定筛选优选项,时间、采用量、随机推荐等筛选项,用户根据需要自发选取需要的资源。
进一步的:S2与S4中的云存储为临时存储数据信息,接收时间往后推迟三个月为数据信息有效时间,三个月后自动删除数据信息,做出垃圾清理操作,保证用户做出的文案不被误删,用户可便捷快速的找回做出的文案,节省用户的时间。
再进一步的:S4中筛选不过关的文案可有五次再次提交的机会,五次再次提交人工审核不通过,用户应该重新撰写文案,重新发布数据,在第一次提交前,打开云存储内部退还的文案,对退还的文案检查其违规项,并对违规项进行修改,修改后再次提交,进行人工审核,如通过人工审核直接进入下一步,如人工审核未通过,文案作废并保存到云存储,此云存储与S2的云存储相同为草稿形式保存,在第二次提交前,打开云存储内部退还的文案,对退还的文案检查其违规项,并对违规项进行修改,修改后再次提交,此提交可有五次修改提交的机会,如在五次机会内不再修改提交,文案作废并保存到云存储保留三个月,最后一次修改后推三个月为限可修改提交,最后一次修改到文案不再修改提交超过三个月,文案完全作废。
再进一步的:S4中人工审核,采用半人工审核,首先通过二级筛选服务器,筛分出明确违规重复的文案,二级筛选服务器的筛分限定值小于筛选服务器的筛分限定值,最大限度的避免剔除出错,二级筛选服务器筛分后,人工客服审核文案,审核期内,用户可自行电话端、网页端、邮箱端与客服沟通,进行问题答复,对有要求者,客服可对具体违规项进行问题指出,形成人性化的审核,避免智能剔除优秀不违规文案。
实施例1
S1、用户发布数据:用户登录对应的大数据客户端,把想提交发布的信息,编撰成文案提交,等待后续的审核;
S2、大数据信息接收并传输到云存储:大数据端接收文案,并存储到云存储;
S3、发送到筛选服务器:把接收的文案发送到筛选服务器,筛选服务器运行;
S4、筛选数据信息:通过筛选服务器筛分,剔除系统判定违规重复的文案,文案未判定违规重复直接进入下一步;
S5、发送到服务器分类保存到资源盘:把筛分后合格的文案发送到服务器,服务器根据类目进行资源分类整理,分类整理后保存到资源盘;
S6、用户提交资源获取请求:用户需要资源时,登录客户端,发送资源获取请求;
S7、服务器提取资源盘对应信息提交到用户手中:服务器根据搜索关键字提取资源盘对应信息并推荐给用户,用户根据需要选取需要的资源。
实施例2
S1、用户发布数据:用户登录对应的大数据客户端,把想提交发布的信息,编撰成文案提交,等待后续的审核;
S2、大数据信息接收并传输到云存储:大数据端接收文案,并存储到云存储;
S3、发送到筛选服务器:把接收的文案发送到筛选服务器,筛选服务器运行;
S4、筛选数据信息:通过筛选服务器筛分,剔除系统判定违规重复的文案,文案判定违规重复为,文案作废并保存到云存储。
实施例3
S1、用户发布数据:用户登录对应的大数据客户端,把想提交发布的信息,编撰成文案提交,等待后续的审核;
S2、大数据信息接收并传输到云存储:大数据端接收文案,并存储到云存储;
S3、发送到筛选服务器:把接收的文案发送到筛选服务器,筛选服务器运行;
S4、筛选数据信息:通过筛选服务器筛分,剔除系统判定违规重复的文案,文案判定违规重复,用户再次提交后,进入大数据的信息分析人工审核区,如通过人工审核直接进入下一步,如人工审核未通过,文案作废并保存到云存储,筛选不过关的文案可有五次再次提交的机会,五次再次提交人工审核不通过,用户应该重新撰写文案,重新发布数据;
S5、发送到服务器分类保存到资源盘:把筛分后合格的文案发送到服务器,服务器根据类目进行资源分类整理,分类整理后保存到资源盘;
S6、用户提交资源获取请求:用户需要资源时,登录客户端,发送资源获取请求;
S7、服务器提取资源盘对应信息提交到用户手中:服务器根据搜索关键字提取资源盘对应信息并推荐给用户,用户根据需要选取需要的资源。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (4)

1.一种基于大数据的信息分析方法,其特征在于,其信息分析方法为以下步骤:
S1、用户发布数据:用户登录对应的大数据客户端,把想提交发布的信息,编撰成文案提交,等待后续的审核;
S2、大数据信息接收并传输到云存储:大数据端接收文案,并存储到云存储;
S3、发送到筛选服务器:把接收的文案发送到筛选服务器,筛选服务器运行;
S4、筛选数据信息:通过筛选服务器筛分,剔除系统判定违规重复的文案,文案未判定违规重复直接进入下一步,文案判定违规重复,如用户不再次提交,文案作废并保存到云存储,如用户再次提交后,进入大数据的信息分析人工审核区,如通过人工审核直接进入下一步,如人工审核未通过,文案作废并保存到云存储;
S5、发送到服务器分类保存到资源盘:把筛分后合格的文案发送到服务器,服务器根据类目进行资源分类整理,分类整理后保存到资源盘;
S6、用户提交资源获取请求:用户需要资源时,登录客户端,发送资源获取请求;
S7、服务器提取资源盘对应信息提交到用户手中:服务器根据搜索关键字提取资源盘对应信息并推荐给用户,用户根据需要选取需要的资源。
2.根据权利要求1所述的一种基于大数据的信息分析方法,其特征在于,所述S2与S4中的云存储为临时存储数据信息,接收时间往后推迟三个月为数据信息有效时间,三个月后自动删除数据信息,做出垃圾清理操作。
3.根据权利要求1所述的一种基于大数据的信息分析方法,其特征在于,所述S4中筛选不过关的文案可有五次再次提交的机会,五次再次提交人工审核不通过,用户应该重新撰写文案,重新发布数据。
4.根据权利要求1所述的一种基于大数据的信息分析方法,其特征在于,所述S4中人工审核,采用半人工审核,首先通过二级筛选服务器,筛分出明确违规重复的文案,所述二级筛选服务器的筛分限定值小于筛选服务器的筛分限定值,最大限度的避免剔除出错,二级筛选服务器筛分后,人工客服审核文案。
CN202011063327.5A 2020-09-30 2020-09-30 一种基于大数据的信息分析方法 Pending CN112182392A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011063327.5A CN112182392A (zh) 2020-09-30 2020-09-30 一种基于大数据的信息分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011063327.5A CN112182392A (zh) 2020-09-30 2020-09-30 一种基于大数据的信息分析方法

Publications (1)

Publication Number Publication Date
CN112182392A true CN112182392A (zh) 2021-01-05

Family

ID=73949293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011063327.5A Pending CN112182392A (zh) 2020-09-30 2020-09-30 一种基于大数据的信息分析方法

Country Status (1)

Country Link
CN (1) CN112182392A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114124974A (zh) * 2021-09-30 2022-03-01 平安普惠企业管理有限公司 一种静态资源发布方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101409594A (zh) * 2008-09-26 2009-04-15 深圳和勤信息技术有限公司 一种通过网络播放音乐及同步伴随信息的方法及系统
CN106815730A (zh) * 2016-12-08 2017-06-09 赵云龙 商务资讯信息网络交互方法及系统
CN108399260A (zh) * 2018-03-12 2018-08-14 上海哔哩哔哩科技有限公司 商品信息管理方法、服务器及商品信息管理系统
CN109660828A (zh) * 2018-09-27 2019-04-19 深圳壹账通智能科技有限公司 视频资源管理方法、设备及计算机可读存储介质
CN109857932A (zh) * 2019-01-21 2019-06-07 深圳中利汇信息技术有限公司 一种基于云计算的资源管理系统
CN111259424A (zh) * 2020-01-16 2020-06-09 泰康保险集团股份有限公司 产品创建的处理方法、装置、设备及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101409594A (zh) * 2008-09-26 2009-04-15 深圳和勤信息技术有限公司 一种通过网络播放音乐及同步伴随信息的方法及系统
CN106815730A (zh) * 2016-12-08 2017-06-09 赵云龙 商务资讯信息网络交互方法及系统
CN108399260A (zh) * 2018-03-12 2018-08-14 上海哔哩哔哩科技有限公司 商品信息管理方法、服务器及商品信息管理系统
CN109660828A (zh) * 2018-09-27 2019-04-19 深圳壹账通智能科技有限公司 视频资源管理方法、设备及计算机可读存储介质
CN109857932A (zh) * 2019-01-21 2019-06-07 深圳中利汇信息技术有限公司 一种基于云计算的资源管理系统
CN111259424A (zh) * 2020-01-16 2020-06-09 泰康保险集团股份有限公司 产品创建的处理方法、装置、设备及计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114124974A (zh) * 2021-09-30 2022-03-01 平安普惠企业管理有限公司 一种静态资源发布方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US11546364B2 (en) Phishing data item clustering and analysis
US8620875B2 (en) Fraud analysis in a contact database
US10740563B2 (en) System and methods for text classification
US20210004795A1 (en) Anomaly and fraud detection using duplicate event detector
US9965937B2 (en) External malware data item clustering and analysis
US20140207786A1 (en) System and methods for computerized information governance of electronic documents
CN111090776A (zh) 一种视频审核的方法、装置、审核服务器和存储介质
CN106682096A (zh) 一种日志数据的管理方法和装置
CN102077201A (zh) 用于网页的动态及实时归类的系统及方法
US8484217B1 (en) Knowledge discovery appliance
CN102833111B (zh) 一种可视化http数据监管方法及装置
CN107784083A (zh) 一种网络舆情信息有效性的自动识别处理方法
US20220172204A1 (en) Transaction auditing using token extraction and model matching
CN102945246A (zh) 网络信息数据的处理方法及装置
CN115982012A (zh) 一种接口管理能力成熟度的评估模型及方法
WO2023273303A1 (zh) 基于树模型的事件影响度获取方法、装置及计算机设备
CN104754374A (zh) 音视频文件检测管理方法及装置
Gurav et al. Survey on automated system for fake news detection using NLP & machine learning approach
CN113221535B (zh) 情报处理方法、装置、计算机设备和存储介质
CN112182392A (zh) 一种基于大数据的信息分析方法
CN106330661A (zh) 一种数据集中处理方法
CN113157729A (zh) 批量邮件自动处理方法和装置
US11895137B2 (en) Phishing data item clustering and analysis
Lee Technology-based practical blockchain system audit maturity model
CN114022053B (zh) 一种基于风险因子的审计系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination