CN116561188B - 一种具有筛选功能的大数据分析方法 - Google Patents

一种具有筛选功能的大数据分析方法 Download PDF

Info

Publication number
CN116561188B
CN116561188B CN202310378266.9A CN202310378266A CN116561188B CN 116561188 B CN116561188 B CN 116561188B CN 202310378266 A CN202310378266 A CN 202310378266A CN 116561188 B CN116561188 B CN 116561188B
Authority
CN
China
Prior art keywords
module
data
screening
displayed
requirements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310378266.9A
Other languages
English (en)
Other versions
CN116561188A (zh
Inventor
杨启元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Lianshi Legend Network Technology Co ltd
Original Assignee
Beijing Lianshi Legend Network Technology Co ltd
Filing date
Publication date
Application filed by Beijing Lianshi Legend Network Technology Co ltd filed Critical Beijing Lianshi Legend Network Technology Co ltd
Priority to CN202310378266.9A priority Critical patent/CN116561188B/zh
Publication of CN116561188A publication Critical patent/CN116561188A/zh
Application granted granted Critical
Publication of CN116561188B publication Critical patent/CN116561188B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种具有筛选功能的大数据分析方法,包括以下步骤,S1:数据获取阶段:获取模块对通过客户信息库和移动端模块对客户的相关信息进行获取,获取到信息将通过整合模块汇集整合至目标数据库内;S2:数据筛选阶段:利用大数据服务器接入互联网大数据,然后利用分析模块和筛选模块对相关的数据进行初步筛选;S21:不符合筛选要求的数据将会经删除模块自动删除;S22:符合要求的数据将会通过第一展示模块展示出来,并存储在数据区模块内。该具有筛选功能的大数据分析方法,获取模块可通过客户信息库以及移动端模块对客户的数据进行多来源获取,同时整合模块可将并将获取的进行集中整合,进而便于丰富对比样本同时便于保证资源获取的全面性。

Description

一种具有筛选功能的大数据分析方法
技术领域
本发明涉及具有大数据分析技术领域,具体为一种具有筛选功能的大数据分析方法。
背景技术
大数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。经检索,发现现有技术中的大数据分析方法典型的如公开号CN114092224A一种大数据分析方法及装置,应用于大数据技术领域,其中该方法包括:接收待分析数据、再抽样子样本数目、计算统计量集合、模型评价指标、再抽样子样本数目、计算统计量集合、模型评价指标、结果整合方法及预设结果精度;循环确定最优样本数据,每个循环周期均执行以下操作:对待分析数据进行再抽样,得到周期子样本;根据计算统计量集合,得到周期子样本计算结果;根据模型评价指标,得到周期子样本计算结果精度;根据结果整合方法,将每一周期的子样本计算结果精度进行整合,得到周期整合结果精度;周期整合结果精度达到预设结果精度时,得到最优样本数据。本发明可以高效准确地进行大数据分析得到高精度的样本数据,使得在硬件有限的条件下进行高效准确地建模。
现有的大数据分析方法在分析数据时为了提高分析效率和关联度,大多是通过对比抽样样本的方式进行数据获取,而利用对比样本的方式分析大数据使得获取资源不够全面,另一方面现有的筛选对比方式程序单一,从而在筛选过程中存在一定的数据遗漏的问题,现有的针对上述问题,需要对现有设备进行改进。
发明内容
本发明的目的在于提供一种具有筛选功能的大数据分析方法,以解决上述背景技术中提出的现现有的大数据分析方法在分析数据时为了提高分析效率和关联度,大多是通过对比抽样样本的方式进行数据获取,而利用对比样本的方式分析大数据使得获取资源不够全面的问题。
为实现上述目的,本发明提供如下技术方案:一种具有筛选功能的大数据分析方法,包括以下步骤,其特征在于:
S1:数据获取阶段:
获取模块对通过客户信息库和移动端模块对客户的相关信息进行获取,获取到信息将通过整合模块汇集整合至目标数据库内;
S2:数据筛选阶段:
利用大数据服务器接入互联网大数据,然后利用分析模块和筛选模块对相关的数据进行初步筛选;
S21:不符合筛选要求的数据将会经删除模块自动删除;
S22:符合要求的数据将会通过第一展示模块展示出来,并存储在数据区模块内。
S3:数据对比阶段:
利用对比模块对数据区模块内的数据与现有的目标数据库内的数据进行对比;
S31:利用复检模块将对比之后的资源进行复检;
S4:利用通过关联度排列模块将资源进行排列;
S41:利用加密模块对即将进行传送的数据进行加密。
优选的,利用大数据服务器接入互联网大数据,分析模块将对接入的大数据进行分析处理,接着筛选模块将对分析之后相关的数据进行初步筛选。
优选的,删除模块将会把不符合筛选要求的数据自动删除,符合要求的数据将会通过第一展示模块展示出来,并存储在数据区模块内。
优选的,对比模块对数据区模块内的数据与现有的目标数据库内的数据进行对比,当数据区模块内数据不符合目标数据库内任一偏好数据时,忽略模块将会对相应的资源进行忽略,符合偏好需求的数据将会通过第二展示模块展示出来。
优选的,复检模块将会对展示的资源进行复检,符合复检要求的数据将会通过第三展示模块展示出来,不符合要求的数据若三次均未通过对比模块的对比分析之后将会再次忽略。
优选的,第三展示模块展示的内容选择通过关联度排列模块按数据关联度排列,也通过时间排列模块按数据发布时间前后排列。
优选的,所述第三展示模块包括关联度排列模块和时间排列模块,且关联度排列模块和时间排列模块均与分类模块连接。
优选的,分类模块将会把分类之后的数据存储至第二存储模块的内部。
优选的,加密模块将第二存储模块内的数据进行加密然后通过发送模块发送给客户,同时根据需求选择使用数字加密模块进行数字加密,或者利用文字加密模块进行文字加密。
与现有技术相比,本发明的有益效果是:该具有筛选功能的大数据分析方法,
(1)本发明通过客户信息库、移动端模块、获取模块以及整合模块的配合使用可有效解决现有的大数据分析方法在分析数据时为了提高分析效率和关联度,大多是通过对比抽样样本的方式进行数据获取,而利用对比样本的方式分析大数据使得获取资源不够全面的问题,获取模块可通过客户信息库以及移动端模块对客户的数据进行多来源获取,同时整合模块可将并将获取的进行集中整合,进而便于丰富对比样本,同时便于保证资源获取的全面性。
(2)本发明通过筛选模块和对比模块的配合使用可有效解决大数据容易因接入资源复杂重复而导致分析效率低的问题,筛选模块可对大数据服务器接入获取的信息进行筛选,对比模块可避免重复以及无用的数据反复与目标数据库内的数据进行对比,进而便于提高分析效率,同时重复以及无用的数据将会在筛选和对比时通过删除模块和忽略模块删除忽略掉,从而便于减少展示的资源,进而便于更加直观的通过相关的展示模块对资源进行查看获取。
(3)本发明通过对比模块、复检模块和第三展示模块的配合使用可有效解决现有的筛选对比方式程序单一,从而存在一定的数据遗漏的问题,复检模块可对用于第三展示模块展示的数据即经过筛选和对比的数据进行再次进行复检,符合复检要求的数据将会通过第三展示模块展示出来,不符合复检要求的数据将再次输出至对比模块内进行再次对比,若不符合复检要求的数据三次均未通过对比模块的对比分析之后将会由忽略模块再次忽略,从而可在一定程度上避免出现数据遗漏的问题。
(4)本发明通过第三展示模块、关联度排列模块、时间排列模块和分类模块的配合使用可有效解决分析获取的最终数据展示即查看方式单一,不便于满足使用者多样化的查看需求的问题,可利用第三展示模块内的关联度排列模块将最终数据按照与样本的关联度的高低从前至后进行排列,也可通过时间排列模块按照数据发布日期从新到旧进行排列,进而便于对相关数据进行快速准确找寻。
附图说明
图1为本发明筛选模块的工作流程示意图;
图2为本发明目标数据库生成工作流程示意图;
图3为本发明数据区模块、对比模块、目标数据库和第三展示模块之间的控制关系工作流程示意图;
图4为本发明复检模块的工作流程示意图;
图5为本发明第三展示模块和第二存储模块之间的输出关系工作流程示意图;
图6为本发明加密模块的构成以及输入输出关系工作流程示意图。
图中:1、客户信息库;2、移动端模块;3、获取模块;4、整合模块;5、目标数据库;6、大数据服务器;7、分析模块;8、筛选模块;9、第一展示模块;10、删除模块;11、数据区模块;12、对比模块;13、第二展示模块;14、忽略模块;15、复检模块;16、第三展示模块;17、关联度排列模块;18、时间排列模块;19、分类模块;20、第二存储模块;21、加密模块;22、数字加密模块;23、文字加密模块;24、发送模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-6,本发明提供一种技术方案:一种具有筛选功能的大数据分析方法,包括以下步骤,S1:数据获取阶段:
获取模块3对通过客户信息库1和移动端模块2对客户的相关信息进行获取,获取到信息将通过整合模块4汇集整合至目标数据库5内;
S2:数据筛选阶段:
利用大数据服务器6接入互联网大数据,然后利用分析模块7和筛选模块8对相关的数据进行初步筛选;
S21:不符合筛选要求的数据将会经删除模块10自动删除;
S22:符合要求的数据将会通过第一展示模块9展示出来,并存储在数据区模块11内。
S3:数据对比阶段:
利用对比模块12对数据区模块11内的数据与现有的目标数据库5内的数据进行对比;
S31:利用复检模块15将对比之后的资源进行复检;
S4:利用通过关联度排列模块17将资源进行排列;
S41:利用加密模块21对即将进行传送的数据进行加密。
利用大数据服务器6接入互联网大数据,分析模块7将对接入的大数据进行分析处理,接着筛选模块8将对分析之后相关的数据进行初步筛选。
删除模块10将会把不符合筛选要求的数据自动删除,符合要求的数据将会通过第一展示模块9展示出来,并存储在数据区模块11内。
对比模块12对数据区模块11内的数据与现有的目标数据库5内的数据进行对比,当数据区模块11内数据不符合目标数据库5内任一偏好数据时,忽略模块14将会对相应的资源进行忽略,符合偏好需求的数据将会通过第二展示模块13展示出来。
复检模块15将会对展示的资源进行复检,符合复检要求的数据将会通过第三展示模块16展示出来,不符合要求的数据若三次均未通过对比模块12的对比分析之后将会再次忽略。
第三展示模块16展示的内容选择通过关联度排列模块17按数据关联度排列,也通过时间排列模块18按数据发布时间前后排列。
第三展示模块16包括关联度排列模块17和时间排列模块18,且关联度排列模块17和时间排列模块18均与分类模块19连接。
分类模块19将会把分类之后的数据存储至第二存储模块20的内部。
加密模块21将第二存储模块20内的数据进行加密然后通过发送模块24发送给客户,同时根据需求选择使用数字加密模块22进行数字加密,或者利用文字加密模块23进行文字加密。
如图1、图2、图3、图4、图5和图6所示,在实际工作过程中,获取模块3可对通过客户信息库1和移动端模块2对客户之前的相关信息进行获取,获取到信息将通过整合模块4汇集整合至目标数据库5内,利用大数据服务器6接入网络大数据,分析模块7将对接入的大数据进行分析处理,接着筛选模块8将对分析之后相关的数据进行初步筛选,不符合筛选要求的数据将会输入删除模块10内,并经删除模块10自动完成删除,符合要求的数据将会通过第一展示模块9展示出来,并存储在数据区模块11内,对比模块12可将数据区模块11内的数据与现有的目标数据库5内的数据进行对比,当数据区模块11内数据不符合目标数据库5内任一偏好数据时,忽略模块14将会对相应的资源进行忽略,符合偏好需求的数据将会通过第二展示模块13展示出来,紧接着复检模块15将会对展示的资源进行复检,符合复检要求的数据将会通过第三展示模块16展示出来,不符合要求的数据若三次均未通过对比模块12的对比分析之后将会再次忽略,第三展示模块16展示的内容可选择通过关联度排列模块17按数据关联度的高低将其进行排列,也可通过时间排列模块18按数据发布时间前后将其进行排列,排列之后的数据经分类模块19分类之后将会存储至第二存储模块20的内部,接着可利用加密模块21将第二存储模块20内的数据进行加密然后通过发送模块24发送给客户,客户可在解密之后查看接收到的数据。
尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种具有筛选功能的大数据分析方法,包括以下步骤,其特征在于:
S1:数据获取阶段:
获取模块(3)对通过客户信息库(1)和移动端模块(2)对客户的相关信息进行获取,获取到信息将通过整合模块(4)汇集整合至目标数据库(5)内;
S2:数据筛选阶段:
利用大数据服务器(6)接入互联网大数据,然后利用分析模块(7)和筛选模块(8)对相关的数据进行初步筛选;
S21:不符合筛选要求的数据将会经删除模块(10)自动删除;
S22:符合要求的数据将会通过第一展示模块(9)展示出来,并存储在数据区模块(11)内;
S3:数据对比阶段:
利用对比模块(12)对数据区模块(11)内的数据与现有的目标数据库(5)内的数据进行对比;
S31:利用复检模块(15)将对比之后的资源进行复检;
S4:利用通过关联度排列模块(17)将资源进行排列;
S41:利用加密模块(21)对即将进行传送的数据进行加密;利用大数据服务器(6)接入互联网大数据,分析模块(7)将对接入的大数据进行分析处理,接着筛选模块(8)将对分析之后相关的数据进行初步筛选;删除模块(10)将会把不符合筛选要求的数据自动删除,符合要求的数据将会通过第一展示模块(9)展示出来,并存储在数据区模块(11)内;对比模块(12)对数据区模块(11)内的数据与现有的目标数据库(5)内的数据进行对比,当数据区模块(11)内数据不符合目标数据库(5)内任一偏好数据时,忽略模块(14)将会对相应的资源进行忽略,符合偏好需求的数据将会通过第二展示模块(13)展示出来;复检模块(15)将会对展示的资源进行复检,符合复检要求的数据将会通过第三展示模块(16)展示出来,不符合要求的数据若三次均未通过对比模块(12)的对比分析之后将会再次忽略;第三展示模块(16)展示的内容选择通过关联度排列模块(17)按数据关联度排列,也通过时间排列模块(18)按数据发布时间前后排列;所述第三展示模块(16)包括关联度排列模块(17)和时间排列模块(18),且关联度排列模块(17)和时间排列模块(18)均与分类模块(19)连接;分类模块(19)将会把分类之后的数据存储至第二存储模块(20)的内部;加密模块(21)将第二存储模块(20)内的数据进行加密然后通过发送模块(24)发送给客户,同时根据需求选择使用数字加密模块(22)进行数字加密,或者利用文字加密模块(23)进行文字加密。
CN202310378266.9A 2023-04-11 一种具有筛选功能的大数据分析方法 Active CN116561188B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310378266.9A CN116561188B (zh) 2023-04-11 一种具有筛选功能的大数据分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310378266.9A CN116561188B (zh) 2023-04-11 一种具有筛选功能的大数据分析方法

Publications (2)

Publication Number Publication Date
CN116561188A CN116561188A (zh) 2023-08-08
CN116561188B true CN116561188B (zh) 2024-06-11

Family

ID=

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109901A (zh) * 2018-02-02 2019-08-09 北京京东尚科信息技术有限公司 筛选目标对象的方法和装置
CN112101977A (zh) * 2020-07-01 2020-12-18 上海世强信息技术有限公司 一种精准的大数据分析方法
CN112231419A (zh) * 2020-10-28 2021-01-15 南京謇张大数据科技有限公司 一种大数据分析方法
CN113190670A (zh) * 2021-05-08 2021-07-30 重庆第二师范学院 一种基于大数据平台的信息展示方法及系统
WO2021217626A1 (zh) * 2020-04-30 2021-11-04 上海华东汽车信息技术有限公司 车辆数据处理方法、装置、计算机设备和存储介质
CN114661705A (zh) * 2022-04-15 2022-06-24 广州双知网络科技有限公司 一种基于云计算的大数据分析系统
CN114996486A (zh) * 2021-03-02 2022-09-02 腾讯科技(深圳)有限公司 一种数据推荐方法、装置、服务器以及存储介质
CN115098599A (zh) * 2022-06-20 2022-09-23 启明信息技术股份有限公司 一种基于多维度用户偏好标签画像分析方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109901A (zh) * 2018-02-02 2019-08-09 北京京东尚科信息技术有限公司 筛选目标对象的方法和装置
WO2021217626A1 (zh) * 2020-04-30 2021-11-04 上海华东汽车信息技术有限公司 车辆数据处理方法、装置、计算机设备和存储介质
CN112101977A (zh) * 2020-07-01 2020-12-18 上海世强信息技术有限公司 一种精准的大数据分析方法
CN112231419A (zh) * 2020-10-28 2021-01-15 南京謇张大数据科技有限公司 一种大数据分析方法
CN114996486A (zh) * 2021-03-02 2022-09-02 腾讯科技(深圳)有限公司 一种数据推荐方法、装置、服务器以及存储介质
CN113190670A (zh) * 2021-05-08 2021-07-30 重庆第二师范学院 一种基于大数据平台的信息展示方法及系统
CN114661705A (zh) * 2022-04-15 2022-06-24 广州双知网络科技有限公司 一种基于云计算的大数据分析系统
CN115098599A (zh) * 2022-06-20 2022-09-23 启明信息技术股份有限公司 一种基于多维度用户偏好标签画像分析方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
融合关联数据和分众分类的徽州文化数字资源多维度聚合研究;王伟;许鑫;;图书情报工作;20150720(第14期);第33-38+60页 *

Similar Documents

Publication Publication Date Title
CN104933095B (zh) 异构信息通用性关联分析系统及其分析方法
CN106708815B (zh) 数据处理方法、装置和系统
CN110659790A (zh) 实验管理与数据分析系统
WO2012155455A1 (zh) 一种基于web平台的日志分析方法及系统
CN111177544A (zh) 一种基于用户行为数据和用户画像数据的运营系统及方法
EP4358005A1 (en) Information recommendation method and apparatus based on data interaction, and device and storage medium
US20190197140A1 (en) Automation of sql tuning method and system using statistic sql pattern analysis
CN107370830B (zh) 基于大数据的行业信息推送系统及方法
CN111311190A (zh) 一种便于数据收集的实验数据管理方法
US20240144405A1 (en) Method for information interaction, device, and storage medium
CN114116872A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN116561188B (zh) 一种具有筛选功能的大数据分析方法
CN111159559A (zh) 根据用户需求和用户行为构建推荐引擎的方法
CN112598142B (zh) 一种风电机组检修工作质量审查辅助方法与系统
CN109271432A (zh) 报表数据的处理方法、装置、计算机设备和存储介质
CN116561188A (zh) 一种具有筛选功能的大数据分析方法
CN113204687A (zh) 质谱数据自动上传方法及终端设备
CN110310101A (zh) 一种警情案管信息系统
CN113901034A (zh) 一种自动识别行政非诉执行案源的方法
CN116089490A (zh) 数据分析方法、装置、终端和存储介质
US20240185370A1 (en) Method for information recommendation based on data interaction, device, and storage medium
CN112597207B (zh) 一种元数据管理系统
CN114661766A (zh) 基于云计算的大数据信息技术开发咨询服务系统
CN113642870B (zh) 基于信息化平台的数据分析系统及分析方法
CN111429987B (zh) 一种基于索引文件的搜索方法和装置

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20240517

Address after: Building 106, Lize Zhongyuan, Chaoyang District, Beijing, 100020 (No. 492, Wangjing Central Office Area)

Applicant after: Beijing Lianshi Legend Network Technology Co.,Ltd.

Country or region after: China

Address before: Building 15, No. 41 Jinlang Road, Langxia Town, Jinshan District, Shanghai, 200000 (Langxia Industrial Zone)

Applicant before: Shanghai Yulingshu Network Technology Co.,Ltd.

Country or region before: China

GR01 Patent grant