CN108932300A - 一种无限迭代的过滤分析方法、设备及存储介质 - Google Patents
一种无限迭代的过滤分析方法、设备及存储介质 Download PDFInfo
- Publication number
- CN108932300A CN108932300A CN201810587016.5A CN201810587016A CN108932300A CN 108932300 A CN108932300 A CN 108932300A CN 201810587016 A CN201810587016 A CN 201810587016A CN 108932300 A CN108932300 A CN 108932300A
- Authority
- CN
- China
- Prior art keywords
- node
- route
- filter
- filtration parameter
- filter condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
本发明涉及大数据领域,针对现有技术存在的问题,本发明提供一种无限迭代的过滤分析方法、设备及存储介质。本发明中对初始节点对应的原始数据,分别输入m个过滤条件,进行数据的查询过滤,并保存n个第一级节点对应的路线过滤参数;m大于等于n;基于上述任意一个第一级节点的路线过滤参数,重新输入r个过滤条件,形成s个第一级节点的子节点,即s个第二级节点;并保存s个第二级节点对应的路线过滤参数;重复上述过程,进行过滤条件设置,进行无限迭代,形成上一级的x个的子节点,即x个第y级节点,并保存x个第y级节点及对应的路线过滤参数值,直到到找到相关数据,并形成p条过滤路线。
Description
技术领域
本发明涉及大数据领域,尤其是一种无限迭代的过滤分析方法、设备及存储介质。
背景技术
随着互联网大数据时代的到来,在电商,互联网金融,企业服务,教育,旅游,医疗,物流等各大领域发生了翻天覆地的变化。海量用户被导入到各大信息化系统中。面向大数据的全局检索过滤分析在各种需求场景得以体现。人们通常做法是通过关键字在原始数据中进行全文检索得到与之匹配的信息集合。但是在一些高端需求场景里面临如下问题:
1.基于原始数据进行过滤,多次分析需要循环输入条件查询。通过特定过滤条件,将数亿,甚至百亿、千亿级数据源一步步缩减至几百万或者几十万、几万、甚至更小范围的数据集合。
2.基于原始数据进行过滤,面对大数据情况下,效率低,响应慢。
3.不容易形成步骤化、模型化的分析过滤思路。
4.作为单一过滤结果集,不便于形成对比分析和关联交互操作。
发明内容
本发明所要解决的技术问题是:针对现有技术存在的问题,提供一种无限迭代的过滤分析方法、设备及存储介质。选择一个需要分析过滤的数据集合,进行一次查询过滤,基于当前数据结果,再次输入查询条件进行过滤,如此反复,达到无限迭代过滤的效果。进一步的,通过图形化路线过滤分析,直观有效的展示出迭代过滤的全过程。
本发明采用的技术方案如下:
一种无限迭代的过滤分析方法包括:
对初始节点对应的原始数据,分别输入m个过滤条件,进行数据的查询过滤,并保存n个第一级节点对应的路线过滤参数;m大于等于n;n大于等于1;
基于上述任意一个第一级节点的路线过滤参数,重新输入r个过滤条件,形成s个第一级节点的子节点,即s个第二级节点;并保存s个第二级节点对应的路线过滤参数;r大于等于s, s大于等1;
重复上述过程,进行过滤条件设置,进行无限迭代,形成上一级的x个的子节点,即x个第y级节点,并保存x个第y级节点及对应的路线过滤参数值,直到到找到相关数据,并形成p条过滤路线。
进一步的,所说m个过滤条件中有至少一个与其他过滤条件重合时,则m大于n;当m个过滤条件完全不同时,则m等于n;r个过滤条件中有至少一个与其他过滤条件重合时,则r大于s;当r个过滤条件完全不同时,则r等于s。
进一步的,所述的方法还包括从保存的p条过滤路线中任意节点z的路线过滤参数中进行查询,得到该节点z路线过滤参数的相关信息。
进一步的,所述的方法还包括用户在查询后,需要继续过滤时,基于p条过滤路线中的任意节点z,输入新的过滤条件,进行再次迭代过滤,系统将自动保存过滤条件,形成该条过滤路线以及对应的路线过滤参数,并将其添加到相应的过滤路线中。
进一步的,于所述保存路线过滤参数是通过全局结构体方式实现。
进一步的,根据所述的方法还包括加载已经保存的全局结构体,进行数据路线图显示。
一种存储介质,其中存储有多条指令,所述指令适用于由处理器加载并执行任意一项所述的方法的步骤。
一种无限迭代的过滤分析设备包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适于由处理器加载并执行上述任意一项所述的方法。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.基于当前过滤结果的无限迭代查询,将海量数据缩减至易分析范围。
2.解决了每次过滤需要在原始数据中过滤的问题,迭代过滤是从上一次结果中进行,大大提高了响应速度。如图1所述。
3.自动存储过滤步骤,形成多分支的过滤分析路线。
4.路线化分析思路,支持任意步骤回归查询和二次迭代过滤,并保存。
5.相比过去在原始数据中过滤,越往后进行,所需要的条件愈发复杂,不够清晰。现在每一个步骤对应一个过滤条件和结果,通过结果及时发现输入的过滤条件的准确性,作到及时修正或重新迭代过滤。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明原理图。
图2是本发明实施例示意图
图3是本发明具体实施例示意图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
该方法包括:
一种无限迭代的过滤分析方法包括:
步骤1:对初始节点对应的原始数据,分别输入m个过滤条件,进行数据的查询过滤,并保存n个第一级子节点对应的路线过滤参数;m大于等于n;n大于等于1;
步骤2:基于上述任意一个第一级子节点的路线过滤参数,重新输入r个过滤条件,形成s个第一级子节点的子节点,即s个第二级子节点;并保存s个节点对应的路线过滤参数;r大于等于s, s大于等1;
步骤3:重复上述过程,进行过滤条件设置,进行无限迭代,形成上一级的x个的子节点,即x个第y级子节点,并保存x个子节点及对应的路线过滤参数值,直到到找到相关数据,并形成p条过滤路线。
步骤4:从保存的路线过滤参数中,选取任意节点查看历史过滤数据。
步骤5:基于步骤4,可进行二次迭代过滤;即,重新输入过滤条件进行一次迭代查询,生成新的路线分支,并保存。
步骤6:全局保存路线以及路线中包含的路线过滤参数。
步骤7:加载已经保存的路线过滤参数和路线,可以还原分析场景,持久化工作状态。
其中,步骤2中,基于上述任意一个第一级子节点的路线过滤参数,重新输入r个过滤条件,形成s个第一级子节点的子节点具体过程是:
对某一节点的数据进行过滤处理时,对该节点需要过滤的数据输入不同的过滤条件,形成该节点的下一个节点;同时在该节点位置记录该节点路线过滤参数,以及在下一界点记录对该节点对应的下一级节点的路线过滤参数;路线过滤参数记录过程分为:
其中第一级节点,即起始节点的路线过滤参数:节点编号以及原始数据;
起始节点之外的其他节点的线路过滤参数至少包括:该节点的过滤条件、节点编号、该节点过滤后的数据、以及该节点与下一级节点上下级关系。
实施例一:
1、如图2,节点*-***中,横杠前面数字表示原始数据的第几层级节点,横杠后边数字表示该节点的节点编号;例如7-014表示,数字7表示该节点是原始数据的第7层级节点,即该层级节点表示当前节点是原始数据经过7次过滤得到的节点;数字014表示当前节点编号是014,是用户操作的第14次过滤。
2、路线图形成过程:图2中原始节点通过节点1-001表示,原始节点通过两个不同过滤条件,形成两个第二级节点,通过节点2-002,节点2-003表示;
两个第二级节点中节点2-002通过两个不同过滤条件,形成两个第三级节点,分别通过3-004,3-005表示;两个第二级节点中节点2-003通过一个过滤条件形成一个第三级节点3-006;以此类推,形成29个过滤条件,有17个节点;
其中图2种输出某些过滤条件,形成如图3的路线图,例如1-001中输入被过滤数据是地球,过滤条件是中国或泰国;则分别在节点2-003过滤后的数据为泰国,2-002过滤后的数据为中国,以此输入各种过滤条件,最后可以得到玉溪地方对应的线路图,即地球、中国、云南、玉溪这个过滤条件的对应的路线。
3、路线图过滤条件的算法如下:如果某一个节点位于两个不同线路中,那么该节点里面就包括两个完全相同过滤条件;若某一节点位于三个不同线路中,则该节点就包括三个完全相同过滤条件; 例如2-002分别用于线路1和线路2,则2-002节点包括两个相同的过滤表达式。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。
Claims (8)
1.一种无限迭代的过滤分析方法,其特征在于包括:
对初始节点对应的原始数据,分别输入m个过滤条件,进行数据的查询过滤,并保存n个第一级节点对应的路线过滤参数;m大于等于n;n大于等于1;
基于上述任意一个第一级节点的路线过滤参数,重新输入r个过滤条件,形成s个第一级节点的子节点,即s个第二级节点;并保存s个第二级节点对应的路线过滤参数;r大于等于s, s大于等1;
重复上述过程,进行过滤条件设置,进行无限迭代,形成上一级的x个的子节点,即x个第y级节点,并保存x个第y级节点及对应的路线过滤参数值,直到到找到相关数据,并形成p条过滤路线。
2.根据权利要求1所述的方法,其特征在于所说m个过滤条件中有至少一个与其他过滤条件重合时,则m大于n;当m个过滤条件完全不同时,则m等于n;r个过滤条件中有至少一个与其他过滤条件重合时,则r大于s;当r个过滤条件完全不同时,则r等于s。
3.根据权利要求1或2所述的方法,其特征在于还包括从保存的p条过滤路线中任意节点z的路线过滤参数中进行查询,得到该节点z路线过滤参数的相关信息。
4.根据权利要求3所述的方法,其特征在于还包括用户在查询后,需要继续过滤时,基于p条过滤路线中的任意节点z,输入新的过滤条件,进行再次迭代过滤,系统将自动保存过滤条件,形成该条过滤路线以及对应的路线过滤参数,并将其添加到相应的过滤路线中。
5.根据权利要求1、2或4所述的方法,其特征在于所述保存路线过滤参数是通过全局结构体方式实现。
6.根据权利要求5所述的方法,其特征在于还包括加载已经保存的全局结构体,进行数据路线图显示。
7.一种存储介质,其中存储有多条指令,所述指令适用于由处理器加载并执行如权利要求1至6任意一项所述的方法的步骤。
8.一种无限迭代的过滤分析设备,其特征在于包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适于由处理器加载并执行上述权利要求1至6任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810587016.5A CN108932300B (zh) | 2018-06-06 | 2018-06-06 | 一种无限迭代的过滤分析方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810587016.5A CN108932300B (zh) | 2018-06-06 | 2018-06-06 | 一种无限迭代的过滤分析方法、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108932300A true CN108932300A (zh) | 2018-12-04 |
CN108932300B CN108932300B (zh) | 2022-05-27 |
Family
ID=64449549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810587016.5A Active CN108932300B (zh) | 2018-06-06 | 2018-06-06 | 一种无限迭代的过滤分析方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108932300B (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7412241B2 (en) * | 2003-06-06 | 2008-08-12 | Meshnetworks, Inc. | Method to provide a measure of link reliability to a routing protocol in an ad hoc wireless network |
US20100106398A1 (en) * | 2008-10-10 | 2010-04-29 | Eads Deutschland Gmbh | Computing-Time-Efficient Route Determination Along Several Preset Path Points with Given Connecting Routes In-Between |
CN102081675A (zh) * | 2011-01-27 | 2011-06-01 | 中国科学院计算技术研究所 | 支持Top K查询的自动服务组合方法及系统 |
CN102446179A (zh) * | 2010-10-09 | 2012-05-09 | Tcl集团股份有限公司 | 公交线路查询方法 |
CN102467545A (zh) * | 2010-11-16 | 2012-05-23 | 腾讯科技(深圳)有限公司 | 公交路线查询的方法及设备 |
CN102567413A (zh) * | 2010-12-31 | 2012-07-11 | 中国银联股份有限公司 | 数据过滤系统和方法 |
CN102609446A (zh) * | 2012-01-05 | 2012-07-25 | 厦门市美亚柏科信息股份有限公司 | 一种分布式Bloom过滤系统及其使用方法 |
CN102693317A (zh) * | 2012-05-29 | 2012-09-26 | 华为软件技术有限公司 | 数据挖掘流程生成方法及装置 |
CN103279544A (zh) * | 2013-06-05 | 2013-09-04 | 中国电子科技集团公司第十五研究所 | 树型结构数据在关系型数据库中的存储和查询方法及装置 |
CN103488655A (zh) * | 2012-06-13 | 2014-01-01 | 阿里巴巴集团控股有限公司 | 复合模型数据处理方法及系统 |
CN103632606A (zh) * | 2012-08-27 | 2014-03-12 | 联想(北京)有限公司 | 信息处理方法和装置 |
CN103729395A (zh) * | 2012-10-12 | 2014-04-16 | 国际商业机器公司 | 用于推断查询答案的方法和系统 |
CN104090962A (zh) * | 2014-07-14 | 2014-10-08 | 西北工业大学 | 面向海量分布式数据库的嵌套查询方法 |
CN104424253A (zh) * | 2013-08-28 | 2015-03-18 | 腾讯科技(深圳)有限公司 | 一种路径查询方法及装置、终端设备 |
CN105550241A (zh) * | 2015-12-07 | 2016-05-04 | 珠海多玩信息技术有限公司 | 多维数据库查询方法及装置 |
CN106339831A (zh) * | 2015-07-09 | 2017-01-18 | 阿里巴巴集团控股有限公司 | 用于为业务获取有效路径的方法及装置 |
CN107391691A (zh) * | 2017-07-26 | 2017-11-24 | 成都科来软件有限公司 | 一种网络分析中数据的过滤方法 |
-
2018
- 2018-06-06 CN CN201810587016.5A patent/CN108932300B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7412241B2 (en) * | 2003-06-06 | 2008-08-12 | Meshnetworks, Inc. | Method to provide a measure of link reliability to a routing protocol in an ad hoc wireless network |
US20100106398A1 (en) * | 2008-10-10 | 2010-04-29 | Eads Deutschland Gmbh | Computing-Time-Efficient Route Determination Along Several Preset Path Points with Given Connecting Routes In-Between |
CN102446179A (zh) * | 2010-10-09 | 2012-05-09 | Tcl集团股份有限公司 | 公交线路查询方法 |
CN102467545A (zh) * | 2010-11-16 | 2012-05-23 | 腾讯科技(深圳)有限公司 | 公交路线查询的方法及设备 |
CN102567413A (zh) * | 2010-12-31 | 2012-07-11 | 中国银联股份有限公司 | 数据过滤系统和方法 |
CN102081675A (zh) * | 2011-01-27 | 2011-06-01 | 中国科学院计算技术研究所 | 支持Top K查询的自动服务组合方法及系统 |
CN102609446A (zh) * | 2012-01-05 | 2012-07-25 | 厦门市美亚柏科信息股份有限公司 | 一种分布式Bloom过滤系统及其使用方法 |
CN102693317A (zh) * | 2012-05-29 | 2012-09-26 | 华为软件技术有限公司 | 数据挖掘流程生成方法及装置 |
CN103488655A (zh) * | 2012-06-13 | 2014-01-01 | 阿里巴巴集团控股有限公司 | 复合模型数据处理方法及系统 |
CN103632606A (zh) * | 2012-08-27 | 2014-03-12 | 联想(北京)有限公司 | 信息处理方法和装置 |
CN103729395A (zh) * | 2012-10-12 | 2014-04-16 | 国际商业机器公司 | 用于推断查询答案的方法和系统 |
CN103279544A (zh) * | 2013-06-05 | 2013-09-04 | 中国电子科技集团公司第十五研究所 | 树型结构数据在关系型数据库中的存储和查询方法及装置 |
CN104424253A (zh) * | 2013-08-28 | 2015-03-18 | 腾讯科技(深圳)有限公司 | 一种路径查询方法及装置、终端设备 |
CN104090962A (zh) * | 2014-07-14 | 2014-10-08 | 西北工业大学 | 面向海量分布式数据库的嵌套查询方法 |
CN106339831A (zh) * | 2015-07-09 | 2017-01-18 | 阿里巴巴集团控股有限公司 | 用于为业务获取有效路径的方法及装置 |
CN105550241A (zh) * | 2015-12-07 | 2016-05-04 | 珠海多玩信息技术有限公司 | 多维数据库查询方法及装置 |
CN107391691A (zh) * | 2017-07-26 | 2017-11-24 | 成都科来软件有限公司 | 一种网络分析中数据的过滤方法 |
Non-Patent Citations (4)
Title |
---|
BAUER R 等: "Fast and robust unidirectional routing", 《JOURNAL OF EXPERIMENTAL ALGORITHMICS (JEA)》 * |
吕建华 等: "选择-验证-过滤:一种迭代的子图包含查询处理机制", 《计算机研究与发展》 * |
孙莉 等: "列存储数据查询中的连接策略优化方法", 《计算机研究与发展》 * |
滕云等: "一种基于迭代优化的安全定位算法", 《传感技术学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN108932300B (zh) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9870382B2 (en) | Data encoding and corresponding data structure | |
US9275422B2 (en) | Distributed k-core view materialization and maintenance for graphs | |
EP3117379A1 (en) | Mapping attributes of keyed entities | |
CN105787126B (zh) | k-d树生成方法和k-d树生成装置 | |
CN105550225A (zh) | 索引构建方法、查询方法及装置 | |
CN107679049A (zh) | 获取树形结构数据两节点间路径的方法、装置及系统 | |
CN109658018A (zh) | 提高仓储出库效率的方法和装置 | |
CN108415912B (zh) | 基于MapReduce模型的数据处理方法和设备 | |
KR100898465B1 (ko) | 웹로그의 시계열 분석을 위한 데이터 저장 및 조회 방법그리고 상기 방법을 수행하는 시스템 | |
US10789277B2 (en) | Systems methods, and apparatuses for creating, linking and discovering business navigation maps for analyzing data | |
CN107451204B (zh) | 一种数据查询方法、装置及设备 | |
CN104794130B (zh) | 一种表间关联查询方法和装置 | |
CN106648839A (zh) | 数据处理的方法和装置 | |
CN105183824A (zh) | 数据整合方法及装置 | |
CN107704620A (zh) | 一种档案管理的方法、装置、设备和存储介质 | |
CN105868216A (zh) | 一种实现对象过期操作的方法、装置和设备 | |
Hamdi et al. | A pattern growth-based approach for mining spatiotemporal co-occurrence patterns | |
CN108932300A (zh) | 一种无限迭代的过滤分析方法、设备及存储介质 | |
KR101609915B1 (ko) | 다차원 시간차 분석 방법 및 장치 | |
KR20100092981A (ko) | 업무 흐름 처리 방법 및 장치 | |
CN105740365A (zh) | 一种数据仓库快速查询方法和装置 | |
CN109033210A (zh) | 一种挖掘地图兴趣点poi的方法和装置 | |
CN109597807A (zh) | 数仓表处理方法和装置 | |
CN106779909A (zh) | 物料匹配方法和装置 | |
CN110019225A (zh) | 数据处理的方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: 2119, 21st floor, unit 1, building 7, 1700 Tianfu Avenue North Section, high tech Zone, Chengdu, Sichuan 610000 Patentee after: Chengdu Fengwei Technology Co.,Ltd. Address before: 2119, 21st floor, unit 1, building 7, 1700 Tianfu Avenue North Section, high tech Zone, Chengdu, Sichuan 610000 Patentee before: CHENGDU SHENSI SCIENCE & TECHNOLOGY Co.,Ltd. |
|
CP01 | Change in the name or title of a patent holder |