CN116126245A - 数据动态存储方法、装置、电子设备及存储介质 - Google Patents
数据动态存储方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116126245A CN116126245A CN202310090910.2A CN202310090910A CN116126245A CN 116126245 A CN116126245 A CN 116126245A CN 202310090910 A CN202310090910 A CN 202310090910A CN 116126245 A CN116126245 A CN 116126245A
- Authority
- CN
- China
- Prior art keywords
- data table
- scored
- scoring
- node
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000004458 analytical method Methods 0.000 claims description 46
- 238000007726 management method Methods 0.000 claims description 14
- 230000002596 correlated effect Effects 0.000 claims description 9
- 230000000875 corresponding effect Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000013500 data storage Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 12
- 238000013523 data management Methods 0.000 abstract description 10
- 238000004590 computer program Methods 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000012797 qualification Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000013439 planning Methods 0.000 description 3
- 230000004931 aggregating effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本申请公开了一种数据动态存储方法、装置、电子设备及存储介质,所述的数据动态存储方法包括以下步骤:获取待评分数据表的操作信息,其中,所述待评分数据表存储于归档节点或计算节点;根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果;根据所述使用率评分结果对所述待评分数据表的存储位置进行调整。本申请解决了常规技术难以平衡大数据管理的成本和效率的技术问题。
Description
技术领域
本申请涉及金融科技(Fintech)的人工智能技术领域,尤其涉及一种数据动态存储方法、装置、电子设备及存储介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业大数据的分析和管理也有更高的要求。
在金融行业中,通过大数据,可以分析挖掘客户的交易和消费信息,掌握客户的消费习惯,准确预测客户的行为,提高金融机构的服务、营销和风控能力。然而,随着目前大数据服务器费用单价上升,为了节约成本,一个集群中往往会设置有计算节点和归档节点,其中,计算节点主要提供CPU、内存等计算资源,同时提供部分少量存储,归档节点主要提供存储空间,不提供或仅提供极少的计算资源。目前,在获得数据之后,会根据用户初始规划或者平台默认逻辑,将数据表自动导入到计算节点或归档节点中,然而,若计算节点中存储的数据过多,归档节点的服务器每T的存储成本是计算节点的服务器的七分之一左右,则会导致成本较高,但若用户需要操作保存在归档节点上的数据,则需要先将数据传输至计算节点,导致计算任务缓慢,数据表的操作效率较低,在计算性能上归档节点的服务器会损耗30%左右的效率。
发明内容
本申请的主要目的在于提供一种数据动态存储方法、装置、电子设备及存储介质,旨在解决常规技术难以平衡大数据管理的成本和效率的技术问题。
为实现上述目的,本申请提供一种数据动态存储方法,包括以下步骤:
获取待评分数据表的操作信息,其中,所述待评分数据表存储于归档节点或计算节点;
根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果;
根据所述使用率评分结果对所述待评分数据表的存储位置进行调整。
本申请还提供一种数据动态存储装置,所述数据动态存储装置包括:
获取模块,用于获取待评分数据表的操作信息,其中,所述待评分数据表存储于归档节点或计算节点;
评分模块,用于根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果;
存储位置调整模块,用于根据所述使用率评分结果对所述待评分数据表的存储位置进行调整。
本申请还提供一种电子设备,所述电子设备为实体设备,所述电子设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述的数据动态存储方法的程序,所述的数据动态存储方法的程序被处理器执行时可实现如上述的数据动态存储方法的步骤。
本申请还提供一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有实现数据动态存储方法的程序,所述的数据动态存储方法的程序被处理器执行时实现如上述的数据动态存储方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的数据动态存储方法的步骤。
本申请提供了一种数据动态存储方法、装置、电子设备及存储介质,通过获取待评分数据表的操作信息,其中,所述待评分数据表存储于归档节点或计算节点,实现了对已经存储于归档节点和计算节点中数据表的操作信息的获取,进而通过根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果,实现了对已经存储于归档节点和计算节点中数据表的使用率评分,进而通过根据所述使用率评分结果对所述待评分数据表的存储位置进行调整,实现了对已经存储于归档节点和计算节点中数据表的存储位置的评估和调整。相比于在获得数据后根据用户初始规划或者平台默认逻辑将数据表自动导入到计算节点或归档节点中的这种一次性存储方式,本申请在数据存储至归档节点或计算节点之后,通过对数据表进行使用率评分,实现了对归档节点和计算节点中数据表的存储位置是否合理进行再次评估,这样可以使得数据表的存储位置能够随数据表的操作情况而进行适应性调整,进而实现对大数据管理的成本和效率的动态调整,克服了若计算节点中存储的数据过多,归档节点的服务器每T的存储成本是计算节点的服务器的七分之一左右,则会导致成本较高,但若用户需要操作保存在归档节点上的数据,则需要先将数据传输至计算节点,导致计算任务缓慢,数据表的操作效率较低,在计算性能上归档节点的服务器会损耗30%左右的效率的技术缺陷,通过动态存储数据,有效兼顾了大数据管理的成本和效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图得到其他的附图。
图1为本申请中数据动态存储方法的一实施例的流程示意图;
图2为本申请数据动态存储方法中集群的一种可实施方式的场景示意图;
图3为本申请中数据动态存储方法的另一实施例的流程示意图;
图4为本申请中数据动态存储装置的一实施例的结构示意图;
图5为本申请实施例中数据动态存储方法涉及的硬件运行环境的设备结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所得到的所有其它实施例,均属于本发明保护的范围。
实施例一
本申请实施例提供一种数据动态存储方法,在本申请数据动态存储方法的第一实施例中,参照图1,包括以下步骤:
步骤S10,获取待评分数据表的操作信息,其中,所述待评分数据表存储于归档节点或计算节点;
本实施例方法的执行主体可以是一种数据动态存储装置,也可以是一种数据动态存储终端设备或服务器,本实施例以数据动态存储装置进行举例,该数据动态存储装置可以集成在具有数据处理功能的智能手机、平板电脑等终端设备上。
在本实施例中,需要说明的是,计算节点是指集群中主要提供CPU、内存等计算资源同时提供部分少量存储的节点,归档节点是指集群中主要提供存储空间不提供或仅提供极少的计算资源的节点,所述待评分数据表是指归档节点或计算节点中存储有数据的数据表。在一种可实施的方式中,参照图2,集群中包括有计算节点和归档节点,计算节点与归档节点之间通信连接,归档节点上仅设置有内存而未设置CPU,仅提供存储资源,计算节点上设置有CPU和较小的内存,主要提供计算资源。
具体的,在需要对存储于计算节点或归档节点中的数据表进行存储位置的调整的情况下,对计算节点和/或归档节点中的数据表进行扫描,确定一个或多个待评分数据表,并获取各所述待评分数据表在预设时间范围内的操作信息,其中,所述需要对存储于计算节点或归档节点中的数据表进行存储位置的调整的情况可以通过定时或用户操作等方式进行触发,所述预设时间范围可以根据实际情况进行设置,本实施例对此不加以限制。
可选地,所述获取待评分数据表的操作信息的步骤包括:
步骤S11,定时开启数据表存储位置管理模式;
步骤S12,在数据表存储位置管理模式下,获取待评分数据表的操作信息。
在本实施例中,具体的,在集群的使用过程中,定时开启数据表存储位置管理模式,在数据表存储位置管理模式下,对计算节点和/或归档节点中的数据表进行扫描,确定一个或多个待评分数据表,并获取各所述待评分数据表在预设时间范围内的操作信息,实现了对数据表当前的存储位置是否合适进行定期扫描,对数据表的存储位置进行动态管理的目的。
步骤S20,根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果;
在本实施例中,具体地,通过统计分析、预设使用率评分算法或预设使用率评分规则等,基于所述操作信息对所述待评分数据表进行使用率评分,获得所述待评分数据表对应的使用率评分结果,其中,所述操作信息可以包括数据表的用户访问人数、用户访问时间、报表引用次数、个人用户即时分析查询次数、数仓批量查询次数、优先级等,进行使用率评分的具体方法可以根据所述操作信息对计算任务效率以及成本的影响进行确定,本实施例对此不加以限制。
示例性地,可以根据用户访问人数对计算任务效率以及成本的影响,将用户访问人数分为1分档:0~N1人,2分档:N1~N2人,3分档:N2~N3人,4分档:N3~N4人,5分档:大于N4人,进而即可根据用户访问人数所属的档位确定用户访问人数对应的使用率评分结果;也可以通过将所述操作信息输入分类模型,获得评分标签。
步骤S30,根据所述使用率评分结果对所述待评分数据表的存储位置进行调整。
在本实施例中,具体地,检测所述使用率评分结果是否符合所述待评分数据表当前存储的节点的存储要求,若所述使用率评分结果符合所述待评分数据表当前存储的节点的存储要求,则无需对所述待评分数据表的存储位置进行调整,若所述使用率评分结果不符合所述待评分数据表当前存储的节点的存储要求,则需要对所述待评分数据表的存储位置进行调整,以将所述待评分数据表移动至符合存储要求的节点中,示例性地,若所述待评分数据表当前存储于归档节点,检测到使用率评分结果不符合归档节点的存储要求,则将所述待评分数据表移动至计算节点中。
可选地,所述根据所述使用率评分结果对所述待评分数据表的存储位置进行调整的步骤包括:
步骤S31,确定所述待评分数据表的当前存储节点,其中,所述当前存储节点为归档节点或计算节点;
步骤S32,根据所述使用率评分结果确定所述待评分数据表的目标存储节点;
在本实施例中,具体的,确定所述待评分数据表当前存储的当前存储节点,比较所述使用率评分结果以及各个节点的存储要求,将符合要求的节点确定为目标存储节点,判断所述目标存储节点与所述当前存储节点是否一致,其中,所述当前存储节点为归档节点或计算节点,所述目标存储节点为归档节点或计算节点。
可选地,所述根据所述使用率评分结果确定所述待评分数据表的目标存储节点的步骤包括:
步骤S321,比较所述使用率评分结果与预设评分阈值;
步骤S322,若确定所述使用率评分结果高于预设评分阈值,则将所述待评分数据表的目标存储节点确定为计算节点;
步骤S323,若确定所述使用率评分结果不高于预设评分阈值,则将所述待评分数据表的目标存储节点确定为归档节点。
在本实施例中,具体的,将所述使用率评分结果与预设评分阈值进行数值大小的比较,其中,所述预设评分阈值可以根据实际情况、对计算任务效率以及成本的影响等进行确定,本实施例对此不加以限制。若确定所述使用率评分结果高于预设评分阈值,则说明所述待评分数据表的使用率较高,也即,用户对所述待评分数据表的操作较频繁,若所述待评分数据表存储于归档节点,则用户每次操作都需要将所述待评分数据表传输至计算节点,计算任务较缓慢,数据表的整体操作效率降低,故而将所述待评分数据表的目标存储节点确定为计算节点,以减少传输所述待评分数据表所需耗费的时间和资源,提高了数据表的操作效率;若确定所述使用率评分结果不高于预设评分阈值,则说明所述待评分数据表的使用率较低,也即,用户对所述待评分数据表的操作较少,即使存储于归档节点,对整体的任务效率影响也较小,但若所述待评分数据表存储于计算节点,则需要占用计算节点的存储资源,增加了不必要的成本支出,故而将所述待评分数据表的目标存储节点确定为归档节点,以实现节约成本的目的。
步骤S33,若确定所述目标存储节点与所述当前存储节点不一致,则将所述待评分数据表移动至所述目标节点。
在本实施例中,具体的,若确定所述目标存储节点与所述当前存储节点不一致,则将所述待评分数据表从当前存储节点移动至所述目标节点;若确定所述目标存储节点与所述当前存储节点一致,则无需移动所述待评分数据表。
归档节点和计算节点中可以存储有一个或多个数据表,在每一次对数据表进行存储位置管理的过程中,可以对归档节点和计算节点中存储的全部数据表进行使用率评分和存储位置管理,也即,对于归档节点和计算节点中存储的每一个数据表,都会执行步骤S10、步骤S20和步骤S30,但本实施例并不限定各个数据表,执行步骤S10、步骤S20和步骤S30的先后顺序,示例性地,可以将全部数据表确定为待评分数据表,获取到全部待评分数据表的操作信息之后,再根据各所述操作信息对各所述待评分数据表进行使用率评分,再根据各所述使用率评分结果,对不符合当前存储的节点的存储要求的一个或多个待评分数据表统一进行移动;也可以每次确定一个数据表作为待评分数据表,获取这一个待评分数据表的操作信息之后,对这一个待评分数据表进行使用率评分,并根据使用率评分结果对这一个待评分数据表进行移动或不进行移动;也可以每次确定一个数据表作为待评分数据表,获取这一个待评分数据表的操作信息之后,对这一个待评分数据表进行使用率评分,在确定了全部数据表的使用率评分结果之后,对不符合当前存储的节点的存储要求的一个或多个待评分数据表统一进行移动。
可选地,所述根据所述使用率评分结果对所述待评分数据表的存储位置进行调整的步骤之后,还包括:
将所述待评分数据表标记为已评分数据表,返回执行所述获取待评分数据表的操作信息的步骤,直至检测到所述归档节点和所述计算节点中不存在待评分数据表。
在本实施例中,具体地,在对当前的待评分数据表的存储位置进行调整或确定不需要进行调整之后,将当前的所述待评分数据表标记为已评分数据表,返回执行所述获取待评分数据表的操作信息的步骤,重新从归档节点和/或计算节点中确定新的待评分数据表,直至检测到所述归档节点和所述计算节点中不存在待评分数据表,此时,说明所述归档节点和所述计算节点中的全部数据表均已经完成此轮的使用率评分和存储位置管理。
在一种可实施的方式中,为了便于下一轮的使用率评分和存储位置管理,可以在每一轮使用率评分和存储位置管理之后,也即,在检测到所述归档节点和所述计算节点中不存在待评分数据表之后,将所述归档节点和所述计算节点中的已评分数据表标记为待评分数据表,也即,在循环完成之后进行复原,便于进行下一次循环。
在本实施例中,通过获取待评分数据表的操作信息,其中,所述待评分数据表存储于归档节点或计算节点,实现了对已经存储于归档节点和计算节点中数据表的操作信息的获取,进而通过根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果,实现了对已经存储于归档节点和计算节点中数据表的使用率评分,进而通过根据所述使用率评分结果对所述待评分数据表的存储位置进行调整,实现了对已经存储于归档节点和计算节点中数据表的存储位置的评估和调整。相比于在获得数据后根据用户初始规划或者平台默认逻辑将数据表自动导入到计算节点或归档节点中的这种一次性存储方式,本申请在数据存储至归档节点或计算节点之后,通过对数据表进行使用率评分,实现了对归档节点和计算节点中数据表的存储位置是否合理进行再次评估,这样可以使得数据表的存储位置能够随数据表的操作情况而进行适应性调整,进而实现对大数据管理的成本和效率的动态调整,克服了若计算节点中存储的数据过多,则成本会较高,但若用户需要操作保存在归档节点上的数据,则需要先将数据传输至计算节点,导致计算任务缓慢,数据表的操作效率较低的技术缺陷,有效平衡了大数据管理的成本和效率。
实施例二
进一步地,参照图3,基于本申请上述实施例,在本申请的第二实施例中,与上述实施例相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,所述操作信息包括用户访问信息、报表引用信息、查询分析信息和优先级信息中的至少一项,所述根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果的步骤包括:
步骤S21,根据所述用户访问信息、所述报表引用信息、所述查询分析信息和/或所述优先级信息,对所述待评分数据表进行使用率评分,获得至少一个中间评分结果;
在本实施例中,需要说明的是,所述操作信息包括用户访问信息、报表引用信息、查询分析信息和优先级信息中的至少一项,其中,所述用户访问信息是指访问数据表的用户信息,包括访问人数、访问时间等,访问人数越多和/或访问时间越长,说明数据表的使用率越高;所述报表引用信息是指引用数据表的报表信息,包括引用次数、报表类型等,引用次数越多,说明数据表的使用率越高;所述查询分析信息是指查询数据表的情况信息,包括个人用户即时分析查询次数、数仓批量查询次数等,个人用户即时分析查询次数越多和/或数仓批量查询次数越多,说明数据表的使用率越高;所述优先级信息是指人工输入确定的数据表的使用率优先级,示例性地,用户在需要频繁操作某一个数据表时,若依据经验预估到或操作数据表的过程中察觉出计算任务变缓慢,则可以手动调整数据表的优先级,优先级越高表示数据表的预估使用率越高。
具体地,可以通过相同或不同的统计分析、预设使用率评分算法或预设使用率评分规则等,分别基于所述用户访问信息、所述报表引用信息、所述查询分析信息和/或所述优先级信息对所述待评分数据表进行使用率评分,获得所述用户访问信息、所述报表引用信息、所述查询分析信息和/或所述优先级信息各自对应的中间评分结果。
可选地,所述中间评分结果包括用户访问评分结果、报表引用评分结果、查询分析评分结果和优先级评分结果中的至少一项,所述根据所述用户访问信息、所述报表引用信息、所述查询分析信息和/或所述优先级信息,对所述待评分数据表进行使用率评分,获得至少一个中间评分结果的步骤包括:
步骤S211,根据所述用户访问信息对所述待评分数据表进行使用率评分,获得用户访问评分结果,其中,所述用户访问评分结果与所述用户访问信息中的访问人数和访问时间正相关;
在本实施例中,具体地,通过将所述用户访问信息输入预设的用户访问评分算法,对所述待评分数据表进行使用率评分,获得用户访问评分结果,其中,所述用户访问评分结果与所述用户访问信息中的访问人数和访问时间正相关。
步骤S212,和/或,根据所述报表引用信息对所述待评分数据表进行使用率评分,获得报表引用评分结果,其中,所述报表引用评分结果与所述报表引用信息中的报表引用次数正相关;
在本实施例中,具体地,通过将所述报表引用信息输入预设的报表引用评分算法,对所述待评分数据表进行使用率评分,获得报表引用评分结果,其中,所述报表引用评分结果与所述报表引用信息中的报表引用次数正相关。
步骤S213,和/或,根据所述查询分析信息对所述待评分数据表进行使用率评分,获得查询分析评分结果,其中,所述查询分析评分结果与所述查询分析信息中的即时分析次数和数仓批量分析次数正相关;
在本实施例中,具体地,在本实施例中,具体地,通过将所述查询分析信息输入预设的查询分析评分算法,对所述待评分数据表进行使用率评分,获得查询分析评分结果,其中,所述查询分析评分结果与所述查询分析信息中的即时分析次数和数仓批量分析次数正相关。
步骤S214,和/或,根据所述优先级信息对所述待评分数据表进行使用率评分,获得优先级评分结果,其中,所述优先级评分结果与所述优先级信息中的优先级正相关。
在本实施例中,具体地,在本实施例中,具体地,通过将所述优先级信息输入预设的优先级评分算法,对所述待评分数据表进行使用率评分,获得优先级评分结果,其中,所述优先级评分结果与所述优先级信息中的优先级正相关。
步骤S22,对各所述中间评分结果进行加权聚合,得到使用率评分结果,其中,所述优先级信息对应的中间评分结果的权重值最高。
在本实施例中,具体地,根据所述用户访问信息、所述报表引用信息、所述查询分析信息和/或所述优先级信息各自对应的预设的权重,对所述用户访问信息、所述报表引用信息、所述查询分析信息和/或所述优先级信息各自对应的中间评分结果进行加权聚合,得到使用率评分结果,其中,所述用户访问信息、所述报表引用信息、所述查询分析信息和/或所述优先级信息各自对应的权重可以根据实际情况及其对计算任务效率以及成本的影响进行确定,本实施例对此不加以限制,所述优先级信息对应的中间评分结果的权重值最高,所述加权聚合可以为加权平均、加权求和等。
在本实施例中,用户访问信息、报表引用信息、查询分析信息和/或优先级信息均可以用于表征数据表的使用情况,故而基于这些可以用于表征数据表的使用情况的信息对所述待评分数据表进行使用率评分,可以即时且准确地了解到数据表当前的使用情况,提高对数据表进行存储位置调整的准确性。
实施例三
进一步地,本申请实施例还提供一种数据动态存储装置,参照图4,所述数据动态存储装置应用于数据动态存储方,包括:
获取模块10,用于获取待评分数据表的操作信息,其中,所述待评分数据表存储于归档节点或计算节点;
评分模块20,用于根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果;
存储位置调整模块30,用于根据所述使用率评分结果对所述待评分数据表的存储位置进行调整。
可选地,所述数据动态存储装置还包括循环模块,在所述根据所述使用率评分结果对所述待评分数据表的存储位置进行调整的步骤之后,所述循环模块用于:
将所述待评分数据表标记为已评分数据表,返回执行所述获取待评分数据表的操作信息的步骤,直至检测到所述归档节点和所述计算节点中不存在待评分数据表。
可选地,所述获取模块10还用于:
定时开启数据表存储位置管理模式;
在数据表存储位置管理模式下,获取待评分数据表的操作信息。
可选地,所述存储位置调整模块30还用于:
确定所述待评分数据表的当前存储节点,其中,所述当前存储节点为归档节点或计算节点;
根据所述使用率评分结果确定所述待评分数据表的目标存储节点;
若确定所述目标存储节点与所述当前存储节点不一致,则将所述待评分数据表移动至所述目标节点。
可选地,所述存储位置调整模块30还用于:
比较所述使用率评分结果与预设评分阈值;
若确定所述使用率评分结果高于预设评分阈值,则将所述待评分数据表的目标存储节点确定为计算节点;
若确定所述使用率评分结果不高于预设评分阈值,则将所述待评分数据表的目标存储节点确定为归档节点。
可选地,所述评分模块20还用于:
根据所述用户访问信息、所述报表引用信息、所述查询分析信息和/或所述优先级信息,对所述待评分数据表进行使用率评分,获得至少一个中间评分结果;
对各所述中间评分结果进行加权聚合,得到使用率评分结果,其中,所述优先级信息对应的中间评分结果的权重值最高。
可选地,所述评分模块20还用于:
根据所述用户访问信息对所述待评分数据表进行使用率评分,获得用户访问评分结果,其中,所述用户访问评分结果与所述用户访问信息中的访问人数和访问时间正相关;
和/或,根据所述报表引用信息对所述待评分数据表进行使用率评分,获得报表引用评分结果,其中,所述报表引用评分结果与所述报表引用信息中的报表引用次数正相关;
和/或,根据所述查询分析信息对所述待评分数据表进行使用率评分,获得查询分析评分结果,其中,所述查询分析评分结果与所述查询分析信息中的即时分析次数和数仓批量分析次数正相关;
和/或,根据所述优先级信息对所述待评分数据表进行使用率评分,获得优先级评分结果,其中,所述优先级评分结果与所述优先级信息中的优先级正相关。
本发明提供的数据动态存储装置,采用上述实施例中的数据动态存储方法,解决了常规技术难以平衡大数据管理的成本和效率的技术问题。与现有技术相比,本发明实施例提供的数据动态存储装置的有益效果与上述实施例提供的数据动态存储方法的有益效果相同,且该数据动态存储装置中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
实施例四
进一步地,本发明实施例提供一种电子设备,电子设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例中的数据动态存储方法或转化资质截断参数确定方法。
下面参考图5,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如蓝牙耳机、移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM)中的程序或者从存储装置加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有电子设备操作所需的各种程序和数组。处理装置、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
通常,以下系统可以连接至I/O接口:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信装置。通信装置可以允许电子设备与其他设备进行无线或有线通信以交换数组。虽然图中示出了具有各种系统的电子设备,但是应理解的是,并不存储要求实施或具备所有示出的系统。可以替代地实施或具备更多或更少的系统。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从ROM被安装。在该计算机程序被处理装置执行时,执行本公开实施例的方法中限定的上述功能。
本发明提供的电子设备,采用上述实施例中的数据动态存储方法或转化资质截断参数确定方法,解决了常规技术难以平衡大数据管理的成本和效率的技术问题。与现有技术相比,本发明实施例提供的电子设备的有益效果与上述实施例提供的数据动态存储方法或转化资质截断参数确定方法的有益效果相同,且该电子设备中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
实施例六
进一步地,本实施例提供一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行上述实施例中的数据动态存储方法或转化资质截断参数确定方法。
本发明实施例提供的计算机可读存储介质例如可以是U盘,但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是电子设备中所包含的;也可以是单独存在,而未装配入电子设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被电子设备执行时,使得电子设备:获取待评分数据表的操作信息,其中,所述待评分数据表存储于归档节点或计算节点;根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果;根据所述使用率评分结果对所述待评分数据表的存储位置进行调整。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该单元本身的限定。
本发明提供的计算机可读存储介质,存储有用于执行上述数据动态存储方法或转化资质截断参数确定方法的计算机可读程序指令,解决了常规技术难以平衡大数据管理的成本和效率的技术问题。与现有技术相比,本发明实施例提供的计算机可读存储介质的有益效果与上述实施例提供的数据动态存储方法或转化资质截断参数确定方法的有益效果相同,在此不做赘述。
实施例七
进一步地,本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的数据动态存储方法或转化资质截断参数确定方法的步骤。
本申请提供的计算机程序产品解决了常规技术难以平衡大数据管理的成本和效率的技术问题。与现有技术相比,本发明实施例提供的计算机程序产品的有益效果与上述实施例提供的数据动态存储方法或转化资质截断参数确定方法的有益效果相同,在此不做赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。
Claims (10)
1.一种数据动态存储方法,其特征在于,所述数据动态存储方法包括以下步骤:
获取待评分数据表的操作信息,其中,所述待评分数据表存储于归档节点或计算节点;
根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果;
根据所述使用率评分结果对所述待评分数据表的存储位置进行调整。
2.如权利要求1所述的数据动态存储方法,其特征在于,所述根据所述使用率评分结果对所述待评分数据表的存储位置进行调整的步骤之后,还包括:
将所述待评分数据表标记为已评分数据表,返回执行所述获取待评分数据表的操作信息的步骤,直至检测到所述归档节点和所述计算节点中不存在待评分数据表。
3.如权利要求1所述的数据动态存储方法,其特征在于,所述获取待评分数据表的操作信息的步骤包括:
定时开启数据表存储位置管理模式;
在数据表存储位置管理模式下,获取待评分数据表的操作信息。
4.如权利要求1所述的数据动态存储方法,其特征在于,所述根据所述使用率评分结果对所述待评分数据表的存储位置进行调整的步骤包括:
确定所述待评分数据表的当前存储节点,其中,所述当前存储节点为归档节点或计算节点;
根据所述使用率评分结果确定所述待评分数据表的目标存储节点;
若确定所述目标存储节点与所述当前存储节点不一致,则将所述待评分数据表移动至所述目标节点。
5.如权利要求4所述的数据动态存储方法,其特征在于,所述根据所述使用率评分结果确定所述待评分数据表的目标存储节点的步骤包括:
比较所述使用率评分结果与预设评分阈值;
若确定所述使用率评分结果高于预设评分阈值,则将所述待评分数据表的目标存储节点确定为计算节点;
若确定所述使用率评分结果不高于预设评分阈值,则将所述待评分数据表的目标存储节点确定为归档节点。
6.如权利要求1所述的数据动态存储方法,其特征在于,所述操作信息包括用户访问信息、报表引用信息、查询分析信息和优先级信息中的至少一项,所述根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果的步骤包括:
根据所述用户访问信息、所述报表引用信息、所述查询分析信息和/或所述优先级信息,对所述待评分数据表进行使用率评分,获得至少一个中间评分结果;
对各所述中间评分结果进行加权聚合,得到使用率评分结果,其中,所述优先级信息对应的中间评分结果的权重值最高。
7.如权利要求4所述的数据动态存储方法,其特征在于,所述中间评分结果包括用户访问评分结果、报表引用评分结果、查询分析评分结果和优先级评分结果中的至少一项,所述根据所述用户访问信息、所述报表引用信息、所述查询分析信息和/或所述优先级信息,对所述待评分数据表进行使用率评分,获得至少一个中间评分结果的步骤包括:
根据所述用户访问信息对所述待评分数据表进行使用率评分,获得用户访问评分结果,其中,所述用户访问评分结果与所述用户访问信息中的访问人数和访问时间正相关;
和/或,根据所述报表引用信息对所述待评分数据表进行使用率评分,获得报表引用评分结果,其中,所述报表引用评分结果与所述报表引用信息中的报表引用次数正相关;
和/或,根据所述查询分析信息对所述待评分数据表进行使用率评分,获得查询分析评分结果,其中,所述查询分析评分结果与所述查询分析信息中的即时分析次数和数仓批量分析次数正相关;
和/或,根据所述优先级信息对所述待评分数据表进行使用率评分,获得优先级评分结果,其中,所述优先级评分结果与所述优先级信息中的优先级正相关。
8.一种数据动态存储装置,其特征在于,所述数据动态存储装置包括:
获取模块,用于获取待评分数据表的操作信息,其中,所述待评分数据表存储于归档节点或计算节点;
评分模块,用于根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果;
存储位置调整模块,用于根据所述使用率评分结果对所述待评分数据表的存储位置进行调整。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述的数据动态存储方法的步骤。
10.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有实现数据动态存储方法的程序,所述实现数据动态存储方法的程序被处理器执行以实现如权利要求1至7中任一项所述的数据动态存储方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310090910.2A CN116126245A (zh) | 2023-01-30 | 2023-01-30 | 数据动态存储方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310090910.2A CN116126245A (zh) | 2023-01-30 | 2023-01-30 | 数据动态存储方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116126245A true CN116126245A (zh) | 2023-05-16 |
Family
ID=86306149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310090910.2A Pending CN116126245A (zh) | 2023-01-30 | 2023-01-30 | 数据动态存储方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116126245A (zh) |
-
2023
- 2023-01-30 CN CN202310090910.2A patent/CN116126245A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3502881B1 (en) | Method for preloading application, storage medium, and terminal device | |
CN107392259B (zh) | 构建不均衡样本分类模型的方法和装置 | |
US10768947B2 (en) | Method for interface refresh synchronization,terminal device, and non-transitory computer-readable storage medium | |
WO2019085754A1 (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN111651700A (zh) | 消息展示方法、装置、电子设备及存储介质 | |
CN113626200A (zh) | 任务负载计算方法、装置、存储介质以及终端 | |
CN113392018B (zh) | 流量分发方法、装置、存储介质及电子设备 | |
CN117236805B (zh) | 电力设备控制方法、装置、电子设备和计算机可读介质 | |
EP3825876A2 (en) | Method, apparatus, device, storage medium and program for embedding user app interest | |
US9152948B2 (en) | Method and system for providing a structured topic drift for a displayed set of user comments on an article | |
US10275525B2 (en) | Method and system for mining trends around trending terms | |
CN116126245A (zh) | 数据动态存储方法、装置、电子设备及存储介质 | |
CN115203564A (zh) | 信息流推荐方法、装置及计算机程序产品 | |
CN111680754B (zh) | 图像分类方法、装置、电子设备及计算机可读存储介质 | |
CN111339770B (zh) | 用于输出信息的方法和装置 | |
CN109218411B (zh) | 数据处理方法及装置、计算机可读存储介质、电子设备 | |
CN114138358A (zh) | 应用程序的启动优化方法、装置、设备和存储介质 | |
US10084664B1 (en) | Dynamic configuration of a scroll feature | |
CN116436919B (zh) | 云资源消耗优化方法、装置、电子设备及可读存储介质 | |
CN116820539B (zh) | 一种基于互联网的系统软件运行维护系统及方法 | |
CN115470292B (zh) | 区块链共识方法、装置、电子设备及可读存储介质 | |
CN111292329B (zh) | 视频分割网络的训练方法、装置及电子设备 | |
CN111694755B (zh) | 应用程序测试方法、装置、电子设备及介质 | |
KR20240060983A (ko) | 앱 아이콘을 표시하는 방법 및 전자 장치 | |
CN118259638A (zh) | 自动化产线的调整方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |