CN104717761A - 用于管理数据的方法以及设备 - Google Patents

用于管理数据的方法以及设备 Download PDF

Info

Publication number
CN104717761A
CN104717761A CN201410766196.5A CN201410766196A CN104717761A CN 104717761 A CN104717761 A CN 104717761A CN 201410766196 A CN201410766196 A CN 201410766196A CN 104717761 A CN104717761 A CN 104717761A
Authority
CN
China
Prior art keywords
data
storage device
data object
retired
data storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410766196.5A
Other languages
English (en)
Other versions
CN104717761B (zh
Inventor
尼古拉斯·詹姆斯·兰德尔
P·肯尼恩格堂
克里斯多佛·德拉瓦特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Viavi Solutions UK Ltd
Original Assignee
Viavi Solutions UK Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Viavi Solutions UK Ltd filed Critical Viavi Solutions UK Ltd
Publication of CN104717761A publication Critical patent/CN104717761A/zh
Application granted granted Critical
Publication of CN104717761B publication Critical patent/CN104717761B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/122File system administration, e.g. details of archiving or snapshots using management policies
    • G06F16/125File system administration, e.g. details of archiving or snapshots using management policies characterised by the use of retention policies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0652Erasing, e.g. deleting, data cleaning, moving of data to a wastebasket
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供了一种管理用于至少一个无线通信网络的数据的方法,以及一种用于实现此类方法的数据管理系统。该方法包括确定用于至少一个数据存储装置的至少一个可用空间度量,并且将用于该至少一个数据存储装置的该至少一个所确定的可用空间度量与至少一个阈值进行比较。如果用于该至少一个数据存储装置的该至少一个所确定的可用空间装置超过该至少一个阈值,则该方法进一步包括:标识由存储在该至少一个数据存储装置内的数据对象表示的数据对象组;确定用于每个所标识的数据对象组的一个保留优先级值;至少部分地基于该所确定的保留优先级值确定为其使数据对象退役的至少一个数据对象组;以及使在来自该至少一个数据存储装置的该所确定的至少一个数据对象组内的数据对象退役。

Description

用于管理数据的方法以及设备
发明领域
本发明的领域涉及一种管理至少一个无线通信网络的数据的方法、以及其数据管理系统。
发明背景
无线通信网络(如第三代(3G)移动电话标准和技术)是众所周知的。这种3G标准和技术的一个示例是第三代合作伙伴计划(3GPPTM)(http://www.3gpp.org/www.3gpp.org)开发的通用移动电信系统(UMTSTM)。
一般已经开发了第三和第四代无线通信和如LTE(长期演进技术)具体系统来支持宏蜂窝移动电话通信以及更最近的毫微微蜂窝移动电话通信。此处‘电话’可以是智能电话、或与网络(通过所述网络连接通话)无线链接的另一个移动或例携式通信单元。自此以后所有这些装置将被称为移动通信单元。通话可以是数据、视频或语音通话、或这些内容的组合。
典型地,移动通信单元,或如在3G用语中经常将它们称为的用户设备与3G或4G无线通信系统的核心网络通信。这种通信经由无线网络子系统。无线通信系统通常包括多个无线网络子系统。每个无线网络子系统包括一个或多个小区,移动通信单元可以附接到这些小区,并且由此连接至网络。基站可以为小区服务。每个基站可以具有多个天线,这些天线中的每个天线为小区的一个扇区服务。
无线通信系统的运营商需要尽可能精确地了解系统中正在发生什么。具体问题是需要解决‘故障’。故障可能采取多种多样的形式,但可以概括为当网络和/或一个或多个移动通信单元的表现与预期不一样时的事件。
现代的无线通信系统允许单独移动通信单元和基站的高度自主性。其结果是,不全都集中做出关于设置和‘拆毁’贯穿网络的通话链路的决定。因此,无线通信系统内生成的信息量引起了额外的复杂性。一天中,无线通信系统可以生成100千兆字节关于网络中已经进行通话的数据。
这个数据量已以证实为在现有的无线通信系统中对故障定位的主要障碍。具体地,常规的数据管理技术已经证实为不适合用于管理这样大的数据量,例如潜在地以十亿(100000万)计或更多的记录。
网络运营商在管理他们收集的大量数据时所遇到的具体的问题是,一旦数据不再需要和/或当必需为新数据清空空间时的数据的高效和有效的退役。这样的数据退役是必需的,可便提供一些限制需要存储的数据量的手段。然而,以不对系统造成计算负担的方式实现此类数据退役是一个挑战。
用于使有时间戳的数据退役的常规途径典型地是一种“最旧最先(旧est first)”的途径,由此将所有比具体时间/日期更旧的数据退役。然而,这样一种途径没有考虑到如可能可使用的和/或新数据所需的可用空间量等因素。另外,这样一种途径无法不同类型/类别的数据的保留确定优先次序,例如由此某些数据的类型/分类可以有利地保留比其他类型/类别的数据的更长的时期。
发明概要
相应地,本发明力图单独地或以任何组合来缓解、减轻或消除上述缺点中的一个或多个缺点。
根据本发明的第一方面,提供了一种管理至少一个无线通信网络的数据的方法。所述方法包括确定用于至少一个数据存储装置的至少一个可用空间度量,并且将用于所述至少一个数据存储装置的所述所确定的至少一个可用空间度量与至少一个阈值进行比较,以及如果用于所述至少一个数据存储装置的所述所确定的至少一个可用空间装置超过所述至少一个阈值:标识由存储在所述至少一个数据存储装置内的数据对象表示的数据对象组;确定用于每个所标识的数据对象组的保留优先级值;至少部分地基于所述所确定的保留优先级值确定为其使多个数据对象退役的至少一个数据对象组;以及使在来自所述至少一个数据存储装置的所述所确定至少一个数据对象组内的多个数据对象退役。
以此方式,通过确定用于所述或每个数据存储装置的可用空间度量,并且将所述所确定的可用空间度量与一个或多个最小可用空间阈值进行比较,数据对象的退役可以被限制为当需要清空数据存储装置内的空间以存储新的数据对象时进行。以此方式,可以实现“尽可能多的数据”保留策略,由此基于在存储装置内可用的存储空间量的限制,尽可能/实际多的数据可以被保留尽可能/实际长。此外,通过基于数据对象所指定到的数据对象组的退役优先级值来使数据对象退役,包括更有意义的数据的数据对象的保留可以设为优先级高于包括意义较小的数据的数据对象的保留。
根据本发明的第二方面,提供了一种数据管理系统,所述数据管理系统包括至少一个数据处理模块,所述模块被安排成用于实现本发明的第一方面的方法。
根据本发明的第三方面,提供了一种无线通信系统,所述系统结合有本发明的第二方面的数据管理系统。
根据本发明的第四方面,提供了一种非瞬态计算机程序产品,所述计算机程序产品上存储有计算机可读代码,用于编程一个数据处理模块来执行本发明的第一方面的方法。
附图简要说明
现在将仅以示例方式并且参考附图描述本发明的实施例,其中:
图1展示了数据管理系统的示例的简化框图。
图2展示了数据退役管理方法的示例的简化流程图。
图3展示了数据退役模块的示例实现方式的简化框图。
图4展示了数据退役管理方法的更详细示例的简化流程图。
图5和6展示了来自数据存储装置的数据的退役的示例。
图7展示了可以用于实现本发明的实施例中的数据处理功能性的典型计算系统。
本发明的实施方案的详细说明
就一种用于管理无线通信网络(如根据第三代(3G)和/或第四代(4G)移动电话标准和技术实现的网络)内的数据的系统和方法方面,将描述本发明的示例。这种3G和4G标准和技术的示例是第三代合作伙伴计划(3GPPTM)(http://www.3gpp.org/www.3gpp.org)开发的通用移动电信系统(UMTSTM)和长期演进技术(LTE)。
在某些示例中,描述了一种方法,所述方法包括确定用于至少一个数据存储容器的至少一个可用空间度量,并且将用于所述至少一个数据存储装置的所述所确定的至少一个可用空间度量与至少一个阈值进行比较。如果用于所述至少一个数据存储容器的所述所确定的至少一个可用空间装置超过(例如,小于)所述至少一个阈值,所述方法进一步包括:标识由存储在所述至少一个数据存储容器内的数据对象表示的数据对象组;针对每个所标识的数据对象组计算保留优先级值;至少部分地基于所述所确定的保留优先级值确定为其使多个数据对象退役的至少一个数据对象组;以及使来自所述至少一个数据存储容器的所述所确定的至少一个数据对象组内的数据对象退役。
首先参照图1,展示了数据管理系统100的示例的简化框图,如可以用于存储和后续访问来自一个或多个无线通信网络的数据。数据处理系统100可以用任何合适的方式实现。例如,并且如图1中所示,数据管理系统100可以通过计算机程序代码的方式实现,并且被安排成在一个或多个数据处理模块上执行,如总体上在105展示的数据处理模块。所述计算机程序代码可以存储在一个或多个非瞬态计算机程序产品内,例如,像一个或多个存储器元件。这种存储器元件可以包括任何形式的计算机可读存储装置,如硬盘、CD-ROM、光存储装置、磁存储装置、只读存储器ROM、可编程只读存储器PROM、可擦除可编程只读存储器EPROM、电可擦除可编程只读存储器EEPROM和闪速存储器。相应地,在所示示例中,计算机程序代码可以是从例如高速存储器140执行的。
在所示示例中,数据管理系统100被安排成用于接收数据110。这样的数据可以包括任何与一个或多个无线通信网络内的通话相关的数据,例如包括通话服务类型(例如,数据通话、语音通话等)、通话事件的时间(例如,通话起始时间、服务类型的改变时间、通话结束的时间等)、服务信息的质量、小区测量结果报告等。这样的数据110可以进一步包括从通话事件数据得出的统计信息。数据管理系统100在一个或多个数据存储装置(如总体上在120展示的那些)内存储所接收的数据110。
在所示示例中,数据管理系统100经由存储器访问模块130可操作地联接到数据存储装置120,所述模块被安排成用于从数据管理系统100到数据存储装置120接收并实现数据访问请求(读和写)。数据存储装置120可以包括任何适合形式的非易失性大容量存储装置,如磁盘驱动器、固态盘驱动器或类似物。在此使用的术语数据存储装置可以是指整个物理数据存储装置或者逻辑存储装置,如物理数据存储装置的单个分区。替代性地,逻辑存储装置可以包括跨多个物理数据存储装置安排的多个分区。相应地,除非另外指明,否则术语数据存储装置的使用应理解为涵盖整个物理数据存储装置和逻辑数据存储装置(例如,分区)两者。
在所示示例中,数据管理系统100被进一步安排成用于接收与在数据存储装置120内存储的数据相关的查询,例如,来自一个或多个客户端应用150。在收到这样的查询时,数据管理系统100被安排成用于从数据存储装置检索与从所述数据存储装置接收的查询对应的数据并且将所检索的数据返回到(在所示示例中)从其中接收查询的客户端应用150,如在下文更详细说明的。
在所示示例中,数据管理系统100接收所述数据作为数据流110。数据管理系统100的数据分段组件112被安排成用于接收数据流110,并且进行通话数据分段,由此所述数据被安排到单独的数据记录中。
在所示示例中,然后,将数据记录提供到数据管理系统100的数据记录分类组件114,所述数据记录分类组件被安排成用于根据至少其相应的时间戳信息将这些数据记录进行分类。例如,数据记录可以被分类成预定义的、固定时长的事件时间间隔(例如,包括一个或多个小时的固定时长)。替代性地,数据记录可以被分类成在一天和/或一周和/或一月和/或一年期间的预定义时长。例如,这样的分类可以被安排成考虑到在通话事件密度(例如,在夜晚进行的通话可能更少,此时人们通常在睡觉,同时白天的某些时间段可以典型地包括更高的通话量)的可预测的和/或一致的变化。
考虑了数据记录可以额外地/替代性地基于任何其他的指标被分类。例如,通过以下各项分组:
-空中接口技术;
-数据类型(例如,总通话数据,完整通话数据等);
-通话类型(例如,语音、视频、数据等)
-用户类别(例如,企业用户、私人用户、VIP用户、在某个号码中有IMSI结尾使得能够以伪随机用户选择为目标的用户等);
-地理位置;
-用户设备的装置类型(型号)或制造商;
-等等。
在所示示例中,地理定位组件116然后可以相对于通话数据记录进行地理定位,并且将空间信息添加到每个单独的通话数据记录。地理定位是物体(如移动通信单元)的现实世界地理位置的标识。地理定位技术在本领域是众所周知的,并且如此不需要在此进行任何更加详细的描述。然而,申请人的标题为“无线通信网络中的地理定位(GEO-LOCATION IN A WIRELESS COMMUNICATIONNETWORK)”WO 2010/081658号未决国际专利申请中描述了地理定位的一个示例实现方式,所述申请通过引用结合于此。在本发明的所示示例的背景下,可以进行地理定位以确定在与特定通话记录相关的通话事件的时刻,呼叫记录相关的移动通信单元的位置。额外地/替代地,在移动通信单元的全球定位系统(GPS)数据可用的情况下,这样的GPS数据可以用于确定那个移动通信单元的位置。
将认识到,在某些替代示例中,这样的地理定位和将空间信息添加到数据记录可能同等地在通过数据记录时间分类组件114进行数据记录的时间分组之前进行。
在所示示例中,数据管理系统100的数据块组装组件118然后被安排成用于将在时间上分类的数据记录组装成数据块。图1中所示的数据管理系统100的分配和存储组件160将组装的数据块分配到所述数据存储装置(例如,磁盘)120中的一个或多个。已经将数据块分配到存储装置120之后,分配和存储组件160然后将数据块存储在其分配的存储装置120中,通过例如将一个写访问请求发送到存储器访问模块130(包括有待存储的数据块),并且指示要将数据块存储在哪个数据存储装置120中。在收到这样的写访问请求时,存储器访问模块130然后可以进行必需的步骤来将数据块写入到存储器中适当的区域(即,适当的数据存储装置120),并且在其完成时可以将写入数据块的确认返回到存储器。
旧的数据记录的“退役”是对要求存储大量数据的数据管理系统的重要要求,如用于无线通信网络的数据管理系统,因为连续地存储大量数据要求大量的存储空间。因此,数据退役是用以清空有价值的存储空间的重要操作。
来自无线通信网络的与通话相关的数据不断地大量产生并且因此可用信息不断地更新。结果是,所存储的数据在一段时期以后典型地变得冗余,因为不断提供了更多最新信息。因此,所希望的是使例如比预先确定定“年龄”更旧(即,提前一个给定(渐进的)的时间/日期)的数据“退役”。除了基于数据的年龄使数据退役之外,通常还希望的是基于例如数据的优先次序使数据退役,其中意义较小的数据会在意义更大的数据之前退役。
相应地,数据管理系统100包括数据退役模块170,所述模块被安排成用于使在数据存储装置120内存储的数据退役。现在参照图2,展示了管理数据存储装置内存储的数据的退役的方法的示例的简化流程图200,如可以通过图1中所示的数据退役模块170实现。
方法在210开始并继续到220,在220确定用于至少一个数据存储装置的至少一个可用空间度量。这样的可用空间度量可以包括按比例的可用空间度量,表示例如对应的存储装置的可用百分比(即,可以被写入的)。此地/替代地,这样的可用空间度量可以包括绝对可用空间度量,表示例如对应的存储装置内的可用存储空间。因此,在图1中所示示例中,数据退役模块170可以被安排成用于确定用于数据存储装置120中每一个的可用空间度量。数据退役模块170可以按任何适合的方式确定这样的可用空间度量。例如,数据退役模块170可以被安排为用于从分配和存储组件160接收在数据存储装置120中每一个内的可用空间量的指示。替代地,数据退役模块170可以被安排成用于从存储器访问模块130获得在数据存储装置120中每一个内的可用空间量的指示。替代地,数据退役模块170可以被安排为用于从存储器访问模块130接收在这些数据存储装置120中每一个内的可用量的指示。
返回参照图2,已经确定用于所述或每个存储装置的可用空间度量之后,所述方法前进到步骤230,在230所述或每个可用空间度量与最小可用空间阈值进行比较。以此方式,可以确定在所述或每个存储装置内的可用空间量是否小于一个预配置的最小量。在某些示例中,考虑了最小可用空间阈值可以被定义并配置用于每个存储装置,从而使得不同的最小可用空间阈值可以被定义和配置用于不同的存储装置。
在图2中所示示例中,如果确定用于存储装置的所述或每个可用空间度量超过最小可用空间阈值,那么可以认为不需要退役数据来为新数据清空空间。如此,为了保持“尽可能多的数据”,在所展示的示例中在这种情况下没有数据退役。相应地,方法在280结束。
然而,如果用于所述或至少一个存储装置的所述或至少一个可用空间度量小于对应的最小可用空间阈值,那么可以确定需要从至少其可用空间度量小于最小可用空间阈值的存储装置中退役数据。相应地,在这样的情况下,在所示示例中,所示方法前进到步骤240,在240标识由其可用空间度量小于对应的最小可用空间阈值的数据存储装置内存储的数据表示的数据对象组。
例如,并且如在下文更详细描述的,存储在数据存储装置内的数据可以作为数据对象存储。数据对象可以包括例如单独的数据记录、多个数据记录块、数据库行、表格分区等。针对在图1中所示的示例数据管理系统100,各自由数据块组装组件118组装的、包括临时存储的数据记录的数据块可以被认为是根据本发明的某些示例的数据对象。
在数据存储装置120内存储的每个数据对象被指定给一个特定的数据对象组,例如通过分配和存储组件160。数据对象可以基于数据的一个或多个退役优先级特性被指定给数据对象组,例如,数据的一个或多个特性可以用于定义优先级以在其他类型的数据之前保留那种类型的数据。这样的退役优先级特性的示例在无线通信网络数据的情况下可以包括以下各项中的一项或多项:
-空中接口技术;
-数据类型(例如简略通话数据,完整通话数据等);
-通话类型(例如,语音、视频、数据等)
-用户类别(例如企业用户、私人用户、VIP用户、在某个号码中有IMSI结尾使得能够以伪随机用户选择为目标的用户等);
-地理位置;
-用户设备的装置类型(型号)或制造商;
-等等。
可以实现/配置任何适合的数据对象分组,并且考虑了数据对象的这种分组可以是用户(例如,网络运营商)可配置/可改变的。基于例如用于通话或通话段的空中接口技术(其中在通话中出现从一个空中接口到另一个空中接口的切换)的数据对象分组以及数据类型的一个示例可以如下实现:
组1:总通话数据(3G/UMTS)
组2:完整通话数据(3G/UMTS)
组3:总通话数据(GSM)
组4:完整通话数据(GSM)
组5:总通话数据(LTE)
组6:完整通话数据(LTE)
这些组中的每一个可以具有不同的相对优先级。例如,3G/UMTS(第三代/通用移动电信系统)通话可以被认为比GSM(全球移动通信系统)通话具有更大的重要性或意义。在3G/UMTS通话内,总数据可以被认为比完整通话数据具有更大的重要性,并且类似地,在GSM通话内,总数据可以被认为比完整通话数据具有更大的重要性。然而整体优先级可以是:
1.3G总数据
2.GSM总数据
3.3G完整通话数据
4.GSM完整通话数据
替代地,在仍然满足所述3G对GSM优先级的同时,其可以是:
1.3G总数据
2.3G完整通话数据
3.GSM总数据
4.GSM完整通话数据
下文更加详细地描述了用于每个组的退役优先级值的计算的示例。
返回参照图2,并且尤其步骤240,由在其可用空间度量小于相应的最小可用空间阈值的数据存储装置中存储的数据表示的数据对象组可以按适合的方式标识。例如,在图1中所示示例中,数据退役模块170可以被安排成用于从分配和存储组件160接收在所述或每个数据存储装置内所表示的数据对象组的指示。替代地,数据退役模块170可以被安排成用于从存储器访问模块130获得在所述或每个数据存储装置内所表示的数据对象组的指示。在本发明的某些示例中,考虑了可以假设在每个数据存储装置内表示所有数据对象组,并且图2的方法的步骤240包括确定包括所有(非空)数据对象组的集合。
已经标识相关的数据对象组之后,所述方法前进到步骤250,在250针对每个所标识的数据对象组确定退役优先级值。例如,并且如在下文中更详细描述的,所标识的组的退役优先组值可以至少部分地基于对应组的最小保留时长值和/或基于对应的组内存储数据对象的时间段来计算。
已经确定了用于每个所标识的数据对象组的退役优先组值之后,所述方法前进到步骤260,在260,数据要从其中退役的数据对象组至少部分地基于所确定的退役优先组值来确定。在所示示例中,具有更大意义的数据对象的组被赋予比具有更小意义的数据对象组更高的退役优先级值。如此,图2的方法包括标识包括最高退役优先级值的数据对象组。
将认识到,在替代实施例中,具有更大意义的数据对象组可以替代地被赋予比其他具有更小意义的数据对象组更低的退役优先组值,并且因此步骤260可以替代地包括标识包括最低退役优先组值的数据对象组。
然后在步骤270,来自所标识的组的数据退役并且方法在280结束。
有利地,通过确定用于所述或每个数据存储装置的可用空间度量,并且将所确定的可用空间度量与一个或多个最小可用空间阈值进行比较,数据对象的退役可以被限制为当需要清空数据存储装置内的空间以存储新的数据对象时进行。以此方式,图2的方法使得能够实现“尽可能多的数据”保留策略,其中基于在存储装置内可用的存储空间的量的限制,尽可能/实际多的数据可以被保留尽可能/实际长。
对于某些示例,考虑了最小可用空间阈值可以被配置/设置为用于提供“缓冲”空间以应对数据的突然流入并且由此避免系统变得过载。取决于系统要求和/或存储容量,可以根据适当情况来配置/设置这样的缓冲空间。在某些示例中,这样的缓冲空间可以被配置/设置为对应的数据存储装置的存储容量的例如5-10%。
另外,基于数据对象所指定到的数据对象组的退役优先权值来使数据对象退役,使得包括更有意义的数据的数据对象的保留可以设为优先级高于包括意义较小的数据的数据对象的保留。
现在参照图3,展示了图1中所示的数据退役模块170的示例实现方式的简化框图。在所示示例中,数据退役模块170被安排成用于接收与存储装置120相关的信息,如总体上在310展示的。这样的存储装置信息310可以包括例如指示在所述或每个存储装置120内的可用空间量的信息,在所述或每个存储装置120内托管/存储的数据对象组的指示等。这样的存储装置信息310可以从例如分配和存储组件160和/或存储器访问模块130中获得。数据退役模块170可以进一步被安排成用一接收数据退役配置信息,如总体上在315指示的。这样的配置数据315的示例将在下文更详细说明。
在图3中民所示的数据退役模块170包括控制器320,所述控制器被安排成用于实现对数据存储装置(如图1中所示的数据存储装置120)内存储的数据的退役进行管理的方法。
图4展示了对数据存储装置内存储的数据的退役进行管理的方法的更详细示例,如可以通过控制器320实现。所述方法在305开始,并且在所示示例中,在410启动一个循环计数器,如图3中所示的计数器330,以使得所述方法步骤的迭代数目能够被限制到预定义的数目。接着,在步骤415,选择第一存储器存储装置(“容器”)。然后在420确定用于所选择的存储装置的一个或多个可用空间度量。
这样的可用空间度量可以包括按比例的自由空间度量,表示例如所选的存储装置的可用百分比(即,可以被写入的)。此地/替代地,这样的可用空间度量可以包括绝对可用空间度量,表示例如所选的存储装置内的可用存储空间。可用空间度量可以用任何合适的方式确定。例如,在图3中所示的示例中,所选择的数据存储装置内的可用空间量的指示可以包括在存储装置信息310内。
返回参照图4,已经确定用于所选择的数据存储装置的可用空间度量之后,所述方法继续到425,在425将所确定的可用空间度量与一个或多个阈值进行比较,以确定所选择的数据存储空器内的可用空间值是否小于预先确定的最小量。在所示示例中,如果所述或每个可用空间度量大于对应的阈值,那么可以确定所选择的数据存储装置包括足够的可用空间并且不要求数据对象退役,并且所述方法跳至步骤450。
相反,在所示示例中,如果可用空间度量中的至少一个小于对应的阈值,那么可以确定针对所选择的数据存储装置需要使数据退役,并且所述方法前进到步骤430,在430标识由所选择的数据存储装置内存储的数据对象表示的数据对象组。
如上所述,数据存储装置120内在储的每个数据对象例如通过分配和存储组件160被指定给一个特定的数据对象组。数据对象可以基于数据的一个或多个退役优先组特性被指定给数据对象组,例如数据的一个或多个特性可以用于定义优先级以在其他类型的数据之前保留这那类型的数据。这样的退役优先级特性的示例在无线通信网络数据的情况下可谬包括以下各项中的一项或多项:
-空中接口技术;
-数据类型(例如简略通话数据,完整通话数据等);
-通话类型(例如,语音、视频数据等)
-用户类别(例如企业用户、私人用户、VIP用户、在某个号码中有IMSI结尾使得能够以伪随机用户选择为目标的用户等);
-地理位置;
-用户设备的装置类型(型号)或制造商;
-等等。
由所选择的数据存储装置内存储的数据对象表示的数据对象组可以按任何适当的方式标识。例如,在图3中所示的示例中,所选择的数据存储装置内存储的数据对象表示的数据对象组的指示可以包括在存储装置信息310内。
接着,在步骤435,针对每个标识的数据对象组确定退役优先级值。所标识的组的退役优先级值可以至少部分地基于对应组的最小保留时长值来计算。例如,针对每个数据对象组,可以在配置数据315内定义对应的组内用数据对象待保留的最小时间段(T_最小)。针对数据对象组的最小时间段(T_最小)可以定义在那个组内应当保留的数据对象的最小时长。相对于其他数据对象组,最小时间段(T_最小)可以反映单独数据对象组之间的所希望的时间关系目标;例如,哪个具有更高的退役优先级以及一个组的优先级比任何其他组高出多少。以此方式,相对退役优先级可以通过数据应该保持的最小时间段(T_最小)来调控。
所标识伯组的退役优先级值可以至少部分地基于对应组内的数据对象存储的时间段来进一步计算。例如,数据存储装置内存储的数据对象的时间戳信息可以包括在存储装置信息310内。这样的时间戳信息可以按任何适合的方式实现。例如:作为细粒度对象的数据本身的一部分(例如,表格行、数组列表(ArrayList)内的对象);作为粗粒度单元(分区、文件)的元数据;或其甚至可以结合到所使用的命名惯例中。
在本发明的某些示例中,考虑了数据对象组的退役优先级值可以至少部分地基于以下比率来计算:
退役优先级=(TS_旧–TS_新)/T_最小。   [方程式1]
其中TS_旧是所选择的数据存储装置内的对就的数据对象组的最旧数据的时间戳,并且TS_新是在所选择的数据存储装置内的对应的数据对象组的最近数据的时间戳。因此,对于在图3中所示的示例,控制器320可以被安排成用于将对于每个数据对象组的最旧和最新(最近)的时间戳信息TS_旧和TS_新以及最小时间段T_最小提供到优先级值计算器组件340。然后,优先级值计算器组件340可以计算每个数据对象组的退役优先级值并将退役优先级值返回至控制器320。
返回参照图4,已经确定用于所标识的数据对象组的优先级值之后,所述方法前进到步骤440,在440,在所示的示例中,标识包括最高退役优先级值的数据对象组。然后,来自所标识的数据对象组的包括最高退役优先级值的数据对象在步骤445退役。
在本发明的某些示例中,针对每个数据对象组,可以在配置数据315内定义退役时期(R_时期)。退役周期(R_时期)表示数据对象组内的(最旧)数据对象可以在单一的数据退役操作中退役的时间跨度长度。这实际上是在数据对象组内退役的数据对象的“分辨率”。例如,更重要的(例如,更高优先级)数据可以在比较不重要的数据更小的退役时期(R_时期)内退役。因此,在步骤445,来自所标识的数据对象组的包括最高退役优先级值的“大片”数据对象可以退役,包括那个组中的所有数据对象,针对其:
TS<(TS_旧+R_时期)  [方程式2]
其中TS是特定数据对象的时间戳。
是本发明的某些示例中,数据对象可以仅在如下情况下从包括最高退役优先级值的所标识的数据对象组退役:在这样的退役之后,剩余的(未退役的)数据对象覆盖最小时间段。这样的最小时间段可以等于例如最小时间段(T_最小)。相应地,在步骤445,数据对象可以从包括最高退役优先级值的所标识的数据对象组退役,只要:
TS_新–(TS_旧+R_时期)<T_最小  [方程式3]
在所展示的示例中,来自所标识的数据对象组的包括最高退役优先级值的数据对象从所有数据存储装置(容器)退役,并且不仅是从所选择的数据存储装置。以此方式,来自可能以任何分布模式(即,不必跨所有容器等同地、或以严格的时间顺序)跨多个数据存储装置分散的特定组的数据对象,可以从所有容器移除,以便避免例如某些数据的“孤立”并减少将数据从多个数据存储装置退役所需要的迭代数目。
因此,针对在图3中所示的示例,控制器320可以按安排成用于将包括最高退役优先级值的数据对象组的最旧和最新(最近)的时间戳信息TS_旧将TS_新以及最小时间段R_时期和退役时期(R_时期)提供到数据对象退役组件350。数据对象退役组件350然后可以相应地实现数据对象的退役。例如,数据对象退役组件350可以被安排成用于标识待退役的数据对象,并且致使所标识的数据对象从数据存储装置120删除(例如,经由数据访问模块130或经由分配和存储组件160)。替代地,数据对象退役组件350可以简单地将在数据存储装置120内的由待退役的数据对象占据的存储器区域标识为对数据访问模块130和/或分配和存储模块160可用,由此使得新数据能够后续地被写在退役的数据上。
返回参照图4,已经实现对于所选择的数据存储装置在包括最高退役优先级值的数据对象组内的数据对象的退役之后,所述方法前进到步骤450,在450确定是否在当前循环/迭代中已经选择了所有数据存储装置。如果一个或多个数据存储装置尚未被选择,则所述方法前进到步骤455,在455选择下一个数据存储装置并且所述方法返回到针对新选择的数据存储装置的步骤420。
如果在当前循环/迭代中已经选择了所有数据存储装置,则所述方法前进到步骤460,在460确定对于所有数据存储装置,对应的数据存储容器内的可用空间量是否超过对应的预先确定的是小量,如在步骤425针对每个数据存储装置所确定的。
如果确定对应的数据存储容器内的可用空间量超过每个数据存储装置的对相应的预先确定的最小量,那么可以确定所有数据存储装置包括足够的可用空间并且不需要将数据对象退役。相应地,方法跳跃到步骤475并结束。
相反,如果确定对于一个或多个数据存储装置可用空间的量没有超过相应的预先确定的最小量,那么所述方法前进到步骤465,在465循环计数器增量。接着,在步骤470,确定循环计数器值是否超过一个预定义值N(即循环/迭代的数目是否已经到达最大数目)。在图3中所示的示例中,预定义值N可以在配置数据315中定义。
如果循环计数值没有超过预定义值N,那么所述方法循环回到415并且重复步骤415到460。相反,如果循环计数器值超过预定义值N,那么为了避免进行所述方法的过度迭代,方法在步骤475结束。
在图3中所示的示例中,数据退役模块进一步包括计时组件360以使得控制器能够调度管理数据存储装置120内存储的数据的退役的方法的周期性执行,如在图4中所示的方法。以此方式,数据退役模块可以被安排成用于自动周期性地启动管理在数据存储装置120内存储的数据的退役的方法。
以下是用于实现图4的方法的一个算法的伪代码实现方式的示例:
循环直到或者所有容器具有(%可用>最小)或者完成N次迭代:
{
针对所有容器:
{
确定容器%可用空间;
如果(容器实际%可用<容器最小%可用):
{
确定由容器中存储的数据对象表示的组;
针对容器中表示的所有组:
确定比率(TS_旧-TS_新)/T_最小;
针对具有最高比率的组:
跨所有容器将具有如下条件的组数据对象退役:
TS<(TS_旧+R_时期);
只要:
TS_新-(TS_旧+R_时期)<T_最小
}
}
}
有利地,采用此算法来改变在数据存储装置内的可用空间(%可用)的量,并且可以容易地适应数据存储装置本身的变化。结果是,算法(并且因此图3和4的方法和设备)能够适应存储情形的改变,如向操作系统添加新的存储装置(例如硬盘)、一个或多个存储装置的部分或完全失效,如一个或多个盘上的“坏扇区”的出现,或者存储装置与另一个(独立和/或不相关)系统共享的情况,由此可以使用的可用空间量是不可预测的。
返回参照图3,将认识到,在所示的示例中展示的配置数据315使得用于数据退役的各参数能够是可配置的。例如,网络运营商或其他用户可以配置各参数,例如,像:
-每个数据对象组的最小时期(T_最小);
-对于每个数据对象组的退役时期(R_时期);
-针对每个数据存储装置的最小可用空间阈值(最小%可用);
-图4的方法的迭代(循循)的最大数目N;
-等等。
以此方式,网络运营商或其他用户可以灵活地适应数据保留/退役的优先级以及单独数据存储装置内的空间的清空。
网络运营商或其他用户还可以根据要求配置/更改数据对象的分组,以使得某些类别的数据对象的保留可以设为优先,以方便例如具体故障的检测和诊断等。例如,在图3中所示的示例中,数据退役模块170可以在每次执行上述算法时接收例如存储装置信息310内的所要求的数据对象组信息。以此方式,在算法的多次执行之间的数对象分组的变化可以进行考虑。
现在将参照图5和6描述根据上述算法(并且等同地在图4中展示的方法)从数据存储装置退役数据的示例。首先参照图5,展示了其内已经了数据对象的多个数据存储装置510、520、530。确切地,图5展示了在调用上述算法时数据存储装置的状态的示例。
数据存储装置510、520、530已经在其中存储了已经被分组到一起的数据对象。如上所述,数据对象可以基于用于数据对象的一个或多个退役优先级特性被指定给数据对象组。在所展示例中,第一数据存储装置510包括已经被指定给(至少)三个数据对象组541、542、544的数据对象,分别标记为G1_Obj、G2_Obj和G4_Obj。第二数据存储装置520包括已经被指定给(至少)三个数据对象组543、541、544的数据对象,分别标记为G3_Obj、G1_Obj和G4_Obj。第三数据存储装置530包括已经被指定给(至少)三个数据对象组545、542、541的数据对象,分别标记为G5_Obj、G2_Obj和G1_Obj。值得注意的是,指定给数据对象组G1_Obj 541的数据对象已经存储在所有三个数据存储装置510、520、530中,指定给数据对象组G2_Obj 542的数据对象已经存储在第一和第三数据存储装置510、530中,指定给数据对象组G3_Obj 543的数据对象已经存储在第二数据存储装置520中,指定给数据对象组G4_ObjObj 544的数据对象已经存储在第一和第二数据存储装置510、520中,并且指定给数据对象组G5_Obj 545的数据对象已经存储在第三数据存储装置530中。
如在图5中所示,在调用上述算法时,第一数据存储装置510的状态如下:
-包含用于数据对象组G1_对象541的覆盖十二天时期的数据,即(TS_旧–TS_新)=12;
-包含用于数据对象组G2_对象542的覆盖十天时期的数据,即(TS_旧–TS_新)=10;
-包含用于数据对象组G4_对象544的覆盖二十二天时期的数据,即(TS_旧-TS_新)=22;以以
-具有10%可用存储空间。
类似地,在调用上述算法时,第二数据存储装置520的状态如下:
-包含用于数据对象组G3_对象543的覆盖十天进期的数据,即(TS_旧–TS_新)=10;
-包含用于数据对象组G1_对象541的覆盖十天时期的数据,即(TS_旧–TS_新)=10;
-包含用于数据对象组G4_对象544的覆盖二十二天进期的数据,即(TS_旧–TS_新)=22;以及
-具有25%可用存储空间。
最后,在调用上述算法时,第二数据存储装置530的状态如下:
-包含用于数据对象组G5_对象545的覆盖二十二天时期的数据,即(TS_旧–TS_新)=22;
-包含用于数据对象组G2_对象542的覆盖十天时期的数据,即(TS_旧-TS_新)=10;
-包含用于数据对象组G1_对象541的覆盖十天时期的数据,即(TS_旧-TS_新)=10;以及
-具有25%可用存储空间。
如先前提及的,针对每个数据存储装置确定一个或多个可用空间度量。对于上面的示例算法,可用空间度量包括代表相应存储装置的可用的(即可写入的)百分比的按比例的可用空间度量(%可用),并且从上述信息,在调用该算法时数据存储装置510、520、530中每一个的可用空间度量是:
-针对第一数据存储装置510:%可用1=10%
-针对第二数据存储装置520:%可用2=25%
-针对第三数据存储装置530:%可用3=25%。
已经确定对于每个存储装置510、520、530的可用空间度量(%可用)之后,将每个可用空间度量与对于对应数据存储装置510、520、530的最小可用空间阈值进行比较。为了本示例的目的,假设针对图5中所示的数据存储装置510、520、530已经定义了以下的最小可用空间阈值(最小%可用):
-针对第一数据存储装置510:最小%可用1=15%
-针对第二数据存储装置520:最小%可用2=20%
-针对第三数据存储装置530:最小%可用3=10%
在调用该算法时,可以看到第一数据存储装置510的可用空间度量(%可用)等于10%,小于其最小可用空间阈值(最小%可用1)。
已经标识了第一数据存储装置510的可用空间度量(%可用)是小于其最小可用空间阈值(最小%可用1)之后,然后确定第一数据存储装置510内存储的数据对象所表示的组;即,数据对象组G1_Obj 541、对象组G2_Obj 542和对象组G4_Obj 544。然后基于比率(TS_旧–TS_新)/T_最小计算这些组中的每一个的退役优先级值。
如先前提及的,针对每个数据对象组定义最小时间周期(T_最小)。为了本示例的目的,假设数据对象组G1_Obj 541、G2_Obj 542和G4_Obj 544已经定义了以下最小时期(T_最小)。
-针对数据对象组G1_Obj 541:T_最小1=4天
-针对数据对象组G2_Obj 542:T_最小2=4天
-针对数据对象组G4_Obj 544:T_最小4=18天
针对第一存储装置,如上所标识的:
-针对数据对象组G1_Obj 541,(TS_旧–TS_新)=12;
-针对数据对象组G2_Obj 541,(TS_旧–TS_新)=10;
-针对数据对象组G4_Obj 544,(TS_旧–TS_新)=22。
所以,在第一数据存储装置内对于数据对象组G1_Obj 541、G2_Obj 541和G4_Obj 544的比率(TS_旧–TS_新)/T_最小,并且因此比率(TS_旧–TS_新)/T_最小,以及因此退役优先级值可以计算为:
-针对数据对象组G1_Obj 541,12/4=3;
-针对数据对象组G2_Obj 542,10/4=2.5;并且
-针对数据对象组G4_Obj 544,22/18=1.2;
上述比率是重要的,因为它们设置了数据对象组的相对优先级水平,并因而确定了哪些数据退役以及频率。
因此,从这些计算的退役优先级值,可以看出数据对象组G1_Obj 541包括最高比率,并因此包括最高退役优先级值。相应地,数据对象组G1_Obj 541需要退役,在所示的示例中跨所有数据存储装置。具体地,要要TS_新–(TS_旧+R_时期)<T_最小,就使TS<(TS_旧+R_时期)的数据对象退役,
为了这个示例的目的,分设对于数据对象组G1_Obj 541已经定义了两天的退役时期(R_时期)。这样,在所有数据存储装置510、520、530内将最旧为两天的数据从数据对象组G1_Obj 541退役。
图6展示了在所描述的上述算法的单次迭代之后数据存储装置的状态。如在图6中展示的,在执行上述算法之后,第一数据存储装置510的状态如下:
-包含用于数据对象组G1_Obj 541的覆盖十天时期的数据,即(TS_旧–TS_新)=10;
-包含用于数据对象组G2_对象542的覆盖十天时期的数据,即(TS_旧–TS_新)=10;
-包含用于数据对象组G4_对象544的覆盖二十二天时期的数据,即(TS_旧–TS_新)=22;以及
-具有16%可用存储空间。
类似地,在执行上述算法之后,第二数据存储装置520的状态如下:
-包含用于数据对象组G3_对象543为覆盖十天时期的数据,即(TS_旧–TS_新)=10;
-包含用于数据对象组G1_对象541的覆盖十天时期的数据,即(TS_旧–TS_新)=8;
-包含用于数据对象组G4_对象544的覆盖二十二天时期的数据,即(TS_旧–TS_新)=22;以及
-具有28%可用存储空间。
最后,在执行上述算法之后,第三数据存储装置530的状态如下:
-包含用于数据对象组G5_对象545的覆盖二十二天时期伯数据,即(TS_旧–TS_新)=22;
-包含用于数据对象组G2_对象542的覆盖十天时期的数据,即(TS_旧–TS_新)=10;
-包含用于数据对象组G1_对象541的覆盖十天时期的数据,即(TS_旧–TS_新)=8;以及
-具有27%可用存储空间。
如可见的,G1_Obj 541的数据天数已经在数据存储装置510、520、530中的每一个内降低了二;即降低了对于G1_Obj 541的退役周期(R_时期)。结果是,在数据存储装置510、520、530中每一个内的可用存储空间量已经增加。明显地,在所展示的示例中,在执行该算法之后,第一数据存储装置510内的可用存储空间的量已经从10%增加到16%,造成第一数据存储装置510中的可用存储空间的量超过其15%的最小可用空间阈值(最小%可用1)。不需要进一步的迭代,因为所有三个数据存储装置510、520、530现在具有足够的可用存储空间。
将认识到,本发明的某些示例实施例,如图4中展示的方法,提供超过用于数据退役的现有技术解决方案的以下优点中的至少一部分:
-动态地在组定的存储空间限制内最大可能地保留重要和有用数据的能力;
-动态地将相对大部分的可用存储空间分配给“重要的”信息并将相对小量(但仍然有)分配给更低优先级数据的能力;
-管理近实时加载的数据的滚动窗口的能力;
-使数据存储容器(例如,文件系统、表空间、裸盘)的使用率最大化而同时为待存储的新数据提供足够空间的能力;
-为不同的数据组维持独立的滚动窗口的能力;
-按需要动态地移除或转出旧数据的能力;
-动态地适应不断变化的存储情形(或者在进入数据的量上或者在可用存储器的大小上)的能力;以及
-在一个或多个存储装置中部分失效的事件中一定的容错度。
现在参照图7,展示了可以用于实现本发明的实施例中的数据处理功能性的典型计算系统700。例如,此类的计算系统可以用在图1的数据管理系统100内。相关领域垢技术人员还将认识到如何使用其他计算机系统或架构实现本发明。计算系统700可能表示例如台式计算机、膝上型计算机、平板计算机或笔记本计算机、手持式计算装置(PDA、手机、掌上型计算机等)、大型计算机、服务器、客户机、或可能令人希望的或适合于给定应用或环境的任何其他类型的专用或通用计算装置。计算系统700可以包括一个或多个处理器,如处理器704。可以使用通用或专用处理引擎(如,例如微处理器、微控制器或其他控制模块)实现处理器704。在本示例中,处理器704连接至总线702或其他通信介质。
计算系统700还可以包括用于存储处理器704有待执行的信息和指令的主存储器708,如随机存取存储器(RAM)或其他动态存储器。主存储器708还可以用于在处理器704有待执行的指令的执行过程中存储临时变量或其他中间信息。计算系统700同样可以包括联接至总线702的用于存储处理器704的静态信息和指令的只读存储器(ROM)或其他静态存储装置。
计算系统700还可以包括信息存储系统710,其可以包括例如媒体驱动器712和可移除存储接口720。媒体驱动712可以包括支持固定或可移除存储介质的驱动器或其他机构,如硬盘驱动器、软盘驱动器、磁带驱动器、光盘驱动器、激光唱片(CD)或数字视频驱动器(DVD)读或写驱动器(R或RW)、或其他可移除或固定媒体驱动器。存储介质718可以包括例如硬盘、软盘、磁带、光盘、CD或DVD、或媒体驱动器712读取和写入的其他固定或可移除介质。如这些示例所示,存储介质718可以包括其中存储有特殊计算机软件或数据的计算机可读存储介质。
在替代实现例中,信息存储系统710可以包括用于允许计算机程序或其他指令或数据被加载到计算系统700中的其他类似组件。这种组件可以包括例如可移除存储单元722和接口720(如程序盒和盒式接口)、可移除存储器(例如,闪速存储器或其他可移除存储器模块)和存储器插槽、以及允许软件和数据从可移除存储单元718传输到计算系统700的其他可移除存储单元722和接口720。
计算系统700还可以包括通信接口724。通信接口724可以用于允许在计算系统700与外部装置之间传输软件和数据。通信接口724可以包括调制解调器、网络接口(如以太网或其他NIC卡)、通信端口(如,例如通用串行总线(USB)端口)、PCMCIA插槽和卡等。经由通信接口724传输的软件和数据是呈可以为电子信号、电磁信号、以及光信号或能够被通信接口724接收的其他信号的形式。这些信号经由通道728提供给通信接口724。此通道728可以携带信号并且可以使用无线介质、导线或缆线、光纤光学器件或其他通信介质来实现。通道的某些示例包括电话线、蜂窝电话链路、RF链路、网络接口、局域网或广域网以及其他通信通道。
在本文件中,术语‘计算机程序产品’、‘计算机可读介质’等通常可以用于指例如像存储器708、存储装置718或存储单元722等介质。这些或其他形式的计算机可读介质可以存储一个或多个供处理器704使用的致使处理器执行特定操作的指令。这种指令通常指‘计算机程序代码’(其可以被分组成到计算机程序代码的形式或其他分组),当被执行时,使得计算系统700能够执行本发明的实施例的功能。应指出的是,代码可以直接致使处理器执行特定操作、被编译成用于那么做、和/或与其他软件、硬件和/或固件元件组合(例如,用于存储标准功能的库)来那么做。
如在此使用的,表达非瞬态将被理解成是指存储介质本身的非短暂性质,而不是所存储的信息本身可以在存储状态下坚持多久的概念。相应地,然而,可以另外被视为例如易失性(如许多电可擦除可编程只读存储器(EPROM)或随机存储存储器(RAM)的存储器此处被视为‘非瞬态’,而传送中的信号载波被认为是‘瞬态的’,尽管信号可以保持传送中持续一段长时期。
在使用软件实现元件的实施例中,软件可以存储在计算机而读介质中并使用例如可移除存储驱动器722、驱动器712或通信接口724加载到计算系统700内。当被处理器704执行时,控制模块致使处理器704执行如在此描述的本发明的功能。
此外,发明概念可以应用于任何信号处理单元。进一步设想到,例如,半导体制造商可以将该发明概念用于独立式装置的设计,如微控制器、数字信号处理器、或专用集成电路(ASIC)和/或任何其他子系统元件。
将认识到,为了清晰性目的,以上描述已经引用不同功能单元和处理器描述了本发明的实施例。然而,将明显的是,在不减损本发明的情况下,可以使用功能性在不同功能单元或处理器之间的任何合适的分布。例如,单独的处理器或控制可以执行所示的有待由同一处理器或控制执行的功能性。因此,对特定功能单元的引用仅被视为对使用于提供所述功能性的装置的引用,而不指示严格的逻辑或物理结构或组织。
具体地,如图1中所展示的示例中,数据退役模块170已经被展示并描述为包括一个“完整”数据管理系统100的一个整体式部分,其中数据管理系统进一步包括数据存储功能性和数据调取功能性。然而,考虑了这样的数据退役模块并不受限于在这样的完整的数据管理系统中实现。例如,在某些示例中,数据退役模块170可以在如下的数据管理系统内实现,该数据管理系统被安排为用于仅仅提供数据退役功能性;其他的功能性如数据存储和数据检索由其他的分开的系统提供
因为所示本发明的实施例可以很大程度上使用本领域的技术人员熟知的电子组件来实现,所以为了理解所认识本发明的基本概念并且为了不模糊或减损本发明的教示,将不会比如上所示认为的必要性更详细的程度解释细节。
在前述说明书中,已经参考本发明的实施例的特定示例描述了本发明。然而,将明显的是,在不脱离如所附权利要求书中所阐述的本发明的更宽泛的精神和范围的情况下,可以在其中进行各种修改和变化。其他修改、更改和替代方案也是可以的。相应地,应以说明性而非限制性意义看待说明书和附图。
在权利要求书中,置于园括号之间的任何参考符号不应被解释位限制权利要求。词语‘包括’没有排除存在除了权利要求中所列的那些元件以外的其他元件。此外,如在此使用的术语‘一个’或‘一种’被定义为一个或不止一个。并且,如权利要求书中的“至少一个”和“一个或多个”等介绍性短语的使用不应被解释为隐含不定冠词“一个”或“一种”介绍的另一个权利要求元素将包含所介绍的这种具体权利要求元素的任何具体权利要求局限于仅包含一个这种元素的发明,甚至当同一权利要求包括介绍信短语“至少一个”和“一个或多个”以及不定冠词,如“一个”或“一种”。针对定冠词的使用,情况相同。除非另外声明,否则如“第一”和“第二”术语用于在这种术语描述的元素之间进行随意区分。因此,这些术语不一定皆在指示这种元素的时间或其他优先次序。相互不同的权利要求中引用某些措施的单纯事实并不指示不可以使用这些措施的组合来处于优势。

Claims (20)

1.一种管理用于至少一个无线通信网络的数据的方法,所述方法包括:
确定用于至少一个数据存储装置的至少一个可用空间度量;
将用于所述至少一个数据存储装置的所述至少一个所确定的可用空间度量与至少一个阈值进行比较;以及
如果用于所述至少一个数据存储装置的所述至少一个所确定的可用空间度量超过所述至少一个阈值:
标识由存储在所述至少一个数据存储装置中的数据对象表示的多个数据对象组;
确定用于每个所标识的数据对象组的一个保留优先级值;
至少部分地基于所述所确定的保留优先级值确定为其使多个数据对象退役的至少一个数据对象组;以及
使来自所述至少一个数据存储装置的所述所确定的至少一个数据对象组内的多个数据对象退役。
2.如权利要求1所述的方法,其中,所述可用空间度量包括以下各项中的至少一项:
一个按比例的可用空间度量;以及
一个绝对可用空间度量。
3.如权利要求1所述的方法,其中,用于一个所标识的数据对象组的所述保留优先级值是至少部分地基于用于对应的数据对象组的一个最小保留期值来计算。
4.如权利要求1所述的方法,其中,用于一个所标识的数据对象组的所述保留优先级值是至少部分地基于一段时期来计算,在所述时期中,将多个数据对象存储在对应的数据对象组内。
5.如权利要求1所述的方法,其中,用于一个所标识的数据对象组的所述保留优先级值是至少部分地基于以下比率来计算:(TS_旧-TS_新)/T_最小。
6.如权利要求1所述的方法,其中,所述方法包括确定至少一个数据对象组,针对所述至少一个数据对象组,至少部分地基于包括一个极限保留优先级值的一个数据对象组使多个数据对象退役。
7.如权利要求1所述的方法,其中,所述方法包括使在来自所述至少一个数据存储装置的所述所确定的至少一个数据对象组内的多个数据对象退役,这些数据对象组包括比一个退役截止时间值更旧的一个时间戳值。
8.如权利要求7所述的方法,其中,所述退役截止时间值等于所述所确定的至少一个数据对象组内的一个最旧的数据对象的一个时间戳值+一个数据移除时期值。
9.如权利要求8所述的方法,其中,所述退役截止时间值等于所述所确定的至少一个数据对象组内的一个最旧的数据对象的一个时间戳值+一个数据对象组特定的数据移除时期期值。
10.如权利要求1所述的方法,其中,所述方法包括使在来自所述至少一个数据存储装置的所述所确定的至少一个数据对象组内的多个数据对象退役,只要:
TS_新-(TS_旧+R_时期)<T_最小。
11.如权利要求1所述的方法,其中,数据对象是至少部分也基于以下各项中的一项或多项分组的数据对象:
空中接口技术;
数据类型;
用户分类;
地理位置;
用户设备的装置类型(型号)或制造商;
12.如权利要求1所述的方法,其中,所述方法包括确定用于多个数据存储装置的可用空间度量;
将用于所述多个数据存储装置的所述所确定的可用空间度量与至少一个阈值进行比较;以及
如果用于至少一个数据存储装置的所述所确定的至少一个可用空间度量超过所述至少一个阈值:
标识由至少存储在所述可用空间度量超过所述至少一个阈值的数据存储装置内的多个数据对象表示的数据对象组;
确定用于每个所标识的数据对象组的一个保留优先级值;
至少部分地基于所述所确定的保留优先级值确定为其使多个数据对象退役的至少一个数据对象组;以及
使至少来自所述可用空间度量超过所述至少一个阈值的数据存储装置的所述所确定的至少一个数据对象组内的多个数据对象退役。
13.如权利要求12所述的方法,其中,所述方法包括使在来自所述数据存储装置中的所确装置的所述所确定的至少一个数据对象组内的多个数据对象退役。
14.如权利要求12所述的方法,其中,所述方法包括将用于所述多个数据存储装置的所述所确定的可用空间度量与数据存储装置特定阈值进行比较。
15.如权利要求1所述的方法,其中,所述方法包括使在所述所确定的至少一个数据对象组内的具有一个比TS_旧+R_时期更早的时间戳的多个数据对象退役。
16.如权利要求1所述的方法,其中,所述方法被安排成自动周期性地启动。
17.一种数据管理系统,包括至少一个数据处理模块,所述数据处理模块被安排成用于;
确定用于至少一个数据存储装置的至少一个可用空间度量;
将用于所述至少一个数据存储装置的所述至少一个所确定的可用空间度量与至少一个阈值进行比较;以及
如果用于所述至少一个数据存储装置的所述至少一个所确定的可用空间度量超过所述至少一个阈值:
标识由在所述至少一个数据存储装置内存储的多个数据对象表示的多个数据对象组;
确定用于每个所标识的数据对象组的一个保留优先级值;
至少部分地基于所述所确定的保留优先级值确定为其使多个数据对象退役的至少一个数据对象组;以及
使来自所述至少一个数据存储装置的所述所确定的至少一个数据对象组内的多个数据对象退役。
18.一种无线通信系统,所述无线通信系统结合有如权利要求17所述的数据管理系统。
19.一种非瞬态计算机程序产品,所述产品具有存储在其上的计算机可读代码,用于对一个数据处理模块进行编程以执行一种管理用于至少一个无线通信网络的数据的方法,所述代码可操作用于:
确定用于至少一个数据存储装置的至少一个可用空间度量;
将用于所述至少一个数据存储装置的所述至少一个所确定的可用空间度量与至少一个阈值进行比较;以及
如果用于所述至少一个数据存储装置的所述至少一个所确定的可用空间度量超过所述至少一个阈值:
标识由存储在所述至少一个数据存储装置中的数据对象表示的多个数据对象组;
确定用于每个所标识的数据对象组的一个保留优先级值;
至少部分地基于所确定的保留优先级值确定为其使多个数据对象退役的至少一个数据对象组;以及
使来自所述至少一个数据存储装置的所述所确定的至少一个数据对象组内的多个数据对象退役。
20.如权利要求19所述的非瞬态计算机程序产品,其中,所述非瞬态计算机程序产品包括以下各项中的至少一项:硬盘、CD-ROM、光存储装置、磁存储装置、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)和闪速存储器。
CN201410766196.5A 2013-12-11 2014-12-11 用于管理数据的方法以及设备 Active CN104717761B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/103,518 2013-12-11
US14/103,518 US9767105B2 (en) 2013-12-11 2013-12-11 Method and apparatus for managing data

Publications (2)

Publication Number Publication Date
CN104717761A true CN104717761A (zh) 2015-06-17
CN104717761B CN104717761B (zh) 2019-09-13

Family

ID=52103218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410766196.5A Active CN104717761B (zh) 2013-12-11 2014-12-11 用于管理数据的方法以及设备

Country Status (3)

Country Link
US (1) US9767105B2 (zh)
EP (1) EP2889750B1 (zh)
CN (1) CN104717761B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10346897B2 (en) * 2014-05-30 2019-07-09 Walmart Apollo, Llc Method and system for smart order management and application level sharding
US10410169B2 (en) 2014-05-30 2019-09-10 Walmart Apollo, Llc Smart inventory management and database sharding
US9659079B2 (en) 2014-05-30 2017-05-23 Wal-Mart Stores, Inc. Shard determination logic for scalable order and inventory management architecture with a sharded transactional database
US10043208B2 (en) * 2014-05-30 2018-08-07 Walmart Apollo, Llc Smart order management and database sharding
US9916199B2 (en) * 2016-03-30 2018-03-13 Intel Corporation Method and apparatus for an error tolerance aware data retention scheme in a storage device for multi-scale error tolerant data
US10545699B2 (en) * 2017-04-11 2020-01-28 International Business Machines Corporation Dynamic retention policies and optional deletes
US10459836B2 (en) * 2017-06-22 2019-10-29 Macronix International Co., Ltd. Memory device and associated control method
US10789507B2 (en) * 2018-03-30 2020-09-29 Walmart Apollo, Llc Relative density-based clustering and anomaly detection system
CN111124291B (zh) * 2019-12-09 2023-05-30 北京金山云网络技术有限公司 分布式存储系统的数据存储处理方法、装置、电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050055512A1 (en) * 2003-09-05 2005-03-10 Kishi Gregory Tad Apparatus, system, and method flushing data from a cache to secondary storage
US20060075007A1 (en) * 2004-09-17 2006-04-06 International Business Machines Corporation System and method for optimizing a storage system to support full utilization of storage space
CN101496005A (zh) * 2005-12-29 2009-07-29 亚马逊科技公司 具有网络服务客户接口的分布式存储系统
CN101540769A (zh) * 2008-03-19 2009-09-23 索尼株式会社 信息处理单元、客户端设备、信息处理方法和系统
CN101635734A (zh) * 2008-07-22 2010-01-27 上海聚力传媒技术有限公司 非易失性存储介质上的下载数据存储管理方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7162524B2 (en) * 2002-06-21 2007-01-09 International Business Machines Corporation Gapless delivery and durable subscriptions in a content-based publish/subscribe system
US7613212B1 (en) * 2003-06-10 2009-11-03 Atrica Israel Ltd. Centralized clock synchronization for time division multiplexed traffic transported over Ethernet networks
JP5130734B2 (ja) * 2007-02-15 2013-01-30 ソニー株式会社 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
WO2010081658A2 (en) 2009-01-13 2010-07-22 Arieso Limited Geo-location in a wireless communication network

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050055512A1 (en) * 2003-09-05 2005-03-10 Kishi Gregory Tad Apparatus, system, and method flushing data from a cache to secondary storage
US20060075007A1 (en) * 2004-09-17 2006-04-06 International Business Machines Corporation System and method for optimizing a storage system to support full utilization of storage space
CN101496005A (zh) * 2005-12-29 2009-07-29 亚马逊科技公司 具有网络服务客户接口的分布式存储系统
CN101540769A (zh) * 2008-03-19 2009-09-23 索尼株式会社 信息处理单元、客户端设备、信息处理方法和系统
US20090240766A1 (en) * 2008-03-19 2009-09-24 Norifumi Kikkawa Information processing unit, information processing method, client device and information processing system
CN101635734A (zh) * 2008-07-22 2010-01-27 上海聚力传媒技术有限公司 非易失性存储介质上的下载数据存储管理方法及装置

Also Published As

Publication number Publication date
EP2889750A3 (en) 2015-08-05
CN104717761B (zh) 2019-09-13
US9767105B2 (en) 2017-09-19
EP2889750A2 (en) 2015-07-01
US20150161148A1 (en) 2015-06-11
EP2889750B1 (en) 2018-10-24

Similar Documents

Publication Publication Date Title
CN104717761A (zh) 用于管理数据的方法以及设备
US10911952B1 (en) Autonomous assistant for mobile and stationary environments
CN100478956C (zh) 生成和获取报表的方法及相应的系统
CN102612831B (zh) 用于同步社交网络中的用户内容的方法和系统
CN104081339B (zh) 基于优先级和数据使用计划来管理通过网络连接的数据传输
US20140068212A1 (en) Device backups and updates in view of data usage statistics
CN101395672B (zh) 低存储量便携式媒体播放器
CN101552976B (zh) 多业务格式文件处理系统及方法
US9210600B1 (en) Wireless network performance analysis system and method
CN103108083A (zh) 移动终端的文件列表排序方法及系统
CN107092641A (zh) 店铺营业状态的判断方法和装置、店铺搜索的方法和装置
CN103098540B (zh) 用于共享无线数据服务的方法和装置
US20130268736A1 (en) Sensor data recording apparatus, method, and program
CN109901798A (zh) 数据存储方法及装置
US20040015573A1 (en) Network terminal setting information management method and information terminal device
CN104167216A (zh) 一种音频文件共享方法、装置及音箱
CN1662902B (zh) 网络中设备的数据信道资源优化的系统和方法
CN105229641A (zh) 用于实时管理呼叫数据的方法和装置
CN102034163A (zh) 一种对电信设备资产信息进行管理的方法和系统
CN105721348A (zh) 智能终端的流量控制方法及装置
CN101594686A (zh) 无线通信系统中用户优先级确定方法、装置及系统
WO2008032992A1 (en) Method for downloading multimedia contents to electronic picture frame
CN105247515A (zh) 用于管理空间相关呼叫数据的方法和装置
CN101997885B (zh) 一种用户数据调度方法、服务器及数据中心
CN101217755B (zh) 一种用于数据采集的前置机系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
CB02 Change of applicant information

Address after: Burke County, England

Applicant after: JDSU UK LTD

Address before: England Hampshire

Applicant before: JDSU UK Ltd.

COR Change of bibliographic data
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant