CN107851060B - 卸载数据分析应用中的概率计算 - Google Patents

卸载数据分析应用中的概率计算 Download PDF

Info

Publication number
CN107851060B
CN107851060B CN201680045160.5A CN201680045160A CN107851060B CN 107851060 B CN107851060 B CN 107851060B CN 201680045160 A CN201680045160 A CN 201680045160A CN 107851060 B CN107851060 B CN 107851060B
Authority
CN
China
Prior art keywords
call
processor
user
virtual machine
nfs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680045160.5A
Other languages
English (en)
Other versions
CN107851060A (zh
Inventor
维尼特·查德哈
戈皮纳斯·帕拉尼
施广宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN107851060A publication Critical patent/CN107851060A/zh
Application granted granted Critical
Publication of CN107851060B publication Critical patent/CN107851060B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/1824Distributed file systems implemented using Network-attached Storage [NAS] architecture
    • G06F16/183Provision of network file services by network file servers, e.g. by using NFS, CIFS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/188Virtual file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45583Memory management, e.g. access or allocation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/509Offload

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明描述了一种卸载概率计算的方法。本发明公开了一种应用服务器,所述应用服务器包括存储器和处理器并且耦合到网络附加存储设备,所述网络附加存储设备用于基于数据请求响应虚拟机容器的程序调用而创建专用进程。所述处理器将所述数据请求转发给所述网络附加存储设备,对一个或多个虚拟机进行编程以基于所述程序调用执行概率计算,并将所述概率计算指示给所述一个或多个虚拟机中的第一虚拟机。所述数据请求使用虚拟化查找调用转变为修改后的调用。

Description

卸载数据分析应用中的概率计算
相关申请案交叉申请
本申请要求2015年8月7日递交的发明名称为“卸载数据分析应用中的概率计算(Offloading Probabilistic Computations in Data Analytics Applications)”的第14/821,320号美国专利申请案的在先申请优先权,该在先申请的全部内容以引用的方式并入本文本中。
技术领域
本发明实施例大体上涉及分析计算领域。具体而言,本发明实施例涉及分布式概率计算。
背景技术
许多数据分析应用(例如,推荐引擎)需要通过专用概率数据结构(例如,布隆过滤bloom filter、线性计数、重对数计算(LogLog counting)、元素基数、count-min算法)基于非常大量的数据进行概率计算。这通常需要从一个或多个存储服务器中提取大量数据并将这些数据传输给计算节点以进行处理。目前没有将基于概率的计算卸载到在分布式文件存储服务器(例如,NFS/CIFS服务器)上执行的可行方案。一些方法使得将原始数据传送给节点以进行处理时的网络使用、NAS侧CPU使用、内存使用和NIC使用大幅度增加。其它缺点包括计算期间的数据提取延迟和应用服务器资源消耗。
非常大的数据集在web领域或数据分析领域很常见。许多模型用来处理大规模数据,例如MapReduce。这种大规模数据处理的一个示例是Hadoop生态系统,其以查询大数据集进行分析为基础。对于这种大规模数据,内存资源经常是一个限制性因素。已探研究过各种算法,这些算法尝试达成内存使用量与所需精度之间的折衷。因为分析需要估计查询结果,所以,如果基于用来计算期望值的计算模型,则该期望值的变化是可容许的且安全的。
发明内容
通过存储端处的轻量级(例如,低开销)VM实现了一种卸载概率计算方法。本方法通过嵌入概率运算(例如,语义)以及指向存储设备上的数据的指针,通过扩展分布式协议来实现。存储控制器执行多个功能,包括去重、配置、复制和分层。概率算法(例如,分类、聚类和协同过滤)可嵌入具有限定扩展的传统协议(NFS&CIFS)中。使用转换器或解析器将表达式(运算)转换为C个对象。每个运算在一个容器中执行,该容器提供沙盒化环境(VM或者进程级VM,如zeroVM)。不同运算以流水线方式执行,其中每个运算的输出被输入到下一运算。
在一项实施例中,描述了一种用于将概率计算卸载到存储设备的装置。所述装置包括应用服务器,所述应用服务器包括存储器和处理器并且耦合到网络附加存储设备,所述网络附加存储设备用于基于数据请求响应虚拟机容器的程序调用而创建专用进程。所述处理器将所述数据请求转发给所述网络附加存储设备,对一个或多个虚拟机进行编程以基于所述程序调用执行概率计算,并将所述概率计算指示给所述一个或多个虚拟机中的第一虚拟机。所述数据请求使用虚拟化查找调用转变为修改后的调用。
在另一实施例中,公开了一种用于将计算卸载到存储设备的方法。所述方法包括:使用用户级应用将进程标识符注册到处理器,以便与所述处理器建立通信信道并派生虚拟机的输出以创建新进程;使用虚拟化查找调用将数据请求转变为修改后的调用;使用虚拟化NFS程序调用和所述通信信道将所述修改后的调用转发给所述用户级应用;在所述处理器的内核地址空间与用户地址空间之间创建进程间通信信道;以及使用所述通信信道将NFS调用转发给所述虚拟机以执行所述概率计算。
附图说明
附图包含在并且构成本说明书的一部分,示出了本发明的各种实施例,并且与描述内容一起用于解释本发明的原则:
图1为根据本发明实施例的描绘示例性系统架构的方框图。
图2是根据本发明实施例的描绘用于从应用服务器卸载运算的示例性配置的方框图。
图3为根据本发明实施例的描绘示例性概率计算的方框图。
图4是根据本发明一些实施例的描绘用于将存储端处的VM与应用服务器集成的步骤的示例性计算机实施序列的流程图。
具体实施方式
现在将详细地给出一些实施例的参考。虽然结合可替代的实施例描述该主题,但应该理解它们不是旨在将请求保护的主题限制于这些实施例。相反,请求保护的主题旨在覆盖可以包括在由附加的权利要求书限定的请求保护的主题的精神和范围内的替代物、修改和等同物。
另外,在以下本发明的详细描述中,阐述了许多特定细节以便提供对请求保护主题的透彻理解。然而,所属领域的技术人员将认识到,可以在没有这些具体细节的情况下实践实施例。在其它实例中没有详细描述众所周知的方法、流程、部件和电路,以免对本请求保护的主题的各方面和特征造成不必要地模糊。
下面详细描述的部分以方法的方式表示和讨论。实施例很好地适合于执行多种其它步骤或在此处的流程图中引用的步骤的改变,以及以与此处描述和说明的不同的顺序执行。
该具体实施方式的一些部分按照程序、步骤、逻辑块、处理、以及对计算机存储器中的数据位的操作的其它符号表示来呈现。这些描述和表示是数据处理领域技术人员向该领域其他技术人员有效传达工作实质内容使用的方法。将程序、计算机执行的步骤、逻辑块、过程等一般设想为首尾一致的步骤或指令序列,以产生期望的结果。这些步骤需要物理量的物理操控。通常,并不是完全必须的,这些量以电信号或磁信号的形式存在,可以被存储、转移、合并和比较,否则将在电脑系统中被操控。有时候这种方法被证明是行之有效的,主要出于常见用法的考虑,将这些信号作为比特位、数值、元素、符号、字符、术语、或数字等等。
然而,应牢记,所有这些和类似术语与适当物理量相关联,且仅为应用于这些量的方便标签。除非确切地陈述为从以下论述显而易见,否则应了解,利用例如“访问”、“编写”、“包含”、“存储”、“传输”、“遍历”、“关联”、“标识”等术语的论述是指操控表示为系统的寄存器和存储器内的物理(电子)量的数据并将这些数据变换为类似地表示为系统存储器或寄存器或其它此类信息储存、传输或显示设备内的物理量的其它数据的计算机处理器、网络设备或其它电子计算设备的动作和进程。
卸载数据分析应用中的概率计算
随着存储操作成本越来越低,在存储设备侧执行的大规模计算(而不是将数据提取到计算节点的内存中以执行计算)变得更加可行。在存储设备侧执行概率计算可减少或消除将原始数据从一个或多个文件服务器传送到计算节点以进行处理时所需的网络使用、NAS侧CPU利用、内存使用和NIC使用。本文公开了一种使用修改后的应用API在分布式节点处计算概率计算的方法论。
为了对大的整数集执行概率计算,例如,原始数据需要能够以一种适用于查询数据分析的形式来表示。一个示例查询会尝试确定最前面的最频繁的k个元素。然而,维护数百万个整数的状态信息将需要大量内存。而近似数据结构可用于分析。Count-min是用于计算存储在数据集中的最前面k个元素的概率数据结构的示例。注意的是,可能需要多个哈希来存储数据集状态并实现数据集状态的查询。结果经常由元素的数量和数据集中的不同元素控制。类似地,概率数据结构的另一示例是布隆过滤器。布隆过滤器通过位集合使用若干独立的哈希函数来跟踪项目状态。一个示例应用用例是在受欢迎的社交网站中使用的推荐引擎,其中使用布隆过滤来排除一些候选项。
此处描述了使用轻量级虚拟化进行数据集的概率计算。在一种方法中,通过分布式文件系统协议传送查询,并在预先配置的专用于执行概率计算算法的虚拟机(virtualmachine,VM)上启动概率计算。这些VM用于从输入信道接收输入,执行概率算法,并通过输出信道发送结果。这一方法还支持派生(例如,创建新进程)或在多个VM间分配计算以执行不同的算法(例如,并行计算),从而提高计算性能和/或准确性。此外,所描述的方法可由于以下事实而扩展:可根据环境利用更多或更少的VM。
通常,数据分析(或基于机器学习的分析)经历多个阶段(例如,分类、聚类和协同过滤)。分类尝试基于某些特性对信息进行分类。执行聚类是为了发现具有相似特性的对象或确定重叠对象。协同过滤是一种常用来基于多个数据源过滤出对象的技术。每个阶段都有其自己的计算要求,而将非常大的数据集(例如,拍字节数据)进行分类可能需要大量处理能力。
这种概率计算方法通过存储端处的轻量级(例如,低开销)VM来实现。本方法通过嵌入概率运算(例如,语义)以及指向存储设备上的数据的指针,通过扩展分布式协议来实现。存储控制器执行多个功能,包括去重、配置、复制和分层。
参考图1,根据本发明一些实施例描绘了示例性系统架构100。在应用服务器102处接传入客户端请求101。应用服务器102执行NFS/CIFS客户端应用103,并通过网络结构104耦合到网络附加存储(network-attached storage,NAS)设备105和NAS设备107。NAS设备107包括具有一个或多个存储设备110的NAS服务器109,并维护轻量级的虚拟环境108。如图1所示,虚拟环境108具有多个虚拟机(例如,VC1、VC2、VC3和VC4)。
概率算法(例如,分类、聚类和协同过滤)可嵌入具有“prob_XXX”扩展的传统协议(NFS&CIFS)中。使用转换器或解析器将表达式(运算)转换为C个对象。每个运算在一个容器中执行,该容器提供沙盒化环境(VM或者进程级VM,如zeroVM)。不同运算以流水线方式执行,其中每个运算的输出被输入到下一运算。例如,可执行五个不同的运算:
Op1—从文件A读取图形
Op2—从文件B读取图形
Op3—执行协同过滤
Ope4—对Op3的输出执行count-min算法
Op5—将结果模型保存到文件C
表I
参考图2,根据本发明一些实施例描绘了用于从应用服务器卸载运算的示例性配置。应用服务器208执行应用201,程序调用使用NFS客户端202卸载。执行NFS服务器203的NAS设备209接收初始文件句柄提取以及修改后的NFS程序运算。NFS服务器203耦合到内核通信模块204。内核通信模块204可在通用处理器或网络处理器等上执行。内核通信模块204用于向用户级VM容器提供修改后的RPC调用的间接寻址。用户通信模块205具有用户级应用线程206,其用于从内核接收请求参数以配置沙盒环境。用户程序将进程ID(process ID,PID)注册到内核以与内核建立通信信道。存储部件内部的应用执行可以应用模板207,以基于配置参数改变存储容器的行为。
NFS协议和配置
网络文件系统是一种基于远程程序调用(remote procedural call,RPC)的网络协议。NFS协议将一个远程文件划分为大小相等的块,并支持按需、基于块的文件内容传输。为NFS协议定义了多个程序调用,例如读取(read)、查找(lookup)、读取目录(readdir)、移除(remove)等。虽然其它文件系统协议可用于本发明,但是NFS是首选协议,因为其使用了远程程序调用(remote procedural call,RPC)。
在NFS协议的上下文中,使用不透明文件句柄对文件或目录对象进行寻址。任何读取调用之前都要进行查找,以定位要读取的文件对象。然后迭代对读取调用进行调用,其中迭代数基于NFS配置和要提取的文件大小。随着文件大小持续增长,通常称为大数据,的趋势愈演愈烈以及随着领域中新工作负载的出现,某些操作(例如,分布式文件系统上的读取操作)变得非常消耗资源。在许多情况下,对于大规模数据,可以在后端设备上无缝执行联合运算,并向服务器地址空间中的应用返回结果。在从后端设备提取数据之后将运算(例如,逻辑或语义)嵌入传统的分布式协议中可能会降低或消除将大规模数据提取到服务器中的成本。
进程级虚拟机
进程级VM通常用于为一组进程提供沙盒化环境以安全地执行或者提供平台独立性给用户应用。进程级虚拟机是OpenVZ和Linux容器(Linux container,LXC)等虚拟化容器的重要部件。本发明的一个方面提供了用于应用执行的专用堆栈。一种为操作系统提供专用堆栈的方法称为Exokernel(还称为libOS)。Exokernel减少通常由单片操作系统(operating system,O/S)提供的抽象。O/S功能在用户级导出,应用可与专用O/S运行时和专用设备驱动器动态链接以减少或消除传统操作系统中发生的开销。libOS通常提供接口,例如进程管理、寻呼、文件系统和文件调用接口。随着大数据的到来,将数据移至靠近存储部件非常有利。例如,融合存储与处理和存储控制器位于同一模具或者非常靠近,可通过将计算任务卸载到存储部件来消除总线延迟或网络延迟。
基于libOS主体的轻量级虚拟化的一个示例是ZeroVM。ZeroVM使单个进程或任务能够隔离到单独的容器中。该方法仅支持基本任务而非完整软件堆栈的隔离(例如,沙盒化)。存储部件内部的应用执行可以应用模板清单,以基于配置参数改变存储容器的行为。通常,各抽象层被添加到存储设备之上,从而为客户端请求提供自定义服务。例如,可使用Linux LUN或卷来提供容量抽象。还存在专用于虚拟化的存储设备。
多个类别可用于模板容器以在存储侧部署进程级VM,例如容量、吞吐量、虚拟化和功能变换。根据本发明一些实施例,使用基于ZeroVM方法的轻量级虚拟化,因为谷歌(举例)原生客户端是一种经过良好测试的为应用提供安全执行的方法,并且虚拟机监视器执行VM需要的内存较少。
概率计算卸载
可修改用户应用API以包括新提议的NFS程序调用prob-lookup的概率运算。prob-lookup调用在多个文件上调用查找,在安全环境(进程级VM)中,在这些文件读取之上调用概率运算。这是一个迭代的程序调用,涉及查找文件名、调用读取、最终在其上应用概率运算计算(例如,count-min、布隆过滤器(bloom filter)、线性计数、重对数计算(LogLogcounting)等)。系统调用传递语义信息和文件清单给NFS prob-lookup程序调用。概率运算可定义为:
Figure BDA0001565453230000061
注意的是,客户端和服务器对在存储端可行的概率计算进行同步。虚拟机监视器可以将计算重指示给预配置有概率算法并监听来自客户端的请求的VM。
参考图3,根据本发明一些实施例描绘了示例性概率计算。如图所示,该实施方式具有DFS客户端303和DFS服务器306。第一NAS地址空间301中的DFS客户端303接收传入客户端302请求。该请求通过扩展协议304转发给具有第二NAS地址空间305的DFS服务器306。虚拟机环境307中的每个VM(例如,VC1、VC2、VC3和VCn)都可动态调用。根据一些实施例,每个VM用于执行不同的概率算法(例如,count-min、重对数计算(LogLog counting)、布隆过滤器(bloom filter))。布隆过滤器可使用高效利用空间的概率数据结构。将多个哈希函数应用到每个元素,并维护状态数据。布隆过滤器对于成员资格查询很有用。count-min运算对于频率估计很有效,例如以便确定大数据集中的最前面的k个元素。
可修改NFS/CIFS协议以通过添加以下原语支持执行基于概率的算法:
●prob_compute(“expr”);
o输入(expr)=要读取数据和操作类型(分类、聚类、协同过滤)的图形或数据文件
o输出=数据模型或状态
●prob_compute_save(“expr”,”filename”);
o输入(expr)=要读取数据和操作类型(分类、聚类、协同过滤)的图形或数据文件
o输入(filename)=存储结果的数据文件名。
o输出=状态
●prob_from(“filename”);
o与prob_compute和prob_compute_save结合使用以从数据文件加载多维数组(每个维度表示一个系列的事件)
o输入=文件名
o输出=多维数组
●prob_classify(“filename-X”,“filename-y”);
o用于基于信息特性对信息分类并生成模型
o输入=文件名-X源数据文件
o输入=文件名-y特性元素数据文件
o输出=训练后的模型
●prob_clustering(“filename-X”,“filename-y”);
o具有相似特性的集群对象
o输入=文件名-X源数据文件
o输出=二维数组(数据id和集群ID)
●prob_collabfilter(“filename-X”,“filename-y”);
o基于多个数据源过滤出数据
o输入=文件名-X源数据文件
o输入=文件名-y特性源数据文件
o输出=二维数组
表II
用户内核通信模块
内核模块用于向用户级zeroVM容器提供修改后的RPC调用的间接寻址。容器用于使用输入/输出参数和系统配置文件运行卸载的运算。内核模块在内核地址空间与用户地址空间之间创建进程间通信(inter-process communication,IPC)信道,以将NFS调用转发给虚拟机和/或安全容器。用户级应用线程用于从内核接收请求参数以配置沙盒环境。用户程序将进程ID注册到内核以与内核建立通信信道。
ZeroVM轻量级虚拟化
根据本发明一些实施例,ZeroVM云虚拟机监视器用于运行卸载的概率运算。ZeroVM是进程级沙盒,其支持在安全环境中执行单个任务。ZeroVM特征包括:限制应用的内存访问;能够运行外来编译的源代码;以及系统调用限制条件。抽象受到限制,使得非常小的表面会遭受攻击威胁。对于通信,ZeroVM有多个信道(例如,随机读取和按序写入)。ZeroVM中的VM可通过存储代表性参数的配置文件派生以自举安全环境。当一个修改后的RPC调用通过嵌入的语义调用时,这些参数可由用户级应用动态配置。
参考图4,根据本发明实施例描绘了用于将存储端处的VM与应用服务器集成的步骤的示例性顺序,其中卸载通过内核用户间接寻址执行。或者,该方法可采用用户级间接寻址。如流程图400所描绘,在卸载和部署期间可发生以下一系列示例性事件。在步骤401处,将通信模块作为间接寻址层加载以将基于语义的程序调用传递到进程级虚拟机。在步骤402处,将修改后的NFS服务器加载到O/S中以建立IPC通信信道用户空间容器。在步骤403处,调用用户级应用程序以将PID注册到内核模块并且还可按需派生VM。过程在步骤404处继续,在步骤404处,自举修改后的NFS服务器(mountd和nfsd)。在步骤405处,启动客户端应用,并通过虚拟化查找调用将数据请求转变为修改后的调用。在步骤406处,使用虚拟化NFS程序调用将修改后的调用转发给用户级应用,该虚拟化NFS程序调用还可为卸载到安全容器中的数据运算派生VM。在步骤407处,将结果发回给用户应用。
根据本发明的实施例如此处所述。虽然本公开已经在特定实施例中进行了描述,但是应理解,本公开不应该被解释为这些实施例的限制,而是根据以下权利要求书进行解释。

Claims (14)

1.一种用于将概率计算卸载到存储设备的装置,其特征在于,所述装置包括:
应用服务器,所述应用服务器包括存储器和处理器并且耦合到网络附加存储NAS设备,所述应用服务器包括对应用户级应用和网络文件系统NFS的服务器,所述NAS设备用于基于数据请求响应虚拟机容器的程序调用而创建专用进程,
其中,所述处理器注册用户程序的进程标识符以在所述用户程序与所述NAS设备之间建立通信信道;
所述处理器使用虚拟化查找调用将所述数据请求转变为修改后的调用;
所述处理器使用虚拟化NFS程序调用和所述通信信道将所述修改后的调用转发给所述用户级应用;
所述处理器在所述处理器的内核地址空间与用户地址空间之间创建进程间通信信道;
所述处理器使用所述进程间通信信道将NFS调用转发给一个或多个虚拟机以执行所述概率计算。
2.根据权利要求1所述的装置,其特征在于,所述处理器使用模板改变所述一个或多个虚拟机的一个或多个存储容器的行为。
3.根据权利要求1所述的装置,其特征在于,至少一个所述虚拟机用于执行概率算法。
4.根据权利要求1所述的装置,其特征在于,至少一个所述虚拟机执行重对数计算操作。
5.根据权利要求1所述的装置,其特征在于,至少一个所述虚拟机执行成员资格测试。
6.根据权利要求1所述的装置,其特征在于,至少一个所述虚拟机执行布隆过滤运算。
7.一种在计算机存储系统中将概率计算卸载到存储设备的方法,其特征在于,应用于应用服务器和网络附加存储NAS设备,所述应用服务器包括对应用户级应用和网络文件系统NFS的服务器,所述应用服务器包括存储器和处理器并且耦合到所述NAS设备,所述NAS设备用于基于数据请求响应虚拟机容器的程序调用而创建专用进程,所述方法包括:
使用用户级应用将进程标识符注册到所述处理器以与所述处理器建立通信信道;
使用虚拟化查找调用将所述数据请求转变为修改后的调用,所述修改后的调用包括添加原语以支持执行概率计算;
使用虚拟化NFS程序调用和所述通信信道将所述修改后的调用转发给所述用户级应用;
在所述处理器的内核地址空间与用户地址空间之间创建进程间通信信道;以及
使用所述进程间通信信道将NFS调用转发给一个或多个虚拟机以执行所述概率计算。
8.根据权利要求7所述的方法,其特征在于,还包括将所述概率计算传递到所述虚拟机的安全容器。
9.根据权利要求8所述的方法,其特征在于,所述安全容器提供沙盒环境用于执行所述概率计算。
10.根据权利要求7所述的方法,其特征在于,还包括派生所述虚拟机的输出以创建新进程。
11.根据权利要求10所述的方法,其特征在于,所述新进程由第二虚拟机执行。
12.根据权利要求7所述的方法,其特征在于,所述虚拟机用于执行重对数计算操作。
13.根据权利要求7所述的方法,其特征在于,所述虚拟机用于执行成员资格测试。
14.根据权利要求7所述的方法,其特征在于,所述虚拟机用于执行布隆过滤运算。
CN201680045160.5A 2015-08-07 2016-07-26 卸载数据分析应用中的概率计算 Active CN107851060B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/821,320 US9697034B2 (en) 2015-08-07 2015-08-07 Offloading probabilistic computations in data analytics applications
US14/821,320 2015-08-07
PCT/CN2016/091776 WO2017024939A1 (en) 2015-08-07 2016-07-26 Offloading probabilistic computations in data analytics applications

Publications (2)

Publication Number Publication Date
CN107851060A CN107851060A (zh) 2018-03-27
CN107851060B true CN107851060B (zh) 2020-10-09

Family

ID=57983932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680045160.5A Active CN107851060B (zh) 2015-08-07 2016-07-26 卸载数据分析应用中的概率计算

Country Status (4)

Country Link
US (1) US9697034B2 (zh)
EP (1) EP3320444A4 (zh)
CN (1) CN107851060B (zh)
WO (1) WO2017024939A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9934395B2 (en) * 2015-09-11 2018-04-03 International Business Machines Corporation Enabling secure big data analytics in the cloud
KR102511451B1 (ko) * 2016-11-09 2023-03-17 삼성전자주식회사 리치 실행 환경에서 보안 어플리케이션을 안전하게 실행하는 컴퓨팅 시스템
US10824623B2 (en) * 2018-02-28 2020-11-03 Vmware, Inc. Efficient time-range queries on databases in distributed computing systems
KR20200142043A (ko) * 2018-04-11 2020-12-21 코넬 유니버시티 소프트웨어 컨테이너 성능 및 격리를 개선하기 위한 방법 및 시스템
US20190361697A1 (en) * 2018-05-22 2019-11-28 Pure Storage, Inc. Automatically creating a data analytics pipeline
US11150817B2 (en) 2019-02-08 2021-10-19 International Business Machines Corporation Integrating kernel-bypass user-level file systems into legacy applications
US10976963B2 (en) 2019-04-15 2021-04-13 International Business Machines Corporation Probabilistically selecting storage units based on latency or throughput in a dispersed storage network
US11010097B2 (en) 2019-09-18 2021-05-18 International Business Machines Corporation Apparatus, systems, and methods for offloading data operations to a storage system
US20230297268A1 (en) * 2022-03-21 2023-09-21 International Business Machines Corporation Processing data in-memory with memory devices having a crossbar array structure

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003507B2 (en) * 2000-09-18 2006-02-21 International Business Machines Corporation Scalable propagation-based methods for call graph construction
US7475199B1 (en) * 2000-10-19 2009-01-06 Emc Corporation Scalable network file system
US7318229B1 (en) * 2003-07-29 2008-01-08 Sun Microsystems, Inc. Method, system, and program for dispatching a method call
US8336046B2 (en) * 2006-12-29 2012-12-18 Intel Corporation Dynamic VM cloning on request from application based on mapping of virtual hardware configuration to the identified physical hardware resources
US8775358B2 (en) * 2007-11-30 2014-07-08 Massachusetts Institute Of Technology Method and apparatus for performing probabilistic inference and providing related solution methods
US8370835B2 (en) 2009-03-12 2013-02-05 Arend Erich Dittmer Method for dynamically generating a configuration for a virtual machine with a virtual hard disk in an external storage device
WO2011072178A1 (en) * 2009-12-09 2011-06-16 Bizanga Ltd. Probabilistic offload engine for distributed hierarchical object storage devices
US20110161495A1 (en) 2009-12-26 2011-06-30 Ralf Ratering Accelerating opencl applications by utilizing a virtual opencl device as interface to compute clouds
US8782161B2 (en) 2011-06-30 2014-07-15 Oracle International Corporation Method and system for offloading computation flexibly to a communication adapter
US9201697B2 (en) * 2012-01-23 2015-12-01 International Business Machines Corporation System and method to reduce memory usage by optimally placing VMS in a virtualized data center
US9400664B2 (en) 2012-12-20 2016-07-26 Hitachi, Ltd. Method and apparatus for offloading storage workload
US9063967B2 (en) 2013-01-10 2015-06-23 Pure Storage, Inc. Performing copies in a storage system
CN103595720B (zh) 2013-11-15 2017-07-07 华为技术有限公司 卸载数据传输方法、装置和客户端
CN104754008B (zh) * 2013-12-26 2019-03-08 伊姆西公司 网络存储节点、网络存储系统以及用于网络存储节点的装置和方法
CN104156216B (zh) * 2014-08-14 2017-11-03 浪潮(北京)电子信息产业有限公司 一种面向云计算的异构存储管理系统及方法

Also Published As

Publication number Publication date
EP3320444A4 (en) 2019-01-09
EP3320444A1 (en) 2018-05-16
US9697034B2 (en) 2017-07-04
CN107851060A (zh) 2018-03-27
WO2017024939A1 (en) 2017-02-16
US20170039080A1 (en) 2017-02-09

Similar Documents

Publication Publication Date Title
CN107851060B (zh) 卸载数据分析应用中的概率计算
US9229759B2 (en) Virtual machine provisioning using replicated containers
US8897573B2 (en) Virtual machine image access de-duplication
US10430378B1 (en) Fast container distribution with storage acceleration
US20110246617A1 (en) Virtual Application Extension Points
KR20210075845A (ko) 네이티브 키-밸류 분산 스토리지 시스템
CN107113231B (zh) 将基于图形的计算卸载到后端设备
Ghasemi et al. Accelerating apache spark with fpgas
US10049122B1 (en) Cluster file system comprising multiple burst buffers each including virtual file system and metadata server components
US20150113092A1 (en) Method and apparatus for distributed enterprise data pattern recognition
US10831775B2 (en) Efficient representation, access and modification of variable length objects
Slagter et al. SmartJoin: a network-aware multiway join for MapReduce
US11030177B1 (en) Selectively scanning portions of a multidimensional index for processing queries
US20210397583A1 (en) Namespace representation and enhanced browsability for replicated file systems
US11003629B2 (en) Dual layer deduplication for application specific file types in an information processing system
CN105573852B (zh) 一种虚拟地址隔离环境下超高速数据对象通信的方法
CN111767287A (zh) 数据导入方法、装置、设备及计算机存储介质
KR101134464B1 (ko) 네트워크 비동기 입출력 방법 및 장치
Seera et al. Leveraging mapreduce with column-oriented stores: Study of solutions and benefits
EP3186731B1 (en) Array-based computations on a storage device
Sun et al. FPGA-based acceleration architecture for Apache Spark operators
US12032516B1 (en) File-level snapshot access service
US11934347B2 (en) Determining a sharing relationship of a file in namespace snapshots
US11030241B2 (en) Query usage based organization for very large databases
US20240184745A1 (en) File-level snapshot access service

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant