CN110807125A - 推荐系统、数据访问方法及装置、服务器、存储介质 - Google Patents

推荐系统、数据访问方法及装置、服务器、存储介质 Download PDF

Info

Publication number
CN110807125A
CN110807125A CN201911012219.2A CN201911012219A CN110807125A CN 110807125 A CN110807125 A CN 110807125A CN 201911012219 A CN201911012219 A CN 201911012219A CN 110807125 A CN110807125 A CN 110807125A
Authority
CN
China
Prior art keywords
access
data
persistent memory
memory
recommendation system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911012219.2A
Other languages
English (en)
Other versions
CN110807125B (zh
Inventor
任恺
王靖
徐万鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Reach Best Technology Co Ltd
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Reach Best Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Reach Best Technology Co Ltd filed Critical Reach Best Technology Co Ltd
Publication of CN110807125A publication Critical patent/CN110807125A/zh
Application granted granted Critical
Publication of CN110807125B publication Critical patent/CN110807125B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开关于一种推荐系统、数据访问方法及装置、服务器、存储介质。一种推荐系统,所述系统包括参数服务器;所述参数服务器内设置有持久性内存;所述持久性内存被配置为满足读数据和写数据非对称场景下的数据访问。本实施例中通过在推荐系统中采用持久性内存,由于其延迟小有利于提升提高推荐系统的数据吞吐量,可以满足参数服务器大规模推荐时读写次数非对称场景下的数据访问;并且持久性内存的存储量较大,有利于降低存储成本。另外,本实施例的推荐系统采用持久性内存后,其数据恢复比以前从网络或者磁盘进行故障恢复时间能从小时级别降低到分钟级,使得故障重启时间大大减少,极大提高了系统可用性。

Description

推荐系统、数据访问方法及装置、服务器、存储介质
相关申请的交叉引用
本申请要求于2019年8月3日提交的、名称为“推荐系统、数据访问方法及装置、电子设备、存储介质”、申请号为201910714160.5的中国发明专利申请的优先权,该申请的全文以引用的形式并入本文中用于所有目的。
技术领域
本公开涉及视频编码技术领域,尤其涉及一种推荐系统、数据访问方法及装置、服务器、存储介质。
背景技术
目前,大规模分布式存储系统一直是各平台推荐系统的核心基石。推荐系统的各个服务包括用户和视频特征索引、推荐模型的训练和预估都对底层存储系统的容量、延迟和吞吐量等各个方面的扩展性有着极其严格的要求。尤其是随着用户和视频规模的快速增长、以及大规模深度模型在推荐系统中的广泛使用,增强存储系统扩展性的需求日益凸显出来。
发明内容
本公开提供一种推荐系统、数据访问方法及装置、服务器、存储介质,以解决相关技术中存在的问题。
本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种推荐系统,所述系统包括参数服务器;所述参数服务器内设置有持久性内存;所述持久性内存被配置为满足读数据和写数据非对称场景下的数据访问。
可选地,所述系统包括参数服务器;所述分布式索引服务器内设置有持久性内存;所述持久性内存被配置为满足读数据和写数据非对称场景下的数据访问。
可选地,所述参数服务器采用键值存储系统存储数据;所述键值存储系统包括缓存池组件;所述缓存池组件被配置为执行获取数据访问请求的访问类型,并基于所述访问类型选择访问所述持久性内存或动态随机存取存储器DRAM缓存。
可选地,针对在线预估服务的场景,所述缓存池组件被配置为执行在接收到预估模型发送的数据访问请求时,确定所述预估模型访问所述DRAM缓存。
可选地,所述键值存储系统内采用非统一内容访问NUMA节点绑定方式,以使所述持久性内存的数据访问不跨越NUMA节点。
可选地,所述键值存储系统内采用零拷贝ZeroCopy方式访问所述持久性内存和所述DRAM缓存。
可选地,所述键值存储系统内对所述持久性内存的数据进行分块存储,以保证对各分块数据访问次数不超过设定次数。
可选地,所述持久性内存内设置缓存器,被配置为缓存在高频写入低字节的场景下所写入的字节,以在写满后由PMKD将所述缓存器内的所有数据刷入所述持久性内存,其中高频写入低字节是指超过预先设置的频率下,每次写入低于设定数量字节的数据。
可选地,所述推荐系统还包括图分布式训练系统;所述图分布式训练系统训练时所使用的用户关系图以及神经网络结构存储到所述参数服务器中的持久性内存中。
根据本公开实施例的第二方面,提供一种推荐系统,所述系统包括参数服务器;所述分布式索引服务器内设置有持久性内存;所述持久性内存被配置为满足读数据和写数据非对称场景下的数据访问。
可选地,所述分布式索引服务器采用键值存储系统存储数据;所述键值存储系统包括缓存池组件;所述缓存池组件被配置为执行获取数据访问请求的访问类型,并基于所述访问类型选择访问所述持久性内存或DRAM缓存。
可选地,所述键值存储系统内采用非统一内容访问NUMA节点绑定方式,以使所述持久性内存的数据访问不跨越NUMA节点。
可选地,所述键值存储系统内采用零拷贝ZeroCopy方式访问所述持久性内存和所述DRAM缓存。
可选地,所述键值存储系统内对所述持久性内存的数据进行分块存储,以保证对各分块数据访问次数不超过设定次数。
可选地,所述持久性内存内设置缓存器,被配置为缓存在高频写入低字节的场景下所写入的字节,以在写满后由PMKD将所述缓存器内的所有数据刷入所述持久性内存,其中高频写入低字节是指超过预先设置的频率下,每次写入低于设定数量字节的数据。
根据本公开实施例的第三方面,提供一种数据访问方法,适用于设置有持久性内存的推荐系统,所述方法包括:
获取所接收的数据访问请求的访问类型;
根据所述访问类型确定访问所述持久性内存或动态随机存取存储器DRAM缓存。
可选地,根据所述访问类型确定访问所述持久性内存或动态随机存取存储器DRAM缓存包括:
若所述访问类型为访问索引值,则确定访问所述DRAM缓存;
若所述访问类型为访问数据值,则确定访问所述持久性内存。
可选地,根据所述访问类型确定访问所述持久性内存或动态随机存取存储器DRAM缓存包括:
若确定出数据访问请求来自预估模型,则确定所述预估模型访问所述DRAM缓存。
可选地,根据所述访问类型确定访问所述持久性内存或动态随机存取存储器DRAM缓存包括:
若写入数据的字节数低于设定数量,则将所述字节写入到所述持久性内存内的缓存器内;
响应于所述缓存器内已写满字节,将所述缓存器内的全部字节刷入所述持久性内存。
根据本公开实施例的第四方面,提供一种数据访问装置,适用于设置有持久性内存的推荐系统,所述装置包括:
访问类型获取模块,被配置为执行获取所接收的数据访问请求的访问类型;
访问位置确定模块,被配置为执行根据所述访问类型确定访问所述持久性内存或动态随机存取存储器DRAM缓存。
可选地,所述访问位置确定模块包括第一确定单元,所述第一确定单元被配置为执行在所述访问类型为访问索引值的情况下确定访问所述DRAM缓存,或在所述访问类型为访问数据值的情况下确定访问所述持久性内存。
可选地,所述访问位置确定模块包括第二确定单元,所述第二确定单元被配置为执行在确定出数据访问请求来自预估模型的情况下确定所述预估模型访问所述DRAM缓存。
可选地,所述访问位置确定模块包括:
缓存写入单元,被配置为执行在写入数据的字节数低于设定数量的情况下,将所述字节写入到所述持久性内存内的缓存器内;
内存写入单元,被配置为执行响应于所述缓存器内已写满字节,将所述缓存器内的全部字节刷入所述持久性内存。
根据本公开实施例的第五方面,提供一种服务器,包括:
处理器;
用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述存储器中的可执行指令,以实现如第三方面任一项所述方法的步骤。
根据本公开实施例的第六方面,提供一种存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如第三方面任一项所述方法的步骤。
本公开的实施例提供的技术方案至少带来以下有益效果:
本实施例中通过在推荐系统中采用持久性内存,由于其延迟小有利于提升提高推荐系统的数据吞吐量,可以满足参数服务器大规模推荐时读写次数非对称场景下的数据访问;并且持久性内存的存储量较大,有利于降低存储成本。另外,本实施例的推荐系统采用持久性内存后,其数据恢复比以前从网络或者磁盘进行故障恢复时间能从小时级别降低到分钟级,使得故障重启时间大大减少,极大提高了系统可用性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种推荐系统的框图。
图2是根据一示例性实施例示出的存储层次结构图。
图3是根据一示例性实施例示出的一种采用持久性内存的推荐系统的框图。
图4是根据一示例性实施例示出的键值存储系统的结构图。
图5是根据一示例性实施例示出的推荐系统的压测效果对比图;
图6是根据一示例性实施例示出的一种图深度学习下的应用场景图。
图7是根据一示例性实施例示出的一种数据访问方法的流程图。
图8是根据一示例性实施例示出的一种数据访问装置的框图。
图9是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
本实施例中,提供了一种推荐系统,图1示出了一种推荐系统的架构。参见图1,推荐系统可以包括参数服务器(parameter server)、分布式索引服务器(index server),并可以提供预估服务(prediction service)。以客户端请求推荐服务为例,用户可以触发客户端,这样客户端可以向推荐服务(reccooendation service)发起推荐请求。推荐服务(reccooendation service)可以响应于该推荐请求,从推荐请求中获取用户信息以提取用户画像。然后基于用户画像中的数据请求召回服务,由召回服务提供可以提供向用户推荐的多媒体数据(后续以视频为例),例如1000个视频。召回服务在请求推荐服务的过程中会根据用户画像的数着从分布式索引服务器内读取索引数据。推荐服务可以根据召回服务返回的索引数据请求预估服务,预估服务可以根据索引数据从参数服务器获取参数数据并对视频进行预估,例如排序,将排序靠前的多个视频返回给推荐服务,由推荐服务提供给客户端。
本公开的发明人发现,分布式索引服务器需要提供每秒百万级别的在线查询量,十亿级别的存储数据量;而且索引需要实时更新,且同时满足低延迟的要求,是一种典型的读数据和写数据次数非对称的应用场景。在线预估场景需要支持低延迟、高并发的访问,并且需要实时更新模型,同样是一种典型的读数据和写数据次数非对称的应用场景。另外,分布式索引服务器每次读取内容大小是KB级别,大于参数服务器每次的读取内容,因此分布式索引服务器的顺序读的性能更好。
基于上述两个场景的读数据和写数据次数非对称,本公开实施例中将具有读数据和写数据次数非对称特点的持久性内存技术应用到图1所示的推荐系统中。
图2示出了一种服务器的存储层次结构,参见图2,持久性内存是介于动态随机存取存储器(Dynamic Random Access Memory,DRAM,后续称之为DRAM缓存)和固态硬盘(Solid State Drive,SSD)之间的一个新的存储层级,主要为温数据(即温数据是非即时的状态和行为数据)提供读写数据服务。持久性内存不仅能提供类似DRAM缓存的延迟,同时提供持久化和更大的存储容量。持久性内存采用与DRAM缓存相同的通道接口,直接插在DRAM插槽上,因此享用比PCI-e更高效的与CPU通讯带宽。DRAM缓存主要为热数据(即指即时的位置状态、交易和浏览行为)提供读写数据服务。机械硬盘HDD主要为冷数据(即不需要实时访问的离线数据,用于灾难恢复的备份或者法律规定保留的数据)提供读写数据服务。
持久性内存支持多种操作模式,主要包括内存模式(Memory Mode)和应用直接访问模式(App Direct Mode)。因为上层应用对数据访问模式有更多的信息,因此本实施例中在推荐系统中使用的是应用直接访问模式。
参见图3右侧的DAX存储接口部分(即支持直接访问的存储接口),在应用直接访问模式下,持久性内存将作为块设备(Block Device,即可以直接访问的存储空间,无需通过文件系统等中转)的形式使用Linux文件系统的DAX挂载模式来使用,第四代扩展文件系统(Fourth extended filesystem,Ext4)和高级日志文件系统XFS都支持DAX模式。DAX挂载模式具有以下特点,分配和使用持久性内存空间对应的操作时在相应的文件系统路径上创建并打开文件,并使用文件系统接口或者Intel提供的和持久内存开发工具包(PersistentMemory Development Kit,PMDK)来进行访问和控制。由于PMDK为数据读写的专用服务,因此与Linux文件系统读写相比,其效率有大幅提升。
需要说明的是,图3中左侧的传统存储接口的存取数据可以通过应用直接或者通过文件系统来访问通用内存接口驱动(generic nvdimm driver),由通用内存接口驱动访问持久性内容。传统存储接口存取数据的方案可以参考相关技术,在此不再赘述。由于分布式索引服务器和参数服务器的存储内核都是基于键值(Key-Value,KV)存储,针对持久性内存的特点和键值存储系统的结构,本实施例在键值存储系统进行优化,增加一个缓存池MemPool的组件,优化后的键值存储系统结构如图4所示。参见图4,键值存储系统采用两层的索引结构:第一层为HashMap,存储HashKey和指向第二层的指针Index即索引值,即索引值key存储到DRAM缓存内;第二层是按数据值大小(Value size)以Slab机制为组织方式的数据页,这些数据页是读写频率较低且数据较大,即数据值Value存储到持久性内存。
其中,内存分配机制(Slab机制)是Linux操作系统的一种内存分配机制,其工作是针对一些经常分配并释放的对象,如进程描述符等,这些对象的大小一般比较小,如果直接采用伙伴系统来进行分配和释放,不仅会造成大量的内存碎片,而且处理速度也太慢。
继续参见图4,MemPool组件可以获取访问请求的访问类型,访问类型包括访问索引值key和访问数据值value,这样可以根据访问类型决定是从DRAM缓存读写数据,还是从持久性内存读写数据。
例如,在推荐模型预估的场景中,由于推荐模型中神经网络需存储数据(即神经网络的结构数据和参数数据)的大小与数据页Embedding Table相比很小,因此神经网络需存储数据会被MemPool组件直接分配进入DRAM缓存来提高预估的性能。
除了上述的架构优化,本实施例还对键值存储系统进行如下处理,包括:
(1)本实施例中,在推荐系统中进行大规模模型训练时,每个批处理batch会更新24GB/s的数据量,对于参数服务器的读数据和写数据次数比值约为1:1。在这种场景下,本实施例对持久性内存进行更加细致的架构设计,使数据读写限定在本地存储器内。例如,对于数据读写场景采用非统一内存访问(NUMA)节点绑定的方式,即考虑到在NUMA下处理器访问自己的本地存储器的速度比非本地存储器(其他处理器的本地存储器)快一些,因此本实施例中绑定处理器和本地存储器,原则上不读取非本地存储器内的数据,这样可以保证持久性内存访问不跨越NUMA节点,可以减少跨网络传输而造成的延迟,有利于提升读写效率。另外,本实施例中还可以降低构建成本。
(2)采用零拷贝ZeroCopy方式访问持久性内存和DRAM缓存。
继续参见图3,映射函数即Mmap()函数将文件直接映射到持久性内存和硬盘,在映射成功时返回指向目标区域的指针。这段持久性内存和硬盘可以用作进程间的共享内存空间,操作系统的内核也可以直接操作这段内存空间,但大部分情况下,PMDK可以向Mmap()函数请求指针,然后读取该指针对应的内存空间内的内容,提升读取效率。
(3)键值存储系统内临界区对所述持久性内存的数据访问次数不超过设定次数。即减少锁的使用,尤其是减少临界区中对持久性内存的数据访问,或者说,本实施例中可以对持久性内存内的数据进行分块存储,各块的数据之间原则上无联系,这样读取数据时仅对该数据块读取即可,以提高持久性内存读写数据的性能。
(4)在高频写入低字节的场景下,持久性内存内设置缓存器,在缓存器内写满字节后,将其所述缓存器内的字节写入所述持久性内存内。如,对于高频写入低字节(指超过预先设置的频率下,每次写入低于设定数量字节的数据)的更新场景,对于持久性内存是不友好的,通过做缓存cache的方式,在内存中保持写入缓存器Buffer,合并写操作,缓存器Buffer满后再用PMDK的API刷入持久性内存NVM。虽然会损失一些持久化特性,但是带来写性能接近内存的性能提升。
本公开实施例还通过对比实验来验证上述推荐系统的性能,参见图5,经过上述改进,将基于持久性内存的索引系统用真实的线上请求数据进行模拟压测。在压测中,基于持久性内存的索引系统的请求吞吐(request item)和网络带宽与基于DRAM缓存的系统比较基本持平;在平均时延(avg_time)上基本持平,比DRAM缓存的平均时延略高5%;但是P99的性能持久性内存没有DRAM缓存稳定,会有随时间和压力变化的现象,总体P99时延在测试中大概比DRAM缓存高15%。其中改写相关的请求相比读请求少几个量级,因此基本不影响线上读写操作的性能。在机器重启的情况下,基于持久性内存的异常恢复时间相比DRAM缓存方案降低120倍,从两小时降低到分钟级别,极大的提高系统可用性。
在推荐系统的高吞吐量数据请求的场景,可以大规模使用持久性内存,以降低存储成本的目的。同时,由于其持久性存储的特点,推荐系统的数据恢复比以前从网络或者磁盘进行故障恢复时间能从小时级别降低到分钟级,使得故障重启时间大大减少,极大提高了推荐系统可用性。
另外,实际应用中,为了支持数百亿边级别规模的动态图学习,传统的图计算引擎需要通过图划分算法将图划分成多个分片,然后进行分布式处理,来突破单机内存的限制。而作为图神经网络训练中相对耗时的图遍历采样部分,图分片算法的好坏直接决定了图遍历采样中跨分片跨机器访问的数量,直接关系到图遍历采样的性能和效率。而且很多现有经典划分算法往往对稠密图是很难降低跨机器跨分片访问数量的。
因此,在一实施例中,还将持久性内存应用于大规模图深度学习中,以直接提高单机存储容量。参见图6,本实施例中重新设计图神经网络分布式训练系统的架构,在构建的图分布式训练系统中,先根据用户数据可以得到表示用户特点的数据集合Embedding,每个用户可看作一个点,两个用户之间可能存在关联关系,该关联关系可以看作一条边,边的权重表示两个用户的关联关系的远近或者相似程度,将Embedding以及点和边的相关参数分布式的存储在参数服务器中。需要说明的是,图神经网络分布式训练系统的目的就在于根据Embedding来训练训练各图像的边。另外,本实施例中还可以将神经网络结构存储在参数服务器中。
对于每个执行训练作业(如推理计算和梯度计算)的工作节点Worker,可以将整个图的链接结构压缩后存储在Worker的持久性内存中,随着样本流进行动态的结构更新。由于每个Worker在本地都有图链接结构,因此能够快速的进行各种图遍历采样。对于高阶(边的数量较多,如超过阈值)的稠密图遍历,采用持久性内存在本地运算甚至能节省数十次远程调用,从而极大的提升了图深度学习的训练效率。其中,图的链接结构包括用户关系图和神经网络结构;用户关系图由点vertex和边edge构成,即用户(点)与其他用户(点)之间的关系(边)。
换言之,在大规模图神经网络分布式训练系统中使用可持久性内存也带了极大的性能改善,为改善大规模机器学习模型分布式训练系统的性能开辟了新的方向。
图7是根据一示例性实施例示出的一种数据访问方法的流程图。参见图7,一种数据访问方法,适用于图1~图6所示的设置有持久性内存的推荐系统,所述方法包括:
701,获取所接收的数据访问请求的访问类型;
702,根据所述访问类型确定访问所述持久性内存或动态随机存取存储器DRAM缓存。
在一实施例中,若所述访问类型为访问索引值,则确定访问所述DRAM缓存;
若所述访问类型为访问数据值,则确定访问所述持久性内存。
在一实施例中,根据所述访问类型确定访问所述持久性内存或动态随机存取存储器DRAM缓存包括:
若确定出数据访问请求来自预估模型,则确定所述预估模型访问所述DRAM缓存。
在一实施例中,根据所述访问类型确定访问所述持久性内存或动态随机存取存储器DRAM缓存包括:
若写入数据的字节数低于设定数量,则将所述字节写入到所述持久性内存内的缓存器内;
响应于所述缓存器内已写满字节,将所述缓存器内的全部字节刷入所述持久性内存。
图8是根据一示例性实施例示出的一种数据访问装置的框图。参见图8,一种数据访问装置,适用于设置有持久性内存的推荐系统,所述装置包括:
访问类型获取单元801,被配置为执行获取所接收的数据访问请求的访问类型;
读写位置确定单元802,被配置为执行根据所述访问类型确定访问所述持久性内存或动态随机存取存储器DRAM缓存。
在一实施例中,所述访问位置确定模块包括第一确定单元,所述第一确定单元被配置为执行在所述访问类型为访问索引值的情况下确定访问所述DRAM缓存,或在所述访问类型为访问数据值的情况下确定访问所述持久性内存。
在一实施例中,所述访问位置确定模块包括第二确定单元,所述第二确定单元被配置为执行在确定出数据访问请求来自预估模型的情况下确定所述预估模型访问所述DRAM缓存。
在一实施例中,所述访问位置确定模块包括:
缓存写入单元,被配置为执行在写入数据的字节数低于设定数量的情况下,将所述字节写入到所述持久性内存内的缓存器内;
内存写入单元,被配置为执行响应于所述缓存器内已写满字节,将所述缓存器内的全部字节刷入所述持久性内存。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图9是根据一示例性实施例示出的一种电子设备的框图。例如,电子设备900可以是服务器,移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图9,电子设备900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(I/O)的接口912,传感器组件914,以及通信组件916。
处理组件902通常控制电子设备900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件902可以包括一个或多个处理器920来执行指令,以完成图7所示方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理组件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。
存储器904被配置为存储各种类型的数据以支持在电子设备900的操作。这些数据的示例包括用于在电子设备900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件906为电子设备900的各种组件提供电力。电源组件906可以包括电源管理系统,一个或多个电源,及其他与为电子设备900生成、管理和分配电力相关联的组件。
多媒体组件908包括在电子设备900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当电子设备900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(MIC),当电子设备900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。
I/O接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件914包括一个或多个传感器,用于为电子设备900提供各个方面的状态评估。例如,传感器组件914可以检测到电子设备900的打开/关闭状态,组件的相对定位,例如所述组件为电子设备900的显示器和小键盘,传感器组件914还可以检测电子设备900或电子设备900一个组件的位置改变,用户与电子设备900接触的存在或不存在,电子设备900方位或加速/减速和电子设备900的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件916被配置为便于电子设备900和其他设备之间有线或无线方式的通信。电子设备900可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件916还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在本公开一实施例中,电子设备900可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在本公开一实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器904,上述指令可由电子设备900的处理器920执行以完成上述方法的步骤。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在本公开一实施例中,还提供了一种应用程序,当该应用程序由电子设备的处理器执行时,使得所述电子设备能够执行上述方法的步骤,以获取相同的技术效果。
在本公开一实施例中,还提供了一种计算机程序产品,当该计算机程序产品由电子设备的处理器执行时,使得所述电子设备能够执行上述方法的步骤,以获取相同的技术效果。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置/电子设备/存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种推荐系统,其特征在于,所述系统包括参数服务器;所述参数服务器内设置有持久性内存;所述持久性内存被配置为满足读数据和写数据非对称场景下的数据访问。
2.根据权利要求1所述的推荐系统,其特征在于,所述系统包括参数服务器;所述分布式索引服务器内设置有持久性内存;所述持久性内存被配置为满足读数据和写数据非对称场景下的数据访问。
3.根据权利要求1或2所述的推荐系统,其特征在于,所述参数服务器采用键值存储系统存储数据;所述键值存储系统包括缓存池组件;所述缓存池组件被配置为执行获取数据访问请求的访问类型,并基于所述访问类型选择访问所述持久性内存或动态随机存取存储器DRAM缓存。
4.根据权利要求3所述的推荐系统,其特征在于,针对在线预估服务的场景,所述缓存池组件被配置为执行在接收到预估模型发送的数据访问请求时,确定所述预估模型访问所述DRAM缓存。
5.根据权利要求3所述的推荐系统,其特征在于,所述键值存储系统内采用非统一内容访问NUMA节点绑定方式,以使所述持久性内存的数据访问不跨越NUMA节点。
6.一种推荐系统,其特征在于,所述系统包括参数服务器;所述分布式索引服务器内设置有持久性内存;所述持久性内存被配置为满足读数据和写数据非对称场景下的数据访问。
7.一种数据访问方法,其特征在于,适用于设置有持久性内存的推荐系统,所述方法包括:
获取所接收的数据访问请求的访问类型;
根据所述访问类型确定访问所述持久性内存或动态随机存取存储器DRAM缓存。
8.一种数据访问装置,其特征在于,适用于设置有持久性内存的推荐系统,所述装置包括:
访问类型获取模块,被配置为执行获取所接收的数据访问请求的访问类型;
访问位置确定模块,被配置为执行根据所述访问类型确定访问所述持久性内存或动态随机存取存储器DRAM缓存。
9.一种服务器,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述存储器中的可执行指令,以实现如权利要求7所述方法的步骤。
10.一种存储介质,其特征在于,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如7所述方法的步骤。
CN201911012219.2A 2019-08-03 2019-10-23 推荐系统、数据访问方法及装置、服务器、存储介质 Active CN110807125B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019107141605 2019-08-03
CN201910714160 2019-08-03

Publications (2)

Publication Number Publication Date
CN110807125A true CN110807125A (zh) 2020-02-18
CN110807125B CN110807125B (zh) 2020-12-22

Family

ID=69279675

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201911012219.2A Active CN110807125B (zh) 2019-08-03 2019-10-23 推荐系统、数据访问方法及装置、服务器、存储介质
CN201911013968.7A Active CN110751275B (zh) 2019-08-03 2019-10-23 图训练系统、数据访问方法及装置、电子设备、存储介质

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201911013968.7A Active CN110751275B (zh) 2019-08-03 2019-10-23 图训练系统、数据访问方法及装置、电子设备、存储介质

Country Status (1)

Country Link
CN (2) CN110807125B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112306682A (zh) * 2020-10-29 2021-02-02 第四范式(北京)技术有限公司 一种模型参数的存储方法和系统以及一种参数服务器集群
CN115358729A (zh) * 2022-10-21 2022-11-18 成都戎星科技有限公司 一种卫星影像数据智能发布系统

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929870B (zh) * 2020-02-17 2020-06-12 支付宝(杭州)信息技术有限公司 图神经网络模型训练方法、装置及系统
CN112083881B (zh) * 2020-08-24 2022-10-18 云南财经大学 一种基于持久化内存的一体化天文数据采集与存储系统
CN112181732A (zh) * 2020-10-29 2021-01-05 第四范式(北京)技术有限公司 参数服务器节点的恢复方法和恢复系统
CN112596963B (zh) * 2020-12-14 2024-05-03 成都海光集成电路设计有限公司 一种快速内存训练的方法及系统
WO2022133725A1 (en) * 2020-12-22 2022-06-30 Orange Improved distributed training of graph-embedding neural networks
CN112906825A (zh) * 2021-03-30 2021-06-04 第四范式(北京)技术有限公司 实现机器学习模型的分布式训练的方法和计算节点
CN113657577B (zh) * 2021-07-21 2023-08-18 阿里巴巴达摩院(杭州)科技有限公司 模型训练方法及计算系统
CN113568586B (zh) * 2021-09-17 2021-12-17 支付宝(杭州)信息技术有限公司 用于分布式图学习架构的数据存取方法及装置
CN115391341A (zh) * 2022-08-23 2022-11-25 抖音视界有限公司 分布式图数据处理系统、方法、装置、设备及存储介质
CN117785490B (zh) * 2024-02-27 2024-05-10 苏州元脑智能科技有限公司 一种图神经网络模型的训练架构、方法、系统及服务器

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346293A (zh) * 2013-07-25 2015-02-11 华为技术有限公司 混合内存的数据访问方法、模块、处理器及终端设备
US20180083979A1 (en) * 2016-09-20 2018-03-22 Trinity Groves Restaurant Incubator Partners, Lp Networking application for controlled-access-establishment
CN108763458A (zh) * 2018-05-28 2018-11-06 腾讯科技(深圳)有限公司 内容特征查询方法、装置、计算机设备及存储介质
CN109063103A (zh) * 2018-07-27 2018-12-21 郑州云海信息技术有限公司 一种分布式非易失文件系统
CN109656482A (zh) * 2018-12-19 2019-04-19 哈尔滨工业大学 一种基于存储器访问的写热页面预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105242881B (zh) * 2015-10-12 2018-02-16 创新科软件技术(深圳)有限公司 分布式存储系统及其数据读写方法
CN109754060B (zh) * 2017-11-06 2023-08-25 阿里巴巴集团控股有限公司 一种神经网络机器学习模型的训练方法及装置
CN108962238B (zh) * 2018-04-25 2020-08-07 苏州思必驰信息科技有限公司 基于结构化神经网络的对话方法、系统、设备及存储介质
CN108683738B (zh) * 2018-05-16 2020-08-14 腾讯科技(深圳)有限公司 图数据处理方法和图数据的计算任务发布方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346293A (zh) * 2013-07-25 2015-02-11 华为技术有限公司 混合内存的数据访问方法、模块、处理器及终端设备
US20180083979A1 (en) * 2016-09-20 2018-03-22 Trinity Groves Restaurant Incubator Partners, Lp Networking application for controlled-access-establishment
CN108763458A (zh) * 2018-05-28 2018-11-06 腾讯科技(深圳)有限公司 内容特征查询方法、装置、计算机设备及存储介质
CN109063103A (zh) * 2018-07-27 2018-12-21 郑州云海信息技术有限公司 一种分布式非易失文件系统
CN109656482A (zh) * 2018-12-19 2019-04-19 哈尔滨工业大学 一种基于存储器访问的写热页面预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴刚等: "NUMA架构下数据热度的内存数据库日志恢复技术", 《计算机科学与探索》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112306682A (zh) * 2020-10-29 2021-02-02 第四范式(北京)技术有限公司 一种模型参数的存储方法和系统以及一种参数服务器集群
WO2022089560A1 (zh) * 2020-10-29 2022-05-05 第四范式(北京)技术有限公司 一种模型参数的存储方法和系统以及一种参数服务器集群
CN112306682B (zh) * 2020-10-29 2022-08-16 第四范式(北京)技术有限公司 一种模型参数的存储方法和系统以及一种参数服务器集群
CN115358729A (zh) * 2022-10-21 2022-11-18 成都戎星科技有限公司 一种卫星影像数据智能发布系统
CN115358729B (zh) * 2022-10-21 2023-01-13 成都戎星科技有限公司 一种卫星影像数据智能发布系统

Also Published As

Publication number Publication date
CN110751275B (zh) 2022-09-02
CN110751275A (zh) 2020-02-04
CN110807125B (zh) 2020-12-22

Similar Documents

Publication Publication Date Title
CN110807125B (zh) 推荐系统、数据访问方法及装置、服务器、存储介质
US9952753B2 (en) Predictive caching and fetch priority
US9009103B2 (en) Fingerprint-based, intelligent, content pre-fetching
CN106775446B (zh) 基于固态硬盘加速的分布式文件系统小文件访问方法
RU2615682C2 (ru) Способ, устройство, сервер и терминал для посещения веб-страницы
CN108292300B (zh) 用于管理对电子文档的协同编辑的自动保存的装置和方法
CN108984225A (zh) 快速启动寄宿应用的方法及设备
EP2992453A1 (en) Hydration and dehydration with placeholders
CN107223240B (zh) 与文件高速缓存的上下文感知管理相关联的计算方法和装置
US11599462B1 (en) Memory cache entry management with pinned cache entries
CN112052097B (zh) 虚拟场景的渲染资源处理方法、装置、设备及存储介质
CN109829077A (zh) 一种页面显示方法、装置和设备
US20160055257A1 (en) Method and system for adaptive pre-fetching of pages into a buffer pool
JP5272428B2 (ja) アクセス頻度の高い情報を事前にキャッシュする予測型キャッシュ方法、そのシステム及びそのプログラム
CN114416178A (zh) 数据访问方法、装置及非临时性计算机可读存储介质
US9213673B2 (en) Networked applications with client-caching of executable modules
CN114428589B (zh) 一种数据处理方法、装置、电子设备及存储介质
EP3274844A1 (en) Hierarchical cost based caching for online media
CN112286448B (zh) 对象访问方法、装置、电子设备及机器可读存储介质
CN109992790A (zh) 数据处理方法和装置、用于数据处理的装置
CN115016944A (zh) 一种进程访问方法、装置及电子设备
CN114281859A (zh) 数据处理方法、设备及存储介质
CN113485642A (zh) 数据缓存方法及装置
US20180285327A1 (en) Determining cacheability of webpages
CN117235088B (zh) 一种存储系统的缓存更新方法、装置、设备、介质及平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant