CN113377725B - 一种内核客户端的预读方法、系统及计算机可读存储介质 - Google Patents

一种内核客户端的预读方法、系统及计算机可读存储介质 Download PDF

Info

Publication number
CN113377725B
CN113377725B CN202110928210.7A CN202110928210A CN113377725B CN 113377725 B CN113377725 B CN 113377725B CN 202110928210 A CN202110928210 A CN 202110928210A CN 113377725 B CN113377725 B CN 113377725B
Authority
CN
China
Prior art keywords
reading
file
read
offset
linked list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110928210.7A
Other languages
English (en)
Other versions
CN113377725A (zh
Inventor
薛亚茅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202110928210.7A priority Critical patent/CN113377725B/zh
Publication of CN113377725A publication Critical patent/CN113377725A/zh
Application granted granted Critical
Publication of CN113377725B publication Critical patent/CN113377725B/zh
Priority to US18/271,458 priority patent/US11914551B2/en
Priority to PCT/CN2021/134337 priority patent/WO2023015778A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种内核客户端的预读方法、系统及计算机可读存储介质,方法包括:接收对文件的读取请求并判断对文件的读取是否连续;若是对文件的读取不连续,则生成文件inode的头结点,并构建嵌入头结点的链表;判断文件是否包括文件的读取规则,若是文件包括文件的读取规则,则基于所读取规则,获取文件的读取请求次数和每次对应的读取偏移量,并基于读取请求次数和对应的读取偏移量生成map路线,并将map路线存入所述链表中;基于链表执行预读。通过本发明的方案,改善了内核客户端的预读机制,实现了内核客户端的非顺序预读,提高了内核客户端读文件性能,并且能够适应多种形式的读取文件业务,提高了非顺序预读的缓存命中率。

Description

一种内核客户端的预读方法、系统及计算机可读存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种内核客户端的预读方法、系统及计算机可读存储介质。
背景技术
随着社会信息爆炸时代的到来,信息数据量的日益增大,存储服务器的发展也越来越快,客户对存储读写性能要求也越来越高。在从存储读取文件时,使用内核客户端有很大的优势,得益于内核的缓存特性(pagecache和预读等)以及较短的IO路径。内核预读是在读请求量读完后按照顺序多读一定量页面,以便下个读取请求时,可以直接在缓存中读取目标内容,但是某些客户场景下进行随机读时,内核客户端识别到随机读,预读会停止失效。
发明内容
有鉴于此,本发明提出了一种内核客户端的预读方法、系统及计算机可读存储介质,改善了内核客户端的预读机制,实现了内核客户端的非顺序预读,提高了内核客户端读文件性能,并且能够适应多种形式的读取文件业务,提高了非顺序预读的缓存命中率。
基于上述目的,本发明实施例的一方面提供了一种内核客户端的预读方法,具体包括如下步骤:
接收对文件的读取请求并判断对文件的读取是否连续;
若是对文件的读取不连续,则生成所述文件inode的头结点,并构建嵌入所述头结点的链表,所述链表中的每个链表节点包括读取偏移量;
判断所述文件是否包括文件的读取规则,若是所述文件包括所述文件的读取规则,则基于所述读取规则,获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,并将所述map路线存入所述链表中;
基于所述链表执行预读。
在一些实施方式中,方法还包括:
若是所述文件不包括所述文件的读取规则,则判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,并将所述map路线存入所述链表中。
在一些实施方式中,判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,包括:
若是对所述文件进行重复读取,则获取第一次读取所述文件时的读取请求次数和对应的读取偏移量,在重复读取所述文件时,基于所述读取请求次数分别对所述对应的读取偏移量进行作差计算,若是计算结果的误差小于预设量的页面,则根据计算结果的误差小于预设量的所述对应的读取偏移量生成所述map路线。
在一些实施方式中,判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,包括:
若是对所述文件不进行重复读取,则获取所述文件的预设次数的读取请求和每次对应的读取偏移量,并基于所述预设次数的读取请求和所述对应的读取偏移量进行统计计算,生成所述map路线。
在一些实施方式中,基于所述预设次数的读取请求和所述对应的读取偏移量进行统计计算,生成所述map路线,包括:
基于所述预设次数和所述对应的读请求偏移量得到读请求偏移量平均值;
基于所述读请求偏移量平均值和文件大小,得到文件的未读部分的请求次数;
根据所述文件的未读部分的请求次数和所述读请求偏移量平均值,生成map路线。
在一些实施方式中,接收对文件的读取请求并判断对文件的读取是否连续,还包括:记录读取所述文件的不连续次数。
在一些实施方式中,对文件的读取不连续,包括:所述不连续次数达到预设次数。
在一些实施方式中,所述链表中的每个链表节点还包括下一次要读取的读取偏移量;
基于所述链表执行预读,包括:基于所述链表将所述文件下一次要读取的读取偏移量读取到页高速缓存中以对非顺序读的文件执行预读。
本发明实施例的另一方面,还提供了一种内核客户端的预读系统,系统包括:
接收模块,所述接收模块配置为接收对文件的读取请求并判断对文件的读取是否连续;
构建模块,所述构建模块配置为若是对文件的读取不连续,则生成所述文件inode的头结点,并构建嵌入所述头结点的链表,所述链表中的每个链表节点包括读取偏移量;
生成模块,所述生成模块配置为判断所述文件是否包括文件的读取规则,若是所述文件包括所述文件的读取规则,则基于所述读取规则,获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,并将所述map路线存入所述链表中;
执行模块,所述执行模块配置为基于所述链表执行预读。
在一些实施方式中,系统还包括第二生成模块,第二生成模块配置为:
若是所述文件不包括所述文件的读取规则,则判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,并将所述map路线存入所述链表中。
在一些实施方式中,判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,包括:
若是对所述文件进行重复读取,则获取第一次读取所述文件时的读取请求次数和对应的读取偏移量,在重复读取所述文件时,基于所述读取请求次数分别对所述对应的读取偏移量进行作差计算,若是计算结果的误差小于预设量的页面,则根据计算结果的误差小于预设量的所述对应的读取偏移量生成所述map路线。
在一些实施方式中,判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,包括:
若是对所述文件不进行重复读取,则获取所述文件的预设次数的读取请求和每次对应的读取偏移量,并基于所述预设次数的读取请求和所述对应的读取偏移量进行统计计算,生成所述map路线。
在一些实施方式中,基于所述预设次数的读取请求和所述对应的读取偏移量进行统计计算,生成所述map路线,包括:
基于所述预设次数和所述对应的读请求偏移量得到读请求偏移量平均值;
基于所述读请求偏移量平均值和文件大小,得到文件的未读部分的请求次数;
根据所述文件的未读部分的请求次数和所述读请求偏移量平均值,生成map路线。
在一些实施方式中,接收对文件的读取请求并判断对文件的读取是否连续,还包括:记录读取所述文件的不连续次数。
在一些实施方式中,对文件的读取不连续,包括:所述不连续次数达到预设次数。
在一些实施方式中,所述链表中的每个链表节点还包括下一次要读取的读取偏移量,
基于所述链表执行预读,包括:基于所述链表将所述文件下一次要读取的读取偏移量读取到页高速缓存中以对非顺序读的文件执行预读。
本发明实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上方法步骤的计算机程序。
本发明具有以下有益技术效果:通过本发明的方案,改善了内核客户端的预读机制,实现了内核客户端的非顺序预读,提高了内核客户端读文件性能,并且能够适应多种形式的读取文件业务,提高了非顺序预读的缓存命中率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明提供的内核客户端的读取方法的一实施例的框图;
图2为本发明的内核客户端的读取系统的一实施例的示意图;
图3为本发明提供的计算机可读存储介质的一实施例的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
基于上述目的,本发明实施例的第一个方面,提出了一种内核客户端的预读方法的实施例。如图1所示,其包括如下步骤:
步骤101、接收对文件的读取请求并判断对文件的读取是否连续;
步骤103、若是对文件的读取不连续,则生成所述文件inode的头结点,并构建嵌入所述头结点的链表,所述链表中的每个链表节点包括读取偏移量;
步骤105、判断所述文件是否包括文件的读取规则,若是所述文件包括所述文件的读取规则,则基于所述读取规则,获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,并将所述map路线存入所述链表中;
步骤107、基于所述链表执行预读。
具体的,接收对文件的读取请求并判断所述对文件的读取是否连续;
若是对文件的读取不连续,则进入非顺序预读学习模式,生成文件inode的头结点list_head,定义结构体变量ra_map,在结构体变量ra_map中,包括读取偏移量和嵌入头结点的链表,并以头结点将链表连接起来,在链表的每个链表节点中包括:读取偏移量、下一次要读取的读取偏移量、上一次读取的读取偏移量;判断文件是否存在已知的读文件规则、算法,如果有,则生成对应的文件的读取请求次数和每次对应的偏移量,并根据对应的文件的读取请求次数和每次对应的偏移量生成map路线,将map路线存入链表中,基于所述链表执行预读。
通过本发明的方案,改善了内核客户端的预读机制,实现了内核客户端的非顺序预读,提高了内核客户端读文件性能,并且能够适应多种形式的读取文件业务,提高了非顺序预读的缓存命中率。
在一些实施方式中,方法还包括:
若是所述文件不包括所述文件的读取规则,则判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,并将所述map路线存入所述链表中。
在一些实施方式中,判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,包括:
若是对所述文件进行重复读取,则获取第一次读取所述文件时的读取请求次数和对应的读取偏移量,在重复读取所述文件时,基于所述读取请求次数分别对所述对应的读取偏移量进行作差计算,若是计算结果的误差小于预设量的页面,则根据计算结果的误差小于预设量的所述对应的读取偏移量生成所述map路线。
根据本发明的多个实施方式,对于需要重复读取的文件,例如,所述文件1000页,第一次读取文件时,一共读了5次,读取请求次数与读取偏移量的关系为:读取请求次数1:读取偏移量200,读取请求次数2:读取偏移量300,读取请求次数3:读取偏移量100,读取请求次数4:读取偏移量100,读取请求次数5:读取偏移量400,再重复读取该文件时,取前五次的读取偏移量,分别与第一次读取时的读取偏移量作差,如果差值的绝对值,小于预设量的页面,比如30,则将小于30的那次读取请求的读取偏移量作为以后重复读取该文件时的map路线。
通过对需要重复读取的文件的读取请求次数和读取偏移量的计算,提高了内核客户端的读取速率和重复读取文件的缓存命中率。
在一些实施方式中,判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,包括:
若是对所述文件不进行重复读取,则获取所述文件的预设次数的读取请求和每次对应的读取偏移量,并基于所述预设次数的读取请求和所述对应的读取偏移量进行统计计算,生成所述map路线。
在一些实施方式中,基于所述预设次数的读取请求和所述对应的读取偏移量进行统计计算,生成所述map路线,包括:
基于所述预设次数和所述对应的读请求偏移量得到读请求偏移量平均值;
基于所述读请求偏移量平均值和文件大小,得到文件的未读部分的请求次数;
根据所述文件的未读部分的请求次数和所述读请求偏移量平均值,生成map路线。
根据本发明的多个实施方式,对于不需要重复读取的文件,统计文件读取时的读取情况,例如,所述文件1000页,前3次读取文件时,读取请求次数与读取偏移量的关系为:读取请求次数1:读取偏移量70,读取请求次数2:读取偏移量50,读取请求次数3:读取偏移量60,计算读请求偏移量平均值为60,计算文件未读部分的大小为820,将读请求偏移量平均值作为文件未读部分的读取偏移量,计算剩余读取请求次数为820÷60=13.6≈14,将请求次数14和读请求偏移量平均值60作为文件未读部分的读取请求次数和读取偏移量,并基于此生成map路线。
通过对不需要重复读取的文件的读取请求次数和读取偏移量的计算,提高了内核客户端的读取速率和重复读取文件的缓存命中率。
在一些实施方式中,接收对文件的读取请求并判断对文件的读取是否连续,还包括:记录读取所述文件的不连续次数。
在一些实施方式中,对文件的读取不连续,包括:所述不连续次数达到预设次数。
在一些实施方式中,所述链表中的每个链表节点还包括下一次要读取的读取偏移量;
基于所述链表执行预读,包括:基于所述链表将所述文件下一次要读取的读取偏移量读取到页高速缓存中以对非顺序读的文件执行预读。
基于同一发明构思,根据本发明的另一个方面,如图2所示,本发明的实施例还提供了一种内核客户端的预读系统,系统包括:
接收模块110,所述接收模块110配置为接收对文件的读取请求并判断对文件的读取是否连续;
构建模块120,所述构建模块120配置为若是对文件的读取不连续,则生成所述文件inode的头结点,并构建嵌入所述头结点的链表,所述链表中的每个链表节点包括读取偏移量;
生成模块130,所述生成模块130配置为判断所述文件是否包括文件的读取规则,若是所述文件包括所述文件的读取规则,则基于所述读取规则,获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,并将所述map路线存入所述链表中;
执行模块140,所述执行模块140配置为基于所述链表执行预读。
在一些实施方式中,系统还包括第二生成模块,第二生成模块配置为:
若是所述文件不包括所述文件的读取规则,则判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,并将所述map路线存入所述链表中。
在一些实施方式中,判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,包括:
若是对所述文件进行重复读取,则获取第一次读取所述文件时的读取请求次数和对应的读取偏移量,在重复读取所述文件时,基于所述读取请求次数分别对所述对应的读取偏移量进行作差计算,若是计算结果的误差小于预设量的页面,则根据计算结果的误差小于预设量的所述对应的读取偏移量生成所述map路线。
在一些实施方式中,判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,包括:
若是对所述文件不进行重复读取,则获取所述文件的预设次数的读取请求和每次对应的读取偏移量,并基于所述预设次数的读取请求和所述对应的读取偏移量进行统计计算,生成所述map路线。
在一些实施方式中,基于所述预设次数的读取请求和所述对应的读取偏移量进行统计计算,生成所述map路线,包括:
基于所述预设次数和所述对应的读请求偏移量得到读请求偏移量平均值;
基于所述读请求偏移量平均值和文件大小,得到文件的未读部分的请求次数;
根据所述文件的未读部分的请求次数和所述读请求偏移量平均值,生成map路线。
在一些实施方式中,接收对文件的读取请求并判断对文件的读取是否连续,还包括:则记录读取所述文件的不连续次数。
在一些实施方式中,对文件的读取不连续,包括:所述不连续次数达到预设次数。
在一些实施方式中,所述链表中的每个链表节点还包括下一次要读取的读取偏移量;
基于所述链表执行预读,包括:基于所述链表将所述文件下一次要读取的读取偏移量读取到页高速缓存中以对非顺序读的文件执行预读。
基于同一发明构思,根据本发明的另一个方面,如图3所示,本发明的实施例还提供了一种计算机可读存储介质30,计算机可读存储介质30存储有被处理器执行时执行如下方法的计算机程序310:
接收对文件的读取请求并判断对文件的读取是否连续;
若是对文件的读取不连续,则生成所述文件inode的头结点,并构建嵌入所述头结点的链表,所述链表中的每个链表节点包括读取偏移量;
判断所述文件是否包括文件的读取规则,若是所述文件包括所述文件的读取规则,则基于所述读取规则,获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,并将所述map路线存入所述链表中;
基于所述链表执行预读。
在一些实施方式中,方法还包括:
若是所述文件不包括所述文件的读取规则,则判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,并将所述map路线存入所述链表中。
在一些实施方式中,判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,包括:
若是对所述文件进行重复读取,则获取第一次读取所述文件时的读取请求次数和对应的读取偏移量,在重复读取所述文件时,基于所述读取请求次数分别对所述对应的读取偏移量进行作差计算,若是计算结果的误差小于预设量的页面,则根据计算结果的误差小于预设量的所述对应的读取偏移量生成所述map路线。
在一些实施方式中,判断是否对文件进行重复读取,并基于判断结果获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线,包括:
若是对所述文件不进行重复读取,则获取所述文件的预设次数的读取请求和每次对应的读取偏移量,并基于所述预设次数的读取请求和所述对应的读取偏移量进行统计计算,生成所述map路线。
在一些实施方式中,基于所述预设次数的读取请求和所述对应的读取偏移量进行统计计算,生成所述map路线,包括:
基于所述预设次数和所述对应的读请求偏移量得到读请求偏移量平均值;
基于所述读请求偏移量平均值和文件大小,得到文件的未读部分的请求次数;
根据所述文件的未读部分的请求次数和所述读请求偏移量平均值,生成map路线。
在一些实施方式中,接收对文件的读取请求并判断对文件的读取是否连续,还包括:记录读取所述文件的不连续次数。
在一些实施方式中,对文件的读取不连续,包括:所述不连续次数达到预设次数。
在一些实施方式中,所述链表中的每个链表节点还包括下一次要读取的读取偏移量;
基于所述链表执行预读,包括:基于所述链表将所述文件下一次要读取的读取偏移量读取到页高速缓存中以对非顺序读的文件执行预读。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (6)

1.一种内核客户端的预读方法,其特征在于,包括:
接收对文件的读取请求并判断对文件的读取是否连续;
若是对文件的读取不连续,则生成所述文件inode的头结点,并构建嵌入所述头结点的链表,所述链表中的每个链表节点包括读取偏移量;
判断所述文件是否包括文件的读取规则,若是所述文件包括所述文件的读取规则,则基于所述读取规则,获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线;
若是所述文件不包括所述文件的读取规则,则判断是否对文件进行重复读取;
若是对所述文件进行重复读取,则获取第一次读取所述文件时的读取请求次数和对应的读取偏移量,在重复读取所述文件时,基于所述读取请求次数分别将重复读取所述文件时对应的读取偏移量与所述第一次读取所述文件时对应的读取偏移量进行作差计算,若是计算的差值的绝对值小于预设量的页面,则根据计算的差值的绝对值小于预设量的所述对应的读取偏移量生成所述map路线;
若是对所述文件不进行重复读取,则获取所述文件的读取请求的预设次数和每次对应的读取偏移量,计算读请求偏移量平均值和文件未读部分的大小,通过文件未读部分的大小与读请求偏移量平均值相除得到剩余读取请求次数,将所述剩余读取请求次数和所述读请求偏移量平均值作为文件未读部分的读取请求次数和读取偏移量并生成所述map路线;以及
将所述map路线存入所述链表中;
基于所述链表执行预读。
2.根据权利要求1所述的方法,其特征在于,接收对文件的读取请求并判断对文件的读取是否连续,还包括:记录读取所述文件的不连续次数。
3.根据权利要求2所述的方法,其特征在于,对文件的读取不连续,包括:所述不连续次数达到预设次数。
4.根据权利要求1所述的方法,其特征在于,所述链表中的每个链表节点还包括下一次要读取的读取偏移量;
基于所述链表执行预读,包括:基于所述链表将所述文件下一次要读取的读取偏移量读取到页高速缓存中以对非顺序读的文件执行预读。
5.一种内核客户端的预读系统,其特征在于,包括:
接收模块,所述接收模块配置为接收对文件的读取请求并判断对文件的读取是否连续;
构建模块,所述构建模块配置为若是对文件的读取不连续,则生成所述文件inode的头结点,并构建嵌入所述头结点的链表,所述链表中的每个链表节点包括读取偏移量;
生成模块,所述生成模块配置为判断所述文件是否包括文件的读取规则,若是所述文件包括所述文件的读取规则,则基于所述读取规则,获取所述文件的读取请求次数和每次对应的读取偏移量,并基于所述读取请求次数和所述对应的读取偏移量生成map路线;若是所述文件不包括所述文件的读取规则,则判断是否对文件进行重复读取;若是对所述文件进行重复读取,则获取第一次读取所述文件时的读取请求次数和对应的读取偏移量,在重复读取所述文件时,基于所述读取请求次数分别将重复读取所述文件时对应的读取偏移量与所述第一次读取所述文件时对应的读取偏移量进行作差计算,若是计算的差值的绝对值小于预设量的页面,则根据计算的差值的绝对值小于预设量的所述对应的读取偏移量生成所述map路线;若是对所述文件不进行重复读取,则获取所述文件的读取请求的预设次数和每次对应的读取偏移量,计算读请求偏移量平均值和文件未读部分的大小,通过文件未读部分的大小与读请求偏移量平均值相除得到剩余读取请求次数,将所述剩余读取请求次数和所述读请求偏移量平均值作为文件未读部分的读取请求次数和读取偏移量并生成所述map路线;以及将所述map路线存入所述链表中;
执行模块,所述执行模块配置为基于所述链表执行预读。
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行如权利要求1-4任意一项所述的方法的步骤。
CN202110928210.7A 2021-08-13 2021-08-13 一种内核客户端的预读方法、系统及计算机可读存储介质 Active CN113377725B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110928210.7A CN113377725B (zh) 2021-08-13 2021-08-13 一种内核客户端的预读方法、系统及计算机可读存储介质
US18/271,458 US11914551B2 (en) 2021-08-13 2021-11-30 Pre-reading method and system of kernel client, and computer-readable storage medium
PCT/CN2021/134337 WO2023015778A1 (zh) 2021-08-13 2021-11-30 一种内核客户端的预读方法、系统及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110928210.7A CN113377725B (zh) 2021-08-13 2021-08-13 一种内核客户端的预读方法、系统及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113377725A CN113377725A (zh) 2021-09-10
CN113377725B true CN113377725B (zh) 2021-11-12

Family

ID=77577042

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110928210.7A Active CN113377725B (zh) 2021-08-13 2021-08-13 一种内核客户端的预读方法、系统及计算机可读存储介质

Country Status (3)

Country Link
US (1) US11914551B2 (zh)
CN (1) CN113377725B (zh)
WO (1) WO2023015778A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377725B (zh) 2021-08-13 2021-11-12 苏州浪潮智能科技有限公司 一种内核客户端的预读方法、系统及计算机可读存储介质
CN114168272B (zh) * 2022-02-14 2022-04-19 麒麟软件有限公司 一种缓存读文件时随机读的内核io优化方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050205814A1 (en) * 2004-03-17 2005-09-22 Fuji Photo Film Co., Ltd. Method of and apparatus for reading out radiation image
CN105094701A (zh) * 2015-07-20 2015-11-25 浪潮(北京)电子信息产业有限公司 一种自适应预读方法及装置
CN106951301A (zh) * 2017-04-27 2017-07-14 腾讯科技(深圳)有限公司 文件预读方法及装置
JP2017215096A (ja) * 2016-05-31 2017-12-07 三菱電機株式会社 シミュレーション装置、シミュレーション方法及びシミュレーションプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030115410A1 (en) * 1999-06-03 2003-06-19 Lucent Technologies Inc. Method and apparatus for improving file system response time
JP4067293B2 (ja) * 2001-10-17 2008-03-26 富士通株式会社 キャッシュ制御プログラムおよびキャッシュ処理を行うコンピュータ
US7711797B1 (en) * 2006-07-31 2010-05-04 Juniper Networks, Inc. Optimizing batch size for prefetching data over wide area networks
JP5274380B2 (ja) * 2009-06-04 2013-08-28 キヤノン株式会社 情報処理装置、データアクセスシステム及びそれらの制御方法
KR20120064576A (ko) * 2010-12-09 2012-06-19 한국전자통신연구원 비대칭 스토리지 시스템에서 연속적인 읽기/쓰기를 제공하기 위한 장치 및 그 방법
CN102841931A (zh) * 2012-08-03 2012-12-26 中兴通讯股份有限公司 分布式文件系统的存储方法及装置
KR101694988B1 (ko) * 2014-02-26 2017-01-11 한국전자통신연구원 분산 파일시스템에서의 읽기 동작 수행 방법 및 장치
US20170116127A1 (en) * 2015-10-22 2017-04-27 Vormetric, Inc. File system adaptive read ahead
JP7269780B2 (ja) * 2019-04-08 2023-05-09 株式会社日立製作所 情報処理装置および情報処理装置のデータ管理方法
CN111625503B (zh) * 2020-05-29 2022-11-04 苏州浪潮智能科技有限公司 一种分布式文件系统文件局部随机预读的方法和设备
CN113377725B (zh) * 2021-08-13 2021-11-12 苏州浪潮智能科技有限公司 一种内核客户端的预读方法、系统及计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050205814A1 (en) * 2004-03-17 2005-09-22 Fuji Photo Film Co., Ltd. Method of and apparatus for reading out radiation image
CN105094701A (zh) * 2015-07-20 2015-11-25 浪潮(北京)电子信息产业有限公司 一种自适应预读方法及装置
JP2017215096A (ja) * 2016-05-31 2017-12-07 三菱電機株式会社 シミュレーション装置、シミュレーション方法及びシミュレーションプログラム
CN106951301A (zh) * 2017-04-27 2017-07-14 腾讯科技(深圳)有限公司 文件预读方法及装置

Also Published As

Publication number Publication date
US20240037070A1 (en) 2024-02-01
WO2023015778A1 (zh) 2023-02-16
CN113377725A (zh) 2021-09-10
US11914551B2 (en) 2024-02-27

Similar Documents

Publication Publication Date Title
CN113377725B (zh) 一种内核客户端的预读方法、系统及计算机可读存储介质
CN110109873B (zh) 一种用于消息队列的文件管理方法
CN111324665B (zh) 一种日志回放方法及装置
CN112214468B (zh) 一种分布式存储系统小文件加速方法、装置、设备及介质
CN112416880A (zh) 一种基于实时归并的海量小文件存储性能优化方法及装置
CN115114232A (zh) 一种历史版本对象列举方法、装置及其介质
CN113901395A (zh) 数据处理方法、装置、计算机设备和存储介质
CN112463880B (zh) 一种区块链数据存储方法及相关装置
CN110049133B (zh) 一种dns区文件全量下发的方法和装置
CN111309576A (zh) 一种压力测试方法和装置
CN111782153A (zh) 一种基于读取数据的方法、系统、设备以及介质
CN117751368A (zh) 隐私敏感神经网络训练
CN111984591A (zh) 文件存储、读取方法、装置、设备及计算机可读存储介质
CN111435323A (zh) 信息的传输方法、装置、终端、服务器及存储介质
CN113411364B (zh) 资源获取方法、装置及服务器
CN107943415A (zh) 基于fat文件系统的查找空闲簇的方法和系统
CN114647658A (zh) 一种数据检索方法、装置、设备及机器可读存储介质
CN114579061A (zh) 一种数据存储方法、装置、设备及介质
CN111428016A (zh) 一种检测谣言的方法与设备
CN108287853B (zh) 一种数据关系分析方法及其系统
US20130073782A1 (en) Method and device for storing data
CN117271440B (zh) 一种基于freeRTOS文件信息存储方法、读取方法及相关设备
CN113806249B (zh) 一种对象存储有序列举方法、装置、终端及存储介质
CN115495026B (zh) 一种优化内存处理方法、装置、设备及存储介质
CN114510494B (zh) 日志回放方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant