CN111049887A - 基于动态搜索策略的下载控制方法、系统及存储介质 - Google Patents

基于动态搜索策略的下载控制方法、系统及存储介质 Download PDF

Info

Publication number
CN111049887A
CN111049887A CN201911198533.4A CN201911198533A CN111049887A CN 111049887 A CN111049887 A CN 111049887A CN 201911198533 A CN201911198533 A CN 201911198533A CN 111049887 A CN111049887 A CN 111049887A
Authority
CN
China
Prior art keywords
file
downloaded
searching method
determining
identification information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911198533.4A
Other languages
English (en)
Inventor
彭岳松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Lajin Zhongbo Technology Co ltd
Original Assignee
Tianmai Juyuan (hangzhou) Media Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianmai Juyuan (hangzhou) Media Technology Co Ltd filed Critical Tianmai Juyuan (hangzhou) Media Technology Co Ltd
Priority to CN201911198533.4A priority Critical patent/CN111049887A/zh
Publication of CN111049887A publication Critical patent/CN111049887A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于动态搜索策略的下载控制方法、系统及存储介质,方法包括:确定待下载文件的第一标识信息;根据文件大小和文件类型,动态确定文件搜索方法;采用确定的文件搜索方法,从本地存储中搜索目标文件集合;获取目标文件集合中各个目标文件的第二标识信息;计算第一标识信息与第二标识信息的相似度;对相似度大于阈值的目标文件进行展示;判断目标文件是否为待下载文件,若是,则停止下载所述待下载文件;反之,则继续下载所述待下载文件。本发明能够在下载文件的同时判断本地是否已经存储有相同的目标文件,进而能够避免用户重复下载,在节省了本地存储空间的同时,还节约了下载时间,可广泛应用于计算机技术领域。

Description

基于动态搜索策略的下载控制方法、系统及存储介质
技术领域
本发明涉及计算机技术领域,尤其是基于动态搜索策略的下载控制方法、系统及存储介质。
背景技术
随着网络传输技术的发展,用户可以方便地通过网络下载资料。但随着下载资料的数量越来越大,用户难免会遇到下载过的资料需要重复下载。众所周知,现有技术通过浏览器等下载的文件一般预存在指定路径上,而用户在使用完下载文件后如果没有及时删除,就会使得该文件长时间存留在该指定路径上,当用户第二次下载该文件时,本地实际已经存储有该文件,造成了重复下载,浪费了本地存储空间,且浪费了下载时间。因此,现有技术无法了解是否本地已经存在相同内容的资源,造成流量与带宽的浪费。
发明内容
有鉴于此,本发明实施例提供一种能够避免重复下载的,基于动态搜索策略的下载控制方法、系统及存储介质,以减少存储空间的占用并节省下载时间。
第一方面,本发明实施例提供了一种基于动态搜索策略的下载控制方法,包括以下步骤:
确定待下载文件的第一标识信息,所述第一标识信息包括文件名、文件大小、文件类型和文件起始字符;
根据文件大小和文件类型,动态确定文件搜索方法,所述文件搜索方法包括顺序查找法、二分查找法、插值查找法、斐波那契查找法、树表查找法、分块查找法和哈希查找法;
采用确定的文件搜索方法,从本地存储中搜索目标文件集合;
获取目标文件集合中各个目标文件的第二标识信息,所述第二标识信息包括文件名、文件大小、文件类型和文件起始字符;
计算第一标识信息与第二标识信息的相似度;
对相似度大于阈值的目标文件进行展示;
判断目标文件是否为待下载文件,若是,则停止下载所述待下载文件;反之,则继续下载所述待下载文件。
进一步,所述确定待下载文件的第一标识信息这一步骤,包括以下步骤:
根据待下载文件对应的下载链接,调用下载器工具截取待下载文件的文件名;
根据待下载文件对应的下载链接,确定待下载文件的文件大小;
根据待下载文件对应的下载链接,确定待下载文件的文件类型;
根据待下载文件对应的下载链接,下载所述待下载文件的起始部分,对起始部分进行识别得到文件起始字符。
进一步,所述根据文件大小和文件类型,动态确定文件搜索方法这一步骤,包括以下步骤:
对于文件类型为可执行文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第一阈值,若是,则确定文件搜索方法为插值查找法;反之,则确定文件搜索方法为二分查找法;
对于文件类型为图片文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第二阈值,若是,则确定文件搜索方法为斐波那契查找法;反之,则确定文件搜索方法为二分查找法;
对于文件类型为音频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第三阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为树表查找法;
对于文件类型为视频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第四阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为二分查找法;
对于文件类型为文本文件类型的待下载文件,判断该待下载文件的文件大小是否大于第五阈值,若是,则确定文件搜索方法为哈希查找法;反之,则确定文件搜索方法为顺序查找法。
进一步,所述计算第一标识信息与第二标识信息的相似度这一步骤,包括以下步骤:
计算待下载文件的第一文件名哈希值;
计算目标文件的第二文件名哈希值;
采用欧式距离计算法计算第一文件名哈希值与第二文件名哈希值之间的第一相似度;
计算待下载文件的第一文件起始字符哈希值;
计算目标文件的第二文件起始字符哈希值;
采用欧式距离计算法计算第一文件起始字符哈希值与第二文件起始字符哈希值之间的第二相似度;
将第一相似度与第二相似度相加,得到第一标识信息与第二标识信息的相似度。
进一步,还包括以下步骤:
确定目标文件为待下载文件后,将待下载文件的下载内容删除。
进一步,所述对相似度大于阈值的目标文件进行展示这一步骤中:
若目标文件的文件个数为多个,则根据相似度的大小进行排序,并按序将目标文件进行展示。
第二方面,本发明实施例还提供了一种基于动态搜索策略的下载控制系统,包括:
第一确定模块,用于确定待下载文件的第一标识信息,所述第一标识信息包括文件名、文件大小、文件类型和文件起始字符;
第二确定模块,用于根据文件大小和文件类型,动态确定文件搜索方法,所述文件搜索方法包括顺序查找法、二分查找法、插值查找法、斐波那契查找法、树表查找法、分块查找法和哈希查找法;
搜索模块,用于采用确定的文件搜索方法,从本地存储中搜索目标文件集合;
获取模块,用于获取目标文件集合中各个目标文件的第二标识信息,所述第二标识信息包括文件名、文件大小、文件类型和文件起始字符;
计算模块,用于计算第一标识信息与第二标识信息的相似度;
展示模块,用于对相似度大于阈值的目标文件进行展示;
判断模块,用于判断目标文件是否为待下载文件,若是,则停止下载所述待下载文件;反之,则继续下载所述待下载文件。
进一步,所述第二确定模块包括:
第一确定单元,用于对于文件类型为可执行文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第一阈值,若是,则确定文件搜索方法为插值查找法;反之,则确定文件搜索方法为二分查找法;
第二确定单元,用于对于文件类型为图片文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第二阈值,若是,则确定文件搜索方法为斐波那契查找法;反之,则确定文件搜索方法为二分查找法;
第三确定单元,用于对于文件类型为音频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第三阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为树表查找法;
第四确定单元,用于对于文件类型为视频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第四阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为二分查找法;
第五确定单元,用于对于文件类型为文本文件类型的待下载文件,判断该待下载文件的文件大小是否大于第五阈值,若是,则确定文件搜索方法为哈希查找法;反之,则确定文件搜索方法为顺序查找法。
第三方面,本发明实施例还提供了一种基于动态搜索策略的下载控制系统,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述的基于动态搜索策略的下载控制方法。
第四方面,本发明实施例还提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行所述的基于动态搜索策略的下载控制方法
上述本发明实施例中的一个或多个技术方案具有如下优点:本发明的实施例首先确定待下载文件的第一标识信息,接着动态确定文件搜索方法,然后获取目标文件的第二标识信息,通过计算第一标识信息与第二标识信息的相似度后,确定目标文件是否为待下载文件;本发明能够在下载文件的同时判断本地是否已经存储有相同的目标文件,进而能够避免用户重复下载,在节省了本地存储空间的同时,还节约了下载时间。
附图说明
图1为本发明实施例的步骤流程图。
具体实施方式
下面结合说明书附图和具体实施例对本发明作进一步解释和说明。对于本发明实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
参照图1,本发明实施例提供了一种基于动态搜索策略的下载控制方法,包括以下步骤:
确定待下载文件的第一标识信息,所述第一标识信息包括文件名、文件大小、文件类型和文件起始字符;
根据文件大小和文件类型,动态确定文件搜索方法,所述文件搜索方法包括顺序查找法、二分查找法、插值查找法、斐波那契查找法、树表查找法、分块查找法和哈希查找法;
采用确定的文件搜索方法,从本地存储中搜索目标文件集合;
获取目标文件集合中各个目标文件的第二标识信息,所述第二标识信息包括文件名、文件大小、文件类型和文件起始字符;
计算第一标识信息与第二标识信息的相似度;
对相似度大于阈值的目标文件进行展示;
判断目标文件是否为待下载文件,若是,则停止下载所述待下载文件;反之,则继续下载所述待下载文件。
进一步作为优选的实施方式,所述确定待下载文件的第一标识信息这一步骤,包括以下步骤:
根据待下载文件对应的下载链接,调用下载器工具截取待下载文件的文件名;
根据待下载文件对应的下载链接,确定待下载文件的文件大小;
根据待下载文件对应的下载链接,确定待下载文件的文件类型;
根据待下载文件对应的下载链接,下载所述待下载文件的起始部分,对起始部分进行识别得到文件起始字符。
进一步作为优选的实施方式,所述根据文件大小和文件类型,动态确定文件搜索方法这一步骤,包括以下步骤:
对于文件类型为可执行文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第一阈值,若是,则确定文件搜索方法为插值查找法;反之,则确定文件搜索方法为二分查找法;
对于文件类型为图片文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第二阈值,若是,则确定文件搜索方法为斐波那契查找法;反之,则确定文件搜索方法为二分查找法;
对于文件类型为音频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第三阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为树表查找法;
对于文件类型为视频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第四阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为二分查找法;
对于文件类型为文本文件类型的待下载文件,判断该待下载文件的文件大小是否大于第五阈值,若是,则确定文件搜索方法为哈希查找法;反之,则确定文件搜索方法为顺序查找法。
进一步作为优选的实施方式,所述计算第一标识信息与第二标识信息的相似度这一步骤,包括以下步骤:
计算待下载文件的第一文件名哈希值;
计算目标文件的第二文件名哈希值;
采用欧式距离计算法计算第一文件名哈希值与第二文件名哈希值之间的第一相似度;
计算待下载文件的第一文件起始字符哈希值;
计算目标文件的第二文件起始字符哈希值;
采用欧式距离计算法计算第一文件起始字符哈希值与第二文件起始字符哈希值之间的第二相似度;
将第一相似度与第二相似度相加,得到第一标识信息与第二标识信息的相似度。
进一步作为优选的实施方式,还包括以下步骤:
确定目标文件为待下载文件后,将待下载文件的下载内容删除。
进一步作为优选的实施方式,所述对相似度大于阈值的目标文件进行展示这一步骤中:
若目标文件的文件个数为多个,则根据相似度的大小进行排序,并按序将目标文件进行展示。
与图1的方法相对应,本发明实施例还提供了一种基于动态搜索策略的下载控制系统,包括:
第一确定模块,用于确定待下载文件的第一标识信息,所述第一标识信息包括文件名、文件大小、文件类型和文件起始字符;
第二确定模块,用于根据文件大小和文件类型,动态确定文件搜索方法,所述文件搜索方法包括顺序查找法、二分查找法、插值查找法、斐波那契查找法、树表查找法、分块查找法和哈希查找法;
搜索模块,用于采用确定的文件搜索方法,从本地存储中搜索目标文件集合;
获取模块,用于获取目标文件集合中各个目标文件的第二标识信息,所述第二标识信息包括文件名、文件大小、文件类型和文件起始字符;
计算模块,用于计算第一标识信息与第二标识信息的相似度;
展示模块,用于对相似度大于阈值的目标文件进行展示;
判断模块,用于判断目标文件是否为待下载文件,若是,则停止下载所述待下载文件;反之,则继续下载所述待下载文件。
进一步作为优选的实施方式,所述第二确定模块包括:
第一确定单元,用于对于文件类型为可执行文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第一阈值,若是,则确定文件搜索方法为插值查找法;反之,则确定文件搜索方法为二分查找法;
第二确定单元,用于对于文件类型为图片文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第二阈值,若是,则确定文件搜索方法为斐波那契查找法;反之,则确定文件搜索方法为二分查找法;
第三确定单元,用于对于文件类型为音频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第三阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为树表查找法;
第四确定单元,用于对于文件类型为视频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第四阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为二分查找法;
第五确定单元,用于对于文件类型为文本文件类型的待下载文件,判断该待下载文件的文件大小是否大于第五阈值,若是,则确定文件搜索方法为哈希查找法;反之,则确定文件搜索方法为顺序查找法。
下面详细描述本发明基于动态搜索策略的下载控制方法的具体实施步骤:
S1、确定待下载文件的第一标识信息,所述第一标识信息包括文件名、文件大小、文件类型和文件起始字符;
具体的,所述步骤S1包括以下步骤:
S11、根据待下载文件对应的下载链接,调用下载器工具截取待下载文件的文件名;
S12、根据待下载文件对应的下载链接,确定待下载文件的文件大小;
S13、根据待下载文件对应的下载链接,确定待下载文件的文件类型;
S14、根据待下载文件对应的下载链接,下载所述待下载文件的起始部分,对起始部分进行识别得到文件起始字符。
本实施例中,首先通过下载器工具截取待下载文件的文件名,例如通过迅雷下载器,输入下载链接之后,能够直接获取待下载文件的文件名信息。
同样地,本实施例还能通过下载器工具直接获取待下载文件的文件大小,例如使用迅雷下载器下载文件时,能够提前显示文件的整体大小。
本实施例中所述待下载文件的文件类型包括可执行文件格式类型、图片文件格式类型、音频文件格式类型、视频文件格式类型和文本文件类型。
本实施例在获取了下载链接的时候,先下载所述待下载文件的起始部分,并识别得到相应的文件起始字符。例如待下载文件为文本文件类型,则获取对应的文件起始部分,然后通过分词算法切分出起始部分中前10个字符的词,将切分出来的词转换成统一的UTF-16编码,并将该编码作为该文本文件的文件起始字符。对于视频文件格式类型的待下载文件,则可获取前10个视频帧,然后将获取的视频帧转换成统一的UTF-16编码,并将该编码作为该文本文件的文件起始字符。
S2、根据文件大小和文件类型,动态确定文件搜索方法,所述文件搜索方法包括顺序查找法、二分查找法、插值查找法、斐波那契查找法、树表查找法、分块查找法和哈希查找法;
具体的,所述步骤S2包括以下步骤:
S21、对于文件类型为可执行文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第一阈值,若是,则确定文件搜索方法为插值查找法;反之,则确定文件搜索方法为二分查找法;
其中,插值查找是有序表的一种查找方式。插值查找是根据查找关键子与查找表中最大最小记录关键字比较后的查找方法。插值查找基于二分查找,将查找点的选择改进为自适应选择,提高查找效率。
二分查找也称折半查找(Binary Search),它是一种效率较高的查找方法。但是,折半查找要求线性表必须采用顺序存储结构,而且表中元素按关键字有序排列。
本实施例预设的第一阈值为1GiB,即当待下载文件的文件大小大于1GiB时,采用效率较高的插值查找法来进行文件查找,当待下载文件的文件大小等于或者小于1GiB时,采用效率较低但能够按顺序查找的二分查找法来进行文件查找。
S22、对于文件类型为图片文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第二阈值,若是,则确定文件搜索方法为斐波那契查找法;反之,则确定文件搜索方法为二分查找法;
其中,斐波那契搜索(Fibonacci search),又称斐波那契查找,是区间中单峰函数的搜索技术。斐波那契搜索就是在二分查找的基础上根据斐波那契数列进行分割的。在斐波那契数列找一个等于略大于查找表中元素个数的数F[n],将原查找表扩展为长度为F[n](如果要补充元素,则补充重复最后一个元素,直到满足F[n]个元素),完成后进行斐波那契分割,即F[n]个元素分割为前半部分F[n-1]个元素,后半部分F[n-2]个元素,找出要查找的元素在那一部分并递归,直到找到。
本实施例预设的第二阈值为20MiB,当图片文件格式的待下载文件大于20MiB时,采用准确率较高的插值查找法来进行文件查找,当待下载文件的文件大小等于或者小于20MiB时,采用效率较低但能够按顺序查找的二分查找法来进行文件查找。
S23、对于文件类型为音频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第三阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为树表查找法;
其中,分块查找是折半查找和顺序查找的一种改进方法,分块查找由于只要求索引表是有序的,对块内节点没有排序要求,因此特别适合于节点动态变化的情况。
树表查找是对树型存储结构所做的查找。树型存储结构是一种多链表,该表中的每个结点包含有一个数据域和多个指针域,每个指针域指向一个后继结点。
本实施例预设的第三阈值为200MiB,当音频文件格式的待下载文件大于200MiB时,采用准确率较高的分块查找法来进行文件查找,当待下载文件的文件大小等于或者小于200MiB时,采用效率较低但能够按顺序查找的树表查找法来进行文件查找。
S24、对于文件类型为视频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第四阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为二分查找法;
本实施例预设的第四阈值为3GiB,当视频文件格式的待下载文件大于3GiB时,采用准确率较高的分块查找法来进行文件查找,当待下载文件的文件大小等于或者小于3GiB时,采用效率较低但能够按顺序查找的二分查找法来进行文件查找。
S25、对于文件类型为文本文件类型的待下载文件,判断该待下载文件的文件大小是否大于第五阈值,若是,则确定文件搜索方法为哈希查找法;反之,则确定文件搜索方法为顺序查找法。
本实施例预设的第五阈值为10MiB,当文本文件格式的待下载文件大于10MiB时,采用准确率较高的哈希查找法来进行文件查找,当待下载文件的文件大小等于或者小于10MiB时,采用效率较低但能够按顺序查找的顺序查找法来进行文件查找。
S3、采用确定的文件搜索方法,从本地存储中搜索目标文件集合;
S4、获取目标文件集合中各个目标文件的第二标识信息,所述第二标识信息包括文件名、文件大小、文件类型和文件起始字符;
S5、计算第一标识信息与第二标识信息的相似度;
具体的,本实施例采用BM25原理来计算两个标识信息之间的相似度,bm25是一种用来评价搜索词和文档之间相关性的算法,它是一种基于概率检索模型提出的算法。
所述步骤S5包括以下步骤:
S51、计算待下载文件的第一文件名哈希值;
本实施例采用现有的哈希函数来计算哈希值,在此不再赘述。
S52、计算目标文件的第二文件名哈希值;
S53、采用欧式距离计算法计算第一文件名哈希值与第二文件名哈希值之间的第一相似度;
S54、计算待下载文件的第一文件起始字符哈希值;
S55、计算目标文件的第二文件起始字符哈希值;
S56、采用欧式距离计算法计算第一文件起始字符哈希值与第二文件起始字符哈希值之间的第二相似度;
S57、将第一相似度与第二相似度相加,得到第一标识信息与第二标识信息的相似度。
S6、对相似度大于阈值的目标文件进行展示;
S7、判断目标文件是否为待下载文件,若是,则停止下载所述待下载文件;反之,则继续下载所述待下载文件。
S8、确定目标文件为待下载文件后,将待下载文件的下载内容删除。
本实施例在确定了目标文件为待下载文件后,能够直接获取本地的目标文件进行使用,无需再次重复下载文件,节约了时间成本和存储成本,且自动将已经下载的累赘内容删除。
本发明实施例还提供了一种基于动态搜索策略的下载控制系统,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述的基于动态搜索策略的下载控制方法。
上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
此外,本发明实施例还提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行所述的基于动态搜索策略的下载控制方法。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.基于动态搜索策略的下载控制方法,其特征在于:包括以下步骤:
确定待下载文件的第一标识信息,所述第一标识信息包括文件名、文件大小、文件类型和文件起始字符;
根据文件大小和文件类型,动态确定文件搜索方法,所述文件搜索方法包括顺序查找法、二分查找法、插值查找法、斐波那契查找法、树表查找法、分块查找法和哈希查找法;
采用确定的文件搜索方法,从本地存储中搜索目标文件集合;
获取目标文件集合中各个目标文件的第二标识信息,所述第二标识信息包括文件名、文件大小、文件类型和文件起始字符;
计算第一标识信息与第二标识信息的相似度;
对相似度大于阈值的目标文件进行展示;
判断目标文件是否为待下载文件,若是,则停止下载所述待下载文件;反之,则继续下载所述待下载文件。
2.根据权利要求1所述的基于动态搜索策略的下载控制方法,其特征在于:所述确定待下载文件的第一标识信息这一步骤,包括以下步骤:
根据待下载文件对应的下载链接,调用下载器工具截取待下载文件的文件名;
根据待下载文件对应的下载链接,确定待下载文件的文件大小;
根据待下载文件对应的下载链接,确定待下载文件的文件类型;
根据待下载文件对应的下载链接,下载所述待下载文件的起始部分,对起始部分进行识别得到文件起始字符。
3.根据权利要求1所述的基于动态搜索策略的下载控制方法,其特征在于:所述根据文件大小和文件类型,动态确定文件搜索方法这一步骤,包括以下步骤:
对于文件类型为可执行文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第一阈值,若是,则确定文件搜索方法为插值查找法;反之,则确定文件搜索方法为二分查找法;
对于文件类型为图片文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第二阈值,若是,则确定文件搜索方法为斐波那契查找法;反之,则确定文件搜索方法为二分查找法;
对于文件类型为音频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第三阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为树表查找法;
对于文件类型为视频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第四阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为二分查找法;
对于文件类型为文本文件类型的待下载文件,判断该待下载文件的文件大小是否大于第五阈值,若是,则确定文件搜索方法为哈希查找法;反之,则确定文件搜索方法为顺序查找法。
4.根据权利要求1所述的基于动态搜索策略的下载控制方法,其特征在于:所述计算第一标识信息与第二标识信息的相似度这一步骤,包括以下步骤:
计算待下载文件的第一文件名哈希值;
计算目标文件的第二文件名哈希值;
采用欧式距离计算法计算第一文件名哈希值与第二文件名哈希值之间的第一相似度;
计算待下载文件的第一文件起始字符哈希值;
计算目标文件的第二文件起始字符哈希值;
采用欧式距离计算法计算第一文件起始字符哈希值与第二文件起始字符哈希值之间的第二相似度;
将第一相似度与第二相似度相加,得到第一标识信息与第二标识信息的相似度。
5.根据权利要求1所述的基于动态搜索策略的下载控制方法,其特征在于:还包括以下步骤:
确定目标文件为待下载文件后,将待下载文件的下载内容删除。
6.根据权利要求1所述的基于动态搜索策略的下载控制方法,其特征在于:所述对相似度大于阈值的目标文件进行展示这一步骤中:
若目标文件的文件个数为多个,则根据相似度的大小进行排序,并按序将目标文件进行展示。
7.基于动态搜索策略的下载控制系统,其特征在于:包括:
第一确定模块,用于确定待下载文件的第一标识信息,所述第一标识信息包括文件名、文件大小、文件类型和文件起始字符;
第二确定模块,用于根据文件大小和文件类型,动态确定文件搜索方法,所述文件搜索方法包括顺序查找法、二分查找法、插值查找法、斐波那契查找法、树表查找法、分块查找法和哈希查找法;
搜索模块,用于采用确定的文件搜索方法,从本地存储中搜索目标文件集合;
获取模块,用于获取目标文件集合中各个目标文件的第二标识信息,所述第二标识信息包括文件名、文件大小、文件类型和文件起始字符;
计算模块,用于计算第一标识信息与第二标识信息的相似度;
展示模块,用于对相似度大于阈值的目标文件进行展示;
判断模块,用于判断目标文件是否为待下载文件,若是,则停止下载所述待下载文件;反之,则继续下载所述待下载文件。
8.根据权利要求7所述的基于动态搜索策略的下载控制系统,其特征在于:所述第二确定模块包括:
第一确定单元,用于对于文件类型为可执行文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第一阈值,若是,则确定文件搜索方法为插值查找法;反之,则确定文件搜索方法为二分查找法;
第二确定单元,用于对于文件类型为图片文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第二阈值,若是,则确定文件搜索方法为斐波那契查找法;反之,则确定文件搜索方法为二分查找法;
第三确定单元,用于对于文件类型为音频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第三阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为树表查找法;
第四确定单元,用于对于文件类型为视频文件格式类型的待下载文件,判断该待下载文件的文件大小是否大于第四阈值,若是,则确定文件搜索方法为分块查找法;反之,则确定文件搜索方法为二分查找法;
第五确定单元,用于对于文件类型为文本文件类型的待下载文件,判断该待下载文件的文件大小是否大于第五阈值,若是,则确定文件搜索方法为哈希查找法;反之,则确定文件搜索方法为顺序查找法。
9.基于动态搜索策略的下载控制系统,其特征在于:包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-6中任一项所述的基于动态搜索策略的下载控制方法。
10.一种存储介质,其中存储有处理器可执行的指令,其特征在于:所述处理器可执行的指令在由处理器执行时用于执行如权利要求1-6中任一项所述的基于动态搜索策略的下载控制方法。
CN201911198533.4A 2019-11-29 2019-11-29 基于动态搜索策略的下载控制方法、系统及存储介质 Pending CN111049887A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911198533.4A CN111049887A (zh) 2019-11-29 2019-11-29 基于动态搜索策略的下载控制方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911198533.4A CN111049887A (zh) 2019-11-29 2019-11-29 基于动态搜索策略的下载控制方法、系统及存储介质

Publications (1)

Publication Number Publication Date
CN111049887A true CN111049887A (zh) 2020-04-21

Family

ID=70234050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911198533.4A Pending CN111049887A (zh) 2019-11-29 2019-11-29 基于动态搜索策略的下载控制方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN111049887A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115834572A (zh) * 2022-12-13 2023-03-21 广州文远知行科技有限公司 一种文件下载方法、装置、设备和存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101420452A (zh) * 2008-12-05 2009-04-29 深圳市迅雷网络技术有限公司 一种视频文件的发布方法及装置
US20140129540A1 (en) * 2012-11-02 2014-05-08 Swiftype, Inc. Modifying a Custom Search Engine for a Web Site Based on Custom Tags
CN106055549A (zh) * 2015-04-09 2016-10-26 国际商业机器公司 利用加速器的概念分析操作
EP3163474A1 (en) * 2015-09-28 2017-05-03 Fujitsu Limited A similarity module, a local computer, a server of a data hosting service and associated methods
CN107291949A (zh) * 2017-07-17 2017-10-24 小草数语(北京)科技有限公司 信息搜索方法及装置
CN107741937A (zh) * 2016-09-13 2018-02-27 腾讯科技(深圳)有限公司 一种数据查询方法及装置
CN108829765A (zh) * 2018-05-29 2018-11-16 平安科技(深圳)有限公司 一种信息查询方法、装置、计算机设备及存储介质
CN109189772A (zh) * 2018-08-21 2019-01-11 华清瑞达(天津)科技有限公司 用于无文件系统存储介质的文件管理方法及系统
CN109324999A (zh) * 2018-11-30 2019-02-12 维沃移动通信有限公司 一种基于下载指令执行操作的方法和电子设备
CN110471660A (zh) * 2019-08-16 2019-11-19 天脉聚源(杭州)传媒科技有限公司 基于大数据的个性化下载界面生成方法、系统及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101420452A (zh) * 2008-12-05 2009-04-29 深圳市迅雷网络技术有限公司 一种视频文件的发布方法及装置
US20140129540A1 (en) * 2012-11-02 2014-05-08 Swiftype, Inc. Modifying a Custom Search Engine for a Web Site Based on Custom Tags
CN106055549A (zh) * 2015-04-09 2016-10-26 国际商业机器公司 利用加速器的概念分析操作
EP3163474A1 (en) * 2015-09-28 2017-05-03 Fujitsu Limited A similarity module, a local computer, a server of a data hosting service and associated methods
CN107741937A (zh) * 2016-09-13 2018-02-27 腾讯科技(深圳)有限公司 一种数据查询方法及装置
CN107291949A (zh) * 2017-07-17 2017-10-24 小草数语(北京)科技有限公司 信息搜索方法及装置
CN108829765A (zh) * 2018-05-29 2018-11-16 平安科技(深圳)有限公司 一种信息查询方法、装置、计算机设备及存储介质
CN109189772A (zh) * 2018-08-21 2019-01-11 华清瑞达(天津)科技有限公司 用于无文件系统存储介质的文件管理方法及系统
CN109324999A (zh) * 2018-11-30 2019-02-12 维沃移动通信有限公司 一种基于下载指令执行操作的方法和电子设备
CN110471660A (zh) * 2019-08-16 2019-11-19 天脉聚源(杭州)传媒科技有限公司 基于大数据的个性化下载界面生成方法、系统及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115834572A (zh) * 2022-12-13 2023-03-21 广州文远知行科技有限公司 一种文件下载方法、装置、设备和存储介质
CN115834572B (zh) * 2022-12-13 2024-03-26 广州文远知行科技有限公司 一种文件下载方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
US20180260114A1 (en) Predictive models of file access patterns by application and file type
JP5652220B2 (ja) ファイル管理装置及びプログラム
JP5209635B2 (ja) ファイルのコンテンツ識別子を比較するシステム
JP5886447B2 (ja) ロケーション非依存のファイル
CN105573667A (zh) 一种数据读取方法和存储服务器
KR20170123336A (ko) 파일 조작 방법 및 장치
CN112330398B (zh) 一种对象处理方法、装置、电子设备及存储介质
JP4233564B2 (ja) データ処理装置、データ処理用のプログラムおよび記録媒体
CN109472540B (zh) 业务处理方法和装置
MXPA04007146A (es) Metodo y aparato para resolucion de nombre de ruta de aglutinacion tardia/dinamica.
CN109710827B (zh) 图片属性管理方法、装置、图片服务端和业务处理端
CN111049887A (zh) 基于动态搜索策略的下载控制方法、系统及存储介质
CN113312553B (zh) 一种用户标签的确定方法和装置
CN111090623B (zh) 一种数据审计方法、装置、电子设备及存储介质
CN108108379B (zh) 关键词拓词的方法及装置
US8407187B2 (en) Validating files using a sliding window to access and correlate records in an arbitrarily large dataset
KR102455316B1 (ko) 복수의 정보원에서 얻는 정보 및 도구를 통일화하는 방법 및 이를 응용한 컴퓨터 프로그램 제품과 장치
CN114070844B (zh) 一种文件下载方法、装置、计算设备及存储介质
CN113705683B (zh) 推荐模型的训练方法、装置、电子设备及存储介质
CN113411364B (zh) 资源获取方法、装置及服务器
JP2006172282A (ja) 文書管理システム、文書管理方法、コンピュータプログラム
CN109960695B (zh) 云计算系统中数据库的管理方法和装置
CN106021416A (zh) 一种文件图标的创建方法和终端
CN112966029A (zh) 一种信息显示和发送方法、装置、设备和可读介质
CN116226222B (zh) 基于时序数据库的数据段标记处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20221013

Address after: Room 1602, 16th Floor, Building 18, Yard 6, Wenhuayuan West Road, Beijing Economic and Technological Development Zone, Daxing District, Beijing 100176

Applicant after: Beijing Lajin Zhongbo Technology Co.,Ltd.

Address before: 310000 room 650, building 3, No. 16, Zhuantang science and technology economic block, Xihu District, Hangzhou City, Zhejiang Province

Applicant before: Tianmai Juyuan (Hangzhou) Media Technology Co.,Ltd.

TA01 Transfer of patent application right
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200421

WD01 Invention patent application deemed withdrawn after publication