CN110019019A - 数据文件管理方法、装置、设备及计算机可读存储介质 - Google Patents

数据文件管理方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110019019A
CN110019019A CN201910216910.6A CN201910216910A CN110019019A CN 110019019 A CN110019019 A CN 110019019A CN 201910216910 A CN201910216910 A CN 201910216910A CN 110019019 A CN110019019 A CN 110019019A
Authority
CN
China
Prior art keywords
data file
index
content
file management
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910216910.6A
Other languages
English (en)
Other versions
CN110019019B (zh
Inventor
吴成锐
李红臻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Rui En Science And Technology Ltd
Original Assignee
Guangdong Rui En Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Rui En Science And Technology Ltd filed Critical Guangdong Rui En Science And Technology Ltd
Priority to CN201910216910.6A priority Critical patent/CN110019019B/zh
Publication of CN110019019A publication Critical patent/CN110019019A/zh
Application granted granted Critical
Publication of CN110019019B publication Critical patent/CN110019019B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据文件管理方法,在接收到索引的创建命令时,获取文件系统中待创建索引的各个数据文件;基于所述获取的各个数据文件,提取各个所述数据文件的目录信息;基于所述提取的各个目录信息,建立各个所述数据文件的索引。本发明还公开了一种数据文件管理装置、设备和计算机可读存储介质。本发明通过提取数据文件中的关键属性字段和关键内容字段,创建数据文件的索引,提高了数据文件的管理效率。

Description

数据文件管理方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及数据文件领域,尤其涉及一种数据文件管理方法、装置、设备及计算机可读存储介质。
背景技术
随着数据量越来越大,数据文件在终端设备上的操作变得很缓慢,文件排序需要很长时间,还可能造成系统无法使用。
典型的情况下,每日新增数据文件几百G字节,分布在几万个文件系统里面。文件系统总体规模非常庞大,数据文件的管理显得越来越困难,在现有的文件系统中,目录只是保存了当前目录下文件名字条目,在每次查询和排序的时候,都需要整个系统重新计算,显然这种数据文件的管理效率低。
发明内容
本发明的主要目的在于提出一种数据文件管理方法、装置、设备及计算机可读存储介质,旨在解决数据文件的管理效率低的技术问题。
为实现上述目的,本发明提供一种数据文件管理方法,所述数据文件管理方法包括以下步骤:
在接收到索引的创建命令时,获取文件系统中待创建索引的各个数据文件;
基于所述获取的各个数据文件,提取各个所述数据文件的目录信息;
基于所述提取的各个目录信息,建立各个所述数据文件的索引。
优选地,所述基于所述提取的各个目录信息,建立各个所述数据文件的索引的步骤包括:
基于所述提取的各个目录信息,提取所述各个数据文件中的关键属性字段;
基于提取的各个所述关键属性字段,分别计算各个所述关键属性字段的索引;
根据计算的结果,获取各个所述关键属性字段在索引上的指针位置,并分别写入各个所述关键属性字段对应的索引数据。
优选地,所述基于所述提取的各个目录信息,建立各个所述数据文件的索引的步骤包括:
基于所述提取的各个目录信息,读取所述各个数据文件中的关键内容字段;
基于所述读取的各个所述关键内容字段,提取各个所述关键内容字段的各个行内容;
按照预设的列间隔符,将各个所述行内容分别拆分成预设个数列内容;
基于所述拆分的预设个数列内容,分别计算所述预设个数列内容的索引;
根据计算的结果,获取各个行内容在各个索引上的指针位置,并分别写入各个所述行内容对应的索引数据。
优选地,所述数据文件管理方法还包括:
在检测到新数据文件时,获取所述新数据文件对应的关键属性字段和关键内容字段;
基于所述获取的关键属性字段和关键内容字段,创建并更新所述新数据文件的索引信息。
优选地,所述数据文件管理方法还包括:
在接收到数据文件查询指令时,分析所述接收到的查询指令,并提取出预设的过滤条件;
基于所述提取的过滤条件,确定是否能提取出所述数据文件预设的索引条件;
在提取出预设的索引条件时,根据数据文件中的关键属性字段及/或关键内容字段进行查找索引,以获取查询结果。
此外,为实现上述目的,本发明还提出一种数据文件管理装置,所述数据文件管理装置包括:
获取模块,用于在接收到索引的创建命令时,获取文件系统中待创建索引的各个数据文件;
提取模块,用于基于所述获取的各个数据文件,提取各个所述数据文件的目录信息;
建立模块,用于基于所述提取的各个目录信息,建立各个所述数据文件的索引。
优选地,所述建立模块包括:
第一提取单元,用于基于所述提取的各个目录信息,提取所述各个数据文件中的关键属性字段;
第一计算单元,用于基于提取的各个所述关键属性字段,分别计算各个所述关键属性字段的索引;
第一处理单元,用于根据计算的结果,获取各个所述关键属性字段在索引上的指针位置,并分别写入各个所述关键属性字段对应的索引数据。
优选地,所述建立模块还包括:
读取单元,用于基于所述提取的各个目录信息,读取所述各个数据文件中的关键内容字段;
第二提取单元,用于基于所述读取的各个所述关键内容字段,提取各个所述关键内容字段的各个行内容;
拆分单元,用于按照预设的列间隔符,将各个所述行内容分别拆分成预设个数列内容;
第二计算单元,用于基于所述拆分的预设个数列内容,分别计算所述预设个数列内容的索引;
第二处理单元,用于根据计算的结果,获取各个行内容在各个索引上的指针位置,并分别写入各个所述行内容对应的索引数据。
优选地,所述获取模块,还用于在检测到新数据文件时,获取所述新数据文件对应的关键属性字段和关键内容字段;
所述数据文件管理装置还包括处理模块,用于基于所述获取的关键属性字段和关键内容字段,创建并更新所述新数据文件的索引信息。
优选地,所述数据文件管理装置包括:
处理模块,用于在接收到数据文件查询指令时,分析所述接收到的查询指令,并提取出预设的过滤条件;
分析模块,用于基于所述提取的过滤条件,分析是否能提取出所述数据文件预设的索引条件;
获取模块,用于在提取出预设的索引条件时,根据数据文件中的关键属性字段及/或关键内容字段进行查找索引,以获取查询结果。
此外,为实现上述目的,本发明还提出一种数据文件管理设备,所述数据文件管理设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的数据文件管理程序,所述数据文件管理程序被所述处理器执行时实现如上文所述的数据文件管理方法的步骤。
此外,为实现上述目的,本发明还提出一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据文件管理程序,所述数据文件管理程序被处理器执行时实现如上文所述的数据文件管理方法的步骤。
本发明提出的数据文件管理方法和装置,在接收到索引的创建命令时,获取文件系统中待创建索引的各个数据文件,基于所述获取的各个数据文件,提取各个所述数据文件的目录信息,基于所述提取的各个目录信息,建立各个所述数据文件的索引,相比于现有的数据文件管理模式,通过提取数据文件中的关键属性字段和关键内容字段,创建数据文件的索引,提高了数据文件管理效率。
附图说明
图1为本发明数据文件管理方法第一实施例的流程示意图;
图2为图1中步骤S30的第一实施例细化流程示意图;
图3为图1中步骤S30的第二实施例细化流程示意图;
图4为本发明数据文件管理方法第二实施例的流程示意图;
图5为本发明数据文件管理方法第三实施例的流程示意图;
图6为本发明数据文件管理装置第一实施例的功能模块示意图;
图7为图6中建立模块的第一实施例细化功能模块示意图;
图8为图6中建立模块的第二实施例细化功能模块示意图;
图9为本发明数据文件管理装置第二实施例的功能模块示意图;
图10为本发明数据文件管理装置第三实施例的功能模块示意图;
图11为本发明数据文件管理设备的硬件架构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种数据文件管理方法。
参照图1,图1为本发明数据文件管理方法第一实施例的流程示意图。
步骤S10,在接收到索引的创建命令时,获取文件系统中待创建索引的各个数据文件;
在本实施例中,所述数据文件管理方法可选应用于终端中,所述终端可选为图11中所述的终端,所述终端设置有实体按键或虚拟按键,其中,所述实体按键与所述终端的处理器通信连接。所述终端根据所述实体按键或虚拟按键接收到索引的创建命令时,获取文件系统中待创建索引的各个数据文件。
在本实施例中,所述实体按键可选是终端中新设计的按键,该实体按键可选为多功能按键,包括数据索引查询功能、建立索引功能等多种功能。所述实体按键可设置在终端的任一位置,可选设置在终端的侧边或背面,具体的设置位置不做限定,根据实际情况而定。本实施例中,所述实体按键还可选为终端已有的按键,如终端的home键,在实体按键为终端已有的按键时,对该实体按键复用出更多的功能,使得该实体按键具备索引查询功能、建立索引功能等多种功能。在终端设置的该实体按键,与终端的处理器通信连接,以将接收到的操作指令发送至处理器,由处理器根据接收到的操作指令执行相应的控制操作,如索引查询、建立索引等等。
所述步骤S10之前,包括预设文件系统的管理方式以及配置文件系统的运行参数的步骤,所述文件系统的管理方式以及配置文件系统的运行参数的方式优选包括:a、配置文件系统的基本参数,如配置文件系统中索引的更新方式、系统内存池、系统线程数以及索引是否随系统的启动在后台运行等;b、配置索引的相关参数,如配置索引存储位置、索引对应的数据文件类型(如索引包括/排除哪些类型数据文件)以及索引是否包括子目录等;c、采集系统运行过程中产生的数据统计信息,并将所述产生的数据统计信息展现给用户,用户可通过分析这些统计信息,优化调整配置参数,使系统运行状态最佳。在本实施例中,所述数据文件包括日志文件、语音文件。
步骤S20,基于所述获取的各个数据文件,提取各个所述数据文件的目录信息;
步骤S30,基于所述提取的各个目录信息,建立各个所述数据文件的索引。
在本实施例中,所述基于所述提取的各个目录信息,建立各个所述数据文件的索引的实施例包括:
1)第一实施例,参照图2,所述步骤S30包括:
步骤S31,基于所述提取的各个目录信息,提取所述各个数据文件中的关键属性字段;
在本实施例中,基于所述提取的各个目录信息,确定各个目录信息对应的数据文件名称,并基于所述确定的数据文件名称,分别从目录信息列表中提取出所述确定的数据文件对应的关键属性字段,所述关键属性字段包括数据文件的名称、大小、类型以及创建日期。
步骤S32,基于提取的各个所述关键属性字段,分别计算各个所述关键属性字段的索引;
在本实施例中,优选为基于提取的各个所述关键属性字段,分析所述关键属性字段的字段列表、字段类型及/或字段之间的先后顺序,优选根据hash方法,计算各个所述关键属性字段的索引。
步骤S33,根据计算的结果,获取各个所述关键属性字段在索引上的指针位置,并分别写入各个所述关键属性字段对应的索引数据。
在本实施例中,优选为根据所述计算好的所述关键属性字段对应的索引数据,在索引树上查找所述索引数据对应的位置指针,并将所述索引数据加入所述查找的位置指针并保存。可以理解的是,在使用数据文件过程中,通过文件名称等文件属性寻找数据文件,可通过索引定位,若对某个目录列表下的文件进行排序,排序的规则预设为某个关键属性的先后顺序,即可利用定位到的索引信息查询数据文件。
1)第二实施例,参照图3,所述步骤S30包括:
步骤S34,基于所述提取的各个目录信息,读取所述各个数据文件中的关键内容字段;
在本实施例中,基于所述提取的各个目录信息,确定各个目录信息对应的数据文件名称,并基于所述确定的数据文件名称,分别从目录信息列表中提取出所述确定的数据文件对应的关键内容字段,所述关键内容字段优选包括关键字所在数据列。
步骤S35,基于所述读取的各个所述关键内容字段,提取各个所述关键内容字段的各个行内容;
步骤S36,按照预设的列间隔符,将各个所述行内容分别拆分成预设个数列内容;
步骤S37,基于所述拆分的预设个数列内容,分别计算所述预设个数列内容的索引;
由于数据文件具有固定的格式,所以读取关键内容字段时,优选根据行结束符读取行内容,然后按照列间隔符拆分所述行内容,以提取关键内容字段信息,并优选根据hash方法,计算各个所述关键内容字段的索引。
步骤S38,根据计算的结果,获取各个行内容在各个索引上的指针位置,并分别写入各个所述行内容对应的索引数据。
在本实施例中,优选为根据所述计算好的所述各个行内容对应的索引数据,在索引树上查找所述索引数据对应的位置指针,并将所述索引数据加入所述查找的位置指针并保存。
本实施例提出的数据文件管理方法,在接收到索引的创建命令时,获取文件系统中待创建索引的各个数据文件,基于所述获取的各个数据文件,提取各个所述数据文件的目录信息,基于所述提取的各个目录信息,建立各个所述数据文件的索引,相比于现有的数据文件管理模式,通过提取数据文件中的关键属性字段和关键内容字段,创建数据文件的索引,提高了数据文件管理效率。
进一步地,为了提高数据文件管理的灵活性,参照图4,基于第一实施例提出本发明数据文件管理方法第二实施例,在本实施例中,所述数据文件管理方法还包括:
步骤S40,在检测到新数据文件时,获取所述新数据文件对应的关键属性字段和关键内容字段;
在本实施例中,可预设终端在检测到文件系统出现新数据文件时,在终端界面的预设区域显示提示信息,所述显示提示信息优选包括在终端界面的预设区域显示提示窗口(如显示:系统出现新数据文件!),或者在终端界面预设区域(如终端界面的右下角)抖动预设面积的窗口,以提示系统文件中出现新文件信息。
步骤S50,基于所述获取的关键属性字段和关键内容字段,创建并更新所述新数据文件的索引信息。
在本实施例中,所述基于所述获取的关键属性字段和关键内容字段,创建并更新所述新数据文件的索引信息创建并更新所述新数据文件的索引信息的方式包括:
1)人工更新索引的方式;所述步骤S50包括,基于所述获取的关键属性字段和关键内容字段,终端显示预设选择界面,以供用户基于所述预设的选择界面选择是否更新索引信息,在接收到用户触发的选择完成指令时,确定所述选择完成指令,如接收到用户触发的确定更新指令时,基于所述确定更新指令更新所述索引信息。
2)定时更新索引的方式:所述步骤S50之前包括用户预设定时更新索引的步骤,终端显示预设的设置界面,以供用户基于所述设置界面输入索引定时更新的时间,在检测到用户的输入的设置完成指令时,确定所述设置完成指令对应的时间,并存储所述设置的更新时间,即所述步骤S50包括,在检测到定时更新时间到达时,终端触发更新指令,以更新文件系统中的数据文件对应的索引信息。
参照图5,图5为本发明数据文件管理方法第三实施例的流程示意图。
本实施例提出一种数据文件管理方法,所述数据文件管理方法包括:
步骤S60,在接收到数据文件查询指令时,分析所述接收到的查询指令,并提取出预设的过滤条件;
步骤S70,基于所述提取的过滤条件,分析是否能提取出所述数据文件预设的索引条件;
在本实施例中,优选方案为,终端根据所述提取的过滤条件,从数据字典中查找预设的索引条件,所述索引条件用于加速查询数据文件。
步骤S80,在提取出预设的索引条件时,根据数据文件中的关键属性字段及/或关键内容字段进行查找索引,以获取查询结果。
在本实施例中,所述查询结果包括两种:当所述查询结果为指向满足过滤条件的文件列表,依次打开这些文件,读取数据文件的关键属性字段,并进一步判断是否符合完整的过滤条件,当所述满足条件时,所述数据文件就是需要的数据文件;或者当查询结果是指向满足过滤条件的文件指针时,依次打开这些文件,读取指定行的文件内容,并进一步判断是否符合完整的过滤条件,当所述满足条件时,所述数据文件的文件内容就是需要的行。进一步地,对于已经找到的数据文件,可补充查询其它需要返回的信息。
在本实施例中,为提高数据文件查询的准确性,所述步骤S80之后,还包括步骤:判断所述接收到的查询指令是否还存在过滤条件;在检测到所述接收到的查询指令存在过滤条件时,基于数据文件的文件属性及/或文件内容查询索引。
本发明进一步提供一种数据文件管理装置。
参照图6,图6为本发明数据文件管理装置第一实施例的功能模块示意图。
需要强调的是,对本领域的技术人员来说,图6所示功能模块图仅仅是一个较佳实施例的示例图,本领域的技术人员围绕图6所示的数据文件管理装置的功能模块,可轻易进行新的功能模块的补充;各功能模块的名称是自定义名称,仅用于辅助理解该数据文件管理装置的各个程序功能块,不用于限定本发明的技术方案,本发明技术方案的核心是,各自定义名称的功能模块所要达成的功能。
本实施例提出一种数据文件管理装置,所述数据文件管理装置包括:
获取模块10,用于在接收到索引的创建命令时,获取文件系统中待创建索引的各个数据文件;
在本实施例中,所述数据文件管理装置可选应用于终端中,所述终端可选为图11中所述的终端,所述终端设置有实体按键或虚拟按键,其中,所述实体按键与所述终端的处理器通信连接。所述终端根据所述实体按键或虚拟按键接收到索引的创建命令时,获取文件系统中待创建索引的各个数据文件。
在本实施例中,所述实体按键可选是终端中新设计的按键,该实体按键可选为多功能按键,包括数据索引查询功能、建立索引功能等多种功能。所述实体按键可设置在终端的任一位置,可选设置在终端的侧边或背面,具体的设置位置不做限定,根据实际情况而定。本实施例中,所述实体按键还可选为终端已有的按键,如终端的home键,在实体按键为终端已有的按键时,对该实体按键复用出更多的功能,使得该实体按键具备索引查询功能、建立索引功能等多种功能。在终端设置的该实体按键,与终端的处理器通信连接,以将接收到的操作指令发送至处理器,由处理器根据接收到的操作指令执行相应的控制操作,如索引查询、建立索引等等。
在本实施例中,所述数据文件管理装置包括配置管理模块,所述配置管理模块用于预设文件系统的管理方式以及配置文件系统的运行参数,所述预设文件系统的管理方式以及配置文件系统的运行参数的方式优选包括:a、配置文件系统的基本参数,如配置文件系统中索引的更新方式、系统内存池、系统线程数以及索引是否随系统的启动在后台运行等;b、配置索引的相关参数,如配置索引存储位置、索引对应的数据文件类型(如索引包括/排除哪些类型文件夹)以及索引是否包括子目录等;c、采集系统运行过程中产生的数据统计信息,并将所述产生的数据统计信息展现给用户,用户可通过分析这些统计信息,优化调整配置参数,使系统运行状态最佳。在本实施例中,所述数据文件包括日志文件、语音文件。
提取模块20,用于基于所述获取的各个数据文件,提取各个所述数据文件的目录信息;
建立模块30,用于基于所述提取的各个目录信息,建立各个所述数据文件的索引。
在本实施例中,所述建立模块30基于所述提取的各个目录信息,建立各个所述数据文件的索引的实施例包括:
1)第一实施例,参照图7,所述建立模块30包括:
第一提取单元31,用于基于所述提取的各个目录信息,提取所述各个数据文件中的关键属性字段;
在本实施例中,第一提取单元31基于所述提取的各个目录信息,确定各个目录信息对应的数据文件名称,并基于所述确定的数据文件名称,分别从目录信息列表中提取出所述确定的数据文件对应的关键属性字段,所述关键属性字段包括数据文件的名称、大小、类型以及创建日期。
第一计算单元32,用于基于提取的各个所述关键属性字段,分别计算各个所述关键属性字段的索引;
在本实施例中,优选为第一计算单元32基于提取的各个所述关键属性字段,分析所述关键属性字段的字段列表、字段类型及/或字段之间的先后顺序,优选根据hash方法,计算各个所述关键属性字段的索引。
第一处理单元33,用于根据计算的结果,获取各个所述关键属性字段在索引上的指针位置,并分别写入各个所述关键属性字段对应的索引数据。
在本实施例中,所述第一处理单元33优选根据所述计算好的所述关键属性字段对应的索引数据,在索引树上查找所述索引数据对应的位置指针,并将所述索引数据加入所述查找的位置指针并保存。可以理解的是,在使用数据文件过程中,通过文件名称等文件属性寻找数据文件,可通过索引定位,若对某个目录列表下的文件进行排序,排序的规则预设为某个关键属性的先后顺序,即可利用定位到的索引信息查询数据文件。
1)第二实施例,参照图8,所述建立模块30还包括:
读取单元34,用于基于所述提取的各个目录信息,读取所述各个数据文件中的关键内容字段;
在本实施例中,所述读取单元34基于所述提取的各个目录信息,确定各个目录信息对应的数据文件名称,并基于所述确定的数据文件名称,分别从目录信息列表中提取出所述确定的数据文件对应的关键内容字段,所述关键内容字段优选包括关键字所在数据列。
第二提取单元35,用于基于所述读取的各个所述关键内容字段,提取各个所述关键内容字段的各个行内容;
拆分单元36,用于按照预设的列间隔符,将各个所述行内容分别拆分成预设个数列内容;
第二计算单元37,用于基于所述拆分的预设个数列内容,分别计算所述预设个数列内容的索引;
由于数据文件具有固定的格式,当所述读取单元34读取关键内容字段时,优选所述第二提取单元35根据行结束符读取行内容,所述拆分单元36按照列间隔符拆分所述行内容,以提取关键内容字段信息,并且所述第二计算单元37优选根据hash方法,计算各个所述关键内容字段的索引。
第二处理单元38,用于根据计算的结果,获取各个行内容在各个索引上的指针位置,并分别写入各个所述行内容对应的索引数据。
在本实施例中,优选为所述第二处理单元38根据所述计算好的所述各个行内容对应的索引数据,在索引树上查找所述索引数据对应的位置指针,并将所述索引数据加入所述查找的位置指针并保存。
本实施例提出的数据文件管理装置,在接收到索引的创建命令时,获取文件系统中待创建索引的各个数据文件,基于所述获取的各个数据文件,提取各个所述数据文件的目录信息,基于所述提取的各个目录信息,建立各个所述数据文件的索引,相比于现有的数据文件管理模式,通过提取数据文件中的关键属性字段和关键内容字段,创建数据文件的索引,提高了数据文件管理效率。
进一步地,为了提高数据文件管理的灵活性,参照图9,基于第一实施例提出本发明数据文件管理装置第二实施例,在本实施例中,所述数据文件管理装置还包括:
所述获取模块10,还用于在检测到新数据文件时,获取所述新数据文件对应的关键属性字段和关键内容字段;
在本实施例中,可预设终端在检测到文件系统出现新数据文件时,在终端界面的预设区域显示提示信息,所述显示提示信息优选包括在终端界面的预设区域显示提示窗口(如显示:系统出现新数据文件!),或者在终端界面预设区域(如终端界面的右下角)抖动预设面积的窗口,以提示系统文件中出现新文件信息。
处理模块40,用于基于所述获取的关键属性字段和关键内容字段,创建并更新所述新数据文件的索引信息。
在本实施例中,所述处理模块40基于所述获取的关键属性字段和关键内容字段,创建并更新所述新数据文件的索引信息创建并更新所述新数据文件的索引信息的方式包括:
1)人工更新索引的方式;在预设区域显示预设选择界面,以供用户基于所述预设的选择界面选择是否更新索引信息,在接收到用户触发的选择完成指令时,所述处理模块40确定所述选择完成指令,如接收到用户触发的确定更新指令时,基于所述确定更新指令更新所述索引信息。
2)定时更新索引的方式:在预设区域显示预设的设置界面,以供用户基于所述设置界面输入索引定时更新的时间,在检测到用户的输入的设置完成指令时,所述处理模块40确定所述设置完成指令对应的时间,并存储所述设置的更新时间,即在检测到定时更新时间到达时,所述处理模块40触发更新指令,以更新文件系统中的数据文件对应的索引信息。
参照图10,图10为本发明数据文件管理装置第三实施例的流程示意图。
本实施例提出一种数据文件管理装置,所述数据文件管理装置包括:
处理模块50,用于在接收到数据文件查询指令时,分析所述接收到的查询指令,并提取出预设的过滤条件;
分析模块60,用于基于所述提取的过滤条件,确定是否能提取出所述数据文件预设的索引条件;
在本实施例中,所述处理模块50根据所述提取的过滤条件,从数据字典中查找预设的索引条件,所述索引条件用于加速查询数据文件。
获取模块70,用于在提取出预设的索引条件时,根据数据文件中的关键属性字段及/或关键内容字段进行查找索引,以获取查询结果。
在本实施例中,所述查询结果包括两种:当所述查询结果为指向满足过滤条件的文件列表,依次打开这些文件,读取数据文件的关键属性字段,并进一步判断是否符合完整的过滤条件,当所述满足条件时,所述数据文件就是需要的数据文件;或者当查询结果是指向满足过滤条件的文件指针时,依次打开这些文件,读取指定行的文件内容,并进一步判断是否符合完整的过滤条件,当所述满足条件时,所述数据文件的文件内容就是需要的行。进一步地,对于已经找到的数据文件,可补充查询其它需要返回的信息。
在本实施例中,为提高数据文件查询的准确性,所述数据文件管理装置还包括判断模块,用于判断所述接收到的查询指令是否还存在过滤条件;以及查询模块,用于在检测到所述接收到的查询指令存在过滤条件时,基于数据文件的文件属性及/或文件内容查询索引。
此外,如图11所示,图11是本发明实施例方案涉及的硬件运行环境的结构示意图。
如图11所示,该数据文件管理设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元,比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,数据文件管理设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。
本领域技术人员可以理解,图11中示出的数据文件管理设备结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图11所示,作为一种计算机存储介质的存储器1005中可以包括操作系统以及数据文件管理程序。其中,操作系统是管理和控制数据文件管理设备硬件和软件资源的程序,支持数据文件管理程序以及其它软件和/或程序的运行。
在图11所示的数据文件管理设备中,网络接口1004主要用于接入网络;用户接口1003连接用户端,而处理器1001可以用于调用存储器1005中存储的问句推荐程序,并执行上文所述的数据文件管理方法的步骤。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有数据文件管理程序,所述数据文件管理程序被处理器执行时实现如上文所述数据文件管理方法的操作。

Claims (10)

1.一种数据文件管理方法,其特征在于,所述数据文件管理方法包括以下步骤:
在接收到索引的创建命令时,获取文件系统中待创建索引的各个数据文件;
基于所述获取的各个数据文件,提取各个所述数据文件的目录信息;
基于所述提取的各个目录信息,建立各个所述数据文件的索引。
2.如权利要求1所述的数据文件管理方法,其特征在于,所述基于所述提取的各个目录信息,建立各个所述数据文件的索引的步骤包括:
基于所述提取的各个目录信息,提取所述各个数据文件中的关键属性字段;
基于提取的各个所述关键属性字段,分别计算各个所述关键属性字段的索引;
根据计算的结果,获取各个所述关键属性字段在索引上的指针位置,并分别写入各个所述关键属性字段对应的索引数据。
3.如权利要求1所述的数据文件管理方法,其特征在于,所述基于所述提取的各个目录信息,建立各个所述数据文件的索引的步骤包括:
基于所述提取的各个目录信息,读取所述各个数据文件中的关键内容字段;
基于所述读取的各个所述关键内容字段,提取各个所述关键内容字段的各个行内容;
按照预设的列间隔符,将各个所述行内容分别拆分成预设个数列内容;
基于所述拆分的预设个数列内容,分别计算所述预设个数列内容的索引;
根据计算的结果,获取各个行内容在各个索引上的指针位置,并分别写入各个所述行内容对应的索引数据。
4.如权利要求1-3任一项所述的数据文件管理方法,其特征在于,所述数据文件管理方法还包括:
在检测到新数据文件时,获取所述新数据文件对应的关键属性字段和关键内容字段;
基于所述获取的关键属性字段和关键内容字段,创建并更新所述新数据文件的索引信息。
5.如权利要求1-3任一项所述的数据文件管理方法,其特征在于,所述数据文件管理方法还包括:
在接收到数据文件查询指令时,分析所述接收到的查询指令,并提取出预设的过滤条件;
基于所述提取的过滤条件,确定是否能提取出所述数据文件预设的索引条件;
在提取出预设的索引条件时,根据数据文件中的关键属性字段及/或关键内容字段进行查找索引,以获取查询结果。
6.一种数据文件管理装置,其特征在于,所述数据文件管理装置包括:
获取模块,用于在接收到索引的创建命令时,获取文件系统中待创建索引的各个数据文件;
提取模块,用于基于所述获取的各个数据文件,提取各个所述数据文件的目录信息;
建立模块,用于基于所述提取的各个目录信息,建立各个所述数据文件的索引。
7.如权利要求6所述的数据文件管理装置,其特征在于,所述建立模块包括:
第一提取单元,用于基于所述提取的各个目录信息,提取所述各个数据文件中的关键属性字段;
第一计算单元,用于基于提取的各个所述关键属性字段,分别计算各个所述关键属性字段的索引;
第一处理单元,用于根据计算的结果,获取各个所述关键属性字段在索引上的指针位置,并分别写入各个所述关键属性字段对应的索引数据。
8.如权利要求6所述的数据文件管理装置,其特征在于,所述建立模块还包括:
读取单元,用于基于所述提取的各个目录信息,读取所述各个数据文件中的关键内容字段;
第二提取单元,用于基于所述读取的各个所述关键内容字段,提取各个所述关键内容字段的各个行内容;
拆分单元,用于按照预设的列间隔符,将各个所述行内容分别拆分成预设个数列内容;
第二计算单元,用于基于所述拆分的预设个数列内容,分别计算所述预设个数列内容的索引;
第二处理单元,用于根据计算的结果,获取各个行内容在各个索引上的指针位置,并分别写入各个所述行内容对应的索引数据。
9.一种数据文件管理设备,其特征在于,所述数据文件管理设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的数据文件管理程序,所述数据文件管理程序被所述处理器执行时实现如权利要求1至5中任一项所述的数据文件管理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据文件管理程序,所述数据文件管理程序被处理器执行时实现如权利要求1至5中任一项所述的数据文件管理方法的步骤。
CN201910216910.6A 2019-03-21 2019-03-21 数据文件管理方法、装置、设备及计算机可读存储介质 Active CN110019019B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910216910.6A CN110019019B (zh) 2019-03-21 2019-03-21 数据文件管理方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910216910.6A CN110019019B (zh) 2019-03-21 2019-03-21 数据文件管理方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110019019A true CN110019019A (zh) 2019-07-16
CN110019019B CN110019019B (zh) 2023-08-22

Family

ID=67189754

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910216910.6A Active CN110019019B (zh) 2019-03-21 2019-03-21 数据文件管理方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110019019B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030101171A1 (en) * 2001-11-26 2003-05-29 Fujitsu Limited File search method and apparatus, and index file creation method and device
CN102184211A (zh) * 2011-05-03 2011-09-14 成都市华为赛门铁克科技有限公司 文件系统和检索、写入、修改或删除文件的方法与装置
CN105701096A (zh) * 2014-11-25 2016-06-22 腾讯科技(深圳)有限公司 索引生成方法、数据查询方法、装置及系统
CN108460075A (zh) * 2017-12-28 2018-08-28 上海顶竹通讯技术有限公司 一种文件内容检索方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030101171A1 (en) * 2001-11-26 2003-05-29 Fujitsu Limited File search method and apparatus, and index file creation method and device
CN102184211A (zh) * 2011-05-03 2011-09-14 成都市华为赛门铁克科技有限公司 文件系统和检索、写入、修改或删除文件的方法与装置
CN105701096A (zh) * 2014-11-25 2016-06-22 腾讯科技(深圳)有限公司 索引生成方法、数据查询方法、装置及系统
CN108460075A (zh) * 2017-12-28 2018-08-28 上海顶竹通讯技术有限公司 一种文件内容检索方法及系统

Also Published As

Publication number Publication date
CN110019019B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
US10366154B2 (en) Information processing device, information processing method, and computer program product
US20080215548A1 (en) Information search method and system
CN110188165A (zh) 合同模板获取方法、装置、存储介质和计算机设备
CN110705226A (zh) 电子表格的创建方法、装置及计算机设备
CN106156111B (zh) 专利文件检索方法、装置和系统
CN102456054A (zh) 一种搜索方法及系统
CN111381913B (zh) 前端多语言加载适配方法、装置、计算机设备及存储介质
CN110018982A (zh) 查找文件的方法、装置、设备及计算机可读存储介质
CN111191133A (zh) 业务搜索处理方法、装置及设备
CN109783589A (zh) 电子地图解析地址的方法、装置及存储介质
CN112579944A (zh) 一种页面跳转处理方法、装置以及电子设备
JP5802924B2 (ja) 文書検索システムおよび文書検索プログラム
CN118502857A (zh) 用户界面的交互处理方法、装置、设备、介质及程序产品
CN113407678B (zh) 知识图谱构建方法、装置和设备
CN111125226B (zh) 一种配置数据采集方法及装置
CN110489528B (zh) 基于电子书内容的电子词典重构方法及计算设备
CN106201198B (zh) 终端应用的查找方法、装置及移动终端
CN110515618A (zh) 页面信息录入优化方法、设备、存储介质及装置
CN110362694A (zh) 基于人工智能的文献数据检索方法、设备及可读存储介质
CN110019019A (zh) 数据文件管理方法、装置、设备及计算机可读存储介质
CN111428117A (zh) 应用程序的数据获取方法和装置
CN109634929A (zh) 业务数据的采集方法、装置和服务器
CN115858742A (zh) 问题文本扩充方法、装置、设备及存储介质
JP2006155275A (ja) 情報抽出方法及び情報抽出装置
CN110633430B (zh) 事件发现方法、装置、设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant