CN114637726A - 数据处理方法、装置及存储介质 - Google Patents

数据处理方法、装置及存储介质 Download PDF

Info

Publication number
CN114637726A
CN114637726A CN202210254759.7A CN202210254759A CN114637726A CN 114637726 A CN114637726 A CN 114637726A CN 202210254759 A CN202210254759 A CN 202210254759A CN 114637726 A CN114637726 A CN 114637726A
Authority
CN
China
Prior art keywords
file
information
data
target
file data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210254759.7A
Other languages
English (en)
Inventor
郑绪春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An International Smart City Technology Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202210254759.7A priority Critical patent/CN114637726A/zh
Publication of CN114637726A publication Critical patent/CN114637726A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本实施例涉及人工智能技术领域,其涉及一种数据处理方法、装置及存储介质,该方法包括:接收用户终端发送的源文件数据;根据源文件数据的数据信息从预设数据库提取对应的存储通行证;根据存储通行证将源文件数据上传至目标服务器得到文件数据,并获取文件数据在目标服务器的目的存储地址;其中,每个源文件数据均对应有各自的文件数据;对源文件数据进行解析以得到文件信息,根据文件信息和目的存储地址生成文件描述信息;接收目标用户端发送的搜索请求,根据搜索请求中的搜索信息从多个文件描述信息中获取目标描述信息中的目的存储地址;将目的存储地址发送至目标用户端。本申请实施例的技术方案,能够提高文件搜索效率。

Description

数据处理方法、装置及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及数据处理方法、装置及存储介质。
背景技术
通常,上传文件至线上平台时,线上平台会按照时间顺序存储文件,从而在需要查找线上平台的文件时只能查找最近时间段上传的文件,对于上传时间较久的文件、命名不规范的文件,查找困难。并且若线上平台存储了大量文件,当需要查找文件时,一般需要逐个进行文件比对,以反馈查找结果;而对大量文件进行逐个比对,使得查找效率低下。
发明内容
本公开实施例的主要目的在于提出数据处理方法、装置及存储介质,能够提高用户端从服务器获取文件数据的效率。
为实现上述目的,本公开实施例的第一方面提出了一种数据处理方法,应用于文件搜索终端,包括:
接收用户终端发送的源文件数据;
根据所述源文件数据的数据信息从预设数据库提取对应的存储通行证;
根据所述存储通行证将所述源文件数据上传至目标服务器得到文件数据,并获取所述文件数据在所述目标服务器的目的存储地址;其中,每个所述源文件数据均对应有各自的文件数据;
对所述源文件数据进行解析以得到文件信息,根据所述文件信息和所述目的存储地址生成文件描述信息;
接收目标用户端发送的搜索请求,根据所述搜索请求中的搜索信息从多个所述文件描述信息中获取目标描述信息中的目的存储地址;
将所述目的存储地址发送至所述目标用户端,以使所述目标用户端根据所述目的存储地址从所述目标服务器获取所述文件数据。
在一些实施例,所述数据信息包括:身份标识码和源文件类型;在接收用户终端发送的源文件数据之前,所述方法还包括:
获取所述用户终端的访问请求,所述访问请求包括访问地址信息和账户信息;
根据所述访问地址信息和所述账户信息确定所述用户终端的身份标识码,并获取所述用户终端填写的源文件类型;
将所述身份标识码和所述源文件类型发送至所述目标服务器,以使所述目标服务器根据所述身份标识码和所述源文件类型创建对应的目的文件夹;
获取所述目的文件夹的所述目的存储地址,根据所述目的存储地址确定所述用户终端的所述存储通行证,并将所述身份标识码、所述源文件类型和所述存储通行证进行匹配,以生成预设数据库的匹配信息。
在一些实施例,所述根据所述源文件数据的数据信息从预设数据库提取对应的存储通行证,包括:
获取所述源文件数据的数据来源和源文件类型,所述数据来源包括:身份标识码;
根据所述身份标识码和所述源文件类型从所述预设数据库获取匹配信息;
根据所述身份标识码、所述源文件类型、所述匹配信息生成所述存储通行证。
在一些实施例,所述文件信息包括:文件属性信息和文件内容信息,所述对所述源文件数据进行解析以得到文件信息,包括:
提取所述源文件数据的文件属性信息,所述文件属性信息至少包括以下一种:文件类型、文件大小、文件创建时间、文件修改时间、文件访问时间;
对所述源文件数据进行内容解析,以得到所述文件内容信息。
在一些实施例,所述方法还包括:
根据所述数据来源构建对应的索引存储区;
根据所述数据来源将对应的所述文件描述信息存储至对应的所述索引存储区;
获取所述搜索请求的请求来源,根据所述请求来源和所述数据来源确定对应的所述索引存储区;
根据所述搜索请求中的所述搜索信息从所述索引存储区的多个所述文件描述信息中获取目标描述信息中的所述目的存储地址。
在一些实施例,所述搜索信息包括:搜索属性信息和搜索内容信息;所述接收目标用户端发送的搜索请求,根据所述搜索请求中的搜索信息从多个所述文件描述信息中获取目标描述信息中的目的存储地址,包括:
接收所述目标用户端发送的搜索请求,根据所述搜索请求中的所述搜索属性信息和所述搜索内容信息构建搜索检索式;
根据所述搜索检索式从多个所述文件描述信息获取所述文件属性信息,并根据所述搜索检索式从所述文件内容信息中满足所述搜索检索式的所述目标描述信息;
获取所述目标描述信息中的所述目的存储地址。
为实现上述目的,本公开实施例的第二方面提出了一种数据处理方法,应用于目标服务器,包括:
接收文件搜索终端上传的源文件数据和存储通行证;
根据所述存储通行证将所述源文件数据存储至对应的目的文件夹,以得到文件数据;
接收目标用户端发送的目的存储地址;
将所述目的存储地址获取对应所述目的文件夹中的所述文件数据发送至所述目标用户端。
在一些实施例中,所述方法还包括:
获取所述文件搜索终端发送的身份标识码和源文件类型;其中,所述身份标识码用于表征所述用户终端的身份信息,所述源文件类型用于表征来源于所述用户终端的所述源文件数据的文件类型;
根据所述身份标识码创建对应的系统文件夹;
根据所述源文件类型在所述系统文件夹中创建所述目的文件夹。
为实现上述目的,本公开实施例的第三方面提出了一种数据处理装置,应用于用户终端,包括:
第一接收模块,用于接收用户终端发送的源文件数据;
通行证获取模块,用于根据所述源文件数据的数据信息从预设数据库提取对应的存储通行证;
上传模块,用于根据所述存储通行证将所述源文件数据上传至目标服务器,得到文件数据文件数据,并获取所述文件数据在所述目标服务器的目的存储地址;其中,每个源文件数据均对应各自的文件数据;
解析模块,用于对所述源文件数据进行解析以得到文件信息;
描述信息生成模块,用于根据所述文件信息和所述目的存储地址生成文件描述信息;
文件查找模块,用于接收目标用户端发送的搜索请求,根据所述搜索请求中的搜索信息从多个所述文件描述信息中获取目标描述信息中的目的存储地址;
第一发送模块,用于根据所述搜索信息将所述目的存储地址发送至所述目标用户端,以使所述目标用户端根据所述目的存储地址从所述目标服务器获取所述文件数据。
为实现上述目的,本公开实施例的第四方面提出了一种数据处理装置,应用于目标服务器,包括:
第二接收模块,用于接收文件搜索终端上传的源文件数据和存储通行证;
存储模块,用于根据所述存储通行证将所述源文件数据存储至对应的目的文件夹,以得到文件数据,其中,每个源文件数据均对应有各自的文件数据;
第三接收模块,用于接收目标用户端发送的目的存储地址;
第二发送模块,将所述目的存储地址获取对应所述目的文件夹中的所述文件数据发送至所述目标用户端。
为实现上述目的,本公开实施例的第五方面提出了一种存储介质,该存储介质是计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行:
如上述第一方面,或第二方面所述的方法。
本公开实施例提出的一种数据处理方法、装置及存储介质,通过在目标服务器和用户终端之间设置文件搜索终端,则文件搜索终端只存储文件描述信息,且将源文件数据存储至目标服务器,则文件查找时只需要根据搜索请求中的搜索信息从多个文件描述信息中获取目标描述信息中的目的存储地址,则可以直接根据目的存储地址从目标服务器中提取出文件数据,使得文件数据获取更加快速和高效,且提高了文件数据搜索的高效性。
附图说明
图1是本公开实施例提供的数据处理方法的系统框架的示意图。
图2是本公开实施例提供的数据处理方法的流程图。
图3是本公开实施例提供的数据处理方法的另一流程图。
图4是图2中的步骤S1200的流程图。
图5是图2中的步骤S1300的流程图。
图6是本公开实施例提供的数据处理方法的另一流程图。
图7是本公开实施例提供的数据处理方法的流程示意图。
图8是图2中的步骤S1500的流程图。
图9是本公开实施例提供的数据处理方法的流程图。
图10是本公开实施例提供的数据处理方法的另一流程图。
图11是本公开实施例提供的其中一数据处理装置的系统模块框图。
图12是本公开实施例提供的另一数据处理装置的系统模块框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
首先,对本申请中涉及的若干名词进行解析:
人工智能(artificial intelligence,AI):是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;人工智能是计算机科学的一个分支,人工智能企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
自然语言处理(natural language processing,NLP):NLP用计算机来处理、理解以及运用人类语言(如中文、英文等),NLP属于人工智能的一个分支,是计算机科学与语言学的交叉学科,又常被称为计算语言学。自然语言处理包括语法分析、语义分析、篇章理解等。自然语言处理常用于机器翻译、手写体和印刷体字符识别、语音识别及文语转换、信息检索、信息抽取与过滤、文本分类与聚类、舆情分析和观点挖掘等技术领域,它涉及与语言处理相关的数据挖掘、机器学习、知识获取、知识工程、人工智能研究和与语言计算相关的语言学研究等。
SaaS(Software-as-a-Service):直译为“软件即服务”,这是一种特殊形态的软件产品。SaaS可以替代传统的运维服务,客户公司不再需要购买服务器等硬件设备,不需要设置IT运维工程师的岗位,可节省一大笔运维费用,因此才被称为“软件即服务”。SaaS平台供应商将应用软件统一部署在自己的服务器上,客户可以根据工作实际需求,通过互联网向厂商定购所需的应用软件服务,按定购的服务多少和时间长短向厂商支付费用,并通过互联网获得Saas 平台供应商提供的服务。
数据处理法:文件的基本作用是存储信息。当使用文件时,必须将文件的信息读入计算机内存中。数据处理法,也可以称之为文件的存取方法,是指读写文件存储器上的一个物理块的方法。通常由三种数据处理方法:顺序存取法、直接存取法和按键存取法。数据处理法与文件的物理结构有关。
ElasticSearch:Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。 Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、 PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据 DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是ApacheSolr,也是基于Lucene。
随着互联网发展,人们日常办公和日常生活也逐渐与互联网结合,人们在使用线上平台时,由于线上平台一般都具备文件存储功能。因此,人们会将文件上传至线上平台的存储文件夹中,但是线上平台只是按照时间顺序进行存储,所以查看线上平台上传的文件只能查询最近时间段的文件,对于时间过去很久,或者文件命名不规范的文件,用户难以在线上平台中查找所需要查找的文件。
基于此,本公开实施例提供一种数据处理方法、装置及存储介质,通过在目标服务器和用户终端之间设置文件搜索终端,通过文件搜索终端存储的文件描述信息确定文件的存储地址,以提高文件搜索的效率,使得文件查找更加便利。
本公开实施例提供一种数据处理方法、装置及存储介质,具体通过如下实施例进行说明,首先描述本公开实施例中的一种数据处理方法。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的数据处理方法、装置及存储介质,涉及人工智能技术领域,尤其涉及数据处理技术领域。本申请实施例提供的数据处理方法可应用于文件搜索终端,也可应用于目标服务器中,还可以是运行于终端或服务器端中的软件。在一些实施例中,文件搜索终端可以是智能手机、平板电脑、笔记本电脑、台式计算机或者智能手表等;目标服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器;软件可以是实现数据处理方法的应用等,但并不局限于以上形式。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
请参照图1,图1是本申请一些实施例提供的数据处理方法的一个系统框架的示意图,在图1的示例中,该系统架构包括用户终端、文件搜索终端和目标服务器。
其中,用户终端设置多个,且多个用户终端分别与文件搜索终端通信连接,用于将源文件数据上传至文件搜索终端,文件搜索终端和目标服务器通信连接,且文件搜索终端将源文件数据存储至目标服务器中,以得到文件数据。同时文件搜索终端将源文件数据进行解析以得到文件信息,并根据文件信息和文件数据的目的存储地址生成文件描述信息。当用户终端需要获取文件数据,则将搜索请求发送至文件搜索终端,则文件搜索终端根据搜索请求中的搜索信息从文件描述信息中确定目标存储地址,并将目标存储地址发送至用户终端,则用户终端可以根据目标存储地址在目标服务器中获取文件数据。因此,通过在用户终端和目标服务器之间设置文件搜索终端,通过文件搜索终端进行文件查找,使得文件搜索更加高效。
文件搜索终端上设置文件查找的系统平台,且与目标服务器通信连接,文件搜索终端还与用户终端通信连接。文件搜索终端接收来自用户终端发送的源文件数据,并根据源文件数据的数据信息从预设数据库中获取存储通行证,并根据存储通信证将源文件数据存储至目标服务器。同时文件搜索终端对源文件数据进行解析以得到文件信息,且根据文件信息和文件数据的目的存储地址生成文件描述信息,当接收用户终端上传的搜索请求时,可以根据搜索请求中的搜索信息中从多个文件描述信息确定目标描述信息中的目的存储地址,并将目的存储地址发送至用户终端。
用户终端与文件搜索终端、目标服务器通信连接,且用户终端将源文件数据发送至文件搜索终端,则文件搜索终端将源文件数据上传至目标服务器的目的文件夹。当需要查找文件时,用户终端发送搜索请求至文件搜索终端,并接收文件搜索终端反馈的目的存储地址,则用户终端根据目的存储地址从目标服务器中获取文件数据。
目标服务器与文件搜索终端、用户终端通信连接,且根据文件搜索终端上传存储通行证将源文件数据存储至目标服务器。同时目标服务器根据用户终端发送的目的存储地址将对应的文件数据发送至用户终端。
在本实施例中,用户终端将源文件数据发送至文件搜索终端,文件搜索终端根据源文件数据的数据信息从预设数据库获取存储通行证,根据存储通行证将源文件数据上传至目标服务器以得到文件数据,并获取文件夹数据的目的存储地址。对源文件数据进行解析以得到文件信息,所以根据目的存储地址和文件信息生成文件描述信息。当用户终端发送搜索请求至文件搜索终端,文件搜索终端根据搜索请求中的搜索信息从多个文件描述信息中获取目标描述信息中的目的存储地址,并将目的存储地址发送至用户终端,且用户终端根据目的存储地址从目标服务器中获取文件数据。因此通过在目标服务器和用户终端之间设置文件搜索终端,根据搜索请求中的搜索信息从多个文件描述信息中确定目标描述信息的目的存储地址,以根据目的存储地址提取对应文件数据,以提高文件搜索的效率,使得文件提取更加快速。
本申请实施例描述的系统架构以及应用场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域技术人员可知,随着系统架构的演变和新应用场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
另外,请参照图2,图2是本申请一些实施例提供的数据处理方法的一个可选的流程图,该数据处理方法应用于文件搜索终端,该数据处理方法包括步骤 S1100、步骤S1200、步骤S1300、步骤S1400、步骤S1500、步骤S1600、步骤 S1700,应理解,本申请实施例的数据处理方法包括但不限于步骤S1100至步骤 S1700,下面结合图1对步骤S1100至步骤S1700进行详细介绍。
步骤S1100:接收用户终端发送的源文件数据。
具体地,在一些实施例的步骤S1100中,文件搜索终端连接多个用户终端,且用户终端为多个用户终端中的任意一个,而接收源文件数据的用户终端为已通过身份验证且实现通信连接的用户终端。若未通过身份验证的用户终端,则无法接收该用户终端的源文件数据。
步骤S1200:根据源文件数据的数据信息从预设数据库提取对应的存储通行证;
具体地,在一些实施例的步骤S1200中,存储通行证用于表征源文件数据在目标服务器中的存储地址,以确定存储通行证后也即确定了源文件数据在目标服务器中的存储地址,以便于源文件数据的存储。其中,存储通行证通过根据源文件数据的数据信息在预设数据库中提取,由于预设数据库中预先存储数据信息和存储通行证的匹配信息,所以通过源文件数据的数据信息和预设数据库中的匹配信息即可确定对应的存储通行证,也即清楚该源文件数据的存储地址。其中,若在预设数据库中的匹配信息中无法查找到与源文件数据匹配的存储通行证,则表示该源文件数据库无法进行存储。因此,通过预设数据库中存储的匹配信息确定数据信息对应的存储通行证,则可以将已经建立通信连接的用户终端发送的源文件数据存储在对应的目标服务器。其中,不同用户终端匹配的存储通行证都是不同的,所以需要根据不同的存储通行证将源文件数据分类存储至目标服务器对应的目的文件夹,而不是将所有用户终端发送的源文件数据都统一存储,而根据存储通行证将源文件数据进行分类存储,以将不同的源文件数据存储到相应不同的目的文件夹中,实现源文件数据存储划分,则在进行文件提取时可以在目的文件夹进行查找,以快速提取需要查找的文件数据。
需要说明的是,根据源文件数据生成存储通行证后,需要根据存储通行证将源文件数据存储至目标服务器,则目标服务器接收到存储通行证,且目标服务器根据存储通行证确定源文件数据对应的目的文件夹。若后续文件搜索终端将源文件数据上传至目标服务器后,目标服务器根据存储通行证将源文件数据存储至对应的目的文件夹,以完成源文件数据的存储以得到文件数据,实现源文件数据的分类存储,而不是直接将所有的源文件数据都存储到一个文件夹中,因此,通过源文件数据的数据信息确定的存储通行证,可以根据存储通行证将源文件数据分别存储至不同的目的文件夹中,则在进行文件数据查找时,减少文件查找的时间且能够提高文件查找的准确性,减少错误文件查找。步骤S1300:根据存储通行证将源文件数据上传至目标服务器得到文件数据,并获取文件数据在目标服务器的目的存储地址;其中,每个源文件数据均对应有各自的文件数据。
具体地,在一些实施例中的步骤S1300中,存储通行证用于表征源文件数据存储在目标服务器中的通行证,所以通过存储通行证将源文件数据存储至目标服务器以得到文件数据。其中,每个源文件数据均对应有各自的文件数据,但是存储在目标服务器的数据为文件数据,而用户终端所发送的数据为源文件数据,以通过文件数据和源文件数据进行数据区分。其中,存储通行证相当于可以进行源文件数据存储的通行证,若没有匹配到源文件数据对应的存储通行证,则无法将源文件数据存储至目标服务器。其中,根据存储通行证将不同用户终端发送的源文件数据存储至目标服务器对应的目的文件夹,所以存储通行证作为源文件数据的存储凭证,以作为源文件数据存储的目的文件夹的存储权限。因此,根据存储通行证确定源文件数据可以存储至目标服务器中,再根据存储通行证中标识源文件数据对应的目的文件夹,将源文件数据存储至目的文件夹。
需要说明的是,由于源文件数据存储至目的文件夹,且目的文件夹包括目的存储地址,所以通过目的存储地址确定文件数据的存储地址,以便于根据目的存储地址即可获取到文件数据。
步骤1400:对源文件数据进行解析以得到文件信息,根据文件信息和目的存储地址生成文件描述信息;
具体地,在一些实施例的步骤S1400中,由于文件搜索终端主要进行文件搜索,而源文件数据存储则是目标服务器,因此为了提高文件搜索终端进行文件搜索的高效性,文件搜索终端的存储量需要简化,以减轻文件搜索终端的运行压力。因此,对源文件数据进行解析以得到文件信息,而文件信息用于表征源文件数据的文字信息,所以文件信息相对于源文件数据的文件占用空间小。其中,对于源文件数据的解析主要是内容解析和属性提取,而源文件数据的内容解析存在多种,且根据不同文件类型对应的内容解析不同,而在本实施例不做限制。完成源文件数据存储后,将对源文件数据解析得到的文件信息,并根据文件信息和目的存储地址生成文件描述信息。其中,文件描述信息包括两部分信息,一个是文件信息,另一个是目的存储地址,以构建文件信息和目的存储地址的映射关系。
例如,若对源文件数据进行解析以得到文件信息为A,则将源文件存储至目标服务器的目的文件夹中,且目的文件夹的目的存储地址为a,则根据文件信息和目的存储地址生成的文件描述信息为(A,a)。因此,通过文件信息和文件描述信息即可确定文件数据的目的存储地址。
步骤S1500:接收目标用户端发送的搜索请求,根据搜索请求中的搜索信息从多个文件描述信息中获取目标描述信息中的目的存储地址。
需要说明的是,在一些实施例的步骤S1500中,将用户终端中需要进行文件查找的用户终端确定为目标用户端,也即设置发送搜索请求的用户终端为目标用户端。因此接收来自目标用户端发送到搜索请求,以根据搜索请求中的搜索信息从多个文件描述信息中获取目标描述信息中的目的存储地址。其中,通过搜索信息和文件描述信息中的文件信息进行比对,以获取文件信息和搜索信息匹配度最高的文件描述信息为目标描述信息。
其中,根据搜索请求中的搜索信息从多个文件描述信息中获取目标描述信息,也即根据搜索请求的搜索信息和多个文件描述信息中的文件信息进行比对,且设置一个误差范围,通过搜索信息中的部分信息和文件信息中的部分信息重合即可,无需搜索信息和文件信息完全一样,以减少文件搜索的难度。
步骤S1600:将目的存储地址发送至目标用户端,以使目标用户端根据目的存储地址从目标服务器获取文件数据。
需要说明的是,在一些实施例的步骤S1600中,由于目标描述信息包括目的存储地址,所以直接将目的存储地址发送至目标用户端,则目标用户端可以通过目的存储地址从目标服务器中的目的文件夹中获取文件数据。因此,文件数据获取快速且简易。其中,文件搜索终端只将目的存储地址发送至目标用户端,所以目标用户端直接将目的存储地址发送至目标服务器进行文件数据的提取,使得文件数据获取更加快速。
本申请实施例提出了数据处理方法,通过对用户终端上传的源文件数据的数据信息和预设数据库中的匹配信息确定存储通行证,并根据存储通行证将源文件数据存储至目标服务器,以得到文件数据。将源文件数据进行解析以得到文件信息,并将文件信息和目的存储地址生成文件描述信息,因此文件搜索终端只存储文件描述信息,所以在进行文件搜索时,只需要根据搜索请求中的搜索信息从多个文件描述信息中获取目标描述信息中的目的存储地址,然后目标用户端根据目的存储地址从目标服务器对应的目的文件夹中获取文件数据。因此在目标服务器和用户终端之间设置文件搜索终端,则文件搜索终端只存储文件描述信息,而源文件数据存储至目标服务器,则文件查找时只需要根据搜索请求中的搜索信息从多个文件描述信息中确定目标描述信息中的目的存储地址,也即确定了文件数据的目的存储地址,则可以直接根据目的存储地址从目标服务器中提取出文件数据,使得文件数据获取更加快速和高效,以提高了文件数据搜索的效率。
请参照图3,本申请的一些实施例中,在接收用户终端发送的源文件数据之前,数据处理方法还包括步骤S1010、步骤S1020、步骤S1030、步骤S1040;应理解,数据处理方法还包括但不限于步骤S1010至步骤S1040;
步骤S1010:获取用户终端的访问请求,访问请求包括访问地址信息和账户信息;
具体地,在一些实施例的步骤S1010中,由于在接收用户终端的源文件数据之前,用户终端需要进行注册和登录则可以建立与用户终端的通信连接,若用户终端没有进行注册和登录则无法接收用户终端的源文件数据,其次尽管用户终端进行了注册和登录但是没有获得存储通行证,则只能接收源文件数据,但无法将源文件数据存储至目标服务器,所以在接收用户终端发送到源文件数据之前需要对用户终端进行注册和登录。因此,获取用户终端的访问请求,且访问请求包括访问地址信息和账户信息;访问请求为用户终端进行注册时产生的,通过用户终端填报账户信息后上传,且上传的访问请求携带对应的访问地址信息。其中,访问地址信息包括以下任意一种:IP地址信息、MAC地址信息。
步骤S1020:根据访问地址信息和所账户信息确定用户终端的身份标识码,并获取用户终端填写的源文件类型;
需要说明的是,在一些实施例的步骤S1020中,通过访问地址信息和账户信息确定用户终端的身份标识码,也即对于不同访问地址信息和账户信息分别确定对应的身份标识码,且身份标识码是唯一的,也即一个用户终端对应一个身份标识码。身份标识码相当于用户终端上传访问地址信息和账户信息完成注册后文件搜索平台分配给已注册的用户终端一个身份凭证信息,也即对该用户终端以身份标识码进行标注,当接收用户终端发送的源文件数据时,所上传的源文件数据携带身份标识码,所以验证用户终端是否有对应的身份标识码,若用户终端具有对应的身份标识码即可接收用户终端上传的源文件数据。
步骤S1030:将身份标识码和源文件类型发送至目标服务器,以使目标服务器根据身份标识码和源文件类型创建对应的目的文件夹;
具体地,在一些实施例的步骤S1030中,为了能够在用户终端发送源文件数据时,将源文件数据存储至目标服务器对应的目的文件夹中,因此需要提前在目标服务器创建好对应的目的文件夹。因此,得到身份标识码后,需要将身份标识码和获取源文件类型发送至目标服务器,以使得目标服务器根据身份标识码和源文件类型创建对应的目的文件夹。通过目标服务器根据身份标识码和源文件类型创建对应的目的文件夹,且身份标识码是唯一的,所以不同用户终端对应的目的文件夹都是唯一的,同时还根据源文件类型创建目的文件夹,以将不同文件类型的源文件数据分别存储在不同的目的文件夹中,实现文件的分类存储,则在文件搜索时可以针对性地在对应的目的文件夹进行查找,减少文件搜索的负载量,使得文件搜索更加高效。
步骤S1040:获取目的文件夹的目的存储地址,根据目的存储地址确定用户终端的存储通行证,并将身份标识码、源文件类型和存储通行证进行匹配,以生成预设数据库的匹配信息。
需要说明的是,在一些实施例的步骤S1040中,由于预设数据库预存有用于匹配数据信息和存储通行证的匹配信息,且数据信息包括:身份标识码和源文件类型。其中,源文件数据具体存储于目标服务器的目的文件夹,以实现文件数据的分类存储。因此,确定了目的文件夹的目的存储地址,根据目的存储地址生成用户终端的存储通行证,也即对于已经注册的用户终端且已在目标服务器中创建好目的文件夹,则生成该用户终端对应的存储通行证,存储通行证用于表征用户终端可以将源文件数据上传至目标服务器对应的目的文件夹中。因此,根据身份标识码、源文件类型和存储通行证进行匹配以构建预设数据库中的匹配信息,相当于在文件搜索终端设置一个预设数据库,且预设数据库存储身份标识码、源文件类型和存储通行证之间的映射表,则在接收用户终端发送的源文件数据时,可以通过源文件数据的数据信息在映射表中查找对应的存储通行证,以判断该用户终端发送的源文件数据是否可以进行存储至目标服务器的目的文件夹中。
通过执行步骤S1010至步骤S1040,获取用户终端的访问地址信息和账户信息,并根据访问地址信息和账户信息确定用户终端的身份标识码,也即完成用户终端的注册与登录,且身份标识码包括:身份ID信息。完成了用户终端的注册和登录,则需要在目标服务器中创建属于用户终端的源文件数据存储的目的文件夹,然后获取目的文件夹的目的存储地址,则根据目的文件夹的目的存储地址生成用户终端的存储通行证,并将身份标识码、源文件类型和存储通行证进行匹配生成预设数据库的匹配信息,也即建立了身份标识码、源文件类型和存储通行证之间的映射表,且文件搜索终端存储映射表,当接收到用户终端发送到源文件数据,提取源文件数据的数据信息,且数据信息包括:身份标识码和源文件类型,则通过身份标识码和源文件类型以映射表进行查找出对应的存储通行证,则该用户终端所发送的源文件数据可以存储至目标服务器的目的文件夹。因此,通过执行步骤S1010至步骤S1040,以完成用户终端的注册和登录,并给用户终端分配身份标识码,并构建预设数据库的匹配信息,以实现源文件数据存储权限的设置,以防止任意用户终端都进行源文件数据上传影响了目标服务器的文件存储。
请参照图4,本申请的一些实施例中,步骤S1200包括:步骤S1210、步骤 S1220和步骤S1230,应理解,步骤S1200可以包括但不限于步骤S1210至步骤 S1230。
步骤S1210:获取源文件数据的数据来源和源文件类型,数据来源包括:身份标识码。
具体地,在一些实施例的步骤S1210,当用户终端上传源文件数据,若是已经注册和登录的用户终端,获取源文件数据的数据来源,且数据来源包括:身份标识码,则可以确定源文件数据的身份标识码,并提取源文件数据的源文件类型,以得到源文件数据的身份标识码和源文件类型。若没有进行注册和登录的用户终端,则所上传的源文件数据没有身份标识码,则不接收该源文件数据。
步骤S1220:根据身份标识码和源文件类型从预设数据库获取匹配信息;
需要说明的是,在一些实施例的步骤S1220中,预设数据库中存储的匹配信息为身份标识码、源文件类型和存储通行证之间的匹配信息,所以根据身份标识码、源文件类型从预设数据库进行查找以确定对应的匹配信息。
步骤S1230:根据身份标识码、源文件类型、匹配信息生成存储通行证。
具体地,在一些实施例的步骤S1230中,由于匹配信息为身份标识码、源文件类型和存储通行证之间的匹配关系,因此根据身份标识码、源文件类型在匹配信息中进行比对,以得到对应的存储通行证。
请参照图5,在本申请的一些实施例中,文件信息包括:文件属性信息和文件内容信息;步骤S1300还可以包括但不限于步骤S1310和步骤S1320。下面结合图5对两个步骤进行详细介绍。
步骤S1310:提取源文件数据的文件属性信息,文件属性信息至少包括以下一种:文件类型、文件大小、文件创建时间、文件修改时间、文件访问时间;
步骤S1320:对源文件数据进行内容解析,以得到文件内容信息。
需要说明的是,文件信息包括文件属性信息和文件内容信息,由于目标服务器的存储量较大,根据文件信息和目的存储地址生成文件描述信息,且源文件数据需要根据源文件类型存储在不同的目的文件夹中,所以文件信息包括:文件属性信息和文件内容信息,则在根据搜索信息从多个文件描述信息中确定目标描述信息更加准确。对于文件存储来说,相同的文件内容可以存在多个,但是文件类型不同,则对源文件数据的文件属性信息提取,再对源文件数据进行内容解析,以得到文件内容信息。因此在进行文件搜索时,通过搜索信息与文件属性信息、文件内容信息进行比对,以能够查找出更加符合目标用户端的文件数据,使得文件数据查找更加准确。同时,对源文件数据的文件属性信息和文件内容信息获取,则可以更加精确地匹配到目的存储地址,以防止同一个文件内容信息对应的目的存储地址有多个,则在文件搜索时会输出多个目的存储地址,不便于目标用户端快速查找到文件数据。
具体地,文件属性信息包括至少任意一种:文件类型、文件大小、文件创建时间、文件修改时间、文件访问时间,因此,通过文件属性信息、文件内容信息和目的存储地址进行匹配以生成文件描述信息更加准确。对于搜索文件的用户而言,若用户不清楚需要查找的文件数据的命名,但是只记得文件创建时间、文件类型,由于文件描述信息包括的文件属性信息,且文件属性信息包括至少任意一种:文件类型、文件大小、文件创建时间、文件修改时间、文件访问时间。因此,用户也可以大略搜索出满足要求的文件数据。
请参照图6和图7,在本申请的一些实施例中,数据处理方法还包括但不限于步骤S1710、步骤S1720、步骤S1730和步骤S1740;
步骤S1710:根据数据来源构建对应的索引存储区;
具体地,在一些实施例的步骤S1710中,为了提高文件搜索的效率,需要根据数据来源构建对应的索引存储区。其中,数据来源包括身份标识码,且身份标识码用于表征用户终端的身份凭证,且身份标识码是唯一的。因此,根据不同用户终端的身份标识码构建对应的索引存储区。
步骤S1720:根据数据来源将对应的文件描述信息存储至对应的索引存储区;
具体地,在一些实施例地步骤S1720中,根据数据来源构建对应的索引存储区,则将文件描述信息存储至对应的索引存储区,由于数据来源包括身份标识码,且身份标识码是每一个用户终端唯一的身份凭证,所以所构建的索引存储区也是唯一的。将数据来源对应的文件描述信息存储至对应的索引存储区中,以实现文件描述信息的分类存储,也即同一个用户终端上传的源文件数据后生成的文件描述信息都存储同一个索引存储区。
例如,若文件搜索平台和两个用户终端构建了通信连接,也即两个用户终端完成了注册和登记且具有身份标识码,则接收的源文件数据的数据来源分别 P1、P2,则P1对应的索引存储区为C1索引存储区,P2对应的索引存储区为C2 索引存储区,且P1对应在目标服务器中的系统文件夹为D1系统文件夹,P2对应在目标服务器的系统文件夹为D2系统文件夹。若数据来源为P1具有三个源文件数据,且得到的文件描述信息分别为(A,a)、(B、b)和(C、c),则将(A,a)、(B、b)和(C、c)都存储至C1区中。因此,根据不同的数据来源将对应的文件描述信息存储至对应的索引存储区中,实现文件描述信息的分类存储。
步骤S1730:获取搜索请求的请求来源,根据请求来源和数据来源确定对应的索引存储区;
具体地,在一些实施例的步骤S1730中,当接收目标用户端发送的搜索请求,则获取搜索请求的请求来源,其中,请求来源包括:身份标识码,也即通过身份标识码确定对应的索引存储区。
步骤S1740:根据搜索请求中的搜索信息从索引存储区的多个文件描述信息中获取目标描述信息中的目的存储地址。
具体地,在一些实施例的步骤S1740中,根据搜索请求中的请求来源确定对应的索引存储区,也即确定该目标用户端的文件描述信息的索引存储区,以便于根据搜索请求中的搜索信息从对应索引存储区进行目标描述信息查找。因此,对于同一个目标用户端的文件搜索,只需要在同一个索引存储区进行分类搜索,无需从所有的文件描述信息中去查找目标描述信息,以减少文件搜索的难度,使得文件搜索更加高效。
需要说明的是,通过根据数据来源构建对应的索引存储区,并将同一个数据来源的文件描述信息存储到同一个索引存储区,则接收目标用户端发送的搜索请求时,只需要在搜索请求的搜索来源对应的索引存储区进行文件描述信息查找,则根据搜索请求的搜索信息在对应的索引存储区中查找对应的文件描述信息以快速查找到目标描述信息,使得目标描述信息中的目的存储地址查找更加快速。
请参照图8,在本申请的一些实施例中,其中,搜索信息包括:搜索属性信息和搜索内容信息;步骤S1500可以包括但不限于步骤S1510至步骤S1530;
步骤S1510:接收目标用户端发送的搜索请求,根据搜索请求中的搜索属性信息和搜索内容信息构建搜索检索式;
具体地,在一些实施例的步骤S1510中,由于文件描述信息由文件属性信息、文件内容信息和目的存储地址组合形成,因此根据搜索请求中的搜索属性信息和搜索内容构建搜索检索式,以通过搜索检索式从多个文件描述信息中获取目标描述信息。其中,搜索请求中的搜索信息可以包括搜索属性信息和/或搜索内容信息,若输入的搜索请求中的搜索信息只有搜索属性信息或搜索内容信息,则对应的搜索检索式有搜索属性信息或搜索内容信息;若搜索请求中的搜索信息包括搜索属性信息和搜索内容信息,则构建的搜索检索式为搜索属性信息和搜索内容信息的组合信息。因此,根据不同的信息构建出对应的搜索检索式,以在多个文件描述信息中获取匹配的目标描述信息。
步骤S1520:根据搜索检索式从多个文件描述信息获取文件属性信息,并根据搜索检索式从文件内容信息中满足搜索检索式的目标描述信息。
需要说明的是,在一些实施例的步骤S1520中,完成搜索检索式构建后,根据搜索检索式获取目标描述信息,由于搜索检索式由文搜索属性信息和搜索内容信息组合形成,所以先根据搜索检索式中的搜索属性信息获取文件描述信息中的文件属性信息,再根据搜索检索式的搜索内容信息获取文件描述信息的文件内容信息,以确定目标描述信息。因此,通过搜索检索式从索引存储区的多个文件描述信息中获取目标描述信息,使得目标描述信息获取快速,以得到目标描述信息中的目的存储地址更加快速,则便于目标用户端根据目的存储地址从目标服务器中获取对应的文件数据,使得文件数据的搜索和提取高效。
具体地,根据搜索检索式中搜索内容信息从多个文件描述信息中获取目标描述信息,通过获取搜索内容信息中的关键词与文件描述信息中的关键词进行比对,以满足预设关键词数即可确定对应的目标描述信息。若用户预先定义的预设关键词数为3,则只要搜索内容信息中的关键字和文件描述信息中的关键词数有3个匹配即可确定该文件描述信息为目标描述信息。在进行搜索内容信息和文件描述信息比对时,需要将搜索内容信息分词后进行关键词提取,以得到搜索关键词,再将搜索关键词和文件内容信息中的文件关键词进行比对,根据关键词匹配关键词数大于或等于预设关键词数的文件描述信息定义为目标描述信息。
步骤S1530:获取目标描述信息中的目的存储地址。
需要说明的是,完成目标描述信息查找之后,直接在目标描述信息中提取目的存储地址,以便于根据目的存储地址在目标服务器中提取对应的文件数据。
例如,预设关键词数为搜索内容信息为“我的2022年年度计划完成情况以及未来规划期望doc文档”,则对搜索内容信息进行分词以得到搜索关键词为“我的2020年”、“2020年年度计划”、“年度计划”、“未来规划期望”,然后将文件描述信息的文件内容信息满足2个搜索关键词的文件描述信息确定为目标描述信息。因此,通过搜索内容信息的搜索关键词从多个文件描述信息中获取目标描述信息准确且简易。
另外,请参照图9,本申请的另一个实施例还公开了数据处理方法,应用于目标服务器,且数据处理方法包括但不限于步骤S2100、S2200、S2300和S2400。
步骤S2100:接收文件搜索终端上传的源文件数据和存储通行证;
具体地,在一些实施例的步骤S2100中,当文件搜索终端根据源文件数据的数据信息从预设数据库获取存储通行证,则文件搜索终端将源文件数据和存储通行证都上传至目标服务器中,目标服务器接收到存储通行证和源文件数据。其中,存储通行证用于表征源文件数据可以进行存储和对应的目的文件夹。
步骤S2200:根据存储通行证将源文件数据存储至对应的目的文件夹,以得到文件数据;
具体地,在一些实施例的步骤S2200中,存储通行证表征源文件数据的目的文件夹,所以根据存储通行证将上传的源文件数据存储至目的文件夹,以得到文件数据。
其中,存储通行证用于指示源文件数据存储在目标服务器中目的文件夹的目的存储地址。因此根据存储通行证即可确定源文件数据的目的文件夹,以根据存储通行证将源文件数据存储至目的文件夹中。
步骤S2300:接收目标用户端发送的目的存储地址;
步骤S2400:将目的存储地址获取对应目的文件夹中的文件数据发送至目标用户端。
具体地,在一些实施例的步骤S2300至步骤S2400中,目的文件夹包括目的存储地址;若文件搜索终端接收目标用户端发送的搜索请求,且根据搜索请求中的搜索信息从多个文件描述信息中获取目标描述信息,然后将目标描述信息中的目的存储地址发送至目标用户端。因此,目标用户端将目的存储地址发送至目标服务器,则目标服务器根据目的存储地址确定文件数据的目的文件夹,以将目的文件夹中文件数据提取后发送至目标用户端。因此,通过目标用户端直接根据目的存储地址从目标服务器中提取文件数据,使得文件数据的提取更加简易。
请参照图10,在本申请的一些实施例中,数据处理方法还包括但不限于步骤S2500、步骤S2600和步骤S2700。
步骤S2500:获取文件搜索终端发送的身份标识码和源文件类型;其中,身份标识码用于表征用户终端的身份信息,源文件类型用于表征来源于用户终端的源文件数据的文件类型;
需要说明的是,在一些实施例的步骤S2500中,由于不是所有的用户终端都可以进行源文件数据存储至目标服务器中,所以需要用户终端在文件搜索终端上进行注册和登录以得到对应的存储通行证。在用户终端进行注册和登录时,需要将身份标识码和源文件类型发送至目标服务器中,则目标服务器先根据身份标识码和源文件类型进行目的文件夹创建,则可以根据不同用户终端的身份标识码和源文件类型创建不同的目的文件夹,以实现文件存储的分类。通过自动进行文件分类存储便于文件的管理。
步骤S2600:根据身份标识码创建对应的系统文件夹;
具体地,在一些实施例的步骤S2600中,由于用户终端在文件搜索终端上进行注册和登录后得到唯一的身份标识码,则根据身份标识码创建对应的系统文件夹,也即标识不同的用户终端对应的系统文件夹不同,以根据用户终端的身份标识码创建专属的系统文件夹,则系统文件夹中存储的文件数据都来源于一个用户终端。通过根据身份标识码创建对应的系统文件夹,以实现不同用户终端的文件数据的隔离,在进行文件数据搜索时,只需要在根据搜索请求的搜索来源即可确定系统文件夹,则只需要在同一个系统文件夹中去提取对应的文件数据,无需检索其他系统文件夹下的目的文件夹,节省了文件搜索的时间,且提高了文件搜索的效率。
步骤S2700:根据源文件类型在系统文件夹中创建目的文件夹。
具体地,在一些实施例地步骤S2700中,完成了系统文件夹的创建后,需要根据源文件类型在系统文件夹中创建目的文件夹,以实现不同文件类型的分类存储。对于同一个用户终端的源文件数据再以源文件类型分类存储,则在进行文件搜索时,只需要确定搜索请求的请求来源确定系统文件夹,再根据搜索属性信息中的搜索文件类型确定目的文件夹,则可以在目的文件夹中提取符合要求的文件数据,使得文件数据搜索更加针对性,以提高文件搜索的效率。
结合步骤S2100至步骤S2700,在进行源文件数据存储前,需要接收来自文件搜索终端发送的身份标识码和源文件类型,则根据身份标识码创建对应的系统文件夹,则系统文件夹下存储专属于一个用户终端的文件数据。然后根据源文件类型在系统文件夹下创建对应目的文件夹,也即在同一个目的文件夹下存储的文件类型相同。因此,当接收存储通行证时,且存储通行证用于指示源文件数据的目的存储地址,则将源文件数据存储至对应的目的文件夹以得到文件数据。当目标用户端需要获取文件数据,则根据目标用户端发送的目的存储地址直接获取对应的文件数据,使得文件数据存储和提取高效。
另外,请参照图11,本申请的另一个实施例公开了一种数据处理装置,应用于文件搜索终端,该装置包括:第一接收模块1100,用于接收用户终端发送的源文件数据;通行证获取模块1200,用于根据源文件数据的数据信息从预设数据库提取对应的存储通行证;上传模块1300,用于根据存储通行证将源文件数据上传至目标服务器,得到文件数据文件数据,并获取文件数据在目标服务器的目的存储地址;其中,每个源文件数据均对应各自的文件数据;解析模块 1400,用于对源文件数据进行解析以得到文件信息;描述信息生成模块1500,用于根据文件信息和所述目的存储地址生成文件描述信息;文件查找模块1600,用于接收目标用户端发送的搜索请求,根据搜索请求中的搜索信息从多个文件描述信息中获取目标描述信息中的目的存储地址;第一发送模块1700,用于根据搜索信息将目的存储地址发送至目标用户端,以使目标用户端根据目的存储地址从目标服务器获取文件数据。本申请实施例的数据处理装置的具体实施方式与上述应用于文件搜索终端的数据处理方法的具体实施方式基本相同,在此不再赘述。
本申请实施例的数据处理装置,通过对用户终端上传的源文件数据的数据信息和预设数据库中的匹配信息确定存储通行证,并根据存储通行证将源文件数据存储至目标服务器,以得到文件数据,同时获取文件数据在目标服务器的目的存储地址。源文件数据进行解析以得到文件信息,并将文件信息和目的存储地址生成描述信息,因此文件搜索终端只存储文件描述信息,所以在进行文件搜索时,只需要根据搜索请求中的搜索信息从多个文件描述信息中获取目标描述信息中的目的存储地址,并将目的存储地址发送至目标用户端,则目标用户端可以根据目的存储地址从目标服务器对应的目的文件夹中获取文件数据。因此在目标服务器和用户终端之间设置文件搜索终端,则文件搜索终端只存储文件描述信息,且将源文件数据存储至对应的目的文件夹,则文件查找时只需要根据搜索请求中的搜索信息从多个文件描述信息中确定目标描述信息,也即确定了文件数据的目的存储地址,则可以直接根据目的存储地址从目的文件夹中提取出文件数据,使得文件数据获取更加快速和高效,且提高了文件数据搜索的高效性。
另外,请参照图12,本申请的一个实施例还公开了另一种数据处理装置,应用于目标服务器,该装置包括:第二接收模块2100,用于接收文件搜索终端上传的源文件数据和存储通行证;存储模块2200用于根据存储通行证将源文件数据存储至对应的目的文件夹,以得到文件数据;第三接收模块2300用于接收目标用户端发送的目的存储地址;第二发送模块2400将目的存储地址获取对应目的文件夹中的文件数据发送至目标用户端。
本申请实施例的数据处理装置,目标服务器通过接收文件搜索终端发送的源文件数据和存储通行证,并根据存储通行证将源文件数据存储至目的文件夹以得到文件数据,且将文件数据的目的存储地址发送至目标用户端,以便于目标用户端根据目的存储地址直接从目的文件夹中获取文件数据,使得文件数据存取便捷。本申请实施例的数据处理装置的具体实施方式与上述应用于文件搜索终端的数据处理方法的具体实施方式基本相同,在此不再赘述。
其中,图2至图8所运行的数据处理方法为文件搜索终端上的文件搜索平台执行,且文件搜索平台为ES搜索平台,且ES搜索平台是一个搜索引擎。图9 至图10所运行的数据处理方法为目标服务器执行。因此,将文件描述信息存储在ES搜索平台上,以通过ES搜索平台根据搜索请求中的搜索信息从多个文件描述信息中获取目标描述信息,以得到文件数据的目的存储地址,以提高文件搜索的效率。
需要说明的是,本申请实施例的数据处理装置与前述的数据处理方法相对应,具体的训练过程请参照前述的数据处理方法,在此不一一赘述。
另外,本本申请的一些实施例还提供了一种存储介质,该存储介质是计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使计算机执行上述数据处理方法。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本公开实施例描述的实施例是为了更加清楚的说明本公开实施例的技术方案,并不构成对于本公开实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本公开实施例提供的技术方案对于类似的技术问题,同样适用。
本领域技术人员可以理解的是,图中示出的技术方案并不构成对本公开实施例的限定,可以包括比图示更多或更少的步骤,或者组合某些步骤,或者不同的步骤。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在 A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a 和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U 盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序的介质。
以上参照附图说明了本公开实施例的优选实施例,并非因此局限本公开实施例的权利范围。本领域技术人员不脱离本公开实施例的范围和实质内所作的任何修改、等同替换和改进,均应在本公开实施例的权利范围之内。

Claims (11)

1.一种数据处理方法,应用于文件搜索终端,其特征在于,包括:
接收用户终端发送的源文件数据;
根据所述源文件数据的数据信息从预设数据库提取对应的存储通行证;
根据所述存储通行证将所述源文件数据上传至目标服务器得到文件数据,并获取所述文件数据在所述目标服务器的目的存储地址;其中,每个源文件数据均对应有各自的文件数据;
对所述源文件数据进行解析以得到文件信息,根据所述文件信息和所述目的存储地址生成文件描述信息;
接收目标用户端发送的搜索请求,根据所述搜索请求中的搜索信息从多个所述文件描述信息中获取目标描述信息中的目的存储地址;
将所述目的存储地址发送至所述目标用户端,以使所述目标用户端根据所述目的存储地址从所述目标服务器获取所述文件数据。
2.根据权利要求1所述的方法,其特征在于,所述数据信息包括:身份标识码和源文件类型;在接收用户终端发送的源文件数据之前,所述方法还包括:
获取所述用户终端的访问请求,所述访问请求包括访问地址信息和账户信息;
根据所述访问地址信息和所述账户信息确定所述用户终端的身份标识码,并获取所述用户终端填写的源文件类型;
将所述身份标识码和所述源文件类型发送至所述目标服务器,以使所述目标服务器根据所述身份标识码和所述源文件类型创建对应的目的文件夹;
获取所述目的文件夹的目的存储地址,根据所述目的存储地址确定所述用户终端的所述存储通行证,并将所述身份标识码、所述源文件类型和所述存储通行证进行匹配,以生成所述预设数据库的匹配信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述源文件数据的数据信息从预设数据库提取对应的存储通行证,包括:
获取所述源文件数据的数据来源和源文件类型,所述数据来源包括:身份标识码;
根据所述身份标识码和所述源文件类型从所述预设数据库获取匹配信息;
根据所述身份标识码、所述源文件类型、所述匹配信息生成所述存储通行证。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述文件信息包括:文件属性信息和文件内容信息,所述对所述源文件数据进行解析以得到文件信息,包括:
提取所述源文件数据的文件属性信息,所述文件属性信息至少包括以下一种:文件类型、文件大小、文件创建时间、文件修改时间、文件访问时间;
对所述源文件数据进行内容解析,以得到所述文件内容信息。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述数据来源构建对应的索引存储区;
根据所述数据来源将对应的所述文件描述信息存储至对应的所述索引存储区;
获取所述搜索请求的请求来源,根据所述请求来源和所述数据来源确定对应的所述索引存储区;
根据所述搜索请求中的所述搜索信息从所述索引存储区的多个所述文件描述信息中获取目标描述信息中的所述目的存储地址。
6.根据权利要求4所述的方法,其特征在于,所述搜索信息包括:搜索属性信息和搜索内容信息;所述接收目标用户端发送的搜索请求,根据所述搜索请求中的搜索信息从多个所述文件描述信息中获取目标描述信息中的目的存储地址,包括:
接收所述目标用户端发送的搜索请求,根据所述搜索请求中的所述搜索属性信息和所述搜索内容信息构建搜索检索式;
根据所述搜索检索式从多个所述文件描述信息获取所述文件属性信息,并根据所述搜索检索式从所述文件内容信息中满足所述搜索检索式的所述目标描述信息;
获取所述目标描述信息中的所述目的存储地址。
7.一种数据处理方法,应用于目标服务器,其特征在于,包括:
接收文件搜索终端上传的源文件数据和存储通行证;
根据所述存储通行证将所述源文件数据存储至对应的目的文件夹,以得到文件数据;
接收目标用户端发送的目的存储地址;
将所述目的存储地址获取对应所述目的文件夹中的所述文件数据发送至所述目标用户端。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
获取所述文件搜索终端发送的身份标识码和源文件类型;其中,所述身份标识码用于表征所述用户终端的身份信息,所述源文件类型用于表征来源于所述用户终端的所述源文件数据的文件类型;
根据所述身份标识码创建对应的系统文件夹;
根据所述源文件类型在所述系统文件夹中创建所述目的文件夹。
9.一种数据处理装置,应用于用户终端,其特征在于,包括:
第一接收模块,用于接收用户终端发送的源文件数据;
通行证获取模块,用于根据所述源文件数据的数据信息从预设数据库提取对应的存储通行证;
上传模块,用于根据所述存储通行证将所述源文件数据上传至目标服务器,得到文件数据文件数据,并获取所述文件数据在所述目标服务器的目的存储地址;其中,每个源文件数据均对应各自的文件数据;
解析模块,用于对所述源文件数据进行解析以得到文件信息;
描述信息生成模块,用于根据所述文件信息和所述目的存储地址生成文件描述信息;
文件查找模块,用于接收目标用户端发送的搜索请求,根据所述搜索请求中的搜索信息从多个所述文件描述信息中获取目标描述信息中的目的存储地址;
第一发送模块,用于根据所述搜索信息将所述目的存储地址发送至所述目标用户端,以使所述目标用户端根据所述目的存储地址从所述目标服务器获取所述文件数据。
10.一种数据处理装置,应用于目标服务器,其特征在于,包括:
第二接收模块,用于接收文件搜索终端上传的源文件数据和存储通行证;
存储模块,用于根据所述存储通行证将所述源文件数据存储至对应的目的文件夹,以得到文件数据,其中,每个所述源文件数据均对应有各自的文件数据;
第三接收模块,用于接收目标用户端发送的目的存储地址;
第二发送模块,将所述目的存储地址获取对应所述目的文件夹中的所述文件数据发送至所述目标用户端。
11.一种存储介质,所述存储介质为计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行:
如权利要求1至6任一项所述的方法;或,
如权利要求7至8任一项所述的方法。
CN202210254759.7A 2022-03-15 2022-03-15 数据处理方法、装置及存储介质 Pending CN114637726A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210254759.7A CN114637726A (zh) 2022-03-15 2022-03-15 数据处理方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210254759.7A CN114637726A (zh) 2022-03-15 2022-03-15 数据处理方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN114637726A true CN114637726A (zh) 2022-06-17

Family

ID=81948582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210254759.7A Pending CN114637726A (zh) 2022-03-15 2022-03-15 数据处理方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN114637726A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115374066A (zh) * 2022-10-26 2022-11-22 北京芯可鉴科技有限公司 远程可视化系统与远程可视化方法
CN116578538A (zh) * 2023-07-13 2023-08-11 天津中新智冠信息技术有限公司 跨平台文件处理方法、装置、电子设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115374066A (zh) * 2022-10-26 2022-11-22 北京芯可鉴科技有限公司 远程可视化系统与远程可视化方法
CN116578538A (zh) * 2023-07-13 2023-08-11 天津中新智冠信息技术有限公司 跨平台文件处理方法、装置、电子设备及存储介质
CN116578538B (zh) * 2023-07-13 2023-10-27 天津中新智冠信息技术有限公司 跨平台文件处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN108932294B (zh) 基于索引的简历数据处理方法、装置、设备及存储介质
CN102880649B (zh) 一种个性化信息处理方法和系统
US9965547B2 (en) System and methods for automating trademark and service mark searches
US11899681B2 (en) Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium
CN110020424B (zh) 合同信息的提取方法、装置和文本信息的提取方法
US10303689B2 (en) Answering natural language table queries through semantic table representation
CN114637726A (zh) 数据处理方法、装置及存储介质
CN109408821B (zh) 一种语料生成方法、装置、计算设备及存储介质
CN109508458B (zh) 法律实体的识别方法及装置
CN109492081B (zh) 文本信息搜索和信息交互方法、装置、设备及存储介质
CN103902535A (zh) 获取联想词的方法、装置及系统
CN110929125A (zh) 搜索召回方法、装置、设备及其存储介质
CN110990057A (zh) 小程序子链信息的提取方法、装置、设备及介质
CN104008087A (zh) 一种针对具有标准格式的文案的自动排版方法和系统
CN111783425B (zh) 基于句法分析模型的意图识别方法及相关装置
CN116701604A (zh) 问答语料库的构建方法和装置、问答方法、设备及介质
CN116127066A (zh) 文本聚类方法、文本聚类装置、电子设备及存储介质
CN116383234A (zh) 一种搜索语句生成方法、装置、计算机设备及存储介质
CN110704654A (zh) 一种图片搜索方法和装置
CN112685389B (zh) 数据管理方法、数据管理装置、电子设备及存储介质
CN114416847A (zh) 一种数据转换的方法、装置、服务器及存储介质
US20140236940A1 (en) System and method for organizing search results
US20220207238A1 (en) Methods and system for the extraction of properties of variables using automatically detected variable semantics and other resources
CN117648416A (zh) 一种体检结果处理方法和装置、设备及介质
CN112860979B (zh) 资源搜索方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination