CN110489417A - 一种数据处理方法及相关设备 - Google Patents
一种数据处理方法及相关设备 Download PDFInfo
- Publication number
- CN110489417A CN110489417A CN201910679327.9A CN201910679327A CN110489417A CN 110489417 A CN110489417 A CN 110489417A CN 201910679327 A CN201910679327 A CN 201910679327A CN 110489417 A CN110489417 A CN 110489417A
- Authority
- CN
- China
- Prior art keywords
- index
- target
- target data
- storage
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2272—Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Fuzzy Systems (AREA)
- Artificial Intelligence (AREA)
- Automation & Control Theory (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种数据处理方法及相关设备,所述方法应用于数据处理技术领域,包括:当接收到来自客户端的用于存储目标数据的存储请求时,对目标数据进行字段解析,若基于字段解析结果检测到预设索引存储区域中不存在目标索引,则基于语义信息确定目标数据所属的存储结构类型,并向预连接的搜索服务器发送用于创建目标索引的索引请求,当接收到搜索服务器返回的目标索引时,根据目标索引存储目标数据。采用本申请实施例,可以根据目标数据所属的存储结构类型,创建目标索引,防止对不必要字段的拆分,有利于提高创建索引的效率。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据处理方法及相关设备。
背景技术
目前,许多数据管理平台均可以提供通过关键词进行目标数据查询的功能。如果需要使用目标数据查询的功能,首先需要在服务器对应的存储区域创建该目标数据对应的索引,在索引创建完成后,可以通过关键词查询该目标数据。其中,该关键词是通过对目标数据进行分词处理后得到的。
传统服务对目标数据的存储一般都存储到关系型数据库,例如MySql、Oracle等。如果服务器通过关系型数据库创建目标数据对应的索引,从而实现目标数据的查询功能,需要另外维护一套数据库服务,无法对非结构化的目标数据进行很好的分词处理,从而创建索引。因此,如何更加高效地创建索引,存储目标数据,从而实现目标数据的查询,成为一个亟待解决的问题。
发明内容
本申请实施例提供了一种数据处理方法及相关设备,有利于提高创建索引的效率。
第一方面,本申请实施例提供了一种数据处理方法,所述方法应用于服务器,该方法包括:
接收来自客户端的用于存储目标数据的存储请求,所述存储请求中包括所述目标数据;
对所述目标数据进行字段解析,以得到字段解析结果,所述字段解析结果包括所述目标数据对应的字段以及所述字段的语义信息;
检测预设索引存储区域中是否存在所述字段对应的目标索引;
若检测到所述预设索引存储区域中不存在所述目标索引,则基于所述语义信息确定所述目标数据所属的存储结构类型;
向预连接的搜索服务器发送用于创建目标索引的索引请求,所述索引请求携带所述存储结构类型以及所述目标数据,以便于所述搜索服务器根据所述索引请求,为所述目标数据创建与所述存储结构类型匹配的目标索引;
接收所述搜索服务器返回的所述目标索引,并根据所述目标索引存储所述目标数据。
在一个实施例中,所述基于所述语义信息确定所述目标数据所属的存储结构类型的具体实施方式为:
若基于所述语义信息检测到所述目标数据对应的字段用于完整匹配查找,则将所述目标数据所属的存储结构类型确定为关键字类型。
在一个实施例中,所述基于所述语义信息确定所述目标数据所属的存储结构类型的具体实施方式为:
若基于所述语义信息检测到所述目标数据对应的字段用于模糊匹配查找,则将所述目标数据所属的存储结构类型确定为分词类型。
在一个实施例中,所述在所述目标索引中存储所述目标数据之后,还可以
向所述客户端发送针对所述目标数据的更新指示信息,所述更新指示信息用于指示客户端按照预设更新策略更新所述目标数据。
在一个实施例中,所述预设更新策略包括延迟更新策略或者时间更新策略,其中,所述延迟更新策略用于指示所述客户端在检测到针对目标数据的触发操作时,更新所述目标数据;所述时间更新策略,用于指示所述客户端在预设时间后更新所述目标数据。
在一个实施例中,所述向预连接的搜索服务器发送用于创建目标索引的索引请求之后,所述方法还包括:
若在预设时间内未接收到所述搜索服务器返回的所述目标索引时,生成一个预设索引,并根据所述预设索引存储所述目标数据。
在一个实施例中,所述生成一个预设索引之后,还可以创建用于接收所述搜索服务器返回的目标索引的异步线程;其中,所述接收所述搜索服务器返回的所述目标索引,并在所述目标索引中存储所述目标数据的具体实施方式为若通过所述异步线程接收到所述搜索服务器返回所述目标索引,则通过所述目标索引更新所述预设索引,并根据所述目标索引存储所述目标数据。
第二方面,本申请实施例提供了一种数据处理装置,该数据处理装置包括用于执行上述第一方面的方法的模块。
第三方面,本申请实施例提供了一种服务器,该服务器包括处理器、网络接口和存储器,所述处理器、网络接口和存储器相互连接,其中,所述网络接口受所述处理器的控制用于收发消息,所述存储器用于存储支持服务器执行上述方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
本申请实施例中,服务器可以当接收到来自客户端的用于存储目标数据的存储请求时,对目标数据进行字段解析,以得到目标数据对应的字段以及字段的语义信息,并检测预设索引存储区域中是否存在字段对应的目标索引。进一步地,若检测到预设索引存储区域中不存在目标索引,则基于语义信息确定目标数据所属的存储结构类型,并向预连接的搜索服务器发送用于创建目标索引的索引请求,用于请求搜索服务器根据索引请求,为目标数据创建与存储结构类型匹配的目标索引。当接收到搜索服务器返回的目标索引时,根据目标索引存储目标数据。采用本申请实施例,可以根据目标数据所属的存储结构类型,创建目标索引,防止对不必要字段的拆分,有利于提高创建索引的效率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种数据处理方法的流程示意图;
图2是本申请实施例提供的另一种数据处理方法的流程示意图;
图3是本申请实施例提供的一种数据处理装置的示意性框图;
图4是本申请实施例提供的一种服务器的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本申请实施例提供的一种数据处理方法的流程示意图,该方法应用于服务器,可由服务器执行,如图所示,该数据处理方法可包括:
101:接收来自客户端的用于存储目标数据的存储请求,该存储请求中包括目标数据。
102:对目标数据进行字段解析,以得到字段解析结果,该字段解析结果包括所述目标数据对应的字段以及字段的语义信息。
其中,上述服务器可以数据管理平台对应的服务器,该服务器可以为一台服务器,也可以为多台服务器组成的服务器集群,该服务器可以提供数据管理的相关服务。例如,该数据管理平台可以为日志平台,该日志云平台可以提供通过关键词进行日志查询的功能。其中,该客户端可以为日志平台对应的应用或者网站,也可以为安装有日志平台应用或者开启日志平台网站的终端设备。在一个实施例中,该目标数据可以为非结构化的数据。
103:检测预设索引存储区域中是否存在所述字段对应的目标索引,若检测到预设索引存储区域中不存在目标索引,则基于语义信息确定目标数据所属的存储结构类型。
其中,服务器为了实现目标数据的查询功能,服务器需要预先在索引存储区域中创建目标数据对应的索引,创建索引之后,可以通过关键词进行目标数据的查询,其中,该索引与关键词具有对应关系。在一个实施例中,预设索引存储区域中包括至少一个索引,每个索引对应有关键词。针对这种情况,当服务器接收到来自客户端的用于存储目标数据的存储请求时,可以对目标数据进行字段解析,得到目标数据对应的至少一个字段。进一步地,可以将上述至少一个字段与预先存储的各个索引的关键词进行对比,若对比得到至少一个字段中的任一字段与任一索引的关键词匹配,则确定预设索引存储区域中存在目标索引。
相反地,若服务器检测到上述至少一个字段中不存在与任一索引的关键词匹配的字段,则确定预设索引存储区域中不存在目标索引。
其中,上述存储结构类型可以包括关键字类型和分词类型。在一个实施例中,当服务器检测到预设索引存储区域中不存在目标索引时,可以检测目标数据对应各个字段的语义信息,若基于该语义信息检测到目标数据对应任一字段用于完整匹配查找,则将目标数据所属的存储结构类型确定为关键字类型。
若基于语义信息检测到目标数据对应的任一字段用于模糊匹配查找,则将目标数据所属的存储结构类型确定为分词类型。其中,用于完整匹配查找的字段可以称为第一字段,该第一字段具有唯一性,例如该第一字段的语义信息可以表征用户姓名、证件号等,每一个用户仅对应一个用户姓名,以及证件号;其中,用于模糊查找的字段可以称为第二字段,该第二字段的语义信息不具有唯一性,例如该第二字段的语义信息可以表征公司名称等,该公司名称可以对应多个用户。采用这样的方式,服务器可以根据不同的目标数据,创建不同的存储结构,可以避免搜索服务器在创建目标索引时,对不必要的字符进行拆分,可以有效提高数据处理效率。
104:向预连接的搜索服务器发送用于创建目标索引的索引请求,该索引请求携带存储结构类型以及目标数据,以便于搜索服务器根据该索引请求,为目标数据创建与该存储结构类型匹配的目标索引。
105:接收搜索服务器返回的目标索引,并根据目标索引存储目标数据。
在一个实施例中,可以预先配置针对搜索服务器的配置文件,该配置文件中包含了关于连接搜索服务器的地址、端口、协议、连接超时时间、协议的路由数和最大连接数等相关配置。进一步地,当服务器检测到上述搜索服务器启动时,可以基于上述配置文件在搜索服务器注册,从而实现后续与搜索服务器之间的数据交互,即与搜索服务器建立连接。
其中,该搜索服务器可以为ElasticSearch,该ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTfulweb接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
在一个实施例中,当服务器确定出目标数据所属的存储结构类型之后,可以向以建立连接的搜索服务器发送创建目标索引的索引请求,该索引请求包括目标数据的存储结构类型以及该目标数据。进一步地,搜索服务器可以基于该目标数据以及存储结构类型,自动为该目标数据创建出与该存储结构类型匹配的目标索引,并将该目标索引返回服务器。服务器接收到搜索服务器返回的目标索引后,可以在目标索引对应的存储区域中存储该目标数据,并为该目标数据分配关键字,以便于后续使用该关键字,查询到目标数据。其中,该目标索引对应的存储区域可以为磁盘或者文件夹。
在一个实施例中,上述数据处理方法可应用于一个数据管理平台对应的插件,该插件插入的对象为搜索服务器。示例性地,该数据管理平台为一个日志平台,该插件可以在搜索服务器的服务文件夹下创建属于自己服务的文件夹,该文件夹中包括以jar包形式存在的日志云插件、当前插件的运行信息和日志平台需要的配置文件。其中,该运行信息包括:插件的描述信息,用来描述该插件的作用;插件的版本信息;插件在搜索服务器中显示的名称;插件的入口,插件采用的java版本信息;插件发布到搜索服务器对应的特定版本。
在一个实施例中,若检测到上述预设索引存储区域中存在目标索引,可以直接在该目标索引中存储该目标数据。
本申请实施例中,服务器可以当接收到来自客户端的用于存储目标数据的存储请求时,对目标数据进行字段解析,以得到目标数据对应的字段以及字段的语义信息,并检测预设索引存储区域中是否存在字段对应的目标索引。进一步地,若检测到预设索引存储区域中不存在目标索引,则基于语义信息确定目标数据所属的存储结构类型,并向预连接的搜索服务器发送用于创建目标索引的索引请求,用于请求搜索服务器根据索引请求,为目标数据创建与存储结构类型匹配的目标索引。当接收到搜索服务器返回的目标索引时,根据目标索引存储目标数据。采用本申请实施例,可以根据目标数据所属的存储结构类型,创建目标索引,防止对不必要字段的拆分,有利于提高创建索引的效率。
参见图2,图2是本申请实施例提供的另一种数据处理方法的流程示意图,该方法可由服务器执行,如图所示,该数据处理方法可包括:
201:当接收到来自客户端的用于存储目标数据的存储请求时,对目标数据进行字段解析,以得到字段解析结果,该字段解析结果包括所述目标数据对应的字段以及字段的语义信息。
202:检测预设索引存储区域中是否存在所述字段对应的目标索引,若检测到预设索引存储区域中不存在目标索引,则基于语义信息确定目标数据所属的存储结构类型。
203:向预连接的搜索服务器发送用于创建目标索引的索引请求,该索引请求携带存储结构类型以及目标数据,以便于搜索服务器根据该索引请求,为目标数据创建与该存储结构类型匹配的目标索引。
204:接收搜索服务器返回的目标索引,并根据目标索引存储目标数据。
其中,上述步骤201~步骤204的具体实施方式,可以参见上述实施例中步骤101~步骤105的相关描述,此处不再赘述。
205:向上述客户端发送针对目标数据的更新指示信息,该更新指示信息用于指示客户端按照预设更新策略更新目标数据。
在一个实施例中,上述预设更新策略可以包括延迟更新策略或者时间更新策略,其中,上述延迟更新策略用于指示客户端在检测到针对目标数据的触发操作时,更新目标数据;该时间更新策略,用于指示客户端在预设时间后更新目标数据。其中,该触发操作可以为搜索目标数据的搜索操作,也可以为查看目标数据的查看操作等等,或者,其他针对目标数据的任何操作,本申请对此不做具体限定。
在一个实施例中,该预设时间可以为0s,1s等等,均可以为预先由开发人员默认设置的,也可以由用户根据自身需求选择的。或者,当该预设时间已经确定后,用户也可以根据自身需求据对该预设时间进行调整。其中,该0s可以理解为立即刷新。
示例性地,上述预设更新策略为时间更新策略,该时间更新策略,用于指示客户端在0s后更新目标数据,这种情况下,客户端接收到针对目标数据的更新指示信息后,可以立即更新该目标数据。
在一个实施例中,当上述预设更新策略为延迟更新策略时,上述延迟更新策略用于指示客户端在检测到针对目标数据的查看操作时,更新目标数据。其中,该查看操作例如可以为针对查看按钮的触控操作,或者用于查看目标数据的语音信号等等。采用这样的方式,不需要立即更新目标数据大量消耗硬件的性能,延迟刷新会在下次对目标数据存在触发操作时进行刷新,保证了硬件性能的保护和用户及时可以查询到保存的目标数据。
在一个实施例中,向预连接的搜索服务器发送用于创建目标索引的索引请求之后,若在预设时间内未接收到搜索服务器返回的目标索引时,可以生成一个预设索引,并根据预设索引存储该目标数据
在一个实施例中,可以预先设置等待搜索服务器返回目标索引的等待时长(即,预设时间),当向预连接的搜索服务器发送用于创建目标索引的索引请求时,开启计时器进行计时,若检测到计时器对应的当前时长大于或者等于该等待时长时,还未接收到返回的目标索引,则可以获取一个预设索引,并在预设索引对应的存储区域存储该目标数据。
在一个实施例中,服务器生成一个预设索引之后,还可以创建用于接收搜索服务器返回的目标索引的异步线程,也即,开启一个新的线程,用于继续等待搜索服务器返回目标索引。进一步地,若服务器通过上述异步线程接收到搜索服务器返回的目标索引,则通过目标索引更新预设索引,并根据目标索引存储目标数据。
在一个实施例中,可以预先对接收搜索服务器返回目标索引的事件注册一个回调监听器,当服务器在预设时间内未接收到搜索服务器返回的目标索引时,可以开启该回调监听器(即创建一个上述异步线程),用于接收该搜索服务器返回的目标索引。
在一个实施例中,本申请实施例中的数据处理方法应用于服务器集群,该服务器集群部署有N个节点(如N个服务器)。这种情况下,在向预连接的搜索服务器发送用于创建目标索引的索引请求之前,还可以基于服务器集群中节点的数量确定对目标数据进行分片过程中,每一个节点对应的主片和副片数量,并将每一个节点对应的主片和副片数量添加至索引请求,发送至搜索服务器。进一步地,搜索服务器接收到该索引请求后,可以根据每一个节点对应的主片和副片数量对目标数据进行分片处理,并创建每一个节点各自对应的目标索引,创建完成后,将该目标索引返回至各自对应的节点。采用这样的方式,可以根据集群中部署节点的个数去设置主片和副片的数量,有效的减少了过多副片数量对硬件资源的浪费。
示例性地,当存在N个节点时,当基于服务器集群中节点的数量确定对目标数据进行分片过程中,每一个节点对应的主片和副片数量时,可以依据第二节点的副片数量与第一节点的主片数量相同、第三节点的副片数量与第二节点的主片数量相同,以此类推的原则,确定每一个节点对应的主片和副片数量。其中,主片和副片存储的数据相同,可以防止硬件问题导致数据丢失。
本申请实施例中,服务器可以当接收到来自客户端的用于存储目标数据的存储请求时,对目标数据进行字段解析,以得到目标数据对应的字段以及字段的语义信息,并检测预设索引存储区域中是否存在字段对应的目标索引。进一步地,若检测到预设索引存储区域中不存在目标索引,则基于语义信息确定目标数据所属的存储结构类型,并向预连接的搜索服务器发送用于创建目标索引的索引请求,用于请求搜索服务器根据索引请求,为目标数据创建与存储结构类型匹配的目标索引。当接收到搜索服务器返回的目标索引时,根据目标索引存储目标数据,并向上述客户端发送针对目标数据的更新指示信息,该更新指示信息用于指示客户端按照预设更新策略更新目标数据。采用本申请实施例,可以不需要立即更新目标数据大量消耗硬件的性能,有利于兼顾对硬件性能的保护和用户查询到目标数据的及时性。
本申请实施例还提供了一种数据处理装置。该装置包括用于执行前述图1或者图2所述的方法的模块,配置于服务器。具体地,参见图3,是本申请实施例提供的数据处理装置的示意框图。本实施例的数据处理装置包括:
通信模块30,用于接收来自客户端的用于存储目标数据的存储请求,所述存储请求中包括所述目标数据;
处理模块31,用于对所述目标数据进行字段解析,以得到字段解析结果,所述字段解析结果包括所述目标数据对应的字段以及所述字段的语义信息;
所述处理模块31,还用于检测预设索引存储区域中是否存在所述字段对应的目标索引,若检测到所述预设索引存储区域中不存在所述目标索引,则基于所述语义信息确定所述目标数据所属的存储结构类型;
所述通信模块30,还用于向预连接的搜索服务器发送用于创建目标索引的索引请求,并接收所述搜索服务器返回的所述目标索引,所述索引请求携带所述存储结构类型以及所述目标数据,以便于所述搜索服务器根据所述索引请求,为所述目标数据创建与所述存储结构类型匹配的目标索引;
所述处理模块31,还用于根据所述目标索引存储所述目标数据。
在一个实施例中,所述处理模块31,具体用于若基于所述语义信息检测到所述目标数据对应的字段用于完整匹配查找,则将所述目标数据所属的存储结构类型确定为关键字类型。
在一个实施例中,所述处理模块31,具体还用于若基于所述语义信息检测到所述目标数据对应的字段用于模糊匹配查找,则将所述目标数据所属的存储结构类型确定为分词类型。
在一个实施例中,所述通信模块30,还用于在所述目标索引中存储所述目标数据之后,向所述客户端发送针对所述目标数据的更新指示信息,所述更新指示信息用于指示客户端按照预设更新策略更新所述目标数据。
在一个实施例中,所述预设更新策略包括延迟更新策略或者时间更新策略,其中,所述延迟更新策略用于指示所述客户端在检测到针对目标数据的触发操作时,更新所述目标数据;所述时间更新策略,用于指示所述客户端在预设时间后更新所述目标数据。
在一个实施例中,所述处理模块31,还用于向预连接的搜索服务器发送用于创建目标索引的索引请求之后,若在预设时间内未接收到所述搜索服务器返回的所述目标索引时,生成一个预设索引,并根据所述预设索引存储所述目标数据。
在一个实施例中,所述处理模块31,还用于生成一个预设索引之后,创建用于接收所述搜索服务器返回的目标索引的异步线程;若通过所述异步线程接收到所述搜索服务器返回所述目标索引,则通过所述目标索引更新所述预设索引,并根据所述目标索引存储所述目标数据。
需要说明的是,本申请实施例所描述的数据处理装置的各功能模块的功能可根据图1或者图2所述的方法实施例中的方法具体实现,其具体实现过程可以参照图1或者图2的方法实施例的相关描述,此处不再赘述。
本申请实施例中,当通信模块30接收到来自客户端的用于存储目标数据的存储请求时,处理模块31对目标数据进行字段解析,得到目标数据对应的字段以及字段的语义信息,并检测预设索引存储区域中是否存在字段对应的目标索引,若检测到预设索引存储区域中不存在目标索引,则基于语义信息确定目标数据所属的存储结构类型,并通过通信模块30向预连接的搜索服务器发送用于创建目标索引的索引请求,进而接收搜索服务器返回的目标索引,通过处理模块31根据目标索引存储目标数据。采用本申请实施例,可以根据目标数据所属的存储结构类型,创建目标索引,防止对不必要字段的拆分,有利于提高创建索引的效率。
请参见图4,图4是本申请实施例提供的一种服务器的示意性框图,如图4所示,该服务器包括,处理器401、存储器402和网络接口403。上述处理器401、存储器402和网络接口403可通过总线或其他方式连接,在本申请实施例所示图4中以通过总线连接为例。其中,网络接口403受所述处理器的控制用于收发消息,存储器402用于存储计算机程序,所述计算机程序包括程序指令,处理器401用于执行存储器402存储的程序指令。其中,处理器401被配置用于调用所述程序指令执行:当通过网络接口403接收到来自客户端的用于存储目标数据的存储请求时,对所述目标数据进行字段解析,以得到字段解析结果,所述字段解析结果包括所述目标数据对应的字段以及所述字段的语义信息;检测预设索引存储区域中是否存在所述字段对应的目标索引;若检测到所述预设索引存储区域中不存在所述目标索引,则基于所述语义信息确定所述目标数据所属的存储结构类型;通过网络接口403向预连接的搜索服务器发送用于创建目标索引的索引请求,所述索引请求携带所述存储结构类型以及所述目标数据,以便于所述搜索服务器根据所述索引请求,为所述目标数据创建与所述存储结构类型匹配的目标索引;通过网络接口403接收所述搜索服务器返回的所述目标索引,并根据所述目标索引存储所述目标数据。
在一个实施例中,所述处理器401,具体用于若基于所述语义信息检测到所述目标数据对应的字段用于完整匹配查找,则将所述目标数据所属的存储结构类型确定为关键字类型。
在一个实施例中,所述处理器401,具体还用于若基于所述语义信息检测到所述目标数据对应的字段用于模糊匹配查找,则将所述目标数据所属的存储结构类型确定为分词类型。
在一个实施例中,所述网络接口403,还用于在所述目标索引中存储所述目标数据之后,向所述客户端发送针对所述目标数据的更新指示信息,所述更新指示信息用于指示客户端按照预设更新策略更新所述目标数据。
在一个实施例中,所述预设更新策略包括延迟更新策略或者时间更新策略,其中,所述延迟更新策略用于指示所述客户端在检测到针对目标数据的触发操作时,更新所述目标数据;所述时间更新策略,用于指示所述客户端在预设时间后更新所述目标数据。
在一个实施例中,所述处理器401,还用于向预连接的搜索服务器发送用于创建目标索引的索引请求之后,若在预设时间内未接收到所述搜索服务器返回的所述目标索引时,生成一个预设索引,并根据所述预设索引存储所述目标数据。
在一个实施例中,所述处理器401,还用于生成一个预设索引之后,创建用于接收所述搜索服务器返回的目标索引的异步线程;若通过所述异步线程接收到所述搜索服务器返回所述目标索引,则通过所述目标索引更新所述预设索引,并根据所述目标索引存储所述目标数据。
应当理解,在本申请实施例中,所称处理器401可以是中央处理单元(CentralProcessing Unit,CPU),该处理器401还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器402可以包括只读存储器和随机存取存储器,并向处理器401提供指令和数据。存储器402的一部分还可以包括非易失性随机存取存储器。例如,存储器402还可以存储设备类型的信息。
具体实现中,本申请实施例中所描述的处理器401、存储器402和网络接口403可执行本申请实施例提供的图1或者图2所述的方法实施例所描述的实现方式,也可执行本申请实施例所描述的数据处理装置的实现方式,在此不再赘述。
在本发明的另一实施例中提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现:当接收到来自客户端的用于存储目标数据的存储请求时,对所述目标数据进行字段解析,以得到字段解析结果,所述字段解析结果包括所述目标数据对应的字段以及所述字段的语义信息;检测预设索引存储区域中是否存在所述字段对应的目标索引;若检测到所述预设索引存储区域中不存在所述目标索引,则基于所述语义信息确定所述目标数据所属的存储结构类型;向预连接的搜索服务器发送用于创建目标索引的索引请求,所述索引请求携带所述存储结构类型以及所述目标数据,以便于所述搜索服务器根据所述索引请求,为所述目标数据创建与所述存储结构类型匹配的目标索引;接收所述搜索服务器返回的所述目标索引,并根据所述目标索引存储所述目标数据。
所述计算机可读存储介质可以是前述任一实施例所述的服务器的内部存储单元,例如服务器的硬盘或内存。所述计算机可读存储介质也可以是所述服务器的外部存储设备,例如所述服务器上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述服务器的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述服务器所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明的部分实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
Claims (10)
1.一种数据处理方法,其特征在于,所述方法包括:
接收来自客户端的用于存储目标数据的存储请求,所述存储请求中包括所述目标数据;
对所述目标数据进行字段解析,以得到字段解析结果,所述字段解析结果包括所述目标数据对应的字段以及所述字段的语义信息;
检测预设索引存储区域中是否存在所述字段对应的目标索引;
若检测到所述预设索引存储区域中不存在所述目标索引,则基于所述语义信息确定所述目标数据所属的存储结构类型;
向预连接的搜索服务器发送用于创建目标索引的索引请求,所述索引请求携带所述存储结构类型以及所述目标数据,以便于所述搜索服务器根据所述索引请求,为所述目标数据创建与所述存储结构类型匹配的目标索引;
接收所述搜索服务器返回的所述目标索引,并根据所述目标索引存储所述目标数据。
2.根据权利要求1所述的方法,其特征在于,所述基于所述语义信息确定所述目标数据所属的存储结构类型,包括:
若基于所述语义信息检测到所述目标数据对应的字段用于完整匹配查找,则将所述目标数据所属的存储结构类型确定为关键字类型。
3.根据权利要求1所述的方法,其特征在于,所述基于所述语义信息确定所述目标数据所属的存储结构类型,包括:
若基于所述语义信息检测到所述目标数据对应的字段用于模糊匹配查找,则将所述目标数据所属的存储结构类型确定为分词类型。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述在所述目标索引中存储所述目标数据之后,所述方法还包括:
向所述客户端发送针对所述目标数据的更新指示信息,所述更新指示信息用于指示客户端按照预设更新策略更新所述目标数据。
5.根据权利要求4所述的方法,其特征在于,所述预设更新策略包括延迟更新策略或者时间更新策略,其中,所述延迟更新策略用于指示所述客户端在检测到针对目标数据的触发操作时,更新所述目标数据;所述时间更新策略,用于指示所述客户端在预设时间后更新所述目标数据。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述向预连接的搜索服务器发送用于创建目标索引的索引请求之后,所述方法还包括:
若在预设时间内未接收到所述搜索服务器返回的所述目标索引时,生成一个预设索引,并根据所述预设索引存储所述目标数据。
7.根据权利要求6所述的方法,其特征在于,所述生成一个预设索引之后,所述方法还包括:
创建用于接收所述搜索服务器返回的目标索引的异步线程;
其中,所述接收所述搜索服务器返回的所述目标索引,并在所述目标索引中存储所述目标数据,包括:
若通过所述异步线程接收到所述搜索服务器返回所述目标索引,则通过所述目标索引更新所述预设索引,并根据所述目标索引存储所述目标数据。
8.一种数据处理装置,其特征在于,所述装置包括:
通信模块,用于接收来自客户端的用于存储目标数据的存储请求,所述存储请求中包括所述目标数据;
处理模块,用于对所述目标数据进行字段解析,以得到字段解析结果,所述字段解析结果包括所述目标数据对应的字段以及所述字段的语义信息;
所述处理模块,还用于检测预设索引存储区域中是否存在所述字段对应的目标索引,若检测到所述预设索引存储区域中不存在所述目标索引,则基于所述语义信息确定所述目标数据所属的存储结构类型;
所述通信模块,还用于向预连接的搜索服务器发送用于创建目标索引的索引请求,并接收所述搜索服务器返回的所述目标索引,所述索引请求携带所述存储结构类型以及所述目标数据,以便于所述搜索服务器根据所述索引请求,为所述目标数据创建与所述存储结构类型匹配的目标索引;
所述处理模块,还用于根据所述目标索引存储所述目标数据。
9.一种服务器,其特征在于,包括处理器和存储器,所述处理器和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1至7任意一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910679327.9A CN110489417B (zh) | 2019-07-25 | 2019-07-25 | 一种数据处理方法及相关设备 |
PCT/CN2019/120960 WO2021012553A1 (zh) | 2019-07-25 | 2019-11-26 | 一种数据处理方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910679327.9A CN110489417B (zh) | 2019-07-25 | 2019-07-25 | 一种数据处理方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110489417A true CN110489417A (zh) | 2019-11-22 |
CN110489417B CN110489417B (zh) | 2023-03-28 |
Family
ID=68548292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910679327.9A Active CN110489417B (zh) | 2019-07-25 | 2019-07-25 | 一种数据处理方法及相关设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110489417B (zh) |
WO (1) | WO2021012553A1 (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111125176A (zh) * | 2019-12-20 | 2020-05-08 | 北京百度网讯科技有限公司 | 一种业务数据搜索方法、装置、电子设备和存储介质 |
CN111274350A (zh) * | 2020-02-03 | 2020-06-12 | 广州极尚网络技术有限公司 | 数据处理方法、装置、计算机设备和存储介质 |
CN111914126A (zh) * | 2020-07-22 | 2020-11-10 | 浙江乾冠信息安全研究院有限公司 | 用于索引的网络安全大数据的处理方法、设备及存储介质 |
CN111949479A (zh) * | 2020-07-31 | 2020-11-17 | 中国工商银行股份有限公司 | 交互系统和索引创建情况的确定方法、设备 |
CN112100414A (zh) * | 2020-09-11 | 2020-12-18 | 深圳力维智联技术有限公司 | 数据处理方法、装置、系统与计算机可读存储介质 |
WO2021012553A1 (zh) * | 2019-07-25 | 2021-01-28 | 深圳壹账通智能科技有限公司 | 一种数据处理方法及相关设备 |
CN112988692A (zh) * | 2019-12-13 | 2021-06-18 | 阿里巴巴集团控股有限公司 | 数据处理方法及装置 |
CN113190623A (zh) * | 2021-05-14 | 2021-07-30 | 京东数科海益信息科技有限公司 | 数据处理方法、装置、服务器和存储介质 |
CN113626443A (zh) * | 2021-08-26 | 2021-11-09 | 企查查科技有限公司 | 索引的数据处理方法、装置、计算机设备和存储介质 |
CN113760931A (zh) * | 2021-08-20 | 2021-12-07 | 济南浪潮数据技术有限公司 | 一种资源信息的存取方法、装置、设备和介质 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112100152A (zh) * | 2020-09-14 | 2020-12-18 | 广州华多网络科技有限公司 | 业务数据处理方法、系统、服务器和可读存储介质 |
CN112948016A (zh) * | 2021-02-25 | 2021-06-11 | 京东数字科技控股股份有限公司 | 配置信息的生成方法、装置及设备 |
CN116860428A (zh) * | 2022-03-28 | 2023-10-10 | 华为技术有限公司 | 一种数据处理方法、编解码加速器和相关设备 |
CN116737428B (zh) * | 2023-08-14 | 2023-11-21 | 中科三清科技有限公司 | 空气质量模式运行的稳定性检查方法、装置及电子设备 |
CN117076542B (zh) * | 2023-08-29 | 2024-06-07 | 中国中金财富证券有限公司 | 数据处理方法及相关装置 |
CN116842223B (zh) * | 2023-08-29 | 2023-11-10 | 天津鑫宝龙电梯集团有限公司 | 一种工况数据管理方法、装置、设备和介质 |
CN116910260B (zh) * | 2023-09-13 | 2023-11-17 | 中国标准化研究院 | 一种基于大数据的数字资产搜索方法 |
CN117896440B (zh) * | 2024-03-15 | 2024-05-24 | 江西曼荼罗软件有限公司 | 一种数据缓存获取方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160154851A1 (en) * | 2013-04-24 | 2016-06-02 | Hitachi Ltd. | Computing device, storage medium, and data search method |
CN105988996A (zh) * | 2015-01-27 | 2016-10-05 | 腾讯科技(深圳)有限公司 | 一种索引文件生成方法及装置 |
CN106326295A (zh) * | 2015-07-01 | 2017-01-11 | 中兴通讯股份有限公司 | 语义数据的存储方法及装置 |
US20170139996A1 (en) * | 2012-05-18 | 2017-05-18 | Splunk Inc. | Collection query driven generation of inverted index for raw machine data |
CN108874924A (zh) * | 2018-05-31 | 2018-11-23 | 康键信息技术(深圳)有限公司 | 搜索服务的创建方法、装置及计算机可读存储介质 |
CN110019646A (zh) * | 2017-10-12 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 一种建立索引的方法和装置 |
CN110019211A (zh) * | 2017-11-27 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 关联索引的方法、装置和系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102016224455A1 (de) * | 2016-12-08 | 2018-06-14 | Bundesdruckerei Gmbh | Datenbankindex aus mehreren Feldern |
CN110489417B (zh) * | 2019-07-25 | 2023-03-28 | 深圳壹账通智能科技有限公司 | 一种数据处理方法及相关设备 |
-
2019
- 2019-07-25 CN CN201910679327.9A patent/CN110489417B/zh active Active
- 2019-11-26 WO PCT/CN2019/120960 patent/WO2021012553A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170139996A1 (en) * | 2012-05-18 | 2017-05-18 | Splunk Inc. | Collection query driven generation of inverted index for raw machine data |
US20160154851A1 (en) * | 2013-04-24 | 2016-06-02 | Hitachi Ltd. | Computing device, storage medium, and data search method |
CN105988996A (zh) * | 2015-01-27 | 2016-10-05 | 腾讯科技(深圳)有限公司 | 一种索引文件生成方法及装置 |
CN106326295A (zh) * | 2015-07-01 | 2017-01-11 | 中兴通讯股份有限公司 | 语义数据的存储方法及装置 |
CN110019646A (zh) * | 2017-10-12 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 一种建立索引的方法和装置 |
CN110019211A (zh) * | 2017-11-27 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 关联索引的方法、装置和系统 |
CN108874924A (zh) * | 2018-05-31 | 2018-11-23 | 康键信息技术(深圳)有限公司 | 搜索服务的创建方法、装置及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
高海宾: "基于SQL Server数据库索引的创建与优化分析", 《九江学院学报(自然科学版)》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021012553A1 (zh) * | 2019-07-25 | 2021-01-28 | 深圳壹账通智能科技有限公司 | 一种数据处理方法及相关设备 |
CN112988692B (zh) * | 2019-12-13 | 2024-05-07 | 阿里巴巴集团控股有限公司 | 数据处理方法及装置 |
CN112988692A (zh) * | 2019-12-13 | 2021-06-18 | 阿里巴巴集团控股有限公司 | 数据处理方法及装置 |
CN111125176B (zh) * | 2019-12-20 | 2023-10-03 | 北京百度网讯科技有限公司 | 一种业务数据搜索方法、装置、电子设备和存储介质 |
CN111125176A (zh) * | 2019-12-20 | 2020-05-08 | 北京百度网讯科技有限公司 | 一种业务数据搜索方法、装置、电子设备和存储介质 |
CN111274350A (zh) * | 2020-02-03 | 2020-06-12 | 广州极尚网络技术有限公司 | 数据处理方法、装置、计算机设备和存储介质 |
CN111914126A (zh) * | 2020-07-22 | 2020-11-10 | 浙江乾冠信息安全研究院有限公司 | 用于索引的网络安全大数据的处理方法、设备及存储介质 |
CN111949479A (zh) * | 2020-07-31 | 2020-11-17 | 中国工商银行股份有限公司 | 交互系统和索引创建情况的确定方法、设备 |
CN111949479B (zh) * | 2020-07-31 | 2023-08-25 | 中国工商银行股份有限公司 | 交互系统和索引创建情况的确定方法、设备 |
CN112100414A (zh) * | 2020-09-11 | 2020-12-18 | 深圳力维智联技术有限公司 | 数据处理方法、装置、系统与计算机可读存储介质 |
CN112100414B (zh) * | 2020-09-11 | 2024-02-23 | 深圳力维智联技术有限公司 | 数据处理方法、装置、系统与计算机可读存储介质 |
CN113190623A (zh) * | 2021-05-14 | 2021-07-30 | 京东数科海益信息科技有限公司 | 数据处理方法、装置、服务器和存储介质 |
CN113190623B (zh) * | 2021-05-14 | 2024-05-17 | 京东科技信息技术有限公司 | 数据处理方法、装置、服务器和存储介质 |
CN113760931B (zh) * | 2021-08-20 | 2023-12-29 | 济南浪潮数据技术有限公司 | 一种资源信息的存取方法、装置、设备和介质 |
CN113760931A (zh) * | 2021-08-20 | 2021-12-07 | 济南浪潮数据技术有限公司 | 一种资源信息的存取方法、装置、设备和介质 |
CN113626443B (zh) * | 2021-08-26 | 2024-03-15 | 企查查科技股份有限公司 | 索引的数据处理方法、装置、计算机设备和存储介质 |
CN113626443A (zh) * | 2021-08-26 | 2021-11-09 | 企查查科技有限公司 | 索引的数据处理方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2021012553A1 (zh) | 2021-01-28 |
CN110489417B (zh) | 2023-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110489417A (zh) | 一种数据处理方法及相关设备 | |
US11394805B1 (en) | Automatic discovery of API information | |
CN110489391A (zh) | 一种数据处理方法及相关设备 | |
WO2019192103A1 (zh) | 并发访问控制方法、装置、终端设备及介质 | |
CN113489772B (zh) | 网络请求处理方法及装置、电子设备 | |
CN108509523A (zh) | 区块链数据的结构化处理方法、设备及可读存储介质 | |
CN110049503B (zh) | 一种获取数据的方法和设备 | |
CN108259425A (zh) | 攻击请求的确定方法、装置及服务器 | |
CN109635550B (zh) | 集群数据的权限校验方法、网关及系统 | |
CN112887121B (zh) | 一种管理网络服务的方法、设备及系统 | |
CN110247857B (zh) | 限流方法及装置 | |
CN108123820A (zh) | 一种网络设备信息采集方法和装置 | |
CN110049031A (zh) | 一种接口安全认证方法及服务器、认证中心服务器 | |
CN108595505A (zh) | 数据查询的方法和装置 | |
WO2021017907A1 (zh) | 一种优化的微服务间通信的方法及装置 | |
CN105592141B (zh) | 一种连接数控制方法及装置 | |
US20100036892A1 (en) | Determination of an updated data source from disparate data sources | |
CN114553960A (zh) | 一种数据缓存方法、装置、设备及存储介质 | |
US20100218202A1 (en) | Method and Apparatus for Case-Based Service Composition | |
WO2019006998A1 (zh) | Node.js权限控制方法、存储介质、电子设备及系统 | |
CN105991568A (zh) | 一种代理实现装置 | |
CN103036895A (zh) | 一种状态跟踪方法及系统 | |
CN108600349B (zh) | 连接池中的连接管理方法及装置 | |
CN110347659A (zh) | 数据处理方法和装置、交易数据处理方法和装置 | |
KR101888131B1 (ko) | Dds-dbms 연동 도구의 실시간 변경 데이터 발간 서비스 수행 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |