CN113392121A - 一种数据查询方法、装置、设备和存储介质 - Google Patents

一种数据查询方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN113392121A
CN113392121A CN202011427858.8A CN202011427858A CN113392121A CN 113392121 A CN113392121 A CN 113392121A CN 202011427858 A CN202011427858 A CN 202011427858A CN 113392121 A CN113392121 A CN 113392121A
Authority
CN
China
Prior art keywords
information
query
data
aggregation
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011427858.8A
Other languages
English (en)
Inventor
王家彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011427858.8A priority Critical patent/CN113392121A/zh
Publication of CN113392121A publication Critical patent/CN113392121A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/545Interprogram communication where tasks reside in different layers, e.g. user- and kernel-space

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据查询方法、装置、设备和存储介质,所述方法涉及大数据和机器学习,所述方法包括:数据库中间层获取查询配置信息,生成与查询配置信息对应的聚合查询接口。数据库中间层利用聚合查询接口获取聚合查询请求,聚合查询请求包括查询文本信息和待查询业务,在搜索引擎中对查询文本信息进行分词处理,得到分词文本信息,并根据查询配置信息和分词文本信息,得到待查询业务对应的目标业务数据。该方法可以在数据库中间层中进行简单配置,就可以生成与查询配置信息对应的聚合查询接口,对数据库中的业务数据进行聚合查询,提高了数据库的通用性,同时也提高了业务数据查询的效率和准确性。

Description

一种数据查询方法、装置、设备和存储介质
技术领域
本申请涉及大数据领域,尤其涉及一种数据查询方法、装置、设备和存储介质。
背景技术
随着云时代的来临,大数据作为规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,也吸引了越来越多的关注。数据库中存储的业务数据为定制化开发的业务数据,当增加新的业务数据到数据库中时,需要对新的业务数据进行定制化开发,单独开发与新的业务数据对应的数据接口,使得数据库的通用性降低。且在现有技术中,数据库一般只能提供普通的查询功能,不能同时搜索多个不同数据结构的业务数据,从而降低了业务数据查询的准确性。
发明内容
本申请提供了一种数据查询方法、装置、设备和存储介质,可以提高数据库的通用性和业务数据查询的准确性。
一方面,本申请提供了一种数据查询方法,所述方法包括:
获取查询配置信息,所述查询配置信息表征聚合查询对应的数据协议;
生成与所述查询配置信息对应的聚合查询接口;
利用所述聚合查询接口获取聚合查询请求,所述聚合查询请求包括查询文本信息和多个待查询业务信息;
对所述查询文本信息进行分词处理,得到分词文本信息;
根据所述查询配置信息和所述分词文本信息,查询所述待查询业务信息对应的目标业务数据。
另一方面提供了一种数据查询装置,所述装置包括:配置信息获取模块、接口生成模块、查询请求获取模块、分词处理模块和聚合查询模块;
所述配置信息获取模块用于获取查询配置信息,所述查询配置信息表征聚合查询对应的数据协议;
所述接口生成模块用于生成与所述查询配置信息对应的聚合查询接口;
所述查询请求获取模块用于利用所述聚合查询接口获取聚合查询请求,所述聚合查询请求包括查询文本信息和多个待查询业务信息;
所述分词处理模块用于对所述查询文本信息进行分词处理,得到分词文本信息;
所述聚合查询模块用于根据所述查询配置信息和所述分词文本信息,查询所述待查询业务信息对应的目标业务数据。
另一方面提供了一种电子设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述所述的一种数据查询方法。
另一方面提供了一种计算机可读存储介质,所述存储介质包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述所述的一种数据查询方法。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述数据查询的各种可选实现方式中提供的方法。
本申请提供的一种数据查询方法、装置、设备和存储介质,所述方法包括:数据库中间层获取查询配置信息,生成与查询配置信息对应的聚合查询接口。数据库中间层利用聚合查询接口获取聚合查询请求,聚合查询请求包括查询文本信息和待查询业务,在搜索引擎中对查询文本信息进行分词处理,得到分词文本信息,并根据查询配置信息和分词文本信息,得到待查询业务对应的目标业务数据。该方法可以在数据库中间层中进行简单配置,就可以生成与查询配置信息对应的聚合查询接口,进行聚合查询,提高数据库通用性,同时也提高了数据查询的效率和准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种数据查询方法的应用场景示意图;
图2为本申请实施例提供的一种数据查询方法中服务器中间层和数据库的分布式存储示意图;
图3为本申请实施例提供的一种数据查询方法的流程图;
图4为本申请实施例提供的一种数据查询方法的分词处理的流程图;
图5为本申请实施例提供的一种数据查询方法中聚合查询的流程图;
图6为本申请实施例提供的一种数据查询方法中聚合查询条件字段的配置界面示意图;
图7为本申请实施例提供的一种数据查询方法中对聚合查询结果进行条件过滤的流程图;
图8为本申请实施例提供的一种数据查询方法中的流程图;
图9为本申请实施例提供的一种数据查询方法的训练数据模型的示意图;
图10为本申请实施例提供的一种数据查询方法应用于看一看场景中的逻辑示意图;
图11为本申请实施例提供的一种数据查询方法在服务器侧的结构示意图;
图12为本申请实施例提供的一种数据查询装置的结构示意图;
图13为本申请实施例提供的一种用于实现本申请实施例所提供的方法的设备的硬件结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。而且,术语“第一”、“第二”等适用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
请参见图1,其显示了本申请实施例提供的一种数据查询方法的应用场景示意图,该应用场景包括用户端110和服务器120,服务器120包括数据库中间层1201和数据层1202。用户端110进行聚合协议配置,使得数据库中间层1201获取查询配置信息。数据库中间层1201根据查询配置信息生成对应的聚合查询接口,用户端110基于聚合查询接口输入聚合查询请求到数据库中间层1201,数据库中间层1201获取聚合查询请求中的查询文本信息和多个待查询业务信息,并在数据层1202对查询文本信息进行分词处理,得到分词文本信息。数据层1202根据查询配置信息和分词文本信息,查询待查询业务信息对应的目标业务数据。
在本申请实施例中,用户端110包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备等类型的实体设备,也可以包括运行于实体设备中的软体,例如应用程序等。本申请实施例中实体设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、Unix、windows等。该用户端110还包括UI(User Interface,用户界面)层,该用户端110通过UI层进行聚合协议配置和目标业务数据的显示,另外,基于API(ApplicationProgramming Interface,应用程序接口)将聚合查询请求发送给服务器120。
在本申请实施例中,服务器120可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。服务器120可以包括有网络通信单元、处理器和存储器等等。具体的,服务器120可以用于获取查询配置信息,并生成对应的聚合查询接口,利用聚合查询接口获取聚合查询请求,并根据查询配置信息和聚合查询请求,查询待查询业务信息对应的目标业务数据。
此外,需要说明的是,图1中的服务器中间层1201和数据层1202仅仅是一种示例,本说明书实施例中服务器120中服务器中间层1201和数据层1202还可以包括区块链网络对应的分布式数据库。具体的如图2所示,可以包括分布式节点201、202、203、204、205和206。各个分布式节点之间可以通过通信链路进行连接,比如可以通过有线通信链路或无线通信链路进行连接等。
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
服务器120提供典型应用的基本能力和实现框架,开发人员可以基于这些基本能力,叠加业务的特性,完成业务逻辑的区块链实现。服务器120提供基于区块链方案的应用服务给用户端110进行使用。
在本申请实施例中,服务器120利用机器学习中的分词技术对查询文本信息进行分词,服务器120根据分词的结果进行后续的聚合查询步骤。机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
请参见图3,其显示了一种数据查询方法,可应用于服务器侧,该方法包括:
S310.获取查询配置信息,查询配置信息表征聚合查询对应的数据协议;
具体地,查询配置信息为聚合查询对应的数据协议,数据协议可以包括多个字段,字段可以包括数据标识信息、业务名称、业务描述、业务类型、浏览量等信息。数据协议和字段构成对应的业务数据的数据结构。查询配置的方式可以为增加聚合查询所需要的字段到数据协议中。
S320.生成与查询配置信息对应的聚合查询接口;
具体地,根据查询配置信息,生成对应的聚合查询接口。用户端可以通过聚合查询接口对数据层中的业务数据进行聚合查询的操作,数据层可以通过聚合查询接口返回与查询配置信息中的字段对应的目标业务数据到客户端。聚合查询接口由数据库中间层的超文本传输协议(HyperText Transfer Protocol,HTTP)服务生成,数据库中间层为“协议即服务”的数据库中间层。聚合查询接口与HTTP服务中的HTTP协议具有对应的类型。例如,当数据库中间层的HTTP服务为表性状态转移(Representational State Transfer,Restful)风格的协议时,聚合查询接口也为restful风格的接口。Restful为基于HTTP协议的网络应用程序的设计风格和开发方式,适用于数据库中间层作为业务使能接口的场景,可以实现用户端调用业务数据的功能。
数据库中间层包括HTTP服务,HTTP服务用于根据配置的数据协议,生成与用户端将要执行的数据操作对应的接口,以获取用户端发送的数据操作请求并反馈数据操作的结果。作为一个可选的实施例,当数据操作为聚合查询时,HTTP服务用于根据配置的与聚合查询对应的数据协议,生成与用户端将要执行的聚合查询对应的接口,以获取用户端发送的聚合查询请求并反馈聚合查询的结果。数据库中间层还可以对查询配置信息进行协议检查,得到协议检查结果,数据库中间层还可以将查询配置信息转换为数据库内部适用的数据协议,可以基于数据库内部适用的数据协议,获取数据库内部的业务数据。数据库中间层对数据层中的数据库进行一层封装,以HTTP服务生成的聚合查询接口向用户端提供数据访问功能。
数据层包括搜索引擎和数据库。搜索引擎中具有搜索文本信息,搜索文本信息为存储在搜索引擎中的业务数据的文本字段信息,搜索文本信息的标识信息为第二数据标识信息。数据库中具有数据库内容信息,数据库内容信息为存储在数据库中的业务数据,数据库内容信息的标识信息为第一数据标识信息。搜索引擎与数据库中存储的数据是一一对应的,可以通过第一数据标识信息和第二数据标识信息进行对应。执行聚合查询时,先从搜索引擎中获取搜索文本信息,反馈搜索文本信息对应的第二数据标识信息到用户端。再基于搜索文本信息,确定数据库中是否存在与搜索文本信息对应的数据库内容信息,进行确定时可以通过第一数据标识信息和第二数据标识信息进行确定,再将确定后的数据库内容信息反馈到用户端,使得用户端在点击搜索引擎反馈的第二数据标识信息时,可以获取对应的数据库内容信息。
数据库中间层可以通过数据协议配置,生成对应的接口的方式,使得用户可以基于接口进行数据操作,不需要在增加新的业务时进行额外的开发,提高了数据库的通用性,并可以实现聚合查询,提高了数据库中间层的查询性能,从而提高了数据查询的效率和准确性。
S330.利用聚合查询接口获取聚合查询请求,聚合查询请求包括查询文本信息和多个待查询业务信息;
S340.对查询文本信息进行分词处理,得到分词文本信息;
进一步地,请参见图4,对查询文本信息进行分词处理,得到分词文本信息包括:
S400.对查询文本信息中的字符信息和预设的词典数据进行匹配;
S410.将查询文本信息中与词典数据中单字词匹配的字符信息作为目标单字词信息;
S420.将查询文本信息中与词典数据中多字词的词首匹配的字符信息作为前缀信息;
S430.将查询文本信息中在前缀信息之后的字符信息作为后缀信息;
S440.对后缀信息与前缀信息进行组合,得到组合词信息集;
S450.对组合词信息集和词典数据进行匹配;
S460.若组合词信息集中任一组合词信息与词典数据中多字词的词首匹配,则基于与多字词的词首匹配的组合词信息更新前缀信息,并基于更新后的前缀信息更新后缀信息;
S470.重复对更新后的前缀信息和更新后的后缀信息进行组合,得到更新后的组合词信息集,并对更新后的组合词信息集和词典数据进行匹配的步骤,直到更新后的组合词信息集中组合词信息的后缀信息与词典数据中多字词的词尾匹配,将更新后的组合词信息集中后缀信息与词典数据中多字词的词尾匹配的组合词信息作为目标多字词信息;
S480.将目标单字词信息和目标多字词信息作为分词文本信息。
具体地,在进行分词处理时,可以基于搜索引擎elasticsearch的插件ik分词器进行分词。elasticsearch是一个基于全文搜索引擎(Lucene)的搜索服务器,可以提供基于RESTful的接口的分布式搜索和数据分析引擎。在利用ik分词器进行分词时,先将查询文本信息划分为字符信息,
将字符信息与词典数据中单字词进行匹配,如果字符信息和单字词匹配成功,就将匹配成功的字符信息作为目标单字词信息输出。如果字符信息和多字词的词首匹配成功,则将与多字词的词首匹配成功的字符信息作为前缀信息,将查询文本信息中前缀信息的之后的字符信息作为后缀信息。组合后缀信息与前缀信息,得到组合词信息集,再匹配组合词信息集中的组合词信息与词典数据。若可以匹配到词典数据中的多字词,则将该组合词信息作为目标多字词信息输出。
由于还可能存在两个字符信息以上的词汇,或者由多个词组成的固定短语,例如“前门拒虎,后门进狼”中“前门”,“拒虎”,“虎”,“后门”,“进”,“狼”都可以作为词汇被划分出来,同时“前门拒虎,后门进狼”也是一个固定的短语搭配,“前门拒虎”和“后门进狼”都可以作为一个词汇。因此在划分出两个字符的多字词后,如果这两个字符的组合词信息还可以与词典数据中多字词的词首匹配,则根据与词典数据中多字词的词首匹配的组合词信息更新前缀信息,并更新后缀信息,将这个组合词信息作为更新后的前缀信息,将查询文本信息中这个组合词之后的字符信息作为更新后的后缀信息。重新组合更新后的前缀信息和更新后的后缀信息,得到新的组合词信息集。再匹配新的组合词信息集中的组合词信息与词典数据,当组合词信息的后缀信息与词典数据中多字词的词尾匹配成功时,将后缀信息与词典数据中多字词的词尾匹配成功的组合词作为目标多字词信息输出。
目标单字词信息和目标多字词信息组成分词文本信息。例如,对“前门拒虎,后门进狼”进行分词后,分词处理后得到的分词文本信息应该为“前”,“前门”,“拒”,“虎”“前门拒虎”,“后”,“后门”,“进”,“狼”,“后门进狼”。
对搜索文本信息进行分词处理,得到分词文本信息,并在后续的查询步骤中用分词文本信息与搜索文本信息进行匹配,可以提高数据查询的准确性和搜索效率。
S350.根据查询配置信息和分词文本信息,查询待查询业务信息对应的目标业务数据。
进一步地,请参见图5,查询配置信息包括基础查询协议和聚合查询协议,根据查询配置信息和分词文本信息,查询待查询业务信息对应的目标业务数据包括:
S510.获取待查询业务信息对应的待查询业务的查询权限;
S520.根据聚合查询协议,确定聚合查询条件字段;
S530.根据基础查询协议,确定基础查询字段;
S540.基于查询权限,从搜索文本信息中查询与基础查询字段、聚合查询条件字段和分词文本信息分别匹配的搜索文本信息,搜索文本信息为存储在搜索引擎中的业务数据的文本字段信息;
S550.将与基础查询字段、聚合查询条件字段和分词文本信息匹配的搜索文本信息作为聚合查询结果;
S560.将聚合查询结果对应的业务数据作为目标业务数据,目标业务数据为具有不同数据协议的业务数据。
具体地,聚合查询可以同时搜索多个不同数据协议的业务数据,因此具有多个待查询业务信息。在进行聚合查询之前,用户端需要获取这些待查询业务信息的查询权限,若用户端不能获取其中一个待查询业务信息的查询权限,则用户端不能对该待查询业务信息进行查询。
聚合查询协议包括聚合查询条件字段,请参见图6,如图6所示为聚合查询条件字段的配置界面示意图,只有包括了聚合查询条件字段的业务数据可以进行聚合查询,且业务数据中的聚合查询条件字段的数据类型要一致。例如,聚合查询条件字段是浏览量,数据类型为整型,业务数据A中具有浏览量字段,数据类型为整型。业务数据B中具有浏览量字段,数据类型为整型。业务数据C中缺少浏览量字段,业务数据D中的浏览量字段的数据类型为浮点型,则业务数据A和业务数据B可以作为目标业务数据传输给用户端,但是业务数据C和业务数据D是不能作为规定了聚合查询条件字段是浏览量的本次聚合查询的结果,因此不能作为目标业务数据传输到用户端。
聚合查询结果对应的业务数据可以为具有不同数据协议的业务数据,这些业务数据仅需要满足均包括聚合查询协议即可。
基础查询协议包括基础查询字段,基础查询字段可以是标题、作者或摘要等字段。与基础查询字段对应的内容包括查询文本信息,可以用于进行分词处理,得到分词文本信息,与基础查询字段对应的内容还包括聚合查询中发送到用户端的用于展示的目标业务数据内容。
基于查询权限进行聚合查询时,将分词文本信息作为关键词与搜索引擎中的搜索文本信息进行匹配,将匹配到的结果中与基础查询字段和聚合查询条件字段匹配的结果作为聚合查询结果。
将聚合查询结果对应的业务数据作为目标业务数据,聚合查询结果对应的目标业务数据可以从数据库中获取。在获取目标业务数据时,数据库中间层可以将搜索引擎中搜索时使用的基础查询协议和聚合查询协议转换为数据库内部适用的数据协议,基于数据库内部适用的数据协议,从数据库中获取与聚合查询结果对应的业务数据。
通过聚合查询的方法,可以一次性获取多个搜索文本信息,提高了数据查询的效率,同时只有符合聚合查询条件字段的搜索文本信息才可以作为聚合查询结果,可以提高数据查询的准确性。
进一步地,请参见图7,聚合查询请求还包括业务数据范围信息,根据查询配置信息和分词文本信息,查询待查询业务信息对应的目标业务数据还包括:
S710.获取待查询业务信息对应的待查询业务的查询权限;
S720.根据聚合查询协议,确定聚合查询条件字段;
S730.根据基础查询协议,确定基础查询字段;
S740.基于查询权限,从搜索文本信息中查询与基础查询字段、聚合查询条件字段和分词文本信息分别匹配的搜索文本信息,搜索文本信息为存储在搜索引擎中的业务数据的文本字段信息;
S750.将与基础查询字段、聚合查询条件字段和分词文本信息匹配的搜索文本信息作为聚合查询结果;
S760.对聚合查询请求中的业务数据范围信息进行解析,得到搜索引擎可识别的过滤条件信息;
S770.从聚合查询结果中筛选与过滤条件信息匹配的聚合查询结果;
将聚合查询结果对应的业务数据作为目标业务数据包括:
S780.将匹配的聚合查询结果对应的业务数据作为目标业务数据。
具体地,业务范围信息是通过操作符对聚合查询结果的范围进行限定的信息,过滤条件信息是搜索引擎可识别的业务范围信息。根据过滤条件信息,在搜索引擎中筛选符合操作符限定的范围的聚合查询结果,从而根据筛选后的聚合查询结果得到符合用户端的需求目标业务数据,操作符可以如下表所示:
Figure BDA0002825612630000121
对业务范围信息进行解析,将业务范围信息转换为搜索引擎可识别的过滤条件信息,从聚合查询结果中筛选与过滤条件信息匹配的聚合查询结果,将与过滤条件信息匹配的聚合查询结果对应的业务数据作为目标业务数据。作为一个具体的实施例,过滤条件信息为获取前100个聚合查询结果,则根据该过滤条件信息,筛选出前100个聚合查询结果,将前100个聚合查询结果对应的业务数据作为目标业务数据。
通过条件过滤,可以对聚合查询结果进行筛选,获取更符合用户需求的聚合查询结果,提高了数据查询的准确性。
进一步地,将聚合查询结果对应的业务数据作为目标业务数据包括:
S810.查询数据库内容信息中与聚合查询结果对应的目标数据库内容信息,数据库内容信息为存储在数据库中的业务数据;
S820.将目标数据库内容信息作为目标业务数据。
具体地,请参见图8,如图8所示为聚合查询的查询流程示意图,服务器在搜索引擎中获取聚合查询结果后,在数据库中对聚合查询结果以存在性检查的方式对数据进行一致性校验,以确定数据的一致性。存在性检查指的是在数据库的数据库内容信息中,确定聚合查询结果对应的目标数据库内容信息,将对应的目标数据库内容信息作为目标业务数据,发送到用户端,因此可以确定聚合查询结果一定在数据库中存在。若某一聚合查询结果没有对应的目标数据库内容信息,则该聚合查询结果为非法结果,无法反馈对应的目标数据库内容信息到用户端。
作为一个可选的实施例,可以获取搜索引擎中的聚合查询结果对应的的第二数据标识信息,在数据库中查询与第二数据标识信息对应的第一数据标识信息,将该第一数据标识信息对应的数据库内容信息作为与搜索结果对应的目标数据库内容信息,将对应的目标数据库内容信息作为目标业务数据,发送到用户端。若根据某一第二数据标识信息没有对应的第一数据标识信息,则该第二数据标识信息对应的聚合查询结果没有对应的目标数据库内容信息,该第二数据标识信息对应的聚合查询结果为非法结果,无法反馈对应的业务数据到用户端。
在运行中对数据进行一致性校验,使得聚合查询结果均为可以从数据库中得到对应的业务数据的合法结果,提高了数据查询的合理性,避免产生非法结果。
进一步地,请参见图9,该方法还包括:
S910.获取新增数据库内容信息的文本字段信息;
S920.将文本字段信息组成新增数据库内容信息对应的搜索文本信息;
S930.存储搜索文本信息到搜索引擎中。
具体地,基于数据库中间层生成的接口还可以为新增数据接口、修改数据接口、删除数据接口和基础查询数据接口,可以进行与不同的接口对应的数据操作。当在进行数据协议配置时增加了聚合查询协议时,才可以生成聚合查询数据接口,若只有基础查询协议,则生成的是基础查询数据接口,不能进行聚合查询。
在通过数据库中间层生成新增数据接口,利用新增数据接口增加业务数据,也就是在数据库中存储新增数据库内容信息。搜索引擎可以根据新增数据库内容信息对应的数据库内适用的数据协议规定的存在文本内容的字段,获取新增数据库内容信息中的文本字段信息,将文本字段信息组成搜索文本信息后存储,搜索引擎可以对搜索文本信息进行分词和索引,得到与搜索文本信息关联的分词数据,在聚合查询的步骤中,将分词文本信息和分词数据进行比对,就可以确定与分词文本信息匹配的搜索文本信息。文本字段信息可以包括作者、摘要、标题等字段对应的内容。
若通过数据库中间层生成修改数据接口,利用修改数据接口修改业务数据,也就是对数据库中的数据库内容信息进行修改。若修改了数据库内容信息的文本字段信息,搜索引擎则会重新获取修改后的数据库内容信息的文本字段信息,根据修改后的数据库内容信息的文本字段信息对搜索文本信息进行更新。
在通过数据库中间层生成删除数据接口,利用删除数据接口删除业务数据,也就是删除数据库中的待删除数据库内容信息。获取数据库中待删除数据库内容信息对应的第一数据标识信息,根据第一数据标识信息确定对应的第二数据标识信息,删除第一数据标识信息对应的数据库内容信息,删除搜索引擎中的第二数据标识信息对应的搜索文本信息。
在新增数据、修改数据和删除数据时,可能会出现新增数据失败、修改数据失败和删除数据失败的情况,导致搜索引擎和数据库中的数据不一致,因此需要周期性地对数据进行一致性校验。进一步地,请参见图10,进行一致性校验的方法包括:
S1010.将数据库中的数据库内容信息的文本字段信息传输到搜索引擎中,以使得搜索引擎根据数据库内容信息的文本字段信息,更新搜索文本信息;
和/或;
S1020.获取数据库中的数据库内容信息对应的第一数据标识信息;
S1020.获取搜索引擎中的搜索文本信息对应的第二数据标识信息;
S1030.基于第一数据标识信息和第二数据标识信息,对数据库和搜索引擎中的数据进行一致性校验,以使得搜索引擎删除校验失败的第二数据标识信息对应的搜索文本信息。
具体地,除了在数据层的数据库和搜索引擎运行时,对数据库和搜索引擎进行数据一致性校验之外,还可以根据预设的校验周期,对数据库和搜索引擎进行数据一致性校验。
作为一个可选的实施例,可以将数据库中的数据库内容信息的文本字段信息传输到搜索引擎中,覆盖搜索引擎中的搜索文本信息,从而对搜索文本信息进行更新,使得搜索文本信息与数据库内容信息保持一致。例如,数据库中有数据库内容信息X和数据库内容信息Y,数据库内容信息X的文本字段信息为X1,数据库内容信息Y的文本字段信息为Y1,搜索引擎中有搜索文本信息X1。将文本字段信息X1和文本字段信息Y1传输到搜索引擎中,搜索引擎覆盖原本的搜索文本信息X1的数据,形成搜索文本信息X1和搜索文本信息Y1,与数据库内容信息保持一致。
作为一个可选的实施例,可以获取数据库中数据库内容信息对应的第一数据标识信息和搜索引擎中的搜索文本信息对应的第二数据标识信息,将第一数据标识信息和第二数据标识信息进行比对,若不存在与第二数据标识信息对应的第一数据标识信息,则可以确定第二数据标识信息对应的搜索文本信息为多余数据,将确定为多余数据的搜索文本信息删除,完成一致性校验。例如,数据库内容信息X对应第一数据标识信息x,搜索文本信息X1对应第二数据标识信息x1,搜索文本信息Y1对应第二数据标识信息y1。其中,第二数据标识信息x1和第一数据标识信息x对应,则搜索文本信息X1和数据库内容信息X对应。不存在与第二数据标识信息y1对应的第一数据标识信息,则搜索文本信息Y1是多余数据,从搜索引擎中删除搜索文本信息Y1。
周期性地对搜索引擎和数据库的数据进行一致性校验,可以使得聚合查询结果均为可以从数据库中得到对应的业务数据的合法结果,提高了数据查询的合理性,避免产生非法结果。
作为一个可选的实施例,请参见图11,如图11所示为服务器侧的结构示意图,由数据库中间层生成新增数据接口、删除数据接口、修改数据接口、基础查询数据接口和聚合查询数据接口,根据聚合查询执行模块中的功能,在数据层中进行聚合查询。当进行聚合查询时,用户在服务器中的配置平台进行与聚合查询对应的数据协议的配置,将聚合查询需要的字段增加到数据协议中,得到查询配置信息。查询配置信息包括基础查询协议和聚合查询协议。服务器中间层根据查询配置信息,生成对应的聚合查询接口。用户通过聚合查询接口发送聚合查询请求,聚合查询请求中包括查询文本信息和多个待查询业务信息。数据库中间层确定用户具有待查询业务信息对应的查询权限后,服务器中的聚合查询执行模块将查询配置信息中文本字段对应的查询文本信息传输到搜索引擎,搜索引擎对查询文本信息进行分词处理,得到分词文本信息。搜索引擎查询与分词文本信息、基础查询协议和聚合查询协议对应的聚合查询结果。搜索引擎对存储的搜索文本信息均进行分词处理,得到分词数据,当分词数据与分词文本信息匹配时,可以确定为与分词文本信息匹配的初始查询结果,再从初始查询结果中确定与基础查询协议和聚合查询协议中规定的字段匹配的目标查询结果,将目标查询结果作为聚合查询结果。聚合查询执行模块还可以解析聚合查询请求中的业务范围信息,确定搜索引擎可识别的过滤条件信息,搜索引擎根据过滤条件信息,对聚合查询结果进行过滤。在确定聚合查询结果后,聚合查询执行模块还可以执行对聚合查询结果运行时的存在性检查,在数据库中查询与聚合查询结果对应的目标数据库内容信息,数据库中间层将目标数据库内容信息作为目标业务数据,利用聚合查询接口,将目标业务数据的摘要信息反馈给用户。
聚合查询执行模块还可以周期性地执行对数据库和搜索引擎中数据的一致性校验,可以删除搜索引擎中的多余数据,或者用数据库中的数据覆盖搜索引擎中的数据的方法,使得数据库和搜索引擎的数据保持一致。
本申请实施例提出了一种数据查询方法,该方法包括:数据库中间层获取查询配置信息,生成与查询配置信息对应的聚合查询接口。数据库中间层利用聚合查询接口获取聚合查询请求,聚合查询请求包括查询文本信息和待查询业务,在搜索引擎中对查询文本信息进行分词处理,得到分词文本信息,并根据查询配置信息和分词文本信息,得到待查询业务对应的目标业务数据。该方法可以在数据库中间层中进行简单配置,就可以生成与查询配置信息对应的聚合查询接口,进行聚合查询,提高了数据库的通用性,同时提高了数据查询的准确性和数据查询的效率。该方法还通过运行时数据一致性检查和周期性数据一致性检查,提高了数据查询的合理性,避免产生非法结果
本申请实施例还提供了一种数据查询装置,请参见图12,该装置包括:配置信息获取模块1210、接口生成模块1220、查询请求获取模块1230、分词处理模块1240和聚合查询模块1250;
配置信息获取模块1210用于获取查询配置信息,查询配置信息表征聚合查询对应的数据协议;
接口生成模块1220用于生成与查询配置信息对应的聚合查询接口;
查询请求获取模块1230用于利用聚合查询接口获取聚合查询请求,聚合查询请求包括查询文本信息和多个待查询业务信息;
分词处理模块1240用于对所述查询文本信息进行分词处理,得到分词文本信息;
聚合查询模块1250用于根据查询配置信息和分词文本信息,查询待查询业务信息对应的目标业务数据。
进一步地,查询配置信息包括基础查询协议和聚合查询协议,聚合查询模块1250包括:查询权限获取单元、聚合查询条件获取单元、基础查询条件获取单元、搜索文本匹配单元、聚合查询结果获取单元和目标业务数据获取单元。
查询权限获取单元用于获取待查询业务信息对应的待查询业务的查询权限;
聚合查询条件获取单元用于根据聚合查询协议,确定聚合查询条件字段;
基础查询条件获取单元用于根据基础查询协议,确定基础查询字段;
搜索文本匹配单元用于基于查询权限,从搜索文本信息中查询与基础查询字段、聚合查询条件字段和分词文本信息分别匹配的搜索文本信息,搜索文本信息为存储在搜索引擎中的业务数据的文本字段信息;
聚合查询结果获取单元用于将与基础查询字段、聚合查询条件字段和分词文本信息匹配的搜索文本信息作为聚合查询结果;
目标业务数据获取单元用于将聚合查询结果对应的业务数据作为目标业务数据。
进一步地,聚合查询模块1250还包括:
过滤条件获取单元用于对聚合查询请求中的业务数据范围信息进行解析,得到搜索引擎可识别的过滤条件信息;
筛选单元用于从聚合查询结果中筛选与过滤条件信息匹配的聚合查询结果;
进一步地,目标业务数据获取单元还用于将匹配的聚合查询结果对应的业务数据作为目标业务数据。
进一步地,目标业务数据获取单元包括:业务数据查询单元
业务数据查询单元用于查询数据库内容信息中与聚合查询结果对应的目标数据库内容信息,数据库内容信息为存储在数据库中的业务数据,将目标数据库内容信息作为目标业务数据。
进一步地,该装置还包括:文本字段获取模块、搜索文本组成模块和搜索文本存储模块;
文本字段获取模块用于获取预存储的业务数据的文本字段信息;
搜索文本组成模块用于将文本字段信息组成预存储的业务数据对应的搜索文本信息;
搜索文本存储模块用于存储搜索文本信息到搜索引擎中。
进一步地,该装置还包括:搜索文本更新模块,第一数据标识获取模块、第二数据标识获取模块和一致性校验模块;
搜索文本更新模块用于将数据库中的数据库内容信息的文本字段信息传输到搜索引擎中,以使得搜索引擎根据数据库内容信息的文本字段信息,更新搜索文本信息;
和/或;
第一数据标识获取模块用于获取数据库中的数据库内容信息对应的第一数据标识信息;
第二数据标识获取模块用于获取搜索引擎中的搜索文本信息对应的第二数据标识信息;
一致性校验模块用于基于第一数据标识信息和第二数据标识信息,对数据库和搜索引擎中的数据进行一致性校验,以使得搜索引擎删除校验失败的第二数据标识信息对应的搜索文本信息。
进一步地,分词处理模块1240包括:单字词匹配单元、组合词获取单元、多字词匹配单元和分词文本确定单元。
单字词匹配单元用于对查询文本信息中的字符信息和预设的词典数据进行匹配,将查询文本信息中与词典数据中单字词匹配的字符信息作为目标单字词信息;
组合词获取单元用于将查询文本信息中与词典数据中多字词的词首匹配的字符信息作为前缀信息;将查询文本信息中在前缀信息之后的字符信息作为后缀信息;对后缀信息与前缀信息进行组合,得到组合词信息集;
多字词匹配单元用于对组合词信息集和词典数据进行匹配,若组合词信息集中任一组合词信息与词典数据中多字词的词首匹配,则基于与所多字词的词首匹配的组合词信息更新所述前缀信息,基于更新后的前缀信息更新后缀信息,重复对更新后的前缀信息和更新后的后缀信息进行组合,得到更新后的组合词信息集,并对更新后的组合词信息集和词典数据进行匹配的步骤,直到更新后的组合词信息集中组合词信息的后缀信息与词典数据中多字词的词尾匹配,将更新后的组合词信息集中后缀信息与词典数据中多字词的词尾匹配的组合词信息作为目标多字词信息;
分词文本确定单元用于将所述目标单字词信息和所述目标多字词信息作为所述分词文本信息。
上述实施例中提供的装置可执行本申请任意实施例所提供方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的一种数据查询方法。
本实施例还提供了一种计算机可读存储介质,该存储介质中存储有计算机可执行指令,该计算机可执行指令由处理器加载并执行本实施例上述的一种数据查询方法。
本实施例还提供了一种设备,该设备包括处理器和存储器,其中,该存储器存储有计算机程序,该计算机程序适于由该处理器加载并执行本实施例上述的一种数据查询方法。
该设备可以为计算机终端、移动终端或服务器,该设备还可以参与构成本申请实施例所提供的装置或系统。如图13所示,服务器13可以包括一个或多个(图中采用1302a、1302b,……,1302n来示出)处理器1302(处理器1302可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器1304、以及用于通信功能的传输装置1306。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图13所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器13还可包括比图13中所示更多或者更少的组件,或者具有与图13所示不同的配置。
应当注意到的是上述一个或多个处理器1302和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到服务器13中的其他元件中的任意一个内。
存储器1304可用于存储应用软件的软件程序以及模块,如本申请实施例中的方法对应的程序指令/数据存储装置,处理器1302通过运行存储在存储器1304内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的一种基于自注意力网络的时序行为捕捉框生成方法。存储器1304可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1304可进一步包括相对于处理器1302远程设置的存储器,这些远程存储器可以通过网络连接至服务器13。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置1306用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端13的通信供应商提供的无线网络。在一个实例中,传输装置1306包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置1306可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与服务器13的用户界面进行交互。
本说明书提供了如实施例或流程图的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤和顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或中断产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
本实施例中所示出的结构,仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比示出的更多或更少的部件,或者组合某些部件,或者具有不同的部件的布置。应当理解到,本实施例中所揭露的方法、装置等,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分仅仅为一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元模块的间接耦合或通信连接。
基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例该方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员还可以进一步意识到,结合本说明书所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但这种实现不应认为超出本申请的范围。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种数据查询方法,其特征在于,所述方法包括:
获取查询配置信息,所述查询配置信息表征聚合查询对应的数据协议;
生成与所述查询配置信息对应的聚合查询接口;
利用所述聚合查询接口获取聚合查询请求,所述聚合查询请求包括查询文本信息和多个待查询业务信息;
对所述查询文本信息进行分词处理,得到分词文本信息;
根据所述查询配置信息和所述分词文本信息,查询所述待查询业务信息对应的目标业务数据。
2.根据权利要求1所述的数据查询方法,其特征在于,所述查询配置信息包括基础查询协议和聚合查询协议,所述根据所述查询配置信息和所述分词文本信息,查询所述待查询业务信息对应的目标业务数据包括:
获取所述待查询业务信息对应的待查询业务的查询权限;
根据所述聚合查询协议,确定聚合查询条件字段;
根据所述基础查询协议,确定基础查询字段;
基于所述查询权限,从搜索文本信息中查询与所述基础查询字段、所述聚合查询条件字段和所述分词文本信息分别匹配的搜索文本信息,所述搜索文本信息为存储在搜索引擎中的业务数据的文本字段信息;
将所述与所述基础查询字段、所述聚合查询条件字段和所述分词文本信息匹配的搜索文本信息作为聚合查询结果;
将所述聚合查询结果对应的业务数据作为所述目标业务数据,所述目标业务数据为具有不同数据协议的业务数据。
3.根据权利要求2所述的数据查询方法,其特征在于,所述聚合查询请求还包括业务数据范围信息,在所述将所述聚合查询结果对应的业务数据作为所述目标业务数据之前,还包括:
对所述聚合查询请求中的业务数据范围信息进行解析,得到所述搜索引擎可识别的过滤条件信息;
从所述聚合查询结果中筛选与所述过滤条件信息匹配的聚合查询结果;
所述将所述聚合查询结果对应的业务数据作为所述目标业务数据包括:
将所述匹配的聚合查询结果对应的业务数据作为所述目标业务数据。
4.据权利要求2或3所述的数据查询方法,其特征在于,所述将所述聚合查询结果对应的业务数据作为所述目标业务数据包括:
查询数据库内容信息中与所述聚合查询结果对应的目标数据库内容信息,所述数据库内容信息为存储在数据库中的业务数据;
将所述目标数据库内容信息作为目标业务数据。
5.根据权利要求1所述的数据查询方法,其特征在于,所述方法还包括:
获取新增数据库内容信息的文本字段信息;
将所述文本字段信息组成所述新增数据库内容信息对应的搜索文本信息;
存储所述搜索文本信息到搜索引擎中。
6.根据权利要求1所述的数据查询方法,其特征在于,所述方法还包括:
将数据库中的数据库内容信息的文本字段信息传输到搜索引擎中,以使得所述搜索引擎根据所述数据库内容信息的文本字段信息,更新搜索文本信息;
和/或;
获取所述数据库中的数据库内容信息对应的第一数据标识信息;
获取所述搜索引擎中的搜索文本信息对应的第二数据标识信息;
基于所述第一数据标识信息和所述第二数据标识信息,对所述数据库和所述搜索引擎中的数据进行一致性校验,以使得所述搜索引擎删除校验失败的第二数据标识信息对应的搜索文本信息。
7.根据权利要求1所述的数据查询方法,其特征在于,所述对所述查询文本信息进行分词处理,得到分词文本信息包括:
对所述查询文本信息中的字符信息和预设的词典数据进行匹配;
将所述查询文本信息中与所述词典数据中单字词匹配的字符信息作为目标单字词信息;
将所述查询文本信息中与所述词典数据中多字词的词首匹配的字符信息作为前缀信息;
将所述查询文本信息中在所述前缀信息之后的字符信息作为后缀信息;
对所述后缀信息与所述前缀信息进行组合,得到组合词信息集;
对所述组合词信息集和所述词典数据进行匹配;
若所述组合词信息集中任一组合词信息与所述词典数据中多字词的词首匹配,则基于与所述多字词的词首匹配的组合词信息更新所述前缀信息;
基于更新后的前缀信息更新所述后缀信息;
重复对所述更新后的前缀信息和所述更新后的后缀信息进行组合,得到更新后的组合词信息集,并对所述更新后的组合词信息集和所述词典数据进行匹配的步骤,直到所述更新后的组合词信息集中组合词信息的后缀信息与所述词典数据中多字词的词尾匹配,将所述更新后的组合词信息集中后缀信息与所述词典数据中多字词的词尾匹配的组合词信息作为目标多字词信息;
将所述目标单字词信息和所述目标多字词信息作为所述分词文本信息。
8.一种数据查询装置,其特征在于,所述装置包括:配置信息获取模块、接口生成模块、查询请求获取模块、分词处理模块和聚合查询模块;
所述配置信息获取模块用于获取查询配置信息,所述查询配置信息表征聚合查询对应的数据协议;
所述接口生成模块用于生成与所述查询配置信息对应的聚合查询接口;
所述查询请求获取模块用于利用所述聚合查询接口获取聚合查询请求,所述聚合查询请求包括查询文本信息和多个待查询业务信息;
所述分词处理模块用于对所述查询文本信息进行分词处理,得到分词文本信息;
所述聚合查询模块用于根据所述查询配置信息和所述分词文本信息,查询所述待查询业务信息对应的目标业务数据。
9.一种电子设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1-7任一项所述的一种数据查询方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1-7任一项所述的一种数据查询方法。
CN202011427858.8A 2020-12-09 2020-12-09 一种数据查询方法、装置、设备和存储介质 Pending CN113392121A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011427858.8A CN113392121A (zh) 2020-12-09 2020-12-09 一种数据查询方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011427858.8A CN113392121A (zh) 2020-12-09 2020-12-09 一种数据查询方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN113392121A true CN113392121A (zh) 2021-09-14

Family

ID=77616576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011427858.8A Pending CN113392121A (zh) 2020-12-09 2020-12-09 一种数据查询方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN113392121A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115563356A (zh) * 2022-09-30 2023-01-03 上海柯林布瑞信息技术有限公司 基于监控服务的系统交互信息动态收集查询方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115563356A (zh) * 2022-09-30 2023-01-03 上海柯林布瑞信息技术有限公司 基于监控服务的系统交互信息动态收集查询方法及装置
CN115563356B (zh) * 2022-09-30 2023-07-18 上海柯林布瑞信息技术有限公司 基于监控服务的系统交互信息动态收集查询方法及装置

Similar Documents

Publication Publication Date Title
CN104391934B (zh) 数据校验方法和装置
CN110705683B (zh) 随机森林模型的构造方法、装置、电子设备及存储介质
CN111026858B (zh) 基于项目推荐模型的项目信息处理方法及装置
CN108718341B (zh) 数据的共享和搜索的方法
CN110046297B (zh) 运维违规操作的识别方法、装置和存储介质
CN111291394B (zh) 一种虚假信息管理方法、装置和存储介质
CN107679819B (zh) 财务数据处理方法、装置、计算机设备和存储介质
CN105786950A (zh) 一种处理数据的方法及装置
CN110795763B (zh) 电子证照处理方法、查询方法、装置、设备、平台和介质
CN111400504A (zh) 企业关键人的识别方法和装置
CN105095369A (zh) 网址匹配方法及装置
CN111625552B (zh) 数据收集方法、装置、设备和可读存储介质
CN107820613A (zh) 数据库索引自动推荐和创建
CN112925954B (zh) 用于在图数据库中查询数据的方法和装置
CN112256880A (zh) 文本识别方法和装置、存储介质及电子设备
CN109255587A (zh) 一种工作数据的协同处理方法及装置
CN113392121A (zh) 一种数据查询方法、装置、设备和存储介质
EP4120096A1 (en) Method and device for data retrieval, electronic device, and storage medium
CN106326317A (zh) 数据处理方法及装置
CN114461705A (zh) 数据可视化生成方法、装置、电子设备及存储介质
CN115659375A (zh) 数据处理方法、装置、存储介质及电子设备
CN115203138A (zh) 数据检索方法、装置及存储介质
CN108023949A (zh) 拨号上网方法、系统、智能终端及服务器
CN114328818A (zh) 文本语料处理方法、装置、存储介质及电子设备
CN109241381A (zh) 信息匹配方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40052826

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination