CN110109948A - 数据查询方法、计算机设备及计算机可读存储介质 - Google Patents

数据查询方法、计算机设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110109948A
CN110109948A CN201910341140.8A CN201910341140A CN110109948A CN 110109948 A CN110109948 A CN 110109948A CN 201910341140 A CN201910341140 A CN 201910341140A CN 110109948 A CN110109948 A CN 110109948A
Authority
CN
China
Prior art keywords
data
response
inquiry request
database
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910341140.8A
Other languages
English (en)
Inventor
曹鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Translation (chengdu) Information Technology Co Ltd
Original Assignee
Digital Translation (chengdu) Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Translation (chengdu) Information Technology Co Ltd filed Critical Digital Translation (chengdu) Information Technology Co Ltd
Priority to CN201910341140.8A priority Critical patent/CN110109948A/zh
Publication of CN110109948A publication Critical patent/CN110109948A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一数据查询方法、计算机设备及计算机可读存储介质。该数据查询方法包括:S2:发送被查询数据的第一查询请求;S4:接收对所述第一查询请求的第一响应;S6:根据所述第一响应,发送所述被查询数据的第二查询请求;S8:接收对所述第二查询请求的第二响应。本申请解决了由于数据量大造成的查询系统响应时间出现明显下降的技术问题。

Description

数据查询方法、计算机设备及计算机可读存储介质
技术领域
本申请涉及通信领域,具体而言,涉及一种数据查询方法。
背景技术
通常使用传统关系型数据库存储语句对,并利用结构化查询语言语句在数据库进行查询,再根据用户当前设置的句段匹配率对返回结果进行过滤;或者通过搜索引擎集群获得分布式非关系型数据库集群中的索引集合,再利用索引集合到语料存储数据库集群中检索达到快速响应。
针对相关技术中当数据量大时,系统响应时间会出现明显下降的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种数据查询方法,以解决当数据量大时,系统响应时间会出现明显下降的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种数据查询方法。
根据本申请的数据查询方法包括:
发送被查询数据的第一查询请求;
接收对所述第一查询请求的第一响应,所述第一响应包括所述被查询数据的至少一个数据索引及需要建立所述索引的字段;
发送对所述至少一个数据索引及需要建立所述索引的字段的至少其中之一的第二查询请求;
接收对所述第二查询请求的第二响应,并获得查询结果。
为了实现上述目的,根据本申请的另一方面,提供了一种数据查询方法,根据本申请的数据查询方法包括:
接收被查询数据的第一查询请求;
根据所述第一查询请求在第一数据库中查询所述数据,并获得第一响应;
发送所述第一响应;
接收所述被查询数据的第二查询请求;
根据所述第二查询请求在第二数据库中查询所述数据,并获得第二响应;
发送所述第二响应。
进一步的,所述第一数据库为非关系型数据库,所述步骤S4为:根据所述第一查询请求,通过全文搜索引擎在所述非关系型数据库,并获得所述第一响应。
进一步的,所述第一响应包括所述被查询数据的数据索引及需要建立索引的字段。
进一步的,所述第一数据库与所述第二数据库为同一个数据库。
进一步的,所述非关系型数据库与所述全文搜索引擎中的数据同时更新。
为了实现上述目的,根据本申请的另一方面,提供了一种计算机设备,包括:存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的方法。
为了实现上述目的,根据本申请的另一方面,提供了一种计算机设备,包括:非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现上述任一项所述的方法。
为了实现上述目的,根据本申请的另一方面,提供了一种计算机设备,包括:计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行上述任一项所述的方法。
在本申请实施例中,采用将查询数据的查询分成两次,即采用模糊查询,再精确查询,逐级递进的查询方法来查询数据,通过只需要精确查询用户感兴趣的某篇文字即可,而不需要精确搜索其他的文字,达到了提高的查询的效率以及大大减少了查询的时间。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请一个实施例的数据查询方法的流程示意图;
图2是根据本申请一个实施例的数据查询方法的流程示意图;
图3是根据本申请一个实施例的数据查询方法的流程示意图;
图4是根据本申请一个实施例的计算机设备的示意图;以及
图5是根据本申请一个实施例的计算机可读存储介质的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参照图1,在本申请一实施例中,当用户需要查询数据时,以查询“长城”为例。S102:用户发送含有“长城”的字段的查询请求至服务器;S104:用户收到所有包含“长城”字段的整篇文字或部分文字以及索引标识;S106:在这些文字中寻找自己感兴趣的,并针对自己感兴趣的某篇或某些篇含有“长城”字段的文字发送进一步查询的请求;S108:用户接收根据该进一步查询请求以及该文字所对应的索引标识,精准找到对应的含有“长城”字段的结果。
本实施例中的技术方案将查询数据的查询请求分成两次,即采用先发送模糊查询请求,再发送精确查询请求,逐级递进的查询方法来查询数据。这样就可以只需要精确查询用户感兴趣的某篇文字即可,而不需要精确搜索其他的文字。因此,大大提高的查询的效率以及大大减少了查询的时间。
请参照图2,本申请一实施例中,还以查询“长城”为例。S202:服务器接收来自用户发送查询请求;S204:服务器在收到该查询请求时,在数据库中查询所有带有“长城”字段的整篇文字或部分文字,获得该整篇文字或部分文字以及对应的索引标识;S206:服务器将上述所有含有“长城”字段的整篇或部分文字发送至用户;S208:服务器接收经过筛选过后的针对上述所有含有“长城”字段的整篇或部分文字的其中之一或其中之几的进一步查询请求;S210:服务器根据该进一步查询请求以及该文字所对应的索引标识,精准的在服务器中找到对应的含有“长城”字段的结果;S212:服务器将该结果发送给用户。
本实施例中的技术方案将查询结果分成两次,即采用先发送模糊查询结果,再发送精确查询结果,逐级递进的查询方法来查询数据。这样就可以只需要精确查询用户感兴趣的某篇文字即可,而不需要精确搜索其他的文字。因此,大大提高的查询的效率以及大大减少了查询的时间。
在上述实施例中,需要查询的内容为“长城”字段,但并不以此为限,本领域技术人员可以根据需要查询其他类型的数据。另外,在本实施例中,以两级查询为例,但并不以此为限,本领域技术人员可以根据具体需求任意设置查询的层级。当设置为三级或三级以上的查询层级时,索引标识所指向的内容可以是标识为下一层级的查询内容,也可以为最终层级的查询内容,并不做任何限制,均属于本申请所要保护的范围之内。
为了获得更快的查询效果,本申请另一实施例中,通过全文搜索引擎在所述非关系型数据库,但并不以此为限,本领域技术人员可以使用其他类型的搜索引擎搜索其他类型的数据库。
在本申请一实施例中,用户收到的第一响应包括所述被查询数据的数据索引及需要建立索引的字段。当查询层级为三级或三级以上时,任何一个或几个层级的查询响应均可包括下一层级或者最终层级的数据索引及需要建立索引的字段。
在上述实施例中,服务器在每个层级查询时所使用的数据库为同一个数据库,然而并不以此为限。在本申请其他实施例中,服务器在每个层级查询时所使用的数据库可为同一个数据库,或者可为部分相同的数据库。
为了保持搜索引擎与数据库集群间数据实时的一致性,在本申请一实施例中,非关系型数据库与所述全文搜索引擎中的数据同时更新。
请参照图3,在本申请另一实施例中,采用非关系型数据库(如HBase)作为数据库,配合全文搜索引擎(如ElasticSearch)建立二级索引,实现大数据量下的高速响应以及线上业务容错性提升,同时避免数据同步不及时的问题。
在本实施例中,本技术详细步骤:
非关系型数据库储存数据的完整内容,全文搜索引擎只储存每条数据中的数据索引以及需要建立索引的字段(主要是业务中的原、译文字段);
当用户向系统发模糊匹配请求,请求到达服务端,程序会根据搜索条件在全文搜索引擎集群中搜索;
程序获取在全文搜索引擎集群中的检索结果,并对所有结果进行排序筛选;
程序将筛选结果返回给用户;
如果用户要查看某一条数据具体信息,根据返回数据的索引,直接访问非关系型数据库集群,利用索引在非关系型数据库集群中检索,响应效率可以达到毫秒级别;
用户更新数据时会同步更新非关系型数据库集群和全文搜索引擎集群,达到数据同步要求,不用定时同步,避免“数据丢失”的现象产生。
请参照图4,在本申请一实施例中,计算机设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述任一项所述的方法。
请参照图5,在本申请一实施例中,计算机可读存储介质,优选为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现上述中任一项所述的方法。
在本申请一实施例中,计算机程序产品,包括计算机可读代码,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行上述任意一项所述的方法。
本申请中的方法的步骤虽然是按照数字顺序编号,但并不意味着各个步骤的执行顺序一定要按照数字的顺序进行。有些步骤之间可以是并列执行的关系,甚至可以颠倒顺序执行,都属于本申请所要求的保护的范围内。
从以上的描述中,可以看出,本发明实现了如下技术效果:
将查询数据的查询分成两次,即采用模糊查询,再精确查询,逐级递进的查询方法来查询数据。这样就可以只需要精确查询用户感兴趣的某篇文字即可,而不需要精确搜索其他的文字。因此,大大提高的查询的效率以及大大减少了查询的时间。
高效率:充分利用了全文搜索引擎集群搜索引擎的高效,全面等特点,近实时地为用户提供数据查询结果;
高读命中率:每一次用户读请求下发到全文搜索引擎集群,全文搜索引擎集群利用配置的分词插件以及分词细腻度,根据用户需要进行搜索,能大大提高结果命中率;
集群特性得以最大限度发挥:大部分查询场景通过全文搜索引擎集群承担,非关系型数据库集群主要是在查询具体数据时使用,加上非关系型数据库集群写入性能高于读取性能,使得两个集群的优势得以最大性能发挥。
良好的容错率:全文搜索引擎集群良好的稳定性,可以弥补不可预计状况导致Hbase集群宕机引发的线上业务挂起问题,本发明针对翻译计算机辅助翻译系统,主要运用语料匹配,可以保持线上业务正常进行的前提下完成数据库业务的恢复;
数据一致性:同步更新机制保证了两个集群间数据实时的一致性,避免产生“数据丢失”现象。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (9)

1.一种数据查询方法,其特征在于,包括:
发送被查询数据的第一查询请求;
接收对所述第一查询请求的第一响应,所述第一响应包括所述被查询数据的至少一个数据索引及需要建立所述索引的字段;
发送对所述至少一个数据索引及需要建立所述索引的字段的至少其中之一的第二查询请求;
接收对所述第二查询请求的第二响应,并获得查询结果。
2.一种数据查询方法,其特征在于,包括:
接收被查询数据的第一查询请求;
根据所述第一查询请求在第一数据库中查询所述数据,并获得第一响应;
发送所述第一响应;
接收所述被查询数据的第二查询请求;
根据所述第二查询请求在第二数据库中查询所述数据,并获得第二响应;
发送所述第二响应。
3.根据权利要求2所述的数据查询方法,其特征在于,所述第一数据库为非关系型数据库,所述步骤S4为:根据所述第一查询请求,通过全文搜索引擎在所述非关系型数据库,并获得所述第一响应。
4.根据权利要求2或3所述的数据查询方法,其特征在于,所述第一响应包括所述被查询数据的数据索引及需要建立索引的字段。
5.根据权利要求2所述的数据查询方法,其特征在于,所述第一数据库与所述第二数据库为同一个数据库。
6.根据权利要求3所述的数据查询方法,其特征在于,所述非关系型数据库与所述全文搜索引擎中的数据同时更新。
7.一种计算机设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述的方法。
8.一种计算机可读存储介质,非易失性可读存储介质,其内存储有计算机程序,其特征在于,所述计算机程序在由处理器执行时实现如权利要求1-6中任一项所述的方法。
9.一种计算机程序产品,包括计算机可读代码,其特征在于,当所述计算机可读代码由计算机设备执行时,导致所述计算机设备执行权利要求1-6中任一项所述的方法。
CN201910341140.8A 2019-04-25 2019-04-25 数据查询方法、计算机设备及计算机可读存储介质 Pending CN110109948A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910341140.8A CN110109948A (zh) 2019-04-25 2019-04-25 数据查询方法、计算机设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910341140.8A CN110109948A (zh) 2019-04-25 2019-04-25 数据查询方法、计算机设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110109948A true CN110109948A (zh) 2019-08-09

Family

ID=67486834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910341140.8A Pending CN110109948A (zh) 2019-04-25 2019-04-25 数据查询方法、计算机设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110109948A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110569268A (zh) * 2019-09-17 2019-12-13 深圳前海环融联易信息科技服务有限公司 数据查询方法、系统及计算机可读存储介质
CN110704486A (zh) * 2019-09-27 2020-01-17 支付宝(杭州)信息技术有限公司 数据处理方法、装置、系统、存储介质和服务器
CN111104426A (zh) * 2019-11-22 2020-05-05 深圳智链物联科技有限公司 一种数据查询方法及系统
CN112835938A (zh) * 2021-02-23 2021-05-25 百度在线网络技术(北京)有限公司 数据处理方法、装置、电子设备和计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106383860A (zh) * 2016-08-31 2017-02-08 无锡雅座在线科技发展有限公司 数据查询方法及装置
CN106682145A (zh) * 2016-12-22 2017-05-17 北京览群智数据科技有限责任公司 一种企业信息的处理方法、服务器及客户端
CN106708996A (zh) * 2016-12-19 2017-05-24 北京天广汇通科技有限公司 用于对关系数据库进行全文搜索的方法及系统
US20170206249A1 (en) * 2016-01-20 2017-07-20 Systems And Methods For Implementing Urban Voices Systems and methods for implementing urban voices
CN109376121A (zh) * 2018-08-10 2019-02-22 南京华讯方舟通信设备有限公司 一种基于ElasticSearch全文检索的文件索引系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170206249A1 (en) * 2016-01-20 2017-07-20 Systems And Methods For Implementing Urban Voices Systems and methods for implementing urban voices
CN106383860A (zh) * 2016-08-31 2017-02-08 无锡雅座在线科技发展有限公司 数据查询方法及装置
CN106708996A (zh) * 2016-12-19 2017-05-24 北京天广汇通科技有限公司 用于对关系数据库进行全文搜索的方法及系统
CN106682145A (zh) * 2016-12-22 2017-05-17 北京览群智数据科技有限责任公司 一种企业信息的处理方法、服务器及客户端
CN109376121A (zh) * 2018-08-10 2019-02-22 南京华讯方舟通信设备有限公司 一种基于ElasticSearch全文检索的文件索引系统及方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110569268A (zh) * 2019-09-17 2019-12-13 深圳前海环融联易信息科技服务有限公司 数据查询方法、系统及计算机可读存储介质
CN110704486A (zh) * 2019-09-27 2020-01-17 支付宝(杭州)信息技术有限公司 数据处理方法、装置、系统、存储介质和服务器
CN111104426A (zh) * 2019-11-22 2020-05-05 深圳智链物联科技有限公司 一种数据查询方法及系统
CN111104426B (zh) * 2019-11-22 2024-04-05 深圳智链物联科技有限公司 一种数据查询方法及系统
CN111104426B8 (zh) * 2019-11-22 2024-04-23 北京傲速科技有限公司 一种数据查询方法及系统
CN112835938A (zh) * 2021-02-23 2021-05-25 百度在线网络技术(北京)有限公司 数据处理方法、装置、电子设备和计算机可读存储介质
CN112835938B (zh) * 2021-02-23 2024-07-30 百度在线网络技术(北京)有限公司 数据处理方法、装置、电子设备和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN110109948A (zh) 数据查询方法、计算机设备及计算机可读存储介质
CN105488043B (zh) 基于Key-Value数据块的数据查询方法及系统
US8938459B2 (en) System and method for distributed index searching of electronic content
CN102567495B (zh) 一种海量信息存储系统及实现方法
CN100462979C (zh) 分布式索引文件的检索方法、检索系统及检索服务器
CN111460023A (zh) 基于Elasticsearch的业务数据处理方法、装置、设备及存储介质
CN105404634B (zh) 基于Key-Value数据块的数据管理方法及系统
CN102163218B (zh) 基于图索引的图数据库关键词邻近搜索方法
CN104252536B (zh) 一种基于hbase的上网日志数据查询方法及装置
CN107451208B (zh) 一种数据搜索方法与装置
CN106294695A (zh) 一种面向实时大数据搜索引擎的实现方法
CN105740472A (zh) 一种分布式实时全文检索方法及系统
CN100458784C (zh) 在数字图书馆中所采用的检索系统和检索方法
WO2009031915A1 (fr) Système et procédés de stockage, de recherche et d'extraction des informations sur la base d'ensembles de données faiblement organisés et décentralisés
CN111597160A (zh) 分布式数据库系统、分布式数据处理方法和装置
CN108509437A (zh) 一种ElasticSearch查询加速方法
CN103823846A (zh) 一种基于图论的大数据存储及查询方法
CN104346458A (zh) 数据存储方法和存储设备
CN112231351A (zh) 一种pb级海量数据的实时查询方法和装置
CN104008199A (zh) 一种数据查询方法
CN103412883A (zh) 基于p2p技术的语义智能信息发布订阅方法
KR101955376B1 (ko) 비공유 아키텍처 기반의 분산 스트림 처리 엔진에서 관계형 질의를 처리하는 방법, 이를 수행하기 위한 기록 매체 및 장치
CN110134698A (zh) 数据管理方法及相关产品
CN102325098B (zh) 群信息获取方法和系统
CN114741570A (zh) 图数据库的查询方法、索引创建方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190809