CN109299219B - 数据查询方法、装置、电子设备及计算机可读存储介质 - Google Patents

数据查询方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN109299219B
CN109299219B CN201811014383.2A CN201811014383A CN109299219B CN 109299219 B CN109299219 B CN 109299219B CN 201811014383 A CN201811014383 A CN 201811014383A CN 109299219 B CN109299219 B CN 109299219B
Authority
CN
China
Prior art keywords
query
data
text
index
data storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811014383.2A
Other languages
English (en)
Other versions
CN109299219A (zh
Inventor
蒋志勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Oceanbase Technology Co Ltd
Original Assignee
Beijing Oceanbase Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Oceanbase Technology Co Ltd filed Critical Beijing Oceanbase Technology Co Ltd
Priority to CN201811014383.2A priority Critical patent/CN109299219B/zh
Publication of CN109299219A publication Critical patent/CN109299219A/zh
Priority to TW108119719A priority patent/TWI745702B/zh
Priority to US16/554,122 priority patent/US11386081B2/en
Priority to PCT/US2019/048909 priority patent/WO2020047317A1/en
Priority to SG11202012515TA priority patent/SG11202012515TA/en
Priority to EP19768962.3A priority patent/EP3844639A1/en
Application granted granted Critical
Publication of CN109299219B publication Critical patent/CN109299219B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种数据查询方法、装置、电子设备及计算机可读存储介质,所述方法包括:接收查询命令,并对所述查询命令进行文本处理,得到查询子命令;利用所述查询子命令在预设数据存储索引表中进行搜索,得到目标索引集;利用所述目标索引集在数据存储库中进行查询,得到查询结果。该技术方案建立了一种新型的索引机制,能够有效地支持对普通列条件和全文检索条件这两类混合条件的查询,尤其对于数据量和并发量非常大的情况,查询性能更为突出,进而大大缩短了查询时间、提高查询效率、节省用户的宝贵时间。

Description

数据查询方法、装置、电子设备及计算机可读存储介质
技术领域
本发明实施例涉及数据查询技术领域,具体涉及一种数据查询方法、装置、电子设备及计算机可读存储介质。
背景技术
在数据库系统,比如OLTP(On-Line Transaction Processing,联机事务处理过程)型数据库系统中,通常支持B+树索引和全文索引,其中B+树索引用于对数值、字符串等类型列的单行查询及范围查询,比如通过用户ID查找用户订单,而全文索引则用于对文本类型(字符串、字符型大对象)列是否包含一个或多个特定关键字以及关键字组合的查询,如在电商场景中,查询用户是否购买过某品牌的运动鞋等等。由上可见,相对于B+树索引查询的条件,全文索引的查询条件是比较模糊的。虽然B+树索引与全文索引均能够满足一部分场景的需求,但存在一种场景,比如某用户想要查找自己在指定时间段购买的特定品牌商品的记录,对于这种场景,在当前的大多数数据库系统中,只能使用B+树索引先查找到该用户在指定时间段的所有购买记录,然后再从这些记录中通过字符串like操作在商品名称列中去进一步查找特定品牌的购买记录。若查询时间段较长,用户在这段时间内的购买记录比较多,由于字符串like操作本身的性能比较低下,将会导致查询整体的性能比较低下。对于大规模电商业务,数据量和并发量都非常大,查询性能更是会受到很大的影响,进而导致查询时间冗长、查询效率低下、浪费用户的时间。
发明内容
本发明实施例提供一种数据查询方法、装置、电子设备及计算机可读存储介质。
第一方面,本发明实施例中提供了一种数据查询方法。
具体的,所述数据查询方法,包括:
接收查询命令,并对所述查询命令进行文本处理,得到查询子命令;
利用所述查询子命令在预设数据存储索引表中进行搜索,得到目标索引集;
利用所述目标索引集在数据存储库中进行查询,得到查询结果。
结合第一方面,本发明实施例在第一方面的第一种实现方式中,所述接收查询命令,并对所述查询命令进行文本处理,得到查询子命令,包括:
接收查询命令;
确定所述查询命令中的文本查询内容;
对所述文本查询内容进行文本处理,得到多个文本查询子内容;
将所述文本查询子内容分别与所述查询命令中的非文本查询内容组合,得到多个查询子命令。
结合第一方面和第一方面的第一种实现方式,本发明实施例在第一方面的第二种实现方式中,所述利用所述查询子命令在预设数据存储索引表中进行搜索,得到目标索引集,包括:
利用所述多个查询子命令在所述预设数据存储索引表中进行搜索,得到多个候选索引集;
计算所述多个候选索引集的交集,作为所述目标索引集。
结合第一方面、第一方面的第一种实现方式和第一方面的第二种实现方式,本公开在第一方面的第三种实现方式中,所述利用所述目标索引集在数据存储库中进行查询,得到查询结果,包括:
获取所述目标索引集中的索引值;
利用所述索引值在数据存储库中进行查询,得到多个查询子结果;
对于所述多个查询子结果进行组合处理,得到所述查询结果。
结合第一方面、第一方面的第一种实现方式和第一方面的第二种实现方式,本公开在第一方面的第四种实现方式中,还包括:
对于所述数据存储索引表进行预设维护操作。
第二方面,本发明实施例中提供了一种数据查询装置。
具体的,所述数据查询装置,包括:
处理模块,被配置为接收查询命令,并对所述查询命令进行文本处理,得到查询子命令;
搜索模块,被配置为利用所述查询子命令在预设数据存储索引表中进行搜索,得到目标索引集;
查询模块,被配置为利用所述目标索引集在数据存储库中进行查询,得到查询结果。
结合第二方面,本发明实施例在第二方面的第一种实现方式中,所述处理模块包括:
接收子模块,被配置为接收查询命令;
确定子模块,被配置为确定所述查询命令中的文本查询内容;
处理子模块,被配置为对所述文本查询内容进行文本处理,得到多个文本查询子内容;
第一组合子模块,被配置为将所述文本查询子内容分别与所述查询命令中的非文本查询内容组合,得到多个查询子命令。
结合第二方面和第二方面的第一种实现方式,本发明实施例在第二方面的第二种实现方式中,所述搜索模块包括:
搜索子模块,被配置为利用所述多个查询子命令在所述预设数据存储索引表中进行搜索,得到多个候选索引集;
计算子模块,被配置为计算所述多个候选索引集的交集,作为所述目标索引集。
结合第二方面、第二方面的第一种实现方式和第二方面的第二种实现方式,本公开在第二方面的第三种实现方式中,所述查询模块包括:
获取子模块,被配置为获取所述目标索引集中的索引值;
查询子模块,被配置为利用所述索引值在数据存储库中进行查询,得到多个查询子结果;
第二组合子模块,被配置为对于所述多个查询子结果进行组合处理,得到所述查询结果。
结合第二方面、第二方面的第一种实现方式和第二方面的第二种实现方式,本公开在第二方面的第四种实现方式中,还包括:
维护模块,被配置为对于所述数据存储索引表进行预设维护操作。
第三方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条支持数据查询装置执行上述第一方面中数据查询方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算机指令。所述数据查询装置还可以包括通信接口,用于数据查询装置与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储数据查询装置所用的计算机指令,其包含用于执行上述第一方面中数据查询方法为数据查询装置所涉及的计算机指令。
本发明实施例提供的技术方案可以包括以下有益效果:
上述技术方案通过对于查询命令进行文本处理,得到查询子命令,进而基于查询子命令对于索引表中进行搜索,然后将搜索到的所有索引值对应的查询结果均作为最终查询结果返回。该技术方案建立了一种新型的索引机制,能够有效地支持对普通列条件和全文检索条件这两类混合条件的查询,尤其对于数据量和并发量非常大的情况,查询性能更为突出,进而大大缩短了查询时间、提高查询效率、节省用户的宝贵时间。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明实施例。
附图说明
结合附图,通过以下非限制性实施方式的详细描述,本发明实施例的其它特征、目的和优点将变得更加明显。在附图中:
图1示出根据本发明一实施方式的数据查询方法的流程图;
图2示出根据图1所示实施方式的数据查询方法的步骤S101的流程图;
图3示出根据图1所示实施方式的数据查询方法的步骤S102的流程图;
图4示出根据图1所示实施方式的数据查询方法的步骤S103的流程图;
图5示出根据本发明另一实施方式的数据查询方法的流程图;
图6示出根据本发明一实施方式的数据查询装置的结构框图;
图7示出根据图6所示实施方式的数据查询装置的处理模块601的结构框图;
图8示出根据图6所示实施方式的数据查询装置的搜索模块602的结构框图;
图9示出根据图6所示实施方式的数据查询装置的查询模块603的结构框图;
图10示出根据本发明另一实施方式的数据查询装置的结构框图;
图11示出根据本发明一实施方式的电子设备的结构框图;
图12是适于用来实现根据本发明一实施方式的数据查询方法的计算机系统的结构示意图。
具体实施方式
下文中,将参考附图详细描述本发明实施例的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。
在本发明实施例中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。
另外还需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明实施例。
本发明实施例提供的技术方案通过对于查询命令进行文本处理,得到查询子命令,进而基于查询子命令对于索引表中进行搜索,然后将搜索到的所有索引值对应的查询结果均作为最终查询结果返回。该技术方案建立了一种新型的索引机制,能够有效地支持对普通列条件和全文检索条件这两类混合条件的查询,尤其对于数据量和并发量非常大的情况,查询性能更为突出,进而大大缩短了查询时间、提高查询效率、节省用户的宝贵时间。
图1示出根据本发明一实施方式的数据查询方法的流程图,如图1所示,所述数据查询方法包括以下步骤S101-S103:
在步骤S101中,接收查询命令,并对所述查询命令进行文本处理,得到查询子命令;
在步骤S102中,利用所述查询子命令在预设数据存储索引表中进行搜索,得到目标索引集;
在步骤S103中,利用所述目标索引集在数据存储库中进行查询,得到查询结果。
上文提及,在现有的数据查询机制中,B+树索引、全文索引与字符串like操作的组合使用难以应对数据量和并发量非常大的情况,由于字符串like操作本身的性能比较低下,将会导致查询整体的性能比较低下,进而导致查询时间冗长、查询效率低下、浪费用户的时间的不良效果。
考虑到上述问题,在该实施方式中,提出一种数据查询方法,该方法通过对于查询命令进行文本处理,得到查询子命令,进而基于查询子命令对于索引表中进行搜索,然后将搜索到的所有索引值对应的查询结果均作为最终查询结果返回。该技术方案建立了一种新型的索引机制,能够有效地支持对普通列条件和全文检索条件这两类混合条件的查询,尤其对于数据量和并发量非常大的情况,查询性能更为突出,进而大大缩短了查询时间、提高查询效率、节省用户的宝贵时间。
其中,所述查询命令包括一个或多个查询条件,比如用户ID、查询对象ID、操作时间区间、查询对象生成时间区间、查询文本等等,所述查询命令可以为用户自行输入的查询命令,也可以为用户根据操作系统的提示进行选择或者填写而由系统自动生成的查询命令。
以购物平台为例,所述查询命令可以为:搜索用户ID为“1000111”的、下单时间从“2017-7-12”至“2018-7-11”之间的、所有商品名称中包含“李宁鞋”的订单,在该查询命令中,包括用户ID、查询对象生成时间区间和查询文本三个内容,其中,用户ID指定为“1000111”,查询对象生成时间区间为从“2017-7-12”至“2018-7-11”之间,查询文本为“李宁鞋”。
在本实施例的一个可选实现方式中,所述文本处理可以包括分词、去噪等处理,所述分词指的是将待处理文本根据词库进行词语分割,得到一个或多个具有独立含义的词语,比如“李宁鞋”可以分为“李宁”、“鞋”和“李宁鞋”3个词语;所述去噪指的是,在将待处理文本进行词语分割后,将与数据查询无关的词语删除,比如若待处理文本为“李宁鞋和耐克鞋”,则可分为“李宁”、“鞋”、“李宁鞋”、“和”、“耐克”、“耐克鞋”6个词语,但其中“和”只是一个连接词,与该数据查询无关,则可将其删除,以实现去噪的目的。
其中,数据存储库存储有可供查询的数据,其可包括主键列值、文本列值、普通数据列值等数据,比如,对于一个购物平台,主键列值可设为订单ID值,文本列值可设为商品名称等商品信息,普通数据列值可设为用户ID、下单时间等等。
其中,所述数据存储索引表是预先设置好的,所述数据存储索引表中包括索引值及其类型等索引数据。
在本实施例的一个可选实现方式中,在创建数据存储索引表时,可根据以下步骤创建:
获取初始数据存储索引表,其中,所述初始数据存储索引表可以以经过系统初始化后得到的元信息表为基础,根据用户的需要在元信息表中设置相应的索引类型、索引列等索引基本信息而得到。
获取索引对象数据,其中,所述索引对象数据可包括数据存储库中存储的数据,比如主键列值、文本列值、普通数据列值等等。
对于所述索引对象数据中的文本内容进行文本处理,得到一个或多个词语等文本单元;
对于每个文本内容的每个文本单元,将其与所述索引对象数据中相关的主键列值和普通数据列值等非文本数据进行组合得到索引单元数据,将得到的索引单元数据按照预设规则存入所述初始数据存储索引表中即可得到所述数据存储索引表,其中,所述索引单元数据比如可以表现为一个索引行数据。
其中,所述预设规则比如可以为最小距离规则、最相似规则、最相关规则等规则,即使得所述数据存储索引表中,较为相关的索引数据所存放的位置较近。
在本实施例的一个可选实现方式中,如图2所示,所述步骤S101,即接收查询命令,并对所述查询命令进行文本处理,得到查询子命令的步骤,包括以下步骤S201-S204:
在步骤S201中,接收查询命令;
在步骤S202中,确定所述查询命令中的文本查询内容;
在步骤S203中,对所述文本查询内容进行文本处理,得到多个文本查询子内容;
在步骤S204中,将所述文本查询子内容分别与所述查询命令中的非文本查询内容组合,得到多个查询子命令。
为了提高数据查询的完备性,在该实施方式中,基于对于查询命令中文本查询内容的拆分得到多个查询子命令,用于后续的数据查询。具体地,首先接收查询命令;然后确定所述查询命令中的文本查询内容;然后对所述文本查询内容进行文本处理,得到多个文本查询子内容;最后将所述文本查询子内容分别与所述查询命令中的非文本查询内容组合,得到多个查询子命令。
其中,所述非文本查询内容指的是查询命令中非文本形式的查询条件。
以上文提及的查询命令:搜索用户ID为“1000111”的、下单时间从“2017-7-12”至“2018-7-11”之间的、所有商品名称中包含“李宁鞋”的订单为例,对于该查询命令,首先确定其中的文本查询内容为“李宁鞋”,然后对文本查询内容“李宁鞋”进行分词处理,得到“李宁”、“鞋”、“李宁鞋”3个词语,即文本查询子内容,然后对于每个分割得到的词语,将其与查询命令中的非文本查询内容“用户ID为“1000111””和“从“2017-7-12”至“2018-7-11”之间”相组合,即可得到3个查询子命令:查询子命令1:用户ID为“1000111”&下单时间从“2017-7-12”至“2018-7-11”之间&商品名称中包含“李宁”,查询子命令2:用户ID为“1000111”&下单时间从“2017-7-12”至“2018-7-11”之间&商品名称中包含“鞋”和查询子命令3:用户ID为“1000111”&下单时间从“2017-7-12”至“2018-7-11”之间&商品名称中包含“李宁鞋”。使用这3个查询子命令进行索引的查询,有利于查询到所有与所述查询命令匹配的数据内容,进而提高数据查询的完备性。
在本实施例的一个可选实现方式中,如图3所示,所述步骤S102,即利用所述查询子命令在预设数据存储索引表中进行搜索,得到目标索引集的步骤,包括以下步骤S301-S302:
在步骤S301中,利用所述多个查询子命令在所述预设数据存储索引表中进行搜索,得到多个候选索引集;
在步骤S302中,计算所述多个候选索引集的交集,作为所述目标索引集。
为了进一步提高数据查询的完备性,在该实施方式中,对于所有的查询子命令均进行索引数据的搜索。具体地,首先利用所述多个查询子命令在所述预设数据存储索引表中进行搜索,得到多个候选索引集;然后为了避免多个候选索引集中存在重复的索引数据,因此将所述多个候选索引集的交集作为所述目标索引集。
其中,所述索引集中包括可用于在数据存储库中进行查询得到数据查询结果的索引数据,比如存储地址、订单ID等数据。
以上文示例为例,使用查询子命令1在预设数据存储索引表中进行搜索,得到候选索引集U1,使用查询子命令2在预设数据存储索引表中进行搜索,得到候选索引集U2,使用查询子命令3在预设数据存储索引表中进行搜索,得到候选索引集U3,那么最终的目标索引集U即为U1∩U2∩U3。
在本实施例的一个可选实现方式中,如图4所示,所述步骤S103,即利用所述目标索引集在数据存储库中进行查询,得到查询结果的步骤,包括以下步骤S401-S403:
在步骤S401中,获取所述目标索引集中的索引值;
在步骤S402中,利用所述索引值在数据存储库中进行查询,得到多个查询子结果;
在步骤S403中,对于所述多个查询子结果进行组合处理,得到所述查询结果。
在该实施方式中,首先提取所述目标索引集中的索引值;然后利用所述索引值在数据存储库中进行查询,可以得到多个查询子结果,然后对于所述多个查询子结果进行组合处理,得到所述查询结果。
其中,所述组合处理可包括交集、并集、差集等组合处理。
比如,若使用目标索引集U中所有的索引值作为查询条件在数据存储库中进行查询,可以得到多个与所述索引值匹配的数据行或者数据单元,这些数据行或者数据单元均为满足用户查询要求的查询结果,因此可将这些数据进行并集处理得到一个数据集合,将其作为最终的查询结果反馈给用户。
在本实施例的一个可选实现方式中,所述方法还包括对于所述数据存储索引表进行预设维护操作的步骤,即如图5所示,所述方法包括以下步骤S501-S504:
在步骤S501中,接收查询命令,并对所述查询命令进行文本处理,得到查询子命令;
在步骤S502中,利用所述查询子命令在预设数据存储索引表中进行搜索,得到目标索引集;
在步骤S503中,利用所述目标索引集在数据存储库中进行查询,得到查询结果;
在步骤S504中,对于所述数据存储索引表进行预设维护操作。
在本实施例的一个可选实现方式中,所述预设维护操作可包括以下操作中的一种或多种:新建操作、删除操作、更新操作等等。
对于新建操作,其与数据存储索引表的数据创建相似,在此不作过多赘述。
对于删除操作,首先获取数据存储库中的目标删除数据;然后根据所述目标删除数据搜索得到所述数据存储索引表中对应的目标删除索引数据;对于所述目标删除数据中的文本内容进行文本处理,得到一个或多个文本单元;对于每个文本单元,将其与所述目标删除数据中相关的非文本数据进行组合得到目标删除索引单元搜索数据;根据所述目标删除索引单元搜索数据在所述数据存储索引表中进行搜索,确定目标删除索引单元数据;对所述目标删除数据和目标删除索引单元数据进行删除。
对于更新操作,当更新对象为非文本数据时,首先获取数据存储库中的待更新数据;然后根据所述待更新数据搜索得到所述数据存储索引表中对应的待更新索引数据;对于所述待更新数据中的文本内容进行文本处理,得到一个或多个文本单元;对于每个文本单元,将其与所述待更新数据中相关的非文本数据进行组合得到待更新索引单元搜索数据;根据所述待更新索引单元搜索数据在所述数据存储索引表中进行搜索,确定待更新索引单元数据;对所述待更新索引单元数据进行删除;获取更新数据,即替换待更新数据的数据,基于所述更新数据得到更新索引单元数据,将得到的更新索引单元数据按照所述预设规则存入所述数据存储索引表中即可完成对于数据存储索引表的更新。
当更新对象为文本数据时,首先获取数据存储库中的待更新数据;然后根据所述待更新数据搜索得到所述数据存储索引表中对应的待更新索引数据;对于所述待更新数据中的文本内容进行文本处理,得到一个或多个文本单元;对于每个文本单元,将其与所述待更新数据中相关的非文本数据进行组合得到待更新索引单元搜索数据;根据所述待更新索引单元搜索数据在所述数据存储索引表中进行搜索,确定待更新索引单元数据;对所述待更新索引单元数据进行删除;获取更新数据,即替换待更新数据的数据,对于所述更新数据中的文本内容进行文本处理,得到一个或多个文本单元;对于每个文本单元,将其与所述更新数据中相关的非文本数据进行组合得到更新索引单元数据,将得到的更新索引单元数据按照所述预设规则存入所述数据存储索引表中即可完成对于数据存储索引表的更新。
由上可知,非文本数据和文本数据的数据更新的流程大致是类似的,只是文本数据的数据更新还增加了对于更新数据进行文本处理的过程。
下述为本发明装置实施例,可以用于执行本发明方法实施例。
图6示出根据本发明一实施方式的数据查询装置的结构框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图6所示,所述数据查询装置包括:
处理模块601,被配置为接收查询命令,并对所述查询命令进行文本处理,得到查询子命令;
搜索模块602,被配置为利用所述查询子命令在预设数据存储索引表中进行搜索,得到目标索引集;
查询模块603,被配置为利用所述目标索引集在数据存储库中进行查询,得到查询结果。
上文提及,在现有的数据查询机制中,B+树索引、全文索引与字符串like操作的组合使用难以应对数据量和并发量非常大的情况,由于字符串like操作本身的性能比较低下,将会导致查询整体的性能比较低下,进而导致查询时间冗长、查询效率低下、浪费用户的时间的不良效果。
考虑到上述问题,在该实施方式中,提出一种数据查询装置,该装置通过对于查询命令进行文本处理,得到查询子命令,进而基于查询子命令对于索引表中进行搜索,然后将搜索到的所有索引值对应的查询结果均作为最终查询结果返回。该技术方案建立了一种新型的索引机制,能够有效地支持对普通列条件和全文检索条件这两类混合条件的查询,尤其对于数据量和并发量非常大的情况,查询性能更为突出,进而大大缩短了查询时间、提高查询效率、节省用户的宝贵时间。
其中,所述查询命令包括一个或多个查询条件,比如用户ID、查询对象ID、操作时间区间、查询对象生成时间区间、查询文本等等,所述查询命令可以为用户自行输入的查询命令,也可以为用户根据操作系统的提示进行选择或者填写而由系统自动生成的查询命令。
以购物平台为例,所述查询命令可以为:搜索用户ID为“1000111”的、下单时间从“2017-7-12”至“2018-7-11”之间的、所有商品名称中包含“李宁鞋”的订单,在该查询命令中,包括用户ID、查询对象生成时间区间和查询文本三个内容,其中,用户ID指定为“1000111”,查询对象生成时间区间为从“2017-7-12”至“2018-7-11”之间,查询文本为“李宁鞋”。
在本实施例的一个可选实现方式中,所述文本处理可以包括分词、去噪等处理,所述分词指的是将待处理文本根据词库进行词语分割,得到一个或多个具有独立含义的词语,比如“李宁鞋”可以分为“李宁”、“鞋”和“李宁鞋”3个词语;所述去噪指的是,在将待处理文本进行词语分割后,将与数据查询无关的词语删除,比如若待处理文本为“李宁鞋和耐克鞋”,则可分为“李宁”、“鞋”、“李宁鞋”、“和”、“耐克”、“耐克鞋”6个词语,但其中“和”只是一个连接词,与该数据查询无关,则可将其删除,以实现去噪的目的。
其中,数据存储库存储有可供查询的数据,其可包括主键列值、文本列值、普通数据列值等数据,比如,对于一个购物平台,主键列值可设为订单ID值,文本列值可设为商品名称等商品信息,普通数据列值可设为用户ID、下单时间等等。
其中,所述数据存储索引表是预先设置好的,所述数据存储索引表中包括索引值及其类型等索引数据。
在本实施例的一个可选实现方式中,可设置有创建模块,所述创建模块被配置为创建数据存储索引表,具体地,所述创建模块被配置为:
获取初始数据存储索引表,其中,所述初始数据存储索引表可以以经过系统初始化后得到的元信息表为基础,根据用户的需要在元信息表中设置相应的索引类型、索引列等索引基本信息而得到。
获取索引对象数据,其中,所述索引对象数据可包括数据存储库中存储的数据,比如主键列值、文本列值、普通数据列值等等。
对于所述索引对象数据中的文本内容进行文本处理,得到一个或多个词语等文本单元;
对于每个文本内容的每个文本单元,将其与所述索引对象数据中相关的主键列值和普通数据列值等非文本数据进行组合得到索引单元数据,将得到的索引单元数据按照预设规则存入所述初始数据存储索引表中即可得到所述数据存储索引表,其中,所述索引单元数据比如可以表现为一个索引行数据。
其中,所述预设规则比如可以为最小距离规则、最相似规则、最相关规则等规则,即使得所述数据存储索引表中,较为相关的索引数据所存放的位置较近。
在本实施例的一个可选实现方式中,如图7所示,所述处理模块601包括:
接收子模块701,被配置为接收查询命令;
确定子模块702,被配置为确定所述查询命令中的文本查询内容;
处理子模块703,被配置为对所述文本查询内容进行文本处理,得到多个文本查询子内容;
第一组合子模块704,被配置为将所述文本查询子内容分别与所述查询命令中的非文本查询内容组合,得到多个查询子命令。
为了提高数据查询的完备性,在该实施方式中,基于对于查询命令中文本查询内容的拆分得到多个查询子命令,用于后续的数据查询。具体地,接收子模块701接收查询命令;确定子模块702确定所述查询命令中的文本查询内容;处理子模块703对所述文本查询内容进行文本处理,得到多个文本查询子内容;第一组合子模块704将所述文本查询子内容分别与所述查询命令中的非文本查询内容组合,得到多个查询子命令。
其中,所述非文本查询内容指的是查询命令中非文本形式的查询条件。
以上文提及的查询命令:搜索用户ID为“1000111”的、下单时间从“2017-7-12”至“2018-7-11”之间的、所有商品名称中包含“李宁鞋”的订单为例,对于该查询命令,首先确定其中的文本查询内容为“李宁鞋”,然后对文本查询内容“李宁鞋”进行分词处理,得到“李宁”、“鞋”、“李宁鞋”3个词语,即文本查询子内容,然后对于每个分割得到的词语,将其与查询命令中的非文本查询内容“用户ID为“1000111””和“从“2017-7-12”至“2018-7-11”之间”相组合,即可得到3个查询子命令:查询子命令1:用户ID为“1000111”&下单时间从“2017-7-12”至“2018-7-11”之间&商品名称中包含“李宁”,查询子命令2:用户ID为“1000111”&下单时间从“2017-7-12”至“2018-7-11”之间&商品名称中包含“鞋”和查询子命令3:用户ID为“1000111”&下单时间从“2017-7-12”至“2018-7-11”之间&商品名称中包含“李宁鞋”。使用这3个查询子命令进行索引的查询,有利于查询到所有与所述查询命令匹配的数据内容,进而提高数据查询的完备性。
在本实施例的一个可选实现方式中,如图8所示,所述搜索模块602包括:
搜索子模块801,被配置为利用所述多个查询子命令在所述预设数据存储索引表中进行搜索,得到多个候选索引集;
计算子模块802,被配置为计算所述多个候选索引集的交集,作为所述目标索引集。
为了进一步提高数据查询的完备性,在该实施方式中,对于所有的查询子命令均进行索引数据的搜索。具体地,搜索子模块801利用所述多个查询子命令在所述预设数据存储索引表中进行搜索,得到多个候选索引集;为了避免多个候选索引集中存在重复的索引数据,计算子模块802将所述多个候选索引集的交集作为所述目标索引集。
其中,所述索引集中包括可用于在数据存储库中进行查询得到数据查询结果的索引数据,比如存储地址、订单ID等数据。
以上文示例为例,使用查询子命令1在预设数据存储索引表中进行搜索,得到候选索引集U1,使用查询子命令2在预设数据存储索引表中进行搜索,得到候选索引集U2,使用查询子命令3在预设数据存储索引表中进行搜索,得到候选索引集U3,那么最终的目标索引集U即为U1∩U2∩U3。
在本实施例的一个可选实现方式中,如图9所示,所述查询模块603包括:
获取子模块901,被配置为获取所述目标索引集中的索引值;
查询子模块902,被配置为利用所述索引值在数据存储库中进行查询,得到多个查询子结果;
第二组合子模块903,被配置为对于所述多个查询子结果进行组合处理,得到所述查询结果。
在该实施方式中,获取子模块901提取所述目标索引集中的索引值;查询子模块902利用所述索引值在数据存储库中进行查询,可以得到多个查询子结果,第二组合子模块903对于所述多个查询子结果进行组合处理,得到所述查询结果。
其中,所述组合处理可包括交集、并集、差集等组合处理。
比如,若使用目标索引集U中所有的索引值作为查询条件在数据存储库中进行查询,可以得到多个与所述索引值匹配的数据行或者数据单元,这些数据行或者数据单元均为满足用户查询要求的查询结果,因此可将这些数据进行并集处理得到一个数据集合,将其作为最终的查询结果反馈给用户。
在本实施例的一个可选实现方式中,所述装置还包括对于所述数据存储索引表进行预设维护操作的部分,即如图10所示,所述装置包括:
处理模块1001,被配置为接收查询命令,并对所述查询命令进行文本处理,得到查询子命令;
搜索模块1002,被配置为利用所述查询子命令在预设数据存储索引表中进行搜索,得到目标索引集;
查询模块1003,被配置为利用所述目标索引集在数据存储库中进行查询,得到查询结果;
维护模块1004,被配置为对于所述数据存储索引表进行预设维护操作。
在本实施例的一个可选实现方式中,所述预设维护操作可包括以下操作中的一种或多种:新建操作、删除操作、更新操作等等。
对于新建操作,其与数据存储索引表的数据创建相似,在此不作过多赘述。
对于删除操作,所述维护模块1004被配置为:首先获取数据存储库中的目标删除数据;然后根据所述目标删除数据搜索得到所述数据存储索引表中对应的目标删除索引数据;对于所述目标删除数据中的文本内容进行文本处理,得到一个或多个文本单元;对于每个文本单元,将其与所述目标删除数据中相关的非文本数据进行组合得到目标删除索引单元搜索数据;根据所述目标删除索引单元搜索数据在所述数据存储索引表中进行搜索,确定目标删除索引单元数据;对所述目标删除数据和目标删除索引单元数据进行删除。
对于更新操作,当更新对象为非文本数据时,所述维护模块1004被配置为:首先获取数据存储库中的待更新数据;然后根据所述待更新数据搜索得到所述数据存储索引表中对应的待更新索引数据;对于所述待更新数据中的文本内容进行文本处理,得到一个或多个文本单元;对于每个文本单元,将其与所述待更新数据中相关的非文本数据进行组合得到待更新索引单元搜索数据;根据所述待更新索引单元搜索数据在所述数据存储索引表中进行搜索,确定待更新索引单元数据;对所述待更新索引单元数据进行删除;获取更新数据,即替换待更新数据的数据,基于所述更新数据得到更新索引单元数据,将得到的更新索引单元数据按照所述预设规则存入所述数据存储索引表中即可完成对于数据存储索引表的更新。
当更新对象为文本数据时,所述维护模块1004被配置为:首先获取数据存储库中的待更新数据;然后根据所述待更新数据搜索得到所述数据存储索引表中对应的待更新索引数据;对于所述待更新数据中的文本内容进行文本处理,得到一个或多个文本单元;对于每个文本单元,将其与所述待更新数据中相关的非文本数据进行组合得到待更新索引单元搜索数据;根据所述待更新索引单元搜索数据在所述数据存储索引表中进行搜索,确定待更新索引单元数据;对所述待更新索引单元数据进行删除;获取更新数据,即替换待更新数据的数据,对于所述更新数据中的文本内容进行文本处理,得到一个或多个文本单元;对于每个文本单元,将其与所述更新数据中相关的非文本数据进行组合得到更新索引单元数据,将得到的更新索引单元数据按照所述预设规则存入所述数据存储索引表中即可完成对于数据存储索引表的更新。
由上可知,非文本数据和文本数据的数据更新的流程大致是类似的,只是文本数据的数据更新还增加了对于更新数据进行文本处理的过程。
本发明实施例还公开了一种电子设备,图11示出根据本发明一实施方式的电子设备的结构框图,如图11所示,所述电子设备1100包括存储器1101和处理器1102;其中,
所述存储器1101用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器1102执行以实现上述任一方法步骤。
图12适于用来实现根据本发明实施方式的数据查询方法的计算机系统的结构示意图。
如图12所示,计算机系统1200包括中央处理单元(CPU)1201,其可以根据存储在只读存储器(ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(RAM)1203中的程序而执行上述实施方式中的各种处理。在RAM1203中,还存储有系统1200操作所需的各种程序和数据。CPU1201、ROM1202以及RAM1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。
以下部件连接至I/O接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
特别地,根据本发明的实施方式,上文描述的方法可以被实现为计算机软件程序。例如,本发明的实施方式包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行所述数据查询方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。
附图中的流程图和框图,图示了按照本发明各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本发明实施例的方法。
以上描述仅为本发明的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本发明实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本发明实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种数据查询方法,其特征在于,包括:
接收查询命令;
确定所述查询命令中的文本查询内容;
对所述文本查询内容进行分词及去噪处理,得到多个文本查询子内容,其中,所述文本查询子内容为具有独立含义的词语,所述去噪处理用于删除与查询无关的词语;
将所述文本查询子内容分别与所述查询命令中的非文本查询内容组合,得到多个查询子命令;
利用所述查询子命令在预设数据存储索引表中进行搜索,得到目标索引集;
利用所述目标索引集在数据存储库中进行查询,得到查询结果。
2.根据权利要求1所述的方法,其特征在于,所述利用所述查询子命令在预设数据存储索引表中进行搜索,得到目标索引集,包括:
利用所述多个查询子命令在所述预设数据存储索引表中进行搜索,得到多个候选索引集;
计算所述多个候选索引集的交集,作为所述目标索引集。
3.根据权利要求1所述的方法,其特征在于,所述利用所述目标索引集在数据存储库中进行查询,得到查询结果,包括:
获取所述目标索引集中的索引值;
利用所述索引值在数据存储库中进行查询,得到多个查询子结果;
对于所述多个查询子结果进行组合处理,得到所述查询结果。
4.根据权利要求1-3任一所述的方法,其特征在于,还包括:
对于所述数据存储索引表进行预设维护操作。
5.一种数据查询装置,其特征在于,包括:
处理模块,被配置为接收查询命令;确定所述查询命令中的文本查询内容;对所述文本查询内容进行分词及去噪处理,得到多个文本查询子内容;将所述文本查询子内容分别与所述查询命令中的非文本查询内容组合,得到多个查询子命令,其中,所述文本查询子内容为具有独立含义的词语,所述去噪处理用于删除与查询无关的词语;
搜索模块,被配置为利用所述查询子命令在预设数据存储索引表中进行搜索,得到目标索引集;
查询模块,被配置为利用所述目标索引集在数据存储库中进行查询,得到查询结果。
6.根据权利要求5所述的装置,其特征在于,所述搜索模块包括:
搜索子模块,被配置为利用所述多个查询子命令在所述预设数据存储索引表中进行搜索,得到多个候选索引集;
计算子模块,被配置为计算所述多个候选索引集的交集,作为所述目标索引集。
7.根据权利要求5所述的装置,其特征在于,所述查询模块包括:
获取子模块,被配置为获取所述目标索引集中的索引值;
查询子模块,被配置为利用所述索引值在数据存储库中进行查询,得到多个查询子结果;
第二组合子模块,被配置为对于所述多个查询子结果进行组合处理,得到所述查询结果。
8.根据权利要求5-7任一所述的装置,其特征在于,还包括:
维护模块,被配置为对于所述数据存储索引表进行预设维护操作。
9.一种电子设备,其特征在于,包括存储器和处理器,其中,
所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现权利要求1-4任一项所述的方法步骤。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-4任一项所述的方法步骤。
CN201811014383.2A 2018-08-31 2018-08-31 数据查询方法、装置、电子设备及计算机可读存储介质 Active CN109299219B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201811014383.2A CN109299219B (zh) 2018-08-31 2018-08-31 数据查询方法、装置、电子设备及计算机可读存储介质
TW108119719A TWI745702B (zh) 2018-08-31 2019-06-06 資料查詢方法、裝置、電子設備及電腦可讀儲存媒體
US16/554,122 US11386081B2 (en) 2018-08-31 2019-08-28 System and method for facilitating efficient indexing in a database system
PCT/US2019/048909 WO2020047317A1 (en) 2018-08-31 2019-08-29 System and method for facilitating efficient indexing in a database system
SG11202012515TA SG11202012515TA (en) 2018-08-31 2019-08-29 System and method for facilitating efficient indexing in a database system
EP19768962.3A EP3844639A1 (en) 2018-08-31 2019-08-29 System and method for facilitating efficient indexing in a database system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811014383.2A CN109299219B (zh) 2018-08-31 2018-08-31 数据查询方法、装置、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109299219A CN109299219A (zh) 2019-02-01
CN109299219B true CN109299219B (zh) 2022-08-12

Family

ID=65165843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811014383.2A Active CN109299219B (zh) 2018-08-31 2018-08-31 数据查询方法、装置、电子设备及计算机可读存储介质

Country Status (6)

Country Link
US (1) US11386081B2 (zh)
EP (1) EP3844639A1 (zh)
CN (1) CN109299219B (zh)
SG (1) SG11202012515TA (zh)
TW (1) TWI745702B (zh)
WO (1) WO2020047317A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110232137B (zh) * 2019-05-10 2021-09-03 北京搜狗科技发展有限公司 一种数据处理方法、装置和电子设备
CN110362598B (zh) * 2019-06-27 2022-02-08 东软集团股份有限公司 数据查询的方法、装置、存储介质及电子设备
US11068454B2 (en) 2019-09-23 2021-07-20 Singlestore, Inc. Method of performing transactional and analytical data processing using a data structure
CN111723097A (zh) * 2020-06-29 2020-09-29 深圳壹账通智能科技有限公司 应用程序接口配置方法、装置、计算机设备和存储介质
CN112182050B (zh) * 2020-09-30 2024-04-30 中国民航信息网络股份有限公司 一种用户查询请求的处理方法、装置及电子设备
CN112579743A (zh) * 2020-12-25 2021-03-30 深圳市英威腾电气股份有限公司 一种说明书内容查询方法、装置、电子设备及存储介质
CN112800759B (zh) * 2021-04-14 2021-08-06 北京金山云网络技术有限公司 标准化数据的生成方法、医学文本数据的处理方法和装置
US20230127193A1 (en) * 2021-10-27 2023-04-27 Bank Of America Corporation System and Method for Recursive Transliteration of Machine Interpretable Languages
CN117453707A (zh) * 2023-12-09 2024-01-26 北京镜舟科技有限公司 数据更新方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064933A (zh) * 2012-12-24 2013-04-24 华为技术有限公司 数据查询方法及系统
CN104111936A (zh) * 2013-04-18 2014-10-22 阿里巴巴集团控股有限公司 数据查询方法和系统
CN105550171A (zh) * 2015-12-31 2016-05-04 北京奇艺世纪科技有限公司 一种垂直搜索引擎的查询信息纠错方法和系统
CN107346325A (zh) * 2016-05-04 2017-11-14 中国石油集团长城钻探工程有限公司 信息查询方法及装置
CN107451208A (zh) * 2017-07-12 2017-12-08 北京潘达互娱科技有限公司 一种数据搜索方法与装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW476878B (en) * 1997-06-14 2002-02-21 Sheng-Fu Lin Data indexing, searching and accessing management method
US6606626B1 (en) * 1998-10-20 2003-08-12 Sybase, Inc. Database system with lock manager enhancement for improving concurrency
JP2000315206A (ja) * 1999-04-30 2000-11-14 Fujitsu Ltd 検索条件の組み合わせに基づく検索システムおよび方法
JP2002269116A (ja) * 2001-03-13 2002-09-20 Ricoh Co Ltd 文書検索システム及びプログラム
US6980976B2 (en) * 2001-08-13 2005-12-27 Oracle International Corp. Combined database index of unstructured and structured columns
TWI234091B (en) * 2001-08-24 2005-06-11 Pchome Online Inc Method for establishing data index and its data searching method
US7617197B2 (en) * 2005-08-19 2009-11-10 Google Inc. Combined title prefix and full-word content searching
US9477609B2 (en) * 2013-04-22 2016-10-25 Sap Se Enhanced transactional cache with bulk operation
GB2531537A (en) * 2014-10-21 2016-04-27 Ibm Database Management system and method of operation
CN105045848B (zh) * 2015-06-30 2019-01-29 四川长虹电器股份有限公司 一种支持布尔表达式查询的数据库管理系统
US10896222B1 (en) * 2017-06-28 2021-01-19 Amazon Technologies, Inc. Subject-specific data set for named entity resolution
CN107562878B (zh) * 2017-08-31 2021-03-19 广东美的制冷设备有限公司 家电控制方法、电子设备和计算机可读存储介质
WO2020023787A1 (en) * 2018-07-25 2020-01-30 Oracle International Corporation Natural language interfaces for databases using autonomous agents and thesauri

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064933A (zh) * 2012-12-24 2013-04-24 华为技术有限公司 数据查询方法及系统
CN104111936A (zh) * 2013-04-18 2014-10-22 阿里巴巴集团控股有限公司 数据查询方法和系统
CN105550171A (zh) * 2015-12-31 2016-05-04 北京奇艺世纪科技有限公司 一种垂直搜索引擎的查询信息纠错方法和系统
CN107346325A (zh) * 2016-05-04 2017-11-14 中国石油集团长城钻探工程有限公司 信息查询方法及装置
CN107451208A (zh) * 2017-07-12 2017-12-08 北京潘达互娱科技有限公司 一种数据搜索方法与装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向高校信息的垂直搜索引擎的研究与实现;赵德平 等;《沈阳建筑大学学报(自然科学版)》;20120515;第28卷(第03期);第555-562页 *

Also Published As

Publication number Publication date
US20200073863A1 (en) 2020-03-05
SG11202012515TA (en) 2021-03-30
EP3844639A1 (en) 2021-07-07
WO2020047317A1 (en) 2020-03-05
TW202011224A (zh) 2020-03-16
US11386081B2 (en) 2022-07-12
CN109299219A (zh) 2019-02-01
TWI745702B (zh) 2021-11-11

Similar Documents

Publication Publication Date Title
CN109299219B (zh) 数据查询方法、装置、电子设备及计算机可读存储介质
JP5721818B2 (ja) 検索におけるモデル情報群の使用
US8443006B1 (en) Data propagation in a multi-shard database system
US20230273923A1 (en) Generating and/or utilizing a machine learning model in response to a search request
JP7451747B2 (ja) コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
US9563691B2 (en) Providing search suggestions from user selected data sources for an input string
US20130339369A1 (en) Search Method and Apparatus
US9798833B2 (en) Accessing information content in a database platform using metadata
JP2011008420A (ja) カテゴリを対応付けする装置、方法、およびプログラム
CN107609192A (zh) 一种搜索引擎的补充搜索方法和装置
CN110737824B (zh) 内容查询方法和装置
CN116594683A (zh) 一种代码注释信息生成方法、装置、设备及存储介质
CN110008396B (zh) 对象信息推送方法、装置、设备及计算机可读存储介质
CN114756570A (zh) 采购场景的垂直搜索方法、装置和系统
CN116383340A (zh) 信息搜索方法、装置、电子设备和存储介质
CN107908724B (zh) 一种数据模型匹配方法、装置、设备及存储介质
TWI547888B (zh) A method of recording user information and a search method and a server
CN111309704B (zh) 数据库操作方法和数据库操作系统
CN115146030A (zh) 一种基于知识图谱的公务文书写作方法及系统
CN114237588A (zh) 一种代码仓库选择方法、装置、设备及存储介质
CN113076322A (zh) 一种商品搜索处理方法及装置
JPH11232154A (ja) 複数データベース異種性解消検索方法および装置と複数データベース異種性解消検索プログラムを記録した記録媒体
KR101137056B1 (ko) 자동 상품모델 추천 로직을 이용한 상품 정보 등록 방법 및시스템
KR102588238B1 (ko) 컨텐츠 제작 어플리케이션 및 상기 컨텐츠 제작 어플리케이션 구동 방법
CN117971873A (zh) 一种生成结构化查询语言sql的方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210202

Address after: 801-10, Section B, 8th floor, 556 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province

Applicant after: Ant financial (Hangzhou) Network Technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Innovative advanced technology Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210906

Address after: 100020 unit 02, 901, floor 9, unit 1, building 1, No.1, East Third Ring Middle Road, Chaoyang District, Beijing

Applicant after: Beijing Aoxing Beisi Technology Co.,Ltd.

Address before: 801-10, Section B, 8th floor, 556 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province 310000

Applicant before: Ant financial (Hangzhou) Network Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant