CN115495478A - 数据查询方法、装置、电子设备以及存储介质 - Google Patents
数据查询方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN115495478A CN115495478A CN202211205488.2A CN202211205488A CN115495478A CN 115495478 A CN115495478 A CN 115495478A CN 202211205488 A CN202211205488 A CN 202211205488A CN 115495478 A CN115495478 A CN 115495478A
- Authority
- CN
- China
- Prior art keywords
- target edge
- edge node
- data
- information
- queried
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请的实施例揭示了数据查询方法、装置、电子设备及计算机可读存储介质。本方法包括中央节点获取待查询信息对应的业务类型,从多个边缘节点中确定与业务类型对应的多个目标边缘节点,其中,各个目标边缘节点的注册信息包括业务类型;中央节点将待查询信息发送至各个目标边缘节点,其中,各个目标边缘节点位于不同的区域;各个目标边缘节点在本地存储的数据集合中查询与待查询信息相关的候选数据,各个目标边缘节点分别将得到的包括候选数据的查询结果发送至中央节点;中央节点将各个目标边缘节点对应的查询结果进行汇总,得到最终的查询结果。本申请能够提高数据查询效率。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种数据查询方法、数据查询控制装置、电子设备以及存储介质。
背景技术
目前很多行业的数据仍以非结构化的为主,占比高达80%左右,非结构化数据体积大、信息杂乱无章,传输和分析均较为困难,且因为私密、价值等原因各地、各机构、企业、分公司、部门等均不想将数据共享出去,且按照传统方法对数据进行ETL(Extract-Transform-Load)(清洗、转换、加载)操作,工作量巨大,费时费力。例如司法行业,有上亿的裁判文书,且大部分都是长文本,少则几百,多则几千、上万,如何快速的从这些长文本中进行价值挖掘是很需要解决的问题。
发明内容
为解决上述技术问题,本申请的实施例提供了一种数据查询方法、数据查询控制装置、电子设备以及计算机可读存储介质,能够提高数据查询的效率。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种数据查询方法,应用于数据查询系统,所述数据查询系统包括中央节点和与所述中央节点连接的多个边缘节点,包括:中央节点获取待查询信息对应的业务类型,从所述多个边缘节点中确定与所述业务类型对应的多个目标边缘节点,其中,各个目标边缘节点的注册信息包括所述业务类型;所述中央节点将所述待查询信息发送至各个目标边缘节点,其中,各个目标边缘节点位于不同的区域;各个目标边缘节点在本地存储的数据集合中查询与所述待查询信息相关的候选数据,各个目标边缘节点分别将得到的包括候选数据的查询结果发送至所述中央节点;所述中央节点将各个目标边缘节点对应的查询结果进行汇总,得到最终的查询结果。
根据本申请实施例的一个方面,提供了一种数据查询控制装置,用于控制数据查询系统,所述数据查询系统包括中央节点和与所述中央节点连接的多个边缘节点,包括:确定模块,用于控制中央节点获取待查询信息对应的业务类型,从所述多个边缘节点中确定与所述业务类型对应的多个目标边缘节点,其中,各个目标边缘节点的注册信息包括所述业务类型;发送模块,用于控制所述中央节点将所述待查询信息发送至各个目标边缘节点,其中,各个目标边缘节点位于不同的区域;查询模块,用于控制各个目标边缘节点基于所述待查询信息在本地存储的数据集合中进行查询,各个目标边缘节点分别将得到的查询结果发送至所述中央节点;汇总模块,用于控制所述中央节点将各个目标边缘节点对应的查询结果进行汇总,得到最终的查询结果。
根据本申请实施例的一个方面,提供了一种电子设备,包括处理器及存储器,存储器上存储有计算机可读指令,计算机可读指令被处理器执行时实现如上数据查询方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,当计算机可读指令被计算机的处理器执行时,使计算机执行如前提供的数据查询方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施例中提供的数据查询方法。
本申请的实施例所提供的技术方案,中央节点获取待查询信息对应的业务类型,从所述多个边缘节点中确定与所述业务类型对应的多个目标边缘节点,其中,各个目标边缘节点的注册信息包括所述业务类型;所述中央节点将所述待查询信息发送至各个目标边缘节点,其中,各个目标边缘节点位于不同的区域;各个目标边缘节点在本地存储的数据集合中查询与所述待查询信息相关的候选数据,各个目标边缘节点分别将得到的包括候选数据的查询结果发送至所述中央节点;所述中央节点将各个目标边缘节点对应的查询结果进行汇总,得到最终的查询结果。上述方案中,各个目标边缘节点分别进行数据查询,与传统方式相比,无需对边缘节点存储的本地数据进行移动,提高数据的安全性和隐私性;另外,多个边缘节点分别负责一部分的查询任务,且能够同步进行数据查询,减轻处理器的任务量,提高数据查询的效率;最后,中央节点将各个边缘节点按照业务类型分类,在客户端发送的待查询信息之后,根据待查询信息中包括的业务类型筛选出一部分与该业务类型对应的边缘节点,通过这种方式,缩小数据查询的范围,能够提高数据查询的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本申请一个示例性实施例示出的本发明所涉及的实施环境的示意图;
图2是本申请的一示例性实施例示出的数据查询方法的流程图;
图3是一示例性示出的中央节点中基于业务类型对边缘节点进行聚类的距离结果的示意图;
图4是图2所示实施例中的步骤S103在一示例性实施例的流程图;
图5是图2所示实施例中的步骤S201在一示例性实施例的流程图;
图6是图2所示实施例中的步骤S203在一示例性实施例的流程图;
图7是图2所示实施例中的步骤S203在一示例性实施例的流程图;
图8是在图2所示实施例的基础上提出的数据查询方法的流程图;
图9是本申请一示例性实施例示出的数据查询控制装置的框图;
图10示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
还需要说明的是:在本申请中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
图1是本申请一个示例性实施例示出的本发明所涉及的实施环境的示意图。如图1所示,本发明所涉及的实施环境包括中央节点和多个边缘节点,其中,中央节点与边缘节点1、边缘节点2和边缘节点3连接;其中,中央节点、边缘节点1、边缘节点2和边缘节点3位于不同的区域,此处不同的区域既可以表示地域的不同,A国的B城市、C城市以及D城市的数据库为边缘节点1、边缘节点2和边缘节点3,D城市为中央节点;又例如,中央节点为某公司的总部,边缘节点1、边缘节点2和边缘节点3分别为该公司位于不同地区的三个子公司。
不同的区域也可以表示虚拟域的不同,例如,公司B的a部门、b部门以及c部分分别为边缘节点1、边缘节点2和边缘节点3,公司B的d部分为中央节点,其中,公司B的所有部分均在同一个地址。
示例性地,用户端在有查询数据的需求时,发送查询结果至中央节点,中央节点将待查询信息转发至边缘节点1、边缘节点2和边缘节点3,边缘节点1、边缘节点2和边缘节点3基于待查询信息在本地存储的数据集合中进行查询,边缘节点1将得到的第一查询结果发送至中央节点,边缘节点2将得到的第二查询结果发送至中央节点,边缘节点3将得到的第三查询结果发送至中央节点,中央节点将第一查询结果、第二查询结果以及第三查询结果进行汇总,并将得到的查询结果发送至用户端。
中央节点、边缘节点1、边缘节点2和边缘节点3均可以是智能手机、平板电脑、PC(Personal Computer,个人计算机)、智能语音交互设备、智能家电、车載终端、飞行器或者其它电子设备,本处不进行限制。服务器30可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content DeliveryNetwork,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器,在此也不进行限制。
请参阅图2,图2是本申请的一示例性实施例示出的数据查询方法的流程图,如图2所示,本实施例提供的数据查询方法包括步骤S101-步骤S104,详细描述参考如下:
步骤S101:中央节点获取待查询信息对应的业务类型,从多个边缘节点中确定与业务类型对应的多个目标边缘节点。
在本实施例中,待查询信息提供多种形式供用户端提交,例如文本、图像、视频、音频等等,在此不做具体限定,可以理解的是,若待查询信息为图像、视频、图像、音频等形式存在,中央节点利用现有文本提取方式进行文本提取,得到统一的文本形式。
在本实施例中,数据查询系统中的边缘节点在参与数据查询之前,需在中央节点中进行注册。在请求注册时,边缘节点发送的注册申请请求中应包括对应边缘节点执行业务的业务类型至中央节点,以使得中央节点基于该边缘节点对应的业务类型对其进行聚类。可以理解的是,一个边缘节点执行的业务类型可能不止一种,因此,一个边缘节点可能属于多个业务类型的类别中。
参阅图3,图3是一示例性示出的中央节点中基于业务类型对边缘节点进行聚类的距离结果的示意图,如图3所示,本实施例的数据查询系统包括中央节点和四个边缘节点,其中,边缘节点1发送的注册申请请求包括业务类型1和业务类型2,则中央节点将边缘节点1关联至业务类型1包括的边缘节点类别和业务类型2包括的边缘节点类别;边缘节点2发送的注册申请请求包括业务类型1和业务类型2,则中央节点将边缘节点2关联至业务类型1包括的边缘节点类别和业务类型2包括的边缘节点类别;边缘节点3发送的注册申请请求包括业务类型1,则中央节点将边缘节点1关联至业务类型1包括的边缘节点类别;边缘节点4发送的注册申请请求包括业务类型2,则中央节点将边缘节点1关联至业务类型2包括的边缘节点类别。
可以理解的是,中央节点还可以根据各个边缘节点的注册更新请求对对应边缘节点的聚类状态进行更新,在新的边缘节点加入数据查询系统之后,主动发送注册邀请至该边缘节点。
本实施例考虑到,数据查询系统中包括的多个边缘节点处理的业务类型多种多样,而不同业务类型决定了对应边缘节点本地存储的数据集合中数据的类型,因此,若中央节点能将各个边缘节点按照业务类型分类,在客户端发送的待查询信息之后,根据待查询信息中包括的业务类型筛选出一部分与该业务类型对应的边缘节点,通过这种方式,缩小数据查询的范围,能够提高数据查询的效率。
示例性地,中央节点保存各个边缘节点的注册信息,注册信息中包括对应边缘节点的业务类型。中央节点通过查询边缘节点的注册信息确定与业务类型对应的多个目标边缘节点。
步骤S102:中央节点将待查询信息发送至各个目标边缘节点。
在本实施例中,中央节点将待查询信息发送至各个目标边缘节点,以使得各个边缘节点在本地存储的数据集合中查询该待查询信息。
步骤S103:各个目标边缘节点在本地存储的数据集合中查询与待查询信息相关的候选数据,各个目标边缘节点分别将得到的包括候选数据的查询结果发送至中央节点。
示例性地,分别计算目标边缘节点在本地存储的数据集合中的每个数据与待查询信息的相关度,将相关度大于预设阈值的数据作为待查询信息相关的候选数据。示例性地,在计算目标边缘节点在本地存储的数据集合中的每个数据与待查询信息的相关度时,可将欧氏距离或者余弦角度作为两者的相似度,在此不做具体限定。
在本实施例中,由于各个目标边缘节点只在本地存储的数据集合中进行查询,可见,各个目标边缘节点的查询范围小于总的查询范围,总的查询范围是所有目标边缘节点本地存储的数据总和,因此,各个目标边缘节点分别将得到的包括候选数据的查询结果发送至中央节点,中央节点对所有查询结果进行汇总,从而提高数据查询精度。
在本实施例中,各个目标边缘节点分别进行数据查询,与传统方式相比,一方面无需对边缘节点存储的本地数据进行移动,提高数据的安全性和隐私性;另一方面,多个边缘节点分别负责一部分的查询任务,且能够同步进行数据查询,减轻处理器的任务量,提高数据查询的效率。
步骤S104:中央节点将各个目标边缘节点对应的查询结果进行汇总,得到最终的查询结果。
本实施例可以基于多种方式对各个目标边缘节点对应的查询结果进行汇总,在此不做具体限定。
示例性地,对各个目标边缘节点对应的查询结果包括的候选数据进行去重处理,然后将所有目标边缘节点对应的查询结果包括的候选数据作为最终的查询结果。
示例性地,各个目标边缘节点的查询结果包括各个候选数据的相似度,基于各个候选数据的相似度对各个候选数据进行排序,将相似度大于预设阈值的候选数据作为最终的查询结果中包括的数据,将相似度小于或等于预设阈值的候选数据舍弃。
本实施例提供的数据查询方法,中央节点获取待查询信息对应的业务类型,从多个边缘节点中确定与业务类型对应的多个目标边缘节点,其中,各个目标边缘节点的注册信息包括业务类型;中央节点将待查询信息发送至各个目标边缘节点,其中,各个目标边缘节点位于不同的区域;各个目标边缘节点在本地存储的数据集合中查询与待查询信息相关的候选数据,各个目标边缘节点分别将得到的包括候选数据的查询结果发送至中央节点;中央节点将各个目标边缘节点对应的查询结果进行汇总,得到最终的查询结果。上述方案中,各个目标边缘节点分别进行数据查询,与传统方式相比,无需对边缘节点存储的本地数据进行移动,提高数据的安全性和隐私性;另外,多个边缘节点分别负责一部分的查询任务,且能够同步进行数据查询,减轻处理器的任务量,提高数据查询的效率;最后,中央节点将各个边缘节点按照业务类型分类,在客户端发送的待查询信息之后,根据待查询信息中包括的业务类型筛选出一部分与该业务类型对应的边缘节点,通过这种方式,缩小数据查询的范围,能够提高数据查询的效率。
示例性地,参阅图4,图4是图2所示实施例中的步骤S103在一示例性实施例的流程图,如图4所示,步骤S103包括步骤S201-步骤S203,详细描述参考如下:
步骤S201:各个目标边缘节点在向量索引中获取每个数据,并计算对应数据与待查询信息的相似度,将相似度大于第一预设阈值的数据作为对应目标边缘节点的候选数据,基于对应目标边缘节点的候选数据确定对应目标边缘节点的第一查询结果。
在关系数据库中,索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结构,是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容。在本实施例中,各个目标边缘节点为本地存储的数据集合构建索引,以便于快速查询数据集合中的数据,提高数据查询的效率。示例性地,各个目标边缘节点为本地存储的数据集合构建向量索引和倒排索引。
向量索引(vector index)是指通过某种数学模型,对向量构建的一种时间和空间上更高效的数据结构。借助向量索引,我们能够高效地查询与目标向量相似的若干个向量。
本实施例并不限制构建向量索引的方式,例如,基于量化的IVF_FLAT、IVF_SQ8、IVF_PQ、基于树的ANNOY、基于图的HNSW、IVF_HNSW、RHNSW_FLAT、RHNSW_SQ等,本实施例可以基于内存的使用量和返回结果的匹配度的不同,可以选择不同的方式,在此不做过多叙述。
倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。
示例性地,各个目标边缘节点预先基于本地存储的数据集合确定多个关键词,然后以关键词为健,文档为值,构建词与文档的映射关系,同时记录词频(Term Frequency,TF)和逆文档频率(Inverse Document Frequency,IDF),在查询数据时可以基于TF、IDF快速计算相似距离。
示例性地,基于历史查询信息确定各个目标边缘节点的关键词,例如,统计预设时间段内的历史查询信息包括的实词的频次,将频次大于预设阈值的关键词作为关键词,通过这种方式,将倒排索引的关键词与历史查询信息进行关联,在数据查询的过程中,避免倒排索引中无法查询与各个实词对应的关键词的情况发生。
在本实施例中,各个目标边缘节点在向量索引中查询每个数据,并计算对应数据与待查询信息的相似度,将相似度大于第一预设阈值的数据作为候选数据,基于得到的候选数据确定第一查询结果。通过这种方式,能够快速查询各个目标边缘节点本地存储的数据集合中的数据,提高数据查询的效率。
示例性地,在各个目标边缘节点在向量索引中查询每个数据,并计算对应数据与待查询信息的相似度之前,各个目标边缘节点构建并训练词向量模型,用于提取待查询数据和数据集合中的各个数据的语义向量,各个目标边缘节点在向量索引中查询每个数据,将对应数据和待查询信息先后输入对应的词向量模型,计算输出的待查询信息的语义向量和对应数据的语义向量的相似度,将相似度大于第一预设阈值的数据作为候选数据,基于得到的候选数据确定第一查询结果。示例性地,考虑到如果模型不一致,最终融合时导致彼此之间的相似距离不可比较,无法融合,各个目标边缘节点使用相同的词向量模型。示例性地,为提高词向量模型的精度,利用联邦学习的方式在中央节点训练词向量模型的模型参数,最终得到的词向量模型既保证了各个目标边缘节点的数据隐私性,又关联了各个目标边缘节点中的训练数据,因此提高了词向量模型的模型精度。
本实施例并不限制词向量模型的网络结构,例如,BERT(Bidirectional EncoderRepresentation from Transformers)模型,RoBERTa(A Robustly Optimized BERTPretraining Approach)模型等等。
示例性地,参阅图5,图5是图2所示实施例中的步骤S201在一示例性实施例的流程图,如图5所示,步骤S201包括步骤S301-步骤S303,详细描述参考如下:
步骤S301:各个目标边缘节点将待查询信息划分为多个子待查询信息。
考虑到大多数网络模型都存在一个问题,即处理文本有长度限制,例如只能处理前512个字符,而现实中很多文档都会超过这个长度限制,比如司法文书,一个司法案例的内容可能有几千行,只处理512个字符,显然会丢失很多重要信息,为解决上述问题,本实施例将待查询信息划分为多个子查询信息,每个字查询信息的长度小于预设阈值,在本实施例中,该预设阈值与训练的词向量模型的单次处理文本长度相关联,示例性地,预设阈值等于词向量模型的单次处理文本长度。
在本实施例中,将每个子查询文本输入至预先训练好的词向量模型,输出每个子查询文本的语义向量。
步骤S302:对多个子待查询信息的语义向量进行池化处理,得到待查询信息的语义向量。
池化(Pooling)是卷积神经网络中的一个重要的概念,是一种形式的降采样处理过程,现有技术存在多种不同形式的非线性池化函数,而最大池化(Max pooling)是最为常见的。它是将输入的图像划分为若干个矩形区域,对每个子区域输出最大值。这种机制能够有效的原因在于,在发现一个特征之后,它的精确位置远不及它和其他特征的相对位置的关系重要。池化层会不断地减小数据的空间大小,因此参数的数量和计算量也会下降,这在一定程度上也控制了过拟合。示例性地,本实施例可以基于最大池化算法、均值池化算法等对多个子待查询信息的语义向量进行池化处理。
步骤S303:计算对应数据的语义向量与待查询信息的语义向量的相似度,将相似度大于第一预设阈值的数据作为对应目标边缘节点的候选数据,基于对应目标边缘节点的候选数据确定对应目标边缘节点的的第一查询结果。
待查询信息进行划分、池化等一系列操作之后,得到的语义向量的维度相对较低,通过这种方式可以针对任意长度的待查询信息进行向量化,又可以防止词向量模型输出的语义向量过拟合。
步骤S202:各个目标边缘节点在倒排索引中获取每个数据,并计算对应数据与待查询信息的相似度,将相似度大于第二预设阈值的数据作为对应目标边缘节点的候选数据,基于对应目标边缘节点的候选数据确定对应目标边缘节点的第二查询结果。
由于倒排索引中的键为预设的多个关键词,值为包括对应键的所有数据的集合,因此,本实施例首先将待查询信息划分为多个实词,然后在倒排索引中查询与各个实词相关的关键词对应的键值,也即,包括与各个实词相关的关键词的所有数据,计算这些数据与待查询信息的相似度,将相似度大于第二预设阈值的数据作为候选数据,基于得到的候选数据确定第二查询结果。
示例性地,参阅图6,图6是图2所示实施例中的步骤S203在一示例性实施例的流程图,如图6所示,步骤S203包括步骤S401-步骤S403,详细描述参考如下:
步骤S401:各个目标边缘节点对待查询信息进行分词,得到多个实词。
在本实施例中,对待查询信息进行分词之后,将各个词语进行去重、去停用词等处理,得到多个实词,例如,将语气助词、标点符号等重要程度较低的词语去除。
步骤S402:基于各个实词在待查询信息的IF-IDF值,得到待查询信息的第一词频向量。
在本实施例中,通过以下公式计算各个实词在待查询信息的IF-IDF值:
其中,IF-IDF1i表示第i个实词在待查询信息的IF-IDF值,tf1i表示第i个实词在待查询信息中的频次,q11表示待查询信息包含的实词总数,q12表示待查询信息的文本总数,q1i表示包含第i个实词的文本总数。
示例性地,将各个实词在待查询信息的IF-IDF值所组成的向量作为第一词频向量。
步骤S403:在对应目标边缘节点的倒排索引中获取与各个实词对应的数据,基于各个实词在对应数据中的IF-IDF值,得到对应数据的第二词频向量。
在本实施例中,将各个实词分别与倒排索引进行匹配,确定每个实词在倒排索引中相匹配的关键词,获取对应关键词的键值,将该键值作为对应实词对应的数据。通过这种方式,能够将查询范围从整个倒排索引缩小到与各个实词相匹配的关键词的键值,能够大大加快数据查询速度。
在本实施例中,通过以下公式计算各个实词在在对应数据中的IF-IDF值:
其中,IF-IDF2i表示第i个实词在对应数据的IF-IDF值,tf2i表示第i个实词在对应数据中的频次,q21表示对应数据包含的实词总数,q22表示对应数据的文本总数,q2i表示包含第i个实词的文本总数。
示例性地,将各个实词在对应数据的IF-IDF值所组成的向量作为对应数据的第二词频向量。其中,第一词频向量和第二词频向量在对应位置的元素为相同实词对应在待查询信息和对应数据的IF-IDF值。
步骤S404:对应目标边缘节点计算第一词频向量和各个数据对应的第二词频向量的相似度,基于相似度大于第二预设阈值的候选数据确定对应目标边缘节点的第二查询结果。
步骤S203:各个目标边缘节点基于对应的第一查询结果和第二查询结果确定对应目标边缘节点的查询结果。
示例性地,参阅图7,图7是图2所示实施例中的步骤S203在一示例性实施例的流程图,如图7所示,步骤S203包括步骤S601-步骤S602,详细描述参考如下:
步骤S601:若存在目标边缘节点的第一查询结果和第二查询结果均包括目标候选数据,将对应目标边缘节点的目标候选数据的第一相似度和第二相似度的加权和作为对应目标边缘节点的目标候选数据的相似度。
在本实施例中,各个目标边缘节点的第一查询结果包括待查询信息与各个候选数据之间的第一相似度,各个目标边缘节点的第二查询结果包括待查询信息与各个候选数据之间的第二相似度。
由于各个目标边缘节点基于向量索引进行数据查询和基于倒排索引进行数据查询的查询范围都是对应目标边缘节点本地存储的数据,因此,上述两种查询方式得到的查询结果可能包括重复的数据,而相同的数据在两种查询方式中与待查询信息的相似度可能不同,为合理确定发生重复的数据与待查询信息的相似度,本实施例基于两种查询方式针对该重复候选数据的相似度确定最终的相似度,提高数据查询的准确性。
在本实施例中,预先为两种向量索引查询方式和倒排索引查询方式配置对应的相似度权重,示例性地,各个目标边缘节点基于预设时间段内的历史
统计第一查询结果和第二查询结果中各个候选数据对最终的查询结果的贡献大小,例如,在多次数据查询流程中,第一查询结果中包括的候选数据在最终的查询结果中的占比大于第一查询结果中包括的候选数据在最终的查询结果中的占比,则设置向量索引查询方式的相似度权重大于倒排索引查询方式的相似度权重;或者,多次数据查询流程中,基于第一查询结果中包括的候选数据在最终的查询结果中的占比确定向量索引查询方式的相似度权重,基于第一查询结果中包括的候选数据在最终的查询结果中的占比确定倒排索引查询方式的相似度权重。
在本实施例中,中央节点将对应目标边缘节点的目标候选数据的第一相似度和第二相似度的加权和作为对应目标边缘节点的目标候选数据的相似度。
步骤S602:若对应目标边缘节点的目标候选数据的相似度大于第三预设阈值,中央节点将对应目标边缘节点的目标候选数据作为对应目标边缘节点的查询结果中一个候选数据。
示例性地,参阅图8,图8是在图2所示实施例的基础上提出的数据查询方法的流程图,如图8所示,本实施例提供的数据查询方法还包括步骤S501-步骤S502,详细描述参考如下:
步骤S501:各个目标边缘节点基于对应的业务类型将本地存储的数据集合划分为与各个业务类型对应的子数据集合。
本实施例考虑到目标边缘节点可能包括多个业务类型的数据,因此能够进一步提升数据查询效率,各个目标边缘节点基于对应的业务类型将本地存储的数据集合划分为与各个业务类型对应的子数据集合,在进行数据查询时,基于待查询信息的业务类型进一步缩小查询范围。
步骤S502:各个目标业务节点分别为各个业务类型对应的子数据集合构建对应的子向量索引和子倒排索引。
示例性地,各个目标边缘节点基于待查询信息在待查询信息对应的业务类型的子向量索引和子倒排索引进行查询,获取与待查询信息相关的候选数据。也即,各个目标边缘节点基于待查询信息对应的业务类型,确定对应的子向量索引和子倒排索引,然后在对应的子向量索引检索与待查询信息相关的候选数据,以及在对应的子倒排索引中检索与待查询信息相关的候选数据。
本实施例各个目标边缘节点基于对应的业务类型将本地存储的数据集合划分为与各个业务类型对应的子数据集合,在进行数据查询时,基于待查询信息的业务类型进一步缩小查询范围,能够进一步提升数据查询效率。
参与图9,图9是本申请一示例性实施例示出的数据查询控制装置的框图,如图9所示,数据查询控制装置700包括确定模块701、发送模块702、查询模块703以及汇总模块704。
其中,确定模块701用于控制中央节点获取待查询信息对应的业务类型,从多个边缘节点中确定与业务类型对应的多个目标边缘节点,其中,各个目标边缘节点的注册信息包括业务类型;发送模块702用于控制中央节点将待查询信息发送至各个目标边缘节点,其中,各个目标边缘节点位于不同的区域;查询模块703用于控制各个目标边缘节点基于待查询信息在本地存储的数据集合中进行查询,各个目标边缘节点分别将得到的查询结果发送至中央节点;汇总模块704用于控制中央节点将各个目标边缘节点对应的查询结果进行汇总,得到最终的查询结果。
在另一示例性实施例中,查询模块703包括第一查询单元、第二查询单元和确定单元。
其中,第一查询单元用于控制各个目标边缘节点在向量索引中获取每个数据,并计算对应数据与待查询信息的相似度,将相似度大于第一预设阈值的数据作为对应目标边缘节点的候选数据,基于对应目标边缘节点的候选数据确定对应目标边缘节点的第一查询结果;第二查询单元用于控制各个目标边缘节点在倒排索引中获取每个数据,并计算对应数据与待查询信息的相似度,将相似度大于第二预设阈值的数据作为对应目标边缘节点的候选数据,基于对应目标边缘节点的候选数据确定对应目标边缘节点的第二查询结果;确定单元用于控制各个目标边缘节点基于对应的第一查询结果和第二查询结果确定对应目标边缘节点的查询结果;其中,各个目标边缘节点的向量索引和倒排索引是对应目标边缘节点预先为本地存储的数据集合构建的。
在另一示例性实施例中,第二查询单元包括分词子单元、第一计算子单元、第二计算子单元以及确定子单元。
其中,分词子单元用于控制各个目标边缘节点对待查询信息进行分词,得到多个实词;第一计算子单元用于控制基于各个实词在待查询信息的IF-IDF值,得到待查询信息的第一词频向量;第二计算子单元用于控制在对应目标边缘节点的倒排索引中获取与各个实词对应的数据,基于各个实词在对应数据中的IF-IDF值,得到对应数据的第二词频向量;确定子单元用于控制对应目标边缘节点计算第一词频向量和各个数据对应的第二词频向量的相似度,基于相似度大于第二预设阈值的候选数据确定对应目标边缘节点的第二查询结果。
在另一示例性实施例中,确定单元包括第三计算子单元和查询结果获取子单元,其中,第三计算子单元用于控制若存在目标边缘节点的第一查询结果和第二查询结果均包括目标候选数据,中央节点将对应目标边缘节点的目标候选数据的第一相似度和第二相似度的加权和作为对应目标边缘节点的目标候选数据的相似度;查询结果获取子单元用于控制若对应目标边缘节点的目标候选数据的相似度大于第三预设阈值,中央节点将对应目标边缘节点的目标候选数据作为对应目标边缘节点的查询结果中一个候选数据。
在另一示例性实施例中,本实施例的数据查询控制装置700还包括划分模块和构建模块,其中,划分模块用于控制各个目标边缘节点基于对应的业务类型将本地存储的数据集合划分为与各个业务类型对应的子数据集合;构建模块用于控制各个目标业务节点分别为各个业务类型对应的子数据集合构建对应的子向量索引和子倒排索引。
在另一示例性实施例中,第一查询单元包括划分子单元、池化子单元、第四计算子单元。
其中,划分子单元用于控制各个目标边缘节点将待查询信息划分为多个子待查询信息;池化子单元用于控制对多个子待查询信息的语义向量进行池化处理,得到待查询信息的语义向量;第四计算子单元用于控制计算对应数据的语义向量与待查询信息的语义向量的相似度,将相似度大于第一预设阈值的数据作为对应目标边缘节点的候选数据,基于对应目标边缘节点的候选数据确定对应目标边缘节点的的第一查询结果。
需要说明的是,上述实施例所提供的装置与上述实施例所提供的方法属于同一构思,其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
在另一示例性实施例中,本申请提供一种电子设备,包括处理器和存储器,其中,存储器上存储有计算机可读指令,该计算机可读指令被处理器执行时实现如前的数据查询方法。在本实施例中,电子设备包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等。
图10示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图10示出的电子设备的计算机系统1000仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图10所示,计算机系统1000包括中央处理单元(Central Processing Unit,CPU)1001,其可以根据存储在只读存储器(Read-Only Memory,ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(Random Access Memory,RAM)1003中的程序而执行各种适当的动作和处理,例如执行上述实施例中的信息推荐方法。在RAM 1003中,还存储有系统操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(Input/Output,I/O)接口1005也连接至总线1004。
以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
可以理解的是,在本申请的具体实施方式中,涉及到用户信息***等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本申请的另一方面还提供了一种计算机可读存储介质,其上存储有计算机可读指令,该计算机可读指令被处理器执行时实现如前实施例中任一项的数据查询方法。
本申请的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的数据查询方法。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
上述内容,仅为本申请的较佳示例性实施例,并非用于限制本申请的实施方案,本领域普通技术人员根据本申请的主要构思和精神,可以十分方便地进行相应的变通或修改,故本申请的保护范围应以权利要求书所要求的保护范围为准。
Claims (10)
1.一种数据查询方法,其特征在于,应用于数据查询系统,所述数据查询系统包括中央节点和与所述中央节点连接的多个边缘节点,包括:
中央节点获取待查询信息对应的业务类型,从所述多个边缘节点中确定与所述业务类型对应的多个目标边缘节点,其中,各个目标边缘节点的注册信息包括所述业务类型;
所述中央节点将所述待查询信息发送至各个目标边缘节点,其中,各个目标边缘节点位于不同的区域;
各个目标边缘节点在本地存储的数据集合中查询与所述待查询信息相关的候选数据,各个目标边缘节点分别将得到的包括候选数据的查询结果发送至所述中央节点;
所述中央节点将各个目标边缘节点对应的查询结果进行汇总,得到最终的查询结果。
2.根据权利要求1所述的方法,其特征在于,所述各个目标边缘节点在本地存储的数据集合中查询与所述待查询信息相关的候选数据包括:
各个目标边缘节点在向量索引中获取每个数据,并计算对应数据与所述待查询信息的相似度,将相似度大于第一预设阈值的数据作为对应目标边缘节点的候选数据,基于对应目标边缘节点的候选数据确定对应目标边缘节点的第一查询结果;
各个目标边缘节点在倒排索引中获取每个数据,并计算对应数据与所述待查询信息的相似度,将相似度大于第二预设阈值的数据作为对应目标边缘节点的候选数据,基于对应目标边缘节点的候选数据确定对应目标边缘节点的第二查询结果;
各个目标边缘节点基于对应的第一查询结果和第二查询结果确定对应目标边缘节点的查询结果;
其中,各个目标边缘节点的向量索引和倒排索引是对应目标边缘节点预先为本地存储的数据集合构建的。
3.根据权利要求2所述的方法,其特征在于,所述各个目标边缘节点在倒排索引中获取每个数据,并计算对应数据与所述待查询信息的相似度,将相似度大于第二预设阈值的数据作为对应目标边缘节点的候选数据,基于对应目标边缘节点的候选数据确定对应目标边缘节点的第二查询结果包括:
各个目标边缘节点对所述待查询信息进行分词,得到多个实词;
基于各个实词在所述待查询信息的IF-IDF值,得到所述待查询信息的第一词频向量;
在对应目标边缘节点的倒排索引中获取与各个实词对应的数据,基于各个实词在对应数据中的IF-IDF值,得到对应数据的第二词频向量;
对应目标边缘节点计算所述第一词频向量和各个数据对应的第二词频向量的相似度,基于相似度大于所述第二预设阈值的候选数据确定对应目标边缘节点的所述第二查询结果。
4.根据权利要求2所述的方法,其特征在于,各个目标边缘节点的第一查询结果包括所述待查询信息与各个候选数据之间的第一相似度,各个目标边缘节点的第二查询结果包括所述待查询信息与各个候选数据之间的第二相似度;所述各个目标边缘节点基于对应的第一查询结果和第二查询结果确定对应目标边缘节点的查询结果包括:
若存在目标边缘节点的所述第一查询结果和第二查询结果均包括目标候选数据,所述中央节点将对应目标边缘节点的目标候选数据的第一相似度和第二相似度的加权和作为对应目标边缘节点的目标候选数据的相似度;
若对应目标边缘节点的目标候选数据的相似度大于第三预设阈值,所述中央节点将对应目标边缘节点的目标候选数据作为对应目标边缘节点的查询结果中一个候选数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
各个目标边缘节点基于对应的业务类型将本地存储的数据集合划分为与各个业务类型对应的子数据集合;
各个目标业务节点分别为各个业务类型对应的子数据集合构建对应的子向量索引和子倒排索引。
6.根据权利要求5所述的方法,其特征在于,所述各个目标边缘节点在本地存储的数据集合中查询与所述待查询信息相关的候选数据包括:
各个目标边缘节点基于所述待查询信息在所述待查询信息对应的业务类型的子向量索引和子倒排索引进行查询,获取与所述待查询信息相关的候选数据。
7.根据权利要求2所述的方法,其特征在于,所述各个目标边缘节点在向量索引中获取每个数据,并计算对应数据与所述待查询信息的相似度,将相似度大于第一预设阈值的数据作为对应目标边缘节点的候选数据,基于对应目标边缘节点的候选数据确定对应目标边缘节点的第一查询结果包括:
各个目标边缘节点将所述待查询信息划分为多个子待查询信息;
对所述多个子待查询信息的语义向量进行池化处理,得到所述待查询信息的语义向量;
计算对应数据的语义向量与所述待查询信息的语义向量的相似度,将相似度大于所述第一预设阈值的数据作为对应目标边缘节点的候选数据,基于对应目标边缘节点的候选数据确定对应目标边缘节点的的第一查询结果。
8.一种数据查询控制装置,用于控制数据查询系统,所述数据查询系统包括中央节点和与所述中央节点连接的多个边缘节点,其特征在于,包括:
确定模块,用于控制中央节点获取待查询信息对应的业务类型,从所述多个边缘节点中确定与所述业务类型对应的多个目标边缘节点,其中,各个目标边缘节点的注册信息包括所述业务类型;
发送模块,用于控制所述中央节点将所述待查询信息发送至各个目标边缘节点,其中,各个目标边缘节点位于不同的区域;
查询模块,用于控制各个目标边缘节点基于所述待查询信息在本地存储的数据集合中进行查询,各个目标边缘节点分别将得到的查询结果发送至所述中央节点;
汇总模块,用于控制所述中央节点将各个目标边缘节点对应的查询结果进行汇总,得到最终的查询结果。
9.一种电子设备,其特征在于,包括:
存储器,存储有计算机可读指令;
处理器,读取存储器存储的计算机可读指令,以执行权利要求1-7中的任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行权利要求1-7中的任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211205488.2A CN115495478A (zh) | 2022-09-29 | 2022-09-29 | 数据查询方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211205488.2A CN115495478A (zh) | 2022-09-29 | 2022-09-29 | 数据查询方法、装置、电子设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115495478A true CN115495478A (zh) | 2022-12-20 |
Family
ID=84472512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211205488.2A Pending CN115495478A (zh) | 2022-09-29 | 2022-09-29 | 数据查询方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115495478A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116150304A (zh) * | 2023-03-28 | 2023-05-23 | 阿里云计算有限公司 | 数据的查询方法、电子设备和存储介质 |
CN118152453A (zh) * | 2024-03-12 | 2024-06-07 | 北京忆元科技有限公司 | topk数据查询方法、系统、装置、存储介质及电子设备 |
-
2022
- 2022-09-29 CN CN202211205488.2A patent/CN115495478A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116150304A (zh) * | 2023-03-28 | 2023-05-23 | 阿里云计算有限公司 | 数据的查询方法、电子设备和存储介质 |
CN118152453A (zh) * | 2024-03-12 | 2024-06-07 | 北京忆元科技有限公司 | topk数据查询方法、系统、装置、存储介质及电子设备 |
CN118152453B (zh) * | 2024-03-12 | 2024-10-01 | 北京忆元科技有限公司 | topk数据查询方法、系统、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3819792A2 (en) | Method, apparatus, device, and storage medium for intention recommendation | |
CN108509547B (zh) | 一种信息管理方法、信息管理系统及电子设备 | |
CN115495478A (zh) | 数据查询方法、装置、电子设备以及存储介质 | |
CN110489558B (zh) | 文章聚合方法和装置、介质和计算设备 | |
CN110110225B (zh) | 基于用户行为数据分析的在线教育推荐模型及构建方法 | |
CN109033101A (zh) | 标签推荐方法及装置 | |
CN111813905A (zh) | 语料生成方法、装置、计算机设备及存储介质 | |
CN113836131A (zh) | 一种大数据清洗方法、装置、计算机设备及存储介质 | |
CN112528315B (zh) | 识别敏感数据的方法和装置 | |
Singh et al. | Probabilistic data structure-based community detection and storage scheme in online social networks | |
Pan et al. | Recommendation of crowdsourcing tasks based on word2vec semantic tags | |
Maduako et al. | A space-time varying graph for modelling places and events in a network | |
CN111899822B (zh) | 医疗机构数据库构建方法、查询方法、装置、设备和介质 | |
US11809506B1 (en) | Multivariant analyzing replicating intelligent ambience evolving system | |
Li et al. | Research on distributed search technology of multiple data sources intelligent information based on knowledge graph | |
CN110390011B (zh) | 数据分类的方法和装置 | |
JP2023517518A (ja) | ヌル値又は同等の値を有するリレーショナル・テーブルのためのベクトル埋込モデル | |
US9372930B2 (en) | Generating a supplemental description of an entity | |
Liu | POI recommendation model using multi-head attention in location-based social network big data | |
CN111209403A (zh) | 数据处理方法、装置、介质及电子设备 | |
CN110750555A (zh) | 用于生成索引的方法、装置、计算设备以及介质 | |
CN113010642B (zh) | 语义关系的识别方法、装置、电子设备及可读存储介质 | |
Leifeld et al. | Package ‘btergm’ | |
US20200081875A1 (en) | Information Association And Suggestion | |
CN111597453A (zh) | 用户画像方法、装置、计算机设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |