CN116049511A - 多维数据的查询方法、系统、设备及存储介质 - Google Patents
多维数据的查询方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN116049511A CN116049511A CN202310100274.7A CN202310100274A CN116049511A CN 116049511 A CN116049511 A CN 116049511A CN 202310100274 A CN202310100274 A CN 202310100274A CN 116049511 A CN116049511 A CN 116049511A
- Authority
- CN
- China
- Prior art keywords
- supervector
- query result
- random
- neural network
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 238000013528 artificial neural network Methods 0.000 claims abstract description 89
- 230000015654 memory Effects 0.000 claims description 54
- 210000002569 neuron Anatomy 0.000 claims description 38
- 238000004590 computer program Methods 0.000 claims description 10
- 238000005259 measurement Methods 0.000 claims description 3
- 238000009749 continuous casting Methods 0.000 abstract description 22
- 239000013598 vector Substances 0.000 description 40
- 238000012549 training Methods 0.000 description 32
- 230000001149 cognitive effect Effects 0.000 description 30
- 230000006870 function Effects 0.000 description 25
- 238000013507 mapping Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000013527 convolutional neural network Methods 0.000 description 6
- 210000004205 output neuron Anatomy 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 239000000945 filler Substances 0.000 description 4
- 238000011478 gradient descent method Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种多维数据的查询方法、系统、设备及存储介质,该方法包括:根据基于神经网络得到的随机位序列确定至少一个超向量;测量通过组合超向量得到的随机查询结果的超向量与候选查询结果的超向量之间的距离值;根据距离值选择与随机查询结果的超向量距离最小的目标超向量;根据目标超向量得到多维数据对应的目标查询结果。本发明根据通过神经网络生成的随机位序列确定至少一个超向量;测量随机查询结果的超向量与候选查询结果的超向量之间的距离值;根据距离值选择与随机查询结果的超向量距离最小的目标超向量;根据目标超向量得到多维数据对应的目标查询结果,实现了连铸产业状态下的多维数据查询,提高了多维数据查询的准确性。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种多维数据的查询方法、系统、设备及存储介质。
背景技术
目前认知智能领域是人工智能领域中较热的主题之一,同时也是信息技术(IT)组织所关注的主题。在过去的时间内,企业通过现场传感器收集的大量数据不断的增加,因此需要越来越复杂的分析工具来协助数据分析。传统的商业智能或商业分析工具已被证明对于信息技术和商业用户具有一定的使用前景,而由于分析半结构化数据和分析非结构化数据受到数据本身的限制变得较为困难。
而目前处于的AI(人工智能)时代还局限于数据训练和学习后的模式识别阶段,因此,在紧密的现场传感器处理边界内,行业内需要一个可以将知识抽象到另一个维度的域内进行知识之间的互相转换的方式,从而完成新的架构信息。
AI进行模拟和回答认知查询的能力目前在很大程度上已经具备相应的能力,通过工业现场连铸传感器的数据接入可以获得数据本身的采集方式,同时通过向量转换的方式进行数据新的表示。向量符号体系结构是这一类向量的新的表示方法,可以通过向量的符号表示来进行认知智能结构的输入。
目前针对认知智能查询的科研平台知识提取方法:一种是医疗认知智能科研平台的知识提取方法,该方法包括以下步骤S1、数据源获取;S2、数据源采掘;S3、数据清洗;S4、知识图谱构建;S5、知识存储和人工纠错。该医疗认知智能科研平台的知识提取方法,采用分布式爬虫框架Scrapy(抓取)抓取超过10个网页获取数据,使得数据具有广泛性与全面性并针对获取的数据进行采掘融合,并在融合的数据不限定文本,同时融合的还有图片与视频数据,保证了数据的全面性同时也方便了查阅人员的直观查看,并利用NoSQL(非关系型数据库)构建知识图谱使得方便使用者查询,并利用数据清洗将数据中重复性数据与无效性数据剔除,使得能够减小数据的占用空间保证知识数据的精炼性的同时也方便了后期对知识数据的维护。该方法的缺点在于基于爬虫框架进行认知智能的图谱构建,并未从语义理解上进行认知智能的查询方式,同时针对工业连铸领域中并不完全适用。另一种是面向知识图谱问答的查询图排序方法及系统,该方法包括以下步骤:将自然语言问句解析为对应的候选查询图,获得每个问句对应的候选查询图集合,所述自然语言问句包括训练集、测试集和验证集;从所述候选查询图集合中选择出最优查询图,包括:将候选查询图转换成对应的查询图序列;构建排序模型;使用训练集对所述排序模型进行迭代训练,获得训练后的排序模型,通过验证集评价训练后的排序模型,保存评价得分最高的排序模型作为最优的排序模型;通过最优的排序模型获取测试集中每个问句对应的得分集合,从得分集合中筛选获得分值最高的查询图。其提升了查询图的编码质量,排序过程合理,提高了系统的整体性能。该方法的缺点在采用知识图谱进行查询图的排序方式,同时通过自然语言中的问句解析来进行查询图序列的排序模型构建,通过保存评价得分的方式进行最优排序模型的搭建,然而针对工业连铸环境下的排序模型构建并未适用。
发明内容
本发明要解决的技术问题是为了克服现有技术中的数据查询方式存在不适用于连铸产业状态下的多维数据查询的缺陷,提供一种多维数据的查询方法、系统、设备及存储介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明第一方面提供了一种多维数据的查询方法,所述查询方法包括:
将所述多维数据输入神经网络,以得到随机位序列;
根据所述随机位序列确定至少一个超向量;
组合不同的所述超向量,以得到所述多维数据对应的随机查询结果的超向量和候选查询结果的超向量;
测量所述随机查询结果的超向量与所述候选查询结果的超向量之间的距离值;
根据所述距离值选择与所述随机查询结果的超向量距离最小的目标超向量;
根据所述目标超向量得到所述多维数据对应的目标查询结果。
较佳地,所述将所述多维数据输入神经网络,以得到随机位序列的步骤之前,所述查询方法还包括:
获取传感器的多维数据。
较佳地,所述将所述多维数据输入神经网络,以得到随机位序列的步骤包括:
将所述多维数据输入神经网络的输入层;
确定所述神经网络的隐藏神经元层的输出信号和神经网络的输出信号;
根据所述隐藏神经元层的输出信号和所述神经网络的输出信号生成随机位序列。
较佳地,所述根据所述随机位序列确定至少一个超向量的步骤之后,所述查询方法还包括:
将所述至少一个超向量存储至关联存储器中;
所述组合不同的所述超向量,以得到所述多维数据对应的随机查询结果的超向量和候选查询结果的超向量的步骤包括:
组合存储在所述关联存储器中的不同的超向量,以得到所述多维数据对应的随机查询结果的超向量和候选查询结果的超向量。
本发明第二方面提供了一种多维数据的查询系统,所述查询系统包括生成模块、确定模块、组合模块、测量模块、选择模块和查询结果获取模块;
所述生成模块用于将所述多维数据输入神经网络,以得到随机位序列;
所述确定模块用于根据所述随机位序列确定至少一个超向量;
所述组合模块用于组合不同的所述超向量,以得到所述多维数据对应的随机查询结果的超向量和候选查询结果的超向量;
所述测量模块用于测量所述随机查询结果的超向量与所述候选查询结果的超向量之间的距离值;
所述选择模块用于根据所述距离值选择与所述随机查询结果的超向量距离最小的目标超向量;
所述查询结果获取模块用于根据所述目标超向量得到所述多维数据对应的目标查询结果。
较佳地,所述查询系统还包括数据获取模块;
所述数据获取模块用于获取传感器的多维数据。
较佳地,所述生成模块包括输入单元、确定单元和生成单元;
所述输入单元用于将所述多维数据输入神经网络的输入层;
所述确定单元用于确定所述神经网络的隐藏神经元层的输出信号和神经网络的输出信号;
所述生成单元用于根据所述隐藏神经元层的输出信号和所述神经网络的输出信号生成随机位序列。
较佳地,所述查询系统还包括存储模块;
所述存储模块用于将所述至少一个超向量存储至关联存储器中;
所述组合模块用于组合存储在所述关联存储器中的不同的超向量,以得到所述多维数据对应的随机查询结果的超向量和候选查询结果的超向量。
本发明第三方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并用于在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的多维数据的查询方法。
本发明第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的多维数据的查询方法。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明的积极进步效果在于:
本发明根据通过神经网络生成的随机位序列确定至少一个超向量;测量随机查询结果的超向量与候选查询结果的超向量之间的距离值;根据距离值选择与随机查询结果的超向量距离最小的目标超向量;根据目标超向量得到多维数据对应的目标查询结果,实现了连铸产业状态下的多维数据查询,提高了多维数据查询的准确性。
附图说明
图1为本发明实施例1的多维数据的查询方法的流程图。
图2为本发明实施例2的多维数据的查询系统的模块示意图。
图3为本发明实施例3的电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供的一种多维数据的查询方法,如图1所示,该查询方法包括:
步骤101、将多维数据输入神经网络,以得到随机位序列;
本实施例中,神经网络可以是LSTM(长短期记忆网络)或CNN(卷积神经网络)神经网络。LSTM网络被证明在识别图像或处理声音(例如,以口语单词的形式)方面非常成功,同时CNN神经网络也可以通过分类进行相应的过程识别。另外,通常位于神经网络的隐藏神经元层序列的开始处的一个或多个卷积使得能够非常快速地减少从一个神经网络层到下一层神经元的数量,有助于降低神经网络的计算能力需求;
需要说明的是,本实施例的神经网络通常为训练后的神经网络。
步骤102、根据随机位序列确定至少一个超向量;
本实施例中,随机位序列是通过二进制算法进行算法随机生成的位信息,组成一组位序列编码信息,提供随机的信息来帮助信息生成;
超向量可以表示具有大量维数的向量,在这里提出的概念中,维数可以在10的范围内;
另外,超向量(Hyper-Vector)和超维向量(Hyper-Dimentional Vector)可以互交换使用。
步骤103、组合不同的超向量,以得到多维数据对应的随机查询结果的超向量和候选查询结果的超向量;
本实施例中,超向量可以包括通过向量元素(Vector-Element)二进制异或XOR运算来绑定不同的超向量。这种操作可以表示为计算功率方面的低成本和高效数字函数,以便在不同的超向量之间建立绑定关系。
同时该超向量组合还可以包括通过逐向量元素的二进制平均来捆绑不同的超向量。与定义为逐元素二进制XOR运算的绑定运算符相反,捆绑运算符可以定义为HD超维向量的逐元素进行相应的二进制平均化处理,即多数规则。因此,简单的二进制计算可以通过有限的计算能力定义不同的超向量的绑定(binding)和捆绑(bounding)。
步骤104、测量随机查询结果的超向量与候选查询结果的超向量之间的距离值;
本实施例中,测量所表示认知查询的随机查询结果的超向量与表示候选查询结果的超向量之间的距离,通过测量二进制超向量之间的距离,利用距离函数,以及可控计算能力实现良好的可比性,即距离函数与可比性相关联。
本实施例中,不同超向量之间的距离可以表示为距离的值的函数的结果。例如,如果超向量被认为是串,则两个(例如两个相等长度)超向量之间的距离可以等于串中的对应符号不同的位置的数量。
步骤105、根据距离值选择与随机查询结果的超向量距离最小的目标超向量;
本实施例中,选择与候选查询结果相关的具有与随机查询结果的超向量距离最小的目标超向量。
步骤106、根据目标超向量得到多维数据对应的目标查询结果。
在具体实施过程中,采用认知查询的方式,可以将传感器的多维数据进行神经网络的直接编码,通过不同层的网络编码感知进行二进制超向量编码,通过相似性计算的分析,同时将二进制超向量编码和相似性距离计算值存储在关联存储器中,针对选中的传感器的多维数据所对应的随机查询结果进行查询结果关联(即进行答案关联),越是近距离的计算得出的查询结果(即答案)越是近似,通过认知查询后的随机查询结果与最佳候选查询结果之间的最短距离可以用作给定查询的最佳答案(即目标查询结果),实现了工业连铸场景下的多维数据的认知查询,能够支持多维数据类型下的多种数据类型。
需要说明的是,认知查询是表示对认知智能及机器学习系统下的智能查询,其不被公式化为SQL(结构化查询语言数据库)结构化语句或另一形式化的查询语言,其直接从连铸现场传感器输入信号中转换得到。使用认知智能的学习系统,同时针对认知查询测试得到的一系列候选查询结果(即候选答案),以便确定学习上下文中的最佳可能响应,从基础的经训练过的神经网络获取相关的知识信息。
本实施例还可以在神经网络训练结束时生成多个随机超向量或HD超维向量作为角色向量,以存储在关联存储器中。训练结束环节可以通过梯度下降方法来确定,该梯度下降方法依赖于由监督训练会话中的训练数据的结果和标签之间的差异所确定的误差。使用SGD(随机梯度下降)算法并监视梯度统计确定训练会话结束,以便生成角色向量的一个选项。利用两个不同的训练数据集简单确定两个训练周期之间的随机梯度方差的差值并与阈值比较,可以触发角色向量的生成。还可以将多个神经网络的输出作为传感器输入数据集(即传感器输入信号)所连续生成的随机超向量作为填充向量,该随机超向量将被存储在关联存储器中,与角色向量相反,只要表示认知查询和候选查询结果的传感器输入信号被馈送到相关的机器学习系统,这些随机超向量就可以连续进行生成。
另外,如果神经网络的传感器输入信号两组输入向量之间确定的随机梯度下降值保持低于预定义的阈值,那么可在神经网络训练结束时将角色向量存储于关联存储器中。相邻的SGD值之间的差可以很小,以致于进一步的训练可能越来越不重要。这种方法步骤还可以用于将训练数据集缩减到合理的大小,以便保持训练时间尽可能的短。
作为可选的一种实施方式,步骤101之前,该查询方法还包括:
步骤100、获取传感器的多维数据。
本实施例中,在连铸产线状态下获取传感器的多维数据(即采集连铸传感器输入信号),传感器的多维数据包括但不限于视频、音频、时序信号等。
需要说明的是,工业连铸现场的传感器适用于各类输入信号。
另外,传感器的多维数据(即传感器输入信号)表示为通过连铸现场传感器设备信息得出相关的视觉、时序、间接等数据,通过识别而得的信息,例如来自图像传感器(例如现场摄像机)、现场温度液位传感器(例如现场传感)、一些间接的声音信号传感器的数据。
作为可选的一种实施方式,步骤101包括:
步骤101-1、将多维数据输入神经网络的输入层;
本实施例中,将传感器的多维数据(即传感器输入信号)馈送到包括多个隐藏神经元层和一个输出神经元层的神经网络的输入层;
另外,将传感器的多维数据馈送到神经网络的输入层可以包括将传感器的多维数据馈送到多个神经网络的输入层,显著提高了学习速度和回答过程的可靠性。
步骤101-2、确定神经网络的隐藏神经元层的输出信号和神经网络的输出信号;
本实施例中,确定来自多个隐藏神经元层中的每一个隐藏神经元层的输出信号和神经网络的输出信号;
需要说明的是,隐藏神经元层(Hidden Neuron Layer(s))可以表示神经网络中的层不是输入层或者输出层,而是隐藏在输入层和输出层中间的神经元层。
步骤101-3、根据隐藏神经元层的输出信号和神经网络的输出信号生成随机位序列。
本实施例中,通过使用神经网络的输出神经元层中输出层所对应的输出信号和使用隐神经元层之一的隐藏神经元层的输出信号作为映射函数(例如通过最少一类映射函数),通过传感器的多维数据来映射成相关函数组(mapping functions),进而生成随机位序列(random bit sequence)。
本实施例中,生成随机位序列还可以包括使用神经网络的输出神经元层中输出层的输出信号和多个隐藏神经元层的输出信号作为至少一个映射函数。需要说明的是,使用神经网络的隐藏神经元层而不仅仅是输出层,可以相对容易地生成更复杂的结构,特别是超向量中的一个,因为映射函数实际上可以是多个单独的映射函数,还可以从神经网络的中间状态,即从隐藏神经元层接收信息。这可以表示用于形成寻址关联存储器的二进制超向量的基本数据集。
另外,映射函数(Mapping function)可以表示用于从给定输入生成PRBS(伪随机二进制序列)的算法,通常情况下,如果将生成的PRBS作为向量,则其具有比对应的输入向量高得多的维度。
作为可选的一种实施方式,步骤102的步骤之后,该查询方法还包括:
步骤102-1、将至少一个超向量存储至关联存储器中;
本实施例中,关联存储器(associative memory)或内容可寻址存储器(CAM)或关联存储器(associative storage)可以表示例如在某些非常高速的搜索应用中使用的特殊类型的计算机存储器,关联存储器可将输入数据(例如超向量)与存储的数据进行比较,并可返回匹配数据的地址。
步骤103包括:
步骤103-1、组合存储在关联存储器中的不同的超向量,以得到多维数据对应的随机查询结果的超向量和候选查询结果的超向量。
在具体实施过程中,采用训练后的神经网络隐含状态,通过导出隐藏神经元层超向量来寻址关联存储器。使用不同的时间帧,通过第一时间帧由神经网络训练的约束条件来定义,可以通过应用于神经网络的层通过梯度下降法来确定训练会话的结束。同时生成的超向量仅生成一次,在训练周期结束时,超向量与认知查询元素相互关联。
同时在连铸现场传感器数据训练之后,通过认知查询(即随机查询结果)和候选查询结果的传感器输入信号被重新定义并输入到系统中,填充超向量可以连续的生成。每个候选查询结果可以至少对应一个超向量以发送到关联存储器中。根据角色向量(例如随机查询结果的超向量)和填充向量(例如候选查询结果的超向量)之间的距离,可以导出对多维数据查询的响应。具体地,可以使用绑定算法,组合存储在关联存储器中的不同的超向量,导出认知查询(即随机查询结果)和候选答案(即候选查询结果),每个候选答案从传感器输入信号中获取。因此,查询的处理和候选答案的处理可以以类似的方式加以实现,通过这类候选答案的处理可以隐含地比较容易进行比较和最终决策相应的过程。
本实施例根据通过神经网络生成的随机位序列确定至少一个超向量;测量随机查询结果的超向量与候选查询结果的超向量之间的距离值;根据距离值选择与随机查询结果的超向量距离最小的目标超向量;根据目标超向量得到多维数据对应的目标查询结果,实现了连铸产业状态下的多维数据查询,提高了多维数据查询的准确性。
实施例2
本实施例提供的一种多维数据的查询系统,如图2所示,该查询系统包括生成模块21、确定模块22、组合模块23、测量模块24、选择模块25和查询结果获取模块26;
生成模块21用于将多维数据输入神经网络,以得到随机位序列;
本实施例中,神经网络可以是LSTM(长短期记忆网络)或CNN(卷积神经网络)神经网络。LSTM网络被证明在识别图像或处理声音(例如,以口语单词的形式)方面非常成功,同时CNN神经网络也可以通过分类进行相应的过程识别。另外,通常位于神经网络的隐藏神经元层序列的开始处的一个或多个卷积使得能够非常快速地减少从一个神经网络层到下一层神经元的数量,有助于降低神经网络的计算能力需求;
需要说明的是,本实施例的神经网络通常为训练后的神经网络。
确定模块22用于根据随机位序列确定至少一个超向量;
本实施例中,随机位序列是通过二进制算法进行算法随机生成的位信息,组成一组位序列编码信息,提供随机的信息来帮助信息生成;
超向量可以表示具有大量维数的向量,在这里提出的概念中,维数可以在10的范围内;
另外,超向量(Hyper-Vector)和超维向量(Hyper-Dimentional Vector)可以互交换使用。
组合模块23用于组合不同的超向量,以得到多维数据对应的随机查询结果的超向量和候选查询结果的超向量;
本实施例中,超向量可以包括通过向量元素(Vector-Element)二进制异或XOR运算来绑定不同的超向量。这种操作可以表示为计算功率方面的低成本和高效数字函数,以便在不同的超向量之间建立绑定关系。
同时该超向量组合还可以包括通过逐向量元素的二进制平均来捆绑不同的超向量。与定义为逐元素二进制XOR运算的绑定运算符相反,捆绑运算符可以定义为HD超维向量的逐元素进行相应的二进制平均化处理,即多数规则。因此,简单的二进制计算可以通过有限的计算能力定义不同的超向量的绑定(binding)和捆绑(bounding)。
测量模块24用于测量随机查询结果的超向量与候选查询结果的超向量之间的距离值;
本实施例中,测量所表示认知查询的随机查询结果的超向量与表示候选查询结果的超向量之间的距离,通过测量二进制超向量之间的距离,利用距离函数,以及可控计算能力实现良好的可比性,即距离函数与可比性相关联。
本实施例中,不同超向量之间的距离可以表示为距离的值的函数的结果。例如,如果超向量被认为是串,则两个(例如两个相等长度)超向量之间的距离可以等于串中的对应符号不同的位置的数量。
选择模块25用于根据距离值选择与随机查询结果的超向量距离最小的目标超向量;
本实施例中,选择与候选查询结果相关的具有与随机查询结果的超向量距离最小的目标超向量。
查询结果获取模块26用于根据目标超向量得到多维数据对应的目标查询结果。
在具体实施过程中,采用认知查询的方式,可以将传感器的多维数据进行神经网络的直接编码,通过不同层的网络编码感知进行二进制超向量编码,通过相似性计算的分析,同时将二进制超向量编码和相似性距离计算值存储在关联存储器中,针对选中的传感器的多维数据所对应的随机查询结果进行查询结果关联(即进行答案关联),越是近距离的计算得出的查询结果(即答案)越是近似,通过认知查询后的随机查询结果与最佳候选查询结果之间的最短距离可以用作给定查询的最佳答案(即目标查询结果),实现了工业连铸场景下的多维数据的认知查询,能够支持多维数据类型下的多种数据类型。
需要说明的是,认知查询是表示对认知智能及机器学习系统下的智能查询,其不被公式化为SQL结构化语句或另一形式化的查询语言,其直接从连铸现场传感器输入信号中转换得到。使用认知智能的学习系统,同时针对认知查询测试得到的一系列候选查询结果(即候选答案),以便确定学习上下文中的最佳可能响应,从基础的经训练过的神经网络获取相关的知识信息。
本实施例还可以在神经网络训练结束时生成多个随机超向量或HD超维向量作为角色向量,以存储在关联存储器中。训练结束环节可以通过梯度下降方法来确定,该梯度下降方法依赖于由监督训练会话中的训练数据的结果和标签之间的差异所确定的误差。使用SGD算法并监视梯度统计确定训练会话结束,以便生成角色向量的一个选项。利用两个不同的训练数据集简单确定两个训练周期之间的随机梯度方差的差值并与阈值比较,可以触发角色向量的生成。还可以将多个神经网络的输出作为传感器输入数据集(即传感器输入信号)所连续生成的随机超向量作为填充向量,该随机超向量将被存储在关联存储器中,与角色向量相反,只要表示认知查询和候选查询结果的传感器输入信号被馈送到相关的机器学习系统,这些随机超向量就可以连续进行生成。
另外,如果神经网络的传感器输入信号两组输入向量之间确定的随机梯度下降值保持低于预定义的阈值,那么可在神经网络训练结束时将角色向量存储于关联存储器中。相邻的SGD值之间的差可以很小,以致于进一步的训练可能越来越不重要。这种方法步骤还可以用于将训练数据集缩减到合理的大小,以便保持训练时间尽可能的短。
作为可选的一种实施方式,如图2所示,该查询系统还包括数据获取模块27;
数据获取模块27用于获取传感器的多维数据。
本实施例中,在连铸产线状态下获取传感器的多维数据(即采集连铸传感器输入信号),传感器的多维数据包括但不限于视频、音频、时序信号等。
需要说明的是,工业连铸现场的传感器适用于各类输入信号。
另外,传感器的多维数据(即传感器输入信号)表示为通过连铸现场传感器设备信息得出相关的视觉、时序、间接等数据,通过识别而得的信息,例如来自图像传感器(例如现场摄像机)、现场温度液位传感器(例如现场传感)、一些间接的声音信号传感器的数据。
作为可选的一种实施方式,如图2所示,生成模块21包括输入单元211、确定单元212和生成单元213;
输入单元211用于将多维数据输入神经网络的输入层;
本实施例中,将传感器的多维数据(即传感器输入信号)馈送到包括多个隐藏神经元层和一个输出神经元层的神经网络的输入层;
另外,将传感器的多维数据馈送到神经网络的输入层可以包括将传感器的多维数据馈送到多个神经网络的输入层,显著提高了学习速度和回答过程的可靠性。
确定单元212用于确定神经网络的隐藏神经元层的输出信号和神经网络的输出信号;
本实施例中,确定来自多个隐藏神经元层中的每一个隐藏神经元层的输出信号和神经网络的输出信号;
需要说明的是,隐藏神经元层(Hidden Neuron Layer(s))可以表示神经网络中的层不是输入层或者输出层,而是隐藏在输入层和输出层中间的神经元层。
生成单元213用于根据隐藏神经元层的输出信号和神经网络的输出信号生成随机位序列。
本实施例中,通过使用神经网络的输出神经元层中输出层所对应的输出信号和使用隐神经元层之一的隐藏神经元层的输出信号作为映射函数(例如通过最少一类映射函数),通过传感器的多维数据来映射成相关函数组(mapping functions),进而生成随机位序列(random bit sequence)。
本实施例中,生成随机位序列还可以包括使用神经网络的输出神经元层中输出层的输出信号和多个隐藏神经元层的输出信号作为至少一个映射函数。需要说明的是,使用神经网络的隐藏神经元层而不仅仅是输出层,可以相对容易地生成更复杂的结构,特别是超向量中的一个,因为映射函数实际上可以是多个单独的映射函数,还可以从神经网络的中间状态,即从隐藏神经元层接收信息。这可以表示用于形成寻址关联存储器的二进制超向量的基本数据集。
另外,映射函数(Mapping function)可以表示用于从给定输入生成PRBS的算法,通常情况下,如果将生成的PRBS作为向量,则其具有比对应的输入向量高得多的维度。
作为可选的一种实施方式,如图2所示,该查询系统还包括存储模块28;
存储模块28用于将至少一个超向量存储至关联存储器中;
本实施例中,关联存储器(associative memory)或内容可寻址存储器(CAM)或关联存储器(associative storage)可以表示例如在某些非常高速的搜索应用中使用的特殊类型的计算机存储器,关联存储器可将输入数据(例如超向量)与存储的数据进行比较,并可返回匹配数据的地址。
组合模块23用于组合存储在关联存储器中的不同的超向量,以得到多维数据对应的随机查询结果的超向量和候选查询结果的超向量。
在具体实施过程中,采用训练后的神经网络隐含状态,通过导出隐藏神经元层超向量来寻址关联存储器。使用不同的时间帧,通过第一时间帧由神经网络训练的约束条件来定义,可以通过应用于神经网络的层通过梯度下降法来确定训练会话的结束。同时生成的超向量仅生成一次,在训练周期结束时,超向量与认知查询元素相互关联。
同时在连铸现场传感器数据训练之后,通过认知查询(即随机查询结果)和候选查询结果的传感器输入信号被重新定义并输入到系统中,填充超向量可以连续的生成。每个候选查询结果可以至少对应一个超向量以发送到关联存储器中。根据角色向量(例如随机查询结果的超向量)和填充向量(例如候选查询结果的超向量)之间的距离,可以导出对多维数据查询的响应。具体地,可以使用绑定算法,组合存储在关联存储器中的不同的超向量,导出认知查询(即随机查询结果)和候选答案(即候选查询结果),每个候选答案从传感器输入信号中获取。因此,查询的处理和候选答案的处理可以以类似的方式加以实现,通过这类候选答案的处理可以隐含地比较容易进行比较和最终决策相应的过程。
本实施例根据通过神经网络生成的随机位序列确定至少一个超向量;测量随机查询结果的超向量与候选查询结果的超向量之间的距离值;根据距离值选择与随机查询结果的超向量距离最小的目标超向量;根据目标超向量得到多维数据对应的目标查询结果,实现了连铸产业状态下的多维数据查询,提高了多维数据查询的准确性。
实施例3
图3为本发明实施例3提供的一种电子设备的结构示意图。电子设备包括存储器、处理器及存储在存储器上并用于在处理器上运行的计算机程序,处理器执行程序时实现实施例1的多维数据的查询方法。图3显示的电子设备30仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图3所示,电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。
总线33包括数据总线、地址总线和控制总线。
存储器32可以包括易失性存储器,例如随机存取存储器(RAM)321和/或高速缓存存储器322,还可以进一步包括只读存储器(ROM)323。
存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器31通过运行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1的多维数据的查询方法。
电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口35进行。并且,模型生成的设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图3所示,网络适配器36通过总线33与模型生成的设备30的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例4
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现实施例1所提供的多维数据的查询方法。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行实现实施例1所述的多维数据的查询方法。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
Claims (10)
1.一种多维数据的查询方法,其特征在于,所述查询方法包括:
将所述多维数据输入神经网络,以得到随机位序列;
根据所述随机位序列确定至少一个超向量;
组合不同的所述超向量,以得到所述多维数据对应的随机查询结果的超向量和候选查询结果的超向量;
测量所述随机查询结果的超向量与所述候选查询结果的超向量之间的距离值;
根据所述距离值选择与所述随机查询结果的超向量距离最小的目标超向量;
根据所述目标超向量得到所述多维数据对应的目标查询结果。
2.如权利要求1所述的多维数据的查询方法,其特征在于,所述将所述多维数据输入神经网络,以得到随机位序列的步骤之前,所述查询方法还包括:
获取传感器的多维数据。
3.如权利要求1所述的多维数据的查询方法,其特征在于,所述将所述多维数据输入神经网络,以得到随机位序列的步骤包括:
将所述多维数据输入神经网络的输入层;
确定所述神经网络的隐藏神经元层的输出信号和神经网络的输出信号;
根据所述隐藏神经元层的输出信号和所述神经网络的输出信号生成随机位序列。
4.如权利要求1所述的多维数据的查询方法,其特征在于,所述根据所述随机位序列确定至少一个超向量的步骤之后,所述查询方法还包括:
将所述至少一个超向量存储至关联存储器中;
所述组合不同的所述超向量,以得到所述多维数据对应的随机查询结果的超向量和候选查询结果的超向量的步骤包括:
组合存储在所述关联存储器中的不同的超向量,以得到所述多维数据对应的随机查询结果的超向量和候选查询结果的超向量。
5.一种多维数据的查询系统,其特征在于,所述查询系统包括生成模块、确定模块、组合模块、测量模块、选择模块和查询结果获取模块;
所述生成模块用于将所述多维数据输入神经网络,以得到随机位序列;
所述确定模块用于根据所述随机位序列确定至少一个超向量;
所述组合模块用于组合不同的所述超向量,以得到所述多维数据对应的随机查询结果的超向量和候选查询结果的超向量;
所述测量模块用于测量所述随机查询结果的超向量与所述候选查询结果的超向量之间的距离值;
所述选择模块用于根据所述距离值选择与所述随机查询结果的超向量距离最小的目标超向量;
所述查询结果获取模块用于根据所述目标超向量得到所述多维数据对应的目标查询结果。
6.如权利要求5所述的多维数据的查询系统,其特征在于,所述查询系统还包括数据获取模块;
所述数据获取模块用于获取传感器的多维数据。
7.如权利要求5所述的多维数据的查询系统,其特征在于,所述生成模块包括输入单元、确定单元和生成单元;
所述输入单元用于将所述多维数据输入神经网络的输入层;
所述确定单元用于确定所述神经网络的隐藏神经元层的输出信号和神经网络的输出信号;
所述生成单元用于根据所述隐藏神经元层的输出信号和所述神经网络的输出信号生成随机位序列。
8.如权利要求5所述的多维数据的查询系统,其特征在于,所述查询系统还包括存储模块;
所述存储模块用于将所述至少一个超向量存储至关联存储器中;
所述组合模块用于组合存储在所述关联存储器中的不同的超向量,以得到所述多维数据对应的随机查询结果的超向量和候选查询结果的超向量。
9.一种电子设备,包括存储器、处理器及存储在存储器上并用于在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-4中任一项所述的多维数据的查询方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4中任一项所述的多维数据的查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310100274.7A CN116049511A (zh) | 2023-02-06 | 2023-02-06 | 多维数据的查询方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310100274.7A CN116049511A (zh) | 2023-02-06 | 2023-02-06 | 多维数据的查询方法、系统、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116049511A true CN116049511A (zh) | 2023-05-02 |
Family
ID=86116417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310100274.7A Pending CN116049511A (zh) | 2023-02-06 | 2023-02-06 | 多维数据的查询方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116049511A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113474795A (zh) * | 2019-02-25 | 2021-10-01 | 国际商业机器公司 | 从传感器输入信号回答认知查询 |
WO2021213160A1 (zh) * | 2020-11-27 | 2021-10-28 | 平安科技(深圳)有限公司 | 基于图神经网络的医疗查询方法、装置、计算机设备及存储介质 |
-
2023
- 2023-02-06 CN CN202310100274.7A patent/CN116049511A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113474795A (zh) * | 2019-02-25 | 2021-10-01 | 国际商业机器公司 | 从传感器输入信号回答认知查询 |
WO2021213160A1 (zh) * | 2020-11-27 | 2021-10-28 | 平安科技(深圳)有限公司 | 基于图神经网络的医疗查询方法、装置、计算机设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
袁培森;沙朝锋;王晓玲;周傲英;: "一种基于学习的高维数据c-近似最近邻查询算法", 软件学报, no. 08 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yuan et al. | Marginalized average attentional network for weakly-supervised learning | |
CN109960810B (zh) | 一种实体对齐方法及装置 | |
CN112633010A (zh) | 基于多头注意力和图卷积网络的方面级情感分析方法及系统 | |
CN111052128A (zh) | 用于检测和定位视频中的对象的描述符学习方法 | |
JP7427011B2 (ja) | センサ入力信号からのコグニティブ・クエリへの応答 | |
CN116126341A (zh) | 模型编译方法、装置、计算机设备及计算机可读存储介质 | |
CN115471771A (zh) | 一种基于语义级时序关联建模的视频时序动作定位方法 | |
CN112420125A (zh) | 分子属性预测方法、装置、智能设备和终端 | |
CN112668438A (zh) | 红外视频时序行为定位方法、装置、设备及存储介质 | |
CN115712740A (zh) | 多模态蕴含增强图像文本检索的方法和系统 | |
CN115695950A (zh) | 一种基于内容感知的视频摘要生成方法 | |
CN115358337A (zh) | 一种小样本故障诊断方法、装置及存储介质 | |
CN111444802A (zh) | 一种人脸识别方法、装置及智能终端 | |
Liu et al. | An anomaly detection method based on double encoder–decoder generative adversarial networks | |
Harari et al. | Automatic features generation and selection from external sources: a DBpedia use case | |
CN117332117A (zh) | 一种基于跨模态对应匹配和数据集解偏置的视频片段检索方法及系统 | |
CN116049511A (zh) | 多维数据的查询方法、系统、设备及存储介质 | |
CN115546689A (zh) | 基于无监督下帧相关性的视频时间序列的异常帧探测方法 | |
Li et al. | C $^{2} $ MT: A Credible and Class-Aware Multi-Task Transformer for SR-IQA | |
CN114550036B (zh) | 一种视频目标检测最佳级联配置的搜索方法及系统 | |
CN116662536B (zh) | 一种摘要提取方法及相关装置 | |
CN116051633B (zh) | 一种基于加权关系感知的3d点云目标检测方法及装置 | |
CN117592865B (zh) | 一种装备零备件质量状态预测方法及装置 | |
CN113344122B (zh) | 一种操作流程诊断方法、装置及存储介质 | |
CN116847091B (zh) | 图像编码方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230502 |