CN111881179A - 数据匹配方法、装置及其设备、计算机存储介质 - Google Patents
数据匹配方法、装置及其设备、计算机存储介质 Download PDFInfo
- Publication number
- CN111881179A CN111881179A CN202010701655.7A CN202010701655A CN111881179A CN 111881179 A CN111881179 A CN 111881179A CN 202010701655 A CN202010701655 A CN 202010701655A CN 111881179 A CN111881179 A CN 111881179A
- Authority
- CN
- China
- Prior art keywords
- data
- sequence
- symbol
- similar
- corpus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000003860 storage Methods 0.000 title claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 45
- 230000011218 segmentation Effects 0.000 claims description 59
- 238000012163 sequencing technique Methods 0.000 claims description 23
- 230000015654 memory Effects 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 11
- 238000005070 sampling Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Automation & Control Theory (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种数据匹配方法、装置及其设备、计算机存储介质。该方法包括:获取设施语料库,设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,符号序列是对多维时间序列原始数据进行符号化处理得到的;接收用户输入的查询请求,查询请求中包括待查询时间序列数据;对待查询时间序列数据进行符号化处理得到待查询符号序列;将待查询符号序列与设施语料库中的符号序列进行匹配,得到多个相似符号序列;获取与多个相似符号序列对应的多个相似多维时间序列原始数据;获取与多个相似多维时间序列原始数据对应的语义。本发明的方法,解决了现有的多维时间序列数据的相似度匹配方法存在劳动成本大的问题。
Description
技术领域
本发明涉及数据处理技术,尤其涉及一种数据匹配方法、装置及其设备、计算机存储介质。
背景技术
多维时间序列是物联网系统最常见的一种数据。物联网系统每间隔一段固定或不固定时间,便同时采样设备的多个不同物理量形成多维时间序列。例如电力领域的大型设备,如变电站、发电站的汽轮车、发电机、励磁系统等设备在运行中通常都会安装物联网监测系统,这些监测系统会采集每个设备在运行中的多个物理量,并以多维时间序列的形式将多个物理量保存下来,形成重要的数据资产。当工作人员对某个设备的运行数据进行分析,例如对设备的运行温度进行分析时,往往需要查询预设时间段的设备运行温度对应的时间序列数据,并将多个时间序列数据进行相似度比较。
但是现有的针对多维时间序列的查询技术十分落后,还局限于类SQL(StructuredQuery Language,结构化查询语言)查询的水平。数据搜索完成后,需要人工对查询到的数据进行标注,再对标注后的数据进行汇总,然后进行数据相似度的精确匹配。这种相似度匹配的方法需要大量的人力和时间,劳动成本大。目前针对多维时间序列数据的相似度匹配,还没有更为有效的解决方法。
因此,现有的多维时间序列数据的相似度匹配方法存在劳动成本大的问题。
发明内容
本发明提供一种数据匹配方法、装置及其设备、计算机存储介质,用以解决现有的多维时间序列数据的相似度匹配方法存在劳动成本大的问题。
一方面,本发明提供一种数据匹配方法,包括:
获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,所述符号序列用于表征所述多维时间序列数据的特征,所述符号序列是对所述多维时间序列原始数据进行符号化处理得到的;
接收用户输入的待查询时间序列数据;
对所述待查询时间序列数据进行所述符号化处理得到待查询符号序列;
将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列;
获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据;
获取与所述多个相似多维时间序列原始数据对应的语义;
输出所述多个相似多维时间序列原始数据和所述多个多维相似时间序列原始数据对应的语义。
其中一项实施例中,所述获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据中每个维度的时间序列数据对应的符号序列,包括:
从工业物理网服务器获取多个设备的所述多维时间序列原始数据;
获取所述多个设备中任意一个设备的所述多维时间序列原始数据对应的指定时间窗口,一个所述指定时间窗口对应有多个维度的时间序列数据;
获取所述指定时间窗口对应的多个维度的时间序列数据,分别符号分割化处理所述多个维度的时间序列数据中每个维度的时间序列数据,得到关于所述多个维度的原始符号序列;
分别分词操作处理所述多个维度的原始符号序列中每个维度的所述原始符号序列,得到所述多个维度中每个维度对应的分词符号序列组;
获取所述多个维度的排序规律,根据所述排序规律排序所述每个维度对应的分词符号序列组,得到序列句,所述序列句包括所述多个维度的分词符号序列组;
根据相似度标准聚类所述序列句中所述多个维度的分词符号序列组,得到所述多个维度对应的所述符号序列,即多维时间序列原始数据对应的符号序列;
根据所述多维时间序列原始数据对应的符号序列建立所述任意一个设备的语料库;
返回执行步骤获取所述多个设备中任意一个设备的所述多维时间序列原始数据对应的具有物理意义的时间窗口,直至获取所述多个设备中每个设备的语料库,得到所述设施语料库。
其中一项实施例中,所述获取所述指定时间窗口中的时间序列数据,符号化所述时间序列数据,得到关于多个维度的原始符号序列,包括:
获取所述指定时间窗口对应的多个维度的时间序列数据,并摘录所述多个维度的时间序列数据的语义;
获取所述语义的持续时间;
根据所述持续时间,符号化所述多个维度的时间序列数据,得到关于所述多个维度的原始符号序列。
其中一项实施例中,所述根据所述多维时间序列原始数据对应的符号序列建立所述任意一个设备的语料库包括:
更新所述序列句中的所述多个维度的分词符号序列组为所述多个维度对应的所述符号序列,并根据更新结果建立所述任意一个设备的语料库。
其中一项实施例中,所述排序规律为所述多个维度之间的相关性由高至低的排序规律。
其中一项实施例中,所述获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据,包括:
从工业物联网服务器获取数据对应关系,所述数据对应关系是指所述设施语料库中的多维时间序列数据与对应的符号序列之间的对应关系;
根据所述数据对应关系,从所述工业物联网服务器获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据。
其中一项实施例中,所述将所述待查询符号序列与所述述设施语料库中的符号序列进行匹配,得到多个相似符号序列,包括:
获取匹配模型;
将所述待查询符号序列输入所述匹配模型,得到所述多个相似符号序列,所述匹配模型用于将所述待查询符号序列与所述设施语料库中的符号序列进行匹配。
其中一项实施例中,所述获取匹配模型包括:
获取词向量模型;
根据所述设施语料库训练所述词向量模型,得到所述匹配模型。
其中一项实施例中,所述将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列,包括:
分别获取所述多个相似符号序列中每个所述相似符号序列与所述待查询符号序列的相似度;
获取相似度排序规律;
根据所述相似度排序规律排序所述相似度,以及排序与所述相似度对应的相似符号序列。
另一方面,本发明提供一种数据匹配装置,包括:
获取模块,用于获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,所述符号序列用于表征所述多维时间序列数据的特征,所述符号序列是对所述多维时间序列原始数据进行符号化处理得到的;
接收模块,用于接收用户输入的待查询时间序列数据;
数据处理模块,用于对所述待查询时间序列数据进行所述符号化处理得到待查询符号序列;
匹配模块,用于将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列;
所述获取模块还用于获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据;
所述获取模块还用于获取与所述多个相似多维时间序列原始数据对应的语义;
输出模块,用于输出所述多个相似多维时间序列原始数据和所述多个多维相似时间序列原始数据对应的语义。
另一方面,本发明提供一种电子设备,包括:处理器、存储器和收发器,所述存储器用于存储指令,所述收发器用于和其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如上实施例所述的数据匹配方法。
另一方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上实施例所述的数据匹配方法。
本发明提供一种数据匹配方法,包括获取设施语料库,该设施语料库包括多个设备的多维时间序列原始数据对应的符号序列;接收用户输入的待查询时间序列数据;对该待查询时间序列数据进行同样的符号化处理后得到待查询符号序列。将该待查询符号序列与该设施语料库中的符号序列进行匹配,得到多个相似符号序列。在获取该多个相似符号序列对应的多个相似多维时间序列原始数据,以及该多个相似多维时间序列原始数据对应的语义之后,输出该多个相似的多维时间序列原始数据和该多个多维相似时间序列原始数据对应的语义。本发明提供的数据匹配方法将多维时间序列数据符号化处理,在进行数据相似度匹配时可以根据符号化处理的结果进行数据的相似查询、模糊匹配,无需人工进行数据标注再进行数据相似度的精确匹配,解决了多维时间序列数据的相似度匹配方法存在的劳动成本大的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本发明提供的数据匹配方法的应用场景示意图。
图2为本发明的一个实施例提供的数据匹配方法的流程示意图。
图3为本发明的另一个实施例提供的数据匹配方法的流程示意图。
图4为本发明的一个实施例提供的多维时间序列数据的表现形式示意图。
图5为本发明的一个实施例提供的数据匹配装置的示意图。
图6为本发明的一个实施例提供的电子设备的示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
首先对本发明所涉及的名词进行解释:
时间序列数据:是指在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。
多维时间序列数据:是指在不同时间点上收集的包括多个变量的时间序列数据。
本发明提供的数据匹配方法,可以用于面向计算类的服务器,该服务器可以为科学计算服务器、智能计算服务器等。图1为该数据匹配方法的应用场景示意图,其中,该服务器为科学计算服务器,该科学计算服务器与工业物联网服务器通信连接,该工业物联网服务器与工业物联网网关通信连接,其中,该工业物联网网关和现场的传感器等采集设备通信连接。现场的传感器等采集设备将采集到的数据发送至该工业物联网网关,该工业物联网网关对该数据进行预处理后发送至该工业物联网服务器进行数据存储,该预处理例如滤除无效数据。
多维时间序列是物联网系统最常见的一种数据。物联网系统每间隔一段固定或不固定时间,便同时采样设备的多个不同物理量形成多维时间序列。例如电力领域的大型设备,如变电站、发电站的汽轮车、发电机、励磁系统等设备在运行中通常都会安装物联网监测系统,这些监测系统会采集每个设备在运行中的多个物理量,并以多维时间序列的形式将多个物理量保存下来,形成重要的数据资产。当工作人员对某个设备的运行数据进行分析,例如设备的运行温度进行分析时,往往需要查询固定时间段的设备运行温度对应的时间序列数据,并将多个时间序列数据进行相似度比较。但是现有的针对多维时间序列的查询技术十分落后,还局限于类SQL(Structured Query Language,结构化查询语言)查询的水平。数据搜索完成后,需要人工对查询到的数据进行标注,再对标注后的数据进行汇总,然后进行数据相似度的精确匹配。这种相似度匹配的方法需要大量的人力和时间,劳动成本大。目前针对多维时间序列数据的相似度匹配,还没有更为有效的解决方法。
本发明提供的数据匹配方法、装置及其设备、计算机存储介质旨在解决现有技术的如上技术问题。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
请参见图2,本发明提供一种数据匹配方法,包括:
S100,获取设施语料库,该设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,该符号序列用于表征该多维时间序列数据的特征,该符号序列是对该多维时间序列原始数据进行符号化处理得到的。
时间序列数据本身是JSON(JavaScriptObject Notation,JS对象简谱)格式的数据,存储于工业物联网服务器中。对该多维时间序列数据进行符号化处理,即为科学计算服务器从工业物联网服务器调用多维时间序列数据,并将该JSON格式的数据用符号化的形式进行表征,该设施语料库中只存储有该多维时间序列数据对应的符号序列。需要说明的是,该符号化处理的过程是将该多维时间序列数据进行特征化,则以符号化的形式进行表征的该多维时间序列数据是具有自身特征的符号。例如,某个设备关于温度维度的时间序列数据在符号化后表示为ABBC,其中,A,B,B,C分别对应不同的时间段。例如,A代表第一时间段运行温度小于20℃,B代表第二时间段运行温度大于30℃且小于40℃,C代表第三时间段运行温度大于20℃小于30℃,用ABBC符号化表征该关于温度维度的时间序列数据可以归类标记各不同温度数据,以及对应的各不同时间段。需要说明的是,该第一时间段、第二时间段和第三时间段并不限定为连续的三个时间段。
S200,接收用户输入的待查询时间序列数据。
可以理解的是,该待查询时间序列数据是JSON格式的数据。该待查询时间序列数据以JSON格式存储,在用户输入该待查询时间序列数据的时候,是将该待查询时间序列数据对应的JSON格式的文件拖入或导入至该科学计算服务器中。该待查询时间序列数据可以包括一个或者多个维度的时间序列数据。
S300,对该待查询时间序列数据进行该符号化处理得到待查询符号序列。
需要说明的是,该设施语料库没有存储时间序列数据,只包括符号序列,此时使用该设施语料库只能对该待查询时间序列数据进行模糊匹配。在进行模糊匹配时无法直接匹配查询该待查询时间序列数据的相似数据,所以需要先将该待查询时间序列数据进行该符号化处理,即与步骤S100中相同的符号化处理,得到该待查询符号序列,该待查询符号序列用于表征该待查询时间序列数据的特征。
S400,将该待查询符号序列与该设施语料库中的符号序列进行匹配,得到多个相似符号序列。
该匹配是指符号序列之间的匹配,符号序列之间的匹配对应时间序列数据之间的模糊匹配。例如,该待查询符号序列为BAACDBACD,在与该设施语料库中的符号序列进行匹配后,得到的多个相似符号序列可以为BAACDBCDA,BAACDBACB,BAACDCCAC,BAACDBABC等。每个相似符号序列对应一个多维时间序列原始数据,因此,该待查询时间序列数据最终会匹配到多个多维时间序列原始数据,所以称为时间序列数据之间的模糊匹配。
该多个相似符号序列可以根据和该待查询符号序列之间的相似度进行排序,以上例为例,该多个相似符号序列的排序可以依次为BAACDBACB,BAACDBABC,BAACDBACB,BAACDBCDA。该多个相似符号序列也可以不进行排序。
S500,获取与该多个相似符号序列对应的多个相似多维时间序列原始数据。
工业物联网服务器中存储有多维时间序列原始数据,当确定该相似符号序列时,该科学计算服务器需要从工业物联网服务器调用与该多个相似符号序列对应的多个相似多维时间序列原始数据。
S600,获取与该多个相似多维时间序列原始数据对应的语义。
该工业物联网服务器还存储有多维时间序列原始数据对应的语义,该语义用于表征时间序列数据对应的外部事件。
S700,输出该多个相似多维时间序列原始数据和该多个多维相似时间序列原始数据对应的语义。
语义是指时间序列数据对应的真实物理世界的具体信息,即时间序列数据对应的外部事件。输出该多个多维相似时间序列原始数据对应的语义是为了方便用户看懂时间序列数据。此时间序列数据本身是JSON格式的数据,而对应于真实物理世界的具体信息例如可以为飞机起飞、电网负荷等。例如,采集设备关于运行温度的时间序列数据,对应的语义为设备所处环境的温度为某个温度。再例如,采集飞机飞行时的飞行速率,对应的语义为飞机起飞阶段。这些语义可以来自传感器数值的直接提取,也可能是人工因为特殊时间而进行的标记。
综上,本发明提供一种数据匹配方法,包括获取设施语料库,该设施语料库包括多个设备的多维时间序列原始数据对应的符号序列;接收用户输入的查询请求,该查询请求包括待查询时间序列数据;对该待查询时间序列数据进行同样的符号化处理后得到待查询符号序列。将该待查询符号序列与该设施语料库中的符号序列进行匹配,得到多个相似符号序列。在获取该多个相似符号序列对应的多个相似多维时间序列原始数据,以及该多个相似多维时间序列原始数据对应的语义之后,输出该多个相似的多维时间序列原始数据和该多个多维相似时间序列原始数据对应的语义。本发明提供的数据匹配方法通过将多维时间序列数据符号化处理,在进行数据相似度匹配时使用符号化后的符号序列进行匹配,从而实现时间序列数据的模糊匹配,无需人工进行数据标注再进行数据相似度的精确匹配,解决了多维时间序列数据的相似度匹配方法存在的劳动成本大的问题。
请参见图3,在本发明的一个实施例中,S100包括:
S110,从工业物理网服务器获取多个设备的该多维时间序列原始数据。
该工业物联网服务器存储有多维时间序列原始数据,科学计算服务器建立该设施语料库时,需要从该工业物联网服务器获取多个设备的该多维时间序列原始数据。
S120,获取该多个设备中任意一个设备的该多维时间序列原始数据对应的指定时间窗口,一个该指定时间窗口对应有多个维度的时间序列数据。
时间序列数据可以以图4所示的坐标系表示,横坐标为时间,纵坐标为多个维度的数据,则时间序列数据在对应维度的图形表示为曲线。该指定时间窗口即为从关于多维时间序列原始数据的坐标图中截取的一部分具有物理意义的时间窗口。该物理意义指的是工业物联网服务器伴随多维时间序列数据采集到的同时段的其他信息,也可以是采集到多维时间序列数据中某些维度的数据信息。即,该指定时间窗口中的多维时间序列数据对应有同时段的其他信息,或者是对应有多维时间序列数据中某些维度的数据信息。
S130,获取该指定时间窗口对应的多个维度的时间序列数据,分别符号分割化处理该多个维度的时间序列数据中每个维度的时间序列数据,得到关于该多个维度的原始符号序列。
需要说明的是,该符号分割化处理属于S100中的符号化处理中的一个步骤,得到的结果是关于该多个维度的原始符号序列。请参见图4,科学计算服务器读取工业物联网服务器的指定时间窗口中的多维时间序列数据,针对每个维度,按等概率分布确定符号分割点,将该指定时间窗口中的该维度时间序列数据符号分割化处理,生成该原始符号序列,该原始符号序列实质为一段字符串。例如,以该维度上的某两个数据为准做垂直于维度坐标轴的上边界线和下边界线,位于下边界线以下的部分用字母a表示,位于上边界线以上的部分用字母c表示,位于上边界线和下边界线之间的部分用字母b表示。例如,指定时间窗口中的该时间序列数据可以根据曲线划分状况表示为cabbc。
在一个实施例中,S130包括:
S131,获取该指定时间窗口对应的多个维度的时间序列数据,并摘录该多个维度的时间序列数据的语义。
该语义即表示该多个维度的时间序列数据对应的外部事件。
S132,获取该语义的持续时间。
以该语义为设备所处环境温度为某温度为例,该语义的持续时间即为该设备所处环境温度为某温度的持续时间。
S133,根据该持续时间,符号化该多个维度的时间序列数据,得到关于该多个维度的原始符号序列。
根据该持续时间,该科学计算服务器需要按照预先配置读取该指定时间窗口的多维时间序列数据,针对每个维度,按等概率分布确定符号分割点,将该指定时间窗口内的此维度时间序列符号化。该预先配置可以理解为配置采集某个固定时间段的数据。
S140,分别分词操作处理该多个维度的原始符号序列中每个维度的该原始符号序列,得到该多个维度中每个维度对应的分词符号序列组。
该分词操作处理指的是把该原始符号序列按照所有维度最高采样频率的整数倍进行分割,被分割后的该原始符号序列,即字符串表现多个为以空格形式分开的分词符号序列,该多个以空格形式分开的分词符号序列组成该分词符号序列组。例如,把原始符号序列为baabccbc的字符串按照所有维度最高采样频率的整数倍进行分割,得到分词符号序列组为baa bcc bc,其中,baa代表分词符号序列,同理,bcc和bc也代表分词符号序列。例如一个维度的采样频率为30hz(赫兹),另一个维度的采样频率为20hz,其余维度的采样频率分别为15hz,18hz,22hz,则该所有维度最高采样频率为30hz。
S150,获取该多个维度的排序规律,根据该排序规律排序该每个维度对应的分词符号序列组,得到序列句,该序列句包括该多个维度的分词符号序列组。
例如,有某个维度的分词符号序列组baa bcc bc,还有一个维度的分词符号序列组eff fdd dee,另一个维度的分词符号序列组hii hj ijj。假设该排序规律依次为该某个维度、该另一个维度、该一个维度,则得到的序列句为baa eff hii;bcc fdd hj;bc deeijj。
该排序规律为该多个维度之间的相关性由高至低的排序规律。具体的,是根据Pearson相关系数计算各个维度之间的相关性,再根据各个维度之间的相关性从高到低排序该多个维度的分词符号序列。具体的,根据Pearson相关系数计算各个维度之间的相关性,公式如下:
其中,X和Y分别代表两个维度的时间序列数据,cov(X,Y)代表关于该两个维度的协方差,δXδY代表该两个维度的时间序列数据标准差乘积。ρX,Y的值的绝对值越大,则该两个维度的时间序列数据相关性越高。例如,以X为温度的时间序列数据,Y为湿度的时间序列数据进行计算得到ρX,Y的值的绝对值,作为第一值。再替换Y为速度的时间序列数据进行计算得到一个ρX,Y的值的绝对值,作为第二值。若该第一值大于该第二值,则该湿度的时间序列数据优先于该速度的时间序列数据排在该温度的时间序列数据的后面。
S160,根据相似度标准聚类该序列句中该多个维度的分词符号序列组,得到该多个维度对应的该符号序列,即多维时间序列原始数据对应的符号序列。
该相似度标准即为该多个维度的分词符号序列组的共性。举例对该相似度标准进行阐释,例如,该多个维度的分词符号序列组分别代表设备运行温度40℃、50℃、60℃,而设备运行温度超过20℃即为运行温度过高,则在此例中,相似度标准可以为运行温度过高,根据相似度标准为运行温度过高聚类该多个维度的分词符号序列组,即为聚类同属于运行温度过高的标准中的分词符号序列组。
该多个维度对应的该符号序列,可以是以一个符号表示的代表一个相似度标准。延续上例,比如,可以用A代表运行温度过高。需要说明的是,步骤S160是基于步骤S150的基础上进行聚类处理,因此,该多个维度对应的该符号序列之间的排序依然是按照该排序规律进行排序的,没有发生改变。
S170,根据该多维时间序列原始数据对应的符号序列建立该任意一个设备的语料库。
该语料库包括该任意一个设备的指定时间窗口中的多维时间序列原始数据对应的符号序列。
在一个实施例中,S170包括:
S171,更新该序列句中的该多个维度的分词符号序列组为该多个维度对应的该符号序列,并根据更新结果建立该任意一个设备的语料库。
该更新也可以理解为替换。该多个维度对应的该符号序列的排序规律不变,只是将该序列句中的该分词符号序列组替换为该多个维度对应的该符号序列。在其中一个实施例中,该得到序列句之后,该科学计算服务器根据该序列句建立原始语料库。步骤S171包括:
S172,更新该原始语料库中的该多个维度的分词符号序列组为该多个维度对应的该符号序列,并根据更新结果更新原始语料库为该任意一个设备的语料库。
S180,返回执行步骤获取该多个设备中任意一个设备的该多维时间序列原始数据对应的具有物理意义的时间窗口,直至获取该多个设备中每个设备的语料库,得到该设施语料库。
反复执行步骤S110至步骤S170,直至获取该多个设备中每个设备的语料库,根据该每个设备的语料库,建立包括该多个设备的多维时间序列原始数据对应的符号序列的该设施语料库。
需要说明的是,S300中涉及到的该符号化处理,该符号化处理过程包括:
获取该待查询时间序列数据,分别符号化处理该待查询时间序列数据,得到关于该待查询时间序列数据中多个维度的原始符号序列。
分别分词操作处理该多个维度的原始符号序列,得到该多个维度中每个维度对应的分词符号序列组。
获取该多个维度的排序规律,根据该排序规律排序该每个维度对应的分词符号序列组,得到序列句,该序列句包括该多个维度的分词符号序列组。
根据相似度标准聚类该序列句中该多个维度的分词符号序列组,得到该多个维度对应的该符号序列,即该待查询时间序列对应的符号序列。
进而,步骤S400将该待查询符号序列与该设施语料库中的符号序列进行匹配,得到多个相似符号序列。
本实施例提供的方法是对多维时间序列原始数据进行符号化处理后建立该设施语料库的方法。该符号化处理的方法包括从工业物联网服务器获取多个设备的该多维时间序列原始数据;获取该多维时间序列原始数据对应的指定时间窗口;获取该指定时间窗口对应的多个维度的时间序列数据,分别符号分割化处理该多个维度的时间序列数据中每个维度的时间序列数据,得到关于该多个维度的原始符号序列;分词操作处理该原始符号序列后得到该多个维度中每个维度对应的分词符号序列组;根据排序规律排序该每个维度对应的分词符号序列组,得到序列句;根据相似度标准聚类该序列句中的该多个维度的分词符号序列组,得到该多个维度对应的该符号序列。根据该多维时间序列原始数据对应的符号序列建立任意一个设备的语料库;根据该多个设备中每个设备的语料库建立该设施语料库。该符号化处理可以将多维时间序列数据表征为符号形式,存储于该设施语料库中。符号化处理可以帮助时间序列数据之间的模糊匹配,无需进行相似度精确匹配便可以找到相似的数据,解决了多维时间序列数据的相似度匹配方法存在的劳动成本大的问题。
在本发明的一个实施例中,S500包括:
S510,从工业物联网服务器获取数据对应关系,该数据对应关系是指该设施语料库中的多维时间序列数据与对应的符号序列之间的对应关系。
S520,根据该数据对应关系,从该工业物联网服务器获取与该多个相似符号序列对应的多个相似多维时间序列原始数据。
可以理解的是,该对应关系存储于该工业物联网服务器,当该科学计算服务器确定了该多个相似符号序列后,还需要找出该多个相似符号序列对应的多个相似多维时间序列原始数据,并反馈给输入该查询请求的用户。
在本申请的一个实施例中,S400包括:
S410,获取匹配模型。
在其中一个实施例中,S410包括:
S411,获取词向量模型。
S412,根据该设施语料库训练该词向量模型,得到该匹配模型。
工作人员可以根据实际应用需要,利用不同的设施语料库训练基于词向量模型的神经网络,即该匹配模型,该匹配模型是包含了词向量上下文关联模式的神经网络模型。工作人员可以将训练的多个匹配模型保存备用,在需要调用的时候使用。
S420,将该待查询符号序列输入该匹配模型,得到该多个相似符号序列,该匹配模型用于将该待查询符号序列与该设施语料库中的符号序列进行匹配。
可以理解的是,该匹配模式中包含该多个设备的多维时间序列原始数据对应的符号序列。将该待查询符号序列输入至该匹配模型,该匹配模型将该待查询符号序列与该设施语料库中的符号序列进行匹配,可以得到该多个相似符号序列。
在本发明的一个实施例中,S400之后包括:
S430,分别获取该多个相似符号序列中每个该相似符号序列与该待查询符号序列的相似度。
S440,获取相似度排序规律。
S450,根据该相似度排序规律排序该相似度,以及排序与该相似度对应的相似符号序列。
在一个实施例中,该相似度排序规律可以为相似度由高到低,根据该相似度排序该多个相似符号序列,得到与该待查询符号序列的相似度由高到低的多个相似符号序列,相应的,可以得到相似度由高到低排列的该多个相似多维时间序列原始数据,以及该多个相似的多维时间序列原始数据对应的语义。进而输出与该待查询时间序列数据的相似度由高到低的该多个相似多维时间序列原始数据,以及该多个多维相似时间序列原始数据对应的语义。
请参见图5,本发明还提供一种数据匹配装置10,包括:
获取模块11,用于获取设施语料库,该设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,该符号序列用于表征该多维时间序列数据的特征,该符号序列是对该多维时间序列原始数据进行符号化处理得到的。该获取模块11还用于从工业物理网服务器获取多个设备的该多维时间序列原始数据;获取该多个设备中任意一个设备的该多维时间序列原始数据对应的指定时间窗口,一个该指定时间窗口对应有多个维度的时间序列数据;获取该指定时间窗口对应的多个维度的时间序列数据,分别符号分割化处理该多个维度的时间序列数据中每个维度的时间序列数据,得到关于该多个维度的原始符号序列;分别分词操作处理该多个维度的原始符号序列中每个维度的该原始符号序列,得到该多个维度中每个维度对应的分词符号序列组;获取该多个维度的排序规律,根据该排序规律排序该每个维度对应的分词符号序列组,得到序列句,该序列句包括该多个维度的分词符号序列组;根据相似度标准聚类该序列句中该多个维度的分词符号序列组,得到该多个维度对应的该符号序列,即多维时间序列原始数据对应的符号序列;根据该多维时间序列原始数据对应的符号序列建立该任意一个设备的语料库;返回执行步骤获取该多个设备中任意一个设备的该多维时间序列原始数据对应的具有物理意义的时间窗口,直至获取该多个设备中每个设备的语料库,得到该设施语料库。该获取模块11还用于获取该指定时间窗口对应的多个维度的时间序列数据,并摘录该多个维度的时间序列数据的语义;获取该语义的持续时间;根据该持续时间,符号化该多个维度的时间序列数据,得到关于该多个维度的原始符号序列。该获取模块11还用于更新该序列句中的该多个维度的分词符号序列组为该多个维度对应的该符号序列,并根据更新结果建立该任意一个设备的语料库。
接收模块12,用于接收用户输入的待查询时间序列数据。
数据处理模块13,用于对该待查询时间序列数据进行该符号化处理得到待查询符号序列。
匹配模块14,用于将该待查询符号序列与该设施语料库中的符号序列进行匹配,得到多个相似符号序列。该匹配模块14还用于获取匹配模型;将该待查询符号序列输入该匹配模型,得到该多个相似符号序列,该匹配模型用于将该待查询符号序列与该设施语料库中的符号序列进行匹配。该匹配模块14还用于获取词向量模型;根据该设施语料库训练该词向量模型,得到该匹配模型。该匹配模块14还用于分别获取该多个相似符号序列中每个该相似符号序列与该待查询符号序列的相似度;获取相似度排序规律;根据该相似度排序规律排序该相似度,以及排序与该相似度对应的相似符号序列。
该获取模块11还用于获取与该多个相似符号序列对应的多个相似多维时间序列原始数据。该获取模块11还用于从工业物联网服务器获取数据对应关系,该数据对应关系是指该设施语料库中的多维时间序列数据与对应的符号序列之间的对应关系;根据该数据对应关系,从该工业物联网服务器获取与该多个相似符号序列对应的多个相似多维时间序列原始数据。
该获取模块11还用于获取与该多个相似多维时间序列原始数据对应的语义。
输出模块15,用于输出该多个相似多维时间序列原始数据和该多个多维相似时间序列原始数据对应的语义。
请参见图6,本发明还提供一种电子设备20,包括处理器21、存储器22和收发器23,该存储器22用于存储指令,该收发器23用于和其他设备通信,该处理器21用于执行该存储器22中存储的指令,以使该电子设备20执行如上实施例该的数据匹配方法。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,该计算机执行指令被处理器执行时用于实现如上任一项实施例该的图片删除方法。
需要说明的是,上述计算机可读存储介质可以是只读存储器(Read Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是包括上述存储器之一或任意组合的各种电子设备,如移动电话、计算机、平板设备、个人数字助理等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所描述的方法。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (12)
1.一种数据匹配方法,其特征在于,包括:
获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,所述符号序列用于表征所述多维时间序列数据的特征,所述符号序列是对所述多维时间序列原始数据进行符号化处理得到的;
接收用户输入的待查询时间序列数据;
对所述待查询时间序列数据进行所述符号化处理得到待查询符号序列;
将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列;
获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据;
获取与所述多个相似多维时间序列原始数据对应的语义;
输出所述多个相似多维时间序列原始数据和所述多个多维相似时间序列原始数据对应的语义。
2.根据权利要求1所述的方法,其特征在于,所述获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据中每个维度的时间序列数据对应的符号序列,包括:
从工业物理网服务器获取多个设备的所述多维时间序列原始数据;
获取所述多个设备中任意一个设备的所述多维时间序列原始数据对应的指定时间窗口,一个所述指定时间窗口对应有多个维度的时间序列数据;
获取所述指定时间窗口对应的多个维度的时间序列数据,分别符号分割化处理所述多个维度的时间序列数据中每个维度的时间序列数据,得到关于所述多个维度的原始符号序列;
分别分词操作处理所述多个维度的原始符号序列中每个维度的所述原始符号序列,得到所述多个维度中每个维度对应的分词符号序列组;
获取所述多个维度的排序规律,根据所述排序规律排序所述每个维度对应的分词符号序列组,得到序列句,所述序列句包括所述多个维度的分词符号序列组;
根据相似度标准聚类所述序列句中所述多个维度的分词符号序列组,得到所述多个维度对应的所述符号序列,即多维时间序列原始数据对应的符号序列;
根据所述多维时间序列原始数据对应的符号序列建立所述任意一个设备的语料库;
返回执行步骤获取所述多个设备中任意一个设备的所述多维时间序列原始数据对应的具有物理意义的时间窗口,直至获取所述多个设备中每个设备的语料库,得到所述设施语料库。
3.根据权利要求2所述的方法,其特征在于,所述获取所述指定时间窗口中的时间序列数据,符号化所述时间序列数据,得到关于多个维度的原始符号序列,包括:
获取所述指定时间窗口对应的多个维度的时间序列数据,并摘录所述多个维度的时间序列数据的语义;
获取所述语义的持续时间;
根据所述持续时间,符号化所述多个维度的时间序列数据,得到关于所述多个维度的原始符号序列。
4.根据权利要求2所述的方法,其特征在于,所述根据所述多维时间序列原始数据对应的符号序列建立所述任意一个设备的语料库包括:
更新所述序列句中的所述多个维度的分词符号序列组为所述多个维度对应的所述符号序列,并根据更新结果建立所述任意一个设备的语料库。
5.根据权利要求2所述的方法,其特征在于,所述排序规律为所述多个维度之间的相关性由高至低的排序规律。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据,包括:
从工业物联网服务器获取数据对应关系,所述数据对应关系是指所述设施语料库中的多维时间序列数据与对应的符号序列之间的对应关系;
根据所述数据对应关系,从所述工业物联网服务器获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述将所述待查询符号序列与所述述设施语料库中的符号序列进行匹配,得到多个相似符号序列,包括:
获取匹配模型;
将所述待查询符号序列输入所述匹配模型,得到所述多个相似符号序列,所述匹配模型用于将所述待查询符号序列与所述设施语料库中的符号序列进行匹配。
8.根据权利要求7所述的方法,其特征在于,所述获取匹配模型包括:
获取词向量模型;
根据所述设施语料库训练所述词向量模型,得到所述匹配模型。
9.根据权利要求1-5任一项所述的方法,其特征在于,所述将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列,包括:
分别获取所述多个相似符号序列中每个所述相似符号序列与所述待查询符号序列的相似度;
获取相似度排序规律;
根据所述相似度排序规律排序所述相似度,以及排序与所述相似度对应的相似符号序列。
10.一种数据匹配装置,其特征在于,包括:
获取模块,用于获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,所述符号序列用于表征所述多维时间序列数据的特征,所述符号序列是对所述多维时间序列原始数据进行符号化处理得到的;
接收模块,用于接收用户输入的待查询时间序列数据;
数据处理模块,用于对所述待查询时间序列数据进行所述符号化处理得到待查询符号序列;
匹配模块,用于将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列;
所述获取模块还用于获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据;
所述获取模块还用于获取与所述多个相似多维时间序列原始数据对应的语义;
输出模块,用于输出所述多个相似多维时间序列原始数据和所述多个多维相似时间序列原始数据对应的语义。
11.一种电子设备,其特征在于,包括:处理器、存储器和收发器,所述存储器用于存储指令,所述收发器用于和其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如权利要求1至9中任一项所述的数据匹配方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至9任一项所述的数据匹配方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010701655.7A CN111881179B (zh) | 2020-07-20 | 2020-07-20 | 数据匹配方法、装置及其设备、计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010701655.7A CN111881179B (zh) | 2020-07-20 | 2020-07-20 | 数据匹配方法、装置及其设备、计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111881179A true CN111881179A (zh) | 2020-11-03 |
CN111881179B CN111881179B (zh) | 2024-03-01 |
Family
ID=73155117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010701655.7A Active CN111881179B (zh) | 2020-07-20 | 2020-07-20 | 数据匹配方法、装置及其设备、计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111881179B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116071690A (zh) * | 2023-04-03 | 2023-05-05 | 江西师范大学 | 一种基于场景关键帧的情景特征提取方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017056982A1 (ja) * | 2015-09-30 | 2017-04-06 | ヤマハ株式会社 | 楽曲検索方法および楽曲検索装置 |
CN107122469A (zh) * | 2017-04-28 | 2017-09-01 | 中国人民解放军国防科学技术大学 | 基于语义相似度与时效性频率的查询推荐排序方法与装置 |
CN107145510A (zh) * | 2017-03-31 | 2017-09-08 | 西安科技大学 | 一种数学公式搜索方法及装置 |
CN107704453A (zh) * | 2017-10-23 | 2018-02-16 | 深圳市前海众兴电子商务有限公司 | 一种文字语义分析方法、文字语义分析终端及存储介质 |
US20190065992A1 (en) * | 2017-08-30 | 2019-02-28 | International Business Machines Corporation | Machine learning for time series using semantic and time series data |
US20200142989A1 (en) * | 2018-11-02 | 2020-05-07 | International Business Machines Corporation | Method and system for supporting inductive reasoning queries over multi-modal data from relational databases |
CN111199149A (zh) * | 2019-12-17 | 2020-05-26 | 航天信息股份有限公司 | 一种对话系统的语句智能澄清方法及系统 |
-
2020
- 2020-07-20 CN CN202010701655.7A patent/CN111881179B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017056982A1 (ja) * | 2015-09-30 | 2017-04-06 | ヤマハ株式会社 | 楽曲検索方法および楽曲検索装置 |
CN107145510A (zh) * | 2017-03-31 | 2017-09-08 | 西安科技大学 | 一种数学公式搜索方法及装置 |
CN107122469A (zh) * | 2017-04-28 | 2017-09-01 | 中国人民解放军国防科学技术大学 | 基于语义相似度与时效性频率的查询推荐排序方法与装置 |
US20190065992A1 (en) * | 2017-08-30 | 2019-02-28 | International Business Machines Corporation | Machine learning for time series using semantic and time series data |
CN107704453A (zh) * | 2017-10-23 | 2018-02-16 | 深圳市前海众兴电子商务有限公司 | 一种文字语义分析方法、文字语义分析终端及存储介质 |
US20200142989A1 (en) * | 2018-11-02 | 2020-05-07 | International Business Machines Corporation | Method and system for supporting inductive reasoning queries over multi-modal data from relational databases |
CN111199149A (zh) * | 2019-12-17 | 2020-05-26 | 航天信息股份有限公司 | 一种对话系统的语句智能澄清方法及系统 |
Non-Patent Citations (2)
Title |
---|
崔渊;陶莉;周余洪;刘晓强;杜明;: "一种对时间连续数据进行分析查询的SQL扩展语言", 计算机应用与软件, no. 05 * |
蔺伟斌;杨世瀚;: "基于时间递归序列模型的短文本语义简化", 物联网技术, no. 05 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116071690A (zh) * | 2023-04-03 | 2023-05-05 | 江西师范大学 | 一种基于场景关键帧的情景特征提取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111881179B (zh) | 2024-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109885768A (zh) | 工单处理方法、装置及系统 | |
CN109829108B (zh) | 信息推荐方法、装置、电子设备及可读存储介质 | |
CN106997390B (zh) | 一种设备配件或零部件商品交易信息搜索方法 | |
CN111782763A (zh) | 基于语音语义的信息检索方法、及其相关设备 | |
CN113222170B (zh) | 一种用于物联网ai协同服务平台的智能算法和模型 | |
CN106844638A (zh) | 信息检索方法、装置及电子设备 | |
CN111221954A (zh) | 一种构建家电维修问答库的方法、装置、存储介质及终端 | |
CN113627797A (zh) | 入职员工画像生成方法、装置、计算机设备及存储介质 | |
CN111881179B (zh) | 数据匹配方法、装置及其设备、计算机存储介质 | |
CN115619448A (zh) | 用户流失预测方法、装置、计算机设备及存储介质 | |
JP5884293B2 (ja) | 類似文字コード群検索支援方法、類似候補抽出方法、類似候補抽出プログラムおよび類似候補抽出装置 | |
CN114638501A (zh) | 一种业务数据处理方法、装置、计算机设备及存储介质 | |
CN112632378B (zh) | 基于大数据和人工智能的信息处理方法及数据服务器 | |
CN113836272A (zh) | 关键信息的展示方法、系统、计算机设备及可读存储介质 | |
CN117420998A (zh) | 一种客户端ui交互组件生成方法、装置、终端及介质 | |
US20160292258A1 (en) | Method and apparatus for filtering out low-frequency click, computer program, and computer readable medium | |
CN110598995A (zh) | 智能客户评级方法、装置及计算机可读存储介质 | |
US20230297082A1 (en) | System and method for facilitating engineering of an industrial system | |
CN115454466A (zh) | 机器学习模型自动更新的方法、装置、设备和介质 | |
CN114219663A (zh) | 产品推荐方法、装置、计算机设备及存储介质 | |
CN110019547B (zh) | 获取客户间的关联关系的方法、装置、设备及介质 | |
CN112287215A (zh) | 一种智能就业推荐方法和装置 | |
CN115858759B (zh) | 一种基于医学知识图谱的智能查询算法及管理系统 | |
CN111859154A (zh) | 一种应用推荐方法及装置 | |
CN111090723A (zh) | 一种基于知识图谱的电网安全生产内容推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |