CN114510525B - 数据格式转换方法、装置、计算机设备和存储介质 - Google Patents
数据格式转换方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN114510525B CN114510525B CN202210405401.XA CN202210405401A CN114510525B CN 114510525 B CN114510525 B CN 114510525B CN 202210405401 A CN202210405401 A CN 202210405401A CN 114510525 B CN114510525 B CN 114510525B
- Authority
- CN
- China
- Prior art keywords
- data
- rule
- target
- format
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种数据格式转换方法、装置、计算机设备和存储介质。方法包括:获取由传感器采集预设业务场景下的原始数据;预设业务场景具有对应的规则池;将原始数据按照规则池对应的业务逻辑降维,得到降维后数据;在规则池中查询与降维后数据匹配的目标规则;基于目标规则对应的数据格式,对降维后数据进行格式转换。采用本方法能够对传感器采集的大量数据按照预设业务场景进行分类,得到与业务相关的原始数据,实现数据整合,缩减了规则池所处理的原始数据的数据量,并按照原始数据对应的预设业务场景确定规则池,进一步缩减原始数据的数据量,得到降维后数据,再转换降维后数据并输出格式转换后的数据高效地数据转换。
Description
技术领域
本申请涉及数据处理技术领域,特别是涉及一种数据格式转换方法、装置、计算机设备和存储介质。
背景技术
随着工业生产的变革,工厂的数据对接和转换变得尤其重要。通过对工厂设备数据的采集,实现对设备数据处理的第一步,有些逻辑比较复杂的业务,代码是无法修改的,需要将其采集上来的数据通过转换引擎转换处理。
在传统的数据转换方式,通常是将采集到的传感器数据全部进行格式转换,由于每种格式转换均有其对应的解决方案,其用于进行格式转换的数据总量较大,需要较长的匹配时间,且数据转换的效率相对较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高效率的数据转换方法、装置、计算机设备和计算机可读存储介质。
第一方面,本申请提供了一种数据格式转换方法,所述方法包括:
获取由传感器采集预设业务场景下的原始数据;所述预设业务场景具有对应的规则池;
将所述原始数据按照所述规则池对应的业务逻辑降维,得到降维后数据;
在所述规则池中查询与所述降维后数据匹配的目标规则;
基于所述目标规则对应的数据格式,对所述降维后数据进行格式转换。
在其中一个实施例中,将所述原始数据按照所述规则池对应的业务逻辑降维,得到降维后数据,包括:
确定所述规则池对应的多个业务属性;
将所述原始数据按照各所述业务属性进行特征提取,得到多份数据特征;
按照所述规则池与各所述业务属性的对应关系,将多份所述数据特征进行组合,并将组合的数据特征作为降维后数据。
在其中一个实施例中,将所述原始数据按照各所述业务属性进行特征提取,得到多份数据特征之后,包括:
若目标数据特征中出现数据缺失的情况时,获取所述业务属性对应的待填充变量;所述目标数据特征属于多份所述数据特征中的至少一份;
基于所述待填充变量的分布特性与重要程度中的至少一项,对所述目标数据特征中缺失的数据进行预测,得到预测结果;
将所述预测结果填充于所述目标数据特征中。
在其中一个实施例中,所述方法还包括:
获取所述待填充变量与所述预测结果之间的关联度;
获取所述待填充变量对应的信息总量;
根据所述信息总量和所述关联度确定所述待填充变量的重要程度。
在其中一个实施例中,在所述规则池中查询与所述降维后数据匹配的目标规则,包括:
确定所述规则池中的多个规则;
获取各所述规则各自对应的多个待转换格式标识;
确定各所述降维后数据的数据格式标识;
基于各所述降维后数据的数据格式标识与多个所述待转换格式标识之间的匹配关系,查询所述规则池中的目标规则。
在其中一个实施例中,基于所述目标规则对应的数据格式,对所述降维后数据进行格式转换,包括:
获取所述目标规则对应的业务需求;
确定所述业务需求适配的目标数据格式;
按照所述目标数据格式对所述降维后数据进行格式转换。
第二方面,本申请还提供了一种数据格式转换装置,所述装置包括:
原始数据获取模块,用于获取由传感器采集预设业务场景下的原始数据;所述预设业务场景具有对应的规则池;
原始数据降维模块,用于将所述原始数据按照所述规则池对应的业务逻辑降维,得到降维后数据;
目标规则确定模块,用于在所述规则池中查询与所述降维后数据匹配的目标规则;
数据格式转换模块,用于基于所述目标规则对应的数据格式,对所述降维后数据进行格式转换。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任意实施例中数据格式转换的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意实施例中数据格式转换的步骤。
上述数据格式转换方法、装置、计算机设备和存储介质,传感器采集的大量数据按照预设业务场景进行分类后,得到与业务相关的原始数据,实现了数据的整合,缩减了规则池所处理的原始数据的数据量,且便于规则池的扩展和维护。而按照原始数据对应的预设业务场景确定规则池,以便于通过规则池内各规则共同对应的业务逻辑降维原始数据,进一步缩减原始数据的数据量,并使得原始数据的信息损失较小,得到降维后数据。再基于降维后数据,在规则池中查询相匹配的目标规则,以确定降维后数据进行的至少一种数据格式,进而转换降维后数据并输出格式转换后的数据,实现高效地数据转换。
附图说明
图1为一个实施例中数据格式转换方法的应用环境图;
图2为一个实施例中数据格式转换方法的流程示意图;
图3为一个实施例中缺少的数据进行填充的流程示意图;
图4为另一个实施例中确定重要程度的流程示意图;
图5为一个实施例中数据格式转换在对接服务中的数据流向图;
图6为一个实施例中数据格式转换内各模块的结构框图;
图7为一个实施例中数据格式转换装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的数据格式转换方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。获取由传感器采集预设业务场景下的原始数据;预设业务场景具有对应的规则池;将原始数据按照规则池对应的业务逻辑降维,得到降维后数据;在规则池中查询与降维后数据匹配的目标规则;基于目标规则对应的数据格式,对降维后数据进行格式转换。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种数据格式转换方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
步骤202,获取由传感器采集预设业务场景下的原始数据;预设业务场景具有对应的规则池。
传感器采集的数据可以是在工厂设备端产生的数据、工厂内部系统产生的数据,也可以是在生产过程中产生的数据。具体的,工厂设备端主要是设备的数据,其可以包括设备的标识、电流、电压等数据;工厂内部系统产生的数据是工厂相关的环境数据或基于工厂中各设备而生成的数据;生产过程中产生的数据是与产品生产过程相关的数据,其包括生产的产品粒度大小、水分含量、配方等相关数据。
不同传感器采集到的数据对应于数以百计的属性,因而确定与预设业务场景相关的原始数据后,按照预设业务场景确定对应的规则池,以便于对接入的原始数据分类,删除与业务不相关的属性,以在信息损失最小的前提下,减少各规则池分别处理的数据量。
步骤204,将原始数据按照规则池对应的业务逻辑降维,得到降维后数据。
对于原始数据按照规则池对应的业务逻辑进行降维的过程,其可以是通过用于控制规则池的规则引擎进行的,也可以是按照规则池中某用于降维的业务逻辑执行的。而对原始数据进行降维后,是为了保证信息的损失最小,而通过数据规约的方式缩减原始数据中的数据量,进而得到降维后数据。
可选地,规则池通过相应的规则引擎进行管理,不同规则引擎分别设置于引擎池内,通过业务逻辑的解耦,便于规则池内的各规则进行管理、拓展与维护,以便更高效地对原始数据进行降维。
在一个实施例中,将原始数据按照规则池对应的业务逻辑降维,得到降维后数据,包括:确定规则池对应的多个业务属性,将原始数据按照各业务属性进行特征提取,得到多份数据特征,按照规则池与各业务属性的对应关系,将多份数据特征进行组合,并将组合的数据特征作为降维后数据。
规则池对应的多个业务属性,用于确定该规则池下的预设业务场景对应的原始数据,去除与业务无关的冗余数据,高效提取数据特征,再基于规则池与各业务属性之间的对应关系,确定各业务属性相关的数据特征的组合方式,并以该组合方式组合数据特征。由于降维后数据的数据总量较少,当存在各类的原因导致数据丢失和空缺时,为了补全这些数据所使用的分类和回归算法的复杂度得以降低,且待补全的原始数据也并未进行格式转换,补全效果较佳。由此,使得降维后数据较为完整,进而在高效地数据格式转换后,得到符合预期的数据流。
步骤206,在规则池中查询与降维后数据匹配的目标规则。
按照各份降维后数据对应的某些前缀字段或ID值等用于匹配的数据,在规则池中查找出相匹配的目标规则,以确定用于对降维后数据进行格式转换的至少一个目标规则。
在一个实施例中,在规则池中查询与降维后数据匹配的目标规则,包括:确定规则池中的多个规则,获取各规则各自对应的多个待转换格式标识,确定各降维后数据的数据格式标识,基于各降维后数据的数据格式标识与多个待转换格式标识之间的匹配关系,查询规则池中的目标规则。
规则池中的各规则分别对应于多个待转换格式标识。将待转换格式标识分别与降维后数据的数据格式标识进行匹配后,确定各降维后数据的数据格式标识与多个待转换格式标识之间的匹配关系,再基于该匹配关系,从规则池中确定目标规则,以按照目标规则进行格式转换。例如:当降维后数据的数据格式前缀或ID值与待转换格式标识一致时,将该待转换格式标识所对应的目标规则确定为目标规则。
步骤208,基于目标规则对应的数据格式,对降维后数据进行格式转换。
按照目标规则对应的数据格式,对降维后数据进行格式转换后,使降维后数据转换为目标规则所规定的数据格式。
在一个实施例中,基于目标规则对应的数据格式,对降维后数据进行格式转换,包括:获取目标规则对应的业务需求,确定业务需求适配的目标数据格式,按照目标数据格式对降维后数据进行格式转换。
当目标规则对应于不同业务需求时,按照各业务需求确定适配的目标数据格式,并将目标数据格式作为格式转换最终得到的数据格式,以贴合各种业务需求的方式进行灵活的数据转换。
上述数据格式转换方法中,传感器采集的大量数据按照预设业务场景进行分类后,得到与业务相关的原始数据,实现了数据的整合,缩减了规则池所处理的原始数据的数据量。而按照原始数据对应的预设业务场景确定规则池,以便于通过规则池内各规则共同对应的业务逻辑降维原始数据,进一步缩减原始数据的数据量,并使得原始数据的信息损失较小,得到降维后数据。再基于降维后数据,在规则池中查询相匹配的目标规则,以确定降维后数据进行的至少一种数据格式,进而转换降维后数据并输出格式转换后的数据,实现高效地数据转换。
在一个实施例中,如图3所示,将原始数据按照各业务属性进行特征提取,得到多份数据特征之后,包括:
步骤302,若目标数据特征中出现数据缺失的情况时,获取业务属性对应的待填充变量;目标数据特征属于多份数据特征中的至少一份。
在获取多份数据特征的过程中,数据缺失的数据特征是目标数据特征。当目标数据特征出现数据缺失的情况时,该目标数据特征对应的业务属性存在相应的待填充变量。
具体的,将饲料生产的原始数据按照第一产品业务属性与第二产品业务属性分别进行特征提取后,得到第一产品业务属性对应的第一产品数据特征与第二产品业务属性对应的第二产品数据特征;若第一产品数据特征中的数据较为完整,且第二产品数据特征出现数据缺失的情况,则获取第二产品数据特征对应的待填充变量。
待填充变量是原始数据中缺少的数据所属的参数类别,其可以是待填充的设备参数、工厂参数及生产过程参数。例如,设备参数可以是设备的电压、电流等参数,工厂参数可以是工厂的环境、物料库存等参数,生产过程参数可以是产品在不同工段中的设备顺序、配方等参数。
步骤304,基于待填充变量的分布特性与重要程度中的至少一项,对目标数据特征中缺失的数据进行预测,得到预测结果。
若变量的缺失率较高(大于80%)较低,且重要程度较低,可以直接将变量删除,或者按照定值进行填充,其中,工程中常用-9999定值填充;
若缺失率较低(小于95%)且重要性较低,则根据未缺失的数据分布的情况进行填充。当数据符合均匀分布时,用该变量均值填补缺失;当数据存在倾斜分布的情况,采用中位数进行填补。此外,还有插值法填充,其括随机插值,多重差补法,热平台插补,拉格朗日插值,牛顿插值等;模型填充法,使用回归、贝叶斯、随机森林、决策树等模型对缺失数据进行预测。
此外,若变量是离散型,且不同值较少,可转换成哑变量,例如性别SEX变量,存在male,fameal,NA三个不同的值,可将该列转换成 IS_SEX_MALE, IS_SEX_FEMALE, IS_SEX_NA。若某个变量存在十几个不同的值,可根据每个值的频数,将频数较小的值归为一类other,降低维度。此做法可最大化保留变量的信息。
步骤306,将预测结果填充于目标数据特征中。
本实施例中,通过预测结果确定目标数据特征缺失的数据,并通过预测结果补全目标数据特征,而补全数据特征再进行格式转换,可以直接输出到其他应用中直接使用,无需再次处理,因而数据格式装换效率较高。
进一步地,如图4所示,该方法还包括:
步骤402,获取待填充变量与预测结果之间的关联度。
待填充变量与预测结果之间的关联度,用于表征待填充变量的预测能力,其既可以表征预测出的数据量,也可以是指该待填充变量所能预测出的设备故障数量等相关信息的能力。
步骤404,获取待填充变量对应的信息总量。
信息总量用于表征待填充变量所涉及的信息多少,信息总量越大,则该待填充变量的重要程度越高,更可能对缺失的数据进行预测,以便于提高数据进行格式转换后的适应性。
步骤406,根据信息总量和关联度确定待填充变量的重要程度。
本实施例中,从待填充变量对应的信息总量和关联度这两个维度判断待填充变量的重要程度,将待填充变量的重要程度量化为可衡量的数据,以便于更准确地补全目标数据特征中缺少的数据,且使得信息损失量进一步缩小,以便于降维后数据格式转换后,可以输出,无需多次转换,间接提高数据转换的效率。
进一步地,为了更清楚地展示数据转换方法在具体应用中的数据流,将数据转换方法对应的模块作为处理数据流向中的转换模块,以便于说明其在整体数据流向中的功能,如图5所示。其他设备或系统输入传感器数据到用于处理对接服务的模块集合中的接入模块,通过接入模块将数以百计的数据输入到上述任意实施例的数据转换模块,以进行格式转换后,将转换后的数据传输到其他模块,以高效地数据转换来保障其他各模块的数据处理效率。
具体的,如图6所示,在转换模块包括引擎池,引擎池中的规则引擎可以定义多个,各规则引擎分别管控业务场景对应的规则池,规则池中的各规则分别对应于不同的业务需求。由此,数据转换模块便于拓展和维护。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的数据格式转换方法的数据格式转换装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个数据格式转换装置实施例中的具体限定可以参见上文中对于数据格式转换方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种数据格式转换装置,包括:原始数据获取模块702、原始数据降维模块704、目标规则确定模块706和数据格式转换模块708,其中:
原始数据获取模块702,用于获取由传感器采集预设业务场景下的原始数据;所述预设业务场景具有对应的规则池;
原始数据降维模块704,用于将所述原始数据按照所述规则池对应的业务逻辑降维,得到降维后数据;
目标规则确定模块706,用于在所述规则池中查询与所述降维后数据匹配的目标规则;
数据格式转换模块708,用于基于所述目标规则对应的数据格式,对所述降维后数据进行格式转换。
在其中一个实施例中,原始数据降维模块704,包括:
降维属性确定单元,用于确定所述规则池对应的多个业务属性;
数据特征提取单元,用于将所述原始数据按照各所述业务属性进行特征提取,得到多份数据特征;
降维数据组合单元,用于按照所述规则池与各所述业务属性的对应关系,将多份所述数据特征进行组合,并将组合的数据特征作为降维后数据。
在其中一个实施例中,该装置还包括:
数据缺失确定模块,用于若目标数据特征中出现数据缺失的情况时,获取所述业务属性对应的待填充变量;所述目标数据特征属于多份所述数据特征中的至少一份;
缺失数据预测模块,用于基于所述待填充变量的分布特性与重要程度中的至少一项,对所述目标数据特征中缺失的数据进行预测,得到预测结果;
缺失数据填充模块,用于将所述预测结果填充于所述目标数据特征中。
在其中一个实施例中,该装置还包括:
关联度获取模块,用于获取所述待填充变量与所述预测结果之间的关联度;
信息量获取模块,用于获取所述待填充变量对应的信息总量;
重要程度生成模块,用于根据所述信息总量和所述关联度确定所述待填充变量的重要程度。
在其中一个实施例中,目标规则确定模块706,包括:
规则确定单元,用于确定所述规则池中的多个规则;
第一格式确定单元,用于获取各所述规则各自对应的多个待转换格式标识;
第一格式确定单元,用于确定各所述降维后数据的数据格式标识;
目标规则确定单元,用于基于各所述降维后数据的数据格式标识与多个所述待转换格式标识之间的匹配关系,查询所述规则池中的目标规则。
在其中一个实施例中,数据格式转换模块708包括:
业务需求确定单元,用于获取所述目标规则对应的业务需求;
目标数据格式确定单元,用于确定所述业务需求适配的目标数据格式;
格式转换单元,用于按照所述目标数据格式对所述降维后数据进行格式转换。
上述数据格式转换装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种数据格式转换方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种数据格式转换方法,其特征在于,所述方法包括:
获取由传感器采集按照预设业务场景分类的原始数据;所述预设业务场景具有对应的规则池;
将所述原始数据按照各所述规则池对应的业务属性进行特征提取,得到多份数据特征;按照所述规则池与各所述业务属性的对应关系,将多份所述数据特征进行组合,并将组合的数据特征作为降维后数据;所述降维后数据是通过所述业务属性去除业务无关数据后所得到的;
在所述规则池中查询与所述降维后数据匹配的目标规则;
基于所述目标规则对应的数据格式,对所述降维后数据进行格式转换。
2.根据权利要求1所述的方法,其特征在于,将所述原始数据按照各所述业务属性进行特征提取,得到多份数据特征之后,包括:
若目标数据特征中出现数据缺失的情况时,获取所述业务属性对应的待填充变量;所述目标数据特征属于多份所述数据特征中的至少一份;
基于所述待填充变量的分布特性与重要程度中的至少一项,对所述目标数据特征中缺失的数据进行预测,得到预测结果;
将所述预测结果填充于所述目标数据特征中。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取所述待填充变量与所述预测结果之间的关联度;
获取所述待填充变量对应的信息总量;
根据所述信息总量和所述关联度确定所述待填充变量的重要程度。
4.根据权利要求1所述的方法,其特征在于,在所述规则池中查询与所述降维后数据匹配的目标规则,包括:
确定所述规则池中的多个规则;
获取各所述规则各自对应的多个待转换格式标识;
确定各所述降维后数据的数据格式标识;
基于各所述降维后数据的数据格式标识与多个所述待转换格式标识之间的匹配关系,查询所述规则池中的目标规则。
5.根据权利要求1所述的方法,其特征在于,基于所述目标规则对应的数据格式,对所述降维后数据进行格式转换,包括:
获取所述目标规则对应的业务需求;
确定所述业务需求适配的目标数据格式;
按照所述目标数据格式对所述降维后数据进行格式转换。
6.一种数据格式转换装置,其特征在于,所述装置包括:
原始数据获取模块,用于获取由传感器采集按照预设业务场景分类的原始数据;所述预设业务场景具有对应的规则池;
原始数据降维模块,用于将所述原始数据,按照所述规则池与多个业务属性的对应关系进行降维,得到降维后数据;
目标规则确定模块,用于在所述规则池中查询与所述降维后数据匹配的目标规则;
数据格式转换模块,用于基于所述目标规则对应的数据格式,对所述降维后数据进行格式转换;
其中,所述原始数据降维模块,包括:
降维属性确定单元,用于确定所述规则池对应的多个业务属性;
数据特征提取单元,用于将所述原始数据按照各所述业务属性进行特征提取,得到多份数据特征;
降维数据组合单元,用于按照所述规则池与各所述业务属性的对应关系,将多份所述数据特征进行组合,并将组合的数据特征作为降维后数据。
7.根据权利要求6所述的装置,其特征在于,还包括:
数据缺失确定模块,用于若目标数据特征中出现数据缺失的情况时,获取所述业务属性对应的待填充变量;所述目标数据特征属于多份所述数据特征中的至少一份;
缺失数据预测模块,用于基于所述待填充变量的分布特性与重要程度中的至少一项,对所述目标数据特征中缺失的数据进行预测,得到预测结果;
缺失数据填充模块,用于将所述预测结果填充于所述目标数据特征中。
8.根据权利要求7所述的装置,其特征在于,还包括:
关联度获取模块,用于获取所述待填充变量与所述预测结果之间的关联度;
信息量获取模块,用于获取所述待填充变量对应的信息总量;
重要程度生成模块,用于根据所述信息总量和所述关联度确定所述待填充变量的重要程度。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210405401.XA CN114510525B (zh) | 2022-04-18 | 2022-04-18 | 数据格式转换方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210405401.XA CN114510525B (zh) | 2022-04-18 | 2022-04-18 | 数据格式转换方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114510525A CN114510525A (zh) | 2022-05-17 |
CN114510525B true CN114510525B (zh) | 2022-08-30 |
Family
ID=81554724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210405401.XA Active CN114510525B (zh) | 2022-04-18 | 2022-04-18 | 数据格式转换方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114510525B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115438107A (zh) * | 2022-08-10 | 2022-12-06 | 珠海金智维信息科技有限公司 | 一种数据处理方法、系统、装置与存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107239581A (zh) * | 2017-07-07 | 2017-10-10 | 小草数语(北京)科技有限公司 | 数据清洗方法及装置 |
CN112783884A (zh) * | 2021-01-29 | 2021-05-11 | 浪潮软件股份有限公司 | 一种基于正态分布的数据选优方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004120227A (ja) * | 2002-09-25 | 2004-04-15 | Sharp Corp | 画像表示装置および方法 |
CN106294219B (zh) * | 2015-05-26 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 一种设备识别、数据处理方法、装置及系统 |
CN108009195B (zh) * | 2017-10-23 | 2022-06-28 | 环亚数据技术有限公司 | 一种基于大数据的降维转换方法、电子设备、存储介质 |
CN110298001B (zh) * | 2019-05-30 | 2021-11-09 | 北京奇艺世纪科技有限公司 | 日志数据包的获取方法和装置及计算机可读存储介质 |
CN112016581A (zh) * | 2019-05-31 | 2020-12-01 | 北京京东尚科信息技术有限公司 | 一种多维数据处理方法、装置、计算机设备及存储介质 |
CN110378423A (zh) * | 2019-07-22 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 特征提取方法、装置、计算机设备及存储介质 |
CN112328636A (zh) * | 2020-10-27 | 2021-02-05 | 上海金仕达软件科技有限公司 | 一种数据查找方法、装置及电子设备 |
CN112288014B (zh) * | 2020-10-30 | 2023-01-24 | 云南电网有限责任公司电力科学研究院 | 一种基于数据挖掘的设备全生命周期管理方法 |
CN112966296A (zh) * | 2021-01-28 | 2021-06-15 | 北京明朝万达科技股份有限公司 | 基于规则配置和机器学习的敏感信息过滤方法和系统 |
CN112800183B (zh) * | 2021-02-25 | 2023-09-26 | 国网河北省电力有限公司电力科学研究院 | 内容名称数据处理方法及终端设备 |
CN113806332B (zh) * | 2021-08-23 | 2024-03-19 | 北京金蝶云基科技有限公司 | 一种异构系统集成数据处理方法、装置和计算机设备 |
-
2022
- 2022-04-18 CN CN202210405401.XA patent/CN114510525B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107239581A (zh) * | 2017-07-07 | 2017-10-10 | 小草数语(北京)科技有限公司 | 数据清洗方法及装置 |
CN112783884A (zh) * | 2021-01-29 | 2021-05-11 | 浪潮软件股份有限公司 | 一种基于正态分布的数据选优方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114510525A (zh) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110866491B (zh) | 目标检索方法、装置、计算机可读存储介质和计算机设备 | |
CN108664582B (zh) | 企业关系的查询方法、装置、计算机设备及存储介质 | |
CN105824974A (zh) | 数据分析处理的方法和系统 | |
CN114510525B (zh) | 数据格式转换方法、装置、计算机设备和存储介质 | |
CN113807926A (zh) | 推荐信息生成方法、装置、电子设备和计算机可读介质 | |
CN114816711A (zh) | 批量任务处理方法、装置、计算机设备和存储介质 | |
CN111400578A (zh) | 货物数据查询方法、装置、计算机设备和存储介质 | |
CN112199443B (zh) | 数据同步方法、装置、计算机设备和存储介质 | |
CN111443897B (zh) | 一种数据处理方法、装置及存储介质 | |
CN117390011A (zh) | 报表数据处理方法、装置、计算机设备和存储介质 | |
CN116303657A (zh) | 群体画像生成方法、装置、计算机设备和存储介质 | |
CN116258597A (zh) | 单据处理方法、装置、计算机设备和存储介质 | |
CN116185578A (zh) | 计算任务的调度方法和计算任务的执行方法 | |
CN111930691B (zh) | 一种模型调用方法、装置及系统 | |
CN116757765A (zh) | 生产排程方法、装置、计算机设备和存储介质 | |
CN114547066A (zh) | 核电业务数据的标准化方法、装置和计算机设备 | |
CN116757766A (zh) | 生产排程单生成方法、装置、计算机设备和存储介质 | |
CN114676675B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN116089474B (zh) | 自定义编辑模式下的数据缓存方法、装置、设备及介质 | |
CN118394308A (zh) | 目标基座模型获取方法、装置、计算机设备和存储介质 | |
CN118170867A (zh) | 业务内容获取方法、装置、计算机设备、介质和程序产品 | |
CN117130606A (zh) | 前端页面配置方法、装置、计算机设备和存储介质 | |
CN116800833A (zh) | 数据推送方法、装置、计算机设备和存储介质 | |
CN115952337A (zh) | 一种固废系统数据展示方法及装置 | |
CN118277026A (zh) | 虚拟资源的处理方法、装置、设备、存储介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |