CN115204128A - 一种配置文件生成方法、装置和计算机可读存储介质 - Google Patents

一种配置文件生成方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN115204128A
CN115204128A CN202110382452.0A CN202110382452A CN115204128A CN 115204128 A CN115204128 A CN 115204128A CN 202110382452 A CN202110382452 A CN 202110382452A CN 115204128 A CN115204128 A CN 115204128A
Authority
CN
China
Prior art keywords
target
configuration file
file
parameter
data format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110382452.0A
Other languages
English (en)
Inventor
李宜燃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Shanghai ICT Co Ltd
CM Intelligent Mobility Network Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Shanghai ICT Co Ltd
CM Intelligent Mobility Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Shanghai ICT Co Ltd, CM Intelligent Mobility Network Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202110382452.0A priority Critical patent/CN115204128A/zh
Publication of CN115204128A publication Critical patent/CN115204128A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种配置文件生成方法、装置和计算机可读存储介质,其中,方法包括:基于预设文件聚类模型对目标配置文件内的数据格式进行识别聚类处理,以得到所述目标配置文件的目标数据格式类别;基于所述目标数据格式类别确定所述目标配置文件的结构信息,并根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件;获取用户作用于所述表格文件的编辑输入,更新所述表格文件;根据目标信息,生成与所述目标配置文件对应的更新配置文件,其中,所述目标信息包括更新后的所述表格文件、所述目标数据格式类别以及所述结构信息。本发明能够提升生成配置文件过程的灵活性。

Description

一种配置文件生成方法、装置和计算机可读存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种配置文件生成方法、装置和计算机可读存储介质。
背景技术
随着智慧工厂的推广,并伴随5G、边缘计算技术的产生,对于大批量、多类型(例如:YAML、XML、JSON、MAP等)的网关和数采设备的接入需求日益增加。网关所需要管理的采集点属性日益复杂,给网关点列表的配置带来了巨大的挑战。如何减少网关点列表配置人员的工作量,以及工厂对技术人员的依赖成为一个待解决的问题。
在相关技术中,生成配置文件的过程中,需要根据固定的目标配置文件格式,以及固定的配置参数项,创建单一的模板生成程序,并依赖于对应平台对配置信息进行数据的编辑,且目标配置文件中的内容格式也必须是固定的。
由此可见,相关技术中的配置文件生成方法存在灵活性差的缺陷。
发明内容
本发明实施例提供一种配置文件生成方法、装置和计算机可读存储介质,能够解决相关技术中的配置文件生成方法存在灵活性差的问题。
为解决上述技术问题,本发明是这样实现的:
第一方面,本发明提供了一种配置文件生成方法,包括:
基于预设文件聚类模型对目标配置文件内的数据格式进行识别聚类处理,以得到所述目标配置文件的目标数据格式类别;
基于所述目标数据格式类别确定所述目标配置文件的结构信息,并根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件,其中,所述表格文件内包括所述目标配置文件中的参数;
获取用户作用于所述表格文件的编辑输入,更新所述表格文件;
根据目标信息,生成与所述目标配置文件对应的更新配置文件,其中,所述目标信息包括更新后的所述表格文件、所述目标数据格式类别以及所述结构信息。
第二方面,本发明还提供了一种配置文件生成装置,其特征在于,包括:
分类模块,用于基于预设文件聚类模型对目标配置文件内的数据格式进行识别聚类处理,以得到所述目标配置文件的目标数据格式类别;
第一生成模块,用于基于所述目标数据格式类别确定所述目标配置文件的结构信息,并根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件,其中,所述表格文件内包括所述目标配置文件中的参数;
更新模块,用于获取用户作用于所述表格文件的编辑输入,更新所述表格文件;
第二生成模块,用于根据目标信息,生成与所述目标配置文件对应的更新配置文件,其中,所述目标信息包括更新后的所述表格文件、所述目标数据格式类别以及所述结构信息。
第三方面,本发明还提供了一种定位系统,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时,实现如第一方面所述的配置文件生成方法中的步骤。
第四方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如第一方面所述的配置文件生成方法中的步骤。
本发明提供的配置文件生成方法,包括:基于预设文件聚类模型对目标配置文件内的数据格式进行识别聚类处理,以得到所述目标配置文件的目标数据格式类别;基于所述目标数据格式类别确定所述目标配置文件的结构信息,并根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件,其中,所述表格文件内包括所述目标配置文件中的参数;获取用户作用于所述表格文件的编辑输入,更新所述表格文件;根据目标信息,生成与所述目标配置文件对应的更新配置文件,其中,所述目标信息包括更新后的所述表格文件、所述目标数据格式类别以及所述结构信息。这样,能够对不同数据结构的配置进行分类,从而按照对应的数据结构对该配置文件进行解析,以得到该配置文件的结构和参数,从而将该配置文件转化为表格文件,以便于用户通过表格文件对配置文件进行编辑或者查看等,并且可以将用户编辑后的表格文件按照原有配置文件的结构转化为更新配置文件,从而实现配置文件的更新,便于使用该更新配置文件对设备进行配置。因此,本发明提供的配置文件生成方法能够适用于多种数据结构的配置文件生成,且便于用户查看和编辑,其灵活性较好。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种配置文件生成方法的流程图;
图2是预设文件聚类模型的示意图;
图3是确定配置文件的结构信息的示意图;
图4是将配置文件转化为表格文件的示意图;
图5是将表格文件转化为配置文件的示意图;
图6是本发明实施例提供的另一种配置文件生成方法的流程图;
图7是本发明实施例提供的一种配置文件生成装置的结构图;
图8是本发明实施例提供的另一种配置文件生成装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
智慧工厂可以包括多个网关设备,以通过多个网关分别管理数据采集设备的采集点属性。对于不同的网关设备可能需要配置不同数据格式的配置文件,例如:YAML、XML、JSON、MAP等。其中,对于不同数据格式的配置文件,需要通过与该数据格式对应的平台才能够打开或者生成,且打开配置文件后,其中的语言也不便于用户理解,从而造成配置文件的生成过程复杂。
本申请提供的配置文件生成方法可以应用于上述智慧工厂,以分别将不同数据格式的配置文件转化为表格文件(例如:excel文件),从而便于用户打开该表格文件,并对其中的数据进行查看和编辑。另外,在编辑完成后,本申请提供的配置文件生成方法还可以将该表格文件转化为与原始的配置文件格式相同的更新配置文件,以便于使用该更新配置文件。
请参阅图1,是本申请提供的一种配置文件生成方法的流程图,如图1所示,该方法可以包括以下步骤:
步骤101、基于预设文件聚类模型对目标配置文件内的数据格式进行识别聚类处理,以得到所述目标配置文件的目标数据格式类别。
其中,上述目标配置文件可以是配置文件模板或者网关设备中已经存储的配置文件,为便于说明,以下实施例中,仅以目标配置文件是配置文件模板为例进行举例说明。
另外,上述目标配置文件内的数据格式,可以是:目标配置文件内部数据的编写语言,例如:某一配置文件的后缀为.txt,若其内部数据为YMAL语言编写的数据,则该配置文件的数据格式类别为YMAL;若其内部数据为JSON语言编写的数据,则该配置文件的数据格式类别为JSON。
在具体实施中,上述预设文件聚类模型可以根据目标配置文件内的特殊字符信息进行聚类处理。
例如:YAML配置文件中包括“-”(即破折号),而JSON配置文件中不包括“-”,据此,当识别到目标配置文件内包括“-”时,可以确定该目标配置文件的目标数据格式类别为YAML。
当然,在具体实施中,上述预设文件聚类模型能够区分的数据格式类别可以包括多种,且并不限定为仅根据目标配置文件内的特殊字符信息进行聚类处理,例如:上述预设文件聚类模型还可以根据特殊字符内的参数名称等参数信息进行聚类处理,在此不作具体限定。
在实际应用中,可以将一个或者多个配置文件输入至预设文件聚类模型中,以通过预设文件聚类模型分别对各个配置文件进行聚类处理,以得到每一个配置文件的数据格式类别。
例如:如图2所示,将配置文件模板输入至包括预设文件聚类模型的数据结构类型识别程序中,以使该数据结构类型识别程序输出该配置文件模板的数据格式类别。
本步骤中,上述预设文件聚类模型能够对不同数据格式的配置文件进行分类。以便于在步骤102中采用对应数据格式的解析算法获取配置文件中的参数内容和结构信息。
步骤102、基于所述目标数据格式类别确定所述目标配置文件的结构信息,并根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件,其中,所述表格文件内包括所述目标配置文件中的参数。
上述基于所述目标数据格式类别确定所述目标配置文件的结构信息,可以表述为:采用与目标数据格式类别对应的解析算法对目标配置文件进行解析,并对该目标配置文件中的参数点层级、每一层级参数点的数量,以及每个参数点的名称等进行统计,以得到上述结构信息。
本步骤中,可以根据该结构信息确定每一个参数的位置信息,且表格文件中每一个数据的位置可以通过行号、列号甚至页面编号等唯一确定,从而可以将目标配置文件中的每一个参数的位置与表格文件中与该参数对应的数据进行一一对应,以据此生成与所述目标配置文件关联的表格文件。
步骤103、获取用户作用于所述表格文件的编辑输入,更新所述表格文件。
本步骤中通过编辑输入以编辑表格文件中的数据的方式,与现有技术中编辑excel等表格的方式相同,在此不再赘述。
步骤104、根据目标信息,生成与所述目标配置文件对应的更新配置文件,其中,所述目标信息包括更新后的所述表格文件、所述目标数据格式类别以及所述结构信息。
上述根据目标信息,生成与所述目标配置文件对应的更新配置文件的过程,可以理解为上述步骤101至步骤102的逆过程,具体可以包括:根据步骤102中确定的目标配置文件中的每一个参数的位置与表格文件中该参数的数据之间的对应关系,将更新后的所述表格文件中的数据填入配置文件模板中的对应位置,以生成更新配置文件。
在实际应用中,在步骤104之后,还可以包括:
通过FastDFS文件系统程序,将所述更新配置文件上传文件到文件服务器。
这样,其他用户可以便捷的通过上述FastDFS文件系统程序从所述文件服务器下载所述更新配置文件,或者使所述更新配置文件能够通过所述FastDFS文件系统程序被第三方应用程序引用。
本发明提供的配置文件生成方法,包括:基于预设文件聚类模型对目标配置文件内的数据格式进行识别聚类处理,以得到所述目标配置文件的目标数据格式类别;基于所述目标数据格式类别确定所述目标配置文件的结构信息,并根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件,其中,所述表格文件内包括所述目标配置文件中的参数;获取用户作用于所述表格文件的编辑输入,更新所述表格文件;根据目标信息,生成与所述目标配置文件对应的更新配置文件,其中,所述目标信息包括更新后的所述表格文件、所述目标数据格式类别以及所述结构信息。这样,能够对不同数据结构的配置进行分类,从而按照对应的数据结构对该配置文件进行解析,以得到该配置文件的结构和参数,从而将该配置文件转化为表格文件,以便于用户通过表格文件对配置文件进行编辑或者查看等,并且可以将用户编辑后的表格文件按照原有配置文件的结构转化为更新配置文件,从而实现配置文件的更新,便于使用该更新配置文件对设备进行配置。因此,本发明提供的配置文件生成方法能够适用于多种数据结构的配置文件生成,且便于用户查看和编辑,其灵活性较好。
作为一种可选的实施方式,所述预设文件聚类模型通过以下过程训练得到:
分别获取至少两个配置文件样本,并分别获取每一个配置文件样本对应的实际数据格式类别;
分别统计每一个所述配置文件样本中包括的结构元素,并根据目标结构元素分别在每一个配置文件样本中的出现频率,确定所述目标结构元素分别在每一个配置文件样本中的权值,其中,所述配置文件样本的结构元素包括所述目标结构元素;
根据目标配置文件样本中的每一个结构元素的权值和所述目标配置文件样本的实际数据格式类别,生成训练样本,其中,所述至少两个配置文件样本包括所述目标配置文件样本;
将所述训练样本输入至预设机器学习模型,以训练得到所述预设文件聚类模型。
在训练所述预设文件聚类模型的过程中,需要预先收集不同类型的网关设备所使用的数据结构(即数据格式),例如:YAML、JSON,、TOML以及etc等,并将该多种数据结构存入数据库;然后,对于每种数据结构的配置文件可以尽可能的多收集,以为训练所述预设文件聚类模型提供数据支撑。
另外,随着智慧工厂中网关设备的更新或者新增,可能在智慧工厂内设置其他类型的网关设备,此时,可以在数据结构库中不断的引进新的配置文件的数据结构类型,以满足对不同网关设备或数据采集设备使用的不同协议数据的解析。
在实施中,上述分别统计每一个所述配置文件样本中包括的结构元素,可以理解为:对配置文件样本中的数据进行预处理,该预处理过程具体可以包括:
步骤一、梳理所述配置文件样本主要包括的数据结构元素;
该数据结构元素构成具体如下表1所示:
表1
Figure BDA0003013538810000071
Figure BDA0003013538810000081
上述表1用于统计各种格式的配置文件样本的结构元素组成,以据此构成预设文件聚类模型的词库,目的是计算各个结构元素在对应文件中的出现频率。
需要说明的是,上表1仅以预设文件聚类模型用于对YAML、JSON以及TOML这3类数据结构的配置文件进行区分,在实际应用中,预设文件聚类模型还可以用于对其他数据结构类型的配置文件进行区分,此时,仅需获取该其他数据结构类型的配置文件样本中的数据结构元素构成,以据此训练预设文件聚类模型即可。
步骤二、去停用词。
本步骤中,对步骤一中得到的数据结构元素中的注释结构元素进行去停用。
例如:YAML数据文件采用#作为注释;TOML数据文件采用#作为注释;JSON数据文件一般不允许包含注释。
另外,本步骤中,还将上述结构元素中出现的具体中英文数据进行去停用处理,以避免具体中英文数据对结构分析产生干扰。
进一步地,上述根据目标结构元素分别在每一个配置文件样本中的出现频率,确定所述目标结构元素分别在每一个配置文件样本中的权值,可以理解为:分别将以上各个结构元素的统计值(即该结构元素在其所述的配置文件样本中出现的次数)转化为权值。
进一步地,所述根据目标结构元素分别在每一个配置文件样本中的出现频率,确定所述目标结构元素分别在每一个配置文件样本的配置文件中的权值,包括:
统计得到目标结构元素分别在每一个配置文件样本中的出现次数;
采用词频-逆文本频率指数方法,将所述目标结构元素在每一配置文件样本种的出现次数分别转化为权值。
本实施方式中,采用词频(Term Frequency,TF))-逆文本频率指数(InverseDocument Frequency,IDF)方法将上述统计值转化为权值。
其中,上述TF-IDF方法是一种统计方法,用以评估某一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。该TF-IDF方法可以参照现有技术中的TF-IDF方法,在此不作具体阐述。
例如:如下表2所示,上述表1可以转化为如下表2所示的数据格式:
表2
Figure BDA0003013538810000091
上述表2中,第一行包括所有配置文件样本中包括的结构元素的集合。第二行及以下的每一行表示一个配置文件样本中包括的各个结构元素的权值。
在实施中可以将上表中除了第一行以外的其他行分别组成一个向量,且该向量中的元素值分别为各个结构元素的权值,这样,在训练过程中,可以将该向量输入至预设机器学习模型中,并以该向量对应行的配置文件样本的实际数据格式类型(即如表2中所示标签项)作为目标参数,进行训练。
也就是说,所述根据目标配置文件样本中的每一个结构元素的权值和所述目标配置文件样本的实际数据格式类别,生成训练样本,可以理解为:每一个训练样本包括一个向量和该向量对应行的配置文件样本的实际数据格式类型。
在具体实施中,上述预设机器学习模型可以是随机森林分类模型。
其中,采用上述随机森林分类模型训练所述预设文件聚类模型,具体可以包括以下步骤:
步骤一、将训练样本划分为训练数据和测试数据。
本步骤中,可以采用交叉验证(cross-validation)算法来降低过拟合(overfitting)。
步骤二、使用python程序语言,引入随机森林模型包(from sklearn ensembleimport Random Forest Classifier)。
步骤三、输入以上训练数据中的向量和实际数据格式类别,以将实际数据格式类别作为训练数据的目标参数y,且将向量中的每个元素作为训练参数x1,x2,x3,…,xn。
其中,n表示一个向量包括的元素的总数量。
步骤四、使用计算机视觉(Computer Version,CV)算法运行以上随机森林模型,并获取模型训练结果的准确度。
在上述模型训练结果的准确度低于预设准确度(例如:95%或99%等)的情况下,还可以采用以下优化方式中的至少一种,来对模型进行优化:
使用Lasso(用于调整参数的权重值)或Ridge(用于删除不重要的参数)降维的方法,来优化参数X(即x1,x2,x3,…,xn);
减少参数X的数量;
将至少两个参数进行合并,以构成新的参数X。
其中,上述减少参数X的数量,可以理解为:删除权重值较低或者用户认为不重要的参数,例如:YAML、JSON以及TOML者3类数据文件中都有“[]”这一结构元素,对于区分不同类型的数据文件没有特殊性,从而将该结构元素对应的参数删掉。
另外,上述将至少两个参数进行合并,以构成新的参数X,可以理解为:对训练参数进行优化,以将多个参数进行组合,例如:将x1,x2和x3合并为x’。并采用合并后的参数进行模型训练。
在对模型进行优化后,可以再次验证该模型的准确度,并在该模型的准确度大于或者等于预设准确度的情况下,结束训练,并输出最终的模型作为所述预设文件聚类模型;否则,可以再次对模型进行优化,直至该模型的准确度大于或者等于预设准确度。
例如:如图2所示,采用大量的YAML、XML、MAP以及TOML的模板文件训练得到预设文件聚类模型,然后,可以将待分类的目标配置文件输入至该预设文件聚类模型,以使预设文件聚类模型输出该目标配置文件的目标数据格式类别。
其中,本申请调用的随机森林算法的原理及数据处理过程,具体可以参照现有技术中的随机森林算法的原理及数据处理过程,在此不再赘述。
需要说明的是,在实际应用中,除了上述随机森林分类模型之外,预设机器学习模型还可以是其他分类算法模型,以通过训练后得到本申请所需的预设文件聚类模型,在此不作具体限定。
作为一种可选的实施方式,所述根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件,包括:
根据所述目标数据格式类别,对所述目标配置文件中每一层级的参数点进行解析,以获取所述目标配置文件中每一个参数点的参数名称、数量以及参数点之间的关联关系,其中,所述结构信息包括以下至少一项:所述目标配置文件中每一层级的参数点数量、参数名称以及各个参数点关联的下一级参数点数量和下一级参数名称;
按照所述参数点之间的关联关系,分别获取所述目标配置文件中的每一个参数名称和对应的参数点数量,以生成所述表格文件,并确定配置文件位置与表格文件位置之间的对应关系,其中,所述配置文件位置为目标参数在所述目标配置文件中的位置,所述表格文件位置为所述目标参数在所述表格文件中的位置,所述目标配置文件包括所述目标参数。
在具体实施中,上述根据所述目标数据格式类别,对所述目标配置文件中每一层级的参数点进行解析,以获取所述目标配置文件中每一个参数点的参数名称、数量以及参数点之间的关联关系,可以包括以下过程:
步骤一、对目标配置文件进行解析,并统计得到以下结构信息:
目标配置文件中每一层级的参数点数量和参数点名称,以及该参数点关联的下一级参数点数量和参数点名称(例如:第一层级包括三个主要参数点:参数一、参数二以及参数三;其中,参数一为数组,且包括3个参数:参数四、参数五以及参数六);
第一层级中的每个参数点所包括的所有层级数(例如:参数一下面总共包括5个层级)。
步骤二、采用与目标数据格式类别匹配的解析方式,以判断每一层级的主要结构元素。
例如:YAML类型的数据,其典型结构元素包括"[]"和"{}"。那么本步骤中会进行多个if语句判断,以确定每个结构元素中包括的参数点名称和参数取值等:
通过if语句判断下一层级的开头包括“-”,则判定下一层级的参数为数组,并统计“-”的数量,若包括多个“-”,则表示多个数组。
需要说明的是,在实际应用中,数据文件中还可以包括其他结构元素,在此不作一一阐述。
本实施方式中,存储每一个参数所对应的上一级参数(例如:参数一包括2个数组)。并续对其中的每个数组进行解析,以存储其包括的参数。例如:此数组包括:参数一,参数二,参数三。
通过if语句判断下一层级开头包括“{”,则判定下一层级为对象(object),然后存储统计结果到数据库。
在判定下一层级为对象的情况下,还需要对该对象进行解析,其解析过程与上述对数组的解析过程相同,在此不再赘述。
具体如图3所示,某一类型的数据文件中可以包括多个层级的参数点,每一层级的参数点可以具有参数名称(如图3中所示的key)和数量(如图3中所示的value),通过与该类型的数据文件匹配的数据结构解析程序,以解析得到该数据文件的结构信息,例如:数据文件的数据格式类型(例如:YAML、JSON或者TOML等)、数据文件包括的参数点层级数量、每一个参数点的参数名称和数量(如图3中所示的Unique Key)以及参数点与参数点之间的关联关系(如图3中所示的key与key的嵌套关系)等,以将该结构信息存储于数据库中,以便后续与表格文件关联。
另外,在确定目标配置文件的结构信息之后,鉴于目标配置文件中的每一个参数都具有参数名称以及其所属的层级和关联层级等信息,从而能够通过结构信息区分各个参数。
这样,可以通过以下过程,实现根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件:
步骤一、将目标配置文件与上述结构信息上传至同一数据库;
步骤二、根据结构信息中识别出的参数点名称及其参数点数量的顺序,将各个参数点的参数名称写入到表格文件的第一行,以作为表头;
步骤三、鉴于目标配置文件中每个分支的最后一层是对应参数点的数量,据此将参数点数量写到第二行中与表头中的参数名称相匹配的位置;
例如:如图4所示,将配置文件模板输入至转化程序,以将该配置文件模板转化为对应的excel表格文件。该excel表格文件的表头为各个参数点的参数名称。
步骤四、记录目标配置文件中的每个参数分别存储到表格文件中的坐标。
本步骤中,具体可以是记录目标配置文件中的每个参数与其填写到表格文件中时所处的行号、列号甚至页面编号之间的关联关系。
在实施中,可以通过将目标配置文件中的每个参数分别作为key,其在表格文件中的坐标作为value,以组成模板数据位置(key:value)JSON数据,并将该模板数据位置JSON数据存储到数据库,以供后续将表格文件转化为配置文件的过程中,确定表格文件中的每个参数在配置文件中的对应位置。
另外,在多个网关设备具有相同数据格式类型的情况下,还可以包括:
步骤五、在表格文件中添加下一行,并分别将每一行的索引(index)作为其网关设备编号;
本步骤中,可以在同一表格文件中查看或者编辑多个具有相同数据格式类型的配置文件中的数据,并在后续将表格文件转化为配置文件的过程中,可以生产与网关设备一一对应的多个配置文件。
另外,在多个网关设备具有不同数据格式类型的情况下,还可以包括:
步骤六、分部针对每一中数据格式类型的配置文件,执行上述步骤一至步骤五。
本步骤表示,针对不同数据格式类型的配置文件,可以生成不同的表格文件,例如:在生成3个YMAL配置文件和2个JSON配置文件的过程中,需要生成两个表格文件,其中一个表格文件用于记录上述3个YMAL配置文件的参数信息,且另一个表格文件用于记录上述2个JSON配置文件的参数信息。
在实施中,为了便于用户理解,上述根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件,还可以包括以下步骤:
步骤七、将目标配置文件的结构信息写入表格文件中的空白处。
本步骤中,上述结构信息可以理解为参数点的类型,例如:通过if语言判断下一层级的参数为数组的情况下,可以在表格文件中提示对应的参数点为数组,从而使用户便于理解该数组可以包括多个参数。例如:某一数组为温度,其包括两个参数:温度A和温度B。
在实施中,上述结构信息可以写入表格文件的第一行或者首页,以对表格文件中各个数据的含义、关联关系等进行说明,以使用户据此可以确定表格文件中每一个数据的含义。
作为一种可选的实施方式,所述根据目标信息,生成与所述目标配置文件对应的更新配置文件,包括:
根据所述配置文件位置与所述表格文件位置之间的对应关系,确定更新后的所述表格文件中的每一个参数分别在所述目标配置文件中的目标位置,并分别将所述表格文件中的每一个参数填入所述目标配置文件中的所述目标位置,以得到所述更新配置文件。
本实施方式中,上述配置文件位置与所述表格文件位置之间的对应关系,可以理解为上一实施方式中记录的:将目标配置文件中的每个数据分别作为key,其在表格文件中的坐标作为value,以组成模板数据位置(key:value)JSON数据。
在实施中,可以通过excel表格文件对配置文件的转化程序,将实现本实施方式中的根据更新后的表格文件生成更新配置文件,例如:如图5所示,将经过用户编辑的excel表格文件输入至excel表格文件对配置文件的转化程序中,以使该excel表格文件对配置文件的转化程序输出与目标配置文件具有相同数据格式的更新配置文件。
在实际应用中,上述将excel表格文件转化为更新配置文件的过程,为上一实施方式中,将目标配置文件转化为excel表格文件过程的逆过程,其可以根据将目标配置文件转化为excel表格文件过程中获取的所述配置文件位置与所述表格文件位置之间的对应关系,将excel表格文件中的参数填入更新配置文件中对应的位置,以还原更新配置文件的数据格式和结构。
为便于说明,下面以如图6所示的另一种配置文件生成方法为例,对本申请提供的配置文件生成方法的整体过程进行举例说明。如图6所示,该配置文件生成方法可以包括以下步骤:
步骤1.用户上传配置文件模板;
上述配置文件模板即为如图1所示流程图中的目标配置文件,其可以是网关设备现有的配置文件目标,在此不做赘述。
步骤2.通过数据结构类型识别程序读取配置文件模板,以获取其内部数据;
步骤3.数据结构类型识别程序判断出数据结构类型,并将该数据结构类型存储于数据库中;
步骤4.通过数据结构解析程序从数据库中获取配置文件模板的数据结构类型;
步骤5.通过数据结构解析程序根据配置文件模板的数据结构类型,分析配置文件模板的数据结构,以得到其结构信息,并将其存储于数据库;
步骤6.将配置文件模板输入配置文件模板转化excel程序;
步骤7.通过数据结构解析程序根据数据库中的数据结构类型和结构信息,生成与配置文件模板对应的excel文件;
步骤8.用户在excel文件中填写参数;
步骤9.将用户填写好的excel文件上传至excel转化配置文件模板程序;
步骤10.excel转化配置文件模板程序根据数据库中的数据结构类型和结构信息,生成与用户填写好的excel文件相对应的更新配置文件模板,并将其存储在对应的配置文件存储程序中。
由上可知,本发明提供的配置文件生成方法,第一方面,通过excel填写配置文件的方式,极大的降低了智慧工厂网关设备配置人员的专业要求,提高了效率,降低了生成配置文件的复杂性;第二方面,采用数据结构类型识别程序,能够识别出配置文件内部的数据格式,从而极大的增加了配置文件的格式可变化性,以及其内容数据结构的灵活性;第三方面,通过配置文件模板对excel的转化程序,能够极大的提高了配置文件模板的内容的伸缩性,且可在其数据结构的基础上继续增加,也可以继续缩短,从而使得配置文件模板的内部格式可以具有多变性;第四方面,通过数据结构解析程序,对配置模板的结构进行分析,并统计主要参数点、层级、参数数据类型等结构信息,从而据此对生成的excel文件的表头属性之间的关系进行解读,使用户在编辑excel数据的时候,能很快的知晓此数据的意义,从而便于用户编辑和查看。
请参阅图7,是本发明提供的一种配置文件生成装置的结构图,如图7所示,该配置文件生成装置700可以包括:
分类模块701,用于基于预设文件聚类模型对目标配置文件内的数据格式进行识别聚类处理,以得到所述目标配置文件的目标数据格式类别;
第一生成模块702,用于基于所述目标数据格式类别确定所述目标配置文件的结构信息,并根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件,其中,所述表格文件内包括所述目标配置文件中的参数;
更新模块703,用于获取用户作用于所述表格文件的编辑输入,更新所述表格文件;
第二生成模块704,用于根据目标信息,生成与所述目标配置文件对应的更新配置文件,其中,所述目标信息包括更新后的所述表格文件、所述目标数据格式类别以及所述结构信息。
可选的,所述预设文件聚类模型通过以下过程训练得到:
分别获取至少两个配置文件样本,并分别获取每一个配置文件样本对应的实际数据格式类别;
分别统计每一个所述配置文件样本中包括的结构元素,并根据目标结构元素分别在每一个配置文件样本中的出现频率,确定所述目标结构元素分别在每一个配置文件样本中的权值,其中,所述配置文件样本的结构元素包括所述目标结构元素;
根据目标配置文件样本中的每一个结构元素的权值和所述目标配置文件样本的实际数据格式类别,生成训练样本,其中,所述至少两个配置文件样本包括所述目标配置文件样本;
将所述训练样本输入至预设机器学习模型,以训练得到所述预设文件聚类模型。
可选的,所述预设机器学习模型为随机森林分类模型。
可选的,配置文件生成装置700执行的所述根据目标结构元素分别在每一个配置文件样本中的出现频率,确定所述目标结构元素分别在每一个配置文件样本的配置文件中的权值,包括:
统计得到目标结构元素分别在每一个配置文件样本中的出现次数;
采用词频-逆文本频率指数方法,将所述目标结构元素在每一配置文件样本种的出现次数分别转化为权值。
可选的,第一生成模块702,包括:
获取单元,用于根据所述目标数据格式类别,对所述目标配置文件中每一层级的参数点进行解析,以获取所述目标配置文件中每一个参数点的参数名称、数量以及参数点之间的关联关系,其中,所述结构信息包括以下至少一项:所述目标配置文件中每一层级的参数点数量、参数名称以及各个参数点关联的下一级参数点数量和下一级参数名称;
确定单元,用于按照所述参数点之间的关联关系,分别获取所述目标配置文件中的每一个参数名称和对应的参数点数量,以生成所述表格文件,并确定配置文件位置与表格文件位置之间的对应关系,其中,所述配置文件位置为目标参数在所述目标配置文件中的位置,所述表格文件位置为所述目标参数在所述表格文件中的位置,所述目标配置文件包括所述目标参数。
可选的,第二生成模块704,具体用于:
根据所述配置文件位置与所述表格文件位置之间的对应关系,确定更新后的所述表格文件中的每一个参数分别在所述目标配置文件中的目标位置,并分别将所述表格文件中的每一个参数填入所述目标配置文件中的所述目标位置,以得到所述更新配置文件。
本发明提供的配置文件生成装置700能够执行如图1或图6所示配置文件生成方法中的各个过程,且能够取得相同的有益效果,为避免重复,在此不再赘述。
请参阅图8,是本发明实施例提供的一种配置文件生成装置的结构图,如图8所示,该配置文件生成装置800包括:处理器801、存储器802及存储在所述存储器802上并可在所述处理器上运行的计算机程序8021,所述计算机程序8021被所述处理器801执行时实现如图1或图6所示配置文件生成方法中的步骤。
本申请实施例提供的配置文件生成装置能够执行如1或图6所示的配置文件生成方法中的各个步骤,且能够取得相同的有益效果,为避免重复,在此不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述1或图6所示的配置文件生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述的计算机可读存储介质,如ROM、RAM、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (9)

1.一种配置文件生成方法,其特征在于,所述方法包括:
基于预设文件聚类模型对目标配置文件内的数据格式进行识别聚类处理,以得到所述目标配置文件的目标数据格式类别;
基于所述目标数据格式类别确定所述目标配置文件的结构信息,并根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件,其中,所述表格文件内包括所述目标配置文件中的参数;
获取用户作用于所述表格文件的编辑输入,更新所述表格文件;
根据目标信息,生成与所述目标配置文件对应的更新配置文件,其中,所述目标信息包括更新后的所述表格文件、所述目标数据格式类别以及所述结构信息。
2.根据权利要求1所述的方法,其特征在于,所述预设文件聚类模型通过以下过程训练得到:
分别获取至少两个配置文件样本,并分别获取每一个配置文件样本对应的实际数据格式类别;
分别统计每一个所述配置文件样本中包括的结构元素,并根据目标结构元素分别在每一个配置文件样本中的出现频率,确定所述目标结构元素分别在每一个配置文件样本中的权值,其中,所述配置文件样本的结构元素包括所述目标结构元素;
根据目标配置文件样本中的每一个结构元素的权值和所述目标配置文件样本的实际数据格式类别,生成训练样本,其中,所述至少两个配置文件样本包括所述目标配置文件样本;
将所述训练样本输入至预设机器学习模型,以训练得到所述预设文件聚类模型。
3.根据权利要求2所述的方法,其特征在于,所述预设机器学习模型为随机森林分类模型。
4.根据权利要求2所述的方法,其特征在于,所述根据目标结构元素分别在每一个配置文件样本中的出现频率,确定所述目标结构元素分别在每一个配置文件样本的配置文件中的权值,包括:
统计得到目标结构元素分别在每一个配置文件样本中的出现次数;
采用词频-逆文本频率指数方法,将所述目标结构元素在每一配置文件样本种的出现次数分别转化为权值。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件,包括:
根据所述目标数据格式类别,对所述目标配置文件中每一层级的参数点进行解析,以获取所述目标配置文件中每一个参数点的参数名称、数量以及参数点之间的关联关系,其中,所述结构信息包括以下至少一项:所述目标配置文件中每一层级的参数点数量、参数名称以及各个参数点关联的下一级参数点数量和下一级参数名称;
按照所述参数点之间的关联关系,分别获取所述目标配置文件中的每一个参数名称和对应的参数点数量,以生成所述表格文件,并确定配置文件位置与表格文件位置之间的对应关系,其中,所述配置文件位置为目标参数在所述目标配置文件中的位置,所述表格文件位置为所述目标参数在所述表格文件中的位置,所述目标配置文件包括所述目标参数。
6.根据权利要求5所述的方法,其特征在于,所述根据目标信息,生成与所述目标配置文件对应的更新配置文件,包括:
根据所述配置文件位置与所述表格文件位置之间的对应关系,确定更新后的所述表格文件中的每一个参数分别在所述目标配置文件中的目标位置,并分别将所述表格文件中的每一个参数填入所述目标配置文件中的所述目标位置,以得到所述更新配置文件。
7.一种配置文件生成装置,其特征在于,包括:
分类模块,用于基于预设文件聚类模型对目标配置文件内的数据格式进行识别聚类处理,以得到所述目标配置文件的目标数据格式类别;
第一生成模块,用于基于所述目标数据格式类别确定所述目标配置文件的结构信息,并根据所述目标数据格式类别和所述结构信息,生成与所述目标配置文件关联的表格文件,其中,所述表格文件内包括所述目标配置文件中的参数;
更新模块,用于获取用户作用于所述表格文件的编辑输入,更新所述表格文件;
第二生成模块,用于根据目标信息,生成与所述目标配置文件对应的更新配置文件,其中,所述目标信息包括更新后的所述表格文件、所述目标数据格式类别以及所述结构信息。
8.一种配置文件生成装置,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1至6中任一项所述的配置文件生成方法中的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1至6中任一项所述的配置文件生成方法中的步骤。
CN202110382452.0A 2021-04-09 2021-04-09 一种配置文件生成方法、装置和计算机可读存储介质 Pending CN115204128A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110382452.0A CN115204128A (zh) 2021-04-09 2021-04-09 一种配置文件生成方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110382452.0A CN115204128A (zh) 2021-04-09 2021-04-09 一种配置文件生成方法、装置和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN115204128A true CN115204128A (zh) 2022-10-18

Family

ID=83571663

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110382452.0A Pending CN115204128A (zh) 2021-04-09 2021-04-09 一种配置文件生成方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN115204128A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116521198A (zh) * 2023-04-13 2023-08-01 广州汽车集团股份有限公司 数据处理方法、装置、设备及计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116521198A (zh) * 2023-04-13 2023-08-01 广州汽车集团股份有限公司 数据处理方法、装置、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN107766371B (zh) 一种文本信息分类方法及其装置
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
CN111783394B (zh) 事件抽取模型的训练方法、事件抽取方法和系统及设备
WO2018218708A1 (zh) 一种基于深度学习的舆情热点类别划分方法
CN111259873B (zh) 一种表格数据提取方法及装置
CN111967761A (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
CN111597356A (zh) 智能化教育知识图谱构建系统与方法
CN111951079B (zh) 一种基于知识图谱的信用评级方法、装置及电子设备
CN111191429A (zh) 数据表格自动填充的系统和方法
CN111241410A (zh) 一种行业新闻推荐方法及终端
CN113094512A (zh) 一种工业生产制造中故障分析系统及方法
CN111460114A (zh) 检索方法、装置、设备及计算机可读存储介质
CN115204128A (zh) 一种配置文件生成方法、装置和计算机可读存储介质
CN117421226A (zh) 一种基于生成式大语言模型的缺陷报告重构的方法及系统
CN117592470A (zh) 大语言模型驱动的低成本公报数据抽取方法
CN116842919A (zh) 一种基于基层治理的本地表格文件智能化解析方法
Khekare et al. Design of Automatic Key Finder for Search Engine Optimization in Internet of Everything
CN115827885A (zh) 一种运维知识图谱的构建方法、装置及电子设备
CN116226371A (zh) 一种数字经济专利分类方法
CN115936003A (zh) 基于神经网络的软件功能点查重方法、装置、设备及介质
CN111258953B (zh) 一种财务数据转换成评估数据规范化的方法
CN114936279A (zh) 一种面向协同制造企业的非结构化图表数据分析方法
CN115617790A (zh) 数据仓库创建方法、电子设备及存储介质
CN110909545A (zh) 一种基于梯度提升算法的黑导游检测方法
CN110413899A (zh) 服务器存储新闻的存储资源优化方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination