CN115390853B - 多源工艺文件结构化解析方法、系统、终端及存储介质 - Google Patents
多源工艺文件结构化解析方法、系统、终端及存储介质 Download PDFInfo
- Publication number
- CN115390853B CN115390853B CN202211116718.8A CN202211116718A CN115390853B CN 115390853 B CN115390853 B CN 115390853B CN 202211116718 A CN202211116718 A CN 202211116718A CN 115390853 B CN115390853 B CN 115390853B
- Authority
- CN
- China
- Prior art keywords
- cell
- header
- name
- template
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/40—Transformation of program code
- G06F8/41—Compilation
- G06F8/42—Syntactic analysis
- G06F8/427—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/71—Version control; Configuration management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种多源工艺文件结构化解析方法、系统、终端及存储介质,其属于计算机数据库领域,包括获取列名信息表;根据所述列名信息表和预设的生成模型得到初始模板;接收反馈信息;根据所述反馈信息和所述初始模板得到目标模板。本申请具有降低工艺文件变更维护难度和维护成本的效果。
Description
技术领域
本申请涉及计算机数据库领域,尤其是涉及多源工艺文件结构化解析方法、系统、终端及存储介质。
背景技术
目前,大部分工厂车间还处于采用传统电子版文件对工艺文件进行管理的阶段,在该阶段中,针对于工艺文件的编制、会签、定版、发放等一系列执行周期会较长,当企业从传统管理模式向信息化管理模式转型时,需要耗费大量人力将传统管理模式中的工艺文件录入信息化系统中,且由于工艺文件数据量大,还可能会出现工艺文件数据错录漏录等情况。同时,因不同的客户生产的产品不同,所得到的工艺文件结构及内容也不尽相同。
现有技术中,软件供应商需要根据客户的工艺文件结构及内容进行分析,设计符合当前客户的工艺文件结构模型,用于存储工艺文件内容。然而,由于不同的客户具有不同的工艺文件结构及内容,所以需要针对每一个客户建立一套独立的工艺文件结构模型。同时,针对于已经建立的工艺文件结构模型,当客户对生产加工进行精细化调整时,则需要对已经设计完成的工艺文件模型进行较大规模的结构变更,那么对已经设计完成甚至开发完成的工艺文件模型的管理功能将带来巨大冲击,导致工艺文件模型的稳定性得不到保障。为此,搭建一套灵活扩展兼容性高、鲁棒性强的多源工艺文件结构化解析系统是迫切和必要的。
发明内容
为了克服现有技术中的缺陷,本申请提供一种多源工艺文件结构化解析方法、系统、终端及存储介质,以解决现有技术中存在的工艺文件的变更维护需要大量人力和物力,以及后期不便于管控的问题。
本申请目的一是提供一种多源工艺文件结构化解析方法、系统、终端及存储介质。
本申请的上述申请目的一是通过以下技术方案得以实现的:
一种多源工艺文件结构化解析方法,包括:
获取列名信息表;
根据所述列名信息表和预设的生成模型得到初始模板;
接收反馈信息;
根据所述反馈信息和所述初始模板得到目标模板。
通过采用上述技术方案,基于开发搭建的系统,在输入列名信息表后,能够自动化解析列名信息表的表格结构以得到目标模板,从而便于后续输入电子版工艺文件时,系统能够将电子版工艺文件的数据项搬移至目标模板中,以得到系统可识别的工艺文件。因此,本申请的系统能够满足客户大规模变更工艺文件的文件结构,且系统的设计和代码不会随着工艺文件的文件结构的变更而变更,从而减少了云平台的后期开发和维护成本。
本申请在一较佳示例中可以进一步配置为:所述列名信息表包括表头名称和所述表头名称所对应的单元格;
所述根据列名信息表和预设的生成模型得到初始模板包括:
提取所述表头名称的坐标点;
根据所述坐标点确定所述表头名称所对应的单元格;
判断每一个单元格是否跨行或者跨列得到基础模板;
判断所述基础模板中的每一个单元格是否存在嵌套表格得到初始模板。
通过采用上述技术方案,自动化解析列名信息表的表格结构后,本申请的系统得到对应的初始模板,以便于后续在初始模板的基础上进行微调。
本申请在一较佳示例中可以进一步配置为:所述根据所述坐标点确定所述表头名称所对应的单元格包括:
判断所述表头名称是否为多个;
若是,则根据多个表头名称的排列方式得到每一个表头名称所对应的单元格;
若否,则列名信息表中的单元格均与表头名称对应。
通过采用上述技术方案,分别分析表头名称与单元格的对应关系,从而使得初始模板的文件结构更加贴合电子版工艺文件的文件结构,进而保障了自动化解析列名信息表后得到的初始模板的准确度。
本申请在一较佳示例中可以进一步配置为:所述根据多个表头名称的排列方式得到每一个表头名称所对应的单元格包括:
当多个表头名称分布在列名信息表的最高一行时,每一个表头名称所对应的单元格为与表头名称位于同一列的所有单元格;
当多个表头名称分布在列名信息表的最左一列时,每一个表头名称所对应的单元格为与表头名称位于同一行的所有单元格。
本申请在一较佳示例中可以进一步配置为:所述判断每一个单元格是否跨行或者跨列得到基础模板包括:
提取每一个单元格的线条;
判断提取到的单元格的线条组成的面积与预设的单元面积是否存在两倍或两倍以上的倍数关系;
若是,则根据倍数关系确定跨行个数或者跨列个数,并根据单元格的线条的朝向确定单元格为跨行或者跨列;
将确定单元格朝向和确定跨行个数或者跨列个数的表格结构标记为基础模板。
通过采用上述技术方案,判断每一个单元格是否跨行或者跨列能够保障表头名称所对应的单元格的数量的准确度,进一步保障了自动化解析列名信息表后得到的初始模板的准确度。
本申请在一较佳示例中可以进一步配置为:得到初始模板后,所述方法还包括:
提取所述初始模板的待确认信息,所述待确认信息包括读取数据的顺序和嵌套表格的节点;
根据所述待确认信息得到调整界面。
通过采用上述技术方案,得到调整界面是为了便于客户微调初始模板,从而使初始模板的准确度更高。
本申请目的二是提供一种多源工艺文件结构化解析系统。
本申请的上述申请目的二是通过以下技术方案得以实现的:
一种多源工艺文件结构化解析系统,包括:
数据获取模块,用于获取列名信息表;
数据处理模块,用于根据所述列名信息表和预设的生成模型得到初始模板;
数据接收模块,用于接收反馈信息;
数据确定模块,用于根据所述反馈信息和所述初始模板得到目标模板。
本申请目的三是提供一种智能终端。
本申请的上述申请目的三是通过以下技术方案得以实现的:
一种智能终端,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行的上述多源工艺文件结构化解析方法的计算机程序指令。
本申请目的四是提供一种计算机介质,能够存储相应的程序。
本申请的上述申请目的四是通过以下技术方案得以实现的:
一种计算机可读存储介质,存储有能够被处理器加载并执行上述任一项多源工艺文件结构化解析方法的计算机程序。
综上所述,本申请包括以下至少一种有益技术效果:
1.基于开发搭建的系统,在输入列名信息表后,能够自动化解析列名信息表的表格结构以得到目标模板,从而便于后续输入电子版工艺文件时,系统能够将电子版工艺文件的数据项搬移至目标模板中,以得到系统可识别的工艺文件。因此,本申请的系统能够满足客户大规模变更工艺文件的文件结构,且系统的设计和代码不会随着工艺文件的文件结构的变更而变更,从而减少了云平台的后期开发和维护成本;
2.本申请还分别分析了表头名称与单元格的对应关系,从而使得初始模板的文件结构更加贴合电子版工艺文件的文件结构,进而保障了自动化解析列名信息表后得到的初始模板的准确度,以减少客户在初始模板上进行微调的工作量。
附图说明
图1为本申请实施例的示例性运行环境示意图。
图2为本申请实施例的多源工艺文件结构化解析方法流程图。
图3为本申请方法实施例中当多个表头名称分布在列名信息表的最高一行时的示例图。
图4为本申请方法实施例中当多个表头名称分布在列名信息表的最左一列时的示例图。
图5为本申请方法实施例中数据信息表与列名信息表的关系展示图。
图6为本申请方法实施例中调整界面的展示图。
附图标记说明:1、客户端;2、云平台;21、数据获取模块;22、数据处理模块;23、数据接收模块;24、数据确定模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的全部其他实施例,都属于本申请保护的范围。
下面结合说明书附图对本申请实施例做进一步详细描述。
图1示出了能够在其中实现本申请实施例的示例性运行环境示意图。参照图1,该运行环境包括客户端1和云平台2。其中,云平台2可以通过无线网络与多个客户端1通信连接,无线网络可以是基于4G网络或5G网络等通信的广域性物联网系统,也可以是局域性的物联网。
客户端1可以为手机、电脑、平板等电子设备。客户端1用于供客户输入工艺文件,当不同的客户通过客户端1输入不相同的工艺文件时,云平台2将获取到文件结构不相同的多种工艺文件。
为了便于制造企业顺利从传统管理模式转型至信息化管理模式,使工厂车间电子版工艺文件快速转换为系统可识别的工艺文件,云平台2采用JAVA语言、ORACLE数据库、TOMCAT中间服务器开发和搭建了一套灵活扩展兼容性高、鲁棒性强的多源工艺文件结构化解析系统。
具体地,多源工艺文件结构化解析系统包括数据获取模块21、数据处理模块22、数据接收模块23以及数据确定模块24。数据获取模块21、数据处理模块22、数据接收模块23以及数据确定模块24共同配合,用于自动化解析客户上传的电子版工艺文件,并转化为系统可识别的工艺文件,便于客户管控工艺文件。同时,多源工艺文件结构化解析系统可根据电子版工艺文件的文件结构的变化而灵活改变,使得即使输入的电子版工艺文件的文件结构变化也不会影响程序运行,减少云平台2的后期开发和维护成本。
本申请还提供一种多源工艺文件结构化解析方法,所述方法的主要流程描述如下。
如图2所示:
步骤S1:获取列名信息表。
列名信息表包括表头名称和表头名称所对应的单元格。其中,一个表头名称代表一种工艺类型,而该表头名称所对应的单元格为该种工艺类型下所包含的数据项。如表头名称有工艺规程表、工序表、工步表、材料表、工装表、刀具表、NC程序表,而工艺规程表所对应的单元格有12个,若每一个单元格代表一个月,则12个单元格组成一年的工艺规程。
需要说明的是,一种工艺类型可以有多个表头名称,即允许不同的客户对同一个种工艺类型设置不同的表头名称。同时,客户还可以选择在后续展示时显示表头名称或者隐藏表头名称。
客户在客户端1设置表头名称、关联表头名称所对应的单元格以及设置表头名称的展示方式后,点击“确认”虚拟按钮上传列名信息表至云平台2中,即云平台2获取到列名信息表。
步骤S2:根据列名信息表和预设的生成模型得到初始模板。
云平台2获取到列名信息表后,首先根据列名信息表得到初始模板,再根据初始模板得到调整界面。
其中,根据列名信息表得到初始模板的流程如步骤S21所示:
步骤S211:获取表头名称的坐标点,通过坐标点确定表头名称的排列方式,再通过排列方式确定表头名称所对应的单元格。
具体地,在云平台2获取到列名信息表后,将自动提取列名信息表的表头名称。在提取列名信息表的过程中,如果表头名称为一个,则列名信息表中的单元格均与表头名称相关。而若表头名称有多个,则需要获取每一个表头名称的坐标,并判断多个表头名称的排列方式,当:
多个表头名称分布在列名信息表的最高一行时,与表头名称位于同一列的所有单元格均与该表头名称对应。如图3所示,表头名称有工艺规程表、工序表、工步表、材料表、工装表,且工艺规程表、工序表、工步表、材料表、工装表分布在列名信息表的最高一行,则单元格x11和单元格x12均与工艺规程表对应、单元格x21和单元格x22均与工序表对应、单元格x31和单元格x32均与工步表对应、单元格x41和单元格x42均与材料表对应、单元格x51和单元格x52均与工装表对应;
多个表头名称分布在列名信息表的最左一列时,与表头名称位于同一行的所有单元格均与表头名称对应。如图4所示,表头名称有工艺规程表、工序表、工步表、材料表、工装表,且工艺规程表、工序表、工步表、材料表、工装表分布在列名信息表的最左一侧,则单元格y11和单元格y21均与工艺规程表对应、单元格y12和单元格y22均与工序表对应、单元格y13和单元格y23均与工步表对应、单元格y14和单元格y24均与材料表对应、单元格y15和单元格y25均与工装表对应。
步骤S212:判断每一个单元格是否跨行或者跨列得到基础模板,再在基础模板上判断每一个单元格是否存在嵌套表格得到初始模板。
在确定每一个表头名称所对应的单元格后,还需要判断每一个单元格是否跨行或者跨列,这是因为按照常规来说,一个5×5的表格,应该有25个单元格,但若是其中一个单元格存在跨行或者跨列的情况时,单元格的数量就会随之减少。因此,需要判断每一个单元格是否存在跨行或者跨列的情况。
具体地,云平台2判断每一个单元格是否跨行或者跨列的方式是:当表头名称为一个时,云平台2从表格的左上向右下依次提取单元格的线条;当表头名称为多个且多个表头名称分布在列名信息表的最高一行时,云平台2首先按照由上至下的顺序提取位于最左一列的单元格的线条,再按照提取最左一列单元格的线条的提取方式由左至右依次提取每一列单元格的线条;当表头名称为多个且多个表头名称分布在列名信息表的最左一列时,云平台2首先按照由左至右的顺序提取位于最高一行的单元格的线条,再按照提取最高一行单元格的线条的提取方式由上至下依次提取每一行单元格的线条。
在云平台2提取单元格的线条的过程中,当提取到的单元格的线条组成的面积与预设的单元面积存在两倍或两倍以上的倍数关系时,则认为该单元格存在跨行或者跨列的情况,单元格具体跨几行或者几列由倍数关系确定,而具体判断为跨行或者跨列可以根据线条的朝向来确定。在本实施例中,当线条的朝向与列名信息表的行的方向一致时,则判断结果为单元格跨行;而如果线条的朝向与列名信息表的列的方向一致,则判断结果为单元格跨列。例如,当提取到的单元格的线条组成的面积是预设的单元面积的3倍且属于跨行时,该单元格总的跨3行。
上述预设的单元面积是云平台2在接收到列名信息表时,自动定位并提取列名信息表中面积最小的一个单元格的线条组成的面积。所以,不同的列名信息表可能具有不同的单元面积。
在完成判断每一个单元格是否存在跨行或者跨列的情况后,将得到的表格结构标记为基础模板。为了进一步完善表格结构,再在基础模板上判断每一个单元格是否存在嵌套表格,最后将完成判断单元格是否存在嵌套表格的基础模板标记为初始模板。在本实施例中,当单元格中存在嵌套表格时,该单元格内显示一个链接,当点击该单元格中的链接时,能够跳转到嵌套的表格所在的界面。
需要说明的是,为嵌套的表格搭建表格结构与上述由列名信息表生成初始模板的原理相同,所以在此不再赘述。
得到初始模板后,再根据初始模板得到调整界面的流程如步骤S22所示:
步骤S221:提取初始模板的待确认信息。
待确认信息包括读取数据的顺序和嵌套表格的节点。
其中,读取数据的顺序是指在客户端1输入数据信息表时,云平台2按照怎样的顺序读取数据信息表中的数据项,从而将数据信息表中的数据项搬移至初始模板中。
上述数据信息表的表格结构与列名信息表的表格结构一致,不同的是列名信息表仅包含表格结构的框架,而数据信息表包含的是具体内容。如图5所示,列名信息表仅包含一个表头名称,表头名称为工序表,工序表对应单元格z11、单元格z21、单元格z31,而单元格z11内的数据项是上电,单元格z21内的数据项是测试,单元格z31内的数据项是启动,则工序表以及工序表下的上电、测试、启动共同组成数据信息表,在图5中,用双箭头表示数据信息表和列名信息表的对应关系。
需要说明的是,当列名信息表中仅包含一个表头名称,而表头名称也仅对应一个单元格时,无需确认读取数据的顺序,即默认将数据信息表中的单一数据项直接搬移至单一的单元格中。然而,在实际应用中,列名信息表不仅包含有多个表头名称,同时,每一个表头名称还会对应多个单元格。所以,需要客户确定读取数据信息表中的数据项的顺序。
嵌套表格的节点是指嵌套表格所在的位置,通过嵌套表格的位置能够核查嵌套表格与单元格的对应关系是否正确。例如,嵌套表格本应该位于表头名称为工序表所对应的单元格中,但是却位于表头名称为工步表所对应的单元格中,此时认为嵌套表格与单元格的对应关系有误。
步骤S222:根据待确认信息得到调整界面。
首先,云平台2会根据表头名称和每一个表头名称所对应的单元格确定读取数据的顺序总数,然后在初始模板中采用圆圈表示嵌套表格的节点,点击该节点能够显示嵌套表格所在的单元格以及该单元格所属的表头名称,将既能够显示读取数据的顺序又能够显示嵌套表格的节点的初始模板标记为调整界面。
在本实施例中,调整界面上还设置有“切换”、“确定”、“调整”以及“上传”虚拟按钮。云平台2生成调整界面后,将调整界面传输至客户端1。客户通过客户端1查看调整界面时,若客户点击“切换”虚拟按钮,则在调整界面上采用箭头的走向表示读取数据的顺序,点击一次“切换”虚拟按钮,则切换一种读取顺序。当客户选择到满意的读取数据的顺序时,通过点击“确定”虚拟按钮确定该种顺序为读取数据的顺序,具体参阅图6所示。客户还通过客户端1核查嵌套表格的节点,当嵌套表格与单元格的对应关系有误时,客户可通过点击“调整”虚拟按钮,然后拖拽嵌套表格的节点至正确的单元格中,在图6中,嵌套表格的节点用圆圈表示,当点击圆圈时,能够显示嵌套表格所在的单元格以及该单元格所属的表头名称,展示方式是[工装表,2],说明嵌套表格的节点在工装表的第二个单元格内。最后,在客户选择读取数据的顺序和核查嵌套表格的节点后,通过点击“上传”虚拟按钮将操作结果上传至云平台2,即向云平台2返回一个反馈信息。
步骤S3:接收反馈信息。
由步骤S22可知,反馈信息是客户通过客户端1对调整界面执行一系列操作后得到的操作结果,所以,在此不再对反馈信息进行赘述。
步骤S4:根据反馈信息和初始模板得到目标模板。
得到反馈信息后,识别反馈信息中的读取数据的顺序,保存该种读取数据的顺序。同时,还提取反馈信息中的嵌套表格的节点,并判断反馈信息中的嵌套表格的节点是否与初始模板的嵌套表格的节点一致。当不一致时,依据反馈信息中的嵌套表格的节点调整初始模板的嵌套表格的节点,使反馈信息中的嵌套表格的节点与初始模板的嵌套表格的节点保持一致。最后,将确认了读取数据的顺序和嵌套表格的节点后的初始模板标记为目标模板,并将目标模板进行封装、存储在云平台2中。
当客户需要将电子版工艺文件转换为系统可识别的工艺文件时,首先需要通过客户端1向云平台2发送请求指令。在云平台2接收到请求指令后,会将目标模板发送至客户端1,便于客户输入数据信息表,然后目标模板根据读取数据的顺序依次将数据信息表中的数据项搬移至目标模板中,并根据嵌套表格的节点输入待嵌套的表格,从而实现将电子版的工艺文件转换为系统可识别的工艺文件。
而当客户需要维护工艺文件时,客户通过客户端1发送更改的列名信息表,云平台2会自动依据更改的列名信息表调整目标模板,从而使云平台2能够满足客户大规模变更工艺文件的文件结构,且云平台2的设计和代码不会随着工艺文件的文件结构的变更而变更,从而减少了云平台2的后期开发和维护成本。
为了更好地执行上述方法的程序,本申请还提供一种智能终端,智能终端包括存储器和处理器。
其中,存储器可用于存储指令、程序、代码、代码集或指令集。存储器可以包括存储程序区和存储数据区,其中存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令以及用于实现上述多源工艺文件结构化解析方法的指令等;存储数据区可存储上述多源工艺文件结构化解析方法中涉及到的数据等。
处理器可以包括一个或者多个处理核心。处理器通过运行或执行存储在存储器内的指令、程序、代码集或指令集,调用存储在存储器内的数据,执行本申请的各种功能和处理数据。处理器可以为特定用途集成电路、数字信号处理器、数字信号处理装置、可编程逻辑装置、现场可编程门阵列、中央处理器、控制器、微控制器和微处理器中的至少一种。可以理解地,对于不同的设备,用于实现上述处理器功能的电子器件还可以为其它,本申请实施例不作具体限定。
本申请还提供一种计算机可读存储介质,例如包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。该计算机可读存储介质存储有能够被处理器加载并执行上述多源工艺文件结构化解析方法的计算机程序。
以上描述仅为本申请得较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离前述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其他技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (7)
1.一种多源工艺文件结构化解析方法,其特征在于,包括:
获取列名信息表,所示列名信息表包括表头名称和所述表头名称所对应的单元格;
提取所述表头名称的坐标点;
根据所述坐标点确定所述表头名称所对应的单元格;
判断每一个单元格是否跨行或者跨列得到基础模板;
判断所述基础模板中的每一个单元格是否存在嵌套表格得到初始模板;
提取所述初始模板的待确认信息,所述待确认信息包括读取数据的顺序和嵌套表格的节点;
根据所述待确认信息得到调整界面并输出;
接收客户端(1)在接收到调整界面后返回的反馈信息;
识别反馈信息中的读取数据的顺序,提取反馈信息中的嵌套表格的节点,使反馈信息中的嵌套表格的节点与初始模板的嵌套表格的节点保持一致,将确认读取数据的顺序和嵌套表格的节点后的初始模板标记为目标模板。
2.根据权利要求1所述的多源工艺文件结构化解析方法,其特征在于,所述根据所述坐标点确定所述表头名称所对应的单元格包括:
判断所述表头名称是否为多个;
若是,则根据多个表头名称的排列方式得到每一个表头名称所对应的单元格;
若否,则列名信息表中的单元格均与表头名称对应。
3.根据权利要求2所述的多源工艺文件结构化解析方法,其特征在于,所述根据多个表头名称的排列方式得到每一个表头名称所对应的单元格包括:
当多个表头名称分布在列名信息表的最高一行时,每一个表头名称所对应的单元格为与表头名称位于同一列的所有单元格;
当多个表头名称分布在列名信息表的最左一列时,每一个表头名称所对应的单元格为与表头名称位于同一行的所有单元格。
4.根据权利要求1所述的多源工艺文件结构化解析方法,其特征在于,所述判断每一个单元格是否跨行或者跨列得到基础模板包括:
提取每一个单元格的线条;
判断提取到的单元格的线条组成的面积与预设的单元面积是否存在两倍或两倍以上的倍数关系;
若是,则根据倍数关系确定跨行个数或者跨列个数,并根据单元格的线条的朝向确定单元格为跨行或者跨列;
将确定单元格朝向和确定跨行个数或者跨列个数的表格结构标记为基础模板。
5.一种多源工艺文件结构化解析系统,其特征在于,包括:
数据获取模块(21),用于获取列名信息表,所示列名信息表包括表头名称和所述表头名称所对应的单元格;
数据处理模块(22),用于提取所述表头名称的坐标点;根据所述坐标点确定所述表头名称所对应的单元格;判断每一个单元格是否跨行或者跨列得到基础模板;判断所述基础模板中的每一个单元格是否存在嵌套表格得到初始模板;提取所述初始模板的待确认信息,所述待确认信息包括读取数据的顺序和嵌套表格的节点;根据所述待确认信息得到调整界面并输出;
数据接收模块(23),用于接收客户端(1)在接收到调整界面后返回的反馈信息;
数据确定模块(24),用于识别反馈信息中的读取数据的顺序,提取反馈信息中的嵌套表格的节点,使反馈信息中的嵌套表格的节点与初始模板的嵌套表格的节点保持一致,将确认读取数据的顺序和嵌套表格的节点后的初始模板标记为目标模板。
6.一种智能终端,其特征在于,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1-4中任一项所述方法的计算机程序指令。
7.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1-4中任一项所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211116718.8A CN115390853B (zh) | 2022-09-14 | 2022-09-14 | 多源工艺文件结构化解析方法、系统、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211116718.8A CN115390853B (zh) | 2022-09-14 | 2022-09-14 | 多源工艺文件结构化解析方法、系统、终端及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115390853A CN115390853A (zh) | 2022-11-25 |
CN115390853B true CN115390853B (zh) | 2023-04-07 |
Family
ID=84126661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211116718.8A Active CN115390853B (zh) | 2022-09-14 | 2022-09-14 | 多源工艺文件结构化解析方法、系统、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115390853B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761357A (zh) * | 2013-12-24 | 2014-04-30 | 西安工业大学 | 一种ug环境下基于xml的制造特征建模系统的方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951290B (zh) * | 2014-03-31 | 2018-05-01 | 国际商业机器公司 | 优化软件的方法和设备 |
CN111090971A (zh) * | 2019-12-11 | 2020-05-01 | 哈尔滨安天科技集团股份有限公司 | 一种将多源信息导出为Excel文件的方法及装置 |
CN112668289A (zh) * | 2020-12-25 | 2021-04-16 | 苏州开心盒子软件有限公司 | 一种嵌套表格的提取方法及装置、存储介质 |
CN113505580A (zh) * | 2021-07-26 | 2021-10-15 | 京东科技控股股份有限公司 | 表格文件的解析方法和装置 |
CN114970475A (zh) * | 2022-05-27 | 2022-08-30 | 招商银行股份有限公司 | excel表格解析方法、系统、设备及存储介质 |
-
2022
- 2022-09-14 CN CN202211116718.8A patent/CN115390853B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761357A (zh) * | 2013-12-24 | 2014-04-30 | 西安工业大学 | 一种ug环境下基于xml的制造特征建模系统的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115390853A (zh) | 2022-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110292775B (zh) | 获取差异数据的方法及装置 | |
CN113391871B (zh) | 一种rpa元素智能融合拾取的方法与系统 | |
US10198407B2 (en) | System and method for dynamic linking between graphic documents and comment data bases | |
CN102541521B (zh) | 基于结构化查询语言的操作指令自动生成装置及方法 | |
US7159209B1 (en) | Inter-application validation tool for use in enterprise architecture modeling | |
CN108830554B (zh) | 基于任务模型的数据成果信息质量智能检测方法和系统 | |
CN109448100A (zh) | 三维模型格式转换方法、系统、计算机设备及存储介质 | |
CN113505082B (zh) | 应用程序测试方法及装置 | |
CN112307191A (zh) | 多系统交互式日志查询方法、装置、设备及存储介质 | |
CN113434482A (zh) | 数据迁移方法、装置、计算机设备及存储介质 | |
CN111552665A (zh) | 标注信息格式转换方法、装置、设备和介质 | |
CN110442653A (zh) | 增量构建cube模型的方法、装置、服务器及存储介质 | |
CN115390853B (zh) | 多源工艺文件结构化解析方法、系统、终端及存储介质 | |
US20210357190A1 (en) | Aesthetic visualizations by auto-optimizing connectors in workflows | |
CN116756261A (zh) | 一种基于关系型数据库管理工具的gis数据处理方法 | |
CN115169578A (zh) | 一种基于元宇宙数据标记的ai模型生产方法及系统 | |
CN115035044A (zh) | 一种应用于工业质检的智能ai平台 | |
CN114816408A (zh) | 信息处理方法及装置 | |
CN111143643B (zh) | 元素识别方法、装置、可读存储介质和电子设备 | |
CN112559641A (zh) | 拉链表的处理方法及装置、可读存储介质及电子设备 | |
CN112396343A (zh) | 一种数据质量核查方法及装置 | |
CN113515651B (zh) | 一种基于网格数据库的档案存储方法 | |
CN116383094B (zh) | 一种测试用例库构建方法、装置、设备及存储介质 | |
CN112130841B (zh) | Sql开发方法、装置及终端设备 | |
Chu et al. | An improved database inspection system for e-commerce companies based on web data mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |