CN112668288A - 一种继电保护装置定值校核仪智能提取定值单项的方法 - Google Patents
一种继电保护装置定值校核仪智能提取定值单项的方法 Download PDFInfo
- Publication number
- CN112668288A CN112668288A CN202011548310.9A CN202011548310A CN112668288A CN 112668288 A CN112668288 A CN 112668288A CN 202011548310 A CN202011548310 A CN 202011548310A CN 112668288 A CN112668288 A CN 112668288A
- Authority
- CN
- China
- Prior art keywords
- normalization
- cell
- fixed value
- merging
- row
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种继电保护装置定值校核仪智能提取定值单项的方法,生成归一表格,将定值单转化为一种归一表格;逐行读取归一表格的各个归一单元格的定值内容,忽略被合并定值单元格对应的归一单元格,根据关键字查找表头,保存表头,读取与表头所在的归一单元格同列关联的归一单元格的定值内容作为表头对应的定值项。本发明能从各种不同格式的定值单提取定值项,以关键字查找表头,并自动识别每列代表的定值内容,智能化得到定值项。
Description
技术领域
本发明属于继电保护技术领域,具体涉及一种继电保护装置定值校核仪智能提取定值单项的方法。
背景技术
长期以来,电力继电保护装置定值校核的工作模式是:保护人员2人一组,一人读取定值,另一人在装置上操作,输入完毕后,保存,然后2人互换角色,进行第一次核对,无误后,运行人员打印装置内部定值单,2人一组,将定值清单和打印的定值单逐项进行核对,完成第二次核对,其中任何一个环节出错就从头来一遍。目前针对智能变电站的具备通信功能的继电保护装置已经出现一些工具软件或便携装置可以替代人工操作,大大提高了工作效率和校核准确性,它们的工作原理是一次性从保护装置中读取所有定值,再将其和电子版定值单中的定值作对比,得出校核结果并允许用户根据需要下发定值,操作过程简单便捷。
利用软件完成的自动校核功能有一个非常重要的步骤是从电子版定值单提取定值项,目前各地方并没有统一的定值单文件格式和表格样式,各省市常见的文件格式有pdf、doc、docx、xls、xlsx、html等,表格中常见的定值项关键字有"名称"、"整定项目"、"控制字名称"、"定值名称"、"一区定值"、"动作值"、 "现定值"、"新定值"、"更改后定值"、"现正常状态"、"整定值"等,利用软件解析提取这些不同文件格式和表格样式的定值单是一项不容易的工作,如果针对不同文件格式和表格样式定制开发相应的定值提取软件是一种低效且难于管理的方式,而比较明智的做法是首先开发一种能够兼容绝大多数定值单的方式,再针对极少数非常特别的定值单定制开发。
发明内容
本发明的目的是针对现有技术存在的上述缺陷,提供一种继电保护装置定值校核仪智能提取定值单项的方法。
本发明的上述目的通过以下技术方案实现:
一种继电保护装置定值校核仪智能提取定值单项的方法,包括以下步骤:
步骤1、生成归一表格,归一表格包括多行归一表行,每行归一表行包括多个归一单元格,各行归一表行与定值单的各行对应,归一单元格与定值单对应行的各个定值单元格对应,将定值单转化为一种归一表格;
步骤2、逐行读取归一表格的各个归一单元格的定值内容,忽略被合并定值单元格对应的归一单元格,根据关键字在归一单元格的定值内容中找出表头,保存表头,并读取与表头所在的归一单元格同列关联的归一单元格的定值内容作为表头对应的定值项。
如上所述的步骤1中,将定值单转化为一种归一表格包括以下步骤:
归一单元格内填写有行合并跨度、列合并跨度、合并状态和定值内容;
定值单元格为被合并定值单元格时,行合并跨度和列合并跨度均为0,合并状态为true;
定值单元格为普通定值单元格时,行合并跨度和列合并跨度均为1,合并状态为;
定制单元格为合并格首格且合并N1行的定值单元格时,行合并跨度为N1,合并状态merged为false,N1为大于1的自然数;
定制单元格为合并格首格且合并N2列的定值单元格时,列合并跨度为N2,合并状态merged为false,N2为大于1的自然数。
如上所述的步骤2中,与表头所在的归一单元格同列关联的归一单元格是指:表头所在的归一单元格与同列关联的归一单元格同列,行合并跨度相同,列合并跨度相同,表头所在的归一单元格的行数与同列关联的归一单元格的行数连续。
本发明与现有技术相比,具有以下优点和有益效果:
本发明能从各种不同格式的定值单提取定值项,以关键字查找表头,并自动识别每列代表的定值内容,智能化得到定值项。
附图说明
图1归一表格示意图;
图2定制单示意图;
图3归一表格示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明提供一种继电保护装置定值校核仪智能提取定值单项的方法,可以兼容目前各省市在用的大多数定值单,当应用于新关键字的定值单时仅通过简单的配置即可快速兼容。
本发明使用两个步骤来提取定值单项:
第一步:将各种格式的定值单转化为一种归一表格,各种格式的定值单包括多行多列的阵列排布的定值单元格,其中,某些相邻行的定值单元格合并作为定值合并格,某些相邻列的定值单元格合并作为定值合并格,定值合并格中填入有相应的定值,不同格式的定制单中,定值合并格的合并方式不同,
在本步骤中,生成归一表格BillTable,归一表格BillTable包括多行归一表行BillRow,每行归一表行BillRow包括多个归一单元格BillCell,各行归一表行BillRow与定值单的各行对应,归一单元格BillCell与定值单对应行的各个定值单元格对应。
归一单元格BillCell内填写有行合并跨度rowspan、列合并跨度colspan、合并状态merged、定值内容value;
定值单元格为被合并定值单元格时,行合并跨度rowspan和列合并跨度 colspan均为0,合并状态merged为true;
定值单元格为普通定值单元格时,行合并跨度rowspan和列合并跨度 colspan均为1,合并状态merged为false;
定制单元格为合并格首格且合并N1(N1为大于1的自然数)行的定值单元格时,行合并跨度rowspan为N1,合并状态merged为false;
定制单元格为合并格首格且合并N2(N2为大于1的自然数)列的定值单元格时,列合并跨度colspan为N2,合并状态merged为false;
该归一表格充分考虑到后续提取工作的便携性,而又不丢失原有定值单的内容及合并格信息;
第二步:逐行读取归一表格的各个归一单元格的定值内容,忽略被合并定值单元格对应的归一单元格(即直接忽略合并装填merged为true的归一单元格),根据关键字在归一单元格的定值内容中找出表头,保存表头,并读取与表头所在的归一单元格同列关联的归一单元格的定值内容作为表头对应的定值项。
与表头所在的归一单元格同列关联的归一单元格是指:表头所在的归一单元格与同列关联的归一单元格同列,行合并跨度相同,列合并跨度相同,表头所在的归一单元格的行数与同列关联的归一单元格的行数连续。
归一表格的定义需要考虑到不丢失原表格信息同时方便后续处理,将归一表格命名为BillTable,归一表格的表行命名为BillRow,表行的各个归一单元格命名为BillCell,如图1所示。
其中最基本的单元为归一单元格BillCell。
如图2所示,以图中第3行为例,
A3是一个普通定值单元格,对应的归一单元格的行合并跨度rowspan和列合并跨度colspan都为1,合并状态merged为false,定值内容value为“1”。
B3是合并格首格,对应的归一单元格的行合并跨度rowspan为1,列合并跨度colspan为3,合并状态merged为false,定值内容value为“低电压闭锁定值”。
C3是被合并定值单元格,对应的归一单元格的行合并跨度rowspan为0,列合并跨度colspan为0,合并状态merged为true,定值内容value为空。
D3是被合并定值单元格,对应的归一单元格的行合并跨度rowspan为0,列合并跨度colspan为0,合并状态merged为true,定值内容value为空。
E3与A3类似,F3与B3类似,G3与C3或D3类似;表行BillRow为多个归一单元格BillCell组成;表格BillTable由多个表行BillRow组成。如图3所示,其中灰色背景为被合并定值单元格对应的归一单元格,后续处理将被忽略。
归一表格的特点在于合并格的信息被转化为单元格的属性,其在接下来的定值单项提取过程中具有方便处理的特性,提取处理中可直接忽略被合并定值单元格对应的归一单元格(即直接忽略合并状态merged为true的归一单元格)。从归一表格提取定值项时为找到每列代表的意义,先以关键字找到表头。本实施例以三类关键字作为查找表头依据:名称类、目标值类和单位类。其中名称类的关键字例如"名称"、"控制字名称"、"定值名称",目标值类的关键字例如"现定值"、 "新定值"、"更改后定值",单位类的关键字例如“单位”。
归一表格在逐行扫描时,将直接忽略合并状态merged为true的归一单元格,并首先尝试寻找以上的三类关键字,当三类关键字都被找到时认为找到表头,若未找到表头而其结构又与其前的表头行结构相同,则认为是定值项。以图2和图 3为例,扫描第1行未得到任何结果,在扫描第2行时根据关键字可以找到表头,并确立B列、E列和F列分别代表名称、单位和目标值,当扫描第3行时未找到表头但是发现当前扫描归一表格与表头的行合并跨度相同、列合并跨度相同、且所在列相同与表头(第2行)一样,则其B列、E列和F列就是该定值项的名称、单位和目标值。后续以此类推即可得到定值单的所有定值项。
需要指出的是,本发明中所描述的具体实施例仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例作各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或超越所附权利要求书所定义的范围。
Claims (3)
1.一种继电保护装置定值校核仪智能提取定值单项的方法,其特征在于,包括以下步骤:
步骤1、生成归一表格,归一表格包括多行归一表行,每行归一表行包括多个归一单元格,各行归一表行与定值单的各行对应,归一单元格与定值单对应行的各个定值单元格对应,将定值单转化为一种归一表格;
步骤2、逐行读取归一表格的各个归一单元格的定值内容,忽略被合并定值单元格对应的归一单元格,根据关键字在归一单元格的定值内容中找出表头,保存表头,并读取与表头所在的归一单元格同列关联的归一单元格的定值内容作为表头对应的定值项。
2.根据权利要求1所述的一种继电保护装置定值校核仪智能提取定值单项的方法,其特征在于,所述的步骤1中,将定值单转化为一种归一表格包括以下步骤:
归一单元格内填写有行合并跨度、列合并跨度、合并状态和定值内容;
定值单元格为被合并定值单元格时,行合并跨度和列合并跨度均为0,合并状态为true;
定值单元格为普通定值单元格时,行合并跨度和列合并跨度均为1,合并状态为;
定制单元格为合并格首格且合并N1行的定值单元格时,行合并跨度为N1,合并状态merged为false,N1为大于1的自然数;
定制单元格为合并格首格且合并N2列的定值单元格时,列合并跨度为N2,合并状态merged为false,N2为大于1的自然数。
3.根据权利要求1所述的一种继电保护装置定值校核仪智能提取定值单项的方法,其特征在于,所述的步骤2中,与表头所在的归一单元格同列关联的归一单元格是指:表头所在的归一单元格与同列关联的归一单元格同列,行合并跨度相同,列合并跨度相同,表头所在的归一单元格的行数与同列关联的归一单元格的行数连续。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011548310.9A CN112668288A (zh) | 2020-12-24 | 2020-12-24 | 一种继电保护装置定值校核仪智能提取定值单项的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011548310.9A CN112668288A (zh) | 2020-12-24 | 2020-12-24 | 一种继电保护装置定值校核仪智能提取定值单项的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112668288A true CN112668288A (zh) | 2021-04-16 |
Family
ID=75409958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011548310.9A Pending CN112668288A (zh) | 2020-12-24 | 2020-12-24 | 一种继电保护装置定值校核仪智能提取定值单项的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112668288A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622335A (zh) * | 2011-01-27 | 2012-08-01 | 微软公司 | 根据示例的自动化表格变换 |
US20180365205A1 (en) * | 2016-02-04 | 2018-12-20 | Fujitsu Limited | Tabular data analysis method, recording medium storing tabular data analysis program, and information processing apparatus |
CN109213818A (zh) * | 2018-08-15 | 2019-01-15 | 平安科技(深圳)有限公司 | 表格导出方法、装置、计算机设备及存储介质 |
CN110096507A (zh) * | 2019-04-25 | 2019-08-06 | 北京博跃科技有限公司 | 一种页面复杂表格渲染方法、系统、终端及介质 |
CN110287379A (zh) * | 2019-06-17 | 2019-09-27 | 中电科大数据研究院有限公司 | 一种基于逻辑树的表格拆分与数据提取方法 |
-
2020
- 2020-12-24 CN CN202011548310.9A patent/CN112668288A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622335A (zh) * | 2011-01-27 | 2012-08-01 | 微软公司 | 根据示例的自动化表格变换 |
US20180365205A1 (en) * | 2016-02-04 | 2018-12-20 | Fujitsu Limited | Tabular data analysis method, recording medium storing tabular data analysis program, and information processing apparatus |
CN109213818A (zh) * | 2018-08-15 | 2019-01-15 | 平安科技(深圳)有限公司 | 表格导出方法、装置、计算机设备及存储介质 |
CN110096507A (zh) * | 2019-04-25 | 2019-08-06 | 北京博跃科技有限公司 | 一种页面复杂表格渲染方法、系统、终端及介质 |
CN110287379A (zh) * | 2019-06-17 | 2019-09-27 | 中电科大数据研究院有限公司 | 一种基于逻辑树的表格拆分与数据提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753099B (zh) | 一种基于知识图谱增强档案实体关联度的方法及系统 | |
US11868717B2 (en) | Multi-page document recognition in document capture | |
US10120537B2 (en) | Page-independent multi-field validation in document capture | |
US20120303645A1 (en) | System and method for extraction of structured data from arbitrarily structured composite data | |
CN101206670B (zh) | 用于将非结构化信息转换成内容的系统和方法 | |
EP0472026A2 (en) | Information processing system and method for processing document by using structured keywords | |
CN102110123B (zh) | 倒排索引建立方法 | |
AU2021212025A1 (en) | Intelligent question answering on tabular content | |
CN103793372A (zh) | 从电子文档中的表格结构提取语义关系 | |
CA2430802A1 (en) | Method and system for displaying and linking ink objects with recognized text and objects | |
CN101930435A (zh) | 机构名称检索方法及系统 | |
CN110362596A (zh) | 一种文本抽取信息结构化数据处理的控制方法及装置 | |
CN101814075A (zh) | 一种信息资源目录系统及其查询方法 | |
CN101853297A (zh) | 一种在电子设备中快速获得期望图像的方法 | |
US20080008391A1 (en) | Method and System for Document Form Recognition | |
CN111190920A (zh) | 一种基于自然语言的数据交互查询方法及其系统 | |
CN106874240A (zh) | 数字出版方法及系统 | |
JP2003173342A (ja) | データベースに対するデータの登録および検索を支援する装置、方法 | |
CN112668288A (zh) | 一种继电保护装置定值校核仪智能提取定值单项的方法 | |
EP3470993A1 (en) | A method and system for click thru capability of electronic media | |
CN115983202A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN100442275C (zh) | 用于鉴别中文地址数据的方法和系统 | |
CN111275409A (zh) | 一种电网大修审计数据处理系统及处理方法 | |
KR20020061443A (ko) | 컴퓨터 통신망을 이용한 정보의 수집, 가공 및 표시방법과 그 시스템 | |
Lin et al. | Exploration and Implementation of Data Processing Methods in Admission and Enrollment for Adult Higher Education Institutions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |