CN111523382B - 一种雨量计自记纸数据采集方法 - Google Patents

一种雨量计自记纸数据采集方法 Download PDF

Info

Publication number
CN111523382B
CN111523382B CN202010180625.6A CN202010180625A CN111523382B CN 111523382 B CN111523382 B CN 111523382B CN 202010180625 A CN202010180625 A CN 202010180625A CN 111523382 B CN111523382 B CN 111523382B
Authority
CN
China
Prior art keywords
rainfall
time
data
abc
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010180625.6A
Other languages
English (en)
Other versions
CN111523382A (zh
Inventor
熊传圣
艾萍
袁定波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202010180625.6A priority Critical patent/CN111523382B/zh
Publication of CN111523382A publication Critical patent/CN111523382A/zh
Application granted granted Critical
Publication of CN111523382B publication Critical patent/CN111523382B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/14Rainfall or precipitation gauges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Environmental & Geological Engineering (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Library & Information Science (AREA)
  • Hydrology & Water Resources (AREA)
  • Geometry (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种雨量计自记纸数据采集方法,利用电脑对传统的虹吸式雨量计自记纸数据进行扫描、识别、核对和存储。该装置由扫描模块、识别模块、核对模块和存储模块组成,采用扫描自记纸内容、识别自记纸范围及过程线的方法计算获取雨量数据、并关联人工复核的情况及多张自记纸的连续性来保证准确性。应用本发明的方法与装置,能够高效准确地将传统的纸质雨量数据资料转化为电子数据资源,在实现快速数字化雨量模拟记录资料的同时,大大减少人工数据读取与处理的工作量,全面提升数据采集的时效与能力。

Description

一种雨量计自记纸数据采集方法
技术领域
本发明涉及水利工程领域,特别是涉及一种雨量计自记纸数据采集方法。
背景技术
随着计算机技术的飞速发展,人们进入了电子化、信息化的时代,计算机带来的方便、快捷使得几乎所有的脑力工作都能通过计算机技术得到更好的条件与应用,并大大提高了工作效率。由于多方面的原因,传统的纸质数据仍然占据着数据资源的很大一部分,这一部分数据无法通过计算机进行快速、高效的运算,使用起来较为困难,但其包含的信息量却可能是项目、工作中所需要的。相较而言,传统的纸质数据如果无法变成电子数据,那么工作的效率将赶不上时代的步伐,如何将纸质资源转化为电子资源将是需要解决的问题。
在水文行业,大量的雨量数据仍通过传统的雨量计进行采集。这种雨量计获取的数据保存在自记纸上,虽然经过人工审核并装订成册,但储存的方式基本为建立大型的资料室,将数据整理排放,需要使用则找到相应的数据进行抄录。这种做法严重影响了工作的效率,也造成大量人力、物力、财力的浪费。由于纸质数据存量巨大且存在着记录不规范等不足,将纸质数据转化为电子数据是一个庞大且复杂的工程,急需一种方法及装置来解决上述问题。
随着计算机技术的发展,图像识别、文字识别技术已趋于成熟,可利用该技术进行大量、快速、可靠的识别。
发明内容
本发明所要解决的技术问题是针对背景技术中的缺陷,提供一种雨量计自记纸数据采集方法,能够将传统的纸质雨量数据资料转化为电子资源,进行大规模、快速数字化雨量资料,并减少人工数据读取困难,降低人力、物力的消耗。
本发明为解决上述技术问题采用以下技术方案:
一种雨量计自记纸数据识别方法,具体包括:
步骤S.1),扫描自记纸并确定格式及初始条件,具体包括如下步骤:
步骤S.1.1),通过扫描仪快速、连续地扫描自记纸数据,按顺序存储为图片“abc_i”,其中name=abc,“i”为扫描的第i张图纸,即表示测站abc的第i张图纸所形成的图片;
步骤S.1.2),人工确认图纸格式,即abc_i的参数:网格代表的时间x轴长度“T小时”,分成了“a”格,即每格大小为dt=Ta;雨量y轴高度“L毫米”,分成了“b”格,即每格大小为dl=L/b;
步骤S.1.3),确定abc_i的初始参数,包括初始时间itime(1)=(yyyy,mm,dd,hh,mm)、初始雨量G(itime(1))=F(1,0)=y;
步骤S.2),识别abc_i的绘图区,并提取范围和绘制网格,具体包括如下步骤:
步骤S.2.1),判断并读取图中网格纸的四个角位置;
步骤S.2.2),连接角的位置,判断绘图区的边框;
步骤S.2.3),根据abc_i的样式,划分密集网格,识别出图片中的网格内容;
步骤S.2.4),以左下角作为原点位置,建立坐标轴,其中x轴为时间,y轴为雨量;
步骤S.3),识别abc_i中雨量线数据,确定第i张图纸的相对时间time(i,k)及相对雨量值f(i,k),并对模糊、污迹等现象进行智能处理,具体包括如下步骤:
步骤S.3.1),识别abc_i中除步骤步骤S.2.3确定的网格外实线,将其确定为雨量线;
步骤S.3.2),确定abc_i的初始时间itime(i)=(yyyy,mm,dd,hh,mm),其中itime(i)-itime(i-1)=T;
步骤S.3.3),确定雨量线的相对时间:time(i,k)=k×dt,其中k为格数,k=0,1,2,...a;time(i,k)具有以下特点:time(i,0)=0,time(i,a)=T,time(i,k)-time(i,k-1)=dt;
步骤S.3.4),雨量线在time(i,k)处的雨量为y(k),确定雨量值f(i,k)=y(k);
步骤S.3.4.1),当f(i,c)≥L-10dl且f(i,c+1)≤10dl时,记录纸为超出上界限,并在k>c时令y(k)=y(k)+L;
步骤S.3.4.2),当f(i,c)≤10Δl且f(i,c+1)≥L-10Δl时,记录纸为超出下界限,并在k>c时令y(k)=y(k)-L;
步骤S.3.5),处理abc_i上其他非文字痕迹:
步骤S.3.5.1),如果abc_i上出现自记笔痕迹不清晰的区域,根据趋势延长雨量线直至下一个清晰的笔记处;如果延长无法交汇或发生矛盾,则记录为P(n)=(i,in,5),n=n+1,in=in+1并从下一个清晰处继续记录;
步骤S.3.5.2),如果abc_i上出现污迹、杂乱痕迹等问题,如果出现距离雨量线较远,则可当作干扰内容去除;如果出现在雨量线上,则记录P(n)=(i,in,6),n=n+1,in=in+1并从下一个清晰处继续记录;
步骤S.4),提取图纸中“人工复核信息”及其他信息,具体包括如下步骤:
步骤S.4.1),识别主要文字并提取资料;
步骤S.4.2),识别雨量线附近的数值文字及其位置为j(i,b,c),其中b为第b处人工校对数据,c为数据或记录人员,其中c=1为记录数据,c=2为记录人员;
步骤S.5),智能拼接各张图纸数据,确定abc_i的绝对雨量数据F(i,k),并建立全局雨量G(t),具体包括如下步骤:
步骤S.5.1),绝对雨量为abc_i的初始雨量和相对雨量之和,且abc_(i+1)的初始雨量为abc_i的末端雨量,即F(i,k)=F(i,0)+f(i,k),F(i+1,0)=F(i,a);
步骤S.5.2),绝对时间TIME(i,k)为abc_i的初始时间和相对时间之和,abc_(i+1)的初始时间为abc_i的末端时间,即TIME(i,k)=itime(i)+time(i,k),itime(i+1)=TIME(i,a);
步骤S.5.3),建立全局雨量G(t=TIME(i,k))=F(i,k);
步骤S.6),数据核对、智能核对及人工核对,具体包括如下步骤:
步骤S.6.1),数据核对,获取问题P(n)=(i,in,p),其中n为发现问题的序号,in为abc_i的问题序号,p为问题原因:
p=1:aname(i)≠name,识别名称不同于站点名称;
p=2:atime(i)≠itime(i),识别初始时间不同于计算的初始时间;
p=3:TIME(i,a)≠itime(i+1),abc_i的绝对时间末和下一张的初始时间不匹配;
p=4:图纸网格无法确定;
p=5:自记笔痕迹不清晰问题;
p=6:自记笔处有污迹问题;
p=7:f(i,a)≠f(i+1,0),两张纸无法结合;
p=8:F(i,a)≠F(i+1,0),abc_i的绝对雨量末和下一张的初始雨量不匹配;
p=9:j(i,n,1)≠max/min(F(i,c),F(i,d)),复核记录的数值不为某一段运算的极值;
步骤S.6.2),将问题通过计算机智能解决,如p=2,3,7,8时分析是否为序号弄错,并自行修改序号,p=5,6时通过前期工作的学习方法来进行智能推演;
步骤S.6.3),如人工智能无法解决问题,如缺页、记录错误等,则转由人工核对,由人工修改雨量、时间、站点等数值;如可忽略则进行忽略操作;所有的人工操作将进行记录;
步骤S.6.4),将智能核对和人工核对的结果转入数据核对模块并进行数据更新,再次核对数据;
步骤S.6.5),将数据进行人工抽检,确认合格率;
步骤S.7),记录并存储数据,具体包括如下步骤:
步骤S.7.1),将数据记录为表格形式,主要记录项为name、G(t=TIME(i,k))=F(i,k)、i及备注,其中,备注记录j(i,b,c);
步骤S.7.2),按核对后的序号保存所有图片文件用于数据的复查;
步骤S.7.3),记录所有人工修改情况。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明能够智能转换大量纸质雨量数据资料,在耗费较小人力资源的基础上,实现大量水文行业纸质数据的电子化。
附图说明
图1是本发明一种雨量计自记纸数据识别方法示意图;
图2是传统雨量自记纸示意图;
图3是数据核对及人工抽检方法的分解示意图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
本发明可以以许多不同的形式实现,而不应当认为限于这里所述的实施例。相反,提供这些实施例以便使本公开透彻且完整,并且将向本领域技术人员充分表达本发明的范围。在附图中,为了清楚起见放大了组件。
本发明提供一种雨量计自记纸数据识别方法,采用扫描自记纸内容、识别自记纸范围及过程线的方法计算获取雨量数据、并关联人工复核的情况及多张自记纸的连续性来保证准确性。通过上述方式,本发明能够将传统的纸质雨量数据资料转化为电子资源,在快速数字化雨量资料的同时,减少人工数据读取困难。
举例说明:现有测站“abc”1980年1月1日~2000年12月31日的雨量数据,采集的方式为虹吸式雨量计,自记纸的样式如图2所示,现需将其全部转化为电子资源。
参照图1,是本发明实施例所述的一种雨量计自记纸数据识别方法流程图,具体处理过程如下:
步骤S.1),扫描自记纸并确定格式及初始条件,具体包括如下步骤:
步骤S.1.1),通过扫描仪快速、连续地扫描自记纸数据,按顺序存储为图片“abc_i”,其中name=abc,“i”为扫描的第i张图纸,即表示测站abc的第i张图纸所形成的图片;
步骤S.1.2),人工确认图纸格式,即abc_i的参数:网格代表的时间x轴长度“T(小时)”,分成了“a”格,即每格大小为dt=T/a;雨量y轴高度“L(毫米)”,分成了“b”格,即每格大小为dl=L/b;在此例中,T=24,a=24×60;
步骤S.1.3),确定abc_i的初始参数,包括:初始时间itime(1)=(yyyy,mm,dd,hh,mm),初始雨量:G(itime(1))=F(1,0)=y;此例中,itime(1)=(1980,1,1,8,0),表示abc_1所记录的初始时间为1980年1月1日上午8点,第一个值G(1980,1,1,8,0)=F(1,0)=y;
步骤S.2),识别abc_i的绘图区,并提取范围和绘制网格,具体包括如下步骤:
步骤S.2.1),判断并读取图中网格纸的四个角位置;
步骤S.2.2),连接角的位置,判断绘图区的边框;
步骤S.2.3),根据abc_i的样式,自动划分密集网格,识别出图片中的网格内容;
步骤S.2.4),以左下角作为原点位置,建立坐标轴,其中x轴为时间,y轴为雨量;
步骤S.3),识别abc_i中雨量线数据,确定第i张图纸的相对时间time(i,k)及相对雨量值f(i,k),并对模糊、污迹等现象进行智能处理,具体包括如下步骤:
步骤S.3.1),识别abc_i中除步骤步骤S.2.3确定的网格外实线,将其确定为雨量线;
步骤S.3.2),确定abc_i的初始时间itime(i)=(yyyy,mm,dd,hh,mm),其中itime(i)-itime(i-1)=T;
步骤S.3.3),确定雨量线的相对时间:time(i,k)=k×dt,其中k为格数,k=0,1,2,...a;time(i,k)具有以下特点:time(i,0)=0,time(i,a)=T,time(i,k)-time(i,k-1)=dt;
步骤S.3.4),雨量线在time(i,k)处的雨量为y(k),确定雨量值f(i,k)=y(k);
步骤S.3.4.1),当f(i,c)≥L-10dl且f(i,c+1)≤10dl时,记录纸为超出上界限,令y(k)=y(k)+L(当k>c时);
步骤S.3.4.2),同理,当f(i,c)≤10Δl且f(i,c+1)≥L-10Δl时,记录纸为超出下界限,令y(k)=y(k)-L(当k>c时);
步骤S.3.5),处理abc_i上其他非文字痕迹:
步骤S.3.5.1),如果abc_i上出现自记笔痕迹不清晰的区域,则根据趋势延长雨量线直至下一个清晰的笔记处,期间可进行适当的弯曲;如果延长无法交汇或发生矛盾,则记录为P(n)=(i,in,5),n=n+1,in=in+1并从下一个清晰处继续记录;
步骤S.3.5.2),如果abc_i上出现污迹、杂乱痕迹等问题,如果出现距离雨量线较远,则可当作干扰内容去除;如果出现在雨量线上,则记录P(n)=(i,in,6),n=n+1,in=in+1并从下一个清晰处继续记录;
步骤S.4),提取图纸中“人工复核信息”及其他信息,图2为i=10时的自记纸,具体包括如下步骤:
步骤S.4.1),识别主要文字:测站abc,日期19800110,初始时间:8:00,提取资料:aname=abc,atime(10)=(1980,1,10,8,0);
步骤S.4.2),识别雨量线附近的数值文字及其位置为j(i,b,c),其中b为第b处人工校对数据,c为数据或记录人员,其中c=1为记录数据,c=2为记录人员。如图2为第i张图纸,识别图中“张三”,“a”,“张三”,“b”,即为前半部分的极值为“a”,审核者为“张三”,记录j(10,1,1)=a,j(10,1,2)=张三;后半部分的极值为“b”,审核者为“张三”,“b”,即为后半部分的极值为“b”,审核者为“张三”,记录j(10,2,1)=b,j(10,2,2)=张三;一般情况下,记录纸的开头及结尾位置均有人工核对情况。
步骤S.5),智能拼接多张图纸数据,确定abc_i的绝对雨量数据F(i,k),并建立全局雨量G(t),具体包括如下步骤:
步骤S.5.1),绝对雨量为abc_i的初始雨量和相对雨量之和,且abc_(i+1)的初始雨量为abc_i的末端雨量,即F(i,k)=F(i,0)+f(i,k),F(i+1,0)=F(i,a);
步骤S.5.2),绝对时间TIME(i,k)为abc_i的初始时间和相对时间之和,且abc_(i+1)的初始时间为abc_i的末端时间,即TIME(i,k)=itime(i)+time(i,k),itime(i+1)=TIME(i,a);
步骤S.5.3),建立全局雨量G(t=TIME(i,k))=F(i,k);
步骤S.6),数据核对、智能核对及人工核对,如图3所示,具体包括如下步骤:
步骤S.6.1),数据核对,获取问题P(n)=(i,in,p),其中n为发现问题的序号,in为abc_i的问题序号,p为问题原因:
p=1:aname(i)≠name%识别名称不同于站点名称;
p=2:atime(i)≠itime(i)%识别初始时间不同于计算的初始时间;
p=3:TIME(i,a)≠itime(i+1)%abc_i的绝对时间末和下一张的初始时间不匹配;
p=4:图纸网格无法确定;
p=5:自记笔痕迹不清晰问题;
p=6:自记笔处有污迹问题;
p=7:f(i,a)≠f(i+1,0)%两张纸无法结合;
p=8:F(i,a)≠F(i+1,0)%abc_i的绝对雨量末和下一张的初始雨量不匹配;
p=9:j(i,n,1)≠max/min(F(i,c),F(i,d))%复核记录的数值不为某一段运算的极值;
步骤S.6.2),将问题通过计算机智能解决,如p=2,3,7,8时分析是否为序号弄错,并自行修改序号,p=5,6时通过前期工作的学习方法来进行智能推演;
步骤S.6.3),如人工智能无法解决问题,如缺页、记录错误等,则转由人工核对,由人工修改雨量、时间、站点等数值;如可忽略则进行忽略操作;所有的人工操作将进行记录;
步骤S.6.4),将智能核对和人工核对的结果转入数据核对模块并进行数据更新,再次核对数据;
步骤S.6.5),将数据进行人工抽检,确认合格率;
步骤S.7),记录并存储数据,具体包括如下步骤:
步骤S.7.1),将数据记录为表格形式,主要记录项为name、G(t=TIME(i,k))=F(i,k)、i及备注,其中备注主要记录j(i,b,c),如下表所示:
站点 时间 雨量 备注 i
abc 1980.1.1 8:00 20 20,张三核对 1
步骤S.7.2),按核对后的序号保存所有图片文件用于数据的复查;
步骤S.7.3),记录所有人工修改情况。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种雨量计自记纸数据识别方法,其特征在于,包括以下步骤:
步骤S.1),扫描自记纸并确定格式及初始条件,具体包括如下步骤:
步骤S.1.1),通过扫描仪快速、连续地扫描自记纸数据,按顺序存储为图片“abc_i”,其中name=abc,“i”为扫描的第i张图纸,即表示测站abc的第i张图纸所形成的图片;
步骤S.1.2),人工确认图纸格式,即abc_i的参数:网格代表的时间x轴长度“T小时”,分成了“a”格,即每格大小为dt=T/a;雨量y轴高度“L毫米”,分成了“b”格,即每格大小为dl=L/b;
步骤S.1.3),确定abc_i的初始参数,包括初始时间itime(1)=(yyyy,mm,dd,hh,mm)、初始雨量G(itime(1))=F(1,0)=y;
步骤S.2),识别abc_i的绘图区,并提取范围和绘制网格,具体包括如下步骤:
步骤S.2.1),判断并读取图中网格纸的四个角位置;
步骤S.2.2),连接角的位置,判断绘图区的边框;
步骤S.2.3),根据abc_i的样式,划分密集网格,识别出图片中的网格内容;
步骤S.2.4),以左下角作为原点位置,建立坐标轴,其中x轴为时间,y轴为雨量;
步骤S.3),识别abc_i中雨量线数据,确定第i张图纸的相对时间time(i,k)及相对雨量值f(i,k),并对模糊、污迹等现象进行智能处理,具体包括如下步骤:
步骤S.3.1),识别abc_i中除步骤S.2.3确定的网格外实线,将其确定为雨量线;
步骤S.3.2),确定
Figure FDA0003640342450000013
的初始时间
Figure FDA0003640342450000012
其中itime(i)-itime(i-1)=T;
步骤S.3.3),确定雨量线的相对时间:time(i,k)=k×dt,其中k为格数,k=0,1,2,...a;time(i,k)具有以下特点:time(i,0)=0,time(i,a)=T,time(i,k)-time(i,k-1)=dt;
步骤S.3.4),雨量线在time(i,k)处的雨量为y(k),确定雨量值f(i,k)=y(k);
步骤S.3.4.1),当f(i,c)≥L-10dl且f(i,c+1)≤10dl时,记录纸为超出上界限,并在k>c时令y(k)=y(k)+L;
步骤S.3.4.2),当f(i,c)≤10Δl且f(i,c+1)≥L-10Δl时,记录纸为超出下界限,并在k>c时令y(k)=y(k)-L;
步骤S.3.5),处理abc_i上其他非文字痕迹:
步骤S.3.5.1),如果abc_i上出现自记笔痕迹不清晰的区域,根据趋势延长雨量线直至下一个清晰的笔记处;如果延长无法交汇或发生矛盾,则记录为P(n)=(i,in,5),n=n+1,in=in+1并从下一个清晰处继续记录;
步骤S.3.5.2),如果abc_i上出现污迹、杂乱痕迹问题,如果出现距离雨量线较远,则当作干扰内容去除;如果出现在雨量线上,则记录P(n)=(i,in,6),n=n+1,in=in+1并从下一个清晰处继续记录;
步骤S.4),提取图纸中“人工复核信息”及其他信息,具体包括如下步骤:
步骤S.4.1),识别主要文字并提取资料;
步骤S.4.2),识别雨量线附近的数值文字及其位置为j(i,b,c),其中b为第b处人工校对数据,c为数据或记录人员,其中c=1为记录数据,c=2为记录人员;
步骤S.5),智能拼接各张图纸数据,确定abc_i的绝对雨量数据F(i,k),并建立全局雨量G(t),具体包括如下步骤:
步骤S.5.1),绝对雨量为abc_i的初始雨量和相对雨量之和,且abc_(i+1)的初始雨量为abc_i的末端雨量,即F(i,k)=F(i,0)+f(i,k),F(i+1,0)=F(i,a);
步骤S.5.2),绝对时间TIME(i,k)为abc_i的初始时间和相对时间之和,abc_(i+1)的初始时间为abc_i的末端时间,即TIME(i,k)=itime(i)+time(i,k),itime(i+1)=TIME(i,a);
步骤S.5.3),建立全局雨量G(t=TIME(i,k))=F(i,k);
步骤S.6),数据核对、智能核对及人工核对,具体包括如下步骤:
步骤S.6.1),数据核对,获取问题P(n)=(i,in,p),其中n为发现问题的序号,in为abc_i的问题序号,p为问题原因:
p=1:aname(i)≠name,识别名称不同于站点名称;
p=2:atime(i)≠itime(i),识别初始时间不同于计算的初始时间;
p=3:TIME(i,a)≠itime(i+1),abc_i的绝对时间末和下一张的初始时间不匹配;
p=4:图纸网格无法确定;
p=5:自记笔痕迹不清晰问题;
p=6:自记笔处有污迹问题;
p=7:f(i,a)≠f(i+1,0),两张纸无法结合;
p=8:F(i,a)≠F(i+1,0),abc_i的绝对雨量末和下一张的初始雨量不匹配;
p=9:j(i,n,1)≠max/min(F(i,c),F(i,d)),复核记录的数值不为某一段运算的极值;
步骤S.6.2),将问题通过计算机智能解决,如p=2,3,7,8时分析是否为序号弄错,并自行修改序号,p=5,6时通过前期工作的学习方法来进行智能推演;
步骤S.6.3),如人工智能无法解决问题,问题包括缺页、记录错误,则转由人工核对,由人工修改雨量、时间、站点数值;如可忽略则进行忽略操作;所有的人工操作将进行记录;
步骤S.6.4),将智能核对和人工核对的结果转入数据核对模块并进行数据更新,再次核对数据;
步骤S.6.5),将数据进行人工抽检,确认合格率;
步骤S.7),记录并存储数据,具体包括如下步骤:
步骤S.7.1),将数据记录为表格形式,主要记录项为name、G(t=TIME(i,k))=F(i,k)、i及备注,其中,备注记录j(i,b,c);
步骤S.7.2),按核对后的序号保存所有图片文件用于数据的复查;
步骤S.7.3),记录所有人工修改情况。
CN202010180625.6A 2020-03-16 2020-03-16 一种雨量计自记纸数据采集方法 Active CN111523382B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010180625.6A CN111523382B (zh) 2020-03-16 2020-03-16 一种雨量计自记纸数据采集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010180625.6A CN111523382B (zh) 2020-03-16 2020-03-16 一种雨量计自记纸数据采集方法

Publications (2)

Publication Number Publication Date
CN111523382A CN111523382A (zh) 2020-08-11
CN111523382B true CN111523382B (zh) 2022-08-05

Family

ID=71901475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010180625.6A Active CN111523382B (zh) 2020-03-16 2020-03-16 一种雨量计自记纸数据采集方法

Country Status (1)

Country Link
CN (1) CN111523382B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113359216A (zh) * 2021-06-03 2021-09-07 山东捷瑞数字科技股份有限公司 用于翻斗式雨量计记录数据识别的方法、系统和存储介质
CN115409825B (zh) * 2022-09-06 2023-09-12 重庆众仁科技有限公司 一种基于图像识别的温湿压迹线识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100960850B1 (ko) * 2009-01-28 2010-06-07 (주)신비한 우량 계측정보 전송시스템
CN110266907A (zh) * 2019-07-01 2019-09-20 陈鹏 一种细微角度变化调整的气象自记纸扫描图像设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100960850B1 (ko) * 2009-01-28 2010-06-07 (주)신비한 우량 계측정보 전송시스템
CN110266907A (zh) * 2019-07-01 2019-09-20 陈鹏 一种细微角度变化调整的气象自记纸扫描图像设备

Also Published As

Publication number Publication date
CN111523382A (zh) 2020-08-11

Similar Documents

Publication Publication Date Title
US10353997B1 (en) Freeform annotation transcription
US5404294A (en) Tag method for moving information between computers & forms
CN111523382B (zh) 一种雨量计自记纸数据采集方法
US7783634B2 (en) Device, a program and a system for managing electronic documents
CN103198503A (zh) 数字漫画编辑器及方法
CN107193467B (zh) 用于展示智能笔书写内容的方法及设备
CN103020812B (zh) 方便电子化的专业笔记本及其添加到电子日历中的方法
CN113806170B (zh) 工程行业监理日志自动生成的方法、系统、介质及终端
CN111310682B (zh) 一种文本文件表格的通用检测分析及识别方法
Klein et al. Comprehensive methods for leaf geometric morphometric analyses
CN109241555A (zh) 一种改善绘图精度的多图元Gerber文件解析及绘制方法
Walton et al. A cost analysis of transcription systems
US6792145B2 (en) Pattern recognition process for text document interpretation
CN111310428A (zh) 一种纸质表格笔迹自动录入传输系统及方法
CN112101336A (zh) 一种基于计算机视觉的智能数据采集方式
CN210038810U (zh) 智能评测设备及系统
JP2020067998A (ja) 特許文献集合の分析方法
CN115587098A (zh) 一种智能识别图表数据的方法及系统
JP2007087021A (ja) 紙文書の電子文書化装置,紙文書の電子文書化方法および紙文書の電子文書化用プログラム
CN110675729B (zh) 一种多版本地理信息一体化制图方法及系统
Peng et al. Document image matching based on component blocks
JP2021152696A (ja) 情報処理装置及びプログラム
CN110781643A (zh) Word文档电子试卷的手写笔迹识别方法及计算机可读存储介质
CN110737790A (zh) 一种基于数据库的通用图像数据集管理方法
CN100403318C (zh) 简化图形组件的系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant