CN106326818B - 纸质水文资料的数字化方法及装置 - Google Patents
纸质水文资料的数字化方法及装置 Download PDFInfo
- Publication number
- CN106326818B CN106326818B CN201510388835.3A CN201510388835A CN106326818B CN 106326818 B CN106326818 B CN 106326818B CN 201510388835 A CN201510388835 A CN 201510388835A CN 106326818 B CN106326818 B CN 106326818B
- Authority
- CN
- China
- Prior art keywords
- hydrographic
- point
- image
- data
- grid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims abstract description 53
- 238000012937 correction Methods 0.000 claims abstract description 33
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 20
- 238000002372 labelling Methods 0.000 claims description 6
- 230000002708 enhancing effect Effects 0.000 claims description 5
- 238000003709 image segmentation Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 4
- 238000005342 ion exchange Methods 0.000 claims 2
- 230000008901 benefit Effects 0.000 abstract description 4
- 238000012545 processing Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 238000013075 data extraction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 239000003208 petroleum Substances 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
- G06T3/608—Rotation of whole images or parts thereof by skew deformation, e.g. two-pass or three-pass rotation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
- G06T2207/20061—Hough transform
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种纸质水文资料的数字化方法,利用计算机将纸质水文资料所记录的水文数据转化为可查询的数据库数据。该方法包括以下步骤:从纸质水文资料的数字图像中提取出二值化的坐标网格图像、水文曲线图像;对坐标网格图像、水文曲线图像进行倾斜校正;分别对倾斜校正后的坐标网格图像、水文曲线图像进行图像增强,并计算出单位网格的大小;利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合;计算出单位网格对应的水文数据;计算交点所对应的水文数据。本发明还公开了一种纸质水文资料的数字化装置。相比现有技术,本发明具有准确性和自动化程度高的优点,可大幅提高水文数据资料数字化的效率,降低成本。
Description
技术领域
本发明涉及一种纸质水文资料的数字化方法及装置,利用计算机将纸质水文资料所记录的水文数据转化为可查询的数据库数据,属于计算机图像识别技术与水利技术相交叉的技术领域。
背景技术
在计算机没有普及之前,在水利、气象、生物医学、石油地质等领域,都是通过特定仪器或者人工将观测的有效数据信息绘制在纸质工程图纸上。在水利领域方面,水文信息是水利工程发展中最重要最根本的内容。可知纸质水文资料上的数据均是比较珍贵的历史资料,记录流量、水位、降水量、蒸发量等,其中很多的数据会被经常用来分析与处理,对这些有效信息的利用与共享将为我国水利工程建设提供科学的理论与依据,将会大大促进我国水利事业的发展。
然而这类水文纸质资料并不是完全保存完整,随着时间,会受到存放条件、温度、环境等影响,导致如纸质磨坏破损、时间过久老化、字迹变淡模糊、纸质资料字迹渗透等污染,这些都会对历史数据的安全以及价值带来影响。因此对这类纸质资料进行数字化,将纸质水文资料中的重要的数据转移到计算机中进行分类存储和处理是很有必要的。
由于水文纸质资料种类繁多以及数据多样化,对这些资料进行保存到计算机的过程中,一般是以人工为主,选择代表性的节点及数据,指定插值或曲线拟合的方法,计算出某一时间的水位信息等数据。但是曲线形态各异,拟合或插值并不能通用。另一种方式是通过人工录入数据并建立大型数据库,由于资料种类繁多数据量大,工作量巨大且易出错,数据需要经过严格的审查与校核才能入库,并需要提供各种不同的检索方式,而且并不保证能够在最短时间准确找到需要的数据。
随着计算机技术的快速发展,数字图像处理技术渐渐成熟,很多研究者对图像处理技术有深入研究并且应用到实际领域中,如水利、石油地质、气象等。一方面,水文纸质资料与其他工程图纸相比,图纸的材质与规格并不相同,以及应用需求并不相同,从而如心电图等工程图纸数字化方法,并不能完全适用于纸质水位资料。另一方面,部分有关水文历史资料的数字化研究不够深入,例如[魏庆杰,董秀强.水文资料数据库管理系统开发及应用[J].水利科技与经济,第15卷,2009,163-165]、[赵春霖,孙利芳,王健.水文资料整编管理系统的设计思路及功能实现[J].内蒙古大学学报(自然科学版),2003,34(5):556-559]、[赵启升.数字化水资源档案管理系统的设计与实现[J].信息技术,2005,8:56-59]等均利用扫描仪将纸质水文资料转换图像格式进行入库保存。又如文献[肖卫,时昶,高军.历史水文资料数字化处理[J],人民长江,2011,42(11):67-69]、[王意惟,李登民,隋铁成.水文原始资料数据库的开发应用与分析评价[J].东北水利水电,2008,26(12):40-41]等,对水文资料的管理通过人工录入信息建立对应的数据库,对资料分类进行整编到数据库中,但是数据信息在录入之前需要经过严格的校正,对访问数据时需要建立各种索引,不能够快速用于进一步的参考与研究当中。
综上可知,对于水文纸质资料而言,还没有能够全自动实现水文曲线数字化的技术被公开,且水文资料幅面大引起的形变给图像分割及数据提取带来一定难度。
发明内容
本发明所要解决的问题在于克服现有技术不足,提供一种纸质水文资料的数字化方法及装置,利用计算机将纸质水文资料所记录的水文数据转化为可查询的数据库数据,具有准确性和自动化程度高的优点。
本发明具体采用以下技术方案解决上述技术问题:
纸质水文资料的数字化方法,利用计算机将纸质水文资料所记录的水文数据转化为可查询的数据库数据,包括以下步骤:
步骤A、从纸质水文资料的数字图像中提取出二值化的坐标网格图像、水文曲线图像;
步骤B、对坐标网格图像、水文曲线图像进行倾斜校正;
步骤C、分别对倾斜校正后的坐标网格图像、水文曲线图像进行图像增强,并计算出单位网格的大小;
步骤D、利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合;
步骤E、扫描出水文曲线的最高点、最低点,结合给定的最高点、最低点所对应的水文数据,计算出单位网格对应的水文数据;
步骤F、对整点时刻交点集合中的每个交点,按照以下方法计算出其对应的水文数据:首先查找出交点所处网格的上、下端线,从上、下端线中确定交点所处网格的基线,并标定基线对应的基线水文数据;然后求出交点到基线的距离占上、下端线间距离的比例,并根据单位网格对应的水文数据,计算交点相对于基线的相对水文数据;根据基线对应的基线水文数据以及交点相对于基线的相对水文数据,得到交点所对应的水文数据。
优选地,所述对坐标网格图像、水文曲线图像进行倾斜校正,其方法具体如下:利用霍夫变换获得坐标网格图像中心区域的倾斜角度,然后按照所述倾斜角度对坐标网格图像、水文曲线图像分别进行旋转校正。
优选地,按照以下方法对倾斜校正后的水文曲线图像进行图像增强:首先使用中值滤波方法去除水文曲线内部噪点,然后对去除水文曲线内部噪点后的水文曲线图像进行膨胀操作,最后利用贴标签方法对膨胀操作后的水文曲线图像进行处理。
优选地,所述对倾斜校正后的坐标网格图像进行图像增强,具体是指:利用行列投影的方法去除坐标网格区域外的点以及网格内部的噪点。
优选地,所述利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合,具体方法如下:
首先根据单位网格宽度,对坐标网格图像进行横向等间隔划分,粗定位出每个整点时刻网格线的横坐标;对粗定位出的每个整点时刻网格线,找出位于其左、右两侧预设宽度范围内的水文曲线点,对找出的每一个水文曲线点,纵向扫描其上、下方预设高度范围内位于网格线上的点的个数num_blackpoint,num_blackpoint大于一预设阈值的水文曲线点构成该整点时刻网格线的交点区域点集,该交点区域点集的中心点即为该整点时刻网格线与水文曲线的交点;所有整点时刻网格线与水文曲线的交点构成网格线和水文曲线的整点时刻交点集合;
其中,所述预设宽度大于或等于5个像素且小于单位网格宽度;所述预设高度小于或等于3倍单位网格高度。
优选地,所述交点所处网格的上、下端线按照以下方法确定:在坐标网格图像中确定以该交点为中心,宽度为60像素,高度为2倍单位网格高度的邻域;对于所述邻域中的每一行,统计其中位于网格线上的点的数目Neighbor_blackpoint,并将Neighbor_blackpoint大于一预设阈值的行作为候选端线,如候选端线集合中存在两条或两条以上候选端线连续相邻的情况,则以这些连续相邻候选端线所包围区域的纵向等分线作为新的候选端线,替换这些连续相邻候选端线;位于交点上方的所有候选端线中距离交点最近的候选端线即为交点所处网格的上端线,位于交点下方的所有候选端线中距离交点最近的候选端线即为交点所处网格的下端线。
优选地,所述从上、下端线中确定交点所处网格的基线,具体方法如下:确定与交点所处网格纵向距离较近的水文曲线极值点,然后选择距离所述水文曲线极值点距离近的端线作为基线。
根据相同的发明思路还可以得到以下技术方案:
纸质水文资料的数字化装置,包括:
图像分割单元,用于从纸质水文资料的数字图像中提取出二值化的坐标网格图像、水文曲线图像;
倾斜校正单元,用于对坐标网格图像、水文曲线图像进行倾斜校正;
图像增强单元,用于分别对倾斜校正后的坐标网格图像、水文曲线图像进行图像增强,并计算出单位网格的大小;
交点搜索单元,利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合;
单位网格计算单元,用于扫描出水文曲线的最高点、最低点,结合给定的最高点、最低点所对应的水文数据,计算出单位网格对应的水文数据;
水文数据计算单元,用于对整点时刻交点集合中的每个交点,按照以下方法计算出其对应的水文数据:首先查找出交点所处网格的上、下端线,从上、下端线中确定交点所处网格的基线,并标定基线对应的基线水文数据;然后求出交点到基线的距离占上、下端线间距离的比例,并根据单位网格对应的水文数据,计算交点相对于基线的相对水文数据;根据基线对应的基线水文数据以及交点相对于基线的相对水文数据,得到交点所对应的水文数据。
优选地,所述图像增强单元包括坐标网格图像增强模块和水文曲线图像增强模块;水文曲线图像增强模块按照以下方法对倾斜校正后的水文曲线图像进行图像增强:首先使用中值滤波方法去除水文曲线内部噪点,然后对去除水文曲线内部噪点后的水文曲线图像进行膨胀操作,最后利用贴标签方法对膨胀操作后的水文曲线图像进行处理;坐标网格图像增强模块利用行列投影的方法去除坐标网格区域外的点以及网格内部的噪点。
优选地,所述交点搜索单元按照以下方法搜索出网格线和水文曲线的整点时刻交点集合:首先根据单位网格宽度,对坐标网格图像进行横向等间隔划分,粗定位出每个整点时刻网格线的横坐标;对粗定位出的每个整点时刻网格线,找出位于其左、右两侧预设宽度范围内的水文曲线点,对找出的每一个水文曲线点,纵向扫描其上、下方预设高度范围内位于网格线上的点的个数num_blackpoint,num_blackpoint大于一预设阈值的水文曲线点构成该整点时刻网格线的交点区域点集,该交点区域点集的中心点即为该整点时刻网格线与水文曲线的交点;所有整点时刻网格线与水文曲线的交点构成网格线和水文曲线的整点时刻交点集合;其中,所述预设宽度大于或等于5个像素且小于单位网格宽度;所述预设高度小于或等于3倍单位网格高度。
优选地,所述水文数据计算单元按照以下方法确定交点所处网格的上、下端线:
在坐标网格图像中确定以该交点为中心,宽度为60像素,高度为2倍单位网格高度的邻域;对于所述邻域中的每一行,统计其中位于网格线上的点的数目Neighbor_blackpoint,并将Neighbor_blackpoint大于一预设阈值的行作为候选端线,如候选端线集合中存在两条或两条以上候选端线连续相邻的情况,则以这些连续相邻候选端线所包围区域的纵向等分线作为新的候选端线,替换这些连续相邻候选端线;位于交点上方的所有候选端线中距离交点最近的候选端线即为交点所处网格的上端线,位于交点下方的所有候选端线中距离交点最近的候选端线即为交点所处网格的下端线。
优选地,所述水文数据计算单元按照以下方法从上、下端线中确定交点所处网格的基线:确定与交点所处网格纵向距离较近的水文曲线极值点,然后选择距离所述水文曲线极值点距离近的端线作为基线。
进一步地,所述质水文资料的数字化装置还包括用于获取纸质水文资料的数字图像的图像采集单元,以及用于存储水文数据计算单元所输出水文数据的数据库。
相比现有技术,本发明具有以下效果:
1.本发明能够快速准确地从纸质水文资料图像中提取出便于查询和分析的水文数据,大量节省了水文资料数字化的效率和成本;
2.本发明能够自动校正图像的倾斜并对图像进行增强,因此对纸质水位资料的图像采集要求不高;
3.本发明可由坐标网格和水文曲线准确完成曲线与网格的交点定位,并结合交点
所处网格的上下端线,从中选出基线,然后利用基线数据进行水文数据的计算,由于形变网格与非形变小网格所处的基线数据是一致的,从而有效减少了图像形变带来的不良影响,提高了数据提取的精度;
4.本发明结合交点在所处网格中的长度比例得到的相对数据以及基线的定标数据,间接地对交点所处的小网格进行了一定程度的校正,从而进一步提高了交点处的水文数据提取精度。
附图说明
图1为纸质水文资料图像的一个实例;
图2为本发明装置的工作流程示意图;
图3(a)、图3(b)分别为初步提取的坐标网格图像、水文曲线图像;
图4(a)、图4(b)分别为倾斜校正后的坐标网格图像、水文曲线图像;
图5(a)、图5(b)分别为图像增强后的水文曲线图像、坐标网格图像;
图6为提取交点所对应水文数据的原理示意图。
具体实施方式
下面结合附图对本发明的技术方案进行详细说明:
图1显示了纸质水文资料图像的一个实例。这类纸质资料上的水文数据进行数字化的过程中,主要依赖于图纸中的曲线,但是坐标图纸上仅仅含有曲线的轨迹并没有曲线的时时刻刻对应的数值,因此现有方法直接将这些纸质资料输入到计算机中归档,并不能得到每个时刻对应的具体数值。由图1可以看出这类纸质水文资料均是绘制在统一规格的网格图纸上,以纸质水位资料为例,其包含不同深浅的蓝紫色水文曲线,不同深浅橘红色的坐标网格,由粗细线条交织成的若干个网格,自上而下共有40个小格子,每个格子对应着一定的水位数据,而从左到右共有26个小格子,每个格子对应着不同的时间刻度,那么曲线与网格交点则对应着不同时刻的水文数据,即是本发明最终需要提取的数据。
本发明的数字化装置包括:图像分割单元、倾斜校正单元、图像增强单元、交点搜索单元、单位网格计算单元、水文数据计算单元,并可进一步包括用于获取纸质水文资料的数字图像的图像采集单元,以及用于存储水文数据计算单元所输出水文数据的数据库。图2显示了该装置的基本工作流程,主要包括以下步骤:步骤A、从纸质水文资料的数字图像中提取出二值化的坐标网格图像、水文曲线图像;
步骤B、对坐标网格图像、水文曲线图像进行倾斜校正;
步骤C、分别对倾斜校正后的坐标网格图像、水文曲线图像进行图像增强,并计算出单位网格的大小;
步骤D、利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合;
步骤E、扫描出水文曲线的最高点、最低点,结合给定的最高点、最低点所对应的水文数据,计算出单位网格对应的水文数据;
步骤F、对整点时刻交点集合中的每个交点,按照以下方法计算出其对应的水文数据:首先查找出交点所处网格的上、下端线,从上、下端线中确定交点所处网格的基线,并标定基线对应的基线水文数据;然后求出交点到基线的距离占上、下端线间距离的比例,并根据单位网格对应的水文数据,计算交点相对于基线的相对水文数据;根据基线对应的基线水文数据以及交点相对于基线的相对水文数据,得到交点所对应的水文数据;
步骤G、将所得到的数据导入数据库,即可利用数据库进行水文数据的查找分析操作。
为了便于公众理解,下面对本发明技术方案进行进一步详细说明。其中需要说明的是,本发明技术方案基于数字图像的处理技术,因此如无特别说明,则下文中所出现的点、行、列均指图像中的像素点、像素行、像素列。
1、坐标网格图像、水文曲线图像的分割:
为了后续水文数据的提取,需要先根据水文资料图像的特点,利用图像分割的方法
将其分割为二值化的坐标网格图像、水文曲线图像。本步骤可以采用现有的各种图像分割方法,但考虑到纸质水文资料图像的特点,本发明优选中国发明专利申请(公开号为103971367A,申请日为2014/4/28)中所公开的水文资料图像分割方法,可更准确地提取出二值化的坐标网格图像、水文曲线图像。图3(a)、图3(b)分别显示了采用该方法初步提取的坐标网格图像、水文曲线图像。
2、图像的倾斜校正:
水文资料记录的幅面通常较大,往往会导致所获取的图像出现不同程度的倾斜,因此有必要对图像进行倾斜校正。现有图像倾斜校正通常是采用霍夫(Hough)变换对图像的倾斜角度进行检测,并按照所检测出的倾斜角度进行对图像进行旋转校正。本发明同样采用霍夫变换的方法,但为了防止大幅面图像由于光照不均带来的扭曲,本发明利用霍夫变换获得坐标网格图像中心区域的倾斜角度,然后按照所述倾斜角度对坐标网格图像、水文曲线图像分别进行旋转校正。倾斜校正的具体过程如下:
(1)设定(ρ,θ),θ的变化范围为0°到180°,ρ的最大值为源图像对角线的长度,定义数组Count[]作为累加器,将数组中所有元素的初始化为0。
(2)对图像中心区域400*400的小区域中的每一个目标(黑色或者白色)像素点,假设此点在直角坐标系下的坐标(x,y),让θ在取值范围内依次发生变化并计算ρ=xcosθ+ysinθ,对于每个像素点对应的(ρ,θ),使得数组Count[]中的对应的第ρ×180+θ元素累加。
(3)对数组Count[]中的元素进行比较,取得其中元素最大的点(θmax,ρmax),即极坐标系下被曲线经过最多的点,也就是图像中含有点最多的直线,得到直线所要旋转的角度θmax。
(4)按照求出的倾斜角度θmax进行旋转操作,分别完成网格图像和水文曲线的倾斜校正。倾斜校正后的坐标网格图像、水文曲线图像的分别如4(a)和图4(b)所示。
3、图像增强:
初步分割出的坐标网格图像中会存在部分噪点,且在网格区域之外会残留一些无用信息,可能对后续的数据处理产生不良影响;初步分割出的水文曲线图像中的曲线内部会存在部分噪点,且曲线轨迹也容易产生少量缺失;因此,本发明分别对倾斜校正后的坐标网格图像、水文曲线图像进行图像增强。
本发明对水文曲线图像进行图像增强的具体方法如下:首先使用中值滤波方法去除水文曲线内部噪点,然后对去除水文曲线内部噪点后的水文曲线图像进行膨胀操作,最后利用贴标签方法对膨胀操作后的水文曲线图像进行处理。
本发明利用行列投影的方法对坐标网格图像进行图像增强,同时获得单位网格的大小。该方法具体如下:对坐标网格图像进行行列投影,对于投影数组的元素,满足一定阈值,求得网格图像所在边界,去除边界外的离散点,并由每两次扫描过程中,可以对相邻的网格线之间的不满足阈值的点进行删除,达到消除网格图像中小网格内部的噪声点,得到增强后的坐标网格图像;选择增强后坐标网格图像中心区域的行列投影,针对行列投影的数组元素,依次扫描与比较,找到满足一定阈值的数目以及起始位置,统计出单位网格的宽度Grid_W和高度Grid_H。所述增强后坐标网格图像中心区域的行列投影可按照以下方式确定:行投影的范围设置为[图像宽度中心-200,图像宽度中心+200]对应的行线条,列投影的范围设置为[图像高度中心-200,图像高度中心+200]对应的列线条,其中用于计算网格单位宽高的阈值为:行投影阈值设置为120,列投影阈值设为100。
图像增强后的水文曲线图像、坐标网格图像分别如图5(a)、图5(b)所示。
以上涉及的中值滤波、膨胀操作、贴标签、行列投影等均为成熟的数字图像处理技术,为节省篇幅,不在对其细节进行描述。
4、网格线和水文曲线的整点时刻交点定位:
获得各整点时刻的水文数据,则必须准确定位出图像中网格线和水文曲线的整点时刻交点。本发明采用以下方法进行交点定位:首先根据单位网格宽度,对坐标网格图像进行横向等间隔划分,粗定位出每个整点时刻网格线的横坐标;对粗定位出的每个整点时刻网格线,找出位于其左、右两侧预设宽度范围内的水文曲线点,对找出的每一个水文曲线点,纵向扫描其上、下方预设高度范围内位于网格线上的点的个数num_blackpoint,num_blackpoint大于一预设阈值的水文曲线点构成该整点时刻网格线的交点区域点集,该交点区域点集的中心点即为该整点时刻网格线与水文曲线的交点;所有整点时刻网格线与水文曲线的交点构成网格线和水文曲线的整点时刻交点集合;其中,所述预设宽度大于或等于5个像素且小于单位网格宽度;所述预设高度小于或等于3倍单位网格高度。
5、确定单位网格对应的水文数据:
首先在水文曲线图像中查找出水文曲线的最高和最低点坐标,然后根据查找得到的水文曲线峰值坐标位置,结合预先给定的峰值水位数据,得到每个网格对应的水文数据Unit_data。设用户预先输入的最高、最低点对应的水位数据分别为high、low,在水文曲线二值图像查找出对应最高、最低点坐标ph(xh,yh)和pl(xl,yl),根据下式即可得到单位网格对应的水文刻度数据Unit_data,即
6、交点处水文数据的计算:
对整点时刻交点集合中的每个交点,按照以下方法计算出其对应的水文数据:首先查找出交点所处网格的上、下端线,从上、下端线中确定交点所处网格的基线,并标定基线对应的基线水文数据;然后求出交点到基线的距离占上、下端线间距离的比例,并根据单位网格对应的水文数据,计算交点相对于基线的相对水文数据;根据基线对应的基线水文数据以及交点相对于基线的相对水文数据,得到交点所对应的水文数据。
本发明交点处水文数据的计算原理如图6所示,具体方法如下:
步骤1、查找出交点所处网格的上、下端线:
对交点cp所处的小网格进行分析,在一定邻域范围内对网格图像进行水平扫描,并统计每一行中位于网格线上的点的数目Neighbor_blackpoint;所述邻域为以交点为中心的小矩形区域,其长为2*Grid_H个像素,宽为60个像素;将Neighbor_blackpoint大于一预设阈值(例如可以选则20、30或40像素作为阈值)的行作为候选端线;如候选端线集合中存在两条或两条以上候选端线连续相邻的情况,则以这些连续相邻候选端线所包围区域的纵向等分线作为新的候选端线,替换这些连续相邻候选端线;位于交点cp上方的所有候选端线中距离交点cp最近的候选端线即为交点cp所处网格的上端线top,位于交点cp下方的所有候选端线中距离交点最近的候选端线即为交点所处网格的下端线bot。
步骤2、从上、下端线中确定交点所处网格的基线,并标定基线对应的基线水文数据:
交点cp所处网格的基线可随意选择上短线top或下端线bot,为了提高数据精度,特别的,本发明根据水文曲线极值点与上下端线之间的关系来选择基线,具体为:确定与交点cp所处网格纵向距离较近的水文曲线极值点(所述水文曲线极值点为水文曲线二值图像中最高和最低的两个点,分别对应当天水位或流量等水文数据的最大值和最小值),然后选择距离所述水文曲线极值点距离近的端线作为基线basic_point;
然后利用对应的极值点坐标和basic_point计算出极值点与基线之间的网格个数num,进一步计算出基线对应的水文数据base。不妨设对应的极值点纵坐标为pl,则base计算过程如下:
num=(yl-basic_point.y)//Grid_H;
此处//为整数除,basic_point.y为基线basic_point的y坐标;
base=(low//Unit_data+num)*Unit_data。
步骤3、求出交点到基线的距离占上、下端线间距离的比例,并根据单位网格对应的水文数据,计算交点相对于基线的相对水文数据:
交点cp到基线basic_poin的距离占上、下端线top、bot间距离的比例p的计算公式如下:
其中,dist()表示求距离运算;
则交点cp相对于基线basic_poin的相对水文数据δ=Unit_data×p。
步骤4、根据基线对应的基线水文数据以及交点相对于基线的相对水文数据,得到交点所对应的水文数据:对于交点cp而言,其所处网格的基线basic_poin的基线水文数据为base,cp相对于基线basic_poin的相对水文数据为δ,则交点cp所对应的水文数据为base+δ。
值得说明的是,由于纸质水文资料图像幅面过大,图像获取过程中会存在一定的形变,本发明利用交点所处网格的上下端线之间的长度比例,得到交点在单位网格中相对数据,提高了数据精度,避免直接使用单位像素的水位数据,并利用基线与极值点之间的网格数目,对小网格的基线进行数据标定,保证了形变小网格和非形变小网格对应的基线标定数据是一致的,因此能够大幅提高数据提取的精度。
实验结果表明,本发明能够对数码相机或扫描仪获取的水文资料图像进行自动地数字化分析,能够完成坐标图像和水位过程曲线图像的提取,并且能够得到交点及交点所处网格的上下端线,最终完成对纸质资料图像中水文数据的提取,且具有较高的精确度。
Claims (11)
1.纸质水文资料的数字化方法,利用计算机将纸质水文资料所记录的水文数据转化为可查询的数据库数据,其特征在于,包括以下步骤:
步骤A、从纸质水文资料的数字图像中提取出二值化的坐标网格图像、水文曲线图像;
步骤B、对坐标网格图像、水文曲线图像进行倾斜校正;
步骤C、分别对倾斜校正后的坐标网格图像、水文曲线图像进行图像增强,并计算出单位网格的大小;
步骤D、利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合;
步骤E、扫描出水文曲线的最高点、最低点,结合给定的最高点、最低点所对应的水文数据,计算出单位网格对应的水文数据;
步骤F、对整点时刻交点集合中的每个交点,按照以下方法计算出其对应的水文数据:首先查找出交点所处网格的上、下端线,从上、下端线中确定交点所处网格的基线,并标定基线对应的基线水文数据,所述从上、下端线中确定交点所处网格的基线,具体方法如下:确定与交点所处网格纵向距离较近的水文曲线极值点,然后选择距离所述水文曲线极值点距离近的端线作为基线;然后求出交点到基线的距离占上、下端线间距离的比例,并根据单位网格对应的水文数据,计算交点相对于基线的相对水文数据;根据基线对应的基线水文数据以及交点相对于基线的相对水文数据,得到交点所对应的水文数据。
2.如权利要求1所述纸质水文资料的数字化方法,其特征在于,所述对坐标网格图像、水文曲线图像进行倾斜校正,其方法具体如下:利用霍夫变换获得坐标网格图像中心区域的倾斜角度,然后按照所述倾斜角度对坐标网格图像、水文曲线图像分别进行旋转校正。
3.如权利要求1所述纸质水文资料的数字化方法,其特征在于,按照以下方法对倾斜校正后的水文曲线图像进行图像增强:首先使用中值滤波方法去除水文曲线内部噪点,然后对去除水文曲线内部噪点后的水文曲线图像进行膨胀操作,最后利用贴标签方法对膨胀操作后的水文曲线图像进行处理。
4.如权利要求1所述纸质水文资料的数字化方法,其特征在于,所述对倾斜校正后的坐标网格图像进行图像增强,具体是指:利用行列投影的方法去除坐标网格区域外的点以及网格内部的噪点。
5.如权利要求1所述纸质水文资料的数字化方法,其特征在于,所述利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合,具体方法如下:
首先根据单位网格宽度,对坐标网格图像进行横向等间隔划分,粗定位出每个整点时刻网格线的横坐标;对粗定位出的每个整点时刻网格线,找出位于其左、右两侧预设宽度范围内的水文曲线点,对找出的每一个水文曲线点,纵向扫描其上、下方预设高度范围内位于网格线上的点的个数num_blackpoint,num_blackpoint大于一预设阈值的水文曲线点构成该整点时刻网格线的交点区域点集,该交点区域点集的中心点即为该整点时刻网格线与水文曲线的交点;所有整点时刻网格线与水文曲线的交点构成网格线和水文曲线的整点时刻交点集合;
其中,所述预设宽度大于或等于5个像素且小于单位网格宽度;所述预设高度小于或等于3倍单位网格高度。
6.如权利要求1所述纸质水文资料的数字化方法,其特征在于,所述交点所处网格的上、下端线按照以下方法确定:
在坐标网格图像中确定以该交点为中心,宽度为60像素,高度为2倍单位网格高度的邻域;对于所述邻域中的每一行,统计其中位于网格线上的点的数目Neighbor_blackpoint,并将Neighbor_blackpoint大于一预设阈值的行作为候选端线,如候选端线集合中存在两条或两条以上候选端线连续相邻的情况,则以这些连续相邻候选端线所包围区域的纵向等分线作为新的候选端线,替换这些连续相邻候选端线;位于交点上方的所有候选端线中距离交点最近的候选端线即为交点所处网格的上端线,位于交点下方的所有候选端线中距离交点最近的候选端线即为交点所处网格的下端线。
7.纸质水文资料的数字化装置,其特征在于,包括:
图像分割单元,用于从纸质水文资料的数字图像中提取出二值化的坐标网格图像、水文曲线图像;
倾斜校正单元,用于对坐标网格图像、水文曲线图像进行倾斜校正;
图像增强单元,用于分别对倾斜校正后的坐标网格图像、水文曲线图像进行图像增强,并计算出单位网格的大小;
交点搜索单元,利用增强后的坐标网格图像、水文曲线图像,搜索出网格线和水文曲线的整点时刻交点集合;
单位网格计算单元,用于扫描出水文曲线的最高点、最低点,结合给定的最高点、最低点所对应的水文数据,计算出单位网格对应的水文数据;
水文数据计算单元,用于对整点时刻交点集合中的每个交点,按照以下方法计算出其对应的水文数据:首先查找出交点所处网格的上、下端线,从上、下端线中确定交点所处网格的基线,并标定基线对应的基线水文数据,所述水文数据计算单元按照以下方法从上、下端线中确定交点所处网格的基线:确定与交点所处网格纵向距离较近的水文曲线极值点,然后选择距离所述水文曲线极值点距离近的端线作为基线;然后求出交点到基线的距离占上、下端线间距离的比例,并根据单位网格对应的水文数据,计算交点相对于基线的相对水文数据;根据基线对应的基线水文数据以及交点相对于基线的相对水文数据,得到交点所对应的水文数据。
8.如权利要求7所述纸质水文资料的数字化装置,其特征在于,所述图像增强单元包括坐标网格图像增强模块和水文曲线图像增强模块;水文曲线图像增强模块按照以下方法对倾斜校正后的水文曲线图像进行图像增强:首先使用中值滤波方法去除水文曲线内部噪点,然后对去除水文曲线内部噪点后的水文曲线图像进行膨胀操作,最后利用贴标签方法对膨胀操作后的水文曲线图像进行处理;坐标网格图像增强模块利用行列投影的方法去除坐标网格区域外的点以及网格内部的噪点。
9.如权利要求7所述质水文资料的数字化装置,其特征在于,所述交点搜索单元按照以下方法搜索出网格线和水文曲线的整点时刻交点集合:
首先根据单位网格宽度,对坐标网格图像进行横向等间隔划分,粗定位出每个整点时刻网格线的横坐标;对粗定位出的每个整点时刻网格线,找出位于其左、右两侧预设宽度范围内的水文曲线点,对找出的每一个水文曲线点,纵向扫描其上、下方预设高度范围内位于网格线上的点的个数num_blackpoint,num_blackpoint大于一预设阈值的水文曲线点构成该整点时刻网格线的交点区域点集,该交点区域点集的中心点即为该整点时刻网格线与水文曲线的交点;所有整点时刻网格线与水文曲线的交点构成网格线和水文曲线的整点时刻交点集合;
其中,所述预设宽度大于或等于5个像素且小于单位网格宽度;所述预设高度小于或等于3倍单位网格高度。
10.如权利要求7所述质水文资料的数字化装置,其特征在于,所述水文数据计算单元按照以下方法确定交点所处网格的上、下端线:
在坐标网格图像中确定以该交点为中心,宽度为60像素,高度为2倍单位网格高度的邻域;对于所述邻域中的每一行,统计其中位于网格线上的点的数目Neighbor_blackpoint,并将Neighbor_blackpoint大于一预设阈值的行作为候选端线,如候选端线集合中存在两条或两条以上候选端线连续相邻的情况,则以这些连续相邻候选端线所包围区域的纵向等分线作为新的候选端线,替换这些连续相邻候选端线;位于交点上方的所有候选端线中距离交点最近的候选端线即为交点所处网格的上端线,位于交点下方的所有候选端线中距离交点最近的候选端线即为交点所处网格的下端线。
11.如权利要求7~10任一项所述质水文资料的数字化装置,其特征在于,还包括用于获取纸质水文资料的数字图像的图像采集单元,以及用于存储水文数据计算单元所输出水文数据的数据库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510388835.3A CN106326818B (zh) | 2015-06-30 | 2015-06-30 | 纸质水文资料的数字化方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510388835.3A CN106326818B (zh) | 2015-06-30 | 2015-06-30 | 纸质水文资料的数字化方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106326818A CN106326818A (zh) | 2017-01-11 |
CN106326818B true CN106326818B (zh) | 2019-10-15 |
Family
ID=57728274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510388835.3A Active CN106326818B (zh) | 2015-06-30 | 2015-06-30 | 纸质水文资料的数字化方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106326818B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107625519B (zh) * | 2017-09-20 | 2020-09-08 | 武汉中旗生物医疗电子有限公司 | 心电图处理方法及装置 |
CN111738208A (zh) * | 2020-07-16 | 2020-10-02 | 江苏省气象信息中心 | 关于气象自记纸中轨迹提取的方法 |
CN113052975A (zh) * | 2020-09-23 | 2021-06-29 | 视伴科技(北京)有限公司 | 一种优化模型的方法及装置 |
CN113359216A (zh) * | 2021-06-03 | 2021-09-07 | 山东捷瑞数字科技股份有限公司 | 用于翻斗式雨量计记录数据识别的方法、系统和存储介质 |
CN113436117B (zh) * | 2021-08-03 | 2022-11-25 | 东莞理工学院 | 一种基于图像识别的水文长序列数据提取方法 |
CN115409825B (zh) * | 2022-09-06 | 2023-09-12 | 重庆众仁科技有限公司 | 一种基于图像识别的温湿压迹线识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102038498A (zh) * | 2011-01-20 | 2011-05-04 | 天津理工大学 | 一种纸质心电图数字化方法 |
CN102521428A (zh) * | 2011-11-15 | 2012-06-27 | 西北农林科技大学 | 一种水电站电气一次部分cad系统及其设计方法 |
CN103971367A (zh) * | 2014-04-28 | 2014-08-06 | 河海大学 | 水文资料图像分割方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7424137B2 (en) * | 2003-04-24 | 2008-09-09 | A.M.P.S. L.L.C. | Method and system for converting paper ECG printouts to digital ECG files |
-
2015
- 2015-06-30 CN CN201510388835.3A patent/CN106326818B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102038498A (zh) * | 2011-01-20 | 2011-05-04 | 天津理工大学 | 一种纸质心电图数字化方法 |
CN102521428A (zh) * | 2011-11-15 | 2012-06-27 | 西北农林科技大学 | 一种水电站电气一次部分cad系统及其设计方法 |
CN103971367A (zh) * | 2014-04-28 | 2014-08-06 | 河海大学 | 水文资料图像分割方法 |
Non-Patent Citations (2)
Title |
---|
水文年鉴数字化研究;肖卫等;《水生态学杂志》;20110731;第149-151页 * |
记录图纸中ECG曲线数字化的方法研究;王志成等;《华中科技大学学报 自然科学版》;20031031;第8-9页 * |
Also Published As
Publication number | Publication date |
---|---|
CN106326818A (zh) | 2017-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106326818B (zh) | 纸质水文资料的数字化方法及装置 | |
Chen et al. | Multiscale grid method for detection and reconstruction of building roofs from airborne LiDAR data | |
Chen et al. | Isolating individual trees in a savanna woodland using small footprint lidar data | |
CN109840553B (zh) | 耕地作物类型的提取方法及系统、存储介质、电子设备 | |
CN105608222A (zh) | 一种大规模栅格数据集的瓦片金字塔快速构建方法 | |
CN103218787A (zh) | 多源异构遥感影像控制点自动采集方法 | |
CN101672915A (zh) | 一种高空间分辨率遥感影像树冠轮廓勾绘系统及方法 | |
CN114611834B (zh) | 一种基于多维特征分析的电力发电站选址评估规划方法 | |
Yadav et al. | Identification of trees and their trunks from mobile laser scanning data of roadway scenes | |
Uhl et al. | Towards the automated large-scale reconstruction of past road networks from historical maps | |
CN104820826B (zh) | 一种基于数字高程模型的坡形提取与识别方法 | |
CN112819066A (zh) | 一种Res-UNet单木树种分类技术 | |
CN107657618A (zh) | 基于遥感影像和地形数据的区域尺度侵蚀沟自动提取方法 | |
Cheng et al. | Extracting urban areas in China using DMSP/OLS nighttime light data integrated with biophysical composition information | |
CN106960029A (zh) | 一种提取跨图幅地理范围分幅栅格数据的方法 | |
CN106324708B (zh) | 雨量记录图纸的数字化方法、装置 | |
Yang et al. | Extracting buildings from airborne laser scanning point clouds using a marked point process | |
CN109635828A (zh) | 一种生态保护红线区典型地理国情要素提取系统及方法 | |
CN110728691B (zh) | 一种基于多时相水边线的海岸线自动判别方法 | |
Zhu et al. | Research on deep learning individual tree segmentation method coupling RetinaNet and point cloud clustering | |
Yan et al. | Quality analysis on ransac-based roof facets extraction from airborne lidar data | |
CN105930459B (zh) | 一种有效的基于内容的人体皮肤图像分类检索方法 | |
CN106652032B (zh) | 一种基于Linux集群平台的DEM并行等高线生成方法 | |
CN114694022A (zh) | 一种基于球形邻域的多尺度多特征算法的语义分割方法 | |
Tang et al. | Accuracy test of point-based and object-based urban building feature classification and extraction applying airborne LiDAR data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |