CN113192195B - 一种受损地形坐标数据的修复方法 - Google Patents

一种受损地形坐标数据的修复方法 Download PDF

Info

Publication number
CN113192195B
CN113192195B CN202110460271.5A CN202110460271A CN113192195B CN 113192195 B CN113192195 B CN 113192195B CN 202110460271 A CN202110460271 A CN 202110460271A CN 113192195 B CN113192195 B CN 113192195B
Authority
CN
China
Prior art keywords
sample
class
distance
samples
text object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110460271.5A
Other languages
English (en)
Other versions
CN113192195A (zh
Inventor
陆非
李文军
赵远翔
翟蔚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changjiang Institute of Survey Planning Design and Research Co Ltd
Original Assignee
Changjiang Institute of Survey Planning Design and Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changjiang Institute of Survey Planning Design and Research Co Ltd filed Critical Changjiang Institute of Survey Planning Design and Research Co Ltd
Priority to CN202110460271.5A priority Critical patent/CN113192195B/zh
Publication of CN113192195A publication Critical patent/CN113192195A/zh
Application granted granted Critical
Publication of CN113192195B publication Critical patent/CN113192195B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/05Geographic models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/30Assessment of water resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Geometry (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供一种受损地形坐标数据的修复方法,包括:首先在图纸上遍历找到所有的文本对象,对每个文本对象生成特征向量,形成样本集合;然后根据定义的样本特征距离规则,对所有样本进行聚类,将类间距离小的类合并,成为一个新的类,重复此操作,直到满足停止条件,最终获得若干个样本类;针对样本类中的若干个样本,根据特征值进行排序,然后合并成一个文本对象,用这个文本对象替换原始的若干个文本对象。本发明可以正确处理高程文字拆分成多个,包括三个以上文本对象的场景,也可以处理多个不同的文本对象相互干扰的情况,也能处理含有少量损坏数据的图纸,并且能快速实现大量受损地形坐标数据的修复,提高工作效率。

Description

一种受损地形坐标数据的修复方法
技术领域
本发明涉及地形坐标数据处理技术领域,具体是一种受损地形坐标数据的修复方法。
背景技术
三维地形坐标数据(平面X表示精度,Y坐标表示维度,高程Z坐标表示海拔高度)是测绘测量领域最基础的研究对象。比如在地理信息系统中要建立数字高程模型,需要从原始的地形测绘图中获取三维地形坐标数据,然后导入到GIS软件中生成。在河道演变分析过程中,要从河道的地形测绘图中提取三维坐标数据,然后导入到surfer等软件中生成数字高程模型。由此可见,作为基础的研究对象,地形坐标数据的精度对于保证研究成果的质量至关重要。
在实际的操作中,以河道地形测绘图为例,测绘部门提供的图纸一般是CAD电子文件,地形坐标数据一般存储在CAD的某一图层(比如实测点层)上的Text文字对象中。操作人员通过VBA,ObjectArx等CAD二次开发手段可以提取文字的位置(Text对象的位置属性)和内容(Z坐标,比如字符串“-15.73”),通过把文字的内容转成数字(比如C语言提供的strtod函数),就可以得到地形坐标数据的三个标量数据。但是在实际操作中,经常会遇到损坏的图纸,具体表现为实测点层中一个原本完整的高程文字(比如“-15.73”),在实际获取中返回三个文字对象,分别是整数部分(“-15”),小数点部分(“.”)和小数部分(“73”).在这种情况下,如果按原来的方法简单的获取文字,就会获得高程值为-15和73的两个坐标数据,与真实的高程值-15.73相去甚远,给后续的工作带来隐患。有的情况下,原始完整的高程文字比如“-15.73”,在实际获取中,会返回更多的文字对象,分别是“-”,“1”,“5”,“.”,“7”,“3”,离真实的高程值相差更远。
目前遇到这种情况的解决办法有几种。一,将图纸转成图片格式,然后用OCR方式识别里面的文字,然后转成数字,最后再人工在图纸上修改。这种方法有很大的不确定性,OCR在不同的图层叠加下很难转成正确的文字。二,人工在CAD图纸上直接修改。比如删除上述实例中三个文字对象中的后面两个,直接将第一个文字对象的内容修改为“-15.73”。上述两种办法都需要很大的人工成本,特别是图纸问题数据成千上万的时候,可能要花费数天之久。
中国发明专利《一种受损地形坐标数据的自动化匹配及高精度修复方法》(申请号:202010009076.6)提出了一种自动化匹配和修复方法,但是其存在一定局限性。第一,处理对象范围有限。以原始高程文字为“-15.73”为例,如果拆分成“-15”,“.”,“73”三个文本对象可以处理,但是如果拆分成“-”,“1”,“5”,“.”,“7”,“3”五个文本对象,则无法处理。第二,处理条件比较简单,只是按照文字和点之间的平面距离作为判断标准。如图1所示,在处理“2014.5896”和“2015.1234”两个高程文字中的小数点时,两个高程文字拆分的文字对象互相干扰,会重复选取“2015”和“1234”两个文本对象,忽视掉“2014”和“5896”两个文本对象。第三,要求选择集至少有五个文本对象,对于损坏数据小于5的图纸无法处理;有时候图纸数量很多,但是单个图纸的损坏数据并不多。
发明内容
为解决上述现有技术中的缺陷,本发明提供一种受损地形坐标数据的修复方法。
本发明是采用如下技术方案实现的:
一种受损地形坐标数据的修复方法,其特征在于:包括如下步骤:首先在图纸上遍历找到所有的文本对象,对每个文本对象生成特征向量,形成样本集合;然后根据定义的样本特征距离规则,对所有样本进行聚类,将类间距离小的类合并,成为一个新的类,重复此操作,直到满足停止条件,最终获得若干个样本类;针对样本类中的若干个样本,根据特征值进行排序,然后合并成一个文本对象,用这个文本对象替换原始的若干个文本对象。
进一步的,所述方法具体步骤如下:
步骤一、创建文本对象集合:遍历图纸的所有文本对象,如果文本对象的内容可以生成数字或者小数点,则添加到文本对象集合中;
步骤二、遍历文本对象集合中的所有文本对象,对每个文本对象,创建一个样本i,取属性位置
Figure BDA0003042164080000031
方向向量
Figure BDA0003042164080000032
旋转角度
Figure BDA0003042164080000033
包围盒
Figure BDA0003042164080000034
以及高度(height)作为样本特征,生成特征向量
Figure BDA0003042164080000035
即一个样本用一个特征向量表示,最终得到样本集合X=[x1,x2,...,xN];
步骤三、对样本集合进行聚类:针对给定的样本,根据特征的距离,将其归并到若干个类,一个类是样本的一个子集;
步骤四、遍历类的集合,对每个类中所有样本进行排序,排序规则基于方向向量和位置,对排序后的样本进行合并,最终得到结果类的集合,每个类中含有一个样本,删除输入的文本对象集合,根据结果生成新的文本对象集合。
进一步的,所述步骤三对样本集合进行聚类的具体过程为:
(1)输入n个样本组成的样本集合;
(2)计算n个样本之间的样本距离dij,得到矩阵D=[dij]n×n
(3)构造n个类,每个类只包含一个样本,这样得到类的集合;
(4)定义类间距离为两个类之间所有样本的样本距离中最短距离,定义类间距离的阈值,计算类集合中所有类互相之间的类间距离,假如两个类的类间距离小于阈值,则将这两个类合并成一个新的类;
(5)重复执行步骤(4),直至没有新的类合并发生,最终得到类的集合。
进一步的,所述步骤(4)中的阈值设为0.25。
进一步的,步骤四中排序的比较值为方向向量和位置XY向量的点积,用公式表达为:
ci=cosα*Xi+sinα*Yi
其中,α是文本对象的旋转角度,Xi是文本对象位置在X轴上的值,Yi是文本对象i位置在Y轴上的值。
进一步的,所述步骤三中求样本i和样本j之间的样本距离,具体步骤为:
(1)获取样本i和样本j包围框的各四个点,从样本i的包围框的四个点中取一个点,再从样本j的包围框四个点中取一个点,组成一对,即获得16对点的集合;
(2)在上述点的集合中寻找距离最近的一对点,分别为点Pi(Xpi,Ypi)和Pj(Xpj,Ypj),Xpi是点Pi在X轴上的值,Ypi是点Pi在Y轴上的值,Xpj是点Pj在X轴上的值,Ypj是点Pj在Y轴上的值;
(3)由样本i的旋转角度α,定义样本i的轴线为经过点Pi,旋转角度为α的直线,直线公式为:
y=tgα*(x-Xpi)+Ypi
(4)获得Pj到轴线的纵向距离为dvertical=|sinα*Xpj-cosα*Ypj-sinα*Xpi+cosα*Ypi|;
(5)点Pi到Pj的直线距离
Figure BDA0003042164080000041
因为ddirect 2=dvertical 2+dhorizon 2,得到Pj到Pi沿轴线的横向距离
Figure BDA0003042164080000042
(6)定义样本距离为:
Figure BDA0003042164080000043
其中khor是计算沿着轴线横向距离的经验因子,kv是计算沿着轴线纵向距离的经验因子,kr是计算旋转角度之间差值的经验因子,dr是两个样本旋转角度之间的差值,kh是计算样本高度差的经验因子,dh是两个样本高度之间的差值。
进一步的,khor、kr、kh均设为1,kv设为10。
本发明可以正确处理高程文字拆分成多个,包括三个以上文本对象的场景,也可以处理多个不同的文本对象相互干扰的情况,也能处理含有少量损坏数据的图纸,并且能快速实现大量受损地形坐标数据的修复,提高工作效率。
附图说明
图1为本发明实施例中含有受损地形坐标数据的图纸;
图2为本发明实施例中部分示例代码截图;
图3为本发明实施例中部分示例代码截图;
图4为本发明实施例中部分示例代码截图;
图5为本发明实施例中文本对象包围框和轴线的示意图;
图6为本发明实施例的运行效果图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种受损地形坐标数据的修复方法,其是在CAD二次开发平台上完成的。一般主流的CAD都支持二次开发,比如AutoCAD可以通过lisp,vba,或者ActiveX接口进行二次开发。本次实例是在国产CAD ZWCAD的平台上演示,采用的编程语言是C#。所述方法具体包括如下步骤:
首先在图纸上遍历找到所有的文本对象,对每个文本对象生成特征向量,形成样本集合;然后根据定义的样本特征距离规则,对所有样本进行聚类,将类间距离小的类合并,成为一个新的类,重复此操作,直到满足停止条件,最终获得若干个样本类;针对样本类中的若干个样本,根据特征值进行排序,然后合并成一个文本对象,用这个文本对象替换原始的若干个文本对象。具体流程是:
步骤一、创建文本对象集合。遍历图纸的所有文本对象,如果文本对象的内容可以生成数字,或者是小数点的,则添加到文本对象集合中。如图1所示,原本有三个文本对象,分别是“2016.4321”,“2014.5896”和“2015.1234”。但因为某种原因,变成了11个文本对象,“2016.4321”拆分成了“2016”,“.”,“4321”三个文本对象。“2014.5896”拆分成了“2014”,“.”,“5”,“8”,“9”,“6”六个文本对象,“2015.1234”拆分成了“2015”,“.”,“1234”三个文本对象。一共有12个文本对象。
步骤二、遍历文本对象集合中的所有文本对象,对每个文本对象,创建一个样本i,取属性位置
Figure BDA0003042164080000061
方向向量
Figure BDA0003042164080000062
旋转角度
Figure BDA0003042164080000063
包围盒
Figure BDA0003042164080000064
高度(height)作为样本特征,生成特征向量
Figure BDA0003042164080000065
即一个样本用一个特征向量表示,最终得到样本集合X=[x1,x2,...,xN]。如图2所示。
步骤三、对样本集合进行聚类。聚类是针对给定的样本,根据特征的距离,将其归并到若干个类,一个类是样本的一个子集。聚类算法的具体流程是:
(1)输入n个样本组成的样本集合;
(2)计算n个样本之间的样本距离dij,如图3所示,得到矩阵D=[dij]n×n
(3)构造n个类,每个类只包含一个样本,这样得到类的集合;
(4)定义类间距离为两个类之间所有样本的样本距离中最短距离,定义类间距离的阈值,计算类集合中所有类互相之间的类间距离,假如两个类的类间距离小于阈值,则将这两个类合并成一个新的类,如图4所示。这里的阈值设为0.25。
(5)重复执行步骤(4),直至没有新的类合并发生,最终得到类的集合。类中每个样本之间的欧氏距离都小于阈值,但是类和类之间的类间距离大于阈值。
步骤四、遍历类的集合,在每个类中对所有样本进行排序,排序规则基于方向向量和位置,对排序后的若干个样本进行合并,最终得到一个文本对象。特别的,排序的比较值为方向向量和位置XY向量的点积,用公式表达为
ci=cosα*Xi+sinα*Yi
其中,α是文本对象的旋转角度,可以从文本对象的属性中得到。Xi是文本对象位置在X轴上的值,Yi是文本对象i位置在Y轴上的值。
所述步骤三中求样本i和样本j之间的样本距离的方法是:
(1)获取样本i和样本j包围框的各四个点,从样本i的包围框的四个点中取一个点,再从样本j的包围框四个点中取一个点,组成一对,这样获得16对点的集合;
(2)在上述点的集合中寻找距离最近的一对点,分别为点Pi(Xpi,Ypi)和Pj(Xpj,Ypj),Xpi是点Pi在X轴上的值,Ypi是点Pi在Y轴上的值,Xpj是点Pj在X轴上的值,Ypj是点Pj在Y轴上的值;
(3)由样本i的旋转角度α,定义样本i的轴线为经过点Pi,旋转角度为α的直线,直线公式为:
y=tgα*(x-Xpi)+Ypi
(4)获得Pj到轴线的纵向距离为dvertical=|sinα*Xpj-cosα*Ypj-sinα*Xpi+cosα*Ypi|;
(5)点Pi到Pj的直线距离
Figure BDA0003042164080000071
因为ddirect 2=dvertical 2+dhorizon 2,可以得到Pj到Pi沿轴线的横向距离
Figure BDA0003042164080000072
(6)定义样本距离为
Figure BDA0003042164080000081
其中khor是计算沿着轴线横向距离的经验因子,kv是计算沿着轴线纵向距离的经验因子,kr是计算旋转角度之间差值的经验因子,dr是两个样本旋转角度之间的差值,kh是计算样本高度差的经验因子,dh是两个样本高度之间的差值。dhorizon需要做归一化,可以除于所有样本的包围盒的长度或宽度。dvertical的归一化和dhorizon一样处理。dr的归一化可以除以2*pi。dh的归一化可以除以所有样本的最大高度。
在实例中,为了突出纵向上的距离,khor,kr,kh都设为1,kv设为10。虽然“2014.5896”的小数点P的距离离“2015.1234”拆分的几个文本对象毕竟近,但是“2015.1234”并不在点P的轴线上,并且高度也不一致。所以最终计算样本距离的时候,“2015.1234”与点P的样本距离,比“2014”或者“5”的样本距离要小。
最终程序仿真结果如图6所示,可见成功的将拆分的文本对象按照上述算法合并起来。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何属于本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (4)

1.一种受损地形坐标数据的修复方法,其特征在于:包括如下步骤:首先在图纸上遍历找到所有的文本对象,对每个文本对象生成特征向量,形成样本集合;然后根据定义的样本特征距离规则,对所有样本进行聚类,将类间距离小的类合并,成为一个新的类,重复此操作,直到满足停止条件,最终获得若干个样本类;针对样本类中的若干个样本,根据特征值进行排序,然后合并成一个文本对象,用这个文本对象替换原始的若干个文本对象;
所述方法具体步骤如下:
步骤一、创建文本对象集合:遍历图纸的所有文本对象,如果文本对象的内容可以生成数字或者小数点,则添加到文本对象集合中;
步骤二、遍历文本对象集合中的所有文本对象,对每个文本对象,创建一个样本i,取属性位置
Figure FDA0003585824400000011
方向向量
Figure FDA0003585824400000012
旋转角度
Figure FDA0003585824400000013
包围盒
Figure FDA0003585824400000014
以及高度作为样本特征,生成特征向量
Figure FDA0003585824400000015
即一个样本用一个特征向量表示,最终得到样本集合X=[x1,x2,...,xN];
步骤三、对样本集合进行聚类:针对给定的样本,根据特征的距离,将其归并到若干个类,一个类是样本的一个子集;
步骤四、遍历类的集合,对每个类中所有样本进行排序,排序规则基于方向向量和位置,对排序后的样本进行合并,最终得到结果类的集合,每个类中含有一个样本,删除输入的文本对象集合,根据结果生成新的文本对象集合;
所述步骤三对样本集合进行聚类的具体过程为:
(1)输入n个样本组成的样本集合;
(2)计算n个样本之间的样本距离dij,得到矩阵D=[dij]n×n
(3)构造n个类,每个类只包含一个样本,这样得到类的集合;
(4)定义类间距离为两个类之间所有样本的样本距离中最短距离,定义类间距离的阈值,计算类集合中所有类互相之间的类间距离,假如两个类的类间距离小于阈值,则将这两个类合并成一个新的类;
(5)重复执行步骤(4),直至没有新的类合并发生,最终得到类的集合;
所述步骤三中求样本i和样本j之间的样本距离,具体步骤为:
(1)获取样本i和样本j包围框的各四个点,从样本i的包围框的四个点中取一个点,再从样本j的包围框四个点中取一个点,组成一对,即获得16对点的集合;
(2)在上述点的集合中寻找距离最近的一对点,分别为点Pi(Xpi,Ypi)和Pj(Xpj,Ypj),Xpi是点Pi在X轴上的值,Ypi是点Pi在Y轴上的值,Xpj是点Pj在X轴上的值,Ypj是点Pj在Y轴上的值;
(3)由样本i的旋转角度α,定义样本i的轴线为经过点Pi,旋转角度为α的直线,直线公式为:
y=tgα*(x-Xpi)+Ypi
(4)获得Pj到轴线的纵向距离为dvertical=|sinα*Xpj-cosα*Ypj-sinα*Xpi+cosα*Ypi|;
(5)点Pi到Pj的直线距离
Figure FDA0003585824400000021
因为ddirect 2=dvertical 2+dhorizon 2,得到Pj到Pi沿轴线的横向距离
Figure FDA0003585824400000022
(6)定义样本距离为:
Figure FDA0003585824400000023
其中khor是计算沿着轴线横向距离的经验因子,kv是计算沿着轴线纵向距离的经验因子,kr是计算旋转角度之间差值的经验因子,dr是两个样本旋转角度之间的差值,kh是计算样本高度差的经验因子,dh是两个样本高度之间的差值。
2.如权利要求1所述的受损地形坐标数据的修复方法,其特征在于:所述步骤(4)中的阈值设为0.25。
3.如权利要求1所述的受损地形坐标数据的修复方法,其特征在于:步骤四中排序的比较值为方向向量和位置XY向量的点积,用公式表达为:
ci=cosα*Xi+sinα*Yi
其中,α是文本对象的旋转角度,Xi是文本对象位置在X轴上的值,Yi是文本对象i位置在Y轴上的值。
4.如权利要求1所述的受损地形坐标数据的修复方法,其特征在于:kho、kr、kh均设为1,kv设为10。
CN202110460271.5A 2021-04-27 2021-04-27 一种受损地形坐标数据的修复方法 Active CN113192195B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110460271.5A CN113192195B (zh) 2021-04-27 2021-04-27 一种受损地形坐标数据的修复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110460271.5A CN113192195B (zh) 2021-04-27 2021-04-27 一种受损地形坐标数据的修复方法

Publications (2)

Publication Number Publication Date
CN113192195A CN113192195A (zh) 2021-07-30
CN113192195B true CN113192195B (zh) 2022-05-17

Family

ID=76979458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110460271.5A Active CN113192195B (zh) 2021-04-27 2021-04-27 一种受损地形坐标数据的修复方法

Country Status (1)

Country Link
CN (1) CN113192195B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111144114A (zh) * 2019-12-19 2020-05-12 广联达科技股份有限公司 一种文本识别方法及装置
CN111241221A (zh) * 2020-01-06 2020-06-05 长江勘测规划设计研究有限责任公司 一种受损地形坐标数据的自动化匹配及高精度修复方法
WO2020228706A1 (zh) * 2019-05-15 2020-11-19 腾讯科技(深圳)有限公司 基于围栏地址的坐标数据处理方法、装置和计算机设备
EP3754549A1 (en) * 2019-06-17 2020-12-23 Sap Se A computer vision method for recognizing an object category in a digital image

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020228706A1 (zh) * 2019-05-15 2020-11-19 腾讯科技(深圳)有限公司 基于围栏地址的坐标数据处理方法、装置和计算机设备
EP3754549A1 (en) * 2019-06-17 2020-12-23 Sap Se A computer vision method for recognizing an object category in a digital image
CN111144114A (zh) * 2019-12-19 2020-05-12 广联达科技股份有限公司 一种文本识别方法及装置
CN111241221A (zh) * 2020-01-06 2020-06-05 长江勘测规划设计研究有限责任公司 一种受损地形坐标数据的自动化匹配及高精度修复方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于标签路径聚类的文本信息抽取算法;刘云峰;《计算机工程》;20100620(第12期);第89-90,93页 *
基于类间距离参数估计的文本聚类评价方法;郑军等;《计算机工程》;20090505(第09期);第43-45,48页 *

Also Published As

Publication number Publication date
CN113192195A (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
JP3822277B2 (ja) 文字テンプレートセット学習マシン動作方法
CN111046462A (zh) 一种室外建筑设计用图纸展示系统及方法
CN110110729B (zh) 基于u形cnn模型实现遥感图像的建筑实例掩模提取方法
JPH05500874A (ja) ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法
CN113343740B (zh) 表格检测方法、装置、设备和存储介质
CN112990183B (zh) 离线手写汉字同名笔画提取方法、系统、装置
Sohn et al. An implicit regularization for 3D building rooftop modeling using airborne lidar data
Galvanin et al. Extraction of building roof contours from LiDAR data using a Markov-random-field-based approach
CN111681300B (zh) 轮廓素描线组成的目标区域获取方法
US10762377B2 (en) Floating form processing based on topological structures of documents
CN112949455B (zh) 一种增值税发票识别系统及方法
CN112119397A (zh) 使用机器学习的管道及仪表流程图信息的分类
CN113239818A (zh) 基于分割和图卷积神经网络的表格图像跨模态信息提取方法
CN113657377B (zh) 一种机打票据图像结构化识别方法
Gavrilov et al. A method for aircraft labeling in aerial and satellite images based on continuous morphological models
CN113192195B (zh) 一种受损地形坐标数据的修复方法
CN113642542B (zh) 基于位置约束的手写汉字同名笔画提取方法
Heitzler et al. A modular process to improve the georeferencing of the Siegfried map
CN111402256B (zh) 一种基于模板的三维点云目标检测和姿态估计方法
Frischknecht et al. A raster-based approach for the automatic interpretation of topographic maps
Vasin et al. Increasing the effectiveness of intelligent information technology for producing digital graphic documents with weakly formalized description of objects
Vasin et al. Geometric modeling of raster images of documents with weakly formalized description of objects
Laumer et al. A Semi-automatic Label Digitization Workflow for the Siegfried Map
CN115761279B (zh) 空间布局相似性检测方法、设备、存储介质及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant