发明内容
鉴于以上内容,有必要提供一种实现图档拟合的数据处理设备,能够快速从图档中识别和提取图元及文字信息,从而提高图档数据提取的效率及准确性。
一种实现图档拟合的数据处理设备,该数据处理设备包括存储器及处理器。该存储器用于存储图档拟合系统、图档设计系统及标准文字信息。该处理器用于运行存储的图档拟合系统,以执行以下步骤:(i1)接收图档设计系统设计的待识别的图档;(i2)从存储器中接收标准文字信息;(i3)根据接收的标准文字信息生成标准文字库;(i4)从接收的图档中提取文字或图元;(i5)根据标准文字库对提取的文字进行拟合,并根据图元方程限定的标准图元对提取的图元进行拟合,以输出与标准文字或图元匹配的文字或图元。其中,在保证步骤i1于步骤i4之前执行,且步骤i2于步骤i3之前执行的情况下,步骤i1、i2、i3及i4之间的执行顺序可以调整。
此外,还有必要提供一种实现图档拟合的方法,能够快速从图档中识别和提取图元及文字信息,从而提高图档数据提取的效率及准确性。
一种实现图档拟合的方法,适用于装置有图档设计系统的数据处理设备。该方法包括步骤:(a)接收图档设计系统设计的待识别的图档;(b)从数据处理设备的存储器中接收标准文字信息;(c)根据接收的标准文字信息生成标准文字库;(d)从接收的图档中提取文字或图元;(e)根据标准文字库对提取的文字进行拟合,并根据图元方程限定的标准图元对提取的图元进行拟合,以输出与标准文字或图元匹配的文字或图元。其中,在保证步骤a于步骤d之前执行,且步骤b于步骤c之前执行的情况下,步骤a、b、c及d之间的执行顺序可以调整。
此外,还有必要提供一种实现图档拟合的系统,能够快速从图档中识别和提取图元及文字信息,从而提高图档数据提取的效率及准确性。
一种实现图档拟合的系统,该系统运行于装置有图档设计系统的数据处理设备。该系统按照如下步骤运行:(f1)接收图档设计系统设计的待识别的图档;(f2)从数据处理设备的存储器中接收标准文字信息;(f3)根据接收的标准文字信息生成标准文字库;(f4)从接收的图档中提取文字或图元;(f5)根据标准文字库对提取的文字进行拟合,并根据图元方程限定的标准图元对提取的图元进行拟合,以输出与标准文字或图元匹配的文字或图元。其中,在保证步骤f1于步骤f4之前执行,且步骤f2于步骤f3之前执行的情况下,步骤f1、f2、f3及f4之间的执行顺序可以调整。
相较现有技术,本发明根据标准文字库及标准图元,对从图档中提取的文字与图元采用最小二乘法拟牛顿迭代公式进行最佳拟合迭代,实现了图元及文字的快速识别及准确提取,从而提高了图档数据提取的效率及准确性。
具体实施方式
如图1所示,是本发明图档拟合系统较佳实施例的运行环境图。该图档拟合系统13运行于计算机1中。该计算机1还包括图档设计系统12、处理器10、存储器11及显示器15。该图档设计系统12用于进行图档的设计操作,例如,可以是CAD(computer aided design,计算机辅助设计)系统。在本实施例中,该图档拟合系统13作为一个单独运行的程序系统为图档设计系统12设计的图档进行拟合;在本发明的其他实施例中,该图档拟合系统13还可以作为图档设计系统12的一个程序模块,为图档设计系统12设计的图档进行拟合。该显示器15用于显示图档设计系统12设计的图档,及显示图档拟合系统13的图档拟合结果。
在本实施例中,该存储器11用于存储该图档拟合系统13、图档设计系统12及标准文字信息;在本发明的其他实施例中,该图档拟合系统13、图档设计系统12及标准文字信息存储在不同的存储器中。
对本领域的技术人员来说,可以显而易见的知悉如下内容:该计算机1仅是一个较佳的技术手段,其显然容易被其他任意适用的数据处理设备(例如:服务器、机器人等)所等效替换。
以下是结合本实施例逐步实现对图档进行拟合的内容,即:该处理器10运行该图档拟合系统13对图档设计系统12设计的图档进行拟合的内容。
如图2所示,是本发明图档拟合方法较佳实施例的具体实施流程图。
步骤S10,接收图档设计系统12设计的待识别的图档。
步骤S11,从存储器11中接收标准文字信息。在本实施例中,所述标准文字信息指的是103个键盘符组成的ASCII码(American Standard Code for Information Interchange,美国信息互换标准代码);在本发明的其他实施例中,所述标准文字信息还可包括其他任意适用的文字信息。
步骤S12,根据接收的标准文字信息生成标准文字库。本步骤的详细信息见下文关于图3的描述部分。
步骤S13,从接收的图档中提取文字或图元。本步骤的详细信息见下文关于图5的描述部分。
步骤S15,根据标准文字库对提取的文字进行拟合,并根据图元方程限定的标准图元对提取的图元进行拟合,以输出与标准文字或图元匹配的文字或图元。本步骤的详细信息见下文关于图6的描述部分。
步骤S16,对文字或图元的拟合结果进行纠错。在本实施例中,步骤S16进一步包括步骤:找出与所有标准文字或图元都不匹配的文字或图元,及/或找出与多个标准文字或图元匹配的文字或图元;根据找出的文字或图元生成一个错误列表;将生成的错误列表输出至显示器15上进行显示。
如图3所示,是图2中步骤S12的细化流程图。在本实施例中,图2中步骤S12进一步包括:
步骤S120,采用固定边长的正方形格子方式分割标准文字。如图4所示,标准文字A被用正方形格子方式进行了分割,每一个格子表示一个像素点。
步骤S121,提取分割后的标准文字有效点的坐标。如图4所示,标准文字A被分割后,在像素点中,黑色表示有效点,白色表示无效点。
步骤S122,根据提取的有效点坐标及其与标准文字的对应关系生成标准文字库。
如图5所示,是图2中步骤S13的细化流程图。在本实施例中,图2中步骤S13进一步包括:
步骤S130,对接收的图档分盒子。具体说来,步骤S130包括:获取图档的包围盒;获取包围盒的最远点和最近点;通过等分步长并根据获取的最远点及最近点,将包围盒分割成多个正方形的小格子。
步骤S131,根据分盒子,找出所有相交的线段,并对所有相交的线段分组输出。具体说来,步骤S131包括:1、将图档的坐标原点作为起始点开始搜索,以找出一条线段S1;2、将线段S1加入到相交列表(List)中,从所有分盒子限定的线段中搜索与List中线段相交的线段并添加到List中;3、直到找不到与List中线段相交的线段为止,将List中的线段组成线段组输出;4、清空List并将List中线段的最远点作为起始点向后继续搜索,在找到一条线段后重复执行步骤2、3及4,或者,在找不到线段后结束。在本实施例中,每一个输出的线段组代表一个文字或图元,组成一个文字或图元的线段相互之间必定具有特定相交关系,即:组成一个文字或图元的任意一条线段必定与组成该文字或图元的至少一条其他线段相连。
如图6所示,是图2中步骤S15的细化流程图。对文字或图元的拟合分为精拟合和粗拟合,在本实施例中,对待拟合的文字或图元采用了粗拟合和精拟合两种方式,在本发明的其他实施例中,对待拟合的文字或图元可以单独采用粗拟合或精拟合。所述粗拟合指的是只选取待拟合的文字或图元的部分有效点进行迭代拟合(例如:每隔一个固定数量的有效点选取一个有效点,或者,选取待拟合的文字或图元的某个部分的所有有效点);所述精拟合指的是选取待拟合的文字或图元的所有有效点进行迭代拟合。
在本实施例中,图2中步骤S15进一步包括:
步骤S150,预设一个迭代函数的精度值、一个相似度公差标准值及一个迭代步长D,并选取一个待拟合的文字或图元。
步骤S151,对选取的文字或图元的有效点进行选取,计算选取的文字或图元相对于一个标准文字或图元的迭代函数值。在本实施例中,选取的文字或图元相对于每一个标准文字或图元都有一个迭代函数值,且对于每一个标准文字或图元的迭代函数值都分别执行下述各步骤。在本实施例中,该迭代函数如下:
其中,X1代表的是选取的所有有效点的X轴坐标矩阵,Y1代表的是选取的所有有效点的Y轴坐标矩阵,Z1代表的是选取的所有有效点的Z轴坐标矩阵;X2代表的是该标准文字或图元中与选取的有效点对应的点的X轴坐标矩阵,Y2代表的是该标准文字或图元中与选取的有效点对应的点的Y轴坐标矩阵,Z2代表的是该标准文字或图元中与选取的有效点对应的点的Z轴坐标矩阵。
步骤S152,分析计算的迭代函数F(X)值是否大于预设的精度值。
若计算的迭代函数F(X)值小于或等于预设的精度值,则转入执行下述步骤S157;或者,若计算的迭代函数F(X)值大于预设的精度值,则转入执行下述步骤S153。
步骤S153,用最小二乘法拟牛顿迭代公式迭代F(X),以使得F(X)值最小。
步骤S154,分析是否有最小的F(X)值。
若有最小的F(X)值,则转入执行下述步骤S155;或者,若没有最小的F(X)值,则转入执行下述步骤S157。
步骤S155,根据预设的迭代步长D对选取的文字或图元的有效点进行空间平移,并根据平移后的有效点计算出对应的迭代函数F(X+1)值。
步骤S156,分析F(X+1)值是否小于F(X)值。
若F(X+1)值小于F(X)值,则返回执行步骤S153;或者,若F(X+1)值大于或等于F(X)值,则返回执行步骤S155。
步骤S157,输出当前F(X)值,并根据预设的相似度公差标准值,对选取的文字或图元,及当前F(X)值对应的标准文字或图元进行相似度公差检查。相似度公差检查包括:若选取的文字或图元及当前F(X)值对应的标准文字或图元的相似度公差小于或等于预设的相似度公差标准值,则判定选取的文字或图元与当前F(X)值对应的标准文字或图元匹配;若选取的文字或图元及当前F(X)值对应的标准文字或图元的相似度公差大于预设的相似度公差标准值,则判定选取的文字或图元与当前F(X)值对应的标准文字或图元不匹配。
步骤S158,分析是否还有待拟合的文字或图元没有拟合。
若还有待拟合的文字或图元没有拟合,则转入执行上述步骤S150;或者,若所有待拟合的文字或图元都已经拟合,则转入执行下述步骤S159。
步骤S159,输出与标准文字或图元匹配的文字或图元。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。