CN111400524B - 一种基于ai的可变尺度地质图文本矢量化方法及系统 - Google Patents
一种基于ai的可变尺度地质图文本矢量化方法及系统 Download PDFInfo
- Publication number
- CN111400524B CN111400524B CN202010145454.3A CN202010145454A CN111400524B CN 111400524 B CN111400524 B CN 111400524B CN 202010145454 A CN202010145454 A CN 202010145454A CN 111400524 B CN111400524 B CN 111400524B
- Authority
- CN
- China
- Prior art keywords
- text
- grid
- image
- scale
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/56—Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
本发明提供了一种基于AI的可变尺度地质图文本矢量化方法及系统,其中,方法包括:获取可变尺度格栅地质图,并构建图像素材集合;基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像;基于多尺度可分割目标检测算法,对输出的格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息;基于词向量表示算法对输出的文本格栅信息进行矢量化识别,输出与文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息;将文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统。提高了地质图文本信息提取的体验。
Description
技术领域
本发明涉及人工智能技术领域,特别涉及一种基于AI的可变尺度地质图文本矢量化方法及系统。
背景技术
在地质图领域,由于存在大量的素材,有大量的地理信息,其主要呈现形式又以文本字符为主,图像本身背景复杂、光照与角度多变,加之文本语种繁多、字体尺度方向等多变,最终导致检测与识别精度难以达到应用的需求。
而针对格栅地质图的文本信息提取与检索,目前还没有比较系统的方案能够对现有的地质图进行妥善、精确地处理语文本信息提取,普遍都是依靠人力进行查询与操作,也没有一个产品对地质图进行有效的格栅化处理并提取矢量化的文本信息,无法全面和系统的获取到完成对地质图从格栅化到最后文本信息提取的全部处理过程。
因此,需要提出基于格栅的文本矢量化检索方法,解决上述问题。
发明内容
本发明提供一种基于AI的可变尺度地质图文本矢量化方法及系统,用以解决现有技术中图像本身背景复杂、光照与角度多变,加之文本语种繁多、字体尺度方向等多变,而导致检测与识别精度难以达到实际应用的需求的缺陷。
本发明实施例提供一种基于AI的可变尺度地质图文本矢量化方法,包括:
获取可变尺度格栅地质图,并构建图像素材集合;
基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像;
基于多尺度可分割目标检测算法,对输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息;
基于词向量表示算法对输出的所述文本格栅信息进行矢量化识别,输出与所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息;
将文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统。
优选地,所述获取可变尺度格栅地质图,并构建图像素材集合之后包括:
按照预设比例,对所述图像素材集合进行分类处理,获得若干分类子集合;
对不同所述分类子集合中的每张格栅地质图建立与之同名的预设文件,为文本矢量化检索做准备。
优选地,所述基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像的步骤包括:
根据文本走向水平或者沿同一方向倾斜的格栅地质图,确定第一参考坐标系,并基于倾斜校正方法,对文本走向水平或者沿同一方向倾斜的格栅地质图进行水平校正,并输出;
根据文本走向不一的格栅地质图,动态建立若干个第二参考坐标系,实现对文本走向不一的格栅地质图的动态校正,并输出;
其中,基于所述第一参考坐标系和第二参考坐标系的两个轴向长度,确定所述格栅图像对应的文本区域的分割范围。
优选地,所述基于多尺度可分割目标检测算法,对输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息的步骤包括:
基于多尺度可分割目标检测算法,对输出的所述格栅图像进行动态分割;
对动态分割后的所述格栅图像中的格栅文本进行定位,获得所述格栅文本对应的文本区域的中心位置坐标;
基于多尺度可分割目标检测算法输出的长方形区域,将所述中心位置坐标对应的栅格文本的格栅化图像区域与周围背景进行分割;
提取格栅化图像区域中的格栅文本,并输出文本格栅信息。
优选地,所述基于词向量表示算法对输出的所述文本格栅信息进行矢量化识别,输出与所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息的步骤包括:
建立卷积层,获取CNN算法,并提取所述CNN算法中的特征序列标签;
基于提取的特征序列标签,对所述图像素材集合进行特征检测,得到输入的图像特征序列检测结果;
建立循环层,获取双向LSTM算法,并基于卷积层的CNN算法和输入的图像特征序列检测结果,提取所述双向LSTM算法中的特征序列标签的预测结果,获得所述图像素材集合的标签分布,并根据标签分布将格栅文本从所述图像素材集合中逐帧分离并提取;
建立转录层,获取CTC算法,并基于循环层的双向LSTM算法和分离并提取的格栅文本,提取所述CTC算法中的重整和标签分布输出,获得词向量表示算法;
基于所述词向量表示算法,对输出的所述文本格栅信息进行矢量化识别,并输出所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息。
优选地,提取所述CTC算法中的重整和标签分布输出,获得词向量表示算法的步骤包括:
对分离并提取的所述格栅文本的文本格栅信息与标签分布输出进行拼接复原和纠正处理;
通过词向量匹配,将已识别出的格栅文本与词向量词库中的标准词语进行匹配校正,得到校正后的连贯文本矢量化内容,进而获得词向量表示算法。
优选地,将文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统的过程中,还包括:
提取文本元素简介为标签,并从文本素材中提取文本元素,输入到所述非关系型数据库;
基于文本元素,提取格栅化文本数据为标签,并从格栅图像中提取格栅文本所在的N个位置元素,并将所述N个位置元素输入到所述非关系型数据库;
同时,基于所述非关系型数据库将输入的数据信息实时异步复制到M个备份数据库中,并相互校验;
其中,所述非关系型数据库还实时同步输入的数据信息到全文检索引擎;
当所述全文检索引擎实时同步之后,还接收目标用户输入的检索词;
所述全文检索引擎根据接收的检索词,返回检索结果并进行展示,同时,供所述目标用户查看。
本发明实施例提供一种基于AI的可变尺度地质图文本矢量化系统,包括:
导入模块,用于导入可变尺度格栅地质图,并构建图像素材集合;
校正模块,用于基于动态参考坐标系,对所述导入模块构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像;
文本定位提取模块,用于基于多尺度可分割目标检测算法,对所述校正模块输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息;
文本矢量化模块,用于基于词向量表示算法对所述定位提取模块输出的所述文本格栅信息进行矢量化识别,输出所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息;
构建模块,用于将所述识别模块输出的文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统。
本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现一种基于AI的可变尺度地质图文本矢量化方法的构建步骤。
本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现一种基于AI的可变尺度地质图文本矢量化方法的构建步骤。
本申请的有益效果是:通过应用基于人工智能的一系列算法,对地质图进行格栅化处理并对其各个特征进行提取和整合,基于提取整合的结果将地质图格栅化,文本矢量化,并通过构建地质图格栅化与文本矢量化数据库,很好地提高了地质图文本信息提取的体验。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例提供的一种基于AI的可变尺度地质图文本矢量化方法的流程图;
图2为本发明实施例提供的格栅地质图倾斜角度校正部分体系结构图;
图3为本发明实施例提供的对目标图像中格栅文本进行定位、提取与将含文本区域和背景图像进行分割的流程图;
图4为本发明实施例提供对格栅化文本信息进行矢量化的流程示意图;
图5为本发明实施例提供的一种基于AI的可变尺度地质图文本矢量化系统的流程图;
图6为本发明实施例提供的系统ER图;
图7为本发明实施例提供的格栅地质图文本数据库构建系统的结构图;
图8为本发明实施例提供的电子设备的结构框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
为了解决现有技术中对格栅化地质图文本提取不够系统和准确,难以批量操作的问题,本发明实施例提出了一种基于AI的可变尺度地质图文本矢量化方法及系统,其中,方法是基于人工智能技术进行的可变尺度格栅地质图文本检索,且通过采用多坐标系图像校正技术校正图像,很好的对格栅化地质图进行校正。
针对可变尺度格栅地质图文本矢量化检索方法,研究可变尺度可分割目标检测技术,研究基于卷积神经网络与循环神经网络的格栅地质图文本的特征提取技术,构建基于词向量表示算法的文本栅格信息进行矢量化识别方法;构建可变尺度格栅地质图文本库,实现格栅化地质图中文本矢量化及其位置信息的高效提取与检索。
本发明实施例提供一种基于AI的可变尺度地质图文本矢量化方法,如图1所示,包括:
步骤S1:获取可变尺度格栅地质图,并构建图像素材集合;
步骤S2:基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像;
步骤S3:基于多尺度可分割目标检测算法,对输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息;
步骤S4:基于词向量表示算法对输出的所述文本格栅信息进行矢量化识别,输出与所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息;
步骤S5:将文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统。
具体地,在步骤S1中,首先获取一定数量的可变尺度格栅地质图的素材集合,基于该集合来进行后续的处理和构建步骤;
在步骤S2中,基于可变尺度格栅地质图素材集合进行初步的分类,分为大、中、小三种不同的比例尺度的子集合,并对子集合中的每个图像做倾斜角度校正,输出水平走向的格栅图像;
在步骤S3中,引入多尺度可分割目标检测算法对输出的格栅图像进行处理,对格栅图像中的格栅文本进行定位和提取,输出文本格栅信息,其中,文本可以为中文、英文和数字。
在步骤S4中,基于词向量表示算法对输出的文本格栅信息进行矢量化,通过一系列图像和文本处理过程,得到文本矢量与其对应的坐标点信息整理结果;
在步骤S5中,将步骤S4中得到的文本矢量及其对应的坐标点信息结果保存至非关系型的数据库,同时导入全文检索引擎,完成可变尺度格栅地质图文本检索系统的构建。
上述技术方案的有益效果是:通过对可变尺度的格栅地质图进行角度校正,并对其中的文本矢量和对应坐标点进行了提取,基于提取整合的结果构建了系统的可变尺度格栅地质图文本检索数据库,很好地提高了可变尺度格栅地质图文本矢量批量提取的体验。
本发明实施例提供一种文本矢量化检索方法,所述获取可变尺度格栅地质图,并构建图像素材集合之后包括:
按照预设比例,对所述图像素材集合进行分类处理,获得若干分类子集合;
对不同所述分类子集合中的每张格栅地质图建立与之同名的预设文件,为文本矢量化检索做准备。
上述按照预设比例,是将图像素材集合中的栅格地质图按照比例尺度大致分为3类分类子集合,分别为:大比例尺图像集、中比例尺图像集、小比例尺图像集;
且为每一张图像建立一个与之同名的Xml文件,为后续矢量化文本录入和检索做好准备。
具体地,为了实现对图像素材集合的进一步分类,本发明实施例使用地质图的比例尺度来进行分类,读取格栅地质图标识的比例尺,并依据地质图像素数量与比例尺间的对比关系,将图像素材集合大致分为三种:大比例尺图像集、中比例尺图像集、小比例尺图像集,以便后续对不同比例尺的格栅地质图进行有针对性地处理,输出对应的处理结果。
上述技术方案的有益效果是:通过对图像素材集合进行初始分类,便于后续进行图像倾斜角度校正时进行更加针对有效的图像处理模型的建立,进而更准确地对格栅地质图中的格栅文本进行定位与提取。
本发明实施例提供一种基于AI的可变尺度地质图文本矢量化方法,所述基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像的步骤包括:
根据文本走向水平或者沿同一方向倾斜的格栅地质图,确定第一参考坐标系,并基于倾斜校正方法,对文本走向水平或者沿同一方向倾斜的格栅地质图进行水平校正,并输出;
根据文本走向不一的格栅地质图,动态建立若干个第二参考坐标系,实现对文本走向不一的格栅地质图的动态校正,并输出;
其中,基于所述第一参考坐标系和第二参考坐标系的两个轴向长度,确定所述格栅图像对应的文本区域的分割范围。
具体地,针对分为三种不同大小比例尺的分类子集合中的地质图,进行了如下校正处理:
如图2所示,开发了基于不同比例尺的格栅化地质图校正程序,该程序有效集成了现有数据按照比例尺分类、对不清晰的地质图提供图像增强处理、根据具体图像具体情况,确定图像中文本走向趋势,并根据不同走向趋势选择不同的处理方式,提供了现有格栅地质图按照不同比例尺进行分类储存、不同文本走向类型图像按照不同方式处理并提供了将处理后的格栅地质图储存的功能,促进了混乱、无序、清晰度不一的格栅地质图向有序、文本及数据显示较为清晰、文本按一定走向校正后的标准格栅地质图数据转变。
上述技术方案的有益效果是:便于促进了混乱、无序、清晰度不一的格栅地质图向有序、文本及数据显示较为清晰、文本按一定走向校正后的标准格栅地质图数据转变。
本发明实施例提供一种基于AI的可变尺度地质图文本矢量化方法,所述基于多尺度可分割目标检测算法,对输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息的步骤包括:
基于多尺度可分割目标检测算法,对输出的所述格栅图像进行动态分割;
对动态分割后的所述格栅图像中的格栅文本进行定位,获得所述格栅文本对应的文本区域的中心位置坐标;
基于多尺度可分割目标检测算法输出的长方形区域,将所述中心位置坐标对应的栅格文本的格栅化图像区域与周围背景进行分割;
提取格栅化图像区域中的格栅文本,并输出文本格栅信息。
具体地,如图3所示,该技术体系对经过清晰度补正、文本走向校正的格栅地质图的分割、对分割后的格栅地质图片段中文本信息的定位、对定位的文本区域中心点的确定、通过目标检测算法输出的长方形区域将格栅文本与周围背景进行分割,最后将分割后的含有文本区域的图像及其位置信息保存并输出。此处,目标检测算法采用CNN算法+区域建议网络结构进行构建。
其中,CNN算法的全称叫ConvolutionalNeuralNetwork,通过在CNN的特征图上密集的移动窗口来检测文本行;
首先,针对图像中的像素计算某些局部特征;
然后,假设单个字符内所使用特征的方差很小,运用连通分量分析将具有相似条件的像素连接形成字符,可以初步检测到文本信息;
再使用区域建议网络对初步检测出的含文本信息的文字区域进行识别,确定含有文字的区间的中心点,并检测目标区域文本的倾斜度,如果水平,则不作处理,如果有一定的倾斜角度,则设置多个锚点并建立相应的动态坐标系,通过锚点间配合进行旋转、扩展等调整,将目标坐标系向预设的文本识别坐标系调整,确定含文本的格栅化图像区域,将其从背景中分割出来,输出含有文本区域的图像数据及其位置信息,以便于之后的文本矢量化操作。
可以理解的是,采用直接得到的文本区域图像与其所在的长方形区域四个端点位置信息直接储存进入数据库,能够妥善的保存信息,并完整的保存含文本长方形图像区域与其位置信息之间的关联,有利于之后的处理与最终结果的输出。
上述技术方案的有益效果是:通过格栅化图像区域与背景的分割,且通过确定文本区域的图像数据及其位置信息,以便于之后的文本矢量化操作。
本发明实施例提供一种基于AI的可变尺度地质图文本矢量化方法,如图4所示,所述基于词向量表示算法对输出的所述文本格栅信息进行矢量化识别,输出与所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息的步骤包括:
建立卷积层,获取CNN算法,并提取所述CNN算法中的特征序列标签;
基于提取的特征序列标签,对所述图像素材集合进行特征检测,得到输入的图像特征序列检测结果;
建立循环层,获取双向LSTM算法,并基于卷积层的CNN算法和输入的图像特征序列检测结果,提取所述双向LSTM算法中的特征序列标签的预测结果,获得所述图像素材集合的标签分布,并根据标签分布将格栅文本从所述图像素材集合中逐帧分离并提取;
建立转录层,获取CTC算法,并基于循环层的双向LSTM算法和分离并提取的格栅文本,提取所述CTC算法中的重整和标签分布输出,获得词向量表示算法;
基于所述词向量表示算法,对输出的所述文本格栅信息进行矢量化识别,并输出所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息。
优选地,提取所述CTC算法中的重整和标签分布输出,获得词向量表示算法的步骤包括:
对分离并提取的所述格栅文本的文本格栅信息与标签分布输出进行拼接复原和纠正处理;
通过词向量匹配,将已识别出的格栅文本与词向量词库中的标准词语进行匹配校正,得到校正后的连贯文本矢量化内容,进而获得词向量表示算法。
上述技术方案的有益效果是:通过使用词向量表示算法,对从图像中提取文本进行矢量化识别和标识,便于准确从图像中提取文本。
本发明实施例提供一种基于AI的可变尺度地质图文本矢量化方法,将文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统的过程中,还包括:
提取文本元素简介为标签,并从文本素材中提取文本元素,输入到所述非关系型数据库;
基于文本元素,提取格栅化文本数据为标签,并从格栅图像中提取格栅文本所在的N个位置元素,并将所述N个位置元素输入到所述非关系型数据库;
同时,基于所述非关系型数据库将输入的数据信息实时异步复制到M个备份数据库中,并相互校验;
其中,所述非关系型数据库还实时同步输入的数据信息到全文检索引擎;
当所述全文检索引擎实时同步之后,还接收目标用户输入的检索词;
所述全文检索引擎根据接收的检索词,返回检索结果并进行展示,同时,供所述目标用户查看。
其中,N为4,M为2。
具体地,如图5所示,首先提取格栅地质图中的矢量化文本为标签,同时从格栅化地质图中提取文本位置信息,一同输入到非关系型的数据库;
本发明实施例采用的可以是MongoDB数据库,该数据库会实时同步数据至全文检索引擎,即ElasticSearch,用户在查询的时,通过输入检索词,进行检索词分词,进入ElasticSearch检索,ElasticSearch全文检索引擎返回包括搜索文本、文本位置信息在内的一组检索结果进行展示,供用户查看。
如图6所示,展示了格栅地质图文本检索数据库中矢量化文本信息的各分量。
此处,MongoDB数据库是一个基于分布式的,开源的,应用于文档数据信息存储的非关系型数据库,在所有非关系型数据库中拥有最丰富功能,同时和关系型数据库极其相似。
MongoDB在C++编程环境下编写,其目的在于处理巨量数据时能够提供较高的可靠性与过程稳定性。
Elasticsearch,提供了一个基于RESTfulWeb接口分布式多用户能力的全文搜索引擎,使用Java开发的基于Lucene的实时分布式搜索引擎。目前,Elasticsearch遵照Apache许可条款作为开放源码发布,是当前较为流行的企业级搜索引擎。
本发明实施例获取的地质图是通过用户导入获取的,且经过后台的可变尺度格栅化文本矢量提取系统进行文本矢量和位置信息的提取,由数据库结合搜索引擎进行全局搜索。实践证明,通过构建全局检索引擎,系统能够提供百万数据级别的快速精准检索需求,检索时间小于3s。
且基于上述任一实施例,本发明实施例采用的软硬件处理环境为:超算服务器1台,逻辑CPU80个,内存500G,GPU3个,硬盘容量7T;
安装Anaconda环境,引入kears架构为基础,辅以Sklearn、OpenCV等算法库,用于地质图校正算法运行;
调用kears架构中卷积神经网络、循环神经网络,用于构建文本信息提取和含文本区域分割;
引入区域结构建议网络结构,用于对提取的文本进行矢量化处理;
安装jdk1.8,MongoDB4.0.10,ElasticSearch6.4.3,用于构建可变尺度格栅地质图文本识别系统。
本发明实施例提供一种基于AI的可变尺度地质图文本矢量化系统,如图7所示,包括:
导入模块71,用于导入可变尺度格栅地质图,并构建图像素材集合;
校正模块72,用于基于动态参考坐标系,对所述导入模块构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像;
文本定位提取模块73,用于基于多尺度可分割目标检测算法,对所述校正模块输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息;
文本矢量化模块74,用于基于词向量表示算法对所述定位提取模块输出的所述文本格栅信息进行矢量化识别,输出所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息;
构建模块75,用于将所述识别模块输出的文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统。
本发明实施例提供的系统用于执行上述对应的方法,其具体的实施方式与方法的实施方式一致,涉及的算法流程与对应的方法算法流程相同,此处不再赘述。
在一个实施例中,还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述一种基于AI的可变尺度地质图文本矢量化方法中的任一构建步骤。
如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(CommunicationsInterface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行如下方法:获取原始文本素材集合;将所述原始文本素材集合进行分类,得到文本素材集合和图片素材集合;基于词向量表示算法对文本素材集合进行分类和提取关键信息,输出文本素材整理结果;基于图像语义分割算法对图片素材集合进行分类和特征提取,输出图片素材整理结果;将文本素材整理结果和图片素材整理结果保存至非关系型数据库,并导入全文检索引擎,构建文本素材库。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
在一个实施例中,还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述一种基于AI的可变尺度地质图文本矢量化方法中的任一的构建步骤。
本发明实施例提供的一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:
处理器(processor)810、通信接口(CommunicationsInterface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行如下方法:获取原始文本素材集合;将所述原始文本素材集合进行分类,得到文本素材集合和图片素材集合;基于词向量表示算法对所述文本素材集合进行分类和提取关键信息,输出文本素材整理结果;基于图像语义分割算法对所述图片素材集合进行分类和特征提取,输出图片素材整理结果;将所述文本素材整理结果和所述图片素材整理结果保存至非关系型数据库,并导入全文检索引擎,构建文本素材库。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,包括:
获取可变尺度格栅地质图,并构建图像素材集合;
基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像;
基于多尺度可分割目标检测算法,对输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息;
基于词向量表示算法对输出的所述文本格栅信息进行矢量化识别,输出与所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息;
将文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统。
2.根据权利要求1所述的一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,所述获取可变尺度格栅地质图,并构建图像素材集合之后包括:
按照预设比例,对所述图像素材集合进行分类处理,获得若干分类子集合;
对不同所述分类子集合中的每张格栅地质图建立与之同名的预设文件,为文本矢量化检索做准备。
3.根据权利要求1所述的一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,所述基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像的步骤包括:
根据文本走向水平或者沿同一方向倾斜的格栅地质图,确定第一参考坐标系,并基于倾斜校正方法,对文本走向水平或者沿同一方向倾斜的格栅地质图进行水平校正,并输出;
根据文本走向不一的格栅地质图,动态建立若干个第二参考坐标系,实现对文本走向不一的格栅地质图的动态校正,并输出;
其中,基于所述第一参考坐标系和第二参考坐标系的两个轴向长度,确定所述格栅图像对应的文本区域的分割范围。
4.根据权利要求1所述的一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,所述基于多尺度可分割目标检测算法,对输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息的步骤包括:
基于多尺度可分割目标检测算法,对输出的所述格栅图像进行动态分割;
对动态分割后的所述格栅图像中的格栅文本进行定位,获得所述格栅文本对应的文本区域的中心位置坐标;
基于多尺度可分割目标检测算法输出的长方形区域,将所述中心位置坐标对应的栅格文本的格栅化图像区域与周围背景进行分割;
提取格栅化图像区域中的格栅文本,并输出文本格栅信息。
5.根据权利要求1所述的一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,所述基于词向量表示算法对输出的所述文本格栅信息进行矢量化识别,输出与所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息的步骤包括:
建立卷积层,获取CNN算法,并提取所述CNN算法中的特征序列标签;
基于提取的特征序列标签,对所述图像素材集合进行特征检测,得到输入的图像特征序列检测结果;
建立循环层,获取双向LSTM算法,并基于卷积层的CNN算法和输入的图像特征序列检测结果,提取所述双向LSTM算法中的特征序列标签的预测结果,获得所述图像素材集合的标签分布,并根据标签分布将格栅文本从所述图像素材集合中逐帧分离并提取;
建立转录层,获取CTC算法,并基于循环层的双向LSTM算法和分离并提取的格栅文本,提取所述CTC算法中的重整和标签分布输出,获得词向量表示算法;
基于所述词向量表示算法,对输出的所述文本格栅信息进行矢量化识别,并输出所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息。
6.根据权利要求5所述的一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,提取所述CTC算法中的重整和标签分布输出,获得词向量表示算法的步骤包括:
对分离并提取的所述格栅文本的文本格栅信息与标签分布输出进行拼接复原和纠正处理;
通过词向量匹配,将已识别出的格栅文本与词向量词库中的标准词语进行匹配校正,得到校正后的连贯文本矢量化内容,进而获得词向量表示算法。
7.根据权利要求1所述的一种基于AI的可变尺度地质图文本矢量化方法,其特征在于,将文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统的过程中,还包括:
提取文本元素简介为标签,并从文本素材中提取文本元素,输入到所述非关系型数据库;
基于文本元素,提取格栅化文本数据为标签,并从格栅图像中提取格栅文本所在的N个位置元素,并将所述N个位置元素输入到所述非关系型数据库;
同时,基于所述非关系型数据库将输入的数据信息实时异步复制到M个备份数据库中,并相互校验;
其中,所述非关系型数据库还实时同步输入的数据信息到全文检索引擎;
当所述全文检索引擎实时同步之后,还接收目标用户输入的检索词;
所述全文检索引擎根据接收的检索词,返回检索结果并进行展示,同时,供所述目标用户查看。
8.一种基于AI的可变尺度地质图文本矢量化系统,其特征在于,包括:
导入模块,用于导入可变尺度格栅地质图,并构建图像素材集合;
校正模块,用于基于动态参考坐标系,对所述导入模块构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像;
文本定位提取模块,用于基于多尺度可分割目标检测算法,对所述校正模块输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息;
文本矢量化模块,用于基于词向量表示算法对所述定位提取模块输出的所述文本格栅信息进行矢量化识别,输出所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息;
构建模块,用于将识别模块输出的文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一所述的一种基于AI的可变尺度地质图文本矢量化方法的构建步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一所述的一种基于AI的可变尺度地质图文本矢量化方法的构建步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010145454.3A CN111400524B (zh) | 2020-03-03 | 2020-03-03 | 一种基于ai的可变尺度地质图文本矢量化方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010145454.3A CN111400524B (zh) | 2020-03-03 | 2020-03-03 | 一种基于ai的可变尺度地质图文本矢量化方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111400524A CN111400524A (zh) | 2020-07-10 |
CN111400524B true CN111400524B (zh) | 2023-05-26 |
Family
ID=71434489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010145454.3A Active CN111400524B (zh) | 2020-03-03 | 2020-03-03 | 一种基于ai的可变尺度地质图文本矢量化方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111400524B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112085357B (zh) * | 2020-08-27 | 2021-06-04 | 东南大学 | 一种出让地块规划条件冲突要点识别与处理的系统与方法 |
CN112800158B (zh) * | 2021-01-19 | 2022-09-13 | 吉林大学 | 一种地质图的向量化表示方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341837A (zh) * | 2017-06-26 | 2017-11-10 | 华中师范大学 | 基于影像金字塔的栅格‑矢量数据转换及连续尺度表达方法 |
CN108573510A (zh) * | 2018-02-05 | 2018-09-25 | 上海思岚科技有限公司 | 一种栅格地图矢量化方法及设备 |
CN109509234A (zh) * | 2018-10-09 | 2019-03-22 | 天津科技大学 | 一种基于城区建筑群高清栅格地图矢量化的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7792331B2 (en) * | 2004-06-29 | 2010-09-07 | Acd Systems, Ltd. | Composition of raster and vector graphics in geographic information systems |
-
2020
- 2020-03-03 CN CN202010145454.3A patent/CN111400524B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341837A (zh) * | 2017-06-26 | 2017-11-10 | 华中师范大学 | 基于影像金字塔的栅格‑矢量数据转换及连续尺度表达方法 |
CN108573510A (zh) * | 2018-02-05 | 2018-09-25 | 上海思岚科技有限公司 | 一种栅格地图矢量化方法及设备 |
CN109509234A (zh) * | 2018-10-09 | 2019-03-22 | 天津科技大学 | 一种基于城区建筑群高清栅格地图矢量化的方法 |
Non-Patent Citations (1)
Title |
---|
基于GIS的地质图矢量化技术研究;陶鹰;;现代测绘(06);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111400524A (zh) | 2020-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111898696B (zh) | 伪标签及标签预测模型的生成方法、装置、介质及设备 | |
Liu et al. | Automatic building extraction on high-resolution remote sensing imagery using deep convolutional encoder-decoder with spatial pyramid pooling | |
RU2661750C1 (ru) | Распознавание символов с использованием искусственного интеллекта | |
US10032072B1 (en) | Text recognition and localization with deep learning | |
US11810326B2 (en) | Determining camera parameters from a single digital image | |
KR101377601B1 (ko) | 모바일 카메라를 이용한 자연 영상 다국어 문자 인식과 번역 시스템 및 방법 | |
CN111400524B (zh) | 一种基于ai的可变尺度地质图文本矢量化方法及系统 | |
CN112819686A (zh) | 基于人工智能的图像风格处理方法、装置及电子设备 | |
CN110990563A (zh) | 一种基于人工智能的传统文化素材库构建方法及系统 | |
CN110414523A (zh) | 一种身份证识别方法、装置、设备及存储介质 | |
CN115130613B (zh) | 虚假新闻识别模型构建方法、虚假新闻识别方法与装置 | |
CN111401309B (zh) | 基于小波变换的cnn训练和遥感图像目标识别方法 | |
CN115640394A (zh) | 文本分类方法、文本分类装置、计算机设备及存储介质 | |
CN114357174B (zh) | 基于ocr和机器学习的代码分类系统及方法 | |
CN113283432A (zh) | 图像识别、文字排序方法及设备 | |
US20210374490A1 (en) | Method and apparatus of processing image, device and medium | |
CN114821590A (zh) | 文档信息提取方法、装置、设备及介质 | |
CN106709490B (zh) | 一种字符识别方法和装置 | |
CN113821663A (zh) | 图像处理方法、装置、设备及计算机可读存储介质 | |
CN116225956A (zh) | 自动化测试方法、装置、计算机设备和存储介质 | |
CN114049640A (zh) | 一种票据文本检测方法、装置、电子设备及存储介质 | |
CN113486848A (zh) | 文档表格识别方法、装置、设备及存储介质 | |
CN113204984A (zh) | 一种少量标注数据下的中医手写处方识别方法 | |
CN114692715A (zh) | 一种样本标注方法及装置 | |
Pang et al. | Chinese Calligraphy Character Image Recognition and Its Applications in Web and Wechat Applet Platform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |