CN115965983A - 图像信息的解析方法和装置 - Google Patents
图像信息的解析方法和装置 Download PDFInfo
- Publication number
- CN115965983A CN115965983A CN202211579612.1A CN202211579612A CN115965983A CN 115965983 A CN115965983 A CN 115965983A CN 202211579612 A CN202211579612 A CN 202211579612A CN 115965983 A CN115965983 A CN 115965983A
- Authority
- CN
- China
- Prior art keywords
- data
- page
- line
- image
- analyzed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Image Analysis (AREA)
Abstract
本公开涉及一种图像信息的解析方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:从待解析页面对应的编码数据中提取线条编码数据;根据所述线条编码数据确定所述待解析页面中的线条分布数据;根据所述线条分布数据确定所述待解析页面中的图像的位置数据和类别数据。采用本方法能够实现对页面中矢量图的图像信息的提取和解析。
Description
技术领域
本公开涉及图像处理技术领域,特别是涉及一种图像信息的解析方法、装置、计算机设备和存储介质。
背景技术
在数据处理过程中,有些应用场景下需要对文档内的图片进行提取解析,以得到图片信息。传统技术中,可以直接根据图片编码从文档中提取对应的图像信息进行进一步处理。
然而,有些文档中包含矢量图,矢量图通常由直线曲线等线条勾勒而成,图片编码与普通图片不同,是由多个矢量编码组合而成,因此无法通过图片编码直接提取图像信息。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提取矢量图中图像信息的图像信息的解析方法、装置、计算机设备、存储介质和计算机程序产品。
第一方面,本公开实施例提供了一种图像信息的解析方法。所述方法包括:
从待解析页面对应的编码数据中提取线条编码数据;
根据所述线条编码数据确定所述待解析页面中的线条分布数据;
根据所述线条分布数据确定所述待解析页面中的图像的位置数据和类别数据。
在其中一个实施例中,所述待解析页面的获取方式,包括:
获取原始页面;
将所述原始页面的页面格式转换为预设格式,得到待解析页面,其中,所述预设格式包括预设矢量图格式。
在其中一个实施例中,所述线条分布数据包括线条连接关系数据,所述根据所述线条分布数据确定所述待解析页面中的图像的位置数据,包括:
根据所述线条连接关系数据确定所述待解析页面中的线条之间的连通关系;
获取所述待解析页面中存在连通关系的线条对应的图像;
根据所述图像的边界线条数据确定所述图像的位置数据。
在其中一个实施例中,所述线条分布数据包括线条属性数据,所述根据所述线条分布数据确定所述待解析页面中的图像的类别数据,包括:
获取所述线条分布数据对应的所述待解析页面中的图像;
根据所述图像的线条属性数据与图像类别数据之间的关联关系,确定所述图像的类别数据。
在其中一个实施例中,所述线条编码数据包括线条颜色属性数据,所述根据所述线条编码数据确定所述待解析页面中的线条分布数据,包括:
根据所述线条颜色属性数据对所述待解析页面中的线条进行分类,得到多组不同颜色属性的线条;
根据所述多组不同颜色属性的线条确定所述待解析页面中的线条分布数据。
第二方面,本公开实施例还提供了一种图像信息的解析装置。所述装置包括:
提取模块,用于从待解析页面对应的编码数据中提取线条编码数据;
第一确定模块,用于根据所述线条编码数据确定所述待解析页面中的线条分布数据;
第二确定模块,用于根据所述线条分布数据确定所述待解析页面中的图像的位置数据和类别数据。
在其中一个实施例中,所述待解析页面的获取模块,包括:
获取模块,用于获取原始页面;
转换模块,用于将所述原始页面的页面格式转换为预设格式,得到待解析页面,其中,所述预设格式包括预设矢量图格式。
在其中一个实施例中,所述线条分布数据包括线条连接关系数据,所述第二确定模块,包括:
第一确定子模块,用于根据所述线条连接关系数据确定所述待解析页面中的线条之间的连通关系;
第一获取子模块,用于获取所述待解析页面中存在连通关系的线条对应的图像;
第二确定子模块,用于根据所述图像的边界线条数据确定所述图像的位置数据。
在其中一个实施例中,所述线条分布数据包括线条属性数据,所述第二确定模块,包括:
第二获取子模块,用于获取所述线条分布数据对应的所述待解析页面中的图像;
第三确定子模块,用于根据所述图像的线条属性数据与图像类别数据之间的关联关系,确定所述图像的类别数据。
在其中一个实施例中,所述线条编码数据包括线条颜色属性数据,所述第一确定模块,包括:
分类模块,用于根据所述线条颜色属性数据对所述待解析页面中的线条进行分类,得到多组不同颜色属性的线条;
第四确定子模块,用于根据所述多组不同颜色属性的线条确定所述待解析页面中的线条分布数据。
第三方面,本公开实施例还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本公开实施例中任一项所述的方法的步骤。
第四方面,本公开实施例还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本公开实施例中任一项所述的方法的步骤。
第五方面,本公开实施例还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开实施例中任一项所述的方法的步骤。
本公开实施例,根据获取到的待解析页面对应的编码数据,确定线条编码数据,根据线条编码数据确定待解析页面中的线条分布数据,根据待解析页面中的线条分布数据能够确定待解析页面中的图像的位置数据和类别数据,从而实现了对页面中的图像信息的提取和解析,本实施例通过编码数据中的线条编码数据确定待解析页面中的线条分布,能够实现对页面中矢量图的提取和解析,从而能够对文档中的矢量图像进行识别和提取解析;且通过编码数据能够准确便捷地对待解析页面中图像信息的提取和解析,降低了人工工作量和数据处理实现的复杂度,提高了图像信息解析的效率。
附图说明
图1为一个实施例中图像信息的解析方法的流程示意图;
图2为一个实施例中页面中图片的示意图;
图3为一个实施例中图像信息的解析方法的流程示意图;
图4为一个实施例中图像信息的解析方法的流程示意图;
图5为一个实施例中图像信息的解析方法的流程示意图;
图6为一个实施例中图像信息的解析方法的流程示意图;
图7为一个实施例中图像信息的解析装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本公开实施例的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本公开实施例进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本公开实施例,并不用于限定本公开实施例。
在一个实施例中,如图1所示,提供了一种图像信息的解析方法,所述方法包括:
步骤S110,从待解析页面对应的编码数据中提取线条编码数据;
本公开实施例中,获取待解析页面对应的编码数据,从获取到的编码数据中提取线条编码数据。其中,待解析页面可以从待解析文档中获取。通常情况下,当需要对包含图片的文档进行分析处理时,通常需要将图片从文档中解析出来,在一个示例中,当需要对文档中的图片进行分析处理时,确定文档对应的待解析页面,并获取待解析页面对应的编码数据,根据编码数据获取线条编码数据。编码数据可以包括但不限于页面的源码数据。在一个示例中,不同页面格式可以对应有不同的编码类型,本实施例中的编码类型可以被设置与预设格式的页面相对应,其中,预设格式通常为根据实际应用场景设置得到,例如svg格式。在一种可能的实现方式中,当需要处理的页面与预设格式不匹配时,可以将页面格式转换为预设格式,得到待解析的页面。在一个示例中,待解析页面对应的编码数据可以由多种种类的编码数据组合而成,例如文本编码数据、线条编码数据等,不同的编码类型对应的编码数据的种类划分方式可能不同,因此,在从编码数据中提取线条编码数据时,可以根据编码类型对应的特征确定具体的提取方式。在一个示例中,当待解析页面对应的格式为svg格式时,对应的编码数据为svg源码数据,提取到的线条编码数据的类型可以包括<g>,<path>等。
步骤S120,根据所述线条编码数据确定所述待解析页面中的线条分布数据;
本公开实施例中,在得到线条编码数据后,根据获取到的线条编码数据可以确定待解析页面中的线条分布数据。其中,根据线条编码数据通常可以确定得到待解析页面中线条的具体属性数据,所述具体属性数据可以包括但不限于线条的颜色属性数据、线条的位置属性数据等。根据线条编码数据中包含的线条数据能够确定得到待解析页面中的线条分布数据。本实施例中,线条编码数据可以包括但不限于直线编码数据、曲线编码数据等。
步骤S130,根据所述线条分布数据确定所述待解析页面中的图像的位置数据和类别数据。
本公开实施例中,得到线条分布数据后,根据线条分布数据能够确定待解析页面中的图像的位置数据和类别数据。其中,图像的位置数据可以包括但不限于图像在所述待解析页面中所处的位置数据、图像的尺寸数据等,图像的类别数据根据不同的划分方式可能存在差异,在一个示例中,可以事先根据实际应用场景确定多个图像类别,当获取到线条分布数据后,根据线条分布数据对应的图像的特征确定图像所属的图像类别,得到图像的类别数据。在一个示例中,获取到线条分布数据后,还可以根据线条分布数据先确定待解析页面中是否包括图片,由于图片的线条分布与文本的线条分布的差异,结合获取到的线条分布数据能够确定待解析页面中是否包括图片,若包括图片,则确定所述图片对应的图像的位置数据和类别数据;若不包含图片,则可以不做处理。在一种可能的实现方式中,当待解析页面为从待解析文档中获取时,其编码数据通常对应有多个无色框对应的编码数据,可以根据编码数据确定无色框的位置数据,并对无色框中的线条分布进行判断,由于文本与图片之间的差异,根据无色框中的线条分布能够确定无色框中是否为图片。图2为根据一示例性实施例示出的一种页面中图片的示意图,参考图2所示,图2为金融报告文档中的公司关联关系图像,在确定得到无色框后,由于无色框中的线条分布符合图片特征,因此,可以认为此时无色框中对应为图片,进而可以确定该图片对应的图像的位置数据和类别数据。
本公开实施例,根据获取到的待解析页面对应的编码数据,确定线条编码数据,根据线条编码数据确定待解析页面中的线条分布数据,根据待解析页面中的线条分布数据能够确定待解析页面中的图像的位置数据和类别数据,从而实现了对页面中的图像信息的提取和解析,本实施例通过编码数据中的线条编码数据确定待解析页面中的线条分布,能够实现对页面中矢量图的提取和解析,从而能够对文档中的矢量图像进行识别和提取解析;且通过编码数据能够准确便捷地对待解析页面中图像信息的提取和解析,降低了人工工作量和数据处理实现的复杂度,提高了图像信息解析的效率。
在一个实施例中,如图3所示,所述待解析页面的获取方式,包括:
步骤S310,获取原始页面;
步骤S320,将所述原始页面的页面格式转换为预设格式,得到待解析页面,其中,所述预设格式包括预设矢量图格式。
本公开实施例中,获取待解析页面时,先获取原始页面,原始页面对应有原始页面格式。将原始页面的页面格式转换为预设格式,得到待解析页面,其中,预设格式包括预设矢量图格式。通常情况下,不同的页面格式可以对应有不同的编码类型,预设格式通常为根据实际应用场景设置得到,本实施例中,由于要对线条编码数据进行处理,因此,可以将预设格式设置为线条编码数据特征较为明显的页面格式,例如预设矢量图格式,其中,所述预设矢量图格式可以包括但不限于svg格式。由于矢量图格式对应的编码数据通常由多个矢量编码组合而成,因此能够确定编码数据中的线条编码数据。获取原始页面后,判断原始页面的页面格式是否为预设格式,当原始页面的页面格式不是预设格式时,则可以认为此时从原始页面对应的编码数据中提取线条编码数据的难度较大,需要进行格式转换。在一个示例中,当原始页面的页面格式对应为预设格式时,无需进行格式转换,直接将原始页面作为待解析页面。
本公开实施例,通过对原始页面进行格式转换,能够使得得到的待解析页面的编码数据更符合应用场景,保证了线条编码数据提取的准确性和效率,进而保证了后续提取到的图像信息的准确性和提取效率,实现了对页面中矢量图的提取和解析。
在一个实施例中,如图4所示,所述线条分布数据包括线条连接关系数据,所述根据所述线条分布数据确定所述待解析页面中的图像的位置数据,包括:
步骤S131,根据所述线条连接关系数据确定所述待解析页面中的线条之间的连通关系;
步骤S132,获取所述待解析页面中存在连通关系的线条对应的图像;
步骤S133,根据所述图像的边界线条数据确定所述图像的位置数据。
本公开实施例中,线条分布数据包括线条连接关系数据,根据线条分布数据能够确定待解析页面中的线条之间的连接关系。在确定图像的位置数据时,根据线条连接关系数据能够确定得到待解析页面中的线条之间的连通关系,本实施例中,将存在连通关系的线条对应的图像作为一副图像进行处理。获取待解析页面中存在连通关系的线条对应的图像,其中,待解析页面中可能存在一副或多副对应的图像。在一个示例中,参考图2所示,图中的线条框之间存在连通关系,因此,可以将图2中对应的图像作为一副图像进行处理。得到图像后,根据获取图像的边界线条数据,其中,由于图像是由线条组成的,且每个线条对应有线条编码数据,因此,可以判断得到最靠近图像边界的线条编码数据,从而确定得到图像的边界线条数据,根据图像的边界线条数据确定图像的位置数据,其中,边界线条数据可以包括但不限于最靠近图像边界的线条的起始点、最靠近图像边界的线条的终点等。在一个示例中,边界线条可以包括最靠近图像四个边界对应的四组边界线条。本实施例中,图像的位置数据可以包括但不限于图像在待解析页面中所处的位置数据、图像的尺寸数据、图像在待解析页面中的占比数据等。
本公开实施例,通过线条连接关系数据确定线条之间的连通关系,并根据连通关系确定对应的图像,得到图像对应的位置数据,能够实现对待解析页面中图片对应的图像的位置数据的精确地确定;通过连通关系能够实现根据线条对图像进行划分,确定待解析页面中的图片的数量;通过边界线条数据确定图像的位置数据,实现了对待解析页面中图像的位置的解析提取,且通过线条数据确定,所以能够对矢量图的位置进行解析提取,实现了对待解析页面中矢量图的处理分析。
在一个实施例中,如图5所示,所述线条分布数据包括线条属性数据,所述根据所述线条分布数据确定所述待解析页面中的图像的类别数据,包括:
步骤S134,获取所述线条分布数据对应的所述待解析页面中的图像;
步骤S135,根据所述图像的线条属性数据与图像类别数据之间的关联关系,确定所述图像的类别数据。
本公开实施例中,线条分布数据包括线条属性数据,线条属性数据可以包括但不限于线条类型数据、线条颜色数据、线条斜率数据等。确定图像的类别数据时,根据线条分布数据确定对应的待解析页面中的图像,由于线条分布数据能够体现待解析页面中线条的特征信息,因此,可以根据线条的特征信息确定待解析页面中的图像。在一个示例中,可以通过图4中步骤S131、步骤S132所示的方式确定待解析页面中的图像。根据图像的线条属性数据和图像类别数据之间的关联关系,确定图像的类别数据。在一个示例中,线条属性数据和图像类别之间的关联关系可以为事先根据实际应用场景设置得到,不同场景下,对图像类别的划分方式不同,关联关系也可能不同。在一个示例中,当应用场景对应为统计图像时,可以将图像类别划分为不同种类的统计图像,如直方图、折线图、流程图、架构图、饼状图等,根据不同统计图像的特征确定对应的线条属性信息,例如,饼状图对应的线条属性数据可以包括线条为闭合曲线等。
本公开实施例,根据线条属性数据能够确定得到图像的类别数据,实现了对待解析页面中图像类别的分析处理;且通过线条属性进行判断,能够实现对矢量图的类别数据的确定,判断方式简单精确,保证了页面中图像信息解析的准确性和效率。
在一个实施例中,如图6所示,所述线条编码数据包括线条颜色属性数据,所述根据所述线条编码数据确定所述待解析页面中的线条分布数据,包括:
步骤S121,根据所述线条颜色属性数据对所述待解析页面中的线条进行分类,得到多组不同颜色属性的线条;
步骤S122,根据所述多组不同颜色属性的线条确定所述待解析页面中的线条分布数据。
本公开实施例中,线条编码数据包括线条颜色属性数据。在确定线条分布数据时,可以通过线条颜色属性数据对线条进行分类,得到多组不同颜色属性的线条,根据多组不同颜色属性的线条确定待解析页面中的线条分布数据。其中,线条颜色属性可以包括但不限于无色线条、黑色线条等。在一个示例中,一组颜色属性的线条可以对应为一个线条框。在对线条进行分类时,可以通过聚类的方式按照线条的属性数据进行分类处理,在一种可能的实现方式中,基于线条的颜色属性数据,采用预设的聚类方式,可以得到多个不同线条框,根据线条框的分布可以确定待解析页面中的线条分布数据,其中,线条分布数据可以包括线条框的数目、线条框的具体位置数据等。在一个示例中,线条框中可能还对应有背景颜色,根据待解析页面的编码数据可以确定线条框对应的背景颜色,从而能够确定不同线条框的类别,实现对图像信息更进一步的解析。
本公开实施例,通过线条颜色属性数据进行分类处理,能够更为准确地确定得到待解析页面中的线条分布数据,能够实现对页面中矢量图的提取和解析,进而实现对文档中的矢量图像进行识别和提取解析。
在一个示例中,可以对矢量图对应图像信息进行解析提取。在对图像信息进行提取解析时,先获取需要处理的原始文档,将原始文档转换为预设格式,其中,预设格式包括svg格式。本实施例中,原始文档的格式可以包括但不限于pdf格式。转换后,根据待解析页面对应的编码数据提取线条编码数据,其中,线条编码数据可以包括直线编码数据、曲线编码数据等。根据得到的线条编码数据对待解析页面中的线条进行聚类,得到有颜色属性的线条框。结合线条框中的背景颜色、不同颜色属性的线条框的信息定位待解析页面中的矢量图,得到矢量图对应的图像的位置数据。根据图像中线条的数据、连接方式、斜率变化等数据确定图像类别。在一个示例中,图像类别可以包括但不限于流程图,架构图,柱状图,折线图,饼状图等。
通过本公开实施例,能够准确有效地提取页面中的矢量图,并对矢量图类别进行判断分析,实现了对文档中矢量图的提取解析;且实现方式简单,实现难度低,降低了人工工作量和数据处理的复杂度,提高了图像解析的效率和准确性。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,附图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本公开实施例还提供了一种用于实现上述所涉及的图像信息的解析方法的图像信息的解析装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个图像信息的解析装置实施例中的具体限定可以参见上文中对于图像信息的解析方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种图像信息的解析装置700。所述装置包括:
提取模块710,用于从待解析页面对应的编码数据中提取线条编码数据;
第一确定模块720,用于根据所述线条编码数据确定所述待解析页面中的线条分布数据;
第二确定模块730,用于根据所述线条分布数据确定所述待解析页面中的图像的位置数据和类别数据。
在一个实施例中,所述待解析页面的获取模块,包括:
获取模块,用于获取原始页面;
转换模块,用于将所述原始页面的页面格式转换为预设格式,得到待解析页面,其中,所述预设格式包括预设矢量图格式。
在一个实施例中,所述线条分布数据包括线条连接关系数据,所述第二确定模块,包括:
第一确定子模块,用于根据所述线条连接关系数据确定所述待解析页面中的线条之间的连通关系;
第一获取子模块,用于获取所述待解析页面中存在连通关系的线条对应的图像;
第二确定子模块,用于根据所述图像的边界线条数据确定所述图像的位置数据。
在一个实施例中,所述线条分布数据包括线条属性数据,所述第二确定模块,包括:
第二获取子模块,用于获取所述线条分布数据对应的所述待解析页面中的图像;
第三确定子模块,用于根据所述图像的线条属性数据与图像类别数据之间的关联关系,确定所述图像的类别数据。
在一个实施例中,所述线条编码数据包括线条颜色属性数据,所述第一确定模块,包括:
分类模块,用于根据所述线条颜色属性数据对所述待解析页面中的线条进行分类,得到多组不同颜色属性的线条;
第四确定子模块,用于根据所述多组不同颜色属性的线条确定所述待解析页面中的线条分布数据。
上述图像信息的解析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待解析页面的编码数据等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像信息的解析方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本公开实施例方案相关的部分结构的框图,并不构成对本公开实施例方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本公开实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本公开实施例所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本公开实施例所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本公开实施例所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本公开实施例的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本公开实施例专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本公开实施例构思的前提下,还可以做出若干变形和改进,这些都属于本公开实施例的保护范围。因此,本公开实施例的保护范围应以所附权利要求为准。
Claims (10)
1.一种图像信息的解析方法,其特征在于,所述方法包括:
从待解析页面对应的编码数据中提取线条编码数据;
根据所述线条编码数据确定所述待解析页面中的线条分布数据;
根据所述线条分布数据确定所述待解析页面中的图像的位置数据和类别数据。
2.根据权利要求1所述的方法,其特征在于,所述待解析页面的获取方式,包括:
获取原始页面;
将所述原始页面的页面格式转换为预设格式,得到待解析页面,其中,所述预设格式包括预设矢量图格式。
3.根据权利要求1所述的方法,其特征在于,所述线条分布数据包括线条连接关系数据,所述根据所述线条分布数据确定所述待解析页面中的图像的位置数据,包括:
根据所述线条连接关系数据确定所述待解析页面中的线条之间的连通关系;
获取所述待解析页面中存在连通关系的线条对应的图像;
根据所述图像的边界线条数据确定所述图像的位置数据。
4.根据权利要求1所述的方法,其特征在于,所述线条分布数据包括线条属性数据,所述根据所述线条分布数据确定所述待解析页面中的图像的类别数据,包括:
获取所述线条分布数据对应的所述待解析页面中的图像;
根据所述图像的线条属性数据与图像类别数据之间的关联关系,确定所述图像的类别数据。
5.根据权利要求1所述的方法,其特征在于,所述线条编码数据包括线条颜色属性数据,所述根据所述线条编码数据确定所述待解析页面中的线条分布数据,包括:
根据所述线条颜色属性数据对所述待解析页面中的线条进行分类,得到多组不同颜色属性的线条;
根据所述多组不同颜色属性的线条确定所述待解析页面中的线条分布数据。
6.一种图像信息的解析装置,其特征在于,所述装置包括:
提取模块,用于从待解析页面对应的编码数据中提取线条编码数据;
第一确定模块,用于根据所述线条编码数据确定所述待解析页面中的线条分布数据;
第二确定模块,用于根据所述线条分布数据确定所述待解析页面中的图像的位置数据和类别数据。
7.根据权利要求6所述的装置,其特征在于,所述待解析页面的获取模块,包括:
获取模块,用于获取原始页面;
转换模块,用于将所述原始页面的页面格式转换为预设格式,得到待解析页面,其中,所述预设格式包括预设矢量图格式。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的图像信息的解析方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的图像信息的解析方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至5中任一项所述的图像信息的解析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211579612.1A CN115965983A (zh) | 2022-12-08 | 2022-12-08 | 图像信息的解析方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211579612.1A CN115965983A (zh) | 2022-12-08 | 2022-12-08 | 图像信息的解析方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115965983A true CN115965983A (zh) | 2023-04-14 |
Family
ID=87353525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211579612.1A Pending CN115965983A (zh) | 2022-12-08 | 2022-12-08 | 图像信息的解析方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115965983A (zh) |
-
2022
- 2022-12-08 CN CN202211579612.1A patent/CN115965983A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020192391A1 (zh) | 基于ocr的图像转档方法、装置、设备及可读存储介质 | |
CN113378710B (zh) | 图像文件的版面分析方法、装置、计算机设备和存储介质 | |
AU2021201141A1 (en) | System and method for data extraction and searching | |
WO2019144855A1 (zh) | 图像处理方法、存储介质和计算机设备 | |
CN111476067A (zh) | 图像的文字识别方法、装置、电子设备及可读存储介质 | |
CN112232346B (zh) | 语义分割模型训练方法及装置、图像语义分割方法及装置 | |
US20140212033A1 (en) | Image compression mehtod, image compression device and mobile terminal | |
CN111144370B (zh) | 单据要素抽取方法、装置、设备及存储介质 | |
US7277584B2 (en) | Form recognition system, form recognition method, program and storage medium | |
WO2021175040A1 (zh) | 视频处理方法及相关装置 | |
CN111612004A (zh) | 一种基于语义内容的图像裁剪方法及装置 | |
CN110866457A (zh) | 一种电子保单的获得方法、装置、计算机设备和存储介质 | |
CN115115968A (zh) | 视频质量评价方法、装置及计算机可读存储介质 | |
CN111881943A (zh) | 图像分类的方法、装置、设备和计算机可读介质 | |
CN115131803A (zh) | 文档字号的识别方法、装置、计算机设备和存储介质 | |
US20240040108A1 (en) | Method and system for preprocessing optimization of streaming video data | |
CN114519788A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN114996360B (zh) | 数据分析方法、系统、可读存储介质及计算机设备 | |
CN116612280A (zh) | 车辆分割方法、装置、计算机设备和计算机可读存储介质 | |
CN115965983A (zh) | 图像信息的解析方法和装置 | |
CN113779218B (zh) | 问答对构建方法、装置、计算机设备和存储介质 | |
US20240071114A1 (en) | Image data verification | |
CN118298448A (zh) | 表格识别方法、装置、计算机设备、存储介质 | |
AU2021106056A4 (en) | The system and apparatus for image resolution by using deep learning technique. | |
CN117217172B (zh) | 表格信息获取方法、装置、计算机设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |