CN105205790B - 一种可视化数据和结构化数据合成图片的方法及装置 - Google Patents
一种可视化数据和结构化数据合成图片的方法及装置 Download PDFInfo
- Publication number
- CN105205790B CN105205790B CN201510524843.6A CN201510524843A CN105205790B CN 105205790 B CN105205790 B CN 105205790B CN 201510524843 A CN201510524843 A CN 201510524843A CN 105205790 B CN105205790 B CN 105205790B
- Authority
- CN
- China
- Prior art keywords
- data
- visualization
- key element
- base plate
- business datum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明公开了一种可视化数据和结构化数据合成图片的方法及装置,涉及图像处理技术领域,其方法包括以下步骤:根据底板要素定义结构化数据关于结构化业务数据的定义和描述,对结构化业务数据进行可视化数据形成处理,得到与可视化底板图像数据相匹配的可视化业务数据;将所述可视化业务数据与所述可视化底板图像数据进行合成处理,得到可视化合成图像数据;通过将结构化描述数据添加到所述可视化合成图像数据中进行图片生成处理,得到合成图片。本发明通过将结构化数据合成到图片,让结构化数据具有更好的可视性,同时继承了标记语言的机读优势。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种可视化数据和结构化数据合成图片的方法及装置。
背景技术
在社会公共应用领域中需要产生和转输大量的单证(如涵盖各行各业的财政票据、税务发票、金融票证和公共电子缴费单等),为了环保和降低单证流转成本,我国已推进无纸化单证改革,如电子票据、电子凭证和电子单据等无纸化单证应用。目前主流的电子单证表现技术有两种方式,一是使用结构化数据表现电子单证,二是使用文档数据表现电子单证。
结构化数据指用特定的格式、标记和编码规则来表示的、具有语义和层级关系的数据,包括关系型数据库或其他形式数据表等具有正式结构的数据,也包括使用标记和规则分割语义元素和层级关系的全文本(full-text)数据。现有描述、交换和展示结构化数据的方案大致分为两类:关系型数据库或其他形式数据表等具有正式结构的数据;使用标记和规则分割语义元素和层级关系的全文本数据,比如标记语言格式(如XML(Extensive Markup Language,可扩展标示语言)和JSON(JavaScript Object Notation,JavaScript对象表示法)),但这种格式可视化效果差,无法具象,人读困难,不利于人工审阅,需要专业人员、专业软件查看和检索,适合机读和系统自动化处理。为了增强数据可视性,目前也有使用文档格式来表示结构化数据的,比如PDF(Portable Document Format,便携式文件格式)、HTML(Hypertext Markup Language,超文本标记语言)、MS-Word。文档格式数据可视化效果好,但是机读困难,很难从文档格式重建数据和关系,终端支持度不高,需要有专门的阅读软件支持,不便于标准化推广和自动化处理。
发明内容
本发明的目的在于提供一种可视化数据和结构化数据合成图片的方法及装置,解决了现有技术中所合成的文档在终端中支持度不高,且不便于标准化推广和自动化处理的问题。
根据本发明的一个方面,提供了一种可视化数据和结构化数据合成图片的方法,包括以下步骤:
根据底板要素定义结构化数据关于结构化业务数据的定义和描述,对结构化业务数据进行可视化数据形成处理,得到与可视化底板图像数据相匹配的可视化业务数据;
将所述可视化业务数据与所述可视化底板图像数据进行合成处理,得到可视化合成图像数据;
通过将结构化描述数据添加到所述可视化合成图像数据中进行图片生成处理,得到合成图片。
优选地,还包括:
根据将要形成的图片的轮廓,建立可视化底板图像数据;
建立与所述可视化底板图像数据适配的底板要素定义结构化数据。
优选地,所述结构化描述数据包括:对所述可视化合成图像数据具有防伪和校验功能的图像数字指纹和制作者数字签名。
优选地,所述的根据所述底板要素定义结构化数据关于结构化业务数据的定义和描述,对结构化的业务数据进行可视化数据形成处理包括:
根据所述底板要素定义结构化数据的要素ID,查找所述业务数据中的对应要素;
按照所述底板要素定义结构化数据的要素ID指定的要素可视化特征,对业务数据中查找到的对应要素进行可视化处理。
优选地,所述的可视化处理包括:
将业务数据中查找到的对应要素进行结构转换,并将业务数据中查找到的对应要素和底板要素定义结构化数据进行合并,得到与所述可视化底板图像数据相匹配的可视化业务数据;
其中,所述结构转换是指将所述对应要素的图像位置转换成字体基线位置。
根据本发明的另一方面,提供了一种可视化数据和结构化数据合成图片的装置,包括:
可视化数据形成模块,用于根据底板要素定义结构化数据关于结构化业务数据的定义和描述,对结构化业务数据进行可视化数据形成处理,得到与可视化底板图像数据相匹配的可视化业务数据;
合成图像数据模块,用于将所述可视化业务数据与所述可视化底板图像数据进行合成处理,得到可视化合成图像数据;
合成图片模块,用于通过将结构化描述数据添加到所述可视化合成图像数据中进行图片生成处理,得到合成图片。
优选地,还包括:
建立模块,用于根据将要形成的图片的轮廓,建立可视化底板图像数据,以及建立与所述可视化底板图像数据适配的底板要素定义结构化数据。
优选地,所述可视化描述数据包括:对所述可视化合成图像数据具有防伪和校验功能的图像数字指纹和制作者数字签名。
优选地,所述的可视化数据形成模块包括:
查找单元,用于根据所述底板要素定义结构化数据的要素ID,查找所述业务数据中的对应要素;
可视化处理单元,用于按照所述底板要素定义结构化数据的要素ID指定的要素可视化特征,对业务数据中查找到的对应要素进行可视化处理。
优选地,所述的可视化处理单元包括:
处理子单元,用于将业务数据中查找到的对应要素进行结构转换,并将业务数据中查找到的对应要素和底板要素定义结构化数据进行合并,得到与所述可视化底板图像数据相匹配的可视化业务数据;
其中,所述结构转换是指将所述对应要素的图像位置转换成字体基线位置。
与现有技术相比较,本发明的有益效果在于:
本发明利用现有图片可视化、标准化且支持设备广泛等优良特性,结合现有结构化数据处理技术和图像合成等技术,高效实现结构化数据的可视性,还能方便机读和数据结构还原。
附图说明
图1是本发明实施例提供的一种可视化数据和结构化数据合成图片的方法流程图;
图2是本发明实施例提供的一种可视化数据和结构化数据合成图片的装置示意图;
图3是本发明实施例提供的准备工作示意图;
图4是本发明实施例提供的可视化数据和结构化数据合成的流程图;
图5是本发明实施例提供的底板要素定义结构化数据的数据格式示意图;
图6是本发明实施例提供的可视化数据和结构化数据合成的结构图;
图7是本发明实施例提供的图像坐标和字体坐标的关系示意图;
图8是本发明实施例提供的描述数据和合成图像数据的处理示意图;
图9是本发明实施例提供的可视化底板图像数据的示意图;
图10是本发明实施例提供的可视化数据和结构化数据合成的示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1显示了本发明实施例提供的一种可视化数据和结构化数据合成图片的方法流程图,如图1所示,包括以下步骤:
步骤S101:根据底板要素定义结构化数据关于结构化业务数据的定义和描述,对结构化业务数据进行可视化数据形成处理,得到与可视化底板图像数据相匹配的可视化业务数据;
步骤S102:将所述可视化业务数据与所述可视化底板图像数据进行合成处理,得到可视化合成图像数据。
步骤S103:通过将结构化描述数据添加到所述可视化合成图像数据中进行图片生成处理,得到合成图片。
本发明还包括:根据将要形成的图片的轮廓,建立可视化底板图像数据;建立与所述可视化底板图像数据适配的底板要素定义结构化数据。其中,所述结构化描述数据包括:对所述可视化合成图像数据具有防伪和校验功能的图像数字指纹和制作者数字签名。
其中,所述的根据所述底板要素定义结构化数据关于结构化业务数据的定义和描述,对结构化的业务数据进行可视化数据形成处理包括:根据所述底板要素定义结构化数据的要素ID,查找所述业务数据中的对应要素;按照所述底板要素定义结构化数据的要素ID指定的要素可视化特征,对业务数据中查找到的对应要素进行可视化处理。具体地说,所述的可视化处理包括:将业务数据中查找到的对应要素进行结构转换,并将业务数据中查找到的对应要素和底板要素定义结构化数据进行合并,得到与所述可视化底板图像数据相匹配的可视化业务数据;其中,所述结构转换是指将所述对应要素的图像位置转换成字体基线位置。
图2显示了本发明实施例提供的一种可视化数据和结构化数据合成图片的装置示意图,如图2所示,包括:可视化数据形成模块201、合成图像数据模块202以及合成图片模块203。所述可视化数据形成模块201,用于根据底板要素定义结构化数据关于结构化业务数据的定义和描述,对结构化业务数据进行可视化数据形成处理,得到与可视化底板图像数据相匹配的可视化业务数据;所述合成图像数据模块202,用于将所述可视化业务数据与所述可视化底板图像数据进行合成处理,得到可视化合成图像数据;所述合成图片模块203,用于通过将结构化描述数据添加到所述可视化合成图像数据中进行图片生成处理,得到合成图片。
本发明还包括:建立模块,用于根据将要形成的图片的轮廓,建立可视化底板图像数据,以及建立与所述可视化底板图像数据适配的底板要素定义结构化数据。其中,所述可视化描述数据包括:对所述可视化合成图像数据具有防伪和校验功能的图像数字指纹和制作者数字签名。
具体地说,所述的可视化数据形成模块201包括:查找单元,用于根据所述底板要素定义结构化数据的要素ID,查找所述业务数据中的对应要素;可视化处理单元,用于按照所述底板要素定义结构化数据的要素ID指定的要素可视化特征,对业务数据中查找到的对应要素进行可视化处理。其中,所述的可视化处理单元包括:处理子单元,用于将业务数据中查找到的对应要素进行结构转换,并将业务数据中查找到的对应要素和底板要素定义结构化数据进行合并,得到与所述可视化底板图像数据相匹配的可视化业务数据;其中,所述结构转换是指将所述对应要素的图像位置转换成字体基线位置。
本发明可视化数据和结构化数据合成图片的技术分为结构化数据、底板图像数据、底板要素定义结构化数据、图片合成四部分。该图片合成技术需经过要素数据定义、合成、添加三个步骤。首先需要为结构化数据建立底板图像数据和底板要素定义结构化数据,定义结构化数据的可视化属性和要素;按照底板要素定义结构化数据规则将结构化数据和底板图像数据进行合成处理,得到可视化合成图像数据;最后将文本格式的描述数据添加到所述可视化合成图像数据中的处理完成图片合成,便于机读数据提取和自动化处理。
如图3所示,首先需要完成准备工作:使用制图工具制作底板图像数据,如图9所示;使用自研工具制作底板要素定义结构化数据(依据RDL语言定义)。
如图4所示,结构化数据、底板图像数据、底板要素定义结构化数据作为输入数据,结构化数据中包含每一项要素数据,其中包含唯一的要素ID。首先需要准备底板图像数据和底板要素定义结构化数据;然后把结构化数据在合适的位置以合适的图形和底板图像数据合成一个新的可视化图像数据上;最后追加描述并输出图片处理,即将可视化图像数据按照图片标准写成图片文件,并将结构化数据(可以在输入的结构化数据中增加图像数字指纹信息、防伪等辅助信息)按照图片标准追加到新图片扩展数据块中,至此一张内含结构化描述数据的图片就创建完毕。
图片是指由图形、图像等构成的平面媒体,用点、线、符号、文字和数字等描绘事物几何特征、形态、位置及大小的一种形式。图片文件格式很多,常见的国际标准比如PNG(Portable Network Graphic Format,图像文件存储格式)、JPEG(Joint Photographic Experts Group,联合图像专家小组)、TIFF(TaggedImage File Format,图像文件格式)、GIF(Graphics Interchange Format,图像互换格式)等。图片作为一种广泛使用的数据存储和交换格式,可视化程度高,平台、设备独立,支持在PC(personal computer,个人计算机)、触摸屏、智能手机等各种设备,处理软件和计算机语言众多,已广泛运用在各行各业。
结构化数据是现实世界的业务数据,由实体单元和层级关系构成,其结构是二维的对象模型或特定的全文本(Full-Text)数据,可以方便的抽取数据,比如使用SQL(Structured Query Language,结构化查询语言)从关系型数据库的表中抽取的数据,或从XML或JSON结构中抽取数据都十分容易。
如图5所示,底板要素定义结构化数据定义了每一项要素以及要素数据的可视化特征,底板要素定义结构化数据作为与底板图片配套的结构化数据,使用RDL(Resources Description Language,资源描述语言)或XML格式,定义结构化数据编号、位置、样式等,描述结构化数据的要素和要素可视化特征。其中,要素一般包括要素ID、描述、可视化特征,每项结构化数据都有唯一的要素ID,可视化特征指明该数据项是否能在图片上显示。要素数据的可视化特征包括位置坐标、高宽规格、字形、方向、透明度等,即相对于底板图片左上角位置(0,0)的位置坐标(Xi,Yi)、规格(宽,高)、字体(font-size、font-family,font-style)、方向(旋转角度)、透明度等信息。如图7所示,图片中所有的几何形状,其位置坐标X、Y都是该几何形状相对于图形左上角位置向右和向下的偏移量(像素),但是字形的坐标是基于字体本身的基线(baseline),因此如果结构化数据是文本,在底板要素定义结构化数据中设置的起始位置图形坐标Pi(Xi,Yi)需要转换为字体位置坐标Pf(Xf,Yf),上坡度是Yi和Yf之间的差值。
Xf=Xi;Yf=Yi+|Ascent|(上坡度)
其中:上坡度是负值,用绝对值表示。结构化数据在绘图阶段需要处理超长情况,所谓超长情况就是按照底板要素定义结构化数据的字体属性绘图时,文本的矩形区域长度超出底板要素定义结构化数据中的宽度值,需要做缩小字体或换行处理,采用哪种策略是底板要素定义结构化数据要素的可选项。
图6显示了本发明实施例提供的可视化数据和结构化数据合成的结构图,如图6所示,先将结构化数据按照底板要素定义结构化数据格式进行结构转换与合并,得到符合RDL规范的RDL实体,如果是文本数据,需要参考图7将底板要素定义结构化数据中的图像位置转换成字体基线位置,文本信息越界时根据底板要素定义结构化数据配置选取换行或缩小字体策略,得到最终的RDL实体;按照图像规范将最终的RDL实体和底板图像数据合成在一起,并处理图像的透明度、旋转,多图像组合等效果,得到可视化图像数据。如图8所示,将可视化图像数据和文件格式的描述数据追加到图像数据的标准扩展块中,最终完成可视化图像数据和结构化数据的合成,如图10所示。描述数据是文本格式的信息,这个格式是一种内部自定义标准,决定了图像自动化处理的工作方式。比如使用描述数据记录图像数字指纹和制作者数字签名,作为图片防伪和校验的基本依据,可以确认制作者身份,防止图片被篡改。也可以从图片的描述中提取结构化数据,做自动化处理。
综上所述,本发明具有以下技术效果:
本发明将单证可视化数据和结构化数据合成通用图片电子单证,让公众能在广泛的终端与设备上查看电子单证,便于人、机阅读,支持防伪和自动化处理,同时支持更广泛的终端与设备对图片电子单证的结构化数据提取和自动化处理。
尽管上文对本发明进行了详细说明,但是本发明不限于此,本技术领域技术人员可以根据本发明的原理进行各种修改。因此,凡按照本发明原理所作的修改,都应当理解为落入本发明的保护范围。
Claims (8)
1.一种可视化数据和结构化数据合成图片的方法,其特征在于,包括以下步骤:
根据底板要素定义结构化数据关于结构化业务数据的定义和描述,对结构化业务数据进行可视化数据形成处理,得到与可视化底板图像数据相匹配的可视化业务数据;
将所述可视化业务数据与所述可视化底板图像数据进行合成处理,得到可视化合成图像数据;
通过将结构化描述数据添加到所述可视化合成图像数据中进行图片生成处理,得到合成图片;
其中,所述的根据所述底板要素定义结构化数据关于结构化业务数据的定义和描述,对结构化的业务数据进行可视化数据形成处理包括:
根据所述底板要素定义结构化数据的要素ID,查找所述业务数据中的对应要素;
按照所述底板要素定义结构化数据的要素ID指定的要素可视化特征,对业务数据中查找到的对应要素进行可视化处理。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据将要形成的图片的轮廓,建立可视化底板图像数据;
建立与所述可视化底板图像数据适配的底板要素定义结构化数据。
3.根据权利要求1所述的方法,其特征在于,所述结构化描述数据包括:对所述可视化合成图像数据具有防伪和校验功能的图像数字指纹和制作者数字签名。
4.根据权利要求3所述的方法,其特征在于,所述的可视化处理包括:
将业务数据中查找到的对应要素进行结构转换,并将业务数据中查找到的对应要素和底板要素定义结构化数据进行合并,得到与所述可视化底板图像数据相匹配的可视化业务数据;
其中,所述结构转换是指将所述对应要素的图像位置转换成字体基线位置。
5.一种可视化数据和结构化数据合成图片的装置,其特征在于,包括:
可视化数据形成模块,用于根据底板要素定义结构化数据关于结构化业务数据的定义和描述,对结构化业务数据进行可视化数据形成处理,得到与可视化底板图像数据相匹配的可视化业务数据;
合成图像数据模块,用于将所述可视化业务数据与所述可视化底板图像数据进行合成处理,得到可视化合成图像数据;
合成图片模块,用于通过将结构化描述数据添加到所述可视化合成图像数据中进行图片生成处理,得到合成图片;
所述的可视化数据形成模块包括:
查找单元,用于根据所述底板要素定义结构化数据的要素ID,查找所述业务数据中的对应要素;
可视化处理单元,用于按照所述底板要素定义结构化数据的要素ID指定的要素可视化特征,对业务数据中查找到的对应要素进行可视化处理。
6.根据权利要求5所述的装置,其特征在于,还包括:
建立模块,用于根据将要形成的图片的轮廓,建立可视化底板图像数据,以及建立与所述可视化底板图像数据适配的底板要素定义结构化数据。
7.根据权利要求5所述的装置,其特征在于,所述可视化描述数据包括:对所述可视化合成图像数据具有防伪和校验功能的图像数字指纹和制作者数字签名。
8.根据权利要求7所述的装置,其特征在于,所述的可视化处理单元包括:
处理子单元,用于将业务数据中查找到的对应要素进行结构转换,并将业务数据中查找到的对应要素和底板要素定义结构化数据进行合并,得到与所述可视化底板图像数据相匹配的可视化业务数据;
其中,所述结构转换是指将所述对应要素的图像位置转换成字体基线位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510524843.6A CN105205790B (zh) | 2015-08-25 | 2015-08-25 | 一种可视化数据和结构化数据合成图片的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510524843.6A CN105205790B (zh) | 2015-08-25 | 2015-08-25 | 一种可视化数据和结构化数据合成图片的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105205790A CN105205790A (zh) | 2015-12-30 |
CN105205790B true CN105205790B (zh) | 2016-08-17 |
Family
ID=54953452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510524843.6A Active CN105205790B (zh) | 2015-08-25 | 2015-08-25 | 一种可视化数据和结构化数据合成图片的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105205790B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740214B (zh) * | 2016-02-18 | 2019-03-26 | 上海联影医疗科技有限公司 | 生成检查报告的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715402A (zh) * | 2013-12-17 | 2015-06-17 | 航天信息股份有限公司 | 基于数字签章的电子发票生成方法 |
CN104778614A (zh) * | 2014-04-30 | 2015-07-15 | 无锡工艺职业技术学院 | 电子发票的生成步骤及其辨伪方法 |
-
2015
- 2015-08-25 CN CN201510524843.6A patent/CN105205790B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715402A (zh) * | 2013-12-17 | 2015-06-17 | 航天信息股份有限公司 | 基于数字签章的电子发票生成方法 |
CN104778614A (zh) * | 2014-04-30 | 2015-07-15 | 无锡工艺职业技术学院 | 电子发票的生成步骤及其辨伪方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105205790A (zh) | 2015-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Embley et al. | Table-processing paradigms: a research survey | |
DeRose et al. | Making hypermedia work: A user’s guide to HyTime | |
JP3940491B2 (ja) | 文書処理装置および文書処理方法 | |
US7576753B2 (en) | Method and apparatus to convert bitmapped images for use in a structured text/graphics editor | |
JP4343213B2 (ja) | 文書処理装置および文書処理方法 | |
US20130191732A1 (en) | Fixed Format Document Conversion Engine | |
JP2749020B2 (ja) | ダイアグラム認識システム | |
US20070065013A1 (en) | Method and apparatus to convert digital ink images for use in a structured text/graphics editor | |
EP2110758B1 (en) | Searching method based on layout information | |
US10803233B2 (en) | Method and system of extracting structured data from a document | |
KR20200102238A (ko) | 데이터 시각화 서비스 시스템, 방법 및 어플리케이션 | |
JP2010108208A (ja) | 文書処理装置 | |
US20080270879A1 (en) | Computer-readable medium, document processing apparatus and document processing system | |
JP2009110500A (ja) | ドキュメント処理装置、ドキュメント処理方法、ドキュメント処理装置のプログラム | |
CN105205790B (zh) | 一种可视化数据和结构化数据合成图片的方法及装置 | |
Chen et al. | The state of the art in creating visualization corpora for automated chart analysis | |
CN114529933A (zh) | 一种合同数据差异性的比对方法、装置、设备和介质 | |
CN105912723A (zh) | 一种自定义字段的存储方法 | |
Lin et al. | Font generation of personal handwritten Chinese characters | |
Petrova et al. | Methods of machine-readable zone recognition results post-processing | |
CN112395834B (zh) | 基于图片输入的脑图生成方法、装置、设备及存储介质 | |
CN111241955B (zh) | 一种票据信息提取方法及系统 | |
Homburg et al. | 3D data derivatives of the Haft Tappeh processing pipeline | |
CN111222310A (zh) | 一种不规则表单的录入和展示的方法及系统 | |
CN113255499B (zh) | 一种变电站电缆二次回路数字化自动建模方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |