CN112507931A - 一种基于深度学习的信息图表序列检测方法及系统 - Google Patents

一种基于深度学习的信息图表序列检测方法及系统 Download PDF

Info

Publication number
CN112507931A
CN112507931A CN202011489925.9A CN202011489925A CN112507931A CN 112507931 A CN112507931 A CN 112507931A CN 202011489925 A CN202011489925 A CN 202011489925A CN 112507931 A CN112507931 A CN 112507931A
Authority
CN
China
Prior art keywords
information
chart
elements
information chart
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011489925.9A
Other languages
English (en)
Other versions
CN112507931B (zh
Inventor
蔡毅
林捷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202011489925.9A priority Critical patent/CN112507931B/zh
Publication of CN112507931A publication Critical patent/CN112507931A/zh
Application granted granted Critical
Publication of CN112507931B publication Critical patent/CN112507931B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于深度学习的信息图表序列检测方法及系统,该方法步骤包括:获取信息图表以及信息图表中所有元素的元素类型和元素属性;根据信息图表中的元素,获取包含不同元素的截图;根据信息图表中的元素、包含不同元素的截图,训练识别信息图表中信息块的深度卷积网络;根据信息图表、信息图表中的元素、包含不同元素的截图和训练后的深度卷积网络,确定待识别信息图表中的信息块;根据待识别信息图表中的信息块识别结果,确定待识别信息图表中的信息序列。本发明对于信息图表的信息序列识别具有较高的准确性和鲁棒性。

Description

一种基于深度学习的信息图表序列检测方法及系统
技术领域
本发明涉及信息图表序列检测技术领域,具体涉及一种基于深度学习的信息图表序列检测方法及系统。
背景技术
随着科技的发展,办公软件越来越成为人们工作生活的重要组成部分。信息图表是办公软件的重要组成部分,用户将需要展示数据、知识等信息制作成信息图表,可以在投影仪或者计算机上进行演示。
为信息图表添加统一美观的装饰性元素,可以降低观众从信息图表中获取信息的难度。然而,对于没有充足的设计知识的信息图表制作者来说,为信息图表设计和添加统一美观的装饰性元素,是非常耗费时间和精力的。
许多信息图表的设计软件(如WPS Office、Microsoft PowerPoint)拥有大量由专业设计师完成的信息图表模板,信息图表的模板套用可以自动将用户的输入信息填入合适的信息图表模板中。要完成这个工作,需要设计模型识别信息图表模板和信息图表草稿的信息序列部分,并为信息序列中的每个元素确定信息块和逻辑次序。在此基础上,确定模板和用户草稿中的元素和信息块的匹配关系,即可完成信息图表的模板套用。
然而,现有技术在识别信息图表中的信息序列时,没有考虑信息块的识别;也没有考虑信息序列和信息块之间的逻辑关系,导致在信息图表套用中,出现套用效果较差的问题。
发明内容
为了克服现有技术存在的缺陷与不足,本发明提供一种基于深度学习的信息图表序列检测方法及系统,本发明利用深度卷积网络提取待识别信息图表中的信息块的特征,利用特定元素类型的元素作为信息块的种子元素集合来确定信息序列,对于信息图表的信息块识别具有较高的准确性,对于信息图表的信息序列识别具有较好的鲁棒性。
为了达到上述目的,本发明采用以下技术方案:
本发明提供一种基于深度学习的信息图表序列检测方法,包括下述步骤:
获取信息图表以及信息图表中所有元素的元素类型和元素属性;
根据信息图表中的元素,获取包括不同元素的截图,将信息图表中的所有元素两两组合后,与对应的截图框组合成为信息图表三元组集合;
根据信息图表中的元素、包括不同元素的截图,训练识别信息图表中信息块的深度卷积网络;
根据信息图表中的元素、包括不同元素的截图和训练后的深度卷积网络,确定待识别信息图表中的信息块;
根据待识别信息图表中的信息块识别结果,确定待识别信息图表中的信息序列。
作为优选的技术方案,所述元素类型包括:信息文本、信息注解图标、信息注解标题、信息注解文本、信息注解标记、信息标记、信息主体、信息图表标题、信息图表副标题、信息图表文本和信息图表装饰。
作为优选的技术方案,所述元素属性包括元素位置框,其定义为描述元素的位置和大小的一个四元组(x,y,w,h),分别代表元素框左上角距离信息图表左上角的水平距离和距离信息图表左上角的垂直距离,元素方框的宽、高。
作为优选的技术方案,所述将信息图表中的所有元素两两组合后,与对应的截图框组合成为信息图表三元组集合,具体步骤包括:
将信息图表中的所有元素两两组合,得到元素组合的集合Ttuple={(ei,ej)},ei,ej∈E′,E′为当前信息图表内的所有元素;
根据元素组合中两个元素的元素位置框,在信息图表中选取一个将两个元素包含进去的截图框pij=(xp,yp,wp,hp),选取方式如下:
xp=min(xi,xj)
yp=min(yi,yj)
wp=max(xi,xj)-min(xi,xj)
hp=max(yi,yj)-min(yi,yj)
其中,xi,yi为元素ei的元素框左上角距离信息图表左上角的水平距离和距离信息图表左上角的垂直距离,xj,yj为元素ej的元素框左上角距离信息图表左上角的水平距离和距离信息图表左上角的垂直距离;
将信息图表中的所有的元素组合及其对应的截图框组合成为信息图表三元组集合Ttriplet={(ei,ej,pij)}。
作为优选的技术方案,所述训练识别信息图表中信息块的深度卷积网络,具体步骤包括:
根据信息图表三元组集合,对于集合中的每一个元素截图,由人工标注截图中所包括的两个元素是否属于同一个信息块,将截图和信息块标签组成一个数据标签对,使用数据标签对训练深度卷积网络模型。
作为优选的技术方案,所述确定待识别信息图表中的信息块,具体步骤包括:
获取待识别信息图表中的信息图表三元组集合,表示为:T′triplet={(e′i,e′j,p′ij)},使用训练后的深度卷积网络,根据信息图表三元组集合中的每一个三元组(e′i,e′j,p′ij)中的元素截图p′ij,预测元素截图p′ij所包含的元素e′i、e′j是否属于相同的信息块;
将当前信息图表中所有的信息块预测结果和对应的信息元素组合组成信息块三元组的集合T′block={(e′i,e′j,t′ij)},其中,t′ij代表e′i和e′j是否属于同一个信息块。
作为优选的技术方案,所述根据待识别信息图表中的信息块识别结果,确定待识别信息图表中的信息序列,具体步骤包括:
从待识别信息图表中选择一种特定元素类型的元素,构成种子元素集合,集合中的每个元素分别属于各不相同的一个信息块;
遍历种子元素集合中的每个元素e,从信息块三元组的集合T′block={(e′i,e′j,t′ij)}中找出模型预测和e属于同一个信息块的所有其他元素,将这些元素确定为与元素e属于相同的信息块;
遍历完成后,得到信息图表的信息块集合,信息块集合的形式化表达为:B={s1,...,sk}(k≥2),其中sk={e1,...,et}(t≥1),其中et为信息图表中的元素;
遍历信息块集合中的每个信息块sk,对信息块sk中所有元素的中心点取均值,得到信息块sk的中心点;
对信息块的中心点进行升序排序,根据排序值,确定每个信息块的排序序号。
作为优选的技术方案,所述对信息块sk中所有元素的中心点取均值,具体计算公式为:
Figure BDA0002840426160000041
Figure BDA0002840426160000042
所述排序值计算公式为:
Figure BDA0002840426160000043
其中,xi为信息块sk中第i个元素的元素框左上角距离信息图表左上角的水平距离,wi为信息块sk中第i个元素的元素框宽;yi为信息块sk中第i个元素的元素框左上角距离信息图表左上角的垂直距离,hi为信息块sk中第i个元素的元素框高。
作为优选的技术方案,所述信息块中的元素类型包含信息文本、信息注解图标、信息注解标题和信息注解文本四种元素类型。
本发明还提供一种基于深度学习的信息图表序列检测系统,包括:元素信息获取模块、信息图表三元组集合构建模块、深度卷积网络训练模块、信息块确定模块和信息序列确定模块;
所述元素信息获取模块用于获取信息图表以及信息图表中所有元素的元素类型和元素属性;
所述信息图表三元组集合构建模块用于根据信息图表中的元素,获取包括不同元素的截图,将信息图表中的所有元素两两组合后,与对应的截图框组合成为信息图表三元组集合;
所述深度卷积网络训练模块用于根据信息图表中的元素、包括不同元素的截图,训练识别信息图表中信息块的深度卷积网络;
所述信息块确定模块用于根据信息图表中的元素、包括不同元素的截图和训练后的深度卷积网络,确定待识别信息图表中的信息块;
所述信息序列确定模块用于根据待识别信息图表中的信息块识别结果,确定待识别信息图表中的信息序列。
本发明与现有技术相比,具有如下优点和有益效果:
本发明对于信息图标的信息块识别具有较高的准确性,对于信息图表中的信息序列识别具有较好的鲁棒性,解决了现有技术在识别信息图表的信息序列时,没有充分考虑信息块的识别,也没有考虑信息序列和信息块之间的结构关系,导致信息图表的信息序列识别效果较差的问题。
附图说明
图1为本发明基于深度学习的信息图表序列检测方法的流程示意图;
图2为本发明信息图表和信息序列、信息块、元素之间的层级关系示意图;
图3为本发明信息图表标题、信息标记、信息主体、信息文本、信息注解文本元素的示意图;
图4为本发明信息图表文本、信息图表装饰、信息注解图标、信息注解标题元素的示意图;
图5为本发明信息注解标记元素的示意图;
图6为本发明深度卷积网络的模型结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
如图1所示,本实施例提供一种基于深度学习的信息图表序列检测方法,包括下述步骤:
S1:获取信息图表以及信息图表中所有元素的元素类型和元素属性;
信息序列的定义为:信息图表中用于传递信息的信息块的有序序列,信息块的序列顺序代表信息图表中传递的信息的先后顺序。
信息图表的定义为:信息图表是用于展示信息、数据、知识等的视觉可视化图表,它使用文本传达信息,并广泛利用静态的图形元素、动态的元素动画以及装饰性元素,帮助观众快速理解图表中的信息、数据和知识。所述元素的定义为:元素是指放置在信息图表中的具有形状的、可填充内容(如文本、图片)的对象,是信息图表中的基本对象;
具体地,信息图表中的元素类型包括:信息文本、信息注解图标、信息注解标题、信息注解文本、信息注解标记、信息标记、信息主体、信息图表标题、信息图表副标题、信息图表文本、信息图表装饰;
元素属性包括:元素位置框,其定义为描述元素的位置和大小的一个四元组(x,y,w,h),分别代表元素框左上角距离信息图表左上角的水平距离和距离信息图表左上角的垂直距离,元素方框的宽、高。本实施例中的信息图表的元素示例如图2中的信息图表元素4a所示,该元素的x为16.92厘米,y为12.69厘米,w为4.62厘米,h为3.12厘米。
信息图表标题的定义为:一张信息图表的标题,用于概括描述一张信息图表的主要内容。本实施例中的信息图表标题元素示例如图3中的信息图表标题1a所示;
信息标记的定义为:一种装饰性元素,用于标记特定的信息。本实施例中的信息标记元素示例如图3中的信息标记元素2a所示;
信息主体的定义为:表明信息的逻辑顺序或整体结构的装饰性元素。本实施例中的信息主体元素示例如图3中的信息主体元素3a所示;
信息块的定义为:一个信息块由若干元素(一个或者多个,且至少包含一个元素)集合而成,独立表达信息序列中的一个信息;信息块中的元素类型只包括信息文本、信息注解图标、信息注解标题、信息注解文本四种,其他元素类型的元素不包括在信息块中。
信息文本定义为:信息块中字数较少的文本,用于提示当前信息块相对于整个信息图表的关系(如当前信息块的顺序、重要性等),信息文本是信息块内的元素;本实施例中的信息文本元素示例如图3中的信息文本元素4a所示;
信息注解文本的定义为:信息块中的文本,表明了信息图表中的一个信息的主要内容,信息注解文本是信息块内的元素;本实施例中的信息注解文本元素示例如图3中的信息注解文本元素5a所示;
信息图表副标题的定义为:一张信息图表的副标题,用于辅助信息图表标题,概括一张信息图表的主要内容。本实施例中的信息图表副标题元素示例如图3中的信息图表副标题6a所示;
信息图表文本的定义为:一张信息图表中的非信息块形式的表达信息的文本。本实施例中的信息图表文本元素示例如图4中的信息图表文本1a所示;
信息图表装饰的定义为:一张信息图表中的与信息无关的装饰性元素。本实施例中的信息图表装饰元素示例如图4中的信息图表装饰2a所示;
信息注解图标定义为:信息块中的图标或图片,用于表达信息图表中的一个信息的部分内容,信息注解图标是信息块内的元素;本实施例中的信息注解图标元素示例如图4中的信息注解图标元素3a所示;
信息注解标题的定义为:信息块中的标题,表明了信息图表中的一个信息的内容概要,信息注解标题是信息块内的元素;本实施例中的信息注解标题元素示例如图4中的信息注解标题元素4a所示;
信息注解标记的定义为:作为背景装饰信息块的装饰性元素(不属于信息块),用于将信息注解标题、信息注解文本和信息注解图标在视觉上组合成一个整体。本实施例中的信息注解标记元素示例如图5中的信息注解标记元素1a所示;
S2:根据信息图表中的元素,获取包含不同元素的截图;
将信息图表中的所有元素两两组合,得到元素组合的集合Ttuple={(ei,ej)},ei,ej∈E′,E′为当前信息图表内的所有元素;
根据元素组合中两个元素的元素位置框,在信息图表中选取一个可以将两个元素包含进去的截图框pij=(xp,yp,wp,hp),选取方式如下:
xp=min(xi,xj)
yp=min(yi,yj)
wp=max(xi,xj)-min(xi,xj)
hp=max(yi,yj)-min(yi,yj)
其中,xi,yi为元素ei的元素框左上角距离信息图表左上角的水平距离和距离信息图表左上角的垂直距离,xj,yj为元素ej的元素框左上角距离信息图表左上角的水平距离和距离信息图表左上角的垂直距离。
将信息图表中的所有的元素组合及其对应的截图框组合成为信息图表三元组集合Ttriplet={(ei,ej,pij)}。
本实施例中,信息图表元素截图示例如图6所示,根据信息图表元素5a和信息图表元素6a得到信息图表截图1a,信息图表截图1a的截图框中,xp为12.89厘米,yp为0.47厘米,wp为4.34厘米,hp为12.41厘米。
S3:根据信息图表中的元素、包含不同元素的截图,训练识别信息图表中信息块的深度卷积网络;
具体地,根据步骤S2所述的方法,获得的信息图表三元组集合Ttriplet={(ei,ej,pij)},对于集合中的每一个元素截图pij,由人工标注截图中所包括的两个元素是否属于同一个信息块(属于同一个信息块标为1,不属于同一个信息块标为0),将截图和信息块标签组成一个数据标签对<元素截图pij,信息块标签>,使用数据标签对训练深度卷积网络模型。
本实施例中,深度卷积网络模型示例如图6卷积神经网络3a所示,优选地,深度卷积网络模型采用一个深度金字塔网络,模型接收如图6所示的信息图表截图1a,获得多个层级的特征表示,由多层级的特征表示,得到预测结果如图6信息块识别结果4a所示,模型根据信息块标签和预测结果的差异进行训练。
S4:根据信息图表中的元素、包含不同元素的截图和训练后的深度卷积网络,确定待识别信息图表中的信息块;
具体地,根据步骤(2)取得待识别信息图表中的信息图表三元组集合T′triplet={(e′i,e′j,pij)},使用训练后的深度卷积网络,根据信息图表三元组集合中的每一个三元组(e′i,e′j,p′ij)中的元素截图p′ij,预测元素截图p′ij所包含的元素e′i、e′j是否属于相同的信息块;
将当前信息图表中所有的信息块预测结果和对应的信息元素组合组成信息块三元组的集合T′block={(e′i,e′j,t′ij)},其中,t′ij代表e′i和e′j是否属于同一个信息块。
S5:根据待识别信息图表中的信息块识别结果,确定待识别信息图表中的信息序列。
具体地,从待识别信息图表中选择一种特定元素类型的元素(较优地,选择的元素类型为信息注解文本),构成种子元素集合,集合中的每个元素分别属于各不相同的一个信息块;
遍历种子元素集合中的每个元素e,从信息块三元组的集合T′block={(e′i,e′j,t′ij)}中找出模型预测和e属于同一个信息块的所有其他元素,将这些元素确定为与元素e属于相同的信息块。遍历完成后,得到信息图表的信息块集合,信息块集合的形式化表达为:B={s1,...,sk}(k≥2),其中sk={e1,...,et}(t≥1),其中et为信息图表中的元素。
遍历信息块集合中的每个信息块sk,对信息块sk中所有元素的中心点取均值,得到信息块sk的中心点,其计算公式为:
Figure BDA0002840426160000101
Figure BDA0002840426160000111
其中,xi为信息块sk中第i个元素的元素框左上角距离信息图表左上角的水平距离,wi为信息块sk中第i个元素的元素框宽;yi为信息块sk中第i个元素的元素框左上角距离信息图表左上角的垂直距离,hi为信息块sk中第i个元素的元素框高。
对信息块的中心点进行升序排序,根据排序值,确定每个信息块的排序序号。排序值的计算公式为:
Figure BDA0002840426160000112
本实施例还提供一种基于深度学习的信息图表序列检测系统,包括:元素信息获取模块、信息图表三元组集合构建模块、深度卷积网络训练模块、信息块确定模块和信息序列确定模块;
在本实施例中,元素信息获取模块用于获取信息图表以及信息图表中所有元素的元素类型和元素属性;
在本实施例中,信息图表三元组集合构建模块用于根据信息图表中的元素,获取包括不同元素的截图,将信息图表中的所有元素两两组合后,与对应的截图框组合成为信息图表三元组集合;
在本实施例中,深度卷积网络训练模块用于根据信息图表中的元素、包括不同元素的截图,训练识别信息图表中信息块的深度卷积网络;
在本实施例中,信息块确定模块用于根据信息图表中的元素、包括不同元素的截图和训练后的深度卷积网络,确定待识别信息图表中的信息块;
在本实施例中,信息序列确定模块用于根据待识别信息图表中的信息块识别结果,确定待识别信息图表中的信息序列。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.一种基于深度学习的信息图表序列检测方法,其特征在于,包括下述步骤:
获取信息图表以及信息图表中所有元素的元素类型和元素属性;
根据信息图表中的元素,获取包括不同元素的截图,将信息图表中的所有元素两两组合后,与对应的截图框组合成为信息图表三元组集合;
根据信息图表中的元素、包括不同元素的截图,训练识别信息图表中信息块的深度卷积网络;
根据信息图表中的元素、包括不同元素的截图和训练后的深度卷积网络,确定待识别信息图表中的信息块;
根据待识别信息图表中的信息块识别结果,确定待识别信息图表中的信息序列。
2.根据权利要求1所述的基于深度学习的信息图表序列检测方法,其特征在于,所述元素类型包括:信息文本、信息注解图标、信息注解标题、信息注解文本、信息注解标记、信息标记、信息主体、信息图表标题、信息图表副标题、信息图表文本和信息图表装饰。
3.根据权利要求1所述的基于深度学习的信息图表序列检测方法,其特征在于,所述元素属性包括元素位置框,其定义为描述元素的位置和大小的一个四元组(x,y,w,h),分别代表元素框左上角距离信息图表左上角的水平距离和距离信息图表左上角的垂直距离,元素方框的宽、高。
4.根据权利要求1所述的基于深度学习的信息图表序列检测方法,其特征在于,所述将信息图表中的所有元素两两组合后,与对应的截图框组合成为信息图表三元组集合,具体步骤包括:
将信息图表中的所有元素两两组合,得到元素组合的集合Ttuple={(ei,ej)},ei,ej∈E′,E′为当前信息图表内的所有元素;
根据元素组合中两个元素的元素位置框,在信息图表中选取一个将两个元素包含进去的截图框pij=(xp,yp,wp,hp),选取方式如下:
xp=min(xi,xj)
yp=min(yi,yj)
wp=max(xi,xj)-min(xi,xj)
hp=max(yi,yj)-min(yi,yj)
其中,xi,yi为元素ei的元素框左上角距离信息图表左上角的水平距离和距离信息图表左上角的垂直距离,xj,yj为元素ej的元素框左上角距离信息图表左上角的水平距离和距离信息图表左上角的垂直距离;
将信息图表中的所有的元素组合及其对应的截图框组合成为信息图表三元组集合Ttriplet={(ei,ej,pij)}。
5.根据权利要求1所述的基于深度学习的信息图表序列检测方法,其特征在于,所述训练识别信息图表中信息块的深度卷积网络,具体步骤包括:
根据信息图表三元组集合,对于集合中的每一个元素截图,由人工标注截图中所包括的两个元素是否属于同一个信息块,将截图和信息块标签组成一个数据标签对,使用数据标签对训练深度卷积网络模型。
6.根据权利要求1所述的基于深度学习的信息图表序列检测方法,其特征在于,所述确定待识别信息图表中的信息块,具体步骤包括:
获取待识别信息图表中的信息图表三元组集合,表示为:T′triplet={(e′i,e′j,p′ij)},使用训练后的深度卷积网络,根据信息图表三元组集合中的每一个三元组(e′i,e′j,p′ij)中的元素截图p′ij,预测元素截图p′ij所包含的元素e′i、e′j是否属于相同的信息块;
将当前信息图表中所有的信息块预测结果和对应的信息元素组合组成信息块三元组的集合T′block={(e′i,e′j,t′ij)},其中,t′ij代表e′i和e′j是否属于同一个信息块。
7.根据权利要求1所述的基于深度学习的信息图表序列检测方法,其特征在于,所述根据待识别信息图表中的信息块识别结果,确定待识别信息图表中的信息序列,具体步骤包括:
从待识别信息图表中选择一种特定元素类型的元素,构成种子元素集合,集合中的每个元素分别属于各不相同的一个信息块;
遍历种子元素集合中的每个元素e,从信息块三元组的集合T′block={(e′i,e′j,t′ij)}中找出模型预测和e属于同一个信息块的所有其他元素,将这些元素确定为与元素e属于相同的信息块;
遍历完成后,得到信息图表的信息块集合,信息块集合的形式化表达为:B={s1,...,sk}(k≥2),其中sk={e1,...,et}(t≥1),其中et为信息图表中的元素;
遍历信息块集合中的每个信息块sk,对信息块sk中所有元素的中心点取均值,得到信息块sk的中心点;
对信息块的中心点进行升序排序,根据排序值,确定每个信息块的排序序号。
8.根据权利要求7所述的基于深度学习的信息图表序列检测方法,其特征在于,所述对信息块sk中所有元素的中心点取均值,具体计算公式为:
Figure FDA0002840426150000031
Figure FDA0002840426150000032
所述排序值计算公式为:
Figure FDA0002840426150000033
其中,xi为信息块sk中第i个元素的元素框左上角距离信息图表左上角的水平距离,wi为信息块sk中第i个元素的元素框宽;yi为信息块sk中第i个元素的元素框左上角距离信息图表左上角的垂直距离,hi为信息块sk中第i个元素的元素框高。
9.根据权利要求1所述的基于深度学习的信息图表序列检测方法,其特征在于,所述信息块中的元素类型包含信息文本、信息注解图标、信息注解标题和信息注解文本四种元素类型。
10.一种基于深度学习的信息图表序列检测系统,其特征在于,包括:元素信息获取模块、信息图表三元组集合构建模块、深度卷积网络训练模块、信息块确定模块和信息序列确定模块;
所述元素信息获取模块用于获取信息图表以及信息图表中所有元素的元素类型和元素属性;
所述信息图表三元组集合构建模块用于根据信息图表中的元素,获取包括不同元素的截图,将信息图表中的所有元素两两组合后,与对应的截图框组合成为信息图表三元组集合;
所述深度卷积网络训练模块用于根据信息图表中的元素、包括不同元素的截图,训练识别信息图表中信息块的深度卷积网络;
所述信息块确定模块用于根据信息图表中的元素、包括不同元素的截图和训练后的深度卷积网络,确定待识别信息图表中的信息块;
所述信息序列确定模块用于根据待识别信息图表中的信息块识别结果,确定待识别信息图表中的信息序列。
CN202011489925.9A 2020-12-16 2020-12-16 一种基于深度学习的信息图表序列检测方法及系统 Active CN112507931B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011489925.9A CN112507931B (zh) 2020-12-16 2020-12-16 一种基于深度学习的信息图表序列检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011489925.9A CN112507931B (zh) 2020-12-16 2020-12-16 一种基于深度学习的信息图表序列检测方法及系统

Publications (2)

Publication Number Publication Date
CN112507931A true CN112507931A (zh) 2021-03-16
CN112507931B CN112507931B (zh) 2023-12-22

Family

ID=74972795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011489925.9A Active CN112507931B (zh) 2020-12-16 2020-12-16 一种基于深度学习的信息图表序列检测方法及系统

Country Status (1)

Country Link
CN (1) CN112507931B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116452702A (zh) * 2023-06-15 2023-07-18 深圳大学 信息图表快速设计方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2370207A1 (en) * 1989-09-29 1991-03-30 James R. Savage Parallel processing system
WO2007048008A2 (en) * 2005-10-21 2007-04-26 Fair Isaac Corporation Method and apparatus for retail data mining using pair-wise co-occurrence consistency
CN110968708A (zh) * 2019-12-20 2020-04-07 华中师范大学 一种教育信息资源属性标注方法及系统
CN111858905A (zh) * 2020-07-20 2020-10-30 北京百度网讯科技有限公司 模型训练方法、信息识别方法、装置、电子设备及存储介质
CN111950528A (zh) * 2020-09-02 2020-11-17 北京猿力未来科技有限公司 图表识别模型训练方法以及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2370207A1 (en) * 1989-09-29 1991-03-30 James R. Savage Parallel processing system
WO2007048008A2 (en) * 2005-10-21 2007-04-26 Fair Isaac Corporation Method and apparatus for retail data mining using pair-wise co-occurrence consistency
CN110968708A (zh) * 2019-12-20 2020-04-07 华中师范大学 一种教育信息资源属性标注方法及系统
CN111858905A (zh) * 2020-07-20 2020-10-30 北京百度网讯科技有限公司 模型训练方法、信息识别方法、装置、电子设备及存储介质
CN111950528A (zh) * 2020-09-02 2020-11-17 北京猿力未来科技有限公司 图表识别模型训练方法以及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张豹;陈伟荣;张梦易;吴天星;漆桂林;: "通过标签嵌入从社交标签中挖掘上下位关系", 指挥信息系统与技术, no. 04, pages 68 - 73 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116452702A (zh) * 2023-06-15 2023-07-18 深圳大学 信息图表快速设计方法、装置、计算机设备和存储介质
CN116452702B (zh) * 2023-06-15 2023-08-18 深圳大学 信息图表快速设计方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN112507931B (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
US9875429B2 (en) Font attributes for font recognition and similarity
US8832080B2 (en) System and method for determining dynamic relations from images
CN102207950B (zh) 电子装置和图像处理方法
US9824304B2 (en) Determination of font similarity
CN103488339B (zh) 一种个性化汉字数字墨水的生成方法
CN106537390B (zh) 标识教育视频的呈现样式
CN109849576B (zh) 一种参考灰度图辅助绘画的方法
CN110119688A (zh) 一种利用视觉注意力协同网络的图像情感分类方法
US20200285951A1 (en) Figure captioning system and related methods
WO2014100936A1 (zh) 视频的关联信息库制作和视频播放的方法、平台及系统
CN112507931B (zh) 一种基于深度学习的信息图表序列检测方法及系统
CN108509567A (zh) 一种数字文化内容库搭建的方法及装置
CN116862166A (zh) 一种岗位匹配方法、装置、设备及计算机存储介质
CN113705176A (zh) 平面排版方法及系统
CN111178083A (zh) 一种bim和gis的语义匹配方法及装置
CN111144466B (zh) 一种图像样本自适应的深度度量学习方法
CN110458751B (zh) 一种基于粤剧图片的面部替换方法、设备及介质
CN110347686A (zh) 记录工程图修改信息的方法和系统
WO2022033135A1 (zh) 一种基于故事线的手绘视频创作方法和装置
JP6623597B2 (ja) 情報処理装置及びプログラム
JP2015225398A (ja) デザイン管理装置及びプログラム
CN106547891A (zh) 针对掌上显示设备的图片化文本信息的快速可视化方法
CN113590918A (zh) 基于课程式学习的社交媒体舆情热度监测的框架构建方法
Angrave et al. Creating TikToks, Memes, Accessible Content, and Books from Engineering Videos? First Solve the Scene Detection Problem.
Duester Digitization and culture in Vietnam

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant