CN113111858A - 自动检测图片中表格的方法、装置、设备和存储介质 - Google Patents

自动检测图片中表格的方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN113111858A
CN113111858A CN202110513879.XA CN202110513879A CN113111858A CN 113111858 A CN113111858 A CN 113111858A CN 202110513879 A CN202110513879 A CN 202110513879A CN 113111858 A CN113111858 A CN 113111858A
Authority
CN
China
Prior art keywords
picture
target detection
target
training
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110513879.XA
Other languages
English (en)
Inventor
曹峰
黄夫龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinascope Shanghai Technology Co ltd
Original Assignee
Chinascope Shanghai Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinascope Shanghai Technology Co ltd filed Critical Chinascope Shanghai Technology Co ltd
Priority to CN202110513879.XA priority Critical patent/CN113111858A/zh
Publication of CN113111858A publication Critical patent/CN113111858A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于图像检测技术领域,具体涉及一种自动检测图片中表格的方法、装置、设备和存储介质。其中方法包括:获取待检测图片,调用预设的目标检测模型,通过目标检测模型对待检测图片进行目标检测,得到目标检测结果,目标检测结果包括包括目标、目标在待检测图片中的坐标位置和分类标签;根据目标检测结果对待检测图片进行标记后输出。本发明通过训练好的目标检测模型能精准的识别出上市公司披露的公告数据中表格、文本段、图表等目标所在的位置区域,并对每个区域进行置信度标记,为后续内容可分类处理打下基础,也减少不同目标之间的相互干扰。

Description

自动检测图片中表格的方法、装置、设备和存储介质
技术领域
本发明属于图像检测技术领域,具体涉及一种自动检测图片中表格的方法、装置、设备和存储介质。
背景技术
随着互联网的快速发展,为方便更多投资者进行投资,许多券商或投资机构对于上市公司都会定期做一个专业的研究报告作为上市公司公告数据。这些数据都是以图片的形式进行披露展示。
在挖掘上市公司公告数据的过程中,会有很多表格数据以无线框和图片的方式进行披露,这给后续解析造成一个很大问题就是如何定位表格区域,以便更好的解析公告数据。
发明内容
本发明针对上市公司公告数据中无法定位表格区域的技术问题,目的在于提供一种自动检测图片中表格的方法、装置、设备和存储介质。
一种自动检测图片中表格的方法,包括:
获取待检测图片,调用预设的目标检测模型,通过所述目标检测模型对所述待检测图片进行目标检测,得到目标检测结果,所述目标检测结果包括目标、所述目标在所述待检测图片中的坐标位置和分类标签;
根据所述目标检测结果对所述待检测图片进行标记后输出。
可选的,所述获取待检测图片,调用预设的目标检测模型之前,包括对所述目标检测模型进行训练,训练过程包括:
从公告中披露的公告数据中获取多张样本图片,定义目标识别的分类标签;
根据所述分类标签对所述样本图片进行标注,生成用来训练的训练数据;
调用预设的目标检测模型,初始化所述目标检测模型,根据标注好的所述训练数据,利用目标检测算法训练所述目标检测模型,训练出适用于公告数据的目标检测模型。
可选的,所述分类标签包括标题、表格、特殊表格、文本、特殊结构、页眉或页脚中的至少一种。
可选的,所述目标检测算法采用Faster R-CNN目标检测算法。
可选的,所述获取待检测图片,调用预设的目标检测模型,包括:
获取待检测图片,将所述待检测图片的大小处理成最大不超过600*1024;
所述根据所述分类标签对所述样本图片进行标注之前,包括:
对样本图片的大小处理成最大不超过600*1024后,根据所述分类标签对所述样本图片进行标注。
可选的,所述根据标注好的所述训练数据,利用目标检测算法训练所述目标检测模型,训练出适用于公告数据的目标检测模型,包括:
使用预设的图片分类模型提取所述训练数据中样本图片的图片特征;
将所述图片特征输入RPN网络(Region Proposal Network,区域候选网络),得到多个proposals(候选区域);
将所述图片特征和多个所述候选区域输入RoI Pooling(特征池化层),得到综合的候选特征;
根据所述候选特征预测目标的区域框和目标的类别,所述目标的类别为所述分类标签。
可选的,所述图片分类模型采用VGG16网络模型,所述图片分类模型的模型特征提取器采用faster_rcnn_resnet101。
可选的,所述根据所述候选特征预测目标的区域框和目标的类别时,所述目标的目标对象比例尺(scales)设置时最小为0.25、最大为2;
所述目标的目标对象重叠率(iou_threshold)取值在0到1之间,优选设置为0.1;
所述目标的训练步数(schedule.step)设置为75000步。
可选的,对所述目标检测模型进行训练,还包括:
获取新的公告数据,从新的公告数据中获取多张新的样本图片;
根据所述分类标签对所述新的样本图片进行标注,生成用来训练的新的训练数据;
调用所述目标检测模型,根据标注好的所述新的训练数据,利用目标检测算法训练所述目标检测模型,训练出适用于公告数据的目标检测模型。
可选的,所述利用目标检测算法训练所述目标检测模型时,所述目标检测模型的训练步数是初次训练步数的十分之一。
可选的,所述根据所述目标检测结果对所述待检测图片进行标记后输出,包括:
所述目标检测结果还包括置信度数据,对所述待检测图片进行标记时,还标记每个目标的置信度数据。
一种自动检测图片中表格的装置,包括:
目标检测模块,用于获取待检测图片,调用预设的目标检测模型,通过所述目标检测模型对所述待检测图片进行目标检测,得到目标检测结果,所述目标检测结果包括包括目标、所述目标在所述待检测图片中的坐标位置和分类标签;
标记和输出模块,用于根据所述目标检测结果对所述待检测图片进行标记后输出。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述自动检测图片中表格的方法的步骤。
一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述自动检测图片中表格的方法的步骤。
本发明的积极进步效果在于:本发明采用自动检测图片中表格的方法、装置、设备和存储介质,通过训练好的目标检测模型能精准的识别出上市公司披露的公告数据中表格、文本段、图表等目标所在的位置区域,并对每个区域进行置信度标记,为后续内容可分类处理打下基础,也减少不同目标之间的相互干扰。本发明还解决了常规公告中无线框表格无法确定表格所在位置或区域大小的问题。
附图说明
图1为本发明的一种流程示意图;
图2为本发明的一种经目标检测的图片进行标记后的效果图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示进一步阐述本发明。
参照图1,一种自动检测图片中表格的方法,包括:
S1,对图片进行目标检测:获取待检测图片,调用预设的目标检测模型,通过目标检测模型对待检测图片进行目标检测,得到目标检测结果,目标检测结果包括包括目标、目标在待检测图片中的坐标位置、分类标签和置信度数据。
本步骤中的目标检测模型是通过训练后得到的适用于上市公司公告数据的目标检测模型。其中分类标签即为目标的目标类别,本发明的分类标签包括标题、表格、特殊表格、文本、特殊结构、页眉或页脚中的至少一种。
在一个实施例中,本步骤中在获取待检测图片后,还对待检测图片进行了预处理,再调用预设的目标检测模型。预处理的过程主要是调节待检测图片的图片大小,将待检测图片的大小处理成最大不超过600*1024的图片。因为图片太大了目标检测的效率会降低,图片太小了检测效果会变差。
在一个实施例中,获取待检测图片,调用预设的目标检测模型之前,包括步骤S0,对目标检测模型进行训练,训练过程包括:
S001,筛选样本图片:从公告中披露的公告数据中获取多张样本图片,定义目标识别的分类标签。
本步骤中,获取的公告数据尽可能的覆盖所有分类标签。
S002,标注训练数据:根据分类标签对样本图片进行标注,生成用来训练的训练数据。
标注过程就是对样本图片中的目标区域打上预先定义的分类标签。本步骤可以使用开源的目标检测标注工具(labelImg)对样本图片进行标注。
本步骤中对样本图片的大小处理成最大不超过600*1024后,根据分类标签对样本图片进行标注。
S003,训练模型:调用预设的目标检测模型,初始化目标检测模型,根据标注好的训练数据,利用目标检测算法训练目标检测模型,训练出适用于公告数据的目标检测模型。
本步骤中的目标检测算法采用Faster R-CNN目标检测算法。
本步骤在利用目标检测算法训练目标检测模型时,包括:
使用预设的图片分类模型提取训练数据中样本图片的图片特征;将图片特征输入RPN网络(Region Proposal Network,区域候选网络),得到多个proposals(候选区域);将图片特征和多个候选区域输入RoI Pooling(特征池化层),得到综合的候选特征;根据候选特征预测目标的区域框和目标的类别,目标的类别为分类标签。
图片分类模型采用VGG16网络模型,图片分类模型的模型特征提取器采用faster_rcnn_resnet101。
根据候选特征预测目标的区域框和目标的类别时,目标的目标对象比例尺(scales)设置时最小为0.25、最大为2。目标的目标对象重叠率(iou_threshold)取值在0到1之间,本发明目标对象的数据区域检测重叠概率非常小,因此优选设置为0.1。目标的训练步数(schedule.step)设置为75000步,太高了会出现过拟合现象。
在一个实施例中,当出现新的分类或新的样本时,本发明不需要重新将之前已标注过的样本图片和新样本集合在一起再重复初次的训练过程。本发明以之前训练的模型为基础,只加入新的标注的样本图片,再次训练模型:
S011,筛选新的样本图片:获取新的公告数据,从新的公告数据中获取多张新的样本图片。
S012,标注新的训练数据:根据分类标签对新的样本图片进行标注,生成用来训练的新的训练数据。
S013,更新模型:调用目标检测模型,根据标注好的新的训练数据,利用目标检测算法训练目标检测模型,训练出适用于公告数据的目标检测模型。
本步骤中的目标检测模型是经训练或更新过的目标检测模型,在利用目标检测算法训练该目标检测模型时,目标检测模型的训练步数是初次训练步数的十分之一。即如果目标的初次训练步数是75000步时,则更新模型时的训练步数是7500步即可。
S2,标记和输出:根据目标检测结果对待检测图片进行标记后输出。
在对检测图片进行标记时,可以采用对每个目标通过坐标位置进行标记框标记,并显示目标的分类标签,以直观的区分每个目标的位置情况和分类标签情况。
目标检测结果还包括置信度数据,对待检测图片进行标记时,还标记每个目标的置信度数据。
参照图2,是在通过本发明的上述步骤S1和步骤S2后,得到的图片效果。如图2中所示,通过目标检测模型检测得到的目标检测结果包括五个目标,从图片的上至下分别为:
1)特殊表格(special_table),其置信度为99%;
2)文本(text),其置信度为72%;
3)特殊结构(special_structure),其置信度为62%;
4)文本(text),其置信度为55%;
5)页脚(footer),其置信度为87%。
本发明通过标注训练生成的目标检测模型来检测图片中的目标分类和位置区域。主要用于公司披露的公告中表格、文本段落、标题以及图表等区域检测,同时针对公告中的无线框表格也能在增加样本训练后通过生成图片的方式来检测其位置和区域。
一种自动检测图片中表格的装置,包括:
目标检测模块,用于获取待检测图片,调用预设的目标检测模型,通过目标检测模型对待检测图片进行目标检测,得到目标检测结果,目标检测结果包括包括目标、目标在待检测图片中的坐标位置和分类标签;
标记和输出模块,用于根据目标检测结果对待检测图片进行标记后输出。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例自动检测图片中表格的方法中的步骤。
在一个实施例中,提出了一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述各实施例自动检测图片中表格的方法中的步骤。其中,存储介质可以为非易失性存储介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
以上各实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (14)

1.一种自动检测图片中表格的方法,其特征在于,包括:
获取待检测图片,调用预设的目标检测模型,通过所述目标检测模型对所述待检测图片进行目标检测,得到目标检测结果,所述目标检测结果包括目标、所述目标在所述待检测图片中的坐标位置和分类标签;
根据所述目标检测结果对所述待检测图片进行标记后输出。
2.如权利要求1所述的自动检测图片中表格的方法,其特征在于,所述获取待检测图片,调用预设的目标检测模型之前,包括对所述目标检测模型进行训练,训练过程包括:
从公告中披露的公告数据中获取多张样本图片,定义目标识别的分类标签;
根据所述分类标签对所述样本图片进行标注,生成用来训练的训练数据;
调用预设的目标检测模型,初始化所述目标检测模型,根据标注好的所述训练数据,利用目标检测算法训练所述目标检测模型,训练出适用于公告数据的目标检测模型。
3.如权利要求1或2所述的自动检测图片中表格的方法,其特征在于,所述分类标签包括表格、特殊表格、文本、特殊结构、页眉或页脚中的至少一种。
4.如权利要求2所述的自动检测图片中表格的方法,其特征在于,所述目标检测算法采用Faster R-CNN目标检测算法。
5.如权利要求2所述的自动检测图片中表格的方法,其特征在于,所述获取待检测图片,调用预设的目标检测模型,包括:
获取待检测图片,将所述待检测图片的大小处理成最大不超过600*1024;
所述根据所述分类标签对所述样本图片进行标注之前,包括:
对样本图片的大小处理成最大不超过600*1024后,根据所述分类标签对所述样本图片进行标注。
6.如权利要求2所述的自动检测图片中表格的方法,其特征在于,所述根据标注好的所述训练数据,利用目标检测算法训练所述目标检测模型,训练出适用于公告数据的目标检测模型,包括:
使用预设的图片分类模型提取所述训练数据中样本图片的图片特征;
将所述图片特征输入RPN网络,得到多个proposals;
将所述图片特征和多个所述候选区域输入RoIPooling,得到综合的候选特征;
根据所述候选特征预测目标的区域框和目标的类别,所述目标的类别为所述分类标签。
7.如权利要求6所述的自动检测图片中表格的方法,其特征在于,所述图片分类模型采用VGG16网络模型,所述图片分类模型的模型特征提取器采用faster_rcnn_resnet101。
8.如权利要求6所述的自动检测图片中表格的方法,其特征在于,所述根据所述候选特征预测目标的区域框和目标的类别时,所述目标的目标对象比例尺设置时最小为0.25、最大为2;
所述目标的目标对象重叠率取值在0到1之间,优选设置为0.1;
所述目标的训练步数设置为75000步。
9.如权利要求1所述的自动检测图片中表格的方法,其特征在于,对所述目标检测模型进行训练,还包括:
获取新的公告数据,从新的公告数据中获取多张新的样本图片;
根据所述分类标签对所述新的样本图片进行标注,生成用来训练的新的训练数据;
调用所述目标检测模型,根据标注好的所述新的训练数据,利用目标检测算法训练所述目标检测模型,训练出适用于公告数据的目标检测模型。
10.如权利要求9所述的自动检测图片中表格的方法,其特征在于,所述利用目标检测算法训练所述目标检测模型时,所述目标检测模型的训练步数是初次训练步数的十分之一。
11.如权利要求1所述的自动检测图片中表格的方法,其特征在于,所述根据所述目标检测结果对所述待检测图片进行标记后输出,包括:
所述目标检测结果还包括置信度数据,对所述待检测图片进行标记时,还标记每个目标的置信度数据。
12.一种自动检测图片中表格的装置,其特征在于,包括:
目标检测模块,用于获取待检测图片,调用预设的目标检测模型,通过所述目标检测模型对所述待检测图片进行目标检测,得到目标检测结果,所述目标检测结果包括包括目标、所述目标在所述待检测图片中的坐标位置和分类标签;
标记和输出模块,用于根据所述目标检测结果对所述待检测图片进行标记后输出。
13.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至11中任一项权利要求所述的自动检测图片中表格的方法的步骤。
14.一种存储有计算机可读指令的存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至11中任一项权利要求所述的自动检测图片中表格的方法的步骤。
CN202110513879.XA 2021-05-12 2021-05-12 自动检测图片中表格的方法、装置、设备和存储介质 Pending CN113111858A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110513879.XA CN113111858A (zh) 2021-05-12 2021-05-12 自动检测图片中表格的方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110513879.XA CN113111858A (zh) 2021-05-12 2021-05-12 自动检测图片中表格的方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN113111858A true CN113111858A (zh) 2021-07-13

Family

ID=76721930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110513879.XA Pending CN113111858A (zh) 2021-05-12 2021-05-12 自动检测图片中表格的方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN113111858A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114463766A (zh) * 2021-07-16 2022-05-10 荣耀终端有限公司 一种表格的处理方法及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086756A (zh) * 2018-06-15 2018-12-25 众安信息技术服务有限公司 一种基于深度神经网络的文本检测分析方法、装置及设备
CN110287998A (zh) * 2019-05-28 2019-09-27 浙江工业大学 一种基于Faster-RCNN的科技文献图片提取方法
CN110348294A (zh) * 2019-05-30 2019-10-18 平安科技(深圳)有限公司 Pdf文档中图表的定位方法、装置及计算机设备
CN110443270A (zh) * 2019-06-18 2019-11-12 平安科技(深圳)有限公司 图表定位方法、装置、计算机设备及计算机可读存储介质
CN110991403A (zh) * 2019-12-19 2020-04-10 同方知网(北京)技术有限公司 一种基于视觉深度学习的文档信息碎片化抽取方法
CN111814722A (zh) * 2020-07-20 2020-10-23 电子科技大学 一种图像中的表格识别方法、装置、电子设备及存储介质
CN112464626A (zh) * 2020-12-09 2021-03-09 上海携宁计算机科技股份有限公司 Pdf文档的图表提取方法、电子设备和存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086756A (zh) * 2018-06-15 2018-12-25 众安信息技术服务有限公司 一种基于深度神经网络的文本检测分析方法、装置及设备
CN110287998A (zh) * 2019-05-28 2019-09-27 浙江工业大学 一种基于Faster-RCNN的科技文献图片提取方法
CN110348294A (zh) * 2019-05-30 2019-10-18 平安科技(深圳)有限公司 Pdf文档中图表的定位方法、装置及计算机设备
CN110443270A (zh) * 2019-06-18 2019-11-12 平安科技(深圳)有限公司 图表定位方法、装置、计算机设备及计算机可读存储介质
CN110991403A (zh) * 2019-12-19 2020-04-10 同方知网(北京)技术有限公司 一种基于视觉深度学习的文档信息碎片化抽取方法
CN111814722A (zh) * 2020-07-20 2020-10-23 电子科技大学 一种图像中的表格识别方法、装置、电子设备及存储介质
CN112464626A (zh) * 2020-12-09 2021-03-09 上海携宁计算机科技股份有限公司 Pdf文档的图表提取方法、电子设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114463766A (zh) * 2021-07-16 2022-05-10 荣耀终端有限公司 一种表格的处理方法及电子设备

Similar Documents

Publication Publication Date Title
CN112580439B (zh) 小样本条件下的大幅面遥感图像舰船目标检测方法及系统
CN109902271B (zh) 基于迁移学习的文本数据标注方法、装置、终端及介质
CN111476284A (zh) 图像识别模型训练及图像识别方法、装置、电子设备
CN111046784A (zh) 文档版面分析识别方法、装置、电子设备和存储介质
CN112070135A (zh) 电力设备图像检测方法、装置、电力设备及存储介质
CN110991403A (zh) 一种基于视觉深度学习的文档信息碎片化抽取方法
CN114694165A (zh) 一种pid图纸智能识别与重绘方法
CN114187595A (zh) 基于视觉特征和语义特征融合的文档布局识别方法及系统
CN111626292A (zh) 一种基于深度学习技术的楼宇指示标识的文字识别方法
CN113111858A (zh) 自动检测图片中表格的方法、装置、设备和存储介质
CN113255767B (zh) 票据分类方法、装置、设备及存储介质
CN114429577A (zh) 一种基于高置信标注策略的旗帜检测方法及系统及设备
CN110705535A (zh) 一种试卷版面文字行自动检测的方法
CN116681997B (zh) 一种不良场景图像的分类方法、系统、介质及设备
CN112613367A (zh) 票据信息文本框获取方法、系统、设备及存储介质
CN115221452B (zh) 基于可视化配置的门户构建方法、系统、电子设备及介质
CN116597438A (zh) 一种基于Yolov5的改进型水果识别方法及识别系统
CN115359468A (zh) 一种目标网站识别方法、装置、设备及介质
CN111291756B (zh) 图像中文本区域的检测方法、装置、计算机设备及计算机存储介质
CN114581923A (zh) 表格图像及对应标注信息的生成方法、装置及存储介质
CN113192108A (zh) 一种针对视觉跟踪模型的人在回路训练方法及相关装置
CN110956174A (zh) 一种器件编号的识别方法
Phan et al. An Integrated Approach for Table Detection and Structure Recognition
CN114758132B (zh) 一种基于卷积神经网络的果树病虫害识别方法及系统
CN115309941B (zh) 一种基于ai的智能标签检索方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210713