CN115761049A - 一种图片自动标注方法、装置、设备和存储介质 - Google Patents
一种图片自动标注方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN115761049A CN115761049A CN202211476911.2A CN202211476911A CN115761049A CN 115761049 A CN115761049 A CN 115761049A CN 202211476911 A CN202211476911 A CN 202211476911A CN 115761049 A CN115761049 A CN 115761049A
- Authority
- CN
- China
- Prior art keywords
- screenshot
- text
- new
- information
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
本申请公开了一种图片自动标注方法、装置、设备和存储介质,方法包括:对原截图进行标注,保存原截图的标注信息和图片分辨率,标注信息包括标注坐标位置;识别原截图标注的文本信息,文本信息包括文本内容和文本坐标位置;获取新截图的图片分辨率并识别新截图的文本内容得到新截图的文本信息;根据原截图和新截图的图片分辨率计算缩放比例,通过比较原截图中标注坐标位置对应的文本内容和新截图中的文本内容,获取原截图中标注坐标位置对应的文本内容在新截图中的存在个数;根据存在个数和缩放比例获取新截图的标注信息,根据新截图的标注信息对新截图进行标注,改善了现有技术通过人工进行图片标注存在的标注效率低的技术问题。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种图片自动标注方法、装置、设备和存储介质。
背景技术
目前医疗机构参加电子病历系统应用水平评级时,需要提交两份系统功能实证材料(以下简称实证材料),实证材料具体为两份Word文档,文档内容包括指标内容、指标具体实现方式、指标实证截图等,其中,指标实证截图的每一张图片要求有图片标注信息,根据以往经验,两份实证材料通常包含着500张以上的图片,甚至上千张,一般情况下整理两份实证材料的实证截图是通过人工借助第三方截图工具进行截图,再人工添加相关标注信息,最后整理到实证材料的实证截图中。因为实证材料准备的工作需要持续数月,再加上可能存在对指标理解错误导致截取了错误的实证截图等因素,所以需要对实证截图的图片反复核对和修改,具体操作为参考原截图的标注信息在新截图进行新增标注信息。对于实证截图的反复核对和修改是一项大量的重复标注工作,现有技术解决实证材料的实证截图标注复用问题,主要是通过人工添加标注信息,需要耗费大量人力成本及时间成本,标注效率低。
发明内容
本申请提供了一种图片自动标注方法、装置、设备和存储介质,用于改善现有技术通过人工进行图片标注存在的标注效率低的技术问题。
有鉴于此,本申请第一方面提供了一种图片自动标注方法,包括:
对原截图进行标注,保存所述原截图的标注信息和图片分辨率,所述标注信息包括标注坐标位置;
识别所述原截图标注的文本信息,所述文本信息包括文本内容和文本坐标位置;
获取新截图的图片分辨率并识别所述新截图的文本内容,得到所述新截图的文本信息;
根据所述原截图和所述新截图的图片分辨率计算缩放比例,通过比较所述原截图中标注坐标位置对应的文本内容和所述新截图中的文本内容,获取所述原截图中标注坐标位置对应的文本内容在所述新截图中的存在个数;
根据所述存在个数和所述缩放比例获取所述新截图的标注信息,根据所述新截图的标注信息对所述新截图进行标注。
可选的,所述识别所述原截图标注的文本信息,包括:
识别所述原截图中标注坐标位置的所有文本内容,得到所述原截图标注的文本信息;
选取所述文本信息中面积最大的文本内容作为所述原截图的标注坐标位置对应的文本内容。
可选的,所述选取所述文本信息中面积最大的文本内容作为所述原截图的标注坐标位置对应的文本内容,包括:
将所述文本信息的文本坐标位置转换为与标注坐标位置相同类型的坐标,得到新文本坐标位置;
根据所述新文本坐标计算新文本面积,筛选掉小于预置面积阈值的新文本面积,得到新文本面积结果集;
从所述新文本面积结果集中选取最大新文本面积对应的文本内容作为所述原截图的标注坐标位置对应的文本内容。
可选的,所述根据所述存在个数和所述缩放比例获取所述新截图的标注信息,包括:
当所述存在个数小于预置数量阈值时,根据所述原截图的标注坐标位置和所述缩放比例计算所述新截图的标注坐标位置,得到所述新截图的标注信息;
当所述存在个数大于或等于预置数量阈值时,根据所述原截图中标注坐标位置对应的文本坐标位置和所述缩放比例计算该文本内容在所述新截图的文本参考坐标,从存在所述新截图的文本信息中选取距离所述新截图的文本参考坐标最近的文本坐标位置按照所述缩放比例生成所述新截图的标注信息。
可选的,所述从存在所述新截图的文本信息中选取距离所述新截图的文本参考坐标最近的文本坐标位置按照所述缩放比例生成所述新截图的标注信息,包括:
从存在所述新截图的文本信息中选取距离所述新截图的文本参考坐标最近的文本坐标位置,得到所述新截图的初始文本坐标位置;
根据所述缩放比例和所述原截图的标注坐标位置与对应的文本坐标位置之间的坐标偏移量计算缩放后坐标偏移量;
在所述新截图的初始文本坐标位置的基础上增加对应的所述缩放后坐标偏移量,得到所述新截图的标注信息。
可选的,所述标注信息还包括标注文本说明和标注图形类型。
本申请第二方面提供了一种图片自动标注装置,包括:
信息存储单元,用于对原截图进行标注,保存所述原截图的标注信息和图片分辨率,所述标注信息包括标注坐标位置;
文本识别单元,用于识别所述原截图标注的文本信息,所述文本信息包括文本内容和文本坐标位置;
信息获取单元,用于当所述原截图发生替换时,获取新截图的图片分辨率并识别所述新截图的文本内容,得到所述新截图的文本信息;
计算单元,用于根据所述原截图和所述新截图的图片分辨率计算缩放比例,通过比较所述原截图中标注坐标位置对应的文本内容和所述新截图中的文本内容,获取所述原截图中标注坐标位置对应的文本内容在所述新截图中的存在个数;
标注单元,用于根据所述存在个数和所述缩放比例获取所述新截图的标注信息,根据所述新截图的标注信息对所述新截图进行标注。
可选的,所述标注单元,具体用于:
当所述存在个数小于预置数量阈值时,根据所述原截图的标注坐标位置和所述缩放比例计算所述新截图的标注坐标位置,得到所述新截图的标注信息;
当所述存在个数大于或等于预置数量阈值时,根据所述原截图中标注坐标位置对应的文本坐标位置和所述缩放比例计算该文本内容在所述新截图的文本参考坐标,从存在所述新截图的文本信息中选取距离所述新截图的文本参考坐标最近的文本坐标位置按照所述缩放比例生成所述新截图的标注信息;
根据所述新截图的标注信息对所述新截图进行标注。
本申请第三方面提供了一种图片自动标注设备,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的图片自动标注方法。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码被处理器执行时实现第一方面任一种所述的图片自动标注方法。
从以上技术方案可以看出,本申请具有以下优点:
本申请提供了一种图片自动标注方法,包括:对原截图进行标注,保存原截图的标注信息和图片分辨率,标注信息包括标注坐标位置;识别原截图标注的文本信息,文本信息包括文本内容和文本坐标位置;获取新截图的图片分辨率并识别新截图的文本内容,得到新截图的文本信息;根据原截图和新截图的图片分辨率计算缩放比例,通过比较原截图中标注坐标位置对应的文本内容和新截图中的文本内容,获取原截图中标注坐标位置对应的文本内容在新截图中的存在个数;根据存在个数和缩放比例获取新截图的标注信息,根据新截图的标注信息对新截图进行标注。
本申请中,保存原截图的标注信息和图片分辨率,并识别原截图标注的所有文本内容;当原截图被替换时,识别新截图的文本内容,根据新截图和原截图的图片分辨率计算缩放比例,通过比较原截图中标注坐标位置对应的文本内容和新截图中的文本内容,获取原截图中标注坐标位置对应的文本内容在新截图中的存在个数;根据存在个数和缩放比例获取新截图的标注信息,实现对新截图的自动标注,避免了人工参考原截图对新截图进行人工标注,有助于提高标注效率,改善了现有技术通过人工进行图片标注存在的标注效率低的技术问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种图片自动标注方法的一个流程示意图;
图2为本申请实施例提供的一种图片自动标注装置的一个结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请实施例提供了一种图片自动标注方法,包括:
步骤101、对原截图进行标注,保存原截图的标注信息和图片分辨率,标注信息包括标注坐标位置。
在对原截图进行标注时,比如选择一个标注图形类型如矩形,然后在原截图上将矩形绘制某些图片文字上,每一个标注信息的创建都会生成标志信息,包括标注在图片上的坐标位置,标注的文本说明,标注的图形类型。在标注完成后,保存标注在原截图上的标注坐标位置,如(x,y,width,height),以原截图的左下角点为参考点,x为标注矩形框的左上角点的横坐标,y为标注矩形框的左上角点的纵坐标,width为标注矩形框的宽,height为标注矩形框的高。还可以保存标注的文本说明,即标注文本说明,以及标注图形类型,标注图形类型可以分为两类,一类是空心图形,另一类是实心图形,空心和实心图形可以包括矩形、椭圆、对话框、圆角矩形、箭头等。在原截图标注完成后,还可以保存原截图的图片分辨率[width,length]。
步骤102、识别原截图标注的文本信息,文本信息包括文本内容和文本坐标位置。
可以通过现有的文本识别方法识别原截图中标注坐标位置的所有文本内容,得到原截图标注的文本信息,选取文本信息中面积最大的文本内容作为原截图的标注坐标位置对应的文本内容,文本信息包括识别到的文本内容以及对应的文本坐标位置,文本坐标位置包括文本内容的左上角坐标、右上角坐标、右下角坐标、左下角坐标。
在识别得到原截图标注的文本信息后,选取文本信息中面积最大的文本内容作为原截图的标注坐标位置对应的文本内容的具体过程如下:
S1、将文本信息的文本坐标位置转换为与标注坐标位置相同类型的坐标,得到新文本坐标位置。
假设原截图的某个文本坐标位置为(x1,y1)、(x2,y1)、(x2,y2)、(x1,y2),则该文本坐标位置转换后的新文本坐标位置为(x1,y1,|x2-x1|,|y2-y1|)。
S2、根据新文本坐标计算新文本面积,筛选掉小于预置面积阈值的新文本面积,得到新文本面积结果集;
在获取到新文本坐标后,可以计算新文本面积。上述举例的新文本坐标(x1,y1,|x2-x1|,|y2-y1|)的新文本面积可以表示为S1=(x1,y1,|x2-x1|,|y2-y1|).area()。筛选掉新文本面积S1<0的结果,得到新文本面积结果集S2。
S3、从新文本面积结果集中选取最大新文本面积对应的文本内容作为原截图的标注坐标位置对应的文本内容;
当原截图标注坐标位置所有的文本内容的数量为多个时,每个标注坐标位置对应多个新文本坐标,相应的,每个标注坐标位置对应多个新文本面积,根据预置面积阈值对每个标注坐标位置的多个新文本面积进行筛选,得到每个标注坐标位置的新文本面积结果集。从每个标注坐标位置的新文本面积结果集中选取最大新文本面积对应的文本内容作为原截图的标注坐标位置对应的文本内容,即该最大新文本面积对应的新文本坐标位置的文本内容即为该最大新文本面积对应的标注坐标位置匹配的文本内容。若标注坐标位置对应的最大新文本面积为0,则说明该标注坐标位置在原截图对应的文本内容为空。
进一步,还可以计算原截图的标注坐标位置与对应匹配的文本内容的文本坐标位置之间的坐标偏移量,并保存原截图的标注坐标位置匹配的文本内容以及对应的坐标偏移量。
经过上述步骤可以给标注坐标位置匹配到对应的文本内容,由于标注时的坐标与文本识别时得到坐标会存在一定的偏移,为了提高后续对新截图标注的准确性,可以计算原截图的标注坐标位置与对应匹配的文本内容的文本坐标位置之间的坐标偏移量T(xt,yt),保存原截图的标注坐标位置匹配的文本内容以及对应的坐标偏移量,以用于后续标注过程。
假设原截图的标注坐标位置(x,y,width,height)对应匹配的文本内容的新文本坐标位置为(x4,y4,width4,height4),则这两个坐标位置之间的坐标偏移量为T(xt,yt)=(x-x4,y-y4)。
步骤103、获取新截图的图片分辨率并识别新截图的文本内容,得到新截图的文本信息。
当检测到原截图发生替换时,获取替换原截图的新截图的图片分辨率[width_n,length_n],并通过文本识别方法识别新截图的文本内容,得到新截图的文本信息,包括识别到的新截图的所有文本内容以及对应的文本坐标位置。
步骤104、根据原截图和新截图的图片分辨率计算缩放比例,通过比较原截图中标注坐标位置对应的文本内容和新截图中的文本内容,获取原截图中标注坐标位置对应的文本内容在新截图中的存在个数。
根据原截图和新截图的图片分辨率计算缩放比例n,n=width_n*length_n/width*length;通过比较原截图中标注坐标位置对应的文本内容和新截图中的文本内容,统计原截图中标注坐标位置对应的文本内容在新截图中的存在个数N。
步骤105、根据存在个数和缩放比例获取新截图的标注信息,根据新截图的标注信息对新截图进行标注。
当存在个数小于预置数量阈值时,根据原截图的标注坐标位置和缩放比例计算新截图的标注坐标位置,得到新截图的标注信息。当原截图的标注坐标位置对应的文本内容的存在个数N<1时,说明原截图的标注坐标位置对应的文本内容在新截图中不存在,则直接在新截图中按缩放比例n计算新截图的标注坐标位置。原截图的标注坐标位置(x,y,width,height)对应在新截图的标注坐标位置为(x*n,y*n,width*n,height*n)。
当存在个数大于或等于预置数量阈值时,根据原截图中标注坐标位置对应的文本坐标位置和缩放比例计算该文本内容在新截图的文本参考坐标,从存在新截图的文本信息中选取距离新截图的文本参考坐标最近的文本坐标位置按照缩放比例生成新截图的标注信息。当存在个数N≥1时,表示原截图中标注坐标位置对应的文本内容在新截图中的文本内容中找到至少1个,可以根据原截图的文本坐标位置和缩放比例计算该文本内容在新截图的文本参考坐标。假设原截图的文本内容在新截图中存在,且该文本内容在原截图中的文本坐标位置转换成与标注坐标位置同类型的坐标位置为(x1,y1,|x2-x1|,|y2-y1|),则该文本内容在新截图中的文本参考坐标为(x1*n,y1*n,|x2-x1|*n,|y2-y1|*n)。
从新截图的文本信息中选取距离新截图的文本参考坐标最近的文本坐标位置,得到新截图的初始文本坐标位置;假设新截图中的某个文本坐标位置为(x5,y5)、(x6,y5)、(x6,y6)、(x5,y6),将其转换为与标注坐标位置同类型的坐标为(x5,y5,|x6-x5|,|y6-y5|),则文本参考坐标位置为(x1*n,y1*n,|x2-x1|*n,|y2-y1|*n)与该文本转换后的坐标位置(x5,y5,|x6-x5|,|y6-y5|)之间的距离为根据新截图的文本信息中各个文本坐标位置与文本参考坐标的距离L选取最小距离min(L)的文本坐标位置作为新截图的初始文本坐标位置。可以理解的是,当统计得到原截图的多个文本内容在新截图中的存在个数大于1,则可以计算得到多个文本内容在新截图中的初始文本坐标。
根据缩放比例和原截图的标注坐标位置与对应的文本坐标位置之间的坐标偏移量计算缩放后坐标偏移量,即(n*xt,n*yt);
在新截图的初始文本坐标位置的基础上增加对应的缩放后坐标偏移量,得到新截图的标注坐标位置,假设新截图的初始文本坐标位置为(x5,y5,|x6-x5|,|y6-y5|),则新截图的标注坐标位置为(x5+n*xt,y5+n*yt,width*n,height*n),新截图的标注信息中的标注文本说明和标注图像类型保存与原截图中的标注信息中的标注文本说明和标注图像类型一致。得到新截图的标注信息后,根据新截图的标注信息对新截图进行标注。
本申请实施例中,保存原截图的标注信息和图片分辨率,并识别原截图标注的所有文本内容;当原截图被替换时,识别新截图的文本内容,根据新截图和原截图的图片分辨率计算缩放比例,通过比较原截图中标注坐标位置对应的文本内容和新截图中的文本内容,获取原截图中标注坐标位置对应的文本内容在新截图中的存在个数;根据存在个数和缩放比例获取新截图的标注信息,实现对新截图的自动标注,避免了人工参考原截图对新截图进行人工标注,有助于提高标注效率,改善了现有技术通过人工进行图片标注存在的标注效率低的技术问题。
以上为本申请提供的一种图片自动标注方法的一个实施例,以下为本申请提供的一种图片自动标注装置的一个实施例。
请参考图2,本申请实施例提供的一种图片自动标注装置,包括:
信息存储单元,用于对原截图进行标注,保存原截图的标注信息和图片分辨率,标注信息包括标注坐标位置;
文本识别单元,用于识别原截图标注的文本信息,文本信息包括文本内容和对应的文本坐标位置;
信息获取单元,用于当原截图发生替换时,获取新截图的图片分辨率并识别新截图的文本内容,得到新截图的文本信息;
计算单元,用于根据原截图和新截图的图片分辨率计算缩放比例,通过比较原截图中标注坐标位置对应的文本内容和新截图中的文本内容,获取原截图中标注坐标位置对应的文本内容在新截图中的存在个数;
标注单元,用于根据存在个数和缩放比例获取新截图的标注信息,根据新截图的标注信息对新截图进行标注。
作为进一步地改进,标注信息还包括标注文本说明和标注图形类型。
在对原截图进行标注时,通过信息存储单元存储原截图的标注信息和图片分辨率,在原截图标注完成后,文本识别单元识别别原截图中标注坐标位置的所有文本内容,得到原截图标注的文本信息,取文本信息中面积最大的文本内容作为原截图的标注坐标位置对应的文本内容。
文本识别单元具体将原截图标注的文本信息的文本坐标位置转换为与标注坐标位置相同类型的坐标,得到新文本坐标位置;根据新文本坐标计算新文本面积,筛选掉小于预置面积阈值的新文本面积,得到新文本面积结果集;从新文本面积结果集中选取最大新文本面积对应的文本内容作为原截图的标注坐标位置对应的文本内容,即该最大新文本面积对应的标注坐标位置匹配该最大新文本面积对应的新文本坐标位置的文本内容;还可以计算原截图的标注坐标位置与对应匹配的文本内容的文本坐标位置之间的坐标偏移量,并保存原截图的标注坐标位置匹配的文本内容以及对应的坐标偏移量。
信息获取单元检测到原截图发生替换时,获取新截图的图片分辨率并识别新截图的文本内容,得到新截图的文本信息,并触发计算单元,计算单元根据原截图和新截图的图片分辨率计算缩放比例,通过比较原截图中标注坐标位置对应的文本内容和新截图中的文本内容,获取原截图中标注坐标位置对应的文本内容在新截图中的存在个数。标注单元根据存在个数和缩放比例获取新截图的标注信息,根据新截图的标注信息对新截图进行标注。
作为进一步地改进,标注单元,具体用于:
当存在个数小于预置数量阈值时,根据原截图的标注坐标位置和缩放比例计算新截图的标注坐标位置,得到新截图的标注信息;
当存在个数大于或等于预置数量阈值时,根据原截图中标注坐标位置对应的文本坐标位置和缩放比例计算该文本内容在新截图的文本参考坐标,从存在新截图的文本信息中选取距离新截图的文本参考坐标最近的文本坐标位置按照缩放比例生成新截图的标注信息;
根据新截图的标注信息对新截图进行标注。
本申请实施例中,保存原截图的标注信息和图片分辨率,并识别原截图标注的所有文本内容;当原截图被替换时,识别新截图的文本内容,根据新截图和原截图的图片分辨率计算缩放比例,通过比较原截图中标注坐标位置对应的文本内容和新截图中的文本内容,获取原截图中标注坐标位置对应的文本内容在新截图中的存在个数;根据存在个数和缩放比例获取新截图的标注信息,实现对新截图的自动标注,避免了人工参考原截图对新截图进行人工标注,有助于提高标注效率,改善了现有技术通过人工进行图片标注存在的标注效率低的技术问题。
本申请实施例还提供了一种图片自动标注设备,设备包括处理器以及存储器;
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行前述方法实施例中的图片自动标注方法。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码被处理器执行时实现前述方法实施例中的图片自动标注方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:RandomAccess Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种图片自动标注方法,其特征在于,包括:
对原截图进行标注,保存所述原截图的标注信息和图片分辨率,所述标注信息包括标注坐标位置;
识别所述原截图标注的文本信息,所述文本信息包括文本内容和文本坐标位置;
获取新截图的图片分辨率并识别所述新截图的文本内容,得到所述新截图的文本信息;
根据所述原截图和所述新截图的图片分辨率计算缩放比例,通过比较所述原截图中标注坐标位置对应的文本内容和所述新截图中的文本内容,获取所述原截图中标注坐标位置对应的文本内容在所述新截图中的存在个数;
根据所述存在个数和所述缩放比例获取所述新截图的标注信息,根据所述新截图的标注信息对所述新截图进行标注。
2.根据权利要求1所述的图片自动标注方法,其特征在于,所述识别所述原截图标注的文本信息,包括:
识别所述原截图中标注坐标位置的所有文本内容,得到所述原截图标注的文本信息;
选取所述文本信息中面积最大的文本内容作为所述原截图的标注坐标位置对应的文本内容。
3.根据权利要求2所述的图片自动标注方法,其特征在于,所述选取所述文本信息中面积最大的文本内容作为所述原截图的标注坐标位置对应的文本内容,包括:
将所述文本信息的文本坐标位置转换为与标注坐标位置相同类型的坐标,得到新文本坐标位置;
根据所述新文本坐标计算新文本面积,筛选掉小于预置面积阈值的新文本面积,得到新文本面积结果集;
从所述新文本面积结果集中选取最大新文本面积对应的文本内容作为所述原截图的标注坐标位置对应的文本内容。
4.根据权利要求1所述的图片自动标注方法,其特征在于,所述根据所述存在个数和所述缩放比例获取所述新截图的标注信息,包括:
当所述存在个数小于预置数量阈值时,根据所述原截图的标注坐标位置和所述缩放比例计算所述新截图的标注坐标位置,得到所述新截图的标注信息;
当所述存在个数大于或等于预置数量阈值时,根据所述原截图中标注坐标位置对应的文本坐标位置和所述缩放比例计算该文本内容在所述新截图的文本参考坐标,从存在所述新截图的文本信息中选取距离所述新截图的文本参考坐标最近的文本坐标位置按照所述缩放比例生成所述新截图的标注信息。
5.根据权利要求4所述的图片自动标注方法,其特征在于,所述从存在所述新截图的文本信息中选取距离所述新截图的文本参考坐标最近的文本坐标位置按照所述缩放比例生成所述新截图的标注信息,包括:
从存在所述新截图的文本信息中选取距离所述新截图的文本参考坐标最近的文本坐标位置,得到所述新截图的初始文本坐标位置;
根据所述缩放比例和所述原截图的标注坐标位置与对应的文本坐标位置之间的坐标偏移量计算缩放后坐标偏移量;
在所述新截图的初始文本坐标位置的基础上增加对应的所述缩放后坐标偏移量,得到所述新截图的标注信息。
6.根据权利要求1所述的图片自动标注方法,其特征在于,所述标注信息还包括标注文本说明和标注图形类型。
7.一种图片自动标注装置,其特征在于,包括:
信息存储单元,用于对原截图进行标注,保存所述原截图的标注信息和图片分辨率,所述标注信息包括标注坐标位置;
文本识别单元,用于识别所述原截图标注的文本信息,所述文本信息包括文本内容和文本坐标位置;
信息获取单元,用于获取新截图的图片分辨率并识别所述新截图的文本内容,得到所述新截图的文本信息;
计算单元,用于根据所述原截图和所述新截图的图片分辨率计算缩放比例,通过比较所述原截图中标注坐标位置对应的文本内容和所述新截图中的文本内容,获取所述原截图中标注坐标位置对应的文本内容在所述新截图中的存在个数;
标注单元,用于根据所述存在个数和所述缩放比例获取所述新截图的标注信息,根据所述新截图的标注信息对所述新截图进行标注。
8.根据权利要求7所述的图片自动标注装置,其特征在于,所述标注单元,具体用于:
当所述存在个数小于预置数量阈值时,根据所述原截图的标注坐标位置和所述缩放比例计算所述新截图的标注坐标位置,得到所述新截图的标注信息;
当所述存在个数大于或等于预置数量阈值时,根据所述原截图中标注坐标位置对应的文本坐标位置和所述缩放比例计算该文本内容在所述新截图的文本参考坐标,从存在所述新截图的文本信息中选取距离所述新截图的文本参考坐标最近的文本坐标位置按照所述缩放比例生成所述新截图的标注信息;
根据所述新截图的标注信息对所述新截图进行标注。
9.一种图片自动标注设备,其特征在于,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-6任一项所述的图片自动标注方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码被处理器执行时实现权利要求1-6任一项所述的图片自动标注方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211476911.2A CN115761049A (zh) | 2022-11-23 | 2022-11-23 | 一种图片自动标注方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211476911.2A CN115761049A (zh) | 2022-11-23 | 2022-11-23 | 一种图片自动标注方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115761049A true CN115761049A (zh) | 2023-03-07 |
Family
ID=85336428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211476911.2A Pending CN115761049A (zh) | 2022-11-23 | 2022-11-23 | 一种图片自动标注方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115761049A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117076703A (zh) * | 2023-10-11 | 2023-11-17 | 中邮消费金融有限公司 | 一种自动化的卡证结构化信息抽取技术方法及系统 |
-
2022
- 2022-11-23 CN CN202211476911.2A patent/CN115761049A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117076703A (zh) * | 2023-10-11 | 2023-11-17 | 中邮消费金融有限公司 | 一种自动化的卡证结构化信息抽取技术方法及系统 |
CN117076703B (zh) * | 2023-10-11 | 2024-02-06 | 中邮消费金融有限公司 | 一种自动化的卡证结构化信息抽取技术方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7840092B2 (en) | Medium processing method, copying apparatus, and data filing apparatus | |
WO2020155757A1 (zh) | 柱状图数据转换控制方法、装置、计算机设备及存储介质 | |
CN111310426A (zh) | 基于ocr的表格版式恢复方法、装置及存储介质 | |
CN108319578B (zh) | 一种用于数据记录的介质的生成方法 | |
CN115713775B (zh) | 一种从文档中提取表格的方法、系统和计算机设备 | |
CN115761049A (zh) | 一种图片自动标注方法、装置、设备和存储介质 | |
CN104794106A (zh) | 一种批注方法及装置 | |
CN109726369A (zh) | 一种基于标准文献的智能模板化题录技术实现方法 | |
CN112199929A (zh) | 表格处理方法、装置、存储介质及电子设备 | |
CN114529933A (zh) | 一种合同数据差异性的比对方法、装置、设备和介质 | |
CN112417826B (zh) | Pdf在线编辑方法、装置、电子设备和可读存储介质 | |
CN103970723A (zh) | 基于图像检测和切割的电子文档屏幕显示方法 | |
CN112861485A (zh) | 核电dcs控制逻辑图纸的处理方法、装置及设备 | |
US10430458B2 (en) | Automated data extraction from a chart from user screen selections | |
CN111079709B (zh) | 一种电子单据的生成方法、装置、计算机设备和存储介质 | |
CN107861931B (zh) | 模板文件处理方法、装置、计算机设备和存储介质 | |
US20100023517A1 (en) | Method and system for extracting data-points from a data file | |
CN106980604B (zh) | 合同内容校阅装置 | |
CN114548040A (zh) | 笔记处理方法、电子设备及存储介质 | |
CN114564915A (zh) | 文本排版方法、电子设备及存储介质 | |
JP3732254B2 (ja) | フォーマット情報生成方法及びフォーマット情報生成装置 | |
CN112667438A (zh) | 文本保存及还原方法、装置、计算机设备及存储介质 | |
CN106203910B (zh) | 一种无需文字识别的图像订单管理系统 | |
US10606928B2 (en) | Assistive technology for the impaired | |
CN116402571B (zh) | 预算数据的处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |