CN109146768A - 图像变换方法、系统及应用 - Google Patents
图像变换方法、系统及应用 Download PDFInfo
- Publication number
- CN109146768A CN109146768A CN201810006155.4A CN201810006155A CN109146768A CN 109146768 A CN109146768 A CN 109146768A CN 201810006155 A CN201810006155 A CN 201810006155A CN 109146768 A CN109146768 A CN 109146768A
- Authority
- CN
- China
- Prior art keywords
- image
- picture
- pixel
- value
- peak
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 22
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 230000001186 cumulative effect Effects 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 2
- 230000000007 visual effect Effects 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 53
- 230000000694 effects Effects 0.000 description 19
- 238000004422 calculation algorithm Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 8
- 239000000463 material Substances 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000006837 decompression Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000004069 differentiation Effects 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000004359 castor oil Substances 0.000 description 1
- 235000019438 castor oil Nutrition 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- ZEMPKEQAKRGZGQ-XOQCFJPHSA-N glycerol triricinoleate Natural products CCCCCC[C@@H](O)CC=CCCCCCCCC(=O)OC[C@@H](COC(=O)CCCCCCCC=CC[C@@H](O)CCCCCC)OC(=O)CCCCCCCC=CC[C@H](O)CCCCCC ZEMPKEQAKRGZGQ-XOQCFJPHSA-N 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000009394 selective breeding Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
- G06T7/41—Analysis of texture based on statistical description of texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
- G06T7/41—Analysis of texture based on statistical description of texture
- G06T7/44—Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/77—Determining position or orientation of objects or cameras using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了图像变换方法、系统及应用,图像变换方法,其特征在于,将图片上的各个像素点的像素值按照预定规则,沿着特定方向进行迭代处理,得到迭代曲线,实现将二维图像数据变换为一维数据。
Description
技术领域
本发明涉及图像处理技术,尤其是图像的变换方法、系统与应用。
背景技术
图像处理技术是一项基础,并且适用面非常广泛的技术。目前,对图像处理技术方面的研究也非常多,各有优缺点。以图像比对为例,其即可实现图像内容的识别、对比,也可用于图像的检索——实现“以图搜图”。但是,目前所研究的图像比对技术方案,很多都是运算量大,计算复杂度高,往往不适合用于诸如移动智能终端(如智能手机)等数据处理能力有限的设备上,从而不利于相关技术商业化应用的广泛实现。
其中,有文献公开过,利用图像的直方图来进行图像的检索、比对,但是,由于方差图只是反应了图像中像素点的统计分布,也就是图片中任意像素值的像素点的数量,这种方式运算量小。但是,由于这种统计只是反应一个总量或比例关系,无法反应图像中很重要的信息——像素的空间分布关系,也就导致了其具有极大的局限性和不准确性。
同时,为了实现对图像的检索、分析、识别,以及对图像的智能化处理或应用,而图像本身,由于其数据的特殊性,对其处理和应用具有较强的壁垒,计算机等数据处理设备难以直接对其进行复杂的处理,因此,形成了各种方式的图像变换,以此来反应图像内容的特点,,如前述的图像直方图变换,以及基于图像内容的图像识别、检索技术中对图像特征的提取技术。无论采用何种技术,其前提是对图像进行变换,以获得图像或图像内容的特征信息,为后续处理奠定基础。
发明内容
针对上述不足,本发明所要解决的技术问题在于提供一种复杂度低,运算量小的图像变换方法;进一步地,基于所述方法实现图像满足不同需求的应用。
本发明的技术思想是,通过对图像的像素迭代实现对图像的变换。
本发明通过在不同方向上进行像素值迭代的方式,可以在获得图像像素的空间分布特征,从而较好地反应图像的特点。同时,其运算量小,计算复杂度为n(n为图像的像素数量),资源占用少,可以便于在各类移动计算终端、嵌入式设备、乃至计算资源极其有限的单片机等上都可以进行应用,显著提供其应用场景。并且,其稳定性、健壮性和鲁棒性都较强。
附图说明
为了更清楚地描述本发明所涉及的相关技术方案,下面将其涉及的附图予以简单说明,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1图片1中矩形框图像像素第一迭代原理图(图中,(a)以图像方式是模拟的图片像素点结构,每个矩形表述一个像素点;(b)系每行像素的迭代曲线,图中所示曲线的竖直方向坐标为行号,也就是图片坐标系的y轴(与(a)图片1的方向对应),水平方向为像素迭代后的值;(c)系每列像素的迭代曲线,图中所示曲线的水平方向坐标为列号,也就是图片坐标系的x轴(与(a)图片1的方向对应),竖直方向为像素迭代后的值;(d)为对(a)中图片1各个像素点像素值分布情况;图1-4采用相同的方式予以表示);
图2图片中回形框图像像素第一迭代原理图;
图3图片中变形的回形框图像像素第一迭代原理图;
图4图片像素提取过程及迭代示意图;
图5图片另一种像素提取过程及迭代示意图;
图6对图片像素迭代实现目标图像定位的原理示意图;
图7对图片像素迭代实现目标图像边界确定的原理示意图;
图8图片像素迭代实测结果示意图;
图9-10对图片像素迭代实现图片比对的原理示意图;
图11对图片像素迭代实现模拟标尺识别和像素标定的原理示意图;
图12-13对真实标尺(最小刻度为毫米)图片进行像素迭代实现标尺识别和像素标定的实测图;
图14对图片像素迭代实现模拟柱状标尺(如水文标尺)识别和像素标定的原理示意图;
图15真实图片1的像素迭代处理效果图(图中背景图像为灰色,目标图像为白色圆);
图16对真实手机拍摄的杯子图片1的像素迭代处理实测图(背景图像为白色,并且有折痕和阴影等噪声);
图17-19采用本发明对真实的复杂背景的识别结果(图中,背景图像均为比较复杂,并伴随噪声,图中的辅助线4为通过本发明识别到图片目标对象的边界坐标所绘制出的辅助线,通过所述线条,可以看出,本发明具有很高的识别效率和准确度。图中,图16的目标对象为杯子,图17、19均为同一个双色印台,图18为在杂乱背景下的电子设备作为目标图像)。
在图1-5、11、14采用的模拟示意图中以图片左下方顶点像素作为图片像素坐标系的原点(0,0)进行绘制;图8、12、13、15、16采用普遍使用的以图片左上方顶点像素作为图片像素坐标系原点(0,0)进行绘制,虽然坐标系建立方式略有不同,但是所表达的技术思想和效果完全不变(坐标系的目的在于对图片中各个像素点进行定位,不会对相关结果构成影响),在具体应用中,可以更加需要进行坐标系的建立。
附图标记说明:
图片1,图片上的目标图像10(简称目标图像10),图片上的背景图像13(简称背景图像13),行号16,列号15,像素迭代曲线3(简称迭代曲线3),目标部曲线30,目标部曲线峰/谷301,边界部曲线31,背景部曲线33,背景噪声部曲线331,迭代差值曲线3a,迭代差值曲线峰/谷30a,噪声迭代差值曲线332,标尺刻度101(简称刻度101),辅助线4。
需要说明的是,为了简化附图,部分相同附图标记只是在部分附图中予以示出,其他附图中没有进行标注,以使得附图更加清晰并易于辨识,但是并不影响本领域技术人员的阅读和理解,也不会构成相关的歧义。
具体实施方式
为了便于本领域的技术人员对本发明的进一步理解,并清楚地认识本申请所记载的技术方案,完整、充分地公开本发明的相关技术内容,下面结合附图对本发明的具体实施方式进行详细的描述,当然,所描述的具体实施方式仅仅以列举方式给出了本发明的一部分实施例,用于帮助理解本发明及其核心思想。
基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,和/或在不背离本发明精神及其实质的情况下,即使对各个步骤的执行顺序(部分的连接关系或结构)进行了改变,以及根据本发明做出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明保护的范围。以及各个实施例的技术方案中的相关部分可以重新进行组合,以形成不同的实施例,这些变形和组合无需创造性劳动即可实现,对于本领域技术人员来说是完全清楚并可无歧义予以理解的。
本发明涉及的相关术语定义如下:
图像,指数字图像,用数字任意描述像素点、强度和颜色,并借以表示特定内容信息,由像素点阵构成的位图。
图片,指数字化图片,用以记录采集到的图像信息,由若干像素点构成的,包括背景图像、前景图像(本申请称之为目标图像);对于像素点的描述可以根据不同的协议来实现,并可以采用多种编码方式予以记录、运算和存储,并根据不同的需要采用不同协议规定的模式进行应用。当然,在本发明中,所述的图片还可以是其他形式所记录的图像信息,根据申请文件的上下文可以无歧义的理解。以图片的象素点为单位,行、场(列)方向分别为X轴、Y轴建立坐标系,以像素点为单位,沿行方向为X坐标轴,场方向为Y轴建立坐标系,在建立坐标时,通常选择左上顶点像素点为坐标原点(0,0)。
在本申请中没有刻意区分图片和图像的差异,主要在于为了表述上的方便进行了适当的区分,但是作为本领域技术人员足以理解相关内容的表述。需要特别说明的是,本申请中的图片并不局限于是仅仅可以记录到数据存储设备的图像文件。
本发明的基础技术方案如下:
图像变换方法,其特征在于,将图片上的各个像素点的像素值按照预定规则,沿着特定方向进行迭代处理,得到迭代曲线,实现将二维图像数据变换为一维数据。
本发明还包括以下延伸的技术方案:
本发明所记载的方法和系统,可以用于:
图像识别、比对、检索、匹配(相似图像匹配),通过比较两个图片运用本发明进行迭代,得到迭代曲线,实现将二维数据变成一维数据,通过比对两组迭代曲线的相似度或者关系,从而判断两个图片或图片上的目标图像的相似程度,如果对于复杂图像,还可以进一步将图片旋转一定角度(比如45度)再次进行迭代,得到迭代曲线,进行比较。将图像采用不同的方式进行迭代,如不同通道、不同方向的迭代、不同迭代方式或顺序(反响,相当于图像的在相应方向的翻转),对图像的正片、负片图像等生成相应的迭代数据,然后提交给服务器进行检索处理。当然,也可以采用得到一个基本数据,然后进行不同的函数变换来实现上述不同的方式。当然,也可采用对数据库中的样本(例如,进行商标图像的检索,所述样本即为商标数据库的商标标样)进行上述处理并分别进行存储,然后建立相应的映射关系,但是这种方法会增加服务器的数据存储空间的占用和预处理的庞大负荷;如果采用服务端存储少量的变换方式,而在输入端(终端设备)采用上述方式进行预处理,然后采用不同的数据向服务器发送请求,从而年相应的检索、比对。这种方式虽然耗费终端设备的计算资源,但是这种方式采用了分布式的运算的思想,有助于减小服务器的负荷和I/O带宽,从而提高响应速度和用户体验,并且还可降低相应的服务器投入成本。
图片中目标图像边界识别,通过对迭代曲线上边界部曲线的识别和判断,实现对目标图像边界的识别。进一步地,通过边界的识别可以确定目标图像的几何中心。通过迭代曲线峰、谷的识别,可以实现对图像几何尺寸最大位置的识别和判断。
图像异常判断:图像缺陷判断,通过对将当前图片的像素迭代曲线与预先设定的标准图像的像素迭代曲线的比较,如果存在不同点(满足一定阈值条件),则图像存在异常,并根据异常点的坐标,确定图像异常的位置。
标尺识别(视觉传感器的定标(以及图像的定标、视觉测量),对标尺图片进行像素迭代,通过迭代曲线的峰或谷的识别,实现对标尺的识别,并且对图片像素进行定标(在同等条件下,每个像素点的对应的图像尺寸),从而进一步实现通过图片或图像采集设备对目标物的尺寸进行精确测量,从而实现自动化和智能化。
目标跟踪(包括太阳跟踪等),采样本发明,直接利用1个摄像头等图像传感器,即可准确识别太阳位置和角度,并进行实时跟著。当然也可以用在其他目标跟踪方面,如飞行器,火光检测等。对于消防、森林防火等需要进行火焰识别时,优选采用热红外图像采集设备,并进行成像具有理想的效果,或者选择恰当图片RGB、YUV和HSV颜色空间模型的通道分量(或称为通道)来进行迭代处理。
视频图像监控(含实时监控等),通过对不同视频帧(图片)进行像素迭代,通过对将当前图片的像素迭代曲线与预先设定的标准图像的像素迭代曲线的比较,如果存在不同点(满足一定阈值条件),则图像存在异常,说明有物体侵入,并根据异常点的坐标,确定图像异常的位置。
视频帧比对,通过对迭代曲线的比对,根据迭代曲线的差异情况,确定是否作为关键帧,将非关键帧图像与关键帧图像的迭代曲线的比对,获取差一点,并据需进行压缩过程中确定变换的区域,对其他没有发生变化的区域直接使用关键帧的数据等。
此外,本发明所述方法和系统,对于目标图像的识别还可以用于路面标识识别、路面障碍物识别,实现基于视觉的智能导航判定。
本发明可以采用以下具体技术方案、实施例来实现:
以图片行、场方向建立坐标系,其中(0,0)为图片的左下方的像素点(当然,也可以采用其他方式建立坐标系,本申请文件中均采用该坐标系进行说明),以像素点为单位;横坐标x(x=0,1,2……i)为行方向,纵坐标y(y=0,1,2……j)为场方向,即图像上任意像素点的像素值p(i,j)(i、j分别是该像素点对应的横、纵坐标值,像素值p这是一个通道的值,如果是多通道,类似地,是多个值如pr(i,j)、pg(i,j)、pb(i,j)分别标识RGB模式下不同通道的像素值,当然,对于多通道情况,p(i,j)也可表示为各个通道值进行一定的运算的值),i为横坐标值,事实上表示的是第i列(场方向),j为横坐标值,事实上表示的是第j行,迭代时,是将行的像素数据迭代投影到纵坐标(j)上,将列的像素数据迭代投影到横坐标(i)上。也就是逐行扫描时,根据坐标值,将像素值(寻址,偏移量,指针)
还可以设置分段寄存器,分段迭代,放到不同位置,根据需要选取
由于采用迭代方式,使得图像像素值与背景的像素值的差异化经过跌代而放大,同时,整个过程中无需逐步比较像素值的大小,减小运算负荷,而且,避免了因为图像中噪声的干扰,能较好地对图像进行识别
在jpg解压时(或者模数转换,或从其他途径获取),实时将每个像素点的像素值送到图片浏览显示、列迭代、行迭代(或迭代运算后放入,即先放入相应的迭代运算器内存)内存地址(或定义的变量)。由于解压或AD转换的速度大于迭代计算、内存写入时间,这样,当图片解压完成,迭代结果已经给出,可以很好的保证实时性,对于视频的实时处理效果好。
当然,所述方法还可用于普通直方图的获取,将0-255依次设定内存或变量地址,才解压是获得的像素数据作为地址偏移量以0地址为基础得到对应地址,在对应地址(或变量)的内存中+1,即可同步实现;进一步还可以同步记录对应的地址,以实现同一像素值区域分别特点的获取。
图6提供了一种利用像素迭代处理实现图片1上目标图像10的识别和定位的原理图;图8给出了基于图8的技术原理对某一黑白图片像素迭代(求和方式的迭代)实测结果图。本技术方案通过将图像像素的行列像素值依次进行求和处理,并绘制相应的曲线,实现将二维的复杂图像信息,转换为简单的一维数据信息,便于计算机的识别应用。当然,还可根据需要,进行其它方向的像素迭代,从而更好地实现图像内容的分析处理。以求和为例对本技术方案予以说明。以图片1行、场(列)方向建立坐标系,其中(0,0)为图片的左上方的像素点(当然,也可以采用其他方式建立坐标系,本申请文件中均采用该坐标系进行说明),以像素点为单位;横坐标x(x=0,1,2……i)为行方向,其刻度为图片的列号,纵坐标y(y=0,1,2……j)为场方向,其刻度为图片的行号。
依次将图片1每行的像素点像素值依次累加求和,投影到像素坐标的纵坐标y上,此时纵坐标y的刻度对应行号,也就得到每行的像素值之和;同理,依次将图片1每列的像素点像素值依次累加求和,投影到像素坐标的横坐标x上,此时横坐标x的刻度对应列号,也就得到每列的像素值之和。由于图片1每个像素点一般由多个通道值构成(具体情况与所使用的编码协议有关,如RGB格式,每个像素点包括3个通道值,求和时分别每个通道进行运算,或者将多个通道值按照一定的运算关系进行求和处理,对于本发明,可以根据不同需要来选择,如果对于太阳检测、定位,采用单通道的黑白图片即可满足要求)由于图片1上不同图像的像素值不同,因此,求和后会直观反应行、列像素值的情况。将求和得到的值绘制成曲线30,因此,迭代曲线30的峰、谷对应不同的目标图像,同时,采用累加方式,背景图像的均匀噪声被淹没,目标图像的特征被放大,可以很好地予以识别。以图8示意的效果(图中假定圆形目标图像10为白色,背景图像为黑色),迭代曲线30的峰值对应目标图像10的峰值,所述峰值对应的行列号就是其在图片上的像素位置,从而快捷地得到目标图像10的位置信息。
图8给出的真实图片1的时间迭代效果,图中图片1为黑白图片,图片上的目标图像10为相同的黑色,背景为白色,行、列方向像素值求和得到曲线如图所示。图中,迭代曲线3包括背景部曲线33(白色,数值最大,8位单通道数值为255),目标部曲线30(黑色,数值小,纯黑色为0),其中目标部曲线谷301是目标图像10中尺寸最大的部位,目标图像10的边界位置为边界部曲线31,此处为迭代曲线3的突变点。通过图中可以看出,通过对迭代曲线3的分析处理,可以直接得到图片1上目标图像10的边界、峰值等像素坐标(对应行列号)。具体应用时,可以设置以峰值,或者以目标部曲线30满足一定的阈值关系来判断是否为目标图像,或者结合目标图10的宽度来进行限定获取。
图15给出了图片1的像素迭代处理效果图;图中的虚线为方便参看对应关系而人为给出的辅助线。图片1a的背景为灰度,目标图像10a为白色,图片1尺寸为729×542(宽×高,下同),通过迭代曲线30上的目标部曲线峰301对应目标图像10a的中心(圆形,峰值为几何尺寸最大部位,也就是中心位置,对于通过滤光处理后成像在图片上的太阳图像具有类似效果),根据计算,得到下表一所示的目标图像10a峰值的坐标及结果。从图中可以看出,在y向(表示行号)上,存在背景噪声,背景噪声部曲线331的峰值显著大于目标部曲线峰301,应用中,可以通过目标部曲线30满足相应的阈值范围来判断是否为目标部曲线30。或者通过迭代曲线的曲率、梯度变化等来判断。图中采用迭代差值方式予以进行边界判断(依次相邻的行累加求和值求差,并赋值到对应行号,比如减数对应的行号,也可时被减数对应的行号;列方向相同)得到迭代差值曲线3a,曲线上的峰、谷值满足阈值情况即为边界。背景噪声的差值曲线边界宽度明细小于目标图像宽度,予以丢弃。
表一:迭代曲线30峰值情况
从上表中,可以看出,无论通过峰值还是边界,或者二者的结合,均可以较好地识别目标图像,并得到目标图像的位置坐标。
本技术方案通过在不同方向上进行像素值迭代(比如求和)的方式,可以在获得图像像素的空间分布特征,从而较好地反应图像的特点。同时,其运算量小,计算复杂度为n(n为图像的像素数量),资源占用少,可以便于在各类移动计算终端、嵌入式设备、乃至计算资源极其有限的单片机等上都可以进行应用,显著提供其应用场景。并且,其稳定性、健壮性和鲁棒性都较强。由于采用迭代方式,使得目标图像像素值与背景图像的像素值的差异化经过跌代而放大,同时,整个过程中无需逐步比较像素值的大小,减小运算负荷,而且,避免了因为图片中噪声的干扰,能较好地对目标图像进行识别。将所述方案用于对图像中的任意目标的边界进行识别,以便于进行目标自动跟踪、图片裁切等,可以对不同形状、不同颜色、背景单一到复杂的多种情况的识别和应用。使用效果好,鲁棒性强,复杂度低。
一、以下为从最大峰/谷为基础的求差,以及以图像中心点行列为基础的求差(给出了相应的行/列像素坐标),这可以减少运算(无需判断曲线的走势,并进一步判断最大峰/谷值并取得对应行列坐标),尽管前述的运算量很小,但是还是有益处的(能耗、运算效率,而且,由于各个通道的峰谷可能不同,选择哪一个通道也需要多次比较)。况且,这种调整对于外观设计切图方面的应用没有影响(一般对象都在图像中部),出现图像中心坐标完全落在对象以外区域是极少的,如果出现,则与以0为基础的效果相似。通过上述技术方案,可以使得绝大部分图像的两侧边界处差值走势处于同向(横轴上方或下方),而且对称性更强,误差也具有相同的对称性,便于采用相同的手段进行修正。此版本软件采用此原理进行设计,其识别算法相对简单。
求差公式为:
(1)i=m,Pic=Pzc=0,Pzc中心(或最大峰/最小谷值)行/列, m为所中心(或最大峰/最小谷值)行/列号
(2)0≤i<m,Pic=Pi-Pi+1,式中,
Pic:i列/行对应的相邻差值,i=m-1, m-2, m-3……0,m为所中心(或最大峰/最小谷值)行/列号
Pi:i列/行对应的像素值总和
Pi+1:i+1列/行对应的像素值总和。
(3)i>m,Pic=Pi-Pi-1,式中,
Pic:i列/行对应的相邻差值,i=m+1, m+2,m+3……,m为所中心(或最大峰/最小谷值)行/列号
Pi:i列/行对应的像素值总和
Pi-1:i-1列/行对应的像素值总和。
从两侧向中间依次做如下运算:
1.依次计算Pic的峰值、谷值,并记录对应的坐标(行/列号)PicM
2.从两侧或上下开始(也就是从图像边缘向中心m行/列进行处理)依次提取PicM,PicM与其向图像两侧(即其前或后,从0开始则与前面的平均比,从末尾开始,则与后面的平均比;也就是靠近边沿方向)的16个像素点的平均值比较(如果不足16个点,以0补足),当前峰/谷值PicM大于平均数(可正、可负,或者采用绝对值平均数)绝对值的F倍,予以记录;判断峰值的相邻的另外S个Pic是否大于其前或后的Pic值平均数绝对值的X倍,如果成立,记录该峰、谷值及对应坐标;
3.记录上述峰、谷对应的坐标作为对象边界坐标。
如果无同时满足F倍、S个、X倍,则取一侧取一个绝对值最大的峰、谷值坐标作为对象边界。
使用过程中,F倍、S个、X倍可以采用输入方式赋值,以便于自行设定并调试确定理想的范围值。
由于计算机无法对曲线进行处理,曲线上的曲率、梯度或斜率变化大的位置(也可以理解为高频位置)可能对应边界,采用相邻求差(横坐标等间,均为1像素点),所述差值就可表征上述信息;
采用从中间开始计算,可以尽可能保障差值的走向具有相对对称性(大部分图像,对于一半黑、一半白这种反向色调的图像相对较少,大部分都具有一定的一致性,至少边界部分具有近似的变化),从而便于计算机自动的识别(如根据其他几个部分的走向来确定等,或者通过对一张图像的信息来修正后续的图像识别)和后期的机器学习
不知道是否是原来不足16个点时,用0补位,估计有问题,如果背景完全纯色,差就是0,无法计算平均数,导致错误,建议作一个检测,如果前面16个点的和为0,则当然任意值都是满足条件,或者对将平均数赋值为1-10,以及根据需要调整相应的参数;
通过找出RC等的峰、谷后,再进行峰谷与前面的平均值【差值绝对值的平均】比较;暂时保持低位的运算方法,对高位的运算进行修改。尤其是敬请确认是否是平均值为0是,对平均值赋1-10,以及均以绝对值进行平均值计算。
另外,需要特别注意,预先设计是以符合要求的峰、谷坐标作为边界,而不是峰、谷外侧的相应坐标,这样虽然可能对部分误判或误差,但是,这样可以避免部分噪声或模糊边界的影响。
【具体步骤为】:
【先扫描差值的峰、谷;从低位开始取第一个峰、谷,与前面点的绝对值平均数比较,如果该峰、谷值大于平均的F倍,在峰、谷前面和后面紧邻的点依次取值(不是峰、谷),如果该值大于平均值(前面点的平均,或者直接与上述比对峰谷的平均值来比)X倍,至少找到S-1个点满足,该峰谷坐标就为边界;高位同理。】
(数据确定原则:如果至少两个通道相近-差在0-10个(取差距最小的),取其外侧通道;如果没有相近的,取外侧通道),通过上述规则,实现对外输出XY的起止坐标。
由于目标对象对应的曲线一般具有反向的一致性(大部分目标的边沿具有相同或接近的色彩,或者相对于背景具有相近的曲线走向;具有类似一半黑,一半白的这种极端情况非常少)。
图像分析是机器智能技术的重要手段,目前,包括图像智能识别在内的各种图像机器分析算法,往往需要针对不同的目标对象采用不同的算法来实现,并且运输量大,复杂度高。本建议提供了一种高效、低复杂度的图像智能分析算法以及其应用。
本算法通过将图像像素的行列像素值依次进行求和处理,并绘制相应的曲线,实现将二维的复杂图像信息,转换为简单的一维数据信息,便于计算机的识别应用。当然,还可根据需要,进行其它方向的像素迭代,从而更好地实现图像内容的分析处理。
将所述算法应用于目标识别,尤其是细小目标的识别,在对蓖麻油中下落的1mm直径的小球下落过程中(落球法测量液体黏滞系数),采用本建议的方案可以实现小球的准确识别,运算量小,而且可以对背景噪声进行有效过滤。
将所述算法用于对图像中的任意目标的边界进行识别,以便于进行目标自动跟踪、图片裁切等,可以对不同形状、不同颜色、背景单一到复杂的多种情况的识别和应用。使用效果好,鲁棒性强,复杂度低。实验结果如附图所示;
所实现的技术可以应用到多种智能设备之中,并且包括嵌入式系统等在内的便携设备,均能很好地予以实现。目前,该算法已经应用到单位开发的“智能化外观设计图片处理系统”之中,并得到了较好的应用效果。
需要说明的是,上述装置和系统内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
图像分析是机器智能技术的重要手段,目前,包括图像智能识别在内的各种图像机器分析算法,往往需要针对不同的目标对象采用不同的算法来实现,并且运输量大,复杂度高。本中间件提供了一种高效、低复杂度的图像智能分析算法以及其应用。本中间件通过将图像像素的行列像素值依次进行求和处理,并绘制相应的曲线,实现将二维的复杂图像信息,转换为简单的一维数据信息,便于计算机的识别应用。当然,还可根据需要,进行其它方向的像素迭代,从而更好地实现图像内容的分析处理。本中间件所可以应用到多种智能设备之中,并且包括嵌入式系统等在内的便携设备,均能很好地予以实现。本中间件运算量小,速度快,使用效果好,鲁棒性强,复杂度低。
本中间件具有鲁棒性强,计算复杂度低(时间复杂度和空间复杂度均较低),克服了原有算法的各种缺陷,通用性强,适应面广,除了可以应用于上述场景,还要其它多种运用。
本项目所使用的算法简单、高效,运算量小,计算复杂度使用范围广,可广泛应用于目标识别等多种用途,目前,相关单位利用该中间件开发的相关系统,由于利用该算法,有效提升了运行效率,加快了处理速度,极大地提升了用户体验。已经形成较强的应用能力,形成了极好的经济效益和社会效益。
随着计算机技术的发展,数字图片的应用领域越来越宽,而对图像处理的日渐增多,工作繁杂琐碎,而且往往工作量大,严重影响了工作效率。比如,在日常工作中,往往需要将系列图片中的各张图片调整成满足一定比例关系的尺寸,尤其是要使得图片中的对象满足一定的比例关系,例如投影比例关系,特定的比例关系等。以外观设计专利申请的图片(含照片)要求为例,其要求所提交的各个视图的图片(含照片)具有相同的比例,现在一般是采用手工调整,工作量大,而且由于是采用诸如Adobe Photoshop等软件来实现,其只能对图片的整体尺寸(包括对象、边框或背景),通过对图片尺寸的调整来实现对图片中对象尺寸的调整,从而试图实现各个视图的对象具有相同的比例,由于各张图片边框或背景的宽度往往是不确定的,也是不一致的,因此,很难准确控制各个视图的对象具有比较准确的等比例。如果对于要求各张图片的中的对象满足其他比例关系时,这种调整难度更大。因此,对于上述图片的剪裁或调整是一个需要解决的问题。
此外,在图片中对象(图片中的目标图像)轮廓边界的识别方面,一般根据对像像素值的差异(如Adobe公司的知名软件Photoshop)来判断边界,也就是通过比较相邻像素点的像素值是否相同(或与选择的样本相同),而真实图像中,任何图像的同一边界,或边界以外的同一边框或背景(如白色边框或背景等)其图像的像素值都不会是绝对的一致(可能存在的阴影或偏色等),为了实现识别和选取,一般对所述像素值设置一定的容差(阈值)范围,在像素值满足相应阈值范围的像素点,则认为是相同的区域,这种方式容易将图像中的满足上述条件,而不属于需要选择的图像区域的像素点被选择,甚至将边界识别错误,尤其是对于背景或边框复杂的图像要把其中的对象边界进行准确识别是一个难题,而且该识别方式运算量也较大。
本算法通过将图像像素的行列像素值依次进行求和处理,并绘制相应的曲线,实现将二维的复杂图像信息,转换为简单的一维数据信息,便于计算机的识别应用。当然,还可根据需要,进行其它方向的像素迭代,从而更好地实现图像内容的分析处理。其实现原理如附图所示;
针对上述不足,本中间件所要解决的技术问题在于提供一种高效的图片调整或剪裁方法和系统,能实现图片按照预设比例自动进行调整。
进一步地,还要提供一种简单、高效的对象轮廓自动识别方法与系统,从而再一步地为对象的识别或实现对图片的自动调整或剪裁奠定基础。当然,所述方法和系统也可应用于其他领域和实现其他的用途。
图像处理方法,通过确定各个图片中对象的边界,根据设定的各个对象的比例关系,设定各个图像的缩放比例,从而对各个图片进行尺寸调整,以使得各个图片的对象满足设定的比例关系。
多个图片拖入相应的框中,或一个图片,在上面描不同的框。
本中间件通过确定各个图片中对象的边界,根据设定的各个对象的比例关系,设定各个图像的缩放比例,从而对各个图片进行尺寸调整,以使得各个图片的对象满足设定的比例关系。
上述方法同样适用于同一图片上的多个对象按照设定的比例进行调整,以满足相应的比例关系。此时,其只对对象的尺寸进行调整。
当然,上述方案中,为了保持图片的整体性,可以采用以边界向外延展一定宽度,将该宽度的背景和对象一并进行尺寸调整。
所述目标图像(对象)轮廓边界的确定,可以采用现有的方法来实现,如背景技术所提及的技术方案,以及其他相应的技术方案,或者通过一滤波器,滤除图像中的低频部分,剩下的高频部分即为对象的轮廓边界,通过识别所述边界像素点的坐标,即可实现对其轮廓边界的确定。以及应用小波算法,也可以获得图像的边界;甚至通过对图片上各个像素点逐行、逐列扫描,比较出像素点像素值变化情况来确定轮廓边界。
由于上述对象轮廓边界只需要获得对象的最大边界即可,无需获得全部边界的坐标,因此,提供了一种确定图片上的目标图像轮廓边界的方法。以黑白图像为例,实际图像中像素值越大,表现为越偏向白色,即纯黑色为0,白色为255(8位黑白图像)。在本申请中,为了便于描述,将目标图像的像素值设定为大于背景或边框的像素值。当然,本中间件所提供的方法适合于任何图片,如果图片是RGB或YUV等多通道图像,可以分通道实施,并进行迭代;也可以只选取一个通道的像素点进行处理。
所述,采用将图片的像素点的横向投影到纵坐标、纵向投影到横坐标,可以获得投影后的两条曲线(也可是将相应的各个像素点像素值横向累加后表示在相应的坐标系上得到曲线),根据图像的特定,图像的波峰或波谷(图中为波峰)对应的即为图片中的对象;通过这种方式可以滤除背景中均匀的超声的影响。进一步,再配以图像直径等要素作为阈值,对其他可能的背景噪声进行滤除,对应的波峰或波谷中心点即为图像中对象的中心。相应地从曲线两侧向图像靠拢的地方曲线曲率变化最大或曲率最大处即为对象的边界坐标(当然也可采用设定阈值来进行判断),如图中的a、b、c、d点,根据所述坐标即可绘制出一矩形框,基于a、b、c、d点,即可获得矩形框的A、B、C、D边的坐标,其即为对象的边界。本方法简单,效率高,鲁棒性强。
此外,以下提出了一种对上述对象轮廓边界确定方法的改进方案,通过下述方案能更好地获得对象的边界坐标。
采用像素点投影叠加方式,由于背景噪声或边缘处因图像数据处理的因素形成的像素点像素值可能比较大(当然也可以是小,本说明仅以举例说明),从而接近其中目标图像的像素值,导致行、列像素值叠加后,图像部分被背景噪声淹没,无法得到结果。鉴于此,可以采用对图像进行二值化处理获得二值化图像来进行像素点像素值的叠加,这样可以有效获得目标图像所在的位置。也可采用对像素点的像素值进行加权方式运算后实现对目标的图像的加强(目标图像的像素值和背景等被明显区分开,差距拉大),以下采用了像素点像素值做指数化运算(特定的加权运算,暂时定义为自加权)的结果示意,均较好地提升了效果。其中,为了简化图表,只模拟给出了20行、3列像素点构成的图像。其中前述的对像素点进行指数化运算包括:对像素值进行1次方、2次方……n(n为正整数)次方运算,以及以自身像素值作为指数(其中的“指数”,如像素值为5,运算方式为55)进行运算。
此外,所述的方法还可以实现对图像的加强处理,使得对比度低的图像对比度得以提高,从而使得目标图像与背景之间的差异加大,各个部分的像素值变化更为明显。
当然,还可以实现对图片背景的去处和修改,通过所述的加权运算,将所有数据减去背景中的最大值,即可清除掉背景,然后在做自加权逆运算,甚至直接对数据做1/m(m≥2,3,4……n)次方的运算。或者将低于某一数值的全部像素值进行替换,可以实现背景的清除或替换,然后在做自加权逆运算,甚至直接对数据做1/m(m≥2,3,4……n)次方的运算。
各个模块的功能及数据接口简表。其中的数据输入列明输入的数据名称以及来源位置(括号内);输出数据列明输出的数据名称以位置(括号内)。
所述的“图像”指图片解压后获得的位图信息;“对象”指图像中需要识别的目标(内容)。
含图像位图数据传送控制。
实现:
1.将每个数据块的数据同时送到3个变量或内存地址(显示、行求和、列求和);
2.获得行求和、列求和(累加)值;
(原理图参见图2,这种方式实时性更强:解析图片数据时,将图像数据同时送到本模块的运算变量求和、送到显示模块用于显示)
可考虑直接调用windows图片浏览器的内存数据来处理(采用5的原理同步方式)
可实现,
1.用于显示的连续位图数据串(内存)
2.行列累加值数据序列(内存)
输出从解析图片到获得累加数据的时间,用于测试。(并在另文中给出计时起点和终点)
1. 以及每个通道相邻和的差值(或梯度值)
2. 找出累加(求和)值曲线的全部波峰、波谷;
3. 找出差值的全部波峰、波谷;
4. 照片类的识别策略为:(照片)判断出对象的大致区域(曲线走向,如果通过峰谷位置判断:a峰谷均处于两侧数值的同侧-好判断;b峰与谷分居两侧数值的异侧;c峰谷在两侧数值异侧均有出现;d两侧数值由于受噪声影响,本身就不对应,两侧都是变化且差距大;f背景噪声中的峰谷存在干扰);找到差值的全部波峰、波谷,与前述拟合,确定对象区域,差值为(峰-谷分别对应边界),所述峰-谷对应坐标为边界坐标(,噪声峰谷的判断,)。所述峰-谷为明显偏离边缘的平均值(方向与曲线走向相适应),并且相邻无绝对值接近的反向谷或峰(以边界为波谷为例,即边界处靠近对象中心方向无直接临近的、处于坐标轴异侧,绝对值相差50%以上的波峰);或者以图像中部最大的峰、谷的10%以上的峰、谷作为边界点。第一种应该更准确,
如果多个通道彼此不能完全对应,优选峰值最明显的曲线,并与其他曲线定性拟合(满足大致拟合关系-三个通道曲线对应的区域拟合,而不是走势拟合。)(见图3-5)
5. 线条图的识别策略为:(线条图,如果自动识别线条图有难道,可以采用人为选择图像类型)另外,如果是线条图(多数为黑白线条,但是可能是彩色图片方式呈现的黑白)(通过差值峰-谷间距与曲线上波峰宽度适应,或者上述宽度仅仅1-30个像素,并且大多相差不大,或者满足2-4倍以内的比例关系;或者曲线中至少一个大的峰/谷值(一般为谷)(对于某些线条图,可能峰/谷值不明显),而曲线的其它部分(平滑部分)的数值很小(或大)与之相差巨大——10倍以上)。对于线条图的以两侧曲线或差值(最好二者拟合)的谷值对应坐标为边界,此时不用上述2中“并且相邻无绝对值接近的反向谷或峰”的要件来判断边界。
另外,线条图,通常情况下边缘为纯白色(0),但是也可能是灰度,数值较小-因为可能是扫描得到的线条图像,同时,彩色照片也可能边缘图像被处理,呈现为纯白色。因此不能以0作为判断标准。(见图6)
补充:测试中差值计算时,将差与被减数像素坐标对应(从坐标0开始执行),也可根据情况反向处理,或从曲线的中部峰/谷开始往两侧减-中间无数据,但是此时边界识别策略需要调整,应该表现为同向的,即以最大值为被减数。
上述2、3合并后的整体策略为:
A:判断图片类型
B:识别边界(选通道)
实现:对象的行列边界坐标值(像素为单位)。
输出差值(或梯度值)、运算耗时,用于调试(并在另文中给出计时起点和终点)
判断曲线走势,并大致确定图像范围或方向(如何确定对象的曲线的峰或谷),以峰/谷20-80%(优选30%、40%、50%、60%)以上在起点上或下为标准进行判断,颜色复杂,不在一个标准分区内,如白到黑的渐变对象属于极端之一,在加上背景包含白色或黑色,识别难度极大(测试得到的效果不好),但是如果背景相对干净,应该可以判断。暂时不考虑。因为,如果背景复杂,其曲线走势无法判断背景和对象,虽然可以通过曲线的光滑程度来配合,但是,如果背景曲线的光滑程度与对象及边界接近,则很难作出判断。
任何一个通道(通常转为黑白的通道)显示不出边界-黑白无法显示,提示要求修改背景色。
以下为相关手段的测试范例(以下均为以图像左上像素坐标点为(0,0))
一、以下为从最大峰/谷为基础的求差,以及以图像中心点行列为基础的求差(给出了相应的行/列像素坐标),这可以减少运算(无需判断曲线的走势,并进一步判断最大峰/谷值并取得对应行列坐标),尽管前述的运算量很小,但是还是有益处的(能耗、运算效率,而且,由于各个通道的峰谷可能不同,选择哪一个通道也需要多次比较)。况且,这种调整对于外观设计切图方面的应用没有影响(一般对象都在图像中部),出现图像中心坐标完全落在对象以外区域是极少的,如果出现,则与以0为基础的效果相似。通过上述技术方案,可以使得绝大部分图像的两侧边界处差值走势处于同向(横轴上方或下方),而且对称性更强,误差也具有相同的对称性,便于采用相同的手段进行修正。此版本软件采用此原理进行设计,其识别算法相对简单。
1.对符合曲线走势的方向的数(正或负)两侧求平均值(如果不用正负整体求,平均值小,阈值可能不好确定;如果绝对值的平均,可能加大运算量),满足条件方向的差值的平均值(取多少个平均值开始,还是找到峰值之前的全部平均,-噪声的峰值,而且所述峰值应该至少一个方向有一定的变化趋势,如多个值具有相通的走势),当前值(or第一个峰值-峰值最好)显著大于平均值即可(阈值如何取。如10倍平均值,接近10倍开始的峰值即可)平均取峰前全部,还是峰起始前全部,
经过测试,差值峰值大于前或后的平均值10倍,峰值不是孤立的大,而且前后至少3-5个点都大,杯子测试通过
可以考虑如果上述峰值都不连续,则选取独立峰值(是否可以考虑有2个以上大于2倍平均的,),如窗帘上的单色物品,窗帘的通过
上述再配合曲线的全部波峰,落于上述区间进行辅助修正,不是,继续往下(走势判断)
2.依次找到差值的峰值,判断当前曲线值得走势,(如何判断,-该点前后10个点,走势同or不同,)该思路对下述特点不好判断,噪声趋势与对象接近(左侧)
线条图的曲线谷位于差值峰谷的对称中心或中间,而且较窄;整个图全是峰或谷,对于外观,曲线只能是谷
3.通过走势一致性(整体性)来判断
采用下述对3个通道分别执行,并拟合,取至少两个可拟合通道的点为边界。如果没用同时满足两侧点的相同两个通道,可以采用两侧不同的通道的拟合点,如左侧为rb,右侧为rg。
1.分别从行列累加值从行/列中心开始向两侧相邻求差,得到差值Pic;
2.提取Pic的全部峰/谷(负峰)值及对应的横坐标(行/列值),并从中心向两侧排序(反向排序也可)(峰/谷可以在后续逐个计算)由于计算机无法对曲线进行处理,曲线上的曲率、梯度或斜率变化大的位置(也可以理解为高频位置)可能对应边界,采用相邻求差(横坐标等间,均为1像素点),所述差值就可表征上述信息;
采用从中间开始计算,可以尽可能保障差值的走向具有相对对称性(大部分图像,对应一半黑、一半白这种反向色调的图像相对较少,大部分都具有一定的一致性,至少边界部分具有近似的变化),从而便于计算机自动的识别(如根据其他几个部分的走向来确定等,或者通过对一张图像的信息来修正后续的图像识别)和后期的机器学习。
从两侧向中间首位相减(DP0=R0-Rm,DP1=R1-Rm-1……,m为最末端的行/列号);
先做:如果首个符合下述条件的峰、谷(符合下述对象边界条件)距离图片像素边界小于20-50(D)像素,不取该点做对象边界,往下走。并且该峰谷及靠近边沿的方向的数据不用于计算平均值
由于可能存在边沿干扰图像(只正对非对称干扰图像,如果是对称的干扰图像,由于对于计算机来说,会把干扰图像作为背景,而把包含真实背景和目标的图像整体作为目标,因为,对于任意对象,在图像上还是可能出现大面积的均匀色块)或噪声,如果采用“先做”的方法,可以避免边界噪声或图像的影响。
从两侧向中间依次做如下运算:
1.依次(提取或计算出峰值)Pic当前峰值与其前(或后,从0开始则与前面的平均比,从末尾开始,则与后面的平均比;也就是靠近边沿方向)的所有大于0的Pic值的平均值比较,如果峰值大于平均值的F倍,予以记录;判断峰值的相邻的另外S个Pic是否大于其前大于0的Pic值平均值的X倍,如果成立,记录该峰值及对应坐标;(满足的条件的第一个峰)
2.依次(提取或计算出峰值)将Pic当前谷值(负峰值)与其前(或后,从0开始则与前面的平均比,从末尾开始,则与后面的平均比;也就是靠近边沿方向)的所有小于0的Pic值的平均值比较(绝对值,下同),如果谷值大于平均值的F倍,予以记录;判断谷值的相邻的另外S个Pic是否大于其前大于0的Pic值平均值的X倍,如果成立,记录该谷值及对应坐标;(满足的条件的第一个谷)
说明:上述1.2是相似的,只是一个用正数取峰,一个用负数取谷
3.如果只有峰或谷满足条件,则其就是边界坐标;
4.如果两侧均同时存在满足条件的峰、谷,则比较峰谷对应的坐标,取靠近两侧的坐标为边界坐标;(或者取绝对值大的)
5. 两侧取方向性一致的峰谷,即:如果在某侧具有,如果提取到的两侧的Pic峰/谷情况是,某一侧只有符合上述1.2条件的峰或谷,而另一侧同时有符合上述1.2条件的相邻峰、谷(中间无其他满足条件的峰谷),则取与某一侧同类的为边界。如某一侧为峰,而另一侧有峰、谷,则该侧取峰。还包括,两侧同存峰谷,
(结合其他方向的峰谷方向来判断)
6.如果全部Pic数据中只有满足条件(F倍)的孤立峰谷,而峰谷相邻的点不满足条件(X倍),则分别以第一个孤立峰、谷为边界,因此,上述1、2判断单独满足条件的峰、谷对应的坐标要进行记录。
如果均无满足F倍、S个、X倍,则取一侧取一个绝对值最大的峰、谷。
由于目标对象对应的曲线一般具有反向的一致性(大部分目标的边沿具有相同或接近的色彩,或者相对于背景具有相近的曲线走向;具有类似一半黑,一半白的这种极端情况非常少),所述F倍(取2-15)、S个(取0-10的整数)、X倍(0-14.5),一般F>X。例如,可以取如下组别的数值。所述参数的选择,根据是图像识别的精度,图像的特点等进行选择。
。
关于图像迭代的扩展和改进,
1.为了提高计算效率,以及内存空间长度的限制问题,采用以下措施来实现(可以用于图像边界获取等):
分别建立行、列累加缓存,依次提取一个像素值,根据其坐标,同时送到行、列缓存并累加。提高运算效率。
如何减少寻址时间,指针不断变换,采用相邻,减少寻址。
当行或列某一坐标的累加值大于一定阈值,而且余下像素多(可根据象素数及平均值预判),对应行、列全部像素值减去对应行、列的最小值,以释放空间。
每个像素值先统一乘以一个小于1的数字(如0.1等),然后再进行迭代。(开方等不好,因为会缩小差距,倍数保持了图片像素的关系)
2.为了实现对背景的删除-抠图问题
除了采取自加权方式运算外,还可以采用以下方式;
先迭代获得图像区域,对所述区域进行滤波获得高频部分,也就是边界,对所述高频部分图像二值化,从迭代获得的任意边界开始依次获取边界坐标,对应到原图,获得边界坐标;所述边界曲线为闭合曲线或与图片边缘闭合。
为了避免背景纹路等的干扰边界,上述寻边界优选向迭代后的中心靠拢方式寻边。中心靠拢有问题,可以配合迭代确定的图像范围来实现分层迭代-先滤波得到轮廓,逐步迭代确定边界点,沿着迭代后曲率最大处的轮廓前行,或者迭代总数再逆向做(相当于逐步减去一行的像素)
此外,由于图像中也存在轮廓线等,如果单纯向中心聚合,可能出现将图像对象分割,再配合迭代曲线来处理;另外,可以考虑,对图像进行二值化后,进行迭代的数据配合处理。
3.为了实现图片的比对对齐
对所有迭代峰谷进行比对,确定线条是否对其,如果没有对其,或峰谷异常,应提示用户,确认是否有误,如图片绘制过程中缺少或多了线条等。
具体应用中,可以先纵向投影,获得标尺的横向边界范围,并在此范围内在进行横向投影迭代,
作为一种进一步提高效率的技术方案,可以采用矩阵式图像处理系统,如图像传感器矩阵、图像处理芯片等,在其中图像以矩阵形式存在,直接获得矩阵数据进行迭代即可实时获得相关数据,并实现实时处理。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
Claims (10)
1.图像变换方法,其特征在于,将图片上的各个像素点的像素值按照预定规则,沿着特定方向进行迭代处理,得到迭代曲线,实现将二维图像数据变换为一维数据。
2.如权利要求1所述的方法,其特征在于,所述迭代方向沿着图片的行、列方向进行迭代。
3.如权利要求1所述的方法,其特征在于,所述迭代方式为累加求和。
4.图像识别、比对、检索、匹配(相似图像匹配),其特征在于,通过比较两个图片运用本发明进行迭代,得到迭代曲线,实现将二维数据变成一维数据,通过比对两组迭代曲线的相似度或者关系,从而判断两个图片或图片上的目标图像的相似程度。
5.图片中目标图像边界识别,通过对迭代曲线上边界部曲线的识别和判断,实现对目标图像边界的识别;进一步地,通过边界的识别可以确定目标图像的几何中心;通过迭代曲线峰、谷的识别,可以实现对图像几何尺寸最大位置的识别和判断。
6.图像异常判断,图像缺陷判断,通过对将当前图片的像素迭代曲线与预先设定的标准图像的像素迭代曲线的比较,如果存在不同点(满足一定阈值条件),则图像存在异常,并根据异常点的坐标,确定图像异常的位置。
7.标尺识别(视觉传感器的定标(以及图像的定标、视觉测量),对标尺图片进行像素迭代,通过迭代曲线的峰或谷的识别,实现对标尺的识别,并且对图片像素进行定标(在同等条件下,每个像素点的对应的图像尺寸),从而进一步实现通过图片或图像采集设备对目标物的尺寸进行精确测量,从而实现自动化和智能化。
8.视频图像监控(含实时监控等),通过对不同视频帧(图片)进行像素迭代,通过对将当前图片的像素迭代曲线与预先设定的标准图像的像素迭代曲线的比较,如果存在不同点(满足一定阈值条件),则图像存在异常,说明有物体侵入,并根据异常点的坐标,确定图像异常的位置。
9.视频帧比对,通过对迭代曲线的比对,根据迭代曲线的差异情况,确定是否作为关键帧,将非关键帧图像与关键帧图像的迭代曲线的比对,获取差一点,并据需进行压缩过程中确定变换的区域,对其他没有发生变化的区域直接使用关键帧的数据等。
10.所述方法和系统,对于目标图像的识别还可以用于路面标识识别、路面障碍物识别,实现基于视觉的智能导航判定。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710002678 | 2017-01-03 | ||
CN2017100026787 | 2017-01-03 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109146768A true CN109146768A (zh) | 2019-01-04 |
Family
ID=62773323
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810004861.5A Pending CN108269270A (zh) | 2017-01-03 | 2018-01-03 | 太阳检测、跟踪装置,方法及应用 |
CN201810006155.4A Pending CN109146768A (zh) | 2017-01-03 | 2018-01-03 | 图像变换方法、系统及应用 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810004861.5A Pending CN108269270A (zh) | 2017-01-03 | 2018-01-03 | 太阳检测、跟踪装置,方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN108269270A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111343335A (zh) * | 2020-02-14 | 2020-06-26 | Tcl移动通信科技(宁波)有限公司 | 图像显示处理方法、系统、存储介质及移动终端 |
CN114494017A (zh) * | 2022-01-25 | 2022-05-13 | 北京至简墨奇科技有限公司 | 根据比例尺进行图像dpi调整的方法和装置、设备及介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109297464B (zh) * | 2018-12-03 | 2021-02-23 | 大连维德集成电路有限公司 | 一种基于激光定位的桥梁沉降视觉监测装置及方法 |
CN110243393B (zh) * | 2019-06-17 | 2021-01-05 | 中国科学院合肥物质科学研究院 | 一种自动化全谱段辐射定标参照目标装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101604439A (zh) * | 2008-06-13 | 2009-12-16 | 西北工业大学 | 一种基于多混沌系统的彩色图像加密方法 |
CN101790069A (zh) * | 2010-03-09 | 2010-07-28 | 周艇 | 一种基于图像边缘方向的尺度变换方法 |
CN102243766A (zh) * | 2011-06-08 | 2011-11-16 | 无锡引速得信息科技有限公司 | 一种ct图像重建加速的新方法 |
CN102521801A (zh) * | 2011-11-23 | 2012-06-27 | 中国科学院深圳先进技术研究院 | Ct图像的环形伪影及弧形伪影校正方法 |
CN102609936A (zh) * | 2012-01-10 | 2012-07-25 | 四川长虹电器股份有限公司 | 基于置信度传播的图像立体匹配方法 |
CN103049598A (zh) * | 2012-11-29 | 2013-04-17 | 北京航空航天大学 | 一种基于像素坐标策略的电磁兼容测试曲线图片的信息提取方法 |
CN103325130A (zh) * | 2013-06-18 | 2013-09-25 | 浙江大学 | 基于t样条的几何迭代图像拟合方法 |
CN103617590A (zh) * | 2013-11-28 | 2014-03-05 | 辽宁大学 | 一种基于魏尔斯特拉斯函数的图像置乱方法 |
CN103632338A (zh) * | 2013-12-05 | 2014-03-12 | 鲁东大学 | 一种基于匹配曲线特征的图像配准评估法 |
CN103729856A (zh) * | 2014-01-24 | 2014-04-16 | 浙江师范大学 | 一种利用s变换信号提取的布匹疵点检测方法 |
CN104036290A (zh) * | 2014-06-11 | 2014-09-10 | 新达通科技股份有限公司 | 一种纸币面值识别方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1680778A (zh) * | 2004-04-27 | 2005-10-12 | 北京山鑫海达科技发展有限公司 | 运动目标高速实时数字图像测量系统及测量方法 |
CN102135777B (zh) * | 2010-12-14 | 2013-01-02 | 天津理工大学 | 车载红外跟踪系统 |
CN211827332U (zh) * | 2018-01-03 | 2020-10-30 | 成都科创知识产权研究所 | 目标检测、跟踪装置,太阳检测、跟踪装置及太阳能系统,防眩光系统 |
-
2018
- 2018-01-03 CN CN201810004861.5A patent/CN108269270A/zh active Pending
- 2018-01-03 CN CN201810006155.4A patent/CN109146768A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101604439A (zh) * | 2008-06-13 | 2009-12-16 | 西北工业大学 | 一种基于多混沌系统的彩色图像加密方法 |
CN101790069A (zh) * | 2010-03-09 | 2010-07-28 | 周艇 | 一种基于图像边缘方向的尺度变换方法 |
CN102243766A (zh) * | 2011-06-08 | 2011-11-16 | 无锡引速得信息科技有限公司 | 一种ct图像重建加速的新方法 |
CN102521801A (zh) * | 2011-11-23 | 2012-06-27 | 中国科学院深圳先进技术研究院 | Ct图像的环形伪影及弧形伪影校正方法 |
CN102609936A (zh) * | 2012-01-10 | 2012-07-25 | 四川长虹电器股份有限公司 | 基于置信度传播的图像立体匹配方法 |
CN103049598A (zh) * | 2012-11-29 | 2013-04-17 | 北京航空航天大学 | 一种基于像素坐标策略的电磁兼容测试曲线图片的信息提取方法 |
CN103325130A (zh) * | 2013-06-18 | 2013-09-25 | 浙江大学 | 基于t样条的几何迭代图像拟合方法 |
CN103617590A (zh) * | 2013-11-28 | 2014-03-05 | 辽宁大学 | 一种基于魏尔斯特拉斯函数的图像置乱方法 |
CN103632338A (zh) * | 2013-12-05 | 2014-03-12 | 鲁东大学 | 一种基于匹配曲线特征的图像配准评估法 |
CN103729856A (zh) * | 2014-01-24 | 2014-04-16 | 浙江师范大学 | 一种利用s变换信号提取的布匹疵点检测方法 |
CN104036290A (zh) * | 2014-06-11 | 2014-09-10 | 新达通科技股份有限公司 | 一种纸币面值识别方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111343335A (zh) * | 2020-02-14 | 2020-06-26 | Tcl移动通信科技(宁波)有限公司 | 图像显示处理方法、系统、存储介质及移动终端 |
CN114494017A (zh) * | 2022-01-25 | 2022-05-13 | 北京至简墨奇科技有限公司 | 根据比例尺进行图像dpi调整的方法和装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108269270A (zh) | 2018-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110598610B (zh) | 一种基于神经选择注意的目标显著性检测方法 | |
CN109146768A (zh) | 图像变换方法、系统及应用 | |
CN104050443B (zh) | 使用肤色检测的视频流的姿势预处理 | |
WO2018145470A1 (zh) | 一种图像检测方法和装置 | |
CN109800698A (zh) | 基于深度网络的图标检测方法 | |
CN110610509B (zh) | 可指定类别的优化抠图方法及系统 | |
CN111914698B (zh) | 图像中人体的分割方法、分割系统、电子设备及存储介质 | |
CN104794479B (zh) | 基于局部笔画宽度变换的自然场景图片中文本检测方法 | |
WO2022247162A1 (zh) | 一种基于机器视觉的透明度检测方法 | |
WO2021184718A1 (zh) | 卡片边框识别方法、装置、设备和计算机存储介质 | |
Lu et al. | Saliency modeling from image histograms | |
WO2020151148A1 (zh) | 基于神经网络的黑白照片色彩恢复方法、装置及存储介质 | |
CN110909778B (zh) | 一种基于几何一致性的图像语义特征匹配方法 | |
Ma et al. | Saliency detection based on singular value decomposition | |
WO2022127814A1 (zh) | 一种图像的显著性物体检测方法、装置、设备及存储介质 | |
Xiao et al. | Pedestrian object detection with fusion of visual attention mechanism and semantic computation | |
CN115082776A (zh) | 一种基于图像识别的电能表自动检测系统及方法 | |
CN109587394A (zh) | 一种智能构图方法、电子设备及存储介质 | |
CN115170832A (zh) | 一种基于可见光单图像的弱纹理表面微结构特征提取方法 | |
CN110910497A (zh) | 实现增强现实地图的方法和系统 | |
CN111369494B (zh) | 冬小麦穗密度检测方法及装置 | |
CN117197064A (zh) | 一种无接触眼红程度自动分析方法 | |
CN114463346B (zh) | 一种基于移动端的复杂环境快速舌分割装置 | |
CN110288621A (zh) | 基于b样条的唇线补全方法、装置、电子设备及存储介质 | |
CN115063473A (zh) | 物体高度的检测方法、装置、计算机设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |