CN117710695A - 图像数据的处理方法及电子设备 - Google Patents
图像数据的处理方法及电子设备 Download PDFInfo
- Publication number
- CN117710695A CN117710695A CN202310972584.8A CN202310972584A CN117710695A CN 117710695 A CN117710695 A CN 117710695A CN 202310972584 A CN202310972584 A CN 202310972584A CN 117710695 A CN117710695 A CN 117710695A
- Authority
- CN
- China
- Prior art keywords
- processor
- matching
- feature
- software
- electronic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 238000000034 method Methods 0.000 claims abstract description 90
- 238000012545 processing Methods 0.000 claims description 37
- 238000004590 computer program Methods 0.000 claims description 26
- 238000000605 extraction Methods 0.000 abstract description 49
- 230000001976 improved effect Effects 0.000 abstract description 14
- 238000004891 communication Methods 0.000 description 36
- 230000006854 communication Effects 0.000 description 36
- 230000006870 function Effects 0.000 description 27
- 230000008569 process Effects 0.000 description 26
- 238000007726 management method Methods 0.000 description 21
- 239000010410 layer Substances 0.000 description 19
- 230000000694 effects Effects 0.000 description 17
- 230000005236 sound signal Effects 0.000 description 13
- 238000010295 mobile communication Methods 0.000 description 12
- 210000000988 bone and bone Anatomy 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 229920001621 AMOLED Polymers 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000003416 augmentation Effects 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000004438 eyesight Effects 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000016776 visual perception Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000002138 osteoinductive effect Effects 0.000 description 1
- 230000010349 pulsation Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本申请提供了一种图像数据的处理方法及电子设备,该电子设备包括硬化模块和处理器,该方法包括:利用硬化模块分别提取待处理的多个图像帧的特征点,然后,基于这些特征点,通过软件对该多个图像帧中相邻的图像帧进行特征匹配。通过本申请提供的方法,可以提高特征提取与匹配的精度,降低功耗。
Description
技术领域
本申请属于计算机视觉领域,尤其涉及一种图像数据的处理方法及电子设备。
背景技术
随着技术的快速发展,视觉感知技术开始应用于各种领域,该技术可以用于理解多个视觉目标之间的区别与联系,并根据特定的需求对感知的信息作相应的处理。
其中,特征提取与匹配是视觉感知技术在实际应用中的一个重要任务,广泛运用在视频防抖、运动识别、图像检索、目标检测等场景中,因此,如果特征提取与匹配所执行的效果不佳,将会影响最终任务的完成效果。同时,在进行特征提取与匹配时往往需要处理大量数据,因此功耗可能会比较高,这将会影响电子设备的整体性能。
因此,如何进行特征提取与匹配,以优化效果,降低功耗,是当前亟待解决的技术问题。
发明内容
本申请实施例提供了一种图像数据的处理方法及电子设备,可以提高特征提取与匹配的精度,降低功耗。
第一方面,提供了一种图像数据的处理方法,应用于电子设备,该电子设备包括硬化模块和处理器,该方法包括:利用该硬化模块分别提取待处理的多个图像帧的特征点;基于该特征点,利用该处理器通过软件对该多个图像帧中相邻的图像帧进行特征匹配。
在上述方案中,由硬件(及硬化模块)执行特征点提取的流程,而由软件执行特征匹配的流程,也就是说,本申请实施例提供的方案将软件或硬件执行特征提取与匹配的流程进行了解耦,利用硬件执行特征点的提取具有低功耗的优点、软件执行特征匹配具有精度高的优点,提高了特征提取与匹配的效果,同时规避了软件执行特征点的提取时功耗高的缺点,以及硬件执行特征匹配时精度低的缺点,使得该特征提取与匹配的方法能够适应更多场景。
结合第一方面,在第一方面的某些实现方式中,该基于该特征点,利用该处理器通过软件对该多个图像帧中相邻的图像帧进行特征匹配,包括:基于当前业务,利用该处理器通过该软件确定匹配规则;基于该匹配规则,利用该处理器通过该软件进行该特征匹配。
在上述方案中,通过软件进行特征匹配。由于软件可以针对当前业务定制化特征匹配的流程(即根据当前业务确定匹配规则),有利于提高特征匹配的精度,因此效果比较好,可以避免由硬件执行特征匹配时精度低、应用场景比较局限的问题。
结合第一方面,在第一方面的某些实现方式中,该匹配规则包括:通过512位的描述子进行特征匹配;该基于该匹配规则,利用该处理器通过该软件进行该特征匹配,包括:利用该处理器通过该软件计算该特征点对应的描述子,该描述子为512位;基于该描述子,利用该处理器通过该软件进行该特征匹配。
在上述方案中,通过512位的描述子进行特征匹配,可以提高特征匹配的精度。具体来说,如果通过硬化模块执行特征匹配的流程的话,计算的描述子是256位的,并且由于硬件无法做到定制化,所以无法修改描述子的位数,而如果这个时候当前业务对匹配精度要求比较高的话,可能就无法满足当前业务的要求,而通过软件便可以根据当前业务的需要灵活调整描述子的位数,从而满足当前业务的需求。
结合第一方面,在第一方面的某些实现方式中,该匹配规则包括:通过双向匹配维度进行特征匹配;该基于该匹配规则,利用该处理器通过该软件进行该特征匹配,包括:利用该处理器通过该软件计算该特征点对应的描述子;利用该处理器通过该软件计算该多个图像帧中相邻的图像帧的描述子之间的双向汉明距离,该双向汉明距离用于表示该特征匹配的结果。
在上述方案中,在进行特征匹配的时候计算双向汉明距离,可以降低误匹配的概率,提高匹配精度。具体来说,如果通过硬化模块执行特征匹配流程的话,是通过计算单向汉明距离来进行特征匹配的,并且由于硬件无法做到定制化,所以无法对匹配维度进行修改,而如果当前业务对匹配精度要求比较高的话,可能就无法满足当前业务的要求,而通过软件可以根据当前业务计算双向汉明距离,即将匹配维度从单向提升为双向,从而降低误匹配的概率,提高匹配精度。
结合第一方面,在第一方面的某些实现方式中,该匹配规则包括:通过基于预设阈值筛选后的特征点进行特征匹配;该基于该匹配规则,利用该处理器通过该软件进行该特征匹配,包括:基于该匹配规则,去除该特征点中分数低于该预设阈值的特征点,得到筛选后的特征点;基于该筛选后的特征点,利用该处理器通过该软件进行该特征匹配。
结合第一方面,在第一方面的某些实现方式中,该方法还包括:利用该处理器从该硬化模块获取该特征点,并将该特征点输入该软件。
在上述方案中,为了通过软硬件协同的方式进行特征提取和匹配,可以利用处理器将从硬化模块获取的特征点输入软件中,以便通过软件基于该特征点进行特征匹配,提高特征匹配的精度。
结合第一方面,在第一方面的某些实现方式中,该利用该处理器从该硬化模块获取该特征点,包括:利用该处理器通过驱动器调用该硬化模块的输出接口;利用该处理器从该硬化模块的输出接口获取该特征点。
上述方案可以实现软硬件协同,使得硬件(即硬化模块)和软件一起完成特征提取与匹配的流程。具体来说,硬化模块提取了特征点之后,处理器可以调用该硬化模块的接口来获取特征点,从而使得处理器可以通过软件来进一步进行特征匹配。
结合第一方面,在第一方面的某些实现方式中,该方法还包括:基于特征匹配的结果,对该多个图像帧进行防抖处理。
上述方案可以基于特征匹配的结果进行防抖处理,由于上述特征提取与匹配的方案具有功耗低、精度高的优点,因此也可以提高图像(或视频)的防抖效果。
结合第一方面,在第一方面的某些实现方式中,该多个图像帧为待处理视频流中多个连续的图像帧。
第二方面,提供了一种电子设备,包括硬化模块和处理器,该硬化模块,用于分别提取待处理的多个图像帧的特征点;该处理器,用于从该硬化模块获取该特征点;以及,基于该特征点,通过软件对该多个图像帧中相邻的图像帧进行特征匹配。
可以理解的是,该硬化模块可以用于执行第一方面中任一项所述的图像数据的处理方法中由硬化模块所执行的方案,该处理器可以用于执行第一方面中任一项所述的图像数据的处理方法中由处理器所执行的方案。
第三方面,提供了一种电子设备,该电子设备包括存储器、硬化模块、处理器、存储在该存储中其并可在该硬化模块上运行的第一计算机程序以及存储在该存储器中并可在该处理器上运行的第二计算机程序,该第一计算机程序被该硬化模块执行时实现如第一方面中任一项所述的方法中由该硬化模块执行的方法,该第二计算机程序被该处理器执行时实现如第一方面中任一项所述的方法中由该处理器执行的方法。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被电子设备执行时,实现如上述第一方面中任一项所述的图像数据的处理方法的步骤。
第五方面,提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述第一方面中任一项所述的图像数据的处理方法。
第六方面,提供了一种芯片系统,该芯片系统与存储器耦合,该芯片系统用于读取并执行存储器中存储的计算机程序,以实现上述第一方面任一项所述的图像数据的处理方法。
其中,芯片系统可以是单个芯片或者,多个芯片组成的芯片模组。
可以理解的是,上述第二方面至第六方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
图1示出了本申请实施例提供的一种特征提取与匹配的示意性流程图;
图2示出了本申请实施例提供的另一种特征提取与匹配的示意性流程图;
图3示出了本申请实施例提供的一种图像数据的处理方法的示意性流程图;
图4示出了本申请实施例提供的另一种图像数据的处理方法的示意性流程图;
图5示出了本申请实施例提供的一种电子设备的结构示意图;
图6示出了一种由电子设备执行本申请实施例提供的图像数据的处理方法的示意性流程图;
图7是本申请实施例的一种电子设备的软件结构框图;
图8示出了本申请实施例提供的一种电子设备的结构框图;
图9示出了本申请实施例提供的另一种电子设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”以及其他各种术语标号等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包括,例如,包括了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请实施例的描述中,“复数个”或者“多个”是指两个或多于两个。
本申请方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。
在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本申请的各个实施例中,如果没有特殊说明以及逻辑冲突,不同的实施例之间的术语和/或描述具有一致性、且可以相互引用,不同的实施例中的技术特征根据其内在的逻辑关系可以组合形成新的实施例。
可以理解的是,在本申请中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本申请的范围。上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定。
本申请实施例提供的方法可以应用于手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等电子设备上,本申请实施例对电子设备的具体类型不作任何限制。
如背景技术所言,特征提取与匹配是许多计算机视觉应用中的一个重要任务,它基于人的视觉特征,通过提取并匹配相邻帧的特征进行运动估计,通常可以应用在视频防抖、运动识别、图像检索、目标检测等场景中。常见的特征提取与匹配算法包括:尺度不变特征变换(scale-invariant feature transform,SIFT)、加速稳健特征(speeded up robustfeatures,SURF)、定向快速旋转简报(oriented fast and rotated brief,ORB)等,其中,SIFT是一种尺度不变的特征提取算法,SURF是一种加速版的SIFT算法,ORB是一种基于FAST特征检测器和BRIEF描述子的算法。
一般特征提取与匹配主要包括三个步骤:特征点的提取(或者称作特征点的抽取、特征点的选取等)、特征描述、特征匹配。为了便于理解本申请实施例所提供的方案,下面首先对这三个步骤以及涉及到的相关术语作简要说明。
1、特征点的提取:特征点的提取指的是从图像中提取特征点(feature points)。
一幅图像中总存在着其独特的像素点,这些点我们可以认为就是这幅图像的特征,称为特征点,特征点能够用来描述图像的局部区域的特征。特征点也被称作关键点(keypoints)或兴趣点(interest points),它被大量用于解决物体识别、图像识别、图像匹配、视觉跟踪、三维重建等一系列的问题。
特征点一般是一些十分突出的点,不会因光照、尺度、旋转等因素的改变而消失,比如角点、边缘点、暗区域的亮点以及亮区域的暗点等。
2、特征描述:特征描述指的是对特征点进行描述,以便在后续进行特征匹配。
例如,可以基于特征点计算对应的特征描述子(feature descriptor)(后文简称为描述子),该描述子用于描述该特征点的特征,同时,不同特征点的描述子差异性尽量大,相似的特征点的描述子差异性尽量小。例如,描述子可以表示该特征点的像素值,或表示该特征点的特征描述向量,或表示该特征点的方向,或表示该特征点的领域信息等,本申请不限于此。具体地,本申请实施例中的描述子例如可以是ORB特征描述子(Fast特征点(角点)提取+BRIEF特征描述),也可以是SIFT特征描述子,还可以是其他的特征描述子,本申请不限于此。
3、特征匹配:特征匹配指的是利用合适的相似性度量标准进行图像间特征的匹配,或者指的是对不同的特征点的特征之间进行相似度检测。
例如,可以通过计算不同特征点的描述子之间的距离,来表征特征点之间的差异,常用的距离有汉明距离(Hamming distance)、欧氏距离(Euclidean distance)、余弦距离(Cosine distance)等。下面以汉明距离为例进行说明:
在信息论中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。例如:1011101与1001001之间的汉明距离是2,2143896与2233796之间的汉明距离是3,"toned"与"roses"之间的汉明距离是3。
可以将两个描述子进行二进制编码,进而计算两个描述子之间的汉明距离,通过汉明距离来表征两个特征点之间的差异。
下面结合图1介绍一种特征提取与匹配的具体实现方案。从图中可以看出,图1所示的方案由硬件模块或软件模块中的一种执行,其中硬件模块指的是电子设备中可以用于执行特征提取与匹配流程的任意硬件设备,软件模块指的是电子设备中可以通过软件执行特征提取与匹配的任意设备。
在图1所示的方案中,硬件模块/软件模块获取多个图像帧。对于硬件模块,可以直接根据该多个图像帧进行特征提取与匹配,并输出匹配结果;对于软件模块,可以通过软件对该多个图像帧进行特征提取与匹配,并输出匹配结果。
下面结合图2介绍图1所示的方案在一种实际应用场景下的具体实现流程。其中,图2所示的方案以处理视频流的场景(如对视频流进行防抖处理)为例进行说明的,并且,图2所示的流程可以由图1所示的硬件模块执行,也可以由图1所示的软件模块通过软件执行。
首先,从待处理的视频流中获取待处理的多个图像帧(如图中的图像帧#1、图像帧#2、图像帧#3、……、图像帧#n),然后分别从该多个图像帧中提取特征点,例如,从图像帧#1中提取特征点#1,从图像帧#2中提取特征点#2,从图像帧#3中提取特征点#3,……。可以理解的是,特征点#1、特征点#2、特征点#3中的每一个均可以包括一个或多个特征点。进一步地,根据获取到的特征点生成对应的描述子,并基于生成的描述子对相邻的图像帧进行特征匹配,并输出匹配结果。
由上可知,在特征提取与匹配的流程中,需要处理大量的数据,因此对设备的处理性能要求比较高,否则可能会导致较高的功耗,影响设备的整体性能。同时,特征匹配的精度也会影响着最终任务的完成效果(例如视频防抖的效果)。因此,如何提高特征提取与匹配的精度,同时降低整体的功耗,是当前需要考虑的问题。
鉴于此,本申请实施例提供了一种图像数据的处理方法,通过该方法可以提高特征提取与匹配的精度,并降低功耗。下面结合图3对本申请实施例提供的图像数据的处理方法300作示例性说明。其中,该图像数据的处理方法300应用于电子设备中,该电子设备包括硬化模块和处理器。
S310,利用硬化模块分别提取多个图像帧的特征点。
示例性地,首先利用硬化模块获取待处理的多个图像帧。
该硬化模块是该电子设备中的一种硬件模块,作为一种示例,该硬化模块例如可以是该电子设备中用于进行视觉分析的专用芯片,或者是该专用芯片中的某一个模块,本申请对此不作限定。
该待处理的多个图像帧为需要进行特征提取与匹配的图像帧。例如,该多个图像帧是通过电子设备连续拍摄的图像序列(如拍摄全景照片时连续拍摄的多个图像帧);又例如,该多个图像帧为待处理的视频流中在时间上连续的图像序列。本申请不限定该多个图像帧的具体格式,具体例如,该多个图像帧可以是红绿蓝(red,green,blue,RGB)图像、灰度图像、深度图像等其中的任意一种。
也就是说,可以利用硬化模块从待处理的图像流或视频流中抽取多个图像帧进行特征提取与匹配,其中,该待处理的图像流或视频流可以是电子设备实时采集的,例如,电子设备通过外接或内置的摄像头实时拍摄图像流或视频流,硬化模块从该实时采集的图像流或视频流中抽取多个图像帧;或者,该待处理的图像流或视频流也可以是非实时采集的,例如,可以先在存储设备中存储待处理的图像流或视频流,硬化模块可以从该存储设备中读取该待处理的图像流或视频流,然后从该图像流或视频流中抽取多个图像帧。
由上可知,上述方案利用硬化模块进行特征点的提取。由于硬化模块作为硬件具有较强的处理性能,因此由硬化模块进行特征点的提取,性能表现比较好,功耗较低,可以避免由软件执行特征点的提取时功耗较高的情况。
S320,基于特征点的信息,处理器通过软件对多个图像帧中相邻的图像帧进行特征匹配。
示例性地,在利用硬化模块分别提取待处理的多个图像帧的特征点之后,基于该特征点,利用处理器通过软件,对该多个图像帧中相邻的图像帧进行特征匹配。
作为一种示例,该处理器例如可以是中央处理器(central processing unit,CPU),或是数字信号处理器(digital signal processor,DSP)等。
其中,这里的软件可以理解成用于进行特征匹配的应用程序,该应用程序可以是直接安装于该处理器中的,也可以处理器从存储器中调用的,本申请对此不做限定。该多个图像帧中相邻的图像帧可以指的是该多个图像帧中任意两个在时域上相邻的图像帧,或者是根据预设规则在该多个图像帧中确定的用于进行特征匹配的两个图像帧,本申请对此不做限定。
可选地,在S320之前,利用处理器从硬化模块获取特征点,并将该特征点输入到上述软件中。
示例性地,利用硬化模块提取了多个图像帧的特征点之后,利用处理器从该硬化模块获取该特征点,以便基于该特征点对该多个图像帧进行特征匹配。
其中,获取该特征点可以指的是获取该特征点的信息,该特征点的信息例如可以包括特征点的坐标信息,可选地还可以包括该特征点的评分(score)等,本申请不限于此。
可以理解的是,本申请对处理器从硬化模块获取特征点的信息的具体实现方式不作限定。作为一种示例,硬化模块提取多个图像帧的特征点之后,通过输出接口输出该特征点的信息。处理器通过驱动器(driver)调用硬化模块的输出接口,并从该输出接口获取该特征点的信息。
下面对通过软件进行特征匹配的一种可能的实现方式作示例性说明。
在一种可能的实现方式中,基于当前业务,利用处理器通过软件确定匹配规则。然后,基于该匹配规则,利用处理器通过软件进行上述特征匹配。也就是说,可以先利用处理器确定与当前业务对应的匹配规则,以便最终的匹配结果可以满足当前业务的需求,然后根据确定的匹配规则对上述多个图像帧中相邻的图像帧进行特征匹配。
因此在上述方案中,可以根据当前的业务确定与该业务相适应的匹配规则,从而能够使得特征提取与匹配的结果更加适应业务的特性,提高最终的业务效果。例如,在精度要求比较高的业务中,可以通过参数设置提高特征匹配的精度,下面结合几个示例作具体说明。
在一个可能的示例中,匹配规则包括:通过512位的描述子进行特征匹配。在这种情况下,基于该匹配规则,利用处理器通过软件计算特征点对应的描述子,计算得到的描述子为512位,然后基于该描述子,利用处理器通过软件进行特征匹配。通过这种方式可以提高特征匹配的精度。具体来说,如果利用硬化模块执行特征匹配的流程的话,计算的描述子是256位的,并且由于硬件无法做到定制化,所以无法修改描述子的位数,而如果当前业务对匹配精度要求比较高的话,可能就无法满足当前业务的要求,而通过软件便可以根据当前业务的需要灵活调整描述子的位数,从而满足当前业务的需求。
在另一个可能的示例中,匹配规则包括通过双向匹配维度进行特征匹配。在这种情况下,基于该匹配规则,利用处理器通过软件计算特征点对应的描述子,然后利用处理器通过软件计算多个图像帧中相邻的图像帧的描述子之间的双向汉明距离,其中,该双向汉明距离用于表示特征匹配的结果。通过这种方式可以降低误匹配的概率,提高匹配精度。具体来说,如果通过硬化模块执行特征匹配流程的话,是通过计算单向汉明距离来进行特征匹配的,并且由于硬件无法做到定制化,所以无法对匹配维度进行修改,而如果当前业务对匹配精度要求比较高的话,可能就无法满足当前业务的要求,而通过软件可以根据当前业务计算双向汉明距离,即将匹配维度从单向提升为双向,从而降低误匹配的概率,提高匹配精度。
在又一个可能的示例中,匹配规则包括:通过基于预设阈值筛选后的特征点进行特征匹配。在这种情况下,基于该匹配规则,去除特征点中分数低于预设阈值的特征点,得到筛选后的特征点,然后基于筛选后的特征点,利用处理器通过软件进行特征匹配。其中,上述预设阈值可以基于当前业务进行设置,上述分数可以是硬化模块在进行特征提取之后,所输出的特征点的信息中的部分参数。通过这种凡是可以降低误匹配率,提高匹配精度。具体方式本申请不作限定。
由上可知,上述方案通过软件进行特征匹配。由于软件可以针对当前业务定制化特征匹配的流程,有利于提高特征匹配的精度,因此效果比较好,可以避免由硬件执行特征匹配时精度低、应用场景比较局限的问题。具体来说,由于硬件无法做到定制化,特征匹配流程较为单一,相关参数不能按需改动,因此会造成精度的缺失,应用场景也比较有限,而由于软件具有较好的灵活性,可以方便地针对当前业务调整相应的匹配参数,从而有利于提高特征匹配的效果,使得特征匹配的结果更加适应业务的要求。
综上,本申请提供了一种由软硬件结合的特征提取与匹配方法,在该方法中,由硬件(即硬化模块)执行特征点提取的流程,而由软件执行特征匹配的流程,也就是说,本申请实施例提供的方案将软件和硬件执行特征提取与匹配的流程进行了解耦,利用硬件执行特征点的提取具有低功耗的优点、软件执行特征匹配具有精度高的优点,提高了特征提取与匹配的效果,同时规避了软件执行特征点的提取时功耗高的缺点,以及硬件执行特征匹配时精度低的缺点,使得该特征提取与匹配的方法能够适应更多场景。具体地,下面结合图4所示的流程图介绍本申请实施例所提供的图像数据的处理方法在实际场景下的一种应用。
首先,硬化模块从待处理的视频流中获取多个图像帧(如图中的图像帧#1、图像帧#2、图像帧#3、……、图像帧#n),然后分别从该多个图像帧中提取特征点,例如,从图像帧#1中提取特征点#1,从图像帧#2中提取特征点#2,从图像帧#3中提取特征点#3,……。在提取了上述特征点之后,硬化模块从输出接口输出这些特征点的信息。对应地,处理器通过驱动器调用该硬化模块的输出接口,并从该输出接口获取这些特征点的信息。
进一步地,处理器通过软件根据获取到的特征点生成对应的描述子,并基于生成的描述子对相邻的图像帧进行特征匹配,并输出匹配结果,具体实现方案可参考方法300所示的内容。
进一步可选地,可以基于特征提取与匹配的结果执行后续的业务,例如,基于特征提取与匹配的结果,对待处理的图像帧进行运动补偿,得到稳定的图像或视频。
相应于上述各方法实施例给出的方法,本申请实施例还提供了相应的装置,该装置包括用于执行上述各个方法实施例相应的模块。该模块可以是软件,也可以是硬件,或者是软件和硬件结合。可以理解的是,上述各方法实施例所描述的技术特征同样适用于以下装置实施例,因此,未详细描述的内容可以参见上文方法实施例,为了简洁,这里不再赘述。
图5示出了本申请实施例提供的装置200的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。参照图5,该装置200具体可以包括以下模块:
硬化模块210,用于分别提取待处理的多个图像帧的特征点。
处理器220,用于基于该特征点的信息,通过软件对该多个图像帧中相邻的图像帧进行特征匹配。
也就是说,本申请实施例提供的装置,通过两个模块(即硬化模块210和处理器220)分别执行特征提取以及特征匹配,其中,处理器220通过软件进行特征匹配。
下面结合图6所示的流程图对硬化模块210和处理器220执行特征提取与匹配的具体流程作示例性说明。
从图中可以看出,图6所示的方案由硬化模块210和处理器220共同执行。具体地,硬化模块210获取待处理的多个图像帧,然后根据从该多个图像帧中提取特征点,并输出该特征点。处理器220从硬化模块210的输出接口获取该特征点,然后通过软件对该多个图像帧进行特征匹配,并输出匹配结果。
需要说明的是,上述硬化模块210和处理器220之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
相较于图1所示的方法流程,图6所示的方案中,由硬件(即硬化模块210)执行特征点提取的流程,而由软件(即处理器220所调用的软件)执行特征匹配的流程,也就是说,本申请实施例提供的方案将软件和硬件执行特征提取与匹配的流程进行了解耦,利用硬件执行特征点的提取具有低功耗的优点、软件执行特征匹配具有精度高的优点,提高了特征提取与匹配的效果,同时规避了软件执行特征点的提取时功耗高的缺点,以及硬件执行特征匹配时精度低的缺点,使得该装置能够适应更多场景下的特征提取与匹配流程。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元或模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
如图7所示,本申请实施例还提供了一种装置300,该装置300包括:存储器310、硬化模块320、处理器330、存储在该存储中其并可在该硬化模块上运行的第一计算机程序以及存储在该存储器中并可在该处理器上运行的第二计算机程序。所述硬化模块320执行所述第一计算机程序时实现上述任意各个方法实施例中由硬化模块执行的步骤,所述处理器330执行所述第二计算机程序时实现上述任意各个方法实施例中由处理器所执行的步骤。
可以理解的是,上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/电子设备的任何实体或装置、记录介质、计算机存储器、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供的方法可以应用于手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等电子设备上,本申请实施例对电子设备的具体类型不作任何限制。
示例性的,图8示出了电子设备100的结构示意图。电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现电子设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现电子设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现电子设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为电子设备100充电,也可以用于电子设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-OLED,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行电子设备100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定电子设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定电子设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测电子设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,电子设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。电子设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当电子设备100是翻盖机时,电子设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测电子设备100在各个方向上(一般为三轴)加速度的大小。当电子设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。电子设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备100通过发光二极管向外发射红外光。电子设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备100附近有物体。当检测到不充分的反射光时,电子设备100可以确定电子设备100附近没有物体。电子设备100可以利用接近光传感器180G检测用户手持电子设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。电子设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测电子设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。电子设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,电子设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,电子设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备100对电池142加热,以避免低温导致电子设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控面板”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。
电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android系统为例,示例性说明电子设备100的软件结构。
图9是本申请实施例的电子设备的软件结构框图。分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。应用程序层可以包括一系列应用程序包。
如图9所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。作为一种可能的实现方式,本申请上述实施例中所述的用于进行特征匹配的软件可以位于应用程序框架层。
如图9所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android Runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(media libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
应理解,本申请实施例可以适用于Android、IOS等等系统中。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (12)
1.一种图像数据的处理方法,其特征在于,应用于电子设备,所述电子设备包括硬化模块和处理器,所述方法包括:
利用所述硬化模块分别提取待处理的多个图像帧的特征点;
基于所述特征点,利用所述处理器通过软件对所述多个图像帧中相邻的图像帧进行特征匹配。
2.根据权利要求1所述的方法,其特征在于,所述基于所述特征点,利用所述处理器通过软件对所述多个图像帧中相邻的图像帧进行特征匹配,包括:
基于当前业务,利用所述处理器通过所述软件确定匹配规则;
基于所述匹配规则,利用所述处理器通过所述软件进行所述特征匹配。
3.根据权利要求2所述的方法,其特征在于,所述匹配规则包括:通过512位的描述子进行特征匹配;
所述基于所述匹配规则,利用所述处理器通过所述软件进行所述特征匹配,包括:
利用所述处理器通过所述软件计算所述特征点对应的描述子,所述描述子为512位;
基于所述描述子,利用所述处理器通过所述软件进行所述特征匹配。
4.根据权利要求2所述的方法,其特征在于,所述匹配规则包括:通过双向匹配维度进行特征匹配;
所述基于所述匹配规则,利用所述处理器通过所述软件进行所述特征匹配,包括:
利用所述处理器通过所述软件计算所述特征点对应的描述子;
利用所述处理器通过所述软件计算所述多个图像帧中相邻的图像帧的描述子之间的双向汉明距离,所述双向汉明距离用于表示所述特征匹配的结果。
5.根据权利要求2至4中任一项所述的方法,其特征在于,所述匹配规则包括:通过基于预设阈值筛选后的特征点进行特征匹配;
所述基于所述匹配规则,利用所述处理器通过所述软件进行所述特征匹配,包括:
基于所述匹配规则,去除所述特征点中分数低于所述预设阈值的特征点,得到筛选后的特征点;
基于所述筛选后的特征点,利用所述处理器通过所述软件进行所述特征匹配。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
利用所述处理器从所述硬化模块获取所述特征点,并将所述特征点输入所述软件。
7.根据权利要求6所述的方法,其特征在于,所述利用所述处理器从所述硬化模块获取所述特征点,包括:
利用所述处理器通过驱动器调用所述硬化模块的输出接口;
利用所述处理器从所述硬化模块的输出接口获取所述特征点。
8.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
基于特征匹配的结果,对所述多个图像帧进行防抖处理。
9.一种电子设备,其特征在于,包括硬化模块和处理器,
所述硬化模块,用于分别提取待处理的多个图像帧的特征点;
所述处理器,用于基于所述特征点,通过软件对所述多个图像帧中相邻的图像帧进行特征匹配。
10.一种电子设备,其特征在于,所述电子设备包括存储器、硬化模块、处理器、存储在所述存储器中并可在所述硬化模块上运行的第一计算机程序以及存储在所述存储器中并可在所述处理器上运行的第二计算机程序,所述第一计算机程序被所述硬化模块执行时实现如权利要求1至8任意一项中所述硬化模块执行的方法,所述第二计算机程序被所述处理器执行时实现如权利要求1至8任意一项中所述处理器执行的方法。
11.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被电子设备执行时实现如权利要求1至8任一项所述的图像数据的处理方法的步骤。
12.一种芯片系统,其特征在于,所述芯片系统与存储器耦合,所述芯片系统用于读取并执行所述存储器中存储的计算机程序,以实现如权利要求1至8中任一项所述的图像数据的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310972584.8A CN117710695A (zh) | 2023-08-02 | 2023-08-02 | 图像数据的处理方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310972584.8A CN117710695A (zh) | 2023-08-02 | 2023-08-02 | 图像数据的处理方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117710695A true CN117710695A (zh) | 2024-03-15 |
Family
ID=90148626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310972584.8A Pending CN117710695A (zh) | 2023-08-02 | 2023-08-02 | 图像数据的处理方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117710695A (zh) |
-
2023
- 2023-08-02 CN CN202310972584.8A patent/CN117710695A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114650363B (zh) | 一种图像显示的方法及电子设备 | |
CN113641271B (zh) | 应用窗口的管理方法、终端设备及计算机可读存储介质 | |
CN114089932B (zh) | 多屏显示方法、装置、终端设备及存储介质 | |
CN113542580B (zh) | 去除眼镜光斑的方法、装置及电子设备 | |
CN116070035B (zh) | 数据处理方法和电子设备 | |
CN116048358B (zh) | 悬浮球的控制方法和相关装置 | |
CN112541861B (zh) | 图像处理方法、装置、设备及计算机存储介质 | |
CN115914461B (zh) | 位置关系识别方法和电子设备 | |
CN115437601B (zh) | 图像排序方法、电子设备、程序产品及介质 | |
CN116389884B (zh) | 缩略图显示方法及终端设备 | |
CN114093368A (zh) | 跨设备声纹注册方法、电子设备及存储介质 | |
CN117710695A (zh) | 图像数据的处理方法及电子设备 | |
CN116703741B (zh) | 一种图像对比度的生成方法、装置和电子设备 | |
CN116048831B (zh) | 一种目标信号处理方法和电子设备 | |
CN116048769B (zh) | 内存回收方法、装置和终端设备 | |
CN115792431B (zh) | 一种异常位置检测方法和电子设备 | |
CN114942741B (zh) | 数据传输方法及电子设备 | |
CN116051351B (zh) | 一种特效处理方法和电子设备 | |
CN115619628B (zh) | 图像处理方法和终端设备 | |
CN116233599B (zh) | 一种录像模式推荐方法和电子设备 | |
CN116522400B (zh) | 图像处理方法和终端设备 | |
CN117133311B (zh) | 音频场景识别方法及电子设备 | |
CN115880198B (zh) | 图像处理方法和装置 | |
CN116343247B (zh) | 表格图像矫正方法、装置和设备 | |
CN116048681B (zh) | 图标显示方法、电子设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |