CN110111238A - 图像处理方法、装置、设备及其存储介质 - Google Patents
图像处理方法、装置、设备及其存储介质 Download PDFInfo
- Publication number
- CN110111238A CN110111238A CN201910337290.1A CN201910337290A CN110111238A CN 110111238 A CN110111238 A CN 110111238A CN 201910337290 A CN201910337290 A CN 201910337290A CN 110111238 A CN110111238 A CN 110111238A
- Authority
- CN
- China
- Prior art keywords
- target object
- positional relationship
- target
- image data
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 25
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 39
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 15
- 238000001514 detection method Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 10
- 230000000903 blocking effect Effects 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 241000406668 Loxodonta cyclotis Species 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 abstract description 4
- 230000004927 fusion Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 6
- 230000006854 communication Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000005291 magnetic effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了图像处理方法、装置、设备及其存储介质。该方法包括:获取第一目标对象和第二目标对象的位置关系,第一目标对象是第一图像数据的前景部分,第二目标对象是第二图像数据的前景部分;基于合成优先级先将第一目标对象或第二目标对象与待合成的背景部分进行初步合成;基于位置关系调整第二目标对象的合成位置。根据本申请实施例的技术方案,通过确定目标对象的位置关系来调整合成图像中目标对象的分布情况,以解决合成导致的遮挡问题,有效地提升了合成画面的质量和融合场景的真实性。
Description
技术领域
本申请一般涉及图像处理技术领域,尤其涉及图像处理方法、装置、设备及其存储介质。
背景技术
教育培训从线下向线上发展的趋势日趋明显。早期培训教育采用传统线下培训方式,其具有面对面教授学习的互动优势,但其学习场景不可再现。随着互联网技术的发展,线下教育不可再现的场景可以通过课程录制等方式进行回顾,但是,这种录制视频不能及时有效地域教育者沟通。
线上教育以其空间成本低、时间掌控灵活等优势,逐渐在教育培训领域占据较大市场份额,但是,线上教育通过互联网技术建立的沟通桥梁,受到各项技术局限。例如,线上教育或者线下教育在使用网络享受课程内容时,仅可以通过显示装置观看课件内容或独立的个人影像,如视频通话的图像。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种图像处理方法、装置、设备及其存储介质,来解决现有技术中图像合成中出现的异常遮挡问题。
第一方面,本申请实施例提供了一种图像处理方法,该方法包括:
获取第一目标对象和第二目标对象的位置关系,第一目标对象是第一图像数据的前景部分,第二目标对象是第二图像数据的前景部分;
基于合成优先级先将第一目标对象或第二目标对象与待合成的背景部分进行初步合成;
基于位置关系调整第二目标对象的合成位置。
第二方面,本申请实施例提供了一种图像处理装置,该装置包括:
位置获取单元,用于获取第一目标对象和第二目标对象的位置关系,第一目标对象是第一图像数据的前景部分,第二目标对象是第二图像数据的前景部分;
合成单元,基于合成优先级先将第一目标对象或第二目标对象与待合成的背景部分进行初步合成;
调整单元,用于基于位置关系调整第二目标对象的合成位置。
第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如本申请实施例描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序用于:
该计算机程序被处理器执行时实现如本申请实施例描述的方法。
本申请实施例提供的图像处理方法、装置、设备及其存储介质,通过获取第一目标对象和第二目标对象的位置关系,根据合成优先级将第一目标对象或第二目标对象与待合成的背景部分初步合成之后,再利用位置关系对第二目标对象的合成位置进行调整,以解决合成导致的遮挡问题,有效地提升了合成画面的质量和融合场景的真实性。
进一步地,还通过第一目标对象的数量确定位置关系有效地提升了数据处理效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了本申请实施例提供的图像处理方法的流程示意图;
图2示出了本申请实施例提供步骤101的流程示意图;
图3示出了本申请实施例提供的图像处理装置的结构示意图;
图4示出了本申请实施例提供的位置获取单元301的结构示意图;
图5示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关公开,而非对该公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与公开相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
线上教学与线下教学同步进行,或者二者单独使用网络资源时,为了辅助学习活动参与者更好地体验教学资源,可以将参与者的实景形象融合到教学环境中。
抠图技术可以获得前景图像,但是前景图像中包括多个目标对象时,多个目标对象的位置可能是多变的。随着目标对象的移动,将包含多个目标对象的前景图像合成到预先创建的背景图像中,可能出现遮挡等问题。将来自不同图像的前景图像同步合成到相同背景图像中,也可能存在同一个位置出现重叠等问题。现有通常通过人工调整来避免多个目标对象的在背景图像中的遮挡问题,但这种方式显示是不能满足实时处理的需求。
因此,本申请提出一种图像处理方法来解决上述问题。
请参考图1,图1示出了本申请实施例提供的图像处理方法的流程示意图。
如图1所示,该方法包括:
步骤101,获取第一目标对象和第二目标对象的位置关系。其中,第一目标对象是第一图像数据的前景部分,第二目标对象是第二图像数据的前景部分。
本申请实施例中,实时获取的图像数据包括第一图像数据和第二图像数据。图像数据可以是图片或者视频数据,图像数据还包括音频数据等。
第一图像数据和第二图像数据分别包含不同的前景部分,例如第一图像数据是由移动终端的摄像头采集的图像数据,其前景部分包括移动终端拍摄的第一目标对象,其背景部分包括单色背景。第二图像数据是由线下教学空间预先安装的摄像装置采集的图像数据,其前景部分包括摄像装置采集的第二目标对象,其背景部分包括单色背景。第一图像数据例如可以包含至少一个第一目标对象。第二图像数据包括至少一个第二目标对象。目标对象可以是参与教学活动的学生、幼儿、成人等。第一目标对象可以理解为线上教学的参与者,第二目标对象可以理解为线下教学的参与者。
实时获取图像数据的前景部分可以通过提取背景色,获取背景色的初始不透明度,利用色差抠图对每个像素点进行不透明处理,获取每个像素点的颜色值,再对每个像素点进行二值化处理。然后,对初始不透明度进行边缘修复后,使得抠出的图像更加平滑。
获取第一目标对象和第二目标对象的位置关系,可以包括:
分别获取第一目标对象和第二目标对象的数量和场景标识;
基于数量确定获取第一目标对象和第二目标对象的位置关系;或者,
基于场景标识确定获取第一目标对象和第二目标对象的位置关系。
步骤102,基于合成优先级先将第一目标对象或第二目标对象与待合成背景部分进行初步合成。
本步骤,合成优先级可以理解为将第一目标对象或第二目标对象优先合成到待合成的背景部分的顺序。例如,当第一目标对象的数量大于第二目标对象的数量时,则第一目标对象的合成优先级高于第二目标对象的合成优先级。或者,第一目标对象的场景标识为线下标识,第二目标对象的场景标识为线上标识,则第一目标对象的合成优先级高于第二目标对象的合成优先级。反之,同理。
如果第一目标对象的合成优先级高于第二目标对象的合成优先级,则先将第一目标对象合成到待合成的背景部分,得到初步合成的结果。初步合成的结果。
步骤103,基于位置关系调整第二目标对象的合成位置。
本步骤中,位置关系可以根据第一目标对象和第二目标对象的数量或场景标识来确定。
基于位置关系调整第二目标对象的合成位置包括:基于位置关系确定初步合成的结果中是否存在遮挡位置;若存在遮挡位置,以位置关系中确定的预测位置为中心,预设距离为半径移动第二目标对象,从而将第二目标对象的合成位置进行调整,使得第一目标对象和第二目标对象中合成后的位置避免了因合成引起的遮挡问题,使得合成后的画面更加真实。
例如,第一目标对象的合成优先级高于第二目标对象的合成优先级,先将第一目标对象按照其在原图像数据中的位置关系,合成到待合成背景部分,得到初步合成的结果。背景部分可以教学课件的预测背景内容,背景部分可以是全景图像,或者动态的视频等资源,也可以是虚拟现实场景。
然后,将第二目标对象按照预测位置合成到初步合成的结果中,这时,可能存在预测位置与第一目标对象的位置重叠的问题,为了避免合成造成的遮挡问题。基于第二目标对象的预测位置和第一目标对象的两两之间的位置关系,确定第二目标对象的预测位置是否被第一目标对象遮挡,或者遮挡第一目标对象。例如,可以根据第一目标对象所在图层的像素坐标值和第二目标对象所在图层的像素坐标值是否小于等于重叠阈值来判定。例如,两个像素坐标值的差值小于等于重叠阈值,则表示第一目标对象和第二目标对象重合。
然后,以第二目标对象的预测位置为中心,预设距离例如0.5m为半径,绘制调整曲线,然后将第二目标对象调整到曲线上。例如可以按照调整时间阈值在曲线上选择最优的位置点,从而将该位置点作为第二目标对象的更新位置,更新位置即为新的合成位置,从而实现基于位置关系调整第二目标对象的合成位置。
请参考图2,图2示出了本申请实施例提供步骤101的流程示意图。
如图2所示,获取第一目标对象和第二目标对象的位置关系,可以包括:
步骤201,分别获取第一目标对象和第二目标对象的数量和场景标识;
步骤202,基于数量确定获取第一目标对象或第二目标对象的位置关系;或者,基于场景标识确定获取第一目标对象或第二目标对象的位置关系。
其中,基于数量确定获取第一目标对象和第二目标对象的位置关系,包括:
如果数量大于等于2,则通过目标检测算法从第一图像数据或第二图像数据中获取第一目标对象或第二目标对象的检测区域;
确定检测区域两两之间的相对位置关系。
如果数量等于1,则利用卡尔曼预测模型预测第一目标对象或第二目标对象的预测位置。
其中,基于数量确定获取第一目标对象和第二目标对象的位置,可以包括:
如果第一目标对象的数量或者第二目标对象的数量大于等于2,则获取第一目标对象或第二目标对象两两之间的相对位置关系。
如果第一目标对象的数量或者第二目标对象的数量等于1,则获取第一目标对象或第二目标对象的预测位置。
本申请实施例中,基于第一目标对象的数量或者第二目标对象的数量来确定位置关系。例如,第一目标对象的数量大于等于2,则可以通过目标检测算法从第一图像数据中获得多个目标对象的检测区域,通过对检测区域之间相对位置进行标注,对检测区域的跟踪学习,可以获得检测区域两两之间的相对位置关系。通过相对位置关系可以确定多个第一目标对象之间的相对位置关系,从而实现第一图像数据的动态目标跟踪。
如果第一目标对象的数量或者第二目标对象的数量为1,则表示在第一图像数据或者第二图像数据中有且仅有1个目标对象,则可以根据目标运动轨迹预测出目标对象的在下一图像帧中的位置,由于该位置会对其他目标对象造成影响。以第一目标对象的数量为2个,第二目标对象的数量为1个的场景为例,第一目标对象为第一图像数据的前景部分,第二目标对象为第二图像数据的前景部分。第一图像数据的前景部分包括2个第一目标对象,则可以通过目标跟踪算法获取两个第一目标对象的目标框,通过目标框可以确定两个第一目标对象之间的相对关系。第二图像数据的前景部分仅包括1个第二目标对象,可以利用卡尔曼预测模型对第二目标对象的预测位置。
假设要估算第k帧的第二目标对象的位置。先根据第k-1帧的第二目标对象的位置,来预测第k帧的第二目标对象的位置,然后根据贝叶斯估计的相关理论,对误差小的项赋予较大的权重,对误差大的项赋予较小的权重,并使预测的误差最小,则可以预测到第k帧的第二目标对象的位置。
获取第一目标对象和第二目标对象的位置关系,包括:
分别获取第一目标对象和第二目标对象的数量和场景标识;
基于第一目标对象或第二目标对象数量确定获取第一目标对象或第二目标对象两两之间的相对位置关系;或者,
基于场景标识确定获取第一目标对象和所述第二目标对象的位置关系位置。
场景标识是用于指示第一图像数据或第二图像数据针对的教学场景,例如场景标识为00,表示图像数据是线下教学场景,场景标识为11,表示图像数据是线上教学场景。在线下教学场景中可以包括多个目标对象,线上教学场景则通常是1个目标对象。同样可以基于目标对象的数量来确定目标对象的位置关系或位置。
应当注意,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
请参考图3,图3示出了本申请实施例提供的图像处理装置的结构示意图。
如图3所示,该装置300包括:
位置获取单元301,用于获取第一目标对象和第二目标对象的位置关系。其中,第一目标对象是第一图像数据的前景部分,第二目标对象是第二图像数据的前景部分。
本申请实施例中,实时获取的图像数据包括第一图像数据和第二图像数据。图像数据可以是图片或者视频数据,图像数据还包括音频数据等。
第一图像数据和第二图像数据分别包含不同的前景部分,例如第一图像数据是由移动终端的摄像头采集的图像数据,其前景部分包括移动终端拍摄的第一目标对象,其背景部分包括单色背景。第二图像数据是由线下教学空间预先安装的摄像装置采集的图像数据,其前景部分包括摄像装置采集的第二目标对象,其背景部分包括单色背景。第一图像数据例如可以包含至少一个第一目标对象。第二图像数据包括至少一个第二目标对象。目标对象可以是参与教学活动的学生、幼儿、成人等。第一目标对象可以理解为线上教学的参与者,第二目标对象可以理解为线下教学的参与者。
实时获取图像数据的前景部分可以通过提取背景色,获取背景色的初始不透明度,利用色差抠图对每个像素点进行不透明处理,获取每个像素点的颜色值,再对每个像素点进行二值化处理。然后,对初始不透明度进行边缘修复后,使得抠出的图像更加平滑。
获取第一目标对象和第二目标对象的位置关系,可以包括:
分别获取第一目标对象和第二目标对象的数量和场景标识;
基于数量确定获取第一目标对象和第二目标对象的位置关系;或者,
基于场景标识确定获取第一目标对象和第二目标对象的位置关系。
合成单元302,用于基于合成优先级先将第一目标对象或第二目标对象与待合成背景部分进行初步合成。
本步骤,合成优先级可以理解为将第一目标对象或第二目标对象优先合成到待合成的背景部分的顺序。例如,当第一目标对象的数量大于第二目标对象的数量时,则第一目标对象的合成优先级高于第二目标对象的合成优先级。或者,第一目标对象的场景标识为线下标识,第二目标对象的场景标识为线上标识,则第一目标对象的合成优先级高于第二目标对象的合成优先级。反之,同理。
如果第一目标对象的合成优先级高于第二目标对象的合成优先级,则先将第一目标对象合成到待合成的背景部分,得到初步合成的结果。初步合成的结果如图3所示。
调整单元303,基于位置关系调整第二目标对象的合成位置。
本步骤中,位置关系可以根据第一目标对象和第二目标对象的数量或场景标识来确定。
基于位置关系调整第二目标对象的合成位置包括:基于位置关系确定初步合成的结果中是否存在遮挡位置;若存在遮挡位置,以位置关系中确定的预测位置为中心预设距离为半径移动第二目标对象,从而将第二目标对象的合成位置进行调整,使得第一目标对象和第二目标对象中合成后的位置避免了因合成引起的遮挡问题,使得合成后的画面更加真实。
例如,第一目标对象的合成优先级高于第二目标对象的合成优先级,先将第一目标对象按照其在原图像数据中的位置关系,合成到待合成背景部分,得到初步合成的结果。背景部分可以教学课件的预测背景内容,背景部分可以是全景图像,或者动态的视频等资源,也可以是虚拟现实场景。
然后,将第二目标对象按照预测位置合成到初步合成的结果中,这时,可能存在预测位置与第一目标对象的位置重叠的问题,为了避免合成造成的遮挡问题。基于第二目标对象的预测位置和第一目标对象的两两之间的位置关系,确定第二目标对象的预测位置是否被第一目标对象遮挡,或者遮挡第一目标对象。例如,可以根据第一目标对象所在图层的像素坐标值和第二目标对象所在图层的像素坐标值是否小于等于重叠阈值来判定。例如,两个像素坐标值的差值小于等于重叠阈值,则表示第一目标对象和第二目标对象重合。
然后,以第二目标对象的预测位置为中心,预设距离例如0.5m为半径,绘制调整曲线,然后将第二目标对象调整到曲线上。例如可以按照调整时间阈值在曲线上选择最优的位置点,从而将该位置点作为第二目标对象的更新位置,更新位置即为新的合成位置,从而实现基于位置关系调整第二目标对象的合成位置。
请参考图4,图4示出了本申请实施例提供的位置获取单元301的结构示意图。
如图4所示,位置获取单元301还包括:
数量标识获取子单元401,用于分别获取第一目标对象和第二目标对象的数量和场景标识;
位置获取子单元402,用于基于第一目标对象的数量或第二目标对象的数量获取第一目标对象或第二目标对象的位置关系;或者,
基于场景标识获取第一目标对象或第二目标对象的位置关系。
位置获取子单元402,还包括
第一获取模块,用于如果数量大于等于2,则通过目标检测算法从第一图像数据或第二图像数据中获取第一目标对象或第二目标对象的检测区域;
确定模块,用于确定检测区域两两之间的相对位置关系。
预测模块,用于如果数量等于1,则利用卡尔曼预测模型预测第一目标对象或第二目标对象的预测位置。
本申请实施例中,可以基于第一目标对象的数量或者第二目标对象的数量来位置关系。例如,第一目标对象的数量大于等于2,则可以通过目标检测算法从第一图像数据中获得多个目标对象的检测区域,通过对检测区域之间相对位置进行标注,对检测区域的跟踪学习,可以获得检测区域两两之间的相对位置关系。通过相对位置关系可以确定多个第一目标对象之间的相对位置关系,从而实现第一图像数据的动态目标跟踪。
如果第一目标对象的数量或者第二目标对象的数量为1,则表示在第一图像数据或者第二图像数据中有且仅有1个目标对象,则可以根据目标运动轨迹预测出目标对象的在下一图像帧中的位置,由于该位置会对其他目标对象造成影响。以第一目标对象的数量为2个,第二目标对象的数量为1个的场景为例,第一目标对象为第一图像数据的前景部分,第二目标对象为第二图像数据的前景部分。第一图像数据的前景部分包括2个第一目标对象,则可以通过目标跟踪算法获取两个第一目标对象的目标框,通过目标框可以确定两个第一目标对象之间的相对关系。第二图像数据的前景部分仅包括1个第二目标对象,可以利用卡尔曼预测模型对第二目标对象的预测位置。
假设要估算第k帧的第二目标对象的位置。先根据第k-1帧的第二目标对象的位置,来预测第k帧的第二目标对象的位置,然后根据贝叶斯估计的相关理论,对误差小的项赋予较大的权重,对误差大的项赋予较小的权重,并使预测的误差最小,则可以预测到第k帧的第二目标对象的位置。
获取第一目标对象和第二目标对象的位置关系,包括:
分别获取所述第一目标对象和所述第二目标对象的数量和场景标识;
基于第一目标对象或第二目标对象数量确定获取第一目标对象或第二目标对象两两之间的相对位置关系;或者,
基于场景标识确定获取第一目标对象和所述第二目标对象的位置关系位置。
场景标识是用于指示第一图像数据或第二图像数据针对的教学场景,例如场景标识为00,表示图像数据是线下教学场景,场景标识为11,表示图像数据是线上教学场景。在线下教学场景中可以包括多个目标对象,线上教学场景则通常是1个目标对象。同样可以基于目标对象的数量来确定目标对象的位置关系或位置。
应当理解,装置300中记载的诸单元或模块与参考图1描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于装置300及其中包含的单元,在此不再赘述。装置300可以预先实现在电子设备的浏览器或其他安全应用中,也可以通过下载等方式而加载到电子设备的浏览器或其安全应用中。装置300中的相应单元可以与电子设备中的单元相互配合以实现本申请实施例的方案。
在上文详细描述中提及的若干模块或者单元,这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
下面参考图5,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图图1描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在机器可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括位置获取单元、合成单元以及调整单元。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,调整单元还可以被描述为“用于基于位置关系调整第二目标对象的合成位置的单元”。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中的。上述计算机可读存储介质存储有一个或者多个程序,当上述前述程序被一个或者一个以上的处理器用来执行描述于本申请的图像处理方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离前述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (12)
1.一种图像处理方法,其特征在于,该方法包括:
获取第一目标对象和第二目标对象的位置关系,所述第一目标对象是第一图像数据的前景部分,所述第二目标对象是第二图像数据的前景部分;
基于合成优先级先将所述第一目标对象或所述第二目标对象与待合成的背景部分进行初步合成;
基于所述位置关系调整所述第二目标对象的合成位置。
2.根据权利要求1所述的图像处理方法,其特征在于,获取第一目标对象和第二目标对象的位置关系,包括:
分别获取所述第一目标对象和所述第二目标对象的数量和场景标识;
基于所述数量获取所述第一目标对象或所述第二目标对象的位置关系;或者,
基于所述场景标识获取所述第一目标对象或所述第二目标对象的位置关系。
3.根据权利要求2所述的图像处理方法,其特征在于,所述基于所述数量确定获取所述第一目标对象或所述第二目标对象的位置关系,包括:
如果所述数量大于等于2,则获取所述第一目标对象或所述第二目标对象两两之间的相对位置关系;
如果所述数量等于1,则获取所述第一目标对象或所述第二目标对象的预测位置。
4.根据权利要求3所述的图像处理方法,其特征在于,所述获取所述第一目标对象或所述第二目标对象两两之间的相对位置关系,包括:
通过目标检测算法从所述第一图像数据或所述第二图像数据中获取所述第一目标对象或所述第二目标对象的检测区域;
确定所述检测区域两两之间的相对位置关系。
5.根据权利要求3所述的图像处理方法,其特征在于,所述获取所述第一目标对象或所述第二目标对象的预测位置,包括:利用卡尔曼预测模型预测所述第一目标对象或所述第二目标对象的预测位置。
6.根据权利要求1所述的图像处理方法,其特征在于,基于所述位置关系调整所述第二目标对象的合成位置包括:
基于所述位置关系确定所述初步合成的结果中是否存在遮挡位置;
若存在所述遮挡位置,以所述位置关系中确定的预测位置为中心,预设距离为半径移动所述第二目标对象。
7.一种图像处理装置,其特征在于,该装置包括:
位置获取单元,用于获取第一目标对象和第二目标对象的位置关系,所述第一目标对象是第一图像数据的前景部分,所述第二目标对象是第二图像数据的前景部分;
合成单元,基于合成优先级先将所述第一目标对象或所述第二目标对象与待合成的背景部分进行初步合成;
调整单元,用于基于所述位置关系调整所述第二目标对象的合成位置。
8.根据权利要求7所述的图像处理装置,其特征在于,位置获取单元还包括:
数量标识获取子单元,用于分别获取所述第一目标对象和所述第二目标对象的数量和场景标识;
位置获取子单元,用于基于所述数量获取所述第一目标对象或所述第二目标对象的位置关系;或者,
基于所述场景标识获取所述第一目标对象或所述第二目标对象的位置关系。
9.根据权利要求8所述的图像处理装置,其特征在于,位置获取子单元还用于:
如果所述数量大于等于2,则获取所述第一目标对象或所述第二目标对象两两之间的相对位置关系;
如果所述数量等于1,则获取所述第一目标对象或所述第二目标对象的预测位置。
10.根据权利要求7所述的图像处理装置,其特征在于,调整单元还用于:
基于所述位置关系确定所述初步合成的结果中是否存在遮挡位置;
若存在所述遮挡位置,以所述位置关系中确定的预测位置为中心,预设距离为半径移动所述第二目标对象。
11.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910337290.1A CN110111238A (zh) | 2019-04-24 | 2019-04-24 | 图像处理方法、装置、设备及其存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910337290.1A CN110111238A (zh) | 2019-04-24 | 2019-04-24 | 图像处理方法、装置、设备及其存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110111238A true CN110111238A (zh) | 2019-08-09 |
Family
ID=67486627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910337290.1A Pending CN110111238A (zh) | 2019-04-24 | 2019-04-24 | 图像处理方法、装置、设备及其存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110111238A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110913267A (zh) * | 2019-11-29 | 2020-03-24 | 上海赛连信息科技有限公司 | 图像处理方法、装置、系统、界面、介质和计算设备 |
CN110992297A (zh) * | 2019-11-11 | 2020-04-10 | 北京百度网讯科技有限公司 | 多商品图像合成方法、装置、电子设备及存储介质 |
CN112004034A (zh) * | 2020-09-04 | 2020-11-27 | 北京字节跳动网络技术有限公司 | 合拍方法、装置、电子设备及计算机可读存储介质 |
WO2023273049A1 (zh) * | 2021-06-29 | 2023-01-05 | 杭州海康威视系统技术有限公司 | 目标对象位置关系分析方法、装置、存储介质及电子设备 |
CN117710271A (zh) * | 2024-02-06 | 2024-03-15 | 成都戎盛科技有限公司 | 一种基于海思2d加速平台的透明度处理方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106162137A (zh) * | 2016-06-30 | 2016-11-23 | 北京大学 | 虚拟视点合成方法及装置 |
CN108449569A (zh) * | 2018-03-13 | 2018-08-24 | 重庆虚拟实境科技有限公司 | 虚拟会议方法、系统、装置、计算机装置及存储介质 |
CN108521823A (zh) * | 2017-06-30 | 2018-09-11 | 深圳市大疆创新科技有限公司 | 一种图像处理方法、装置及电子设备 |
CN109035288A (zh) * | 2018-07-27 | 2018-12-18 | 北京市商汤科技开发有限公司 | 一种图像处理方法及装置、设备和存储介质 |
CN109544496A (zh) * | 2018-11-19 | 2019-03-29 | 南京旷云科技有限公司 | 训练数据的生成方法、对象检测模型的训练方法和装置 |
-
2019
- 2019-04-24 CN CN201910337290.1A patent/CN110111238A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106162137A (zh) * | 2016-06-30 | 2016-11-23 | 北京大学 | 虚拟视点合成方法及装置 |
CN108521823A (zh) * | 2017-06-30 | 2018-09-11 | 深圳市大疆创新科技有限公司 | 一种图像处理方法、装置及电子设备 |
CN108449569A (zh) * | 2018-03-13 | 2018-08-24 | 重庆虚拟实境科技有限公司 | 虚拟会议方法、系统、装置、计算机装置及存储介质 |
CN109035288A (zh) * | 2018-07-27 | 2018-12-18 | 北京市商汤科技开发有限公司 | 一种图像处理方法及装置、设备和存储介质 |
CN109544496A (zh) * | 2018-11-19 | 2019-03-29 | 南京旷云科技有限公司 | 训练数据的生成方法、对象检测模型的训练方法和装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110992297A (zh) * | 2019-11-11 | 2020-04-10 | 北京百度网讯科技有限公司 | 多商品图像合成方法、装置、电子设备及存储介质 |
CN110913267A (zh) * | 2019-11-29 | 2020-03-24 | 上海赛连信息科技有限公司 | 图像处理方法、装置、系统、界面、介质和计算设备 |
CN110913267B (zh) * | 2019-11-29 | 2020-11-06 | 上海赛连信息科技有限公司 | 图像处理方法、装置、系统、界面、介质和计算设备 |
CN112004034A (zh) * | 2020-09-04 | 2020-11-27 | 北京字节跳动网络技术有限公司 | 合拍方法、装置、电子设备及计算机可读存储介质 |
WO2022048651A1 (zh) * | 2020-09-04 | 2022-03-10 | 北京字节跳动网络技术有限公司 | 合拍方法、装置、电子设备及计算机可读存储介质 |
WO2023273049A1 (zh) * | 2021-06-29 | 2023-01-05 | 杭州海康威视系统技术有限公司 | 目标对象位置关系分析方法、装置、存储介质及电子设备 |
CN117710271A (zh) * | 2024-02-06 | 2024-03-15 | 成都戎盛科技有限公司 | 一种基于海思2d加速平台的透明度处理方法及系统 |
CN117710271B (zh) * | 2024-02-06 | 2024-04-19 | 成都戎盛科技有限公司 | 一种基于海思2d加速平台的透明度处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110111238A (zh) | 图像处理方法、装置、设备及其存储介质 | |
WO2021047396A1 (zh) | 图像处理方法及装置、电子设备和计算机可读存储介质 | |
CN110086988A (zh) | 拍摄角度调整方法、装置、设备及其存储介质 | |
CN108960316A (zh) | 用于生成模型的方法和装置 | |
CN112073748B (zh) | 全景视频的处理方法、装置及存储介质 | |
CN110781823A (zh) | 录屏检测方法、装置、可读介质及电子设备 | |
CN111079588B (zh) | 一种图像处理方法、装置及存储介质 | |
JP2023039426A (ja) | コンピュータ実装方法、情報処理システム、コンピュータプログラム(時空間的関係ベースmrコンテンツ配置) | |
Kounlaxay et al. | Design of Learning Media in Mixed Reality for Lao Education. | |
KR101613777B1 (ko) | 라이브 댄스 클래스 및 라이브 뮤직 룸을 위한 서비스 시스템 및 서비스 방법 | |
Song et al. | Rapid interactive real-time application prototyping for media arts and stage performance | |
CN110139030A (zh) | 混合现实处理系统、方法、服务器及其存储介质 | |
CN112153472A (zh) | 一种画面特效的生成方法及装置、存储介质及电子设备 | |
CN109816791B (zh) | 用于生成信息的方法和装置 | |
CN109871465A (zh) | 一种时间轴计算方法、装置、电子设备及存储介质 | |
CN111127607A (zh) | 一种动画生成方法、装置、设备及介质 | |
CN110062116A (zh) | 用于处理信息的方法和设备 | |
CN110035315A (zh) | 一种模块化编程录播课的使用方法及电子设备 | |
Verma et al. | Digital assistant with augmented reality | |
Pillat et al. | A mixed reality system for teaching STEM content using embodied learning and whole-body metaphors | |
CN110475108A (zh) | 投影图像校正方法、终端设备、系统及存储介质 | |
CN113763090B (zh) | 信息处理方法及装置 | |
Shimada et al. | Supporting theatrical performance practice by collaborating real and virtual space | |
Bekaroo et al. | Ai-assisted extended reality toward the 6g era: challenges and prospective solutions | |
Wang | Application of VR virtual reality in the course of later stage and special effect production |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190809 |
|
WD01 | Invention patent application deemed withdrawn after publication |