CN108683874B - 一种视频会议注意力聚焦的方法及一种存储设备 - Google Patents
一种视频会议注意力聚焦的方法及一种存储设备 Download PDFInfo
- Publication number
- CN108683874B CN108683874B CN201810465189.XA CN201810465189A CN108683874B CN 108683874 B CN108683874 B CN 108683874B CN 201810465189 A CN201810465189 A CN 201810465189A CN 108683874 B CN108683874 B CN 108683874B
- Authority
- CN
- China
- Prior art keywords
- attention
- weight
- region
- video
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 44
- 230000011218 segmentation Effects 0.000 claims description 67
- 238000013473 artificial intelligence Methods 0.000 claims description 16
- 238000005192 partition Methods 0.000 claims description 9
- 230000003111 delayed effect Effects 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 abstract description 9
- 230000007704 transition Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明涉及多媒体技术领域,特别涉及一种视频会议注意力聚焦的方法及一种存储设备。一种视频会议注意力聚焦的方法,包括步骤:获取全景图像和全向声音;分割全景图像,并对分割后的全景图像进行处理得到目标图像;分割全向声音,并对分割后的全向声音进行处理得到目标声音;发送所述目标图像和所述目标声音至目标设备。所发送的目标图像是经过处理后的,对中等以上区域权重的照片才进行处理传输,并非原始的整个全景图像,大大节省传输过程中的网络带宽,网络带宽的减少,也使得参会人员的人数可以大大增加。
Description
技术领域
本发明涉及多媒体技术领域,特别涉及一种视频会议注意力聚焦的方法及一种存储设备。
背景技术
随着科技的发展,与商业的发展,越来越多的公司在日常的业务当中需要用到视频会议。现有技术中,高级的视频会议场景,为在主会场的长方形或椭圆形会议桌四周围坐参会人员。多个普通摄像头从多个位置采集会场图像,然后视频会议系统将摄像头的多路图像中的一路或多路传输给参会人员。或者机械旋转摄像头,根据声音的有向性,自动旋转到目标角度,然后视频会议系统将摄像头的图像传输给参会人员。同时广域网视频会议参加者的视频图像,也会传到主会场视频会议系统。
而类似这样的视频会议系统都存在以下缺陷:第一,多路传输浪费网络带宽,普通视频会议系统由于带宽限制,仅支持若干路视频通话,限制了参会人员人数。第二,机械旋转摄像头,根据声音的有向性做出反向,当多人发言或交头接耳时,其无法做出有效性方向判断,另外有向性改变时,过场时间较长。
发明内容
为此,需要提供一种视频会议注意力聚焦的方法,用以解决多路传输浪费网络带宽、多人发言或交头接耳时,无法对声音有效性方向做出判断等等问题。具体的技术方案如下所述:
一种视频会议注意力聚焦的方法,包括步骤:获取全景图像;获取全向声音;分割全景图像,并对分割后的全景图像进行处理得到目标图像;分割全向声音,并对分割后的全向声音进行处理得到目标声音;发送所述目标图像和所述目标声音至目标设备
进一步的,所述“分割全景图像,并对分割后的全景图像进行处理得到目标图像”,还包括步骤:通过基于人工智能的视频注意力聚焦算法,实时计算视频注意力分割区域;通过基于分割区域评分的视频注意力聚焦算法,实时计算视频注意力分割区域权重;根据分割区域权重获取优选分割区域;对所述优选分割区域进行处理输出目标图像。
进一步的,还包括步骤:主视频注意力分割区域切换,根据预设场景切换模式进行场景切换,所述预设场景切换模式包括:自然过度、延迟过度和画中画过度;所述主视频注意力分割区域为:权重最大的视频注意力分割区域。
进一步的,所述“对所述优选分割区域进行处理输出目标图像”,还包括步骤:根据画面主次关系将多区域图像合成一张目标图像,优选中等以上权重的注意力分割区域的图像合成目标图像,屏蔽低权重的注意力分割区域。
进一步的,所述“分割全向声音,并对分割后的全向声音进行处理得到目标声音”,还包括步骤:通过基于人工智能的音频注意力聚焦算法和基于音频相关性评分的聚焦算法,实时计算音频注意力相关性权重;根据视频注意力分割区域权重调整音频注意力相关性权重;根据音频注意力相关性权重获取最佳相关性音频方向;对所述最佳相关性音频方向进行处理输出目标声音。
为解决上述问题,还提供了一种存储设备。具体的技术方案如下:
一种存储设备,其中存储有指令集,所述指令集用于执行:获取全景图像;获取全向声音;分割全景图像,并对分割后的全景图像进行处理得到目标图像;分割全向声音,并对分割后的全向声音进行处理得到目标声音;发送所述目标图像和所述目标声音至目标设备。
进一步的,所述指令集还用于执行:通过基于人工智能的视频注意力聚焦算法,实时计算视频注意力分割区域;通过基于分割区域评分的视频注意力聚焦算法,实时计算视频注意力分割区域权重;根据区域权重获取优选分割区域;对所述优选分割区域进行处理输出目标图像。
进一步的,所述指令集还用于执行:主视频注意力分割区域切换,根据预设场景切换模式进行场景切换,所述预设场景切换模式包括:自然过度、延迟过度和画中画过度;所述主视频注意力分割区域为:权重最大的视频注意力分割区域。
进一步的,所述指令集还用于执行:所述“对所述优选分割区域进行处理输出目标图像”,还包括步骤:根据画面主次关系将多区域图像合成一张目标图像,优选中等以上权重的注意力分割区域的图像合成目标图像,屏蔽低权重的注意力分割区域。
进一步的,所述指令集还用于执行:通过基于人工智能的音频注意力聚焦算法和基于音频相关性评分的聚焦算法,实时计算音频注意力相关性权重;根据视频注意力分割区域权重调整音频注意力相关性权重;根据音频注意力相关性权重获取最佳相关性音频方向;对所述最佳相关性音频方向进行处理输出目标声音。
本发明的有益效果是:
1、通过获取全景图像,分割全景图像,并对分割后的全景图像进行处理得到目标图像,发送目标图像至目标设备,所发送的目标图像是经过处理后的,对中等以上区域权重的照片才进行处理传输,并非原始的整个全景图像,大大节省传输过程中的网络带宽,网络带宽的减少,也使得参会人员的人数可以大大增加。
2、通过获取全向声音,分割全向声音,并对分割后的全向声音进行处理得到目标声音,且结合分割区域权重调整音频注意力相关性权重,使得声音的获取及时有效,避免杂音;同时也大大节省传输过程中的网络带宽。
附图说明
图1为具体实施方式所述一种视频会议注意力聚焦的方法的流程图;
图2为具体实施方式所述一种存储设备的模块图。
附图标记说明:
200、存储设备。
具体实施方式
为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。
请参阅图1,首先,对本实施方式中会出现的一些名词做以下解释:
画中画:是一种图像或视频呈现方式,是指主画面有机的叠加若干子画面的形成的效果。视频画中画是指全屏的视频叠加若干个预览小窗口。在本实施方式中是指图像的画中画效果,主画面图像和有机的叠加若干子图像,最终形成带画中画效果的单幅画面。
在本实施方式中,一种视频会议注意力聚焦的方法可应用在一种注意力聚焦的视频会议系统上,该系统可在智能手机、平板电脑、台式PC、笔记本电脑、PDA、智能手表等等上运行,并通过360度全景摄像头采集全景图像;视频会议系统通过360度全向麦克风阵列采集声音数据。
步骤S101:获取全景图像。可采用如下方式:通过360度全景摄像头采集全景图像。在其他实施方式中,亦可以采用其他方式获取全景图像,如:3d沉浸式全景、普通全景视频和3d视频。
步骤S102:获取全向声音。可采用如下方式:通过360度全向麦克风阵列采集声音数据。在其他实施方式中,亦可以采用其他方式获取全向声音。
步骤S103:分割全景图像,并对分割后的全景图像进行处理得到目标图像。可采用如下方式:通过基于人工智能的视频注意力聚焦算法,实时计算视频注意力分割区域,通过基于分割区域评分的视频注意力聚焦算法,实时计算视频注意力分割区域权重;根据分割区域权重获取优选分割区域;对所述优选分割区域进行处理输出目标图像。在本实施方式中,优先的人像区域权重相对较高,区域权重越大,则为优选的分割区域。举例如下:在实际场景中,一个会议桌前有三个人A/B/C,在整个视频会议的过程中,将通过基于人工智能的视频注意力聚焦算法,实时计算视频注意力分割区域,通过基于分割区域评分的视频注意力聚焦算法,实时计算视频注意力分割区域权重。如:可通过基于人工智能的视频注意力聚焦算法,实时计算视频注意力分割区域,如在某一时间段,算法计算出来的注意力区域及权重为:Area-A(weight-80),Area-B(weight-30),Area-C(weight-20),Area-D(weigh t-10)。在下一时间段又实时计算视频注意力分割区域。最后对所述优选分割区域进行处理输出目标图像。
在本实施方式中,对于画面的微抖动,需要进行抖动去除操作,将大大提升用户体验。
在本实施方式中,所述“对所述优选分割区域进行处理输出目标图像”,还包括步骤:根据画面主次关系将多区域图像合成一张目标图像,优选中等以上权重的注意力分割区域的图像合成目标图像,屏蔽低权重的注意力分割区域。如:以上某一时刻,注意力区域及权重为:Area-A(weight-80),Area-B(weight-30),Area-C(weight-20),Area-D(weight-10)。此时根据画面的主次关系将多区域图像合成一张图像,优选A/B的注意力分割区域的图像合成目标图像,屏蔽低权重的注意力分割区域C和分割区域D。
在其他实施方式中,亦可以是权重最高的A的画面分割出来(1920x1080)。B的画面(150x200),C的画面(150x200),B/C画面和主画面(A的画面)合成画中画(1920x1080)。其它的低权重区域则被认为是背景噪声,不进行图像合成。
在本实施方式中,在对全景图像进行分割处理前,还包括步骤:图像输入格式转换,通过图像处理模块对全景图像进行前处理去躁,确保了用于后处理的全景图像具有较好的画质和清晰度。
在本实施方式中,对分割后的全景图像的处理还包括:优选缩放、字幕、水印等处理。
步骤S104:分割全向声音,并对分割后的全向声音进行处理得到目标声音。可采用如下方式:通过基于人工智能的音频注意力聚焦算法和基于音频相关性评分的聚焦算法,实时计算音频注意力相关性权重;根据视频注意力分割区域权重调整音频注意力相关性权重;根据音频注意力相关性权重获取最佳相关性音频方向;对所述最佳相关性音频方向进行处理输出目标声音。在本实施方式中,根据主视频注意力分割区域权重调整音频注意力相关性权重,如:在某一帧画面中,A/B/C三个人在进行讨论,实时计算得到的音频注意力相关性权重为A和B相同,但此时A所在的视频注意力分割区域权重最大,则根据该情况对音频注意力相关性权重做调整,得到最佳相关性音频方向为对准A的方向,并对所述最佳相关性音频方向进行处理输出目标声音。
在本实施方式中,在对全向声音进行分割处理前,还包括步骤:音频输入格式转换,通过音效模块对全向声音进行前处理去躁,确保了用于后处理的全向声音具有较好的音质和清晰度。
步骤S105:发送所述目标图像和所述目标声音至目标设备。可采用如下方式:对目标图像和目标声音进行高效编码打包,其中目标图像优选H264/H265/VP9等编码格式,目标声音优选AAC/AC3等编码格式。在本实施方式中,目标设备可为:目标视频会议系统,在其它实施方式中,亦可以是其他目标设备。
通过获取全景图像,分割全景图像,并对分割后的全景图像进行处理得到目标图像,发送目标图像至目标设备,所发送的目标图像是经过处理后的,对中等以上区域权重的照片才进行处理传输,并非原始的整个全景图像,大大节省传输过程中的网络带宽,网络带宽的减少,也使得参会人员的人数可以大大增加。
通过获取全向声音,分割全向声音,并对分割后的全向声音进行处理得到目标声音,且结合分割区域权重调整音频注意力相关性权重,使得声音的获取及时有效,避免杂音。同时也大大节省传输过程中的网络带宽。
进一步的,在本实施方式中,主视频注意力分割区域切换,根据预设场景切换模式进行场景切换,所述预设场景切换模式包括:自然过度、延迟过度和画中画过度;所述主视频注意力分割区域为:权重最大的视频注意力分割区域。可采用如下方式:如:在全景图像中(全景图像是指:一帧图像(已拼接-宽度很宽)或多帧图像(未拼接)),通过算法识别到ABC都在发言,算法识别出了注意力区域:Area-A、Area-B、Area-C、Area-D,计算权重后,Area-A(weight-80),Area-B(weight-30),Area-C(weight-20),Area-D(weigh t-10)。
场景变换,T1时间A发言,T2时间B发言,则根据预设的场景切换模式进行场景切换,所述预设场景切换模式包括:自然过度、延迟过度和画中画过度,三种模式具体如下:
自然过度:画面从A发言显示自然过度到B发言显示。
延迟过度:A发言画面进行停顿片刻,在过度到B发言显示。
画中画过度:原来A发言时,B发言以小窗口显示;现在B发言以大窗口显示,A发言以小窗口显示。
请参阅图2,在本实施方式中,一种存储设备的具体实施方案如下:
一种存储设备200,其中存储有指令集,所述指令集用于执行:获取全景图像;获取全向声音;分割全景图像,并对分割后的全景图像进行处理得到目标图像;分割全向声音,并对分割后的全向声音进行处理得到目标声音;发送所述目标图像和所述目标声音至目标设备。
进一步的,所述指令集还用于执行:通过基于人工智能的视频注意力聚焦算法,实时计算视频注意力分割区域;通过基于分割区域评分的视频注意力聚焦算法,实时计算视频注意力分割区域权重;根据区域权重获取优选分割区域;对所述优选分割区域进行处理输出目标图像。可采用如下方式:在实际场景中,一个会议桌前有三个人A/B/C,在整个视频会议的过程中,将通过基于人工智能的视频注意力聚焦算法,实时计算视频注意力分割区域,通过基于分割区域评分的视频注意力聚焦算法,实时计算视频注意力分割区域权重。如:可通过基于人工智能的视频注意力聚焦算法,实时计算视频注意力分割区域,如在某一时间段,算法计算出来的注意力区域及权重为:Area-A(weight-80),Area-B(weight-30),Area-C(weight-20),Area-D(weigh t-10)。在下一时间段又实时计算视频注意力分割区域。最后对所述优选分割区域进行处理输出目标图像。进一步的,所述指令集还用于执行:所述“对所述优选分割区域进行处理输出目标图像”,还包括步骤:根据画面主次关系将多区域图像合成一张目标图像,优选中等以上权重的注意力分割区域的图像合成目标图像,屏蔽低权重的注意力分割区域。如:以上某一时刻,注意力区域及权重为:Area-A(weight-80),Area-B(weight-30),Area-C(weight-20),Area-D(weight-10)。此时根据画面的主次关系将多区域图像合成一张图像,优选A/B的注意力分割区域的图像合成目标图像,屏蔽低权重的注意力分割区域C和和分割区域D。
在其他实施方式中,亦可以是权重最高的A的画面分割出来(1920x1080)。B的画面(150x200),C的画面(150x200),B/C画面和主画面(A的画面)合成画中画(1920x1080)。其它的则被认为是背景噪声,不进行图像合成。
在本实施方式中,在对全景图像进行分割处理前,还包括步骤:图像输入格式转换,通过图像处理模块对全景图像进行前处理去躁,确保了用于后处理的全景图像具有较好的画质和清晰度。
在本实施方式中,对分割后的全景图像的处理还包括:优选缩放、字幕、水印等处理。
进一步的,所述指令集还用于执行:通过基于人工智能的音频注意力聚焦算法和基于音频相关性评分的聚焦算法,实时计算音频注意力相关性权重;根据视频注意力分割区域权重调整音频注意力相关性权重;根据音频注意力相关性权重获取最佳相关性音频方向;对所述最佳相关性音频方向进行处理输出目标声音。可采用如下方式:在本实施方式中,根据主视频注意力分割区域权重调整音频注意力相关性权重,如:在某一帧画面中,A/B/C三个人在进行讨论,实时计算得到的音频注意力相关性权重为A和B相同,但此时A所在的视频注意力分割区域权重最大,则根据该情况对音频注意力相关性权重做调整,得到最佳相关性音频方向为对准A的方向,并对所述最佳相关性音频方向进行处理输出目标声音。
在本实施方式中,在对全向声音进行分割处理前,还包括步骤:音频输入格式转换,通过音效模块对全向声音进行前处理去躁,确保了用于后处理的全向声音具有较好的音质和清晰度。
在本实施方式中,对目标图像和目标声音进行高效编码打包,其中目标图像优选H264/H265/VP9等编码格式,目标声音优选AAC/AC3等编码格式。在本实施方式中,目标设备可为:目标视频会议系统,在其它实施方式中,亦可以是其他目标设备。
通过获取全景图像,分割全景图像,并对分割后的全景图像进行处理得到目标图像,发送目标图像至目标设备,所发送的目标图像是经过处理后的,对中等以上区域权重的照片才进行处理传输,并非原始的整个全景图像,大大节省传输过程中的网络带宽,网络带宽的减少,也使得参会人员的人数可以大大增加。
通过获取全向声音,分割全向声音,并对分割后的全向声音进行处理得到目标声音,且结合分割区域权重调整音频注意力相关性权重,使得声音的获取及时有效,避免杂音。同时也大大节省传输过程中的网络带宽。
进一步的,所述指令集还用于执行:主视频注意力分割区域切换,根据预设场景切换模式进行场景切换,所述预设场景切换模式包括:自然过度、延迟过度和画中画过度;所述主视频注意力分割区域为:权重最大的视频注意力分割区域。
可采用如下方式:如:在全景图像中(全景图像是指:一帧图像(已拼接-宽度很宽)或多帧图像(未拼接)),通过算法识别到ABC都在发言,算法识别出了Area-A、Area-B、Area-C、Area-D,计算权重后,Area-A(weight-80),Area-B(weight-30),Area-C(weight-20),Area-D(weight-10)。
场景变换,T1时间A发言,T2时间B发言,则根据预设的场景切换模式进行场景切换,所述预设场景切换模式包括:自然过度、延迟过度和画中画过度,三种模式具体如下:
自然过度:画面从A发言显示自然过度到B发言显示。
延迟过度:A发言画面进行停顿片刻,在过度到B发言显示。
画中画过度:原来A发言时,B发言以小窗口显示;现在B发言以大窗口显示,A发言以小窗口显示。
需要说明的是,尽管在本文中已经对上述各实施例进行了描述,但并非因此限制本发明的专利保护范围。因此,基于本发明的创新理念,对本文所述实施例进行的变更和修改,或利用本发明说明书及附图内容所作的等效结构或等效流程变换,直接或间接地将以上技术方案运用在其他相关的技术领域,均包括在本发明的专利保护范围之内。
Claims (6)
1.一种视频会议注意力聚焦的方法,其特征在于,包括步骤:
获取全景图像;
获取全向声音;
分割全景图像,并对分割后的全景图像进行处理得到目标图像;具体包括:通过基于人工智能的视频注意力聚焦算法,实时计算视频注意力分割区域;通过基于分割区域评分的视频注意力聚焦算法,实时计算视频注意力分割区域权重;根据分割区域权重获取优选分割区域;对所述优选分割区域进行处理输出目标图像;
分割全向声音,并对分割后的全向声音进行处理得到目标声音;具体包括步骤:通过基于人工智能的音频注意力聚焦算法和基于音频相关性评分的聚焦算法,实时计算音频注意力相关性权重;根据视频注意力分割区域权重调整音频注意力相关性权重;根据音频注意力相关性权重获取最佳相关性音频方向;对所述最佳相关性音频方向进行处理输出目标声音;
发送所述目标图像和所述目标声音至目标设备。
2.根据权利要求1所述的一种视频会议注意力聚焦的方法,其特征在于,还包括步骤:
主视频注意力分割区域切换,根据预设场景切换模式进行场景切换,所述预设场景切换模式包括:自然过度、延迟过度和画中画过度;
所述主视频注意力分割区域为:权重最大的视频注意力分割区域。
3.根据权利要求1所述的一种视频会议注意力聚焦的方法,其特征在于,
所述“对所述优选分割区域进行处理输出目标图像”,还包括步骤:
根据画面主次关系将多区域图像合成一张目标图像,优选中等以上权重的注意力分割区域的图像合成目标图像,屏蔽低权重的注意力分割区域。
4.一种存储设备,其中存储有指令集,其特征在于,所述指令集用于执行:
获取全景图像;
获取全向声音;
分割全景图像,并对分割后的全景图像进行处理得到目标图像;所述指令集还用于执行:通过基于人工智能的视频注意力聚焦算法,实时计算视频注意力分割区域;通过基于分割区域评分的视频注意力聚焦算法,实时计算视频注意力分割区域权重;根据区域权重获取优选分割区域;对所述优选分割区域进行处理输出目标图像;
分割全向声音,并对分割后的全向声音进行处理得到目标声音;所述指令集还用于执行:通过基于人工智能的音频注意力聚焦算法和基于音频相关性评分的聚焦算法,实时计算音频注意力相关性权重;根据视频注意力分割区域权重调整音频注意力相关性权重;根据音频注意力相关性权重获取最佳相关性音频方向;对所述最佳相关性音频方向进行处理输出目标声音;
发送所述目标图像和所述目标声音至目标设备。
5.根据权利要求4所述的一种存储设备,其特征在于,所述指令集还用于执行:
主视频注意力分割区域切换,根据预设场景切换模式进行场景切换,所述预设场景切换模式包括:自然过度、延迟过度和画中画过度;
所述主视频注意力分割区域为:权重最大的视频注意力分割区域。
6.根据权利要求4所述的一种存储设备,其特征在于,所述指令集还用于执行:
所述“对所述优选分割区域进行处理输出目标图像”,还包括步骤:
根据画面主次关系将多区域图像合成一张目标图像,优选中等以上权重的注意力分割区域的图像合成目标图像,屏蔽低权重的注意力分割区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810465189.XA CN108683874B (zh) | 2018-05-16 | 2018-05-16 | 一种视频会议注意力聚焦的方法及一种存储设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810465189.XA CN108683874B (zh) | 2018-05-16 | 2018-05-16 | 一种视频会议注意力聚焦的方法及一种存储设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108683874A CN108683874A (zh) | 2018-10-19 |
CN108683874B true CN108683874B (zh) | 2020-09-11 |
Family
ID=63806518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810465189.XA Active CN108683874B (zh) | 2018-05-16 | 2018-05-16 | 一种视频会议注意力聚焦的方法及一种存储设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108683874B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113556499B (zh) * | 2020-04-07 | 2023-05-09 | 上海汽车集团股份有限公司 | 一种车载视频通话方法及车载系统 |
CN111372011B (zh) * | 2020-04-13 | 2022-07-22 | 杭州友勤信息技术有限公司 | 一种kvm高清视频分割器 |
CN111918127B (zh) * | 2020-07-02 | 2023-04-07 | 影石创新科技股份有限公司 | 一种视频剪辑方法、装置、计算机可读存储介质及相机 |
CN113573120B (zh) * | 2021-06-16 | 2023-10-27 | 北京荣耀终端有限公司 | 音频的处理方法及电子设备、芯片系统及存储介质 |
CN117640877B (zh) * | 2024-01-24 | 2024-03-29 | 浙江华创视讯科技有限公司 | 线上会议的画面重构方法及电子设备 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07135646A (ja) * | 1993-11-11 | 1995-05-23 | Nec Eng Ltd | テレビ会議システム |
CN1479525A (zh) * | 2002-06-27 | 2004-03-03 | 全向摄像机与话筒阵列的集成设计 | |
US7002617B1 (en) * | 2000-07-20 | 2006-02-21 | Robert Samuel Smith | Coordinated audio and visual omnidirectional recording |
CN101350906A (zh) * | 2008-09-04 | 2009-01-21 | 北京中星微电子有限公司 | 图像矫正方法和图像矫正装置 |
CN101583010A (zh) * | 2008-05-14 | 2009-11-18 | 致伸科技股份有限公司 | 图像处理方法及图像处理系统 |
CN203118262U (zh) * | 2013-02-26 | 2013-08-07 | 江苏省中医院 | 一种医院手术示教系统 |
CN104113721A (zh) * | 2013-04-22 | 2014-10-22 | 华为技术有限公司 | 一种视频会议中会议材料的显示方法及装置 |
CN104902263A (zh) * | 2015-05-26 | 2015-09-09 | 深圳市圆周率软件科技有限责任公司 | 一种图像信息展现系统和方法 |
CN105657329A (zh) * | 2016-02-26 | 2016-06-08 | 苏州科达科技股份有限公司 | 视频会议系统、处理装置及视频会议方法 |
CN107135207A (zh) * | 2017-04-19 | 2017-09-05 | 中国电子科技集团公司电子科学研究院 | 一种全景会议直播方法及系统 |
CN107315471A (zh) * | 2017-06-11 | 2017-11-03 | 成都吱吖科技有限公司 | 一种基于虚拟现实的交互式全景视频实现方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6937266B2 (en) * | 2001-06-14 | 2005-08-30 | Microsoft Corporation | Automated online broadcasting system and method using an omni-directional camera system for viewing meetings over a computer network |
-
2018
- 2018-05-16 CN CN201810465189.XA patent/CN108683874B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07135646A (ja) * | 1993-11-11 | 1995-05-23 | Nec Eng Ltd | テレビ会議システム |
US7002617B1 (en) * | 2000-07-20 | 2006-02-21 | Robert Samuel Smith | Coordinated audio and visual omnidirectional recording |
CN1479525A (zh) * | 2002-06-27 | 2004-03-03 | 全向摄像机与话筒阵列的集成设计 | |
CN101583010A (zh) * | 2008-05-14 | 2009-11-18 | 致伸科技股份有限公司 | 图像处理方法及图像处理系统 |
CN101350906A (zh) * | 2008-09-04 | 2009-01-21 | 北京中星微电子有限公司 | 图像矫正方法和图像矫正装置 |
CN203118262U (zh) * | 2013-02-26 | 2013-08-07 | 江苏省中医院 | 一种医院手术示教系统 |
CN104113721A (zh) * | 2013-04-22 | 2014-10-22 | 华为技术有限公司 | 一种视频会议中会议材料的显示方法及装置 |
CN104902263A (zh) * | 2015-05-26 | 2015-09-09 | 深圳市圆周率软件科技有限责任公司 | 一种图像信息展现系统和方法 |
CN105657329A (zh) * | 2016-02-26 | 2016-06-08 | 苏州科达科技股份有限公司 | 视频会议系统、处理装置及视频会议方法 |
CN107135207A (zh) * | 2017-04-19 | 2017-09-05 | 中国电子科技集团公司电子科学研究院 | 一种全景会议直播方法及系统 |
CN107315471A (zh) * | 2017-06-11 | 2017-11-03 | 成都吱吖科技有限公司 | 一种基于虚拟现实的交互式全景视频实现方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108683874A (zh) | 2018-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108683874B (zh) | 一种视频会议注意力聚焦的方法及一种存储设备 | |
US8773498B2 (en) | Background compression and resolution enhancement technique for video telephony and video conferencing | |
US10321093B2 (en) | Automated layouts optimized for multi-screen and multi-camera videoconferencing calls | |
US9392226B2 (en) | Generating and rendering synthesized views with multiple video streams in telepresence video conference sessions | |
US9485466B2 (en) | Video processing in a multi-participant video conference | |
JP2022017369A (ja) | 角度分離されたサブシーンの合成およびスケーリング | |
US8542266B2 (en) | Method and system for adapting a CP layout according to interaction between conferees | |
US9124765B2 (en) | Method and apparatus for performing a video conference | |
US20080235724A1 (en) | Face Annotation In Streaming Video | |
US10079995B1 (en) | Methods and systems for generating resolution based content | |
US11076127B1 (en) | System and method for automatically framing conversations in a meeting or a video conference | |
JP2006101472A (ja) | 動画像データの符号化方法、復号化方法、これらを実行する端末装置、及び双方向対話型システム | |
CN104012086A (zh) | 用于视频会议环境中景深导向图像滤波的系统和方法 | |
US20230283888A1 (en) | Processing method and electronic device | |
CN111147801A (zh) | 一种视联网终端的视频数据处理方法和装置 | |
KR102566072B1 (ko) | 인물 위치 완속 조정형 화상회의 방법 | |
CN113194278A (zh) | 一种会议控制方法、装置及计算机可读存储介质 | |
CN102202206B (zh) | 通信设备 | |
US11516433B1 (en) | Representation and compression of gallery view for video conferencing | |
WO2016206471A1 (zh) | 多媒体业务处理方法、系统及装置 | |
US20220400244A1 (en) | Multi-camera automatic framing | |
CN101583010A (zh) | 图像处理方法及图像处理系统 | |
CN112887653B (zh) | 一种信息处理方法和信息处理装置 | |
US11877084B2 (en) | Video conference user interface layout based on face detection | |
WO2022006693A1 (en) | Videoconferencing systems with facial image rectification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 350003 building, No. 89, software Avenue, Gulou District, Fujian, Fuzhou 18, China Applicant after: Ruixin Microelectronics Co., Ltd Address before: 350003 building, No. 89, software Avenue, Gulou District, Fujian, Fuzhou 18, China Applicant before: Fuzhou Rockchips Electronics Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |