CN112860198A - 视频会议的画面切换方法、装置、计算机设备及存储介质 - Google Patents

视频会议的画面切换方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112860198A
CN112860198A CN202110006064.2A CN202110006064A CN112860198A CN 112860198 A CN112860198 A CN 112860198A CN 202110006064 A CN202110006064 A CN 202110006064A CN 112860198 A CN112860198 A CN 112860198A
Authority
CN
China
Prior art keywords
video conference
coordinates
image
coordinate
target image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110006064.2A
Other languages
English (en)
Other versions
CN112860198B (zh
Inventor
徐飞扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quarkdata Software Co ltd
Original Assignee
Quarkdata Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quarkdata Software Co ltd filed Critical Quarkdata Software Co ltd
Priority to CN202110006064.2A priority Critical patent/CN112860198B/zh
Publication of CN112860198A publication Critical patent/CN112860198A/zh
Application granted granted Critical
Publication of CN112860198B publication Critical patent/CN112860198B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Abstract

本申请提供了一种视频会议的画面切换方法、装置、计算机设备及存储介质,涉及视频处理技术领域,用于提高视频会议画面切换的效果及切换速度。该方法主要包括:通过摄像头实时采集当前视频会议场景图像数据;从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标;获取所述参会人员中置信值最大的位置坐标,并将所述置信值最大的位置坐标确定为目标图像坐标;将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标;根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。

Description

视频会议的画面切换方法、装置、计算机设备及存储介质
技术领域
本申请涉及视频处理技术领域,尤其涉及一种视频会议的画面切换方法、装置、计算机设备及存储介质。
背景技术
传统的视频会议系统,通常是通过机械云台结合变焦镜头的方式去捕捉参会者发言人的位置,调整画面大小。比如,有5人参会,A发言的时候,摄像头转向A,如果发言人切换到B,则机械云台需要机械的调整转动方向,同时镜头变焦马达配合推动变焦镜组达到拉远拉近的效果。
传统机械云台为能达到镜头变焦的需求,往往使用变焦模组。相较于定焦模组,为兼顾图像画质与变焦功能,变焦模组中都会加入大量镜片,造成体积较为庞大且造价不菲。同时,由于电动机械变焦结构的限制,变焦过程往往也存在着对焦点偏移、变焦过程较为缓慢等情况。
发明内容
本申请实施例提供一种视频会议的画面切换方法、装置、计算机设备及存储介质,用于提高视频会议画面切换的效果及切换速度。
本发明实施例提供一种视频会议的画面切换方法,所述方法包括:
通过摄像头实时采集当前视频会议场景图像数据;
从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标;
获取所述参会人员中置信值最大的位置坐标,并将所述置信值最大的位置坐标确定为目标图像坐标;
将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标;
根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。
本发明实施例提供一种视频会议的画面切换装置,所述装置包括:
采集模块,用于通过摄像头实时采集当前视频会议场景图像数据;
识别模块,用于从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标;
确定模块,用于获取所述参会人员中置信值最大的位置坐标,并将所述置信值最大的位置坐标确定为目标图像坐标;
计算模块,用于将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标;
切换模块,用于根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述视频会议的画面切换方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述视频会议的画面切换方法。
本发明提供一种视频会议的画面切换方法、装置、计算机设备及存储介质,首先通过摄像头实时采集当前视频会议场景图像数据;然后从当前视频会议场景图像数据中识别出各个参会人员的位置坐标;获取参会人员中置信值最大的位置坐标,并将所述置信值最大的位置坐标确定为目标图像坐标;将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标;最后根据中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。与目前通过在变焦模组中加入大量镜片实现会议画面的切换相比,本发明基于确定的目标图像坐标和当前图像的位置坐标确定按照顺序排列的中间图像坐标,然后根据中间图像坐标的先后顺序将视频会议当前图像切换到所述目标图像坐标对应的目标图像,从而实现了视频画面的切换,提高了视频会议画面切换的效果及切换速度。
附图说明
图1为本申请实施例提供的视频会议的画面切换方法流程图;
图2为本申请实施例提供的确定参会人员的位置坐标流程图;
图3为本申请一个实施例提供的视频会议的画面切换装置的结构框图;
图4为本申请一个实施例提供的计算机设备的一示意图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请实施例的技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请实施例技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
请参阅图1,所示为本发明第一实施例当中的视频会议的画面切换方法,所述方法具体包括步骤S10-步骤S50:
步骤S10,通过摄像头实时采集当前视频会议场景图像数据。
其中,当前视频会议场景图像数据为视频流(video image buffer/视频中每一帧的画面),通过对视频流进行识别可获取视频中各个参会人员的位置坐标。
步骤S20,从当前视频会议场景图像数据中识别出各个参会人员的位置坐标。
具体的如图2所示,从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标,包括:
步骤S201,从所述当前视频会议场景图像数据中识别出各个参会人员的人型位置信息、人脸位置信息。
其中,人型位置信息代表参会人员人体的中心中标,人脸位置坐标信息为参会人员的人脸中心的位置坐标,位置坐标具体可以通过(x,y)表示。
步骤S202,根据人型位置信息、所述人脸位置信息确定各个参会人员的位置坐标。
在本实施例中,具体可以根据画面切换后显示的需求确定参会人员的位置坐标,若参会人员是站立状态(需要全身显示参会人员视频画面),则可以将人型位置信息确定为参会人员的位置坐标;若参会人员为坐立状态(需要半身显示参会人员视频画面),则可将人脸位置信息确定为参会人员的位置坐标;还可以个根据人型位置坐标信息和人脸位置信息所对应的中心坐标确定为参会人员的位置坐标,本发明实施例不做具体限定。
步骤S30,获取所述参会人员中置信值最大的位置坐标,并将所述置信值最大的位置坐标确定为目标图像坐标。
需要说明的是,本实施例在获取到各个参会人员的位置坐标之后,需要裁剪出位置坐标所在的区域,该区域的大小具体可以根据位置坐标在参会人员的位置确定,如位置坐标在参会人员的人脸位置,则裁剪出的区域为人脸所在的区域(如横版区域),如位置坐标在参会人员身体的中间位置,则裁剪出的区域为人体所在的区域(如竖版区域)。之后,根据裁剪区域内的图像信息确定置信值,该置信值代表该区域检测的可信值,如人脸检测算法中,置信值代表这一块图像区域与人脸的接近程度,置信值为100%则代表一定是人脸。
在本发明提供的一个实施例中,置信值除了可以根据裁剪区域的图像信息确定,还可以根据声源位置信息确定,具体确定置信值的过程为:通过拾音模块获取声源位置信息;根据所述各个参会人员的位置坐标与所述声源位置坐标的位置关系确定各参会人员的置信值。具体的,参会人员的位置坐标与声源位置坐标越近,对应位置坐标的参会人员的置信值也就越大,即从参会人员的位置坐标中选择一个距离声源位置坐标最近的坐标作为目标图像坐标。
此外,本实施例还可以结合裁剪区域内图像信息的置信值,以及参会人员的位置坐标与所述声源位置坐标的位置关系确定目标图像坐标。具体的,通过加权计算得到对应的目标坐标,例如存在3个位置坐,分别位置坐标1、位置坐标2和位置坐标3,位置坐标1对应裁剪区域的置信值度为9,位置坐标2对应的裁剪区域的置信值为8,位置坐标3对应的裁剪区域的置信值为5,若声源位置坐标2距离位置坐标2最近,对应的置信值为9、其次是位置坐标1,对应的置信值为7,最后是位置坐标3,对应的置信值为5;若裁剪区域图像的权重值为0.6,声源位置坐标对应的权重值为0.4,则经过计算位置坐标1的置信值为9*0.6+7*0.4=7;位置坐标2的置信值为8*0.6+9*0.4=8.4;位置坐标3的置信值为5*0.6+5*0.4=5;即最后选择位置坐标2作为目标图像坐标。
步骤S40,将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标。
具体的,通过下述位置拟合函数模型(Logistic函数,一类函数曲线伟S型的函数)计算多个按照时间先后顺序排列的中间图像坐标:
Figure BDA0002883430550000051
其中,所述P0为所述视频会议当前图像的位置坐标,所述K为所述目标图像坐标,所述r为衡量S曲线的变化率,所述t为时间。t的时间单位是s,本实施中是以帧率计算时间间隔t,例如当视频为30帧时,时间递增的间隔就是1/30s。
置信值与rt正相关,在图像开始变换时,变换速度从0开始加速增长,随着当前位置到达中间值时,变换速度达到最大值。之后,随着变换的继续进行,速度开始逐渐降低,当前位置越接近目标位置,速度降低的越慢。最终,当前图像的位置与目标图像位置重合后,变换速度降为0。
步骤S50,根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。
对于本发明实施例,在根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像之前,所述方法还包括:确定将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像所需要的帧数;根据所述帧数对所述S曲线进行等距分割得到每一帧的位置坐标。在本实施例中,确定了帧数就相当于确定了起始时间to和结束时间ts,ts-to的值就等于帧数x帧间隔的时长,所以对应的最终取的中间过程的P(t0),P(t1),P(t2).....的数量是和帧数相等的。
具体的,根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像,包括:裁剪并放大所述每一帧的位置坐标对应的位置区域;按照裁剪并放大的各位置区域对应的顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。
需要说明的是,每一步裁切下来的图像大小是变化的,将所有的中间过程的图像经过不同比例的放大,最终得到相同大小的图像。
本发明提供一种视频会议的画面切换方法,首先通过摄像头实时采集当前视频会议场景图像数据;然后从当前视频会议场景图像数据中识别出各个参会人员的位置坐标;获取参会人员中置信值最大的位置坐标,并将所述置信值最大的位置坐标确定为目标图像坐标;将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标;最后根据中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。与目前通过在变焦模组中加入大量镜片实现会议画面的切换相比,本发明基于确定的目标图像坐标和当前图像的位置坐标确定按照顺序排列的中间图像坐标,然后根据中间图像坐标的先后顺序将视频会议当前图像切换到所述目标图像坐标对应的目标图像,从而实现了视频画面的切换,提高了视频会议画面切换的效果及切换速度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种视频会议的画面切换装置,该视频会议的画面切换装置与上述实施例中视频会议的画面切换方法一一对应。如图3所示,所述视频会议的画面切换装置各功能模块详细说明如下所示:
采集模块10,用于通过摄像头实时采集当前视频会议场景图像数据;
识别模块20,用于从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标;
确定模块30,用于获取所述参会人员中置信值最大的位置坐标,并将所述置信值最大的位置坐标确定为目标图像坐标;
计算模块40,用于将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标;
切换模块50,用于根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。
所述识别模块20,具体用于:
从所述当前视频会议场景图像数据中识别出各个参会人员的人型位置信息、人脸位置信息;
根据人型位置信息、所述人脸位置信息确定各个参会人员的位置坐标。
进一步的,确定模块30,还用于:
通过拾音模块获取声源位置信息;
根据所述各个参会人员的位置坐标与所述声源位置坐标的位置关系确定各参会人员的置信值。
计算模块40,用于通过下述公式计算多个按照时间先后顺序排列的中间图像坐标:
Figure BDA0002883430550000071
其中,所述P0为所述视频会议当前图像的位置坐标,所述K为所述目标图像坐标,所述r为衡量S曲线的变化率,所述t为时间。
所述确定模块30,还用于确定将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像所需要的帧数;根据所述帧数对所述S曲线进行等距分割得到每一帧的位置坐标。
所述切换模块50,具体用于:
裁剪并放大所述每一帧的位置坐标对应的位置区域;
按照裁剪并放大的各位置区域对应的顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。
关于视频会议的画面切换装置的具体限定可以参见上文中对于视频会议的画面切换方法的限定,在此不再赘述。上述设备中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种视频会议的画面切换方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
通过摄像头实时采集当前视频会议场景图像数据;
从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标;
获取所述参会人员中置信值最大的位置坐标,并将所述置信值最大的位置坐标确定为目标图像坐标;
将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标;
根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
通过摄像头实时采集当前视频会议场景图像数据;
从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标;
获取所述参会人员中置信值最大的位置坐标,并将所述置信值最大的位置坐标确定为目标图像坐标;
将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标;
根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种视频会议的画面切换方法,其特征在于,所述方法包括:
通过摄像头实时采集当前视频会议场景图像数据;
从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标;
获取所述参会人员中置信值最大的位置坐标,并将所述置信值最大的位置坐标确定为目标图像坐标;
将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标;
根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。
2.根据权利要求1所述的视频会议的画面切换方法,其特征在于,从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标,包括:
从所述当前视频会议场景图像数据中识别出各个参会人员的人型位置信息、人脸位置信息;
根据人型位置信息、所述人脸位置信息确定各个参会人员的位置坐标。
3.根据权利要求2所述的视频会议的画面切换方法,其特征在于,所述方法还包括:
通过拾音模块获取声源位置信息;
根据所述各个参会人员的位置坐标与所述声源位置坐标的位置关系确定各参会人员的置信值。
4.根据权利要求1所述的视频会议的画面切换方法,其特征在于,所述将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标,包括:
通过下述公式计算多个按照时间先后顺序排列的中间图像坐标:
Figure FDA0002883430540000011
其中,所述P0为所述视频会议当前图像的位置坐标,所述K为所述目标图像坐标,所述r为衡量S曲线的变化率,所述t为时间。
5.根据权利要求4所述的视频会议的画面切换方法,其特征在于,在根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像之前,所述方法还包括:
确定将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像所需要的帧数;
根据所述帧数对所述S曲线进行等距分割得到每一帧的位置坐标。
6.根据权利要求5所述的视频会议的画面切换方法,其特征在于,根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像,包括:
裁剪并放大所述每一帧的位置坐标对应的位置区域;
按照裁剪并放大的各位置区域对应的顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。
7.一种视频会议的画面切换装置,其特征在于,所述装置包括:
采集模块,用于通过摄像头实时采集当前视频会议场景图像数据;
识别模块,用于从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标;
确定模块,用于获取所述参会人员中置信值最大的位置坐标,并将所述置信值最大的位置坐标确定为目标图像坐标;
计算模块,用于将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标;
切换模块,用于根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。
8.根据权利要求7所述的视频会议的画面切换装置,其特征在于,所述识别模块,具体用于:
从所述当前视频会议场景图像数据中识别出各个参会人员的人型位置信息、人脸位置信息;
根据人型位置信息、所述人脸位置信息确定各个参会人员的位置坐标。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的视频会议的画面切换方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的视频会议的画面切换方法。
CN202110006064.2A 2021-01-05 2021-01-05 视频会议的画面切换方法、装置、计算机设备及存储介质 Active CN112860198B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110006064.2A CN112860198B (zh) 2021-01-05 2021-01-05 视频会议的画面切换方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110006064.2A CN112860198B (zh) 2021-01-05 2021-01-05 视频会议的画面切换方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN112860198A true CN112860198A (zh) 2021-05-28
CN112860198B CN112860198B (zh) 2024-02-09

Family

ID=76001637

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110006064.2A Active CN112860198B (zh) 2021-01-05 2021-01-05 视频会议的画面切换方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112860198B (zh)

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005184386A (ja) * 2003-12-18 2005-07-07 Sony Corp 音声集音・映像撮像装置
CN1845064A (zh) * 2005-04-08 2006-10-11 佳能株式会社 信息处理方法和设备
US20120320141A1 (en) * 2011-06-16 2012-12-20 Vtel Products Corporation, Inc. Video conference control system and method
CN103942557A (zh) * 2014-01-28 2014-07-23 西安科技大学 一种煤矿井下图像预处理方法
CN104246796A (zh) * 2012-04-13 2014-12-24 高通股份有限公司 使用多模匹配方案的对象辨识
CN105049674A (zh) * 2015-07-01 2015-11-11 中科创达软件股份有限公司 一种视频图像处理方法和系统
US9753119B1 (en) * 2014-01-29 2017-09-05 Amazon Technologies, Inc. Audio and depth based sound source localization
CN107277427A (zh) * 2017-05-16 2017-10-20 广州视源电子科技股份有限公司 自动选择摄像头画面的方法、装置及音视频系统
US20170372449A1 (en) * 2016-06-24 2017-12-28 Intel Corporation Smart capturing of whiteboard contents for remote conferencing
CN108010058A (zh) * 2017-11-29 2018-05-08 广东技术师范学院 一种对视频流中目标对象进行视觉跟踪的方法及系统
US20190007623A1 (en) * 2017-06-30 2019-01-03 Polycom, Inc. People detection method for auto-framing and tracking in a video conference
CN109257559A (zh) * 2018-09-28 2019-01-22 苏州科达科技股份有限公司 一种全景视频会议的图像显示方法、装置及视频会议系统
CN109413359A (zh) * 2017-08-16 2019-03-01 华为技术有限公司 摄像跟踪方法、装置及设备
CN109712188A (zh) * 2018-12-28 2019-05-03 科大讯飞股份有限公司 一种目标跟踪方法及装置
CN109887040A (zh) * 2019-02-18 2019-06-14 北京航空航天大学 面向视频监控的运动目标主动感知方法及系统
US20200045244A1 (en) * 2018-07-31 2020-02-06 Yohhei Ohmura Communication terminal, image data communication system, and communication method
CN112118414A (zh) * 2020-09-15 2020-12-22 深圳市健成云视科技有限公司 视频会话方法、电子设备以及计算机存储介质

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005184386A (ja) * 2003-12-18 2005-07-07 Sony Corp 音声集音・映像撮像装置
CN1845064A (zh) * 2005-04-08 2006-10-11 佳能株式会社 信息处理方法和设备
US20120320141A1 (en) * 2011-06-16 2012-12-20 Vtel Products Corporation, Inc. Video conference control system and method
CN104246796A (zh) * 2012-04-13 2014-12-24 高通股份有限公司 使用多模匹配方案的对象辨识
CN103942557A (zh) * 2014-01-28 2014-07-23 西安科技大学 一种煤矿井下图像预处理方法
US9753119B1 (en) * 2014-01-29 2017-09-05 Amazon Technologies, Inc. Audio and depth based sound source localization
CN105049674A (zh) * 2015-07-01 2015-11-11 中科创达软件股份有限公司 一种视频图像处理方法和系统
US20170372449A1 (en) * 2016-06-24 2017-12-28 Intel Corporation Smart capturing of whiteboard contents for remote conferencing
CN107277427A (zh) * 2017-05-16 2017-10-20 广州视源电子科技股份有限公司 自动选择摄像头画面的方法、装置及音视频系统
US20190007623A1 (en) * 2017-06-30 2019-01-03 Polycom, Inc. People detection method for auto-framing and tracking in a video conference
CN109413359A (zh) * 2017-08-16 2019-03-01 华为技术有限公司 摄像跟踪方法、装置及设备
CN108010058A (zh) * 2017-11-29 2018-05-08 广东技术师范学院 一种对视频流中目标对象进行视觉跟踪的方法及系统
US20200045244A1 (en) * 2018-07-31 2020-02-06 Yohhei Ohmura Communication terminal, image data communication system, and communication method
CN109257559A (zh) * 2018-09-28 2019-01-22 苏州科达科技股份有限公司 一种全景视频会议的图像显示方法、装置及视频会议系统
CN109712188A (zh) * 2018-12-28 2019-05-03 科大讯飞股份有限公司 一种目标跟踪方法及装置
CN109887040A (zh) * 2019-02-18 2019-06-14 北京航空航天大学 面向视频监控的运动目标主动感知方法及系统
CN112118414A (zh) * 2020-09-15 2020-12-22 深圳市健成云视科技有限公司 视频会话方法、电子设备以及计算机存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李伟: "智能环境下基于音频视频特征融合的多说话人跟踪研究智能环境下基于音频视频特征融合的多说话人跟踪研究", 《中国优秀硕士学位论文全文数据库-信息科技辑》, pages 1 - 71 *

Also Published As

Publication number Publication date
CN112860198B (zh) 2024-02-09

Similar Documents

Publication Publication Date Title
CN110493525B (zh) 变焦图像确定方法及装置、存储介质、终端
CN111654631B (zh) 变焦控制方法、系统、设备及介质
CN109598744B (zh) 一种视频跟踪的方法、装置、设备和存储介质
CN112930677B (zh) 用于在第一镜头和第二镜头之间切换的方法和电子设备
CN108200342B (zh) 自动聚焦方法、装置、计算机设备和存储介质
JP2013054429A (ja) オブジェクト追跡装置
CN112653835B (zh) 聚焦状态的判断方法、装置及存储介质
CN114096994A (zh) 图像对齐方法及装置、电子设备、存储介质
CN105721767A (zh) 处理视频流的方法
CN114640833A (zh) 投影画面调整方法、装置、电子设备和存储介质
CN110111364B (zh) 运动检测方法、装置、电子设备及存储介质
CN111918127A (zh) 一种视频剪辑方法、装置、计算机可读存储介质及相机
CN112860198A (zh) 视频会议的画面切换方法、装置、计算机设备及存储介质
CN112598571B (zh) 一种图像缩放方法、装置、终端及存储介质
CN116456191A (zh) 图像生成方法、装置、设备及计算机可读存储介质
CN114390206A (zh) 拍摄方法、装置和电子设备
JP2020009472A (ja) 人体認識方法、装置、機器及びコンピュータ読み取り可能な記憶媒体
CN110839126B (zh) 一种变倍追踪方法、装置及可变倍摄像机
CN114554095B (zh) 一种4k摄像机的目标对象确定方法以及相关装置
CN113766090B (zh) 一种图像处理方法、终端以及存储介质
CN115514895B (zh) 图像防抖方法、装置、电子设备和计算机可读存储介质
CN116385260B (zh) 图像处理方法、装置、芯片、电子设备及介质
CN114302071B (zh) 视频处理方法、装置、存储介质及电子设备
US11936881B2 (en) Region of interest based image data enhancement in a teleconference
CN113660448B (zh) 通话处理方法、装置、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant