CN116233353A - 一种远程视频会议通讯方法及系统 - Google Patents

一种远程视频会议通讯方法及系统 Download PDF

Info

Publication number
CN116233353A
CN116233353A CN202310504770.9A CN202310504770A CN116233353A CN 116233353 A CN116233353 A CN 116233353A CN 202310504770 A CN202310504770 A CN 202310504770A CN 116233353 A CN116233353 A CN 116233353A
Authority
CN
China
Prior art keywords
video stream
hardware terminal
decoding
output image
acquiring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310504770.9A
Other languages
English (en)
Inventor
屈光辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Aerospace Xingqiao Technology Co ltd
Original Assignee
Beijing Aerospace Xingqiao Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Aerospace Xingqiao Technology Co ltd filed Critical Beijing Aerospace Xingqiao Technology Co ltd
Priority to CN202310504770.9A priority Critical patent/CN116233353A/zh
Publication of CN116233353A publication Critical patent/CN116233353A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/155Conference systems involving storage of or access to video conference sessions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种远程视频会议通讯方法及系统,该方法具体包括以下步骤:获取参会人员的接入请求,根据所述接入请求确定对应的身份信息,接入视频会议硬件终端;根据所述身份信息获取所述硬件终端采集的原始图像,对所述原始图像进行图像处理,以得到输出图像;对所述输出图像进行编码处理,并根据解码参数采集对应的第一视频流,对采集到的第一视频流进行解码处理,生成目标视频流,并将所述目标视频流传输至所述硬件终端;获取视频会议中所述硬件终端传输的语音信息,对视频画面进行实时调整;本发明能够及时在约定的会议时间进行视频会议,及时处理事情,提高办事效率。

Description

一种远程视频会议通讯方法及系统
技术领域
本发明涉及视频会议技术领域,特别是一种远程视频会议通讯方法及系统。
背景技术
视频会议,是指位于两个或多个地点的人们,通过通信设备和网络,进行面对面交谈的会议。根据参会地点数目不同,视频会议可分为点对点会议和多点会议。日常生活中的个人,对谈话内容安全性、会议质量、会议规模没有要求。使用视频会议系统,参会者可以听到其它会场的声音、看到其它会场现场参会人的形象、动作和表情,还可以发送电子演示内容,使与会者有身临其境的感觉。
发明内容
本发明的目的是为了解决上述问题,设计了一种远程视频会议通讯方法及系统。
实现上述目的本发明的技术方案为,进一步,在上述远程视频会议通讯方法中,该远程视频会议通讯方法包括以下步骤:
获取参会人员的接入请求,根据所述接入请求确定对应的身份信息,接入视频会议硬件终端;
根据所述身份信息获取所述硬件终端采集的原始图像,对所述原始图像进行图像处理,以得到输出图像;
对所述输出图像进行编码处理,并根据解码参数采集对应的第一视频流,对采集到的第一视频流进行解码处理,生成目标视频流,并将所述目标视频流传输至所述硬件终端;
获取视频会议中所述硬件终端传输的语音信息,对视频画面进行实时调整。
进一步,在上述远程视频会议通讯方法中,所述根据所述身份信息获取所述硬件终端采集的原始图像,对所述原始图像进行图像处理,以得到输出图像,包括:
获取所述硬件终端采集到的原始图像,对所述原始图像进行采样,得到若干采样点数;
基于所述采样点数将所述原始图像分割成若干离散像素组成的阵列,对所述若干离散像素组成的阵列进行均匀量化和非均匀量化,得到量化结果;
将所述量化结果,得到边缘信息,基于所述边缘信息生成输出图像。
进一步,在上述远程视频会议通讯方法中,所述对所述输出图像进行编码处理,并根据解码参数采集对应的第一视频流,对采集到的第一视频流进行解码处理,生成目标视频流,并将所述目标视频流传输至所述硬件终端,包括:
获取输出图像,将所述输出图像从RGB 颜色空间转换至YUV 颜色空间;
采用哈夫曼编码对转换后的输出图像进行压缩编码,得到解码参数,并根据所述解码参数获取对应的第一视频流;
接收所述第一视频流,对述第一视频流进行解压缩处理,得到解码结果;
获取所述解码结果中解码后的宏块,对解码后的宏块进行排序,并重建图像,得到目标视频流;
将所述目标视频流从 YUV 颜色空间转换至RGB 颜色空间,将所述目标视频流传输至所述硬件终端。
进一步,在上述远程视频会议通讯方法中,所述获取视频会议中所述硬件终端传输的语音信息,对视频画面进行实时调整,包括:
采集所述硬件终端收集的语音信息,并进行预处理,其中所述预处理至少包括端点检测、语音增强、消除噪声;
分析预处理后的语音信息,得到语音特征和特征参数;
基于所述特征参数,利用预先训练好的语音识别模型对所述语音信息进行匹配,得到匹配结果;
对匹配结果进行语法和语义的分析,得到分析结果,并将所述分析结果与视频画面进行实时同步。
进一步,在上述远程视频会议通讯方法中,所述语音识别模型的训练过程,包括:
获取语音样本数据库,将所述语音样本数据库按一定比例分成训练集和测试集;
获取所述测试集和所述训练集中的语音样本,并根据所述语音样本分别确定所述训练集和所述测试集的特征参数;
将所述训练集的特征参数输入机器学习模型中,并采用所述测试集的特征参数对训练后的机器学习模型进行参数调整,得到语音识别模型。
实现上述目的本发明的技术方案为,进一步,在上述远程视频会议通讯系统中,该远程视频会议通讯系统,包括:
接入模块,用于获取参会人员的接入请求,根据所述接入请求确定对应的身份信息,接入视频会议硬件终端;
图像处理模块,用于根据所述身份信息获取所述硬件终端采集的原始图像,对所述原始图像进行图像处理,以得到输出图像;
编解码处理模块,用于对所述输出图像进行编码处理,并根据解码参数采集对应的第一视频流,对采集到的第一视频流进行解码处理,生成目标视频流,并将所述目标视频流传输至所述硬件终端;
调整模块,用于获取视频会议中所述硬件终端传输的语音信息,对视频画面进行实时调整。
进一步,在上述远程视频会议通讯系统中,所述编解码处理模块,包括:
第一转换子模块,用于获取输出图像,将所述输出图像从RGB 颜色空间转换至YUV颜色空间;
压缩编码子模块,用于采用哈夫曼编码对转换后的输出图像进行压缩编码,得到解码参数,并根据所述解码参数获取对应的第一视频流;
解压缩子模块,用于接收所述第一视频流,对述第一视频流进行解压缩处理,得到解码结果;
重建子模块,用于获取所述解码结果中解码后的宏块,对解码后的宏块进行排序,并重建图像,得到目标视频流;
第二转换子模块,用于将所述目标视频流从 YUV 颜色空间转换至RGB 颜色空间,将所述目标视频流传输至所述硬件终端。
其有益效果在于,通过获取参会人员的接入请求,根据所述接入请求确定对应的身份信息,接入视频会议硬件终端;根据所述身份信息获取所述硬件终端采集的原始图像,对所述原始图像进行图像处理,以得到输出图像;对所述输出图像进行编码处理,并根据解码参数采集对应的第一视频流,对采集到的第一视频流进行解码处理,生成目标视频流,并将所述目标视频流传输至所述硬件终端;获取视频会议中所述硬件终端传输的语音信息,对视频画面进行实时调整;本发明能够及时在约定的会议时间进行视频会议,及时处理事情,提高办事效率。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。
图1为本发明实施例中远程视频会议通讯方法的实施例示意图;
图2为本发明实施例中远程视频会议通讯系统的第一个实施例示意图;
图3为本发明实施例中远程视频会议通讯系统的第二个实施例示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
下面结合附图对本发明进行具体描述,如图1所示,一种远程视频会议通讯方法及系统,该远程视频会议通讯方法包括以下步骤:
步骤101、获取参会人员的接入请求,根据接入请求确定对应的身份信息,接入视频会议硬件终端。
步骤102、根据身份信息获取硬件终端采集的原始图像,对原始图像进行图像处理,以得到输出图像;
在本申请的一些实施例中,获取硬件终端采集到的原始图像,对原始图像进行采样,得到若干采样点数;
基于采样点数将原始图像分割成若干离散像素组成的阵列,对若干离散像素组成的阵列进行均匀量化和非均匀量化,得到量化结果;
将量化结果,得到边缘信息,基于边缘信息生成输出图像。
步骤103、对输出图像进行编码处理,并根据解码参数采集对应的第一视频流,对采集到的第一视频流进行解码处理,生成目标视频流,并将目标视频流传输至硬件终端;
在本申请的一些实施例中,获取输出图像,将输出图像从RGB 颜色空间转换至YUV颜色空间;
采用哈夫曼编码对转换后的输出图像进行压缩编码,得到解码参数,并根据解码参数获取对应的第一视频流;
接收第一视频流,对述第一视频流进行解压缩处理,得到解码结果;
获取解码结果中解码后的宏块,对解码后的宏块进行排序,并重建图像,得到目标视频流;
将目标视频流从 YUV 颜色空间转换至RGB 颜色空间,将目标视频流传输至硬件终端。
步骤104、获取视频会议中硬件终端传输的语音信息,对视频画面进行实时调整。
在本申请的一些实施例中,采集硬件终端收集的语音信息,并进行预处理,其中预处理至少包括端点检测、语音增强、消除噪声;
分析预处理后的语音信息,得到语音特征和特征参数;
基于特征参数,利用预先训练好的语音识别模型对语音信息进行匹配,得到匹配结果;
对匹配结果进行语法和语义的分析,得到分析结果,并将分析结果与视频画面进行实时同步。
在本申请的一些实施例中,语音识别模型的训练过程,包括:
获取语音样本数据库,将语音样本数据库按一定比例分成训练集和测试集;
获取测试集和训练集中的语音样本,并根据语音样本分别确定训练集和测试集的特征参数;
将训练集的特征参数输入机器学习模型中,并采用测试集的特征参数对训练后的机器学习模型进行参数调整,得到语音识别模型。
本发明实施例中,获取参会人员的接入请求,根据接入请求确定对应的身份信息,接入视频会议硬件终端;根据身份信息获取硬件终端采集的原始图像,对原始图像进行图像处理,以得到输出图像;对输出图像进行编码处理,并根据解码参数采集对应的第一视频流,对采集到的第一视频流进行解码处理,生成目标视频流,并将目标视频流传输至硬件终端;获取视频会议中硬件终端传输的语音信息,对视频画面进行实时调整;本发明能够及时在约定的会议时间进行视频会议,及时处理事情,提高办事效率。
上面对本发明实施例提供的远程视频会议通讯方法进行了描述,下面对本发明实施例的远程视频会议通讯系统进行描述,请参阅图2,本发明实施例中远程视频会议通讯系统一个实施例包括:
接入模块201,用于获取参会人员的接入请求,根据接入请求确定对应的身份信息,接入视频会议硬件终端;
图像处理模块202,用于根据身份信息获取硬件终端采集的原始图像,对原始图像进行图像处理,以得到输出图像;
编解码处理模块203,用于对输出图像进行编码处理,并根据解码参数采集对应的第一视频流,对采集到的第一视频流进行解码处理,生成目标视频流,并将目标视频流传输至硬件终端;
调整模块204,用于获取视频会议中硬件终端传输的语音信息,对视频画面进行实时调整。
本发明实施例中,所述远程视频会议通讯系统运行上述远程视频会议通讯方法,该系统本发明实施例中,获取参会人员的接入请求,根据接入请求确定对应的身份信息,接入视频会议硬件终端;根据身份信息获取硬件终端采集的原始图像,对原始图像进行图像处理,以得到输出图像;对输出图像进行编码处理,并根据解码参数采集对应的第一视频流,对采集到的第一视频流进行解码处理,生成目标视频流,并将目标视频流传输至硬件终端;获取视频会议中硬件终端传输的语音信息,对视频画面进行实时调整;本发明能够及时在约定的会议时间进行视频会议,及时处理事情,提高办事效率。
请参阅图3,本发明实施例提供的远程视频会议通讯系统的第二个实施例包括:
第一转换子模块2031,用于获取输出图像,将输出图像从RGB 颜色空间转换至YUV颜色空间;
压缩编码子模块2032,用于采用哈夫曼编码对转换后的输出图像进行压缩编码,得到解码参数,并根据解码参数获取对应的第一视频流;
解压缩子模块2033,用于接收第一视频流,对述第一视频流进行解压缩处理,得到解码结果;
重建子模块2034,用于获取解码结果中解码后的宏块,对解码后的宏块进行排序,并重建图像,得到目标视频流;
第二转换子模块2035,用于将目标视频流从 YUV 颜色空间转换至RGB 颜色空间,将目标视频流传输至硬件终端。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (7)

1.一种远程视频会议通讯方法,其特征在于,该远程视频会议通讯方法包括以下步骤:
获取参会人员的接入请求,根据所述接入请求确定对应的身份信息,接入视频会议硬件终端;
根据所述身份信息获取所述硬件终端采集的原始图像,对所述原始图像进行图像处理,以得到输出图像;
对所述输出图像进行编码处理,并根据解码参数采集对应的第一视频流,对采集到的第一视频流进行解码处理,生成目标视频流,并将所述目标视频流传输至所述硬件终端;
获取视频会议中所述硬件终端传输的语音信息,对视频画面进行实时调整。
2.根据权利要求1所述的一种远程视频会议通讯方法,其特征在于,所述根据所述身份信息获取所述硬件终端采集的原始图像,对所述原始图像进行图像处理,以得到输出图像,包括:
获取所述硬件终端采集到的原始图像,对所述原始图像进行采样,得到若干采样点数;
基于所述采样点数将所述原始图像分割成若干离散像素组成的阵列,对所述若干离散像素组成的阵列进行均匀量化和非均匀量化,得到量化结果;
将所述量化结果,得到边缘信息,基于所述边缘信息生成输出图像。
3.根据权利要求1所述的一种远程视频会议通讯方法,其特征在于,所述对所述输出图像进行编码处理,并根据解码参数采集对应的第一视频流,对采集到的第一视频流进行解码处理,生成目标视频流,并将所述目标视频流传输至所述硬件终端,包括:
获取输出图像,将所述输出图像从RGB 颜色空间转换至YUV 颜色空间;
采用哈夫曼编码对转换后的输出图像进行压缩编码,得到解码参数,并根据所述解码参数获取对应的第一视频流;
接收所述第一视频流,对述第一视频流进行解压缩处理,得到解码结果;
获取所述解码结果中解码后的宏块,对解码后的宏块进行排序,并重建图像,得到目标视频流;
将所述目标视频流从 YUV 颜色空间转换至RGB 颜色空间,将所述目标视频流传输至所述硬件终端。
4.根据权利要求1所述的一种远程视频会议通讯方法,其特征在于,所述获取视频会议中所述硬件终端传输的语音信息,对视频画面进行实时调整,包括:
采集所述硬件终端收集的语音信息,并进行预处理,其中所述预处理至少包括端点检测、语音增强、消除噪声;
分析预处理后的语音信息,得到语音特征和特征参数;
基于所述特征参数,利用预先训练好的语音识别模型对所述语音信息进行匹配,得到匹配结果;
对匹配结果进行语法和语义的分析,得到分析结果,并将所述分析结果与视频画面进行实时同步。
5.根据权利要求4所述的一种远程视频会议通讯方法,其特征在于,所述语音识别模型的训练过程,包括:
获取语音样本数据库,将所述语音样本数据库按一定比例分成训练集和测试集;
获取所述测试集和所述训练集中的语音样本,并根据所述语音样本分别确定所述训练集和所述测试集的特征参数;
将所述训练集的特征参数输入机器学习模型中,并采用所述测试集的特征参数对训练后的机器学习模型进行参数调整,得到语音识别模型。
6.一种远程视频会议通讯系统,其特征在于,该远程视频会议通讯系统,包括:
接入模块,用于获取参会人员的接入请求,根据所述接入请求确定对应的身份信息,接入视频会议硬件终端;
图像处理模块,用于根据所述身份信息获取所述硬件终端采集的原始图像,对所述原始图像进行图像处理,以得到输出图像;
编解码处理模块,用于对所述输出图像进行编码处理,并根据解码参数采集对应的第一视频流,对采集到的第一视频流进行解码处理,生成目标视频流,并将所述目标视频流传输至所述硬件终端;
调整模块,用于获取视频会议中所述硬件终端传输的语音信息,对视频画面进行实时调整。
7.根据权利要求6所述的一种远程视频会议通讯系统,其特征在于,所述编解码处理模块,包括:
第一转换子模块,用于获取输出图像,将所述输出图像从RGB 颜色空间转换至YUV 颜色空间;
压缩编码子模块,用于采用哈夫曼编码对转换后的输出图像进行压缩编码,得到解码参数,并根据所述解码参数获取对应的第一视频流;
解压缩子模块,用于接收所述第一视频流,对述第一视频流进行解压缩处理,得到解码结果;
重建子模块,用于获取所述解码结果中解码后的宏块,对解码后的宏块进行排序,并重建图像,得到目标视频流;
第二转换子模块,用于将所述目标视频流从 YUV 颜色空间转换至RGB 颜色空间,将所述目标视频流传输至所述硬件终端。
CN202310504770.9A 2023-05-08 2023-05-08 一种远程视频会议通讯方法及系统 Pending CN116233353A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310504770.9A CN116233353A (zh) 2023-05-08 2023-05-08 一种远程视频会议通讯方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310504770.9A CN116233353A (zh) 2023-05-08 2023-05-08 一种远程视频会议通讯方法及系统

Publications (1)

Publication Number Publication Date
CN116233353A true CN116233353A (zh) 2023-06-06

Family

ID=86587584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310504770.9A Pending CN116233353A (zh) 2023-05-08 2023-05-08 一种远程视频会议通讯方法及系统

Country Status (1)

Country Link
CN (1) CN116233353A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101931783A (zh) * 2010-09-21 2010-12-29 天地阳光通信科技(北京)有限公司 一种视频会议双流发送系统及方法
CN102057677A (zh) * 2008-06-03 2011-05-11 微软公司 用于增强层视频编码的适应性量化
CN102215217A (zh) * 2010-04-07 2011-10-12 苹果公司 在通话期间建立视频会议
CN114422825A (zh) * 2022-01-26 2022-04-29 科大讯飞股份有限公司 音视频同步方法、装置、介质、设备及程序产品
CN115481024A (zh) * 2022-09-20 2022-12-16 阿里巴巴(中国)有限公司 神经网络模型测试方法、装置、电子设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102057677A (zh) * 2008-06-03 2011-05-11 微软公司 用于增强层视频编码的适应性量化
CN102215217A (zh) * 2010-04-07 2011-10-12 苹果公司 在通话期间建立视频会议
CN101931783A (zh) * 2010-09-21 2010-12-29 天地阳光通信科技(北京)有限公司 一种视频会议双流发送系统及方法
CN114422825A (zh) * 2022-01-26 2022-04-29 科大讯飞股份有限公司 音视频同步方法、装置、介质、设备及程序产品
CN115481024A (zh) * 2022-09-20 2022-12-16 阿里巴巴(中国)有限公司 神经网络模型测试方法、装置、电子设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
彭春辉;: "利用图像处理技术进行圆度测量", 信息与电脑(理论版), no. 07 *

Similar Documents

Publication Publication Date Title
US8270476B2 (en) Face detection system for video encoders
CN100459711C (zh) 一种视频压缩方法及使用该方法的视频系统
US20220180881A1 (en) Speech signal encoding and decoding methods and apparatuses, electronic device, and storage medium
CN103988486A (zh) 在多方电话会议的混音中选择活动信道的方法
Zhang et al. Davd-net: Deep audio-aided video decompression of talking heads
CN102915736B (zh) 混音处理方法和混音处理系统
JP2023524000A (ja) 品質正規化ビデオコード変換のための動的パラメータ選択
CN112449142A (zh) 一种基于数据协同传输处理的远程视频会议系统
CN110739000A (zh) 一种适应于个性化交互系统的音频对象编码方法
CN111901621A (zh) 一种基于直播内容识别的互动直播教学节流装置和方法
US20220094950A1 (en) Inter-Prediction Mode-Dependent Transforms For Video Coding
US6898272B2 (en) System and method for testing telecommunication devices
CN116233353A (zh) 一种远程视频会议通讯方法及系统
WO2013102403A1 (zh) 一种音频信号处理方法、装置及终端
CN112767955A (zh) 音频编码方法及装置、存储介质、电子设备
US10375131B2 (en) Selectively transforming audio streams based on audio energy estimate
CN109040116B (zh) 一种基于云端服务器的视频会议系统
RU2654126C2 (ru) Способ и устройство высокоэффективного сжатия мультимедийной информации большого объема по критериям ее ценности для запоминания в системах хранения данных
CN113936680B (zh) 基于多尺度信息感知卷积神经网络的单通道语音增强方法
US10694216B2 (en) Video coding using separate learning and filtering pathways
CN110958417B (zh) 一种基于语音线索的视频通话类视频去除压缩噪声的方法
CN113132732B (zh) 一种人机协同的视频编码方法及视频编码系统
CN110719473B (zh) 基于结构化稀疏的可伸缩压缩视频采集与重构系统
CN114302175A (zh) 视频处理方法及装置
Zhang et al. FLLIC: Functionally Lossless Image Compression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20230606