CN116233353A

CN116233353A - 一种远程视频会议通讯方法及系统

Info

Publication number: CN116233353A
Application number: CN202310504770.9A
Authority: CN
Inventors: 屈光辉
Original assignee: Beijing Aerospace Xingqiao Technology Co ltd
Current assignee: Beijing Aerospace Xingqiao Technology Co ltd
Priority date: 2023-05-08
Filing date: 2023-05-08
Publication date: 2023-06-06

Abstract

本发明公开了一种远程视频会议通讯方法及系统，该方法具体包括以下步骤：获取参会人员的接入请求，根据所述接入请求确定对应的身份信息，接入视频会议硬件终端；根据所述身份信息获取所述硬件终端采集的原始图像，对所述原始图像进行图像处理，以得到输出图像；对所述输出图像进行编码处理，并根据解码参数采集对应的第一视频流，对采集到的第一视频流进行解码处理，生成目标视频流，并将所述目标视频流传输至所述硬件终端；获取视频会议中所述硬件终端传输的语音信息，对视频画面进行实时调整；本发明能够及时在约定的会议时间进行视频会议，及时处理事情，提高办事效率。

Description

一种远程视频会议通讯方法及系统

技术领域

本发明涉及视频会议技术领域，特别是一种远程视频会议通讯方法及系统。

背景技术

视频会议，是指位于两个或多个地点的人们，通过通信设备和网络，进行面对面交谈的会议。根据参会地点数目不同，视频会议可分为点对点会议和多点会议。日常生活中的个人，对谈话内容安全性、会议质量、会议规模没有要求。使用视频会议系统，参会者可以听到其它会场的声音、看到其它会场现场参会人的形象、动作和表情，还可以发送电子演示内容，使与会者有身临其境的感觉。

发明内容

本发明的目的是为了解决上述问题，设计了一种远程视频会议通讯方法及系统。

实现上述目的本发明的技术方案为，进一步，在上述远程视频会议通讯方法中，该远程视频会议通讯方法包括以下步骤：

获取参会人员的接入请求，根据所述接入请求确定对应的身份信息，接入视频会议硬件终端；

根据所述身份信息获取所述硬件终端采集的原始图像，对所述原始图像进行图像处理，以得到输出图像；

对所述输出图像进行编码处理，并根据解码参数采集对应的第一视频流，对采集到的第一视频流进行解码处理，生成目标视频流，并将所述目标视频流传输至所述硬件终端；

获取视频会议中所述硬件终端传输的语音信息，对视频画面进行实时调整。

进一步，在上述远程视频会议通讯方法中，所述根据所述身份信息获取所述硬件终端采集的原始图像，对所述原始图像进行图像处理，以得到输出图像，包括：

获取所述硬件终端采集到的原始图像，对所述原始图像进行采样，得到若干采样点数；

基于所述采样点数将所述原始图像分割成若干离散像素组成的阵列，对所述若干离散像素组成的阵列进行均匀量化和非均匀量化，得到量化结果；

将所述量化结果，得到边缘信息，基于所述边缘信息生成输出图像。

进一步，在上述远程视频会议通讯方法中，所述对所述输出图像进行编码处理，并根据解码参数采集对应的第一视频流，对采集到的第一视频流进行解码处理，生成目标视频流，并将所述目标视频流传输至所述硬件终端，包括：

获取输出图像，将所述输出图像从RGB 颜色空间转换至YUV 颜色空间；

采用哈夫曼编码对转换后的输出图像进行压缩编码，得到解码参数，并根据所述解码参数获取对应的第一视频流；

接收所述第一视频流，对述第一视频流进行解压缩处理，得到解码结果；

获取所述解码结果中解码后的宏块，对解码后的宏块进行排序，并重建图像，得到目标视频流；

将所述目标视频流从 YUV 颜色空间转换至RGB 颜色空间，将所述目标视频流传输至所述硬件终端。

进一步，在上述远程视频会议通讯方法中，所述获取视频会议中所述硬件终端传输的语音信息，对视频画面进行实时调整，包括：

采集所述硬件终端收集的语音信息，并进行预处理，其中所述预处理至少包括端点检测、语音增强、消除噪声；

分析预处理后的语音信息，得到语音特征和特征参数；

基于所述特征参数，利用预先训练好的语音识别模型对所述语音信息进行匹配，得到匹配结果；

对匹配结果进行语法和语义的分析，得到分析结果，并将所述分析结果与视频画面进行实时同步。

进一步，在上述远程视频会议通讯方法中，所述语音识别模型的训练过程，包括：

获取语音样本数据库，将所述语音样本数据库按一定比例分成训练集和测试集；

获取所述测试集和所述训练集中的语音样本，并根据所述语音样本分别确定所述训练集和所述测试集的特征参数；

将所述训练集的特征参数输入机器学习模型中，并采用所述测试集的特征参数对训练后的机器学习模型进行参数调整，得到语音识别模型。

实现上述目的本发明的技术方案为，进一步，在上述远程视频会议通讯系统中，该远程视频会议通讯系统，包括：

接入模块，用于获取参会人员的接入请求，根据所述接入请求确定对应的身份信息，接入视频会议硬件终端；

图像处理模块，用于根据所述身份信息获取所述硬件终端采集的原始图像，对所述原始图像进行图像处理，以得到输出图像；

编解码处理模块，用于对所述输出图像进行编码处理，并根据解码参数采集对应的第一视频流，对采集到的第一视频流进行解码处理，生成目标视频流，并将所述目标视频流传输至所述硬件终端；

调整模块，用于获取视频会议中所述硬件终端传输的语音信息，对视频画面进行实时调整。

进一步，在上述远程视频会议通讯系统中，所述编解码处理模块，包括：

第一转换子模块，用于获取输出图像，将所述输出图像从RGB 颜色空间转换至YUV颜色空间；

压缩编码子模块，用于采用哈夫曼编码对转换后的输出图像进行压缩编码，得到解码参数，并根据所述解码参数获取对应的第一视频流；

解压缩子模块，用于接收所述第一视频流，对述第一视频流进行解压缩处理，得到解码结果；

重建子模块，用于获取所述解码结果中解码后的宏块，对解码后的宏块进行排序，并重建图像，得到目标视频流；

第二转换子模块，用于将所述目标视频流从 YUV 颜色空间转换至RGB 颜色空间，将所述目标视频流传输至所述硬件终端。

其有益效果在于，通过获取参会人员的接入请求，根据所述接入请求确定对应的身份信息，接入视频会议硬件终端；根据所述身份信息获取所述硬件终端采集的原始图像，对所述原始图像进行图像处理，以得到输出图像；对所述输出图像进行编码处理，并根据解码参数采集对应的第一视频流，对采集到的第一视频流进行解码处理，生成目标视频流，并将所述目标视频流传输至所述硬件终端；获取视频会议中所述硬件终端传输的语音信息，对视频画面进行实时调整；本发明能够及时在约定的会议时间进行视频会议，及时处理事情，提高办事效率。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。

图1为本发明实施例中远程视频会议通讯方法的实施例示意图；

图2为本发明实施例中远程视频会议通讯系统的第一个实施例示意图；

图3为本发明实施例中远程视频会议通讯系统的第二个实施例示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。

下面结合附图对本发明进行具体描述，如图1所示，一种远程视频会议通讯方法及系统，该远程视频会议通讯方法包括以下步骤：

步骤101、获取参会人员的接入请求，根据接入请求确定对应的身份信息，接入视频会议硬件终端。

步骤102、根据身份信息获取硬件终端采集的原始图像，对原始图像进行图像处理，以得到输出图像；

在本申请的一些实施例中，获取硬件终端采集到的原始图像，对原始图像进行采样，得到若干采样点数；

基于采样点数将原始图像分割成若干离散像素组成的阵列，对若干离散像素组成的阵列进行均匀量化和非均匀量化，得到量化结果；

将量化结果，得到边缘信息，基于边缘信息生成输出图像。

步骤103、对输出图像进行编码处理，并根据解码参数采集对应的第一视频流，对采集到的第一视频流进行解码处理，生成目标视频流，并将目标视频流传输至硬件终端；

在本申请的一些实施例中，获取输出图像，将输出图像从RGB 颜色空间转换至YUV颜色空间；

采用哈夫曼编码对转换后的输出图像进行压缩编码，得到解码参数，并根据解码参数获取对应的第一视频流；

接收第一视频流，对述第一视频流进行解压缩处理，得到解码结果；

获取解码结果中解码后的宏块，对解码后的宏块进行排序，并重建图像，得到目标视频流；

将目标视频流从 YUV 颜色空间转换至RGB 颜色空间，将目标视频流传输至硬件终端。

步骤104、获取视频会议中硬件终端传输的语音信息，对视频画面进行实时调整。

在本申请的一些实施例中，采集硬件终端收集的语音信息，并进行预处理，其中预处理至少包括端点检测、语音增强、消除噪声；

分析预处理后的语音信息，得到语音特征和特征参数；

基于特征参数，利用预先训练好的语音识别模型对语音信息进行匹配，得到匹配结果；

对匹配结果进行语法和语义的分析，得到分析结果，并将分析结果与视频画面进行实时同步。

在本申请的一些实施例中，语音识别模型的训练过程，包括：

获取语音样本数据库，将语音样本数据库按一定比例分成训练集和测试集；

获取测试集和训练集中的语音样本，并根据语音样本分别确定训练集和测试集的特征参数；

将训练集的特征参数输入机器学习模型中，并采用测试集的特征参数对训练后的机器学习模型进行参数调整，得到语音识别模型。

本发明实施例中，获取参会人员的接入请求，根据接入请求确定对应的身份信息，接入视频会议硬件终端；根据身份信息获取硬件终端采集的原始图像，对原始图像进行图像处理，以得到输出图像；对输出图像进行编码处理，并根据解码参数采集对应的第一视频流，对采集到的第一视频流进行解码处理，生成目标视频流，并将目标视频流传输至硬件终端；获取视频会议中硬件终端传输的语音信息，对视频画面进行实时调整；本发明能够及时在约定的会议时间进行视频会议，及时处理事情，提高办事效率。

上面对本发明实施例提供的远程视频会议通讯方法进行了描述，下面对本发明实施例的远程视频会议通讯系统进行描述，请参阅图2，本发明实施例中远程视频会议通讯系统一个实施例包括：

接入模块201，用于获取参会人员的接入请求，根据接入请求确定对应的身份信息，接入视频会议硬件终端；

图像处理模块202，用于根据身份信息获取硬件终端采集的原始图像，对原始图像进行图像处理，以得到输出图像；

编解码处理模块203，用于对输出图像进行编码处理，并根据解码参数采集对应的第一视频流，对采集到的第一视频流进行解码处理，生成目标视频流，并将目标视频流传输至硬件终端；

调整模块204，用于获取视频会议中硬件终端传输的语音信息，对视频画面进行实时调整。

本发明实施例中，所述远程视频会议通讯系统运行上述远程视频会议通讯方法，该系统本发明实施例中，获取参会人员的接入请求，根据接入请求确定对应的身份信息，接入视频会议硬件终端；根据身份信息获取硬件终端采集的原始图像，对原始图像进行图像处理，以得到输出图像；对输出图像进行编码处理，并根据解码参数采集对应的第一视频流，对采集到的第一视频流进行解码处理，生成目标视频流，并将目标视频流传输至硬件终端；获取视频会议中硬件终端传输的语音信息，对视频画面进行实时调整；本发明能够及时在约定的会议时间进行视频会议，及时处理事情，提高办事效率。

请参阅图3，本发明实施例提供的远程视频会议通讯系统的第二个实施例包括：

第一转换子模块2031，用于获取输出图像，将输出图像从RGB 颜色空间转换至YUV颜色空间；

压缩编码子模块2032，用于采用哈夫曼编码对转换后的输出图像进行压缩编码，得到解码参数，并根据解码参数获取对应的第一视频流；

解压缩子模块2033，用于接收第一视频流，对述第一视频流进行解压缩处理，得到解码结果；

重建子模块2034，用于获取解码结果中解码后的宏块，对解码后的宏块进行排序，并重建图像，得到目标视频流；

第二转换子模块2035，用于将目标视频流从 YUV 颜色空间转换至RGB 颜色空间，将目标视频流传输至硬件终端。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的仅为本发明的优选例，并不用来限制本发明，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种远程视频会议通讯方法，其特征在于，该远程视频会议通讯方法包括以下步骤：

2.根据权利要求1所述的一种远程视频会议通讯方法，其特征在于，所述根据所述身份信息获取所述硬件终端采集的原始图像，对所述原始图像进行图像处理，以得到输出图像，包括：

3.根据权利要求1所述的一种远程视频会议通讯方法，其特征在于，所述对所述输出图像进行编码处理，并根据解码参数采集对应的第一视频流，对采集到的第一视频流进行解码处理，生成目标视频流，并将所述目标视频流传输至所述硬件终端，包括：

4.根据权利要求1所述的一种远程视频会议通讯方法，其特征在于，所述获取视频会议中所述硬件终端传输的语音信息，对视频画面进行实时调整，包括：

分析预处理后的语音信息，得到语音特征和特征参数；

5.根据权利要求4所述的一种远程视频会议通讯方法，其特征在于，所述语音识别模型的训练过程，包括：

6.一种远程视频会议通讯系统，其特征在于，该远程视频会议通讯系统，包括：

7.根据权利要求6所述的一种远程视频会议通讯系统，其特征在于，所述编解码处理模块，包括：

第一转换子模块，用于获取输出图像，将所述输出图像从RGB 颜色空间转换至YUV 颜色空间；