CN117037048B

CN117037048B - 一种基于虚拟形象的社交互动方法及系统

Info

Publication number: CN117037048B
Application number: CN202311300662.6A
Authority: CN
Inventors: 李其伦; 薄涛
Original assignee: Beijing Lekai Technology Co ltd
Current assignee: Beijing Lekai Technology Co ltd
Priority date: 2023-10-10
Filing date: 2023-10-10
Publication date: 2024-01-09
Anticipated expiration: 2043-10-10
Also published as: CN117037048A

Abstract

本发明涉及视觉社交技术领域，具体公开了一种基于虚拟形象的社交互动方法及系统，所述方法包括接收社交端发送的社交请求，获取社交端的摄像头管理权限；基于所述摄像头管理权限实时获取社交视频，对所述社交视频进行识别，构建虚拟场景；在虚拟场景中插入虚拟形象并单向显示，接收社交端的确认信息后，开启数据传输端口；实时记录含有虚拟形象的虚拟场景的特征值，根据所述特征值控制所述数据传输端口。本发明对社交视频进行识别，提取少量的图像进行识别，构建虚拟形象的同时，构建虚拟场景，在计算量较少的前提下，提高了虚拟形象社交过程的信息量。

Description

一种基于虚拟形象的社交互动方法及系统

技术领域

本发明涉及视觉社交技术领域，具体是一种基于虚拟形象的社交互动方法及系统。

背景技术

随着智能手机的普及以及网络技术的发展，社交过程变的非常容易，其中，音频社交和视频社交逐渐的成为了两大主流。

由于视频社交的信息量更大，其创新方向更加广阔，其中一种创新方向就是视频社交过程的信息转码过程，人们在视频社交时，往往会很在意自己的视觉状态，当状态不好的时，用户会很抵触视频社交，这催生了美颜技术，也即，在视频社交过程中引入滤镜或特效，优化个人的视觉状态。

美颜技术有一种极限方案，就是直接采用虚拟形象，这在保留了用户神态的基础上，隐藏了用户的视觉状态，但是现有的虚拟形象技术是基于人脸识别的替换式方案，它通过定位用户的五官，然后采用预设的贴图对人脸进行替换，几乎不会随用户的变化而变化，这种方案的信息量很少，失去了视频社交原本的优势，因此，如何提高虚拟形象社交互动过程中的信息量是本发明技术方案想要解决的技术问题。

发明内容

本发明的目的在于提供一种基于虚拟形象的社交互动方法及系统，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种基于虚拟形象的社交互动方法，所述方法包括：

接收社交端发送的社交请求，获取社交端的摄像头管理权限；

基于所述摄像头管理权限实时获取社交视频，对所述社交视频进行识别，构建虚拟场景；

在虚拟场景中插入虚拟形象并单向显示，接收社交端的确认信息后，开启数据传输端口；所述数据传输端口用于将含有虚拟形象的虚拟场景向其他社交端发送；

实时记录含有虚拟形象的虚拟场景的特征值，根据所述特征值控制所述数据传输端口；控制方式包括开启和关闭。

作为本发明进一步的方案：所述基于所述摄像头管理权限实时获取社交视频，对所述社交视频进行识别，构建虚拟场景的步骤包括：

基于所述摄像头管理权限打开摄像头，基于摄像头的采集参数实时获取社交视频；所述采集参数含有调节端口，所述调节端口用于接收用户输入的调节指令；

对所述社交视频进行数据抽取，得到图像集；

依次计算图像集中各图像的清晰度，将所述清晰度与预设的清晰度阈值进行比对，当所述清晰度小于预设的清晰度阈值时，在图像集中删除对应图像，得到更新集；

在更新集中依次读取图像，对读取到的图像进行识别，构建虚拟场景；

其中，图像的清晰度计算过程为：

式中，为图像均值，和分别为两个方向上的像素尺寸，为点处的数值，为清晰度。

作为本发明进一步的方案：所述在更新集中依次读取图像，对读取到的图像进行识别，构建虚拟场景的步骤包括：

在更新集中依次读取图像，将所述图像转换至YCbCr空间，并提取Y分量；

遍历所述Y分量中的各个像素点，确定区域轮廓；

计算各个区域轮廓的像素均值及全局均值，根据所述全局均值对图像进行一级聚类；

比对一级聚类后的同类图像的像素均值，根据比对结果对图像进行二级聚类；

在二级聚类后的图像中选取一个图像，对选取出的图像进行修正；

将修正后的图像输入训练好的识别模型，输出识别物，根据所述识别物构建虚拟场景。

作为本发明进一步的方案：所述在二级聚类后的图像中选取一个图像，对选取出的图像进行修正的步骤包括：

对所述Y分量进行反色处理，并在预设半径下对其进行高斯模糊；

根据高斯模糊后的数值计算修正值；

对所述修正值进行逆转换，得到修正后的图像；

其中，计算修正值的过程包括：

式中，为图像修正后点的值，为原图像中点的值；为点的修正指数，为反色处理并进行高斯模糊后的点的值。

作为本发明进一步的方案：所述对所述修正值进行逆转换，得到修正后的图像的步骤包括：

式中，、和为修正后的RGB值，、和为原图像的RGB值；Y为修正值，也即，上述。

作为本发明进一步的方案：所述实时记录含有虚拟形象的虚拟场景的特征值，根据所述特征值控制所述数据传输端口的步骤包括：

遍历含有虚拟形象的虚拟场景中的像素点，根据遍历结果确定轮廓；

计算各个轮廓的像素均值，根据所述像素均值计算并记录虚拟场景的特征值；

根据时间顺序排列所述特征值，并拟合变化曲线；

根据变化曲线的导数值控制所述数据传输端口。

本发明技术方案还提供了一种基于虚拟形象的社交互动系统，所述系统包括：

权限获取模块，用于接收社交端发送的社交请求，获取社交端的摄像头管理权限；

视频获取识别模块，用于基于所述摄像头管理权限实时获取社交视频，对所述社交视频进行识别，构建虚拟场景；

端口开放模块，用于在虚拟场景中插入虚拟形象并单向显示，接收社交端的确认信息后，开启数据传输端口；所述数据传输端口用于将含有虚拟形象的虚拟场景向其他社交端发送；

端口调节模块，用于实时记录含有虚拟形象的虚拟场景的特征值，根据所述特征值控制所述数据传输端口；控制方式包括开启和关闭。

作为本发明进一步的方案：所述视频获取识别模块包括：

采集单元，用于基于所述摄像头管理权限打开摄像头，基于摄像头的采集参数实时获取社交视频；所述采集参数含有调节端口，所述调节端口用于接收用户输入的调节指令；

数据抽取单元，用于对所述社交视频进行数据抽取，得到图像集；

图像剔除单元，用于依次计算图像集中各图像的清晰度，将所述清晰度与预设的清晰度阈值进行比对，当所述清晰度小于预设的清晰度阈值时，在图像集中删除对应图像，得到更新集；

识别构建单元，用于在更新集中依次读取图像，对读取到的图像进行识别，构建虚拟场景；

其中，图像的清晰度计算过程为：

作为本发明进一步的方案：所述识别构建单元包括：

提取子单元，用于在更新集中依次读取图像，将所述图像转换至YCbCr空间，并提取Y分量；

遍历子单元，用于遍历所述Y分量中的各个像素点，确定区域轮廓；

第一聚类子单元，用于计算各个区域轮廓的像素均值及全局均值，根据所述全局均值对图像进行一级聚类；

第二聚类子单元，用于比对一级聚类后的同类图像的像素均值，根据比对结果对图像进行二级聚类；

修正子单元，用于在二级聚类后的图像中选取一个图像，对选取出的图像进行修正；

执行子单元，用于将修正后的图像输入训练好的识别模型，输出识别物，根据所述识别物构建虚拟场景。

作为本发明进一步的方案：所述端口调节模块包括：

轮廓识别单元，用于遍历含有虚拟形象的虚拟场景中的像素点，根据遍历结果确定轮廓；

记录单元，用于计算各个轮廓的像素均值，根据所述像素均值计算并记录虚拟场景的特征值；

拟合单元，用于根据时间顺序排列所述特征值，并拟合变化曲线；

控制单元，用于根据变化曲线的导数值控制所述数据传输端口。

与现有技术相比，本发明的有益效果是：本发明对社交视频进行识别，提取少量的图像进行识别，构建虚拟形象的同时，构建虚拟场景，在计算量较少的前提下，提高了虚拟形象社交过程的信息量，此外，实时记录变化情况，根据变化情况判断是否存在突变，在遇到突发情况时，由用户选择是否公开，鲁棒性较高。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例。

图1为基于虚拟形象的社交互动方法的流程框图。

图2为步骤S200的流程框图。

图3为步骤S400的流程框图。

图4为基于虚拟形象的社交互动系统的组成结构框图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1为基于虚拟形象的社交互动方法的流程框图，本发明实施例中，一种基于虚拟形象的社交互动方法，所述方法包括：

步骤S100：接收社交端发送的社交请求，获取社交端的摄像头管理权限；

社交端是用户的个人电子设备，包括智能手机和个人电脑等，它需要具备图像获取功能，用于采集用户的当前场景，在此基础上，它还需要具备数据处理功能和数据传输功能，用于对采集到的当前场景进行识别，并创建含有虚拟形象的虚拟场景。

一个用户对应一个社交端，社交端用于与用户交互，接收到用户发送的社交请求时，将社交请求转移至数据处理中心，用户发送社交请求意味着他想与另一个社交端建立联系，一旦连接建立，那么另一个社交端即可观看到用户的视频，此时，再创建虚拟场景和虚拟形象会存在一定的信息泄露，比如，在连接建立后，虚拟场景和虚拟形象创建完成前的这一段时间内，另一个社交端观看到的是用户的实际视频，因此，创建虚拟场景和虚拟形象的步骤应该在连接建立之前。

接收到社交端发送的社交请求后，需要获取社交端的摄像头管理权限，只有获取到摄像头管理权限后才能够进行后续步骤。

步骤S200：基于所述摄像头管理权限实时获取社交视频，对所述社交视频进行识别，构建虚拟场景；

基于摄像头管理权限获取社交视频，获取过程是实时获取过程，其获取频率一般较高，比如一秒内获取24帧图像；对所述社交视频中的视觉信息进行识别，可以构建虚拟场景；在本发明技术方案中，不对音频进行分析。

步骤S300：在虚拟场景中插入虚拟形象并单向显示，接收社交端的确认信息后，开启数据传输端口；所述数据传输端口用于将含有虚拟形象的虚拟场景向其他社交端发送；

虚拟场景创建完成后，基于获取到的人像创建虚拟形象，将虚拟形象插入虚拟场景并显示，接收用户输入调节信息，对虚拟形象和虚拟场景进行修正直至用户满意，其中，当接收到社交端的确认信息时，意味着用户满意；此时，开启数据传输端口，含有虚拟形象的虚拟场景可以向其他社交端发送，这一过程的含义是创建连接通道。

需要说明的是，关于虚拟形象的创建过程，现有的很多自拍App都有类似功能，比如“漫画脸”特效，借鉴该功能，即可完成虚拟形象的创建过程。

步骤S400：实时记录含有虚拟形象的虚拟场景的特征值，根据所述特征值控制所述数据传输端口；控制方式包括开启和关闭；

在上述内容的基础上，计算含有虚拟形象的虚拟场景的特征值，对特征值进行识别，可以快速地判定是否存在波动时刻，波动时刻指的是含有虚拟形象的虚拟场景发生了突变。

图2为步骤S200的流程框图，所述基于所述摄像头管理权限实时获取社交视频，对所述社交视频进行识别，构建虚拟场景的步骤包括：

步骤S201：基于所述摄像头管理权限打开摄像头，基于摄像头的采集参数实时获取社交视频；所述采集参数含有调节端口，所述调节端口用于接收用户输入的调节指令；

步骤S201是摄像头的基础功能，由摄像头管理权限可以对摄像头的采集过程进行调节，用以获取不同清晰度的视频；但是在大部分场景下，采集参数采用默认值即可，用户也不会对其进行调节。

步骤S202：对所述社交视频进行数据抽取，得到图像集；

剔除社交视频中的音频信息，保留图像信息，得到图像集。

步骤S203：依次计算图像集中各图像的清晰度，将所述清晰度与预设的清晰度阈值进行比对，当所述清晰度小于预设的清晰度阈值时，在图像集中删除对应图像，得到更新集；

由上述内容可以得知，图像集中的图像数量极多，每一秒都会对应多个图像，这些图像之间的重复率较高，因此，需要对图像集中的图像进行选取；最先选取的依据是图像清晰度，在拍摄视频的过程中，电子设备不断运动（智能手机），获取到的图像的清晰度有可能会非常低，此时，该图像不具备分析价值，需要剔除；剔除图像后的图像集称为更新集。

步骤S204：在更新集中依次读取图像，对读取到的图像进行识别，构建虚拟场景；

在更新集中依次读取图像，并对图像进行识别，可以构建虚拟场景。

值得一提的是，上述内容中的图像的清晰度计算过程为：

需要说明的是的含义，它可以是单独的R值、G值和B值，也可以是由R值、G 值和B值确定的单一数值，比如灰度值。

作为本发明技术方案的一个优选实施例，对所述步骤S204进行了具体的限定，所述在更新集中依次读取图像，对读取到的图像进行识别，构建虚拟场景的步骤包括：

遍历所述Y分量中的各个像素点，确定区域轮廓；

上述内容对虚拟场景的构建过程进行了具体的描述，首先，在更新集里读取图像，该图像由摄像头获取得到，为RGB图像，RGB图像有三个参数，不易分析，因此，将RGB图像转换至YCbCr空间后，提取Y分量，并对Y分量进行单独处理；其中，Y是指亮度分量，Cb指蓝色色度分量，而Cr指红色色度分量。

然后，遍历Y分量中的各个像素点，根据相邻像素点的色值关系可以确定不同区域的轮廓，称为区域轮廓；计算每个区域轮廓中色值的均值，得到各个区域轮廓的像素均值；计算所有像素均值的均值，得到全局均值。

最后，根据全局均值对图像进行一级聚类，再根据像素均值对图像进行二级聚类，此时，可以将相似的图像归为一类，在此基础上，依次在各类图像中选取一个图像，从而对更新集进行进一步的简化。

当选取到图像后，对图像进行修正，降低环境对图像的影响后，输入训练好的识别模型，得到识别物，读取识别物的理论模型，构建虚拟场景即可；其中，所述识别模型采用现有识物服务即可，所述识物服务在购物平台中非常常见。

在本发明技术方案的一个实例中，对图像的修正过程进行了限定，所述在二级聚类后的图像中选取一个图像，对选取出的图像进行修正的步骤包括：

根据高斯模糊后的数值计算修正值；

对所述修正值进行逆转换，得到修正后的图像。

其中，计算修正值的过程包括：

作为本发明技术方案的一个优选实施例，所述对所述修正值进行逆转换，得到修正后的图像的步骤包括：

关于上述图像处理内容，其目的是降低图像的环境影响，提高图像的细节度；具体的：

如果mask的值大于128，说明那个点是个暗像素同时周边也是暗像素，因此γ值需要小于0以便将其增亮，mask值小于128，对应的说明当前点是个较亮的像素，且周边像素也较亮，mask值为128则不产生任何变化，同时，mask值离128越远，校正的量就越大。

进一步的，由于现有的图像具有三个色值参数，在处理时需要对三个色值参数进行独立处理，再进行融合，这极大地提高了计算量，在本发明技术方案中，提供了一种解决方案，也即：将图像转换到YCbCr空间，然后只处理亮度通道，最后在转换到RGB空间，这一过程在保证处理效果的同时，极大地简化了计算过程。

实际上，如果对三个色值参数进行独立处理有可能会导致严重偏色，而只处理Y分量却不会，这也是其中一个优点。

图3为步骤S400的流程框图，所述实时记录含有虚拟形象的虚拟场景的特征值，根据所述特征值控制所述数据传输端口的步骤包括：

步骤S401：遍历含有虚拟形象的虚拟场景中的像素点，根据遍历结果确定轮廓；

步骤S402：计算各个轮廓的像素均值，根据所述像素均值计算并记录虚拟场景的特征值；

步骤S403：根据时间顺序排列所述特征值，并拟合变化曲线；

步骤S404：根据变化曲线的导数值控制所述数据传输端口。

在本发明技术方案的一个实例中，对数据传输端口的控制过程进行了限定，由于在上述内容中存在轮廓识别过程（步骤S204的限定部分），因此，步骤S400采用相似的计算过程计算特征值，这样可以简化程序设计过程；其中，所述特征值可以采用上述的“全局均值”，也即，计算所有像素均值的均值，也可以基于像素均值的分布情况确定新的形式，比如，组成矩阵，计算行列式；具体由工作人员限定。

排列所有特征值，连接并拟合坐标，可以得到一条变化曲线，对所述变化曲线进行求导，将求得的导数与预设的导数阈值进行比对，当求得的导数达到预设的导数阈值时，就说明特征值发生了突变，这意味着视频本身发生了突变，此时，需要将数据传输端口短暂关闭，由用户判断是否再次开启；这么做的好处是，虚拟形象具有隐藏身份的功能，如果因为角度或者其他原因暴露了真实信息，可能会造成意料之外的后果。

图4为基于虚拟形象的社交互动系统的组成结构框图，本发明实施例中，一种基于虚拟形象的社交互动系统，所述系统10包括：

权限获取模块11，用于接收社交端发送的社交请求，获取社交端的摄像头管理权限；

视频获取识别模块12，用于基于所述摄像头管理权限实时获取社交视频，对所述社交视频进行识别，构建虚拟场景；

端口开放模块13，用于在虚拟场景中插入虚拟形象并单向显示，接收社交端的确认信息后，开启数据传输端口；所述数据传输端口用于将含有虚拟形象的虚拟场景向其他社交端发送；

端口调节模块14，用于实时记录含有虚拟形象的虚拟场景的特征值，根据所述特征值控制所述数据传输端口；控制方式包括开启和关闭。

进一步的，所述视频获取识别模块12包括：

其中，图像的清晰度计算过程为：

具体的，所述识别构建单元包括：

更进一步的，所述端口调节模块14包括：

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于虚拟形象的社交互动方法，其特征在于，所述方法包括：

实时记录含有虚拟形象的虚拟场景的特征值，根据所述特征值控制所述数据传输端口；控制方式包括开启和关闭；

所述基于所述摄像头管理权限实时获取社交视频，对所述社交视频进行识别，构建虚拟场景的步骤包括：

对所述社交视频进行数据抽取，得到图像集；

其中，图像的清晰度计算过程为：

式中，为图像均值，/>和/>分别为两个方向上的像素尺寸，/>为点/>处的数值，/>为清晰度；

所述在更新集中依次读取图像，对读取到的图像进行识别，构建虚拟场景的步骤包括：

遍历所述Y分量中的各个像素点，确定区域轮廓；

2.根据权利要求1所述的基于虚拟形象的社交互动方法，其特征在于，所述在二级聚类后的图像中选取一个图像，对选取出的图像进行修正的步骤包括：

根据高斯模糊后的数值计算修正值；

对所述修正值进行逆转换，得到修正后的图像；

其中，计算修正值的过程包括：

式中，为图像修正后点/>的值，/>为原图像中点/>的值；/>为点的修正指数，/>为反色处理并进行高斯模糊后的点/>的值。

3.根据权利要求2所述的基于虚拟形象的社交互动方法，其特征在于，所述对所述修正值进行逆转换，得到修正后的图像的步骤包括：

式中，、/>和/>为修正后的RGB值，/>、/>和/>为原图像的RGB值；Y为修正值，也即，上述/>。

4.根据权利要求1所述的基于虚拟形象的社交互动方法，其特征在于，所述实时记录含有虚拟形象的虚拟场景的特征值，根据所述特征值控制所述数据传输端口的步骤包括：

根据时间顺序排列所述特征值，并拟合变化曲线；

根据变化曲线的导数值控制所述数据传输端口。

5.一种基于虚拟形象的社交互动系统，其特征在于，所述系统包括：

端口调节模块，用于实时记录含有虚拟形象的虚拟场景的特征值，根据所述特征值控制所述数据传输端口；控制方式包括开启和关闭；

所述视频获取识别模块包括：

其中，图像的清晰度计算过程为：

所述识别构建单元包括：

6.根据权利要求5所述的基于虚拟形象的社交互动系统，其特征在于，所述端口调节模块包括：