CN114500912B

CN114500912B - 通话处理方法、电子设备以及存储介质

Info

Publication number: CN114500912B
Application number: CN202210167860.9A
Authority: CN
Inventors: 姚涔
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2022-02-23
Filing date: 2022-02-23
Publication date: 2023-10-24
Anticipated expiration: 2042-02-23
Also published as: CN114500912A

Abstract

本发明提供了一种通话处理方法、电子设备以及存储介质，通话处理方法包括：响应于通话事件的发生，确定所述通话事件的通话类型；确定所述通话类型为视频类型，获取所述通话事件中的视频信息；根据所述视频信息确定视频质量，确定所述通话事件以与视频质量对应的呈现方式进行响应；其中，确定所述视频质量处于第一质量等级，提取通话事件中的人物的形象特征并生成虚拟形象，使所述通话事件以所述虚拟形象的呈现方式进行响应。上述方法能够在视频通话的场景下，根据视频质量来调控通话事件的呈现方式，改善用户使用体验。

Description

通话处理方法、电子设备以及存储介质

技术领域

本发明涉及通话处理技术，尤其涉及一种通话处理方法、电子设备以及存储介质。

背景技术

随着网络技术的发展以及人们工作、学习的流动性的增加，企业及个人对视频通讯的需求也越来越多，视频会议系统应运而生。尤其是在用户不方面直接当面交流的场景下，视频电话、视频会议以及在线授课等通话方式均是目前用户常采用的沟通方式。而视频电话、视频会议以及在线授课等通话方式常因网络异常、网络不佳等问题导致影响通话的情况出现，从而使得用户呼叫失败而无法进行视频通话或无法实现在线授课。

发明内容

针对现有技术中存在的上述技术问题，本发明提供了一种通话处理方法、电子设备以及存储介质，其能够在视频通话的场景下根据视频质量来调控通话事件的呈现方式，改善用户使用体验。

本发明实施例提供了一种通话处理方法，包括：

响应于通话事件的发生，确定所述通话事件的通话类型；

确定所述通话类型为视频类型，获取所述通话事件中的视频信息；

根据所述视频信息确定视频质量，确定所述通话事件以与视频质量对应的呈现方式进行响应；其中，

确定所述视频质量处于第一质量等级，提取通话事件中的人物的形象特征并生成虚拟形象，使所述通话事件以所述虚拟形象的呈现方式进行响应。

在一些实施例中，所述方法还包括：

确定所述通话类型为语音类型，获取所述通话事件中的音频信息；

在所述音频信息中提取音频内容以及与通话事件中的人物对应的人物特征；

基于所述人物特征和所述音频内容生成虚拟视频对象。

在一些实施例中，所述方法还包括：

确定所述视频质量处于第二质量等级，提取所述视频信息中的关键像素点；其中，所述第二质量等级高于第一质量等级；

根据所提取的所述关键像素点生成像素视频对象，使所述通话事件以所述像素视频对象的呈现方式进行响应。

在一些实施例中，所述方法还包括：

确定所述视频质量处于第三质量等级，以及所述视频信息中包含有预设对象，将所述通话事件中的视频信息和音频信息直接进行传输；其中，所述第三质量等级高于第二质量等级。

在一些实施例中，所述确定所述视频质量处于第三质量等级之后，所述方法还包括：

确定所述视频信息中不包含有预设对象，调用预存的与所述预设对象对应的图像信息；

将所述通话事件以所述图像信息中的预设对象与所述通话时间中的音频信息相结合的呈现方式进行响应。

在一些实施例中，确定所述视频质量处于第一质量等级之后，所述方法还包括：

确定无法提取通话事件中的人物的形象特征，根据所述通话事件中的音频信息来生成虚拟视频对象。

在一些实施例中，确定所述通话类型为视频类型之后，所述方法还包括：

调整所述通话事件中的音频信息的传输等级高于视频信息的传输等级，以优先传输所述音频信息。

在一些实施例中，所述人物特征至少包括以下一种或多种特征：情绪特征、口型特征以及表情特征。

本发明实施例还提供了一种电子设备，电子设备包括响应模块、获取模块以及确定模块。响应模块配置为响应于通话事件的发生，确定所述通话事件的通话类型。获取模块配置为确定所述通话类型为视频类型，获取所述通话事件中的视频信息。确定模块配置为根据所述视频信息确定视频质量，确定所述通话事件以与视频质量对应的呈现方式进行响应；其中，确定所述视频质量处于第一质量等级，提取通话事件中的人物的形象特征并生成虚拟形象，使所述通话事件以所述虚拟形象的呈现方式进行响应。

本发明实施例还提供了一种存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现上述的通话处理方法的步骤。

与现有技术相比，本发明实施例的有益效果在于：本发明在确定通话类型为视频类型后，通过获取通话事件中的视频信息以及对视频信息的视频质量的确定，能够通话事件以与视频质量对应的呈现方式进行响应，即针对不同的视频质量以不同的呈现方式进行响应，而非是采用固定不变的呈现方式，实现了根据不同视频质量灵活地为用户提供不同的呈现方式，尤其是在视频质量处于第一质量等级时能够结合人物的形象特征生成虚拟形象，从而在视频质量不佳的情况下，用虚拟形象代替真实的视频内容，既减小了传输负载保证了音频信息的呈现连续性，还能够增添视频通话的亲近感，解决了视频通话时无法保证通话质量的问题，达到了保证通话质量的效果的目的。

附图说明

在不一定按比例绘制的附图中，相同的附图标记可以在不同的视图中描述相似的部件。具有字母后缀或不同字母后缀的相同附图标记可以表示相似部件的不同实例。附图大体上通过举例而不是限制的方式示出各种实施例，并且与说明书以及权利要求书一起用于对所公开的实施例进行说明。在适当的时候，在所有附图中使用相同的附图标记指代同一或相似的部分。这样的实施例是例证性的，而并非旨在作为本装置或方法的穷尽或排他实施例。

图1为本发明实施例通话处理方法的第一流程图；

图2为本发明实施例通话处理方法的第二流程图；

图3为本发明实施例通话处理方法的第三流程图；

图4为本发明实施例电子设备的结构框图。

图中的附图标记所表示的构件：

110-电子设备；101-响应模块；102-获取模块；103-确定模块。

具体实施方式

此处参考附图描述本发明的各种方案以及特征。

应理解的是，可以对此处发明的实施例做出各种修改。因此，上述说明书不应该视为限制，而仅是作为实施例的范例。本领域的技术人员将想到在本发明的范围和精神内的其他修改。

包含在说明书中并构成说明书的一部分的附图示出了本发明的实施例，并且与上面给出的对本发明的大致描述以及下面给出的对实施例的详细描述一起用于解释本发明的原理。

通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述，本发明的这些和其它特性将会变得显而易见。

还应当理解，尽管已经参照一些具体实例对本发明进行了描述，但本领域技术人员能够确定地实现本发明的很多其它等效形式。

当结合附图时，鉴于以下详细说明，本发明的上述和其他方面、特征和优势将变得更为显而易见。

此后参照附图描述本发明的具体实施例；然而，应当理解，所发明的实施例仅仅是本发明的实例，其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本发明模糊不清。因此，本文所发明的具体的结构性和功能性细节并非意在限定，而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本发明。

本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”，其均可指代根据本发明的相同或不同实施例中的一个或多个。

本发明实施例提供了一种通话处理方法，该通话处理方法可应用于具有通话功能的电子设备上，也可应用于具有通话功能的软件程序上，其中，电子设备可为笔记本电脑、平板电脑、智能手机等。如图1所示，通话处理方法包括步骤S101至步骤S103。

步骤S101：响应于通话事件的发生，确定所述通话事件的通话类型。

步骤S102：确定所述通话类型为视频类型，获取所述通话事件中的视频信息。

步骤S103：根据所述视频信息确定视频质量，确定所述通话事件以与视频质量对应的呈现方式进行响应；其中，确定所述视频质量处于第一质量等级，提取通话事件中的人物的形象特征并生成虚拟形象，使所述通话事件以所述虚拟形象的呈现方式进行响应。

具体地，上述通话事件的通话类型可至少包括语音类型、视频类型等。在通话类型为视频类型的情况下，通话事件中不仅包含视频信息，还可选择性地包含语音信息，如视频会议的情况下，存在一类用户需要开启语音功能的情况，针对该类用户对应的通话事件是包含语音信息的，当然也存在另外一类用户无需开启语音对应功能的情况，针对该类用户对应的通话事件是不包含语音信息的。

具体地，上述视频信息的视频质量可按等级划分为多个，且视频质量的等级划分可与网络环境有关，在其他一些实施例中，视频信息的视频质量也可是设定的，该设定可由用户手动设定，也可由电子设备根据当前网络流量的规划来动态调控设定，如电子设备当前除视频通话外，其他程序对网络流量的需求较大，此时可根据对网络流量的规划来调控视频质量，而保证电子设备上各个程序对网络流程的需求能够得到合理规划。

具体地，可预先设定通话事件的呈现方式和视频质量的映射关系表，视频质量处于不同质量等级的情况下，通话事件可以以不同的呈现方式进行响应，如视频质量越低则呈现方式所占用的流量越少，视频质量越高则呈现方式所占用的流量越多。该映射关系表中还可包含网络环境信息，网络环境信息中的视频通话下的实时网络流量可与视频质量和呈现方式具有关联关系，如所处的网络环境中的实时网络流量越少，则视频质量越低以及呈现方式所占用的流量越少；所处的网络环境中的实时网络流量越多，视频质量越高则呈现方式所占用的流量越多。

具体地，上述第一质量等级可理解为视频质量较差所对应的等级，在视频质量处于第一质量等级的情况下，提取通话事件中的人物的形象特征，该形象特征可理解为与人物面貌特征、穿衣特征等，将形象特征虚拟化生成虚拟形象后能够减小对网络流量的占用，从而保障视频通话的连续性，避免因为网路环境不佳引起的卡顿情况。另外，在去顶视频质量处于第一质量等级的情况下，还可提取通话事件中的视频背景信息，将视频背景信息虚拟化生成虚拟背景，或直接对视频背景信息进行虚化处理，以降低所要传输的视频信息所需的网络流量，进一步提高视频通话的连续性。

本发明在确定通话类型为视频类型后，通过获取通话事件中的视频信息以及对视频信息的视频质量的确定，能够通话事件以与视频质量对应的呈现方式进行响应，即针对不同的视频质量以不同的呈现方式进行响应，而非是采用固定不变的呈现方式，实现了根据不同视频质量灵活地为用户提供不同的呈现方式，尤其是在视频质量处于第一质量等级时能够结合人物的形象特征生成虚拟形象，从而在视频质量不佳的情况下，用虚拟形象代替真实的视频内容，既减小了传输负载保证了音频信息的呈现连续性，还能够增添视频通话的亲近感，解决了视频通话时无法保证通话质量的问题，达到了保证通话质量的效果的目的。

在一些实施例中，如图2所示，所述方法还包括步骤S201至步骤S203。

步骤S201：确定所述通话类型为语音类型，获取所述通话事件中的音频信息。

步骤S202：在所述音频信息中提取音频内容以及与通话事件中的人物对应的人物特征。

步骤S203：基于所述人物特征和所述音频内容生成虚拟视频对象。

具体地，在通话类型为语音类型的情况下，通话事件中仅包含音频信息，该音频信息的音频质量可划分为多个等级，其等级划分可与网络环境有关，如网络环境越差则音频质量的等级越低。

进一步地，该音频信息的呈现方式也可与音频质量具有关联关系，在音频质量处于低等级的情况下，由于音频信息的连续性可能会受到影响，可将音频信息中的音频内容转化为文字，使音频信息以文字的呈现方式进行相应，使得用户能够获取到连续且完整的音频信息；在音频质量处于高等级的情况下，可将音频信息直接呈现出来，从而使用户直接获取到音频信息，并且，在音频质量处于高等级的情况下，则提取上述音频内容以及人物特征，将音频内容和人物特征相结合生成虚拟视频，使得用户不仅能够通过听的方式来沟通，还能够通过虚拟视频的呈现来增添用户的参与感，改善用户体验。

在一些实施例中，所述人物特征至少包括以下一种或多种特征：情绪特征、口型特征以及表情特征。具体地，可通过电子设备的摄像头来采集用户的人物特征，当然可也通过摄像头来采集用户的穿衣特征或其语音通话时的背景特征，将上述人物特征、穿衣特征及背景特征中的至少一个特征进行虚拟化来生成虚拟视频。

在一些实施例中，如图3所示，所述方法还包括：

确定所述视频质量处于第二质量等级，提取所述视频信息中的关键像素点；其中，所述第二质量等级高于第一质量等级。

具体地，上述像素视频对象可理解为较虚拟形象的传输会占用更多的网络流量的视频对象，其所呈现的内容的真实性也比虚拟形象要高，因此能够给用户带来更好的通话效果。

具体地，上述视频质量所处第二质量等级可根据当前网络环境来设定，也可由用户手动设定，本申请对此不做具体限定，在确定视频质量处于第二质量等级后，使通话时间以像素视频对应的呈现方式进行响应即可。

在一些实施例中，如图3所示，所述方法还包括：确定所述视频质量处于第三质量等级，以及所述视频信息中包含有预设对象，将所述通话事件中的视频信息和音频信息直接进行传输；其中，所述第三质量等级高于第二质量等级。

具体地，上述预设对象可至少包括人物对象、物体对象中的至少一个，例如，上述预设对象为预设好的视频会议中的主讲人，在确定视频质量处于第三质量等级，且预设的主讲人也处于视频信息中，则将该通话事件中的视频信息和音频信息直接进行传输，此时，该视频信息和音频信息能够实时且确保连续的进行传输，有效地保证了通话质量。

在一些其他实施例中，如图3所示，所述确定所述视频质量处于第三质量等级之后，所述方法可还包括：在视频信息中不包含有预设对象的情况下，判断是否预存有与预设对象对此应的图像信息；若否，则仅传输通话时间中的音频信息。

在一些实施例中，如图3所示，所述确定所述视频质量处于第三质量等级之后，所述方法还包括：

在一些其他实施例中，在响应通话事件后，可预先存储视频信息中包含有预设对象的图像信息，该图像信息至少包括预设对象处于不同状态下的信息，如在预设对象为视频会议中的主讲人的情况下，可存储视频信息中包含该主讲人不同表情、不同姿势等不同状态下的信息。

上述图像信息也可为预先存储在电子设备的某一地址内，该图像信息可根据与视频事件相关的会议内容、发起者等信息来对应存储在上述地址内。

具体地，在预先存储好预设对象后，在确定视频信息中不包含预设对象的情况下，调用之前预存好的与预设对象对应的图像信息，提取音频信息中的音频内容，根据音频内容确定预设对象的表情特征，如音频内容表征预设对象处于高兴的情绪下的表情特征，或音频内容表征预设对象处于悲伤的情绪下的表情特征。基于所确定的表情特征可以在预存好的多个图像信息中确定与该表情特征对应的至少一个图像，将该图像与实时的音频信息相结合来进行呈现，实现保证所呈现的内容的连续性和生动性。

在一些实施例中，如图3所示，确定所述视频质量处于第一质量等级之后，所述方法还包括：确定无法提取通话事件中的人物的形象特征，根据所述通话事件中的音频信息来生成虚拟视频对象。

具体地，在确定无法提取通话事件中的人物的形象特征的情况下，表明当前视频通话所处的网络环境较差，根本无法传输通话事件中的人物的形象特征，此时，可根据获取到的音频信息，以及提取音频信息中的人物特征来生成虚拟视频对象，提高互动性以及增加亲近感。其中，人物特征至少包括以下一种或多种特征：情绪特征、口型特征以及表情特征。

在一些实施例中，如图3所示，确定所述通话类型为视频类型之后，所述方法还包括：调整所述通话事件中的音频信息的传输等级高于视频信息的传输等级，以优先传输所述音频信息，使得在网络环境较差的情况下，至少用户可以获取到完整且连续的音频信息，确定语音上交流的顺畅性。

本发明实施例还提供了一种电子设备110，如图4所示，电子设备110包括响应模块101、获取模块102以及确定模块103。响应模块101配置为响应于通话事件的发生，确定所述通话事件的通话类型。获取模块102配置为确定所述通话类型为视频类型，获取所述通话事件中的视频信息。确定模块103配置为根据所述视频信息确定视频质量，确定所述通话事件以与视频质量对应的呈现方式进行响应；其中，确定所述视频质量处于第一质量等级，提取通话事件中的人物的形象特征并生成虚拟形象，使所述通话事件以所述虚拟形象的呈现方式进行响应。

具体地，上述视频信息的视频质量可按等级划分为多个，且视频质量的等级划分可与网络环境有关，在其他一些实施例中，视频信息的视频质量也可是设定的，该设定可由用户手动设定，也可由电子设备110根据当前网络流量的规划来动态调控设定，如电子设备110当前除视频通话外，其他程序对网络流量的需求较大，此时可根据对网络流量的规划来调控视频质量，而保证电子设备110上各个程序对网络流程的需求能够得到合理规划。

在一些实施例中，所述确定模块103还配置为：确定所述通话类型为语音类型，获取所述通话事件中的音频信息；在所述音频信息中提取音频内容以及与通话事件中的人物对应的人物特征；基于所述人物特征和所述音频内容生成虚拟视频对象。

在一些实施例中，所述确定模块103还配置为：确定所述视频质量处于第二质量等级，提取所述视频信息中的关键像素点；其中，所述第二质量等级高于第一质量等级；根据所提取的所述关键像素点生成像素视频对象，使所述通话事件以所述像素视频对象的呈现方式进行响应。

在一些实施例中，所述确定模块103还配置为：确定所述视频质量处于第三质量等级，以及所述视频信息中包含有预设对象，将所述通话事件中的视频信息和音频信息直接进行传输；其中，所述第三质量等级高于第二质量等级。

在一些实施例中，所述确定所述视频质量处于第三质量等级之后，所述确定模块103还配置为：确定所述视频信息中不包含有预设对象，调用预存的与所述预设对象对应的图像信息；将所述通话事件以所述图像信息中的预设对象与所述通话时间中的音频信息相结合的呈现方式进行响应。

在一些实施例中，确定所述视频质量处于第一质量等级之后，所述确定模块103还配置为：确定无法提取通话事件中的人物的形象特征，根据所述通话事件中的音频信息来生成虚拟视频对象。

在一些实施例中，确定所述通话类型为视频类型之后，所述确定模块103还配置为：调整所述通话事件中的音频信息的传输等级高于视频信息的传输等级，以优先传输所述音频信息。

在一些实施例中，所述人物特征至少包括一下一种或多种特征：情绪特征、口型特征以及表情特征。

本申请的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的系统中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。另外，本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

此外，尽管已经在本文中描述了示例性实施例，其范围包括任何和所有基于本申请的具有等同元件、修改、省略、组合(例如，各种实施例交叉的方案)、改编或改变的实施例。权利要求书中的元件将被基于权利要求中采用的语言宽泛地解释，并不限于在本说明书中或本申请的实施期间所描述的示例，其示例将被解释为非排他性的。因此，本说明书和示例旨在仅被认为是示例，真正的范围和精神由以下权利要求以及其等同物的全部范围所指示。

以上描述旨在是说明性的而不是限制性的。例如，上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外，在上述具体实施方式中，各种特征可以被分组在一起以简单化本申请。这不应解释为一种不要求保护的公开的特征对于任一权利要求是必要的意图。相反，本申请的主题可以少于特定的公开的实施例的全部特征。从而，以下权利要求书作为示例或实施例在此并入具体实施方式中，其中每个权利要求独立地作为单独的实施例，并且考虑这些实施例可以以各种组合或排列彼此组合。本申请的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。

以上实施例仅为本申请的示例性实施例，不用于限制本申请，本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内，对本申请做出各种修改或等同替换，这种修改或等同替换也应视为落在本申请的保护范围内。

Claims

1.一种通话处理方法，其特征在于，包括：

响应于通话事件的发生，确定所述通话事件的通话类型；

确定所述视频质量处于第一质量等级，提取通话事件中的人物的形象特征并生成虚拟形象，使所述通话事件以所述虚拟形象的呈现方式进行响应；

确定所述视频质量处于第三质量等级，以及所述视频信息中包含有预设对象，将所述通话事件中的视频信息和音频信息直接进行传输；其中，所述第三质量等级高于第一质量等级；

在所述确定所述视频质量处于第三质量等级之后，确定所述视频信息中不包含有预设对象，调用预存的与所述预设对象对应的图像信息，提取音频信息中的音频内容，根据音频内容确定预设对象的表情特征，基于所确定的表情特征在预存好的多个图像信息中确定与该表情特征对应的至少一个图像；

将该图像与所述通话事件中的音频信息相结合的呈现方式进行响应。

2.根据权利要求1所述的通话处理方法，其特征在于，所述方法还包括：

基于所述人物特征和所述音频内容生成虚拟视频对象。

3.根据权利要求1所述的通话处理方法，其特征在于，所述方法还包括：

确定所述视频质量处于第二质量等级，提取所述视频信息中的关键像素点；其中，所述第二质量等级高于第一质量等级，且低于所述第三质量等级；

4.根据权利要求1所述的通话处理方法，其特征在于，确定所述视频质量处于第一质量等级之后，所述方法还包括：

5.根据权利要求1所述的通话处理方法，其特征在于，确定所述通话类型为视频类型之后，所述方法还包括：

6.根据权利要求2所述的通话处理方法，其特征在于，所述人物特征至少包括以下一种或多种特征：情绪特征、口型特征以及表情特征。

7.一种电子设备，其特征在于，包括：

响应模块，其配置为响应于通话事件的发生，确定所述通话事件的通话类型；

获取模块，其配置为确定所述通话类型为视频类型，获取所述通话事件中的视频信息；

确定模块，其配置为根据所述视频信息确定视频质量，确定所述通话事件以与视频质量对应的呈现方式进行响应；其中，

8.一种存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的通话处理方法的步骤。