CN110012257A - 通话方法、装置及终端 - Google Patents

通话方法、装置及终端 Download PDF

Info

Publication number
CN110012257A
CN110012257A CN201910129715.XA CN201910129715A CN110012257A CN 110012257 A CN110012257 A CN 110012257A CN 201910129715 A CN201910129715 A CN 201910129715A CN 110012257 A CN110012257 A CN 110012257A
Authority
CN
China
Prior art keywords
terminal
dimensional
head portrait
user
call
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910129715.XA
Other languages
English (en)
Inventor
林成龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910129715.XA priority Critical patent/CN110012257A/zh
Publication of CN110012257A publication Critical patent/CN110012257A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B35/00Stereoscopic photography
    • G03B35/18Stereoscopic photography by simultaneous viewing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone

Abstract

本发明实施例提供一种通话方法、装置及终端,应用于第一终端,获取通话指令,所述通话指令用于指示建立所述第一终端与第二终端之间的通话连接,所述通话指令中包括所述第二终端对应的用户的标识;根据所述第二终端对应的用户的标识,获取所述第二终端对应的用户的三维虚拟头像;在所述第一终端与所述第二终端之间建立通话连接之后,对所述三维虚拟头像进行三维的投影显示;由于三维虚拟头像为立体的,看起来更接近于真实的人,因此,与现有技术中用户仅能看到通话对象的二维影像相比,本实施例中用户能够看到通话对象的三维虚拟头像,使得用户体会到面对面交流的感觉,从而增加通话的真实感,提升用户通话体验。

Description

通话方法、装置及终端
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种通话方法、装置及终端。
背景技术
随着网络通话工具的发展,人们已经越来越多的使用视频通话。视频通话是一种基于互联网和移动互联网在终端之间实时传送通话双方的语音和图像的一种通信方式。用户在进行视频通话时,除了能够听到对方的语音,还能够通过终端屏幕看到对方的影像,从而提升了通话双方的交流体验。
现有技术中的视频通话,虽然通话双方可以通过终端屏幕观看到对方的影像,但是,用户在视频通话过程中的真实感不足,不能体会到面对面交流的感觉。
发明内容
本发明实施例提供一种通话方法、装置及终端,能够使得用户在通话过程中体会到面对面交流的感觉,提高通话过程的真实感。
第一方面,本发明实施例提供一种通话方法,应用于第一终端,包括:
获取通话指令,所述通话指令用于指示建立所述第一终端与第二终端之间的通话连接,所述通话指令中包括所述第二终端对应的用户的标识;
根据所述第二终端对应的用户的标识,获取所述第二终端对应的用户的三维虚拟头像;
在所述第一终端与所述第二终端之间建立通话连接之后,对所述三维虚拟头像进行三维的投影显示。
可选的,所述对所述三维虚拟头像进行三维的投影显示,包括:
采用三维全息投影技术,将所述三维虚拟头像进行三维的全息投影显示。
可选的,所述将所述三维虚拟头像进行三维的全息投影显示,包括:
在所述第一终端的屏幕上,对所述三维虚拟头像进行三维的全息投影显示;或者
在空气屏幕上,对所述三维虚拟头像进行三维的全息投影显示。
可选的,所述根据所述第二终端对应的用户的标识,获取所述第二终端对应的用户的三维虚拟头像,包括:
向服务器发送头像获取指令,所述头像获取指令中包括所述第二终端对应的用户的标识;
接收所述服务器从数据库中获取的所述第二终端对应的用户的三维虚拟头像,其中,所述数据库中存储有不同用户的标识对应的三维虚拟头像。
可选的,所述方法还包括:
根据所述第一终端对应的用户的二维图像以及所述二维图像对应的三维信息,生成所述第一终端对应的用户的头像参数,其中,所述三维信息用于指示所述二维图像中的各像素点的深度信息;
根据所述头像参数进行三维重建,生成所述第一终端对应的用户的三维虚拟头像;
向所述服务器发送头像存储指令,所述头像存储指令中包括所述第一终端对应的用户的标识以及所述第一终端对应的用户的三维虚拟头像,以使所述服务器将所述第一终端对应的用户的标识以及所述第一终端对应的用户的三维虚拟头像存储至所述数据库。
可选的,所述根据所述第一终端对应的用户的二维图像以及所述二维图像对应的三维信息,生成所述第一终端对应的用户的头像参数之前,还包括:
通过拍摄装置获取所述第一终端对应的用户的二维图像;
获取所述拍摄装置的模组参数,并根据所述模组参数,获取所述二维图像对应的三维信息。
可选的,所述对所述三维虚拟头像进行三维的投影显示,包括:
获取所述第二终端对应的用户的语音,并对所述语音进行识别,得到语音识别结果;
根据所述语音识别结果,对所述三维虚拟头像的嘴部动作进行实时调整;
对调整后的三维虚拟头像进行三维的投影显示。
第二方面,本发明实施例提供一种通话装置,应用于第一终端,包括:
第一获取模块,用于获取通话指令,所述通话指令用于指示建立所述第一终端与第二终端之间的通话连接,所述通话指令中包括所述第二终端对应的用户的标识;
第二获取模块,用于根据所述第二终端对应的用户的标识,获取所述第二终端对应的用户的三维虚拟头像;
投影模块,用于在所述第一终端与所述第二终端之间建立通话连接之后,对所述三维虚拟头像进行三维的投影显示。
可选的,所述投影模块具体用于:
采用三维全息投影技术,将所述三维虚拟头像进行三维的全息投影显示。
可选的,所述投影模块具体用于:
在所述第一终端的屏幕上,对所述三维虚拟头像进行三维的全息投影显示;或者
在空气屏幕上,对所述三维虚拟头像进行三维的全息投影显示。
可选的,所述第二获取模块具体用于:
向服务器发送头像获取指令,所述头像获取指令中包括所述第二终端对应的用户的标识;
接收所述服务器从数据库中获取的所述第二终端对应的用户的三维虚拟头像,其中,所述数据库中存储有不同用户的标识对应的三维虚拟头像。
可选的,所述装置还包括生成模块,用于:
根据所述第一终端对应的用户的二维图像以及所述二维图像对应的三维信息,生成所述第一终端对应的用户的头像参数,其中,所述三维信息用于指示所述二维图像中的各像素点的深度信息;
根据所述头像参数进行三维重建,生成所述第一终端对应的用户的三维虚拟头像;
向所述服务器发送头像存储指令,所述头像存储指令中包括所述第一终端对应的用户的标识以及所述第一终端对应的用户的三维虚拟头像,以使所述服务器将所述第一终端对应的用户的标识以及所述第一终端对应的用户的三维虚拟头像存储至所述数据库。
可选的,所述生成模块还用于:
通过拍摄装置获取所述第一终端对应的用户的二维图像;
获取所述拍摄装置的模组参数,并根据所述模组参数,获取所述二维图像对应的三维信息。
可选的,所述投影模块具体用于:
获取所述第二终端对应的用户的语音,并对所述语音进行识别,得到语音识别结果;
根据所述语音识别结果,对所述三维虚拟头像的嘴部动作进行实时调整;
对调整后的三维虚拟头像进行三维的投影显示。
第三方面,本发明实施例提供一种终端,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面任一项所述的通话方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面任一项所述的通话方法。
本发明实施例提供的通话方法、装置及终端,应用于第一终端时,获取通话指令,所述通话指令用于指示建立所述第一终端与第二终端之间的通话连接,所述通话指令中包括所述第二终端对应的用户的标识;根据所述第二终端对应的用户的标识,获取所述第二终端对应的用户的三维虚拟头像;在所述第一终端与所述第二终端之间建立通话连接之后,对所述三维虚拟头像进行三维的投影显示;由于三维虚拟头像为立体的,看起来更接近于真实的人,因此,与现有技术中用户仅能看到通话对象的二维影像相比,本实施例中用户能够看到通话对象的三维虚拟头像,使得用户体会到面对面交流的感觉,从而增加通话的真实感,提升用户通话体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所适用的场景示意图;
图2为本发明实施例提供的通话方法一种实施例的流程示意图;
图3为本发明实施例提供的通话方法另一种实施例的流程示意图。
图4为本发明实施例提供的生成并存储三维虚拟头像的方法的流程示意图;
图5为本发明实施例提供的通话方法再一种实施例的流程示意图;
图6为本发明实施例提供的通话装置一种实施例的结构示意图;
图7为本发明实施例提供的通话装置另一种实施例的结构示意图;
图8为本发明实施例提供的终端的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如前所述,现有技术中的视频通话,虽然通话双方可以通过终端屏幕观看到对方的影像,但是,用户在视频通话过程中的真实感不足,不能体会到面对面交流的感觉。
为了解决上述问题,本发明实施例提供一种通话方法、装置及终端,在通话双方进行通话的过程中,可以观看到彼此的三维虚拟头像的三维的投影显示,使通话双方体会到面对面交流的感觉,提高通话的真实感,从而提升用户的体验。
下面结合图1描述本发明实施例所适用的场景。图1为本发明实施例所适用的场景示意图,如图1所示,包括:第一终端、第二终端和服务器。其中,服务器可以是用于建立第一终端与第二终端之间通话连接的服务器。具体的,第一终端和第二终端与服务器之间可以通过互联网或者移动互联网建立连接,并且,在第一终端和第二终端还可以通过与服务器的交互,建立第一终端与第二终端之间的通话连接。可以理解的,第一终端和第二终端建立通话连接的过程中,可能还涉及其他的网络设备节点,本发明实施例对此不作特别赘述。
需要说明的是,本发明实施例提供的通话方法,可适用于双方通话,还可适用于多方通话,即群组通话。无论参与通话的用户终端的数量是多少,本发明实施例提供的通话方法均可适用于参与通话的任一用户终端。以双方通话为例,第一用户与第二用户进行通话的场景中,本实施例的方法可适用于第一用户的终端,还可适用于第二用户的终端。
需要说明的是,本发明实施例中的终端是一种向用户提供语音和/或数据联通性的设备,例如:具有无线或有线网络连接功能的手持式设备或者车载设备等,常见的终端包括但不限于:手机、平板电脑、笔记本电脑、掌上电脑、可穿戴设备、智能家居等,其中,可穿戴设备包括智能手表、智能手环等,智能家居包括智能音箱、智能冰箱等。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本发明实施例提供的通话方法一种实施例的流程示意图,本实施例的方法可以由图1中的任一终端执行。为了描述方便,本发明实施例站在第一终端的角度描述本实施例的通话方法。如图2所示,本实施例的方法,包括:
S201:获取通话指令,所述通话指令用于指示建立所述第一终端与第二终端之间的通话连接,所述通话指令中包括所述第二终端对应的用户的标识。
具体的,第一终端获取通话指令,该通话指令指示建立第一终端与第二终端之间的通话连接。其中,第一终端可以是本次通话的主叫,也可以是本次通话的被叫。也就是说,本实施可适用于第一终端主动呼叫第二终端的场景,还可以适用于第二终端主动呼叫第一终端的场景。
对于第一终端主动呼叫第二终端的情况,第一终端获取的通话指令可以具体是第一终端向第二终端发送的呼叫指令;对于第二终端主动呼叫第一终端的情况,第一终端获取的通话指令可以具体是第一终端接收到的由第二终端发送的呼叫指令。无论上述中的哪一种情况,所述通话指令中包括第二终端对应的用户的标识。
下面举例进行说明,为了描述方便,本发明实施例以及后续实施例中,将第一终端对应的用户称为第一用户,第二终端对应的用户称为第二用户。当第一用户为主叫用户时,第一终端获取的通话指令中包括的是被叫用户(即第二用户)的标识,当第一用户为被叫用户时,第一终端获取的通话指令中包括的是主叫用户(即第二用户)的标识。
其中,用户的标识可以能够表征该用户的任一标识,包括但不限于:姓名、电话号码、身份证号码、昵称、网名、邮箱、账号等。
S202:根据所述第二终端对应的用户的标识,获取所述第二终端对应的用户的三维虚拟头像。
具体的,第一终端根据通话指令,确定第二终端对应的第二用户的标识后,根据第二用户的标识,获取第二用户的三维虚拟头像。该三维虚拟头像为立体的头像。具体的,该三维虚拟头像可以具体是根据第二用户的二维图像采用三维重建技术生成的,其中,本发明实施例对于三维重建技术不作具体限定,可采用现有技术中的任一种三维重建技术。
具体的,三维虚拟头像是第二用户的立体头像,例如可以是包括第二用户的头部的立体头像。可选的,为了进一步提高通话的真实感,本实施例中的三维虚拟头像还可以是包括第二用户上半身和头部的立体头像。
一种可选的实施方式中,第二用户的三维虚拟头像是事先存储在第一终端的预设存储区中的。例如:第二终端在通话之前,根据第二用户的二维图像重建生成第二用户的三维虚拟头像后,将第二用户的三维虚拟头像发送给第一终端,以便第一终端对第二用户的三维虚拟头像进行存储。当第一终端获取到包括第二用户的标识的通话指令后,根据第二用户的标识,从第一终端的预设存储区中,获取第二用户的三维虚拟头像。
另一种可选的实施方式中,第二用户的三维虚拟头像是事先存储在预设的数据库中的,该数据库可以是通话服务器的数据库,还可以是第一终端可以访问的任一数据库。例如:第二终端在通话之前,根据第二用户的二维图像重建生成第二用户的三维虚拟头像后,将第二用户的三维虚拟头像存储到该数据库中。当第一终端获取到包括第二用户的标识的通话指令后,根据第二用户的标识,从数据库中获取第二用户的三维虚拟头像。
S203:在所述第一终端与所述第二终端之间建立通话连接之后,对所述三维虚拟头像进行三维的投影显示。
本实施例与现有技术不同之处在于,现有技术中,第一终端与第二终端建立视频通话连接之后,在第一终端的屏幕中显示的是第二用户的二维影像,从而第一用户在通话过程中看到的是第二用户的二维影像;而本实施例中,在第一终端与第二终端建立通话连接之后,第一终端对第二用户的三维虚拟头像进行三维的投影显示,从而第一用户在通话过程中看到的是第二用户的三维虚拟头像的投影。
由于三维虚拟头像为立体的,看起来更接近于真实的人,因此,与现有技术中第一用户看到第二用户的二维影像相比,本实施例中第一用户看到第二用户的三维虚拟头像,能够增加通话的真实感,使得第一用户体会到面对面交流的感觉。
具体的,本实施例中对于三维虚拟头像进行三维的投影显示,可以具体采用现有的立体投影技术,还可以采用现有的全息投影技术,本发明实施例对此不作具体限定。其中,立体投影是通过光偏振原理来实现的;全息投影技术也称虚拟成像技术,是利用干涉和衍射原理记录并再现物体真实的三维图像的技术。
可以理解的,由于本实施例是对三维虚拟头像进行投影显示,其可以投影显示在用户便于观看的任意位置,例如:可以投影在第一终端的屏幕上,还可以投影在其他位置。
另外,第一终端对三维虚拟头像进行投影显示后,还可以接收用户输入的调节指令,并根据调节指令对三维虚拟头像的大小进行调整,从而可以将三维虚拟头像的大小调整得与真实人物更接近,从而进一步增加用户通话的真实度。
需要说明的是,上述实施例的通话方法是站在第一终端的角度来描述,可以理解的,第二终端与第一终端的通话方法是类似的,此处不再赘述。
本发明实施例提供的通话方法,应用于第一终端时,获取通话指令,所述通话指令用于指示建立所述第一终端与第二终端之间的通话连接,所述通话指令中包括所述第二终端对应的用户的标识;根据所述第二终端对应的用户的标识,获取所述第二终端对应的用户的三维虚拟头像;在所述第一终端与所述第二终端之间建立通话连接之后,对所述三维虚拟头像进行三维的投影显示;由于三维虚拟头像为立体的,看起来更接近于真实的人,因此,与现有技术中用户仅能看到通话对象的二维影像相比,本实施例中用户能够看到通话对象的三维虚拟头像,使得用户体会到面对面交流的感觉,从而增加通话的真实感,提升用户通话体验。
图3为本发明实施例提供的通话方法另一种实施例的流程示意图,在上述实施例的基础上,本实施例的方法,包括:
S301:获取通话指令,所述通话指令用于指示建立所述第一终端与第二终端之间的通话连接,所述通话指令中包括所述第二终端对应的用户的标识。
本实施例中,S301的实施方式与上述实施例中的S201类似,此处不作赘述。
S302:向服务器发送头像获取指令,所述头像获取指令中包括所述第二终端对应的用户的标识。
S303:接收所述服务器从数据库中获取的所述第二终端对应的用户的三维虚拟头像,其中,所述数据库中存储有不同用户的标识对应的三维虚拟头像。
具体的,本实施例适用的其中一个场景为:第一终端和第二终端均与服务器连接,服务器的数据库中存储了不同用户的标识对应的三维虚拟头像。当第一终端需要获取第二用户的三维虚拟头像时,向服务器发送头像获取指令,并在头像获取指令中携带第二用户的标识,以使服务器根据第二用户的标识获取第二用户的三维虚拟头像。然后,第一终端接收服务器发送的第二用户的三维虚拟头像。
S304:在所述第一终端与所述第二终端之间建立通话连接之后,采用三维全息投影技术,将所述三维虚拟头像进行三维的全息投影显示。
在图2所示实施例的基础上,本实施例中,在第一终端与第二终端建立通话连接之后,第一终端采用三维全息投影技术,将第二用户的三维虚拟头像进行三维的全息投影显示。三维全息投影技术是利用干涉和衍射原理记录并再现物体真实三维图像的技术,其最大的优势就是无观察者佩戴三维全息眼镜,便可以多角度的浏览三维的立体影像。
可以理解的,三维全息投影技术属于成熟的现有技术,可以采用现有技术实现对三维虚拟头像的三维全息投影显示。例如,在第一终端中设置三维全息投影芯片,由三维全息投影芯片实现对三维虚拟头像的全息投影。
一种可选的实施方式中,在所述第一终端的屏幕上,对所述三维虚拟头像进行三维的全息投影显示。该方式中,第二用户的三维虚拟头像是投影显示在第一终端的屏幕上,第一用户通过第一终端的屏幕观看到第二用户的三维虚拟头像。
另一种可选的实施方式中,在空气屏幕上,对所述三维虚拟头像进行三维的全息投影显示。该方式中,第二用户的三维虚拟头像是投影显示在空气中,第一用户通过空气屏幕观看到第二用户的三维虚拟头像。
其中,空气屏幕可以是位于第一终端上方/下方/左侧/右侧的空气形成的虚拟屏幕。
可以理解的,由于空气屏幕不受第一终端的屏幕大小的限制,在空气屏幕中进行三维虚拟头像的投影显示,可以使得投影显示的第二用户的三维虚拟头像的大小更接近于真实人物,提高通话真实度。
在图3所示实施例的基础上,下面结合一个具体的实施例,详细描述终端生成三维虚拟头像并存储到服务器的数据库中的过程。
图4为本发明实施例提供的生成并存储三维虚拟头像的方法的流程示意图,如图4所示,本实施例的方法,包括:
S401:根据所述第一终端对应的用户的二维图像以及所述二维图像对应的三维信息,生成所述第一终端对应的用户的头像参数,其中,所述三维信息用于指示所述二维图像中的各像素点的深度信息。
需要说明的是,本发明实施例的执行主体可以为任一终端,即任一终端均可以采用本发明实施例的方法生成该终端对应的用户的三维虚拟头像。为了描述方便,本发明实施例以第一终端的角度描述三维虚拟头像的生成过程。
具体的,头像参数是指可用于对用户的头像进行三维重建的参数集合。本实施例中,可以根据第一用户的二维图像以及该二维图像对应的三维信息得到该第一用户的头像参数。其中,三维信息用于指示该二维图像中的各个像素点的深度信息,深度信息指的是各像素点与拍摄装置之间的距离。可以理解的,头像参数可以根据一个或者多个二维图像以及各二维图像对应的三维信息生成。
一种可选的实施方式中,第一终端包括拍摄装置或者连接了拍摄装置的情况下,在S401之前,还可以包括:
通过拍摄装置获取所述第一终端对应的用户的二维图像;
获取所述拍摄装置的模组参数,并根据所述模组参数,获取所述二维图像对应的三维信息。其中,模组参数是指用于指示拍摄装置的深度信息的参数,模组参数可以是多个参数组成的参数集合。
另一种可选的实施方式中,在S401之前,还可以包括:
获取用户向所述第一终端输入的二维图像以及所述二维图像的三维信息。
该方式中,第一用户可以向第一终端上传由其他拍摄终端拍摄的第一用户的二维图像以及该二维图像对应的三维信息。
S402:根据所述头像参数进行三维重建,生成所述第一终端对应的用户的三维虚拟头像。
其中,利用头像参数进行三维重建生成三维虚拟头像的过程属于现有技术,本实施例对此不作具体限定。
S403:向所述服务器发送头像存储指令,所述头像存储指令中包括所述第一终端对应的用户的标识以及所述第一终端对应的用户的三维虚拟头像,以使所述服务器将所述第一终端对应的用户的标识以及所述第一终端对应的用户的三维虚拟头像存储至所述数据库。
具体的,第一终端生成第一用户的三维虚拟头像之后,向服务器发送头像存储指令,该头像存储指令中包括第一用户的标识和第一用户的三维虚拟头像,从而服务器将第一用户的标识和第一用户的三维虚拟头像存储到数据库中。当第二终端需要与第一终端建立通话连接时,第二终端通过与服务器的交互过程,获取第一用户的三维虚拟头像,以便在通话过程中,对第一用户的三维虚拟头像进行三维的投影显示。
图5为本发明实施例提供的通话方法再一种实施例的流程示意图,如图5所示,在图2所示实施例的基础上,本实施例的方法,包括:
S501:获取通话指令,所述通话指令用于指示建立所述第一终端与第二终端之间的通话连接,所述通话指令中包括所述第二终端对应的用户的标识。
S502:根据所述第二终端对应的用户的标识,获取所述第二终端对应的用户的三维虚拟头像。
S503:与所述第二终端之间建立通话连接。
S504:获取所述第二终端对应的用户的语音,并对所述语音进行识别,得到语音识别结果。
S505:根据所述语音识别结果,对所述三维虚拟头像的嘴部动作进行实时调整。
S506:对调整后的三维虚拟头像进行三维的投影显示。
在图2所示实施例的基础上,本实施例中第一终端对第二用户的三维虚拟头像进行投影显示时,还根据对第二用户的语音识别结果对第二用户的三维虚拟头像的嘴部动作进行实时调整。
其中,对第二用户的语音进行识别得到语音识别结果的过程属于现有技术,本发明实施例对此不作特别赘述。
具体实施过程中,可以事先根据不同音素对应的口型,获取不同音素对应的嘴部调节参数。在获取到第二用户的语音识别结果后,根据语音识别结果中的各音素的顺序,按照各音素对应的嘴部调节参数对所述三维虚拟头像进行实时调整,以使第二用户的嘴部动作与所述语音识别结果对应。然后,对调整后的三维虚拟头像进行投影显示。
本实施例中,第一终端与第二终端进行通话的过程中,第一用户和第二用户不仅可以观看到彼此的三维虚拟头像,并且观看到的三维虚拟头像的嘴部还会根据语音进行实时动作,使得用户在通话过程中体会到面对面交流的感觉,更进一步提高了通话的真实感。
图6为本发明实施例提供的通话装置一种实施例的结构示意图,如图6所示,本实施例的通话装置600,包括:第一获取模块601、第二获取模块602、投影模块603。
其中,第一获取模块601,用于获取通话指令,所述通话指令用于指示建立所述第一终端与第二终端之间的通话连接,所述通话指令中包括所述第二终端对应的用户的标识;
第二获取模块602,用于根据所述第二终端对应的用户的标识,获取所述第二终端对应的用户的三维虚拟头像;
投影模块603,用于在所述第一终端与所述第二终端之间建立通话连接之后,对所述三维虚拟头像进行三维的投影显示。
本实施例的通话装置,可用于执行如图2所示的方法实施例中的通话方法,其实现原理和技术效果类似,此处不再赘述。
图7为本发明实施例提供的通话装置另一种实施例的结构示意图,如图7所示,在上述实施例的基础上,本实施例的通话装置600,还可以包括生成模块604。
可选的,所述投影模块603具体用于:
采用三维全息投影技术,将所述三维虚拟头像进行三维的全息投影显示。
可选的,所述投影模块603具体用于:
在所述第一终端的屏幕上,对所述三维虚拟头像进行三维的全息投影显示;或者
在空气屏幕上,对所述三维虚拟头像进行三维的全息投影显示。
可选的,所述第二获取模块602具体用于:
向服务器发送头像获取指令,所述头像获取指令中包括所述第二终端对应的用户的标识;
接收所述服务器从数据库中获取的所述第二终端对应的用户的三维虚拟头像,其中,所述数据库中存储有不同用户的标识对应的三维虚拟头像。
可选的,所述生成模块604用于:
根据所述第一终端对应的用户的二维图像以及所述二维图像对应的三维信息,生成所述第一终端对应的用户的头像参数,其中,所述三维信息用于指示所述二维图像中的各像素点的深度信息;
根据所述头像参数进行三维重建,生成所述第一终端对应的用户的三维虚拟头像;
向所述服务器发送头像存储指令,所述头像存储指令中包括所述第一终端对应的用户的标识以及所述第一终端对应的用户的三维虚拟头像,以使所述服务器将所述第一终端对应的用户的标识以及所述第一终端对应的用户的三维虚拟头像存储至所述数据库。
可选的,所述生成模块604还用于:
通过拍摄装置获取所述第一终端对应的用户的二维图像;
获取所述拍摄装置的模组参数,并根据所述模组参数,获取所述二维图像对应的三维信息。
可选的,所述投影模块603具体用于:
获取所述第二终端对应的用户的语音,并对所述语音进行识别,得到语音识别结果;
根据所述语音识别结果,对所述三维虚拟头像的嘴部动作进行实时调整;
对调整后的三维虚拟头像进行三维的投影显示。
本实施例的通话装置,可用于执行上述任一方法实施例中的通话方法,其实现原理和技术效果类似,此处不再赘述。
图8为本发明实施例提供的终端的硬件结构示意图,如图8所示,本实施例的终端800,包括:至少一个处理器801和存储器802。该终端800还包括通信部件803,通信部件803可以与服务器进行通信。其中,处理器801、存储器802以及通信部件803通过总线804连接。
在具体实现过程中,至少一个处理器801执行所述存储器802存储的计算机执行指令,使得至少一个处理器801执行上述任一方法实施例中的通话方法。
处理器801的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的图8所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现上述任一方法实施例中的通话方法。
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种通话方法,其特征在于,应用于第一终端,包括:
获取通话指令,所述通话指令用于指示建立所述第一终端与第二终端之间的通话连接,所述通话指令中包括所述第二终端对应的用户的标识;
根据所述第二终端对应的用户的标识,获取所述第二终端对应的用户的三维虚拟头像;
在所述第一终端与所述第二终端之间建立通话连接之后,对所述三维虚拟头像进行三维的投影显示。
2.根据权利要求1所述的方法,其特征在于,所述对所述三维虚拟头像进行三维的投影显示,包括:
采用三维全息投影技术,将所述三维虚拟头像进行三维的全息投影显示。
3.根据权利要求2所述的方法,其特征在于,所述将所述三维虚拟头像进行三维的全息投影显示,包括:
在所述第一终端的屏幕上,对所述三维虚拟头像进行三维的全息投影显示;或者
在空气屏幕上,对所述三维虚拟头像进行三维的全息投影显示。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述第二终端对应的用户的标识,获取所述第二终端对应的用户的三维虚拟头像,包括:
向服务器发送头像获取指令,所述头像获取指令中包括所述第二终端对应的用户的标识;
接收所述服务器从数据库中获取的所述第二终端对应的用户的三维虚拟头像,其中,所述数据库中存储有不同用户的标识对应的三维虚拟头像。
5.根据权利要求4所述的方法,其特征在于,还包括:
根据所述第一终端对应的用户的二维图像以及所述二维图像对应的三维信息,生成所述第一终端对应的用户的头像参数,其中,所述三维信息用于指示所述二维图像中的各像素点的深度信息;
根据所述头像参数进行三维重建,生成所述第一终端对应的用户的三维虚拟头像;
向所述服务器发送头像存储指令,所述头像存储指令中包括所述第一终端对应的用户的标识以及所述第一终端对应的用户的三维虚拟头像,以使所述服务器将所述第一终端对应的用户的标识以及所述第一终端对应的用户的三维虚拟头像存储至所述数据库。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一终端对应的用户的二维图像以及所述二维图像对应的三维信息,生成所述第一终端对应的用户的头像参数之前,还包括:
通过拍摄装置获取所述第一终端对应的用户的二维图像;
获取所述拍摄装置的模组参数,并根据所述模组参数,获取所述二维图像对应的三维信息。
7.根据权利要求1至3任一项所述的方法,其特征在于,所述对所述三维虚拟头像进行三维的投影显示,包括:
获取所述第二终端对应的用户的语音,并对所述语音进行识别,得到语音识别结果;
根据所述语音识别结果,对所述三维虚拟头像的嘴部动作进行实时调整;
对调整后的三维虚拟头像进行三维的投影显示。
8.一种通话装置,其特征在于,应用于第一终端,包括:
第一获取模块,用于获取通话指令,所述通话指令用于指示建立所述第一终端与第二终端之间的通话连接,所述通话指令中包括所述第二终端对应的用户的标识;
第二获取模块,用于根据所述第二终端对应的用户的标识,获取所述第二终端对应的用户的三维虚拟头像;
投影模块,用于在所述第一终端与所述第二终端之间建立通话连接之后,对所述三维虚拟头像进行三维的投影显示。
9.一种终端,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至7任一项所述的通话方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至7任一项所述的通话方法。
CN201910129715.XA 2019-02-21 2019-02-21 通话方法、装置及终端 Pending CN110012257A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910129715.XA CN110012257A (zh) 2019-02-21 2019-02-21 通话方法、装置及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910129715.XA CN110012257A (zh) 2019-02-21 2019-02-21 通话方法、装置及终端

Publications (1)

Publication Number Publication Date
CN110012257A true CN110012257A (zh) 2019-07-12

Family

ID=67165791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910129715.XA Pending CN110012257A (zh) 2019-02-21 2019-02-21 通话方法、装置及终端

Country Status (1)

Country Link
CN (1) CN110012257A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112182170A (zh) * 2020-09-10 2021-01-05 五邑大学 一种远程交互系统
CN112672089A (zh) * 2019-10-16 2021-04-16 中兴通讯股份有限公司 会议控制及与会方法、装置、服务器、终端及存储介质
CN114760602A (zh) * 2022-04-18 2022-07-15 中国电信股份有限公司 全息通信方法、装置、系统及计算机可读存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1991982A (zh) * 2005-12-29 2007-07-04 摩托罗拉公司 一种使用语音数据激励图像的方法
CN102164265A (zh) * 2011-05-23 2011-08-24 宇龙计算机通信科技(深圳)有限公司 一种三维视频通话的方法及系统
US20120242777A1 (en) * 2011-03-21 2012-09-27 Sony Corporation Establishing 3d video conference presentation on 2d display
CN104345801A (zh) * 2013-08-09 2015-02-11 三星电子株式会社 混合视觉通信
CN105871897A (zh) * 2016-05-20 2016-08-17 腾讯科技(深圳)有限公司 一种控制媒体播放的方法、相关装置以及系统
CN105912101A (zh) * 2016-03-31 2016-08-31 联想(北京)有限公司 一种投影控制方法和电子设备
WO2017139695A1 (en) * 2016-02-12 2017-08-17 Sony Interactive Entertainment LLC Multiuser telepresence interaction
CN107465887A (zh) * 2017-09-14 2017-12-12 潍坊学院 视频通话系统及视频通话方法
CN107957669A (zh) * 2017-11-23 2018-04-24 苏州奥柯图葳机电科技有限公司 一种基于bim技术的用于工程设计的多功能成像设备
CN109215420A (zh) * 2018-11-23 2019-01-15 江苏华存电子科技有限公司 一种立体几何空间展示仪

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1991982A (zh) * 2005-12-29 2007-07-04 摩托罗拉公司 一种使用语音数据激励图像的方法
US20120242777A1 (en) * 2011-03-21 2012-09-27 Sony Corporation Establishing 3d video conference presentation on 2d display
CN102164265A (zh) * 2011-05-23 2011-08-24 宇龙计算机通信科技(深圳)有限公司 一种三维视频通话的方法及系统
CN104345801A (zh) * 2013-08-09 2015-02-11 三星电子株式会社 混合视觉通信
WO2017139695A1 (en) * 2016-02-12 2017-08-17 Sony Interactive Entertainment LLC Multiuser telepresence interaction
CN105912101A (zh) * 2016-03-31 2016-08-31 联想(北京)有限公司 一种投影控制方法和电子设备
CN105871897A (zh) * 2016-05-20 2016-08-17 腾讯科技(深圳)有限公司 一种控制媒体播放的方法、相关装置以及系统
CN107465887A (zh) * 2017-09-14 2017-12-12 潍坊学院 视频通话系统及视频通话方法
CN107957669A (zh) * 2017-11-23 2018-04-24 苏州奥柯图葳机电科技有限公司 一种基于bim技术的用于工程设计的多功能成像设备
CN109215420A (zh) * 2018-11-23 2019-01-15 江苏华存电子科技有限公司 一种立体几何空间展示仪

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112672089A (zh) * 2019-10-16 2021-04-16 中兴通讯股份有限公司 会议控制及与会方法、装置、服务器、终端及存储介质
US11838338B2 (en) 2019-10-16 2023-12-05 Xi'an Zhongxing New Software Co., Ltd. Method and device for conference control and conference participation, server, terminal, and storage medium
CN112672089B (zh) * 2019-10-16 2024-02-06 中兴通讯股份有限公司 会议控制及与会方法、装置、服务器、终端及存储介质
CN112182170A (zh) * 2020-09-10 2021-01-05 五邑大学 一种远程交互系统
CN114760602A (zh) * 2022-04-18 2022-07-15 中国电信股份有限公司 全息通信方法、装置、系统及计算机可读存储介质
CN114760602B (zh) * 2022-04-18 2024-03-19 中国电信股份有限公司 全息通信方法、装置、系统及计算机可读存储介质

Similar Documents

Publication Publication Date Title
TWI650675B (zh) 群組視頻會話的方法及系統、終端、虛擬現實設備及網路設備
US9030486B2 (en) System and method for low bandwidth image transmission
CN104170318B (zh) 使用交互化身的通信
CN110012257A (zh) 通话方法、装置及终端
CN109479114A (zh) 光场捕获
CN111402399B (zh) 人脸驱动和直播方法、装置、电子设备及存储介质
CN110401810B (zh) 虚拟画面的处理方法、装置、系统、电子设备及存储介质
CN113038287B (zh) 多人视频直播业务实现方法、装置、计算机设备
CN109997175B (zh) 确定虚拟对象的大小
CN1732687A (zh) 用于远程临场通信的方法、系统和装置
US20210241465A1 (en) Expression transfer across telecommunications networks
KR20050102079A (ko) 이동영상통신을 위한 아바타 데이터베이스
CN111064919A (zh) 一种vr远程会议方法及装置
CN103369289A (zh) 一种视频模拟形象的通信方法和装置
CN110278140B (zh) 通讯方法及装置
CN108880983B (zh) 一种虚拟三维空间的语音实时处理方法及装置
CN107103645A (zh) 虚拟现实媒体文件生成方法及装置
CN110288703A (zh) 图像处理方法、装置、设备以及存储介质
CN106887033A (zh) 场景的渲染方法和装置
CN108668050A (zh) 基于虚拟现实的视频拍摄方法和装置
CN107995482A (zh) 视频文件的处理方法和装置
CN108776917A (zh) 一种虚拟三维空间的同步处理方法及装置
CN106817508A (zh) 一种同步对象确定方法、装置和系统
CN112752085A (zh) 基于人眼跟踪的裸眼3d视频播放系统及方法
CN205545426U (zh) 立体全景摄像组手机装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190712