CN105556955B

CN105556955B - 视频通话装置和视频通话处理方法

Info

Publication number: CN105556955B
Application number: CN201380079419.4A
Authority: CN
Inventors: 铃木基之; 益冈信夫; 吉泽和彦; 西岛英男
Original assignee: Maxell Ltd
Current assignee: Maxell Ltd
Priority date: 2013-09-24
Filing date: 2013-09-24
Publication date: 2018-07-10
Anticipated expiration: 2033-09-24
Also published as: WO2015044994A1; CN105556955A; US9591261B2; JPWO2015044994A1; JP6110503B2; US20160205344A1

Abstract

提供一种即使在多人使用的情况下也能够获得易用性较好的视频通话环境的视频通话装置和视频通话处理方法。在经网络与其它视频通话装置进行通话的视频通话装置中，拍摄通话人的图像，利用拍摄的图像对通话人进行识别，根据识别结果改变发送的图像中的背景图像。由此，例如在不那么亲密的用户彼此通话的情况下，能够消除将可得知房间状态的图像作为背景图像提供的状况。

Description

视频通话装置和视频通话处理方法

技术领域

本发明涉及利用网络连接进行视频通话的视频通话装置和视频通话处理方法。

背景技术

近年来，随着全世界扩大网络环境的建设，除现有的电话线路外，利用因特网线路的IP(Internet Protocol，因特网协议)电话正在普及中。该IP电话中，用户使用连接到因特网线路上的PC(Personal Computer，个人计算机)或内置有LAN(Local Area Network，局域网)功能的便携式电话机等，基于因特网协议交换声音和图像信号进行会话。

在这样的IP电话中，尤其是被称作Skype的服务在全世界广为普及，有数亿个注册用户。利用Skype的IP电话在最初只是声音通话，但随着网络的高速化和终端装置的高性能化，目前支持高清影像的视频通话也成为可能，为众人所使用。

在这种视频通话中，由于将摄像机拍摄的图像原样发送给通话对方，所以在用户的隐私这一点上可能会出现问题。因此，下述专利文献1提出了一种从拍摄的图像提取用户的轮廓，将剪切出的用户的图像与背景图像合成的技术。专利文献2提出了一种根据来电号码自动选择背景图像的方法。

现有技术文献

专利文献

专利文献1：日本特开平4-57582号公报

专利文献2：日本特开2005-210191号公报

发明内容

发明要解决的技术问题

在全家多人使用的电视接收装置、智能电话或平板型便携终端装置等上，也开始安装上述基于IP电话的视频通话功能。因此，针对这些装置的使用环境、使用状态，上述专利文献1或2的方法对用户不具有足够的易用性。例如存在这样的问题，即，在这些装置中，在连接到提供视频通话功能这一服务的服务器时，全家人使用同一账户，因此仅根据用于标识用户的账户无法判别发起或接收通话的对方是家庭成员中的哪一位，无法选择适于通话对方的背景。

本发明考虑到上述问题，其目的在于提供一种视频通话装置和视频通话处理方法，即使在像家人那样多人使用的情况下，也能够获得易用性较好的视频通话环境。

解决问题的技术手段

作为解决上述问题的技术手段，例如可采用权利要求书中记载的技术方案。

举一例如下，本发明涉及视频通话装置，其经网络与其它视频通话装置进行以拍摄的图像为首的图像的图像信息的通信，包括：拍摄所述图像的摄像部；图像处理部，生成以该摄像部拍摄的图像为首的图像的图像信息；通信部，与所述其它视频通话装置进行以该图像处理部生成的图像信息为首的信息的通信；显示部，显示以根据由该通信部从所述其它视频通话装置接收到的信息生成的图像信息为首的由所述图像处理部生成的图像信息；个别信息存储部，存储用于识别所述视频通话装置的成员的账户信息、与该账户信息关联登记的多个成员的成员信息，用于识别使用所述视频通话装置的通话人和使用所述其它视频通话装置的通话人的通话人识别信息以及与所述视频通话装置的成员和所述其它视频通话装置的成员的组合对应的个别设定信息；基于该个别信息存储部存储的通话人识别信息识别使用所述视频通话装置的通话人和使用所述其它视频通话装置的通话人的通话人识别部；和控制部，控制所述视频通话装置的结构部分的动作，使得基于该通话人识别部的识别结果和所述个别信息存储部存储的个别设定信息，对所述通信部向所述其它视频通话装置发送的图像信息或所述显示部显示的图像信息的显示进行设定。

另外，本发明还提供一种视频通话装置中的视频通话处理方法，所述视频通话装置经网络与其它视频通话装置进行以拍摄的图像为首的图像的图像信息的通信，所述视频通话处理方法包括：接收所述其它视频通话装置发送来的图像信息的接收步骤；识别在该接收步骤中接收到所述图像信息时使用所述其它视频通话装置的通话人的识别步骤；基于该识别步骤的识别结果将使用所述视频通话装置的通话人的图像与背景图像合成而生成合成图像的图像处理步骤；和将该合成图像发送给所述其它视频通话装置的发送步骤。

另外，本发明提供一种视频通话系统中的视频通话处理方法，该视频通话系统包括视频通话装置和用于联合多个该视频通话装置的视频通话服务器，其中所述视频通话装置经网络与其它视频通话装置进行以拍摄的图像为首的图像的图像信息的通信，所述视频通话处理方法包括：识别使用所述视频通话装置的通话人，生成与该通话人有关的通话人信息的识别步骤；基于该识别步骤中生成的通话人信息选择所述视频通话装置要通信的其它视频通话装置的选择步骤；获取步骤，获取与使用该选择步骤中选择的所述其它视频通话装置的通话人有关的通话人信息；和发送步骤，对与该获取步骤中获取到的通话人信息有关的通话人所使用的所述其它视频通话装置，发送与使用所述视频通话装置的通话人有关的通话人信息，在所述选择步骤中，作为要通信的视频通话装置选择当前登录在所述视频通话服务器上的其它视频通话装置。

发明效果

根据本发明具有这样的效果，即，能够提供一种即使在多人使用的情况下，也能够获得易用性较好的视频通话环境的视频通话装置和视频通话处理方法。

附图说明

图1是表示视频通话系统的一个实施例的框结构图。

图2是表示视频通话服务器3的结构例的框图。

图3是表示电视接收装置的结构例的框图。

图4是表示终端装置的结构例的框图。

图5是表示视频通话处理之一例的流程图。

图6是表示用户设定处理之一例的流程图。

图7是表示成员设定处理之一例的流程图。

图8是表示新成员登记处理之一例的流程图。

图9是表示新成员登记处理时的电视接收装置的显示之一例的图。

图10是表示与用户账户关联着登记的信息之示例的图。

图11是表示通话被叫方选择处理之一例的流程图。

图12是表示通话被叫方追加登记处理之一例的流程图。

图13是表示通话被叫方选择处理中的电视接收装置的显示之一例的图。

图14是表示与通话被叫方账户关联着登记的信息之示例的图。

图15是表示与通话主叫方对应的针对通话被叫方的背景设定数据之一例的图。

图16是表示背景设定数据之示例的图。

图17是表示通话处理之一例的流程图。

图18是表示通话处理的流程图之第二例的图。

图19是表示通话处理的流程图之第三例的图。

图20是表示通话处理的流程图之第四例的图。

图21是表示通话处理的流程图之第五例的图。

图22是表示视频通话处理的流程图之第二例的图。

图23是表示通话被叫方选择处理中的电视接收装置的显示之一例的图。

具体实施方式

下面使用附图对本发明实施方式之示例进行说明。

图1是表示本发明实施方式的视频通话系统的一个实施例的框结构图。本实施例是作为视频通话装置使用了电视接收装置1、终端装置2的视频通话系统，包括视频通话服务器3、路由器4、外部网络5、基站6、路由器7。

路由器4和7具有基于IEEE802.11a/b/n等Wi-fi标准的无线LAN功能或有线LAN功能，经由通信线路与外部网络5连接。

电视接收装置1通过无线LAN或有线LAN与路由器4连接，从路由器4经外部网络5与视频通话服务器3连接，基于IP电话进行视频通话。

终端装置2通过无线LAN或有线LAN与路由器7连接，从路由器7经外部网络5与视频通话服务器3连接，基于IP电话进行视频通话。另外，终端装置2能够通过W-CDMA(WidebandCode Division Multiple Access，宽带码分多址接入)、GSM(Global System for Mobilecommunications，全球移动通信系统，注册商标)等远距离无线通信，从基站6经外部网络5与视频通话服务器3连接，基于IP电话进行视频通话。

[视频通话服务器的硬件结构]

图2是表示本发明实施方式的视频通话服务器3的结构例的框图。

在图2中，视频通话服务器3包括控制部301、存储器(内存)302、存储部303、通信部304，各自通过总线300彼此连接。控制部301由CPU(Central Processing Unit，中央处理单元)等构成，通过执行存储在存储器302中的程序而控制各结构部，进行各种处理。存储部303存储有用于认证用户的账户的信息等用户信息。通信部304是用于与外部网络5连接的接口，将用户在视频通话服务器3上的登录状态等信息从外部网络5经基站6或路由器4、7发送给支持网络连接的电视接收装置1、终端装置2等。

[电视接收装置的硬件结构]

图3是表示本发明实施方式的电视接收装置1的结构例的框图。

在图3中，控制部101由CPU等构成，按照存储在存储器(内存)103中的操作系统和各种应用程序等对电视接收装置1的整体进行控制。系统总线100是用于在控制部101与电视接收装置1内的各部分之间进行数据收发的数据通信线路。另外，通话人识别部102根据从摄像部115经图像处理部114获取的通话主叫方的用户的影像，和能够经通信部117、路由器4、外部网络5获得的通话被叫方的对方的影像来识别通话人。

存储部104包括存储与电视接收装置1的用户有关的信息等的个别信息存储区域104a、存储数字广播节目的录像和与数字广播节目录像关联的信息(预约信息等)的节目记录区域104b、保存音乐/视频/照片的数据等用户数据的用户数据存储区域104c和其它信息存储区域104d。个别信息存储区域104a中存储有与进行视频通话服务的服务器连接的用户的账户的信息，在通话人识别部102中使用的、用于识别通话主叫方的用户的面孔和通话被叫方的对方的面孔的信息，或视频通话时的背景图像的数据等。

另外，电视接收装置1能够通过经通信部117、路由器4、外部网络5下载新的应用来实现功能扩展。此时，下载的上述新的应用被存储在其它信息存储区域104d中。通过将存储在其它信息存储区域104d中的上述新的应用展开到存储器103上执行，电视接收装置1能够实现多种新的功能。

外部接口105是用于扩展电视接收装置1的功能的接口组，在本实施例中，包括影像输入接口105a、声音输入接口105b、USB(Universal Serial Bus，通用串行总线)接口105c。影像输入接口105a和声音输入接口105b用于从外部影像/声音输出设备输入影像信号/声音信号。USB接口105c用于进行与键盘等USB设备或存储卡类的连接等。在电视接收装置1要将数字广播节目记录到外部连接的HDD(Hard Disc Drive，硬盘驱动器)装置等的情况下，将HDD装置等连接到USB接口105c上即可。另外，影像输入接口105a、声音输入接口105b也可以使用HDMI(High-Definition Multimedia Interface，高清多媒体接口，注册商标)，将影像与声音一起输入。

操作部106是用于输入对电视接收装置1的操作指示的指示输入部，在本实施例中，包括排列有按钮开关的操作按键106a和接收来自遥控器120的红外线信号的遥控接收部106b。也可以使用连接在USB接口105c上的键盘等进行电视接收装置1的操作。另外，也可以使用经通信部117连接的便携式终端装置或除此之外的PC等进行电视接收装置1的操作。

调谐器108从由天线107接收到的广播电波中提取电视接收装置1的用户所选择的频道的信号，解调出TS(Transport Stream，传输流)信号。分离部109将上述TS信号分离为分别封包的影像数据、声音数据和附加信息数据，将它们输出到解码部110。此处，影像数据被输出到影像解码器110a，声音数据被输出到声音解码器110b，附加信息数据被输出到信息解码器110c。影像解码器110a将从分离部109输出的影像数据解码，作为影像信号输出到图像处理部114。声音解码器110b将从分离部109输出的声音数据解码，作为声音信号输出到声音处理部111。信息解码器110c对从分离部109输出的附加信息数据进行处理而获得SI(Service Information，业务信息)信息等，其中该SI信息尤其包括各节目的节目名、类别(风格)、放映开始/结束日期时间等节目信息。

显示部116例如是液晶面板这样的显示设备，显示经图像处理部114处理后的影像信号。另外，图像处理部114对于输入的影像信号根据需要进行格式转换、叠加菜单或其它OSD(On Screen Display，屏上显示)信息的叠加处理、或将视频通话中从摄像部输送来的通话人的图像与存储在个别信息存储区域104a中背景图像合成的合成处理等。扬声器113输出经声音处理部111处理后的声音信号。

摄像部115是摄像机等，获取视频通话时的通话人的影像输出到图像处理部。图像处理部114基于上述影像生成图像信息。麦克风112获取外部的声音输出到声音处理部111，用于视频通话等。

通信部117通过有线LAN或无线LAN与路由器4连接，与因特网等外部网络5进行信息的收发，或基于因特网协议交换声音和图像信号进行视频通话等。

另外，以上说明中采用了将摄像部115和麦克风112内置于电视接收装置1中的结构，但也可以使用经USB接口105c设置于外部的摄像机或麦克风。

[终端装置的硬件结构]

图4是表示本发明实施方式的终端装置2的结构例的框图。

此处，以终端装置2为智能电话的情况为例进行说明。终端装置2包括控制部201、通话人识别部202、存储器(内存)203、存储部204、GPS(Global Positioning System，全球定位系统)接收部205、地磁传感器206、加速度传感器207、陀螺仪传感器208、输入输出接口209、麦克风210、声音处理部211、扬声器212、外部声音输出部213、操作输入部214、显示部215、图像处理部216、摄像部217、基站通信部218、无线通信部219，各自经总线200彼此连接。

控制部201由CPU等构成，通过执行存储在存储器203中的操作系统和各种应用程序等，控制各结构部进行各种处理。另外，通话人识别部202根据从摄像部217经图像处理部216获取到的通话主叫方的用户的影像，和能够经基站通信部218、基站6或无线通信部219、路由器7与外部网络5连接而获得的进行视频通话的通话被叫方的对方的影像来识别通话人。

存储部204包括存储与用户有关的信息等的个别信息存储区域204a，保存音乐、视频、照片的数据等用户数据的用户数据存储区域204b，和其它信息存储区域204c。个别信息存储区域204a中存储有与进行视频通话服务的服务器连接的用户的账户的信息，在通话人识别部202中使用的、用于识别通话主叫方的用户的面孔和通话被叫方的对方的面孔的信息，或视频通话时的背景图像的数据等。

GPS接收部205接收来自位于高空的GPS卫星的信号。由此检测终端装置2的当前位置。地磁传感器206是检测终端装置2所朝向的方向的传感器。加速度传感器207是检测终端装置2的加速度的传感器，陀螺仪传感器208是检测终端装置2的角速度的传感器。由此，能够详细地检测终端装置2的倾斜和运动。

输入输出接口209例如是USB等，是与未图示的外部设备进行数据的收发的接口。

麦克风210输入外部的声音，扬声器212对外部输出声音。外部声音输出部213与未图示的耳机连接而输出声音。输入输出的声音由声音处理部211进行声音处理。

操作输入部214例如是静电电容式等触摸板方式的输入单元，以手指或触摸笔等的接触操作(下文称触摸)作为操作输入来检测用户的操作。显示部215将影像或图像显示在液晶面板等上，其显示面上具有操作输入部214。

摄像部217是摄像机等。要显示在显示部215上的影像和从摄像部217输入的影像由图像处理部216进行处理，对于输入的影像信号根据需要进行格式转换、或将视频通话中从摄像部217输送来的通话人的图像与存储在个别信息存储区域204a中背景图像合成的合成处理等。

基站通信部218是与W-CDMA或GSM等的基站6进行远距离无线通信的通信接口。无线通信部219是通过无线LAN与路由器4进行无线通信的通信接口。由此，终端装置2能够经基站6或路由器7与外部网络5连接，进行信息的收发，或基于因特网协议交换声音和图像信号进行视频通话等。

基站通信部218或无线通信部219经基站6或路由器7与外部网络5连接。由此，存储在存储器203或存储部204中的程序或数据能够从未图示的外部服务器等下载，随时更新、增加。另外，通过使输入输出接口209与个人计算机等外部设备连接，也能够更新、增加数据和程序。

下面对视频通话处理的动作例进行说明。

[视频通话处理的实施方式例]

图5是表示本发明实施方式的视频通话处理之一例的流程图，是表示在视频通话装置a的用户a与视频通话装置b(其它视频通话装置)的用户b之间进行视频通话的情况下的处理之一例的流程图。此处，视频通话装置是电视接收装置1或终端装置2等可视频通话的装置。

视频通话装置a的用户a和视频通话装置b的用户b各自从菜单画面选择视频通话应用，请求启动(S501a、S501b)。由此，视频通话装置a和视频通话装置b启动视频通话应用(S502a、S502b)，访问视频通话服务器3，请求并获取登录画面信息(S503a、S503b)。

接着，视频通话装置a和视频通话装置b各自显示登录画面(S504a、S504b)，当用户a和用户b输入了用户账户和密码后(S505a、S505b)，从视频通话装置将输入的用户账户和密码这些登录信息发送到视频通话服务器3。

视频通话服务器3参照存储在存储部303中的用户信息，若是正当的注册用户则给予用户账户认证(S506a、S506b)。然后，视频通话装置a和视频通话装置b各自基于从摄像部115或217输入的用户的图像进行面孔识别处理(S507a、S507b)。

在通过面孔识别处理识别出的面孔与预先登记的账户的成员的面孔一致的情况下，作为登录的用户设定已登记的成员名。此处，成员指的是登记在视频通话装置a中的能够利用该视频通话装置a进行通话(或者允许进行这样的通话或被赋予了权限)的1个或多个用户。在通过上述面孔识别处理识别出多个成员的情况下，可以将多个成员名设定为用户，或者也可以显示识别出的成员的列表，将由用户中的一个人从列表中选出的成员名设定为登录的用户，或者也可以不指定成员而是将账户名设定为登录的用户。另外，在像双胞胎那样两个人的判别难以实现的情况下，也可以显示候选的列表，将用户从列表中选出的成员名设定为登录的用户。

在与预先登记的账户的成员的面孔不一致的情况下，作为登录的用户设定新的账户名(S508a、S508b)。新的账户名可以由登录的用户自身设定，也可以由视频通话装置设定。另外，也可以进行后述图6的成员设定处理S612，将设定的成员设定为用户。

由拥有视频通话装置的家庭中的一个人，按每个家人将例如由摄像部115或217拍摄的面孔的图像和成员名登记在视频通话装置的个别信息存储部104a或204a中。在用户登录时，在S507a、S507b的面孔识别处理中，判断由摄像部115或217拍摄该用户的面孔而得的图像是否与登记在个别信息存储部104a或204a中的面孔的图像中的某一个一致。如后文详述的那样，根据上述判断结果，针对摄像部115或217拍摄的当前的图像，决定例如是否将背景图像发送给通话被叫方。由此，即使在包括家人以外的用户的多个人使用视频通话装置的情况下，也能够获得易用性较好的视频通话环境。

接着，视频通话装置a和视频通话装置b各自反复进行处理S510a和S510b，直至用户选择“退出”为止。在反复处理S510a和S510b中，首先，视频通话装置a和视频通话装置b显示要执行的处理的选择画面(S511a、S511b)。当用户输入了选择结果后(S512a、S512b)，视频通话装置a和视频通话装置b各自执行与选择结果相应的分支处理S520a和S520b。在用户选中“用户设定”的情况下，执行用户设定处理S521a、S521b，在用户选中“选择通话被叫方”的情况下执行通话被叫方选择处理S522a、S522b，在用户选中“通话”的情况下执行通话处理S523a、S523b。在选中“退出”的情况下执行退出处理S524a、S524b，离开反复处理S510a、S510b，结束视频通话应用(S530a、S530b)。

接着，对图5的用户设定处理S521a、S521b，通话被叫方选择处理S522a、S522b和通话处理S523a、S523b，基于图6～图8的流程图、图11与图12的流程图和图17～图21的流程图依次进行详细说明。首先说明用户设定处理S521a、S521b。

图6是表示本发明实施方式的用户设定处理S521之一例的流程图。

在用户设定处理中反复进行处理S600直至用户选择“设定结束”。在反复处理S600中，首先，视频通话装置显示用于选择由用户设定的项目的画面(S601)。在用户输入了设定项目选择结果后(S602)，视频通话装置执行与选择结果相应的分支处理S610。在用户选中“账户设定”的情况下，执行用于登录视频通话服务器3的账户信息的设定处理S611，在选中“成员设定”的情况下，执行用于设定使用相同账户进行视频通话的成员的处理S612。在选中“设定结束”的情况下执行结束处理S613，离开反复处理S600结束用户设定处理。

图7是表示本发明实施方式的成员设定处理S612之一例的流程图。

在成员设定处理中反复进行处理S700直至用户选择“设定结束”。在反复处理S700中，首先，在视频通话装置上显示用于选择由用户设定的项目的画面(S701)。在用户输入了设定项目选择结果后(S702)，视频通话装置执行与选择结果相应的分支处理S710。在用户选中“新成员登记”的情况下，执行新登记使用相同账户进行视频通话的成员的处理S711，在选中“登记变更”的情况下，执行对已登记的成员的登记内容进行变更的处理S712。在选中“设定结束”的情况下执行结束处理S713，离开反复处理S700结束成员设定处理。

图8是表示本发明实施方式的新成员登记处理S711之一例的流程图。

在新成员登记处理中反复进行处理S800直至用户在选择输入处理S805或S842中选择“登记结束”。在反复处理S800中，首先，显示请求输入要新登记的成员的姓名的画面(S801)。当用户输入姓名后(S802)，将输入的姓名登记为当前登录的账户的成员(S803)。接着显示用于选择面孔图像来源的画面(S804)，这里面孔图像来源用于面孔图像的登记，而面孔图像用于进行所登记的成员的面孔识别。在用户输入了选择结果后(S805)，视频通话装置执行与选择结果相应的分支处理S810。在用户选中“摄像机”的情况下，例如电视接收装置1在显示部115上显示从摄像机115输送来的图像，终端装置2在显示部215上显示从摄像部217输送来的图像(S811)。在选中“文件”的情况下，例如电视接收装置1进行选择存储在存储部104的用户数据存储区域104c中的照片或视频之图像文件的处理S812，终端装置2进行选择存储在存储部204的用户数据存储区域204b中的照片或视频之图像文件的处理S812，将选中的图像显示在电视接收装置1的显示部115或终端装置的显示部215上(S813)。另外，在选中“登记结束”的情况下，不执行面孔图像的登记而是执行结束处理S814，离开反复处理S800结束新成员登记处理。

在选择处理S810中选中“摄像机”或“文件”的情况下，对接下来显示在显示部上的图像进行面孔识别处理(S820)，并进行与识别结果相应的条件处理S830。在条件处理S830中，在识别出的面孔为一个人以上的情况下，显示部显示用于选择所登记的成员的面孔的画面(S831)，由用户选择要登记的面孔(S832)。接着，根据来自用户的确定登记的输入S840，在识别出的面孔为一个人的情况下将识别出的面孔与成员名对应着登记，在识别出的面孔为一个人以上的情况下，将选中的面孔与成员名对应着登记(S841)。显示部显示用于选择是接着再登记成员还是结束登记处理的画面(S842)。在用户输入了选择结果后(S843)，视频通话装置执行与选择结果相应的条件处理S850。在条件处理S850中选中“登记结束”的情况下，进行结束处理S851，离开反复处理S800结束新成员登记处理。在选中“追加登记”的情况下，通过反复处理S800继续进行新成员的登记。

图9是表示新成员登记处理时的电视接收装置1的显示之一例的图。

图9的示例是在选择处理S810中选择“文件”，对存储在用户数据存储区域104c中的照片进行面孔识别的情况下的例子。当前登录的账户名显示于90a，要登记的成员名显示于90b。并且，选中的照片的文件名显示于90e。显示有表示识别出的面孔的多个框90c、90d，其中作为要登记的面孔选中的框90d被显示为粗框。此处，例如用户通过按下遥控器120的规定的按钮进行确定登记的输入，将与成员名对应的面孔识别信息登记到个别信息存储区域104a中。另外，在基于视频(动画)图像文件进行面孔识别的情况下，从面孔识别的精度的角度考虑，优选在显示出成员的面孔的时刻以静止状态进行面孔识别。

图10表示与用户账户关联着登记在个别信息存储区域104a中的信息之示例。登记有与用户账户名10a对应的成员名10b、已登记的面孔图像数据10c和用于识别各成员的面孔的面孔识别数据10d。作为面孔识别数据10d，例如使用将眼睛与鼻子的位置关系等面孔的特征数值化而得的数据。

接着，对之前图5中的通话被叫方选择处理S522进行说明。

图11是表示本发明实施方式的通话被叫方选择处理S522之一例的流程图。

在通话被叫方选择处理S522中，首先，从视频通话装置经外部网络5访问视频通话服务器3，请求并获取作为通话被叫方登记的账户是否已登录到视频通话服务器3上的信息，已登录的账户的视频通话装置的IP地址信息，和是否正在通话中的信息等(S1101)。然后反复进行处理S1110直至用户在选择输入处理S1112中选择“结束”。在反复处理S1110中，首先显示用于选择通话主叫方/通话被叫方的画面(S1111)。接着，根据用户的选择处理S1112进行分支处理S1120。在选择处理S1112中选中“确定”的情况下，进行通话主叫方/通话被叫方设定处理S1121，在选中“通话被叫方追加登记”的情况下，进行用于新登记通话被叫方的账户的处理S1122，在选中“通话被叫方变更登记”的情况下，进行对已登记的账户的信息进行变更的处理S1123。

图12是表示本发明实施方式的通话被叫方追加登记处理S1122之一例的流程图。

在通话被叫方追加登记处理中反复进行处理S1200直至用户选择“设定结束”。在反复处理S1200中，首先，视频通话装置显示用于选择由用户设定的项目的画面(S1201)。此处，视频通话装置是电视接收装置1或终端装置2等可视频通话的装置。在用户输入了设定项目选择结果后(S1202)，视频通话装置执行与选择结果相应的分支处理S1210。在用户选中“账户设定”的情况下，执行用于设定通话被叫方的账户名称等信息的处理S1211，在选中“成员设定”的情况下，执行用于设定使用通话被叫方的账户进行通话的成员的处理S1212。在选中“设定结束”的情况下执行结束处理S1213，离开反复处理S1200结束用户设定处理。

图13是表示通话被叫方选择处理S522中的电视接收装置1的显示之一例的图。

在图13中，通话主叫方的账户和登记在账户中的成员的姓名和面孔显示于1300a，作为通话主叫方选中的成员的显示框显示为粗框。例如，在面孔识别处理S507中通过面孔识别，经登录用户设定处理S508设定的成员被选中为通话主叫方。关于该情况下的选择，作为初始选择基于登录用户设定处理S508进行，但选择也可以变更，在因面孔识别错误导致登录用户设定处理S508中的用户设定有误的情况下，能够通过进行选择变更来设定正确的通话主叫方的成员。另外，也可以不指定特定的成员而仅设定用户账户。

此外，通话被叫方的账户和登记在账户中的成员的姓名、面孔、对选中的通话被叫方的背景的设定以及表示通话被叫方的账户是否已登录到视频通话服务器3的状态(在线/离线)等显示于1300b，作为通话被叫方选中的成员的显示框显示为粗框。另外，与S1120的分支处理对应地，显示有与“确定”选项对应的按钮1300c、与“通话被叫方追加登记”选项对应的按钮1300d、与“通话被叫方变更登记”选项对应的按钮1300e、与“设定结束”选项对应的按钮1300g，通过使用电视接收装置1的遥控器120选择按钮，来执行与各按钮对应的处理。

图14表示与通话被叫方账户关联着登记在个别信息存储区域104a或204a中的信息之示例。登记有与通话被叫方账户名14a对应的成员名14b、已登记的面孔图像数据14c和用于识别各成员的面孔的面孔识别数据14d。作为面孔识别数据，例如使用将眼睛与鼻子的位置关系等面孔的特征数值化而得的数据。通话被叫方账户的成员的面孔识别在通话被叫方成员设定处理S1212中进行，能够通过与用户账户的新成员登记处理S711同样的处理来进行。例如，作为面孔图像来源根据存储在用户数据存储区域104c或204b中的拍摄有通话被叫方账户的成员的照片或视频之图像文件进行面孔识别，将其登记。或者，也可以将视频通话中的对方的面孔作为面孔图像来源进行面孔识别，将其登记。

图15表示与通话主叫方和通话被叫方对应着个别设定的背景设定数据之一例。对于通话主叫方的用户账户的各成员15a，存储有针对通话被叫方账户的各成员的背景设定数据15b。例如，通话主叫方的用户账户的成员未指定、通话被叫方账户为“Oooo Yyyy”的情况下的背景设定为A2(这相当于如图13的设定画面中不指定成员仅设定账户的情况那样，在对于通话主叫方和通话被叫方均仅指定用户账户而不指定特定的成员的状态下进行通话的情况。不限于未登记的用户，即使是已登记的成员也存在作为通话主叫方不指定成员的情况。)，在对于用户账户成员“Cccc”以“Oooo Yyyy”的成员“Qqqq”为通话被叫方账户的情况下，背景设定为B2(这相当于在对于通话主叫方和通话被叫方均指定了用户账户的成员的状态下进行通话的情况)。

图16表示背景设定数据的示例。例如，背景编号A1的设定如下，即，没有背景图像，由通话主叫方的视频通话装置的摄像部获取的图像中，人物和背景均原样显示在通话被叫方的视频通话装置的画面上。背景编号A2的设定如下，即，不发送从通话主叫方的视频通话装置的摄像部获取的背景图像，在通话被叫方的视频通话装置的画面上不显示通话主叫方的背景图像。另外，背景编号B1和B2的设定如下，即，将选中的背景图像与由通话主叫方的视频通话装置的摄像部获取的人物图像合成，显示在通话被叫方的视频通话装置的画面上。

如上所述，通过在通话被叫方成员设定处理S1212中设定通话被叫方的成员，根据通话主叫方的成员与通话被叫方的成员(不是根据是否登记，而是根据是否指定)，选择发送给通话被叫方的图像中的背景图像。由此，例如在不那么亲密的用户彼此通话的情况下，能够消除将可得知房间状态的图像作为背景图像提供这样的不理想的状况，获得易用性较好的视频通话环境(即使是登记为父母与孩子、孩子与孩子这样的成员，也存在想到改变背景的情况——例如在孩子彼此通话的情况下使背景为彼此喜欢的角色等)。

接着，对之前图5中的通话处理S523进行说明。

图17是表示本发明实施方式的通话处理S523之一例的流程图。本例是由通话主叫方的用户a的视频通话装置a与通话被叫方的用户b的视频通话装置b进行视频通话的情况下的例子。

首先，视频通话装置a基于作为通话被叫方指定的账户的成员名，按照图15所示的与通话主叫方和通话被叫方对应的背景设定数据来设定背景图像(S1701)。接着，从通话主叫方的视频通话装置a对通话被叫方的账户发送呼叫请求(S1702)，其中该通话被叫方的账户是基于通话被叫方信息请求/获取处理S1101中获得的通话被叫方信息而在通话被叫方选择处理S522中选择的。通话被叫方的视频通话装置b在接收到通话呼叫时在显示部上显示用于通知来电的画面(S1703)。当通话被叫方的用户b接听来电时(S1704)，从通话被叫方的视频通话装置b向通话主叫方的视频通话装置a发送接听响应。由此，在视频通话装置a与视频通话装置b之间建立了用于进行视频通话的通信路径。

视频通话装置a开始发送图像和声音(S1705)，其中这里发送的图像是按照背景设定数据将通话主叫方的视频通话装置a的摄像部获取的图像合成到背景图像中而得的图像。视频通话装置b显示接收到的图像并输出声音(S1706)，并使用如图14所示存储在视频通话装置b的个别信息存储区域中的通话主叫方的用户a的账户的成员的面孔识别数据和接收到的图像，进行通话主叫方的用户a的识别(S1707)。按照存储在视频通话装置b的个别信息存储区域中的与通话主叫方和通话被叫方对应的背景设定数据来设定背景图像(S1708)。之后反复执行处理S1720，直至从用户a或用户b接收到“通话结束”的选择输入。

在反复处理S1720中，在视频通话装置a和视频通话装置b中进行图像和声音的收发，其中这里的图像是由视频通话装置的摄像部获取的图像与设定的背景图像合成而得的(S1721)，并且显示接收到的图像、输出声音(S1722a、S1722b)。基于来自用户a或用户b的选择输入(S1723a、S1723b)进行条件处理，在选中“通话结束”的情况下进行通话结束处理(S1724a、S1724b)，离开反复处理结束通话处理。

本实施例中，通话接收侧的视频通话装置b在登录时进行用户b的面孔识别，并使用从视频通话装置a发送的图像来识别通话发起侧的用户a的面孔，从而能够确定通话发起侧与通话接收侧的账户的成员，能够设定与成员相应的背景。另外，在通话发起侧的用户a没有被登记为成员的情况下，能够设定为不将通话主叫方的摄像部拍摄的图像或其中的背景图像发送给视频通话装置a。

图18表示本发明实施方式的通话处理S523的流程图之第二例。在图18中，对于与图17的流程图相同的处理标注相同标记省略说明。

在图18中，视频通话装置b按照存储在个别信息存储区域中的与通话主叫方和通话被叫方对应的背景设定数据来设定背景图像(S1708)，开始发送图像和声音，其中这里发送的图像是由通话被叫方的视频通话装置b的摄像部获取的图像与设定的背景图像合成而得的图像(S1709)。视频通话装置a显示接收到的图像并输出声音(S1710)，并使用存储在视频通话装置a的个别信息存储区域中的通话被叫方的账户的成员的面孔识别数据和接收到的图像，进行通话被叫方的用户b的识别(S1711)。按照存储在视频通话装置a的个别信息存储区域中的与通话主叫方和通话被叫方对应的背景设定数据来设定背景图像(S1712)。之后反复执行处理S1720，直至从用户a或用户b接收到“通话结束”的选择输入。

在以上的第二流程图之例所示的处理中，即使在接听来电的通话被叫方的用户b不是通话主叫方的用户a选作通话被叫方的账户的成员的情况下，视频通话装置a基于从视频通话装置b发送的图像进行面孔识别，根据识别出的结果设定背景图像，从而能够进行与通话发起侧和通话接收侧的账户的成员相应的背景的设定。

图19表示本发明实施方式的通话处理S523的流程图之第三例。在图19中，对于与图17的流程图相同的处理标注相同标记省略说明。本例对应于使用相同账户登录到视频通话服务器3上的视频通话装置存在多个的情况，例如不同的成员使用相同账户从电视接收装置1和终端装置2登录的情况。

首先，视频通话装置a基于作为通话被叫方指定的账户的成员名，按照图15所示的与通话主叫方和通话被叫方对应的背景设定数据来设定背景图像(S1901)。接着，基于通话被叫方信息请求/获取处理S1101中获得的通话被叫方信息，从通话主叫方的视频通话装置a对使用作为通话被叫方指定的账户登录的视频通话装置b和视频通话装置c发送通话人信息和通话呼叫，其中通话人信息是通话主叫方的账户的用户a的成员名和作为通话被叫方指定的账户的成员名等(S1902)。通话被叫方的视频通话装置b和视频通话装置c在接收到通话呼叫后，在显示部上显示通话主叫方的用户a的账户的成员名和作为通话被叫方指定的账户的成员名等信息，以及用于通知来电的画面(S1903b、S1903c)。

此处，令用户c与作为通话被叫方指定的账户的成员名一致。当用户c接听来电时(S1904)，视频通话装置c发送登录时识别出的用户c的成员名等通话人信息和接听响应。视频通话装置a接收来自视频通话装置c的接听响应，从而在视频通话装置a与视频通话装置c之间建立起用于进行视频通话的通信路径。

并且，视频通话装置c基于接收到的通话主叫方的用户a的账户的成员名，按照存储在视频通话装置c的个别信息存储区域中的与通话主叫方和通话被叫方对应的背景设定数据来设定背景图像(S1905)。视频通话装置a基于接收到的通话人信息的成员名，按照存储在视频通话装置a的个别信息存储区域中的与通话主叫方和通话被叫方对应的背景设定数据来设定背景图像(S1906)。之后反复执行处理S1720，直至从用户a或用户c接收到“通话结束”的选择输入。

在以上的第三流程图之例所示的处理中，由于作为通话被叫方指定的账户的成员名等信息被显示在视频通话装置上，所以即使在多个视频通话装置使用相同账户登录的情况下，也能够由指定的账户的成员确认是以自己为对象的呼叫而接听来电。另外，因为通话对方的账户的成员名的信息等被发送过来，所以不需要使用从通话对方发送来的图像通过面孔识别来确定成员，不需要如图14所示与通话对方的账户关联着登记各成员的面孔图像数据14c和用于识别各成员的面孔的面孔识别数据14d。

另外，在通话呼叫和来电接听的时刻能够确定通话对方的成员，所以能够按照与通话主叫方和通话被叫方的通话对方对应的背景设定数据来设定背景图像。并且，即使在用户b误接听来电的情况下，也能够基于背景设定处理S1906中接收到的通话人信息的成员名，按照与通话主叫方和通话被叫方对应的背景设定数据来设定背景图像。由此，在作为通话被叫方指定的账户的成员以外的人或没有被登记为成员的人接听来电的情况下，能够设定为不发送由通话主叫方的摄像部拍摄的图像。

图20表示本发明实施方式的通话处理S523的流程图之第四例。在图20中，对于与图17的流程图相同的处理标注相同标记省略说明。本例对应于使用相同账户登录到视频通话服务器3上的视频通话装置存在多个的情况。

首先，视频通话装置a基于作为通话被叫方指定的账户的成员名，按照图15所示的与通话主叫方和通话被叫方对应的背景设定数据来设定背景图像(S2001)。接着，基于通话被叫方信息请求/获取处理S1101中获得的通话被叫方信息，从通话主叫方的视频通话装置a对使用作为通话被叫方指定的账户登录的视频通话装置b和视频通话装置c发送通话人信息和通话呼叫请求(S2002)。通话被叫方的视频通话装置b和视频通话装置c各自进行通话人判定处理(S2003b、S2003c)，对从接收到的信息获得的作为通话被叫方指定的账户的成员名，与在视频通话装置b和视频通话装置c中通过登录用户设定处理而设定的用户名进行比较。

在作为通话被叫方指定的账户的成员名与通过登录用户设定处理而设定的用户名一致的情况下，显示部显示通话主叫方的用户a的账户的成员名和通话被叫方的账户的成员名等信息，以及用于通知来电的画面(S2004)。此处，令用户c与作为通话被叫方指定的账户的成员名一致。当通话被叫方的用户c接听来电时(S2005)，视频通话装置c发送接听响应。视频通话装置a接收来自视频通话装置c的接听响应，从而在视频通话装置a与视频通话装置c之间建立起用于进行视频通话的通信路径。

并且，视频通话装置c基于接收到的通话主叫方的用户a的账户的成员名，按照存储在视频通话装置c的个别信息存储区域中的与通话主叫方和通话被叫方对应的背景设定数据来设定背景图像(S2006)。之后反复执行处理S1720，直至从用户a或用户c接收到“通话结束”的选择输入。

以上的第四流程图之例所示的处理中，由于仅在作为通话被叫方指定的账户的成员名与在视频通话装置中通过登录用户设定处理而设定的用户名一致的视频通话装置上显示来电通知，所以即使在多个视频通话装置使用相同账户登录的情况下，也能够由指定的账户的成员接听来电。另外，因为通话对方的账户的成员名的信息等被发送过来，所以不需要使用从通话对方发送来的图像通过面孔识别来确定成员，不需要如图14所示与通话对方的账户关联着登记各成员的面孔图像数据14c和用于识别各成员的面孔的面孔识别数据14d。另外，在通话呼叫和来电接听的时刻能够确定通话对方的成员，所以能够按照与通话主叫方和通话被叫方的通话对方对应的背景设定数据来设定背景图像。

图21表示本发明实施方式的通话处理S523的流程图之第五例。在图21中，对于与图17的流程图相同的处理标注相同标记省略说明。

首先，视频通话装置a基于作为通话被叫方指定的账户的成员名，按照存储在视频通话装置a的个别信息存储区域中的与通话主叫方和通话被叫方对应的背景设定数据来设定背景图像(S2301)。接着，基于通话被叫方信息请求/获取处理S1101中获得的登录中的账户、视频通话装置的IP地址信息和成员名等通话被叫方信息决定呼叫目标的视频通话装置(S2302)，对使用作为通话被叫方指定的账户的成员登录的视频通话装置c发送通话呼叫(S2303)。

视频通话装置c在接收到通话人信息和通话呼叫时，在显示部上显示通话主叫方的用户a的账户的成员名和通话被叫方的账户的成员名等信息，以及用于通知来电的画面(S2304)。当通话被叫方的用户c接听来电时(S2305)，从视频通话装置c向视频通话装置a发送接听响应。视频通话装置a接收来自视频通话装置c的接听响应，在视频通话装置a与视频通话装置c之间建立起用于进行视频通话的通信路径。

并且，基于接收到的通话主叫方的用户a的账户的成员名，按照存储在视频通话装置c的个别信息存储区域中的与通话主叫方和通话被叫方对应的背景设定数据来设定背景图像(S2306)。之后反复执行处理S1720，直至从用户a或用户c接收到“通话结束”的选择输入。

以上的第五流程图之例所示的处理中，通过获取在通话被叫方信息请求/获取处理S1101中获取的登录中的账户、视频通话装置的IP地址和成员名等通话被叫方信息，仅在由作为通话被叫方指定的账户的成员进行登录的视频通话装置上显示来电通知，所以即使在多个视频通话装置使用相同账户登录的情况下，也能够由指定的账户的成员接听来电。另外，因为通话对方的账户的成员名的信息等被发送过来，所以不需要使用从通话对方发送来的图像通过面孔识别来确定成员，不需要如图14所示与通话对方的账户关联着登记各成员的面孔图像数据14c和用于识别各成员的面孔的面孔识别数据14d。另外，在通话呼叫和来电接听的时刻能够确定通话对方的成员，所以能够按照与通话主叫方和通话被叫方的通话对方对应的背景设定数据来设定背景图像。

图22是表示本发明实施方式的视频通话处理的流程图之第二例的图。在图22中，对于与图5的流程图相同的处理标注相同标记省略说明。图22中仅记载了用户a的视频通话装置a和视频通话服务器3的处理部分，其它用户的视频通话装置也进行同样的处理。

视频通话装置a的用户a从菜单画面选择视频通话应用，请求启动(S501a)。由此，启动视频通话应用(S502a)，访问视频通话服务器3请求/获取登录画面信息(S503a)。

接着，视频通话装置a显示登录画面(S504a)，当用户a输入了用户账户和密码后(S505a)，从视频通话装置a将输入的用户账户和密码这些登录信息发送到视频通话服务器3。

视频通话服务器3参照存储在存储部303中的用户信息，若是正当的注册用户则给予用户账户认证(S506a)。

然后，视频通话装置a基于从摄像部输入的用户的图像进行面孔识别处理(S507a、)。在通过面孔识别处理识别出的面孔与预先登记的账户的成员的面孔一致的情况下，作为登录的用户设定识别出的成员名，在与预先登记的账户的成员的面孔不一致的情况下，将登录的用户设定为账户名(S508a)。

此处，在识别出多个成员的情况下，将多个成员名设定为用户。接着，将作为用户设定的成员名等用户信息发送给视频通话服务器3(S540a)。视频通话服务器3根据用户信息将登录的账户名、视频通话装置的IP地址信息和成员名等信息存储到存储器302或存储部303中(S541a)。然后反复进行处理S510a直至用户选择“退出”。

图23是表示通话被叫方选择处理S522中的电视接收装置1的显示之另一例的图。

通过在图11的通话被叫方信息请求/获取处理S1101中获取视频通话服务器3在登录用户信息存储处理S541中存储的登录中的用户的账户名、成员名等信息，从而能够按通话被叫方的账户的每个成员名显示登录状态，指定通话被叫方。

在以上实施例中，作为确定通话被叫方的账户的成员的方法表示了通过面孔识别来进行的示例，但也可以预先存储通话被叫方的账户的成员的声音识别数据，通过声音识别来进行。另外，本实施例中根据通话主叫方和通话被叫方的成员来个别地设定背景图像，但不限于背景图像，也可以个别地设定其它项目，例如在通话被叫方为不容易听清声音的成员的情况下将音量设定得较大等。

另外，采用了将与账户关联着登记的成员名、与通话主叫方和通话被叫方的成员对应的背景图像的设定存储在视频通话装置的个别信息存储区域的结构，但不限于此，也可以作为用户信息存储在视频通话服务器的存储部303中。由此，无需对每个视频通话装置进行与账户关联着登记的成员名、与通话主叫方和通话被叫方的成员对应的背景图像的设定，而且能够按多个视频通话装置进行与通话主叫方和通话被叫方的成员对应的设定。

另外，本实施例中采用了在通话被叫方信息请求/获取处理S1101中从视频通话服务器3请求/获取通话被叫方信息的结构，但不限于此，也可以像Skype所使用的“超级节点”那样，对具有登录中的账户、视频通话装置的IP地址等信息的装置进行通话被叫方信息请求/获取。

另外，上述实施例中，为了易于理解地说明本发明而进行了详细说明，但本发明并不限定于必须包括所说明的全部结构。而且，对于各实施例的结构的一部分，能够添加、删除、置换成其它结构。而且，各实施例的流程能够在不脱离本发明的要点的范围内进行处理的追加、删除、置换、顺序变更。另外，就上述各结构、功能、处理部、处理单元等而言，它们的一部分或全部可以例如通过设计集成电路的方式以硬件实现。

并且，上述各结构、功能等也可以由处理器解释并执行实现各功能的程序来以软件实现。实现各功能的程序、表、文件等信息能够存储在存储器103或203，或者存储部104、204中。

另外，控制线和信息线表示说明上必要的部分，并不一定表示了产品上必需的全部的控制线和信息线。实际上，可以认为几乎所有的结构彼此连接。

附图标记说明

1：电视接收装置，2：终端装置，3：视频通话服务器，4、7：路由器，5：外部网络，101、201：控制部，102、202：通话人识别部，104、204：存储部，104a、204a：个别信息存储部，104c、204b：用户数据存储部，114、216：图像处理部，116、215：显示部，115、217：摄像部。

Claims

1.一种视频通话装置，其特征在于，包括：

拍摄图像的摄像部；

图像处理部，生成包括该摄像部拍摄的图像的图像信息；

通信部，将该图像处理部生成的图像信息发送给其它视频通话装置，并从该其它视频通话装置接收包括该其它视频通话装置的摄像部拍摄的图像的图像信息；

显示由该通信部接收到的来自所述其它视频通话装置的图像信息的显示部；

个别信息存储部，其存储账户信息、成员信息、通话人识别信息和个别设定信息，其中所述账户信息用于识别能够使用所述视频通话装置和/或所述其它视频通话装置进行通话的成员，所述成员信息是与所述账户信息关联登记的所述成员的信息，所述通话人识别信息用于识别使用所述视频通话装置的通话人和使用所述其它视频通话装置的通话人，所述个别设定信息与所述视频通话装置的成员和所述其它视频通话装置的成员的组合对应；

基于该个别信息存储部存储的通话人识别信息识别使用所述视频通话装置的通话人和使用所述其它视频通话装置的通话人的通话人识别部；和

控制部，基于该通话人识别部的识别结果和所述个别信息存储部存储的个别设定信息，对所述通信部向所述其它视频通话装置发送的图像信息或所述显示部显示的图像信息的显示进行设定。

2.如权利要求1所述的视频通话装置，其特征在于：

所述个别设定信息是与所述图像信息的背景图像有关的信息，

所述控制部控制所述图像处理部来基于所述通话人识别信息设定所述背景图像。

3.如权利要求1所述的视频通话装置，其特征在于：

所述通话人识别信息包括与所述摄像部拍摄的所述视频通话装置的成员的面孔有关的第一图像信息；和与由所述通信部接收到的所述其它视频通话装置的成员的面孔有关的第二图像信息，

所述通话人识别部基于根据所述摄像部在通话时拍摄的图像而生成的图像信息和所述第一图像信息来识别使用所述视频通话装置的通话人，并基于所述通信部在通话时接收到的与使用所述其它视频通话装置的通话人有关的图像信息和所述第二图像信息来识别使用所述其它视频通话装置的通话人。

4.如权利要求1所述的视频通话装置，其特征在于：

包括获取使用该视频通话装置的通话人所发出的声音的麦克风，

所述通话人识别部基于根据所述麦克风获取的声音而生成的声音信息来识别使用所述视频通话装置的通话人，并基于所述通信部接收到的声音信息来识别使用所述其它视频通话装置的通话人。

5.一种视频通话装置中的视频通话处理方法，用于在所述视频通话装置与其它视频通话装置之间经网络进行包括拍摄的图像的图像信息的通信，所述视频通话处理方法包括：

接收所述其它视频通话装置发送来的图像信息的接收步骤；

识别在该接收步骤中接收到所述图像信息时使用所述其它视频通话装置的通话人的识别步骤；

基于该识别步骤的识别结果将使用所述视频通话装置的通话人的图像与背景图像合成而生成合成图像的图像处理步骤；和

将该合成图像发送给所述其它视频通话装置的发送步骤。

6.如权利要求5所述的视频通话装置中的视频通话处理方法，其特征在于：

在所述识别步骤中，基于所述接收步骤中接收到的图像信息识别使用所述其它视频通话装置的通话人。

7.如权利要求5所述的视频通话装置中的视频通话处理方法，其特征在于：

在所述识别步骤中，基于所述接收步骤中与图像信息一起接收到的通话人信息识别使用所述其它视频通话装置的通话人，

所述视频通话处理方法包括将用于识别使用所述视频通话装置的通话人的通话人信息发送给所述其它视频通话装置的发送步骤。

8.如权利要求7所述的视频通话装置中的视频通话处理方法，其特征在于：

基于所述接收步骤中接收到的用于识别使用所述其它视频通话装置的通话人的通话人信息和用于识别使用所述视频通话装置的通话人的通话人信息来设定所述背景图像，

在所述图像处理步骤中，基于所述接收步骤中接收到的通话人信息生成合成图像，所述合成图像是选择使用所述视频通话装置的通话人的图像来与所述设定步骤中设定的背景图像合成的合成图像，

将所述图像处理步骤中生成的合成图像发送给所述其它视频通话装置。

9.如权利要求7所述的视频通话装置中的视频通话处理方法，其特征在于：

还包括显示步骤，在该显示步骤中，显示所述接收步骤中接收到的用于识别使用所述其它视频通话装置的通话人的通话人信息和用于识别使用所述视频通话装置的通话人的通话人信息。

10.一种视频通话系统中的视频通话处理方法，其特征在于：

所述视频通话系统包括视频通话装置、其它视频通话装置和视频通话服务器，其中所述视频通话服务器用于在所述视频通话装置与所述其它视频通话装置之间经网络进行包括拍摄的图像的图像信息的通信，

所述视频通话处理方法包括：

识别使用所述视频通话装置的通话人，生成与该通话人有关的通话人信息的识别步骤；

基于该识别步骤中生成的通话人信息选择所述视频通话装置要通信的其它视频通话装置的选择步骤；

获取步骤，获取与使用该选择步骤中选择的所述其它视频通话装置的通话人有关的通话人信息；和

发送步骤，对与该获取步骤中获取到的通话人信息对应的通话人所使用的所述其它视频通话装置，发送与使用所述视频通话装置的通话人有关的通话人信息，

其中，在所述选择步骤中，作为要通信的视频通话装置选择当前登录在所述视频通话服务器上的其它视频通话装置。