CN105450970B

CN105450970B - 一种信息处理方法及电子设备

Info

Publication number: CN105450970B
Application number: CN201410268632.6A
Authority: CN
Inventors: 王红光; 张磊
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2014-06-16
Filing date: 2014-06-16
Publication date: 2019-03-29
Anticipated expiration: 2034-06-16
Also published as: CN105450970A

Abstract

本发明公开了一种信息处理方法及电子设备，其中，接收来自于第二电子设备的第一请求信息；基于所述第一请求信息，开启所述第一图像采集单元；通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息，根据所述第二图像信息生成第一信息；将所述第一图像信息和第一信息进行整合，得到第一视频信息；如此，能够在不适合通过语音方式将相关信息传输给对方时，依然能够将相关的信息传递给对方，从而提升用户体验。

Description

一种信息处理方法及电子设备

技术领域

本发明涉及电子技术，尤其涉及一种信息处理方法及电子设备。

背景技术

视频通话又称视频电话，是指双方电子设备之间通过互联网或移动互联网技术来实现传送人的语音信息和图像信息的一种通信方式。视频通话以其良好地交互性、真实感受到越来越多的用户的青睐。但是用户在某些场合并不适合通过耳麦等语音采集单元来发送语音，例如，用户在开会的时候并不适合通过语音的方式传输给对方，此时如何将相关的信息传递给对方，成为需要解决的问题。

发明内容

有鉴于此，本发明实施例提供一种信息处理方法及电子设备，能够在不适合通过语音方式将相关信息传输给对方时，依然能够将相关的信息传递给对方，从而提升用户体验。

本发明实施例的技术方案是这样实现的：

第一方面，本发明实施例提供一种信息处理方法，应用于第一电子设备，所述第一电子设备具有第一图像采集单元，所述方法包括：

接收来自于第二电子设备的第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

基于所述第一请求信息，开启所述第一图像采集单元；

通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；

提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息，根据所述第二图像信息生成第一信息；

将所述第一图像信息和第一信息进行整合，得到第一视频信息。

第二方面，本发明实施例提供一种信息处理方法，应用第二电子设备，所述第二电子设备具有第一语音输出单元，所述方法包括：

向第一电子设备发送第一请求信息，所述第一请求信息用于表明所述第一电子设备向所述第二电子设备发起视频通信连接；

接收所述第一电子设备发送的第一视频信息，解析所述第一视频信息，得到第一图像信息和第一信息；

确定所述第一信息为文本信息时，获取与所述第一信息对应的第三语音信息，并将所述第三语音信息与所述第一图像信息整合，得到第二视频信息；

将所述第二视频信息输出。

第三方面，本发明实施例提供一种第一电子设备，所述第一电子设备具有第一图像采集单元，所述第一电子设备包括第一接收单元、第一开启单元、第一采集单元、提取单元和第一整合单元，其中：

所述第一接收单元，用于接收来自于第二电子设备的第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

所述第一开启单元，用于基于所述第一请求信息，开启所述第一图像采集单元；

所述第一采集单元，用于通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；

所述提取单元，用于提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息，根据所述第二图像信息生成第一信息；

所述第一整合单元，用于将所述第一图像信息和第一信息进行整合，得到第一视频信息。

第四方面，本发明实施例提供一种第二电子设备，所述第二电子设备具有第一语音输出单元，所述第二电子设备包括第二发送单元、第二接收单元、第二获取单元和输出单元，其中：

所述第二发送单元，用于向第一电子设备发送第一请求信息，所述第一请求信息用于表明所述第一电子设备向所述第二电子设备发起视频通信连接；

所述第二接收单元，用于接收所述第一电子设备发送的第一视频信息，解析所述第一视频信息，得到第一图像信息和第一信息；

所述第二获取单元，用于确定所述第一信息为文本信息时，获取与所述第一信息对应的第三语音信息，并将所述第三语音信息与所述第一图像信息整合，得到第二视频信息；

所述输出单元，用于将所述第二视频信息输出。

本发明实施例提供的一种信息处理方法及电子设备，其中，接收来自于第二电子设备的第一请求信息；基于所述第一请求信息，开启所述第一图像采集单元；通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息，根据所述第二图像信息生成第一信息；将所述第一图像信息和第一信息进行整合，得到第一视频信息；如此，能够在不适合通过语音方式将相关信息传输给对方时，依然能够将相关的信息传递给对方，从而提升用户体验。

附图说明

图1-1为本发明实施例应用场景的实现流程示意图；

图1-2为本发明实施例一信息处理方法的实现流程示意图一；

图1-3为本发明实施例一中检测口型的流程示意图一；

图1-4为本发明实施例一中步骤104的实现流程示意图；

图1-5为本发明实施例一信息处理方法的实现流程示意图二；

图2为本发明实施例二信息处理方法的实现流程示意图；

图3为本发明实施例三信息处理方法的实现流程示意图；

图4为本发明实施例四信息处理方法的实现流程示意图；

图5为本发明实施例五信息处理方法的实现流程示意图；

图6-1为本发明实施例六第一电子设备的组成结构示意图；

图6-2为本发明实施例六中生成单元的组成结构示意图；

图7为本发明实施例七第一电子设备的组成结构示意图；

图8为本发明实施例八第一电子设备的组成结构示意图；

图9为本发明实施例九第一电子设备的组成结构示意图；

图10为本发明实施例十第二电子设备的组成结构示意图；

图11为本发明实施例十一信息处理方法的实现流程示意图；

图12为本发明实施例十二交互系统的组成结构示意图。

具体实施方式

在本发明以下各实施例中，是基于这样的场景，如图1-1所示，第一用户11与第二用户12进行视频连接，所述第一用户11通过第一电子设备13、第二用户12通过第二电子设备14分别与对方建立视频连接；这时第一电子设备13和第二电子设备14分别可以从自身角度出发，认为自身为本端，而分别认为对方为对端，即：就第一电子设备而言，第二电子设备为对端；就第二电子设备而言，第一电子设备为对端。本发明的以下实施例中，虽然已第一电子设备、第二电子设备进行描述，但不是说明两者是完全不同的设备即完成的功能完全不同，事实上，两端设备是一样的，即对端完成的功能在本端也可以完成，这是因为本端也可以作为对端。

本发明实施例中，所述第一电子设备和所述第二电子设备都是电子设备中的一种，所述电子设备可以是个人计算机、笔记本电脑、平板电脑、智能手机等设备中的任意一种。

下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。

实施例一

本发明实施例提供一种信息处理方法，应用于第一电子设备，所述第一电子设备具有第一图像采集单元，图1-2为本发明实施例一信息处理方法的实现流程示意图，如图1-2所示，该方法包括：

步骤101，接收来自于第二电子设备的第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

步骤102，基于所述第一请求信息，开启所述第一图像采集单元；通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；

这里，所述第一图像采集单元可以为摄像头。

这里，所述操作体可以是用户，具体可以是第一用户。所述第一图像信息可以是二维数字图像信息、当然也可以是三维的数字图像信息，第一图像信息是二维还是三维，与第一图像采集单元的性能密切相关。

步骤103，提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息；

这里，所述预定子区域具体可以是面部区域，具体可以是唇部区域；当所述预定子区域为面部区域时，所述第二图像信息可以是面部图像信息；所述预定子区域为唇部区域时，参见图1-3，所述第二图像信息可以是唇部的口型图形信息。

步骤104，根据所述第二图像信息生成第一信息；

这里，所述第一信息可以为语音信息和/或文本信息。

步骤105，将所述第一图像信息和第一信息进行整合，得到第一视频信息。

这里，由于步骤104中的第一信息可以为语音信息，也可以是文本信息，还可以是语音信息和文本信息，因此所述第一视频信息可能是语音配合图像的形式，还可以是文本配合图像的形式，还可以是语音配合文本配合图像的形式，当第一视频信息为文本配合图像的形式时，文本类似于字幕，第一视频信息在第二电子设备端进行播放时类似于无声电影；所述第一视频信息为语音配合图像的形式时，第一视频信息在第二电子设备端进行播放时类似于有声电影；所述第一视频信息为语音配合文本配合图像的形式时。第一视频信息在第二电子设备端播放时类似于带字幕的有声电影。

本发明实施例中，当所述第一信息为语音信息时，如图1-4所示，所述步骤104包括：

步骤141，对所述第二图像信息进行唇语识别，得到第一文本信息；

步骤142，对所述第一文本信息进行配音，得到第一信息。

其中，所述对所述第一文本信息进行配音，可以按照第一用户的语音参数进行配音，还可以按照某些特定人物的语音参数进行配音，以得到第一语音信息。当所述第一信息为文本信息时，上述所述第一文本信息可以作为所述第一信息。其中，所述语音参数包括音强、音高、音色；所述特定人物可以是第二用户、可以是某些知名度较高的人物的语音参数，例如，可以用模仿某些播音员的语音参数来对第一文本信息进行配音。这样第二电子设备在播放第一视频信息，听到的声音有可能是第二用户的，有可能不是第二用户的，采用本实施例提供的技术方案，从而增加了趣味性。

本发明实施例中，如图1-5所示，在步骤105之后，所述方法还包括步骤106：将所述第一视频信息发送给所述第二电子设备。

这里，第二电子设备收到第一视频信息后，对所述第一视频信息输出给第二用户观看。

本发明实施例提供的技术方案，可以用于以下场景，第一用户与第二用户建立视频连接，但是第一用户正在开会，而第二用户正在向第一用户询问一件非常紧急的事情，由于第一用户正在开会，无法通过语音方式告知第二用户所询问的事情，因为第一用户不适合在开会的场合通过语音方式告知第二用户；在现有技术条件下，第一用户要么等到开会结束之后告诉第二用户所询问的事情，要么中断会议离开会场告诉第二用户所询问的事情；采用本发明实施例提供的技术方案，第一用户只需要对着图像采集单元作口型，这样第一电子设备就会根据口型进行唇语检测和识别，得到第一信息，该第一信息就是第一用户要传递给第二用户的信息。可见，本发明实施例提供的技术方案，能够在不适合通过语音方式将相关信息传输给对方时，依然能够将相关的信息传递给对方，从而提升用户体验。

实施例二

基于上述的实施例一，本发明实施例提供一种信息处理方法，应用于第一电子设备，所述第一电子设备具有第一图像采集单元和第一语音采集单元，图2为本发明实施例二信息处理方法的实现流程示意图，如图2所示，该方法包括：

步骤201，接收来自于第二电子设备的第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

步骤202，基于所述第一请求信息，开启所述第一图像采集单元，通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；

这里，所述第一图像采集单元可以为摄像头。

步骤203，提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息；

这里，所述预定子区域具体可以是面部区域，具体可以是唇部区域；当所述预定子区域为面部区域时，所述第二图像信息可以是面部图像信息，所述预定子区域为唇部区域时，所述第二图像信息可以是唇部的口型图形信息。

步骤204，根据所述第二图像信息生成第一信息；

这里，所述第一信息可以为语音信息和/或文本信息。

步骤205，基于所述第一请求信息，开启所述第一声音采集单元，通过所述第一语音采集单元采集第一语音信息；基于所述第一语音信息对所述第一信息进行修正，得到修正后的第一信息；

步骤206，将所述第一图像信息和修正后的第一信息进行整合，得到第一视频信息。

本发明实施例中，在步骤206之后，所述方法还包括：将所述第一视频信息发送给所述第二电子设备。

本发明实施例中，当所述第一信息为语音信息时，所述根据所述第二图像信息生成第一信息，包括：

步骤S1，对所述第二图像信息进行唇语识别，得到第一文本信息；

步骤S2，对所述第一文本信息进行配音，得到第一信息。

本发明实施例提供的技术方案能够用于下面的场景，即第一用户以很小的声音对着第一语音采集单元说话，这种很小的声音类似于窃窃私语的，也就是说所述语音参数中音强较小，而保留了音色和音高；由于距离所述第一语音采集单元较近，所述第一语音采集单元是可以采集到第一语音信息，所以采集到第一语音单元是可以用于对基于第二图像信息而得到的第一信息进行修正，然后将所述第一图像信息和修正后的第一信息进行整合，得到第一视频信息。如此，本发明实施例提供的技术方案，通过对第一信息进行修正，使得传递给第二用户的信息更为准确。

实施例三

基于上述的实施例一和实施例二，本发明实施例提供一种信息处理方法，应用于第一电子设备，所述第一电子设备具有第一图像采集单元，图3为本发明实施例三信息处理方法的实现流程示意图，如图3所示，该方法包括：

步骤301，接收来自于第二电子设备的第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

步骤302，基于所述第一请求信息，开启所述第一图像采集单元，通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；

这里，所述第一图像采集单元可以为摄像头。

步骤303，提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息；

步骤304，根据所述第二图像信息生成第一信息；

这里，所述第一信息可以为语音信息和/或文本信息。

步骤305，解析所述第一信息，当所述第一信息内容符合预定条件时，获取与所述第一信息对应的第二语音信息；

这里，所述预定条件可以是诗词片段信息、歌曲片段信息。所述获取与所述第一信息对应的第二语音信息，可以通过下面的方式：当确定所述第一信息中包括预定条件的信息时，可以以所述预定条件为关键词，检索得到与所述第一信息相关的第二语音信息。

步骤306，将所述第二语音信息与所述第一图像信息整合，得到第二视频信息。

本发明实施例中，在步骤306之后，所述方法还包括：将所述第一视频信息发送给所述第二电子设备。

步骤S2，对所述第一文本信息进行配音，得到第一信息。

本发明实施例提供的技术方案，可以用于以下场景，第一用户与第二用户建立视频连接，但是第一用户正在给第一用户唱一首歌，但是第一用户嗓子发炎了，这时候唱歌的话肯定会影响唱歌的效果，采用本发明实施例提供的技术方案，第一用户可以不出声音只作口型；这时，第一电子设备基于提取的第二图像信息生产第一信息，然后第一电子设备发现第一信息满足预定条件，即预定条件的设置为歌曲片段信息，然后根据所述第一信息获取第二语音信息，就该例而言，本实施例可以以下列方式实现获取第二语音信息，第一种方式可以采用第一用户的语音参数对第一用户所唱的歌曲进行配音，得到第二语音信息；第二种方式可以采用某歌手的语音参数对第一用户所唱的歌曲进行配音，得到第二语音信息；第三种方式是直接获取某歌手所唱的歌曲，得到第二语音信息。可见，本发明实施例提供的技术方案，能够在不适合通过语音方式将相关信息传输给对方时，依然能够将相关的信息传递给对方，从而提升用户体验。

实施例四

本发明实施例提供一种信息处理方法，应用于第一电子设备，所述第一电子设备具有第一图像采集单元，图4为本发明实施例四信息处理方法的实现流程示意图，如图4所示，该方法包括：

步骤401，接收来自于第二电子设备的第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

步骤402，基于所述第一请求信息，开启所述第一图像采集单元；通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；

这里，所述第一图像采集单元可以为摄像头。

步骤403，提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息；

步骤404，根据所述第二图像信息生成第一信息；

这里，所述第一信息可以为语音信息和/或文本信息。

步骤405，将所述第一图像信息和第一信息进行整合，得到第一视频信息；

步骤406，确定所述第一图像信息中未包括所述预定子区域的图像信息时，发出第一提示信息，所述第一提示信息用于提示用户调整所述第一图像采集单元。

这里，由于步骤404中的第一信息可以为语音信息，也可以是文本信息，还可以是语音信息和文本信息，因此所述第一视频信息可能是语音配合图像的形式，还可以是文本配合图像的形式，还可以是语音配合文本配合图像的形式，当第一视频信息为文本配合图像的形式时，文本类似于字幕，第一视频信息在第二电子设备端进行播放时类似于无声电影；所述第一视频信息为语音配合图像的形式时，第一视频信息在第二电子设备端进行播放时类似于有声电影；所述第一视频信息为语音配合文本配合图像的形式时。第一视频信息在第二电子设备端播放时类似于带字幕的有声电影。

步骤S2，对所述第一文本信息进行配音，得到第一信息。

本发明实施例中，在步骤405之后，所述方法还包括：将所述第一视频信息发送给所述第二电子设备。

实施例五

本发明实施例提供一种信息处理方法，应用第二电子设备，所述第二电子设备具有第一语音输出单元，图5为本发明实施例五信息处理方法的实现流程示意图，如图5所示，该方法包括：

步骤501，向第一电子设备发送第一请求信息，所述第一请求信息用于表明所述第一电子设备向所述第二电子设备发起视频通信连接；

步骤502，接收所述第一电子设备发送的第一视频信息，解析所述第一视频信息，得到第一图像信息和第一信息；

步骤503，确定所述第一信息为文本信息时，获取与所述第一信息对应的第三语音信息；

这里，所述获取与所述第一信息对应的第三语音信息，包括：可以按照第一用户的语音参数对第一信息进行配音，还可以按照某些特定人物的语音参数对第一信息进行配音，以得到第三语音信息。其中，所述语音参数包括音强、音高、音色；所述特定人物可以是第二用户、可以是某些知名度较高的人物的语音参数，例如，可以用模仿某些播音员的语音参数来对第一文本信息进行配音。这样第二电子设备在播放第一视频信息，听到的声音有可能是第二用户的，有可能不是第二用户的，采用本实施例提供的技术方案，从而增加了趣味性。

步骤504，将所述第三语音信息与所述第一图像信息整合，得到第二视频信息；

步骤505，将所述第二视频信息输出。

本发明实施例提供的技术方案，可以用于以下场景，第一用户与第二用户建立视频连接，但是第一用户正在开会，而第二用户正在向第一用户询问一件非常紧急的事情，由于第一用户正在开会，无法通过语音方式告知第二用户所询问的事情，因为第一用户不适合在开会的场合通过语音方式告知第二用户；采用本发明实施例提供的技术方案，第一用户只需要对着图像采集单元作口型，这样第一电子设备就会根据口型进行唇语检测和识别，得到第一信息，该第一信息为文本信息。然后将该第一信息发送第二电子设备，第二电子设备检测到第一信息为文本信息，将第一信息转化为声音信息，即第三语音信息，如此，本实施例提供的技术方案，在网络带宽以及网络信号的不稳定时，依然保证视频通话的质量，这是因为将语音信息转化为文本信息，传输的数据量会陡降，因而只需要很小的带宽即可以实现保证视频通话的质量，需要说明的是，在带宽不好的情况下，第一电子设备可以将第一图像信息转化为一个标识，第二电子设备解析发现是标识的时候，可以调取采用前几秒的之前图像信息，然后配上第三语音信息，从而第二用户不会感觉到视频通话的质量受到了影响，第二用户之所以不认为视频通话质量受到下降，是因为人们对声音的延迟或停顿的敏感度要比对图像的延迟或停顿敏感的多，本发明实施例正是利用这一点，在网络带宽不好的情况下依然保持用户能够有良好的体验感。

实施例六

本发明实施例提供一种第一电子设备，所述第一电子设备具有第一图像采集单元，图6-1为本发明实施例六第一电子设备的组成结构示意图，如图6-1所示，所述第一电子设备600包括第一接收单元601、第一开启单元602、第一采集单元603、提取单元604、生成单元605和第一整合单元606，其中：

所述第一接收单元601，用于接收来自于第二电子设备的第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

所述第一开启单元602，用于基于所述第一请求信息，开启所述第一图像采集单元；

所述第一采集单元603，用于通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；

所述提取单元604，用于提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息；

所述生成单元605，用于根据所述第二图像信息生成第一信息；

所述第一整合单元606，用于将所述第一图像信息和第一信息进行整合，得到第一视频信息。

这里，所述第一图像采集单元可以为摄像头。

这里，所述第一信息可以为语音信息和/或文本信息。由于第一信息可以为语音信息，也可以是文本信息，还可以是语音信息和文本信息，因此所述第一视频信息可能是语音配合图像的形式，还可以是文本配合图像的形式，还可以是语音配合文本配合图像的形式，当第一视频信息为文本配合图像的形式时，文本类似于字幕，第一视频信息在第二电子设备端进行播放时类似于无声电影；所述第一视频信息为语音配合图像的形式时，第一视频信息在第二电子设备端进行播放时类似于有声电影；所述第一视频信息为语音配合文本配合图像的形式时。第一视频信息在第二电子设备端播放时类似于带字幕的有声电影。

本发明实施例中，当所述第一信息为语音信息时，如图6-2所示，所述生成单元605包括识别模块651和配音模块652，其中：

所述识别模块651，用于对所述第二图像信息进行唇语识别，得到第一文本信息；

所述配音模块652，用于对所述第一文本信息进行配音，得到第一信息。

本发明实施例中，该第一电子设备还包括第一发送单元，用于将所述第一视频信息发送给所述第二电子设备。这里，第二电子设备收到第一视频信息后，对所述第一视频信息输出给第二用户观看。

实施例七

基于上述的实施例六，本发明实施例提供一种第一电子设备，所述第一电子设备具有第一图像采集单元和第一语音采集单元，图7为本发明实施例七第一电子设备的组成结构示意图，如图7所示，所述第一电子设备700包括第一接收单元701、第一开启单元702、第一采集单元703、提取单元704、生成单元705、第二开启单元706、修正单元707和第一整合单元708，其中：

所述第一接收单元701，用于接收来自于第二电子设备的第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

所述第一开启单元702，用于基于所述第一请求信息，开启所述第一图像采集单元；

所述第一采集单元703，用于通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；

这里，所述第一图像采集单元可以为摄像头。

所述提取单元704，用于提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息；

所述生成单元705，用于根据所述第二图像信息生成第一信息；

这里，所述第一信息可以为语音信息和/或文本信息。

所述第二开启单元706，用于基于所述第一请求信息，开启所述第一声音采集单元，通过所述第一语音采集单元采集第一语音信息；

所述修正单元707，用于基于所述第一语音信息对所述第一信息进行修正，得到修正后的第一信息。

所述第一整合单元708，用于将所述第一图像信息和修正后的第一信息进行整合，得到第一视频信息。

本发明实施例中，当所述第一信息为语音信息时，所述生成单元包括识别模块和配音模块，其中：

所述识别模块，用于对所述第二图像信息进行唇语识别，得到第一文本信息；

所述配音模块，用于对所述第一文本信息进行配音，得到第一信息。

实施例八

本发明实施例提供一种第一电子设备，所述第一电子设备具有第一图像采集单元，图8为本发明实施例八第一电子设备的组成结构示意图，如图8所示，所述第一电子设备800包括第一接收单元801、第一开启单元802、第一采集单元803、提取单元804、生成单元805、第一解析单元806、第一获取单元807和第一整合单元808，其中：

所述第一接收单元801，用于接收来自于第二电子设备的第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

所述第一开启单元802，用于基于所述第一请求信息，开启所述第一图像采集单元；

所述第一采集单元803，用于通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；

所述提取单元804，用于提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息；

所述生成单元805，用于根据所述第二图像信息生成第一信息；

所述第一解析单元806，用于解析所述第一信息，当所述第一信息内容符合预定条件时，触发所述第一获取单元；

所述第一获取单元807，用于获取与所述第一信息对应的第二语音信息；

所述第一整合单元808，用于将所述第二语音信息与所述第一图像信息整合，得到第二视频信息。

实施例九

本发明实施例提供一种第一电子设备，所述第一电子设备具有第一图像采集单元，图9为本发明实施例九第一电子设备的组成结构示意图，如图9所示，所述第一电子设备900包括第一接收单元901、第一开启单元902、第一采集单元903、提取单元904、生成单元905、第一整合单元906和发出单元907，其中：

所述第一接收单元901，用于接收来自于第二电子设备的第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

所述第一开启单元902，用于基于所述第一请求信息，开启所述第一图像采集单元；

所述第一采集单元903，用于通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；

所述提取单元904，用于提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息；

所述生成单元905，用于根据所述第二图像信息生成第一信息；

所述第一整合单元906，用于将所述第一图像信息和第一信息进行整合，得到第一视频信息。

所述发出单元907，用于确定所述第一图像信息中未包括所述预定子区域的图像信息时，发出第一提示信息，所述第一提示信息用于提示用户调整所述第一图像采集单元。

实施例十

本发明实施例提供一种第二电子设备，所述第二电子设备具有第一语音输出单元，图10为本发明实施例十第二电子设备的组成结构示意图，如图10所示，所述第二电子设备1000包括第二发送单元1001、第二接收单元1002、第二获取单元1003和输出单元1004，其中：

所述第二发送单元1001，用于向第一电子设备发送第一请求信息，所述第一请求信息用于表明所述第一电子设备向所述第二电子设备发起视频通信连接；

所述第二接收单元1002，用于接收所述第一电子设备发送的第一视频信息，解析所述第一视频信息，得到第一图像信息和第一信息；

所述第二获取单元1003，用于确定所述第一信息为文本信息时，获取与所述第一信息对应的第三语音信息，并将所述第三语音信息与所述第一图像信息整合，得到第二视频信息；

所述输出单元1004，用于将所述第二视频信息输出。

实施例十一

本发明实施例提供一种信息处理方法，应用于交互系统，所述交互系统包括第一电子设备和第二电子设备，所述第一电子设备具有第一图像采集单元，所述第二电子设备具有第一语音输出单元，图11为本发明实施例十一信息处理方法的实现流程示意图，如图11所示，所述方法包括：

步骤1101，第二电子设备向第一电子设备发送第一请求信息，所述第一请求信息用于表明所述第一电子设备向所述第二电子设备发起视频通信连接；

步骤1102，第一电子设备接收来自于第二电子设备的第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

步骤1103，第一电子设备基于所述第一请求信息，开启所述第一图像采集单元；

步骤1104，第一电子设备通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；

步骤1105，第一电子设备提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息，根据所述第二图像信息生成第一信息；

步骤1106，第一电子设备将所述第一图像信息和第一信息进行整合，得到第一视频信息；并向所述第二电子设备发送第一视频信息；

步骤1107，第二电子设备接收所述第一电子设备发送的第一视频信息，解析所述第一视频信息，得到第一图像信息和第一信息；

步骤1108，第二电子设备确定所述第一信息为文本信息时，获取与所述第一信息对应的第二语音信息，并将所述第一语音信息与所述第一图像信息整合，得到第二视频信息；

步骤1109，第二电子设备将所述第二视频信息输出。

实施例十二

本发明实施例提供一种交互系统，图12为本发明实施例十二交互系统的组成结构示意图，如图12所示，所述交互系统包括第一电子设备1210和第二电子设备1220，所述第一电子设备1210具有第一图像采集单元(图中未示出)，所述第二电子设备1220具有第一语音输出单元(图中未示出)，其中：所述第一电子设备1210包括第一接收单元1211、第一开启单元1212、第一采集单元1213、提取单元1214和第一整合单元1215；所述第二电子设备1220包括第二发送单元1221、第二接收单元1222、第二获取单元1223和输出单元1224，其中：

所述第二发送单元1221，用于向第一电子设备发送第一请求信息，所述第一请求信息用于表明所述第一电子设备向所述第二电子设备发起视频通信连接；

所述第一接收单元1211，用于接收来自于第二电子设备的第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

所述第一开启单元1212，用于基于所述第一请求信息，开启所述第一图像采集单元；

所述第一采集单元1213，用于通过所述第一图像采集单元采集操作体的第一图像，获得第一图像信息；

所述提取单元1214，用于提取所述第一图像信息中至少一个预定子区域的图像信息进行分析，获得第二图像信息，根据所述第二图像信息生成第一信息；

所述第一整合单元1215，用于将所述第一图像信息和第一信息进行整合，得到第一视频信息；

所述第一发送单元1216，用于向所述第二电子设备的第二接收单元发送第一视频信息；

所述第二接收单元1222，用于接收所述第一电子设备发送的第一视频信息，解析所述第一视频信息，得到第一图像信息和第一信息；

所述第二获取单元1223，用于确定所述第一信息为文本信息时，获取与所述第一信息对应的第二语音信息，并将所述第一语音信息与所述第一图像信息整合，得到第二视频信息；

所述输出单元1224，用于将所述第二视频信息输出。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种信息处理方法，应用于第一电子设备，所述第一电子设备具有第一图像采集单元和第一语音采集单元，所述方法包括：

基于所述第一请求信息，开启所述第一图像采集单元；

基于所述第一请求信息，开启所述第一语音采集单元，通过所述第一语音采集单元采集第一语音信息；基于所述第一语音信息对所述第一信息进行修正，得到修正后的第一信息；

将所述第一图像信息和修正后的第一信息进行整合，得到第一视频信息；

解析所述第一信息，当所述第一信息中包括预定条件的信息时，以所述预定条件为关键字，获取与所述第一信息对应的第二语音信息；

将所述第二语音信息与所述第一图像信息整合，得到第二视频信息。

2.根据权利要求1所述的方法，其特征在于，所述第一信息为语音信息和/或文本信息。

3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

确定所述第一图像信息中未包括所述预定子区域的图像信息时，发出第一提示信息，所述第一提示信息用于提示用户调整所述第一图像采集单元。

4.一种信息处理方法，应用第二电子设备，所述第二电子设备具有第一语音输出单元，所述方法包括：

向第一电子设备发送第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

将所述第二视频信息输出；

解析所述第一信息，当所述第一信息中包括预定条件的信息时，以所述预定条件为关键字，获取与所述第一信息对应的第四语音信息；

将所述第四语音信息与所述第一图像信息整合，得到第三视频信息。

5.一种第一电子设备，所述第一电子设备具有第一图像采集单元和第一语音采集单元，所述第一电子设备包括第一接收单元、第一开启单元、第一采集单元、提取单元、第一整合单元、第二开启单元、修正单元、第一解析单元和第一获取单元，其中：

所述第二开启单元，用于基于所述第一请求信息，开启所述第一语音采集单元，通过所述第一语音采集单元采集第一语音信息；

所述修正单元，用于基于所述第一语音信息对所述第一信息进行修正，得到修正后的第一信息；

所述第一整合单元，用于将所述第一图像信息和修正后的第一信息进行整合，得到第一视频信息；

所述第一解析单元，用于解析所述第一信息，当所述第一信息中包括预定条件的信息时，以所述预定条件为关键字，触发所述第一获取单元；

所述第一获取单元，用于获取与所述第一信息对应的第二语音信息；

对应地，所述第一整合单元，用于将所述第二语音信息与所述第一图像信息整合，得到第二视频信息。

6.根据权利要求5所述的第一电子设备，其特征在于，所述第一信息为语音信息和/或文本信息。

7.根据权利要求5或6所述的第一电子设备，其特征在于，所述第一电子设备还包括发出单元，用于确定所述第一图像信息中未包括所述预定子区域的图像信息时，发出第一提示信息，所述第一提示信息用于提示用户调整所述第一图像采集单元。

8.一种第二电子设备，所述第二电子设备具有第一语音输出单元，所述第二电子设备包括第二发送单元、第二接收单元、第二获取单元、输出单元、第二解析单元、第二获取单元和第二整合单元，其中：

所述第二发送单元，用于向第一电子设备发送第一请求信息，所述第一请求信息用于表明所述第二电子设备向所述第一电子设备发起视频通信连接；

所述输出单元，用于将所述第二视频信息输出；

所述第二解析单元，用于解析所述第一信息，当所述第一信息中包括预定条件的信息时，以所述预定条件为关键字，触发所述第二获取单元；

所述第二获取单元，用于获取与所述第一信息对应的第四语音信息；

对应地，所述第二整合单元，用于将所述第四语音信息与所述第一图像信息整合，得到第三视频信息。