CN106303694A

CN106303694A - 一种多媒体幻灯片制备的方法

Info

Publication number: CN106303694A
Application number: CN201510356393.4A
Authority: CN
Inventors: 张会军
Original assignee: Shanghai Zhi Sen Network Technology Co Ltd
Current assignee: Shanghai Zhi Sen Network Technology Co Ltd
Priority date: 2015-06-25
Filing date: 2015-06-25
Publication date: 2017-01-04

Abstract

本发明涉及数字多媒体领域，尤其涉及一种多媒体幻灯片制备的方法，根据景深摄像头拍摄到的景深信息，计算得出景深均值，将该景深均值内的图像提取出来并与先前的幻灯片结合形成视频文档，最后将语音数据同步至该视频文档内，从而使得输出的景深文档可以根据需要由用户自行调整，满足不同用户的个性化需求。

Description

一种多媒体幻灯片制备的方法

技术领域

本发明涉及数字多媒体领域，尤其涉及一种多媒体幻灯片制备的方法。

背景技术

幻灯片作为目前会议演示内容的主要辅助呈现方式之一，被广泛使用。但由于历史、技术等方面的原因，幻灯片存在一些功能方面的局限性，其主要局限性在于目前的幻灯片制作软件没有将演讲者影像、语音有机结合到一起。其导致的结果就是：一旦脱离了演讲人，即使幻灯片附带语音旁白，这样的幻灯片也会显得不够生动、形象，其会议演示效果也将会大打折扣。

现在一般的网络教学视频都是演讲者站在演示幻灯片投影旁并一起拍摄成视频，可以部分弥补上述局限性，但由于光线反射、拍摄距离、投影幕布大小等因素影响，这种拍摄方法会降低幻灯片的显示质量，甚至字体模糊，无法识读。

目前也有一些视频编辑软件，可以将演讲者影像、语音与幻灯片合成到一起，但需要纯色背景作为拍摄场景，视频编辑也需要一定专业知识的技术人员，同时需要花费较长时间做视频编辑处理，这样的幻灯片视频合成由于其费工、费时、专业性强等特点，而无法被广大企业和会议演示人员所接受。

所以亟需一种新型的3D幻灯片，以使得用户可以根据自身需要，对3D图像的景深信息进行调整，以满足不同用户的个性需求。

发明内容

鉴于上述问题，本发明提供一种多媒体幻灯片制备的方法。

一种多媒体幻灯片制备的方法，其特征在于，包括：

首先，提供一视频格式的幻灯片；

然后，利用景深摄像头将所述幻灯片演讲者与所述演讲者所处环境背景分离，并将分离后的所述演讲者与所述幻灯片合成并输出视频文档；

最后，将所述幻灯片演讲者语音数据同步合成至所述视频文档形成所述多媒体幻灯片。

上述的方法，其特征在于，所述景深摄像头包括有景深调整单元，所述景深调整单元用以接收并处理所述幻灯片演讲者和所述幻灯片演讲者所处环境背景的景深信息。

上述的方法，其特征在于，所述景深信息包括有所述幻灯片演讲者和所述幻灯片演讲者所处环境背景的景象信息和景深数据。

上述的方法，其特征在于，所述景深摄像头还包括有景物摄像单元，所述景物摄像单元与所述景深调整单元连接，所述景物摄像单元用以获取所述幻灯片演讲者和所述幻灯片演讲者所处环境背景的景象信息，并将所述景象信息传输至所述景深调整单元内。

上述的方法，其特征在于，所述方法还包括：

根据所述景象信息和所述景深数据计算得出景深均值，所述景深调整单元对处于所述景深均值位置的景象进行提取，以使所述幻灯片演讲者与所述幻灯片演讲者所处环境背景分离。

上述的方法，其特征在于，所述景深调整单元还包括有景深生成单元、景深参数输入单元和景深计算单元；且

所述景深生成单元用以接收所述景象信息和所述景深数据并合成所述景深信息，并将所述景深信息传输到所述景深计算单元；

所述景深参数输入单元用来接收景深参数，并将所述景深参数传输到所述景深计算单元；

所述计算单元根据所述景深信息和所述景深参数计算得出所述景深均值。

上述的方法，其特征在于，所述方法还包括：

将分离后的所述演讲者转换成卡通人物形象。

上述的方法，其特征在于，所述方法还包括：

通过实时图像边缘模糊和图像噪点过滤工艺对所述多媒体幻灯片进行优化。

综上所述，本发明提出了一种多媒体幻灯片制备的方法，根据景深摄像头获得的景深信息，计算得出景深均值，将该景深均值内的图像提取出来并与先前的幻灯片结合形成视频文档，最后将语音数据同步至该视频文档内，从而使得输出的3D景深文档可以根据需要由用户自行调整，满足不同用户的个性化需求。

附图说明

参考所附附图，以更加充分的描述本发明的实施例。然而，所附附图仅用于说明和阐述，并不构成对本发明范围的限制。

图1是本发明结构示意图；

图2是本发明操作流程图。

具体实施方式

为了使本发明的技术方案及优点更加易于理解，下面结合附图作进一步详细说明。应当说明，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1、图2所示，本发明设计的一种多媒体幻灯片制备的方法，该方法包括有：

首先，提供一视频格式的幻灯片，该视频格式的幻灯片就是将常规幻灯片的格式转换成视频格式文档，就是将.ppt的形式转换成.avi或者其他任何一种视频格式，即在观看的时候不是仅仅幻灯片每张图片的变换，而是由一个视频格式流畅的播放原幻灯片上的内容。

然后，利用目前现有的景深摄像头将原幻灯片演讲者与该演讲者所处的环境背景分离，就是单单得到一个演讲者的景象，而没有背景。将分离后的演讲者与刚才得到的视频格式的幻灯片结合起来，这样就能看到一个人物形象在幻灯片上，形象清晰，内容完整。这样的设计弥补了目前一般网络中仅仅通过拍摄演讲者演讲幻灯片形成的视频的局限性，因为目前这样拍摄形成的视频光线反射不均匀，拍摄距离远近不易调节，且投影幕布的质量差，形成的视频中幕布上的字体模糊，有时无法识读。

最后，利用集成麦克风的计算机将演讲者的语音数据同步合成到形成的视频文档内，这样最终形成需要的多媒体幻灯片。

在本发明中，景深摄像头只是一个概述，包括有很多其他工作单元，其中就包括有景深调整单元，该景深调整单元用以接收并处理幻灯片演讲者区域和演讲者背景区域的景深信息。在景深摄像头拍摄到的整个图像区域内包括前景图像区域和背景图像区域，前景图像区域就是上述的幻灯片演讲者所处的图像区域，而背景图像区域就是上述的该演讲者所处的环境背景区域，两个区域的图像的景深信息传输给景深调整单元，然后景深调整单元将前景图像区域（即演讲者所处的景象区域）提取出来，这样就达到了幻灯片演讲者与演讲者所处环境背景分离的效果。两个区域的景深信息包括有幻灯片演讲者和幻灯片演讲者所处环境背景的景象信息和景深数据。

其中，景深摄像头内还包括有景物摄像单元，该景物摄像单元获取幻灯片演讲者区域和幻灯片演讲者所处环境背景区域的景象信息，然后根据这个景象信息和上述的景深数据计算得出了一个景深均值，而景深调整单元就是根据这个景深均值进行提取需要的图像的。具体的是景深均值一定误差范围内的图像区域内的图像被景深摄像头捕捉到了，然后景深调整单元将这个景深均值误差范围内的图像与背景区域图像分离，得到这个景深均值附近的图像。

在本发明中，景深调整单元包括有景深生成单元、景深参数输入单元和景深计算单元。景深生成单元用以接收演讲者所处环境背景和演讲者的景象信息和景深数据，然后将该景象信息和景深数据合成景深信息，并将景深信息传输到景深计算单元。景深参数输入单元用来接收景深参数，并将所述景深参数传输到景深计算单元。而最终就是景深计算单元根据景深信息和景深参数计算得出上述的景深均值。

景深参数输入单元接收用户输入的景深参数，该景深参数包括有演讲者所处环境背景被调整后的比例。该景深参数输入单元具体实现可以通过提供景深参数输入菜单的方式，在景深调整参数输入菜单中设置选项，当选中某一选项时，对应的进行景深参数的调整，然后该景深参数输入单元输入对应的景深参数。

当用户对合成视频中演讲者的需求不是很重要的时候，就可以将其在视频中的比例进行调整，以突出幻灯片内容。然而目前社会中各种行业都用到多媒体，比如在儿童教育领域，为了教学质量更高，使儿童在教学过程中的注意力更集中，或者说是更能有兴趣的关注要演讲的东西，可以将分离出来的演讲者通过比对人体骨骼活动特征，将演讲人转换成熊猫或者其他动物，亦或者是卡通人物。其实这就是在计算机中首先建立一个虚拟的世界，设计师在这个虚拟的三维世界中按照要表现的对象的形状尺寸建立模型，再根据人体骨骼活动特征的运动轨迹、虚拟摄影机的运动和其它动画参数，最后按要求赋上特定的材质，并打上灯光，当这一切完成后就可以让计算机自动运算，生成最后的动物形象或者卡通人物形象。

这样的面对儿童教育领域的多媒体幻灯片更加的生动形象，且有吸引力。

最后就是将演讲者的语音数据同步合成至做好的视频中，这样形成一个比较粗糙的视频，还需要通过实时图像边缘模糊、图像噪点过滤等图像处理技术，进一步优化幻灯片合成的质量。

下面结合具体实施例进行说明

具体实施例一

将目前会议演示幻灯片的演讲人物音视频和幻灯片进行3D景深合成，该技术除需要集成麦克风的计算机外，还需要使用微软Kinect、英特尔Realsense、华硕Xtion Pro Live等带3D景深数据的摄像头硬件设备，其合成技术主要通过以下步骤完成合成过程：

步骤1、将幻灯片标准格式文档转换成幻灯片视频格式文档，如使用微软PowerPoint软件开发接口或幻灯片播放电脑屏幕录像将幻灯片转换成视频格式文档；

步骤2、使用3D景深摄像头拍摄演讲者影像并获取该3D景深摄像头的景物图像和景深数据；

步骤3、利用人脸识别技术识别出人物脸部在“步骤2”景物图像中的像素位置；

步骤4、获取“步骤3”人脸像素位置对应“步骤2”的景深数据并计算景深均值，将所有处于该景深均值位置一定误差范围“步骤2”的全部景物图像对应提取出来；

步骤5、读取“步骤1”幻灯片视频格式文档并按演讲进度播放，然后将幻灯片播放图像与“步骤4”的图像合成并输出为视频格式文档。

步骤6、获取麦克风语音数据，并实时与“步骤5”视频文件合成，或录音完成后再与“步骤5”视频文件做后期合成。

在本发明中，利用景深数据将人物与环境背景进行分离，再与幻灯片视频进行合成。

对上述技术细节进一步分析，可以通过比对人体骨骼活动特征，将人体活动转换成熊猫、卡通人物等动画形象，面向儿童教育领域的会议演示会更加的生动形象，有吸引力。

经上述步骤处理，即可初步完成本专利的技术步骤，通过实时图像边缘模糊、图像噪点过滤等图像处理技术，可进一步优化幻灯片合成质量。

本发明提出了一种多媒体幻灯片制备的方法，根据景深摄像头拍摄到的景深信息，计算得出景深均值，将该景深均值内的图像提取出来并与先前的幻灯片结合形成视频文档，最后将语音数据同步至该视频文档内，从而使得输出的3D景深文档可以根据需要由用户自行调整，满足不同用户的个性化需求。

通过说明和附图，给出了具体实施方式的特定结构的典型实施例，基于本发明景深，还可作其他的转换。尽管上述发明提出了现有的较佳实施例，然而，这些内容并不作为局限。

对于本领域的技术人员而言，阅读上述说明后，各种变化和修正无疑将显而易见。因此，所附的权利要求书应看作是涵盖本发明的真实意图和范围的全部变化和修正。在权利要求书范围内任何和所有等价的范围与内容，都应认为仍属本发明的意图和范围内。

Claims

1.一种多媒体幻灯片制备的方法，其特征在于，包括：

首先，提供一视频格式的幻灯片；

2.根据权利要求1所述的方法，其特征在于，所述景深摄像头包括有景深调整单元，所述景深调整单元用以接收并处理所述幻灯片演讲者和所述幻灯片演讲者所处环境背景的景深信息。

3.根据权利要求2所述的方法，其特征在于，所述景深信息包括有所述幻灯片演讲者和所述幻灯片演讲者所处环境背景的景象信息和景深数据。

4.根据权利要求2所述的方法，其特征在于，所述景深摄像头还包括有景物摄像单元，所述景物摄像单元与所述景深调整单元连接，所述景物摄像单元用以获取所述幻灯片演讲者和所述幻灯片演讲者所处环境背景的景象信息，并将所述景象信息传输至所述景深调整单元内。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，所述景深调整单元还包括有景深生成单元、景深参数输入单元和景深计算单元；且

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

将分离后的所述演讲者转换成卡通人物形象。

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：