CN106303694A - 一种多媒体幻灯片制备的方法 - Google Patents

一种多媒体幻灯片制备的方法 Download PDF

Info

Publication number
CN106303694A
CN106303694A CN201510356393.4A CN201510356393A CN106303694A CN 106303694 A CN106303694 A CN 106303694A CN 201510356393 A CN201510356393 A CN 201510356393A CN 106303694 A CN106303694 A CN 106303694A
Authority
CN
China
Prior art keywords
depth
field
speaker
lantern slide
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510356393.4A
Other languages
English (en)
Inventor
张会军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhi Sen Network Technology Co Ltd
Original Assignee
Shanghai Zhi Sen Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhi Sen Network Technology Co Ltd filed Critical Shanghai Zhi Sen Network Technology Co Ltd
Priority to CN201510356393.4A priority Critical patent/CN106303694A/zh
Publication of CN106303694A publication Critical patent/CN106303694A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明涉及数字多媒体领域,尤其涉及一种多媒体幻灯片制备的方法,根据景深摄像头拍摄到的景深信息,计算得出景深均值,将该景深均值内的图像提取出来并与先前的幻灯片结合形成视频文档,最后将语音数据同步至该视频文档内,从而使得输出的景深文档可以根据需要由用户自行调整,满足不同用户的个性化需求。

Description

一种多媒体幻灯片制备的方法
技术领域
本发明涉及数字多媒体领域,尤其涉及一种多媒体幻灯片制备的方法。
背景技术
幻灯片作为目前会议演示内容的主要辅助呈现方式之一,被广泛使用。但由于历史、技术等方面的原因,幻灯片存在一些功能方面的局限性,其主要局限性在于目前的幻灯片制作软件没有将演讲者影像、语音有机结合到一起。其导致的结果就是:一旦脱离了演讲人,即使幻灯片附带语音旁白,这样的幻灯片也会显得不够生动、形象,其会议演示效果也将会大打折扣。
现在一般的网络教学视频都是演讲者站在演示幻灯片投影旁并一起拍摄成视频,可以部分弥补上述局限性,但由于光线反射、拍摄距离、投影幕布大小等因素影响,这种拍摄方法会降低幻灯片的显示质量,甚至字体模糊,无法识读。
目前也有一些视频编辑软件,可以将演讲者影像、语音与幻灯片合成到一起,但需要纯色背景作为拍摄场景,视频编辑也需要一定专业知识的技术人员,同时需要花费较长时间做视频编辑处理,这样的幻灯片视频合成由于其费工、费时、专业性强等特点,而无法被广大企业和会议演示人员所接受。
所以亟需一种新型的3D幻灯片,以使得用户可以根据自身需要,对3D图像的景深信息进行调整,以满足不同用户的个性需求。
发明内容
鉴于上述问题,本发明提供一种多媒体幻灯片制备的方法。
一种多媒体幻灯片制备的方法,其特征在于,包括:
首先,提供一视频格式的幻灯片;
然后,利用景深摄像头将所述幻灯片演讲者与所述演讲者所处环境背景分离,并将分离后的所述演讲者与所述幻灯片合成并输出视频文档;
最后,将所述幻灯片演讲者语音数据同步合成至所述视频文档形成所述多媒体幻灯片。
上述的方法,其特征在于,所述景深摄像头包括有景深调整单元,所述景深调整单元用以接收并处理所述幻灯片演讲者和所述幻灯片演讲者所处环境背景的景深信息。
上述的方法,其特征在于,所述景深信息包括有所述幻灯片演讲者和所述幻灯片演讲者所处环境背景的景象信息和景深数据。
上述的方法,其特征在于,所述景深摄像头还包括有景物摄像单元,所述景物摄像单元与所述景深调整单元连接,所述景物摄像单元用以获取所述幻灯片演讲者和所述幻灯片演讲者所处环境背景的景象信息,并将所述景象信息传输至所述景深调整单元内。
上述的方法,其特征在于,所述方法还包括:
根据所述景象信息和所述景深数据计算得出景深均值,所述景深调整单元对处于所述景深均值位置的景象进行提取,以使所述幻灯片演讲者与所述幻灯片演讲者所处环境背景分离。
上述的方法,其特征在于,所述景深调整单元还包括有景深生成单元、景深参数输入单元和景深计算单元;且
所述景深生成单元用以接收所述景象信息和所述景深数据并合成所述景深信息,并将所述景深信息传输到所述景深计算单元;
所述景深参数输入单元用来接收景深参数,并将所述景深参数传输到所述景深计算单元;
所述计算单元根据所述景深信息和所述景深参数计算得出所述景深均值。
上述的方法,其特征在于,所述方法还包括:
将分离后的所述演讲者转换成卡通人物形象。
上述的方法,其特征在于,所述方法还包括:
通过实时图像边缘模糊和图像噪点过滤工艺对所述多媒体幻灯片进行优化。
综上所述,本发明提出了一种多媒体幻灯片制备的方法,根据景深摄像头获得的景深信息,计算得出景深均值,将该景深均值内的图像提取出来并与先前的幻灯片结合形成视频文档,最后将语音数据同步至该视频文档内,从而使得输出的3D景深文档可以根据需要由用户自行调整,满足不同用户的个性化需求。
附图说明
参考所附附图,以更加充分的描述本发明的实施例。然而,所附附图仅用于说明和阐述,并不构成对本发明范围的限制。
图1是本发明结构示意图;
图2是本发明操作流程图。
具体实施方式
为了使本发明的技术方案及优点更加易于理解,下面结合附图作进一步详细说明。应当说明,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1、图2所示,本发明设计的一种多媒体幻灯片制备的方法,该方法包括有:
首先,提供一视频格式的幻灯片,该视频格式的幻灯片就是将常规幻灯片的格式转换成视频格式文档,就是将.ppt的形式转换成.avi或者其他任何一种视频格式,即在观看的时候不是仅仅幻灯片每张图片的变换,而是由一个视频格式流畅的播放原幻灯片上的内容。
然后,利用目前现有的景深摄像头将原幻灯片演讲者与该演讲者所处的环境背景分离,就是单单得到一个演讲者的景象,而没有背景。将分离后的演讲者与刚才得到的视频格式的幻灯片结合起来,这样就能看到一个人物形象在幻灯片上,形象清晰,内容完整。这样的设计弥补了目前一般网络中仅仅通过拍摄演讲者演讲幻灯片形成的视频的局限性,因为目前这样拍摄形成的视频光线反射不均匀,拍摄距离远近不易调节,且投影幕布的质量差,形成的视频中幕布上的字体模糊,有时无法识读。
最后,利用集成麦克风的计算机将演讲者的语音数据同步合成到形成的视频文档内,这样最终形成需要的多媒体幻灯片。
在本发明中,景深摄像头只是一个概述,包括有很多其他工作单元,其中就包括有景深调整单元,该景深调整单元用以接收并处理幻灯片演讲者区域和演讲者背景区域的景深信息。在景深摄像头拍摄到的整个图像区域内包括前景图像区域和背景图像区域,前景图像区域就是上述的幻灯片演讲者所处的图像区域,而背景图像区域就是上述的该演讲者所处的环境背景区域,两个区域的图像的景深信息传输给景深调整单元,然后景深调整单元将前景图像区域(即演讲者所处的景象区域)提取出来,这样就达到了幻灯片演讲者与演讲者所处环境背景分离的效果。两个区域的景深信息包括有幻灯片演讲者和幻灯片演讲者所处环境背景的景象信息和景深数据。
其中,景深摄像头内还包括有景物摄像单元,该景物摄像单元获取幻灯片演讲者区域和幻灯片演讲者所处环境背景区域的景象信息,然后根据这个景象信息和上述的景深数据计算得出了一个景深均值,而景深调整单元就是根据这个景深均值进行提取需要的图像的。具体的是景深均值一定误差范围内的图像区域内的图像被景深摄像头捕捉到了,然后景深调整单元将这个景深均值误差范围内的图像与背景区域图像分离,得到这个景深均值附近的图像。
在本发明中,景深调整单元包括有景深生成单元、景深参数输入单元和景深计算单元。景深生成单元用以接收演讲者所处环境背景和演讲者的景象信息和景深数据,然后将该景象信息和景深数据合成景深信息,并将景深信息传输到景深计算单元。景深参数输入单元用来接收景深参数,并将所述景深参数传输到景深计算单元。而最终就是景深计算单元根据景深信息和景深参数计算得出上述的景深均值。
景深参数输入单元接收用户输入的景深参数,该景深参数包括有演讲者所处环境背景被调整后的比例。该景深参数输入单元具体实现可以通过提供景深参数输入菜单的方式,在景深调整参数输入菜单中设置选项,当选中某一选项时,对应的进行景深参数的调整,然后该景深参数输入单元输入对应的景深参数。
当用户对合成视频中演讲者的需求不是很重要的时候,就可以将其在视频中的比例进行调整,以突出幻灯片内容。然而目前社会中各种行业都用到多媒体,比如在儿童教育领域,为了教学质量更高,使儿童在教学过程中的注意力更集中,或者说是更能有兴趣的关注要演讲的东西,可以将分离出来的演讲者通过比对人体骨骼活动特征,将演讲人转换成熊猫或者其他动物,亦或者是卡通人物。其实这就是在计算机中首先建立一个虚拟的世界,设计师在这个虚拟的三维世界中按照要表现的对象的形状尺寸建立模型,再根据人体骨骼活动特征的运动轨迹、虚拟摄影机的运动和其它动画参数,最后按要求赋上特定的材质,并打上灯光,当这一切完成后就可以让计算机自动运算,生成最后的动物形象或者卡通人物形象。
这样的面对儿童教育领域的多媒体幻灯片更加的生动形象,且有吸引力。
最后就是将演讲者的语音数据同步合成至做好的视频中,这样形成一个比较粗糙的视频,还需要通过实时图像边缘模糊、图像噪点过滤等图像处理技术,进一步优化幻灯片合成的质量。
下面结合具体实施例进行说明
具体实施例一
将目前会议演示幻灯片的演讲人物音视频和幻灯片进行3D景深合成,该技术除需要集成麦克风的计算机外,还需要使用微软Kinect、英特尔Realsense、华硕Xtion Pro Live等带3D景深数据的摄像头硬件设备,其合成技术主要通过以下步骤完成合成过程:
步骤1、将幻灯片标准格式文档转换成幻灯片视频格式文档,如使用微软PowerPoint软件开发接口或幻灯片播放电脑屏幕录像将幻灯片转换成视频格式文档;
步骤2、使用3D景深摄像头拍摄演讲者影像并获取该3D景深摄像头的景物图像和景深数据;
步骤3、利用人脸识别技术识别出人物脸部在“步骤2”景物图像中的像素位置;
步骤4、获取“步骤3”人脸像素位置对应“步骤2”的景深数据并计算景深均值,将所有处于该景深均值位置一定误差范围“步骤2”的全部景物图像对应提取出来;
步骤5、读取“步骤1”幻灯片视频格式文档并按演讲进度播放,然后将幻灯片播放图像与“步骤4”的图像合成并输出为视频格式文档。
步骤6、获取麦克风语音数据,并实时与“步骤5”视频文件合成,或录音完成后再与“步骤5”视频文件做后期合成。
在本发明中,利用景深数据将人物与环境背景进行分离,再与幻灯片视频进行合成。
对上述技术细节进一步分析,可以通过比对人体骨骼活动特征,将人体活动转换成熊猫、卡通人物等动画形象,面向儿童教育领域的会议演示会更加的生动形象,有吸引力。
经上述步骤处理,即可初步完成本专利的技术步骤,通过实时图像边缘模糊、图像噪点过滤等图像处理技术,可进一步优化幻灯片合成质量。
本发明提出了一种多媒体幻灯片制备的方法,根据景深摄像头拍摄到的景深信息,计算得出景深均值,将该景深均值内的图像提取出来并与先前的幻灯片结合形成视频文档,最后将语音数据同步至该视频文档内,从而使得输出的3D景深文档可以根据需要由用户自行调整,满足不同用户的个性化需求。
通过说明和附图,给出了具体实施方式的特定结构的典型实施例,基于本发明景深,还可作其他的转换。尽管上述发明提出了现有的较佳实施例,然而,这些内容并不作为局限。
对于本领域的技术人员而言,阅读上述说明后,各种变化和修正无疑将显而易见。因此,所附的权利要求书应看作是涵盖本发明的真实意图和范围的全部变化和修正。在权利要求书范围内任何和所有等价的范围与内容,都应认为仍属本发明的意图和范围内。

Claims (8)

1.一种多媒体幻灯片制备的方法,其特征在于,包括:
首先,提供一视频格式的幻灯片;
然后,利用景深摄像头将所述幻灯片演讲者与所述演讲者所处环境背景分离,并将分离后的所述演讲者与所述幻灯片合成并输出视频文档;
最后,将所述幻灯片演讲者语音数据同步合成至所述视频文档形成所述多媒体幻灯片。
2.根据权利要求1所述的方法,其特征在于,所述景深摄像头包括有景深调整单元,所述景深调整单元用以接收并处理所述幻灯片演讲者和所述幻灯片演讲者所处环境背景的景深信息。
3.根据权利要求2所述的方法,其特征在于,所述景深信息包括有所述幻灯片演讲者和所述幻灯片演讲者所处环境背景的景象信息和景深数据。
4.根据权利要求2所述的方法,其特征在于,所述景深摄像头还包括有景物摄像单元,所述景物摄像单元与所述景深调整单元连接,所述景物摄像单元用以获取所述幻灯片演讲者和所述幻灯片演讲者所处环境背景的景象信息,并将所述景象信息传输至所述景深调整单元内。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
根据所述景象信息和所述景深数据计算得出景深均值,所述景深调整单元对处于所述景深均值位置的景象进行提取,以使所述幻灯片演讲者与所述幻灯片演讲者所处环境背景分离。
6.根据权利要求5所述的方法,其特征在于,所述景深调整单元还包括有景深生成单元、景深参数输入单元和景深计算单元;且
所述景深生成单元用以接收所述景象信息和所述景深数据并合成所述景深信息,并将所述景深信息传输到所述景深计算单元;
所述景深参数输入单元用来接收景深参数,并将所述景深参数传输到所述景深计算单元;
所述计算单元根据所述景深信息和所述景深参数计算得出所述景深均值。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将分离后的所述演讲者转换成卡通人物形象。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过实时图像边缘模糊和图像噪点过滤工艺对所述多媒体幻灯片进行优化。
CN201510356393.4A 2015-06-25 2015-06-25 一种多媒体幻灯片制备的方法 Pending CN106303694A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510356393.4A CN106303694A (zh) 2015-06-25 2015-06-25 一种多媒体幻灯片制备的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510356393.4A CN106303694A (zh) 2015-06-25 2015-06-25 一种多媒体幻灯片制备的方法

Publications (1)

Publication Number Publication Date
CN106303694A true CN106303694A (zh) 2017-01-04

Family

ID=57650861

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510356393.4A Pending CN106303694A (zh) 2015-06-25 2015-06-25 一种多媒体幻灯片制备的方法

Country Status (1)

Country Link
CN (1) CN106303694A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536302A (zh) * 2018-04-17 2018-09-14 中国矿业大学 一种基于人体手势和语音的教学方法及系统
CN108900816A (zh) * 2018-08-20 2018-11-27 威创集团股份有限公司 一种控制图像显示的方法、相关装置和系统
CN112804516A (zh) * 2021-04-08 2021-05-14 北京世纪好未来教育科技有限公司 一种视频播放方法、装置、可读存储介质、电子设备
CN112929688A (zh) * 2021-02-09 2021-06-08 歌尔科技有限公司 一种直播视频录制方法、投影仪及直播视频系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536302A (zh) * 2018-04-17 2018-09-14 中国矿业大学 一种基于人体手势和语音的教学方法及系统
CN108900816A (zh) * 2018-08-20 2018-11-27 威创集团股份有限公司 一种控制图像显示的方法、相关装置和系统
CN112929688A (zh) * 2021-02-09 2021-06-08 歌尔科技有限公司 一种直播视频录制方法、投影仪及直播视频系统
CN112804516A (zh) * 2021-04-08 2021-05-14 北京世纪好未来教育科技有限公司 一种视频播放方法、装置、可读存储介质、电子设备
CN112804516B (zh) * 2021-04-08 2021-07-06 北京世纪好未来教育科技有限公司 一种视频播放方法、装置、可读存储介质、电子设备

Similar Documents

Publication Publication Date Title
US11076142B2 (en) Real-time aliasing rendering method for 3D VR video and virtual three-dimensional scene
CN103503455B (zh) 针对视频自适应和重定目标进行视频字幕重新覆盖的系统和方法
US8655152B2 (en) Method and system of presenting foreign films in a native language
US9160938B2 (en) System and method for generating three dimensional presentations
US10250864B2 (en) Method and apparatus for generating enhanced 3D-effects for real-time and offline applications
EP3735677A1 (en) Fusing, texturing, and rendering views of dynamic three-dimensional models
EP1843298A2 (en) Image blending system and method
CN106303289A (zh) 一种将真实对象与虚拟场景融合显示的方法、装置及系统
US8903162B2 (en) Method and apparatus for separating an image object from an image using three-dimensional (3D) image depth
JPH11219446A (ja) 映像音響再生システム
WO1997015926A1 (en) A method for the automatic computerized audio visual dubbing of movies
CN106303694A (zh) 一种多媒体幻灯片制备的方法
CN106331521A (zh) 一种网络虚拟现实技术与实拍结合影视制作系统
EP2812894A2 (en) Motion picture project management system
CN113542624A (zh) 生成商品对象讲解视频的方法及装置
RU105102U1 (ru) Автоматизированная система для создания, обработки и монтажа видеороликов
CN116524087A (zh) 融合神经辐射场的音频驱动的说话人视频合成方法及系统
US20230138434A1 (en) Extraction of user representation from video stream to a virtual environment
JP5894505B2 (ja) 画像コミュニケーションシステム、画像生成装置及びプログラム
US9967546B2 (en) Method and apparatus for converting 2D-images and videos to 3D for consumer, commercial and professional applications
CN116962744A (zh) 网络直播的连麦互动方法、装置及直播系统
KR101231661B1 (ko) 컬러세그먼트 추출과 깊이지도를 활용한 입체영상 제작 방법
KR20170059310A (ko) 텔레 프레젠스 영상 송신 장치, 텔레 프레젠스 영상 수신 장치 및 텔레 프레젠스 영상 제공 시스템
JPH11149285A (ja) 映像音響システム
KR20060040118A (ko) 맞춤형 3차원 애니메이션 제작 방법 및 장치와 그 배포시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170104

WD01 Invention patent application deemed withdrawn after publication