CN1510501A - 合成幻灯片的系统和方法 - Google Patents

合成幻灯片的系统和方法 Download PDF

Info

Publication number
CN1510501A
CN1510501A CNA2003101225998A CN200310122599A CN1510501A CN 1510501 A CN1510501 A CN 1510501A CN A2003101225998 A CNA2003101225998 A CN A2003101225998A CN 200310122599 A CN200310122599 A CN 200310122599A CN 1510501 A CN1510501 A CN 1510501A
Authority
CN
China
Prior art keywords
image
resolving power
audio
generate
resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2003101225998A
Other languages
English (en)
Inventor
Z
Z·孙
·
A·C·路易
J·K·里克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of CN1510501A publication Critical patent/CN1510501A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • G06F16/4387Presentation of query results by the use of playlists
    • G06F16/4393Multimedia presentations, e.g. slide shows, multimedia albums
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2545CDs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/775Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

一种合成多媒体幻灯片的方法。在最佳实施例中,该方法包括以下步骤:选择多个数字图像;对多个数字图像中的每个图像进行编码以生成正常分辨率的图像部分和高分辨率的图像部分;复用每个对应的正常分辨率和高分辨率图像部分以生成单个高分辨率静止图像;为每个高分辨率静止图像确定时间参数;选择用于多个数字图像中至少一个图像的音频部分;连接多个高分辨率静止图像以生成视频比特流;通过对音频部分编码以生成音频比特流;以及复用视频比特流和音频比特流以生成多媒体幻灯片。

Description

合成幻灯片的系统和方法
技术领域
本发明一般涉及多媒体编码和再现领域。
背景技术
近年来,数字照相机的使用在不断增加。相应地,商业和消费者保持的数字图像文件量也在不断增加。很象一个柜子装满了鞋盒而鞋盒装有随意摆放的相片的问题一样,在数字环境中,存在着计算机“鞋盒”,而“鞋盒”装满随机存储的数字图像。另外,对VCD和DVD播放器的使用在增加,可用的数字图像和视频剪辑的数量也在增加。这就产生对可定位、分类和共享数字图像而且简单、有趣以及节省成本和时间的系统和/或方法的需求。
一种方式是在光盘(CD)或数字视盘(DVD)上编排数字图像、文本、语音注释和音乐剪辑,可以采用视频CD播放器或DVD播放器在电视上作为多媒体相册/节目重放它们。
这种以电视为中心的系统与流行的以计算机为中心的系统不同。例如,Kodak Picture CD产品(可从Eastman Kodak公司获得)采用计算机来提供数字图像共享和观看功能。但是,当前配置的KodakPicture CD的CD格式不能在电视上播放。
将音频和视频信息编码为VCD可兼容节目,然后以ISO9660格式将节目转到CD上,这是已知的。这种CD可在VCD/DVD播放器和计算机系统中播放。VCD编码采用特别的MPEG-1标准,其目标应用具有不超过每秒1.5兆比特的比特率。由于这样的比特率约束,图像分辨率在NTSC系统上仅限于352×240(常见于美国和日本),在PAL系统上仅限于352×288(常见于欧洲和中国)。NTSC上352×240的分辨率和PAL上352×288的分辨率通常称为正常分辨率,对应的NTSC上704×480和PAL上704×575的空间分辨率通常称为高分辨率。
具体的MPEG-1标准用于以具有娱乐质量的CD-ROM比特率对活动图像序列进行编码。因此,它通常不是适用于在电视上显示诸如多媒体相册或幻灯片等静止图像的标准。当以高帧频、例如NTSC的29.97帧/秒或PAL的25帧/秒再现视频序列时,快速移动的帧的时间滤波隐蔽了大部分空间失真。但是,当静止图像被二次抽样到正常分辨率、由MPEG-1编码器编码(用于帧内的基于块的类JPEG压缩)并且在电视上显示时,则诸如分块假象的失真会很明显。
由于DVD具有比CD高得多的容量并且因而可以存储更高的空间分辨率(即,NTSC系统上的720×480和PAL系统上的720×576),因此,可以使用MPEG-2标准将音频和视频节目编码到DVD上。但是,与CD技术相比,DVD技术更昂贵且更复杂。因此,大多数消费者常认为DVD媒体和写入装置太昂贵。
题为“记录伴随幻灯片的语音叙述的方法和设备”的美国专利6084582(Qureshi)公开了一种将音频输入作为音频片段记录和数字化的方法和设备,音频片段与对应的幻灯片一起存储并相关联。幻灯片是用于在个人计算机上重放的数字小片(例如PowerPoint)。题为“利用多媒体组合的直观表示来创作多媒体组合的计算机系统”的美国专利5892507(Moorby)公开了通过图形用户界面组合和显示具有一个或多个多媒体事件的多媒体演示的计算机系统。题为“生成多媒体演示的方法和设备”的美国专利6081262(Gill)公开了一种文档排版范例,用以调整多媒体演示内包含的多个对象之间的空间关系。与本发明相反,这些引用内容并不是针对组合和再现音频和静止图像,使其成为可在消费者电子装置(如DVD或VCD播放器)和具有适当解码器的计算机上显示的高分辨率幻灯片,并且增强了图像质量和音频处理。
题为“对多音频流编码的方法”的专利WO/0035194公开了将静止图像或视频流与多个声音流进行编码的方法和系统,允许用大量的音频信息对媒体(例如光盘)编码。该方法能够在光盘上存储和重放大量歌曲与视频信息。相反,本发明是为了提高图像再现质量(通过图像增强和合成以及高分辨率幻灯片再现)以及增强视听享受体验(通过语音注释和音乐/歌曲剪辑的音频合成以及音频/视觉娱乐的组合)。
本发明中的术语“高分辨率”指在NTSC系统上具有704×480的空间分辨率和PAL系统上具有704×576的空间分辨率的图像,这是相对于视频高密光盘规范中指定的NTSC上352×240和PAL系统上352×288的正常分辨率而言。相反,几个先有的公开内容旨在通过组合一组静止图像来提高单个图像的分辨率/质量。例如,题为“对高分辨率静止图像和视频图像进行编码和解码以便在标准存储媒体上记录的设备”的美国专利4825301公开了通过将信号分成多组信号而在传统记录媒体上对静止图像进行编码的设备,每组信号对应于图像的多个不同像素。题为“创建高分辨率静止图像的方法和装置”的美国专利6349154公开了在运动补偿预测编码后从一系列低分辨率图像中创建高分辨率静止图像的方法。题为“从一系列低分辨率活动图像中创建高分辨率图像的系统”的EP专利0731600公开了基于到凸面模式的投影从视频序列中创建高分辨率静止图像的方法。
发明内容
本发明旨在克服上述缺点。更具体地说,现在需要一种简单、有趣以及节省成本和时间的多媒体合成系统和方法,该系统和方法可提供更高的图像和幻灯片再现质量。本发明针对一种系统和方法,用于采用比正常分辨率对应物更高的空间分辨率和更高的图像质量在光盘上将音频和视频信息合成为多媒体幻灯片/相册,该多媒体幻灯片/相册可以在VCD/DVD播放器上重放。这样,本发明提供了这种简单、有趣以及节省成本和时间的多媒体合成系统和方法。
本发明的一个目的是提供一种系统和方法,用于采用比正常分辨率对应物更高的空间分辨率和更高的图像质量在光盘上将音频和视频信息合成为多媒体幻灯片/相册,该多媒体幻灯片/相册可以在VCD/DVD播放器上重放。
本发明的另一个目的是提供这种简单、有趣以及节省成本和时间的多媒体合成系统和方法。
这些目的仅通过说明性示例来说明,并且此类目的可能是本发明的一个或多个实施例的示范。本领域的技术人员可想到或明白本公开的发明本来可实现的其它所需目的和优点。本发明由所附权利要求书定义。
根据本发明的一个方面,提供一种合成幻灯片的方法。该方法包括以下步骤:访问多个数字图像;对多个数字图像中的每个图像进行编码以生成正常分辨率的图像部分和高分辨率的图像部分;复用每个对应的正常分辨率和高分辨率图像部分以生成单个高分辨率静止图像;确定每个高分辨率静止图像的时间参数;以及根据确定的时间参数连接多个高分辨率静止图像以生成无声幻灯片。
根据本发明的另一方面,提供一种合成多媒体幻灯片的方法。此方法包括以下步骤:选择多个数字图像;对多个数字图像中的每个图像进行编码以生成正常分辨率的图像部分和高分辨率的图像部分;复用每个对应的正常分辨率和高分辨率图像部分以生成单个高分辨率静止图像;确定每个高分辨率静止图像的时间参数;选择多个数字图像中至少一个图像的音频部分;连接多个高分辨率静止图像以生成视频比特流;通过对音频部分编码以生成音频比特流;以及复用视频比特流和音频比特流以生成多媒体幻灯片。
根据本发明的又一方面,提供一种合成幻灯片的系统。此系统包括:用于访问多个数字图像的装置;对多个数字图像中的每个图像进行编码以生成正常分辨率的图像部分和高分辨率的图像部分的装置;复用每个对应的正常分辨率和高分辨率图像部分以生成单个高分辨率静止图像的装置;确定每个高分辨率静止图像的时间参数的装置;以及根据确定的时间参数连接多个高分辨率静止图像以产生无声幻灯片的装置。
根据本发明的又一方面,提供一种合成多媒体幻灯片的系统。该系统包括:选择多个数字图像的装置;对多个数字图像中的每个图像进行编码以产生正常分辨率的图像部分和高分辨率的图像部分的装置;复用每个对应的正常分辨率和高分辨率图像部分以产生单个高分辨率静止图像的装置;确定每个高分辨率静止图像的时间参数的装置;选择多个数字图像中至少一个图像的音频部分的装置;连接多个高分辨率静止图像以生成视频比特流的装置;通过对音频部分进行编码而生成音频比特流的装置;以及复用视频比特流和音频比特流以生成多媒体幻灯片的装置。
附图说明
通过以下对如附图所示的本发明最佳实施例的更具体说明,可明白本发明的上述和其它目的、特征和优点。
图1一般地说明根据本发明的系统的功能部件;
图2表示将数字音频剪辑和数字图像合成为单个混合分辨率静止图像、按顺序显示多个静止图像的无声高分辨率幻灯片以及带音频的多媒体高分辨率幻灯片的示意图;
图3表示静止图像合成的框图;
图4表示各种图像增强操作;
图5表示数字音乐和语音注释合成的框图;
图6表示音频组合、语音注释和背景音乐;
图7表示根据本发明的音频合成的示例;
图8一般地说明可用于执行本发明的方法的数字照相机;
图9一般地说明可用于执行本发明的方法的蜂窝/移动电话。
具体实施方式
下面参照附图详细描述了本发明的最佳实施例,图中相同的参考标号标识几个图形中的每个图形中的相同结构单元。
概括而言,本发明提供了一种系统和方法,用于将数字音频剪辑和图像合成为高分辨率多媒体节目,该节目可在VCD/DVD播放器上或具有软件/硬件播放器的计算机系统上播放,所述系统和方法包括以下功能:图像增强和合成;音频合成;单个高分辨率静止图像的合成;按顺序显示多个静止图像的无声幻灯片的合成;以及带音频的多媒体幻灯片的合成。
本发明具有以下优点。通过图像增强和合成、音频合成、高分辨率静止图像合成以及组合的音频和视频编码,提高了本发明的多媒体再现和娱乐的质量。通过使用本发明的比特分配方案,本发明可使用成本较低的媒体(即,光盘对DVD)、装置(CD刻录机对DVD刻录机)和技术(MPEG-1对MPEG-2),提供与DVD类似的空间分辨率。使用本发明,编码比特流可在VCD/DVD播放器上重放。另外,高分辨率节目的分辨率大约为普通分辨率对应物的4倍,这大大提高了图像再现质量。
应当指出,根据本发明的一个最佳实施例将明确描述为通常以软件程序来实现。本领域的技术人员会认识到,此类软件的等效物也可以硬件形式构建。因为图像处理算法和系统是众所周知的,所以本发明的说明将特别针对构成根据本发明的系统和方法的一部分或与之更直接配合的算法和系统。从本领域中熟知的此类系统、算法、部件和单元中,可选择未在此处具体表示或描述的此类算法和系统的其它方面以及用于生成及处理相关图像信号的硬件和/或软件。在下述内容中给定根据本发明所述的系统,则此处未具体显示、建议或描述而对于实现本发明有用的软件是常规软件,并且在本领域技术人员的知识范围内。
还要指出,如此处所使用的一样,计算机程序可存储在计算机可读存储媒体中,所述计算机可读存储媒体可包括例如:诸如磁盘(如硬盘驱动器或软盘)或磁带之类的磁存储媒体;诸如光盘、光带或机器可读条形码之类的光存储媒体;诸如随机存取存储器(RAM)或只读存储器(ROM)之类的固态电子存储装置;或者任何其它用于存储计算机程序的物理装置或媒体。
还要指出的是,本发明最好是在诸如个人计算机之类的任何熟知的计算机系统上利用。因此,此类计算机系统将不在此处详细讨论。还需指出的是,图像可直接输入到计算机系统(例如通过数字照相机)或者在输入计算机系统前数字化(例如通过扫描原件,比如通过扫描卤化银照片或底片)。
应当指出,一种幻灯片是图像集。这种幻灯片也可称作电子相册、数字相册或多媒体相册。此类幻灯片/相册可包括视频剪辑、音频剪辑、语音注释、文本、音乐剪辑等等,以便增强相册的环境和演示。因而,幻灯片/相册可指多媒体幻灯片或多媒体相册。放映幻灯片中的每张“幻灯片”对应于显示一组图像和/或视频剪辑其中之一的一个画面或显示,其中幻灯片按顺序显示一系列的静止图像和/或视频剪辑。
参照图1,其中说明用于实现本发明的系统110。虽然表示出系统110是为了说明最佳实施例,但是本发明不限于所示的系统110,而是可以为任何电子处理系统,如家用计算机、信息站、零售或批发相片洗印设备或任何其它用于处理数字图像的系统。系统110包括用于接收和处理软件程序和执行其它处理功能的基于微处理器的单元112。显示器114电连接到基于微处理器的单元112以显示与软件相关联的用户相关信息,比如通过图形用户界面来显示。键盘116可连接到基于微处理器的单元112以允许用户将信息输入软件中。作为用键盘116输入的替代方式,鼠标118或其它输入装置可用于在显示器114上移动选择器120和用于选择选择器120所覆盖的项目,这已为本领域的技术人员所熟知。
通常包括软件程序的光盘只读存储器(CD-ROM)124插入基于微处理器的单元以提供一种将软件程序和其它信息输入到基于微处理器的单元112的方式。另外,软盘126也可包括软件程序,并插入基于微处理器的单元112以输入该软件程序。光盘只读存储器(CD-ROM)124或软盘126也可插入位于外部的盘驱动器单元122,该单元122电连接到基于微处理器的单元112。此外,基于微处理器的单元112可经设计,以便在内部存储软件程序,这已为本领域的技术人员所熟知。基于微处理器的单元112也可具有网络连接127,如因特网连接、局域网或电话线,以便连接到一个或多个计算机的外部网络或其它系统125。打印机128也可连接到基于微处理器的单元112,以便打印系统110的输出的硬拷贝。
图像可通过个人计算机卡(PC卡)130显示在显示器114上,如先前已知的PCMCIA卡(基于个人计算机存储卡国际协会的规范),它包含以电子形式嵌入卡130中的数字化图像。此外,PC卡130最终被插入基于微处理器的单元112中以便允许图像在显示器114上进行视觉显示。或者,PC卡130可插入连接到基于微处理器的单元112的外部PC卡阅读器132。图像也可通过光盘124、软盘126或网络连接127输入系统10。任何存储于PC卡130、软盘126或光盘124上的图像或通过网络连接127输入的图像可能已从诸如数字照相机(未显示)或扫描仪(未显示)等本领域技术人员熟知的多种来源获得。通过连接到基于微处理器的单元112的照相机对接端口136,或者通过连接到基于微处理器的单元112的电缆连接138或者通过连接到基于微处理器的单元112的无线连接140,图像也可直接从数字照相机134输入。
MPEG-1是众所周知的标准。要使用MPEG-1对静止图像进行编码(即数字静止图像),仅需要对I-帧(帧内)进行编码,并且不存在P-帧(预测帧)或B-帧(双向预测帧)。要确保解码缓冲器无下溢和溢出,需要插入填充数据包以维持恒定的比特率。填充数据包包含解码器忽略的所有填充字节0xFF(所有十六进制值前面均有0x)。这导致一种不想要的情况。一方面,可能的分块假象将I-帧的空间分辨率限制为正常分辨率。另一方面,不得不插入额外的填充字节以维持所需的比特率。本发明采用填充字节以增加I-帧的分辨率,这是通过高分辨率静止图像的Video CD 2.0规范来实现的。通过用分配到活动图像的比特交换I-帧,可用四倍的分辨率对静止图像和多媒体幻灯片的空间分辨率进行编码,从而提供更高的再现质量。
现在参照图2描述本发明的方法。图2表示将数字音频剪辑和数字图像合成为单个混合分辨率静止图像、按顺序显示多个静止图像的无声高分辨率幻灯片以及具有音频的多媒体高分辨率幻灯片的示意图。更具体地说,如图2所示,合成高分辨率幻灯片的方法一般包括以下五个步骤:1)图像增强和合成;2)音频合成;3)单个混合分辨率静止图像的合成;4)按顺序显示多个静止图像的无声幻灯片的合成;以及5)具有音频的多媒体幻灯片的合成。合成的幻灯片可在VCD/DVD播放器或具有软件/硬件播放器的计算机上再现/观看。
现在参照图2描述单个混合分辨率静止图像(即,数字静止图像)的编码。标号210表示要合成的N个数字图像。使用图像增强和合成模块220(下面将更详细描述),每个图像210先转换到YUV彩色空间,二次抽样为4∶2∶0格式,分成8×8个块,并在DCT变换后进行霍夫曼编码。更具体地说,每个通道分成8×8个块,并通过二维离散余弦变换(DCT)进行编码以消除空间相关。进一步通过量化和霍夫曼编码消除符号冗余。这产生了在正常分辨率230的DCT编码图像和在高分辨率240的DCT编码图像。在正常分辨率230和高分辨率240的DCT编码图像随后会根据VCD规范2.0进行复用/交织,成为混合分辨率静止图像250。混合分辨率静止图像250具有比正常分辨率230的DCT编码图像更高的分辨率,因此称为高分辨率静止图像250。使用在NTSC上为704×480或在PAL上为704×576的空间分辨率,可通过VCD/DVD播放器在电视上观看/再现高分辨率静止图像250。
如图2所示,如果定时参数270可用,则N个输入图像可进一步合成为单个无声高分辨率幻灯片280。(应当指出,可采用定时参数270的缺省值或预定值,比如5秒。)定时参数270指定图像应在显示器114上停留并维持音频和视频比特流之间同步的持续时间。定时参数270可通过输入设备118、选择器120、键盘116、用户交互、参数文件或音频合成模块290指定。要维持恒定的比特率,可在两个高分辨率静止图像250之间插入填充数据包260,从而在前一图像切换到下一图像而下一图像在显示器114上显示之前,前一图像在显示器114上显示指定的秒数。填充数据包260是装满填充字节0xFF的数据包。填充字节没有具体的意义,用于维持恒定的比特率。根据以下算法,填充数据包的数量NP可由显示的秒数T、保持DCT编码的正常分辨率图像230的数据包数量NN以及保持DCT编码的高分辨率图像240的数据包数量NH来确定:
NP=T*75-(NN+NH)
其中每秒对应于75个数据包。
应当指出,每个图像210的定时参数270不必要相同。也就是说,每个图像210在显示器114上显示的时间可以不同。例如,可能希望任意安排显示时间。或者,可能希望根据图像内容安排每个图像的显示时间,人物图像显示时间为Time1,而景色图像的显示时间为不同于Time1的Time2。
仍参照图2,无声幻灯片280可经过增强以便包括音频206,从而生成多媒体幻灯片320。为此,音频206可包括一个或多个为不同范围的图像选择的背景音乐剪辑206。例如,音乐剪辑可应用于图像210 N=1到10、对图像210N=11到15用静音,并且另一个音乐剪辑应用于图像210N=16到30。另外,音频206可包括用于任何图像210的语音注释206。例如,用户可对着麦克风说话以记录关于特定图像的信息。音频206被发送到音频合成模块290。音频合成模块290的定时参数270用于生成无声幻灯片280,并且290的标准化音频会传递到数字音频编码/压缩模块300以生成音频比特流310。无声幻灯片280的视频比特流和音频比特流310被复用为单个具有音频的多媒体幻灯片320。多媒体幻灯片320可通过软件来演示,或者,多媒体幻灯片320可刻录到VCD或DVD中,以便使用VCD/DVD播放器播放。请参考题为“创作多媒体启用光盘的系统和方法”、序列号为09/885577的共同转让的美国申请,该申请以Loui等人的名义于2001年6月20日提交,并转让给本申请的受让人。
图3更具体地描述了图像增强和合成模块220。一个目的是准备具有正确分辨率的图像数据,另一个目的是增强图像再现质量。为此,通过图像输入接口211将每个图像210读入计算机存储器。图像输入接口211应配置为接受通常采用的图像文件格式(如JPEG、GIF、TIFF、BMP等等)以及存储在不同装置(如硬盘、存储卡、记忆棒、闪存卡、光盘、软盘等等)上的图像数据。每个图像210先要再定向为适当的取向212(例如纵向或横向),这可通过图像分析从图像进行的用户交互或自动化方案来实现。
多种图像增强算法213可应用于图像以增强图像质量。此类图像增强的示例包括但不限于彩色平衡、噪声降低、边缘锐化、红眼检测和校正、色阶调整以及其它典型的图像增强算法。
应用图像增强213后,可将其它纹理覆盖在图像上作为合成图像214。纹理的示例包括背景纹理、图像的边框装饰、公司徽标等。文本注释215(如标题、主题、人物、时间、地点等)也可以添加到图像内容中。然后图像会经过两次大小调整216以获得具有同样图像内容的正常分辨率图像和高分辨率图像。按照MPEG-1I-帧编码语法分别对每种版本进行编码。如上所示,随后会产生在正常分辨率230的DCT编码图像和在高分辨率240的DCT编码图像。
图4更具体地说明图像增强213的操作。具体地说,图像增强213最好首先包括通过模糊掩蔽、即从原件中去除图像的模糊版本而实现的图像锐化410。然后,最好使用增强黑色打印算法来实现噪声降低420,即,根据高频信道中方差所指示的噪声因素自适应地过滤图像。图像理解算法可应用于图像以检测和校正红眼430。另外,色阶调整440和彩色平衡450可用于增强图像。
现在参照图5更具体地描述音频合成模块290。通常,音频合成模块290将多个音频流组合成单个标准化的音频流,并且自动地计算用于音频/视频同步的定时参数。
如上所述,音频206可包括一个或多个背景音乐剪辑和/或语音注释。音频提取292将数字音频样本从外部装置(例如硬盘、光盘、存储卡、软盘等等)读入计算机存储器。数字音频信号可以各种各样的文件格式来存储,诸如Microsoft wave文件、MPEG音频文件(层I、II和III)、Apple/SGI Aiff文件、NeXT/Sun au/snd文件、SoundBlaster voc文件、Turtle beach Sample Vision smp文件或原始格式的流式音频。该音频可以是语音注释、音乐剪辑、歌曲或背景声音。
在音频标准化294中将输入音频流标准化为标准规格,例如,立体声、16比特/样本、44.1千赫兹。这种标准化可包括抽样率的改变(例如从8千赫兹到44.1千赫兹)、样本精度的改变(例如从8比特/样本到16比特/样本)、信道数量的改变(例如从单声道到立体声)和/或文件格式的改变。
图像标准化294之后的步骤是音频对准296。更具体地说,音频对准沿相同的时间因次登记多个音频流并且计算时间参数270。每个图像210在其对应的音频/语音注释开始时应显示,并且每个图像210应持续显示到该音频/语音注释结束。另外,图像应当尽可能均匀地分配到指定的背景音乐剪辑上。
现在参照示例更详细地描述音频对准,其中:
i是N个输入图像210的图像索引;
ti是第i个图像在显示器上的持续时间,以秒计;
td是图像在显示器上的缺省持续时间,以秒计(例如5秒);
tm是最小持续时间,以秒计(例如0.5秒);
ts是音乐剪辑的持续时间;以及
ai是第i个图像上语音注释的持续时间,以秒计。
当没有为N个图像选择声音(音乐或语音)时,则ti=td,i=1,…,N。这样,每个图像210显示td秒,而无声幻灯片280具有td*N秒的持续时间。
提供语音注释但未指定背景音乐时,特定图像的持续时间由关于该图像的语音注释的持续时间确定,具体地说,如果0<=ai<td,则ti=td,否则ti=ai。换言之,如果没有关于图像的语音注释,或者注释的长度小于缺省持续时间td,则ti取缺省值td。否则,ti取实际的语音注释持续时间,即,有语音注释时,图像会在显示器114上显示。
存在单个音乐或歌曲但不存在语音注释时,每个图像按等量时间显示,具体地说,ti=ts/N。存在多个音乐剪辑时,最好先将音乐剪辑连接为单个音乐剪辑。其它操作按照单个背景音乐剪辑的情况进行。
在为多个图像指定了音乐剪辑和语音注释的情况下,有三种可能的安排。(1)如果所有语音注释的总持续时间长于音乐剪辑的持续时间,则音频流会填充相同的音乐剪辑(或零音频样本)。其余操作按照仅有注释的情况进行。(2)如果选择长的音乐剪辑(即持续时间足够长,可适合平均持续时间的所有语音注释),则ti=ts/N。这与仅有音乐剪辑的情况相似。(3)第三种安排提供一些复杂性,具体地说,一些语音注释的持续时间长于平均持续时间并且总语音注释持续时间短于音乐剪辑持续时间。在此安排中,最好使用递归方案为图像指定持续时间,一次一个图像。图像或者采取语音注释的持续时间或者采取缺省持续时间。为N个图像其中之一指定的时间从用于剩余(N-1)个图像的总可用时间中减去。该过程会一直重复,直至为所有图像指定了持续时间。
完成音频对准296后,在音频组合模块298中,来自不同音频流的音频样本被组合在一起,成为具有指定重点的单个流。在每个时刻,所取的音频样本x是语音注释x1和背景音乐/歌曲x2的线性组合:
x=(a)(x1)+(1-a)(x2),
其中a是介于0与1之间的加权值。存在语音注释时,背景音乐/歌曲的音量会降低,以便突出前景语音注释。
图6表示了音频组合的图示。组合音频流226中突出了来自语音注释222的音频样本。存在语音注释时,背景音乐的音量会(从正常音量)降低,并在语音注释完成后提高到正常音量。音频样本的转换可以实现为平滑转换,逐渐从低到高,然后从高到低。
相应地,音频合成模块290提供标准化的音频,该音频会传递到数字音频编码/压缩模块300以生成音频比特流310。
现在参照图7,它提供了音频合成的示例。图7表示6个输入图像210,N=1-6。语音注释222应用于图像1、2、4和6。已经指定两个音乐/歌曲剪辑224,一个在图像1-2上,另一个在图像4-5上。对于此特定示例,(i)没有为图像3指定音频;(ii)仅图像6有语音注释;(iii)仅图像5有音乐剪辑;以及(iv)图像1、2和4上都有语音注释和音乐剪辑。图7表示了根据本发明合成的最终合成音频流。更具体地说,音乐剪辑224-1在图像1和2显示时播放。在图像1和2显示期间播放语音注释时,则音乐的音量会降低。图像3再现时未使用任何音频,并且停留时间是缺省持续时间所指定的td秒。当图像4和5在显示器114上显示时,则播放音乐剪辑224-2。图像6在显示器114上显示td秒,最初的a6秒具有语音注释,而剩余的时间则无声。更具体地说,参考标号226指音乐剪辑上存在与语音注释组合的音频的时间,参考标号228指没有音频的时间(即,无语音注释或音乐剪辑)。
应当指出,图7所示的示例的每个图像均按等量时间显示,如图7的时间线所示。但是,如上所述,本发明可在每个图像的显示时间不同的情况下实施。
本发明的系统110可以是数字照相机、PDA(个人数字助理)或蜂窝/移动电话。例如,图8表示了具有显示器502和选择构件504的数字照相机500。如果数字照相机500具有微处理器(CPU)、存储器和音频功能,则数字照相机500可实现本发明的方法。同样,图9表示了具有显示器508和选择构件510的蜂窝/移动电话506。如果蜂窝/移动电话506具有微处理器(CPU)、存储器和音频功能,则蜂窝/移动电话506也可实现本发明的方法。通过本领域技术人员熟知的网络,例如无线网络、因特网或电话线,可以实现通信。

Claims (10)

1.一种合成幻灯片的方法,它包括以下步骤:
访问多个数字图像;
对所述多个数字图像中的每个图像进行编码,从而生成正常分辨率的图像部分和高分辨率的图像部分;
复用每个对应的正常分辨率和高分辨率图像部分以生成单个高分辨率静止图像;
为每个所述高分辨率静止图像确定时间参数;以及
根据所述确定的时间参数连接所述多个高分辨率静止图像以生成无声幻灯片。
2.如权利要求1所述的方法,其特征在于还包括对所述多个数字图像中的至少一个进行图像增强的步骤。
3.如权利要求2所述的方法,其特征在于所述图像增强步骤包括将文本注释包含在内的步骤。
4.如权利要求2所述的方法,其特征在于所述图像增强步骤包括以下步骤:
为所述数字图像定向;
应用图像增强算法;以及
调整所述数字图像的大小。
5.一种合成多媒体幻灯片的方法,它包括以下步骤:
选择多个数字图像;
对所述多个数字图像中的每个图像进行编码,从而生成正常分辨率的图像部分和高分辨率的图像部分;
复用每个对应的正常分辨率和高分辨率图像部分以生成单个高分辨率静止图像;
为每个所述高分辨率静止图像确定时间参数;
选择用于所述多个数字图像中至少一个图像的音频部分;
连接所述多个高分辨率静止图像以生成视频比特流;
通过对所述音频部分进行编码而生成音频比特流;以及
复用所述视频比特流和音频比特流以生成所述多媒体幻灯片。
6.如权利要求5所述的方法,其特征在于还包括产生包含无声幻灯片的VCD或DVD的步骤,由此所述幻灯片可使用VCD播放器或DVD播放器来观看。
7.如权利要求5所述的方法,其特征在于所述幻灯片适合在计算机上观看。
8.如权利要求5所述的方法,其特征在于所述多个数字图像中的每个图像均采用MPEG-1进行编码。
9.一种用于合成幻灯片的系统,它包括:
访问多个数字图像的装置;
对所述多个数字图像中的每个图像进行编码以生成正常分辨率的图像部分和高分辨率的图像部分的装置;
复用每个对应的正常分辨率和高分辨率图像部分以生成单个高分辨率静止图像的装置;
为每个所述高分辨率静止图像确定时间参数的装置;以及
根据所述确定的时间参数连接所述多个高分辨率静止图像以生成无声幻灯片的装置。
10.一种用于合成多媒体幻灯片的系统,它包括:
选择多个数字图像的装置;
对所述多个数字图像中的每个图像进行编码以生成正常分辨率的图像部分和高分辨率的图像部分的装置;
复用每个对应的正常分辨率和高分辨率图像部分以生成单个高分辨率静止图像的装置;
为每个所述高分辨率静止图像确定时间参数的装置;
选择用于所述多个数字图像中至少一个图像的音频部分的装置;
连接所述多个高分辨率静止图像以生成视频比特流的装置;
通过对所述音频部分进行编码以生成音频比特流的装置;以及
复用所述视频比特流和音频比特流以生成所述多媒体幻灯片的装置。
CNA2003101225998A 2002-12-11 2003-12-11 合成幻灯片的系统和方法 Pending CN1510501A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/316556 2002-12-11
US10/316,556 US7394969B2 (en) 2002-12-11 2002-12-11 System and method to compose a slide show

Publications (1)

Publication Number Publication Date
CN1510501A true CN1510501A (zh) 2004-07-07

Family

ID=32392944

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2003101225998A Pending CN1510501A (zh) 2002-12-11 2003-12-11 合成幻灯片的系统和方法

Country Status (4)

Country Link
US (2) US7394969B2 (zh)
EP (1) EP1431887A3 (zh)
JP (1) JP2004194338A (zh)
CN (1) CN1510501A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101453607A (zh) * 2007-12-06 2009-06-10 奥林巴斯映像株式会社 再现装置、数字照相机、幻灯放映再现方法以及程序
CN101039372B (zh) * 2006-03-16 2011-01-26 腾讯科技(深圳)有限公司 一种电视相册管理装置及系统
CN101360191B (zh) * 2007-07-31 2011-04-20 奥林巴斯映像株式会社 图像再现装置和图像再现方法
US8699857B2 (en) 2007-12-06 2014-04-15 Olympus Imaging Corp. Reproducer, digital camera, slide show reproduction method, program, image display apparatus, image display method, image reproduction method, and image display program
CN104956356A (zh) * 2012-11-29 2015-09-30 思杰系统有限公司 用于自动地将通信流与在会议期间呈现的文件进行关联的系统和方法
CN109726367A (zh) * 2017-10-27 2019-05-07 腾讯科技(北京)有限公司 一种批注展示的方法及相关装置
CN110390087A (zh) * 2018-04-20 2019-10-29 成都野望数码科技有限公司 一种应用于演示文稿的图像处理方法及装置
CN111083396A (zh) * 2019-12-26 2020-04-28 北京奇艺世纪科技有限公司 视频合成方法、装置、电子设备及计算机可读存储介质
CN114946193A (zh) * 2020-01-23 2022-08-26 张衡淳 使用基于云的语音结合的定制视频制作服务提供系统

Families Citing this family (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7042505B1 (en) 1997-10-09 2006-05-09 Fotonation Ireland Ltd. Red-eye filter method and apparatus
US7738015B2 (en) * 1997-10-09 2010-06-15 Fotonation Vision Limited Red-eye filter method and apparatus
US7630006B2 (en) 1997-10-09 2009-12-08 Fotonation Ireland Limited Detecting red eye filter and apparatus using meta-data
US7352394B1 (en) * 1997-10-09 2008-04-01 Fotonation Vision Limited Image modification based on red-eye filter analysis
US6892351B2 (en) * 1998-12-17 2005-05-10 Newstakes, Inc. Creating a multimedia presentation from full motion video using significance measures
US7107081B1 (en) 2001-10-18 2006-09-12 Iwao Fujisaki Communication device
US7466992B1 (en) 2001-10-18 2008-12-16 Iwao Fujisaki Communication device
US7882258B1 (en) * 2003-02-05 2011-02-01 Silver Screen Tele-Reality, Inc. System, method, and computer readable medium for creating a video clip
US7142250B1 (en) * 2003-04-05 2006-11-28 Apple Computer, Inc. Method and apparatus for synchronizing audio and video streams
US7792970B2 (en) 2005-06-17 2010-09-07 Fotonation Vision Limited Method for establishing a paired connection between media devices
US7269292B2 (en) 2003-06-26 2007-09-11 Fotonation Vision Limited Digital image adjustable compression and resolution using face detection information
US7471846B2 (en) 2003-06-26 2008-12-30 Fotonation Vision Limited Perfecting the effect of flash within an image acquisition devices using face detection
US8682097B2 (en) 2006-02-14 2014-03-25 DigitalOptics Corporation Europe Limited Digital image enhancement with reference images
US8155397B2 (en) 2007-09-26 2012-04-10 DigitalOptics Corporation Europe Limited Face tracking in a camera processor
US8498452B2 (en) 2003-06-26 2013-07-30 DigitalOptics Corporation Europe Limited Digital image processing using face detection information
US7920723B2 (en) 2005-11-18 2011-04-05 Tessera Technologies Ireland Limited Two stage detection for photographic eye artifacts
US7620218B2 (en) 2006-08-11 2009-11-17 Fotonation Ireland Limited Real-time face tracking with reference images
US8254674B2 (en) 2004-10-28 2012-08-28 DigitalOptics Corporation Europe Limited Analyzing partial face regions for red-eye detection in acquired digital images
US7844076B2 (en) 2003-06-26 2010-11-30 Fotonation Vision Limited Digital image processing using face detection and skin tone information
US8330831B2 (en) 2003-08-05 2012-12-11 DigitalOptics Corporation Europe Limited Method of gathering visual meta data using a reference image
US7574016B2 (en) 2003-06-26 2009-08-11 Fotonation Vision Limited Digital image processing using face detection information
US7970182B2 (en) 2005-11-18 2011-06-28 Tessera Technologies Ireland Limited Two stage detection for photographic eye artifacts
US7536036B2 (en) * 2004-10-28 2009-05-19 Fotonation Vision Limited Method and apparatus for red-eye detection in an acquired digital image
US7689009B2 (en) 2005-11-18 2010-03-30 Fotonation Vision Ltd. Two stage detection for photographic eye artifacts
US9692964B2 (en) 2003-06-26 2017-06-27 Fotonation Limited Modification of post-viewing parameters for digital images using image region or feature information
US7440593B1 (en) 2003-06-26 2008-10-21 Fotonation Vision Limited Method of improving orientation and color balance of digital images using face detection information
US7565030B2 (en) 2003-06-26 2009-07-21 Fotonation Vision Limited Detecting orientation of digital images using face detection information
US8593542B2 (en) 2005-12-27 2013-11-26 DigitalOptics Corporation Europe Limited Foreground/background separation using reference images
US8170294B2 (en) 2006-11-10 2012-05-01 DigitalOptics Corporation Europe Limited Method of detecting redeye in a digital image
US8896725B2 (en) 2007-06-21 2014-11-25 Fotonation Limited Image capture device with contemporaneous reference image capture mechanism
US8948468B2 (en) 2003-06-26 2015-02-03 Fotonation Limited Modification of viewing parameters for digital images using face detection information
US8036458B2 (en) 2007-11-08 2011-10-11 DigitalOptics Corporation Europe Limited Detecting redeye defects in digital images
US8989453B2 (en) 2003-06-26 2015-03-24 Fotonation Limited Digital image processing using face detection information
US9129381B2 (en) 2003-06-26 2015-09-08 Fotonation Limited Modification of post-viewing parameters for digital images using image region or feature information
JP4035824B2 (ja) * 2003-07-30 2008-01-23 ソニー株式会社 編集装置
US8520093B2 (en) 2003-08-05 2013-08-27 DigitalOptics Corporation Europe Limited Face tracker and partial face tracker for red-eye filter method and apparatus
US9412007B2 (en) 2003-08-05 2016-08-09 Fotonation Limited Partial face detector red-eye filter method and apparatus
US8090402B1 (en) 2003-09-26 2012-01-03 Iwao Fujisaki Communication device
JP2005143014A (ja) * 2003-11-10 2005-06-02 Konica Minolta Photo Imaging Inc 画像処理装置、画像処理方法および画像処理プログラム
US8121635B1 (en) 2003-11-22 2012-02-21 Iwao Fujisaki Communication device
WO2005116992A1 (en) * 2004-05-27 2005-12-08 Koninklijke Philips Electronics N.V. Method of and system for modifying messages
US20050275805A1 (en) * 2004-06-15 2005-12-15 Yu-Ru Lin Slideshow composition method
JP4257607B2 (ja) * 2004-09-14 2009-04-22 ソニー株式会社 情報処理装置および方法、並びにプログラム
US7400351B2 (en) * 2004-10-06 2008-07-15 Microsoft Corporation Creation of image based video using step-images
US20060088284A1 (en) * 2004-10-26 2006-04-27 Paul Shen Digital photo kiosk and methods for digital image processing
US8320641B2 (en) 2004-10-28 2012-11-27 DigitalOptics Corporation Europe Limited Method and apparatus for red-eye detection using preview or other reference images
US7315631B1 (en) 2006-08-11 2008-01-01 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
US8225335B2 (en) 2005-01-05 2012-07-17 Microsoft Corporation Processing files from a mobile device
US20060176781A1 (en) * 2005-02-04 2006-08-10 Konica Minolta Technology U.S.A., Inc. Digital photo album producing apparatus
US20060177194A1 (en) * 2005-02-07 2006-08-10 Konica Minolta Technology U.S.A., Inc. Digital photo album producing apparatus
US20060177153A1 (en) * 2005-02-07 2006-08-10 Konica Minolta Technology U.S.A., Inc. Digital photo album producing apparatus
US8208954B1 (en) 2005-04-08 2012-06-26 Iwao Fujisaki Communication device
US7599710B2 (en) * 2005-04-15 2009-10-06 Magix Ag System and method of utilizing a remote server to create movies and slide shows for viewing on a cellular telephone
US7587671B2 (en) * 2005-05-17 2009-09-08 Palm, Inc. Image repositioning, storage and retrieval
US20070031124A1 (en) * 2005-08-05 2007-02-08 Samsung Electronics Co., Ltd. Method and apparatus for creating and reproducing media data in a mobile terminal
KR100704631B1 (ko) * 2005-08-10 2007-04-10 삼성전자주식회사 음성 주석 생성 장치 및 방법
JP4489662B2 (ja) * 2005-08-25 2010-06-23 富士フイルム株式会社 スライドショー用データ生成装置およびスライドショー生成装置ならびにそれらの制御方法ならびにそれらを制御するプログラム
JP4726577B2 (ja) 2005-08-25 2011-07-20 富士フイルム株式会社 スライドショー生成装置およびスライドショー用データ生成装置ならびにそれらの制御方法ならびにそれらを制御するプログラム
US7599577B2 (en) 2005-11-18 2009-10-06 Fotonation Vision Limited Method and apparatus of correcting hybrid flash artifacts in digital images
US20070182822A1 (en) * 2005-12-12 2007-08-09 Microsoft Corporation Media Composer
US8078618B2 (en) * 2006-01-30 2011-12-13 Eastman Kodak Company Automatic multimode system for organizing and retrieving content data files
KR100726258B1 (ko) 2006-02-14 2007-06-08 삼성전자주식회사 휴대단말의 사진파일 및 음성파일을 이용한 영상물 제작방법
JP4643715B2 (ja) 2006-02-14 2011-03-02 テセラ テクノロジーズ アイルランド リミテッド 赤目ではない目の閃光による不良の自動的な検知および補正
JP4665793B2 (ja) * 2006-02-20 2011-04-06 株式会社ニコン 動画像ファイル生成プログラムおよび電子カメラ
JP4760438B2 (ja) 2006-02-20 2011-08-31 株式会社ニコン 画像再生装置および画像再生プログラム
US20070203845A1 (en) * 2006-02-24 2007-08-30 Eastman Kodak Company Method and system for creating multimedia
JP2007243411A (ja) * 2006-03-07 2007-09-20 Fujifilm Corp 画像処理装置、方法およびプログラム
US7667120B2 (en) * 2006-03-30 2010-02-23 The Tsi Company Training method using specific audio patterns and techniques
EP2012537A4 (en) * 2006-04-19 2011-04-13 Nikon Corp IMAGE PLAYER, CAMERA AND IMAGE PLAY SYSTEM
JP5124994B2 (ja) * 2006-06-06 2013-01-23 株式会社ニコン 画像再生システム、デジタルカメラ、および画像再生装置
EP2033142B1 (en) 2006-06-12 2011-01-26 Tessera Technologies Ireland Limited Advances in extending the aam techniques from grayscale to color images
US7916897B2 (en) 2006-08-11 2011-03-29 Tessera Technologies Ireland Limited Face tracking for controlling imaging parameters
US7403643B2 (en) 2006-08-11 2008-07-22 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
KR100823281B1 (ko) * 2006-09-29 2008-04-21 삼성전자주식회사 컨텐츠 재생 방법 및 장치
US7669132B2 (en) * 2006-10-30 2010-02-23 Hewlett-Packard Development Company, L.P. Matching a slideshow to an audio track
US20080119714A1 (en) * 2006-11-22 2008-05-22 Oliver Meissner Optimized clinical workflow method and apparatus for functional gastro-intestinal imaging
US8055067B2 (en) 2007-01-18 2011-11-08 DigitalOptics Corporation Europe Limited Color segmentation
WO2008102413A1 (ja) * 2007-02-22 2008-08-28 Fujitsu Limited 音楽再生装置および音楽再生方法
JP2010520567A (ja) 2007-03-05 2010-06-10 フォトネーション ビジョン リミテッド 顔の位置および向きを用いた赤目の誤検出フィルタリング
US9158776B2 (en) 2007-08-06 2015-10-13 Apple Inc. Slideshows comprising various forms of media
US8676273B1 (en) * 2007-08-24 2014-03-18 Iwao Fujisaki Communication device
KR101402623B1 (ko) 2007-08-29 2014-06-03 삼성전자 주식회사 디스플레이장치 및 그 제어방법
US20090060453A1 (en) * 2007-09-05 2009-03-05 Kellogg John Method and system for authoring music
US8503818B2 (en) 2007-09-25 2013-08-06 DigitalOptics Corporation Europe Limited Eye defect detection in international standards organization images
US8212864B2 (en) 2008-01-30 2012-07-03 DigitalOptics Corporation Europe Limited Methods and apparatuses for using image acquisition data to detect and correct image defects
CN101515278B (zh) * 2008-02-22 2011-01-26 鸿富锦精密工业(深圳)有限公司 影像存取装置及其影像存储以及读取方法
US8401284B2 (en) * 2008-05-28 2013-03-19 Apple Inc. Color correcting method and apparatus
US8340726B1 (en) 2008-06-30 2012-12-25 Iwao Fujisaki Communication device
CN106919911A (zh) 2008-07-30 2017-07-04 快图有限公司 使用脸部检测的自动脸部和皮肤修饰
US8081254B2 (en) 2008-08-14 2011-12-20 DigitalOptics Corporation Europe Limited In-camera based method of detecting defect eye with high accuracy
JP5104709B2 (ja) * 2008-10-10 2012-12-19 ソニー株式会社 情報処理装置、プログラム、および情報処理方法
KR101589991B1 (ko) 2008-12-01 2016-01-29 삼성전자주식회사 컨텐츠 생성 기능을 갖는 컨텐츠 재생 장치 및 그의 컨텐츠생성 방법
US9060187B2 (en) * 2008-12-22 2015-06-16 Netflix, Inc. Bit rate stream switching
US8265450B2 (en) * 2009-01-16 2012-09-11 Apple Inc. Capturing and inserting closed captioning data in digital video
KR101567814B1 (ko) * 2009-01-21 2015-11-11 삼성전자주식회사 슬라이드 쇼를 제공하는 방법, 장치, 및 컴퓨터 판독가능 저장매체
US8026436B2 (en) * 2009-04-13 2011-09-27 Smartsound Software, Inc. Method and apparatus for producing audio tracks
US8379917B2 (en) 2009-10-02 2013-02-19 DigitalOptics Corporation Europe Limited Face recognition performance using additional image features
US20110131299A1 (en) * 2009-11-30 2011-06-02 Babak Habibi Sardary Networked multimedia environment allowing asynchronous issue tracking and collaboration using mobile devices
US20110138282A1 (en) * 2009-12-07 2011-06-09 Lai Anthony P System and method for synchronizing static images with dynamic multimedia contents
CN101833937B (zh) * 2010-05-05 2014-09-10 中兴通讯股份有限公司 一种图片显示方法及图片显示装置
US8621355B2 (en) 2011-02-02 2013-12-31 Apple Inc. Automatic synchronization of media clips
US8854370B2 (en) 2011-02-16 2014-10-07 Apple Inc. Color waveform
US20120210229A1 (en) 2011-02-16 2012-08-16 Andrew Bryant Color workflow
US11580155B2 (en) * 2011-03-28 2023-02-14 Kodak Alaris Inc. Display device for displaying related digital images
JP5790509B2 (ja) * 2012-01-05 2015-10-07 富士通株式会社 画像再生装置、画像再生プログラム、及び画像再生方法
JP5810920B2 (ja) * 2012-01-05 2015-11-11 富士通株式会社 コンテンツ再生装置、コンテンツ再生プログラム、及びコンテンツ再生方法
US10198420B2 (en) * 2013-06-15 2019-02-05 Microsoft Technology Licensing, Llc Telling interactive, self-directed stories with spreadsheets
WO2018102875A1 (en) * 2016-12-07 2018-06-14 Unser Pty Ltd Method and system for displaying aesthetic image streams
JP2018101828A (ja) * 2016-12-19 2018-06-28 船井電機株式会社 制御装置

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4825301A (en) 1987-07-16 1989-04-25 Polaroid Corporation Apparatus for encoding and decoding high resolution still images and video images for recording on a standard storage media
US4945406A (en) * 1988-11-07 1990-07-31 Eastman Kodak Company Apparatus and accompanying methods for achieving automatic color balancing in a film to video transfer system
US5347305A (en) * 1990-02-21 1994-09-13 Alkanox Corporation Video telephone system
US5218455A (en) 1990-09-14 1993-06-08 Eastman Kodak Company Multiresolution digital imagery photofinishing system
CA2081762C (en) 1991-12-05 2002-08-13 Henry D. Hendrix Method and apparatus to improve a video signal
JP3575063B2 (ja) * 1994-07-04 2004-10-06 ソニー株式会社 再生装置、再生方法
EP0967613B1 (en) 1994-07-04 2004-09-15 Sony Corporation Apparatus for replaying a recording medium
US5874997A (en) * 1994-08-29 1999-02-23 Futuretel, Inc. Measuring and regulating synchronization of merged video and audio data
US5517250A (en) * 1995-02-28 1996-05-14 General Instrument Corporation Of Delaware Acquisition of desired data from a packetized data stream and synchronization thereto
US5696848A (en) 1995-03-09 1997-12-09 Eastman Kodak Company System for creating a high resolution image from a sequence of lower resolution motion images
AU5442796A (en) 1995-04-06 1996-10-23 Avid Technology, Inc. Graphical multimedia authoring system
JP3876462B2 (ja) * 1996-11-18 2007-01-31 ソニー株式会社 地図情報提供装置及び方法
US6081262A (en) 1996-12-04 2000-06-27 Quark, Inc. Method and apparatus for generating multi-media presentations
US6084582A (en) 1997-07-02 2000-07-04 Microsoft Corporation Method and apparatus for recording a voice narration to accompany a slide show
US20030113096A1 (en) * 1997-07-07 2003-06-19 Kabushiki Kaisha Toshiba Multi-screen display system for automatically changing a plurality of simultaneously displayed images
TW432372B (en) * 1997-09-17 2001-05-01 Matsushita Electric Ind Co Ltd Optical disc, video data editing apparatus, computer -readable recording medium storing an editing program, reproduction apparatus for the optical disc, and computer -readable recording medium storing an reproduction program
DE69824554T2 (de) 1997-12-22 2005-06-30 Koninklijke Philips Electronics N.V. Verfahren und anordnung zum erzeugen eines standbildes mit hoher auflösung
US6587505B1 (en) * 1998-08-31 2003-07-01 Canon Kabushiki Kaisha Image processing apparatus and method
US6646655B1 (en) * 1999-03-09 2003-11-11 Webex Communications, Inc. Extracting a time-sequence of slides from video
US6574419B1 (en) 1999-03-12 2003-06-03 Matsushita Electric Industrial Co., Ltd. Optical disk, reproduction apparatus reproduction method, and recording medium
GB2357649A (en) * 1999-12-22 2001-06-27 Nokia Mobile Phones Ltd Image enhancement using inverse histogram based pixel mapping
US6810131B2 (en) * 2000-01-05 2004-10-26 Canon Kabushiki Kaisha Information processing method and apparatus
US20010056434A1 (en) * 2000-04-27 2001-12-27 Smartdisk Corporation Systems, methods and computer program products for managing multimedia content
US20060064716A1 (en) * 2000-07-24 2006-03-23 Vivcom, Inc. Techniques for navigating multiple video streams
US8270820B2 (en) * 2001-02-23 2012-09-18 Hewlett-Packard Development Company, L.P. Archiving and sharing of multimedia content
US20020149677A1 (en) * 2001-04-09 2002-10-17 Michael Wright Digital camera with communications functionality
US20030206729A1 (en) * 2001-06-20 2003-11-06 Eastman Kodak Company Imaging system for authoring a multimedia enabled disc
US20030007784A1 (en) * 2001-06-20 2003-01-09 Loui Alexander C. System and method for authoring a multimedia enabled disc
US6980691B2 (en) * 2001-07-05 2005-12-27 Corel Corporation Correction of “red-eye” effects in images
US20030043210A1 (en) * 2001-09-04 2003-03-06 Hanks Darwin Mitchel System and method for generating high-resolution images via resolution-limited devices
US7031534B2 (en) * 2001-10-31 2006-04-18 Xerox Corporation Enhancement of compressed image data
US7167640B2 (en) * 2002-02-11 2007-01-23 Sony Corporation Method and apparatus for efficiently allocating memory in audio still video (ASV) applications
US7099569B2 (en) * 2002-02-11 2006-08-29 Sony Corporation Method and apparatus for efficiently allocating memory when switching between DVD audio and DVD video

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101039372B (zh) * 2006-03-16 2011-01-26 腾讯科技(深圳)有限公司 一种电视相册管理装置及系统
CN101360191B (zh) * 2007-07-31 2011-04-20 奥林巴斯映像株式会社 图像再现装置和图像再现方法
CN101453607A (zh) * 2007-12-06 2009-06-10 奥林巴斯映像株式会社 再现装置、数字照相机、幻灯放映再现方法以及程序
CN101453607B (zh) * 2007-12-06 2012-10-10 奥林巴斯映像株式会社 再现装置、数字照相机、幻灯放映再现方法
US8699857B2 (en) 2007-12-06 2014-04-15 Olympus Imaging Corp. Reproducer, digital camera, slide show reproduction method, program, image display apparatus, image display method, image reproduction method, and image display program
CN104956356A (zh) * 2012-11-29 2015-09-30 思杰系统有限公司 用于自动地将通信流与在会议期间呈现的文件进行关联的系统和方法
CN109726367A (zh) * 2017-10-27 2019-05-07 腾讯科技(北京)有限公司 一种批注展示的方法及相关装置
CN110390087A (zh) * 2018-04-20 2019-10-29 成都野望数码科技有限公司 一种应用于演示文稿的图像处理方法及装置
CN111083396A (zh) * 2019-12-26 2020-04-28 北京奇艺世纪科技有限公司 视频合成方法、装置、电子设备及计算机可读存储介质
CN114946193A (zh) * 2020-01-23 2022-08-26 张衡淳 使用基于云的语音结合的定制视频制作服务提供系统

Also Published As

Publication number Publication date
US20040114904A1 (en) 2004-06-17
US7394969B2 (en) 2008-07-01
EP1431887A3 (en) 2004-12-22
EP1431887A2 (en) 2004-06-23
JP2004194338A (ja) 2004-07-08
US20080247458A1 (en) 2008-10-09

Similar Documents

Publication Publication Date Title
CN1510501A (zh) 合成幻灯片的系统和方法
CN1251494C (zh) 用于创建多媒体可操作光盘的系统和方法
EP1641275B1 (en) Interactive design process for creating stand-alone visual representations for media objects
KR101012618B1 (ko) 이미징 시스템 내의 이미지들의 프로세싱
EP1641282B1 (en) Techniques for encoding media objects to a static visual representation
EP1641281B1 (en) Techniques for decoding and reconstructing media objects from a still visual representation
US20060050140A1 (en) Wireless communication terminal and its method for generating moving picture using still image
CN105933724A (zh) 视频制作方法、装置及系统
EP2202748A3 (en) Reproducing apparatus using adaptive temporal scalability in a region of interest ROI of a multi enhancement layer video bitstream
AU2007231756A1 (en) A method of segmenting videos into a hierachy of segments
WO2003085968A1 (fr) Support d'enregistrement d'informations et son procede de fabrication
US20030206729A1 (en) Imaging system for authoring a multimedia enabled disc
López et al. Methodological and statistical background on the world’s technological capacity to store, communicate, and compute information
US20070154164A1 (en) Converting a still image in a slide show to a plurality of video frame images
CN1538445A (zh) 生成多媒体盘的方法
JP3688214B2 (ja) 視聴者映像記録再生装置
CN1574900A (zh) 图像摄取装置
JP2008288934A (ja) 動画撮影装置および動画再生装置
JPH11285023A (ja) 画像情報の送信・記録・再生装置
Sun et al. High resolution multimedia slide show composition for Video CD and DVD rendering
Loui et al. RhythmPix: a multimedia composition and albuming system for consumer images
US20060093319A1 (en) Method of reproducing contents data and apparatus for reproducing the same
JP2005159878A (ja) データ処理装置及びデータ処理方法、並びにプログラム、記憶媒体
KR20040019654A (ko) 전자 영상 앨범 장치
JPH07182794A (ja) 情報記録媒体と再生装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication