CN101971262A - 用于播放图片的方法和设备 - Google Patents

用于播放图片的方法和设备 Download PDF

Info

Publication number
CN101971262A
CN101971262A CN2008801290269A CN200880129026A CN101971262A CN 101971262 A CN101971262 A CN 101971262A CN 2008801290269 A CN2008801290269 A CN 2008801290269A CN 200880129026 A CN200880129026 A CN 200880129026A CN 101971262 A CN101971262 A CN 101971262A
Authority
CN
China
Prior art keywords
picture
electronic equipment
speech message
key feature
reproduction time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2008801290269A
Other languages
English (en)
Inventor
金盛
陈鑫
彭扬
陈宁江
夏允基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Priority to CN2008801290269A priority Critical patent/CN101971262A/zh
Publication of CN101971262A publication Critical patent/CN101971262A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • G06F16/436Filtering based on additional data, e.g. user or group profiles using biological or physiological data of a human being, e.g. blood pressure, facial expression, gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • G06F16/4387Presentation of query results by the use of playlists
    • G06F16/4393Multimedia presentations, e.g. slide shows, multimedia albums
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biophysics (AREA)
  • Physiology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一种播放图片的方法包括步骤:接收(11)语音消息;提取(12)该语音消息的关键特征;通过将该关键特征与预存储图片信息进行匹配来选择(13)图片;通过整合所选择图片和所述语音消息来生成(14)图片-语音序列;以及播放(15)该图片-语音序列。本发明还给出一种电子设备,其包括用于实现依照本发明的方法的步骤的处理单元。

Description

用于播放图片的方法和设备
技术领域
本发明涉及用于播放图片的方法和设备。
背景技术
越来越多的电子设备被用于播放图片,例如PDA(个人数字助理)、移动电话、TV(电视)、PC(个人计算机)、数字相框。用于播放图片的电子设备能够存储、管理和共享图片。用于播放图片的电子设备还能够在嵌入式显示屏上播放数字图片的幻灯片,这些数字图片存储在该电子设备的内部存储器或者外部存储卡中。所述图片可以是照片、图像等等。
当前大多数电子设备只是简单地播放已存储数字图片的幻灯片。用户可能要求有更多的功能伴随该幻灯片,以便增加用户与电子设备之间的交互性。
为了增进电子设备与用户之间的交互性,日本专利申请JP200058205A公开了一种已知的电子设备,该电子设备是一种用于通过语音记录来对图片进行分类的设备和存储介质。这种设备包括:预存储语音数据和图片数据;用于识别伴随图片数据的语音数据的识别装置;用于根据由识别装置识别出的预存储语音数据来对图片数据进行分类的分类装置;以及用于根据输入语音数据对图片或图片种类进行搜索的搜索装置,所述输入语音数据与预存储语音数据相同。
然而,这种已知的电子设备仅仅根据预定义和固定的语音来与用户交互,这使得用户界面不智能化和不友好,并且没有充分改善用户与电子设备之间的交互性。
发明目的和概述
本发明的一个目的是提供一种用于播放图片的改进方法和设备。
这种播放图片的方法包括步骤:
-接收语音消息;
-提取该语音消息的关键特征;
-通过将该关键特征与预存储图片信息进行匹配来选择图片;
-通过整合所选择图片和所述语音消息来生成图片-语音序列;以及
-播放该图片-语音序列。
本发明还给出一种包括处理单元的电子设备,所述处理单元用于实现依照本发明的方法的步骤。
在该方法和设备中,由用户随机输入的语音消息和与该语音消息相关的对应图片被整合成用于播放的图片-语音序列,这改善了用户与电子设备之间的交互性。
附图简述
根据下文描述的实现方式和实施例并且参照附图,依照本发明用于播放图片的该方法和设备的这些和其他方面将变得显而易见,并且将对其进行阐述,其中
图1是依照本发明的实施例的方法流程图;
图2是描绘依照本发明的实施例的设备的示意图。
在所有附图中,相同的附图标记用来表示相似的部件。
本发明详述
图1是依照本发明的实施例的方法流程图。所述播放图片的方法包括步骤:
-接收(11)语音消息。该语音消息从用户或者第二电子设备处接收,所述第二电子设备可以是PDA(个人数字助理)、移动电话、TV(电视机)、PC(个人计算机)以及数字相框等等。该语音消息的内容可以由用户随机决定。该语音消息可以是用户输入的单词、句子、及音乐等。所述接收(11)步骤可以用来记录该语音消息并且将该语音消息存储到第一电子设备的存储器中。例如,当儿子从学校返回时,他希望通过所述第一电子设备给他的母亲留下诸如“我要去打篮球,下午7点回来”之类的语音消息。所述第一电子设备也可以是PDA、移动电话、TV、PC以及数字相框等等。
-从该语音消息提取(12)关键特征。该提取(12)步骤用来逐字分析语音消息内容,以便提取出关键特征,例如关键字和/或用户身份和/或对应的语调。可以预先将语调分成不同的种类(例如“高兴”、“悲伤”、“平和”),并且存储到所述第一电子设备的存储器中。例如,关键字可能是“篮球”,语调可能是“高兴”,用户身份是“儿子”。所述提取(12)步骤进一步用来计算该语音消息的播放时间,例如,经过计算,播放该语音消息的持续时间是1分钟。
-通过将所述关键特征与预存储图片信息进行匹配来选择(13)图片。该预存储图片信息被存储在所述第一电子设备的存储器中。该预存储图片信息可以包括图片名称、针对图片内容的简短描述等等。例如,选择与“篮球”、“高兴”和“儿子”有关的图片,因为这些图片与所述语音消息的关键特征匹配。可以在所述存储器中预定义匹配权重,以便所选择的图片能够被分类成例如4个等级。对于第一等级,匹配权重为100,这意味着包含在第一等级内的所选择图片与所述语音消息非常相关;对于第二等级,匹配权重为60;对于第三等级,匹配权重为20;对于第四等级,匹配权重为0。属于第一等级的被选图片被播放的优先级最高,第二等级、第三等级及第四级的优先级依次降低。
-通过整合所选择图片和所述语音消息生成(14)图片-语音序列。该生成(14)步骤用来依照所述语音消息的关键特征、所述语音消息的持续时间以及所述预存储图片信息来生成图片-语音序列。该生成(14)步骤还用来确定所述图片-语音序列的播放时间、所选择图片的播放顺序以及每张所选择图片的播放时间。所述图片-语音序列的播放时间可以等于所述语音消息的持续时间。用于所选择图片的播放顺序能够依照匹配权重来确定。例如,如果匹配权重较高,那么可以更早地播放对应的所选择图片;如果匹配权重较低,那么可以更晚地播放对应的所选择图片。每张所选择图片的播放时间也可以依照匹配权重来确定。例如,如果匹配权重较高,那么可以更长时间地播放对应的图片;如果匹配权重较低,那么可以更短时间地播放对应的图片。当然,每张所选择图片可以以相同的时间长度来播放。如果语音消息的播放时间为1分钟,那么图片-语音序列的播放时间可以是1分钟。如果要以相同时间长度来播放每张所选择图片并且选择了6张图片,那么每张所选择图片可以播放10秒钟。
-播放(15)所述图片-语音序列。该播放(15)步骤可以包括三种情况:第一种情况是在生成图片-语音序列之后立即播放该图片-语音序列;第二种情况是循环地播放该图片-语音序列,直到播放被切断;第三种情况是依照用户的指示来播放该图片-语音序列。对于第三种情况,当用户注意到所述第一电子设备上显示的针对该图片-语音序列的提示闪光(例如LED)或者其他警报时,用户可以指示该第一电子设备播放该图片-语音序列。在用户指示播放该图片-语音序列之前,可以将该图片-语音序列存储在所述第一电子设备的存储器中。例如,当这位母亲回来时,她注意到所述电子设备(例如相框)上的提示闪光,并且这位母亲知道某个家庭成员留下了语音消息,那么她就可以打开相框的按钮来浏览该图片-语音序列。对于所有上述三种情况,都可以在播放之后自动将该图片-语音序列保存在所述存储器中。如果生成了不止一个图片-语音序列,那么所述播放(15)步骤可以用来依照每个图片-语音序列的生成时间顺序地播放这些图片-语音序列。
图2是描绘依照本发明的实施例的设备的示意图。电子设备20可以是PDA、移动电话、TV、PC以及数字相框等等。
用于播放图片的电子设备20包括:
-用于接收语音消息的接收单元(21)。该语音消息从用户或者另一电子设备处接收,所述另一电子设备可以是PDA、移动电话、TV、PC以及数字相框等等。该语音消息的内容可以由用户随机决定。该语音消息可以由字词、句子、音乐等组成。所述接收单元(21)用来记录该语音消息并且将该语音消息存储到存储器中。所述接收单元(21)可以是无线单元、记录器等等。
-用于从该语音消息提取关键特征的提取单元(22)。该提取单元(22)用来逐字分析语音消息内容,以便提取出关键特征,例如关键字、用户身份以及对应的语调。可以预先将语调分成不同的种类(例如“高兴”、“悲伤”、“平和”),并且可以将预分类语调标准存储到所述电子设备20的存储器中。所述提取单元(22)进一步用来计算该语音消息的播放时间。
-用于通过将所述关键特征与预存储图片信息进行匹配来选择图片的选择单元(23)。该预存储图片信息被存储在所述电子设备20的存储器中。该图片信息可以包括图片名称、针对图片内容的简短描述等等。可以在所述存储器中预定义匹配权重,以便所选择的图片能够被分类成例如4个等级。对于第一等级,匹配权重为100,这意味着包含在第一等级内的所选择图片与所述语音消息非常相关;对于第二等级,匹配权重为60;对于第三等级,匹配权重为20;对于第四等级,匹配权重为0。属于第一等级的被选图片被播放的优先级最高,第二等级、第三等级及第四级的优先级依次降低。
-用于通过整合所选择图片和所述语音消息来生成图片-语音序列的生成单元(24)。该生成单元(24)用来依照所述语音消息的关键特征、所述语音消息的持续时间以及所述预存储图片信息来生成图片-语音序列。该生成单元(24)还用来确定所述图片-语音序列的播放时间、用于所选择图片的播放顺序以及每张所选图片的播放时间。所述图片-语音序列的播放时间可以等于所述语音消息的持续时间。用于所选图片的播放顺序可以由该生成单元(24)依照匹配权重来确定。每张所选择图片的播放时间也可以由该生成单元(24)依照匹配权重来确定。当然,每张所选择图片可以以相同的时间长度来播放。
-用于播放所述图片-语音序列的播放单元(25)。该播放单元(25)用于在下列三种情况下播放所述图片-语音序列:第一种情况是在生成图片-语音序列之后立即播放该图片-语音序列;第二种情况是循环地播放该图片-语音序列,直到播放被切断;第三种情况是依照用户的指示来播放该图片-语音序列。对于第三种情况,当用户注意到所述第一电子设备上显示的针对该图片-语音序列的提示闪光(例如LED)或者其他警报时,用户可以指示该第一电子设备播放该图片-语音序列。在用户指示播放该图片-语音序列之前,可以将该图片-语音序列存储在所述存储器中。对于所有上述三种情况,都可以在播放之后自动将该图片-语音序列保存在所述存储器中。如果生成了不止一个图片-语音序列,那么所述播放单元(25)可以用来依照每个图片-语音序列的生成时间顺序地播放这些图片-语音序列。
所述电子设备20的各部件得到至少一个CPU的支持。
应当指出的是,上述实施例说明了而不是限制了本发明,并且本领域技术人员将能够设计出可替换的实施例而不偏离所附权利要求的范围。在权利要求中,置于括号中的任何附图标记都不应当被视为限制了该权利要求。词语“包括”没有排除权利要求中未列出的元件或步骤的存在。元件前的词语“一”或“一个”没有排除存在多个这种元件。本发明可以通过包括了几个不同元件的硬件来实现,也可以通过经过适当编程的计算机来实现。在列举了几个装置的设备权利要求中,这些装置中的一些可以由同一硬件项来实施。词语第一、第二和第三等等的使用并不意味着任何排序。这些词语应被解释为用于命名。

Claims (22)

1.一种播放图片的方法,包括步骤:
-接收(11)语音消息;
-从该语音消息提取(12)关键特征;
-通过将所述关键特征与预存储图片信息进行匹配来选择(13)图片;
-通过整合所选择图片和所述语音数据来生成(14)图片-语音序列;以及
-播放(15)该图片-语音序列。
2.如权利要求1所述的方法,其中所述提取(12)步骤用来逐字分析语音消息内容,以便提取出关键特征。
3.如权利要求1所述的方法,其中所述关键特征是关键字和/或用户身份和/或对应的语调。
4.如权利要求1所述的方法,其中所述提取(12)步骤还用来计算所述语音消息的播放时间。
5.如权利要求4所述的方法,其中所述预存储图片信息包括图片名称、图片内容的简短描述。
6.如权利要求5所述的方法,其中所述生成(14)步骤用来依照所述语音消息的关键特征、所述语音消息的持续时间以及所述预存储图片信息来生成图片-语音序列。
7.如权利要求1所述的方法,其中所述生成(14)步骤还用来确定所述图片-语音序列的播放时间、所选择图片的播放顺序以及每张所选择图片的播放时间。
8.如权利要求7所述的方法,其中所述图片-语音序列的播放时间等于所述语音消息的持续时间。
9.如权利要求7所述的方法,其中所述用于所选择图片的播放顺序是依照预定义匹配权重来确定的。
10.如权利要求7所述的方法,其中每张所选择图片的播放时间是依照预定义匹配权重来确定的。
11.如权利要求1所述的方法,其中以相同的时间长度播放每张所选择图片。
12.一种用于播放图片的电子设备,包括:
-用于接收语音消息的接收单元(21);
-用于从该语音消息提取关键特征的提取单元(22);
-用于通过将所述关键特征与预存储图片信息进行匹配来选择图片的选择单元(23);
-用于通过整合所选择图片和所述语音数据来生成图片-语音序列的生成单元(24);以及
-用于播放该图片-语音序列的播放单元(25)。
13.如权利要求12所述的电子设备,其中所述提取单元(22)用来逐字分析语音消息内容,以便提取出关键特征。
14.如权利要求12所述的电子设备,其中所述关键特征是关键字和/或用户身份和/或对应的语调。
15.如权利要求12所述的电子设备,其中所述提取单元(22)还用来计算所述语音消息的播放时间。
16.如权利要求15所述的电子设备,其中所述预存储图片信息包括图片名称、图片内容的简短描述。
17.如权利要求16所述的电子设备,其中所述生成单元(24)用来依照所述语音消息的关键特征、所述语音消息的持续时间以及所述预存储图片信息来生成图片-语音序列。
18.如权利要求12所述的电子设备,其中所述生成单元(24)还用来确定所述图片-语音序列的播放时间、所选择图片的播放顺序以及每张所选择图片的播放时间。
19.如权利要求18所述的电子设备,其中所述图片-语音序列的播放时间等于所述语音消息的持续时间。
20.如权利要求18所述的电子设备,其中所述生成单元(24)被用于依照预定义匹配权重来确定所述用于所选择图片的播放顺序。
21.如权利要求18所述的电子设备,其中所述生成单元(24)被用于依照预定义匹配权重来确定每张所选择图片的播放时间。
22.如权利要求12所述的电子设备,其中以相同的时间长度播放每张所选择图片。
CN2008801290269A 2007-12-21 2008-12-11 用于播放图片的方法和设备 Pending CN101971262A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008801290269A CN101971262A (zh) 2007-12-21 2008-12-11 用于播放图片的方法和设备

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN200710162187 2007-12-21
CN200710162187.5 2007-12-21
CN2008801290269A CN101971262A (zh) 2007-12-21 2008-12-11 用于播放图片的方法和设备
PCT/IB2008/055219 WO2009083845A2 (en) 2007-12-21 2008-12-11 Method and apparatus for playing pictures

Publications (1)

Publication Number Publication Date
CN101971262A true CN101971262A (zh) 2011-02-09

Family

ID=40578247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801290269A Pending CN101971262A (zh) 2007-12-21 2008-12-11 用于播放图片的方法和设备

Country Status (6)

Country Link
US (1) US8438034B2 (zh)
EP (1) EP2225758A2 (zh)
JP (1) JP5765940B2 (zh)
KR (1) KR101513847B1 (zh)
CN (1) CN101971262A (zh)
WO (1) WO2009083845A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104022942A (zh) * 2014-06-26 2014-09-03 北京奇虎科技有限公司 处理交互式消息的方法、客户端、电子设备及系统
CN104821109A (zh) * 2015-05-26 2015-08-05 北京云江科技有限公司 一种基于图像和语音信息的在线答疑系统
CN106060394A (zh) * 2016-06-28 2016-10-26 广东欧珀移动通信有限公司 一种拍照方法、装置和终端设备
CN111724795A (zh) * 2020-06-17 2020-09-29 海尔优家智能科技(北京)有限公司 一种相册播放方法及装置

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8909531B2 (en) * 2009-10-02 2014-12-09 Mediatek Inc. Methods and devices for displaying multimedia data emulating emotions based on image shuttering speed
TWI509506B (zh) * 2010-04-02 2015-11-21 Transcend Information Inc 影像顯示裝置及其方法
WO2011156719A1 (en) * 2010-06-10 2011-12-15 Logoscope, Llc System and method for conversion of speech to displayed media data
JP2012075039A (ja) * 2010-09-29 2012-04-12 Sony Corp 制御装置、および制御方法
CN102055845A (zh) * 2010-11-30 2011-05-11 深圳市五巨科技有限公司 移动通信终端及其音乐播放器图片切换方法
CN103188366B (zh) * 2011-12-30 2015-11-11 中国移动通信集团福建有限公司 一种短信处理方法及装置
CN104409087B (zh) * 2014-11-18 2017-06-16 广东欧珀移动通信有限公司 歌曲文件播放方法和系统
CN105208439B (zh) * 2015-09-11 2018-09-04 深圳Tcl数字技术有限公司 音频文件播放方法及装置
KR101966803B1 (ko) 2017-01-20 2019-04-08 동우 화인켐 주식회사 착색 감광성 수지 조성물, 이를 사용하여 제조된 블랙 매트릭스, 컬럼 스페이서 또는 블랙 컬럼 스페이서를 포함하는 컬러필터, 및 상기 컬러필터를 포함하는 표시장치
CN107547748A (zh) * 2017-09-07 2018-01-05 深圳市金立通信设备有限公司 一种图片管理方法、终端及计算机可读存储介质
WO2019114582A1 (zh) * 2017-12-15 2019-06-20 广州市百果园信息技术有限公司 视频图像处理方法及计算机存储介质、终端
CN108462892B (zh) 2018-03-26 2019-08-06 百度在线网络技术(北京)有限公司 图像和音频同步播放的处理方法及设备
CN111399794B (zh) * 2019-01-02 2024-03-22 中国移动通信有限公司研究院 一种语音播放方法、装置及终端设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1452157A (zh) * 2002-04-17 2003-10-29 日本先锋公司 语音识别设备和方法以及记录了语音识别程序的记录媒体
US7248857B1 (en) * 2004-02-27 2007-07-24 Cingular Wireless Ii, Llc System and method for enhanced message notification

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956682A (en) 1991-06-06 1999-09-21 Lj Laboratories, Llc Picture frame with associated audio messages and position sensitive or speech recognition device
JPH0863176A (ja) * 1994-08-19 1996-03-08 Pfu Ltd 音楽映像データ再生装置
US5734794A (en) * 1995-06-22 1998-03-31 White; Tom H. Method and system for voice-activated cell animation
US5651055A (en) 1995-06-29 1997-07-22 Lucent Technologies Inc. Digital secretary
SE519244C2 (sv) * 1995-12-06 2003-02-04 Telia Ab Anordning och metod vid talsyntes
JPH09288681A (ja) * 1996-04-23 1997-11-04 Toshiba Corp 背景映像検索表示装置および背景映像検索方法
US6084582A (en) * 1997-07-02 2000-07-04 Microsoft Corporation Method and apparatus for recording a voice narration to accompany a slide show
US6721001B1 (en) * 1998-12-16 2004-04-13 International Business Machines Corporation Digital camera with voice recognition annotation
JP2000358205A (ja) 1999-06-17 2000-12-26 Fuji Photo Film Co Ltd 音声認識による画像分類装置、方法及び記憶媒体
US6499016B1 (en) * 2000-02-28 2002-12-24 Flashpoint Technology, Inc. Automatically storing and presenting digital images using a speech-based command language
JP2002082684A (ja) 2000-09-07 2002-03-22 Sony Corp プレゼンテーションシステム及びプレゼンテーションデータ生成方法、並びに記録媒体
US20020099552A1 (en) * 2001-01-25 2002-07-25 Darryl Rubin Annotating electronic information with audio clips
JP2003219327A (ja) * 2001-09-28 2003-07-31 Canon Inc 画像管理装置、画像管理方法、制御プログラム、情報処理システム、画像データ管理方法、アダプタ、及びサーバ
GB2383247A (en) 2001-12-13 2003-06-18 Hewlett Packard Co Multi-modal picture allowing verbal interaction between a user and the picture
TW565811B (en) * 2001-12-31 2003-12-11 Ji-Ching Jou Computer digital teaching method
US7133535B2 (en) * 2002-12-21 2006-11-07 Microsoft Corp. System and method for real time lip synchronization
US7711560B2 (en) * 2003-02-19 2010-05-04 Panasonic Corporation Speech recognition device and speech recognition method
US7127127B2 (en) * 2003-03-04 2006-10-24 Microsoft Corporation System and method for adaptive video fast forward using scene generative models
US7349010B2 (en) * 2003-04-11 2008-03-25 Eastman Kodak Company Digital camera including an on-line sales mode
JP2005049773A (ja) * 2003-07-31 2005-02-24 Denso Corp 音楽再生装置
US20050057578A1 (en) 2003-09-16 2005-03-17 Shan-Jang Chen Digital photo frame
TW200540732A (en) * 2004-06-04 2005-12-16 Bextech Inc System and method for automatically generating animation
US7738637B2 (en) * 2004-07-24 2010-06-15 Massachusetts Institute Of Technology Interactive voice message retrieval
JP2006092430A (ja) * 2004-09-27 2006-04-06 Denso Corp 音楽再生装置
EP2113121B1 (en) * 2004-11-22 2018-11-07 Mario Pirchio Method to synchronize audio and graphics in a multimedia presentation
US7613613B2 (en) * 2004-12-10 2009-11-03 Microsoft Corporation Method and system for converting text to lip-synchronized speech in real time
US7574453B2 (en) * 2005-01-03 2009-08-11 Orb Networks, Inc. System and method for enabling search and retrieval operations to be performed for data items and records using data obtained from associated voice files
JP2006244002A (ja) * 2005-03-02 2006-09-14 Sony Corp コンテンツ再生装置およびコンテンツ再生方法
US7412389B2 (en) * 2005-03-02 2008-08-12 Yang George L Document animation system
US7721301B2 (en) * 2005-03-31 2010-05-18 Microsoft Corporation Processing files from a mobile device using voice commands
US8015009B2 (en) * 2005-05-04 2011-09-06 Joel Jay Harband Speech derived from text in computer presentation applications
US8077179B2 (en) * 2005-07-11 2011-12-13 Pandoodle Corp. System and method for creating animated video with personalized elements
JP2007174026A (ja) * 2005-12-20 2007-07-05 Sony Corp 画像収集システム、電子機器および画像送信方法、プログラム、並びに記録媒体
JP2007174503A (ja) * 2005-12-26 2007-07-05 Fujifilm Corp 音楽画像再生装置及び音楽画像情報管理方法
JP2007281618A (ja) * 2006-04-03 2007-10-25 Sony Corp 情報処理装置、情報処理方法、およびプログラム
US20070263266A1 (en) * 2006-05-09 2007-11-15 Har El Nadav Method and System for Annotating Photographs During a Slide Show
US20110289445A1 (en) * 2010-05-18 2011-11-24 Rovi Technologies Corporation Virtual media shelf

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1452157A (zh) * 2002-04-17 2003-10-29 日本先锋公司 语音识别设备和方法以及记录了语音识别程序的记录媒体
US7248857B1 (en) * 2004-02-27 2007-07-24 Cingular Wireless Ii, Llc System and method for enhanced message notification

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DAVID A.SHAMMA,BRYAN PARDO,KRISTIAN J.HAMMOND: "MusicStory: a Personalized Music Video Creator", 《PROCEEDINGS OF THE ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104022942A (zh) * 2014-06-26 2014-09-03 北京奇虎科技有限公司 处理交互式消息的方法、客户端、电子设备及系统
CN104022942B (zh) * 2014-06-26 2018-09-11 北京奇虎科技有限公司 处理交互式消息的方法、客户端、电子设备及系统
CN104821109A (zh) * 2015-05-26 2015-08-05 北京云江科技有限公司 一种基于图像和语音信息的在线答疑系统
CN106060394A (zh) * 2016-06-28 2016-10-26 广东欧珀移动通信有限公司 一种拍照方法、装置和终端设备
CN111724795A (zh) * 2020-06-17 2020-09-29 海尔优家智能科技(北京)有限公司 一种相册播放方法及装置

Also Published As

Publication number Publication date
JP2011511499A (ja) 2011-04-07
KR101513847B1 (ko) 2015-04-21
KR20100095633A (ko) 2010-08-31
EP2225758A2 (en) 2010-09-08
WO2009083845A3 (en) 2009-08-27
US20100312559A1 (en) 2010-12-09
JP5765940B2 (ja) 2015-08-19
US8438034B2 (en) 2013-05-07
WO2009083845A2 (en) 2009-07-09

Similar Documents

Publication Publication Date Title
CN101971262A (zh) 用于播放图片的方法和设备
US11055342B2 (en) System and method for rich media annotation
CN110286976B (zh) 界面显示方法、装置、终端及存储介质
CN107251006B (zh) 具有共享兴趣的消息的图库
CN102202173B (zh) 照片自动命名方法及其装置
US8874596B2 (en) Image processing system and method
CN100476818C (zh) 基于元数据搜索和命名条目
CN113536793A (zh) 一种实体识别方法、装置、设备以及存储介质
CN111368141B (zh) 视频标签的扩展方法、装置、计算机设备和存储介质
CN107103316A (zh) 基于智能手机的方法和系统
CN105159988A (zh) 一种浏览照片的方法及装置
TW201421994A (zh) 視頻內容搜索系統及方法
CN113204691B (zh) 一种信息展示方法、装置、设备及介质
CN101853297A (zh) 一种在电子设备中快速获得期望图像的方法
CN107508964A (zh) 一种移动终端的照片存储和查看方法、装置及存储介质
CN113420223A (zh) 内容搜索方法、装置、设备及介质
CN111159442A (zh) 基于语音的图片搜索系统、方法、介质及设备
CN113792226B (zh) 一种信息展示方法、装置以及计算机存储介质
CN107562954B (zh) 基于移动终端的推荐搜索方法、装置以及移动终端
CN104090878B (zh) 一种多媒体查找方法、终端、服务器及系统
US9066135B2 (en) System and method for generating a second screen experience using video subtitle data
CN114697762B (zh) 一种处理方法、装置、终端设备及介质
CN108255917B (zh) 图像管理方法、设备及电子设备
KR101804889B1 (ko) 사용자 정보에 따른 스토리 생성 장치 및 방법
CN112333554B (zh) 多媒体数据的处理方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110209