CN101971262A - 用于播放图片的方法和设备 - Google Patents
用于播放图片的方法和设备 Download PDFInfo
- Publication number
- CN101971262A CN101971262A CN2008801290269A CN200880129026A CN101971262A CN 101971262 A CN101971262 A CN 101971262A CN 2008801290269 A CN2008801290269 A CN 2008801290269A CN 200880129026 A CN200880129026 A CN 200880129026A CN 101971262 A CN101971262 A CN 101971262A
- Authority
- CN
- China
- Prior art keywords
- picture
- electronic equipment
- speech message
- key feature
- reproduction time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000008878 coupling Effects 0.000 claims description 21
- 238000010168 coupling process Methods 0.000 claims description 21
- 238000005859 coupling reaction Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 13
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
- G06F16/436—Filtering based on additional data, e.g. user or group profiles using biological or physiological data of a human being, e.g. blood pressure, facial expression, gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/438—Presentation of query results
- G06F16/4387—Presentation of query results by the use of playlists
- G06F16/4393—Multimedia presentations, e.g. slide shows, multimedia albums
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/32—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
- G11B27/327—Table of contents
- G11B27/329—Table of contents on a disc [VTOC]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biophysics (AREA)
- Physiology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Television Signal Processing For Recording (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
一种播放图片的方法包括步骤:接收(11)语音消息;提取(12)该语音消息的关键特征;通过将该关键特征与预存储图片信息进行匹配来选择(13)图片;通过整合所选择图片和所述语音消息来生成(14)图片-语音序列;以及播放(15)该图片-语音序列。本发明还给出一种电子设备,其包括用于实现依照本发明的方法的步骤的处理单元。
Description
技术领域
本发明涉及用于播放图片的方法和设备。
背景技术
越来越多的电子设备被用于播放图片,例如PDA(个人数字助理)、移动电话、TV(电视)、PC(个人计算机)、数字相框。用于播放图片的电子设备能够存储、管理和共享图片。用于播放图片的电子设备还能够在嵌入式显示屏上播放数字图片的幻灯片,这些数字图片存储在该电子设备的内部存储器或者外部存储卡中。所述图片可以是照片、图像等等。
当前大多数电子设备只是简单地播放已存储数字图片的幻灯片。用户可能要求有更多的功能伴随该幻灯片,以便增加用户与电子设备之间的交互性。
为了增进电子设备与用户之间的交互性,日本专利申请JP200058205A公开了一种已知的电子设备,该电子设备是一种用于通过语音记录来对图片进行分类的设备和存储介质。这种设备包括:预存储语音数据和图片数据;用于识别伴随图片数据的语音数据的识别装置;用于根据由识别装置识别出的预存储语音数据来对图片数据进行分类的分类装置;以及用于根据输入语音数据对图片或图片种类进行搜索的搜索装置,所述输入语音数据与预存储语音数据相同。
然而,这种已知的电子设备仅仅根据预定义和固定的语音来与用户交互,这使得用户界面不智能化和不友好,并且没有充分改善用户与电子设备之间的交互性。
发明目的和概述
本发明的一个目的是提供一种用于播放图片的改进方法和设备。
这种播放图片的方法包括步骤:
-接收语音消息;
-提取该语音消息的关键特征;
-通过将该关键特征与预存储图片信息进行匹配来选择图片;
-通过整合所选择图片和所述语音消息来生成图片-语音序列;以及
-播放该图片-语音序列。
本发明还给出一种包括处理单元的电子设备,所述处理单元用于实现依照本发明的方法的步骤。
在该方法和设备中,由用户随机输入的语音消息和与该语音消息相关的对应图片被整合成用于播放的图片-语音序列,这改善了用户与电子设备之间的交互性。
附图简述
根据下文描述的实现方式和实施例并且参照附图,依照本发明用于播放图片的该方法和设备的这些和其他方面将变得显而易见,并且将对其进行阐述,其中
图1是依照本发明的实施例的方法流程图;
图2是描绘依照本发明的实施例的设备的示意图。
在所有附图中,相同的附图标记用来表示相似的部件。
本发明详述
图1是依照本发明的实施例的方法流程图。所述播放图片的方法包括步骤:
-接收(11)语音消息。该语音消息从用户或者第二电子设备处接收,所述第二电子设备可以是PDA(个人数字助理)、移动电话、TV(电视机)、PC(个人计算机)以及数字相框等等。该语音消息的内容可以由用户随机决定。该语音消息可以是用户输入的单词、句子、及音乐等。所述接收(11)步骤可以用来记录该语音消息并且将该语音消息存储到第一电子设备的存储器中。例如,当儿子从学校返回时,他希望通过所述第一电子设备给他的母亲留下诸如“我要去打篮球,下午7点回来”之类的语音消息。所述第一电子设备也可以是PDA、移动电话、TV、PC以及数字相框等等。
-从该语音消息提取(12)关键特征。该提取(12)步骤用来逐字分析语音消息内容,以便提取出关键特征,例如关键字和/或用户身份和/或对应的语调。可以预先将语调分成不同的种类(例如“高兴”、“悲伤”、“平和”),并且存储到所述第一电子设备的存储器中。例如,关键字可能是“篮球”,语调可能是“高兴”,用户身份是“儿子”。所述提取(12)步骤进一步用来计算该语音消息的播放时间,例如,经过计算,播放该语音消息的持续时间是1分钟。
-通过将所述关键特征与预存储图片信息进行匹配来选择(13)图片。该预存储图片信息被存储在所述第一电子设备的存储器中。该预存储图片信息可以包括图片名称、针对图片内容的简短描述等等。例如,选择与“篮球”、“高兴”和“儿子”有关的图片,因为这些图片与所述语音消息的关键特征匹配。可以在所述存储器中预定义匹配权重,以便所选择的图片能够被分类成例如4个等级。对于第一等级,匹配权重为100,这意味着包含在第一等级内的所选择图片与所述语音消息非常相关;对于第二等级,匹配权重为60;对于第三等级,匹配权重为20;对于第四等级,匹配权重为0。属于第一等级的被选图片被播放的优先级最高,第二等级、第三等级及第四级的优先级依次降低。
-通过整合所选择图片和所述语音消息生成(14)图片-语音序列。该生成(14)步骤用来依照所述语音消息的关键特征、所述语音消息的持续时间以及所述预存储图片信息来生成图片-语音序列。该生成(14)步骤还用来确定所述图片-语音序列的播放时间、所选择图片的播放顺序以及每张所选择图片的播放时间。所述图片-语音序列的播放时间可以等于所述语音消息的持续时间。用于所选择图片的播放顺序能够依照匹配权重来确定。例如,如果匹配权重较高,那么可以更早地播放对应的所选择图片;如果匹配权重较低,那么可以更晚地播放对应的所选择图片。每张所选择图片的播放时间也可以依照匹配权重来确定。例如,如果匹配权重较高,那么可以更长时间地播放对应的图片;如果匹配权重较低,那么可以更短时间地播放对应的图片。当然,每张所选择图片可以以相同的时间长度来播放。如果语音消息的播放时间为1分钟,那么图片-语音序列的播放时间可以是1分钟。如果要以相同时间长度来播放每张所选择图片并且选择了6张图片,那么每张所选择图片可以播放10秒钟。
-播放(15)所述图片-语音序列。该播放(15)步骤可以包括三种情况:第一种情况是在生成图片-语音序列之后立即播放该图片-语音序列;第二种情况是循环地播放该图片-语音序列,直到播放被切断;第三种情况是依照用户的指示来播放该图片-语音序列。对于第三种情况,当用户注意到所述第一电子设备上显示的针对该图片-语音序列的提示闪光(例如LED)或者其他警报时,用户可以指示该第一电子设备播放该图片-语音序列。在用户指示播放该图片-语音序列之前,可以将该图片-语音序列存储在所述第一电子设备的存储器中。例如,当这位母亲回来时,她注意到所述电子设备(例如相框)上的提示闪光,并且这位母亲知道某个家庭成员留下了语音消息,那么她就可以打开相框的按钮来浏览该图片-语音序列。对于所有上述三种情况,都可以在播放之后自动将该图片-语音序列保存在所述存储器中。如果生成了不止一个图片-语音序列,那么所述播放(15)步骤可以用来依照每个图片-语音序列的生成时间顺序地播放这些图片-语音序列。
图2是描绘依照本发明的实施例的设备的示意图。电子设备20可以是PDA、移动电话、TV、PC以及数字相框等等。
用于播放图片的电子设备20包括:
-用于接收语音消息的接收单元(21)。该语音消息从用户或者另一电子设备处接收,所述另一电子设备可以是PDA、移动电话、TV、PC以及数字相框等等。该语音消息的内容可以由用户随机决定。该语音消息可以由字词、句子、音乐等组成。所述接收单元(21)用来记录该语音消息并且将该语音消息存储到存储器中。所述接收单元(21)可以是无线单元、记录器等等。
-用于从该语音消息提取关键特征的提取单元(22)。该提取单元(22)用来逐字分析语音消息内容,以便提取出关键特征,例如关键字、用户身份以及对应的语调。可以预先将语调分成不同的种类(例如“高兴”、“悲伤”、“平和”),并且可以将预分类语调标准存储到所述电子设备20的存储器中。所述提取单元(22)进一步用来计算该语音消息的播放时间。
-用于通过将所述关键特征与预存储图片信息进行匹配来选择图片的选择单元(23)。该预存储图片信息被存储在所述电子设备20的存储器中。该图片信息可以包括图片名称、针对图片内容的简短描述等等。可以在所述存储器中预定义匹配权重,以便所选择的图片能够被分类成例如4个等级。对于第一等级,匹配权重为100,这意味着包含在第一等级内的所选择图片与所述语音消息非常相关;对于第二等级,匹配权重为60;对于第三等级,匹配权重为20;对于第四等级,匹配权重为0。属于第一等级的被选图片被播放的优先级最高,第二等级、第三等级及第四级的优先级依次降低。
-用于通过整合所选择图片和所述语音消息来生成图片-语音序列的生成单元(24)。该生成单元(24)用来依照所述语音消息的关键特征、所述语音消息的持续时间以及所述预存储图片信息来生成图片-语音序列。该生成单元(24)还用来确定所述图片-语音序列的播放时间、用于所选择图片的播放顺序以及每张所选图片的播放时间。所述图片-语音序列的播放时间可以等于所述语音消息的持续时间。用于所选图片的播放顺序可以由该生成单元(24)依照匹配权重来确定。每张所选择图片的播放时间也可以由该生成单元(24)依照匹配权重来确定。当然,每张所选择图片可以以相同的时间长度来播放。
-用于播放所述图片-语音序列的播放单元(25)。该播放单元(25)用于在下列三种情况下播放所述图片-语音序列:第一种情况是在生成图片-语音序列之后立即播放该图片-语音序列;第二种情况是循环地播放该图片-语音序列,直到播放被切断;第三种情况是依照用户的指示来播放该图片-语音序列。对于第三种情况,当用户注意到所述第一电子设备上显示的针对该图片-语音序列的提示闪光(例如LED)或者其他警报时,用户可以指示该第一电子设备播放该图片-语音序列。在用户指示播放该图片-语音序列之前,可以将该图片-语音序列存储在所述存储器中。对于所有上述三种情况,都可以在播放之后自动将该图片-语音序列保存在所述存储器中。如果生成了不止一个图片-语音序列,那么所述播放单元(25)可以用来依照每个图片-语音序列的生成时间顺序地播放这些图片-语音序列。
所述电子设备20的各部件得到至少一个CPU的支持。
应当指出的是,上述实施例说明了而不是限制了本发明,并且本领域技术人员将能够设计出可替换的实施例而不偏离所附权利要求的范围。在权利要求中,置于括号中的任何附图标记都不应当被视为限制了该权利要求。词语“包括”没有排除权利要求中未列出的元件或步骤的存在。元件前的词语“一”或“一个”没有排除存在多个这种元件。本发明可以通过包括了几个不同元件的硬件来实现,也可以通过经过适当编程的计算机来实现。在列举了几个装置的设备权利要求中,这些装置中的一些可以由同一硬件项来实施。词语第一、第二和第三等等的使用并不意味着任何排序。这些词语应被解释为用于命名。
Claims (22)
1.一种播放图片的方法,包括步骤:
-接收(11)语音消息;
-从该语音消息提取(12)关键特征;
-通过将所述关键特征与预存储图片信息进行匹配来选择(13)图片;
-通过整合所选择图片和所述语音数据来生成(14)图片-语音序列;以及
-播放(15)该图片-语音序列。
2.如权利要求1所述的方法,其中所述提取(12)步骤用来逐字分析语音消息内容,以便提取出关键特征。
3.如权利要求1所述的方法,其中所述关键特征是关键字和/或用户身份和/或对应的语调。
4.如权利要求1所述的方法,其中所述提取(12)步骤还用来计算所述语音消息的播放时间。
5.如权利要求4所述的方法,其中所述预存储图片信息包括图片名称、图片内容的简短描述。
6.如权利要求5所述的方法,其中所述生成(14)步骤用来依照所述语音消息的关键特征、所述语音消息的持续时间以及所述预存储图片信息来生成图片-语音序列。
7.如权利要求1所述的方法,其中所述生成(14)步骤还用来确定所述图片-语音序列的播放时间、所选择图片的播放顺序以及每张所选择图片的播放时间。
8.如权利要求7所述的方法,其中所述图片-语音序列的播放时间等于所述语音消息的持续时间。
9.如权利要求7所述的方法,其中所述用于所选择图片的播放顺序是依照预定义匹配权重来确定的。
10.如权利要求7所述的方法,其中每张所选择图片的播放时间是依照预定义匹配权重来确定的。
11.如权利要求1所述的方法,其中以相同的时间长度播放每张所选择图片。
12.一种用于播放图片的电子设备,包括:
-用于接收语音消息的接收单元(21);
-用于从该语音消息提取关键特征的提取单元(22);
-用于通过将所述关键特征与预存储图片信息进行匹配来选择图片的选择单元(23);
-用于通过整合所选择图片和所述语音数据来生成图片-语音序列的生成单元(24);以及
-用于播放该图片-语音序列的播放单元(25)。
13.如权利要求12所述的电子设备,其中所述提取单元(22)用来逐字分析语音消息内容,以便提取出关键特征。
14.如权利要求12所述的电子设备,其中所述关键特征是关键字和/或用户身份和/或对应的语调。
15.如权利要求12所述的电子设备,其中所述提取单元(22)还用来计算所述语音消息的播放时间。
16.如权利要求15所述的电子设备,其中所述预存储图片信息包括图片名称、图片内容的简短描述。
17.如权利要求16所述的电子设备,其中所述生成单元(24)用来依照所述语音消息的关键特征、所述语音消息的持续时间以及所述预存储图片信息来生成图片-语音序列。
18.如权利要求12所述的电子设备,其中所述生成单元(24)还用来确定所述图片-语音序列的播放时间、所选择图片的播放顺序以及每张所选择图片的播放时间。
19.如权利要求18所述的电子设备,其中所述图片-语音序列的播放时间等于所述语音消息的持续时间。
20.如权利要求18所述的电子设备,其中所述生成单元(24)被用于依照预定义匹配权重来确定所述用于所选择图片的播放顺序。
21.如权利要求18所述的电子设备,其中所述生成单元(24)被用于依照预定义匹配权重来确定每张所选择图片的播放时间。
22.如权利要求12所述的电子设备,其中以相同的时间长度播放每张所选择图片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008801290269A CN101971262A (zh) | 2007-12-21 | 2008-12-11 | 用于播放图片的方法和设备 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710162187 | 2007-12-21 | ||
CN200710162187.5 | 2007-12-21 | ||
CN2008801290269A CN101971262A (zh) | 2007-12-21 | 2008-12-11 | 用于播放图片的方法和设备 |
PCT/IB2008/055219 WO2009083845A2 (en) | 2007-12-21 | 2008-12-11 | Method and apparatus for playing pictures |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101971262A true CN101971262A (zh) | 2011-02-09 |
Family
ID=40578247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008801290269A Pending CN101971262A (zh) | 2007-12-21 | 2008-12-11 | 用于播放图片的方法和设备 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8438034B2 (zh) |
EP (1) | EP2225758A2 (zh) |
JP (1) | JP5765940B2 (zh) |
KR (1) | KR101513847B1 (zh) |
CN (1) | CN101971262A (zh) |
WO (1) | WO2009083845A2 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104022942A (zh) * | 2014-06-26 | 2014-09-03 | 北京奇虎科技有限公司 | 处理交互式消息的方法、客户端、电子设备及系统 |
CN104821109A (zh) * | 2015-05-26 | 2015-08-05 | 北京云江科技有限公司 | 一种基于图像和语音信息的在线答疑系统 |
CN106060394A (zh) * | 2016-06-28 | 2016-10-26 | 广东欧珀移动通信有限公司 | 一种拍照方法、装置和终端设备 |
CN111724795A (zh) * | 2020-06-17 | 2020-09-29 | 海尔优家智能科技(北京)有限公司 | 一种相册播放方法及装置 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8909531B2 (en) * | 2009-10-02 | 2014-12-09 | Mediatek Inc. | Methods and devices for displaying multimedia data emulating emotions based on image shuttering speed |
TWI509506B (zh) * | 2010-04-02 | 2015-11-21 | Transcend Information Inc | 影像顯示裝置及其方法 |
WO2011156719A1 (en) * | 2010-06-10 | 2011-12-15 | Logoscope, Llc | System and method for conversion of speech to displayed media data |
JP2012075039A (ja) * | 2010-09-29 | 2012-04-12 | Sony Corp | 制御装置、および制御方法 |
CN102055845A (zh) * | 2010-11-30 | 2011-05-11 | 深圳市五巨科技有限公司 | 移动通信终端及其音乐播放器图片切换方法 |
CN103188366B (zh) * | 2011-12-30 | 2015-11-11 | 中国移动通信集团福建有限公司 | 一种短信处理方法及装置 |
CN104409087B (zh) * | 2014-11-18 | 2017-06-16 | 广东欧珀移动通信有限公司 | 歌曲文件播放方法和系统 |
CN105208439B (zh) * | 2015-09-11 | 2018-09-04 | 深圳Tcl数字技术有限公司 | 音频文件播放方法及装置 |
KR101966803B1 (ko) | 2017-01-20 | 2019-04-08 | 동우 화인켐 주식회사 | 착색 감광성 수지 조성물, 이를 사용하여 제조된 블랙 매트릭스, 컬럼 스페이서 또는 블랙 컬럼 스페이서를 포함하는 컬러필터, 및 상기 컬러필터를 포함하는 표시장치 |
CN107547748A (zh) * | 2017-09-07 | 2018-01-05 | 深圳市金立通信设备有限公司 | 一种图片管理方法、终端及计算机可读存储介质 |
WO2019114582A1 (zh) * | 2017-12-15 | 2019-06-20 | 广州市百果园信息技术有限公司 | 视频图像处理方法及计算机存储介质、终端 |
CN108462892B (zh) | 2018-03-26 | 2019-08-06 | 百度在线网络技术(北京)有限公司 | 图像和音频同步播放的处理方法及设备 |
CN111399794B (zh) * | 2019-01-02 | 2024-03-22 | 中国移动通信有限公司研究院 | 一种语音播放方法、装置及终端设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1452157A (zh) * | 2002-04-17 | 2003-10-29 | 日本先锋公司 | 语音识别设备和方法以及记录了语音识别程序的记录媒体 |
US7248857B1 (en) * | 2004-02-27 | 2007-07-24 | Cingular Wireless Ii, Llc | System and method for enhanced message notification |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956682A (en) | 1991-06-06 | 1999-09-21 | Lj Laboratories, Llc | Picture frame with associated audio messages and position sensitive or speech recognition device |
JPH0863176A (ja) * | 1994-08-19 | 1996-03-08 | Pfu Ltd | 音楽映像データ再生装置 |
US5734794A (en) * | 1995-06-22 | 1998-03-31 | White; Tom H. | Method and system for voice-activated cell animation |
US5651055A (en) | 1995-06-29 | 1997-07-22 | Lucent Technologies Inc. | Digital secretary |
SE519244C2 (sv) * | 1995-12-06 | 2003-02-04 | Telia Ab | Anordning och metod vid talsyntes |
JPH09288681A (ja) * | 1996-04-23 | 1997-11-04 | Toshiba Corp | 背景映像検索表示装置および背景映像検索方法 |
US6084582A (en) * | 1997-07-02 | 2000-07-04 | Microsoft Corporation | Method and apparatus for recording a voice narration to accompany a slide show |
US6721001B1 (en) * | 1998-12-16 | 2004-04-13 | International Business Machines Corporation | Digital camera with voice recognition annotation |
JP2000358205A (ja) | 1999-06-17 | 2000-12-26 | Fuji Photo Film Co Ltd | 音声認識による画像分類装置、方法及び記憶媒体 |
US6499016B1 (en) * | 2000-02-28 | 2002-12-24 | Flashpoint Technology, Inc. | Automatically storing and presenting digital images using a speech-based command language |
JP2002082684A (ja) | 2000-09-07 | 2002-03-22 | Sony Corp | プレゼンテーションシステム及びプレゼンテーションデータ生成方法、並びに記録媒体 |
US20020099552A1 (en) * | 2001-01-25 | 2002-07-25 | Darryl Rubin | Annotating electronic information with audio clips |
JP2003219327A (ja) * | 2001-09-28 | 2003-07-31 | Canon Inc | 画像管理装置、画像管理方法、制御プログラム、情報処理システム、画像データ管理方法、アダプタ、及びサーバ |
GB2383247A (en) | 2001-12-13 | 2003-06-18 | Hewlett Packard Co | Multi-modal picture allowing verbal interaction between a user and the picture |
TW565811B (en) * | 2001-12-31 | 2003-12-11 | Ji-Ching Jou | Computer digital teaching method |
US7133535B2 (en) * | 2002-12-21 | 2006-11-07 | Microsoft Corp. | System and method for real time lip synchronization |
US7711560B2 (en) * | 2003-02-19 | 2010-05-04 | Panasonic Corporation | Speech recognition device and speech recognition method |
US7127127B2 (en) * | 2003-03-04 | 2006-10-24 | Microsoft Corporation | System and method for adaptive video fast forward using scene generative models |
US7349010B2 (en) * | 2003-04-11 | 2008-03-25 | Eastman Kodak Company | Digital camera including an on-line sales mode |
JP2005049773A (ja) * | 2003-07-31 | 2005-02-24 | Denso Corp | 音楽再生装置 |
US20050057578A1 (en) | 2003-09-16 | 2005-03-17 | Shan-Jang Chen | Digital photo frame |
TW200540732A (en) * | 2004-06-04 | 2005-12-16 | Bextech Inc | System and method for automatically generating animation |
US7738637B2 (en) * | 2004-07-24 | 2010-06-15 | Massachusetts Institute Of Technology | Interactive voice message retrieval |
JP2006092430A (ja) * | 2004-09-27 | 2006-04-06 | Denso Corp | 音楽再生装置 |
EP2113121B1 (en) * | 2004-11-22 | 2018-11-07 | Mario Pirchio | Method to synchronize audio and graphics in a multimedia presentation |
US7613613B2 (en) * | 2004-12-10 | 2009-11-03 | Microsoft Corporation | Method and system for converting text to lip-synchronized speech in real time |
US7574453B2 (en) * | 2005-01-03 | 2009-08-11 | Orb Networks, Inc. | System and method for enabling search and retrieval operations to be performed for data items and records using data obtained from associated voice files |
JP2006244002A (ja) * | 2005-03-02 | 2006-09-14 | Sony Corp | コンテンツ再生装置およびコンテンツ再生方法 |
US7412389B2 (en) * | 2005-03-02 | 2008-08-12 | Yang George L | Document animation system |
US7721301B2 (en) * | 2005-03-31 | 2010-05-18 | Microsoft Corporation | Processing files from a mobile device using voice commands |
US8015009B2 (en) * | 2005-05-04 | 2011-09-06 | Joel Jay Harband | Speech derived from text in computer presentation applications |
US8077179B2 (en) * | 2005-07-11 | 2011-12-13 | Pandoodle Corp. | System and method for creating animated video with personalized elements |
JP2007174026A (ja) * | 2005-12-20 | 2007-07-05 | Sony Corp | 画像収集システム、電子機器および画像送信方法、プログラム、並びに記録媒体 |
JP2007174503A (ja) * | 2005-12-26 | 2007-07-05 | Fujifilm Corp | 音楽画像再生装置及び音楽画像情報管理方法 |
JP2007281618A (ja) * | 2006-04-03 | 2007-10-25 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
US20070263266A1 (en) * | 2006-05-09 | 2007-11-15 | Har El Nadav | Method and System for Annotating Photographs During a Slide Show |
US20110289445A1 (en) * | 2010-05-18 | 2011-11-24 | Rovi Technologies Corporation | Virtual media shelf |
-
2008
- 2008-12-11 US US12/808,389 patent/US8438034B2/en not_active Expired - Fee Related
- 2008-12-11 WO PCT/IB2008/055219 patent/WO2009083845A2/en active Application Filing
- 2008-12-11 EP EP08868146A patent/EP2225758A2/en not_active Ceased
- 2008-12-11 JP JP2010538982A patent/JP5765940B2/ja not_active Expired - Fee Related
- 2008-12-11 CN CN2008801290269A patent/CN101971262A/zh active Pending
- 2008-12-11 KR KR1020107015789A patent/KR101513847B1/ko not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1452157A (zh) * | 2002-04-17 | 2003-10-29 | 日本先锋公司 | 语音识别设备和方法以及记录了语音识别程序的记录媒体 |
US7248857B1 (en) * | 2004-02-27 | 2007-07-24 | Cingular Wireless Ii, Llc | System and method for enhanced message notification |
Non-Patent Citations (1)
Title |
---|
DAVID A.SHAMMA,BRYAN PARDO,KRISTIAN J.HAMMOND: "MusicStory: a Personalized Music Video Creator", 《PROCEEDINGS OF THE ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104022942A (zh) * | 2014-06-26 | 2014-09-03 | 北京奇虎科技有限公司 | 处理交互式消息的方法、客户端、电子设备及系统 |
CN104022942B (zh) * | 2014-06-26 | 2018-09-11 | 北京奇虎科技有限公司 | 处理交互式消息的方法、客户端、电子设备及系统 |
CN104821109A (zh) * | 2015-05-26 | 2015-08-05 | 北京云江科技有限公司 | 一种基于图像和语音信息的在线答疑系统 |
CN106060394A (zh) * | 2016-06-28 | 2016-10-26 | 广东欧珀移动通信有限公司 | 一种拍照方法、装置和终端设备 |
CN111724795A (zh) * | 2020-06-17 | 2020-09-29 | 海尔优家智能科技(北京)有限公司 | 一种相册播放方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2011511499A (ja) | 2011-04-07 |
KR101513847B1 (ko) | 2015-04-21 |
KR20100095633A (ko) | 2010-08-31 |
EP2225758A2 (en) | 2010-09-08 |
WO2009083845A3 (en) | 2009-08-27 |
US20100312559A1 (en) | 2010-12-09 |
JP5765940B2 (ja) | 2015-08-19 |
US8438034B2 (en) | 2013-05-07 |
WO2009083845A2 (en) | 2009-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101971262A (zh) | 用于播放图片的方法和设备 | |
US11055342B2 (en) | System and method for rich media annotation | |
CN110286976B (zh) | 界面显示方法、装置、终端及存储介质 | |
CN107251006B (zh) | 具有共享兴趣的消息的图库 | |
CN102202173B (zh) | 照片自动命名方法及其装置 | |
US8874596B2 (en) | Image processing system and method | |
CN100476818C (zh) | 基于元数据搜索和命名条目 | |
CN113536793A (zh) | 一种实体识别方法、装置、设备以及存储介质 | |
CN111368141B (zh) | 视频标签的扩展方法、装置、计算机设备和存储介质 | |
CN107103316A (zh) | 基于智能手机的方法和系统 | |
CN105159988A (zh) | 一种浏览照片的方法及装置 | |
TW201421994A (zh) | 視頻內容搜索系統及方法 | |
CN113204691B (zh) | 一种信息展示方法、装置、设备及介质 | |
CN101853297A (zh) | 一种在电子设备中快速获得期望图像的方法 | |
CN107508964A (zh) | 一种移动终端的照片存储和查看方法、装置及存储介质 | |
CN113420223A (zh) | 内容搜索方法、装置、设备及介质 | |
CN111159442A (zh) | 基于语音的图片搜索系统、方法、介质及设备 | |
CN113792226B (zh) | 一种信息展示方法、装置以及计算机存储介质 | |
CN107562954B (zh) | 基于移动终端的推荐搜索方法、装置以及移动终端 | |
CN104090878B (zh) | 一种多媒体查找方法、终端、服务器及系统 | |
US9066135B2 (en) | System and method for generating a second screen experience using video subtitle data | |
CN114697762B (zh) | 一种处理方法、装置、终端设备及介质 | |
CN108255917B (zh) | 图像管理方法、设备及电子设备 | |
KR101804889B1 (ko) | 사용자 정보에 따른 스토리 생성 장치 및 방법 | |
CN112333554B (zh) | 多媒体数据的处理方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20110209 |