CN105224581A - 在播放音乐时呈现图片的方法和装置 - Google Patents

在播放音乐时呈现图片的方法和装置 Download PDF

Info

Publication number
CN105224581A
CN105224581A CN201410314821.2A CN201410314821A CN105224581A CN 105224581 A CN105224581 A CN 105224581A CN 201410314821 A CN201410314821 A CN 201410314821A CN 105224581 A CN105224581 A CN 105224581A
Authority
CN
China
Prior art keywords
music
picture
plot
playing
paragraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410314821.2A
Other languages
English (en)
Other versions
CN105224581B (zh
Inventor
曾成斌
单煜翔
陈又新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Samsung Telecom R&D Center
Beijing Samsung Telecommunications Technology Research Co Ltd
Samsung Electronics Co Ltd
Original Assignee
Beijing Samsung Telecommunications Technology Research Co Ltd
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Samsung Telecommunications Technology Research Co Ltd, Samsung Electronics Co Ltd filed Critical Beijing Samsung Telecommunications Technology Research Co Ltd
Priority to CN201410314821.2A priority Critical patent/CN105224581B/zh
Priority to KR1020150084338A priority patent/KR102396375B1/ko
Priority to EP15175311.8A priority patent/EP2963651A1/en
Priority to US14/792,045 priority patent/US10565754B2/en
Publication of CN105224581A publication Critical patent/CN105224581A/zh
Application granted granted Critical
Publication of CN105224581B publication Critical patent/CN105224581B/zh
Priority to KR1020220055711A priority patent/KR102527281B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Controls And Circuits For Display Device (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了在播放音乐时呈现图片的方法和装置。所述方法的一具体实施方式包括:获取与音乐相关联的故事情节;根据所述故事情节获取一张或者一张以上的图片;在播放所述音乐的同时呈现所述一张或者一张以上的图片。该实施方式实现了对音乐播放功能的扩展。

Description

在播放音乐时呈现图片的方法和装置
技术领域
本申请涉及计算机技术领域,具体涉及多媒体处理技术领域,尤其涉及在播放音乐时呈现图片的方法和装置。
背景技术
当前,智能手机、平板电脑、智能电视已日渐普及,这些设备同时具备了播放高品质音乐、图像、以及视频的功能。人们在利用这些设备听音乐时,往往受限于欣赏音乐本身,而如果能同时在所述设备上播放与音乐相关的图片,则不仅能对原有的音乐播放功能进行极大的扩展,而且也提高了信息表现的丰富程度,对用户而言也是一种更好的视听体验。
发明内容
本申请提供了在播放音乐时呈现图片的方法和装置。
一方面,本申请提供了一种在播放音乐时呈现图片的方法,所述方法包括:获取与音乐相关联的故事情节;根据所述故事情节获取一张或者一张以上的图片;在播放所述音乐的同时呈现所述一张或者一张以上的图片。
在某些实施方式中,所述获取与音乐相关联的故事情节,包括:获取所述音乐的元信息;根据所述元信息,获取与所述音乐相关联的故事情节。
在某些实施方式中,所述获取与音乐相关联的故事情节,包括:获取所述音乐的音频指纹信息;根据所述音频指纹信息,获取与所述音乐相关联的故事情节。
在某些实施方式中,所述根据所述故事情节获取一张或者一张以上的图片,包括:从所述故事情节中提取关键词;根据所述关键词搜索得到一张或者一张以上的图片。
在某些实施方式中,包括:根据所述关键词,利用图片搜索引擎获取至少一张候选图片;根据预定评分参数对所述至少一张候选图片进行评分;根据评分的结果而选取一张或者一张以上的图片作为搜索结果返回。
在某些实施方式中,所述预定评分参数是相似度参数,则根据预定评分参数对所述至少一张候选图片进行评分包括:对所述至少一张候选图片中的每一张候选图片进行语义识别,从而得到该候选图片的语义信息;将所述语义信息与所述关键词进行相似度比较,从而得到相似度值作为对该候选图片的评分。
在某些实施方式中,所述根据所述故事情节获取一张或者一张以上的图片,包括:将所述故事情节分解成一个或者一个以上的句子,获取与每一个所述句子相关联的图片。
在某些实施方式中,在所述将所述故事情节分解成一个或者一个以上的句子之后,还包括:对所述一个或者一个以上的句子进行相似性计算,以便生成至少一个段落,其中每一个所述段落包括一个或者一个以上的句子。
在某些实施方式中,在播放所述音乐的同时呈现所述一张或者一张以上的图片之前,还包括:将所述音乐分割成至少一个音乐片段,并且将所述至少一个段落中的每一个段落都与音乐片段相关联。
在某些实施方式中,所述在播放所述音乐的同时呈现所述一张或者一张以上的图片,包括:依次播放所述至少一个音乐片段中的各个音乐片段;在播放所述至少一个音乐片段中的任一音乐片段的同时,将与所述任一音乐片段相关联的段落中所包括的各个句子所关联的各个图片进行依次呈现。
在某些实施方式中,在所述获取与音乐相关联的故事情节之后,还包括:对所述故事情节进行情感识别,获取与所述故事情节相关联的情感信息。
在某些实施方式中,在所述根据所述故事情节获取一张或者一张以上的图片之后,还包括:根据所述情感信息对所述一张或者一张以上的图片进行渲染从而生成经渲染的一张或者一张以上的图片。
在某些实施方式中,所述在播放所述音乐的同时呈现所述一张或者一张以上的图片,包括:在播放所述音乐的同时呈现经渲染的一张或者一张以上的图片。
在某些实施方式中,在所述获取与音乐相关联的故事情节之后,还包括:对所述故事情节进行分析,根据所述故事情节中的时间信息或者空间信息或者人物信息将所述故事情节分割成至少一个段落。
在某些实施方式中,所述方法还包括:获取与每一个所述段落相关联的图片。
在某些实施方式中,在播放所述音乐的同时呈现所述一张或者一张以上的图片之前,还包括:将所述音乐分割成至少一个音乐片段,并且将所述至少一个段落中的每一个段落都与音乐片段相关联。
在某些实施方式中,所述在播放所述音乐的同时呈现所述一张或者一张以上的图片,包括:播放所述至少一个音乐片段中的指定音乐片段,同时呈现与所述指定音乐片段相关联的段落所关联的图片。
第二方面,本申请提供了一种在播放音乐时呈现图片的装置所述装置包括:故事情节获取模块,用于获取与音乐相关联的故事情节;图片获取模块,用于根据所述故事情节获取一张或者一张以上的图片;音乐和图片呈现模块,用于在播放所述音乐的同时呈现所述一张或者一张以上的图片。
在某些实施方式中,所述故事情节获取模块包括:获取所述音乐的元信息;根据所述元信息,获取与所述音乐相关联的故事情节。
在某些实施方式中,所述故事情节获取模块包括:获取所述音乐的音频指纹信息;根据所述音频指纹信息,获取与所述音乐相关联的故事情节。
在某些实施方式中,所述图片获取模块包括:从所述故事情节中提取关键词;根据所述关键词搜索得到一张或者一张以上的图片。
在某些实施方式中,所述图片获取模块进一步包括:根据所述关键词,利用图片搜索引擎获取至少一张候选图片;根据预定评分参数对所述至少一张候选图片进行评分;根据评分的结果而选取一张或者一张以上的图片作为搜索结果返回。
在某些实施方式中,所述预定评分参数是相似度参数,则所述图片获取模块进一步包括:对所述至少一张候选图片中的每一张候选图片进行语义识别,从而得到该候选图片的语义信息;将所述语义信息与所述关键词进行相似度比较,从而得到相似度值作为对该候选图片的评分。
在某些实施方式中,所述图片获取模块进一步包括:将所述故事情节分解成一个或者一个以上的句子,获取与每一个所述句子相关联的图片。
在某些实施方式中,所述图片获取模块进一步包括:对所述一个或者一个以上的句子进行相似性计算,以便生成至少一个段落,其中每一个所述段落包括一个或者一个以上的句子。
在某些实施方式中,所述装置还包括:音乐处理模块,用于将所述音乐分割成至少一个音乐片段,并且将所述至少一个段落中的每一个段落都与音乐片段相关联。
在某些实施方式中,所述音乐和图片呈现模块包括:依次播放所述至少一个音乐片段中的各个音乐片段;在播放所述至少一个音乐片段中的任一音乐片段的同时,将与所述任一音乐片段相关联的段落中所包括的各个句子所关联的各个图片进行依次呈现。
在某些实施方式中,所述装置还包括:情感识别模块,用于对所述故事情节进行情感识别,获取与所述故事情节相关联的情感信息。
在某些实施方式中,所述装置还包括:渲染模块,用于根据所述情感信息对所述一张或者一张以上的图片进行渲染从而生成经渲染的一张或者一张以上的图片。
在某些实施方式中,所述音乐和图片呈现模块包括:在播放所述音乐的同时呈现经渲染的一张或者一张以上的图片。
在某些实施方式中,所述装置还包括:分析模块,用于对所述故事情节进行分析,提取所述故事情节的时间特征信息或者空间特征信息。
在某些实施方式中,所述图片获取模块包括:根据所述时间特征信息或者空间特征信息来获取一张或者一张以上的图片。
在某些实施方式中,所述装置还包括:故事情节处理模块,用于对所述故事情节获取模块获取的所述故事情节进行分析,根据所述故事情节中的时间信息或者空间信息或者人物信息将所述故事情节分割成至少一个段落。
在某些实施方式中,所述图片获取模块还包括:获取与每一个所述段落相关联的图片。
在某些实施方式中,所述装置还包括:音乐处理模块,用于将所述音乐分割成至少一个音乐片段,并且将所述至少一个段落中的每一个段落都与音乐片段相关联。
在某些实施方式中,所述音乐和图片呈现模块包括:播放所述至少一个音乐片段中的指定音乐片段,同时呈现与所述指定音乐片段相关联的段落所关联的图片。
本申请提供的在播放音乐时呈现图片的方法和装置,通过首先获取与音乐相关联的故事情节,随后根据所述故事情节获取一张或者一张以上的图片,由此在播放所述音乐的同时呈现所述一张或者一张以上的图片,实现了音乐与图片的同时播放,从而扩展了音乐播放功能,也提高了信息表现的丰富程度。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请在播放音乐时呈现图片的方法的一个实施例的流程图;
图2是图1所示实施例的一个应用场景的示意图;
图3是本申请在播放音乐时呈现图片的方法的另一个实施例的流程图;
图4是本申请在播放音乐时呈现图片的方法的再一个实施例的流程图;
图5是本申请在播放音乐时呈现图片的方法的又一个实施例的流程图;
图6是本申请在播放音乐时呈现图片的方法的又一个实施例的流程图
图7是本申请在播放音乐时呈现图片的装置的一个实施例的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参考图1,其示出了在播放音乐时呈现图片的方法的一个实施例的流程100。本实施例主要以该方法应用于包含有显示屏的终端中来举例说明,该终端可以包括智能手机、平板电脑、电子书阅读器、MP3播放器(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面3)播放器、电视机、膝上型便携计算机和台式计算机等等。所述在播放音乐时呈现图片的方法,包括以下步骤:
步骤101,获取与音乐相关联的故事情节。
在本实施例中,根据正在上述终端上播放或者待要在上述终端上播放的音乐,可以获取与所述音乐相关联的故事情节。其中,所述音乐可以是预先存储在所述终端本地的音乐文件(例如MP3格式、WMA(WindowsMediaAudio)格式或者ASF(AdvancedStreamingFormat)格式的音乐文件),或者是存储在其他非本地位置而通过有线连接方式或者无线连接方式远程地获取的音乐文件。这里,所使用的无线连接方式包括但不限于3G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultrawideband)连接或者其它未来将开发的无线连接方式。
获取上述音乐文件之后,可以对其进行分析,以便得到所述音乐的元信息或者音频指纹信息。其中,所述元信息包括但不限于以下中的一项或多项:音乐的标题,曲作者,演奏者,音乐类型,演奏时长,所属专辑,歌词作者,歌词。在一些情况下,歌词信息还可以包括了每一句歌词的起止时间相关信息,例如LRC格式的歌词文件就是如此。而所述音频指纹信息是从所述音乐本身的音频信号中提取的一段数字摘要,可以用于所述音乐的识别和检索。根据所述音频指纹信息,可以从音频指纹数据库(例如,同时存储了音乐的音频指纹信息和元信息的数据库)中检索获得与所述音频指纹信息相关联的元信息。
根据上述音乐的元信息,可以生成与所述音乐相关联的故事情节。其中,所述故事情节是对所述音乐的故事性描述,其可以是视频形式的,例如与所述音乐相关联的一段视频,诸如MV(音乐视频,MusicVideo);其也可以是图片形式的,例如描述音乐情节的一张或多张图片;还可以是文字形式的。所述文字形式的对音乐的描述可以是所述音乐的歌词;或者可以是以所述音乐的歌词为基础对所述音乐的扩展性文字描述,例如,既包括了歌词也包括了音乐的主题、关键词等信息的文字描述;或者在所述音乐没有歌词的情况下,还可以是对所述音乐的介绍性文字描述。例如,中国著名的交响乐《梁祝》并无歌词,对其的介绍性文字描述(即故事情节)如下:“1)引子:春天的江南,风和日丽、鸟语花香、百花盛开。2)结缘:祝英台女扮男装去上学,在学堂遇见了梁山伯,两人一见如故,彼此情投意合,十分欣赏对方。3)草桥结拜:后来,两人在草桥结拜为兄弟,更是时时刻刻形影不离。4)同窗:两人同窗读书三载,一同读书、一同玩耍,度过了一段愉快的时光。5)分离:三年之后,学年期满,两人都必须回到自己的家乡,两人在长亭恋恋不舍的分别了。6)抗婚:祝英台回到家之后,父亲逼迫她嫁给官僚马府少爷,祝英台抗婚不嫁,和封建礼教做了顽强的斗争。7)楼台会:正在此时,梁山伯来祝家探望,得知了祝英台其实是女子,也知道了祝英台抗婚的事情,两人相约于楼台,互诉衷肠,相互倾诉了爱慕之情。8)哭诉:梁山伯回家之后,不久病故,祝英台得知后悲痛万分,她来到梁山伯的坟前,时而呼天嚎地,时而低回婉转,泣不成声,并纵身投坟。9)化蝶:在坟前,祝英台与梁山伯两人双双化成蝴蝶,在鲜花丛中翩翩起舞,诉说他们忠贞不渝的爱情”。
对于有歌词的音乐,文字形式的故事情节的生成可以如下进行:首先,直接从所述音乐的元信息中获取所述音乐的歌词,或者在所述元信息中不包括歌词的情况下,根据所述元信息,利用搜索引擎(例如常见的谷歌搜索引擎或者百度搜索引擎)搜索得到所述音乐的歌词;接着,对所述歌词进行分析和处理,得到所述音乐的故事情节。
而对于没有歌词的音乐,文字形式的故事情节的生成可以如下进行:根据所述元信息,利用搜索引擎,搜索得到所述音乐的介绍性文字描述。通过搜索引擎得到的介绍性文字描述往往有多篇(例如,用于介绍所述音乐的多张网页),这时,还可以通过预定义的筛选规则对多篇介绍性文字描述进行筛选,以得到所期望的介绍性文字描述。例如,所述筛选规则可以是排名规则,在这种情况下,可以将所述多篇介绍性文字描述中排名最靠前的那篇选择为所述音乐的介绍性文字描述;再例如,所述筛选规则还可以是重复率规则,在这种情况下,可以首先利用多个搜索引擎搜索得到所述音乐的多篇介绍性文字描述,接着将在不同搜索引擎的搜索结果中重复出现次数最多的那篇选择为所述音乐的介绍性文字描述。
步骤102,根据上述故事情节获取一张或者一张以上的图片。
在本实施例中,根据获取自步骤101的故事情节,可以进一步获取图片。在上述故事情节是图片形式的情况下,则可以直接将相应的图片返回供后继处理步骤使用。在上述故事情节是视频形式的情况下,可以对相应的视频进行图片截取。例如可以以1秒的时间间隔进行图片截取从而得到一张或者一张以上的图片,再将所述一张或者一张以上的图片作为根据故事情节获取的图片。在上述故事情节是文字形式的情况下,还可以根据相应的文字在本地进行图片搜索或者借助于互联网进行在线图片搜索,并将搜索得到的图片作为根据故事情节获取的图片。
步骤103,在播放上述音乐的同时呈现所述一张或者一张以上的图片。
在本实施例中,借助于上述步骤101得到了与正在上述终端上播放或者待要在上述终端上播放的音乐相关联的故事情节,而借助于上述步骤102又得到了与所述故事情节相关联的一张或者一张以上的图片,结果,所述音乐最终对应上了一张或者一张以上的图片。由此,可以在播放所述音乐的同时,在所述终端中逐一播放所述一张或者一张以上的图片。
为了实现音乐与图片同步的播放效果,即音乐和与其对应的图片在同一时间内播放完,可以将各个图片的呈现时长的总和设置得等于所述音乐的播放时长。
在一个可选的实现方式中,除了在上述终端上与音乐同时地播放上述一张或者一张以上的图片,还可以在至少一个其他终端上同时地播放这些图片。多个终端之间的数据(例如音频数据和/或视频数据)同步可以通过网络通信协议来实现。
图2给出了本实施例的一个应用场景。如图2所示,终端201为具有触摸屏幕的智能手机,音乐播放界面可以显示在所述智能手机上。用户在用智能手机听音乐的同时,如果还选择了“显示故事情节”这一功能,例如点击了图2中所示的“显示故事情节”按钮202。之后,借助于网络与所述终端201相连接的后台服务器203(例如,云服务器),可以进行如下操作:首先,视音乐文件的位置情况而从智能手机本地的所述音乐文件或者从音乐服务器(例如托管了在线音乐网站的服务器)上的所述音乐文件得到所述音乐的元信息;其次,根据所述元信息,可以生成与所述音乐相关联的故事情节;接着,根据所述故事情节检索得到一张或者一张以上的图片;最后,将这些图片传送到所述终端201中以便实现所述音乐和图片的同时播放。
本发明的上述实施例提供的方法通过获取与音乐相关联的故事情节,而后根据所述故事情节获取图片,最后在播放所述音乐的同时呈现所述图片,从而实现了对原有音乐播放功能的扩展。
进一步参考图3,其示出了在播放音乐时呈现图片的方法的另一个实施例的流程300。该在播放音乐时呈现图片的方法的流程300,包括以下步骤:
步骤301,获取与音乐相关联的故事情节。
在本实施例中,根据正在上述终端上播放或者待要在上述终端上播放的音乐,可以获取与所述音乐相关联的故事情节。其中,所述音乐可以是预先存储在所述终端本地的音乐文件(例如MP3格式、WMA(WindowsMediaAudio)格式或者ASF(AdvancedStreamingFormat)格式的音乐文件),或者是存储在其他非本地位置而通过有线连接方式或者无线连接方式远程地获取的音乐文件。
获取上述音乐文件之后,可以对其进行分析,以便得到所述音乐的元信息或者音频指纹信息。其中,所述元信息包括但不限于以下中的一项或多项:音乐的标题,曲作者,演奏者,音乐类型,演奏时长,所属专辑,歌词作者,歌词。而所述音频指纹信息是从所述音乐本身的音频信号中提取的一段数字摘要,可以用于所述音乐的识别和检索。根据所述音频指纹信息,可以从音频指纹数据库(例如,同时存储了音乐的音频指纹信息和元信息的数据库)中检索获得与所述音频指纹信息相关联的元信息。
根据上述音乐的元信息,可以生成与所述音乐相关联的故事情节。其中,所述故事情节是对所述音乐的故事性描述,其可以是视频形式的,也可以是图片形式的,还可以是文字形式的。所述文字形式的对音乐的描述可以是所述音乐的歌词;或者可以是以所述音乐的歌词为基础对所述音乐的扩展性文字描述,例如,既包括了歌词也包括了音乐的主题、关键词等信息的文字描述;或者在所述音乐没有歌词的情况下,还可以是对所述音乐的介绍性文字描述。
步骤302,从上述故事情节中提取关键词。
在本实施例中,在上述故事情节是文字形式的情况下,可以对这样的文字描述进行文字信息处理,从而得到特定的词作为关键词。所述特定的词包括但不限于:所述文字描述中的名词,动词;所述文字描述中出现频率最多的词。进行文字信息处理的技术作为目前广泛研究和应用的公知技术,在此不再赘述。
步骤303,根据上述关键词搜索得到一张或者一张以上的图片。
在本实施例中,根据所述步骤302中得到的关键词,可以进行搜索操作以便得到与所述关键词相关联的图片。例如,在上述终端本地存在图片数据库(例如,保存了图片、图片标题和/或图片描述信息的数据库)的情况下,所述搜索操作可以如下进行:利用所述关键词在所述图片数据库中进行搜索;将图片标题或者图片描述信息与所述关键词相匹配的图片作为搜索结果返回。然而,在上述终端本地并不存在图片数据库的情况下,所述搜索操作还可以如下进行:借助于互联网,将所述关键词输入图片搜索引擎,例如百度图片搜索引擎或者谷歌图片搜索引擎;将通过所述图片搜索引擎得到的图片作为搜索结果返回。
在此,需要注意的是,经过搜索操作得到的、与上述关键词相关联的图片可以是一张,也可以是多张,例如,通过图片搜索引擎返回的搜索结果可能是至少一张候选图片。为了从所述至少一张候选图片中选取最合适的一张或一些张图片作为与上述故事情节相关联的图片,可以进一步地执行下述筛选步骤。
步骤304,根据预定评分参数对上述至少一张候选图片进行评分,根据评分的结果而选取一张或者一张以上的图片作为关键词搜索结果返回。
在本实施例中,对于上述至少一张候选图片,可以首先根据预定评分参数对所述多张候选图片中的每一张候选图片都进行评分;其后,选择评分靠前的一张或者一张以上的候选图片作为与上述故事情节相关联的图片返回供后继处理步骤使用。
所述预定评分参数可以是重复度参数,在这种情况下,可以把所述多张候选图片中的每一张候选图片在不同搜索引擎的搜索结果中出现的次数作为对该候选图片的评分,例如,如果该候选图片在两个搜索引擎的搜索结果中出现,则其评分为2。
进一步地,所述预定评分参数可以是相似度参数,则根据预定评分参数对所述多张候选图片中的每一张候选图片进行评分包括:对每一张候选图片进行语义识别,从而得到该候选图片的语义信息;将所述语义信息与所述关键词进行相似度比较,从而得到相似度值作为对该候选图片的评分。对图像进行语义识别和进行相似度比较的技术作为目前广泛研究和应用的公知技术,在此不再赘述。
步骤305,在播放上述音乐的同时呈现一张或者一张以上的图片。
在本实施例中,借助于上述步骤304筛选得到了与上述故事情节相关联的一张或者一张以上的图片。由此,可以在播放所述音乐的同时,在所述终端中逐一播放这些图片。
从图3中可以看出,与图1对应的实施例不同的是,本实施例中的在播放音乐时呈现图片的方法的另一个实施例的流程300多出了对搜索结果图片进行筛选的步骤。通过增加的这样的步骤,本实施例描述的方案有助于实现图片与故事情节更准确的匹配,从而也有助于在播放所述音乐的同时更加准确地呈现与所述音乐对应的图片,最终实现了对原有音乐播放功能的更好的扩展。
进一步参考图4,其示出了在播放音乐时呈现图片的方法的再一个实施例的流程400。该在播放音乐时呈现图片的方法的流程400,包括以下步骤:
步骤401,获取与音乐相关联的故事情节。
在本实施例中,根据正在上述终端上播放或者待要在上述终端上播放的音乐,可以获取与所述音乐相关联的故事情节。其中,所述音乐可以是预先存储在所述终端本地的音乐文件(例如MP3格式、WMA(WindowsMediaAudio)格式或者ASF(AdvancedStreamingFormat)格式的音乐文件),或者是存储在其他非本地位置而通过有线连接方式或者无线连接方式远程地获取的音乐文件。
获取上述音乐文件之后,可以对其进行分析,以便得到所述音乐的元信息或者音频指纹信息。根据所述音频指纹信息,也可以从音频指纹数据库(例如,同时存储了音乐的音频指纹信息和元信息的数据库)中检索获得与所述音频指纹信息相关联的元信息。
根据上述音乐的元信息,可以生成与所述音乐相关联的故事情节,其中,所述故事情节是对所述音乐的故事性描述。
步骤402,将上述故事情节分解成一个或者一个以上的句子。
在本实施例中,在故事情节是文字形式的情况下,对于由上述步骤401得到的故事情节,可以根据标点符号进行句子分割,以便得到一个或者一个以上的句子。其中,用于句子分割的标点符号通常是句号、问号和叹号,当然,根据实际需要(例如句子分割粒度的需要),也可以选择逗号或者其他标点符号用于句子分割。
例如,意大利名曲《Timetosaygoodbye》中前4句的歌词如下:当我独自一人的时候,我梦见地平线,我失望的无法言语,在没有阳光也没有光线的房间里。根据逗号对上述歌词进行句子分割,将得到如下4个句子:“当我独自一人的时候”,“我梦见地平线”,“我失望的无法言语”,“在没有阳光也没有光线的房间里”。
步骤403,对上述一个或者一个以上的句子进行相似性计算,以便生成至少一个段落,其中每一个所述段落包括一个或者一个以上的句子。
在本实施例中,针对上述步骤402所得到的全部句子,可以通过公知的句子相似性计算方法进行句子的相似性度量。对于目标句子和待与所述目标句子进行相似性比较的当前句子而言,对所述当前句子进行句子相似性计算所得到的值越高,则表明所述当前句子与所述目标句子的相似性越高。
目前,公知的句子相似性计算方法大致可分为5类:字面匹配方法,词频-逆向文挡频率(TermFrequency-inverseDocumentFrequency,TF-IDF)向量方法,概率方法,句子结构方法和语义扩展方法。字面匹配方法依据2个句子中所蕴含的相同词个数计算句子的相似度,典型方法例如Jaccard相似系数(JaccardSimilarityCoefficient)方法。TF-IDF向量方法将句子表示成TF-IDF向量,将两向量的余弦值作为相似度。概率方法通过引入语言模型框架,利用概率的方法得出2个句子的相似度。在句子结构方法中,按句子模板的匹配方式,把句子分成不同的组成部分,按句子的结构组成分别计算相似性。
全部句子之间的相似性度量可以如下进行:对于除了第一个句子之外的其他句子,依次计算当前句子和前一句子之间的相似性,得到相似性度量值,其中,第一个句子不需要计算(其相似性度量值可以默认为1);由此,全部句子的相似性度量值形成了一个相似性度量值序列。
对于上述相似性度量值序列,可以设定一个阈值,然后将序列中的各个数值依次地与所述阈值进行比较。如果所述相似性度量值序列中的一个数值高于所述阈值,则认为该数值对应的句子和前一句子之间相似性比较高,由此判断该句子和前一句子处于同一段落;而如果所述数值低于所述阈值,则认为该数值对应的句子和前一句子之间相似性比较低,由此判断该句子和前一句子不处于同一段落,因此,该句子将成为新的段落的第一个句子。借助于上述比较方法,将会得到至少一个段落,其中每一个所述段落都包括了一个或者一个以上的句子。
所设定的上述阈值可以是终端用户或者后台服务器的管理员手动设置的一个值,也可以是预设的一个缺省值。所述缺省值可以根据以下统计方法得到:首先,选择一定数量的音乐,音乐的类型要尽可能多元化,按照步骤401的方法得到每首音乐的故事情节,每个故事情节的段落数通过人工的方法来标定;其次,按照步骤402和步骤403中的方法得到任一故事情节的全部句子的相似性度量值序列;接着,设所述任一故事情节的段落数为X(X为自然数),把所述相似性度量值序列中的相似性度量值按从小到大的顺利排序,排在第X位的值即为该任一故事情节的阈值;最后,对所有故事情节的阈值求一个平均值,即为最终所需的阈值缺省值。
步骤404,将上述音乐分割成至少一个音乐片段,并且将所述至少一个段落中的每一个段落都与音乐片段相关联。
在本实施例中,可以首先对上述音乐进行分割,获得有音乐意义的多个音乐片段。这些有音乐意义的多个音乐片段对于常见的流行音乐而言,可以是前奏片段、主歌片段、副歌片段和间奏片段等;而对于交响乐而言,可以是奏鸣曲式片段、复三部曲式或变奏曲片段、小步舞曲或者谐谑曲片段和奏鸣曲或回旋曲式片段等。
对所述音乐进行的分割,可以依据所述音乐的元信息来进行,在这种情况下,借助于所述元信息所包括的音乐分段信息(例如,流行音乐的前奏、主歌、副歌和间奏的起止时间信息,或者交响乐的各个乐章的起止时间信息),可以将所述音乐分割成有音乐意义的至少一个音乐片段。此外,对所述音乐的分割,还可以采用下属方法:按一定的时间间隔(例如10毫秒)从所述音乐中提取帧样本;接着分析和计算所述帧样本的特征,例如,时域频域特征、基音频率特征、MFCC(Mel频率倒谱系数的缩写)特征等;最后利用分类器(例如支持向量机)来判断该帧样本属于哪一类音乐片段,例如,前奏片段、主歌片段、副歌片段或间奏片段等。根据音乐样本的特征对该音乐样本进行分类的技术作为目前广泛研究和应用的公知技术,在此不再赘述。
获得有音乐意义的多个音乐片段之后,将进一步地对所述音乐的元信息进行分析,在所述元信息中的歌词信息(例如LRC格式的歌词信息)包括了每一句歌词的起止时间信息的情况下,可以通过以下操作来将上述至少一个段落中的每一个段落都与音乐片段相关联:对于任一段落,由于该段落中的句子是与歌词相对应的,则可以根据歌词的起止时间判断与所述歌词对应的句子将要关联到哪一个音乐片段,由此可以随后判断出所述段落将要关联到的音乐片段。
当然,还可以采用其他方式将段落与音乐片段相关联。例如,对于常见的流行音乐而言,可以如下建立段落和音乐片段的关联关系:首先,由于流行音乐的前奏片段和间奏片段不需要建立和段落的关联关系,因此可以首先排除掉;其次,将所述流行音乐的故事情节所包括的段落中的最后一个与所述流行音乐的副歌片段相关联;接着,设所述流行音乐的故事情节一共包括了M个段落(M为自然数),则除去与副歌片段所关联的段落,剩下的M-1个段落将都会对应到所述流行音乐的主歌片段。
可选地,还可以对上述M-1个段落所对应到的上述主歌片段进行进一步地细分,以便实现段落与主歌片段的子片段的一一对应。例如,可以按一定的时间间隔(例如10毫秒)从所述主歌片段中提取帧样本,生成帧样本的有序(即帧样本在所述主歌片段中出现的先后顺序)集合;接着,对于所述有序集合中除了第一个帧样本之外的其他帧样本,依次计算当前帧样本和前一帧样本之间的相似性,得到相似性度量值,其中,第一个帧样本不需要计算(其相似性度量值可以默认为1),由此,全部帧样本的相似性度量值形成了一个相似性度量值序列;将所述相似性度量值序列中的各个相似性度量值按从小到大的顺利排序,排在第M-1位的值作为阈值;通过将各个帧样本的相似性度量值与所述阈值的大小进行比较,可以将帧样本的有序集合分成M-1个部分,即将主歌片段分成M-1个子片段,每个子片段对应一个段落。
步骤405,依次播放上述至少一个音乐片段中的各个音乐片段;在播放所述至少一个音乐片段中的任一音乐片段的同时,将与所述任一音乐片段相关联的段落中所包括的各个句子所关联的各个图片进行依次呈现。
在本实施例中,经过步骤404,上述音乐被分割成了至少一个音乐片段。所述至少一个音乐片段中的一些片段(例如前奏片段和间奏片段)并不与段落相关联,这时,可以使这样的一些片段与缺省的图片相关联或者不与图片相关联。而对于所述至少一个音乐片段中的其他音乐片段,其关联到的段落的各个句子所关联的各个图片形成了一个图片序列。而完整的所述音乐最终则对应了一个大的图片序列,即各个段落所对应的各个图片序列之和。结果,在播放所述至少一个音乐片段中的任一音乐片段的同时,可以将与所述任一音乐片段相关联的段落中所包括的各个句子所关联的各个图片进行依次呈现。
从图4中可以看出,与图1对应的实施例不同的是,本实施例中的在播放音乐时呈现图片的方法的再一个实施例的流程400多出了对句子进行相似性计算以便生成段落的步骤,和将音乐分割成音乐片段并且将段落与音乐片段相关联的步骤。通过增加的所述步骤,本实施例描述的方案有助于实现对音乐更小粒度的分割,这有助于在播放所述音乐的同时更加准确地呈现与所述音乐对应的图片,从而实现了对原有音乐播放功能的更好的扩展。
进一步参考图5,其示出了在播放音乐时呈现图片的方法的又一个实施例的流程500。该在播放音乐时呈现图片的方法的流程500,包括以下步骤:
步骤501,获取与音乐相关联的故事情节。
在本实施例中,根据正在上述终端上播放或者待要在上述终端上播放的音乐,可以获取与所述音乐相关联的故事情节。其中,所述音乐可以是预先存储在所述终端本地的音乐文件(例如MP3格式、WMA(WindowsMediaAudio)格式或者ASF(AdvancedStreamingFormat)格式的音乐文件),或者是存储在其他非本地位置而通过有线连接方式或者无线连接方式远程地获取的音乐文件。
获取上述音乐文件之后,可以对其进行分析,以便得到所述音乐的元信息或者音频指纹信息。根据所述音频指纹信息,也可以从音频指纹数据库(例如,同时存储了音乐的音频指纹信息和元信息的数据库)中检索获得与所述音频指纹信息相关联的元信息。
根据上述音乐的元信息,可以生成与所述音乐相关联的故事情节,其中,所述故事情节是对所述音乐的故事性描述。
步骤502,对上述故事情节进行情感识别,获取与所述故事情节相关联的情感信息。
在本实施例中,在步骤501中得到的故事情节是文字形式的情况下,可以通过以下操作得到与所述故事情节相关联的情感信息:对文字形式的故事情节进行文字信息处理,从而得到特定的词作为关键词,其中,所述特定的词包括但不限于:所述文字描述中的名词,动词,所述文字描述中出现频率最多的词;之后,所述关键词对应的情感信息可以通过词语情感数据库来得到;最后,通过对所述故事情节的所有关键词的情感信息进行汇总分析可以得到所述故事情节的情感信息。
上述词语情感数据库的一种实现方式如下:首先收集一定数量的词语,对这些词语的情感信息进行人工标注,将词语和对应的标注的情感信息成对地保存到数据库中,该数据库即可作为词语情感数据库。在使用时,将上述故事情节的关键词作为检索关键词输入到所述词语情感数据库,即可检索到与所述关键词对应的情感信息,如果在所述词语情感数据库不能检索到与所述关键词对应的情感信息,则可以人工添加情感信息到所述词语情感数据库中。
此外,在步骤501中得到的故事情节是图片形式的情况下,可以通过以下操作得到与所述故事情节相关联的情感信息:对所述图片进行语义识别,从而得到该图片的语义信息;对所述语义信息进行文字信息处理,从而得到特定的词作为关键词;之后,所述关键词对应的情感信息可以通过词语情感数据库来得到;最后,通过对所述故事情节的所有关键词的情感信息进行汇总分析可以得到所述故事情节的情感信息。
步骤503,根据上述故事情节获取一张或者一张以上的图片。
在本实施例中,根据获取自步骤501的故事情节,可以进一步获取图片。在上述故事情节是图片形式的情况下,则可以直接将相应的图片返回供后继处理步骤使用。在上述故事情节是视频形式的情况下,可以对相应的视频进行图片截取。例如可以以1秒的时间间隔进行图片截取从而得到一张或者一张以上的图片,再将所述一张或者一张以上的图片作为根据故事情节获取的图片。在上述故事情节是文字形式的情况下,还可以根据相应的文字在本地进行图片搜索或者借助于互联网进行在线图片搜索,并将搜索得到的图片作为根据故事情节获取的图片。
步骤504,根据上述情感信息对上述一张或者一张以上的图片进行渲染从而生成经渲染的一张或者一张以上的图片。
在本实施例中,根据步骤502得到与故事情节相关联的情感信息之后,可以根据该情感信息所表达的情绪对步骤503中获取的图片进行渲染。例如:如果所述故事情节所表达的情绪是负面的,则可以把上述一张或者一张以上的图片的色调渲染得低沉一些,甚至可以渲染为黑白色;如果所述故事情节所表达的情绪是正面的,则可以把所述一张或者一张以上的图片的色调渲染得亮一些,甚至可以渲染成更鲜艳的颜色。最终,得到了与所述故事情节相关联的经渲染的一张或者一张以上的图片。
步骤505,在播放上述音乐的同时呈现经渲染的一张或者一张以上的图片。
在本实施例中,借助于上述步骤501得到了与正在上述终端上播放或者待要在上述终端上播放的音乐相关联的故事情节,而借助于上述步骤504又得到了与所述故事情节相关联的经渲染的一张或者一张以上的图片。由此,可以在播放所述音乐的同时,在所述终端中逐一播放经渲染的一张或者一张以上的图片。
从图5中可以看出,与图1对应的实施例不同的是,本实施例中的在播放音乐时呈现图片的方法的又一个实施例的流程500多出了对故事情节进行情感识别的步骤,和根据情感信息对图片进行渲染的步骤。通过增加的所述步骤,本实施例描述的方案有助于实现对图片更符合故事情节的渲染效果。
进一步参考图6,其示出了在播放音乐时呈现图片的方法的又一个实施例的流程600。该在播放音乐时呈现图片的方法的流程600,包括以下步骤:
步骤601,获取与音乐相关联的故事情节。
在本实施例中,根据正在上述终端上播放或者待要在上述终端上播放的音乐,可以获取与所述音乐相关联的故事情节。其中,所述音乐可以是预先存储在所述终端本地的音乐文件(例如MP3格式、WMA(WindowsMediaAudio)格式或者ASF(AdvancedStreamingFormat)格式的音乐文件),或者是存储在其他非本地位置而通过有线连接方式或者无线连接方式远程地获取的音乐文件。
获取上述音乐文件之后,可以对其进行分析,以便得到所述音乐的元信息或者音频指纹信息。根据所述音频指纹信息,也可以从音频指纹数据库(例如,同时存储了音乐的音频指纹信息和元信息的数据库)中检索获得与所述音频指纹信息相关联的元信息。
根据上述音乐的元信息,可以生成与所述音乐相关联的故事情节,其中,所述故事情节是对所述音乐的故事性描述。
步骤602,对上述故事情节进行分析,根据所述故事情节中的时间信息或者空间信息或者人物信息将所述故事情节分割成至少一个段落。
在本实施例中,在故事情节是文字形式的情况下,所述故事情节通常可以视为由若干基本段落构成,例如,常见的故事情节一般包括开端、发展、高潮、结局这四个基本段落。
由此,根据时间信息将所述故事情节分割成至少一个段落可以如下进行:首先,从故事情节的文字描述中提取时间信息,所述时间信息可以体现为与时间相关的关键词,常用的关键词有:早上,中午,晚上,春天,夏天,秋天,冬天等等;其次,根据提取的关键词所处的句子,对所述故事情节进行分割从而生成多个段落,例如,如果“秋天”这个时间关键词首次出现在某个句子里,则将该句子和前一句子分为不同的段落;最后,将所生成的多个段落与故事情节的开端、发展、高潮、结局这四个基本段落关联起来。将所生成的多个段落与基本段落关联的实现方式可以如下操作:如果对故事情节进行分割生成了4个段落,则这4个段落就对应了开端、发展、高潮、结局这4个基本段落;2)如果故事情节有3个段落,则第1个段落对应于开端,第2个段落对应于结局,第2个段落对应于发展和高潮;3)如果故事情节有2个段落,则第1个段落对应于开端和发展,第2个段落对应于高潮和结局;4)如果分割生成的段落数大于4,则第1个段落对应于开端,最后1个段落对应于结局,中间的段落均匀分为2部分,第1部分对应于发展,第2部分对应于高潮。
而根据空间信息将所述故事情节分割成至少一个段落可以如下进行:首先,从故事情节的文字描述中提取空间信息,所述空间信息可以体现为与空间相关的关键词,常用的关键词有:大山,办公楼,大海,房间等等;其次,根据提取的关键词所处的句子,对所述故事情节进行分割从而生成多个段落,例如,如果“大山”这个空间关键词首次出现在某个句子里,则将该句子和前一句子分为不同的段落;最后,将所生成的多个段落与故事情节的开端、发展、高潮、结局这四个基本段落关联起来。将所生成的多个段落与基本段落关联的实现方式可以与上面所述的操作相同。
而根据人物信息将所述故事情节分割成至少一个段落可以如下进行:首先,从故事情节的文字描述中提取人物信息,所述人物信息可以体现为与人物相关的关键词,常用的关键词有:你,我,他,人物的具体名字等等;其次,根据提取的关键词所处的句子,对所述故事情节进行分割从而生成多个段落,例如,如果“他”这个人物关键词首次出现在某个句子里,则将该句子和前一句子分为不同的段落;最后,将所生成的多个段落与故事情节的开端、发展、高潮、结局这四个基本段落关联起来。将所生成的多个段落与基本段落关联的实现方式可以与上面所述的操作相同。
步骤603,获取与每一个段落相关联的图片。
在本实施例中,可以对上述段落或者上述基本段落中的文字描述进行文字信息处理,从而得到特定的词作为关键词。所述特定的词包括但不限于:所述文字描述中的名词,动词;所述文字描述中出现频率最多的词。进行文字信息处理的技术作为目前广泛研究和应用的公知技术,在此不再赘述。之后,根据得到的关键词,可以进行图片搜索操作以便得到与所述段落或所述基本段落相关联的图片。
步骤604,将音乐分割成至少一个音乐片段,并且将至少一个段落中的每一个段落都与音乐片段相关联。
在本实施例中,可以首先对上述音乐进行分割,获得有音乐意义的多个音乐片段。这些有音乐意义的多个音乐片段对于常见的流行音乐而言,可以是前奏片段、主歌片段、副歌片段和间奏片段等;而对于交响乐而言,可以是奏鸣曲式片段、复三部曲式或变奏曲片段、小步舞曲或者谐谑曲片段和奏鸣曲或回旋曲式片段等。
对于常见的流行音乐而言,可以如下建立段落和音乐片段的关联关系:首先,由于流行音乐的前奏片段和间奏片段不需要建立和段落的关联关系,因此可以首先排除掉;其次,将步骤602中对故事情节进行分割所得到的至少一个段落中的最后一个与所述流行音乐的副歌片段相关联;接着,设所述至少一个段落中一共包括了M个段落(M为自然数),则除去与副歌片段所关联的段落,剩下的M-1个段落将都会对应到所述流行音乐的主歌片段。
对于常见的流行音乐而言,还可以如下建立基本段落和音乐片段的关联关系:将开端、发展、高潮、结局这四个基本段落直接与流行音乐的前奏片段、主歌片段、副歌片段和间奏片段一一对应。
步骤605,播放至少一个音乐片段中的指定音乐片段,同时呈现与所述指定音乐片段相关联的段落所关联的图片。
在本实施例中,可以播放步骤604得到的至少一个音乐片段中的指定(例如用户指定或者随机指定)音乐片段,同时,在上述终端中逐一呈现与所述指定音乐片段相关联的段落所关联的图片。
从图6中可以看出,与图1对应的实施例不同的是,本实施例中的在播放音乐时呈现图片的方法的实施例多出了对故事情节进行分割的步骤和对音乐进行分割的步骤。通过增加的这些步骤,本实施例描述的方案有助于实现对故事情节和音乐的更小粒度的分割,这有助于在播放所述音乐片段的同时更加准确地呈现与所述音乐片段对应的图片,从而实现了对原有音乐播放功能的更好的扩展。
进一步参考图7,其示出了在播放音乐时呈现图片的装置的一个实施例的结构示意图。
如图7所示,本实施例所述的在播放音乐时呈现图片的装置700包括:故事情节获取模块701,图片获取模块702和音乐和图片呈现模块703。其中,故事情节获取模块701用于获取与音乐相关联的故事情节;图片获取模块702用于根据所述故事情节获取一张或者一张以上的图片;音乐和图片呈现模块703用于在播放所述音乐的同时呈现所述一张或者一张以上的图片。
在本实施例中,上述装置700的故事情节获取模块701根据正在播放或者待要播放的音乐,可以获取与所述音乐相关联的故事情节。其中,所述音乐可以是预先存储在所述终端本地的音乐文件(例如MP3格式、WMA(WindowsMediaAudio)格式或者ASF(AdvancedStreamingFormat)格式的音乐文件),或者是存储在其他非本地位置而通过有线连接方式或者无线连接方式远程地获取的音乐文件。这里,所使用的无线连接方式包括但不限于3G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultrawideband)连接或者其它未来将开发的无线连接方式。
上述故事情节获取模块701获取上述音乐文件之后,可以对其进行分析,以便得到所述音乐的元信息或者音频指纹信息。其中,所述元信息包括但不限于以下中的一项或多项:音乐的标题,曲作者,演奏者,音乐类型,演奏时长,所属专辑,歌词作者,歌词。而所述音频指纹信息是从所述音乐本身的音频信号中提取的一段数字摘要,可以用于所述音乐的识别和检索。根据所述音频指纹信息,可以从音频指纹数据库(例如,同时存储了音乐的音频指纹信息和元信息的数据库)中检索获得与所述音频指纹信息相关联的元信息。
根据上述音乐的元信息,上述故事情节获取模块701可以生成与所述音乐相关联的故事情节。其中,所述故事情节是对所述音乐的故事性描述,其可以是视频形式的,例如与所述音乐相关联的一段视频,诸如MV(音乐视频,MusicVideo);其也可以是图片形式的,例如描述音乐情节的一张或多张图片;还可以是文字形式的。
对于有歌词的音乐,文字形式的故事情节的生成可以如下进行:首先,上述故事情节获取模块701直接从所述音乐的元信息中获取所述音乐的歌词,或者在所述元信息中不包括歌词的情况下,根据所述元信息,利用搜索引擎(例如常见的谷歌搜索引擎或者百度搜索引擎)搜索得到所述音乐的歌词;接着,故事情节获取模块701对所述歌词进行分析和处理,得到所述音乐的故事情节。
而对于没有歌词的音乐,文字形式的故事情节的生成可以如下进行:上述故事情节获取模块701根据所述元信息,利用搜索引擎,搜索得到所述音乐的介绍性文字描述。
在本实施例中,上述装置700的图片获取模块702根据获取自故事情节获取模块701的故事情节,可以进一步获取图片。在上述故事情节是图片形式的情况下,所述图片获取模块702可以直接将相应的图片返回供后继处理步骤使用。在上述故事情节是视频形式的情况下,所述图片获取模块702可以对相应的视频进行图片截取。例如可以以1秒的时间间隔进行图片截取从而得到一张或者一张以上的图片,再将所述一张或者一张以上的图片作为根据故事情节获取的图片。在上述故事情节是文字形式的情况下,所述图片获取模块702还可以根据相应的文字在本地进行图片搜索或者借助于互联网进行在线图片搜索,并将搜索得到的图片作为根据故事情节获取的图片。
在本实施例中,借助于故事情节获取模块701得到了与音乐相关联的故事情节,而借助于图片获取模块702又得到了与所述故事情节相关联的一张或者一张以上的图片,结果,所述音乐最终对应上了一张或者一张以上的图片。由此,音乐和图片呈现模块703可以在播放所述音乐的同时,逐一播放所述一张或者一张以上的图片。
为了实现音乐与图片同步的播放效果,即音乐和与其对应的图片在同一时间内播放完,音乐和图片呈现模块703可以将各个图片的呈现时长的总和设置得等于所述音乐的播放时长。
在本实施例的一个可选的实现方式中,除了与音乐同时地播放上述一张或者一张以上的图片,音乐和图片呈现模块703还可以在至少一个其他终端上同时地播放这些图片。多个终端之间的数据(例如音频数据和/或视频数据)同步可以通过网络通信协议来实现。
在本实施例的一个可选实现方式中,所述故事情节获取模块701进一步包括:获取所述音乐的元信息;根据所述元信息,获取与所述音乐相关联的故事情节。
在本实施例的一个可选实现方式中,所述故事情节获取模块701进一步包括:获取所述音乐的音频指纹信息;根据所述音频指纹信息,获取与所述音乐相关联的故事情节。
在本实施例的一个可选实现方式中,所述图片获取模块702包括:从所述故事情节中提取关键词;根据所述关键词,利用图片搜索引擎获取至少一张候选图片;根据预定评分参数对所述至少一张候选图片进行评分;根据评分的结果而选取一张或者一张以上的图片作为搜索结果返回。可选地,所述预定评分参数是相似度参数,则所述图片获取模块702进一步包括:对所述至少一张候选图片中的每一张候选图片进行语义识别,从而得到该候选图片的语义信息;将所述语义信息与所述关键词进行相似度比较,从而得到相似度值作为对该候选图片的评分。
在本实施例的一个可选实现方式中,所述图片获取模块702进一步包括:故事情节分解模块(未示出),用于将所述故事情节分解成一个或者一个以上的句子,获取与每一个所述句子相关联的图片。之后,所述图片获取模块702对所述一个或者一个以上的句子进行相似性计算,以便生成至少一个段落,其中每一个所述段落包括一个或者一个以上的句子。所述装置700进一步包括:音乐处理模块,用于将所述音乐分割成至少一个音乐片段,并且将所述至少一个段落中的每一个段落都与音乐片段相关联。所述音乐和图片呈现模块703进一步包括:依次播放所述至少一个音乐片段中的各个音乐片段;在播放所述至少一个音乐片段中的任一音乐片段的同时,将与所述任一音乐片段相关联的段落中所包括的各个句子所关联的各个图片进行依次呈现。
在本实施例的一个可选实现方式中,所述装置700还包括情感识别模块(未示出),用于对所述故事情节获取模块701获取的故事情节进行情感识别,获取与所述故事情节相关联的情感信息。所述装置700还包括渲染模块(未示出),用于根据所述情感信息对图片获取模块702获取的一张或者一张以上的图片进行渲染从而生成经渲染的一张或者一张以上的图片。之后,所述音乐和图片呈现模块703在播放所述音乐的同时呈现经渲染的一张或者一张以上的图片。
描述于本申请实施例中的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括故事情节获取模块,图片获取模块和音乐和图片呈现模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,故事情节获取模块还可以被描述为“用于获取与音乐相关联的故事情节的模块”。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端中的计算机可读存储介质。所述计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本申请的在播放音乐时呈现图片的方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (21)

1.一种在播放音乐时呈现图片的方法,其特征在于,所述方法包括:
获取与音乐相关联的故事情节;
根据所述故事情节获取一张或者一张以上的图片;
在播放所述音乐的同时呈现所述一张或者一张以上的图片。
2.根据权利要求1所述的在播放音乐时呈现图片的方法,其特征在于,所述获取与音乐相关联的故事情节,包括:获取所述音乐的元信息;根据所述元信息,获取与所述音乐相关联的故事情节。
3.根据权利要求1所述的在播放音乐时呈现图片的方法,其特征在于,所述获取与音乐相关联的故事情节,包括:获取所述音乐的音频指纹信息;根据所述音频指纹信息,获取与所述音乐相关联的故事情节。
4.根据权利要求1-3之一所述的在播放音乐时呈现图片的方法,其特征在于,所述根据所述故事情节获取一张或者一张以上的图片,包括:从所述故事情节中提取关键词;根据所述关键词搜索得到一张或者一张以上的图片。
5.根据权利要求4所述的在播放音乐时呈现图片的方法,其特征在于,所述根据所述关键词搜索得到一张或者一张以上的图片,包括:根据所述关键词,利用图片搜索引擎获取至少一张候选图片;根据预定评分参数对所述至少一张候选图片进行评分;根据评分的结果而选取一张或者一张以上的图片作为搜索结果返回。
6.根据权利要求5所述的在播放音乐时呈现图片的方法,其特征在于,所述预定评分参数是相似度参数,则根据预定评分参数对所述至少一张候选图片进行评分包括:对所述至少一张候选图片中的每一张候选图片进行语义识别,从而得到该候选图片的语义信息;将所述语义信息与所述关键词进行相似度比较,从而得到相似度值作为对该候选图片的评分。
7.根据权利要求1-3之一所述的在播放音乐时呈现图片的方法,其特征在于,所述根据所述故事情节获取一张或者一张以上的图片,包括:将所述故事情节分解成一个或者一个以上的句子,获取与每一个所述句子相关联的图片。
8.根据权利要求7所述的在播放音乐时呈现图片的方法,其特征在于,在所述将所述故事情节分解成一个或者一个以上的句子之后,还包括:对所述一个或者一个以上的句子进行相似性计算,以便生成至少一个段落,其中每一个所述段落包括一个或者一个以上的句子。
9.根据权利要求8所述的在播放音乐时呈现图片的方法,其特征在于,在播放所述音乐的同时呈现所述一张或者一张以上的图片之前,还包括:将所述音乐分割成至少一个音乐片段,并且将所述至少一个段落中的每一个段落都与音乐片段相关联。
10.根据权利要求9所述的在播放音乐时呈现图片的方法,其特征在于,所述在播放所述音乐的同时呈现所述一张或者一张以上的图片,包括:依次播放所述至少一个音乐片段中的各个音乐片段;在播放所述至少一个音乐片段中的任一音乐片段的同时,将与所述任一音乐片段相关联的段落中所包括的各个句子所关联的各个图片进行依次呈现。
11.根据权利要求1所述的在播放音乐时呈现图片的方法,其特征在于,在所述获取与音乐相关联的故事情节之后,还包括:对所述故事情节进行情感识别,获取与所述故事情节相关联的情感信息。
12.根据权利要求11所述的在播放音乐时呈现图片的方法,其特征在于,在所述根据所述故事情节获取一张或者一张以上的图片之后,还包括:根据所述情感信息对所述一张或者一张以上的图片进行渲染从而生成经渲染的一张或者一张以上的图片。
13.根据权利要求12所述的在播放音乐时呈现图片的方法,其特征在于,所述在播放所述音乐的同时呈现所述一张或者一张以上的图片,包括:在播放所述音乐的同时呈现经渲染的一张或者一张以上的图片。
14.根据权利要求1所述的在播放音乐时呈现图片的方法,其特征在于,在所述获取与音乐相关联的故事情节之后,还包括:对所述故事情节进行分析,根据所述故事情节中的时间信息或者空间信息或者人物信息将所述故事情节分割成至少一个段落。
15.根据权利要求14所述的在播放音乐时呈现图片的方法,其特征在于,获取与每一个所述段落相关联的图片。
16.根据权利要求15所述的在播放音乐时呈现图片的方法,其特征在于,在播放所述音乐的同时呈现所述一张或者一张以上的图片之前,还包括:将所述音乐分割成至少一个音乐片段,并且将所述至少一个段落中的每一个段落都与音乐片段相关联。
17.根据权利要求16所述的在播放音乐时呈现图片的方法,其特征在于,所述在播放所述音乐的同时呈现所述一张或者一张以上的图片,包括:播放所述至少一个音乐片段中的指定音乐片段,同时呈现与所述指定音乐片段相关联的段落所关联的图片。
18.一种在播放音乐时呈现图片的装置,其特征在于,所述装置包括:
故事情节获取模块,用于获取与音乐相关联的故事情节;
图片获取模块,用于根据所述故事情节获取一张或者一张以上的图片;
音乐和图片呈现模块,用于在播放所述音乐的同时呈现所述一张或者一张以上的图片。
19.根据权利要求18所述的在播放音乐时呈现图片的装置,其特征在于,所述故事情节获取模块包括:获取所述音乐的元信息;根据所述元信息,获取与所述音乐相关联的故事情节。
20.根据权利要求18所述的在播放音乐时呈现图片的装置,其特征在于,所述故事情节获取模块包括:获取所述音乐的音频指纹信息;根据所述音频指纹信息,获取与所述音乐相关联的故事情节。
21.根据权利要求18-20之一所述的在播放音乐时呈现图片的装置,其特征在于,所述图片获取模块包括:从所述故事情节中提取关键词;根据所述关键词搜索得到一张或者一张以上的图片。
CN201410314821.2A 2014-07-03 2014-07-03 在播放音乐时呈现图片的方法和装置 Active CN105224581B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201410314821.2A CN105224581B (zh) 2014-07-03 2014-07-03 在播放音乐时呈现图片的方法和装置
KR1020150084338A KR102396375B1 (ko) 2014-07-03 2015-06-15 멀티미디어 재생 방법 및 그 디바이스
EP15175311.8A EP2963651A1 (en) 2014-07-03 2015-07-03 Method and device for playing multimedia
US14/792,045 US10565754B2 (en) 2014-07-03 2015-07-06 Method and device for playing multimedia
KR1020220055711A KR102527281B1 (ko) 2014-07-03 2022-05-04 멀티미디어 재생 방법 및 그 디바이스

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410314821.2A CN105224581B (zh) 2014-07-03 2014-07-03 在播放音乐时呈现图片的方法和装置

Publications (2)

Publication Number Publication Date
CN105224581A true CN105224581A (zh) 2016-01-06
CN105224581B CN105224581B (zh) 2019-06-21

Family

ID=54993550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410314821.2A Active CN105224581B (zh) 2014-07-03 2014-07-03 在播放音乐时呈现图片的方法和装置

Country Status (2)

Country Link
KR (1) KR102396375B1 (zh)
CN (1) CN105224581B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930485A (zh) * 2016-04-28 2016-09-07 深圳市金立通信设备有限公司 一种音频媒体播放方法、通信设备及网络系统
CN106851362A (zh) * 2016-12-15 2017-06-13 咪咕音乐有限公司 一种多媒体内容的播放方法及装置
CN108205550A (zh) * 2016-12-16 2018-06-26 北京酷我科技有限公司 音频指纹的生成方法及装置
CN109446350A (zh) * 2018-11-09 2019-03-08 腾讯音乐娱乐科技(深圳)有限公司 多媒体播放方法、装置、终端及存储介质
CN109615682A (zh) * 2018-12-07 2019-04-12 北京微播视界科技有限公司 动画生成方法、装置、电子设备及计算机可读存储介质
CN109802987A (zh) * 2018-09-11 2019-05-24 北京京东方技术开发有限公司 用于显示装置的内容推送方法、推送装置和显示设备
CN109817242A (zh) * 2019-01-30 2019-05-28 北京雷石天地电子技术有限公司 一种音频匹配方法及装置
CN110209844A (zh) * 2019-05-17 2019-09-06 腾讯音乐娱乐科技(深圳)有限公司 多媒体数据匹配方法、装置和存储介质
CN110521213A (zh) * 2017-03-23 2019-11-29 韩国斯诺有限公司 故事影像制作方法及系统
CN111596841A (zh) * 2020-04-28 2020-08-28 维沃移动通信有限公司 图像显示方法及电子设备
CN111935537A (zh) * 2020-06-30 2020-11-13 百度在线网络技术(北京)有限公司 音乐短片视频生成方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1732692A (zh) * 2002-12-24 2006-02-08 皇家飞利浦电子股份有限公司 用于扩充音频信号的方法和系统
US20090307207A1 (en) * 2008-06-09 2009-12-10 Murray Thomas J Creation of a multi-media presentation
US20110055213A1 (en) * 2009-08-28 2011-03-03 Kddi Corporation Query extracting apparatus, query extracting method and query extracting program
CN102099804A (zh) * 2008-07-18 2011-06-15 索尼爱立信移动通讯有限公司 增强音频播放的自适应显示器
WO2012177229A1 (en) * 2011-06-21 2012-12-27 Echostar Ukraine, L.L.C. Apparatus, systems and methods for identifying image objects using audio commentary

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7599554B2 (en) * 2003-04-14 2009-10-06 Koninklijke Philips Electronics N.V. Method and apparatus for summarizing a music video using content analysis
KR20080043129A (ko) * 2006-11-13 2008-05-16 삼성전자주식회사 음악의 무드를 이용한 사진 추천 방법 및 그 시스템
KR20110121830A (ko) * 2010-05-03 2011-11-09 삼성전자주식회사 이동통신 단말기에서 자동으로 뮤직비디오를 생성하기 위한 장치 및 방법
JP2012220582A (ja) * 2011-04-05 2012-11-12 Sony Corp 音楽再生装置、音楽再生方法、プログラム、およびデータ作成装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1732692A (zh) * 2002-12-24 2006-02-08 皇家飞利浦电子股份有限公司 用于扩充音频信号的方法和系统
US20090307207A1 (en) * 2008-06-09 2009-12-10 Murray Thomas J Creation of a multi-media presentation
CN102099804A (zh) * 2008-07-18 2011-06-15 索尼爱立信移动通讯有限公司 增强音频播放的自适应显示器
US20110055213A1 (en) * 2009-08-28 2011-03-03 Kddi Corporation Query extracting apparatus, query extracting method and query extracting program
WO2012177229A1 (en) * 2011-06-21 2012-12-27 Echostar Ukraine, L.L.C. Apparatus, systems and methods for identifying image objects using audio commentary

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930485A (zh) * 2016-04-28 2016-09-07 深圳市金立通信设备有限公司 一种音频媒体播放方法、通信设备及网络系统
CN106851362A (zh) * 2016-12-15 2017-06-13 咪咕音乐有限公司 一种多媒体内容的播放方法及装置
CN108205550A (zh) * 2016-12-16 2018-06-26 北京酷我科技有限公司 音频指纹的生成方法及装置
CN108205550B (zh) * 2016-12-16 2021-03-12 北京酷我科技有限公司 音频指纹的生成方法及装置
CN110521213A (zh) * 2017-03-23 2019-11-29 韩国斯诺有限公司 故事影像制作方法及系统
US11954142B2 (en) 2017-03-23 2024-04-09 Snow Corporation Method and system for producing story video
US11704355B2 (en) 2017-03-23 2023-07-18 Snow Corporation Method and system for producing story video
CN110521213B (zh) * 2017-03-23 2022-02-18 韩国斯诺有限公司 故事影像制作方法及系统
CN109802987A (zh) * 2018-09-11 2019-05-24 北京京东方技术开发有限公司 用于显示装置的内容推送方法、推送装置和显示设备
WO2020052324A1 (zh) * 2018-09-11 2020-03-19 京东方科技集团股份有限公司 用于显示装置的内容推送方法、推送装置和显示设备
US11410706B2 (en) 2018-09-11 2022-08-09 Beijing Boe Technology Development Co., Ltd. Content pushing method for display device, pushing device and display device
CN109446350A (zh) * 2018-11-09 2019-03-08 腾讯音乐娱乐科技(深圳)有限公司 多媒体播放方法、装置、终端及存储介质
CN109615682A (zh) * 2018-12-07 2019-04-12 北京微播视界科技有限公司 动画生成方法、装置、电子设备及计算机可读存储介质
CN109817242A (zh) * 2019-01-30 2019-05-28 北京雷石天地电子技术有限公司 一种音频匹配方法及装置
CN110209844A (zh) * 2019-05-17 2019-09-06 腾讯音乐娱乐科技(深圳)有限公司 多媒体数据匹配方法、装置和存储介质
CN111596841B (zh) * 2020-04-28 2021-09-07 维沃移动通信有限公司 图像显示方法及电子设备
CN111596841A (zh) * 2020-04-28 2020-08-28 维沃移动通信有限公司 图像显示方法及电子设备
CN111935537A (zh) * 2020-06-30 2020-11-13 百度在线网络技术(北京)有限公司 音乐短片视频生成方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN105224581B (zh) 2019-06-21
KR102396375B1 (ko) 2022-05-10
KR20160004914A (ko) 2016-01-13

Similar Documents

Publication Publication Date Title
CN105224581B (zh) 在播放音乐时呈现图片的方法和装置
US10692480B2 (en) System and method of reading environment sound enhancement based on image processing and semantic analysis
CN113569088B (zh) 一种音乐推荐方法、装置以及可读存储介质
TWI553494B (zh) 基於多模態融合之智能高容錯視頻識別系統及其識別方法
CN107731219B (zh) 语音合成处理方法、装置及设备
CN108920648B (zh) 一种基于音乐-图像语义关系的跨模态匹配方法
CN105335455A (zh) 一种阅读文字的方法及装置
CN105096932A (zh) 有声读物的语音合成方法和装置
US20150169747A1 (en) Systems and methods for automatically suggesting media accompaniments based on identified media content
CN111046225B (zh) 音频资源处理方法、装置、设备及存储介质
CN107864410B (zh) 一种多媒体数据处理方法、装置、电子设备以及存储介质
CN104252861A (zh) 视频语音转换方法、装置和服务器
CN107644085A (zh) 体育赛事新闻的生成方法和装置
CN114143479B (zh) 视频摘要的生成方法、装置、设备以及存储介质
GB2532174A (en) Information processing device, control method therefor, and computer program
JP2022538702A (ja) 音声パケット推薦方法、装置、電子機器およびプログラム
WO2023116122A1 (zh) 一种字幕生成方法、电子设备及计算机可读存储介质
CN110781346A (zh) 基于虚拟形象的新闻生产方法、系统、装置和存储介质
CN110297897B (zh) 问答处理方法及相关产品
JP7315321B2 (ja) 生成装置、生成方法および生成プログラム
JP2014153977A (ja) コンテンツ解析装置、コンテンツ解析方法、コンテンツ解析プログラム、およびコンテンツ再生システム
CN113038175B (zh) 视频处理方法、装置、电子设备及计算机可读存储介质
CN113641837A (zh) 一种展示方法及其相关设备
US11410706B2 (en) Content pushing method for display device, pushing device and display device
CN113407766A (zh) 视觉动画显示方法及相关设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant