CN106021368A - 播放多媒体文件的方法及装置 - Google Patents

播放多媒体文件的方法及装置 Download PDF

Info

Publication number
CN106021368A
CN106021368A CN201610307489.6A CN201610307489A CN106021368A CN 106021368 A CN106021368 A CN 106021368A CN 201610307489 A CN201610307489 A CN 201610307489A CN 106021368 A CN106021368 A CN 106021368A
Authority
CN
China
Prior art keywords
information
multimedia
content
multimedium
multimedia file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610307489.6A
Other languages
English (en)
Inventor
王磊
麦涛
张旭
白杨
孔畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201610307489.6A priority Critical patent/CN106021368A/zh
Publication of CN106021368A publication Critical patent/CN106021368A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/44Browsing; Visualisation therefor
    • G06F16/447Temporal browsing, e.g. timeline
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/489Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using time information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种播放多媒体文件的方法及装置。方法包括:获取用户输入的检索信息;根据检索信息查询多媒体信息数据库,获取候选多媒体信息记录,候选多媒体信息记录包括多媒体信息数据库中与检索信息相匹配的多媒体信息记录;输出候选多媒体信息记录;接收用户针对候选多媒体信息记录的选择指令,其中,该选择指令用于指示用户从候选多媒体信息记录中选出的目标多媒体信息记录;根据目标多媒体信息记录中的时段信息,播放目标多媒体信息记录中的多媒体文件标识信息所表示的多媒体文件。由此,可以节省用户在搜索多媒体文件的过程中的决策时间,提高多媒体文件检索的工作效率。

Description

播放多媒体文件的方法及装置
技术领域
本发明涉及视频搜索播放领域,具体地,涉及一种播放多媒体文件的方法及装置。
背景技术
视频素材的管理和检索是好多拥有视频素材厂商的痛点。不同于文本检索可以通过输入关键字的匹配进行查找,视频文件的检索通常都是由人工方法将视频中讲述的“内容”以手工的方式标记出来,比如一个视频中含有小明出席了同学聚会,手工人员会将小明、同学聚会等关键词记录下来并与视频文件捆绑。检索视频时可以通过输入小明或同学聚会的关键字找到该视频。但是,如果使用者想要了解在该视频文件中何时出现了小明或同学聚会,则检索到结果后,使用者还需要对全片视频文件进行预览才能得到想要的结果,这就导致费时费力,检索效率低下。
发明内容
本发明的目的是提供一种播放多媒体文件的方法及装置,以节省用户在搜索多媒体文件的过程中的决策时间,提高多媒体文件检索的工作效率。
为了实现上述目的,本发明提供一种播放多媒体文件的方法,所述方法包括:获取用户输入的检索信息;根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息记录,所述候选多媒体信息记录包括所述多媒体信息数据库中与所述检索信息相匹配的多媒体信息记录,其中,所述多媒体信息数据库中预置有至少一条多媒体信息记录,每条多媒体信息记录包括以下:多媒体文件标识信息,时段信息,以及在所述多媒体文件标识信息所表示的多媒体文件中、与所述时段信息相对应的多媒体内容的标识信息,其中,所述多媒体内容的标识信息用于与所述检索信息进行匹配;输出所述候选多媒体信息记录;接收用户针对所述候选多媒体信息记录的选择指令,其中,所述选择指令用于指示用户从所述候选多媒体信息记录中选出的目标多媒体信息记录;根据所述目标多媒体信息记录中的所述时段信息,播放所述目标多媒体信息记录中的所述多媒体文件标识信息所表示的多媒体文件。
可选地,所述根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息记录,包括:将所述检索信息与所述多媒体信息数据库中的所述多媒体内容的标识信息进行匹配;将与所述检索信息相匹配的所述多媒体内容的标识信息所在的多媒体信息记录获取为是所述候选多媒体信息记录。
可选地,在输出的所述候选多媒体信息记录中,所述多媒体内容的标识信息用于用户选择所述目标多媒体信息记录。
可选地,所述多媒体内容的标识信息为所述多媒体内容的文本信息;以及所述输出所述候选多媒体信息记录,包括:显示所述候选多媒体信息记录,并将所述候选多媒体信息记录中包括的所述多媒体内容的标识信息中、与所述检索信息相一致的部分突出显示。
可选地,所述多媒体信息数据库通过以下方式来建立:从多媒体资源库获取多媒体文件和与所述多媒体文件相对应的多媒体文件标识信息;按照预设的时间间隔为所述多媒体文件添加时间戳,其中,相邻两个时间戳用于限定所述多媒体文件的时段信息;针对每个所述时段信息,对所述多媒体文件中与所述时段信息相对应的多媒体内容进行识别,得到与所述时段信息相对应的多媒体内容的文本信息,其中,所述文本信息作为所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息;针对每个所述时段信息,将所述多媒体文件标识信息、所述时段信息、以及所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息作为一条多媒体信息记录存储在所述多媒体信息数据库中。
可选地,所述对所述多媒体文件中与所述时段信息相对应的多媒体内容进行识别,得到与所述时段信息相对应的多媒体内容的文本信息,包括:对所述多媒体文件中与所述时段信息相对应的多媒体内容的字幕部分进行文字识别,得到字幕识别结果;对所述多媒体文件中与所述时段信息相对应的多媒体内容的语音部分进行语音识别,得到语音识别结果;以及根据所述字幕识别结果和所述语音识别结果,得到与所述时段信息相对应的多媒体内容的文本信息。
本发明还提供一种播放多媒体文件的装置,所述装置包括:检索信息获取模块,被配置为获取用户输入的检索信息;查询模块,被配置为根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息记录,所述候选多媒体信息记录包括所述多媒体信息数据库中与所述检索信息相匹配的多媒体信息记录,其中,所述多媒体信息数据库中预置有至少一条多媒体信息记录,每条多媒体信息记录包括以下:多媒体文件标识信息,时段信息,以及在所述多媒体文件标识信息所表示的多媒体文件中、与所述时段信息相对应的多媒体内容的标识信息,其中,所述多媒体内容的标识信息用于与所述检索信息进行匹配;输出模块,被配置为输出所述候选多媒体信息记录;选择指令接收模块,被配置为接收用户针对所述候选多媒体信息记录的选择指令,其中,所述选择指令用于指示用户从所述候选多媒体信息记录中选出的目标多媒体信息记录;播放模块,被配置为根据所述目标多媒体信息记录中的所述时段信息,播放所述目标多媒体信息记录中的所述多媒体文件标识信息所表示的多媒体文件。
可选地,所述查询模块包括:匹配子模块,被配置为将所述检索信息与所述多媒体信息数据库中的所述多媒体内容的标识信息进行匹配;第一获取子模块,被配置为将与所述检索信息相匹配的所述多媒体内容的标识信息所在的多媒体信息记录获取为是所述候选多媒体信息记录。
可选地,在所述输出模块输出的所述候选多媒体信息记录中,所述多媒体内容的标识信息用于用户选择所述目标多媒体信息记录。
可选地,所述多媒体内容的标识信息为所述多媒体内容的文本信息;以及所述输出模块包括:显示子模块,被配置为显示所述候选多媒体信息记录,并将所述候选多媒体信息记录中包括的所述多媒体内容的标识信息中、与所述检索信息相一致的部分突出显示。
可选地,所述多媒体信息数据库通过多媒体信息数据库建立模块来建立,并且所述多媒体信息数据库建立模块包括:第二获取子模块,被配置为从多媒体资源库获取多媒体文件和与所述多媒体文件相对应的多媒体文件标识信息;时间戳添加子模块,被配置为按照预设的时间间隔为所述多媒体文件添加时间戳,其中,相邻两个时间戳用于限定所述多媒体文件的时段信息;识别子模块,被配置为针对每个所述时段信息,对所述多媒体文件中与所述时段信息相对应的多媒体内容进行识别,得到与所述时段信息相对应的多媒体内容的文本信息,其中,所述文本信息作为所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息;存储子模块,被配置为针对每个所述时段信息,将所述多媒体文件标识信息、所述时段信息、以及所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息作为一条多媒体信息记录存储在所述多媒体信息数据库中。
可选地,所述识别子模块包括:第一识别单元,被配置为对所述多媒体文件中与所述时段信息相对应的多媒体内容的字幕部分进行文字识别,得到字幕识别结果;第二识别单元,被配置为对所述多媒体文件中与所述时段信息相对应的多媒体内容的语音部分进行语音识别,得到语音识别结果;以及文本信息确定单元,被配置为根据所述字幕识别结果和所述语音识别结果,得到与所述时段信息相对应的多媒体内容的文本信息。
在上述技术方案中,由于反馈给用户的与其检索信息相匹配的多媒体信息记录中包含有时段信息,因此,当用户选定某个多媒体信息记录作为目标多媒体信息记录时,可以直接根据该目标多媒体信息记录中的时段信息,来播放该目标多媒体信息记录中的多媒体文件标识信息所表示的多媒体文件。这样,用户无需全部浏览完整的多媒体文件,只需要花费较短时间就能了解该多媒体文件是否是想要的素材,因此,节省了用户在搜索多媒体文件的过程中的决策时间,提升了多媒体文件检索的工作效率。
本发明的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
图1是根据本发明的实施方式的建立多媒体信息数据库的方法的流程图;
图2是一示例多媒体文件分割并添加时间戳的示意图;
图3是一示例多媒体信息数据库的示意图;
图4是根据本发明的实施方式的播放多媒体文件的方法的流程图;
图5A至图5C示出了根据本发明的实施方式的播放多媒体文件的装置的框图。
图6A至图6B示出了根据本发明的实施方式的多媒体信息数据库建立模块的框图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
在本发明中,多媒体文件可以包括但不限于视频文件、音频文件等。
在详细描述本发明提供的播放多媒体文件的方法之前,先描述一下如何建立多媒体信息数据库的方法,以为后续多媒体文件检索建立基础。
图1示出了根据本发明的实施方式的建立多媒体信息数据库的方法的流程图。如图1所示,该方法可以包括:
在步骤101中,从多媒体资源库获取多媒体文件和与该多媒体文件相对应的多媒体文件标识信息。
在多媒体资源库中存储有大量的多媒体文件,可以首先获取其中一个多媒体文件及该多媒体文件相对应的多媒体文件标识信息,并针对该多媒体文件进行以下处理。之后,再一一遍历该多媒体资源库中包含的其他多媒体文件,利用同样的方法进行处理,从而完成多媒体信息数据库的建立。
在本发明中,多媒体文件标识信息可以用于唯一地表示所对应的多媒体文件。其中,该多媒体文件标识信息可以例如为所对应的多媒体文件的编号、名称等等。
在步骤102中,按照预设的时间间隔为多媒体文件添加时间戳,其中,相邻两个时间戳用于限定该多媒体文件的时段信息。
预设的时间间隔可以视实际需求来设定,通常设定得相对较短,例如,5秒。也就是说,从该多媒体文件的起始处开始,每隔5秒为该多媒体文件添加时间戳。通过这一步骤,可以将一个完整的多媒体文件分割成多个多媒体文件片段,并且每个多媒体文件片段对应一个时段信息。
例如,如图2所示,假设一个完整的多媒体文件(其相对应的多媒体文件标识为“001”)的总时长为1分钟,那么按照每隔5秒添加时间戳,则该多媒体文件可以总共被分割成12个多媒体文件片段S1~S12。相邻两个时间戳可以限定一个时段信息,这样,每个多媒体文件片段就可以对应一个时段信息。例如,如图2所示,S1所对应的时段信息可以为“00:00-00:05”,S2所对应的时段信息可以为“00:05-00:10”,S3所对应的时段信息可以为“00:10-00:15”,依次类推。
在步骤103中,针对每个时段信息,对多媒体文件中与该时段信息相对应的多媒体内容进行识别,得到与该时段信息相对应的多媒体内容的文本信息,其中,该文本信息作为多媒体文件中与该时段信息相对应的多媒体内容的标识信息。
例如,假设针对图2所示的多媒体文件,针对“00:05-00:10”这一时段信息,可以针对与该时段信息相对应的多媒体内容(即,多媒体文件片段S2中包含的多媒体内容)进行识别,得到关于该多媒体内容的文本信息。
在进行识别时,可以采用文字识别技术或语音识别技术进行识别。例如,在一个实施方式中,针对有字幕的视频文件,可以利用文字识别技术(例如,OCR(Optical Character Recognition)光学字符识别技术)来识别出字幕部分对应的文本信息,并将该文本信息作为相对应的多媒体内容的标识信息。或者,在另一个实施方式中,针对无字幕的视频文件,可以利用语音识别技术(ASR,Auto Speech Recognize)来识别出语音部分对应的文本信息,并将该文本信息作为相对应的多媒体内容的标识信息。
在步骤104中,针对每个时段信息,将该多媒体文件标识信息、该时段信息、以及该多媒体文件中与该时段信息相对应的多媒体内容的标识信息作为一条多媒体信息记录存储在多媒体信息数据库中。
例如,假设针对图2所示的多媒体文件,经过步骤102至步骤104,能够得到12条多媒体信息记录,如图3所示,这12条多媒体信息记录被存储在多媒体信息数据库中。
针对多媒体资源库中的每一个多媒体文件,都可以按照上述方法处理,由此,完成多媒体信息数据库的建立。另外,一旦多媒体资源库中有更新,则可以按照上述方法同步更新多媒体信息数据库。
如上所述,在进行识别时,可以采用文字识别技术或语音识别技术进行识别。不过,OCR技术在识别一些特定内容时精度不高,例如,字母、数字等。因此,为了提高文本信息的识别准确率,在本发明的一个可选的实施方式中,采用这两种技术共同进行识别,如下所述。
在执行步骤103时,首先,可以对多媒体文件中与该时段信息相对应的多媒体内容的字幕部分进行文字识别,得到字幕识别结果。
接下来,对多媒体文件中与该时段信息相对应的多媒体内容的语音部分进行语音识别,得到语音识别结果。
最后,根据字幕识别结果和语音识别结果,得到与该时段信息相对应的多媒体内容的文本信息。
具体地,首先,字幕识别结果中可能包括多个字符,该多个字符中可能包括汉字、外语单词、字母、数字或者符号中的一种或者多种,因此可以先将字幕识别结果进行分词,用于将所述字幕识别结果划分为多个字符集合,每个字符集合中包括一个或多个字符,即每个字符集合可能是一个字、词、句,也可能是一个字母、一个单词、一个或一组数字。例如,假设字幕为“最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy,1966年他们发表了第一篇关于汉字识别的文章”,在通过OCR对字幕进行识别后,假设得到的字幕识别结果为“最早对印刷体汉字识别进行研究的是1BM公司的Casey和Nagy,I966年他们发表了第一篇关于汉字识别的文章”。在对该字幕识别结果进行分词后,示例地,假设得到的分词结果为:“最早,对,印刷体,汉字识别,进行研究的,是,1BM,公司,的,Casey和Nagy,I966,年,他们,发表了,第一篇,关于,汉字识别,的文章”。
接下来,将上述分词得到的多个字符集合分别与预定义的关键词进行对比,在所有的字符集合中查找与预定义的关键词匹配的字符集合,与预定义的关键词匹配的字符集合就是需要找到的目标字符。示例地,预定义的关键词可以包括两类,一类为代表数字的关键词,例如:年、月、日,时、分、秒等时间单位,以及重量,体积,价钱等度量单位;另一类为代表字母的关键词,例如:品牌,公司,地名等名词形式的词语。从而,根据这里的关键词,可以确定上述分词得到的多个字符集合“最早,对,印刷体,汉字识别,进行研究的,是,1BM,公司,的,Casey和Nagy,I966,年,他们,发表了,第一篇,关于,汉字识别,的文章”中与预定义的关键词匹配的为“公司”和“年”,从而字幕识别结果中的目标字符就是“公司”和“年”。
当查找到目标字符时,确定目标字符所匹配的关键词所属的分类,分类包括代表数字的关键词,或代表字母的关键词。以上述示例为例,“公司”为代表字母的关键词,“年”为代表数字的关键词。
当目标字符所匹配的关键词属于代表数字的关键词时,将目标字符之前和/或目标字符之后的一个或多个字符确定为字符属性为数字的字符。
在本实施例中,将目标字符之前和/或目标字符之后的一个或多个字符确定为字符属性为数字的字符可以理解为,将目标字符之前的,或者目标字符之后的,或者目标字符前后的确定为字符属性为数字的字符,而实际需要采用上述三种情况中的哪一种可以根据目标字符所匹配的关键词,以及与该关键词对应的判定策略来确定。示例地,由于年、月、日,时、分、秒等时间单位,以及重量,体积,价钱等度量单位之前的字符为数字的可能性大于为字母的可能性,因此其对应的判定策略可以为:将目标字符之前的字符确定为字符属性为数字的字符。
因此,由于在上面得到的分词结果中,在目标字符“年”之前的字符集合为“I966”,从而结合之前确定出的“年”为代表数字的关键词,以及上述的判定策略,可以将目标字符“年”之前的字符集合“I966”确定为字符属性为数字的字符。
相类似地,当目标字符所匹配的关键词属于代表字母的关键词时,将目标字符之前和/或目标字符之后的一个或多个字符确定为字符属性为字母的字符。
其中,将目标字符之前和/或目标字符之后的一个或多个字符确定为字符属性为字母的字符可以理解为,将目标字符之前的,或者目标字符之后的,或者目标字符前后的确定为字符属性为字母的字符,而实际需要采用上述三种情况中的哪一种可以根据目标字符所匹配的关键词,以及与该关键词对应的判定策略来确定。示例地,由于品牌,公司,地名等名词形式的词语之前的字符为字母的可能性大于为数字的可能性,因此其对应的判定策略可以为:将目标字符之前的字符确定为字符属性为字母的字符。
因此,由于在上面得到的分词结果中,在目标字符“公司”之前的字符集合为“1BM”,从而结合之前确定出的“公司”为代表字母的关键词,以及上述的判定策略,可以将目标字符“公司”之前的字符集合“1BM”确定为字符属性为字母的字符。
接下来,将字符属性为字母的字符标记为字母,将字符属性为数字的字符标记为数字。
示例地,字符集合“I966”为字符属性为数字的字符,字符集合“1BM”为字符属性为字母的字符,因此,将字符集合“I966”中的字符标记为数字,将字符集合“1BM”中的字符标记为字母。
针对字幕识别结果中被标记为数字和字母的字符集合,可以利用语音识别结果来对其进行验证,并在验证有误时利用语音识别结果对其进行校正。
示例地,如上所述,字幕识别结果为“最早对印刷体汉字识别进行研究的是1BM公司的Casey和Nagy,I966年他们发表了第一篇关于汉字识别的文章”,按照以上方式,能够确定出“I966”为数字,“1BM”为字母。随后,通过结合语音识别结果对其进行验证,发现OCR进行字幕识别的结果中将“1966”错误地识别为“I966”,以及将“IBM”错误地识别为“1BM”。这时,通过语音识别结果对其进行校正,利用语音识别结果中的“1966”和“IBM”这两个内容分别替换字幕识别结果中的相应内容,即“I966”和“1BM”。这样,就能够得到与时段信息相对应的多媒体内容的文本信息为“最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy,1966年他们发表了第一篇关于汉字识别的文章”。
通过结合OCR和ASR技术得到多媒体内容的文本信息,可以提高识别准确率,两种技术所得结果之间可以进行交叉校验,从而确保获取到正确的文本信息,为后续的检索提供准确的数据支持。
图4示出了根据本发明的实施方式的播放多媒体文件的方法的流程图。其中,该方法可以应用于各种类型的电子设备,例如,服务器、终端(包括个人计算机、智能手机、平板电脑等)等等。如图4所示,该方法可以包括以下步骤:
在步骤401中,获取用户输入的检索信息。
用户可以通过各种类型的信息输入设备来输入该检索信息,其中,所述信息输入设备可以例如包括键盘、触摸屏等等。另外,该检索信息可以包括至少一个关键词,或者也可以为一句话、一段话。
在步骤402中,根据检索信息查询多媒体信息数据库,获取候选多媒体信息记录,其中,该候选多媒体信息记录包括多媒体信息数据库中与检索信息相匹配的多媒体信息记录。并且,如上所述,多媒体信息数据库中预置有至少一条多媒体信息记录,每条多媒体信息记录可以包括以下:多媒体文件标识信息,时段信息,以及在多媒体文件标识信息所表示的多媒体文件中、与该时段信息相对应的多媒体内容的标识信息,其中,该多媒体内容的标识信息用于与检索信息进行匹配。
示例地,当检索信息包括一个或多个关键词时,可以直接利用所包括的关键词查询多媒体信息数据库。当检索信息包括一句话或者一段话时,在查询多媒体信息数据库之前,可以首先对检索信息进行分词处理,之后,利用所得到的分词查询多媒体信息数据库。
在获取与检索信息相匹配的多媒体信息记录时,可以首先将检索信息与多媒体信息数据库中的多媒体内容的标识信息进行匹配,例如,如图3所示,将检索信息与多媒体信息数据库中的“多媒体内容的标识信息”这一列字段中的内容进行匹配。示例地,判断检索信息与某个多媒体内容的标识信息是否匹配可以基于以下准则:该多媒体内容的标识信息是否包含检索信息中的内容。当满足上述准则时,确定检索信息与该多媒体内容的标识信息相匹配,否则,确定检索信息与该多媒体内容的标识信息不匹配。
接下来,将与检索信息相匹配的多媒体内容的标识信息所在的多媒体信息记录获取为是与检索信息相匹配的多媒体信息记录,即,上述候选多媒体信息记录。例如,假设用户输入的检索信息为“天津爆炸”,则通过查询如图3所示的多媒体信息数据库,可以确定与该检索信息相匹配的多媒体信息记录为第1条多媒体信息记录,获取该条多媒体信息记录作为候选多媒体信息记录。
在步骤403中,输出候选多媒体信息记录。
在输出候选多媒体信息记录时,可以例如通过显示的方式将获取到的候选多媒体信息记录显示出来,呈现方式可以例如采用列表的方式。另外,如上所述,多媒体内容的标识信息为该多媒体内容的文本信息。这样,在显示候选多媒体信息记录时,还可以将该候选多媒体信息记录中包括的多媒体内容的标识信息中、与检索信息相一致的部分突出显示,其中,突出显示的方式包括但不限于以下中的至少一者:放大、标红、加粗、加下划线、变斜体等。例如,假设检索信息为“天津爆炸”,那么在显示图3中的第1条多媒体信息记录时,可以将该多媒体信息记录中包括的多媒体内容的标识信息中的“天津”和“爆炸”字样突出显示,以便于用户更方便且清晰地查看和判断检索到的多媒体信息记录是否符合预期,从而便于用户快速了解多媒体文件的概要内容。
在步骤404中,接收用户针对候选多媒体信息记录的选择指令,其中,该选择指令用于指示用户从候选多媒体信息记录中选出的目标多媒体信息记录。
输出候选多媒体信息记录的目的在于向用户反馈检索结果。当满足用户检测条件的结果反馈给用户时,用户可以根据自身需求来从中选择哪个或哪些多媒体信息记录为目标多媒体信息记录,即,用户期望的多媒体信息记录。
在用户选择目标多媒体信息记录时,在一种实施方式中,用户可以任意选取其中的一个或一些多媒体信息记录作为目标多媒体信息记录。或者,在另一种实施方式中,在输出的候选多媒体信息记录中,多媒体内容的标识信息用于用户选择目标多媒体信息记录。也就是说,用户可以通过阅读候选多媒体信息记录中的多媒体内容的标识信息,来快速了解相应多媒体内容的概要,并选取其中感兴趣的多媒体信息记录作为目标多媒体信息记录。
当用户做出选择时,通过步骤404,执行该方法的电子设备可以接收到选择指令,并且在该选择指令中指示了用户期望的多媒体信息记录,即,目标多媒体信息记录。
在步骤405中,根据目标多媒体信息记录中的时段信息,播放目标多媒体信息记录中的多媒体文件标识信息所表示的多媒体文件。
当接收到选择指令之后,可以确定出目标多媒体信息记录是哪条。在执行该方法的电子设备中可以配置有播放模块,在这种情况下,播放模块可以首先根据该目标多媒体信息记录中的多媒体文件标识信息确定要播放哪个多媒体文件,之后,再根据该目标多媒体信息记录中的时段信息确定要播放该多媒体文件中的哪部分多媒体内容。在一个实施方式中,播放模块可以只播放该多媒体文件中与该时段信息相对应的多媒体内容。或者,在另一个实施方式中,播放模块可以将该时段信息作为播放起始点,从该多媒体文件中与该时段信息对应的多媒体内容开始向后播放。
通过根据时段信息来播放多媒体文件,可以实现定位播放。
综上所述,在上述技术方案中,由于反馈给用户的与其检索信息相匹配的多媒体信息记录中包含有时段信息,因此,当用户选定某个多媒体信息记录作为目标多媒体信息记录时,可以直接根据该目标多媒体信息记录中的时段信息,来播放该目标多媒体信息记录中的多媒体文件标识信息所表示的多媒体文件。这样,用户无需全部浏览完整的多媒体文件,只需要花费较短时间就能了解该多媒体文件是否是想要的素材。例如,针对一个30分钟的视频文件,用户不用全部浏览,使用该方法后只需要5分钟就能了解视频是否是想要的素材。因此,有效节省了用户在搜索多媒体文件的过程中的决策时间,提升了多媒体文件检索的工作效率。
图5A至图5C示出了根据本发明的实施方式的播放多媒体文件的装置500的框图。其中,该装置500可以配置于各种类型的电子设备,例如,服务器、终端(包括个人计算机、智能手机、平板电脑等)等等。如图5A所示,该装置500可以包括:
检索信息获取模块510,被配置为获取用户输入的检索信息;
查询模块520,被配置为根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息记录,所述候选多媒体信息记录包括所述多媒体信息数据库中与所述检索信息相匹配的多媒体信息记录,其中,所述多媒体信息数据库中预置有至少一条多媒体信息记录,每条多媒体信息记录包括以下:多媒体文件标识信息,时段信息,以及在所述多媒体文件标识信息所表示的多媒体文件中、与所述时段信息相对应的多媒体内容的标识信息,其中,所述多媒体内容的标识信息用于与所述检索信息进行匹配;
输出模块530,被配置为输出所述候选多媒体信息记录;
选择指令接收模块540,被配置为接收用户针对所述候选多媒体信息记录的选择指令,其中,所述选择指令用于指示用户从所述候选多媒体信息记录中选出的目标多媒体信息记录;
播放模块550,被配置为根据所述目标多媒体信息记录中的所述时段信息,播放所述目标多媒体信息记录中的所述多媒体文件标识信息所表示的多媒体文件。
综上所述,在上述技术方案中,由于反馈给用户的与其检索信息相匹配的多媒体信息记录中包含有时段信息,因此,当用户选定某个多媒体信息记录作为目标多媒体信息记录时,可以直接根据该目标多媒体信息记录中的时段信息,来播放该目标多媒体信息记录中的多媒体文件标识信息所表示的多媒体文件。这样,用户无需全部浏览完整的多媒体文件,只需要花费较短时间就能了解该多媒体文件是否是想要的素材。例如,针对一个30分钟的视频文件,用户不用全部浏览,使用该方法后只需要5分钟就能了解视频是否是想要的素材。因此,有效节省了用户在搜索多媒体文件的过程中的决策时间,提升了多媒体文件检索的工作效率。
可选地,如图5B所示,所述查询模块520可以包括:
匹配子模块521,被配置为将所述检索信息与所述多媒体信息数据库中的所述多媒体内容的标识信息进行匹配;
第一获取子模块522,被配置为将与所述检索信息相匹配的所述多媒体内容的标识信息所在的多媒体信息记录获取为是所述候选多媒体信息记录。
可选地,在所述输出模块530输出的所述候选多媒体信息记录中,所述多媒体内容的标识信息用于用户选择所述目标多媒体信息记录。
可选地,如上所述,多媒体内容的标识信息为该多媒体内容的文本信息。这样,如图5C所示,所述输出模块530可以包括:
显示子模块531,被配置为显示所述候选多媒体信息记录,并将所述候选多媒体信息记录中包括的所述多媒体内容的标识信息中、与所述检索信息相一致的部分突出显示。
可选地,所述多媒体信息数据库通过多媒体信息数据库建立模块来建立,其中,该多媒体信息数据库建立模块可以配置于上述播放多媒体文件的装置500中,或者可以与上述播放多媒体文件的装置500相独立。图6A至图6B示出了根据本发明的实施方式的多媒体信息数据库建立模块600的框图。如图6A所示,所述多媒体信息数据库建立模块600可以包括:
第二获取子模块610,被配置为从多媒体资源库获取多媒体文件和与所述多媒体文件相对应的多媒体文件标识信息;
时间戳添加子模块620,被配置为按照预设的时间间隔为所述多媒体文件添加时间戳,其中,相邻两个时间戳用于限定所述多媒体文件的时段信息;
识别子模块630,被配置为针对每个所述时段信息,对所述多媒体文件中与所述时段信息相对应的多媒体内容进行识别,得到与所述时段信息相对应的多媒体内容的文本信息,其中,所述文本信息作为所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息;
存储子模块640,被配置为针对每个所述时段信息,将所述多媒体文件标识信息、所述时段信息、以及所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息作为一条多媒体信息记录存储在所述多媒体信息数据库中。
可选地,如图6B所示,所述识别子模块630可以包括:
第一识别单元631,被配置为对所述多媒体文件中与所述时段信息相对应的多媒体内容的字幕部分进行文字识别,得到字幕识别结果;
第二识别单元632,被配置为对所述多媒体文件中与所述时段信息相对应的多媒体内容的语音部分进行语音识别,得到语音识别结果;以及
文本信息确定单元633,被配置为根据所述字幕识别结果和所述语音识别结果,得到与所述时段信息相对应的多媒体内容的文本信息。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。

Claims (12)

1.一种播放多媒体文件的方法,其特征在于,所述方法包括:
获取用户输入的检索信息;
根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息记录,所述候选多媒体信息记录包括所述多媒体信息数据库中与所述检索信息相匹配的多媒体信息记录,其中,所述多媒体信息数据库中预置有至少一条多媒体信息记录,每条多媒体信息记录包括以下:多媒体文件标识信息,时段信息,以及在所述多媒体文件标识信息所表示的多媒体文件中、与所述时段信息相对应的多媒体内容的标识信息,其中,所述多媒体内容的标识信息用于与所述检索信息进行匹配;
输出所述候选多媒体信息记录;
接收用户针对所述候选多媒体信息记录的选择指令,其中,所述选择指令用于指示用户从所述候选多媒体信息记录中选出的目标多媒体信息记录;
根据所述目标多媒体信息记录中的所述时段信息,播放所述目标多媒体信息记录中的所述多媒体文件标识信息所表示的多媒体文件。
2.根据权利要求1所述的方法,其特征在于,所述根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息记录,包括:
将所述检索信息与所述多媒体信息数据库中的所述多媒体内容的标识信息进行匹配;
将与所述检索信息相匹配的所述多媒体内容的标识信息所在的多媒体信息记录获取为是所述候选多媒体信息记录。
3.根据权利要求1所述的方法,其特征在于,在输出的所述候选多媒体信息记录中,所述多媒体内容的标识信息用于用户选择所述目标多媒体信息记录。
4.根据权利要求1所述的方法,其特征在于,所述多媒体内容的标识信息为所述多媒体内容的文本信息;以及
所述输出所述候选多媒体信息记录,包括:
显示所述候选多媒体信息记录,并将所述候选多媒体信息记录中包括的所述多媒体内容的标识信息中、与所述检索信息相一致的部分突出显示。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述多媒体信息数据库通过以下方式来建立:
从多媒体资源库获取多媒体文件和与所述多媒体文件相对应的多媒体文件标识信息;
按照预设的时间间隔为所述多媒体文件添加时间戳,其中,相邻两个时间戳用于限定所述多媒体文件的时段信息;
针对每个所述时段信息,对所述多媒体文件中与所述时段信息相对应的多媒体内容进行识别,得到与所述时段信息相对应的多媒体内容的文本信息,其中,所述文本信息作为所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息;
针对每个所述时段信息,将所述多媒体文件标识信息、所述时段信息、以及所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息作为一条多媒体信息记录存储在所述多媒体信息数据库中。
6.根据权利要求5所述的方法,其特征在于,所述对所述多媒体文件中与所述时段信息相对应的多媒体内容进行识别,得到与所述时段信息相对应的多媒体内容的文本信息,包括:
对所述多媒体文件中与所述时段信息相对应的多媒体内容的字幕部分进行文字识别,得到字幕识别结果;
对所述多媒体文件中与所述时段信息相对应的多媒体内容的语音部分进行语音识别,得到语音识别结果;以及
根据所述字幕识别结果和所述语音识别结果,得到与所述时段信息相对应的多媒体内容的文本信息。
7.一种播放多媒体文件的装置,其特征在于,所述装置包括:
检索信息获取模块,被配置为获取用户输入的检索信息;
查询模块,被配置为根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息记录,所述候选多媒体信息记录包括所述多媒体信息数据库中与所述检索信息相匹配的多媒体信息记录,其中,所述多媒体信息数据库中预置有至少一条多媒体信息记录,每条多媒体信息记录包括以下:多媒体文件标识信息,时段信息,以及在所述多媒体文件标识信息所表示的多媒体文件中、与所述时段信息相对应的多媒体内容的标识信息,其中,所述多媒体内容的标识信息用于与所述检索信息进行匹配;
输出模块,被配置为输出所述候选多媒体信息记录;
选择指令接收模块,被配置为接收用户针对所述候选多媒体信息记录的选择指令,其中,所述选择指令用于指示用户从所述候选多媒体信息记录中选出的目标多媒体信息记录;
播放模块,被配置为根据所述目标多媒体信息记录中的所述时段信息,播放所述目标多媒体信息记录中的所述多媒体文件标识信息所表示的多媒体文件。
8.根据权利要求7所述的装置,其特征在于,所述查询模块包括:
匹配子模块,被配置为将所述检索信息与所述多媒体信息数据库中的所述多媒体内容的标识信息进行匹配;
第一获取子模块,被配置为将与所述检索信息相匹配的所述多媒体内容的标识信息所在的多媒体信息记录获取为是所述候选多媒体信息记录。
9.根据权利要求7所述的装置,其特征在于,在所述输出模块输出的所述候选多媒体信息记录中,所述多媒体内容的标识信息用于用户选择所述目标多媒体信息记录。
10.根据权利要求7所述的装置,其特征在于,所述多媒体内容的标识信息为所述多媒体内容的文本信息;以及
所述输出模块包括:
显示子模块,被配置为显示所述候选多媒体信息记录,并将所述候选多媒体信息记录中包括的所述多媒体内容的标识信息中、与所述检索信息相一致的部分突出显示。
11.根据权利要求7-10中任一项所述的装置,其特征在于,所述多媒体信息数据库通过多媒体信息数据库建立模块来建立,并且所述多媒体信息数据库建立模块包括:
第二获取子模块,被配置为从多媒体资源库获取多媒体文件和与所述多媒体文件相对应的多媒体文件标识信息;
时间戳添加子模块,被配置为按照预设的时间间隔为所述多媒体文件添加时间戳,其中,相邻两个时间戳用于限定所述多媒体文件的时段信息;
识别子模块,被配置为针对每个所述时段信息,对所述多媒体文件中与所述时段信息相对应的多媒体内容进行识别,得到与所述时段信息相对应的多媒体内容的文本信息,其中,所述文本信息作为所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息;
存储子模块,被配置为针对每个所述时段信息,将所述多媒体文件标识信息、所述时段信息、以及所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息作为一条多媒体信息记录存储在所述多媒体信息数据库中。
12.根据权利要求11所述的装置,其特征在于,所述识别子模块包括:
第一识别单元,被配置为对所述多媒体文件中与所述时段信息相对应的多媒体内容的字幕部分进行文字识别,得到字幕识别结果;
第二识别单元,被配置为对所述多媒体文件中与所述时段信息相对应的多媒体内容的语音部分进行语音识别,得到语音识别结果;以及
文本信息确定单元,被配置为根据所述字幕识别结果和所述语音识别结果,得到与所述时段信息相对应的多媒体内容的文本信息。
CN201610307489.6A 2016-05-10 2016-05-10 播放多媒体文件的方法及装置 Pending CN106021368A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610307489.6A CN106021368A (zh) 2016-05-10 2016-05-10 播放多媒体文件的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610307489.6A CN106021368A (zh) 2016-05-10 2016-05-10 播放多媒体文件的方法及装置

Publications (1)

Publication Number Publication Date
CN106021368A true CN106021368A (zh) 2016-10-12

Family

ID=57100242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610307489.6A Pending CN106021368A (zh) 2016-05-10 2016-05-10 播放多媒体文件的方法及装置

Country Status (1)

Country Link
CN (1) CN106021368A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829765A (zh) * 2018-05-29 2018-11-16 平安科技(深圳)有限公司 一种信息查询方法、装置、计算机设备及存储介质
CN108965923A (zh) * 2017-05-17 2018-12-07 北京博瑞彤芸文化传播股份有限公司 一种视音频数据的获取方法
CN109189957A (zh) * 2018-08-30 2019-01-11 维沃移动通信有限公司 一种媒体数据的处理方法及设备
CN109597898A (zh) * 2018-11-28 2019-04-09 广州讯立享智能科技有限公司 一种信息检索方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739450A (zh) * 2009-11-26 2010-06-16 北京网梯科技发展有限公司 对视频中出现的信息进行检索的方法及系统
CN103902611A (zh) * 2012-12-28 2014-07-02 鸿富锦精密工业(深圳)有限公司 视频内容搜索系统及方法
CN104462354A (zh) * 2014-12-05 2015-03-25 国家电网公司 一种具有多种检索方式的多媒体系统及处理方法
CN104572712A (zh) * 2013-10-18 2015-04-29 英业达科技有限公司 浏览多媒体文件的系统及方法
US20150169693A1 (en) * 2011-08-18 2015-06-18 Google Inc. Using pre-search triggers
CN104731944A (zh) * 2015-03-31 2015-06-24 努比亚技术有限公司 视频搜索方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739450A (zh) * 2009-11-26 2010-06-16 北京网梯科技发展有限公司 对视频中出现的信息进行检索的方法及系统
US20150169693A1 (en) * 2011-08-18 2015-06-18 Google Inc. Using pre-search triggers
CN103902611A (zh) * 2012-12-28 2014-07-02 鸿富锦精密工业(深圳)有限公司 视频内容搜索系统及方法
CN104572712A (zh) * 2013-10-18 2015-04-29 英业达科技有限公司 浏览多媒体文件的系统及方法
CN104462354A (zh) * 2014-12-05 2015-03-25 国家电网公司 一种具有多种检索方式的多媒体系统及处理方法
CN104731944A (zh) * 2015-03-31 2015-06-24 努比亚技术有限公司 视频搜索方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108965923A (zh) * 2017-05-17 2018-12-07 北京博瑞彤芸文化传播股份有限公司 一种视音频数据的获取方法
CN108829765A (zh) * 2018-05-29 2018-11-16 平安科技(深圳)有限公司 一种信息查询方法、装置、计算机设备及存储介质
WO2019227582A1 (zh) * 2018-05-29 2019-12-05 平安科技(深圳)有限公司 一种信息查询方法、装置、计算机设备及存储介质
CN109189957A (zh) * 2018-08-30 2019-01-11 维沃移动通信有限公司 一种媒体数据的处理方法及设备
CN109189957B (zh) * 2018-08-30 2022-05-31 维沃移动通信有限公司 一种媒体数据的处理方法及设备
CN109597898A (zh) * 2018-11-28 2019-04-09 广州讯立享智能科技有限公司 一种信息检索方法及装置

Similar Documents

Publication Publication Date Title
US20210056133A1 (en) Query response using media consumption history
Whittaker et al. SCANMail: a voicemail interface that makes speech browsable, readable and searchable
US7437296B2 (en) Speech recognition dictionary creation apparatus and information search apparatus
US7908141B2 (en) Extracting and utilizing metadata to improve accuracy in speech to text conversions
US7415409B2 (en) Method to train the language model of a speech recognition system to convert and index voicemails on a search engine
US9196310B2 (en) Systems and methods for indexing and searching digital video content
US7574453B2 (en) System and method for enabling search and retrieval operations to be performed for data items and records using data obtained from associated voice files
CN101202864B (zh) 动画再现装置
US8965916B2 (en) Method and apparatus for providing media content
CN106021368A (zh) 播放多媒体文件的方法及装置
CN101778233B (zh) 数据处理装置以及数据处理方法
EP1536638A1 (en) Metadata preparing device, preparing method therefor and retrieving device
CN102761668A (zh) 基于图片中的电话号码信息拨打电话的方法及装置
US8457472B2 (en) Method and apparatus for segmenting recorded news program according to topics
CN102982800A (zh) 具有影音文件处理功能的电子装置及影音文件处理方法
CN101976265A (zh) 自动判断电话号码并添加联系人的方法
US20150278248A1 (en) Personal Information Management Service System
US20080075433A1 (en) Locating digital images in a portable electronic device
JP2013069015A (ja) 情報処理装置及び情報処理プログラム
CN109299324B (zh) 一种标签式视频文件的检索方法
US20140122513A1 (en) System and method for enabling search and retrieval operations to be performed for data items and records using data obtained from associated voice files
CA2310176A1 (en) Key segment spotting in voice messages
US20160147853A1 (en) Method and system for consolidating data retrieved from different sources
JP2006340136A (ja) 映像再生方法、インデックス情報提供方法、映像再生端末、及び映像用インデックス作成検索システム
US20090164512A1 (en) Method and Computer Program Product for Managing Media Items

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161012