CN105760376B - 提取多媒体文件元信息的方法及装置 - Google Patents

提取多媒体文件元信息的方法及装置 Download PDF

Info

Publication number
CN105760376B
CN105760376B CN201410778237.2A CN201410778237A CN105760376B CN 105760376 B CN105760376 B CN 105760376B CN 201410778237 A CN201410778237 A CN 201410778237A CN 105760376 B CN105760376 B CN 105760376B
Authority
CN
China
Prior art keywords
data
multimedia file
markup language
extensible markup
language format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410778237.2A
Other languages
English (en)
Other versions
CN105760376A (zh
Inventor
陈伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen TCL Digital Technology Co Ltd
Original Assignee
Shenzhen TCL Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen TCL Digital Technology Co Ltd filed Critical Shenzhen TCL Digital Technology Co Ltd
Priority to CN201410778237.2A priority Critical patent/CN105760376B/zh
Priority to PCT/CN2014/094239 priority patent/WO2016095166A1/zh
Publication of CN105760376A publication Critical patent/CN105760376A/zh
Application granted granted Critical
Publication of CN105760376B publication Critical patent/CN105760376B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种提取多媒体文件元信息的方法,包括:在读取多媒体文件数据、将多媒体文件数据中的音视频数据及描述数据进行分离、对分离出的音视频数据及描述数据进行解析的同时,对多媒体文件数据中的描述数据进行提取;将提取的描述数据转换为可扩展标记语言格式信息,并将可扩展标记语言格式信息发送至创建的消息总线;根据消息总线接收的可扩展标记语言格式信息生成多媒体文件元信息。本发明还公开了一种提取多媒体文件元信息的装置。本发明对元信息提取效率更高,且生成的多媒体文件元信息为可扩展标记语言格式,可扩展性更好。

Description

提取多媒体文件元信息的方法及装置
技术领域
本发明涉及多媒体技术领域,尤其涉及一种提取多媒体文件元信息的方法及装置。
背景技术
多媒体文件里除了占用大部分空间的音视频数据外,还有一些描述音视频数据的信息,称作元信息。多媒体文件的元信息大体上可以分成两类,第一类属于对音视频数据的关键描述信息,用于音视频数据的解码或者编码,例如音视频数据的编码格式、容器格式、视频宽高、音频采样率等,第二类无关解码和编码,仅起辅助性的描述说明作用,例如视频标题、演员和制作日期信息等。上述两类元信息对于信息解码编码和检索来说非常重要,因此,在要进行信息解码编码和检索时,需要快速的对多媒体文件中的元信息进行提取,但是由于多媒体文件中的元信息格式繁多,没有统一的标准进行说明,而且元信息可能杂乱的散落在多媒体文件中的各个位置,目前常用的顺序提取多媒体文件元信息的方法效率很低,提取元信息的速度非常缓慢,且提取的元信息格式不统一,不利于后续操作的调用及扩展。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种提取多媒体文件元信息的方法及装置,以解决现有提取元信息的速度缓慢、提取的元信息可扩展性不高的技术问题。
为实现上述目的,本发明提供的一种提取多媒体文件元信息的方法,所述方法包括以下步骤:
在读取多媒体文件数据、将多媒体文件数据中的音视频数据及描述数据进行分离、对分离出的音视频数据及描述数据进行解析的同时,对多媒体文件数据中的描述数据进行提取;
将提取的描述数据转换为可扩展标记语言格式信息,并将所述可扩展标记语言格式信息发送至创建的消息总线;
根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息。
优选地,所述对分离出的音视频数据及描述数据进行解析的步骤包括:对分离出的音视频数据及描述数据中的视频格式数据、音频格式数据及字幕格式数据进行解析。
优选地,所述将提取的描述数据转换为可扩展标记语言格式信息,并将所述可扩展标记语言格式信息发送至创建的消息总线的步骤包括:
将提取的描述数据按不同格式对应进行名称统一,并将统一名称后的描述数据转换为可扩展标记语言格式信息,将所述可扩展标记语言格式信息发送至创建的消息总线。
优选地,所述将提取的描述数据转换为可扩展标记语言格式信息,并将所述可扩展标记语言格式信息发送至创建的消息总线的步骤包括:
将提取的描述数据转换为可扩展标记语言格式信息后,通过竞争读写消息总线权利的方式将转换的可扩展标记语言格式信息发送至创建的消息总线。
优选地,所述根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息的步骤包括:将消息总线接收的若干可扩展标记语言格式信息进行整合,形成一个完整的可扩展标记语言格式信息,该完整的可扩展标记语言格式信息即为最终生成的多媒体文件元信息。
优选地,所述根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息的步骤之前还包括:
当超过设定的预设时间或所述消息总线判断接收到出错信息、结束信息时,停止对多媒体文件数据中的描述数据的提取进程。
此外,为实现上述目的,本发明还提供一种提取多媒体文件元信息的装置,所述装置包括:
提取模块,用于在读取多媒体文件数据、将多媒体文件数据中的音视频数据及描述数据进行分离、对分离出的音视频数据及描述数据进行解析的同时,对多媒体文件数据中的描述数据进行提取;
发送模块,用于将提取的描述数据转换为可扩展标记语言格式信息,并将所述可扩展标记语言格式信息发送至创建的消息总线;
生成模块,用于根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息。
优选地,所述提取模块还用于:对分离出的音视频数据及描述数据中的视频格式数据、音频格式数据及字幕格式数据进行解析。
优选地,所述发送模块还用于:
将提取的描述数据按不同格式对应进行名称统一,并将统一名称后的描述数据转换为可扩展标记语言格式信息,将所述可扩展标记语言格式信息发送至创建的消息总线。
优选地,所述发送模块还用于:
将提取的描述数据转换为可扩展标记语言格式信息后,通过竞争读写消息总线权利的方式将转换的可扩展标记语言格式信息发送至创建的消息总线。
优选地,所述装置还包括:
停止模块,用于当超过设定的预设时间或所述消息总线判断接收到出错信息、结束信息时,停止对多媒体文件数据中的描述数据的提取进程。
本发明提出的一种提取多媒体文件元信息的方法及装置,在读取多媒体文件数据、将多媒体文件数据中的音视频数据及描述数据进行分离、对分离出的音视频数据及描述数据进行解析的同时,对多媒体文件数据中的描述数据进行提取,这样,实现了对描述数据的异步并发提取,效率更高,避免了顺序提取时任一环节阻塞就会影响提取描述数据的情况发生,而且,最终生成的多媒体文件元信息是综合由提取的描述数据转换成的可扩展标记语言格式信息得到的,即最终生成的多媒体文件元信息为可扩展标记语言格式,使得生成的多媒体文件元信息的可扩展性更好,更加灵活。
附图说明
图1为本发明提取多媒体文件元信息的方法第一实施例的流程示意图;
图2为本发明提取多媒体文件元信息的方法第二实施例的流程示意图;
图3为本发明提取多媒体文件元信息的装置第一实施例的功能模块示意图;
图4为本发明提取多媒体文件元信息的装置第二实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种提取多媒体文件元信息的方法。
参照图1,图1为本发明提取多媒体文件元信息的方法第一实施例的流程示意图。
在第一实施例中,该提取多媒体文件元信息的方法包括:
步骤S10,在读取多媒体文件数据、将多媒体文件数据中的音视频数据及描述数据进行分离、对分离出的音视频数据及描述数据进行解析的同时,对多媒体文件数据中的描述数据进行提取;
本实施例中,在读取多媒体文件数据、将多媒体文件数据中的音视频数据及描述数据进行分离、对分离出的音视频数据及描述数据进行解析的同时,对多媒体文件数据中的描述数据进行提取,以实现对描述数据的异步并发提取,效率更高,避免了顺序提取时任一环节阻塞就会影响提取描述数据的情况发生。
需要说明的是,为了便于说明,本实施例中仅以协议处理模块读取多媒体文件数据、解复用模块将多媒体文件数据中的音视频数据及描述数据进行分离、剖析器对分离出的音视频数据及描述数据进行解析的同时,通过协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据进行提取为例进行说明,当然,也不限定通过其他处理模块来实现上述功能。
协议处理模块用于读取需要提取元信息的多媒体文件数据,其中,多媒体文件数据包括本地多媒体文件数据或网络在线多媒体文件数据;解复用模块用于将协议处理模块读取的多媒体文件数据进行分离,将多媒体文件数据中的音视频数据及描述数据如字幕数据等进行分离,并将分离的数据以帧的形式传送至剖析器中;剖析器用于对分离出的音视频数据及描述数据进行解析,从而最终将多媒体文件数据解析成各种不同格式的数据,其中,本实施例中,所述剖析器包括但不限于:解析视频格式数据的剖析器、解析音频格式数据的剖析器及解析字幕格式数据的剖析器。
由于多媒体文件中的描述数据在多媒体文件中的分布位置是散落无序的,可能散落在多媒体文件数据中音视频数据块里面,也可能散落在多媒体文件数据中音视频数据块之外的位置。因此,在协议处理模块读取多媒体文件数据、解复用模块将多媒体文件数据中的音视频数据及描述数据进行分离、剖析器对分离出的音视频数据及描述数据进行解析的处理过程中,协议处理模块、解复用模块、剖析器均有可能获取到多媒体文件数据中的描述数据,若完全依照协议处理模块、解复用模块、剖析器的处理顺序,直到剖析器全面解析完多媒体文件数据之后,才提取多媒体文件数据中的描述数据作为元信息,不仅会导致提取效率很低,而且如果协议处理模块、解复用模块、剖析器中任一模块出现处理出错或网络阻塞的情况,则会更加拖慢提取多媒体文件数据中描述数据的速度。因此,本实施例中,在协议处理模块读取多媒体文件数据、解复用模块将多媒体文件数据中的音视频数据及描述数据进行分离、剖析器对分离出的音视频数据及描述数据进行解析的同时,通过协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据进行提取;即协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据的提取不是顺序进行的,而是异步并发进行,在协议处理模块、解复用模块、剖析器对多媒体文件数据进行处理的过程中,只要协议处理模块、解复用模块、剖析器读取到多媒体文件数据中的描述数据,协议处理模块、解复用模块、剖析器中任一模块均可对多媒体文件数据中的描述数据进行提取,这样,极大地提升了对多媒体文件数据中的描述数据提取的效率,且各个模块对多媒体文件数据中的描述数据的提取相对独立,避免了顺序提取时任一环节阻塞就会影响提取描述数据的情况发生,进一步地提高了描述数据的提取速度。
步骤S20,将提取的描述数据转换为可扩展标记语言格式信息,并将所述可扩展标记语言格式信息发送至创建的消息总线;
协议处理模块、解复用模块、剖析器提取到多媒体文件数据中的描述数据后,将提取的描述数据转换为可扩展标记语言格式信息,可扩展标记语言可以用来标记数据、定义数据类型,非常适合万维网传输,将提取的描述数据转换为可扩展标记语言格式信息有利于对其后续进行传输及应用。同时,为了实现协议处理模块、解复用模块、剖析器中任一模块均可对多媒体文件数据中的描述数据进行提取,创建消息总线,使得协议处理模块、解复用模块、剖析器中任一模块在提取到多媒体文件数据中的描述数据,并将提取的描述数据转换为可扩展标记语言格式信息后,均可将转换的可扩展标记语言格式信息发送至创建的消息总线,即协议处理模块、解复用模块、剖析器共享该消息总线,实现了协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据提取的异步并发进行。其中,本实施例中,协议处理模块、解复用模块、剖析器中任一模块将提取的描述数据转换为可扩展标记语言格式信息后,协议处理模块、解复用模块、剖析器可通过竞争读写消息总线权利的方式将转换的可扩展标记语言格式信息发送至创建的消息总线,这样,使消息总线的资源得到了充分利用,进一步提升了对多媒体文件数据中的描述数据提取的效率,当然,也不限定协议处理模块、解复用模块、剖析器通过其他读写消息总线的方式来对多媒体文件数据中的描述数据进行异步并发提取。
步骤S30,根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息。
当协议处理模块、解复用模块、剖析器中任一模块提取到多媒体文件数据中的描述数据,并将提取的描述数据转换为可扩展标记语言格式信息发送至创建的消息总线后,将消息总线接收的若干可扩展标记语言格式信息进行整合,最后形成一个完整的可扩展标记语言格式信息,该完整的可扩展标记语言格式信息即为最终生成的多媒体文件元信息,包含了多媒体文件的描述数据的信息,供后续进行信息解码编码和检索时调用,由于生成的多媒体文件元信息为可扩展标记语言格式,可以根据需要灵活的进行扩展,且能更加方便的进行传输,更加有利于后续的调用等操作。在本实施例中,所述可扩展标记语言格式信息即为xml格式信息。最终生成的多媒体文件元信息是将消息总线接收到的若干xml格式信息进行整合得到的完整的xml格式信息。
本实施例中在读取多媒体文件数据、将多媒体文件数据中的音视频数据及描述数据进行分离、对分离出的音视频数据及描述数据进行解析的同时,对多媒体文件数据中的描述数据进行提取,这样,实现了对描述数据的异步并发提取,效率更高,避免了顺序提取时任一环节阻塞就会影响提取描述数据的情况发生,而且,最终生成的多媒体文件元信息是综合由提取的描述数据转换成的可扩展标记语言格式信息得到的,即最终生成的多媒体文件元信息为可扩展标记语言格式,使得生成的多媒体文件元信息的可扩展性更好,更加灵活。
进一步地,在其他实施例中,上述步骤S20可以包括:
将提取的描述数据按不同格式对应进行名称统一,并将统一名称后的描述数据转换为可扩展标记语言格式信息,将所述可扩展标记语言格式信息发送至创建的消息总线。
协议处理模块、解复用模块、剖析器提取到多媒体文件数据中的描述数据后,由于多媒体文件数据中的描述数据没有统一的命名标准,如mp3类型的多媒体文件数据中标题使用名称TIT2,而MKV类型的多媒体文件数据中标题使用名称Title,这就导致了提取的描述数据中包含有各种各样的名称,因此,有必要进行统一标准化命名,各种格式对应采用统一的名称,即对提取的描述数据按不同格式对应进行名称统一,这样,有利于将统一名称后的描述数据转换为可扩展标记语言格式信息,将所述可扩展标记语言格式信息发送至创建的消息总线。根据统一名称后的描述数据转换的可扩展标记语言格式信息可扩展性更高,更加方便进行不同模块之间的发送和接收。
参照图2,图2为本发明提取多媒体文件元信息的方法第二实施例的流程示意图。
在上述第一实施例的基础上,在上述步骤S30之前还包括:
步骤S40,当超过设定的预设时间或所述消息总线判断接收到出错信息、结束信息时,停止对多媒体文件数据中的描述数据的提取进程。
本实施例与上述第一实施例的区别在于,本实施例还包括当超过设定的预设时间或所述消息总线判断接收到出错信息、结束信息时,停止对多媒体文件数据中的描述数据的提取进程的操作。
本实施例中,在根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息之前,考虑到在对网络在线多媒体文件数据中的元信息进行提取时,可能会出现网络延时造成数据传输阻塞的情况发生,预先设定一预设时间,当超过设定的预设时间时,停止协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据的提取进程,所述消息总线即停止接收所述可扩展标记语言格式信息,结束协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据的提取,以避免网络延时造成长时间等待的情况,更加灵活。且在根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息之前,对所述消息总线接收的消息进行分析判断,若判断所述消息总线接收到出错信息或结束信息,则获知协议处理模块、解复用模块、剖析器在提取描述数据的过程中出错或提取已结束,则停止协议处理模块、解复用模块、剖析器中所有模块对多媒体文件数据中描述数据的提取进程,所述消息总线无需继续等待接收协议处理模块、解复用模块、剖析器发送消息,直接根据所述消息总线上已接收到的所述可扩展标记语言格式信息生成多媒体文件元信息,这样,避免了协议处理模块、解复用模块、剖析器在提取描述数据的过程中出错或提取进程已结束的情况下,所述消息总线浪费时间继续等待接收消息,进一步地提升了提取多媒体文件元信息的效率及速度。
本发明进一步提供一种提取多媒体文件元信息的装置。
参照图3,图3为本发明提取多媒体文件元信息的装置第一实施例的功能模块示意图。
在第一实施例中,该提取多媒体文件元信息的装置包括:
提取模块01,用于在读取多媒体文件数据、将多媒体文件数据中的音视频数据及描述数据进行分离、对分离出的音视频数据及描述数据进行解析的同时,对多媒体文件数据中的描述数据进行提取;
本实施例中,提取模块01在读取多媒体文件数据、将多媒体文件数据中的音视频数据及描述数据进行分离、对分离出的音视频数据及描述数据进行解析的同时,对多媒体文件数据中的描述数据进行提取,以实现对描述数据的异步并发提取,效率更高,避免了顺序提取时任一环节阻塞就会影响提取描述数据的情况发生。
需要说明的是,为了便于说明,本实施例中仅以提取模块01包括协议处理模块、解复用模块及剖析器这三个分支处理模块为例进行说明,即协议处理模块读取多媒体文件数据、解复用模块将多媒体文件数据中的音视频数据及描述数据进行分离、剖析器对分离出的音视频数据及描述数据进行解析的同时,通过协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据进行提取为例进行说明,当然,也不限定提取模块01包括其他处理模块或提取模块01自身单独来实现上述功能。
本实施例中,协议处理模块用于读取需要提取元信息的多媒体文件数据,其中,多媒体文件数据包括本地多媒体文件数据或网络在线多媒体文件数据;解复用模块用于将协议处理模块读取的多媒体文件数据进行分离,将多媒体文件数据中的音视频数据及描述数据如字幕数据等进行分离,并将分离的数据以帧的形式传送至剖析器中;剖析器用于对分离出的音视频数据及描述数据进行解析,从而最终将多媒体文件数据解析成各种不同格式的数据,其中,本实施例中,所述剖析器包括但不限于:解析视频格式数据的剖析器、解析音频格式数据的剖析器及解析字幕格式数据的剖析器。
由于多媒体文件中的描述数据在多媒体文件中的分布位置是散落无序的,可能散落在多媒体文件数据中音视频数据块里面,也可能散落在多媒体文件数据中音视频数据块之外的位置。因此,在协议处理模块读取多媒体文件数据、解复用模块将多媒体文件数据中的音视频数据及描述数据进行分离、剖析器对分离出的音视频数据及描述数据进行解析的处理过程中,协议处理模块、解复用模块、剖析器均有可能获取到多媒体文件数据中的描述数据,若完全依照协议处理模块、解复用模块、剖析器的处理顺序,直到剖析器全面解析完多媒体文件数据之后,才提取多媒体文件数据中的描述数据作为元信息,不仅会导致提取效率很低,而且如果协议处理模块、解复用模块、剖析器中任一模块出现处理出错或网络阻塞的情况,则会更加拖慢提取多媒体文件数据中描述数据的速度。因此,本实施例中,在协议处理模块读取多媒体文件数据、解复用模块将多媒体文件数据中的音视频数据及描述数据进行分离、剖析器对分离出的音视频数据及描述数据进行解析的同时,通过协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据进行提取;即协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据的提取不是顺序进行的,而是异步并发进行,在协议处理模块、解复用模块、剖析器对多媒体文件数据进行处理的过程中,只要协议处理模块、解复用模块、剖析器读取到多媒体文件数据中的描述数据,协议处理模块、解复用模块、剖析器中任一模块均可对多媒体文件数据中的描述数据进行提取,这样,极大地提升了对多媒体文件数据中的描述数据提取的效率,且各个模块对多媒体文件数据中的描述数据的提取相对独立,避免了顺序提取时任一环节阻塞就会影响提取描述数据的情况发生,进一步地提高了描述数据的提取速度。
发送模块02,用于将提取的描述数据转换为可扩展标记语言格式信息,并将所述可扩展标记语言格式信息发送至创建的消息总线;
协议处理模块、解复用模块、剖析器提取到多媒体文件数据中的描述数据后,将提取的描述数据转换为可扩展标记语言格式信息,可扩展标记语言可以用来标记数据、定义数据类型,非常适合万维网传输,将提取的描述数据转换为可扩展标记语言格式信息有利于对其后续进行传输及应用。同时,为了实现协议处理模块、解复用模块、剖析器中任一模块均可对多媒体文件数据中的描述数据进行提取,创建消息总线,使得协议处理模块、解复用模块、剖析器中任一模块在提取到多媒体文件数据中的描述数据,并将提取的描述数据转换为可扩展标记语言格式信息后,均可将转换的可扩展标记语言格式信息发送至创建的消息总线,即协议处理模块、解复用模块、剖析器共享该消息总线,实现了协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据提取的异步并发进行。其中,本实施例中,协议处理模块、解复用模块、剖析器中任一模块将提取的描述数据转换为可扩展标记语言格式信息后,协议处理模块、解复用模块、剖析器可通过竞争读写消息总线权利的方式将转换的可扩展标记语言格式信息发送至创建的消息总线,这样,使消息总线的资源得到了充分利用,进一步提升了对多媒体文件数据中的描述数据提取的效率,当然,也不限定协议处理模块、解复用模块、剖析器通过其他读写消息总线的方式来对多媒体文件数据中的描述数据进行异步并发提取。
生成模块03,用于根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息。
当协议处理模块、解复用模块、剖析器中任一模块提取到多媒体文件数据中的描述数据,并将提取的描述数据转换为可扩展标记语言格式信息发送至创建的消息总线后,将消息总线接收的若干可扩展标记语言格式信息进行整合,最后形成一个完整的可扩展标记语言格式信息,该完整的可扩展标记语言格式信息即为最终生成的多媒体文件元信息,包含了多媒体文件的描述数据的信息,供后续进行信息解码编码和检索时调用,由于生成的多媒体文件元信息为可扩展标记语言格式,可以根据需要灵活的进行扩展,且能更加方便的进行传输,更加有利于后续的调用等操作。
本实施例中在读取多媒体文件数据、将多媒体文件数据中的音视频数据及描述数据进行分离、对分离出的音视频数据及描述数据进行解析的同时,对多媒体文件数据中的描述数据进行提取,这样,实现了对描述数据的异步并发提取,效率更高,避免了顺序提取时任一环节阻塞就会影响提取描述数据的情况发生,而且,最终生成的多媒体文件元信息是综合由提取的描述数据转换成的可扩展标记语言格式信息得到的,即最终生成的多媒体文件元信息为可扩展标记语言格式,使得生成的多媒体文件元信息的可扩展性更好,更加灵活。
进一步地,在其他实施例中,上述发送模块02还用于:
将提取的描述数据按不同格式对应进行名称统一,并将统一名称后的描述数据转换为可扩展标记语言格式信息,将所述可扩展标记语言格式信息发送至创建的消息总线。
协议处理模块、解复用模块、剖析器提取到多媒体文件数据中的描述数据后,由于多媒体文件数据中的描述数据没有统一的命名标准,如mp3类型的多媒体文件数据中标题使用名称TIT2,而MKV类型的多媒体文件数据中标题使用名称Title,这就导致了提取的描述数据中包含有各种各样的名称,因此,有必要进行统一标准化命名,各种格式对应采用统一的名称,即对提取的描述数据按不同格式对应进行名称统一,这样,有利于将统一名称后的描述数据转换为可扩展标记语言格式信息,将所述可扩展标记语言格式信息发送至创建的消息总线。根据统一名称后的描述数据转换的可扩展标记语言格式信息可扩展性更高,更加方便进行不同模块之间的发送和接收。
参照图4,图4为本发明提取多媒体文件元信息的装置第二实施例的流程示意图。
在上述第一实施例的基础上,该提取多媒体文件元信息的装置还包括:
停止模块04,用于当超过设定的预设时间或所述消息总线判断接收到出错信息、结束信息时,停止对多媒体文件数据中的描述数据的提取进程。
本实施例与上述第一实施例的区别在于,本实施例还包括当超过设定的预设时间或所述消息总线判断接收到出错信息、结束信息时,停止协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据的提取进程的操作。
本实施例中,在根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息之前,考虑到在对网络在线多媒体文件数据中的元信息进行提取时,可能会出现网络延时造成数据传输阻塞的情况发生,预先设定一预设时间,当超过设定的预设时间时,停止协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据的提取进程,所述消息总线即停止接收所述可扩展标记语言格式信息,结束协议处理模块、解复用模块、剖析器对多媒体文件数据中的描述数据的提取,以避免网络延时造成长时间等待的情况,更加灵活。且在根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息之前,对所述消息总线接收的消息进行分析判断,若判断所述消息总线接收到出错信息或结束信息,则获知协议处理模块、解复用模块、剖析器在提取描述数据的过程中出错或提取已结束,则停止协议处理模块、解复用模块、剖析器中所有模块对多媒体文件数据中描述数据的提取进程,所述消息总线无需继续等待接收协议处理模块、解复用模块、剖析器发送消息,直接根据所述消息总线上已接收到的所述可扩展标记语言格式信息生成多媒体文件元信息,这样,避免了协议处理模块、解复用模块、剖析器在提取描述数据的过程中出错或提取进程已结束的情况下,所述消息总线浪费时间继续等待接收消息,进一步地提升了提取多媒体文件元信息的效率及速度。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (11)

1.一种提取多媒体文件元信息的方法,其特征在于,所述方法包括以下步骤:
在读取多媒体文件数据、将多媒体文件数据中的音视频数据及描述数据进行分离、对分离出的音视频数据及描述数据以帧的形式进行解析的同时,对多媒体文件数据中的描述数据进行提取;
将提取的描述数据转换为可扩展标记语言格式信息,并将所述可扩展标记语言格式信息发送至创建的消息总线;
根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息。
2.如权利要求1所述的提取多媒体文件元信息的方法,其特征在于,所述对分离出的音视频数据及描述数据进行解析的步骤包括:对分离出的音视频数据及描述数据中的视频格式数据、音频格式数据及字幕格式数据进行解析。
3.如权利要求1所述的提取多媒体文件元信息的方法,其特征在于,所述将提取的描述数据转换为可扩展标记语言格式信息,并将所述可扩展标记语言格式信息发送至创建的消息总线的步骤包括:
将提取的描述数据按不同格式对应进行名称统一,并将统一名称后的描述数据转换为可扩展标记语言格式信息,将所述可扩展标记语言格式信息发送至创建的消息总线。
4.如权利要求1所述的提取多媒体文件元信息的方法,其特征在于,所述将提取的描述数据转换为可扩展标记语言格式信息,并将所述可扩展标记语言格式信息发送至创建的消息总线的步骤包括:
将提取的描述数据转换为可扩展标记语言格式信息后,通过竞争读写消息总线权利的方式将转换的可扩展标记语言格式信息发送至创建的消息总线。
5.如权利要求1所述的提取多媒体文件元信息的方法,其特征在于,所述根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息的步骤包括:将消息总线接收的若干可扩展标记语言格式信息进行整合,形成一个完整的可扩展标记语言格式信息,该完整的可扩展标记语言格式信息即为最终生成的多媒体文件元信息。
6.如权利要求1至5中任意一项所述的提取多媒体文件元信息的方法,其特征在于,所述根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息的步骤之前还包括:
当超过设定的预设时间或所述消息总线判断接收到出错信息、结束信息时,停止对多媒体文件数据中的描述数据的提取进程。
7.一种提取多媒体文件元信息的装置,其特征在于,所述装置包括:
提取模块,用于在读取多媒体文件数据、将多媒体文件数据中的音视频数据及描述数据进行分离、对分离出的音视频数据及描述数据以帧的形式进行解析的同时,对多媒体文件数据中的描述数据进行提取;
发送模块,用于将提取的描述数据转换为可扩展标记语言格式信息,并将所述可扩展标记语言格式信息发送至创建的消息总线;
生成模块,用于根据所述消息总线接收的所述可扩展标记语言格式信息生成多媒体文件元信息。
8.如权利要求7所述的装置,其特征在于,所述提取模块还用于:对分离出的音视频数据及描述数据中的视频格式数据、音频格式数据及字幕格式数据进行解析。
9.如权利要求7所述的装置,其特征在于,所述发送模块还用于:
将提取的描述数据按不同格式对应进行名称统一,并将统一名称后的描述数据转换为可扩展标记语言格式信息,将所述可扩展标记语言格式信息发送至创建的消息总线。
10.如权利要求7所述的装置,其特征在于,所述发送模块还用于:
将提取的描述数据转换为可扩展标记语言格式信息后,通过竞争读写消息总线权利的方式将转换的可扩展标记语言格式信息发送至创建的消息总线。
11.如权利要求7至10中任意一项所述的装置,其特征在于,还包括:
停止模块,用于当超过设定的预设时间或所述消息总线判断接收到出错信息、结束信息时,停止对多媒体文件数据中的描述数据的提取进程。
CN201410778237.2A 2014-12-15 2014-12-15 提取多媒体文件元信息的方法及装置 Active CN105760376B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410778237.2A CN105760376B (zh) 2014-12-15 2014-12-15 提取多媒体文件元信息的方法及装置
PCT/CN2014/094239 WO2016095166A1 (zh) 2014-12-15 2014-12-18 提取多媒体文件元信息的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410778237.2A CN105760376B (zh) 2014-12-15 2014-12-15 提取多媒体文件元信息的方法及装置

Publications (2)

Publication Number Publication Date
CN105760376A CN105760376A (zh) 2016-07-13
CN105760376B true CN105760376B (zh) 2019-04-02

Family

ID=56125628

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410778237.2A Active CN105760376B (zh) 2014-12-15 2014-12-15 提取多媒体文件元信息的方法及装置

Country Status (2)

Country Link
CN (1) CN105760376B (zh)
WO (1) WO2016095166A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106961626B (zh) * 2017-03-13 2020-02-11 福州瑞芯微电子股份有限公司 一种视频元信息自动补全整理的方法和装置
CN108055507A (zh) * 2017-12-19 2018-05-18 四川九洲电器集团有限责任公司 一种用于视频分析系统通信的数据组包方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020103920A1 (en) * 2000-11-21 2002-08-01 Berkun Ken Alan Interpretive stream metadata extraction
EP1349080A1 (en) * 2002-03-26 2003-10-01 Deutsche Thomson-Brandt Gmbh Methods and apparatus for using metadata from different sources
WO2008048067A1 (en) * 2006-10-19 2008-04-24 Lg Electronics Inc. Encoding method and apparatus and decoding method and apparatus
CN101187938B (zh) * 2007-11-09 2010-12-08 中国传媒大学 一种多媒体元数据统一描述及检索方法
CN102026022A (zh) * 2009-09-14 2011-04-20 展讯通信(上海)有限公司 Cmmb手机电视的终端多模式处理方法及其处理终端
US8849930B2 (en) * 2010-06-16 2014-09-30 Sony Corporation User-based semantic metadata for text messages
CN102387177B (zh) * 2010-09-01 2015-05-06 腾讯科技(深圳)有限公司 影音文件的下载方法及装置
CN102541889A (zh) * 2010-12-21 2012-07-04 新奥特(北京)视频技术有限公司 一种非结构化媒体数据存储方式的方法
TWI476761B (zh) * 2011-04-08 2015-03-11 Dolby Lab Licensing Corp 用以產生可由實施不同解碼協定之解碼器所解碼的統一位元流之音頻編碼方法及系統

Also Published As

Publication number Publication date
CN105760376A (zh) 2016-07-13
WO2016095166A1 (zh) 2016-06-23

Similar Documents

Publication Publication Date Title
CN109036417B (zh) 用于处理语音请求的方法和装置
Schröder The SEMAINE API: Towards a Standards‐Based Framework for Building Emotion‐Oriented Systems
CN104735468B (zh) 一种基于语义分析将图像合成新视频的方法及系统
CN102065234B (zh) 基于分布式字幕处理系统的字幕制播方法及系统
KR20180129486A (ko) 외국어학습을 위한 청크단위 분리 규칙과 핵심어 자동 강세 표시 구현 방법 및 시스템
RU2616552C2 (ru) Приемное устройство и способ управления им, устройство и способ распределения, программа и система распределения
JP2002366964A (ja) 動画作成方法およびシステム
KR20060122265A (ko) 확장형 자막 파일을 이용하여 부가정보를 제공하는 장치 및방법
TW200821862A (en) RSS content administration for rendering RSS content on a digital audio player
RU2003134278A (ru) Способ и считываемый компьютером носитель для импорта и экспорта иерархически структурированных данных
CN113035199B (zh) 音频处理方法、装置、设备及可读存储介质
CN102402432A (zh) 用于产生多国语言网页的方法
CN109410953A (zh) 一种多媒体竖式播放系统
CN105760376B (zh) 提取多媒体文件元信息的方法及装置
US9666211B2 (en) Information processing apparatus, information processing method, display control apparatus, and display control method
CN106550268B (zh) 视频处理方法和视频处理装置
CN109858005B (zh) 基于语音识别的文档更新方法、装置、设备及存储介质
WO2015019774A1 (ja) データ生成装置、データ生成方法、翻訳処理装置、プログラム、およびデータ
CN103902529A (zh) 外语自动实时标注中外文字幕音像录播方法
CN113380229B (zh) 语音响应速度确定方法、相关装置及计算机程序产品
CN113032538A (zh) 一种基于知识图谱的话题转移方法、控制器及存储介质
KR20060088175A (ko) 멀티 포맷을 갖는 전자책 파일 생성 방법 및 시스템
CN104768083B (zh) 一种章节内容展示的视频播放方法及装置
EP3171610B1 (en) Transmission device, transmission method, reception device, and reception method
CN109241331A (zh) 一种面向智能机器人的故事数据处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant