CN1991821A - 文件格式识别系统及方法 - Google Patents

文件格式识别系统及方法 Download PDF

Info

Publication number
CN1991821A
CN1991821A CN 200510097569 CN200510097569A CN1991821A CN 1991821 A CN1991821 A CN 1991821A CN 200510097569 CN200510097569 CN 200510097569 CN 200510097569 A CN200510097569 A CN 200510097569A CN 1991821 A CN1991821 A CN 1991821A
Authority
CN
China
Prior art keywords
file
document
parameter
database
processing parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200510097569
Other languages
English (en)
Other versions
CN100447783C (zh
Inventor
邱全成
谭雪峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CNB2005100975695A priority Critical patent/CN100447783C/zh
Publication of CN1991821A publication Critical patent/CN1991821A/zh
Application granted granted Critical
Publication of CN100447783C publication Critical patent/CN100447783C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

一种文件格式识别系统及方法,该文件格式识别系统及方法应用在数据处理装置中,通过建立对应不同文件格式的文件格式定义参数,以及对应该文件格式定义参数的处理参数数据库,当文件输入该数据处理装置时,在该输入文件的预定范围内判断符合该文件格式定义参数的编码是否存在,如果该文件格式定义参数存在,则进一步判断该输入文件是否存在相对应的该处理参数,如果相对应的该处理参数存在,则定义该输入文件的格式与处理参数。本发明的文件格式识别系统及方法,通过该数据库与对比机制,能实现正确识别文件格式及其处理参数的目的。

Description

文件格式识别系统及方法
技术领域
本发明是关于一种数据处理技术,特别是关于一种应用在数据处理装置的文件格式识别系统及方法。
背景技术
随着数字技术不断进步,用户可以在个人计算机等数据处理装置上处理文字、图像、声音以及视频数据。虽然数据处理装置的硬件不断升级,网络带宽也不断增加,文件运行或通过网络传输的速度与日俱增。但如何通过数据压缩等技术,在不影响文件原始质量的前提下,将文件大小尽可能压缩,仍然是相关技术领域要解决的课题。
以多媒体文件压缩格式为例,其可包括MPEG-1、MPEG-2与MPEG-4等压缩格式。随着文件格式的多样化,在用户运行这些文件的过程中会遇到一些问题。例如,当用户开启文件时,常常会发生操作系统找不到用什么应用程序运行的问题。面对这种情况,用户通常必须在原有应用程序中外挂其它编译码程序或是安装专门运行该文件的应用程序才能运行。由于网络的普及,通过网络搜索、下载以及安装这些外挂应用程序并不困难。但是,用户必须先确定该文件的格式,如果无法知道该文件的正确格式,则无法取得正确的外挂应用程序或专门的应用程序。如果用户对计算机操作或是与计算机相关的软硬件信息不很了解,要正确运行未知格式的文件,就更加困难。
另外,即使文件有扩展名供用户参考,但文件的扩展名极易被修改。例如,用户可以将扩展名.AVI修改为.MP3,则其它用户在执行时,操作系统会将其视为MP3格式的文件运行,但该文件实际上是AVI格式,如果播放MP3的应用程序并不支持AVI格式时,可能会出现应用程序无法运行的情况,主要原因在于现有文件格式识别技术仅以扩展名为判断标准。
另外,即使扩展名相同的文件,也可能发生相应的处理参数不同而无法运行的情况。例如,Xvid格式的文件通常使用在DVD格式影音文件的压缩,而Xvid持续有不同的版本出现,而编译码的参数也有所不同,相同的DVD影音文件基于不同的压缩率可能出现分辨率及/或音频等处理参数的差异。这样,虽然能识别出正确的扩展名,但是如果无法正确识别出处理参数,通过正确的应用程序运行,用户的不便仍没有得到解决。
因此,如何提供一种能够正确识别文件格式及其相对应的处理参数,调用相应的应用程序运行,已成为目前亟待解决的问题。
发明内容
为克服上述现有技术的问题,本发明的主要目的在于提供一种能够正确识别文件格式的文件格式识别系统及方法。
本发明的另一目的在于提供一种能够正确识别处理参数的文件格式识别系统及方法。
为实现上述及其它目的,本发明的文件格式识别系统应用在数据处理装置中,该文件格式识别系统包括:数据库,存储对应不同文件格式的文件格式定义参数,以及对应该文件格式定义参数的处理参数;以及对比模块,当文件输入该数据处理装置时,在该输入文件的预定范围内判断该数据库中存储的文件格式定义参数是否存在,并在对比出该文件格式定义参数后,在该输入文件的预定范围内判断该数据库中存储的处理参数是否存在,并根据对比的结果定义该输入文件的格式。
该文件格式识别系统包括还包括:输入模块,接收用户输入到该数据处理装置的文件格式定义参数,以及对应该文件格式定义参数的处理参数,并将该定义参数与处理参数存储到该数据库。
该文件格式识别系统包括还包括:驱动模块,根据定义的输入文件格式驱动相对应的应用程序执行该输入文件。
通过上述本发明的文件格式识别系统,执行本发明的文件格式识别方法,该文件格式识别方法包括:建立存储对应不同文件格式的文件格式定义参数,以及对应该文件格式定义参数的处理参数数据库;当文件输入该数据处理装置时,在该输入文件的预定范围内判断该数据库存储的文件格式定义参数是否存在;当对比出该文件格式定义参数后,在该输入文件的预定范围内判断该数据库存储的处理参数是否存在;以及当该处理参数存在时,根据该文件格式定义参数与处理参数定义该输入文件的格式。
该文件格式识别方法还包括:接收用户输入到该数据处理装置的文件格式定义参数,以及对应该文件格式定义参数的处理参数,并将该定义参数与处理参数存储到该数据库。
该文件格式识别方法还包括:根据该定义的输入文件格式驱动相对应的应用程序执行该输入文件。
与现有的文件识别技术相比,本发明的文件格式识别系统及方法,通过该数据库与对比机制,能实现正确识别文件格式及其处理参数的目的。
附图说明
图1是本发明的文件格式识别系统的应用结构示意图;以及
图2是本发明的文件格式识别方法执行时的流程图。
具体实施方式
实施例
图1是本发明的文件格式识别系统的应用结构示意图。如图所示,在本实施例中,本发明的文件格式识别系统1应用在数据处理装置2中。该数据处理装置2是个人计算机、笔记本计算机等具有数据处理功能的装置。本发明的文件格式识别系统1包括:数据库11、输入模块12、对比模块13以及驱动模块14。
该数据库11存储对应不同文件格式的文件格式定义参数,以及对应该文件格式定义参数的处理参数。在本实施例中,该数据库11建立在该数据处理装置2中,具体而言,建立在该数据处理装置2的硬盘(未标出)中。该文件格式定义参数是不同文件格式开发者针对特定文件格式制定的识别码。例如,以「MPEG-2ps」格式的文件为例,根据《ISO/IEC13818-1:1994(E)》中关于「MPEG-2ps」的定义《2.5.3.4 Specification ofthe Program Stream Syntax and Semantics》,「0x01BA」(两个字节)是识别「MPEG-2ps」文件格式的识别码。
另外,对应该文件格式定义参数的处理参数则可以是该文件的尺寸(即图像分辨率),压缩率(即源文件大小的压缩率),位率(Bit Rate)等,提供该数据处理装置2中相应的应用程序确定用什么译码方式运行该文件。
再者,在本实施例中,该数据库11还包括对应不同文件格式定义参数,及其处理参数的应用程序数据表,提供该数据处理装置2调用应用程序运行文件的依据,这部分后面详述。
该输入模块12接收用户输入到该数据处理装置2的文件格式定义参数,以及对应该文件格式定义参数的处理参数,并将该定义参数与处理参数存储到该数据库11。在本实施例中,用户可通过该输入模块12输入该文件格式定义参数,以及对应该文件格式定义参数的处理参数到该数据处理装置2。具体而言,该输入模块12可以是设置在该数据处理装置2上的软盘驱动器、光盘驱动器、USB输入端等数据读取装置。用户可通过安装磁盘、光盘或USB存储装置到该数据处理装置2,输入文件格式定义参数,以及对应该文件格式定义参数的处理参数,并将该定义参数与处理参数存储到该数据库11。
该对比模块13在文件输入该数据处理装置2时,在该输入文件的预定范围内判断该数据库存储的文件格式定义参数是否存在,并在对比出该文件格式定义参数后,在该输入文件的预定范围内判断该数据库11存储的处理参数是否存在,并根据对比的结果定义该输入文件的格式。
该预定范围是该文件的前32KB编码。在另一实施方式中也可以是该文件的前64KB编码。在本实施例中,该对比模块13在文件通过该输入模块12输入到该数据处理装置2时,立即判断该文件的前32KB编码中,是否存在存储在该数据库11的任何一个文件格式定义参数,如果没有,输出文件格式不明的信息到该数据处理装置2,并显示在与该数据处理装置2连接的显示单元(未标出)上;如果有,则进一步在该输入文件的预定范围内判断该数据库11存储的处理参数是否存在。在判断该数据库11存储的处理参数是否存在时,如果该文件的前32KB编码中存在该数据库11中的任一处理参数,则根据该文件格式定义参数,及其处理参数定义该输入文件的格式;如果没有,则输出文件格式不明的信息到该数据处理装置2,并显示在与该数据处理装置2连接的显示单元上。
该驱动模块14根据该定义的输入文件格式调用相对应的应用程序运行该输入文件。当该对比模块13根据该文件格式定义参数,及其处理参数定义该输入文件的格式后,会根据该数据库11中对应不同文件格式定义参数及其处理参数的应用程序数据表,查找出符合的应用程序,并调用该相对应的应用程序运行该输入文件。
图2是本发明的文件格式识别方法执行时的流程图。如图所示,在步骤S200中,接收用户输入到该数据处理装置的文件格式定义参数、对应该文件格式定义参数的处理参数,以及对应不同文件格式定义参数及其处理参数的应用程序数据表,并将该定义参数与处理参数存储到该数据库。接着进到步骤S201。
在步骤S201中,建立存储对应不同文件格式的文件格式定义参数、对应该文件格式定义参数的处理参数,以及对应不同文件格式定义参数及其处理参数的应用程序数据表的数据库。接着进到步骤S202。
在步骤S202中,在文件输入该数据处理装置时,在该输入文件的预定范围内判断该数据库中存储的文件格式定义参数是否存在,如果是,进到步骤S203;否则,进到步骤S206。
在步骤S203中,在该输入文件的预定范围内判断该数据库中存储的处理参数是否存在,如果是,进到步骤S204,否则,进到步骤S206。
在步骤S204中,根据该文件格式定义参数与处理参数定义该输入文件的格式。接着进到步骤S205。
在步骤S205中,根据该定义的输入文件格式调用相对应的应用程序运行该输入文件。
在步骤S206中,输出文件格式不明的信息到该数据处理装置,并显示在与该数据处理装置连接的显示单元上。
须特别说明的是,该步骤S200可独立于其它步骤实施。具体而言,用户可仅更新该数据库中存储的对应不同文件格式的定义参数、对应该文件格式定义参数的处理参数,以及对应不同文件格式定义参数及其处理参数的应用程序数据,而不执行文件输入及其后续识别文件格式的流程步骤。
综上所述,本发明的文件格式识别系统及方法,通过该数据库、输入模块、对比模块以及驱动模块之间的相互运作,能实现正确识别文件格式及其处理参数的目的。

Claims (16)

1.一种文件格式识别系统,应用在数据处理装置中,其特征在于,该文件格式识别系统包括:
数据库,存储对应不同文件格式的文件格式定义参数,以及对应该文件格式定义参数的处理参数;以及
对比模块,当文件输入该数据处理装置时,在该输入文件的预定范围内判断该数据库中存储的文件格式定义参数是否存在,并在对比出该文件格式定义参数后,在该输入文件的预定范围内判断该数据库中存储的处理参数是否存在,并根据对比的结果定义该输入文件的格式。
2.如权利要求1所述的文件格式识别系统,其特征在于,该文件格式识别系统还包括:输入模块,接收用户输入到该数据处理装置的文件格式定义参数,以及对应该文件格式定义参数的处理参数,并将该定义参数与处理参数存储到该数据库。
3.如权利要求1所述的文件格式识别系统,其特征在于,该文件格式识别系统还包括:驱动模块,根据定义的输入文件格式驱动相对应的应用程序执行该输入文件。
4.如权利要求1所述的文件格式识别系统,其特征在于,该数据库还包括:对应不同文件格式定义参数及其处理参数应用程序的数据表。
5.如权利要求1所述的文件格式识别系统,其特征在于,该文件格式定义参数是不同文件格式开发者针对特定文件格式制定的识别码。
6.如权利要求1所述的文件格式识别系统,其特征在于,该处理参数选自该文件的尺寸、压缩率或位率所组成的群组。
7.如权利要求1所述的文件格式识别系统,其特征在于,该预定范围是该文件的前64KB编码。
8.如权利要求1所述的文件格式识别系统,其特征在于,该预定范围是该文件的前32KB编码。
9.一种文件格式识别方法,应用在数据处理装置中,其特征在于,该文件格式识别方法包括:
建立存储对应不同文件格式的文件格式定义参数,以及对应该文件格式定义参数的处理参数数据库;
当文件输入该数据处理装置时,在该输入文件的预定范围内判断该数据库存储的文件格式定义参数是否存在;
当对比出该文件格式定义参数后,在该输入文件的预定范围内判断该数据库存储的处理参数是否存在;以及
当该处理参数存在时,根据该文件格式定义参数与处理参数定义该输入文件的格式。
10.如权利要求9所述的文件格式识别方法,其特征在于,该文件格式识别方法还包括:接收用户输入到该数据处理装置的文件格式定义参数,以及对应该文件格式定义参数的处理参数,并将该定义参数与处理参数存储到该数据库。
11.如权利要求9所述的文件格式识别方法,其特征在于,该文件格式识别方法还包括:根据该定义的输入文件格式驱动相对应的应用程序执行该输入文件。
12.如权利要求9所述的文件格式识别方法,其特征在于,该数据库还包括:对应不同文件格式定义参数及其处理参数应用程序的数据表。
13.如权利要求9所述的文件格式识别方法,其特征在于,该文件格式定义参数是不同文件格式开发者针对特定文件格式制定的识别码。
14.如权利要求9所述的文件格式识别方法,其特征在于,该处理参数选自该文件的尺寸、压缩率或位率所组成的群组。
15.如权利要求9所述的文件格式识别方法,其特征在于,该预定范围是该文件的前64KB编码。
16.如权利要求9所述的文件格式识别方法,其特征在于,该预定范围是该文件的前32KB编码。
CNB2005100975695A 2005-12-30 2005-12-30 文件格式识别系统及方法 Expired - Fee Related CN100447783C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005100975695A CN100447783C (zh) 2005-12-30 2005-12-30 文件格式识别系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005100975695A CN100447783C (zh) 2005-12-30 2005-12-30 文件格式识别系统及方法

Publications (2)

Publication Number Publication Date
CN1991821A true CN1991821A (zh) 2007-07-04
CN100447783C CN100447783C (zh) 2008-12-31

Family

ID=38214081

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100975695A Expired - Fee Related CN100447783C (zh) 2005-12-30 2005-12-30 文件格式识别系统及方法

Country Status (1)

Country Link
CN (1) CN100447783C (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075661A1 (zh) * 2008-12-31 2010-07-08 中国银联股份有限公司 一种文件类型识别分析方法及系统
CN101917609A (zh) * 2010-08-13 2010-12-15 四川长虹电器股份有限公司 嵌入式流媒体文件格式识别方法
CN102376333A (zh) * 2010-08-18 2012-03-14 Tcl集团股份有限公司 一种多媒体播放终端及其文件播放方法和装置
CN103871440A (zh) * 2012-12-18 2014-06-18 瑞轩科技股份有限公司 快速判断影音档案的压缩格式的方法及其相关的播放装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6260043B1 (en) * 1998-11-06 2001-07-10 Microsoft Corporation Automatic file format converter
US7721334B2 (en) * 2004-01-30 2010-05-18 Microsoft Corporation Detection of code-free files

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075661A1 (zh) * 2008-12-31 2010-07-08 中国银联股份有限公司 一种文件类型识别分析方法及系统
CN101770470B (zh) * 2008-12-31 2012-11-28 中国银联股份有限公司 一种文件类型识别分析方法及系统
US9690788B2 (en) 2008-12-31 2017-06-27 China Unionpay Co., Ltd. File type recognition analysis method and system
CN101917609A (zh) * 2010-08-13 2010-12-15 四川长虹电器股份有限公司 嵌入式流媒体文件格式识别方法
CN101917609B (zh) * 2010-08-13 2012-05-30 四川长虹电器股份有限公司 嵌入式流媒体文件格式识别方法
CN102376333A (zh) * 2010-08-18 2012-03-14 Tcl集团股份有限公司 一种多媒体播放终端及其文件播放方法和装置
CN103871440A (zh) * 2012-12-18 2014-06-18 瑞轩科技股份有限公司 快速判断影音档案的压缩格式的方法及其相关的播放装置

Also Published As

Publication number Publication date
CN100447783C (zh) 2008-12-31

Similar Documents

Publication Publication Date Title
EP2090071B1 (en) Bundling of multimedia content and decoding means
US9299342B2 (en) User query history expansion for improving language model adaptation
US7096474B2 (en) Mobile multimedia Java framework application program interface
US20030056029A1 (en) Method and apparatus for customizing Java API implementations
US20070147274A1 (en) Personal information management using content with embedded personal information manager data
CN1991821A (zh) 文件格式识别系统及方法
US20080252490A1 (en) Merging A Codec With A Digital Media File and Playing A Digital Media File On A Playback Device
US20230362224A1 (en) Systems and methods for encoding and decoding
KR20080032100A (ko) 통합 저장 보안 모델
CN105635284A (zh) 一种页面显示方法及终端
US20080256341A1 (en) Data Processing Pipeline Selection
CN111200744A (zh) 一种多媒体播放控制方法、装置及智能设备
US20060184783A1 (en) System and method for providing an extensible codec architecture for digital images
EP2397953A1 (en) A computer-implemented method, a computer program product and an embedded system for displaying data more efficiently
CN1975701A (zh) 主机驱动外设的方法及系统
US20090327344A1 (en) Media foundation source reader
CN111796865B (zh) 一种字节码文件修改方法、装置、终端设备及介质
Deng et al. Combinatorial testing on implementations of html5 support
US20230305851A1 (en) Modular pipelines for accessing digital data
CN111639055B (zh) 差分包计算方法、装置、设备及存储介质
CN115098191A (zh) 扫地机器人软件的配置方法、装置、电子设备及存储介质
JP2008065736A (ja) データ処理装置、データ処理方法、プログラムおよび記録媒体
CN107077872A (zh) Android自带多媒体播放器的功能扩展方法和多媒体播放系统
CN112400280A (zh) 信息处理装置、信息处理系统、程序和信息处理方法
CN110704812A (zh) Drm文件识别方法及装置、存储介质、终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081231

Termination date: 20111230