CN100447783C - 文件格式识别系统及方法 - Google Patents
文件格式识别系统及方法 Download PDFInfo
- Publication number
- CN100447783C CN100447783C CNB2005100975695A CN200510097569A CN100447783C CN 100447783 C CN100447783 C CN 100447783C CN B2005100975695 A CNB2005100975695 A CN B2005100975695A CN 200510097569 A CN200510097569 A CN 200510097569A CN 100447783 C CN100447783 C CN 100447783C
- Authority
- CN
- China
- Prior art keywords
- document
- file
- parameter
- processing parameter
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种文件格式识别系统及方法,该文件格式识别系统及方法应用在数据处理装置中,通过建立对应不同文件格式的文件格式定义参数,以及对应该文件格式定义参数的处理参数数据库,当文件输入该数据处理装置时,在该输入文件的预定范围内判断符合该文件格式定义参数的编码是否存在,如果该文件格式定义参数存在,则进一步判断该输入文件是否存在相对应的该处理参数,如果相对应的该处理参数存在,则定义该输入文件的格式与处理参数。本发明的文件格式识别系统及方法,通过该数据库与对比机制,能实现正确识别文件格式及其处理参数的目的。
Description
技术领域
本发明是关于一种数据处理技术,特别是关于一种应用在数据处理装置的文件格式识别系统及方法。
背景技术
随着数字技术不断进步,用户可以在个人计算机等数据处理装置上处理文字、图像、声音以及视频数据。虽然数据处理装置的硬件不断升级,网络带宽也不断增加,文件运行或通过网络传输的速度与日俱增。但如何通过数据压缩等技术,在不影响文件原始质量的前提下,将文件大小尽可能压缩,仍然是相关技术领域要解决的课题。
以多媒体文件压缩格式为例,其可包括MPEG-1、MPEG-2与MPEG-4等压缩格式。随着文件格式的多样化,在用户运行这些文件的过程中会遇到一些问题。例如,当用户开启文件时,常常会发生操作系统找不到用什么应用程序运行的问题。面对这种情况,用户通常必须在原有应用程序中外挂其它编译码程序或是安装专门运行该文件的应用程序才能运行。由于网络的普及,通过网络搜索、下载以及安装这些外挂应用程序并不困难。但是,用户必须先确定该文件的格式,如果无法知道该文件的正确格式,则无法取得正确的外挂应用程序或专门的应用程序。如果用户对计算机操作或是与计算机相关的软硬件信息不很了解,要正确运行未知格式的文件,就更加困难。
另外,即使文件有扩展名供用户参考,但文件的扩展名极易被修改。例如,用户可以将扩展名.AVI修改为.MP3,则其它用户在执行时,操作系统会将其视为MP3格式的文件运行,但该文件实际上是AVI格式,如果播放MP3的应用程序并不支持AVI格式时,可能会出现应用程序无法运行的情况,主要原因在于现有文件格式识别技术仅以扩展名为判断标准。
另外,即使扩展名相同的文件,也可能发生相应的处理参数不同而无法运行的情况。例如,Xvid格式的文件通常使用在DVD格式影音文件的压缩,而Xvid持续有不同的版本出现,而编译码的参数也有所不同,相同的DVD影音文件基于不同的压缩率可能出现分辨率及/或音频等处理参数的差异。这样,虽然能识别出正确的扩展名,但是如果无法正确识别出处理参数,通过正确的应用程序运行,用户的不便仍没有得到解决。
因此,如何提供一种能够正确识别文件格式及其相对应的处理参数,调用相应的应用程序运行,已成为目前亟待解决的问题。
发明内容
为克服上述现有技术的问题,本发明的主要目的在于提供一种能够正确识别文件格式的文件格式识别系统及方法。
本发明的另一目的在于提供一种能够正确识别处理参数的文件格式识别系统及方法。
为实现上述及其它目的,本发明的文件格式识别系统应用在数据处理装置中,该文件格式识别系统包括:数据库,存储对应不同文件格式的文件格式定义参数,以及对应该文件格式定义参数的处理参数;以及对比模块,当文件输入该数据处理装置时,在该输入文件的预定范围内判断该数据库中存储的文件格式定义参数是否存在,并在对比出该文件格式定义参数后,在该输入文件的预定范围内判断该数据库中存储的处理参数是否存在,并根据对比的结果定义该输入文件的格式。
该文件格式识别系统包括还包括:输入模块,接收用户输入到该数据处理装置的文件格式定义参数,以及对应该文件格式定义参数的处理参数,并将该定义参数与处理参数存储到该数据库。
该文件格式识别系统包括还包括:驱动模块,根据定义的输入文件格式驱动相对应的应用程序执行该输入文件。
通过上述本发明的文件格式识别系统,执行本发明的文件格式识别方法,该文件格式识别方法包括:建立存储对应不同文件格式的文件格式定义参数,以及对应该文件格式定义参数的处理参数数据库;当文件输入该数据处理装置时,在该输入文件的预定范围内判断该数据库存储的文件格式定义参数是否存在;当对比出该文件格式定义参数后,在该输入文件的预定范围内判断该数据库存储的处理参数是否存在;以及当该处理参数存在时,根据该文件格式定义参数与处理参数定义该输入文件的格式。
该文件格式识别方法还包括:接收用户输入到该数据处理装置的文件格式定义参数,以及对应该文件格式定义参数的处理参数,并将该定义参数与处理参数存储到该数据库。
该文件格式识别方法还包括:根据该定义的输入文件格式驱动相对应的应用程序执行该输入文件。
与现有的文件识别技术相比,本发明的文件格式识别系统及方法,通过该数据库与对比机制,能实现正确识别文件格式及其处理参数的目的。
附图说明
图1是本发明的文件格式识别系统的应用结构示意图;以及
图2是本发明的文件格式识别方法执行时的流程图。
具体实施方式
实施例
图1是本发明的文件格式识别系统的应用结构示意图。如图所示,在本实施例中,本发明的文件格式识别系统1应用在数据处理装置2中。该数据处理装置2是个人计算机、笔记本计算机等具有数据处理功能的装置。本发明的文件格式识别系统1包括:数据库11、输入模块12、对比模块13以及驱动模块14。
该数据库11存储对应不同文件格式的文件格式定义参数,以及对应该文件格式定义参数的处理参数。在本实施例中,该数据库11建立在该数据处理装置2中,具体而言,建立在该数据处理装置2的硬盘(未标出)中。该文件格式定义参数是不同文件格式开发者针对特定文件格式制定的识别码。例如,以「MPEG-2ps」格式的文件为例,根据《ISO/IEC13818-1:1994(E)》中关于「MPEG-2ps」的定义《2.5.3.4 Specification ofthe Program Stream Syntax and Semantics》,「0x01BA」(两个字节)是识别「MPEG-2ps」文件格式的识别码。
另外,对应该文件格式定义参数的处理参数则可以是该文件的尺寸(即图像分辨率),压缩率(即源文件大小的压缩率),位率(Bit Rate)等,提供该数据处理装置2中相应的应用程序确定用什么译码方式运行该文件。
再者,在本实施例中,该数据库11还包括对应不同文件格式定义参数,及其处理参数的应用程序数据表,提供该数据处理装置2调用应用程序运行文件的依据,这部分后面详述。
该输入模块12接收用户输入到该数据处理装置2的文件格式定义参数,以及对应该文件格式定义参数的处理参数,并将该定义参数与处理参数存储到该数据库11。在本实施例中,用户可通过该输入模块12输入该文件格式定义参数,以及对应该文件格式定义参数的处理参数到该数据处理装置2。具体而言,该输入模块12可以是设置在该数据处理装置2上的软盘驱动器、光盘驱动器、USB输入端等数据读取装置。用户可通过安装磁盘、光盘或USB存储装置到该数据处理装置2,输入文件格式定义参数,以及对应该文件格式定义参数的处理参数,并将该定义参数与处理参数存储到该数据库11。
该对比模块13在文件输入该数据处理装置2时,在该输入文件的预定范围内判断该数据库存储的文件格式定义参数是否存在,并在对比出该文件格式定义参数后,在该输入文件的预定范围内判断该数据库11存储的处理参数是否存在,并根据对比的结果定义该输入文件的格式。
该预定范围是该文件的前32KB编码。在另一实施方式中也可以是该文件的前64KB编码。在本实施例中,该对比模块13在文件通过该输入模块12输入到该数据处理装置2时,立即判断该文件的前32KB编码中,是否存在存储在该数据库11的任何一个文件格式定义参数,如果没有,输出文件格式不明的信息到该数据处理装置2,并显示在与该数据处理装置2连接的显示单元(未标出)上;如果有,则进一步在该输入文件的预定范围内判断该数据库11存储的处理参数是否存在。在判断该数据库11存储的处理参数是否存在时,如果该文件的前32KB编码中存在该数据库11中的任一处理参数,则根据该文件格式定义参数,及其处理参数定义该输入文件的格式;如果没有,则输出文件格式不明的信息到该数据处理装置2,并显示在与该数据处理装置2连接的显示单元上。
该驱动模块14根据该定义的输入文件格式调用相对应的应用程序运行该输入文件。当该对比模块13根据该文件格式定义参数,及其处理参数定义该输入文件的格式后,会根据该数据库11中对应不同文件格式定义参数及其处理参数的应用程序数据表,查找出符合的应用程序,并调用该相对应的应用程序运行该输入文件。
图2是本发明的文件格式识别方法执行时的流程图。如图所示,在步骤S200中,接收用户输入到该数据处理装置的文件格式定义参数、对应该文件格式定义参数的处理参数,以及对应不同文件格式定义参数及其处理参数的应用程序数据表,并将该定义参数与处理参数存储到该数据库。接着进到步骤S201。
在步骤S201中,建立存储对应不同文件格式的文件格式定义参数、对应该文件格式定义参数的处理参数,以及对应不同文件格式定义参数及其处理参数的应用程序数据表的数据库。接着进到步骤S202。
在步骤S202中,在文件输入该数据处理装置时,在该输入文件的预定范围内判断该数据库中存储的文件格式定义参数是否存在,如果是,进到步骤S203;否则,进到步骤S206。
在步骤S203中,在该输入文件的预定范围内判断该数据库中存储的处理参数是否存在,如果是,进到步骤S204,否则,进到步骤S206。
在步骤S204中,根据该文件格式定义参数与处理参数定义该输入文件的格式。接着进到步骤S205。
在步骤S205中,根据该定义的输入文件格式调用相对应的应用程序运行该输入文件。
在步骤S206中,输出文件格式不明的信息到该数据处理装置,并显示在与该数据处理装置连接的显示单元上。
须特别说明的是,该步骤S200可独立于其它步骤实施。具体而言,用户可仅更新该数据库中存储的对应不同文件格式的定义参数、对应该文件格式定义参数的处理参数,以及对应不同文件格式定义参数及其处理参数的应用程序数据,而不执行文件输入及其后续识别文件格式的流程步骤。
综上所述,本发明的文件格式识别系统及方法,通过该数据库、输入模块、对比模块以及驱动模块之间的相互运作,能实现正确识别文件格式及其处理参数的目的。
Claims (16)
1.一种文件格式识别系统,应用在数据处理装置中,其特征在于,该文件格式识别系统包括:
数据库,存储对应不同文件格式的文件格式定义参数,以及对应该文件格式定义参数的处理参数;以及
对比模块,当文件输入该数据处理装置时,在该输入文件的预定范围内判断该数据库中存储的文件格式定义参数是否存在,并在对比出该文件格式定义参数后,在该输入文件的预定范围内判断该数据库中存储的处理参数是否存在,当处理参数存在时,根据该文件格式定义参数与处理参数定义该输入文件的格式。
2.如权利要求1所述的文件格式识别系统,其特征在于,该文件格式识别系统还包括:输入模块,接收用户输入到该数据处理装置的文件格式定义参数,以及对应该文件格式定义参数的处理参数,并将该定义参数与处理参数存储到该数据库。
3.如权利要求1所述的文件格式识别系统,其特征在于,该文件格式识别系统还包括:驱动模块,根据定义的输入文件格式驱动相对应的应用程序执行该输入文件。
4.如权利要求1所述的文件格式识别系统,其特征在于,该数据库还包括:对应该文件格式定义参数及其处理参数的应用程序的数据表。
5.如权利要求1所述的文件格式识别系统,其特征在于,该文件格式定义参数是不同文件格式开发者针对特定文件格式制定的识别码。
6.如权利要求1所述的文件格式识别系统,其特征在于,该处理参数选自该文件的尺寸、压缩率或位率所组成的群组。
7.如权利要求1所述的文件格式识别系统,其特征在于,该预定范围是该文件的前64KB编码。
8.如权利要求1所述的文件格式识别系统,其特征在于,该预定范围是该文件的前32KB编码。
9.一种文件格式识别方法,应用在数据处理装置中,其特征在于,该文件格式识别方法包括:
建立存储对应不同文件格式的文件格式定义参数,以及对应该文件格式定义参数的处理参数数据库;
当文件输入该数据处理装置时,在该输入文件的预定范围内判断该数据库存储的文件格式定义参数是否存在;
当对比出该文件格式定义参数后,在该输入文件的预定范围内判断该数据库存储的处理参数是否存在;以及
当该处理参数存在时,根据该文件格式定义参数与处理参数定义该输入文件的格式。
10.如权利要求9所述的文件格式识别方法,其特征在于,该文件格式识别方法还包括:接收用户输入到该数据处理装置的文件格式定义参数,以及对应该文件格式定义参数的处理参数,并将该定义参数与处理参数存储到该数据库。
11.如权利要求9所述的文件格式识别方法,其特征在于,该文件格式识别方法还包括:根据该定义的输入文件格式驱动相对应的应用程序执行该输入文件。
12.如权利要求9所述的文件格式识别方法,其特征在于,该数据库还包括:对应该文件格式定义参数及其处理参数的应用程序的数据表。
13.如权利要求9所述的文件格式识别方法,其特征在于,该文件格式定义参数是不同文件格式开发者针对特定文件格式制定的识别码。
14.如权利要求9所述的文件格式识别方法,其特征在于,该处理参数选自该文件的尺寸、压缩率或位率所组成的群组。
15.如权利要求9所述的文件格式识别方法,其特征在于,该预定范围是该文件的前64KB编码。
16.如权利要求9所述的文件格式识别方法,其特征在于,该预定范围是该文件的前32KB编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100975695A CN100447783C (zh) | 2005-12-30 | 2005-12-30 | 文件格式识别系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100975695A CN100447783C (zh) | 2005-12-30 | 2005-12-30 | 文件格式识别系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1991821A CN1991821A (zh) | 2007-07-04 |
CN100447783C true CN100447783C (zh) | 2008-12-31 |
Family
ID=38214081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005100975695A Expired - Fee Related CN100447783C (zh) | 2005-12-30 | 2005-12-30 | 文件格式识别系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100447783C (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770470B (zh) | 2008-12-31 | 2012-11-28 | 中国银联股份有限公司 | 一种文件类型识别分析方法及系统 |
CN101917609B (zh) * | 2010-08-13 | 2012-05-30 | 四川长虹电器股份有限公司 | 嵌入式流媒体文件格式识别方法 |
CN102376333B (zh) * | 2010-08-18 | 2014-06-25 | Tcl集团股份有限公司 | 一种多媒体播放终端及其文件播放方法和装置 |
CN103871440A (zh) * | 2012-12-18 | 2014-06-18 | 瑞轩科技股份有限公司 | 快速判断影音档案的压缩格式的方法及其相关的播放装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6260043B1 (en) * | 1998-11-06 | 2001-07-10 | Microsoft Corporation | Automatic file format converter |
CN1648812A (zh) * | 2004-01-30 | 2005-08-03 | 微软公司 | 无代码文件的检测 |
-
2005
- 2005-12-30 CN CNB2005100975695A patent/CN100447783C/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6260043B1 (en) * | 1998-11-06 | 2001-07-10 | Microsoft Corporation | Automatic file format converter |
CN1648812A (zh) * | 2004-01-30 | 2005-08-03 | 微软公司 | 无代码文件的检测 |
Non-Patent Citations (4)
Title |
---|
多媒体数据库的非格式化数据库管理问题. 卢豫开,刘宁.广西大学学报(自然科学版),第21卷第3期. 1996 |
多媒体数据库的非格式化数据库管理问题. 卢豫开,刘宁.广西大学学报(自然科学版),第21卷第3期. 1996 * |
多种流行图像格式的自动识别技术. 陈茂山.微型机与应用,第1997年第3期. 1997 |
多种流行图像格式的自动识别技术. 陈茂山.微型机与应用,第1997年第3期. 1997 * |
Also Published As
Publication number | Publication date |
---|---|
CN1991821A (zh) | 2007-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20080134012A1 (en) | Bundling of multimedia content and decoding means | |
CN101395572B (zh) | 适用于分布式内容的辅助显示小配件 | |
US9372836B2 (en) | HTML5 I-frame extension | |
US20150334413A1 (en) | Systems and methods for accessing digital data | |
CN110764941B (zh) | 获取调用栈栈帧指令偏移的方法、装置、介质和设备 | |
US10025787B2 (en) | Systems and methods for selecting digital data for archival | |
CN100447783C (zh) | 文件格式识别系统及方法 | |
CN111796865B (zh) | 一种字节码文件修改方法、装置、终端设备及介质 | |
JP5283907B2 (ja) | 電子デバイスの汎用パーサ | |
US20230362224A1 (en) | Systems and methods for encoding and decoding | |
EP1898308A1 (en) | Apparatus and method for implementing components, and apparatus and method for verifying components | |
KR20080032100A (ko) | 통합 저장 보안 모델 | |
CN103137183A (zh) | 用于确定音频内容的比特率的设备和方法 | |
MXPA04012143A (es) | Sistema para representacion de multimedios en un dispositivo portatil. | |
US20080256341A1 (en) | Data Processing Pipeline Selection | |
CN104063306A (zh) | 智能终端软件测试中的自动登录方法、装置和系统 | |
US20050210117A1 (en) | Remote controlled application program sharing framework and method for operating systems | |
CN101753579A (zh) | 一种用于移动通讯设备的多媒体播放方法 | |
CN110399040B (zh) | 多模态交互方法、用户端设备、服务器及系统 | |
CN104866294A (zh) | 一种扩展Android软件功能的方法及装置 | |
CN102077190A (zh) | 媒体基础源读取器 | |
AU2013206622B2 (en) | Download management method and device based on Android browser | |
WO2015176009A1 (en) | Systems and methods for selecting digital data for archival | |
KR100837742B1 (ko) | 데이터 통신 케이블을 이용한 모바일 데이터 복구 장치 및그 방법 | |
US20240176600A1 (en) | Intelligent Adaptation of Source Code for Multi-Purpose Compilation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20081231 Termination date: 20111230 |