CN108595672A - 一种识别下载文件类型的方法、装置及可读存储介质 - Google Patents

一种识别下载文件类型的方法、装置及可读存储介质 Download PDF

Info

Publication number
CN108595672A
CN108595672A CN201810407209.8A CN201810407209A CN108595672A CN 108595672 A CN108595672 A CN 108595672A CN 201810407209 A CN201810407209 A CN 201810407209A CN 108595672 A CN108595672 A CN 108595672A
Authority
CN
China
Prior art keywords
resource
file
download
type
downloaded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810407209.8A
Other languages
English (en)
Inventor
梁洁辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nubia Technology Co Ltd
Original Assignee
Nubia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nubia Technology Co Ltd filed Critical Nubia Technology Co Ltd
Priority to CN201810407209.8A priority Critical patent/CN108595672A/zh
Publication of CN108595672A publication Critical patent/CN108595672A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种识别下载文件类型的方法、装置及可读存储介质,该方法包括:解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名;根据所述文件拓展名判断所述下载资源与实际资源是否匹配;当所述下载资源与所述实际资源匹配时,提示开始获取所述下载资源和所述下载资源对应的文件名。本申请通过预置的MIME对照表和文件特征数据库,对下载的资源进行验证,确保用户下载的内容能够在终端本地进行处理,避免网络提供的资源内容和实际下载的内容不匹配导致用户资源浪费。本申请解决了目前终端浏览器的资源下载时文件识别问题,避免了文件类型不匹配导致的用户流量消耗,改善了终端浏览器的用户体验。

Description

一种识别下载文件类型的方法、装置及可读存储介质
技术领域
本发明涉及终端网络技术领域,特别是一种识别下载文件类型的方法、装置及可读存储介质。
背景技术
随着智能移动终端技术的不断发展,智能移动终端均能够支持访问互联网的功能,一般情况下通过浏览器访问互联网网站,其中,资源下载是终端浏览器的一个重要功能。通过资源下载能够从互联网上获得海量的数据资源,满足终端对数据资源的需求。目前网页包含了大量的图片内容,有些用户需要通过终端浏览器的下载功能将其保存到本地存储设备,下次访问时不必再占用网络流量来加载图片。另外很多网站提供了大量资源共享,这些资源也需要通过终端浏览器进行下载。
MIME(Multipurpose Internet Mail Extensions)多用途互联网邮件扩展类型,是设定某种扩展名的文件用一种应用程序来打开的方式类型,当该扩展名文件被访问的时候,浏览器会自动使用指定应用程序来打开;多用于指定一些客户端自定义的文件名,以及一些媒体文件打开方式。但是,资源下载时需要根据网站提供的MIME类型来识别文件内容,有些网站提供的无效MIME类型,导致浏览器资源下载后,文件无法识别,下载下来的数据无法被其它应用打开,导致最后被丢弃,浪费了用户的网络流量。
发明内容
本发明的主要目的在于提出一种识别下载文件类型的方法、装置及可读存储介质,旨在解决终端浏览器不能够识别下载文件类型是否有效而造成网络流量浪费的技术问题。
为了解决上述技术问题,本发明提供了一种识别下载文件类型的方法,该方法包括以下步骤:
解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名;
根据所述文件拓展名判断所述下载资源与实际资源是否匹配;
当所述下载资源与所述实际资源匹配时,提示开始获取所述下载资源和所述下载资源对应的文件名。
进一步的,所述解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名的步骤具体包括:
当所述资源信息中包含Content-Disposition字段时,直接获取所述文件名;
否则,检测所述资源信息的URL参数是否包含Filename字段,从所述Filename字段获取所述文件名;
否则,检测所述URL参数的路径最后一部分是否为所述下载资源的文件名;RR
进一步的,所述解析下载资源的URL参数,获取所述下载资源对应的文件类型,包括文件名和文件扩展名的步骤具体还包括:
当所述资源信息中不包含Content-Disposition字段和Filename字段,且所述URL参数的路径最后一部分不是所述下载资源的文件名时,为所述下载资源指定一缺省文件名。
进一步的,所述根据所述文件拓展名判断所述下载资源与实际资源是否匹配的步骤之前,所述方法还包括:
检测所述下载资源是否具有所述文件拓展名,否则,判断所述资源信息中是否具有资源内容类型Content-Type信息;
根据所述Content-Type信息从预置的MIME对照表中查询获得所述下载资源的文件拓展名。
进一步的,所述判断所述资源信息中是否包含资源内容类型Content-Type信息的步骤之后,所述方法还包括:
当所述资源信息中不包含所述Content-Type信息时,通过HTTP HEAD请求获取对应下载资源的资源内容类型Content-Type信息。
进一步的,所述根据所述资源内容类型信息从预置的MIME对照表中查询获得所述下载资源的文件拓展名的步骤还包括:
当所述下载资源的MIME类型和对应的所述文件拓展名无法被本地应用程序处理时,获取所述下载资源的资源数据并进行文件特征识别,通过预置的文件特征数据库检测是否匹配对应的资源内容类型Content-Type信息。
进一步的,所述获取所述下载资源的资源数据并进行文件特征识别包括:
通过HTTP GET请求进行模拟下载,在HTTP GET请求头部RANG字段指定获取的字节范围,获得所述下载资源的资源数据。
进一步的,所述通过预置的文件特征数据库检测是否匹配对应的资源内容类型Content-Type信息的步骤之后,所述方法还包括:
当所述资源信息中的资源内容类型Content-Type信息与预置的文件特征数据库不匹配时,根据所述资源数据重新识别确定所述资源内容类型Content-Type信息。
基于同一发明构思,本发明的另一方面,提供了一种识别下载文件类型的装置,所述识别下载文件类型的装置包括处理器、存储器及数据总线;
所述数据总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的识别下载文件类型程序,以实现以下步骤:
解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名;
根据所述文件拓展名判断所述下载资源与实际资源是否匹配;
当所述下载资源与所述实际资源匹配时,提示开始获取所述下载资源和所述下载资源对应的文件名。
基于同一发明构思,本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有识别下载文件类型程序,所述识别下载文件类型程序被处理器执行时实现上述的识别下载文件类型的方法的步骤。
本发明技术方案的有益效果:
本申请的识别下载文件类型的方法、装置及可读存储介质,在浏览器界面上点击下载某一资源时,解析URL参数,获取所述下载资源对应的文件类型,包括文件名和文件扩展名;通过预置的MIME对照表和文件特征数据库,对下载的资源进行验证,确保用户下载的内容能够在终端本地进行处理,避免网络提供的资源内容和实际下载的内容不匹配导致用户资源浪费。本申请解决了目前终端浏览器的资源下载时文件识别问题,避免了文件类型不匹配导致的用户流量消耗,改善了终端浏览器的用户体验。
附图说明
图1是实现本发明各个实施例的一种移动终端的硬件结构示意图;
图2是本发明实施例提供的一种通信网络系统架构图;
图3是本发明实施例提供的一种识别下载文件类型的的方法流程框图;
图4是本发明实施例提供的解析下载资源的URL参数,获取所述下载资源对应的文件类型的步骤流程框图;
图5是本发明实施例提供的一种识别下载文件类型的的装置结构框图;
图6是本发明实施例提供的判断下载资源与实际资源是否匹配的流程框图。
图7是本发明实施例提供的一种下载图片的浏览器界面示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。
后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
请参阅图1,其为实现本发明各个实施例的一种移动终端的硬件结构示意图,该移动终端100可以包括:RF(Radio Frequency,射频)单元101、WiFi模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图1对移动终端的各个部件进行具体的介绍:
射频单元101可用于收发信息或通话过程中,信号的接收和发送,具体的,将基站的下行信息接收后,给处理器110处理;另外,将上行的数据发送给基站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过公共交通费用快捷支付与网络和其他设备通信。上述公共交通费用快捷支付可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobilecommunication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA2000(Code Division Multiple Access 2000,码分多址2000)、WCDMA(Wideband Code Division Multiple Access,宽带码分多址)、TD-SCDMA(Time Division-Synchronous Code Division Multiple Access,时分同步码分多址)、FDD-LTE(FrequencyDivision Duplexing-Long Term Evolution,频分双工长期演进)和TDD-LTE(TimeDivision Duplexing-Long Term Evolution,分时双工长期演进)等。
WiFi属于短距离无线传输技术,移动终端通过WiFi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图1示出了WiFi模块102,但是可以理解的是,其并不属于移动终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
音频输出单元103可以在移动终端100处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将射频单元101或WiFi模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103可以包括扬声器、蜂鸣器等等。
A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或WiFi模块102进行发送。麦克风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在移动终端100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1061。
用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作),并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。具体地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种,具体此处不做限定。
进一步的,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元108用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/0)端口、视频I/0端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端100和外部装置之间传输数据。
存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理公共交通费用快捷支付。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。
移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图1未示出,移动终端100还可以包括蓝牙模块等,在此不再赘述。
为了便于理解本发明实施例,下面对本发明的移动终端所基于的通信网络系统进行描述。
请参阅图2,图2为本发明实施例提供的一种通信网络系统架构图,该通信网络系统为通用移动通信技术的LTE系统,该LTE系统包括依次通讯连接的UE(User Equipment,用户设备)201,E-UTRAN(Evolved UMTS Terrestrial Radio Access Network,演进式UMTS陆地无线接入网)202,EPC(Evolved Packet Core,演进式分组核心网)203和运营商的IP业务204。
具体地,UE201可以是上述终端100,此处不再赘述。
E-UTRAN202包括eNodeB2021和其它eNodeB2022等。其中,eNodeB2021可以通过回程(backhaul)(例如X2接口)与其它eNodeB2022连接,eNodeB2021连接到EPC203,eNodeB2021可以提供UE201到EPC203的接入。
EPC203可以包括MME(Mobility Management Entity,移动性管理实体)2031,HSS(Home Subscriber Server,归属用户服务器)2032,其它MME2033,SGW(Serving Gate Way,服务网关)2034,PGW(PDN Gate Way,分组数据网络网关)2035和PORF(Policy andCharging Rules Function,政策和资费功能实体)2036等。其中,MME2031是处理UE201和EPC203之间信令的控制节点,提供承载和连接管理。HSS2032用于提供一些寄存器来管理诸如归属位置寄存器(图中未示)之类的功能,并且保存有一些有关服务特征、数据速率等用户专用的信息。所有用户数据都可以通过SGW2034进行发送,PGW2035可以提供UE 201的IP地址分配以及其它功能,PCRF2036是业务数据流和IP承载资源的策略与计费控制策略决策点,它为策略与计费执行功能单元(图中未示)选择及提供可用的策略和计费控制决策。
IP业务204可以包括因特网、内联网、IMS(IP Multimedia Subsystem,IP多媒体子系统)或其它IP业务等。
虽然上述以LTE系统为例进行了介绍,但本领域技术人员应当知晓,本发明不仅仅适用于LTE系统,也可以适用于其他公共交通费用快捷支付系统,例如GSM、CDMA2000、WCDMA、TD-SCDMA以及未来新的网络系统等,此处不做限定。
基于上述移动终端100硬件结构、通信网络系统提出本发明方法各个实施例。
实施例1
如图3所示,本发明实施例提供了一种识别下载文件类型的方法,该方法包括以下步骤:
S101、解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名;
在用户通过浏览器界面点击网页的某个下载资源时,浏览器网页解析该下载资源的相关资源信息,其中包含下载资源的URL、提供此下载资源的网页URL以及此网站的Cookies,资源字节大小、资源内容类型Content-Type等等,有些资源还包括网站要求进行文件保存的缺省文件名,即Content-Disposition字段,这种资源是最理想的情况。有很多资源只有下载资源的URL,其它都需要浏览器来补充完成。统一资源定位符(UniformResource Locator,URL)是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。
S102、根据所述文件拓展名判断所述下载资源与实际资源是否匹配;
S103、当所述下载资源与所述实际资源匹配时,提示开始获取所述下载资源和所述下载资源对应的文件名。
如图4所示,所述解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名的步骤具体包括:
S201、当所述资源信息包含Content-Disposition字段时,直接获取所述文件名;
S202、否则,检测所述资源信息的URL参数是否包含Filename字段,从所述Filename字段获取所述文件名;
S203、否则,检测所述URL参数的路径最后一部分是否为所述下载资源的文件名。
其中,所述解析下载资源的URL参数,获取所述下载资源对应的文件类型,包括文件名和文件扩展名的步骤具体还包括:
当所述资源信息中不包含Content-Disposition字段和Filename字段,且所述URL参数的路径最后一部分不是所述下载资源的文件名时,为所述下载资源指定一缺省文件名。
其中,所述根据所述文件拓展名判断所述下载资源与实际资源是否匹配的步骤之前,所述方法还包括:
检测所述下载资源是否具有所述文件拓展名,否则,判断所述资源信息中是否具有资源内容类型Content-Type信息;
根据所述资源内容类型Content-Type信息从预置的MIME对照表中查询获得所述下载资源的文件拓展名。
如表1所示,其中一种MIME对照表,当获取了Content-Type信息后,可以直接查询下载资源对应的拓展名。
表1 MIME对照表
其中,所述判断所述资源信息中是否包含资源内容类型Content-Type信息的步骤之后,所述方法还包括:
当所述资源信息中不包含所述资源内容类型Content-Type信息时,通过HTTPHEAD请求获取对应下载资源的资源内容类型Content-Type信息。
其中,所述根据所述资源内容类型Content-Type信息从预置的MIME对照表中查询获得所述下载资源的文件拓展名的步骤还包括:
当所述下载资源的MIME类型和对应的所述文件拓展名无法被本地应用程序处理时,获取所述下载资源的资源数据并进行文件特征识别,通过预置的文件特征数据库检测是否匹配对应的资源内容类型Content-Type信息。
其中,所述获取所述下载资源的资源数据并进行文件特征识别包括:
通过HTTP GET请求进行模拟下载,在HTTP GET请求头部RANG字段指定获取的字节范围,获得所述下载资源的资源数据。
其中,所述通过预置的文件特征数据库检测是否匹配对应的资源内容类型Content-Type信息的步骤之后,所述方法还包括:
当所述资源信息中的资源内容类型Content-Type信息与预置的文件特征数据库不匹配时,根据所述资源数据重新识别确定所述资源内容类型Content-Type信息。
实施例2
如图5所示,本发明实施例提供的一种识别下载文件类型的装置硬件结构,具体地,所述识别下载文件类型的装置30至少包括处理器31、存储器32以及数据总线33。数据总线33用于实现处理器31和存储器32之间的连接通信,存储器32作为一种计算机可读存储介质,可以存储至少一个计算机程序,这些计算机程序可供处理器31读取、编译并执行,从而实现对应的处理流程。在本实施例中,存储器32作为一种计算机可读存储介质,其中存储有识别下载文件类型程序,该程序可供处理器31执行,从而实现如下的识别下载文件类型的方法的步骤:
解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名;
根据所述文件拓展名判断所述下载资源与实际资源是否匹配;
当所述下载资源与所述实际资源匹配时,提示开始获取所述下载资源和所述下载资源对应的文件名。
具体的,如图6所示,若资源信息有包含Content-Disposition字段,直接可以获得对应的文件名;
否则需要从资源信息的URL参数中检测其参数字段中是否包含有Filename字段,这也是对下载资源识别的一个重要参考;
若URL的参数也未包含上述字段,则检查URL的路径最后一个部分是否可以当作文件名;
若最后上述检查都失效,那么需要浏览器为下载资源提供一个缺省文件名。
上述确定文件名字的过程有可能导致最终下载的文件名字跟网站提供的资源名字不一致,所以需要进一步确定文件的内容类型(即MIME),保证文件扩展名跟实际资源是匹配的。
首先检测上述过程得到的文件名字是否有文件扩展名,如果没有,需要判断资源下载请求中是否有Content-Type信息;
否则需要通过HTTP HEAD请求获取对应资源的Content-Type信息,例如浏览器浏览某个网站的一张图片,尽管用户能够确定是图片类型,但无法最终确认是JPG、PNG、BMP、GIF、WEBP等等,通过HTTP HEAD请求能够得到对应资源的Content-Type信息。这样我们就能够从本地预置的MIME对照表中得到资源的文件扩展名。
本地预置的MIME对照表中还包含本地能够处理的应用程序名字,如果能够在此对照表中找到对应,那么可以确保本地应用能够处理下载的资源。
但有些资源的MIME类型为“text/plain”或者“application/octet-stream”时,对应的文件扩展名为“.txt”和“.bin”,则无法被本地应用处理。此时需要获取资源的实际内容才能进一步识别。通过HTTP GET请求进行模拟下载,在请求头部RANG字段指定获取的字节范围,通常仅需要对应资源的前100个字节,根据后续识别过程,有可能会跳转到资源的最后部分获取相应字节范围的数据。文件识别模块对获取的资源数据进行文件特征识别,通过本地保存的文件特征数据库检测是否能够匹配到对应的Content-Type,如果识别的Content-Type跟之前指定的不一致,则以此为准。每一文件类型的特征数据长短不一,因此在文件识别过程中可能有多次HTTP GET请求。
通过上述步骤之后,浏览器会提示用户是否下载,以及对应资源的文件名,用户确认后就可以获取能够被本地应用处理的下载资源。如图7所示,通过浏览器的搜索引擎查询关于“猫”的图片,浏览器在下载之前对图片对应的URL参数进行解析,在界面上显示图片名称:timg.jpg;文件大小:20.17KB。并且向用户提示是否确认下载,该图片下载到终端本地后,终端可以通过图片处理应用程序对jpg格式的图片进行处理。
浏览器确定下载资源的文件类型,通过MIME对照表和文件特征数据库进一步判断下载资源的文件类型是否跟实际内容匹配,如果不匹配则进行修正,避免用户获取的下载资源内容跟网站提供的内容不匹配导致所获得的下载资源无法被终端本地使用。
实施例3
基于同一发明构思,本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有识别下载文件类型程序,所述识别下载文件类型程序被处理器执行时实现如下识别下载文件类型的方法的步骤:
解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名;
根据所述文件拓展名判断所述下载资源与实际资源是否匹配;
当所述下载资源与所述实际资源匹配时,提示开始获取所述下载资源和所述下载资源对应的文件名。
其中,所述解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名的步骤具体包括:
当所述下载资源的资源信息包含Content-Disposition字段时,直接获取所述文件名;否则,检测资源信息的URL参数是否包含Filename字段,从所述Filename字段获取所述文件名;否则,检测所述URL参数的路径最后一部分是否为所述下载资源的文件名。
其中,所述解析资源信息的URL参数,获取所述下载资源对应的文件类型,包括文件名和文件扩展名的步骤具体还包括:
当所述资源信息中不包含Content-Disposition字段和Filename字段,且所述URL参数的路径最后一部分不是所述下载资源的文件名时,为所述下载资源指定一缺省文件名。
其中,所述根据所述文件拓展名判断所述下载资源与实际资源是否匹配的步骤之前,所述方法还包括:
检测所述下载资源是否具有所述文件拓展名,否则,判断所述资源信息中是否具有资源内容类型Content-Type信息;
根据所述资源内容类型Content-Type信息从预置的MIME对照表中查询获得所述下载资源的文件拓展名。
其中,所述判断所述资源信息中是否包含资源内容类型Content-Type信息的步骤之后,所述方法还包括:
当所述资源信息中不包含所述资源内容类型Content-Type信息时,通过HTTPHEAD请求获取对应下载资源的资源内容类型Content-Type信息。
其中,所述根据所述资源内容类型Content-Type信息从预置的MIME对照表中查询获得所述下载资源的文件拓展名的步骤还包括:
当所述下载资源的MIME类型和对应的所述文件拓展名无法被本地应用程序处理时,获取所述下载资源的资源数据并进行文件特征识别,通过预置的文件特征数据库检测是否匹配对应的资源内容类型Content-Type信息。
其中,所述获取所述下载资源的资源数据并进行文件特征识别包括:
通过HTTP GET请求进行模拟下载,在HTTP GET请求头部RANG字段指定获取的字节范围,获得所述下载资源的资源数据。
其中,所述通过预置的文件特征数据库检测是否匹配对应的资源内容类型Content-Type信息的步骤之后,所述方法还包括:
当所述资源信息中的资源内容类型Content-Type信息与预置的文件特征数据库不匹配时,根据所述资源数据重新识别确定所述资源内容类型Content-Type信息。
本申请的识别下载文件类型的方法、装置及可读存储介质,在浏览器界面上点击下载某一资源时,解析URL参数,获取所述下载资源对应的文件类型,包括文件名和文件扩展名;通过预置的MIME对照表和文件特征数据库,对下载的资源进行验证,确保用户下载的内容能够在终端本地进行处理,避免网络提供的资源内容和实际下载的内容不匹配导致用户资源浪费。本申请解决了目前终端浏览器的资源下载时文件识别问题,避免了文件类型不匹配导致的用户流量消耗,改善了终端浏览器的用户体验。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种识别下载文件类型的方法,其特征在于,所述方法包括以下步骤:
解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名;
根据所述文件拓展名判断所述下载资源与实际资源是否匹配;
当所述下载资源与所述实际资源匹配时,提示开始获取所述下载资源和所述下载资源对应的文件名。
2.根据权利要求1所述的一种识别下载文件类型的方法,其特征在于,所述解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名的步骤具体包括:
当所述资源信息包含Content-Disposition字段时,直接获取所述文件名;
否则,检测所述资源信息的URL参数是否包含Filename字段,从所述Filename字段获取所述文件名;
否则,检测所述URL参数的路径最后一部分是否为所述下载资源的文件名。
3.根据权利要求2所述的一种识别下载文件类型的方法,其特征在于,所述解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名的步骤具体还包括:
当所述资源信息中不包含Content-Disposition字段和Filename字段,且所述URL参数的路径最后一部分不是所述下载资源的文件名时,为所述下载资源指定一缺省文件名。
4.根据权利要求1所述的一种识别下载文件类型的方法,其特征在于,所述根据所述文件拓展名判断所述下载资源与实际资源是否匹配的步骤之前,所述方法还包括:
检测所述下载资源是否具有所述文件拓展名,否则,判断所述资源信息中是否具有Content-Type信息;
根据所述Content-Type信息从预置的MIME对照表中查询获得所述下载资源的文件拓展名。
5.根据权利要求4所述的一种识别下载文件类型的方法,其特征在于,所述判断所述资源信息中是否包含Content-Type信息的步骤之后,所述方法还包括:
当所述资源信息中不包含所述Content-Type信息时,通过HTTP HEAD请求获取对应下载资源的Content-Type信息。
6.根据权利要求4所述的一种识别下载文件类型的方法,其特征在于,所述根据所述Content-Type信息从预置的MIME对照表中查询获得所述下载资源的文件拓展名的步骤还包括:
当所述下载资源的MIME类型和对应的所述文件拓展名无法被本地应用程序处理时,获取所述下载资源的资源数据并进行文件特征识别,通过预置的文件特征数据库检测是否匹配对应的Content-Type信息。
7.根据权利要求6所述的一种识别下载文件类型的方法,其特征在于,所述获取所述下载资源的资源数据并进行文件特征识别包括:
通过HTTP GET请求进行模拟下载,在HTTP GET请求头部RANG字段指定获取的字节范围,获得所述下载资源的资源数据。
8.根据权利要求6所述的一种识别下载文件类型的方法,其特征在于,所述通过预置的文件特征数据库检测是否匹配对应的Content-Type信息的步骤之后,所述方法还包括:
当所述资源信息中的Content-Type信息与预置的文件特征数据库不匹配时,根据所述资源数据重新识别确定所述Content-Type信息。
9.一种识别下载文件类型的装置,其特征在于,所述装置包括处理器、存储器及数据总线;
所述数据总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的识别下载文件类型程序,以实现以下步骤:
解析下载资源的资源信息,获取所述下载资源对应的文件类型,包括文件名和文件扩展名;
根据所述文件拓展名判断所述下载资源与实际资源是否匹配;
当所述下载资源与所述实际资源匹配时,提示开始获取所述下载资源和所述下载资源对应的文件名。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有识别下载文件类型程序,所述识别下载文件类型程序被处理器执行时实现如权利要求1-8任意一项所述的识别下载文件类型的方法的步骤。
CN201810407209.8A 2018-04-28 2018-04-28 一种识别下载文件类型的方法、装置及可读存储介质 Pending CN108595672A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810407209.8A CN108595672A (zh) 2018-04-28 2018-04-28 一种识别下载文件类型的方法、装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810407209.8A CN108595672A (zh) 2018-04-28 2018-04-28 一种识别下载文件类型的方法、装置及可读存储介质

Publications (1)

Publication Number Publication Date
CN108595672A true CN108595672A (zh) 2018-09-28

Family

ID=63619460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810407209.8A Pending CN108595672A (zh) 2018-04-28 2018-04-28 一种识别下载文件类型的方法、装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN108595672A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109889588A (zh) * 2019-02-13 2019-06-14 中国银行股份有限公司 文件获取方法、装置、计算机设备和存储介质
CN110597761A (zh) * 2019-09-18 2019-12-20 龙芯中科(合肥)技术有限公司 基于浏览器的文件处理方法、装置、电子设备及存储介质
CN113595981A (zh) * 2021-06-25 2021-11-02 新浪网技术(中国)有限公司 上传文件威胁检测方法及装置、计算机可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571767A (zh) * 2011-12-24 2012-07-11 成都市华为赛门铁克科技有限公司 文件类型识别方法及文件类型识别装置
CN103209170A (zh) * 2013-03-04 2013-07-17 汉柏科技有限公司 文件类型识别方法及识别系统
CN103347092A (zh) * 2013-07-22 2013-10-09 星云融创(北京)信息技术有限公司 一种识别缓存文件的方法及装置
US20140136654A1 (en) * 2012-11-12 2014-05-15 Sap Ag Upload/download of mobile applications using a mime repository
CN104111846A (zh) * 2014-06-17 2014-10-22 贝壳网际(北京)安全技术有限公司 页面数据的加载方法和装置
CN106227893A (zh) * 2016-08-24 2016-12-14 乐视控股(北京)有限公司 一种文件类型获取方法及装置
CN106407260A (zh) * 2016-08-24 2017-02-15 乐视控股(北京)有限公司 一种获取文件类型的处理方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102571767A (zh) * 2011-12-24 2012-07-11 成都市华为赛门铁克科技有限公司 文件类型识别方法及文件类型识别装置
US20140136654A1 (en) * 2012-11-12 2014-05-15 Sap Ag Upload/download of mobile applications using a mime repository
CN103209170A (zh) * 2013-03-04 2013-07-17 汉柏科技有限公司 文件类型识别方法及识别系统
CN103347092A (zh) * 2013-07-22 2013-10-09 星云融创(北京)信息技术有限公司 一种识别缓存文件的方法及装置
CN104111846A (zh) * 2014-06-17 2014-10-22 贝壳网际(北京)安全技术有限公司 页面数据的加载方法和装置
CN106227893A (zh) * 2016-08-24 2016-12-14 乐视控股(北京)有限公司 一种文件类型获取方法及装置
CN106407260A (zh) * 2016-08-24 2017-02-15 乐视控股(北京)有限公司 一种获取文件类型的处理方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
R. FIELDING, J. GETTYS, J. C. MOGUL: "《Hypertext Transfer Protocol -- HTTP/1.1》", 30 June 1999 *
月是故乡明95: "Http 请求头 Range", 《HTTPS://WWW.CNBLOGS.COM/1995HXT/P/5692050.HTML》 *
赵友星,赵羽: "《Internet步步引导,万维新叶——自己动手做网页》", 31 December 1998 *
阿祥仔: "Http中Content-Type的详解", 《HTTPS://BLOG.CSDN.NET/DANIELZHOU888/ARTICLE/DETAILS/72861097》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109889588A (zh) * 2019-02-13 2019-06-14 中国银行股份有限公司 文件获取方法、装置、计算机设备和存储介质
CN110597761A (zh) * 2019-09-18 2019-12-20 龙芯中科(合肥)技术有限公司 基于浏览器的文件处理方法、装置、电子设备及存储介质
CN110597761B (zh) * 2019-09-18 2022-08-16 龙芯中科(合肥)技术有限公司 基于浏览器的文件处理方法、装置、电子设备及存储介质
CN113595981A (zh) * 2021-06-25 2021-11-02 新浪网技术(中国)有限公司 上传文件威胁检测方法及装置、计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN108536481A (zh) 一种应用程序启动方法、移动终端及计算机存储介质
CN107193889A (zh) 广告拦截方法、终端及计算机可读存储介质
CN108566304A (zh) 接口控制方法、电子设备及计算机可读存储介质
CN107707450A (zh) 一种传输文件的方法、装置和计算机可读存储介质
CN108600330A (zh) 离线消息推送方法、设备及计算机可读存储介质
CN107220050A (zh) 自适应显示方法、终端及计算机可读存储介质
CN107749919A (zh) 一种应用程序页面显示方法及设备
CN108573064A (zh) 信息推荐方法、移动终端、服务器及计算机可读存储介质
CN107528825A (zh) 一种资源下载方法、终端及计算机可读存储介质
CN108021698A (zh) 存储文件的删除方法、装置和计算机存储介质
CN107423389A (zh) 一种网页缩略图生成方法、装置及计算机可读存储介质
CN107800879A (zh) 一种音频调整方法、终端及计算机可读存储介质
CN107426304A (zh) 交互媒体资源的方法、系统及代理服务器
CN108595672A (zh) 一种识别下载文件类型的方法、装置及可读存储介质
CN108572777A (zh) 一种终端对象整理方法、终端及计算机可读存储介质
CN108012029A (zh) 一种信息处理方法、设备及计算机可读存储介质
CN107688639A (zh) 应用推荐方法、服务器及计算机可读存储介质
CN110069458A (zh) 一种删除安卓系统中无效资源的方法、设备及存储介质
CN109408185A (zh) 图片显示方法、移动终端及计算机可读存储介质
CN107391593A (zh) 一种文件处理方法、移动终端和计算机可读存储介质
CN108196746A (zh) 一种文件展示方法及终端、存储介质
CN108121762A (zh) 一种图片处理方法、移动终端以及计算机存储介质
CN107943397A (zh) 一种便签生成方法、移动终端及计算机可读存储介质
CN110069320A (zh) 一种应用程序的分类校正方法、终端、系统及存储介质
CN108900696A (zh) 一种数据处理方法、终端和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180928