CN103246646B - 一种网络数据获取方法和装置 - Google Patents

一种网络数据获取方法和装置 Download PDF

Info

Publication number
CN103246646B
CN103246646B CN201210022277.5A CN201210022277A CN103246646B CN 103246646 B CN103246646 B CN 103246646B CN 201210022277 A CN201210022277 A CN 201210022277A CN 103246646 B CN103246646 B CN 103246646B
Authority
CN
China
Prior art keywords
file
network data
information
data link
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210022277.5A
Other languages
English (en)
Other versions
CN103246646A (zh
Inventor
刘刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210022277.5A priority Critical patent/CN103246646B/zh
Priority to BR112014018866A priority patent/BR112014018866A8/pt
Priority to PCT/CN2013/070352 priority patent/WO2013113255A1/en
Priority to US14/126,436 priority patent/US20140337696A1/en
Publication of CN103246646A publication Critical patent/CN103246646A/zh
Application granted granted Critical
Publication of CN103246646B publication Critical patent/CN103246646B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种网络数据获取方法和装置,该方法包括:获取终端发送的文件信息;根据所述文件信息获取对应的网络数据链接;将所述网络数据链接发送给所述终端,以供所述终端根据所述网络数据链接获取相应的网络数据。采用本发明提供的方法,可以提高网络数据获取的效率。

Description

一种网络数据获取方法和装置
技术领域
本发明涉及网络技术领域,特别涉及一种网络数据获取方法和装置。
背景技术
随着互联网技术的发展,数据下载已经成为了人们获取网络数据资源的一个重要的途径。数据下载技术也在随着网络技术的发展飞速的发展,不断涌现出了P2P(Peer toPeer,点对点)技术、P2SP(Peer to Server&Peer,点对服务器和点)技术、云下载技术(基于云计算的下载技术,就是常见的离线下载)等多种下载技术。
现有技术中,提供了基于上述下载技术的多种下载协议,包括HTTP(Hyper TextTransfer Protocol,超文本传输协议)、eMule协议、BT(Bit Torrent,比特流)协议等,每种协议都为用户提供了不同格式的链接,使用户可以链接到相应的网络资源进行数据下载,例如,在HTTP为用户提供的是URL(Uniform/Universal Resource Locator,统一资源定位符)链接,eMule协议为用户提供的是ed2k链接,BT协议为用户提供的是Torrent链接。
然而,发明人发现,现有技术至少存在如下问题:现有的下载技术,用户只能通过各种协议的链接才能连接到相应的网络资源,而在某些情况下,用户可以很方便的获悉到某些网络数据的信息,可该网络数据对应的链接却无法获取或者不能方便的直接获取(例如,用户在某论坛上浏览到某最新电影的海报,然而论坛中却没有直接提供该电影下载资源的链接),这时,用户将会通过各种网络途径,如通过网络搜索引擎查找,浏览各大网站以获取相应的链接,才能够完成下载,严重的影响了网络数据获取的效率,而且,网络用户数量非常庞大,每个用户多次的搜索和浏览等操作必然会造成巨大的网络资源浪费。
发明内容
本发明的目的在于提供一种网络数据获取方法和装置,以提高网络数据获取的效率,为此,本发明实施例采用如下技术方案:
获取终端发送的图片文件的文件信息;
根据存储的文件特征信息与网络数据链接的对应关系,匹配所述发送的文件信息的精确特征值,所述精确特征值是用于唯一确定所述图片文件的文件特征;
当匹配成功时,获取所述精确特征值对应的网络数据链接;
当匹配失败时,在存储的粗略特征值中查找与所述图片文件的粗略特征值接近度最高且接近度大于阈值的粗略特征值,并获取所述粗略特征值对应的网络数据链接,所述粗略特征值是用于描述所述图片文件的部分的文件特征;
将所获取的与所述图片文件相应的多个视频的网络数据链接、以及所述网络数据链接的描述信息发送给所述终端,以
供所述终端根据所述描述信息而选择的所述网络数据链接获取相应视频的网络数据。
一种网络数据获取方法,包括:
向服务器发送图片文件的文件信息,以供所述服务器根据所述文件信息获取对应的网络数据链接;
其中,所述服务器根据存储的文件特征信息与网络数据链接的对应关系,匹配所述发送的文件信息的精确特征值,所述精确特征值是用于唯一确定所述图片文件的文件特征,
当匹配成功时,获取所述精确特征值对应的网络数据链接,
当匹配失败时,在存储的粗略特征值中查找与所述图片文件的粗略特征值接近度最高且接近度大于阈值的粗略特征值,并获取所述粗略特征值对应的网络数据链接,所述粗略特征值是用于描述所述图片文件的部分的文件特征;
接收所述服务器发送的与所述图片文件相应的多个视频的网络数据链接、以及所述网络数据链接的描述信息;
根据所述描述信息所述网络数据链接获取与被选择的视频相应的网络数据。
一种服务器,包括:
接收模块,用于获取终端发送的图片文件的文件信息;
获取模块,用于根据所述文件信息获取对应的网络数据链接;
根据存储的文件特征信息与网络数据链接的对应关系,匹配所述发送的文件信息的精确特征值,所述精确特征值是用于唯一确定所述图片文件的文件特征;
当匹配成功时,获取所述精确特征值对应的网络数据链接;
当匹配失败时,在存储的粗略特征值中查找与所述图片文件的粗略特征值接近度最高且接近度大于阈值的粗略特征值,并获取所述粗略特征值对应的网络数据链接,所述粗略特征值是用于描述所述图片文件的部分的文件特征;
发送模块,用于将所获取的与所述图片文件相应的多个视频的网络数据链接、以及所述网络数据链接的描述信息发送给所述终端,以
供所述终端根据所述描述信息而选择的所述网络数据链接获取相应视频的网络数据。
一种终端,包括:
发送模块,用于向服务器发送图片文件的文件信息,以供所述服务器根据所述文件信息获取对应的网络数据链接;
其中,所述服务器根据存储的文件特征信息与网络数据链接的对应关系,匹配所述发送的文件信息的精确特征值,所述精确特征值是用于唯一确定所述图片文件的文件特征;
当匹配成功时,获取所述精确特征值对应的网络数据链接;
当匹配失败时,在存储的粗略特征值中查找与所述图片文件的粗略特征值接近度最高且接近度大于阈值的粗略特征值,并获取所述粗略特征值对应的网络数据链接,所述粗略特征值是用于描述所述图片文件的部分的文件特征;
接收模块,用于接收所述服务器发送的所获取的所述网络数据链接;
获取模块,用于根据所述描述信息而选择的所述网络数据链接获取相应视频的网络数据。
本发明的上述实施例,获取终端发送的文件信息,根据文件信息获取对应的网络数据链接,并将网络数据链接发送给终端,以供终端根据网络数据链接获取相应的网络数据,可以提高网络数据获取的效率。
附图说明
图1为本发明实施例提供的网络数据获取方法服务器侧的处理的流程示意图;
图2为本发明实施例提供的网络数据获取方法的网络架构示意图;
图3为本发明实施例提供的网络数据获取方法终端侧的处理的流程示意图;
图4为本发明实施例提供的网络数据获取方法中终端进行网络数据下载的流程示意图;
图5为本发明实施例提供的网络数据获取方法的处理流程示意图;
图6为本发明实施例提供的服务器的结构示意图;
图7为本发明实施例提供的终端的结构示意图。
具体实施方式
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例,服务器获取终端发送的文件信息,根据文件信息获取对应的网络数据链接,并将网络数据链接发送给终端,以供终端根据网络数据链接获取相应的网络数据,从而可以提高网络数据获取的效率。
如图1所示,为本发明实施例提供的网络数据获取方法服务器侧的处理的流程,具体包括以下步骤:
步骤101,服务器获取终端发送的文件信息。其中,该文件信息可以是文件数据代码,计算机存储文件使用的数据代码;也可以是文件特征信息,文件特征信息是描述文件特征或文件数据特征的信息(例如,文件的哈希值,图片文件的轮廓信息、关键点信息、亮度特征曲线等),该信息可以是通过对文件数据代码进行的数据分析或处理获得的数据,也可以是统一规定的标识信息。优选的,文件信息可以是图片文件的文件信息。
例如,某用户在浏览网络的过程中,如果浏览到某个电影的海报,希望能够观看相应的电影,可提供该海报的网站却没有提供相应的电影下载资源的链接,此时用户可以将此海报的图片文件发送给服务器,或将根据图片文件获取的文件特征信息发送给服务器。
步骤102,服务器根据文件信息获取对应的网络数据链接。
优选的,服务器可以存储文件特征信息与网络数据链接的对应关系。此对应关系具体可以通过链表的形式存储,文件特征信息作为主键,即文件特征信息可以作为查找网络数据链接的索引。在具体实施中,如图2所示的网络架构图,服务器可以由策略服务器和链接数据库组成,其中,链接数据库用于存储网络数据链接以及对应的文件特征信息,策略服务器则可以负责完成与终端、网络、链接数据库的交互以及文件特征信息获取等处理。
当文件信息为文件数据代码时,具体的处理过程可以是:服务器根据文件数据代码获取文件特征信息;服务器根据获取的文件特征信息,以及存储的文件特征信息与网络数据链接的对应关系,获取对应的网络数据链接。其中,服务器根据文件数据代码获取文件特征信息的过程可以是,例如计算文件数据代码的全文哈希值或部分哈希值,或者获取相应图片文件的轮廓信息、关键点信息、亮度特征曲线等信息。
当文件信息为文件特征信息时,具体的处理过程可以是:服务器直接根据获取的文件特征信息,以及存储的文件特征信息与网络数据链接的对应关系,获取对应的网络数据链接。
在具体实施中,可以由策略服务器根据接收或提取的文件特征信息查找链接数据库,以查找到终端所请求的文件对应的网络数据资源的链接。优选的,在策略服务器中可以设置Cache(高速缓存),在策略服务器查询链接数据库的过程中,可以将文件特征信息以及查找到的对应的网络数据链接存储在Cache中,并设置相应的老化机制,例如,Cache对每一条记录保存固定时长后则进行老化,另外,也可以根据相应条目被查询的频率设置保存时长,查询频率越高保存的时长越长。
优选的,可以将文件特征信息分类为精确特征值和粗略特征值。其中,精确特征值是能够唯一确定该文件数据代码特征的文件特征信息,如文件数据代码的哈希值,包括全文哈希值或部分哈希值;粗略特征值是能够描述文件部分特征的文件特征信息,如图片文件的轮廓信息、关键点信息、亮度特征曲线等。根据文件特征信息查找网络数据链接的过程,可以如下:
服务器根据存储的文件特征信息与网络数据链接的对应关系,匹配获取的文件特征信息中的精确特征值;如果匹配成功,服务器则获取该精确特征值对应的网络数据链接;如果匹配失败,服务器则在存储的粗略特征值中查找与获取的粗略特征值接近度最高且接近度大于阈值的粗略特征值,并获取该粗略特征值对应的网络数据链接。例如,如表1所示,链接数据库中存储了多种特征值与网络数据链接的对应关系,第一特征值为精确特征值,其他特征值为粗略特征值,服务器可以设置多个粗略特征值的匹配原则以及接近度计算方式,其中,文件特征信息对应的网络数据链接可以是一个或者多个。
表1
可见,上述查找过程可以分为精确查找(根据精确特征值进行网络数据链接查找)和粗略查找(根据粗略特征值进行网络数据链接查找)的过程,在精确查找不成功的情况下进行粗略查找。需要指出的是,精确查找和粗略查找可以按上述过程组合,同样也可以单独进行。采用精确查找的优点在于,查找结果不会出现错误,即只要精确特征值匹配,那么对应的网络数据链接一定能够连接到相应文件对应的网络资源。采用粗略查找的优点在于,即使用户获取到的文件与服务器中存储的文件存在一定差别,如图片文件的边缘被裁剪掉,但如果主体内容接近度足够高,也能够查找到对应的网络数据链接。
如果服务器根据其存储的文件特征信息与网络数据链接的对应关系,没有查找到与该文件特征值对应的网络数据链接,则服务器可以向终端返回资源查找失败的提示信息。
步骤103,服务器将网络数据链接发送给所述终端,以供终端根据所述网络数据链接获取相应的网络数据。该获取过程具体可以是下载相应的网络数据。
服务器获取到的网络数据链接可以是多个,服务器在向终端发送这些网络数据链接的时候,还可以向终端发送每个网络数据链接对应的网络资源的描述信息。例如,如终端向服务器发送了某电影海报的文件信息,服务器向终端发送的网络数据链接的数目为3个,服务器在发送给终端的信息中注明,链接1是相应影片的下载资源的链接,链接2是相应影片的片花下载资源,链接3是相应影片手机视频版本的下载资源的链接。终端可以将这些信息显示给用户,以供用户根据这些信息进行下载资源的选择。
在本发明的另一实施例中,服务器可以通过终端及其他服务器获取更多的网络数据链接以及对应的文件特征信息,以不断扩充链接数据库,具体过程可以是:服务器接收各终端和/或其他服务器发送的文件信息以及对应的网络数据链接;服务器根据该文件信息获取文件特征信息;服务器存储该文件特征信息与该网络数据链接的对应关系。
在实施过程中,可以在各终端的客户端中设置相应的功能,使终端在浏览网络的过程中,不断的保存对应有文件信息的网络数据链接。例如,在用户浏览网络的过程中,点击某网站提供的图片,链接到某下载资源,这时客户端则对该图片文件和该下载资源的链接进行保存;又例如,在用户浏览网络的过程中,获取到了某BT种子文件,客户端则对该BT种子文件中的图片文件(或文本文件)和网络数据链接进行保存。客户端还可以对保存的图片文件(或文本文件)和对应的网络数据链接进行筛选,过滤掉没有价值的网络数据链接(如跳转链接等)。终端可以将保存的文件信息和对应的网络数据链接按照预设的触发条件上报给服务器,例如,在客户端启动时上报,或定时上报等。
在实施过程中,可以在其他的服务器(如本网站的云端下载服务器集群)也安装类似终端客户端的软件,采用与上述终端类似的保存、筛选和上报机制,对文件信息和对应的网络数据链接进行保存并发送给服务器。下载服务器中相对于终端具有更丰富的数据资源,例如在云端下载服务器集群存储了大量的BT种子,可以获取BT种子中的图片以及网络资源链接。
进一步的,服务器可以对接收到的文件信息和对应的网络数据链接进行相应的管理,如将接收到的对应关系与服务器中存储的对应关系进行比较,如果重复则抛弃接收到的对应关系。
本发明的上述实施例,服务器获取终端发送的文件信息,根据文件信息获取对应的网络数据链接,并将网络数据链接发送给终端,以供终端根据网络数据链接获取相应的网络数据,以提高网络数据获取的效率。
如图3所示,为本发明实施例提供的网络数据获取方法终端侧的处理的流程,具体包括以下步骤:
步骤301,终端向服务器发送文件信息,以供服务器根据文件信息获取对应的网络数据链接。优选的,该文件信息可以是图片文件的文件信息。
终端获取到的文件信息一般是文件数据代码,所以具体的,终端可以根据文件数据代码获取文件特征信息,并将文件特征信息发送给所述服务器;或者,终端也可以直接将文件数据代码发送给服务器,由服务器根据文件数据代码获取相应的文件特征信息。
步骤302,终端接收服务器发送的网络数据链接。
步骤303,终端根据该网络数据链接获取相应的网络数据。该获取过程具体可以是下载相应的网络数据。
具体的,终端根据网络数据链接进行网络数据下载的过程可以如图4所示,包括以下步骤:
步骤1,获取网络数据链接。终端可以通过上述实施例的过程,根据用户提供的文件信息获取到对应的网络数据链接。
步骤2,终端将网络数据链接发送给资源索引服务器。用户在客户端软件中输入网络数据连接(如URL),客户端软件则将用户输入的网络数据连接上传到资源索引服务器。
步骤3,资源索引服务器根据网络数据链接,查找对应的网络数据的标识(文件的哈希值),以及存储有该网络数据的资源服务器,并将查找到的网络数据的标识和资源服务器的链接发送给终端。
资源索引服务器根据网络数据链接查找对应的文件哈希值,然后进一步根据文件哈希值查找存储有该文件的资源服务器,将查找到的文件哈希值和资源服务器的链接发送给终端。查找到的资源服务器可以为多个。
步骤4,终端将接收到的网络数据的标识发送给Tracker服务器。
步骤5,Tracker服务器根据网络数据标识查找正在下载(或已经下载完成)该网络数据的P2P终端,并将P2P终端的地址通知给终端。
各终端在下载网络数据的过程中可以在Tracker服务器注册,使Tracker服务器可以记录各网络数据的标识对应的正在下载(或已经下载完成)该网络数据的P2P终端。
步骤6,终端对网络数据进行下载。终端根据资源索引服务器提供的资源服务器的链接和Tracker服务器提供的P2P终端的地址,下载相应的网络数据。
需要指出的是,在进行完步骤3之后,终端就可以根据资源索引服务器提供的资源服务器的链接,下载相应的网络数据。
还可以包括步骤7,下载完成后终端将相关的统计信息(如下载用时、下载速率、各数据源所占的比例等)上报给统计服务器。
在上述步骤301-303的流程之外,在网络浏览的过程中,终端可以不断获取并保存文件信息以及对应的网络数据链接,并发送给所述服务器。具体的保存和发送的过程可以参照上述实施例的具体内容。
本发明的上述实施例,终端向服务器发送文件信息以供服务器根据文件信息获取对应的网络数据链接,接收服务器发送的网络数据链接,并根据该网络数据链接获取相应的网络数据,以提高网络数据获取的效率。
如图5所示,为本发明实施例提供的网络数据获取方法在具体的应用场景中的处理流程,具体包括以下步骤:
步骤501,终端向服务器发送图片文件的文件信息。例如,某用户在浏览网页的过程中,获取到某影片的相关图片(如海报),可以将该图片文件指示给客户端软件,客户端软件可以将该图片文件上传给服务器,或者将该图片文件的文件特征信息发送给服务器。
步骤502,服务器根据图片文件的文件信息,获取对应的网络数据链接。
服务器可以预先存储图片文件的文件特征信息(例如,图片文件的哈希值、轮廓信息、关键点信息、亮度特征曲线等)与网络数据链接的对应关系,根据此对应关系获取图片文件对应的网络数据链接,具体过程可以参照步骤102中的相关内容。
步骤503,服务器将图片文件对应的网络数据链接发送给所述终端。一个图片文件可能对应多个网络数据链接,服务器可以将多个网络数据链接都发送给终端,并将各网络数据链接的相关信息(如影片名称、内容简介等)也发送给终端。
步骤504,终端根据接收到的网络数据链接获取相应的网络数据。
具体的,当终端接收到服务器发送的多个网络数据链接和相关信息时,可以通过客户端软件将各网络数据链接和相关信息显示给用户,供用户选择,当用户选择相应的网络数据链接后,终端则可以根据用户选择的网络数据链接进行相应的数据下载。
本发明的上述实施例,终端向服务器发送图片文件的文件信息,服务器根据文件信息获取对应的网络数据链接,并将网络数据链接发送给终端,以供终端根据网络数据链接获取相应的网络数据,以提高网络数据获取的效率。
基于相同的技术构思,本发明实施例还提供了一种服务器,如图6所示,该服务器可以包括:
接收模块610,用于获取终端发送的文件信息;
获取模块620,用于根据所述文件信息获取对应的网络数据链接;
发送模块630,用于将所述网络数据链接发送给所述终端,以供所述终端根据所述网络数据链接获取相应的网络数据。
优选的,还包括存储模块640,用于存储文件特征信息与网络数据链接的对应关系;
所述文件信息具体为文件数据代码;
所述获取模块620,具体用于:
根据所述文件数据代码获取文件特征信息;
根据获取的文件特征信息,以及所述存储模块640存储的文件特征信息与网络数据链接的对应关系,获取对应的网络数据链接。
优选的,还包括存储模块640,用于存储文件特征信息与网络数据链接的对应关系;
所述文件信息具体为文件特征信息;
所述获取模块620,具体用于:
根据获取的文件特征信息,以及所述存储模块640存储的文件特征信息与网络数据链接的对应关系,获取对应的网络数据链接。
优选的,所述文件特征信息包括精确特征值和粗略特征值;
所述获取模块620,具体用于:
根据所述存储模块640存储的文件特征信息与网络数据链接的对应关系,匹配获取的文件特征信息中的精确特征值;
如果匹配成功,则获取该精确特征值对应的网络数据链接;
如果匹配失败,则在所述存储模块640存储的粗略特征值中查找与获取的文件特征信息中的粗略特征值接近度最高且接近度大于阈值的粗略特征值,并获取该粗略特征值对应的网络数据链接。
优选的,所述存储模块640,还用于:
接收各终端和/或其他服务器发送的文件信息以及对应的网络数据链接;
根据该文件信息获取文件特征信息;
存储该文件特征信息与该网络数据链接的对应关系。
本发明的上述实施例,服务器获取终端发送的文件信息,根据文件信息获取对应的网络数据链接,并将网络数据链接发送给终端,以供终端根据网络数据链接获取相应的网络数据,以提高网络数据获取的效率。
基于相同的技术构思,本发明实施例还提供了一种终端,如图7所示,该终端可以包括:
发送模块710,用于向服务器发送文件信息,以供所述服务器根据所述文件信息获取对应的网络数据链接;
接收模块720,用于接收所述服务器发送的所述网络数据链接;
获取模块730,用于根据所述网络数据链接获取相应的网络数据。
优选的,所述发送模块710,具体用于:
根据文件数据代码获取文件特征信息,并将所述文件特征信息发送给所述服务器;或者,
将文件数据代码发送给所述服务器。
优选的,还包括:
上报模块740,用于获取文件信息以及对应的网络数据链接,并发送给所述服务器。
本发明的上述实施例,终端向服务器发送文件信息以供服务器根据文件信息获取对应的网络数据链接,接收服务器发送的网络数据链接,并根据该网络数据链接获取相应的网络数据,以提高网络数据获取的效率。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台终端设备(可以是手机,个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (15)

1.一种网络数据获取方法,其特征在于,包括:
获取终端发送的图片文件的文件信息;
根据存储的文件特征信息与网络数据链接的对应关系,匹配所述发送的文件信息的精确特征值,所述精确特征值是用于唯一确定所述图片文件的文件特征;
当匹配成功时,获取所述精确特征值对应的网络数据链接;
当匹配失败时,在存储的粗略特征值中查找与所述图片文件的粗略特征值接近度最高且接近度大于阈值的粗略特征值,并获取所述粗略特征值对应的网络数据链接,所述粗略特征值是用于描述所述图片文件的部分的文件特征;
将所获取的与所述图片文件相应的多个视频的网络数据链接、以及所述网络数据链接的描述信息发送给所述终端,以
供所述终端根据所述描述信息而选择的所述网络数据链接获取相应视频的网络数据。
2.如权利要求1所述的方法,其特征在于,还包括:
预先存储文件特征信息与网络数据链接的对应关系,所述图片文件的文件信息为文件数据代码;
根据所述文件数据代码获取所述图片文件的文件特征信息;
根据获取的文件特征信息,以及存储的文件特征信息与网络数据链接的对应关系,获取对应的网络数据链接。
3.如权利要求1所述的方法,其特征在于,还包括:
预先存储文件特征信息与网络数据链接的对应关系,所述图片文件的文件信息为文件特征信息。
4.如权利要求2或3所述的方法,其特征在于,还包括:
接收各终端和/或各服务器发送的文件信息以及对应的网络数据链接;
根据所述文件信息获取文件特征信息;
存储所述文件特征信息与所述网络数据链接的对应关系。
5.一种网络数据获取方法,其特征在于,包括:
向服务器发送图片文件的文件信息,以供所述服务器根据所述文件信息获取对应的网络数据链接;
其中,所述服务器根据存储的文件特征信息与网络数据链接的对应关系,匹配所述发送的文件信息的精确特征值,所述精确特征值是用于唯一确定所述图片文件的文件特征,
当匹配成功时,获取所述精确特征值对应的网络数据链接,
当匹配失败时,在存储的粗略特征值中查找与所述图片文件的粗略特征值接近度最高且接近度大于阈值的粗略特征值,并获取所述粗略特征值对应的网络数据链接,所述粗略特征值是用于描述所述图片文件的部分的文件特征;
接收所述服务器发送的与所述图片文件相应的多个视频的网络数据链接、以及所述网络数据链接的描述信息;
根据所述描述信息所述网络数据链接获取与被选择的视频相应的网络数据。
6.如权利要求5所述的方法,其特征在于,所述向服务器发送文件信息,包括:
根据文件数据代码获取文件特征信息,并将所述文件特征信息发送给所述服务器;或者,
将文件数据代码发送给所述服务器。
7.如权利要求5所述的方法,其特征在于,还包括:
获取文件信息以及对应的网络数据链接,并发送给所述服务器。
8.一种服务器,其特征在于,包括:
接收模块,用于获取终端发送的图片文件的文件信息;
获取模块,用于根据所述文件信息获取对应的网络数据链接;
根据存储的文件特征信息与网络数据链接的对应关系,匹配所述发送的文件信息的精确特征值,所述精确特征值是用于唯一确定所述图片文件的文件特征;
当匹配成功时,获取所述精确特征值对应的网络数据链接;
当匹配失败时,在存储的粗略特征值中查找与所述图片文件的粗略特征值接近度最高且接近度大于阈值的粗略特征值,并获取所述粗略特征值对应的网络数据链接,所述粗略特征值是用于描述所述图片文件的部分的文件特征;
发送模块,用于将所获取的与所述图片文件相应的多个视频的网络数据链接、以及所述网络数据链接的描述信息发送给所述终端,以
供所述终端根据所述描述信息而选择的所述网络数据链接获取相应视频的网络数据。
9.如权利要求8所述的服务器,其特征在于,所述服务器还包括:
存储模块,用于存储文件特征信息与网络数据链接的对应关系,所述图片文件的文件信息具体为文件数据代码;
所述获取模块,具体用于:
根据所述文件数据代码获取所述图片文件的文件特征信息,所述获取的文件特征信息为所述图片文件的哈希值;
根据获取的文件特征信息,以及所述存储模块存储的文件特征信息与网络数据链接的对应关系,获取对应的网络数据链接。
10.如权利要求8所述的服务器,其特征在于,所述服务器还包括:
存储模块,用于存储文件特征信息与网络数据链接的对应关系,所述图片文件的文件信息为文件特征信息;
所述获取模块,具体用于:
根据获取的文件特征信息,以及所述存储模块存储的文件特征信息与网络数据链接的对应关系,获取对应的网络数据链接。
11.如权利要求9或10所述的服务器,其特征在于,所述文件特征信息包括精确特征值和粗略特征值;
所述获取模块,具体用于:
根据所述存储模块存储的文件特征信息与网络数据链接的对应关系,匹配获取的文件特征信息中的精确特征值;
如果匹配成功,则获取所述精确特征值对应的网络数据链接;
如果匹配失败,则在所述存储模块存储的粗略特征值中查找与获取的文件特征信息中的粗略特征值接近度最高且接近度大于阈值的粗略特征值,并获取所述粗略特征值对应的网络数据链接。
12.如权利要求9或10所述的服务器,其特征在于,所述存储模块,还用于:
接收各终端和/或其他服务器发送的文件信息以及对应的网络数据链接;
根据所述文件信息获取文件特征信息;
存储所述文件特征信息与所述网络数据链接的对应关系。
13.一种终端,其特征在于,包括:
发送模块,用于向服务器发送图片文件的文件信息,以供所述服务器根据所述文件信息获取对应的网络数据链接;
其中,所述服务器根据存储的文件特征信息与网络数据链接的对应关系,匹配所述发送的文件信息的精确特征值,所述精确特征值是用于唯一确定所述图片文件的文件特征;
当匹配成功时,获取所述精确特征值对应的网络数据链接;
当匹配失败时,在存储的粗略特征值中查找与所述图片文件的粗略特征值接近度最高且接近度大于阈值的粗略特征值,并获取所述粗略特征值对应的网络数据链接,所述粗略特征值是用于描述所述图片文件的部分的文件特征;
接收模块,用于接收所述服务器发送的所获取的所述网络数据链接;
获取模块,用于根据所述描述信息而选择的所述网络数据链接获取相应视频的网络数据。
14.如权利要求13所述的终端,其特征在于,所述发送模块,具体用于:
根据文件数据代码获取文件特征信息,并将所述文件特征信息发送给所述服务器;或者,
将文件数据代码发送给所述服务器。
15.如权利要求13所述的终端,其特征在于,还包括:
上报模块,用于获取文件信息以及对应的网络数据链接,并发送给所述服务器。
CN201210022277.5A 2012-02-01 2012-02-01 一种网络数据获取方法和装置 Active CN103246646B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201210022277.5A CN103246646B (zh) 2012-02-01 2012-02-01 一种网络数据获取方法和装置
BR112014018866A BR112014018866A8 (pt) 2012-02-01 2013-01-11 Método e aparalho para obtenção de dados da web
PCT/CN2013/070352 WO2013113255A1 (en) 2012-02-01 2013-01-11 Method and apparatus for obtaining web data
US14/126,436 US20140337696A1 (en) 2012-02-01 2013-01-11 Method and apparatus for obtaining web data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210022277.5A CN103246646B (zh) 2012-02-01 2012-02-01 一种网络数据获取方法和装置

Publications (2)

Publication Number Publication Date
CN103246646A CN103246646A (zh) 2013-08-14
CN103246646B true CN103246646B (zh) 2019-07-16

Family

ID=48904407

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210022277.5A Active CN103246646B (zh) 2012-02-01 2012-02-01 一种网络数据获取方法和装置

Country Status (4)

Country Link
US (1) US20140337696A1 (zh)
CN (1) CN103246646B (zh)
BR (1) BR112014018866A8 (zh)
WO (1) WO2013113255A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105577712B (zh) * 2014-10-10 2019-06-11 腾讯科技(深圳)有限公司 一种文件上传方法、装置和系统
CN106412715A (zh) * 2016-09-14 2017-02-15 华为软件技术有限公司 一种信息检索方法、终端以及服务器
CN109190077B (zh) * 2018-08-23 2020-07-07 Oppo广东移动通信有限公司 收藏信息的处理方法、装置、存储介质及电子设备
CN110134805A (zh) * 2019-05-20 2019-08-16 北京字节跳动网络技术有限公司 图片类评论数据的网络存储方法、装置、电子设备及介质
US11250153B2 (en) * 2019-09-06 2022-02-15 Microsoft Technology Licensing, Llc Techniques for detecting publishing of a private link
CN111597479A (zh) * 2020-04-18 2020-08-28 北京奇保信安科技有限公司 一种用于终端的图片智能加载方法、装置和电子设备

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5579471A (en) * 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
US7840892B2 (en) * 2003-08-29 2010-11-23 Nokia Corporation Organization and maintenance of images using metadata
CN100418330C (zh) * 2006-06-06 2008-09-10 北京北大方正电子有限公司 一种基于预测搜索的网络文件传输方法
JP5029030B2 (ja) * 2007-01-22 2012-09-19 富士通株式会社 情報付与プログラム、情報付与装置、および情報付与方法
US7836060B1 (en) * 2007-04-13 2010-11-16 Monster Worldwide, Inc. Multi-way nested searching
US8364660B2 (en) * 2008-07-11 2013-01-29 Videosurf, Inc. Apparatus and software system for and method of performing a visual-relevance-rank subsequent search
JP5173721B2 (ja) * 2008-10-01 2013-04-03 キヤノン株式会社 文書処理システム及びその制御方法、プログラム、記憶媒体
US8452794B2 (en) * 2009-02-11 2013-05-28 Microsoft Corporation Visual and textual query suggestion
CN201422118Y (zh) * 2009-04-01 2010-03-10 升东网络科技发展(上海)有限公司 即时通讯中的多媒体传输系统
CN101854278A (zh) * 2009-04-01 2010-10-06 升东网络科技发展(上海)有限公司 即时通讯中的多媒体传输系统和方法
US20110119293A1 (en) * 2009-10-21 2011-05-19 Randy Gilbert Taylor Method And System For Reverse Pattern Recognition Matching
US8433140B2 (en) * 2009-11-02 2013-04-30 Microsoft Corporation Image metadata propagation
CN102065110A (zh) * 2009-11-12 2011-05-18 钟惠波 一种基于p2sp的客户端软件在线升级的方法和系统
CN102012934A (zh) * 2010-11-30 2011-04-13 百度在线网络技术(北京)有限公司 图片搜索方法及搜索系统
US9098533B2 (en) * 2011-10-03 2015-08-04 Microsoft Technology Licensing, Llc Voice directed context sensitive visual search

Also Published As

Publication number Publication date
US20140337696A1 (en) 2014-11-13
CN103246646A (zh) 2013-08-14
BR112014018866A2 (zh) 2017-06-20
BR112014018866A8 (pt) 2017-07-11
WO2013113255A1 (en) 2013-08-08

Similar Documents

Publication Publication Date Title
US10262045B2 (en) Application representation for application editions
US10667101B2 (en) Contextual deep linking of applications
CN103246646B (zh) 一种网络数据获取方法和装置
US8612416B2 (en) Domain-aware snippets for search results
CN103365865B (zh) 数据存储方法、数据下载方法及其装置
US20150227496A1 (en) Method and system for microblog resource sharing
CN104333531B (zh) 网络资源的分享及获取方法、装置、终端
US20160259818A1 (en) Searching for Software Applications Based on Application Attributes
US20160004774A1 (en) Information recommendation method and apparatus and information recommendation system
WO2015043428A1 (en) Method, system, browser and proxy server for loading webpage
US10372769B2 (en) Displaying results, in an analytics visualization dashboard, of federated searches across repositories using as inputs attributes of the analytics visualization dashboard
US11423096B2 (en) Method and apparatus for outputting information
CN102184185A (zh) 一种用于多媒体资源搜索的方法与设备
US20150169751A1 (en) Client state result de-duping
US10311070B2 (en) Candidate topic picker for digital magazine
US9824149B2 (en) Opportunistically solving search use cases
US20180337930A1 (en) Method and apparatus for providing website authentication data for search engine
CN106332556A (zh) 传输云端文件的方法、终端及云端服务器
US20130060802A1 (en) Exposing file metadata as ldap attributes
US9973597B1 (en) Differential dictionary compression of network-accessible content
CN103389989A (zh) 一种跨社区搜索方法和装置
CN101340463A (zh) 一种确定网络资源类型的方法和装置
CN105357270A (zh) 信息推荐方法、装置及服务器
CN103577545B (zh) 一种用于提供待发送信息的方法及装置
CN110770778B (zh) 信息处理方法及相关产品

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant