CN104978337A - 一种基于软件定义网络的分布式视频搜索引擎框架 - Google Patents

一种基于软件定义网络的分布式视频搜索引擎框架 Download PDF

Info

Publication number
CN104978337A
CN104978337A CN201410138024.3A CN201410138024A CN104978337A CN 104978337 A CN104978337 A CN 104978337A CN 201410138024 A CN201410138024 A CN 201410138024A CN 104978337 A CN104978337 A CN 104978337A
Authority
CN
China
Prior art keywords
url
key frame
format file
search engine
video format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410138024.3A
Other languages
English (en)
Inventor
张军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201410138024.3A priority Critical patent/CN104978337A/zh
Publication of CN104978337A publication Critical patent/CN104978337A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种基于软件定义网络的分布式视频搜索引擎框架,其具体步骤如下:构建一套分布式内存对象缓存系统,作为代理服务器,用于在动态系统中减少数据库负载;通过METAFILE的链路,实现对URL和关键帧的提取及索引并建立URL与关键帧映射;构建高可用的负载均衡服务器集群,存储已索引的URL和关键帧;利用关键词对指向视频格式文件地址的URL进行检索;对检索结果再进行关键帧的精准检索,通过关键帧与URL的映射,确定指向视频格式文件地址的URL,获得视频格式文件;主干网络可运行在OpenFlow上,并且通过网络链接分布在全球各地的数据中心,提高广域线路的利用率。

Description

一种基于软件定义网络的分布式视频搜索引擎框架
技术领域
本发明涉及一种基于软件定义网络的分布式视频搜索引擎框架 
背景技术
目前搜索引擎只针对文本进行搜索,还不能对音乐、图片和视频等多媒体文件进行搜索,原因主要是多媒体数据量太大;如何索引多媒体文件;进而对处理过的多媒体文件检索。现在因特网上有大量的多媒体文件,特别是社交网站和多媒体分享的兴起,需要对多媒体文件进行精准检索。 
网络爬虫,也称网络蜘蛛、网络机器人,是一个自动提取网页的程序,它从因特网上下载网页,是搜索引擎的重要组成部分。网络爬虫利用标准的HTTP协议,根据超级链接和Web文档检索的方法遍历因特网信息空间。因特网上有数千种不同的数据类型,HTTP给每种要通过Web传输的对象都打上了名为MIME类型的数据格式标签。统一资源定位符(URL)是资源标识符最常见的形式。URL描述了一台特定服务器上某资源的特定位置。元素文件(METAFILE)可提供有关页面的元信息,如针对搜索引擎和更新频度的描述和关键词,可针对元素的关键词进行索引。 
要对多媒体文件进行精准检索,首先要提供高可用的负载均衡服务器集群,存储标注的多媒体文件;其次要有一套分布式内存对象缓存系统,作为代理服务器,用于在动态系统中减少数据库负载,实现对多媒体文件的爬取索引;还可用软件定义网络(Software Defined Network,SDN),其核心技术OpenFlow通过将网络设备控制面与数据面分离开来,从而实现了网络流量的灵活控制;最后利用关键词对视频格式文件进行检索,再对检索结果进行关键帧的精准检索。 
本发明提供了一种基于软件定义网络的分布式视频搜索引擎用户界面、检索排名、缓存爬取以及服务器集群框架,主干网络可运行在OpenFlow上,并且通过网络链接分布在全球各地的数据中心,提高广域线路的利用率。 
发明内容
本发明的目的在于提供一种基于软件定义网络的分布式视频搜索引擎框架。本发明包括以下特征: 
发明技术方案 
一种基于软件定义网络的分布式视频搜索引擎框架,其具体步骤如下: 
1)构建一套分布式内存对象缓存系统,作为代理服务器,用于在动态系统中减少数据库负载; 
2)通过METAFILE的链路,实现对URL和关键帧的提取及索引并建立URL与关键帧映射; 
3)构建高可用的负载均衡服务器集群,存储已索引的URL和关键帧; 
4)利用关键词对指向视频格式文件地址的URL进行检索; 
5)对检索结果再进行关键帧的精准检索,通过关键帧与URL的映射,确定指向视频格式文件地址的URL,获得视频格式文件; 
6)主干网络可运行在OpenFlow上,并且通过网络链接分布在全球各地的数据中心,提高广域线路的利用率。 
附图说明
图1是基于关键词和关键帧的二级视频搜索引擎框架图;图2是一致性散列算法的原理图;图3是高可用的LVS集群拓扑结构图。 
具体实施方式
这种基于软件定义网络的分布式视频搜索引擎框架,包括如下步骤: 
1)构建一套分布式内存对象缓存系统,作为代理服务器见附图2,用于在动态系统中减少数据库负载; 
2)通过METAFILE的链路,实现对URL和关键帧的提取及索引并建立URL与关键帧映射; 
3)构建高可用的负载均衡服务器集群见附图3,存储已索引的URL和关键帧; 
4)利用关键词对指向视频格式文件地址的URL进行检索; 
5)对检索结果再进行关键帧的精准检索,通过关键帧与URL的映射,确定指向视频格式文件地址的URL,获得视频格式文件; 
6)主干网络可运行在OpenFlow上,并且通过网络链接分布在全球各地的数据中心,提高广域线路的利用率。 

Claims (1)

1.一种基于软件定义网络的分布式视频搜索引擎框架,其具体步骤如下:
1)构建一套分布式内存对象缓存系统,作为代理服务器,用于在动态系统中减少数据库负载;
2)通过METAFILE的链路,实现对URL和关键帧的提取及索引并建立URL与关键帧映射;
3)构建高可用的负载均衡服务器集群,存储已索引的URL和关键帧;
4)利用关键词对指向视频格式文件地址的URL进行检索;
5)对检索结果再进行关键帧的精准检索,通过关键帧与URL的映射,确定指向视频格式文件地址的URL,获得视频格式文件;
6)主干网络可运行在OpenFlow上,并且通过网络链接分布在全球各地的数据中心,提高广域线路的利用率。
CN201410138024.3A 2014-04-08 2014-04-08 一种基于软件定义网络的分布式视频搜索引擎框架 Pending CN104978337A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410138024.3A CN104978337A (zh) 2014-04-08 2014-04-08 一种基于软件定义网络的分布式视频搜索引擎框架

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410138024.3A CN104978337A (zh) 2014-04-08 2014-04-08 一种基于软件定义网络的分布式视频搜索引擎框架

Publications (1)

Publication Number Publication Date
CN104978337A true CN104978337A (zh) 2015-10-14

Family

ID=54274852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410138024.3A Pending CN104978337A (zh) 2014-04-08 2014-04-08 一种基于软件定义网络的分布式视频搜索引擎框架

Country Status (1)

Country Link
CN (1) CN104978337A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107145603A (zh) * 2017-06-08 2017-09-08 上海德衡数据科技有限公司 一种针对关键词的网络文档搜索引擎框架
CN107273540A (zh) * 2017-07-05 2017-10-20 北京三快在线科技有限公司 分布式搜索及索引更新方法、系统、服务器及计算机设备
CN108924603A (zh) * 2018-07-31 2018-11-30 复旦大学 基于软件定义WiFi的多终端流媒体播放系统和方法
CN109246141A (zh) * 2018-10-26 2019-01-18 电子科技大学 一种基于sdn的反过度爬虫方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102957672A (zh) * 2011-08-25 2013-03-06 中国电信股份有限公司 自适应播放flv媒体流的方法、客户端和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102957672A (zh) * 2011-08-25 2013-03-06 中国电信股份有限公司 自适应播放flv媒体流的方法、客户端和系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107145603A (zh) * 2017-06-08 2017-09-08 上海德衡数据科技有限公司 一种针对关键词的网络文档搜索引擎框架
CN107273540A (zh) * 2017-07-05 2017-10-20 北京三快在线科技有限公司 分布式搜索及索引更新方法、系统、服务器及计算机设备
CN107273540B (zh) * 2017-07-05 2021-09-24 北京三快在线科技有限公司 分布式搜索及索引更新方法、系统、服务器及计算机设备
CN108924603A (zh) * 2018-07-31 2018-11-30 复旦大学 基于软件定义WiFi的多终端流媒体播放系统和方法
CN109246141A (zh) * 2018-10-26 2019-01-18 电子科技大学 一种基于sdn的反过度爬虫方法
CN109246141B (zh) * 2018-10-26 2021-03-12 电子科技大学 一种基于sdn的反过度爬虫方法

Similar Documents

Publication Publication Date Title
US8903800B2 (en) System and method for indexing food providers and use of the index in search engines
CN107623729B (zh) 一种缓存方法、设备及缓存服务系统
CN106933871B (zh) 短链接处理方法、装置及短链接服务器
CN102164186B (zh) 一种实现云搜索服务的方法及系统
US20130080576A1 (en) Historical browsing session management
CN102651750B (zh) 一种提供网页信息的方法、系统及装置
CN103747112A (zh) 一种cdn回源的方法、第一服务器及系统
WO2012155593A1 (zh) 一种用网页进行本地调用的方法和系统
CN103347089A (zh) 一种对网站动态资源和静态资源分离加速的方法及装置
CN104778208A (zh) 一种搜索引擎 seo 网站数据的优化抓取方法及系统
CN104283723A (zh) 网络访问日志处理方法及装置
CN104978337A (zh) 一种基于软件定义网络的分布式视频搜索引擎框架
WO2013049025A1 (en) Historical browsing session management
CN104199893B (zh) 一种快速将全媒体内容发布的系统和方法
CN103139252B (zh) 一种网络代理缓存加速的实现方法及其装置
JP6453464B2 (ja) 検索エンジンにウェブサイト認証データを提供するための方法及び装置
CN104980464A (zh) 一种网络请求处理方法、网络服务器和网络系统
CN106776694A (zh) 一种基于软件定义的网络分布式图片搜索引擎框架
CN104572981A (zh) 一种网页页面缓存处理方法和移动终端设备
WO2014146448A1 (en) Method and system for synchronizing browser bookmarks
CN105740251B (zh) 一种总线式整合不同内容源的方法和系统
CN101257501B (zh) 数据导入方法、系统及Web服务器
CN103823855A (zh) 面向语义网的中文百科知识组织与集成方法
CN104978338A (zh) 一种针对视频格式的网络爬虫提取url并索引及与关键帧映射的框架
US20160156693A1 (en) System and Method for the Management of Content on a Website (URL) through a Device where all Content Originates from a Secured Content Management System

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151014