TW200935245A - System and method for providing visibility for dynamic webpages - Google Patents

System and method for providing visibility for dynamic webpages Download PDF

Info

Publication number
TW200935245A
TW200935245A TW097142448A TW97142448A TW200935245A TW 200935245 A TW200935245 A TW 200935245A TW 097142448 A TW097142448 A TW 097142448A TW 97142448 A TW97142448 A TW 97142448A TW 200935245 A TW200935245 A TW 200935245A
Authority
TW
Taiwan
Prior art keywords
static
web page
dynamic
copy
webpage
Prior art date
Application number
TW097142448A
Other languages
English (en)
Inventor
Thomas C Kwon
Michael Hanna
Viktor A Svirnovskiy
Original Assignee
Altruik Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Altruik Inc filed Critical Altruik Inc
Publication of TW200935245A publication Critical patent/TW200935245A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

200935245 九、發明說明: 【發明所屬之技術領域】 本發明係關於-提供動態網頁之可視性之系統及方法, . 例如藉由提供供一 webcrawler遍歷之一種形式之網頁β • 此申請案主張優先於2007年丨丨月2日提出申請第 61/〇〇1,600號美國臨時專利申請案及2〇〇8年i月29曰提出申 請第12/021,892號美國專利申請案,該等申請案之全文以 參考方式併入本文中。 © 【先前技術】
Web伺服器提供靜態及動態網頁以(例如)供一運行一评讣 劉覽器之使用者終端機存取。靜態網頁係彼等回應於來自 使用者終端機之請求而提供固定内容(例如,固定文字)、 至其他頁之鏈路及指向擋案之嵌入式指針之網頁,該等網 頁經摘取並被傳輸至該使用者終端機以藉助嵌入該等網頁 中之所參考棺案再現該等網頁。與其相反,動態網頁係彼 〇 “應於不同背景或條件下之請求,提供不同内容之頁, 該等不同内容係(例如)藉由自一(例如)由一 _伺服器維持 .4與其鏈路之資料庫搜索並操取内容資料而動態產生。此 '夕卜由於儲存於資料庫中之内容資料可根據外部資訊源週 期性地進行更新,因此,即使在不同時間之相同條件下, 一動態網頁可向使用者終端機供應不同網頁。
WebCrawle4自動遍歷網頁且給其加索引以使得該等網 頁可作為自一Web搜索引擎所獲得之結果藉由-web劉覽 器返回之程式。例如,回應於一關鍵字搜索,—㈣搜索 135910.doc 200935245 引擎可產生一與該關鍵字相關之網頁之鏈路清單,且因此 知供該等網頁之可視性。然而,webcrawler通常經組態以 使得其僅遍歷靜態網頁而不遍歷動態網頁。此約束之一個 原因係webcrawler可在動態網頁可基於其產生之大量資料 庫資料内”丟失”,且可甚至被同一動態網頁内之一網頁鏈 路迴路”捕捉”而無法逃離以遍歷其他網頁並給其加索引。 ❹ 由於webcrawler通常不給動態網頁加索引,因此該等動 態網頁可處於一幾乎不可視狀態,在此狀態中,該等動態 網頁並不作為搜索引擎結果藉由web瀏覽器而返回。因 此,其可僅藉由直接輸入動態網頁之一位址(例如,一統 -貝源疋位器(URL)位址)或經由(例如)嵌入於其他網頁中 之鏈路來存取。將一網站包含在搜索引擎結果中通常在較 大程度上確定了訊務量及因此該網站可產生之收益。因 此’開發一為動態網頁提供可視性且促進其作為搜索引擎 結果而返回之系統及方法係重要。 【發明内容】 本發明之例示性實施例提供—提供具有增加之可視性之 動態網頁之系統及方法(例如)以使得該等動態網頁 一—覽器搜索之結果而提供。-棚截器模組可在回應 於一對動態網頁之請求(例如,回應於在1㈣覽器應用 ^:輸人該等動態網頁之狐)而在抑㈣服 生 網頁並返回時獲得該等動態網頁之—副本。^ = L網頁之該副本可作為對應動態網頁^動 靜態網百蝕左取山 肝〜、版本儲存於一 » 。該等對應動態網頁之靜態版本可適合 135910.doc 200935245 於供webcrawler遍歷。該靜態網頁料器可給該等靜態頁 編索引且以任何傳統方式將該索引提供至一 webcrawler以 供該webcrawler遍歷。 * 在本發明之-實例性實施例中,-用於向-搜索引擎提 供一動態網頁之可視性之系統可包含:一web伺服器及一 靜態網頁健存器。該web伺服器可進-步包含-網頁產生 器,其經組態以例如回應於一使用纟對一網頁之請求,基 於來自-第-内容資料庫之資料動態地產生該網頁;及一 ’周、頁攔截器模組’其經組態以捕獲—與該網頁相關之網頁 資料之第-版本。該靜態網頁儲存器可經組態以將來自該 web飼服器之網頁資料之該第一版本轉換為一適合於一搜 索引擎搜索之網頁資料之第二版本。該web伺服器可進一 步包含一網頁登記器,其經組態以記錄該網頁攔截器模組 及該網頁產生器之活動。回應於該使用者請求,該網頁產 生器可自該第一N容資料庫請求資料以用於產生該動態網 ❹頁 在本發明之一實例性實施例中,該網頁攔截器模組係該 web伺服器之一能夠將網頁資料之第一版本提供至該靜態 網頁儲存器之插入程式。該網頁攔截器模組可進一步包含 用於將網頁資料之第一版本儲存於該web伺服器中之臨 時快取。然後該臨時快取可根據一排程將網頁資料之第一 版本傳輸至該靜態網頁儲存器。 在本發明之一實例性實施例中,一第二内容資料庫可儲 存該網頁資料之第二版本。該靜態網頁儲存器可存取並更 135910.doc 200935245 新該第二内容資料庫。該靜態網頁儲存器可進一步包含一 網頁索引產生器,其經組態以產生該第二内容資料庫之内 谷之一索引,及一網頁重定向器,其經組態以使一使用者 • 對與網頁資料之第:版本對應之網頁之請求自該靜態網頁 . 儲存器重定向至該㈣伺服器。在本發明之一替代實施例 中’回應於該使用者請求,該靜態網頁储存器可將一基於 儲存於該第二内容資料庫中之網頁資料之第二版本之網頁 直接傳輸至該使用者。 4網頁資料之第二版本可包含自網頁資料之第—版本得 出之關鍵字及最佳化資料。 在本發明之一實例性實施例中,一用於提供一動態網頁 °視f·生之;$^套可包含:藉由一 飼服$之一網頁搁截 器模組攔截一對一網頁之請求;該網頁攔截器模組回應於 接收所棚截之請求自該web飼服器之一網頁產生器請求該 網頁;確定該所請求之網頁是否儲存於一臨時快取中;若 〇 定’周頁不存在於該臨時快取中,則將與該網頁相關之 .網頁資料之第—版本健存於該臨時快取中;根據-排程將 頁資料之第—版本傳輸至一靜態網頁儲存器,·及將該 頁貝料之第一版本轉換成一適合於一搜索引擎搜索之網 頁資料之第二版本。 在本發明之-實例性實施例中,該方法可進—步包含: 靜態網頁儲存器之一條件,由一内部说―螭 ▲_提供動;i網頁之網站以在該靜態網頁儲存器中產生網 頁資枓之一最初第一版本及網頁資料之一最初第二版本。 I35910.doc 200935245 在實例I·生實施例中,該條件係該靜態内容資料庫缺乏靜 …網頁内谷在此情況下,運行一内部webcrawler來提供 該網站之最初可視性可係有利的。 在本發明之一實例性實施例中該方法可進一步包含將 該網頁棚截器模組及該網頁產生器之活動記錄在一駐存於 o web飼服器中之登g己器模組中,(例 >)以用於存播及除 錯之目的。 ❹ ❹ 在實例)·生實施例中,該方法可進一步包含將自該產生 器所產生之網頁傳輸至一使用者終端機。 在-實例性實施例中’該方法可進—步包含:將一對定 址至該靜態網頁儲存器之網頁之請求重定向至該web伺服 在#代實施例中,該方法可包含:回應於該請求, 基於儲存於該第二内容資料庫中之資訊向係該請求源之使 用者終端機提供一靜態網頁。 在本發明之—實例性實施例中,該靜態網頁儲存器可實 施為-專用電腦(例如,一實體上位於一資料中心内且高 速本端連接至該web伺服器之無週邊Linux伺服器),其對 自系統之weM)服器提取之資料執行所有最佳化及過滤任 2。該靜態網頁儲存器可包含’例如一單個雙核中央處理 單元(CPU)、4GB之記憶體、具有RAID5組態選項之5〇〇gb 硬磁碟驅動機("HDD")。在一實例性實施例中,一用於該 無週邊LhlUX词服器之核心係一基於SUSE Linux 1〇或1: =版本之定製單片Linux核心。例如,可以一非模組方式 提供Linux系統核心。該靜態内容資料庫可使用一⑴扣】e資 135910.doc -10- 200935245 料庫管理系統來實施,同時該臨時快取可實施於一储存於 一硬磁碟驅動機中之分離分區上的檔案中。在一較佳實施 例中,該〇racle資料庫可以一多執行緒模式組態以允許纪 • 憶'體適#分佈於連接池之間’ ^具有-經啓用且排程以每 . 天執行—次之”冷”備份選項。本實施例具有㈣__簡單獨 立式插入程式之優點,此乃因使用CPU功率之大部分工作 可卸載給該靜態網頁儲存器而對飼服器效能不產生負面梦 冑,資料可儲存於該靜態網頁儲存器中而對祠服器儲㈣ 4不產生負面影響,且當新負載平衡及儲存選項為該靜態 網頁儲存器可用時,該靜態網頁儲存器可提供未來擴展之 靈活性而不需要改變web伺服器或使web伺服器停工。 在本發明之實例性實施例巾,該web祠服器插入程式 (其可包含網頁棚截器模組)可以用於目標平臺之最高效能 開發語言來實施,例如在大多數情況下,使用C++或另一 選擇為’在某些情形下使用用於某些平臺之或其他程 ❹ 式化語言。在一實例性實施例中,web伺服器插入程式可 編睪為Apache或具有可承載模組支援之類似评化伺服器 之模組,較佳地為一 Apache 2〇或一最新版本,或其他具 . 有加载類似功能性之模組之能力之基於UNIX之web/應用 伺服态。另一選擇為,對於網際網路資訊服務("Iis")web 伺服器而吕,例如—Micr〇s〇ft ns 6 〇或一最新版本,該 web伺服器插入程式可編譯為一網際網路伺服器應用程式 化介面("ISAPI”)擴展程式。在一實例性實施财,該_ 飼服器插入程式可完全支援多執行緒處理。一用於該web 135910.doc 200935245 飼服器插人程式之臨時快取可視需要設定至本端快取記憶 體以達成最高效能、或本端資料庫或基於構案之儲存裝置 以用於大多數平臺或記憶體内揮發性儲存裝置以用於特殊 平臺支援。在-較佳實施例中,該web飼服器插入程式支 援所有資料之單程式碼内容。 ❹ ❿ 在本發明之—實例性實施例中,在該webe⑽ler遍歷動 態網頁之靜態版本之後,指向該等靜態網頁之指針可作為 web剧覽&搜索之結果而提供。回應於選擇—指向動態網 頁之-靜態版本之指針,該web瀏覽器可自該靜態頁儲存 器請求該動態網頁之靜態版本。 在本發明之—實例性實施例中,回應於對該網頁之靜離 版本之請求,該靜態頁儲存器可將web劉覽器重定向至該 動態網頁伺服器,其中該曹宕& < * ΤS疋向凊求對應於所請求之該網 頁之靜態版本之動態網頁。 、該動態網頁词服器可返回該動態網頁至請求福劉覽器 以在使用者終端機處顯示。該重定向可係有利,此乃因其 可促進對該靜態頁儲存器之 两仔器之更新且返回動態網頁之最新版 本至請求使用者終端機β 該摘截器模組可獲得回應 源忑菫疋向而產生之動態網頁 之一副本。若新產生之動鲅 “κι 頁上不同於先前儲存於 I時快取中之動態網頁之靜雉 〜版本,例如,其中用於產生 該動態網頁之資料庫資料已改變1攔截 網頁儲存器中用新產生之動態網頁 只^田』本作為該網頁之一 新靜態版本來替換該網頁之先前 。叫〜貯態版本,此乃因不同 1359I0.doc •12- 200935245 可=先前所儲存之該網頁之靜態版本已過期。 頁二=入返回—錯誤或而LL,則可確定該動態網 只个丹仔在。本發明 存器刪η έ 系統及方法可因此自該靜態網頁儲 . ⑻刪除該網頁之靜態版本。 在本發明之—卷 . 離版本m 實例性實施例中,回應於對網頁之靜 2、-求’該靜態網頁儲存器可返回該網頁之靜態版 本。返回靜態網頁 〜 系有利,例如以遵守網路安全及/或 女全性規則,該等規 ® η ^ έΕΙ 、而要返回所請求之頁。可發生返 =不頁:過時版本及陳舊網頁,此乃因該網頁之靜態版 本針反映對動態網頁或用於產生靜態網頁版 ==動態網頁之資料庫資料之更新。相反,可回應於 …網頁或回應於_給動態網頁飼服器的對對應動 態網頁之直接培來& π „ ' 求返回一錯誤或NULL·,實施對靜態頁 版本之更新或刪除’例如其中輸人對應動態網頁之概。 在此實施例之-實例性變化形式中,該系統及方法可週期 〇 性地請求所储存之靜態網頁之動態版本以確定所儲存之靜 態網頁是否為最新。 ’ 纟本發明之-實例性實施例令,該系統可另外包含一管 •理模組(其包含—用戶端GUI及一管理⑽)、-報告模组、 一内部⑽咖模組、—按點擊付費模組、-按動作付費模 組及一魔幻關鍵字模組。可向使用該系統之安裝者及用戶 端提供該用戶端GUI以設定系統中其他模組之屬性。例 如,基於所指派之權利,用戶端GUI可提供對一具有管理 預設應用設置及規定-網頁之所有或任何部分之資料透明 135910.doc 200935245 規則能力之組態面板的存取^該管理(31;1可適合於設定系 統關,設置及監視系統功能(包含與收益串流相關之功能) 之機岔。卩刀。例如,基於所指派之權利,該管理丨可提 • 供對一具有以下能力之組態面板之存取:系統存槽、備份/ . 重儲存、系統清理、使用者管理、將所有設置重設為預 存取報告旎力及一組態面板(例如,與用戶端GUI相 同)。 該報告模組可允許察看及報告登記器中之内容,例如, 〇 對錯誤及網頁攔截器模組與網頁產生器之活動之文字記 錄。該#告模組可還報告與#態網頁儲存器之健康及功能 相關之整體系統統計(包含例如,系統負載及磁碟使用)。 該報告模組可能夠提供關於關鍵字、搜索引擎活動及請求 數目之資訊,具體而言包含:内容處理統計,例如錯誤及 曰誌、内容處理時間、所處理檔案之數目、重定向統計, 例如,成功/失敗、重定向之平均速度、系統内部日誌、 Q 存檔/歷史錯誤/成功日誌、備份日誌、系統失敗日誌及有 關管理員/編輯員活動之存取資訊曰諸。 ' 在本發明之一實例性實施例中,一旦經安裝,靜態網頁 . 儲存器可自主地發揮功能以以較小的經排程遞增量獲得及 最佳化資料以便不會使系統超負載。當第一次安裝時,系 統可處於一無資料之狀態且可需要某些時間來開始建立最 佳化内谷。為加速,一内部crawler模組(例如,其將其攸 行限制於係動態網頁源之網站)可在第一次安裝期間或在 大部分站點重設計之後運行一次以遍歷該網站之靜態網頁 135910.doc 14 200935245 部分以快速地用某些用戶端網站結構及資料填充系統。 在本發明之一實例性實施例中,根據基於系統使用量來 計費用戶端之一常用工業標準方法,一按點擊付費模組可 跟蹤所有通過該靜態網頁儲存器之不同重定向以用於與重 定向相關之用戶端賬單之目的。 、 ❹ ❹ 人在本發明之-實例性實施例中’一按動作付費模組可包 ^員㈣按點擊付費模組之功能性。另外’該按動 模組可跟蹤依靠靜態網頁健存器已到達產品頁之消費 =之購買。此效能之-關鍵量測可係出售而非點擊。可 針對效能付費係所需之計費方法之基於較大交易之電子商 務系統實施該按動作付費模組,其為_直接基於出售 費用戶端之常用工業標準方法。 、 β 在本發明之一實例性實施 外值,一魔幻關鍵字模組可包含於添加至總解之額 广可储存並分類由使用者在搜索引擎中用於尋找用戶 用戶端網頁之使用者:::依靠任何搜索引擎到達 入鏈路心 關鍵字可與用於(藉由傳 等關鍵用之一個或多個網頁相關聯地儲存。然後,該 庫自=於例如兩個高級服務:1·自工業特定儲存 關鍵字清單;及2.使用原始關鍵字及儲 二本摘=鍵字兩者來自動建立元標藏及額外内容 k方式Γ於加強全體網一關性之目的。 圖1根據本發明之一實例性實施例圖解說明一為搜索引 135910.doc 200935245 $提供動態網頁之可視性之系統。一終端機1〇2可向一動 嘘網頁伺服器104發送網頁請求,該動態網頁伺服器1〇4可 包含一執行儲存於一記憶體1〇8(例如,一硬體實施電腦可 . 碩媒體)中之程式指令以處置該等請求之處理器106。接收 .肖等請求可觸發動態網頁產生例程’包含執行包含擴展程 式之程式。該請求可初始地由一 web伺服器插入程式(本文 中亦稱為-網頁攔截器112)進行處置。網頁搁截器ιΐ2可 f施為冑展程式,例如,實施為一運行於一網際網路資 訊服務("IIS")伺服器上之網際網路伺服器應用程式化介面 ("ISAPI")擴展程式。攔截器112可記錄請求並將其轉發至 一網頁產生器110。網頁產生器i 1〇可存取一儲存於(例如) 該記憶體或一外部記憶體中之動態資料資料庫丨16以擷取 藉助其產生所請求之動態網頁之動態資料。網頁產生器 11〇可經由輸入/輸出埠將所請求之動態網頁返回至請求終 端機102。網頁產生器11〇可還將所產生頁之一副本提供至 多 攔截器112且攔截器112可提供所產生頁之副本作為—要靜 態地儲存於一臨時快取118中之網頁。在本發明之—實例 性實施例中,攔截器112亦可捕獲隱藏之"後端"資訊連同 •靜態儲存之網頁,例如,該頁之會話及變數以儲存於臨時 快取118中。該隱藏之"後端”資訊可用於重定向一靜熊網 頁請求以請求一動態網頁,如下文將詳細闡述。臨時快取 118可係一記憶體,一檔案及/或一駐存於一硬驅動機中之 資料庫。臨時快取11 8可例如根據一排程(例如,網路上之 負載相對低之每晚上)將經靜態儲存之網頁以及隱藏 135910.doc -16 - 200935245 =訊(本文令一起稱為網頁資料)傳輸至一靜態網頁儲存 益120。另一選擇為,例如相依於一組態設定,搁截哭⑴ 可經由管理控制面板GUI將網頁資料直接提供 頁儲存器120。 …網 ❹ ❾ 靜態網頁儲存态120可與動態網頁伺服器整合在—起 或實施於一(例如)由-服務諸多用戶端(每-用戶端具有一 對應動態網頁祠服器)之主機祠服器維持之單獨器件上, 靜態網頁儲存器12〇可包含—索引產生器124。在本發明之 。實例|±實施例中,靜態網頁儲存器⑽可係—與Μ词服 器1〇4協同疋位且以—高速度連接連接至4伺服器⑽, 、實見更佳n之專用電腦。靜態網頁儲存器⑽可包含 處理模組,其可變換獲自網頁攔截器112之資料。例 ^,該處理模組可藉由移除所有錢之内容及包含超文字 標記語言("HTML"),串接樣式表腳本格式在内 的標鐵,同時保存所需資訊,包含元資料及交易資料(例 如,頁標題、頁體、頁日期、内容大小、說明、關鍵字、 URL參數、投遞資訊、所請求之資訊及頁内容資料 ㈠如文章;^題、文章本體、槽案名稱、檔案說明及鍵路 鍵路說明))來清除網頁。此外,在—最佳化步驟中,該 處理模組可將經清除之網頁轉換成—特殊格式,例如,在 兀資料、《易資料及内容資料方面進行組織。在本發明之 —實例性實施例中,變換可係基於可經由-管理控制面板 GUI組態之變換規則。 變換規則可用於自動產生擴展樣式語言變換(Extensible 1359l〇.d〇c -17- 200935245
Style Language Transformati 〇n,"XSLT")模板,以用來解
且將頁内容資料儲存於一 XML儲存裝置中。一 HTML 產生器可基於用於儲存於靜態内容f料庫中之元内容資料 及頁内容資料來產生一靜態頁。
給其編索引。由於可儲存諸多靜態網頁,因此靜態網頁儲 存器120可供索引至一 webcrawier/搜索引擎η〗,該 webCrawler/搜索引擎132可遍歷由索引參考之靜態網頁, 以使其包含於一由webcrawler丨32維持且供搜索引擎將結果 提供至一運行於一終端機1〇2上之web瀏覽器的索引中。 (應注意’ 一單個webcrawler可服務多個搜索引擎。然而, 為清晰起見,闡述一單個webcrawier/搜索引擎132。)所闡 述之特徵可促進向一 webcrawler自動提供動態網頁之可視 性’使得對應於該等動態網頁之資料可作為一搜索引擎搜 索之結果而提供。 在將對靜態頁130中之一者之參考包含在weberawier/搜 索引擎132的索引中之後,作為一搜索結果,webcrawler/ 搜索引擎132之搜索引擎組件可提供一指向靜態頁13〇之鏈 路。回應於對搜索結果之選擇(例如藉由點擊該鏈路),一 對靜態網頁130之對應請求可自終端機1〇2傳輸至靜態網頁 13591 〇.<j〇c 200935245 儲存器120,該靜態網頁儲存器12〇可直接返回所請求之靜 態網頁130至終端機102。 在本發明之一替代實例性實施例中,靜態網頁儲存器 . I20可包含一網頁重定向122(例如實施為—組儲存於一硬 . 體實施電腦可讀媒體中或可由靜態網頁儲存器i 2 〇之處理 器執行之指令),該網頁重定向122可將對靜態網頁13〇之 請求重定向至動態網頁伺服器丨〇4,此由圖i中之虛線表 不。網頁重定向122可確定所請求之靜態頁130tf應之動態 網頁且將終端機102之請求發送至動態網頁伺服器1〇4,以 由產生器模組110、攔截器模組丨丨2及登記器模組進行處置 以返回對應動態網頁。對動態網頁之請求可如上文所述進 行處置。對請求之處置可使攔截器丨12更新靜態網頁儲存 器120以包含靜態網頁之一更新版本。 在本發明之一實例性實施例中,當攔截器丨12處置一動 I網頁晴求時,攔截器112可確定臨時快取118是否已經包 〇 +該動態網頁之-副本。當快取118已經包含該網頁之一 • 靜態副本時’攔截器112可製止將該靜態副本轉發至靜態 . 網頁儲存器㈣,除非«器112確定新產生之靜態網頁副 本實質上不同於經快取儲存之副本,在此情況下,攔截器 U 2可用當前副本替換先前儲存於快取118中之副本且立即 或在如上文所論述之成批處理期間將新副本轉發至靜態 ’罔頁儲存器12〇,以替換靜態網頁儲存器12〇處該動態網頁 先則所儲存靜態版本。在一實例性實施例中,系統可檢 查回應(例如,所產生用於傳輸至使用者瀏覽器之資料)之 135910.doc •19- 200935245 屬度’以確定該資粗σ 貧抖疋否為已經鍺存於快 製。系統可在可被考量_定係至關重:方之複 在^组態。例如’對於某些使用者,可考量咖 同… 再頁與快取令之網頁資料之間的類似或不 .例:面係至關重要。其他使用者可考量額外或其他屬性, 回應大小及請求類型或一網頁回;I K h1 之屬性。 Λ 口應之任何其他類型 ❿限=月,之一實例性實施例中’快取内容可根擄-期限 '、 對快取内容可儲存於該快取中多長時n t 一限制)進行清除。該期限限制可使用一服二 :饥進仃設定。若記錄超過該期限限制,則 :之記錄已由靜態儲存器進行處理,且因此,對超二 2限制之快取内容之快取儲存可不再係必須。此外,通 二期限限制之記錄可係過時且較差地反映欲 = 一當前狀態,使得自快取中清除超過期 © 、 s己錄可使對每—超過期限限制之記錄之複製確定 之效能更有效。 .*在本發明之—實例性實施例中,㈣統及方法可提供一 *初始安裝攔截器插入程式時執行之初始階段。在該初始 階段期間,可執行—用於運行—内部webe讀ler之咖ler 模組以遍歷提供動態網頁之網站之任何靜態部分。該等靜 態部分可包含例如模板及/或靜態網頁。該内部^_可 產生初始攸行結果之-初始靜態頁索引且將該索引提供至 webCrawler。此可提供某些初始可視性以使得一使用者可 135910.doc •20- 200935245 被引導至網站、導覽該網站或請求動態網頁,回應於此可 實施上述提供動態網頁可視性之方法。另一選擇為,一熟 悉網站之使用者(例如網站擁有者或創建者或已觀看一廣 . σ之客戶)可在藉由手動輸入動態網頁之位址來安裝插入 . 程式之後,初始地存取頁。 在本發明之一實例性實施例中,提供至webcrawler之靜 態頁可被剝離僅剩其文字。檔案可包含指向其他檔案(例 如圖片或小應用程式檔案)之指針,該等指針可在當Web瀏 覽器根據其中返回靜態網頁之實施例請求時提供。 圖2圖解說明一根據本發明之一實例性實施例向搜索引 擎提供動態網頁之可視性之方法。在步驟2〇2處,使用者 終端機102可向用戶端web伺服器1〇4傳輸一對一動態網頁 之清求。在步驟204處,web伺服器1〇4之一 web伺服器插 入程式/網頁攔截器U2可將該請求轉發至一網頁產生器 110,該網頁產生器110可產生所請求之動態網頁且在21〇 〇 處,將所產生之網頁傳輸至使用者終端機102。網頁攔截 . 器112可還接收所產生網頁之-副本且在214處將該副本儲 ^ 存於一臨時快取118中。網頁攔戴器112及Web伺服器104之 • 活動可登記在—頁登記器中,例如用於存似除錯之目 的。 在本實施例之一實例性變化形式中,在儲存網頁副本於 快取中之前,在2丨2處網頁攔截器112可確定快取是否已經 包含-對應㈣新網頁副本對應之同一動態網頁之網頁副 本。若發現-匹配,則網頁攔戴器112可比較兩個副本。 135910.doc -21 - 200935245 確定决取還未包含—對應副本或該新副本大體上不同於 對應^本’則網頁棚截11112可儲存更新及未複製頁於 L時決取11 8中或直接將其傳輸至靜態網頁儲存器⑶以替 換該頁之較舊版本。否則,攔截器H2可退出該過程而出 於效率原因(例如關於頻寬及/或cpu功率),不重储存或重 發送網頁副本^ 網頁攔截器1 12可將所產生之網頁資料(網頁内容以及"後 端”貧料)直接傳輸至靜態網頁儲存器〗2〇,或在一替代實 例性實施例中,將所產生之網頁資料儲存於臨時快取ιΐ8 中以使得其可在216處被成批傳輸至靜態網頁儲存器12〇, 例如根據-排程(例如,在網路負載相對低之每個晚上)。 在本發明之-實例性實施例中,靜態網頁储存器12〇可 進-步處理所接收之網頁資料以將該網頁資料變換為一適 合於-搜索引擎或weberawler之格式。例如,在218處,可 藉由一過濾程序處理該網頁資料以藉由移除所有無用内容 及標籤且同時’保存進-步最佳化所需之資訊來清除並最 佳化該資料。此可藉由一組變換規則來實現,該等變換規 則可(例經由一管理控制面板GUI(圖中未顯示)進行組態 以將該網頁資料變換為更方便管理之形式。在2 1 8處預 定變換可移除HTML、CSS或java腳本。同時,該變=可保 存元資料及交易資料(包含例如頁標題、頁體、頁曰期、 内容大小、說明、關鍵字、統一資源定位器(url)、 參數、投遞資訊及請求資訊)且將其儲存於—内容資料庫 中。在220處,靜態網頁儲存器! 20可還自網頁資料提取關 135910.doc •22· 200935245 鍵字且將其儲存於靜態内容資料庫中。基於靜態内容資料 庫中之資訊,一HTML頁產生器可在222處運行一獨立過程 來產生網頁副本之crawler友好版本及一索引頁,其含有用 - 戶端網站内之所有頁之站點地圖,其中每一頁之内容具有 • 一簡短說明(例如,一段落長度大綱)。該索引可(例如')根 據一排程創建,通常為在web伺服器及靜態網頁儲存器兩 者上之總負載最低之每一晚上一次。在一替代實施例中, 一管理員可在初始安裝或對於大量網站内容已改變之情形 使用官理控制面板GUI起始編索引過程。 在224處,靜態網頁儲存器12〇可使其内部靜態網頁索弓丨 可由webcrawler遍歷,以使可在226處更新其 網頁索引。 ' 圖3根據本發明之一實例性實施例圖解說明一用於回應 於終端機10 2所請求且定址至靜態網頁儲存器丨2 〇之一請求 長:供網頁之方法。在webcrawler遍歷靜態網頁儲存器12〇 ❹ 中動態網頁之靜態版本之後,作為搜索結果,一搜索引擎 . 可提供至由靜態網頁儲存器12〇所儲存之靜態網頁之鏈 路。在步驟302處,可在使用者終端機1〇2處輸入搜索參 數在304處’搜索引擎可返回可包含至靜態網頁儲存器 120中之靜態網頁之鏈路之搜索結果鏈路。在3〇6處,一運 作終端機102之使用者可點擊搜索結果中至靜態網頁儲存 益120中之-靜態網頁之鍵路,從而可致使一對該靜態網 頁之請求傳輸至靜態網頁儲存器12〇。 在步驟308處’回應於該請求,靜態網頁儲存器可使該 135910.doc -23· 200935245 請求重定向至用戶端動態網頁伺服器丨04 ^回應於經重定 向之請求’動態網頁伺服器1〇4可在步驟31〇處,產生—動 態網頁。然後,網頁攔截器可捕獲所產生之動態頁且據此 更新臨時快取11 8,及靜態網頁儲存器12〇,如上文所述。 在步驟312處,動態網頁伺服器1〇4可將動態網頁傳輸至使 用者終端機102。 熟悉此項技術者可自前述說明瞭解,本發明可以各種形 ❹
式(包含,例如圖2及3中所示步驟之順序之變化)實施且各 個實施例可單獨或以組合方式實施。因此,儘管已結合本 發明之各個實施例之特定實例纟閣述本發明之各個實施 例’但本發明之實施例及/或彳法之真正範圍應不受限 制此乃因實踐者在學習圖式、說明書及隨附申請專利範 圍之後,會明瞭其他修改。 【圖式簡單說明】 係根據本發明之一實例性實施例圖解說明一用於 提供動態網頁之可視性之圖。 系根據本發明之一實例性實施例圖解說明一用於 提供動態產生之網頁之可視性之方法的交叉功能流程圖。 一二根據本發明之一實例性實施例圖解說明一經由 網頁儲存裝置存取—叙能_百 1仔取動態網頁之方法的交又功能流程 圖0 【主要元件符號說明】 102 終端機 104 動態網頁伺服器 135910.doc •24- 200935245 106 處理器 108 記憶體 110 網頁產生器 . 112 Web伺服器插入程式(網頁攔截器) 116 等 動態内容資料庫 118 臨時快取 120 靜態網頁儲存器 122 網頁重定向 ® 124 索引產生器 126 靜態内容資料庫 128 索引 130 靜態頁 132 webcrawler/搜索引擎 135910.doc -25-

Claims (1)

  1. 200935245 十、申請專利範圍: 其包括: 1 ’ 種用於k供動態網頁之可視性之系統 一靜態内容資料庫;及 一 web伺服器之一處理器,其經組態以: 產生該動態網頁; 提供該動態網頁之一靜態副本, 内容資料庫中;及 回應於一來自一終端機之對一動態網頁之請求: 以儲存於該靜態
    ;及 至 ~ webcrawler。 將β亥動態網頁傳輸至該終端機 將該動態網頁之該靜態副本提供 2.如請求項1之系統,進一步包括: 一動態内容資料庫,其中·· 回應於該請求, 内容;且 該處理器自該動態内容資料庫獲得 基於該所獲得之内容產生該動態網頁。 3.如π求項1之系統’其中,為提供該靜態副本以儲存於 該靜態内容資料庫中,該處理器執行_在產生該動態網 頁期間由該web伺服器使用的網頁攔截器插入程式。 4,如請求項1之系統,其中: 提供該靜態副本以儲存於該靜態内容資料庫中包含藉 由將忒動態網頁之一複製物轉換成該靜態副本而產生該 副本;且 該靜態副本為一適合於供該webcrawler遍歷之格式。 5.如請求項4之系統,其中轉換該動態網頁之該複製物包 135910.doc 200935245 含: 移除嵌入於該動態網頁之該複製物中之格式化腳本程 式碼;及 分別將嵌入於該動態網頁之該複製物中之元資料及交 易>料儲存於一元内容儲存裝置中’並將嵌入於該動態 網頁之該複製物中之頁内容資料儲存於一頁内容儲存裝 置中。 、 6.如請求項4之系統,進一步包括:
    用於儲存該複製物之臨時快取,其十為將該靜態副 本儲存於該靜態内容資料庫中,該臨時快取之内容根據 一排程被提供至該靜態内容資料庫。 7,如請求項1之系統,其中該處理器經組態以執行一超文 字標記語言(HTML)頁產生器模組,以基於該動態網頁之 元資料、交易資料及頁内容資料產生該靜態副本。 8.如請求項1之系統,其中: 該處理器經組態以產生儲存於該靜態内容資料庫中之 ::個靜態網頁副本之一索引,該複數個靜態網頁副本 ^回應於該請求而儲存的該靜態副本;且· ::動態網頁之該靜態副本提供至—包含 =索引提供至該一Ier,以遍歷由該索引參考之 該複數個靜態網頁副本。 9·如請求項1之系統, 該靜態副本之一請求 之一請求。 其申該處理器經組態以··回應於對 ’將該請纟重定向為對該動態網頁 135910.doc 200935245 ίο. 11. ❹ G * 12. 如請求項1之系統,其中該處理器經組態以:回應於_ 來自一終端機的對該靜態副本之請求,將該靜態副本傳 輸至該終端機。 如請求項1之系統,其中: 該web伺服器包含: —用戶端伺服器;及 —應用伺服器’其連接至該用戶端伺服器,且該靜 態内容資料庫與其整合在一起; 該處理器包含: —位於該用戶端伺服器中之第一處理器,其回應於 •網頁請求而產生動態網頁;及 一位於該應用伺服器中之第二處理器;且 該第一處理器經組態以回應於一來自一終端機且定址 至該應用伺服器之靜態網頁請求,將該請求自該應用伺 服器重定向至該用戶端伺服器,以使該第一處理器產生 一對應於該所請求靜態網頁之動態網頁並將其傳輸至該 終端機。 一種用於提供動態網頁之可視性之方法,其包括: 回應於一來自一終端機之對一動態網頁之請求: 產生該動態網頁; 提供該動態網頁之一靜態副本,以儲存於一靜態内 容資料庫中;及 將該動態網頁傳輸至該終端機;及 將該動態網頁之該靜態副本提供至一·y^ebcrawlei·。 135910.doc 200935245 13. 14. 15. 16. ❹ 17. 如請求項12之方法,進一步包括: 回應於該請求,一處理器自一動態内容資料庫獲得内 容; 其中基於該所獲得之内容產生該動態網頁。 如請求項12之方法’其中,提供該靜態副本以儲存於該 靜態内容資料庫中包含執行一網頁攔截器插入程式以產 生該動態網頁。 如請求項12之方法,其中: 提供該靜態副本以儲存於該靜態内容資料庫中包含藉 由將該動態網頁之一複製物轉換成該靜態副本來產生該 副本;且 該靜態副本呈一適合於供該webcrawler遍歷之格式。 如請求項15之方法,其卡轉換該動態網頁之該複製物包 含: 移除嵌入於該動態網頁之該複製物中之格式化腳本程 式碼;及 分別將嵌入於該動態網頁之該複製物中之元資料及交 易資料儲存於一元内容儲存裝置中,且將嵌入於該動態 網頁之該複製物中之頁内容資料儲存於一頁内容儲存裝 置中。 如請求項15之方法,進一步包括: 將該複製物儲存於—臨時快取中,其中提供該靜態副 本以儲存於該靜態内容資料庫中包含根據一排程將該臨 時快取之内容提供至該靜態内容資料庫。 135910.doc 200935245 18. 19. 〇 20. 21. 22. 如請求項12之方法,進一步包括: 基於"亥動態網頁之該元資料、交易資料及頁内容資料 產生該靜態副本。 如請求項12之方法’進-步包括: 產生儲存於該靜態内容資料庫中之複數個靜態網頁副 索引°亥複數個靜態網頁副本包含回應於該請求 而提供之用於儲存之該靜態副本; 其中將該動態網頁之該靜態副本提供至該滅·^ os將該索引提供至該webe贿Ια以遍歷由該索引所參 考之該複數個靜態網頁副本。 如請求項12之方法,進一步包括: ;回應於㈣靜態副本之—請求,將該請求重^向為對 »»亥動態網頁之一請求。 如請求項12之方法,其中: 一位於—用戶端飼服器中之第―處理器回應於網頁請 求而產生動態網頁,該方法進一步包括: 一位於—應用伺服器中之第二處理器回應於-來自— 終端機且定址至該應用伺服器之靜態網頁請求,將該請 求自該應賴服器重定向至該用戶端伺服器,以使該第 處理器產生-對應於該所請求靜態網頁之動態網頁並 將其傳輸至該終端機,該應關μ連接至制戶端词 服器,且該應用伺服器與其整合在一起。 -種其上儲存有指令之電腦可讀媒體,該等指令在執行 時使-處理器執行一用於提供動態網頁之可視性之方 135910.doc 200935245 法,該方法包括: 回應於一來自一終端機的對一動離細1 = ,頁之請 . 產生該動態網頁; · 提供該動態網頁之一靜態副本,,、, , ^ u儲存於一靜_ 容資料庫中;及 « 將該動態網頁傳輸至該終端機;及 將該動態網頁之该靜態副本提供至^一 web crawl er。 e ❹ 135910.doc
TW097142448A 2007-11-02 2008-11-03 System and method for providing visibility for dynamic webpages TW200935245A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US160007P 2007-11-02 2007-11-02
US12/021,892 US20090119329A1 (en) 2007-11-02 2008-01-29 System and method for providing visibility for dynamic webpages

Publications (1)

Publication Number Publication Date
TW200935245A true TW200935245A (en) 2009-08-16

Family

ID=40589262

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097142448A TW200935245A (en) 2007-11-02 2008-11-03 System and method for providing visibility for dynamic webpages

Country Status (3)

Country Link
US (1) US20090119329A1 (zh)
TW (1) TW200935245A (zh)
WO (1) WO2009059145A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI416350B (zh) * 2009-12-29 2013-11-21

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080154678A1 (en) * 2006-12-21 2008-06-26 Botelho Stephen F Internet based search engine advertising exchange
US7831455B2 (en) * 2007-03-08 2010-11-09 Salesforce.Com, Inc. Method and system for posting ideas and weighting votes
US7818194B2 (en) * 2007-04-13 2010-10-19 Salesforce.Com, Inc. Method and system for posting ideas to a reconfigurable website
US7840413B2 (en) 2007-05-09 2010-11-23 Salesforce.Com, Inc. Method and system for integrating idea and on-demand services
US8239420B1 (en) * 2007-07-19 2012-08-07 Salesforce.Com, Inc. System, method and computer program product for locking data in an on-demand database service
AU2008355023A1 (en) * 2008-04-17 2009-10-22 Google Inc. Generating sitemaps
JP5440004B2 (ja) 2008-10-20 2014-03-12 セイコーエプソン株式会社 情報配信システム、情報配信システムのサービス実現方法およびそのプログラム
JP5293086B2 (ja) 2008-10-28 2013-09-18 セイコーエプソン株式会社 情報配信システム、情報配信システムのサービス実現方法およびそのプログラム
US8239482B2 (en) 2008-11-13 2012-08-07 At&T Intellectual Property I, Lp System and method for selectively caching hot content in a content delivery system
US8121991B1 (en) * 2008-12-19 2012-02-21 Google Inc. Identifying transient paths within websites
CN101477539B (zh) * 2008-12-31 2011-09-28 杭州华三通信技术有限公司 一种信息采集方法及装置
US8543608B2 (en) * 2009-09-10 2013-09-24 Oracle International Corporation Handling of expired web pages
US10198414B2 (en) * 2009-09-10 2019-02-05 Usablenet Inc. Methods for optimizing interaction with a form in a website page and systems thereof
CN102411571A (zh) * 2010-09-21 2012-04-11 上海众融信息技术有限公司 一种动态网页的静态化信息处理方法及装置
US9323861B2 (en) * 2010-11-18 2016-04-26 Daniel W. Shepherd Method and apparatus for enhanced web browsing
US8935606B2 (en) * 2012-02-29 2015-01-13 Ebay Inc. Systems and methods for providing a user interface with grid view
US20130262483A1 (en) * 2012-03-30 2013-10-03 Nokia Corporation Method and apparatus for providing intelligent processing of contextual information
US9436773B2 (en) * 2012-04-20 2016-09-06 The Boeing Company Method and computer program for discovering a dynamic network address
US9348932B2 (en) * 2012-04-30 2016-05-24 Penske Truck Leasing Co., L.P. Method and apparatus for redirecting webpage requests to appropriate equivalents
US8966370B2 (en) 2012-08-31 2015-02-24 Google Inc. Dynamic adjustment of video quality
US9922349B2 (en) * 2012-11-27 2018-03-20 Synqy Corporation Method and system for the distribution, maintenance, management, merchandising and analysis of digital brand assets on the internet
CN103218396B (zh) * 2013-03-07 2016-12-28 江苏省电力公司南京供电公司 根据访问频次特征生成静态网页的调度运行可视化分析方法
TWI484438B (zh) * 2013-04-12 2015-05-11 Inventec Corp 基於雲端的學習系統及其方法
US9613012B2 (en) * 2013-11-25 2017-04-04 Dell Products L.P. System and method for automatically generating keywords
US9558163B1 (en) 2015-08-10 2017-01-31 Information Capital Executive Management, Inc. Method for accelerated webpage development for at least one mobile computing device
US9558288B1 (en) 2015-08-10 2017-01-31 Information Capital Executive Management, Inc. Webpage creation system for accelerated webpage development for at least one mobile computing device
US9514107B1 (en) * 2015-08-10 2016-12-06 Information Capital Executive Management, Inc. Webpage creation tool for accelerated webpage development for at least one mobile computing device
US20190121827A1 (en) * 2015-12-21 2019-04-25 Michael Boswell Method for webpage creation system for accelerated webpage development for at least one mobile computing device
CN105930538A (zh) * 2016-06-27 2016-09-07 北京奇虎科技有限公司 一种网页访问请求处理方法和服务器
CN107729531A (zh) * 2017-10-27 2018-02-23 深圳市行云易通科技有限公司 一种动态渲染类网页优化方法
CN110866196A (zh) * 2018-12-28 2020-03-06 哈尔滨安天科技集团股份有限公司 一种打印机网络信息采集方法、装置及电子设备
US10785336B2 (en) * 2019-01-31 2020-09-22 Walmart Apollo, Llc Pre-loading and caching application code
CN110737856A (zh) * 2019-09-10 2020-01-31 苏宁云计算有限公司 一种页面获取方法、装置及系统
US11093217B2 (en) * 2019-12-03 2021-08-17 International Business Machines Corporation Supervised environment controllable auto-generation of HTML

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020010753A1 (en) * 1999-12-20 2002-01-24 Matsuoka Robert M. Method and apparatus for delivering dynamic information in a computer network
US7096418B1 (en) * 2000-02-02 2006-08-22 Persistence Software, Inc. Dynamic web page cache
AU2001234758A1 (en) * 2000-02-04 2001-08-14 America Online Incorporated High performance "freeze-dried" dynamic web page generation
US6917961B2 (en) * 2000-03-30 2005-07-12 Kettera Software, Inc. Evolving interactive dialog box for an internet web page
US6622168B1 (en) * 2000-04-10 2003-09-16 Chutney Technologies, Inc. Dynamic page generation acceleration using component-level caching
US7200677B1 (en) * 2000-04-27 2007-04-03 Microsoft Corporation Web address converter for dynamic web pages
US6931598B2 (en) * 2001-03-30 2005-08-16 Intel Corporation Dynamic web list display
US20030110158A1 (en) * 2001-11-13 2003-06-12 Seals Michael P. Search engine visibility system
US20040205637A1 (en) * 2002-06-25 2004-10-14 Evan Witt Methods and systems for dynamic display of information in an internet application
US7386786B2 (en) * 2003-01-24 2008-06-10 The Cobalt Group, Inc. Method and apparatus for processing a dynamic webpage
US20040267781A1 (en) * 2003-05-23 2004-12-30 Flytecomm, Inc. Web-based system and method for multi-layered display of dynamic and static objects
US20040260767A1 (en) * 2003-06-19 2004-12-23 David Kedem Dynamic web advertisement and content display system
US20050102309A1 (en) * 2003-11-06 2005-05-12 Mdteknix, Inc. Configurable framework for storing and retrieving arbitrary information from a database
US20080140626A1 (en) * 2004-04-15 2008-06-12 Jeffery Wilson Method for enabling dynamic websites to be indexed within search engines
US20070143283A1 (en) * 2005-12-09 2007-06-21 Stephan Spencer Method of optimizing search engine rankings through a proxy website
US20070168465A1 (en) * 2005-12-22 2007-07-19 Toppenberg Larry W Web Page Optimization Systems
US20070271238A1 (en) * 2006-05-17 2007-11-22 Jeffrey Webster System and Method For Improving the Search Visibility of a Web Page

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI416350B (zh) * 2009-12-29 2013-11-21

Also Published As

Publication number Publication date
WO2009059145A1 (en) 2009-05-07
US20090119329A1 (en) 2009-05-07

Similar Documents

Publication Publication Date Title
TW200935245A (en) System and method for providing visibility for dynamic webpages
US10817489B2 (en) Content class for object storage indexing system
US8452925B2 (en) System, method and computer program product for automatically updating content in a cache
US9135257B2 (en) Technique for implementing seamless shortcuts in sharepoint
US10068028B1 (en) Deep link verification for native applications
USRE42051E1 (en) Peer-to-peer automated anonymous asynchronous file sharing
JP4873813B2 (ja) インデクシングシステムおよび方法
KR101623223B1 (ko) 하나의 인터넷 호스팅 시스템 집합에 의해 제공되는 다수의 병렬 사용자 경험
US9380022B2 (en) System and method for managing content variations in a content deliver cache
US9292529B2 (en) File change detector and tracker
TWI410812B (zh) 網站之定做的、私人化的與整合的客戶端搜尋索引
US20080263193A1 (en) System and Method for Automatically Providing a Web Resource for a Broken Web Link
US20130103669A1 (en) Search Engine Indexing
US20090083714A1 (en) Remote monitoring of local behavior of network applications
US9405831B2 (en) Avoiding masked web page content indexing errors for search engines
US8380932B1 (en) Contextual regeneration of pages for web-based applications
US10007731B2 (en) Deduplication in search results
US7890527B1 (en) Backup search agents for use with desktop search tools
US9645980B1 (en) Verification of native applications for indexing
US8108513B2 (en) Remote monitoring of local behavior of network applications
Hochstenbach et al. The OAI-PMH static repository and static repository gateway
US8190625B1 (en) Method and system for robust hyperlinking
US7870129B2 (en) Handling error documents in a text index
US20100251270A1 (en) Selective Mobile Metering
Drugeon A technical approach for the French web legal deposit