TWI410812B - 網站之定做的、私人化的與整合的客戶端搜尋索引 - Google Patents

網站之定做的、私人化的與整合的客戶端搜尋索引 Download PDF

Info

Publication number
TWI410812B
TWI410812B TW096124154A TW96124154A TWI410812B TW I410812 B TWI410812 B TW I410812B TW 096124154 A TW096124154 A TW 096124154A TW 96124154 A TW96124154 A TW 96124154A TW I410812 B TWI410812 B TW I410812B
Authority
TW
Taiwan
Prior art keywords
search
client
index
server
indexer
Prior art date
Application number
TW096124154A
Other languages
English (en)
Other versions
TW200817944A (en
Inventor
Ryan Kirk Cradick
Zachary Adam Garbow
David Joseph Borrillo
Original Assignee
Ibm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibm filed Critical Ibm
Publication of TW200817944A publication Critical patent/TW200817944A/zh
Application granted granted Critical
Publication of TWI410812B publication Critical patent/TWI410812B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Description

網站之定做的、私人化的與整合的客戶端搜尋索引
本申請案大體而言係關於一種經改良之資料處理系統及方法。更具體言之,本申請案係針對全球資訊網之定做的、私人化的與整合的客戶端搜尋索引。
網際網路搜尋引擎使用索引將搜尋結果顯示給使用者。向請求使用者顯示的結果僅與搜尋索引一樣為當前的或為最新的。一些搜尋引擎關於三分之一的網站進行索引編製,且僅能夠每三十天再新一次搜尋索引。隨著網際網路之大小及全球資訊網上之內容量繼續增長,搜尋引擎愈來愈難以發現變化,難以判定此等變化出現的頻率,及難以將俘獲之變化列入優先。
一個當前解決方案為將一些搜尋索引比其他索引更新得更加頻繁。伺服器索引軟體代理程式將比其他索引更頻繁地得到更新之索引列入優先。儘管頻繁更新之索引與大多數使用者相關,但其餘使用者使用的是過期之索引。
說明性實施例辨識先前技術之缺點,且提供一以透明方式且結合基於伺服器之搜尋索引而運作之客戶端搜尋索引程式。經組合之搜尋索引提供更為準確及最新的網站影像,該網站影像係對於每一個別使用者之興趣而定做的。客戶端索引器根據使用者之偏好及使用型式定做特定網頁的索引。
使用者最初在客戶端上安裝並組態客戶端索引器。所請求之索引在搜尋期間被自動再新且與主伺服器端索引整合。當使用者執行搜尋時,客戶端索引可與主伺服器端索引組合。經組合之索引為特定使用者提供準確的搜尋結果。此允許使用者使用其最感興趣之站點的被頻繁更新之索引進行搜尋,同時仍利用由伺服器所維持的用於大多數網站的大索引。
在一說明性實施例中,提供一種電腦程式產品,該電腦程式產品包含具有電腦可讀程式之電腦可用媒體。該電腦可讀程式當在計算設備上執行時使該計算設備載入一組組態選項。該等組態選項定義對於客戶端索引之使用者偏好。該電腦可讀程式可進一步使計算設備基於該組組態選項而識別待編入索引之一部分內容,並基於該組組態選項而在客戶端索引器處將該部分內容編入索引以形成客戶端搜尋索引。客戶端搜尋索引係對於與客戶端索引器相關聯之使用者而私人化。該電腦可讀程式可進一步使計算設備使用客戶端搜尋索引與關聯於一搜尋引擎之伺服器端搜尋索引的組合基於搜尋詢問而執行搜尋。
在一例示性實施例中,搜尋引擎將客戶端搜尋索引與伺服器端搜尋索引組合以形成經組合之搜尋索引,並使用該經組合之搜尋索引執行搜尋以滿足搜尋請求。
在另一例示性實施例中,搜尋引擎使用伺服器端搜尋索引基於搜尋詢問而執行搜尋,並傳回一組伺服器搜尋結果。一客戶端組件使用客戶端搜尋索引基於搜尋詢問而執行搜尋,以產生一組客戶端搜尋結果。該電腦可讀程式可進一步使計算設備:回應於該組客戶端搜尋結果比該組伺服器搜尋結果新,將該組客戶端搜尋結果整合至伺服器搜尋結果中以形成一經組合的搜尋結果組。
在又一例示性實施例中,電腦設備藉由如下方式而識別待編入索引之一部分內容:識別一組先前搜尋結果,識別一組最常訪問之網站,識別一組書籤或最喜愛項目,識別帶旗標站點,或識別由具有類似興趣之使用者所訪問之一組站點。在另一例示性實施例中,電腦設備藉由如下方式將該部分內容編入索引:自對等物接收客戶端索引,並將來自對等物之客戶端索引與客戶端搜尋索引組合。
在一例示性實施例中,該組組態選項包括索引排程,且其中客戶端索引器根據索引排程自動將該部分內容編入索引。在另一例示性實施例中,該組組態選項包括一包括清單,且其中該部分內容總是包括來自該包括清單之內容。在又一例示性實施例中,該組組態選項包括一排除清單,且其中該部分內容從不包括來自該排除清單之內容。在又一例示性實施例中,該組組態選項包括索引演算法,且其中客戶端索引器使用索引演算法將該部分內容編入索引。
在另一說明性實施例中,提供一種裝置,該裝置包含一處理器及一耦合至該處理器之記憶體。該記憶體含有指令,該等指令當由處理器執行時使該處理器載入一組組態選項。該等組態選項定義對於客戶端索引之使用者偏好。該等指令可進一步使處理器基於該組組態選項而識別待編入索引之一部分內容,並基於該組組態選項而在客戶端索引器處將該部分內容編入索引以形成客戶端搜尋索引。客戶端搜尋索引係對於與客戶端索引器相關聯之使用者而私人化。該等指令可進一步使處理器使用客戶端搜尋索引與關聯於一搜尋引擎之伺服器端搜尋索引的組合基於搜尋詢問而執行搜尋。
在另一說明性實施例中,記憶體可含有指令,該等指令當由處理器執行時使該處理器關於電腦可讀程式執行以上所述之操作中的一或多者。
在另一說明性實施例中,提供一種用於私人化的、整合的搜尋索引之方法。該方法包含載入一組組態選項。該等組態選項定義對於客戶端索引之使用者偏好。該方法可進一步包含基於該組組態選項而識別待編入索引之一部分內容,及基於該組組態選項而在客戶端索引器處將該部分內容編入索引以形成客戶端搜尋索引。客戶端搜尋索引係對於與客戶端索引器相關聯之使用者而私人化。該方法可進一步包含使用客戶端搜尋索引與關聯於一搜尋引擎之伺服器端搜尋索引的組合基於搜尋詢問而執行搜尋。
在其他例示性實施例中,該方法可包含關於電腦可讀程式的以上所述之操作中的一或多者。
本發明之此等及其他特徵及優點將描述於本發明之例示性實施例的以下實施方式中,或鑒於本發明之例示性實施例的以下實施方式而對於一般熟習此項技術者將變得顯而易見。
現參看諸圖且詳言之參看圖1至圖2,提供了資料處理環境之例示性圖式,其中可實施本發明之實施例。應瞭解,圖1至圖2僅為例示性的,且不欲宣稱或暗示對於可實施本發明之態樣或實施例的環境之任何限制。在不脫離本發明之精神及範疇的情況下可對所描繪之環境進行許多修改。
現參看諸圖,圖1描繪可實施說明性實施例之態樣之例示性分散式資料處理系統的圖示。分散式資料處理系統100可包括可實施說明性實施例之實施例的電腦網路。分散式資料處理系統100含有至少一個網路102,網路102為用以在分散式資料處理系統100內在連接於一起之各種設備與電腦之間提供通信鏈路之媒體。網路102可包括諸如導線、無線通信鏈路或光纖電纜之連接。
在所描繪之實例中,伺服器122及伺服器124分別連接至網路102且分別提供對儲存單元132及儲存單元134之存取。另外,客戶端110、112及114亦連接至網路102。此等客戶端110、112及114可為(例如)個人電腦、網路電腦或其類似物。在所描繪之實例中,伺服器122及124(例如)將諸如網頁、多媒體內容及應用程式之資料提供至客戶端110、112及114。客戶端110、112及114在所描繪之實例中為對伺服器122及124之客戶端。分散式資料處理系統100可包括未圖示之額外伺服器、客戶端及其他設備。
伺服器126可為客戶端110、112及114提供搜尋引擎。客戶端110、112、114可將搜尋請求提交給伺服器126上之搜尋引擎,該搜尋引擎接著使用索引136產生結果頁。為了提供最新結果,伺服器126存取伺服器122及124或更特定言之存取儲存器132及134中之內容,以更新搜尋索引136。
隨著伺服器之數目及大量可用內容繼續增長,將搜尋索引保持為最新變得愈加困難。結果,一些搜尋索引比其他搜尋索引更頻繁地得到更新。伺服器索引軟體代理程式或"機器人程式(bot)"將比其他索引更頻繁地得到更新之索引列入優先。
根據一說明性實施例,客戶端搜尋索引程式以透明方式且結合基於伺服器之索引而運作。經組合之搜尋索引提供更為準確及最新的網站影像,該網站影像係對於每一個別使用者之興趣而定做的。客戶端索引器根據使用者之偏好及使用型式定做特定網頁的索引。
使用者最初在客戶端(諸如,客戶端110、112、114中之一者)上安裝並組態客戶端索引器。所請求之索引在搜尋期間被自動再新且與主伺服器端索引整合。舉例而言,當使用者執行搜尋時,客戶端110處之客戶端索引(例如)可與主伺服器端索引136組合。經組合之索引為特定使用者提供準確的搜尋結果。伺服器126處之搜尋引擎接著檢查客戶端索引及伺服器端索引,並使用時戳來比較該等索引。搜尋引擎使用具有較新時戳之索引。此允許使用者使用其最感興趣之站點的被頻繁更新之索引進行搜尋,同時仍利用由伺服器所維持的用於大多數網站的大索引。
在所描繪之實例中,分散式資料處理系統100為具有網路102之網際網路,其表示全球範圍內使用傳輸控制協定/網際網路協定(TCP/IP)協定組以彼此通信之網路及閘道器的集合。網際網路之核心為在主節點或主電腦之間的高速資料通信線路的骨幹,由投送資料及訊息之上千的商業、政府、教育及其他電腦系統組成。當然,分散式資料處理系統100亦可經實施以包括多個不同類型之網路,諸如企業內部網路、區域網路(LAN)、廣域網路(WAN)或其類似物。如上所述,圖1意欲作為一實例,而非作為對本發明之不同實施例的架構限制,且因此,不應將圖1中所示之特定元件視為關於可實施本發明之說明性實施例的環境為限制性的。
現參看圖2,其展示例示性資料處理系統之方塊圖,在該系統中可實施說明性實施例之態樣。資料處理系統200為電腦之一實例,諸如圖1中之主機110,其中可定位實施本發明之說明性實施例之處理的電腦可用程式碼或指令。
在所描繪之實例中,資料處理系統200使用包括北橋與記憶體控制器集線器(NB/MCH)202及南橋與輸入/輸出(I/O)控制器集線器(SB/ICH)204之集線器架構。處理單元206、主記憶體208及圖形處理器210連接至NB/MCH 202。圖形處理器210可經由加速圖形埠(AGP)而連接至NB/MCH 202。
在所描繪之實例中,區域網路(LAN)配接器212連接至SB/ICH 204。音訊配接器216、鍵盤與滑鼠配接器220、數據機222、唯讀記憶體(ROM)224、硬碟驅動器(HDD)226、CD-ROM驅動器230、通用串列匯流排(USB)埠與其他通信埠232及PCI/PCIe設備234經由匯流排238及匯流排240而連接至SB/ICH 204。PCI/PCIe設備可包括(例如)乙太網路配接器、插入卡及用於筆記型電腦之PC卡。PCI使用卡匯流排控制器,而PCIe則不使用卡匯流排控制器。ROM 224可為(例如)快閃二進位輸入/輸出系統(BIOS)。
HDD 226及CD-ROM驅動器230經由匯流排240而連接至SB/ICH 204。HDD 226及CD-ROM驅動器230可使用(例如)整合的驅動電子設備(IDE)或串列高級技術連接(SATA)介面。超級I/O(SIO)設備236可連接至SB/ICH 204。
一作業系統在處理單元206上執行。該作業系統協調及提供對圖2中之資料處理系統200內之各種組件的控制。作為客戶端,該作業系統可為一可購得之作業系統,諸如MicrosoftWindowsXP(Microsoft及Windows為Microsoft公司在美國、其他國家或兩者的商標)。諸如JavaTM 程式設計系統之物件導向程式設計系統可結合作業系統來執行,且自執行於資料處理系統200上之JavaTM 程式或應用程式來提供對作業系統的呼叫(Java係Sun Microsystems有限公司在美國、其他國家或兩者的商標)。
作為伺服器,資料處理系統200可為(例如)執行Advanced Interactive Executive(AIX)作業系統或LINUX作業系統之IBMeServerTM pSeries電腦系統(eServer,pSeries及AIX係International Business Machines公司在美國、其他國家或兩者的商標,而LINUX係Linus Torvalds在美國、其他國家或兩者的商標)。資料處理系統200可為在處理單元206中包括複數個處理器之對稱多處理器(SMP)系統。或者,可使用單處理器系統。
用於作業系統、物件導向程式設計系統及應用程式或程式之指令位於諸如HDD 226之儲存設備上,且可載入至主記憶體208中以供處理單元206執行。舉例而言,可由處理單元206使用電腦可用程式碼來執行本發明之說明性實施例的程序,電腦可用程式碼可位於諸如主記憶體208、ROM 224之記憶體中或位於一或多個周邊設備226及230中。
匯流排系統(諸如,圖2所示之匯流排238或匯流排240)可包含一或多個匯流排。當然,可使用任何類型之通信組構或架構來實施匯流排系統,該通信組構或架構提供在附加至該組構或架構之不同組件或設備之間的資料轉移。通信單元(諸如,圖2之數據機222或網路配接器212)可包括用於傳輸及接收資料之一或多個設備。記憶體可為(例如)圖2中之主記憶體208、ROM 224或諸如在NB/MCH 202中發現之快取記憶體。
一般熟習此項技術者將瞭解,圖1至圖2中之硬體可視實施情況而變化。除了圖1至圖2所描繪之硬體之外或替代圖1至圖2所描繪之硬體,可使用其他內部硬體或周邊設備,諸如快閃記憶體、等效非揮發性記憶體或光碟驅動器及其類似物。又,在不脫離本發明之精神及範疇的情況下,說明性實施例之處理可應用於除前述SMP系統之外的多處理器資料處理系統。
此外,資料處理系統200可採用多個不同資料處理系統中之任一者之形式,包括客戶端計算設備、伺服器計算設備、平板型電腦、膝上型電腦、電話或其他通信設備、個人數位助理(PDA)或其類似物。舉例而言,在一些說明性實例中,資料處理系統200可為一攜帶型計算設備,該攜帶型計算設備組態有快閃記憶體以提供非揮發性記憶體用於儲存作業系統檔案及/或使用者產生之資料。實質上,資料處理系統200在無架構限制的情況下可為任何已知的或稍後開發的資料處理系統。
圖3為說明根據一例示性實施例之整合的索引系統之圖式。伺服器端索引器330將來自內容伺服器330之內容編入索引,並更新伺服器端索引332。如上所述,在伺服器數目及內容量迅速增長的情況下,伺服器端索引器330難以將伺服器端索引332保持為最新的。
根據一說明性實施例,客戶端索引器310及320分別提供客戶端索引312及322,客戶端索引312及322係針對特定使用者而定做的。客戶端索引器310及320在無限制的情況下可為獨立應用程式或網站瀏覽器插件。
第一使用者安裝客戶端索引器310,並設定組態選項314。組態選項可包括下述各項:.索引排程-更新索引之時間及頻率。
.包括清單-總是編入索引之站點的清單。
.排除清單-從不編入索引之站點的清單。
.所收集之使用者資料-由程式收集來用於索引之資料。
.訂用服務-由另一使用者之客戶端索引器更新之索引的清單。
.伺服器更新-是否發送經更新之索引至網際網路搜尋引擎以識別變化。
.P2P索引共用-是否與對等物共用索引。
.索引式樣或演算法組態。
.自動索引-當被賦能時,索引應用程式判定待編入索引之頁。
.相關性準則-用以包括於索引中之準則。
此等組態選項允許使用者在客戶端上全面地定做搜尋索引。
舉例而言,客戶端索引器310可以自動及透明方式起始索引操作。亦即,客戶端索引器310可根據排程或者可能當客戶端設備閒置時將背景中來自內容伺服器330的內容編入索引。
客戶端索引器310可使用包括清單及排除清單來判定待編入索引之內容。此外,客戶端索引器310可使用自動索引及相關性準則來判定待編入索引之內容。舉例而言,客戶端索引器310可將最近搜尋結果、最常訪問之站點、書籤或最喜愛項目、帶旗標站點或具有類似興趣的人所訪問之站點編入索引。為此目的,客戶端索引器310可儲存使用資訊316。
組態選項314亦可允許使用者定義待編入索引之頁內資訊及待使用之索引式樣或演算法。舉例而言,使用者可設定組態選項314以將常讀之網站日誌(網志(blog))頁編入索引,且可選擇特定演算法用於索引網志。此演算法可較強調網志標題、日期及回溯(trackback),而不過於強調此實例中之較舊之項目及註釋。
類似地,客戶端索引器320提供客戶端索引322。第二使用者可安裝客戶端索引器320,並設定組態選項324。客戶端索引器可接著根據組態選項324而將內容伺服器330上之內容編入索引以形成客戶端索引322。此外,客戶端索引器320可基於使用資訊326根據組態選項324中之相關性準則來判定待編入索引之內容。
此外,圖3所描繪之整合的索引系統可提供合作式點對點(P2P)團體態樣。因為每一使用者可定做區域索引以符合其需要,所以除了反饋至伺服器之外,此資訊亦可供其他類似使用者共用。在一實施例中,關聯於客戶端索引器310之使用者可與關聯於客戶端索引器320之使用者相匹配(例如,基於其區域索引或使用資訊之相似性)。此等使用者可接著經配對以共用區域索引、索引組態及待局部編入索引之站點的自動建議。此進一步提高索引操作之有效性及效率,而不會對伺服器端索引器330施加任何額外負荷。
圖4為說明根據一例示性實施例之搜尋系統之圖式。搜尋客戶端410將搜尋詢問412提交給搜尋引擎420。搜尋客戶端410可為(例如)執行自搜尋引擎420提供為網頁之搜尋應用程式的網站瀏覽器。搜尋客戶端410將客戶端索引414附加至搜尋請求412。搜尋客戶端410亦可包括瀏覽器插件(未圖示)。
當搜尋引擎420接收搜尋請求412及客戶端索引414時,其將客戶端索引414之時戳與伺服器端索引422之時戳相比較。若客戶端索引414較新,則搜尋引擎420將客戶端索引414與伺服器端索引422組合。
客戶端索引414可將可與或可不與伺服器端索引422之內容重疊之一部分內容編入索引。由客戶端索引414編入索引之內容對關聯於搜尋客戶端410之使用者的偏好及使用歷史而言係特定的。另外,客戶端索引414可包括與P2P團體中之另一客戶端索引器相關聯之客戶端索引的全部或一部分。
搜尋引擎420使用經組合之索引執行搜尋。當搜尋完成時,搜尋引擎420將搜尋結果424傳回至搜尋客戶端410。
在一例示性實施例中,搜尋客戶端410可將搜尋請求412提交給搜尋引擎420。搜尋引擎420可接著使用伺服器端索引422執行搜尋,並傳回搜尋結果424。搜尋引擎420可使用伺服器端索引422之時戳給搜尋結果424加時戳。
搜尋客戶端410亦可使用客戶端索引414在客戶端處執行搜尋。搜尋客戶端410亦可使用客戶端索引414之時戳給所得搜尋結果(未圖示)加時戳。搜尋客戶端410可接著將伺服器搜尋結果424之時戳與客戶端搜尋結果之時戳相比較。若客戶端搜尋結果之時戳指示客戶端索引414比伺服器端索引424新,則搜尋客戶端410可將客戶端搜尋結果整合至伺服器搜尋結果424中。
圖5為說明根據一說明性實施例之客戶端索引器之操作的流程圖。應瞭解,流程圖說明中之每一區塊及流程圖說明中之區塊的組合可由電腦程式指令實施。此等電腦程式指令可提供至處理器或其他可程式化資料處理裝置以產生一機器,從而使得在處理器或其他可程式化資料處理裝置上執行之指令形成用於實施流程圖區塊中所規定之功能的構件。此等電腦程式指令亦可儲存於可引導處理器或其他可程式化資料處理裝置以特定方式發揮作用之電腦可讀記憶體或儲存媒體中,從而使得儲存於電腦可讀記憶體或儲存媒體中之指令產生一製造物件,該製造物件包括實施流程圖區塊中所規定之功能的指令構件。
因此,流程圖說明中之區塊支援用於執行規定功能之構件的組合、用於執行規定功能之步驟與用於執行規定功能之程式指令構件的組合。亦應瞭解,流程圖說明中之每一區塊及流程圖說明中之區塊的組合可由執行規定功能或步驟的基於專用硬體之電腦系統或由專用硬體與電腦指令之組合來實施。
現參看圖5,操作開始且客戶端索引器載入組態選項(區塊502)。客戶端索引器判定是否更新客戶端索引之全部或一部分(504)。客戶端索引器可基於一總排程、一與客戶端索引之一特定部分相關聯之排程、客戶端設備是否閒置及其類似物來判定是否更新客戶端索引。
若客戶端索引器判定不更新客戶端索引,則客戶端索引器判定是否存在退出條件(區塊506)。舉例而言,若客戶端索引器關閉或客戶端設備停用,則可能存在退出條件。若退出條件並不存在,則操作返回至區塊504以判定是否更新客戶端索引。若區塊506中確實存在退出條件,則操作結束。
返回至區塊504,若客戶端索引器判定客戶端索引之全部或一部分有待更新,則客戶端索引器基於組態選項及使用資訊來識別待編入索引之內容(區塊508)。客戶端索引器判定經識別內容之索引式樣及/或演算法(區塊510)。接著,客戶端索引器藉由將經識別內容編入索引而更新客戶端搜尋索引(區塊512)。其後,操作進行至區塊506以判定是否存在退出條件。
圖6為說明根據一說明性實施例之搜尋引擎之操作的流程圖。操作開始且搜尋引擎接收具有附加之客戶端索引之搜尋請求(區塊602)。搜尋引擎將客戶端索引之時戳與伺服器端索引之時戳相比較(區塊604)。接著,搜尋引擎判定客戶端索引是否比伺服器端索引新(區塊606)。
若伺服器端索引比客戶端索引新,則搜尋引擎使用伺服器端索引執行搜尋(區塊608)。其後,搜尋引擎將搜尋結果傳回至請求客戶端(區塊610),且操作結束。
若在區塊606中客戶端索引之至少一部分比伺服器端索引之對應部分新,則搜尋引擎將客戶端索引與伺服器端索引組合(區塊612)。接著,搜尋引擎使用經組合之搜尋索引執行搜尋(區塊614)。其後,操作進行至區塊610以將搜尋結果傳回至請求客戶端,且操作結束。
圖7為說明根據一說明性實施例之一經組合的客戶端與伺服器端搜尋之操作的流程圖。操作開始且搜尋客戶端接收搜尋請求(區塊702)。搜尋客戶端將搜尋請求發送至搜尋引擎伺服器(區塊704)。搜尋引擎伺服器執行搜尋以產生一組搜尋結果。伺服器使用伺服器端搜尋索引之時戳給該組搜尋結果加時戳。
接著,搜尋客戶端自伺服器接收該組被加時戳之搜尋結果(區塊706)。搜尋客戶端亦使用客戶端搜尋索引執行搜尋(區塊708)。接著,搜尋客戶端將客戶端搜尋結果之時戳與伺服器搜尋結果之時戳相比較(區塊710)。接著,搜尋客戶端判定客戶端索引是否比伺服器端索引新(區塊712)。
若伺服器端索引比客戶端索引新,則搜尋客戶端將伺服器搜尋結果傳回至使用者(區塊714),且操作結束。若在區塊710中客戶端索引之至少一部分比伺服器端索引之對應部分新,則搜尋客戶端將客戶端搜尋結果與伺服器端搜尋結果組合(區塊716)。接著,搜尋客戶端將經組合之搜尋結果傳回至使用者(區塊718),且操作結束。
因此,說明性實施例藉由一以透明方式且結合基於伺服器之搜尋索引而運作之客戶端搜尋索引程式來解決先前技術之缺點。經組合之搜尋索引提供更為準確及最新的網站影像,該網站影像係對於每一個別使用者之興趣而定做的。客戶端索引器根據使用者之偏好及使用型式定做特定網頁的索引。
使用者最初在客戶端上安裝並組態客戶端索引器。所請求之索引在搜尋期間被自動再新且與主伺服器端索引整合。當使用者執行搜尋時,客戶端索引可與主伺服器端索引組合。經組合之索引為特定使用者提供準確的搜尋結果。此允許使用者使用其最感興趣之站點的被頻繁更新之索引進行搜尋,同時仍利用由伺服器所維持的用於大多數網站的大索引。
如搜尋引擎提供者之間的激烈競爭所證明,搜尋引擎技術內之任何提高可為寶貴的。說明性實施例經由對每一使用者而私人化之定做的、整合的區域搜尋索引而提供改良搜尋功能性、準確性及使用者友好性之機制。
應瞭解,說明性實施例可採用完全硬體實施例之形式、完全軟體實施例之形式或含有硬體及軟體元件之實施例之形式。在一例示性實施例中,說明性實施例之機制係以軟體實施,該軟體包括(但不限於)韌體、常駐軟體、微程式碼等。
此外,說明性實施例可採用可自電腦可用或電腦可讀媒體存取之電腦程式產品的形式,該電腦可用或電腦可讀媒體提供由電腦或任何指令執行系統使用或結合電腦或任何指令執行系統使用的程式碼。出於此描述之目的,電腦可用或電腦可讀媒體可為可含有、儲存、傳達、傳播或傳送由指令執行系統、裝置或設備使用或結合指令執行系統、裝置或設備使用之程式的任何裝置。
該媒體可為電子、磁性、光學、電磁、紅外或半導體系統(或裝置或設備)或傳播媒體。電腦可讀媒體之實例包括半導體或固態記憶體、磁帶、抽取式電腦磁碟、隨機存取記憶體(RAM)、唯讀記憶體(ROM)、剛性磁碟及光碟。光碟之當前實例包括緊密光碟-唯讀記憶體(CD-ROM)、緊密光碟-讀/寫(CD-R/W)及DVD。
適用於儲存及/或執行程式碼之資料處理系統將包括直接耦合至記憶體元件或經由一系統匯流排間接耦合至記憶體元件的至少一處理器。該等記憶體元件可包括在程式碼之實際執行期間使用的區域記憶體、大容量儲存器,及提供對至少某程式碼之暫時儲存以減少在執行期間必須自大容量儲存器擷取程式碼的次數之快取記憶體。
輸入/輸出或I/O設備(包括但不限於鍵盤、顯示器、指標設備等)可直接耦合至系統或經由插入之I/O控制器耦合至系統。網路配接器亦可耦合至系統以使資料處理系統能經由插入之私用或公用網路耦合至其他資料處理系統或遠端指標或儲存設備。數據機、電纜數據機及乙太網路卡僅為幾種當前可用之類型的網路配接器。
已為說明及描述之目的而呈現了本發明之描述,但該描述不欲為詳盡的或限於所揭示之形式的本發明。許多修改及變化對於一般熟習此項技術者將顯而易見。選擇且描述了實施例以最佳地解釋本發明之原理、實際應用,且使其他一般熟習此項技術者瞭解本發明之具有適合於所涵蓋之特定用途的各種修改之各種實施例。
100...分散式資料處理系統
102...網路
110...客戶端
112...客戶端
114...客戶端
122...伺服器
124...伺服器
126...伺服器
132...儲存單元/儲存器
134...儲存單元/儲存器
136...主伺服器端索引
200...資料處理系統
202...北橋與記憶體控制器集線器(NB/MCH)
204...南橋與輸入/輸出(I/O)控制器集線器(SB/ICH)
206...處理單元
208...主記憶體
210...圖形處理器
212...區域網路(LAN)配接器
216...音訊配接器
220...鍵盤與滑鼠配接器
222...數據機
224...唯讀記憶體(ROM)
226...硬碟驅動器(HDD)/周邊設備
230...CD-ROM驅動器/周邊設備
232...通用串列匯流排(USB)埠與其他通信埠
234...PCI/PCIe設備
236...超級I/O(SIO)設備
238...匯流排
240...匯流排
310...客戶端索引器
312...客戶端索引
314...組態選項
316...使用資訊
320...客戶端索引器
322...客戶端索引
324...組態選項
326...使用資訊
330...伺服器端索引器/內容伺服器
332...伺服器端索引
410...搜尋客戶端
412...搜尋詢問/搜尋請求
414...客戶端索引
420...搜尋引擎
422...伺服器端索引
424...搜尋結果/伺服器端索引
圖1描繪可實施說明性實施例之態樣的例示性分散式資料處理系統之圖示;圖2為可實施說明性實施例之態樣的例示性資料處理系統之方區塊圖;圖3為說明根據一例示性實施例之一整合的索引系統之圖式;圖4為說明根據一例示性實施例之一搜尋系統的圖式;圖5為說明根據一說明性實施例之一客戶端索引器之操作的流程圖;圖6為說明根據一說明性實施例之一搜尋引擎之操作的流程圖;及圖7為說明根據一說明性實施例之一經組合的客戶端與伺服器端搜尋之操作的流程圖。
(無元件符號說明)

Claims (20)

  1. 一種電腦程式產品,其包含一具有一電腦可讀程式之電腦可用媒體,其中該電腦可讀程式當執行於一計算設備上時使該計算設備:載入一組組態選項,其中該等組態選項定義對於客戶端索引之使用者偏好;基於該組組態選項而識別待編入索引之一部分內容;基於該組組態選項而在一客戶端索引器處將該部分內容編入索引,以形成一客戶端搜尋索引,其中該客戶端搜尋索引係對於一關聯於該客戶端索引器之使用者而私人化;及使用該客戶端搜尋索引與一關聯於一搜尋引擎之伺服器端搜尋索引的一組合基於一搜尋詢問而執行一搜尋。
  2. 如請求項1之電腦程式產品,其中該搜尋引擎將該客戶端搜尋索引與該伺服器端搜尋索引組合以形成一經組合之搜尋索引,並使用該經組合之搜尋索引執行一搜尋以滿足搜尋請求。
  3. 如請求項1之電腦程式產品,其中該搜尋引擎使用該伺服器端搜尋索引基於該搜尋詢問而執行一搜尋,並傳回一組伺服器搜尋結果,且其中一客戶端組件使用該客戶端搜尋索引基於該搜尋詢問而執行一搜尋以產生一組客戶端搜尋結果,其中該電腦可讀程式進一步使該計算設備:回應於該組客戶端搜尋結果比該組伺服器搜尋結果新,將該組客戶端搜尋結果整合至該等伺服器搜尋結果中以形成一經組合的搜尋結果組。
  4. 如請求項1之電腦程式產品,其中識別待編入索引之一部分內容包含識別一組先前搜尋結果、識別一組最常訪問之網站、識別一組書籤或最喜愛項目、識別帶旗標站點或識別由具有類似興趣之使用者所訪問之一組站點。
  5. 如請求項1之電腦程式產品,其中將該部分內容編入索引包含:接收來自一對等物之一客戶端索引;及將該來自該對等物之客戶端索引與該客戶端搜尋索引組合。
  6. 如請求項1之電腦程式產品,其中該組組態選項包括一索引排程,且其中該客戶端索引器根據該索引排程而自動將該部分內容編入索引。
  7. 如請求項1之電腦程式產品,其中該組組態選項包括一包括清單,且其中該部分內容總是包括來自該包括清單之內容。
  8. 如請求項1之電腦程式產品,其中該組組態選項包括一排除清單,且其中該部分內容從不包括來自該排除清單之內容。
  9. 如請求項1之電腦程式產品,其中該組組態選項包括一索引演算法,且其中該客戶端索引器使用該索引演算法將該部分內容編入索引。
  10. 一種用於私人化的、整合的搜尋索引之裝置,其包含:一處理器;及一耦合至該處理器之記憶體,其中該記憶體含有指令,該等指令當由該處理器執行時使該處理器:載入一組組態選項,其中該等組態選項定義對於客戶端索引之使用者偏好;基於該組組態選項而識別待編入索引之一部分內容;基於該組組態選項而在一客戶端索引器處將該部分內容編入索引,以形成一客戶端搜尋索引,其中該客戶端搜尋索引係對於一關聯於該客戶端索引器之使用者而私人化;及使用該客戶端搜尋索引與一關聯於一搜尋引擎之伺服器端搜尋索引的一組合基於一搜尋詢問而執行一搜尋。
  11. 如請求項10之裝置,其中該客戶端索引器藉由如下方式而將該部分內容編入索引:接收來自一對等物之一客戶端索引;及將該來自該對等物之客戶端索引與該客戶端搜尋索引組合。
  12. 如請求項10之裝置,其中該組組態選項包括一索引排程,且其中該客戶端索引器根據該索引排程而自動將該部分內容編入索引。
  13. 如請求項10之裝置,其中該組組態選項包括一索引演算法,且其中該客戶端索引器使用該索引演算法將該部分內容編入索引。
  14. 一種用於私人化的、整合的搜尋索引之方法,該方法包含:載入一組組態選項,其中該等組態選項定義對於客戶端索引之使用者偏好;基於該組組態選項而識別待編入索引之一部分內容;基於該組組態選項而在一客戶端索引器處將該部分內容編入索引,以形成一客戶端搜尋索引,其中針對一關聯於該客戶端索引器之使用者而私人化該客戶端搜尋索引;及使用該客戶端搜尋索引與一關聯於一搜尋引擎之伺服器端搜尋索引的一組合基於一搜尋詢問而執行一搜尋。
  15. 如請求項14之方法,其中該搜尋引擎將該客戶端搜尋索引與該伺服器端搜尋索引組合以形成一經組合之搜尋索引,並使用該經組合之搜尋索引執行一搜尋以滿足搜尋請求。
  16. 如請求項14之方法,其中該搜尋引擎使用該伺服器端搜尋索引基於該搜尋詢問而執行一搜尋,並傳回一組伺服器搜尋結果,且其中一客戶端組件使用該客戶端搜尋索引基於該搜尋詢問而執行一搜尋以產生一組客戶端搜尋結果,該方法進一步包含:回應於該組客戶端搜尋結果比該組伺服器搜尋結果新,將該組客戶端搜尋結果整合至該等伺服器搜尋結果中以形成一經組合的搜尋結果組。
  17. 如請求項14之方法,其中識別待編入索引之一部分內容包含識別一組先前搜尋結果、識別一組最常訪問之網站、識別一組書籤或最喜愛項目、識別帶旗標站點或識別由具有類似興趣之使用者所訪問之一組站點。
  18. 如請求項14之方法,其中將該部分內容編入索引包含:接收來自一對等物之一客戶端索引;及將該來自該對等物之客戶端索引與該客戶端搜尋索引組合。
  19. 如請求項14之方法,其中該組組態選項包括一索引排程,且其中該客戶端索引器根據該索引排程而自動將該部分內容編入索引。
  20. 如請求項14之方法,其中該組組態選項包括一索引演算法,且其中該客戶端索引器使用該索引演算法將該部分內容編入索引。
TW096124154A 2006-07-19 2007-07-03 網站之定做的、私人化的與整合的客戶端搜尋索引 TWI410812B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/458,532 US7660787B2 (en) 2006-07-19 2006-07-19 Customized, personalized, integrated client-side search indexing of the web

Publications (2)

Publication Number Publication Date
TW200817944A TW200817944A (en) 2008-04-16
TWI410812B true TWI410812B (zh) 2013-10-01

Family

ID=38442495

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096124154A TWI410812B (zh) 2006-07-19 2007-07-03 網站之定做的、私人化的與整合的客戶端搜尋索引

Country Status (6)

Country Link
US (1) US7660787B2 (zh)
EP (1) EP2050020A1 (zh)
JP (1) JP2009544088A (zh)
CN (1) CN101490679B (zh)
TW (1) TWI410812B (zh)
WO (1) WO2008009515A1 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9195756B1 (en) 1999-08-16 2015-11-24 Dise Technologies, Llc Building a master topical index of information
US8504554B2 (en) 1999-08-16 2013-08-06 Raichur Revocable Trust, Arvind A. and Becky D. Raichur Dynamic index and search engine server
US9977831B1 (en) 1999-08-16 2018-05-22 Dise Technologies, Llc Targeting users' interests with a dynamic index and search engine server
US10115124B1 (en) * 2007-10-01 2018-10-30 Google Llc Systems and methods for preserving privacy
US8583682B2 (en) * 2008-12-30 2013-11-12 Microsoft Corporation Peer-to-peer web search using tagged resources
US20100174719A1 (en) * 2009-01-06 2010-07-08 Jorge Alegre Vilches System, method, and program product for personalization of an open network search engine
US8738801B2 (en) 2009-07-14 2014-05-27 Qualcomm Incorporated Methods and apparatus for updating index information while adding and updating documents in a distributed network
US8539161B2 (en) * 2009-10-12 2013-09-17 Microsoft Corporation Pre-fetching content items based on social distance
WO2011056169A1 (en) * 2009-11-03 2011-05-12 Arvind Raichur Dynamic index and search engine server
US8495058B2 (en) * 2011-08-05 2013-07-23 Google Inc. Filtering social search results
US9189555B2 (en) * 2012-09-07 2015-11-17 Oracle International Corporation Displaying customized list of links to content using client-side processing
CN105493081B (zh) * 2013-07-04 2020-12-22 瓦罗尼斯系统控股公司 企业中的分布式索引
US9892139B2 (en) 2013-07-04 2018-02-13 Varonis Systems, Ltd. Distributed indexing in an enterprise
US20150112996A1 (en) 2013-10-23 2015-04-23 Microsoft Corporation Pervasive search architecture
US10140299B2 (en) * 2014-12-31 2018-11-27 Rovi Guides, Inc. Systems and methods for enhancing search results by way of updating search indices
CN106294691B (zh) * 2016-08-04 2020-03-03 广州交易猫信息技术有限公司 榜单刷新方法、装置及服务端
US11093518B1 (en) 2017-09-23 2021-08-17 Splunk Inc. Information technology networked entity monitoring with dynamic metric and threshold selection
US11159397B2 (en) 2017-09-25 2021-10-26 Splunk Inc. Lower-tier application deployment for higher-tier system data monitoring
US11676072B1 (en) 2021-01-29 2023-06-13 Splunk Inc. Interface for incorporating user feedback into training of clustering model
US20230010652A1 (en) * 2021-07-09 2023-01-12 Mongodb, Inc. Systems and methods for automatic index creation in database deployment

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6594682B2 (en) * 1997-10-28 2003-07-15 Microsoft Corporation Client-side system for scheduling delivery of web content and locally managing the web content
TW545070B (en) * 2000-11-17 2003-08-01 Ibm User specified parallel data fetching for optimized web access
TW552521B (en) * 2001-03-08 2003-09-11 Ibm Predictive caching and highlighting of web pages
TW200426625A (en) * 2002-12-23 2004-12-01 Ibm A transparent edge-of-network data cache
TW200501721A (en) * 2003-03-24 2005-01-01 Yahoo Inc System and method for exchanging messages between an instant messaging user and an e-mail user
US20050071766A1 (en) * 2003-09-25 2005-03-31 Brill Eric D. Systems and methods for client-based web crawling
TWI235939B (en) * 2002-12-12 2005-07-11 Ibm Client device configuration with configuration services providers
TWI239467B (en) * 2002-11-16 2005-09-11 Ibm System and method for conducting adaptive search using a peer-to-peer network
TW200612262A (en) * 2004-10-05 2006-04-16 Microsoft Corp Systems, methods, and interfaces for providing personalized search and information access
US7068309B2 (en) * 2001-10-09 2006-06-27 Microsoft Corp. Image exchange with image annotation

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3254642B2 (ja) * 1996-01-11 2002-02-12 株式会社日立製作所 索引の表示方法
JPH09265482A (ja) * 1996-01-26 1997-10-07 Mitsubishi Electric Corp データベース検索装置及びデータベース検索方法
US6212549B1 (en) * 1997-10-06 2001-04-03 Nexprise, Inc. Trackpoint-based computer-implemented systems and methods for facilitating collaborative project development and communication
JP3998794B2 (ja) * 1998-02-18 2007-10-31 株式会社野村総合研究所 ブラウジングクライアントサーバーシステム
US6510439B1 (en) 1999-08-06 2003-01-21 Lucent Technologies Inc. Method and system for consistent update and retrieval of document in a WWW server
US6490575B1 (en) * 1999-12-06 2002-12-03 International Business Machines Corporation Distributed network search engine
US6366907B1 (en) 1999-12-15 2002-04-02 Napster, Inc. Real-time search engine
US6983379B1 (en) 2000-06-30 2006-01-03 Hitwise Pty. Ltd. Method and system for monitoring online behavior at a remote site and creating online behavior profiles
JP2002169805A (ja) * 2000-11-30 2002-06-14 Matsushita Electric Ind Co Ltd クライアント・サーバ型文書検索装置
WO2003040963A1 (en) * 2001-11-02 2003-05-15 Medical Research Consultants L.P. Knowledge management system
US7356711B1 (en) * 2002-05-30 2008-04-08 Microsoft Corporation Secure registration
US8752115B2 (en) * 2003-03-24 2014-06-10 The Directv Group, Inc. System and method for aggregating commercial navigation information
JP2005056223A (ja) * 2003-08-06 2005-03-03 Inax Corp テキストデータ検索システム、その方法及びそのプログラム
WO2005048052A2 (en) 2003-11-05 2005-05-26 Dipsie, Inc. Identifying cataloging and retrieving web pages using client-side scripting and web forms
US7490079B2 (en) * 2005-04-14 2009-02-10 Microsoft Corporation Client side indexing of offline address book files
US8762410B2 (en) * 2005-07-18 2014-06-24 Oracle International Corporation Document level indexes for efficient processing in multiple tiers of a computer system
US20070136243A1 (en) * 2005-12-12 2007-06-14 Markus Schorn System and method for data indexing and retrieval

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6594682B2 (en) * 1997-10-28 2003-07-15 Microsoft Corporation Client-side system for scheduling delivery of web content and locally managing the web content
TW545070B (en) * 2000-11-17 2003-08-01 Ibm User specified parallel data fetching for optimized web access
TW552521B (en) * 2001-03-08 2003-09-11 Ibm Predictive caching and highlighting of web pages
US7068309B2 (en) * 2001-10-09 2006-06-27 Microsoft Corp. Image exchange with image annotation
TWI239467B (en) * 2002-11-16 2005-09-11 Ibm System and method for conducting adaptive search using a peer-to-peer network
TWI235939B (en) * 2002-12-12 2005-07-11 Ibm Client device configuration with configuration services providers
TW200426625A (en) * 2002-12-23 2004-12-01 Ibm A transparent edge-of-network data cache
TW200501721A (en) * 2003-03-24 2005-01-01 Yahoo Inc System and method for exchanging messages between an instant messaging user and an e-mail user
US20050071766A1 (en) * 2003-09-25 2005-03-31 Brill Eric D. Systems and methods for client-based web crawling
TW200612262A (en) * 2004-10-05 2006-04-16 Microsoft Corp Systems, methods, and interfaces for providing personalized search and information access

Also Published As

Publication number Publication date
WO2008009515A1 (en) 2008-01-24
US20080021872A1 (en) 2008-01-24
EP2050020A1 (en) 2009-04-22
CN101490679B (zh) 2011-07-13
US7660787B2 (en) 2010-02-09
TW200817944A (en) 2008-04-16
CN101490679A (zh) 2009-07-22
JP2009544088A (ja) 2009-12-10

Similar Documents

Publication Publication Date Title
TWI410812B (zh) 網站之定做的、私人化的與整合的客戶端搜尋索引
US10803017B2 (en) Generating file usage information
US10268641B1 (en) Search result ranking based on trust
US7797295B2 (en) User content feeds from user storage devices to a public search engine
US9031946B1 (en) Processor engine, integrated circuit and method therefor
US10489448B2 (en) Method and system for dynamically ranking images to be matched with content in response to a search query
US20170255652A1 (en) Method for dynamically matching images with content items based on keywords in response to search queries
US20120016857A1 (en) System and method for providing search engine optimization analysis
CN106605221A (zh) 具有用于即时索引的方法的多用户搜索系统
JP2018507473A (ja) パーソナルコンテンツアイテム検索システム及び方法
US20130219281A1 (en) Processor engine, integrated circuit and method therefor
US20150254216A1 (en) Contextual hyperlink insertion
US10275472B2 (en) Method for categorizing images to be associated with content items based on keywords of search queries
US20170357712A1 (en) Method and system for searching and identifying content items in response to a search query using a matched keyword whitelist
KR102284761B1 (ko) 내장가능형 미디어 콘텐츠 검색 위젯
US10909170B2 (en) Method for processing and rendering feed-like based images for mobile devices
Melucci et al. Advanced topics in information retrieval
CN110291515B (zh) 计算系统中的分布式索引搜索
US20130117263A1 (en) Context-Based Item Bookmarking
US10567845B2 (en) Embeddable media content search widget
US20160077727A1 (en) Online Protocol Community
CA2864767A1 (en) Processor engine, integrated circuit and method for promoting websites in search result lists
US20110055260A1 (en) Systems and methods for delivering a web page to a user in response to a page request
Kivistö Case Study: SEO Strategy and Implementation for Industrial Pump Company
Downes Introduction to the world wide web

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees