TWI386824B - 響應終端使用者資訊請求之方法及裝置 - Google Patents

響應終端使用者資訊請求之方法及裝置 Download PDF

Info

Publication number
TWI386824B
TWI386824B TW094128426A TW94128426A TWI386824B TW I386824 B TWI386824 B TW I386824B TW 094128426 A TW094128426 A TW 094128426A TW 94128426 A TW94128426 A TW 94128426A TW I386824 B TWI386824 B TW I386824B
Authority
TW
Taiwan
Prior art keywords
keyword
search
information
behavior
user
Prior art date
Application number
TW094128426A
Other languages
English (en)
Other versions
TW200630828A (en
Inventor
Remigiusz K Paczkowski
Matthew E Westover
Dominic Bennett
Benjamin Lindsey
Scott Vandevelde
Jason Fairchild
Adam William Pingel
Original Assignee
Carhamm Ltd Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/015,583 external-priority patent/US8078602B2/en
Application filed by Carhamm Ltd Llc filed Critical Carhamm Ltd Llc
Publication of TW200630828A publication Critical patent/TW200630828A/zh
Application granted granted Critical
Publication of TWI386824B publication Critical patent/TWI386824B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Description

響應終端使用者資訊請求之方法及裝置
本發明係相關於高階搜尋引擎。下面討論待解決的技術問題、所使用的對策、和已獲得的結果。
其中一Google採用的搜尋引擎之途徑係組織全球資訊並且讓它能夠在全球被存取和使用。另一Dogpile曾採用的途徑係具有聚集其他搜尋引擎的結果之媒介搜尋引擎。這些途徑產生一大堆結果。例如,光是2005夏天,關鍵字"cheap travel(廉價旅行)"從Google轉回大約18,000,000結果、從Yahoo轉回大約85,800,000結果、及從MSN轉回大約68,377,619結果。
已針對在一大堆結果中"海底撈針"及設計排列響應詢問所轉回的鏈結之方法做了許多努力。Google發表的專利申請案(以Google為名)建議使用區域互連、物體資訊、位置認知、和其他因素決定結果的位置。Yahoo、Overture、和Microsoft也對推敲結果的代表性做了許多努力。
在任一組資訊中,搜尋詞語有時仍不完全能夠決定找到什麼結果。在一觀點中,搜尋詞語可能含糊不清,如同Bharat等人在2005,6,16出版的US 205/0131762A1之"產生用於目標廣告的使用者資訊"和Carrasco等人在2005,1,20出版的US 2005/0015366 A1之"使用解釋叢集去除搜尋片語的含糊語意"中所廣泛討論一般。"jaguar(美洲豹)"一詞可以指車子、動物、足球隊、或作業系統。即使詞語未含糊不清,不同使用者仍可能偏好存取不同資訊。例如,青少年旅客、商業旅客、和豪華旅客可能使用類似搜尋詞語尋找不同的旅行安排和住宿。
無論是響應搜尋或通常是饋送的資訊,轉回最多相關結果較理想。越來越多在網站上出版的文件(和越來越多在專用伺服器上可存取的文件)需要發展另一或改良的技術以快速轉回響應使用者詢問的相關結果。實際上,為關鍵字是"cheap travel(廉價旅行)"的特定使用者找到50或100個最相關網站並且為使用者有效率地概述它們。此另外引起發展依據使用者興趣個人化轉回的資訊之需求,無論是內容、贊助的內容、或廣告。
高階搜尋引擎可包括用以監視終端使用者的瀏覽活動之用戶端組件、用以儲存和處理從用戶端組件接收的資料之遠端伺服器(可包含一或多個電腦)、及處理網頁和供應搜尋結果給終端使用者之模組。例如,高階搜尋引擎響應與一或多個關鍵字有關之終端使用者的資訊搜尋請求,可為證明相關的關鍵字收集網頁、擷取終端使用者請求的網頁、產生網頁的片段或抽象符號、淘汰重複網頁、排列網頁的重要性、及提供相關網頁或鏈結給網頁。
參照圖式進行下面的詳細說明。說明較佳實施例係用於圖解而非限制申請專利範圍的範疇。精於本技藝之人士將可知道下文說明中的各種同等變化。然而,精於本技藝之人士將明白沒有其中一或一些特定細節仍可實施所說明的實施例。在其他例子中,將不圖示或說明眾所皆知的細節以免混淆實施例的觀點。
作為電腦相關組件,應明白可在硬體、軟體、或硬體和軟體的組合(如、韌體)中實施本文所揭示的組件。軟體組件可以是儲存在諸如記憶體、大量儲存體裝置、或可移式儲存裝置等電腦可讀儲存媒體中之電腦可讀程式碼的形式。例如,電腦可讀媒體可包含用以執行特定組件的功能之電腦可讀程式碼。同樣地,電腦記憶體可被配置成包括之後可由處理器執行的一或多個組件。組件可分開實施於多個模組中或一起實施在單一模組中。
下文所說明的實施例和實施例的觀點可用於解決各種技術問題。其中一問題應用於大型網路:如何監視和有效聚集使用者、搜尋引擎、和存取的文件之中的通訊圖型。在一解決方案中,使用者正在所費不貲的個人電腦上漫遊網際網路;搜尋引擎包括Baidu,Google,Yahoo!,及MSN;文件是張貼在全球網站上的網頁。在另一問題中,雇員利用企業搜尋引擎使用企業內部網路以找出工作群組伺服器上所發出的參考文件。提出這些問題可包含最好是不干擾使用者常式之下在行為觀察模組能夠監視使用中的通訊頻道和報告觀察給伺服器之處定位該模組。在一實施例中,行為觀察模組可執行在使用者個人電腦上(諸如桌上型、膝上型或手提電腦或媒體中央裝置等)。模組可在通訊發生時觀察通訊和使用者機器的狀態。例如,使用者跟隨什麼搜尋語詞和結果到特定網站?模組藉由過濾報告和明確地編碼活動可達成分配處理並且大幅減少聚集通訊行為所需的資源。當資源可取得或當使用者瀏覽到結合的網域時,可報告觀察給伺服器。可傳輸觀察cookie到伺服器作為一般上載cookie到所存取的網域之一部分。伺服器可聚集通訊的報告圖型。其中一技術結果是從定位於各大型網路的通訊監視器接收報告並且聚集圖型,包括當通訊發生時個別電腦的狀態。依次,聚集的通訊圖型可用於預期有詢問或接觸時為檢索或公布預先組織資訊。
一相關技術問題係如何依據連接到網路的特定終端機之目前和近來狀態組織過多的電子報告,以增加呈現給使用者的第一筆報告之適當性。這些過多的電子報告可能來自遍及世界的網站,諸如"jaguar(美洲豹)"的網站等。或者,他們可能是儲存在工作群組伺服器上的文件。在沒有重複壓下"下一頁"等就顯示在使用者螢幕上會數量太多,以此觀點來看,電子報告過多。終端機的目前和近來狀態(與特定使用者有關的較佳)可包括在遞送搜尋詢問之前的最近24小時(或其他週期)內所參觀的網站。或者,可包括從工作群組伺服器檢索的文件歷史。每一種活動類型可被預先處理或明確地分類。報告終端機狀態的週期可置放於詢問和請求依據目前和近來的終端機狀態選擇和過濾資訊之個人化電子日誌之前。技術方法又包含在使用者電腦上執行的行為看守模組。在此實施例中,模組概述終端機狀態’、公布概述給電子記錄(如、cookie)、和傳遞該記錄給搜尋引擎或其他使用者接觸的電腦網站。報告明確的狀態或活動概述可分散處理和減少需要伺服器為基礎的資源。搜尋引擎例如使用資訊以決定什麼"jaguar"是相關的?搜尋"jaguar"之與汽車類型有高度相關性的使用者將得到Jaguar汽車相關鏈結,而沒有相關類型的人將得到汽車、動物等混合的鏈結。可更進一步發展類型輪廓以分類使用者興趣。與單身X世代20來歲的人比較,從所存取的內容較容易辨識是住在郊區沒有經驗的父母並且分配到家用配件或車子的不同類型。諸如結婚、家庭購物、當父母等生活改變事件也可被辨識。如"jaguar"一例,就"旅行義大利"詢問而言,搜尋引擎可決定使用者有興趣的旅行型態並且組織過多的電子記錄。技術結果依據終端機的近來活動或狀態之電子報告響應詢問或接觸,從過多的電子記錄選擇一組與終端機的目前和近來狀態最有關聯之特別記錄。
全網路行為目標與網站側行為目標明顯不同。實施網站側行為目標,一群聯合網站試圖識別商業行為。這些網站典型上為廣告服務,諸如入口網站和新聞網站等訊息顯示在聯合網站上,以響應被認定從參觀到聯合網站之行為。網站側行為目標的結果優於非行為目標活動,但是有賴於從少部分的使用者行為得到之眼光,如圖12所示並且說明如下。與網站側相反的全網路行為目標可識別遍及所有網站甚至不接受廣告的網站上之商業漫遊行為和相關的隨意非商業漫遊行為。這是相當重要的,因為90%商業網路活動發生在不顯示廣告的網站或網頁上。因此,從網頁角度評估,入口網站見到小於10%的使用者總商業活動。非入口網站出版人見到小於3%他們的使用者總商業活動。行為看守模組可簡化與網站操作者的關係並且允許訊息顯示在較多出版人的網路上(與參與網站側行為目標比較)。全網路行為目標產生比網站側行為目標較好的結果。
現在參考圖1,圖示有可使用在各種實施例之範例性電腦的概要圖。依據其配置,可使用圖1例子所示的電腦當作用戶端電腦、伺服器電腦、或其他資料處理裝置。圖1之電腦可具有較多或較少的組件以符合特別應用的需求。如圖1所示,電腦可包括處理器101、諸如來自Intel公司、高階Micro裝置、或IBM等。電腦可具有耦合其各種組件的一或多個匯流排103。電腦可包括一或多個輸入裝置102(如、鍵盤、滑鼠)、電腦可讀儲存媒體(CRSM)105、(如、軟式磁碟片、CD-ROM)、CRSM(電腦可讀儲存媒體)閱讀機104(如、軟式磁碟機、CD-ROM驅動機)、顯示監視器109(如、陰極射線管、平版顯示器)、用以耦合到網路之通訊介面106(如、網路配接器、數據機)、一或多個資料儲存裝置107(如、硬碟機、光碟機、FLASH記憶體)、及主要記憶體108(如、RAM)。軟體實施例可被儲存在轉交到資料儲存裝置107或主要記憶體108之電腦可讀儲存媒體105。可由處理器101執行主要記憶體108中的軟體實施例。在圖1之例子中,主要記憶體108被圖示成具有行為看守和訊息運送程式120(下文另外詳述)。行為看守和訊息運送程式120及主要記憶體108中的其他程式例如可經由通訊介面106從電腦可讀儲存媒體105、資料儲存裝置107、或網際網路上載入。可由處理器101執行行為看守和訊息運送程式120及主要記憶體108中的其他程式。
圖2圖示此技術可操作的計算環境之概要圖。在圖2的例子中,計算環境包括一或多個網路伺服器電腦160(即160-1,160-2,…)、一或多個用戶端電腦110、一或多個訊息伺服器電腦140、和未特別圖示的其他電腦。在圖2的例子中,用戶端電腦110在網際網路上與伺服器電腦(如、網路伺服器電腦或訊息伺服器電腦)通訊。就其本身而論,箭頭201表示此例的網際網路連接。為簡要明白,不圖示諸如閘道器、路由器、橋接器、網際網路服務提供者網路、公用交換電話網路、代理伺服器、防火牆、和其他網路組件等中間節點。
用戶端電腦110典型上是諸如操作Microsoft Windows TM作業系統者等個人電腦,但不一定是。消費者可使用適當配備的用戶端電腦110登上網際網路並且存取耦合其上之電腦。例如,用戶端電腦110可用於從網路伺服器電腦160存取網頁。
網頁伺服器電腦160可以是主機登入服務網站的伺服器電腦,包含被設計成吸引漫遊於網際網路上的消費者之網頁。網頁伺服器電腦160可包括支援廣告、可下載的電腦程式、線上購買可買得到的產品等的網頁。另外,網站可以是一或多個伺服器電腦。
訊息伺服器電腦140可包括網頁伺服器電腦160的功能。在一實施例中,訊息伺服器電腦140另外包括資料庫171。資料庫171可以是市面上買得到的資料庫,諸如可從Oracle公司購買者等資料庫171可儲存從操作於用戶端電腦110之行為看守和訊息運送程式120接收的用戶端資料。用戶端資料可從用戶端電腦110傳輸到資料封包121中的訊息伺服器電腦140。用戶端資料可包括藉由監測消費者線上活動由行為看守和訊息運送程式120所獲得的領航和行為資料。在圖2的例子中,為了圖示清楚,訊息伺服器電腦140被圖示成與一用戶端電腦110通訊。事實上,訊息伺服器電腦140接收含來自複數用戶端電腦110的用戶端資料之資料封包121,其每一個都具有行為看守和訊息運送程式120。訊息伺服器電腦140又包括用以支援、更新、及維修用戶端電腦110上的軟體組件之可下載電腦程式和檔案。訊息伺服器電腦140可包括或與搜尋引擎650連接。
網頁伺服器電腦160和訊息伺服器電腦140典型上是諸如可從Sun Microsystems,Hewlett-Packard,或International Business Machines可購得者等,但不一定是。用戶端電腦110可使用伺服器協定與網頁伺服器電腦160或訊息伺服器電腦140通訊。需注意的是,主從計算是技藝中眾所皆知的,故不再贅述。
如圖2所示,用戶端電腦110可包括網頁瀏覽器112和行為看守和訊息運送程式120。網頁瀏覽器112可以是市面上買得到的網頁瀏覽器或網頁用戶端。在一實施例中,網頁瀏覽器112包含Microsoft Internet Explorer TM網頁瀏覽器。網頁瀏覽器使用戶端電腦上的消費者能夠存取網頁。在圖2的例子中,網頁瀏覽器112被描畫成顯示來自網頁伺服器電腦160的網頁113。諸如網頁113等網頁具有被稱作"URL"(一致性資源定址器)的對應位址。網頁瀏覽器112被指向網頁的URL以接收用戶端電腦110中的那網頁。網頁瀏覽器112例如可藉由在網頁瀏覽器112的位址視窗中輸入URL或藉由點選指向那URL的鏈結以指向URL。
在一實施例中,從訊息伺服器電腦140或網頁伺服器電腦160可下載行為看守和訊息運送程式120。可連同下載另一電腦程式一起下載行為看守和訊息運送程式120到用戶端電腦110。例如,可連同免費提供或折價提供的公用程式181一起下載行為看守和訊息運送程式120到用戶端電腦110。例如,公用程式181可以是錢包或日曆程式。透過行為看守和訊息運送程式120,公用程式181可被提供給消費者以交換運送廣告到那消費者用戶端電腦110的權力。本質上,來自運送給消費者的廣告收入可幫助支付建立和維修公用程式的費用。例如,行為看守和訊息運送程式120又可連同免費或折價存取線上服務一起提供給消費者。
行為看守和訊息運送程式120被儲存和操作在用戶端電腦110中的用戶端程式。行為看守和訊息運送程式120可包含用以顯示廣告在用戶端電腦110和用以監視用戶端電腦110上的消費者線上活動之電腦可讀程式碼。需注意的是,例如監視消費者線上活動的技術,諸如決定消費者在何處領航到用戶端電腦110所接收的網頁URL、消費者參觀的網站之網域名稱、消費者正在網頁上打上什麼字、消費者正提供什麼關鍵字給搜尋引擎、消費者是否點選在鏈結或廣告上、消費者何時啟動滑鼠或鍵盤等通常是技藝中眾所皆知的,故不再贅述。行為看守和訊息運送程式120可藉由來自網頁瀏覽器112的事件通知得知消費者線上活動。
行為看守和訊息運送程式120可記錄用以報告給訊息伺服器電腦140的消費者線上活動。記錄的消費者線上活動又被稱作"用戶端資料",並且使用資料封包121提供給訊息伺服器電腦140。訊息伺服器電腦140可使用用戶端資料提供目標廣告給消費者。訊息伺服器電腦140可包括用以顯示廣告在訊息單元141之廣告或資料。在圖2的例子中,目標廣告被標稱為廣告116並且顯示在展示車輛115。展示車輛115可以是背顯式、突現式、分離式瀏覽器視窗、訂製瀏覽器視窗、或其他顯示廣告在電腦螢幕上的方法。由Scott G.Eagle,David L.Goulden,Anthony G.Martin,and Eugene A.Veteska於2002,5,21發表的共同擁有U.S.申請案號碼10/152,204之"用以顯示訊息在電腦系統之方法和裝置"也揭示使用用戶端程式運送廣告到用戶端電腦的技術,本文併入其全文做為參考。
如下文中將更明白一般,行為看守和訊息運送程式主要用於取得用戶端資料以建立搜尋引擎索引,所以不一定需要顯示展示車輛在用戶端電腦110。也就是說,行為看守和訊息運送程式不一定需要顯示廣告在用戶端電腦110中。就消費者而言是有利的,因為消費者可獲得免費或折價的公用程式181(或其他益處)卻不一定要看見來自公用程式提供者或贊助者的廣告。
圖3概要圖解轉換處理的追蹤。當消費響應呈現給她的廣告而進行線上購物或註冊時所出現的"轉換"。如下文中將更明白一般,實施例可使用轉換當作排列關鍵字鏈結組合的因素。在圖3的例子中,網頁202(即202-1,202-2,…)可連續顯示在網頁瀏覽器112之同一或分開的視窗。每一網頁202包括可以是URL的網頁識別符號2113(即210-1,210-2,…)。如同消費者花在像領航資料之每一網頁上的時間一般,行為看守和訊息運送程式120也記錄消費者所觀看的網頁202之20 URLs。就本揭示的目的而言,消費者所"觀看"的網頁是接收在用戶端電腦中的網頁。在圖的例子中,領航資料627包含日誌登錄117(即117-1,117-2,…)。每一日誌登錄117包括不具名識別用戶端電腦110(或消費者)、網頁識別符號、及表示日誌登錄417何時進行的時間戳記之機器ID。在日誌登錄117之間的時間戳記提供消費者花在觀看指出的網頁之時間估算。可為消費者所觀看的每一網頁202建立日誌登錄117。例如,當消費者點選鏈結501以接收網頁202-2時可建立日誌登錄117-1。在用戶端電腦110中,在消費者在用戶端電腦110接收網頁202-3時可建立日誌登錄117-2等。
在圖3的例子中,網頁202-2又稱作"登陸頁",因為它是由網頁202-1中具有鏈結的廣告所直接指向的網頁。在線上販售產品的網站也可具有"確認頁"202-5。確認頁是提供給消費者以確認剛完成的線上購物之網頁。另一選擇是,確認頁可包含註冊資訊的確認協議書。網站在登陸頁202-2和確認頁202-5之間可具有"中間頁"202-3,202-4等。中間頁可以是線上產品目錄、購物車、和其他網頁類型。流行或夥伴網站的登陸頁和確認頁之網頁識別符號可儲存在訊息伺服器電腦140的資料庫171,可比較登陸頁和確認頁之網頁識別符號和用戶端電腦110的領航資料627以決定從特定網頁進行線上購物的消費者數目。明顯地,消費者進行購物的網站有高度關聯性,因此可視作消費者偏好的網頁。由David L.Goulden and Dominic Bennett於2003,6,17發表的共同擁有U.S.申請案號碼10/464,419之"產生電腦網路中的統計資訊"也揭示監視消費者購物行為的技術,本文併入其全文做為參考。
處理流程
圖4為能夠一起運作以產生個人化贊助和非贊助資訊運送的搜尋引擎之組件的高階方塊圖。如同先前技術所說明一般,行為看守模組目前在U.S.和國外的四千萬個機器上捕捉行為網路領航資訊。視需要將擴展和採用所收集的資訊。此領航行為資訊目前被用於供給全網路GMT廣告車輛(如、突現式及背顯式)動力和供給遍及網路的提供獨到眼光給消費者行為之許多資料豐富的應用動力。行為看守模組具有看見整個搜尋生命週期的能力,從觀察輸入的原有關鍵字到顯示的最後鏈結、到包括閉鎖時間、所觀看的網頁、重複的參觀之張貼點選的度量衡、及張貼點選購物或註冊。藉由聚集使用者行為,可決定類型輪廓和生活改變事件。一段時間過後,可決定使用搜尋引擎和類型涵蓋的程度之使用者熟練度。使用此資訊,可選擇和重新排列搜尋結果,係由請求搜尋的人而非由機器人程式過濾。
資料收集
為在遍及網際網路或企業內部網路各處的選定搜尋引擎上搜尋之使用者使用行為看守模組(120)收集網路使用統計(401)。模組發送回與他們搜尋和在就每一特定關鍵字而言他們的搜尋在每一特定搜尋引擎上如何有效有關的資訊。資訊被捕捉在資料庫,每天或在一些其他同時發生的頻率時下載。可取得的資訊包括使用者看見什麼和他們如何響應。使用者看見的URLs可顯示結果在演算或自然區。用於單一搜尋語詞的適當資訊包括機器id、關鍵字、執行搜尋的搜尋引擎、結果的URLs、演算的URLs、出價的URLs、付清內容物URLs、是否點選URL、觀看的網頁數、閉鎖時間、重複參觀、和諸如類型關聯和搜尋引擎熟練度等使用者度量衡。
來自US使用者的一些統計可帶給生活可分析的資料收集和排列範圍。一百萬最常搜尋的關鍵字目前說明在主要搜尋引擎上執行的剛好一半多的搜尋,53%的搜尋。45,000最常搜尋的關鍵字說明38%。以Zipf分佈表示輸入當作搜尋之關鍵字的分佈。描繪當作兩軸上具有演算刻度的圖上之直線。例如,見2005,8,13在http://www.useit.com/alertbox/20030616.html所存取的警告方塊(2003,6,16),Jacob Nielson的"多樣性是專業網站的動力"。其估計2,000行為看守模組將產生足夠的資料排列10,000最常的搜尋。20,000個較大群行為看守模組將涵蓋45,000最常搜尋的關鍵字。從所觀察的一千五百億網頁觀看過濾,四千萬行為看守模組的基礎可每月捕捉三百億列資料。在所觀察的網頁觀看之中,注意每月八十億商業事件的等級上,包括多於二百五十萬的購物。這些數目和甚至一些偶然類似的統計應激勵閱讀器聚集多種搜尋者的智慧和行為並且由普遍擁立之搜尋引擎的第一結果網頁上之最明顯的網站加以表示。使用聚集的消費者行為之搜尋引擎被置放於適當位置以在響應搜尋請求時評價網頁/文件之權威性和流行性。
圖5-11為能夠從行為看守模組傳達資訊到排列和鏈結跟隨伺服器及到產生個人化結果的搜尋引擎之資料記錄或cookie的例子。圖5為報告點選的URL之cookie或資料記錄的例子。例如在當使用者到達與伺服器之一有聯繫的網站時的cookie中或在當行為看守模組報告活動時的資料記錄中傳達關鍵字501、時間戳記502、和由使用者選擇的一或多個URLs表列503,而與網際網路漫遊行為無關。有關轉換狀態的額外資料、轉回轉換狀態、使用者看見的表列中之排列等可包括在此種cookie或資料記錄中。
圖6為儲存相關的最近商業關鍵字之cookie例子。此可以是來自與URL或點閱有關的關鍵字或搜尋之相關的最近商業關鍵字。跟隨圖6的例子,一個以上的相關最近商業關鍵字可儲存在一或多個cookie中。此cookie的其中一屬性或欄位是餅屑的版本602。另一個欄位是寫入時間604,可從1970到寫入cookie的時間以秒表示。商業旗標606可被用於分類關鍵字類型,例如目前商業興趣的關鍵字和打折的關鍵字之間的類型。關鍵字608可被包括在正文或當作一速記碼。諸如UFT-8等特性組610可被包括以幫助解碼關鍵字608。這在國際化設定中是重要的。
圖7為由被寫到持續性記憶體之行為看守所維持的概要資料之例子。在此例中,類型ID 802適用於特定類型的速記。為諸如一天等目前週期702配置bin。週期可以等長或不同長度。在一實施例中,位元字串實施bin。藉由60位元加用於一類型ID的儲存體加以實施60天的歷史。每一bin對應於特定時間區段。位元旗標表示在特定時間區段是否有與該類型有關的活動。在對應於以任何bin所表示的最短週期之規律時間中,更新該位元字串。資料被移位到較舊的bin,在最近的bin製造空間。有關最近活動的資料被概述成最近的bin,在圖式中標示為零。若bin表示不相等的時間量,則在較短和較長時間bin之間進行特殊的規定,無論是演算法方式或藉由配置額外儲存體。例如,在前一天期間任一小時區段的活動可產生設定位元旗標在整天的時間區段中。只有在當午夜更新發生時午夜的時間區段旗標是"0",則整天時間區段的旗標"0"。這是一小時區段和整天區段之間的邊界之演算法規定的例子。另一選擇是,可為bin配置儲存體以記錄在特定時間區段中參觀的次數。此明顯增加所需的儲存體量,卻不必改變報告行為察覺伺服器132如何反應。當有數百種類型並且cookie尺寸的實際限制是2K到4K位元組時,精巧的儲存體較佳。Cookie可被發送到將使用者活動資料存檔的伺服器。使用者活動資料可用於分析廣告或廣告目標的鎖定。如圖8-10所示,可由類型另外概述位元字串。
圖9為可應用到使用者興趣的使用搜尋字、點閱、進入URL目的地、或其他表示的最近者之儲存區圖。在特別儲存區中以會員身份記錄最近的參觀。可利用四位元識別15或16儲存區之一。在圖式中,儲存區的長度相等。諸如由圖6所圖示者等單一、最近參觀記錄或保留在記憶體中的登錄可被用於分配類型給特定的儲存區。
圖19圖解由點閱率所量測之響應標題廣告的近來行為之重要性。在廣告類型中最後一小時內有行為之使用者響應橫幅廣告的可能性是在該類型中最後七天以上沒有行為之使用者的30倍。最後一小時、兩小時、或三小時中的行為已被注意到對橫幅廣告產生很大的響應。甚至在最後七天內的行為與使用者興趣有密切的關係。最好是,近來儲存區尺寸的選擇反映圖式所圖解之近來行為的觀察力。
圖10圖解可應用於參觀頻率之儲存區。當利用天組織圖7的位元字串時,類型中的活動可被分配到不同參觀頻率的儲存區,諸如使用者指示興趣的最後60天之外的0,1,2,,4或5,到10,11到30,或31到60天等。使用此分類技術和概述位元字串中的位元集數目。
記住近來和頻率的分類碼,回到圖8。單一cookie可為許多類型ID’s 802記錄資料。就每一類型ID而言,可記錄三或更多使用者興趣的度量衡。可記錄一或多個近來類型804。如上述,近來的記錄可應用到遞送到搜尋引擎的關鍵字或到其他使用者行為種類。一或多個頻率類型806可被記錄並且應用到所遞送的關鍵字或其他使用者行為種類。可以近來、頻率或該二者分開分類橫幅點選808。資料欄中的註解810是解釋表格中的資料之編輯註解並且不是資料的一部分。類型ID 98409經歷大量並且近來的使用者興趣。類型ID 65625經歷上一個月大量的使用者興趣。類型ID 68530經歷少量近來的使用者興趣。類型147374經歷上一個月少量的活動,也可能是頻率806之下的非零值反映的。
最好是,行為看守模組120分類圖8中的類型歷史資訊,使得首先列出最重要的類型。另一選擇是,系統讓類型分類到報告行為響應伺服器。如圖11所示,類型ID 1102可與類型名稱1104和年收入優先1106二者結合。對利用年收入優先1106分類類型歷史資訊是有用的,尤其是只有一部分用戶端使用者行為資料傳輸到報告行為響應伺服器。
在商業和非商業關鍵字搜尋之間可以或不可以區分有關網頁使用轉回的統計。在載入到關鍵字檢查違反諸如Overture所出價的語詞等商業語詞的永遠改變表列之資料庫時進行此區別。若關鍵字被決定是商業的,則被分配一個關鍵字id,可與Overture關鍵字id表列相容。若關鍵字未被視作商業的,則在資料載入處理中分配另一個id。
這兩類型資料(商業和非商業)被載入到資料倉庫中分開的區域。在新搜尋引擎載入操作時,從商業和非商業表格二者析取關鍵字資料。結果被連接及從母表分配特有的關鍵字ids。有時在商業和非商業內文二者中可發現關鍵字。例如,若關鍵字的商業本質與其是否被出價聯合,則若接收出價的話,則今天不是商業的關鍵字明天可能變成商業的。當同一關鍵字具有由出價處理所產生的關鍵字id和經由載入處理所產生的第二關鍵字id時,此關鍵字的雙重性產生非特有的關鍵字ids。為了淘汰此種關鍵字,最好是為每一關鍵字產生和維持單一特有關鍵字id。當發現新的關鍵字時更新此表列,並且分配現存ids給已在系統中的關鍵字。
可由行為看守模組執行一些預先處理以簡化報告的URLs。在分開處理中打開和清潔URLs。通常由搜尋引擎包裹URLs以使服務的搜尋引擎可在被服務的URLs上追蹤點選。有許多不同URL包裹形式。例如,來自yahoo.com的包裹URL可以是:http://rds.yahoo.com/S=2766679/K=bmw/v=2/SID=w/l=WSl/R-2/SS=100040736/H=1/SHE=0/ - http://www.bmwmotorcycles.com/。未包裹該URL產生http://www.bmwmotorcycles.com
從伺服器觀點,處理開始於接收行為資訊(402)。伺服器使用其接收什麼資訊。從使用者觀點,行為看守模組將報告其觀察和使用者將接收聚集使用者資訊與其他使用者資訊所整理的搜尋結果及/或將接收個人化給使用者近來行為。
在URL級也可出現反複製。完全相同之兩URLs的資訊被聚集成一單一URL。然而,若兩URLs只是些許不同(如、藉由裁減),則保留兩不同版本並且例如如下述使用標題和產生的片段之組合在反複製時進行另一嘗試。
藉由結合搜尋URL點選與出現在預定視窗內之特定轉換事件之演算法可結合轉換資料和特定搜尋。就在機器id、詢問時間、廣告客戶網域等級具有點選之廣告客戶網域(URLs)而言,使用和轉換資料相符合。就在特定廣告客戶網域上具有點選之特定機器而言,若在預定視窗內觀察轉換狀態,則轉換被視作那搜尋點選的屬性。若轉換落在預定視窗外,則不認為屬於該搜尋點選。
就具有所屬的轉換狀態之機器id-廣告客戶網域對而言,後面更進一步的轉換被視作重複的轉換。這些屬性可被一起帶著並且可用於排列演算法(404)。搜尋資料所包括的度量衡包括參觀數目、花費的時間(閉鎖時間)、和所觀看的網頁。
就組合google.com,msn.com,及yahoo.com的U.S.機器之搜尋行為而言,在遍及資源的機器id-廣告商網域等級中網域事件資料與使用者資料(具有轉換度量衡)結合。這些結果放入機器id和廣告客戶網域內的時間序列等級。出現於跟隨搜尋引擎之後的預定時間週期內之網域事件被分派當作在那特別廣告客戶網域上的那搜尋引擎之張貼點選度量衡。若張貼點選度量衡無法分派給特別搜尋點選,則該記錄不與考慮。
幾個網域事件資料元件經過用戶端發送狀態所顯示的不精確。偶而錯誤報告所花費的時間和觀看的網頁二者,而有時準確報告,但是需要強加邏輯式驅動限制。
具有不良或不準確時脈的機器可能錯誤呈現所花費的時間。當機器留在特定網域一段長時間時,可準確地呈現所花費的時間但是需要最高限度。為了限定不相關者和為了維持在網站張貼點選上所花費時間的合理臨界點(403),使用30分鐘的時間限制。也已實施觀看網頁的最高限制並且設定在5。可以其他時間和觀看網頁最高限制加以取代。在行為看守用戶端上或在主機中接收資料之後可實施這些最高限制。此外,可藉由行為看守模組監測使用者活動,使得未活動的延長期間未被計算成閉鎖時間。
當資料被結合和聚集在機器-id,關鍵字,和URL位準時,最後的資料結構可包括:機器-id、關鍵字、keyword_id、URL、URL_ID、網域id(對應於URL的網域)、點選、dwell_per_click、pages_per_click、conversions_per_click、rank_position(來自使用者所觀看的搜尋結果表列)。另外,只有預定相關性的關鍵字(402)才被處理。例如,具有諸如拍實關鍵字等商業性相關性的關鍵字才被處理。
可隨意地去除不相關者(403),以避免評分異常。其中一不相關者例子係搜尋引擎只轉回一次而在轉回時被使用者一時興起的跟隨的鏈結。單一強力樣本點可給予鏈結無可比擬的平均分數。依據單一樣本,重新計分只出現在關鍵字之前的鏈結可能被排列在那關鍵字的上層位置!因此,一隨意去除不相關者的例子係除非他們已跟隨達到預設的次數否則不排列鏈結。例如,若使用者不曾選擇鏈結但跟隨至少10或100次,則維持不排列直到其活動位準達到預定位準或臨界點。
排列演算法
已發展URL排列演算法(404)以為任何指定的關鍵字識別和排列鏈結。如下述,組合所聚集的觀察之許多變數具有度量衡。其中一組合使用URL點選速率和閉鎖時間度量衡(在網域所花費的時間及/或所觀看的網頁數)選擇和排列URLs。
隨意地,可為搜尋結果組中的URL位置正常化使用者響應。位置為搜尋結果產生URL點選資料中的固有偏向,也許是想要的也許不然。佔有較高排列的URLs獲得較多點選。為了說明此偏向,發展正常化演算法以在平等立足點上於分散位置中將點選放在鏈結上。
為每一位置聚集資料並且計算平均點閱率、平均所花費的時間、平均所觀看的網頁。就每一排列位置(1-n)而言,至少有三個位置重要性的平均聚集量測:點閱率、所花費的時間、和所觀看的網頁。這些量測的正常化可被表示成:位置n的所觀看網頁膨脹係數=位置n的閉鎖時間膨脹係數=位置n的所觀看網頁膨脹係數=
此實施例依據觀察的使用者度量衡為任何關鍵字(404)計算和排列重要的URLs。
對應於個別機器百分比表決,此實施例可依據時間共用度量衡重新排列結果。演算法將使用者網路漫遊圖型列入考量並且有效率地將使用者置於相關鏈結的平等表決上。前提是使用者具有花費在張貼搜尋點選的網站上的特定時間量。總計這些時間以形成花費觀看張貼搜尋點選的網站之個別使用者總時間值。然後,為那特定使用者所做的每一URL點選計算總時間的百分比,產生時間小數表決。
在使用此方法中,通常花費較少時間漫遊網路的使用者具有與花費大量時間漫遊網路的使用者一樣的表決權。此使所有類型的遊戲領域相等。另一選擇是,其他實施例可將組成個別使用者輪廓的其他因素列入考量。被識別當作類型熟手的使用者可具有較高的表決權。例如,在電子類型涉入較深的使用者對點選的鏈結具有比新近到該類型的使用者更高的表決分數。此表決區塊可發生在特別類型中,而非全部類型。
經由聚集和淨化處理將下面詳細的計算例子應用於特定關鍵字-URL對。
較高位置的鏈結獲得較高點選,因此擁有較高點閱率。結果,在佔有這些較高排列的URLs中,使用者也傾向花費較長時間觀看更多網頁。為了說明此偏向,應用正常化處理。
不管關鍵字或URL的組合,為每一位置計算平均點選、平均閉鎖時間、及平均所觀看的網頁。這些數目被圖示如下當作位置平均。也為此關鍵字、URL組合圖示平均小數點選、閉鎖時間、及所觀看的網頁。這些平均小數對應於到每一關鍵字、URL、位置群組的所有機器所衍生之每一度量衡的百分比。
為每一位置計算膨脹係數並且應用於適當觀察的度量衡,為位置正常化他們。正常化等式:位置n的膨脹係數=
以那特定位置所觀察的適當膨脹係數分解下位置中的點選、閉鎖時間、及所觀看的網頁。在下面的例子中,位置7的平均小數閉鎖時間預先正常化是.32。在應用膨脹係數之後,平均小數閉鎖時間是.53。現在此數目是正常化閉鎖時間。
為每一位置中的每一度量衡計算加權平均,並且為及所有加權平均小數量測和點選的所有位置計算總和;點選、時間、和所觀看的網頁。
一段時間過後,利用來自行為看守模組的新網路使用報告將調整特定關鍵字的URLs的位置。這星期位置1的URL可能下一星期在位置7。因此,位置的調整是一大掃除和調整處理。
最後結果是任意位置中的關鍵字01、URL 101之正常化總和的加權平均。為v17.1演算法所需的每一度量衡計算每一關鍵字、URL組合的單一分數。現在為位置和為多個排列出現正常化這些度量衡。
得分的排列可依據使用者花在觀看該網域上的網頁之時間。從行為看守模組所接收的資訊可限制分派給任何觀看期的最大時間量或其可追蹤使用者行為,諸如程式、滑鼠點選或滑鼠移動之間的視窗領航等,並且當計算閉鎖時間時不理會不活動的週期。
排列可忽視使用者所選擇小於預定次數的鏈結,該預定次數可被預定成固定次數或關鍵字或類型的流量功能。忽略不相關者鏈結(403)可避免指定高排列給搜尋引擎很少呈現並且只跟隨一次或兩次的鏈結。
評分的排列又可依據跟隨鏈結之後的點閱率、閉鎖時間、及所觀看的網頁或文件數目之組合。組合這些因素,在某些例子中,其中一因素將主導:所有或多於2/3的排列加權只分配給點閱率、閉鎖時間、及所觀看的網頁或文件的其中之一。另外,可平均加權,加上或減少10%,或這些因素可被分配大約2-1-1的加權比例,加上或減少10%,使得其中一因素得到大約組合加權的一半。
可用於排列的另一因素是轉回參觀。若使用者在離開網域之後的預定時間內或預定領航事件後轉回到網域,則使用者轉回到網站可分配重要性。在思考其他網站之後轉回到網站可反映喜愛的印象。
從瀏覽器轉變到買方或註冊行距可被視作特別值得當作一因素。此外,轉換可包括在網域中購物和註冊。在某些例子中,諸如車子或家庭購物等,註冊可以是更實際的量測,因為該購物在網站中是不實際或不常的。轉回轉換也可被列入考量。
可由搜尋引擎和排列得分分開分析結果。然後,分開排列得分可併入總排列。
統計或其他分析可應用於類型或關鍵字內以決定哪一排列因素組合最吸引使用者反映搜尋跟隨鏈結。可預料排列資訊將以不同方式被用於關鍵字的類型之中。在汽車類型中所花費的時間是重要的。轉換將是更為重要的音樂下載類型。
隨意地,可應用點選區段頻帶。這些頻帶指定優先權給具有高點選數的URLs。使用這些頻帶可提高選定演算法上的最後鏈結。
可依據特別URL所接收的總點選識別區段頻帶。例如:Tier1:具有100+點選的URLs Tier2:具有50和99之間的點選之URLs Tier3:具有10和49之間的點選之URLs Tier4:具有少於10點選之URLs
特定關鍵字的URLs首先被放入適當的區段頻帶。一旦識別該頻帶,則利用排列得分以下降等級設定這些URLs。
可為資料收集選擇諸如最重要的15鏈結等預定鏈結數目(405)以讓蜘蛛程式引擎能夠跟隨(406)。
產生三個表格當作來自排列處理的輸出:關鍵字表格(KEYWORDID,KEYWORD)URL表格(DOMAINID,URL_ID,URL)排列表格(keyword,URL,rank)
跟隨鏈結
在其他搜尋引擎中的傳統爬行程式(例如:Yahoo!中的Slurp、Google中的Googlebot、MSN中的MSNBot)爬行整個網路以搜尋相關網頁給用於為指定的關鍵字決定顯示的鏈結排列等級之索引。對照之下,本文所揭示的實施例給予爬行一簡潔的URLs數目,可從行為看守模組所報告的鏈結(401)隨意選取(405)。這些鏈結是預先排列的,因此,此資訊檢索處理不需要決定特定URL到其他連接的相對重要性,而是從URL獲得最有可能的說明資訊。
本實施例採用特別指定的一組URLs並且執行幾個特別的工作:拆除所有HTML標記並且轉回網頁上的前1000K或其他預定數量的正文給檔案。其從正文物件值採用並且儲存映射到統一量空間以使用當作正文簽名或正文指紋。其計算MD5或其他文件的指紋(具有或沒有html標記)。其計算從文件析取的正文內之字元概要量。
可藉由操作在如圖18所示的Linux環境之Java應用程式實施此方法。該應用程式(1811)是一中間人,可允許大量且可按比例排列的串列數同時操作在多個Linux伺服器上。在目前的配置中,每一Linux伺服器(1821,1822)可處理直到10的蜘蛛程式(1831-33,1834-36)。每一蜘蛛程式依序操作200工作者串列(1841-43,1844-46)。在處理容量上,此配置能夠一秒搜尋800鏈結。
可利用下列等式到達為單一中間人工作的總串列:利用都具有j工作者數目(串列)的i蜘蛛程式數目:i #蜘蛛程式的總串列:
雙中間人模型(1821,1822)可利用關鍵字速率分離關鍵字。一般關鍵字通過一粗略且工作量大的排列演算法版本。快速移動的關鍵字(如、新聞、目前事件)則可經由使用較少歷史的精巧且快速的排列演算法版本加以處理。關鍵字速率是關鍵字的流行性如何快速改變的一量測。可藉由比較在最近24小時(day 0)和之前24小時(day-1)搜尋的關鍵字數目選擇最高速率關鍵字。當然,也可以使用不同的時間區段,諸如4或8小時。day0/day1從"1"的比例變化多大是關鍵字速率。若比例小於1,則關鍵字變得較不流行,"舊新聞"。若比例遠大於1,則關鍵字可能與新題材有關。通常,預定數目的高速率關鍵字是在預定間距中被重複索引或當作允許的資源。在一實施例中,最重要的10,000關鍵字是每一天被重複索引的。儘管已說明關鍵字速率或活潑性的其中一度量衡,但是可預期其他的變化。
工作量大的版本處理已排列的關鍵字URL對。經由資料庫上的Oracle表格可取得這些已排列的關鍵字URL對。URL_TABLE包括:DOMAINID,URLID,URL,LENGTH,SIGNATURE_H,SIGNATURE_T,SPIDER_DATE及HOST。
在跟隨鏈結之前從參考資料庫寫入DOMAINID,URLID,及URL欄位。在特定URL的鏈結跟隨處理之後,將LENGTH,SIGNATURE_H,SIGNATURE_T,SPIDER_DATE及HOST寫回資料庫。
中間人使用Java資料庫連接(JDBC)連接到Oracle資料庫。中間人從排列處理存取URL_TABLE。中間人請求在SPIDER_DATE是空的URL表格中可取得之網域總數的1/100t h 。由利用網域群聚的中間人析取與這些網域有關的所有URLs。個別蜘蛛程式箱透過一次請求1,000網域的網域URLs之遠端方法調用(RMI)告訴中間人。然後從蜘蛛程式傳遞網域到採用與其網域有關的所有URLs並且以那些URLs操作之工作者。
為了顧及一般接受的爬行或鏈結跟隨慣例以便不陷入同時具有上千個請求的網域,所以傳遞URLs到網域所群聚的工作者。不存取一次具有一個以上的請求之單一網域是一般接受的慣例。鏈結跟隨處理(406)藉由分派與指定網域有關的所有URLs給每一工作者以顧及此一般接受的通則。
鏈結跟隨處理(406)是從指定URL擷取內容和計算統計之堅固且可按比例排列的應用程式。一旦工作者接收網域和其相關的URLs時,其使用HTTP協定存取那URL。若接收一良好響應碼,則鏈結跟隨工作者在那網頁上進行工作。98%的時間,工作者接收200響應碼(狀態OK)。若網頁轉回表示重新導向的HTTP碼(碼301,302,303,及307),則工作者或系統必須採取進一步的行動以便獲得有關那URL的資訊。在放棄之前,工作者將跟隨直到5個來自原有URL的重新導向。一旦工作者到達末端點,則將發生下列工作:從URL取得HTTP轉回碼。若取得良好響應碼:則可以的話識別標題媒介標記;計算整個文件(HTML和正文)的MD5指紋;從網頁剖析HTML;及將正文的前1000k寫回到碟。
一旦內容被剖析並且寫回到碟時,則下一操作者接管。此操作者進行用於文件指紋的幾項計算並且將那些和其他統計寫回到Oracle資料庫。該系統將下列欄位寫回到Oracle:URL_TABLE,DOMAINID,URLID,URL,LENGTH,SIGNATURE_H,SIGNATURE_T,SPINDER_DATE及HOST。
LENGTH是文件正文中的字元總數(前1000k)。此特徵可被用於稍後處理(408)中的反複製URLs。SIGNATURE_H是MD5雜湊碼簽名。SIGNATURE_T是正文(前1000k)的CRC32總和檢查碼。SPINDER_DATE表示存取特別URL的日期和時間。HOST係有關於儲存URL的正文之蜘蛛程式機器。
下列系統可產生設計用以幫助文件反複製之三不同量測(409)。此反複製處理旨在識別在指定關鍵結果組內完全相同或非常類似的文件。在未被分開圖示的前一步驟中,在URL位準中反複製URLs。淘汰諸如出現兩次完全相同URL等容易辨識的複製。系統試圖淘汰未出現指到同一網頁但事實上指到之URLs。在一實施例中,為每一URL採用數學簽名(指紋)並且與指定關鍵字結果組內的其他URLs比較。三個範例性簽名是長度簽名、MD5簽名、和CRC32總和檢查。也可利用其他簽名加以取代。
就長度簽名而言,計算正文文件的字元長度。此量測旨在在反複製處理中幫助指定內文給已被識別是複製的網頁。例如,若兩網站顯示完全相同的MD5和CRC32簽名但是具有非常不同的URLs,則分析該簽名。若長度簽名低,意謂網頁小,則可能這兩URLs例如共用標準警告螢幕,如在進入成人內容網站之前已被發現一般。
MD5簽名典型上是一種查驗資料完整性的方法。MD5演算法採用任意長度的訊息當作輸入並且產生輸入的128位元"指紋"或"訊息摘要"當作輸出。MD5演算法用於數位簽名應用,其中大型檔案必須以安全方式"被壓縮"。系統為整個文件計算MD5簽名,例如將識別比較處理減少到128位元比較。
CRC32總和檢查產生32位元長度的循環冗餘總和檢查多項式。此通常用於驗證所傳輸的資料之完整性。CRC是檔案的"數位指紋",具有CRC32,可將龐大的20 MB(或甚至更大)檔案"熔化"成具有小巧便利的參考,如反映此龐大檔案的完整內容之7b9c42fb(十六進位標記法)單一32位元號碼。系統計算文件的正文之CRC32簽名,將洞察力給予該網頁的正文內容。
另一可計算和使用的簽名是Rabin的指紋演算法,例如,Broeder的成就,可產生精巧的總和檢查。
總和檢查或指紋任一個可應用於整個文件,HTML標記較小被去除的整個文件,快取整推選定的文件,來自文件的標題及片段或一些其他預定的摘錄。可使用大於或小於1000k的文件。
該處理完成操作具有被寫入到Oracle資料庫和蜘蛛程式箱的資料之特定URL。Oracle資料庫接收寫入到URL_TABLE的指紋資訊(長度,MD5,crc32)、蜘蛛程式日期/時間、及主機位置資訊及寫入到KEYWORD表格的的蜘蛛程式日期/時間戳記。蜘蛛程式箱為其跟隨的資料鏈結接收檔案:URL、標題(若從URL原有擷取期間獲得)、及用於產生片段的文件之正文(前1000k)。正文包含媒介說明的元件和文件的本體。
片段產生
片段產生處理產生顯示用的標題和片段(407)。片段處理採用關鍵字片語和URL組合,提供說明那URL的最佳標題,及產生那URL的最佳片段(即摘要、說明),即利用200字元空間略述包含在URL中關於關鍵字的資訊。
關鍵字"somec bicycles"產生下列顯示用的範例性正文:
在此例中,標題是"Upland Sports...Frames"。片段是標題後面的兩行。URL是最下面一行。1標題通常從跟隨鏈結時所檢索的網頁標題產生。大部分網站使用HTML媒介標記為搜尋引擎註解網頁的標題。在所有URLs的97%以上呈現識別標題的標記。
在HTML標記未供應標題的3% URLs中,該處理構成標題。若具有URL可利用的正文,則該處理採用正文中大約前70字元(顧及字邊界)和產生標題。若沒有從URL所產生的正文,則從URL去除網域名稱(在www和.com之間的所有資訊)並且被顯示當作標題。
片段產生是一藝術和科學的組合。該處理產生在數學等式和語言科學之間取得平衡之片段。在一實施例中,片段可包含由橢圓(...)分開的1單一子片段,或直到3子片段。得分演算法決定何時組合的子片段(或不在單一子片段例子時)產生最佳分數。
片段得分演算法是計算文件的正文之各部位之分數的多步驟處理。在四部分中,包括關鍵字表號化、視窗得分、視窗交易、和最後的決定。
因為關鍵字不總是一個字所以應用關鍵字表號化。關鍵字通常是多個字的片語。該處理表號化或挑出片語中的個別字。識別個別字表號典型上包括搜尋諸如間隔、句號、逗號、分號等字的區分者。一旦完成關鍵字片語的表號化,可開始視窗得分常式。
在一視窗得分版本中,在文件正文內計算三不同尺寸的視窗,例如,就長度200字元、100字元、及66字元的子片段而言。就各種顯示格式和使用者偏好而言,50、100、200、500、或1000字元的總片段長度之工作性能最佳。本文的例子是200字元。圖20描畫視窗得分常式如何與文件內(2004)的正文第一字(2003)一起開始。在第一例子中,視窗橫跨200字元。此視窗依據幾個度量衡接收分數。一旦計算該分數,則視窗移動1字元到右邊並且為下一視窗計算另一分數。另一選擇是,視窗可移動一個字到右邊,將視窗開始或視窗結束與字的邊界校準。重複此處理(2004,2005)直到獲得最後視窗的分數。可內建智慧到演算法以去除計算每一完整視窗的分數之必要,但是最好加上額外資訊到前一視窗得分並且減掉移動中喪失的資訊。如下述,又可捕捉標題(2002)。
當完成處理時,可存在有:長度200的i視窗(其中i=文件長度-200)長度100的j視窗(其中j=文件長度-100)長度66的k視窗(其中k=文件長度-66)
視窗得分可依據一或多個度量衡,諸如在視窗內發現的特有表號之數目、在視窗內發現的表號總數目、及/或在視窗內發現的表號之最長字串等。從這些度量衡的組合計算每一視窗的公式並且分配到那視窗。
在具有200字元片段的例子中,選擇具有最高得分的視窗。為兩子片段模型選擇長度100的兩最高得分視窗。為三子片段模型選擇長度66的三最高得分視窗。
為每一模型(1,2,或3子片段)計算最佳得分。當2或3視窗適合於一片段時,可應用最後的演算法。若藉由一視窗讓出字元到另一視窗可增加全球視窗得分,則那活動被視作增益並且被採用。若全球視窗得分並無法因此方式而提高,則無須交易就可使用片段。
來自片段產生的輸出包括5不同得分:單一子片段模型的得分;無交易的兩子片段模型之得分;交易的兩子片段模型之得分;無交易的三子片段模型之得分;及/或交易的三子片段模型之得分。在五不同得分之中,選擇單一最高得分並且那子片段模型被應用於那關鍵字、URL組合。
就樣本關鍵字="red dog run"而言,可跟隨下列步驟:步驟1:將關鍵字表號化成三表號:表號1=red表號2=dog表號3=run
步驟2a:在正文文件內定位表號的例子。
-------red----------dog--------dog--------- -----run-------red----------red------------- -------red-dog-run---------dog----------- ---run----red-------run----run------------
步驟2b:使視窗得分並且識別最高的一個。在此例中,三子片段模型,計算最佳3視窗。
-------red----------dog--------dog--------- [------run------red--]--------red------------- (1) ---[----red-dog-run--]-------dog----------- (2) --run-----[-red-----run---]-run------------ (3)
步驟3:許可交易出現。在此例中,若視窗1能夠讓出包含在其左邊緣內的字元之一些非表號給視窗3,則此使視窗3能夠擴充並且包括最後的表號’run’,增加片段的整個全球得分。
-------red----------dog--------dog--------- ------[run------red--]--------red------------- (1) ---[----red-dog-run--]-------dog----------- (2) ---run-----[-red-----run----run]------------ (3)
在另一實施例中,片段產生處理可包含建立當作相關鏈結的描述符之大約200位元組欄位。片段產生發生張貼蜘蛛程式並且從與選定的URL有關之文件的完整正文或所儲存文件的至少一部分產生。
個人化及排列
在排列演算法內,具有依據使用者的行為輪廓選擇在特定鏈結類型上具有多於其他使用者的表決總數之無特色使用者的能力比在同一鏈結上的新近搜尋者之表決比較,強力搜尋者的使用者(依據他們觀察的搜尋行為)在他們點選的鏈結上具有較多的表決總數。在此方式中,搜尋熟手將有助於產生更多相關排列結果。
同樣地,與特定類型具有高度關聯的使用者具有與那類型沒有關聯的使用者比較,在那類型中具有較高的表決總數。使用行為看守模組,可識別在諸如數位相機、喜好的運動、或汽車等各種類行中有高度關聯的使用者。例如,就點選的鏈結而言,被識別作與數位相機類型具有高度關聯的使用者將在搜尋"Cannon G3"之後比新到該類型的使用者以那同一關鍵字搜尋時具有更多的表決總數。
使用者類型關聯狀態的識別又驅動個別化。在特定類型具有高度關聯程度的使用者將得到與被視作具有較少關聯的使用者不同結果。此個人化結果服務將需要存在諸如在特定機器上可利用的物件等cookie。此生活方式cookie將提供搜尋引擎從使用者類型領航圖型所獲得之使用者的行為輪廓。這些類型特殊領航圖型係從含在又可用於目標廣告的分類結構之資訊獲得。就商業目的而言,從參觀的網站可推論預算的類型或類似預算。到IKEA和Target的參觀者與到Sachs Fifth Avenue或Bloomingdale’s的參觀者可能對服裝具有不同的預算。同樣地,Hyatt Hotels與青年旅館是不同的預算類型。
依據觀察的通訊之個人化比使用者輸入的量身定做更具威力,因為重新搜尋顯示只有百分之8-14的使用者手工個人化他們的內容。個人化與在網域所觀看的網頁有高度的關聯:個人化的使用者已經報告比未個人化的使用者在該網域觀看百分之130多的網頁。
有時不同的行為輪廓可能發揮影響力呈現出不同的搜尋結果。有時,在兩使用者行為輪廓的差異並無助於特定搜尋關鍵字的內文。
某些例子是有幫助的。首先、一語意不清的搜尋語詞例子:與無法識別類型關聯之某些人比較,搜尋"jaguar"之與汽車類型有高度關聯的使用者得到的Jaguar汽車相關鏈結比美洲豹動物相關鏈結多。這些行為輪廓的識別和使用可能使結果偏向,但卻沒有完全取代結果。在上述例子中,汽車類型關聯使用者可得到100%汽車結果,或比流行網站中所發現者更多比例的汽車結果。
接著,子類型識別例子:三使用者搜尋關鍵字rental car(出租汽車)"。三組分開的結果發生,每一個都是針對使用者而個人化的。每一使用者都具有從旅行類型內所觀察之它們過去的領航圖型所獲得之特別行為輪廓。從觀察到的通訊可輕易識別出這些行為者。
使用者1:經常性生意旅客-其出租汽車結果將傾向商業旅行車出租結果,可能更多有關經常出租點等。
使用者2:有預算旅客-其出租汽車結果將傾向有預算的旅客;出租汽車種類結果,特別是在小型汽車等上。
使用者3:豪華旅客-其出租汽車結果將傾向高級豪華旅客、運動車出租、經典車出租等。
圖12比較使用者機器上的行為看守模組給予相關網路漫遊的眼光和伺服器能夠達成的有限觀點。與行為看守模組看見什麼比較,產生這些統計以比較Yahoo!伺服器知道什麼使用者行為。X軸1202識別網站類型。Y軸是相對刻度,具有繪圖成"1"的Yahoo!伺服器觀察。在每一堆中,Yahoo!1203具有1的可見度。行為看守模組具有較高的相對刻度1204並且在類型之間強烈變化。此令人驚訝的差異度強烈區分無機器行為看守模組與甚至具有許多聯合的網站之廣泛使用的搜尋引擎可到達之可見度。
圖13與關鍵字"cars(汽車)"高度關聯的網頁。應用排列演算法,CarsDirect首頁得到100中的97分數。用於計算此得分的因素可包括最初參觀的度量衡、接下來參觀的度量衡、及使用者位準度量衡。反映於關鍵字"cars",觀察使用者響應到遍及搜尋引擎上的特定網站,行為看守模組觀察12%的點閱率。在他們留在該網站之前,跟隨原有鏈結,平均使用者觀看此網站上五網頁。平均使用者花費55秒看著網頁及轉換率是80%,在此處註冊的可能性大於購買。在接下來的情況中,在搜尋或第一次參觀之後的預定時間內,平均回訪者觀看15網頁並且花費300秒在此網站上。回訪者利用15%的轉換率註冊。在跟隨有關此關鍵字的此鏈結之使用者之中,類型關聯高,排列為"熟手"。搜尋引擎使用是"內行",更常表示表示一般使用者勝過電腦熟手。就此類型而言,在U..使用者之中,網站的地理位置是重要的。使用者(如、汽車買者)對U.S.的網站比對海外網站有興趣。
圖14為與"cars(車子)"些微相關的網頁之計數器例子。此文章的標題符合關鍵字,但是點閱率和其他度量衡表示使用者覺得在"cars"搜尋中,此網頁比CarsDirect首頁的關聯性少。所計算的此網頁關聯性得分只有11。
圖15為利用本文所說明的搜尋引擎之實施例將來自Yahoo!,msn Search,及Google的"cars(車子)"之結果並列的圖。使用相關性指數,此實施例產生更多相關的搜尋結果。相關性指數是排列得分,反映使用者對搜尋結果表列中的鏈結之響應。樣本得分是:MSN 598,Google 524及Yahoo!487。此實施例之明顯增加的得分強烈區分機器上行為看守模組和許多使用者的聚集行為之使用與主要搜尋引擎的排列演算法。
圖16為使用來自行為看守模組的結果之使用者區別圖。在此圖式中報告使用者行為的一大樣本,尤其是在服裝類型中購物。順著在類型中瀏覽的量(1601)和對特別網路網域(或對賣主、牌子、或其他類型)的忠誠度(1602)之屬性將使用者分成九格。瀏覽量分成少量、中等、或重量。1/4使用者在重量和中等使用類型中而剩下的一半在少量使用類型中。忠誠度分成忠誠、在資源之間轉換者、或對競爭者忠誠。屬性的3乘上3配置產生九格。在忠誠購物者之中,進行大約一百萬特有觀察。當響應搜尋顯示特別結果時,重量使用者具有較高點閱率,比率是7.90%,中等使用者為5.40%,及少量使用者只有3.00%。在點閱事件之後,重量使用者轉換成購物或註冊的比率為8.00%,中等使用者為7.20%,及少量使用者為6.50%。一點都不稀奇的是,就觀察到的特別網域而言,具有更多轉換者和競爭的忠誠特有觀察。諸如廣告等內容的個人化有賴於使用者適合九格中的哪一個。例如,忠誠且重量的使用者將比中等到少量轉換者得到不同的訊息(a a1經常性廣告傳單程式)。忠誠於競爭者的重量使用者得到可能完全誤導忠誠使用者之試驗性報價。對重量且忠誠使用者的廣告策略即將他們與競爭者隔離。就中等和少量的忠誠使用者而言,策略的目標為提高販售和交叉販售。就重量到中等轉換者而言,目的為增加共有。重量到中等的競爭者忠誠使用者被設定成獲得的目標。可忽略少量轉換者和少量的競爭者忠誠使用者以將廣告資源對準目標。
來自行為看守模組的回訪資料可幫助廣告商量測特別廣告的有效性。格子中的使用者差異可更進一步與選擇廣告和評估有效性結合。
又可報告使用者的交叉瀏覽。藉由隨球動作選擇使用者,例如具有轉換的所有點閱或所有使用者。可藉由使用者參觀競爭者網域(或賣主或牌子)的頻率評估特別網域(或賣主或牌子等)中具有轉換的使用者。
圖17為藉由關鍵字從特定搜尋引擎到特定網域之交通圖。此資訊可用於公司設計的廣告,及當對定位在搜尋引擎結果網頁上的贊助內容之關鍵字出價時也有用。來自行為看守模組的資料可產生印象、點選、點閱率、轉換率、及搜尋引擎的結果網頁之位置。
一些特別實施例
本發明可被實施當作一方法或用於實施該方法的裝置。可從使用者終端或個人電腦或伺服器側上之使用者的觀點檢視同一方法,並且從使用者收集資訊。本發明可以是製造的物體,諸如具有完成幫助電腦的方法之壓印有邏輯的媒體等。
從使用者觀點的裝置實施例可具體實現在操作於使用者電腦上的模組中並且收集行為觀察,及耦合於響應具有對使用者個人化的資訊之行為觀察的伺服器。
儘管參照較佳實施例和上文詳述的例子揭示本發明,但是應明白這些例子只用於圖解說明而非限制。說明的實施例中意涵著電腦幫助處理。因此,以下面方法具體實施本發明:聚集通訊圖型,響應關鍵字搜尋預先處理鏈結,使用聚集的通訊圖型響應關鍵字搜尋以排列響應鏈結,及使用近來和目前領航資訊系統響應關鍵字搜尋以依據使用者特徵解決語意含糊不清及/或個人化響應。諸如裝置等其他實施例包括在終端機上的行為看守模組、處理或響應行為資料或二者的伺服器。其他實施例包括壓印有完成該方法的邏輯之媒體、鴨印有完成該方法的邏輯之資料串流、或完成該方法的電腦可存取服務。可想像精於本技藝之人士很容易產生在本發明的精神和下面申請專利範圍的範疇內之修正和組合。
所揭示的實施例可被實施當作一方法或用於實施該方法的裝置。他們可被實施當作一系統。可從收集資料的伺服器的角度或產生資料的行為看守模組之角度檢視同一方法。本發明可包括諸如包括完成該方法的指令之機器可讀記憶體或包括完成該方法的指令之資料串流等製造的物體。
其中一實施例是響應搜尋請求以選擇性收集可轉回到使用者的網頁之方法。此方法包括從複數使用者電腦上操作的行為看守模組接收有關橫跨一或多個搜尋引擎的使用者搜尋引擎使用之資訊。此資訊包括由到搜尋引擎的特定使用者遞送之關鍵字(包括片語)、由特定使用者從搜尋引擎轉回的結果選擇之鏈結、及當跟隨選定的鏈結時閉鎖時間或由特定使用者觀看之文件的至少其中之一。該方法另外包括使用搜尋引擎使用資訊以選擇相關關鍵字和由使用者選擇對應於相關關鍵字的鏈結。
依據經常遞送的搜尋語詞之想要的覆蓋範圍,在此實施例的複數使用者可超過2000或100000使用者。從行為看守模組接收的資訊可橫跨複數未結合的搜尋引擎,提供無單一搜尋引擎可收集之資料。
此實施例另外可包括就選定的關鍵字而言,依據從搜尋引擎使用資訊和閉鎖時間或所觀看之文件的至少其中之一所計算的使用者存取率排列對應的鏈結。該方法另外包括依據預設的排列應用以限制內容的收集,諸如遵循一特別關鍵字只有最高的10或最高的15鏈結等。
在某些實施例中,在接收之前知道修正搜尋引擎使用資訊以對特定使用者可能不注意的期間之閉鎖時間打折扣。
此實施例另外包括從跟隨選定的鏈結其中之一所到達文件內容選擇片段。此片段選擇可包括將預定長度的視窗應用到文件,重複地移位視窗經過文件。將相關的關鍵字(若是片語的話)分成字。該方法另外包括為視窗中的字重複計算一或多個視窗得分,包括視窗中的字之距離的計數及視窗中的字之字距的量測。利用該視窗得分,選擇複數未重疊視窗位置當作片段。將片段或片段的參考儲存到機器可讀記憶體中。可以許多方法重新定義此方法。重複移位視窗可校準視窗,使得其開始或結束與字邊界相符。當重複移位視窗時,藉由減少從視窗移除的字元之得分並且增加添加到視窗的字元之得分可計算視窗內的得分。
藉由協調片段的長度可重新定義片段產生,大約維持所有片段的組合長度。當協調片段的長度時,重新計算一或多個視窗得分。該方法另外包括使用重新計算的視窗得分選擇特定協調的片段長度,任意合併片段;及將選定的片段或選定片段的參考儲存到機器可讀記憶體中。
從行為看守模組的電腦網路之觀點來看,該方法包括使用複數使用者電腦上操作的複數行為看守模組,行為看守模組收集有關橫跨一或多個搜尋引擎的使用者搜尋引擎使用之資訊。收集的資訊包括由到搜尋引擎的特定使用者遞送之關鍵字(包括片語),由特定使用者從搜尋引擎轉回的結果選擇鏈結,及當跟隨選定的鏈結時閉鎖時間或由特定使用者觀看之文件的至少其中之一。該方法另外包括行為看守模組電子式報告搜尋引擎使用資訊給一或多個未結合伺服器。如上述,依據想要的經常遞送搜尋語詞覆蓋範圍,在此實施例中的複數使用者可超過2000或100000使用者。從行為看守模組接收的資訊可橫跨複數未結合的搜尋引擎,提供無單一搜尋引擎可收集之資料。
行為看守模組在接收之前修正搜尋引擎使用資訊以對特定使用者可能不注意的期間之閉鎖時間打折扣。
行為看守模組實施例另外包括特定使用者利用關鍵字召喚搜尋引擎並且從被組織成反映報告的搜尋引擎資訊之搜尋引擎接收結果。
系統實施例包括至少一聽者模組和與聽者模組通訊之至少一電腦或電腦叢集。聽者模組包括網路介面,該網路介面從在以網路連接的複數使用者電腦上操作之行為看守模組接收有關橫跨一或多個搜尋引擎的使用者搜尋引擎使用之資訊。該資訊至少包括由到搜尋引擎的特定使用者遞送之關鍵字(包括片語)、由特定使用者從搜尋引擎轉回的結果選擇之鏈結、當跟隨選定的鏈結時閉鎖時間或由特定使用者觀看之文件的至少其中之一。與聽者模組通訊之該電腦或電腦叢集操作包括邏輯和資源的一或多個模組,該邏輯和資源被設計成處理搜尋引擎使用資訊和選擇相關關鍵字和由使用者選擇對應於相關關鍵字的鏈結、跟隨選定的鏈結以收集由選定的鏈結所定址之至少一部分文件內容、及結合收集的內容和對應的相關關鍵字。
依據想要的經常遞送搜尋語詞覆蓋範圍,在此實施例中的複數使用者可超過2000或100000使用者。從行為看守模組接收的資訊可橫跨複數未結合的搜尋引擎,提供無單一搜尋引擎可收集之資料。
另一實施例是從響應搜尋請求轉回給使用者之文件的內容選擇片段之方法。片段選擇包括將預定長度的視窗應用到文件,重複地移位視窗經過文件。若相關的關鍵字是片語,則被分成字。該方法另外包括為視窗中的字重複計算一或多個視窗得分,包括視窗中的字之距離的計數及視窗中的字之字距的量測。利用視窗得分,選擇複數未重疊視窗位置當作片段,將選定的片段或選定片段的參考儲存到機器可讀記憶體中。可以許多方法重新定義此方法。重複移位視窗可校準視窗,使得其開始或結束與字邊界相符。當重複移位視窗時,藉由減少從視窗移除的字元之得分並且增加添加到視窗的字元之得分可計算視窗內的得分。
藉由協調片段的長度可重新定義片段產生,大約維持所有片段的組合長度。當協調片段的長度時,重新計算一或多個視窗得分。該方法另外包括使用重新計算的視窗得分選擇特定協調的片段長度,任意合併片段;及將選定的片段或選定片段的參考儲存到機器可讀記憶體中。
片段產生可與複製淘汰結合。該方法另外包括依據文件的標題和計算的片段評估更多文件。若從標題和片段計算的標題和片段或指印或總和檢查相符或非常類似,則該文件被宣稱或處理成其複製。
在片段產生中,視窗中的字之距離的計數包括計數有多少關鍵字中的字出現在視窗中並且這些字出現在視窗多少次。
另一實施例是排列之方法,包括從在複數使用者電腦上操作的行為看守模組接收有關橫跨一或多個搜尋引擎的使用者搜尋引擎使用之資訊,接收的資訊至少包括由到搜尋引擎的特定使用者遞送之關鍵字(包括片語)、由特定使用者從搜尋引擎轉回的結果選擇之鏈結、當跟隨選定的鏈結時閉鎖時間或由特定使用者觀看之文件的至少其中之一。該方法另外包括使用(使用者存取率)和((閉鎖時間)或(觀看的文件)的至少其中之一)二者從搜尋引擎使用資訊排列對應於特定關鍵字之鏈結。然後,在機器可讀記憶體中儲存排列,響應利用特定關鍵字所召喚的搜尋時用得到。
可應用使用者存取率、閉鎖時間、和所觀看的網頁數目之各種加權。應用加權的其中一資料觀點是在接收之前知道修正閉鎖時間以對特定使用者可能不注意的期間打折扣。另一觀點是可過濾該資料以去除搜尋引擎使用的邊遠觀察、淘汰由特定使用者選擇但是少於預定次數之鏈結。同樣地,在接收資料之後,對超過預定時間長度之閉鎖時間打折扣。
將使用者存取率、閉鎖時間、和所觀看的網頁數目列入考慮,其中一變化具有支配其他兩個因素的一因素。支配因素可以是在網域中的點閱權、閉鎖時間、或所觀看的網頁數目。另一變化是加或減10%以分配大約相等的加權給各因素。另一變化是加或減10%以分配大約2-1-1的加權比例,使得三因素的其中之一被指定大約組合加權的一半。
可選擇視作排列預定時間內回訪鏈結之兩其他因素和轉換事件。如上述,轉換事件可以是購物或註冊。轉換和重複轉換可分開給予加權。
就排列而言,來自單一使用者的組合資料可給予反映搜尋所花費的時間量和所跟隨的鏈結數目之所有加權或其中一加權的加權。雖然單一使用者給予正常化加權,但是藉由減少對單一投票的機器人程式行為可緩和行為所造成的結果偏向。
如上述,在此實施例步驟中的排列另外包括將鏈結歸類成頻帶並且在頻帶內排列選定的鏈結。排列步驟又可包括將分開排列由特定搜尋引擎的使用者所選定之鏈結,然後將來自特定搜尋引擎的排列組合成總排列。
另一實施例是解決由使用者遞送到搜尋引擎的關鍵字搜尋語詞之含糊不清之方法。此方法包括從在使用者電腦上操作的行為看守模組接收有關使用者近來領航行為之資訊。領航行為包括存取未全與特定伺服器側行為資料收集網路結合之文件,及另外包括滑鼠點閱、輸入鍵擊、或其他選擇活動的至少其中之一和源自選擇活動的內文之至少一關鍵字。伺服器決定搜尋語詞似乎合理屬於的複數相關類型並且使用近來領航資訊在複數相關類型之中選擇。
行為看守模組操作的其中一觀點係由相關類型和行為接近者分類行為。所存取的文件可以是網頁並且伺服器側行為資料收集網路可以是廣告網路。
從行為看守模組的此觀點看來,此實施例可被實施當作利用在可透過網路存取的文件之中反映使用者近來領航行為之資訊加以補充搜尋請求。此方法包括操作使用者電腦上的行為看守模組,收集有關使用者近來領航行為的資訊。近來領航行為資訊至少包括識別由使用者電子式存取的文件;分類所存取的文件;指出類型中的文件何時被存取。連同到包括搜尋引擎的一或多個伺服器之詢問一起遞送至少近來領航行為資訊的概述。使用者從搜尋引擎接收偏向到對應於遞送的近來領航行為資訊之興趣類型的一組結果。另一選擇是,使用者從搜尋引擎接收偏向到對應於遞送的近來領航行為資訊之預算類型的一組結果。尤其是,從近來領航行為可分辨出的任何類型可反映響應詢問所接收的搜尋引擎結果之偏向。
另一實施例是個人化響應使用者遞送到搜尋引擎的關鍵字搜尋語詞之內容的方法。如利用上述使語意清楚的方法一樣,此方法包括從在使用者電腦上操作的行為看守模組接收有關使用者近來的領航行為之資訊。領航行為包括存取未全與特定伺服器側行為資料收集網路結合之文件,及另外包括滑鼠點閱、輸入鍵擊、或其他選擇活動的至少其中之一和源自選擇活動的內文之至少一關鍵字。伺服器決定結果屬於的複數可能預算類型並且使用近來領航資訊在可能預算類型之中選擇。
就使用近來領航行為的實施例而言,領航行為可反映近來領航,包括至少在最後一小時和最後一天內的領航。另一選擇是,可包括在被決定與使用者對資訊響應有關聯之時間週期內的近來領航。使用者領航資訊可被概述成當接收可能預算類型時或接收可能預算類型之後的相關類型。尤其是,從近來領航行為可分辨出的任何類型可反映響應詢問所接收的搜尋引擎結果之偏向。
上述實施例和實施例中的各種觀點可被實施當作包括完成所說明的方法和方法中的觀點之指令的機器可讀記憶體,或包括機器可讀指令的資料串流。而且,裝置可包括具有被設計成實施上述的方法和方法的觀點之邏輯和資源的一或多個伺服器、個人電腦、或其他電腦裝置。
101...處理器
102...輸入裝置
103...匯流排
104...電腦可讀儲存媒體閱讀機
105...電腦可讀儲存媒體
106...通訊介面
107...資料儲存裝置
108...主要記憶體
109...顯示監視器
110...用戶端電腦
112...網頁瀏覽器
113...網頁
115...展示車輛
116...廣告
117-1...日誌登錄
117-2...日誌登錄
117-n...日誌登錄
120...行為看守和訊息運送程式
121...資料封包
140...訊息伺服器電腦
141...訊息單元
160-1...網路伺服器電腦
160-2...網路伺服器電腦
160-n...網路伺服器電腦
171...資料庫
181...公用程式
201...箭頭
202-1...網頁
202-2...登陸頁
202-3...中間頁
202-4...中間頁
202-5...確認頁
210-1...網頁識別符號
210-2...網頁識別符號
210-3...網頁識別符號
210-4...網頁識別符號
210-5...網頁識別符號
501-1...鏈結
501-2...鏈結
501-n...鏈結
501...關鍵字
502...時間戳記
503...點選的一致性資源定址器
602...餅屑版本
604...寫入時間
606...商業旗標
608...關鍵字
610...特性組
627...領航資料
650...搜尋引擎
702...目前週期
802...類型ID
804...近來類型
806...頻率類型
808...橫幅點選
810...註解
1102...類型ID
1104...類型名稱
1106...收入優先
1202...X軸
1203...Yahoo!
1204...相對刻度
1601...類型中瀏覽的量
1602...忠誠度
1811...應用程式
1821...Linux伺服器
1821...雙中間人模型
1822...雙中間人模型
1822...Linux伺服器
1831...蜘蛛程式
1832...蜘蛛程式
1833...蜘蛛程式
1834...蜘蛛程式
1835...蜘蛛程式
1836...蜘蛛程式
1841...工作者串列
1842...工作者串列
1843...工作者串列
1844...工作者串列
1845...工作者串列
1846...工作者串列
圖1為可用於各種實施例的範例性電腦之概要圖。
圖2為可操作此技術之計算環境的概要圖。
圖3為轉換處理的追蹤概要圖。
圖4為能夠一起運作以產生個人化贊助和非贊助資訊運送的搜尋引擎之組件的高階方塊圖。
圖5為報告點選URL之cookie或資料記錄的例子。
圖6為儲存相關的最近商業關鍵字之cookie例子。
圖7為由被寫到持續性記憶體之行為看守所維持的概要資料之例子。
圖8為另外由類型加以概述的位元字串圖。
圖9為可應用到使用者興趣的使用搜尋字、點閱、進入URL目的地、或其他表示的最近者之儲存區圖。
圖10為可被應用到參觀頻率之儲存區。
圖11為類型ID如何與類型名稱和年收入優先權結合之圖。
圖12為比較使用者機器上的行為看守模組給予相關網頁漫遊之眼光和伺服器能夠到達的有限觀點。
圖13為與關鍵字"cars(車子)"高度相關的網頁圖。
圖14為與"cars(車子)"些微相關的網頁之計數器例子。
圖15為利用本文所說明的搜尋引擎之實施例將來自Yahoo!,msn Search,及Google的"cars(車子)"之結果並列的圖。
圖16為使用來自行為看守模組的結果之使用者區別圖。
圖17為藉由關鍵字從特定搜尋引擎到特定網域之交通圖。
圖18為用以跟隨鏈結和檢索內容之架構圖。
圖19為以點閱率量測之響應標題廣告的近來行為之重要性圖。
圖20為視窗評分常式與文件內的正文第一個字如何開始圖。
101...處理裝置
102...輸入裝置
103...匯流排
104...電腦可讀儲存媒體閱讀機
105...電腦可讀儲存媒體
106...通訊介面
107...資料儲存裝置
108...主要記憶體
109...顯示監視器
120...行為看守模組

Claims (23)

  1. 一種解決關鍵字搜尋語詞的含糊不清之方法,該關鍵字搜尋語詞由使用者遞送到搜尋引擎,該方法包括:(A)從在電腦系統上操作的客戶端行為看守模組接收有關在電腦系統上的近來領航行為之近來領航資訊,該近來領航資訊包括行為資料及至少一關鍵字;(B)核對相對於該至少一關鍵字的商業用詞清單;(C)基於至少部分的步驟(B),判斷該至少一關鍵字是否為商業用詞;(D)若於步驟(C)中判斷該至少一關鍵字為商業用詞,則:(d1)指定該至少一關鍵字的一關鍵字ID;(d2)產生一第一資料結構,該第一資料結構包括該關鍵字ID、行為資料以及對應於搜尋位置之定義域之一定義域ID;以及(d3)下載該第一資料結構至一資料庫關聯於商業用詞的一第一部分;(E)若於步驟(C)中判斷該至少一關鍵字非為商業用詞,則:(e1)指定該至少一關鍵字的一其他關鍵字ID;(e2)產生一第二資料結構,該第二資料結構包括該其他關鍵字ID、行為資料以及對應於搜尋位置之定義域之一定義域ID;以及(e3)下載該第二資料結構至一資料庫關聯於非商業用詞的一第二部分;(F)排序關聯於關聯於來自電腦系統的客戶端行為看守模組的結果的該至少一關鍵字的鏈結;(G)優先提供回應相關搜尋準則的較高的商業鏈結排序。
  2. 如申請專利範圍第1項之方法,其中由相關類型和行為接 近者分類近來領航資訊。
  3. 如申請專利範圍第1項之方法,其中文件是網頁和伺服器側行為資料收集網路是廣告網路。
  4. 如申請專利範圍第1項之方法,其中近來領航資訊包括關於存取並非完全關聯於特定伺服端行為資料收集網路的文件的資料。
  5. 如申請專利範圍第1項之方法,其中該關鍵字係由一選擇動作的脈絡所推導出。
  6. 如申請專利範圍第1項之方法,其中更包括:若該關鍵字被判斷為非商業的,指定該至少一關鍵字的另一關鍵字ID。
  7. 如申請專利範圍第1項之方法,其中更包括:定義關聯於一線上交易或登錄以回應廣告的一變換。
  8. 如申請專利範圍第1項之方法,其中更包括:判斷關鍵字搜尋用詞係由使用收集資料的重要搜尋者所遞送;以及排序鏈結時,加權來自客戶端行為看守模組的結果因為該關鍵字搜尋用詞係由使用收集資料的重要搜尋者所遞送。
  9. 如申請專利範圍第1項之方法,其中更包括:判斷關鍵字搜尋用詞於一高度包含使用收集資料的特定分類之中遞送;以及排序鏈結關聯於特定類型時,加權來自客戶端行為看守模組的結果因為該關鍵字搜尋用詞於該高度包含使用收集資料的特定分類之中遞送。
  10. 如申請專利範圍第1項之方法,其中客戶端行為看守模組為獨立瀏覽器。
  11. 如申請專利範圍第1項之方法,其中客戶端行為看守模組由網路瀏覽器所分出。
  12. 如申請專利範圍第1項之方法,其中客戶端行為看守模組獨立運作電腦系統的瀏覽程式。
  13. 一種補充搜尋請求之方法,係利用在可透過網路存取的文件之中反映近來領航行為之資訊加以補充,該方法包括:(A)操作一電腦系統上的客戶端行為看守模組,以收集有關近來領航行為的近來領航行為資訊,被收集的該近來領航行為資訊包括:(i)由電子式存取的文件的識別;(ii)所電子存取的文件為不同類型的分類;(iii)不同類型中的文件何時被電子存取的指出;(iv)及足夠識別由一線上交易或登錄的變換以回應廣告的資料;(B)連同到搜尋引擎的一或多個伺服器之包括一關鍵字的詢問一起遞送至少近來領航行為資訊的概述,該概述包括足夠識別資料的變換的識別;及(C)回應步驟(B)中的遞送,從搜尋引擎接收偏向到對應於遞送的近來領航行為資訊之相關類型的一組結果以及排序來自其他電腦系統上的多個客戶端行為看守模組的使用結果,其中一組結果包括回應關聯於變換的關鍵字的詢問的相關搜尋準則的較高的商業鏈結排序。
  14. 如申請專利範圍第13項之方法,另外包括行為看守模組過濾所存取的文件和分類何時存取類型的指示。
  15. 如申請專利範圍第13項之方法,其中該關鍵字係由一選擇動作的脈絡所推導出。
  16. 如申請專利範圍第13項之方法,其中結果的清單係基於至少部分,對應於一商業關鍵字與否的關鍵字所產生。
  17. 如申請專利範圍第16項之方法,更包括判斷關鍵字是否對應於該商業關鍵字。
  18. 如申請專利範圍第13項之方法,其中客戶端行為看守模組為獨立瀏覽器。
  19. 如申請專利範圍第13項之方法,其中客戶端行為看守模組由網路瀏覽器所分出。
  20. 如申請專利範圍第13項之方法,其中客戶端行為看守模 組獨立運作電腦系統的瀏覽程式。
  21. 一種解決關鍵字搜尋語詞的含糊不清之方法,該關鍵字搜尋語詞由使用者遞送到搜尋引擎,該方法包括:接收來自電腦系統上操作的客戶端行為看守模組的包括一關鍵字以及領航行為資訊的近來領航資訊;關聯近來領航資訊於電腦系統上;核對相對於該關鍵字的商業用詞清單;判斷該關鍵字是否為商業用詞;若該關鍵字為商業用詞,則:指定該關鍵字的一關鍵字ID;產生一第一資料結構,該第一資料結構包括該關鍵字ID、行為資訊以及對應於搜尋位置之定義域之一定義域ID;以及下載該第一資料結構至一資料庫關聯於商業用詞的一第一部分;若該關鍵字非為商業用詞,則:指定該關鍵字的一其他關鍵字ID;產生一第二資料結構,該第二資料結構包括該其他關鍵字ID、行為資料以及對應於搜尋位置之定義域之一定義域ID;以及下載該第二資料結構至一資料庫關聯於非商業用詞的一第二部分;排序關聯於關聯於來自電腦系統的客戶端行為看守模組的結果的該關鍵字的鏈結;優先提供回應相關搜尋準則的較高的商業鏈結排序。
  22. 一種電腦可讀取的儲存媒介,該儲存媒介儲存電腦可執行的指令,以使電腦裝置執行:接收來自電腦系統上操作的客戶端行為看守模組的關於近來領航行為資訊的近來領航資訊,該近來領航資訊包括行為資訊以 及一關鍵字;核對相對於該關鍵字的商業用詞清單;基於至少部分的核對,判斷該關鍵字是否為商業用詞;若該關鍵字為商業用詞,則:指定該關鍵字的一關鍵字ID;產生一第一資料結構,該第一資料結構包括該關鍵字ID、行為資訊以及對應於搜尋位置之定義域之一定義域ID;排序關聯於關聯於來自電腦系統的客戶端行為看守模組的結果的該關鍵字的鏈結;以及優先提供回應相關搜尋準則的較高的商業鏈結排序。
  23. 一種電腦可讀取的儲存媒介,該儲存媒介儲存電腦可執行的指令,以使電腦裝置執行:收集有關近來領航行為的近來領航行為資訊,該近來領航行為資訊包括:由電子式存取的文件的識別;所電子存取的文件為不同類型的分類;不同類型中的文件何時被電子存取的指出;及足夠識別由一線上交易或登錄的變換以回應廣告的資料連同到搜尋引擎的一或多個伺服器之包括一關鍵字的詢問一起遞送至少近來領航行為資訊的概述,該概述包括足夠識別資料的變換的識別;以及回應遞送,從搜尋引擎接收偏向到對應於遞送的近來領航行為資訊之相關類型的一組結果以及排序來自其他電腦系統上的多個客戶端行為看守模組的使用結果,其中一組結果包括回應關聯於變換的關鍵字的詢問的相關搜尋準則的較高的商業鏈結排序。
TW094128426A 2004-08-19 2005-08-19 響應終端使用者資訊請求之方法及裝置 TWI386824B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US60314004P 2004-08-19 2004-08-19
US11/015,583 US8078602B2 (en) 2004-12-17 2004-12-17 Search engine for a computer network
US63768404P 2004-12-20 2004-12-20
US66079805P 2005-03-11 2005-03-11
US66268005P 2005-03-17 2005-03-17

Publications (2)

Publication Number Publication Date
TW200630828A TW200630828A (en) 2006-09-01
TWI386824B true TWI386824B (zh) 2013-02-21

Family

ID=35910770

Family Applications (1)

Application Number Title Priority Date Filing Date
TW094128426A TWI386824B (zh) 2004-08-19 2005-08-19 響應終端使用者資訊請求之方法及裝置

Country Status (10)

Country Link
US (2) US7444358B2 (zh)
EP (1) EP1779276A4 (zh)
JP (1) JP2008511057A (zh)
KR (1) KR20070053282A (zh)
AU (1) AU2005277210A1 (zh)
CA (1) CA2577841A1 (zh)
IL (1) IL181323A0 (zh)
NZ (1) NZ553287A (zh)
TW (1) TWI386824B (zh)
WO (1) WO2006023765A2 (zh)

Families Citing this family (260)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8868448B2 (en) 2000-10-26 2014-10-21 Liveperson, Inc. Systems and methods to facilitate selling of products and services
US9819561B2 (en) 2000-10-26 2017-11-14 Liveperson, Inc. System and methods for facilitating object assignments
US20090228354A1 (en) * 2008-03-05 2009-09-10 Ryan Steelberg Engine, system and method for generation of brand affinity content
US20090112715A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg Engine, system and method for generation of brand affinity content
US20090112692A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg Engine, system and method for generation of brand affinity content
US20090024409A1 (en) * 2002-02-06 2009-01-22 Ryan Steelberg Apparatus, system and method for a brand affinity engine using positive and negative mentions
US20090112698A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg System and method for brand affinity content distribution and optimization
US20090018922A1 (en) * 2002-02-06 2009-01-15 Ryan Steelberg System and method for preemptive brand affinity content distribution
US7383513B2 (en) * 2002-09-25 2008-06-03 Oracle International Corporation Graphical condition builder for facilitating database queries
US7698267B2 (en) * 2004-08-27 2010-04-13 The Regents Of The University Of California Searching digital information and databases
US20070011155A1 (en) * 2004-09-29 2007-01-11 Sarkar Pte. Ltd. System for communication and collaboration
US20060074980A1 (en) * 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information
US8635216B1 (en) * 2004-09-30 2014-01-21 Avaya Inc. Enhancing network information retrieval according to a user search profile
US7856413B2 (en) * 2004-10-14 2010-12-21 International Business Machines Corporation Dynamic search criteria on a search graph
US7631007B2 (en) * 2005-04-12 2009-12-08 Scenera Technologies, Llc System and method for tracking user activity related to network resources using a browser
US7699707B2 (en) * 2005-05-09 2010-04-20 Hotbox Sports Llc Fantasy sports system and method thereof
US7546289B2 (en) * 2005-05-11 2009-06-09 W.W. Grainger, Inc. System and method for providing a response to a search query
US20060294196A1 (en) * 2005-06-27 2006-12-28 Elie Feirouz Method and system for storing a web browser application session cookie from another client application program
JPWO2007029348A1 (ja) 2005-09-06 2009-03-12 コミュニティーエンジン株式会社 データ抽出システム、端末装置、端末装置のプログラム、サーバ装置、及び、サーバ装置のプログラム
US8738732B2 (en) 2005-09-14 2014-05-27 Liveperson, Inc. System and method for performing follow up based on user interactions
US9432468B2 (en) 2005-09-14 2016-08-30 Liveperson, Inc. System and method for design and dynamic generation of a web page
US8688673B2 (en) 2005-09-27 2014-04-01 Sarkar Pte Ltd System for communication and collaboration
US20070088690A1 (en) * 2005-10-13 2007-04-19 Xythos Software, Inc. System and method for performing file searches and ranking results
US8219457B2 (en) 2005-10-28 2012-07-10 Adobe Systems Incorporated Custom user definable keyword bidding system and method
CN100539503C (zh) * 2005-12-31 2009-09-09 华为技术有限公司 信息发布系统、公共媒体信息发布系统和发布方法
US7853602B2 (en) * 2006-01-24 2010-12-14 At&T Intellectual Property, I, L.P. System and method for creating an enhanced enterprise directory
JP4005100B2 (ja) * 2006-01-30 2007-11-07 株式会社カナックス 広告配信システムと装置、方法並びに広告配信プログラム
US8862572B2 (en) * 2006-02-17 2014-10-14 Google Inc. Sharing user distributed search results
US7844603B2 (en) * 2006-02-17 2010-11-30 Google Inc. Sharing user distributed search results
US8122019B2 (en) 2006-02-17 2012-02-21 Google Inc. Sharing user distributed search results
US20070208730A1 (en) * 2006-03-02 2007-09-06 Microsoft Corporation Mining web search user behavior to enhance web search relevance
US8402022B2 (en) * 2006-03-03 2013-03-19 Martin R. Frank Convergence of terms within a collaborative tagging environment
US8112324B2 (en) * 2006-03-03 2012-02-07 Amazon Technologies, Inc. Collaborative structured tagging for item encyclopedias
KR100785352B1 (ko) * 2006-04-21 2007-12-18 엔에이치엔(주) 검색결과리스트 생성 방법 및 검색결과리스트 생성 시스템
US20090177629A1 (en) * 2006-04-21 2009-07-09 Blurum S.R.L. Users Profiling Method
US10042927B2 (en) * 2006-04-24 2018-08-07 Yeildbot Inc. Interest keyword identification
KR100777409B1 (ko) * 2006-06-05 2007-11-19 주식회사 알티캐스트 디지털 양방향 방송에서의 네트워크 서비스 프로바이더애플리케이션 프로비저닝 방법
US20080010338A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method and apparatus for client and server interaction
US20080010388A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method and apparatus for server wiring model
US8560956B2 (en) 2006-07-07 2013-10-15 International Business Machines Corporation Processing model of an application wiki
US20080010386A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method and apparatus for client wiring model
US20080065769A1 (en) * 2006-07-07 2008-03-13 Bryce Allen Curtis Method and apparatus for argument detection for event firing
US8196039B2 (en) 2006-07-07 2012-06-05 International Business Machines Corporation Relevant term extraction and classification for Wiki content
US20080010345A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method and apparatus for data hub objects
US8219900B2 (en) * 2006-07-07 2012-07-10 International Business Machines Corporation Programmatically hiding and displaying Wiki page layout sections
US7954052B2 (en) * 2006-07-07 2011-05-31 International Business Machines Corporation Method for processing a web page for display in a wiki environment
US20080010387A1 (en) * 2006-07-07 2008-01-10 Bryce Allen Curtis Method for defining a Wiki page layout using a Wiki page
US8775930B2 (en) * 2006-07-07 2014-07-08 International Business Machines Corporation Generic frequency weighted visualization component
US7792967B2 (en) * 2006-07-14 2010-09-07 Chacha Search, Inc. Method and system for sharing and accessing resources
US8255383B2 (en) * 2006-07-14 2012-08-28 Chacha Search, Inc Method and system for qualifying keywords in query strings
WO2008011454A2 (en) * 2006-07-18 2008-01-24 Chacha Search, Inc. Anonymous search system using human searchers
US9268873B2 (en) * 2006-08-04 2016-02-23 Yahoo! Inc. Landing page identification, tagging and host matching for a mobile application
US7765203B2 (en) * 2006-09-11 2010-07-27 International Business Machines Corporation Implicit context collection and processing
US20080071797A1 (en) * 2006-09-15 2008-03-20 Thornton Nathaniel L System and method to calculate average link growth on search engines for a keyword
US7860886B2 (en) * 2006-09-29 2010-12-28 A9.Com, Inc. Strategy for providing query results based on analysis of user intent
US20080091548A1 (en) * 2006-09-29 2008-04-17 Kotas Paul A Tag-Driven Concept-Centric Electronic Marketplace
US20080091524A1 (en) * 2006-10-13 2008-04-17 Yahoo! Inc. System and method for advertisement price adjustment utilizing traffic quality data
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US20080154889A1 (en) * 2006-12-22 2008-06-26 Pfeiffer Silvia Video searching engine and methods
US20080168045A1 (en) * 2007-01-10 2008-07-10 Microsoft Corporation Content rank
JP2008181186A (ja) * 2007-01-23 2008-08-07 Yahoo Japan Corp クエリーログを利用したキーワードとサイトの関連度を求める方法
US20080183561A1 (en) * 2007-01-26 2008-07-31 Exelate Media Ltd. Marketplace for interactive advertising targeting events
US20080183691A1 (en) * 2007-01-30 2008-07-31 International Business Machines Corporation Method for a networked knowledge based document retrieval and ranking utilizing extracted document metadata and content
ITBG20070012A1 (it) * 2007-02-13 2008-08-14 Web Lion Sas Metodo di ricerca e selezione di siti web
US7930286B2 (en) * 2007-02-16 2011-04-19 Yahoo! Inc. Federated searches implemented across multiple search engines
US7756867B2 (en) * 2007-02-16 2010-07-13 Yahoo! Inc. Ranking documents
US20080228719A1 (en) * 2007-03-13 2008-09-18 Fatdoor, Inc. People and business search result optimization
US20080235163A1 (en) * 2007-03-22 2008-09-25 Srinivasan Balasubramanian System and method for online duplicate detection and elimination in a web crawler
US9912766B2 (en) * 2007-03-23 2018-03-06 Yahoo Holdings, Inc. System and method for identifying a link and generating a link identifier for the link on a webpage
US7580945B2 (en) * 2007-03-30 2009-08-25 Microsoft Corporation Look-ahead document ranking system
US7958103B1 (en) * 2007-03-30 2011-06-07 Emc Corporation Incorporated web page content
US7676520B2 (en) * 2007-04-12 2010-03-09 Microsoft Corporation Calculating importance of documents factoring historical importance
US8041778B2 (en) * 2007-04-26 2011-10-18 Microsoft Corporation Extended browser data storage
US8015181B2 (en) * 2007-06-19 2011-09-06 Conduit, Ltd System for providing enhanced search results on the internet
JP2009003617A (ja) * 2007-06-20 2009-01-08 Denso Corp 携帯通信装置
US7783630B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Tuning of relevancy ranking for federated search
US7783620B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Relevancy scoring using query structure and data structure for federated search
US8688521B2 (en) * 2007-07-20 2014-04-01 Yahoo! Inc. System and method to facilitate matching of content to advertising information in a network
KR100902036B1 (ko) * 2007-07-20 2009-06-15 주식회사 네티모커뮤니케이션즈 웹문서의 본문 문장내 키워드 광고 시스템 및 그 방법
US8666819B2 (en) 2007-07-20 2014-03-04 Yahoo! Overture System and method to facilitate classification and storage of events in a network
US8200694B1 (en) 2007-07-23 2012-06-12 Google Inc. Identification of implicitly local queries
US9178848B1 (en) * 2007-07-23 2015-11-03 Google Inc. Identifying affiliated domains
US20090132493A1 (en) * 2007-08-10 2009-05-21 Scott Decker Method for retrieving and editing HTML documents
KR100901938B1 (ko) * 2007-08-14 2009-06-10 엔에이치엔비즈니스플랫폼 주식회사 Ctr을 보정하는 방법 및 시스템
US20100114719A1 (en) * 2007-09-07 2010-05-06 Ryan Steelberg Engine, system and method for generation of advertisements with endorsements and associated editorial content
US20100030746A1 (en) * 2008-07-30 2010-02-04 Ryan Steelberg System and method for distributing content for use with entertainment creatives including consumer messaging
US20100131337A1 (en) * 2007-09-07 2010-05-27 Ryan Steelberg System and method for localized valuations of media assets
US20110040648A1 (en) * 2007-09-07 2011-02-17 Ryan Steelberg System and Method for Incorporating Memorabilia in a Brand Affinity Content Distribution
US20100131085A1 (en) * 2007-09-07 2010-05-27 Ryan Steelberg System and method for on-demand delivery of audio content for use with entertainment creatives
US20110047050A1 (en) * 2007-09-07 2011-02-24 Ryan Steelberg Apparatus, System And Method For A Brand Affinity Engine Using Positive And Negative Mentions And Indexing
US20110078003A1 (en) * 2007-09-07 2011-03-31 Ryan Steelberg System and Method for Localized Valuations of Media Assets
US9633505B2 (en) 2007-09-07 2017-04-25 Veritone, Inc. System and method for on-demand delivery of audio content for use with entertainment creatives
US20100131357A1 (en) * 2007-09-07 2010-05-27 Ryan Steelberg System and method for controlling user and content interactions
US7809603B2 (en) * 2007-09-07 2010-10-05 Brand Affinity Technologies, Inc. Advertising request and rules-based content provision engine, system and method
US8452764B2 (en) * 2007-09-07 2013-05-28 Ryan Steelberg Apparatus, system and method for a brand affinity engine using positive and negative mentions and indexing
US20090112717A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg Apparatus, system and method for a brand affinity engine with delivery tracking and statistics
US8751479B2 (en) * 2007-09-07 2014-06-10 Brand Affinity Technologies, Inc. Search and storage engine having variable indexing for information associations
US20100114703A1 (en) * 2007-09-07 2010-05-06 Ryan Steelberg System and method for triggering development and delivery of advertisements
US20100114693A1 (en) * 2007-09-07 2010-05-06 Ryan Steelberg System and method for developing software and web based applications
US8725563B2 (en) * 2007-09-07 2014-05-13 Brand Affinity Technologies, Inc. System and method for searching media assets
US20100274644A1 (en) * 2007-09-07 2010-10-28 Ryan Steelberg Engine, system and method for generation of brand affinity content
US20090112718A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg System and method for distributing content for use with entertainment creatives
US20100318375A1 (en) * 2007-09-07 2010-12-16 Ryan Steelberg System and Method for Localized Valuations of Media Assets
US20090112700A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg System and method for brand affinity content distribution and optimization
US20090112714A1 (en) * 2007-10-31 2009-04-30 Ryan Steelberg Engine, system and method for generation of brand affinity content
US20100082598A1 (en) * 2008-02-07 2010-04-01 Brand Affinity Technologies, Inc. Engine, system and method for generation of brand affinity content
US20100106601A1 (en) * 2007-09-07 2010-04-29 Ryan Steelberg System and method for distributing text content for use in one or more creatives
US20100114701A1 (en) * 2007-09-07 2010-05-06 Brand Affinity Technologies, Inc. System and method for brand affinity content distribution and optimization with charitable organizations
US8285700B2 (en) 2007-09-07 2012-10-09 Brand Affinity Technologies, Inc. Apparatus, system and method for a brand affinity engine using positive and negative mentions and indexing
US9294727B2 (en) 2007-10-31 2016-03-22 Veritone, Inc. System and method for creation and management of advertising inventory using metadata
US20100217664A1 (en) * 2007-09-07 2010-08-26 Ryan Steelberg Engine, system and method for enhancing the value of advertisements
US20110131141A1 (en) * 2008-09-26 2011-06-02 Ryan Steelberg Advertising request and rules-based content provision engine, system and method
US20090138304A1 (en) * 2007-09-11 2009-05-28 Asaf Aharoni Data Mining
US7761471B1 (en) * 2007-10-16 2010-07-20 Jpmorgan Chase Bank, N.A. Document management techniques to account for user-specific patterns in document metadata
US20090299837A1 (en) * 2007-10-31 2009-12-03 Ryan Steelberg System and method for brand affinity content distribution and optimization
US20100076866A1 (en) * 2007-10-31 2010-03-25 Ryan Steelberg Video-related meta data engine system and method
US20110106632A1 (en) * 2007-10-31 2011-05-05 Ryan Steelberg System and method for alternative brand affinity content transaction payments
CN101855631B (zh) * 2007-11-08 2016-06-29 上海惠普有限公司 用于聚焦爬行的导航排名
US8626823B2 (en) * 2007-11-13 2014-01-07 Google Inc. Page ranking system employing user sharing data
WO2009094633A1 (en) 2008-01-25 2009-07-30 Chacha Search, Inc. Method and system for access to restricted resource(s)
US7853587B2 (en) * 2008-01-31 2010-12-14 Microsoft Corporation Generating search result summaries
WO2009099675A1 (en) * 2008-02-07 2009-08-13 Brand Affinity Technologies, Inc. Qualitative and quantitative method for rating a brand using keywords
US10269024B2 (en) * 2008-02-08 2019-04-23 Outbrain Inc. Systems and methods for identifying and measuring trends in consumer content demand within vertically associated websites and related content
US7814074B2 (en) * 2008-03-14 2010-10-12 International Business Machines Corporation Method and system for assuring integrity of deduplicated data
US8694526B2 (en) * 2008-03-18 2014-04-08 Google Inc. Apparatus and method for displaying search results using tabs
US8209331B1 (en) 2008-04-02 2012-06-26 Google Inc. Context sensitive ranking
JP5150341B2 (ja) * 2008-04-10 2013-02-20 株式会社東芝 データ作成装置及び方法
US7567188B1 (en) * 2008-04-10 2009-07-28 International Business Machines Corporation Policy based tiered data deduplication strategy
US8515909B2 (en) * 2008-04-29 2013-08-20 International Business Machines Corporation Enhanced method and system for assuring integrity of deduplicated data
US8095980B2 (en) * 2008-04-30 2012-01-10 International Business Machines Corporation Detecting malicious behavior in data transmission of a de-duplication system
US8229911B2 (en) * 2008-05-13 2012-07-24 Enpulz, Llc Network search engine utilizing client browser activity information
US20090307053A1 (en) * 2008-06-06 2009-12-10 Ryan Steelberg Apparatus, system and method for a brand affinity engine using positive and negative mentions
EP2308019A4 (en) * 2008-06-12 2012-01-11 Ryan Steelberg ADVERTISING PROVIDED WITH A BAR CODE
US8788490B1 (en) 2008-06-27 2014-07-22 Google Inc. Link based locale identification for domains and domain content
US8799200B2 (en) 2008-07-25 2014-08-05 Liveperson, Inc. Method and system for creating a predictive model for targeting webpage to a surfer
US8762313B2 (en) 2008-07-25 2014-06-24 Liveperson, Inc. Method and system for creating a predictive model for targeting web-page to a surfer
US8805844B2 (en) 2008-08-04 2014-08-12 Liveperson, Inc. Expert search
US8392791B2 (en) * 2008-08-08 2013-03-05 George Saliba Unified data protection and data de-duplication in a storage system
US20120166414A1 (en) * 2008-08-11 2012-06-28 Ultra Unilimited Corporation (dba Publish) Systems and methods for relevance scoring
US8368698B2 (en) * 2008-09-24 2013-02-05 Microsoft Corporation Calculating a webpage importance from a web browsing graph
US8103599B2 (en) * 2008-09-25 2012-01-24 Microsoft Corporation Calculating web page importance based on web behavior model
CA2738455A1 (en) * 2008-09-26 2010-04-01 Brand Affinity Technologies, Inc. An advertising request and rules-based content provision engine, system and method
WO2010039860A1 (en) * 2008-09-30 2010-04-08 Brand Affinity Technologies, Inc. System and method for brand affinity content distribution and placement
US20100114680A1 (en) * 2008-10-01 2010-05-06 Ryan Steelberg On-site barcode advertising
CA2739582A1 (en) 2008-10-14 2010-04-22 Brand Affinity Technologies, Inc. Apparatus, system and method for a brand affinity engine using positive and negative mentions and indexing
US9892417B2 (en) 2008-10-29 2018-02-13 Liveperson, Inc. System and method for applying tracing tools for network locations
WO2010056545A1 (en) * 2008-10-29 2010-05-20 Brand Affinity Technologies, Inc. System and method for metricizing assets in a brand affinity content distribution
US20100121702A1 (en) * 2008-11-06 2010-05-13 Ryan Steelberg Search and storage engine having variable indexing for information associations and predictive modeling
CA2742788A1 (en) * 2008-11-06 2010-05-14 Brand Affinity Technologies, Inc. System and method for searching media assets
WO2010056866A1 (en) * 2008-11-14 2010-05-20 Brand Affinity Technologies, Inc. System and method for brand affinity content distribution and optimization
US20100153372A1 (en) * 2008-12-17 2010-06-17 Sea Woo Kim 3d visualization system for web survey
KR101731009B1 (ko) * 2009-01-30 2017-04-27 구글 인코포레이티드 컨버전 크레디팅
US9477763B2 (en) 2009-03-02 2016-10-25 Excalibur IP, LC Personalized search results utilizing previously navigated web sites
US9275067B2 (en) * 2009-03-16 2016-03-01 International Busines Machines Corporation Apparatus and method to sequentially deduplicate data
US8229909B2 (en) * 2009-03-31 2012-07-24 Oracle International Corporation Multi-dimensional algorithm for contextual search
US8412679B1 (en) 2009-03-31 2013-04-02 Intuit Inc. Method and system for identifying obsolete discussion threads in a forum
US8554602B1 (en) 2009-04-16 2013-10-08 Exelate, Inc. System and method for behavioral segment optimization based on data exchange
US20100306224A1 (en) * 2009-06-02 2010-12-02 Yahoo! Inc. Online Measurement of User Satisfaction Using Long Duration Clicks
KR101011726B1 (ko) * 2009-06-09 2011-01-28 성균관대학교산학협력단 스니펫 제공 장치 및 방법
US8719240B2 (en) * 2009-06-19 2014-05-06 International Business Machines Corporation Apparatus and method to sequentially deduplicate groups of files comprising the same file name but different file version numbers
US8979538B2 (en) * 2009-06-26 2015-03-17 Microsoft Technology Licensing, Llc Using game play elements to motivate learning
US20100331075A1 (en) * 2009-06-26 2010-12-30 Microsoft Corporation Using game elements to motivate learning
US9396485B2 (en) * 2009-12-24 2016-07-19 Outbrain Inc. Systems and methods for presenting content
US20110040604A1 (en) * 2009-08-13 2011-02-17 Vertical Acuity, Inc. Systems and Methods for Providing Targeted Content
US8621068B2 (en) * 2009-08-20 2013-12-31 Exelate Media Ltd. System and method for monitoring advertisement assignment
US9081857B1 (en) * 2009-09-21 2015-07-14 A9.Com, Inc. Freshness and seasonality-based content determinations
US7716205B1 (en) * 2009-10-29 2010-05-11 Wowd, Inc. System for user driven ranking of web pages
US9256692B2 (en) * 2009-12-03 2016-02-09 Hewlett Packard Enterprise Development Lp Clickstreams and website classification
US20110197137A1 (en) * 2009-12-24 2011-08-11 Vertical Acuity, Inc. Systems and Methods for Rating Content
US10607235B2 (en) * 2009-12-24 2020-03-31 Outbrain Inc. Systems and methods for curating content
US20110161091A1 (en) * 2009-12-24 2011-06-30 Vertical Acuity, Inc. Systems and Methods for Connecting Entities Through Content
US10713666B2 (en) 2009-12-24 2020-07-14 Outbrain Inc. Systems and methods for curating content
US8693353B2 (en) * 2009-12-28 2014-04-08 Schneider Electric USA, Inc. Intelligent ethernet gateway system and method for optimizing serial communication networks
US10263827B2 (en) * 2009-12-31 2019-04-16 Schneider Electric USA, Inc. Information bridge between manufacturer server and monitoring device on a customer network
US8949980B2 (en) * 2010-01-25 2015-02-03 Exelate Method and system for website data access monitoring
US9855503B2 (en) 2010-03-01 2018-01-02 Rishi Nangia System and method for providing secondary gaming
US20110238670A1 (en) * 2010-03-23 2011-09-29 Microsoft Corporation Crowd-sourcing and contextual reclassification of rated content
US10083248B2 (en) 2010-04-07 2018-09-25 Excalibur Ip, Llc Method and system for topic-based browsing
US9135354B2 (en) * 2010-04-07 2015-09-15 Yahoo! Inc. Method and system for topical browser history
US9996614B2 (en) 2010-04-07 2018-06-12 Excalibur Ip, Llc Method and system for determining relevant text in a web page
US8863000B2 (en) * 2010-04-07 2014-10-14 Yahoo! Inc. Method and system for action suggestion using browser history
JP5941903B2 (ja) 2010-04-07 2016-06-29 ライブパーソン, インコーポレイテッド カスタマイズされたウェブコンテンツおよびアプリケーションを動的にイネーブルにするためのシステムおよび方法
KR20110116562A (ko) * 2010-04-19 2011-10-26 서울대학교산학협력단 대규모 다중 사용자 온라인 롤플레잉 게임에서 봇을 검출하는 방법 및 시스템
US20110270850A1 (en) * 2010-04-30 2011-11-03 Microsoft Corporation Prioritization of Resources based on User Activities
US9697500B2 (en) * 2010-05-04 2017-07-04 Microsoft Technology Licensing, Llc Presentation of information describing user activities with regard to resources
US10540660B1 (en) 2010-05-19 2020-01-21 Adobe Inc. Keyword analysis using social media data
US8655938B1 (en) 2010-05-19 2014-02-18 Adobe Systems Incorporated Social media contributor weight
WO2012009672A1 (en) * 2010-07-16 2012-01-19 Altruik, Inc. System and method for improving webpage indexing and optimization
US8489560B1 (en) * 2010-09-08 2013-07-16 Conductor, Inc. System and method for facilitating the management of keyword/universal resource locator (URL) data
US20120066359A1 (en) * 2010-09-09 2012-03-15 Freeman Erik S Method and system for evaluating link-hosting webpages
US8843817B2 (en) * 2010-09-14 2014-09-23 Yahoo! Inc. System and method for obtaining user information
US8825641B2 (en) * 2010-11-09 2014-09-02 Microsoft Corporation Measuring duplication in search results
US20120130910A1 (en) * 2010-11-19 2012-05-24 Salesforce.Com, Inc. Customer support flow
US9350598B2 (en) 2010-12-14 2016-05-24 Liveperson, Inc. Authentication of service requests using a communications initiation feature
US8918465B2 (en) 2010-12-14 2014-12-23 Liveperson, Inc. Authentication of service requests initiated from a social networking site
CA2819268C (en) 2010-12-20 2017-10-17 The Nielsen Company (Us), Llc Methods and apparatus to determine media impressions using distributed demographic information
US20120240019A1 (en) * 2011-03-17 2012-09-20 Ebay Inc. Method and system for tracking web link usage
US8819009B2 (en) 2011-05-12 2014-08-26 Microsoft Corporation Automatic social graph calculation
US9477574B2 (en) 2011-05-12 2016-10-25 Microsoft Technology Licensing, Llc Collection of intranet activity data
JP5682480B2 (ja) * 2011-06-30 2015-03-11 富士通株式会社 情報処理装置、情報処理方法、および情報処理プログラム
US9367638B2 (en) 2011-07-26 2016-06-14 Microsoft Technology Licensing, Llc Surfacing actions from social data
US9218422B2 (en) 2011-07-26 2015-12-22 Microsoft Technology Licensing, Llc Personalized deeplinks for search results
US8838643B2 (en) 2011-07-26 2014-09-16 Microsoft Corporation Context-aware parameterized action links for search results
US20130086083A1 (en) * 2011-09-30 2013-04-04 Microsoft Corporation Transferring ranking signals from equivalent pages
CN103034633B (zh) 2011-09-30 2016-08-03 国际商业机器公司 生成扩展的搜索结果页面摘要的方法及装置
US20130144847A1 (en) * 2011-12-05 2013-06-06 Google Inc. De-Duplication of Featured Content
US8805941B2 (en) 2012-03-06 2014-08-12 Liveperson, Inc. Occasionally-connected computing interface
US9311417B2 (en) * 2012-03-09 2016-04-12 Oracle International Corporation Personalized navigation shortcuts
KR101413988B1 (ko) * 2012-04-25 2014-07-01 (주)이스트소프트 문서의 이산분리시스템 및 방법
US9563336B2 (en) 2012-04-26 2017-02-07 Liveperson, Inc. Dynamic user interface customization
US9672196B2 (en) 2012-05-15 2017-06-06 Liveperson, Inc. Methods and systems for presenting specialized content using campaign metrics
WO2013180729A1 (en) * 2012-05-31 2013-12-05 Intel Corporation Rendering multiple remote graphics applications
US9705964B2 (en) 2012-05-31 2017-07-11 Intel Corporation Rendering multiple remote graphics applications
CN104641389A (zh) * 2012-07-13 2015-05-20 特鲁菲克特股份有限公司 增强广告服务度量确定
US9591173B2 (en) * 2012-08-17 2017-03-07 Samsung Electrônica da Amazônia Ltda. System and method for digital analysis of authenticity and integrity of documents using portable devices
US9634977B2 (en) 2012-10-01 2017-04-25 Salesforce.Com, Inc. Systems and methods of redactive messaging
US9098511B1 (en) * 2012-10-02 2015-08-04 Google Inc. Watch time based ranking
US9202332B2 (en) 2013-01-14 2015-12-01 Hotbox Sports Llc Online fantasy sports game system and method
US9858526B2 (en) 2013-03-01 2018-01-02 Exelate, Inc. Method and system using association rules to form custom lists of cookies
US9292405B2 (en) 2013-03-08 2016-03-22 Sap Se HANA based multiple scenario simulation enabling automated decision making for complex business processes
US20140278796A1 (en) * 2013-03-14 2014-09-18 Nick Salvatore ARINI Identifying Target Audience for a Product or Service
JP5939580B2 (ja) * 2013-03-27 2016-06-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 匿名化データを名寄せするための名寄せシステム、並びに、その方法及びコンピュータ・プログラム
US9805124B2 (en) * 2013-04-25 2017-10-31 Microsoft Technology Licensing, Llc Automatic generation of a collection of content
US9269049B2 (en) 2013-05-08 2016-02-23 Exelate, Inc. Methods, apparatus, and systems for using a reduced attribute vector of panel data to determine an attribute of a user
CN104252456B (zh) * 2013-06-25 2018-10-09 阿里巴巴集团控股有限公司 一种权重估计方法、装置及系统
US10698930B2 (en) * 2013-08-22 2020-06-30 Sensoriant, Inc. Assignment of application (apps) and relevant services to specific locations, dates and times
US9792357B2 (en) * 2013-09-10 2017-10-17 Adobe Systems Incorporated Method and apparatus for consuming content via snippets
US9767158B1 (en) * 2013-10-09 2017-09-19 Google Inc. Ranking algorithms using unique bucketing identifiers
RU2583739C2 (ru) 2013-10-16 2016-05-10 Общество С Ограниченной Ответственностью "Яндекс" Сервер для определения поисковой выдачи на поисковый запрос и электронное устройство
US9633017B2 (en) * 2013-11-07 2017-04-25 Yahoo! Inc. Dwell-time based generation of a user interest profile
US11386442B2 (en) 2014-03-31 2022-07-12 Liveperson, Inc. Online behavioral predictor
US10579630B2 (en) * 2015-01-14 2020-03-03 Microsoft Technology Licensing, Llc Content creation from extracted content
US10067985B2 (en) * 2015-03-05 2018-09-04 Telenav, Inc. Computing system with crowd-source mechanism and method of operation thereof
US10009308B2 (en) * 2015-04-24 2018-06-26 International Business Machines Corporation Social content features based on user tracking
US10733594B1 (en) * 2015-05-11 2020-08-04 Square, Inc. Data security measures for mobile devices
JP6762963B2 (ja) 2015-06-02 2020-09-30 ライブパーソン, インコーポレイテッド 一貫性重み付けおよびルーティング規則に基づく動的通信ルーティング
CN106487844A (zh) * 2015-08-28 2017-03-08 北京奇虎科技有限公司 一种检测推广url的有效性的方法和系统
AU2016346740B2 (en) * 2015-10-27 2020-07-09 A1 Media Group Co., Ltd. Server for providing internet content and computer-readable recording medium including implemented internet content providing method
US10546028B2 (en) 2015-11-18 2020-01-28 International Business Machines Corporation Method for personalized breaking news feed
CN105468730A (zh) * 2015-11-20 2016-04-06 广州华多网络科技有限公司 一种网页信息提取方法及其设备
US9690828B1 (en) 2015-12-21 2017-06-27 International Business Machines Corporation Collaborative search of databases
US10360622B2 (en) 2016-05-31 2019-07-23 Target Brands, Inc. Method and system for attribution rule controls with page content preview
US11269972B2 (en) 2016-05-31 2022-03-08 Target Brands, Inc. Date-specific webpage versions
US10373167B2 (en) 2016-06-30 2019-08-06 Square, Inc. Logical validation of devices against fraud
US10546302B2 (en) 2016-06-30 2020-01-28 Square, Inc. Logical validation of devices against fraud and tampering
CN116521299A (zh) 2016-08-14 2023-08-01 利维帕尔森有限公司 用于移动应用程序的实时远程控制的方法和装置
US10496993B1 (en) 2017-02-15 2019-12-03 Square, Inc. DNS-based device geolocation
US10552308B1 (en) 2017-06-23 2020-02-04 Square, Inc. Analyzing attributes of memory mappings to identify processes running on a device
US10678831B2 (en) * 2017-08-31 2020-06-09 Ca Technologies, Inc. Page journey determination from fingerprint information in web event journals
JP6440792B2 (ja) * 2017-09-19 2018-12-19 キヤノン株式会社 情報処理装置、その制御方法、プログラム
US10715536B2 (en) 2017-12-29 2020-07-14 Square, Inc. Logical validation of devices against fraud and tampering
US10977670B2 (en) * 2018-01-23 2021-04-13 Mass Minority Inc. Method and system for determining and monitoring brand performance based on paid expenditures
US11138276B2 (en) * 2018-06-27 2021-10-05 At&T Intellectual Property I, L.P. Method and apparatus for generating a search query for a search engine
US10942979B2 (en) * 2018-08-29 2021-03-09 International Business Machines Corporation Collaborative creation of content snippets
US11494762B1 (en) 2018-09-26 2022-11-08 Block, Inc. Device driver for contactless payments
US11507958B1 (en) 2018-09-26 2022-11-22 Block, Inc. Trust-based security for transaction payments
SG11202112609TA (en) * 2019-02-19 2021-12-30 Zirca Digital Solutions Pvt Ltd A platform for providing relevant content on targeted url's and method thereof
US11281733B2 (en) 2019-03-14 2022-03-22 Microsoft Technology Licensing, Llc Selective presentation of rich experiences in search
JP7021290B2 (ja) * 2020-05-19 2022-02-16 ヤフー株式会社 推定装置、推定方法、及び推定プログラム
WO2023057988A1 (en) * 2021-10-08 2023-04-13 Graphite Growth, Inc. Generation and use of content briefs for network content authoring

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW531702B (en) * 2001-04-23 2003-05-11 Tendy Information Corp Collection and management method for network information
US20030195877A1 (en) * 1999-12-08 2003-10-16 Ford James L. Search query processing to provide category-ranked presentation of search results
US6681247B1 (en) * 1999-10-18 2004-01-20 Hrl Laboratories, Llc Collaborator discovery method and system
TW200411436A (en) * 2002-12-30 2004-07-01 Inventec Corp Computer network system providing intelligent on-line data search function and enhancing linking performance of network nodes

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5446919A (en) 1990-02-20 1995-08-29 Wilkins; Jeff K. Communication system and method with demographically or psychographically defined audiences
US5898434A (en) 1991-05-15 1999-04-27 Apple Computer, Inc. User interface system having programmable user interface elements
EP0605945B1 (en) 1992-12-15 1997-12-29 Sun Microsystems, Inc. Method and apparatus for presenting information in a display system using transparent windows
US5956030A (en) 1993-06-11 1999-09-21 Apple Computer, Inc. Computer system with graphical user interface including windows having an identifier within a control region on the display
US5642484A (en) 1994-05-13 1997-06-24 Captive Communications, Inc. Pump top advertisement distribution and display system with performance and sales information feedback
JPH10508964A (ja) 1994-11-08 1998-09-02 バーミア、テクノロジーズ、インコーポレーテッド 料金設定機能を有するオンラインサービス開発ツール
US6026368A (en) 1995-07-17 2000-02-15 24/7 Media, Inc. On-line interactive system and method for providing content and advertising information to a targeted set of viewers
US5823879A (en) 1996-01-19 1998-10-20 Sheldon F. Goldberg Network gaming system
US5794259A (en) 1996-07-25 1998-08-11 Lextron Systems, Inc Apparatus and methods to enhance web browsing on the internet
US5933811A (en) 1996-08-20 1999-08-03 Paul D. Angles System and method for delivering customized advertisements within interactive communication systems
US6253188B1 (en) 1996-09-20 2001-06-26 Thomson Newspapers, Inc. Automated interactive classified ad system for the internet
US5854897A (en) 1996-12-27 1998-12-29 Quantum Systems, Inc. Network communications marketing system
US6285987B1 (en) 1997-01-22 2001-09-04 Engage, Inc. Internet advertising system
US5796952A (en) 1997-03-21 1998-08-18 Dot Com Development, Inc. Method and apparatus for tracking client interaction with a network resource and creating client profiles and resource database
US6144944A (en) 1997-04-24 2000-11-07 Imgis, Inc. Computer system for efficiently selecting and providing information
US5937037A (en) 1998-01-28 1999-08-10 Broadpoint Communications, Inc. Communications system for delivering promotional messages
US6073105A (en) 1997-06-13 2000-06-06 Tele-Publishing, Inc. Interactive personals online network method and apparatus
US6029141A (en) 1997-06-27 2000-02-22 Amazon.Com, Inc. Internet-based customer referral system
US6078916A (en) 1997-08-01 2000-06-20 Culliss; Gary Method for organizing information
JPH1166099A (ja) * 1997-08-15 1999-03-09 Nippon Telegr & Teleph Corp <Ntt> 検索機能付代理情報提供装置および情報検索システム
JP3000972B2 (ja) 1997-08-18 2000-01-17 日本電気株式会社 情報提供装置及びプログラムを記録した機械読み取り可能な記録媒体
US6119098A (en) 1997-10-14 2000-09-12 Patrice D. Guyot System and method for targeting and distributing advertisements over a distributed network
US6222520B1 (en) 1997-12-31 2001-04-24 At&T Corp. Information display for a visual communication device
US6163778A (en) 1998-02-06 2000-12-19 Sun Microsystems, Inc. Probabilistic web link viability marker and web page ratings
US6421675B1 (en) 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
US6133912A (en) 1998-05-04 2000-10-17 Montero; Frank J. Method of delivering information over a communication network
WO1999060504A1 (en) 1998-05-15 1999-11-25 Unicast Communications Corporation A technique for implementing browser-initiated network-distributed advertising and for interstitially displaying an advertisement
JPH11328724A (ja) * 1998-05-18 1999-11-30 Fuji Photo Film Co Ltd 3次元光メモリ
US6141010A (en) 1998-07-17 2000-10-31 B. E. Technology, Llc Computer interface method and apparatus with targeted advertising
US6324569B1 (en) 1998-09-23 2001-11-27 John W. L. Ogilvie Self-removing email verified or designated as such by a message distributor for the convenience of a recipient
US6297819B1 (en) 1998-11-16 2001-10-02 Essential Surfing Gear, Inc. Parallel web sites
US6084628A (en) 1998-12-18 2000-07-04 Telefonaktiebolaget Lm Ericsson (Publ) System and method of providing targeted advertising during video telephone calls
JP2000242392A (ja) 1999-02-12 2000-09-08 Dbm Korea:Kk 動的な情報ディスプレイのためのコンピュータシステム及びその方法
US6321209B1 (en) 1999-02-18 2001-11-20 Wired Solutions, Llc System and method for providing a dynamic advertising content window within a window based content manifestation environment provided in a browser
US6314457B1 (en) 1999-04-21 2001-11-06 Airclic, Inc. Method for managing printed medium activated revenue sharing domain name system schemas
US6269361B1 (en) 1999-05-28 2001-07-31 Goto.Com System and method for influencing a position on a search result list generated by a computer network search engine
US6502076B1 (en) 1999-06-01 2002-12-31 Ncr Corporation System and methods for determining and displaying product promotions
JP2001084256A (ja) * 1999-09-10 2001-03-30 Toshiba Corp データベース処理装置、データベース処理方法、及びデータベース処理プログラムを記録したコンピュータ読み取り可能な記憶媒体
ES2173051T1 (es) 1999-11-11 2002-10-16 United Virtualities Inc Metodo y sistema de publicidad por ordenador.
US6480837B1 (en) * 1999-12-16 2002-11-12 International Business Machines Corporation Method, system, and program for ordering search results using a popularity weighting
US6401075B1 (en) 2000-02-14 2002-06-04 Global Network, Inc. Methods of placing, purchasing and monitoring internet advertising
KR100618997B1 (ko) 2000-04-10 2006-08-31 삼성전자주식회사 홈 페이지 광고 방법
US6718365B1 (en) 2000-04-13 2004-04-06 International Business Machines Corporation Method, system, and program for ordering search results using an importance weighting
US20020010626A1 (en) 2000-05-22 2002-01-24 Eyal Agmoni Internert advertising and information delivery system
US8032418B2 (en) 2000-05-24 2011-10-04 Daniel Ishag Searching apparatus and a method of searching
US7353229B2 (en) 2000-05-26 2008-04-01 Vilcauskas Jr Andrew J Post-session internet advertising system
US20040225716A1 (en) * 2000-05-31 2004-11-11 Ilan Shamir Methods and systems for allowing a group of users to interactively tour a computer network
US6795856B1 (en) * 2000-06-28 2004-09-21 Accountability International, Inc. System and method for monitoring the internet access of a computer
US6529903B2 (en) 2000-07-06 2003-03-04 Google, Inc. Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query
JP2002032401A (ja) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
US7062488B1 (en) 2000-08-30 2006-06-13 Richard Reisman Task/domain segmentation in applying feedback to command control
GB2368935A (en) 2000-11-14 2002-05-15 Itt Mfg Enterprises Inc Updating a searchable database of descriptive information describing information stored at a plurality of addressable logical locations
JP2002259371A (ja) * 2001-03-02 2002-09-13 Nippon Telegr & Teleph Corp <Ntt> 文書要約方法および装置と文書要約プログラムおよび該プログラムを記録した記録媒体
US7194454B2 (en) 2001-03-12 2007-03-20 Lucent Technologies Method for organizing records of database search activity by topical relevance
WO2002079951A2 (en) 2001-03-30 2002-10-10 Fpba Group, Llc Network banner advertisement system and method
US7216290B2 (en) * 2001-04-25 2007-05-08 Amplify, Llc System, method and apparatus for selecting, displaying, managing, tracking and transferring access to content of web pages and other sources
JP2002334104A (ja) * 2001-05-07 2002-11-22 Sony Corp 情報配信システム、情報配信サーバ、クライアント、情報送信方法、受信方法、並びにプログラム
US7149704B2 (en) * 2001-06-29 2006-12-12 Claria Corporation System, method and computer program product for collecting information about a network user
US7219139B2 (en) 2001-06-29 2007-05-15 Claria Corporation System and method for using continuous messaging units in a network architecture
US20030046150A1 (en) 2001-08-01 2003-03-06 Jamie Ader System and method of advertiser-subsidized customizable ordering and delivery of multimedia products
JP2003058572A (ja) * 2001-08-10 2003-02-28 Seiko Epson Corp マルチメディア情報システム及びコンピュータプログラム
JP2003141155A (ja) * 2001-11-06 2003-05-16 Pfu Ltd Webページ検索システムおよびWebページ検索プログラム
JP2003178092A (ja) * 2001-12-10 2003-06-27 Mitsubishi Electric Corp 情報検索システム、情報提供装置及び情報検索方法並びにプログラム
US7565367B2 (en) 2002-01-15 2009-07-21 Iac Search & Media, Inc. Enhanced popularity ranking
JP2003271647A (ja) * 2002-03-18 2003-09-26 Toshiba Corp 閲覧ファイルデータ提供方法、閲覧頻度データ提供方法、そのための中継装置、プログラム及び記録媒体
US9235849B2 (en) 2003-12-31 2016-01-12 Google Inc. Generating user information for use in targeted advertising
US20040024756A1 (en) 2002-08-05 2004-02-05 John Terrell Rickard Search engine for non-textual data
US8086559B2 (en) 2002-09-24 2011-12-27 Google, Inc. Serving content-relevant advertisements with client-side device support
US7225184B2 (en) 2003-07-18 2007-05-29 Overture Services, Inc. Disambiguation of search phrases using interpretation clusters
US20050097088A1 (en) 2003-11-04 2005-05-05 Dominic Bennett Techniques for analyzing the performance of websites
US20050222982A1 (en) 2004-03-31 2005-10-06 Paczkowski Remigiusz K System and method for responding to search requests in a computer network
US20060136524A1 (en) * 2004-12-20 2006-06-22 Claria Corporation Method and device for backing up cookies

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6681247B1 (en) * 1999-10-18 2004-01-20 Hrl Laboratories, Llc Collaborator discovery method and system
US20030195877A1 (en) * 1999-12-08 2003-10-16 Ford James L. Search query processing to provide category-ranked presentation of search results
TW531702B (en) * 2001-04-23 2003-05-11 Tendy Information Corp Collection and management method for network information
TW200411436A (en) * 2002-12-30 2004-07-01 Inventec Corp Computer network system providing intelligent on-line data search function and enhancing linking performance of network nodes

Also Published As

Publication number Publication date
WO2006023765A3 (en) 2006-05-04
JP2008511057A (ja) 2008-04-10
EP1779276A4 (en) 2007-08-29
US20060041562A1 (en) 2006-02-23
NZ553287A (en) 2010-10-29
KR20070053282A (ko) 2007-05-23
CA2577841A1 (en) 2006-03-02
WO2006023765A2 (en) 2006-03-02
TW200630828A (en) 2006-09-01
US7444358B2 (en) 2008-10-28
EP1779276A2 (en) 2007-05-02
IL181323A0 (en) 2007-07-04
US20060041553A1 (en) 2006-02-23
US7836009B2 (en) 2010-11-16
AU2005277210A1 (en) 2006-03-02

Similar Documents

Publication Publication Date Title
TWI386824B (zh) 響應終端使用者資訊請求之方法及裝置
US8255413B2 (en) Method and apparatus for responding to request for information-personalization
US6839680B1 (en) Internet profiling
CN100401292C (zh) 用于使用倾向分析进行搜索查询处理的系统和方法
Ortiz‐Cordova et al. Classifying web search queries to identify high revenue generating customers
US6691106B1 (en) Profile driven instant web portal
US20180322201A1 (en) Interest Keyword Identification
US10269024B2 (en) Systems and methods for identifying and measuring trends in consumer content demand within vertically associated websites and related content
US8768954B2 (en) Relevancy-based domain classification
US7580926B2 (en) Method and apparatus for representing text using search engine, document collection, and hierarchal taxonomy
US8090621B1 (en) Method and system for associating feedback with recommendation rules
US7933884B2 (en) Apparatus and methods for tracking, querying, and visualizing behavior targeting processes
US20060064411A1 (en) Search engine using user intent
US20110252015A1 (en) Qualitative Search Engine Based On Factors Of Consumer Trust Specification
US20130046584A1 (en) Page reporting
US20060129463A1 (en) Method and system for automatic product searching, and use thereof
CN101111837A (zh) 查询自动分类的搜索处理
TW200917070A (en) System and method to facilitate matching of content to advertising information in a network
JP2004504674A (ja) 売り切れ広告インベントリの代わりに別の広告インベントリを選択させるシステム及び方法
Vargiu et al. Improving contextual advertising by adopting collaborative filtering
Ortiz-Cordova et al. External to internal search: Associating searching on search engines with searching on sites
Lai et al. A system architecture for intelligent browsing on the web
Valera et al. A novel approach of mining frequent sequential pattern from customized web log preprocessing
Wen Development of personalized online systems for web search, recommendations, and e-commerce
Castellano et al. Innovations in web personalization