201209744 六、發明說明: 【發明所屬之技術領域】 本申請案涉及電腦技術領域,尤其涉及一種記錄用戶訪 問商品資訊的方法和伺服器’以及一種利用記錄的用戶訪問 商品資訊的結果對商品資訊進行搜尋的方法和伺服器。 【先前技術】 用戶在企業對個人用戶(Business To Customer, B2C )網站或個人用戶對個人用戶(Customer To Customer, C2C )網站上進行商品搜索時,會通過網站提供的介面輸 入待查詢的商品名稱’網站根據用戶輸入的關鍵字進行搜 索後向用戶返回的的結果主要有兩種,一種是與用戶待查 詢的商品相關的導航資訊’另一種是用戶待查詢的商品的 相關資訊。 目前,大量的商品資訊按照商品類目名稱以樹的結構 組織在一起,商品類目樹保存在資料庫相對應的資料表中 ,由人工對商品類目樹中各節點的資料進行輸入與維護’ B2C網站或是C2C網站中的每個商品資訊的展示都屬於商 品類目樹中某一個或多個節點。 用戶向B2C網站或是C2C網站進行商品資訊查詢時 ,如果網站向用戶返回的結果是與用戶待查詢的商品相關 的導航資訊,則用戶可以根據接收到的導航資訊’沿商品 類目樹的路徑自上而下定位至希望查詢的搜尋結果。如果 網站向用戶返回的結果是用戶待查詢的商品的相關資訊’ -5- 201209744 則網站將商品類目樹中與用戶待查詢的商品相關的所有節 點的資訊返回給用戶。 由於目前的電子商務網站的商品數量非常龐大,有些 網站的商品數量能夠達到上億規模,根據用戶輸入的待查 詢的商品名稱搜尋出的商品資訊數量可能非常多,一方面 ,網站伺服器向用戶推送數量巨大的商品資訊會佔用伺服 器的大量系統資源以及網路帶寬,另一方面,用戶獲得這 些資訊後,很難從網站返回的商品中準確、快速地定位出 用戶實際希望查詢的商品。 爲了解決上述問題,目前的常規做法是限定向用戶返 回的商品類目數,通過減少向用戶返回的商品資訊,以減 少向用戶推送商品資訊時對系統伺服器的資源佔用和網路 的資源佔用,並同時減少用戶的查詢時間。通過減少向用 戶返回的商品類目數的做法在一定程度上減少了資源的佔 用和用戶的查詢時間,但同時也可能將與用戶查詢相關度 非常高的商品排除在外,導致向用戶返回的查詢結果不準 確。 綜上所述,目前針對用戶請求查詢商品資訊的搜尋技 術中,存在的對用戶查詢意圖不明確,向用戶返回的搜尋 結果中的資訊與用戶查詢的相關度較低,導致用戶的搜尋 結果較差的問題。 【發明內容】 本申請案的目的在於,提供一種記錄用戶訪問商品資 -6- 201209744 訊的方法和伺服器,用以解決現有技術中存在的對用戶查 詢意圖不明確的問題。 一種記錄用戶訪問商品資訊的方法,該方法包括·· 在用戶每次訪問包含商品資訊的頁面時產生日誌檔, 該曰誌檔中包含訪問頁面中包含的商品資訊的至少一個屬 性資訊; 根據各個日誌檔包含的屬性資訊,分別確定同一商品 類目對應的各個不同屬性資訊、及每種屬性資訊出現的次 數資訊;以及 將確定出的同一商品類目對應的各個不同屬性資訊、 及每種屬性資訊出現的次數資訊作爲一模型資訊組記錄; 其中:記錄的該模型資訊組中任一屬性資訊及其對應 出現的次數資訊作爲該模型資訊組中一個屬性模型資訊存 在。 一種記錄用戶訪問商品資訊的伺服器,該伺服器包括 曰誌產生模組,用於收到用戶對包含商品資訊的頁面 的訪問資訊時,產生日誌檔,該日誌檔中包含訪問頁面中 包含的商品資訊的至少一個屬性資訊; 資訊確定模組,用於根據產生的多個該曰誌檔中包含 的屬性資訊,分別確定同一商品類目對應的各個不同屬性 資訊及每種屬性資訊出現的次數資訊; 記錄模組,用於將確定出的同一商品類目對應的各個 不同屬性資訊以及每種屬性資訊出現的次數資訊作爲一模 201209744 型資訊組記錄;其中:該模型資訊組包括屬性模型資訊, 每一該屬性模型資訊包括一屬性資訊及其對應出現的次數 資訊。 本申請案記錄用戶訪問包含商品資訊的頁面時產生曰 誌檔,並對各個日誌檔中的屬性資訊進行分析,將確定出 的同一商品類目對應的各個不同屬性資訊、及每種屬性資 訊出現的次數資訊作爲一模型資訊組記錄,構建用戶對商 品訪問意圖的模型,明確了設定時間內用戶對商品的訪問 意圖。 本申請案的另一目的在於,提供一種利用記錄的用戶 訪問商品資訊對商品資訊進行搜尋的方法和伺服器,用以 解決現有技術中存在的向用戶返回的搜尋結果與用戶查詢 的相關度較低,導致用戶的搜尋結果較差的問題。 一種對商品資訊進行搜尋的方法,該方法包括: 根據用戶輸入的查詢關鍵字,確定用戶待査詢商品資 訊所屬的商品類目; 在記錄的各個模型資訊組中,查找到確定出的商品類 目對應的模型資訊組; 從査找到的模型資訊組的屬性模型資訊下的屬性資訊 中,確定與該查詢關鍵字匹配的屬性資訊; 從確定出的屬性資訊中,提取出出現次數達到設定門 限値的屬性資訊; 將包含提取出的屬性資訊的商品節點列表返回給用戶 ,其中商品節點列表中包含了與提取出的屬性資訊內容相 -8 - 201209744 同的至少一個包含商品資訊的頁面資訊。 一種對商品資訊進行搜尋的伺服器’該進行搜尋的伺 服器包括: 類目確定模組,用於根據查詢關鍵字,確定待査詢商 品資訊所屬的商品類目; 查找模組,用於在記錄的各個模型資訊組中,查找確 定出的商品類目對應的模型資訊組; 屬性資訊確定模組,用於從查找到的模型資訊組的屬 性模型資訊下的屬性資訊中,確定與該查詢關鍵字匹配的 屬性資訊; 提取模組,用於從確定出的屬性資訊中,提取出現次 數達到設定門限値的屬性資訊; 返回模組,用於將包含提取出的屬性資訊的商品節點 列表作爲搜尋結果返回。 本申請案利用已記錄的用戶對商品資訊的訪問意圖對 用戶的搜尋請求進行分類,查詢出與用戶的查詢意圖相關 性較高的屬性資訊,並將包含查詢出的屬性資訊的商品節 點列表返回給用戶,使用戶得到高相關度的搜尋結果,能 夠快速、準確的定位出希望獲得的商品資訊。在減少用戶 的查詢時間和準確的定位出希望獲得的商品資訊的同時, 有效減少了向用戶推送商品資訊時對系統伺服器的資源佔 用和網路的資源佔用。 【實施方式】 -9- 201209744 本申請案提出對一段時間內用戶對商品資訊的訪問進 行記錄,根據記錄的匯總資料確定用戶對商品資訊的査詢 意圖分佈情況,得到用戶對商品資訊訪問意圖’進而利用 得到的用戶對商品資訊的訪問意圖對用戶的搜尋請求進行 分類,將與用戶搜尋的商品資訊相關性較高的包含商品資 訊頁面鏈結的商品資訊節點列表返回給用戶,讓搜尋結果 更加接近用戶的真實意圖’使得搜尋結果更準確° 下面結合說明書附圖對本申請案的方案進行詳細說明。 實施例一 本申請案實施例一是記錄用戶訪問商品資訊的方法, 如圖1所示,包括以下步驟: 步驟1 0 1 :伺服器在用戶每次訪問包含商品資訊的頁 面時產生日誌檔》 本實施例一中涉及的伺服器是指能夠在用戶每次訪問 頁面時,爲本次訪問事件產生日誌檔的設備。該伺服器可 以是與提供商品資訊頁面的伺服器集成在一起’也可以是 獨立於提供商品資訊頁面的伺服器。 本步驟的具體執行方式如下: 預先在提供商品資訊的頁面中添加一條可以連接到產 生曰誌檔的伺服器(簡稱“日誌伺服器”)的鏈結,當用戶 通過搜尋結果訪問該頁面或是通過其他方式(如通過商品 類目樹)訪問該頁面後,用戶對該頁面的每一次點擊都由 伺服器產生一條日誌檔,並將產生的該日誌檔通過在頁面 -10- 201209744 中添加的鏈結保存到日誌伺服器中。本步驟中, 誌伺服器可以是獨立的資料存儲設備,也可以是 類目樹的資料庫中專門用於存儲日誌檔的存儲設 本申請案中涉及的日誌檔中包含頁面顯示的 的至少一個屬性資訊,該屬性資訊包括商品品牌 品型號資訊、商品顏色資訊或商品所屬類目ID 例如,用戶訪問一個提供的商品爲手機的Web頁 服器針對該用戶的這次訪問產生的日誌檔可以包 性資訊:手機的品牌信息爲“ABC”,手機的型 “123”,手機的顏色資訊爲“紅色”,所屬類目ID “手機”。 如果用戶是通過搜尋引擎提供的導航資訊沿 樹的路徑自上而下到達的訪問頁面,則日誌檔中 戶向搜尋引擎提供的搜尋關鍵字資訊。例如,用 關鍵字爲“ABC紅色”,根據搜尋引擎伺服器返回 訊沿商品類目樹訪問提供品牌爲“ABC”、型號爲‘ 顏色爲“紅色”的手機的Web頁面時,則產生的曰 包含以下屬性資訊:手機的品牌信息爲“ABC”, 號資訊爲“:! 23”,手機的顏色資訊爲“紅色”,搜 資訊爲“ A B C紅色”等。由於日誌檔是在用戶點擊 頁面或是商品資訊頁面時由伺服器自動產生的文 因此,日誌伺服器中存儲的各個日誌檔中包含的 的搜尋關鍵字資訊的格式可能會不統一,這種情 以對存儲的各個日誌檔中的用戶輸入的關鍵字進 涉及的曰 存儲商品 備。 商品資訊 資訊、商 資訊等。 面時,伺 含以下屬 號資訊爲 的資訊爲 商品類目 還包含用 戶搜尋的 的導航資 ‘ 1 2 3,,、且 誌檔可以 手機的型 尋關鍵字 商品類目 字檔案, 用戶輸入 況下,可 行歸一化 -11 - 201209744 處理,歸一化處理的方式包括但不限於:去除不必要的詞 語、去除多餘的空格、大小寫字母的轉換、全形半形的轉 換、繁體簡體的轉換、標點的轉換和中文數位的轉換等。 步驟102:根據設定時間長度內產生的各個日誌檔包 含的屬性資訊’分別確定同—商品類目對應的各個不同屬 性資訊、及每種屬性資訊出現的次數資訊。 在本步驟中,可以對設定時間長度(如24小時)內 產生的日誌檔進行統計分析,確定用戶在該設定時間長度 內對商品資訊的查詢意圖。在設定時間長度內產生的曰誌 檔可以是多個用戶訪問提供商品資訊的Web頁面時產生的 曰誌檔。 在本步驟中,由於日誌檔中包含的資訊繁多,因此, 可以通過支持向量機(support vector machine)對屬性資 訊進行分類,產生分類資料。 步驟103:將確定出的同一商品類目對應的各個不同 屬性資訊以及每種屬性資訊出現的次數資訊作爲一模型資 訊組記錄。 其中:記錄的該模型資訊組中任一屬性資訊及其對應 出現的次數資訊作爲該模型資訊組中一個屬性模型資訊存 在。屬性模型資訊包括:商品品牌模型資訊、商品型號模 型資訊和商品顏色模型資訊等。例如,如果一條日誌檔中 包含的屬性資訊爲商品品牌資訊、商品型號資訊、商品顏 色資訊和商品類目資訊’則該商品類目資訊對應的模型資 訊組中’商品品牌模型資訊包括商品品牌資訊及其出現次 -12- 201209744 數,商品型號模型資訊包括商品型號資訊及其出現次數, 商品顏色模型資訊包括商品顏色資訊及其出現次數。 由於每一條日誌檔是在用戶訪問提供某一商品資訊的 Web頁面時產生的,因此,每一條日誌檔對應一件商品資 訊。但是,某些商品資訊中的一個或多個屬性資訊的內容 可能是相同的,但這些商品資訊表示的商品所屬類目ID 不同(如相同品牌的手機和電腦,其所屬商品類目不同, 但作爲屬性資訊的商品品牌資訊相同),因此,可以根據 商品資訊表示的商品所屬類目來確定日誌檔對應的類目。 由於每一商品類目對應一個模型資訊組,因此,將每 個類目對應的模型資訊組集合在一起,成爲表示用戶在設 定時間長度內對商品資訊訪問意圖的模型。 下面以設定時間長度內產生N條日誌檔爲例,說明實 施例一的具體實現方式: 對產生的N條日誌檔(1,2......,n0,nl,n2,n3......Ν )依次進行分析,確定每一條日誌檔包含的屬性資訊,不 斷訓練各商品類目對應的模型資訊組,假設通過對第1條 〜第η0條日誌檔的訓練,得到的模型資訊組如表1所示: 模型資訊組:類目 商品品牌模型資訊 商品品牌資訊:數量 商品型號模型資訊 商品型號資訊:數量 商品顏色模型資訊 商品顏色資訊:數量 模型資訊組1:手機 ABC: 2 123: 6 紅色:10 DEF: 8 456:20 黑色:60 模型資訊組2:女裙 abc: 10 S: 30 白色:45 def; 6 M: 35 綠色:50
-13- 201209744 假設:日誌檔η 1是訪問提供某一款手機資訊的Web 頁面時產生的日誌檔,包含的屬性資訊爲:“商品品牌資 訊:ABC”,“商品型號資訊:123”,“商品顏色資訊:紅色 日誌檔n2是訪問提供另一款手機資訊的Web頁面時 產生的日誌檔,包含的屬性資訊爲:“商品品牌資訊: DEF”,“商品型號資訊:456”,“商品顔色資訊:紅色”。 日誌檔n3是訪問提供一款女裙資訊的Web頁面時產 生的日誌檔,包含的屬性資訊爲:“商品品牌資訊:abc” ,“商品型號資訊:S”,“商品顏色資訊:白色”。 對上述第nl〜第n3條日誌檔分析後,在表1的基礎上 進一步得到表2所示的模型資訊組: 模型資訊組:類目 商品品牌模型資訊 商品品牌資訊:數量 商品型號模型資訊 商品型號資訊:數量 商品顏色模型資訊 商品顏色資訊:數量 模型資訊組1:手機 ABC: 3 123:7 紅色:12 DEF:9 456:21 黑色:60 模型資訊組2:女裙 abc: 11 S:31 白色:46 def: 6 Μ: 35 綠色:50 表2 類似地,在第n 3條曰誌檔之後’可以繼續利用第n 4 ~ 第Ν條日誌消息不斷更新表2。表2所示的多個模型資訊 組的集合可以表示在設定時間長度內用戶對多種類目商品 的訪問意圖的模型。 -14- 201209744 在對表2所示的用戶對商品資訊訪問意圖的模型進行 存儲時,不僅需要存儲每一個模型資訊組中的內容,還需 要存儲每一個模型資訊組與類目的對應關係。 在實施例一的方案中,對設定時間長度內保存在日誌 伺服器中的曰誌資訊,可以按照產生的時間先後順序進行 分析,訓練得到模型資訊組;也可以不分產生的先後順序 ’對全部日誌資訊中的屬性資訊進行統一分析,訓練得到 模型資訊組。 通過實施例一的方案,對設定時間長度內用戶對商品 資訊的訪問,以日誌檔的形式進行記錄,並記錄根據匯總 資料確定的用戶對商品資訊的查詢意圖,以構建設定時間 長度內用戶對商品資訊的訪問意圖的模型,從而確定設定 時間長度內的用戶訪問意圖。 實施例二 本申請案實施例二利用實施例一記錄的用戶訪問商品 資訊對商品資訊進行搜尋的方法,如圖2所示,包括以下 步驟: 步驟201 :伺服器根據接收的用戶輸入的查詢關鍵字 ,確定用戶待查詢商品資訊所屬的商品類目。 本實施例二中涉及的伺服器是能夠根據用戶輸入的關 鍵字進行商品信息搜尋的伺服器,可以與實施例一中涉及 的伺服器集成在一起,也可以分別獨立設置。 步驟2〇2 :在記錄的各個模型資訊組中,查找到確定 -15- 201209744 出的商品類目對應的模型資訊組。 由於在實施例一的方案中,表2所示的用戶對商品資 訊訪問意圖的模型中,每一個模型資訊組與對應的商品類 目保存在一起,因此,伺服器在接收到用戶輸入的關鍵字 時,可以根據該關鍵字確定待查詢的商品資訊所屬的商品 類目,進而確定該商品類目ID對應的模型資訊組。 例如:用戶向伺服器輸入的關鍵字爲“手機、DEF”, 則確定用戶待査詢商品資訊的商品類目是手機,且商品品 牌資訊是DEF,對應表2模型中的模型資訊組1。在實施 例二中,用戶輸入的査詢關鍵字中也不限於包括待查詢商 品類目,還可以包括待査詢商品的屬性資訊。 步驟203 :從査找到的模型資訊組的屬性模型資訊下 的屬性資訊中,確定與該查詢關鍵字匹配的屬性資訊。 假設用戶輸入的查詢關鍵字是“手機、DEF”,則查找 出的模型資訊組爲模型資訊組1,模型資訊組1的屬性模 型資訊包括商品品牌模型資訊、商品型號模型資訊和商品 顏色模型資訊,每一個屬性模型資訊又進一步包括屬性資 訊。與查詢關鍵字“DEF”匹配的屬性資訊包括:商品品牌 資訊“DEF”、商品型號資訊“123、456”,商品顔色資訊:“ 紅色、黑色”。 如果在本步驟中能夠查詢出與該査詢關鍵字匹配的屬 性資訊,則表示用戶輸入的查詢關鍵字是高頻詞’可以直 接利用實施例一得到的模型資訊組進行査詢。 如果在本步驟中未能夠查詢出與該查詢關鍵字匹配的 -16- 201209744 屬性資訊’表示該用戶輸入的查詢關鍵字是低頻詞,則可 以減少查詢關鍵字的內容後重新確定的屬性資訊中查詢與 減少內容後的查詢關鍵字匹配的屬性資訊。例如:用戶輸 入的查詢關鍵字是“手機、A B D ”,由於在實施例一中得到 的模型資訊組1中沒有“ABD”品牌的手機,因此,減少查 詢關鍵字中的“ABD”,直接將“手機”作爲查詢關鍵字重新 查詢,以確定與更新後的查詢關鍵字匹配的屬性資訊。 再重新查詢匹配的屬性資訊之後,確定“ A B D ”爲低頻 詞,則可以進一步利用該低頻詞進行即時對用戶的查詢意 圖分析’利用低頻詞更新表2中模型資訊組1的內容,得 到表3所示的用戶對商品資訊訪問意圖的模型: 模型資訊組:類目 商品品牌模型資訊 商品品牌資訊:數量 商品型號模型資訊 商品型號資訊:數量 商品顏色模型資訊 商品顏色資訊:數量 ABC: 3 123:7 紅色:12 模型資訊組1:手機 DEF:9 456:21 黑色:60 ABD: 1 模型資訊組2:女裙 abc: 11 S: 31 白色:46 def: 6 M:35 綠色:50
步驟2〇4 :伺服器從確定出的屬性資訊中,提取出出 現次數達到設定門限値的屬性資訊。 在本步驟中,爲了向用戶返回與查詢相關度高的搜尋 結果,可以從步驟2 0 3中查詢出的屬性資訊中進一步提取 出在之前的設定時間長度內用戶的查詢意圖較高的商品資 -17- 201209744 訊的屬性資訊,例如,在步驟203中查詢出的屬性資訊包 括:商品品牌資訊“DEF”、商品型號資訊“123、45 6”,商 品顏色資訊“紅色、黑色”。通過表2可以確定商品品牌資 訊爲“DEF”,因此,不論“DEF”的數量多少,都要將“DEF” 作爲提取出的屬性資訊;商品型號資訊“123”的數量爲7, 商品型號資訊“45 6”的數量爲21,因此,可以將“45 6”作爲 提取出的屬性資訊;商品顏色資訊爲“紅色”的數量爲1 2, 商品顏色資訊爲“黑色”的數量爲60,因此,可以將“黑色” 作爲提取出的屬性資訊。此時,最終得到提取出的屬性資 訊包括:商品品牌資訊“DEF”、商品型號資訊“4 5 6”和商品 顏色資訊“黑色”。 步驟205 :伺服器將包含提取出的屬性資訊的商品節 點列表返回給用戶。 商品節點列表中包含了與提取出的屬性資訊內容相同 的至少一個包含商品資訊的頁面資訊,如鏈結位址資訊。 由於商品資訊按照商品資訊類目樹的形式保存在資料 庫中,因此,可以將包含商品品牌“DEF”、商品型號“456” 和商品顏色“黑色”這些屬性資訊的部分或包含這些屬性資 訊的商品節點列表按照XML的格式返回給用戶。 在用戶通過商品節點列表中包括的商品頁面的鏈結資 訊訪問某一商品頁面時,在該商品頁面中還可進一步包含 顯示的商品的賣方資訊、價格趨勢資訊和買方回饋資訊中 的一種或多種。 在本實施例二的方案中,如果用戶在步驟201中輸入 -18 - 201209744 的查詢關鍵字中不包含待查詢商品所屬的商品類目,則從 表2的模型資訊組中查詢是否存在與查詢關鍵字內容匹配 的屬性模型資訊’如果存在,則可以根據查詢出的屬性模 型資訊確定該屬性模型資訊所屬的模型資訊組,進而確定 出待查詢茼品所屬的商品類目;否則’可以按照該查詢關 鍵字查詢出與用戶待查詢的商品的相關資訊,並將查詢出 的相關資訊返回給用戶’並在用戶訪問該相關資訊指示的 頁面時產生日誌檔,並利用產生的日誌檔更新表2的模型 資訊組,其中:該查詢關鍵字的內容將作爲更新後的模型 資訊組內的一部分內容。 例如:如果用戶在步驟201中輸入的查詢關鍵字爲 “ABC”,則從表2中模型資訊組的內容可以確定待查詢商 品所屬的商品類目爲手機。 如果用戶在步驟20 1中輸入的查詢關鍵字爲“ABD”, 則從表2中無法確定待查詢商品所屬的商品類目,因此, 伺服器從保存在資料庫中的商品類目樹中查詢出與“ABD” 匹配的所有相關資訊,並包含該相關資訊的所有節點的資 訊返回給用戶。用戶獲得伺服器返回的資訊後,在每次訪 問返回的資訊指示的頁面時,按照實施例一的方案產生曰 誌檔。例如,用戶訪問一個提供的商品爲ABD品牌的手 機Web頁面時,伺服器針對該用戶的這次訪問產生的日誌 檔至少可以包含以下屬性資訊:手機的品牌資訊爲“ABD” ,則可以根據當前產生的日誌檔更新表2,得到如表3所 示的模型資訊組: •19- 201209744 模型資訊組:類目 商品品牌模型資訊 商品品牌資訊:數量 商品型號模型資訊 商品型號資訊:數量 商品顏色模型資訊 商品顏色資訊:數量 模型資訊組1:手機 ABC: 3 123:7 紅色:12 DEF:9 456:21 黑色:6〇 ABD: 1 模型資訊組2:女裙 abc: 11 S:31 白色:46 def: 6 Μ: 35 綠色:50
在上述實例中,用戶輸入的查詢關鍵字“ABD”可能是 商品類目樹中真實存在的商品屬性資訊的內容,也可能是 用戶在輸入査詢關鍵字時的誤輸入,如用戶實際希望輸入 的查詢關鍵字是“ABC”,但在輸入時出現錯誤導致輸入 “ABD” ’在按照上述實例中的方式向用戶返回商品類目樹 中與用戶待查詢的商品相關的所有節點的資訊後,用戶訪 問頁面時產生日誌檔中應當包含該頁面實際的屬性資訊以 及用戶輸入的査詢關鍵字。 例如:用戶訪問的是提供的商品爲AB C品牌的手機 Web頁面,此時,伺服器針對該用戶的這次訪問產生的曰 誌檔至少可以包含以下屬性資訊:手機的品牌資訊爲 “ABC”和“ABD”,則可以根據當前產生的日誌檔更新表2 ,得到如表4所示的模型資訊組: -20- 201209744 模型資訊組:類目 商品品牌模型資訊 商品品牌資訊:數量 商品型號模型資訊 商品型號資訊:數量 商品顏色模型資訊 商品顏色資訊:數量 模型資訊組1:手機 ABC: 4 123: 7 紅色:12 DEF:9 456: 21 黑色:60 ABD: 1 模型資訊組2:女裙 abc: 11 S:31 白色:46 def: 6 Μ: 35 綠色:50
在表4所示的模型資訊組中,如果ABD是用戶的誤 輸入,則在利用表4執行本發明實施例二的方案時,由於 誤輸入“ABD”對應的數量較少,達不到設定門限値,因此 ,在用戶正確輸入查詢關鍵字時,誤輸入不會影響查詢結 果的準確性;如果A B D不是用戶的誤輸入,而是一種新 式的手機品牌,則後續當有用戶請求查詢“ABD”時,可以 按照表4爲用戶提供準確的查詢結果。 通過本實施例二的方案,利用已記錄的用戶對商品資 訊的訪問意圖對用戶的搜尋請求進行分類,查詢出與用戶 的查詢意圖相關性較高的屬性資訊,使用戶得到高相關度 的搜尋結果,從而能夠快速、準確的定位出希望獲得的商 品資訊。 實施例三 本申請案實施例三還提供一種記錄用戶訪問商品資訊 的伺服器,如圖3所示,該伺服器包括:日誌產生模組1 1 -21 - 201209744 、資訊確定模組1 2和記錄模組1 3,其中: 日誌產生模組1 1用於收到用戶對包含商品資訊的頁 面的訪問資訊時,產生日誌檔,該日誌檔中包含訪問頁面 中包含的商品資訊的至少一個屬性資訊; 資訊確定模組1 2用於根據產生的多個該日誌檔中包 含的屬性資訊,分別確定同一商品類目對應的各個不同屬 性資訊及每種屬性資訊出現的次數資訊; 記錄模組1 3用於將確定出的同一商品類目對應的各 個不同屬性資訊以及每種屬性資訊出現的次數資訊作爲一 模型資訊組記錄;其中:該模型資訊組包括屬性模型資訊 ,每一該屬性模型資訊包括一屬性資訊及其對應出現的次 數資訊。 本實施例中涉及的商品資訊的屬性資訊和屬性模型資 訊與實施例一中定義相同。 實施例四 本申請案實施例四在利用實施例三的伺服器記錄的用 戶訪問商品資訊基礎上,提出一種對商品資訊進行搜尋的 伺服器,如圖4所示,進行搜尋的伺服器包括:類目確定 模組21、查找模組22、屬性資訊確定模組23、提取模組 24和返回模組25,其中: 類目確定模組21用於根據查詢關鍵字,確定待查詢 商品資訊所屬的商品類目; 查找模組22用於在記錄的各個模型資訊組中,查找 •22- 201209744 確定出的商品類目對應的模型資訊組; 屬性資訊確定模組2 3用於從查找到的模型資訊組的 屬性模型資訊下的屬性資訊中,確定與該查詢關鍵字匹配 的屬性資訊; 提取模組24用於從確定出的屬性資訊中,提取出現 次數達到設定門限値的屬性資訊; 返回模組2 5用於將包含提取出的屬性資訊的商品節 點列表作爲搜尋結果返回。 該查找模組2 2具體用於根據査詢關鍵字中的屬性資 訊所屬的屬性模型資訊,從多個模型資訊組中確定該屬性 模型資訊所屬的模型資訊組。 屬性資訊確定模組23還用於在模型資訊組中未查詢 出與該查詢關鍵字匹配的屬性資訊所對應的屬性模型資訊 時,減少查詢關鍵字的內容後,重新在查找到的模型資訊 組中查詢與減少內容後的查詢關鍵字匹配的屬性資訊所對 應的屬性模型資訊。 該進行搜尋的伺服器還包括更新模組26,用於根據減 少內容後的查詢關鍵字更新查找到的模型資訊組。 返回模組2 5還用於在模型資訊組的屬性模型資訊中 不存在與查詢關鍵字匹配的屬性資訊時,從商品類目樹中 查詢出與查詢關鍵字匹配的所有資訊,並返回包含該資訊 的所有節點的資訊。 該進行搜尋的伺服器還包括日誌產生模組27 ’用於收 到對該返回包含該資訊的所有節點的資訊中的商品資訊的 -23- 201209744 頁面的訪問資訊時,產生日誌檔;更新模組2 6還用於根 據該日誌檔中的商品資訊的屬性資訊和對應的該査詢關鍵 字,更新模型資訊組。 實施例三中的記錄用戶訪問商品資訊的伺服器和實施 例四中的對商品資訊進行搜尋的伺服器可以是獨立的網路 設備,也可以是集成在一起的網路設備。 本領域內的技術人員應明白,本申請案的實施例可提 供爲方法、系統、或電腦程式產品。因此,本申請案可採 用完全硬體實施例'、完全軟體實施例、或結合軟體和硬體 方面的實施例的形式。而且,本申請案可採用在一個或多 個其中包含有電腦可用程式碼的電腦可用存儲介質(包括 但不限於磁盤記億體、CD-ROM、光學記憶體等)上實施 的電腦程式產品的形式。 本申請案是參照根據本申請案實施例的方法、設備( 系統)、和電腦程式產品的流程圖和/或方框圖來描述的 。應理解可由電腦程式指令實現流程圖和/或方框圖中的 每一流程和/或方框、以及流程圖和/或方框圖中的流程 和/或方框的結合。可提供這些電腦程式指令到通用電腦 、專用電腦、嵌入式處理機或其他可編程資料處理設備的 處理器以產生一個機器,使得通過電腦或其他可編程資料 處理設備的處理器執行的指令產生用於實現在流程圖一個 流程或多個流程和/或方框圖一個方框或多個方框中指定 的功能的裝置。 這些電腦程式指令也可存儲在能引導電腦或其他可編 -24- 201209744 程資料處理設備以特定方式工作的電腦可讀記憶體中’使 得存儲在該電腦可讀記憶體中的指令產生包括指令裝置的 製造品,該指令裝置實現在流程圖一個流程或多個流程和 /或方框圖一個方框或多個方框中指定的功能。 這些電腦程式指令也可裝載到電腦或其他可編程資料 處理設備上,使得在電腦或其他可編程設備上執行一系列 操作步驟以產生電腦實現的處理,從而在電腦或其他可編 程設備上執行的指令提供用於實現在流程圖一個流程或多 個流程和/或方框圖一個方框或多個方框中指定的功能的 步驟。 儘管已描述了本申請案的優選實施例,但本領域內的 技術人員一旦得知了基本創造性槪念,則可對這些實施例 做出另外的變更和修改。所以,所附申請專利範圍意欲解 釋爲包括優選實施例以及落入本申請案範圍的所有變更和 修改。 顯然’本領域的技術人員可以對本申請案進行各種改 動和變型而不脫離本申請案的精神和範圍。這樣,倘若本 申請案的這些修改和變型屬於本申請案申請專利範圍及其 等同技術的範圍之內’則本申請案也意圖包含這些改變和 變型在內。 【圖式簡單說明】 圖1爲本申請案實施例一確定商品的屬性資訊數量的 方法示意圖; -25- 201209744 圖2爲本申請案實施例二進行商品搜尋的方法示意圖 > 圖3爲本申請案實施例三記錄用戶訪問商品資訊的伺 服器結構示意圖; 圖4爲本申請案實施例三對商品資訊進行搜尋的伺服 器結構示意圖。 【主要元件符號說明】 1 1 :日誌產生模組 1 2 :資訊確定模組 1 3 :記錄模組 2 1 :類目確定模組 2 2 :查找模組 2 3 :屬性資訊確定模組 24 :提取模組 2 5 :返回模組 2 6 :更新模組 2 7 :日誌產生模組 -26-