TW201209744A - Method of recording information of merchandise visited by consumers, and searching method and server - Google Patents

Method of recording information of merchandise visited by consumers, and searching method and server Download PDF

Info

Publication number
TW201209744A
TW201209744A TW99128884A TW99128884A TW201209744A TW 201209744 A TW201209744 A TW 201209744A TW 99128884 A TW99128884 A TW 99128884A TW 99128884 A TW99128884 A TW 99128884A TW 201209744 A TW201209744 A TW 201209744A
Authority
TW
Taiwan
Prior art keywords
information
product
attribute
model
model information
Prior art date
Application number
TW99128884A
Other languages
English (en)
Other versions
TWI547888B (zh
Inventor
Wei Yuan
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to TW099128884A priority Critical patent/TWI547888B/zh
Publication of TW201209744A publication Critical patent/TW201209744A/zh
Application granted granted Critical
Publication of TWI547888B publication Critical patent/TWI547888B/zh

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

201209744 六、發明說明: 【發明所屬之技術領域】 本申請案涉及電腦技術領域,尤其涉及一種記錄用戶訪 問商品資訊的方法和伺服器’以及一種利用記錄的用戶訪問 商品資訊的結果對商品資訊進行搜尋的方法和伺服器。 【先前技術】 用戶在企業對個人用戶(Business To Customer, B2C )網站或個人用戶對個人用戶(Customer To Customer, C2C )網站上進行商品搜索時,會通過網站提供的介面輸 入待查詢的商品名稱’網站根據用戶輸入的關鍵字進行搜 索後向用戶返回的的結果主要有兩種,一種是與用戶待查 詢的商品相關的導航資訊’另一種是用戶待查詢的商品的 相關資訊。 目前,大量的商品資訊按照商品類目名稱以樹的結構 組織在一起,商品類目樹保存在資料庫相對應的資料表中 ,由人工對商品類目樹中各節點的資料進行輸入與維護’ B2C網站或是C2C網站中的每個商品資訊的展示都屬於商 品類目樹中某一個或多個節點。 用戶向B2C網站或是C2C網站進行商品資訊查詢時 ,如果網站向用戶返回的結果是與用戶待查詢的商品相關 的導航資訊,則用戶可以根據接收到的導航資訊’沿商品 類目樹的路徑自上而下定位至希望查詢的搜尋結果。如果 網站向用戶返回的結果是用戶待查詢的商品的相關資訊’ -5- 201209744 則網站將商品類目樹中與用戶待查詢的商品相關的所有節 點的資訊返回給用戶。 由於目前的電子商務網站的商品數量非常龐大,有些 網站的商品數量能夠達到上億規模,根據用戶輸入的待查 詢的商品名稱搜尋出的商品資訊數量可能非常多,一方面 ,網站伺服器向用戶推送數量巨大的商品資訊會佔用伺服 器的大量系統資源以及網路帶寬,另一方面,用戶獲得這 些資訊後,很難從網站返回的商品中準確、快速地定位出 用戶實際希望查詢的商品。 爲了解決上述問題,目前的常規做法是限定向用戶返 回的商品類目數,通過減少向用戶返回的商品資訊,以減 少向用戶推送商品資訊時對系統伺服器的資源佔用和網路 的資源佔用,並同時減少用戶的查詢時間。通過減少向用 戶返回的商品類目數的做法在一定程度上減少了資源的佔 用和用戶的查詢時間,但同時也可能將與用戶查詢相關度 非常高的商品排除在外,導致向用戶返回的查詢結果不準 確。 綜上所述,目前針對用戶請求查詢商品資訊的搜尋技 術中,存在的對用戶查詢意圖不明確,向用戶返回的搜尋 結果中的資訊與用戶查詢的相關度較低,導致用戶的搜尋 結果較差的問題。 【發明內容】 本申請案的目的在於,提供一種記錄用戶訪問商品資 -6- 201209744 訊的方法和伺服器,用以解決現有技術中存在的對用戶查 詢意圖不明確的問題。 一種記錄用戶訪問商品資訊的方法,該方法包括·· 在用戶每次訪問包含商品資訊的頁面時產生日誌檔, 該曰誌檔中包含訪問頁面中包含的商品資訊的至少一個屬 性資訊; 根據各個日誌檔包含的屬性資訊,分別確定同一商品 類目對應的各個不同屬性資訊、及每種屬性資訊出現的次 數資訊;以及 將確定出的同一商品類目對應的各個不同屬性資訊、 及每種屬性資訊出現的次數資訊作爲一模型資訊組記錄; 其中:記錄的該模型資訊組中任一屬性資訊及其對應 出現的次數資訊作爲該模型資訊組中一個屬性模型資訊存 在。 一種記錄用戶訪問商品資訊的伺服器,該伺服器包括 曰誌產生模組,用於收到用戶對包含商品資訊的頁面 的訪問資訊時,產生日誌檔,該日誌檔中包含訪問頁面中 包含的商品資訊的至少一個屬性資訊; 資訊確定模組,用於根據產生的多個該曰誌檔中包含 的屬性資訊,分別確定同一商品類目對應的各個不同屬性 資訊及每種屬性資訊出現的次數資訊; 記錄模組,用於將確定出的同一商品類目對應的各個 不同屬性資訊以及每種屬性資訊出現的次數資訊作爲一模 201209744 型資訊組記錄;其中:該模型資訊組包括屬性模型資訊, 每一該屬性模型資訊包括一屬性資訊及其對應出現的次數 資訊。 本申請案記錄用戶訪問包含商品資訊的頁面時產生曰 誌檔,並對各個日誌檔中的屬性資訊進行分析,將確定出 的同一商品類目對應的各個不同屬性資訊、及每種屬性資 訊出現的次數資訊作爲一模型資訊組記錄,構建用戶對商 品訪問意圖的模型,明確了設定時間內用戶對商品的訪問 意圖。 本申請案的另一目的在於,提供一種利用記錄的用戶 訪問商品資訊對商品資訊進行搜尋的方法和伺服器,用以 解決現有技術中存在的向用戶返回的搜尋結果與用戶查詢 的相關度較低,導致用戶的搜尋結果較差的問題。 一種對商品資訊進行搜尋的方法,該方法包括: 根據用戶輸入的查詢關鍵字,確定用戶待査詢商品資 訊所屬的商品類目; 在記錄的各個模型資訊組中,查找到確定出的商品類 目對應的模型資訊組; 從査找到的模型資訊組的屬性模型資訊下的屬性資訊 中,確定與該查詢關鍵字匹配的屬性資訊; 從確定出的屬性資訊中,提取出出現次數達到設定門 限値的屬性資訊; 將包含提取出的屬性資訊的商品節點列表返回給用戶 ,其中商品節點列表中包含了與提取出的屬性資訊內容相 -8 - 201209744 同的至少一個包含商品資訊的頁面資訊。 一種對商品資訊進行搜尋的伺服器’該進行搜尋的伺 服器包括: 類目確定模組,用於根據查詢關鍵字,確定待査詢商 品資訊所屬的商品類目; 查找模組,用於在記錄的各個模型資訊組中,查找確 定出的商品類目對應的模型資訊組; 屬性資訊確定模組,用於從查找到的模型資訊組的屬 性模型資訊下的屬性資訊中,確定與該查詢關鍵字匹配的 屬性資訊; 提取模組,用於從確定出的屬性資訊中,提取出現次 數達到設定門限値的屬性資訊; 返回模組,用於將包含提取出的屬性資訊的商品節點 列表作爲搜尋結果返回。 本申請案利用已記錄的用戶對商品資訊的訪問意圖對 用戶的搜尋請求進行分類,查詢出與用戶的查詢意圖相關 性較高的屬性資訊,並將包含查詢出的屬性資訊的商品節 點列表返回給用戶,使用戶得到高相關度的搜尋結果,能 夠快速、準確的定位出希望獲得的商品資訊。在減少用戶 的查詢時間和準確的定位出希望獲得的商品資訊的同時, 有效減少了向用戶推送商品資訊時對系統伺服器的資源佔 用和網路的資源佔用。 【實施方式】 -9- 201209744 本申請案提出對一段時間內用戶對商品資訊的訪問進 行記錄,根據記錄的匯總資料確定用戶對商品資訊的査詢 意圖分佈情況,得到用戶對商品資訊訪問意圖’進而利用 得到的用戶對商品資訊的訪問意圖對用戶的搜尋請求進行 分類,將與用戶搜尋的商品資訊相關性較高的包含商品資 訊頁面鏈結的商品資訊節點列表返回給用戶,讓搜尋結果 更加接近用戶的真實意圖’使得搜尋結果更準確° 下面結合說明書附圖對本申請案的方案進行詳細說明。 實施例一 本申請案實施例一是記錄用戶訪問商品資訊的方法, 如圖1所示,包括以下步驟: 步驟1 0 1 :伺服器在用戶每次訪問包含商品資訊的頁 面時產生日誌檔》 本實施例一中涉及的伺服器是指能夠在用戶每次訪問 頁面時,爲本次訪問事件產生日誌檔的設備。該伺服器可 以是與提供商品資訊頁面的伺服器集成在一起’也可以是 獨立於提供商品資訊頁面的伺服器。 本步驟的具體執行方式如下: 預先在提供商品資訊的頁面中添加一條可以連接到產 生曰誌檔的伺服器(簡稱“日誌伺服器”)的鏈結,當用戶 通過搜尋結果訪問該頁面或是通過其他方式(如通過商品 類目樹)訪問該頁面後,用戶對該頁面的每一次點擊都由 伺服器產生一條日誌檔,並將產生的該日誌檔通過在頁面 -10- 201209744 中添加的鏈結保存到日誌伺服器中。本步驟中, 誌伺服器可以是獨立的資料存儲設備,也可以是 類目樹的資料庫中專門用於存儲日誌檔的存儲設 本申請案中涉及的日誌檔中包含頁面顯示的 的至少一個屬性資訊,該屬性資訊包括商品品牌 品型號資訊、商品顏色資訊或商品所屬類目ID 例如,用戶訪問一個提供的商品爲手機的Web頁 服器針對該用戶的這次訪問產生的日誌檔可以包 性資訊:手機的品牌信息爲“ABC”,手機的型 “123”,手機的顏色資訊爲“紅色”,所屬類目ID “手機”。 如果用戶是通過搜尋引擎提供的導航資訊沿 樹的路徑自上而下到達的訪問頁面,則日誌檔中 戶向搜尋引擎提供的搜尋關鍵字資訊。例如,用 關鍵字爲“ABC紅色”,根據搜尋引擎伺服器返回 訊沿商品類目樹訪問提供品牌爲“ABC”、型號爲‘ 顏色爲“紅色”的手機的Web頁面時,則產生的曰 包含以下屬性資訊:手機的品牌信息爲“ABC”, 號資訊爲“:! 23”,手機的顏色資訊爲“紅色”,搜 資訊爲“ A B C紅色”等。由於日誌檔是在用戶點擊 頁面或是商品資訊頁面時由伺服器自動產生的文 因此,日誌伺服器中存儲的各個日誌檔中包含的 的搜尋關鍵字資訊的格式可能會不統一,這種情 以對存儲的各個日誌檔中的用戶輸入的關鍵字進 涉及的曰 存儲商品 備。 商品資訊 資訊、商 資訊等。 面時,伺 含以下屬 號資訊爲 的資訊爲 商品類目 還包含用 戶搜尋的 的導航資 ‘ 1 2 3,,、且 誌檔可以 手機的型 尋關鍵字 商品類目 字檔案, 用戶輸入 況下,可 行歸一化 -11 - 201209744 處理,歸一化處理的方式包括但不限於:去除不必要的詞 語、去除多餘的空格、大小寫字母的轉換、全形半形的轉 換、繁體簡體的轉換、標點的轉換和中文數位的轉換等。 步驟102:根據設定時間長度內產生的各個日誌檔包 含的屬性資訊’分別確定同—商品類目對應的各個不同屬 性資訊、及每種屬性資訊出現的次數資訊。 在本步驟中,可以對設定時間長度(如24小時)內 產生的日誌檔進行統計分析,確定用戶在該設定時間長度 內對商品資訊的查詢意圖。在設定時間長度內產生的曰誌 檔可以是多個用戶訪問提供商品資訊的Web頁面時產生的 曰誌檔。 在本步驟中,由於日誌檔中包含的資訊繁多,因此, 可以通過支持向量機(support vector machine)對屬性資 訊進行分類,產生分類資料。 步驟103:將確定出的同一商品類目對應的各個不同 屬性資訊以及每種屬性資訊出現的次數資訊作爲一模型資 訊組記錄。 其中:記錄的該模型資訊組中任一屬性資訊及其對應 出現的次數資訊作爲該模型資訊組中一個屬性模型資訊存 在。屬性模型資訊包括:商品品牌模型資訊、商品型號模 型資訊和商品顏色模型資訊等。例如,如果一條日誌檔中 包含的屬性資訊爲商品品牌資訊、商品型號資訊、商品顏 色資訊和商品類目資訊’則該商品類目資訊對應的模型資 訊組中’商品品牌模型資訊包括商品品牌資訊及其出現次 -12- 201209744 數,商品型號模型資訊包括商品型號資訊及其出現次數, 商品顏色模型資訊包括商品顏色資訊及其出現次數。 由於每一條日誌檔是在用戶訪問提供某一商品資訊的 Web頁面時產生的,因此,每一條日誌檔對應一件商品資 訊。但是,某些商品資訊中的一個或多個屬性資訊的內容 可能是相同的,但這些商品資訊表示的商品所屬類目ID 不同(如相同品牌的手機和電腦,其所屬商品類目不同, 但作爲屬性資訊的商品品牌資訊相同),因此,可以根據 商品資訊表示的商品所屬類目來確定日誌檔對應的類目。 由於每一商品類目對應一個模型資訊組,因此,將每 個類目對應的模型資訊組集合在一起,成爲表示用戶在設 定時間長度內對商品資訊訪問意圖的模型。 下面以設定時間長度內產生N條日誌檔爲例,說明實 施例一的具體實現方式: 對產生的N條日誌檔(1,2......,n0,nl,n2,n3......Ν )依次進行分析,確定每一條日誌檔包含的屬性資訊,不 斷訓練各商品類目對應的模型資訊組,假設通過對第1條 〜第η0條日誌檔的訓練,得到的模型資訊組如表1所示: 模型資訊組:類目 商品品牌模型資訊 商品品牌資訊:數量 商品型號模型資訊 商品型號資訊:數量 商品顏色模型資訊 商品顏色資訊:數量 模型資訊組1:手機 ABC: 2 123: 6 紅色:10 DEF: 8 456:20 黑色:60 模型資訊組2:女裙 abc: 10 S: 30 白色:45 def; 6 M: 35 綠色:50
-13- 201209744 假設:日誌檔η 1是訪問提供某一款手機資訊的Web 頁面時產生的日誌檔,包含的屬性資訊爲:“商品品牌資 訊:ABC”,“商品型號資訊:123”,“商品顏色資訊:紅色 日誌檔n2是訪問提供另一款手機資訊的Web頁面時 產生的日誌檔,包含的屬性資訊爲:“商品品牌資訊: DEF”,“商品型號資訊:456”,“商品顔色資訊:紅色”。 日誌檔n3是訪問提供一款女裙資訊的Web頁面時產 生的日誌檔,包含的屬性資訊爲:“商品品牌資訊:abc” ,“商品型號資訊:S”,“商品顏色資訊:白色”。 對上述第nl〜第n3條日誌檔分析後,在表1的基礎上 進一步得到表2所示的模型資訊組: 模型資訊組:類目 商品品牌模型資訊 商品品牌資訊:數量 商品型號模型資訊 商品型號資訊:數量 商品顏色模型資訊 商品顏色資訊:數量 模型資訊組1:手機 ABC: 3 123:7 紅色:12 DEF:9 456:21 黑色:60 模型資訊組2:女裙 abc: 11 S:31 白色:46 def: 6 Μ: 35 綠色:50 表2 類似地,在第n 3條曰誌檔之後’可以繼續利用第n 4 ~ 第Ν條日誌消息不斷更新表2。表2所示的多個模型資訊 組的集合可以表示在設定時間長度內用戶對多種類目商品 的訪問意圖的模型。 -14- 201209744 在對表2所示的用戶對商品資訊訪問意圖的模型進行 存儲時,不僅需要存儲每一個模型資訊組中的內容,還需 要存儲每一個模型資訊組與類目的對應關係。 在實施例一的方案中,對設定時間長度內保存在日誌 伺服器中的曰誌資訊,可以按照產生的時間先後順序進行 分析,訓練得到模型資訊組;也可以不分產生的先後順序 ’對全部日誌資訊中的屬性資訊進行統一分析,訓練得到 模型資訊組。 通過實施例一的方案,對設定時間長度內用戶對商品 資訊的訪問,以日誌檔的形式進行記錄,並記錄根據匯總 資料確定的用戶對商品資訊的查詢意圖,以構建設定時間 長度內用戶對商品資訊的訪問意圖的模型,從而確定設定 時間長度內的用戶訪問意圖。 實施例二 本申請案實施例二利用實施例一記錄的用戶訪問商品 資訊對商品資訊進行搜尋的方法,如圖2所示,包括以下 步驟: 步驟201 :伺服器根據接收的用戶輸入的查詢關鍵字 ,確定用戶待查詢商品資訊所屬的商品類目。 本實施例二中涉及的伺服器是能夠根據用戶輸入的關 鍵字進行商品信息搜尋的伺服器,可以與實施例一中涉及 的伺服器集成在一起,也可以分別獨立設置。 步驟2〇2 :在記錄的各個模型資訊組中,查找到確定 -15- 201209744 出的商品類目對應的模型資訊組。 由於在實施例一的方案中,表2所示的用戶對商品資 訊訪問意圖的模型中,每一個模型資訊組與對應的商品類 目保存在一起,因此,伺服器在接收到用戶輸入的關鍵字 時,可以根據該關鍵字確定待查詢的商品資訊所屬的商品 類目,進而確定該商品類目ID對應的模型資訊組。 例如:用戶向伺服器輸入的關鍵字爲“手機、DEF”, 則確定用戶待査詢商品資訊的商品類目是手機,且商品品 牌資訊是DEF,對應表2模型中的模型資訊組1。在實施 例二中,用戶輸入的査詢關鍵字中也不限於包括待查詢商 品類目,還可以包括待査詢商品的屬性資訊。 步驟203 :從査找到的模型資訊組的屬性模型資訊下 的屬性資訊中,確定與該查詢關鍵字匹配的屬性資訊。 假設用戶輸入的查詢關鍵字是“手機、DEF”,則查找 出的模型資訊組爲模型資訊組1,模型資訊組1的屬性模 型資訊包括商品品牌模型資訊、商品型號模型資訊和商品 顏色模型資訊,每一個屬性模型資訊又進一步包括屬性資 訊。與查詢關鍵字“DEF”匹配的屬性資訊包括:商品品牌 資訊“DEF”、商品型號資訊“123、456”,商品顔色資訊:“ 紅色、黑色”。 如果在本步驟中能夠查詢出與該査詢關鍵字匹配的屬 性資訊,則表示用戶輸入的查詢關鍵字是高頻詞’可以直 接利用實施例一得到的模型資訊組進行査詢。 如果在本步驟中未能夠查詢出與該查詢關鍵字匹配的 -16- 201209744 屬性資訊’表示該用戶輸入的查詢關鍵字是低頻詞,則可 以減少查詢關鍵字的內容後重新確定的屬性資訊中查詢與 減少內容後的查詢關鍵字匹配的屬性資訊。例如:用戶輸 入的查詢關鍵字是“手機、A B D ”,由於在實施例一中得到 的模型資訊組1中沒有“ABD”品牌的手機,因此,減少查 詢關鍵字中的“ABD”,直接將“手機”作爲查詢關鍵字重新 查詢,以確定與更新後的查詢關鍵字匹配的屬性資訊。 再重新查詢匹配的屬性資訊之後,確定“ A B D ”爲低頻 詞,則可以進一步利用該低頻詞進行即時對用戶的查詢意 圖分析’利用低頻詞更新表2中模型資訊組1的內容,得 到表3所示的用戶對商品資訊訪問意圖的模型: 模型資訊組:類目 商品品牌模型資訊 商品品牌資訊:數量 商品型號模型資訊 商品型號資訊:數量 商品顏色模型資訊 商品顏色資訊:數量 ABC: 3 123:7 紅色:12 模型資訊組1:手機 DEF:9 456:21 黑色:60 ABD: 1 模型資訊組2:女裙 abc: 11 S: 31 白色:46 def: 6 M:35 綠色:50
步驟2〇4 :伺服器從確定出的屬性資訊中,提取出出 現次數達到設定門限値的屬性資訊。 在本步驟中,爲了向用戶返回與查詢相關度高的搜尋 結果,可以從步驟2 0 3中查詢出的屬性資訊中進一步提取 出在之前的設定時間長度內用戶的查詢意圖較高的商品資 -17- 201209744 訊的屬性資訊,例如,在步驟203中查詢出的屬性資訊包 括:商品品牌資訊“DEF”、商品型號資訊“123、45 6”,商 品顏色資訊“紅色、黑色”。通過表2可以確定商品品牌資 訊爲“DEF”,因此,不論“DEF”的數量多少,都要將“DEF” 作爲提取出的屬性資訊;商品型號資訊“123”的數量爲7, 商品型號資訊“45 6”的數量爲21,因此,可以將“45 6”作爲 提取出的屬性資訊;商品顏色資訊爲“紅色”的數量爲1 2, 商品顏色資訊爲“黑色”的數量爲60,因此,可以將“黑色” 作爲提取出的屬性資訊。此時,最終得到提取出的屬性資 訊包括:商品品牌資訊“DEF”、商品型號資訊“4 5 6”和商品 顏色資訊“黑色”。 步驟205 :伺服器將包含提取出的屬性資訊的商品節 點列表返回給用戶。 商品節點列表中包含了與提取出的屬性資訊內容相同 的至少一個包含商品資訊的頁面資訊,如鏈結位址資訊。 由於商品資訊按照商品資訊類目樹的形式保存在資料 庫中,因此,可以將包含商品品牌“DEF”、商品型號“456” 和商品顏色“黑色”這些屬性資訊的部分或包含這些屬性資 訊的商品節點列表按照XML的格式返回給用戶。 在用戶通過商品節點列表中包括的商品頁面的鏈結資 訊訪問某一商品頁面時,在該商品頁面中還可進一步包含 顯示的商品的賣方資訊、價格趨勢資訊和買方回饋資訊中 的一種或多種。 在本實施例二的方案中,如果用戶在步驟201中輸入 -18 - 201209744 的查詢關鍵字中不包含待查詢商品所屬的商品類目,則從 表2的模型資訊組中查詢是否存在與查詢關鍵字內容匹配 的屬性模型資訊’如果存在,則可以根據查詢出的屬性模 型資訊確定該屬性模型資訊所屬的模型資訊組,進而確定 出待查詢茼品所屬的商品類目;否則’可以按照該查詢關 鍵字查詢出與用戶待查詢的商品的相關資訊,並將查詢出 的相關資訊返回給用戶’並在用戶訪問該相關資訊指示的 頁面時產生日誌檔,並利用產生的日誌檔更新表2的模型 資訊組,其中:該查詢關鍵字的內容將作爲更新後的模型 資訊組內的一部分內容。 例如:如果用戶在步驟201中輸入的查詢關鍵字爲 “ABC”,則從表2中模型資訊組的內容可以確定待查詢商 品所屬的商品類目爲手機。 如果用戶在步驟20 1中輸入的查詢關鍵字爲“ABD”, 則從表2中無法確定待查詢商品所屬的商品類目,因此, 伺服器從保存在資料庫中的商品類目樹中查詢出與“ABD” 匹配的所有相關資訊,並包含該相關資訊的所有節點的資 訊返回給用戶。用戶獲得伺服器返回的資訊後,在每次訪 問返回的資訊指示的頁面時,按照實施例一的方案產生曰 誌檔。例如,用戶訪問一個提供的商品爲ABD品牌的手 機Web頁面時,伺服器針對該用戶的這次訪問產生的日誌 檔至少可以包含以下屬性資訊:手機的品牌資訊爲“ABD” ,則可以根據當前產生的日誌檔更新表2,得到如表3所 示的模型資訊組: •19- 201209744 模型資訊組:類目 商品品牌模型資訊 商品品牌資訊:數量 商品型號模型資訊 商品型號資訊:數量 商品顏色模型資訊 商品顏色資訊:數量 模型資訊組1:手機 ABC: 3 123:7 紅色:12 DEF:9 456:21 黑色:6〇 ABD: 1 模型資訊組2:女裙 abc: 11 S:31 白色:46 def: 6 Μ: 35 綠色:50
在上述實例中,用戶輸入的查詢關鍵字“ABD”可能是 商品類目樹中真實存在的商品屬性資訊的內容,也可能是 用戶在輸入査詢關鍵字時的誤輸入,如用戶實際希望輸入 的查詢關鍵字是“ABC”,但在輸入時出現錯誤導致輸入 “ABD” ’在按照上述實例中的方式向用戶返回商品類目樹 中與用戶待查詢的商品相關的所有節點的資訊後,用戶訪 問頁面時產生日誌檔中應當包含該頁面實際的屬性資訊以 及用戶輸入的査詢關鍵字。 例如:用戶訪問的是提供的商品爲AB C品牌的手機 Web頁面,此時,伺服器針對該用戶的這次訪問產生的曰 誌檔至少可以包含以下屬性資訊:手機的品牌資訊爲 “ABC”和“ABD”,則可以根據當前產生的日誌檔更新表2 ,得到如表4所示的模型資訊組: -20- 201209744 模型資訊組:類目 商品品牌模型資訊 商品品牌資訊:數量 商品型號模型資訊 商品型號資訊:數量 商品顏色模型資訊 商品顏色資訊:數量 模型資訊組1:手機 ABC: 4 123: 7 紅色:12 DEF:9 456: 21 黑色:60 ABD: 1 模型資訊組2:女裙 abc: 11 S:31 白色:46 def: 6 Μ: 35 綠色:50
在表4所示的模型資訊組中,如果ABD是用戶的誤 輸入,則在利用表4執行本發明實施例二的方案時,由於 誤輸入“ABD”對應的數量較少,達不到設定門限値,因此 ,在用戶正確輸入查詢關鍵字時,誤輸入不會影響查詢結 果的準確性;如果A B D不是用戶的誤輸入,而是一種新 式的手機品牌,則後續當有用戶請求查詢“ABD”時,可以 按照表4爲用戶提供準確的查詢結果。 通過本實施例二的方案,利用已記錄的用戶對商品資 訊的訪問意圖對用戶的搜尋請求進行分類,查詢出與用戶 的查詢意圖相關性較高的屬性資訊,使用戶得到高相關度 的搜尋結果,從而能夠快速、準確的定位出希望獲得的商 品資訊。 實施例三 本申請案實施例三還提供一種記錄用戶訪問商品資訊 的伺服器,如圖3所示,該伺服器包括:日誌產生模組1 1 -21 - 201209744 、資訊確定模組1 2和記錄模組1 3,其中: 日誌產生模組1 1用於收到用戶對包含商品資訊的頁 面的訪問資訊時,產生日誌檔,該日誌檔中包含訪問頁面 中包含的商品資訊的至少一個屬性資訊; 資訊確定模組1 2用於根據產生的多個該日誌檔中包 含的屬性資訊,分別確定同一商品類目對應的各個不同屬 性資訊及每種屬性資訊出現的次數資訊; 記錄模組1 3用於將確定出的同一商品類目對應的各 個不同屬性資訊以及每種屬性資訊出現的次數資訊作爲一 模型資訊組記錄;其中:該模型資訊組包括屬性模型資訊 ,每一該屬性模型資訊包括一屬性資訊及其對應出現的次 數資訊。 本實施例中涉及的商品資訊的屬性資訊和屬性模型資 訊與實施例一中定義相同。 實施例四 本申請案實施例四在利用實施例三的伺服器記錄的用 戶訪問商品資訊基礎上,提出一種對商品資訊進行搜尋的 伺服器,如圖4所示,進行搜尋的伺服器包括:類目確定 模組21、查找模組22、屬性資訊確定模組23、提取模組 24和返回模組25,其中: 類目確定模組21用於根據查詢關鍵字,確定待查詢 商品資訊所屬的商品類目; 查找模組22用於在記錄的各個模型資訊組中,查找 •22- 201209744 確定出的商品類目對應的模型資訊組; 屬性資訊確定模組2 3用於從查找到的模型資訊組的 屬性模型資訊下的屬性資訊中,確定與該查詢關鍵字匹配 的屬性資訊; 提取模組24用於從確定出的屬性資訊中,提取出現 次數達到設定門限値的屬性資訊; 返回模組2 5用於將包含提取出的屬性資訊的商品節 點列表作爲搜尋結果返回。 該查找模組2 2具體用於根據査詢關鍵字中的屬性資 訊所屬的屬性模型資訊,從多個模型資訊組中確定該屬性 模型資訊所屬的模型資訊組。 屬性資訊確定模組23還用於在模型資訊組中未查詢 出與該查詢關鍵字匹配的屬性資訊所對應的屬性模型資訊 時,減少查詢關鍵字的內容後,重新在查找到的模型資訊 組中查詢與減少內容後的查詢關鍵字匹配的屬性資訊所對 應的屬性模型資訊。 該進行搜尋的伺服器還包括更新模組26,用於根據減 少內容後的查詢關鍵字更新查找到的模型資訊組。 返回模組2 5還用於在模型資訊組的屬性模型資訊中 不存在與查詢關鍵字匹配的屬性資訊時,從商品類目樹中 查詢出與查詢關鍵字匹配的所有資訊,並返回包含該資訊 的所有節點的資訊。 該進行搜尋的伺服器還包括日誌產生模組27 ’用於收 到對該返回包含該資訊的所有節點的資訊中的商品資訊的 -23- 201209744 頁面的訪問資訊時,產生日誌檔;更新模組2 6還用於根 據該日誌檔中的商品資訊的屬性資訊和對應的該査詢關鍵 字,更新模型資訊組。 實施例三中的記錄用戶訪問商品資訊的伺服器和實施 例四中的對商品資訊進行搜尋的伺服器可以是獨立的網路 設備,也可以是集成在一起的網路設備。 本領域內的技術人員應明白,本申請案的實施例可提 供爲方法、系統、或電腦程式產品。因此,本申請案可採 用完全硬體實施例'、完全軟體實施例、或結合軟體和硬體 方面的實施例的形式。而且,本申請案可採用在一個或多 個其中包含有電腦可用程式碼的電腦可用存儲介質(包括 但不限於磁盤記億體、CD-ROM、光學記憶體等)上實施 的電腦程式產品的形式。 本申請案是參照根據本申請案實施例的方法、設備( 系統)、和電腦程式產品的流程圖和/或方框圖來描述的 。應理解可由電腦程式指令實現流程圖和/或方框圖中的 每一流程和/或方框、以及流程圖和/或方框圖中的流程 和/或方框的結合。可提供這些電腦程式指令到通用電腦 、專用電腦、嵌入式處理機或其他可編程資料處理設備的 處理器以產生一個機器,使得通過電腦或其他可編程資料 處理設備的處理器執行的指令產生用於實現在流程圖一個 流程或多個流程和/或方框圖一個方框或多個方框中指定 的功能的裝置。 這些電腦程式指令也可存儲在能引導電腦或其他可編 -24- 201209744 程資料處理設備以特定方式工作的電腦可讀記憶體中’使 得存儲在該電腦可讀記憶體中的指令產生包括指令裝置的 製造品,該指令裝置實現在流程圖一個流程或多個流程和 /或方框圖一個方框或多個方框中指定的功能。 這些電腦程式指令也可裝載到電腦或其他可編程資料 處理設備上,使得在電腦或其他可編程設備上執行一系列 操作步驟以產生電腦實現的處理,從而在電腦或其他可編 程設備上執行的指令提供用於實現在流程圖一個流程或多 個流程和/或方框圖一個方框或多個方框中指定的功能的 步驟。 儘管已描述了本申請案的優選實施例,但本領域內的 技術人員一旦得知了基本創造性槪念,則可對這些實施例 做出另外的變更和修改。所以,所附申請專利範圍意欲解 釋爲包括優選實施例以及落入本申請案範圍的所有變更和 修改。 顯然’本領域的技術人員可以對本申請案進行各種改 動和變型而不脫離本申請案的精神和範圍。這樣,倘若本 申請案的這些修改和變型屬於本申請案申請專利範圍及其 等同技術的範圍之內’則本申請案也意圖包含這些改變和 變型在內。 【圖式簡單說明】 圖1爲本申請案實施例一確定商品的屬性資訊數量的 方法示意圖; -25- 201209744 圖2爲本申請案實施例二進行商品搜尋的方法示意圖 > 圖3爲本申請案實施例三記錄用戶訪問商品資訊的伺 服器結構示意圖; 圖4爲本申請案實施例三對商品資訊進行搜尋的伺服 器結構示意圖。 【主要元件符號說明】 1 1 :日誌產生模組 1 2 :資訊確定模組 1 3 :記錄模組 2 1 :類目確定模組 2 2 :查找模組 2 3 :屬性資訊確定模組 24 :提取模組 2 5 :返回模組 2 6 :更新模組 2 7 :日誌產生模組 -26-

Claims (1)

  1. 201209744 七、申請專利範圍: I · 一種記錄用戶訪問商品資訊的方法,其特徵在於, 該方法包括: 伺服器收到用戶對包含商品資訊的頁面的訪問資訊時 ’產生日誌檔’該日誌檔中包含訪問頁面中包含的商品資 訊的至少一個屬性資訊; 根據產生的多個該日誌檔中包含的屬性資訊,分別確 定同一商品類目對應的各個不同屬性資訊及每種屬性資訊 出現的次數資訊;以及 將確定出的同一商品類目對應的各個不同屬性資訊以 及每種屬性資訊出現的次數資訊作爲一模型資訊組記錄; 其中:該模型資訊組包括屬性模型資訊,每一該屬性模型 資訊包括一屬性資訊及其對應出現的次數資訊。 2.如申請專利範圍第1項所述的方法,其中,該曰誌 檔中包含的商品資訊的屬性資訊爲:商品品牌資訊、商品 型號資訊、商品顏色資訊和商品類目資訊; 該模型資訊組中包含以下屬性模型資訊: 由商品品牌資訊及其出現次數構成的商品品牌模型資 訊; 由商品型號資訊及其出現次數構成的商品型號模型資 訊;以及 由商品顏色資訊及其出現次數構成的商品顏色模型資 訊。 3 · —種對商品資訊進行搜尋的方法’其特徵在於’利 -27- 201209744 用申請專利範圍第1項記錄的用戶訪問商品資訊,該方法 包括: 伺服器根據查詢關鍵字,確定待查詢商品資訊所屬的 商品類目; 在記錄的各個模型資訊組中,査找確定出的商品類目 對應的模型資訊組; 從査找到的模型資訊組的屬性模型資訊下的屬性資訊 中,確定與該査詢關鍵字匹配的屬性資訊; 從確定出的屬性資訊中,提取出現次數達到設定門限 値的屬性資訊;以及 將包含提取出的屬性資訊的商品節點列表作爲搜尋結 果返回。 4.如申請專利範圍第3項所述的方法,其中,在提取 出對應屬性資訊出現次數達到設定門限値的屬性資訊之前 ,該方法還包括: 如果在模型資訊組中未查詢出與該查詢關鍵字匹配的 屬性資訊所對應的屬性模型資訊,則減少查詢關鍵字的內 容後,重新在查找到的模型資訊組中查詢與減少內容後的 查詢關鍵字匹配的屬性資訊所對應的屬性模型資訊》 5 ·如申請專利範圍第4項所述的方法,其中,重新查 詢與減少內容後的查詢關鍵字匹配的屬性資訊所對應的屬 性模型資訊之後,該方法還包括: 根據減少內容後的查詢關鍵字更新查找到的模型資訊 組。 -28 - 201209744 6 ·如申請專利範圍第3項所述的方法,其中,伺服器 根據查詢關鍵字確定的商品類目查找對應的模型資訊組’ 具體包括: 伺服器根據查詢關鍵字中的屬性資訊所屬的屬性模型 資訊’從多個模型資訊組中確定該屬性模型資訊所屬的模 型資訊組。 7.如申請專利範圍第3項所述的方法,其中’在模型 資訊組的屬性模型資訊中不存在與查詢關鍵字匹配的屬性 資訊時,該方法還包括: 伺服器從商品類目樹中查詢出與查詢關鍵字匹配的所 有資訊’並返回包含該資訊的所有節點的資訊。 8 .如申請專利範圍第7項所述的方法,其中’該方法 還包括: 伺服器接收到對該返回包含該資訊的所有節點的資訊 中的商品資訊的頁面的訪問資訊時,產生日誌檔,並根據 該日誌檔中的商品資訊的屬性資訊和對應的該查詢關鍵字 ,更新模型資訊組。 9. 一種記錄用戶訪問商品資訊的伺服器’其特徵在於 ,該伺服器包括: 曰誌產生模組,用於接收到用戶對包含商品資訊的頁 面的訪問資訊時,產生日誌檔,該曰誌檔中包含訪問頁面 中包含的商品資訊的至少一個屬性資訊·’ 資訊確定模組,用於根據產生的多個該日誌檔中包含 的屬性資訊,分別確定同一商品類目對應的各個不同屬性 -29- 201209744 資訊及每種屬性資訊出現的次數資訊;以及 記錄模組,用於將確定出的同一商品類目對應的各個 不同屬性資訊以及每種屬性資訊出現的次數資訊作爲一模 型資訊組記錄;其中:該模型資訊組包括屬性模型資訊, 每一·該屬性模型資訊包括一屬性資訊及其對應出現的次數 資訊。 1 〇 . —種進行搜尋的伺服器,利用申請專利範圍第9 項記錄的用戶訪問商品資訊對商品資訊進行搜索尋,其特 徵在於,該進行搜尋的伺服器包括’: 類目確定模組,用於根據查詢關鍵字,確定待查詢商 品資訊所屬的商品類目; 查找模組,用於在記錄的各個模型資訊組中,查找確 定出的商品類目對應的模型資訊組; 屬性資訊確定模組,用於從査找到的模型資訊組的屬 性模型資訊下的屬性資訊中,確定與該查詢關鍵字匹配的 屬性資訊; 提取模組,用於從確定出的屬性資訊中,提取出現次 數達到設定門限値的屬性資訊;以及 返回模組,用於將包含提取出的屬性資訊的商品節點 列表作爲搜尋結果返回。 -30-
TW099128884A 2010-08-27 2010-08-27 A method of recording user information and a search method and a server TWI547888B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW099128884A TWI547888B (zh) 2010-08-27 2010-08-27 A method of recording user information and a search method and a server

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW099128884A TWI547888B (zh) 2010-08-27 2010-08-27 A method of recording user information and a search method and a server

Publications (2)

Publication Number Publication Date
TW201209744A true TW201209744A (en) 2012-03-01
TWI547888B TWI547888B (zh) 2016-09-01

Family

ID=46763738

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099128884A TWI547888B (zh) 2010-08-27 2010-08-27 A method of recording user information and a search method and a server

Country Status (1)

Country Link
TW (1) TWI547888B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI557664B (zh) * 2012-03-15 2016-11-11 Alibaba Group Holding Ltd Product information publishing method and device
TWI573032B (zh) * 2014-12-25 2017-03-01 Rakuten Inc Information processing device, information processing method, memory media

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI734733B (zh) * 2017-01-23 2021-08-01 香港商阿里巴巴集團服務有限公司 獲取產品對象的方法及裝置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9262056B2 (en) * 2005-03-30 2016-02-16 Ebay Inc. Methods and systems to browse data items
CN1858733B (zh) * 2005-11-01 2012-04-04 华为技术有限公司 信息检索系统和检索方法
US8380698B2 (en) * 2006-02-09 2013-02-19 Ebay Inc. Methods and systems to generate rules to identify data items
KR101049889B1 (ko) * 2007-10-22 2011-07-19 주식회사 이베이지마켓 검색을 통한 행태분석에 기반한 키워드 그룹에 대하여광고를 수주하고 타겟 광고하는 웹 사이트 운영 방법 및온라인 시스템
TW200945074A (en) * 2008-04-22 2009-11-01 Ein Si & S Co Ltd Method and system for providing content (3)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI557664B (zh) * 2012-03-15 2016-11-11 Alibaba Group Holding Ltd Product information publishing method and device
TWI573032B (zh) * 2014-12-25 2017-03-01 Rakuten Inc Information processing device, information processing method, memory media
US10846773B2 (en) 2014-12-25 2020-11-24 Rakuten, Inc. Information processing device, information processing method, program, and storage medium

Also Published As

Publication number Publication date
TWI547888B (zh) 2016-09-01

Similar Documents

Publication Publication Date Title
US11468019B2 (en) Apparatus, systems, and methods for analyzing characteristics of entities of interest
JP5721818B2 (ja) 検索におけるモデル情報群の使用
US9418128B2 (en) Linking documents with entities, actions and applications
US9280561B2 (en) Automatic learning of logos for visual recognition
RU2670494C2 (ru) Способ обработки поискового запроса, сервер и машиночитаемый носитель для его осуществления
US20070073708A1 (en) Generation of topical subjects from alert search terms
US20110040733A1 (en) Systems and methods for generating statistics from search engine query logs
US10585927B1 (en) Determining a set of steps responsive to a how-to query
WO2014000576A1 (zh) 一种网络搜索方法及网络搜索系统
TW201214166A (en) Processing of categorized product information cross reference to other applications
KR20180126577A (ko) 관련 엔티티 탐색
JP7254925B2 (ja) 改良されたデータマッチングのためのデータレコードの字訳
US10169802B2 (en) Data refining engine for high performance analysis system and method
US8799314B2 (en) System and method for managing information map
US11886444B2 (en) Ranking search results using hierarchically organized coefficients for determining relevance
TWI547888B (zh) A method of recording user information and a search method and a server
US10817519B2 (en) Automatic conversion stage discovery
WO2019218151A1 (zh) 一种资料搜寻方法
RU2721159C1 (ru) Способ и сервер генерирования мета-признака для ранжирования документов
JP2011100302A (ja) ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム
TWI746527B (zh) 資料推薦的處理互動方法、裝置及系統
CN107423298B (zh) 一种搜索方法和装置
CN116910229A (zh) 针对指标的智能查询方法和装置
US9858291B1 (en) Detection of related local entities