TWI567673B - Sorting methods and devices for search results - Google Patents
Sorting methods and devices for search results Download PDFInfo
- Publication number
- TWI567673B TWI567673B TW102109488A TW102109488A TWI567673B TW I567673 B TWI567673 B TW I567673B TW 102109488 A TW102109488 A TW 102109488A TW 102109488 A TW102109488 A TW 102109488A TW I567673 B TWI567673 B TW I567673B
- Authority
- TW
- Taiwan
- Prior art keywords
- displayed
- user
- attribute
- sorted
- objects
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
- G06F16/3326—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本發明係有關電腦技術領域,尤其有關一種搜尋結果的排序方法和裝置。
隨著電腦網路技術的不斷發展,各個電子商務網站陸續設有自己的搜尋引擎用以提供商品搜尋服務,從而方便用戶進行商品查詢,快速地找到用戶感興趣的商品。商品搜尋與普通搜尋引擎(諸如,百度、google、bing等)的檢索方法相類似,但有其自身的特點。與普通搜尋相比,商品搜尋在搜尋結果的排序上,除了考慮與查詢詞的相關性之外,還會加入買家對商品的歷史評價、發佈商品資訊的賣家的信譽度、作弊難易度、類目相關性及商品價格等多個維度並結合用戶的個人偏好資料對各個商品對象進行綜合排序,而得到搜尋結果。
現有的搜尋結果通常係按照分頁或瀑布流的形式來予以展現,一頁或一屏顯示一定數量的商品,例如每頁40個商品,用戶可以選擇向後翻頁或翻屏來進行瀏覽。如果是分頁展現的方式,當用戶需要翻頁時,透過點擊對應的
頁碼或者向後翻頁的標籤向搜尋引擎再一次發送請求,可以瀏覽其他頁面的商品。如果是瀑布流的展現方式,會在拖拽下拉滑鼠或滑塊的時候,向搜尋引擎再一次發送請求,展現更多的網頁內容來代替原先所展現的內容。
由於現有的搜尋結果都是一次性輸出的自然搜尋結果,在切換不同頁的搜尋結果時,並不重做新的排序。搜尋結果的顯示順序與用戶的點擊或瀏覽行為沒有任何一點關係。例如,在商品搜尋時輸入查詢詞為nike,用戶在第一頁點擊了10個商品,當翻頁查看到第二頁時,第二頁顯示結果和第一頁有沒有點擊無關,並不會根據用戶行為而進行動態排序。
在現有普通的搜尋引擎中,會利用查詢詞的自然搜尋結果的第一個點擊行為作為目標網頁,再根據目標網頁基於全量的網頁與網頁之間的相似性的距離,從小到大的排序,而對自然搜尋結果進行調整,用以解決查詢詞的一意多詞和一詞多意的問題,明確用戶的查詢意圖。
普通搜尋的網頁的相似性的距離計算,不適合商品搜尋,因為商品搜尋自然結果的列表頁展現的資訊,例如標題、價格及圖片資訊會被目標頁面的商品描述、評價資訊、店舖資訊、成交記錄、促銷資訊、屬性資訊等各種資訊複合作用在一起,目標頁面的資訊已不能代表用戶點擊自然搜尋結果的資訊了,所以目標頁面與對象之間的網頁相似性並不能確切地表徵商品搜尋的結果的相似性。另外,普通搜尋的動態排序主要是最佳化查詢詞的自然結
果,用初始搜尋結果來探測查詢詞的意圖,與用戶實際意圖偏差較大,準確率和轉換率較低。
本發明的目的在於提供一種搜尋結果的排序方法和裝置,根據用戶行為來識別用戶意圖,動態地更新搜尋結果的排序,以顯示符合用戶需求的搜尋結果,使搜尋結果更準確,方便用戶快速找到所需要的內容,轉換率高。
為了實現上述目的,本發明提供了一種搜尋結果的排序方法,所述方法包括:記錄用戶對根據查詢詞所獲得的搜尋結果中的已展示對象的行為資訊;當接收到翻頁或翻屏請求時,根據用戶對已展示對象的行為資訊而確定一項或多項屬性特徵在用戶發生行為的對象的集合中的共同度;根據所述共同度而選取符合預定要求的屬性特徵作為待展示或待排序對象排序的參考指標;及對屬性特徵符合該參考指標的待展示或待排序的對象的排序進行調整。
另一方面,本發明還提供了一種搜尋結果的排序裝置,所述裝置包括:記錄單元,用以記錄用戶對根據查詢詞所獲得的搜尋結果中的已展示對象的行為資訊;計算單元,用以當接收到翻頁或翻屏請求時,根據用
戶對已展示對象的行為資訊而確定一項或多項屬性特徵在用戶發生行為的對象的集合中的共同度;選取單元,用以根據所述共同度而選取符合預定要求的屬性特徵作為待展示或待排序對象排序的參考指標;及調整單元,用以對屬性特徵符合所述選取單元選取的參考指標的待展示或待排序的對象的排序進行調整。
本發明提供的搜尋結果的排序方法和裝置,根據用戶最近的瀏覽或點擊行為來進行用戶意圖的識別,動態地更新搜尋結果的排序,以顯示符合用戶需求的搜尋結果,使搜尋結果更準確,從而使得用戶能快速地找到所需要的內容,轉換率高。
10‧‧‧記錄單元
20‧‧‧計算單元
30‧‧‧選取單元
40‧‧‧調整單元
50‧‧‧分類單元
60‧‧‧排序單元
201‧‧‧獲取子單元
202‧‧‧第一計算子單元
203‧‧‧第二計算子單元
401‧‧‧賦值子單元
402‧‧‧第三計算子單元
403‧‧‧第四計算子單元
404‧‧‧第五計算子單元
圖1為本發明實施例一所提供的搜尋結果的排序方法流程圖;圖2為本發明實施例一所提供的一種根據用戶對已展示對象的行為資訊而確定屬性特徵共同度的方法流程圖;圖3為本發明實施例一所提供的一種計算待展示或待排序的對象的排序分數值的方法流程圖;圖4為本發明實施例二所提供的搜尋結果的排序裝置示意圖。
下面透過附圖和實施例,對本發明的技術方案做進一
步的詳細描述。
本發明提供的搜尋結果的排序方法和裝置,可被使用於各類的搜尋引擎中,尤其是針對所得到搜尋結果的屬性資訊類別較多的情況,例如電子商務網站的商品搜尋等情況,在本發明的實施例中以商品搜尋為例,對商品搜尋的搜尋結果進行動態排序的處理過程進行說明。
圖1是本實施例所提供的搜尋結果的排序方法流程圖,如圖1所示,本發明的搜尋結果的排序方法包括:
步驟S101、記錄用戶對根據查詢詞所獲得的搜尋結果中的已展示對象的行為資訊。
用戶透過瀏覽器輸入查詢詞並確認後,即向搜尋引擎發起搜尋請求。搜尋引擎接收用戶的搜尋請求,對查詢詞進行分詞等處理操作,檢索得到對應的搜尋結果,並根據相關度的大小而將所述搜尋結果以分頁或分屏的形式來加以顯示。在本步驟中,可以採用現有的搜尋引擎而得到查詢詞的搜尋結果,並採用默認的排序方法來加以顯示。
所述的對象可以是商品或商品資訊。在商品搜尋中,利用查詢詞從資料庫中檢索出與該查詢詞相關的商品,並按照相關度大小進行排列顯示,商品的排列方式也可以採用其他方式,本發明對具體的顯示形式不作限定。
用戶對搜尋結果中的對象的行為包括瀏覽和點擊。根據用戶的瀏覽或點擊等行為,記錄所述搜尋結果中各對象
的行為資訊。行為資訊可以包括但不限於:用戶行為的對象、用戶行為的對象在搜尋結果頁中的位置資訊和/或用戶對行為對象的發生瀏覽或點擊的順序。本實施例中以商品搜尋為例進行說明,搜尋結果中的一個對象具體為一個商品。搜尋結果中沒有被展示過的對象即為待重新排序和待展示的對象。
根據用戶的瀏覽行為,記錄用戶瀏覽過的頁面的資訊,無論該頁面有沒有產生點擊資訊,只要被用戶瀏覽過,就進行記錄。所記錄的資訊,亦即,所述的用戶行為資訊還包括頁面的會話(session)資訊、該頁面對應的查詢詞、該頁面在搜尋結果中所處的頁碼或屏、該頁面對應的商品識別碼(id)及用戶目前行為的對象在用戶發生行為的各對象中的行為順序。
其中,會話Session是指終端用戶與交互系統進行通信的過程,通常指從用戶註冊進入系統到登出退出系統之間的過程。
具體地說,一個會話session指的就是用戶在瀏覽某個網站時,從進入網站到瀏覽器關閉所經過的這段時間,用戶使用瀏覽器在這段時間內的所有操作為同一個會話中操作。
在同一個session中,用戶可以輸入一個或多個查詢詞來進行檢索查詢,本實施例對同一個session中的同一個查詢詞或查詢片語綜合下的搜尋結果進行動態排序,第n+1頁的搜尋結果根據前n個頁面的瀏覽或點擊回饋而進
行排序。當然,在實際使用需求下,也可以對一段時間內不同session的同一個查詢詞的搜尋結果進行動態排序,例如,對同一個用戶或者同一IP位址。
同理,根據用戶的點擊行為,記錄用戶點擊過的商品,一併記錄商品被點擊的順序,亦即,用戶對該對象的行為順序。對於被用戶點擊的對象,記錄的行為資訊包括該對象對應的頁面的會話(session)資訊、該對象對應的查詢詞、該對象在搜尋結果中所處的頁面的頁碼或屏、該對象的商品識別碼(id)及該對象在用戶行為的各對象中發生點擊的順序。記錄的格式可以如(session,查詢詞,頁碼,商品id串,行為順序),表示在一個session的某個查詢詞下某一頁碼中的商品id被點擊的資訊。統計發現,用戶在query搜尋時的最後一次點擊,才是最接近用戶本意的,而非第一次點擊。一般而言,對於點擊順序越靠後的點擊,其價值越大,越符合用戶的查詢意圖。
對於儲存格式,可以將點擊的商品依次寫入商品id串中,以固定的符號進行壓縮,可以但不限於使用“棧”的資料結構。
舉個例子,假如搜尋“nike”,在第一頁,依次點擊了4個商品,一般一頁的商品數是40個,則記錄結果為:(20120324081,nike,1,auction_1:auction_3:auction_5:auction_15)
其中,第一個欄位表示會話session,例如20120324081是會話session的id,第二個欄位表示查詢詞,第三個欄位表示頁面。auction_1、auction_3、
auction_5、auction_15分別表示不同的商品id。根據上述例子的記錄,可看出第一頁展示的搜素結果中,商品id為auction_15的商品是第四個被點擊的。
步驟S102、當接收到翻頁或翻屏請求時,根據用戶對已展示對象的行為資訊而確定一項或多項屬性特徵在用戶發生行為的對象的集合中的共同度。
當用戶在同一個會話session中針對同一個查詢詞的搜尋結果列表發起的一個翻頁或翻屏請求時,搜尋引擎則獲取目前session使用的查詢詞對應的搜尋結果下用戶對已展示對象的行為資訊,根據用戶的行為資訊而確定用戶行為對象的特徵資訊。如圖2所示,根據用戶對已展示對象的行為資訊而確定預設的一項或多項屬性特徵在用戶發生行為的對象的集合中的共同度的方法具體包括如下子步驟S102_1-S102_4。
步驟S102_1、獲取已展示的對象的屬性特徵。
按照歷史選擇資訊中的相關次序,依次解析出用戶行為對象對應的商品id,並獲取該商品id對應的各項屬性特徵。所述的屬性特徵包括:商品資訊的標題、商品的價格、商品的圖片或圖片位址、最近成交筆數、運費、商品所在地域、賣家名稱及自定義標籤(例如,商品發佈方提供的服務標籤,包括:假一賠三,如實描述,7天無理由退換貨,閃電發貨,細節圖,貨到付款,消費者保障等商品或賣家的標籤)中的一種或多種資訊。由於這些商品的屬性特徵通常可以被展現在搜尋結果的列表頁面,可以直
觀地影響買家對搜尋結果的行為傾向,因而可以利用這些商品屬性特徵識別用戶的意圖。所述屬性特徵包括屬性及商品在該屬性上的屬性值或屬性值區間。
步驟S102_2、將用戶點擊過的對象歸類於已選集合,將已展示的對象中未被點擊的對象歸類於未選集合。
用戶點擊包括在搜尋結果頁中用戶選擇某一對象點擊而進入該對象的詳情頁面的操作行為。用戶點擊也可以是包括在搜尋結果頁中用戶選擇某一對象使其展開詳細描述資訊的操作行為。
當用戶選擇搜尋結果的某一列表頁時,在該列表頁展示的對象通常是用戶可以獲取或瀏覽的對象。用戶選擇獲得該列表頁後,該列表頁展示的對象視為用戶已經瀏覽的對象。
將所有被瀏覽過的商品(亦即,已展示的對象)分為兩個集合:已選集合和未選集合,已選集合中的商品是被瀏覽過且被點擊過的商品,未選集合中的則是被瀏覽過但未被點擊過的商品。
需要說明的是,步驟S102_1和步驟S102_2的先後順序可以調換。
步驟S102_3、根據所述已選集合中的對象所具有的各項屬性特徵而計算每一個屬性特徵在已選集合中的共同度。
步驟S102_4、根據所述未選集合中的對象所具有的各項屬性特徵而計算所述屬性特徵在未選集合中的共同
度。
某一項屬性特徵在所述已選集合或未選集合中的共同度具體為:在所述已選集合或未選集合中,具有相同或相似的所述屬性特徵的對象的個數與所述已選集合或未選集合中對象的總數的比值,亦即,所述屬性特徵對應的屬性上具有相同或相似的屬性值的對象的個數與所述已選集合或未選集合中對象的總數的比值。
所述屬性的屬性值相似的情形包括:多個對象在該屬性上的屬性值在相同的預設區間內。
由於圖片是影響點擊的主要因素之一,但每個商品的圖片很難有共同度,因而將屬性特徵分為圖片屬性特徵和非圖片屬性特徵。圖片屬性的屬性值可以使用商品的圖片的特徵值表示。
對於非圖片屬性特徵的共同度的計算,將商品的非圖片屬性特徵的屬性值數值化或分組離散化。例如,可以利用統計的方法,將價格、成交筆數、信用等屬性,按照一定規則來進行分組,例如對價格屬性可以分為(0,50)、(50,100]及(100-150]三個屬性值區間等等,將每個商品在價格屬性上的屬性值劃分到相應區間。透過對商品各項屬性的數值化和分組可以將所有的屬性特徵分組離散化。如果被點擊的商品大多符合某一屬性的同一個屬性值區間,則該該屬性及屬性值對形成的屬性特徵在被點擊商品中的共同度較大。
繼續參見圖1,步驟S103、根據所述共同度而選取符
合預定要求的屬性特徵作為待展示或排序對象排序的參考指標。
選取符合預定要求的屬性特徵作為待展示或排序對象(亦即,未展示對象)排序的參考指標的方法可以包括如下方式中的一種或多種:對各項屬性特徵按共同度從大到小依次排序,選取預定數量的排序在前的屬性特徵作為參考指標。
或者,將共同度大於設定閾值的屬性特徵作為參考指標。
或者,先計算各項屬性特徵在所述已選集合和所述未選集合中的共同度之差,將所述共同度之差大於設定閾值時對應的屬性特徵作為參考指標。
或者,先計算各項屬性特徵在所述已選集合和所述未選集合中的共同度之差,按所述共同度之差對所述屬性特徵從大到小依次排序,選取預定數量的排序在前的屬性特徵作為參考指標。
如果一個屬性特徵在已選集合中有較高共同度,亦即,在用戶點擊過的商品集合中屬性特徵具有較高共同度,表示屬性特徵很可能時用戶選擇商品的參考因素;同時,如果該屬性特徵在未選集合中的共同度越低,該屬性特徵在已選集合和未選集合中的共同度的差值就較越大,表示該屬性特徵對用戶的選擇商品產生影響的可能性就越大,則可以將該屬性特徵作為未展示頁面中的商品的動態排序的參考指標。可以理解的,參考指標可以被用來區分
用戶意圖。
本實施例的動態排序可以綜合考慮屬性特徵在已選集合和未選集合的共同度之差,選出在已選集合中共同度高且在未選集合中不存在該屬性特徵或者共同度低的屬性作為參考指標。
需要說明的是,步驟S102_2並不是必須的步驟,在用戶點擊的數量較少時,例如只點擊1-2個商品,則可以不考慮未選集合。相應地,步驟S102_1可以僅根據所述對象的點擊順序,依次獲取所點擊的對象的各個屬性及其屬性值。
步驟S104、根據所述參考指標而計算待展示或待排序的對象各自的排序分數值。
根據共同度確定出參考指標。例如,根據各項屬性特徵在已選集合中的共同度確定出的參考指標的集合表示為(A1,A2,A3)。根據各項屬性特徵在未選集合中的共同度確定的參考指標的集合表示為(B1,B2,B3)。
對於待排序的對象,利用參考指標來進行排序分數值調整,將符合參考指標A1、A2和/或A3的對象進行加分,對符合參考指標B1、B2和/或B3的對象進行降分;亦即,對符合從已選集合中確定出的參考指標的未展示或待排序對象進行排序分數值的加分或給予正的排序分數值,對符合從未選集合中確定出的參考指標的未展示或待排序對象進行排序分數值的減分或給予負的排序分數值。
計算待展示或待排序的對象各自的排序分數值可以同
時考慮依照自然排序規則所得到的每一個對象的排序分數值,亦即,根據所述參考指標在依照自然排序規則所得到的排序分數值上做加分或減分。所述的自然排序規則可以為展示搜尋結果列表的首頁或首屏時採用的排序規則。
可以理解地,為了確保符合從已選集合中確定出的參考指標的對象能優先展示,計算待展示或待排序的對象各自的排序分數值時,符合從已選集合中確定出的參考指標的未展示或待排序對象的排序分數值也可以是在依照自然排序規則得到的未展示或待排序對象的最大排序分數值的基礎上做加分後的分數值。
此外,考慮到用戶在已展示對象上的選擇順序對於用戶意圖的影響,在本申請案的具體實施例中步驟S104包括步驟S104_1-S104_4,如圖3所示。用戶在已展示對象上的選擇順序,亦即,用戶在已展示的搜尋結果列表中發生於對象上的點擊順序。
步驟S104_1、根據所述點擊順序而為用戶在已展示對象中所點擊的對象賦予第一權重。
由於點擊順序越靠後,其價值越大,就越符合用戶的查詢意圖,因而根據點擊順序為被點擊的商品賦予不同的第一權重,例如可以直接將順序的名次作為第一權重,如果商品是第一個被點擊,則該商品的第一權重為V1,第二個被點擊的商品的第一權重為V2,依次類推,第n個被點擊的商品的第一權重為Vn。依照商品被點擊的順序,各被點擊商品的第一權重依次增大,亦即,V1<V2…
<Vn。
步驟S104_2、根據用戶所選擇的對象中符合參考指標的對象的權重而計算每一個參考指標的權重。
用戶選擇的對象(亦即,點擊的對象)的數量為n,n為自然數。這些用戶選擇的對象對用戶查詢意圖的影響的權重依次為V1、V2、…Vn。對於某一項參考指標,計算符合該參考指標的被選擇的對象的權重的和,記作Vm。將符合該參考指標的被選擇的對象的權重的和與用戶選擇的對象的權重的總和的比值作為該參考指標的權重,亦即,參考指標對用戶查詢意圖的影響的權重,記作Q。亦即,Q=Vm/(V1+V2+…Vn)。
例如,用戶針對查詢詞為nike的第一頁搜尋結果,依次點擊了第1、3、5和15個商品,記錄為(20120324081,nike,1,auction_1:auction_3:auction_5:auction_15),第1、3、5和15個商品對應的第一權重分別為1、2、3和4。根據該用戶行為確定的某一參考指標包括商品相關標籤這一屬性及對應的屬性值“假一賠三”。在搜尋結果列表中的第1、5和15個商品具有商品相關標籤這一個屬性,且該商品相關標籤具有“假一賠三”這一個屬性值,即符合該參考指標。則該參考指標的權重為(1+3+4)/(1+2+3+4)=0.8。
對於圖片特徵的計算,可以選擇在離線情況下,將商品的圖片轉換為圖片的特徵值,以數值型的形式來表示圖片,數值越接近,則表明圖片越相似。
步驟S104_3、計算待展示或待排序的對象符合的參考指標對該對象排序的影響程度的綜合分數。
待排序對象可能符合多個參考指標,可以為每一個參考指標分別預先配置指標分數。根據已選集合確定的參考指標的指標分數為正值,比如分數值“1”;根據未選集合確定的參考指標的指標分數為負值,比如分數值“-1”。待排序的對象符合的參考指標對排序的影響程度的綜合分數值每一個參考指標的指標分數與權重的乘積的和。
待排序的對象符合的參考指標對待排序的對象的影響程度的綜合分數的計算公式如下:f(auction_id)=T1*Q1+T2*Q2...+Tn*Qn
其中,f(auction_id)表示待排序的對象符合的參考指標對待排序對象的排序的影響程度的綜合分數。Tn為第n個參考指標的指標分數,Qn為第n個參考指標的權重。對於根據已選集合確定的參考指標,其指標分數為固定的正值,也可以分別為不同的預設值。對於根據未選集合確定的參考指標,其指標分數可以為固定的負值,也可以分別為預設的不同的負值。
對於每一個點擊圖片,根據圖片的特徵值而計算待排序商品的圖片與該點擊圖片的相似度,並設定一個圖片相似度閾值,判斷計算得到的相似度是否大於預設圖片相似度閾值,並選取前N3個,N3為任意正整數。對於每一個頁面顯示40個商品,N3也可以設定為40,選取待排序商品的圖片與該點擊圖片相似度排在前40個的商品,存為
(auction_id,auc_list)。其中,auc_list是商品的列表,按照相似度的大小順序而排列,出現在auc_list的第一個商品,則在圖片特徵上該商品與被點擊商品最相似。
如果用戶的點擊行為中包括多個被點擊的商品,則針對每一個被點擊的商品,確定一個待排序商品的商品列表。如果一個待排序商品存在於某一商品列表中,則將該待排序商品與該被點擊商品的相似度加權到f(auction_id)中。如果不存在,則不加權。
步驟S104_4、根據待展示或待排序的對象符合的參考指標對該對象排序的影響程度的綜合分數來調整待展示或待排序的對象的排序分數值。
f(auction_id)為正值時,參考指標待展示或待排序的對象的排序分數值的調整為正向調整,亦即,提升該對象排序。
f(auction_id)為負值時,參考指標待展示或待排序的對象的排序分數值的調整為負向調整,亦即,降低該對象排序。
步驟S105、根據調整後待展示或待排序的對象的排序分數值而對待展示或待排序的對象進行重新排序。
若f(auction_id)<0,則表示商品要被降冪,則在該商品原有的排序分數值的基礎上加上f(auction_id)即為調整後的排序分數值;如果f(auction_id)>0,則表示商品要被提序,在該商品原有的排序分數值的基礎上加上f(auction_id)得到調整後的排序分數值。
這樣,根據用戶的行為特徵可以對待排序商品進行動態調整,第n+1頁的搜尋結果會根據前n個頁面的點擊回饋而進行排序。
可選地,本發明在進行排序分數值調整時,還可以加入用戶在一段時間內的瀏覽行為或點擊回饋行為,例如瀏覽了哪些商品,哪些店舖,哪些類目,收藏哪些商品,基於歷史偏好的統計,提取出共有的屬性特徵,以動態影響排序分數值。
以上是對本發明所提供的搜尋結果的排序方法進行的詳細描述,下面對本發明提供的搜尋結果的排序裝置進行詳細描述。
圖4是本實施例提供的搜尋結果的排序裝置示意圖,如圖4所示,本發明的排序裝置包括:記錄單元10、計算單元20、選取單元30、調整單元40、分類單元50和排序單元60。
記錄單元10用以記錄用戶對根據查詢詞所獲得的搜尋結果中的已展示對象的行為資訊。
用戶透過瀏覽器來輸入查詢詞並確認後,即向搜尋引擎發起搜尋請求。搜尋引擎接收用戶的搜尋請求,對查詢詞進行分詞等處理操作,檢索得到對應的搜尋結果,並根據相關度的大小而將所述搜尋結果以分頁或分屏的形式來加以顯示。可以利用現有的搜尋引擎而得到查詢詞的搜尋
結果,並採用默認的排序方法來加以顯示,本發明是在利用已有的搜尋引擎所產生的搜尋結果的基礎上進行動態排序的。
所述的對象可以是商品或商品資訊。在商品搜尋中,檢索單元10利用查詢詞從資料庫中所檢索出與該查詢詞相關的商品,並按照相關度大小進而行排列顯示,商品的排列方式可以,本發明對具體顯示形式不作限定。
用戶對搜尋結果中的對象的行為包括瀏覽和點擊。記錄單元10根據用戶的瀏覽或點擊等行為,記錄所述搜尋結果中各對象的行為資訊,當接收到同一個查詢詞的翻頁或翻屏請求時,觸發計算單元20。行為資訊可以包括但不限於:用戶行為的對象,以及用戶行為的對象在搜尋結果頁中的位置資訊和/或用戶對行為對象的發生瀏覽或點擊的順序。本實施例中以商品搜尋為例來進行說明,搜尋結果中的一個對象具體為一個商品。搜尋結果中沒有被展示過的對象即為待重新排序和待展示的對象。
記錄單元10根據用戶的瀏覽行為,記錄用戶瀏覽過的頁面的資訊,無論該頁面有沒有產生點擊資訊,只要被用戶瀏覽過,就進行記錄。所記錄的資訊,亦即,所述的用戶行為資訊還包括頁面的會話(session)資訊、該頁面對應的查詢詞、該頁面在搜尋結果中所處的頁碼或屏、該頁面對應的商品識別碼(id)及用戶目前行為的對象在用戶發生行為的各對象中的行為順序。
其中,會話Session是指終端用戶與交互系統進行通
信的過程,通常指從用戶註冊進入系統到登出退出系統之間的過程。
具體地說,一個會話session指的就是用戶在瀏覽某個網站時,從進入網站到瀏覽器關閉所經過的這段時間,用戶使用瀏覽器在這段時間內的所有操作為同一個會話中操作。
在同一個session中,用戶可以輸入一個或多個查詢詞來進行檢索查詢,本實施例對同一個session中的同一個查詢詞或查詢片語綜合下的搜尋結果進行動態排序,第n+1頁的搜尋結果根據前n個頁面的瀏覽或點擊回饋而進行排序。當然,在實際使用需求下,也可以對一段時間內不同session的同一個查詢詞的搜尋結果進行動態排序,例如,對同一個用戶或者同一個IP位址。
同理,記錄單元10根據用戶的點擊行為,記錄用戶點擊過的商品,一併記錄商品被點擊的順序,亦即,用戶對該對象的行為順序。對於被用戶點擊的對象,記錄的行為資訊包括該對象對應的頁面的會話(session)資訊、該對象對應的查詢詞、該對象在搜尋結果中所處的頁面的頁碼或屏、該對象的商品識別碼(id)及該對象在用戶行為的各對象中發生點擊的順序。記錄的格式可以如(session,查詢詞,頁碼,商品id串,行為順序),表示在一個session的某個查詢詞下某一頁碼中的商品id被點擊的資訊。統計發現,用戶在query搜尋時的最後一次點擊,才是最接近用戶本意的,而非第一次點擊。一般而
言,對於點擊順序越靠後的點擊,其價值越大,越符合用戶的查詢意圖。
對於儲存格式,記錄單元10可以將點擊的商品依次寫入商品id串中,以固定的符號來進行壓縮,可以但不限於使用“棧”的資料結構。
舉個例子,假如搜尋“nike”,在第一頁,依次點擊了4個商品,一般一頁的商品數是40個,則記錄結果為:(20120324081,nike,1,auction_1:auction_3:auction_5:auction_15)
其中,第一個欄位表示會話session,例如20120324081是會話session的id,第二個欄位表示查詢詞,第三個欄位表示頁面。auction_1、auction_3、auction_5、auction_15分別表示不同的商品id。根據上述例子的記錄,可看出第一頁展示的搜素結果中,商品id為auction_15的商品是第四個被點擊的。
當記錄單元10接收到用戶在同一個會話session中針對同一個查詢詞發起的一個翻頁或翻屏請求時,觸發計算單元20。
計算單元20用以根據用戶對已展示對象的行為資訊而確定一項或多項屬性特徵在用戶發生行為的對象的集合中的共同度。
當受到記錄單元10的觸發時,計算單元20獲取目前session使用的查詢詞對應的搜尋結果下用戶對已展示對象的行為資訊,根據用戶的行為資訊而確定用戶行為的特徵資訊。
分類單元50與計算單元20相連接,用以將用戶點擊過的對象歸類於已選集合,將已展示的對象中未被點擊的對象歸類於未選集合。
用戶點擊包括在搜尋結果頁中用戶選擇某一對象點擊而進入該對象的詳情頁面的操作行為。用戶點擊也可以是包括在搜尋結果頁中用戶選擇某一對象使其展開詳細描述資訊的操作行為。
當用戶選擇搜尋結果的某一列表頁時,在該列表頁展示的對象通常是用戶可以獲取或瀏覽的對象。用戶選擇獲得該列表頁後,該列表頁展示的對象視為用戶已經瀏覽的對象。
將所有被瀏覽過的商品(亦即,已展示的對象)分為兩個集合:已選集合和未選集合,已選集合中的商品是被瀏覽過且被點擊過的商品,未選集合中的則是被瀏覽過但未被點擊過的商品。
當然,分類單元50也可以僅用以將在搜尋結果中被點擊的對象歸類於已選集合,或者,也可以僅用以將將在搜尋結果中已展示且未被點擊的對象歸類於未選集合。
計算單元20包括獲取子單元201、第一計算子單元202、和第二計算子單元203。
獲取子單元201用以獲取已展示的對象的屬性特徵。
按照歷史選擇資訊中的相關次序,依次解析出用戶行為對象對應的商品id,並獲取該商品id對應的各項屬性特徵。所述的屬性特徵包括:商品資訊的標題、商品的價
格、商品的圖片或圖片位址、最近成交筆數、運費、商品所在地域、賣家名稱及自定義標籤(例如,商品發佈方提供的服務標籤,包括:假一賠三,如實描述,7天無理由退換貨,閃電發貨,細節圖,貨到付款,消費者保障等商品或賣家的標籤)中的一種或多種資訊。由於這些商品的屬性特徵通常可以展現在搜尋結果的列表頁面,可以直觀地影響買家對搜尋結果的行為傾向,因而可以利用這些商品屬性特徵識別用戶的意圖。所述屬性特徵包括屬性及商品在該屬性上的屬性值或屬性值區間。
第一計算子單元202用以根據所記錄的用戶對已展示對象的行為資訊而計算每一個屬性特徵在已選集合中的共同度。
第二計算子單元203用以根據所述未選集合中的對象所具有的各項屬性特徵而計算所述屬性特徵在未選集合中的共同度。
某一項屬性特徵在所述已選集合或未選集合中的共同度具體為:在所述已選集合或未選集合中,具有相同或相似的所述屬性特徵的對象的個數與所述已選集合或未選集合中對象的總數的比值,亦即,所述屬性特徵對應的屬性上具有相同或相似的屬性值的對象的個數與所述已選集合或未選集合中對象的總數的比值。
所述屬性的屬性值相似的情形包括:多個對象在該屬性上的屬性值在相同的預設區間內。
由於圖片是影響點擊的主要因素之一,但每個商品的
圖片很難有共同度,因而將屬性特徵分為圖片屬性特徵和非圖片屬性特徵。圖片屬性的屬性值可以使用商品的圖片的特徵值來予以表示。
對於非圖片屬性特徵的共同度的計算,將商品的非圖片屬性特徵的屬性值數值化或分組離散化。例如,可以利用統計的方法,將價格、成交筆數、信用等屬性,按照一定規則來進行分組,例如對價格屬性可以分為(0,50]、(50,100]及(100-150]三個屬性值區間等等,將每個商品在價格屬性上的屬性值劃分到相應區間。透過對商品各項屬性的數值化和分組可以將所有的屬性特徵分組離散化。如果被點擊的商品大多符合某一屬性的同一個屬性值區間,則該該屬性及屬性值對形成的屬性特徵在被點擊商品中的共同度較大。
選取單元30用以根據所述共同度而選取符合預定要求的屬性特徵作為待展示或排序對象排序的參考指標。
選取單元30選取符合預定要求的屬性特徵作為待展示或排序對象(亦即,未展示對象)排序的參考指標的方法可以包括如下方式中的一種或多種:對各項屬性特徵按共同度從大到小依次排序,選取預定數量的排序在前的屬性特徵作為參考指標。
或者,將共同度大於設定閾值的屬性特徵作為參考指標。
或者,先計算各項屬性特徵在所述已選集合和所述未選集合中的共同度之差,將所述共同度之差大於設定閾值
時對應的屬性特徵作為參考指標。
或者,先計算各項屬性特徵在所述已選集合和所述未選集合中的共同度之差,按所述共同度之差對所述屬性特徵從大到小依次排序,選取預定數量的排序在前的屬性特徵作為參考指標。
如果一個屬性特徵在已選集合中有較高共同度,亦即,在用戶點擊過的商品集合中屬性特徵具有較高共同度,表示屬性特徵很可能時用戶選擇商品的參考因素;同時,如果該屬性特徵在未選集合中的共同度越低,該屬性特徵在已選集合和未選集合中的共同度的差值就較越大,表示該屬性特徵對用戶的選擇商品產生影響的可能性就越大,則可以將該屬性特徵作為未展示頁面中的商品的動態排序的參考指標。可以理解的,參考指標可以被用來於區分用戶意圖。
本實施例的動態排序可以綜合考慮屬性特徵在已選集合和未選集合的共同度之差,選出在已選集合中共同度高且在未選集合中不存在該屬性特徵或者共同度低的屬性作為參考指標。
需要說明的是,計算單元20也可以不設置分類單元50,在用戶點擊的數量較少時,例如只點擊1-2個商品,則可以不考慮未選集合。相應地,採用第一計算子單元202來進行計算,根據所有的所述選擇的對象具有的屬性特徵或對應的所述屬性特徵值而計算所述屬性特徵各自的共同度。選取單元30將所述共同度滿足要求的屬性特徵
作為所述關鍵特徵。
排序單元40用以根據所述參考指標而計算待展示或待排序的對象各自的排序分數值。
選取單元30根據共同度而確定出參考指標。例如,根據各項屬性特徵在已選集合中的共同度確定出的參考指標的集合係表示為(A1,A2,A3)。根據各項屬性特徵在未選集合中的共同度確定的參考指標的集合係表示為(B1,B2,B3)。
排序單元40對於待排序的對象,利用參考指標來進行排序分數值調整,將符合參考指標A1、A2和/或A3的對象進行加分,對符合參考指標B1、B2和/或B3的對象進行降分;亦即,對符合從已選集合中確定出的參考指標的未展示或待排序對象進行排序分數值的加分或給予正的排序分數值,對符合從未選集合中確定出的參考指標的未展示或待排序對象進行排序分數值的減分或給予負的排序分數值。
排序單元40計算待展示或待排序的對象各自的排序分數值可以同時考慮依照自然排序規則所得到的每一個對象的排序分數值,亦即,根據所述參考指標而在依照自然排序規則得到的排序分數值上做加分或減分。所述的自然排序規則可以為展示搜尋結果列表的首頁或首屏時採用的排序規則。
可以理解地,為了確保符合從已選集合中確定出的參考指標的對象能優先展示,排序單元40計算待展示或待
排序的對象各自的排序分數值時,符合從已選集合中確定出的參考指標的未展示或待排序對象的排序分數值也可以是在依照自然排序規則得到的未展示或待排序對象的最大排序分數值的基礎上做加分後的分數值。
此外,考慮到用戶在已展示對象上的選擇順序對於用戶意圖的影響,在本申請案的具體實施例中排序單元40還包括:賦值子單元401、第三計算子單元402、第四計算子單元403和第五計算子單元404。用戶在已展示對象上的選擇順序,亦即,用戶在已展示的搜尋結果列表中發生於對象上的點擊順序。
賦值子單元401用以根據點擊順序而為用戶在已展示對象中所點擊的對象賦予第一權重。
由於點擊順序越靠後,其價值越大,就越符合用戶的查詢意圖,因而根據點擊順序為被點擊的商品賦予不同的第一權重,例如可以直接將順序的名次作為第一權重,如果商品是第一個被點擊的,則該商品的第一權重為V1,第二個被點擊的商品的第一權重為V2,依次類推,第n個被點擊的商品的第一權重為Vn。依照商品被點擊的順序,各被點擊商品的第一權重依次增大,亦即,V1<V2…<Vn。
第三計算子單元402用以根據用戶所選擇的對象中符合參考指標的對象的第一權重而計算每一個參考指標的權重。
用戶選擇的對象(亦即,點擊的對象)的數量為n,
n為自然數。這些用戶選擇的對象對用戶查詢意圖的影響的權重依次為V1、V2、…Vn。對於某一項參考指標,計算符合該參考指標的被選擇的對象的權重的和,記作Vm。將符合該參考指標的被選擇的對象的權重的和與用戶選擇的對象的權重的總和的比值作為該參考指標的權重,亦即,參考指標對用戶查詢意圖的影響的權重,記作Q。亦即,Q=Vm/(V1+V2+…Vn)。
例如,用戶針對查詢詞為nike的第一頁搜尋結果,依次點擊了第1、3、5和15個商品,記錄為(20120324081,nike,1,auction_1:auction_3:auction_5:auction_15),第1、3、5和15個商品對應的第一權重分別為1、2、3和4。第三計算子單元402根據該用戶行為確定的某一參考指標包括商品相關標籤這一屬性及對應的屬性值“假一賠三”。在搜尋結果列表中的第1、5和15個商品具有商品相關標籤這一個屬性,且該商品相關標籤具有“假一賠三”這一個屬性值,即符合該參考指標。則該參考指標的權重為(1+3+4)/(1+2+3+4)=0.8。
對於圖片特徵的計算,第三計算子單元402選擇在離線情況下,將商品的圖片轉換為圖片的特徵值,以數值型的形式來表示圖片,數值越接近,則表明圖片越相似。
第四計算子單元403用以根據待展示或待排序的對象的屬性特徵所符合的參考指標的權重,計算該參考指標對該對象排序的影響程度的綜合分數。
待排序對象可能符合多個參考指標,可以為每一個參
考指標分數別預先配置指標分數。根據已選集合確定的參考指標的指標分數為正值,比如分數值“1”;根據未選集合確定的參考指標的指標分數為負值,比如分數值“-1”。待排序的對象符合的參考指標對排序的影響程度的綜合分數值每一個參考指標的指標分數與權重的乘積的和。
第四計算子單元403採用待排序的對象符合的參考指標對待排序的對象的影響程度的綜合分數的計算公式如下:f(auction_id)=T1*Q1+T2*Q2...+Tn*Qn
其中,f(auction_id)表示待排序的對象符合的參考指標對待排序對象的排序的影響程度的綜合分數。Tn為第n個參考指標的指標分數,Qn為第n個參考指標的權重。對於根據已選集合確定的參考指標,其指標分數為固定的正值,也可以分別為不同的預設值。對於根據未選集合確定的參考指標,其指標分數可以為固定的負值,也可以分別為預設的不同的負值。
對於每一個點擊圖片,第四計算子單元403根據圖片的特徵值而計算待排序商品的圖片與該點擊圖片的相似度,並設定一個圖片相似度閾值,判斷計算得到的相似度是否大於預設圖片相似度閾值,並選取前N3個,N3為任意正整數。對於每一個頁面顯示40個商品,N3也可以設定為40,選取待排序商品的圖片與該點擊圖片相似度排在前40個的商品,存為(auction_id,auc_list)。其中,auc_list是商品的列表,按照相似度的大小順序而排列,
出現在auc_list的第一個商品,則在圖片特徵上該商品與被點擊商品最相似。
如果用戶的點擊行為中包括多個被點擊的商品,第四計算子單元403則針對每一個被點擊的商品,確定一個待排序商品的商品列表。如果一個待排序商品存在於某一商品列表中,則將該待排序商品與該被點擊商品的相似度加權到f(auction_id)中。如果不存在,則不加權。
第五計算子單元404用以根據該綜合分數來調整該對象的排序分數值。
第五計算子單元404根據待展示或待排序的對象符合的參考指標對該對象排序的影響程度的綜合分數來調整待展示或待排序的對象的排序分數值。
f(auction_id)為正值時,參考指標待展示或待排序的對象的排序分數值的調整為正向調整,亦即,提升該對象排序。
f(auction_id)為負值時,參考指標待展示或待排序的對象的排序分數值的調整為負向調整,亦即,降低該對象排序。
排序單元60用以根據調整後待展示或待排序的對象的排序分數值而對待展示或待排序的對象進行重新排序。
若f(auction_id)<0,則表示商品要被降冪,則在該商品原有的排序分數值的基礎上加上f(auction_id)即為調整後的排序分數值;如果f(auction_id)>0,則表示商品要被提序,在該商品原有的排序分數值的基礎上加上f
(auction_id)得到調整後的排序分數值。
這樣,根據用戶的行為特徵可以對待排序商品進行動態調整,第n+1頁的搜尋結果會根據前n個頁面的點擊回饋而進行排序。
可選地,本發明在進行排序分數值調整時,還可以加入用戶在一段時間內的瀏覽行為或點擊回饋行為,如瀏覽了哪些商品,哪些店舖,哪些類目,收藏哪些商品,基於歷史偏好的統計,提取出共有的屬性特徵,以動態影響排序分數值。
本發明提供的排序方法和裝置,根據綜合排序的前面的點擊回饋行為,以動態更新後續頁面的搜尋排序,用以最佳化查詢詞搜尋結果的排序,可以符合用戶的需要,使用戶能快速地找到所需要的內容,從而提高用戶從瀏覽到成交的轉換率。
專業人員應該還可以進一步意識到,結合本文中所揭示的實施例描述的各示例的單元及演算法步驟,能夠以電子硬體、電腦軟體或者二者的結合來予以實現,為了清楚地說明硬體和軟體的可互換性,在上述說明中已經按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬體還是軟體方式來予以執行,取決於技術方案的特定應用和設計約束條件。專業技術人員可以對每個特定的應用而使用不同方法來實現所描述的功能,但是這種實現不應視為超出本發明的範圍。
結合本文中所揭示的實施例描述的方法或演算法的步
驟可以用硬體、處理器執行的軟體模組,或者二者的結合來予以實施。軟體模組可以被置於隨機記憶體(RAM)、記憶體、唯讀記憶體(ROM)、電氣可編程ROM、電氣可擦除可編程ROM、暫存器、硬碟、可移動磁碟片、CD-ROM、或技術領域內所公知的任意其他形式的儲存媒體中。
以上所述的具體實施方式,對本發明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發明的具體實施方式而已,並非用來限定本發明的保護範圍,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應被包含在本發明的保護範圍之內。
Claims (13)
- 一種搜尋結果的排序方法,其特徵在於,該方法包括:記錄用戶對根據查詢詞所獲得的搜尋結果中的已展示對象的行為資訊,其中,該已展示對象係有關商品或商品資訊;當接收到翻頁或翻屏請求時,根據用戶對已展示對象的行為資訊而確定一項或多項屬性特徵在用戶發生行為的對象的集合中的一項或多項共同度,其中,該一項或多項共同度包含商品的標題、商品的價格、商品的圖片或圖片位址、商品的最近成交筆數、商品的運費、商品所在地域、商品的賣家名稱、由商品發佈方提供的自定義標籤、由商品發佈方提供的服務標籤、或其任何組合,且其中,該一項或多項共同度的該確定包括:根據所記錄之用戶對已展示對象的行為資訊而計算對象的屬性特徵在已選集合中的第一共同度,其中,該已選集合包含已展示對象之用戶選取的對象、有關具有用戶選取的對象之相同或相似屬性特徵的多個對象的第一共同度、和用戶選取的對象的總數;以及計算對象的屬性特徵在未選集合中的第二共同度,其中,該未選集合包含未曾被選取的展示對象、有關具有未曾被選取的展示對象之相同或相似屬性特徵的多個對象的第二共同度、和未曾被選取之展示對象的總數;根據該共同度而選取符合預定要求的屬性特徵作為待 展示或待排序對象排序的參考指標;及對屬性特徵符合該參考指標的待展示或待排序的對象的排序進行調整,其中,該待展示或待排序的對象尚未被展示並且與已展示的對象分開。
- 根據申請專利範圍第1項所述的搜尋結果的排序方法,其中,根據該共同度而選取符合預定要求的屬性特徵作為待展示或待排序對象排序的參考指標,具體包括:對各項屬性特徵按共同度從大到小依次排序,選取預定數量的排序在前的屬性特徵作為參考指標或將共同度大於設定閾值的屬性特徵作為參考指標。
- 根據申請專利範圍第1項所述的搜尋結果的排序方法,其中,根據該共同度而選取符合預定要求的屬性特徵作為待展示或待排序對象排序的參考指標,具體包括:計算各項屬性特徵在該已選集合和該未選集合中的共同度之差,對各項屬性特徵按在該已選集合和該未選集合中的該一項或多項共同度之差而從大到小的順序依次排序,選取預定數量的排序在前的屬性特徵作為參考指標或將該共同度之差大於設定閾值時對應的屬性特徵作為參考指標。
- 根據申請專利範圍第1項所述的搜尋結果的排序方法,其中,該用戶發生行為的對象為在搜尋結果中被選取的對象;將在搜尋結果中被選取的對象歸類於已選集合;該對屬性特徵符合該參考指標的待展示或待排序的對 象的排序進行調整的步驟包括:根據用戶對已選集合中的對象的行為資訊而計算每一個屬性特徵在已選集合中的共同度;選擇該共同度大於預設閾值的屬性特徵作為參考指標;及對屬性特徵符合該參考指標的待展示或待排序的對象的排序進行提升。
- 根據申請專利範圍第1項所述的搜尋結果的排序方法,其中,該用戶發生行為的對象為在搜尋結果中被選取的對象;將在搜尋結果中被選取的對象歸類於已選集合;該對屬性特徵符合該參考指標的待展示或待排序的對象的排序進行調整的步驟包括:根據用戶對已選集合中的對象的行為資訊而計算每一個屬性特徵在已選集合中的共同度;對各項屬性特徵按共同度從大到小依次排序,選取預定數量的排序在前的屬性特徵作為參考指標;及對屬性特徵符合該參考指標的待展示或待排序的對象的排序進行提升。
- 根據申請專利範圍第1項所述的搜尋結果的排序方法,其中,該用戶發生行為的對象為在搜尋結果中被選取的對象;該方法還包括:將在搜尋結果中已展示且未被選取的對象歸類於未選集合; 該對屬性特徵符合該參考指標的待展示或待排序的對象的排序進行調整的步驟包括:根據用戶對未選集合中的對象的行為資訊而計算每一個屬性特徵在未選集合中的共同度;選擇該共同度大於預設閾值的屬性特徵作為參考指標;及對屬性特徵符合該參考指標的待展示或待排序的對象的排序進行降冪。
- 根據申請專利範圍第1項所述的搜尋結果的排序方法,其中,該用戶發生行為的對象為在搜尋結果中被選取的對象;該方法還包括:將在搜尋結果中已展示且未被選取的對象歸類於未選集合;該對屬性特徵符合該參考指標的待展示或待排序的對象的排序進行調整的步驟包括:根據用戶對未選集合中的對象的行為資訊而計算每一個屬性特徵在未選集合中的共同度;對各項屬性特徵按共同度從大到小依次排序,選取預定數量的排序在前的屬性特徵作為參考指標;及對屬性特徵符合該參考指標的待展示或待排序的對象的排序進行降冪。
- 根據申請專利範圍第1項所述的搜尋結果的排序方法,其中,該方法還包括:根據該參考指標而計算待展示或待排序的對象各自的 排序分數值;該對屬性特徵符合該參考指標的待展示或待排序的對象的排序進行調整具體為:根據該排序分數值而對待展示或待排序的對象重新進行排序;其中,根據該參考指標而計算待展示或待排序的對象各自的排序分數值,具體包括:根據選取順序為用戶在已展示對象中所選取的對象賦予第一權重;根據用戶所選擇的對象中符合參考指標的對象的第一權重而計算每一個參考指標的權重;根據待展示或待排序的對象的屬性特徵所符合的參考指標的權重,計算該參考指標對該對象排序的影響程度的綜合分數;及根據該綜合分數而調整該對象的排序分數值。
- 一種搜尋結果的排序裝置,其特徵在於,該裝置包括:記錄單元,用以記錄用戶對根據查詢詞所獲得的搜尋結果中的已展示對象的行為資訊,其中,該已展示對象係有關商品或商品資訊;計算單元,用以當接收到翻頁或翻屏請求時,根據用戶對已展示對象的行為資訊而確定一項或多項屬性特徵在用戶發生行為的對象的集合中的一項或多項共同度,其中,該一項或多項共同度包含商品的標題、商品的價格、商品的圖片或圖片位址、商品的最近成交筆數、商品的運 費、商品所在地域、商品的賣家名稱、由商品發佈方提供的自定義標籤、由商品發佈方提供的服務標籤、或其任何組合,且其中,該計算單元具體包括:第一計算子單元,根據所記錄之用戶對已展示對象的行為資訊而計算對象的屬性特徵在已選集合中的第一共同度,其中,該已選集合包含已展示對象之用戶選取的對象、有關具有用戶選取的對象之相同或相似屬性特徵的多個對象的第一共同度、和用戶選取的對象的總數;以及第二計算子單元,計算對象的屬性特徵在未選集合中的第二共同度,其中,該未選集合包含未曾被選取的展示對象、有關具有未曾被選取的展示對象之相同或相似屬性特徵的多個對象的第二共同度、和未曾被選取之展示對象的總數;選取單元,用以根據該共同度而選取符合預定要求的屬性特徵作為待展示或待排序對象排序的參考指標;及調整單元,用以對屬性特徵符合該選取單元選取的參考指標的待展示或待排序的對象的排序進行調整,其中,該待展示或待排序的對象尚未被展示並且與已展示的對象分開。
- 根據申請專利範圍第9項所述的搜尋結果的排序裝置,其中,該選取單元具體用以:對各項屬性特徵按共同度從大到小依次排序,選取預定數量的排序在前的屬性特徵作為參考指標或將共同度大於設定閾值的屬性特徵作為參考指標。
- 根據申請專利範圍第9項所述的搜尋結果的排序裝置,其中,該用戶發生行為的對象為在搜尋結果中被選取的對象;該裝置還包括:分類單元,用以將在搜尋結果中被選取的對象歸類於已選集合;該計算單元具體用以根據用戶對已選集合中的對象的行為資訊而計算每一個屬性特徵在已選集合中的共同度;該選取單元具體用以選擇該共同度大於預設閾值的屬性特徵作為參考指標;及該調整單元具體用以對屬性特徵符合該參考指標的待展示或待排序的對象的排序進行提升。
- 根據申請專利範圍第9項所述的搜尋結果的排序裝置,其中,該裝置還包括:分類單元,用以將在搜尋結果中已展示且未被選取的對象歸類於未選集合;該計算單元具體用以根據用戶對未選集合中的對象的行為資訊而計算每一個屬性特徵在未選集合中的共同度;該選取單元具體用以選擇該共同度大於預設閾值的屬性特徵作為參考指標;及該調整單元具體用以對屬性特徵符合該參考指標的待展示或待排序的對象的排序進行降冪。
- 根據申請專利範圍第9項所述的搜尋結果的排序裝置,其中,該裝置還包括:排序單元,用以根據該選取單元選取的參考指標而計 算待展示或待排序的對象各自的排序分數值;該調整單元根據該排序單元計算得到的排序分數值而對待展示或待排序的對象重新進行排序;該排序單元具體包括:賦值子單元,用以根據選取順序而為用戶在已展示對象中所選取的對象賦予第一權重;第三計算子單元,用以根據用戶所選擇的對象中符合參考指標的對象的第一權重而計算每一個參考指標的權重;第四計算子單元,用以根據待展示或待排序的對象的屬性特徵所符合的參考指標的權重,計算該參考指標對該對象排序的影響程度的綜合分數;及第五計算子單元,用以根據該綜合分數而調整該對象的排序分數值。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210420861.6A CN103793388B (zh) | 2012-10-29 | 2012-10-29 | 搜索结果的排序方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201417019A TW201417019A (zh) | 2014-05-01 |
TWI567673B true TWI567673B (zh) | 2017-01-21 |
Family
ID=50548372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102109488A TWI567673B (zh) | 2012-10-29 | 2013-03-18 | Sorting methods and devices for search results |
Country Status (4)
Country | Link |
---|---|
US (2) | US9633082B2 (zh) |
CN (1) | CN103793388B (zh) |
TW (1) | TWI567673B (zh) |
WO (1) | WO2014070624A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI742568B (zh) * | 2020-03-17 | 2021-10-11 | 昕力資訊股份有限公司 | 通用型資料庫模糊搜索的電腦程式產品及裝置 |
TWI813926B (zh) * | 2020-02-05 | 2023-09-01 | 南韓商韓領有限公司 | 用於網頁顯示修正的電腦化系統及方法 |
US11899718B2 (en) | 2020-12-21 | 2024-02-13 | Coupang Corp. | Systems and methods for automatically updating guaranteed computing counters |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104391847A (zh) * | 2014-05-22 | 2015-03-04 | 艺龙网信息技术(北京)有限公司 | 一种基于用户行为的酒店排序方法、云端服务器及系统 |
TW201544979A (zh) * | 2014-05-23 | 2015-12-01 | Chao-Yu Yueh | 資訊查詢方法、資訊提供方法、資訊查詢系統及其伺服器 |
US9754037B2 (en) * | 2014-08-27 | 2017-09-05 | Facebook, Inc. | Blending by query classification on online social networks |
US9703859B2 (en) | 2014-08-27 | 2017-07-11 | Facebook, Inc. | Keyword search queries on online social networks |
CN105468652A (zh) * | 2014-09-12 | 2016-04-06 | 北大方正集团有限公司 | 一种检索排序方法及系统 |
CN105512122B (zh) * | 2014-09-22 | 2019-05-24 | 华为技术有限公司 | 信息检索系统的排序方法及装置 |
CN105635229B (zh) * | 2014-11-06 | 2019-09-17 | 阿里巴巴集团控股有限公司 | 数据回填方法及装置 |
CN105760393A (zh) * | 2014-12-17 | 2016-07-13 | 纽海信息技术(上海)有限公司 | 网页显示方法及系统 |
US20160321716A1 (en) * | 2015-04-30 | 2016-11-03 | Wal-Mart Stores, Inc. | System, method, and non-transitory computer-readable storage media for enhancing online product search through multiobjective optimization of product search ranking functions |
US10007732B2 (en) | 2015-05-19 | 2018-06-26 | Microsoft Technology Licensing, Llc | Ranking content items based on preference scores |
CN115795147A (zh) * | 2015-05-20 | 2023-03-14 | 电子湾有限公司 | 用于进行搜索的方法和系统 |
US10997184B2 (en) | 2015-05-22 | 2021-05-04 | Coveo Solutions, Inc. | System and method for ranking search results |
CN104899766A (zh) * | 2015-06-03 | 2015-09-09 | 北京京东尚科信息技术有限公司 | 选择对象属性的方法及装置 |
CN106503006B (zh) * | 2015-09-07 | 2020-01-31 | 阿里巴巴集团控股有限公司 | 应用App中子应用的排序方法及装置 |
CN105224959B (zh) * | 2015-11-02 | 2019-03-26 | 北京奇艺世纪科技有限公司 | 排序模型的训练方法和装置 |
CN105849730A (zh) * | 2016-03-25 | 2016-08-10 | 马岩 | 数据抓取的方法及系统 |
CN107291749B (zh) * | 2016-03-31 | 2020-11-10 | 菜鸟智能物流控股有限公司 | 一种数据指标关联关系的确定方法及装置 |
CN105956887A (zh) * | 2016-05-26 | 2016-09-21 | 宇宙世代信息技术(深圳)有限公司 | 商品信息的动态排序方法和商品信息的动态排序装置 |
CN107562756B (zh) * | 2016-07-01 | 2021-02-02 | 阿里巴巴集团控股有限公司 | 一种确定对象信息的方法和设备 |
CN106326373A (zh) * | 2016-08-15 | 2017-01-11 | 马岩 | 可信视频在大数据中的抓取方法及系统 |
CN106294802A (zh) * | 2016-08-15 | 2017-01-04 | 马岩 | 音频数据的抓取方法及系统 |
US11368752B2 (en) | 2017-01-03 | 2022-06-21 | Bliss Point Media, Inc. | Optimization of broadcast event effectiveness |
US10878435B2 (en) * | 2017-08-04 | 2020-12-29 | Truecar, Inc. | Method and system for presenting information for a geographically eligible set of automobile dealerships ranked based on likelihood scores |
CN109446402B (zh) * | 2017-08-29 | 2022-04-01 | 阿里巴巴集团控股有限公司 | 一种搜索方法及装置 |
CN107562873B (zh) * | 2017-08-31 | 2021-02-02 | 北京小度互娱科技有限公司 | 推送瀑布流数据的方法及装置 |
CN110020282A (zh) * | 2017-09-18 | 2019-07-16 | 北京国双科技有限公司 | 一种检索方法及检索装置 |
CN109656433B (zh) * | 2017-10-11 | 2021-07-06 | 腾讯科技(深圳)有限公司 | 类目信息处理方法、装置、计算机设备和存储介质 |
CN107977405B (zh) * | 2017-11-16 | 2021-01-22 | 北京三快在线科技有限公司 | 数据排序方法、数据排序装置、电子设备及可读存储介质 |
CN110020171B (zh) * | 2017-12-28 | 2023-05-16 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置、设备及计算机可读存储介质 |
CN110020173B (zh) * | 2017-12-29 | 2023-07-18 | 阿里巴巴集团控股有限公司 | 用于优化搜索排序的方法、装置及电子设备 |
US11012319B2 (en) * | 2018-07-24 | 2021-05-18 | International Business Machines Corporation | Entity selection in a visualization of a network graph |
CN110807680B (zh) * | 2018-08-06 | 2023-05-02 | 阿里巴巴集团控股有限公司 | 数据对象信息处理方法、装置及电子设备 |
CN109101630B (zh) * | 2018-08-14 | 2021-12-17 | 广东小天才科技有限公司 | 一种应用程序搜索结果的生成方法、装置及设备 |
US10956507B2 (en) * | 2018-08-16 | 2021-03-23 | Rovi Guides, Inc. | Reaction compensated result selection |
CN110895594A (zh) * | 2018-08-23 | 2020-03-20 | 武汉斗鱼网络科技有限公司 | 一种页面展示的方法以及相关设备 |
CN109949075A (zh) * | 2019-02-25 | 2019-06-28 | 傲宝珠宝文化发展(深圳)有限公司 | 一种用于多家珠宝门店的实时数据远程监控系统 |
CN111626805B (zh) * | 2019-02-28 | 2023-11-03 | 北京沃东天骏信息技术有限公司 | 信息展示方法和装置 |
EP3764243B1 (en) * | 2019-07-09 | 2023-11-29 | ABB Schweiz AG | An industrial information identification and retrieval system |
CN110377830B (zh) * | 2019-07-25 | 2022-03-29 | 拉扎斯网络科技(上海)有限公司 | 检索方法、装置、可读存储介质和电子设备 |
CN111210298A (zh) * | 2019-12-24 | 2020-05-29 | 武汉诸相网络科技有限公司 | 一种基于大数据处理c2c平台商品货架智能排序的方法及系统 |
CN111274093B (zh) * | 2020-01-23 | 2023-12-01 | 湖南快乐阳光互动娱乐传媒有限公司 | 一种应用程序的排序方法及装置 |
US12026166B2 (en) | 2020-11-30 | 2024-07-02 | Direct Cursus Technology L.L.C | Method and system for determining rank positions of elements by a ranking system |
CN112434070A (zh) * | 2020-12-14 | 2021-03-02 | 四川长虹电器股份有限公司 | 一种基于相似度算法的分页查询方法 |
US12086149B2 (en) * | 2021-04-09 | 2024-09-10 | Y.E. Hub Armenia LLC | Method and system for determining rank positions of content elements by a ranking system |
CN113628004A (zh) * | 2021-07-29 | 2021-11-09 | 陈子龙 | 终端显示设备图像显示方法 |
CN113792225B (zh) * | 2021-08-25 | 2023-08-18 | 北京库睿科技有限公司 | 一种多数据类型分层排序方法和装置 |
CN114138152A (zh) * | 2021-12-02 | 2022-03-04 | 连尚(新昌)网络科技有限公司 | 信息收藏方法和设备 |
CN114547064B (zh) * | 2021-12-31 | 2023-07-07 | 广州万物集工业互联网科技有限公司 | 一种产品搜索方法、系统、计算机设备及可读存储介质 |
CN115238126A (zh) * | 2022-07-28 | 2022-10-25 | 腾讯科技(深圳)有限公司 | 搜索结果重排序方法、装置、设备及计算机存储介质 |
CN116226515B (zh) * | 2022-12-29 | 2024-02-13 | 北京奇树有鱼文化传媒有限公司 | 一种搜索结果排序方法、装置、电子设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050203918A1 (en) * | 2000-11-15 | 2005-09-15 | Holbrook David M. | Apparatus and methods for organizing and/or presenting data |
US20070260597A1 (en) * | 2006-05-02 | 2007-11-08 | Mark Cramer | Dynamic search engine results employing user behavior |
US20100262495A1 (en) * | 2009-04-08 | 2010-10-14 | Dumon Olivier G | Business rules for affecting the order in which item listings are presented |
TW201224972A (en) * | 2010-12-07 | 2012-06-16 | Alibaba Group Holding Ltd | Sorting method and apparatus of query results |
TW201229791A (en) * | 2011-01-14 | 2012-07-16 | Alibaba Group Holding Ltd | Ranking method and device of query results |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1818908A (zh) * | 2006-03-16 | 2006-08-16 | 董崇军 | 一种在搜索引擎中应用搜索者反馈信息的方法 |
US7603350B1 (en) | 2006-05-09 | 2009-10-13 | Google Inc. | Search result ranking based on trust |
WO2008019007A2 (en) | 2006-08-04 | 2008-02-14 | Thefind, Inc. | Method for relevancy ranking of products in online shopping |
US8117197B1 (en) | 2008-06-10 | 2012-02-14 | Surf Canyon, Inc. | Adaptive user interface for real-time search relevance feedback |
US8359309B1 (en) | 2007-05-23 | 2013-01-22 | Google Inc. | Modifying search result ranking based on corpus search statistics |
US8583633B2 (en) | 2007-11-30 | 2013-11-12 | Ebay Inc. | Using reputation measures to improve search relevance |
US8307390B2 (en) * | 2009-02-26 | 2012-11-06 | Comcast Cable Communications, Llc | Re-addressable alternate content |
US9069843B2 (en) | 2010-09-30 | 2015-06-30 | International Business Machines Corporation | Iterative refinement of search results based on user feedback |
-
2012
- 2012-10-29 CN CN201210420861.6A patent/CN103793388B/zh active Active
-
2013
- 2013-03-18 TW TW102109488A patent/TWI567673B/zh active
- 2013-10-24 US US14/062,773 patent/US9633082B2/en active Active
- 2013-10-25 WO PCT/US2013/066968 patent/WO2014070624A1/en active Application Filing
-
2017
- 2017-03-13 US US15/457,826 patent/US20170255630A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050203918A1 (en) * | 2000-11-15 | 2005-09-15 | Holbrook David M. | Apparatus and methods for organizing and/or presenting data |
US20070260597A1 (en) * | 2006-05-02 | 2007-11-08 | Mark Cramer | Dynamic search engine results employing user behavior |
US20100262495A1 (en) * | 2009-04-08 | 2010-10-14 | Dumon Olivier G | Business rules for affecting the order in which item listings are presented |
TW201224972A (en) * | 2010-12-07 | 2012-06-16 | Alibaba Group Holding Ltd | Sorting method and apparatus of query results |
TW201229791A (en) * | 2011-01-14 | 2012-07-16 | Alibaba Group Holding Ltd | Ranking method and device of query results |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI813926B (zh) * | 2020-02-05 | 2023-09-01 | 南韓商韓領有限公司 | 用於網頁顯示修正的電腦化系統及方法 |
TWI742568B (zh) * | 2020-03-17 | 2021-10-11 | 昕力資訊股份有限公司 | 通用型資料庫模糊搜索的電腦程式產品及裝置 |
US11899718B2 (en) | 2020-12-21 | 2024-02-13 | Coupang Corp. | Systems and methods for automatically updating guaranteed computing counters |
Also Published As
Publication number | Publication date |
---|---|
US20170255630A1 (en) | 2017-09-07 |
TW201417019A (zh) | 2014-05-01 |
CN103793388A (zh) | 2014-05-14 |
US9633082B2 (en) | 2017-04-25 |
WO2014070624A1 (en) | 2014-05-08 |
CN103793388B (zh) | 2017-08-25 |
US20140122475A1 (en) | 2014-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI567673B (zh) | Sorting methods and devices for search results | |
TWI615724B (zh) | 基於電子資訊的關鍵字提取的資訊推送、搜尋方法及裝置 | |
JP6356744B2 (ja) | ウェブサイト横断情報を表示する方法およびシステム | |
JP5507154B2 (ja) | 社会的インデックス付けを用いて、トピックに基づいて広告ターゲットを拡大させるシステム及び方法 | |
US10354308B2 (en) | Distinguishing accessories from products for ranking search results | |
CN105765573B (zh) | 网站通信量优化方面的改进 | |
WO2018053966A1 (zh) | 点击率预估 | |
JP6018338B1 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
US20120311140A1 (en) | Method of processing web access information and server implementing same | |
JP5229504B2 (ja) | 広告提示方法、広告提示システム及びプログラム | |
Lin et al. | Personalized hotel recommendation using text mining and mobile browsing tracking | |
CN103198118A (zh) | 一种商品网页回溯方法及系统 | |
JP6655223B1 (ja) | 情報処理システム、情報処理方法、及びプログラム | |
CN110647679A (zh) | 一种o2o场景下的搜索结果综合排序方法 | |
JP6584486B2 (ja) | 予測装置、予測方法、及び予測プログラム | |
JP6424194B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
US20180165741A1 (en) | Information providing device, information providing method, information providing program, and computer-readable storage medium storing the program | |
CN115827994A (zh) | 一种数据处理方法、装置、设备、存储介质 | |
WO2017219317A1 (zh) | 一种基于搜索内容的信息推送方法及装置 | |
JP2021176085A (ja) | ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム | |
JP2021140646A (ja) | ターゲットユーザ特徴抽出方法、ターゲットユーザ特徴抽出システム及びターゲットユーザ特徴抽出サーバ | |
CN112307298A (zh) | 个人品牌标签的生成方法及其装置 | |
CN112989238B (zh) | 一种基于用户习惯的快速呈现页面的方法 | |
JP7520097B2 (ja) | 判定装置、判定方法および判定プログラム | |
US11308099B2 (en) | Method of and system for ranking digital objects based on objective characteristic associated therewith |