TW201426357A - 搜索資料排序的方法和裝置,資料搜索的方法和裝置 - Google Patents

搜索資料排序的方法和裝置,資料搜索的方法和裝置 Download PDF

Info

Publication number
TW201426357A
TW201426357A TW102107869A TW102107869A TW201426357A TW 201426357 A TW201426357 A TW 201426357A TW 102107869 A TW102107869 A TW 102107869A TW 102107869 A TW102107869 A TW 102107869A TW 201426357 A TW201426357 A TW 201426357A
Authority
TW
Taiwan
Prior art keywords
search
attribute value
historical
data
search target
Prior art date
Application number
TW102107869A
Other languages
English (en)
Inventor
hua-qing Song
Original Assignee
Alibaba Group Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Services Ltd filed Critical Alibaba Group Services Ltd
Publication of TW201426357A publication Critical patent/TW201426357A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申請提供了一種搜索資料排序的方法和裝置,資料搜索的方法和裝置,其中,該搜索資料排序的方法包括:生成中庸需求點的資料;該中庸需求點的資料包括搜索目標的參考屬性值;根據該中庸需求點的資料,對相應搜索目標的資料集合進行排序,具體包括:獲取該搜索目標的資料集合,並獲取該資料集合中一個或多個搜索目標的當前屬性值;計算該一個或多個搜索目標的當前屬性值與參考屬性值的距離;按照該距離對該資料集合中的一個或多個搜索目標進行排序。本申請實施例可以在充分滿足用戶的個性化需求,簡化用戶操作,降低用戶端與伺服器資源耗費的基礎上,提高搜索效率。

Description

搜索資料排序的方法和裝置,資料搜索的方法和裝置
本申請係關於網路資料搜索的技術領域,特別係關於一種搜索資料排序的方法,一種搜索資料排序的裝置,一種資料搜索的方法,以及,一種資料搜索的裝置。
現有技術中,對於網路資料的搜索通常基於搜索引擎實現。
搜索引擎指自動從網際網路搜集資訊,經過一定整理以後,提供給用戶進行查詢的系統。網際網路上的資訊浩瀚萬千,而且毫無秩序,所有的資訊像汪洋上的一個個小島,網頁鏈結是這些小島之間縱橫交錯的橋樑,而搜索引擎,則為用戶繪製一幅一目了然的資訊地圖,供用戶隨時查閱。
搜索引擎的工作原理大致可以分為:
(1)搜集資訊:搜索引擎的資訊搜集基本都是自動的。搜索引擎利用稱為網路蜘蛛(Spider)的自動搜索機器人程式根據網頁中的超鏈結,從少數幾個網頁開始,連 到資料庫上所有到其他網頁的鏈結。理論上,若網頁上有適當的超鏈結,機器人便可以遍曆絕大部分網頁。
(2)整理資訊:搜索引擎整理資訊的過程稱為“創建索引”。搜索引擎不僅要保存搜集起來的資訊,還要將它們按照一定的規則進行編排。這樣,搜索引擎根本不用重新翻查它所有保存的資訊而迅速找到所要的資料。
(3)接受查詢:用戶向搜索引擎發起查詢,搜索引擎接受查詢並向用戶返回搜索結果。搜索引擎每時每刻都要接到來自大量用戶的幾乎是同時發起的查詢,它按照每個用戶的要求檢查自己的索引,在極短時間內找到用戶需要的搜索結果,並返回給用戶。目前,搜索引擎返回結果主要是以網頁鏈結的形式提供的,這樣透過這些鏈結,用戶便能到達含有自己所需資料的網頁。通常搜索引擎會在這些鏈結下提供一小段來自這些網頁的摘要資訊以幫助用戶判斷此網頁是否含有自己需要的內容。
現有技術中的搜索引擎往往需要用戶首先提交搜索條件發起查詢,如輸入關鍵字,設定搜索範圍等,而搜索引擎所返回的搜索結果僅僅是網路蜘蛛抓取到的資料庫中的網頁鏈結,完全無法兼顧用戶的個性化需求。
目前,某些站內搜索引擎提供了一些個性化搜索的功能,如某些電子商務網站的產品搜索引擎或商品搜索引擎,會根據用戶行為、商品、銷量等多維度的資訊,在用戶不提交搜索條件的情況下,自動推薦可能適合用戶需求的搜索結果。然而,這種現有方案中各種維度設置得比較 多,而且不透明,多種維度間的權重設置也無法調整,往往不能實實在在滿足用戶的真實需求。在這種情況下,用戶不得不重新提交搜索條件觸發搜索引擎重新發起搜索,才能獲得其想要的搜索結果。
顯然,採用現有的搜索技術不僅無法充分滿足用戶的個性化需求,而且使用戶操作繁瑣,並且耗費了過多的用戶端與伺服器的資源,搜索效率低下。
因此,本領域技術人員迫切需要解決的問題是:提供一種搜索資料排序以及資料搜索的機制,用以在充分滿足用戶的個性化需求,簡化用戶操作,降低用戶端與伺服器資源耗費的基礎上,提高搜索效率。
本申請所要解決的技術問題是提供一種搜索資料排序以及資料搜索的方法,用以在簡化用戶操作,降低用戶端與伺服器資源耗費的基礎上,提高搜索效率。
相應的,本申請還提供了一種搜索資料排序以及資料搜索的裝置,用以保證上述方法在實際中的應用。
為了解決上述問題,本申請公開了一種搜索資料排序的方法,包括:生成中庸需求點的資料;該中庸需求點的資料包括搜索目標的參考屬性值;根據該中庸需求點的資料,對相應搜索目標的資料集合進行排序,具體包括: 獲取該搜索目標的資料集合,並獲取該資料集合中一個或多個搜索目標的當前屬性值;計算該一個或多個搜索目標的當前屬性值與參考屬性值的距離;按照該距離對該資料集合中的一個或多個搜索目標進行排序。
較佳地,該生成中庸需求點的資料的步驟包括:獲得包含一個或多個該搜索目標的歷史搜索結果,提取該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值;依據該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值。
較佳地,採用如下公式計算質心:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值。
較佳地,該包含一個或多個該搜索目標的歷史搜索結果包括,多個用戶發起搜索獲得的包含一個或多個該搜索目標的歷史搜索結果;該依據一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值的子步驟進一步包括:1)分別採用如下公式計算s個用戶的質心,其中,s 為大於1的正整數:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值;2)獲得s個用戶的質心{Y1,Y2,...,Ys};3)採用如下公式在該s個用戶的質心中進一步求取質心作為搜索目標的參考屬性值: 其中,Yi為從Y1~Ys
較佳地,該多個用戶為多個近鄰用戶,該近鄰用戶包括用戶行為相似度大於第一預設閾值的用戶集合。
較佳地,該搜索目標的參考屬性值、歷史屬性值、當前屬性值均表示為一個n維的向量X={x1,x2,…,xn},其中,該n為正整數。
較佳地,該根據中庸需求點的資料對相應的搜索目標資料集合進行排序的步驟還包括:在該搜索目標的資料集合中去除特定搜索目標,該特定搜索目標為其當前屬性值與參考屬性值的距離大於第二預設閾值的搜索目標。
本申請實施例還公開了一種資料搜索的方法,包括:生成中庸需求點的資料;該中庸需求點的資料包括搜索目標的參考屬性值; 獲取發起搜索用戶的行為資訊;根據該發起搜索用戶的行為資訊提取適配的中庸需求點的資料;根據該適配的中庸需求點的資料獲取對應的搜索目標的資料集合返回給該發起搜索用戶;其中,該搜索目標的資料集合中的一個或多個搜索目標具有當前屬性值,該一個或多個搜索目標按照其當前屬性值與搜索目標的參考屬性值的距離進行排序。
較佳地,該生成中庸需求點的資料的步驟包括:獲得包含一個或多個該搜索目標的歷史搜索結果,提取該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值;依據該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值。
較佳地,採用如下公式計算質心:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值。
較佳地,該包含一個或多個該搜索目標的歷史搜索結果包括,多個用戶發起搜索獲得的包含一個或多個該搜索目標的歷史搜索結果;該依據一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值 的子步驟進一步包括:1)分別採用如下公式計算s個用戶的質心,其中,s為大於1的正整數:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值;2)獲得s個用戶的質心{Y1,Y2,...,Ys};3)採用如下公式在該s個用戶的質心中進一步求取質心作為搜索目標的參考屬性值: 其中,Yi為從Y1~Ys
較佳地,該多個用戶為多個近鄰用戶,該近鄰用戶包括用戶行為相似度大於第一預設閾值的用戶集合。
較佳地,該搜索目標的參考屬性值、歷史屬性值、當前屬性值均表示為一個n維的向量X={x1,x2,…,xn},其中,該n為正整數。
較佳地,該根據發起搜索用戶的行為資訊提取適配的中庸需求點的資料的步驟包括:計算該發起搜索用戶的行為資訊與近鄰用戶集合的行為相似度;若大於第一預設閾值,則判定該發起搜索用戶的行為資訊屬於該近鄰用戶集合;提取該發起搜索用戶所屬的近鄰用戶集合對應的搜索 目標的參考屬性值,將該搜索目標的參考屬性值作為該發起搜索用戶適配的中庸需求點的資料。
較佳地,該根據適配的中庸需求點的資料獲取對應的搜索目標的資料集合返回給該發起搜索用戶的步驟包括:獲取包含一個或多個該搜索目標的當前搜索結果,提取該一個或多個搜索目標的當前屬性值;分別計算該一個或多個搜索目標的當前屬性值與該屬性參考值的距離;按照該距離對該一個或多個搜索目標進行排序;將該排序後的搜索目標資料集合返回給用戶。
較佳地,該根據適配的中庸需求點的資料獲取對應的搜索目標的資料集合返回給該發起搜索用戶的步驟還包括:在該搜索目標的資料集合中去除特定搜索目標,該特定搜索目標為其當前屬性值與參考屬性值的距離大於第二預設閾值的搜索目標。
本申請實施例還公開了一種搜索資料排序的裝置,包括:中庸需求點生成模組,用於生成中庸需求點的資料;該中庸需求點的資料包括搜索目標的參考屬性值;中庸需求點排序模組,用於根據該中庸需求點的資料,對相應搜索目標的資料集合進行排序,具體包括:搜索結果獲取子模組,用於獲取該搜索目標的資料集合,並獲得該資料集合中一個或多個搜索目標的當前屬性 值;距離計算子模組,用於計算該一個或多個搜索目標的當前屬性值與參考屬性值的距離;排序子模組,用於按照該距離對該資料集合中的一個或多個搜索目標進行排序。
較佳地,該中庸需求點生成模組包括:歷史搜索結果分析子模組,用於獲得包含一個或多個該搜索目標的歷史搜索結果,提取該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值;中庸需求點計算子模組,用於依據該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值。
較佳地,採用如下公式計算質心:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值。
較佳地,該包含一個或多個該搜索目標的歷史搜索結果包括,多個用戶發起搜索獲得的包含一個或多個該搜索目標的歷史搜索結果;該中庸需求點計算子模組進一步包括:單用戶質心計算單元,用於分別採用如下公式計算s個用戶的質心,其中,s為大於1的正整數:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值;質心資料組織單元,用於獲得s個用戶的質心{Y1,Y2,...,Ys};多用戶質心計算單元,用於採用如下公式在該s個用戶的質心中進一步求取質心作為搜索目標的參考屬性值: 其中,Yi為從Y1~Ys
較佳地,該多個用戶為多個近鄰用戶,該近鄰用戶包括用戶行為相似度大於第一預設閾值的用戶集合。
較佳地,該中庸需求點排序模組還包括:篩選子模組,用於在該搜索目標的資料集合中去除特定搜索目標,該特定搜索目標為其當前屬性值與參考屬性值的距離大於第二預設閾值的搜索目標。
本申請實施例還公開了一種資料搜索的裝置,包括:中庸需求點生成模組,用於生成中庸需求點的資料;該中庸需求點的資料包括搜索目標的參考屬性值;用戶行為獲取模組,用於獲取發起搜索用戶的行為資訊;適配需求點提取模組,用於根據該發起搜索用戶的行為資訊提取適配的中庸需求點的資料;搜索結果返回模組,用於根據該適配的中庸需求點的資料獲取對應的搜索目標的資料集合返回給該發起搜索用 戶;其中,該搜索目標的資料集合中的一個或多個搜索目標具有當前屬性值,該一個或多個搜索目標按照其當前屬性值與搜索目標的參考屬性值的距離進行排序。
較佳地,該中庸需求點生成模組包括:歷史搜索結果分析子模組,用於獲得包含一個或多個該搜索目標的歷史搜索結果,提取該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值;中庸需求點計算子模組,用於依據該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值。
較佳地,採用如下公式計算質心:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值。
較佳地,該包含一個或多個該搜索目標的歷史搜索結果包括,多個用戶發起搜索獲得的包含一個或多個該搜索目標的歷史搜索結果;該中庸需求點計算子模組進一步包括:單用戶質心計算單元,用於分別採用如下公式計算s個用戶的質心,其中,s為大於1的正整數:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值; 質心資料組織單元,用於獲得s個用戶的質心{Y1,Y2,...,Ys};多用戶質心計算單元,用於採用如下公式在該s個用戶的質心中進一步求取質心作為搜索目標的參考屬性值: 其中,Yi為從Y1~Ys
較佳地,該多個用戶為多個近鄰用戶,該近鄰用戶包括用戶行為相似度大於第一預設閾值的用戶集合。
較佳地,該適配需求點提取模組包括:行為相似度計算子模組,用於計算該發起搜索用戶的行為資訊與近鄰用戶集合的行為相似度;判定子模組,用於在該行為相似度大於第一預設閾值時,判定該發起搜索用戶的行為資訊屬於該近鄰用戶集合;適配點獲取子模組,用於提取該發起搜索用戶所屬的近鄰用戶集合對應的搜索目標的參考屬性值,將該搜索目標的參考屬性值作為該發起搜索用戶適配的中庸需求點的資料。
較佳地,該搜索結果返回模組包括:搜索結果獲取子模組,用於獲取包含一個或多個該搜索目標的當前搜索結果,提取該一個或多個搜索目標的當前屬性值;距離計算子模組,用於分別計算該一個或多個搜索目 標的當前屬性值與該屬性參考值的距離;排序子模組,用於按照該距離對該一個或多個搜索目標進行排序;回饋子模組,用於將該排序後的搜索目標資料集合返回給用戶。
較佳地,該搜索結果返回模組還包括:篩選子模組,用於在該搜索目標的資料集合中去除特定搜索目標,該特定搜索目標為其當前屬性值與參考屬性值的距離大於第二預設閾值的搜索目標。
與現有技術相比,本申請具有以下優點:本申請透過設置中庸需求點,透過這個中庸需求點來建立一種新的排序方式,並可以持續地改進這個中庸需求點以滿足用戶變化的需求。應用本實施例,用戶無需自己提交搜索條件,即可獲得滿足其個性化需求的搜索結果資料,從而大大簡化了用戶操作;並且,各個網站伺服器也無需反覆處理用戶端請求,從而節約了用戶端與伺服器的資源,有效提高了搜索效率。
在本申請的一種較佳實施例中,該中庸需求點的資料可以作為搜索條件提交給相應的搜索引擎,由搜索引擎依據自身的搜索機制抓取相應的搜索結果(搜索目標的資料集合)。即基於該中庸需求點的資料發起線上搜索。採用這種實現方式,可以只在伺服器端保存中庸需求點的資料,可以有效節約伺服器資源。
在本申請的另一種較佳實施例中,可以將該中庸需求 點的資料對應的搜索目標的資料集合保存在伺服器端,並記錄該中庸需求點的資料對應的搜索目標的資料集合的對應關係,本實施例適用於較小型的站內搜索引擎。在這種情況下,由於網站訪問量小,站內用戶行為資訊較少,該中庸需求點的資料可以定期更新,而無需即時更新,在每次更新中庸需求點的資料時,即可將對應的搜索目標的資料集合進行保存。當用戶發起搜索時,直接依據其適配的中庸需求點的資料提取伺服器中對應的搜索目標的資料集合進行回饋即可。本實施例可以有效減少用戶端與伺服器通信交互的資源,也能讓用戶獲得較快的回饋。
41‧‧‧中庸需求點生成模組
42‧‧‧中庸需求點排序模組
421‧‧‧搜索結果獲取子模組
422‧‧‧距離計算子模組
423‧‧‧排序子模組
501‧‧‧中庸需求點生成模組
502‧‧‧用戶行為獲取模組
503‧‧‧適配需求點提取模組
504‧‧‧搜索結果返回模組
圖1是本申請的一種搜索資料排序的方法實施例的步驟流程圖;圖2是本申請的一種示例中將商品資料和中庸需求點的資料放到價格-銷量的二維空間中的示意圖;圖3是本申請的一種資料搜索的方法實施例的步驟流程圖;圖4是本申請的一種搜索資料排序的裝置實施例的結構框圖;圖5是本申請的一種資料搜索的裝置實施例的結構框圖。
為使本申請的上述目的、特徵和優點能夠更加明顯易懂,下面結合附圖和具體實施方式對本申請作進一步詳細的說明。
本申請實施例的核心構思之一在於,結合中國人的中庸之道,不求最好,也不要最差。如在電子商務網站選購商品時,針對產品的品質和價格,購買人不求價格最便宜的,也不要品質最好的,折中就好。本申請透過技術手段來滿足這種大眾心理。透過收集近鄰用戶針對搜索目標的搜索行為資訊,計算出該類用戶的中庸需求點,透過這個中庸需求點來建立一種新的排序方式,並可以持續地改進這個中庸需求點以滿足用戶變化的需求。
參考圖1,示出了本申請的一種搜索資料排序的方法實施例的步驟流程圖,具體可以包括如下步驟:步驟101,生成中庸需求點的資料;其中,該中庸需求點的資料可以包括搜索目標的參考屬性值。
“中庸”一詞取自於儒家的一種主張,是指待人接物採取不偏不倚,調和折中的態度。在本申請實施例中,中庸需求點即指在中庸思想的作用下用戶的需求點。需要說明的是,本申請實施例中的用戶可指單個用戶,也可以為多個用戶,群體用戶,還可以包括所有網路用戶。一般而言,在中庸思想的作用下用戶的需求點,是指大多數用戶在中庸思想的作用下的需求點,例如,針對某商品這個搜 索目標時,大多數用戶在中庸思想的作用下的需求點往往是,銷量最大的並且價格相對來說最低的,或者,好評率最高並且價格最低的(即性價比最優)。
中庸需求點的資料即可以理解為,在中庸思想的作用下用戶的需求點所對應的搜索目標的屬性值(即本申請實施例中所指的“搜索目標的參考屬性值”)。其中,該搜索目標可以依據所適應的搜索引擎確定,例如,當在全網搜索引擎中應用本申請實施例時,該搜索目標可以為任一種網路資源,如圖片,視頻,網頁等等;當在某個電子商務網站的站內搜索引擎中應用本申請實施例時,該搜索目標可以為產品,商品或服務等等。從用戶角度而言,該搜索目標也可以理解為用戶希望搜索得到的目標物品,目標資訊或目標資料等。
以在電子商務平台中對某個商品的搜索為例,該商品即可理解為本申請實施例中所指的“搜索目標”,在電子商務平台中,可能有成千上萬條該商品的資訊(即搜索目標的資料集合)。商品在電子商務平台中一般具有多個屬性,如價格,銷量,好評率等等。需要說明的是,在本申請實施例中,該屬性值(包括參考屬性值、當前屬性值、歷史屬性值)所對應的屬性,可以為搜索目標的所有屬性,也可以為用戶所關注的搜索目標的部分屬性或特定屬性。例如,對於商品這個搜索目標而言,用戶需求僅在價格、銷量這兩個屬性上時,則只採用價格、銷量這兩個屬性的屬性值進行相關運算。並且,該參考屬性值、當前屬 性值、歷史屬性值具有一致性,即例如,某個商品(搜索目標)的參考屬性值是價格、銷量這兩個屬性的參考屬性值,則其當前屬性值會是價格、銷量這兩個屬性的當前屬性值,而不會是好評率、發佈時間等其他屬性的當前屬性值;其歷史屬性值會是價格、銷量這兩個屬性的歷史屬性值,而不會是好評率、發佈時間等其他屬性的歷史屬性值。
一般而言,在中庸思想的作用下,用戶往往希望搜索到性價比最優的產品,例如:銷量最大的並且價格相對來說最低的,或者,好評率最高並且價格最低的,則滿足這種用戶需求所對應的搜索目標的參考屬性值可能是價格為0.2,銷量為0.8,或者,好評率為0.9,價格為0.2。當然,該參考屬性值只是為增進本領域技術人員直觀理解的示例,在實際中並不一定是這種獨立的小數值,可以是陣列,百分比之類,並且,可以不僅僅採用這種直接賦值的方法,而採用多種計算的方式來生成搜索目標的參考屬性值,本申請對此不作限制。作為本申請實施例具體應用的一種示例,該搜索目標的參考屬性值可以表示為一個n維的向量X={x1,x2,…,xn},其中,該n為正整數。
在本申請的一種較佳實施例中,該參考屬性值可以透過從一個或多個系統中獲取搜索目標的歷史搜索資訊後計算獲得,即用來計算該參考屬性值的源資料可以從同一個平台中獲取,如均從電子商務平台中獲取,也可以從不同的多個平台中獲取,比如說從商品系統平台、銷售系統平 台和營運系統平台分別獲取,本申請對此不作限制。該參考屬性值所採用的數值表徵形式及計算方式本申請均不作限制,作為一種示例,該步驟101具體可以包括如下子步驟:子步驟S11,獲得包含一個或多個該搜索目標的歷史搜索結果,提取該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值;子步驟S12,依據該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值。
在實際中,該歷史搜索結果可以為用戶針對搜索目標先前發起過搜索獲得的搜索結果,例如,當前搜索目標為“iphone手機”,則歷史搜索結果可以為用戶先前提交過“iphone手機”搜索而獲得的搜索結果。該歷史搜索結果還可以為用戶不是針對搜索目標發起的搜索,但搜索結果中包含此搜索目標的搜索結果。例如,當前搜索目標為“iphone手機”,用戶先前提交過“手機”搜索,但其獲得的搜索結果中包含多條“iphone手機”的搜索結果,則本申請實施例中的歷史搜索結果也可以包括這種情形。在具體應用中,該歷史搜索結果可以從日誌或歷史資料庫中獲得。
該搜索目標的歷史屬性值是相應於搜索目標的當前屬性值而言的,即為搜索目標的屬性值的歷史記錄,可以表示為一個n維的向量X={x1,x2,…,xn},其中,該n為正整 數。在具體實現中,該搜索目標的屬性值可以為經過歸一化處理的數值,如0<x<1,以搜索目標為iphone手機為例,假設iphone手機包括兩個屬性值,價格和銷量,即:X={x1,x2},在先前的某次搜索結果中,iphone手機的銷售總量為10台,其中,A賣家iphone手機(搜索目標1)的銷量是1,B賣家iphone手機(搜索目標2)的銷量是9,採用銷售總量進行歸一化處理,獲得搜索目標1的銷量屬性值為1/(1+9)=0.1(此處銷量屬性值為搜索目標1占銷售總量的比例),同理,搜索目標2的銷量屬性值為0.9。
當然,上述搜索目標屬性值的計算方式僅僅用作示例,本領域技術人員依據實際情況採用任一種方式計算搜索目標的屬性值均是可行的,本申請對此不作限制。
在具體實現中,該歷史搜索排序權值可以為搜索引擎(包括全網搜索引擎和站內搜索引擎)用於對匹配的搜索記錄進行排序的權重參數。例如,電子商務平台採用商品的品質給分(具體可以為參考多種因素給出的給分方法,本申請對此不作限制)為搜索排序權值,全網搜索引擎採用Page Rank(Google推出的網頁等級,通常被稱為PR值)為搜索排序權值,該搜索排序權值也可以為進行人工干預的分值等,本申請對此無需加以限制。
在實際中,該搜索目標的屬性值及搜索排序權值可以在搜索結果生成時,計算並儲存在指定的資料庫中,以進一步提高搜索目標的參考屬性值的生成效率。
作為本申請實施例具體應用的一種示例,可以採用如下公式計算質心:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值。
更佳的是,該包含一個或多個該搜索目標的歷史搜索結果可以為,多個用戶針對相同搜索目標或不同搜索目標發起搜索獲得的,包含一個或多個該搜索目標的歷史搜索結果;在這種情況下,該子步驟S12可以進一步包括如下子步驟:1)分別採用如下公式計算s個用戶的質心,其中,s為大於1的正整數:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值;2)獲得s個用戶的質心{Y1,Y2,...,Ys};3)採用如下公式在該s個用戶的質心中進一步求取質心作為搜索目標的參考屬性值: 其中,Yi為從Y1~Ys
需要說明的是,上述公式是質心公式的簡化版,表達的是搜索目標的搜索排序權值都為1的情況,在實際中, 本領域技術人員採用任一種公式求取質心均是可行的,本申請對此無需加以限制。
在具體應用中,還可以即時或定時地根據新增的包含一個或多個該搜索目標的搜索結果更新中庸需求點的資料。以在電子商務平台中的商品資料搜索排序為例,在初始未收集過多個用戶的包含搜索目標的搜索結果時,可以透過採集用戶一次包含搜索目標的搜索結果來計算商品資料分佈在多維空間上的質心,即搜索目標的參考屬性值。例如,用戶發起一次MP3的商品搜索(如:搜索MP3),商品搜索系統會返回一個MP3商品資料的集合,假設MP3商品的個數為k,一個或多個MP3商品有不同的搜索排序權值(商品品質分數,頁面上的表現就是排序不同,品質好的在前面,品質差的在後面),用數學公式可以表示為:M={m1,m2,…,mk},其中,k為商品個數,m值來自於搜索系統,如果沒有搜索系統,也可以假設m=1,所有的商品品質分數都一樣,則計算質心可以採用如下公式:
當有s個用戶搜索過MP3時,每個包含該MP3商品的搜索結果就會有對應不同的參考屬性值(即採用上述公式求到的質心),例如,A用戶與B用戶的參考屬性值相比,價格較低,銷量較高,在這種情況下,所獲得的s個用戶的參考屬性值即可以表示為{,,…,}; 採用如下公式在該s個用戶的質心中進一步求取質心作為搜索目標的參考屬性值,以作為中庸需求點的資料: 其中,Yi為從Y1~Ys
當獲得新增的s+1個用戶的包含搜索目標的搜索結果時,採用上述公式進行計算即可獲得更新的中庸需求點的資料。
為提高中庸需求點的資料的用戶傾向性,該多個用戶可以為多個近鄰用戶,具體而言,近鄰用戶是協同過濾演算法中提出來的概念,其指與目標用戶具有相同或相似興趣偏好的用戶,近鄰用戶即這些具有相同或相似興趣偏好用戶的集合。傳統的近鄰用戶演算法是基於用戶-專案的評分矩陣尋找目標用戶的最近鄰集合。關於近鄰用戶的計算方式,本領域技術人員採用現有的任一種方法均是可行的,如基於矩陣降維的協同過濾,基於神經網路的協同過濾等方法,本申請對此不作限制。在本申請實施例具體應用的一種示例中,該近鄰用戶可以包括用戶行為相似度大於第一預設閾值的用戶集合。
當然,上述生成中庸需求點資料的方法僅僅用作示例,例如,對於一維的搜索目標的屬性值則採用計算均值的方法等,本領域技術人員根據實際情況採用任一種生成中庸需求點資料的方法均是可行的,本申請對此無需加以限制。
在具體實現中,該中庸需求點的資料可以在伺服器端 生成,可以離線完成,比如由搜索伺服器生成並保存,同時還可以即時或定期更新。也可由伺服器生成該中庸需求點的資料後,發送至用戶端保存,或由伺服器定期更新該中庸需求點的資料後,再將更新的資料發送至用戶端保存。由用戶端完成後續的排序操作,以節省伺服器的資源,提高用戶請求的回應速度。
步驟102,根據該中庸需求點的資料,對相應搜索目標的資料集合進行排序。
在本申請實施例中,該排序可以為以中庸需求點資料為中心由近及遠產生的排序。具體而言,該步驟102可以包括如下子步驟:子步驟S21,獲取該搜索目標的資料集合,並獲取該資料集合中一個或多個搜索目標的當前屬性值;該搜索目標的資料集合即包含一個或多個搜索目標形成的資料集合,例如,用戶搜索“Iphone手機”獲得的多個賣家的Iphone手機的商品資料。
子步驟S22,計算該一個或多個搜索目標的當前屬性值與參考屬性值的距離;例如,可以採用如下公式計算一個或多個搜索目標的當前屬性值Xi與該搜索目標的參考屬性值Yi的距離:
子步驟S23,按照該距離對該資料集合中的一個或多個搜索目標進行排序。
應用本申請實施例,針對用戶發起搜索獲得的包含一個或多個該搜索目標物件的當前搜索結果,將分別獲取該一個或多個搜索目標的當前屬性值,然後分別計算該一個或多個搜索目標的當前屬性值與屬性參考值的距離;最後按照該距離從小到大對該資料集合中的一個或多個搜索目標進行排序,使用戶獲得經過該排序後的搜索目標的搜索結果。在這種情況下,用戶無需自己提交搜索條件,即可獲得滿足其個性化需求的搜索結果資料,從而大大簡化了用戶操作,不需用戶一再改變搜索條件以獲得自己想要的搜索結果,從而使各個網站伺服器也無需反覆處理用戶端請求,故本申請實施例節約了用戶端與伺服器的資源,有效提高了搜索效率。
為便於本領域技術人員直觀理解,可以參考圖2,其示出了將商品資料的當前屬性值和中庸需求點的資料放到價格-銷量的二維空間(即屬性值的兩個維度)中的示意圖,當獲得一個或多個商品資料在該二維空間中的當前屬性值,以及,該商品資料的參考屬性值時,按該一個或多個商品資料點到參考屬性值的距離由近及遠進行排序。
參考圖3,示出了一種資料搜索的方法實施例的步驟流程圖,具體可以包括以下步驟:步驟301,生成中庸需求點的資料;該中庸需求點的資料包括針對搜索目標的參考屬性值;在本申請的一種較佳實施例中,該步驟301可以包括如下子步驟: 子步驟S31,獲得包含一個或多個該搜索目標的歷史搜索結果,提取該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值;子步驟S32,依據該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值。
作為本申請實施例具體應用的一種示例,可以採用如下公式計算質心:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值。
在具體實現中,該包含一個或多個該搜索目標的歷史搜索結果可以包括,多個用戶發起搜索獲得的包含一個或多個該搜索目標的歷史搜索結果;在這種情況下,該子步驟S32可以進一步包括如下子步驟:1)分別採用如下公式計算s個用戶的質心,其中,s為大於1的正整數:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值;2)獲得s個用戶的質心{Y1,Y2,...,Ys};3)採用如下公式在該s個用戶的質心中進一步求取質心作為搜索目標的參考屬性值: 其中,Yi為從Y1~Ys
在本申請的一種較佳實施例中,該多個用戶可以為多個近鄰用戶,該近鄰用戶包括用戶行為相似度大於第一預設閾值的用戶集合。
步驟302,獲取發起搜索用戶的行為資訊;在本申請實施例中,該發起搜索用戶不僅包括直接提交搜索請求的用戶,提交關鍵字進行搜索的用戶,還包括由系統設置需要向其推薦資訊的用戶,例如,用戶一登錄或進入網站即需要向其推薦資訊,此類用戶也視為本申請實施例中所指發起搜索用戶。簡而言之,即觸發搜索行為的用戶均稱之為發起搜索用戶。
步驟303,根據該發起搜索用戶的行為資訊提取適配的中庸需求點的資料;在本申請的一種較佳實施例中,該步驟303可以包括如下子步驟:子步驟S41,計算該發起搜索用戶的行為資訊與近鄰用戶集合的行為相似度;子步驟S42,若大於第一預設閾值,則判定該發起搜索用戶的行為資訊屬於該近鄰用戶集合;子步驟S43,提取該發起搜索用戶所屬的近鄰用戶集合對應的搜索目標的參考屬性值,將該搜索目標的參考屬性值作為該發起搜索用戶適配的中庸需求點的資料。
當然,上述方法僅僅是為了滿足更精準用戶需求的一種較佳示例,在實際中,本領域技術人員採用任一種根據發起搜索用戶的行為資訊提取適配的中庸需求點的資料的方法都是可行的,例如,從用戶提交的搜索關鍵字或搜索條件中獲得搜索目標的資訊,然後基於該搜索目標的資訊直接在資料庫中提取該搜索目標對應的中庸需求點的資料,即本領域技術人員可以在資料庫儲存多個搜索目標及對應參考屬性值的對應關係,當從用戶的搜索行為資訊中(如用戶提交的搜索關鍵字,輸入或觸發的搜索條件等)獲得搜索目標資訊時,直接提取對應搜索目標的參考屬性值即可,本申請對此不作限制。
步驟304,根據該中庸需求點的資料獲取對應的搜索目標的資料集合返回給該發起搜索用戶。
具體而言,該步驟304可以包括如下子步驟:子步驟S51,獲取包含一個或多個該搜索目標的當前搜索結果,提取該一個或多個搜索目標的當前屬性值;子步驟S52,分別計算該一個或多個搜索目標的當前屬性值與該屬性參考值的距離;子步驟S53,按照該距離對該一個或多個搜索目標進行排序;子步驟S54,將該排序後的搜索目標資料集合返回給用戶。
在具體實現中,該步驟304還可以包括如下子步驟:子步驟S55,在該搜索目標的資料集合中去除特定搜 索目標,該特定搜索目標為其當前屬性值與參考屬性值的距離大於第二預設閾值的搜索目標。
在本申請實施例中,該第一預設閾值、第二預設閾值可以由本領域技術人員依據實際情況任意設置,本申請對此無需加以限制。
在具體實現中,該用戶行為資訊可以從用戶操作日誌、本地歷史記錄或從預設軟體中獲取,例如,用戶歷史調整所需的商品價格、商品銷量後發起的商品資料搜索等。需要說明的是,在本申請實施例中,隨著該用戶的行為資訊不斷更新,該中庸需求點的資料也將不斷更新。即基於更多的用戶行為資訊可以訓練出近鄰用戶更為適配的中庸需求點的資料,從而更滿足用戶的實際需求。
在實際中,用戶可以透過調節不同維度的需求,如將價格需求調低,銷量需求調高,從而定位到不同的中庸需求點的資料上,獲得不同的搜索目標排序。該用戶調節的介面可以以介面的方式設置在前端,或在前端頁面採用滑動條等對話模式,本申請對此不作限制。
在本申請的一種較佳實施例中,該中庸需求點的資料可以作為搜索條件提交給相當的搜索引擎,由搜索引擎依據自身的搜索機制抓取相應的搜索結果(搜索目標的資料集合)。即基於該中庸需求點的資料發起線上搜索。採用這種實現方式,僅需在伺服器端保存中庸需求點的資料,可以有效節約伺服器資源。
在本申請的另一種較佳實施例中,可以將該中庸需求 點的資料對應的搜索目標的資料集合保存在伺服器端,並記錄該中庸需求點的資料對應的搜索目標的資料集合的對應關係,本實施例適用於較小型的站內搜索引擎。在這種情況下,由於網站訪問量小,站內用戶行為資訊較少,該中庸需求點的資料可以定期更新,而無需即時更新,在每次更新中庸需求點的資料時,即可將對應的搜索目標的資料集合進行保存。當用戶發起搜索時,直接依據其適配的中庸需求點的資料提取伺服器中對應的搜索目標的資料集合進行回饋即可。本實施例可以有效減少用戶端與伺服器通信交互的資源,也能讓用戶獲得較快的回饋。
需要說明的是,對於方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本申請並不受所描述的動作順序的限制,因為依據本申請,某些步驟可以採用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬於較佳實施例,所涉及的動作並不一定是本申請所必須的。
參照圖4,示出了一種資料搜索的裝置實施例的結構框圖,具體可以包括如下模組:中庸需求點生成模組41,用於生成中庸需求點的資料;該中庸需求點的資料包括搜索目標的參考屬性值;中庸需求點排序模組42,用於根據該中庸需求點的資料,對相應搜索目標的資料集合進行排序,具體可以包括如下子模組: 搜索結果獲取子模組421,用於獲取該搜索目標的資料集合,並獲得該資料集合中一個或多個搜索目標的當前屬性值;距離計算子模組422,用於計算一個或多個搜索目標的屬性值與參考屬性值的距離;排序子模組423,用於按照該距離對該資料集合中的一個或多個搜索目標進行排序。
在本申請的一種較佳實施例中,該中庸需求點生成模組41可以包括如下子模組:歷史搜索結果分析子模組,用於獲得包含一個或多個該搜索目標的歷史搜索結果,提取該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值;中庸需求點計算子模組,用於依據該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值。
作為本申請實施例具體應用的一種示例,可以採用如下公式計算質心:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值。
在本申請的一種較佳實施例中,該包含一個或多個該搜索目標的歷史搜索結果可以包括,多個用戶發起搜索獲得的包含一個或多個該搜索目標的歷史搜索結果;在這種情況下,該中庸需求點計算子模組進一步包括: 單用戶質心計算單元,用於分別採用如下公式計算s個用戶的質心,其中,s為大於1的正整數:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值;質心資料組織單元,用於獲得s個用戶的質心{Y1,Y2,...,Ys};多用戶質心計算單元,用於採用如下公式在該s個用戶的質心中進一步求取質心作為搜索目標的參考屬性值: 其中,Yi為從Y1~Ys
在具體實現中,該多個用戶可以為多個近鄰用戶,該近鄰用戶可以包括用戶行為相似度大於第一預設閾值的用戶集合。
在本申請實施例中,該搜索目標的參考屬性值、歷史屬性值、當前屬性值均可以表示為一個n維的向量X={x1,x2,…,xn},其中,該n為正整數。
在具體實現中,該中庸需求點排序模組42還可以包括如下子模組:篩選子模組,用於在該搜索目標的資料集合中去除特定搜索目標,該特定搜索目標為其當前屬性值與參考屬性值的距離大於第二預設閾值的搜索目標。
由於該裝置實施例基本相應於前述圖1所示的方法實 施例,故本實施例的描述中未詳盡之處,可以參見前述實施例中的相關說明,在此就不贅述了。
參考圖5,示出了本申請的一種資料搜索的裝置實施例的結構框圖,具體可以包括如下模組:中庸需求點生成模組501,用於生成中庸需求點的資料;該中庸需求點的資料包括搜索目標的參考屬性值;用戶行為獲取模組502,用於獲取發起搜索用戶的行為資訊;適配需求點提取模組503,用於根據該發起搜索用戶的行為資訊提取適配的中庸需求點的資料;搜索結果返回模組504,用於根據該適配的中庸需求點的資料獲取對應的搜索目標的資料集合返回給該發起搜索用戶;其中,該搜索目標的資料集合中的一個或多個搜索目標具有當前屬性值,該一個或多個搜索目標按照其屬性值與搜索目標的參考屬性值的距離從小到大進行排序。
在本申請的一種較佳實施例中,該中庸需求點生成模組501可以包括如下子模組:歷史搜索結果分析子模組,用於獲得包含一個或多個該搜索目標的歷史搜索結果,提取該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值;中庸需求點計算子模組,用於依據該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值。
作為本申請實施例具體應用的一種示例,可以採用如 下公式計算質心:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值。
在本申請的一種較佳實施例中,該包含一個或多個該搜索目標的歷史搜索結果可以包括,多個用戶發起搜索獲得的包含一個或多個該搜索目標的歷史搜索結果;在這種情況下,該中庸需求點計算子模組可以進一步包括如下單元:單用戶質心計算單元,用於分別採用如下公式計算s個用戶的質心,其中,s為大於1的正整數:
其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值;質心資料組織單元,用於獲得s個用戶的質心{Y1,Y2,...,Ys};多用戶質心計算單元,用於採用如下公式在該s個用戶的質心中進一步求取質心作為搜索目標的參考屬性值: 其中,Yi為從Y1~Ys
更佳的是,該多個用戶為多個近鄰用戶,該近鄰用戶包括用戶行為相似度大於第一預設閾值的用戶集合。
在本申請的一種較佳實施例中,該適配需求點提取模組503可以包括如下子模組:行為相似度計算子模組,用於計算該發起搜索用戶的行為資訊與近鄰用戶集合的行為相似度;判定子模組,用於在該行為相似度大於第一預設閾值時,判定該發起搜索用戶的行為資訊屬於該近鄰用戶集合;適配點獲取子模組,用於提取該發起搜索用戶所屬的近鄰用戶集合對應的搜索目標的參考屬性值,將該搜索目標的參考屬性值作為該發起搜索用戶適配的中庸需求點的資料。
在具體實現中,該搜索結果返回模組504可以進一步包括如下子模組:搜索結果獲取子模組,用於獲取包含一個或多個該搜索目標的當前搜索結果,提取該一個或多個搜索目標的當前屬性值;距離計算子模組,用於分別計算該一個或多個搜索目標的當前屬性值與該屬性參考值的距離;排序子模組,用於按照該距離對該一個或多個搜索目標進行排序;回饋子模組,用於將該排序後的搜索目標資料集合返回給用戶。
更佳的是,該搜索結果返回模組504還可以包括如下子模組: 篩選子模組,用於在該搜索目標的資料集合中去除特定搜索目標,該特定搜索目標為其當前屬性值與參考屬性值的距離大於第二預設閾值的搜索目標。
由於該裝置實施例基本相應於前述圖3所示的方法實施例,故本實施例的描述中未詳盡之處,可以參見前述實施例中的相關說明,在此就不贅述了。
本領域內的技術人員應明白,本申請的實施例可提供為方法、系統、或電腦程式產品。因此,本申請可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本申請可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存媒體(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。
本申請是參照根據本申請實施例的方法、設備(系統)、和電腦程式產品的流程圖和/或方框圖來描述的。應理解可由電腦程式指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些電腦程式指令到通用電腦、專用電腦、嵌入式處理機或其他可編程資料處理設備的處理器以產生一個機器,使得透過電腦或其他可編程資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些電腦程式指令也可儲存在能引導電腦或其他可編 程資料處理設備以特定方式工作的電腦可讀記憶體中,使得儲存在該電腦可讀記憶體中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些電腦程式指令也可裝載到電腦或其他可編程資料處理設備上,使得在電腦或其他可編程設備上執行一系列操作步驟以產生電腦實現的處理,從而在電腦或其他可編程設備上執行的指令提供用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
儘管已描述了本申請的較佳實施例,但本領域內的技術人員一旦得知了基本創造性概念,則可對這些實施例做出另外的變更和修改。所以,所附申請專利範圍意欲解釋為包括較佳實施例以及落入本申請範圍的所有變更和修改。
最後,還需要說明的是,在本文中,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個......”限定的要素,並不排除在包括該要素的過程、方法、物品或者設備中還存在另外的相同要素。
以上對本申請所提供的一種搜索資料排序的方法,一 種搜索資料排序的裝置,一種資料搜索的方法,以及,一種資料搜索的裝置進行了詳細介紹,本文中應用了具體個例對本申請的原理及實施方式進行了闡述,以上實施例的說明只是用於幫助理解本申請的方法及其核心思想;同時,對於本領域的一般技術人員,依據本申請的思想,在具體實施方式及應用範圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本申請的限制。

Claims (30)

  1. 一種搜索資料排序的方法,其特徵在於,包括:生成中庸需求點的資料;該中庸需求點的資料包括搜索目標的參考屬性值;根據該中庸需求點的資料,對相應搜索目標的資料集合進行排序,具體包括:獲取該搜索目標的資料集合,並獲取該資料集合中一個或多個搜索目標的當前屬性值;計算該一個或多個搜索目標的當前屬性值與參考屬性值的距離;按照該距離對該資料集合中的一個或多個搜索目標進行排序。
  2. 如申請專利範圍第1項所述的方法,其中,該生成中庸需求點的資料的步驟包括:獲得包含一個或多個該搜索目標的歷史搜索結果,提取該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值;依據該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值。
  3. 如申請專利範圍第2項所述的方法,其中,採用如下公式計算質心: 其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值。
  4. 如申請專利範圍第2項所述的方法,其中,該包含一個或多個該搜索目標的歷史搜索結果包括,多個用戶發起搜索獲得的包含一個或多個該搜索目標的歷史搜索結果;該依據一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值的子步驟進一步包括:1)分別採用如下公式計算s個用戶的質心,其中,s為大於1的正整數: 其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值;2)獲得s個用戶的質心{Y1,Y2,...,Ys};3)採用如下公式在該s個用戶的質心中進一步求取質心作為搜索目標的參考屬性值: 其中,Yi為從Y1~Ys
  5. 如申請專利範圍第4項所述的方法,其中,該多個用戶為多個近鄰用戶,該近鄰用戶包括用戶行為相似度大於第一預設閾值的用戶集合。
  6. 如申請專利範圍第2或第3或第4或第5項所述的 方法,其中,該搜索目標的參考屬性值、歷史屬性值、當前屬性值均表示為一個n維的向量X={x1,x2,…,xn},其中,該n為正整數。
  7. 如申請專利範圍第1或2或3或4或5項所述的方法,其中,該根據中庸需求點的資料對相應的搜索目標資料集合進行排序的步驟還包括:在該搜索目標的資料集合中去除特定搜索目標,該特定搜索目標為其當前屬性值與參考屬性值的距離大於第二預設閾值的搜索目標。
  8. 一種資料搜索的方法,其特徵在於,包括:生成中庸需求點的資料;該中庸需求點的資料包括搜索目標的參考屬性值;獲取發起搜索用戶的行為資訊;根據該發起搜索用戶的行為資訊提取適配的中庸需求點的資料;根據該適配的中庸需求點的資料獲取對應的搜索目標的資料集合返回給該發起搜索用戶;其中,該搜索目標的資料集合中的一個或多個搜索目標具有當前屬性值,該一個或多個搜索目標按照其當前屬性值與搜索目標的參考屬性值的距離進行排序。
  9. 如申請專利範圍第8項所述的方法,其中,該生成中庸需求點的資料的步驟包括:獲得包含一個或多個該搜索目標的歷史搜索結果,提取該一個或多個搜索目標的歷史屬性值及歷史搜索排序權 值;依據該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值。
  10. 如申請專利範圍第9項所述的方法,其中,採用如下公式計算質心: 其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值。
  11. 如申請專利範圍第9項所述的方法,其中,該包含一個或多個該搜索目標的歷史搜索結果包括,多個用戶發起搜索獲得的包含一個或多個該搜索目標的歷史搜索結果;該依據一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值的子步驟進一步包括:1)分別採用如下公式計算s個用戶的質心,其中,s為大於1的正整數: 其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值;2)獲得s個用戶的質心{Y1,Y2,...,Ys};3)採用如下公式在該s個用戶的質心中進一步求取 質心作為搜索目標的參考屬性值: 其中,Yi為從Y1~Ys
  12. 如申請專利範圍第11項所述的方法,其中,該多個用戶為多個近鄰用戶,該近鄰用戶包括用戶行為相似度大於第一預設閾值的用戶集合。
  13. 如申請專利範圍第9或10或11或12項所述的方法,其中,該搜索目標的參考屬性值、歷史屬性值、當前屬性值均表示為一個n維的向量X={x1,x2,…,xn},其中,該n為正整數。
  14. 如申請專利範圍第12項所述的方法,其中,該根據發起搜索用戶的行為資訊提取適配的中庸需求點的資料的步驟包括:計算該發起搜索用戶的行為資訊與近鄰用戶集合的行為相似度;若大於第一預設閾值,則判定該發起搜索用戶的行為資訊屬於該近鄰用戶集合;提取該發起搜索用戶所屬的近鄰用戶集合對應的搜索目標的參考屬性值,將該搜索目標的參考屬性值作為該發起搜索用戶適配的中庸需求點的資料。
  15. 如申請專利範圍第8或第9或第10或第11或第12或第14項所述的方法,其中,該根據適配的中庸需求點的資料獲取對應的搜索目標的資料集合返回給該發起搜 索用戶的步驟包括:獲取包含一個或多個該搜索目標的當前搜索結果,提取該一個或多個搜索目標的當前屬性值;分別計算該一個或多個搜索目標的當前屬性值與該屬性參考值的距離;按照該距離對該一個或多個搜索目標進行排序;將該排序後的搜索目標資料集合返回給用戶。
  16. 如申請專利範圍第15項所述的方法,其中,該根據適配的中庸需求點的資料獲取對應的搜索目標的資料集合返回給該發起搜索用戶的步驟還包括:在該搜索目標的資料集合中去除特定搜索目標,該特定搜索目標為其當前屬性值與參考屬性值的距離大於第二預設閾值的搜索目標。
  17. 一種搜索資料排序的裝置,其特徵在於,包括:中庸需求點生成模組,用於生成中庸需求點的資料;該中庸需求點的資料包括搜索目標的參考屬性值;中庸需求點排序模組,用於根據該中庸需求點的資料,對相應搜索目標的資料集合進行排序,具體包括:搜索結果獲取子模組,用於獲取該搜索目標的資料集合,並獲得該資料集合中一個或多個搜索目標的當前屬性值;距離計算子模組,用於計算該一個或多個搜索目標的當前屬性值與參考屬性值的距離;排序子模組,用於按照該距離對該資料集合中的一個 或多個搜索目標進行排序。
  18. 如申請專利範圍第17項所述的裝置,其中,該中庸需求點生成模組包括:歷史搜索結果分析子模組,用於獲得包含一個或多個該搜索目標的歷史搜索結果,提取該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值;中庸需求點計算子模組,用於依據該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值。
  19. 如申請專利範圍第18項所述的裝置,其中,採用如下公式計算質心: 其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值。
  20. 如申請專利範圍第18項所述的裝置,其中,該包含一個或多個該搜索目標的歷史搜索結果包括,多個用戶發起搜索獲得的包含一個或多個該搜索目標的歷史搜索結果;該中庸需求點計算子模組進一步包括:單用戶質心計算單元,用於分別採用如下公式計算s個用戶的質心,其中,s為大於1的正整數: 其中,k為搜索目標的個數,m為搜索目標的歷史搜 索排序權值,Xi為搜索目標的歷史屬性值;質心資料組織單元,用於獲得s個用戶的質心{Y1,Y2,...,Ys};多用戶質心計算單元,用於採用如下公式在該s個用戶的質心中進一步求取質心作為搜索目標的參考屬性值: 其中,Yi為從Y1~Ys
  21. 如申請專利範圍第20項所述的裝置,其中,該多個用戶為多個近鄰用戶,該近鄰用戶包括用戶行為相似度大於第一預設閾值的用戶集合。
  22. 如申請專利範圍第17或第18或第19或第20或第21項所述的裝置,其中,該中庸需求點排序模組還包括:篩選子模組,用於在該搜索目標的資料集合中去除特定搜索目標,該特定搜索目標為其當前屬性值與參考屬性值的距離大於第二預設閾值的搜索目標。
  23. 一種資料搜索的裝置,其特徵在於,包括:中庸需求點生成模組,用於生成中庸需求點的資料;該中庸需求點的資料包括搜索目標的參考屬性值;用戶行為獲取模組,用於獲取發起搜索用戶的行為資訊;適配需求點提取模組,用於根據該發起搜索用戶的行為資訊提取適配的中庸需求點的資料; 搜索結果返回模組,用於根據該適配的中庸需求點的資料獲取對應的搜索目標的資料集合返回給該發起搜索用戶;其中,該搜索目標的資料集合中的一個或多個搜索目標具有當前屬性值,該一個或多個搜索目標按照其當前屬性值與搜索目標的參考屬性值的距離進行排序。
  24. 如申請專利範圍第23項所述的裝置,其中,該中庸需求點生成模組包括:歷史搜索結果分析子模組,用於獲得包含一個或多個該搜索目標的歷史搜索結果,提取該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值;中庸需求點計算子模組,用於依據該一個或多個搜索目標的歷史屬性值及歷史搜索排序權值計算質心,將該質心作為搜索目標的參考屬性值。
  25. 如申請專利範圍第24項所述的裝置,其中,採用如下公式計算質心: 其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值。
  26. 如申請專利範圍第24項所述的裝置,其中,該包含一個或多個該搜索目標的歷史搜索結果包括,多個用戶發起搜索獲得的包含一個或多個該搜索目標的歷史搜索結果;該中庸需求點計算子模組進一步包括:單用戶質心計算單元,用於分別採用如下公式計算s 個用戶的質心,其中,s為大於1的正整數: 其中,k為搜索目標的個數,m為搜索目標的歷史搜索排序權值,Xi為搜索目標的歷史屬性值;質心資料組織單元,用於獲得s個用戶的質心{Y1,Y2,...,Ys};多用戶質心計算單元,用於採用如下公式在該s個用戶的質心中進一步求取質心作為搜索目標的參考屬性值: 其中,Yi為從Y1~Ys
  27. 如申請專利範圍第26項所述的裝置,其中,該多個用戶為多個近鄰用戶,該近鄰用戶包括用戶行為相似度大於第一預設閾值的用戶集合。
  28. 如申請專利範圍第27項所述的裝置,其中,該適配需求點提取模組包括:行為相似度計算子模組,用於計算該發起搜索用戶的行為資訊與近鄰用戶集合的行為相似度;判定子模組,用於在該行為相似度大於第一預設閾值時,判定該發起搜索用戶的行為資訊屬於該近鄰用戶集合;適配點獲取子模組,用於提取該發起搜索用戶所屬的近鄰用戶集合對應的搜索目標的參考屬性值,將該搜索目標的參考屬性值作為該發起搜索用戶適配的中庸需求點的 資料。
  29. 如申請專利範圍第23或第24或第25或第26或第27或第28項所述的裝置,其中,該搜索結果返回模組包括:搜索結果獲取子模組,用於獲取包含一個或多個該搜索目標的當前搜索結果,提取該一個或多個搜索目標的當前屬性值;距離計算子模組,用於分別計算該一個或多個搜索目標的當前屬性值與該屬性參考值的距離;排序子模組,用於按照該距離對該一個或多個搜索目標進行排序;回饋子模組,用於將該排序後的搜索目標資料集合返回給用戶。
  30. 如申請專利範圍第29項所述的裝置,其中,該搜索結果返回模組還包括:篩選子模組,用於在該搜索目標的資料集合中去除特定搜索目標,該特定搜索目標為其當前屬性值與參考屬性值的距離大於第二預設閾值的搜索目標。
TW102107869A 2012-12-25 2013-03-06 搜索資料排序的方法和裝置,資料搜索的方法和裝置 TW201426357A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210572391.5A CN103902549B (zh) 2012-12-25 2012-12-25 搜索数据排序的方法和装置,数据搜索的方法和装置

Publications (1)

Publication Number Publication Date
TW201426357A true TW201426357A (zh) 2014-07-01

Family

ID=49956398

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102107869A TW201426357A (zh) 2012-12-25 2013-03-06 搜索資料排序的方法和裝置,資料搜索的方法和裝置

Country Status (5)

Country Link
US (1) US20140181067A1 (zh)
EP (1) EP2939147A1 (zh)
CN (1) CN103902549B (zh)
TW (1) TW201426357A (zh)
WO (1) WO2014105571A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI766522B (zh) * 2020-12-31 2022-06-01 鴻海精密工業股份有限公司 資料處理方法、裝置、電子設備及存儲介質

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9953065B2 (en) 2015-02-13 2018-04-24 International Business Machines Corporation Method for processing a database query
CN106951516B (zh) * 2017-03-18 2020-07-17 深圳市彬讯科技有限公司 一种基于大数据的装修选品智能排序方法
CN110020094B (zh) * 2017-07-14 2023-06-13 阿里巴巴集团控股有限公司 一种搜索结果的展示方法和相关装置
CN109300021A (zh) * 2018-11-29 2019-02-01 爱保科技(横琴)有限公司 保险推荐方法及装置
CN110378770A (zh) * 2019-07-25 2019-10-25 上海尊溢商务信息咨询有限公司 一种电商运营选款推荐的方法及装置
CN116578602B (zh) * 2023-06-15 2024-03-12 深圳计算科学研究院 一种时序排序方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3347088B2 (ja) * 1999-02-12 2002-11-20 インターナショナル・ビジネス・マシーンズ・コーポレーション 関連情報検索方法およびシステム
JP4227072B2 (ja) * 2004-05-18 2009-02-18 日本電信電話株式会社 おすすめ番組提供方法、おすすめ番組提供装置およびおすすめ番組提供プログラム
US20080208800A1 (en) * 2004-07-15 2008-08-28 Innovation Business Partners, Inc. Method and System For Increasing Invention
US20060190425A1 (en) * 2005-02-24 2006-08-24 Yuan-Chi Chang Method for merging multiple ranked lists with bounded memory
CN101154287A (zh) * 2006-09-29 2008-04-02 阿里巴巴公司 一种过滤商品信息的方法及系统
CN101013491A (zh) * 2006-10-17 2007-08-08 钟权 一种实现商品信息汇集并按价格排名竞争发布的方法
US7974974B2 (en) * 2008-03-20 2011-07-05 Microsoft Corporation Techniques to perform relative ranking for search results
CN101957828B (zh) * 2009-07-20 2013-03-06 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法和装置
US9135305B2 (en) * 2010-03-24 2015-09-15 Google Inc. Ranking object search results
US20120005045A1 (en) * 2010-07-01 2012-01-05 Baker Scott T Comparing items using a displayed diagram

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI766522B (zh) * 2020-12-31 2022-06-01 鴻海精密工業股份有限公司 資料處理方法、裝置、電子設備及存儲介質

Also Published As

Publication number Publication date
CN103902549A (zh) 2014-07-02
WO2014105571A1 (en) 2014-07-03
US20140181067A1 (en) 2014-06-26
CN103902549B (zh) 2017-12-12
EP2939147A1 (en) 2015-11-04

Similar Documents

Publication Publication Date Title
US11507975B2 (en) Information processing method and apparatus
US11797626B2 (en) Search result filters from resource content
JP6266080B2 (ja) 類似性スコアに基づきコンテンツアイテムと画像とのマッチングを評価する方法、およびシステム
US8903794B2 (en) Generating and presenting lateral concepts
TW201426357A (zh) 搜索資料排序的方法和裝置,資料搜索的方法和裝置
JP6247292B2 (ja) クエリ拡張
US9251292B2 (en) Search result ranking using query clustering
US9128988B2 (en) Search result ranking by department
US10984056B2 (en) Systems and methods for evaluating search query terms for improving search results
JP2017157192A (ja) キーワードに基づいて画像とコンテンツアイテムをマッチングする方法
WO2013163062A1 (en) Recommending keywords
CN103886487A (zh) 基于分布式的b2b平台的个性化推荐方法与系统
EP2443546A1 (en) Generating ranked search results using linear and nonlinear ranking models
WO2021082123A1 (zh) 信息推荐方法及装置、电子设备
CN102063453A (zh) 一种用于基于用户的需求进行搜索的方法和设备
US20130290138A1 (en) Search Method, Apparatus and Server for Online Trading Platform
WO2013082506A1 (en) Method and apparatus for information searching
TWI705411B (zh) 社交業務特徵用戶的識別方法和裝置
CN103309869A (zh) 数据对象的展示关键词推荐方法及系统
JP2017157193A (ja) 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法
CN107169821B (zh) 大数据查询推荐方法及其系统
US20140344114A1 (en) Methods and systems for segmenting queries
US9183251B1 (en) Showing prominent users for information retrieval requests
TWI476611B (zh) Search results generation method and information search system
JP2021072099A (ja) 製品の需要及び供給に基づくクエリ・オートコンプリートのためのキーワード・ランキング