TW201913415A - 搜尋方法及裝置 - Google Patents
搜尋方法及裝置 Download PDFInfo
- Publication number
- TW201913415A TW201913415A TW107119974A TW107119974A TW201913415A TW 201913415 A TW201913415 A TW 201913415A TW 107119974 A TW107119974 A TW 107119974A TW 107119974 A TW107119974 A TW 107119974A TW 201913415 A TW201913415 A TW 201913415A
- Authority
- TW
- Taiwan
- Prior art keywords
- user
- type
- behavior
- historical behavior
- search
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本發明提供了一種搜尋方法及裝置,在依據搜尋關鍵字確定搜尋結果的過程中,從與用戶發生歷史行為的對象的具有關聯關係的擴展對象中,確定與搜尋關鍵字相關的對象,作為搜尋結果的一部分,因此,搜尋結果能夠更貼近用戶的行為習慣,對於用戶而言,更為準確。
Description
本發明關於電子資訊領域,尤其關於一種搜尋方法及裝置。
搜尋引擎是網站最常見的功能。用戶在搜尋引擎中輸入關鍵字後,搜尋引擎依據關鍵字查詢到相關的搜尋結果,並對搜尋結果進行排序顯示。例如,電子商務網站的搜尋引擎接收到用戶輸入的關鍵字後,查詢到與關鍵字相關的商品資訊,並對商品資訊進行排序,再按照排序結果向用戶展示各個商品資訊。 然而現有的搜尋方法,僅依據關鍵字輸出搜尋結果,而沒有考慮到其它因素,所以,無法得到面向用戶而言更加準確的搜尋結果。
本發明提供了一種搜尋方法及裝置,目的在於解決如何得到面向用戶更加準確的搜尋結果的問題。 為了實現上述目的,本發明提供了以下技術方案: 一種搜尋方法,包括: 依據用戶的搜尋關鍵字確定第一類對象,所述第一類對象為與所述搜尋關鍵字相關的對象; 基於所述用戶的歷史行為,確定所述用戶的歷史行為對象; 確定與所述歷史行為對象具有關聯關係的擴展對象; 確定所述擴展對象中與所述關鍵字相關的第二類對象; 對搜尋結果進行綜合排序,所述搜尋結果包括所述第一類對象和所述第二類對象。 可選地,所述基於所述用戶的歷史行為,確定所述用戶的歷史行為對象包括: 從所述用戶的歷史行為資料中獲取所述用戶的歷史行為對象; 所述確定與所述歷史行為對象具有關聯關係的擴展對象包括: 計算任意一個對象i與任意一個用戶的種子對象j之間的行為相似性和/或,其中,表示該用戶同時對i和j有行為的次數之和,表示該用戶在s情況下t時間範圍內同時對i和j有行為p的次數之和; 依據各個對象與各個用戶的歷史行為對象之間的相似性得到所述擴展對象,所述相似性至少包括所述行為相似性。 可選地,在所述對搜尋結果進行綜合排序之前,還包括: 如果所述第二類對象的數量小於預設值,則增大所述第一類對象在所述搜尋結果中的占比。 可選地,所述對搜尋結果進行綜合排序包括: 計算所述搜尋結果的排序分數,所述第二類對象具有相似排序分數和常規排序分數,所述與所述第一類對象具有所述常規排序分數,所述相似排序分數和常規排序分數不同。 可選地,所述相似排序分數基於所述第二類對象與所述用戶的歷史行為對象的相似度以及種子權重確定,所述種子權重依據所述第二類對象所屬的類目、用戶對所述第二類對象的行為類型和行為發生的時間確定。 可選地,所述相似排序分數為所述相似度與所述種子權重的乘積。 可選地,所述相似排序分數進一步基於所述用戶的歷史行為對象和所述第二類對象的價格差。 可選地,在所述對搜尋結果進行綜合排序之後,還包括: 按照所述排序分數展示所述搜尋結果。 一種搜尋裝置,包括: 第一確定模組,用於依據用戶的搜尋關鍵字確定第一類對象,所述第一類對象為與所述搜尋關鍵字相關的對象; 第二確定模組,用於基於所述用戶的歷史行為,確定所述用戶的歷史行為對象; 第三確定模組,用於確定與所述歷史行為對象具有關聯關係的擴展對象; 第四確定模組,用於確定所述擴展對象中與所述關鍵字相關的第二類對象; 排序模組,用於對搜尋結果進行綜合排序,所述搜尋結果包括所述第一類對象和所述第二類對象。 可選地,所述第二確定模組具體用於: 從所述用戶的歷史行為資料中獲取所述用戶的歷史行為對象; 所述第三確定模組具體用於: 計算任意一個對象i與任意一個用戶的種子對象j之間的行為相似性和/或,其中,表示該用戶同時對i和j有行為的次數之和,表示該用戶在s情況下t時間範圍內同時對i和j有行為p的次數之和; 依據各個對象與各個用戶的歷史行為對象之間的相似性得到所述擴展對象,所述相似性至少包括所述行為相似性。 可選地,還包括: 控制模組,用於在所述排序模組對搜尋結果進行綜合排序之前,如果所述第二類對象的數量小於預設值,則增大所述第一類對象在所述搜尋結果中的占比。 可選地,所述排序模組具體用於: 計算所述搜尋結果的排序分數,所述第二類對象具有相似排序分數和常規排序分數,所述與所述第一類對象具有所述常規排序分數,所述相似排序分數和常規排序分數不同。 可選地,所述相似排序分數基於所述第二類對象與所述用戶的歷史行為對象的相似度以及種子權重確定,所述種子權重依據所述第二類對象所屬的類目、用戶對所述第二類對象的行為類型和行為發生的時間確定。 可選地,所述相似排序分數所述相似度與所述種子權重的乘積。 可選地,所述相似排序分數進一步基於所述用戶的歷史行為對象和所述第二類對象的價格差。 可選地,還包括: 展示模組,用於按照所述排序分數展示所述搜尋結果。 一種搜尋方法,包括: 基於用戶的歷史行為,確定所述用戶的歷史行為對象; 確定與所述歷史行為對象具有關聯關係的擴展對象; 確定所述擴展對象中與搜尋關鍵字相關的結果對象; 對所述結果對象進行排序。 本發明所述的搜尋方法及裝置,在依據搜尋關鍵字確定搜尋結果的過程中,從與用戶發生歷史行為的對象的具有關聯關係的擴展對象中,確定與搜尋關鍵字相關的對象,作為搜尋結果的一部分,因此,搜尋結果能夠更貼近用戶的行為習慣,對於用戶而言,更為準確。
本發明實施例揭示的搜尋方法,可以應用在網站(例如電子商務網站)的伺服器上。所述伺服器用於運行網站,在網站的搜尋引擎接收到搜尋關鍵字後,伺服器不僅依據關鍵字給出搜尋結果,還依據輸入關鍵字的用戶的歷史行為資訊給出搜尋結果,從而提高搜尋結果面向該用戶的準確性。 下面將結合本發明實施例中的圖式,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。 圖1為本發明實施例揭示的一種搜尋方法,包括以下步驟: S101:接收用戶輸入的搜尋關鍵字,並搜尋與搜尋關鍵字相關的對象,簡稱為第一類對象。 以電子商務網站為例,用戶在網站的搜尋引擎中輸入搜尋關鍵字“運動鞋”,則伺服器依據搜尋關鍵字給出相關的商品“運動鞋”的資訊。依據搜尋關鍵字得到相關的對象的方式可以參見現有技術,這裡不再贅述。 S102:基於所述用戶的歷史行為,確定所述用戶的歷史行為對象。 其中, 用戶的歷史行為對象為用戶發生過歷史行為的對象。 以電子商務網站為例,通常,電子商務網站可以依據用戶的註冊資訊識別用戶的身分資訊,即識別出輸入關鍵字的用戶是用戶A。 用戶A發生歷史行為(行為包括但不限於收藏、點擊、購買)的商品為用戶A的歷史行為商品(對象)。 S103:確定與用戶的歷史行為對象具有關聯關係的擴展對象。 擴展對象與用戶的歷史行為對象具有關聯關係,關聯關係可以為相似關係、或者具有相同屬性、或者具有相同的用戶歷史行為等。接上例,與用戶A的歷史行為商品屬於相同品牌的商品為關聯商品。 S104:確定擴展對象中與搜尋關鍵字相關的第二類對象。 S105:對搜尋結果進行綜合排序,搜尋結果包括第一類對象和第二類對象。 具體地,可以分別從第一類對象和第二類對象中選擇對象作為搜尋結果,其中,搜尋結果中,第一類對象和第二類對象的數量滿足一定占比。 本實施例中,占比可以為預先設定的固定值,也可以依據第一類對象和第二類對象的數量調整。具體地,如果第二類對象的數量小於預設值,則增加第一類對象的占比。例如,對於一種新商品,可能不存在用戶的歷史行為商品,也就不存在第二類對象,在這種情況下,第二類對象的數量為零,則要將第一類對象的占比調整為1。反之,在另一種極端情況下,可以僅將第二類對象作為待展示的對象,在此情況下,可以跳過S101。 綜合排序是指,將第一類對象和第二類對象作為整體進行排序,而不是將第一類對象排序再將第二類對象排序。也就是說,將第一類對象和第二類對象一起進行排序。 下面以圖2(a)-圖2(c)為例,對圖1所示的搜尋方法以及使用該搜尋方法後的效果,進行舉例說明: 用戶在圖2(a)所示的商品列表中點擊圖2(a)列表頂端所示的眼霜,所以,伺服器後臺記錄圖2(a)所示的眼霜為用戶的歷史行為商品,並在網站中所有的商品中,查詢與圖2(a)所示的眼霜的相似商品,查詢完成後在後臺記錄。 圖2(b)為用戶在搜尋引擎中輸入“眼霜”後,伺服器依據“眼霜”搜尋得到的商品。圖2(b)也是現有的搜尋方法展示給用戶的搜尋結果。 圖2(c)為圖1所示的搜尋方法得到的搜尋結果,搜尋結果的呈現過程為:伺服器基於關鍵字“眼霜”,從網站的全部商品中搜尋得到圖2(b)所示的商品,並且,基於關鍵字“眼霜”,從後臺記錄的與圖2(a)所示的眼霜的相似商品中搜尋,得到搜尋結果。再從兩次得到的搜尋結果中各自選擇一部分商品,形成最終的搜尋結果向用戶展示。 如圖2(c)所示,最終的搜尋結果中包括從圖2(a)所示的眼霜的相似商品中選擇出的一部分商品(第二類對象,圖2(a)所示的眼霜的箭頭指向的商品),以及從圖2(b)搜尋得到的商品中選擇出的一部分商品(第一類對象,圖2(b)所示的眼霜的箭頭指向的商品),第一類對象和第二類對象的數量成一定的占比。 從圖1所示的過程可以看出,搜尋結果中除了依據搜尋關鍵字搜尋出的對象外,還包括與用戶發生歷史行為的對象相似的擴展對象,因此,搜尋結果能夠更貼近用戶的行為習慣,對於用戶而言,更為準確。 具體地,以關聯關係為相似關係為例,S102的具體實現過程如圖3所示,包括以下步驟: S301:獲取各個用戶的歷史行為對象。 如前所述,一個用戶的種子對象是指該用戶發生歷史行為的對象。伺服器可以先從網站的歷史運行資料中獲得各個用戶的歷史行為資料,可選的,可以對各個用戶的歷史行為資料進行過濾,再從過濾後的資料中篩選出各個用戶的歷史行為對象。 用戶的歷史行為資料表示用戶對對象產生的歷史行為。例如用戶收藏、點擊或購買商品。也就是說,一份歷史行為資料包括用戶、對象以及行為資訊。 從用戶、對象以及行為資訊三方面考慮,以電子商務網站為例,具體的過濾方式包括但不限於以下任意一種: 1、過濾掉屬於黑名單的用戶的歷史行為資料,以防止駭客透過作弊行為獲得種子商品。 2、同一個用戶在預設時間段內(如一天內)用戶對同一個對象的多次行為。 3、過濾掉行為時間小於第一預設時間值(例如1秒)和/或大於第二時間值(例如360秒)的用戶歷史行為資料。 例如,用戶瀏覽某商品的詳情頁面的時間不足1秒,則視為無效點擊或者用戶點擊後完全不感興趣,因此,這樣的歷史行為資料可以看作雜訊。或者,對用戶點擊後停留時間大於360秒,可能是用戶離開沒有關閉頁面導致的無效瀏覽時間,因此,這樣的歷史行為資料也可以看作雜訊。 4、過濾掉用戶對自家對象產生的歷史行為資料,例如,用戶點擊的商品是自家的商品,則需要過濾掉這種用戶歷史行為資料。 5、過濾掉行為次數超過預設數值的資料。例如,要過濾掉點擊數超過10000的商品的用戶歷史行為資料。原因在於,這種商品與大部分商品的相似度都很高,因此會影響其它商品進入相似對象程式庫。 S302:計算網站上目前包括的各個對象與各個用戶的歷史行為對象之間的綜合相似度。 行為相似度如式(1)所示:(1)其中,表示對象i和j的行為相似度,對所有用戶是否對對象(i,j)同時有行為的次數求和。表示用戶u是否對對象i有行為,是為1,反之為0;表示用戶u是否對商品i和商品j同時有行為,是為1,反之為0。 進一步地,實際上,不同行為如點擊和購買,用戶付出的成本不同,因此資料的可信度和重要性也不一樣。不同情況如推薦和搜尋下的行為資料,也具有差異。共同行為發生在多長的時間範圍內,對於相似度的認定也有不同的影響,例如,當天和一個月前共同點擊過的商品有關聯性的可能性比較小。綜合考慮到上述因素,本實施例中,區分行為類型,行為時間,行為情況進行相似度計算,如式(2):(2) 表示用戶u對對象i在s情況下t時間範圍是否有p行為;表示用戶u對對象i和j在s情況下t時間範圍內是否同時有p行為類型,是為1,反之為0。表示對象i和j在s情況下t時間範圍內p種行為類型下的次數之和。 以電子商務網站上的常見的兩種行為類型:點擊和購買為例(將收藏商品合併為點擊,加購合併為購買),可以得到點擊-點擊,點擊-購買,購買-購買3種行為組合。再以全網資料和搜尋情況資料以及1天和3天兩種時間範圍為例,按照式(2),對象i和j總計可以得到3x2x2種相似度。 本實施例中,將式(1)和式(2)所示的相似度統稱為對象的行為相似度。在實際應用中,可以使用式(1)和/或式(2)得到對象的行為相似度。 除了對象的行為相似度外,還可以計算對象的內容相似度。對象的內容相似度主要包括對象間的圖像和/或文本的相似度。對象的內容相似度的計算方式可以參見現有技術,這裡不再贅述。 可以基於行為相似度和內容相似度,得到綜合相似度,作為網站上目前包括的各個對象與各個用戶的歷史行為對象之間的相似度。 S303:依據上述得到的綜合相似度,確定擴展對象。 具體地,可以將相似度滿足閾值的對象確定為擴展對象。 從圖3的步驟可以看出,每次搜尋均需執行S301-S303,為了減輕搜尋過程中的線上計算壓力,可選地,可以按照S301-S303的原理訓練模型,使用訓練好的模型離線預測出每個歷史行為對象的擴展對象,具體地: 將上述獲得的綜合相似度作為邏輯回歸模型的輸入,在不同情況下訓練邏輯回歸模型,得到相似對象模型。 具體地,以電子商務網站為例,將上述獲得的相似度輸入邏輯回歸模型作為特徵,加入商品人氣分等代表商品品質的特徵一起訓練。為獲取跟情況需求一致的相似資料,用搜尋下的樣本進行訓練,即在搜尋時,給用戶展現根據用戶的歷史行為商品推出的相似商品,用戶若點擊或購買為正樣本,反之為負樣本。使用正樣本和負樣本訓練邏輯回歸模型。可選地,可以使用現有的工具評估模型的好壞。 需要說明的是,訓練過程可以在搜尋之前進行,模型訓練好後,可以離線預測出每個歷史行為對象的相似對象,以減輕搜尋過程中的線上計算壓力。 圖4為本發明實施例揭示的又一種搜尋方法,與圖1所示的方法相比,圖4中,分別對第一類對象和第二類對象進行打分,以得到更為準確的搜尋排序。 圖4中包括以下步驟: S401:接收用戶輸入的搜尋關鍵字。 S402:搜尋與搜尋關鍵字相關的對象,簡稱為第一類對象。 S403:獲取與用戶的歷史行為對象具有關聯關係的擴展對象中,與搜尋關鍵字相關的相似對象,簡稱為第二類對象。 具體地,可以依據預先設定的相似對象模型,獲取擴展對象。 S404:分別從第一類對象和第二類對象中選擇待展示的對象,其中,待展示的對象中,第一類對象和第二類對象的數量滿足一定占比。 S405:計算待展示的對象中的第二類對象的相似排序分數。 本實施例中,按照式(3)計算第二類對象的相似排序分數:(3) 其中,Score表示排序分數,是對象類目cate、行為類型type和行為時間time對應的種子權重(可以預先為不同對象類目、不同行為類型和行為時間設定對應的種子權重,例如,女裝、一個月內的購買行為的種子權重為1,女裝、一個月內的收藏行為的種子權重為0.5),是離線計算好的相似度,即S302中得到的綜合相似度。 具體地,的計算方式為:用不同的對象類目、用戶對對象的行為類型和用戶對對象的行為時間作為特徵,訓練邏輯回歸模型,學習出不同類目下不同行為類型不同行為時間的重要性,即這裡的。 本實施例中,考慮了種子權重和對象間的相似度。不同行為類型,行為時間的對象具有不同的重要性。種子權重會根據用戶對該對象的行為類型(例如點擊、購買),行為發生的時間來確定,同時因為不同類目受到時間的影響不同,例如家電等長時間才需要購買一次,服飾等受到季節影響,變化會比較快,所以,對象所屬的類目也是確定種子權重的因素之一。 除了式(3)之外,在電子商務網站中,還可以加入價格作為打分的依據,如式(4):(4) 其中,是種子對象和相似對象的價格差,表示調控價格的參數,當為正時表示將比種子對象價格高的相似對象上提,為負則反之,表示最終相似排序分。可以根據需求和人工經驗預先設定,也可以透過Q-Learning
模型學習確定。 在實際應用中,可以酌情使用式(3)或式(4)。 S406:計算待展示的對象中的第一類對象和第二類對象的常規排序分數。 計算常規排序分數的具體方式可以參見現有技術,例如,按照商品的在一個月之內的銷量打分,銷量越高分數越高。這裡不再贅述。 S407:按照相似排序分數和常規排序分數對待展示的對象進行排序展示。 需要說明的是,對於具有兩類排序分數的第二類對象,可以綜合兩類分數得到一個最終的分數,例如,將兩類分數取平局值,或者,先權重相乘求和後再取平均值。 本發明實施例還揭示了一種搜尋方法,包括以下步驟: 1、基於用戶的歷史行為,確定所述用戶的歷史行為對象。 2、確定與所述歷史行為對象具有關聯關係的擴展對象。 3、確定所述擴展對象中與搜尋關鍵字相關的結果對象。 前三步驟的具體實現方式可以參見上述實施例,這裡不再贅述。 4、對所述結果對象進行排序。 排序的方式可以為:使用相似性排序分進行排序,或者,使用常規排序分進行排序。 本實施例所述的搜尋方法,僅執行圖4所示的搜尋方法中的S403和S405,即僅將歷史相似對象作為關鍵字的搜尋庫。 圖5為本發明實施例揭示的一種搜尋裝置,包括:第一確定模組、第二確定模組、第三確定模組、第四確定模組和排序模組。 其中,第一確定模組用於依據用戶的搜尋關鍵字確定第一類對象,所述第一類對象為與所述搜尋關鍵字相關的對象。第二確定模組用於基於所述用戶的歷史行為,確定所述用戶的歷史行為對象。第三確定模組用於確定與所述歷史行為對象具有關聯關係的擴展對象。第四確定模組用於確定所述擴展對象中與所述關鍵字相關的第二類對象。排序模組用於對搜尋結果進行綜合排序,所述搜尋結果包括所述第一類對象和所述第二類對象。 可選地,圖5所示的裝置還可以包括:控制模組,用於如果所述第二類對象的數量小於預設值,則增大所述第一類對象在所述搜尋結果中的占比。以及,展示模組,用於按照排序分數展示搜尋結果。 以上各個模組實現各自功能的具體方式,可以參見上述方法實施例,這裡不再贅述。 圖5所示的搜尋裝置,可以設定在網站(例如電子商務網站)的伺服器上。在網站的搜尋引擎接收到搜尋關鍵字後,所述裝置不僅依據搜尋關鍵字給出搜尋結果,還依據輸入搜尋關鍵字的用戶的歷史行為資訊給出搜尋結果,從而提高搜尋結果面向該用戶的準確性。 本發明實施例方法所述的功能如果以軟體功能單元的形式實現並作為獨立的產品銷售或使用時,可以被儲存在一個計算設備可讀取儲存媒體中。基於這樣的理解,本發明實施例對現有技術做出貢獻的部分或者該技術方案的部分可以以軟體產品的形式體現出來,該軟體產品被儲存在一個儲存媒體中,包括若干指令用以使得一台計算設備(可以是個人電腦、伺服器、行動計算裝置或者網路設備等)執行本發明各個實施例所述方法的全部或部分步驟。而前述的儲存媒體包括:U碟、行動硬碟、唯讀記憶體(ROM,Read-Only Memory)、隨機存取記憶體(RAM,Random Access Memory)、磁碟或者光碟等各種可以儲存程式碼的媒體。 本說明書中各個實施例採用漸進的方式描述,每個實施例重點說明的都是與其它實施例的不同之處,各個實施例之間相同或相似部分互相參見即可。 對所揭示的實施例的上述說明,使本領域專業技術人員能夠實現或使用本發明。對這些實施例的多種修改對本領域的專業技術人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發明的精神或範圍的情況下,在其它實施例中實現。因此,本發明將不會被限制於本文所示的這些實施例,而是要符合與本文所揭示的原理和新穎特點相一致的最寬的範圍。
S101‧‧‧方法步驟
S102‧‧‧方法步驟
S103‧‧‧方法步驟
S104‧‧‧方法步驟
S105‧‧‧方法步驟
S301‧‧‧方法步驟
S302‧‧‧方法步驟
S303‧‧‧方法步驟
S401‧‧‧方法步驟
S402‧‧‧方法步驟
S403‧‧‧方法步驟
S404‧‧‧方法步驟
S405‧‧‧方法步驟
S406‧‧‧方法步驟
S407‧‧‧方法步驟
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的圖式作簡單地介紹,顯而易見地,下面描述中的圖式僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些圖式獲得其他的圖式。 圖1為本發明實施例揭示的一種搜尋方法的流程圖; 圖2(a)-2(c)為本發明實施例揭示的搜尋方法與現有技術的頁面顯示效果對比圖; 圖3為本發明實施例揭示的建立相似對象模型的方法的流程圖; 圖4為本發明實施例揭示的又一種搜尋方法的流程圖; 圖5為本發明實施例揭示的搜尋裝置的結構示意圖。
Claims (17)
- 一種搜尋方法,其特徵在於,該方法包括: 依據用戶的搜尋關鍵字確定第一類對象,該第一類對象為與該搜尋關鍵字相關的對象; 基於該用戶的歷史行為,確定該用戶的歷史行為對象; 確定與該歷史行為對象具有關聯關係的擴展對象; 確定該擴展對象中與該關鍵字相關的第二類對象;以及 對搜尋結果進行綜合排序,該搜尋結果包括該第一類對象和該第二類對象。
- 根據申請專利範圍第1項所述的方法,其中,該基於該用戶的歷史行為,確定該用戶的歷史行為對象包括: 從該用戶的歷史行為資料中獲取該用戶的歷史行為對象,且 該確定與該歷史行為對象具有關聯關係的擴展對象包括: 計算任意一個對象i與任意一個用戶的種子對象j之間的行為相似性和/或,其中,表示該用戶同時對i和j有行為的次數之和,表示該用戶在s情況下t時間範圍內同時對i和j有行為p的次數之和;以及 依據各個對象與各個用戶的歷史行為對象之間的相似性得到該擴展對象,該相似性至少包括該行為相似性。
- 根據申請專利範圍第1或2項所述的方法,其中,在該對搜尋結果進行綜合排序之前,還包括: 如果該第二類對象的數量小於預設值,則增大該第一類對象在該搜尋結果中的占比。
- 根據申請專利範圍第1或2項所述的方法,其中,該對搜尋結果進行綜合排序包括: 計算該搜尋結果的排序分數,該第二類對象具有相似排序分數和常規排序分數,該第一類對象具有該常規排序分數,該相似排序分數和該常規排序分數不同。
- 根據申請專利範圍第4項所述的方法,其中,該相似排序分數基於該第二類對象與該用戶的歷史行為對象的相似度以及種子權重來確定,該種子權重依據該第二類對象所屬的類目、用戶對該第二類對象的行為類型和行為發生的時間確定。
- 根據申請專利範圍第5項所述的方法,其中,該相似排序分數為該相似度與該種子權重的乘積。
- 根據申請專利範圍第6項所述的方法,其中,該相似排序分數進一步基於該用戶的歷史行為對象和該第二類對象的價格差。
- 根據申請專利範圍第4項所述的方法,其中,在該對搜尋結果進行綜合排序之後,還包括: 按照該排序分數展示該搜尋結果。
- 一種搜尋裝置,其特徵在於,該裝置包括: 第一確定模組,用於依據用戶的搜尋關鍵字確定第一類對象,該第一類對象為與該搜尋關鍵字相關的對象; 第二確定模組,用於基於該用戶的歷史行為,確定該用戶的歷史行為對象; 第三確定模組,用於確定與該歷史行為對象具有關聯關係的擴展對象; 第四確定模組,用於確定該擴展對象中與該關鍵字相關的第二類對象;以及 排序模組,用於對搜尋結果進行綜合排序,該搜尋結果包括該第一類對象和該第二類對象。
- 根據申請專利範圍第9項所述的裝置,其中,該第二確定模組具體用於: 從該用戶的歷史行為資料中獲取該用戶的歷史行為對象,且 該第三確定模組具體用於: 計算任意一個對象i與任意一個用戶的種子對象j之間的行為相似性和/或,其中,表示該用戶同時對i和j有行為的次數之和,表示該用戶在s情況下t時間範圍內同時對i和j有行為p的次數之和;以及 依據各個對象與各個用戶的歷史行為對象之間的相似性得到該擴展對象,該相似性至少包括該行為相似性。
- 根據申請專利範圍第9或10項所述的裝置,其中,該裝置還包括: 控制模組,用於在該排序模組對搜尋結果進行綜合排序之前,如果該第二類對象的數量小於預設值,則增大該第一類對象在該搜尋結果中的占比。
- 根據申請專利範圍第9或10項所述的裝置,其中,該排序模組具體用於: 計算該搜尋結果的排序分數,該第二類對象具有相似排序分數和常規排序分數,該第一類對象具有該常規排序分數,該相似排序分數和常規排序分數不同。
- 根據申請專利範圍第12項所述的裝置,其中,該相似排序分數基於該第二類對象與該用戶的歷史行為對象的相似度以及種子權重確定,該種子權重依據該第二類對象所屬的類目、用戶對該第二類對象的行為類型和行為發生的時間確定。
- 根據申請專利範圍第13項所述的裝置,其中,該相似排序分數為該相似度與該種子權重的乘積。
- 根據申請專利範圍第14項所述的裝置,其中,該相似排序分數進一步基於該用戶的歷史行為對象和該第二類對象的價格差。
- 根據申請專利範圍第12項所述的裝置,其中,該裝置還包括: 展示模組,用於按照該排序分數展示該搜尋結果。
- 一種搜尋方法,其特徵在於,該方法包括: 基於用戶的歷史行為,確定該用戶的歷史行為對象; 確定與該歷史行為對象具有關聯關係的擴展對象; 確定該擴展對象中與搜尋關鍵字相關的結果對象;以及 對該結果對象進行排序。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710757313.5A CN109446402B (zh) | 2017-08-29 | 2017-08-29 | 一种搜索方法及装置 |
??201710757313.5 | 2017-08-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201913415A true TW201913415A (zh) | 2019-04-01 |
Family
ID=65437406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107119974A TW201913415A (zh) | 2017-08-29 | 2018-06-11 | 搜尋方法及裝置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20190065611A1 (zh) |
CN (1) | CN109446402B (zh) |
TW (1) | TW201913415A (zh) |
WO (1) | WO2019046329A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110580278B (zh) * | 2019-07-30 | 2023-05-26 | 平安科技(深圳)有限公司 | 根据用户画像的个性化搜索方法、系统、设备及存储介质 |
CN111475725B (zh) * | 2020-04-01 | 2023-11-07 | 百度在线网络技术(北京)有限公司 | 用于搜索内容的方法、装置、设备和计算机可读存储介质 |
CN112040250A (zh) * | 2020-07-21 | 2020-12-04 | 拉扎斯网络科技(上海)有限公司 | 一种信息处理方法、信息处理装置、存储介质和电子设备 |
CN113763005A (zh) * | 2020-09-23 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 图片广告推送方法、电子设备及计算机可读存储介质 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7346839B2 (en) * | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
CN101751422A (zh) * | 2008-12-08 | 2010-06-23 | 北京摩软科技有限公司 | 一种移动终端智能搜索的方法、移动终端和服务器 |
CN101908184A (zh) * | 2009-06-04 | 2010-12-08 | 维鹏信息技术(上海)有限公司 | 一种通过多个具有关联的终端发布信息的控制方法及系统 |
CN102479366A (zh) * | 2010-11-25 | 2012-05-30 | 阿里巴巴集团控股有限公司 | 一种商品推荐方法及系统 |
CN102254028A (zh) * | 2011-07-22 | 2011-11-23 | 青岛理工大学 | 一种集成属性和结构相似性的个性化商品推荐方法和系统 |
US9020835B2 (en) * | 2012-07-13 | 2015-04-28 | Facebook, Inc. | Search-powered connection targeting |
CN103793388B (zh) * | 2012-10-29 | 2017-08-25 | 阿里巴巴集团控股有限公司 | 搜索结果的排序方法和装置 |
US9292515B1 (en) * | 2013-03-15 | 2016-03-22 | Google Inc. | Using follow-on search behavior to measure the effectiveness of online video ads |
US20140280174A1 (en) * | 2013-03-16 | 2014-09-18 | Elan Bitan | Interactive user-controlled search direction for retrieved information in an information search system |
CN104102328B (zh) * | 2013-04-01 | 2017-10-03 | 联想(北京)有限公司 | 信息处理方法和信息处理设备 |
CN104636402B (zh) * | 2013-11-13 | 2018-05-01 | 阿里巴巴集团控股有限公司 | 一种业务对象的分类、搜索、推送方法和系统 |
CN104731830B (zh) * | 2013-12-24 | 2017-02-22 | 腾讯科技(深圳)有限公司 | 一种推荐方法、装置及服务器 |
CN104794135B (zh) * | 2014-01-21 | 2018-06-29 | 阿里巴巴集团控股有限公司 | 一种对搜索结果进行排序的方法和装置 |
US10031913B2 (en) * | 2014-03-29 | 2018-07-24 | Camelot Uk Bidco Limited | Method, system and software for searching, identifying, retrieving and presenting electronic documents |
KR101670412B1 (ko) * | 2015-04-03 | 2016-10-31 | 경북대학교 산학협력단 | 작업현장의 아차사고 모니터링 시스템 및 이를 이용한 모니터링 방법 |
CN104933172A (zh) * | 2015-06-30 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 一种基于用户搜索行为的信息推送方法和装置 |
CN106446210A (zh) * | 2016-09-30 | 2017-02-22 | 四川九洲电器集团有限责任公司 | 一种多媒体文件搜索方法、服务器及客户端 |
-
2017
- 2017-08-29 CN CN201710757313.5A patent/CN109446402B/zh active Active
-
2018
- 2018-06-11 TW TW107119974A patent/TW201913415A/zh unknown
- 2018-08-28 WO PCT/US2018/048387 patent/WO2019046329A1/en active Application Filing
- 2018-08-28 US US16/115,324 patent/US20190065611A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20190065611A1 (en) | 2019-02-28 |
WO2019046329A1 (en) | 2019-03-07 |
CN109446402A (zh) | 2019-03-08 |
CN109446402B (zh) | 2022-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6356744B2 (ja) | ウェブサイト横断情報を表示する方法およびシステム | |
Zhao et al. | Exploring demographic information in social media for product recommendation | |
Jannach et al. | What recommenders recommend: an analysis of recommendation biases and possible countermeasures | |
CN107424043B (zh) | 一种产品推荐方法及装置,电子设备 | |
TWI512508B (zh) | Recommended methods and systems for recommending information | |
US9489688B2 (en) | Method and system for recommending search phrases | |
CN107341268B (zh) | 一种热搜榜排序方法及系统 | |
TWI694401B (zh) | 融合用戶關係資料的搜尋方法和裝置 | |
US20180260848A1 (en) | Information processing method and apparatus | |
TW201913415A (zh) | 搜尋方法及裝置 | |
US20120143883A1 (en) | Ranking product information | |
WO2015081219A1 (en) | Individualized data search | |
TW201501059A (zh) | 訊息推薦方法及裝置 | |
Brovman et al. | Optimizing similar item recommendations in a semi-structured marketplace to maximize conversion | |
CN103345517B (zh) | 模拟tf-idf相似性计算的协同过滤推荐算法 | |
WO2015148393A1 (en) | Data search processing | |
TW201417019A (zh) | 搜尋結果的排序方法和裝置 | |
US20140288999A1 (en) | Social character recognition (scr) system | |
EP2778985A1 (en) | Search result ranking by department | |
WO2015066591A1 (en) | Ranking information providers | |
US10157411B1 (en) | Recommendation system that relies on RFM segmentation | |
WO2014144348A2 (en) | Using entity repository to enhance advertisement display | |
JP5938009B2 (ja) | 情報推薦装置、情報推薦方法及び情報推薦プログラム | |
TWI476611B (zh) | Search results generation method and information search system | |
TW201911079A (zh) | 搜尋方法及裝置 |