TW201911080A - 搜索方法、搜索伺服器和搜索系統 - Google Patents

搜索方法、搜索伺服器和搜索系統 Download PDF

Info

Publication number
TW201911080A
TW201911080A TW107120135A TW107120135A TW201911080A TW 201911080 A TW201911080 A TW 201911080A TW 107120135 A TW107120135 A TW 107120135A TW 107120135 A TW107120135 A TW 107120135A TW 201911080 A TW201911080 A TW 201911080A
Authority
TW
Taiwan
Prior art keywords
copy
user
product
search
cluster
Prior art date
Application number
TW107120135A
Other languages
English (en)
Inventor
王國鑫
Original Assignee
香港商阿里巴巴集團服務有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 香港商阿里巴巴集團服務有限公司 filed Critical 香港商阿里巴巴集團服務有限公司
Publication of TW201911080A publication Critical patent/TW201911080A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces

Abstract

本發明提供了一種搜索方法、搜索伺服器和搜索系統,其中,該方法包括:獲取使用者的特徵資料和搜索關鍵字;根據所述使用者的特徵資料和所述搜索關鍵字,產生關聯有產品簇的文案;在對應於所述搜索關鍵字的搜索結果瀏覽介面,顯示所述關聯有產品簇的文案。利用本發明實施例提供的技術方案,可以更有效地使得使用者繼續留在搜索介面,有效提高了使用者的點擊率和成交率。

Description

搜索方法、搜索伺服器和搜索系統
本發明屬於網際網路技術領域,尤其涉及一種搜索方法、搜索伺服器和搜索系統。
隨著網際網路技術的發展,越來越多的人透過網路完成產品的購買,這也就帶動了電子產務的發展。在電子產務的環境中,搜索一直是消費者尋找產品最主要的方式。   在進行搜索和產品瀏覽的過程中,電子產品平臺往往希望為使用者提供更為貼合使用者搜索意圖的產品,從而達到提高平臺成交率的目的。   現有的產務平臺,在使用者輸入搜索關鍵字之後,往往僅是呈現出基於該搜索關鍵字的產品,最多是出現與當前搜索關鍵字相似的關鍵字,從而促使使用者對相似關鍵字進行點擊,以觸發新的搜索,從而提高使用者瀏覽的時間。即,透過推薦新的搜索關鍵字給使用者的方式,提升使用者留在搜索介面的時長,以盡可能滿足使用者最終的購物需求。
本發明目的在於提供一種搜索方法、搜索伺服器和搜索系統,可以實現基於文案的產品簇顯示,以提高搜索後的點擊率和轉化率。   本發明提供一種搜索方法、搜索伺服器和搜索系統是這樣實現的:   一種搜索方法,所述方法包括:   獲取使用者的特徵資料和搜索關鍵字;   根據所述使用者的特徵資料和所述搜索關鍵字,產生關聯有產品簇的文案;   在對應於所述搜索關鍵字的搜索結果瀏覽介面,顯示所述關聯有產品簇的文案。   一種搜索伺服器,包括:   獲取模組,用於獲取使用者的特徵資料和搜索關鍵字;   產生模組,用於根據所述使用者的特徵資料和所述搜索關鍵字,產生關聯有產品簇的文案;   顯示模組,用於在對應於所述搜索關鍵字的搜索結果瀏覽介面,顯示所述關聯有產品簇的文案。   一種搜索系統,包括:上述的搜索伺服器和多個使用者用戶端,其中,所述使用者用戶端用於獲取使用者輸入的搜索關鍵字和呈現所述搜索伺服器顯示的文案,並在接收到使用者對所述文案的點擊指令後,顯示所述文案關聯的產品簇。   一種搜索方法,包括:   獲取使用者的特徵資料和搜索關鍵字;   根據所述使用者的特徵資料和所述搜索關鍵字,產生關聯有產品簇的文案;   在對應於所述搜索關鍵字的使用者購買行為結果介面,顯示所述關聯有產品簇的文案。   一種電腦可讀儲存媒體,其上儲存有電腦程式,該程式被處理器執行時實現上述方法的步驟。   本發明提供的搜索方法、搜索伺服器和搜索系統,透過使用者的特徵資料和搜索關鍵字等產生關聯有產品簇的文案,並將關聯有產品簇的文案推送給使用者。因為採用文案的方式推送給使用者,從而可以更有效地使得使用者繼續留在搜索介面,有效提高了使用者的點擊率和成交率。
為了使本技術領域的人員更好地理解本發明中的技術方案,下面將結合本發明實施例中的圖式,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都應當屬於本發明保護的範圍。   請參閱圖1,本發明提供了一種搜索系統,可以包括:使用者用戶端100和搜索伺服器200,所述使用者用戶端100與所述搜索伺服器200耦合。所述搜索系統中可以有一個或多個使用者用戶端100。   在一個實施方式中,所述使用者用戶端100可以是可移動設備。例如,可以是手機、平板電腦等。所述使用者用戶端100還可以是桌面設備,例如:一體機等。   使用者可以在不同場景下利用不同的使用者用戶端100登陸搜索伺服器200進行搜索操作,搜索伺服器200為了使得使用者在進行目標物件搜索的時候,為了使得使用者可以在搜索結果介面持續進行搜索瀏覽,可以在使用者瀏覽搜索結果的過程中,向使用者推送關聯有產品簇的文案,從而使得使用者透過使用者用戶端100登陸到電子產務平臺進行產品搜索的時候,可以有效延長使用者瀏覽的時長,以便提高平臺的點擊率和成交率。   在一個實施方式中,上述搜索伺服器200可以獲取使用者的特徵資料和搜索關鍵字,然後根據使用者的特徵資料和搜索關鍵字,產生關聯有產品簇的文案;在對應於搜索關鍵字的搜索結果瀏覽介面,推送所述關聯有產品簇的文案。   舉例而言,張三透過使用者用戶端100登陸到電子產務平臺搜索“牛仔褲”,這時獲取的搜索關鍵字就是“牛仔褲”,按照常規方式會形成如圖2所示的搜索結果頁面。在本例中,同時可以獲取張三的特徵資料,例如:“年齡:28歲”“性別:男”等。如圖3所示,可以推送為張三產生的幾個文案,例如:“品質達人必選牛仔褲”等給張三,如果張三點開該文案,則可以看到如圖4所示的產品頁面,瀏覽到該文案所關聯的牛仔褲產品的集合,從而可以進一步提高張三繼續瀏覽的興趣,以便提高點擊率和成交率。   在另一個實施方式中,上述搜索伺服器200在產生關聯有產品簇的文案之後,不僅可以在搜索介面頁面顯示,還可以在其它的頁面顯示,例如,可以在加購物車動作頁面、刪除產品動作頁面,創建訂單動作頁面,刪除訂單動作頁面等進行顯示,還可以在使用者完成訂單頁面,或者是使用者對訂單進行評價頁面等進行顯示,甚至可以在使用者從瀏覽過程中,或者是購買過程中切換至主頁面的時候,在主頁面顯示。還可以是採用消息推送方式等,直接以軟體提醒消息或者是軟體推送消息等將該關聯有產品簇的文案推送給使用者。上述所列舉的多種對產生的關聯有產品簇的文案的呈現方式,僅是一種示例性說明,在實際實現的時候,其它的可以呈現的方式都是可以被構想的,本發明對此不作限定。   在一個具體實施方式中,上述搜索伺服器200可以根據使用者的特徵資料,確定在搜索關鍵字下使用者的基礎特徵向量,然後,獲取產品簇集合,其中,所述產品簇集合中儲存若干個產品簇,且每個產品簇對應一個產品簇特徵向量;根據使用者的基礎特徵向量、每個產品簇的產品簇特徵向量、以及所述使用者的歷史點擊行為資料,從產品簇集合中選取預設數量個產品簇;為預設數量個產品簇匹配產生文案。   即,在搜索伺服器200中已經先聚合得到了多個產品簇集合,例如:牛仔褲,搜索伺服器200中就已經聚合得到了多個基於牛仔褲的產品簇,那麼在獲取了使用者的基礎特徵向量後,就可以基於使用者的基礎特徵向量以及使用者的歷史點擊行為,從這些產品簇中選擇幾個以文案方式推送的產品簇。該使用者的歷史點擊行為,可以包括但不限於:使用者最近幾天的基於牛仔褲的搜索點擊購買行為、使用者基於牛仔褲的收藏行為、使用者基於牛仔褲的歷史購買記錄等等。同時還需要使用者本次搜索時候的瀏覽點擊記錄等等。因為這些是即時的使用者行為資料,如果透過這些即時行為對所有的產品簇進行排序選擇,會導致計算效率較低。因此,上述搜索伺服器200可以先透過使用者的基本特徵,進行一個篩選,選出適合該使用者(例如:張三)的產品簇做成候選產品簇集合(例如,選擇100個)。然後,再透過使用者的即時歷史行為資料,從這100個中選擇幾個最為匹配的幾個產品簇作為最終推送的產品簇,例如,可以從這100個中選擇三個作為最終推送的產品簇。   具體地,上述搜索伺服器200可以從產品簇集合中選取產品簇特徵向量與使用者的基礎特徵向量之間的相似度超出預設閾值的若干個產品簇組成候選產品簇集合;然後,獲取所述使用者的歷史點擊行為資料;根據所述使用者的歷史點擊行為資料,從所述候選產品簇集合中選取匹配度最高的預設數量個產品簇。   在選取出了要推送的產品簇之後,就可以為這些產品簇匹配文案。例如,最終選擇了匹配度最高的三個產品簇,那麼就可以為這三個產品簇產生文案。在產生文案的時候,可以但不限於按照以下方式之一進行:   方式1)從預先建立的文案集合中,為預設數量個產品簇中的各個產品簇分別選擇一個文案。即,預先建立了一個文案集合,直接從中挑選即可。   方式2)獲取使用者對歷史文案的點擊率資料,根據點擊率資料和搜索關鍵字、結合產品簇中產品的特徵,為預設數量個產品簇中的各個產品簇分別產生一個文案。即,按照使用者的選擇和喜好,直接產生文案。   然而,為了使得可以在短時間內,可以產生符合使用者個性化需求的文案。可以離線產生文案集合,然後根據使用者對文案的歷史點擊情況,產生使用者-文本的點擊率預估模型,基於該預估模型,確定對該使用者而言點擊率高的文案作為最終確定的文案,作為產品簇的文案進行推送。   舉例而言,對於搜索關鍵字“牛仔褲”,產生了兩種類型的文案:強轉化類文案(例如:品質達人必買牛仔褲)和內容類別文案(例如:牛仔褲怎麼搭配才好看)。進一步的,確定出使用者張三點擊內容類別文案的概率更好,即,點擊:牛仔褲怎麼搭配才好看的可能性更高。因此,將文案“牛仔褲怎麼搭配才好看”作為挑選出的幾個產品簇中一個產品簇的文案進行推送,在使用者點擊該文案之後,就可以呈現出該文案所關聯的產品簇中產品的資訊。   搜索伺服器200在進行上述歷史文案集合搜集的過程中,可以先獲取歷史文案的文案資訊,例如,獲取文案中的攜帶的:類目、產品、品牌、發佈時間、投放轉化率、成交轉化率和關鍵字等資訊,然後,再根據歷史文案的文案資訊,選擇文案產生所述文案集合。   在一個實施方式中,搜索伺服器200為了可以從預先建立的文案集合中,為預設數量個產品簇中的各個產品簇分別選擇一個文案,且選擇的文案點擊率更高,搜索伺服器200可以獲取使用者對歷史文案的點擊率資料,然後,根據使用者對歷史文案的點擊率資料,對文案集合中的各個文案按照點擊率高低進行排序;最後,選擇與待產生文案的產品簇匹配的,且點擊率高的文案,作為待產生文案的產品簇的文案。   上述所列舉的產生文案的方式,僅是一種示意性描述,在實際實現的時候,還可以選擇其它的方式產生並選擇文案,本發明對此不作限定。   在一個實施方式中,所述搜索伺服器200可以在預測的當前搜索的跳失點處推送產生的關聯有產品簇的文案,以使得使用者可以繼續在搜索介面,其中,跳失點指的是使用者在當前頁面無法完成交易的時候,就會離開搜尋網頁面,業內一般將使用者離開搜尋網頁面的位置稱為跳失點。   在預測使用者當前搜索的跳失點的時候,可以是根據使用者的歷史搜索瀏覽記錄確定的,例如,可以統計使用者歷史瀏覽記錄一般在瀏覽到第幾頁的時候離開,那麼就可以將這一頁作為跳失點。例如,該使用者經常在看完搜索結果頁面的第三頁之後離開,那麼就可以將瀏覽結果的第三頁作為跳失點。當然,還可以採用其它的方式確定,例如:使用者在搜索結果介面點擊產品的頻率等,都可以作為預測跳失點的方式,   然而值得注意的是,上述所列舉的預測跳失點的方式僅是一種示意性描述,本發明對此不作限定。   在一個實施方式中,所述搜索伺服器200除了在預測的跳失點附近顯示該文案,還可以在其它地方顯示或推送該文案,例如,在使用者瀏覽過程中的任何時間段,或者是週期性地推送方式等。具體的推送時間點,本發明不作具體限定。   在一個實施方式中,上述使用者用戶端100可以獲取使用者輸入的搜索關鍵字,還可以呈現搜索伺服器推送的文案,並在接收到使用者對文案的點擊指令後,顯示文案關聯的產品簇。   下面結合具體的場景和系統處理流程對上述搜索系統的執行過程進行說明,然而,值得注意的是,該具體實施例僅是為了更好地說明本發明,並不構成對本發明的不當限定。   在本例中,考慮到使用者真正的搜索意圖很難透過搜索關鍵字直接體現出來,因此考慮可以透過文案配合產品簇的方式來更為貼切地表達消費者的需求,從而與消費者產生互動。即,在使用者輸入搜索詞之後,瀏覽搜索結果的過程中,推薦文案給使用者,使用者點擊文案後,則可以進入與該文案關聯的產品簇的集合頁面。基於此,提出了一種基於文案推送產品簇的方案,具體地,可以根據使用者即時的瀏覽點擊行為,自動確定是否可以推薦產品簇並使用文案的方式將產品簇展現是給使用者。透過文案的方式進行產品簇的推送,可以有效提升使用者對於搜索的滿意度,從而達到提升點擊量和成交量的目的。   從整體流程而言,可以包括以下步驟:   S1:透過使用者輸入的關鍵字、使用者的基本資訊、以及使用者的行為資料等,挖掘一批產品形成推薦產品簇;   S2:利用搜集的歷史文案資料,計算產品簇與文案之間的相似關係,然後組合產品簇和文案;   S3:建立點擊模型,將建立的關聯有產品簇的文案以點擊模型的方式直接推薦給使用者。   舉例而言,當使用者搜索“牙刷”後,如果採用直接推送近似關鍵字的方式,就會為使用者推薦“奈米牙刷”,“牙刷套裝”等詞相關的關鍵字給使用者,引導使用者繼續點擊,點擊後會發起新的搜索。   在本例中,當使用者搜索“牙刷”後,會推薦例如:“嬰幼兒乳牙牙刷選購“、“量販裝牙刷趕緊囤貨”等這種類似的文案給使用者,在使用者點擊文案後,會進入與該文案關聯的產品簇。   由此可見,透過推薦相似搜索關鍵字的方式,本質上是一種搜索導航,使用者在點擊後表現為針對當前搜索關鍵字的進一步細化,其技術方案是針對關鍵字點擊來建模,是以關鍵字為出發點。因為在模型中不引入點擊後的產品結果,因此,無法直接解決使用者更加需要推薦合適產品的需求。   在本例中,基於即時推薦的技術,從推薦合適產品滿足使用者需求的角度出發,針對使用者的搜索意圖建模,直接從使用者可能感興趣的產品角度觸發,匹配出推薦的產品簇,這樣使得推送的結果更為符合使用者的需求,透過打破關鍵字描述和吸引力不足的問題,建立了文案和產品簇之間的關聯,直接將符合自然語音的文案推送給消費者,並可以在文案評估演算法中,引入使用者與歷史文案之間的行為關係,做到個性化的文案推薦的目的。   在實現的時候,具體的,搜索伺服器200可以包括如下模組:使用者即時行為特徵計算模組、產品簇選擇排序模組、文案產生模組等模組。具體的,這些模組可以執行以下操作:   1)使用者即時行為特徵計算模組:   採集使用者當前的搜索關鍵字、使用者最近一段時間的點擊行為、加購行為和購買行為等資料,在即時計算平臺上,加工成為能夠描述使用者當前偏好的特徵向量。   其中,上述特徵向量可以分為:基礎特徵和排序特徵,其中,基礎特徵用於獲取候選產品簇,排序特徵用於排序策略。因此,基礎特徵(使用者的性別、年齡等)選擇比較固定的、不依賴即時計算的特徵。在實現的時候,可以透過離線流程儲存在不同的系統中。排序特徵(使用者點擊的產品、品牌、店鋪等)則需要強依賴即時計算能力,透過快速的變化來滿足最優化排序的需求。   2)產品簇選擇排序模組:   透過上述的基礎特徵可以匹配出相關並且靜態分較高的產品簇(假設有50個),這些產品簇,可以是依據產品-產品相似演算法圍繞熱門產品和業務規則,即時產生的。   對上述50個產品簇進行排序,選取前3個作為最終選定的產品簇。具體地,可以使用排序服務,針對使用者特徵向量和產品簇特徵向量做運算,以獲取產品簇的排名。   3)文案產生模組:   對於完成排序的產品簇,根據產品向量和文本向量之間的關係,可以從文案庫或者文本庫中選擇文本,組成關聯文案,並建立文案與產品簇之間的關聯關係。   待使用者看到文案後,可以將使用者是否點擊以及點擊後是否購買等行為回饋給產品簇產生模組和排序策略模組中進行優化。   在一個實施方式中,在對目標物件進行特徵資料表達的時候,可以採用如下幾種類型的特徵資料形成特徵向量。舉例而言,以使用者作為目標物件為例,那麼使用者的性別、年齡和手機類型、使用者歷史上對產品簇中產品是喜歡還是忽略、使用者上一次對產品點擊的日期與當前時間的差值、使用者在文本下的跳失比例和轉化率等都可以作為形成特徵向量的特徵資料。   為了使得特徵資料可以更進一步地反映使用者的喜好特徵,可以建立使用者與文字之間的關聯關係、使用者與賣家之間的關聯關係、使用者與產品之間的關聯關係、或者產品和文字之間的關聯關係等。例如:使用者偏愛哪種類型的文字、使用者偏愛哪些賣家、使用者偏愛哪些類型的產品、某種類型的產品習慣採用哪種文字描述等。即,將使用者、賣家、產品、文字進行關聯,以使得特徵資料可以更全面反映特徵。   然而值得注意的是,上述所列舉特徵資料所包含的內容僅是一種示意性描述,還可以採用其它類型的內容作為特徵資料,只要能描述目標物件的特徵即可,本發明對此不作限定。   在執行的過程中,還可以透過即時行為資料回饋來計算排序特徵。具體地,可以透過線上日誌收集系統,獲取使用者對於推薦消息的滿意度(例如:是否點擊、點擊後是否購買等)資料來更新使用者、產品簇的排序特徵,從而來更新排序策略和優化產品簇的產生邏輯。   如圖5所示,在完成使用者以及產品簇的特徵抽取之後,可以獲得使用者基礎特徵向量和產品簇基礎特徵向量,可以將其保存在不同的服務系統中。當使用者發起一次訪問,線上服務可以去獲取並計算使用者在當前關鍵字下的基礎特徵向量,可以將該向量稱為“查詢向量”。透過查詢向量發起對產品簇儲存系統的查詢,獲取向量相似度最高的一批產品簇組成候選集合。即,透過計算查詢向量與產品簇基礎特徵向量之間的相似性比對,可以對產品簇進行一次快速篩選,過濾掉大部分不相關的產品簇,為下一步做詳細排序降低運算消耗。在進行相似性比較的時候,可以採用計算向量距離的方法,確定相似性大小。   在獲取到候選集合之後,由於候選集合中的產品簇數量不會特別多,因此,可以支援更為複雜的計算。具體地,可以對候選集合中的產品簇進行排序,以優化使用者點擊行為。因此,可以採用歷史使用者行為作為樣本,使用排序特徵來進行監督學習,以最優化點擊率。在獲取候選產品簇集合的時候,可以使用不同的相似度計算方法來實現快速降低檢索範圍的目的。   假設從候選集合中選出了前N個(top N)的產品簇,那麼就對這top N的產品簇進行文案產生操作。即,為排序結果靠前的產品簇形成文案。   在一個實施方式中,可以從歷史文案庫中選取文案作為選出的產品簇的文案。其中,歷史文案庫可以是人工產生的大量的文案。在從歷史文案庫中匹配為產品簇匹配文案的時候,可以是基於使用者對具體文案的行為資料進行的。例如,可以從使用者對具體文案的行為資料中抽取文本排序特徵,然後基於使用者的文本排序特徵產生使用者對文案的偏好模型。基於使用者對文案的偏好模型,可以為不同的使用者提供不同的文案。   下面結合一個具體場景對上述方法進行說明:   使用者A進入到搜索介面後,對系統而言可以獲取到使用者本身的資料u、使用者輸入的搜索關鍵字q和使用者最近的行為資料d。   例如:使用者A搜索“牛仔褲”並有過一些點擊行為,那麼可以將使用者本身的資料u、使用者輸入的搜索關鍵字q和使用者最近的行為資料d整合為產品簇查詢向量,其中可以包含如下內容:   1) 搜索關鍵字q對應的類目資訊,例如:“牛仔褲”對應的是男女裝下的牛仔褲類目。   2)使用者本身的人口統計資訊,例如:年齡、性別等。   3)使用者最近的點擊產品、品牌以及店鋪的資料。   透過這些資訊,如圖6所示,可以從產品簇線上查詢服務中獲取到top M個相關產品簇,假設獲取到100個產品簇,這個過程可以稱為產品簇的粗排序。   然後,可以對粗排得到的100個產品簇進行打分,從中選出分值最高的若干個產品簇作為最終匹配出的要進行推送的產品簇,例如,選擇分值最高的三個產品簇作為最終要推送的產品簇,這個過程可以稱為產品簇的細排。   文案產生流程可以分為離線流程和線上流程:   1)離線流程   離線過程中可以是對從電子產務平臺上搜集來的歷史文案進行整理分析。   例如,收集到文案:“冬季有型又保暖,一條加絨牛仔褲幫你搞定”,那麼離線分析可以包括抽取文案的如下資訊:   a:文案對應的類目、產品、品牌和發佈時間等資訊;   b:文案投放的點擊率和成交轉化率;   c: 文案中的核心關鍵字。   2)線上流程   線上過程中可以透過離線流程中所抽取的資訊,為精排後的3個產品簇尋找合適的文案,需要注意的是,產品簇與文案之間可以是多對多的關係,因此,針對不同的使用者可以預先建立一個使用者-文本的點擊率預估模型。例如:同樣是牛仔褲,有些使用者可能比較喜歡強轉化類的文案“品質達人必買牛仔褲”,有些使用者則比較喜歡內容類別的文案“牛仔褲怎麼搭配才好看?”。那麼透過預先建立的使用者-文本的點擊率預估模型進行文案選擇,可以確定出更為適合的文案,從而可以有效提升使用者的點擊率。   透過上述處理,就可以產生符合使用者個性的關聯有產品簇的文案,將這些文案推送給使用者,使用者點擊文案後就可以看到對應的產品簇。在推送文案的時候,可以在確定的預測的使用者的跳失點處進行推送,也可以直接在使用者瀏覽的過程中在搜索結果頁面直接進行推送,推送的位置本發明不作限定。   如圖7所示,在本發明實施例中還提供了一種搜索方法,可以包括如下步驟:   步驟701:獲取使用者的特徵資料和搜索關鍵字;   步驟702:根據所述使用者的特徵資料和所述搜索關鍵字,產生關聯有產品簇的文案;   在一個實施方式中,可以按照以下步驟產生關聯有產品簇的文案,包括:   S1:根據所述使用者的特徵資料,確定在所述搜索關鍵字下,所述使用者的基礎特徵向量;   其中,使用者的基礎特徵向量可以包括但不限於以下至少之一:使用者的年齡、使用者的性別、使用者所在的城市。   S2:獲取產品簇集合,其中,所述產品簇集合中儲存若干個產品簇,且每個產品簇對應一個產品簇特徵向量;   S3:根據所述使用者的基礎特徵向量、每個產品簇的產品簇特徵向量、以及所述使用者的歷史點擊行為資料,從所述產品簇集合中選取預設數量個產品簇;   在實現的時候,可以先進行粗選,再進行細選。在粗選的時候,採用一些基礎的靜態資料進行選擇,在細選的時候,根據使用者的歷史事實行為資料進行選擇。具體地,可以從產品簇集合中選取產品簇特徵向量與使用者的基礎特徵向量之間的相似度超出預設閾值的若干個產品簇組成候選產品簇集合;獲取所述使用者的歷史點擊行為資料;根據所述使用者的歷史點擊行為資料,從候選產品簇集合中選取匹配度最高的預設數量個產品簇。   S4:為所述預設數量個產品簇匹配產生文案。   在產生文案的時候,可以採用以下方式之一執行:   方式1)從預先建立的文案集合中,為所述預設數量個產品簇中的各個產品簇分別選擇一個文案,其中,該文案集合可以透過獲取歷史文案的文案資訊,其中,所述文案資訊包括以下至少之一:類目、產品、品牌、發佈時間、投放轉化率、成交轉化率和關鍵字;根據所述歷史文案的文案資訊,選擇文案產生的文案集合。   具體地,可以獲取使用者對歷史文案的點擊率資料;根據所述使用者對歷史文案的點擊率資料,對所述文案集合中的各個文案集合按照點擊率高低進行排序;選擇與待產生文案的產品簇匹配的,且點擊率高的文案,作為待產生文案的產品簇的文案。   方式2)獲取使用者對歷史文案的點擊率資料;根據所述點擊率資料和所述搜索關鍵字、結合產品簇中產品的特徵,為所述預設數量個產品簇中的各個產品簇分別產生一個文案。   步驟703:在對應於所述搜索關鍵字的搜索結果瀏覽介面(或者是使用者購買行為結果介面等),顯示所述關聯有產品簇的文案。   本發明提供的搜索方法、搜索伺服器和搜索系統,透過使用者的特徵資料和搜索關鍵字等產生關聯有產品簇的文案,並推送該文案,因為採用文案的方式推送給使用者,從而可以更有效地使得使用者繼續留在搜索介面,有效提高了使用者的點擊率和成交率。   雖然本發明提供了如實施例或流程圖所述的方法操作步驟,但基於常規或者無創造性的勞動可以包括更多或者更少的操作步驟。實施例中列舉的步驟順序僅僅為眾多步驟執行順序中的一種方式,不代表唯一的執行順序。在實際中的裝置或用戶端產品執行時,可以按照實施例或者圖式所示的方法循序執行或者並存執行(例如並行處理器或者多執行緒處理的環境)。   上述實施例闡明的裝置或模組,具體可以由電腦晶片或實體實現,或者由具有某種功能的產品來實現。為了描述的方便,描述以上裝置時以功能分為各種模組分別描述。在實施本發明時可以把各模組的功能在同一個或多個軟體和/或硬體中實現。當然,也可以將實現某功能的模組由多個子模組或子單元組合實現。   本發明中所述的方法、裝置或模組可以以電腦可讀程式碼方式實現控制器按任何適當的方式實現,例如,控制器可以採取例如微處理器或處理器以及儲存可由該(微)處理器執行的電腦可讀程式碼(例如軟體或韌體)的電腦可讀媒體、邏輯閘、開關、專用積體電路(Application Specific Integrated Circuit,ASIC)、可程式設計邏輯控制器和嵌入微控制器的形式,控制器的例子包括但不限於以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,記憶體控制器還可以被實現為記憶體的控制邏輯的一部分。本領域技術人員也知道,除了以純電腦可讀程式碼方式實現控制器以外,完全可以透過將方法步驟進行邏輯程式設計來使得控制器以邏輯閘、開關、專用積體電路、可程式設計邏輯控制器和嵌入微控制器等的形式來實現相同功能。因此這種控制器可以被認為是一種硬體部件,而對其內部包括的用於實現各種功能的裝置也可以視為硬體部件內的結構。或者甚至,可以將用於實現各種功能的裝置視為既可以是實現方法的軟體模組又可以是硬體部件內的結構。   本發明所述裝置中的部分模組可以在由電腦執行的電腦可執行指令的一般上下文中描述,例如程式模組。一般地,程式模組包括執行特定任務或實現特定抽象資料類型的常式、程式、物件、元件、資料結構、類等等。也可以在分散式運算環境中實踐本發明,在這些分散式運算環境中,由透過通信網路而被連接的遠端處理設備來執行任務。在分散式運算環境中,程式模組可以位於包括存放裝置在內的本地和遠端電腦儲存媒體中。   透過以上的實施方式的描述可知,本領域的技術人員可以清楚地瞭解到本發明可借助軟體加必需的硬體的方式來實現。基於這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來,也可以透過資料移轉的實施過程中體現出來。該電腦軟體產品可以儲存在儲存媒體中,如ROM/RAM、磁碟、光碟等,包括若干指令用以使得一台電腦設備(可以是個人電腦,移動終端,伺服器,或者網路設備等)執行本發明各個實施例或者實施例的某些部分所述的方法。   本說明書中的各個實施例採用遞進的方式描述,各個實施例之間相同或相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。本發明的全部或者部分可用於眾多通用或專用的電腦系統環境或配置中。例如:個人電腦、伺服器電腦、手持設備或可攜式設備、平板型設備、移動通信終端、多處理器系統、基於微處理器的系統、可程式設計的電子設備、網路PC、小型電腦、大型電腦、包括以上任何系統或設備的分散式運算環境等等。   雖然透過實施例描繪了本發明,本領域普通技術人員知道,本發明有許多變形和變化而不脫離本發明的精神,希望申請專利範圍包括這些變形和變化而不脫離本發明的精神。
100‧‧‧使用者用戶端
200‧‧‧搜索伺服器
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的圖式作簡單地介紹,顯而易見地,下面描述中的圖式僅僅是本發明中記載的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些圖式獲得其他的圖式。   圖1是本發明提供的搜索系統的一種架構示意圖;   圖2是本發明提供的搜索介面的一種示意圖;   圖3是本發明提供的搜索介面的另一種示意圖;   圖4是本發明提供的搜索介面的又一種示意圖;   圖5是本發明提供的兩級排序產生文案的結構示意圖;   圖6是本發明提供的產品簇兩級篩選示意圖;   圖7是本發明提供的搜索方法的方法流程圖。

Claims (20)

  1. 一種搜索方法,其特徵在於,該方法包括:   獲取使用者的特徵資料和搜索關鍵字;   根據該使用者的特徵資料和該搜索關鍵字,產生關聯有產品簇的文案;   在對應於該搜索關鍵字的搜索結果瀏覽介面,顯示該關聯有產品簇的文案。
  2. 根據申請專利範圍第1項的方法,其中,根據該使用者的特徵資料和該搜索關鍵字,產生關聯有產品簇的文案,包括:   根據該使用者的特徵資料,確定在該搜索關鍵字下,該使用者的基礎特徵向量;   獲取產品簇集合,其中,該產品簇集合中儲存若干個產品簇,且每個產品簇對應一個產品簇特徵向量;   根據該使用者的基礎特徵向量、每個產品簇的產品簇特徵向量、以及該使用者的歷史點擊行為資料,從該產品簇集合中選取預設數量個產品簇;   為該預設數量個產品簇匹配產生文案。
  3. 根據申請專利範圍第2項的方法,其中,該使用者的基礎特徵向量包括以下至少之一:使用者的年齡、使用者的性別、使用者所在的城市。
  4. 根據申請專利範圍第2項的方法,其中,根據該使用者的基礎特徵向量、每個產品簇的產品簇特徵向量、以及該使用者的歷史點擊行為資料,從該產品簇集合中選取預設數量個產品簇,包括:   從該產品簇集合中選取產品簇特徵向量與該使用者的基礎特徵向量之間的相似度超出預設閾值的若干個產品簇組成候選產品簇集合;   獲取該使用者的歷史點擊行為資料;   根據該使用者的歷史點擊行為資料,從該候選產品簇集合中選取匹配度最高的預設數量個產品簇。
  5. 根據申請專利範圍第2項的方法,其中,為該預設數量個產品簇匹配產生文案,包括:   從預先建立的文案集合中,為該預設數量個產品簇中的各個產品簇分別選擇一個文案。
  6. 根據申請專利範圍第5項的方法,其中,按照以下方式建立該預設建立的文案集合:   獲取歷史文案的文案資訊,其中,該文案資訊包括以下至少之一:類目、產品、品牌、發佈時間、投放轉化率、成交轉化率和關鍵字;   根據該歷史文案的文案資訊,選擇文案產生該文案集合。
  7. 根據申請專利範圍第6項的方法,其中,從預先建立的文案集合中,為該預設數量個產品簇中的各個產品簇分別選擇一個文案,包括:   獲取使用者對歷史文案的點擊率資料;   根據該使用者對歷史文案的點擊率資料,對該文案集合中的各個文案集合按照點擊率高低進行排序;   選擇與待產生文案的產品簇匹配的,且點擊率高的文案,作為待產生文案的產品簇的文案。
  8. 根據申請專利範圍第2項的方法,其中,為該預設數量個產品簇匹配產生文案,包括:   獲取使用者對歷史文案的點擊率資料;   根據該點擊率資料和該搜索關鍵字、結合產品簇中產品的特徵,為該預設數量個產品簇中的各個產品簇分別產生一個文案。
  9. 根據申請專利範圍第1至8項中任一項的方法,其中,在對應於該搜索關鍵字的搜索結果瀏覽介面,顯示該關聯有產品簇的文案,包括:   在預測出的對應於該搜索關鍵字的搜索結果瀏覽介面的跳失點處,顯示該關聯有產品簇的文案。
  10. 一種搜索伺服器,其特徵在於,包括:   獲取模組,用於獲取使用者的特徵資料和搜索關鍵字;   產生模組,用於根據該使用者的特徵資料和該搜索關鍵字,產生關聯有產品簇的文案;   顯示模組,用於在對應於該搜索關鍵字的搜索結果瀏覽介面,顯示該關聯有產品簇的文案。
  11. 根據申請專利範圍第10項的搜索伺服器,其中,該產生模組包括:   確定單元,用於根據該使用者的特徵資料,確定在該搜索關鍵字下,該使用者的基礎特徵向量;   獲取單元,用於獲取產品簇集合,其中,該產品簇集合中儲存若干個產品簇,且每個產品簇對應一個產品簇特徵向量;   選取單元,用於根據該使用者的基礎特徵向量、每個產品簇的產品簇特徵向量、以及該使用者的歷史點擊行為資料,從該產品簇集合中選取預設數量個產品簇;   產生單元,用於為該預設數量個產品簇匹配產生文案。
  12. 根據申請專利範圍第11項的搜索伺服器,其中,該選取單元包括:   第一選取子單元,用於從該產品簇集合中選取產品簇特徵向量與該使用者的基礎特徵向量之間的相似度超出預設閾值的若干個產品簇組成候選產品簇集合;   獲取子單元,用於獲取該使用者的歷史點擊行為資料;   第二選擇子單元,用於根據該使用者的歷史點擊行為資料,從該候選產品簇集合中選取匹配度最高的預設數量個產品簇。
  13. 根據申請專利範圍第11項的搜索伺服器,其中,該產生單元具體用於從預先建立的文案集合中,為該預設數量個產品簇中的各個產品簇分別選擇一個文案。
  14. 根據申請專利範圍第13項的搜索伺服器,其中,還包括:建立模組,用於按照以下方式建立該預設建立的文案集合:獲取歷史文案的文案資訊,其中,該文案資訊包括以下至少之一:類目、產品、品牌、發佈時間、投放轉化率、成交轉化率和關鍵字;根據該歷史文案的文案資訊,選擇文案產生該文案集合。
  15. 根據申請專利範圍第14項的搜索伺服器,其中,該產生單元包括:   第三獲取子單元,用於獲取使用者對歷史文案的點擊率資料;   排序子單元,用於根據該使用者對歷史文案的點擊率資料,對該文案集合中的各個文案集合按照點擊率高低進行排序;   第一產生子單元,用於選擇與待產生文案的產品簇匹配的,且點擊率高的文案,作為待產生文案的產品簇的文案。
  16. 根據申請專利範圍第11項的搜索伺服器,其中,該產生單元包括:   第四獲取子單元,用於獲取使用者對歷史文案的點擊率資料;   第二產生子單元,用於根據該點擊率資料和該搜索關鍵字、結合產品簇中產品的特徵,為該預設數量個產品簇中的各個產品簇分別產生一個文案。
  17. 根據申請專利範圍第10至16項中任一項的搜索伺服器,其中,該顯示模組包括:   預測單元,用於預測是否到達對應於該搜索關鍵字的搜索結果瀏覽介面的跳失點處;   顯示單元,用於在確定到達預測的跳失點處的情況下,顯示該關聯有產品簇的文案。
  18. 一種搜索系統,其特徵在於,包括:申請專利範圍第10至17項中任一項的搜索伺服器和多個使用者用戶端,其中,該使用者用戶端用於獲取使用者輸入的搜索關鍵字和呈現該搜索伺服器推送的文案,並在接收到使用者對該文案的點擊指令後,顯示該文案關聯的產品簇。
  19. 一種搜索方法,其特徵在於,該方法包括:   獲取使用者的特徵資料和搜索關鍵字;   根據該使用者的特徵資料和該搜索關鍵字,產生關聯有產品簇的文案;   在對應於該搜索關鍵字的使用者購買行為結果介面,顯示該關聯有產品簇的文案。
  20. 一種電腦可讀儲存媒體,其上儲存有電腦程式,其特徵在於,該程式被處理器執行時實現申請專利範圍第1至9項中任一項的方法的步驟。
TW107120135A 2017-08-09 2018-06-12 搜索方法、搜索伺服器和搜索系統 TW201911080A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710675576.1A CN109388742A (zh) 2017-08-09 2017-08-09 一种搜索方法、搜索服务器和搜索系统
??201710675576.1 2017-08-09

Publications (1)

Publication Number Publication Date
TW201911080A true TW201911080A (zh) 2019-03-16

Family

ID=65272515

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107120135A TW201911080A (zh) 2017-08-09 2018-06-12 搜索方法、搜索伺服器和搜索系統

Country Status (4)

Country Link
US (1) US20190050487A1 (zh)
CN (1) CN109388742A (zh)
TW (1) TW201911080A (zh)
WO (1) WO2019032403A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977301A (zh) * 2019-02-28 2019-07-05 贵阳学院 一种用户使用习惯挖掘方法
CN112131848A (zh) * 2019-06-25 2020-12-25 北京沃东天骏信息技术有限公司 文案信息生成方法及装置、存储介质、电子设备
CN111787042B (zh) * 2019-09-19 2022-09-06 北京京东尚科信息技术有限公司 用于推送信息的方法和装置
CN110717029A (zh) * 2019-10-15 2020-01-21 支付宝(杭州)信息技术有限公司 一种信息处理方法和系统
CN112651839A (zh) * 2021-01-07 2021-04-13 中国农业银行股份有限公司 一种产品优化方法及系统
CN112989022B (zh) * 2021-03-16 2022-11-25 中国平安人寿保险股份有限公司 虚拟文本智能选取方法、装置以及计算机设备
CN113254633B (zh) * 2021-05-10 2024-05-03 中国民生银行股份有限公司 消息文案生成方法和装置
CN113570413B (zh) * 2021-07-28 2023-12-05 杭州王道控股有限公司 广告关键词的生成方法、装置、存储介质及电子设备
CN116089729B (zh) * 2023-03-31 2023-07-18 浙江口碑网络技术有限公司 搜索推荐方法、设备及存储介质
CN117150144B (zh) * 2023-10-30 2023-12-29 南通苏鹏计算机技术有限公司 一种基于大数据的搜索引擎优化方法
CN117150143B (zh) * 2023-10-30 2024-01-26 华能信息技术有限公司 一种基于工业互联网平台的服务方法及系统
CN117544425B (zh) * 2024-01-09 2024-03-12 成都运荔枝科技有限公司 一种基于数据分析的网络系统登录安全管控方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003279992A1 (en) * 2002-10-21 2004-05-13 Ebay Inc. Listing recommendation in a network-based commerce system
US7734641B2 (en) * 2007-05-25 2010-06-08 Peerset, Inc. Recommendation systems and methods using interest correlation
US9536197B1 (en) * 2011-04-22 2017-01-03 Angel A. Penilla Methods and systems for processing data streams from data producing objects of vehicle and home entities and generating recommendations and settings
CN103186539B (zh) * 2011-12-27 2016-07-27 阿里巴巴集团控股有限公司 一种确定用户群体、信息查询及推荐的方法及系统
CN103218719B (zh) * 2012-01-19 2016-12-07 阿里巴巴集团控股有限公司 一种电子商务网站导航方法及系统
US20130246383A1 (en) * 2012-03-18 2013-09-19 Microsoft Corporation Cursor Activity Evaluation For Search Result Enhancement
JP2013235507A (ja) * 2012-05-10 2013-11-21 Mynd Inc 情報処理方法、装置、コンピュータプログラムならびに記録媒体
US20140180798A1 (en) * 2012-12-26 2014-06-26 Richrelevance, Inc. Contextual selection and display of information
CN103914484A (zh) * 2013-01-07 2014-07-09 阿里巴巴集团控股有限公司 一种页面内容的生成方法及装置
CN105447731A (zh) * 2016-01-07 2016-03-30 上海携程商务有限公司 站外用户站内动态广告生成方法及系统
CN106095900B (zh) * 2016-06-07 2019-10-29 网易无尾熊(杭州)科技有限公司 一种搜索结果提供方法和装置
CN106204099A (zh) * 2016-06-23 2016-12-07 广州筷子信息科技有限公司 基于元素级别的广告创意有效性分析方法及装置
US10129367B2 (en) * 2016-09-22 2018-11-13 Facebook, Inc. Delivering content items using machine learning based prediction of user actions
US20180174218A1 (en) * 2016-12-19 2018-06-21 Sap Se Recommendation optmization with a dynamic mixture of frequent and occasional recommendations

Also Published As

Publication number Publication date
WO2019032403A1 (en) 2019-02-14
CN109388742A (zh) 2019-02-26
US20190050487A1 (en) 2019-02-14

Similar Documents

Publication Publication Date Title
TW201911080A (zh) 搜索方法、搜索伺服器和搜索系統
US11397772B2 (en) Information search method, apparatus, and system
JP6967612B2 (ja) 情報検索方法、装置及びシステム
WO2015188699A1 (zh) 推荐项目的方法和装置
Tuarob et al. Fad or here to stay: Predicting product market adoption and longevity using large scale, social media data
US10180979B2 (en) System and method for generating suggestions by a search engine in response to search queries
Liang et al. Connecting users and items with weighted tags for personalized item recommendations
WO2017071251A1 (zh) 信息推送方法和装置
WO2020048084A1 (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN104991966B (zh) 媒体内容排序方法及系统
CN106557480B (zh) 查询改写的实现方法及装置
US20150242750A1 (en) Asymmetric Rankers for Vector-Based Recommendation
WO2016091114A1 (zh) 一种信息推送方法和装置
WO2018040069A1 (zh) 信息推荐系统及方法
CN110163703B (zh) 一种分类模型建立方法、文案推送方法和服务器
US20160125028A1 (en) Systems and methods for query rewriting
TWI662495B (zh) 推廣資訊的處理方法、裝置及系統
US9767417B1 (en) Category predictions for user behavior
WO2020043001A1 (zh) 广告投放方法、确定推广人群的方法、服务器和客户端
CN110209931B (zh) 媒体内容的推送方法和装置、存储介质、电子装置
JP6405704B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
CN109241451B (zh) 一种内容组合推荐方法、装置及可读存储介质
WO2018058118A1 (en) Method, apparatus and client of processing information recommendation
US10474670B1 (en) Category predictions with browse node probabilities
CN112364184A (zh) 多媒体数据的排序方法、装置、服务器及存储介质