TWI498753B - Information adjustment method and device - Google Patents

Information adjustment method and device Download PDF

Info

Publication number
TWI498753B
TWI498753B TW100128692A TW100128692A TWI498753B TW I498753 B TWI498753 B TW I498753B TW 100128692 A TW100128692 A TW 100128692A TW 100128692 A TW100128692 A TW 100128692A TW I498753 B TWI498753 B TW I498753B
Authority
TW
Taiwan
Prior art keywords
information
category
clicked
weight value
displayed
Prior art date
Application number
TW100128692A
Other languages
English (en)
Other versions
TW201250490A (en
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of TW201250490A publication Critical patent/TW201250490A/zh
Application granted granted Critical
Publication of TWI498753B publication Critical patent/TWI498753B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

資訊調整方法及裝置
本申請係關於網際網路技術領域,尤其關於一種資訊調整方法及裝置。
目前,根據統計出的用戶點擊行為資訊(比如,用戶對於根據關鍵字搜索到的資訊的點擊行為資訊、對於前臺展示的資訊的點擊行為資訊等),可以採用效果統計演算法來確定資訊類別與資訊之間的匹配度。需要說明的是,這裏的資訊可以是指以聲音、語言、文字、圖像、動畫等方式所表示的實際內容,而資訊類別則可以看做是多個資訊所具備的一種共同屬性。比如,“上衣”、“連衣裙”、“短褲”、“長褲”等文字資訊具備的共同屬性可以為“服裝”,則這些文字資訊的資訊類別可以為“服裝”。又比如,包含有高山的圖像、包含有瀑布的圖像、包含有海洋的圖像等圖像資訊所具備的共同屬性可以為“風景”,則這些圖片資訊的資訊類別可以為“風景”。一般地,在搜索領域中,輸入的關鍵字可以看做是資訊類別,而根據搜索到的與該關鍵字匹配的資訊則可以看做是該資訊類別包含的資訊,比如,根據關鍵字“酒店”搜索到的“希爾頓酒店”、“香格里拉酒店”、“北京大酒店”等都可以看做是“酒店”這一資訊類別所包含的資訊。
在實際應用中,確定資訊類別與資訊之間的匹配度對於後續根據該匹配度確定關鍵字搜索命中率、確定資訊排序/展現準確率、對資訊類別所包含的資訊進行調整(如從某一資訊類別包含的資訊中,刪除掉與該資訊類別匹配度較低的資訊)等具有重要意義。
現有技術中提供的用於確定上述匹配度的效果統計演算法比較簡單,一般是直接根據用戶點擊的資訊來確定用戶點擊的資訊與相應的資訊類別之間的匹配度。但現有技術提供的效果統計演算法不會考慮被展現但未被用戶點擊的資訊對於上述匹配度的貢獻,從而其存在確定出的匹配度準確性不高的問題。
由於確定出的匹配度的準確性不高,進而也會使得根據該準確性不高的匹配度確定出的關鍵字搜索命中率、資訊排序/展現準確率也是不準確的,這就相當於是浪費處理資源來得到了可用性較低的確定結果。並且,在根據該匹配度對資訊類別所包含的展現資訊進行調整時,也可能出現對展現資訊產生較大的誤調整從而浪費了處理資源。
本申請實施例提供一種資訊調整方法及裝置,用以解決基於現有技術提供的效果統計演算法得到的資訊與資訊所屬類別的匹配度對展現資訊進行調整時,可能出現對展現資訊產生較大的誤調整從而導致浪費處理資源的問題。
本申請實施例採用以下技術方案:一種資訊調整方法,包括:從資訊瀏覽日誌中獲取針對展現資訊的點擊行為資訊,並根據該點擊行為資訊,從展現資訊中確定被點擊資訊和只展現但未被點擊資訊,並確定只展現但未被點擊資訊的總個數;為各個被點擊資訊分別分配第一原始權重值,為只展現但未被點擊資訊分配第二原始權重值,為被點擊資訊所屬的各個資訊類別分別分配第一對應關係權重值;確定各個只展現但未被點擊資訊所屬的資訊類別,並針對確定出的只展現但未被點擊資訊所屬的任意資訊類別,確定該資訊類別包含的只展現但未被點擊資訊的第一個數,並根據該總個數和該第一個數,為只展現但未被點擊資訊所屬的各個資訊類別分配第二對應關係權重值;以及針對該展現資訊所屬的任意資訊類別,執行:確定該資訊類別包含的被點擊資訊和只展現但未被點擊資訊,並根據該資訊類別包含的被點擊資訊被分配的第一原始權重值、該資訊類別包含的只展現但未被點擊資訊被分配的第二原始權重值,以及該資訊類別被分配的第一對應關係權重值和第二對應關係權重值,確定該資訊類別與其包含的展現資訊之間的匹配度;並根據確定的匹配度調整該資訊類別包含的展現資訊。
可選的,為各個被點擊資訊分別分配第一原始權重值,為只展現但未被點擊資訊分配第二原始權重值,具體包括:確定展現資訊中包含的被點擊資訊的總個數、只展現但未被點擊資訊的總個數;根據展現資訊的總個數、被點擊資訊的總個數,確定第一原始權重值並分配給各個被點擊資訊;根據展現資訊的總個數、只展現但未被點擊資訊的總個數,確定第二原始權重值並分配給各個只展現但未被點擊資訊。
可選的,根據該任意資訊類別包含的被點擊資訊被分配的第一原始權重值、該資訊類別包含的只展現但未被點擊資訊被分配的第二原始權重值,以及該資訊類別被分配的第一對應關係權重值和第二對應關係權重值,確定該資訊類別與其包含的展現資訊之間的匹配度,具體包括:執行該資訊類別包含的各個被點擊資訊被分配的第一原始權重值分別與該資訊類別被分配的第一對應關係權重值相乘,並對所有相乘結果進行相加的操作,得到第一和值;並執行該資訊類別包含的各個只展現但未被點擊資訊被分配的第二原始權重值分別與該資訊類別被分配的第二對應關係權重值相乘,並對所有相乘結果進行相加的操作,得到第二和值;以及根據第一和值與第二和值之和,確定該資訊類別與其包含的展現資訊之間的匹配度。
可選的,根據確定的匹配度調整該資訊類別包含的展現資訊,具體包括:判斷確定的該資訊類別與其包含的展現資訊之間的匹配度是否低於預設的匹配度閾值;並在判斷結果為是時,從該資訊類別包含的非展現資訊中選取資訊;並利用選取的資訊更新該資訊類別所包含的展現資訊。
可選的,該點擊行為資訊為指定時間長度內的點擊行為資訊。
一種資訊調整裝置,包括:資訊和個數確定單元,用於從資訊瀏覽日誌中獲取針對資訊的點擊行為資訊,並根據該點擊行為資訊,從展現資訊中確定被點擊資訊和只展現但未被點擊資訊,並確定只展現但未被點擊資訊的總個數;第一權重值分配單元,用於為資訊和個數確定單元確定的各個被點擊資訊分別分配第一原始權重值,為資訊和個數確定單元確定的只展現但未被點擊資訊分配第二原始權重值,為資訊和個數確定單元確定的被點擊資訊所屬的各個資訊類別分別分配第一對應關係權重值;資訊類別確定單元,用於確定資訊和個數確定單元確定的各個只展現但未被點擊資訊所屬的資訊類別;第二權重值分配單元,用於針對資訊類別確定單元確定出的只展現但未被點擊資訊所屬的各個類別,分別確定各個類別包含的只展現但未被點擊資訊的第一個數,並根據該總個數和該第一個數,為只展現但未被點擊資訊所屬的各個資訊類別分別分配第二對應關係權重值;匹配度確定單元,用於針對該展現資訊所屬的任意資訊類別,執行:確定該資訊類別包含的被點擊資訊和只展現但未被點擊資訊,並根據第一權重值分配單元為該資訊類別包含的被點擊資訊分配的第一原始權重值、為該資訊類別包含的只展現但未被點擊資訊分配的第二原始權重值、為該資訊類別分配的第一對應關係權重值和第二權重值分配單元為該資訊類別分配的第二對應關係權重值,確定該資訊類別與其包含的展現資訊之間的匹配度;資訊調整單元,用於針對該展現資訊所屬的任意資訊類別,執行:根據匹配度確定單元確定的該資訊類別與其包含的展現資訊之間的匹配度,調整該資訊類別包含的展現資訊。
本申請實施例的有益效果如下:採用本申請實施例提供的上述方案,在確定資訊類別與資訊之間匹配度時,不僅體現了被點擊資訊對資訊類別與資訊之間匹配度的貢獻度,還體現了只展現但未被點擊的資訊以及資訊個數對該匹配度的貢獻度,因此確定出的匹配度非常準確,進而基於該匹配度進行資訊調整時也不會出現較大的誤調整,從而解決了基於現有技術提供的效果統計演算法得到的匹配度對資訊進行調整時,可能導致出現較大誤調整從而導致浪費處理資源的問題。
為了解決基於現有技術提供的效果統計演算法得到的資訊與資訊所屬類別的匹配度對資訊進行調整時,可能導致出現較大誤調整從而導致浪費處理資源的問題,本申請實施例提供一種資訊調整方案。該方案在確定資訊類別與資訊之間匹配度時,在考慮到被點擊資訊以及只展現但未被點擊的資訊都會為該匹配度做出貢獻,以及被展現的分屬不同資訊類別的資訊個數也會對該匹配度做出貢獻的基礎上,分別為不同展現資訊分配相應的權重值,並進一步根據該權重值來確定資訊類別與其包含的展現資訊之間匹配度,從而能夠根據該匹配度對展現資訊進行準確調整。本申請實施例提供的該方案能夠在體現被點擊資訊的貢獻度的同時,充分體現只展現但未被點擊的資訊的貢獻度,並且還能體現資訊個數對於該匹配度的貢獻度,從而能夠非常準確地確定資訊類別與資訊之間匹配度,避免基於現有技術採用的方案得到的匹配度準確性不高而導致出現較大的資訊誤調整的問題。
以下結合附圖,對本申請實施例提供的該方案進行詳細說明。
本申請實施例首先提供一種資訊調整方法,該方法的具體流程示意圖如圖1所示,包括以下步驟:步驟11,從資訊瀏覽日誌中獲取針對展現資訊的點擊行為資訊,並根據該點擊行為資訊,從展現資訊中確定被點擊資訊和只展現但未被點擊資訊,並確定只展現但未被點擊資訊的總個數;在本申請實施例中,展現資訊可以為根據搜索關鍵字,利用搜索引擎搜索到並展現在用戶終端顯示螢幕上的資訊,也可以為資訊提供方直接顯示在終端顯示螢幕上的資訊,比如商品賣家在終端顯示螢幕上向買家展示的商品資訊就可視為展現資訊。
用戶在對展現資訊進行瀏覽時,會根據自身需求對某個或某些資訊進行點擊,這樣就會在資訊瀏覽中留下相應的記錄,即上文所述的點擊行為資訊。可選的,這裏的點擊行為資訊可以為指定時間長度內的點擊行為資訊。一般地,該指定時間長度越長,記錄的行為資訊會越多,則最終得到的匹配度的準確度越高。
步驟12,為各個被點擊資訊分別分配第一原始權重值,為只展現但未被點擊資訊分配第二原始權重值,為被點擊資訊所屬的各個資訊類別分別分配第一對應關係權重值;本申請實施例中,第一原始權重值可以但不限於根據被點擊資訊在展現資訊中所占比例來確定,而第二原始權重值可以但不限於根據只展現但未被點擊資訊在展現資訊中所占比例來確定。比如,若展現資訊總個數為20個,其中包含8個點擊資訊、12個只展現但未被點擊資訊,則第一原始權重值可以為8個點擊資訊在20個展現資訊中所占比例,即0.4,而第二原始權重值可以為12個只展現但未被點擊資訊在20個展現資訊中所占比例,即0.6。或者,可以將0.4擴大10倍變為4後作為第一原始權重值,而相應地,也可將0.6擴大10倍變為6後作為第二原始權重值。
而上述第一對應關係權重值的具體大小則可以是一個固定值。比如,本申請實施例中,就可以將該固定值設置為1。需要說明的是,這裏的第一對應關係權重值與後文將要出現的為只展現但未被點擊資訊所屬的各個資訊類別分配的第二對應關係權重值是有一定聯繫的。一般地,為任一資訊類別所分配的第二對應關係權重值是與屬於該資訊類別的只展現但未被點擊資訊在只展現但未被點擊資訊中所占比例有關的,而該比例一般不會超過1,即不會超過上述固定值。也就是說,按照上述設置方式,一般情況下,第二對應關係權重值與第一對應關係權重值的關係為:第二對應關係權重值第一對應關係權重值。不過,第一、第二對應關係權重值的設置是可以靈活變動的。按照另外的設置方式,也可能出現第二對應關係權重值第一對應關係權重值的情況。
步驟13,確定各個只展現但未被點擊資訊所屬的資訊類別,針對確定出的只展現但未被點擊資訊所屬的任意資訊類別,確定該資訊類別包含的只展現但未被點擊資訊的第一個數,並根據步驟11中確定的只展現但未被點擊資訊的總個數和該第一個數,為只展現但未被點擊資訊所屬的各個資訊類別分配第二對應關係權重值;前文已提到,第二對應關係權重值可以與只展現但未被點擊資訊的個數在只展現但未被點擊資訊的總個數的比例有關,具體來說,比如在20個展現資訊中,若只展現但未被點擊資訊的總個數為12個,而某資訊類別所包含的只展現但未被點擊資訊的個數為6,即該資訊列別所包含的只展現但未被點擊資訊在只展現但未被點擊資訊中所占比例為0.5,那麼該資訊類別被分配的第二對應關係權重值就可以為0.5。
步驟14,針對展現資訊所屬的任意資訊類別,執行下述操作:確定該資訊類別包含的被點擊資訊和只展現但未被點擊資訊,並根據確定出的該資訊類別包含的被點擊資訊被分配的第一原始權重值、確定出的該資訊類別包含的只展現但未被點擊資訊被分配的第二原始權重值,以及該資訊類別被分配的第一對應關係權重值和第二對應關係權重值,確定該資訊類別與其包含的展現資訊之間的匹配度,並根據確定的匹配度調整該資訊類別包含的展現資訊。
步驟14所述的操作的一種實現方式可以為:執行對該資訊類別包含的各個被點擊資訊被分配的第一原始權重值分別與該資訊類別被分配的第一對應關係權重值相乘,並對所有相乘結果進行相加的操作,得到第一和值;並執行對該資訊類別包含的各個只展現但未被點擊資訊被分配的第二原始權重值分別與該資訊類別被分配的第二對應關係權重值相乘,並對所有相乘結果進行相加的操作,得到第二和值;最後,根據第一和值與第二和值之和,就可以確定出該資訊類別與其包含的展現資訊之間的匹配度,從而根據該匹配度調整該資訊類別包含的展現資訊。
在一個較佳的實施例中,上述步驟12中為各個被點擊資訊分別分配第一原始權重值,為只展現但未被點擊資訊分配第二原始權重值的具體過程可以為:首先,從展現資訊中確定被點擊資訊的總個數、只展現但未被點擊資訊的總個數;然後,根據展現資訊的總個數、被點擊資訊的總個數,確定第一原始權重值並分配給各個被點擊資訊;最後,根據展現資訊的總個數、只展現但未被點擊資訊的總個數,確定第二原始權重值並分配給各個只展現但未被點擊資訊。
本申請實施例提供的上述方法透過在確定資訊類別與其包含的展現資訊之間的匹配度時,不僅考慮到被點擊的資訊為該匹配度做出的貢獻,還引入了只展現但未被點擊的資訊為該匹配度做出的貢獻、被展現的分屬不同類別的資訊個數為該匹配度做出貢獻,因此,可以大大提高確定出的匹配度的準確性,從而根據確定出的準確性較高的匹配度對展現資訊進行調整就能夠儘量避免產生較大的誤調整,從而解決基於現有技術提供的效果統計演算法得到的資訊與資訊所屬類別的匹配度對資訊進行調整時,可能導致出現較大誤調整從而導致浪費處理資源的問題。
可選的,上述步驟14中所述的“根據確定的匹配度調整該資訊類別包含的展現資訊”的具體實現過程可以為:首先,判斷該資訊類別與其包含的展現資訊之間的匹配度是否低於預設的匹配度閾值;然後,在判斷結果為是時,從該資訊類別包含的非展現資訊中選取資訊,並利用選取的資訊更新該資訊類別包含的展現資訊。比如,針對共包含40條資訊的資訊類別A,若當前只對該資訊類別A包含的20條資訊進行了展現(即資訊類別A包含的展現資訊有20條,而包含非展現資訊也有20條),並且確定出資訊類別A與其包含的這20條展現資訊之間的匹配度低於了匹配度閾值(比如為30%)。那麼,就可以從資訊類別A所包含的20條非展現資訊中選取資訊對資訊類別A包含的展現資訊進行替換。如可以從20條非展現資訊中選取10條資訊對展現資訊中的10條只展現但未被點擊資訊進行替換,也可以選取全部的20條非展現資訊對全部的20條展現資訊進行替換。此外,還可以按照一次替換一條展現資訊的方式,逐次從該資訊類別包含的非展現資訊中選取非展現資訊對展現資訊進行替換,並在每次替換後,都可以根據用戶針對替換後的展現資訊所產生的新的點擊行為資訊,確定該資訊類別與其當前包含的展現資訊(即替換後的展現資訊)之間的匹配度,從而最終可以選擇一個最大的匹配度所對應的展現資訊作為一種較佳的資訊集合進行長期展示。
透過根據資訊類別與其包含的展現資訊之間的匹配度對展現資訊的動態調整,能夠從展現資訊中去除或替換掉用戶不感興趣的、與資訊類別匹配程度不高的資訊,而只將用戶感興趣的、與資訊類別匹配程度較高的資訊展現給用戶,從而可以避免浪費處理資源來提供用戶不感興趣的資訊的問題,同時還大大了提升用戶的體驗。
在實際應用中,在根據關鍵字進行資訊搜索的場景下,採用本申請實施例提供的上述方案確定資訊類別與資訊之間匹配度的具體實現流程示意圖如圖2所示,包括如下步驟:步驟21,對根據某一關鍵字進行一次搜索並呈現給用戶的展現資訊、展現資訊對應的資訊類別標識、用戶針對展現資訊的點擊行為資訊進行記錄;步驟22,根據記錄的上述資訊,確定展現資訊的總個數,並確定被點擊資訊的總個數以及只展現但未被點擊資訊的總個數;在本申請實施例中,可以假設確定出的展現資訊總個數為10,被點擊資訊的總個數為3,只展現但未被點擊資訊的總個數為7;步驟23,根據展現資訊總個數、被用戶點擊的資訊總個數以及只展現但未被點擊的資訊總個數,為被用戶點擊的資訊分配原始權重值;比如,根據展現資訊總個數10,被用戶點擊的資訊總個數3,只展現但未被點擊的資訊總個數7,為被用戶點擊的資訊分配原始權重值3/10=0.3,該原始權重值可以記為Sctr。同時,為只展現但未被點擊的資訊分配原始權重值7/10=0.7,該原始權重值可以記為Sn。
步驟24,按照預設的對應關係權重值分配策略,為展現資訊所屬資訊類別分別分配相應的對應關係權重值,其中,展現資訊所屬資訊類別被分配的對應關係權重值大小可以與各資訊類別與展現資訊之間的匹配度成正比;比如,假設上述3個被點擊資訊所屬資訊類別的標識分別為p_cate1、p_cate2、p_cate3,則按照預設的“為被點擊資訊所屬資訊類別分配的對應關係權重值=1”這樣的對應關係權重值分配策略,可以為3個被點擊資訊所屬資訊類別分別分配對應關係權重值“1”。若將第n 個資訊類別被分配的對應關係權重值記為Rsctr (kw ~p_caten ),則根據上述分配策略,當n 為1、2、3時,分別有如下式[1]、[2]、[3]這樣的等式:
Rsctr (kw ~p_cate 1)=1 [1]
Rsctr (kw ~p_cate 2)=1 [2]
Rsctr (kw ~p_cate 3)=1 [3]
而針對另外7個只展現但未被點擊資訊而言,則可以採用下述方式確定其分別所屬的資訊類別的對應關係權重值:首先,確定這7個只展現但未被點擊資訊所分屬的資訊類別,比如,假設確定出這7個只展現但未被點擊資訊中,有4個資訊是屬於資訊類別p_cate1,另外的3個資訊則分屬於資訊類別p_cate2、p_cate3、p_cate4;然後,按照“第n 個資訊類別被分配的對應關係權重值Rsn (kw ~p_caten )=該資訊類別所包含的只展現但未被點擊資訊的個數/只展現但未被點擊資訊的總個數”的計算方式,可以計算得到如下述公式[4]~[7]所示的資訊類別p_cate1~p_cate4被分配的對應關係權重值:
Rsn (kw ~p_cate 1)=4/7=0.57 [4]
Rsn (kw~p_cate 2)=1/7=0.14 [5]
Rsn (kw ~p_cate 3)=1/7=0.14 [6]
Rsn (kw ~p_cate 4)=1/7=0.14 [7]
步驟25,根據確定的原始權重值和對應關係權重值,確定每個資訊類別的資訊類別權重值Kwa ~p_caten ,其中,Kwa ~p_caten 即體現了資訊類別與其包含的展現資訊之間的匹配度;
具體地,針對資訊類別p_cate1,可以按照下述計算方式[8]計算在以關鍵字Kw 1作為檢索關鍵字的前提下為資訊類別p_cate1所確定的資訊類別權重值Kw 1~p_cate 1:
類似地,針對資訊類別p_cate2、p_cate3、p_cate4,還可以計算出以關鍵字Kw 1作為檢索關鍵字的前提下的資訊類別權重值Kw 1:p_cate 2、Kw 1:p_cate 3、Kw 1:p_cate 4,如下式[9]、[10]、[11]所示:
上述步驟22~25是基於某一關鍵字進行一次搜索並對展現資訊、展現資訊對應的資訊類別標識、用戶基於展現資訊的點擊行為資訊進行記錄後進行的操作。此時可以直接根據上述資訊類別權重值的具體數值0.699、0.398、0.398、0.098來確定資訊類別與資訊之間匹配度。按照原始權重值和對應關係權重值的分配方式可知,資訊類別權重值越大,則該資訊類別所包含的資訊與該資訊類別的匹配度越高;反之,則匹配度越低。
步驟26,針對任一資訊類別,當根據其資訊類別權重值Kwa ~p_caten 和預設的資訊類別權重閾值確定出需要對該資訊類別包含的展現資訊進行調整時,執行調整展現資訊的操作。
當考慮到需要保證結果的較高準確度時,在步驟21中,也可以是對一台伺服器在一天24小時內針對同一關鍵字(或所有關鍵字)產生的上述資訊進行記錄,或者是對一台伺服器在30天內針對同一關鍵字(或所有關鍵字)產生的上述資訊進行記錄,還可以是對多台伺服器在指定時間長度內針對同一關鍵字(或所有關鍵字)產生的上述資訊進行記錄。一般說來,該指定時間長度越長,記錄的資訊越多,基於記錄的資訊所確定出的上述匹配度就會越準確。
在本申請實施例中,當記錄了一台伺服器在一天24小時內針對同一關鍵字Kw a進行的m次搜索並展現資訊、展現資訊對應的資訊類別標識、用戶基於展現資訊的點擊行為資訊時,那麼,在按照上述步驟22~25,實現分別根據每次搜索所記錄的上述資訊確定出各個資訊類別的資訊類別權重值之後,針對任意資訊類別n,可以進一步採用下式[12]計算該資訊類別n的m個資訊類別權重值的平均值Dn (kwa ~p_caten )。需要說明的是,為了便於描述,可以將基於關鍵字Kwa 進行的第j 次搜索所計算得到的、針對資訊類別n的資訊類別權重值可以記為Kwa j :p_caten ,將相應的對應關係權重值記為Rsctr j (kwa~p_caten )和Rsn j (kwa~p_caten )。
根據計算出的Dn (kwa ~p_caten ),能夠更準確地確定資訊類別與其包含的資訊之間的匹配度。與資訊類別權重值與該匹配度的關係類似,Dn (kwa ~p_caten )的值越大,則該資訊類別n所包含的資訊與該資訊類別n的匹配度越高;反之,則匹配度越低。
此外,若需要進一步提高結果的準確度,還可以記錄一台伺服器在多天(比如為d天,d可以為10、30等)內針對同一關鍵字Kwa進行搜索並展現資訊、展現資訊對應的資訊類別標識、用戶基於展現資訊的點擊行為資訊。假設按照上式[12]計算出的第i天的資訊類別權重值的平均值記為Dn i (kwa ~p_caten )時,則針對資訊類別n,可以計算得到d個Dn i (kwa ~p_caten )。此時,可以進一步按照下式[13]計算d個Dn i (kwa ~p_caten )的平均值Skweightdate(kwa~p_caten):
根據計算出的Skweightdate(kwa~p_caten),就能夠更為準確地確定資訊類別與資訊之間的匹配度。與資訊類別權重值與該匹配度的關係類似,Skweightdate(kwa~p_caten)的值越大,則該資訊類別n所包含的資訊與該資訊類別n的匹配度越高;反之,則匹配度越低。
在本申請實施例中,在計算出能夠反映資訊類別與資訊之間匹配度的Kwa ~p_catenDn (kwa ~p_caten )或Skweightdate(kwa~p_caten)時,還可以根據計算出的這些值,進一步執行對資訊的排序進行調整,和/或重新選取與資訊類別匹配度較高的資訊作為最能代表該資訊類別的資訊進行展示等操作。比如,針對任意資訊類別A,當確定出資訊類別A與其包含的展示資訊之間的匹配度非常低時,可以重新選取資訊類別A包含的非展示資訊作為展示資訊進行展示;又比如,針對資訊類別B,當確定出資訊類別B與其包含的展示資訊之間的匹配度非常低時,可以將從資訊類別B包含的非展現資訊中選取資訊並將選取的資訊排列在與資訊類別B匹配度不高的展示資訊之前進行展示,等等。
需要說明的是,上述權重值的確定方式僅僅是實際應用中的一種具體情況。實際上,原始權重值和對應關係權重值的確定還可以採用除上述方式外的其他方式。比如,可以為被點擊資訊確定較小的原始權重值,而為只展現但未被點擊資訊確定較大的原始權重值,並且為被點擊資訊確定較小的對應關係權重值,而為只展現但未被點擊資訊確定較大的原始權重值。按照這樣的權重值確定方式,則最終得到的資訊類別權重值與上述匹配度的關係為:資訊類別權重值越小,資訊類別與資訊之間的匹配度越高;反之,則越低。
本申請實施例提供的方案除了可以應用於根據關鍵字進行資訊搜索的場景下,還可以應用於存在對分屬於不同資訊類別的資訊進行展示這一需求的任意場景(比如商品資訊展示場景)中。本申請實施例對該方案的應用場景不做限定。
對應於本發明實施例提供的資訊調整方法,本發明實施例還提供一種資訊調整裝置,該裝置的具體結構示意圖如圖3所示,包括以下功能單元:資訊和個數確定單元31,用於根據點擊行為資訊,從展現資訊中確定被點擊資訊和只展現但未被點擊資訊,並確定只展現但未被點擊資訊的總個數;第一權重值分配單元32,用於為資訊和個數確定單元31確定的各個被點擊資訊分別分配第一原始權重值,為資訊和個數確定單元31確定的只展現但未被點擊資訊分配第二原始權重值,為資訊和個數確定單元31確定的被點擊資訊所屬的各個資訊類別分別分配第一對應關係權重值;資訊類別確定單元33,用於確定資訊和個數確定單元31確定的各個只展現但未被點擊資訊所屬的資訊類別;第二權重值分配單元34,用於針對資訊類別確定單元33確定出的只展現但未被點擊資訊所屬的各個類別,分別確定各個類別包含的只展現但未被點擊資訊的第一個數,並根據上述展現資訊的總個數和上述第一個數,為只展現但未被點擊資訊所屬的各個資訊類別分別分配第二對應關係權重值;匹配度確定單元35,用於針對上述展現資訊所屬的任意資訊類別,執行:確定該資訊類別包含的被點擊資訊和只展現但未被點擊資訊,並根據第一權重值分配單元32為該資訊類別包含的被點擊資訊分配的第一原始權重值、為該資訊類別包含的只展現但未被點擊資訊分配的第二原始權重值、為該資訊類別分配的第一對應關係權重值和第二權重值分配單元34為該資訊類別分配的第二對應關係權重值,確定該資訊類別與其包含的展現資訊之間的匹配度;資訊調整單元36,用於針對展現資訊所屬的任意資訊類別,執行:根據匹配度確定單元35確定的該資訊類別與其包含的展現資訊之間的匹配度,調整該資訊類別包含的展現資訊。
對應於第一權重值分配單元32功能的一種實現方式,本發明實施例中可以將第一權重值分配單元32具體劃分為以下功能模組,包括:總個數確定模組,用於確定展現資訊中包含的被點擊資訊的總個數、只展現但未被點擊資訊的總個數;第一分配模組,用於根據總個數確定模組確定的展現資訊的總個數、被點擊資訊的總個數,確定第一原始權重值並分配給各個被點擊資訊;第二分配模組,用於根據總個數確定模組確定的展現資訊的總個數、只展現但未被點擊資訊的總個數,確定第二原始權重值並分配給各個只展現但未被點擊資訊;第三分配模組,用於為資訊和個數確定單元確定的被點擊資訊所屬的各個資訊類別分別分配第一對應關係權重值。
可選的,對應於匹配度確定單元35功能的一種實現方式,本發明實施例中還可以將匹配度確定單元35具體劃分為以下功能模組,包括:第一和值確定模組,用於針對展現資訊所屬的任意資訊類別,執行該資訊類別包含的各個被點擊資訊被分配的第一原始權重值分別與該資訊類別被分配的第一對應關係權重值相乘,並對所有相乘結果進行相加的操作,得到第一和值;第二和值確定模組,用於執行該資訊類別包含的各個只展現但未被點擊資訊被分配的第二原始權重值分別與該資訊類別被分配的第二對應關係權重值相乘,並對所有相乘結果進行相加的操作,得到第二和值;匹配度確定模組,用於根據第一和值確定模組確定的第一和值與第二和值確定模組確定的第二和值之和,確定該資訊類別與其包含的展現資訊之間的匹配度。
可選的,對應於資訊調整單元36功能的一種實現方式,可以將其劃分為以下功能模組,包括:判斷模組,針對展現資訊所屬的任意資訊類別,執行:判斷匹配度確定單元確定的該資訊類別與其包含的展現資訊之間的匹配度是否低於預設的匹配度閾值;選取模組,用於在判斷模組得到的判斷結果為是時,從該資訊類別包含的非展現資訊中選取資訊;更新模組,用於利用選取模組選取的資訊更新該資訊類別所包含的展現資訊。
顯然,本領域的技術人員可以對本申請進行各種改動和變型而不脫離本申請的精神和範圍。這樣,倘若本申請的這些修改和變型屬於本申請之申請專利範圍及其等同技術的範圍之內,則本申請也意圖包含這些改動和變型在內。
31...資訊和個數確定單元
32...第一權重值分配單元
33...資訊類別確定單元
34...第二權重值分配單元
35...匹配度確定單元
36...資訊調整單元
圖1為本申請實施例提供的一種資訊調整方法的具體流程示意圖;
圖2為本申請實施例提供的方法應用於根據關鍵字進行資訊搜索的場景下的具體應用流程圖;
圖3為本申請實施例提供的一種資訊調整裝置的具體結構示意圖。

Claims (10)

  1. 一種資訊調整方法,其特徵在於,包括:從資訊瀏覽日誌中獲取針對展現資訊的點擊行為資訊,並根據該點擊行為資訊,從展現資訊中確定被點擊資訊和只展現但未被點擊資訊,並確定只展現但未被點擊資訊的總個數;為各個被點擊資訊分別分配第一原始權重值,為只展現但未被點擊資訊分配第二原始權重值,為被點擊資訊所屬的各個資訊類別分別分配第一對應關係權重值;確定各個只展現但未被點擊資訊所屬的資訊類別,並針對確定出的只展現但未被點擊資訊所屬的任意資訊類別,確定該資訊類別包含的只展現但未被點擊資訊的第一個數,並根據該總個數和該第一個數,為只展現但未被點擊資訊所屬的各個資訊類別分配第二對應關係權重值;以及針對該展現資訊所屬的任意資訊類別,執行:確定該資訊類別包含的被點擊資訊和只展現但未被點擊資訊,並根據該資訊類別包含的被點擊資訊被分配的第一原始權重值、該資訊類別包含的只展現但未被點擊資訊被分配的第二原始權重值,以及該資訊類別被分配的第一對應關係權重值和第二對應關係權重值,確定該資訊類別與其包含的展現資訊之間的匹配度;並根據確定的匹配度調整該資訊類別包含的展現資訊。
  2. 如申請專利範圍第1項所述的方法,其中,為各個被點擊資訊分別分配第一原始權重值,為只展現但未被點擊資訊分配第二原始權重值,具體包括:確定展現資訊中包含的被點擊資訊的總個數、只展現但未被點擊資訊的總個數;根據展現資訊的總個數、被點擊資訊的總個數,確定第一原始權重值並分配給各個被點擊資訊;根據展現資訊的總個數、只展現但未被點擊資訊的總個數,確定第二原始權重值並分配給各個只展現但未被點擊資訊。
  3. 如申請專利範圍第1項所述的方法,其中,根據該任意資訊類別包含的被點擊資訊被分配的第一原始權重值、該資訊類別包含的只展現但未被點擊資訊被分配的第二原始權重值,以及該資訊類別被分配的第一對應關係權重值和第二對應關係權重值,確定該資訊類別與其包含的展現資訊之間的匹配度,具體包括:執行該資訊類別包含的各個被點擊資訊被分配的第一原始權重值分別與該資訊類別被分配的第一對應關係權重值相乘,並對所有相乘結果進行相加的操作,得到第一和值;並執行該資訊類別包含的各個只展現但未被點擊資訊被分配的第二原始權重值分別與該資訊類別被分配的第二對應關係權重值相乘,並對所有相乘結果進行相加的操作,得到第二和值;以及根據第一和值與第二和值之和,確定該資訊類別與其包含的展現資訊之間的匹配度。
  4. 如申請專利範圍第1~3項之任一項所述的方法,其中,根據確定的匹配度調整該資訊類別包含的展現資訊,具體包括:判斷確定的該資訊類別與其包含的展現資訊之間的匹配度是否低於預設的匹配度閾值;並在判斷結果為是時,從該資訊類別包含的非展現資訊中選取資訊;並利用選取的資訊更新該資訊類別所包含的展現資訊。
  5. 如申請專利範圍第1~3項之任一項所述的方法,其中,該點擊行為資訊為指定時間長度內的點擊行為資訊。
  6. 一種資訊調整裝置,其特徵在於,包括:資訊和個數確定單元,用於從資訊瀏覽日誌中獲取針對資訊的點擊行為資訊,並根據該點擊行為資訊,從展現資訊中確定被點擊資訊和只展現但未被點擊資訊,並確定只展現但未被點擊資訊的總個數;第一權重值分配單元,用於為資訊和個數確定單元確定的各個被點擊資訊分別分配第一原始權重值,為資訊和個數確定單元確定的只展現但未被點擊資訊分配第二原始權重值,為資訊和個數確定單元確定的被點擊資訊所屬的各個資訊類別分別分配第一對應關係權重值;資訊類別確定單元,用於確定資訊和個數確定單元確定的各個只展現但未被點擊資訊所屬的資訊類別;第二權重值分配單元,用於針對資訊類別確定單元確定出的只展現但未被點擊資訊所屬的各個類別,分別確定各個類別包含的只展現但未被點擊資訊的第一個數,並根據該總個數和該第一個數,為只展現但未被點擊資訊所屬的各個資訊類別分別分配第二對應關係權重值;匹配度確定單元,用於針對該展現資訊所屬的任意資訊類別,執行:確定該資訊類別包含的被點擊資訊和只展現但未被點擊資訊,並根據第一權重值分配單元為該資訊類別包含的被點擊資訊分配的第一原始權重值、為該資訊類別包含的只展現但未被點擊資訊分配的第二原始權重值、為該資訊類別分配的第一對應關係權重值和第二權重值分配單元為該資訊類別分配的第二對應關係權重值,確定該資訊類別與其包含的展現資訊之間的匹配度;資訊調整單元,用於針對該展現資訊所屬的任意資訊類別,執行:根據匹配度確定單元確定的該資訊類別與其包含的展現資訊之間的匹配度,調整該資訊類別包含的展現資訊。
  7. 如申請專利範圍第6項所述的裝置,其中,該第一權重值分配單元具體包括:總個數確定模組,用於確定展現資訊中包含的被點擊資訊的總個數、只展現但未被點擊資訊的總個數;第一分配模組,用於根據總個數確定模組確定的展現資訊的總個數、被點擊資訊的總個數,確定第一原始權重值並分配給各個被點擊資訊;第二分配模組,用於根據總個數確定模組確定的展現資訊的總個數、只展現但未被點擊資訊的總個數,確定第二原始權重值並分配給各個只展現但未被點擊資訊;第三分配模組,用於為資訊和個數確定單元確定的被點擊資訊所屬的各個資訊類別分別分配第一對應關係權重值。
  8. 如申請專利範圍第6項所述的裝置,其中,該匹配度確定單元具體包括:第一和值確定模組,用於針對該展現資訊所屬的任意資訊類別,執行該資訊類別包含的各個被點擊資訊被分配的第一原始權重值分別與該資訊類別被分配的第一對應關係權重值相乘,並對所有相乘結果進行相加的操作,得到第一和值;並第二和值確定模組,用於執行該資訊類別包含的各個只展現但未被點擊資訊被分配的第二原始權重值分別與該資訊類別被分配的第二對應關係權重值相乘,並對所有相乘結果進行相加的操作,得到第二和值;匹配度確定模組,用於根據第一和值確定模組確定的第一和值與第二和值確定模組確定的第二和值之和,確定該資訊類別與其包含的展現資訊之間的匹配度。
  9. 如申請專利範圍第6~8項之任一項所述的裝置,其中,該資訊調整單元具體包括:判斷模組,針對該展現資訊所屬的任意資訊類別,執行:判斷匹配度確定單元確定的該資訊類別與其包含的展現資訊之間的匹配度是否低於預設的匹配度閾值;選取模組,用於在判斷模組得到的判斷結果為是時,從該資訊類別包含的非展現資訊中選取資訊;更新模組,用於利用選取模組選取的資訊更新該資訊類別所包含的展現資訊。
  10. 如申請專利範圍第6~8項之任一項所述的裝置,其中,該點擊行為資訊為指定時間長度內的點擊行為資訊。
TW100128692A 2011-06-03 2011-08-11 Information adjustment method and device TWI498753B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110149832.6A CN102810104B (zh) 2011-06-03 2011-06-03 信息调整方法及装置

Publications (2)

Publication Number Publication Date
TW201250490A TW201250490A (en) 2012-12-16
TWI498753B true TWI498753B (zh) 2015-09-01

Family

ID=47233811

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100128692A TWI498753B (zh) 2011-06-03 2011-08-11 Information adjustment method and device

Country Status (7)

Country Link
US (1) US8745042B2 (zh)
EP (1) EP2715570A1 (zh)
JP (1) JP5624689B2 (zh)
CN (1) CN102810104B (zh)
HK (1) HK1173523A1 (zh)
TW (1) TWI498753B (zh)
WO (1) WO2012166958A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2722805A1 (en) * 2012-10-19 2014-04-23 Telefonica S.A. A user-profiling method for providing advertisement data and/or online content to a user and a computer program
CN106919692B (zh) * 2017-03-07 2021-02-19 阿里巴巴(中国)有限公司 一种推送消息的方法和装置
CN107506463B (zh) * 2017-08-30 2020-08-18 宁波城市职业技术学院 一种数据分类和处理方法及设备
CN114268626A (zh) * 2020-09-16 2022-04-01 阿里巴巴集团控股有限公司 窗口处理系统、方法以及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050120311A1 (en) * 2003-12-01 2005-06-02 Thrall John J. Click-through re-ranking of images and other data
TW201007488A (en) * 2008-04-15 2010-02-16 Yahoo Inc System and method for trail identification with search results
US7716218B1 (en) * 2007-07-20 2010-05-11 Oracle America, Inc. Method and system for enhanced search engine tuning
TW201102842A (en) * 2009-07-06 2011-01-16 Alibaba Group Holding Ltd Word matching and information searching method and device thereof

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5446891A (en) * 1992-02-26 1995-08-29 International Business Machines Corporation System for adjusting hypertext links with weighed user goals and activities
US6618722B1 (en) * 2000-07-24 2003-09-09 International Business Machines Corporation Session-history-based recency-biased natural language document search
DE60335472D1 (de) 2002-07-23 2011-02-03 Quigo Technologies Inc System und verfahren zur automatisierten abbildung von schlüsselwörtern und schlüsselphrasen auf dokumenten
US7444327B2 (en) * 2004-01-09 2008-10-28 Microsoft Corporation System and method for automated optimization of search result relevance
US7925657B1 (en) * 2004-03-17 2011-04-12 Google Inc. Methods and systems for adjusting a scoring measure based on query breadth
JP4453437B2 (ja) * 2004-05-11 2010-04-21 日本電信電話株式会社 検索キーワード順位付け方法及び装置及びプログラム
US20050256848A1 (en) * 2004-05-13 2005-11-17 International Business Machines Corporation System and method for user rank search
US7788260B2 (en) * 2004-06-14 2010-08-31 Facebook, Inc. Ranking search results based on the frequency of clicks on the search results by members of a social network who are within a predetermined degree of separation
KR100806862B1 (ko) 2004-07-16 2008-02-26 (주)이네스트커뮤니케이션 웹 사이트에서의 1차 키워드 검색에 대해 관련성 있는 2차키워드의 리스트를 제공하는 방법 및 장치
US8903827B2 (en) 2004-10-29 2014-12-02 Ebay Inc. Method and system for categorizing items automatically
US7617193B2 (en) * 2005-03-28 2009-11-10 Elan Bitan Interactive user-controlled relevance ranking retrieved information in an information search system
US8060463B1 (en) * 2005-03-30 2011-11-15 Amazon Technologies, Inc. Mining of user event data to identify users with common interests
US8812473B1 (en) * 2005-06-16 2014-08-19 Gere Dev. Applications, LLC Analysis and reporting of collected search activity data over multiple search engines
CN101311922A (zh) * 2007-05-25 2008-11-26 百度在线网络技术(北京)有限公司 广告模板样式匹配方法及系统
KR100898458B1 (ko) * 2007-08-10 2009-05-21 엔에이치엔(주) 정보 검색 방법 및 그 시스템
US8515035B2 (en) * 2007-10-01 2013-08-20 Ingenio Llc Systems and methods to connect people for real time communications
JP2009146248A (ja) * 2007-12-17 2009-07-02 Fujifilm Corp コンテンツ提示システム及びプログラム
CN101551806B (zh) * 2008-04-03 2012-04-18 北京搜狗科技发展有限公司 一种个性化网址导航的方法和系统
US20090271374A1 (en) * 2008-04-29 2009-10-29 Microsoft Corporation Social network powered query refinement and recommendations
US20100070339A1 (en) 2008-09-15 2010-03-18 Google Inc. Associating an Entity with a Category
US8185544B2 (en) * 2009-04-08 2012-05-22 Google Inc. Generating improved document classification data using historical search results
US9215420B2 (en) * 2010-06-01 2015-12-15 Comcast Cable Communications, Llc Ranking search results
US8818981B2 (en) * 2010-10-15 2014-08-26 Microsoft Corporation Providing information to users based on context

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050120311A1 (en) * 2003-12-01 2005-06-02 Thrall John J. Click-through re-ranking of images and other data
US7716218B1 (en) * 2007-07-20 2010-05-11 Oracle America, Inc. Method and system for enhanced search engine tuning
TW201007488A (en) * 2008-04-15 2010-02-16 Yahoo Inc System and method for trail identification with search results
TW201102842A (en) * 2009-07-06 2011-01-16 Alibaba Group Holding Ltd Word matching and information searching method and device thereof

Also Published As

Publication number Publication date
US20120310932A1 (en) 2012-12-06
HK1173523A1 (zh) 2013-05-16
CN102810104A (zh) 2012-12-05
JP2014517404A (ja) 2014-07-17
JP5624689B2 (ja) 2014-11-12
CN102810104B (zh) 2015-05-20
WO2012166958A1 (en) 2012-12-06
EP2715570A1 (en) 2014-04-09
US8745042B2 (en) 2014-06-03
TW201250490A (en) 2012-12-16

Similar Documents

Publication Publication Date Title
US9842170B2 (en) Method, apparatus and system of intelligent navigation
RU2629449C2 (ru) Устройство, а также способ выбора и размещения целевых сообщений на странице результатов поиска
US11843651B2 (en) Personalized recommendation method and system, and terminal device
US10528970B2 (en) Systems, methods, and devices for pipelined processing of online advertising performance data
US10679304B2 (en) System and method for positioning sponsored content in a social network interface
US9047622B1 (en) Delivering content to users based on advertisement interaction type
US8893012B1 (en) Visual indicator based on relative rating of content item
CN111123290B (zh) 将来自应用的转化与所选内容项目匹配
US9836766B1 (en) Customized landing pages
Lommatzsch et al. Real-time recommendations for user-item streams
US8799297B2 (en) Evaluating supply of electronic content relating to keywords
US11586684B2 (en) Serving multiple content items responsive to a single request
TWI539306B (zh) Information delivery method, processing server and merge server
US20120124070A1 (en) Recommending queries according to mapping of query communities
US10394832B2 (en) Ranking search results documents
TWI498753B (zh) Information adjustment method and device
US8868565B1 (en) Calibrating click duration according to context
CN108781223B (zh) 用于提供第三方内容的系统、方法和介质
KR102167756B1 (ko) 광고 관리 장치 및 방법
JP5312083B2 (ja) 広告決定方法及び装置
US20180039643A1 (en) Analysis and management of resources in a network
US20140214555A1 (en) Externalities in an auction
CN113905045B (zh) 用于提供第三方内容的系统、方法和介质
JP6382139B2 (ja) 情報処理装置、情報処理方法、及びプログラム
CN115422451A (zh) 一种评论展示方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees