TWI710917B - 資料處理方法及裝置 - Google Patents

資料處理方法及裝置 Download PDF

Info

Publication number
TWI710917B
TWI710917B TW107128021A TW107128021A TWI710917B TW I710917 B TWI710917 B TW I710917B TW 107128021 A TW107128021 A TW 107128021A TW 107128021 A TW107128021 A TW 107128021A TW I710917 B TWI710917 B TW I710917B
Authority
TW
Taiwan
Prior art keywords
search result
user
result item
search
item
Prior art date
Application number
TW107128021A
Other languages
English (en)
Other versions
TW201923629A (zh
Inventor
王彥鋒
Original Assignee
開曼群島商創新先進技術有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 開曼群島商創新先進技術有限公司 filed Critical 開曼群島商創新先進技術有限公司
Publication of TW201923629A publication Critical patent/TW201923629A/zh
Application granted granted Critical
Publication of TWI710917B publication Critical patent/TWI710917B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本案實施例揭露了一種資料處理方法及裝置。所述方法包括:獲取用戶的身份資訊、搜尋詞以及與所述搜尋詞相匹配的搜尋結果項集合;獲取所述用戶對所述搜尋結果項集合的歷史接取資料,以及與所述用戶的所述身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料;根據所述用戶的歷史接取資料以及所述多個其他用戶的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。利用本案技術方案,可以使得推薦給用戶的搜尋結果項更加符合用戶的需求以及用戶的身份資訊。

Description

資料處理方法及裝置
本案涉及資料處理技術領域,特別涉及一種資料處理方法及裝置。
近幾年,基於網際網路平台提供的服務越來越多,其中,資料查詢服務已經在各個行業中廣泛應用。資料查詢服務可以根據用戶輸入的搜尋詞從平台上獲取相關資料,並將相關資料展示給用戶,具體的相關資料例如可以包括文檔、產品資訊等資料。   在一些特定行業內,如網際網路行業,隨著企業不斷的發展,企業內資訊系統沉澱積累的資料資訊較多。由於企業內部資料資訊的保密性和不可公開性,諸多資訊一般不允許對外部搜尋引擎開放,僅允許在組織架構的區域網路內接取。企業內部積累的資料資訊對於企業用戶來說,是具有價值的數據資料,對推動企業內部知識轉移和學習具有重要意義。但是,目前很多行業內組織架構複雜,組織架構內用戶在根據搜尋詞搜尋企業內資料時,企業內組織架構往往僅根據搜尋詞匹配到與所述搜尋詞相似的內部資料,並將該資料展示給用戶。   利用上述方式獲取的用戶資料往往只能獲取一些字面上與搜尋詞相關的資料資訊,但是卻無法滿足用戶的實際搜尋訴求。因此,現有技術中極需一種與用戶實際的搜尋需求相匹配的資料處理方式。
本案實施例的目的在於提供一種資料處理方法及裝置,可以使得推薦給用戶的搜尋結果項更加符合用戶的需求以及用戶的身份資訊。   本案實施例提供的一種資料處理方法及裝置具體是這樣實現的:   一種資料處理方法,所述方法包括:   獲取用戶的身份資訊、搜尋詞以及與所述搜尋詞相匹配的搜尋結果項集合;   獲取所述用戶對所述搜尋結果項集合的歷史接取資料,以及與所述用戶的所述身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料;   根據所述用戶的歷史接取資料以及所述多個其他用戶的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。   一種資料處理裝置,所述裝置包括:   結果項獲取單元,用於獲取用戶的身份資訊、搜尋詞以及與所述搜尋詞相匹配的搜尋結果項集合;   歷史資料獲取單元,用於獲取所述用戶對所述搜尋結果項集合的歷史接取資料,以及與所述用戶的所述身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料;   推薦結果項提取單元,用於根據所述用戶的歷史接取資料以及所述多個其他用戶的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。   一種資料處理裝置,包括處理器以及用於儲存處理器可執行指令的記憶體,所述處理器執行所述指令時實現:   獲取用戶的身份資訊、搜尋詞以及與所述搜尋詞相匹配的搜尋結果項集合;   獲取所述用戶對所述搜尋結果項集合的歷史接取資料,以及與所述用戶的所述身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料;   根據所述用戶的歷史接取資料以及所述多個其他用戶的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。   本案提供的資料處理方法及裝置,可以根據用戶的搜尋詞匹配到搜尋結果項集合,再根據用戶對所述搜尋結果項集合的歷史接取資料,以及與所述用戶身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。利用用戶以及與用戶身份資訊相匹配的多個用戶的歷史資料,對推薦給用戶的搜尋結果項產生影響,使得推薦給用戶的搜尋結果項更加符合用戶的需求以及用戶的身份資訊。尤其對於處於組織架構內的用戶來說,用戶在組織架構內搜尋到的相關資料更加符合用戶的搜尋需求以及用戶在組織架構內的身份。
為了使本技術領域的人員更好地理解本案中的技術方案,下面將結合本案實施例中的圖式,對本案實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本案一部分實施例,而不是全部的實施例。基於本案中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都應當屬於本案保護的範圍。   下面結合圖式對本案所述的資料處理方法進行詳細的說明。圖1是本案提供的資料處理方法的一種實施例的方法流程示意圖。雖然本案提供了如下述實施例或圖式所示的方法操作步驟,但基於常規或者無需創造性的勞動在所述方法中可以包括更多或者更少的操作步驟。在邏輯性上不存在必要因果關係的步驟中,這些步驟的執行順序不限於本案實施例提供的執行順序。所述方法在實際中的資料處理過程中,可以按照實施例或者圖式所示的方法順序執行或者並行執行(例如並行處理器或者多執行緒處理的環境)。   具體的本案提供的一種資料處理方法的一種實施例如圖1所示,所述方法可以包括:   S101:獲取用戶的身份資訊、搜尋詞以及與所述搜尋詞相匹配的搜尋結果項集合。   本說明書中,所述用戶的身份資訊可以包括所述用戶在組織架構中的身份資訊。所述組織架構例如可以包括企業、學校、圖書館等具有內部區域網路的機構,在所述組織結構中,用戶可以透過搜尋詞搜尋組織架構提供的資料。例如,對於企業來說,用戶的身份資訊可以包括該用戶所在的部門、職位(如管理人員、研發人員、文員等等)。對於學校來說,用戶的身份資訊可以包括該用戶所在的學院、職位(教授、講師、輔導員、博士研究生、碩士研究生、本科生等等)。對於圖書館,可以具有與學校相似的身份資訊劃分,對此不再贅述。在獲取所述用戶的身份資訊時,可以根據用戶的標識資訊獲取所述身份資訊。例如,當用戶登錄到組織架構的區域網路時,可以根據所述用戶的標識資訊(如登錄帳號)獲取到與所述標識資訊相匹配的身份資訊,例如,所述標識資訊可以與所述身份資訊綁定,在確定用戶的標識資訊之後,可以根據所述標識資訊確定用戶的身份資訊。當然,在其他實施例中,所述組織架構不限於具有內部區域網路,也可以運行於非區域網路中,本案對此不作限制。   本說明書中,用戶可以在組織架構內搜尋資料,具體地,用戶可以在所述組織架構的區域網路內輸入搜尋詞,如“卷積神經網路”、“醫療 VR”等等搜尋詞。在獲取到所述搜尋詞之後,可以獲取與所述搜尋詞相匹配的搜尋結果項集合。本說明書中,所述搜尋結果項可以包括多種資料類型,如文檔、圖片、視訊、資訊、日誌等多種資料資訊。所述搜尋結果項集合中可以包括上述資料類型中的一種或者多種。其中,所述搜尋結果項與所述搜尋詞相匹配可以包括所述搜尋結果項中可以包含所述搜尋詞,例如,對於文檔搜尋來說,搜尋到的文檔中可以包含所述搜尋詞,如文檔的標題、摘要、正文、結語等一處或者多處出現所述搜尋詞。當然,在說明書的其他實施例中,所述搜尋結果項與所述搜尋詞相匹配還可以包括所述搜尋結果項中包括與所述搜尋詞的同義或者相似含義的詞彙,對此,本案在此不做限制。   S103:獲取所述用戶對所述搜尋結果項集合的歷史接取資料,以及與所述用戶的所述身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料。   本說明書中,還可以獲取所述用戶對所述搜尋結果項集合的歷史接取資料,以及與所述用戶的所述身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料。本說明書中,可以從所述組織架構的資料庫中獲取用戶的用戶日誌,並從所述用戶日誌中獲取所述用戶對所述搜尋結果項集合的歷史接取資料。本說明書中,所述與所述用戶的所述身份資訊相匹配的其他用戶可以包括與所述用戶的身份資訊相同的多個其他用戶,或者,與所述用戶的身份資訊位於同一等級的多個其他用戶。例如,若用戶A屬於公司研發部門的研發人員,即與用戶A相匹配的多個其他用戶可以包括與所述用戶A同樣屬於研發部門的多個研發人員。本說明書中,所述歷史接取資料可以包括所述用戶和所述多個其他用戶對所述搜尋結果項的接取頻率、接取時間等多個資料。例如,在一個示例中,根據用戶A的搜尋詞“卷積神經網路”搜尋到共200篇與卷積神經網路相關的電子文檔,根據後台資料庫的用戶日誌,可以獲取到用戶A分別對所述200篇電子文檔的接取記錄,如對各篇電子文檔的接取次數等資料。另外,在確定與用戶A相匹配的多個其他用戶,即與所述用戶A同樣屬於研發部門的多個研發人員之後,可以獲取所述多個研發人員的對上述200篇電子文檔的接取記錄。   S105:根據所述用戶的歷史接取資料以及所述多個其他用戶的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。   本說明書中,在獲取到所述用戶以及與所述用戶身份資訊相匹配的多個其他用戶的歷史接取資料之後,可以根據所述用戶以及所述多個其他用戶的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。在一個實施例中,如圖2所示,所述根據所述用戶的歷史接取資料以及所述多個其他用戶的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項可以包括:   S201:根據所述用戶以及所述多個其他用戶的歷史接取資料,分別統計所述用戶以及所述多個其他用戶分別對所述搜尋結果項的接取頻率。   S203:根據所述接取頻率從所述搜尋結果項集合中提取所述身份資訊所對應的頻繁項集合。   S205:根據所述用戶的歷史接取資料以及所述頻繁項集合,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。   本說明書中,可以根據所述用戶以及所述多個其他用戶的歷史接取資料,分別統計所述用戶以及所述多個其他用戶對所述搜尋結果項集合中搜尋結果項的接取頻率。例如在上述舉例中,用戶A對文檔3的接取頻率為3,即用戶A一共接取過3次文檔3,而用戶B對文檔80的接取頻率為10,即用戶B一共接取過10次文檔80。然後,可以根據所述接取頻率從所述搜尋結果項中提取所述身份資訊所對應的頻繁項集合。所述頻繁項集合可以包括所述身份資訊所對應的接取比較頻繁的多個搜尋結果項組成的集合。具體地,在一個實施例中,如圖3所示,所述根據所述接取頻率從所述搜尋結果項集合中提取所述身份資訊所對應的頻繁項集合可以包括:   S301:根據所述接取頻率分別統計所述搜尋結果項集合中搜尋結果項的總接取頻率。   S303:根據所述搜尋結果項的總接取頻率計算所述搜尋結果項的支持度值。   S305:根據所述搜尋結果項的支持度值計算所述搜尋結果項集合的總支持度值。   S307:將所述搜尋結果項集合中支持度值不小於所述總支持度值的搜尋結果項的集合作為所述身份資訊對應的頻繁項集合。   本說明書中,可以根據所述用戶以及所述多個其他用戶分別對所述搜尋結果項的接取頻率,統計各個搜尋結果項的總接取頻率。例如,對於上述示例中的文檔3,根據各個用戶對文檔3的接取頻率,可以統計得到用戶A以及其他多個研發人員對文檔3的總接取頻率,例如,據統計,對文檔3的總接取頻率為40次。然後,在獲取到所述搜尋結果項集合中各個搜尋結果項的接取頻率之後,可以計算各個搜尋結果項的支持度值,所述支持度值可以包括各個搜尋結果項的關注熱度資訊。   在本說明書的其他實施例中,所述身份資訊還可以包括多個身份等級,此時,如圖4所示,所述根據所述接取頻率從所述搜尋結果項集合中提取所述身份資訊所對應的頻繁項集合可以包括:   S401:根據所述接取頻率分別從所述搜尋結果項集合中分別提取所述多個身份等級對應的頻繁項集合。   S403:將所述多個身份等級對應的頻繁項集合的交集作為所述身份資訊所對應的頻繁項集合。   在本實施例中,所述身份等級可以包括組織架構內垂直的用戶等級劃分。例如,對於一般的企業來說,可以劃分為多個部門,每個部門具有各自的職位等級,如決策層、管理層以及普通用戶層。也就是說,對於企業內的一個用戶來說,該用戶的身份資訊中可以包括多個身份等級資訊。例如上述示例中用戶A,其身份資訊可以包括{研發部門,普通研發人員},即用戶A的身份資訊中至少包含兩層身份等級。在獲取到用戶的身份等級之後,可以根據所述接取頻率從所述搜尋結果項集合中分別提取所述多個身份等級所對應的頻繁項集合。在獲取到所述多個身份等級所對應的頻繁項集合之後,可以將所述多個身份等級所對應的頻繁項結合的交集作為所述身份資訊所對應的頻繁項集合。   下面透過一個示例說明上述獲取頻繁項集合的過程,例如,根據搜尋詞搜尋得到的搜尋結果項集合可以表示為
Figure 02_image001
Figure 02_image003
表示為第
Figure 02_image005
個搜尋結果項。根據組織架構區域網路中的用戶日誌等歷史資料,統計得到組織架構中搜尋部門的用戶A實際接取的點擊項集合為
Figure 02_image007
Figure 02_image009
表示為第
Figure 02_image011
個點擊項,顯然
Figure 02_image013
Figure 02_image015
。對於該搜尋部門內的所有
Figure 02_image017
個用戶,可以得到具有
Figure 02_image017
個不同點擊項集合的點擊項總集合
Figure 02_image019
。統計所述計算點擊項總集合
Figure 02_image021
中所有的點擊項,得到點擊項總集合
Figure 02_image021
中共包含
Figure 02_image024
個點擊項
Figure 02_image026
,其中,
Figure 02_image028
表示
Figure 02_image030
一項,若設置所述
Figure 02_image024
個點擊項的支持度為
Figure 02_image032
,其中,
Figure 02_image034
表示
Figure 02_image036
一項,則
Figure 02_image034
的計算公式可以為:
Figure 02_image038
其中,
Figure 02_image040
Figure 02_image042
Figure 02_image044
。將
Figure 02_image046
區間劃分為
Figure 02_image048
個等份,每個點擊項的支持度
Figure 02_image036
分佈在該區間各個子區間段上,那麼求得部門總支持度值
Figure 02_image050
Figure 02_image052
根據求出的總支持度
Figure 02_image054
可以計算得到推薦給該搜尋部門用戶的頻繁項集合
Figure 02_image055
,具體地,可以將點擊項總集合
Figure 02_image021
中支持度大於等於
Figure 02_image054
的點擊項的集合作為所述頻繁項集合
Figure 02_image055
。假設所述頻繁項集合
Figure 02_image055
具有
Figure 02_image057
項,且
Figure 02_image059
,則
Figure 02_image061
中任意一個搜尋結果項的支持度值大於等於
Figure 02_image054
。   在本說明書的一個實施例中,如圖5所示,所述從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項可以包括:   S501:從所述搜尋詞中提取至少一個搜尋分詞;   S503:分別計算所述至少一個搜尋分詞在所述搜尋結果項中多個搜尋區域的鄰近度值;   S505:根據所述鄰近度值以及所述多個搜尋區域的權重值,分別計算所述搜尋詞對應於所述搜尋結果項的鄰近度值;   S507:根據所述用戶的歷史接取資料、所述多個其他用戶的歷史接取資料以及所述搜尋詞對應於所述搜尋結果項的鄰近度值,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。   本實施例中,所述搜尋詞中可以包括一個或者多個獨立的分詞,此時,可以從所述搜尋詞中提取至少一個搜尋分詞,例如對於描述詞“醫療 VR”,可以從中提取出搜尋分詞“醫療”、“VR”。在確定所述搜尋詞中的至少一個搜尋分詞之後,可以分別計算所述至少一個搜尋分詞在所述搜尋結果項中多個搜尋區域的鄰近度值。其中,所述鄰近度值越大,表示所述搜尋分詞與所述搜尋區域的關聯程度越大,就越有可能符合用戶的期望結果。所述搜尋結果項的搜尋區域可以包括所述搜尋結果項的各個組成部分,例如,當所述搜尋結果項為文檔時,所述搜尋區域可以包括文檔的標題、摘要、正文、結語等多個不同的組成部分。   在獲取到所述鄰近度值以及所述多個搜尋區域的權重值之後,可以分別計算所述搜尋詞對應於所述搜尋結果項的鄰近度值。即將多個搜尋分詞對應的鄰近度值合併成所述搜尋詞對應於所述搜尋結果項的鄰近度值。在獲取到所述搜尋詞對應於所述搜尋結果項的鄰近度值之後,可以根據所述用戶的歷史接取資料、所述多個其他用戶的歷史接取資料以及所述搜尋詞對應於所述搜尋結果項的鄰近度值,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。   具體地,在本說明書的一個實施例中,所述根據所述用戶的歷史接取資料、所述多個其他用戶的歷史接取資料以及所述搜尋詞對應於所述搜尋結果項的鄰近度值,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項可以包括:   SS1:根據所述用戶的歷史接取資料、所述多個其他用戶的歷史接取資料,分別計算所述用戶對應於所述搜尋結果項的個性化權重值。   SS3:根據所述搜尋詞對應於所述搜尋結果項的鄰近度值以及所述用戶對應於所述搜尋結果項的個性化權重值,計算所述搜尋結果項的評分值。   SS5:將所述搜尋結果項集合中評分值大於預設臨限值的搜尋結果項推薦給所述用戶。   本實施例中,可以根據所述用戶以及所述多個其他用戶的歷史接取資料,分別計算所述用戶對應於各個搜尋結果項的個性化權重值。根據所述搜尋詞對應於所述搜尋結果項的鄰近度值以及所述用戶對應於所述搜尋結果項的個性化權重值,計算所述搜尋結果項的評分值。然後,將所述搜尋結果項集合中評分值大於預設臨限值的搜尋結果項推薦給所述用戶。   下面透過一個示例具體說明上述實施例過程,對於用戶提交的搜尋詞
Figure 02_image062
,透過中文分詞得到搜尋分詞
Figure 02_image064
(其中,
Figure 02_image066
表示搜尋詞
Figure 02_image062
中的第
Figure 02_image069
個搜尋分詞),且
Figure 02_image071
,則在某一搜尋區域
Figure 02_image073
中搜尋分詞
Figure 02_image066
的位置記為
Figure 02_image075
,搜尋分詞
Figure 02_image077
的位置記為
Figure 02_image079
,搜尋分詞
Figure 02_image066
Figure 02_image081
的最小距離值記為
Figure 02_image083
,其鄰近度值記為
Figure 02_image085
,則
Figure 02_image087
搜尋結果項
Figure 02_image089
中包含多個搜尋區域的描述(如標題,內容,路徑等),且
Figure 02_image091
,搜尋區域的權重為
Figure 02_image093
,則搜尋詞
Figure 02_image062
對應於所述搜尋結果項
Figure 02_image089
的鄰近度值記為
Figure 02_image095
,那麼,
Figure 02_image097
透過搜尋結果項
Figure 02_image089
的鄰近度值
Figure 02_image099
更新評分結果,可以從用戶輸入的搜尋詞入手,利用鄰近度值對與用戶需求相關的搜尋結果產生影響,能夠準確返回與搜尋詞相匹配的搜尋結果。另外,從鄰近度計算公式來看,演算法的複雜度沒有增加,保證較快的搜尋速度。   在按照上述實施例方法,根據組織架構內用戶點擊項集合
Figure 02_image101
與其所在部門的權限組的頻繁項集
Figure 02_image103
之間不存在包屬的關係,但
Figure 02_image105
,系統初始設置用戶點擊項與推薦項的權值比為常量
Figure 02_image107
(
Figure 02_image109
),當
Figure 02_image111
時,忽略用戶實際點擊效果,搜尋引擎展現給用戶的是推薦的搜尋結果;當
Figure 02_image113
時,忽略系統推薦的搜尋結果,僅體現用戶點擊效果。當
Figure 02_image115
時,融合了用戶點擊和系統推薦的搜尋結果。那麼用戶推薦點擊項的權重為
Figure 02_image117
可以表示為:
Figure 02_image119
其中
Figure 02_image121
表示用戶對
Figure 02_image123
項的點擊量,
Figure 02_image125
Figure 02_image127
分別表示推薦
Figure 02_image129
Figure 02_image130
項的點擊量。由於處於組織架構內不同部門、不同權限組的用戶關注的內容不同,點擊密度隨時間、部門差別和權限組有較大變化,搜尋呈現的排序結果更符合個性化的特點。而且推薦項的權重可以離線計算,定期更新點擊項與推薦項的權重,不影響檢索速度。   評分排序結果融合是先根據查詢內容的鄰近度值與關鍵詞權重計算計算結果搜尋結果項的評分值,然後融合結果搜尋結果項的個性化權重得到最終排序結果。具體方法如下:   結果搜尋結果項的評分分為兩個部分,一是基於布爾和向量空間模型的加權評分
Figure 02_image132
,計算公式可以表示為
Figure 02_image134
其中,
Figure 02_image136
表示查詢項
Figure 02_image138
在某一搜尋結果項
Figure 02_image140
中出現的詞頻,
Figure 02_image142
表示含有查詢項
Figure 02_image138
的搜尋結果項數(或占總搜尋結果項的比例)。   二是加權鄰近度評分
Figure 02_image144
。因此,擴展布爾和向量空間模型後的評分公式
Figure 02_image145
Figure 02_image147
根據結果搜尋結果項的權重,更新評分資料
Figure 02_image149
。最終得到的結果項集合
Figure 02_image151
已知,點擊項的權重
Figure 02_image153
影響集合
Figure 02_image155
搜尋結果項的評分,原始項權重值為1,由公式得到融合後的評分結果為
Figure 02_image156
對於集合
Figure 02_image158
不包含
Figure 02_image159
的搜尋結果項,其評分不變。這樣計算得到的評分,能夠體現用戶行為特徵的同時,也向用戶推薦了其它用戶關注的內容,很好的改善了用戶的體驗感,從而實現了用戶個性化排序結果的展現。   本案提供的資料處理方法,可以根據用戶的搜尋詞匹配到搜尋結果項集合,再根據用戶對所述搜尋結果項集合的歷史接取資料,以及與所述用戶身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。利用用戶以及與用戶身份資訊相匹配的多個用戶的歷史資料,對推薦給用戶的搜尋結果項產生影響,使得推薦給用戶的搜尋結果項更加符合用戶的需求以及用戶的身份資訊。尤其對於處於組織架構內的用戶來說,用戶在組織架構內搜尋到的相關資料更加符合用戶的搜尋需求以及用戶在組織架構內的身份。   本案另一方面還提供一種時間序列中異常點檢測裝置,圖6是本案提供的資料處理裝置的一種實施例的模組結構示意圖,如圖6所示,所述裝置60可以包括:   結果項獲取單元61,用於獲取用戶的身份資訊、搜尋詞以及與所述搜尋詞相匹配的搜尋結果項集合;   歷史資料獲取單元63,用於獲取所述用戶對所述搜尋結果項集合的歷史接取資料,以及與所述用戶的所述身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料;   推薦結果項提取單元65,用於根據所述用戶的歷史接取資料以及所述多個其他用戶的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。   可選的,在本案的一個實施例中,所述推薦結果項提取單元65包括:   接取頻率統計單元,用於根據所述用戶以及所述多個其他用戶的歷史接取資料,分別統計所述用戶以及所述多個其他用戶分別對所述搜尋結果項的接取頻率;   頻繁項集合提取單元,用於根據所述接取頻率從所述搜尋結果項集合中提取所述身份資訊所對應的頻繁項集合;   結果項提取單元,用於根據所述用戶的歷史接取資料以及所述頻繁項集合,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。   可選的,在本案的一個實施例中,所述頻繁項集合提取單元可以包括:   總接取頻率統計單元,用於根據所述接取頻率分別統計所述搜尋結果項集合中搜尋結果項的總接取頻率;   支持度計算單元,用於根據所述搜尋結果項的總接取頻率計算所述搜尋結果項的支持度值;   總支持度計算單元,用於根據所述搜尋結果項的支持度值計算所述搜尋結果項集合的總支持度值;   頻繁項集合提取子單元,用於將所述搜尋結果項集合中支持度值不小於所述總支持度值的搜尋結果項的集合作為所述身份資訊對應的頻繁項集合。   可選的,在本案的一個實施例中,當所述身份資訊包括多個身份等級時,所述頻繁項集合提取單元可以包括:   多個頻繁項集合提取單元,用於根據所述接取頻率分別從所述搜尋結果項集合中分別提取所述多個身份等級對應的頻繁項集合;   頻繁項交集計算單元,用於將所述多個身份等級對應的頻繁項集合的交集作為所述身份資訊所對應的頻繁項集合。   可選的,在本案的一個實施例中,所述推薦結果項提取單元可以包括:   分詞提取單元,用於從所述搜尋詞中提取至少一個搜尋分詞;   第一鄰近度值計算單元,用於分別計算所述至少一個搜尋分詞在所述搜尋結果項中多個搜尋區域的鄰近度值;   第二鄰近度值計算單元,用於根據所述鄰近度值以及所述多個搜尋區域的權重值,分別計算所述搜尋詞對應於所述搜尋結果項的鄰近度值;   結果項提取子單元,用於根據所述用戶的歷史接取資料、所述多個其他用戶的歷史接取資料以及所述搜尋詞對應於所述搜尋結果項的鄰近度值,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。   可選的,在本案的一個實施例中,所述結果項提取子單元可以包括:   權重值計算單元,用於根據所述用戶的歷史接取資料、所述多個其他用戶的歷史接取資料,分別計算所述用戶對應於所述搜尋結果項的個性化權重值;   評分值計算單元,用於根據所述搜尋詞對應於所述搜尋結果項的鄰近度值以及所述用戶對應於所述搜尋結果項的個性化權重值,計算所述搜尋結果項的評分值;   結果項推薦單元,用於將所述搜尋結果項集合中評分值大於預設臨限值的搜尋結果項推薦給所述用戶。   本案另一方面還提供一種資料處理裝置,圖7是本案提供的資料處理裝置的一種實施例的模組結構示意圖,如圖7所示,所述裝置70可以包括處理器以及用於儲存處理器可執行指令的記憶體,所述處理器執行所述指令時可以實現:   獲取用戶的身份資訊、搜尋詞以及與所述搜尋詞相匹配的搜尋結果項集合;   獲取所述用戶對所述搜尋結果項集合的歷史接取資料,以及與所述用戶的所述身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料;   根據所述用戶的歷史接取資料以及所述多個其他用戶的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。   在20世紀90年代,對於一個技術的改進可以很明顯地區分是硬體上的改進(例如,對二極體、電晶體、開關等電路結構的改進)還是軟體上的改進(對於方法流程的改進)。然而,隨著技術的發展,當今的很多方法流程的改進已經可以視為硬體電路結構的直接改進。設計人員幾乎都透過將改進的方法流程程式化到硬體電路中來得到相應的硬體電路結構。因此,不能說一個方法流程的改進就不能用硬體實體模組來實現。例如,可程式化邏輯器件(Programmable Logic Device, PLD)(例如現場可程式化閘陣列(Field Programmable Gate Array,FPGA))就是這樣一種積體電路,其邏輯功能由用戶對器件程式化來確定。由設計人員自行程式化來把一個數位系統“整合”在一片PLD上,而不需要請晶片製造廠商來設計和製作專用的積體電路晶片。而且,如今,取代手工地製作積體電路晶片,這種程式化也多半改用“邏輯編譯器(logic compiler)”軟體來實現,它與程式開發撰寫時所用的軟體編譯器相類似,而要編譯之前的原始碼也得用特定的程式化語言來撰寫,此稱之為硬體描述語言(Hardware Description Language,HDL),而HDL也並非僅有一種,而是有許多種,如ABEL (Advanced Boolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL (Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等,目前最普遍使用的是VHDL (Very-High-Speed Integrated Circuit Hardware Description Language)與Verilog。本領域技術人員也應該清楚,只需要將方法流程用上述幾種硬體描述語言稍作邏輯程式化並程式化到積體電路中,就可以很容易得到實現該邏輯方法流程的硬體電路。   控制器可以按任何適當的方式實現,例如,控制器可以採取例如微處理器或處理器以及儲存可由該(微)處理器執行的計算機可讀程式碼(例如軟體或韌體)的計算機可讀媒體、邏輯閘、開關、專用積體電路(Application Specific Integrated Circuit,ASIC)、可程式化邏輯控制器和嵌入微控制器的形式,控制器的例子包括但不限於以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,記憶體控制器還可以被實現為記憶體的控制邏輯的一部分。本領域技術人員也知道,除了以純計算機可讀程式碼方式實現控制器以外,完全可以透過將方法步驟進行邏輯程式化來使得控制器以邏輯閘、開關、專用積體電路、可程式化邏輯控制器和嵌入微控制器等的形式來實現相同功能。因此這種控制器可以被認為是一種硬體部件,而對其內包括的用於實現各種功能的裝置也可以視為硬體部件內的結構。或者甚至,可以將用於實現各種功能的裝置視為既可以是實現方法的軟體模組又可以是硬體部件內的結構。   上述實施例闡明的單元,具體可以由計算機晶片或實體實現,或者由具有某種功能的產品來實現。一種典型的實現設備為計算機。具體的,計算機例如可以為個人計算機、膝上型計算機、蜂窩電話、相機電話、智慧型電話、個人數位助理、媒體播放器、導航設備、電子郵件設備、遊戲控制台、平板計算機、可穿戴設備或者這些設備中的任何設備的組合。   為了描述的方便,描述以上客戶端或伺服器時以功能分為各種單元分別描述。當然,在實施本案時可以把各單元的功能在同一個或多個軟體和/或硬體中實現。   本領域內的技術人員應明白,本發明的實施例可提供為方法、系統、或計算機程式產品。因此,本發明可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本發明可採用在一個或多個其中包含有計算機可用程式碼的計算機可用儲存媒體(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施的計算機程式產品的形式。   本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程式產品的流程圖和/或方塊圖來描述的。應理解可由計算機程式指令實現流程圖和/或方塊圖中的每一流程和/或方塊、以及流程圖和/或方塊圖中的流程和/或方塊的結合。可提供這些計算機程式指令到通用計算機、專用計算機、嵌入式處理機或其他可程式化資料處理設備的處理器以產生一個機器,使得透過計算機或其他可程式化資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方塊圖一個方塊或多個方塊中指定的功能的裝置。   這些計算機程式指令也可儲存在能引導計算機或其他可程式化資料處理設備以特定方式工作的計算機可讀記憶體中,使得儲存在該計算機可讀記憶體中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程和/或方塊圖一個方塊或多個方塊中指定的功能。   這些計算機程式指令也可裝載到計算機或其他可程式化資料處理設備上,使得在計算機或其他可程式化設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可程式化設備上執行的指令提供用於實現在流程圖一個流程或多個流程和/或方塊圖一個方塊或多個方塊中指定的功能的步驟。   在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出埠、網路埠和記憶體。   記憶體可能包括計算機可讀媒體中的非永久性記憶體,隨機存取記憶體(RAM)和/或非揮發性記憶體等形式,如唯讀記憶體(ROM)或快閃記憶體(flash RAM)。記憶體是計算機可讀媒體的示例。   計算機可讀媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是計算機可讀指令、資料結構、程式的模組或其他資料。計算機的儲存媒體的例子包括,但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可擦除可程式化唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶,磁帶磁磁碟儲存或其他磁性儲存設備或任何其他非傳輸媒體,可用於儲存可以被計算設備接取的資訊。按照本文中的界定,計算機可讀媒體不包括暫存電腦可讀媒體(transitory media),如調變的資料信號和載波。   還需要說明的是,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,並不排除在包括所述要素的過程、方法、商品或者設備中還存在另外的相同要素。   本領域技術人員應明白,本案的實施例可提供為方法、系統或計算機程式產品。因此,本案可採用完全硬體實施例、完全軟體實施例或結合軟體和硬體方面的實施例的形式。而且,本案可採用在一個或多個其中包含有計算機可用程式碼的計算機可用儲存媒體(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施的計算機程式產品的形式。   本案可以在由計算機執行的計算機可執行指令的一般上下文中描述,例如程式模組。一般地,程式模組包括執行特定任務或實現特定抽象資料類型的例程、程式、對象、組件、資料結構等等。也可以在分布式計算環境中實踐本案,在這些分布式計算環境中,由透過通信網路而被連接的遠端處理設備來執行任務。在分布式計算環境中,程式模組可以位於包括儲存設備在內的本地和遠端計算機儲存媒體中。   本說明書中的各個實施例均採用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。   以上所述僅為本案的實施例而已,並不用於限制本案。對於本領域技術人員來說,本案可以有各種更改和變化。凡在本案的精神和原理之內所作的任何修改、等同替換、改進等,均應包含在本案的申請專利範圍之內。
S101, S103, S105‧‧‧步驟S201, S203, S205‧‧‧步驟S301, S303, S305, S307‧‧‧步驟S401, S403‧‧‧步驟S501, S503, S505, S507‧‧‧步驟SS1, SS3, SS5‧‧‧步驟60‧‧‧裝置61‧‧‧結果項獲取單元63‧‧‧歷史資料獲取單元65‧‧‧推薦結果項提取單元70‧‧‧裝置
為了更清楚地說明本案實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的圖式作簡單地介紹,顯而易見地,下面描述中的圖式僅僅是本案中記載的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些圖式獲得其他的圖式。   圖1是本案提供的資料處理方法的一種實施例的流程示意圖;   圖2是本案提供的提取搜尋結果項方法的一種實施例的方法流程示意圖;   圖3是本案提供的獲取頻繁項方法的一種實施例的方法流程圖;   圖4是本案提供的獲取頻繁項方法的另一種實施例的方法流程圖;   圖5是本案提供的推薦搜尋結果項方法的一種實施例的方法流程圖;   圖6是本案提供的資料處理裝置裝置的一種實施例的模組結構示意圖;   圖7是本案提供的資料處理裝置的另一種實施例的模組結構示意圖。

Claims (9)

  1. 一種資料處理方法,所述方法包括:獲取用戶的身份資訊、搜尋詞以及與所述搜尋詞相匹配的搜尋結果項集合,其中所述用戶的身份資訊是所述用戶在組織架構中的身份資訊,所述組織架構是包含內部區域網路的機構;獲取所述用戶對所述搜尋結果項集合的歷史接取資料,以及與所述用戶的所述身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料;根據所述用戶的歷史接取資料以及所述多個其他用戶的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項,其包括:根據所述用戶以及所述多個其他用戶的歷史接取資料,分別統計所述用戶以及所述多個其他用戶分別對所述搜尋結果項的接取頻率;根據所述接取頻率從所述搜尋結果項集合中提取所述身份資訊所對應的頻繁項集合,其中,當所述身份資訊包括多個身份等級時,還根據所述接取頻率分別從所述搜尋結果項集合中分別提取所述多個身份等級對應的頻繁項集合,並且將所述多個身份等級對應的頻繁項集合的交集作為所述身份資訊所對應的頻繁項集合;根據所述用戶的歷史接取資料以及所述頻繁項集合, 從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。
  2. 根據請求項1所述的方法,所述根據所述接取頻率從所述搜尋結果項集合中提取所述身份資訊所對應的頻繁項集合包括:根據所述接取頻率分別統計所述搜尋結果項集合中搜尋結果項的總接取頻率;根據所述搜尋結果項的總接取頻率計算所述搜尋結果項的支持度值;根據所述搜尋結果項的支持度值計算所述搜尋結果項集合的總支持度值;將所述搜尋結果項集合中支持度值不小於所述總支持度值的搜尋結果項的集合作為所述身份資訊對應的頻繁項集合。
  3. 根據請求項1所述的方法,所述從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項包括:從所述搜尋詞中提取至少一個搜尋分詞;分別計算所述至少一個搜尋分詞在所述搜尋結果項中多個搜尋區域的鄰近度值;根據所述鄰近度值以及所述多個搜尋區域的權重值,分別計算所述搜尋詞對應於所述搜尋結果項的鄰近度值;根據所述用戶的歷史接取資料、所述多個其他用戶的 歷史接取資料以及所述搜尋詞對應於所述搜尋結果項的鄰近度值,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。
  4. 根據請求項3所述的方法,所述根據所述用戶的歷史接取資料、所述多個其他用戶的歷史接取資料以及所述搜尋詞對應於所述搜尋結果項的鄰近度值,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項包括:根據所述用戶的歷史接取資料、所述多個其他用戶的歷史接取資料,分別計算所述用戶對應於所述搜尋結果項的個性化權重值;根據所述搜尋詞對應於所述搜尋結果項的鄰近度值以及所述用戶對應於所述搜尋結果項的個性化權重值,計算所述搜尋結果項的評分值;將所述搜尋結果項集合中評分值大於預設臨限值的搜尋結果項推薦給所述用戶。
  5. 一種資料處理裝置,所述裝置包括:結果項獲取單元,用於獲取用戶的身份資訊、搜尋詞以及與所述搜尋詞相匹配的搜尋結果項集合,其中所述用戶的身份資訊是所述用戶在組織架構中的身份資訊,所述組織架構是包含內部區域網路的機構;歷史資料獲取單元,用於獲取所述用戶對所述搜尋結 果項集合的歷史接取資料,以及與所述用戶的所述身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料;推薦結果項提取單元,用於根據所述用戶的歷史接取資料以及所述多個其他用戶的歷史接取資料,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項,所述推薦結果項提取單元包括:接取頻率統計單元,用於根據所述用戶以及所述多個其他用戶的歷史接取資料,分別統計所述用戶以及所述多個其他用戶分別對所述搜尋結果項的接取頻率;頻繁項集合提取單元,用於根據所述接取頻率從所述搜尋結果項集合中提取所述身份資訊所對應的頻繁項集合,其中,當所述身份資訊包括多個身份等級時,所述頻繁項集合提取單元還包括:多個頻繁項集合提取單元,用於根據所述接取頻率分別從所述搜尋結果項集合中分別提取所述多個身份等級對應的頻繁項集合;頻繁項交集計算單元,用於將所述多個身份等級對應的頻繁項集合的交集作為所述身份資訊所對應的頻繁項集合;結果項提取單元,用於根據所述用戶的歷史接取資料以及所述頻繁項集合,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。
  6. 根據請求項5所述的裝置,所述頻繁項集合提取單元包括:總接取頻率統計單元,用於根據所述接取頻率分別統計所述搜尋結果項集合中搜尋結果項的總接取頻率;支持度計算單元,用於根據所述搜尋結果項的總接取頻率計算所述搜尋結果項的支持度值;總支持度計算單元,用於根據所述搜尋結果項的支持度值計算所述搜尋結果項集合的總支持度值;頻繁項集合提取子單元,用於將所述搜尋結果項集合中支持度值不小於所述總支持度值的搜尋結果項的集合作為所述身份資訊對應的頻繁項集合。
  7. 根據請求項5所述的裝置,所述推薦結果項提取單元包括:分詞提取單元,用於從所述搜尋詞中提取至少一個搜尋分詞;第一鄰近度值計算單元,用於分別計算所述至少一個搜尋分詞在所述搜尋結果項中多個搜尋區域的鄰近度值;第二鄰近度值計算單元,用於根據所述鄰近度值以及所述多個搜尋區域的權重值,分別計算所述搜尋詞對應於所述搜尋結果項的鄰近度值;結果項提取子單元,用於根據所述用戶的歷史接取資料、所述多個其他用戶的歷史接取資料以及所述搜尋詞對應於所述搜尋結果項的鄰近度值,從所述搜尋結果項集合 中提取出推薦給所述用戶的至少一個搜尋結果項。
  8. 根據請求項7所述的裝置,所述結果項提取子單元包括:權重值計算單元,用於根據所述用戶的歷史接取資料、所述多個其他用戶的歷史接取資料,分別計算所述用戶對應於所述搜尋結果項的個性化權重值;評分值計算單元,用於根據所述搜尋詞對應於所述搜尋結果項的鄰近度值以及所述用戶對應於所述搜尋結果項的個性化權重值,計算所述搜尋結果項的評分值;結果項推薦單元,用於將所述搜尋結果項集合中評分值大於預設臨限值的搜尋結果項推薦給所述用戶。
  9. 一種資料處理裝置,包括處理器以及用於儲存處理器可執行指令的記憶體,所述處理器執行所述指令時實現:獲取用戶的身份資訊、搜尋詞以及與所述搜尋詞相匹配的搜尋結果項集合,其中所述用戶的身份資訊是所述用戶在組織架構中的身份資訊,所述組織架構是包含內部區域網路的機構;獲取所述用戶對所述搜尋結果項集合的歷史接取資料,以及與所述用戶的所述身份資訊相匹配的多個其他用戶對所述搜尋結果項集合的歷史接取資料;根據所述用戶的歷史接取資料以及所述多個其他用戶的歷史接取資料,從所述搜尋結果項集合中提取出推薦給 所述用戶的至少一個搜尋結果項,其包括:根據所述用戶以及所述多個其他用戶的歷史接取資料,分別統計所述用戶以及所述多個其他用戶分別對所述搜尋結果項的接取頻率;根據所述接取頻率從所述搜尋結果項集合中提取所述身份資訊所對應的頻繁項集合,其中,當所述身份資訊包括多個身份等級時,還根據所述接取頻率分別從所述搜尋結果項集合中分別提取所述多個身份等級對應的頻繁項集合,並且將所述多個身份等級對應的頻繁項集合的交集作為所述身份資訊所對應的頻繁項集合;根據所述用戶的歷史接取資料以及所述頻繁項集合,從所述搜尋結果項集合中提取出推薦給所述用戶的至少一個搜尋結果項。
TW107128021A 2017-10-12 2018-08-10 資料處理方法及裝置 TWI710917B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
??201710946879.2 2017-10-12
CN201710946879.2 2017-10-12
CN201710946879.2A CN107908653A (zh) 2017-10-12 2017-10-12 一种数据处理方法及装置

Publications (2)

Publication Number Publication Date
TW201923629A TW201923629A (zh) 2019-06-16
TWI710917B true TWI710917B (zh) 2020-11-21

Family

ID=61840465

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107128021A TWI710917B (zh) 2017-10-12 2018-08-10 資料處理方法及裝置

Country Status (3)

Country Link
CN (1) CN107908653A (zh)
TW (1) TWI710917B (zh)
WO (1) WO2019072007A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908653A (zh) * 2017-10-12 2018-04-13 阿里巴巴集团控股有限公司 一种数据处理方法及装置
CN109255037B (zh) * 2018-08-31 2022-03-08 北京字节跳动网络技术有限公司 用于输出信息的方法和装置
CN109614507B (zh) * 2018-11-22 2020-08-04 浙江大学 一种基于频繁项挖掘的遥感图像推荐装置
CN109919193B (zh) * 2019-01-31 2023-05-12 中国科学院上海光学精密机械研究所 一种大数据的智能分级方法、系统及终端
CN110287881A (zh) * 2019-06-26 2019-09-27 上海交通大学 图书识别系统、图书识别方法、电子装置及储存介质
CN110717038B (zh) * 2019-09-17 2022-10-04 腾讯科技(深圳)有限公司 对象分类方法及装置
CN111026574B (zh) * 2019-11-25 2024-03-12 中盈优创资讯科技有限公司 诊断Elasticsearch集群问题的方法及装置
CN115002691B (zh) * 2021-03-01 2023-08-15 中国移动通信集团四川有限公司 消息发送方法、装置、设备和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930022A (zh) * 2012-10-31 2013-02-13 中国运载火箭技术研究院 面向用户的信息搜索引擎系统及方法
CN103425650A (zh) * 2012-05-15 2013-12-04 腾讯科技(深圳)有限公司 推荐搜索方法和系统
CN105912549A (zh) * 2015-12-15 2016-08-31 乐视网信息技术(北京)股份有限公司 一种内容推荐方法及其装置
CN106156103A (zh) * 2015-04-02 2016-11-23 广州爱九游信息技术有限公司 一种搜索处理方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3852750B2 (ja) * 2001-06-29 2006-12-06 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報検索システム、情報検索方法、コール・センタ・システムおよびサーバ
US7194460B2 (en) * 2003-03-31 2007-03-20 Kabushiki Kaisha Toshiba Search device, search system, and search method
CN101770474A (zh) * 2008-12-26 2010-07-07 新奥特硅谷视频技术有限责任公司 一种基于历史检索记录检索的方法和装置
US20110029403A1 (en) * 2009-07-29 2011-02-03 Ebay Inc. System and method for targeted merchandising to returning users
CN102567326B (zh) * 2010-12-14 2014-09-03 中国移动通信集团湖南有限公司 一种信息搜索、及信息搜索排序装置和方法
CN103942279B (zh) * 2014-04-01 2018-07-10 百度(中国)有限公司 搜索结果的展现方法和装置
CN104239458A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 搜索结果的展现方法和装置
CN104598511A (zh) * 2014-10-23 2015-05-06 腾讯科技(深圳)有限公司 搜索结果推荐方法、装置及系统
CN107908653A (zh) * 2017-10-12 2018-04-13 阿里巴巴集团控股有限公司 一种数据处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425650A (zh) * 2012-05-15 2013-12-04 腾讯科技(深圳)有限公司 推荐搜索方法和系统
CN102930022A (zh) * 2012-10-31 2013-02-13 中国运载火箭技术研究院 面向用户的信息搜索引擎系统及方法
CN106156103A (zh) * 2015-04-02 2016-11-23 广州爱九游信息技术有限公司 一种搜索处理方法及装置
CN105912549A (zh) * 2015-12-15 2016-08-31 乐视网信息技术(北京)股份有限公司 一种内容推荐方法及其装置

Also Published As

Publication number Publication date
CN107908653A (zh) 2018-04-13
TW201923629A (zh) 2019-06-16
WO2019072007A1 (zh) 2019-04-18

Similar Documents

Publication Publication Date Title
TWI710917B (zh) 資料處理方法及裝置
US10108741B2 (en) Automatic browser tab groupings
Zhu et al. Heterogeneous hypergraph embedding for document recommendation
US10025819B2 (en) Generating a query statement based on unstructured input
JP6293642B2 (ja) 推薦エンジンに基づく汎用グラフ、ルール及び空間構造
CN110162695A (zh) 一种信息推送的方法及设备
US20130060769A1 (en) System and method for identifying social media interactions
US10956469B2 (en) System and method for metadata correlation using natural language processing
US11361030B2 (en) Positive/negative facet identification in similar documents to search context
JP7252914B2 (ja) 検索提案を提供する方法、装置、機器及び媒体
Hossny et al. Feature selection methods for event detection in Twitter: a text mining approach
US20160132589A1 (en) Context based passage retreival and scoring in a question answering system
WO2015084757A1 (en) Systems and methods for processing data stored in a database
CN110019670A (zh) 一种文本检索方法及装置
CN108804550A (zh) 一种查询词拓展方法、装置以及电子设备
US10229186B1 (en) Data set discovery engine comprising relativistic retriever
Chen et al. A framework for annotating OpenStreetMap objects using geo-tagged tweets
US11074266B2 (en) Semantic concept discovery over event databases
CN110019665A (zh) 文本检索方法及装置
Calisir et al. The problem of data cleaning for knowledge extraction from social media
Shah et al. Bridging task expressions and search queries
Jurek et al. It pays to be certain: unsupervised record linkage via ambiguity minimization
US11500933B2 (en) Techniques to generate and store graph models from structured and unstructured data in a cloud-based graph database system
CN113515940B (zh) 一种用于文本搜索的方法及设备
Meng et al. Top-k approximate selection for typicality query results over spatio-textual data