TWI648642B - Data search processing method and system - Google Patents

Data search processing method and system Download PDF

Info

Publication number
TWI648642B
TWI648642B TW103118582A TW103118582A TWI648642B TW I648642 B TWI648642 B TW I648642B TW 103118582 A TW103118582 A TW 103118582A TW 103118582 A TW103118582 A TW 103118582A TW I648642 B TWI648642 B TW I648642B
Authority
TW
Taiwan
Prior art keywords
search
sorting
search object
score
preset mark
Prior art date
Application number
TW103118582A
Other languages
English (en)
Other versions
TW201537365A (zh
Inventor
沈晶晶
Original Assignee
阿里巴巴集團服務有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 阿里巴巴集團服務有限公司 filed Critical 阿里巴巴集團服務有限公司
Publication of TW201537365A publication Critical patent/TW201537365A/zh
Application granted granted Critical
Publication of TWI648642B publication Critical patent/TWI648642B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/908Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Library & Information Science (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申請案提供一種資料搜索處理方法和系統。其中,該方法包括:基於第一排序模型而獲得搜索結果中的各搜索物件的第一排序分,並將第一排序分劃分成多個區間;根據該第一排序分而將各搜索物件歸類到各個區間對應的搜索物件集合中;確定每個區間對應的搜索物件集合中具有預設標記的搜索物件;基於第二排序模型而獲得所述具有預設標記的搜索物件的第二排序分;利用該第二排序分來調整所述具有預設標記的搜索物件在其對應區間的搜索物件集合中的排序。由此,在確保搜索結果相關性的前提下提高了返回搜索結果展示的一致性和連續性效果,為用戶提供良好的一致性體驗,且簡化了演算法降低資料處理複雜度、提高效率和系統處理性能。

Description

資料搜索處理方法和系統
本申請案係有關資料搜索領域,尤其有關一種資料搜索處理方法和系統。
隨著互聯網技術的發展,越來越多的用戶透過網路訪問來進行資料搜索,並獲得回饋的搜索結果。根據搜索請求執行搜索並提供結果的伺服器端的資料搜索處理技術對實現用戶的搜索目的起了重要作用,比如,如何對搜索結果處理以得到最符合用戶需求的結果,如何處理搜索結果以提高伺服器的處理性能,使資料管理效率最佳化等。現有的搜索處理技術,根據用戶的搜索請求,由搜索引擎、關聯引擎而分別根據查詢詞(例如:關鍵字)找到,亦即,搜索引擎找到資料物件、擴展引擎找到基於資料物件的擴展資訊,然後,將資料物件和基於資料物件的擴展資訊進行處理調整後一併返回輸出,例如:將找到的基於資料物件的擴展資訊嵌入到找到的資料物件結果中,一併展示給輸入查詢詞的用戶。
常見的一種應用即為商品搜索引擎中,將收費廣告內 嵌到搜索結果內,具體地說,如圖1A所示。(1)用戶透過瀏覽器訪問商品搜索網站,輸入商品查詢詞,並按下搜索按鈕請求搜索。(2)瀏覽器訪問網站的應用伺服器。 (3)應用伺服器向廣告引擎請求針對這次搜索的廣告結果(基於商品的廣告創意結果),同時還向搜索引擎請求針對這次搜索的商品搜索結果;(i)其中,廣告引擎按照一定的邏輯返回廣告結果,比如:按照查詢詞來匹配廣告主購買的關鍵字,得到符合條件的廣告商品,然後按照廣告預期最大收益(類似考慮廣告出價、匹配度、創意品質等)來決定排序,取前m(top m)個廣告商品的廣告創意作為結果返回;(ii)其中,搜索引擎按照一定的邏輯返回搜索結果,比如:按照查詢詞來匹配商品的文本描述,得到符合條件的商品,然後按照相關性、商品品質等維度而計算出的商品與發出搜索請求的用戶的需求的匹配程度,以決定輸出的商品排序,取前n(top n)個商品作為結果返回。(4)應用伺服器取得廣告結果和搜索的商品結果,進行計算,比如從搜索的商品結果中濾除廣告結果中已經存在的對應商品(廣告商品);對計算後的結果進行合併,調整排序;對頁面進行渲染,返回結果到瀏覽器以展示給發出搜索請求的用戶。
由圖1A的過程,搜索結果返回輸出,以“商品交易平臺搜索”為例子,將收費廣告展現在搜索到的商品旁邊,如頭部、尾部、右邊欄等,作為搜索結果的一部分,如圖2所示的右邊欄。這裏,廣告部分獨立展示,可以由 瀏覽器直接訪問來自廣告引擎取得的廣告結果,直接展現在相應的廣告位置,能縮短頁面處理時間。另外,還可以由圖1B所示的搜索結果返回輸出方式,如圖3所示“競價排名”展示,收費廣告內嵌到搜索結果中,輸出搜索結果到網頁時,收費廣告還用一方形框來予以圈定。這裏,廣告結果和搜索結果混在一起,將得到的廣告結果以及得到的搜索結果做混排後(例如,利用混合排序伺服器),應用伺服器再將混排的結果傳到瀏覽器。
兩種搜索處理後的展示輸出方式,都是在一個頁面中展示搜索引擎的結果和廣告引擎的結果。但是,兩種方式都存在有一定的缺陷。
其一,由於最終展現的結果為兩個引擎的結果合併產生,而兩個引擎對應的商品集合不同,排序演算法不同,最終返回的結果展示出現不連續、不相關的不良效果,導致用戶的體驗不一致,尤其在混排廣告結果和搜索結果的時候更明顯,因此,由於兩個引擎採用的排序邏輯不一致,導致最終返回輸出的結果效果差、缺乏連續性和相關性,進而導致用戶體驗不一致的缺陷。
例如:商品總的集合為A、B、C、D、E、F,其中,參加廣告的商品集合為C、D、E,則搜索引擎的商品集合為商品全集A~F,廣告引擎的商品集合為廣告商品C~D。用戶發起的搜索存在的可能性有:搜索引擎返回結果A、C、F,廣告引擎返回結果C、E,混排後展示給用戶ACEF。由於ACF按照搜索引擎排序規則展示,E插入其中 後會迷惑用戶判斷。從廣告排序角度來看,即使E的文本描述和用戶查詢詞並無密切關聯,如果E出價很高仍會返回給用戶,此時,整體結果給用戶的體驗是相關性差、不連續、不一致。
其二,在現有技術中,應用伺服器需要請求兩個引擎,兩個引擎的目標不一致,各自考慮的排序條件就不一致,返回輸出最終結果需要對兩個引擎的目標結果進行合併、去重等操作,從而導致同樣物件的最終排序不一致,因而,導致增加了混排、去重等繁瑣的運算處理,加大電腦系統的複雜度、以及造成電腦系統處理效率低下。
因此,需要對現有技術的上述資料搜索處理的方案進行改進以提高效率、為用戶提供一致且良好的用戶體驗。
本申請案的主要目的在於提供一種資料搜索處理方法和系統,以解決在確保搜索結果相關性的前提下,提高返回搜索結果展示的一致性和連續性效果等技術問題,以便為用戶提供良好的一致性體驗;進一步地,減少了複雜的混排去重等演算法以解決降低資料處理複雜度、提高資料處理效率、提升資料搜索處理系統性能等技術問題。其中:
本申請案的一個態樣提供的一種資料搜索處理方法,包括:基於第一排序模型而獲得搜索結果中的各搜索物件的第一排序分;將該第一排序分劃分成多個區間,根據該 第一排序分而將各搜索物件歸類到各個區間對應的搜索物件集合中;確定每一個區間對應的搜索物件集合中具有預設標記的搜索物件;基於第二排序模型而獲得所述具有預設標記的搜索物件的第二排序分;利用該第二排序分來調整所述具有預設標記的搜索物件在其對應區間的搜索物件集合中的排序。
其中,基於第一排序模型而獲得搜索結果中的各搜索物件的第一排序分,包括:根據用戶輸入的關鍵字而獲得所述搜索結果,基於所述第一排序模型來計算搜索結果中每個搜索物件與關鍵字的相關性,以獲取的相關性值作為第一排序分。
其中,將該第一排序分劃分成多個區間,根據該第一排序分而將各搜索物件歸類到各個區間對應的搜索物件集合中,包括:設置一個或多個相關性閾值,將該第一排序分對應所述相關性閾值,劃分成多個區間;每個搜索物件依據其第一排序分所屬的區間,歸類到該所屬區間對應的搜索物件集合中。
其中,所述具有預設標記的搜索物件,包括:基於該搜索物件的擴展資訊以及與擴展資訊相關的記錄,所述預設標記用以標識該搜索物件包含所述擴展資訊;利用該第二排序分來調整所述具有預設標記的搜索物件在其所屬的、對應區間的搜索物件集合中的排序,包括:將完成排序調整的搜索結果返回給用戶,同時,將所述具有預設標記的搜索物件的擴展資訊返回給用戶。
其中,基於第二排序模型而獲得所述具有預設標記的搜索物件的第二排序分,包括:所述第二排序模型利用所述記錄,對所述具有預設標記的搜索物件計算第二排序分;利用該第二排序分來調整所述具有預設標記的搜索物件在其所屬的、對應區間的搜索物件集合中的排序,包括:在每個區間對應的搜索物件集合中,具有預設標記的搜索物件利用其第二排序分,確定其新的排序位置,以調整該搜索物件集合中所有的搜索物件的排序位置。
本申請案另一態樣提供一種資料搜索處理系統,包括:第一排序分模組,基於第一排序模型而獲得搜索結果中的各搜索物件的第一排序分;歸類模組,將該第一排序分劃分成多個區間,根據該第一排序分而將各搜索物件歸類到各個區間對應的搜索物件集合中;確定模組,確定每一個區間對應的搜索物件集合中具有預設標記的搜索物件;第二排序分模組,基於第二排序模型而獲得所述具有預設標記的搜索物件的第二排序分;排序調整模組,利用該第二排序分來調整所述具有預設標記的搜索物件在其所屬的、對應區間的搜索物件集合中的排序。
其中,第一排序分模組,包括:根據用戶輸入的關鍵字而獲得所述搜索結果,基於所述第一排序模型來計算搜索結果中每個搜索物件與關鍵字的相關性,以獲取的相關性值作為第一排序分。
其中,歸類模組,包括:設置一個或多個相關性閾值,將該第一排序分對應所述相關性閾值,劃分成多個區 間;每個搜索物件依據其第一排序分所屬的區間,歸類到該所屬區間對應的搜索物件集合中。
其中,所述具有預設標記的搜索物件,包括:基於該搜索物件的擴展資訊以及與擴展資訊相關的記錄,所述預設標記用以標識該搜索物件包含所述擴展資訊;排序調整模組,包括:將完成排序調整的搜索結果返回給用戶,同時,將所述具有預設標記的搜索物件的擴展資訊返回給用戶。
其中,第二排序分模組,包括:所述第二排序模型利用所述記錄,對所述具有預設標記的搜索物件計算第二排序分;排序調整模組,包括:在每個區間對應的搜索物件集合中,具有預設標記的搜索物件利用其第二排序分,確定其新的排序位置,以調整該搜索物件集合中所有的搜索物件的排序位置。
與現有技術相比,根據本申請案的技術方案,透過將基於資料物件的擴展資訊而直接由統一的搜索引擎來執行搜索一併返回,避免了用戶體驗的不一致,並且,能確保兼顧結果相關性以及具有擴展資訊的資料物件的優先展示權。而利用劃分區間方式對排序做小範圍調整,無需複雜演算法,實現簡單。進一步說,透過搜索引擎直接搜索而得出資料物件結果和基於資料物件的擴展資訊,採用一致的排序規則,既達到了資料處理的最佳化以及相應的資料處理系統的最佳化,還達到用戶體驗統一、有效地提升用戶體驗的目的。
800‧‧‧系統
810‧‧‧搜索模組
820‧‧‧排序模組
830‧‧‧輸出模組
此處所說明的附圖係用來提供對本申請案的進一步理解,且構成本申請案的一部分,本申請案的示意性實施例及其說明用以解釋本申請案,並不構成對本申請案的不當限定。在附圖中:
圖1A~1B是現有的資料搜索處理技術的應用示意圖;圖2和圖3是現有的資料搜索處理技術返回輸出搜索結果的展示效果示意圖;圖4是本申請案的資料搜索處理方法的一實施例的流程圖;圖5是本申請案的資料搜索處理方法的應用的一實施例的示意圖;圖6是本申請案資料搜索處理方法的一實施例中對搜索物件進行排序的一實施例的流程圖;圖7是本申請案資料搜索處理方法的一實施例的預設標記的一應用示意圖
圖8是本申請案的資料搜索處理系統的一實施例的結構方塊圖。
本申請案的主要思想在於,在搜索過程中匹配資料物件和用戶查詢詞,根據資料物件與用戶查詢詞的相關性而獲得排序分;設定若干相關性閾值以將排序分劃分成若干 區間,搜索到的資料物件(搜索物件)歸入對應的區間的搜索物件集合;然後,引入與基於資料物件的擴展資訊相關的各種記錄作為影響搜索物件的排序的因素,例如出價因素,利用影響因素,可以在每個搜索物件所屬的相關性閾值區間對應的搜索物件集合中,進行排序的調整。由兩次排序係統一於一次搜索處理過程中,既確保搜索結果相關性,又提高返回搜索結果展示的一致性和連續性效果,並且,減少了複雜的混排去重等演算法以解決降低資料處理複雜度、提高資料處理效率、提升資料搜索處理系統性能,簡化處理過程能有效提高系統處理效率和運算性能,還為用戶提供良好的一致性體驗。本申請案的應用,比如,商品搜索中,可以將廣告主基於商品的廣告創意放入商品的搜索引擎,在搜索環境中僅需要使用搜索引擎即可統一返回搜索結果和廣告結果,在搜索結果中直接商業化,還能在確保搜索結果相關性的前提下,提升廣告商品在搜索結果中的位置,進而有效對搜索引擎商業化。
為了使本申請案的目的、技術方案和優點更加清楚,下面將結合本申請案具體實施例及相應的附圖而對本申請案技術方案進行清楚、完整地描述。顯然,所描述的實施例僅是本申請案的一部分實施例,而不是全部的實施例。基於本申請案中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本申請案保護的範圍。
根據本申請案的實施例,提供了一種資料搜索處理方 法。
參考圖4,圖4是本申請案的資料搜索處理方法的實施例的流程圖400。
在步驟S410處,根據用戶輸入的關鍵字而獲得搜索結果。
如圖5所示本申請案的資料搜索處理方法的應用的一實施例的示意圖。
用戶透過瀏覽器來訪問搜索平臺,如商品搜索平臺。用戶可以在開啟的瀏覽器上輸入查詢詞並發出搜索請求,如輸入商品名稱並按下搜索按鈕。該瀏覽器訪問該搜索平臺的應用伺服器,該應用伺服器接收到該搜索請求。該應用伺服器向搜索引擎請求針對本次搜索請求執行搜索。搜索引擎利用查詢詞預處理後得到的關鍵字,執行搜索,以獲得搜索結果。
其中,搜索引擎在其全部資料物件的總的集合中,利用關鍵字而對各個資料物件的文本描述做匹配,比如,對關鍵字與資料物件的文本描述的相似度進行計算等檢索模型,找到與該關鍵字相關程度高(相關性)的文本描述,由此確定對應該文本描述的資料物件是被搜索到的結果。這些被搜索到的資料物件即為匹配關鍵字的資料物件,作為搜索結果中的各個搜索對象。這裏的相關性即為搜索相關性或檢索相關性。
其中,有的資料物件具有基於該資料物件的擴展資訊,對於這類具有擴展資訊的搜索物件,可以預設標記進 行標識,以便區別於不具有擴展資訊的搜索物件。進一步地,對應具有擴展資訊的資料物件儲存該擴展資訊。進一步地,還可以儲存有與具有擴展資訊的資料物件相關的各種記錄。
以商品搜索為例,用戶透過瀏覽器輸入關鍵字如商品名稱,並按下搜索按鈕,由該瀏覽器訪問到商品搜索平臺的應用伺服器,該商品名稱傳遞到應用伺服器。再由應用伺服器向搜索引擎請求執行本次商品搜索,如透過檢索模型(基於代數論的IR模型、基於概率統計的IR模型、基於集合論的IR模型、基於統計的機器學習模型等)的相似度計算,查找到所有與本次搜索的關鍵字,亦即,該商品名稱相匹配的商品描述,獲取對應這些商品描述的商品(資料物件)。其中,有的商品屬於廣告商品,亦即,該商品還對應有廣告創意(基於資料物件的擴展資訊)。這類廣告商品可以預設標記,與不具有廣告創意的商品進行區分。
例如,圖7所示本申請案之資料搜索處理方法的實施例的預設標記的應用示意圖。廣告主可以透過廣告系統來管理其廣告商品,廣告主針對其要做廣告的商品(亦即,廣告商品)編輯廣告創意,並進行出價。廣告商品和相應的出價會即時進入搜索離線處理系統,與原有的離線處理資料進行合併,比如,對搜索商品集合中的目前投放狀態正常的廣告商品做標記,同時記錄下對應的廣告創意和出價。搜索離線處理系統合併後的資料物件可以進入搜索引 擎的大集合中,提供給搜索引擎進行搜索服務。如果搜索引擎搜索到這些廣告商品,這些廣告商品都具有預設標記。
在步驟S420處,對獲得的搜索結果中的搜索對象進行排序。
具體地說,搜索引擎可以首先按照搜索排序邏輯而對搜索結果進行排序,然後,根據預先設定的相關性閾值而取滿足對應該閾值的條件的該搜索結果中的搜索物件,並且,針對搜索結果中的具有預設標記的搜索物件,根據其記錄來調整排序次序,將調整後的搜索結果返回(例如,返回給應用伺服器等)。
其中,相關性閾值的選擇需要確保不影響搜索相關性。比如,將搜索引擎搜索時的關鍵字與資料物件的文本描述的相關性和一系列其他因素的線性組合來確定搜索到的資料物件(搜索物件)的排序次序的數值(分值),亦即,排序分(例如1-100分,100分排在第一位),以該線性組合的分值情況來選擇相關性閾值。這樣,可以把分值在一定閾值內的搜索物件根據諸如帶有預設標記的各種情況等重新排序,從而既避免影響到原本的搜索體驗、又考慮了預設標記的搜索物件的實際需求。
例如:商品搜索引擎對結果排序,可以將搜索時計算的關鍵字與文本相關性和一系列商業數值(例如:過去30天的銷量,退貨率等)的線性組合來確定排序次序,則可以由此去選擇相關性閾值。
承前述商品搜索例,搜索引擎首先按照例如布林模型、向量空間模型、概率模型、語言模型或機器學習排序模型等,計算商品的文本描述與用戶查詢詞的相似度,亦即,透過相似度計算來確定相關性,假定能匹配得到商品A~I,並對商品A~I排序,得到序列為ABCDEFGHI,而每個商品都有一個排序分。然後預先設定相關性閾值為“20分”,取滿足排序分大於等於20分的此條件的前6個商品A~F放在相關性較高的分值區間,亦即,滿足相關性閾值的搜索結果為商品ABCDEF,而小於“20分”的商品G、H、I則劃入相關性較低的分值區間。進而,在大於等於20分的區間,針對搜索到的商品A~F中具有預設標記的標識目前投放狀態正常的廣告商品C、E、F,依據其出價記錄等,調整C、E、F的排序次序為E、C、F,然後將調整次序後的商品返回按次序輸出為EABCDF;同樣,在小於20分的區間,針對搜索到的商品G、H、I中具有預設標記的目前投放狀態正常的廣告商品H、I,依據其出價記錄等,調整排序次序為IGH。
在一個實施例中,參考圖6所示本申請案之資料搜索處理方法的一實施例中對搜索物件進行排序的一實施例的流程圖(步驟S420),介紹對獲得的搜索結果中的搜索物件進行排序以及排序調整的處理方式。
在步驟S610處,基於第一排序模型而獲得搜索結果中的各搜索物件的第一排序分。
其中,第一排序模型,是根據用戶查詢詞所劃分出的 關鍵字,在匹配文檔的過程中,經過檢索模型的相似度計算找到資料物件(亦即,搜索物件)。該相似度計算,亦即,找出關鍵字與資料物件的相關性、相關程度,亦即對相關性的計算。在一個實施方式中,可以依據相似度計算來獲得每個搜索物件的相關性的數值/分值作為排序分;在另一個實施方式中,可以依據相似度來計算而獲得的每個搜索物件的相關性和一系列其他因素的線性組合運算,以確定每個搜索物件的排序分。進而,根據排序分來確定每個搜索物件排序輸出的一種數學模型,或者說,是搜索資料物件以及對搜索結果(搜索到的所有資料物件)進行排序的一種搜索排序邏輯。
其中,透過該第一排序模型的排序運算而獲得搜索結果中的每個搜索物件的排序分,稱為第一排序分。第一排序模型,可以採用語言模型、概率模型、布林模型、機器訓練模型等,以計算出每個搜索物件的排序分。
承上述商品搜索例,為了簡單清楚起見,僅以相似度計算而得到相關性的數值/分值來做說明。商品搜索引擎會根據用戶的查詢詞(可以劃分為幾個關鍵字),利用檢索模型來進行搜索匹配,如利用布林模型、向量空間模型等將查詢詞與每個商品的文本描述來做相似度計算而得到被搜索到的商品A~I的排序分,亦即,基於第一排序模型而獲得搜索結果中的各商品的第一排序分。
在步驟S620處,將該第一排序分劃分成多個區間,根據該第一排序分而將各搜索物件歸類到各個區間對應的搜 索物件集合中。
將第一排序分劃分成多個區間,可以透過預先設置若干相關性閾值如“20分”、“10分”等來進行。例如,將第一排序分劃分成:區間一“大於等於20分”,區間二“大於等於10分且小於20分”,區間三“小於10分”三個區間。這樣,每個區間都預設有閾值,可以將每個搜索物件的第一排序分與該閾值比較,以確定該第一排序分是否落入該區間,一旦落入,則該第一排序分對應的搜索物件,就可以歸入該區間對應的搜索物件集合中。
承上述商品搜索例,商品A~I中,假定預設閾值“20分”,將第一排序分劃分成兩個區間,大於等於20分的第一區間和小於20分的第二區間。商品G、H、I的第一排序分依次為19、18、17,則歸入第二區間對應的商品集合II={G,H,I},其中,H、I是目前投放狀態正常的廣告商品;而商品ABCDEF的第一排序分依次從大到小且均大於20,則歸入第一區間對應的商品集合I={A,B,C,D,E,F},其中,C、E、F是目前投放狀態正常的廣告商品。
在步驟S630處,確定每一個區間對應的搜索物件集合中具有預設標記的搜索物件。
每一個區間對應的搜索物件集合中,都具有一個或多個搜索物件,其中,有的搜索物件還具有預設標記,透過預設標記,能標識該搜索物件(亦即,該資料物件)具有基於資料物件的擴展資訊,並且這些擴展資訊正常無誤即為正常狀態。
承上述商品搜索例,商品集合I={A,B,C,D,E,F}中,C、E、F是目前投放狀態正常的廣告商品,商品集合II={G,H,I}中,H、I是目前投放狀態正常的廣告商品。廣告商品所具有的預設標記,標識該商品具有基於商品的廣告創意並且投放狀態正常。為了清晰簡要地說明,下面將以商品集合I為例,可以透過預設標記在商品集合I中找出廣告商品C、E、F。
在步驟S640處,基於第二排序模型而獲得所述具有預設標記的搜索物件的第二排序分。
在一個實施例中,對於一個區間中的具有預設標記的搜索物件,基於第二排序模型而進行排序分計算。其中,第二排序模型也可以是一種排序邏輯,並且,第二排序模型可以根據實際需要來進行調整和設計,此處僅為舉例,本申請案不應被理解為僅限於此。
比如,每個具有預設標記的搜索物件,其包括擴展資訊(基於資料物件的擴展資訊)、相應的各種記錄等特徵資訊,可以利用各種記錄和擴展資訊來設計排序的規則或邏輯即為第二排序模型,並按照這樣的規則或邏輯而得到第二排序分,例如:確定由哪些特徵資訊的數值、或者哪些特徵資訊做運算後得到的數值來表示該搜索對象的排序先後,亦即,該數值作為第二排序分,該確定數值或計算數值的方式即為第二排序模型。
每個區間,都可以基於第二排序模型而獲得具有預設標記的搜索物件的第二排序分,該第二排序分即為該搜索 物件調整後的排序分。
承上述商品搜索例,以第一區間對應的商品集合I中廣告商品C、E、F採用按點擊付費(CPC)廣告模式來投放廣告創意並付費為例,以說明第二排序模型的第二排序分獲取(包括廣告主出價、排序分計算、廣告扣費等)。第二區間的商品集合II的調整類似。此處為了能清楚簡要地進行說明,僅以商品集合I和調整第一名的排序為例。
廣告主,亦即,提供廣告商品C、E、F的所有者。廣告主出價,亦即,廣告主針對廣告商品,可以對應在某個查詢詞/關鍵字下展現進行出價。該出價被記錄,亦即,步驟S410所述的對搜索商品集合中的目前投放狀態正常的廣告商品做標記,同時記錄下對應的廣告創意、針對關鍵字下展示的出價、收集的廣告商品的廣告品質得分等。如表1示出了廣告主對廣告商品的出價,表2示出了廣告商品的廣告品質得分。
其中,設計的排序邏輯,亦即排序公式為:預期收益(第二排序分)=出價*品質得分。另外還可以設計扣費邏輯,亦即扣費公式為:實際扣費=下一名出價*下一名品質得分/品質得分+0.01。則得到廣告商品C、E、F的第二排序分/預期收益依次為:1*60=60、1.5*50=75、0.8*30=24,則三者排序依次為2、1、3。廣告商品C、E、F實際扣費依次為:24/60+0.01=0.41、60/50+0.01=1.21、0.8(最後一位即按其出價扣費)。第二排序分和實際扣費計算出來如表3所示。
另外,可以採用其他方式進行廣告主出價、第二排序分計算(以便後續搜索引擎排序調整)、廣告扣費等,不影響本申請案的方案核心。例如:採用按每千人成本(CPM)廣告模式來投放廣告創意並付費,還可以直接用廣告主針對千次展現的競價來進行第二排序分計算,等等。
在步驟S650處,利用該第二排序分來調整所述具有預設標記的搜索物件在其所屬的、對應區間的搜索物件集合 中的排序。
在每個區間對應的搜索物件集合中,都可以根據需要,按照一定的規則,對其中的具有預設標記的搜索物件利用該第二排模型來獲得的第二排序分,以調整各自區間對應的搜索物件集合中具有預設標記的搜索物件的排序次序。
比如,某搜索物件的第二排序分即為其新的排序分,與其所屬的對應區間的搜索物件集合中其他搜索物件的排序分做大小比較,分值最大,以從大到小排列,將其調整到該集合的最前位置(第一位);比如,某搜索物件的第二排序分與其所屬的對應區間的搜索物件集合中,其他具有預設標記的搜索物件的第二排序分相比最大,以具有預設標記的搜索物件優先且僅調整第一位的規則,可以將其調整到該集合的最前位置,其他的搜索物件排序分大小從大到小排列;等等。
其中,對於最前位置(第一位)的調整如上述方式外,對於排序第二位、第三位、第四位等的調整,可以根據上述例子的方式類推完成。
承上述商品搜索例,對應第一區間的商品集合I中,商品A~F之前以ABCDEF方式來排序,由前述計算的第二排序分可知,廣告商品C、E、F中,商品E的第二排序分75最高,商品C為60分,商品F為24分最低。
一種情形是,若按照廣告商品優先而且僅調整第一位的規則,可以將商品E放在該商品集合I的第一位。則調 整後的對應第一區間的商品集合I中各個商品的排序為EABCDF。
另一種情形是,如果對廣告有點擊,希望收取所有廣告的費用,可以對於每個區間的商品集合比如第一區間的商品集合I中的所有廣告商品C、E、F,根據第二排序分都調整一遍。例1:若廣告商品絕對優先,可以按照前述第二排序分來調整最後排序為ECFABD。例2:若約定每個廣告商品保持原有第一排序分的次序即為CEF的次序,那麼結合第二排序分調整,例如規定最多向前移動十分之一並取整個位置,廣告商品E最多可以往前調7位(75/10並取整)、C最多往前調6位(60/10並取整)、F最多往前調2位(24/10並取整),根據原ABCDEF的排序按照C往前6位、E往前7位、F往前2位,調整為CEABFD。例3:若約定第一排序分和第二排序分疊加來調整最後排序分,假設商品ABCDEF第一排序分依次為:120、100、50、40、30、10,根據第二排序分的調整(相加),則最後排序分依次為:120、100、110、40、105、34,排序調整為:ACEBDF。
在步驟S430處,將完成排序的搜索結果返回給用戶。
具體地說,應用伺服器從搜索引擎取得完成排序的搜索結果,亦即,調整完成的排序的搜索結果,對瀏覽器頁面進行渲染,將搜索結果返回給瀏覽器。在瀏覽器上將以該排序規定的次序展示搜索結果中的各搜索對象。並且,對於具有預設標記的搜索物件,其還會隨搜索物件(資料 物件)同時返回基於該資料物件的擴展資訊。
承上述商品搜索例,對應第一區間的商品集合I中,應用伺服器從商品搜索引擎獲得搜索到的完成排序的商品結果,對瀏覽器頁面進行渲染,將商品結果返回給瀏覽器。在瀏覽器上對商品A~F,將以EABCDF的排序次序展示給用戶。同時,廣告商品E、C、F的廣告創意也隨廣告商品E、C、F返回展示給用戶。進一步,若用戶對商品E的廣告創意感興趣,點擊商品E則其廣告主按照表3所示扣費1.21元。
圖8示意性地示出了根據本申請案的資料搜索處理系統的一實施例的結構方塊圖。
根據本申請案的一個實施例,該系統800可以包括:搜索模組810,根據用戶輸入的關鍵字而獲得搜索結果,具體實現的功能可以參見步驟S410描述的處理;排序模組820,對獲得的搜索結果中的各個搜索物件進行排序,具體實現的功能可以參見步驟S420描述的處理;輸出模組830,將完成排序的搜索結果返回給用戶,具體實現的功能可以參見步驟S430描述的處理。
其中,排序模組820還包括:第一排序分模組(未示出),基於第一排序模型而獲得搜索結果中的各搜索物件的第一排序分,具體實現的功能可以參見步驟S610描述的處理;歸類模組(未示出),將該第一排序分劃分成多個區間,根據該第一排序分而將各搜索物件歸類到各個區間對應的搜索物件集合中,具體實現的功能可以參見步驟 S620描述的處理;確定模組(未示出),確定每一個區間對應的搜索物件集合中具有預設標記的搜索物件,具體實現的功能可以參見步驟S630描述的處理;第二排序分模組(未示出),基於第二排序模型而獲得所述具有預設標記的搜索物件的第二排序分,具體實現的功能可以參見步驟S640描述的處理;排序調整模組(未示出),利用該第二排序分來調整所述具有預設標記的搜索物件在其所屬的、對應區間的搜索物件集合中的排序,具體實現的功能可以參見步驟S650描述的處理。
由於本實施例的系統所實現的處理及功能基本相應於前述圖1~圖7所示的方法實施例,故本實施例的描述中未詳盡之處,可以參見前述實施例中的相關說明,在此不做贅述。
在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和記憶體。
記憶體可能包括電腦可讀取媒體中的非永久性記憶體,隨機存取記憶體(RAM)和/或非易失性記憶體等形式,如唯讀記憶體(ROM)或快閃記憶體(flash RAM)。記憶體是電腦可讀取媒體的示例。
電腦可讀取媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀取指令、資料結構、程式的模組或其他資料。電腦的儲存媒體的例子包括,但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記 憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可擦除可編程唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位影音光碟(DVD)或其他光學儲存、磁盒式磁帶,磁帶磁磁片儲存或其他磁性儲存設備或任何其他非傳輸媒體,可用來儲存可以被計算設備訪問的資訊。按照本文中的界定,電腦可讀取媒體不包括非暫態性電腦可讀取媒體(transitory media),如調變的資料信號和載波。
還需要說明的是,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個......”限定的要素,並不排除在包括所述要素的過程、方法、商品或者設備中還存在另外的相同要素。
本領域內的技術人員應明白,本申請案的實施例可提供為方法、系統、或電腦程式產品。因此,本申請案可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體態樣的實施例的形式。而且,本申請案可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存媒體(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。
以上所述僅為本申請案的實施例而已,並不用來限制本申請案,對於本領域的技術人員來說,本申請案可以有各種更改和變化。凡在本申請案的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本申請案的申請專利範圍的範疇之內。

Claims (10)

  1. 一種資料搜索處理方法,其特徵在於,包括:基於第一排序模型而獲得搜索結果中的各搜索物件的第一排序分;將該第一排序分劃分成多個區間,根據該第一排序分而將各搜索物件歸類到各個區間對應的搜索物件集合中;確定每一個區間對應的搜索物件集合中具有預設標記的搜索物件;基於第二排序模型而獲得該具有預設標記的搜索物件的第二排序分;以及利用該第二排序分來調整該具有預設標記的搜索物件在其對應區間的搜索物件集合中的排序。
  2. 如申請專利範圍第1項所述的方法,其中,基於第一排序模型而獲得搜索結果中的各搜索物件的第一排序分,包括:根據用戶輸入的關鍵字而獲得該搜索結果,基於該第一排序模型來計算搜索結果中每個搜索物件與關鍵字的相關性,以獲取的相關性值作為第一排序分。
  3. 如申請專利範圍第1或2項所述的方法,其中,將該第一排序分劃分成多個區間,根據該第一排序分而將各搜索物件歸類到各個區間對應的搜索物件集合中,包括:設置一個或多個相關性閾值,將該第一排序分對應該相關性閾值,劃分成多個區間;以及 每個搜索物件依據其第一排序分所屬的區間,歸類到該所屬區間對應的搜索物件集合中。
  4. 如申請專利範圍第1項所述的方法,其中,該具有預設標記的搜索物件,包括:基於該搜索物件的擴展資訊以及與擴展資訊相關的記錄,該預設標記用以標識該搜索物件包含該擴展資訊;以及利用該第二排序分來調整該具有預設標記的搜索物件在其所屬的、對應區間的搜索物件集合中的排序,包括:將完成排序調整的搜索結果返回給用戶,同時,將該具有預設標記的搜索物件的擴展資訊返回給用戶。
  5. 如申請專利範圍第4項所述的方法,其中,基於第二排序模型而獲得該具有預設標記的搜索物件的第二排序分,包括:該第二排序模型利用該記錄,對該具有預設標記的搜索物件計算第二排序分;利用該第二排序分來調整該具有預設標記的搜索物件在其所屬的、對應區間的搜索物件集合中的排序,包括:在每個區間對應的搜索物件集合中,具有預設標記的搜索物件利用其第二排序分,確定其新的排序位置,以調整該搜索物件集合中所有的搜索物件的排序位置。
  6. 一種資料搜索處理系統,其特徵在於,包括:第一排序分模組,基於第一排序模型而獲得搜索結果中的各搜索物件的第一排序分;歸類模組,將該第一排序分劃分成多個區間,根據該第一排序分而將各搜索物件歸類到各個區間對應的搜索物 件集合中;確定模組,確定每一個區間對應的搜索物件集合中具有預設標記的搜索物件;第二排序分模組,基於第二排序模型而獲得該具有預設標記的搜索物件的第二排序分;以及排序調整模組,利用該第二排序分來調整該具有預設標記的搜索物件在其所屬的、對應區間的搜索物件集合中的排序。
  7. 如申請專利範圍第6項所述的系統,其中,該第一排序分模組,包括:根據用戶輸入的關鍵字而獲得該搜索結果,基於該第一排序模型來計算搜索結果中每個搜索物件與關鍵字的相關性,以獲取的相關性值作為第一排序分。
  8. 如申請專利範圍第6或7項所述的系統,其中,該歸類模組,包括:設置一個或多個相關性閾值,將該第一排序分對應該相關性閾值,劃分成多個區間;以及每個搜索物件依據其第一排序分所屬的區間,歸類到該所屬區間對應的搜索物件集合中。
  9. 如申請專利範圍第6項所述的系統,其中,該具有預設標記的搜索物件,包括:基於該搜索物件的擴展資訊以及與擴展資訊相關的記錄,該預設標記用於標識該搜索物件包含該擴展資訊;以及該排序調整模組,包括:將完成排序調整的搜索結果 返回給用戶,同時,將該具有預設標記的搜索物件的擴展資訊返回給用戶。
  10. 如申請專利範圍第9項所述的系統,其中,該第二排序分模組,包括:該第二排序模型利用該記錄,對該具有預設標記的搜索物件計算第二排序分;以及該排序調整模組,包括:在每個區間對應的搜索物件集合中,具有預設標記的搜索物件利用其第二排序分,確定其新的排序位置,以調整該搜索物件集合中所有的搜索物件的排序位置。
TW103118582A 2014-03-28 2014-05-28 Data search processing method and system TWI648642B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
??201410123992.7 2014-03-28
CN201410123992.7A CN104951468A (zh) 2014-03-28 2014-03-28 数据搜索处理方法和系统

Publications (2)

Publication Number Publication Date
TW201537365A TW201537365A (zh) 2015-10-01
TWI648642B true TWI648642B (zh) 2019-01-21

Family

ID=54166131

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103118582A TWI648642B (zh) 2014-03-28 2014-05-28 Data search processing method and system

Country Status (6)

Country Link
US (1) US20150278341A1 (zh)
JP (1) JP2017509070A (zh)
CN (1) CN104951468A (zh)
HK (1) HK1211104A1 (zh)
TW (1) TWI648642B (zh)
WO (1) WO2015148393A1 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017223468A1 (en) * 2016-06-23 2017-12-28 Schneider Electric USA, Inc. Transactional-unstructured data driven sequential federated query method for distributed systems
US11201963B2 (en) * 2016-07-06 2021-12-14 Ehealth, Inc. Prioritization of electronic communications
CN106484766B (zh) * 2016-09-07 2019-10-22 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
JP6913596B2 (ja) * 2017-10-12 2021-08-04 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
CN109992764B (zh) * 2017-12-29 2022-12-16 阿里巴巴集团控股有限公司 一种文案生成方法及装置
CN108389576B (zh) * 2018-01-10 2020-09-01 苏州思必驰信息科技有限公司 压缩后的语音识别模型的优化方法及系统
CN110069524A (zh) * 2018-07-27 2019-07-30 北京奇虎科技有限公司 数据检索方法及装置
CN111210290A (zh) * 2018-11-21 2020-05-29 北京京东尚科信息技术有限公司 排序方法、装置和计算机可读存储介质
CN110119471B (zh) * 2019-04-03 2021-07-27 北京搜狗科技发展有限公司 一种搜索结果一致性的检查方法及装置
CN110473008B (zh) * 2019-07-31 2024-02-20 腾讯科技(深圳)有限公司 一种数据处理方法、装置、设备及存储介质
US20210035180A1 (en) * 2019-07-31 2021-02-04 Ebay Inc. Unified ranking engine for a search system
CN110647679A (zh) * 2019-09-04 2020-01-03 达疆网络科技(上海)有限公司 一种o2o场景下的搜索结果综合排序方法
JP7044821B2 (ja) 2020-03-17 2022-03-30 ヤフー株式会社 情報処理システム、および情報処理方法
JP7309669B2 (ja) * 2020-07-28 2023-07-18 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
CN111626682B (zh) * 2020-08-03 2020-12-11 南昌梦想软件有限公司 一种成本的核算方法、装置、计算机设备和存储介质
CN112364185B (zh) * 2020-11-23 2024-02-06 北京达佳互联信息技术有限公司 多媒体资源的特征确定方法、装置、电子设备和存储介质
CN113254810B (zh) * 2021-06-17 2021-10-29 浙江口碑网络技术有限公司 搜索结果输出方法、装置、计算机设备及可读存储介质
CN113343131B (zh) * 2021-06-30 2022-08-26 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置
CN113535824A (zh) * 2021-07-27 2021-10-22 杭州海康威视数字技术股份有限公司 数据搜索方法、装置、电子设备及存储介质
CN117435696A (zh) * 2023-12-21 2024-01-23 数据空间研究院 文本数据的检索方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7827170B1 (en) * 2007-03-13 2010-11-02 Google Inc. Systems and methods for demoting personalized search results based on personal information
US20110265189A1 (en) * 2006-03-01 2011-10-27 Oracle International Corporation Re-ranking search results from an enterprise system
US8090717B1 (en) * 2002-09-20 2012-01-03 Google Inc. Methods and apparatus for ranking documents

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7062485B1 (en) * 2000-09-01 2006-06-13 Huaichuan Hubert Jin Method and apparatus for score normalization for information retrieval applications
JP2004038370A (ja) * 2002-07-01 2004-02-05 Fan Communications Inc 広告情報検索システム、広告情報検索システム用管理サーバーシステム及び管理サーバーシステム用プログラム
US7716198B2 (en) * 2004-12-21 2010-05-11 Microsoft Corporation Ranking search results using feature extraction
US7809731B2 (en) * 2005-07-29 2010-10-05 Yahoo! Inc. System and method for reordering a result set copyright notice
GB2439348A (en) * 2006-06-23 2007-12-27 Mobile Dna Ltd Electronic classified advertising system
US8442972B2 (en) * 2006-10-11 2013-05-14 Collarity, Inc. Negative associations for search results ranking and refinement
JP5084673B2 (ja) * 2008-09-04 2012-11-28 ヤフー株式会社 商品情報検索装置、方法及びシステム
US8041715B2 (en) * 2009-03-24 2011-10-18 Yahoo! Inc. Sponsored search results re-ranking based on linking associations
JP5418295B2 (ja) * 2010-02-25 2014-02-19 日本電気株式会社 検索装置
JP5484222B2 (ja) * 2010-06-30 2014-05-07 キヤノン株式会社 画像形成装置
CN102779136A (zh) * 2011-05-13 2012-11-14 北京搜狗科技发展有限公司 一种信息搜索的方法和装置
US8706753B2 (en) * 2011-08-25 2014-04-22 Oracle International Corporation Search result ranking with search string certainty weighting
JP5834815B2 (ja) * 2011-11-22 2015-12-24 株式会社リコー 情報処理装置、プログラムおよび文書を検索するための方法
JP5919825B2 (ja) * 2012-01-05 2016-05-18 富士通株式会社 データ処理方法、分散処理システムおよびプログラム
US20130238437A1 (en) * 2012-03-12 2013-09-12 Microsoft Corporation Variable keyword bidding based on search results position
CN103324701B (zh) * 2013-06-13 2018-10-09 深圳中兴网信科技有限公司 数据搜索装置和数据搜索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8090717B1 (en) * 2002-09-20 2012-01-03 Google Inc. Methods and apparatus for ranking documents
US20110265189A1 (en) * 2006-03-01 2011-10-27 Oracle International Corporation Re-ranking search results from an enterprise system
US7827170B1 (en) * 2007-03-13 2010-11-02 Google Inc. Systems and methods for demoting personalized search results based on personal information

Also Published As

Publication number Publication date
US20150278341A1 (en) 2015-10-01
WO2015148393A1 (en) 2015-10-01
HK1211104A1 (zh) 2016-05-13
TW201537365A (zh) 2015-10-01
CN104951468A (zh) 2015-09-30
JP2017509070A (ja) 2017-03-30

Similar Documents

Publication Publication Date Title
TWI648642B (zh) Data search processing method and system
US11494457B1 (en) Selecting a template for a content item
US9633082B2 (en) Search result ranking method and system
US11023545B2 (en) Method and device for displaying recommended contents
JP5859606B2 (ja) オンライン商取引プラットフォームにおける広告ソースおよびキーワードセットの適合
TWI603273B (zh) Method and device for placing information search
WO2020147594A1 (zh) 获取实体间关系表达的方法、系统和设备、广告召回系统
US9805102B1 (en) Content item selection based on presentation context
CN104679771A (zh) 一种个性化数据搜索方法和装置
CN106504011A (zh) 一种业务对象的展示方法和装置
US9330071B1 (en) Tag merging
US20200034885A1 (en) Structured informational link annotations
WO2020043001A1 (zh) 广告投放方法、确定推广人群的方法、服务器和客户端
JP6767342B2 (ja) 検索装置、検索方法および検索プログラム
CN106445965A (zh) 信息推广处理方法及装置
US20140172587A1 (en) Dynamic floor prices in second-price auctions
US9053129B1 (en) Content item relevance based on presentation data
CN111738754A (zh) 对象推荐方法及装置、存储介质、计算机设备
TW201709124A (zh) 基於業務物件的資訊展示方法和裝置
WO2017157130A1 (zh) 推送增值业务信息的方法、装置及电子设备
US20140344114A1 (en) Methods and systems for segmenting queries
WO2017157159A1 (zh) 一种推送增值业务信息的方法、装置及电子设备
US20190026374A1 (en) Search method and apparatus
US10049386B1 (en) Adjusting content selection based on search results
US9600833B1 (en) Duplicate keyword selection