TWI482037B - 搜尋建議叢集與呈現 - Google Patents

搜尋建議叢集與呈現 Download PDF

Info

Publication number
TWI482037B
TWI482037B TW099145451A TW99145451A TWI482037B TW I482037 B TWI482037 B TW I482037B TW 099145451 A TW099145451 A TW 099145451A TW 99145451 A TW99145451 A TW 99145451A TW I482037 B TWI482037 B TW I482037B
Authority
TW
Taiwan
Prior art keywords
suggested
suggestion
search
clusters
query
Prior art date
Application number
TW099145451A
Other languages
English (en)
Other versions
TW201135492A (en
Inventor
Gilad Mishne
Alpa Jain
Original Assignee
Yahoo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Inc filed Critical Yahoo Inc
Publication of TW201135492A publication Critical patent/TW201135492A/zh
Application granted granted Critical
Publication of TWI482037B publication Critical patent/TWI482037B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Description

搜尋建議叢集與呈現
本發明一般來說與電腦實作之建議搜尋查詢的搜尋及呈現有關。
全球資訊網的使用者係熟悉於多種在網路上找出感興趣之事物時可利用的服務。搜尋引擎可由許多實體所提供,並在許多網站之中埋入搜尋功能。例如,許多網站提供搜尋應用程式,其讓使用者可以搜尋該網站以及遍及該網際網路的網站的內容。
搜尋引擎通常提供一種搜尋建議工具,其藉由預測使用者將輸入之下一文字與字元的方式,協助使用者更快的完成其查詢。例如,當一使用者開始輸入“sacr...”時,一般來說將在該搜尋框下方出現一下彈視窗,提供一般完整及相關的建議,像是“sacramento”、“sacramento airport”與“sacred heart”。接著該使用者從該清單中選擇以取代輸入完整的搜尋查詢。
本發明揭露用於將建議搜尋查詢(例如搜尋建議)叢集化與呈現的方法與裝置。根據一實施例,一文字片段係透過一使用者介面之一搜尋查詢部分所獲得,該文件片段係為一搜尋查詢的一部分。獲得一建議集合,該建議集合中的每一建議都係與該文件片段有關,或包含該文字片段之一建議搜尋查詢。產生二或多個建議群集,該二或多個建議群集的每一個都包含該建議集合的一相異次集合。提供該二或多個建議群集,使得該二或多個建議群集的每一個都被顯示在該使用者介面之一搜尋協助片段的一分離區隔之中。
根據一態樣,提供與該二或多個建議群集之每一個關聯之一標籤或影像,使得該標籤或影像是顯示在該使用者介面中,靠近該二或多個建議群集之對應群集的位置。該標籤或影像可以使用來自於該建議之對應群集之中的資訊而獲得。或者,除了從與該建議之對應群集之中所獲得的資訊以外,或取而代之,該標籤或影像也可以使用該建議之對應群集以外的資訊所獲得。
而根據另一態樣,如果根據已經被提交之搜尋查詢的部分,決定該搜尋查詢為一含糊查詢,便可將建議集合叢集化。例如,如果該建議集合的一初始叢集化導致在該建議群集在其大小實質上相異甚大,則該搜尋查詢可能是含糊的。
在另一實施例中,本發明與一種包含一處理器、記憶體及一顯示器的裝置有關。該處理器及記憶體係配置用以執行以上所述方法操作之一或多項。在另一實施例中,本發明與一種電腦可讀取儲存媒體有關,其上具有儲存之電腦程式指令,係配置以執行以上所述方法操作之一或多項。
本發明的這些與其他特徵及優點將於下述描述本發明原理之範例的說明書及隨附圖式中作更詳細呈現。
本發明將參酌特定實施例來詳述。這些實施例的範例會於隨附圖式做描述。雖然本發明將結合這些特定實施例來做描述,但應瞭解並非以這些實施例來對本發明加以限制。相反的,其目的是希望能涵蓋由所附申請專利範圍所定義並可以包含於本發明之精神及範疇內之各種改變、變形及具相等性的安排。在後續描述中,將說明許多特定細節以提供對本發明之通盤瞭解。本發明無需某些或全部的特定細節也可輕易實施。在其他的例子中,已熟知的程序操作將不詳細描述,以避免對本發明形成不必要的干擾。
本發明實施例提供一使用者介面,其用於提供搜尋建議,以回應接收一搜尋查詢的一部分。更特別地,每一搜尋建議都可以是與該搜尋查詢部分有關或包含(例如完全包含或修改之後)該搜尋查詢部分的一建議搜尋查詢。因此,用詞“建議”、“搜尋建議”、“建議搜尋查詢”、“查詢完成”、“建議搜尋查詢完成”以及“查詢完成建議”都可以交替使用。
提供給使用者的搜尋建議可以被組織成二或多個群集,其係參照為叢集或分區。叢集搜尋建議對於含糊查詢而言係特別有用,因為其具有多於一種的可能詮釋。更特別地,搜尋查詢可以根據已經被輸入之搜尋查詢部分的相異詮釋所組織。
當使用者輸入(例如新增、修改及/或刪除一或多個字元)時,所提供之搜尋建議將隨之改變。同樣的,搜尋建議的叢集也將隨著使用者所輸入的搜尋查詢而被動態執行。因此,建議群集數目、每一建議群集中的建議數目以及群集化建議的方法都將隨著使用者輸入的查詢部分而動態改變。換句話說,一使用者修改、新增及/或刪除該搜尋查詢之至少一部份將觸發該建議的叢集化,其將進一步描述如下。
近年來,網際網路對於眾多使用者而言已成為一主要資訊來源。這些使用者憑靠著網際網路搜尋感興趣之資訊。使用者搜尋資訊的一種傳統方法便是透過一搜尋服務網頁開始一搜尋查詢。一般來說,使用者可以在搜尋網頁上之一輸入框中,輸入包含一或多個搜尋項目的一查詢,並接著根據所輸入的搜尋項目開始一搜尋。為了回應該查詢,一般來說,一網頁搜尋引擎會回傳搜尋結果文件之一排序清單。
文件可以被定義為一全球資源定位器(URL),其識別該文件所處之位址。該文件可以位在一特定網站,也可以位在該網站之一特定網頁。例如,一第一全球資源定位器可以識別一文件所處之一網頁位址,同時一第二全球資源定位器可以識別該文件可以被放置之一網站位址。
第一圖描述可實作本發明之多種實施例的一示範網路區段。如圖所示,複數個客戶端102a、102b、102c可以存取一搜尋應用程式,例如透過網路104存取位於搜尋伺服器106上的搜尋應用程式,及/或存取一網頁服務,例如,透過一圖形使用者介面存取網頁伺服器114上的網頁服務,其將進一步詳細描述如下。該網路可以採用任何適用的形式,像是廣域網路或網際網路及/或一或多個區域網路。該網路104可以包含任何適用的數量及形式之裝置,例如路由器及交換器,用以從每一客戶端傳送搜尋或網頁物件請求至該搜尋或網頁應用程式,並將搜尋或網頁結果傳回至該請求客戶端。
本發明也可在多種網路環境(由網路104所表示)中實作,例如包含以TCP/IP為基礎的網路、電信網路、無線網路等等。此外,利用本發明之實施例所實作之電腦程式指令可以被儲存在任何類型的電腦可讀取媒體之中,並可以根據多種電腦模型所執行,上述電腦模型包含在一單獨之計算裝置的一客戶端/伺服器模型、一點對點模型,或是根據一種分散式計算模型,其可以在不同位置處執行或實行此處所描述的多種功能。
一般而言,搜尋應用程式係使一使用者(人或自動化實體)搜尋經網路104存取之資訊以及與包含一或多個搜尋項目之一搜尋查詢有關之資訊。該搜尋項目可以由一使用者以任何方式輸入。例如,像是在以下進一步詳細描述之一圖形使用者介面可以對客戶端(例如在該客戶端裝置上)呈現一輸入特徵,所以該客戶端可以輸入包含一或多個搜尋項目的查詢。在一特定實作中,該圖形使用者介面呈現一輸入框(例如,搜尋查詢區),使用者可以在該輸入框中輸入包含任意數目之搜尋項目或其部分的一查詢。具體來說,圖形使用者介面可以提供一搜尋查詢區,以接收一搜尋查詢之至少一部份,還有與該搜尋查詢有關之建議搜尋查詢(例如,搜尋建議)的其他部分也將被提供。接著使用者可以選擇該建議搜尋查詢之一,並透過該圖形使用者介面提交至一搜尋引擎。
接著可透過一或多個搜尋應用程式(例如與該搜尋伺服器106及/或網頁伺服器114關聯)及/或一或多個資料來源來執行該搜尋查詢。本發明之實施例可以針對任意搜尋應用程式實作。雖然為了簡潔起見只描述一單一搜尋伺服器106,但該搜尋應用程式可以執行在任意數目的伺服器上。
搜尋伺服器106(一或多個)可以存取一或多個查詢記錄110,其中保留有搜尋資訊。例如,該查詢記錄110可被保留在與該搜尋伺服器106耦接之一或多個記憶體之中。每次當使用者執行一或多個搜尋項目的搜尋動作時,與這種搜尋有關的資訊將被保留於該查詢記錄110中。例如,該使用者的搜尋請求可以包含任意數量的參數,像是使用者或瀏覽器識別符以及該些搜尋項目,這些都可被保留在該查詢記錄110中。與該搜尋有關的其他資訊,像是一時間標記也可以與該搜尋請求參數一起被保留在該查詢記錄110中。當根據所輸入的搜尋項目呈現結果給該使用者時,來自這種查詢結果的參數也可以被保留在該查詢記錄110中。例如,該特定查詢結果,像是網站、所呈現之搜尋結果的次序、每一搜尋結果是一種依贊助或依演算法的搜尋結果、每一搜尋結果的擁有者(例如網站)、每一搜尋結果是否都由該使用者(若有的話)所選擇(例如點擊)及/或一時間標記都可以被保留在該查詢記錄110中。
一旦接收一搜尋查詢,該搜尋伺服器106則可以識別並呈現與該查詢有關之適當網頁。例如,該搜尋伺服器106可以識別並呈現複數個超文字鏈結,其識別與該搜尋查詢有關的內容,同時呈現與該些超文字鏈結關聯的一總結或摘要。
在此所揭露之實施例可以透過該搜尋伺服器106(或其他伺服器)及/或該客戶端102a、102b、102c所實作。例如,透過該客戶端102a、102b、102c上之一網頁瀏覽器及/或應用程式可以實作許多特徵。本發明實施例可以透過軟體及/或硬體實作。
搜尋引擎係使用越來越多的搜尋方式,以減少使用者在執行搜尋相關工作的付出。這種努力形成目前廣泛使用的自動完成機制,其在使用者構成其查詢時自動建議可能的完整搜尋查詢。然而,傳統的自動完成機制可能提供使該使用者困擾的搜尋建議,特別是當完成的集合係以一種穿插方式顯示的相異詮釋之查詢所構成時。
第二A圖為描述一示範圖形使用者介面的圖式,其描述透過一傳統自動完成機制所提供的建議搜尋查詢。考慮一使用者係在與一搜尋引擎關聯之圖形使用者介面的搜尋查詢區202中輸入該字元序列haifa而開始一搜尋引擎查詢的情況。當該使用者在該圖形使用者介面的搜尋查詢區202中輸入時,該使用者的輸入可被視為一搜尋查詢的一部分。該搜尋查詢部分可以包含一或多個字元,以及一或多個文字或其部分。在此範例中,該搜尋查詢的部分係被視為一搜尋查詢字首。對於此搜尋查詢字首而言,由一主要搜尋引擎所呈現之建議集合可以包含排序清單,如在204處所顯示。
像是根據過去使用者行為的點擊行為、查詢頻率或是查詢構成等等的多種行為,可以決定由一搜尋引擎所提供之建議的完整搜尋查詢(也就是搜尋建議)集合。本發明實施例可以利用組織依主題自動完成之建議的方式,擴大目前的完整查詢方式。
如在第二A圖中所描述,該完整搜尋建議可以對應於非唯一之真實世界實體、面向或主題。例如,在位置1、2及5處的建議對應為一流行表演者,然而在位置3及6處的建議對應至一城市。此外,與類似或相同的面向或主題關聯之查詢建議可能不被群集在一起,而因此從一主題態樣而言,可能時常將建議呈現成為非排序的清單。
如在第二A圖中所示,當一搜尋查詢(或其部分)具有不同的可能意義時,該建議可能與已經被提供之該搜尋查詢部分的各種詮釋有關。此外,這些建議一般來說僅以普及性排序,使得對應於不同詮釋的建議係以一種穿插的形式所提供。本發明實施例將建議搜尋查詢加以群集化,使得使用者可以簡單地識別包含最相關搜尋建議的搜尋查詢群集。
第二B圖與第二C圖為描述示範圖形使用者介面的螢幕畫面,其可以根據多種實施例加以呈現。如在第二B至第二C圖中所示,本發明實施例可以透過一圖形使用者介面將一建議查詢集合叢集化並呈現。此外,每一叢集皆可以分別由該圖形使用者介面之中的一標籤或影像所識別,如在第二B圖及第二C圖中所示。
如在第二B圖及第二C圖中所示,當一使用者在一圖形使用者介面之一搜尋查詢區202中輸入搜尋查詢部分“Haifa”時,便可以獲得包含該搜尋查詢部分的一建議集合(例如,透過一或多個搜尋查詢記錄)。可以利用基於真實世界實體、面向、主題或其他條件的一或多種叢集化方法,將該建議集合叢集化為二或多個建議群集。例如,每一建議群集都可以被呈現在該圖形使用者介面的一分離區隔或片段之中。
此外,用於識別每一建議群集之一適用標籤或影像也可由關聯於該建議群集所確認跟提供,以協助該使用者在不同對應建議群集之間進行分辨。如在第二B圖及第二C圖中所示,可以顯示關聯於該二或多個建議群集的每一個之一標籤或影像,使可提供與該對應群集相關之該標籤或影像。例如,該標籤或影像可以被顯示在該使用者介面中,極靠近該二或多個建議群集之對應群集的附近。
如在第二B圖中所示,可以顯示與每一建議群集或圖形使用者介面的對應區隔有關之一不同的標籤。例如,在區隔206中顯示的一第一建議群集可以被指定為208處所顯示之一標籤“Haifa(Singer)”,而在區隔210中顯示的一第二建議群集可以被指定為212處所顯示之一標籤“Haifa(City)”。
同樣的,如在第二C圖中所示,可以顯示與每一建議群集或圖形使用者介面的對應區隔有關之一不同的影像。例如,在區隔214中顯示的一第一建議群集可以利用216處所顯示之一影像加以識別,而在區隔218中顯示的一第二建議群集可以利用220處所顯示之一影像加以識別。
當一使用者選擇該些建議群集的其中之一中的建議之一時,便能獲得並提供與所選建議相關的搜尋結果。在此方法中,本發明實施例便可以促進使用者的搜尋處理(search process)。
第三圖為一程序流程圖,其描述根據多種實施例執行搜尋建議叢集化的一示範方法。在302處,可以透過一使用者介面的搜尋查詢部分獲得一文字片段,其中該文字片段為一搜尋查詢的部分。更具體的,該搜尋查詢之該部分可以為該搜尋查詢的一第一部份,其可以被稱做為該搜尋查詢的“字首”或“查詢字首”。例如,該查詢字首可以是由一使用者在構成一搜尋查詢時所輸入的一字元序列。或者,該搜尋查詢之該部分可以位於該預計搜尋查詢的中間或尾部,其也可以被分別稱為“插入詞”或“字尾”。
在304處可以獲得一建議集合,其中該建議集合的每一建議都為包含該文字片段的一建議搜尋查詢。該建議集合可以透過對一搜尋查詢資料庫搜尋包含該使用者輸入文字(例如查詢字首)之查詢的方式所獲得。該搜尋查詢資料庫可以與該使用者關聯,或可以為複數個使用者儲存資料的一總體資料庫。一般來說,根據該對應搜尋查詢的普及性將建議加以排序。
在一實施例中,可以從該建議集合決定該搜尋查詢是否為一含糊查詢(ambiguous query)。如果該搜尋查詢的前輸入部分存在多於一個的可能詮釋,該搜尋查詢便可以被決定為含糊搜尋。例如,根據該建議集合進行初次叢集化之後每一建議群集之中的建議數目,可以決定該查詢是否為含糊查詢。更具體地說,如果該查詢係位於二或多個群集之中,則該查詢便被決定為含糊查詢。然而,如果在一群集之中所存在的建議數量相對於另一群集為極少,便可以指示該查詢並不含糊。如果該搜尋查詢為一含糊查詢,便可將該建議集合叢集化,如以下參考步驟306及308所描述。
在306處可以產生二或多個建議群集,其中該二或多個建議群集的每一個都包含該建議集合的相異子集合。更特別地,可以獲得與該建議集合中每一建議關聯之一或多個特徵集合。接著應用與該建議集合中每一建議所關聯之一或多個特徵集合,以產生該二或多個建議群集。該特徵可以從該建議及/或是當使用該建議執行一搜尋查詢時所獲得之搜尋結果的至少一部份所獲得。例如,一特定建議的特徵可以包含在該建議的一或多個文字集合及/或在該搜尋結果中的一或多個文字集合。在代表一特定建議之搜尋結果中的文字可以包含在一標題、摘要及/或一或多個文件之全球資源定位器(URL)中所發現的文字。一特定建議的特徵也可以包含與該建議關聯的點擊資料。以下將進一步描述用於獲得並應用多種特徵的多種機制。
於產生該建議群集之後,可能會想要將該建議群集再群集化。例如,如果在一特定建議群集中的建議數目實質上小於其他建議群集中的建議數目時,便可能想要進行再群集化。
可能想要決定是否要呈現該二或多個建議群集。例如,可以決定該查詢是否清楚。如果決定該查詢係清楚的,便可以不提供(例如顯示)該二或多個建議群集。
當該查詢為含糊不清時,可以在308提供該二或多個建議群集,使得該二或多個建議群集的每一個都可以在該使用者介面之一搜尋協助片段的分離區隔中顯示。例如,該區隔可以在該使用者介面的搜尋協助片段中連續呈現。以下將進一步詳細描述將該搜尋協助片段之中的建議群集進行排序的各種方法。
在一特定建議群集之中的建議也可以根據多種方法加以排序。例如,一特定建議群集之中的建議可以依照該建議做為一搜尋查詢的執行或選擇普及性加以顯示。可以利用代表該使用者輸入目前搜尋查詢的查詢記錄資料確定做為一搜尋查詢之一特定建議的普及性。或者,做為一搜尋查詢之一特定建議的普及性可以使用代表複數個使用者之查詢記錄資料所確定。
此外,可以提供識別該二或多個建議群集之每一群集的一標籤或影像,使得該標籤或影像便與該對應建議群集關聯顯示。例如,可以顯示與該搜尋協助片段之對應區隔關聯的該標籤或影像。更特別地,可以在該使用者介面之搜尋協助片段的對應片段中,提供與該二或多個建議群集之每一群集關聯的該標籤或影像。以下將進一步詳細描述用於識別或產生代表一特定建議群集之待呈現標籤或影像的多種方法。
1.叢集化建議
在實作中,要生成二個以上的建議群集並使得該建議集合被分配在該些建議群集中是一種數學上的問題。
問題:給定一查詢部分(例如字首p)與一建議集合(例如排序建議集合),S={s1,s2,...,sn},吾人可以將S劃分為k個不連續區隔(例如,排序區隔),P={P1,P2,...,Pk},因此每一si都剛好屬於一個Pj,而每一Pj的數目則為主題相關(換言之,指為查詢q之一單一主題或態樣)。在劃分S之後,吾人可以指定一相區別的標籤L(及/或影像I)給每一區隔,因此L(Pj)或I(Pj)便對一使用者指示或描述由該區隔P(j)成員但不由S中的其他成分所共享的主題或態樣。更具體地說,吾人可以識別由一區隔P(j)成員所共享的一主題或態樣,並接著獲得代表該已識別主題或態樣的一標籤或影像。吾人也可以將該區隔P(j)及/或該區隔P(j)每一個之中的建議排序,使能最大化該集合S的功能給該使用者。
可以應用多種的叢集化機制,以根據一查詢的一部分(例如查詢字首)將一建議集合劃分為二個以上的建議群集。以下將描述三種不同的叢集化機制。在下文描述中,假設由該建議集合中之建議所共享的該查詢部分為一查詢字首。然而,重要的是,要注意該共享的查詢部分可以出現在該查詢中的其他位置。
叢集化工作可以被簡化為尋找被叢集化之成員(例如建議)的任意兩成員之間相似度(或距離)的工作。以下描述的三個示範叢集化機制提供了估計相似度的不同方法,該些方法係為了一查詢部分所提供的一建議集合中,估計兩建議之間相似度的方法。
1.1 首字叢集化
當使用者輸入一搜尋查詢,則完成所提供的許多建議,其將該使用者輸入視為一字首。有時候,該使用者輸入會被視做為一種字尾或中間詞。因此,該集合S在語詞階段可能已經非常接近。一般來說,建議si可以被視為si=p∪ci,其中p為該使用者提供的查詢字首,而ci為在該特定建議si中所增添的額外文字(例如一或多個字元)。當已經由該使用者所輸入的查詢部分係為一查詢字首時,該增添文字ci可為在該查詢字首後方出現的一或多個字元。或者,該增添文字ci可以包含在該查詢部分之前所出現的一或多個字元,及/或在該查詢部分之後所出現的一或多個字元。在該已經被輸入之查詢部分之前及/或之後的字元可以包含該查詢之一或多個文字或其部分。
第四圖為描述當一使用者輸入“salsa”至一使用者介面的搜尋查詢區時,提供至一使用者之示範建議的圖式。如在此範例中所示,該建議已經共享一字首p。對於識別該建議si所屬之叢集有用的用詞,係最可能出現在該建議si的增添文字ci之中。
在一實施例中,我們可以從每一建議si中選擇一單一項目,其中該單一項目為最具代表性項目,也就是說,該項目最能將該建議si從該建議的其他部分區隔出來。接著可以使用這些項目對S執行叢集化。在第四圖顯示的範例中,該區別項目為“recipes”、“dancing”、“dance”、“music”、“singer”、“homemade”、“lessons”以及“classes”。這些項目的每一個都可以被指做為該對應建議si之“首字”。
在建議集合S中的每一建議si都可以透過分析獲得一或多個文字集合。接著可以為了每一建議si識別在該一或多個文字集中的一“首字”(例如代表性文字)。因此,與該建議集合中每一建議所關聯的特徵集合便可以包含代表該建議之首字。
可以應用多種估計語意或主題文字階段相似性的方法,以確定在建議之首字之間的相似度,並藉此確定在該建議si之間的相似度。一般使用的方法包含那些根據一大型語料庫或語彙資源的文字脈絡方法,像是Wordnet。例如,使用資訊檢索(Information Retrieval,IR)技術的點式交互資訊(Pointwise Mutual Information,PMI)。PMI-IR是一種簡單的共現技術,其可以用來確認兩文字{wi,wj}之間的相似度。該兩文字{wi,wj}之間的相似度可以定義為該兩文字之間的點式交互資訊,其中單一文字的機率P(wi)以及聯合機率P(wi,wj)係利用一語料庫中的最大出現可能性所估計。更具體地,在此情況中該些文字之間的相似度估量可以定義為
其中,counts(x)為包含x的文件集合,而n為該語料庫大小(例如,搜尋結果的數量)。兩建議之間的相似度便可為該首字之間的相似度。
首字選擇
由於網頁查詢的平均長度短,該增添文字ci通常包含一單一用詞。因此,該單一用詞可以作為該建議si之首字。然而,還存在該增添文字ci包含二或多個文字的情況。因此,便可以藉由選擇一特定建議si之首字的多種方法而從這些文字中選出首字。以下描述多種示範方法。
第一字: 選擇在該增添文字ci中的最左側文字。例如,當一建議為“salsa singer cruz”時,該增添文字為“singer cruz”,而該第一字為“singer”。
最後字: 選擇在該增添文字ci中的最右側文字(例如,在該建議“salsa singer cruz”中的cruz)。
頻率: 為了在該增添文字ci中的每一文字,計算該詞頻(tf)與逆向文件頻率(idf)的乘積tf‧idf,其中能夠用來計算tf之“文件”可能包含被叢集化之該建議集合S之中的所有文字,而idf係對該使用者輸入之所有建議集合S所計算:
一特定建議si之首字可以由選擇具有最高tf‧idf數值的文字所選出。
1.2 結果集合叢集化
為了確認兩查詢建議之間的相似度,可以運用與該查詢建議之每一建議關聯的搜尋結果。每一建議查詢都可以利用該對應查詢建議之最優選N個的搜尋結果(例如文件)中所找出之用詞的對應tf‧idf數值所表示。因此,與該建議集合中每一建議所關聯的特徵集合,都可以包含或是根據該對應搜尋結果集合中的文字集合。
給定一查詢建議si,吾人可以得到由一搜尋引擎所回傳的該建議si之最優選N個文件的搜尋結果集合R(si)。每一個文件dR(si)都包含一標題、一摘要與一全球資源定位器(URL)。摘要可以是該文件d的一部分,其對該使用者顯示,並包含在該查詢中的用詞以及該用詞附近的一小部分上下文。因此,可以確定在最優選N個搜尋結果之每一個結果中,在標題t(d)、摘要a(d)及/或URL u(d)中一或多個文字的tf‧idf數值。
在一實施例中,每一文件組成(標題、摘要及/或URL)都可以利用於其中所出現之用詞的tf‧idf向量所表示,也就是說,每一位置都儲存一文字之tf‧idf數值的向量。可以為了該最優選N個文件的每一個確定該文件組成的向量。該結果集合R(s)的文件組成向量可以藉由獲得該組成向量之每一個對一特定建議si之所有文件的重心(例如平均向量)所得到。例如,該結果集合R(si)之一向量title(si),可以藉由獲得定義該結果集合R(si)之該最優選N個文件標題的向量重心title(d)所得到。一特定建議si之單一向量vs,可以藉由連接對應該建議si之結果集合R(si)的向量title(d)、abstract(d)、及或url(d)的方式獲得。此程序可以針對每一建議si加以執行。可以應用相似度函數(像是一餘弦相似度函數)確定兩相異重心向量vs之間的相似度,因此兩對應建議si之間的相似度便為其向量內積:
Sim(si ,sj )=vsi ‧vsj
1.3 點擊式叢集化
可以運用由一搜尋引擎所保存的點擊資料,以將該建議集合S劃分為二或多個群集。該點擊資料可以包含有關URLs的資訊,該URLs係來自一或多個使用者曾經點擊過之搜尋結果的URLs。例如,一搜尋記錄可以包含多個使用者對於一特定查詢建議“pineapple salsa”之三個相異點擊的URLs:
URL1:www.allrecipes.com/pineapple-salsa/detail.aspx
URL2:www.cooks.com/rec/pineapple_salsa.html
URL3:www.blogchef.net/pineapple-salsa-recipe/
利用一特定查詢建議si的點擊資料,吾人可以利用與該建議相關之點擊URLs集合,將一搜尋查詢的一部分(例如查詢字首)的每一建議加以特徵化。具有相似使用者點擊行為的建議可以被分在相同群集之中。具體來說,產生一或多個相同URLs之點擊的不同查詢,可以捕捉到相似的使用者意圖。例如,查詢建議“pineapple salsa for fish”可能產生上述URLs的其中之一的點擊,其便指出該兩建議是相似的。
由於網站具有一網頁一概念的傾向,因此利用點擊URLs可能導致被證實為太過受限的特定表現。因此吾人可以使用來自於該點擊資料的基本URLs,而非使用特定的點擊URLs。例如,URL1可能係來自於www.allrecipes.com 。因此,可以使用與一網站關聯之URL,而不是與一特定網頁關聯之URL。
此外,像是www.wikipedia.org 的新聞式或百科式網站可能會引入不想要的偏差,並造成在相同叢集中置入不相似的概念。同樣的,其他像是www.youtube.com 的網站也可能引入這種偏差。為了解決此問題,吾人將每一建議視為一文件,並對於每一基本URL計算一逆向文件頻率,並在產生一表徵時以此做為權重,將進一步描述如下。或者,吾人可以根據其逆向文件頻率去除一或多個URLs。具體來說,該逆向文件頻率可以代表該建議出現在一查詢記錄中的頻率倒數。
查詢建議可以利用點擊資料表示。具體來說,給定一字首p以及與其關聯之建議集合S,吾人可以定義p的一點擊圖形。點擊圖形可以被定義為一種雙向圖形,其包含兩種節點分類:建議節點(s個節點)與基本URL節點(u個節點),以及一定向邊集合E(set of directed edges E)。在該建議集合S中的每一建議都可以由一個s節點來表示。為了產生該u個節點,吾人可以採用與每一建議關聯之基本URLs集合的聯集,並對每一明顯區別的基本URL產生一個節點。在一建議節點s與一URL節點u之間的一邊s->u,指出當s被視為一查詢時點擊該URL u的情況。每一邊都可以被指定一權重,其為當s被視為一查詢時點擊該URL u的次數。
吾人可以利用該點擊圖形對該圖形中的每一建議s產生大小與該圖形中URL節點數量相等的一L2正規化特徵向量,其中該向量中的每一維度都代表該圖形中的一URL。與一URL j關聯之維度的數值可以計算為:
,如果在建議s與j之間存在一邊(an edge);0,否則其中U為該點擊圖形中的URLs集合,而wsj 為與該點擊圖形中邊s->j關聯的權重。為了計算一字首p於兩建議之間的相似度,吾人可以使用一種相似度函數(例如餘弦相似度函數)以產生一相似度度量(similarity metric),如下所示:
1.4 叢集化演算法
一旦在給定一查詢字首下的S中,任意建議對之間的相似度都已經利用上述三種方法的其中之一所界定,便可將其做為用作叢集化的相似度度量。接著可以使用利用該對應相似度度量的一叢集化演算法以將該些建議群集化,使得相似的建議便被群集在一起。具體來說,一旦兩相異建議之間的相似度已被估算出來,便可以利用一種非監督式叢集化演算法(例如階層式凝聚分群法),將該些建議區分為二或多個叢集。
2. 標籤化叢集
一旦區分一建議集合S為二或多個群集後,便可對該每一建議群集指定一相異標籤或影像,該標籤或影像也可與該對應建議群集關聯顯示。在此方法中,可以提供一視覺提示以標示該對應建議群集的主題內容。以下將詳細描述對一建議群集指定一標籤或影像的多種方式。
2.1 最常出現的建議(Most Frequent Suggestion,MFS)
一種選擇一查詢建議叢集之標籤(或影像)的方法是選擇在該叢集中最具代表性的建議。因為該叢集中的每一個建議都是一查詢,因此一種選擇該最具代表性建議的方法則是選擇最常對該使用者呈現及/或最常由該使用者所點擊的建議(例如根據一查詢記錄)。具體來說,由MFS所指定至一特定建議叢集S的標籤為
其中Freq(x)為在一查詢記錄中所觀察到的x次數。
一旦一建議群集中之最具代表性的建議被識別出來,便能獲得並提供(例如顯示)與該代表性建議關聯之一標籤及/或影像。例如,該標籤可以僅僅只是該代表性建議(例如“Nursing”)。又如另一範例,可以提供一護士的影像,而不是該標籤“Nursing”。
2.2 最長共同子序列(Longest Common Subsequence,LCS)
通常,字元序列係由一叢集中的建議所共享,但不與其他叢集中的建議共享。例如,由一使用者所提交之查詢的一部分“us a”可能被完成為“us airways”及“us airways flights”(兩者都在一叢集中),也可為“us army”及“us army jobs”(在一不同的叢集中)。需要使用該建議的最長共同子序列做為一標籤(或用來選擇一影像),以代表一查詢建議叢集。該建議集合S的LCS可以表示以下:
其中,Q(S)為任意建議s S 的子序列集合。例如,可以由該LCS方法指定一標籤為“nursing home”給包含“nursing home”、“nursing home compare”以及“nursing home costs”的搜尋查詢建議集合。因此,一旦由二或多個建議群集所共有的字元序列被識別時,便能提供(例如顯示)由該建議群集所共有,與該字元序列關聯(例如識別)之一標籤或影像。
2.3 結果集合中最常出現的項目(Most Frequent in Result Set,MFRS)
MFS與LCS方法都有一項缺點就是其為一叢集所產生的標籤都是從歸屬於該叢集的建議所產生。然而,對於某些建議叢集而言,一個有意義的標籤可能無法只從該叢集中的建議確定。在這種情況中,代表一叢集的標籤可以利用該叢集外部的資源所獲得。例如,對於包含建議“los angeles daily news”、“los angeles times”與“los angeles times newspaper”的一叢集而言,一個有用的標籤可能是“los angeles newspaper”,其只是該叢集中所有建議的一部份重疊所形成的標籤。
如同執行該叢集化一樣,吾人可以對此外部知識為每一建議(當其被做為提交至一搜尋引擎的查詢時)使用一最優選文件集合。具體來說,每一搜尋查詢建議都可以做為一搜尋查詢而透過一搜尋引擎所執行,以獲得一對應文件集合。藉由將一特定叢集中的建議集合轉換為一文件集合,吾人可以運用多種發展於文件標籤化(而非查詢)的方法。
一種將文件叢集標籤化的標準方法是從該文件取得文字N元語法(n-grams),並選擇最常出現的n-gram。一n-gram係為n個文字的連續序列。令R(s)為一建議s的最優選搜尋結果集合;令R(S)= R (S i ),令NG(d)為包含在該文件d中的文字n-gram集合;並令NG(R(S))為該建議叢集之所有最優選文件中的所有n-gram集合,NG(R(S))= NG (d )。接著由該MFRS方法所指定給該建議集合S的標籤係為
例如,該MFRS方法可以指定該標籤“news”給包含該建議“los angeles daily news”、“los angeles times”與“los angeles times newspaper”的建議叢集。
根據一實施例,對於每一建議群集而言,可以獲得與該對應建議集合關聯之一搜尋結果(例如文件)集合,其中該搜尋結果的每一個都包含一對應標題、摘要與全球資源定位器(URL)。接著可以利用該對應搜尋結果集合,為每一建議群集識別或產生一標籤(或影像)。
2.4 修正結果集合中最常出現的項目(Most Frequent in Modified Result Set,MFRS*)
搜尋建議在叢集中具有高度的語彙重疊性,其做為實體的聚集具有獨特性。在具有一長共同子序列的叢集中,吾人有興趣加以標籤的元素,有時候其最佳呈現係在那些非由該叢集所有元素所共享之建議部分。因此,可以應用一額外的標籤化機制MRFS*。MFRS*與MFRS類似,但用以執行以獲得一最優選文件集合的查詢,可以只透過執行明顯與該叢集之中有所區別的建議部分所獲得(而不是執行完整的搜尋建議)。例如,對於包含該些建議“los angeles public library”、“los angeles police department”以及“los angeles unified school district”的建議叢集而言,可以執行該些搜尋查詢“public library”、“police department”以及“unified school district”。該MFRS*機制可以定義如下:令si *為該建議si 已經將該建議集合S的最長共同子序列去除的部分,si *=si -LCS(S),並令S*為S中將所有建議去除最長共同子序列的建議集合,S*=∪ i si *,而由MFRS*指定給S的標籤係為
MFRS*(S)=MFRS(S*)
例如,該MFRS*方法可以指定標籤“services”至包含該些建議“los angeles public library”、“los angeles police department”以及“los angeles unified school district”之建議叢集”。
2.5 標籤化整合策略
如上述那些一個以上的標籤化機制可以單獨應用或彼此結合應用,以指定一標籤(或影像)至各種建議群集。建議叢集可以具有相異特徵,並可能因此在使用相異標籤化方法時具有優勢。如此一來,所選擇並應用的標籤化機制可以根據所被應用的系統而不同。而且,所選擇並應用的標籤化機制可以根據該叢集的叢集化特徵而不同。
一標籤(或影像)可以單獨利用來自於一叢集之中的資訊(例如建議)而被指定至該叢集。例如,可以應用像是MFS或LCS的機制指定一標籤(或影像)。或者,除了利用來自該叢集之中的資訊以外,還可以額外地利用該叢集外部的資訊(例如搜尋結果),或是不利用該叢集之中的資訊而是利用該叢集外部的資訊(例如搜尋結果),指定一標籤(或影像)至一叢集。例如,可以應用像是MFRS或MFRS*的機制指定一標籤(或影像)。
在一實施例中,可以檢視一叢集以決定該叢集的叢集緊密程度。換句話說,可以檢視該叢集以決定該叢集的元素(例如建議)相似的程度。該叢集愈緊密(例如,該叢集元素愈相似),則愈可能從該叢集的成員之中找到一適合的標籤,而非從該叢集外部。一建議集合S的緊密程度可以利用該叢集S元素之間的平均距離加以測量。當該叢集S的緊密程度係小於一門檻值時,便可以應用利用該叢集外部資訊的機制(例如MFRS或MFRS*);在其他情況中,可以應用利用該叢集之中資訊的機制(例如MFS或LCS)。
3. 排序建議叢集
可以應用本發明實施例來呈現一建議集合以完成查詢,藉此減少該使用者在該建議集合中找出想要的建議時花費的力氣。其中將建議集合群集化的方法可以降低使用者花費的力氣。同樣的,呈現該建議群集的次序,以及呈現在一特定建議群集中的建議次序,也可以影響該使用者在從所呈現之建議集合之中找出想要之建議時所花費的力氣。
根據一態樣,待提供之該二或多個建議群集的次序可以在提供該二或多個建議群集顯示之前確定。接著,可以提供該二或多個建議群集,使得該二或多個建議群集可以根據所確定的次序,顯示在該使用者介面之一搜尋協助片段的個別區隔之中。
可以應用一成本度量,以描述該使用者從一建議叢集集合中找出一建議時所花費力氣的特性。具體來說,該成本度量可以產生一數值,該數值係代表從該二或多個建議群集中找出一建議的一預期成本。接著可以應用一演算法以將從該建議叢集集合中找出之建議的預期成本最小化。
藉由將已經由一使用者輸入之一搜尋查詢部分關聯之待呈現建議集合叢集化(或標籤化)的方式,吾人可以使該使用者在叢集之間快速閱覽,接著在識別一關聯叢集之後,該使用者可以在該叢集中檢閱以找出一想要的建議。因此,識別一想要建議的成本可以被定義為:讀取一叢集標籤的時間:使用者可以利用閱讀該對應標籤(或影像)的方式瀏覽該建議叢集。在每一叢集C處,該使用者可以根據該標籤是否獲得該使用者的興趣,決定該叢集應被跳過或檢閱。吾人可為以Tlb (C)表示閱讀一叢集標籤的成本。
檢閱一叢集的時間:一旦已經識別包含該想要建議之一叢集C,該使用者便可以檢閱該叢集C中的建議,直到找出想要的建議為止。吾人可為以Tsc (s)表示檢閱該叢集之中每一建議的成本。
假設一使用者輸入一查詢字首p,並想要從一叢集集合C1、C2、...、Cn中找出一建議s,並令Cm為包含該建議s1、s2、...、sj的叢集,則sk=s。換句話說,該建議s係位在該叢集Cm中位置k處。對於該使用者而言,找出建議s的成本可以表示為T(s),可被定義為 T lb (Ci )+ T sc (s j )。為了簡化,吾人可以假設對於所有叢集而言讀取任意叢集標籤的成本為相同,也就是Tlb 。同樣的,吾人可以假設在一叢集識別之中掃過建議的成本也相同為Tsc ,而不管該建議為何。在叢集m中位置k處的建議s,其成本T(s)便成為T(s)=m‧Tlb +k‧Tsc
對於輸入字首p的使用者而言,在該些建議之中找出感興趣之建議的預期成本T(p)可以被定義為
其中,P(s|p)表示當該字首已經被輸入而該使用者感興趣之建議s的機率,而Tp為該建議s之排名R的函數。P(s|p)可以根據當使用者輸入該字首p時觀察該使用者的偏好,而從該查詢記錄中估計出來。更具體地說,可以識別包含已經由該使用者(或其他使用者)所提交或選擇之字首的查詢。接著,便可以從所識別的查詢中確認該查詢s已經被提交或選擇的次數對於包含該字首s的查詢總數。具體來說,如果f(p)代表由一使用者(或多個使用者)輸入該字首的次數(例如,由一使用者或多個使用者所提交包含該字首的查詢次數),而f(s)代表該建議s被提交做為一使用者查詢的次數,那麼
注意一般來說是小於1,因為使用者可能已經輸入不包含在該建議集合之中的查詢。吾人可以假設該使用者所感興趣之建議並未出現在該建議集合中的成本,係與所呈現之該建議集合的排序無關。
一排序演算法可以用來排序該叢集,以及排序該叢集之中的建議,以將Tp(R)最小化。在一實施例中,該排序演算法可以以一種頻率f(s)的非遞增次序(例如遞減次序)將一叢集之中的建議排序。為了排序建議叢集,每一叢集S都可以被指定一總頻率F(C),其等於該叢集C中所有建議的頻率總和。因此,一排序演算法可以以總頻率F(C)的非遞增次序(例如遞減次序),排序該建議叢集。
根據另一態樣,可以將該些建議群集之每一群集之中的建議加以排序。具體來說,可以確定在待提供之該二或多個建議群集之每一群集之中,該建議集合之子集合的次序。例如,該次序可以根據一查詢記錄指出該些建議的普及性。接著,該二或多個建議群集之每一群集的建議都可以根據所確定之次序,顯示在該使用者介面之搜尋協助片段的一對應區隔之中。
本發明的實施例可以用來透過一圖形使用者介面執行一種搜尋動作於使用相同圖形使用者介面提供搜尋建議的同時。本發明實施例可以在任意多種的計算環境中實作。例如,如在第五圖中描述,可以考慮實作在使用者可以透過任何電腦形式(例如,桌上型、膝上型、平板電腦等等)1102、媒體計算平台1103(例如,電纜或衛星機上盒與數位視頻記錄器)、手持式計算裝置(例如,個人數位助理)1104、行動電話1106或任何計算或通訊平台形式,與一分散式網路環境互動的實作方式。
根據各種實施例,根據本發明所處理的輸入可以使用多種技術所獲得。例如,可以透過一圖形使用者介面從一使用者與一區域應用程式、網站或網路應用程式或服務的互動,獲得一搜尋查詢,並可以利用任何各種已知的機制獲得來自一使用者的資訊,藉此完成搜尋查詢。然而,應當瞭解這種從一使用者獲得輸入的方法僅為範例,而可以以許多其他方法獲得一搜尋查詢。
根據本發明實施例,可以以某些集中方式將搜尋建議叢集化並加以呈現,這在第五圖中由伺服器1108與資料儲存器1110所表示,如從圖中可以了解到,上述伺服器1108與資料儲存器1110可以對應至多個分散裝置與資料貯存器。本發明也可以在多種網路環境(以網路1112表示)中實作,例如TCP/IP網路、電信網路、無線網路等等。此外,可以實作本發明實施例之電腦程式指令也可以儲存在任何形式的電腦可讀取媒體之中,並可以根據多種計算模型在一獨立計算裝置上所執行,包含客戶端/伺服器端模型、點對點模型,或是根據一種分散式計算裝置所執行,其中可以在不同位置實現或使用在此描述的各種功能。
本發明所揭露之技術可以在任何適合的軟體及/或硬體系統組合中實作,像是一種網路伺服器或桌上型電腦系統。此外,實作本發明各種實施例的系統可以是一種可攜式裝置,像是膝上型電腦或行動電話。本發明之搜尋裝置及/或網頁瀏覽器可以特別為所需的目的所建構,或可以是一種由一電腦程式及/或儲存在電腦中的資料結構所選擇性啟動或再配置的一般功能電腦。在此呈現的程序本質上係不與任何特定電腦或其他裝置關聯。尤其,可以使用各種一般功能的機器,其具有根據在此所教示撰寫的程式,或更方便地是建構一種可執行所需方法步驟之特殊裝置。
不管系統的配置為何,可以配置一或多個記憶體或記憶體模組儲存資料、一般功能處理操作的程式指令及/或在此描述的本發明技術。例如,程式指令可以控制一操作系統及/或一或多個應用程式的操作。記憶體也可以配置以儲存執行本發明方法的指令,以及儲存查詢記錄、標籤、影像、搜尋結果等等。
因為這種資訊與程式指令可以用來實作在此描述的系統/方法,因此本發明也與機器可讀取媒體有關,其包含程式指令、狀態資訊等等,以執行在此描述的各種操作。機器可讀取媒體的範例包含但不限制像是硬碟、軟碟與磁帶的磁性媒體;像是光碟(CD-ROM disk)的光學媒體;像是軟磁光碟(floptical disk)的磁光媒體;以及特別用於儲存並執行程式指令的硬體裝置,像是唯讀記憶體裝置、隨機存取記憶體裝置。程式指令的範例包含機器碼與檔案兩者,例如由一編譯器所產生的機器碼,以及包含可以由電腦使用一直譯器執行之高階程式碼的檔案。
第六圖描述一種典型的電腦系統,當其被適當的配置或設計時,可以做為本發明的系統。該電腦系統1200包含任何數量的處理器1202(也稱做為中央處理單元,CPU),其與包含主儲存器1206(一般為一隨機存取記憶體,RAM)、主儲存器1204(一般為一唯讀記憶體,RAM)的儲存裝置耦接。CPU 1202可以是任何形式,包含像是可程式裝置的微控制器及微處理器(例如複雜可程式邏輯裝置(CPLDs)與場效可程式閘陣列(FPGAs)),以及像是閘陣列特定應用積體電路(gate array ASICs)或一般功能微處理器的不可程式裝置。如同本領域熟知的,主儲存器1204係用於單向傳輸資料及指令至該CPU,而主儲存器1206一般係以雙向形式傳輸資料及指令。這些主儲存器都可以包含如上所述的任何適當的電腦可讀取媒體。一大量儲存裝置1208也可以與CPU 1202雙向耦接,並提供額外的資料儲存容量,以及可以包含上述任何的電腦可讀取媒體。大量儲存裝置1208也可以用來儲存程式、資料等等,其一般來說是像是硬碟的次要儲存媒體。可瞭解的是保存在該大量儲存裝置1208之中的資訊可以在適當的情況下以標準形式結合成為主儲存器1206的部分,以做為虛擬記憶體。像是光碟片1214的特定大量儲存裝置也可以單向傳遞資料至CPU。
CPU 1202也可以與一介面1210耦接,該介面1210連接至一或多個輸入/輸出裝置像是影像監視器、軌跡球、滑鼠、鍵盤、麥克風、觸控顯示器、感應讀卡機、磁帶或紙帶讀取機、手寫板、手寫筆、聲音或手寫辨識器、或其他已知的裝置例如其他電腦。最後,CPU 1202可選擇性地與一外部裝置耦接,像是資料庫或電腦或使用外部連接方式的電信網路,如在1212處所示。有了這樣的連接,便可以考慮CPU於執行在此所描述之方法步驟時,能夠從網路接收資訊或輸出資訊至網路。
雖然前述發明已經為了清楚瞭解之目的詳細描述,但顯然可進行各種變化與改變在下述申請專利範圍的範疇內。因此,本發明實施例係為了說明而非做為限制,且本發明並不限制在本說明書中所描述的細節,但可以在下述申請專利範圍的範疇及等價物之中加以修改。
102a、102b、102c...客戶端
104...網路
106...搜尋伺服器
110...查詢記錄
114...網頁伺服器
202...搜尋查詢區
204...建議集合
206...區隔
208...建議群集
210...區隔
212...建議群集
214...區隔
216...影像
218...區隔
220...影像
302...步驟
304...步驟
306...步驟
308...步驟
1102...電腦
1103...媒體計算平台
1104...手持式計算裝置
1106...行動電話
1108...伺服器
1110...資料儲存器
1112...網路
1200...電腦系統
1202...處理器
1204...主儲存器
1206...主儲存器
1208...大量儲存裝置
1210...介面
1212...網路連結
1214...光碟片
第一圖為描述一示範系統之示意圖,其中可實作多種實施例。
第二A圖為描述一示範圖形使用者介面之示意圖,透過該介面可呈現一搜尋查詢建議清單。
第二B至第二C圖為描述在執行一建議清單叢集化之後之示例的建議群集的圖形使用者介面。
第三圖為描述根據本發明多種實施例叢集化並呈現建議集合之示範方法的程序流程圖。
第四圖為描述當一使用者輸入“salsa”至一使用者介面的搜尋查詢區時,提供至一使用者之示範建議的圖式。
第五圖為一示範網路環境的簡化圖式,其中可實作多種實施例。
第六圖描述一示範電腦系統,其中可實作多種實施例。
302...步驟
304...步驟
306...步驟
308...步驟

Claims (27)

  1. 一種用於搜尋建議叢集與呈現的方法,包括:透過一使用者介面之一搜尋查詢區獲得一文字片段,以回應透過該使用者介面之該搜尋查詢區所輸入的該文字片段,該文字片段係為一使用者尚未提交的一搜尋查詢的一部分;獲得一建議集合,該建議集合中的每一建議都係該搜尋查詢的一建議完成項目,使得該建議包含該文字片段;產生二或多個建議群集,該二或多個建議群集的每一者包含該建議集合之一相異子集合,其中該二或多個建議群集的每一者對應至一使用者尚未提交的該搜尋查詢的該部分的一相異詮釋;提供該二或多個建議群集,使得該二或多個建議群集的每一者顯示在該使用者介面的一搜尋協助片段的一不同區隔之中;提供關聯於該二或多個建議群集的每一者的一標籤或影像,使得該標籤或影像係顯示在該使用者介面中極靠近所對應的該二或多個建議群集的其中一者之處;以及針對該二或多個建議群集的每一者識別一字元序列,該字元序列係該建議集合中所對應的該子集合的每一建議的至少一部分;其中提供關聯於該二或多個建議群集的每一者的該標籤或影像,係包含提供關聯於該字元序列的一標籤或影像,該字元序列係所對應的該建議子集合中的每一建議的至少一部分。
  2. 如申請專利範圍第1項所述之方法,其中提供該標籤或影像,係使得該標籤或影像與該使用者介面的該搜尋協助片段中所對應的該區隔關聯顯示。
  3. 如申請專利範圍第1項所述之方法,其中產生該二或多個建議群集包括: 獲得與該建議集合中每一建議關聯的一或多個特徵集合;以及應用與該建議集合中每一建議關聯的該一或多個特徵集合以產生該二或多個建議群集。
  4. 如申請專利範圍第3項所述之方法,進一步包括:分析該建議集合中的每一建議,以獲得針對所對應的該建議的一或多個文字集合;其中與該建議集合中每一建議關聯的該一或多個特徵集合,係包含所對應的該一或多個文字集合中的一代表文字。
  5. 如申請專利範圍第3項所述之方法,進一步包括:獲得與該建議集合中每一建議關聯的一搜尋結果集合,該搜尋結果集合的每一搜尋結果都包含一對應標題、摘要與全球資源定位器(URL);其中與該建議集合中每一建議關聯的該一或多個特徵集合係包含或是根據所對應的該搜尋結果集合中的一文字集合。
  6. 如申請專利範圍第5項所述之方法,其中所對應的該搜尋結果集合中的該文字集合,係包含至少以下其一:在該搜尋結果集合之至少一部份中該標題中的文字、在該搜尋結果集合之至少一部份中該摘要中的文字,或是在該搜尋結果集合之至少一部份中該全球資源定位器中的文字。
  7. 如申請專利範圍第3項所述之方法,進一步包括:獲得與該建議集合中每一建議關聯的搜尋結果,該等搜尋結果中的每一搜尋結果都包含一全球資源定位器(URL);獲得與該建議集合中每一建議關聯的點擊資料;其中與該建議集合中每一建議關聯的該一或多個特徵集合包含所獲得關聯於所對應的該建議的該點擊資料,其中該點擊資料係與關聯於所對應的該建議的該等搜尋結果的該等全球資源定位器(URL)有關。
  8. 如申請專利範圍第1項所述之方法,進一步包括: 決定是否呈現該二或多個建議群集;其中提供該二或多個建議群集係根據是否呈現該二或多個建議群集之決定執行。
  9. 如申請專利範圍第1項所述之方法,進一步包括:確定在該二或多個建議群集的每一者之中,提供該建議集合之子集合的一次序;其中執行提供該二或多個建議群集,係使得該二或多個建議群集的每一者的該建議集合之子集合根據所確定的該次序,顯示於該使用者介面的該搜尋協助片段的一對應區隔中。
  10. 如申請專利範圍第1項所述之方法,進一步包括:在提供該二或多個建議群集之前,確定提供該二或多個建議群集的一次序;其中執行提供該二或多個建議群集,係使得該二或多個建議群集根據所確定的該次序,顯示於該使用者介面的該搜尋協助片段的不同區隔中。
  11. 如申請專利範圍第10項所述之方法,其中確定提供該二或多個建議群集的一次序係包括:應用一成本度量,以產生代表從該二或多個建議群集中找出一建議之預期成本的數值;以及將所述從該二或多個建議群集中找出一建議的該預期成本最小化。
  12. 如申請專利範圍第1項所述之方法,其中該搜尋查詢的該部分係由一使用者在構成該搜尋查詢時所鍵入的一字元序列。
  13. 如申請專利範圍第12項所述之方法,其中該搜尋查詢的該部分係一字首、中間詞或字尾。
  14. 如申請專利範圍第1項所述之方法,進一步包括:在該二或多個建議群集的其一之中,接收一建議的一選擇;以及透過一或多個搜尋應用程式,執行所選擇的建議作為一 搜尋查詢。
  15. 一種非暫態電腦可讀媒介,其上儲存有電腦可讀指令以用於搜尋建議叢集與呈現,該等電腦可讀指令包括:用於透過一使用者介面之一搜尋查詢區獲得一文字片段的指令,以回應透過該使用者介面之該搜尋查詢區所輸入的該文字片段,該文字片段係為一使用者尚未提交的一搜尋查詢的一部分;用於獲得一建議集合的指令,該建議集合中的每一建議都係該搜尋查詢的一建議完成項目,使得該建議包含該文字片段;用於從該建議集合決定該使用者尚未提交的該搜尋查詢為一含糊查詢的指令;用於產生二或多個建議群集的指令,該二或多個建議群集的每一者包含該建議集合之一相異子集合,其中該二或多個建議群集的每一者對應至一使用者尚未提交的該搜尋查詢的該部分的一相異詮釋;用於提供該二或多個建議群集的指令,使得該二或多個建議群集的每一者顯示在該使用者介面的一搜尋協助片段的一不同區隔之中;用於提供關聯於該二或多個建議群集的每一者的一標籤或影像的指令,使得該標籤或影像係顯示在該使用者介面中極靠近所對應的該二或多個建議群集的其中一者之處;以及用於針對該二或多個建議群集的每一者識別一字元序列的指令,該字元序列係該建議集合中所對應的該子集合的每一建議的至少一部分;其中提供關聯於該二或多個建議群集的每一者的該標籤或影像,係包含提供關聯於該字元序列的一標籤或影像,該字元序列係所對應的該建議子集合中的每一建議的至少一部分。
  16. 如申請專利範圍第15項所述之非暫態電腦可讀媒介,其中 提供該標籤或影像,係使得該標籤或影像與該使用者介面的該搜尋協助片段中所對應的該區隔關聯顯示。
  17. 如申請專利範圍第15項所述之非暫態電腦可讀媒介,進一步包括:用於產生該二或多個建議群集之一第一集合的指令,該二或多個建議群集之該第一集合的每一者包含該建議集合之一相異子集合;其中從該建議集合決定該搜尋查詢為一含糊查詢,係根據該二或多個建議群集之該第一集合的每一者之中的建議數量所執行。
  18. 如申請專利範圍第15項所述之非暫態電腦可讀媒介,其中從該建議集合決定該使用者尚未提交的該搜尋查詢為一含糊查詢,係包括決定該使用者尚未提交的該搜尋查詢的該部分,有多於一個的可能詮釋。
  19. 一種用於搜尋建議叢集與呈現的裝置,包括:一處理器;以及一記憶體,該處理器及該記憶體至少其一者係配置成用於:透過一使用者介面之一搜尋查詢框獲得一文字片段,以回應透過該使用者介面之該搜尋框所輸入的該文字片段,該文字片段係為一使用者尚未提交的一搜尋查詢之一部分;獲得一建議集合,該建議集合中的每一建議都係該搜尋查詢的一建議完成項目,使得該建議包含該文字片段;從該建議集合決定該使用者尚未提交的該搜尋查詢為一含糊查詢;產生二或多個建議群集,該二或多個建議群集的每一者包含該建議集合之一相異子集合,其中該二或多個建議群集的每一者對應至一使用者尚未提交的該搜尋查詢的該部分的一相異詮釋;提供該二或多個建議群集,使得該二或多個建議群集的 每一者顯示在該使用者介面的一搜尋協助片段的一不同區隔之中;提供關聯於該二或多個建議群集的每一者的一標籤或影像,使得該標籤或影像係顯示在該使用者介面中極靠近所對應的該二或多個建議群集的其中一者之處;以及針對該二或多個建議群集的每一者識別一字元序列,該字元序列係該建議集合中所對應的該子集合的每一建議的至少一部分;其中提供關聯於該二或多個建議群集的每一者的該標籤或影像,係包含提供關聯於該字元序列的一標籤或影像,該字元序列係所對應的該建議子集合中的每一建議的至少一部分。
  20. 如申請專利範圍第19項所述之裝置,其中關聯於該二或多個建議群集的每一者的該標籤或影像,係提供於該使用者介面之該搜尋協助片段的對應片段之中。
  21. 如申請專利範圍第19項所述之裝置,該處理器及該記憶體至少其一者配置成用於執行多個步驟,進一步包括:針對該二或多個建議群集之每一者,從該建議子集合識別一代表建議;以及在所對應的該二或多個建議群集的其中一者之中,獲得關聯於該代表建議的一代表標籤或影像;其中提供關聯於該二或多個建議群集的每一者的該標籤或影像,係包含在所對應的該二或多個建議群集的其中一者之中,提供關聯於該代表建議的該代表標籤或影像。
  22. 如申請專利範圍第21項所述之裝置,其中該代表建議是根據一查詢記錄,該建議子集合中最常出現的一建議。
  23. 如申請專利範圍第19項所述之裝置,該處理器及該記憶體至少其一者配置成用於執行多個步驟,進一步包括:針對該二或多個建議群集的每一者,獲得與該建議集合中所對應的該子集合關聯的一搜尋結果集合,該搜尋結果集 合之每一搜尋結果都包含一對應標題、摘要與全球資源定位器(URL);以及利用所對應的該搜尋結果集合,針對該二或多個建議群集之每一者識別或產生一標籤。
  24. 如申請專利範圍第23項所述之裝置,其中獲得該搜尋結果集合係藉由執行一搜尋查詢而進行,該搜尋查詢係針對該建議集合中所對應的該子集合的一或多個建議執行。
  25. 如申請專利範圍第23項所述之裝置,其中獲得該搜尋結果集合係藉由執行一搜尋查詢而進行,該搜尋查詢只利用該建議集合中所對應的該子集合之中的建議的部分執行,所利用的該等建議的該等部分係在所對應的該二或多個建議群集的其一建議群集中有所區別者。
  26. 如申請專利範圍第19項所述之裝置,進一步包括:針對該二或多個建議群集之每一者:識別在該二或多個建議群集其中的該群集中,該建議集合之該子集合所共享的一主題或態樣,其中該主題或態樣並不由該建議集合中的其他建議子集合所共享;以及獲得代表該主題或態樣之一標籤或影像,藉此使該標籤或影像能與所對應的該二或多個建議群集的其中一群集關聯而被提供。
  27. 如申請專利範圍第19項所述之裝置,進一步包括:針對該二或多個建議群集之每一者:確定該二或多個建議群集其中的該群集的內聚程度;以及根據該二或多個建議群集其中的該群集的內聚程度,利用該二或多個建議群集其中的該群集以外的資訊,獲得與該二或多個建議群集其中的該群集關聯的一標籤或影像。
TW099145451A 2009-12-28 2010-12-23 搜尋建議叢集與呈現 TWI482037B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US12/648,220 US8631004B2 (en) 2009-12-28 2009-12-28 Search suggestion clustering and presentation

Publications (2)

Publication Number Publication Date
TW201135492A TW201135492A (en) 2011-10-16
TWI482037B true TWI482037B (zh) 2015-04-21

Family

ID=44188698

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099145451A TWI482037B (zh) 2009-12-28 2010-12-23 搜尋建議叢集與呈現

Country Status (9)

Country Link
US (1) US8631004B2 (zh)
EP (1) EP2519896A4 (zh)
JP (1) JP5727512B2 (zh)
KR (1) KR101443475B1 (zh)
CN (1) CN102687138B (zh)
AU (1) AU2010343183B2 (zh)
HK (1) HK1175271A1 (zh)
TW (1) TWI482037B (zh)
WO (1) WO2011090638A2 (zh)

Families Citing this family (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7757305B2 (en) * 2005-01-07 2010-07-20 Nada Concepts, Inc. Lower body garment with integral back support
US8479118B2 (en) * 2007-12-10 2013-07-02 Microsoft Corporation Switching search providers within a browser search box
US8423538B1 (en) 2009-11-02 2013-04-16 Google Inc. Clustering query refinements by inferred user intent
WO2011079415A1 (en) * 2009-12-30 2011-07-07 Google Inc. Generating related input suggestions
US20120278308A1 (en) * 2009-12-30 2012-11-01 Google Inc. Custom search query suggestion tools
EP2534557A1 (en) * 2010-02-12 2012-12-19 Xelion B.V. Type and select data input field
US8880548B2 (en) * 2010-02-17 2014-11-04 Microsoft Corporation Dynamic search interaction
US9589032B1 (en) * 2010-03-25 2017-03-07 A9.Com, Inc. Updating content pages with suggested search terms and search results
US20110258212A1 (en) * 2010-04-14 2011-10-20 Microsoft Corporation Automatic query suggestion generation using sub-queries
US8180804B1 (en) 2010-04-19 2012-05-15 Facebook, Inc. Dynamically generating recommendations based on social graph information
US8185558B1 (en) 2010-04-19 2012-05-22 Facebook, Inc. Automatically generating nodes and edges in an integrated social graph
US8751521B2 (en) 2010-04-19 2014-06-10 Facebook, Inc. Personalized structured search queries for online social networks
US8782080B2 (en) 2010-04-19 2014-07-15 Facebook, Inc. Detecting social graph elements for structured search queries
US8732208B2 (en) 2010-04-19 2014-05-20 Facebook, Inc. Structured search queries based on social-graph information
US8868603B2 (en) 2010-04-19 2014-10-21 Facebook, Inc. Ambiguous structured search queries on online social networks
US8918418B2 (en) 2010-04-19 2014-12-23 Facebook, Inc. Default structured search queries on online social networks
US8639715B1 (en) * 2010-05-14 2014-01-28 A9.Com, Inc. Auctionable rich media search suggestions
US8666915B2 (en) * 2010-06-02 2014-03-04 Sony Corporation Method and device for information retrieval
US9703895B2 (en) * 2010-06-11 2017-07-11 Microsoft Technology Licensing, Llc Organizing search results based upon clustered content
WO2012024580A1 (en) * 2010-08-19 2012-02-23 Othar Hansson Predictive query completion and predictive search results
US8489625B2 (en) * 2010-11-29 2013-07-16 Microsoft Corporation Mobile query suggestions with time-location awareness
US8832012B2 (en) 2011-01-14 2014-09-09 Hewlett-Packard Development Company, L. P. System and method for tree discovery
US8626693B2 (en) * 2011-01-14 2014-01-07 Hewlett-Packard Development Company, L.P. Node similarity for component substitution
US8730843B2 (en) 2011-01-14 2014-05-20 Hewlett-Packard Development Company, L.P. System and method for tree assessment
US9817918B2 (en) 2011-01-14 2017-11-14 Hewlett Packard Enterprise Development Lp Sub-tree similarity for component substitution
US10409851B2 (en) 2011-01-31 2019-09-10 Microsoft Technology Licensing, Llc Gesture-based search
US10444979B2 (en) 2011-01-31 2019-10-15 Microsoft Technology Licensing, Llc Gesture-based search
US8417718B1 (en) 2011-07-11 2013-04-09 Google Inc. Generating word completions based on shared suffix analysis
US8990242B2 (en) * 2011-08-15 2015-03-24 Microsoft Technology Licensing, Llc Enhanced query suggestions in autosuggest with corresponding relevant data
US9589021B2 (en) 2011-10-26 2017-03-07 Hewlett Packard Enterprise Development Lp System deconstruction for component substitution
CN103136228A (zh) * 2011-11-25 2013-06-05 阿里巴巴集团控股有限公司 一种图片搜索方法以及图片搜索装置
US9348479B2 (en) 2011-12-08 2016-05-24 Microsoft Technology Licensing, Llc Sentiment aware user interface customization
US9378290B2 (en) * 2011-12-20 2016-06-28 Microsoft Technology Licensing, Llc Scenario-adaptive input method editor
US9405856B2 (en) * 2011-12-30 2016-08-02 Microsoft Technology Licensing, Llc Task-oriented query-completion suggestions with shortcuts
JP5364802B2 (ja) * 2012-01-13 2013-12-11 株式会社東芝 文書検索システム、文書検索方法
US10984337B2 (en) * 2012-02-29 2021-04-20 Microsoft Technology Licensing, Llc Context-based search query formation
US9317605B1 (en) * 2012-03-21 2016-04-19 Google Inc. Presenting forked auto-completions
US20130311447A1 (en) * 2012-05-15 2013-11-21 Microsoft Corporation Scenario based insights into structure data
US9183310B2 (en) * 2012-06-12 2015-11-10 Microsoft Technology Licensing, Llc Disambiguating intents within search engine result pages
CN104428734A (zh) 2012-06-25 2015-03-18 微软公司 输入法编辑器应用平台
US9390174B2 (en) 2012-08-08 2016-07-12 Google Inc. Search result ranking and presentation
US9075898B1 (en) * 2012-08-10 2015-07-07 Evernote Corporation Generating and ranking incremental search suggestions for personal content
EP2891078A4 (en) 2012-08-30 2016-03-23 Microsoft Technology Licensing Llc CHOICE OF CANDIDATE BASED ON CHARACTERISTICS
CN103870501A (zh) * 2012-12-14 2014-06-18 联想(北京)有限公司 一种自动匹配方法及装置
EP2750056A1 (en) * 2012-12-31 2014-07-02 Facebook, Inc. Structuring ambiguous structured search queries on online social networks
US9547420B1 (en) * 2013-02-11 2017-01-17 Amazon Technologies, Inc. Spatial approaches to text suggestion
US9594837B2 (en) 2013-02-26 2017-03-14 Microsoft Technology Licensing, Llc Prediction and information retrieval for intrinsically diverse sessions
US20140280297A1 (en) * 2013-03-14 2014-09-18 Microsoft Corporation Search annotation and suggestion
WO2014139120A1 (en) * 2013-03-14 2014-09-18 Microsoft Corporation Search intent preview, disambiguation, and refinement
CN103279486B (zh) * 2013-04-24 2019-03-08 百度在线网络技术(北京)有限公司 一种提供相关搜索的方法和装置
CN103258023B (zh) * 2013-05-07 2016-08-31 百度在线网络技术(北京)有限公司 搜索候选词的推荐方法及搜索引擎
US9405822B2 (en) * 2013-06-06 2016-08-02 Sheer Data, LLC Queries of a topic-based-source-specific search system
US9374431B2 (en) 2013-06-20 2016-06-21 Microsoft Technology Licensing, Llc Frequent sites based on browsing patterns
US10656957B2 (en) * 2013-08-09 2020-05-19 Microsoft Technology Licensing, Llc Input method editor providing language assistance
US9898586B2 (en) 2013-09-06 2018-02-20 Mortara Instrument, Inc. Medical reporting system and method
WO2015084759A1 (en) * 2013-12-02 2015-06-11 Qbase, LLC Systems and methods for in-memory database search
US9454621B2 (en) * 2013-12-31 2016-09-27 Google Inc. Surfacing navigational search results
EP3095042A4 (en) * 2014-01-14 2017-09-06 Ayasdi Inc. Consensus sequence identification
US10599669B2 (en) 2014-01-14 2020-03-24 Ayasdi Ai Llc Grouping of data points in data analysis for graph generation
US9690858B1 (en) * 2014-02-14 2017-06-27 Priceline.Com Llc Predicting categorized completions of a partial search term
CN105183733A (zh) * 2014-06-05 2015-12-23 阿里巴巴集团控股有限公司 一种文本信息的匹配、业务对象的推送方法和装置
US9671956B2 (en) * 2014-06-18 2017-06-06 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Presenting search term suggestions on graphical user interfaces
US10114862B2 (en) 2014-08-29 2018-10-30 International Business Machines Corporation Suggestion of a broad-spectrum list of grouped natural language search query terms
JP6196200B2 (ja) * 2014-09-19 2017-09-13 ヤフー株式会社 ラベル抽出装置、ラベル抽出方法およびプログラム
US20160092550A1 (en) * 2014-09-30 2016-03-31 Yahoo!, Inc. Automated search intent discovery
US9378740B1 (en) 2014-09-30 2016-06-28 Amazon Technologies, Inc. Command suggestions during automatic speech recognition
CN104462369A (zh) * 2014-12-08 2015-03-25 沈阳美行科技有限公司 一种导航设备的搜索自动补全方法
US9910930B2 (en) * 2014-12-31 2018-03-06 TCL Research America Inc. Scalable user intent mining using a multimodal restricted boltzmann machine
US10169488B2 (en) 2015-02-20 2019-01-01 Google Llc Methods, systems, and media for providing search suggestions based on content ratings of search results
US9965569B2 (en) * 2015-03-13 2018-05-08 Microsoft Technology Licensing, Llc Truncated autosuggest on a touchscreen computing device
RU2632140C2 (ru) * 2015-09-29 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для кластеризации предложений для поисковых запросов
US10185784B2 (en) 2015-10-28 2019-01-22 Microsft Technolgy Licensing, LLC Cohesive related searches with dynamically generated titles
RU2015156695A (ru) 2015-12-29 2017-07-05 Общество С Ограниченной Ответственностью "Яндекс" Способ и система обработки префикса, связанного с поисковым запросом
US10289729B2 (en) * 2016-03-17 2019-05-14 Google Llc Question and answer interface based on contextual information
US10467291B2 (en) * 2016-05-02 2019-11-05 Oath Inc. Method and system for providing query suggestions
CN107515877B (zh) * 2016-06-16 2021-07-20 百度在线网络技术(北京)有限公司 敏感主题词集的生成方法和装置
US10169336B2 (en) * 2017-01-23 2019-01-01 International Business Machines Corporation Translating structured languages to natural language using domain-specific ontology
US10984026B2 (en) * 2017-04-25 2021-04-20 Panasonic Intellectual Property Management Co., Ltd. Search method for performing search based on an obtained search word and an associated search word
US10817551B2 (en) * 2017-04-25 2020-10-27 Panasonic Intellectual Property Management Co., Ltd. Method for expanding word, word expanding apparatus, and non-transitory computer-readable recording medium
CN111213212A (zh) * 2017-08-14 2020-05-29 皇家飞利浦有限公司 用于生成反映组的查询建议的系统和方法
JP6805206B2 (ja) * 2018-05-22 2020-12-23 日本電信電話株式会社 検索ワードサジェスト装置、表現情報の作成方法、および、表現情報の作成プログラム
US11232153B2 (en) * 2018-06-14 2022-01-25 Microsoft Technology Licensing, Llc Providing query recommendations
CN112513892A (zh) * 2018-07-31 2021-03-16 三菱电机株式会社 信息处理装置、程序及信息处理方法
US11048734B1 (en) * 2018-08-20 2021-06-29 Pinterest, Inc. Auto-completion based on content similarities
CN109542998B (zh) * 2018-11-27 2021-06-22 重庆英卡电子有限公司 基于节点的地理寻径地图标识方法
US11170017B2 (en) 2019-02-22 2021-11-09 Robert Michael DESSAU Method of facilitating queries of a topic-based-source-specific search system using entity mention filters and search tools
JP6852114B2 (ja) * 2019-05-28 2021-03-31 ヤフー株式会社 特定装置、特定方法及び特定プログラム
CN110442593B (zh) * 2019-08-12 2022-02-01 四川长虹电器股份有限公司 基于用户搜索信息跨应用共享的方法
CN112819513B (zh) * 2021-01-22 2023-07-25 北京有竹居网络技术有限公司 一种文本链生成方法、装置、设备及介质
US20220261406A1 (en) * 2021-02-18 2022-08-18 Walmart Apollo, Llc Methods and apparatus for improving search retrieval
US20220398230A1 (en) * 2021-06-14 2022-12-15 Adobe Inc. Generating and executing automatic suggestions to modify data of ingested data collections without additional data ingestion
TWI806254B (zh) * 2021-11-24 2023-06-21 英業達股份有限公司 資料群集更新方法
CN115687579B (zh) * 2022-09-22 2023-08-01 广州视嵘信息技术有限公司 文档标签生成及匹配方法、装置和计算机设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040267600A1 (en) * 2003-06-30 2004-12-30 Horvitz Eric J. Models and methods for reducing visual complexity and search effort via ideal information abstraction, hiding, and sequencing
TW200816008A (en) * 2006-07-31 2008-04-01 Microsoft Corp Adaptive dissemination of personalized and contextually relevant information
US7428529B2 (en) * 2004-04-15 2008-09-23 Microsoft Corporation Term suggestion for multi-sense query
TW200925913A (en) * 2007-11-02 2009-06-16 Microsoft Corp Syndicating search queries using web advertising
US20090171929A1 (en) * 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
US20090187515A1 (en) * 2008-01-17 2009-07-23 Microsoft Corporation Query suggestion generation

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6424971B1 (en) * 1999-10-29 2002-07-23 International Business Machines Corporation System and method for interactive classification and analysis of data
US8086619B2 (en) * 2003-09-05 2011-12-27 Google Inc. System and method for providing search query refinements
US7836044B2 (en) 2004-06-22 2010-11-16 Google Inc. Anticipated query generation and processing in a search engine
US20060106769A1 (en) 2004-11-12 2006-05-18 Gibbs Kevin A Method and system for autocompletion for languages having ideographs and phonetic characters
US20060190447A1 (en) * 2005-02-22 2006-08-24 Microsoft Corporation Query spelling correction method and system
US8010523B2 (en) * 2005-12-30 2011-08-30 Google Inc. Dynamic search box for web browser
US20090043741A1 (en) 2007-08-09 2009-02-12 Dohyung Kim Autocompletion and Automatic Input Method Correction for Partially Entered Search Query
US8479118B2 (en) * 2007-12-10 2013-07-02 Microsoft Corporation Switching search providers within a browser search box
JP2009289028A (ja) * 2008-05-29 2009-12-10 Denso Corp 検索装置
US20090327270A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Using Variation in User Interest to Enhance the Search Experience
US8452794B2 (en) * 2009-02-11 2013-05-28 Microsoft Corporation Visual and textual query suggestion
US9405841B2 (en) * 2009-10-15 2016-08-02 A9.Com, Inc. Dynamic search suggestion and category specific completion

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040267600A1 (en) * 2003-06-30 2004-12-30 Horvitz Eric J. Models and methods for reducing visual complexity and search effort via ideal information abstraction, hiding, and sequencing
US7428529B2 (en) * 2004-04-15 2008-09-23 Microsoft Corporation Term suggestion for multi-sense query
TW200816008A (en) * 2006-07-31 2008-04-01 Microsoft Corp Adaptive dissemination of personalized and contextually relevant information
TW200925913A (en) * 2007-11-02 2009-06-16 Microsoft Corp Syndicating search queries using web advertising
US20090171929A1 (en) * 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
US20090187515A1 (en) * 2008-01-17 2009-07-23 Microsoft Corporation Query suggestion generation

Also Published As

Publication number Publication date
WO2011090638A2 (en) 2011-07-28
WO2011090638A3 (en) 2011-10-13
EP2519896A4 (en) 2016-06-01
KR20120112663A (ko) 2012-10-11
AU2010343183B2 (en) 2014-05-01
KR101443475B1 (ko) 2014-09-22
CN102687138A (zh) 2012-09-19
HK1175271A1 (zh) 2013-06-28
US8631004B2 (en) 2014-01-14
JP5727512B2 (ja) 2015-06-03
JP2013516022A (ja) 2013-05-09
CN102687138B (zh) 2015-09-16
AU2010343183A1 (en) 2012-06-21
US20110161311A1 (en) 2011-06-30
EP2519896A2 (en) 2012-11-07
TW201135492A (en) 2011-10-16

Similar Documents

Publication Publication Date Title
TWI482037B (zh) 搜尋建議叢集與呈現
CN100530180C (zh) 推荐搜索引擎关键词的方法和系统
US9928296B2 (en) Search lexicon expansion
US8051080B2 (en) Contextual ranking of keywords using click data
US20110072047A1 (en) Interest Learning from an Image Collection for Advertising
US20120002884A1 (en) Method and apparatus for managing video content
US20100274770A1 (en) Transductive approach to category-specific record attribute extraction
US9864768B2 (en) Surfacing actions from social data
US20120016863A1 (en) Enriching metadata of categorized documents for search
Albanese et al. A multimedia recommender integrating object features and user behavior
CN109952571B (zh) 基于上下文的图像搜索结果
US20130031075A1 (en) Action-based deeplinks for search results
Sharma et al. Web page ranking using web mining techniques: a comprehensive survey
Hsu et al. Efficient and effective prediction of social tags to enhance web search
KR101180371B1 (ko) 폭소노미 기반 개인화 웹 검색 방법 및 이를 수행하는 시스템
Li et al. Enhancing news organization for convenient retrieval and browsing
Ruocco et al. Event-related image retrieval: exploring geographical and temporal distribution of user tags
Kanavos et al. On topic categorization of pubmed query results
Radja Personalized Recommendation Techniques in Social Tagging Systems
Jia et al. Scientific referential metadata creation with information retrieval and labeled topic modeling
Strobbe et al. Tag Based Generation of User Profiles.
Bracamonte Nole Improving web multimedia information retrieval using social data
Nauerz et al. Using Collective Intelligence for Adaptive Navigation in Web Portals
Makvana et al. Removal of Single-Word Ambiguity in Web Search Query Through Single Click Information
Lojo Novo Combination of web usage, content and structure information for diverse web mining applications in the tourism context and the context of users with disabilities

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees