TWI585596B - How to implement image search and website server - Google Patents

How to implement image search and website server Download PDF

Info

Publication number
TWI585596B
TWI585596B TW098133413A TW98133413A TWI585596B TW I585596 B TWI585596 B TW I585596B TW 098133413 A TW098133413 A TW 098133413A TW 98133413 A TW98133413 A TW 98133413A TW I585596 B TWI585596 B TW I585596B
Authority
TW
Taiwan
Prior art keywords
picture
image
shape
sample
search
Prior art date
Application number
TW098133413A
Other languages
English (en)
Other versions
TW201113725A (en
Inventor
Chun-Yi Zhou
wei-wei Wang
xin-feng Zhou
Yu Dong
Xiao-Ying Weng
Jia-Long Huang
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to TW098133413A priority Critical patent/TWI585596B/zh
Publication of TW201113725A publication Critical patent/TW201113725A/zh
Application granted granted Critical
Publication of TWI585596B publication Critical patent/TWI585596B/zh

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Description

實現圖片搜索的方法及網站伺服器
本發明關於搜索技術領域,特別關於一種實現圖片搜索的方法及網站伺服器。
網際網路網站提供的圖片搜索服務,可以通過搜索程式,向用戶提供網際網路上相關的圖片資料。
現有技術中的圖片搜索,如各大網站提供的那樣,是由用戶在搜索框內輸入搜索文字並提交到網站的搜索引擎後,搜索引擎在網路爬蟲抓取到的海量圖片中,以用戶提交的搜索文字作為關鍵字搜索附加在這些海量圖片中的文字,典型的如搜索圖片的檔案名或圖片檔屬性中附屬欄位上的文字。進而,伺服器將找到的檔案名或檔屬性附屬欄位與關鍵字匹配的圖片返回給用戶。
可見,事實上這類圖片搜索本質還是基於文本內容的搜索。而這種方式搜索到的圖片,與用戶真正想搜索的圖片有時相去甚遠。例如,同一關鍵字對應的圖片搜索結果中,用戶越來越多的意圖搜索其中具有某一特定形狀的圖片,而按照現有技術的搜索方式,由於返回的搜索結果中包含了諸多形狀的圖片,因此其中包含有大量並非用戶試圖搜索的圖片,那麼,從用戶的觀點,這種方式相應地降低了搜索結果的準確性,而不能滿足用戶的搜索需求。
本發明實施例的目的是提供一種實現圖片搜索的方法及網站伺服器,以實現搜索結果符合用戶的搜索需求。
為解決上述技術問題,本發明一實施例提供的一種實現圖片搜索的方法是這樣實現的:一種實現圖片搜索的方法,其特徵在於,在圖片資料庫中預先根據關鍵字將對應的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片;當伺服器接收到用戶端發來的圖片搜索請求之後,該方法包括:伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並在圖片資料庫中搜索對應所述關鍵字的且與所述選定樣本圖片的特徵值滿足預定要求的圖片;伺服器將所述搜索到的圖片返回給用戶端。
由上述第一實施例可見,當伺服器接收到用戶端發來的圖片搜索請求之後,伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並在圖片資料庫中搜索與所述選定樣本圖片的特徵值滿足預定要求的圖片;伺服器將所述搜索到的圖片返回給用戶端,可以實現按照用戶意圖來搜索圖片,特別是可以實現提供用戶搜索關鍵字對應的圖片形狀類型,進而按照用戶所選擇的形狀類型搜索類似形狀的圖片,從而可以滿足用戶的搜索需求,提高用戶的體驗。
為解決上述技術問題,本發明又一實施例提供的一種實現圖片搜索的方法是這樣實現的:一種實現圖片搜索的方法,在圖片資料庫中預先根據關鍵字將對應的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片;當伺服器接收到用戶端發來的圖片搜索請求之後,該方法包括:伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並返回與提交的樣本圖片同一或近似形狀類型的圖片資料庫中的圖片。
由上述第二實施例可見,當伺服器接收到用戶端發來的圖片搜索請求之後,伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並返回與提交的樣本圖片同一或近似形狀類型的圖片資料庫中的圖片,這樣,可以實現按照用戶意圖來返回搜索的圖片,特別是可以實現提供用戶搜索關鍵字對應的圖片形狀類型,進而按照用戶所選擇的形狀類型返回搜索的類似形狀的圖片,從而可以滿足用戶的搜索需求,提高用戶的體驗。
為解決上述技術問題,本發明第三實施例提供的一種實現圖片搜索的方法是這樣實現的:一種實現圖片搜索的方法,包括:伺服器接收到用戶端發來的圖片搜索請求;伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的圖片;伺服器將所述查找到的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並在圖片資料庫中搜索對應所述關鍵字的且與所述選定樣本圖片的特徵值滿足預定要求的圖片;伺服器將所述搜索到的圖片返回給用戶端。
由上述第三實施例可見,伺服器接收到用戶端發來的圖片搜索請求;伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的圖片;伺服器將所述搜索到的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並在圖片資料庫中搜索與所述選定樣本圖片的特徵值滿足預定要求的圖片;伺服器將所述查找到的圖片返回給用戶端,這樣,可以實現按照用戶意圖來搜索圖片,特別是可以提供用戶搜索關鍵字對應的圖片形狀類型,進而按照用戶所選擇的形狀類型搜索類似形狀的圖片,從而可以滿足用戶的搜索需求,提高用戶的體驗。
為解決上述技術問題,本發明第三實施例提供的一種實現圖片搜索的方法是這樣實現的:一種實現圖片搜索的方法,包括:伺服器接收到用戶端發來的圖片搜索請求;伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的圖片;伺服器將所述查找到的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並將圖片資料庫中該形狀類型的圖片返回給用戶端。
由上述第四實施例可見,伺服器接收到用戶端發來的圖片搜索請求;伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的圖片;伺服器將所述查找到的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並將圖片資料庫中該形狀類型的圖片返回給用戶端,這樣,可以實現按照用戶意圖來搜索圖片,特別是可以提供用戶搜索關鍵字對應的圖片形狀類型,進而按照用戶所選擇的形狀類型返回該形狀的圖片,從而可以滿足用戶的搜索需求,提高用戶的體驗。
為解決上述技術問題,本發明提供一種實現圖片搜索的伺服器第一實施例,是這樣實現的:一種實現圖片搜索的伺服器,包括:圖片資料庫,其中存有圖片,對於對應同一關鍵字的圖片,預先被按照圖片中物體的形狀分類,且每一形狀類型具有選定的樣本圖片;搜索請求接收單元,用於接收用戶端發來的圖片搜索請求;樣本圖片返回單元,用於在圖片資料庫中查找所述搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;選定圖片接收單元,用於接收用戶端選定的某種形狀類型的樣本圖片;搜索單元,用於在圖片資料庫中搜索對應所述關鍵字的且與所述選定樣本圖片的特徵值滿足預定要求的圖片;搜索結果返回單元,用於將所述搜索到的圖片返回給用戶端。
為解決上述技術問題,本發明提供一種實現圖片搜索的伺服器第二實施例,是這樣實現的:一種實現圖片搜索的伺服器,包括:圖片資料庫,其中存有圖片,對於對應同一關鍵字的圖片,預先被按照圖片中物體的形狀分類,且每一形狀類型具有選定的樣本圖片;搜索請求接收單元,用於接收用戶端發來的圖片搜索請求;樣本圖片返回單元,用於在圖片資料庫中查找所述搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;選定圖片接收單元,用於接收用戶端選定的某種形狀類型的樣本圖片;搜索結果返回單元,用於返回與提交的樣本圖片同一或近似形狀類型的圖片資料庫中的圖片。
為解決上述技術問題,本發明提供一種實現圖片搜索的伺服器第三實施例,是這樣實現的:一種實現圖片搜索的伺服器,包括:圖片資料庫,其中存有圖片;搜索請求接收單元,用於接收用戶端發來的圖片搜索請求;查找單元,用於在圖片資料庫查找所述搜索請求中的關鍵字對應的圖片;分類單元,用於將所述查找到的圖片按照圖片中物體的形狀進行分類;樣本圖片返回單元,用於為分類單元分類的每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;選定圖片接收單元,用於接收用戶端選定的某種形狀類型的樣本圖片;搜索單元,用於在圖片資料庫中搜索對應所述關鍵字的且與所述選定樣本圖片的特徵值滿足預定要求的圖片;搜索結果返回單元,用於返回搜索到的圖片。
為解決上述技術問題,本發明提供一種實現圖片搜索的伺服器第四實施例,是這樣實現的:一種實現圖片搜索的伺服器,包括:圖片資料庫,其中存有圖片;搜索請求接收單元,用於接收用戶端發來的圖片搜索請求;查找單元,用於在圖片資料庫查找所述搜索請求中的關鍵字對應的圖片;分類單元,用於將所述查找到的圖片按照圖片中物體的形狀進行分類;樣本圖片返回單元,用於為分類單元分類的每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;選定圖片接收單元,用於接收用戶端選定的某種形狀類型的樣本圖片;搜索結果返回單元,用於返回與提交的樣本圖片同一或近似形狀類型的圖片資料庫中的圖片。
本發明實施例提供一種實現圖片搜索的方法及網站伺服器。
為了使本技術領域的人員更好地理解本發明中的技術方案,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都應當屬於本發明保護的範圍。
以下介紹本發明實現圖片搜索的方法第一實施例。
為了實現本發明第一方法實施例中的圖片搜索,網站伺服器需要在圖片資料庫中預先根據關鍵字將對應的圖片按照圖片中物體的形狀進行分類。
網站伺服器中具有存儲圖片資料的圖片資料庫,這個圖片資料庫中存儲的圖片,可以是登陸該網站的用戶上傳的圖片,也可以是從其他系統中的導入的圖片,還可以是通過網路爬蟲從海量的網際網路網頁中抓取得到,還可能以其他方式得到的圖片,再或者是上述幾種來源中的一種或幾種方式結合而來的圖片,本發明中並不做限定。網路爬蟲定時抓取網際網路中的海量網頁圖片的技術已是公知的技術,這裏不再介紹。每個存儲的圖片,還包括圖片的檔案名以及圖片屬性中附屬的文本內容。圖片的檔案名及圖片屬性中附屬的文本內容,都可以用來表示圖片中特定的內容。如圖片中顯示內容為mp3播放器實體的圖片,該圖片的檔案名和/或圖片屬性中附屬的文本內容,一般都會包括“mp3”這一內容。
網站伺服器可以預先從圖片資料庫中提取出一定數量的具有同一文本關鍵字的圖片,例如將圖片檔案名和/或圖片屬性中附屬的文本內容中包括“mp3”這一關鍵字的圖片提取出1000張。需要指出的是,該提取的圖片,可以是網站伺服器記錄的用戶點擊數量最多的1000張圖片,從而可以保證提取出的圖片的典型性。
進而,網站伺服器可以對提取出的圖片按照圖片的形狀特徵進行分類,例如分為典型的幾種形狀類型。仍以上述的mp3圖片為例,在提取的1000張關於mp3的圖片中,可以按照形狀將這1000張圖片分類為幾種形狀類型,如可以包括顯示圓形mp3的圖片,顯示菱形mp3的圖片,顯示方形mp3的圖片,以及顯示長方形mp3的圖片這幾種類型。
關於將圖片按照形狀類型進行分類,具體的,可以通過比較圖片的特徵值來實現將圖片按照形狀類型進行分類。
該特徵值,是將圖像中能夠反映所顯示物體形狀的特徵通過數學方式提取並表達出來。現有技術中,已有若干種提取圖像形狀特徵的方案。圖片提取出的特徵值,一般可以表示為一定維度的向量,如(P1,P2,...,Pn),這個n維向量,從而可以用該向量來描述圖像中物體的形狀特徵。具體的提取方式,可以採取現有的圖像特徵提取方式,如採用Hough變換等方式的圖像特徵提取,在此不再介紹。另外,以下簡單介紹一種較優的圖像特徵提取的方式,可以包括下面步驟:
A1:從原始圖像中摳出所含物體的圖像;
A2:將所述撥出的圖像用單一顏色為背景填充邊界,並使得填充後的圖像成為最小正方形;
A3:將正方形圖像全圖等比縮放為第一預定大小的圖像,將縮放後的圖像分割為第二預定大小的子圖像塊;
A4:分別計算子圖像塊水準、豎直、正45°、負45°方向上相鄰圖元的亮度導數,將分別在四個方向導數極值點的個數、以及位於子圖像塊四個邊界上極值點的總個數作為該子圖像塊的特徵向量;
A5:將所有子圖像塊的特徵向量作為原始圖像的特徵向量。
上述圖像特徵提取方式,主要利用了圖像中顯示的物體其邊緣部分與周圍的背景等的圖元亮度差異來找出物體的邊緣,也就可以提取得到圖像中物體的形狀特徵,從而可以作為該圖像提取的特徵。該方式表示的圖像特徵為一定維度的向量,如(P1,P2,...,Pn),這個n維向量,從而可以用該向量來描述圖像中物體的形狀特徵。
無論何種方式,都可以使得圖片具有表明其所顯示物體形狀的特徵值。
例如,對於上述提取出包含文本“mp3”的圖片,如最好得到的1000張圖片,可以由伺服器比較這1000張圖片的特徵值,將特徵值相近的圖片劃分為同一或近似形狀類型的圖片。具體的,可以設定預定距離,將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片。
所述特徵值之差,可以通過對表明特徵值的向量求距離來獲得。
對於二維平面上的點A1(x1,y1)和A2(x2,y2),這兩個點的距離可以由公式得到。而這兩個點A1和A2的座標,即(x1,y1)和(x2,y2),即可以視為兩個二維向量。對於三維座標中的點B1(x1,y1,z1)和B2(x2,y2,z2),這兩個點的距離可以由公式得到。而這兩個點B1和B2的座標,即(x1,y1,z1)和(x2,y2,z2),即可以視為兩個三維向量。類似的,對於兩個n維的向量,這兩個向量的距離,可以通過公式得到,其中,兩個向量分別為(P1,P2,...,Pn),(Q1,Q2,...,Qn)。
這樣,就得到了這1000張涉及“mp3”的圖片的幾種典型形狀,對於每種典型形狀,可以選取一張圖片作為該典型形狀的樣本圖片。該樣本圖片,可以是由網站維護人員指定的該形狀類型中的一張圖片,也可以是由伺服器按照一定的標準指定的該形狀類型中的一張圖片,這裏並不限定。對於選取的樣本圖片,可以為其做標記,以方便後續返回該標記的樣本圖片。
另外,該作為典型形狀的樣本圖片,其特徵值也可以得到,如前述已經計算得出的每一圖片的特徵值。
需要說明的是,上面對於同一文本關鍵字涉及的圖片所劃分的形狀類型,是由伺服器來執行實現。此外,還可以是由人工來實現。
如,在提取得到涉及“mp3”的1000張圖片後,可以由網站的工作人員人工得出這1000張圖片的幾種典型形狀類型的樣本圖片。甚至可以直接由網站工作人員從涉及“mp3”的若干張圖片中挑選出幾種典型形狀類型的圖片。
進一步,網站伺服器接收該指定的樣本圖片後,可以提取出該樣本圖片的特徵值。
預先對圖片資料庫中關鍵字涉及的圖片完成劃分形狀類型,還可以由網站工作人員人工對樣本圖片排序,例如將更可能成為搜索目的的形狀類型的樣本圖片排在靠前的位置。還可以由網站伺服器對樣本圖片排序,例如將包含的圖片數量多的形狀類型所對應的樣本圖片排在靠前的位置。
在預先對圖片資料庫中關鍵字涉及的圖片完成劃分形狀類型,並為每一形狀類型選定樣本圖片基礎上,當伺服器接收到用戶端發來的圖片搜索請求之後,本發明實現圖片搜索的方法第一實施例可以按照如圖1所示的流程,包括:步驟110:伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端。
伺服器接收用戶端發來的圖片搜索請求之後,首先在圖片資料中進行查找,具體的,查找所述搜索請求中的關鍵字在圖片資料庫中對應的預先分類的幾種形狀類型的樣本圖片,如查找圖片資料庫中包含所述搜索請求中的關鍵字的預先分類的幾種形狀類型的樣本圖片。這裏的“幾種”,一方面可以取決於實際對關鍵字對應圖片的按形狀分類情況,也就是說可以與該分類的數量相等;另一方面,也可以是按照形狀分類數量中的一部分類別。並且,這裏的“幾種”,僅取決於按形狀分類的情況,但是,分成幾類(當然通常會大於等於2種),實際上對本實施例的實施並沒有影響。另外,這裏的“幾種”可以為預定個數。
由於圖片資料庫中已經預先將檔案名和/或圖片屬性中附屬的文本內容包含某一關鍵字的圖片按照如前述所說的方式進行按形狀類型分類,並已為分類的形狀類型選取了樣本圖片,因此,對於接收到的搜索請求中的關鍵字,如果與圖片資料庫中的前述處理中涉及的某一關鍵字相同,或存在包含關係等,如搜索請求中的關鍵字包含於預先進行前述處理涉及的某一關鍵字中,或預先進行前述處理涉及的某一關鍵字包含於搜索請求中的關鍵字中,則,伺服器可以容易的查找到與搜索請求中的關鍵字相同,或存在包含關係的圖片資料庫中預先分類的幾種形狀類型的樣本圖片。進而,伺服器可將查找到的幾種形狀類型的樣本圖片返回給用戶端,以提供用戶端的選擇,從而選定用戶期望查找的圖片的形狀類型。
步驟120:伺服器接收用戶端選定的某種形狀類型的樣本圖片,並在圖片資料庫中搜索對應所述關鍵字的且與所述選定樣本圖片的特徵值滿足預定要求的圖片。
用戶在伺服器返回的網頁頁面上,可以看到幾種形狀類型的樣本圖片,用戶出於搜索目的,可以進一步選定某種形狀類型的樣本圖片,以表明用戶的搜索意圖為搜索該選定形狀類型的圖片。
伺服器接收到用戶選定的某種形狀類型的樣本圖片後,在圖片資料庫中搜索對應所述關鍵字的且與所述選定樣本圖片的特徵值滿足預定要求的圖片。具體的,對於圖片特徵值為向量形式時,可以在圖片資料庫中搜索與選定圖片的特徵值向量的距離低於預定閾值的圖片。
與前述類似的,該具體的搜索方式,可以通過計算選定圖片的特徵值向量與圖片資料庫中圖片的特徵值向量的舉例來進行。前述提到,對於兩個n維的向量,這兩個向量的距離,可以通過公式得到,其中,兩個向量分別為(P1,P2,...,Pn),(Q1,Q2,...,Qn)。設(P1,P2,...,Pn)為選定圖片的特徵值向量,(Q1,Q2,...,Qn)為圖片資料庫中的某一圖片的特徵值向量。則通過上述公式可以得出兩者的距離。一般地,距離為0的圖片為同一形狀的圖片,距離在一定範圍限度內,可以被認為是近似形狀的圖片。這個範圍,可以通過所述的預定閾值來設定。例如,將閾值設為10,則表明,與選定圖片的特徵值向量距離在10以內的圖片,都作為搜索結果,即與選定圖片相同或近似形狀的圖片,從而之後可以將圖片資料庫中這些與選定圖片相同形狀的圖片返回給用戶端。
在圖片資料庫中搜索對應所述關鍵字的且與所述選定樣本圖片的特徵值滿足預定要求的圖片,可以是在圖片資料庫中搜索出與所述選定樣本圖片的特徵值滿足預定要求的圖片之後,再將搜索出的圖片過濾出檔案名和/或圖片屬性中附屬的文本內容包含所述關鍵字的圖片。當然,也可以是先在圖片資料庫中搜索出檔案名和/或圖片屬性中附屬的文本內容包含所述關鍵字的圖片,再在搜索出的所述關鍵字對應的圖片中搜索與所述選定樣本圖片的特徵值滿足預定要求的圖片。
步驟130:伺服器將所述搜索到的圖片返回給用戶端。
經過該步驟,用戶端所顯示的搜索結果,都是滿足用戶搜索意願的圖片。如用戶提出關鍵字為“mp3”的搜索請求,由於步驟120中用戶可以在伺服器返回的集中形狀類型中選擇某種特定形狀的mp3,如圓形,於是,步驟130中用戶端接收的搜索結果,都是關於圓形的mp3圖片。
伺服器將所述搜索到的圖片,按照點擊次數由多至少的順序返回給用戶端。一般,圖片資料庫中對圖片還將記錄該圖片的點擊次數(或訪問次數),容易理解的,點擊次數多的為用戶經常關注的,反之,為用戶較不易關注的。那麼,優先返回點擊次數多的圖片,將更容易滿足用戶的搜索需求。
需要補充的是,步驟130後,用戶端通常還會點擊搜索到的圖片中的某一具體的圖片,則伺服器還可以記錄用戶端點擊的該具體的圖片,從而對該圖片,伺服器可以累計其點擊量(或稱訪問量)。從而,前述提到的網站伺服器提取的某關鍵字用戶點擊數量最多的若干張圖片,其中提到的圖片的點擊量,可以是伺服器累計的用戶端點擊量。這樣,用戶端對圖片的訪問與伺服器預先對某一關鍵字按照圖片點擊量的提取,可以構成自回饋系統。下述例子中與此類似。
由上述第一實施例可見,當伺服器接收到用戶端發來的圖片搜索請求之後,伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並在圖片資料庫中搜索與所述選定樣本圖片的特徵值滿足預定要求的圖片;伺服器將所述搜索到的圖片返回給用戶端,可以實現按照用戶意圖來搜索圖片,特別是可以實現提供用戶搜索關鍵字對應的圖片形狀類型,進而按照用戶所選擇的形狀類型搜索類似形狀的圖片,從而可以滿足用戶的搜索需求,提高用戶的體驗。
上述實施例中,需要說明的是,所述預先提取具有典型形狀的樣本圖片,目的是提取出圖片資料庫中的涉及某一關鍵字的幾種典型形狀的圖片,而這些典型形狀,一般在一段長的時間內是不會改變的,因此可以間隔較長的週期執行一次。而圖片資料庫中的資料,由於用戶上傳圖片的時間不確定性,以及網路爬蟲在網際網路中高頻率的抓取,伺服器當接收到用戶的搜索請求後,都要在步驟120中立即執行對圖片資料庫中圖片的搜索,以確保搜索物件包括最新的圖片,進而才可能在搜索結果中包含最新的圖片。
以下介紹本發明實現圖片搜索的方法第二實施例。需要說明的是,以下第二方法實施例著重介紹與第一實施例的不同之處,而相類似之處,還須參考第一方法實施例中的相關記載。
為了實現本發明第二方法實施例中的圖片搜索,網站伺服器需要在圖片資料庫中預先根據關鍵字將對應的圖片按照圖片中物體的形狀進行分類。
如前所述,網站伺服器中具有存儲圖片資料的圖片資料庫,這個圖片資料庫中存儲的圖片,可以是登陸該網站的用戶上傳的圖片,也可以是從其他系統中導入的圖片,還可以是通過網路爬蟲從海量的網際網路網頁中抓取得到,還可能以其他方式得到的圖片,再或者是上述幾種來源中的一種或幾種方式結合而來的圖片。每個存儲的圖片,還包括圖片的檔案名以及圖片屬性中附屬的文本內容。
網站伺服器可以預先對圖片資料庫中的圖片按照預定義的關鍵字進行分類,例如將圖片檔案名和/或圖片屬性中附屬的文本內容中包括“mp3”這一關鍵字的圖片分為一類,而將圖片檔案名和/或圖片屬性中附屬的文本內容中包括其他關鍵字的圖片分為另一類。
進一步的,網站伺服器可以對提取出的一類關鍵字對應的圖片按照圖片的形狀特徵進行分類,例如分為典型的幾種形狀類型。仍以上述關鍵字為mp3的圖片為例,在關鍵字為mp3的這一類圖片中,可以按照形狀將這些圖片分類為幾種形狀類型,如可以包括顯示圓形mp3的圖片,顯示菱形mp3的圖片,顯示方形mp3的圖片,以及顯示長方形mp3的圖片這幾種類型。
關於將圖片按照形狀類型進行分類,具體的,可以通過比較圖片的特徵值來實現將圖片按照形狀類型進行分類。
該特徵值,是將圖像中能夠反映所顯示物體形狀的特徵通過數學方式提取並表達出來。現有技術中,已有若干種提取圖像形狀特徵的方案。圖片提取出的特徵值,一般可以表示為一定維度的向量,如(P1,P2,...,Pn),這個n維向量,從而可以用該向量來描述圖像中物體的形狀特徵。具體的提取方式,可以採取現有的圖像特徵提取方式,如採用Hough變換等方式的圖像特徵提取,或者採用前述A1至A5提到的圖像特徵提取的方式,這裏不再重複。
例如,對於上述圖片資料庫中包含文本“mp3”的圖片,可以由伺服器比較這些張圖片的特徵值,將特徵值相近的圖片劃分為同一或近似形狀類型的圖片。具體的,可以設定預定距離,將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片。
所述特徵值之差,可以通過對表明特徵值的向量求距離來獲得。如前所述的,對於兩個n維的向量,這兩個向量的距離,可以通過公式得到,其中,兩個向量分別為(P1,P2,...,Pn),(Q1,Q2,...,Qn)。
這樣,就得到了圖片資料庫中涉及“mp3”的圖片的幾種典型形狀,對於每種典型形狀,可以選取一張圖片作為該典型形狀的樣本圖片。
進一步,網站伺服器接收該指定的樣本圖片後,可以提取出該樣本圖片的特徵值。
預先對圖片資料庫中關鍵字涉及的圖片完成劃分形狀類型,還可以由網站工作人員人工對樣本圖片排序,例如將更可能為搜索目的的形狀類型的樣本圖片排在靠前的位置。還可以由網站伺服器對樣本圖片排序,例如將包含的圖片數量多的形狀類型所對應的樣本圖片排在靠前的位置。
在預先對圖片資料庫中關鍵字涉及的圖片完成劃分形狀類型,並為每一形狀類型選定樣本圖片基礎上,當伺服器接收到用戶端發來的圖片搜索請求之後,本發明實現圖片搜索的方法第二實施例可以按照如圖2所示的流程,包括:步驟210:伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端。
伺服器接收用戶端發來的圖片搜索請求之後,首先在圖片資料中進行查找,具體的,查找所述搜索請求中的關鍵字在圖片資料庫中對應的預先分類的幾種形狀類型的樣本圖片,如查找圖片資料庫中包含所述搜索請求中的關鍵字的預先分類的幾種形狀類型的樣本圖片。這裏的“幾種”,一方面可以取決於實際對關鍵字對應圖片的按形狀分類情況,也就是說可以與該分類的數量相等;另一方面,也可以是按照形狀分類數量中的一部分類別。並且,這裏的“幾種”,僅取決於按形狀分類的情況,但是,分成幾類(當然通常會大於等於2種),實際上對本實施例的實施並沒有影響。
由於圖片資料庫中已經預先將檔案名和/或圖片屬性中附屬的文本內容包含某一關鍵字的圖片按照如前述所說的方式進行按形狀類型分類,並已為分類的形狀類型選取了樣本圖片,因此,對於接收到的搜索請求中的關鍵字,如果與圖片資料庫中的前述處理中涉及的某一關鍵字相同,或存在包含關係等,如搜索請求中的關鍵字包含於預先進行前述處理涉及的某一關鍵字中,或預先進行前述處理涉及的某一關鍵字包含於搜索請求中的關鍵字中,則,伺服器可以容易的查找到與搜索請求中的關鍵字相同,或存在包含關係的圖片資料庫中預先分類的幾種形狀類型的樣本圖片。進而,伺服器可將將查找到的幾種形狀類型的樣本圖片返回給用戶端,以提供用戶端的選擇,從而選定用戶期望查找的圖片的形狀類型。
步驟220:伺服器接收用戶端選定的某種形狀類型的樣本圖片,並返回與提交的樣本圖片同一或近似形狀類型的圖片資料庫中的圖片。
伺服器將所述搜索到的圖片,按照點擊次數由多至少的順序返回給用戶端。
由上述第二實施例可見,當伺服器接收到用戶端發來的圖片搜索請求之後,伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並返回與提交的樣本圖片同一或近似形狀類型的圖片資料庫中的圖片,這樣,可以實現按照用戶意圖來返回搜索的圖片,特別是可以實現提供用戶搜索關鍵字對應的圖片形狀類型,進而按照用戶所選擇的形狀類型返回搜索的類似形狀的圖片,從而可以滿足用戶的搜索需求,提高用戶的體驗。
上述實施例中,需要說明的是,所述預先處理的環節,伺服器做了大量的工作,如預先在圖片資料庫中按照盡可能多的關鍵字對圖片進行分類,進一步地,需要對一關鍵字涉及的分類圖片在按照形狀類型進行劃分,並為每一形狀提供以樣本圖片。進而,伺服器收到用戶端發來的搜索請求時,可以直接查找圖片資料庫中對圖片分類的關鍵字是否存在搜索請求中的關鍵字相同或相包含的情況,如果存在,則提供用戶端對該關鍵字對應的圖片形狀進行選擇,並將選擇的形狀對應的圖片資料庫中的圖片立即返回給用戶端。該實施例,對於小型網站,如圖片資料庫規模不是特別大,而又並不是頻繁更新的情況,比較方便實用。即使頻繁更新的情況,只要網站伺服器可以同樣頻繁的做預先的處理,仍可以實現同樣的目的。
以下介紹本發明實現圖片搜索的方法第三實施例。圖3示出了該方法實施例的流程圖,如圖,包括:步驟310:伺服器接收到用戶端發來的圖片搜索請求。
用戶端發來的圖片搜索請求,包括文本關鍵字,即請求圖片檔案名或圖片屬性中附屬的文本內容包括該搜索請求中的關鍵字的圖片。
步驟320:伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的圖片。
圖片資料庫中存儲有大量的圖片,如前所述,這些圖片,可以是登陸該網站的用戶上傳的圖片,也可以是從其他系統中的導入的圖片,還可以是通過網路爬蟲從海量的網際網路網頁中抓取得到,還可能以其他方式得到的圖片,再或者是上述幾種來源中的一種或幾種方式結合而來的圖片。
每個存儲的圖片,還包括圖片的檔案名以及圖片屬性中附屬的文本內容。圖片的檔案名和/或圖片屬性中附屬的文本內容,都可以用來表示圖片中特定的內容。如圖片中顯示內容為mp3播放器實體的圖片,該圖片的檔案名和/或圖片屬性中附屬的文本內容,一般都會包括“mp3”這一內容。
步驟310中伺服器接收到用戶端發來的搜索請求後,步驟320中,伺服器以搜索請求中包含的關鍵字對圖片資料庫的圖片進行搜索,具體的,可以搜索圖片資料庫中檔案名和/或圖片屬性中附屬的文本內容包含搜索請求中關鍵字的預定個數的圖片,即在圖片資料庫中查找所述搜索請求中的關鍵字對應的預定個數的圖片。如搜索請求中包括“mp3”這一關鍵字,則可以查找圖片資料庫檔案名和/或圖片屬性中附屬的文本內容包含該關鍵字的1000張圖片。
這裏查找圖片資料庫中所述搜索請求中的關鍵字對應的預定個數的圖片,而不是圖片資料庫中所述搜索請求中的關鍵字對應的全部圖片,是因為該步驟僅僅是為了提取典型的圖片,從而在後續步驟中從這些典型圖片中能夠分類為集中形狀類型,以供後續用戶端選擇後,再以選定的形狀在圖片資料庫中進行大範圍的搜索。於是,該步驟中查找所述關鍵字對應的典型圖片,應當以能得出形狀類型為目的,並且兼顧較短的執行時間,以降低整個搜索過程的時間。為了達到這一目的,圖片資料庫可以優先返回關鍵字對應的訪問次數高的那些圖片。
步驟330:伺服器將所述查找到的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端。
伺服器可以對步驟320中搜索到的圖片按照圖片的形狀特徵進行分類,例如分為典型的幾種形狀類型。仍以的mp3圖片為例,在按關鍵字搜索到的關於mp3的圖片中,可以按照形狀將這些圖片分類為幾種形狀類型,如可以包括顯示圓形mp3的圖片,顯示菱形mp3的圖片,顯示方形mp3的圖片,以及顯示長方形mp3的圖片這幾種類型。
關於將圖片按照形狀類型進行分類,具體的,可以通過比較圖片的特徵值來實現將圖片按照形狀類型進行分類。比較特徵值確定圖片形狀類型的方式,與前述第一方法實施例中類似。
例如,對於上述查找出的包含文本“mp3”的1000張圖片,可以由伺服器比較這1000張圖片的特徵值,將特徵值相近的圖片劃分為同一或近似形狀類型的圖片。具體的,可以設定預定距離,將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片。
所述特徵值之差,可以通過對表明特徵值的向量求距離來獲得。這一點也與前述類似。
之後,可以為每種典型形狀選取一張圖片作為該典型形狀的樣本圖片。進而,伺服器將預定個數的形狀類型的樣本圖片返回給用戶端。
步驟340:伺服器接收用戶端選定的某種形狀類型的樣本圖片,並在圖片資料庫中搜索對應所述關鍵字的且與所述選定樣本圖片的特徵值滿足預定要求的圖片。
用戶端接收到步驟330中伺服器發來的預定個數個形狀類型的樣本圖片,用戶可圖選擇其中的某個樣本圖片,從而表明用戶對前述的關鍵字,意圖搜索其中具有某種特定形狀的圖片結果,而該特定形狀即為用戶選定的樣本圖片所代表的形狀類型。用戶提交選中的樣本圖片後,通過網路提交到伺服器。
伺服器接收到用戶端選定的某種形狀類型的樣本圖片後,以該選定的樣本圖片在圖片資料庫中搜索,具體的,在圖片資料庫中搜索對應所述關鍵字的且與所述選定樣本圖片的特徵值滿足預定要求的圖片。對於圖片特徵值為向量形式時,可以在圖片資料庫中搜索與選定圖片的特徵值向量的距離低於預定閾值的圖片。
與前述類似的,該具體的搜索方式,可以通過計算選定圖片的特徵值向量與圖片資料庫中圖片的特徵值向量的舉例來進行。前述提到,對於兩個n維的向量,這兩個向量的距離,可以通過公式得到,其中,兩個向量分別為(P1,P2,...,Pn),(Q1,Q2,...,Qn)。設(P1,P2,...,Pn)為選定圖片的特徵值向量,(Q1,Q2,...,Qn)為圖片資料庫中的某一圖片的特徵值向量。則通過上述公式可以得出兩者的距離。一般地,距離為0的圖片為同一形狀的圖片,距離在一定範圍限度內,可以被認為是近似形狀的圖片。這個範圍,可以通過所述的預定閾值來設定。例如,將閾值設為10,則表明,與選定圖片的特徵值向量距離在10以內的圖片,都作為搜索結果,即與選定圖片相同形狀的圖片,從而之後可以將圖片資料庫中這些與選定圖片相同形狀的圖片返回給用戶端。
在圖片資料庫中搜索對應所述關鍵字的且與所述選定樣本圖片的特徵值滿足預定要求的圖片,可以是在圖片資料庫中搜索出與所述選定樣本圖片的特徵值滿足預定要求的圖片之後,再將搜索出的圖片過濾出檔案名和/或圖片屬性中附屬的文本內容包含所述關鍵字的圖片。當然,也可以是先在圖片資料庫中搜索出檔案名和/或圖片屬性中附屬的文本內容包含所述關鍵字的圖片,再在搜索出的所述關鍵字對應的圖片中搜索與所述選定樣本圖片的特徵值滿足預定要求的圖片。
步驟350:伺服器將所述搜索到的圖片返回給用戶端。
經過該步驟,用戶端所顯示的搜索結果,都是滿足用戶搜索意願的圖片。如用戶提出關鍵字為“mp3”的搜索請求,由於步驟120中用戶可以在伺服器返回的集中形狀類型中選擇某種特定形狀的mp3,如圓形,於是,步驟130中用戶端接收的搜索結果,都是關於圓形的mp3圖片。
伺服器將所述搜索到的圖片,按照點擊次數由多至少的順序返回給用戶端。
由上述第三實施例可見,伺服器接收到用戶端發來的圖片搜索請求;伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的圖片;伺服器將所述搜索到的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並在圖片資料庫中搜索與所述選定樣本圖片的特徵值滿足預定要求的圖片;伺服器將所述查找到的圖片返回給用戶端,這樣,可以實現按照用戶意圖來搜索圖片,特別是可以提供用戶搜索關鍵字對應的圖片形狀類型,進而按照用戶所選擇的形狀類型搜索類似形狀的圖片,從而可以滿足用戶的搜索需求,提高用戶的體驗。
該第三實施例,對於圖片資料庫較為龐大的情況,需要伺服器具有較高的軟硬體存取速度及處理能力。
以下介紹本發明實現圖片搜索的方法第三實施例。圖4示出了該方法實施例的流程圖,如圖,包括:步驟410:伺服器接收到用戶端發來的圖片搜索請求。
用戶端發來的圖片搜索請求,包括文本關鍵字,即請求圖片檔案名或圖片屬性中附屬的文本內容包括該搜索請求中的關鍵字的圖片。
步驟420:伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的圖片。
圖片資料庫中存儲有大量的圖片,如前所述,這些圖片,可以是登陸該網站的用戶上傳的圖片,也可以是從其他系統中的導入的圖片,還可以是通過網路爬蟲從海量的網際網路網頁中抓取得到,還可能以其他方式得到的圖片,再或者是上述幾種來源中的一種或幾種方式結合而來的圖片。
每個存儲的圖片,還包括圖片的檔案名以及圖片屬性中附屬的文本內容。圖片的檔案名和/或圖片屬性中附屬的文本內容,都可以用來表示圖片中特定的內容。如圖片中顯示內容為mp3播放器實體的圖片,該圖片的檔案名和/或圖片屬性中附屬的文本內容,一般都會包括“mp3”這一內容。
步驟430:伺服器將所述查找到的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端。
伺服器可以對步驟420中搜索到的圖片按照圖片的形狀特徵進行分類,例如分為典型的幾種形狀類型。仍以的mp3圖片為例,在按關鍵字搜索到的關於mp3的圖片中,可以按照形狀將這些圖片分類為幾種形狀類型,如可以包括顯示圓形mp3的圖片,顯示菱形mp3的圖片,顯示方形mp3的圖片,以及顯示長方形mp3的圖片這幾種類型。
關於將圖片按照形狀類型進行分類,具體的,可以通過比較圖片的特徵值來實現將圖片按照形狀類型進行分類。比較特徵值確定圖片形狀類型的方式,與前述第一方法實施例中類似。
例如,對於上述查找出的包含文本“mp3”的圖片,可以由伺服器比較這些圖片的特徵值,將特徵值相近的圖片劃分為同一或近似形狀類型的圖片。具體的,可以設定預定距離,將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片。
所述特徵值之差,可以通過對表明特徵值的向量求距離來獲得。這一點也與前述類似。
之後,可以為每種典型形狀選取一張圖片作為該典型形狀的樣本圖片。進而,伺服器將預定個數的形狀類型的樣本圖片返回給用戶端。
進一步的,伺服器可以僅從與所述搜索請求中的關鍵字對應的圖片中提取一定數量的圖片,例如,只提取1000張圖片,然後對該1000張圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端。這樣可以提高搜索的效率。
步驟440:伺服器接收用戶端選定的某種形狀類型的樣本圖片,並將圖片資料庫中該形狀類型的圖片返回給用戶端。
用戶端接收到步驟430中伺服器發來的預定個數個形狀類型的樣本圖片,用戶可圖選擇其中的某個樣本圖片,從而表明用戶對前述的關鍵字,意圖搜索其中具有某種特定形狀的圖片結果,而該特定形狀即為用戶選定的樣本圖片所代表的形狀類型。用戶提交選中的樣本圖片後,通過網路提交到伺服器。
伺服器接收到用戶端選定的某種形狀類型的樣本圖片後,由於前述步驟430中已對查找到的關鍵字對應的圖片進行了分類,而對於用戶選定的樣本圖片,其形狀類型中包含的圖片已經被劃分出來,因此,該步驟440,可以直接返回該形狀類型對應的圖片。
如用戶端選定的為圓形的mp3,則由於前述步驟中伺服器已將查找到的mp3分為了多個形狀類型,其中包含圓形mp3,因此,該步驟中,伺服器可以將分類為圓形mp3的圖片返回給用戶端。伺服器最終返回給用戶端的圖片,可以按照點擊次數由多至少的順序返回。
由上述第四實施例可見,伺服器接收到用戶端發來的圖片搜索請求;伺服器在圖片資料庫中查找所述搜索請求中的關鍵字對應的圖片;伺服器將所述查找到的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並將圖片資料庫中該形狀類型的圖片返回給用戶端,這樣,可以實現按照用戶意圖來搜索圖片,特別是可以提供用戶搜索關鍵字對應的圖片形狀類型,進而按照用戶所選擇的形狀類型返回該形狀的圖片,從而可以滿足用戶的搜索需求,提高用戶的體驗。
該第四實施例,適用於圖片資料庫規模不是很大的情況,從而將所述查找到的圖片按照圖片中物體的形狀進行分類不會佔用整個搜索過程太長的時間。當然,伺服器具有較高的軟硬體存取速度及處理能力也是影響搜索效率的重要因素。
以下介紹本發明實現圖片搜索的伺服器第一實施例,圖5示出了該實施例的框圖,如圖5,包括:圖片資料庫51,其中存有圖片,對於對應同一關鍵字的圖片,預先被按照圖片中物體的形狀分類,且每一形狀類型具有選定的樣本圖片;搜索請求接收單元52,用於接收用戶端發來的圖片搜索請求;樣本圖片返回單元53,用於在圖片資料庫中查找所述搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;選定圖片接收單元54,用於接收用戶端選定的某種形狀類型的樣本圖片;搜索單元55,用於在圖片資料庫中搜索對應所述關鍵字的且與所述選定樣本圖片的特徵值滿足預定要求的圖片;搜索結果返回單元56,用於將所述搜索到的圖片返回給用戶端。
最好,所述實現圖片搜索的伺服器,還可以包括排序單元57,用於對圖片資料庫中選定的樣本圖片排序,例如將包含的圖片數量多的形狀類型所對應的樣本圖片排在靠前的位置。
最好,所述圖片資料庫中的圖片,包括上傳的圖片和/或通過網路爬蟲從海量的網際網路網頁中抓取得到的圖片。
最好,所述實現圖片搜索的伺服器,還包括分類單元58,用於通過比較圖片的特徵值實現對圖片資料庫中的圖片按照圖片中物體的形狀分類。
最好,所述比較圖片的特徵值,包括將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片。
最好,所述滿足預定要求的圖片包括圖片資料庫中與選定圖片的特徵值向量的距離低於預定閾值的圖片。
利用該伺服器實施例實現圖片搜索的方法,與前述第一方法實施例類似,每個單元的具體執行以及各個單元間的交互也與前述第四方法實施例類似,在此不再贅述。
以下介紹本發明實現圖片搜索的伺服器第二實施例,圖6示出了該實施例的框圖,如圖6,包括:圖片資料庫61,其中存有圖片,對於對應同一關鍵字的圖片,預先被按照圖片中物體的形狀分類,且每一形狀類型具有選定的樣本圖片;搜索請求接收單元62,用於接收用戶端發來的圖片搜索請求;樣本圖片返回單元63,用於在圖片資料庫中查找所述搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;選定圖片接收單元64,用於接收用戶端選定的某種形狀類型的樣本圖片;搜索結果返回單元65,用於返回與提交的樣本圖片同一或近似形狀類型的圖片資料庫中的圖片。
利用該伺服器實施例實現圖片搜索的方法,與前述第二方法實施例類似,每個單元的具體執行以及各個單元間的交互也與前述第四方法實施例類似,在此不再贅述。
以下介紹本發明實現圖片搜索的伺服器第三實施例,圖7示出了該實施例的框圖,如圖7,包括:圖片資料庫71,其中存有圖片;搜索請求接收單元72,用於接收用戶端發來的圖片搜索請求;查找單元73,用於在圖片資料庫查找所述搜索請求中的關鍵字對應的圖片;分類單元74,用於將所述查找到的圖片按照圖片中物體的形狀進行分類;樣本圖片返回單元75,用於為分類單元分類的每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;選定圖片接收單元76,用於接收用戶端選定的某種形狀類型的樣本圖片;搜索單元77,用於在圖片資料庫中搜索對應所述關鍵字的且與所述選定樣本圖片的特徵值滿足預定要求的圖片;搜索結果返回單元78,用於返回搜索到的圖片。
利用該伺服器實施例實現圖片搜索的方法,與前述第三方法實施例類似,每個單元的具體執行以及各個單元間的交互也與前述第四方法實施例類似,在此不再贅述。
以下介紹本發明實現圖片搜索的伺服器第四實施例,圖8示出了該實施例的框圖,如圖8,包括:圖片資料庫81,其中存有圖片;搜索請求接收單元82,用於接收用戶端發來的圖片搜索請求;查找單元83,用於在圖片資料庫查找所述搜索請求中的關鍵字對應的圖片;分類單元84,用於將所述查找到的圖片按照圖片中物體的形狀進行分類;樣本圖片返回單元85,用於為分類單元分類的每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;選定圖片接收單元86,用於接收用戶端選定的某種形狀類型的樣本圖片;搜索結果返回單元87,用於返回與提交的樣本圖片同一或近似形狀類型的圖片資料庫中的圖片。
利用該伺服器實施例實現圖片搜索的方法,與前述第四方法實施例類似,每個單元的具體執行以及各個單元間的交互也與前述第四方法實施例類似,在此不再贅述。
為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本發明時可以把各單元的功能在同一個或多個軟體和/或硬體中實現。
通過以上的實施方式的描述可知,本領域的技術人員可以清楚地瞭解到本發明可借助軟體加必需的通用硬體平臺的方式來實現。基於這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來,該電腦軟體產品可以存儲在存儲介質中,如ROM/RAM、磁碟、光碟等,包括若干指令用以使得一台電腦設備(可以是個人電腦,伺服器,或者網路設備等)執行本發明各個實施例或者實施例的某些部分所述的方法。
本說明書中的各個實施例均採用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
本發明可用於眾多通用或專用的計算系統環境或配置中。例如:個人電腦、伺服器電腦、手持設備或可擕式設備、平板型設備、多處理器系統、基於微處理器的系統、置頂盒、可編程的消費電子設備、網路PC、小型電腦、大型電腦、包括以上任何系統或設備的分散式計算環境等等。
本發明可以在由電腦執行的電腦可執行指令的一般上下文中描述,例如程式模組。一般地,程式模組包括執行特定任務或實現特定抽象資料類型的常式、程式、物件、元件、資料結構等等。也可以在分散式計算環境中實踐本發明,在這些分散式計算環境中,由通過通信網路而被連接的遠端處理設備來執行任務。在分散式計算環境中,程式模組可以位於包括存儲設備在內的本地和遠端電腦存儲介質中。
雖然通過實施例描繪了本發明,本領域普通技術人員知道,本發明有許多變形和變化而不脫離本發明的精神,希望所附的權利要求包括這些變形和變化而不脫離本發明的精神。
51...圖片資料庫
52...搜索請求接收單元
53...樣本圖片返回單元
54...選定圖片接收單元
55...搜索單元
56...搜索結果返回單元
57...排序單元
58...分類單元
61...圖片資料庫
62...搜索請求接收單元
63...樣本圖片返回單元
64...選定圖片接收單元
65...搜索結果返回單元
71...圖片資料庫
72...搜索請求接收單元
73...查找單元
74...分類單元
75...樣本圖片返回單元
76...選定圖片接收單元
77...搜索單元
78...搜索結果返回單元
81...圖片資料庫
82...搜索請求接收單元
83...查找單元
84...分類單元
85...樣本圖片返回單元
86...選定圖片接收單元
87...搜索結果返回單元
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明中記載的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明實現圖片搜索的方法第一實施例的流程圖;
圖2為本發明實現圖片搜索的方法第二實施例的流程圖;
圖3為本發明實現圖片搜索的方法第三實施例的流程圖;
圖4為本發明實現圖片搜索的方法第四實施例的流程圖;
圖5為本發明實現圖片搜索的伺服器第一實施例的框圖;
圖6為本發明實現圖片搜索的伺服器第二實施例的框圖;
圖7為本發明實現圖片搜索的伺服器第三實施例的框圖;
圖8為本發明實現圖片搜索的伺服器第四實施例的框圖。

Claims (18)

  1. 一種實現圖片搜索的方法,其特徵在於,在圖片資料庫中預先根據關鍵字將對應的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片;當伺服器接收到用戶端發來的圖片搜索請求之後,該方法包括:伺服器在圖片資料庫中查找該搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並在圖片資料庫中搜索對應該關鍵字的且與選定樣本圖片的特徵值滿足預定要求的圖片;以及伺服器將搜索到的圖片返回給用戶端,其中,將圖片按照圖片中物體的形狀進行分類,包括:通過比較圖片的特徵值將圖片按照形狀類型進行分類,其中,通過比較圖片的特徵值將圖片按照形狀類型進行分類,包括:比較圖片的特徵值,將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片,其中,所述特徵值之差,可以通過對表明特徵值的向 量求距離的公式來獲得。
  2. 如申請專利範圍第1項的方法,其中,在圖片資料庫中預先根據關鍵字將對應的圖片按照圖片中物體的形狀進行分類,是預先從圖片資料庫中提取出一定數量的具 有同一關鍵字的圖片。
  3. 如申請專利範圍第1或2項的方法,其中,為每一形狀類型選定樣本圖片之後,還包括:對樣本圖片排序。
  4. 如申請專利範圍第1或2項的方法,其中,該圖片資料庫中的圖片,包括上傳的圖片和/或通過網路爬蟲從網際網路網頁中抓取得到的圖片。
  5. 如申請專利範圍第1或2項的方法,其中,在圖片資料庫中搜索與該選定樣本圖片的特徵值滿足預定要求的圖片,包括:在圖片資料庫中搜索與選定圖片的特徵值向量的距離低於預定閾值的圖片。
  6. 如申請專利範圍第1或2項的方法,其中,伺服器將該搜索到的圖片返回給用戶端,包括:伺服器將搜索到的圖片按照點擊次數由多至少的順序返回給用戶端。
  7. 一種實現圖片搜索的方法,其特徵在於,在圖片資料庫中預先根據關鍵字將對應的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片;當伺服器接收到用戶端發來的圖片搜索請求之後,該方法包括:伺服器在圖片資料庫中查找該搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;以及 伺服器接收用戶端選定的某種形狀類型的樣本圖片,並返回與提交的樣本圖片同一或近似形狀類型的圖片資料庫中的圖片,其中,將圖片按照圖片中物體的形狀進行分類,包括:通過比較圖片的特徵值將圖片按照形狀類型進行分類,其中,通過比較圖片的特徵值將圖片按照形狀類型進行分類,包括:比較圖片的特徵值,將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片,其中,所述特徵值之差,可以通過對表明特徵值的向 量求距離的公式來獲得。
  8. 一種實現圖片搜索的方法,其特徵在於,包括:伺服器接收到用戶端發來的圖片搜索請求;伺服器在圖片資料庫中查找搜索請求中的關鍵字對應的圖片;伺服器將查找到的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;伺服器接收用戶端選定的某種形狀類型的樣本圖片,並在圖片資料庫中搜索對應關鍵字的且與選定樣本圖片的特徵值滿足預定要求的圖片;以及伺服器將搜索到的圖片返回給用戶端,其中,將圖片按照圖片中物體的形狀進行分類,包括:通過比較圖片的特徵值將圖片按照形狀類型進行分 類,其中,通過比較圖片的特徵值將圖片按照形狀類型進行分類,包括:比較圖片的特徵值,將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片,其中,所述特徵值之差,可以通過對表明特徵值的向 量求距離的公式來獲得。
  9. 如申請專利範圍第8項的方法,其中,伺服器將該查找到的圖片按照圖片中物體的形狀進行分類具體包括:伺服器從查找到的圖片中提取一定數量的圖片,然後將提取出的圖片按照圖片中物體的形狀進行分類。
  10. 如申請專利範圍第8或9項的方法,其中,在圖片資料庫中搜索與該選定樣本圖片的特徵值滿足預定要求的圖片,包括:在圖片資料庫中搜索與選定圖片的特徵值向量的距離低於預定閾值的圖片。
  11. 一種實現圖片搜索的方法,其特徵在於,包括:伺服器接收到用戶端發來的圖片搜索請求;伺服器在圖片資料庫中查找該搜索請求中的關鍵字對應的圖片;伺服器將查找到的圖片按照圖片中物體的形狀進行分類,並為每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;以及伺服器接收用戶端選定的某種形狀類型的樣本圖片,並將圖片資料庫中該形狀類型的圖片返回給用戶端, 其中,將圖片按照圖片中物體的形狀進行分類,包括:通過比較圖片的特徵值將圖片按照形狀類型進行分類,其中,通過比較圖片的特徵值將圖片按照形狀類型進行分類,包括:比較圖片的特徵值,將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片,其中,所述特徵值之差,可以通過對表明特徵值的向 量求距離的公式來獲得。
  12. 一種實現圖片搜索的伺服器,其特徵在於,包括:圖片資料庫,其中存有圖片,對於對應同一關鍵字的圖片,預先被按照圖片中物體的形狀分類,且每一形狀類型具有選定的樣本圖片;搜索請求接收單元,用於接收用戶端發來的圖片搜索請求;樣本圖片返回單元,用於在圖片資料庫中查找搜索請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;選定圖片接收單元,用於接收用戶端選定的某種形狀類型的樣本圖片;搜索單元,用於在圖片資料庫中搜索對應關鍵字的且與選定樣本圖片的特徵值滿足預定要求的圖片;搜索結果返回單元,用於將搜索到的圖片返回給用戶 端;分類單元,用於通過比較圖片的特徵值實現對圖片資料庫中的圖片按照圖片中物體的形狀分類,其中,比較圖片的特徵值,包括將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片,其中,所述特徵值之差,可以通過對表明特徵值的向 量求距離的公式來獲得。
  13. 如申請專利範圍第12項的實現圖片搜索的伺服器,其中,還包括排序單元,用於對圖片資料庫中選定的樣本圖片排序。
  14. 如申請專利範圍第12項的實現圖片搜索的伺服器,其中,圖片資料庫中的圖片,包括上傳的圖片和/或通過網路爬蟲從大量的網際網路網頁中抓取得到的圖片。
  15. 如申請專利範圍第13項的實現圖片搜索的伺服器,其中,滿足預定要求的圖片包括圖片資料庫中與選定圖片的特徵值向量的距離低於預定閾值的圖片。
  16. 一種實現圖片搜索的伺服器,其特徵在於,包括:圖片資料庫,其中存有圖片,對於對應同一關鍵字的圖片,預先被按照圖片中物體的形狀分類,且每一形狀類型具有選定的樣本圖片;搜索請求接收單元,用於接收用戶端發來的圖片搜索請求;樣本圖片返回單元,用於在圖片資料庫中查找該搜索 請求中的關鍵字對應的預先分類的幾種形狀類型的樣本圖片,並將查找到的幾種形狀類型的樣本圖片返回給用戶端;選定圖片接收單元,用於接收用戶端選定的某種形狀類型的樣本圖片;以及搜索結果返回單元,用於返回與提交的樣本圖片同一或近似形狀類型的圖片資料庫中的圖片,其中,將圖片按照圖片中物體的形狀進行分類,包括:通過比較圖片的特徵值將圖片按照形狀類型進行分類,其中,通過比較圖片的特徵值將圖片按照形狀類型進行分類,包括:比較圖片的特徵值,將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片,其中,所述特徵值之差,可以通過對表明特徵值的向 量求距離的公式來獲得。
  17. 一種實現圖片搜索的伺服器,其特徵在於,包括:圖片資料庫,其中存有圖片;搜索請求接收單元,用於接收用戶端發來的圖片搜索請求;查找單元,用於在圖片資料庫查找搜索請求中的關鍵字對應的圖片;分類單元,用於將查找到的圖片按照圖片中物體的形狀進行分類; 樣本圖片返回單元,用於為分類單元分類的每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;選定圖片接收單元,用於接收用戶端選定的某種形狀類型的樣本圖片;搜索單元,用於在圖片資料庫中搜索對應關鍵字的且與選定樣本圖片的特徵值滿足預定要求的圖片;以及搜索結果返回單元,用於返回搜索到的圖片,其中,將圖片按照圖片中物體的形狀進行分類,包括:通過比較圖片的特徵值將圖片按照形狀類型進行分類,其中,通過比較圖片的特徵值將圖片按照形狀類型進行分類,包括:比較圖片的特徵值,將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片,其中,所述特徵值之差,可以通過對表明特徵值的向 量求距離的公式來獲得。
  18. 一種實現圖片搜索的伺服器,其特徵在於,包括:圖片資料庫,其中存有圖片;搜索請求接收單元,用於接收用戶端發來的圖片搜索請求;查找單元,用於在圖片資料庫查找搜索請求中的關鍵字對應的圖片;分類單元,用於將查找到的圖片按照圖片中物體的形 狀進行分類;樣本圖片返回單元,用於為分類單元分類的每一形狀類型選定樣本圖片,進而將預定個數的形狀類型的樣本圖片返回給用戶端;選定圖片接收單元,用於接收用戶端選定的某種形狀類型的樣本圖片;以及搜索結果返回單元,用於返回與提交的樣本圖片同一或近似形狀類型的圖片資料庫中的圖片,其中,將圖片按照圖片中物體的形狀進行分類,包括:通過比較圖片的特徵值將圖片按照形狀類型進行分類,其中,通過比較圖片的特徵值將圖片按照形狀類型進行分類,包括:比較圖片的特徵值,將特徵值之差在預定距離之內的圖片設定為同一或近似形狀類型的圖片,其中,所述特徵值之差,可以通過對表明特徵值的向 量求距離的公式來獲得。
TW098133413A 2009-10-01 2009-10-01 How to implement image search and website server TWI585596B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW098133413A TWI585596B (zh) 2009-10-01 2009-10-01 How to implement image search and website server

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW098133413A TWI585596B (zh) 2009-10-01 2009-10-01 How to implement image search and website server

Publications (2)

Publication Number Publication Date
TW201113725A TW201113725A (en) 2011-04-16
TWI585596B true TWI585596B (zh) 2017-06-01

Family

ID=44909752

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098133413A TWI585596B (zh) 2009-10-01 2009-10-01 How to implement image search and website server

Country Status (1)

Country Link
TW (1) TWI585596B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW410304B (en) * 1997-10-31 2000-11-01 Ibm Multidimensional data clustering and dimension reduction for indexing and searching
TW200614098A (en) * 2004-06-18 2006-05-01 Sony Corp Image verification device, image verification method, and program
CN1875379A (zh) * 2003-11-12 2006-12-06 英国电讯有限公司 视频图像中的对象跟踪
US20070133947A1 (en) * 2005-10-28 2007-06-14 William Armitage Systems and methods for image search
TW200739432A (en) * 2006-04-12 2007-10-16 Univ Nat Cheng Kung A method for face verification
TWI298854B (zh) * 2003-10-07 2008-07-11 Sony Corp
CN101320387A (zh) * 2008-07-11 2008-12-10 浙江大学 基于用户关注时间的网页文本与图像排序方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW410304B (en) * 1997-10-31 2000-11-01 Ibm Multidimensional data clustering and dimension reduction for indexing and searching
TWI298854B (zh) * 2003-10-07 2008-07-11 Sony Corp
CN1875379A (zh) * 2003-11-12 2006-12-06 英国电讯有限公司 视频图像中的对象跟踪
TW200614098A (en) * 2004-06-18 2006-05-01 Sony Corp Image verification device, image verification method, and program
US20070133947A1 (en) * 2005-10-28 2007-06-14 William Armitage Systems and methods for image search
TW200739432A (en) * 2006-04-12 2007-10-16 Univ Nat Cheng Kung A method for face verification
CN101320387A (zh) * 2008-07-11 2008-12-10 浙江大学 基于用户关注时间的网页文本与图像排序方法

Also Published As

Publication number Publication date
TW201113725A (en) 2011-04-16

Similar Documents

Publication Publication Date Title
JP5241954B2 (ja) 形状に基づく画像検索
US10922350B2 (en) Associating still images and videos
US9600499B2 (en) System for collecting interest graph by relevance search incorporating image recognition system
CN104991959B (zh) 一种基于内容检索相同或相似图像的方法与系统
US20150170333A1 (en) Grouping And Presenting Images
US20150178321A1 (en) Image-based 3d model search and retrieval
JP5142509B2 (ja) 文書作成支援装置、文書作成支援システム
CN104915447A (zh) 一种热点话题追踪及关键词确定方法及装置
JP2011028749A (ja) レイアウトに基づく文書検索およびランク付けのためのスケーラブルな索引付け
EP2499564A1 (en) Search method and system
US9098552B2 (en) Scoring images related to entities
CN109299307B (zh) 一种基于结构分析的商标检索预警方法及装置
US9424338B2 (en) Clustering queries for image search
US8923626B1 (en) Image retrieval
CN107169821B (zh) 大数据查询推荐方法及其系统
CN110928903A (zh) 数据提取方法及装置、设备和存储介质
EP3564833B1 (en) Method and device for identifying main picture in web page
CN104111942A (zh) 维吾尔医药古籍资源网络检索平台
CN110737794A (zh) 图像查询方法、系统、服务器及存储介质
JP6140835B2 (ja) 情報検索システムおよび情報検索方法
TWI585596B (zh) How to implement image search and website server
CN103164504A (zh) 一种智能手机精细化图片搜索系统及方法
TWI484356B (zh) Retrieval methods, devices and systems
CN114791978A (zh) 新闻推荐方法、装置、设备以及存储介质
JP2009271811A (ja) 文書管理装置、文書管理システム、文書管理方法およびプログラム

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees