TWI470453B - Method and system for saving database storage space - Google Patents

Method and system for saving database storage space Download PDF

Info

Publication number
TWI470453B
TWI470453B TW98114029A TW98114029A TWI470453B TW I470453 B TWI470453 B TW I470453B TW 98114029 A TW98114029 A TW 98114029A TW 98114029 A TW98114029 A TW 98114029A TW I470453 B TWI470453 B TW I470453B
Authority
TW
Taiwan
Prior art keywords
standard attribute
attribute unit
module
unit
standard
Prior art date
Application number
TW98114029A
Other languages
English (en)
Other versions
TW201039157A (en
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to TW98114029A priority Critical patent/TWI470453B/zh
Publication of TW201039157A publication Critical patent/TW201039157A/zh
Application granted granted Critical
Publication of TWI470453B publication Critical patent/TWI470453B/zh

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

節約資料庫儲存空間的方法和系統
本發明關於電腦網路技術領域,特別關於一種節約資料庫儲存空間的方法和系統。
隨著電腦網路技術的發展,網上購物蓬勃發展,出現了很多購物類網站,人們只需在購物網站上註冊,將商品資訊傳遞到網上就可以足不出戶的進行交易。
例如,目前購物網站淘寶網有1.8億商品,當有賣家發佈商品時,每件商品都對應了名稱、圖片、簡介說明、價格區間和相關屬性,因此,這些商品的資料存在大量的冗餘。比如諾基亞的N73,現在是每個N73商品都會對應各自賣家發佈的圖片、簡介說明、屬性等內容。這就使得購物網的資料庫需要大量的儲存空間,現在購物網使用的多數是產品庫,需要運營人工維護大量的產品。
在實現本發明的過程中,發明人發現現有技術至少存在以下問題:現有技術中使用的是產品庫,需要運營人工維護大量的產品,不夠靈活。每件商品都對應了名稱、圖片、簡介說明、價格區間和相關屬性,在這些商品的資料存在大量的冗餘,對商品進行規範不方便;同時,隨著網站的發展,產品數量迅速增長,增加了運營人員的困難。
本發明實施例提供一種節約資料庫儲存空間的方法和系統,通過使用資料倉庫的挖掘演算法,對後臺類目下同類屬性商品聚合分析,提取出標準屬性單元,減少資料庫的儲存空間和圖片在網路上的傳輸流量,解決了運營困難的問題。
為達到上述目的,本發明實施例一方面提供了一種節約資料庫儲存空間的方法,包括以下步驟:從商品資訊中,提取出標準屬性單元,建立標準屬性單元庫;計算該標準屬性單元庫中的標準屬性單元,生成標準屬性單元序列化檔,定期推送該標準屬性單元序列化檔;判斷新發佈商品和該標準屬性單元序列化檔是否匹配,如果是,綁定該新發佈商品和所匹配到的標準屬性單元。本發明實施例另一方面提供了一種節約資料庫儲存空間的系統,包括:資料庫,用於儲存商品資訊和正式的標準屬性單元;標準屬性單元伺服器,用於緩存來自該資料庫和後臺伺服器的資料,包括來自該資料庫的正式的標準屬性單元和商品屬性及來自該後臺伺服器的正式的標準屬性單元,計算正式的標準屬性單元,生成標準屬性單元序列化檔;後臺伺服器,用於根據來自該標準屬性單元伺服器的商品資訊,生成正式的標準屬性單元;前臺伺服器,用於接收來自該標準屬性單元伺服器的標準屬性單元序列化檔,匹配商品和所匹配到的標準屬性單元。
與現有技術相比,本發明實施例具有以下優點:本發明實施例通過引入標準屬性單元表示商品的共同屬性,如果所發佈商品可以匹配到序列化檔中的標準屬性單元,則綁定商品和匹配的序列化檔中的標準屬性單元,這樣既可以節約儲存,便於規範商品;還可以通過使用標準屬性單元的圖片來節省圖片儲存的空間,減少儲存開銷及網路流量。
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明的一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
本發明實施例一提供了一種節約資料庫儲存空間的方法,如圖1所示,包括以下步驟:步驟S101,從商品資訊中,提取出正式的SPU(Standard Property Unit,標準屬性單元),建立SPU庫。
利用搜尋引擎從商品資訊中搜尋出商品的關鍵屬性,根據搜尋出的商品的關鍵屬性,使用資料庫的挖掘演算法挖掘商品的共同屬性,根據挖掘的商品的共同屬性,聚合分析提取出具有商品共同屬性的待審核的SPU,判斷審核待審核的SPU是否為商品的共同屬性,如果是,則生成正式的SPU,建立SPU庫。
SPU,定義為後臺標準類目葉子節點下一組共同屬性的集合,具有名稱、簡介、圖片(可以是多個)、價格、主屬性、綁定屬性,並能關聯其他SPU。在眾多商品中,伺服器可以將具有某些相同屬性的商品歸類到一起,稱為一個SPU,SPU以資料表的形式儲存,資料表包含該SPU的SPU_ID,並通過類目ID欄位外聯到類目,表示該SPU所屬類目,這樣,可以找到一個類目下所有的SPU。SPU可以重複使用。
步驟S102,計算SPU庫中的SPU,生成SPU序列化檔,按照設定的時間間隔,定期向前臺推送SPU序列化檔。
其中,SPU序列化檔是資料庫中資料的集合,包含後臺類目、SPU和關聯SPU等資訊。例如手機諾基亞N73的SPU序列化檔中,後臺類目為手機,在該類目下可以找到一個SPU,該SPU包含品牌為諾基亞,型號為N73,作業系統為***等資訊,還可以找到關聯SPU(如手機諾基亞N73的電池的SPU)。
生成SPU序列化檔,具體可以為:在後臺類目中獲取類目資訊,根據得到的類目資訊通過訪問SPU庫獲取該類目下所有的SPU,所獲取的SPU生成SPU序列化檔。
步驟S103,判斷新發佈商品和SPU序列化檔中的SPU是否匹配,如果是,綁定新發佈商品和匹配的SPU。
具體的,綁定新發佈商品和匹配的SPU為,建立新發佈商品和上述的匹配的SPU之間的對應關係,並保存該對應關係,用於後續操作。
如果新發佈商品可以匹配到序列化檔中的SPU,將匹配成功的SPU和該新發佈的商品建立對應關係,未匹配成功的屬性為商品的特有屬性,保存在屬性欄位中。
通過本發明實施例的技術方案,使用資料庫的挖掘演算法,對後臺類目下的同類屬性商品提取聚合分析,把商品具有的相同特徵抽取出來,引入SPU表示商品的共同屬性,如果新發佈商品匹配到序列化檔中的SPU,則綁定商品和匹配的序列化檔中的SPU,從而將網站中上億的商品變成百萬級別數量的SPU,這樣既可以節約儲存,便於規範商品;還可以通過使用SPU的圖片來節省圖片儲存的空間,減少儲存開銷及網路流量。
本發明實施例二提供了一種節約資料庫儲存空間的方法,如圖2所示,包括以下步驟:步驟S201,利用搜尋引擎搜尋資料庫中商品的關鍵屬性。
搜尋引擎搜尋的是預先整理好的索引資料庫。搜尋引擎,指收集了上幾千萬到幾十億個商品屬性並對商品屬性中的每一個屬性和屬性值組合進行索引,建立索引資料庫的全文搜尋引擎。當查找某個主屬性的時候,所有包含了該屬性和屬性值組合的商品屬性都將作為搜尋結果被搜出來。
步驟S202,根據步驟S201搜尋出的商品的關鍵屬性,使用資料庫的挖掘演算法,挖掘出商品的共同屬性。
DM(Data Mining,資料挖掘)是從大型資料庫的資料中提取人們感興趣的知識。這些知識是隱含的、事先未知的、潛在有用的資訊,提取的知識表示為概念(Concepts)、規則(Rules)、規律(Regularities)、模式(Patterns)等形式。這種定義把資料挖掘的物件定義為資料庫,而更廣義的說法是:資料挖掘是在一些事實或觀察資料的集合中尋找模式的決策支援過程。資料挖掘的物件不僅是資料庫,也可以是檔系統,或其他任何組織在一起的資料集合。資料挖掘的最終目的是發現人們不易察覺的、隱含的模式。一般說來,這些模式中最易於理解的是統計模型。其次是對資料的週邊檢測,對大規模資料集的模式識別、分類或聚類。最後是從理論和計算上解決在大多數資料庫管理系統中存在的多維空間和大量的資料處理的問題。
搜尋引擎搜尋出資料庫中商品的關鍵屬性後,使用資料庫的挖掘演算法對資料庫中商品的屬性進一步挖掘,計算出商品的共同屬性。這裏所說的商品的共同屬性是指大量資料中存在的規律性或不同特徵屬性值之間存在的[if then]規則。從大量資料中獲取商品共同屬性的有兩個含義:首先,與科學發現有關。從觀測客觀世界的大量實驗資料(往往是數值)中發現資料的整體結構特性和資料之間的函數關係,並根據統計特徵推斷客觀世界中存在的規律性;其次,與商業資料等事實資料所構成的資料庫中發現其中隱含的規則或規律性有關。第二類是將人工智慧技術與資料庫理論相融合的應用性研究課題。
步驟S203,根據步驟S202挖掘的商品的共同屬性,對後臺類目下同類屬性商品聚合分析,提取出具有商品共同屬性的待審核的SPU。
後臺類目是指產品的類型,比如手機、mp3等。後臺類目的結構包括後臺標準類目表、產品相關屬性、相關SPU。
步驟S204,審核待審核的SPU,提取出正式的SPU。步驟S203提取出的SPU有可能不是很準確,需要人工進行審核,判斷待審核的SPU是否是商品具有的共同屬性,如果是,則生成正式的SPU,放入SPU庫中。
步驟S205,正式的SPU經過計算生成SPU序列化檔,在設定程式的控制下,定時向前臺推送SPU序列化檔。
步驟S206,判斷新發佈商品和步驟S205定時推送的SPU序列化檔是否匹配。當賣家發佈商品時,首先需要點選商品的屬性,將賣家點選的屬性和定時向前臺推送的SPU序列化檔進行匹配,如果匹配成功,則將商品與匹配成功的SPU綁定,未匹配成功的屬性為商品的特有屬性,保存在屬性欄位中。
本發明實施例三還提供了一種節約資料庫儲存空間的方法,如圖3所示,包括以下步驟:步驟S301,利用搜尋引擎自動搜尋資料庫中商品的關鍵屬性。例如,搜尋手機諾基亞N73,搜尋引擎搜尋到手機諾基亞N73的屬性,包括:品牌:諾基亞;型號:N73;作業系統:***等。
步驟S302,根據步驟S301搜尋出的商品的關鍵屬性,使用資料庫的挖掘演算法,挖掘出商品的共同屬性。例如,經過搜尋得到了手機諾基亞N73的屬性集合,應用資料庫的挖掘演算法計算搜尋出的手機諾基亞N73的關鍵屬性,提取出手機諾基亞N73的共同屬性:品牌是諾基亞,型號是N73,儲存卡是***,作業系統是***等。
步驟S303,根據步驟S302挖掘的商品的共同屬性,對後臺類目下同類屬性商品聚合分析,提取出具有商品共同屬性的待審核的SPU。後臺類目為手機,根據資料庫挖掘演算法挖掘出的商品的共同屬性,通過聚合分析等技術,提取出手機諾基亞N73的共同特徵,生成待審核的SPU,手機諾基亞N73相關屬性(如手機配件等)則生成手機諾基亞N73的待審核的相關SPU。
步驟S304,審核待審核的SPU,批准成正式的SPU。步驟S303提取出的SPU有可能不是很準確,需要人工進行審核,判斷待審核的SPU是否是商品具有的共同屬性,如果是,則生成正式的SPU,放入SPU庫中。
步驟S305,正式的SPU經過計算生成SPU序列化檔,在設定程式的控制下,定時向前臺推送SPU序列化檔。
步驟S306,判斷新發佈商品和步驟S305定時推送的SPU序列化檔是否匹配。當賣家發佈商品時,首先需要點選商品的屬性,將賣家點選的屬性和定時推送的SPU序列化檔進行匹配,如果匹配成功,則將商品與匹配成功的SPU綁定,未匹配成功的屬性為商品的特有屬性,保存在屬性欄位中。賣家發佈商品為手機諾基亞N73,將商品和手機諾基亞N73的SPU綁定,且手機諾基亞N73的SPU可以關聯相關的SPU(如手機諾基亞N73的電池的SPU)。
本發明實施例四還提供了一種節約資料庫儲存空間的方法,如圖4所示,包括以下步驟:步驟S401,利用搜尋引擎搜尋資料庫中商品的關鍵屬性。例如,搜尋手機諾基亞N73、手機諾基亞N72、手機諾基亞N76,搜尋引擎搜尋到手機諾基亞N73、手機諾基亞N72、手機諾基亞N76的屬性,包括商品品牌、作業系統、儲存卡類型、鈴聲類型、高級特性、圖元等。
步驟S402,根據步驟S401搜尋出的商品的關鍵屬性,使用資料庫的挖掘演算法,挖掘出商品的共同屬性。例如,經過搜尋得到了手機諾基亞N73、手機諾基亞N72、手機諾基亞N76的屬性集合,資料庫的挖掘演算法計算搜尋出的屬性,分別提取出機諾基亞N73、手機諾基亞N72、手機諾基亞N76的共同屬性。
步驟S403,根據步驟S302挖掘的商品的共同屬性,對後臺類目下同類屬性商品聚合分析,提取出具有商品共同屬性的待審核的SPU。根據資料庫挖掘演算法挖掘出的商品的共同屬性,通過提取聚合分析等技術,分別提取出手機諾基亞N73、手機諾基亞N72、手機諾基亞N76的共同特徵,生成待審核的SPU,相關屬性(如手機配件等)則分別生成手機諾基亞N73、手機諾基亞N72、手機諾基亞N76的待審核的相關SPU。
步驟S404,審核待審核的SPU,提取出正式的SPU。步驟S403提取出的SPU有可能不是很準確,需要人工進行審核,判斷待審核的SPU是否是商品具有的共同屬性,如果是,則生成正式的SPU,分別是手機諾基亞N73、手機諾基亞N72、手機諾基亞N76的SPU和手機諾基亞N73、手機諾基亞N72、手機諾基亞N76的相關SPU,放入SPU庫。
步驟S405,步驟S404獲得的正式的SPU為細粒度的SPU,都具有相同的屬性,經過計算算出手機諾基亞N73、手機諾基亞N72、手機諾基亞N76的SPU的共同屬性,得到手機諾基亞N系列的SPU,即細粒度的SPU組裝成粗粒度的SPU。
步驟S406,正式的SPU經過計算生成SPU序列化檔,在設定程式的控制下,定時向前臺推送SPU序列化檔。
步驟S407,判斷新發佈商品和步驟S305定時推送的SPU序列化檔是否匹配。當賣家發佈商品時,首先需要點選商品的屬性,將賣家點選的屬性和定時推送的SPU序列化檔進行匹配,如果匹配成功,則將商品與匹配成功的SPU綁定,未匹配成功的屬性為商品的特有屬性,保存在屬性欄位中。
本發明實施例五提供了一節約資料庫儲存空間的系統,如圖5所示,包括:DB(data base,資料庫)510,SPU伺服器520,後臺伺服器530,前臺伺服器540。
其中,DB510,用於儲存商品資訊和正式的SPU。
例如,在購物網站淘寶網上,賣家在發佈商品時,每件商品都對應了名稱、圖片、簡介說明、價格區間及相關屬性等資訊,這些資訊都儲存在DB510中。來自SPU伺服器520的正式的SPU,也儲存在DB510中。
DB510是依照某種資料模型組織起來並存放在二級記憶體中的資料集合。這種資料集合具有如下特點:盡可能不重複,以最優方式為某個特定組織的多種應用服務,資料結構獨立于使用的應用程式,對資料的增、刪、改和檢索由統一軟體管理和控制。資料庫是資料管理的高級階段,由檔管理系統發展而來。
SPU伺服器520,用於緩存來自DB510和後臺伺服器530的資料,包括來自DB510的正式的SPU和商品屬性及來自後臺伺服器530的正式的SPU。其中,正式的SPU經過計算生成SPU序列化檔,在設定程式的控制下,定時向前臺伺服器540推送SPU序列化檔;發送商品屬性到後臺伺服器530,接收經過後臺伺服器530的處理生成正式的SPU,發送給DB510。
後臺伺服器530,用於根據來自SPU伺服器520的商品屬性,經過程式自動生成待審核SPU,然後經過運營審核,生成正式SPU。後臺伺服器530使用搜尋引擎搜尋來自SPU伺服器520的商品屬性,提取出商品的關鍵屬性,應用資料庫挖掘演算法挖掘出商品的共同屬性,將共同屬性聚合分析,得到具有商品共同屬性的待審核的SPU,審核待審核的SPU是否為商品的共同屬性,如果是,則生成正式的SPU,發送正式的SPU到SPU伺服器520。
前臺伺服器540,用於接收SPU伺服器520定時推送的SPU序列化檔,匹配商品和序列化檔中的SPU。前臺伺服器540接收並保存SPU伺服器520定時推送的SPU序列化檔。當賣家發佈商品時,首先需要點選商品的屬性,將賣家點選的屬性和前臺伺服器540儲存的SPU序列化檔中的SPU進行匹配,如果匹配成功,則將商品與匹配成功的SPU綁定,未匹配成功的屬性為商品的特有屬性,保存在屬性欄位中。
其中,DB510結構如圖6所示,具體包括:第一儲存模組511,第二儲存模組512。
第一儲存模組511,用於儲存來自SPU伺服器520的具有商品共同屬性的正式的SPU。
第二儲存模組512,用於儲存所有商品資訊。
SPU伺服器520結構如圖7所示,具體包括:接收模組521,計算模組522,控制模組523,第一發送模組524,第二發送模組525。
接收模組521,用於接收來自DB510的正式的SPU和商品資訊及來自第二發送模組525的正式的SPU,其中,來自DB510的正式的SPU發送給計算模組522,來自DB510的商品資訊發送給第二發送模組525,來自第二發送模組525的正式的SPU發送給DB510。
計算模組522,用於根據來自接收模組521的正式的SPU計算得到SPU序列化檔,向第一發送模組524發送SPU序列化檔。
第一發送模組524,用於在控制模組523的控制下發送來自計算模組522的SPU序列化文件。
第二發送模組525,用於向後臺伺服器530發送商品資訊及接收後臺伺服器530生成的正式的SPU。
控制模組523,用於通過設置傳送SPU序列化檔的時間間隔,控制第一發送模組524定時傳送SPU序列化檔。
後臺伺服器530,具體包括:獲取模組531,搜尋模組532,挖掘模組533,聚類模組534,運營模組535。
獲取模組531,用於從DB510獲取商品資訊,並將商品資訊傳遞給搜尋模組532。
搜尋模組532,用於搜尋來自獲取模組531的商品屬性,獲取商品的關鍵屬性。
挖掘模組533,用於接收搜尋模組532搜尋的商品關鍵屬性,使用資料庫的挖掘演算法進一步提取出商品的共同屬性。
聚類模組534,用於聚類分析挖掘模組533提取的商品的共同屬性,生成待審核的SPU。
運營模組535,用於接收聚類模組534生成的待審核的SPU,通過運營小二審核待審核的SPU,判斷待審核的SPU是否具有商品的共同屬性,如果是,生成正式的SPU,將正式的SPU發送給SPU伺服器520。
前臺伺服器540,具體包括:接收模組541,判斷模組542,綁定模組543,合併模組544。
接收模組541,用於接收來自SPU伺服器520的SPU序列化檔和賣家發佈商品時商品的資訊,包括:所屬類目,屬性等。
判斷模組542,用於判斷來自接收模組541的賣家發佈商品的屬性和SPU序列化檔中的SPU是否匹配。
綁定模組543,根據判斷模組542的判斷結果,進行商品和SPU序列化檔的綁定,如果匹配成功,則將商品與匹配成功的SPU綁定。
合併模組544,用於當買家查看商品詳情時,合併該綁定模組543綁定的標準屬性單元中的標準屬性和商品的個性屬性,展示給買家。
上述模組可以分佈於一個裝置,也可以分佈於多個裝置。上述模組可以合併為一個模組,也可以進一步拆分成多個子模組。
綜上所述,通過本發明實施例的技術方案,引入SPU表示商品的共同屬性,將網站中上億的商品變成百萬級別數量的SPU,既可以節約儲存,便於規範商品;還可以通過使用SPU的圖片來節省圖片儲存的空間,減少儲存開銷及網路流量。
通過以上的實施方式的描述,本領域的技術人員可以清楚地瞭解到本發明可以通過硬體實現,也可以借助軟體加必要的通用硬體平臺的方式來實現。基於這樣的理解,本發明的技術方案可以以軟體產品的形式體現出來,該軟體產品可以儲存在一個非易失性儲存介質(可以是CD-ROM,U盤,移動硬碟等)中,包括若干指令用以使得一台電腦設備(可以是個人電腦,伺服器,或者網路設備等)執行本發明各個實施例所述的方法。
本領域技術人員可以理解附圖只是一個優選實施例的示意圖,附圖中的模組或流程並不一定是實施本發明所必需的。
本領域技術人員可以理解實施例裝置中的模組可以按照實施例描述分佈於實施例的裝置中,也可以進行相應變化位於不同於本實施例的一個或多個裝置中。上述實施例的模組可以合倂為一個模組,也可以進一步拆分成多個子模組。
上述本發明實施例序號僅僅為了描述,不代表實施例的優劣。
以上公開的僅為本發明的幾個具體實施例,但是,本發明並非局限於此,任何本領域的技術人員能思之的變化都應落入本發明的保護範圍。
510...DB(資料庫)
520...SPU伺服器
530...後臺伺服器
540...前臺伺服器
511...第一儲存模組
512...第二儲存模組
521...接收模組
522...計算模組
523...控制模組
524...第一發送模組
525...第二發送模組
530...後臺伺服器
531...獲取模組
532...搜尋模組
533...挖掘模組
534...聚類模組
535...操作模組
541...接收模組
542...判斷模組
543...綁定模組
544...合倂模組
為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本發明實施例一的一種節約資料庫儲存空間的方法流程圖;
圖2是本發明實施例二的一種節約資料庫儲存空間的方法流程圖;
圖3是本發明實施例三的一種節約資料庫儲存空間的方法流程圖;
圖4是本發明實施例四的一種節約資料庫儲存空間的方法流程圖;
圖5是本發明實施例五的一種節約資料庫儲存空間的系統結構圖;
圖6是本發明實施例五中資料庫的具體結構圖;
圖7是本發明實施例五中標準屬性單元伺服器的具體結構圖;
圖8是本發明實施例五中後臺伺服器的具體結構圖;
圖9是本發明實施例五中前臺伺服器的具體結構圖。

Claims (9)

  1. 一種節約資料庫儲存空間的方法,其特徵在於,包括:從商品資訊中,提取出標準屬性單元,建立標準屬性單元庫,其中,該標準屬性單元具有關聯一商品類目的商品的共同屬性;計算該標準屬性單元庫中的標準屬性單元,生成標準屬性單元序列化檔,定期推送該標準屬性單元序列化檔,其中,該標準屬性單元序列化檔包含後臺類目、標準屬性單元和關聯標準屬性單元等資訊;及判斷新發佈商品和該標準屬性單元序列化檔中的標準屬性單元是否匹配,該匹配藉由將該新發佈商品的屬性和該標準屬性單元序列化檔進行匹配,如果是,綁定該新發佈商品和該匹配的標準屬性單元。
  2. 如申請專利範圍第1項所述的方法,其中,該提取出標準屬性單元具體包括:利用搜尋引擎從該商品資訊中搜尋出商品的關鍵屬性;根據該搜尋出的商品的關鍵屬性,使用資料庫的挖掘演算法挖掘商品的共同屬性;根據該挖掘演算法挖掘的商品的共同屬性,聚合分析提取出具有商品共同屬性的待審核的標準屬性單元;及審核該待審核的標準屬性單元是否為商品的共同屬性,如果是,則批准成正式的標準屬性單元。
  3. 如申請專利範圍第2項所述的方法,其中,該待審核的標準屬性單元包括商品的標準屬性單元和相關屬性的屬性單元。
  4. 如申請專利範圍第2項所述的方法,其中,該正式的標準屬性單元為細粒度標準屬性單元和粗粒度標準屬性單元,該粗粒度標準屬性單元由該細粒度標準屬性單元組裝構成。
  5. 一種節約資料庫儲存空間的系統,其特徵在於,包括:資料庫,用於儲存商品資訊和正式的標準屬性單元,其中,該正式的標準屬性單元具有關聯一商品類目的商品的共同屬性;標準屬性單元伺服器,用於緩存來自該資料庫和後臺伺服器的資料,包括來自該資料庫的正式的標準屬性單元和商品屬性及來自該後臺伺服器的正式的標準屬性單元,計算該正式的標準屬性單元,生成標準屬性單元序列化檔,其中,該正式的標準屬性單元具有關聯一商品類目的商品的共同屬性;後臺伺服器,用於根據來自該標準屬性單元伺服器的商品屬性,生成正式的標準屬性單元;及前臺伺服器,用於接收來自該標準屬性單元伺服器的標準屬性單元序列化檔,匹配商品和該匹配的標準屬性單元,該匹配藉由將該新發佈商品的屬性和該標準屬性單元序列化檔進行匹配。
  6. 如申請專利範圍第5項所述的系統,其中,該資料庫具體包括:第一儲存模組,用於儲存來自該標準屬性單元伺服器的具有商品共同屬性的正式的標準屬性單元;及第二儲存模組,用於儲存該商品資訊。
  7. 如申請專利範圍第5項所述的系統,其中,該標準屬性單元伺服器具體包括:接收模組,用於接收來自該資料庫的正式的標準屬性單元和該商品資訊及來自第二發送模組的正式的標準屬性單元,將來自該資料庫的正式的標準屬性單元發送給計算模組,商品資訊發送給該第二發送模組,將來自該第二發送模組的正式的標準屬性單元發送給該資料庫;計算模組,用於根據來自該接收模組的正式的標準屬性單元計算得到標準屬性單元序列化檔,向第一發送模組發送該標準屬性單元序列化檔;第一發送模組,用於在控制模組的控制下向該前臺伺服器發送來自該計算模組的標準屬性單元序列化檔;第二發送模組,用於向該後臺伺服器發送該商品資訊及接收該後臺伺服器生成的正式的標準屬性單元;及控制模組,用於控制該第一發送模組定時傳送該標準屬性單元序列化檔。
  8. 如申請專利範圍第5項所述的系統,其中,該後臺伺服器具體包括:獲取模組,用於從該資料庫獲取商品資訊,並將該商 品資訊傳遞給搜尋模組;搜尋模組,用於利用搜尋引擎搜尋來自該獲取模組的商品資訊,獲取商品的關鍵屬性;挖掘模組,用於接收該搜尋模組搜尋的商品關鍵屬性,使用資料庫的挖掘演算法進一步挖掘出商品的共同屬性;聚類模組,用於聚類分析該挖掘模組挖掘的商品的共同屬性,生成待審核的標準屬性單元;及操作模組,用於接收該聚類模組生成的待審核的標準屬性單元,判斷生成正式的標準屬性單元,將該正式的標準屬性單元發送給該標準屬性單元伺服器。
  9. 如申請專利範圍第5項所述的系統,其中,該前臺伺服器具體包括:接收模組,用於接收來自該標準屬性單元伺服器的標準屬性單元序列化檔和賣家發佈商品時商品的資訊;判斷模組,用於判斷來自該接收模組接收的賣家發佈商品時商品的資訊和該標準屬性單元序列化檔中的標準屬性單元是否匹配;綁定模組,用於根據該判斷模組的判斷結果,綁定商品和匹配成功的標準屬性單元;及合併模組:用於當買家查看商品詳情時,合併該綁定模組綁定的標準屬性單元中的標準屬性和商品的個性屬性,展示給買家。
TW98114029A 2009-04-28 2009-04-28 Method and system for saving database storage space TWI470453B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW98114029A TWI470453B (zh) 2009-04-28 2009-04-28 Method and system for saving database storage space

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW98114029A TWI470453B (zh) 2009-04-28 2009-04-28 Method and system for saving database storage space

Publications (2)

Publication Number Publication Date
TW201039157A TW201039157A (en) 2010-11-01
TWI470453B true TWI470453B (zh) 2015-01-21

Family

ID=44995342

Family Applications (1)

Application Number Title Priority Date Filing Date
TW98114029A TWI470453B (zh) 2009-04-28 2009-04-28 Method and system for saving database storage space

Country Status (1)

Country Link
TW (1) TWI470453B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778186B (zh) * 2014-01-15 2018-06-22 阿里巴巴集团控股有限公司 将商品对象挂载到标准产品单元的方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1255215A (zh) * 1997-05-06 2000-05-31 伯特斯泰普技术联合股份有限公司 在信息处理系统中存储和操作数据的系统和方法
US20050203940A1 (en) * 2004-03-12 2005-09-15 Sybase, Inc. Database System with Methodology for Automated Determination and Selection of Optimal Indexes
TW200627204A (en) * 2004-08-10 2006-08-01 Ibm System and method for automated data storage management

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1255215A (zh) * 1997-05-06 2000-05-31 伯特斯泰普技术联合股份有限公司 在信息处理系统中存储和操作数据的系统和方法
US20050203940A1 (en) * 2004-03-12 2005-09-15 Sybase, Inc. Database System with Methodology for Automated Determination and Selection of Optimal Indexes
TW200627204A (en) * 2004-08-10 2006-08-01 Ibm System and method for automated data storage management

Also Published As

Publication number Publication date
TW201039157A (en) 2010-11-01

Similar Documents

Publication Publication Date Title
US9928537B2 (en) Management and storage of distributed bookmarks
US8751458B2 (en) Method and system for saving database storage space
US10725981B1 (en) Analyzing big data
WO2020147720A1 (zh) 信息推荐方法和装置以及存储介质
WO2018028443A1 (zh) 数据处理方法、设备及系统
CN102253936A (zh) 记录用户访问商品信息的方法及搜索方法和服务器
CN103049495A (zh) 用于提供与查询序列相对应的搜索建议的方法、装置与设备
JP5926321B2 (ja) 大容量データを処理するための、sqlパーシングによる2レベルクエリー及び結果キャッシングを用いたオンライン分析プロセッシング方法
CN113407785A (zh) 一种基于分布式储存系统的数据处理方法和系统
CN112925954A (zh) 用于在图数据库中查询数据的方法和装置
CN113722600B (zh) 应用于大数据的数据查询方法、装置、设备及产品
Bai et al. Fixing the inconsistencies in fuzzy spatiotemporal RDF graph
TWI470453B (zh) Method and system for saving database storage space
US20220083736A1 (en) Information processing apparatus and non-transitory computer readable medium
CN113918630A (zh) 一种数据同步方法、装置、计算机设备及存储介质
US10824681B2 (en) Enterprise resource textual analysis
CN113515504B (zh) 数据管理方法、装置、电子设备以及存储介质
US20240202797A1 (en) Solving sparse data problems in a recommendation system with cold start
US20240202798A1 (en) Solving sparse data problems in a recommendation system with freezing start
US20240220876A1 (en) Artificial intelligence (ai) based data product provisioning
JP2021149613A (ja) 自然言語処理装置およびプログラム
JP2021157220A (ja) 自然言語処理装置およびプログラム
Luo Real‐Time Query Method Based on Distributed Database Demand Information
CN114297317A (zh) 数据处理方法、装置、电子设备及存储介质
CN116992119A (zh) 内容推送方法、装置、电子设备及存储介质