TW201241773A - Method and apparatus of determining product category information - Google Patents

Method and apparatus of determining product category information Download PDF

Info

Publication number
TW201241773A
TW201241773A TW100131503A TW100131503A TW201241773A TW 201241773 A TW201241773 A TW 201241773A TW 100131503 A TW100131503 A TW 100131503A TW 100131503 A TW100131503 A TW 100131503A TW 201241773 A TW201241773 A TW 201241773A
Authority
TW
Taiwan
Prior art keywords
product
node
phrase
category
degree
Prior art date
Application number
TW100131503A
Other languages
English (en)
Inventor
wen-yan Miao
jian-ping Qian
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of TW201241773A publication Critical patent/TW201241773A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

201241773 六、發明說明 【發明所屬之技術領域】 本申請案係有關資料處理技術領域,尤 品類目資訊的確定方法及裝置。 【先前技術】 用戶透過伺服器上傳商品的資訊時,需 所提供的商品類目的資訊,確定上傳的該商 屬的類目,將該商品的資訊掛靠在相對應類 於伺服器可以提供的商品類目的資訊非常的 主動確定商品的資訊所歸屬的類目時,很可 而導致提供的資訊不準確。 另外,伺服器採用開放搜索的方式,將 保存的商品的資訊納入自身資料庫中時,其 靠商品的資訊的商品類目的劃分類型可能與 品類目的劃分類型並不相同,在將其他伺服 品的資訊納入自身資料庫時,如果商品類目 同’將會導致其他伺服器中保存的商品資訊 到自身的資料庫中,在這種情況下,只能採 納入方式’這大幅影響了商品資訊納入的效 現有商品歸屬類目的確定方法包括:基 類目確定方法,以及長尾查詢(query )類目 其中’基於搜索的商品類目確定方法中 了商品的標題資訊後,伺服器根據用戶輸入 其有關一種商 要根據伺服器 品的資訊所歸 目下。但是由 龐雜,當用戶 能錯選類目, 其他伺服器中 他伺服器中掛 該伺服器的商 器中保存的商 的劃分類型不 無法自動納入 用人工識別的 率及準確率。 於搜索的商品 確定方法。 ,當用戶輸入 的該商品的標 -5- 201241773 題資訊,透過搜索引擎在資料庫中查找與該商品的標題資 訊完全匹配的商品的標題資訊,用戶根據查找到的該商品 的標題資訊匹配的商品掛靠的商品類目,以確定輸入的商 品掛靠的類目。該方法中,只有查找到的標題資訊完全匹 配,才能確定商品所掛靠的商品類目,但是一般情況下, 商品的標題資訊包含的字元數很多,一般都在10〜30個字 元之間,因此,由於在大部分情況下都沒辦法査找到標題 資訊完全匹配的商品,並且逐一査找的過程非常耗時,這 不但導致難以確定該商品掛靠的商品類目,而且效率低 下。此外,即使查找到了完全匹配的標題資訊,但當該標 題資訊對應的商品掛靠的商品類目存在錯誤時,也會導致 確定的該商品掛靠的商品類目的出現差錯。 在長尾query類目確定方法中,當用戶輸入了查詢關 鍵字後,根據該査詢關鍵字向用戶返回査詢結果,伺服器 根據用戶輸入的査詢關鍵字,以及每個査詢結果對應的商 品類目,以確定該查詢關鍵字與每個商品類目的關聯度, 根據確定的關聯度關係來進行商品類目的確定。但是該方 法在進行商品類目的確定時,採用的是一種扁平狀的確定 方法,亦即,只確定了每個關鍵字與葉節點對應的商品類 目的關聯度,在進行商品類目的確定過程中,需要逐一與 每個葉節點對應的商品類目進行匹配,而一般葉節點對應 的商品類目成千上萬,這導致應用該方法確定商品類目的 過程耗時較長,效率較低。 201241773 [發明內容】 有鑒於此,本申請案之實施例提供一種商品類目資訊 的確定方法及裝置,用以解決現有確定商品類目效率低, 準確性差的問題。 本申請案之實施例提供的一種商品資訊與商品類目之 關聯度的確定方法,包括: 針對商品類目樹中每個商品類目對應的節點,確定該 節點的父節點; 針對該節點包含的每個商品標題資訊,進行以下步 驟: 對該商品標題資訊分詞,確定該商品標題資訊對 應的每個片語,其中,所述片語包括至少一個分詞;及 針對每個片語,根據該片語在該父節點對應的商 品類目包含的商品標題資訊中出現的次數,該片語在該節 點對應的商品類目包含的商品標題資訊中出現的次數,該 節點對應的商品類目包含的商品數量及與該父節點對應的 商品類目包含的商品數量,以確定該片語與該節點對應的 商品類目的關聯度値;以及 針對該節點而分別保存每個片語與該節點對應的 商品類目的關聯度値。 本申請案之實施例提供的一種基於上述關聯度的確定 方法以確定商品類目資訊的方法,包括: 接收商品標題資訊; 對該商品標題資訊進行分詞,確定該商品標題資訊對 纽. ·7 201241773 應的每個片語,其中,每個片語中包括至少一個分詞; 根據針對每個節點保存的每個片語與該節點對應的商 品類目的關聯度値,査找確定的每個片語與每個子節點的 關聯度; 根據査找到的每個片語與每個子節點的關聯度,以確 定包含該商品資訊的節點;以及 將確定的該子節點作爲父節點,確定該父節點的子節 點,直到將所述商品標題資訊對應的商品資訊掛靠到葉節 點對應的商品類目爲止。 本申請案之實施例提供的一種商品資訊與商品類目之 關聯度的確定裝置,包括: 節點確定模組,用以針對商品類目樹中每個商品類目 對應的節點,確定該節點的父節點; 控制模組,針對該節點包含的每個商品標題資訊,進 行以下步驟:對該商品標題資訊分詞,確定該商品標題資 訊對應的每個片語,其中所述片語包括至少一個分詞,針 對每個片語,根據該片語在該父節點對應的商品類目包含 的商品標題資訊中出現次數,該片語在該節點對應的商品 類目包含的商品標題資訊中出現的次數,該節點對應的商 品類目包含的商品數量及與該父節點對應的商品類目包含 的商品數量,以確定該片語與該節點對應的商品類目的關 聯度値;以及 關聯度確定模組,用以針對每個節點而分別保存每個 片語與該節點對應的商品類目的關聯度値》 9 -8- 201241773 本申請案之實施例提供的一種基於上述關聯度的確定 裝置以確定商品類目資訊的裝置,包括: 分詞模組,用以接收獲取的商品標題資訊,對該商品 標題資訊進行分詞,確定該商品標題資訊對應的每個片 語’其中,該片語中包括至少一個分詞; 查找模組,用以針對每個片語及與根節點連接的每個 子節點,根據保存的每個片語與每個節點對應的商品類目 的關聯度値,以查找每個片語與每個子節點的關聯度:以 及 商品類目確定模組,用以根據查找到的每個片語與每 個子節點的關聯度,確定包含該商品資訊的節點;將該子 節點作爲父節點,確定該父節點的子節點,直到將所述商 品標題資訊對應的商品掛靠到葉節點對應的商品類目爲 止0 本申請案之實施例提供了一種商品類目資訊的確定方 法及裝置,所述方法中,當獲取到商品標題資訊後,對該 商品標題資訊分詞構成相應的片語,針對每個片語及與根 節點連接的每個子節點,根據保存的每個片語與每個節點 對應的商品類目的關聯度値,查找每個片語與每個子節點 的關聯度,並確定包含該商品資訊的節點;將該子節點作 爲父節點,確定該父節點的子節點,直到將所述商品標題 資訊對應的商品掛靠到葉節點對應的商品類目爲止。由於 在本申請案之實施例中透過確定每個片語與每個商品類目 的關聯度,並且在確定的過程中從根節點開始依次查找包 -9 - • 201241773 含商品資訊的節點,由於與根節點連接的子節點的數量, 遠遠小於商品類目樹中包含的葉節點的數量,因此可以大 大地縮短確定商品掛靠的葉節點的時間,並且由於本申請 案之實施例中,從與根節點連接的子節點而依次確定包含 該商品資訊的子節點,從而可以保證商品掛靠的商品類目 確定的準確性。 【實施方式】 本申請案之實施例爲了提高確定商品所掛靠的商品類 目的準確性及效率,提供了一種商品類目資訊的確定方 法、系統及裝置,該方法透過確定每個片語與每個商品類 目的關聯度,並且在確定的過程中從根節點開始依次查找 包含商品資訊的節點,由於與根節點連接的子節點的數 量,遠遠小於商品類目樹中包含的葉節點的數量,因此可 以大大地縮短確定商品掛靠的葉節點的時間,並且由於本 申請案之實施例中’從與根節點連接的子節點依次確定包 含該商品資訊的子節點,從而可以保證商品掛靠的商品類 目確定的準確性。 下面結合說明書附圖,對本申請案之實施例進行詳細 說明。 具體地說,在本申請案之實施例中,資料庫中保存有 每個商品資訊與其掛靠的商品類目資訊的關係,該關係爲 用戶根據其提供的商品資訊與伺服器上提供的商品類目的 對應關係而選擇建立的。在該資料庫中保存的該商品資訊
S -10- 201241773 與其掛靠的商品類目資訊的關係可以用以下格式存在: 商品ID -商品標題資訊-商品歸屬的商品類目id。 其中,該商品歸屬的商品類目爲商品類目樹中的葉節 點對應的商品類目。在該商品類目樹中,只存在該葉節點 的父節點等上層節點,不存在該葉節點的子節點等下層節 點,亦即,該商品資訊只能掛靠在葉節點對應的商品類目 下。 另外’由於商品類目樹中存在父節點與子節點之間的 父子關係,當確定每個商品掛靠的商品類目時,透過與根 節點連接的子節點依次確定對應的每個節點,最終掛靠到 相應的葉節點下的。因此’在商品類目樹中,掛靠了商品 資訊的葉節點對應的父節點’ 一直到根節點都包含該商品 的資訊爲止。 圖1A爲本申請案之實施例提供的一種商品類目樹的 結構示意圖’在該圖1A中根節點的子節點包括“綠植園 藝” ‘‘ 3 C數位”和“女裝”等商品類目對應的節點,其 中商品類目“綠植園藝”對應的節點的子節點包括“花丼 盆栽”和“花種,,商品類目的節點,另外,“花舟盆栽” 商品類目對應的節點又包括子節點“球根花卉,,以及“芳 香花卉”對應的商品類目,並且“球根花卉”以及‘‘芳香 花舟爲葉節點對應的商品類目’商品資訊掛靠在葉節點 對應的商品類目下。當該商品資訊掛靠在葉子類目下時, 例如,掛靠在“球根花卉,,商品類目對應的葉節點下,此 時,該葉節點的父節點“花卉盆栽,,包含該商品資訊,並 -11 - 201241773 且“花舟盆栽’’節點的父節點“綠植園藝”也包含該商品 資訊。這是因爲’當某一商品資訊掛靠在對應的商品類目 對應的葉節點下後,在資料庫中除了保存該商品資訊與其 掛靠的商品類目資訊,還保存有透過該商品類目樹的節點 到達該葉節點的路徑,因此,在資料庫中保存的該商品資 訊與其掛靠的商品類目資訊的關係可以用以下格式存在: 商品ID-商品標題資訊-商品歸屬的商品類目的祖節點iD_ 商品歸屬的商品類目的父節點ID -商品歸屬的商品類目 ID。 圖1 B爲本申請案之實施例提供的商品類目資訊的確 定過程,該過程包括以下步驟: S101 :接收獲取的商品標題資訊,對該商品標題資訊 進行分詞’以確定該商品標題資訊對應的每個片語,其 中,每個片語中包括至少一個分詞。 其中,獲取商品標題資訊可以是,將接收到的用戶輸 入的商品標題資訊作爲獲取的商品標題資訊,也可以是在 將其他伺服器的商品資訊納入自身資料庫中時,將其他伺 服器中對該商品描述的商品標題資訊,作爲獲取的商品標 題資訊。 ^ 在本申請案之實施例中當獲取了商品標題資訊後,需 對該商品標題資訊進行分詞’在獲取每個分詞後,可以將 至少一個分片語成一個片語。 S102:針對每個片語及與根節點連接的每個子節點, 根據保存的每個片語與每個節點對應的商品類目的關聯度 -12- 201241773 値,以査找每個片語與每個子節點的關聯度。 在伺服器中保存有每個片語與每個節點對應的商品類 目的關聯度値,亦即,保存了該每個片語與每個商品類目 的關聯度値,當確定了每個片語後,可以根據保存的上述 關聯度値,以確定該商品標題資訊中每個片語與每個商品 類目的關聯度。 具體地說,當該片語中包含一個分詞時,所述查找每 個片語與每個子節點的關聯度包括:針對每個片語,根據 保存的每個片語與每個商品類目的關聯度値,以確定包含 該片語的每個商品類目對應的子節點;針對確定的每個子 節點,將保存的該片語與該子節點對應的商品類目的關聯 度値,作爲查找到的該片語與該子節點的關聯度。 S103:根據查找到的每個片語與每個子節點的關聯 度,以確定包含該商品資訊的節點。 確定包含該商品資訊的節點,包括:針對每個片語, 根據查找到的該片語與每個子節點的關聯度,選擇關聯度 較大的設定數量的子節點;針對選擇的每個子節點對應的 商品類目,根據該商品標題資訊中每個片語與該商品類目 的關聯度,以確定該商品標題資訊與該商品類目的總關聯 度;將總關聯度最大的商品類目,確定爲包含該商品資訊 的節點對應的商品類目。 S104:將該子節點作爲父節點,確定該父節點的子節 點,直到將所述商品標題資訊對應的商品掛靠到葉節點對 應的商品類目爲止。 -13- 201241773 本申請案之實施例提供的商品類目資訊的確定方法’ 透過確定每個片語與每個商品類目的關聯度,並且在確定 的過程中從根節點開始依次査找包含商品資訊的節點’由 於與根節點連接的子節點的數量,遠遠小於商品類目樹中 包含的葉節點的數量,因此可以大大地縮短確定商品掛靠 的葉節點的時間,並且由於本申請案之實施例中,從與根 節點連接的子節點依次確定包含該商品資訊的子節點,從 而可以保證商品掛靠的商品類目確定的準確性。 在確定商品歸屬的商品類目之前,需要確定並保存每 個片語與每個節點對應的商品類目的關聯度値,該每個片 語與商品類目的關聯度値可以根據經驗値而設定,但是爲 了提高確定的商品類目資訊的準確性,本申請案之實施例 提供了 一種商品資訊與商品類目之關聯度的確定方法。 圖2A爲本申請案之實施例提供的商品資訊與商品類 目之關聯度的確定及商品類目資訊確定過程,由於在本申 請案之實施例中當用戶上傳商品資訊時,透過登錄伺服器 而將商品資訊錄入,伺服器爲用戶提供其保存的商品類目 樹,用戶透過由根節點不斷的選擇子孫節點,爲其商品資 訊選擇一個葉節點對應的商品類目,此時在伺服器中將該 商品資訊掛靠在該商品類目下,其中,該伺服器可以爲 WEB伺服器。當伺服器將該商品資訊掛靠在該商品類目 下後,將該資訊發送到資料庫,由於涉及資料信息量龐 大,因此可採用雲端計算平臺來予以實現,亦即,由資料 庫週期性的將該資訊導入到雲端計算平臺’例如該雲端計 5 -14- 201241773 算平臺可以爲Hadoop。 由於商品資訊與其掛靠的商品類目資訊的都保存到了 雲端計算平臺,因此雲端計算平臺可以對自身保存的資訊 進行分析,確定每個片語與每個商品類目的關聯度値。具 體的雲端計算平臺在確定每個片語與每個商品類目的關聯 度値時,可以採用分散式分析系統來予以確定。 雲端計算平臺確定了每個片語與每個商品類目的關聯 度値後,將每個片語與每個商品類目的關聯度的資訊發送 到伺服器保存,以便伺服器在確定商品類目資訊時’可以 根據該每個片語與每個商品類目的關聯度値來予以確定。 圖2B爲本申請案之實施例提供的商品資訊與商品類 目之關聯度的確定過程,該過程包括以下步驟: S20 1 :針對商品類目樹中每個商品類目對應的節點’ 確定該節點的父節點。 具體地說,在本申請案之實施例中,商品類目爲每種 商品所歸屬的種類,每個商品類目與商品類目樹中的某個 節點對應,最終掛靠商品資訊的節點爲葉節點。並且商品 類目樹中由根節點開始,節點之間存在連接關係,對於根 節點存在與其連接的子節點,對於葉節點存在與其連接的 父節點,對應中間節點即存在與其連接的父節點,也存在 與其連接的子節點。 當確定商品資訊與商品類目的關聯度時,爲了保證確 定的商品類目的準確性,需要針對每個節點確定相對應片 語與該節點的關聯度値。 -15- 201241773 S 2 02 :針對該節點包含的每個商品標題資訊,進行以 下步驟:對該商品標題資訊分詞,確定該商品標題資訊對 應的每個片語,其中,所述片語包括至少一個分詞,針對 每個片語,根據該片語在該父節點對應的商品類目包含的 商品標題資訊中出現的次數,該片語在該節點對應的商品 類目包含的商品標題資訊中出現的次數,該節點對應的商 品類目包含的商品數量及與該父節點對應的商品類目包含 的商品數量,以確定該片語與該節點對應的商品類目的關 聯度値。 具體地說,確定該片語與該節點對應的商品類目的關 聯度値包括:根據該片語在該節點對應的商品類目包含的 商品標題資訊中出現的次數,及該節點對應的商品類目包 含的商品數量,以確定該片語與該節點對應的商品類目的 第一權重値;根據該片語在該父節點對應的商品類目包含 的商品標題資訊中出現次數,該片語在該節點對應的商品 類目包含的商品標題資訊中出現的次數,該節點對應的商 品類目包含的商品數量及與該父節點對應的商品類目包含 的商品數量,以確定該片語與該父節點對應的商品類目中 其他商品類目的第二權重値;確定第一權重値與第二權重 値的差値,根據該差値與第一權重値的商,以確定該片語 與該節點對應的商品類目的關聯度値。 S 2 03 :針對每個節點而分別保存每個片語與該節點對 應的商品類目的關聯度値。 在本申請案之實施例中在確定片語與商品類目的關聯 e -16- 201241773 度時’是針對該商品類目樹中的每個節點對應的商品類 目,分別確定該商品類目與相應片語的關聯度。 在確定每個片語與每個商品類目的關聯度値時,由於 每個節點對應的商品類目包含的商品資訊是可知的,因此 可以針對每個節點’確定該節點的父節點,針對該節點包 含的每個商品的商品標題資訊,確定該商品標題資訊中的 每個片語與該節點對應的商品類目的關聯度値。並且在本 申請案之實施例中可以針對每兩個存在父子關係的節點, 確定該子節點包含的每個商品的商品標題資訊中每個片語 與該子節點對應的商品類目的關聯度値。 仍以圖1 A爲例,當確定每個片語與“花卉盆栽”節 點的關聯度時,根據該商品類目樹可知該節點的父節點爲 “綠植園藝”節點,針對“花卉盆栽”節點包含的每個商 品的商品標題資訊,以確定該商品標題資訊中的每個片語 與該“花卉盆栽”節點的關聯度。當確定每個片語與“綠 植園藝”節點關聯度時’根據該商品類目樹可知該節點的 父節點爲根節點,針對“綠植園藝”節點包含的每個商品 的商品標題資訊,確定該商品標題資訊中的每個片語與該 “綠植園藝”節點的關聯度値。 具體的在進行關聯度値的計算時,可以以葉節點到根 節點的方向’依次確定每個節點與每個片語的關聯度値, 也可以以根節點到葉節點的方向,依次確定每個節點與每 個片語的關聯度値》 具體的在確定每個片語與每個商品類目的關聯度値 -17- 201241773 時,針對該商品類目對應的節點中包含的每個商品的商品 標題資訊,將該商品標題資訊進行分詞,將其中至少一個 分詞構成片語,確定該商品標題資訊對應的每個片語,針 對每個片語根據該片語與該節點的父節點對應的商品類目 包含的商品標題資訊中出現次數,該片語在該節點對應的 商品類目包含的商品標題資訊中出現的次數,該節點對應 的商品類目包含的商品數量及與該父節點對應的商品類目 包含的商品數量,確定該片語與該節點對應的商品類目的 關聯度値。 具體的確定該片語與該節點對應的商品類目的關聯度 値包括: 根據該片語在該節點對應的商品類目包含的商品標題 資訊中出現的次數,及該節點對應的商品類目包含的商品 數量,以確定該片語與該節點對應的商品類目的第一權重 値; 根據該片語在該父節點對應的商品類目包含的商品標 題資訊中出現次數,該片語在該節點對應的商品類目包含 的商品標題資訊中出現的次數,該節點對應的商品類目包 含的商品數量及與該父節點對應的商品類目包含的商品數 量,以確定該片語與該父節點對應的商品類目中其他商品 類目的第二權重値;以及 確定第一權重値與第二權重値的差値,根據該差値與 第一權重値的商,以確定該片語與該節點對應的商品類目 的關聯度値》
S -18- 201241773 確定該片語與該節點對應的商品類目的第一權重値, 包括: 根據該片語在該節點對應的商品類目包含的商品標題 資訊中出現的次數,及該節點對應的商品類目包含商品數 量的商値,以確定第一權重値》 下面以一個具體的例子進行說明。當商品ID爲 “ 1 000”的商品資訊掛靠在“球根花卉”商品類目對應的 葉節點下時,根據商品類目樹,可知“球根花卉”商品類 目對應的葉節點’其父節點對應的商品類目爲“花卉盆 -*»i\ », 栽 。 當商品ID爲“ 1 〇〇〇”的商品資訊的商品標題資訊爲 “風信子水培紫色風信子種球可盆栽”,將該商品標題資 訊進行分詞’針對分詞“風信子”構成的片語,確定片語 風信子與商品類目“球根花卉”的關聯度値。 例如與“花卉盆栽”商品類目關聯的商品數量爲 1 6239 1 2 ’掛靠在“球根花卉“商品類目下的商品數量爲 1 0 4286,並且片語“風信子”在“球根花卉”商品類目下 的商品標題資訊中出現的次數爲6588,在與“花卉盆 栽”商品類目關聯的商品的商品標題資訊中出現次數爲 2 0 6 8 3,則可知風信子相對於其所掛靠的“球根花卉”商 品類目的第一權重値爲6588/104286,風信子與該“花舟 盆栽”商品類目中其他商品類目的第二權重値爲(20683-650 )/( 16239 1 2- 1 04286 ),因此可知風信子與“球根 花卉“商品類目的關聯度値爲[6588/104286-( 20683- -19- 201241773 6588) /( 1623912-104286) ]/( 6588/104286),即爲 85.3%。 由於該商品標題資訊“風信子水培紫色風信子種球可 盆栽”包含在“花卉盆栽”節點中,當確定該商品標題資 訊中每個片語與“花卉盆栽”節點的關聯度値時,根據該 “花卉盆栽”節點的父節點“綠植園藝”包含的每個商品 的資訊確定,其過程與上述過程相同,這裏就不——贅 述。 上述爲確定片語與每個商品類目的關聯度的過程,並 且該過程是以該片語包括一個分詞進行說明的,由於該分 詞中可以包括至少一個分詞,當該片語中包含兩個以上的 分詞時,將該兩個以上的分詞作爲一個片語,根據上述確 定方法,確定該片語與每個商品類目的關聯度。該兩個以 上分詞可以是該商品標題資訊中的任意兩個以上的分詞, 並且該兩個以上分詞的組成前後順序不限於該商品標題資 訊中的該兩個以上分詞的前後順序’例如當片語中包含兩 個分詞時,該片語中的兩個分詞可以爲“風信子”和“紫 色”,也可以是“紫色”和“水培” ’或者是“盆栽”和 “水培”等,只要是任意兩個分詞構成的片語即可。這是 因爲對於商品標題資訊中可能包括多個產品詞對應的分 詞,根據上述方式確定每個分詞與對應商品類目的關聯度 相差不大,爲了進一步提高確定商品類目的準確性,需要 結合包含至少兩個分詞的片語’與每個商品類目的關聯度 値,以確定每個商品所掛靠的商品類目。
S -20- 201241773 例如對於3 C行業中的數位產品和數位產品配件’經 常出現商品標題資訊多個分詞與多個商品類目的關聯度相 當,僅依據單個分詞與每個商品類目的關聯度’很難透過 商品標題資訊判斷一個商品究竟屬於哪個商品類目。例 如’當商品標題資訊爲‘品勝正品二星Galaxy S i9000 手機電池”,根據該商品標題資訊,可以確定該商品的 資訊與商品類目“手機”和“手機電池”的關聯度不相上 下。爲了解決這個問題’可以確定包含至少兩個分詞的片 語,對於每個商品類目的關聯度’例如確定片語“手機電 池”與商品類目“手機電池”的關聯度,透過該方法,可 以確定該商品的資訊與商品類目“手機電池”的關聯度較 大。 這裏爲了簡便,當該片語中包含一個分詞時,可以將 片語與每個商品類目的關聯度値作爲一階表徵向量,將至 少兩個分片語成的每個片語與每個商品類目的關聯度値作 爲二階表徵向量。 當確定並保存了每個片語與每個商品類目的關聯度値 後,獲取了商品標題資訊後,可以根據該商品標題資訊, 確定該商品標題資訊對應的商品所歸屬的商品類目。 由於將每個片語與每個商品類目的關聯度保存在了伺 服器中,在確定每個商品歸屬的商品類目時,可以透過線 上即時預測系統來進行查找並確定每個商品所歸屬的商品 類目,其中,該線上即時預測系統可以位於伺服器中,例 如,爲植入了 Apache模組的WEB伺服器。該Apache模 -21 - 201241773 組具體的可以透過控制模組和確定模組來予以實現,如圖 3所示。 在確定商品歸屬的商品類目時,可以是用戶在將商品 資訊上傳到伺服器時,向伺服器發送商品類目確定請求, 當伺服器接收到該商品類目確定請求後,提示用戶輸入該 商品的商品標題資訊,根據該商品標題資訊,以及保存的 每個片語與每個商品類目的關聯度値,以確定每個商品歸 屬的商品類目。也可以是在伺服器在將其他伺服器中保存 的商品資訊納入自身的資料庫中時,識別並獲取到每個商 品的商品標題資訊後,根據保存的每個片語與每個商品類 目的關聯度値,以確定每個商品歸屬的商品類目。其具體 的實現過程,可以根據需要而靈活設定。 在確定商品歸屬商品類目的過程中,當獲取了商品標 題資訊後,爲了提高確定的商品歸屬的商品類目的準確 性,可以首先對該商品標題資訊進行歸一化處理,確定將 該商品標題資訊中的每個字元,對應的標準字元’例如當 商品標題資訊中存在英文的大寫和小寫時’伺服器認爲的 標準字元爲英文大寫,則將該商品標題資訊中的英文小 寫,調整爲大寫。之後將該商品標題資訊進行分詞’並根 據保存的停用詞資訊表,過濾掉保存在該停用詞資訊表中 的分詞,針對過濾後得到的每個分詞’確定該商品歸屬的 商品類目。 另外,由於在本申請案之實施例中可以確定每個片語 與每個商品類目的關聯度,該片語包括至少一個分詞’因 -22- 201241773 此在伺服器在保存每個片語與每個商品類目的關聯度値 時,可以針對一個分詞,兩個或多個分詞分別保存每個片 語與每個商品類目的關聯度値,亦即,在伺服器中保存有 關聯度關係表,其中,一個表中記錄的爲每個分詞與每個 商品類目的關聯度値,另一個表中記錄的爲由至少兩個分 詞構成的片語與每個商品類目的關聯度値。 當確定每個商品歸屬的商品類目時,由於已經確定了 每個商品標題資訊中的每個分詞,將至少一個分片語成一 個片語,可以首先根據與根節點連接的該根節點的每個子 節點,根據保存的該每個子節點與每個片語的關聯度値, 確定每個片語與該每個子節點的關聯度,根據該商品標題 資訊中每個片語與該每個子節點的關聯度,以確定包含該 商品標題資訊的子節點,之後將該子節點作爲父節點,確 定該父節點的子節點,依據上述步驟,確定該商品標題資 訊中每個片語與該每個子節點的關聯度,確定包含該商品 標題資訊的子節點,直到將所述商品標題資訊對應的商品 掛靠到葉節點對應的商品類目爲止。 並且在確定該商品標題資訊對應的商品掛靠的葉節點 對應的商品類目時,可以首先針對每個分詞,分別査找每 個分詞與每個商品類目的關聯度。爲了提高確定的商品類 目的準確性,只有在某一分詞與某一商品類目的關聯度大 於設定的關聯度閾値時,才確定該分詞與其他分詞構成的 片語,查找該片語與每個商品類目的關聯度。 圖4爲本申請案之實施例提供的商品歸屬商品類目的 -23- 201241773 詳細確定過程,該過程包括以下步驟: 5401 :伺服器接收用戶所在的用戶端發送的商品類目 確定請求; 5402 :伺服器根據接收到的商品類目確定請求,提示 並獲取用戶輸入的商品標題資訊; 5403 :對該商品標題資訊進行歸一化、分詞及過濾處 理,以得到該商品標題資訊對應的每個分詞; S4 04 :提取該商品標題資訊對應的分詞中一個,將提 取的該分詞作爲目前關聯度確定的分詞,針對該提取的分 詞,以及與根節點連接的每個子節點,根據保存的每個片 語與該每個子節點對應的商品類目的關聯度値,査找該片 語與每個子節點的關聯度; 5405 :判斷查找到的該分詞與每個子節點對應的商品 類目的關聯度中,是否存在超過設定的關聯度閾値的關聯 度,當存在時,進行步驟S407,否則,進行步驟S406; 5406 :判斷該分詞是否爲該商品標題資訊中的最後一 個分詞,當判斷結果爲是時,進行步驟S408,否則,轉 步驟S404 ; 5407 :將該分詞與該分詞之後的至少一個分詞構成片 語,針對該片語,以及與根節點連接的每個子節點,根據 保存的每個片語與該每個子節點對應的商品類目的關聯度 値,査找該片語與每個子節點的關聯度; S4 08 :針對查找的每個片語與每個子節點的關聯度, 選擇關聯度較大的設定數量的子節點; -24-
S 201241773 S4〇9 :針對選擇的每個子節點對應的商品類目,根據 該商品標題資訊中每個分詞與該商品類目的關聯度,確定 該商品標題資訊與該商品類目的第一總關聯度度,根據每 個片語與該商品類目的關聯度,確定該商品標題資訊與該 商品類目的第二總關聯度度; S410:根據該商品標題資訊與每個商品類目的第一總 關聯度和第二總關聯度,確定該商品標題資訊與每個商品 類目的總關聯度,將總關聯度最大的商品類目,確定爲包 含該商品資訊的節點對應的商品類目;以及 S4U:將包含該商品資訊的節點作爲父節點,確定該 父節點的子節點,返回步驟S404,直到將所述商品標題 資訊對應的商品掛靠到葉節點對應的商品類目爲止。 具體地說,例如,當該商品的商品標題資訊包括分詞 A、B、C時’該設定數量的商品類目.爲3,下表爲該商品 標題資訊中包含的每個分詞與每個商品類目的關聯度値: 商品 \類目 分詞 R1 R2 R3 R4 R5 A 50% 83% 62% B 40% 20% 37% C 42% 57% 32% AB 20% 40% 30% AC 10% 30% 40% 根節點包含的子節點對應的商品類目分別爲R1、 R2、R3,並且確定分詞A與商品類目ri、R2、R3的關 聯度値分別爲 5 0 %、8 3 %和6 2 %,分詞b與商品類目 -25- 201241773 R1、R3、R5的關聯度値分別爲40%、20%和37% ’分詞 C與商品類目R 1、R 2、R4的關聯度値分別爲4 2 °/〇、5 7 % 和3 2%,該設定的關聯度閩値爲70% ’確定分詞A與分詞 B構成的片語與商品類目Rl、R2、R5的關聯度値分別爲 2 0%、40%和3 0%,分詞A與分詞C構成的片語與商品類 目Rl、R2、R3的關聯度値分別爲10%、30%和40%。則 可以確定該商品標題資訊與商品類目R1的第一總關聯度 値爲1 3 2%,該商品標題資訊與商品類目R2的第一總關聯 度値爲1 40%,該商品標題資訊與商品類目R3的第一總關 聯度値爲82%,該商品標題資訊與商品類目R4的第一總 關聯度値爲32%,該商品標題資訊與商品類目R5的第一 總關聯度値爲37%。 另外,也可以確定該商品標題資訊與商品類目R1的 第二總關聯度値爲30%,該商品標題資訊與商品類目R2 的第二總關聯度値爲70%,商品標題資訊與商品類目R3 的第二總關聯度値爲40%,商品標題資訊與商品類目 R5 的第二總關聯度値爲3 0%。 因此,該商品標題資訊與商品類目R1的總關聯度値 爲1 62%,該商品標題資訊與商品類目R2的總關聯度値爲 2 1 〇%,該商品標題資訊與商品類目R3的總關聯度値爲 1 22% ’該商品標題資訊與商品類目R4的總關聯度値爲 3 2% ’該商品標題資訊與商品類目R5的總關聯度値爲 67°/。’因此可知包含該商品資訊的節點爲商品類目r2對 應的節點。之後,以該節點爲父節點,確定該父節點的子 節點’在該子節點中採用上述方法,確定包含該商品資訊
S -26- 201241773 節點,在該子節點中採用上述方法,確定包含該商品資訊 的節點,之後再以該節點爲父節點,確定該父節點的子節 點依次採用上述方法,直到將所述商品標題資訊對應的商 品掛靠到葉節點對應的商品類目。 圖5爲本申請案之實施例提供的一種商品資訊與商品 類目之關聯度的確定裝置結構示意圖,該裝置包括: 節點確定模組5 1,用以針對商品類目樹中每個商品 類目對應的節點,確定該節點的父節點; 控制模組52,針對該節點包含的每個商品標題資 訊,進行以下步驟:對該商品標題資訊分詞,確定該商品 標題資訊對應的每個片語,其中,所述片語包括至少一個 分詞,針對每個片語,根據該片語在該父節點對應的商品 類目包含的商品標題資訊中出現的次數,該片語在該節點 對應的商品類目包含的商品標題資訊中出現的次數,該節 點對應的商品類目包含的商品數量及與該父節點對應的商 品類目包含的商品數量,以確定該片語與該節點對應的商 品類目的關聯度値;以及 關聯度確定模組5 3,用以針對每個節點分別保存每 個片語與該節點對應的商品類目的關聯度値。 所述控制模組52,具體上用以根據該片語在該節點 對應的商品類目包含的商品標題資訊中出現的次數,及該 節點對應的商品類目包含的商品數量,確定該片語與該節 點對應的商品類目的第一權重値;根據該片語在該父節點 對應的商品類目包含的商品標題資訊中出現次數,該片語 -27- 201241773 在該節點對應的商品類目包含的商品標題資訊中出現的次 數,該節點對應的商品類目包含的商品數量及與該父節點 對應的商品類目包含的商品數量,確定該片語與該父節點 對應的商品類目中其他商品類目的第二權重値;以及確定 第一權重値與第二權重値的差値,根據該差値與第一權重 値的商,確定該片語與該節點對應的商品類目的關聯度 値。 所述控制模組5 2,具體上用以根據該片語在該節點 對應的商品類目包含的商品標題資訊中出現的次數,及該 節點對應的商品類目包含商品數量的商値,以確定第一權 重値。 所述控制模組52,具體上用以確定該片語在該父節 點對應的商品類目包含的商品標題資訊中出現次數,及該 片語在該節點對應的商品類目包含的商品標題資訊中出現 的次數的第一差値;確定該父節點對應的商品類目包含的 商品數量,及該節點對應的商品類目包含的商品數量的第 二差値;以及根據第一差値與第二差値的商値,以確定該 第二權重値。 圖6爲本申請案之實施例提供的一種基於上述圖6的 關聯度的確定裝置以確定商品類目資訊的裝置結構示意 圖,該裝置包括: 分詞模組6 1,用以接收獲取的商品標題資訊,對該 商品標題資訊進行分詞,確定該商品標題資訊對應的每個 片語,其中,該片語中包括至少一個分詞;
S -28- 201241773 查找模組62,用以針對每個片語及與根節點連接的 每個子節點,根據保存的每個片語與每個節點對應的商品 類目的關聯度値,以查找每個片語與每個子節點的關聯 度;以及 商品類目確定模組63,用以根據查找到的每個片語 與每個子節點的關聯度,確定包含該商品資訊的節點;將 該子節點作爲父節點,確定該父節點的子節點,直到將所 述商品標題資訊對應的商品掛靠到葉節點對應的商品類目 爲止。 所述査找模組62,具體上用以當該片語中包含一個 分詞時,針對每個片語,根據保存的每個片語與每個商品 類目的關聯度値,確定包含該片語的每個商品類目對應的 子節點;針對確定的每個子節點,將保存的該片語與該子 節點對應的商品類目的關聯度,作爲查找到的該片語與該 子節點的關聯度》 所述査找模組62,還用以判斷查找到的該片語與該 子節點的關聯度是否大於設定的關聯度閾値;當判斷結果 爲是時,將所述分詞與該商品標題資訊中的其他分片語成 片語,查找該片語與每個商品類目的關聯度。 所述商品類目確定模組63 ’具體上用以針對每個片 語,根據查找到的該片語與每個子節點的關聯度’選擇關 聯度較大的設定數量的子節點:針對選擇的每個子節點對 應的商品類目,根據該商品標題資訊中每個片語與該商品 類目的關聯度,確定該商品標題資訊與該商品類目的總關 -29- 201241773 聯度;將總關聯度最大的商品類目,確定爲包含該商品資 訊的節點對應的商品類目。 本申請案之實施例提供了一種商品類目資訊的確定方 法及裝置,方法中,當獲取到商品標題資訊後’對該商品 標題資訊分詞構成相應的片語,針對每個片語及與根節點 連接的每個子節點,根據保存的每個片語與每個節點對應 的商品類目的關聯度値,査找每個片語與每個子節點的關 聯度,並確定包含該商品資訊的節點:將該子節點作爲父 節點,確定該父節點的子節點,直到將所述商品標題資訊 對應的商品掛靠到葉節點對應的商品類目爲止。由於在本 申請案之實施例中透過確定每個片語與每個商品類目的關 聯度,並且在確定的過程中從根節點開始依次查找包含商 品資訊的節點,由於與根節點連接的子節點的數量,遠遠 小於商品類目樹中包含的葉節點的數量,因此可以大大地 縮短確定商品掛靠的葉節點的時間,並且由於本申請案之 實施例中,從與根節點連接的子節點而依次確定包含該商 品資訊的子節點’從而可以保證商品掛靠的商品類目確定 的準確性。 顯然,本領域的技術人員可以對本申請案之進行各種 修改和變型而不脫離本申請案的精神和範圍。這樣,倘若 本申請案的這些修改和變型屬於本申請案之申請專利範圍 及其等同技術的範圍之內,則本申請案也意圖包含這些修 改和變型在內。
S -30- 201241773 【圖式簡單說明】 圖1A爲本申請案之實施例提供的一種商品類目樹的 結構示意圖; 圖1B爲本申請案之實施例提供的商品類目資訊的確 定過程; 圖2A爲本申請案之實施例提供的商品資訊與商品類 目之關聯度的確定過程,有關之各個系統的組成結構示意 圖; 圖2B爲本申請案之實施例提供的商品資訊與商品類 目之關聯度的確定過程; 圖3爲本申請案之實施例提供的該apache模組具體 之可以透過控制模組和確定模組實現結構示意圖; 圖4爲本申請案之實施例提供的商品類目資訊的詳細 確定過程; 圖5爲本申請案之實施例提供的一種商品資訊與商品 類目之關聯度的確定裝置結構示意圖; 圖6爲本申請案之實施例提供的一種基於上述圖5的 關聯度的確定裝置以確定商品類目資訊的裝置結構示意 圖。 【主要元件符號說明】 5 1 :節點確定模組 52 :控制模組 53 :關聯度確定模組 -31 - 201241773 6 1 :分詞模組 62 :查找模組 63 :商品類目確定模組 -32-
S

Claims (1)

  1. 201241773 七、申請專利範圍 1. 一種商品資訊與商品類目之關聯度的確定方法, 其特徵在於,包括: 針對商品類目樹中每個商品類目對應的節點,確定該 節點的父節點; 針對該節點包含的每個商品標題資訊,進行以下步 驟: 對該商品標題資訊分詞,確定該商品標題資訊對 應的每個片語,其中,該片語包括至少一個分詞;及 針對每個片語,根據該片語在該父節點對應的商 品類目包含的商品標題資訊中出現的次數,該片語在該節 點對應的商品類目包含的商品標題資訊中出現的次數,該 節點對應的商品類目包含的商品數量及與該父節點對應的 商品類目包含的商品數量,以確定該片語與該節點對應的 商品類目的關聯度値;以及 針對該節點而分別保存每個片語與該節點對應的 商品類目的關聯度値。 2. 如申請專利範圍第1項所述的方法,其中,該確 定該片語與該節點對應的商品類目的關聯度値包括: 根據該片語在該節點對應的商品類目包含的商品標題 資訊中出現的次數,及該節點對應的商品類目包含的商品 數量,以確定該片語與該節點對應的商品類目的第一權重 値; 根據該片語在該父節點對應的商品類目包含的商品標 -33- 201241773 題資訊中出現的次數,該片語在該節點對應的商品類目包 含的商品標題資訊中出現的次數,該節點對應的商品類目 包含的商品數量及與該父節點對應的商品類目包含的商品 數量,以確定該片語與該父節點對應的商品類目中其他商 品類目的第二權重値:以及 確定該第一權重値與該第二權重値的差値,根據該差 値與該第一權重値的商,以確定該片語與該節點對應的商 品類目的關聯度値。 3. 如申請專利範圍第2項所述的方法,其中,該確 定該片語與該節點對應的商品類目的第一權重値,包括: 根據該片語在該節點對應的商品類目包含的商品標題 資訊中出現的次數,及該節點對應的商品類目包含商品數 量的商値,以確定第一權重値。 4. 如申請專利範圍第2項所述的方法,其中,該確 定該片語與該父節點對應的商品類目中其他商品類目的第 二權重値,包括: 確定該片語在該父節點對應的商品類目包含的商品標 題資訊中出現的次數,及該片語在該節點對應的商品類目 包含的商品標題資訊中出現的次數的第一差値; 確定該父節點對應的商品類目包含的商品數量,及該 節點對應的商品類目包含的商品數量的第二差値;以及 根據該第一差値與該第二差値的商値,以確定該第二 權重値。 5- 一種基於如申請專利範圍第1項的關聯度的確定 -34- S 201241773 方法以確定商品類目資訊的方法,其特徵在於,該方法包 括: 接收商品標題資訊: 對該商品標題資訊進行分詞,以確定該商品標題資訊 對應的每個片語,其中,每個片語中包括至少一個分詞: 根據針對每個節點保存的每個片語與該節點對應的商 品類目的關聯度値,以查找確定的每個片語與每個子節點 的關聯度; 根據査找到的每個片語與每個子節點的關聯度,以確 定包含該商品資訊的節點;以及 將確定的該子節點作爲父節點,確定該父節點的子節 點,直到將該商品標題資訊對應的商品資訊掛靠到葉節點 對應的商品類目爲止。 6-如申請專利範圍第5項所述的方法,其中,當該 片語中包含一個分詞時,該查找每個片語與每個子節點的 關聯度包括: 針對每個片語,根據保存的每個片語與每個商品類目 的關聯度値,以確定包含該片語的每個商品類目對應的子 節點;以及 針對確定的每個子節點,將保存的該片語與該子節點 對應的商品類目的關聯度値,作爲查找到的該片語與該子 節點的關聯度。 7 ·如申請專利範圍第6項所述的方法,其中,該方 法還包括: -35- 201241773 判斷查找到的該片語與該子節點的關聯度是否大於設 定的關聯度閾値;以及 當判斷結果爲是時,將該分詞與該商品標題資訊中的 其他分片語成片語’査找該片語與每個商品類目的關聯 度。 8. 如申請專利範圍第5項所述的方法,其中,根據 査找到的每個片語與每個子節點的關聯度,以確定包含該 商品資訊的節點,包括: 針對每個片語,根據査找到的該片語與每個子節點的 關聯度,選擇關聯度較大的設定數量的子節點: 針對選擇的每個子節點對應的商品類目,根據該商品 標題資訊中每個片語與該商品類目的關聯度,以確定該商 品標題資訊與該商品類目的總關聯度;以及 將總關聯度最大的商品類目,確定爲包含該商品資訊 的節點對應的商品類目。 9. 一種商品資訊與商品類目之關聯度的確定裝置, 其特徵在於,包括: 節點確定模組,用以針對商品類目樹中每個商品類目 對應的節點,確定該節點的父節點; 控制模組,針對該節點包含的每個商品標題資訊,進 行以下步驟:對該商品標題資訊分詞,確定該商品標題資 訊對應的每個片語,其中,該片語包括至少一個分詞,針 對每個片語,根據該片語在該父節點對應的商品類目包含 的商品標題資訊中出現的次數,該片語在該節點對應的商 -36- 201241773 品類目包含的商品標題資訊中出現的次數,該節點對應的 商品類目包含的商品數量及與該父節點對應的商品類目包 含的商品數量,以確定該片語與該節點對應的商品類目的 關聯度値;以及 關聯度確定模組,用以針對每個節點而分別保存每個 片語與該節點對應的商品類目的關聯度値。 10. —種基於如申請專利範圍第9項的關聯度的確定 裝置以確定商品類目資訊的裝置,其特徵在於,該裝置包 括: 分詞模組,用以接收獲取的商品標題資訊,對該商品 標題資訊進行分詞,確定該商品標題資訊對應的每個片 語,其中,該片語中包括至少一個分詞; 查找模組’用以針對每個片語及與根節點連接的每個 子節點’根據保存的每個片語與每個節點對應的商品類目 的關聯度値,查找每個片語與每個子節點的關聯度;以及 商品類目確定模組,用以根據査找到的每個片語與每 個子節點的關聯度,確定包含該商品資訊的節點;將該子 節點作爲父節點,確定該父節點的子節點,直到將該商品 標題資訊對應的商品掛靠到葉節點對應的商品類目爲止。
    -37-
TW100131503A 2011-04-14 2011-09-01 Method and apparatus of determining product category information TW201241773A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110093430.9A CN102737057B (zh) 2011-04-14 2011-04-14 一种商品类目信息的确定方法及装置

Publications (1)

Publication Number Publication Date
TW201241773A true TW201241773A (en) 2012-10-16

Family

ID=46992577

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100131503A TW201241773A (en) 2011-04-14 2011-09-01 Method and apparatus of determining product category information

Country Status (7)

Country Link
US (2) US9047369B2 (zh)
EP (1) EP2697709A4 (zh)
JP (2) JP5956558B2 (zh)
CN (1) CN102737057B (zh)
HK (1) HK1171096A1 (zh)
TW (1) TW201241773A (zh)
WO (1) WO2012141934A1 (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102737057B (zh) 2011-04-14 2015-04-01 阿里巴巴集团控股有限公司 一种商品类目信息的确定方法及装置
CN103902545B (zh) * 2012-12-25 2018-10-16 北京京东尚科信息技术有限公司 一种类目路径识别方法及系统
US9460455B2 (en) * 2013-01-04 2016-10-04 24/7 Customer, Inc. Determining product categories by mining interaction data in chat transcripts
US9064230B2 (en) 2013-01-31 2015-06-23 Wal-Mart Stores, Inc. Ranking keywords for product types with manual curation
WO2015016133A1 (ja) * 2013-07-30 2015-02-05 日本電信電話株式会社 情報管理装置及び情報管理方法
CN105446974B (zh) * 2014-06-20 2019-01-15 联想(北京)有限公司 信息处理方法及装置
CN105589853B (zh) * 2014-10-20 2017-09-15 阿里巴巴集团控股有限公司 一种类目目录确定方法及装置、自动分类方法及装置
CN104408635A (zh) * 2014-12-01 2015-03-11 银联智惠信息服务(上海)有限公司 商户类别信息识别方法和装置
CN105718457B (zh) * 2014-12-01 2021-03-26 航天信息股份有限公司 基于电子票据的信息推送方法及系统
US10459608B2 (en) 2014-12-01 2019-10-29 Ebay Inc. Mobile optimized shopping comparison
US10831771B2 (en) * 2015-07-06 2020-11-10 Sap Se Interactive exploration of large graphs
CN106919625B (zh) * 2015-12-28 2021-04-09 中国移动通信集团公司 一种互联网用户属性识别方法和装置
CN105931082B (zh) * 2016-05-17 2020-02-11 北京奇虎科技有限公司 一种商品类目关键词提取方法和装置
US11580589B2 (en) 2016-10-11 2023-02-14 Ebay Inc. System, method, and medium to select a product title
CN110309144A (zh) * 2018-03-22 2019-10-08 北京新媒传信科技有限公司 一种运用redis构建树形数据结构的方法及装置
CN109377316B (zh) * 2018-10-25 2024-07-02 平安科技(深圳)有限公司 资产管理方法、装置、计算机设备及存储介质
CN111190933B (zh) * 2019-12-27 2022-08-12 江苏艾佳家居用品有限公司 基于区间数的电商类目深度查询方法
US11568425B2 (en) * 2020-02-24 2023-01-31 Coupang Corp. Computerized systems and methods for detecting product title inaccuracies
CN112053210B (zh) * 2020-09-11 2023-12-05 深圳市梦网视讯有限公司 一种基于商品社区分类的关联值传播方法、系统及设备
CN112801720B (zh) * 2021-04-12 2021-07-09 连连(杭州)信息技术有限公司 一种店铺类目识别模型生成、店铺类目识别的方法及装置
CN113420196A (zh) * 2021-06-07 2021-09-21 青岛海信智慧生活科技股份有限公司 一种商品类别确定方法、装置、设备及介质
CN113779243A (zh) * 2021-08-16 2021-12-10 深圳市世强元件网络有限公司 一种商品自动分类方法、装置及计算机设备
CN114387524B (zh) * 2022-03-24 2022-06-03 军事科学院系统工程研究院网络信息研究所 基于多层级二阶表征的小样本学习的图像识别方法和系统
US11941076B1 (en) * 2022-09-26 2024-03-26 Dell Products L.P. Intelligent product sequencing for category trees

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3441500B2 (ja) * 1993-05-17 2003-09-02 株式会社リコー 文書分類装置
US7082426B2 (en) * 1993-06-18 2006-07-25 Cnet Networks, Inc. Content aggregation method and apparatus for an on-line product catalog
JPH09223150A (ja) * 1996-02-16 1997-08-26 Nippon Telegr & Teleph Corp <Ntt> 情報分類処理方法
JP3792411B2 (ja) * 1998-10-12 2006-07-05 株式会社リコー 文書分類装置
US6349307B1 (en) * 1998-12-28 2002-02-19 U.S. Philips Corporation Cooperative topical servers with automatic prefiltering and routing
US6324534B1 (en) 1999-09-10 2001-11-27 Requisite Technology, Inc. Sequential subset catalog search engine
GB2355554A (en) 1999-10-21 2001-04-25 Int Computers Ltd Searching for items in an electronic catalogue
WO2001050338A1 (en) 1999-12-30 2001-07-12 Mondosoft A/S Categorisation of data entities
US6751600B1 (en) * 2000-05-30 2004-06-15 Commerce One Operations, Inc. Method for automatic categorization of items
JP4188567B2 (ja) * 2001-02-01 2008-11-26 株式会社リコー 文書管理システム、文書管理方法および記録媒体
US6947936B1 (en) * 2001-04-30 2005-09-20 Hewlett-Packard Development Company, L.P. Method for a topic hierarchy classification system
US7809672B1 (en) 2001-06-28 2010-10-05 I2 Technologies Us, Inc. Association of data with a product classification schema
US6990485B2 (en) * 2002-08-02 2006-01-24 Hewlett-Packard Development Company, L.P. System and method for inducing a top-down hierarchical categorizer
JP4423385B2 (ja) * 2002-10-24 2010-03-03 独立行政法人情報通信研究機構 文書分類支援装置およびコンピュータプログラム
JP2006527886A (ja) * 2003-06-18 2006-12-07 シーエヌイーティ ネットワークス インコーポレイテッド オンライン購入システム用のコンテント集合方法及び装置
US7870039B1 (en) * 2004-02-27 2011-01-11 Yahoo! Inc. Automatic product categorization
JP3889010B2 (ja) * 2004-03-19 2007-03-07 沖電気工業株式会社 語句分類システム、語句分類方法、および語句分類プログラム
US20060212287A1 (en) * 2005-03-07 2006-09-21 Sight'up Method for data processing with a view to extracting the main attributes of a product
US7870031B2 (en) 2005-12-22 2011-01-11 Ebay Inc. Suggested item category systems and methods
US7617199B2 (en) 2006-01-31 2009-11-10 Northwestern University Characterizing context-sensitive search results as non-spam
US8055548B2 (en) * 2006-06-23 2011-11-08 Stb Enterprises, Llc System for collaborative internet competitive sales analysis
US7603367B1 (en) * 2006-09-29 2009-10-13 Amazon Technologies, Inc. Method and system for displaying attributes of items organized in a searchable hierarchical structure
JP2008204444A (ja) * 2007-01-23 2008-09-04 Just Syst Corp データ処理装置、データ処理方法及び検索装置
CA2623796A1 (en) 2008-03-03 2009-09-03 David A. Wassmann Product information system for aggregating and classifying information from multiple sources with update ability
EP2332039A4 (en) 2008-08-11 2012-12-05 Collective Inc METHOD AND SYSTEM FOR CLASSIFYING TEXT
CN101727636A (zh) * 2008-10-23 2010-06-09 深圳富泰宏精密工业有限公司 商品信息管理系统及方法
US8145662B2 (en) * 2008-12-31 2012-03-27 Ebay Inc. Methods and apparatus for generating a data dictionary
JP2010237923A (ja) * 2009-03-31 2010-10-21 Dainippon Printing Co Ltd 広告物作成支援装置、広告物作成支援方法、及びプログラム
CN102033877A (zh) * 2009-09-27 2011-04-27 阿里巴巴集团控股有限公司 检索方法和装置
US20120005044A1 (en) 2010-06-30 2012-01-05 Cbs Interactive, Inc. System And Method To Provide A Table Of Products Based On Ranked User Specified Product Attributes
US8463805B2 (en) 2010-09-15 2013-06-11 Cbs Interactive, Inc. Mapping product identification information to a product
CN102609422A (zh) * 2011-01-25 2012-07-25 阿里巴巴集团控股有限公司 类目错放识别方法和装置
CN102737057B (zh) 2011-04-14 2015-04-01 阿里巴巴集团控股有限公司 一种商品类目信息的确定方法及装置
US8700494B2 (en) * 2011-09-06 2014-04-15 Google Inc. Identifying product variants

Also Published As

Publication number Publication date
US9418147B2 (en) 2016-08-16
JP5956558B2 (ja) 2016-07-27
JP2014512614A (ja) 2014-05-22
EP2697709A1 (en) 2014-02-19
HK1171096A1 (zh) 2013-03-15
WO2012141934A1 (en) 2012-10-18
US20120330961A1 (en) 2012-12-27
CN102737057B (zh) 2015-04-01
EP2697709A4 (en) 2014-11-05
JP2016181277A (ja) 2016-10-13
CN102737057A (zh) 2012-10-17
US9047369B2 (en) 2015-06-02
US20140379724A1 (en) 2014-12-25

Similar Documents

Publication Publication Date Title
TW201241773A (en) Method and apparatus of determining product category information
US10180967B2 (en) Performing application searches
JP5721818B2 (ja) 検索におけるモデル情報群の使用
JP5540079B2 (ja) 知識ベース構築の方法および装置
CN110704411B (zh) 适用于艺术领域的知识图谱搭建方法及装置、电子设备
US20150242497A1 (en) User interest recommending method and apparatus
CN110609902A (zh) 一种基于融合知识图谱的文本处理方法及装置
CN107391509B (zh) 标签推荐方法及装置
CN104462547B (zh) 一种可配置的网页数据采集的方法及系统
CN107918657B (zh) 一种数据源的匹配方法和装置
US20140379616A1 (en) System And Method Of Tuning Item Classification
CN108108426A (zh) 自然语言提问的理解方法、装置及电子设备
JP2017525033A (ja) 検索のためのテーブルの理解
CN105677695B (zh) 一种基于内容的计算移动应用相似性的方法
WO2014127673A1 (en) Method and apparatus for acquiring hot topics
CN108228657B (zh) 一种关键字检索的实现方法及装置
CN110019616A (zh) 一种poi现势状态获取方法及其设备、存储介质、服务器
CN110019384A (zh) 一种血缘数据的获取方法、提供血缘数据的方法及装置
WO2018176913A1 (zh) 搜索方法、装置及非临时性计算机可读存储介质
CN109145110A (zh) 基于标签的信息分类处理、标签查询方法和装置
CN107967285A (zh) 数据处理方法和数据处理装置
CN110795613B (zh) 商品搜索方法、装置、系统及电子设备
CN106708886A (zh) 站内搜索词的显示方法及装置
CN110472019A (zh) 舆情搜索方法及装置
CN105740476A (zh) 一种相关联问题推荐方法、装置及系统