WO2021171373A1

WO2021171373A1 - アイテム分類支援システム、方法およびプログラム

Info

Publication number: WO2021171373A1
Application number: PCT/JP2020/007495
Authority: WO
Inventors: 昌史小山田
Original assignee: 日本電気株式会社
Priority date: 2020-02-25
Filing date: 2020-02-25
Publication date: 2021-09-02
Also published as: JPWO2021171373A1; JP7456486B2; US20230065007A1

Abstract

取得手段１１は、複数のアイテム名を含むグループに属するアイテム名から、そのアイテム名を構成する１つ以上の単語を、アイテム名毎にそれぞれ取得する。算出手段１２は、取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する。決定手段１３は、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和が上位Ｍ番目（Ｍは自然数）までの単語を、複数のアイテム名が表す各アイテムの分類名の候補に決定する。

Description

アイテム分類支援システム、方法およびプログラム

　本発明は、アイテムの分類を支援するアイテム分類支援システム、アイテム分類支援方法、および、アイテム分類支援プログラムに関する。

　商品と、その商品に応じた分類の分類名とを対応付けたデータを作成する場合がある。図１２は、商品と分類名とを対応付けたデータの例を示す模式図である。なお、商品は、商品名で表される。図１２に示す例では、例えば、「名探偵Ｃ 1/10」という商品名の商品は、「フィギュア」に分類され、「怪盗Ｘポスター」という商品名の商品は「ポスター」に分類されることを示している。

　商品と分類名とを対応付けたデータは、例えば、商品の需要予測を行うための機械学習における教師データとして利用される。

　商品に対して、その商品に応じた分類の分類名を定める作業は、商品毎に人手で行われることが一般的である。

　なお、特許文献１には、データを検出するためのモデルを生成する情報処理装置が記載されている。特許文献１に記載されている情報処理装置は、学習対象となるデータのうち、所定の条件を満たす対象データに基づいて対象データの分類を設定する分類手段と、対象データと対象データに設定された分類とに基づいてデータを検出するモデルを生成するモデル生成手段とを備える。

　また、特許文献２には、ユーザが通信ネットワークを介して商品の購入を行うｅコマース（Electronic Commerce ）に関する情報処理装置が記載されている。

国際公開第２０１９／１８７８６５号国際公開第２０１５／１３２８８６号

　前述のように、商品に対して、その商品に応じた分類の分類名を定める作業は、商品毎に人手で行われることが一般的である。そのため、その作業には、非常に手間がかかる。

　また、商品だけでなく、商品以外のアイテムであっても、アイテムに応じた分類の分類名を容易に定められることが好ましい。

　特許文献１には、商品の分類の分類名を定めることは開示されていない。

　また、特許文献２には、商品の分類の分類名を定めることは開示されている。具体的には、特許文献２に記載されている情報処理装置は、選択された複数の商品のそれぞれについて属性を表すキーワードを抽出し、抽出されたキーワードのうちで複数の商品に共通または類似する少なくとも一つのキーワードをグループワード（分類名）として選択する。

　しかし、複数の商品に共通または類似する属性だけではなく、複数の商品に関連する属性も選択された方が、ユーザが選択できる分類名の候補の範囲が広がる。特許文献２に記載されている情報処理装置では、複数の商品に共通または類似するキーワードを選択することしか想定されていない。

　そこで、本発明は、分類対象となるアイテムの分類の適切な分類名の候補をユーザに提示できるアイテム分類支援システム、アイテム分類支援方法、および、アイテム分類支援プログラムを提供することを目的とする。

　本発明によるアイテム分類支援システムは、複数のアイテム名を含むグループに属するアイテム名から、そのアイテム名を構成する１つ以上の単語を、アイテム名毎にそれぞれ取得する取得手段と、取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する算出手段と、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和が上位Ｍ番目（Ｍは自然数）までの単語を、複数のアイテム名が表す各アイテムの分類名の候補に決定する決定手段とを備えることを特徴とする。

　本発明によるアイテム分類支援方法は、コンピュータが、複数のアイテム名を含むグループに属するアイテム名から、そのアイテム名を構成する１つ以上の単語を、アイテム名毎にそれぞれ取得し、取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出し、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和が上位Ｍ番目までの単語を、複数のアイテム名が表す各アイテムの分類名の候補に決定することを特徴とする。

　本発明によるアイテム分類支援プログラムは、コンピュータに、複数のアイテム名を含むグループに属するアイテム名から、そのアイテム名を構成する１つ以上の単語を、アイテム名毎にそれぞれ取得する取得処理、取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する算出処理、および取得された単語のうち、算出された関連度の複数のアイテム名に渡る和が上位Ｍ番目までの単語を、複数のアイテム名が表す各アイテムの分類名の候補に決定する決定処理を実行させることを特徴とする。また、本発明は、上記のアイテム分類支援プログラムを記録したコンピュータ読み取り可能な記録媒体であってもよい。

　本発明によれば、分類対象となるアイテムの分類の適切な分類名の候補をユーザに提示できる。

本発明の実施形態のアイテム分類支援システムの構成例を示すブロック図である。分類名候補決定部３の構成例を示すブロック図である。単語行列作成部７が作成する単語行列の例を示す説明図である。単語行列補正部８が補正する単語行列の例を示す説明図である。分類名候補抽出部９が抽出する分類名の候補を決定する例を示す説明図である。分類名候補抽出部９が各単語の重みを決定する例を示す説明図である。分類名候補抽出部９が抽出する分類名の候補を決定する他の例を示す説明図である。表示制御部４がディスプレイ装置５上に表示する画面の例を示す説明図である。本発明の実施形態の処理経過の例を示すフローチャートである。本発明の実施形態のアイテム分類支援システムに係るコンピュータの構成例を示す概略ブロック図である。本発明のアイテム分類支援システムの概要を示すブロック図である。商品と分類名とを対応付けたデータの例を示す模式図である。

　以下、本発明の実施形態を図面を参照して説明する。

　以下では、分類対象となるアイテムが商品である場合を例にして説明するが、分類対象となるアイテムは商品に限られない。アイテムは、例えば、会社であってもよい。

　アイテムは、アイテム名で表される。例えば、アイテムが商品である場合には、商品名がアイテム名に該当する。また、アイテムが会社である場合には、会社名がアイテム名に該当する。

　図１は、本発明の実施形態のアイテム分類支援システムの構成例を示すブロック図である。本発明の実施形態のアイテム分類支援システム１は、グルーピング済アイテム名記憶部２と、分類名候補決定部３と、表示制御部４と、ディスプレイ装置５と、分類決定部６とを備える。

　グルーピング済アイテム名記憶部２は、既にグループに分けられたアイテムのアイテム名を複数記憶する記憶装置である。本例では、グルーピング済アイテム名記憶部２は、グループに分けられた商品の商品名を複数記憶する。

　具体的には、グルーピング済アイテム名記憶部２には、商品（アイテム）の商品名（アイテム名）の集合に対する商品名のグループが記憶されている。

　商品名のグループは、例えば、１つの所定の商品名と、所定の商品名との類似度が所定の基準以上である１つ以上の商品名とで構成されるグループである。２つの商品名間の類似度は、例えば「２つの商品名間の編集距離の逆数」である。なお、グループは、上記以外の方法で定められてもよい。

　分類名候補決定部３は、上述した商品の分類名の候補を決定する機能を有する。図２は、分類名候補決定部３の構成例を示すブロック図である。

　図２に示すように、本実施形態の分類名候補決定部３は、単語行列作成部７と、単語行列補正部８と、分類名候補抽出部９とを含む。また、分類名候補決定部３は、インターネットに接続されている。以下、本実施形態の分類名候補決定部３が商品の分類名の候補を決定する処理を説明する。

　グルーピング済アイテム名記憶部２に記憶されているグループを１つ取り出すと、最初に分類名候補決定部３の単語行列作成部７は、単語行列を作成する。図３は、単語行列作成部７が作成する単語行列の例を示す説明図である。

　最初に、単語行列作成部７は、図３に示すように、単語行列の１列目に、取り出されたグループに含まれている複数の商品名をそれぞれ格納する。図３に示す商品名の例は、「たっぷりミルクソーダ」、「たっぷりプリン」、「ぎっしりアンパン」である。なお、本例では、取り出されたグループに商品名が全部で１０個含まれている。

　単語行列作成部７は、単語行列に格納された各商品名に対して、最初の処理として形態素解析をそれぞれ行う。単語行列作成部７が形態素解析を行うと、各商品名は、１つ以上の単語に分割される。例えば、「たっぷりミルクソーダ」は、単語「たっぷり」と、単語「ミルク」と、単語「ソーダ」に分割される。

　次いで、単語行列作成部７は、各商品名が分割されて取得された各単語を、図３に示すように単語行列の１行目に格納する。なお、図３に示す単語「たっぷり」のように、複数の商品名から同一の単語がそれぞれ取得されたとき、単語行列作成部７は、取得された単語を１つだけ格納する。

　すなわち、単語行列作成部７は、複数の商品名を含むグループに属する商品名から、その商品名を構成する１つ以上の単語を、商品名毎にそれぞれ取得する。

　なお、図３に示すa₁、a₂、・・・は、単語行列の１行目に格納された各単語を識別する記号である。例えば、a₁は、単語「たっぷり」を示す。

　また、単語行列作成部７は、単語行列に格納された各商品名に対して、２つ目の処理として商品名データベース検索を行う。

　単語行列作成部７は、例えば、商品名を用いて商品名データベース検索を行い、検索に用いられた商品名の属性を商品名データベースから抽出する。

　商品名データベースは、例えばユーザが勤務している店舗内に備えられている、商品名とその属性が検索可能に格納されたデータベースである。単語行列作成部７は、商品名データベースに接続し、商品名を検索する。

　本例において、単語行列作成部７は、商品名「たっぷりプリン」を用いて商品名データベース検索を行った結果、「たっぷりプリン」の属性が「なめらか」であることを発見した。よって、図３に示すように、単語行列作成部７は、単語行列の１行目に「なめらか」を格納している。

　なお、商品名データベースに商品名がカテゴリ毎に格納されている場合、単語行列作成部７は、商品名データベース検索に用いられた単語の上位概念（カテゴリ）を意味する単語を商品名データベースから抽出してもよい。

　上位概念を意味する単語として、単語行列作成部７は、例えば「ぎっしりアンパン」の上位概念である単語「パン」、「たっぷりミルクソーダ」の上位概念である単語「乳製品」を抽出し、単語行列に格納してもよい。

　また、単語行列作成部７は、単語行列に格納された各商品名に対して、３つ目の処理としてWorld Wide Web（以下、単にWeb と呼ぶ。）検索を行う。

　単語行列作成部７は、例えば、商品名を用いてWeb 検索を行い、検索に用いられた商品名に付随することが多い単語をWeb から抽出する。

　本例において、単語行列作成部７は、商品名「たっぷりミルクソーダ」を用いてWeb 検索を行った結果、「自然派」という単語をWeb に多数発見した。よって、図３に示すように、単語行列作成部７は、単語行列の１行目に「自然派」を格納している。

　すなわち、単語行列作成部７は、複数の商品名をいずれも構成せず、かつ複数の商品名のいずれかに関連する単語を外部（商品名データベース、またはWeb ）から取得する。

　次いで、単語行列作成部７は、単語行列の１行目に格納された各単語が、１列目に格納された各商品名に含まれているか否かを判定する。単語が商品名に含まれている場合、単語行列作成部７は、対応する単語行列の成分の値を「１」に設定する。また、単語が商品名に含まれていない場合、単語行列作成部７は、対応する単語行列の成分の値を「０」に設定する。

　例えば、商品名「たっぷりミルクソーダ」には単語「たっぷり」が含まれているので、単語行列作成部７は、単語行列の（「たっぷりミルクソーダ」，「たっぷり」）成分の値を「１」に設定する。また、商品名「たっぷりミルクソーダ」には単語「プリン」が含まれていないので、単語行列作成部７は、単語行列の（「たっぷりミルクソーダ」，「プリン」）成分の値を「０」に設定する。

　単語行列の全ての成分に対して判定を行った後、単語行列作成部７は、作成された単語行列を単語行列補正部８に入力する。単語行列補正部８は、入力された単語行列の成分の値を補正する機能を有する。

　図４は、単語行列補正部８が補正する単語行列の例を示す説明図である。図４に示す下線付きの値が、単語行列補正部８が補正した単語行列の成分の値である。単語行列補正部８は、任意のルールに基づいて、単語行列の各成分の値（特に「０」）を補正できる。

　例えば、商品名データベースから「たっぷりプリン」の属性が「なめらか」であることが発見されたため、単語行列補正部８は、（「たっぷりプリン」，「なめらか」）成分の値を、０よりも大きい値に補正してもよい。図４に示す例では、単語行列補正部８は、（「たっぷりプリン」，「なめらか」）成分の値を「０」から「０．９」に補正している。

　また、単語行列補正部８は、予め保持されている辞書に定められている複数の単語間の類似性を基に補正してもよい。例えば、単語「たっぷり」と単語「ぎっしり」とが類似していることが辞書に定められている場合、単語行列補正部８は、（「ぎっしりアンパン」，「たっぷり」）成分の値を、０よりも大きい値に補正してもよい。図４に示す例では、単語行列補正部８は、（「ぎっしりアンパン」，「ぎっしり」）成分の値が「１」であるので、（「ぎっしりアンパン」，「たっぷり」）成分の値を「０」から「０．８」に補正している。

　同様の理由で、単語行列補正部８は、（「たっぷりミルクソーダ」，「ぎっしり」）成分の値、および（「たっぷりプリン」，「ぎっしり」）成分の値を、どちらも０よりも大きい値に補正してもよい。

　図４に示す例では、単語行列補正部８は、（「たっぷりミルクソーダ」，「たっぷり」）成分の値が「１」であるので、（「たっぷりミルクソーダ」，「ぎっしり」）成分の値を「０」から「０．８」に補正している。また、単語行列補正部８は、（「たっぷりプリン」，「たっぷり」）成分の値が「１」であるので、（「たっぷりプリン」，「ぎっしり」）成分の値を「０」から「０．８」に補正している。

　単語行列補正部８は、他にも様々な方法で単語行列の成分の値を補正できる。また、単語行列補正部８は、低ランク近似を行うことによって、単語行列を値が「０」の成分がより少ない行列に変換してもよい。

　すなわち、単語行列作成部７および単語行列補正部８は、取得された単語が商品名に関連する度合いである関連度を、商品名毎にそれぞれ算出する。特に、単語行列作成部７は、商品名を構成する単語のその商品名との関連度を１として算出し、商品名を構成しない単語のその商品名との関連度を０として算出する。

　また、単語行列補正部８は、予め保持されている辞書に定められている複数の単語間の類似性を基に関連度を算出してもよい。

　単語行列補正部８は、補正した単語行列を分類名候補抽出部９に入力する。分類名候補抽出部９は、入力された単語行列から分類名の候補を抽出する機能を有する。本実施形態の分類名候補抽出部９は、以下の２つの方法のいずれかを用いて分類名の候補を抽出する。

　１つ目の方法は、単純に単語行列の成分の値に基づいて抽出する分類名の候補を決定する方法である。図５は、分類名候補抽出部９が抽出する分類名の候補を決定する例を示す説明図である。

　分類名候補抽出部９は、以下の式で定義されるスコアS₁(a_i)（ｉは自然数）を、各単語a_iに対してそれぞれ計算する。

　S₁(a_i) = Σ_n=1 ^N(b_i ⁿ)　・・・式（１）

　なお、式（１）におけるb_i ⁿは、単語行列の（ｉ，ｎ）成分の値である（ｎは１以上１０以下の自然数、Ｎ＝１０）。図５に示す単語行列の下の各値が、各単語a_iに対してそれぞれ計算されたスコアS₁(a_i)である。

　次いで、分類名候補抽出部９は、単語行列の１行目に格納された各単語のうち、算出されたスコアが上位の単語を、抽出される分類名の候補に決定する。図５に示す例では、分類名候補抽出部９は、算出されたスコアが最高である単語「たっぷり」を、抽出される分類名の候補の１つに決定している。

　すなわち、分類名候補抽出部９は、単語行列作成部７により取得された単語のうち、単語行列作成部７および単語行列補正部８により算出された関連度の複数の商品名に渡る和が上位Ｍ番目（Ｍは自然数）までの単語を、複数の商品名が表す各商品の分類名の候補に決定する。

　２つ目の方法は、各単語の相対的な重要度である重みも用いて抽出する分類名の候補を決定する方法である。図６は、分類名候補抽出部９が各単語の重みを決定する例を示す説明図である。

　本例において、分類名候補抽出部９は、図６に示す行列の２行目のように、取り出されたグループに含まれている１０個の商品名における、単語行列の１行目に格納された各単語の出現頻度をそれぞれ計算する。

　例えば、図６に示すように、分類名候補抽出部９は、単語「たっぷり」の取り出されたグループにおける出現頻度を、「４／１０」と計算している。出現頻度「４／１０」は、１０個の商品名に単語「たっぷり」が４個含まれていたことを意味する。

　また、分類名候補抽出部９は、図６に示す行列の３行目のように、その他のグループに含まれている１０個の商品名における、単語行列の１行目に格納された各単語の出現頻度をそれぞれ計算する。

　例えば、図６に示すように、分類名候補抽出部９は、単語「たっぷり」のその他のグループにおける出現頻度を、「２／１０」と計算している。出現頻度「２／１０」は、１０個の商品名に単語「たっぷり」が２個含まれていたことを意味する。

　なお、その他のグループは、商品名データベース検索、Web 検索、または他の方法で任意に検索された１０個の商品名で構成されるグループである。任意に検索された１０個の商品名は、取り出されたグループに属さない商品名である。

　また、分類名候補抽出部９は、図６に示す行列の４行目のように、取り出されたグループにおける出現頻度からその他のグループにおける出現頻度を引くことによって、単語行列の１行目に格納された各単語の出現頻度の差をそれぞれ計算する。

　例えば、図６に示すように、分類名候補抽出部９は、単語「たっぷり」の出現頻度の差を、「（４／１０－２／１０＝）２／１０」と計算している。

　なお、取り出されたグループにおける出現頻度からその他のグループにおける出現頻度が引かれた値が負の値になる場合、分類名候補抽出部９は、図６に示すように、出現頻度の差を「０」に設定する。例えば、図６に示す単語「ミルク」の出現頻度の差は、（２／１０－５／１０）＜０であるため、「０」に設定されている。

　次いで、分類名候補抽出部９は、以下の式で定義されるスコアS₂(a_i) を、各単語a_iに対してそれぞれ計算する。

　S₂(a_i) = Σ_n=1 ^N(w_i×b_i ⁿ)　・・・式（２）

　なお、式（２）におけるw_iは、単語a_iの相対的な重要度を示す重みである。本例における重みw_iは、図６に示す単語a_iの出現頻度の差である。なお、分類名候補抽出部９は、重みw_iをtf-idf法で算出してもよい。

　図７は、分類名候補抽出部９が抽出する分類名の候補を決定する他の例を示す説明図である。図７に示す単語行列の下の計算された各値が、各単語a_iに対してそれぞれ計算されたスコアS₂(a_i)である。

　次いで、分類名候補抽出部９は、単語行列の１行目に格納された各単語のうち、算出されたスコアが上位の単語を、抽出する分類名の候補に決定する。図７に示す例では、分類名候補抽出部９は、算出されたスコアが上位３番目までの単語「たっぷり」、「ソーダ」、「ぎっしり」を、抽出される分類名の候補に決定している。

　すなわち、分類名候補抽出部９は、複数の商品名における単語の重みを単語毎にそれぞれ算出する。また、分類名候補抽出部９は、単語行列作成部７により取得された単語のうち、単語行列作成部７および単語行列補正部８により算出された関連度の複数のアイテム名に渡る和を算出された重みで重み付けた結果が上位Ｍ番目までの単語を、分類名の候補に決定する。

　また、上記の例のように、分類名候補抽出部９は、複数の商品名における単語の出現頻度と、任意に選択された商品名における単語の出現頻度とを用いて、単語の重みを算出してもよい。

　分類名候補決定部３は、分類名候補抽出部９により抽出された分類名の候補を表示制御部４に入力する。表示制御部４は、入力された分類名の候補を、グループに属する各商品名が表す各商品の分類名の候補としてディスプレイ装置５上に表示する。

　ディスプレイ装置５は、情報を表示する装置であり、一般的なディスプレイ装置でよい。

　以下、表示制御部４の動作について説明する。ここでは、グルーピング済アイテム名記憶部２に記憶されている１つのグループに着目して説明する。なお、グルーピング済アイテム名記憶部２に複数のグループが記憶されている場合、表示制御部４は、グループ毎に同様の動作を行えばよい。

　表示制御部４は、グループに属する個々の商品名をディスプレイ装置５上に表示するとともに、そのグループに属する各商品名が表す各商品の分類名の複数の候補をディスプレイ装置５上に表示する。このとき、表示制御部４は、分類名の複数の候補を、ユーザによる指定可能な態様で（例えば、マウスクリック等で指定可能な態様で）、ディスプレイ装置５上に表示する。表示制御部４がディスプレイ装置５上に表示する画面には、他のＧＵＩ（Graphical User Interface）等が含まれていてもよい。

　図８は、表示制御部４がディスプレイ装置５上に表示する画面の例を示す説明図である。図８に示す例では、表示制御部４がグループに属する商品名である「たっぷりミルクソーダ」、「たっぷりプリン」、「ぎっしりアンパン」等を表示した場合を示している。また、表示制御部４が、各商品名が表す各商品の分類名の候補５０として、「たっぷり」、「ソーダ」および「ぎっしり」を表示した場合を示している。これらの候補５０は、ユーザによるマウスクリック等の操作によって指定可能である。

　分類決定部６は、表示された分類名の複数の候補５０のうちのいずれかが、マウスクリック等の操作でユーザによって指定された場合、グループに属する各商品名（すなわち、表示されている各商品名）が表す各商品が、ユーザによって指定された分類名で分類されると決定する。そして、分類決定部６は、グループに属する各商品名と、指定された分類名とを対応付けたデータを生成する。

　例えば、図８に例示する画面において、各候補５０のうち分類名「たっぷり」がユーザによって指定されたとする。この場合、分類決定部６は、図８に示す「たっぷりミルクソーダ」、「たっぷりプリン」および「ぎっしりアンパン」が表す各商品が、「たっぷり」という分類名で分類されると決定する。そして、分類決定部６は、「たっぷりミルクソーダ」、「たっぷりプリン」および「ぎっしりアンパン」のそれぞれと、「たっぷり」という分類名とを対応付けたデータを生成する。

　すなわち、表示制御部４は、複数の商品名を表示するとともに、複数の商品名が表す各商品の、分類名候補決定部３により決定された分類名の複数の候補をユーザによる指定可能な態様で表示する。

　また、表示制御部４は、分類名の候補と併せて、分類名の候補となる単語を含む商品名を表示してもよい。例えば、図８に示すように、表示制御部４は、ユーザが画面上でカーソルを分類名の候補に合わせたときに、該当の分類名の候補の横に、分類名の候補となる単語を含む商品名を表示してもよい。

　分類名の候補となる単語を含む商品名は、例えば、Web 検索で得られた商品名である。分類名候補決定部３は、分類名の候補となる単語を含む商品名を表示制御部４に入力する。

　グループに属する各商品名以外の商品名も参考にすることによって、ユーザは、分類名の複数の候補の中から最終的に使用したい分類名をより決めやすくなる可能性がある。

　分類名候補決定部３、表示制御部４および分類決定部６は、例えば、アイテム分類支援プログラムに従って動作するコンピュータのＣＰＵ（Central Processing Unit ）によって実現される。例えば、ＣＰＵが、コンピュータのプログラム記憶装置等のプログラム記録媒体からアイテム分類支援プログラムを読み込み、そのアイテム分類支援プログラムに従って、分類名候補決定部３、表示制御部４および分類決定部６として動作すればよい。グルーピング済アイテム名記憶部２は、例えば、コンピュータが備える記憶装置によって実現される。

　次に、処理経過について説明する。図９は、本発明の実施形態の処理経過の例を示すフローチャートである。なお、既に説明した事項については、詳細な説明を省略する。また、グルーピング済アイテム名記憶部２は、既にグループに分けられた商品の商品名を、予め記憶している。

　最初に、分類名候補決定部３は、グルーピング済アイテム名記憶部２に記憶されている商品名のグループを１つ取り出す（ステップＳ１）。

　次いで、分類名候補決定部３の単語行列作成部７は、形態素解析、商品名データベース検索、およびWeb 検索をそれぞれ行うことによって、取り出されたグループに含まれている商品名を基に単語行列を作成する（ステップＳ２）。なお、単語行列作成部７は、ステップＳ２において、商品名データベース検索、またはWeb 検索を実行しなくてもよい。

　次いで、単語行列補正部８は、単語行列作成部７により作成された単語行列の成分の値を補正する（ステップＳ３）。なお、ステップＳ３の処理は、省略されてもよい。

　次いで、分類名候補抽出部９は、単語行列補正部８により補正された単語行列から分類名の候補を抽出する（ステップＳ４）。分類名候補決定部３は、分類名候補抽出部９により抽出された分類名の候補を表示制御部４に入力する。

　次いで、表示制御部４は、グループに属する個々の商品名をディスプレイ装置５上に表示するとともに、そのグループに属する各商品名が表す各商品の分類名の複数の候補５０（図８等を参照）をディスプレイ装置５上に表示する（ステップＳ５）。

　ステップＳ５において、表示制御部４は、分類名の複数の候補５０を、ユーザによる指定可能な態様で（例えば、マウスクリック等で指定可能な態様で）、ディスプレイ装置５上に表示する。なお、分類名の複数の候補５０は、分類名候補決定部３から入力された分類名の候補の集合である。

　分類名の複数の候補５０（図８等を参照）のいずれかがユーザによって指定された場合、分類決定部６は、グループに属する各商品名が表す各商品が、ユーザに指定された分類名で分類されると決定する（ステップＳ６）。このとき、分類決定部６は、グループに属する各商品名と、指定された分類名とを対応付けたデータを生成する。

　本実施形態によれば、単語行列作成部７が、複数のアイテム名を含むグループに属するアイテム名から、そのアイテム名を構成する１つ以上の単語を、アイテム名毎にそれぞれ取得する。また、単語行列作成部７および単語行列補正部８が、取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する。また、分類名候補抽出部９が、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和が上位Ｍ番目までの単語を、複数のアイテム名が表す各アイテムの分類名の候補に決定する。

　従って、本実施形態のアイテム分類支援システム１は、グループに含まれている複数のアイテム名との関連度が高い分類名の候補をユーザに提示できる。よって、アイテム分類支援システム１は、商品毎に人手で分類名を定める一般的な方法に比べて、ユーザの負担を大幅に軽減することができる。また、アイテム分類支援システム１は、特許文献２に記載されている情報処理装置に比べて、多くの種類の分類名の候補をユーザに提示できる。

　図１０は、本発明の実施形態のアイテム分類支援システム１に係るコンピュータの構成例を示す概略ブロック図である。例えば、コンピュータ１０００は、ＣＰＵ１００１と、主記憶装置１００２と、補助記憶装置１００３と、インタフェース１００４と、ディスプレイ装置１００５とを備える。

　本発明の実施形態のアイテム分類支援システム１は、コンピュータ１０００によって実現される。アイテム分類支援システム１の動作は、プログラム（アイテム分類支援プログラム）の形式で、補助記憶装置１００３に記憶されている。ＣＰＵ１００１は、プログラムを補助記憶装置１００３から読み出して主記憶装置１００２に展開し、そのプログラムに従って、上記の実施形態で説明した処理を実行する。この場合、分類名候補決定部３、表示制御部４および分類決定部６は、ＣＰＵ１００１によって実現される。ディスプレイ装置５は、ディスプレイ装置１００５によって実現される。

　補助記憶装置１００３は、一時的でない有形の媒体の例である。一時的でない有形の媒体の他の例として、インタフェース１００４を介して接続される磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ（Compact Disk Read Only Memory ）、ＤＶＤ－ＲＯＭ（Digital Versatile Disk Read Only Memory ）、半導体メモリ等が挙げられる。また、プログラムが通信回線によってコンピュータ１０００に配信される場合、配信を受けたコンピュータ１０００がそのプログラムを主記憶装置１００２に展開し、そのプログラムに従って上記の実施形態で説明した処理を実行してもよい。

　また、各構成要素の一部または全部は、汎用または専用の回路（circuitry ）、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部または全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。

　各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。

　次に、本発明の概要について説明する。図１１は、本発明のアイテム分類支援システムの概要を示すブロック図である。本発明のアイテム分類支援システムは、取得手段１１と、算出手段１２と、決定手段１３とを備える。

　取得手段１１（例えば、単語行列作成部７）は、複数のアイテム名を含むグループに属するアイテム名から、そのアイテム名を構成する１つ以上の単語を、アイテム名毎にそれぞれ取得する。

　算出手段１２（例えば、単語行列作成部７および単語行列補正部８）は、取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する。

　決定手段１３（例えば、分類名候補抽出部９）は、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和が上位Ｍ番目までの単語を、複数のアイテム名が表す各アイテムの分類名の候補に決定する。

　また、算出手段１２は、アイテム名を構成する単語のそのアイテム名との関連度を１として算出し、アイテム名を構成しない単語のそのアイテム名との関連度を０として算出してもよい。

　そのような構成により、分類対象となるアイテムの分類の適切な分類名の候補をユーザに提示できる。

　また、取得手段１１は、複数のアイテム名をいずれも構成せず、かつ複数のアイテム名のいずれかに関連する単語を外部（例えば、商品名データベース）から取得してもよい。

　また、算出手段１２は、予め保持されている辞書に定められている複数の単語間の類似性を基に関連度を算出してもよい。

　そのような構成により、分類対象となるアイテムのアイテム名から想定されない分類名の候補をユーザに提示できる。

　また、決定手段１３は、複数のアイテム名における単語の重みを単語毎にそれぞれ算出し、取得された単語のうち、算出された関連度の複数のアイテム名に渡る和と算出された重みの積が上位Ｍ番目までの単語を、分類名の候補に決定してもよい。

　また、決定手段１３は、複数のアイテム名における単語の出現頻度と、任意に選択されたアイテム名における単語の出現頻度とを用いて、単語の重みを算出してもよい。

　そのような構成により、分類対象となるアイテムの分類のより適切な分類名の候補をユーザに提示できる。

　また、アイテム分類支援システム１０は、複数のアイテム名を表示するとともに、複数のアイテム名が表す各アイテムの、決定手段１３により決定された分類名の複数の候補をユーザによる指定可能な態様で表示する表示制御手段（例えば、表示制御部４）と、分類名の複数の候補のいずれかがユーザに指定された場合、各アイテムがユーザに指定された分類名で分類されると決定する分類決定手段（例えば、分類決定部６）とを備えてもよい。

　そのような構成により、分類対象となるアイテムの分類の分類名をユーザが容易に定められるようにユーザを支援できる。

　また、表示制御手段は、分類名の候補と併せて、分類名の候補を含むアイテム名を表示してもよい。

　そのような構成により、分類対象となるアイテムの分類の分類名をユーザがより容易に定めることができる。

　以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

産業上の利用の可能性

　本発明は、アイテムの分類を支援するアイテム分類支援システムに好適に適用可能である。

１　アイテム分類支援システム
２　グルーピング済アイテム名記憶部
３　分類名候補決定部
４　表示制御部
５　ディスプレイ装置
６　分類決定部
７　単語行列作成部
８　単語行列補正部
９　分類名候補抽出部

Claims

　複数のアイテム名を含むグループに属するアイテム名から、当該アイテム名を構成する１つ以上の単語を、アイテム名毎にそれぞれ取得する取得手段と、
　取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する算出手段と、
　取得された単語のうち、算出された関連度の前記複数のアイテム名に渡る和が上位Ｍ番目（Ｍは自然数）までの単語を、前記複数のアイテム名が表す各アイテムの分類名の候補に決定する決定手段とを備える
　ことを特徴とするアイテム分類支援システム。
　算出手段は、
　アイテム名を構成する単語の当該アイテム名との関連度を１として算出し、
　アイテム名を構成しない単語の当該アイテム名との関連度を０として算出する
　請求項１記載のアイテム分類支援システム。
　取得手段は、複数のアイテム名をいずれも構成せず、かつ前記複数のアイテム名のいずれかに関連する単語を外部から取得する
　請求項１または請求項２記載のアイテム分類支援システム。
　算出手段は、予め保持されている辞書に定められている複数の単語間の類似性を基に関連度を算出する
　請求項１から請求項３のうちのいずれか１項に記載のアイテム分類支援システム。
　決定手段は、
　複数のアイテム名における単語の重みを単語毎にそれぞれ算出し、
　取得された単語のうち、算出された関連度の前記複数のアイテム名に渡る和を算出された重みで重み付けた結果が上位Ｍ番目までの単語を、分類名の候補に決定する
　請求項１から請求項４のうちのいずれか１項に記載のアイテム分類支援システム。
　決定手段は、複数のアイテム名における単語の出現頻度と、任意に選択されたアイテム名における単語の出現頻度とを用いて、単語の重みを算出する
　請求項５記載のアイテム分類支援システム。
　複数のアイテム名を表示するとともに、前記複数のアイテム名が表す各アイテムの、決定手段により決定された分類名の複数の候補をユーザによる指定可能な態様で表示する表示制御手段と、
　前記分類名の複数の候補のいずれかが前記ユーザに指定された場合、前記各アイテムが前記ユーザに指定された分類名で分類されると決定する分類決定手段とを備える
　請求項１から請求項６のうちのいずれか１項に記載のアイテム分類支援システム。
　表示制御手段は、分類名の候補と併せて、前記分類名の候補となる単語を含むアイテム名を表示する
　請求項７記載のアイテム分類支援システム。
　コンピュータが、
　複数のアイテム名を含むグループに属するアイテム名から、当該アイテム名を構成する１つ以上の単語を、アイテム名毎にそれぞれ取得し、
　取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出し、
　取得された単語のうち、算出された関連度の前記複数のアイテム名に渡る和が上位Ｍ番目までの単語を、前記複数のアイテム名が表す各アイテムの分類名の候補に決定する
　ことを特徴とするアイテム分類支援方法。
　コンピュータに、
　複数のアイテム名を含むグループに属するアイテム名から、当該アイテム名を構成する１つ以上の単語を、アイテム名毎にそれぞれ取得する取得処理、
　取得された単語がアイテム名に関連する度合いである関連度を、アイテム名毎にそれぞれ算出する算出処理、および
　取得された単語のうち、算出された関連度の前記複数のアイテム名に渡る和が上位Ｍ番目までの単語を、前記複数のアイテム名が表す各アイテムの分類名の候補に決定する決定処理
　を実行させるためのアイテム分類支援プログラムを記録したコンピュータ読み取り可能な記録媒体。