JP6359045B2 - Information processing apparatus, information processing method, and information processing program - Google Patents

Information processing apparatus, information processing method, and information processing program Download PDF

Info

Publication number
JP6359045B2
JP6359045B2 JP2016052702A JP2016052702A JP6359045B2 JP 6359045 B2 JP6359045 B2 JP 6359045B2 JP 2016052702 A JP2016052702 A JP 2016052702A JP 2016052702 A JP2016052702 A JP 2016052702A JP 6359045 B2 JP6359045 B2 JP 6359045B2
Authority
JP
Japan
Prior art keywords
category
categories
information processing
processing apparatus
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016052702A
Other languages
Japanese (ja)
Other versions
JP2017167831A (en
Inventor
幸史 牧山
幸史 牧山
山下 勝司
勝司 山下
尚樹 平井
尚樹 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2016052702A priority Critical patent/JP6359045B2/en
Publication of JP2017167831A publication Critical patent/JP2017167831A/en
Application granted granted Critical
Publication of JP6359045B2 publication Critical patent/JP6359045B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。   The present invention relates to an information processing apparatus, an information processing method, and an information processing program.

例えば商品の購入など、商品やサービスに関するイベントの発生を予測したり、学習したりするために、商品やサービスを複数のカテゴリに分類する技術がある。   For example, there is a technique for classifying a product or service into a plurality of categories in order to predict or learn the occurrence of an event related to the product or service, such as purchase of the product.

このような場合に、構築したカテゴリを、商品やサービスを利用する顧客の特徴量に基づいて統合することで、当該カテゴリを再構築する技術が提供されている。かかる技術では、離散値である特徴量の分布が類似するカテゴリを統合している。   In such a case, a technique for reconstructing the category by integrating the constructed category based on the feature amount of the customer who uses the product or service is provided. In such a technique, categories having similar distributions of feature values that are discrete values are integrated.

特開2006−318249号公報JP 2006-318249 A

しかしながら、上記の従来技術では、連続値の特徴量を所定単位で区切ることで離散化している。そのため、例えば離散化による丸め誤差の影響等によって、特徴量の分布の類似判定の精度が低下する恐れがある。   However, in the above prior art, the feature values of continuous values are discretized by dividing them into predetermined units. For this reason, for example, due to the influence of rounding error due to discretization, the accuracy of the similarity determination of the distribution of feature amounts may be reduced.

本願は、上記に鑑みてなされたものであって、カテゴリの統合精度を向上させることができる情報処理装置、情報処理方法および情報処理プログラムを提供することを目的とする。   The present application has been made in view of the above, and an object thereof is to provide an information processing apparatus, an information processing method, and an information processing program capable of improving the integration accuracy of categories.

本願に係る情報処理装置は、階層構造を有する複数のカテゴリのうち、所定カテゴリの下位に位置する複数の下位カテゴリに含まれるオブジェクトの特徴量であって、連続値で表される前記特徴量に基づき、複数の前記下位カテゴリごとに、統計的検定値を算出する算出部と、前記算出部の算出結果に基づいて、複数の前記下位カテゴリを統合する統合部と、を備える。前記統合部は、前記所定カテゴリの2つ下位にカテゴリが存在する場合に、該所定カテゴリの1つ下位の前記下位カテゴリと当該所定カテゴリとを統合しない。 The information processing apparatus according to the present application is a feature amount of an object included in a plurality of lower categories located below a predetermined category among a plurality of categories having a hierarchical structure, and the feature amount represented by a continuous value based, for each of the plurality of the lower category, the calculation unit for calculating a statistical test value, based on the calculation result of the calculating unit, and integration unit that integrates a plurality of the lower category, Ru comprising a. The integration unit does not integrate the predetermined category with the lower category that is one level lower than the predetermined category when a category exists in the lower level of the predetermined category.

実施形態の一態様によれば、カテゴリの統合精度を向上させることができる。   According to one aspect of the embodiment, the accuracy of category integration can be improved.

図1は、実施形態に係る統合処理の一例を示す図である。FIG. 1 is a diagram illustrating an example of integration processing according to the embodiment. 図2は、実施形態に係る情報処理装置の構成を示すブロック図である。FIG. 2 is a block diagram illustrating a configuration of the information processing apparatus according to the embodiment. 図3Aは、実施形態に係るカテゴリ情報記憶部の一例を示す図である。FIG. 3A is a diagram illustrating an example of a category information storage unit according to the embodiment. 図3Bは、カテゴリ情報記憶部が記憶する複数のカテゴリの階層関係を示す模式図である。FIG. 3B is a schematic diagram illustrating a hierarchical relationship among a plurality of categories stored in the category information storage unit. 図4は、実施形態に係る属性情報記憶部の一例を示す図である。FIG. 4 is a diagram illustrating an example of the attribute information storage unit according to the embodiment. 図5Aは、実施形態に係る下位カテゴリに含まれるオブジェクトの特徴量の分布の一例を示すグラフである。FIG. 5A is a graph illustrating an example of a distribution of feature amounts of objects included in a lower category according to the embodiment. 図5Bは、実施形態に係る下位カテゴリに含まれるオブジェクトの特徴量の分布の一例を示すグラフである。FIG. 5B is a graph illustrating an example of a distribution of feature amounts of objects included in a lower category according to the embodiment. 図6は、実施形態に係る統合処理部が生成する複数のカテゴリの一例を示す図である。FIG. 6 is a diagram illustrating an example of a plurality of categories generated by the integrated processing unit according to the embodiment. 図7Aは、実施形態に係る下位カテゴリに含まれるオブジェクトの特徴量の分布の一例を示すグラフである。FIG. 7A is a graph illustrating an example of a distribution of feature amounts of objects included in a lower category according to the embodiment. 図7Bは、実施形態に係る下位カテゴリに含まれるオブジェクトの特徴量の分布の一例を示すグラフである。FIG. 7B is a graph illustrating an example of a distribution of feature amounts of objects included in a lower category according to the embodiment. 図8Aは、実施形態に係る下位カテゴリに含まれるオブジェクトの特徴量の分布の一例を示すグラフである。FIG. 8A is a graph illustrating an example of a distribution of feature amounts of objects included in a lower category according to the embodiment. 図8Bは、実施形態に係る下位カテゴリに含まれるオブジェクトの特徴量の分布の一例を示すグラフである。FIG. 8B is a graph illustrating an example of a distribution of feature amounts of objects included in a lower category according to the embodiment. 図8Cは、実施形態に係る下位カテゴリに含まれるオブジェクトの特徴量の分布の一例を示すグラフである。FIG. 8C is a graph illustrating an example of a distribution of feature amounts of objects included in a lower category according to the embodiment. 図9は、実施形態に係る統合処理部が生成する複数のカテゴリの一例を示す図である。FIG. 9 is a diagram illustrating an example of a plurality of categories generated by the integrated processing unit according to the embodiment. 図10は、実施形態に係る更新後のカテゴリ情報記憶部を示す図である。FIG. 10 is a diagram illustrating the updated category information storage unit according to the embodiment. 図11は、実施形態に係る更新後の属性情報記憶部を示す図である。FIG. 11 is a diagram illustrating the updated attribute information storage unit according to the embodiment. 図12は、実施形態に係る情報処理装置による統合処理手順を示すフローチャートである。FIG. 12 is a flowchart illustrating an integration processing procedure by the information processing apparatus according to the embodiment. 図13は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 13 is a hardware configuration diagram illustrating an example of a computer that implements the functions of the information processing apparatus.

以下に、本願に係る情報処理装置、情報処理方法および情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法および情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。   Hereinafter, a mode for carrying out an information processing apparatus, an information processing method, and an information processing program according to the present application (hereinafter referred to as “embodiment”) will be described in detail with reference to the drawings. Note that the information processing apparatus, the information processing method, and the information processing program according to the present application are not limited by this embodiment. In the following embodiments, the same portions are denoted by the same reference numerals, and redundant description is omitted.

〔1.統合処理〕
まず、図1を用いて、実施形態に係る統合処理の一例について説明する。図1は、実施形態に係る統合処理の一例を示す図である。実施形態に係る統合処理は、階層構造を有する複数のカテゴリを統合する処理であり、図示しない情報処理装置によって行われる。
[1. Integrated processing)
First, an example of the integration process according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of integration processing according to the embodiment. The integration process according to the embodiment is a process of integrating a plurality of categories having a hierarchical structure, and is performed by an information processing apparatus (not shown).

情報処理装置は、例えばツリー構造のカテゴリを統合する装置である。情報処理装置は、カテゴリに含まれるオブジェクトの特徴量に基づいてカテゴリを統合する。この点について、図1を用いて詳細に説明する。   The information processing apparatus is an apparatus that integrates categories having a tree structure, for example. The information processing apparatus integrates the categories based on the feature amounts of the objects included in the categories. This point will be described in detail with reference to FIG.

図1に示すカテゴリツリーT11は、オブジェクトを分類する分類カテゴリツリーである。具体的には、例えばオブジェクトは、インターネットオークションに出品された商品であり、分類カテゴリツリーは、かかる商品を分類するために予め用意されたカテゴリツリーである。図1の例では、「デスクトップ型」および「ノート型」の2つのカテゴリが、「パソコン」の下位に位置する下位カテゴリである。また、「商品A」、「商品B」および「商品C」の3つのカテゴリが、「デスクトップ型」の下位に位置する下位カテゴリである。   A category tree T11 shown in FIG. 1 is a classification category tree for classifying objects. Specifically, for example, the object is a product that has been exhibited in the Internet auction, and the classification category tree is a category tree prepared in advance for classifying the product. In the example of FIG. 1, two categories of “desktop type” and “notebook type” are lower categories located below “personal computer”. In addition, the three categories of “product A”, “product B”, and “product C” are lower categories located under the “desktop type”.

「商品A」、「商品B」および「商品C」には、それぞれオブジェクトとして、例えばインターネットオークションに出品された商品(以下、出品商品と呼ぶ)が複数含まれている。出品商品には例えばそれぞれ商品IDが割り振られており、かかる商品IDが各カテゴリに対応付けられている。なお、以下、出品IDを各出品商品の符号として参照する。図1の例では、出品商品の特徴量として、出品商品の落札価格が各商品IDと対応付けられている。出品商品の落札価格は連続変数であり、その項目値は連続値となる。   “Product A”, “Product B”, and “Product C” each include, for example, a plurality of products that have been exhibited in an Internet auction (hereinafter referred to as “exhibited products”) as objects. For example, a product ID is allocated to each exhibition product, and the product ID is associated with each category. Hereinafter, the exhibition ID is referred to as a code of each exhibition product. In the example of FIG. 1, the successful bid price of the exhibited product is associated with each product ID as the feature quantity of the exhibited product. The successful bid price of the exhibited product is a continuous variable, and the item value is a continuous value.

まず、情報処理装置は、所定カテゴリの下位カテゴリに含まれる出品商品の落札価格に基づき、統計的検定値を算出する(ステップS1)。ここでは、所定カテゴリが「デスクトップ型」であるものとする。また、情報処理装置がt検定を行うものとする。情報処理装置は、2つのカテゴリの特徴量の分布の平均値の差に基づき、平均値の差が大きいほど値が小さい統計的検定値を算出する。   First, the information processing apparatus calculates a statistical test value based on the winning bid price of the exhibited product included in the lower category of the predetermined category (step S1). Here, it is assumed that the predetermined category is “desktop type”. In addition, it is assumed that the information processing apparatus performs t-test. The information processing device calculates a statistical test value that is smaller as the difference between the average values is larger, based on the difference between the average values of the distributions of the feature amounts of the two categories.

図1に示すように、情報処理装置は、複数の下位カテゴリの組み合わせごとに統計的検定値を算出する。情報処理装置は、例えば「商品A」、「商品B」の組み合わせで「0.60」、「商品A」、「商品C」の組み合わせで「1.23e−36」、「商品B」、「商品C」の組み合わせで「2.55e−28」という統計的検定値を算出したものとする。 As illustrated in FIG. 1, the information processing apparatus calculates a statistical test value for each combination of a plurality of lower categories. The information processing apparatus, for example, combines “product A” and “product B” with “0.60”, “product A”, and “product C” with “1.23e −36 ”, “product B”, “ Assume that a statistical test value of “2.55e −28 ” is calculated for the combination of “Product C”.

次に、情報処理装置は、算出結果に基づいて、複数の下位カテゴリを統合する(ステップS2)。具体的には、情報処理装置は、閾値Thと算出結果を比較し、閾値Thより統計的検定値が大きい下位カテゴリの組み合わせを統合する。図1では、「商品A」、「商品B」の組み合わせの統計的検定値が閾値Thより大きく、それ以外の組み合わせが閾値Th以下であるものとする。   Next, the information processing apparatus integrates a plurality of lower categories based on the calculation result (step S2). Specifically, the information processing apparatus compares the threshold value Th with the calculation result, and integrates a combination of lower categories having a statistical test value larger than the threshold value Th. In FIG. 1, it is assumed that the statistical test value of the combination of “product A” and “product B” is larger than the threshold value Th, and other combinations are equal to or less than the threshold value Th.

この場合、情報処理装置は、「商品A」および「商品B」を統合し、カテゴリツリーT12を生成する。ここで、情報処理装置は、統合するカテゴリに含まれるオブジェクトを含む新たなカテゴリを所定カテゴリの下位に生成し、統合するカテゴリを削除することで、カテゴリを統合する。図1の例では、情報処理装置は、「商品Aおよび商品B」という新たなカテゴリを「デスクトップ型」の下位に生成し、「商品A」および「商品B」を削除する。   In this case, the information processing apparatus integrates “product A” and “product B” to generate a category tree T12. Here, the information processing apparatus generates a new category including an object included in the category to be integrated below the predetermined category, and deletes the category to be integrated, thereby integrating the categories. In the example of FIG. 1, the information processing apparatus generates a new category “product A and product B” below “desktop type”, and deletes “product A” and “product B”.

このように、実施形態に係る情報処理装置は、階層構造を有する複数のカテゴリのうち、所定カテゴリの下位に位置する複数の下位カテゴリに含まれるオブジェクトの特徴量であって、連続値で表される特徴量に基づき、複数の下位カテゴリの組み合わせごとに、統計的検定値を算出する。また、情報処理装置は、算出結果に基づいて、複数の下位カテゴリを統合する。   As described above, the information processing apparatus according to the embodiment is a feature value of an object included in a plurality of lower categories located below a predetermined category among a plurality of categories having a hierarchical structure, and is represented by a continuous value. A statistical test value is calculated for each combination of a plurality of subcategories based on the feature quantity. Further, the information processing apparatus integrates a plurality of lower categories based on the calculation result.

これにより、情報処理装置は、連続値である特徴量に基づき、カテゴリを統合することができる。このため、カテゴリの統合精度を向上させることができる。   As a result, the information processing apparatus can integrate categories based on feature values that are continuous values. For this reason, the integration accuracy of categories can be improved.

〔2.情報処理装置の構成〕
図2を用いて、実施形態に係る情報処理装置1の構成について説明する。図2は、実施形態に係る情報処理装置1の構成を示すブロック図である。図2に示すように、情報処理装置1は、記憶部10と、制御部(コントローラ)20を備える。
[2. Configuration of information processing apparatus]
The configuration of the information processing apparatus 1 according to the embodiment will be described with reference to FIG. FIG. 2 is a block diagram illustrating a configuration of the information processing apparatus 1 according to the embodiment. As illustrated in FIG. 2, the information processing apparatus 1 includes a storage unit 10 and a control unit (controller) 20.

記憶部10は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部10は、カテゴリ情報記憶部110と、属性情報記憶部120とを有する。   The storage unit 10 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. The storage unit 10 includes a category information storage unit 110 and an attribute information storage unit 120.

カテゴリ情報記憶部110は、階層構造を有する複数のカテゴリに関するカテゴリ情報を記憶する。具体的には、カテゴリ情報記憶部110は、カテゴリ間の階層関係である階層情報を記憶する。ここで、図3Aおよび図3Bを用いて、カテゴリ情報記憶部110の一例を説明する。図3Aは、実施形態に係るカテゴリ情報記憶部110の一例を示す図である。図3Bは、カテゴリ情報記憶部110が記憶する複数のカテゴリの階層関係を示す模式図である。なお、ここでは、複数のカテゴリは、オブジェクトである出品商品の分類カテゴリ、すなわち商品カテゴリであるものとして説明するが、商品カテゴリに限定されない。また、複数のカテゴリがツリー構造を有するものとして説明するが、階層構造を有するカテゴリであればよく、ツリー構造に限定されない。   The category information storage unit 110 stores category information regarding a plurality of categories having a hierarchical structure. Specifically, the category information storage unit 110 stores hierarchical information that is a hierarchical relationship between categories. Here, an example of the category information storage unit 110 will be described with reference to FIGS. 3A and 3B. FIG. 3A is a diagram illustrating an example of the category information storage unit 110 according to the embodiment. FIG. 3B is a schematic diagram illustrating a hierarchical relationship among a plurality of categories stored in the category information storage unit 110. Here, the plurality of categories will be described as classification categories of the exhibited merchandise as objects, that is, merchandise categories, but are not limited to merchandise categories. Further, although a plurality of categories are described as having a tree structure, any category having a hierarchical structure may be used, and the present invention is not limited to the tree structure.

図3Aに示すように、カテゴリ情報記憶部110は、「親ノード」および「子ノード」を項目として有する。親ノードは、上位カテゴリを指し、子ノードは下位カテゴリを指す。すなわち、子ノードのカテゴリは、親ノードのカテゴリの下位に位置する下位カテゴリである。例えば、親ノードが「コンピュータ」であり、子ノードが「タブレット」である場合、「コンピュータ」の下位に「タブレット」が位置する。   As illustrated in FIG. 3A, the category information storage unit 110 includes “parent node” and “child node” as items. The parent node indicates the upper category, and the child node indicates the lower category. In other words, the category of the child node is a lower category located under the category of the parent node. For example, when the parent node is “computer” and the child node is “tablet”, “tablet” is positioned below “computer”.

図3Bでは、カテゴリ情報記憶部110が記憶する複数のカテゴリで構成されるカテゴリツリーT21を模式的に示している。図3Bでは、最上位カテゴリとして「コンピュータ」が位置している。「コンピュータ」の下位に、「タブレット」および「パソコン」が位置している。   FIG. 3B schematically shows a category tree T21 including a plurality of categories stored in the category information storage unit 110. In FIG. 3B, “computer” is positioned as the highest category. “Tablet” and “PC” are located below “Computer”.

属性情報記憶部120は、複数のカテゴリに含まれるオブジェクトに関する情報を記憶する。属性情報記憶部120は、例えばオブジェクト名、オブジェクトが属するカテゴリ等のオブジェクトの属性を示す属性情報を記憶する。ここで、図4を用いて、属性情報記憶部120の一例を説明する。図4は、実施形態に係る属性情報記憶部120の一例を示す図である。なお、ここでは、オブジェクトが出品商品であるものとして説明するが、オブジェクトは、上述するカテゴリに含まれるオブジェクトであればよく、出品商品に限定されない。   The attribute information storage unit 120 stores information regarding objects included in a plurality of categories. The attribute information storage unit 120 stores attribute information indicating object attributes such as an object name and a category to which the object belongs. Here, an example of the attribute information storage unit 120 will be described with reference to FIG. FIG. 4 is a diagram illustrating an example of the attribute information storage unit 120 according to the embodiment. Here, the description will be made assuming that the object is an exhibition commodity, but the object is not limited to the exhibition commodity as long as it is an object included in the above-described category.

図4に示すように、属性情報記憶部120は、「商品ID」、「商品カテゴリ」、「落札価格」、「商品画像」、「入札件数」、「商品状態」等の項目を有する。「商品ID」は、例えば各商品を識別する固有の番号等を示す情報である。また、「商品カテゴリ」は、カテゴリ情報記憶部110が記憶するカテゴリに対応し、出品商品がどのカテゴリに含まれているかを示す情報である。「落札価格」、「入札件数」は、それぞれ出品商品を落札した価格や入札した件数を示す連続変数である。「商品画像」や「商品状態」は、画像の有無や状態を示す離散変数である。   As shown in FIG. 4, the attribute information storage unit 120 includes items such as “product ID”, “product category”, “successful bid price”, “product image”, “number of bids”, and “product state”. “Product ID” is information indicating a unique number for identifying each product, for example. The “product category” corresponds to the category stored in the category information storage unit 110 and is information indicating in which category the exhibited product is included. The “successful bid price” and “number of bids” are continuous variables indicating the price at which the exhibited product is awarded and the number of bids, respectively. “Product image” and “product state” are discrete variables indicating the presence and state of an image.

図2に戻る。制御部20は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置1内部の記憶部10に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部20は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。   Returning to FIG. The control unit 20 includes, for example, a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or the like that stores various programs (corresponding to an example of an information processing program) stored in the storage unit 10 inside the information processing apparatus 1 in RAM. Is implemented as a work area. The control unit 20 is realized by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

制御部20は、処理部200と、特徴指定部210と、取得部220と、算出部230と、統合部240とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部20の内部構成は、図2に示す構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部20が有する各処理部の接続関係は、図2に示す接続関係に限られず、他の接続関係であってもよい。   The control unit 20 includes a processing unit 200, a feature designation unit 210, an acquisition unit 220, a calculation unit 230, and an integration unit 240, and realizes or executes information processing functions and operations described below. Note that the internal configuration of the control unit 20 is not limited to the configuration illustrated in FIG. 2, and may be other configurations as long as the configuration performs information processing to be described later. Further, the connection relationship between the processing units included in the control unit 20 is not limited to the connection relationship illustrated in FIG. 2, and may be another connection relationship.

処理部200は、記憶部10が記憶する属性情報を用いた処理を行う。例えば、ユーザが所定商品を出品するか否か検討する場合などに、出品を予定している商品(以下、出品予定商品と呼ぶ)がどれくらいの価格で落札されるか予測したい場合がある。この場合、処理部200は、属性情報を特徴量とする予測モデル演算を行う。   The processing unit 200 performs processing using the attribute information stored in the storage unit 10. For example, when a user considers whether or not to sell a predetermined product, there is a case where it is desired to predict how much a product scheduled to be sold (hereinafter referred to as a scheduled product to be sold) will be sold. In this case, the processing unit 200 performs a prediction model calculation using the attribute information as a feature amount.

しかしながら、例えば、出品予定商品と同じカテゴリの商品数が少ない場合など、生成されたモデルによる予測演算の精度が低下してしまう場合がある。そこで実施形態に係る情報処理装置1では、例えば属性情報を用いた演算精度を向上させるために、複数のカテゴリの統合処理を行う。このときに、処理部200による予測演算処理に応じた特徴量に基づいてカテゴリを統合することで、処理部200による予測演算精度を低下させることなくカテゴリの統合を行うことができる。   However, for example, when the number of products in the same category as the planned product for sale is small, the accuracy of the prediction calculation by the generated model may be reduced. Therefore, in the information processing apparatus 1 according to the embodiment, for example, in order to improve calculation accuracy using attribute information, a plurality of categories are integrated. At this time, by integrating the categories based on the feature amount corresponding to the prediction calculation processing by the processing unit 200, the categories can be integrated without reducing the prediction calculation accuracy by the processing unit 200.

特徴指定部210は、算出部230が算出する統計的検定値の算出に用いる特徴量を指定する。特徴指定部210が指定する特徴量は、処理部200で行われる処理に応じて異なる。例えば、処理部200により落札価格の予測処理が行われる場合、特徴指定部210は、特徴量として「落札価格」を指定する。なお、特徴指定部210が指定する特徴量は、属性情報記憶部120が記憶する属性情報に含まれる特徴量のうち連続値である特徴量であればよく、「落札価格」に限定されない。例えば、図4の例では、特徴指定部210は、「入札件数」を指定することもできる。   The feature designation unit 210 designates a feature amount used for calculating the statistical test value calculated by the calculation unit 230. The feature amount designated by the feature designation unit 210 varies depending on the processing performed by the processing unit 200. For example, when the processing unit 200 performs a bid price prediction process, the feature designation unit 210 designates “successful bid price” as the feature amount. The feature quantity designated by the feature designation unit 210 may be a feature quantity that is a continuous value among the feature quantities included in the attribute information stored in the attribute information storage unit 120, and is not limited to the “successful bid price”. For example, in the example of FIG. 4, the feature designation unit 210 can also designate “the number of bids”.

なお、ここでは、特徴指定部210が処理部200による演算に応じて特徴量を指定する場合について説明したが、これに限定されない。例えば、予め指定する特徴量が決められていてもよい。この場合、例えば指定する特徴量に関する情報が記憶部10に記憶されており、特徴指定部210は、記憶部10を参照して特徴量を指定する。あるいは、ユーザが特徴量を指定するようにしてもよい。この場合、特徴指定部210は、例えば受付部として機能する。特徴指定部210は、ユーザから受け付けた特徴量を指定する。特徴指定部210は、指定した特徴量を取得部220および算出部230に出力する。   Here, a case has been described in which the feature specifying unit 210 specifies a feature amount according to the calculation by the processing unit 200, but the present invention is not limited to this. For example, a feature amount designated in advance may be determined. In this case, for example, information regarding the feature quantity to be designated is stored in the storage unit 10, and the feature designation unit 210 designates the feature quantity with reference to the storage unit 10. Alternatively, the user may specify the feature amount. In this case, the feature designation unit 210 functions as a reception unit, for example. The feature designation unit 210 designates the feature amount received from the user. The feature designation unit 210 outputs the designated feature amount to the acquisition unit 220 and the calculation unit 230.

取得部220は、複数のカテゴリの階層情報を取得する。また、取得部220は、カテゴリに含まれるオブジェクトの特徴量を取得する。具体的には、取得部220は、カテゴリ情報記憶部110からカテゴリ情報を取得する。また、取得部220は、特徴指定部210が指定した特徴量を属性情報記憶部120から取得する。取得部220は、取得したカテゴリ情報および特徴量を算出部230に出力する。   The acquisition unit 220 acquires hierarchical information of a plurality of categories. Further, the acquisition unit 220 acquires the feature amount of the object included in the category. Specifically, the acquisition unit 220 acquires category information from the category information storage unit 110. The acquisition unit 220 acquires the feature amount designated by the feature designation unit 210 from the attribute information storage unit 120. The acquisition unit 220 outputs the acquired category information and feature amount to the calculation unit 230.

算出部230は、取得部220が取得したカテゴリ情報および特徴量に基づき、統計的検定値を算出する。具体的には、算出部230は、所定カテゴリの下位に位置する複数の下位カテゴリの組み合わせごとに統計的検定値を算出する。算出部230は、算出した統計的検定値を統合部240に出力する。   The calculation unit 230 calculates a statistical test value based on the category information and the feature amount acquired by the acquisition unit 220. Specifically, the calculation unit 230 calculates a statistical test value for each combination of a plurality of lower categories located below the predetermined category. The calculation unit 230 outputs the calculated statistical test value to the integration unit 240.

統合部240は、算出部230が算出した統計的検定値に基づいてカテゴリを統合する。統合部240は、統合決定部241と、統合処理部242とを有する。   The integration unit 240 integrates the categories based on the statistical test value calculated by the calculation unit 230. The integration unit 240 includes an integration determination unit 241 and an integration processing unit 242.

統合決定部241は、統合するカテゴリを決定する。統合決定部241は、例えば、所定カテゴリの下位に1つの下位カテゴリが位置する場合、当該下位カテゴリおよび所定カテゴリを統合すると決定する。また、統合決定部241は、算出部230が算出した統計的検定値に応じて統合するカテゴリを決定する。例えば、統合決定部241は、統計的検定値が所定閾値Th以上である下位カテゴリの組み合わせを統合するカテゴリに決定する。統合決定部241は、決定したカテゴリの組み合わせを統合処理部242に出力する。   The integration determining unit 241 determines a category to be integrated. For example, when one lower category is positioned below the predetermined category, the integration determining unit 241 determines to integrate the lower category and the predetermined category. Further, the integration determining unit 241 determines a category to be integrated according to the statistical test value calculated by the calculating unit 230. For example, the integration determining unit 241 determines a category for integrating a combination of lower categories whose statistical test value is equal to or greater than a predetermined threshold Th. The integration determining unit 241 outputs the determined combination of categories to the integration processing unit 242.

統合処理部242は、統合決定部241が決定したカテゴリの組み合わせを統合し、新たなカテゴリを生成する。統合処理部242は、生成したカテゴリに基づいて、カテゴリ情報記憶部110が記憶するカテゴリ情報を更新する。また、生成したカテゴリに基づいて、統合処理部242は、属性情報記憶部120が記憶する属性情報を更新する。例えば、情報処理装置1は、統合処理部242が更新したカテゴリ情報および属性情報に基づいて、統合できるカテゴリがなくなるまでカテゴリの統合処理を行うものとする。   The integration processing unit 242 integrates the combination of categories determined by the integration determination unit 241 and generates a new category. The integration processing unit 242 updates the category information stored in the category information storage unit 110 based on the generated category. Further, based on the generated category, the integration processing unit 242 updates the attribute information stored in the attribute information storage unit 120. For example, it is assumed that the information processing apparatus 1 performs category integration processing until there is no category that can be integrated, based on the category information and attribute information updated by the integration processing unit 242.

続いて、図5A〜図11を用いて、情報処理装置1が行う統合処理の詳細について説明する。ここでは、図3Aおよび図3Bに示す複数のカテゴリに対して統合処理が行われるものとする。まず、情報処理装置1の算出部230は、属性情報に分類カテゴリとして記載されている最下位カテゴリの上位カテゴリを所定カテゴリとする。また、算出部230は、所定カテゴリの中から、最下位カテゴリが複数属する所定カテゴリの1つを指定カテゴリとする。図3Aおよび図3Bの例では、所定カテゴリは「ブランドA」、「B会社」、「ブランドC」〜「ブランドE」となる。算出部230は、所定カテゴリの中から「ブランドE」を指定カテゴリとする。   Next, details of the integration process performed by the information processing apparatus 1 will be described with reference to FIGS. 5A to 11. Here, it is assumed that the integration process is performed on a plurality of categories shown in FIGS. 3A and 3B. First, the calculation unit 230 of the information processing apparatus 1 sets the upper category of the lowest category described as the classification category in the attribute information as a predetermined category. In addition, the calculation unit 230 sets one of the predetermined categories to which the lowest category belongs, as the designated category. In the example of FIGS. 3A and 3B, the predetermined categories are “brand A”, “company B”, “brand C” to “brand E”. The calculation unit 230 sets “brand E” as the designated category from the predetermined categories.

算出部230は、指定カテゴリの下位カテゴリの組み合わせごとに統計的検定値を算出する。図3Aおよび図3Bの例では、算出部230は、「商品E1」および「商品E2」の組み合わせについて、「落札価格」に基づいた統計的検定値を算出する。ここでは、算出部230がt検定を行い、2つのカテゴリの平均値が等しいと「1」、平均値の差が大きいほど値が0に近づく統計的検定値を算出するものとする。   The calculation unit 230 calculates a statistical test value for each combination of lower categories of the designated category. In the example of FIGS. 3A and 3B, the calculation unit 230 calculates a statistical test value based on the “successful bid price” for the combination of “product E1” and “product E2”. Here, it is assumed that the calculation unit 230 performs a t test and calculates “1” when the average values of the two categories are equal, and calculates a statistical test value that approaches 0 as the difference between the average values increases.

情報処理装置1の統合決定部241は、下位カテゴリが1つの所定カテゴリと、当該下位カテゴリを統合するカテゴリの組み合わせに決定する。図3Aおよび図3Bの例では、統合決定部241は、「ブランドA」および「商品A」の組み合わせ、「B会社」および「商品B」の組み合わせ、「ブランドC」および「商品C」の組み合わせ、および、「ブランドD」および「商品D」の組み合わせを統合するカテゴリの組み合わせに決定する。   The integration determining unit 241 of the information processing apparatus 1 determines a combination of a predetermined category having one lower category and a category integrating the lower category. In the example of FIGS. 3A and 3B, the integration determining unit 241 performs a combination of “Brand A” and “Product A”, a combination of “B Company” and “Product B”, and a combination of “Brand C” and “Product C”. , And the combination of “brand D” and “product D” is determined as a combination of categories.

また、統合決定部241は、算出部230の算出結果に基づいて統合するカテゴリの組み合わせを決定する。例えば、「商品E1」に含まれる出品商品の「落札価格」が図5Aに示す分布となり、「商品E2」に含まれる出品商品の「落札価格」が図5Bに示す分布となるとする。なお、図5Aおよび図5Bは下位カテゴリに含まれるオブジェクトの特徴量の分布の一例を示すグラフであり、縦軸が商品数、横軸が価格を示している。   Further, the integration determination unit 241 determines a combination of categories to be integrated based on the calculation result of the calculation unit 230. For example, it is assumed that the “successful bid price” of the exhibition product included in “product E1” has the distribution shown in FIG. 5A, and the “successful bid price” of the exhibition product included in “product E2” has the distribution shown in FIG. 5B. 5A and 5B are graphs showing an example of the distribution of the feature amounts of the objects included in the lower category, in which the vertical axis indicates the number of products and the horizontal axis indicates the price.

図5Aおよび図5Bに示すように、「商品E1」の分布および「商品E2」の分布が類似しているものとする。この場合、2つのカテゴリの分布の平均値の差が小さくなり、算出部230は、「1」に近いt検定値を算出する。統合決定部241は、「商品E1」および「商品E2」の組み合わせを統合するカテゴリの組み合わせに決定する。   As shown in FIGS. 5A and 5B, it is assumed that the distribution of “product E1” and the distribution of “product E2” are similar. In this case, the difference between the average values of the distributions of the two categories becomes small, and the calculation unit 230 calculates a t-test value close to “1”. The integration determining unit 241 determines a combination of categories for integrating the combination of “product E1” and “product E2”.

なお、「商品E1」および「商品E2」を統合すると、指定カテゴリ「ブランドE」の下位に位置するカテゴリが1つとなる。このような場合に、統合決定部241は、指定カテゴリ「ブランドE」も「商品E1」および「商品E2」に統合すると決定する。   Note that when “product E1” and “product E2” are integrated, one category is positioned below the designated category “brand E”. In such a case, the integration determining unit 241 determines that the designated category “brand E” is also integrated into “product E1” and “product E2”.

情報処理装置1の統合処理部242は、統合決定部241が決定したカテゴリの組み合わせを統合する。具体的には、統合処理部242は、新たなカテゴリを生成し、統合すると決定したカテゴリに含まれるオブジェクトを新たなカテゴリに含める。このとき、統合処理部242は、例えば統合するカテゴリに上位カテゴリが含まれる場合は、上位カテゴリ名を新たなカテゴリ名にする。言い換えると、上位カテゴリに下位カテゴリのオブジェクトが含まれるようにし、下位カテゴリを削除する。また、統合処理部242は、統合するカテゴリに上位カテゴリが含まれない場合は、例えば、下位カテゴリ名を連結して新たなカテゴリ名にする。   The integration processing unit 242 of the information processing apparatus 1 integrates the combination of categories determined by the integration determination unit 241. Specifically, the integration processing unit 242 generates a new category and includes an object included in the category determined to be integrated into the new category. At this time, for example, when the category to be integrated includes a higher category, the integration processing unit 242 sets the higher category name as a new category name. In other words, the lower category is included in the upper category, and the lower category is deleted. Further, when the upper category is not included in the category to be integrated, for example, the integration processing unit 242 concatenates the lower category names to form a new category name.

図6に、統合処理部242が更新した複数のカテゴリをツリーT22として示す。図6は、実施形態に係る統合処理部242が生成する複数のカテゴリの一例を示す図である。図6に示すように、統合処理部242は、「ブランドA」に「商品A」を、「B会社」に「商品B」を、「ブランドC」に「商品C」を、「ブランドD」に「商品D」をそれぞれ統合する。また、統合処理部242は、「ブランドE」に「商品E1」および「商品E2」を統合する。これにより、統合処理部242は、カテゴリ情報を更新する。   FIG. 6 shows a plurality of categories updated by the integration processing unit 242 as a tree T22. FIG. 6 is a diagram illustrating an example of a plurality of categories generated by the integration processing unit 242 according to the embodiment. As shown in FIG. 6, the integrated processing unit 242 displays “Product A” for “Brand A”, “Product B” for “Company B”, “Product C” for “Brand C”, and “Brand D”. "Product D" is integrated into each. Further, the integration processing unit 242 integrates “product E1” and “product E2” with “brand E”. Thereby, the integration processing unit 242 updates the category information.

情報処理装置1は、統合処理部242が生成した複数のカテゴリに対して統合処理をさらに行う。この場合、例えば算出部230は、「ブランドA」および「B会社」の組み合わせについて統計的検定値を算出する。また、算出部230は、「ブランドC」、「ブランドD」および「ブランドE」の全ての組み合わせについて統計的検定値を算出する。   The information processing apparatus 1 further performs integration processing on a plurality of categories generated by the integration processing unit 242. In this case, for example, the calculation unit 230 calculates a statistical test value for the combination of “brand A” and “company B”. In addition, the calculation unit 230 calculates a statistical test value for all combinations of “brand C”, “brand D”, and “brand E”.

統合決定部241は、算出部230の算出結果に基づいて統合するカテゴリの組み合わせを決定する。例えば、「ブランドA」に含まれる出品商品の「落札価格」が図7Aに示す分布となり、「B会社」に含まれる出品商品の「落札価格」が図7Bに示す分布となるとする。なお、図7Aおよび図7Bは下位カテゴリに含まれるオブジェクトの特徴量の分布の一例を示すグラフであり、縦軸が商品数、横軸が価格を示している。   The integration determination unit 241 determines a combination of categories to be integrated based on the calculation result of the calculation unit 230. For example, it is assumed that the “successful bid price” of the exhibited product included in “brand A” has the distribution shown in FIG. 7A, and the “successful bid price” of the exhibited product included in “B company” has the distribution shown in FIG. 7B. 7A and 7B are graphs showing an example of the distribution of feature amounts of objects included in the lower category, in which the vertical axis indicates the number of products and the horizontal axis indicates the price.

図7Aおよび図7Bに示すように、「ブランドA」の分布および「B会社」の分布が類似しているものとする。この場合、2つのカテゴリの分布の平均値の差が小さくなり、算出部230は、「1」に近い統計的検定値を算出する。この場合、統合決定部241は、「ブランドA」および「B会社」の組み合わせを統合するカテゴリの組み合わせに決定する。   As shown in FIGS. 7A and 7B, it is assumed that the distribution of “Brand A” and the distribution of “Company B” are similar. In this case, the difference between the average values of the distributions of the two categories becomes small, and the calculation unit 230 calculates a statistical test value close to “1”. In this case, the integration determining unit 241 determines a combination of categories for integrating the combination of “brand A” and “company B”.

なお、「ブランドA」および「B会社」を統合すると、指定カテゴリ「タブレット」の下位に位置するカテゴリが1つとなる。このような場合に、統合決定部241は、指定カテゴリ「タブレット」も「ブランドA」および「B会社」に統合すると決定する。   When “Brand A” and “Company B” are integrated, there is one category located under the designated category “Tablet”. In such a case, the integration determining unit 241 determines that the designated category “tablet” is also integrated into “brand A” and “company B”.

また、統合決定部241は、「ブランドC」、「ブランドD」および「ブランドE」から統合するカテゴリの組み合わせを決定する。例えば、「ブランドC」に含まれる出品商品の「落札価格」が図8Aに示す分布となり、「ブランドD」に含まれる出品商品の「落札価格」が図8Bに示す分布となり、「ブランドE」に含まれる出品商品の「落札価格」が図8Cに示す分布となるとする。なお、図8A〜図8Cは下位カテゴリに含まれるオブジェクトの特徴量の分布の一例を示すグラフであり、縦軸が商品数、横軸が価格を示している。また、図8Cに示す「ブランドE」の「落札価格」の分布は、図5Aおよび図5Bに示す「商品E1」および「商品E2」の「落札価格」の分布を合わせた分布となっている。   Further, the integration determining unit 241 determines a combination of categories to be integrated from “brand C”, “brand D”, and “brand E”. For example, the “successful bid price” of the exhibition product included in “brand C” has the distribution shown in FIG. 8A, the “successful bid price” of the exhibition product included in “brand D” has the distribution shown in FIG. Suppose that the “successful bid price” of the exhibited products included in the distribution shown in FIG. 8C. 8A to 8C are graphs showing examples of distributions of feature amounts of objects included in the lower category, in which the vertical axis indicates the number of products and the horizontal axis indicates the price. Further, the distribution of “successful bid price” of “brand E” shown in FIG. 8C is a distribution in which the distribution of “successful bid price” of “product E1” and “product E2” shown in FIGS. 5A and 5B is combined. .

図8A〜図8Cに示すように、「ブランドC」の分布および「ブランドD」の分布が類似しており、「ブランドE」の分布は「ブランドC」、「ブランドD」の分布に類似していないものとする。この場合、「ブランドC」および「ブランドD」の分布の平均値の差が小さくなり、算出部230は、「1」に近い統計的検定値を算出する。一方、「ブランドC」および「ブランドE」の分布、「ブランドD」および「ブランドE」の分布の平均値の差は大きくなり、算出部230は「0」に近い統計的検定値をそれぞれ算出する。この場合、統合決定部241は、「ブランドC」および「ブランドD」の組み合わせを統合するカテゴリの組み合わせに決定する。また、「ブランドE」は統合を行わないと決定する。   As shown in FIGS. 8A to 8C, the distribution of “Brand C” and the distribution of “Brand D” are similar, and the distribution of “Brand E” is similar to the distribution of “Brand C” and “Brand D”. Shall not. In this case, the difference between the average values of the distributions of “brand C” and “brand D” becomes small, and the calculation unit 230 calculates a statistical test value close to “1”. On the other hand, the difference between the average values of the distributions of “Brand C” and “Brand E” and the distributions of “Brand D” and “Brand E” is large, and the calculation unit 230 calculates a statistical test value close to “0”, respectively. To do. In this case, the integration determining unit 241 determines a combination of categories for integrating a combination of “brand C” and “brand D”. “Brand E” is determined not to be integrated.

情報処理装置1の統合処理部242は、統合決定部241が決定したカテゴリの組み合わせを統合する。図9に、統合処理部242がカテゴリを統合した後のカテゴリツリーT23を示す。図9は、実施形態に係る統合処理部242が生成する複数のカテゴリの一例を示す図である。図9に示すように、統合処理部242は、「タブレット」に「ブランドA」および「B会社」を統合する。また、統合処理部242は、「ブランドCおよびD」を生成することで「ブランドC」および「ブランドD」を統合する。   The integration processing unit 242 of the information processing apparatus 1 integrates the combination of categories determined by the integration determination unit 241. FIG. 9 shows the category tree T23 after the integration processing unit 242 integrates the categories. FIG. 9 is a diagram illustrating an example of a plurality of categories generated by the integration processing unit 242 according to the embodiment. As illustrated in FIG. 9, the integration processing unit 242 integrates “brand A” and “company B” into “tablet”. Further, the integration processing unit 242 integrates “brand C” and “brand D” by generating “brand C and D”.

ここで、図9に示すように、「コンピュータ」の2つ下位に「ブランドCおよびD」および「ブランドE」が存在する。したがって、「コンピュータ」の下位カテゴリである「タブレット」および「パソコン」は統合できない。また、「タブレット」には下位カテゴリがなく、「パソコン」の下位カテゴリである「ブランドE」は、統合決定部241が統合を行わないと決定したカテゴリである。このように、図9に示すカテゴリツリーT23は、統合をおこなえるカテゴリが存在しない。この場合、情報処理装置1の統合処理部242は、カテゴリ情報および属性情報を更新し、統合処理を終了する。   Here, as shown in FIG. 9, “Brand C and D” and “Brand E” are two levels below “Computer”. Therefore, “tablet” and “personal computer”, which are subcategories of “computer”, cannot be integrated. “Tablet” has no lower category, and “Brand E”, which is a lower category of “PC”, is a category that the integration determining unit 241 determines not to integrate. Thus, the category tree T23 shown in FIG. 9 does not have a category that can be integrated. In this case, the integration processing unit 242 of the information processing device 1 updates the category information and the attribute information, and ends the integration process.

図10は、実施形態に係る更新後のカテゴリ情報記憶部110を示す図である。図10に示すように、統合処理部242は、「商品A」〜「商品E2」や「ブランドA」、「B会社」を削除し、カテゴリ情報を更新する。図11は、実施形態に係る更新後の属性情報記憶部120を示す図である。図11に示すように、統合処理部242は、属性情報の「商品カテゴリ」を更新後のカテゴリ情報に基づいて統合後のカテゴリに変更する。図11では、統合処理部242は、例えば商品A1の「商品カテゴリ」を「商品A」から「タブレット」に変更する(図4参照)。   FIG. 10 is a diagram illustrating the updated category information storage unit 110 according to the embodiment. As illustrated in FIG. 10, the integration processing unit 242 deletes “product A” to “product E2”, “brand A”, and “company B”, and updates the category information. FIG. 11 is a diagram illustrating the updated attribute information storage unit 120 according to the embodiment. As illustrated in FIG. 11, the integration processing unit 242 changes the “product category” of the attribute information to the integrated category based on the updated category information. In FIG. 11, the integration processing unit 242 changes, for example, the “product category” of the product A1 from “product A” to “tablet” (see FIG. 4).

〔3.統合処理手順〕
次に、図12を用いて、実施形態に係る情報処理装置1による統合処理の手順について説明する。図12は、実施形態に係る情報処理装置1による統合処理手順を示すフローチャートである。実施形態に係る情報処理装置1は、下位カテゴリの1つ上位のカテゴリ(所定カテゴリ)に対し、以下の統合処理を行う。統合処理は、例えば統合できるカテゴリが存在しなくなるまで繰り返し行われるものとする。
[3. (Integration procedure)
Next, a procedure of integration processing by the information processing apparatus 1 according to the embodiment will be described with reference to FIG. FIG. 12 is a flowchart illustrating an integration processing procedure by the information processing apparatus 1 according to the embodiment. The information processing apparatus 1 according to the embodiment performs the following integration process on a category (predetermined category) one level higher than the lower category. For example, the integration process is repeatedly performed until there is no category that can be integrated.

図12に示すように、情報処理装置1は、所定カテゴリの1つを指定カテゴリに指定する(ステップS101)。情報処理装置1は、指定カテゴリの2つ下位にカテゴリが存在するか否かを判定する(ステップS102)。2つ下位にカテゴリが存在する場合(ステップS102;Yes)、情報処理装置1は、統合を行わないとしてステップS108に進む。一方、2つ下位にカテゴリが存在しない、すなわち、指定カテゴリの下位カテゴリが全て最下位カテゴリである場合、(ステップS102;No)、情報処理装置1は、指定カテゴリの下位カテゴリ数が1であるか否かを判定する(ステップS103)。   As illustrated in FIG. 12, the information processing apparatus 1 designates one of the predetermined categories as a designated category (step S101). The information processing apparatus 1 determines whether a category exists in the lower level of the designated category (step S102). If a category exists in the lower level (step S102; Yes), the information processing apparatus 1 proceeds to step S108 on the assumption that no integration is performed. On the other hand, if there are no two lower categories, that is, if all the lower categories of the designated category are the lowest categories (step S102; No), the information processing apparatus 1 has one lower category number of the designated category. Whether or not (step S103).

下位カテゴリ数が1、すなわち指定カテゴリに1つの下位カテゴリが属する場合(ステップS103;Yes)、情報処理装置1は、下位カテゴリと指定カテゴリとを統合し(ステップS104)、ステップS108に進む。   When the number of lower categories is 1, that is, one lower category belongs to the designated category (step S103; Yes), the information processing apparatus 1 integrates the lower category and the designated category (step S104), and proceeds to step S108.

一方、下位カテゴリ数が1ではない、すなわち指定カテゴリに複数の下位カテゴリが属する場合(ステップS103;No)、情報処理装置1は、複数の下位カテゴリの全ての組み合わせで統計的検定値を算出する(ステップS105)。情報処理装置1は、ステップS105で算出した統計的検定値に基づいて統合する下位カテゴリを決定し(ステップS106)、決定した下位カテゴリを統合する(ステップS107)。   On the other hand, when the number of lower categories is not 1, that is, when a plurality of lower categories belong to the designated category (step S103; No), the information processing apparatus 1 calculates a statistical test value for all combinations of the plurality of lower categories. (Step S105). The information processing apparatus 1 determines a lower category to be integrated based on the statistical test value calculated in step S105 (step S106), and integrates the determined lower category (step S107).

情報処理装置1は、全ての所定カテゴリについて統合判定を行ったか否かを判定する(ステップS108)。下位カテゴリの統合判定を行っていない所定カテゴリがある場合(ステップS108;No)、情報処理装置1は、統合判定を行っていない所定カテゴリ(未判定カテゴリ)を指定カテゴリに変更し(ステップS109)、ステップS102に戻る。一方、全ての所定カテゴリについて統合判定を行っている場合(ステップS108;Yes)、情報処理装置1は、統合処理を終了する。   The information processing apparatus 1 determines whether or not the integration determination has been performed for all the predetermined categories (step S108). If there is a predetermined category that has not been subjected to the integrated determination of the lower category (step S108; No), the information processing apparatus 1 changes the predetermined category (undetermined category) that has not been subjected to the integrated determination to the designated category (step S109). Return to step S102. On the other hand, when the integration determination is performed for all the predetermined categories (step S108; Yes), the information processing apparatus 1 ends the integration process.

これにより、情報処理装置1は、カテゴリの統合精度を向上させることができる。そのため、カテゴリ数を削減することができ、例えば予測演算等のカテゴリを用いた処理を行う場合に、処理精度を低下させることなく処理速度を向上させることができる。   Thereby, the information processing apparatus 1 can improve the integration accuracy of a category. Therefore, the number of categories can be reduced. For example, when processing using a category such as prediction calculation is performed, the processing speed can be improved without reducing the processing accuracy.

〔4.変形例〕
上述した実施形態に係る情報処理装置1は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、他の実施形態について説明する。
[4. (Modification)
The information processing apparatus 1 according to the above-described embodiment may be implemented in various different forms other than the above-described embodiment. Accordingly, other embodiments will be described below.

上記実施形態では、情報処理装置1は、t検定を行い、統計的検定値を算出するとしたが、これに限定されない。情報処理装置1は、連続値である特徴量に基づいた統計的検定を行えばよく、例えばブルンナー・ムンツェル検定やマン・ホイットニーのU検定等を行うようにしてもよい。またt検定としてウェルチのt検定を行うようにしてもよい。   In the above embodiment, the information processing apparatus 1 performs the t test and calculates the statistical test value, but is not limited thereto. The information processing apparatus 1 may perform a statistical test based on feature values that are continuous values. For example, the Brunner-Munzel test or the Mann-Whitney U test may be performed. Further, a Welch t test may be performed as a t test.

上記実施形態では、情報処理装置1は、全てのカテゴリについて統合できないと判定されるまで繰り返し統合処理を行うものとしたが、これに限定されない。例えば、下位カテゴリに含まれるオブジェクトの数に応じて統合処理を繰り返し行うようにしてもよい。すなわち、情報処理装置1の統合部240は、オブジェクトの数が所定値以下である下位カテゴリを統合する。具体的には、情報処理装置1の統合決定部241が、算出部230が算出した統計的検定値に基づいて、オブジェクトの数が所定値以下である下位カテゴリと統合する下位カテゴリを決定する。   In the above-described embodiment, the information processing apparatus 1 repeatedly performs integration processing until it is determined that integration cannot be performed for all categories, but is not limited thereto. For example, the integration process may be repeated according to the number of objects included in the lower category. That is, the integration unit 240 of the information processing apparatus 1 integrates lower categories in which the number of objects is a predetermined value or less. Specifically, the integration determining unit 241 of the information processing device 1 determines a lower category to be integrated with a lower category in which the number of objects is a predetermined value or less based on the statistical test value calculated by the calculating unit 230.

例えば処理部200によるカテゴリ情報を用いた演算処理において、統合前の下位カテゴリに含まれるオブジェクト数が所定値以下である場合、オブジェクト数が少なく、演算処理精度が低下してしまう場合である。このような場合においても、オブジェクト数が所定値以下である下位カテゴリを高精度で統合することでオブジェクト数を所定値以上に増加させることができ、演算処理精度を向上させることができる。なお、所定値は、例えば、算出部230で所定の精度で統計的検定が行える数であるとする。あるいは、所定値は、例えば、処理部200による演算処理において所定の精度で演算が行える数であってもよい。   For example, in the arithmetic processing using the category information by the processing unit 200, when the number of objects included in the lower category before integration is equal to or less than a predetermined value, the number of objects is small and the arithmetic processing accuracy is reduced. Even in such a case, the number of objects can be increased to a predetermined value or higher by integrating the lower categories having the number of objects equal to or smaller than the predetermined value with high accuracy, and the arithmetic processing accuracy can be improved. Note that the predetermined value is, for example, a number that can be statistically tested by the calculation unit 230 with a predetermined accuracy. Alternatively, the predetermined value may be a number that can be calculated with a predetermined accuracy in the arithmetic processing by the processing unit 200, for example.

また、情報処理装置1の統合部240が、複数のカテゴリの数に応じて下位カテゴリを統合するようにしてもよい。すなわち、情報処理装置1の統合部240は、カテゴリの総数に応じて下位カテゴリを統合する。   Further, the integration unit 240 of the information processing apparatus 1 may integrate lower categories according to the number of categories. That is, the integration unit 240 of the information processing apparatus 1 integrates lower categories according to the total number of categories.

例えば処理部200によるカテゴリ情報を用いた演算処理において、カテゴリ情報に含まれるカテゴリの総数が多いと、演算精度が向上するが、演算量も増加する。そこで、情報処理装置1は、例えば処理部200が処理可能な演算量や求められる演算精度に応じたカテゴリ数になるように、下位カテゴリを統合する。これにより、処理部200の演算処理に応じた所望のカテゴリ数になるようにカテゴリを統合することができる。   For example, in the arithmetic processing using the category information by the processing unit 200, if the total number of categories included in the category information is large, the calculation accuracy is improved, but the calculation amount is also increased. Therefore, the information processing apparatus 1 integrates the lower categories so that, for example, the number of categories according to the calculation amount that can be processed by the processing unit 200 and the required calculation accuracy are obtained. As a result, the categories can be integrated so as to have a desired number of categories according to the arithmetic processing of the processing unit 200.

また、上記実施形態では、情報処理装置1の処理部200が「落札価格」の予測モデルの演算処理を行うとしたが、これに限定されない。処理部200はカテゴリ情報や属性情報に基づいた処理を行えばよく、例えばユーザが入札するか否かを予測する予測モデルや、商品の出品に違反がないか否かを予測する予測モデルなど、種々の演算を行うようにしてもよい。   Moreover, in the said embodiment, although the process part 200 of the information processing apparatus 1 performed the calculation process of the prediction model of "successful bid price", it is not limited to this. The processing unit 200 only needs to perform processing based on category information and attribute information. For example, a prediction model for predicting whether or not the user bids, a prediction model for predicting whether or not there is a violation in the listing of products, etc. Various calculations may be performed.

また、上記実施形態では、情報処理装置1が処理部200を備える構成としたが、これに限定されない。例えば、情報処理装置1とは異なる他装置が処理部200を備え、カテゴリ情報を用いた演算を行うようにしてもよい。この場合、情報処理装置1は、他装置からの要求に応じて複数のカテゴリを統合する。   Moreover, in the said embodiment, although the information processing apparatus 1 was set as the structure provided with the process part 200, it is not limited to this. For example, another device different from the information processing device 1 may include the processing unit 200 and perform calculations using category information. In this case, the information processing apparatus 1 integrates a plurality of categories in response to a request from another apparatus.

また、上記実施形態では、情報処理装置1が、カテゴリ情報および属性情報を記憶するとしたが、これに限定されない。カテゴリ情報および属性情報が図示しない記憶装置やサーバ装置などに記憶されていてもよい。この場合、情報処理装置1の取得部220が、記憶装置やサーバ装置などからカテゴリ情報および属性情報を取得するものとする。   Moreover, in the said embodiment, although the information processing apparatus 1 memorize | stores category information and attribute information, it is not limited to this. The category information and attribute information may be stored in a storage device or server device (not shown). In this case, it is assumed that the acquisition unit 220 of the information processing apparatus 1 acquires category information and attribute information from a storage device, a server device, or the like.

上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。   Of the processes described in the above embodiment, all or part of the processes described as being automatically performed can be performed manually, or all of the processes described as being performed manually or A part can be automatically performed by a known method. In addition, the processing procedures, specific names, and information including various data and parameters shown in the document and drawings can be arbitrarily changed unless otherwise specified. For example, the various types of information illustrated in each drawing is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、図2に示した特徴指定部210および取得部220は統合されてもよい。   Further, each component of each illustrated apparatus is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution / integration of each device is not limited to that shown in the figure, and all or a part thereof may be functionally or physically distributed or arbitrarily distributed in arbitrary units according to various loads or usage conditions. Can be integrated and configured. For example, the feature designation unit 210 and the acquisition unit 220 illustrated in FIG. 2 may be integrated.

また、上記実施形態では、属性情報は、インターネットオークションの出品商品に関する情報としたがこれに限定されない。属性情報は、例えばインターネットを介して販売される商品に関する情報であってもよい。この場合、カテゴリ情報は、販売される商品を分類する商品カテゴリとなる。また、属性情報は、連続値の特徴量を含む情報であればよく、例えばユーザに関する情報であってもよい。このように、属性情報は、商品に関する情報に限られない。   In the above-described embodiment, the attribute information is information related to auctioned products for Internet auction, but is not limited thereto. The attribute information may be information related to a product sold via the Internet, for example. In this case, the category information is a product category for classifying products to be sold. Further, the attribute information may be information including continuous feature values, and may be information about the user, for example. As described above, the attribute information is not limited to information about the product.

〔5.ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置1は、例えば図13に示すような構成のコンピュータ1000によって実現される。図13は、情報処理装置1の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、およびメディアインターフェイス(I/F)1700を有する。
[5. Hardware configuration)
Further, the information processing apparatus 1 according to the embodiment described above is realized by a computer 1000 having a configuration as shown in FIG. 13, for example. FIG. 13 is a hardware configuration diagram illustrating an example of a computer 1000 that implements the functions of the information processing apparatus 1. The computer 1000 includes a CPU 1100, RAM 1200, ROM 1300, HDD 1400, communication interface (I / F) 1500, input / output interface (I / F) 1600, and media interface (I / F) 1700.

CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。   The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400 and controls each unit. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 is started up, a program depending on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、および、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、通信網500を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを通信網500を介して他の機器へ送信する。   The HDD 1400 stores programs executed by the CPU 1100, data used by the programs, and the like. The communication interface 1500 receives data from other devices via the communication network 500 and sends the data to the CPU 1100, and transmits data generated by the CPU 1100 to other devices via the communication network 500.

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。   The CPU 1100 controls an output device such as a display and a printer and an input device such as a keyboard and a mouse via the input / output interface 1600. The CPU 1100 acquires data from the input device via the input / output interface 1600. In addition, the CPU 1100 outputs the generated data to the output device via the input / output interface 1600.

メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。   The media interface 1700 reads a program or data stored in the recording medium 1800 and provides it to the CPU 1100 via the RAM 1200. The CPU 1100 loads such a program from the recording medium 1800 onto the RAM 1200 via the media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable disk), a magneto-optical recording medium such as an MO (Magneto Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. It is.

例えば、コンピュータ1000が実施形態に係る情報処理装置1として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部20の機能を実現する。また、HDD1400には、記憶部10内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。   For example, when the computer 1000 functions as the information processing apparatus 1 according to the embodiment, the CPU 1100 of the computer 1000 implements the function of the control unit 20 by executing a program loaded on the RAM 1200. The HDD 1400 stores data in the storage unit 10. The CPU 1100 of the computer 1000 reads these programs from the recording medium 1800 and executes them, but as another example, these programs may be acquired from other devices via the communication network 500.

〔6.効果〕
上述してきたように、実施形態に係る情報処理装置1は、算出部230と、統合部240とを備える。算出部230は、階層構造を有する複数のカテゴリのうち、所定カテゴリの下位に位置する複数の下位カテゴリに含まれるオブジェクトの特徴量であって、連続値で表される特徴量に基づき、複数の下位カテゴリの組み合わせごとに、統計的検定値を算出する。統合部240は、算出部230の算出結果に基づいて、複数の下位カテゴリを統合する。
[6. effect〕
As described above, the information processing apparatus 1 according to the embodiment includes the calculation unit 230 and the integration unit 240. The calculation unit 230 is a feature amount of an object included in a plurality of lower categories located below a predetermined category among a plurality of categories having a hierarchical structure, and is based on a feature amount represented by a continuous value. A statistical test value is calculated for each combination of subcategories. The integration unit 240 integrates a plurality of lower categories based on the calculation result of the calculation unit 230.

これにより、情報処理装置1は、連続値である特徴量に基づき、カテゴリを統合することができる。このため、カテゴリの統合精度を向上させることができる。このため、カテゴリ数を削減することができ、例えば予測演算等のカテゴリを用いた処理を行う場合に、処理精度を低下させることなく処理速度を向上させることができる。   As a result, the information processing apparatus 1 can integrate categories based on feature values that are continuous values. For this reason, the integration accuracy of categories can be improved. For this reason, the number of categories can be reduced. For example, when processing using a category such as prediction calculation is performed, the processing speed can be improved without reducing the processing accuracy.

また、実施形態に係る統合部240は、下位カテゴリに含まれるオブジェクトの数が所定値以下である下位カテゴリを統合する。これにより、オブジェクト数が所定値以下である下位カテゴリを高精度で統合することができ、オブジェクト数を増加させることができる。このため、例えば予測演算等のカテゴリを用いた処理を行う場合に、処理精度を向上させることができる。   Further, the integration unit 240 according to the embodiment integrates lower categories in which the number of objects included in the lower categories is equal to or less than a predetermined value. As a result, the lower categories whose number of objects is equal to or less than the predetermined value can be integrated with high accuracy, and the number of objects can be increased. For this reason, when processing using categories, such as prediction calculation, is performed, processing accuracy can be improved, for example.

また、実施形態に係る統合部240は、複数のカテゴリの数に応じて下位カテゴリを統合する。これにより、所望のカテゴリ数になるようにカテゴリを統合することができる。このため、複数のカテゴリの総数が、例えば予測演算等のカテゴリを用いた処理を行う場合の処理精度や処理速度に応じたカテゴリ数になるようにカテゴリを統合することができる。   Further, the integration unit 240 according to the embodiment integrates lower categories according to the number of categories. As a result, the categories can be integrated so that the desired number of categories is obtained. For this reason, it is possible to integrate the categories so that the total number of the plurality of categories becomes the number of categories according to the processing accuracy and the processing speed when performing processing using categories such as prediction calculation.

また、実施形態に係る情報処理装置1は、複数のカテゴリの階層情報(カテゴリ情報)を取得する取得部220をさらに備える。また、算出部230は、取得部220が取得した階層情報に基づき、下位カテゴリの組み合わせごとの統計的検定値を算出する。これにより、予め階層化されている複数のカテゴリを高精度に統合することができる。   The information processing apparatus 1 according to the embodiment further includes an acquisition unit 220 that acquires hierarchical information (category information) of a plurality of categories. Further, the calculation unit 230 calculates a statistical test value for each combination of lower categories based on the hierarchy information acquired by the acquisition unit 220. Thereby, a plurality of categories that are hierarchized in advance can be integrated with high accuracy.

また、実施形態に係るオブジェクトは商品であり、カテゴリは商品に関する商品カテゴリである。また、算出部230は、商品の属性情報を特徴量として統計的検定値を算出する。これにより、情報処理装置1は、商品カテゴリの各カテゴリを精度よく統合することができる。   The object according to the embodiment is a product, and the category is a product category related to the product. Further, the calculation unit 230 calculates a statistical test value using the attribute information of the product as a feature amount. Thereby, the information processing apparatus 1 can integrate each category of the product category with high accuracy.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。   As described above, some of the embodiments of the present application have been described in detail with reference to the drawings. However, these are merely examples, and various modifications, including the aspects described in the disclosure section of the invention, based on the knowledge of those skilled in the art, It is possible to implement the present invention in other forms with improvements.

1 情報処理装置
110 カテゴリ情報記憶部
120 属性情報記憶部
200 処理部
220 取得部
230 算出部
240 統合部
241 統合決定部
242 統合処理部
DESCRIPTION OF SYMBOLS 1 Information processing apparatus 110 Category information storage part 120 Attribute information storage part 200 Processing part 220 Acquisition part 230 Calculation part 240 Integration part 241 Integration determination part 242 Integration processing part

Claims (7)

階層構造を有する複数のカテゴリのうち、所定カテゴリの下位に位置する複数の下位カテゴリに含まれるオブジェクトの特徴量であって、連続値で表される前記特徴量に基づき、複数の前記下位カテゴリの組み合わせごとに、統計的検定値を算出する算出部と、
前記算出部の算出結果に基づいて、複数の前記下位カテゴリを統合する統合部と、
を備え
前記統合部は、前記所定カテゴリの2つ下位にカテゴリが存在する場合に、該所定カテゴリの1つ下位の前記下位カテゴリと当該所定カテゴリとを統合しないことを特徴とする情報処理装置。
Among a plurality of categories having a hierarchical structure, feature quantities of objects included in a plurality of lower categories located below a predetermined category, and based on the feature quantities represented by continuous values, For each combination, a calculation unit that calculates a statistical test value,
An integration unit that integrates a plurality of the lower categories based on a calculation result of the calculation unit;
Equipped with a,
The information processing apparatus according to claim 1, wherein the integration unit does not integrate the predetermined category with the lower category that is one level lower than the predetermined category when a category exists in the lower level of the predetermined category .
前記統合部は、
前記下位カテゴリに含まれる前記オブジェクトの数が所定値以下である前記下位カテゴリを統合する、
ことを特徴とする請求項1に記載の情報処理装置。
The integration unit
Integrating the lower categories in which the number of the objects included in the lower category is a predetermined value or less;
The information processing apparatus according to claim 1.
前記統合部は、
複数の前記カテゴリの数に応じて前記下位カテゴリを統合する、
ことを特徴とする請求項1または2に記載の情報処理装置。
The integration unit
Consolidating the subcategories according to the number of the plurality of categories,
The information processing apparatus according to claim 1, wherein the information processing apparatus is an information processing apparatus.
複数の前記カテゴリの階層情報を取得する取得部をさらに備え、
前記算出部は、
前記取得部が取得した前記階層情報に基づき、前記下位カテゴリの組み合わせごとの前記統計的検定値を算出する、
ことを特徴とする請求項1〜3のいずれか1項に記載の情報処理装置。
An acquisition unit for acquiring a plurality of hierarchical information of the category;
The calculation unit includes:
Based on the hierarchy information acquired by the acquisition unit, to calculate the statistical test value for each combination of the lower categories,
The information processing apparatus according to any one of claims 1 to 3.
前記オブジェクトは商品であり、前記カテゴリは前記商品に関する商品カテゴリであって、
前記算出部は、
前記商品の属性情報を前記特徴量として前記統計的検定値を算出する、
ことを特徴とする請求項1〜4のいずれか1項に記載の情報処理装置。
The object is a product, and the category is a product category related to the product,
The calculation unit includes:
Calculating the statistical test value using the product attribute information as the feature amount;
The information processing apparatus according to claim 1, wherein the information processing apparatus is an information processing apparatus.
階層構造を有する複数のカテゴリのうち、所定カテゴリの下位に位置する複数の下位カテゴリに含まれるオブジェクトの特徴量であって、連続値で表される特徴量に基づき、複数の前記下位カテゴリの組み合わせごとに、統計的検定値を算出する算出工程と、
前記算出工程での算出結果に基づいて、複数の前記下位カテゴリを統合する統合工程と、
を含み、
前記統合工程は、前記所定カテゴリの2つ下位にカテゴリが存在する場合に、該所定カテゴリの1つ下位の前記下位カテゴリと当該所定カテゴリとを統合しないことを特徴とする情報処理方法。
Among a plurality of categories having a hierarchical structure, a feature amount of an object included in a plurality of lower categories positioned below a predetermined category, and a combination of the plurality of lower categories based on a feature amount represented by a continuous value A calculation step for calculating a statistical test value for each,
An integration step of integrating a plurality of the lower categories based on a calculation result in the calculation step;
Only including,
In the information processing method , the integrating step does not integrate the predetermined category with the lower category that is one level lower than the predetermined category when a category exists two levels below the predetermined category .
コンピュータに、
階層構造を有する複数のカテゴリのうち、所定カテゴリの下位に位置する複数の下位カテゴリに含まれるオブジェクトの特徴量であって、連続値で表される特徴量に基づき、複数の前記下位カテゴリの組み合わせごとに、統計的検定値を算出する算出手順と、
前記算出手順での算出結果に基づいて、複数の前記下位カテゴリを統合する統合手順と、
を実行させ
前記統合手順は、前記所定カテゴリの2つ下位にカテゴリが存在する場合に、該所定カテゴリの1つ下位の前記下位カテゴリと当該所定カテゴリとを統合しないことを特徴とする情報処理プログラム。
On the computer,
Among a plurality of categories having a hierarchical structure, a feature amount of an object included in a plurality of lower categories positioned below a predetermined category, and a combination of the plurality of lower categories based on a feature amount represented by a continuous value For each, a calculation procedure for calculating a statistical test value,
An integration procedure for integrating a plurality of the lower categories based on a calculation result in the calculation procedure;
Was executed,
In the information processing program , the integration procedure does not integrate the predetermined category with the lower category that is one level lower than the predetermined category when a category exists in the lower level of the predetermined category .
JP2016052702A 2016-03-16 2016-03-16 Information processing apparatus, information processing method, and information processing program Active JP6359045B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016052702A JP6359045B2 (en) 2016-03-16 2016-03-16 Information processing apparatus, information processing method, and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016052702A JP6359045B2 (en) 2016-03-16 2016-03-16 Information processing apparatus, information processing method, and information processing program

Publications (2)

Publication Number Publication Date
JP2017167831A JP2017167831A (en) 2017-09-21
JP6359045B2 true JP6359045B2 (en) 2018-07-18

Family

ID=59909997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016052702A Active JP6359045B2 (en) 2016-03-16 2016-03-16 Information processing apparatus, information processing method, and information processing program

Country Status (1)

Country Link
JP (1) JP6359045B2 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6687705B2 (en) * 2001-01-08 2004-02-03 International Business Machines Corporation Method and system for merging hierarchies
JP4461854B2 (en) * 2004-03-16 2010-05-12 富士ゼロックス株式会社 Document classification apparatus and classification system generation apparatus and method for document classification apparatus
JP2006318249A (en) * 2005-05-13 2006-11-24 Ricoh Co Ltd Customer classification system, customer classification method, and recording medium
JP5160312B2 (en) * 2008-06-05 2013-03-13 株式会社東芝 Document classification device
JP5621773B2 (en) * 2009-07-06 2014-11-12 日本電気株式会社 Classification hierarchy re-creation system, classification hierarchy re-creation method, and classification hierarchy re-creation program
JP5281104B2 (en) * 2011-02-28 2013-09-04 楽天株式会社 Advertisement management apparatus, advertisement selection apparatus, advertisement management method, advertisement management program, and recording medium recording advertisement management program

Also Published As

Publication number Publication date
JP2017167831A (en) 2017-09-21

Similar Documents

Publication Publication Date Title
US9811851B2 (en) Automatic product groupings for merchandising
US7509337B2 (en) System and method for selecting parameters for data mining modeling algorithms in data mining applications
US7512626B2 (en) System and method for selecting a data mining modeling algorithm for data mining applications
US7516152B2 (en) System and method for generating and selecting data mining models for data mining applications
US20170140278A1 (en) Using machine learning to predict big data environment performance
US20140100989A1 (en) Systems and methods for deetermining a fair price range for commodities
WO2018200996A1 (en) Method and system of managing item assortment based on demand transfer
US11727420B2 (en) Time series clustering analysis for forecasting demand
WO2016069815A1 (en) Interrogation of mean field system
US11854022B2 (en) Proactively predicting transaction dates based on sparse transaction data
JP2015524127A (en) Consumer decision tree generation system
JP2007233944A (en) System for predicting commodity sales
US11663509B2 (en) System and method for a personalized machine learning pipeline selection and result interpretation
CN114707771B (en) Big data-based medicine supply chain management method and platform
JP6159056B2 (en) Selection program, selection method and selection device
US20160307146A1 (en) Rule compression in mean field system
US20080177788A1 (en) System and Method for Generating a Product Order From a Product Sample
JP6359045B2 (en) Information processing apparatus, information processing method, and information processing program
CN111932338A (en) Commodity recommendation method, commodity recommendation device, commodity recommendation equipment and storage medium
JP7025854B2 (en) Gross profit calculator, gross profit calculation method and gross profit calculation program
US20230237044A1 (en) Evaluation framework for anomaly detection using aggregated time-series signals
CA2967203A1 (en) Infeasibility management in e-sourcing systems
Hannah et al. Semiconvex regression for metamodeling-based optimization
US20210390586A1 (en) Real-time predictive recommendation system using per-set optimization
KR102023275B1 (en) Product recommendation method using fp growth

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170815

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20170815

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171114

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180419

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180522

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180619

R150 Certificate of patent or registration of utility model

Ref document number: 6359045

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250