JP7492489B2 - Information processing device, information processing method, and information processing program - Google Patents
Information processing device, information processing method, and information processing program Download PDFInfo
- Publication number
- JP7492489B2 JP7492489B2 JP2021097519A JP2021097519A JP7492489B2 JP 7492489 B2 JP7492489 B2 JP 7492489B2 JP 2021097519 A JP2021097519 A JP 2021097519A JP 2021097519 A JP2021097519 A JP 2021097519A JP 7492489 B2 JP7492489 B2 JP 7492489B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- information
- classification
- candidate
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 205
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000013145 classification model Methods 0.000 claims description 81
- 238000000034 method Methods 0.000 claims description 58
- 230000008569 process Effects 0.000 claims description 54
- 238000006243 chemical reaction Methods 0.000 claims description 25
- 230000004044 response Effects 0.000 claims description 6
- 102100026144 Transferrin receptor protein 1 Human genes 0.000 description 18
- 238000010586 diagram Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 15
- 238000011156 evaluation Methods 0.000 description 10
- 241000282472 Canis lupus familiaris Species 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 101001136140 Pinus strobus Putative oxygen-evolving enhancer protein 2 Proteins 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 101001111655 Homo sapiens Retinol dehydrogenase 11 Proteins 0.000 description 2
- 102100023916 Retinol dehydrogenase 11 Human genes 0.000 description 2
- 101100476983 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SDT1 gene Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 101100064323 Arabidopsis thaliana DTX47 gene Proteins 0.000 description 1
- 101150026676 SID1 gene Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.
従来、様々な情報を分類する技術が提供されている。例えば、商品のカテゴリを表す商品カテゴリ表現と正解ラベルとから学習された分類モデルを用いて、各表現から商品カテゴリ表現を分類する技術が提供されている(例えば特許文献1)。 Conventionally, various technologies have been provided for classifying information. For example, a technology has been provided for classifying product category expressions from each expression using a classification model trained from product category expressions that represent product categories and ground truth labels (for example, Patent Document 1).
しかしながら、上記の従来技術では、分類対象について適切にカテゴリを決定することが難しい場合がある。例えば、表現中に商品カテゴリ表現が含まれない場合、分類対象となるその商品のカテゴリを決定することが難しいといった課題がある。また、上記の従来技術では、テキストデータ以外の情報に対応することが難しい。そのため、分類対象について適切にカテゴリを決定することが望まれている。 However, with the above-mentioned conventional technology, it may be difficult to appropriately determine a category for the object to be classified. For example, if a product category expression is not included in the expression, it is difficult to determine the category of the product to be classified. In addition, with the above-mentioned conventional technology, it is difficult to handle information other than text data. Therefore, it is desirable to appropriately determine a category for the object to be classified.
本願は、上記に鑑みてなされたものであって、分類対象について適切にカテゴリを決定する情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。 The present application has been made in consideration of the above, and aims to provide an information processing device, an information processing method, and an information processing program that appropriately determine categories for classification objects.
本願に係る情報処理装置は、入力情報に対応する第1のカテゴリを示す第1の分類結果を出力する第1の部分モデル、及び前記入力情報に対応する第2のカテゴリを示す第2の分類結果を出力する第2の部分モデルを含む分類モデルと、分類対象となる分類対象情報とを取得する取得部と、前記分類対象情報を前記入力情報として前記分類モデルに入力することにより、前記第1の部分モデルが出力した前記第1の分類結果が示す第1の候補カテゴリと、前記第2の部分モデルが出力した前記第2の分類結果が示す第2の候補カテゴリとに基づいて、前記分類対象情報が属するカテゴリである対象カテゴリを決定する決定部と、を備えたことを特徴とする。 The information processing device according to the present application is characterized by comprising a classification model including a first partial model that outputs a first classification result indicating a first category corresponding to input information and a second partial model that outputs a second classification result indicating a second category corresponding to the input information, an acquisition unit that acquires classification target information to be classified, and a determination unit that inputs the classification target information as the input information to the classification model, and determines a target category to which the classification target information belongs based on a first candidate category indicated by the first classification result output by the first partial model and a second candidate category indicated by the second classification result output by the second partial model.
実施形態の一態様によれば、分類対象について適切にカテゴリを決定することができるという効果を奏する。 According to one aspect of the embodiment, it is possible to appropriately determine a category for the classification target.
以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Below, the information processing device, information processing method, and information processing program according to the present application will be described in detail with reference to the drawings. Note that the information processing device, information processing method, and information processing program according to the present application are not limited to these embodiments. In addition, the same parts in the following embodiments will be denoted by the same reference numerals, and duplicated descriptions will be omitted.
(実施形態)
〔1.情報処理〕
以下では、図1及び図2を用いて、実施形態に係る情報処理の一例について説明する。図1及び図2は、実施形態に係る情報処理の一例を示す図である。具体的には、図1は、実施形態に係る情報処理のうち、モデルの学習処理の一例を示す。また、図2は、実施形態に係る情報処理のうち、モデルを用いたカテゴリの決定処理の一例を示す。
(Embodiment)
[1. Information Processing]
An example of information processing according to the embodiment will be described below with reference to Fig. 1 and Fig. 2. Fig. 1 and Fig. 2 are diagrams showing an example of information processing according to the embodiment. Specifically, Fig. 1 shows an example of model learning processing among the information processing according to the embodiment. Also, Fig. 2 shows an example of category determination processing using a model among the information processing according to the embodiment.
以下では、まず、図1を用いて、カテゴリの決定に用いるモデルである分類モデルM1の構造、及び分類モデルM1の学習処理の一例を説明する。また、図2を用いて、分類モデルM1を用いたカテゴリの決定処理の一例を説明する。なお、以下ではカテゴリの決定対象となる情報(「分類対象情報」ともいう)が画像である場合を一例として説明するが、分類対象情報は、画像に限らず文字情報や音声等、その情報が属するカテゴリの決定(分類)を行う対象となる情報であれば、どのような種別の情報であってもよい。 In the following, first, the structure of classification model M1, which is a model used to determine a category, and an example of a learning process of classification model M1 will be described with reference to FIG. 1. Also, an example of a category determination process using classification model M1 will be described with reference to FIG. 2. Note that, in the following, an example will be described in which the information for which a category is to be determined (also referred to as "classification target information") is an image, but the classification target information is not limited to images and may be any type of information, such as text information or audio, as long as it is information that is the subject of determining (classifying) the category to which the information belongs.
〔1-1.学習処理例〕
ここから、図1を用いて分類モデルM1の構造及び学習処理の一例について説明する。分類モデルM1は、第1の部分モデルPM1、第2の部分モデルPM2及び第3の部分モデルPM3等を含む。以下では、分類モデルM1の入力側から説明する。
[1-1. Learning process example]
From here, an example of the structure and learning process of the classification model M1 will be described with reference to Fig. 1. The classification model M1 includes a first partial model PM1, a second partial model PM2, and a third partial model PM3, etc. Below, the classification model M1 will be described starting from the input side.
まず、第3の部分モデルPM3について説明する。第3の部分モデルPM3は、分類モデルM1のうち入力された画像等の分類対象情報について、物体検出や特徴抽出を行う部分モデル(特徴抽出モデル)である。例えば、第3の部分モデルPM3は、モデルのバックボーン等として機能し、図9中のBackboneに対応する。例えば、第3の部分モデルPM3は、画像に関する一般的な特徴を学習しているサブレイヤである。例えば、第3の部分モデルPM3は、入力された入力情報IN1の特徴を抽出し特徴情報として出力する。例えば、第3の部分モデルPM3は、入力された画像から抽出した特徴情報を出力する。 First, the third partial model PM3 will be described. The third partial model PM3 is a partial model (feature extraction model) that performs object detection and feature extraction for classification target information such as input images of the classification model M1. For example, the third partial model PM3 functions as the backbone of the model, and corresponds to the Backbone in FIG. 9. For example, the third partial model PM3 is a sublayer that learns general features related to images. For example, the third partial model PM3 extracts features of the input information IN1 that has been input and outputs them as feature information. For example, the third partial model PM3 outputs feature information extracted from the input image.
第1の部分モデルPM1は、第3の部分モデルPM3の出力が入力され、第1の分類結果OT1を出力する部分モデルである。例えば、第1の部分モデルPM1は、モデルのヘッドとして機能し、図9中の第1Headに対応する。例えば、第1の部分モデルPM1は、分類(以下「第1の分類」ともいう)を行うというタスクに特化した学習が行われるサブレイヤである。例えば、第1の部分モデルPM1(ヘッド)は、タスクに応じた線形変換を行い、第3の部分モデルPM3(バックボーン)が出力した情報(ベクトル)を変換する。 The first partial model PM1 is a partial model that receives the output of the third partial model PM3 and outputs a first classification result OT1. For example, the first partial model PM1 functions as the head of the model and corresponds to the first Head in FIG. 9. For example, the first partial model PM1 is a sublayer in which learning specialized for the task of performing classification (hereinafter also referred to as "first classification" is performed). For example, the first partial model PM1 (head) performs a linear transformation according to the task and converts the information (vector) output by the third partial model PM3 (backbone).
第1の部分モデルPM1は、後述する第1種別のデータセットを用いた学習処理により、第1種別のデータセットに対応するカテゴリ(以下「第1のカテゴリ」ともいう)についての分類結果を出力するよう学習が行われる。すなわち、第1の部分モデルPM1は、第1のカテゴリに対応する第1の分類を行うように学習される。 The first partial model PM1 is trained to output a classification result for a category corresponding to a first type of dataset (hereinafter also referred to as the "first category") through a learning process using a first type of dataset described below. That is, the first partial model PM1 is trained to perform a first classification corresponding to the first category.
第1の部分モデルPM1は、第3の部分モデルPM3により抽出された画像の特徴情報が入力され、その画像についての第1の分類結果OT1を出力する。例えば、第1の部分モデルPM1は、第1種別のデータセットに対応する第1のカテゴリ群の各カテゴリのスコア(値)を、第1の分類結果OT1として出力する。例えば、第1の部分モデルPM1は、ソフトマックス層を有する。この場合、第1の部分モデルPM1は、ソフトマックスの処理を行い、各カテゴリのスコアの総和が1(100%)になるように各カテゴリのスコアを変換し、各カテゴリのスコアを出力する。 The first partial model PM1 receives image feature information extracted by the third partial model PM3 and outputs a first classification result OT1 for the image. For example, the first partial model PM1 outputs the score (value) of each category of the first category group corresponding to the first type of dataset as the first classification result OT1. For example, the first partial model PM1 has a softmax layer. In this case, the first partial model PM1 performs softmax processing, converts the score of each category so that the sum of the scores of each category is 1 (100%), and outputs the score of each category.
第2の部分モデルPM2は、第3の部分モデルPM3の出力が入力され、第2の分類結果OT2を出力する部分モデルである。例えば、第2の部分モデルPM2は、モデルのヘッドとして機能し、図9中の第2Headに対応する。例えば、第2の部分モデルPM2は、分類(以下「第2の分類」ともいう)を行うというタスクに特化した学習が行われるサブレイヤである。例えば、第2の部分モデルPM2(ヘッド)は、タスクに応じた線形変換を行い、第3の部分モデルPM3(バックボーン)が出力した情報(ベクトル)を変換する。 The second partial model PM2 is a partial model that receives the output of the third partial model PM3 and outputs a second classification result OT2. For example, the second partial model PM2 functions as the head of the model and corresponds to the second Head in FIG. 9. For example, the second partial model PM2 is a sublayer in which learning specialized for the task of performing classification (hereinafter also referred to as "second classification" is performed). For example, the second partial model PM2 (head) performs a linear transformation according to the task and converts the information (vector) output by the third partial model PM3 (backbone).
第2の部分モデルPM2は、後述する第2種別のデータセットを用いた学習処理により、第2種別のデータセットに対応するカテゴリ(以下「第2のカテゴリ」ともいう)についての分類結果を出力するよう学習が行われる。すなわち、第2の部分モデルPM2は、第2のカテゴリに対応する第2の分類を行うように学習される。 The second partial model PM2 is trained to output a classification result for a category corresponding to a second type of dataset (hereinafter also referred to as the "second category") through a learning process using a second type of dataset described below. That is, the second partial model PM2 is trained to perform a second classification corresponding to the second category.
第2の部分モデルPM2は、第3の部分モデルPM3により抽出された画像の特徴情報が入力され、その画像についての第2の分類結果OT2を出力する。例えば、第2の部分モデルPM2は、第2種別のデータセットに対応する第2のカテゴリ群の各カテゴリのスコア(値)を、第2の分類結果OT2として出力する。例えば、第2の部分モデルPM2は、ソフトマックス層を有する。この場合、第2の部分モデルPM2は、ソフトマックスの処理を行い、各カテゴリのスコアの総和が1(100%)になるように各カテゴリのスコアを変換し、各カテゴリのスコアを出力する。 The second partial model PM2 receives image feature information extracted by the third partial model PM3 and outputs a second classification result OT2 for the image. For example, the second partial model PM2 outputs the score (value) of each category of the second category group corresponding to the second type of dataset as the second classification result OT2. For example, the second partial model PM2 has a softmax layer. In this case, the second partial model PM2 performs softmax processing, converts the score of each category so that the sum of the scores of each category is 1 (100%), and outputs the score of each category.
なお、上記の構造は一例に過ぎず、分類モデルM1の構造は任意の構造が採用可能である。例えば、分類モデルM1は、第1の部分モデルPM1が入力された情報に対応する第1のカテゴリを示す情報を出力し、第2の部分モデルPM2が入力された情報に対応する第2のカテゴリを示す情報を出力すれば、どのような構造であってもよい。分類モデルM1は、Faster R‐CNN(Region-based Convolutional Neural Network)等の構造を利用して構成されてもよい。例えば、分類モデルM1は、画像を入力とし、その中の物体の座標(x, y, w, h)と物体カテゴリラベルとを出力する関数であってもよい。 Note that the above structure is merely an example, and any structure can be adopted for the classification model M1. For example, the classification model M1 may have any structure as long as the first partial model PM1 outputs information indicating a first category corresponding to the input information, and the second partial model PM2 outputs information indicating a second category corresponding to the input information. The classification model M1 may be configured using a structure such as Faster R-CNN (Region-based Convolutional Neural Network). For example, the classification model M1 may be a function that receives an image as input and outputs the coordinates (x, y, w, h) of an object in the image and an object category label.
次に、分類モデルM1の学習について説明する。図1では、情報処理装置100(図4参照)が分類モデルM1を学習する場合を一例として説明するが、分類モデルM1の学習は情報処理装置100以外の装置が行ってもよい。 Next, the learning of the classification model M1 will be described. In FIG. 1, a case where the information processing device 100 (see FIG. 4) learns the classification model M1 will be described as an example, but the learning of the classification model M1 may be performed by a device other than the information processing device 100.
情報処理装置100は、複数の種別のデータセットを用いて、分類モデルM1を学習する。情報処理装置100は、第1種別のデータセット及び第2種別のデータセットの2種類のデータセットを用いて、分類モデルM1を学習する。 The information processing device 100 uses multiple types of datasets to train the classification model M1. The information processing device 100 trains the classification model M1 using two types of datasets: a first type of dataset and a second type of dataset.
図1の例では、第1種別のデータセットとして、公開データDS1が用いられる場合を示す。公開データについての詳細は後述するが、公開データDS1は、複数の画像と各画像が属する第1のカテゴリとが対応付けられたデータセットである。例えば、公開データDS1は、車、犬等の物体を含む複数の画像の各々と、その各画像に含まれる物体が属するカテゴリ(車種、犬種等)とが対応付けられたデータセットである。また、図1の例では、第2種別のデータセットとして、内製データDS2が用いられる場合を示す。内製データについての詳細は後述するが、内製データDS2は、複数の画像と各画像が属する第2のカテゴリとが対応付けられたデータセットである。なお、図1では、第1種別のデータセットが公開データDS1であり、第2種別のデータセットが内製データDS2である場合を一例として示すが、第1種別のデータセット及び第2種別のデータセットには任意のデータセットが用いられてもよい。 1 shows a case where public data DS1 is used as the first type of dataset. Details of the public data will be described later, but the public data DS1 is a dataset in which a plurality of images are associated with a first category to which each image belongs. For example, the public data DS1 is a dataset in which each of a plurality of images including objects such as a car and a dog is associated with a category (car type, dog breed, etc.) to which the object included in each image belongs. Also, the example of FIG. 1 shows a case where in-house data DS2 is used as the second type of dataset. Details of the in-house data will be described later, but the in-house data DS2 is a dataset in which a plurality of images are associated with a second category to which each image belongs. Note that FIG. 1 shows an example in which the first type of dataset is public data DS1 and the second type of dataset is in-house data DS2, but any dataset may be used for the first type of dataset and the second type of dataset.
情報処理装置100は、第1種別のデータセットである公開データDS1を用いて分類モデルM1を学習する。まず、情報処理装置100は、第1種別のデータセットである公開データDS1を用いた学習では、第1の部分モデルPM1及び第3の部分モデルPM3を対象に学習処理(以下「第1学習処理」ともいう)を行う(ステップS1)。 The information processing device 100 trains the classification model M1 using public data DS1, which is a first type of dataset. First, in training using the public data DS1, which is a first type of dataset, the information processing device 100 performs a training process (hereinafter also referred to as the "first training process") on the first partial model PM1 and the third partial model PM3 (step S1).
例えば、情報処理装置100は、公開データDS1を用いた第1学習処理では、第1の部分モデルPM1から第3の部分モデルPM3への経路を対象にバックプロパゲーションを行うことにより、分類モデルM1を学習する。すなわち、情報処理装置100は、公開データDS1を用いた学習では、第2の部分モデルPM2を学習対象外として、第1の部分モデルPM1及び第3の部分モデルPM3に対応するパラメータ(重み)を更新する。これにより、情報処理装置100は、第1種別のデータセットを用いた学習では、第1種別のデータセットのデータについて第3の部分モデルPM3が特徴を抽出するように学習するとともに、第1の部分モデルPM1が入力されたデータに対応する第1のカテゴリを示す情報を出力するように学習処理を行う。 For example, in the first learning process using the public data DS1, the information processing device 100 learns the classification model M1 by performing backpropagation on the path from the first partial model PM1 to the third partial model PM3. That is, in learning using the public data DS1, the information processing device 100 updates the parameters (weights) corresponding to the first partial model PM1 and the third partial model PM3, excluding the second partial model PM2 from the learning target. As a result, in learning using the first type of dataset, the information processing device 100 performs a learning process such that the third partial model PM3 learns to extract features from the data of the first type of dataset, and the first partial model PM1 outputs information indicating the first category corresponding to the input data.
例えば、情報処理装置100は、公開データDS1中の一の画像を分類モデルM1に入力した場合、第1の部分モデルPM1がその一の画像(画像Z)が対応付けられた第1のカテゴリ(カテゴリCZ)を出力するように学習処理が行われる。情報処理装置100は、画像Zを分類モデルM1に入力した場合、第1の部分モデルPM1が出力する各カテゴリのスコアのうち、画像Zが対応付けられたカテゴリCZのスコアが大きくなるように学習処理が行われる。例えば、情報処理装置100は、画像Zを分類モデルM1に入力した場合、第1の部分モデルPM1が出力するカテゴリCZのスコアが1に近づくように学習処理が行われる。 For example, when the information processing device 100 inputs an image in the public data DS1 into the classification model M1, the learning process is performed so that the first partial model PM1 outputs the first category (category CZ) to which the image (image Z) is associated. When the information processing device 100 inputs image Z into the classification model M1, the learning process is performed so that, among the scores of each category output by the first partial model PM1, the score of the category CZ to which image Z is associated becomes larger. For example, when the information processing device 100 inputs image Z into the classification model M1, the learning process is performed so that the score of the category CZ output by the first partial model PM1 approaches 1.
情報処理装置100は、第2種別のデータセットである内製データDS2を用いて分類モデルM1を学習する。例えば、内製データDS2は、車、犬等の物体を含む複数の画像の各々と、その各画像に含まれる物体が属するカテゴリ(車が属するカテゴリ、犬が属するカテゴリ等)とが対応付けられたデータセットである。ここで、情報処理装置100は、第2種別のデータセットである内製データDS2を用いた学習では、第2の部分モデルPM2及び第3の部分モデルPM3を対象に学習処理(以下「第2学習処理」ともいう)を行う(ステップS2)。 The information processing device 100 trains the classification model M1 using the in-house developed data DS2, which is a second type of dataset. For example, the in-house developed data DS2 is a dataset in which each of a plurality of images including objects such as cars and dogs is associated with a category to which the object included in each image belongs (the category to which cars belong, the category to which dogs belong, etc.). Here, in training using the in-house developed data DS2, which is a second type of dataset, the information processing device 100 performs a learning process (hereinafter also referred to as the "second learning process") on the second partial model PM2 and the third partial model PM3 (step S2).
例えば、情報処理装置100は、内製データDS2を用いた第2学習処理では、第2の部分モデルPM2から第3の部分モデルPM3への経路を対象にバックプロパゲーションを行うことにより、分類モデルM1を学習する。すなわち、情報処理装置100は、内製データDS2を用いた学習では、第1の部分モデルPM1を学習対象外として、第2の部分モデルPM2及び第3の部分モデルPM3に対応するパラメータ(重み)を更新する。これにより、情報処理装置100は、第2種別のデータセットを用いた学習では、第2種別のデータセットのデータについて第3の部分モデルPM3が特徴を抽出するように学習するとともに、第2の部分モデルPM2が入力されたデータに対応する第2のカテゴリを示す情報を出力するように学習処理を行う。 For example, in the second learning process using the in-house data DS2, the information processing device 100 learns the classification model M1 by performing backpropagation on the path from the second partial model PM2 to the third partial model PM3. That is, in learning using the in-house data DS2, the information processing device 100 excludes the first partial model PM1 from the learning target and updates the parameters (weights) corresponding to the second partial model PM2 and the third partial model PM3. As a result, in learning using the second type of dataset, the information processing device 100 performs a learning process in which the third partial model PM3 learns to extract features from the data of the second type of dataset, and the second partial model PM2 outputs information indicating the second category corresponding to the input data.
例えば、情報処理装置100は、内製データDS2中の一の画像を分類モデルM1に入力した場合、第2の部分モデルPM2がその一の画像(画像Y)が対応付けられた第1のカテゴリ(カテゴリCY)を出力するように学習処理が行われる。情報処理装置100は、画像Yを分類モデルM1に入力した場合、第2の部分モデルPM2が出力する各カテゴリのスコアのうち、画像Yが対応付けられたカテゴリCYのスコアが大きくなるように学習処理が行われる。例えば、情報処理装置100は、画像Yを分類モデルM1に入力した場合、第2の部分モデルPM2が出力するカテゴリCYのスコアが1に近づくように学習処理が行われる。例えば、情報処理装置100は、上述した第1学習処理及び第2学習処理の切替えを入力データに応じて行う。例えば、情報処理装置100は、入力データがいずれの種別のデータであるかを示す情報を基に第1学習処理及び第2学習処理の切替えを切り替えてもよい。例えば、第1学習処理及び第2学習処理の切替えは、プログラムのif文等により行われてもよい。 For example, when the information processing device 100 inputs an image in the in-house data DS2 into the classification model M1, the learning process is performed so that the second partial model PM2 outputs the first category (category CY) to which the image (image Y) is associated. When the information processing device 100 inputs image Y into the classification model M1, the learning process is performed so that the score of the category CY to which the image Y is associated becomes larger among the scores of each category output by the second partial model PM2. For example, when the information processing device 100 inputs image Y into the classification model M1, the learning process is performed so that the score of the category CY output by the second partial model PM2 approaches 1. For example, the information processing device 100 switches between the first learning process and the second learning process described above according to the input data. For example, the information processing device 100 may switch between the first learning process and the second learning process based on information indicating which type of data the input data is. For example, the switching between the first learning process and the second learning process may be performed by an if statement or the like in the program.
上記のように、情報処理装置100は、学習に用いるデータセットの種別に応じて、学習処理の対象を切り替えることにより、各データセットに応じたカテゴリ分類を精度よく行う複数の部分モデルを含むモデルを生成することができる。また、情報処理装置100は、共通して用いられる第3の部分モデルPM3については全データセットを加味した学習を行うことができるため、第3の部分モデルPM3がデータの種別に依らず精度良く特徴を抽出することを可能にする。 As described above, the information processing device 100 can generate a model including multiple partial models that perform accurate category classification according to each dataset by switching the target of the learning process depending on the type of dataset used for learning. Furthermore, the information processing device 100 can perform learning that takes into account all datasets for the commonly used third partial model PM3, which enables the third partial model PM3 to extract features with high accuracy regardless of the type of data.
〔1-2.決定処理例〕
次に、図2を用いて、分類モデルM1を用いたカテゴリの決定処理の一例を説明する。図2では、画像Xが分類対象情報TG1であり、情報処理装置100(図4参照)が分類モデルM1を用いて分類対象情報TG1のカテゴリの決定処理を行う場合を一例として説明する。例えば、情報処理装置100は、記憶部120(図4参照)から分類モデルM1を取得し、端末装置10(図3参照)から分類対象情報TG1を取得する。
[1-2. Example of decision process]
Next, an example of a category determination process using the classification model M1 will be described with reference to Fig. 2. In Fig. 2, an example will be described in which an image X is classification target information TG1, and the information processing device 100 (see Fig. 4) performs a category determination process for the classification target information TG1 using the classification model M1. For example, the information processing device 100 acquires the classification model M1 from the storage unit 120 (see Fig. 4), and acquires the classification target information TG1 from the terminal device 10 (see Fig. 3).
まず、情報処理装置100は、分類対象情報TG1を分類モデルM1に入力する(ステップS11)。分類対象情報TG1が入力された分類モデルM1は、第3の部分モデルPM3により分類対象情報TG1を抽出し、分類対象情報TG1により抽出された特徴情報を第1の部分モデルPM1及び第2の部分モデルPM2に入力する。 First, the information processing device 100 inputs the classification target information TG1 to the classification model M1 (step S11). The classification model M1 to which the classification target information TG1 has been input extracts the classification target information TG1 using the third partial model PM3, and inputs the feature information extracted by the classification target information TG1 to the first partial model PM1 and the second partial model PM2.
第3の部分モデルPM3が出力した分類対象情報TG1の特徴情報が入力された第1の部分モデルPM1は、第1のカテゴリ群の各カテゴリのスコアを出力する(ステップS12)。情報処理装置100は、第1の部分モデルPM1の出力を用いて、分類対象情報TG1が属する候補となる第1のカテゴリ(以下「第1の候補カテゴリ」ともいう)を決定する。例えば、情報処理装置100は、第1のカテゴリ群のうち、第1の部分モデルPM1が出力したスコアが最大のカテゴリを第1の候補カテゴリFR1に決定する。 The first partial model PM1, to which the feature information of the classification target information TG1 output by the third partial model PM3 has been input, outputs the score of each category of the first category group (step S12). The information processing device 100 uses the output of the first partial model PM1 to determine a first category (hereinafter also referred to as the "first candidate category") that is a candidate to which the classification target information TG1 belongs. For example, the information processing device 100 determines the category of the first category group that has the largest score output by the first partial model PM1 as the first candidate category FR1.
また、第3の部分モデルPM3が出力した分類対象情報TG1の特徴情報が入力された第2の部分モデルPM2は、第2のカテゴリ群の各カテゴリのスコアを出力する(ステップS13)。情報処理装置100は、第2の部分モデルPM2の出力を用いて、分類対象情報TG1が属する候補となる第2のカテゴリ(以下「第2の候補カテゴリ」ともいう)を決定する。例えば、情報処理装置100は、第2のカテゴリ群のうち、第2の部分モデルPM2が出力したスコアが最大のカテゴリを第2の候補カテゴリSR1に決定する。 The second partial model PM2, to which the feature information of the classification target information TG1 output by the third partial model PM3 has been input, outputs the score of each category of the second category group (step S13). The information processing device 100 uses the output of the second partial model PM2 to determine a second category (hereinafter also referred to as the "second candidate category") that is a candidate to which the classification target information TG1 belongs. For example, the information processing device 100 determines the category of the second category group that has the largest score output by the second partial model PM2 as the second candidate category SR1.
ここで、第1のカテゴリ群と第2のカテゴリ群とは、一方には含まれるカテゴリが他方には含まれない場合がある。例えば、第1のカテゴリ群と第2のカテゴリ群とは、互いに重複するカテゴリが含まれる可能性があるが完全には一致せず、カテゴリ(概念)の階層が異なったりする場合がある。例えば第2のカテゴリ群にはカテゴリ「犬」があり、第1のカテゴリ群には犬種ごとのカテゴリがある等、第1のカテゴリ群と第2のカテゴリ群とは、一方が他方の上位概念であったり、下位概念であったりする場合等がある。そこで、情報処理装置100は、第1の候補カテゴリFR1と第2の候補カテゴリSR1との対応するように変換処理を行う(ステップS14)。図2では、情報処理装置100は、カテゴリマップCM1を用いて、第1の候補カテゴリFR1を、第2のカテゴリに対応する変換後第1のカテゴリTFR1に変換する。 Here, the first category group and the second category group may include categories that are not included in the other. For example, the first category group and the second category group may include overlapping categories, but may not completely match, and the hierarchy of categories (concepts) may be different. For example, the second category group may include a category "dog" and the first category group may include categories for each dog breed. In this case, the first category group and the second category group may be a higher or lower concept than the other. Therefore, the information processing device 100 performs a conversion process so that the first candidate category FR1 and the second candidate category SR1 correspond to each other (step S14). In FIG. 2, the information processing device 100 uses the category map CM1 to convert the first candidate category FR1 into the converted first category TFR1 that corresponds to the second category.
例えば、カテゴリマップCM1は、第1のカテゴリ群の各カテゴリ(第1のカテゴリ)に、そのカテゴリに対応する第2のカテゴリが関連付けられた一覧情報である。例えば、カテゴリマップCM1では、第1のカテゴリ群での犬種ごとのカテゴリが第2のカテゴリ群でのカテゴリ「犬」が関連付けられる。情報処理装置100は、カテゴリマップCM1を用いることで、第1の候補カテゴリFR1を、対応する第2のカテゴリにマッピング(写像)することで、変換後第1のカテゴリTFR1を生成する。 For example, the category map CM1 is list information in which each category (first category) in the first category group is associated with a corresponding second category. For example, in the category map CM1, a category for each dog breed in the first category group is associated with the category "dog" in the second category group. Using the category map CM1, the information processing device 100 maps the first candidate category FR1 to the corresponding second category, thereby generating a converted first category TFR1.
情報処理装置100は、第2の候補カテゴリSR1と変換後第1のカテゴリTFR1とに基づいて、分類対象情報TG1である画像Xが属するカテゴリ(以下「対象カテゴリ」ともいう)を決定する(ステップS15)。図2では、第2の候補カテゴリSR1と変換後第1のカテゴリTFR1とが一致するため、情報処理装置100は、第2の候補カテゴリSR1を、画像Xが属する対象カテゴリTC1に決定する。 Based on the second candidate category SR1 and the first converted category TFR1, the information processing device 100 determines the category to which image X, which is the classification target information TG1, belongs (hereinafter also referred to as the "target category") (step S15). In FIG. 2, the second candidate category SR1 and the first converted category TFR1 match, so the information processing device 100 determines the second candidate category SR1 as the target category TC1 to which image X belongs.
なお、第2の候補カテゴリSR1と変換後第1のカテゴリTFR1とが異なる場合についての詳細は後述する。また、第2の候補カテゴリSR1と第1の候補カテゴリFR1とが一致する場合、情報処理装置100は、ステップS14の変換処理を行うことなく、第2の候補カテゴリSR1を、画像Xが属する対象カテゴリTC1に決定してもよい。 Details of the case where the second candidate category SR1 and the converted first category TFR1 are different will be described later. Also, when the second candidate category SR1 and the first candidate category FR1 match, the information processing device 100 may determine the second candidate category SR1 as the target category TC1 to which image X belongs without performing the conversion process of step S14.
〔1-3.効果等〕
上述したように、情報処理装置100は、分類モデルM1が出力した2つの分類結果を加味して分類対象情報が属するカテゴリを決定することにより、分類対象について適切にカテゴリを決定することができる。例えば、情報処理装置100は、分類モデルM1が第1の部分モデルPM1及び第2の部分モデルPM2のように、分類結果を出力する複数の部分モデル(複数のヘッド)を含むことにより、複数のデータセットの併用を可能にすることができる。また、情報処理装置100は、カテゴリマップを用いることにより、複数のデータセットの違いを吸収することができ、複数のヘッドが出力する複数の分類結果を用いてカテゴリを決定することができる。
[1-3. Effects, etc.]
As described above, the information processing device 100 can appropriately determine the category of the classification target by determining the category to which the classification target information belongs by taking into account the two classification results output by the classification model M1. For example, the information processing device 100 can enable the combined use of multiple data sets by including multiple partial models (multiple heads) that output classification results, such as the first partial model PM1 and the second partial model PM2, in the classification model M1. Furthermore, the information processing device 100 can absorb differences between multiple data sets by using a category map, and can determine a category using multiple classification results output by multiple heads.
〔1-4.その他(データ等)〕
上記の例での第2種別のデータセットである内製データDS2は、オークションサービスやショッピング等の電子商取引サービスの提供に必要となるデータである。例えば、内製データDS2は、電子商取引サービスの提供に必要となる画像と、その画像が電子商取引サービスでのカテゴリ分類(第2の分類)でどのカテゴリ(第2のカテゴリ)に属するかを示す情報を含む。例えば、内製データDS2は、電子商取引サービスの提供に必要となる画像が収集され、収集した画像についてアノテーション等の学習用の正解データの付与作業が行われるため、内製データDS2の生成は高コストとなる。
[1-4. Other (data, etc.)]
In the above example, the in-house data DS2, which is the second type of dataset, is data required for providing e-commerce services such as auction services and shopping. For example, the in-house data DS2 includes images required for providing the e-commerce services and information indicating which category (second category) the image belongs to in the category classification (second classification) for the e-commerce services. For example, the in-house data DS2 is generated by collecting images required for providing the e-commerce services and adding correct answer data for learning such as annotations to the collected images, so that the generation of the in-house data DS2 is costly.
一方で、上記の例での第1種別のデータセットである公開データDS1は、モデルの学習への利用が許可され、インターネット等で広く公開されているデータ(オープンデータ)である。例えば、公開データDS1は、画像と、その画像がカテゴリ分類(第1の分類)でどのカテゴリ(第1のカテゴリ)に属するかを示す情報を含む。例えば、公開データDS1は、研究用の一般画像データ等であり、Open Images Dataset(https://storage.googleapis.com/openimages/web/index.html)等が用いられる。例えば、公開データDS1は、研究用にSNS(Social Networking Service)のタグ等から収集される。公開データDS1は、内製データDS2に比べて低コストで取得可能である。 On the other hand, the public data DS1, which is the first type of dataset in the above example, is data (open data) that is permitted to be used for model learning and is widely available on the Internet, etc. For example, the public data DS1 includes an image and information indicating which category (first category) the image belongs to in the category classification (first classification). For example, the public data DS1 is general image data for research purposes, and the Open Images Dataset (https://storage.googleapis.com/openimages/web/index.html) is used. For example, the public data DS1 is collected for research purposes from tags on SNS (Social Networking Service). The public data DS1 can be acquired at a lower cost than the in-house data DS2.
また、公開データDS1と内製データDS2とは、そのカテゴリ分類の粒度やカバーする範囲に違いがある。情報処理装置100は、内製データDS2と公開データDS1とを併用することにより、内製データDS2で未収集のカテゴリをカバーすることができる。 In addition, the public data DS1 and the in-house developed data DS2 differ in the granularity of their category classifications and the range they cover. By using the in-house developed data DS2 and the public data DS1 together, the information processing device 100 can cover categories that have not yet been collected with the in-house developed data DS2.
なお、上記の例で示した公開データDS1及び内製データDS2は一例に過ぎず、第1種別のデータセット及び第2種別のデータセットには任意のデータセットが採用可能である。 Note that the public data DS1 and in-house data DS2 shown in the above example are merely examples, and any dataset can be used as the first type dataset and the second type dataset.
また、図1及び図2に示した各処理やモデル等は一例に過ぎず、各処理やモデル等は上記に限られない。例えば、分類モデルM1の構成は、上記に示す構成に限られない。例えば、分類モデルM1における分類を行う部分モデルは、第1の部分モデルPM1及び第2の部分モデルPM2の2つに限らず、3つ以上あってもよい。 Furthermore, the processes and models shown in Figures 1 and 2 are merely examples, and the processes and models are not limited to those described above. For example, the configuration of the classification model M1 is not limited to the configuration shown above. For example, the partial models that perform classification in the classification model M1 are not limited to two, the first partial model PM1 and the second partial model PM2, and there may be three or more.
例えば、データセットが3種類ある場合、分類モデルM1には、第1の部分モデルPM1及び第2の部分モデルPM2に加えて、第4の部分モデルが含まれてもよい。この場合、第4の部分モデルは、新たな3つ目の種類のデータセットに対応する分類結果を出力するように学習される。第1の部分モデルPM1及び第2の部分モデルPM2と同様に、第4の部分モデルには、第3の部分モデルPM3の出力が入力される。これにより、情報処理装置100は、第3の部分モデルPM3を、3種類のデータセットを用いて学習することができる。 For example, when there are three types of datasets, the classification model M1 may include a fourth partial model in addition to the first partial model PM1 and the second partial model PM2. In this case, the fourth partial model is trained to output a classification result corresponding to the new third type of dataset. Similar to the first partial model PM1 and the second partial model PM2, the output of the third partial model PM3 is input to the fourth partial model. This allows the information processing device 100 to train the third partial model PM3 using three types of datasets.
図2の例では、第2の候補カテゴリSR1と変換後第1のカテゴリTFR1とが一致する場合を説明したが、情報処理装置100は、第2の候補カテゴリSR1と変換後第1のカテゴリTFR1とが異なる場合は、所定の基準を基に画像Xが属する対象カテゴリTC1を決定する。この点について以下例示を記載する。 In the example of FIG. 2, a case has been described in which the second candidate category SR1 and the first converted category TFR1 match, but when the second candidate category SR1 and the first converted category TFR1 differ, the information processing device 100 determines the target category TC1 to which image X belongs based on a predetermined criterion. An example of this point is described below.
第2の候補カテゴリSR1及び変換後第1のカテゴリTFR1の一方が、カテゴリが決定(特定)でないことを示すカテゴリ(以下「未分類カテゴリ」ともいう)である場合、情報処理装置100は、他方のカテゴリを画像Xが属する対象カテゴリTC1に決定する。例えば、第2の候補カテゴリSR1が未分類カテゴリである場合、情報処理装置100は、変換後第1のカテゴリTFR1を画像Xが属する対象カテゴリTC1に決定する。また、例えば、変換後第1のカテゴリTFR1が未分類カテゴリである場合、情報処理装置100は、第2の候補カテゴリSR1を画像Xが属する対象カテゴリTC1に決定する。 If one of the second candidate category SR1 and the first converted category TFR1 is a category indicating that the category is not determined (specific) (hereinafter also referred to as an "unclassified category"), the information processing device 100 determines the other category as the target category TC1 to which image X belongs. For example, if the second candidate category SR1 is an unclassified category, the information processing device 100 determines the first converted category TFR1 as the target category TC1 to which image X belongs. Also, for example, if the first converted category TFR1 is an unclassified category, the information processing device 100 determines the second candidate category SR1 as the target category TC1 to which image X belongs.
また、第2の候補カテゴリSR1及び変換後第1のカテゴリTFR1のいずれも未分類カテゴリではない場合、情報処理装置100は、種々の方法により対象カテゴリTC1を決定する。この場合、例えば、情報処理装置100は、第2の候補カテゴリSR1を画像Xが属する対象カテゴリTC1に決定してもよい。また、例えば、情報処理装置100は、変換後第1のカテゴリTFR1を画像Xが属する対象カテゴリTC1に決定してもよい。 In addition, if neither the second candidate category SR1 nor the first converted category TFR1 is an unclassified category, the information processing device 100 determines the target category TC1 by various methods. In this case, for example, the information processing device 100 may determine the second candidate category SR1 as the target category TC1 to which image X belongs. In addition, for example, the information processing device 100 may determine the first converted category TFR1 as the target category TC1 to which image X belongs.
また、第2の候補カテゴリSR1と変換後第1のカテゴリTFR1とが異なる場合、情報処理装置100は、第1の部分モデルPM1及び第2の部分モデルPM2の出力を用いて、画像Xが属する対象カテゴリTC1を決定してもよい。例えば、情報処理装置100は、第1の部分モデルPM1が出力したスコアと、第2の部分モデルPM2が出力したスコアとを用いて、画像Xが属する対象カテゴリTC1を決定してもよい。 In addition, when the second candidate category SR1 and the first category TFR1 after conversion are different, the information processing device 100 may determine the target category TC1 to which the image X belongs using the outputs of the first partial model PM1 and the second partial model PM2. For example, the information processing device 100 may determine the target category TC1 to which the image X belongs using the score output by the first partial model PM1 and the score output by the second partial model PM2.
情報処理装置100は、第1の部分モデルPM1が出力したスコアにうち、第1の候補カテゴリFR1(変換後第1のカテゴリTFR1)に対応するスコア(以下「第1のスコア」ともいう)を用いて、画像Xが属する対象カテゴリTC1を決定してもよい。また、情報処理装置100は、第2の部分モデルPM2が出力したスコアのうち、第2の候補カテゴリSR1に対応するスコア(以下「第2のスコア」ともいう)を用いて、画像Xが属する対象カテゴリTC1を決定してもよい。情報処理装置100は、変換後第1のカテゴリTFR1に対応する第1のスコアと第2の候補カテゴリSR1に対応する第2のスコアとの比較に基づいて、画像Xが属する対象カテゴリTC1を決定してもよい。 The information processing device 100 may determine the target category TC1 to which the image X belongs by using a score (hereinafter also referred to as the "first score") corresponding to the first candidate category FR1 (first category after conversion TFR1) among the scores output by the first partial model PM1. The information processing device 100 may also determine the target category TC1 to which the image X belongs by using a score (hereinafter also referred to as the "second score") corresponding to the second candidate category SR1 among the scores output by the second partial model PM2. The information processing device 100 may determine the target category TC1 to which the image X belongs based on a comparison between the first score corresponding to the first category after conversion TFR1 and the second score corresponding to the second candidate category SR1.
情報処理装置100は、第2の候補カテゴリSR1に対応する第2のスコアが変換後第1のカテゴリTFR1に対応する第1のスコア以上である場合、第2の候補カテゴリSR1を画像Xが属する対象カテゴリTC1に決定する。または、情報処理装置100は、変換後第1のカテゴリTFR1に対応する第1のスコアが、第2の候補カテゴリSR1に対応する第2のスコアよりも大きい場合、変換後第1のカテゴリTFR1を画像Xが属する対象カテゴリTC1に決定する。なお、上記は一例に過ぎず、情報処理装置100は、様々な情報を適宜用いて、画像Xが属する対象カテゴリTC1を決定してもよい。 When the second score corresponding to the second candidate category SR1 is equal to or greater than the first score corresponding to the converted first category TFR1, the information processing device 100 determines the second candidate category SR1 as the target category TC1 to which image X belongs. Alternatively, when the first score corresponding to the converted first category TFR1 is greater than the second score corresponding to the second candidate category SR1, the information processing device 100 determines the converted first category TFR1 as the target category TC1 to which image X belongs. Note that the above is merely an example, and the information processing device 100 may determine the target category TC1 to which image X belongs by appropriately using various information.
〔2.情報処理システムの構成〕
次に、図3を用いて情報処理システム1の構成例について説明する。図3は、実施形態に係る情報処理システムの構成例を示す図である。図3に示すように、情報処理システム1は、端末装置10と、情報提供装置50と、情報処理装置100とが含まれる。端末装置10と、情報提供装置50と、情報処理装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続される。なお、図3に示した情報処理システム1には、複数台の端末装置10や、複数台の情報提供装置50や、複数台の情報処理装置100が含まれてもよい。
2. Configuration of Information Processing System
Next, a configuration example of the
端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。なお、以下では、端末装置10をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置10と読み替えることもできる。
The
端末装置10は、ユーザによる操作を受け付ける。また、端末装置10は、ユーザの操作に応じて、情報処理装置100や情報提供装置50に種々の情報を送信する。例えば、端末装置10は、情報処理装置100や情報提供装置50に文字情報等のコンテンツを要求する情報等を送信する。また、端末装置10は、情報処理装置100や情報提供装置50から種々の情報を受信する。例えば、端末装置10は、情報処理装置100から分類結果を受信する。例えば、端末装置10は、情報処理装置100から受信した分類結果を表示する。
The
情報提供装置50は、モデルの学習に利用可能な情報(データ)を情報処理装置100へ提供するサーバ装置である。例えば、情報提供装置50は、モデルの学習への利用が許可されているデータであるオープンデータ(公開データ)を情報処理装置100へ送信する。例えば、情報提供装置50は、インターネット上で公開データを公開し、情報処理装置100等の外部装置からの要求に応じて、要求先の外部装置へ要求された公開データを送信する。例えば、情報提供装置50は、情報処理装置100から公開データを要求する要求情報を受信し、要求情報の受信に応じて、情報処理装置100へ要求情報に対応する公開データを送信する。 The information providing device 50 is a server device that provides the information processing device 100 with information (data) that can be used for model learning. For example, the information providing device 50 transmits open data (public data), which is data that is permitted to be used for model learning, to the information processing device 100. For example, the information providing device 50 publishes the public data on the Internet, and in response to a request from an external device such as the information processing device 100, transmits the requested public data to the external device that is the request destination. For example, the information providing device 50 receives request information requesting public data from the information processing device 100, and in response to receiving the request information, transmits public data corresponding to the request information to the information processing device 100.
例えば、情報提供装置50は、画像とその画像が属するカテゴリとを対応付けた情報を公開データとして、情報処理装置100へ送信する。例えば、情報提供装置50が提供する公開データは上述したOpen Images Dataset等であってもよい。なお、上記は一例に過ぎず、情報提供装置50が提供する公開データは情報処理装置100が第1種別のデータセットとして利用可能であり、第1の部分モデルPM1の学習に利用可能なデータであれば、どのようなデータであってもよい。 For example, the information providing device 50 transmits information associating an image with a category to which the image belongs to as public data to the information processing device 100. For example, the public data provided by the information providing device 50 may be the above-mentioned Open Images Dataset. Note that the above is merely an example, and the public data provided by the information providing device 50 may be any data that can be used by the information processing device 100 as a first type of dataset and can be used for learning the first partial model PM1.
情報処理装置100は、分類対象情報が属するカテゴリを決定するコンピュータである。例えば、情報処理装置100は、画像を分類対象として、その画像が属するカテゴリを、モデルの出力を基に決定する決定装置である。情報処理装置100は、図2に示すように、分類対象情報をモデルに入力し、モデルが出力した分類結果に基づいて、分類対象情報が属するカテゴリを決定する。 The information processing device 100 is a computer that determines the category to which the information to be classified belongs. For example, the information processing device 100 is a determination device that, for example, treats an image as a classification target and determines the category to which the image belongs based on the output of a model. As shown in FIG. 2, the information processing device 100 inputs the information to be classified into a model and determines the category to which the information to be classified belongs based on the classification result output by the model.
例えば、情報処理装置100は、学習処理を行う学習装置である。情報処理装置100は、図1に示すように、複数の種別のデータセットを用いて、モデルを学習する。 For example, the information processing device 100 is a learning device that performs learning processing. As shown in FIG. 1, the information processing device 100 learns a model using multiple types of datasets.
情報処理装置100は、決定したカテゴリを示す情報を端末装置10に情報提供してもよい。情報処理装置100は、分類対象となった画像とその画像の分類結果とを含むコンテンツを、端末装置10に配信してもよい。この場合、情報処理装置100は、コンテンツ配信サービスを提供する外部の情報処理装置等から各種情報を取得し、取得した各種情報に基づいて情報処理や外部の情報処理装置への情報提供を行ってもよい。
The information processing device 100 may provide information indicating the determined category to the
〔3.情報処理装置の構成〕
次に、図4を用いて、実施形態に係る情報処理装置100の構成について説明する。図4は、実施形態に係る情報処理装置100の構成例を示す図である。図4に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
3. Configuration of information processing device
Next, the configuration of the information processing device 100 according to the embodiment will be described with reference to Fig. 4. Fig. 4 is a diagram showing an example of the configuration of the information processing device 100 according to the embodiment. As shown in Fig. 4, the information processing device 100 has a communication unit 110, a storage unit 120, and a control unit 130. Note that the information processing device 100 may have an input unit (e.g., a keyboard, a mouse, etc.) that accepts various operations from an administrator of the information processing device 100, and a display unit (e.g., a liquid crystal display, etc.) that displays various information.
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、端末装置10や情報提供装置50との間で情報の送受信を行う。
(Communication unit 110)
The communication unit 110 is realized by, for example, a network interface card (NIC) etc. The communication unit 110 is connected to a network via a wired or wireless connection, and transmits and receives information between the
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図4に示すように、第1種別情報記憶部121と、第2種別情報記憶部122と、モデル情報記憶部123と、カテゴリマップ記憶部124とを有する。
(Memory unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory element such as a random access memory (RAM) or a flash memory, or a storage device such as a hard disk or an optical disk. As shown in FIG. 4 , the storage unit 120 according to the embodiment has a first type
(第1種別情報記憶部121)
実施形態に係る第1種別情報記憶部121は、第1種別に関する各種情報を記憶する。図5は、実施形態に係る第1種別情報記憶部の一例を示す図である。例えば、第1種別情報記憶部121は、モデルの生成に用いる第1種別に関する教師データを記憶する。図5に示す第1種別情報記憶部121には、「データID」、「データ」、「第1のカテゴリ」といった項目が含まれる。
(First type information storage unit 121)
The first type
「データID」は、各データを識別するための識別情報を示す。また、「データ」は、データIDにより識別されるデータを示す。「データ」は、分類対象となる画像等のデータを示す。図5では「データ」に「FDT1」といった概念的な情報が格納される例を示したが、実際には、分類対象となる画像等のデータ自体、または、その格納場所を示すファイルパス名などが格納される。 "Data ID" indicates identification information for identifying each data. Furthermore, "Data" indicates data identified by the Data ID. "Data" indicates image data, etc. to be classified. Figure 5 shows an example in which conceptual information such as "FDT1" is stored in "Data", but in reality, the image data, etc. to be classified, or a file path name indicating its storage location, etc., is stored.
「第1のカテゴリ」は、対応するデータ(画像)に対応する正解となる分類結果(第1のカテゴリ)を示す。「第1のカテゴリ」は、対応するデータがモデルに入力された場合に、モデルが出力することが期待される分類結果を示す。具体的には、「第1のカテゴリ」は、対応する画像が分類モデルM1に入力された場合に、分類モデルM1の第1の部分モデルPM1が出力することが期待される分類結果(第1のカテゴリ)を示す。 "First category" refers to the classification result (first category) that is the correct answer corresponding to the corresponding data (image). "First category" refers to the classification result that is expected to be output by the model when the corresponding data is input to the model. Specifically, "first category" refers to the classification result (first category) that is expected to be output by the first partial model PM1 of the classification model M1 when the corresponding image is input to the classification model M1.
図5の例では、データID「FID1」により識別されるデータFDT1は、第1のカテゴリが「FC1」であることを示す。図5の例では「FC1」~「FC8」のように抽象的に図示するが、「第1のカテゴリ」には、認識対象に関連する分類結果を示す第1のカテゴリ(値)であるものとする。例えば、「FC1」~「FC8」は、データ(画像)が分類される第1のカテゴリのいずれかとなる。 In the example of Figure 5, data FDT1 identified by data ID "FID1" indicates that the first category is "FC1". In the example of Figure 5, "FC1" to "FC8" are illustrated abstractly, but the "first category" is assumed to be a first category (value) that indicates a classification result related to the recognition target. For example, "FC1" to "FC8" are any of the first categories into which data (images) are classified.
なお、第1種別情報記憶部121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、第1種別情報記憶部121は、画像や音声等の教師データの種別を示す情報を各データに対応付けて記憶する。例えば、第1種別情報記憶部121は、データの種別を示す情報を各データに対応付けて記憶する。図5の例では、データは、種別が「画像」であることを示す情報を各データに対応付けて記憶する。
The first type
例えば、第1種別情報記憶部121は、各データが学習データであるか、評価用データであるか等を特定可能に記憶してもよい。例えば、第1種別情報記憶部121は、学習データと評価用データとを区別可能に記憶する。第1種別情報記憶部121は、各データが学習データや評価用データであるかを識別する情報を記憶してもよい。情報処理装置100は、学習データとして用いられる各データと第1のカテゴリ(正解データ)とに基づいて、モデルを学習する。情報処理装置100は、評価用データとして用いられる各データと第1のカテゴリとに基づいて、モデルの精度を測定する。情報処理装置100は、評価用データを入力した場合にモデルが出力する出力結果(分類結果)と、第1のカテゴリとを比較した結果を収集することにより、モデルの精度を測定する。
For example, the first type
(第2種別情報記憶部122)
実施形態に係る第2種別情報記憶部122は、第2種別に関する各種情報を記憶する。図6は、実施形態に係る第2種別情報記憶部の一例を示す図である。例えば、第2種別情報記憶部122は、モデルの生成に用いる第2種別に関する教師データを記憶する。図6に示す第2種別情報記憶部122には、「データID」、「データ」、「第2のカテゴリ」といった項目が含まれる。
(Second type information storage unit 122)
The second type
「データID」は、各データを識別するための識別情報を示す。また、「データ」は、データIDにより識別されるデータを示す。「データ」は、分類対象となる画像等のデータを示す。図6では「データ」に「SDT1」といった概念的な情報が格納される例を示したが、実際には、分類対象となる画像等のデータ自体、または、その格納場所を示すファイルパス名などが格納される。 "Data ID" indicates identification information for identifying each data. Furthermore, "Data" indicates data identified by the Data ID. "Data" indicates image data, etc. to be classified. Figure 6 shows an example in which conceptual information such as "SDT1" is stored in "Data", but in reality, the image data, etc. to be classified, or a file path name indicating its storage location, etc., is stored.
「第2のカテゴリ」は、対応するデータ(画像)に対応する正解となる分類結果(第2のカテゴリ)を示す。「第2のカテゴリ」は、対応するデータがモデルに入力された場合に、モデルが出力することが期待される分類結果を示す。具体的には、「第2のカテゴリ」は、対応する画像が分類モデルM1に入力された場合に、分類モデルM1の第2の部分モデルPM2が出力することが期待される分類結果(第2のカテゴリ)を示す。 "Second category" refers to the correct classification result (second category) corresponding to the corresponding data (image). "Second category" refers to the classification result that is expected to be output by the model when the corresponding data is input to the model. Specifically, "second category" refers to the classification result (second category) that is expected to be output by the second partial model PM2 of the classification model M1 when the corresponding image is input to the classification model M1.
図6の例では、データID「SID1」により識別されるデータSDT1は、第2のカテゴリが「SC1」であることを示す。図6の例では「SC1」~「SC3」のように抽象的に図示するが、「第2のカテゴリ」には、認識対象に関連する分類結果を示す第2のカテゴリ(値)であるものとする。例えば、「SC1」~「SC3」は、データ(画像)が分類される第2のカテゴリのいずれかとなる。 In the example of Figure 6, data SDT1 identified by data ID "SID1" indicates that the second category is "SC1". In the example of Figure 6, "SC1" to "SC3" are illustrated abstractly, but the "second category" is assumed to be a second category (value) that indicates the classification result related to the recognition target. For example, "SC1" to "SC3" are any of the second categories into which data (images) are classified.
なお、第2種別情報記憶部122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、第2種別情報記憶部122は、画像や音声等の教師データの種別を示す情報を各データに対応付けて記憶する。例えば、第2種別情報記憶部122は、データの種別を示す情報を各データに対応付けて記憶する。図6の例では、データは、種別が「画像」であることを示す情報を各データに対応付けて記憶する。
The second type
例えば、第2種別情報記憶部122は、各データが学習データであるか、評価用データであるか等を特定可能に記憶してもよい。例えば、第2種別情報記憶部122は、学習データと評価用データとを区別可能に記憶する。第2種別情報記憶部122は、各データが学習データや評価用データであるかを識別する情報を記憶してもよい。情報処理装置100は、学習データとして用いられる各データと第2のカテゴリ(正解データ)とに基づいて、モデルを学習する。情報処理装置100は、評価用データとして用いられる各データと第2のカテゴリとに基づいて、モデルの精度を測定する。情報処理装置100は、評価用データを入力した場合にモデルが出力する出力結果(分類結果)と、第2のカテゴリとを比較した結果を収集することにより、モデルの精度を測定する。
For example, the second type
(モデル情報記憶部123)
実施形態に係るモデル情報記憶部123は、モデルに関する情報を記憶する。例えば、モデル情報記憶部123は、学習処理により学習(生成)された学習済みモデル(モデル)の情報(モデルデータ)を記憶する。図7は、実施形態に係るモデル情報記憶部の一例を示す図である。図7に示した例では、モデル情報記憶部123は、「モデルID」、「用途」、「モデルデータ」といった項目が含まれる。
(Model information storage unit 123)
The model
「モデルID」は、モデルを識別するための識別情報を示す。「用途」は、対応するモデルの用途を示す。「モデルデータ」は、モデルのデータを示す。図7等では「モデルデータ」に「MDT1」といった概念的な情報が格納される例を示したが、実際には、モデルの構成(ネットワーク構成)の情報やパラメータに関する情報等、そのモデルを構成する種々の情報が含まれる。例えば、「モデルデータ」には、ネットワークの各層におけるノードと、各ノードが採用する関数と、ノードの接続関係と、ノード間の接続に対して設定される接続係数とを含む情報が含まれる。 "Model ID" indicates identification information for identifying a model. "Use" indicates the use of the corresponding model. "Model data" indicates the data of the model. Figure 7 etc. shows an example in which conceptual information such as "MDT1" is stored in "model data", but in reality, various information that constitutes the model is included, such as information on the model configuration (network configuration) and information on parameters. For example, "model data" includes information including the nodes in each layer of the network, the functions employed by each node, the connection relationships between the nodes, and the connection coefficients set for the connections between the nodes.
図7に示す例では、モデルID「M1」により識別されるモデル(分類モデルM1)は、用途が「画像分類」であることを示す。すなわち、分類モデルM1は、入力された画像データの分類を示す情報を出力するモデルであることを示す。また、分類モデルM1のモデルデータは、モデルデータMDT1であることを示す。 In the example shown in FIG. 7, the model identified by the model ID "M1" (classification model M1) indicates that its use is "image classification." In other words, classification model M1 indicates that it is a model that outputs information indicating the classification of input image data. In addition, it indicates that the model data of classification model M1 is model data MDT1.
なお、モデル情報記憶部123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、モデル情報記憶部123は、モデル内の構成の詳細を示す情報を記憶してもよい。例えば、モデル情報記憶部123は、分類モデルM1が第1の部分モデルPM1、第2の部分モデルPM2、及び第3の部分モデルPM3を含むことを示す情報や各部分モデルの接続関係を示す情報を記憶してもよい。例えば、モデル情報記憶部123は、分類モデルM1において、第3の部分モデルPM3にデータが入力され、第3の部分モデルPM3の出力が第1の部分モデルPM1及び第2の部分モデルPM2に入力されることを示すネットワーク構成の情報を記憶する。なお、分類モデルM1等のモデルは、人工知能ソフトウェアの一部であるプログラムモジュールとしての利用が想定されるものであってもよい。分類モデルM1等のモデルは、プログラムであってもよい。
The model
(カテゴリマップ記憶部124)
実施形態に係るカテゴリマップ記憶部124は、カテゴリマップに関する情報を記憶する。例えば、カテゴリマップ記憶部124は、第1のカテゴリを第2のカテゴリに変換するために用いるカテゴリマップを記憶する。
(Category map storage unit 124)
The category map storage unit 124 according to the embodiment stores information related to the category map. For example, the category map storage unit 124 stores a category map used to convert a first category into a second category.
例えば、カテゴリマップ記憶部124は、第1の部分モデルに対応する第1のカテゴリ群と、第2の部分モデルに対応する第2のカテゴリ群との間の対応関係を示すカテゴリマップを記憶する。例えば、カテゴリマップ記憶部124は、第1のカテゴリの一覧と、一覧中の各第1のカテゴリに対応する第2のカテゴリが関連付けられたカテゴリマップを記憶する。 For example, the category map storage unit 124 stores a category map indicating the correspondence between a first category group corresponding to a first partial model and a second category group corresponding to a second partial model. For example, the category map storage unit 124 stores a list of first categories and a category map in which a second category corresponding to each first category in the list is associated.
なお、カテゴリマップは、第1のカテゴリを第2のカテゴリに変換可能であれば、どのような情報であってもよい。例えば、カテゴリマップは、ルールベースで作成された第1のカテゴリを第2のカテゴリに変換ルール(規則)を示す情報であってもよい。また、カテゴリマップは、第1のカテゴリを入力として、入力された第1のカテゴリに対応する第2のカテゴリを出力する変換モデルであってもよい。 The category map may be any information that can convert a first category into a second category. For example, the category map may be information that indicates a rule-based conversion rule for converting a first category into a second category. The category map may also be a conversion model that receives a first category as input and outputs a second category that corresponds to the input first category.
情報処理装置100は、カテゴリマップを生成してもよい。例えば、情報処理装置100は、第2のカテゴリ付与された画像に対して第1の部分モデルPM1が出力する第1のカテゴリを用いてカテゴリマップを生成してもよい。例えば、情報処理装置100は、内製データカテゴリ付与された画像(ボックスは未付与)に第1ヘッドを適用してもよい。例えば、情報処理装置100は、第1の部分モデルPM1により決定(予測)された画像の第1のカテゴリと、画像に付与された正解ラベル(第2のカテゴリ)の相関に基づいて、カテゴリマップを生成してもよい。例えば、情報処理装置100は、予測された画像の第1のカテゴリと、画像に付与された第2のカテゴリとの相関を調べ、その相関を基にカテゴリマップを生成してもよい。 The information processing device 100 may generate a category map. For example, the information processing device 100 may generate a category map using the first category output by the first partial model PM1 for an image to which a second category has been assigned. For example, the information processing device 100 may apply the first head to an image to which an in-house data category has been assigned (no box has been assigned). For example, the information processing device 100 may generate a category map based on the correlation between the first category of the image determined (predicted) by the first partial model PM1 and the correct label (second category) assigned to the image. For example, the information processing device 100 may examine the correlation between the predicted first category of the image and the second category assigned to the image, and generate a category map based on the correlation.
(制御部130)
図4の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(学習プログラムや生成プログラム等の情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(Control unit 130)
Returning to the explanation of Fig. 4, the control unit 130 is a controller, and is realized, for example, by a CPU (Central Processing Unit) or an MPU (Micro Processing Unit) executing various programs (corresponding to examples of information processing programs such as a learning program and a generation program) stored in a storage device inside the information processing device 100 using a RAM as a working area. The control unit 130 is also a controller, and is realized, for example, by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).
図4に示すように、制御部130は、取得部131と、学習部132と、決定部133と、提供部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図4に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。 As shown in FIG. 4, the control unit 130 has an acquisition unit 131, a learning unit 132, a determination unit 133, and a provision unit 134, and realizes or executes the functions and actions of the information processing described below. Note that the internal configuration of the control unit 130 is not limited to the configuration shown in FIG. 4, and may be other configurations that perform the information processing described below.
(取得部131)
取得部131は、各種情報を取得する。取得部131は、端末装置10や情報提供装置50等の外部の情報処理装置から各種情報を取得する。取得部131は、第1種別情報記憶部121や第2種別情報記憶部122やモデル情報記憶部123やカテゴリマップ記憶部124等に示す各種情報を、外部の情報処理装置から受信してもよい。
(Acquisition unit 131)
The acquisition unit 131 acquires various information. The acquisition unit 131 acquires various information from an external information processing device such as the
取得部131は、記憶部120から各種情報を取得する。取得部131は、第1種別情報記憶部121や第2種別情報記憶部122やモデル情報記憶部123やカテゴリマップ記憶部124等から各種情報を取得する。
The acquisition unit 131 acquires various information from the storage unit 120. The acquisition unit 131 acquires various information from the first type
取得部131は、第1種別の文字情報である第1文字情報と、第1種別とは異なる第2種別の文字情報である第2文字情報とを取得する。取得部131は、変換モデルが出力する文字情報の種別を選択する選択情報を取得する。取得部131は、変換モデルに入力する学習文字情報に対応する種別である学習種別を選択する選択情報を取得する。 The acquisition unit 131 acquires first character information, which is a first type of character information, and second character information, which is a second type of character information different from the first type. The acquisition unit 131 acquires selection information for selecting the type of character information to be output by the conversion model. The acquisition unit 131 acquires selection information for selecting a learning type, which is a type corresponding to the learning character information to be input to the conversion model.
取得部131は、入力情報に対応する第1のカテゴリを示す第1の分類結果を出力する第1の部分モデル、及び入力情報に対応する第2のカテゴリを示す第2の分類結果を出力する第2の部分モデルを含む分類モデルを取得する。取得部131は、分類対象となる分類対象情報を取得する。取得部131は、入力情報の入力に応じて、入力情報の特徴情報を出力する第3の部分モデル、第3の部分モデルの出力を用いて第1の分類結果を出力する第1の部分モデル、第3の部分モデルの出力を用いて第2の分類結果を出力する第2の部分モデルを含む分類モデルを取得する。取得部131は、分類対象となる画像である分類対象情報を取得する。 The acquisition unit 131 acquires a classification model including a first partial model that outputs a first classification result indicating a first category corresponding to the input information, and a second partial model that outputs a second classification result indicating a second category corresponding to the input information. The acquisition unit 131 acquires classification target information to be classified. The acquisition unit 131 acquires a classification model including a third partial model that outputs feature information of the input information in response to input of the input information, a first partial model that outputs a first classification result using the output of the third partial model, and a second partial model that outputs a second classification result using the output of the third partial model. The acquisition unit 131 acquires classification target information, which is an image to be classified.
(学習部132)
学習部132は、各種情報を学習する。学習部132は、学習処理により各種モデルを生成する。例えば、学習部132は、第1種別情報記憶部121や第2種別情報記憶部122等に記憶された情報に基づいて、学習処理を行う。学習部132は、第1種別情報記憶部121や第2種別情報記憶部122等に記憶された情報に基づいて種々のモデルを生成する。
(Learning Unit 132)
The learning unit 132 learns various information. The learning unit 132 generates various models through a learning process. For example, the learning unit 132 performs the learning process based on information stored in the first type
例えば、学習部132は、第1種別情報記憶部121や第2種別情報記憶部122に記憶された学習データを用いて、分類モデルM1を学習する。
For example, the learning unit 132 learns the classification model M1 using the learning data stored in the first type
学習部132は、複数の種別のデータセットを用いて、分類モデルM1を学習する。学習部132は、第1種別のデータセット及び第2種別のデータセットの2種類のデータセットを用いて、分類モデルM1を学習する。 The learning unit 132 uses multiple types of datasets to learn the classification model M1. The learning unit 132 uses two types of datasets, a first type of dataset and a second type of dataset, to learn the classification model M1.
学習部132は、第1種別のデータセットである公開データDS1を用いて分類モデルM1を学習する。学習部132は、公開データDS1を用いた学習では、第1の部分モデルPM1から第3の部分モデルPM3への経路を対象にバックプロパゲーションを行うことにより、分類モデルM1を学習する。 The learning unit 132 learns the classification model M1 using public data DS1, which is a first type of dataset. In learning using the public data DS1, the learning unit 132 learns the classification model M1 by performing backpropagation on the path from the first partial model PM1 to the third partial model PM3.
学習部132は、第2種別のデータセットである内製データDS2を用いて分類モデルM1を学習する。学習部132は、内製データDS2を用いた学習では、第2の部分モデルPM2から第3の部分モデルPM3への経路を対象にバックプロパゲーションを行うことにより、分類モデルM1を学習する。 The learning unit 132 learns the classification model M1 using the in-house data DS2, which is a second type of dataset. In learning using the in-house data DS2, the learning unit 132 learns the classification model M1 by performing backpropagation on the path from the second partial model PM2 to the third partial model PM3.
(決定部133)
決定部133は、各種情報を決定する。決定部133は、決定処理により分類対象情報が属するカテゴリを決定する。例えば、決定部133は、モデル情報記憶部123等に記憶された情報に基づいて、決定処理を行う。決定部133は、モデル情報記憶部123に記憶されたモデルを用いて、分類対象情報が属するカテゴリを決定する。分類モデルM1に分類対象情報を入力し、分類モデルM1の出力を用いて、分類対象情報が属するカテゴリを決定する。
(Determination unit 133)
The determination unit 133 determines various information. The determination unit 133 determines the category to which the classification target information belongs by a determination process. For example, the determination unit 133 performs the determination process based on information stored in the model
決定部133は、分類対象情報を入力情報として分類モデルに入力することにより、第1の部分モデルが出力した第1の分類結果が示す第1の候補カテゴリと、第2の部分モデルが出力した第2の分類結果が示す第2の候補カテゴリとに基づいて、分類対象情報が属するカテゴリである対象カテゴリを決定する。決定部133は、第3の部分モデルが出力した分類対象情報の特徴情報を用いて、第1の部分モデルが出力した第1の分類結果が示す第1の候補カテゴリと、第2の部分モデルが出力した第2の分類結果が示す第2の候補カテゴリとに基づいて、分類対象情報が属する対象カテゴリを決定する。 The determination unit 133 inputs the classification target information as input information into the classification model, and determines a target category to which the classification target information belongs based on the first candidate category indicated by the first classification result output by the first partial model and the second candidate category indicated by the second classification result output by the second partial model. The determination unit 133 uses feature information of the classification target information output by the third partial model to determine a target category to which the classification target information belongs based on the first candidate category indicated by the first classification result output by the first partial model and the second candidate category indicated by the second classification result output by the second partial model.
決定部133は、第1の部分モデルが出力した第1の分類結果が示す第1の候補カテゴリを、第2の部分モデルに対応する形式に変換した変換後第1のカテゴリと、第2の候補カテゴリとに基づいて、分類対象情報が属する対象カテゴリを決定する。決定部133は、第1の部分モデルに対応する第1のカテゴリ群と、第2の部分モデルに対応する第2のカテゴリ群との間の対応関係を示すカテゴリマップを用いて、第1の候補カテゴリが変換された変換後第1のカテゴリと、第2の候補カテゴリとに基づいて、分類対象情報が属する対象カテゴリを決定する。決定部133は、第1のカテゴリを第2のカテゴリに変換するために用いるカテゴリマップを用いて、第1の候補カテゴリが変換された変換後第1のカテゴリと、第2の候補カテゴリとに基づいて、分類対象情報が属する対象カテゴリを決定する。 The determination unit 133 determines the target category to which the classification target information belongs based on the converted first category obtained by converting the first candidate category indicated by the first classification result output by the first partial model into a format corresponding to the second partial model, and the second candidate category. The determination unit 133 determines the target category to which the classification target information belongs based on the converted first category into which the first candidate category is converted, and the second candidate category, using a category map indicating the correspondence between the first category group corresponding to the first partial model and the second category group corresponding to the second partial model. The determination unit 133 determines the target category to which the classification target information belongs based on the converted first category into which the first candidate category is converted, and the second candidate category, using the category map used for converting the first category into the second category.
決定部133は、変換後第1のカテゴリと、第2の候補カテゴリとが異なる場合、所定の基準に基づいて、分類対象情報が属する対象カテゴリを決定する。決定部133は、変換後第1のカテゴリと、第2の候補カテゴリとが異なる場合、変換後第1のカテゴリに対応する第1のスコアと、第2の候補カテゴリに対応する第2のスコアとの比較に基づいて、分類対象情報が属する対象カテゴリを決定する。 When the converted first category and the second candidate category are different, the determination unit 133 determines the target category to which the classification target information belongs based on a predetermined criterion. When the converted first category and the second candidate category are different, the determination unit 133 determines the target category to which the classification target information belongs based on a comparison between the first score corresponding to the converted first category and the second score corresponding to the second candidate category.
決定部133は、第2のスコアが第1のスコア以上である場合、第2のカテゴリを分類対象情報が属する対象カテゴリに決定する。決定部133は、第1のスコアが第2のスコアよりも大きい場合、変換後第1のカテゴリを分類対象情報が属する対象カテゴリに決定する。 If the second score is equal to or greater than the first score, the determination unit 133 determines the second category as the target category to which the classification target information belongs. If the first score is greater than the second score, the determination unit 133 determines the converted first category as the target category to which the classification target information belongs.
決定部133は、変換後第1のカテゴリと、第2の候補カテゴリとが異なる場合、第2の候補カテゴリを分類対象情報が属する対象カテゴリに決定する。決定部133は、変換後第1のカテゴリと、第2の候補カテゴリとが異なる場合、変換後第1のカテゴリを分類対象情報が属する対象カテゴリに決定する。 When the first category after conversion is different from the second candidate category, the determination unit 133 determines the second candidate category as the target category to which the classification target information belongs. When the first category after conversion is different from the second candidate category, the determination unit 133 determines the first category after conversion as the target category to which the classification target information belongs.
決定部133は、変換後第1のカテゴリと、第2の候補カテゴリとが一致する場合、第2の候補カテゴリを分類対象情報が属する対象カテゴリに決定する。決定部133は、第1の候補カテゴリと、第2の候補カテゴリとが一致する場合、第2の候補カテゴリを分類対象情報が属する対象カテゴリに決定する。 When the first category after conversion matches the second candidate category, the determination unit 133 determines the second candidate category as the target category to which the classification target information belongs.When the first candidate category matches the second candidate category, the determination unit 133 determines the second candidate category as the target category to which the classification target information belongs.
(提供部134)
提供部134は、各種情報を提供する。例えば、提供部134は、端末装置10や情報提供装置50に各種情報を提供する。提供部134は、端末装置10や情報提供装置50に各種情報を送信する。提供部134は、取得部131により取得された各種情報に基づいて、種々の情報を提供する。提供部134は、学習部132により学習された各種情報に基づいて、種々の情報を提供する。提供部134は、学習部132により学習されたモデルに基づいて、種々の情報を提供する。提供部134は、決定部133により決定された各種情報に基づいて、種々の情報を提供する。
(Providing Unit 134)
The providing unit 134 provides various information. For example, the providing unit 134 provides various information to the
例えば、提供部134は、分類対象情報の提供先に、分類対象情報の分類結果を示す情報を提供する。提供部134は、分類対象情報が端末装置10から提供された場合、分類対象情報の分類結果を示す情報を端末装置10に送信する。
For example, the providing unit 134 provides information indicating the classification result of the classification target information to the recipient of the classification target information. When the classification target information is provided from the
〔4.情報処理のフロー〕
次に、図8を用いて、情報処理装置100による情報処理のフローについて説明する。図8は、実施形態に係る情報処理の一例を示すフローチャートである。
[4. Information processing flow]
Next, a flow of information processing by the information processing device 100 will be described with reference to Fig. 8. Fig. 8 is a flowchart showing an example of information processing according to the embodiment.
図8に示すように、情報処理装置100は、第1の分類結果を出力する第1の部分モデル、及び第2の分類結果を出力する第2の部分モデルを含む分類モデルを取得する(ステップS101)。例えば、情報処理装置100は、モデル情報記憶部123から分類モデルM1を取得する。
As shown in FIG. 8, the information processing device 100 acquires a classification model including a first partial model that outputs a first classification result and a second partial model that outputs a second classification result (step S101). For example, the information processing device 100 acquires a classification model M1 from the model
情報処理装置100は、分類対象となる分類対象情報を取得する(ステップS102)。例えば、情報処理装置100は、端末装置10から分類対象となる分類対象情報TG1を受信する。
The information processing device 100 acquires classification target information to be classified (step S102). For example, the information processing device 100 receives classification target information TG1 to be classified from the
そして、情報処理装置100は、分類対象情報を入力情報として分類モデルに入力する(ステップS103)。例えば、情報処理装置100は、分類モデルM1に分類対象情報TG1を入力する。 Then, the information processing device 100 inputs the classification target information as input information to the classification model (step S103). For example, the information processing device 100 inputs the classification target information TG1 to the classification model M1.
その後、情報処理装置100は、第1の部分モデルが出力した第1の分類結果が示す第1の候補カテゴリと、第2の部分モデルが出力した第2の分類結果が示す第2の候補カテゴリとに基づいて、分類対象情報が属する対象カテゴリを決定する(ステップS102)。例えば、情報処理装置100は、やカテゴリマップCM1を用いて第1の候補カテゴリを変換した変換後第1の候補カテゴリと、第2の候補カテゴリとに基づいて、分類対象情報TG1が属する対象カテゴリを決定する。 Then, the information processing device 100 determines a target category to which the classification target information belongs based on the first candidate category indicated by the first classification result output by the first partial model and the second candidate category indicated by the second classification result output by the second partial model (step S102). For example, the information processing device 100 determines a target category to which the classification target information TG1 belongs based on the converted first candidate category obtained by converting the first candidate category using the category map CM1 and the second candidate category.
〔5.情報処理システムの適用例〕
ここで、図9を用いて、上述した情報処理システム1の適用例について説明する。図9は、情報処理システムの適用の一例を示す図である。以下、図9の各要素について説明する。
[5. Application examples of information processing systems]
An application example of the above-mentioned
図9において「Training(Multi-task learning)」と表記された第1処理群PS11は、学習処理に関連する構成及びデータを示し、OpenImagesデータと内製データを用いて、分類モデルM1が学習されることを示す。図9において「Detector」と表記された箇所はモデルを示し、第1処理群PS11で学習される分類モデルM1に対応する。 The first processing group PS11, labeled "Training (Multi-task learning)" in FIG. 9, indicates the configuration and data related to the learning process, and indicates that the classification model M1 is trained using OpenImages data and in-house data. The part labeled "Detector" in FIG. 9 indicates the model, and corresponds to the classification model M1 trained by the first processing group PS11.
図9において「Inference」と表記された第2処理群PS12は、カテゴリの決定処理(推論処理)に関連する構成及びデータを示し、第1処理群PS11で学習された分類モデルM1、カテゴリマップなどを用いて推論処理が行われることを示す。 The second processing group PS12, labeled "Inference" in Figure 9, shows the configuration and data related to the category determination process (inference process), and indicates that the inference process is performed using the classification model M1, category map, etc. learned by the first processing group PS11.
図9中のOpenImagesデータは、第1種別のデータセットとして用いられるデータを示す。図9中のOpenImagesデータは、図1中の公開データDS1に対応する。 The OpenImages data in FIG. 9 shows data used as a first type of dataset. The OpenImages data in FIG. 9 corresponds to the public data DS1 in FIG. 1.
図9中の内製データは、第2種別のデータセットとして用いられるデータを示す。図9中の内製データは、図1中の内製データDS2に対応する。 The in-house data in FIG. 9 shows data used as a second type of dataset. The in-house data in FIG. 9 corresponds to the in-house data DS2 in FIG. 1.
図9中の第1Headは、第1の部分モデルPM1に対応する。例えば、図9中の第1Headは、画像について第1カテゴリの分類(第1の分類)を行うというタスクに特化した学習が行われるサブレイヤである。図9中の第1Headは、OpenImagesデータで学習される。 The first head in FIG. 9 corresponds to the first partial model PM1. For example, the first head in FIG. 9 is a sublayer in which learning specialized for the task of classifying images into a first category (first classification) is performed. The first head in FIG. 9 is trained with OpenImages data.
図9中の第2Headは、第2の部分モデルPM2に対応する。例えば、図9中の第2Headは、画像について第2カテゴリの分類(第2の分類)を行うというタスクに特化した学習が行われるサブレイヤである。図9中の第2Headは、内製データで学習される。 The second head in FIG. 9 corresponds to the second partial model PM2. For example, the second head in FIG. 9 is a sublayer in which learning specialized for the task of classifying images into a second category (second classification) is performed. The second head in FIG. 9 is trained with in-house data.
図9中のBackboneは、第3の部分モデルPM3に対応する。例えば、図9中のBackboneは、画像に関する一般的な特徴を学習しているサブレイヤである。図9中のBackboneは、OpenImagesデータと内製データの両方で学習される。 Backbone in Figure 9 corresponds to the third partial model PM3. For example, Backbone in Figure 9 is a sublayer that learns general features about images. Backbone in Figure 9 is trained on both OpenImages data and in-house data.
図9中のカテゴリマップは、図2中のカテゴリマップCM1に対応する。例えば、図9中のカテゴリマップは、第1Headの出力結果を基に決定された第1のカテゴリを第2のカテゴリへマッピングするために用いられる情報である。 The category map in FIG. 9 corresponds to the category map CM1 in FIG. 2. For example, the category map in FIG. 9 is information used to map a first category determined based on the output result of the first head to a second category.
図9中の対応カテゴリは、図2中の対象カテゴリTC1に対応する。例えば、図9中の対応カテゴリは、第1Headの出力結果及び第2Headの出力結果の両方の結果を加味して決定されたカテゴリを示す情報である。 The corresponding category in FIG. 9 corresponds to the target category TC1 in FIG. 2. For example, the corresponding category in FIG. 9 is information indicating a category determined by taking into account both the output results of the first head and the output results of the second head.
〔6.効果〕
上述してきたように、実施形態に係る情報処理装置100は、取得部131と、決定部133とを有する。取得部131は、入力情報に対応する第1のカテゴリを示す第1の分類結果を出力する第1の部分モデル、及び入力情報に対応する第2のカテゴリを示す第2の分類結果を出力する第2の部分モデルを含む分類モデルと、分類対象となる分類対象情報とを取得する。また、決定部133は、分類対象情報を入力情報として分類モデルに入力することにより、第1の部分モデルが出力した第1の分類結果が示す第1の候補カテゴリと、第2の部分モデルが出力した第2の分類結果が示す第2の候補カテゴリとに基づいて、分類対象情報が属するカテゴリである対象カテゴリを決定する。
6. Effects
As described above, the information processing device 100 according to the embodiment includes the acquisition unit 131 and the determination unit 133. The acquisition unit 131 acquires a classification model including a first partial model that outputs a first classification result indicating a first category corresponding to the input information and a second partial model that outputs a second classification result indicating a second category corresponding to the input information, and classification target information to be classified. The determination unit 133 inputs the classification target information as input information to the classification model, and determines a target category to which the classification target information belongs, based on a first candidate category indicated by the first classification result output by the first partial model and a second candidate category indicated by the second classification result output by the second partial model.
このように、実施形態に係る情報処理装置100は、第1の分類結果を出力する第1の部分モデル及び第2の分類結果を出力する第2の部分モデルを含む分類モデルを用いて、分類対象情報が属するカテゴリを決定することで、複数の分類結果を基にカテゴリを決定することができるため、分類対象について適切にカテゴリを決定することができる。 In this way, the information processing device 100 according to the embodiment can determine the category to which the classification target information belongs based on multiple classification results by using a classification model including a first partial model that outputs a first classification result and a second partial model that outputs a second classification result, and therefore can appropriately determine the category for the classification target.
また、実施形態に係る情報処理装置100において、取得部131は、入力情報の入力に応じて、入力情報の特徴情報を出力する第3の部分モデル、第3の部分モデルの出力を用いて第1の分類結果を出力する第1の部分モデル、第3の部分モデルの出力を用いて第2の分類結果を出力する第2の部分モデルを含む分類モデルを取得する。 In addition, in the information processing device 100 according to the embodiment, the acquisition unit 131 acquires a classification model including a third partial model that outputs feature information of the input information in response to the input of the input information, a first partial model that outputs a first classification result using the output of the third partial model, and a second partial model that outputs a second classification result using the output of the third partial model.
このように、実施形態に係る情報処理装置100は、入力情報の特徴情報を出力する第3の部分モデルを含む分類モデルを用いることで、適切に抽出された情報を基に分類対象情報が属するカテゴリを決定することができるため、分類対象について適切にカテゴリを決定することができる。 In this way, the information processing device 100 according to the embodiment can determine the category to which the information to be classified belongs based on appropriately extracted information by using a classification model including a third partial model that outputs feature information of the input information, and can therefore appropriately determine the category for the classification target.
また、実施形態に係る情報処理装置100において、決定部133は、第3の部分モデルが出力した分類対象情報の特徴情報を用いて、第1の部分モデルが出力した第1の分類結果が示す第1の候補カテゴリと、第2の部分モデルが出力した第2の分類結果が示す第2の候補カテゴリとに基づいて、分類対象情報が属する対象カテゴリを決定する。 In addition, in the information processing device 100 according to the embodiment, the determination unit 133 uses the feature information of the classification target information output by the third partial model to determine the target category to which the classification target information belongs, based on the first candidate category indicated by the first classification result output by the first partial model and the second candidate category indicated by the second classification result output by the second partial model.
このように、実施形態に係る情報処理装置100は、第3の部分モデルが出力した分類対象情報の特徴情報を第1の部分モデル及び第2の部分モデルの両方が用いることで、特徴情報を共通して用いることができるため、分類対象について適切にカテゴリを決定することができる。 In this way, the information processing device 100 according to the embodiment can appropriately determine a category for the classification target because both the first partial model and the second partial model use the feature information of the classification target information output by the third partial model, and the feature information can be used in common.
また、実施形態に係る情報処理装置100において、取得部131は、分類対象となる画像である分類対象情報を取得する。 In addition, in the information processing device 100 according to the embodiment, the acquisition unit 131 acquires classification target information, which is the image to be classified.
このように、実施形態に係る情報処理装置100は、画像について適切にカテゴリを決定することができる。 In this way, the information processing device 100 according to the embodiment can appropriately determine a category for an image.
また、実施形態に係る情報処理装置100において、決定部133は、第1の部分モデルが出力した第1の分類結果が示す第1の候補カテゴリを、第2の部分モデルに対応する形式に変換した変換後第1のカテゴリと、第2の候補カテゴリとに基づいて、分類対象情報が属する対象カテゴリを決定する。 In addition, in the information processing device 100 according to the embodiment, the determination unit 133 determines the target category to which the classification target information belongs based on the converted first category obtained by converting the first candidate category indicated by the first classification result output by the first partial model into a format corresponding to the second partial model, and the second candidate category.
このように、実施形態に係る情報処理装置100は、第1の分類結果が示す第1の候補カテゴリを、第2の部分モデルに対応する形式に変換した変換後第1のカテゴリを用いることで、共通のカテゴリ分類を基づく分類結果となるため、分類対象について適切にカテゴリを決定することができる。 In this way, the information processing device 100 according to the embodiment uses the converted first category obtained by converting the first candidate category indicated by the first classification result into a format corresponding to the second partial model, thereby resulting in a classification result based on a common category classification, and thus making it possible to appropriately determine a category for the classification target.
また、実施形態に係る情報処理装置100において、決定部133は、第1の部分モデルに対応する第1のカテゴリ群と、第2の部分モデルに対応する第2のカテゴリ群との間の対応関係を示すカテゴリマップを用いて、第1の候補カテゴリが変換された変換後第1のカテゴリと、第2の候補カテゴリとに基づいて、分類対象情報が属する対象カテゴリを決定する。 In addition, in the information processing device 100 according to the embodiment, the determination unit 133 determines the target category to which the classification target information belongs based on the converted first category into which the first candidate category is converted and the second candidate category, using a category map indicating the correspondence between a first category group corresponding to the first partial model and a second category group corresponding to the second partial model.
このように、実施形態に係る情報処理装置100は、第1のカテゴリ群と第2のカテゴリ群との間の対応関係を示すカテゴリマップを用いることで、第1のカテゴリを第2のカテゴリに適切に写像することができるため、分類対象について適切にカテゴリを決定することができる。 In this way, the information processing device 100 according to the embodiment can appropriately map the first category to the second category by using a category map that indicates the correspondence between the first category group and the second category group, and can therefore appropriately determine the category for the classification target.
また、実施形態に係る情報処理装置100において、決定部133は、第1のカテゴリを第2のカテゴリに変換するために用いるカテゴリマップを用いて、第1の候補カテゴリが変換された変換後第1のカテゴリと、第2の候補カテゴリとに基づいて、分類対象情報が属する対象カテゴリを決定する。 In addition, in the information processing device 100 according to the embodiment, the determination unit 133 uses a category map used to convert the first category into the second category to determine the target category to which the classification target information belongs based on the converted first category into which the first candidate category is converted and the second candidate category.
このように、実施形態に係る情報処理装置100は、カテゴリマップを用いることで、第1の候補カテゴリを第2のカテゴリに対応する変換後第1のカテゴリに変換することができるため、分類対象について適切にカテゴリを決定することができる。 In this way, the information processing device 100 according to the embodiment can use the category map to convert the first candidate category into the first category after conversion that corresponds to the second category, and therefore can appropriately determine the category for the classification target.
また、実施形態に係る情報処理装置100において、決定部133は、変換後第1のカテゴリと、第2の候補カテゴリとが異なる場合、所定の基準に基づいて、分類対象情報が属する対象カテゴリを決定する。 In addition, in the information processing device 100 according to the embodiment, when the first category after conversion is different from the second candidate category, the determination unit 133 determines the target category to which the classification target information belongs based on a predetermined criterion.
このように、実施形態に係る情報処理装置100は、変換後第1のカテゴリと、第2の候補カテゴリとが異なる場合は、両方を考慮して分類対象情報が属する対象カテゴリを決定することで、分類対象について適切にカテゴリを決定することができる。 In this way, when the converted first category and the second candidate category are different, the information processing device 100 according to the embodiment takes both into consideration when determining the target category to which the classification target information belongs, thereby making it possible to appropriately determine the category for the classification target.
また、実施形態に係る情報処理装置100において、決定部133は、変換後第1のカテゴリと、第2の候補カテゴリとが異なる場合、変換後第1のカテゴリに対応する第1のスコアと、第2の候補カテゴリに対応する第2のスコアとの比較に基づいて、分類対象情報が属する対象カテゴリを決定する。 In addition, in the information processing device 100 according to the embodiment, when the converted first category and the second candidate category are different, the determination unit 133 determines the target category to which the classification target information belongs based on a comparison between the first score corresponding to the converted first category and the second score corresponding to the second candidate category.
このように、実施形態に係る情報処理装置100は、変換後第1のカテゴリに対応する第1のスコアと、第2の候補カテゴリに対応する第2のスコアとを比較して分類対象情報が属する対象カテゴリを決定することで、各部分モデルの分類結果の確信度を考慮して、分類対象について適切にカテゴリを決定することができる。 In this way, the information processing device 100 according to the embodiment can appropriately determine the category for the classification target by comparing the first score corresponding to the first category after conversion with the second score corresponding to the second candidate category to determine the target category to which the classification target information belongs, taking into account the confidence of the classification results of each partial model.
また、実施形態に係る情報処理装置100において、決定部133は、第2のスコアが第1のスコア以上である場合、第2のカテゴリを分類対象情報が属する対象カテゴリに決定する。 In addition, in the information processing device 100 according to the embodiment, if the second score is equal to or greater than the first score, the determination unit 133 determines the second category as the target category to which the classification target information belongs.
このように、実施形態に係る情報処理装置100は、第2のスコアが第1のスコア以上である場合、第2のカテゴリを分類対象情報が属する対象カテゴリに決定することで、各部分モデルの分類結果の確信度を考慮して、分類対象について適切にカテゴリを決定することができる。 In this way, when the second score is equal to or greater than the first score, the information processing device 100 according to the embodiment determines the second category as the target category to which the classification target information belongs, thereby taking into account the confidence of the classification results of each partial model and appropriately determining the category for the classification target.
また、実施形態に係る情報処理装置100において、決定部133は、第1のスコアが第2のスコアよりも大きい場合、変換後第1のカテゴリを分類対象情報が属する対象カテゴリに決定する。 In addition, in the information processing device 100 according to the embodiment, if the first score is greater than the second score, the determination unit 133 determines the converted first category as the target category to which the classification target information belongs.
このように、実施形態に係る情報処理装置100は、第1のスコアが第2のスコアよりも大きい場合、変換後第1のカテゴリを分類対象情報が属する対象カテゴリに決定することで、各部分モデルの分類結果の確信度を考慮して、分類対象について適切にカテゴリを決定することができる。 In this way, when the first score is greater than the second score, the information processing device 100 according to the embodiment determines the first category after conversion as the target category to which the classification target information belongs, thereby taking into account the confidence of the classification results of each partial model and appropriately determining the category for the classification target.
また、実施形態に係る情報処理装置100において、決定部133は、変換後第1のカテゴリと、第2の候補カテゴリとが異なる場合、第2の候補カテゴリを分類対象情報が属する対象カテゴリに決定する。 In addition, in the information processing device 100 according to the embodiment, when the first category after conversion is different from the second candidate category, the determination unit 133 determines the second candidate category as the target category to which the classification target information belongs.
このように、実施形態に係る情報処理装置100は、変換後第1のカテゴリと、第2の候補カテゴリとが異なる場合、第2の候補カテゴリを分類対象情報が属する対象カテゴリに決定することで、カテゴリ変換が必要ない方のカテゴリを重要視し、分類対象について適切にカテゴリを決定することができる。 In this way, when the first category after conversion differs from the second candidate category, the information processing device 100 according to the embodiment determines the second candidate category as the target category to which the classification target information belongs, thereby placing emphasis on the category that does not require category conversion and appropriately determining the category for the classification target.
また、実施形態に係る情報処理装置100において、決定部133は、変換後第1のカテゴリと、第2の候補カテゴリとが異なる場合、変換後第1のカテゴリを分類対象情報が属する対象カテゴリに決定する。 In addition, in the information processing device 100 according to the embodiment, when the first converted category differs from the second candidate category, the determination unit 133 determines the first converted category as the target category to which the classification target information belongs.
このように、実施形態に係る情報処理装置100は、変換後第1のカテゴリと、第2の候補カテゴリとが異なる場合、第2の候補カテゴリを分類対象情報が属する対象カテゴリに決定することで、多くのデータで学習された部分モデルの出力を重要視し、分類対象について適切にカテゴリを決定することができる。 In this way, when the first category after conversion differs from the second candidate category, the information processing device 100 according to the embodiment determines the second candidate category as the target category to which the classification target information belongs, thereby placing emphasis on the output of a partial model trained with a large amount of data and appropriately determining a category for the classification target.
また、実施形態に係る情報処理装置100において、決定部133は、変換後第1のカテゴリと、第2の候補カテゴリとが一致する場合、第2の候補カテゴリを分類対象情報が属する対象カテゴリに決定する。 In addition, in the information processing device 100 according to the embodiment, when the first category after conversion matches the second candidate category, the determination unit 133 determines the second candidate category as the target category to which the classification target information belongs.
このように、実施形態に係る情報処理装置100は、変換後第1のカテゴリと、第2の候補カテゴリとが一致する場合、一致したカテゴリを分類対象情報が属する対象カテゴリに決定することで、分類対象について適切にカテゴリを決定することができる。 In this way, when the first category after conversion matches the second candidate category, the information processing device 100 according to the embodiment determines the matching category as the target category to which the classification target information belongs, thereby making it possible to appropriately determine the category for the classification target.
また、実施形態に係る情報処理装置100において、決定部133は、第1の候補カテゴリと、第2の候補カテゴリとが一致する場合、第2の候補カテゴリを分類対象情報が属する対象カテゴリに決定する。 In addition, in the information processing device 100 according to the embodiment, when the first candidate category and the second candidate category match, the determination unit 133 determines the second candidate category as the target category to which the classification target information belongs.
このように、実施形態に係る情報処理装置100は、第1の候補カテゴリと、第2の候補カテゴリとが一致する場合、一致したカテゴリを分類対象情報が属する対象カテゴリに決定することで、分類対象について適切にカテゴリを決定することができる。 In this way, when the first candidate category and the second candidate category match, the information processing device 100 according to the embodiment determines the matching category as the target category to which the classification target information belongs, thereby making it possible to appropriately determine the category for the classification target.
〔7.ハードウェア構成〕
また、上述した実施形態に係る情報処理装置100や端末装置10は、例えば図10に示すような構成のコンピュータ1000によって実現される。以下、情報処理装置100を例に挙げて説明する。図10は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力I/F(Interface)1060、入力I/F1070、ネットワークI/F1080がバス1090により接続された形態を有する。
7. Hardware Configuration
The information processing device 100 and the
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。演算装置1030は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等により実現される。
The arithmetic device 1030 operates based on programs stored in the
一次記憶装置1040は、RAM(Random Access Memory)等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等により実現される。二次記憶装置1050は、内蔵ストレージであってもよいし、外付けストレージであってもよい。また、二次記憶装置1050は、USBメモリやSD(Secure Digital)メモリカード等の取り外し可能な記憶媒体であってもよい。また、二次記憶装置1050は、クラウドストレージ(オンラインストレージ)やNAS(Network Attached Storage)、ファイルサーバ等であってもよい。
The
出力I/F1060は、ディスプレイ、プロジェクタ、及びプリンタ等といった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインターフェイスであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力I/F1070は、マウス、キーボード、キーパッド、ボタン、及びスキャナ等といった各種の入力装置1020から情報を受信するためのインターフェイスであり、例えば、USB等により実現される。
The output I/
また、出力I/F1060及び入力I/F1070はそれぞれ出力装置1010及び入力装置1020と無線で接続してもよい。すなわち、出力装置1010及び入力装置1020は、ワイヤレス機器であってもよい。
In addition, the output I/
また、出力装置1010及び入力装置1020は、タッチパネルのように一体化していてもよい。この場合、出力I/F1060及び入力I/F1070も、入出力I/Fとして一体化していてもよい。
The output device 1010 and the input device 1020 may be integrated together, such as a touch panel. In this case, the output I/
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、又は半導体メモリ等から情報を読み出す装置であってもよい。 The input device 1020 may be a device that reads information from, for example, an optical recording medium such as a CD (Compact Disc), a DVD (Digital Versatile Disc), or a PD (Phase change rewritable Disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory.
ネットワークI/F1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。 The network I/F 1080 receives data from other devices via the network N and sends it to the computing device 1030, and also transmits data generated by the computing device 1030 to other devices via the network N.
演算装置1030は、出力I/F1060や入力I/F1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
The arithmetic unit 1030 controls the output device 1010 and the input device 1020 via the output I/
例えば、コンピュータ1000が情報処理装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、コンピュータ1000の演算装置1030は、ネットワークI/F1080を介して他の機器から取得したプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行してもよい。また、コンピュータ1000の演算装置1030は、ネットワークI/F1080を介して他の機器と連携し、プログラムの機能やデータ等を他の機器の他のプログラムから呼び出して利用してもよい。
For example, when the computer 1000 functions as the information processing device 100, the arithmetic unit 1030 of the computer 1000 executes a program loaded onto the
〔8.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[8. Other]
Furthermore, among the processes described in the above embodiments and modifications, all or part of the processes described as being performed automatically can be performed manually, or all or part of the processes described as being performed manually can be performed automatically by a known method. In addition, the information including the processing procedures, specific names, various data and parameters shown in the above documents and drawings can be changed arbitrarily unless otherwise specified. For example, the various information shown in each drawing is not limited to the illustrated information.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 In addition, each component of each device shown in the figure is a functional concept, and does not necessarily have to be physically configured as shown in the figure. In other words, the specific form of distribution and integration of each device is not limited to that shown in the figure, and all or part of them can be functionally or physically distributed and integrated in any unit depending on various loads, usage conditions, etc.
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 The above-described embodiments and variations can be combined as appropriate to the extent that they do not cause inconsistencies in the processing content.
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。 In addition, the above-mentioned "section, module, unit" can be read as "means" or "circuit." For example, an acquisition unit can be read as an acquisition means or an acquisition circuit.
1 情報処理システム
100 情報処理装置
121 第1種別情報記憶部
122 第2種別情報記憶部
123 モデル情報記憶部
130 制御部
131 取得部
132 学習部
133 決定部
134 提供部
10 端末装置
50 情報提供装置
N ネットワーク
REFERENCE SIGNS
Claims (15)
前記分類対象情報を前記入力情報として前記分類モデルに入力することにより、前記第1の部分モデルが出力した前記第1の分類結果である前記複数の第1のスコアのうち値が最大の前記第1のカテゴリである第1の候補カテゴリと、前記第2の部分モデルが出力した前記第2の分類結果である前記複数の第2のスコアのうち値が最大の前記第2のカテゴリである第2の候補カテゴリを用いて、前記第1の候補カテゴリを、前記第2のカテゴリ群に含まれるカテゴリに変換した変換後第1のカテゴリと、前記第2の候補カテゴリとが一致する場合、前記第2の候補カテゴリを前記分類対象情報が属するカテゴリである対象カテゴリに決定する決定部と、
を備え、
前記決定部は、
前記第1のカテゴリを前記第2のカテゴリに変換するために用いるカテゴリマップを用いて、前記第1の候補カテゴリが変換された前記変換後第1のカテゴリと、前記第2の候補カテゴリとが一致するか否かに基づいて、前記分類対象情報が属する前記対象カテゴリを決定する
ことを特徴とする情報処理装置。 an acquisition unit that acquires classification models including a first partial model that is trained by a learning process using a first type of dataset so that, among first scores for each of a plurality of first categories included in a first category group corresponding to the first type of dataset, a first score for a first category corresponding to input information becomes large, and outputs, as a first classification result, a plurality of first scores corresponding to each of the plurality of first categories corresponding to the input information; and a second partial model that is trained by a learning process using a second type of dataset different from the first type of dataset so that, among second scores for each of a plurality of second categories included in a second category group corresponding to the second type of dataset and having a value comparable to the first score , a second score for a second category corresponding to input information becomes large, and outputs, as a second classification result, a plurality of second scores corresponding to each of the plurality of second categories corresponding to the input information; and
a determination unit that, by inputting the classification target information as the input information into the classification model, converts the first candidate category into a category included in the second category group using a first candidate category which is the first category having a maximum value among the multiple first scores which are the first classification result output by the first partial model, and a second candidate category which is the second category having a maximum value among the multiple second scores which are the second classification result output by the second partial model, and determines the second candidate category as a target category which is a category to which the classification target information belongs , when the second candidate category matches a converted first category;
Equipped with
The determination unit is
an information processing device that determines the target category to which the classification target information belongs based on whether the converted first category into which the first candidate category is converted matches the second candidate category using a category map used to convert the first category into the second category .
前記入力情報の入力に応じて、前記入力情報の特徴情報を出力する第3の部分モデル、前記第3の部分モデルの出力を用いて前記第1の分類結果を出力する前記第1の部分モデル、前記第3の部分モデルの出力を用いて前記第2の分類結果を出力する前記第2の部分モデルを含む分類モデルを取得する
ことを特徴とする請求項1に記載の情報処理装置。 The acquisition unit is
The information processing device according to claim 1, further comprising: a classification model that includes a third partial model that outputs feature information of the input information in response to input of the input information; the first partial model that outputs the first classification result using an output of the third partial model; and the second partial model that outputs the second classification result using an output of the third partial model.
前記第3の部分モデルが出力した前記分類対象情報の特徴情報を用いて、前記第1の部分モデルが出力した前記第1の分類結果が示す前記第1の候補カテゴリと、前記第2の部分モデルが出力した前記第2の分類結果が示す前記第2の候補カテゴリとに基づいて、前記分類対象情報が属する前記対象カテゴリを決定する
ことを特徴とする請求項2に記載の情報処理装置。 The determination unit is
3. The information processing device according to claim 2, further comprising: determining, using feature information of the classification target information output by the third partial model, the target category to which the classification target information belongs, based on the first candidate category indicated by the first classification result output by the first partial model and the second candidate category indicated by the second classification result output by the second partial model.
前記分類対象となる画像である前記分類対象情報を取得する
ことを特徴とする請求項1~3のいずれか1項に記載の情報処理装置。 The acquisition unit is
4. The information processing apparatus according to claim 1, further comprising: acquiring the classification target information which is an image to be classified.
前記第1の部分モデルに対応する第1のカテゴリ群と、前記第2の部分モデルに対応する第2のカテゴリ群との間の対応関係を示す前記カテゴリマップを用いて、前記第1の候補カテゴリが変換された前記変換後第1のカテゴリと、前記第2の候補カテゴリとが一致するか否かに基づいて、前記分類対象情報が属する前記対象カテゴリを決定する
ことを特徴とする請求項1~4のいずれか1項に記載の情報処理装置。 The determination unit is
The information processing device according to any one of claims 1 to 4, characterized in that the target category to which the classification target information belongs is determined based on whether the converted first category into which the first candidate category is converted matches the second candidate category, using the category map indicating a correspondence relationship between a first category group corresponding to the first partial model and a second category group corresponding to the second partial model.
前記変換後第1のカテゴリと、前記第2の候補カテゴリとが異なる場合、前記変換後第1のカテゴリに関する情報と前記第2の候補カテゴリに関する情報との比較に基づいて、前記分類対象情報が属する前記対象カテゴリを決定する
ことを特徴とする請求項1~5のいずれか1項に記載の情報処理装置。 The determination unit is
An information processing device according to any one of claims 1 to 5, characterized in that when the converted first category and the second candidate category are different, the target category to which the classification target information belongs is determined based on a comparison of information relating to the converted first category and information relating to the second candidate category.
前記変換後第1のカテゴリと、前記第2の候補カテゴリとが異なる場合、前記第1の部分モデルが出力した前記複数の第1のスコアのうち前記第1の候補カテゴリの前記第1のスコアと、前記第2の候補カテゴリの前記第2のスコアとの大小関係の比較に基づいて、前記分類対象情報が属する前記対象カテゴリを決定する
ことを特徴とする請求項6に記載の情報処理装置。 The determination unit is
The information processing device according to claim 6, characterized in that, when the converted first category and the second candidate category are different, the target category to which the classification target information belongs is determined based on a comparison of the magnitude relationship between the first score of the first candidate category and the second score of the second candidate category among the multiple first scores output by the first partial model.
前記第2の候補カテゴリの前記第2のスコアが前記第1の候補カテゴリの前記第1のスコア以上である場合、前記第2のカテゴリを前記分類対象情報が属する前記対象カテゴリに決定する
ことを特徴とする請求項7に記載の情報処理装置。 The determination unit is
8. The information processing device according to claim 7, further comprising: determining, when the second score of the second candidate category is equal to or greater than the first score of the first candidate category, the second category as the target category to which the classification target information belongs.
前記第1の候補カテゴリの前記第1のスコアが前記第2の候補カテゴリの前記第2のスコアよりも大きい場合、前記変換後第1のカテゴリを前記分類対象情報が属する前記対象カテゴリに決定する
ことを特徴とする請求項7または請求項8に記載の情報処理装置。 The determination unit is
9. The information processing device according to claim 7, wherein when the first score of the first candidate category is greater than the second score of the second candidate category , the converted first category is determined to be the target category to which the classification target information belongs.
前記変換後第1のカテゴリと、前記第2の候補カテゴリとが異なる場合、前記第2の候補カテゴリを前記分類対象情報が属する前記対象カテゴリに決定する
ことを特徴とする請求項1~6のいずれか1項に記載の情報処理装置。 The determination unit is
The information processing device according to any one of claims 1 to 6 , characterized in that, when the first category after the conversion is different from the second candidate category, the second candidate category is determined to be the target category to which the classification target information belongs.
前記変換後第1のカテゴリと、前記第2の候補カテゴリとが異なる場合、前記変換後第1のカテゴリを前記分類対象情報が属する前記対象カテゴリに決定する
ことを特徴とする請求項1~6のいずれか1項に記載の情報処理装置。 The determination unit is
An information processing device according to any one of claims 1 to 6, characterized in that when the converted first category and the second candidate category are different, the converted first category is determined to be the target category to which the classification target information belongs.
前記変換後第1のカテゴリと、前記第2の候補カテゴリとが一致する場合、前記第2の候補カテゴリを前記分類対象情報が属する前記対象カテゴリに決定する
ことを特徴とする請求項1~6のいずれか1項に記載の情報処理装置。 The determination unit is
An information processing device according to any one of claims 1 to 6, characterized in that if the first category after the conversion matches the second candidate category, the second candidate category is determined to be the target category to which the classification target information belongs.
前記第1の候補カテゴリと、前記第2の候補カテゴリとが一致する場合、前記第2の候補カテゴリを前記分類対象情報が属する前記対象カテゴリに決定する
ことを特徴とする請求項1~12のいずれか1項に記載の情報処理装置。 The determination unit is
The information processing device according to any one of claims 1 to 12 , characterized in that, when the first candidate category and the second candidate category match, the second candidate category is determined to be the target category to which the classification target information belongs.
第1種別のデータセットを用いた学習処理により、前記第1種別のデータセットに対応する第1のカテゴリ群に含まれる複数の第1のカテゴリの各々の第1のスコアのうち、入力情報に対応する第1のカテゴリの第1のスコアが大きくなるように学習され、前記入力情報に対応する前記複数の第1のカテゴリの各々に対応する複数の第1のスコアを第1の分類結果として出力する第1の部分モデル、及び前記第1種別のデータセットとは異なる第2種別のデータセットを用いた学習処理により、前記第2種別のデータセットに対応する第2のカテゴリ群に含まれる複数の第2のカテゴリの各々の第2のスコアであり、前記第1のスコアと比較可能な値である第2のスコアのうち、入力情報に対応する第2のカテゴリの第2のスコアが大きくなるように学習され、前記入力情報に対応する前記複数の第2のカテゴリの各々に対応する複数の第2のスコアを第2の分類結果として出力する第2の部分モデルを含む分類モデルと、分類対象となる分類対象情報とを取得する取得工程と、
前記分類対象情報を前記入力情報として前記分類モデルに入力することにより、前記第1の部分モデルが出力した前記第1の分類結果である前記複数の第1のスコアのうち値が最大の前記第1のカテゴリである第1の候補カテゴリと、前記第2の部分モデルが出力した前記第2の分類結果である前記複数の第2のスコアのうち値が最大の前記第2のカテゴリである第2の候補カテゴリを用いて、前記第1の候補カテゴリを、前記第2のカテゴリ群に含まれるカテゴリに変換した変換後第1のカテゴリと、前記第2の候補カテゴリとが一致する場合、前記第2の候補カテゴリを前記分類対象情報が属するカテゴリである対象カテゴリに決定する決定工程と、
を含み、
前記決定工程は、
前記第1のカテゴリを前記第2のカテゴリに変換するために用いるカテゴリマップを用いて、前記第1の候補カテゴリが変換された前記変換後第1のカテゴリと、前記第2の候補カテゴリとが一致するか否かに基づいて、前記分類対象情報が属する前記対象カテゴリを決定する
ことを特徴とする情報処理方法。 1. A computer-implemented information processing method, comprising:
an acquisition step of acquiring a classification model including a first partial model that is trained by a learning process using a first type of dataset so that, among first scores of each of a plurality of first categories included in a first category group corresponding to the first type of dataset, a first score of a first category corresponding to input information becomes large, and outputs, as a first classification result, a plurality of first scores corresponding to each of the plurality of first categories corresponding to the input information; and a second partial model that is trained by a learning process using a second type of dataset different from the first type of dataset so that, among second scores of each of a plurality of second categories included in a second category group corresponding to the second type of dataset and having a value comparable to the first score , a second score of a second category corresponding to the input information becomes large, and outputs, as a second classification result, a plurality of second scores corresponding to each of the plurality of second categories corresponding to the input information; and classification target information to be classified;
a determination process for inputting the classification target information as the input information into the classification model, and using a first candidate category which is the first category having the largest value among the plurality of first scores which are the first classification result output by the first partial model, and a second candidate category which is the second category having the largest value among the plurality of second scores which are the second classification result output by the second partial model, to convert the first candidate category into a category included in the second category group, when the second candidate category matches the converted first category; and
Including,
The determining step includes:
Using a category map used for converting the first category into the second category, the target category to which the classification target information belongs is determined based on whether the converted first category into which the first candidate category is converted matches the second candidate category.
23. An information processing method comprising:
前記分類対象情報を前記入力情報として前記分類モデルに入力することにより、前記第1の部分モデルが出力した前記第1の分類結果である前記複数の第1のスコアのうち値が最大の前記第1のカテゴリである第1の候補カテゴリと、前記第2の部分モデルが出力した前記第2の分類結果である前記複数の第2のスコアのうち値が最大の前記第2のカテゴリである第2の候補カテゴリを用いて、前記第1の候補カテゴリを、前記第2のカテゴリ群に含まれるカテゴリに変換した変換後第1のカテゴリと、前記第2の候補カテゴリとが一致する場合、前記第2の候補カテゴリを前記分類対象情報が属するカテゴリである対象カテゴリに決定する決定手順と、
をコンピュータに実行させ、
前記決定手順は、
前記第1のカテゴリを前記第2のカテゴリに変換するために用いるカテゴリマップを用いて、前記第1の候補カテゴリが変換された前記変換後第1のカテゴリと、前記第2の候補カテゴリとが一致するか否かに基づいて、前記分類対象情報が属する前記対象カテゴリを決定する
ことを特徴とする情報処理プログラム。 an acquisition step of acquiring a classification model including a first partial model that is trained by a learning process using a first type of dataset so that among first scores of each of a plurality of first categories included in a first category group corresponding to the first type of dataset, a first score of a first category corresponding to input information becomes large, and outputs a plurality of first scores corresponding to each of the plurality of first categories corresponding to the input information as a first classification result, and a second partial model that is trained by a learning process using a second type of dataset different from the first type of dataset so that among second scores, which are second scores of each of a plurality of second categories included in a second category group corresponding to the second type of dataset and have values comparable to the first scores , a second score of a second category corresponding to input information becomes large, and outputs a plurality of second scores corresponding to each of the plurality of second categories corresponding to the input information as a second classification result, and classification target information to be classified;
a determination step of inputting the classification target information as the input information into the classification model, and using a first candidate category which is the first category having the largest value among the plurality of first scores which are the first classification result output by the first partial model, and a second candidate category which is the second category having the largest value among the plurality of second scores which are the second classification result output by the second partial model, to convert the first candidate category into a category included in the second category group, when the second candidate category matches the converted first category; and determining the second candidate category as a target category which is the category to which the classification target information belongs.
Run the following on your computer :
The determination procedure includes:
an information processing program for determining the target category to which the information to be classified belongs based on whether or not the converted first category into which the first candidate category is converted matches the second candidate category using a category map used to convert the first category into the second category .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021097519A JP7492489B2 (en) | 2021-06-10 | 2021-06-10 | Information processing device, information processing method, and information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021097519A JP7492489B2 (en) | 2021-06-10 | 2021-06-10 | Information processing device, information processing method, and information processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022189127A JP2022189127A (en) | 2022-12-22 |
JP7492489B2 true JP7492489B2 (en) | 2024-05-29 |
Family
ID=84532964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021097519A Active JP7492489B2 (en) | 2021-06-10 | 2021-06-10 | Information processing device, information processing method, and information processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7492489B2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015079308A (en) | 2013-10-15 | 2015-04-23 | 国立大学法人広島大学 | Recognition system |
JP2017054239A (en) | 2015-09-08 | 2017-03-16 | 株式会社Screenホールディングス | Image classification device and image classification method |
-
2021
- 2021-06-10 JP JP2021097519A patent/JP7492489B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015079308A (en) | 2013-10-15 | 2015-04-23 | 国立大学法人広島大学 | Recognition system |
JP2017054239A (en) | 2015-09-08 | 2017-03-16 | 株式会社Screenホールディングス | Image classification device and image classification method |
Also Published As
Publication number | Publication date |
---|---|
JP2022189127A (en) | 2022-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Samek et al. | Explainable AI: interpreting, explaining and visualizing deep learning | |
US10755447B2 (en) | Makeup identification using deep learning | |
Li et al. | Image sentiment prediction based on textual descriptions with adjective noun pairs | |
US10796203B2 (en) | Out-of-sample generating few-shot classification networks | |
WO2023179038A1 (en) | Data labeling method, ai development platform, computing device cluster, and storage medium | |
CN113254716B (en) | Video clip retrieval method and device, electronic equipment and readable storage medium | |
Manikiran et al. | E-commerce clothing review analysis and model building | |
CN112364912B (en) | Information classification method, device, equipment and storage medium | |
US20220215287A1 (en) | Self-supervised pretraining through text alignment | |
Ephzibah et al. | Big data management with machine learning inscribed by domain knowledge for health care | |
CN114676836A (en) | Computer system for multi-source domain adaptive learning and method thereof | |
Latha et al. | Product recommendation using enhanced convolutional neural network for e-commerce platform | |
US11501071B2 (en) | Word and image relationships in combined vector space | |
JP7492489B2 (en) | Information processing device, information processing method, and information processing program | |
US20230162518A1 (en) | Systems for Generating Indications of Relationships between Electronic Documents | |
Eltaher et al. | User profiling of Flickr: Integrating multiple types of features for gender classification | |
Mercy Rajaselvi Beaulah et al. | Categorization of images using autoencoder hashing and training of intra bin classifiers for image classification and annotation | |
Madhavi et al. | Bird Species Recognition Using Deep Transfer Learning | |
Asano et al. | Model-agnostic explanations for decisions using minimal patterns | |
JP7507733B2 (en) | Information processing device, information processing method, and information processing program | |
US12008800B2 (en) | Conflation of geospatial points of interest and ground-level imagery | |
US20230093468A1 (en) | Cognitive image searching based on personalized image components of a composite image | |
US20240211812A1 (en) | Processors and methods for selecting a target model for an unlabeled dataset | |
JP7315623B2 (en) | Information processing device, information processing method, and information processing program | |
US20230252311A1 (en) | Systems and methods for transductive out-of-domain learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231003 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20231026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231117 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240402 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20240410 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240423 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240517 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7492489 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |