JP7021161B2 - 学習装置、学習方法および学習プログラム - Google Patents
学習装置、学習方法および学習プログラム Download PDFInfo
- Publication number
- JP7021161B2 JP7021161B2 JP2019170025A JP2019170025A JP7021161B2 JP 7021161 B2 JP7021161 B2 JP 7021161B2 JP 2019170025 A JP2019170025 A JP 2019170025A JP 2019170025 A JP2019170025 A JP 2019170025A JP 7021161 B2 JP7021161 B2 JP 7021161B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- image
- learning
- processed
- traded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 46
- 230000008569 process Effects 0.000 claims description 25
- 239000000284 extract Substances 0.000 claims description 4
- 101000864057 Homo sapiens Serine/threonine-protein kinase SMG1 Proteins 0.000 description 19
- 102100029938 Serine/threonine-protein kinase SMG1 Human genes 0.000 description 19
- 238000001514 detection method Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 13
- 101150037418 POG1 gene Proteins 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 101000579423 Homo sapiens Regulator of nonsense transcripts 1 Proteins 0.000 description 10
- 102100028287 Regulator of nonsense transcripts 1 Human genes 0.000 description 10
- 238000013500 data storage Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 101000824971 Homo sapiens Sperm surface protein Sp17 Proteins 0.000 description 7
- 102100022441 Sperm surface protein Sp17 Human genes 0.000 description 7
- 239000002245 particle Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
まず、図1を用いて、実施形態にかかる学習処理の一例について説明する。図1は、実施形態にかかる学習処理の一例を示す図である。実施形態にかかる学習処理は、学習装置100によって行われる。
次に、図4を用いて、実施形態にかかる学習装置100について説明する。図4は、実施形態にかかる学習装置100の構成例を示す図である。図4に示すように、学習装置100は、通信部110と、記憶部120と、制御部130とを有する。例えば、学習装置100は、図1および図2で説明した学習処理を行うサーバ装置である。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線または無線で接続され、例えば、端末装置10との間で情報の送受信を行う。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリ素子またはハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、画像情報記憶部121と、学習データ記憶部122と、出力情報記憶部123とを有する。
画像情報記憶部121は、学習に用いられる(学習データの生成に用いられる)画像を記憶する。例えば、画像情報記憶部121は、このような画像として、サービスSHに対して入稿された商品画像を記憶する。ここで、図5に実施形態にかかる画像情報記憶部121の一例を示す。図5の例では、画像情報記憶部121は、「画像ID」、「画像データ」といった項目を有する。
学習データ記憶部122は、モデルの学習に用いられる学習データに関する情報を記憶する。ここで、図6に実施形態にかかる学習データ記憶部122の一例を示す。図5の例では、学習データ記憶部122は、「画像ID」、「対象オブジェクト情報」、「第1のカテゴリ」、「下位カテゴリ」、「モデル情報」といった項目を有する。
出力情報記憶部123は、処理対象の画像をモデルに入力することにより出力(検出)された情報を記憶する。ここで、図7に実施形態にかかる出力情報記憶部123の一例を示す。図7の例では、出力情報記憶部123は、「入力画像ID」、「検出オブジェクト情報」、「検出カテゴリ」といった項目を有する。
図4に戻り、制御部130は、CPUやMPU等によって、学習装置100内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASICやFPGA等の集積回路により実現される。
取得部131は、複数のオブジェクトを含む所定の画像を取得する。例えば、取得部131は、所定の画像として、複数のオブジェクトが個別に抽出された領域それぞれに対して当該領域内のオブジェクトに対応する第1のカテゴリが対応付けられた画像を取得する。また、取得部131により取得される所定の画像には、第1のカテゴリとは範囲の異なる所定の第2のカテゴリが予め付与される。第2のカテゴリは、例えば、階層構造状のカテゴリである。図1の例では、取得部131は、出品商品を含む商品画像を取得する。このような商品画像は、以下に説明する学習データの生成に用いられる。例えば、取得部131は、学習に用いられる画像を取得する。例えば、取得部131は、サービスSHに出品される出品商品が映された商品画像であって、店舗から入稿された商品画像を取得する。
特定部132は、取得部131により取得された画像について、各第1のカテゴリと第2のカテゴリとに基づいて、当該画像で取引対象となっているオブジェクト(取引対象のオブジェクト)を特定するための一連の特定処理を行う。例えば、特定部132は、領域によって抽出されている各オブジェクトに紐付けられる第1のカテゴリ、および、取得された画像自体に紐付けられる第2のカテゴリを取得する。そして、特定部132は、取得した各第1のカテゴリと第2のカテゴリとに基づいて、取得された画像で取引対象となっているオブジェクトを特定する。より詳細には、特定部132は、各第1のカテゴリと、第2のカテゴリとを比較することで、第2のカテゴリに対して関係性のより強い方の第1のカテゴリを特定し、特定した第1のカテゴリが紐付けられるオブジェクトを取引対象のオブジェクトとして特定する。
決定部133は、特定部132により特定された取引対象のオブジェクトに紐付けられる第1のカテゴリよりも下位のカテゴリ(下位カテゴリ)を決定する。具体的には、決定部133は、第2のカテゴリに基づいて、第1のカテゴリよりも下位のカテゴリを決定する。
生成部134は、学習データを生成する生成処理を行う。例えば、生成部134は、取引対象のオブジェクトに対応する第1のカテゴリと、このオブジェクトを含む画像に付与される第2のカテゴリとを紐付けることにより学習に用いる学習データを生成する。例えば、図1に示すように、生成部134は、「画像ID」および「対象オブジェクト情報」の組合せ毎に、「第1のカテゴリ」と「下位カテゴリ」とを紐付けることで学習データを生成する。
学習部135は、複数のオブジェクトそれぞれに対応する各カテゴリである第1のカテゴリと、この複数のオブジェクトを含む画像に対して予め付与される第2のカテゴリとの関係性に基づいて、処理対象の画像が入力された場合に、当該処理対象の画像に含まれるオブジェクトのうち、当該処理対象の画像に対して予め付与されるカテゴリによって示唆されるオブジェクトを取引対象のオブジェクトとして出力するようにモデルを学習する。例えば、学習部135は、第1のカテゴリと、第2のカテゴリとの関係性に基づいて、処理対象の画像が入力された場合に、処理対象の画像に含まれるオブジェクトが個別に抽出された領域のうち、処理対象の画像に対して予め付与されるカテゴリによって示唆されるオブジェクトを含む領域を、取引対象のオブジェクトを含む領域として出力するようにモデルを学習する。例えば、学習部135は、処理対象の画像に含まれるオブジェクトが個別に抽出された領域のうち、第2のカテゴリと関係性のより強い第1のカテゴリが対応付けられた領域内のオブジェクトを、取引対象のオブジェクトとして出力するようにモデルを学習する。
次に、図8を用いて、実施形態にかかる学習処理の手順について説明する。図8は、実施形態にかかる学習処理手順を示すフローチャートである。
また、上記実施形態にかかる学習装置100は、例えば図9に示すような構成のコンピュータ1000によって実現される。図9は、学習装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
10 端末装置
100 学習装置
120 記憶部
121 画像情報記憶部
122 学習データ記憶部
123 出力情報記憶部
130 制御部
131 取得部
132 特定部
133 決定部
134 生成部
135 学習部
136 検出部
Claims (7)
- 複数のオブジェクトを含む所定の画像を取得する取得部と、
前記複数のオブジェクトそれぞれに対応する各カテゴリである第1のカテゴリと、前記所定の画像に対して予め付与される第2のカテゴリとの関係性に基づいて、処理対象の画像が入力された場合に、当該処理対象の画像に含まれるオブジェクトのうち、当該処理対象の画像に対して予め付与されるカテゴリによって示唆されるオブジェクトを取引対象のオブジェクトとして出力するようにモデルを学習する学習部と
を有することを特徴とする学習装置。 - 前記取得部は、前記所定の画像として、前記複数のオブジェクトが個別に抽出された領域それぞれに対して当該領域内の前記オブジェクトに対応する前記第1のカテゴリが対応付けられた画像を取得し、
前記学習部は、前記第1のカテゴリと、前記第2のカテゴリとの関係性に基づいて、前記処理対象の画像が入力された場合に、前記処理対象の画像に含まれるオブジェクトが個別に抽出された領域のうち、前記処理対象の画像に対して予め付与される前記カテゴリによって示唆されるオブジェクトを含む領域を、前記取引対象のオブジェクトを含む領域として出力するように前記モデルを学習する
ことを特徴とする請求項1に記載の学習装置。 - 前記学習部は、前記処理対象の画像に含まれるオブジェクトが個別に抽出された領域のうち、前記第2のカテゴリと関係性のより強い前記第1のカテゴリが対応付けられた領域内のオブジェクトを、前記取引対象のオブジェクトとして出力するようにモデルを学習する
ことを特徴とする請求項1または2に記載の学習装置。 - 前記学習部は、前記第1のカテゴリと、前記第2のカテゴリとの関係性に基づいて、前記処理対象の画像が入力された場合に、前記第2のカテゴリに基づくカテゴリであって、前記取引対象のオブジェクトから検出されるカテゴリよりも下位のカテゴリを、前記取引対象のオブジェクトが属するカテゴリとして出力するように前記モデルを学習する
ことを特徴とする請求項1~3のいずれか1つに記載の学習装置。 - 前記学習部は、前記第1のカテゴリのうち、当該第1のカテゴリよりも下位の前記第2のカテゴリと関係性のより強いカテゴリが応付けられた領域であって、前記取引対象のオブジェクトが個別に抽出された領域内の当該オブジェクトが属するカテゴリとして、前記第2のカテゴリを出力するように前記モデルを学習する
ことを特徴とする請求項4に記載の学習装置。 - 学習装置が実行する学習方法であって、
複数のオブジェクトを含む所定の画像を取得する取得工程と、
前記複数のオブジェクトそれぞれに対応する各カテゴリである第1のカテゴリと、前記所定の画像に対して予め付与される第2のカテゴリとの関係性に基づいて、処理対象の画像が入力された場合に、当該処理対象の画像に含まれるオブジェクトのうち、当該処理対象の画像に対して予め付与されるカテゴリによって示唆されるオブジェクトを取引対象のオブジェクトとして出力するようにモデルを学習する学習工程と
を含むことを特徴とする学習方法。 - 複数のオブジェクトを含む所定の画像を取得する取得手順と、
前記複数のオブジェクトそれぞれに対応する各カテゴリである第1のカテゴリと、前記所定の画像に対して予め付与される第2のカテゴリとの関係性に基づいて、処理対象の画像が入力された場合に、当該処理対象の画像に含まれるオブジェクトのうち、当該処理対象の画像に対して予め付与されるカテゴリによって示唆されるオブジェクトを取引対象のオブジェクトとして出力するようにモデルを学習する学習手順と
をコンピュータに実行させることを特徴とする学習プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019170025A JP7021161B2 (ja) | 2019-09-19 | 2019-09-19 | 学習装置、学習方法および学習プログラム |
JP2022015744A JP7457738B2 (ja) | 2019-09-19 | 2022-02-03 | 情報処理装置、情報処理方法および情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019170025A JP7021161B2 (ja) | 2019-09-19 | 2019-09-19 | 学習装置、学習方法および学習プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022015744A Division JP7457738B2 (ja) | 2019-09-19 | 2022-02-03 | 情報処理装置、情報処理方法および情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021047662A JP2021047662A (ja) | 2021-03-25 |
JP7021161B2 true JP7021161B2 (ja) | 2022-02-16 |
Family
ID=74876384
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019170025A Active JP7021161B2 (ja) | 2019-09-19 | 2019-09-19 | 学習装置、学習方法および学習プログラム |
JP2022015744A Active JP7457738B2 (ja) | 2019-09-19 | 2022-02-03 | 情報処理装置、情報処理方法および情報処理プログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022015744A Active JP7457738B2 (ja) | 2019-09-19 | 2022-02-03 | 情報処理装置、情報処理方法および情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7021161B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017221868A1 (ja) | 2016-06-24 | 2017-12-28 | サイジニア株式会社 | サーバ装置、端末装置、および情報処理方法 |
JP2018190293A (ja) | 2017-05-10 | 2018-11-29 | ヤフー株式会社 | 検索装置、検索方法および検索プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6005837B2 (ja) | 2013-02-27 | 2016-10-12 | 株式会社日立製作所 | 画像解析装置、画像解析システム、画像解析方法 |
US10410096B2 (en) | 2015-07-09 | 2019-09-10 | Qualcomm Incorporated | Context-based priors for object detection in images |
JP2018045551A (ja) * | 2016-09-16 | 2018-03-22 | ヤフー株式会社 | 決定装置、決定方法および決定プログラム |
-
2019
- 2019-09-19 JP JP2019170025A patent/JP7021161B2/ja active Active
-
2022
- 2022-02-03 JP JP2022015744A patent/JP7457738B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017221868A1 (ja) | 2016-06-24 | 2017-12-28 | サイジニア株式会社 | サーバ装置、端末装置、および情報処理方法 |
JP2018190293A (ja) | 2017-05-10 | 2018-11-29 | ヤフー株式会社 | 検索装置、検索方法および検索プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7457738B2 (ja) | 2024-03-28 |
JP2021047662A (ja) | 2021-03-25 |
JP2022062177A (ja) | 2022-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11423636B2 (en) | Saliency-based object counting and localization | |
US10747826B2 (en) | Interactive clothes searching in online stores | |
CN107330451B (zh) | 基于深度卷积神经网络的服装属性检索方法 | |
US20160225053A1 (en) | Mobile visual commerce system | |
US20190205962A1 (en) | Computer Vision and Image Characteristic Search | |
US9678989B2 (en) | System and method for use of images with recognition analysis | |
US20160042250A1 (en) | Interactive content generation | |
JP2019537120A (ja) | 画像解析および予測に基づく視覚検索 | |
US9830534B1 (en) | Object recognition | |
US9727620B2 (en) | System and method for item and item set matching | |
US9424466B2 (en) | Shoe image retrieval apparatus and method using matching pair | |
US20210073890A1 (en) | Catalog-based image recommendations | |
KR102517961B1 (ko) | 사용자 선택 의류를 기반으로 의류 추천 정보를 제공하는 방법, 이를 이용하는 서버 및 프로그램 | |
JP2013045122A (ja) | 画像検索装置、画像検索方法、およびプログラム | |
Becker et al. | Mad for visual tracker fusion | |
Du et al. | Amazon shop the look: A visual search system for fashion and home | |
Gutierrez et al. | Deep learning for automated tagging of fashion images | |
JP7021161B2 (ja) | 学習装置、学習方法および学習プログラム | |
JP7106504B2 (ja) | 学習装置、学習方法および学習プログラム | |
JP7179705B2 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
Withurat et al. | Personal color analysis using color space algorithm | |
Sun et al. | Product Re-identification System in Fully Automated Defect Detection | |
Shah et al. | E-commerce Products Image Classification using EfficientNetB5 with Transfer Learning | |
Frikha et al. | Semantic attributes for people’s appearance description: an appearance modality for video surveillance applications | |
Thwe et al. | Accurate fashion and accessories detection for mobile application based on deep learning. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210916 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210916 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7021161 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |