JP7106504B2 - 学習装置、学習方法および学習プログラム - Google Patents
学習装置、学習方法および学習プログラム Download PDFInfo
- Publication number
- JP7106504B2 JP7106504B2 JP2019163971A JP2019163971A JP7106504B2 JP 7106504 B2 JP7106504 B2 JP 7106504B2 JP 2019163971 A JP2019163971 A JP 2019163971A JP 2019163971 A JP2019163971 A JP 2019163971A JP 7106504 B2 JP7106504 B2 JP 7106504B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- image
- learning
- predetermined
- learning device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 26
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 238000012545 processing Methods 0.000 claims description 17
- 101000864057 Homo sapiens Serine/threonine-protein kinase SMG1 Proteins 0.000 description 21
- 102100029938 Serine/threonine-protein kinase SMG1 Human genes 0.000 description 21
- 101000579423 Homo sapiens Regulator of nonsense transcripts 1 Proteins 0.000 description 12
- 101001106045 Homo sapiens Regulator of nonsense transcripts 2 Proteins 0.000 description 12
- 102100028287 Regulator of nonsense transcripts 1 Human genes 0.000 description 12
- 102100021087 Regulator of nonsense transcripts 2 Human genes 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 101000874141 Homo sapiens Probable ATP-dependent RNA helicase DDX43 Proteins 0.000 description 10
- 102100035724 Probable ATP-dependent RNA helicase DDX43 Human genes 0.000 description 10
- 238000013500 data storage Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 102100022907 Acrosin-binding protein Human genes 0.000 description 8
- 101000756551 Homo sapiens Acrosin-binding protein Proteins 0.000 description 8
- 101000824971 Homo sapiens Sperm surface protein Sp17 Proteins 0.000 description 8
- 102100022441 Sperm surface protein Sp17 Human genes 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 101150037418 POG1 gene Proteins 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 239000010902 straw Substances 0.000 description 5
- 230000010365 information processing Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
まず、図1を用いて、実施形態にかかる学習処理の一例について説明する。図1は、実施形態にかかる学習処理の一例を示す図である。実施形態にかかる学習処理は、学習装置100によって行われる。
次に、図3を用いて、実施形態にかかる学習装置100について説明する。図3は、実施形態にかかる学習装置100の構成例を示す図である。図3に示すように、学習装置100は、通信部110と、記憶部120と、制御部130とを有する。例えば、学習装置100は、図1で説明した学習処理を行うサーバ装置である。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線または無線で接続され、例えば、端末装置10との間で情報の送受信を行う。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリ素子またはハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、画像情報記憶部121と、学習データ記憶部122と、出力情報記憶部123とを有する。
画像情報記憶部121は、学習に用いられる(学習データの生成に用いられる)画像を記憶する。例えば、画像情報記憶部121は、このような画像として、サービスSHに対して入稿された商品画像を記憶する。ここで、図4に実施形態にかかる画像情報記憶部121の一例を示す。図4の例では、画像情報記憶部121は、「画像ID」、「画像データ」、「第1のカテゴリ」、「第2のカテゴリ」、「代替カテゴリ」といった項目を有する。
学習データ記憶部122は、モデルの学習に用いられる学習データに関する情報を記憶する。ここで、図5に実施形態にかかる学習データ記憶部122の一例を示す。図5の例では、学習データ記憶部122は、「画像ID」、「特徴情報」、「代替カテゴリ」、「モデル情報」といった項目を有する。
出力情報記憶部123は、処理対象の画像をモデルに入力することにより出力(検出)された情報を記憶する。ここで、図6に実施形態にかかる出力情報記憶部123の一例を示す。図6の例では、出力情報記憶部123は、「入力画像ID」、「検出オブジェクト情報」、「検出カテゴリ」といった項目を有する。
図3に戻り、制御部130は、CPUやMPU等によって、学習装置100内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASICやFPGA等の集積回路により実現される。
取得部131は、所定のオブジェクトを含む所定の画像を取得する。例えば、取得部131は、所定の画像として、所定のオブジェクトが抽出された領域に対して当該領域内の所定のオブジェクトに対応する第1のカテゴリが付された画像を取得する。また、取得部131により取得される所定の画像には、第1のカテゴリとは範囲の異なる所定の第2のカテゴリが予め付与される。第2のカテゴリは、例えば、階層構造状のカテゴリである。図1の例では、取得部131は、出品商品を含む商品画像を取得する。例えば、取得部131は、学習に用いられる画像を取得する。例えば、取得部131は、サービスSHに出品される出品商品が映された商品画像であって、店舗から入稿された商品画像を取得する。
決定部132は、取得部131により取得された画像に対して付与される第2のカテゴリに基づいて、かかる画像において取引対象となっているオブジェクトに対応する第1のカテゴリに置きかわる代替カテゴリを決定する決定処理を行う。例えば、決定部132は、取得された画像から第1のカテゴリおよび第2のカテゴリを取得し、第2のカテゴリに基づいて、第1のカテゴリより下位のカテゴリである下位カテゴリを代替カテゴリとして決定する。
生成部133は、学習データを生成する生成処理を行う。例えば、生成部133は、取得部131により取得された画像から取引対象のオブジェクトを検出する。例えば、生成部133は、かかる画像に対して利用者により設定された領域に基づいて、取引対象のオブジェクトを検出する。具体的には、生成部133は、領域によって抽出される(囲まれる)オブジェクトを取引対象のオブジェクトとして検出する。
学習部134は、所定のオブジェクトの特徴を示す特徴情報と、所定のオブジェクトに対応する第1のカテゴリとは範囲の異なる所定の第2のカテゴリとの関係性に基づいて、処理対象の画像が入力された場合に、当該処理対象の画像に含まれるオブジェクトである対象オブジェクト(例えば、処理対象の画像において取引対象となっているオブジェクト)が属するカテゴリを出力するようにモデルを学習する。例えば、学習部134は、特徴情報と、第2のカテゴリとの関係性に基づいて、処理対象の画像が入力された場合に、対象オブジェクトであって、所定の領域によって抽出された対象オブジェクトが属するカテゴリを出力するようにモデルを学習する。
検出部135は、処理対象の画像をモデルに入力することにより、出力された情報に基づいて、処理対象の画像で取引対象となっているオブジェクトを検出するとともに、当該オブジェクトの属するより粒度の細かいカテゴリを検出する。また、検出部135は、検出した情報を出力情報記憶部123に格納する。
次に、図7を用いて、実施形態にかかる学習処理の手順について説明する。図7は、実施形態にかかる学習処理手順を示すフローチャートである。
また、上記実施形態にかかる学習装置100は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、学習装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
10 端末装置
100 学習装置
120 記憶部
121 画像情報記憶部
122 学習データ記憶部
123 出力情報記憶部
130 制御部
131 取得部
132 決定部
133 生成部
134 学習部
135 検出部
Claims (6)
- 所定のオブジェクトを含む所定の画像として、前記所定のオブジェクトが抽出された領域に対して当該領域内の前記所定のオブジェクトに対応する第1のカテゴリが付された画像を取得する取得部と、
前記所定のオブジェクトの特徴を示す特徴情報と、前記第1のカテゴリとは範囲の異なる所定の第2のカテゴリとの関係性に基づいて、処理対象の画像が入力された場合に、当該処理対象の画像に含まれるオブジェクトである対象オブジェクトであって、所定の領域によって抽出された対象オブジェクトが属するカテゴリを出力するようにモデルを学習する学習部と
を有することを特徴とする学習装置。 - 前記学習部は、前記特徴情報と、前記第2のカテゴリとの関係性に基づいて、前記処理対象の画像が入力された場合に、前記第2のカテゴリに基づくカテゴリであって、前記対象オブジェクトから検出されるカテゴリよりも下位のカテゴリを、当該対象オブジェクトが属するカテゴリとして出力するように前記モデルを学習する
ことを特徴とする請求項1に記載の学習装置。 - 前記学習部は、前記特徴情報と、前記第1のカテゴリに対して下位の関係にある前記第2のカテゴリとの関係性に基づいて、前記処理対象の画像が入力された場合に、前記対象オブジェクトが属するカテゴリとして、前記第2のカテゴリを出力するようにモデルを学習する
ことを特徴とする請求項1または2に記載の学習装置。 - 前記学習部は、前記特徴情報と、前記第2のカテゴリとの関係性に基づいて、前記処理対象の画像が入力された場合に、前記処理対象の画像に含まれるオブジェクトのうち、取引対象となる1の前記対象オブジェクトと、当該対象オブジェクトが属するカテゴリを出力するように前記モデルを学習する
ことを特徴とする請求項1~3のいずれか1つに記載の学習装置。 - 学習装置が実行する学習方法であって、
所定のオブジェクトを含む所定の画像として、前記所定のオブジェクトが抽出された領域に対して当該領域内の前記所定のオブジェクトに対応する第1のカテゴリが付された画像を取得する取得工程と、
前記所定のオブジェクトの特徴を示す特徴情報と、前記第1のカテゴリとは範囲の異なる所定の第2のカテゴリとの関係性に基づいて、処理対象の画像が入力された場合に、当該処理対象の画像に含まれるオブジェクトである対象オブジェクトであって、所定の領域によって抽出された対象オブジェクトが属するカテゴリを出力するようにモデルを学習する学習工程と
を含むことを特徴とする学習方法。 - 所定のオブジェクトを含む所定の画像として、前記所定のオブジェクトが抽出された領域に対して当該領域内の前記所定のオブジェクトに対応する第1のカテゴリが付された画像を取得する取得手順と、
前記所定のオブジェクトの特徴を示す特徴情報と、前記第1のカテゴリとは範囲の異なる所定の第2のカテゴリとの関係性に基づいて、処理対象の画像が入力された場合に、当該処理対象の画像に含まれるオブジェクトである対象オブジェクトであって、所定の領域によって抽出された対象オブジェクトが属するカテゴリを出力するようにモデルを学習する学習手順と
をコンピュータに実行させることを特徴とする学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019163971A JP7106504B2 (ja) | 2019-09-09 | 2019-09-09 | 学習装置、学習方法および学習プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019163971A JP7106504B2 (ja) | 2019-09-09 | 2019-09-09 | 学習装置、学習方法および学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021043594A JP2021043594A (ja) | 2021-03-18 |
JP7106504B2 true JP7106504B2 (ja) | 2022-07-26 |
Family
ID=74864118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019163971A Active JP7106504B2 (ja) | 2019-09-09 | 2019-09-09 | 学習装置、学習方法および学習プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7106504B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012058926A (ja) | 2010-09-07 | 2012-03-22 | Olympus Corp | キーワード付与装置及びプログラム |
JP2018190293A (ja) | 2017-05-10 | 2018-11-29 | ヤフー株式会社 | 検索装置、検索方法および検索プログラム |
-
2019
- 2019-09-09 JP JP2019163971A patent/JP7106504B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012058926A (ja) | 2010-09-07 | 2012-03-22 | Olympus Corp | キーワード付与装置及びプログラム |
JP2018190293A (ja) | 2017-05-10 | 2018-11-29 | ヤフー株式会社 | 検索装置、検索方法および検索プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021043594A (ja) | 2021-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11423076B2 (en) | Image similarity-based group browsing | |
Shi et al. | Transferring a semantic representation for person re-identification and search | |
Simo-Serra et al. | Fashion style in 128 floats: Joint ranking and classification using weak data for feature extraction | |
WO2016123538A1 (en) | Mobile visual commerce system | |
Li et al. | Landmark free face attribute prediction | |
CA2804439A1 (en) | System and method for categorizing an image | |
KR102517961B1 (ko) | 사용자 선택 의류를 기반으로 의류 추천 정보를 제공하는 방법, 이를 이용하는 서버 및 프로그램 | |
Wang et al. | Batch coherence-driven network for part-aware person re-identification | |
Eshwar et al. | Apparel classification using convolutional neural networks | |
US11972466B2 (en) | Computer storage media, method, and system for exploring and recommending matching products across categories | |
Karaoglu et al. | Detect2rank: Combining object detectors using learning to rank | |
Gustavsson et al. | Cloth manipulation based on category classification and landmark detection | |
JP7106504B2 (ja) | 学習装置、学習方法および学習プログラム | |
Selvam et al. | Batch Normalization Free Rigorous Feature Flow Neural Network for Grocery Product Recognition | |
Lei et al. | A new clothing image retrieval algorithm based on sketch component segmentation in mobile visual sensors | |
Kumar et al. | Hierarchical category detector for clothing recognition from visual data | |
JP4995770B2 (ja) | 画像辞書生成装置,画像辞書生成方法,および画像辞書生成プログラム | |
WO2021049119A1 (ja) | 学習装置、学習方法及び学習プログラムが格納された非一時的なコンピュータ可読媒体 | |
JP2020095757A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP7457738B2 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP2018081452A (ja) | 画像処理装置、画像処理方法 | |
US20230401460A1 (en) | Method and electronic device for on-device lifestyle recommendations | |
US11748973B2 (en) | Systems and methods for generating object state distributions usable for image comparison tasks | |
Meena et al. | Hybrid neural network architecture for multi-label object recognition using feature fusion | |
JP7434914B2 (ja) | 歩行者物品検出装置及び方法、電子機器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210916 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210916 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220713 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7106504 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |