JP6043755B2 - 生成装置、生成方法及び生成プログラム - Google Patents

生成装置、生成方法及び生成プログラム Download PDF

Info

Publication number
JP6043755B2
JP6043755B2 JP2014126555A JP2014126555A JP6043755B2 JP 6043755 B2 JP6043755 B2 JP 6043755B2 JP 2014126555 A JP2014126555 A JP 2014126555A JP 2014126555 A JP2014126555 A JP 2014126555A JP 6043755 B2 JP6043755 B2 JP 6043755B2
Authority
JP
Japan
Prior art keywords
classification
image
generation
learning device
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014126555A
Other languages
English (en)
Other versions
JP2016004550A (ja
Inventor
岩崎 雅二郎
雅二郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2014126555A priority Critical patent/JP6043755B2/ja
Publication of JP2016004550A publication Critical patent/JP2016004550A/ja
Application granted granted Critical
Publication of JP6043755B2 publication Critical patent/JP6043755B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、生成装置、生成方法及び生成プログラムに関する。
従来、各種のデータに対してデータのカテゴリを示すラベル付けが行われている。例えば、インターネットオークションに商品を出品する場合に、出品者は、商品のカテゴリ検索や絞込み検索を行えるようにするため、予め用意されたカテゴリの中から出品する商品が属するカテゴリを手動で選択することで商品に対してラベル付けを行う。
特開2005−352900号公報
しかしながら、上記の方法では、適切なラベルを付けることができるとは限らなかった。例えば、上記の方法では、出品者は、商品が属するカテゴリのラベルを恣意的に判断し、商品のラベルを決定する。このため、上記の方法では、商品に対して不適切なラベルが付けられる場合がある。このようなことから、上記の方法では、適切なラベルを付けることができるとは限らなかった。
本願は、上記に鑑みてなされたものであって、適切なラベルを付けることができる生成装置、生成方法及び生成プログラムを提供することを目的とする。
本願に係る生成装置は、入力データとして階層構造を有する分類を示す言語データと当該言語データが示す分類に属する被写体が描出された画像とを受け付ける受付部と、前記受付部によって受け付けられた前記言語データおよび前記画像に基づいて、前記画像を入力した場合に前記言語データが示す階層構造を有する分類に対応するノードが所定の値を出力する学習器を生成する生成部とを備えたことを特徴とする。
実施形態の一態様によれば、適切なラベルを付けることができるという効果を奏する。
図1は、実施形態に係る生成装置による生成処理の一例を示す説明図である。 図2は、実施形態に係る出力層の一例を示す図である。 図3は、実施形態に係る出品システムによる出品処理の一例を示す説明図である。 図4は、実施形態に係る生成装置の構成例を示す図である。 図5は、実施形態に係る階層情報記憶部の一例を示す図である。 図6は、実施形態に係る生成装置による判定処理の一例を示す説明図である。 図7は、生成装置による生成処理手順を示すフローチャートである。 図8は、生成装置による判定処理手順を示すフローチャートである。 図9は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る生成装置、生成方法及び生成プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る生成装置、生成方法及び生成プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.生成処理〕
まず、図1を用いて、実施形態に係る生成処理の一例について説明する。図1は、実施形態に係る生成装置による生成処理の一例を示す説明図である。図1の例では、生成装置100によって入力データを入力した場合に入力データの分類に対応するノードを出力する学習器を生成する生成処理が行われる例を示す。
生成装置100は、入力データを入力した場合に所定のノードを出力する学習器を生成するサーバ装置である。具体的には、生成装置100は、入力データとして画像を入力した場合に画像に描出された被写体が属する分類に対応するノードを出力するDNN(Deep Neural Network)を学習器として生成する。この点について図1を用いて詳細に説明する。
学習器Leは、入力データに対する演算結果を出力する複数のノード(例えば、ニューロン)を接続したDNNであって入力データが属する分類に対応するノードを出力するDNNである。具体的には、学習器Leは、入力データとして被写体が描出された画像が入力された場合に、被写体が属する分類に対応するノードを出力する。
図1の例では、学習器Leは、入力層と、多段のノード群によって形成される中間層と、出力層OLとから構成される。ここで、出力層OLは、例えば、「具体物」が描出された画像が入力された場合に所定の値(例えば、値「1」)を出力し、「具体物」が描出されていない画像が入力された場合に所定の値の出力を行わないノードNを有する。すなわち、出力層OLは、所定の被写体が描出された画像が入力された場合に、所定の値の出力を行うノードを有する。他の例では、出力層OLは、「人工物」が描出された画像が入力された場合に所定の値を出力するノードN11を有する。また、他の例では、出力層OLは、「PC製品」が描出された画像が入力された場合に所定の値を出力するノードN112を有する。また、他の例では、出力層OLは、「ディスプレイ」が描出された画像が入力された場合に所定の値を出力するノードN1122を有する。
生成装置100は、まず、入力データとして階層構造を有する分類を示す言語データ(例えば、物体名称のシソーラス)と言語データが示す分類に属する被写体が描出された画像とを受け付ける(ステップS1)。例えば、生成装置100は、言語データとしてインターネットオークションなどに出品される商品が属するカテゴリの階層構造と商品が描出された画像とを同時に受け付ける。図1の一例では、生成装置100は、入力データID1として「具体物、人工物、PC製品、デスクトップPC」を示す言語データW1と「デスクトップPC」が描出された画像P1とを同時に受け付ける。他の一例では、生成装置100は、入力データID2として「具体物、人工物、PC製品、ディスプレイ」を示す言語データW2と「ディスプレイ」が描出された画像P2とを同時に受け付ける。
続いて、生成装置100は、受け付けられた言語データおよび画像に基づいて、画像を入力した場合に言語データが示す階層構造を有する分類に対応するノードを出力する学習器を生成する(ステップS2)。具体的には、図1の一例では、生成装置100は、入力データID1として「具体物、人工物、PC製品、デスクトップPC」を示す言語データW1と「デスクトップPC」が描出された画像P1とを同時に受け付けた場合に、画像P1に対して言語データW1が示す階層構造を有する分類に対応するノードが出力を行う学習器Leを生成する。例えば、生成装置100は、図1に示すように、画像P1に対してノードNと、ノードN11と、ノードN112とノードN1121とが出力を行う学習器Leを生成する。なお、図1では、ノードNと、ノードN11と、ノードN112とノードN1121とが出力を行う状態を状態OD1と記載した。
図1の他の例では、生成装置100は、入力データID2として「具体物、人工物、PC製品、ディスプレイ」を示す言語データW2と「ディスプレイ」が描出された画像P2とを同時に受け付けた場合に、画像P2に対して言語データW2が示す階層構造を有する分類に対応するノードを出力する学習器Leを生成する。例えば、生成装置100は、図1に示すように、画像P1に対してノードNと、ノードN11と、ノードN112とノードN1122とが出力を行う学習器Leを生成する。なお、図1では、ノードNと、ノードN11と、ノードN112とノードN1122とが出力を行う状態を状態OD2と記載した。
この点について図2を用いて説明する。図2は、出力層のノードが有する階層構造の概念の一例を示す図である。図2に示す出力層は、図1に示す出力層OLに含まれる各ノードが有する階層関係に対応する。なお、図2に示す階層関係は、各ノードが出力を行う階層関係を概念的に示すものであり、出力層OLに含まれる各ノードが、図2に例示する接続関係や構成を有するわけではない。例えば、出力層OLは、図2に示すように、ノードN、ノードN、・・・、ノードN11、ノードN12、・・・、ノードN111、ノードN112、・・・、ノードN1121、ノードN1122・・・といった出力の階層関係を持つ出力ノードを有する。
生成装置100は、図2に示すように、入力データとして受け付けた言語データが示す階層構造を有する分類と画像とを対応付けて学習する学習器を生成する。具体的には、生成装置100は、バックプロパゲーション法や教師有り学習法といった各種の方法によって、階層構造を有する分類と画像との共起性を学習した学習器を生成する。例えば、生成装置100は、画像P1が入力された場合にノードNと、ノードN11と、ノードN112とノードN1121とが所定の値を出力するようにノード間の結合係数を算出する。そして、生成装置100は、算出した結合係数をノード間に設定することで学習器Leを生成する。
また、生成装置100は、例えば、図2に示すように、実行処理の結果(例えば、学習器Leの出力結果)としてウェブページWC1を配信する。一例としては、生成装置100は、オークションサイトの利用者が使用するユーザ端末にウェブページWC1を配信する。ウェブページWC1は、ユーザ端末に送信されるオークションサイトのウェブページの一例である。ウェブページWC1は、コンテンツWC2と、説明文W3と、説明文W4とを有する。なお、ウェブページWC1は、オークションサイトに限らない。例えば、ウェブページWC1は、任意のコンテンツを階層形式で分類し、商品等が属する分類を階層形式で表示するショッピングサイトや価格比較サイト等といった各種のサイトであってもよい。
コンテンツWC2は、階層関係を示すコンテンツである。ウェブページWC1に示すオークションサイトの利用者は、コンテンツWC2に含まれる情報の入力や選択等を行うことで、階層関係に基づいた商品の検索や絞込みを行うことができる。
例えば、生成装置100は、画像P3や画像P4を受け付け、受け付けた画像P3や画像P4を学習器Leに入力する。これにより、学習器Leは、「具体物>人工物>PC製品>デスクトップPC」といった階層関係を示す情報を出力する。そして、生成装置100は、画像P3や画像P4に描出された商品を「具体物>人工物>PC製品>デスクトップPC」といった階層に分類する。
これにより、生成装置100は、出品者がコンテンツWC2に示す階層情報を入力せずとも、出品対象の商品が属する階層を画像から自動で特定することができる。このため、生成装置100は、出品対象の商品をオークションサイトに登録する際の手間を軽減することができる。
なお、生成装置100は、出品対象の商品を登録するとともに入力された他の情報を用いて、階層情報の学習を行うDNNを生成してもよい。例えば、生成装置100は、画像P3に描出された商品に係る階層関係と、画像P3と、画像P3とともに入力される説明文W3とを学習用データとして使用し、DNNの学習を行う。これにより、生成装置100は、商品が描出された画像と説明文とを入力した場合に商品が属する階層関係を出力する学習器を生成する。例えば、生成装置100は、画像P4と説明文W4とをDNNに入力する入力データとして使用することで、画像P4に係る商品の階層関係を特定する。すなわち、生成装置100は、学習用データとして、画像および説明文の組と、階層関係を示す情報との共起性を学習した学習器を生成してもよい。
このように、実施形態に係る生成装置100は、入力データとして階層構造を有する分類を示す言語データと言語データが示す分類に属する被写体が描出された画像とを受け付ける。また、生成装置100は、受け付けられた言語データおよび画像に基づいて、画像を入力した場合に言語データが示す階層構造を有する分類に対応するノードが出力を行う学習器を生成する。
これにより、生成装置100は、入力データに対して入力データが属する適切な分類を出力する学習器を生成することができるので、適切なラベルを付けることができる。例えば、生成装置100は、被写体が描出された画像が入力された場合に画像に描出された被写体が属する分類に対応するノードが所定の値を出力する学習器を生成することができる。このため、生成装置100は、例えば、インターネットオークションにおいて出品者が新規に出品する商品が描出された画像を受け付けた場合に商品が属するカテゴリに対応するノードが所定の値を出力する学習器を生成することができる。
また、生成装置100は、例えば、インターネットオークションで出品する商品に対して適切なラベルを付けることができるので、不適切なラベルが付いた商品を減らすことができる。このため、生成装置100は、出品者やオークションの利用者の利便性を向上させることができる。
また、生成装置100は、商品の画像を学習器に入力するだけで商品に対して適切なラベルを付けることができるので、出品者がラベルを検討する手間を減らすことができる。このため、生成装置100は、出品者の出品作業における利便性を向上させることができる。
〔2.出品システムの構成〕
図3を用いて、実施形態に係る出品システムの構成について説明する。図3は、実施形態に係る出品システムによる出品処理の一例を示す説明図である。図3に示すように、出品システム1には、端末装置10と、サーバ装置50と、生成装置100とが含まれる。端末装置10、サーバ装置50および生成装置100は、ネットワークを介して、有線又は無線により通信可能に接続される。なお、図3に示した出品システム1には、複数台の端末装置10や、複数台のサーバ装置50や、複数台の生成装置100が含まれてもよい。
端末装置10は、例えば、デスクトップ型PCや、ノート型PCや、タブレット型端末や、スマートフォンや、携帯電話機や、PDA(Personal Digital Assistant)等の情報処理装置である。例えば、端末装置10は、オークションに商品を出品する利用者によって利用される。端末装置10は、利用者によって用意された画像をサーバ装置50に送信する。例えば、端末装置10は、表示部に表示中のウェブページである出品画面に対して所定の操作(例えば、クリック操作)を受け付けた場合に、利用者が出品する商品が描出された画像CPをサーバ装置50に送信する。
サーバ装置50は、各種ウェブページを端末装置10に提供するサーバ装置である。具体的には、サーバ装置50は、ネットオークションに関するウェブページを提供する。例えば、サーバ装置50は、消費者が閲覧するネットオークションサイトや商品を出品する利用者が閲覧する管理画面(例えば、出品画面)を提供する。なお、サーバ装置50は、ネットオークションサイトのウェブページに限らず、技術解説サイト、検索エンジンサイト、ショッピングサイト、ニュースサイト、ファイナンスサイト(株価サイト)等といった各種のウェブページも提供してもよい。
生成装置100は、学習器Leを用いて商品が属する分類を判定するサーバ装置である。具体的には、生成装置100は、まず、入力データとして商品が描出された画像を学習器Leに入力する。そして、生成装置100は、入力データに対する出力に基づいて商品が属する分類を判定する。
次に、図3を用いて、出品システム1による出品処理について説明する。まず、端末装置10は、例えば、利用者がオークションサイトに出品する商品C1が描出された画像CPをサーバ装置50に送信する(ステップS21)。
続いて、サーバ装置50は、端末装置10から送信された画像CPを生成装置100に送信する(ステップS22)。これにより、生成装置100は、商品C1が描出された画像CPを取得する。
そして、生成装置100は、画像CPに描出された商品C1が属する分類を判定する(ステップS23)。具体的には、生成装置100は、入力データとして画像CPを学習器Leに入力し、入力データに対する出力に基づいて商品C1が属する分類を判定する。
その後、生成装置100は、判定した商品C1が属する分類をサーバ装置50に通知する(ステップS24)。例えば、生成装置100は、画像CPに描出された商品C1が属する分類を「具体物、人工物、PC製品、ディスプレイ」と判定した場合には、「具体物、人工物、PC製品、ディスプレイ」という分類をサーバ装置50に通知する。
そして、サーバ装置50は、生成装置100から通知された分類に基づいて商品C1のラベル付けを実行する(ステップS25)。例えば、サーバ装置50は、「具体物、人工物、PC製品、ディスプレイ」という分類が通知された場合には、商品C1のカテゴリを「具体物、人工物、PC製品、ディスプレイ」に設定する。これにより、サーバ装置50は、商品C1のラベルを適切に設定してオークションに出品することができる。
〔3.生成装置の構成〕
次に、図4を用いて、実施形態に係る生成装置100の構成について説明する。図4は、実施形態に係る生成装置100の構成例を示す図である。図4に示すように、生成装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、生成装置100は、生成装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
(通信部110について)
通信部110は、例えば、NIC等によって実現される。通信部110は、ネットワークと有線又は無線で接続され、ネットワークを介して、各種のサーバ装置や端末装置との間で情報の送受信を行う。
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、階層情報記憶部121と、学習器情報記憶部122とを有する。
(階層情報記憶部121について)
階層情報記憶部121は、階層構造を有する分類に関する情報を記憶する。具体的には、階層情報記憶部121は、分類間の階層関係や包括関係を記憶する。例えば、階層情報記憶部121は、物体名称のシソーラスを記憶する。ここで、図5に、実施形態に係る階層情報記憶部121の一例を示す。図5に示すように、階層情報記憶部121は、「第1層」、「第2層」、「第3層」・・・といった項目を有する。
「第1層」は、最上位の分類を示す。「第2層」は、「第1層」の下位に位置する分類を示す。すなわち、「第2層」は、「第1層」に包含される分類を示す。「第3層」は、「第2層」の下位に位置する分類を示す。すなわち、「第3層」は、「第1層」および「第2層」に包含される分類を示す。
すなわち、図5では、最上位の分類である「第1層」の分類は、「具体物」および「抽象物」である例を示している。また、図5では、「人工物」は、「具体物」の下位に位置する分類である例を示している。すなわち、「人工物」の分類は、「具体物」の分類に包含される例を示している。
(学習器情報記憶部122について)
学習器情報記憶部122は、学習器(例えば、DNN)に関する情報を記憶する。具体的には、学習器情報記憶部122は、DNNに含まれる入力層、中間層および出力層のノードや、ノード間の結合係数に関する情報を記憶する。例えば、学習器情報記憶部122は、図1に示す学習器Leを記憶する。
(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、生成装置100内部の記憶装置に記憶されている各種プログラム(生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
制御部130は、図4に示すように、受付部131と、生成部132と、判定部133とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図4に示した構成に限られず、後述する生成処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図4に示した接続関係に限られず、他の接続関係であってもよい。
(受付部131について)
受付部131は、入力データを受け付ける。具体的には、受付部131は、学習器の学習を行う際には、入力データとして階層構造を有する分類を示す言語データと言語データが示す分類に属する被写体が描出された画像とを受け付ける。例えば、受付部131は、言語データとして物体名称のシソーラスを受け付ける。また、受付部131は、被写体が描出された画像として商品が描出された画像とを受け付ける。また、受付部131は、被写体の分類を判定する際には、入力データとして被写体が描出された新規画像を受け付ける。
また、受付部131は、階層構造を有する分類をサーバ装置50から受け付ける。例えば、受付部131は、サーバ装置50が運営するオークションサイトにおける商品のカテゴリの階層構造を受け付ける。そして、受付部131は、受け付けた階層構造を有する分類を階層情報記憶部121に格納する。
(生成部132について)
生成部132は、学習器(例えば、DNN)を生成する。具体的には、生成部132は、受付部131によって受け付けられた言語データおよび画像に基づいて、画像を入力した場合に言語データが示す階層構造を有する分類に対応するノードを出力する学習器を生成する。一例としては、生成部132は、バックプロパゲーション法や教師あり学習によりDNNに含まれるニューロンの間の結合係数を算出する。
例えば、生成部132は、受付部131によって言語データ「具体物、人工物、PC製品、デスクトップPC」と「デスクトップPC」が描出された画像とを受け付けた場合には、「具体物」、「人工物」、「PC製品」および「デスクトップPC」に対応するノードが所定の値を出力するようにノード間の結合係数を算出する。そして、生成部132は、算出した結合係数をノード間に設定することで学習器を生成する。これにより、生成部132は、被写体が描出された画像が受け付けられた場合に、被写体が属する分類を出力する学習器を生成することができる。そして、生成部132は、生成した学習器を学習器情報記憶部122に格納する。
なお、生成部132は、例えば、受付部131によって言語データ「デスクトップPC」と「デスクトップPC」が描出された画像とを受け付けた場合には、階層情報記憶部121から「デスクトップPC」の階層構造を取得し、「具体物」、「人工物」、「PC製品」および「デスクトップPC」に対応するノードが出力する学習器を生成する。
(判定部133について)
判定部133は、受付部131によって受け付けられた判定対象(例えば、新規画像)の分類を判定する。具体的には、判定部133は、生成部132によって生成された学習器に対して新規画像を入力した場合に所定の値を出力するノードに基づいて新規画像に描出された被写体が属する分類を判定する。例えば、判定部133は、受付部131によって受け付けられた新規画像に対して生成部132によって生成された学習器が「具体物」、「人工物」、「PC製品」および「ディスプレイ」に対応するノードが所定の値を出力した場合には、新規画像に描出された被写体が属する分類を「具体物」、「人工物」、「PC製品」および「ディスプレイ」と判定する。
判定処理について図6を用いて説明する。図6は、実施形態に係る生成装置による判定処理を説明するための説明図である。例えば、受付部131は、図6に示すように、入力データID21として、PC商品のうちディスプレイに属する商品C1が描出された画像CPを受け付ける(ステップS31)。
そして、判定部133は、生成部132によって生成された学習器に対して画像CPを入力した場合に所定の値を出力するノードに基づいて画像CPに描出された商品C1が属する分類を判定する(ステップS32)。例えば、判定部133は、学習器Leによって出力データOD22としてノードNと、ノードN11と、ノードN112とノードN1122とが所定の値を出力した場合(状態OD22となる場合)には、商品C1の分類を「具体物」、「人工物」、「PC製品」および「ディスプレイ」と判定する。
〔4.生成処理手順〕
次に、図7を用いて、実施形態に係る生成装置100による生成処理の手順について説明する。図7は、実施形態に係る生成装置100による生成処理手順を示すフローチャートである。
図7に示すように、生成装置100は、入力データとして言語データと画像とを受け付ける(ステップS101)。そして、生成装置100は、入力データとして言語データと画像とを受け付けていない場合には(ステップS101;No)、入力データとして言語データと画像とを受け付けるまで待機する。
一方、生成装置100は、入力データとして言語データと画像とを受け付けた場合(ステップS101;Yes)、受け付けた入力データを学習器に入力する(ステップS102)。例えば、生成装置100は、入力データとして物体名称のシソーラスと物体が描出された画像とを学習器に入力する。
その後、生成装置100は、受け付けられた言語データおよび画像に基づいて、画像を入力した場合に言語データが示す階層構造を有する分類に対応するノードが所定の値を出力する学習器を生成する。具体的には、生成装置100は、入力データである画像に対して言語データに対応するノードが所定の値を出力するようにノード間の結合係数を算出する。例えば、生成装置100は、バックプロパゲーション法により結合係数を算出する(ステップS103)。
そして、生成装置100は、学習器を生成する(ステップS104)。例えば、生成装置100は、算出した結合係数をノード間に設定することで、画像に対して言語データに対応するノードを出力する学習器を生成する。
〔5.判定処理手順〕
次に、図8を用いて、実施形態に係る生成装置100による判定処理の手順について説明する。図8は、実施形態に係る生成装置100による判定処理手順を示すフローチャートである。
図8に示すように、生成装置100は、入力データとして新規画像を受け付ける(ステップS201)。そして、生成装置100は、入力データとして新規画像を受け付けていない場合には(ステップS201;No)、入力データとして新規画像を受け付けるまで待機する。
一方、生成装置100は、入力データとして新規画像を受け付けた場合(ステップS201;Yes)、受け付けた入力データである新規画像を学習器に入力する(ステップS202)。例えば、生成装置100は、利用者がオークションに出品する商品が描出された画像を入力データとして学習器に入力する。
その後、生成装置100は、新規画像に描出された被写体が属する分類を判定する(ステップS203)。具体的には、生成装置100は、生成された学習器に対して新規画像を入力した場合に所定の値を出力したノードに基づいて新規画像に描出された被写体が属する分類を判定する。例えば、生成装置100は、学習器が「具体物」、「人工物」、「PC製品」および「ディスプレイ」に対応するノードが所定の値を出力した場合には、新規画像に描出された商品が属する分類を「具体物」、「人工物」、「PC製品」および「ディスプレイ」と判定する。
そして、生成装置100は、判定した分類をサーバ装置50に通知する(ステップS204)。そして、サーバ装置50は、生成装置100によって判定された分類に基づいて商品のラベル付けを実行する。これにより、サーバ装置50は、商品に適切なラベルを付けてオークションサイトに出品することができる。
〔6.変形例〕
上述した実施形態に係る生成装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、上記の生成装置100の他の実施形態について説明する。
〔6−1.学習器(1)〕
上記実施形態では、生成装置100は、受け付けられた言語データおよび画像に基づいて画像を入力した場合に言語データが示す階層構造を有する分類に対応するノードが所定の値を出力する学習器Leを生成する例を示した。
ここで、生成装置100は、各種の形態の学習器を生成してもよい。具体的には、生成装置100は、出力層に含まれる各ノードが異なる分類を示すノードである学習器を生成する。例えば、生成装置100は、出力層に含まれる各ノードが「デスクトップPC」や「ディスプレイ」といったそれぞれ異なる分類、階層を示すノードである学習器を生成する。
このように、生成装置100は、学習器として出力層に含まれる各ノードが異なる分類を示すノードである学習器を生成する。これにより、生成装置100は、入力データに対応する分類を出力することができるので、入力データの分類を判定することができる。
〔6−2.学習器(2)〕
上記実施形態では、生成装置100は、受け付けられた言語データおよび画像に基づいて画像を入力した場合に言語データが示す階層構造を有する分類に対応するノードが所定の値を出力する学習器Leを生成する例を示した。
ここで、生成装置100は、階層構造の中で上位に属する分類に対応する上位ノードを出力した場合に下位に属する分類に対応する下位ノードに関数を伝播させるゲートを有する学習器を生成してもよい。
例えば、生成装置100は、階層構造において下位に位置する分類に対応する下位ノードが出力し、かかる下位ノードを含む上位に位置する分類に対応する上位ノードを出力しない場合も考えられる。そこで、生成装置100は、上位ノードを出力した場合にかかる上位ノードに含まれる下位ノードを出力するゲートを学習器に利用する。例えば、学習器は、上位ノードが出力された場合に、かかる上位ノードの下位に位置する下位ノードの前段に設置されたゲートを開く。他の例では、学習器は、ゲーティングニューロンをノードに組み込むことで上位ノードを出力した場合に下位ノードに関数を伝達してもよい。
このように、生成装置100は、学習器として、階層構造の中で上位に属する分類に対応する上位ノードを出力した場合に下位に属する分類に対応する下位ノードに関数を伝播させるゲートを有する学習器を生成する。これにより、生成装置100は、下位ノードとともに下位ノードを含む上位ノードを出力することができるので、階層構造を有する分類を出力することができる。
〔6−3.DNN〕
上記実施形態では、生成装置100は、入力層、中間層および出力層によって構成される学習器を生成する例を示した。ここで、生成装置100は、各種の層に任意の数のノード群を含む学習器を生成してもよい。例えば、生成装置100は、中間層に複数のノード群が含まれる多段の学習器を生成する。また、学習器に含まれるノード群は、任意の数のノードによって構成されてもよい。
〔6−4.適用対象〕
上記実施形態では、生成装置100は、ネットオークションに出品する商品の分類を判定する画像認識の適用例を示した。ここで、生成装置100は、商品の分類に限らず、各種の認識に適用してもよい。例えば、生成装置100は、音声を対象とする音声認識に適用する。一例としては、生成装置100は、入力データとして階層構造を示す言語データと音声データとを入力することで話者の分類を学習する学習器を生成する。これにより、生成装置100は、音声データに含まれる音声を発した話者の性別や年齢、国籍などといった分類を判定することができる。
また、上記実施形態では、生成装置100は、階層関係を学習した学習器を生成する例を示した。ここで、生成装置100は、階層関係に限らず、内包関係、同義関係、類語関係といった各種の関係を学習した学習器を生成してもよい。また、生成装置100は、物体に限らず、現象や状態等のシソーラスを学習した学習器を生成してもよい。これにより、生成装置100は、バリエーションに富んだ判定をすることができる。
〔6−5.装置構成〕
上記実施形態では、生成装置100は、サーバ装置50と一体となって構成されてもよい。この場合、生成装置100は、学習器によって判定した分類に基づいて商品のラベル付けを行う。また、生成装置100は、分類を判定する判定処理は行わず、生成部132による生成処理のみを行う生成装置であってもよい。この場合、生成装置は、少なくとも判定部133を有しない。そして、判定部133を有する判定装置が、生成装置100によって生成された学習器を用いて分類を判定し、判定した分類をサーバ装置50等に配信する。
〔6−6.その他〕
上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、図4に示した受付部131および生成部132は統合されてもよい。
〔6−7.ハードウェア構成〕
また、上述してきた実施形態に係る生成装置100は、例えば図9に示すような構成のコンピュータ1000によって実現される。以下、生成装置100を例に挙げて説明する。図9は、生成装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、およびメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、および、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、通信網500を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを通信網500を介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る生成装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。
〔7.効果〕
上述してきたように、実施形態に係る生成装置100は、受付部131と、生成部132とを有する。受付部131は、入力データとして階層構造を有する分類を示す言語データと言語データが示す分類に属する被写体が描出された画像とを受け付ける。生成部132は、受付部131によって受け付けられた言語データおよび画像に基づいて、画像を入力した場合に言語データが示す階層構造を有する分類に対応するノードを出力する学習器を生成する。
また、実施形態に係る生成装置100において、判定部133は、生成部132によって生成された学習器に対して新規画像を入力した場合に所定の値を出力するノードに基づいて新規画像に描出された被写体が属する分類を判定する。
これにより、実施形態に係る生成装置100は、入力データに対して入力データが属する適切な分類を出力する学習器を生成することができるので、適切なラベルを付けることができる。例えば、生成装置100は、被写体が描出された画像が入力された場合に画像に描出された被写体が属する分類に対応するノードを出力する学習器を生成することができる。このため、生成装置100は、例えば、インターネットオークションにおいて出品者が新規に出品する商品が描出された画像を受け付けた場合に商品が属するカテゴリに対応するノードを出力する学習器を生成することができる。
また、生成装置100は、例えば、インターネットオークションで出品する商品に対して適切なラベルを付けることができるので、不適切なラベルが付いた商品を減らすことができる。このため、生成装置100は、出品者やオークションの利用者の利便性を向上させることができる。
また、生成装置100は、商品の画像を学習器に入力するだけで商品に対して適切なラベルを付けることができるので、出品者がラベルを検討する手間を減らすことができる。このため、生成装置100は、出品者の出品作業における利便性を向上させることができる。
また、変形例に係る生成装置100において、生成部132は、学習器として出力層に含まれる各ノードが異なる分類を示すノードである学習器を生成する。
これにより、変形例に係る生成装置100は、入力データに対応する分類を出力することができるので、入力データの分類を判定することができる。
また、変形例に係る生成装置100において、生成部132は、学習器として、階層構造の中で上位に属する分類に対応する上位ノードを出力した場合に下位に属する分類に対応する下位ノードに関数を伝播させるゲートを有する学習器を生成する。
これにより、変形例に係る生成装置100は、下位ノードとともに下位ノードを含む上位ノードを出力することができるので、階層構造を有する分類を出力することができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
10 端末装置
50 サーバ装置
100 生成装置
121 階層情報記憶部
122 学習器情報記憶部
131 受付部
132 生成部
133 判定部

Claims (5)

  1. 入力データとして階層構造を有する分類を示す言語データと当該言語データが示す分類に属する被写体が描出された画像とを受け付ける受付部と、
    前記受付部によって受け付けられた前記言語データおよび前記画像に基づいて、前記画像を入力した場合に前記言語データが示す階層構造を有する分類に対応するノードが所定の値を出力する学習器であって、階層構造の中で上位に属する分類に対応する上位ノードが前記所定の値を出力した場合に、当該分類の下位に属する分類に対応する下位ノードに関数を伝播させるゲートを有する学習器を生成する生成部と
    を備えたことを特徴とする生成装置。
  2. 前記生成部によって生成された学習器に対して新規画像を入力した場合に前記所定の値を出力するノードに基づいて当該新規画像に描出された被写体が属する分類を判定する判定部
    をさらに備えることを特徴とする請求項1に記載の生成装置。
  3. 前記生成部は、
    前記学習器として出力層に含まれる各ノードが異なる分類を示すノードである学習器を生成する
    ことを特徴とする請求項1または2に記載の生成装置。
  4. 生成装置が実行する生成方法であって、
    入力データとして階層構造を有する分類を示す言語データと当該言語データが示す分類に属する被写体が描出された画像とを受け付ける受付工程と、
    前記受付工程によって受け付けられた前記言語データおよび前記画像に基づいて、前記画像を入力した場合に前記言語データが示す階層構造を有する分類に対応するノードが所定の値を出力する学習器であって、階層構造の中で上位に属する分類に対応する上位ノードが前記所定の値を出力した場合に、当該分類の下位に属する分類に対応する下位ノードに関数を伝播させるゲートを有する学習器を生成する生成工程と
    を含んだことを特徴とする生成方法。
  5. 入力データとして階層構造を有する分類を示す言語データと当該言語データが示す分類に属する被写体が描出された画像とを受け付ける受付手順と、
    前記受付手順によって受け付けられた前記言語データおよび前記画像に基づいて、前記画像を入力した場合に前記言語データが示す階層構造を有する分類に対応するノードが所定の値を出力する学習器であって、階層構造の中で上位に属する分類に対応する上位ノードが前記所定の値を出力した場合に、当該分類の下位に属する分類に対応する下位ノードに関数を伝播させるゲートを有する学習器を生成する生成手順と
    をコンピュータに実行させることを特徴とする生成プログラム。
JP2014126555A 2014-06-19 2014-06-19 生成装置、生成方法及び生成プログラム Active JP6043755B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014126555A JP6043755B2 (ja) 2014-06-19 2014-06-19 生成装置、生成方法及び生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014126555A JP6043755B2 (ja) 2014-06-19 2014-06-19 生成装置、生成方法及び生成プログラム

Publications (2)

Publication Number Publication Date
JP2016004550A JP2016004550A (ja) 2016-01-12
JP6043755B2 true JP6043755B2 (ja) 2016-12-14

Family

ID=55223747

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014126555A Active JP6043755B2 (ja) 2014-06-19 2014-06-19 生成装置、生成方法及び生成プログラム

Country Status (1)

Country Link
JP (1) JP6043755B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10706327B2 (en) * 2016-08-03 2020-07-07 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium
JP7082239B1 (ja) * 2021-06-09 2022-06-07 京セラ株式会社 認識装置、端末装置、認識器構築装置、認識器修正装置、構築方法、及び修正方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012058926A (ja) * 2010-09-07 2012-03-22 Olympus Corp キーワード付与装置及びプログラム
JP5791909B2 (ja) * 2011-01-26 2015-10-07 オリンパス株式会社 キーワード付与装置

Also Published As

Publication number Publication date
JP2016004550A (ja) 2016-01-12

Similar Documents

Publication Publication Date Title
JP5993897B2 (ja) 特定装置、特定方法及び特定プログラム
US10991012B2 (en) Creative brief-based content creation
CN102693270B (zh) 用于内容管理和组件测试的可发布元数据
JP6344995B2 (ja) 特定装置、特定方法及び特定プログラム
JP6986978B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US10783431B2 (en) Image search using emotions
CN106575289A (zh) 使用数字内容的用户交互
JP6698040B2 (ja) 生成装置、生成方法及び生成プログラム
Prabhu Application of web 2.0 and web 3.0: an overview
KR102446649B1 (ko) 인공지능 모델 기반 추천 템플릿을 이용한 어플리케이션 제작 방법 및 장치
JP2016006593A (ja) 抽出装置、抽出方法及び抽出プログラム
JP5864651B2 (ja) 対話型ネットワークベースの情報オブジェクトの貨幣化のための方法、システム及び媒体
JP2016522486A (ja) 検索クエリに応答するコンテンツアイテムの質を高めるソーシャルネットワーク
US20200387936A1 (en) Smart Campaign with Autopilot Features
JP7231322B2 (ja) 学習装置、学習方法、学習プログラム及びプログラム
JP6043755B2 (ja) 生成装置、生成方法及び生成プログラム
Hussain et al. Mobile marketing in business sustainability: A bibliometric analysis
Li A Study on the Construction of Translation Curriculum System for English Majors from the Perspective of Human‐Computer Interaction
US20230384910A1 (en) Using Attributes for Font Recommendations
JP2018045412A (ja) 生成装置、生成方法、及び生成プログラム
JP6979899B2 (ja) 生成装置、学習装置、生成方法、学習方法、生成プログラム、及び学習プログラム
JP6092160B2 (ja) 表示制御装置、表示制御方法及び表示制御プログラム
JP2017021469A (ja) 分類装置、分類方法、及び分類プログラム
Ripa et al. Generating voice user interfaces from web sites
WO2012109115A2 (en) Idea submission, ranking and incubating system and method

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161018

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161114

R150 Certificate of patent or registration of utility model

Ref document number: 6043755

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250