JP2018101339A - 推定装置、推定方法及び推定プログラム - Google Patents

推定装置、推定方法及び推定プログラム Download PDF

Info

Publication number
JP2018101339A
JP2018101339A JP2016247990A JP2016247990A JP2018101339A JP 2018101339 A JP2018101339 A JP 2018101339A JP 2016247990 A JP2016247990 A JP 2016247990A JP 2016247990 A JP2016247990 A JP 2016247990A JP 2018101339 A JP2018101339 A JP 2018101339A
Authority
JP
Japan
Prior art keywords
product
identification information
estimation
predetermined object
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016247990A
Other languages
English (en)
Other versions
JP7231317B2 (ja
Inventor
諒 五十嵐
Ryo Igarashi
諒 五十嵐
翔太郎 南
Shotaro Minami
翔太郎 南
僚太 中山
Ryota Nakayama
僚太 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2016247990A priority Critical patent/JP7231317B2/ja
Publication of JP2018101339A publication Critical patent/JP2018101339A/ja
Application granted granted Critical
Publication of JP7231317B2 publication Critical patent/JP7231317B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】対象物に関する適切な情報をユーザに提供すること。【解決手段】本願に係る推定装置は、取得部と、推定部とを有する。取得部は、対象物を撮像した画像と、当該対象物を識別するための識別情報とを取得する。推定部は、取得部によって取得された画像と識別情報との組合せを学習例として学習されたモデルを用いて、所定の対象物を撮像した画像から、当該所定の対象物に対応する識別情報を推定する。例えば、取得部は、所定の対象物に対応付けられたテキストデータを取得する。推定部は、所定の対象物を撮像した画像と当該所定の対象物に対応付けられたテキストデータとに基づいて、当該所定の対象物に対応する識別情報を推定する。【選択図】図1

Description

本発明は、推定装置、推定方法及び推定プログラムに関する。
近年、インターネットの飛躍的な普及に伴い、ネットワークを介したショッピングサービスやオークションサービス等の提供等が盛んに行われている。このようなサービスでは、例えば商品を出品する出品者が、各商品の紹介ページにタイトルを付与したり、各商品の画像データや商品の説明文をネットワーク上にアップロードしたりすることにより、商品に関するデータベースが構築される。
ここで、画像データに関する技術として、画像データに基づいて類似の画像データを含むページデータを抽出するとともに、抽出したページデータに広告データを追加してユーザに送信する技術が知られている。
特開2008−96759号公報
しかしながら、上記の従来技術では、対象物に関する適切な情報をユーザに提供できるとは限らない。具体的には、上記の従来技術は、画像データにマッチした広告を配信するためのものであり、ショッピングサービス等で適切な商品情報をユーザに提供するために応用できるとは限らない。すなわち、ネットワーク上のサービスにおいて出品者が商品の画像データをアップロードしたとしても、その情報のみでは、ユーザが望むような商品情報を構築し、ユーザに提供できるとは限らない。
本願は、上記に鑑みてなされたものであって、対象物に関する適切な情報をユーザに提供することのできる推定装置、推定方法及び推定プログラムを提供することを目的とする。
本願に係る推定装置は、対象物を撮像した画像と、当該対象物を識別するための識別情報とを取得する取得部と、前記取得部によって取得された画像と識別情報との組合せを学習例として学習されたモデルを用いて、所定の対象物を撮像した画像から、当該所定の対象物に対応する識別情報を推定する推定部と、を備えたことを特徴とする。
実施形態の一態様によれば、対象物に関する適切な情報をユーザに提供することができるという効果を奏する。
図1は、実施形態に係る推定処理の一例を示す図である。 図2は、実施形態に係る推定処理システムの構成例を示す図である。 図3は、実施形態に係る推定装置の構成例を示す図である。 図4は、実施形態に係る学習情報記憶部の一例を示す図である。 図5は、実施形態に係る出品情報記憶部の一例を示す図である。 図6は、実施形態に係る商品情報記憶部の一例を示す図である。 図7は、実施形態に係る処理手順を示すフローチャート(1)である。 図8は、実施形態に係る処理手順を示すフローチャート(2)である。 図9は、実施形態に係る処理手順を示すフローチャート(3)である。 図10は、推定装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る推定装置、推定方法及び推定プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る推定装置、推定方法及び推定プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.推定処理の一例〕
まず、図1を用いて、実施形態に係る推定処理の一例について説明する。図1は、実施形態に係る推定処理の一例を示す図である。図1では、本願に係る推定装置100によって、電子商取引における商材を識別する識別情報の推定処理が行われる例を示す。具体的には、図1では、推定装置100が、複数の出品者が各々の取り扱う商品を出品する電子商取引サイトにおける、各商品を識別するための識別情報を推定する処理を行う一例を示す。
図1に示す推定装置100は、電子商取引における商材として出品された商品の識別情報を推定するためのモデル(学習器)を生成し、生成したモデルを用いて推定処理を行う。
上述のように、電子商取引サイトでは、複数の出品者が各々の取り扱う商品を出品する。例えば、電子商取引サイトは、複数の出品者が各々の店舗を有するような、ショッピングモールを模したショッピングサイトでもよいし、複数の出品者が任意に商品を出品するオークションサイトでもよい。このような電子商取引サイトでは、通常、出品者によって商品のタイトルや説明文が作成され、商品に付与される。そして、出品者は、商品のタイトルや説明文とともに、商品を撮像した画像データをアップロードする。電子商取引サイト側は、出品者からアップロードされた情報に基づいて商品の購買ページ等を生成する。電子商取引サイトを利用するユーザは、電子商取引サイトにアクセスし、購買ページに掲載されたタイトルや説明文を参照して、購買を行う。また、ユーザが商品を検索する場合には、出品者に付与されたタイトルや説明文に含まれる単語と、ユーザが入力したクエリとの一致等を判定することにより、ユーザが所望する商品が検索される。
ここで、このような商取引サイトでは、商品に付与する情報の作成が出品者に委ねられているため、適切な商品情報がユーザに提供されるとは限らないといった問題がある。すなわち、出品者が任意に商品のタイトルや説明文を付与したとしても、それらの情報が正確な情報とは限らない。また、タイトルや説明文には、いわゆるSEO対策(Search Engine Optimization)が施されることにより、商品とは直接的に関係のない単語等が埋め込まれる場合がある。
このような状況への対応として、商品に対応する識別情報を商品ページに掲載するという手法が考えられる。例えば、メーカーによって製造された商品には、流通のために識別情報が付与される場合がある。識別情報の一例として、国家や公共性の高い団体等により付与される事業者コードや、「どの事業者が作成したどの商品か」を識別することができる商品コード(例えば、日本ではJANコード(Japanese Article Number)が知られている)がある。
このように、商品の識別情報が特定できれば、ユーザは、商品の名称や製造元を知ることができる。また、識別情報には、一般的に、メーカーから提供される商品の詳細な情報や製造年月日などが対応付けられたデータベースが存在する。このため、商取引サイト側は、商品の識別情報が特定できれば、データベースから当該商品の商品情報を引用することで、適切な商品情報を付与することができる。
しかしながら、上述のように、商品を出品する出品者は任意に商品のタイトルや説明文を付与するため、識別情報が付与される可能性は低い。また、商取引サイト側が、出品者に識別情報の付与を義務付けるということも可能であるが、大量の商品を出品する事業者等にとっては、一つ一つの商品に識別情報を付与することは作業負担が大きい。このため、事業者が、当該商取引サイトへの出品を躊躇する可能性も生じる。この場合、商取引サイト側は、大口の出品者を失うことになるため、商取引サイトの運営にとって望ましくない。また、商取引サイト側が、出品された全ての商品に対して人為的に識別情報を付与するということも、出品数が膨大である場合には現実的ではない。
そこで、実施形態に係る推定装置100は、以下の手法により、商品の識別情報を推定し、商品に識別情報を付与する。かかる処理によって、推定装置100は、出品者や商取引サイト側に負担を掛けることなく、商品に識別情報を付与することができる。これにより、推定装置100は、ユーザに適切な商品情報を提供することができる。以下、図1を用いて、推定装置100によって行われる推定処理の一例を流れに沿って説明する。
図1に示すように、推定装置100は、推定処理を行うための学習を行う(学習フェーズ)ために、推定処理に用いる学習データを取得する(ステップS11)。
まず、推定装置100は、処理対象とする商品の画像を取得する。具体的には、推定装置100は、処理対象とする商品がテレビ50である場合には、同一商品(テレビ50)を被写体とする複数の画像を取得する。例えば、推定装置100は、既知の手法を用いてネットワーク上をクロール(crawl)することにより、テレビ50を被写体とする複数の画像を集積する。図1の例では、推定装置100は、画像P01や、画像P02や、画像P03を取得する。なお、画像P01、画像P02及び画像P03は、全てテレビ50を被写体とする画像である。
続けて、推定装置100は、テレビ50に対応付けられている識別情報を取得する。実施形態において、識別情報は、例えば12桁の英数字によって構成されるコードであるものとする。例えば、テレビ50の識別情報L01は、「XXXX-XXXX-XXXX」と表されるものとする。なお、推定装置100は、例えば商品の流通を管理する国家や団体等が備えたデータベースから識別情報を取得する。
そして、推定装置100は、画像と識別情報とを組み合わせとした学習例を学習する(ステップS12)。具体的には、推定装置100は、テレビ50を撮像した画像とテレビ50の識別情報L01との組み合わせを学習データとして、所定のモデル(学習器)を生成する。
推定装置100は、例えば、ディープラーニング(Deep Learning)の手法を用いてモデルを生成する。すなわち、推定装置100は、ディープラーニングの手法を用いて、所定の対象物(商品)が撮像された画像が入力された場合に、当該対象物の識別情報を出力するモデルを生成する。
ここで、推定装置100が用いるモデルについて簡単に説明する。推定装置100が用いるモデルは、例えば、入力されたデータに対する演算結果を出力する複数のノードを多層に接続したモデルであって、画像データが含む画像の特徴を学習するためのモデルである。例えば、モデルは、複数のノードを有する層を多段に接続したニューラルネットワークであり、いわゆるディープラーニングの技術により実現されるDNN(Deep Neural Network)である。
ここで、画像の特徴とは、画像に含まれる文字の有無、色、構成等、画像内に現れる具体的な特徴のみならず、撮像されている物体が何であるか、画像がどのような利用者に好かれるか、画像の雰囲気等、抽象化(メタ化)された画像の特徴をも含む概念である。
例えば、モデルは、ディープラーニングの技術により、以下のような学習手法により生成される。モデルには、各ノードの間の接続係数が初期化され、様々な特徴を有する画像が入力される。そして、モデルは、モデルにおける出力と、入力との誤差が少なくなるようにパラメータ(接続係数)を補正するバックプロパゲーション(Backpropagation(誤差逆伝播法))等の処理により生成される。例えば、モデルは、ある対象物が撮像された画像が入力された際に、その画像に撮像されている対象物の識別情報を出力するように、学習が行われていればよい。なお、モデルの出力は、識別情報そのものを出力するように学習が行われてもよいし、入力された画像に撮像された対象物または対象物の識別情報と対応するノードが所定の値を出力するように学習が行われてもよい。また、例えば、モデルは、誤差関数等、所定の損失(ロス)関数を最小化するようにバックプロパゲーション等の処理を行うことにより生成される。
なお、モデルの学習手法については、上述した手法に限定されるものではなく、任意の公知技術が適用可能である。また、モデルの学習を行う際に用いられる情報は、画像及びその画像に含まれる対象等の種々の画像のデータセットを利用してもよい。モデルの学習を行う際に用いられる情報は、対象が1つ含まれる画像及び対象が1つであることを示す情報のセットや、対象が複数(例えば2つ)含まれる画像及び対象が複数(例えば2つ)であることを示す情報のセットや、対象が含まれない画像及び対象が含まれない(0である)ことを示す情報のセット等を利用してもよい。また、モデルに対する画像の入力方法、モデルが出力するデータの形式、モデルに対して明示的に学習させる特徴の内容等は、任意の手法が適用できる。すなわち、推定装置100は、画像から抽象化された特徴を示す特徴量を算出できるのであれば、任意のモデルを用いることができる。
また、図1では、推定装置100は、入力画像の局所領域の畳み込みとプーリング(pooling)とを繰り返す、いわゆるCNN(Convolutional Neural Network(畳み込みニューラルネットワーク))を用いるモデルを生成してもよい。例えば、CNNによるモデルは、画像から特徴を抽出して出力する機能に加え、画像内に含まれる文字や撮像対象等の位置的変異に対し、出力の不変性を有する。このため、モデルは、画像の抽象化された特徴を精度良く算出することができる。
すなわち、推定装置100は、上記のような手法によって生成されたモデルを用いることで、所定の対象物が撮像された画像が入力された場合に、当該対象物を精度よく推定することができる。具体的には、推定装置100は、まず、所定の対象物が撮像された画像が入力された場合に、当該対象物が「テレビ50」であるか否かを推定する。そして、推定装置100は、当該対象物が「テレビ50」であると推定した場合には、「テレビ50」に対応付けられている「識別情報L01」を参照する。これにより、推定装置100は、「所定の対象物が撮像された画像」に基づいて、当該所定の対象物に対応する「識別情報」を推定することができる。
推定装置100は、例えば、モデルの学習において学習データとして用いることのできる画像(例えば、対象物が写っている画像であって、当該対象物の正解が判明している画像)をネットワーク上から取得し、学習を繰り返す。これにより、推定装置100は、所定の対象物が入力された場合に、当該対象物がどの商品であるか、また、当該商品に対応付けられている識別情報は何か、といった情報を出力することができるようになる。なお、推定装置100は、商品の名称等を介さずに、対象物と識別情報とを直接対応付けて学習し、画像から直接識別情報を推定するようにしてもよい。そして、推定装置100は、生成したモデルを所定の記憶部に格納する。上記が、実施形態に係る推定処理の学習フェーズである。
その後、推定装置100は、出品者が商品を出品しようとする際に、出品者から送信される画像に基づいて、商品の識別情報を推定する処理を行う(推定フェーズ)。
例えば、商取引サイトにおいて、新たに商品を出品しようとする出品者は、出品者端末20を介して、商品画像をアップロードする(ステップS21)。推定装置100は、出品者からアップロードされた商品画像を取得する。
そして、推定装置100は、アップロードされた画像から識別情報を推定する(ステップS22)。例えば、推定装置100は、アップロードされた画像に写っている対象物の特徴情報に基づいて、当該対象物を推定する。さらに、推定装置100は、推定した対象物に対応付けられている識別情報を推定する。
図1の例では、出品者は、テレビ50を撮像した画像P04をアップロードしたものとする。この場合、推定装置100は、画像P04に基づいて、テレビ50の識別情報L01を推定する。そして、推定装置100は、出品者が商品に付与したタイトルや説明文に加えて、推定した識別情報L01を含む商品ページを生成する(ステップS23)。例えば、図1に示すように、画像P04を含む商品ページには、「code:XXXX-XXXX-XXXX」といった識別情報L01が含まれる。なお、推定装置100は、「code:XXXX-XXXX-XXXX」といった識別情報L01の具体的な英数字を含むように商品ページを生成するのではなく、識別情報L01に基づいて取得される商品情報を含むように商品ページを生成してもよい。例えば、推定装置100は、「code:XXXX-XXXX-XXXX」といった具体的な英数字ではなく、識別情報L01に基づいて検索された、テレビ50の製造元や、製造年月日や、商品スペックや、商品の定価等を含むように商品ページを生成してもよい。
このように、実施形態に係る推定装置100は、対象物を撮像した画像データと、当該対象物を識別するための識別情報とを取得する。そして、推定装置100は、取得された画像データと識別情報との組合せを学習例として学習されたモデルを用いて、識別情報が特定されていない所定の対象物を撮像した画像データから、当該所定の対象物に対応する識別情報を推定する。
すなわち、推定装置100によれば、出品者が画像データをアップした時点で、当該画像データに写った対象物(商品)を推定するとともに、さらに、対象物の識別情報を推定することができる。このように、推定装置100は、出品者や商取引サイトを運営する運営者などの人為的な処理を要せずに商品と識別情報とを対応付けることができるため、商品に関するデータベースを効率良く構築することができる。また、推定装置100は、出品者によって識別情報が付与されていない商品について、新たに識別情報を付与することができるため、商取引サイトにおけるデータベースの欠損を補うことができる。
さらに、推定装置100によって商品に関するデータベースが構築されることによって、各商品の正確な情報をユーザに提供することができる商品ページが生成される。また、商品を一意で示すことのできる識別情報が各商品ページに付与されることで、ユーザが行う検索の精度を向上させることができる。結果として、推定装置100は、商取引サイト等において、適切な商品情報をユーザに提供することができる。
なお、推定装置100は、画像による推定処理を補完するため、種々の情報を用いてもよい。例えば、上記で説明した推定フェーズにおいて、推定装置100は、商品に対応付けられた説明文を利用してもよい。すなわち、推定装置100は、画像認識において、類似する外観を有するテレビ50とテレビ51(図1での図示は省略する)とを混同して推定するおそれがある。なお、テレビ50と、テレビ51は、同じメーカーによって製造されたテレビであり、画面サイズのみが異なるものであるとする。
この場合、推定装置100は、画像P04とともに出品者端末20からアップロードされたタイトルや説明文を参照する。例えば、推定装置100は、タイトルや説明文のテキストデータを形態素解析することにより、画像P04に撮像された商品を説明した単語を抽出する。例えば、推定装置100は、商品ページのタイトルとして「新製品:テレビ50」というテキストデータから、「テレビ50」を抽出したとする。この場合、推定装置100は、画像P04の被写体は、テレビ51よりもテレビ50である確率が高いと判定し、テレビ50に対応する識別情報を推定する。
また例えば、推定装置100は、「40インチ」といった、商品のサイズを示していると想定される単語を抽出する。ここで、推定装置100は、上述した商品と識別情報とが対応付けられたデータベースを参照し、テレビ50が「40インチ」であり、テレビ51が「32インチ」であるという情報を抽出する。
すなわち、推定装置100は、画像P04に撮像された商品がテレビ50もしくはテレビ51であるということを推定し、さらに、商品の説明文から、商品のサイズが「40インチ」であると推定する。かかる情報に基づいて、推定装置100は、画像P04に撮像された商品が、テレビ51である可能性よりもテレビ50である可能性が高いと判定する。これにより、推定装置100は、画像P04の被写体はテレビ50であるため、テレビ50に対応する識別情報を推定する。このように、推定装置100は、推定処理にあたり、画像のみならず、種々の情報を利用してもよい。
以下、このような処理を行う推定装置100、及び、推定装置100を含む推定処理システム1の構成等について、詳細に説明する。
〔2.推定処理システムの構成〕
次に、図2を用いて、実施形態に係る推定装置100が含まれる推定処理システム1の構成について説明する。図2は、実施形態に係る推定処理システム1の構成例を示す図である。図2に例示するように、実施形態に係る推定処理システム1には、ユーザ端末10と、出品者端末20と、推定装置100とが含まれる。これらの各種装置は、ネットワークNを介して、有線又は無線により通信可能に接続される。なお、図2に示した推定処理システム1には、複数台のユーザ端末10や、複数台の出品者端末20が含まれてもよい。
ユーザ端末10は、例えば、スマートフォンや、デスクトップ型PC(Personal Computer)や、ノート型PCや、タブレット型端末や、携帯電話機、PDA(Personal Digital Assistant)、ウェアラブルデバイス(Wearable Device)等の情報処理装置である。ユーザ端末10は、ユーザによる操作に従って商取引サイトにアクセスし、商取引サイトにおいてユーザが情報を閲覧したり、商品を購入したりするための処理を行う。
出品者端末20は、商取引サイトにおいて商品を出品する出品者によって利用される情報処理端末である。出品者端末20は、例えば、スマートフォンや、デスクトップ型PCや、ノート型PCや、タブレット型端末や、携帯電話機、PDA、ウェアラブルデバイス等の情報処理装置である。
出品者端末20は、出品者による操作に従って、商取引サイトに商品を出品するための種々の処理を実行する。例えば、出品者端末20は、商品の画像データを、商取引サイトを提供するサーバ(実施形態では推定装置100)にアップロードする。また、出品者端末20は、商品のタイトルや説明文等のテキストデータを、商取引サイトを提供するサーバにアップロードする。
推定装置100は、対象物を撮像した画像データと識別情報との組合せを学習例として学習されたモデルを用いて、識別情報が特定されていない所定の対象物を撮像した画像データから、所定の対象物に対応する識別情報を推定するサーバ装置である。
また、実施形態において、推定装置100は、商品に対応する識別情報を推定した場合には、識別情報に基づいて、商品に対応付けられた商品情報を取得する。そして、推定装置100は、商品情報を含む商品ページを生成し、生成した商品ページをユーザ端末10に提供する。このように、実施形態に係る推定装置100は、商取引サイトを提供したり、生成した商品ページを提供したりするような、ウェブサーバとしての構成を兼ねるものとする。なお、実際には、推定処理システム1において、推定装置100とウェブサーバとは、別個の装置として構成されていてもよい。
〔3.推定装置の構成〕
次に、図3を用いて、実施形態に係る推定装置100の構成について説明する。図3は、実施形態に係る推定装置100の構成例を示す図である。図3に示すように、推定装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、推定装置100は、推定装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。かかる通信部110は、ネットワークNと有線又は無線で接続され、ネットワークNを介して、ユーザ端末10や、出品者端末20との間で情報の送受信を行う。
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、学習情報記憶部121と、出品情報記憶部122と、商品情報記憶部123とを有する。
(学習情報記憶部121について)
学習情報記憶部121は、推定処理に用いるためのモデルを生成するための学習に関する情報を記憶する。ここで、図4に、実施形態に係る学習情報記憶部121の一例を示す。図4は、実施形態に係る学習情報記憶部121の一例を示す図である。図4に示した例では、学習情報記憶部121は、「学習データID」、「正例」、「学習データ」といった項目を有する。また、「正例」は、「商品」、「識別情報」といった小項目を有する。
「学習データID」は、学習データを識別するための識別情報を示す。なお、以下の説明では、各データに対応する識別情報を参照符号で示す場合がある。例えば、学習データIDが「A01」である学習データを「学習データA01」と表記する場合がある。
「正例」は、学習における正例を示す。「商品」は、正例における商品名を示す。「識別情報」は、商品に対応付けられた識別情報を示す。「学習データ」は、学習に用いられたデータを示す。例えば、「学習データ」は、正例となる商品を撮像した複数の画像データである。なお、上記ディープラーニングの手法を用いる場合には、学習は、必ずしも正例(正解データ)が明確に判明している学習データのみを用いることを要しない。例えば、推定装置100は、画像の特徴を抽出し、当該画像に撮像されている対象物を認識できる学習が行えるのであれば、必ずしも正例のみならず、種々の画像を学習してもよい。
すなわち、図4に示したデータの一例は、学習データID「A01」によって識別される学習データの正例は、商品が「テレビ50」であり、識別情報が「XXXX-XXXX-XXXX」であることを示している。また、学習データA01において用いられた学習データは、「画像P01」や、「画像P02」や、「画像P03」であることを示している。
なお、学習情報記憶部121には、上記学習データに基づいて学習されたモデル自体が記憶されてもよい。また、推定装置100は、学習情報記憶部121に記憶された学習データを適宜更新するとともに、生成したモデルの学習を継続してもよい。
(出品情報記憶部122について)
出品情報記憶部122は、出品者からアップロードされる出品物(商品)に関する情報を記憶する。ここで、図5に、実施形態に係る出品情報記憶部122の一例を示す。図5は、実施形態に係る出品情報記憶部122の一例を示す図である。図5に示した例では、出品情報記憶部122は、「出品者ID」、「出品ID」、「商品」、「識別情報」、「画像」、「説明文」といった項目を有する。
「出品者ID」は、出品者又は出品者端末20を識別するための識別情報を示す。「出品ID」は、出品物を識別するための識別情報を示す。「商品」は、出品物の内容(名称)を示す。「識別情報」は、商品に対応付けられた識別情報を示す。なお、出品者が識別情報をアップロードしていない場合には、「識別情報」の項目は空欄となる(図5では、「なし」と表記する)。「画像」は、出品者端末20からアップロードされた画像を示す。「説明文」は、出品者が商品の紹介のために、商品ページに掲載する説明文としてアップロードしたテキストデータを示す。
すなわち、図5に示したデータの一例は、出品者ID「20」で識別される出品者が、出品ID「B01」で識別される出品を行ったことを示している。また、出品B01における商品は「テレビ50」であり、識別情報は出品者端末20からはアップロードされていないことを示している。また、出品B01においてアップロードされた画像は、「画像P04」であり、説明文は、「40インチのテレビが大安売り!・・・」であることを示している。
(商品情報記憶部123について)
商品情報記憶部123は、商取引サイトにおいて、ユーザに提供される商品ページに関する情報を記憶する。ここで、図6に、実施形態に係る商品情報記憶部123の一例を示す。図6は、実施形態に係る商品情報記憶部123の一例を示す図である。図6に示した例では、商品情報記憶部123は、「商品ページID」、「出品ID」、「商品」、「識別情報」、「画像」、「説明文」、「反応情報」、「レビュー情報」といった項目を有する。
「商品ページID」は、商品ページを識別するための識別情報を示す。「出品ID」、「商品」、「識別情報」、「画像」、「説明文」は、図5に示した各々同一の項目に対応する。なお、図5に示した例と異なり、商品情報記憶部123では、「識別情報」について、推定装置100によって推定された識別情報によって項目が埋められている場合がある。この場合、「識別情報」の項目に記憶された識別情報には、その識別情報が推定処理によって推定されたものであるか、あるいは、出品者によってアップロードされたものであるかを区別する情報が与えられていてもよい。
「反応情報」は、商品ページに対するユーザの反応に関する情報を示す。「レビュー情報」は、商品ページもしくは商品ページに掲載された商品に対するユーザからのレビューに関する情報を示す。なお、図6では、反応情報やレビュー情報を「E01」や「G01」といった概念で示しているが、実際には、種々の情報が記憶される。
例えば、反応情報には、当該商品ページにおいてコンバージョン(Conversion)に至ったユーザの数や率が記憶されてもよい。コンバージョンの例としては、商品を購入したことや、商品の紹介ページ(製造メーカーのウェブページ)にアクセスしたこと等が挙げられる。また、反応情報には、例えば、購入に至らなくても、商品がユーザから選択(クリックやタッチ)された数もしくは率等が記憶されてもよい。また、反応情報には、ユーザが商品ページにアクセスした数や、商品ページに滞在した時間等が記憶されてもよい。すなわち、反応情報には、商品ページもしくは商品に対するユーザの反応に関する情報であれば、いずれの情報が記憶されてもよい。
また、レビュー情報には、商品ページに対するユーザレビューに関する情報が記憶される。例えば、商品ページにおいて、ユーザが5段階の数値で商品を評価するようなシステムが採用されている場合、レビュー情報には、ユーザから評価された点数が記憶される。例えば、レビュー情報には、ユーザから送信される「0」から「5」までの数値の平均値が記憶される。また、レビュー情報には、ユーザレビューがユーザから送信された数や率、あるいは、具体的なユーザレビューのコメント(テキストデータ)等が記憶されてもよい。すなわち、反応情報には、商品ページもしくは商品に対するユーザレビューに関する情報であれば、いずれの情報が記憶されてもよい。
すなわち、図6に示したデータの一例は、商品ページID「C01」で識別される商品ページC01は、出品ID「B01」で識別される出品に対応するものであり、商品ページC01では、商品として「テレビ50」を扱っていることを示している。また、商品ページC01には、識別情報として「XXXX-XXXX-XXXX」が付与されており、画像は「画像P04」が掲載されており、説明文として「40インチのテレビが大安売り!・・・」が付与されていることを示している。また、商品ページC01に対するユーザからの反応情報は「E01」であり、レビュー情報は「G01」であることを示している。
(制御部130について)
制御部130は、例えば、コントローラ(controller)であり、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、推定装置100内部の記憶装置に記憶されている各種プログラム(推定プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、コントローラであり、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図3に示すように、制御部130は、取得部131と、生成部132と、受付部133と、推定部134と、格納部135と、受信部136と、提供部137とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。
(取得部131について)
取得部131は、各種情報を取得する。例えば、取得部131は、対象物を撮像した画像と、当該対象物を識別するための識別情報とを取得する。具体的には、取得部131は、電子商取引における商材として出品された商品を撮像した画像を取得する。また、取得部131は、当該商品に対応付けられた識別情報(例えば、JANコード等)を取得する。
また、取得部131は、所定の対象物に対応付けられたテキストデータを取得する。例えば、取得部131は、所定の対象物に対応付けられたテキストデータとして、所定の対象物の属性を示す単語を取得する。より具体的には、取得部131は、所定の対象物の属性を示す単語として、当該所定の対象物の大きさ、重さ、製造年月日、発売年月日、又はメーカー名の少なくともいずれか一つを示す単語を取得する。
例えば、取得部131は、テキストデータとして、商品のタイトル、もしくは、当該商品に対応付けられたドキュメントであって、当該商品を説明するためのドキュメントである説明文を構成するテキストデータを取得する。例えば、取得部131は、商品がテレビであって、画像のみでは商品を特定することが難しい場合には、タイトルや説明文を形態素解析して、商品を特定付けるための情報となりうる単語を抽出する。具体的には、取得部131は、商品の画面サイズや商品自体の大きさ、商品の重さ、製造年月日、発売年月日、又はメーカー名等の情報を示す単語を取得する。この場合、後述する推定部134は、画像から得られた情報と、単語から得られた情報とに基づいて、画像に撮像された商品を推定する。
なお、取得部131は、タイトルや説明文を形態素解析した場合に、ドキュメント(ここでは、タイトルや説明文)に含まれる単語(語句)の出現数等に基づいて、単語の出現頻度や、複数の説明文における各単語の重要度を算出してもよい。例えば、取得部131は、取得した説明文に関する単語のDF値を算出してもよい。また、取得部131は、DF値に限らず、tf−idf(Term Frequency−Inverse Document Frequency)等の指標値を取得してもよい。
また、取得部131は、実際に商品ページが提供されたユーザから、当該商品ページに対する反応に関する情報を取得してもよい。例えば、取得部131は、商品ページもしくは商品に対するユーザの反応として、商品がユーザから選択された数もしくは率、又は、商品に関するコンバージョンの数もしくは率の少なくともいずれか一つを取得してもよい。また、取得部131は、ユーザから送信されるレビューに関する情報を取得してもよい。そして、後述する生成部132は、取得部131によって取得されたユーザの反応に関する情報に基づいて、生成したモデルを適宜チューニングしてもよい。
また、取得部131は、後述する推定部134によって識別情報が推定された場合、すなわち、商品に対応する識別情報が判明した場合、当該識別情報に基づいて商品情報を取得してもよい。例えば、取得部131は、識別情報と対応付けられて商品情報が保持される外部データベース等にアクセスする。そして、取得部131は、識別情報と対応付けられた商品情報を取得する。例えば、取得部131は、商品情報として、商品の製造元や、製造年月日や、商品スペックや、商品の定価等を取得する。
取得部131は、取得した情報を記憶部120の各部に適宜格納する。また、取得部131は、処理に用いる情報を記憶部120の各部から適宜取得する。
(生成部132について)
生成部132は、推定部134による推定処理に用いられるモデル(学習器)を生成する。例えば、生成部132は、上述のように、ディープラーニングの手法を利用してモデルを生成する。具体的には、生成部132は、取得部131によって取得された画像と識別情報との組合せを学習例(正例)として学習されたモデルを生成する。
なお、生成部132が生成するモデルは、ディープラーニングの手法を利用したものでなくてもよい。すなわち、生成部132は、画像に撮像された対象物を認識し、当該対象物を推定するための学習モデルであれば、任意の手法を用いて学習を行い、モデルを生成してもよい。例えば、生成部132は、既知のパターン認識等の種々の手法を用いてモデルを生成してもよい。
(受付部133について)
受付部133は、電子商取引における出品に関する情報を出品者端末20から受け付ける。例えば、受付部133は、出品者が出品しようとする商品を撮像した画像を受け付ける。また、受付部133は、商品に付与されるタイトルや説明文等のテキストデータを受け付ける。
受付部133は、出品を受け付けた場合には、出品ごとに出品IDを付与し、出品情報記憶部122に情報を格納する。
(推定部134について)
推定部134は、取得部131によって取得された画像と識別情報との組合せを学習例として学習されたモデルを用いて、識別情報が特定されていない所定の対象物を撮像した画像から、当該所定の対象物に対応する識別情報を推定する。すなわち、推定部134は、生成部132によって生成されたモデルを用いて識別情報を推定する。
具体的には、推定部134は、電子商取引における商材として出品された商品を撮像した画像から、当該商品に対応する識別情報を推定する。
例えば、推定部134は、出品者端末20から画像がアップロードされたことを契機として、当該出品における商品に識別情報が付与されているか否かを判定する。そして、推定部134は、商品に識別情報が付与されていない場合、アップロードされた画像をモデルに入力し、画像に撮像された商品に対応した識別情報を出力させる。
推定部134は、画像に撮像された商品に対応した識別情報が出力された場合には、出力された識別情報を、当該商品に対応する識別情報と推定する。なお、推定部134は、画像に撮像された商品に対応した識別情報が出力されない場合には、推定処理を保留する。この場合、推定部134は、例えば推定装置100の管理者(すなわち、商取引サイトの管理者)に対してアラートを送信してもよい。また、推定部134が推定できなかった画像に対して正解データが人為的に入力された場合には、生成部132は、かかる情報を正解データとして、さらにモデルの学習を行ってもよい。
また、推定部134は、所定の対象物を撮像した画像と当該所定の対象物に対応付けられたテキストデータとに基づいて、当該所定の対象物に対応する識別情報を推定してもよい。例えば、推定部134は、所定の対象物を撮像した画像と当該所定の対象物の属性を示す単語とに基づいて、当該所定の対象物に対応する識別情報を推定する。具体的には、推定部134は、所定の対象物を撮像した画像と、当該所定の対象物の属性を示す単語として、当該所定の対象物の大きさ、重さ、製造年月日、発売年月日、又はメーカー名の少なくともいずれか一つを示す単語とに基づいて、当該所定の対象物に対応する識別情報を推定してもよい。
すなわち、推定部134は、画像認識によって識別情報を推定する処理において、補完的にテキストデータを用いて対象物を推定するようにしてもよい。具体的には、推定部134は、商品を撮像した画像と、当該商品のタイトルもしくは説明文(ドキュメント)を構成するテキストデータとに基づいて、当該商品の識別情報を推定する。
また、推定部134は、ユーザに実際に提供された商品ページもしくは商品に対するユーザの反応に基づいて、商品に対応付けられた識別情報の正否を推定してもよい。
具体例として、商品がコンバージョンされる場合を説明する。商品ページにおいて、商品情報が誤っている場合、ユーザは、当該商品を購入することを躊躇うと想定される。一方、商品がユーザから購入された(コンバージョンされた)場合、識別情報に基づいて商品に付与された商品情報が正しかったと想定される。
そこで、推定部134は、このようなユーザの反応に基づいて、商品に対応付けられた識別情報の正否を推定する。例えば、推定部134は、予め所定の閾値を設定する。例えば、推定部134は、ある商品に関するコンバージョン率の閾値を設定する。そして、推定部134は、所定期間内や、一定数の閲覧の間に、閾値を超えるコンバージョン率を達成したか否かを判定する。
推定部134は、コンバージョン率が閾値を超えていた場合、当該商品に対応付けた識別情報が正解であったものとして、当該商品の画像と、識別情報とを正解データの1つとして、生成部132や学習情報記憶部121にフィードバックする。また、推定部134は、コンバージョン率が閾値を超えなかった場合、当該商品に対応付けた識別情報が不正解であったものとして、当該商品の画像と、識別情報とを負例の1つとして、生成部132や学習情報記憶部121にフィードバックする。このように、ユーザの反応を利用して学習を継続することで、推定部134は、推定の精度を向上させることができる。
また、推定部134は、さらに異なる手法を用いて学習を継続してもよい。例えば、推定部134が推定した識別情報が誤っていた場合、商品ページには、誤った商品情報が付与されることとなる。この場合、商品ページを閲覧したユーザは、商品情報が誤っているため評価を低く判定したり、「商品情報が間違っている」といったレビューを送信したりすることが想定される。また、商品情報が不正確な場合、ユーザからの評価を示す指標値に影響を与えることが想定される。例えば、商品に対する選択(ユーザからのクリックやタッチ、もしくは、購買を行おうとしてカートにいれるアクションなど)の数や率、当該商品に関するコンバージョンの数もしくは率の少なくともいずれかが、通常の商品よりも相対的に低くなるおそれがある。
推定部134は、このようにユーザの反応やユーザレビューに何らかの変化が生じた場合には、かかる変化を契機として、推定した識別情報の正否を判定する。例えば、推定部134は、ユーザレビューに含まれる単語の傾向に基づいて、推定した識別情報の正否を判定する。具体的には、推定部134は、「商品情報が間違っている」といったネガティブな単語を含むレビューが相対的に増加した場合には、推定した識別情報が誤っていたとして、その商品と識別情報とを負例として生成部132にフィードバックしてもよい。
(格納部135について)
格納部135は、所定の対象物と、推定部134によって推定された所定の対象物に対応する識別情報とを対応付けて商品情報記憶部123に格納する。すなわち、格納部135は、商取引サイトにおける商品情報のデータベースを構築する。
また、格納部135は、推定部134によって推定された所定の対象物に対応する識別情報に基づいて、取得部131によって当該所定の対象物に対応する商品情報が取得された場合には、当該商品情報を対応付けて商品情報記憶部123に格納する。
(受信部136について)
受信部136は、各種要求を受信する。例えば、受信部136は、商取引サイトにアクセスしたユーザ端末10から、商品ページの取得要求を受信する。また、受信部136は、商取引サイトにアクセスしたユーザ端末10から、商品を検索するための検索クエリを受信する。受信部136は、受信した各種要求を提供部137等に送る。
(提供部137について)
提供部137は、各種情報を提供する。例えば、提供部137は、受信部136によって商品ページの取得要求が受信された場合には、当該商品ページをユーザ端末10に提供(送信)する。また、提供部137は、受信部136によって商品を検索するための検索クエリが受信された場合には、検索クエリに対応する検索結果をユーザ端末10に提供する。
すなわち、提供部137は、商品ページや検索結果を提供することで、推定部134によって推定された識別情報が対応付けられた商品であって、識別情報に基づいて商品情報が設定された商品に関する購買機会をユーザに提供する。
〔4.処理手順〕
次に、図7、図8及び図9を用いて、実施形態に係る推定装置100による処理の手順について説明する。まず、図7を用いて、モデルの生成に関する処理手順を説明する。図7は、実施形態に係る処理手順を示すフローチャート(1)である。
図7に示すように、推定装置100は、モデル生成のための正例を取得する(ステップS101)。例えば、推定装置100は、商品と、当該商品に対応付けられる正解データである識別情報とを正例として取得する。
続いて、推定装置100は、学習を行うための画像を取得する(ステップS102)。例えば、推定装置100は、ネットワーク上をクロールし、正例に対応する商品が撮像された画像を相当数取得する。
そして、推定装置100は、取得した情報に基づいてモデルを生成する(ステップS103)。推定装置100は、生成したモデルを記憶部120に記憶する(ステップS104)。上記の流れにより、推定装置100による学習フェーズは終了する。
次に、図8を用いて、モデルを用いた推定処理に関する処理手順を説明する。図8は、実施形態に係る処理手順を示すフローチャート(2)である。
図8に示すように、推定装置100は、出品者端末20からアップロードされる出品物の画像を受け付けたか否かを判定する(ステップS201)。推定装置100は、画像を受け付けていない場合(ステップS201;No)、受け付けるまで待機する。
一方、画像を受け付けた場合(ステップS201;Yes)、推定装置100は、受け付けた画像をモデルに入力する(ステップS202)。そして、推定装置100は、モデルから識別情報が出力されたか否かを判定する(ステップS203)。
推定装置100は、識別情報が出力された場合(ステップS203;Yes)、画像と、出力された識別情報とを対応付けて記憶部120に格納する(ステップS204)。一方、識別情報が出力されない場合(ステップS203;No)、推定装置100は、一旦、推定処理を保留する(ステップS205)。上記の流れにより、推定装置100による推定フェーズは終了する。
次に、図9を用いて、推定処理に関するフィードバックの手順を説明する。図9は、実施形態に係る処理手順を示すフローチャート(3)である。
図9に示すように、推定装置100は、商品ページに対する反応をユーザ端末10から受け付けたか否かを判定する(ステップS301)。推定装置100は、反応を受け付けていない場合(ステップS301;No)、受け付けるまで待機する。
一方、反応を受け付けた場合(ステップS301;Yes)、推定装置100は、ユーザからの反応を取得する(ステップS302)。そして、推定装置100は、ユーザからの反応が所定の閾値を超えたか否かを判定する(ステップS303)。
推定装置100は、ユーザからの反応が所定の閾値を超えていた場合(ステップS303;Yes)、当該商品に対して推定した識別情報が正解であったと判定する(ステップS304)。一方、推定装置100は、ユーザからの反応が所定の閾値を超えていない場合(ステップS303;No)、当該商品に対して推定した識別情報が不正解であったと判定する(ステップS305)。
そして、推定装置100は、ステップS304及びステップS305で得られたデータを正例もしくは負例とした学習データを得ることで、モデルを更新する(ステップS306)。言い換えれば、推定装置100は、ユーザの反応に基づいて、モデルをさらに強化的に学習する。上記の流れを繰り返すことにより、推定装置100は、モデルの最適化を図る。
〔5.変形例〕
上述した推定装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、推定装置100の他の実施形態について説明する。
〔5−1.活用例〕
上記実施形態では、推定装置100が商品の識別情報を推定することによって、商取引サイトを利用するユーザに適切な情報を提供する例を示した。ここで、推定装置100は、商品の識別情報を推定することにより、商取引サイト全体を整理する処理等を行ってもよい。
上記のように、商取引サイトでは、複数の出品者が任意に商品を出品する。この場合、複数の出品者から同じ商品が出品される場合もある。推定装置100は、これらの商品の画像に基づいて、商品の識別情報を推定する。そして、推定装置100は、商品ページに識別情報を付与する。これにより、推定装置100は、商取引サイトを管理するデータベース上において、互いに異なる複数の出品者から同じ商品が出品されているというデータを参照することができる。
この場合、例えば、推定装置100は、同じ商品が出品されていることを、当該商品を出品している複数の出品者に通知してもよい。これにより、推定装置100は、同じ商品が大量に重複されて出品することを防止することができる。また、推定装置100は、同じ商品が複数出品されている場合に、他の出品者に比べて極めて高い値段や低い値段で出品している出品者に対して、秩序ある商取引を乱す可能性があるとして警告を通知するなどしてもよい。
このように、推定装置100は、画像に基づいて識別情報を推定することにより、大量に出品される商品を精度よく推定できるため、上記のように、商取引サイトの運営に関する種々の処理を行うことができる。
〔5−2.レコメンドに対する反応〕
上記実施形態では、商品ページや商品に対するユーザの反応に基づいて、モデルへのフィードバックを行う例を示した。ここで、推定装置100は、商品ページに限らず、ユーザに対して商品の購買機会が提供された場合のユーザの反応を取得するようにしてもよい。
例えば、商取引サイトに出品されている商品は、当該商品以外の商品ページにレコメンドとして表示される場合がある。この場合であっても、レコメンドにおいて表示される情報は、識別情報に基づいて表示される。
そして、推定装置100は、当該商品のレコメンドがクリックされたか、あるいは、ユーザがコンバージョンに至ったかという情報を取得する。例えば、レコメンドとして表示された商品の情報が誤っていた場合、ユーザは、クリックしたりコンバージョンしたりする反応を返さないものと想定される。一方、ユーザがクリックしたりコンバージョンしたりする反応を返した場合、当該レコメンドとして表示された情報は、商品の特徴を示す情報が正解であったと想定される。
そして、推定装置100は、上記実施形態で説明したように、レコメンドに対する反応に応じて、識別情報の推定処理の正否を判定してもよい。これにより、推定装置100は、商品ページに対応する商品以外の商品に対しても、モデルによる学習を強化することができる。
〔5−3.識別情報〕
実施形態では、推定装置100が推定する識別情報は、例えばJANコード等の流通に用いられるコードを例として示した。ここで、識別情報は、任意の情報であってもよい。例えば、推定装置100は、識別情報として、商取引サイトが独自に設定した識別子を推定してもよい。
また、識別情報は、英数字等で構成されるコードであることを要しない。例えば、識別情報は、バーコード等の2次元コードでもよい。
〔5−4.法則性〕
実施形態では、推定装置100は、識別情報そのものを正例として学習する例を示した。ここで、識別情報が何らかの法則性を有する場合、推定装置100は、法則性を含めて学習を行ってもよい。
例えば、12桁の英数字で構成される識別情報が、何らかの法則性を有しているものとする。例えば、識別情報が、はじめの4桁が製造者を示し、次の4桁が製造年月日を示し、次の4桁が商品カテゴリを示すなどの法則性を有するものとする。
このような場合、推定装置100は、上記学習処理によって、法則性を学習するようにしてもよい。これにより、推定装置100は、学習において学習データが不足しており、識別情報そのものが出力できない場合であっても、何らかの類似する識別情報を出力できる可能性がある。例えば、推定装置100は、商品の識別情報を一意に推定できなくとも、例えば、当該商品を製造した製造者の情報のみは推定できる可能性がある。このように、推定装置100は、識別情報の法則性を学習することで、より柔軟な処理が可能となる。
〔6.ハードウェア構成〕
上述してきた実施形態に係る推定装置100やユーザ端末10や出品者端末20は、例えば図10に示すような構成のコンピュータ1000によって実現される。以下、推定装置100を例に挙げて説明する。図10は、推定装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300又はHDD1400に記憶されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を記憶する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(図2に示したネットワークNに対応)を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、通信網500を介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に記憶されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る推定装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが記憶される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。
〔7.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、図3に示した取得部131と、受付部133とは統合されてもよい。また、例えば、記憶部120に記憶される情報は、ネットワークNを介して、外部に備えられた所定の記憶装置に記憶されてもよい。
また、上記実施形態では、推定装置100が、例えば、画像を取得する取得処理と、モデルを生成する生成処理と、モデルを用いて推定を行う推定処理とを行う例を示した。しかし、上述した推定装置100は、取得処理を行う取得装置と、生成処理を行う生成装置と、推定処理を行う推定装置とに分離されてもよい。この場合、取得装置は、少なくとも取得部131を有する。生成装置は、少なくとも生成部132を有する。推定装置は、少なくとも推定部134を有する。そして、上記の推定装置100による処理は、取得装置と、生成装置と、推定装置との各装置を有する推定処理システム1によって実現される。
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
〔8.効果〕
上述してきたように、実施形態に係る推定装置100は、取得部131と、推定部134とを有する。取得部131は、対象物を撮像した画像と、当該対象物を識別するための識別情報とを取得する。推定部134は、取得部131によって取得された画像と識別情報との組合せを学習例として学習されたモデルを用いて、所定の対象物を撮像した画像から、当該所定の対象物に対応する識別情報を推定する。
このように、実施形態に係る推定装置100は、所定の対象物を撮像した画像に基づいて所定の対象物に対応する識別情報を推定するので、対象物と識別情報との対応付けを効率化することができる。また、推定装置100は、対象物と識別情報とが対応することにより、対象物を一意に特定できるようになるため、識別情報が対応付けられていない対象物と比較して、対象物に対して正確な情報を得ることができる。これにより、推定装置100は、対象物に関する適切な情報をユーザに提供することができる。
また、取得部131は、所定の対象物に対応付けられたテキストデータを取得する。推定部134は、所定の対象物を撮像した画像と当該所定の対象物に対応付けられたテキストデータとに基づいて、当該所定の対象物に対応する識別情報を推定する。
このように、実施形態に係る推定装置100は、画像のみならず、所定の対象物に対応付けられたテキストデータを利用して推定処理を行ってもよい。これにより、推定装置100は、推定処理の精度を向上させることができる。
また、取得部131は、所定の対象物に対応付けられたテキストデータとして、当該所定の対象物の属性を示す単語を取得する。推定部134は、所定の対象物を撮像した画像と当該所定の対象物の属性を示す単語とに基づいて、当該所定の対象物に対応する識別情報を推定する。
このように、実施形態に係る推定装置100は、対象物の属性を示す単語を取得し、取得した単語を推定処理に用いる。対象物の属性は、当該対象物の特徴を表すものといえるので、推定装置100は、属性を示す単語を処理に用いることで、より推定処理の精度を向上させることができる。
また、取得部131は、所定の対象物の属性を示す単語として、当該所定の対象物の大きさ、重さ、製造年月日、発売年月日、又はメーカー名の少なくともいずれか一つを示す単語を取得する。推定部134は、所定の対象物を撮像した画像と、当該所定の対象物の属性を示す単語として、当該所定の対象物の大きさ、重さ、製造年月日、発売年月日、又はメーカー名の少なくともいずれか一つを示す単語とに基づいて、当該所定の対象物に対応する識別情報を推定する。
このように、実施形態に係る推定装置100は、対象物に具体的な属性情報が対応付けられている場合には、それらの単語を取得して処理に用いる。これにより、推定装置100は、より推定処理の精度を向上させることができる。
また、実施形態に係る推定装置100は、所定の対象物と、推定部134によって推定された所定の対象物に対応する識別情報とを対応付けて記憶部120に格納する格納部135をさらに備える。
このように、実施形態に係る推定装置100は、対象物と推定された識別情報とを対応付けて格納することで、対象物と識別情報とが一意に紐づいたデータベースを構築することができる。これにより、推定装置100は、データベース内での同じ対象物の重複を抽出したり、同じ対象物であって異なる情報が付与されているなどの誤りを抽出したりできるので、データベースをより効率化することができる。また、推定装置100は、識別情報が欠損している場合には、その欠損を補うことができる。
また、取得部131は、電子商取引における商材として出品された商品を撮像した画像を取得する。推定部134は、商品を撮像した画像から、当該商品に対応する識別情報を推定する。
このように、実施形態に係る推定装置100は、商品に対する識別情報を対応付けることができるので、商取引サイト等において、適切な商品情報をユーザに提供することができる。
また、取得部131は、商品のタイトル、もしくは、当該商品に対応付けられたドキュメントであって、当該商品を説明するためのドキュメントを構成するテキストデータを取得する。推定部134は、商品を撮像した画像と、当該商品のタイトルもしくはドキュメントを構成するテキストデータとに基づいて、当該商品の識別情報を推定する。
このように、実施形態に係る推定装置100は、商品のタイトルや説明文等を用いて推定処理を行ってもよい。これにより、推定装置100は、推定処理の精度を向上させることができる。
また、取得部131は、推定部134によって商品に対応する識別情報が推定された場合、当該識別情報に対応付けられた当該商品の商品情報を取得する。
このように、実施形態に係る推定装置100は、識別情報を推定した後に、当該識別情報に対応付けられた当該商品の商品情報を所定のデータベースから取得してもよい。識別情報には、例えば、商品のスペックを示す商品情報が対応付けられている。推定装置100は、このような情報を取得することで、より商品の説明を充実させることができるため、より適切な商品情報をユーザに提供することができる。
また、実施形態に係る推定装置100は、推定部134によって推定された識別情報が対応付けられた商品であって、当該識別情報に基づいて商品情報が設定された商品に関する購買機会をユーザに提供する提供部137をさらに備える。推定部134は、提供部137によって提供された商品に対するユーザの反応に基づいて、当該商品に対応付けられた識別情報の正否を推定する。
このように、実施形態に係る推定装置100は、商品情報を対応付けた上で、商品ページを提供したり、レコメンドを提供したりして、ユーザに購買機会を提供する。すなわち、推定装置100は、適切な商品情報が掲載された状態で商品の購買機会をユーザに提供するので、商取引サイトを利用するユーザのユーザビリティの向上を図ることができる。また、推定装置100は、提供された商品に対するユーザの反応に基づいて、識別情報の正否を推定することで、推定処理に対するフィードバックを得ることができる。
また、取得部131は、商品に対するユーザの反応として、当該商品がユーザから選択された数もしくは率、又は、当該商品に関するコンバージョンの数もしくは率の少なくともいずれか一つを取得する。
このように、実施形態に係る推定装置100は、購買機会が与えられた商品に関して、ユーザの反応を取得してもよい。例えば、推定装置100は、ユーザのコンバージョン等の具体的な数値に基づいて商品に対応付けられた識別情報の正否を推定することで、正確なフィードバックを行うことができる。これにより、推定装置100は、モデルをさらに学習することができるため、より推定処理の精度を向上させることができる。
以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
1 推定処理システム
10 ユーザ端末
20 出品者端末
100 推定装置
110 通信部
120 記憶部
121 学習情報記憶部
122 出品情報記憶部
123 商品情報記憶部
130 制御部
131 取得部
132 生成部
133 受付部
134 推定部
135 格納部
136 受信部
137 提供部

Claims (12)

  1. 対象物を撮像した画像と、当該対象物を識別するための識別情報とを取得する取得部と、
    前記取得部によって取得された画像と識別情報との組合せを学習例として学習されたモデルを用いて、所定の対象物を撮像した画像から、当該所定の対象物に対応する識別情報を推定する推定部と、
    を備えたことを特徴とする推定装置。
  2. 前記取得部は、
    前記所定の対象物に対応付けられたテキストデータを取得し、
    前記推定部は、
    前記所定の対象物を撮像した画像と当該所定の対象物に対応付けられたテキストデータとに基づいて、当該所定の対象物に対応する識別情報を推定する、
    ことを特徴とする請求項1に記載の推定装置。
  3. 前記取得部は、
    前記所定の対象物に対応付けられたテキストデータとして、当該所定の対象物の属性を示す単語を取得し、
    前記推定部は、
    前記所定の対象物を撮像した画像と当該所定の対象物の属性を示す単語とに基づいて、当該所定の対象物に対応する識別情報を推定する、
    ことを特徴とする請求項2に記載の推定装置。
  4. 前記取得部は、
    前記所定の対象物の属性を示す単語として、当該所定の対象物の大きさ、重さ、製造年月日、発売年月日、又はメーカー名の少なくともいずれか一つを示す単語を取得し、
    前記推定部は、
    前記所定の対象物を撮像した画像と、当該所定の対象物の属性を示す単語として、当該所定の対象物の大きさ、重さ、製造年月日、発売年月日、又はメーカー名の少なくともいずれか一つを示す単語とに基づいて、当該所定の対象物に対応する識別情報を推定する、
    ことを特徴とする請求項3に記載の推定装置。
  5. 前記所定の対象物と、前記推定部によって推定された前記所定の対象物に対応する識別情報とを対応付けて記憶部に格納する格納部、
    をさらに備えたことを特徴とする請求項1〜4のいずれか一つに記載の推定装置。
  6. 前記取得部は、
    電子商取引における商材として出品された商品を撮像した画像を取得し、
    前記推定部は、
    前記商品を撮像した画像から、当該商品に対応する識別情報を推定する、
    ことを特徴とする請求項1〜5のいずれか一つに記載の推定装置。
  7. 前記取得部は、
    前記商品のタイトル、もしくは、当該商品に対応付けられたドキュメントであって、当該商品を説明するためのドキュメントを構成するテキストデータを取得し、
    前記推定部は、
    前記商品を撮像した画像と、当該商品のタイトルもしくはドキュメントを構成するテキストデータとに基づいて、当該商品の識別情報を推定する、
    ことを特徴とする請求項6に記載の推定装置。
  8. 前記取得部は、
    前記推定部によって前記商品に対応する識別情報が推定された場合、当該識別情報に対応付けられた当該商品の商品情報を取得する、
    ことを特徴とする請求項7に記載の推定装置。
  9. 前記推定部によって推定された識別情報が対応付けられた商品であって、当該識別情報に基づいて商品情報が設定された商品に関する購買機会をユーザに提供する提供部、
    をさらに備え、
    前記推定部は、
    前記提供部によって提供された商品に対するユーザの反応に基づいて、当該商品に対応付けられた識別情報の正否を推定する、
    ことを特徴とする請求項8に記載の推定装置。
  10. 前記取得部は、
    前記商品に対するユーザの反応として、当該商品がユーザから選択された数もしくは率、又は、当該商品に関するコンバージョンの数もしくは率の少なくともいずれか一つを取得する、
    ことを特徴とする請求項9に記載の推定装置。
  11. コンピュータが実行する推定方法であって、
    対象物を撮像した画像と、当該対象物を識別するための識別情報とを取得する取得工程と、
    前記取得工程によって取得された画像と識別情報との組合せを学習例として学習されたモデルを用いて、所定の対象物を撮像した画像から、当該所定の対象物に対応する識別情報を推定する推定工程と、
    を含んだことを特徴とする推定方法。
  12. 対象物を撮像した画像と、当該対象物を識別するための識別情報とを取得する取得手順と、
    前記取得手順によって取得された画像と識別情報との組合せを学習例として学習されたモデルを用いて、所定の対象物を撮像した画像から、当該所定の対象物に対応する識別情報を推定する推定手順と、
    をコンピュータに実行させることを特徴とする推定プログラム。
JP2016247990A 2016-12-21 2016-12-21 推定装置、推定方法及び推定プログラム Active JP7231317B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016247990A JP7231317B2 (ja) 2016-12-21 2016-12-21 推定装置、推定方法及び推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016247990A JP7231317B2 (ja) 2016-12-21 2016-12-21 推定装置、推定方法及び推定プログラム

Publications (2)

Publication Number Publication Date
JP2018101339A true JP2018101339A (ja) 2018-06-28
JP7231317B2 JP7231317B2 (ja) 2023-03-01

Family

ID=62714379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016247990A Active JP7231317B2 (ja) 2016-12-21 2016-12-21 推定装置、推定方法及び推定プログラム

Country Status (1)

Country Link
JP (1) JP7231317B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6469923B1 (ja) * 2018-07-20 2019-02-13 株式会社メルカリ 情報処理方法、情報処理装置及びプログラム
JP6472151B1 (ja) * 2018-07-25 2019-02-20 株式会社メルカリ 情報処理方法、情報処理装置、およびプログラム
JP2020042688A (ja) * 2018-09-13 2020-03-19 株式会社リクルート 順番管理システム、およびプログラム
JP2020042403A (ja) * 2018-09-07 2020-03-19 Zホールディングス株式会社 情報処理装置、情報処理方法、及びプログラム
JP2020091654A (ja) * 2018-12-05 2020-06-11 株式会社メルカリ 情報処理装置及びプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009134737A (ja) * 2002-11-27 2009-06-18 Accenture Global Services Gmbh 知識管理システムに対する解決策情報
JP2014115912A (ja) * 2012-12-11 2014-06-26 Yahoo Japan Corp 出品支援装置、出品システム、出品支援方法及び出品支援プログラム
JP2015046071A (ja) * 2013-08-28 2015-03-12 ヤフー株式会社 画像認識装置、画像認識方法及び画像認識プログラム
WO2016137390A1 (en) * 2015-02-24 2016-09-01 Visenze Pte Ltd Product indexing method and system thereof
JP2016177419A (ja) * 2015-03-19 2016-10-06 カシオ計算機株式会社 商品登録装置、およびその商品登録方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009134737A (ja) * 2002-11-27 2009-06-18 Accenture Global Services Gmbh 知識管理システムに対する解決策情報
JP2014115912A (ja) * 2012-12-11 2014-06-26 Yahoo Japan Corp 出品支援装置、出品システム、出品支援方法及び出品支援プログラム
JP2015046071A (ja) * 2013-08-28 2015-03-12 ヤフー株式会社 画像認識装置、画像認識方法及び画像認識プログラム
WO2016137390A1 (en) * 2015-02-24 2016-09-01 Visenze Pte Ltd Product indexing method and system thereof
JP2016177419A (ja) * 2015-03-19 2016-10-06 カシオ計算機株式会社 商品登録装置、およびその商品登録方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"JANコードの作成手順", [ONLINE], JPN6021016989, 2 June 2016 (2016-06-02), pages 全文、全図, ISSN: 0004510860 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6469923B1 (ja) * 2018-07-20 2019-02-13 株式会社メルカリ 情報処理方法、情報処理装置及びプログラム
JP2020013461A (ja) * 2018-07-20 2020-01-23 株式会社メルカリ 情報処理方法、情報処理装置及びプログラム
JP6472151B1 (ja) * 2018-07-25 2019-02-20 株式会社メルカリ 情報処理方法、情報処理装置、およびプログラム
JP2020017068A (ja) * 2018-07-25 2020-01-30 株式会社メルカリ 情報処理方法、情報処理装置、およびプログラム
JP2020042403A (ja) * 2018-09-07 2020-03-19 Zホールディングス株式会社 情報処理装置、情報処理方法、及びプログラム
JP7082014B2 (ja) 2018-09-07 2022-06-07 ヤフー株式会社 情報処理装置、情報処理方法、及びプログラム
JP2020042688A (ja) * 2018-09-13 2020-03-19 株式会社リクルート 順番管理システム、およびプログラム
WO2020054653A1 (ja) * 2018-09-13 2020-03-19 株式会社リクルート 順番管理システム、およびプログラム
JP2020091654A (ja) * 2018-12-05 2020-06-11 株式会社メルカリ 情報処理装置及びプログラム

Also Published As

Publication number Publication date
JP7231317B2 (ja) 2023-03-01

Similar Documents

Publication Publication Date Title
JP5897019B2 (ja) 候補製品のリンクリストを判定する方法および装置
JP7231317B2 (ja) 推定装置、推定方法及び推定プログラム
US20140019285A1 (en) Dynamic Listing Recommendation
US20150046281A1 (en) Product suggestions for related items
US10860883B2 (en) Using images and image metadata to locate resources
US20130238467A1 (en) Object display server, object display method, object display program, and computer-readable recording medium for storing the program
JP6698040B2 (ja) 生成装置、生成方法及び生成プログラム
US20230214895A1 (en) Methods and systems for product discovery in user generated content
JP2015520443A (ja) インターネット取引プラットフォーム及びその処理方法
JP2015046010A (ja) 評価算出装置、評価算出方法及び評価算出プログラム
US20150302011A1 (en) Image management device, image generation program, image management method, and image management program
JP6042428B2 (ja) インスタントメッセージングクライアントにおいて、画像を生成する方法と画像生成装置およびシステム
JP6976207B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6780992B2 (ja) 判定装置、判定方法および判定プログラム
US20100185616A1 (en) Systems and methods for predictive recommendations
US10606832B2 (en) Search system, search method, and program
US10936675B2 (en) Developing an item data model for an item
US10984465B2 (en) Order integration system and integration method thereof
WO2018061297A1 (ja) 情報処理方法、プログラム、情報処理システム、及び情報処理装置
US20150278308A1 (en) Routing order lookups
JP6679415B2 (ja) 選択装置、選択方法および選択プログラム
JP2017076376A (ja) 算出装置、算出方法および算出プログラム
JP6527257B1 (ja) 提供装置、提供方法および提供プログラム
JP6007300B1 (ja) 算出装置、算出方法および算出プログラム
JP2020035072A (ja) 情報処理装置、情報処理方法および情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190325

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200421

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200611

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20201124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210224

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20210224

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20210304

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20210309

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20210528

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20210601

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20210810

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20211102

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20211221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220218

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20220412

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20220607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220805

C302 Record of communication

Free format text: JAPANESE INTERMEDIATE CODE: C302

Effective date: 20220915

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20220920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221121

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20221206

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20221213

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20230117

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20230117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230216

R150 Certificate of patent or registration of utility model

Ref document number: 7231317

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350