JP7224931B2 - LEARNING MODEL GENERATOR, PROGRAM, AND METHOD OF MANUFACTURING TERMINAL DEVICE - Google Patents
LEARNING MODEL GENERATOR, PROGRAM, AND METHOD OF MANUFACTURING TERMINAL DEVICE Download PDFInfo
- Publication number
- JP7224931B2 JP7224931B2 JP2019009987A JP2019009987A JP7224931B2 JP 7224931 B2 JP7224931 B2 JP 7224931B2 JP 2019009987 A JP2019009987 A JP 2019009987A JP 2019009987 A JP2019009987 A JP 2019009987A JP 7224931 B2 JP7224931 B2 JP 7224931B2
- Authority
- JP
- Japan
- Prior art keywords
- product
- background
- images
- image
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Cash Registers Or Receiving Machines (AREA)
- Image Analysis (AREA)
Description
本発明は、学習モデル生成装置、プログラム、及び端末装置を製造する方法に関する。 The present invention relates to a learning model generation device, a program, and a method of manufacturing a terminal device.
下記特許文献1には、携帯装置を使用して商品を購入する方法が開示されている。この方法では、ユーザが、携帯装置のカメラを利用して商品のバーコードをスキャンし、バーコードに含まれる商品の識別情報をサーバに送信する。続いて、サーバが、商品の識別情報に基づいて商品名称や価格等の商品情報を取得し、取得した商品情報を仮想ショッピングカートに収容する。その後、仮想ショッピングカートに収容された商品情報に基づいて精算処理が行われる。 Japanese Unexamined Patent Application Publication No. 2002-200001 discloses a method of purchasing a product using a mobile device. In this method, the user scans the barcode of the product using the camera of the mobile device and transmits the identification information of the product contained in the barcode to the server. Subsequently, the server acquires product information such as the product name and price based on the product identification information, and stores the acquired product information in the virtual shopping cart. After that, settlement processing is performed based on the product information stored in the virtual shopping cart.
特許文献1の方法では、商品名称や価格を携帯装置で確認する場合、購入を前提として、商品ごとにバーコードをスキャンさせる必要がある。したがって、陳列棚に並べられている商品や購入が未確定の商品の商品名称や価格を確認する場合には、バーコードをスキャンさせて商品名称や価格を確認し、その後、購入をキャンセルする必要がある。
In the method of
そこで、本発明は、商品名称や価格を手軽に確認できるようにする学習モデル生成装置、プログラム、及び端末装置を製造する方法を提供することを目的とする。 SUMMARY OF THE INVENTION Accordingly, it is an object of the present invention to provide a learning model generation device, a program, and a method of manufacturing a terminal device that enable easy confirmation of product names and prices.
本発明の一態様に係る学習モデル生成装置は、クロマキー合成時に取り除かれる特定色の背景の前に置かれた商品を複数のアングルで撮影した画像を受信する受信部と、前記受信部により受信されたそれぞれの前記画像に対応付けて登録される商品情報として、少なくとも前記画像に対応する商品の商品名称及び価格の入力を受け付ける入力受付部と、前記受信部により受信されたそれぞれの前記画像から前記特定色の背景を取り除く背景除去部と、前記商品が店舗で販売されるときに前記商品の背景となり得る複数の背景画像に対し、前記背景除去部により前記特定色の背景が取り除かれた前記画像を、それぞれ合成することで、合成画像を生成する画像合成部と、前記画像合成部により生成された前記合成画像と、対応する前記商品情報に含まれる商品名称及び価格との組み合わせを含む教師データを用いて学習し、入力された一つ以上の商品の画像に対応する商品名称及び価格を出力する、学習モデルを生成する学習部と、を備える。 A learning model generation device according to an aspect of the present invention includes a receiving unit that receives images of a product placed in front of a background of a specific color to be removed during chromakey synthesis, photographed from a plurality of angles; Further, as product information registered in association with each of the images, an input reception unit that receives input of at least the product name and price of the product corresponding to the image; a background removal unit that removes a background of a specific color; and the image from which the background of the specific color is removed by the background removal unit for a plurality of background images that may serve as a background of the product when the product is sold in a store. an image synthesizing unit that generates a synthesized image by synthesizing each of the above, the synthetic image generated by the image synthesizing unit, and teacher data including a combination of the product name and price included in the corresponding product information and a learning unit that generates a learning model that learns using and outputs product names and prices corresponding to one or more input product images.
上記態様において、前記画像合成部により生成されたそれぞれの前記合成画像に対応する属性情報を調整し、前記属性情報が異なる複数の前記合成画像を生成する合成画像増殖部をさらに備え、前記学習部は、前記画像合成部及び前記合成画像増殖部により生成された前記合成画像と、対応する前記商品情報に含まれる商品名称及び価格との組み合わせを含む教師データを用いて学習することとしてもよい。 In the above aspect, the learning unit further comprises a synthetic image growing unit that adjusts attribute information corresponding to each of the synthetic images generated by the image synthesizing unit and generates a plurality of the synthetic images having different attribute information. may be learned using teacher data including a combination of the synthetic image generated by the image synthesizing unit and the synthetic image growing unit and the product name and price included in the corresponding product information.
上記態様において、前記属性情報は、少なくとも、コントラスト、サイズ、回転角度及びノイズのいずれかを含むこととしてもよい。 In the above aspect, the attribute information may include at least one of contrast, size, rotation angle, and noise.
上記態様において、前記背景画像は、少なくとも、買い物かごの内側を背景とする画像を含むこととしてもよい。 In the above aspect, the background image may include at least an image with the inside of the shopping basket as a background.
本発明の他の態様に係るプログラムは、コンピュータに、撮影部により撮影される一つ以上の商品をディスプレイに表示する機能、ディスプレイに表示される一つ以上の商品の画像を学習モデルに入力する機能、学習モデルから出力される商品名称及び価格を、前記商品に対応させてディスプレイに表示する機能、ユーザによる集計指示に従って、ディスプレイに表示された一つ以上の商品に対応する合計金額をディスプレイに表示する機能、を実現させる。 A program according to another aspect of the present invention provides a computer with a function of displaying one or more products photographed by an imaging unit on a display, and inputting an image of one or more products displayed on the display into a learning model. Function, function to display the product name and price output from the learning model on the display in association with the product, and display the total amount corresponding to one or more products displayed on the display according to the user's total instruction. Realize the function to display.
本発明の他の態様に係る端末装置を製造する方法は、端末装置に、撮影部により撮影される一つ以上の商品をディスプレイに表示する処理、ディスプレイに表示される一つ以上の商品の画像を学習モデルに入力する処理、学習モデルから出力される商品名称及び価格を、前記商品に対応させてディスプレイに表示する処理、ユーザによる集計指示に従って、ディスプレイに表示された一つ以上の商品に対応する合計金額をディスプレイに表示する処理、を実行させるアプリケーションプログラムをインストールさせるために配信することにより、端末装置を製造する。 A method of manufacturing a terminal device according to another aspect of the present invention includes a process of displaying one or more products photographed by a photographing unit on a display of the terminal device, and an image of the one or more products displayed on the display. to the learning model, processing to display the product name and price output from the learning model on the display in correspondence with the product, and correspondence to one or more products displayed on the display according to the user's aggregation instruction. A terminal device is manufactured by distributing an application program for installing an application program for executing a process of displaying a total amount to be paid on a display.
本発明によれば、商品名称や価格を手軽に確認できるようにする学習モデル生成装置、プログラム、及び端末装置を製造する方法を提供することができる。 According to the present invention, it is possible to provide a learning model generation device, a program, and a method of manufacturing a terminal device that enable easy confirmation of product names and prices.
添付図面を参照して、本発明の好適な実施形態について説明する。なお、各図において、同一の符号を付したものは同一又は同様の構成を有する。 Preferred embodiments of the present invention will be described with reference to the accompanying drawings. It should be noted that, in each figure, the same reference numerals have the same or similar configurations.
図1を参照し、実施形態に係る学習モデル生成装置の構成について説明する。学習モデル生成装置1は、後述する端末装置のカメラで撮影された商品の画像を入力とし、その画像に対応する商品名称及び価格を出力とする学習モデルを生成するサーバ装置である。
The configuration of the learning model generation device according to the embodiment will be described with reference to FIG. The learning
学習モデル生成装置1は、物理的な構成として、例えば、CPU(プロセッサ)及びメモリを含む制御装置10、通信装置20、記憶装置30、入力装置40並びに出力装置(例えば、ディスプレイ、スピーカ)50等を備えて構成される。カメラ9は、有線通信又は無線通信を用いて学習モデル生成装置1に接続することができる。CPUがメモリや記憶装置30に格納された所定のプログラムを実行することにより、以下の各機能が発現する。
The learning
学習モデル生成装置1は、機能的な構成として、例えば、受信部11、入力受付部12、背景除去部13、画像合成部14、合成画像増殖部15及び学習部16を有する。各機能について以下に説明する。
The learning
受信部11は、クロマキー合成時に取り除かれる特定色の背景の前に置かれた商品を、複数のアングルで撮影した画像をカメラ9から受信する。クロマキー合成は、映像(画像)を合成する技法の一つであり、特定の色が表示されている領域に他の映像(画像)をはめ込む技法である。特定の色として、グリーンやブルーが一般に使用される。本実施形態では、特定の色としてグリーンを用いる場合について、例示的に説明する。撮影するアングルは、異なるアングルの数が多くなるほど学習モデルの学習効果を高めることができる。他方、撮影するアングルの数が多くなるほど撮影の手間や学習時間が増大することになる。したがって、学習効果と労力とを勘案し、撮影するアングルの数を適宜定めることが望ましい。
The
図3に、異なるアングルで商品を撮影した画像について例示する。図3(A)は、グリーンの背景(グリーンバック)Bの前に立てて置いたAコーヒーMaをほぼ正面から撮影した画像である。図3(B)は、図3(A)のAコーヒーMaを横に寝かせた状態でほぼ正面から撮影した画像である。図3(C)は、グリーンの背景Bの前に立てて置いたBコーヒーMbをほぼ正面から撮影した画像である。図3(D)は、図3(C)のBコーヒーMbを真上に近い所から撮影した画像である。 FIG. 3 exemplifies images of products photographed at different angles. FIG. 3(A) is an image of A coffee Ma placed upright in front of a green background (green background) B, photographed almost from the front. FIG. 3B is an image of the A coffee Ma of FIG. FIG. 3(C) is an image of the B coffee Mb placed upright in front of the green background B and photographed almost from the front. FIG. 3(D) is an image of the B coffee Mb in FIG. 3(C) photographed from near directly above.
図1に示す入力受付部12は、受信部11により受信されたそれぞれの画像に対応付けて登録される商品情報の入力を受け付ける。商品情報は、画像に対応する商品に関する情報であり、例えば、商品名称、価格、商品の産地、商品の賞味期限、商品の評価等を含む。本実施形態では、商品情報として、少なくとも、商品名称及び価格を含むこととする。商品情報の入力は、例えば、管理者が入力装置40を操作して入力することができる。入力された商品情報を画像に対応付けて登録することで、後述する学習モデルを生成する際に、商品情報を入力する労力を削減することができる。
The
背景除去部13は、受信部11により受信されたそれぞれの画像から特定色の背景を取り除く。図4に、特定色の背景が取り除かれた画像について例示する。図4(A)、(B)は、図3(A)、(B)の各画像からグリーンの背景Bを取り除いたAコーヒーMaの画像である。図4(C)、(D)は、図3(C)、(D)の各画像からグリーンの背景Bを取り除いたBコーヒーMbの画像である。
The
図1に示す画像合成部14は、背景除去部13により特定色の背景が取り除かれた画像を、複数の背景画像にそれぞれ合成することで、合成画像を生成する。合成に用いる背景画像は、商品が店舗で販売されるときに商品の背景となり得る画像を用いる。例えば、商品を入れる買い物かごの内側を背景とする画像や、商品が陳列される棚を背景とする画像等を用いることが好ましい。背景画像は、背景画像の数が多くなるほど学習モデルの学習効果を高めることができる。他方、背景画像の数が多くなるほど合成の手間や学習時間が増大することになる。したがって、学習効果と労力とを勘案し、背景画像の数を適宜定めることが望ましい。
The
図5に、背景画像及び合成画像の一例を示す。図5(A)は、飲料品が陳列されている棚を写した背景画像である。図5(B)は、図5(A)の背景画像上に、図4(A)のAコーヒーMaの画像を合成することで作成された合成画像である。 FIG. 5 shows an example of the background image and the composite image. FIG. 5A is a background image showing a shelf on which beverages are displayed. FIG. 5(B) is a synthesized image created by synthesizing the image of A coffee Ma in FIG. 4(A) on the background image in FIG. 5(A).
図1に示す合成画像増殖部15は、画像合成部14により生成されたそれぞれの合成画像に対応する属性情報を調整し、属性情報が異なる複数の合成画像を生成する。属性情報は、例えば、合成画像のコントラスト、合成画像のサイズ、元の合成画像から画像全体を回転させた角度及び合成画像に含まれるノイズを含む。属性情報を変更することで合成画像の数を増やすことができるため、異なる合成画像を生成する処理の高速化を実現することが可能となる。
The synthetic
増殖させる合成画像は、増殖させる数が多くなるほど学習モデルの学習効果を高めることができる。他方、増殖させる数が多くなるほど調整の手間や学習時間が増大することになる。したがって、学習効果と労力とを勘案し、増殖させる合成画像の数を適宜定めることが望ましい。 The more synthetic images are grown, the more the learning effect of the learning model can be enhanced. On the other hand, as the number to be multiplied increases, the adjustment and learning time will increase. Therefore, it is desirable to appropriately determine the number of synthesized images to be multiplied in consideration of the learning effect and effort.
学習部16は、画像合成部14及び合成画像増殖部15により生成された合成画像と、その合成画像に対応する商品情報に含まれる商品名称及び価格との組み合わせを含む教師データを学習することで、学習モデルを生成する。学習部16は、学習した教師データに基づいて、学習モデルに入力された一つ以上の商品の画像に対応する商品名称及び価格を出力する。
The
学習部16の機能は、例えば、YOLO(You Only Look Once)、SSD(Single Shot MultiBox Detector)、R-CNN(Regions with CNN features)等の物体検出用のディープラーニングモデルを利用して実現することができる。
The function of the
図2を参照し、実施形態に係る端末装置の構成について説明する。端末装置6は、物理的な構成として、例えば、CPU(プロセッサ)及びメモリを含む制御装置61、記憶装置62、入力装置及びディスプレイを含むタッチパネル63、通信装置64並びにカメラ(撮影装置)65等を備えて構成される。
The configuration of the terminal device according to the embodiment will be described with reference to FIG. The
端末装置6には、学習部16が生成した学習モデルを搭載したアプリケーションプログラムがインストールされている。CPUがメモリ又は記憶装置62に格納されたアプリケーションプログラムを実行することにより、以下の各機能が発現する。
An application program loaded with a learning model generated by the
端末装置6は、機能的な構成として、例えば、商品画像表示機能、入力機能、商品情報表示機能、及び合計金額表示機能を有する。商品画像表示機能は、カメラ65で撮影されている一つ以上の商品をディスプレイに表示する機能である。入力機能は、ディスプレイに表示される一つ以上の商品の画像を学習モデルに入力する機能である。
The
商品情報表示機能は、学習モデルから出力される商品名称及び価格を、その商品に対応させてディスプレイに表示する機能である。図6に、商品に対応させて商品名称及び価格を表示する画面の一例を示す。端末装置6のディスプレイ63には、カメラ65により撮影されている買い物かごの内側が表示されている。買い物かごの内側には、AコーヒーMa、BコーヒーMb、たまねぎMc、りんごMd、バナナMeが収納されている。
The product information display function is a function of displaying the product name and price output from the learning model on the display in association with the product. FIG. 6 shows an example of a screen displaying product names and prices corresponding to products. The
図6には、AコーヒーMaに対応させて、商品名称“Aコーヒー”及び価格“¥67”が表示され、BコーヒーMbに対応させて、商品名称“Bコーヒー”及び価格“¥95”が表示されている。同様に、たまねぎMcに対応させて、商品名称“たまねぎ”及び価格“¥100”が表示され、りんごMdに対応させて、商品名称“りんご”及び価格“¥109”が表示され、バナナMeに対応させて、商品名称“バナナ”及び価格“¥201”が表示されている。画面下部にあるボタンTをクリックすると、集計指示が送出され、後述する図7に示す画面に遷移する。 In FIG. 6, the product name "A coffee" and the price "¥67" are displayed corresponding to the A coffee Ma, and the product name "B coffee" and the price "¥95" are displayed corresponding to the B coffee Mb. is displayed. Similarly, the product name “onion” and the price “¥100” are displayed corresponding to the onion Mc, the product name “apple” and the price “¥109” are displayed corresponding to the apple Md, and the banana Me is displayed. Correspondingly, the product name "banana" and the price "¥201" are displayed. When the button T at the bottom of the screen is clicked, a tally instruction is sent, and the screen transitions to the screen shown in FIG. 7, which will be described later.
合計金額表示機能は、ユーザによる集計指示に従って、ディスプレイに表示された一つ以上の商品に対応する合計金額等を表示する機能である。図7に、各商品に対応する合計金額を表示する画面の一例を示す。端末装置6のディスプレイ63には、カメラ65により撮影されている各商品の明細情報及び最安値情報と、合計及び最安値合計とが表示されている。
The total price display function is a function of displaying the total price and the like corresponding to one or more products displayed on the display in accordance with a user's tally instruction. FIG. 7 shows an example of a screen displaying the total price corresponding to each product. The
明細情報は、カメラ65により撮影されている各商品の商品名称及び価格であり、最安値情報は、その商品を販売している周辺店舗での最安値及び最安値の店舗名称である。合計は、カメラ65により撮影されている各商品の価格の合計値であり、最安値合計は、各商品の最安値の合計値である。図7には、合計として、“572円”が表示され、最安値合計として、“468円”が表示されている。
The itemized information is the product name and price of each product photographed by the
このように、端末装置6のカメラ65を用いて一つ以上の商品をディスプレイに表示すると、各商品の合計金額や周辺店舗を含む店舗での各商品の最安値等が表示されるため、ユーザの買い物を効率よく支援することが可能となる。
In this way, when one or more products are displayed on the display using the
次に、図8を参照して、実施形態に係る学習モデル生成装置1の動作の一例について説明する。
Next, an example of the operation of the learning
最初に、学習モデル生成装置1の受信部11は、グリーンの背景の前に置かれた商品を、複数のアングルで撮影した画像をカメラ9から受信する(ステップS101)。
First, the receiving
続いて、入力受付部12は、上記ステップS101で受信した各画像に対応付けて登録される商品情報として、商品名称及び価格の入力を受け付ける(ステップS102)。
Subsequently, the
続いて、背景除去部13は、上記ステップS101で受信した各画像からグリーンの背景を取り除く(ステップS103)。
Subsequently, the
続いて、画像合成部14は、上記ステップS103でグリーンの背景が取り除かれた画像を、複数の背景画像にそれぞれ合成することで、合成画像を生成する(ステップS104)。
Subsequently, the
続いて、合成画像増殖部15は、上記ステップS104で生成された各合成画像に対応する属性情報を調整し、属性情報が異なる複数の合成画像を生成する(ステップS105)。
Subsequently, the composite
続いて、学習部16は、上記ステップS104及びステップS105で生成された合成画像と、その合成画像に対応する商品情報に含まれる商品名称及び価格との組み合わせを含む教師データを用いて学習モデルを生成する(ステップS106)。そして本動作を終了する。
Subsequently, the
次に、図9を参照して、実施形態に係る端末装置6の動作の一例について説明する。
Next, an example of the operation of the
最初に、端末装置6は、カメラ65で撮影されている一つ以上の商品をディスプレイに表示する(ステップS201)。
First, the
続いて、端末装置6は、ディスプレイに表示される一つ以上の商品の画像を学習モデルに入力する(ステップS202)。
Subsequently, the
続いて、端末装置6は、学習モデルから出力される商品名称及び価格を、その商品に対応させてディスプレイに表示する(ステップS203)。
Subsequently, the
続いて、端末装置6は、ユーザによる集計指示(ボタンTをクリック)が発行されたかどうかを判定する(ステップS204)。この判定がNOである場合(ステップS204;NO)には、集計指示が発行されるまで待機する。ここで、集計指示の発行を待機している際に、カメラ65で撮影される商品が変更された場合には、上記ステップS201に処理を移行し、変更された商品について、前述したステップS201からステップS203までの処理を実行する。
Subsequently, the
一方、上記ステップS204で集計指示が発行されたと判定された場合(ステップS204;YES)に、端末装置6は、ディスプレイに表示された各商品に対応する合計金額等をディスプレイに表示する(ステップS205)。そして本動作を終了する。
On the other hand, if it is determined in step S204 that the tallying instruction has been issued (step S204; YES), the
前述したように、実施形態における学習モデル生成装置1によれば、グリーンの背景の前に置かれた商品を複数のアングルで撮影した画像を受信し、その各画像に対応付けて登録される商品名称及び価格の入力を受け付けるとともに、商品が店舗で販売されるときに商品の背景となり得る複数の背景画像に対し、各画像からグリーンの背景が取り除かれた画像をそれぞれ合成して合成画像を生成し、その合成画像と、対応する商品名称及び価格との組み合わせを含む教師データを用いて学習モデルを生成することができる。そして、この学習モデルに、一つ以上の商品の画像を入力して、商品の画像に対応する商品名称及び価格を出力することが可能となる。
As described above, according to the learning
それゆえ、実施形態における学習モデル生成装置1によれば、商品名称や価格を手軽に確認させることが可能となる。
Therefore, according to the learning
また、学習モデル生成装置1によれば、生成した各合成画像に対応する属性情報を調整し、属性情報が異なる複数の合成画像をさらに生成することで、教師データに用いる合成画像を増やす処理を高速化することができる。
In addition, according to the learning
[変形例]
なお、本発明は、前述した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。したがって、上記実施形態はあらゆる点で単なる例示にすぎず、限定的に解釈されるものではない。例えば、前述した各処理ステップは処理内容に矛盾を生じない範囲で任意に順番を変更し、又は並列に実行することができる。
[Variation]
It should be noted that the present invention is not limited to the embodiments described above, and can be implemented in various other forms without departing from the gist of the present invention. Therefore, the above-described embodiment is merely an example in all respects, and should not be construed as limiting. For example, the processing steps described above can be arbitrarily changed in order or executed in parallel as long as the content of processing is not inconsistent.
また、学習モデル生成装置1の構成要素は、前述した実施形態における構成要素に限定されることなく、必要に応じて任意の構成要素を適宜省略することや追加することができる。例えば、学習モデル生成装置1の機能的な構成のうち、合成画像増殖部15を省略することとしてもよい。
Also, the components of the learning
1…学習モデル生成装置、6…端末装置、9…カメラ、10…制御装置、11…受信部、12…入力受付部、13…背景除去部、14…画像合成部、15…合成画像増殖部、16…学習部、20…通信装置、30…記憶装置、40…入力装置、61…制御装置、62…記憶装置、63…タッチパネル(入力装置及びディスプレイ)、64…通信装置、65…カメラ。
REFERENCE SIGNS
Claims (6)
前記受信部により受信されたそれぞれの前記画像に対応付けて登録される商品情報として、少なくとも前記画像に対応する商品の商品名称及び価格の入力を受け付ける入力受付部と、
前記受信部により受信されたそれぞれの前記画像から前記特定色の背景を取り除く背景除去部と、
前記商品が店舗で販売されるときに前記商品の背景となり得る複数の背景画像に対し、前記背景除去部により前記特定色の背景が取り除かれた前記画像を、それぞれ合成することで、合成画像を生成する画像合成部と、
前記画像合成部により生成された前記合成画像と、対応する前記商品情報に含まれる商品名称及び価格との組み合わせを含む教師データを用いて学習し、入力された一つ以上の商品の画像に対応する商品名称及び価格を出力する、学習モデルを生成する学習部と、
を備える学習モデル生成装置。 a receiving unit for receiving images of a product placed in front of a background of a specific color to be removed during chromakey synthesis, taken from a plurality of angles;
an input reception unit that receives input of at least the product name and price of the product corresponding to the image as product information registered in association with each of the images received by the reception unit;
a background remover that removes the background of the specific color from each of the images received by the receiver;
A composite image is generated by synthesizing the images from which the background of the specific color has been removed by the background removing unit with respect to a plurality of background images that can serve as the background of the product when the product is sold in a store. an image synthesizing unit to generate;
Learn using teacher data including combinations of the synthetic image generated by the image synthesizing unit and the product name and price included in the corresponding product information, and correspond to one or more input product images. a learning unit that generates a learning model that outputs the product name and price to be used;
A learning model generation device comprising:
前記学習部は、前記画像合成部及び前記合成画像増殖部により生成された前記合成画像と、対応する前記商品情報に含まれる商品名称及び価格との組み合わせを含む教師データを用いて学習する、
請求項1記載の学習モデル生成装置。 further comprising a synthetic image growing unit that adjusts attribute information corresponding to each of the synthetic images generated by the image synthesizing unit and generates a plurality of the synthetic images with different attribute information;
The learning unit learns using teacher data including a combination of the synthetic image generated by the image synthesizing unit and the synthetic image growing unit and the product name and price included in the corresponding product information.
The learning model generation device according to claim 1.
請求項2記載の学習モデル生成装置。 The attribute information includes at least one of contrast, size, rotation angle and noise,
3. The learning model generation device according to claim 2.
請求項1から3のいずれか一項に記載の学習モデル生成装置。 The background image includes at least an image with the inside of the shopping basket as a background,
The learning model generation device according to any one of claims 1 to 3.
撮影部により撮影される一つ以上の商品をディスプレイに表示する機能、
ディスプレイに表示される一つ以上の商品の画像を学習モデルに入力する機能、
前記学習モデルから出力される商品名称及び価格を、前記商品に対応させてディスプレイに表示する機能、
ユーザによる集計指示に従って、ディスプレイに表示された一つ以上の商品に対応する合計金額をディスプレイに表示する機能、
を実現させるためのプログラムであって、
前記学習モデルは、クロマキー合成時に取り除かれる特定色の背景の前に置かれた商品を複数のアングルで撮影した画像からそれぞれ前記特定色の背景が取り除かれた前記画像を、前記商品が店舗で販売されるときに前記商品の背景となり得る複数の背景画像に対して、それぞれ合成することで生成される合成画像と、前記画像に対応する商品情報に含まれる商品名称及び価格との組み合わせを含む教師データを用いて学習し、入力された一つ以上の商品の画像に対応する商品名称及び価格を出力するように生成されたものである。 to the computer,
A function to display one or more products photographed by the photographing unit on the display;
The ability to input images of one or more products displayed on the display into the learning model;
A function to display the product name and price output from the learning model on the display in association with the product;
A function of displaying on the display the total amount corresponding to one or more products displayed on the display according to the user's totaling instruction;
A program for realizing
According to the learning model, the product is sold at a store by removing the background of the specific color from the images of the product placed in front of the background of the specific color to be removed during chromakey synthesis from a plurality of angles. A teacher containing a combination of a synthetic image generated by synthesizing each of a plurality of background images that can become the background of the product when the product is displayed, and the product name and price included in the product information corresponding to the image. It is learned using data and generated to output product names and prices corresponding to one or more input images of products.
撮影部により撮影される一つ以上の商品をディスプレイに表示する処理、
ディスプレイに表示される一つ以上の商品の画像を学習モデルに入力する処理、
前記学習モデルから出力される商品名称及び価格を、前記商品に対応させてディスプレイに表示する処理、
ユーザによる集計指示に従って、ディスプレイに表示された一つ以上の商品に対応する合計金額をディスプレイに表示する処理、
を実行させるアプリケーションプログラムをインストールさせるために配信することにより、端末装置を製造する方法であって、
前記学習モデルは、クロマキー合成時に取り除かれる特定色の背景の前に置かれた商品を複数のアングルで撮影した画像からそれぞれ前記特定色の背景が取り除かれた前記画像を、前記商品が店舗で販売されるときに前記商品の背景となり得る複数の背景画像に対して、それぞれ合成することで生成される合成画像と、前記画像に対応する商品情報に含まれる商品名称及び価格との組み合わせを含む教師データを用いて学習し、入力された一つ以上の商品の画像に対応する商品名称及び価格を出力するように生成されたものである。 to the terminal device,
a process of displaying one or more products photographed by the photographing unit on the display;
A process of inputting images of one or more products displayed on the display into the learning model,
A process of displaying the product name and price output from the learning model on the display in association with the product;
A process of displaying on the display the total amount corresponding to one or more products displayed on the display according to the totaling instruction by the user;
A method of manufacturing a terminal device by distributing for installation an application program for executing
According to the learning model, the product is sold at a store by removing the background of the specific color from the images of the product placed in front of the background of the specific color to be removed during chromakey synthesis from a plurality of angles. A teacher containing a combination of a synthetic image generated by synthesizing each of a plurality of background images that can become the background of the product when the product is displayed, and the product name and price included in the product information corresponding to the image. It is learned using data and generated to output product names and prices corresponding to one or more input images of products.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019009987A JP7224931B2 (en) | 2019-01-24 | 2019-01-24 | LEARNING MODEL GENERATOR, PROGRAM, AND METHOD OF MANUFACTURING TERMINAL DEVICE |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019009987A JP7224931B2 (en) | 2019-01-24 | 2019-01-24 | LEARNING MODEL GENERATOR, PROGRAM, AND METHOD OF MANUFACTURING TERMINAL DEVICE |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020119283A JP2020119283A (en) | 2020-08-06 |
JP7224931B2 true JP7224931B2 (en) | 2023-02-20 |
Family
ID=71890879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019009987A Active JP7224931B2 (en) | 2019-01-24 | 2019-01-24 | LEARNING MODEL GENERATOR, PROGRAM, AND METHOD OF MANUFACTURING TERMINAL DEVICE |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7224931B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7001864B1 (en) | 2021-06-29 | 2022-01-20 | PayPay株式会社 | Sales support equipment, sales support systems, sales support methods, and programs |
CN117916746A (en) | 2021-09-24 | 2024-04-19 | 富士通株式会社 | Data collection program, data collection device, and data collection method |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6330115B1 (en) | 2018-01-29 | 2018-05-23 | 大黒天物産株式会社 | Product management server, automatic cash register system, product management program, and product management method |
-
2019
- 2019-01-24 JP JP2019009987A patent/JP7224931B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6330115B1 (en) | 2018-01-29 | 2018-05-23 | 大黒天物産株式会社 | Product management server, automatic cash register system, product management program, and product management method |
Also Published As
Publication number | Publication date |
---|---|
JP2020119283A (en) | 2020-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10210659B2 (en) | Augmented reality system, method, and apparatus for displaying an item image in a contextual environment | |
KR102183574B1 (en) | System for constructing of virtual reality shoppingmall using photographed image data and method thereof | |
CN106875244A (en) | A kind of virtual reality purchase method, device and electronic equipment | |
JP6120467B1 (en) | Server device, terminal device, information processing method, and program | |
CN110880139B (en) | Commodity display method, commodity display device, terminal, server and storage medium | |
JP7224931B2 (en) | LEARNING MODEL GENERATOR, PROGRAM, AND METHOD OF MANUFACTURING TERMINAL DEVICE | |
US9715701B2 (en) | Image-based listing using image of multiple items | |
US10424009B1 (en) | Shopping experience using multiple computing devices | |
US20160275723A1 (en) | System and method for generating three dimensional representation using contextual information | |
JP5789734B1 (en) | Information processing method, program, storage medium, and information processing apparatus | |
US20230421706A1 (en) | System and method for ordering a print product including a digital image utilizing augmented reality | |
US9258615B2 (en) | Method for providing interactive contents for smart TV | |
JP2017228278A (en) | Server device, terminal device, information processing method, and program | |
US10169786B2 (en) | Method and apparatus for repurchasing items | |
US20120275643A1 (en) | Purchasing Photographic Products from a Software Application on a Mobile Electronic Device Application | |
CN107798714A (en) | A kind of image data display method and relevant apparatus and computer-readable storage medium | |
JP2014013536A (en) | Print service system | |
JP2012146214A (en) | Generation method for photographic image data, and commodity sales promotion system in internet connection environment using the same | |
TW202115645A (en) | Back-end product launching method of self-checkout system | |
JP7209280B2 (en) | Information processing device, information processing method, and program | |
US20170024786A1 (en) | Electronic Shopping System and Method for Facilitating the Purchase of Goods and Services of Others | |
KR102667525B1 (en) | Digital image suitability determination to generate ar/vr digital content | |
JP7369600B2 (en) | User terminal, control method and computer program | |
CN107292647B (en) | Method and device for providing commodity object information | |
JP2022173397A (en) | Information processing apparatus, information distribution method and information distribution program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210914 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220805 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220812 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220927 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7224931 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |