1.実施形態
1.1 概要
図1は、商品情報提供システム10を示す。商品情報提供システム10は、文字情報抽出部F12と、図情報抽出部F13と、商品情報取得部F14と、を備える。文字情報抽出部F12は、商品の記載を含む画像G10(図2参照)から商品に関する文字情報L11~L13,L21~L23,L31~L35,L41~L43,L51~L53,L61~L63(図5参照)の抽出を行う。図情報抽出部F13は、画像G10から、商品に関する図情報I10~I60(図5参照)の抽出を行う。商品情報取得部F14は、文字情報抽出部F12で抽出された文字情報と図情報抽出部F13で抽出された図情報との少なくとも一方に基づいて、商品に対応する商品情報P10~P60(図7参照)を取得する。
商品情報提供システム10では、商品の記載を含む画像G10から、商品に関する文字情報だけでなく商品に関する図情報を抽出可能である。そして、文字情報と図情報との少なくとも一方に基づいて、商品に対応する商品情報を取得する。したがって、商品情報提供システム10によれば、商品の記載から商品に対応する商品情報P10~P60を提供できる。特に、商品情報を取得するために、商品の記載とは別に、商品に関する識別情報を予め用意しておく必要がない。よって、商品情報提供システム10は、特別な画像ではなく、汎用の画像をもとに商品情報を取得できる。
1.2 詳細
以下、本実施形態の商品情報提供システム10について、図1~図8を参照して更に詳細に説明する。本実施形態の商品情報提供システム10は、商品の記載を含む画像(商品画像)に基づいて、商品情報を提供するためのシステムである。ここで、「商品」は、売買の目的物となる品物である。商品は、製品だけでなく、農作物や海産物等の天然資源も含み得る。「商品の記載」は、商品を説明する(一例として、商品の形状や性質等を説明する)情報であって、文字及び図等の視覚情報を含み得る。
図2は、商品の記載を含む画像の一例を示す。図2に示す画像G10は、複数の商品の記載を含む商品の一覧の画像である。画像G10は、建物に設置する照明器具の姿図一覧の画像である。本実施形態では、商品は、照明器具であり、商品の記載は、商品の外観の図の一種である姿図を含んでいる。画像G10は、図2に示すように、それぞれ商品の記載がされる複数(図2では6つ)の欄R10,R20,R30,R40,R50,R60を含んでいる。
図7は、商品情報を含む画像の一例を示す。図7に示す画像G20は、商品リストW10を示している。商品リストW10は、商品情報のリストである。商品リストW10は、複数(図7では、6つ)の商品情報P10,P20,P30,P40,P50,P60のリストである。商品情報の例としては、品番、品名、価格、寸法、質量、仕様、注意事項が挙げられる。本実施形態では、商品情報は、図7に示すように、品番と品名とを含んでいる。
商品情報提供システム10は、通信ネットワーク60を通じて、認識システム20と、商品検索システム30と、商品推定システム40と、端末装置50とに接続可能である。商品情報提供システム10は、通信ネットワーク60を通じて、認識システム20と、商品検索システム30と、商品推定システム40と、端末装置50とともに、システムを構築している。
通信ネットワーク60は、インターネットを含み得る。通信ネットワーク60は、単一の通信プロトコルに準拠したネットワークだけではなく、異なる通信プロトコルに準拠した複数のネットワークで構成され得る。通信プロトコルは、周知の様々な有線及び無線通信規格から選択され得る。図1では簡略化されているが、通信ネットワーク60は、リピータハブ、スイッチングハブ、ブリッジ、ゲートウェイ、ルータ等のデータ通信機器を含み得る。
端末装置50は、商品情報提供システム10への画像G10の入力、及び、商品情報提供システム10からの商品情報の表示に利用される。端末装置50は、図1に示すように、入出力部51と、通信部52と、処理部53と、を備える。端末装置50は、情報端末であり、例えば、デスクトップコンピュータである。なお、端末装置50は、ラップトップコンピュータ、又は、携帯端末(スマートフォン、タブレット端末、ウェアラブル端末等)により実現され得る。
入出力部51は、端末装置50を操作するための入力装置を備える。入力装置は、例えば、キーボード、マウス、トラックボール、タッチパッド等を含み得る。また、入出力部51は、情報を表示するための画像表示装置を備える。画像表示装置は、液晶ディスプレイや有機ELディスプレイ等の薄型のディスプレイ装置を含み得る。
通信部52は、通信インターフェースである。通信部52は、通信ネットワーク60に接続可能であり、通信ネットワーク60を通じた通信を行う機能を有する。通信部52は、所定の通信プロトコルに準拠している。所定の通信プロトコルは、周知の様々な有線及び無線通信規格から選択され得る。
処理部53は、端末装置50の全体的な制御、すなわち、入出力部51及び通信部52を制御するように構成される。処理部53は、例えば、1以上のプロセッサ(マイクロプロセッサ)と1以上のメモリとを含むコンピュータシステムにより実現され得る。つまり、1以上のプロセッサが1以上のメモリに記憶された1以上のプログラム(アプリケーション)を実行することで、処理部53として機能する。プログラムは、ここでは処理部53のメモリに予め記録されているが、インターネット等の電気通信回線を通じて、又はメモリカード等の非一時的な記録媒体に記録されて提供されてもよい。
処理部53は、上述した、入出力部51の操作に応じて、ユーザにより入力された画像G10を、商品情報提供システム10に通信ネットワーク60を通じて送信する機能を有している。
処理部53は、図3に示すように、ユーザにより入力された画像G10を入出力部51の画像表示装置で表示して、画像G10において、商品の記載がある領域(セル)を、入出力部51の入力装置にて指定させる機能を有している。図3では、欄R10に対して、領域C10が設定されているが、いずれかの欄に対して、領域が設定されればよい。処理部53は、領域が設定されると、領域の情報を、商品情報提供システム10に通信ネットワーク60を通じて送信する機能を有している。領域の情報は、領域のサイズ、及び、画像上の位置を含み得る。
また、処理部53は、領域に対して複数の商品情報の候補がある場合、ユーザに商品情報の候補を選択させる機能を有する(図7参照)。この点については後述する。
商品情報提供システム10は、図1に示すように、通信部11と、処理部12とを備えている。商品情報提供システム10は、サーバにより実現され得る。
通信部11は、通信インターフェースである。通信部11は、通信ネットワーク60に接続可能であり、通信ネットワーク60を通じた通信を行う機能を有する。通信部11は、所定の通信プロトコルに準拠している。所定の通信プロトコルは、周知の様々な有線及び無線通信規格から選択され得る。
処理部12は、商品情報提供システム10の動作を制御する制御回路である。処理部12は、例えば、1以上のプロセッサ(マイクロプロセッサ)と1以上のメモリとを含むコンピュータシステムにより実現され得る。つまり、1以上のプロセッサが1以上のメモリに記憶された1以上のプログラム(アプリケーション)を実行することで、処理部12として機能する。プログラムは、ここでは処理部12のメモリに予め記録されているが、インターネット等の電気通信回線を通じて、又はメモリカード等の非一時的な記録媒体に記録されて提供されてもよい。
処理部12は、図1に示すように、領域設定部F11と、文字情報抽出部F12と、図情報抽出部F13と、商品情報取得部F14と、商品リスト作成部F15と、を備えている。図1において、領域設定部F11と、文字情報抽出部F12と、図情報抽出部F13と、商品情報取得部F14と、商品リスト作成部F15とは実体のある構成を示しているわけではなく、処理部12によって実現される機能を示している。
領域設定部F11は、画像G10に複数の商品の記載にそれぞれ対応する複数の領域を設定する。より詳細には、領域設定部F11は、端末装置50から画像G10及び領域の情報を受け取ると、画像G10に複数の商品の記載にそれぞれ対応する複数の領域を設定する。例えば、図4に示すように、領域設定部F11は、商品の記載がある欄R10~R60にそれぞれ対応するように複数(図4では6つ)の領域C10~C60を設定する。領域設定部F11は、領域の情報に基づいて画像G10から欄R10~R60を抽出し、欄R10~R60それぞれに領域C10~C60を設定する。一例として、領域設定部F11は、エッジ検出によって、画像G10から欄を構成する輪郭の候補を抽出する。画像G10において欄はマトリクス状に並んでいることから、端末装置50からの領域の情報(領域のサイズ及び領域の位置)に基づいて、各欄に対応する領域の推定が可能である。よって、領域設定部F11は、領域の情報(領域のサイズ及び領域の位置)に合致するように、欄を構成する輪郭の候補から、欄を構成する輪郭を選択する。その結果、領域設定部F11は、図4に示すように、欄R10~R60それぞれに領域C10~C60を設定する。
文字情報抽出部F12は、商品の記載を含む画像から、商品に関する文字情報の抽出を行う。領域設定部F11で複数の領域が設定されている場合には、文字情報抽出部F12は、複数の領域のそれぞれに対して、文字情報の抽出を行う。文字情報抽出部F12は、画像から抽出した文字情報を商品情報取得部F14に与える。
図情報抽出部F13は、商品の記載を含む画像から、商品に関する図情報の抽出を行う。領域設定部F11で複数の領域が設定されている場合には、図情報抽出部F13は、複数の領域毎のそれぞれに対して、図情報の抽出を行う。図情報抽出部F13は、画像から抽出した図情報を商品情報取得部F14に与える。
本実施形態では、文字情報抽出部F12及び図情報抽出部F13は、認識システム20を利用して、文字情報の抽出を行う。
認識システム20は、画像から文字と図とを認識するシステムである。認識システム20は、従来周知の画像処理技術により実現され得る。一例として、認識システム20は、光学文字認識(Optical Character Recognition)により、画像から文字を読み取る。認識システム20は、画像において文字として読み取れなかった領域を、図として読み取る。このような認識システム20は、サーバにより実現され得る。
文字情報抽出部F12は、画像G10を認識システム20に入力した結果から、文字情報を取得する。本実施形態では、文字情報抽出部F12は、商品の詳細に関する文字列を文字情報として抽出する。つまり、文字情報抽出部F12は、商品の詳細に関連がない文字列を無視する。例えば、文字情報抽出部F12は、文字数が所定値(例えば2)以下の文字列を商品の詳細に関連がない文字列として扱ってよい。文字数が少ない文字列は、商品情報の特定には寄与しないと考えられるから、商品の詳細に関連がない文字列として扱ってよい。商品の詳細は、商品の品番と、商品の仕様とを含み得る。また、文字情報抽出部F12は、文字情報が品番かどうかを判定してよい。一例として、文字情報抽出部F12は、所定の桁数以上の英数字の文字列である文字情報を品番情報と判定する。文字情報抽出部F12は、商品の仕様に関する文字情報を補足情報として扱ってよい。なお、補足情報として抽出する文字列は、商品の仕様に関するキーワードを含む文字列であってよい。照明器具の場合、キーワードの例としては、形状に関するキーワード、明るさに関するキーワード、光色に関するキーワード、その他のキーワードが挙げられる。形状に関するキーワードの例としては、「直付」、「埋込」、「笠なし」、「笠付」、「スクエア」、「下面」、「パネル」、「ルーバー」、「開放」、「ガード」、「富士型」、「片反射」、「丸形」がある。明るさに関するキーワードの例としては、明るさを示す記号、ワット数が挙げられる。光色に関するキーワードの例としては、「昼光色」、「昼白色」、「白色」、「温白色」、「電球色」が挙げられる。その他のキーワードの例としては、「防湿」、「防水」、「防雨」、「バッテリー」、「調光」、「非常用」、「電源」、「電池」が挙げられる。これらキーワードは、商品検索システム30での検索に適したものであることが好ましい。また、キーワードは、商品の種類によって適宜変更されてよい。文字情報抽出部F12は、抽出された文字情報が予め決められていたキーワードを含む場合に、抽出された文字情報を補足情報と判定してよい。文字情報抽出部F12は、画像から抽出した文字情報を商品情報取得部F14に与える。
図情報抽出部F13は、画像G10を認識システム20に入力した結果から、図情報を取得する。本実施形態では、図情報抽出部F13は、商品の外観の図(本実施形態では、姿図)を図情報として抽出する。つまり、図情報抽出部F13は、商品の外観に関連がない図を無視する。例えば、図情報抽出部F13は、サイズが所定値以下の図情報を商品の外観に関連がない図情報として扱ってよい。姿図一覧では、商品の外観の図はある程度の大きさで描かれているから、サイズが小さい図情報を商品の外観とは関係ない図情報として扱ってよい。
図5は、文字情報抽出部F12及び図情報抽出部F13での抽出の結果を示す。図5では、画像G10に、6つの領域C10~C60が設定されている。
領域C10からは、3つの文字情報L11,L12,L13及び1つの図情報I10が抽出されている。文字情報L11は、「LED埋込パネル」という文字列であり、商品の種類を示す。文字情報L12は、「56W 450角」という文字列であり、商品の定格電力及びサイズを示す。文字情報L13は、「XL575PFVJLA9」という文字列であり、商品の品番を示す。文字情報L13は品番情報であり、文字情報L11,L12は補足情報である。図情報I10は、姿図であり、LED埋込パネルを示す。
領域C20からは、3つの文字情報L21,L22,L23及び1つの図情報I20が抽出されている。文字情報L21は、「LED埋込パネル」という文字列であり、商品の種類を示す。文字情報L22は、「43W 450角」という文字列であり、商品の定格電力及びサイズを示す。文字情報L23は、「XL574PFVJLA9」という文字列であり、商品の品番を示す。文字情報L23は品番情報であり、文字情報L21,L22は補足情報である。図情報I20は、姿図であり、LED埋込パネルを示す。
領域C30からは、5つの文字情報L31,L32,L33,L34,L35及び1つの図情報I30が抽出されている。文字情報L31は、「LED埋込ルーバー」という文字列であり、商品の種類を示す。文字情報L32は、「LDL40×2 (3800Lm)」という文字列であり、商品の光源を示す。文字情報L33は、「消費電力64W」という文字列であり、商品の消費電力を示す。文字情報L34は、「マルチコンフォート15」という文字列であり、商品の種類を示す。文字情報L35は、「XFL323CBLE9」という文字列であり、商品の品番を示す。文字情報L35は品番情報であり、文字情報L31~L34は補足情報である。図情報I30は、姿図であり、LED埋込ルーバーを示す。
領域C40からは、3つの文字情報L41,L42,L43及び1つの図情報I40が抽出されている。文字情報L41は、「LEDブラケット」という文字列であり、商品の種類を示す。文字情報L42は、「20形直管蛍光灯1灯相当」という文字列であり、商品の明るさを示す。文字情報L43は、「LGB85039LE1」という文字列であり、商品の品番を示す。文字情報L43は品番情報であり、文字情報L41,L42は補足情報である。図情報I40は、姿図であり、LEDブラケットを示す。
領域C50からは、3つの文字情報L51,L52,L53及び1つの図情報I50が抽出されている。文字情報L51は、「LED 富士型」という文字列であり、商品の種類を示す。文字情報L52は、「LDL40×2 (2600Lm)」という文字列であり、商品の光源を示す。文字情報L53は、「NNF42001LE9」という文字列であり、商品の品番を示す。文字情報L53は品番情報であり、文字情報L51,L52は補足情報である。図情報I50は、姿図であり、富士型のLED照明器具を示す。
領域C60からは、3つの文字情報L61,L62,L63及び1つの図情報I60が抽出されている。文字情報L61は、「LED直付型」という文字列であり、商品の種類を示す。文字情報L62は、「32.5W iDシリーズ直付型」という文字列であり、商品の定格電力及び種類を示す。文字情報L63は、「W150×L1250」という文字列であり、商品のサイズを示す。文字情報L61~63はいずれも補足情報である。図情報I60は、姿図であり、直付型のLED照明器具を示す。
商品情報取得部F14は、文字情報抽出部F12で抽出された文字情報L11~L63と図情報抽出部F13で抽出された図情報I10~I60との少なくとも一方に基づいて、商品に対応する商品情報P10~P60(図7参照)を取得する。
より詳細には、商品情報取得部F14は、第1処理と、第2処理とを行う機能を有する。
第1処理は、文字情報抽出部F12で抽出された文字情報L11~L13,L21~L23,L31~L35,L41~L43,L51~L53,L61~L63を用いて商品に対応する商品情報P10~P60を取得する処理である。商品情報取得部F14は、第1処理では、商品検索システム30を利用する。商品検索システム30は、1以上の文字列の入力に対して商品情報を出力するように構成されている。商品検索システム30は、商品情報のデータベースを有している。商品検索システム30は、入力された1以上の文字列で、商品情報のデータベースを検索して、入力された1以上の文字列が当てはまる商品情報を出力する。なお、商品検索システム30に入力される文字列が商品情報の特定に十分な文字列を含んでいない場合、商品検索システム30は、商品情報を十分に絞り込むことができないため、商品情報を特定できない。この場合、商品検索システム30は、商品情報を特定できない旨の通知を出力してよい。商品検索システム30は、従来周知のデータベースの構築技術により構成することができ、サーバにより実現され得る。
商品情報取得部F14は、第1処理では、文字情報抽出部F12で抽出された文字情報を商品検索システム30に与えることで、商品検索システム30から商品に対応する商品情報を取得する。特に、商品情報取得部F14は、第1処理では、文字情報抽出部F12で抽出された品番情報を商品検索システム30に与えることで、商品検索システム30から商品に対応する商品情報を取得する。なお、商品情報取得部F14は、文字情報抽出部F12で品番情報が抽出できなかった場合には、第1処理で商品に対応する商品情報を取得できなかったとしてよい。
第2処理は、図情報抽出部F13で抽出された図情報I10~I60を用いて商品に対応する商品情報P10~P60を取得する処理である。商品情報取得部F14は、第2処理では、商品検索システム30及び商品推定システム40を利用する。商品推定システム40は、図情報の入力に対して商品の種類を出力するように構成されている。一例としては、図情報が照明器具の姿図であれば、姿図に対応する照明器具の種類を対応付ければよい。照明器具の種類の例としては、ベースライト、ダウンライト、シーリングライト、誘導灯、非常灯が挙げられる。
商品推定システム40は、学習済みモデル(商品情報推定モデル)を利用する。商品情報推定モデルは、図情報と商品の種類との関係を学習した学習済みモデルである。このような商品情報推定モデルは、一例としては、商品の外観の図と商品の外観に対応する商品の種類とを含む学習用データセットにより、人工知能のプログラム(アルゴリズム)に、商品の外観の図と商品の種類との関係を学習させることで、生成され得る。人工知能のプログラムは、機械学習のモデルであって、例えば、階層モデルの一種であるニューラルネットワークが用いられる。つまり、ニューラルネットワークに学習用データセットで機械学習(例えば、深層学習)を行わせることで、学習済みモデルが生成される。商品推定システム40は、サーバにより実現され得る。
商品情報取得部F14は、第2処理では、図情報抽出部F13で抽出された図情報を商品推定システム40(つまり、商品の外観の図と商品の種類との関係を学習した学習済みモデル)に与えることで、図情報に対応する商品の種類を特定する。そして、商品情報取得部F14は、特定した商品の種類を商品検索システム30に与えることで、商品情報を取得する。このとき、補足情報があれば、図情報から得た商品の種類とともに商品検索システム30に与えられる。補足情報を利用することで、商品情報を絞り込むことができ、商品情報の取得を精度よく行えるようになる。
商品情報取得部F14は、第1処理を第2処理よりも先に実行する。そして、商品情報取得部F14は、第1処理で商品に対応する商品情報を取得できた場合、第2処理を実行しない。言い換えれば、商品情報取得部F14は、第1処理で商品に対応する商品情報を取得できなかった場合に、第2処理を実行する。これによって、商品の記載から商品に対応する商品情報を取得する処理の効率の向上が期待できる。また、商品情報取得部F14は、文字情報抽出部F12での文字情報の抽出が失敗した場合、第2処理を実行する。ここで、図情報抽出部F13での図情報の抽出も失敗していれば、商品情報取得部F14は、商品の記載がないと判断してよい。
領域C10の場合、商品情報取得部F14は、3つの文字情報L11,L12,L13を商品検索システム30に与えることで、商品検索システム30から商品に対応する商品情報を取得する。領域C10では、文字情報L13が品番を示しているから、商品検索システム30は、この品番で特定される商品情報P10(図7参照)を出力する。商品情報P10は、「XL575PFVJLA9」という品番と、「天井埋込型 LED(昼白色) 一体型LEDベースライト」という品名とを含んでいる。
領域C20の場合、商品情報取得部F14は、3つの文字情報L21,L22,L23を商品検索システム30に与えることで、商品検索システム30から商品に対応する商品情報を取得する。領域C20では、文字情報L23が品番を示しているから、商品検索システム30は、この品番で特定される商品情報P20(図7参照)を出力する。商品情報P20は、「XL574PFVJLA9」という品番と、「天井埋込型 LED(昼白色) 一体型LEDベースライト」という品名とを含んでいる。
領域C30の場合、商品情報取得部F14は、5つの文字情報L31,L32,L33,L34,L35を商品検索システム30に与えることで、商品検索システム30から商品に対応する商品情報を取得する。領域C30では、文字情報L35が品番を示しているから、商品検索システム30は、この品番で特定される商品情報P30(図7参照)を出力する。商品情報P30は、「XFL323CBLE9」という品番と、「天井埋込型 40形 直管LEDランプベースライト」という品名とを含んでいる。
領域C40の場合、商品情報取得部F14は、3つの文字情報L41,L42,L43を商品検索システム30に与えることで、商品検索システム30から商品に対応する商品情報を取得する。領域C40では、文字情報L43が品番を示しているから、商品検索システム30は、この品番で特定される商品情報P40(図7参照)を出力する。商品情報P40は、「LGB85039LE1」という品番と、「天井直付型・壁直付型 LED(電球色) ミラーライト」という品名とを含んでいる。
領域C50の場合、商品情報取得部F14は、3つの文字情報L51,L52,L53を商品検索システム30に与えることで、商品検索システム30から商品に対応する商品情報を取得する。領域C50では、文字情報L53が品番を示しているから、商品検索システム30は、この品番で特定される商品情報P50(図7参照)を出力する。商品情報P50は、「NNF42001LE9」という品番と、「天井直付型 40形 直管LEDランプベースライト」という品名とを含んでいる。
領域C60の場合、商品情報取得部F14は、3つの文字情報L61,L62,L63を商品検索システム30に与える。3つの文字情報L61,L62,L63が、商品情報の特定に十分な文字列を含んでいない場合、商品検索システム30は、商品情報を特定できない旨の通知が出される。商品情報取得部F14は、この場合には、文字情報抽出部F12での文字情報の抽出が失敗したと判断して、第2処理を実行する。つまり、商品情報取得部F14は、図情報I60を商品推定システム40に与える。商品推定システム40は、図情報I60に対して、商品情報P60を出力する。ここで、商品情報P60は、複数の商品情報の候補D11~D13を含んでいる。商品情報の候補D11~D13は、商品の外観の図では区別できないが、電気的な性能が異なっている。商品情報の候補D11の品番は「XLX450AENZLE9」であり、商品情報の候補D12の品番は「XLX450AENZRZ9」であり、商品情報の候補D13の品番は「XLX450AENZLR9」である。図7では、商品情報P60には、候補D11の内容が表されている。
図6は、商品情報取得部F14での商品情報の取得の結果を示す。図6に示す画像G10では、領域C10~C50は、商品情報が一つに決まっている。一方で、領域C61は、図3の領域C60に対応するが、商品情報の候補があるため、他の領域C10~C50とは異なる表示がされている。また、領域C10~C50,C61には、領域の識別番号を示すラベルN10~N60がつけられている。
商品リスト作成部F15は、複数の領域のそれぞれに対して商品情報取得部F14で取得された商品情報をもとに、商品リストを作成する。図7は、商品リスト作成部F15が作成した商品リストを含む画像の一例である。図7に示す画像G20は、商品リストW10と、候補リストW20とを含んでいる。商品リストW10は、複数の領域C10~C60のそれぞれに対して商品情報取得部F14で取得された商品情報P10~P60を含んでいる。また、図7では、商品情報P10~P60は、対応する領域の識別番号(図7のセル番号)ともに表示されている。
商品情報提供システム10は、商品情報取得部F14の出力(商品情報の取得の結果)と、商品リスト作成部F15の出力(商品リストW10及び候補リストW20の情報)を、通信ネットワーク60を通じて端末装置50に送信する。
この場合、端末装置50は、図6に示す画像G10を入出力部51の画像表示装置に表示させてよい。この図6の画像G10により、図情報が正しく抽出されているかどうかを確認することが可能である。また、端末装置50は、処理部53が入出力部51の画像表示装置に、画像G20を表示させてよい。これによって、商品情報の詳細の確認が可能になる。ここで、候補リストW20では、商品情報の候補D11~D13の選択のためのボタンB10が表示されている。ユーザは、端末装置50の入出力部51の入力装置を操作して、所望のボタンB10を選択することで、領域C60に対応する商品情報を、商品情報の候補D11~D13のなかから決定できる。
1.3 動作
次に、商品情報提供システム10の動作について図8を参照して簡単に説明する。
まず、ユーザが、端末装置50を用いて、図2に示すような商品の記載を含む画像G10のデータを入力する(S11)。また、ユーザが、端末装置50を用いて、図3に示すように、セル(ここでは、領域C10)の指定(S12)を行う。
これによって、商品情報提供システム10では、領域設定部F11が画像G10に対して、図4に示すように、セル(領域)C10~C60を設定する(S13)。次に、商品情報提供システム10では、図5に示すように、文字情報抽出部F12が認識システム20を利用して文字情報L11~L63を抽出し、図情報抽出部F13が認識システム20を利用して図情報I10~I60を抽出する(S14)。
商品情報取得部F14は、複数のセルのそれぞれについて、対応する商品情報を取得するための処理を行う。まず、商品情報取得部F14は、商品情報の取得の対象となるセルに文字情報があるかどうかを判定する(S15)。
文字情報抽出部F12で文字情報が抽出できた場合には(S15;Yes)、商品情報取得部F14は、文字情報抽出部F12で抽出された文字情報を商品検索システム30に与えて、文字情報で商品の検索を行う(S16)。商品検索システム30から商品情報(品番)が得られれば(S17;Yes)、商品情報取得部F14は、すべてのセル(領域)について商品情報を取得するための処理が完了したかどうかを判定する(S18)。すべてのセル(領域)について商品情報を取得するための処理が完了していれば(S18;Yes)、商品リスト作成部F15が商品リストを作成し、端末装置50に出力し、端末装置50が商品リストを表示する(S19)。これによって、商品情報提供システム10の動作は終了する。一方、すべてのセル(領域)について商品情報を取得するための処理が完了していなければ(S18;No)、商品情報取得部F14は、また処理が完了していないセルについて、文字情報があるかどうかを判定する(S15)。
文字情報抽出部F12で文字情報が抽出できなかった場合(S15;No)、商品情報取得部F14は、商品情報の取得の対象となるセルに図情報があるかどうかを判定する(S20)。又は、商品検索システム30から商品情報(品番)が得られなかった場合(S17;No)、商品情報取得部F14は、商品情報の取得の対象となるセルに図情報があるかどうかを判定する(S20)。
図情報抽出部F13で図情報が抽出できた場合には(S20;Yes)、商品情報取得部F14は、図情報抽出部F13で抽出された図情報を商品推定システム40に与えて、図情報で商品の推定を行う(S21)。商品推定システム40から商品情報(品番)が得られれば(S22;Yes)、商品情報取得部F14は、すべてのセル(領域)について商品情報を取得するための処理が完了したかどうかを判定する(S18)。
図情報抽出部F13で図情報が抽出できなかった場合(S20;No)、商品情報取得部F14は、商品情報の取得の対象となるセルに対しては商品情報(品番)が特定できないと結論付ける(S23)。又は、商品推定システム40から商品情報(品番)が得られなかった場合(S22;No)、商品情報取得部F14は、商品情報の取得の対象となるセルに対しては商品情報(品番)が特定できないと結論付ける(S23)。そして、すべてのセル(領域)について商品情報を取得するための処理が完了したかどうかを判定する(S18)。
1.4 まとめ
以上述べた商品情報提供システム10は、文字情報抽出部F12と、図情報抽出部F13と、商品情報取得部F14と、を備える。文字情報抽出部F12は、商品の記載を含む画像G10(図2参照)から商品に関する文字情報L11~L13,L21~L23,L31~L35,L41~L43,L51~L53,L61~L63(図5参照)の抽出を行う。図情報抽出部F13は、 画像G10から、商品に関する図情報I10,I20,I30,I40,I50,I60(図5参照)の抽出を行う。商品情報取得部F14は、文字情報抽出部F12で抽出された文字情報と図情報抽出部F13で抽出された図情報との少なくとも一方に基づいて、商品に対応する商品情報P10,P20,P30,P40,P50,P60(図7参照)を取得する。このように、商品情報提供システム10によれば、商品の記載から商品に対応する商品情報を提供でき得る。
換言すれば、商品情報提供システム10は、下記の方法(商品情報提供方法)を実行しているといえる。商品情報提供方法は、商品の記載を含む画像G10(図2参照)から商品に関する文字情報L11~L13,L21~L23,L31~L35,L41~L43,L51~L53,L61~L63(図5参照)の抽出を行う。商品情報提供方法は、画像G10から、商品に関する図情報I10,I20,I30,I40,I50,I60(図5参照)の抽出を行う。商品情報提供方法は、文字情報抽出部F12で抽出された文字情報と図情報抽出部F13で抽出された図情報との少なくとも一方に基づいて、商品に対応する商品情報P10,P20,P30,P40,P50,P60(図7参照)を取得する。このように、商品情報提供方法によれば、商品情報提供システム10と同様に、商品の記載から商品に対応する商品情報を提供でき得る。
商品情報提供システム10は、コンピュータシステム(1以上のプロセッサ)により実現されている。つまり、商品情報提供システム10は、1以上のプロセッサがプログラム(コンピュータプログラム)を実行することにより実現される。このプログラムは、1以上のプロセッサに商品提供方法を実行させるためのプログラムである。このようなプログラムによれば、商品情報提供方法と同様に、商品の記載から商品に対応する商品情報を提供でき得る。
2.変形例
本開示の実施形態は、上記実施形態に限定されない。上記実施形態は、本開示の目的を達成できれば、設計等に応じて種々の変更が可能である。以下に、上記実施形態の変形例を列挙する。
上記実施形態では、商品は、照明器具であるが、これに限定されない。商品は、売買の目的物となる品物であればよく、照明器具のような電気製品だけでなく、食料品及び薬品等の製品も含み得る。更に、商品は、農作物や海産物等の天然資源も含み得る。なお、電気製品の例としては、センサ関連機器、空調関連機器、住宅・設備関連機器、調理・家事関連機器、健康管理関連機器、管理・操作関連機器、AV関連機器が挙げられる。センサ関連機器の例としては、カメラ、火災センサ、人体検知センサ、温度センサ、CO2センサ、電流量センサが挙げられる。空調関連機器の例としては、エアコン、扇風機、換気扇、空気清浄機、 ホットカーペット、石油ファンヒータが挙げられる。住宅・設備関連機器の例としては、電動ブラインド、電動カーテン、温水器、電気錠、スマートメーター、太陽光発電設備、蓄電池、燃料電池、一般照明、単機能照明、非常灯が挙げられる。調理・家事関連機器の例としては、IH調理器(クッキングヒータ)、電子レンジ、食器洗い機、食器乾燥機、洗濯機、衣類乾燥機、自動掃除機が挙げられる。健康管理関連機器の例としては、体重計、体脂肪計、体温計、血圧計、血糖値計が挙げられる。管理・操作関連機器の例としては、コントローラ、スイッチ(HA機器)が挙げられる。AV関連機器の例としては、TV、ディスプレイが挙げられる。
一変形例では、商品の外観の図は、姿図以外の図であってよく、例えば、正面図、背面図、平面図、底面図、左側面図、右側面図、斜視図、断面図等であってよい。ただし、商品を表す図として、一般によく利用されている図であることが好ましい。
一変形例では、商品情報提供システム10は、文字情報抽出部F12と、図情報抽出部F13と、商品情報取得部F14とを含んでいればよい。
一変形例では、領域設定部F11は、端末装置50からの領域情報がなくても、画像処理により、領域を設定してもよい。
一変形例では、文字情報抽出部F12は、認識システム20の機能を有していてもよい。換言すれば、商品情報提供システム10は、認識システム20を含むことができる。
一変形例では、図情報抽出部F13は、認識システム20の機能を有していてもよい。換言すれば、商品情報提供システム10は、認識システム20を含むことができる。
一変形例では、商品情報取得部F14は、商品検索システム30の機能を有していてもよい。換言すれば、商品情報提供システム10は、商品検索システム30を含むことができる。
一変形例では、商品情報取得部F14は、商品推定システム40の機能を有していてもよい。換言すれば、商品情報提供システム10は、商品推定システム40を含むことができる。
一変形例では、商品推定システム40は、商品の外観の図と1以上の商品情報との関係を学習した学習済みモデルを利用してよい。商品には、外観が同じで特性が異なる商品が存在し得る。このような商品の例としては、外観が同じで消費電力や使用可能な光源が異なる商品が挙げられる。図情報は、商品の外観の図であるから、商品推定システム40は、図情報の入力に対して、1以上の商品情報を出力するように構成されてよい。このような商品情報推定モデルは、一例としては、商品の外観の図と商品の外観に対応する1以上の商品情報とを含む学習用データセットにより、人工知能のプログラム(アルゴリズム)に、商品の外観の図と商品情報との関係を学習させることで、生成され得る。人工知能のプログラムは、機械学習のモデルであって、例えば、階層モデルの一種であるニューラルネットワークが用いられる。つまり、ニューラルネットワークに学習用データセットで機械学習(例えば、深層学習)を行わせることで、学習済みモデルが生成される。商品推定システム40は、サーバにより実現され得る。
一変形例では、商品情報取得部F14は、第1処理と第2処理とを並行して実施してよいし、第2処理を第1処理よりも先に実施してもよい。つまり、商品情報取得部F14は、第2処理で商品情報が得られなかった場合に第1処理を行うようにしてもよい。また、商品情報取得部F14は、文字情報と図情報とを組み合わせて商品情報を特定してよい。特に、文字情報に品番が含まれていない場合には、商品情報取得部F14は、文字情報で取得した商品情報の候補と図情報で取得した商品情報の候補との論理積により、商品情報を特定してよい。あるいは、商品情報取得部F14は、図情報で取得した商品情報の候補を文字情報で絞り込んで、商品情報を特定してもよい。
一変形例では、商品リスト作成部F15は、商品情報に含まれる全ての項目を商品リストに含めずに、特定の項目だけを抜き出して商品リストを作成してよい。特定の項目の例としては、品番と、価格とが挙げられる。これにより、商品リスト作成部F15は、見積もりとして利用可能な商品リストを作成できる。
一変形例では、商品情報提供システム10は、複数のコンピュータにより構成されていてもよい。例えば、商品情報提供システム10の機能(特に、領域設定部F11、文字情報抽出部F12、図情報抽出部F13、商品情報取得部F14、商品リスト作成部F15)は、複数の装置に分散されていてもよい。更に、商品情報提供システム10の機能の少なくとも一部が、例えば、クラウド(クラウドコンピューティング)によって実現されていてもよい。
以上述べた商品情報提供システム10の実行主体は、コンピュータシステムを含んでいる。コンピュータシステムは、ハードウェアとしてのプロセッサ及びメモリを有する。コンピュータシステムのメモリに記録されたプログラムをプロセッサが実行することによって、本開示における商品情報提供システム10の実行主体としての機能が実現される。プログラムは、コンピュータシステムのメモリに予め記録されていてもよいが、電気通信回線を通じて提供されてもよい。また、プログラムは、コンピュータシステムで読み取り可能なメモリカード、光学ディスク、ハードディスクドライブ等の非一時的な記録媒体に記録されて提供されてもよい。コンピュータシステムのプロセッサは、半導体集積回路(IC)又は大規模集積回路(LSI)を含む1乃至複数の電子回路で構成される。LSIの製造後にプログラムされる、フィールド・プログラマブル・ゲート・アレイ(FGPA)、ASIC(application specific integrated circuit)、又はLSI内部の接合関係の再構成又はLSI内部の回路区画のセットアップができる再構成可能な論理デバイスも同じ目的で使うことができる。複数の電子回路は、1つのチップに集約されていてもよいし、複数のチップに分散して設けられていてもよい。複数のチップは、1つの装置に集約されていてもよいし、複数の装置に分散して設けられていてもよい。
3.態様
上記実施形態及び変形例から明らかなように、本開示は、下記の態様を含む。以下では、実施形態との対応関係を明示するためだけに、符号を括弧付きで付している。
第1の態様は、商品情報提供システム(10)であって、文字情報抽出部(F12)と、図情報抽出部(F13)と、商品情報取得部(F14)と、を備える。前記文字情報抽出部(F12)は、商品の記載を含む画像(G10)から、前記商品に関する文字情報(L11~L63)の抽出を行う。前記図情報抽出部(F13)は、前記画像(G10)から、前記商品に関する図情報(I10~I60)の抽出を行う。前記商品情報取得部(F14)は、前記文字情報抽出部(F12)で抽出された前記文字情報(L11~L63)と前記図情報抽出部(F13)で抽出された前記図情報(I10~I60)との少なくとも一方に基づいて、前記商品に対応する商品情報(P10~P60)を取得する。この態様によれば、商品の記載から商品に対応する商品情報(P10~P60)を提供できる。
第2の態様は、第1の態様の商品情報提供システム(10)に基づく。第2の態様では、前記商品情報取得部(F14)は、第1処理と第2処理とを行う機能を有する。前記第1処理は、前記文字情報抽出部(F12)で抽出された前記文字情報(L11~L63)を用いて前記商品に対応する商品情報(P10~P60)を取得する処理である。前記第2処理は、前記図情報抽出部(F13)で抽出された前記図情報(I10~I60)を用いて前記商品に対応する商品情報(P10~P60)を取得する処理である。この態様によれば、商品の記載から商品に対応する商品情報(P10~P60)を提供できる。
第3の態様は、第2の態様の商品情報提供システム(10)に基づく。第3の態様では、前記商品情報取得部(F14)は、前記第1処理を前記第2処理よりも先に実行する。この態様によれば、商品の記載から商品に対応する商品情報を取得する処理の効率の向上が期待できる。
第4の態様は、第3の態様の商品情報提供システム(10)に基づく。第4の態様では、前記商品情報取得部(F14)は、前記第1処理で前記商品に対応する商品情報(P10~P60)を取得できた場合、前記第2処理を実行しない。この態様によれば、商品の記載から商品に対応する商品情報を取得する処理の効率の向上が期待できる。
第5の態様は、第3又は第4の態様の商品情報提供システム(10)に基づく。第5の態様では、前記商品情報取得部(F14)は、前記文字情報抽出部(F12)での前記文字情報(L11~L63)の抽出が失敗した場合、前記第2処理を実行する。この態様によれば、商品の記載から商品に対応する商品情報を取得する処理の効率の向上が期待できる。
第6の態様は、第1~第5の態様のいずれか一つの商品情報提供システム(10)に基づく。第6の態様では、前記文字情報抽出部(F12)は、前記商品の詳細に関する文字列を前記文字情報(L11~L63)として抽出する。この態様によれば、商品情報(P10~P60)の取得の精度が向上し得る。
第7の態様は、第6の態様の商品情報提供システム(10)に基づく。第7の態様では、前記商品情報取得部(F14)は、前記文字情報抽出部(F12)で抽出された前記文字情報(L11~L63)を、1以上の文字列の入力に対して商品情報(P10~P60)を出力する商品検索システム(30)に与えることで、前記商品検索システム(30)から前記商品に対応する商品情報(P10~P60)を取得する。この態様によれば、商品情報(P10~P60)の取得の精度が向上し得る。
第8の態様は、第1~第7の態様のいずれか一つの商品情報提供システム(10)に基づく。第8の態様では、前記図情報抽出部(F13)は、前記商品の外観の図を前記図情報(I10~I60)として抽出する。この態様によれば、商品情報(P10~P60)の取得の精度が向上し得る。
第9の態様は、第8の態様の商品情報提供システム(10)に基づく。第9の態様では、前記商品情報取得部(F14)は、商品の外観の図と商品の種類との関係を学習した学習済みモデル(40)を利用して、前記図情報抽出部(F13)で抽出された前記図情報(I10~I60)に基づいて前記商品に対応する商品情報(P10~P60)を取得する。この態様によれば、商品情報(P10~P60)の取得の精度が向上し得る。
第10の態様は、第1~第9の態様のいずれか一つの商品情報提供システム(10)に基づく。第10の態様では、前記画像(G10)は、複数の商品の記載を含む商品の一覧の画像である。この態様によれば、一度に複数の商品情報(P10~P60)を提供できる。
第11の態様は、第10の態様の商品情報提供システム(10)に基づく。第11の態様では、前記商品情報提供システム(10)は、前記画像(G10)の複数の商品の記載にそれぞれ対応する複数の領域(C10~C60)を設定する領域設定部(F11)を更に備える。前記文字情報抽出部(F12)は、前記複数の領域(C10~C60)のそれぞれに対して、前記文字情報(L11~L63)の抽出を行う。前記図情報抽出部(F13)は、前記複数の領域(C10~C60)毎のそれぞれに対して、前記図情報(I10~I60)の抽出を行う。前記商品情報取得部(F14)は、前記複数の領域(C10~C60)のそれぞれに対して、前記文字情報抽出部(F12)で抽出された前記文字情報(L11~L63)と前記図情報抽出部(F13)で抽出された前記図情報(I10~I60)との少なくとも一方を用いて、前記領域に対応する商品情報(P10~P60)を取得する。この態様によれば、一度に複数の商品情報(P10~P60)を提供できる。
第12の態様は、第11の態様の商品情報提供システム(10)に基づく。第12の態様では、前記複数の領域(C10~C60)のそれぞれに対して前記商品情報取得部(F14)で取得された商品情報(P10~P60)をもとに、商品リスト(W10)を作成する商品リスト作成部(F15)を更に備える。この態様によれば、一度に複数の商品情報(P10~P60)を提供できる。
第13の態様は、第1~第12の態様のいずれか一つの商品情報提供システム(10)に基づく。第13の態様では、前記商品情報(P10~P60)は、商品の品番を含む。この態様によれば、品番を含む商品情報(P10~P60)を提供できる。
第14の態様は、商品情報提供方法であって、商品の記載を含む画像(G10)から、前記商品に関する文字情報(L11~L63)の抽出を行い、前記画像(G10)から、前記商品に関する図情報(I10~I60)の抽出を行う。前記商品情報提供方法は、前記文字情報(L11~L63)と前記図情報(I10~I60)との少なくとも一方を用いて、前記商品に対応する商品情報(P10~P60)を取得する。この態様によれば、商品の記載から商品に対応する商品情報(P10~P60)を提供できる。
第15の態様は、プログラムであって、第14の態様の商品情報提供方法を、1以上のプロセッサに実行させるための、プログラムである。この態様によれば、商品の記載から商品に対応する商品情報(P10~P60)を提供できる。