JP7324262B2 - 不正推定システム、不正推定方法、及びプログラム - Google Patents

不正推定システム、不正推定方法、及びプログラム Download PDF

Info

Publication number
JP7324262B2
JP7324262B2 JP2021181280A JP2021181280A JP7324262B2 JP 7324262 B2 JP7324262 B2 JP 7324262B2 JP 2021181280 A JP2021181280 A JP 2021181280A JP 2021181280 A JP2021181280 A JP 2021181280A JP 7324262 B2 JP7324262 B2 JP 7324262B2
Authority
JP
Japan
Prior art keywords
item
mark
classification
image
fraud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021181280A
Other languages
English (en)
Other versions
JP2022010108A (ja
Inventor
満 中澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Group Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/JP2019/021771 external-priority patent/WO2020240834A1/ja
Application filed by Rakuten Group Inc filed Critical Rakuten Group Inc
Priority to JP2021181280A priority Critical patent/JP7324262B2/ja
Publication of JP2022010108A publication Critical patent/JP2022010108A/ja
Application granted granted Critical
Publication of JP7324262B2 publication Critical patent/JP7324262B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、不正推定システム、不正推定方法、及びプログラムに関する。
近年、有名ブランドなどの標章を無断で利用した不正アイテムの流通が問題となっている。特許文献1には、アイテムに関する情報が記録されたタグをアイテムに取り付けておき、タグに記録された情報を読み取ることによって、アイテムの不正を推定するシステムが知られている。
特開2013-214314号公報
しかしながら、特許文献1の技術では、アイテムに物理的に取り付けられたタグを読み取る必要があるので、例えば、インターネット上に掲載されているアイテムについては、不正を推定することはできなかった。
本発明は上記課題に鑑みてなされたものであって、その目的は、例えばアイテムに物理的にタグを取り付けたりタグを読み取ったりすることなく、アイテムに関する情報から不正を推定することが可能な不正推定システム、不正推定方法、及びプログラムを提供することである。
上記課題を解決するために、本発明に係る不正推定システムは、アイテムに関するアイテム情報を取得するアイテム情報取得手段と、前記アイテム情報に基づいて、前記アイテムの標章を特定する標章特定手段と、前記アイテム情報に基づいて、前記アイテムの分類を特定する分類特定手段と、前記特定された標章と、前記特定された分類と、に基づいて、前記アイテムに関する不正を推定する推定手段と、を含むことを特徴とする。
本発明に係る不正推定方法は、アイテムに関するアイテム情報を取得するアイテム情報取得ステップと、前記アイテム情報に基づいて、前記アイテムの標章を特定する標章特定ステップと、前記アイテム情報に基づいて、前記アイテムの分類を特定する分類特定ステップと、前記特定された標章と、前記特定された分類と、に基づいて、前記アイテムに関する不正を推定する推定ステップと、を含むことを特徴とする。
本発明に係るプログラムは、アイテムに関するアイテム情報を取得するアイテム情報取得手段、前記アイテム情報に基づいて、前記アイテムの標章を特定する標章特定手段、前記アイテム情報に基づいて、前記アイテムの分類を特定する分類特定手段、前記特定された標章と、前記特定された分類と、に基づいて、前記アイテムに関する不正を推定する推定手段、としてコンピュータを機能させる。
本発明の一態様によれば、前記アイテム情報は、前記アイテムが示されたアイテム画像を含み、前記標章特定手段は、前記アイテム画像に基づいて、前記アイテムの標章を特定する、ことを特徴とする。
本発明の一態様によれば、前記不正推定システムは、認識対象の標章が示された画像に基づいて、標章認識器を作成する標章認識器作成手段を更に含み、前記標章特定手段は、前記アイテム画像と、前記標章認識器と、に基づいて、前記アイテムの標章を特定する、ことを特徴とする。
本発明の一態様によれば、前記不正推定システムは、前記認識対象の標章をクエリにして、前記認識対象の標章が示された画像をインターネット上で検索する検索手段を更に含み、前記標章認識器作成手段は、前記検索された画像に基づいて、前記標章認識器を作成する、ことを特徴とする。
本発明の一態様によれば、前記アイテム情報は、前記アイテムが示されたアイテム画像を含み、前記分類特定手段は、前記アイテム画像に基づいて、前記アイテムの分類を特定する、ことを特徴とする。
本発明の一態様によれば、前記不正推定システムは、認識対象の分類の被写体が示された画像に基づいて、分類認識器を作成する分類認識器作成手段を更に含み、前記分類特定手段は、前記アイテム画像と、前記分類認識器と、に基づいて、前記アイテムの分類を特定する、ことを特徴とする。
本発明の一態様によれば、前記分類特定手段は、予め定められた複数の分類の中から、前記アイテムの分類を特定し、前記分類認識器作成手段は、前記複数の分類に基づいて、前記分類認識器を作成する、ことを特徴とする。
本発明の一態様によれば、前記標章特定手段は、前記アイテム画像に基づいて、前記アイテムの標章を特定し、前記不正推定システムは、前記アイテム画像における、前記特定された標章の位置に関する位置情報を取得する位置情報取得手段を更に含み、前記分類特定手段は、前記アイテム画像と、前記位置情報と、に基づいて、前記アイテムの分類を特定する、ことを特徴とする。
本発明の一態様によれば、前記分類特定手段は、前記アイテム画像のうち、前記位置情報に基づいて定まる部分に加工を施し、当該加工が施された画像に基づいて、前記アイテムの分類を特定する、ことを特徴とする。
本発明の一態様によれば、前記不正推定システムは、語の特徴量を計算する特徴量計算器を作成する特徴量計算器作成手段を更に含み、前記推定手段は、前記特徴量計算器により計算された前記特定された標章の特徴量と、前記特徴量計算器により計算された前記特定された分類の特徴量と、に基づいて、前記アイテムに関する不正を推定する、ことを特徴とする。
本発明の一態様によれば、前記特徴量計算器作成手段は、正規アイテムの説明文に基づいて、前記特徴量計算器を作成する、ことを特徴とする。
本発明の一態様によれば、前記不正推定システムは、複数の標章の各々と、少なくとも1つの分類と、が関連付けられた関連付けデータを取得する関連付けデータ取得手段を更に含み、前記推定手段は、前記特定された標章、前記特定された分類、及び前記関連付けデータに基づいて、前記アイテムに関する不正を推定する、ことを特徴とする。
本発明の一態様によれば、前記アイテムは、商品であり、前記アイテム情報は、前記商品に関する商品情報であり、前記標章特定手段は、前記商品情報に基づいて、前記商品の標章を特定し、前記分類特定手段は、前記商品情報に基づいて、前記商品の分類を特定し、前記推定手段は、前記商品に関する不正を推定する、ことを特徴とする。
本発明によれば、アイテムに物理的にタグを取り付けたりタグを読み取ったりすることなく、アイテムに関する情報から不正を推定することが可能となる。
不正推定システムの全体構成を示す図である。 正当なアイテムのアイテム画像を示す図である。 不正なアイテムのアイテム画像を示す図である。 不正推定システムで実現される機能の一例を示す機能ブロック図である。 アイテムデータベースのデータ格納例を示す図である。 標章画像データベースのデータ格納例を示す図である。 分類画像データベースのデータ格納例を示す図である。 アイテム画像のうち標章部分に加工が施される様子を示す図である。 事前処理の一例を示すフロー図である。 推定処理の一例を示すフロー図である。 変形例(1)における機能ブロック図である。 関連付けデータのデータ格納例を示す図である。
[1.不正推定システムの全体構成]
以下、本発明に係る不正推定システムの実施形態の例を説明する。図1は、不正推定システムの全体構成を示す図である。図1に示すように、不正推定システムSは、サーバ10、ユーザ端末20、及び管理者端末30を含み、これらは、インターネットなどのネットワークNに接続可能である。なお、図1では、サーバ10、ユーザ端末20、及び管理者端末30の各々を1台ずつ示しているが、これらは複数台あってもよい。
サーバ10は、サーバコンピュータである。サーバ10は、制御部11、記憶部12、及び通信部13を含む。制御部11は、少なくとも1つのプロセッサを含む。制御部11は、記憶部12に記憶されたプログラムやデータに従って処理を実行する。記憶部12は、主記憶部及び補助記憶部を含む。例えば、主記憶部はRAMなどの揮発性メモリであり、補助記憶部は、ROM、EEPROM、フラッシュメモリ、又はハードディスクなどの不揮発性メモリである。通信部13は、有線通信又は無線通信用の通信インタフェースであり、ネットワークNを介してデータ通信を行う。
ユーザ端末20は、ユーザが操作するコンピュータである。例えば、ユーザ端末20は、携帯電話機(スマートフォンを含む)、携帯情報端末(タブレット型コンピュータを含む)、又はパーソナルコンピュータ等である。本実施形態では、ユーザ端末20は、制御部21、記憶部22、通信部23、操作部24、及び表示部25を含む。制御部21、記憶部22、及び通信部23の物理的構成は、それぞれ制御部11、記憶部12、及び通信部13と同様であってよい。
操作部24は、入力デバイスであり、例えば、タッチパネルやマウス等のポインティングデバイス、キーボード、又はボタン等である。操作部24は、ユーザによる操作内容を制御部21に伝達する。表示部25は、例えば、液晶表示部又は有機EL表示部等である。表示部25は、制御部21の指示に従って画像を表示する。
管理者端末30は、管理者が操作するコンピュータである。例えば、管理者端末30は、携帯電話機(スマートフォンを含む)、携帯情報端末(タブレット型コンピュータを含む)、又は、パーソナルコンピュータ等である。本実施形態では、管理者端末30は、制御部31、記憶部32、通信部33、操作部34、及び表示部35を含む。制御部31、記憶部32、通信部33、操作部34、及び表示部35の物理的構成は、それぞれ制御部21、記憶部22、通信部23、操作部24、及び表示部25と同様であってよい。
なお、記憶部12,22,32に記憶されるものとして説明するプログラム及びデータは、ネットワークNを介して供給されるようにしてもよい。また、上記説明した各コンピュータのハードウェア構成は、上記の例に限られず、種々のハードウェアを適用可能である。例えば、コンピュータ読み取り可能な情報記憶媒体を読み取る読取部(例えば、光ディスクドライブやメモリカードスロット)や外部機器とデータの入出力をするための入出力部(例えば、USBポート)が含まれていてもよい。例えば、情報記憶媒体に記憶されたプログラムやデータが読取部や入出力部を介して、各コンピュータに供給されるようにしてもよい。
[2.不正推定システムの概要]
本実施形態では、ユーザがユーザ端末20を操作して、SNSや掲示板などに対する投稿を行う場面を例に挙げて、不正推定システムSの処理を説明する。サーバ10は、管理者端末30から所定の要求を受信した場合に、ユーザの投稿に含まれるアイテム画像を解析してアイテムの標章と分類を特定し、これらの組み合わせに基づいて、アイテムに関する不正を推定する。
アイテム画像は、アイテムが示された画像である。別の言い方をすれば、アイテム画像は、アイテムが被写体の画像である。アイテム画像には、アイテムが撮影されている。アイテム画像は、カメラが生成した撮影画像そのものであってもよいし、撮影画像が加工された画像であってもよい。本実施形態では、ユーザが撮影したアイテムのアイテム画像が、サーバ10にアップロードされる。
アイテムは、標章が付された物体である。別の言い方をすれば、アイテムは、アイテム画像における被写体である。アイテムは、商取引の対象であってもよいし、特に商取引の対象ではなくてもよい。アイテムは、任意の物体であってよく、例えば、衣料品、食料品、家具、家電、文具、玩具、雑貨、又は乗物などであってよい。アイテムには、標章が直接的に印刷されてもよいし、標章が印刷されたシールや布などの物体が付着されていてもよい。なお、アイテムは、有体物に限られず、画像や動画などの無体物であってもよい。
標章は、アイテムの識別情報である。標章は、ロゴ又はエンブレムと呼ばれることもある。例えば、標章は、商品名、メーカ名、販売者名、ブランド名、店舗名、又は系列グループ名などの文字列を含む。また例えば、商品、メーカ、販売者、ブランド、店舗、又は系列グループなどを示す図形を含む。標章は、文字及び図形に限られず、例えば、記号、立体的形状、色彩、又は音声であってもよいし、これらの組み合わせであってもよい。標章は、平面的に示されてもよいし、立体的に示されてもよい。また、標章は、見た目が特に変化しなくてもよいし、見た目が変化してもよい。例えば、標章は、時間経過によって見た目が変化する動画のようなものであってもよいし、角度によって見た目が変化するホログラムのようなものであってもよい。
分類は、アイテムの種類又は性質を示す情報である。分類は、ジャンル、カテゴリ、ラベル、区分、又は属性と呼ばれることもある。分類は、アイテムの用途などに応じて定めておけばよく、例えば、アイテムは、予め定められた複数の分類のうちの少なくとも1つに属する。アイテムは、1つの分類だけに属してもよいし、複数の分類に属してもよい。また、分類は、階層的に定義されていてもよいし、特に階層化されていなくてもよい。
アイテムに関する不正とは、アイテムの標章と分類の組み合わせが不自然なことである。別の言い方をすれば、アイテムに関する不正は、正当な権利者が提供するアイテムでは考えられない標章と分類の組み合わせであることを意味する。例えば、標章を使用する権利を有する権利者が製造又は許諾していない分類のアイテムに対し、当該権利者の標章を付することは、アイテムに関する不正に相当する。別の言い方をすれば、正当なアイテムの分類とは異なる分類のアイテムに対し、標章が付されることは、アイテムに関する不正に相当する。
アイテムに関する不正の推定とは、アイテムの標章と分類の組み合わせが不自然であることを推定すること(例えば、不正なアイテムであるか否かの出力までは行わずに、アイテムの標章と分類の組み合わせが不自然であるか否かを判定する処理まで)を意味してもよいし、不正なアイテムであるか否かを推定することまでを含む意味であってもよい。
ユーザは、正当なアイテムの口コミなどを投稿することもあれば、模倣品(海賊版)などの不正なアイテムを購入して口コミなどを投稿することもある。不正なアイテムの投稿がなされると、標章の正当な権利者に不利益を与えたり、他のユーザに誤った情報が提供されたりする可能性がある。このため、サーバ10は、アイテム画像を解析することによって、正当なアイテムであるか、不正なアイテムであるかの推定をするようにしている。
図2は、正当なアイテムのアイテム画像を示す図である。ここでは、靴メーカが、自社ブランドの靴に対し、星形の標章m1を付して販売している場合を例に挙げて説明する。サーバ10は、ユーザが投稿したアイテム画像I1を解析し、アイテムi1に付された標章m1と、アイテムi1の分類(ここでは、靴)と、を特定する。これらの特定方法については、後述する。図2の例であれば、靴メーカの標章m1が、靴メーカが販売する靴に対して付されているので、標章とアイテムの組み合わせは、自然(妥当)な組み合わせである。このため、サーバ10は、アイテムi1が不正なアイテムではなく正当なアイテムである、と推定する。
図3は、不正なアイテムのアイテム画像を示す図である。ここでは、靴メーカは、自社ブランドの標章m1を付したカップを販売しておらず、ノベルティ等でも提供していないものとする。サーバ10は、ユーザが投稿したアイテム画像I2を解析し、アイテムi2に付された標章m1と、アイテムi2の分類(ここでは、カップ)と、を特定する。靴メーカは、標章m1を付したカップを販売しておらず、ノベルティ等でも提供していないので、これらは不自然な組み合わせであり、悪意のある者が勝手に標章を借用した模倣品等である蓋然性が高い。このため、サーバ10は、アイテムi1が不正なアイテムであると推定する。
以上のように、本実施形態の不正推定システムSは、アイテム画像を解析して標章と分類を特定する。不正推定システムSは、これらの組み合わせが自然であれば、アイテム画像に示されたアイテムが正当なアイテムであると推定する。一方、不正推定システムSは、これらの組み合わせが不自然であれば、アイテム画像に示されたアイテムが不正なアイテムであると推定する。これにより、管理者が目視でアイテム画像を判断して不正を推定するといった手間を軽減するようにしている。以降、不正推定システムSの詳細を説明する。
[3.不正推定システムにおいて実現される機能]
図4は、不正推定システムSで実現される機能の一例を示す機能ブロック図である。図4に示すように、サーバ10では、データ記憶部100、検索部101、標章認識器作成部102、分類認識器作成部103、特徴量計算器作成部104、アイテム画像取得部105、標章特定部106、位置情報取得部107、分類特定部108、及び推定部109が実現される。
[3-1.データ記憶部]
データ記憶部100は、記憶部12を主として実現される。データ記憶部100は、本実施形態で説明する処理を実行するために必要なデータを記憶する。ここでは、データ記憶部100が記憶するデータの一例として、アイテムデータベースDB1、標章画像データベースDB2、及び分類画像データベースDB3について説明する。
図5は、アイテムデータベースDB1のデータ格納例を示す図である。図5に示すように、アイテムデータベースDB1は、不正の推定対象となるアイテムに関する情報が格納されたデータベースである。例えば、アイテムデータベースDB1には、アイテムを一意に識別するアイテムID、アップロードされたアイテム画像、アイテムの説明文、標章特定部106により特定された標章を識別する標章情報、分類特定部108により特定された分類を識別する分類情報、及び推定部109による推定結果が格納される。
説明文は、アイテムに関する文章であり、例えば、アイテムの特徴や感想などが記述される。本実施形態では、ユーザが自由に説明文を入力可能であるものとするが、ユーザが選択した定型文などであってもよい。標章情報は、アイテムの標章を識別可能な情報であればよく、例えば、標章を一意に識別するIDであってもよいし、標章を示す文字列であってもよい。同様に、分類情報は、アイテムの分類を識別可能な情報であればよく、例えば、分類を一意に識別するIDであってもよいし、分類を示す文字列であってもよい。なお、説明文以外にも、アイテムの特徴を示す表や画像などがアイテムデータベースDB1に格納されていてもよいし、ユーザがアイテムに対して指定した標章や分類を識別する情報がアイテムデータベースDB1に格納されていてもよい。
図6は、標章画像データベースDB2のデータ格納例を示す図である。図6に示すように、標章画像データベースDB2は、標章画像が格納されたデータベースであり、例えば、標章情報と、少なくとも1つの標章画像と、が格納される。後述するように、本実施形態では、標章画像がネット検索によって取得されるので、標章情報は、検索時のクエリとされた文字列であってもよいし、当該文字列が変換されたIDであってもよい。
標章画像は、後述する標章認識器M1を作成するために用いられる画像である。標章画像は、原則として、正当なアイテムの画像であるものとするが、不正なアイテムの画像が一部に混じっていてもよい。標章画像は、アイテムデータベースDB1に格納されたアイテム画像であってもよいし、特にアイテムデータベースDB1には格納されていない画像であってもよい。本実施形態では、後述する検索部101により検索された標章画像が標章画像データベースDB2に格納される。後述する標章認識器M1の学習時には、標章画像中の標章部分以外の部分をマスク又はインペインティング等の加工をしたうえで学習されてもよいし、特にこれらの加工をせずに学習されてもよい。
図7は、分類画像データベースDB3のデータ格納例を示す図である。図7に示すように、分類画像データベースDB3は、分類画像が格納されたデータベースであり、例えば、分類画像データベースDB3には、分類情報ごとに、少なくとも1つの分類画像が格納される。
分類画像は、後述する分類認識器M2を作成するために用いられる画像である。分類画像は、一般的な物体の形状を学習させるための画像である。本実施形態では、分類画像には、アイテムだけが示されており、標章が示されていないものとするが、分類画像には、標章が付されたアイテムが分類画像に示されていてもよい。この場合、後述する分類認識器M2の学習時には、分類画像中の標章部分をマスク又はインペインティング等の加工をしたうえで学習されてもよいし、特にこれらの加工をせずに学習されてもよい。
なお、分類画像は、アイテムデータベースDB1に格納されたアイテム画像であってもよいし、特にアイテムデータベースDB1には格納されていない画像であってもよい。本実施形態では、研究目的で画像を提供する他のシステムからダウンロードされた画像が分類画像に相当する場合を説明するが、特に他のシステムからダウンロードされた画像でなくてもよく、管理者が自ら分類画像を用意してもよい。
なお、データ記憶部100に記憶されるデータは、上記の例に限られない。例えば、データ記憶部100は、標章を認識するための標章認識器M1を記憶する。標章認識器M1は、プログラム(アルゴリズム)やパラメータなどを含み、本実施形態では、画像認識で用いられる機械学習モデルを例に挙げて説明する。機械学習自体は、公知の種々の手法を適用可能であり、例えば、CNN(Convolutional Neural Network)、ResNet(Residual Network)、又はRNN(Recurrent Neural Network)を利用可能である。標章認識器M1は、アイテム画像又はその特徴量を入力すると、アイテム画像における標章及びその位置に関する位置情報を出力する。なお、標章認識器M1は、特に標章の位置情報を出力しなくてもよい。
例えば、標章認識器M1は、上記説明した例以外にも、CAM、YOLO、又はSSDと呼ばれる手法を利用可能である。これらの手法によれば、標章の認識結果と、認識の際に着目された部分に関する情報(例えば、ヒートマップ)と、の両方を出力可能である。例えば、画像における標章の位置(例えば、バウンディングボックス)がアノテーションされている場合には、YOLO又はSSDを利用すれば、標章だけではなく、その位置まで検出することができる。また例えば、標章の位置がアノテーションされていない場合であっても、標章認識器M1とは別に、Grad-CAMと呼ばれる手法を利用することで、標章認識器M1が標章の認識に着目した部分に関する情報(例えば、ヒートマップ)が出力されるので、標章の大まかな位置を推定可能である。
また例えば、データ記憶部は、分類認識器M2を記憶する。分類認識器M2は、プログラム(アルゴリズム)やパラメータなどを含み、本実施形態では、画像認識で用いられる機械学習モデルを例に挙げて説明する。標章認識器M1と同様、分類認識器M2についても、機械学習自体は、公知の種々の手法を適用可能である。例えば、分類認識器M2についても、CNN、ResNet、又はRNNといった手法を利用可能である。分類認識器M2は、アイテム画像又はその特徴量を入力すると、アイテム画像に示されたアイテムの分類を出力する。
また例えば、データ記憶部は、特徴量計算器M3を記憶する。特徴量計算器M3は、プログラム(アルゴリズム)、パラメータ、及び単語を特徴量に変換するための辞書データなどを含み、本実施形態では、自然言語処理で利用される機械学習モデルを例に挙げて説明する。標章認識器M1及び分類認識器M2と同様、特徴量計算器M3についても、公知の種々の手法を適用可能である。例えば、特徴量計算器M3は、Word2Vec又はGloveと呼ばれる手法を利用可能である。特徴量計算器M3は、文字列を入力すると、その意味を示す特徴量を出力する。本実施形態では、特徴量がベクトル形式で示されるものとするが、特徴量は、任意の形式で示されてよく、例えば、配列形式であってもよいし、単一の数値で示されてもよい。
[3-2.検索部]
検索部101は、制御部11を主として実現される。検索部101は、認識対象の標章をクエリにして、認識対象の標章が示された画像をインターネット上で検索する。検索自体は、ポータルサイトなどで提供されている公知の種々の検索エンジンを利用可能である。また、検索範囲は、任意の範囲であってよく、例えば、ポータルサイトから検索可能な範囲(インターネット上の全範囲)であってもよいし、オンラインショッピングモールなどの特定のデータベースの範囲であってもよい。
例えば、検索部101は、管理者端末30から管理者が入力した標章の文字列を取得し、当該取得した文字列をクエリとして、画像検索を実行する。検索部101は、クエリとなった商標に関連付けて、検索でヒットした画像の全部又は一部を、標章画像として標章画像データベースDB2に格納する。例えば、検索部101は、検索時のスコアが高い順に所定数の画像を取得し、標章画像として標章画像データベースDB2に格納する。また例えば、検索結果の中からランダムに選択した画像を標章画像として標章画像データベースDB2に格納する。また例えば、検索部101は、管理者端末30の表示部35に検索結果を表示させ、管理者が選択した画像を標章画像として標章画像データベースDB2に格納する。
なお、検索部101は、少なくとも1つの標章画像を標章画像データベースDB2に格納すればよく、その数は、任意であってよい。例えば、検索部101は、予め定められた所定数の標章画像を標章画像データベースDB2に格納してもよいし、検索時のスコアが閾値以上の標章画像の全部又は一部を標章画像データベースDB2に格納してもよい。また、本実施形態では、標章の文字列をクエリとする場合を説明するが、標章が示された画像をクエリとし、類似画像が検索されてもよい。この場合、クエリとなる画像は、1つだけであってもよいし、標章に対する光の当たり具合や角度などを互いに変えた複数の画像をクエリとしてもよい。
[3-3.標章認識器作成部]
標章認識器作成部102は、制御部11を主として実現される。標章認識器作成部102は、認識対象の標章が示された標章画像に基づいて、標章認識器M1を作成する。標章認識器M1の作成とは、標章認識器M1のモデルを調整することであり、例えば、標章認識器M1のアルゴリズム又はパラメータを調整することである。本実施形態では、検索部101により標章画像が検索されるので、標章認識器作成部102は、検索された画像に基づいて、標章認識器M1を作成することになる。
例えば、標章認識器作成部102は、標章画像データベースDB2に格納された標章画像に基づいて、標章画像又はその特徴量を入力とし、標章画像に示された標章を出力とする教師データを取得する。標章認識器作成部102は、当該取得された教師データに基づいて、標章認識器M1を学習させる。学習自体は、公知の機械学習で用いられる手法を利用可能であり、例えば、CNN、ResNet、又はRNNの学習方法を利用可能である。標章認識器作成部102は、教師データが示す入出力の関係が得られるように、標章認識器M1を作成する。
[3-4.分類認識器作成部]
分類認識器作成部103は、制御部11を主として実現される。分類認識器作成部103は、認識対象の分類の被写体が示された画像に基づいて、分類認識器M2を作成する。分類認識器M2の作成とは、分類認識器M2のモデルを調整することであり、例えば、分類認識器M2のアルゴリズム又はパラメータを調整することである。本実施形態では、他のシステムから取得された分類画像が用意されているので、標章認識器作成部102は、当該分類画像に基づいて、分類認識器M2を作成することになる。
例えば、分類認識器作成部103は、分類画像データベースDB3に格納された分類画像に基づいて、分類画像又はその特徴量を入力とし、分類画像に示された分類を出力とする教師データを取得する。標章認識器作成部102は、当該取得された教師データに基づいて、標章認識器M1を学習させる。学習自体は、公知の機械学習で用いられる手法を利用可能であり、例えば、CNN、ResNet、又はRNNの学習方法を利用可能である。分類認識器作成部103は、教師データが示す入出力の関係が得られるように、分類認識器M2を作成する。
本実施形態では、複数の分類が予め用意されているので、分類認識器作成部103は、当該複数の分類の各々の分類情報に基づいて、分類認識器M2を作成する。当該分類は、管理者により指定された分類であればよく、例えば、オンラインショッピングモールで取り扱う商品のジャンル又はカテゴリであってもよい。分類認識器作成部103は、予め定められた複数の分類の何れかの分類情報を出力するように、分類認識器M2を調整する。
[3-5.特徴量計算器作成部]
特徴量計算器作成部104は、制御部11を主として実現される。特徴量計算器作成部104は、語の特徴量を計算する特徴量計算器M3を作成する。特徴量計算器M3の作成とは、特徴量計算器M3のモデルを調整することであり、例えば、特徴量計算器M3のアルゴリズム又はパラメータを調整したり、特徴量計算器M3の辞書データを作成したりすることである。
特徴量計算器M3の作成方法自体は、公知の手法を利用可能であり、例えば、Word2Vec又はGloveと呼ばれる手法を利用可能である。例えば、特徴量計算器作成部104は、正規アイテムの説明文に基づいて、特徴量計算器M3を作成してもよい。正規アイテムは、推定部109の推定結果が不正ではなかったアイテムである。例えば、特徴量計算器作成部104は、アイテムデータベースDB1に格納された説明文に基づいて、特徴量計算器M3を作成する。
なお、特徴量計算器作成部104は、アイテムデータベースDB1に格納された説明文ではなく、他のシステムから文書データベースを取得して特徴量計算器M3を作成してもよいし、管理者が用意した文書データベースを取得して特徴量計算器M3を作成してもよい。文書データベースは、例えば、百科事典を提供するウェブサイトの記事、まとめサイトの記事、又はオンラインショッピングモールにおける商品説明文といった任意のデータベースを利用可能である。
[3-6.アイテム画像取得部]
アイテム画像取得部105は、制御部11を主として実現される。アイテム画像取得部105は、アイテムが示されたアイテム画像を取得する。例えば、アイテム画像取得部105は、アイテムデータベースDB1を参照し、処理対象となるアイテム画像を取得する。アイテム画像取得部105は、少なくとも1つのアイテム画像を取得すればよく、アイテム画像を1つだけ取得してもよいし、複数のアイテム画像を取得してもよい。
なお、アイテム画像は、アイテム情報に含まれる情報の一例である。このため、本実施形態でアイテム画像と記載した箇所は、アイテム情報と読み替えることができる。アイテム情報は、アイテムに関する情報を含めばよく、画像以外にも、例えば、文字列、表、図、動画、又は音声といった他の情報を含んでいてもよいし、これらの複数を含んでいてもよい。
[3-7.標章特定部]
標章特定部106は、制御部11を主として実現される。標章特定部106は、アイテム画像に基づいて、アイテムの標章を特定する。ここでの特定とは、アイテム画像の中から、アイテムの標章を抽出することである。標章特定部106は、標章を文字列又はIDとして特定してもよいし画像として特定してもよい。
本実施形態では、標章認識器作成部102により標章認識器M1が作成されるので、標章特定部106は、アイテム画像と、標章認識器M1と、に基づいて、アイテムの標章を特定する。標章特定部106は、アイテム画像又はその特徴量を標章認識器M1に入力する。標章認識器M1は、入力されたアイテム画像又は特徴量に基づいて、アイテム画像に示された標章を識別する標章情報を出力する。標章特定部106は、標章認識器M1の出力を取得することによって、アイテムの標章を特定する。
なお、標章の特定方法は、標章認識器M1を利用した方法に限られず、種々の画像解析技術を利用可能である。例えば、標章特定部106は、見本画像とのパターンマッチングを利用して、アイテム画像からアイテムの標章を特定してもよい。この場合、標章の基本形状を示す見本画像をデータ記憶部100に記憶させておき、標章特定部106は、アイテム画像の中から見本画像と類似する部分の有無を判定することによって、アイテムの標章を特定する。他にも例えば、標章特定部106は、アイテム画像から特徴点又は輪郭線を抽出し、特徴点又は輪郭線のパターンに基づいて、アイテムの標章を特定してもよい。
[3-8.位置情報取得部]
位置情報取得部107は、制御部11を主として実現される。位置情報取得部107は、アイテム画像における、特定された標章の位置に関する位置情報を取得する。本実施形態では、標章認識器M1が、アイテム画像に示された標章の位置に関する位置情報を出力するので、位置情報取得部107は、標章認識器M1から出力された位置情報を取得する。
位置情報は、アイテム画像のうち、標章が示された画像部分の位置を示す情報である。本実施形態では、位置情報が、標章を囲むバウンディングボックスの位置を示す場合を説明するが、位置情報は、バウンディングボックスではなく、標章を示す何れかの画素の位置を示してもよい。例えば、位置情報は、アイテム画像に設定された二次元座標軸の座標情報によって示される。二次元座標軸は、アイテム画像の所定位置を原点として設定されるようにすればよく、例えば、アイテム画像の左上を原点とし、右方向にX軸が設定され、下方向にY軸が設定される。
なお、標章認識器M1ではなく、パターンマッチングによって標章を特定する場合には、位置情報取得部107は、アイテム画像のうち、見本画像と類似する部分を特定することによって、位置情報を取得してもよい。他にも例えば、位置情報取得部107は、アイテム画像のうち、標章部分と推定される特徴点又は輪郭線を特定することによって、位置情報を取得してもよい。
[3-9.分類特定部]
分類特定部108は、制御部11を主として実現される。分類特定部108は、アイテム画像に基づいて、アイテムの分類を特定する。ここでの特定とは、複数の分類の中で、アイテム画像に示されたアイテムが属する分類を判定することである。分類特定部108は、予め定められた複数の分類の中から、アイテムの分類を特定する。
本実施形態では、分類認識器作成部103により分類認識器M2が作成されるので、分類特定部108は、アイテム画像と、分類認識器M2と、に基づいて、アイテムの分類を特定する。分類特定部108は、アイテム画像又はその特徴量を分類認識器M2に入力する。分類認識器M2は、入力されたアイテム画像又は特徴量に基づいて、アイテム画像に示されたアイテムの分類を識別する分類情報を出力する。分類特定部108は、分類認識器M2の出力を取得することによって、アイテムの分類を特定する。
また、本実施形態では、分類特定部108は、アイテム画像と、位置情報と、に基づいて、アイテムの分類を特定する。例えば、分類特定部108は、アイテム画像のうち、位置情報に基づいて定まる部分に加工を施し、当該加工が施された画像に基づいて、アイテムの分類を特定する。ここでの加工は、標章部分の特徴が低下又は無くなる画像処理加工であればよく、例えば、標章部分をマスクすること、標章部分を所定の色又は周囲の色で塗りつぶすこと、又は標章部分にぼかし処理を施すことである。他にも例えば、色だけでなく、テクスチャや形状等についても周囲と調和するように塗りつぶし(いわゆるコンテンツに応じた塗りつぶし)が行われてもよい。
図8は、アイテム画像のうち標章部分に加工が施される様子を示す図である。図8に示すように、例えば、分類特定部108は、アイテム画像I2のうち、標章部分を示すバウンディングボックスb1に対し、マスク等の加工をしたうえで、アイテムの分類を特定する。分類特定部108は、加工したアイテム画像又はその特徴量を分類認識器M2に入力し、分類認識器M2の出力を取得することによって、アイテムの分類を特定する。
なお、分類の特定方法は、分類認識器M2を利用した方法に限られず、種々の画像解析技術を利用可能である。例えば、分類特定部108は、見本画像とのパターンマッチングを利用して、アイテム画像からアイテムの分類を特定してもよい。この場合、各分類に属する物体の基本形状を示す見本画像をデータ記憶部100に記憶させておき、分類特定部108は、アイテム画像の中から見本画像と類似する部分の有無を判定することによって、アイテムの分類を特定する。他にも例えば、分類特定部108は、アイテム画像から特徴点又は輪郭線を抽出し、特徴点又は輪郭線のパターンに基づいて、アイテムの分類を特定してもよい。
[3-10.推定部]
推定部109は、制御部11を主として実現される。推定部109は、標章特定部106により特定された標章と、分類特定部108により特定された分類と、に基づいて、アイテムに関する不正を推定する。例えば、推定部109は、標章と分類の組み合わせが自然(妥当)な組み合わせであるか否かを判定する。推定部109は、標章と分類の組み合わせが自然な組み合わせである場合に、アイテムに関する不正がないと推定し、標章と分類の組み合わせが不自然な組み合わせである場合に、アイテムに関する不正があると推定する。
また例えば、推定部109は、アイテムの標章と分類の組み合わせに基づいて、所定の基準を満たすか否かを判定する。この基準は、アイテムが不正であるか否かの判定基準であればよく、本実施形態では、標章の特徴量と分類の特徴量の距離に関する基準である場合を説明する。なお、基準は、特徴量の距離に限られず、後述する変形例のように、標章と分類が所定の組み合わせであるか否かを判定してもよい。他にも例えば、標章と分類を入力とし、不正の推定結果を出力とする機械学習モデルを用意しておき、推定部109は、当該機械学習モデルを利用することによって、不正を推定してもよい。
本実施形態では、推定部109は、特徴量計算器M3により計算された標章の特徴量と、特徴量計算器M3により計算された分類の特徴量と、に基づいて、アイテムに関する不正を推定する。例えば、推定部109は、標章特定部106により特定された標章を示す文字列を特徴量計算器M3に入力し、特徴量計算器M3により計算された特徴量を取得する。また例えば、推定部109は、分類特定部108により特定された分類を示す文字列を特徴量計算器M3に入力し、特徴量計算器M3により計算された特徴量を取得する。なお、標章情報が文字列である場合には、当該文字列がそのまま特徴量計算器M3に入力され、標章情報がIDである場合には、IDが文字列に変換されたうえで特徴量計算器M3に入力される。同様に、分類情報が文字列である場合には、当該文字列がそのまま特徴量計算器M3に入力され、分類情報がIDである場合には、IDが文字列に変換されたうえで特徴量計算器M3に入力される。
推定部109は、標章の特徴量と分類の特徴量の差異が閾値以上であるか否かを判定する。本実施形態では、特徴量がベクトル形式で示されるので、差異は、ベクトル空間における距離である。特徴量が他の形式で示される場合には、差異は、数値の差であってよい。推定部109は、差異が閾値未満である場合に、アイテムに関する不正がないと推定し、差異が閾値以上である場合に、アイテムに関する不正があると推定する。推定部109は、アイテム画像に関連付けて、推定結果をアイテムデータベースDB1に格納する。
なお、推定部109により不正と推定された場合、その後には、任意の処理が実行されてよい。例えば、管理者端末30に不正と推定されたアイテム画像の一覧を表示させ、管理者により選択されたアイテム画像については、サーバ10から削除するようにしてもよい。また例えば、管理者は、不正と推定されたアイテム画像を投稿したユーザに対し、電子メール等で連絡を取ってアイテムについて確認をしてもよい。また例えば、不正と推定されたアイテム画像については、サーバ10から強制的に削除されるようにしてもよい。
[4.本実施形態において実行される処理]
次に、本実施形態において実行される処理を説明する。ここでは、標章認識器M1、分類認識器M2、及び特徴量計算器M3を作成するための事前処理と、アイテムの不正を推定するための推定処理と、について説明する。
[4-1.事前処理]
図9は、事前処理の一例を示すフロー図である。図9に示す事前処理は、制御部11,31が記憶部12,32に記憶されたプログラムに従って動作することによって実行される。下記に説明する処理は、図4に示す機能ブロックにより実行される処理の一例である。なお、ここでは、標章認識器M1、分類認識器M2、及び特徴量計算器M3の各々が、一連の処理の中で作成される場合を説明するが、これらは別個の処理で作成されてもよい。
図9に示すように、管理者端末30において、制御部31は、サーバ10に対し、管理者が入力した標章をクエリとした標章画像の検索要求を送信する(S100)。S100においては、管理者は、操作部34からクエリとする標章の文字列を入力する。制御部31は、管理者が入力した文字列をクエリとする検索要求を送信する。
サーバ10においては、検索要求を受信すると、制御部11は、管理者が入力した標章をクエリとして、インターネット上の標章画像を検索する(S101)。ここでは、制御部11は、検索でヒットした所定数の標章画像を取得するものとするが、検索結果を管理者端末30に送信し、管理者による選択を受け付けるようにしてもよい。
制御部11は、S101で検索した標章画像を、標章画像データベースDB2に格納する(S102)。S102においては、制御部11は、管理者が入力した標章と、S101で取得した標章画像と、を関連付けて標章画像データベースDB2に格納する。
制御部11は、標章画像データベースDB2に格納された標章画像に基づいて、標章認識器M1を作成する(S103)。S103においては、制御部11は、標章画像又はその特徴量を入力とし、管理者が入力した標章を出力とする教師データを作成する。制御部11は、作成された教師データに基づいて、標章認識器M1を学習させる。
管理者端末30において、制御部31は、サーバ10に対し、分類認識器M2の作成要求を送信する(S104)。分類認識器M2の作成要求は、予め定められた形式の情報が送信されることによって行われるようにすればよい。なお、ここでは、分類画像データベースDB3に予め分類画像が格納されている場合を説明するが、分類認識器M2の作成要求に分類画像が含まれていてもよい。他にも例えば、サーバ10が、分類認識器M2の作成要求を受信した場合に、他のシステムから分類画像をダウンロードしてもよい。
サーバ10においては、分類認識器M2の作成要求を受信すると、制御部11は、分類画像データベースDB3に格納された分類画像に基づいて、分類認識器M2を作成する(S105)。S105においては、制御部11は、分類画像又はその特徴量を入力とし、分類画像に関連付けられた分類を出力とする教師データを作成する。制御部11は、作成された教師データに基づいて、分類認識器M2を学習させる。
管理者端末30において、制御部31は、サーバ10に対し、特徴量計算器M3の作成要求を送信する(S106)。特徴量計算器M3の作成要求は、予め定められた形式の情報が送信されることによって行われるようにすればよい。なお、ここでは、アイテムデータベースDB1の説明文を利用する場合を説明するが、特徴量計算器M3の作成要求に、特徴量計算器M3の作成に必要な文書データが含まれていてもよい。他にも例えば、サーバ10が、特徴量計算器M3の作成要求を受信した場合に、他のシステムから文書データをダウンロードしてもよい。
サーバ10においては、特徴量計算器M3の作成要求を受信すると、制御部11は、アイテムデータベースDB1に基づいて、特徴量計算器M3を作成し(S107)、本処理は終了する。S107においては、制御部11は、アイテムデータベースDB1に格納された説明文を単語に分割し、特徴量を計算する関数を利用して、各単語を特徴量化することによって、特徴量計算器M3を作成する。
[4-2.推定処理]
図10は、推定処理の一例を示すフロー図である。図10に示す推定処理は、制御部11,31が記憶部12,32に記憶されたプログラムに従って動作することによって実行される。下記に説明する処理は、図4に示す機能ブロックにより実行される処理の一例である。
図10に示すように、まず、管理者端末30において、制御部31は、サーバ10に対し、推定処理の実行要求を送信する(S200)。推定処理の実行要求は、予め定められた形式の情報が送信されることによって行われるようにすればよい。なお、ここでは、アイテムデータベースDB1に推定結果が格納されていないアイテム画像が処理対象となる場合を説明するが、推定処理の実行要求に、処理対象とするアイテム画像のアイテムIDが含まれていてもよい。また、推定処理は、管理者からの指示ではなく、他の任意のタイミングで実行されてよい。例えば、推定処理は、定期的に実行されてもよいし、アイテム画像が所定枚数蓄積されたことに応じて実行されてもよい。
サーバ10においては、推定処理の実行要求を受信すると、制御部11は、アイテムデータベースDB1に基づいて、処理対象のアイテム画像を取得する(S201)。S201においては、制御部11は、アイテムデータベースDB1を参照し、推定結果が格納されていないアイテム画像の何れかを取得する。
制御部11は、処理対象のアイテム画像と、標章認識器M1と、に基づいて、アイテムの標章と位置情報を特定する(S202)。S202においては、制御部11は、アイテム画像又はその特徴量を標章認識器M1に入力する。標章認識器M1は、入力されたアイテム画像又は特徴量に基づいて、学習済みの複数の標章のうちの少なくとも1つを示す標章情報と、標章の位置情報と、を出力する。制御部11は、標章認識器M1の出力結果を取得する。なお、標章認識器M1が標章の位置情報を出力する機能を持たない場合には、制御部11は、Grad-CAM等を利用して位置情報を取得すればよい。
制御部11は、処理対象のアイテム画像、S202で取得した標章の位置情報、及び分類認識器M2に基づいて、アイテムの分類を特定する(S203)。S203においては、制御部11は、アイテム画像のうち位置情報が示す領域に対し、マスク又はインペインティング等の加工を行う。制御部11は、加工されたアイテム画像又はその特徴量を標章認識器M1に入力する。標章認識器M1は、入力されたアイテム画像又は特徴量に基づいて、学習済みの複数の分類のうちの少なくとも1つを示す分類情報を出力する。制御部11は、標章認識器M1から出力された分類情報を取得する。
制御部11は、特徴量計算器M3に基づいて、S202で特定した標章の特徴量と、S203で特定した分類の特徴量と、の距離を計算する(S204)。S204においては、制御部11は、特徴量計算器M3に標章情報を入力し、標章の特徴量を取得する。制御部11は、特徴量計算器M3に分類情報を入力し、分類の特徴量を取得する。制御部11は、標章の特徴量と分類の特徴量との距離を計算する。
制御部11は、標章の特徴量と分類の特徴量の距離が閾値以上であるか否かを判定する(S205)。閾値は、予め定められた値であればよく、固定値であってもよいし、可変値であってもよい。閾値を可変値とする場合には、標章及び分類の少なくとも一方に基づいて決定されるようにすればよい。
距離が閾値以上であると判定された場合(S205;Y)、制御部11は、アイテムを不正と推定する(S206)。S206においては、制御部11は、処理対象のアイテム画像に関連付けて、アイテムの標章情報、分類情報、及び推定結果をアイテムデータベースDB1に格納する。
一方、距離が閾値未満であると判定された場合(S205;N)、制御部11は、アイテムを正当と推定する(S207)。S207においては、制御部11は、処理対象のアイテム画像に関連付けて、アイテムの標章情報、分類情報、及び推定結果をアイテムデータベースDB1に格納する。
制御部11は、アイテムデータベースDB1に基づいて、処理対象の全てのアイテム画像に対して推定を行ったか否かを判定する(S208)。S208においては、制御部11は、まだ推定結果が取得されていないアイテム画像が存在するか否かを判定する。
まだ推定を行っていないアイテム画像が存在する場合(S208;N)、S201の処理に戻り、次のアイテム画像に対する処理が実行される。一方、全てのアイテム画像に対して推定を行った場合(S208;Y)、本処理は終了する。
以上説明した不正推定システムSによれば、アイテム画像に基づいて、アイテムの標章とアイテムの分類とを特定し、これらの組み合わせに基づいて、アイテムに関する不正を推定することで、アイテムに物理的にタグを取り付けたりタグを読み取ったりすることなく、アイテムに関する情報から不正を推定することができる。例えば、従来技術のように、アイテムに物理的なタグを取り付ける手法では、管理者がわざわざ店舗等に出向いてタグを読み取らなければならないが、不正推定システムSによれば、アイテム画像があれば不正を推定することができるので、迅速に不正を検出することができる。即ち、アイテム画像が投稿等されてから不正を検出するまでを早くすることができる。また、管理者等が目視で不正を判断する必要がなく、アイテムの不正を推定する手間を軽減することができる。例えば、アイテムの現物がなかったとしても、アイテム画像などの情報から不正を推定することができるので、管理者自らアイテム画像を視認して不正を判断するといった手間をなくすことができる。
また、アイテムの説明文などのように、投稿者によって自由に入力することができる情報に基づいて、アイテムの標章を特定しようとしても、このような情報は、誤魔化しやすく信憑性が低いので、不正を見抜くのが難しいことがある。この点、不正推定システムSは、誤魔化すことが比較的難しいアイテム画像に基づいて、アイテムの標章を特定することにより、不正を推定する精度を高めることができる。また、説明文などの情報がそもそも存在しなかったとしても、アイテム画像さえあれば、不正を推定することができる。
また、不正推定システムSは、認識対象の標章が示された標章画像に基づいて、標章認識器M1を作成し、アイテム画像と標章認識器M1とに基づいて、アイテムの標章を特定することで、標章を特定する精度を高めることができる。その結果、アイテムの不正を推定する精度も高めることができる。
また、不正推定システムSは、認識対象の標章をクエリにして、認識対象の標章が示された標章画像をインターネット上で検索し、検索された画像に基づいて、標章認識器M1を作成することで、より手軽に標章画像を収集し、標章認識器M1を作成する手間を軽減することができる。また、インターネット上に存在する種々の標章画像を利用することで、標章認識器M1の精度を効果的に高めることができる。その結果、アイテムの不正を推定する精度も高めることができる。
また、アイテムの説明文などのように、投稿者によって自由に入力することができる情報に基づいて、アイテムの分類を特定しようとしても、このような情報は、誤魔化しやすく信憑性が低いので、不正を見抜くのが難しいことがある。この点、不正推定システムSは、誤魔化すことが比較的難しいアイテム画像に基づいて、アイテムの分類を特定することにより、不正を推定する精度を高めることができる。また、説明文などの情報がそもそも存在しなかったとしても、アイテム画像さえあれば、不正を推定することができる。
また、不正推定システムSは、認識対象の分類の被写体が示された分類画像に基づいて、分類認識器M2を作成し、アイテム画像と分類認識器M2とに基づいて、アイテムの分類を特定することで、分類を特定する精度を高めることができる。その結果、アイテムの不正を推定する精度も高めることができる。
また、不正推定システムSは、予め定められた複数の分類の中から、アイテムの分類を特定し、複数の分類に基づいて、分類認識器M2を作成することで、分類認識器M2の精度を効果的に高めることができる。その結果、アイテムの不正を推定する精度も高めることができる。
また、不正推定システムSは、アイテム画像における標章の位置に関する位置情報を取得し、アイテム画像と位置情報とに基づいて、アイテムの分類を特定することで、分類を特定する精度を高めることができる。
また、不正推定システムSは、アイテム画像のうち、位置情報に基づいて定まる部分を加工したうえで分類を推定することにより、標章部分の影響を強く受けることによって誤った分類がなされるといったことを防止することができる。その結果、アイテムの不正を推定する精度も高めることができる。
また、不正推定システムSは、語の特徴量を計算する特徴量計算器M3を作成し、特徴量計算器M3により計算された特定された標章の特徴量と、特徴量計算器M3により計算された特定された分類の特徴量と、に基づいて、アイテムに関する不正を推定することで、アイテムの不正を推定する精度を高めることができる。例えば、後述する変形例のように、標章と分類の関連付けを予め用意することも考えられるが、この場合、管理者が誤った関連付けを指定してしまったり、関連付けの指定が漏れていたりした場合には、不正の推定精度が低下する可能性がある。この点、語の特徴量という客観的な指標を利用してアイテムの不正を推定することにより、不正の推定精度が低下するといったことを防止することができる。
また、不正推定システムSは、正規アイテムの説明文に基づいて、特徴量計算器M3を作成することで、特徴量計算器M3の精度を高めることができる。例えば、不正アイテムの説明文については、悪意のあるユーザがわざと不正な文章を入力する可能性があるが、このような説明文を排除することによって、特徴量計算器M3の精度を高めることができる。その結果、アイテムの不正を推定する精度も高めることができる。
[5.変形例]
なお、本発明は、以上に説明した実施の形態に限定されるものではない。本発明の趣旨を逸脱しない範囲で、適宜変更可能である。
(1)例えば、推定部109による不正の推定方法は、実施形態で説明した例に限られない。推定部109は、アイテムの標章と分類の組み合わせが自然であるか否かを判定すればよく、例えば、これらの自然な組み合わせ、又は、これらの不自然な組み合わせを予め用意しておいてもよい。
図11は、変形例(1)における機能ブロック図である。図11に示すように、変形例(1)では、データ記憶部100が関連付けデータDT1を記憶し、実施形態で説明した機能に加えて、データ取得部110が実現される。データ取得部110は、制御部11を主として実現される。なお、変形例(1)では、データ記憶部100は、特徴量計算器M3を記憶しなくてもよく、不正推定システムSは、特徴量計算器作成部104を含まなくてもよい。
図12は、関連付けデータDT1のデータ格納例を示す図である。図12に示すように、関連付けデータDT1には、複数の標章の各々の標章情報と、少なくとも1つの分類の分類情報と、が格納されている。別の言い方をすれば、関連付けデータDT1には、標章情報ごとに、少なくとも1つの分類情報が格納されている。ここでは、関連付けデータDT1に、標章と分類の自然な組み合わせが定義されている場合を説明するが、関連付けデータDT1には、標章と分類の不自然な組み合わせが定義されていてもよい。
ここでは、管理者が関連付けデータDT1を用意する場合を説明するが、関連付けデータDT1は、アイテムデータベースDB1の統計を取ることによって自動的に生成されてもよい。例えば、管理者は、アイテムの製造者のカタログやホームページなどを利用して、標章と分類の自然な組み合わせを特定する。管理者は、管理者端末30の操作部34からこれらの組み合わせを入力して関連付けデータDT1を作成し、サーバ10にアップロードする。サーバ10は、管理者がアップロードした関連付けデータDT1を受信すると、データ記憶部100に格納する。
データ取得部110は、複数の標章の各々と、少なくとも1つの分類と、が関連付けられた関連付けデータDT1を取得する。本変形例では、関連付けデータDT1がデータ記憶部100に記憶されているので、データ取得部110は、データ記憶部100に記憶された関連付けデータDT1を取得する。
推定部109は、特定された標章、特定された分類、及び関連付けデータDT1に基づいて、アイテムに関する不正を推定する。例えば、標章と分類の自然な組み合わせが関連付けデータDT1に定義されている場合、推定部109は、アイテムの標章と分類の組み合わせが関連付けデータDT1に存在するか否かを判定する。推定部109は、これらの組み合わせが関連付けデータDT1に存在する場合、アイテムに関する不正がないと推定し、これらの組み合わせが関連付けデータDT1に存在しない場合、アイテムに関する不正があると推定する。
なお、標章と分類の不自然な組み合わせが関連付けデータDT1に定義されている場合には、推定部109は、アイテムの標章と分類の組み合わせが関連付けデータDT1に存在しない場合、アイテムに関する不正がないと推定し、これらの組み合わせが関連付けデータDT1に存在する場合、アイテムに関する不正があると推定する。
変形例(1)によれば、特定された標章、特定された分類、及び関連付けデータDT1に基づいて、アイテムに関する不正を推定することによって、不正を推定する手間を軽減することができる。例えば、実施形態で説明した手法では、サーバ10は、特徴量計算器M3を作成したり特徴量を計算したりする必要があるが、変形例(1)の手法では、このような処理を実行する必要がないため、簡易な処理で不正を推定することができ、サーバ10の処理負荷を軽減することもできる。
(2)また例えば、実施形態では、SNSや掲示板などに対して投稿されたアイテム画像に基づいて、アイテムに関する不正が推定される場合を説明したが、不正推定システムSは、他の任意の場面に適用可能である。例えば、オンラインショッピングモールに出品されている商品に関する不正を判定する場面に、不正推定システムSを利用してもよい。
本変形例では、サーバ10は、オンラインショッピングモールのウェブサイトを管理する。ユーザ端末20を操作するユーザは、オンラインショッピングモールに出店している店舗のスタッフなどである。ユーザは、自身の店舗で取り扱っている商品に関する商品情報をサーバ10にアップロードする。アイテムデータベースDB1には、店舗が販売する商品を一意に識別するアイテムID、商品画像であるアイテム画像、商品の説明文、標章認識器M1により特定された標章を識別する標章情報、分類認識器M2により特定された分類を識別する分類情報、及び推定部109の推定結果が格納される。これらの情報に基づいて、商品を購入するための商品ページが表示される。
本変形例では、アイテムは、商品であり、アイテム情報は、商品に関する商品情報となる。商品は、オンラインショッピングモールにおける取引の対象となる物であればよい。商品情報は、商品に関する基本情報であればよく、店舗のスタッフなどであるユーザによって入力された情報であればよい。
標章特定部106は、商品情報に基づいて、商品の標章を特定し、分類特定部108は、商品情報に基づいて、商品の分類を特定する。標章と分類の特定方法自体は、実施形態で説明した通りである。推定部109は、商品に関する不正を推定する。不正の推定方法は、実施形態で説明した手法を利用してもよいし、変形例(1)で説明した手法を利用してもよい。例えば、管理者は、不正と推定されたアイテムを購入するページを表示させないようにしたり、当該アイテムを販売する店舗にペナルティを与えたりする。
なお、アイテムデータベースDB1には、店舗が指定した商品の分類を識別する分類情報、商品のタイトル、商品の価格、及び商品の在庫などの他の情報が格納されてもよい。この場合、分類特定部108は、分類認識器M2を利用せずに、店舗が指定した分類情報を参照することによって、商品の分類を特定してもよい。同様に、標章特定部106は、商品の説明文又はタイトルから標章を特定してもよい。
変形例(2)によれば、商品情報に基づいて、商品の標章と商品の分類を特定し、商品に関する不正を推定することで、不正な商品が販売されることを防止することができる。
(3)また例えば、実施形態では、アイテム情報の一例としてアイテム画像を説明したが、アイテム情報は、文字列、動画、又は音声といった他の情報であってもよい。例えば、アイテム情報が文字列である場合、標章特定部106は、アイテムに関連付けられた文字列に、標章を示す文字列が含まれているか否かを判定することによって、標章を特定してもよい。この場合、位置情報は、文章全体の中における標章の文字列の位置を示すことになる。分類特定部108は、アイテムに関連付けられた文字列に、分類を示す文字列が含まれているか否かを判定したり、アイテムに関連付けられた分類情報を参照したりすることによって、分類を特定してもよい。また例えば、分類特定部108は、位置情報が示す標章部分の文字列を隠したうえで、アイテムの分類を特定してもよい。
また例えば、アイテム情報が動画である場合、標章特定部106及び分類特定部108は、動画を構成する個々の画像に対し、実施形態又は変形例で説明した手法を利用して、標章及び分類を特定すればよい。また例えば、アイテム情報が音声である場合には、標章は、CMなどで使用されている音声となる。標章特定部106は、アイテム情報の音声を解析し、標章を示す波形が得られたか否かを判定することによって、標章を特定する。分類特定部108は、音声を解析することによって分類を特定してもよいし、文字列や画像などの他の情報が存在する場合には、当該他の情報を参照することによって分類を特定してもよい。
また例えば、標章特定部106は、アイテム画像を参照して標章を特定し、分類特定部108は、説明文や分類情報を参照して分類を特定するといったように、アイテム情報に含まれる別々の項目を参照することによって、標章と分類が特定されるようにしてもよい。
また例えば、主な機能がサーバ10で実現される場合を説明したが、各機能は、複数のコンピュータで分担されてもよい。例えば、サーバ10、ユーザ端末20、及び管理者端末30の各々で機能が分担されてもよい。例えば、分類などの処理がサーバ10で実行されるのではなく、ユーザ端末20又は管理者端末30で実行されてもよい。また例えば、不正推定システムSが複数のサーバコンピュータを含む場合には、これら複数のサーバコンピュータで機能が分担されてもよい。また例えば、データ記憶部100で記憶されるものとして説明したデータは、サーバ10以外のコンピュータによって記憶されてもよい。

Claims (7)

  1. アイテムに関するアイテム情報であって、前記アイテムの説明文を含む前記アイテム情報を取得するアイテム情報取得手段と、
    前記アイテム情報のうちの前記説明文のみから、前記アイテムの標章を示す文字列を抽出する標章抽出手段と、
    前記説明文全体の中における前記標章の前記文字列の位置を示す位置情報を取得し、前記アイテム情報の前記説明文のうち、当該位置情報が示す標章部分を隠し、当該隠された説明文のみから、前記アイテムのジャンル又はカテゴリである分類を示す文字列を抽出する分類抽出手段と、
    複数の標章の各々を示す文字列と、少なくとも1つの分類を示す文字列と、が関連付けられた関連付けデータを取得する関連付けデータ取得手段と、
    前記説明文のみから抽出された標章と、前記隠された説明文のみから抽出された分類と、の組み合わせが前記関連付けデータに存在するか否かを判定することによって、前記アイテムに関する不正を推定する推定手段と、
    を含む不正推定システム。
  2. 前記関連付けデータには、前記複数の標章の各々を示す文字列と、前記少なくとも1つの分類を示す文字列と、の自然な組み合わせが定義されている
    請求項1に記載の不正推定システム。
  3. 前記推定手段は、前記説明文のみから抽出された標章と、前記隠された説明文のみから抽出された分類と、の組み合わせが前記関連付けデータに存在する場合に、前記不正がないと推定し、前記説明文のみから抽出された標章と、前記隠された説明文のみから抽出された分類と、の組み合わせが前記関連付けデータに存在しない場合に、前記不正があると推定する、
    請求項に記載の不正推定システム。
  4. 前記関連付けデータには、前記複数の標章の各々を示す文字列と、前記少なくとも1つの分類を示す文字列と、の不自然な組み合わせが定義されている
    請求項1に記載の不正推定システム。
  5. 前記推定手段は、前記説明文のみから抽出された標章と、前記隠された説明文のみから抽出された分類と、の組み合わせが前記関連付けデータに存在しない場合に、前記不正がないと推定し、前記説明文のみから抽出された標章と、前記隠された説明文のみから抽出された分類と、の組み合わせが前記関連付けデータに存在する場合に、前記不正があると推定する、
    請求項に記載の不正推定システム。
  6. コンピュータが、
    アイテムに関するアイテム情報であって、前記アイテムの説明文を含む前記アイテム情報を取得するアイテム情報取得ステップと、
    前記アイテム情報のうちの前記説明文のみから、前記アイテムの標章を示す文字列を抽出する標章抽出ステップと、
    前記説明文全体の中における前記標章の前記文字列の位置を示す位置情報を取得し、前記アイテム情報の前記説明文のうち、当該位置情報が示す標章部分を隠し、当該隠された説明文のみから、前記アイテムのジャンル又はカテゴリである分類を示す文字列を抽出する分類抽出ステップと、
    複数の標章の各々を示す文字列と、少なくとも1つの分類を示す文字列と、が関連付けられた関連付けデータを取得する関連付けデータ取得ステップと、
    前記説明文のみから抽出された標章と、前記隠された説明文のみから抽出された分類と、の組み合わせが前記関連付けデータに存在するか否かを判定することによって、前記アイテムに関する不正を推定する推定ステップと、
    実行する不正推定方法。
  7. アイテムに関するアイテム情報であって、前記アイテムの説明文を含む前記アイテム情報を取得するアイテム情報取得手段、
    前記アイテム情報のうちの前記説明文のみから、前記アイテムの標章を示す文字列を抽出する標章抽出手段、
    前記説明文全体の中における前記標章の前記文字列の位置を示す位置情報を取得し、前記アイテム情報の前記説明文のうち、当該位置情報が示す標章部分を隠し、当該隠された説明文のみから、前記アイテムのジャンル又はカテゴリである分類を示す文字列を抽出する分類抽出手段、
    複数の標章の各々を示す文字列と、少なくとも1つの分類を示す文字列と、が関連付けられた関連付けデータを取得する関連付けデータ取得手段、
    前記説明文のみから抽出された標章と、前記隠された説明文のみから抽出された分類と、の組み合わせが前記関連付けデータに存在するか否かを判定することによって、前記アイテムに関する不正を推定する推定手段、
    としてコンピュータを機能させるためのプログラム。
JP2021181280A 2019-05-31 2021-11-05 不正推定システム、不正推定方法、及びプログラム Active JP7324262B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021181280A JP7324262B2 (ja) 2019-05-31 2021-11-05 不正推定システム、不正推定方法、及びプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
PCT/JP2019/021771 WO2020240834A1 (ja) 2019-05-31 2019-05-31 不正推定システム、不正推定方法、及びプログラム
JP2020503831A JP6975312B2 (ja) 2019-05-31 2019-05-31 不正推定システム、不正推定方法、及びプログラム
JP2021181280A JP7324262B2 (ja) 2019-05-31 2021-11-05 不正推定システム、不正推定方法、及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020503831A Division JP6975312B2 (ja) 2019-05-31 2019-05-31 不正推定システム、不正推定方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2022010108A JP2022010108A (ja) 2022-01-14
JP7324262B2 true JP7324262B2 (ja) 2023-08-09

Family

ID=87852795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021181280A Active JP7324262B2 (ja) 2019-05-31 2021-11-05 不正推定システム、不正推定方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP7324262B2 (ja)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005038492A (ja) 2003-07-18 2005-02-10 Teac Corp 電子機器の搭載部品識別方法及び搭載部品の識別が可能な電子機器
WO2009044826A1 (ja) 2007-10-02 2009-04-09 Elady Limited. 物品判定システム及び物品判定方法
JP5816393B1 (ja) 2014-03-31 2015-11-18 楽天株式会社 商品評価装置、方法及びプログラム
JP2017116977A (ja) 2015-12-21 2017-06-29 ヤフー株式会社 予測装置、予測方法、及び予測プログラム
US20180075495A1 (en) 2015-04-17 2018-03-15 Mi-Na YU Apparatus for appraising article
WO2018125984A1 (en) 2016-12-30 2018-07-05 Camelot Uk Bidco Limited Systems and methods for harvesting data associated with fraudulent content in a networked environment
JP2018528516A (ja) 2015-09-09 2018-09-27 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 製品画像がロゴパターンを含むかどうかを判定するためのシステムおよび方法
JP2019057245A (ja) 2017-09-22 2019-04-11 大日本印刷株式会社 情報処理装置及びプログラム
JP6501855B1 (ja) 2017-12-07 2019-04-17 ヤフー株式会社 抽出装置、抽出方法、抽出プログラム及びモデル

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005038492A (ja) 2003-07-18 2005-02-10 Teac Corp 電子機器の搭載部品識別方法及び搭載部品の識別が可能な電子機器
WO2009044826A1 (ja) 2007-10-02 2009-04-09 Elady Limited. 物品判定システム及び物品判定方法
JP5816393B1 (ja) 2014-03-31 2015-11-18 楽天株式会社 商品評価装置、方法及びプログラム
US20180075495A1 (en) 2015-04-17 2018-03-15 Mi-Na YU Apparatus for appraising article
JP2018528516A (ja) 2015-09-09 2018-09-27 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 製品画像がロゴパターンを含むかどうかを判定するためのシステムおよび方法
JP2017116977A (ja) 2015-12-21 2017-06-29 ヤフー株式会社 予測装置、予測方法、及び予測プログラム
WO2018125984A1 (en) 2016-12-30 2018-07-05 Camelot Uk Bidco Limited Systems and methods for harvesting data associated with fraudulent content in a networked environment
JP2019057245A (ja) 2017-09-22 2019-04-11 大日本印刷株式会社 情報処理装置及びプログラム
JP6501855B1 (ja) 2017-12-07 2019-04-17 ヤフー株式会社 抽出装置、抽出方法、抽出プログラム及びモデル

Also Published As

Publication number Publication date
JP2022010108A (ja) 2022-01-14

Similar Documents

Publication Publication Date Title
US10210423B2 (en) Image match for featureless objects
CN107748754B (zh) 一种知识图谱完善方法和装置
US10467674B2 (en) Visual search in a controlled shopping environment
US20210157869A1 (en) Information sending method, apparatus and system, and computer-readable storage medium
US9817900B2 (en) Interactive clothes searching in online stores
US10013633B1 (en) Object retrieval
JP5075291B2 (ja) 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体
JP6975312B2 (ja) 不正推定システム、不正推定方法、及びプログラム
CN108520196B (zh) 奢侈品辨别方法、电子装置及存储介质
US8880563B2 (en) Image search by query object segmentation
WO2020253063A1 (zh) 一种相似图片的检索方法及装置
US20120117072A1 (en) Automated Product Attribute Selection
US20210035187A1 (en) Device and method for item recommendation based on visual elements
CN106776619A (zh) 用于确定目标对象的属性信息的方法和装置
Tsai et al. Learning and recognition of on-premise signs from weakly labeled street view images
CN104685501A (zh) 响应于可视化查询标识文本词汇
US11164234B2 (en) Image searching apparatus, printed material, and image searching method
TW201112134A (en) Face recognition apparatus and methods
US10949460B2 (en) Product indexing method and system thereof
Kim et al. Illumination invariant head pose estimation using random forests classifier and binary pattern run length matrix
CN114898192A (zh) 模型训练方法、预测方法、设备、存储介质及程序产品
JP7324262B2 (ja) 不正推定システム、不正推定方法、及びプログラム
Trappey et al. Intelligent trademark recognition and similarity analysis using a two-stage transfer learning approach
JP7351344B2 (ja) 学習装置、学習方法、推論装置、推論方法、及び、プログラム
KR101468457B1 (ko) 스마트 상품 검색 제공 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221130

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230621

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230728

R150 Certificate of patent or registration of utility model

Ref document number: 7324262

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150