JP7345012B2 - 情報処理システム、情報処理方法およびプログラム - Google Patents

情報処理システム、情報処理方法およびプログラム Download PDF

Info

Publication number
JP7345012B2
JP7345012B2 JP2022081114A JP2022081114A JP7345012B2 JP 7345012 B2 JP7345012 B2 JP 7345012B2 JP 2022081114 A JP2022081114 A JP 2022081114A JP 2022081114 A JP2022081114 A JP 2022081114A JP 7345012 B2 JP7345012 B2 JP 7345012B2
Authority
JP
Japan
Prior art keywords
correspondence
image
unit
information processing
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022081114A
Other languages
English (en)
Other versions
JP2022109313A (ja
Inventor
満 中澤
高志 友岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Group Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Group Inc filed Critical Rakuten Group Inc
Priority to JP2022081114A priority Critical patent/JP7345012B2/ja
Publication of JP2022109313A publication Critical patent/JP2022109313A/ja
Application granted granted Critical
Publication of JP7345012B2 publication Critical patent/JP7345012B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means

Description

本発明は情報処理システム、情報処理方法およびプログラムに関する。
電子商取引において中古品などの商品を販売するサービスがある。そのようなサービスでは、販売者が商品についての画像と説明文とを入力し、購入者がその商品のページにアクセスすると、画像と説明文とが表示され、購入者はその画像と説明文とから、その商品を購入するか検討する。
特許文献1には、出品者から受信した商品画像に基づいて、出品者によって過去に購入された商品の画像の中から類似する類似画像を検索し、検索された類似画像に対応する商品情報を含む出品ページを生成するシステムが開示されている。
特開2014-115912号公報
説明文の内容と画像とがわかりやすく対応せず、商品の説明がわかりにくくなるケースがある。例えばユーザのミスにより説明文において言及された箇所の画像が存在しないケースや、説明文がどの画像の説明をしているか把握しづらいケースでは、商品の説明がわかりにくくなることが懸念される。このような場合には説明文と画像から買い手側のユーザが商品を把握する負担が重くなる。
本発明は上記課題を鑑みてなされたものであって、その目的は、説明文と画像とから商品をより容易に把握することを可能にするための技術を提供することにある。
上記課題を解決するために、本発明にかかる情報処理システムは、電子商取引プラットフォームを提供する情報処理システムであって、商品に関する説明文と1または複数の画像とを取得する取得部と、前記説明文から物体を特定する特定部と、前記1または複数の画像のそれぞれから物体を検出する検出部と、前記説明文から特定された物体と、前記画像から検出された物体との対応に基づいて対応情報を生成する対応部と、を含む。
また、本発明にかかる情報処理方法は、電子商取引プラットフォームを提供するための情報処理方法であって、商品に関する説明文と1または複数の画像とを取得するステップと、前記説明文から物体を特定するステップと、前記1または複数の画像のそれぞれから物体を検出するステップと、前記説明文から特定された物体と、前記画像から前記検出された物体との対応に基づいて対応情報を生成するステップと、を含む。
また、本発明にかかるプログラムは、電子商取引プラットフォームにより取り扱われる商品に関する説明文と1または複数の商品画像とを取得する取得部、前記説明文から1または複数の説明対象を抽出する抽出部、前記説明文から物体を特定する特定部、前記1または複数の画像のそれぞれから物体を検出する検出部、および、前記説明文から特定された物体と、前記画像から前記検出された物体との対応に基づいて対応情報を生成する対応部、としてコンピュータを機能させる。
本発明の一形態では、前記特定部は前記説明文から物体の一部に関する言及部を特定し、前記検出部は、前記1または複数の画像のそれぞれから物体および当該物体の被撮影部を検出し、前記対応部は、前記特定部が特定した物体の言及部と、前記検出部が検出した物体の被撮影部との対応に基づいて対応情報を生成してよい。
本発明の一形態では、前記対応部は、前記説明文から特定された物体のうち、前記画像から検出されたいずれの物体とも対応しない物体を示す情報を含む対応情報を生成してよい。
本発明の一形態では、前記対応部は、前記説明文から特定された物体の言及部のうち、前記画像から検出されたいずれの物体の被撮影部とも対応しない言及部を示す情報を含む対応情報を生成してよい。
本発明の一形態では、情報処理システムは、前記対応情報に基づいて画像の追加を促す通知が表示されるよう制御する表示制御部をさらに含んでよい。
本発明の一形態では、前記対応部は、前記画像から検出された物体と、前記説明文に含まれる文章であって、当該検出された物体に対応し前記説明文から特定された物体を含む文章との対応を示す対応情報を生成し、譲歩処理システムは、前記対応情報に基づいて、ユーザが指し示す画像に含まれる物体に対応する前記文章が表示されるよう制御する表示制御部をさらに含んでよい。
本発明の一形態では、前記表示制御部は、前記画像においてユーザが指し示す物体に対応する前記文章が表示されるよう制御してよい。
本発明により、ユーザは、説明文と画像とから商品をより容易に把握することができる。
本発明の実施形態にかかる情報処理システムの一例を示す図である。 情報処理システムが実現する機能を示すブロック図である。 情報処理システムの処理を概略的に示すフロー図である。 入力される画像の一例を示す図である。 説明文解析部の処理の一例を示すフロー図である。 説明文に含まれる文章と、その文章から特定される物体語および部分語の一例を示す図である。 画像から検出される物体および被撮影部を示す図である。 対応生成部の処理の一例を示すフロー図である。 物体対応テーブルに格納される情報を説明する図である。 セット対応テーブルに格納される情報を説明する図である。 対応生成部の処理の一例を示すフロー図である。 生成されるメッセージの一例を示す図である。 対応生成部の処理の他の一例を示す図である。 表示制御部の処理の他の一例を示す図である。 画像上にポインタがある場合に出力される文章の一例を示す図である。
以下では、本発明の実施形態を図面に基づいて説明する。同じ符号を付された構成に対しては、重複する説明を省略する。本実施形態では、商品を販売するユーザ(販売者)から商品についての画像と説明文とを取得し、その入力された画像および説明文をチェックし、その画像と説明文とを用いた商品説明ページを、購入側のユーザ(購入候補者)に提示する情報処理システムについて説明する。情報処理システムは、例えば中古商品を販売する中古商品の販売システムである。
図1は、本発明の実施形態にかかる情報処理システムの一例を示す図である。情報処理システムは、情報処理サーバ1と1または複数の顧客端末2とを含む。顧客端末2は、例えばスマートフォンやパーソナルコンピュータなどであり、情報処理システムにより提供されるサービスのユーザ(販売者または購入候補者)により操作される。
情報処理サーバ1は、1または複数の顧客端末2と通信し、販売者であるユーザが操作する顧客端末2から商品の説明情報と商品に関する1または複数の画像とを受信し、説明情報および画像をサービス内に登録する。また購入候補者となるユーザに対して説明情報および画像を提示する。説明情報は、販売者が売る商品を説明するための情報であり、例えば、その商品の説明文、価格に関する情報、商品の種類を示す情報、購入時期といった情報を含む。商品の種類は、例えばメーカーや製品名である。
情報処理サーバ1はプロセッサ11、記憶部12、通信部13、入出力部14を含む。なお、情報処理サーバ1は、サーバコンピュータである。情報処理サーバ1の処理は、複数のサーバコンピュータにより実現されてもよい。
プロセッサ11は、記憶部12に格納されているプログラムに従って動作する。またプロセッサ11は通信部13、入出力部14を制御する。なお、上記プログラムは、インターネット等を介して提供されるものであってもよいし、フラッシュメモリやDVD-ROM等のコンピュータで読み取り可能な記憶媒体に格納されて提供されるものであってもよい。
記憶部12は、RAMおよびフラッシュメモリ等のメモリ素子とハードディスクドライブのような外部記憶装置とによって構成されている。記憶部12は、上記プログラムを格納する。また、記憶部12は、プロセッサ11、通信部13、入出力部14から入力される情報や演算結果を格納する。記憶部12は、受信された説明情報と複数の画像とを格納してよい。また、受信された説明情報と複数の画像とを格納するために、情報処理サーバ1と異なるストレージが設けられてもよい。
通信部13は、他の装置と通信する機能を実現するものであり、例えば無線LAN、有線LANを実現する集積回路などにより構成されている。通信部13は、プロセッサ11の制御に基づいて、他の装置から受信した情報をプロセッサ11や記憶部12に入力し、他の装置に情報を送信する。
入出力部14は、表示出力デバイスをコントロールするビデオコントローラや、入力デバイスからのデータを取得するコントローラなどにより構成される。入力デバイスとしては、キーボード、マウス、タッチパネルなどがある。入出力部14は、プロセッサ11の制御に基づいて、表示出力デバイスに表示データを出力し、入力デバイスをユーザが操作することにより入力されるデータを取得する。表示出力デバイスは例えば外部に接続されるディスプレイ装置である。
次に、情報処理システムが提供する機能について説明する。図2は、情報処理システムが実現する機能を示すブロック図である。情報処理システムは、情報取得部51、説明文解析部52、画像解析部53、対応生成部54、表示制御部55を含む。これらの機能は、情報処理サーバ1に含まれるプロセッサ11によって記憶部12に格納されるプログラムが実行され、通信部13などを制御することにより実現される。なお、表示制御部55は、顧客端末2に含まれる図示されないプロセッサ11、記憶部12、通信部13、入出力部14によって実現されてもよい。この場合、顧客端末2に含まれるプロセッサ11によって記憶部12に格納されるプログラムが実行され、入出力部14などを制御することにより表示制御部55が実現される。
情報取得部51は、商品に関する説明文を含む説明情報と、1または複数の画像とを販売者であるユーザが操作する顧客端末2から取得する。1または複数の画像は、販売者が販売する商品に関するものであり、その商品に含まれる1または複数の物体が撮影されたものであってよい。
説明文解析部52は、説明情報に含まれる説明文を解析することにより、その説明文から物体語を特定する。説明文解析部52は、さらに説明文からその物体の一部に関する部分語を特定してよい。物体語は物体を示す言葉であり、部分語はその物体の部分を示す言葉である。
画像解析部53は、1または複数の画像のそれぞれから物体を検出する。画像解析部53は、さらに、その物体のうち撮影されている部分である被撮影部を検出してよい。
対応生成部54は、説明文から特定された物体語と、前記画像から検出された物体との対応に基づいて対応情報を生成する。対応生成部54は、説明文から特定された物体の部分語と、画像から検出された物体の被撮影部との対応に基づいて対応情報を生成してもよい。
対応情報は、説明文から特定された物体語と、画像から検出された物体との対応関係を示す情報であってもよいし、画像から検出されたいずれの物体とも対応しない物体語(部分語であってもよい)を示す情報であってもよい。また、対応情報は、画像から検出された物体と、説明文に含まれる文章であって、その検出された物体に対応しかつ説明文から特定された物体を含む文章との対応を示す情報であってもよい。ここで「文章」は、本明細書においては、1以上の単語で構成され句点で終わる文字列である1つの文であってもよいし、複数の文により構成されてもよい。
表示制御部55は、対応情報に基づいて顧客端末2に情報を表示させるよう制御することにより、その情報をユーザに提示する。提示される情報は、画像から検出されたいずれの物体とも対応しない物体語または部分語に相当する画像の入力を販売者へ促す情報であってもよいし、購入候補者に対して表示される、画像および説明文を含む商品ページであってもよい。提示される情報が商品ページである場合には、表示制御部55は、購入候補者であるユーザが指し示す画像に含まれる物体に対応する文章が表示されるよう制御してよい。
図3は、情報処理システムの処理を概略的に示すフロー図である。図3に示される処理は、主に、販売者が商品を登録する際に行われる処理である。はじめに、図示はしていないが、顧客端末2は販売対象となる商品を登録する画面を出力し、ユーザがその画面において入力した説明情報、および複数の画像を、情報処理サーバ1に向けて送信する。
情報取得部51は、顧客端末2より、説明文を含む説明情報と1または複数の画像とを受信する(ステップS101)。
図4は、入力される画像の一例を示す図である。図4の例では、商品に関する画像として、ユーザにより撮影されたスマートフォン80の画像が示されている。より具体的には、この画像は、スマートフォン80の表側の面(正面)の画像を含む。
次に、説明文解析部52は、受信された説明文から、物体を示す言葉である物体語と、その物体の一部を言及する言葉である部分語とを特定する(ステップS102)。なお、物体の種類や説明文の記載によっては、説明文解析部52は、少なくとも一部の物体について物体語のみ特定してもよい。
図5は、説明文解析部52の処理の一例を示すフロー図である。はじめに、説明文解析部52は、形態素解析および構文解析により、説明文から複数の単語およびそれらの単語間の関係を抽出する(ステップS201)。形態素解析および構文解析については公知の技術であるので詳細の説明を省略する。
説明文解析部52は、単語の係り受けに基づいて、説明文に含まれる文章のうち、物体の存在を示す文章を抽出する(ステップS202)。例えば、説明文解析部52は、物があることを示す単語または単語群(例えば「あります」)が存在する文章を抽出し、物が無いことを示す単語または単語群(例えば「ありません」)が存在する文章を抽出しなくてもよい。以下の処理は抽出された文章に含まれる単語について行われる。
次に説明文解析部52は、抽出された文章に含まれる単語から、物体を示す単語である物体語を特定し(ステップS203)、物体の部分を示す単語である部分語を特定する(ステップS204)。説明文解析部52は、抽出された単語が予め準備された物体辞書に格納された単語のいずれかである場合にその単語を物体語として特定してよいし、抽出された単語が予め準備された部分辞書に格納された単語のいずれかである場合にその単語を部分語として特定してよい。
物体辞書および部分辞書は、手作業で作成されてもよいし、自動的に作成されてもよい。例えば、販売サービスの商品ページで出現する頻度が高い名詞やTF-IDFの値が高い名詞を物体語または部分語として採用してもよい。また、物体語のゆらぎ表現や同義語を物体辞書や部分辞書に追加してもよい。なお、販売サービスにおいて、販売に寄与する単語か否かを考慮して物体語を選択してもよい。例えば、過去に実際に売れた商品の商品説明文に出現した物体語についてPositiveデータをカウントし、売れなかった商品の商品説明文に出現した物体語についてNegativeデータをカウントし、そのカウント結果を用いて物体語を厳選してもよい。
そして、係り受けの関係にある部分語が存在する物体語がある場合には、その物体語および部分語のセットを特定テーブルに登録する(ステップS205)。特定テーブルには1または複数のセットが登録される。特定テーブルに登録されるセットのそれぞれは、説明文解析部52により説明文から特定される物体語および部分語を含む。例えば物体語のみが特定された場合にはセットには部分語は含まれなくてよい。特定テーブルは記憶部12に格納されている。特定テーブルの代わりに配列のようなリスト状のデータとして記憶部12に格納されてもよい。
一方、係り受けの関係にある部分語が存在しない物体語がある場合には、その物体語をセットとして特定テーブルに登録する(ステップS206)。また、係り受けの関係にある物体語が存在しない部分語がある場合には、商品情報に含まれる商品名に基づいて物体語を補完し、その補完された物体語と部分語とのセットを特定テーブルに格納する(ステップS207)。
図6は、説明文に含まれる文章と、その文章から特定される物体語および部分語の一例を示す図である。図6の物体語の欄および部分語の欄は特定テーブルに格納されたセットの一例を示している。
図6をみると、「保証書」、「イヤホン」、「スマートフォン」といった物体語が特定されている。1番目の文からは物体語「保証書」は特定されたが部分語は特定されず、3番目の文では部分語として「裏側」が特定され、言葉のゆらぎを解消するため「裏側」は「裏面」に変換され、特定テーブルに格納される。4番目の文は否定形であり物体の存在を示す文ではないため、「充電アダプタ」が物体辞書に定義されていても、物体語、部分語は特定テーブルに格納されない。
部分語は、説明文に含まれる言葉であって、物体語により示される物体のうち一部について言及される言葉(言及部)である。
説明文解析部52によるステップS202以降の処理は、機械学習モデルを用いて実現されてもよい。BERT(Bidirectional Encoder Representations from Transformers)と呼ばれる自然言語処理モデルを用い、形態素解析を経由せずに、説明文の文章を自然言語処理モデルに入力して物体語と部分語のセットを直接的に出力として取得してもよい。
説明文解析部52の処理の一方で、画像解析部53は、受信された1または複数の画像のそれぞれから、物体およびその物体の被撮影部を検出する(ステップS103)。実際に検出されるのは厳密には物体の種類であり、物体の種類によっては被撮影部が検出されなくてもよい。
より具体的には、機械学習に基づく画像認識モデルを用いたRegion Proposalという手法を用いてよい。画像解析部53は、その画像認識モデルに画像を入力し、画像認識モデルから出力される物体とその物体が存在するエリアとを検出結果として出力する。画像認識モデルは、Faster R-CNN、SSD、YOLOを用いてよい。画像解析部53は、出力される物体を検出された物体としてよい。この場合、画像と検出されるべき物体とを含む教師データにより画像認識モデルが学習される。教師データとして、例えばImageNetと呼ばれる一般的な画像認識データセットを用いてもよい。
画像解析部53は、方向認識モデルにより推定される方向を取得し、その方向を物体の検出された被撮影部として出力してよい。物体の方向推定には,事前に用意した学習データ(例:保証書の表面・裏面の画像群)を用いて物体ごとに方向認識モデルを構築してもよい。方向認識モデルは、例えばMartin Sundermeyer, Zoltan-Csaba Marton, Maximilian Durner, Manuel Brucker, Rudolph Triebelによる論文「Implicit 3D Orientation Learning for 6D Object Detection from RGB Images」に示されるものを使用してよい。画像解析部53は物体の3Dモデルを入手し、その3Dモデルから生成される画像と、入力される画像との類似度から物体の回転パラメータrを推定してよい。回転パラメータrは、回転ベクトル・回転行列・クォータニオン・オイラー角のいずれでもよい。ここで、画像解析部53はマッピング関数fを用いて、回転パラメータrを被撮影部について予め定められた選択肢(例えば表面、裏面、側面)のいずれかに変換してよい。検出された物体について方向の推定が困難である場合(例:ケーブル)は,方向推定の処理はスキップされてもよい。
これまでの処理により検出された物体および被撮影部のセットは、それらが検出された画像と関連付けられて記憶部12の検出結果テーブルに格納される。ここで、画像認識モデルから、物体および非撮影部の両方が検出結果として出力されてもよい。また検出結果テーブルの代わりに配列などのリスト状のデータとして記憶部12に格納されてもよい。この場合は、画像認識モデルは、画像と検出されるべき物体および被撮影部とを含む教師データにより学習される。
図7は、画像から検出される物体および被撮影部を示す図であり、検出結果のリストに登録される物体および被撮影部を示す図である。画像1からは物体としてスマートフォンが検出され、被撮影部として正面が検出される。画像2からは充電アダプタと箱との2つの物体が検出される。充電アダプタについては方向や部分による差が小さいため、被撮影部は検出されない。画像3は実際には保証書の画像であるが、画像解析部53により物体として書類が、被撮影部として正面が検出されている。
説明文解析部52により物体語等が特定され、画像解析部53により物体等が検出されると、対応生成部54は対応情報を生成する(ステップS104)。対応情報が生成されると、表示制御部55は表示された対応情報に基づいて顧客端末2の表示を制御する(ステップS105)。
以下ではステップS104の処理について説明する。図8は、対応生成部54の処理の一例を示すフロー図であり、ステップS104の処理のうち一部を示す。図8に示される処理は、説明文から特定される物体語を含むセット(説明文から特定されるセット)と、画像から検出される物体を含むセット(画像から検出されるセット)、との対応を決定する処理である。
はじめに、対応生成部54は、説明文に基づいて説明文解析部52により作成された特定テーブルから、未選択の1つのセットを選択する(ステップS401)。対応生成部54は、画像から検出された物体(被撮影部とセットで格納されている物体)から、選択されたセットに含まれる物体語に対応する物体を探す(ステップS402)。物体語に対応する物体を探す処理においては、より具体的には、対応生成部54は予め準備された対応表に基づいて選択されたセットに含まれる物体語を画像から検出される物体の種類を識別する識別情報に変換し、画像から検出された物体から、その識別情報が示す物体の種類を有するものを探す。
選択されたセットに含まれる物体語に対応し画像から検出された物体が存在しない場合には(ステップS402のN)、このセットについての処理を終了し、ステップS408へ遷移する。一方、選択されたセットに含まれる物体語に対応し画像から検出された物体が存在する場合には(ステップS402のY)、対応生成部54はその物体語と画像から検出された物体とを関連付けて記憶部12内の物体対応テーブルに格納する(ステップS403)。
図9は、物体対応テーブルに格納される情報を説明する図である。図9の例では、説明文における「保証書」と画像から検出された「書類」とが関連付けられて物体対応テーブルに格納され、説明文から特定された「スマートフォン」と画像から検出された「スマートフォン」およびその物体が検出された画像とが関連付けられて物体対応テーブルに格納される。
そして、選択されたセットに部分語が含まれない場合には(ステップS403のN)、対応生成部54はセット中の物体語と、対応する物体およびそれが検出された画像とを関連付けて記憶部12内のセット対応テーブルに格納する(ステップS405)。
選択されたセットに部分語が含まれる場合には(ステップS403のY)、対応生成部54は、対応するとされた物体とともに検出された被撮影部から、部分語に対応するものを検索する(ステップS406)。部分語に対応する被撮影部が存在する場合には(ステップS406のY)、セット中の物体語および部分語と、画像から検出された物体および被撮影部とを対応づけてセット対応テーブルに格納する(ステップS407)。部分語に対応する被撮影部が存在しない場合には(ステップS406のN)、ステップS407をスキップする。
ステップS408においては、対応生成部54は、特定テーブルに未選択のセットが存在するか判定する。そして未選択のセットが存在する場合には(ステップS408のY)、ステップS401からの処理を繰り返す。一方、未選択のセットが存在しない場合には
(ステップS408のN)、図8の処理を終了する。
図10は、セット対応テーブルに格納される情報を説明する図である。図10の例では、説明文から抽出された物体である「保証書」については、セットとして部分語が特定されていない。そのため、「保証書」を含むセットは、被撮影部に関わらず、画像から検出された「書類」と「正面」のセットに対して対応関係ありとされ、互いに関連付けてセット対応テーブルに格納される。説明文から特定された「スマートフォン」と「裏面」とのセットについては、画像から検出された「スマートフォン」と「正面」とのセットに対して、部分語と被撮影部との対応がないためセットとして対応しないと判断され、これらのセットはセット対応テーブルに格納されない。
ここで、説明文から特定されたセットと画像から検出されたセットとの対応付けは、他の方法により行われてもよい。例えば説明文から特定される物体語の候補と画像から特定される物体の種類の候補との対応の有無が事前に決定されていなくてもよい。画像解析部53は、画像から特定される物体の種類を物体の名称として取得し、対応生成部54は意味空間における、物体語と物体の名称との2点間距離を算出し、物体語と物体の名称との対応関係を、貪欲法や動的計画法に基づいて決定してもよい。なお、意味空間における物体語および物体の名称の座標は、例えばWeb上の膨大なページのような公知の文書に基づいて決定されてよい。
説明文から特定されるセットと、画像から検出されるセットとの対応が決定されると、対応生成部54は、対応情報として、説明文で言及されているが対応する画像が存在しない物体語または部分語を示す情報を生成する。図11は、対応生成部54の処理の一例を示すフロー図である。
対応生成部54は、説明文に基づいて説明文解析部52により作成された特定テーブルから、未選択の1つのセットを選択する(ステップS421)。対応生成部54は、セット対応テーブルから、選択されたセットと関連付けられる情報が格納されているか検索することにより、選択されたセットと対応付けられ、画像から検出されたセットが存在するか判定する(ステップS422)。
選択されたセットに対応付けられ、画像から検出されたセットが存在する場合には(ステップS422のY)、この選択されたセットに関する処理は終了し、ステップS426へ遷移する。
選択されたセットに対応付けられ、画像から検出されたセットが存在しない場合には(ステップS422のN)、物体対応テーブルから、選択されたセットに含まれる物体語と関連付けられる情報が格納されているか検索することにより、選択されたセットに含まれる物体語に対応付けられる、画像から検出された物体が存在するか判定する(ステップS423)。対応する物体が存在する場合には(ステップS423のY)、対応生成部54は、対応情報として、説明文の物体語に対応する物体は撮影されているが、説明文で言及されている部分(部分語に対応する部分)が撮影されていない旨のメッセージを生成する
(ステップS424)。
一方、対応する物体が存在しない場合には(ステップS423のN)、対応生成部54は、対応情報として、説明文で言及される物体(物体語に対応する物体)が撮影されていない旨のメッセージを生成する(ステップS425)。
そして、ステップS426において、対応生成部54は、特定テーブルに未選択のセットが存在するか判定する。そして未選択のセットが存在する場合には(ステップS426のY)、ステップS421からの処理を繰り返す。一方、未選択のセットが存在しない場合には(ステップS426のN)、図11の処理を終了する。
図12は、生成されるメッセージの一例を示す図である。図12は、図9,10に記載のデータに基づいて生成されるメッセージの一例を示している。メッセージは画像の追加を促す通知の一種として生成される。説明文から特定された物体語であるイヤホンについては、画像から検出されイヤホンに対応付けられた物体が存在しないため、物体が検出されず、イヤホンの撮影を促すメッセージが生成されている。一方、説明文から特定されたスマートフォンについては、画像から検出され対応する物体は存在するものの、部分語と被撮影部とが対応していないため、その部分語が示す部分の撮影を促すメッセージが生成される。
図11に示される処理が実行されると、表示制御部55は、ステップS105において、メッセージが生成されている場合には、生成されたメッセージを顧客端末2が表示するように制御する。具体的には、表示制御部55はメッセージを含む表示データを顧客端末2へ送信することにより表示を制御する。また、表示制御部55は単に不足する物体または部分を示す対応情報を顧客端末2へ送信し、顧客端末が対応情報からメッセージを生成して出力してもよい。また顧客端末2の側で表示制御部55としてメッセージの生成が行われてもよい。顧客端末2を操作する販売者は、追加の画像を顧客端末2から送信し、情報取得部51はその画像を取得する。その後、情報処理システムは図3のステップS102以降の処理を実行してもよい。
このように、説明文で言及されているが対応する画像が存在しない物体語または部分語を示すメッセージを生成して表示することで、販売者は、説明文の記載と画像とが整合しないことが容易にわかり、その不整合を容易に改善できる。これにより、説明文と画像との整合性が確保され、ユーザは、説明文と画像とから商品をより容易に把握することができる。
ここで、対応情報として、セット対応テーブルや物体対応テーブルのような情報が生成されてもよいし、画像と説明文に含まれる文章との関連を示す情報が生成されてもよい。
図13は、対応生成部54の処理の他の一例を示す図であり、図8に示される処理の後に、図11に示される処理の代わり、または並行して実行される処理を示す図である。
図13に示される処理では、対応生成部54は、セット対応テーブルから、画像から検出された物体および被撮影部のセットを選択する(ステップS501)。対応生成部54は、選択されたセット対応付けられ説明文から特定されたセットを取得し、そのセットに含まれる物体語および部分語を含む文章を取得する(ステップS502)。この文章は説明文に含まれる文章であり、対応生成部54は説明文から物体語および部分語を含む文章を探して抽出することによりその文章を取得してもよいし、説明文解析部52が物体語および部分語のセットと、そのセットが特定された文章とを関連付けて記憶部12に格納しておき、対応生成部54が物体語および部分語のセットに関連付けて格納される文章を取得してもよい。もちろん、説明文から特定されたセットに物体語しか格納されていない場合にも、対応生成部54はその物体語が特定された文章を取得してよい。
文章が取得されると、対応生成部54は、選択されたセットが検出された画像と、取得された文章とを関連付ける情報を対応情報として生成する(ステップS503)。そして、セット対応テーブルに未選択の画像から検出されたセットが存在する場合には(ステップS504のY)、対応生成部54はステップS501からの処理を繰り返す。一方、セット対応テーブルに未選択の画像から検出されたセットが存在しない場合には(ステップS504のN)、図13の処理を終了する。
図13に示される処理により、物体または被撮影部が検出される画像と、その物体または被撮影部に対応する物体語または部分語が特定された文章とが対応付けられる。
以下では、この対応情報を用いた表示制御について説明する。図14は、表示制御部55の処理の他の一例を示す図である。図14に示される処理は、購入候補者であるユーザの操作により、顧客端末2に画像を含む商品説明ページが表示されている際に行われる処理であり、商品説明ページとともに対応情報を受信した顧客端末2により実行されている。
はじめに、表示制御部55はユーザが操作するポインタが、いずれかの画像の上に位置するか判定する(ステップS521)。ポインタはユーザインタフェースにおいてユーザが指し示す位置を表示するものである。表示制御部55はポインタが画像の上にある場合には(ステップS521のY)、対応情報に基づいて、関連付けられた文章が存在するか判定する(ステップS522)。関連付けられた文章が存在する場合には(ステップS522のY)、表示制御部55は関連付けられた文章をその画像の上または周囲に表示させる(ステップS523)。
図15は、画像上にポインタがある場合に出力される文章の一例を示す図である。図15に示されるポインタはいわゆるマウスポインタであり、顧客端末2がパーソナルコンピュータである場合の例である。このように、ポインタの存在する画像に対応する説明文が表示されることにより、画像に対応する文章を容易に確認することができ、商品の理解が容易になる。
ここで、対応生成部54は、対応情報として、画像そのものの代わりに、画像のうち物体が特定された領域と、説明文とを関連付ける情報を生成してもよい。この場合には、表示制御部55は、ポインタが、画像のうち対応情報に含まれる領域に位置する場合に限って関連付けられた文章を画像の上または周囲に表示させてよい。
1 情報処理サーバ、2 顧客端末、11 プロセッサ、12 記憶部、13 通信部、14 入出力部、51 情報取得部、52 説明文解析部、53 画像解析部、54 対応生成部、55 表示制御部、80 スマートフォン。

Claims (6)

  1. 電子商取引プラットフォームを提供する情報処理システムであって、
    商品に関する説明文と1または複数の画像とを取得する取得部と、
    前記説明文から物体を特定し、当該説明文から前記物体の一部に関する言及部を特定する特定部と、
    前記1または複数の画像のそれぞれから物体の被撮影部を検出する検出部と、
    前記特定部が特定した前記物体の言及部と、前記検出部が検出した前記物体の被撮影部との対応に基づいて対応情報を生成する対応部と、
    を含む情報処理システム。
  2. 請求項1に記載の情報処理システムにおいて、
    前記検出部は、前記物体の方向を、物体ごとに構築される方向認識モデルであって、物体の画像を含む学習データにより学習された方向認識モデルにより推定し、前記推定された方向を前記被撮影部として検出する、
    情報処理システム。
  3. 請求項1または2に記載の情報処理システムにおいて、
    前記対応部は、前記説明文から特定された物体の言及部のうち、前記画像から検出されたいずれの物体の被撮影部とも対応しない言及部を示す情報を含む対応情報を生成する
    情報処理システム。
  4. 請求項3に記載の情報処理システムにおいて、
    前記対応情報に基づいて画像の追加を促す通知が表示されるよう制御する表示制御部をさらに含む、
    情報処理システム。
  5. 電子商取引プラットフォームを提供するための情報処理方法であって、
    取得部が、商品に関する説明文と1または複数の画像とを取得するステップと、
    特定部が、前記説明文から物体を特定し、当該説明文から前記物体の一部に関する言及部を特定するステップと、
    検出部が、前記1または複数の画像のそれぞれから物体の被撮影部を検出するステップと、
    対応部が、前記説明文から特定された言及部と、前記画像から前記検出された被撮影部との対応に基づいて対応情報を生成するステップと、
    を含む情報処理方法。
  6. 電子商取引プラットフォームにより取り扱われる商品に関する説明文と1または複数の商品画像とを取得する取得部、
    前記説明文から物体を特定し、当該説明文から前記物体の一部に関する言及部を特定する特定部、
    前記1または複数の画像のそれぞれから物体の被撮影部を検出する検出部、および、
    前記特定部が特定した前記物体の言及部と、前記検出部が検出した前記物体の被撮影部との対応に基づいて対応情報を生成する対応部、
    としてコンピュータを機能させるためのプログラム。
JP2022081114A 2020-11-27 2022-05-17 情報処理システム、情報処理方法およびプログラム Active JP7345012B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022081114A JP7345012B2 (ja) 2020-11-27 2022-05-17 情報処理システム、情報処理方法およびプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020196845A JP7076521B1 (ja) 2020-11-27 2020-11-27 情報処理システム、情報処理方法およびプログラム
JP2022081114A JP7345012B2 (ja) 2020-11-27 2022-05-17 情報処理システム、情報処理方法およびプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020196845A Division JP7076521B1 (ja) 2020-11-27 2020-11-27 情報処理システム、情報処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2022109313A JP2022109313A (ja) 2022-07-27
JP7345012B2 true JP7345012B2 (ja) 2023-09-14

Family

ID=81752592

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020196845A Active JP7076521B1 (ja) 2020-11-27 2020-11-27 情報処理システム、情報処理方法およびプログラム
JP2022081114A Active JP7345012B2 (ja) 2020-11-27 2022-05-17 情報処理システム、情報処理方法およびプログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020196845A Active JP7076521B1 (ja) 2020-11-27 2020-11-27 情報処理システム、情報処理方法およびプログラム

Country Status (2)

Country Link
US (1) US20220171966A1 (ja)
JP (2) JP7076521B1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230074950A1 (en) * 2021-08-24 2023-03-09 Nvidia Corporation Object characterization using one or more neural networks

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018106284A (ja) 2016-12-22 2018-07-05 楽天株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP2018128805A (ja) 2017-02-07 2018-08-16 ヤフー株式会社 生成装置、生成方法及び生成プログラム
JP2019008684A (ja) 2017-06-28 2019-01-17 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理システム、情報処理方法およびプログラム
JP2020013461A (ja) 2018-07-20 2020-01-23 株式会社メルカリ 情報処理方法、情報処理装置及びプログラム
JP2020098535A (ja) 2018-12-19 2020-06-25 株式会社メルカリ ウェアラブル端末、情報処理端末、プログラム及び商品情報表示方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190042574A1 (en) * 2017-08-01 2019-02-07 Samsung Electronics Co., Ltd. Electronic device and method for controlling the electronic device
US10496884B1 (en) * 2017-09-19 2019-12-03 Deepradiology Inc. Transformation of textbook information
JP7122625B2 (ja) * 2018-07-02 2022-08-22 パナソニックIpマネジメント株式会社 学習データ収集装置、学習データ収集システム、及び学習データ収集方法
US10691584B2 (en) * 2018-09-28 2020-06-23 Sap Se Behavior driven development integration with test tool
US20220301315A1 (en) * 2019-11-08 2022-09-22 Denso Ten Limited Image processing device and image processing method
US11657513B2 (en) * 2019-11-29 2023-05-23 Samsung Electronics Co., Ltd. Method and system for generating a tri-map for image matting
US11468110B2 (en) * 2020-02-25 2022-10-11 Adobe Inc. Utilizing natural language processing and multiple object detection models to automatically select objects in images

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018106284A (ja) 2016-12-22 2018-07-05 楽天株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP2018128805A (ja) 2017-02-07 2018-08-16 ヤフー株式会社 生成装置、生成方法及び生成プログラム
JP2019008684A (ja) 2017-06-28 2019-01-17 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理システム、情報処理方法およびプログラム
JP2020013461A (ja) 2018-07-20 2020-01-23 株式会社メルカリ 情報処理方法、情報処理装置及びプログラム
JP2020098535A (ja) 2018-12-19 2020-06-25 株式会社メルカリ ウェアラブル端末、情報処理端末、プログラム及び商品情報表示方法

Also Published As

Publication number Publication date
US20220171966A1 (en) 2022-06-02
JP7076521B1 (ja) 2022-05-27
JP2022109313A (ja) 2022-07-27
JP2022085253A (ja) 2022-06-08
TW202221614A (zh) 2022-06-01

Similar Documents

Publication Publication Date Title
US8891860B2 (en) Color name determination device, color name determination method, information recording medium, and program
US10372827B2 (en) Translating phrases from image data on a GUI
WO2021194659A1 (en) Processing image-bearing electronic documents using a multimodal fusion framework
US20190294912A1 (en) Image processing device, image processing method, and image processing program
US20210334309A1 (en) Classification device, classification method, generation method, classification program, and generation program
CN110674620A (zh) 目标文案生成方法、装置、介质及电子设备
JP7345012B2 (ja) 情報処理システム、情報処理方法およびプログラム
US11409888B2 (en) Security information processing device, information processing method, and recording medium
US9965679B2 (en) Capturing specific information based on field information associated with a document class
US20220198157A1 (en) Multilingual Model Training Using Parallel Corpora, Crowdsourcing, and Accurate Monolingual Models
JP5559750B2 (ja) 広告処理装置、情報処理システム及び広告処理方法
JP2015232823A (ja) デザイン管理装置及びプログラム
JPWO2015140922A1 (ja) 情報処理システム、情報処理方法、および情報処理プログラム
US20230274096A1 (en) Multilingual support for natural language processing applications
TWI838631B (zh) 資訊處理系統、資訊處理方法及程式產品
US20230096044A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
JP6810303B1 (ja) データ処理装置、データ処理方法及びデータ処理プログラム
CN114579461A (zh) 浏览器兼容性检测方法及相关设备
US11494553B2 (en) Document creation assistance apparatus and non-transitory computer readable medium
JP2015179385A (ja) 資料検索装置、資料検索システム、資料検索方法、及び、プログラム
US20200342169A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
Gunardi et al. Web-Based Gender Classification ML Application Development for e-KYC
JP2017215893A (ja) 特許情報処理装置、特許情報処理方法、プログラム
JP6481901B2 (ja) 商品情報管理装置、商品情報管理方法、およびプログラム
JP5163448B2 (ja) 検査データ生成プログラム、検査データ生成装置及び印刷システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230904

R150 Certificate of patent or registration of utility model

Ref document number: 7345012

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150