JP7231662B2 - 生成装置、生成方法及び生成プログラム - Google Patents

生成装置、生成方法及び生成プログラム Download PDF

Info

Publication number
JP7231662B2
JP7231662B2 JP2021045205A JP2021045205A JP7231662B2 JP 7231662 B2 JP7231662 B2 JP 7231662B2 JP 2021045205 A JP2021045205 A JP 2021045205A JP 2021045205 A JP2021045205 A JP 2021045205A JP 7231662 B2 JP7231662 B2 JP 7231662B2
Authority
JP
Japan
Prior art keywords
product
name
information
learning model
description
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021045205A
Other languages
English (en)
Other versions
JP2022144280A (ja
Inventor
健二 立石
宗也 脇山
聡宏 六瀬
弘紀 水口
和大 佐藤
溢洋 湛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2021045205A priority Critical patent/JP7231662B2/ja
Publication of JP2022144280A publication Critical patent/JP2022144280A/ja
Application granted granted Critical
Publication of JP7231662B2 publication Critical patent/JP7231662B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、生成装置、生成方法及び生成プログラムに関する。
近年、インターネットショッピングや、電子商店街等の電子商取引(EC:Electronic Commerce)において、利用者によって商品の購買が盛んに行われている。このような背景の中、電子商取引にて取扱われる商品を管理する技術が知られている。例えば、外部サービスから取得した電子メールのデータと、複数の取引データとを統合し、商品の名寄せを行う商品名寄せシステムが開示されている。
特許第6495524号公報
しかしながら、上記の従来技術では、メール連携部で統合された電子メールのデータと、取引データ連携部で統合された取引データとを学習することにより商品の名寄せを行うに過ぎず、より簡便な手段で適切な学習モデルを生成することができるとは限らない。
本願は、上記に鑑みてなされたものであって、より簡便な手段で適切な学習モデルを生成することができる生成装置、生成方法及び生成プログラムを目的とする。
本願に係る生成装置は、商品に関する商品情報を取得する取得部と、前記商品情報に含まれる情報のうち、前記商品の名称と、前記商品の商品説明との組合せを学習させることで学習モデルを生成する生成部とを備えることを特徴とする。
実施形態の一態様によれば、より簡便な手段で適切な学習モデルを生成することができるという効果を奏する。
図1は、実施形態に係る生成装置が実行する生成処理の一例を示す図である。 図2は、実施形態に係る生成システムの構成例を示す図である。 図3は、実施形態に係る商品情報記憶部の一例を示す図である。 図4は、実施形態に係る学習データ記憶部の一例を示す図である。 図5は、実施形態に係る提供情報記憶部の一例を示す図である。 図6は、実施形態に係る生成装置が実行する生成処理の流れの一例を示すフローチャートである。 図7は、実施形態に係る生成装置が実行する提供処理の流れの一例を示すフローチャートである。 図8は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る生成装置、生成方法及び生成プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る生成装置、生成方法及び生成プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.生成装置が示す生成処理の一例〕
まず、図1を用いて、生成装置100が実行する生成処理の一例について説明する。図1は、実施形態に係る生成装置100が実行する生成処理の一例を示す図である。以下では、まず、生成装置100が商品の名称と、商品の詳細を示す商品説明とに基づいて、学習モデルを生成する例について説明する。次に、生成装置100が、生成した学習モデルを用いて、第1商品と、第2商品とが同一か否かを判定する例について説明する。
まず、生成装置100が商品の名称と、商品の詳細を示す商品説明とに基づいて、学習モデルを生成する例について説明する。図1に示すように、生成装置100は、商品に関する商品情報をECサーバ50から取得する(ステップS1)。
例えば、生成装置100は、ECサーバ50によって提供されるECサービスにおいて取扱われる商品情報を取得する。より具体的な例を挙げると、生成装置100は、商品情報として、商品の名称に関する情報や、商品説明に関する情報を取得する。
続いて、生成装置100は、第1商品の名称のうちから、文字列を選択する(ステップS2)。図1の例では、第1商品の名称が「XXXXX ABCD YYY」である。この場合、生成装置100は、第1商品の名称「XXXXX ABCD YYY」から、文字列「ABCD」を選択する。このとき、生成装置100は、第1商品の名称からランダムに任意の単語を示す文字列を選択する。
そして、生成装置100は、選択した文字列を含む第2商品の商品説明に対応する第2商品情報によって構成されるクラスタ(群の一例)を生成する(ステップS3)。図1の例では、生成装置100は、選択した文字列「ABCD」を商品説明に含む第2商品の第2商品情報によって構成されるクラスタを生成する。すわなち、生成装置100は、選択した単語「ABCD」を商品説明に含む第2商品の第2商品情報によって構成されるクラスタを生成する。
続いて、生成装置100は、第1商品の名称と、第1商品の商品説明との組合せを正例として学習させ、第1商品の名称と、クラスタからランダムに選択された第2商品の商品説明との組合せを負例として学習させることで学習モデルMO1を生成する(ステップS4)。
例えば、生成装置100は、第1商品の名称と、第2商品の名称とを学習モデルMO1に入力することで、第1商品と、第2商品との一致度合いを示すスコアを出力する学習モデルMO1を生成する。ここで、スコアは、「0」又は「1」をとる。スコア「0」は、第1商品と、第2商品とが一致しないことを示す。また、スコア「1」は、第1商品と、第2商品とが一致することを示す。このように、学習モデルMO1は、二値分類器の機能を有する。
図1の例では、生成装置100は、第1商品の名称「XXXXX ABCD YYY」と、第1商品の商品説明「XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX」との組合せを正例として学習モデルMO1に学習させる。そして、生成装置100は、第1商品の名称「XXXXX ABCD YYY」と、クラスタから選択された第2商品の商品説明との組合せを負例として学習モデルMO1に学習させる。このようにして、生成装置100は、学習モデルMO1を生成する。なお、上記生成処理は、機械学習等の従来技術を用いることで実現可能である。
次に、生成装置100が、生成した学習モデルを用いて、第1商品と、第2商品とが同一か否かを判定する例について説明する。図1に示すように、生成装置100は、提供情報の提供要求をECサーバ50から受付ける(ステップS5)。
続いて、生成装置100は、学習モデルMO1を用いて、商品が同一か否かを判定する(ステップS6)。例えば、第3商品及び第4商品とは、同一の商品か否かを過去に判定されていない商品であるものとする。この場合、生成装置100は、生成した学習モデルMO1を用いて、第3商品と、第4商品とが同一の商品であるか否かを判定する。なお、第3商品及び第4商品とは、第1商品及び第2商品とは異なる商品である。
例えば、生成装置100は、学習モデルMO1を用いて、第3商品情報に含まれる情報のうち、第3商品の名称と、第4商品情報に含まれる情報のうち、第4商品の名称とを学習モデルMO1に入力することで、第3商品と、第4商品との一致度合いを示すスコアを出力する。そして、生成装置100は、スコアが「0」である場合、第3商品と、第4商品とが同一の商品ではないと判定する。一方、生成装置100は、スコアが「1」である場合、第3商品と、第4商品とが同一の商品であると判定する。
そして、生成装置100は、提供情報をECサーバ20に提供する(ステップS7)。図1の例では、生成装置100は、第3商品と、第4商品とが同一の商品であると判定した場合、第3商品と、第4商品とが同一である旨を含む提供情報をECサーバ20に提供する。
一方、生成装置100は、第3商品と、第4商品とが同一の商品でないと判定した場合、第3商品と、第4商品とが同一ではない旨を含む提供情報をECサーバ20に提供する。これにより、生成装置100は、同一の商品か否かを過去に判定されていない商品に対して上記判定処理を実行することで商品の名寄せを行うために適切な情報をECサーバ50に提供することができる。
なお、上記実施形態では、生成装置100が第1商品の名称のうちから、文字列を選択する例を挙げて説明したが、これに限定されない。例えば、生成装置100は、第1商品の商品説明のうちから、文字列を選択してもよい。この場合、生成装置100は、選択した文字列を含む第2商品の名称又は商品説明に対応する第2商品情報によって構成されるクラスタを生成してもよい。また、生成装置100は、第1商品の名称のうちから、文字列を選択した場合、選択した文字列を含む第2商品の名称に対応する第2商品情報によって構成されるクラスタを生成してもよい。
また、生成装置100は、クラスタを生成せずに、商品全体からランダムに第2商品情報を選択してもよい。この場合、生成装置100は、第1商品の名称と、第1商品の商品説明との組合せを正例として学習させ、第1商品の名称と、商品全体からランダムに選択された第2商品の商品説明との組合せを負例として学習させることで学習モデルMO1を生成してもよい。
従来技術では、メール連携部で統合された電子メールのデータと、取引データ連携部で統合された取引データとを学習することにより商品の名寄せを行うに過ぎず、より簡便な手段で適切な学習モデルを生成することができるとは限らなかった。また、一般に同一の商品か否かを判定するための学習モデルを生成するうえで、正例又は負例となるラベルつき学習データを収集することが困難であった。また、ラベルとなり得る商品を識別する情報を新規に作成することも容易ではなかった。このような背景の中で、実施形態に係る生成装置100は、取得した商品情報に含まれる情報のうち、商品の名称と、商品の商品説明との組合せを学習させることで学習モデルを生成することで従来の課題を解決する。このように、生成装置100は、より簡便な手段で適切な学習モデルを生成することができる。
〔2.生成システムの構成〕
図6に示すように、生成システム1は、ECサーバ50と、生成装置100とを含む。ECサーバ50及び生成装置100は、ネットワークNを介して、有線又は無線により通信可能に接続される。なお、図2に示す生成システム1には、複数台のECサーバ50や、複数台の生成装置100が含まれてもよい。
実施形態に係るECサーバ50は、各種ECサービスを提供する情報処理装置であり、例えば、サーバ装置又はクラウドシステム等により実現される。例えば、ECサーバ50は、電子商取引サービスを、利用者によって利用される端末装置等に提供する。また、ECサーバ50は、電子商取引サービスにて取扱われている各種商品情報を生成装置100に提供する。
実施形態に係る生成装置100は、インターネット等の所定のネットワークNを介して、各種の装置と通信可能な情報処理装置であり、例えば、サーバ装置又はクラウドシステム等により実現される。例えば、生成装置100は、ネットワークNを介して、他の各種装置と通信可能に接続される。
〔3.生成装置の構成〕
以下、上記した生成装置100が有する機能構成の一例について説明する。図2は、実施形態に係る生成装置100の構成例を示す図である。図2に示すように、生成装置100は、通信部110と、記憶部120と、制御部130とを有する。
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線又は無線で接続され、他の各種装置との間で情報の送受信を行う。
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部120は、商品情報記憶部121と、学習データ記憶部122と、学習モデル123と、提供情報記憶部124とを有する。
(商品情報記憶部121について)
商品情報記憶部121は、商品に関する各種情報を記憶する。ここで、図3に、実施形態に係る商品情報記憶部121の一例を示す。図3に示した例では、商品情報記憶部121は、「商品ID」、「利用者情報」といった項目を有する。例えば、利用者情報は、「名称」、「商品説明」といった項目を含む。
「商品ID」は、商品を識別する識別子である。「名称」は、「商品ID」に対応付けられた商品の名称に関する情報である。「商品説明」は、「商品ID」に対応付けられた商品の詳細を示す商品説明に関する情報である。例えば、商品説明は、商品の型番又は品番や、商品の金額や、商品の構成要素や、商品を構成する成分又は原材料等に関する情報である。
例えば、図3では、商品IDによって識別された「M1」は、名称が「MN1」であり、商品説明が「ME1」である。なお、図3に示した例では、名称等を、「MN1」等の抽象的な符号で表現したが、名称等は、名称等を示す数値や、名称等を示す文字列や、名称等に関する各種情報を含むファイルのファイル形式等であってもよい。
(学習データ記憶部122について)
学習データ記憶部122は、各種学習データを記憶する。ここで、図4に、実施形態に係る学習データ記憶部122の一例を示す。図4に示した例では、学習データ記憶部122は、「学習データID」、「正解ラベル」、「第1商品ID」、「名称」、「第2商品ID」、「商品説明」といった項目を有する。
「学習データID」は、学習データを識別する識別子である。「正解ラベル」は、「学習データID」に対応付けられた学習データの正解ラベルである。例えば、正解ラベルは、正例や、負例等を示す。「第1商品ID」は、「学習データID」に対応付けられた第1商品の識別子である。「名称」は、「学習データID」に対応付けられ、且つ、「第1商品ID」に対応付けられた第1商品の名称に関する情報である。「第2商品ID」は、「学習データID」に対応付けられた第2商品の識別子である。「商品説明」は、「学習データID」に対応付けられ、且つ、「第2商品ID」に対応付けられた商品の詳細を示す商品説明に関する情報である。
例えば、図4では、学習データIDによって識別された「D1」は、正解ラベルが「正例」であり、第1商品IDが「M11」であり、名称が「MN11」であり、第2商品IDが「M21」であり、商品説明が「ME21」である。
なお、図4に示した例では、名称等を、「MN11」等の抽象的な符号で表現したが、名称等は、名称等を示す数値や、名称等を示す文字列や、名称等に関する各種情報を含むファイルのファイル形式等であってもよい。また、図4に示した例では、素性を、「正例」や、「負例」等で表現したが、素性は、正例や、負例等を示す数値や、正例を「1」、負例を「0」と2値化させて表現した情報等であってもよい。
(提供情報記憶部124について)
提供情報記憶部124は、提供情報に関する各種情報を記憶する。ここで、図5に、実施形態に係る提供情報記憶部124の一例を示す。図5に示した例では、提供情報記憶部124は、「提供情報ID」、「第1商品ID」、「名称」、「第2商品ID」、「商品説明」、「スコア」といった項目を有する。
「提供情報ID」は、提供情報を識別する識別子である。「第1商品ID」は、「提供情報ID」に対応付けられた第1商品の識別子である。「名称」は、「提供情報ID」に対応付けられ、且つ、「第1商品ID」に対応付けられた第1商品の名称に関する情報である。「第2商品ID」は、「提供情報ID」に対応付けられた第2商品の識別子である。「商品説明」は、「提供情報ID」に対応付けられ、且つ、「第2商品ID」に対応付けられた商品の詳細を示す商品説明に関する情報である。「スコア」は、「提供情報ID」に対応付けられた第1商品と、第2商品との一致度合いを示すスコアである。
例えば、図5では、提供情報IDによって識別された「P1」は、第1商品IDが「M11」であり、名称が「MN11」であり、第2商品IDが「M21」であり、商品説明が「ME21」であろ、スコアが「1」である。
(制御部130について)
制御部130は、コントローラ(Controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、生成装置100内部の記憶装置に記憶されている各種プログラム(生成プログラムの一例)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図2に示すように、制御部130は、受付部131と、取得部132と、選択部133と、生成部134と、判定部135と、提供部136とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図2に示した接続関係に限られず、他の接続関係であってもよい。
(受付部131について)
受付部131は、各種情報を受付ける。具体的には、受付部131は、提供情報の提供要求をECサーバ50から受付ける。
(取得部132について)
取得部132は、各種情報を取得する。具体的には、取得部132は、商品情報を取得する。例えば、取得部132は、ECサーバ50によって提供されるECサービスにおいて取扱われる商品情報を取得する。より具体的な例を挙げると、取得部132は、商品情報として、商品の名称に関する情報や、商品説明に関する情報を取得する。そして、取得部132は、かかる商品情報を商品情報記憶部121に記憶する。
(選択部133について)
選択部133は、各種情報を選択する。具体的には、選択部133は、商品情報記憶部121を参照して、第1商品の名称又は商品説明のうちから、文字列を選択し、かかる文字列を含む第2商品の名称又は商品説明に対応する第2商品情報によって構成される群を生成する。
図3の例では、選択部133は、商品IDによって識別された商品ID「M1」の名称「MN1」のうちから、文字列を選択する。例えば、商品ID「M1」の名称が「XXXXX ABCD YYY」であるものとする。この場合、選択部133は、名称「XXXXX ABCD YYY」から、文字列「ABCD」を選択する。このとき、選択部133は、名称「XXXXX ABCD YYY」からランダムに任意の単語を示す文字列を選択する。
また、図3の例では、商品ID「M2」の商品説明「ME2」と、商品ID「M3」の商品説明「ME3」とが選択した文字列「ABCD」を含むものとする。この場合、選択部133は、選択した文字列「ABCD」を商品説明に含む第2商品として、商品ID「M2」及び商品ID「M3」によって構成されるクラスタを生成する。このように、選択部133は、選択した単語「ABCD」を商品説明に含む第2商品の第2商品情報によって構成されるクラスタを生成する。
そして、選択部133は、学習データとなるデータセットに関する情報を選択し、かかるデータセットに関する情報を学習データ記憶部122に記憶する。例えば、選択部133は、第1商品IDと、第1商品の名称との組合せと、第2商品IDと、第2商品の商品説明との組合せとを対応付けて学習データ記憶部122に記憶する。この場合、各種学習データに対応付けて正解ラベルに関する情報も記憶される。
(生成部134について)
生成部134は、商品情報に含まれる情報のうち、商品の名称と、商品の商品説明との組合せを学習させることで学習モデル123を生成する。例えば、生成部134は、学習データ記憶部122を参照して、第1商品の名称と、第2商品の名称とを学習モデル123に入力することで、第1商品と、第2商品との一致度合いを示すスコアを出力する学習モデルMO1を生成する。
図4の例では、生成部134は、学習データIDによって識別された「D1」を正例として学習させ、学習データIDによって識別された「D2」を負例として学習させることで学習モデル123を生成する。この場合、生成部134は、第2商品IDに対応する商品説明を、選択部133によって生成されたクラスタから選択する。このようにして、生成部134は、学習モデル123を生成する。
(判定部135について)
判定部135は、生成部134によって生成された学習モデル123を用いて、第1商品と、第2商品とが同一の商品であるか否かを判定する。例えば、判定部135は、学習モデル123を用いて、商品が同一か否かを判定する。そして、判定部135は、判定対象である商品情報の組合せと、判定結果とを対応付けて提供情報記憶部124に記憶する。
図5の例では、判定部135は、学習モデル123を用いて、第1商品ID「M11」が示す商品と、第2商品ID「ME21」が示す商品とが同一の商品であるか否かを判定する。例えば、判定部135は、学習モデル123を用いて、第1商品ID「M11」に対応付けられた名称「MN11」と、第2商品ID「ME21」に対応付けられた名称「ME21」とを学習モデル123に入力することで、第1商品ID「M11」が示す商品と、第2商品ID「ME21」が示す商品との一致度合いを示すスコアを「1」出力する。そして、判定部135は、第1商品ID「M11」が示す商品と、第2商品ID「ME21」が示す商品が同一の商品であると判定する。
また、判定部135は、学習モデル123を用いて、第1商品ID「M13」に対応付けられた名称「MN13」と、第2商品ID「ME23」に対応付けられた名称「ME23」とを学習モデル123に入力することで、第1商品ID「M13」が示す商品と、第2商品ID「ME23」が示す商品との一致度合いを示すスコアを「0」出力する。そして、判定部135は、第1商品ID「M13」が示す商品と、第2商品ID「ME23」が示す商品が同一の商品ではないと判定する。
(提供部136について)
提供部136は、各種情報を提供する。具体的には、提供部136は、提供情報記憶部124を参照して、提供情報をECサーバ20に提供する。図5の例では、提供部136は、第1商品ID「M11」と、第2商品ID「ME21」とが同一の商品であると判定した場合、第1商品ID「M11」が示す商品と、第2商品ID「ME21」が示す商品とが同一である旨を含む提供情報をECサーバ20に提供する。
一方、提供部136は、第1商品ID「M13」と、第2商品ID「ME23」とが同一の商品でないと判定した場合、第1商品ID「M13」が示す商品と、第2商品ID「ME23」が示す商品とが同一ではない旨を含む提供情報をECサーバ20に提供する。これにより、提供部136は、同一の商品か否かを過去に判定されていない商品に対して上記判定処理を実行することで商品の名寄せを行うために適切な情報をECサーバ50に提供することができる。
〔4.処理手順(1)生成処理〕
次に、図6を用いて、実施形態に係る生成装置100が実行する生成処理の手順について説明する。図6は、実施形態に係る生成装置100が実行する生成処理の流れの一例を示すフローチャートである。
図6に示すように、取得部132は、商品情報を取得する(ステップS101)。そして、選択部133は、第1商品の名称のうちから、文字列を選択する(ステップS102)。また、選択部133は、選択した文字列を含む第2商品の商品説明に対応する第2商品情報によって構成されるクラスタを生成する(ステップS103)。
そして、生成部134は、第1商品の名称と、第1商品の商品説明との組合せを正解データとして学習させ、第1商品の名称と、クラスタからランダムに選択された第2商品の商品説明との組合せを不正解データとして学習させることで学習モデル123を生成する(ステップS104)。
〔5.処理手順(2)提供処理〕
次に、図7を用いて、実施形態に係る生成装置100が実行する提供処理の手順について説明する。図7は、実施形態に係る生成装置100が実行する提供処理の流れの一例を示すフローチャートである。
図7に示すように、受付部131は、提供情報の要求を受付ける(ステップS201)。具体的には、受付部131は、提供情報の要求を受付けていない場合(ステップS201;No)、提供情報の要求を受付けるまで待機する。
一方、判定部135は、受付部131が提供情報の要求を受付けた場合(ステップS201;Yes)、学習モデル123を用いて、商品が同一か否かを判定する(ステップS202)。そして、提供部136は、判定部135が、商品が同一であると判定した場合(ステップS202;Yes)、判定結果として商品が同一である旨を含む提供情報を提供する(ステップS203)。
一方、提供部136は、判定部135が、商品が同一でないと判定した場合(ステップS202;No)、判定結果として商品が同一ではない旨を含む提供情報を提供する(ステップS204)。
〔6.変形例〕
上述した生成装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、生成装置100の他の実施形態について説明する。
〔6-1.クラスタ〕
上記実施形態では、実施形態に係る選択部133が選択した文字列を含む第2商品の商品説明に対応する第2商品情報によって構成されるクラスタを生成する例を挙げて説明したが、これに限定されない。
例えば、選択した文字列が文字列「ABCD」であるものとする。この場合、選択部133は、第1商品の商品説明と、第2商品の商品説明とからランダムに選択した文字列「ABCD」を商品説明に含む第1商品及び第2商品によって構成されるクラスタを生成してもよい。
〔6-2.選択対象となる文字列〕
上記実施形態では、実施形態に係る選択部133が第1商品の名称又は商品説明のうちから、文字列を選択する例について説明したが、これに限定されない。例えば、選択部133は、商品の種別や、カテゴリを示す文字列以外の文字列を選択してもよい。
より具体的な例を挙げると、学習モデルを商品のカテゴリに応じて、シャツに関する学習モデルMO2と、お茶に関する学習モデルMO3とに生成し分けるものとする。この場合、選択部133は、シャツに関する学習モデルMO2を生成するために選択する文字列として、シャツといったカテゴリよりも上位概念の文字列(例えば、洋服等)であり、且つ、シャツといったカテゴリよりも下位概念(例えば、ドレスシャツや、ストライプ柄のシャツ等)に相当する文字列以外の文字列を選択してもよい。
また、選択部133は、お茶に関する学習モデルMO3を生成するために選択する文字列として、お茶といったカテゴリよりも上位概念の文字列(例えば、飲料等)であり、且つ、お茶といったカテゴリよりも下位概念(例えば、緑茶や、ほうじ茶等)に相当する文字列以外の文字列を選択してもよい。このように、実施形態に係る生成装置100の選択部133は、学習モデルを生成するために有用な識別力の高い文字列を選択することが可能となる。
〔6-3.選択処理〕
上記実施形態では、実施形態に係る選択部133が第1商品の名称又は商品説明のうちから、文字列を選択し、文字列を含む第2商品の名称又は商品説明に対応する第2商品情報によって構成されるクラスタを生成する例について説明したが、これに限定されない。
例えば、選択部133は、第1商品の名称又は商品説明のうちから、複数の文字列を選択し、複数の文字列の各々の出現頻度に基づいて、出現頻度が第1閾値以上であり、且つ、出現頻度が第2閾値以下である文字列を含む第2商品の名称又は商品説明に対応する第2商品情報によって構成されるクラスタを生成してもよい。
ここで、出現頻度が高い文字列は、識別力が低い単語であると推定される。また、出現頻度が低い文字列は、識別力が高い単語であると推定される。このため、比較的識別力がある文字列は、出現頻度が低すぎず、且つ、出現頻度が高い過ぎない文字列であると推定される。例えば、高い出現頻度を示す閾値を第2閾値とし、低い出現頻度を示す閾値を第1閾値とする。この場合、選択部133は、第1商品の名称又は商品説明のうちから、出現頻度が第1閾値以上であり、且つ、出現頻度が第2閾値以下である文字列を選択し、選択した文字列含む第2商品の名称又は商品説明に対応する第2商品情報によって構成されるクラスタを生成してもよい。これにより、選択部133は、出現頻度が低すぎず、且つ、出現頻度が高すぎない文字列を選択することが可能となる。
このように、実施形態に係る生成装置100の選択部133は、第1商品の名称又は商品説明のうちから、複数の文字列を選択し、複数の文字列の各々の出現頻度に基づいて、出現頻度が第1閾値以上であり、且つ、出現頻度が第2閾値以下である文字列を含む第2商品の名称又は商品説明に対応する第2商品情報によって構成されるクラスタを生成するため、より簡便な手段で適切な学習モデルを生成するために必要となるクラスタを好適に生成することができる。
〔6-4.判定処理の対象〕
上記実施形態では、第3商品及び第4商品とは、同一の商品か否かを過去に判定されていない商品である例を挙げて説明したが、これに限定されなくともよい。例えば、判定部135は、既に同一の商品として対応付けられた第3商品と、第4商品とが本当に同一の商品であるかを再度判定してもよい。
〔6-5.商品説明〕
上記実施形態では、商品情報として、商品の名称と、商品説明とがある例を説明したが、これに限定されなくともよい。例えば、商品説明は、細分化された情報を含んでもよい。例えば、商品説明は、商品説明の概要を示す商品概要と、商品の詳細を示す商品詳細を含んでもよい。
〔6-6.学習モデル〕
上記実施形態では、実施形態に係る生成装置100の生成部134が第1商品の名称と、第2商品の名称とを学習モデル123に入力することで、第1商品と、第2商品との一致度合いを示すスコアを出力する学習モデル123を生成する例について説明したが、これに限定されない。
例えば、生成部134は、第1商品の名称及び第1商品の商品説明と、第2商品の名称及び第2商品の商品説明とを学習モデル123に入力することで、第1商品と、第2商品との一致度合いを示すスコアを出力する学習モデル123を生成してもよい。
また、生成部134は、第1商品の名称と、第1商品の商品説明とを学習モデル123に入力することで、同一の商品が否かを示すスコアを出力する学習モデル123を生成してもよい。このように、実施形態に係る生成装置100の生成部134は、各種入力情報に対応した適切な学習モデルを生成することができる。
〔6-7.プログラム〕
また、上述した実施形態に係る生成装置100は、例えば、図8に示すような構成のコンピュータ1000によって実現される。図8は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
例えば、コンピュータ1000が生成装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部130の機能を実現する。
〔6-8.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、生成部は、生成手段や生成回路に読み替えることができる。
〔7.効果〕
上述してきたように、実施形態に係る生成装置100は、取得部132と、生成部134とを有する。取得部132は、商品に関する商品情報を取得する。生成部134は、商品情報に含まれる情報のうち、商品の名称と、商品の商品説明との組合せを学習させることで学習モデルを生成する。
これにより、実施形態に係る生成装置100は、商品情報に含まれる情報のうち、商品の名称と、商品の商品説明との組合せを学習させることで学習モデルを生成するため、より簡便な手段で適切な学習モデルを生成することができる。
また、実施形態に係る生成装置100において、生成部134は、第1商品情報に含まれる情報のうち、第1商品の名称と、第2商品情報に含まれる情報のうち、第2商品の名称とを学習モデルに入力することで、第1商品と、第2商品との一致度合いを示すスコアを出力する学習モデルを生成する。
これにより、実施形態に係る生成装置100は、第1商品情報に含まれる情報のうち、第1商品の名称と、第2商品情報に含まれる情報のうち、第2商品の名称とを学習モデルに入力することで、第1商品と、第2商品との一致度合いを示すスコアを出力する学習モデルを生成するため、より簡便な手段で適切な学習モデルを生成することができる。
また、実施形態に係る生成装置100において、生成部134は、第1商品情報に含まれる情報のうち、第1商品の名称と、第1商品情報に含まれる情報のうち、第1商品の商品説明との組合せを正例として学習させることで学習モデルを生成する。
これにより、実施形態に係る生成装置100は、第1商品情報に含まれる情報のうち、第1商品の名称と、第1商品情報に含まれる情報のうち、第1商品の商品説明との組合せを正例として学習させることで学習モデルを生成するため、より簡便な手段で適切な学習モデルを生成することができる。
また、実施形態に係る生成装置100において、生成部134は、第1商品情報に含まれる情報のうち、第1商品の名称と、第2商品情報に含まれる情報のうち、第2商品の商品説明との組合せを負例として学習させることで学習モデルを生成する。
これにより、実施形態に係る生成装置100は、第1商品情報に含まれる情報のうち、第1商品の名称と、第2商品情報に含まれる情報のうち、第2商品の商品説明との組合せを負例として学習させることで学習モデルを生成するため、より簡便な手段で適切な学習モデルを生成することができる。
また、実施形態に係る生成装置100において、第1商品の名称又は商品説明のうちから、文字列を選択し、文字列を含む第2商品の名称又は商品説明に対応する第2商品情報によって構成される群を生成する選択部133をさらに備える。
これにより、実施形態に係る生成装置100は、第1商品の名称又は商品説明のうちから、文字列を選択し、文字列を含む第2商品の名称又は商品説明に対応する第2商品情報によって構成される群を生成するため、より簡便な手段で適切な学習モデルを生成するための予備的な学習データ群を好適に生成することができる。
また、実施形態に係る生成装置100において、選択部133は、第1商品の名称又は商品説明のうちから、複数の文字列を選択し、複数の文字列の各々の出現頻度に基づいて、出現頻度が第1閾値以上であり、且つ、出現頻度が第2閾値以下である文字列を含む第2商品の名称又は商品説明に対応する第2商品情報によって構成される群を生成する。
これにより、実施形態に係る生成装置100は、第1商品の名称又は商品説明のうちから、複数の文字列を選択し、複数の文字列の各々の出現頻度に基づいて、出現頻度が第1閾値以上であり、且つ、出現頻度が第2閾値以下である文字列を含む第2商品の名称又は商品説明に対応する第2商品情報によって構成される群を生成するため、より簡便な手段で適切な学習モデルを生成するための予備的な学習データ群を好適に生成することができる。
また、実施形態に係る生成装置100において、選択部133は、群のうちから、第2商品情報をさらに選択し、生成部134は、第1商品の名称と、第2商品情報に含まれる情報のうち、第2商品の商品説明との組合せを負例として学習させることで学習モデルを生成する。
これにより、実施形態に係る生成装置100は、第1商品の名称と、群のうちから選択した第2商品情報に含まれる情報のうち、第2商品の商品説明との組合せを負例として学習させることで学習モデルを生成するため、より簡便な手段で適切な学習モデルを生成することができる。
また、実施形態に係る生成装置100において、生成部134によって生成された学習モデルを用いて、第1商品と、第2商品とが同一の商品であるか否かを判定する判定部135をさらに備える。
これにより、実施形態に係る生成装置100は、学習モデルを用いて、第1商品と、第2商品とが同一の商品であるか否かを判定するため、商品が同一か否かについて高精度に判定することができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
N ネットワーク
1 生成システム
50 ECサーバ
100 生成装置
110 通信部
120 記憶部
121 商品情報記憶部
122 学習データ記憶部
123 学習モデル
124 提供情報記憶部
130 制御部
131 受付部
132 取得部
133 選択部
134 生成部
135 判定部
136 提供部

Claims (7)

  1. 商品に関する商品情報を取得する取得部と、
    第1商品情報に含まれる第1商品の名称と当該第1商品の商品説明との組合せを正例として、当該第1商品の名称と、第2商品情報に含まれる第2商品商品説明との組合せを負例として学習モデルに学習させ、当該第1商品の名称と当該第2商品の名称とを当該学習モデルに入力することで当該第1商品と当該第2商品と一致度合い示すスコアを出力す当該学習モデルを生成する生成部と
    を備えることを特徴とする生成装置。
  2. 第1商品の名称又は商品説明のうちから、文字列を選択し、当該文字列を含む第2商品の名称又は商品説明に対応する第2商品情報によって構成される群を生成する選択部をさらに備える
    ことを特徴とする請求項1に記載の生成装置。
  3. 前記選択部は、
    前記第1商品の名称又は商品説明のうちから、複数の文字列を選択し、当該複数の文字列の各々の出現頻度に基づいて、当該出現頻度が第1閾値以上であり、且つ、当該出現頻度が第2閾値以下である文字列を含む第2商品の名称又は商品説明に対応する第2商品情報によって構成される前記群を生成する
    ことを特徴とする請求項に記載の生成装置。
  4. 前記選択部は、
    前記群のうちから、前記第2商品情報をさらに選択し、
    前記生成部は、
    前記第1商品の名称と、前記第2商品情報に含まれる情報のうち、第2商品の商品説明との組合せを負例として学習させることで前記学習モデルを生成する
    ことを特徴とする請求項又はに記載の生成装置。
  5. 前記生成部によって生成された学習モデルを用いて、第1商品と、第2商品とが同一の商品であるか否かを判定する判定部をさらに備える
    ことを特徴とする請求項1~のいずれか1つに記載の生成装置。
  6. コンピュータが実行する生成方法であって、
    商品に関する商品情報を取得する取得工程と、
    第1商品情報に含まれる第1商品の名称と当該第1商品の商品説明との組合せを正例として、当該第1商品の名称と、第2商品情報に含まれる第2商品商品説明との組合せを負例として学習モデルに学習させ、当該第1商品の名称と当該第2商品の名称とを当該学習モデルに入力することで当該第1商品と当該第2商品と一致度合い示すスコアを出力す当該学習モデルを生成する生成工程と
    を含むことを特徴とする生成方法。
  7. 商品に関する商品情報を取得する取得手順と、
    第1商品情報に含まれる第1商品の名称と当該第1商品の商品説明との組合せを正例として、当該第1商品の名称と、第2商品情報に含まれる第2商品商品説明との組合せを負例として学習モデルに学習させ、当該第1商品の名称と当該第2商品の名称とを当該学習モデルに入力することで当該第1商品と当該第2商品と一致度合い示すスコアを出力す当該学習モデルを生成する生成手順と
    をコンピュータに実行させることを特徴とする生成プログラム。
JP2021045205A 2021-03-18 2021-03-18 生成装置、生成方法及び生成プログラム Active JP7231662B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021045205A JP7231662B2 (ja) 2021-03-18 2021-03-18 生成装置、生成方法及び生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021045205A JP7231662B2 (ja) 2021-03-18 2021-03-18 生成装置、生成方法及び生成プログラム

Publications (2)

Publication Number Publication Date
JP2022144280A JP2022144280A (ja) 2022-10-03
JP7231662B2 true JP7231662B2 (ja) 2023-03-01

Family

ID=83453646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021045205A Active JP7231662B2 (ja) 2021-03-18 2021-03-18 生成装置、生成方法及び生成プログラム

Country Status (1)

Country Link
JP (1) JP7231662B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009129087A (ja) 2007-11-21 2009-06-11 Yahoo Japan Corp 商品情報分類装置、プログラム、商品情報分類方法
JP2014225181A (ja) 2013-05-17 2014-12-04 株式会社アイディーズ 商品コード分析システム及び商品コード分析プログラム
JP2019020980A (ja) 2017-07-14 2019-02-07 ヤフー株式会社 推定装置、推定方法、推定プログラム、及びモデル
JP2019049945A (ja) 2017-09-12 2019-03-28 ヤフー株式会社 抽出装置、抽出方法、抽出プログラム、及びモデル
JP2019101959A (ja) 2017-12-07 2019-06-24 ヤフー株式会社 抽出装置、抽出方法、抽出プログラム及びモデル

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009129087A (ja) 2007-11-21 2009-06-11 Yahoo Japan Corp 商品情報分類装置、プログラム、商品情報分類方法
JP2014225181A (ja) 2013-05-17 2014-12-04 株式会社アイディーズ 商品コード分析システム及び商品コード分析プログラム
JP2019020980A (ja) 2017-07-14 2019-02-07 ヤフー株式会社 推定装置、推定方法、推定プログラム、及びモデル
JP2019049945A (ja) 2017-09-12 2019-03-28 ヤフー株式会社 抽出装置、抽出方法、抽出プログラム、及びモデル
JP2019101959A (ja) 2017-12-07 2019-06-24 ヤフー株式会社 抽出装置、抽出方法、抽出プログラム及びモデル

Also Published As

Publication number Publication date
JP2022144280A (ja) 2022-10-03

Similar Documents

Publication Publication Date Title
WO2017132296A1 (en) Annotation system for extracting attributes from electronic data structures
JP2018045553A (ja) 選択装置、選択方法および選択プログラム
JPWO2017013770A1 (ja) 検索装置、検索方法、記録媒体、および、プログラム
CN102708122A (zh) 信息处理装置和方法、检索设备和方法和记录介质
JP7231662B2 (ja) 生成装置、生成方法及び生成プログラム
JP4976097B2 (ja) UPnPによらない個体をUPnPデバイスまたはコンテンツで表現する方法及び装置
JP7001559B2 (ja) 公開装置、公開方法および公開プログラム
Gelli et al. Learning visual elements of images for discovery of brand posts
JP7387970B2 (ja) 算出装置、算出方法、算出プログラム
JP6007221B2 (ja) 複数入力変数に対する異常系テストデータ生成装置、方法、及びプログラム
JP7133508B2 (ja) 提供装置、提供方法および提供プログラム
JP6527257B1 (ja) 提供装置、提供方法および提供プログラム
JP7073227B2 (ja) 提供装置、提供方法及び提供プログラム
KR20210101165A (ko) 맞춤형 디자인 제공 시스템
JP7161002B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
Ferguson How analytics is giving fashion a makeover
JP7212728B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP7457675B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP2023168099A (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP2016021108A (ja) 情報処理装置及び情報処理プログラム
JP7430205B2 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
KR102718794B1 (ko) 소비자 맞춤 식품 추천 시스템
JP7350904B2 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JP7077464B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP2023168100A (ja) 情報処理装置、情報処理方法および情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230216

R150 Certificate of patent or registration of utility model

Ref document number: 7231662

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350