TW202226111A

TW202226111A - 學習裝置、程式產品及學習方法

Info

Publication number: TW202226111A
Application number: TW110136241A
Authority: TW
Inventors: 中澤満; 友岡高志
Original assignee: 日商樂天集團股份有限公司
Priority date: 2020-12-28
Filing date: 2021-09-29
Publication date: 2022-07-01
Also published as: JP7190479B2; JP2023018101A; TWI832099B; JP2022104310A; US20220207584A1; JP7445730B2

Abstract

進行從出品者而被提供的商品資訊是否匹配的判定。學習裝置係含有：商品資訊取得部，係從已被預先記憶有關於商品的由複數個項目資料所成之複數個商品資訊的記憶部，取得第1商品的第1商品資訊與第2商品的第2商品資訊；和商品資訊生成部，係生成將前記第1商品資訊中的至少1個項目資料，置換成前記第2商品資訊之該當項目資料的第3商品資訊；和學習部，係令一旦被輸入前記商品資訊就會判定該商品資訊是否匹配的機器學習模型，將前記第3商品資訊當作不匹配之商品資訊而進行學習。

Description

學習裝置、程式產品及學習方法

本揭露係有關於學習裝置、程式產品及學習方法。

近年來，在線上係被提供有購物或競標、跳蚤市場等之服務。這些服務所被提供的網頁(被稱為商品頁面或出品頁面)中，係被顯示有商品影像、商品名、商品說明文、類別等之關於商品的商品資訊。該當商品資訊，係藉由例如出品者或販售者，而被提供給服務的平台。

又，支援商品頁面之作成的技術，也已存在。例如，在下記專利文獻1中係揭露，基於從出品者所接收到的商品影像，而從藉由出品者所過去購入之商品的影像之中檢索出類似的類似影像，將含有已被檢索到之類似影像所對應之商品資訊的商品頁面加以生成的出品支援裝置。 [先前技術文獻] [專利文獻]

[專利文獻1]日本特開2014-115912號公報

[發明所欲解決之課題]

順便一提，為了讓購入者基於商品資訊而考慮購入，商品影像、商品名、商品說明文、類別等之關於商品的商品資訊整體而言是匹配的，才為理想。可是，從出品者而被提供的商品資訊，會有不匹配的情況。

本揭露的目的之1係為，提供一種用來判定從出品者而被提供的商品資訊是否匹配的學習裝置、機器學習模型及學習方法。 [用以解決課題之手段]

本揭露所述之學習裝置，係含有：商品資訊取得部，係從已被預先記憶有關於商品的由複數個項目資料所成之複數個商品資訊的記憶部，取得第1商品的第1商品資訊與第2商品的第2商品資訊；和商品資訊生成部，係生成將前記第1商品資訊中的至少1個項目資料，置換成前記第2商品資訊之該當項目資料的第3商品資訊；和學習部，係令一旦被輸入前記商品資訊就會判定該商品資訊是否匹配的機器學習模型，將前記第3商品資訊當作不匹配之商品資訊而進行學習。

在本揭露的一態樣中，前記商品資訊取得部，係基於前記第1商品與複數個前記第2商品之候補的類似度，而從前記複數個前記第2商品之候補，取得前記第2商品資訊。

在本揭露的一態樣中，前記商品資訊取得部，係將前記類似度是落在已被預先設定之範圍內的前記第2商品資訊，加以取得。

在本揭露的一態樣中，前記商品資訊取得部，係將前記類似度為已被預先設定之閾值以下的前記第2商品資訊，加以取得。

在本揭露的一態樣中，還含有：特徵資訊生成部，係生成前記各項目的特徵資訊；和特徵向量取得部，係基於前記各項目的特徵資訊，而針對前記第1商品、與前記複數個第2商品之候補之每一者，分別取得特徵向量；和類似度算出部，係基於前記第1商品的特徵向量、與前記第2商品之複數個候補的特徵向量之每一者的距離，而算出前記類似度。

在本揭露的一態樣中，前記機器學習模型，係針對每一前記項目而進行前記判定。

本揭露所述之程式產品，係一種程式產品，係用來令電腦發揮機能而成為，一旦被輸入關於商品的由複數個項目資料所成之商品資訊就會判定該商品資訊是否匹配的機器學習模型所需的程式產品，其中，前記機器學習模型係已經執行過，將從已被預先記憶有關於商品的由複數個項目資料所成之複數個商品資訊的記憶部所被取得之第1商品的第1商品資訊的至少1個項目資料被置換成從前記記憶部所被取得之第2商品的第2商品資訊之該當項目資料而被生成的第3商品資訊，當作不匹配之商品資訊的學習。

本揭露所述之學習方法，係含有：商品資訊取得步驟，係從已被預先記憶有關於商品的由複數個項目資料所成之複數個商品資訊的記憶部，取得第1商品的第1商品資訊與第2商品的第2商品資訊；和生成步驟，係生成將前記第1商品資訊中的至少1個項目資料，置換成前記第2商品資訊之該當項目資料的第3商品資訊；和學習步驟，係令一旦被輸入前記商品資訊就會判定該商品資訊是否匹配的機器學習模型，將前記第3商品資訊當作不匹配之商品資訊而進行學習。 [發明效果]

若依據本揭露，則從出品者而被提供的商品資訊是否不匹配的判定，會變得容易。

[1.判定系統的概要]

以下說明，本揭露所述之含有使用者裝置102與學習裝置104的判定系統100的實施形態之例子。圖1係判定系統100的硬體構成之概略的圖示。如圖1所示，判定系統100，係含有使用者裝置102和學習裝置104，這些係被連接至網際網路或LAN等之網路118。此外，雖然在圖1中使用者裝置102是圖示1台，但使用者裝置102係亦可為複數台。又，如後述，學習裝置104與判定裝置212是被個別地構成的情況下，則判定系統100係含有使用者裝置102和學習裝置104判定裝置212。

使用者裝置102，係為出品者等之使用者所操作的電腦。例如，使用者裝置102係為個人電腦、攜帶型資訊終端(包含平板型電腦及可穿戴式終端)、或行動電話(包含智慧型手機)。例如，使用者裝置102係含有：控制部106A、記憶部108A、通訊部110A、操作部112A、顯示部114A及攝影部116。

控制部106A，係含有至少1個處理器。控制部106A，係依照記憶部108A中所記憶之程式或資料，來執行處理。記憶部108A係含有主記憶部及輔助記憶部。例如，主記憶部係為RAM等之揮發性記憶體，輔助記憶部係為ROM、EEPROM、快閃記憶體、或硬碟等之非揮發性記憶體。

通訊部110A，係為有線通訊或無線通訊用之通訊介面，透過網路118而進行資料通訊。操作部112A，係為申請者用來進行操作所需之輸入裝置，例如觸控面板或滑鼠等之指標裝置、鍵盤、或按鈕等。操作部112A係將使用者所做的操作內容，傳達至控制部106A。顯示部114A係為例如液晶顯示部或有機EL顯示部等。顯示部114A係依照控制部106A的指示而顯示影像。

攝影部116，係含有至少1個相機。攝影部116，係將商品當作被攝體而進行攝影。此外，攝影部116係亦可不是生成靜止影像，而是生成影片。

學習裝置104，係在線上提供購物或競標、跳蚤市場等之服務的管理者所操作的電腦。例如，學習裝置104係為例如伺服器電腦。學習裝置104係亦可為個人電腦、攜帶型資訊終端(包含平板型電腦及可穿戴式終端)、或行動電話(包含智慧型手機)。

例如，學習裝置104係含有：控制部106B、記憶部108B、通訊部110B、操作部112B、顯示部114B。控制部106B、記憶部108B、通訊部110B、操作部112B、及顯示部114B之各者的實體構成，係可分別和使用者裝置102中所含有的控制部106A、記憶部108A、通訊部110A、操作部112A、及顯示部114A相同。

此外，作為被記憶在記憶部108A、108B中而說明的程式及資料，係亦可透過網路118而被供給。又，使用者裝置102及學習裝置104之各者的硬體構成，係不限於上記的例子，可適用各式各樣的硬體。例如，亦可包含有：將電腦可讀取之資訊記憶媒體予以讀取的讀取部(例如光碟驅動機或記憶卡插槽)或用來與外部機器進行資料之輸出入所需之輸出入部(例如USB埠)。例如，資訊記憶媒體中所被記憶之程式或資料係亦可透過讀取部或輸出入部，而被供給至各電腦。

[2.學習裝置中所被實現的機能] 圖2係為學習裝置104的機能構成的概略圖示。如圖2所示，學習裝置104係含有：資料記憶部202、商品資訊取得部204、商品資訊生成部206、學習部208、機器學習模型210。

機器學習模型210中所含之程式中，係被定義有電腦所需執行的處理內容(命令或計算式)，例如包含為了進行卷積或池化等之處理所需之程式碼。參數，係包含可藉由學習而被調整的至少1個數值，例如包含加權係數或偏置等之數值。若為學習前的機器學習模型210，則含有初期值之參數，若為已學習的機器學習模型210，則含有已經藉由學習而被調整過的參數。

在判定系統100中，機器學習模型210的學習會被進行，而會使用已學習之機器學習模型210來進行判定。此外，在本揭露中，進行學習的學習裝置104與含有已學習之機器學習模型210的判定裝置212是呈一體的形態來做說明，但學習裝置104與判定裝置212亦可被個別地構成。

資料記憶部202係預先被記憶有，關於商品的由複數個項目資料所成之複數個商品資訊。具體而言，例如，資料記憶部202係預先被記憶有，如圖3所示的含有第1商品至第n商品之複數個商品之商品資訊的第1資料集。在本實施形態中，各商品資訊係分別含有表示資料名、商品影像、價格、狀態、商品名/商品介紹文及類別的資料。

資料名，係為用來識別各商品之商品資訊的資料。例如，用來識別關於第1商品之商品資訊的資料名，係為第1商品資訊。同樣地，用來識別關於第2商品至第n商品之商品的商品資訊的資料名，係分別為第2商品資訊至第n商品資訊。

商品影像，係為拍攝了商品的影像資料。具體而言，例如拍攝了智慧型手機也就是第1商品的點陣圖形式之影像資料係為「aaa.bmp」。又，例如拍攝了電視機也就是第2商品的點陣圖形式之影像資料係為「bbb.bmp」。此外，商品影像係不限於點陣圖形式，只要是能夠讓商品資訊取得部204來取得的形式，則亦可為其他形式的靜止影像或影片。

價格係為表示該當商品之販售價格的數值資料。例如，智慧型手機也就是第1商品的價格，係為「50,000」。又，電視機也就是第2商品的價格係為「80,000」。此外，價格的單位雖然是日圓，但在此處，價格係為不含單位的數值資料。

狀態，係為表示該當商品之保存狀態的資料。具體而言，例如，第1商品的狀態係為「良好」，第2商品的狀態係為「不佳」。狀態係亦可為「良好」、「略差」、「不佳」等之字串資料，亦可為例如相應於保存狀態的被分類成6階段的數值資料。

商品名/商品介紹文，係為該當商品之產品名或規格、製造年月日等，關於出品者要對商品頁面之瀏覽者所進行之說明的字串資料。具體而言，例如，第1商品的商品名係為智慧型手機的產品名(型號等)，第2商品的商品名係為電視機的產品名(型號等)。又，第1商品的商品介紹文，係為所搭載的OS等之智慧型手機的規格、或製造廠商、製造年月日等之本文資料。第2商品的商品介紹文，係為畫面尺寸等之電視機的規格、或製造廠商、製造年月日等之本文資料。

類別，係為表示該當商品所該當之商品範疇之分類的資訊。具體而言，例如，在服務的頂層頁面等，係為了讓使用者容易檢索商品，而顯示有類別之一覽。類別，係為表示該當類別之一覽之中的一項目的資料，是使用者在檢索商品之際所使用的商品範疇之分類。類別，係亦可為「智慧型手機」或「電視機」等之表示特定之商品的字串資料，亦可為「女士」、「男士」等之表示目標之顧客層之屬性的字串資料。又，類別係亦可為，與上記特定之商品或屬性對應而被預先設定的數值資料。

又，商品影像、商品名/商品介紹文及類別，係連同表示各者之實態的資料而一起被與正確解答資料建立關連。各項目的正確解答資料係為表示，各項目之資料是否與商品資訊之中的其他項目之資料匹配的旗標。例如，正確解答資料，係在該當項目之資料是與其他項目之資料匹配的情況則被設定「0.0」之值，在不匹配的情況則設定「1.0」之值。正確解答資料，係亦可藉由管理者來確認商品資訊而被設定，亦可由後述的已學習之機器學習模型210所輸出的判定結果而被設定。

此處，所謂匹配的意思，係表示各項目是與其以外之項目在社會一般概念上為對應。具體而言，例如，商品影像的資料「aaa.bmp」是拍攝了智慧型手機的影像資料，商品名/商品介紹文之資料是記載了關於智慧型手機之說明的字串資料，對此，類別之資料卻是「車」或「包包」等之表示不同商品之類別的資料的情況下，則類別之資料係與商品影像及商品名/商品介紹文之資料在社會一般概念上並非對應。因此，在如此的情況下，作為類別之正確解答資料是被設定「1.0」。

此外，商品資訊中所含之不匹配之項目的數量，係不超過各商品資訊(圖3所示的1行之商品資訊)的正確解答資料為存在的項目數之半數。亦即，各商品資訊之正確解答資料為存在的項目之中的半數以上之項目的正確解答資料係為「0.0」。例如，在圖3所示的例子中，正確解答資料為存在的商品影像、商品名/商品介紹文、類別的3項目之中，2項目以上之正確解答資料係為「0.0」。被設定成匹配的項目，係至少根據正確解答資料為「0.0」的項目之關係，才會被判定成不匹配。

此外，各商品資訊，係亦可不只含有與各項目之資料建立關連的正確解答資料，亦可含有表示商品資訊就全體而言是否匹配的全體之正確解答資料(圖3的第2列)。全體之正確解答資料，係在與各項目建立關連的正確解答資料全部都是「0.0」的情況下則為「0.0」，在有1個以上的項目是「1.0」的情況下則被設成「1.0」。又，全體之正確解答資料，係亦可由後述的已學習之機器學習模型210所輸出的判定結果而被設定。

藉由預先將複數個使用者所出品之商品的商品資訊輸入至使用者裝置102，學習裝置104就會取得複數個商品資訊。資料記憶部202係預先被記憶有，關於商品的由複數個項目資料所成之複數個商品資訊。以下，假設資料記憶部202係已經預先記憶有如圖3所示的第1資料集來做說明。

商品資訊取得部204，係從資料記憶部202，取得第1商品的第1商品資訊與第2商品的第2商品資訊。具體而言，商品資訊取得部204，係取得第1商品的第1商品資訊。然後，商品資訊取得部204，係基於該當第1商品與複數個第2商品之候補的類似度，而從複數個第2商品之候補，取得第2商品資訊。

例如，首先，商品資訊取得部204係取得智慧型手機也就是第1商品的第1商品資訊。商品資訊取得部204，係雖然可從第1資料集中所含之商品資訊隨機地取得第1商品資訊，但亦可取得匹配的商品資訊(亦即所含的各正確解答資料全部都是「0.0」的商品資訊)。又，商品資訊取得部204，係從第1資料集針對複數個第2商品之候補之每一者而取得商品資訊。然後，商品資訊取得部204，係從該當候補之中基於第1商品與第2商品的類似度，取得電視機也就是第2商品的第2商品資訊。第2商品資訊，係會取得第1資料集中所含之第1商品資訊以外的商品資訊，但關於第2商品資訊的選擇方法係於後述。

商品資訊生成部206係生成，將第1商品資訊中的1個項目資料，置換成第2商品資訊之該當項目資料的第3商品資訊。具體而言，例如，商品資訊生成部206係生成，將第1商品資訊中的類別之資料「智慧型手機」，置換成第2商品資訊的類別之資料「電視機」的第3商品資訊。又，商品資訊生成部206係生成，將第1資料集中所含之第1商品資訊替換成第3商品資訊的第2資料集(參照圖4)。此外，替換的項目，係被隨機地選擇。替換的項目之數量，係只要不超過各商品資訊之正確解答資料為存在的項目數之半數的話，則亦可為複數。

此外，第2資料集係亦可為，在第1資料集中追加已被生成之第3商品資訊而成的資料集。又，商品資訊生成部206所生成的不匹配之商品資訊係亦可為複數，此情況下，第2資料集係含有複數個不匹配之商品資訊。

學習部208，係令一旦被輸入商品資訊就會判定該商品資訊是否匹配的機器學習模型210，將第3商品資訊當作不匹配之商品資訊而進行學習。機器學習模型210係為例如，卷積神經網路(CNN：Convolutional Neural Network)等之公知的神經網路。機器學習模型210，係一旦被輸入了商品的特徵向量(後述)，就計算商品資訊的特徵資訊，將相應於該特徵資訊的判定結果予以輸出。特徵資訊，係藉由表示已被輸入之資料之特徵的至少1個數值，而被表現。特徵資訊，通常係以多維向量而被表現，但亦可以表列形式或單一數值等之其他形式而被表現。關於學習部208對機器學習模型210所進行的學習，係於後述。

[3.第2商品資訊的選擇] 接下來，說明從第1資料集中所含之複數個商品資訊選擇出第2商品資訊的方法之一例。圖5係為商品資訊取得部204的機能構成的概略圖示。商品資訊取得部204係含有：特徵資訊生成部502、特徵向量取得部504、類似度算出部506、選擇部508。

特徵資訊生成部502，係生成各項目的特徵資訊。特徵量，係以任意的維度數而被表現。特徵資訊生成部502所致之特徵量的計算方法本身，係可利用公知的方法，例如進行已被設定好加權係數的過濾器所致之卷積或池化等。

具體而言，例如，特徵資訊生成部502係含有：針對商品資訊中所含之每一項目，一旦該項目之資料被輸入就生成特徵資訊的各部。在上記例子中，特徵資訊生成部502係含有：商品影像特徵資訊生成部502A、價格特徵資訊生成部502B、狀態特徵資訊生成部502C、商品說明特徵資訊生成部502D、類別特徵資訊生成部502E。

商品影像特徵資訊生成部502A，係一旦被輸入了商品影像之資料，就生成該商品影像的特徵資訊。價格特徵資訊生成部502B，係一旦被輸入了價格之資料，就生成該價格的特徵資訊。狀態特徵資訊生成部502C，係一旦被輸入了狀態之資料，就生成該狀態的特徵資訊。商品說明特徵資訊生成部502D，係一旦被輸入了商品名/商品介紹文之資料，就生成該商品名/商品介紹文的特徵資訊。類別特徵資訊生成部502E，係一旦被輸入了類別之資料，就生成該類別的特徵資訊。

特徵資訊生成部502中所含之各部，係可使用既存的技術，來生成相應於已被輸入之資料的特徵資訊。具體而言，例如，商品影像特徵資訊生成部502A，係亦可含有為了影像辨識研究而被準備的影像之標準資料集而進行過學習的機器學習模型，將該機器學習模型所算出的特徵向量，當作商品影像的特徵資訊。價格特徵資訊生成部502B，係可將該當商品的市場流通價格的與平均值之比率、或與第1資料集屬於相同類別的商品資訊中所含之價格之資料的與平均值之比率等，當作價格的特徵資訊。狀態特徵資訊生成部502C，係可參照隨應於已被預先設定之保存狀態而被分類成6階段的表，將與該狀態相對應的值，當作狀態的特徵資訊。商品說明特徵資訊生成部502D，係亦可含有使用網路上的字典或一般市場所能取得的語料庫而進行過學習的將任意長度之文章轉換成固定長度之向量的機器學習模型，將該機器學習模型所算出的特徵向量，當作商品名/商品介紹文的特徵資訊。類別特徵資訊生成部502E，係亦可將隨應於類別位於樹狀結構中的位置而被預先設定的值，當作類別的特徵資訊。

此外，特徵資訊生成部502中所含之各部所生成的特徵資訊，亦可分別都是純量量，亦可為向量量。又，特徵資訊生成部502，係不只基於第1商品，還會基於從第1資料集隨機地被選擇出來的複數個第2商品之候補的商品資訊，而生成特徵資訊。

特徵向量取得部504，係基於各項目的特徵資訊，而針對第1商品、與複數個第2商品之候補之每一者，分別取得特徵向量。具體而言，例如，特徵向量取得部504係將特徵資訊生成部502中所含之各部所生成的各項目的特徵資訊予以連結，而生成1個特徵向量。特徵向量的生成方法，係亦可單純將從商品影像到類別的各特徵資訊予以連結而生成特徵向量，亦可使用其他公知的方法來生成。特徵向量取得部504，係將第1商品的特徵向量、與隨機被選擇的複數個第2商品之候補的特徵向量，加以取得。

類似度算出部506，係算出第1商品、與第2商品之複數個候補的類似度。具體而言，例如，類似度算出部506，係將第1商品的特徵向量、與第2商品之複數個候補的特徵向量之各者在歐幾里得空間中的距離，予以算出。然後，類似度算出部506，係基於所算出的距離，而算出第1商品與第2商品之各候補的類似度。例如，類似度算出部506，係以距離越短則類似度越大，距離越長則類似度越小的方式，將對所算出之距離的倒數乘上所定之定數而得的值，當作第1商品與第2商品之各候補的類似度。亦即，第1商品與第2商品的類似度越大，則該當第1商品與第2商品就越為類似。

此外，類似度算出部506，係亦可不是基於特徵向量，而是基於特徵資訊生成部502所生成的各項目的特徵資訊或各項目之資料，而算出類似度。例如，類似度算出部506，係於類別的樹狀結構中，將第1商品、第2商品之各候補所屬的節點，予以特定。然後，類似度算出部506，係亦可將第1商品的類別之節點、與第2商品各之各候補所屬之節點的距離(例如最近共通祖先(LCA：Lowest Common Ancestor))予以算出，基於所算出的距離而算出類似度。

選擇部508，係選擇第2商品。具體而言，例如，若第1商品與第2商品的類似度過大的情況下，則第3商品的商品資訊就全體而言有時候會是匹配。於是，為了使與第1商品之類似度過大的第2商品不被選擇，選擇部508，係從第2商品的複數個候補之中，將類似度是已被預先設定之閾值以下的第2商品，加以。類似度是已被預先設定之閾值以下的第2商品之候補若為複數的情況下，則選擇部508，係亦可從其中隨機地選擇出第2商品，亦可選擇類似度最小的第2商品，亦可選擇類似度最大的第2商品。藉由取得類似度是已被預先設定之閾值以下的第2商品，就可防止全體而言為匹配的第3商品之商品資訊被生成。

又，選擇部508，係亦可將類似度是落在已被預先設定之範圍內的第2商品資訊，加以取得。具體而言，例如，選擇部508，係從第2商品的複數個候補之中，將類似度是落在已被預先設定之範圍內的第2商品加以取得。類似度是落在已被預先設定之範圍內的第2商品之候補若為複數的情況下，則選擇部508，係亦可從其中隨機地選擇出第2商品，亦可選擇類似度最小的第2商品，亦可選擇類似度最大的第2商品。

甚至，亦可隨應於管理者所想定的(欲偵測的)不匹配之商品資訊，而決定是否取得類似度是落在所定範圍內的商品之商品資訊，或是要取得閾值以下的商品之商品資訊。在要取得類似度是落在所定範圍內的商品之商品資訊的情況下，藉由適切地設定所定範圍，就可將與第1商品適度類似的商品，當作第2商品而加以取得。另一方面，在要取得類似度為閾值以下之商品資訊的情況下，藉由適切地設定閾值，就可將與第1商品不類似的商品，當作第2商品而加以取得。

圖6係為表示第2商品之選擇方法的流程圖之一例。首先，特徵資訊生成部502，係取得第1商品與第2商品的複數個候補之商品資訊(S602)。具體而言，特徵資訊生成部502，係將第1商品之商品資訊、與第2商品的複數個候補之商品資訊，從第1資料集之中隨機地取得。

接著，特徵資訊生成部502，係針對S602中所取得的所有的商品資訊，從該商品資訊中所含之各項目之資料，生成特徵資訊(S604)。然後特徵向量取得部504，係基於各項目的特徵資訊，而針對第1商品、與複數個第2商品之候補之每一者，將特徵向量予以生成並取得(S606)。

接著，類似度算出部506，係基於S606中所被取得之第1商品的特徵向量、與第2商品之複數個候補的特徵向量之各者的距離，而算出類似度(S608)。然後，選擇部508，係從第2商品的複數個候補之中，將類似度是已被預先設定之閾值以下的第2商品，加以取得(S610)。商品資訊生成部206，係基於第1商品之商品資訊、和S610中所被選擇之第2商品之商品資訊，而生成第3商品資訊。已被生成之第3商品資訊，係作為第2資料集之一部分而被記憶在資料記憶部202中。此外，圖6所示的第2商品之選擇方法係為一例，並非限定於此。例如，第2商品係亦可從第1資料集之中，被隨機地選擇。

[4.學習裝置所進行的學習] 本實施形態的學習裝置104，係進行如上記的機器學習模型210之學習，判定系統100，係利用已學習之機器學習模型210來進行商品資訊是否匹配之判定。學習中所被使用的訓練資料，係為第2資料集中所含之商品資訊。第2資料集係被記憶在資料記憶部202中。訓練資料，係為令機器學習模型210進行學習的各個資料單位。訓練資料，係也被稱為教師資料或學習資料。例如，訓練資料中，係有輸入資料與正確解答資料是被建立對應。亦即，訓練資料，係為輸入資料與正確解答資料之配對。1個1個的配對係為訓練資料，其集合就是第2資料集。訓練資料中所含之輸入資料，係為特徵向量取得部504所取得的特徵向量。輸入資料，係與要被輸入至已學習之機器學習模型210的輸入資料相同形式(在本實施形態中係為特徵向量)。

正確解答資料，係為表示身為正確解答之輸出的資料，是被各商品資訊所包含。所謂身為正確解答之輸出係指，在輸入資料被輸入的情況下，機器學習模型210所應輸出的內容(希望機器學習模型210所輸出的內容)。例如，正確解答資料係也可說成是，表示真值或真值向量的資料。正確解答資料，係也被稱作正確解答資訊。

例如，如圖4所示，屬於正例的第2商品資訊中所含之「電視機」此一資料，係與表示相當於有匹配的「0.0」(表示這是正例的真值)的正確解答資料，建立對應。對屬於負例的第3商品資訊中所含之「電視機」此一資料，則是有表示相當於不匹配的「1.0」(表示這是負例的真值)的正確解答資料，被建立對應。

在本實施形態中，第2資料集中所含之正確解答資料，係為商品影像的正確解答資料、商品名/商品介紹文的正確解答資料、類別的正確解答資料。例如，第2資料集的第3商品資訊之輸入資料，係有表示[0.0, 0.0, 1.0]的正確解答資料，被建立對應。第2資料集的第2商品資訊之輸入資料，係有表示[0.0, 0.0, 0.0]的正確解答資料，被建立對應。

學習部208，係對進行各項目是否匹配之判定的機器學習模型210，將從複數個訓練資料也就是商品資訊所生成的特徵向量予以依序輸入，基於該當商品資料所對應之正確解答資料，而進行機器學習模型210之學習。在本實施形態中，雖然說明輸入資料的輸入順序是被預先決定的情況，但輸入資料的輸入順序係亦可隨機地決定。

圖7係為表示學習之方法的流程之一例。首先，表示學習中所使用的商品資訊之順序的變數i，是被設定成1(S702)。然後，特徵向量取得部504，係基於第2資料集中所含之第i個商品資訊，而取得特徵向量(S704)。例如，第1個商品資訊，係商品影像之資料係為「aaa.bmp」，價格之資料係為「50000」，狀態之資料係為「良好」，商品名/商品介紹文之資料係為「aaa.txt」，類別之資料係為「電視機」。i為1的情況下，特徵向量取得部504，係基於第1個商品資訊而取得特徵向量。

學習部208，係將S704中所被取得之特徵向量，輸入至機器學習模型210(S706)。在本實施形態中，假設機器學習模型210係為藉由卷積神經網路(CNN)而被實作的機器學習模型210，來做說明。機器學習模型210，係一旦特徵向量被輸入，就將表示關於商品資訊全體、商品影像、商品名/商品介紹文、類別之判定結果的3維之向量予以輸出。亦即，機器學習模型210，係針對每一項目而進行判定。此外，3維之向量中所含之各維的值，係分別將表示是否為匹配之資料的機率設成「0.0」至「1.0」之間的值。各值，係在各項目之資料被判定為匹配的情況下則為「0.0」，被判定為不匹配的情況下則為「1.0」。

接著，學習部208，係計算損失，將機器學習模型210的內部參數予以更新(S708)。具體而言，學習部208，係基於在特徵向量被輸入至機器學習模型210之情況下所被輸出的以3維向量來表現的判定結果、與該當輸入資料所對應之正確解答資料，而計算損失。具體而言，例如，第2資料集的第3商品資訊之輸入資料，係有表示[0.0, 0.0, 1.0]的正確解答資料，被建立對應。學習部208，係使用表示S706中所被輸出之判定結果的3維向量、與該當正確解答資料之3維向量，而算出損失。損失的計算方法本身，係可利用2乘和誤差或交叉熵這類公知的計算方法。然後，學習部208，係以使得所被算出的損失會變小的方式，來將機器學習模型210的內部參數予以更新。此處，內部參數，係為機器學習模型210的內部定數，例如係為各節點之加權時所被使用的值。

一旦參數被更新，則i就被增值(S712)，使用下個商品資訊的參數之更新就被進行。學習部208，係直到損失變得足夠小為止(例如損失變成未滿閾值為止)，會一直重複機器學習模型210之學習。學習部208，係在學習途中損失變成足夠小的情況下，則亦可在此時點上結束學習。學習部208，係即使損失尚未變得足夠小，仍可在已經重複了所定次數之學習的情況下，結束學習。又，亦可在變數i變成與第2資料集中所含之商品資訊相同的情況下，結束學習。學習方法(參數之調整方法)本身，係可利用公知的手法，亦可利用其他的方法。

此外，雖然說明了，使用每一項目的正確解答資料來執行學習的情況，但亦可使用表示商品資訊全體而言是否匹配的正確解答資料來進行學習。具體而言，亦可使用圖4所示的第2資料集中的，與資料名建立關連的正確解答資料，來進行學習。與資料名建立關連的正確解答資料，係在該當商品資訊中所含之各項目之正確解答資料之中，只要至少1個為「1.0」，就設定「1.0」之值。亦即，與資料名建立關連的正確解答資料，係該當商品資訊中所含之各項目之正確解答資料全部都是「0.0」的情況下則被設定「0.0」之值。藉由進行如此的學習，機器學習模型210，係不只可針對每一項目進行判定，亦可就商品資訊全體而言判定是否匹配。

在學習時的學習裝置104中，資料記憶部202，係以記憶部108B為主而被實現，商品資訊取得部204、商品資訊生成部206、學習部208及機器學習模型210之各者，係以控制部106B為主而被實現。

[5.判定裝置所進行的判定] 已學習之學習裝置104，係可作為進行商品資訊是否匹配之判定的判定裝置212來使用。此外，判定裝置212，係並不一定要包含圖2所示的學習裝置104之各構成的全部。判定裝置212，係在圖2所示的學習裝置104的各構成之中，至少含有資料記憶部202、商品資訊取得部204、機器學習模型210即可。又，如圖8所示，判定裝置212中所含之商品資訊取得部204，係至少含有特徵資訊生成部502、特徵向量取得部504即可。機器學習模型210，係已經依照圖7所示的流程而進行過學習。依照圖8及圖9所示的流程圖，說明含有已學習之機器學習模型210的判定裝置212所進行的判定。

首先，商品資訊取得部204，係取得商品資訊(S902)。具體而言，欲出品商品的使用者，係對使用者裝置102輸入關於所出品之商品的商品資訊。商品資訊取得部204，係透過網路118，將使用者所輸入的商品資訊，加以取得。

接著，特徵資訊生成部502，係基於S902中所取得的商品資訊，而生成各項目的特徵資訊(S904)。又，特徵向量取得部504，係基於該當各項目的特徵資訊，而生成特徵向量(S906)。此處，假設S904及S906，係藉由與S604及S606相同之方法，來生成各項目的特徵資訊及特徵向量。

接著，已被生成之特徵向量，係被輸入至已學習之機器學習模型210(S908)，機器學習模型210，係將判定結果予以輸出(S910)。若依據上記例子，則判定結果係以3維向量而被表現。例如，判定結果是[0.0, 0.0, 1.0]的情況下，則該當判定結果係表示，商品影像與商品名/商品介紹文係為匹配，但類別係為不匹配。

又，判定裝置212係亦可構成為，在判定結果是表示不匹配的情況下，對管理者發出錯誤訊息或警告。甚至，判定裝置212亦可透過網路118而將判定結果為不匹配之事實，通知給使用者裝置102。接收到該當通知的使用者裝置102，係亦可在顯示部114A顯示出錯誤訊息、警告、催促修正或確認的訊息。此時，藉由機器學習模型210針對每一項目而進行判定，使用者裝置102及判定裝置212，係可向使用者或管理者通知發生不匹配的項目，並催促關於該當項目的確認或修正。

在判定裝置212中，資料記憶部202，係以記憶部108B為主而被實現，商品資訊取得部204及機器學習模型210，係以控制部106B為主而被實現。

如以上所述，若依據本揭露，則管理者，係可從從數多的出品者而被提供的商品資訊中，容易分辨出不匹配的商品資訊。又，在許多情況下，使用者所輸入的商品資訊係為匹配，因此為了學習時所使用的訓練資料而收集不匹配之商品資訊，是有困難的。於訓練資料中，相較於匹配的商品資訊而不匹配之商品資訊較為不足的情況下，會導致學習效率降低，或學習之結果所得的已學習機器學習模型的判定精度降低等等之疑慮。若依據本揭露，則可容易作成不匹配之商品資訊，藉此可期待學習效率之提升、或已學習機器學習模型的判定精度之提升。

此外，本揭露係不限定於以上說明的實施形態。在不脫離本揭露之宗旨的範圍內，可做適宜變更。

例如，第2商品資訊是被隨機地選擇而構成的情況下，則商品資訊取得部204，係亦可為不具有選擇部508或類似度算出部506的構成。

又，在將機器學習模型210構成為可受理各項目之資料的模型的情況下，則亦可將機器學習模型210與特徵資訊生成部502及特徵向量取得部504一體形成。

又，雖然說明了商品資訊是分別含有表示資料名、商品影像、價格、狀態、商品名/商品介紹文及類別之資訊的情況，但商品資訊係亦可只含有這些的一部分，亦可還包含有其他項目之資訊。

又，雖然判定系統100中包含有使用者裝置102與學習裝置104的情況，但使用者裝置102與學習裝置104，係亦可存在於個別的系統中。此情況下，學習裝置104，係如上記，含有資料記憶部202、商品資訊取得部204、商品資訊生成部206、學習部208、機器學習模型210，該當各構成，係藉由被實作有作為學習裝置之機能的電腦，來加以實現。另一方面，判定裝置212，係含有資料記憶部202、商品資訊取得部204、已執行過學習的機器學習模型210，該當各構成，係藉由與被實作有作為學習裝置之機能的電腦不同的電腦，來加以實現。甚至，作為被記憶在資料記憶部202中而說明的資料，係亦可被記憶在與使用者裝置102或學習裝置104不同的其他電腦或資訊記憶媒體中。

100:判定系統 102:使用者裝置 104:學習裝置 106A:控制部 106B:控制部 108A:記憶部 108B:記憶部 110A:通訊部 110B:通訊部 112A:操作部 112B:操作部 114A:顯示部 114B:顯示部 116:攝影部 118:網路 202:資料記憶部 204:商品資訊取得部 206:商品資訊生成部 208:學習部 210:機器學習模型 502:特徵資訊生成部 502A:商品影像特徵資訊生成部 502B:價格特徵資訊生成部 502C:狀態特徵資訊生成部 502D:商品說明特徵資訊生成部 502E:類別特徵資訊生成部 504:特徵向量取得部 506:類似度算出部 508:選擇部

[圖1]判定系統的全體構成的圖示。 [圖2]學習裝置及判定裝置中所被實現的機能之一例的機能區塊圖。 [圖3]第1資料集之一例的圖示。 [圖4]第2資料集之一例的圖示。 [圖5]商品資訊取得部的機能之一例的機能區塊圖。 [圖6]選擇第2商品的處理之一例的流程圖。 [圖7]學習裝置所執行的學習處理之一例的流程圖。 [圖8]商品資訊取得部的機能之一例的機能區塊圖。 [圖9]判定裝置所執行的判定處理之一例的流程圖。

104:學習裝置

202:資料記憶部

204:商品資訊取得部

206:商品資訊生成部

208:學習部

210:機器學習模型

212:判定裝置

Claims

一種學習裝置，係含有：商品資訊取得部，係從已被預先記憶有關於商品的由複數個項目資料所成之複數個商品資訊的記憶部，取得第1商品的第1商品資訊與第2商品的第2商品資訊；和商品資訊生成部，係生成將前記第1商品資訊中的至少1個項目資料，置換成前記第2商品資訊之該當項目資料的第3商品資訊；和學習部，係令一旦被輸入前記商品資訊就會判定該商品資訊是否匹配的機器學習模型，將前記第3商品資訊當作不匹配之商品資訊而進行學習。
如請求項1所記載之學習裝置，其中，前記商品資訊取得部，係基於前記第1商品與複數個前記第2商品之候補的類似度，而從前記複數個前記第2商品之候補，取得前記第2商品資訊。
如請求項2所記載之學習裝置，其中，前記商品資訊取得部，係將前記類似度是落在已被預先設定之範圍內的前記第2商品資訊，加以取得。
如請求項2所記載之學習裝置，其中，前記商品資訊取得部，係將前記類似度為已被預先設定之閾值以下的前記第2商品資訊，加以取得。
如請求項2至4之任一項所記載之學習裝置，其中，還含有：特徵資訊生成部，係生成前記各項目的特徵資訊；和特徵向量取得部，係基於前記各項目的特徵資訊，而針對前記第1商品、與前記複數個第2商品之候補之每一者，分別取得特徵向量；和類似度算出部，係基於前記第1商品的特徵向量、與前記第2商品之複數個候補的特徵向量之每一者的距離，而算出前記類似度。
如請求項1至4之任一項所記載之學習裝置，其中，前記機器學習模型，係針對每一前記項目而進行前記判定。
一種程式產品，係用來令電腦發揮機能而成為，一旦被輸入關於商品的由複數個項目資料所成之商品資訊就會判定該商品資訊是否匹配的機器學習模型所需的程式產品，其中，前記機器學習模型係已經執行過，將從已被預先記憶有關於商品的由複數個項目資料所成之複數個商品資訊的記憶部所被取得之第1商品的第1商品資訊的至少1個項目資料被置換成從前記記憶部所被取得之第2商品的第2商品資訊之該當項目資料而被生成的第3商品資訊，當作不匹配之商品資訊的學習。
一種學習方法，係含有：商品資訊取得步驟，係從已被預先記憶有關於商品的由複數個項目資料所成之複數個商品資訊的記憶部，取得第1商品的第1商品資訊與第2商品的第2商品資訊；和生成步驟，係生成將前記第1商品資訊中的至少1個項目資料，置換成前記第2商品資訊之該當項目資料的第3商品資訊；和學習步驟，係令一旦被輸入前記商品資訊就會判定該商品資訊是否匹配的機器學習模型，將前記第3商品資訊當作不匹配之商品資訊而進行學習。