JP6460095B2 - 学習モデル選択システム、学習モデル選択方法及びプログラム - Google Patents

学習モデル選択システム、学習モデル選択方法及びプログラム Download PDF

Info

Publication number
JP6460095B2
JP6460095B2 JP2016509979A JP2016509979A JP6460095B2 JP 6460095 B2 JP6460095 B2 JP 6460095B2 JP 2016509979 A JP2016509979 A JP 2016509979A JP 2016509979 A JP2016509979 A JP 2016509979A JP 6460095 B2 JP6460095 B2 JP 6460095B2
Authority
JP
Japan
Prior art keywords
learning model
target
model
value
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016509979A
Other languages
English (en)
Other versions
JPWO2015146026A1 (ja
Inventor
洋介 本橋
洋介 本橋
理人 浅原
理人 浅原
森永 聡
聡 森永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2015146026A1 publication Critical patent/JPWO2015146026A1/ja
Application granted granted Critical
Publication of JP6460095B2 publication Critical patent/JP6460095B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、データマイニングに関する。
データマイニングは、既知のデータに基づいて、未知の情報を予測したり、新規な知識を発見したり、問題を解決するための最適な解を見出したり、通常と異なるデータを検知したりする目的で利用されることがある。
特許文献1、特許文献2および特許文献3は、既知のデータに基づいて、未知の情報を予測する技術の一例を開示する。
特許文献1は、あるビルにおける未来の電力需要量を予測する装置を開示する。以下、電力需要量の予測対象であるビルを「対象ビル」と記載する場合がある。特許文献1が開示する装置は、データ記憶部と予測処理部とを備える。
データ記憶部は、対象ビルにおける過去の電力需要量を一日ごとに記憶している。より詳細には、データ記憶部は、一日ごとの電力需要量と、その日の例えば最高気温を示す値などとを関連付けたデータを記憶している。最高気温を示す値は、電力需要量を決定する要因の一つと考えられる。データ記憶部は、例えば過去一か月分のデータを記憶している。
予測処理部は、データ記憶部が記憶しているデータに基づいて、対象ビルについての学習モデルを生成する。学習モデルとは、最高気温を示す値(説明変数)と電力需要量(目的変数)との間に見出された規則性を示す情報である。予測処理部は、例えば回帰分析などの方法を用いることにより学習モデルを生成する。学習モデルは、例えば、説明変数を示す値を入力として受け付け、予測結果を出力する関数である。
予測処理部が、明日の電力需要量を予測する場合を考える。予測処理部は、例えば、明日の最高気温を示す値を、天気予報等を参照して取得する。予測処理部は、明日の最高気温を示す値を学習モデルに入力する。すると、学習モデルは、対象ビルにおける明日の電力需要量を予測する。本願の以下の説明において、学習モデルに基づいて動作する情報処理装置等の装置に、例えば値を入力することを、上述のように「学習モデルに値を入力する」と表記することがある。学習モデルに基づいて動作する情報処理装置等の装置が、例えば量を予測することを、上述のように「学習モデルが量を予測する」と表記することがある。
このように、特許文献1が開示する装置は、予測対象であるビル(すなわち対象ビル)における過去の電力需要量を示すデータに基づいて、対象ビルについての学習モデルを生成する。そして、特許文献1が開示する装置は、当該学習モデルを用いて、対象ビルにおける未来の電力需要量を予測する。
特許文献2は、ある書籍を中古書籍として販売する際の適正価格を予測する装置を開示する。適正価格とは、当該中古書籍が市場取引において売れる範囲での最も高い価格である。以下、予測対象である中古書籍を「対象中古書籍」と記載する場合がある。特許文献2が開示する装置は、対象中古書籍に付与されたISBN(International Standard Book Number)と同じISBNが付与された書籍(すなわち同じ書籍)が、過去に中古品として販売された際の取引実績価格を取得する。特許文献2が開示する装置は、当該取引実績価格を示す値を説明変数の一つとして、対象中古書籍の適正価格を予測する。
特許文献3は、不動産の価格を予測する装置を開示する。以下、予測対象である不動産を「対象不動産」と記載する場合がある。特許文献3が開示する装置は、例えば、対象不動産の近隣地域に存在する不動産の中から対象不動産と類似する不動産を抽出する。特許文献3が開示する装置は、その類似する不動産が過去に取引された際の価格等を参照することにより、予測対象である不動産の価格を予測する。
特開2013−255390号公報 特開2011−43970号公報 特開2003−22314号公報
特許文献1が開示する装置によれば、新築ビルにおける明日の電力需要量を予測することはできない。その理由は、新築ビルには、その新築ビルにおける過去の電力需要量を示すデータが存在しないからである。特許文献1が開示する装置は、対象ビルにおける過去の電力需要量を示すデータを使用して、その対象ビルにおける明日の電力需要量を予測する予測モデルを生成する。しかし、新築ビルが対象ビルである場合、対象ビルにおける過去の電力需要量を示すデータが存在しない。そのため、特許文献1が開示する装置は、新築ビルにおける明日の電力需要量を予測する予測モデルを生成できない。従って、特許文献1が開示する装置は、新築ビルにおける明日の電力需要量を予測することはできない。特許文献1が開示する装置は、対象ビルにおける過去の電力需要量を示すデータが十分に蓄積されてからでないと、対象ビルにおける明日の電力需要量を精度良く予測することはできない。
特許文献2が開示する装置によれば、過去に古本として販売された実績の無い書籍については、その書籍が中古書籍として販売される場合の適正価格を精度良く予測することは難しい。その理由は、対象中古書籍と同一の書籍が中古書籍として販売された実績が無ければ、特許文献2が開示する装置は、取引実績価格を取得することができないからである。取引実績価格を示す値は、適正価格を予測する際の重要な説明変数のうちの一つである。特許文献2が開示する装置は、対象中古書籍と同一の書籍が中古書籍として過去に販売された実績が十分に蓄積されてからでないと、対象中古書籍の適正価格を精度良く予測することは難しい。
このように、特許文献1が開示する装置も、特許文献2が開示する装置も、予測対象についての過去のデータ(すなわち既知データ)が十分に蓄積された段階でなければ、当該予測対象の未来または未知の性質を精度よく予測することは難しい。
特許文献3が開示する装置は、上述したように、不動産の価格を予測する。不動産という取引客体の性質を鑑みるに、対象不動産が取引される機会は非常に限定されている。予測対象である不動産において、過去に取引された際のデータが十分に蓄積される、というようなことは、不動産業界においては考えづらい。特許文献3が開示する装置は、不動産の価格を予測する際に、対象不動産が過去に取引された際の価格を説明変数として用いることは何ら考慮されていない。
本発明は、予測対象について既知データが全く無い段階または非常に少ない段階から、予測対象について既知データが十分に蓄積された段階に遷移する過程において、当該予測対象の性質を精度よく予測することを目的の一つとする。
上述した説明においては、理解を容易にするため、「予測」を目的とするデータマイニングを例に挙げて、発明が解決しようとする課題を説明した。しかし、本発明が解決する課題は「予測」には限定されない。
本発明は、分析対象について既知データが全く無い段階または非常に少ない段階から、分析対象について既知データが十分に蓄積された段階に遷移する過程において、当該分析対象の性質を精度よく分析することを他の目的とする。
本発明の第1の側面は、学習モデルを評価するモデル評価手段と、前記評価の結果に基づいて対象学習モデルおよび上位学習モデルのうち一方の学習モデルを選択するモデル選択手段と、を備え、前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、前記上位学習モデルは、複数の前記対象データおよび複数の類似データの集合である上位データセットに基づいて生成された学習モデルであり、前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である、学習モデル選択システムである。
本発明の第2の側面は、コンピュータが、学習モデルを評価し、前記評価の結果に基づいて対象学習モデルおよび上位学習モデルのうち一方の学習モデルを選択し、前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、前記上位学習モデルは、複数の前記対象データおよび複数の類似データの集合である上位データセットに基づいて生成された学習モデルであり、前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である、学習モデル選択方法である。
本発明の第3の側面は、コンピュータに、学習モデルを評価する第1の処理と、前記評価の結果に基づいて対象学習モデルおよび上位学習モデルのうち一方の学習モデルを選択する第2の処理と、を実行させ、前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、前記上位学習モデルは、複数の前記対象データおよび複数の類似データの集合である上位データセットに基づいて生成された学習モデルであり、前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である、プログラムを記憶するコンピュータ読み取り可能な記録媒体である。
本発明の第4の側面は、学習モデルを評価するモデル評価手段と、前記評価の結果に基づいて対象学習モデルおよび類似学習モデルのうち一方の学習モデルを選択するモデル選択手段と、を備え、前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、前記類似学習モデルは、一つまたは複数の類似データの集合である類似データセットに基づいて生成された学習モデルであり、前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である、学習モデル選択システムである。
本発明の第5の側面は、コンピュータが、学習モデルをし、前記評価の結果に基づいて対象学習モデルおよび類似学習モデルのうち一方の学習モデルを選択し、前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、前記類似学習モデルは、一つまたは複数の類似データの集合である類似データセットに基づいて生成された学習モデルであり、前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である、学習モデル選択方法である。
本発明の第6の側面は、コンピュータに、学習モデルを評価する第1の処理と、前記評価の結果に基づいて対象学習モデルおよび類似学習モデルのうち一方の学習モデルを選択する第2の処理と、を実行させ、前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、前記類似学習モデルは、一つまたは複数の類似データの集合である類似データセットに基づいて生成された学習モデルであり、前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である、プログラムを記憶するコンピュータ読み取り可能な記録媒体である。
また、本発明の目的は、上記のコンピュータ読み取り可能な記録媒体に格納されたプログラムによっても達成される。
本発明によれば、予測対象について既知データが全く無い段階または非常に少ない段階から、既知データが十分に蓄積された段階に遷移する過程において、当該予測対象の性質を精度よく予測することができる。
また、本発明によれば、分析対象について既知データが全く無い段階または非常に少ない段階から、既知データが十分に蓄積された段階に遷移する過程において、当該分析対象の性質を精度よく分析することができる。
本発明の第1の実施形態にかかる、意味階層モデルの具体例を示す図である。 本発明の第1の実施形態にかかる、予測対象データが蓄積される過程における、予測対象学習モデルおよび上位学習モデルの精度の推移を示すグラフを表す図である。 本発明の第1の実施形態にかかる、モデル選択システム100の構成を示すブロック図である。 本発明の第1の実施形態にかかるモデル選択システム100を実現するハードウェア構成の一例を示す図である。 本発明の第1の実施形態にかかるモデル選択システム100の動作の一例を示すフローチャートである。 本発明の第1の実施形態にかかる、意味階層モデルの他の例を示す図である。 本発明の第2の実施形態にかかる、モデル選択システム100Aの構成を示すブロック図である。 本発明の第3の実施形態にかかる、モデル選択システム100Bの構成を示すブロック図である。
理解を容易にするため、本発明が解決する課題を、具体例を挙げて詳細に説明する。具体例は、予測システムが新築ビルにおける明日の電力需要量を予測する、という例である。以下、電力需要量の予測対象であるこの新築ビルを「対象ビル」と記載する場合がある。
以下の説明における新築ビルは、電力需要量のデータが得られていないビルの例である。対象ビルは、その対象ビルについて、電力需要量を示す値を含むデータが蓄積されていなければ、新築ビルではないビルであってもよい。以下の説明では、「新築日」は、例えば、建設されたビルが使用され始めた日であってもよい。「新築日」は、予測システムが対象ビルの電力需要量を示す値を含むデータの蓄積を開始した日であってもよい。そして、「新築日」は、「新築された初日」とも表記される。
予測システムは、例えば新築日から、対象ビルにおける一日ごとの電力需要量を示す値と、その日の例えば最高気温を示す値などとを関連付けたデータを蓄積し続ける。最高気温は、電力需要量を決定する要因の一つである。本具体例においては、電力需要量を示す値が目的変数の値である。最高気温を示す値が説明変数の値である。以下、この一日分のデータを「既知データ」と記載する。また、既知データの集合を「既知データセット」と記載する。既知データセットは例えば過去1ヶ月分の既知データの集合である。
予測システムは、既知データセットに基づいて学習モデルを生成する。この場合、学習モデルは、電力需要量を示す値と最高気温を示す値との間に見出された規則性を示す情報である。そして予測システムは、この学習モデルを用いて明日の電力需要量を予測する。
「明日」は、例えば、電力需要量を予測するのに用いる学習モデルの生成に使用される、「既知データセット」に含まれる、最も新しい電力需要量の値が表す電力需要が生じた日の翌日である。「明日」は、例えば、その最も新しい電力需要量の値が表す電力需要が生じた日の、翌日より後の日であってもよい。
以下、「予測対象について既知データが全く無い段階または非常に少ない段階から、予測対象について既知データが十分に蓄積された段階に遷移する過程」ということを、下記に示す(段階1)、(段階2)および(段階3)の3段階に分けて説明する。
(段階1):段階1は、予測対象についての既知データが全く無い段階である。本具体例においては、段階1は、例えば、ビルが新築された初日である。この段階では、予測システムは、対象ビルについての学習モデルを生成することはできない。なぜなら、対象ビルにおける過去の電力需要量を示すデータ(すなわち既知データ)が一切存在しないからである。
そこで予測システムは、対象ビルと類似する性質を持つビルを複数抽出する。ビルの電力需要量は、例えば、ビルの日当たりの状況(すなわち日照条件)およびビルに入っているテナントの業種に強く依存すると仮定する。予測システムは、対象ビルの日照条件と似た日照条件のビルであり、かつ、対象ビルに入る予定のテナントの業種と同一または類似の業種のテナントが入っているビルを抽出する。以降、この抽出された一つまたは複数のビルを、「類似ビルの集合」と呼ぶ。この類似ビルの集合の中には、対象ビル自身が含まれる。
そして予測システムは、この類似ビルの集合における過去の電力需要量を示す、既知データセットを取得する。予測システムは、この取得した既知データセットに基づいて、「類似ビルの集合についての学習モデル」を生成する。そして予測システムは、この「類似ビルの集合についての学習モデル」を用いて、対象ビルにおける明日の電力需要量を予測する。以降、「類似ビルの集合についての学習モデル」を対象ビルの「上位学習モデル」と呼ぶ。
このように予測システムは、対象ビルにおける既知データが全く無い段階においては、対象ビルの上位学習モデルを用いることにより、対象ビルにおける明日の電力需要量を予測する。
(段階2):段階2は、予測対象について既知データが非常に少ない段階である。本具体例においては、段階2は、段階1から例えば数日が経過した段階である。この段階にあっては、予測システムは、段階1から経過した数日分の既知データを有している。予測システムは、この数日分の既知データに基づいて、対象ビルについて学習モデルを生成することができる。以下、対象ビル自身における既知データに基づいて生成された学習モデルを、上位学習モデルと区別する目的で「予測対象学習モデル」と記載する。
一般に、精度の良い学習モデルを生成するためには、十分な数量の既知データが必要である。この段階においては、対象ビル自身における既知データの数量は非常に少ないため、予測対象学習モデルの精度は良くない。一方、類似ビルの集合における既知データの数量は豊富であるので、上位学習モデルの精度は良い。
従って、この段階にあっては、予測システムは、予測対象学習モデルを用いるよりも、上位学習モデルを用いるほうが、対象ビルの明日の電力需要量を精度良く予測できる。
(段階3):段階3は、予測対象について既知データが十分に蓄積された段階である。本具体例においては、段階3は、段階1から例えば数ヶ月が経過した段階である。この段階にあっては、予測システムは、予測対象学習モデルを用いるほうが、上位学習モデルを用いるよりも、対象ビルの明日の電力需要量を精度良く予測できる。
その理由は、この段階にあっては、予測対象学習モデルは十分な数量の既知データに基づいて生成されているからである。従って、予測対象学習モデルは十分な精度を有していると考えられる。上位学習モデルも当然に十分な数量の既知データに基づいて生成されているが、上位学習モデルはあくまでも対象ビルに類似するビルにおける既知データが混じったデータセットに基づいて生成されるモデルである。このため、予測対象学習モデルが十分な数量の既知データに基づいて生成されているのであれば、予測対象学習モデルのほうが、対象ビルの明日の電力需要量を精度良く予測できると考えられる。
以上、「予測対象について既知データが全く無い段階または非常に少ない段階から、予測対象について既知データが十分に蓄積された段階に遷移する過程」を、具体例を用いて説明した。
予測対象について既知データが非常に少ない段階(すなわち段階2)から、予測対象について既知データが十分に蓄積された段階(すなわち段階3)に遷移する過程において、当該予測対象の未来または未知の性質を精度よく予測する際に、下記の課題が存在することを本発明者は見出した。
すなわち、上記の過程において、予測対象について未知の性質を予測する際に用いる学習モデルを、適切なタイミングにおいて、上位学習モデルから予測対象学習モデルへと切り替える、ということが、重要な課題であることを見出した。
以下、このような課題を解決可能な本発明の実施形態について、図面を参照して詳細に説明する。
<第1の実施形態>
理解を容易にするため、以下に示す用語を定義する。
(既知データ):既知データとは、目的変数の値と、当該目的変数の値を説明する説明変数の値とを関連付けた情報である。
(既知データセット):既知データセットとは、複数の既知データの集合である。
(学習モデル):学習モデルとは、目的変数の値と、当該目的変数の値を説明する説明変数の値との間に見出された規則性を示す情報である。学習モデルは既知データセットに基づいて生成される。学習モデルは、例えば以下に示す用途に用いられる。
1)未知の情報を予測する用途(予測:回帰または判別などを含む)
2)有用な知見を発見する用途(知識発見)
3)問題を解決するための最適な解を発見する用途(最適化)
4)通常と異なるサンプルデータを見つけ出す用途(異常検知)
本実施形態においては、理解を容易にするため、学習モデルを予測のために用いる例を挙げて説明している。しかし、本発明において、学習モデルの用途は予測のみには限定されない。学習モデルが予測のために用いられる場合、学習モデルは、説明変数の値を入力とし、目的変数の値を予測する関数である。以下、学習モデルが予測した目的変数の値を「予測値」と表現する。
(予測対象データ):予測対象データとは、予測対象についての既知データである。予測対象データは、特許請求の範囲に記載の「対象データ」の一例である。
(予測対象データセット):予測対象データセットとは、予測対象データの集合である。予測対象データセットは、特許請求の範囲に記載の「対象データセット」の一例である。
(類似データ):類似データとは、予測対象に類似する対象物についての既知データである。
(上位データセット):上位データセットとは、予測対象データおよび類似データの集合である。言い換えると、上位データセットは、予測対象データの集合および類似データの集合を含むデータセットである。
(予測対象学習モデル):予測対象学習モデルとは、予測対象データセットに基づいて生成された学習モデルである。予測対象学習モデルは、特許請求の範囲に記載の「対象学習モデル」の一例である。
(上位学習モデル):上位学習モデルとは、上位データセットに基づいて生成された学習モデルである。上位学習モデルは、対象学習モデルの上位に位置づけされたモデルといえる。
以下、中古品の販売業者(以下、「事業者」と記載する)が、ある品物を中古品として販売する際の適正価格を予測するシステムを例に挙げて、第1の実施形態を説明する。適正価格とは、当該中古品が市場取引において売れる範囲での最も高い価格である。
中古品は、中古で取引される品物である。中古品は、例えば、スマートフォン、携帯電話、PC(Personal Computer)、カメラ、腕時計、ゴルフクラブ、服などである。中古品は、以上の例に限られない。
第1の実施形態においては、「既知データ」は、ある品物が中古品として実際に販売された際の価格(すなわち取引実績価格)と、当該価格を決定付ける要因とが関連付けられた情報である。以下の説明では、実際に販売された際の価格を、取引実績価格又は単に価格と表記する。第1の実施形態においては、取引実績価格が目的変数である。その取引実績価格(すなわち価格)を決定付ける要因が説明変数である。価格を決定付ける要因としては、例えばキズの有無及び品物の色などの、さまざまな要因が考えられる。第1の実施形態においては、一つの既知データが、1台の中古品の販売実績に相当する。
図1は、意味階層モデルで表現されている、品種と、当該品種が有する属性との具体例を模式的に表す図である。意味階層モデルにおける属性は、説明変数と共通していてもよいし、共通していなくてもよい。図1に示す例では、意味階層モデルは木構造を有する。
図1に示す例では、品物は、スマートフォン及びフィーチャーフォンを含む携帯電話である。
図1に示す、木構造によって表される意味階層モデルでは、葉ノードに相当するノード1〜7は、それぞれ、いずれかの品種を表す。品種は、例えば、同一の機種名によって判別される、品物のモデルを表す。以下に示す、品種A、品種B、品種C、品種D、品種E、品種F、品種G等は、それぞれ、品種の名称(例えば機種名)を表す。以下の説明において、例えば「品種Aの品」は、品種Aという名称が付与されている品物であってもよい。品物が品種Aの品物である場合、その品物は、品種Aに属するとも表記される。同じ名称が付与されている品物であっても、品物の型番が異なる場合、それらの品物が属する品種は、異なっていてもよい。葉ノード以外のノードは、例えば属性に応じた1回以上のグループ分けによる、品種のグループを表す。以下の説明では、品種を表すノードの先祖グループを、その品種の上位グループとも表記する。品種は、その品種の各上位グループに属する。図1に示す例では、ノード13は、これらの品種の品物を製造する会社を表す。図1に示す例では、ノード11及びノード12は、例えば、スマートフォン及びフィーチャーフォンなどの、品種のグループを表す。ノード8、ノード9、及びノード10は、各品種の端末がサポートする移動体通信の規格(以下では通信規格とも表記する)に応じた、品種のグループを表す。
例えば、図1に示す品種Aの品物、品種Bの品物および品種Cの品物は、hogehoge社製の品物であり、かつ4G(Generation)及び3Gの通信規格をサポートするスマートフォンである。すなわち、品種Bおよび品種Cは、品種Aに類似している品種であるといえる。例えば、図1に示す品種Dの品物および品種Eの品物は、hogehoge社製の品物であり、かつ3Gの通信規格をサポートし、4Gの通信規格をサポートしないスマートフォンである。例えば、図1に示す品種Fの品物および品種Gの品物は、hogehoge社製の3Gの通信規格をサポートし、4Gの通信規格をサポートしないフィーチャーフォンである。
図1に例示する意味階層モデルでは、根ノードと葉ノードとの間のノードの数は2である。しかし、根ノードと葉ノードとの間のノードの数は2でなくてもよい。また、根ノードと葉ノードとの間のノードの数は、葉ノードによって異なっていてもよい。
上述のように、品物は携帯電話以外の品物であってもよい。例えば、品物がPCである場合、図1のノード11及びノード12に相当する、根ノードの子ノードは、例えば、PCの種別(可搬PC又は据え置き型PC)に応じたPCのグループであってもよい。図1のノード8、ノード9、及びノード10に相当する、根ノードの孫ノードは、例えば、PCがサポートする通信規格に応じたグループであってもよい。なお、品物がPCである場合の通信規格は、品物が携帯電話である場合における上述の通信規格と異なっていてよい。品物がPCである場合の通信規格は、例えば、移動体の通信規格を含んでいなくてもよい。品物が服である場合、根ノードの子ノードは、例えば、服の種別(例えば、長袖又は半袖)に応じたグループであってもよい。根ノードの孫ノードは、例えば、服の色又は柄に応じたグループであってもよい。品物が腕時計である場合、根ノードの子ノードは、例えば、ターゲット(男性向け、女性向け、男女兼用)であってもよい。根ノードの孫ノードは、例えば、腕時計の駆動方式(機械式、クウォーツ式)に応じたグループであってもよい。品物の種別がカメラである場合、根ノードの子ノードは、例えば、カメラの種別(デジタルカメラ、フィルムカメラ)であってもよい。根ノードの孫ノードは、例えば、カメラの形式(レンズ一体型、レンズ交換式)であってもよい。品物の種別がデジタルカメラである場合、根ノードの子ノードは、例えば、デジタルカメラの形式(レンズ一体型、レンズ交換式)であってもよい。根ノードの孫ノードは、例えば、撮影できる画像の種別(静止画像、動画像、静止画像及び動画像)であってもよい。以上は単なる例である。品物及びノードの定義は以上の例に限られない。以下では、品物が携帯電話であり、ノードが図1に示すように定義されている場合について説明する。
図1において、品種Aは新発売されたばかりの品種であると仮定する。図1において、品種Bおよび品種Cは、販売開始から十分な日数が経過している品種であると仮定する。また、図1において、品種D、品種E、品種Fおよび品種Gも、販売開始から十分な日数が経過している品種であると仮定する。品種Aは新発売されたばかりの品種であるので、品種Aについての既知データ(すなわち中古品としての販売実績)は全く蓄積されていない。品種Bおよび品種Cは、販売開始から十分な日数が経過している品種であるので、既知データが十分に蓄積されている。同様に、品種D、品種E、品種Fおよび品種Gについても、既知データが十分に蓄積されている。
このように中古品としての品種Aの品物の販売実績が存在しない状態で、中古品の販売業者が、品種Aの品物が中古品として市場に流通する際の適正価格を予測したい場合について考える。その場合、品種Aの品物が「予測対象」であり、品種A自身についての既知データが「予測対象データ」であり、品種A自身についての学習モデルが「予測対象学習モデル」である。以下、ある品種の品物が中古品として市場に流通する際の適正価格を、単に「ある品種の適性価格」と記載する。
まず、品種Aが発売開始されてから少しの期間が経過し、品種Aについての既知データ(すなわち予測対象データ)が少し蓄積された段階、すなわち段階2を考える。段階2においては、予測対象データはまだ十分な数量が蓄積されていない。従って、事業者は、この段階においては、予測対象データセットに基づいて精度の良い予測対象学習モデルを生成することはできない。段階2においては、事業者は、上位データセットに基づいて上位学習モデルを生成し、この上位学習モデルを用いて品種Aの適正価格を予測する。ここで、本実施形態においては、上位データセットは、品種Bおよび品種Cについての既知データの集合、並びに、予測対象データの集合を含むデータセットである。
次に、品種Aが発売開始されてから十分時間が経過し、十分な数量の予測対象データが蓄積された段階、すなわち段階3を考える。この段階においては、事業者は、予測対象データに基づいて精度の良い予測対象学習モデルを生成することができる。段階3においては、事業者は、予測対象学習モデルに基づいて品種Aの適正価格を予測する。
図2は、予測対象データが蓄積される過程における、予測対象学習モデルおよび上位学習モデルの精度の推移を示すグラフを表す図である。
図2に示す横軸は、予測対象データの数量(すなわち品種Aの品物が中古品として販売された実績を示す台数)を表す。図2に示す縦軸は、学習モデルが出力した予測値と、実績値との、差分の絶対値(以下、「誤差」と記載する)を表す。すなわち、図2に示す縦軸は、学習モデルの精度を表す(誤差の値が大きいほど精度が悪い)。図2において実線で示す折れ線は、予測対象学習モデルが出力する予測値の誤差を表す。図2において点線で示す折れ線は、上位学習モデルが出力する予測値の誤差を表す。
図2を参照すると、予測対象データの数量が少ない段階では、予測対象学習モデルが出力する予測値は、誤差が大きく、また安定しないことがわかる。また、図2を見ると、予測対象データの数量が少ない段階では、予測対象学習モデルが出力する予測値は、誤差が小さく、また、安定していることがわかる。
事業者は、図2に示す例では、実線と点線とが交差するタイミング、すなわち、数量が30個程度の予測対象データが蓄積されたタイミングの前後で、予測に用いる学習モデルを、上位学習モデルから予測対象学習モデルに切り替えることが望ましいといえる。
図3は、第1の実施形態にかかるモデル選択システム100の構成を示すブロック図である。図3に示すように、モデル選択システム100は、モデル生成部110と、モデル更新部120と、モデル評価部130と、モデル選択部140と、を備える。モデル選択システム100は、記憶部200にアクセス可能に接続されている。また、モデル選択システム100は、予測システム300にアクセス可能に接続されている。
記憶部200には、図1に示す品種Aから品種Gまでの各品種についての既知データの集合が記憶されている。いずれかの品種の品物が中古品として販売される度に、販売された中古品の販売実績を表すデータが既知データとして記憶部200に蓄積される。
モデル生成部110は、例えば図1に示すような意味階層モデルの入力を受け付ける。モデル生成部110は、記憶部200を参照し、既知データの集合を取得する。モデル生成部110は、意味階層モデルにおける各ノードについての学習モデルを生成する。
モデル生成部110が図1に示す意味階層モデルを受け付けた場合、モデル生成部110は例えば下記に示す学習モデルを生成する。
・品種Aについての学習モデル(ノード1についての学習モデルに相当)
・品種Bについての学習モデル(ノード2についての学習モデルに相当)
・品種Cについての学習モデル(ノード3についての学習モデルに相当)
・品種A、品種Bおよび品種Cを包含する学習モデル(ノード8についての学習モデルに相当)
・品種Dについての学習モデル(ノード4についての学習モデルに相当)
・品種Eについての学習モデル(ノード5についての学習モデルに相当)
・品種Dおよび品種Eを包含する学習モデル(ノード9についての学習モデルに相当)
・品種A、品種B、品種C、品種Dおよび品種Eを含む上位学習モデル(ノード11についての学習モデルに相当)
・品種Fについての学習モデル(ノード6についての学習モデルに相当)
・品種Gについての学習モデル(ノード7についての学習モデルに相当)
・品種Fおよび品種Gを包含する学習モデル(ノード10または12についての学習モデルに相当)
・品種Aから品種Gまでを包含する学習モデル(ノード13についての学習モデルに相当)
例えばモデル生成部110が品種Aについての学習モデルを生成する場合を考える。この場合、モデル生成部110は、品種Aについての既知データセットを記憶部200から取得する。そしてモデル生成部110は、取得した、品種Aについての既知データセットに基づいて、品種Aについての学習モデルを生成する。
例えばモデル生成部110がノード8についての学習モデルを生成する場合を考える。この場合、モデル生成部110は、品種Aについての既知データの集合、品種Bについての既知データの集合および品種Cについての既知データの集合を記憶部200から取得する。そしてモデル生成部110は、取得した、品種A、品種B及び品種Cについての既知データの集合であるデータセットに基づいて、ノード8についての学習モデルを生成する。
なお、モデル生成部110は、必ずしも意味階層モデルにおける全てのノードについての学習モデルを生成する必要はない。例えば予測対象である品種が品種Aである場合、モデル生成部110は、品種Aを表すノード(ノード1)と、品種Aの上位グループを表すノード(ノード8、ノード11およびノード13)についての学習モデルのみを生成してもよい。
モデル更新部120は、所定のタイミングにおいて、各学習モデルを更新する。前述したように、記憶部200には既知データが逐次蓄積される。モデル更新部120は例えば、記憶部200にある程度の数量の既知データが新たに蓄積されたタイミングにおいて、各学習モデルを更新してもよい。
モデル評価部130は、各学習モデルを評価する。評価の具体的な方法については後述する。モデル評価部130は、必ずしも意味階層モデルにおける全てのノードに相当する学習モデルを評価する必要はない。モデル評価部130は、少なくとも、予測対象学習モデルについて評価を行う。
モデル選択部140は、予測対象について予測を行う際に用いる学習モデルを、複数の学習モデルの中から選択する。モデル選択部140は、予測対象データの数量が少ない段階においては上位学習モデルを選択し、予測対象データが蓄積される過程において、上位学習モデルに代えて予測対象学習モデルを選択する。例えばモデル選択部140は、予測対象学習モデルにおける評価が所定の基準を満たしたタイミングにおいて、予測対象学習モデルを選択してもよい。または、モデル選択部140は、予測対象学習モデルにおける評価が上位学習モデルにおける評価を上回ったタイミングにおいて、予測対象学習モデルを選択してもよい。
モデル選択部140は、選択した学習モデルを予測システム300に出力する。
予測システム300は、モデル選択部140が選択した学習モデルに基づいて、予測対象について予測を行う。
(モデル選択システム100の、ハードウェア構成の一例の説明)
図4は、第1の実施形態にかかるモデル選択システム100を実現可能なハードウェア構成の一例を説明する図である。
図4に示す、モデル選択システム100を実現可能なハードウェア(例えばコンピュータ)は、CPU(Central Processing Unit)1、メモリ2、記憶装置3、及び、通信インターフェース(I/F)4を備える。モデル選択システム100は、さらに、入力装置5及び出力装置6を備えていてもよい。モデル選択システム100の機能は、例えばCPU1が、メモリ2に読み出されたコンピュータプログラム(ソフトウェアプログラム、以下単に「プログラム」と記載する)を実行することにより実現される。実行に際して、CPU1は、通信インターフェース4、入力装置5および出力装置6を適宜制御する。
図4に示す例では、具体的には、上述のプログラムは、例えば記憶媒体8に格納されている。そして、CPU1が、記憶媒体8に格納されているプログラムをメモリ2にロードする。CPU1がメモリ2にロードされたプログラムを実行することによって、図4に示す構成を備えるハードウェア(例えばコンピュータ)は、モデル選択システム100の、モデル生成部110、モデル更新部120、モデル評価部130、及びメモリ選択部140として動作する。
なお、本実施形態および後述する各実施形態を例として説明される本発明は、かかるプログラムが格納されたコンパクトディスク等の不揮発性の記憶媒体8によって実現されてもよい。記憶媒体8が格納するプログラムは、例えばドライブ装置7により読み出される。
モデル選択システム100が実行する通信は、例えばOS(Operating System)が提供する機能を使ってアプリケーションプログラムが通信インターフェース4を制御することによって実現される。入力装置5は、例えばキーボード、マウスまたはタッチパネルである。出力装置6は、例えばディスプレイである。モデル選択システム100は、2つ以上の物理的に分離した装置が有線または無線で通信可能に接続されることによって構成されていてもよい。
図4に示すハードウェア構成例は、後述する各実施形態にも適用可能である。なお、モデル選択システム100は専用の回路によって実現された装置であってもよい。なお、モデル選択システム100およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
具体的には、モデル選択システム100の、モデル生成部110、モデル更新部120、モデル評価部130、及びメモリ選択部140の一部又は全部は、それらの機能を実現する専用の回路によって実現されていてもよい。
また、記憶媒体8は、例えば、後述される実施形態に係るモデル選択システム100Aとして動作させるプログラムを記憶していてもよい。そして、図4に示す構成を備えるコンピュータのCPU1が、記憶媒体8に格納されているプログラムをメモリ2にロードする。この場合、CPU1がメモリ2にロードされたプログラムを実行することによって、そのコンピュータは、モデル選択システム100Aの、モデル生成部110、モデル更新部120、モデル評価部130、及びメモリ選択部140Aとして動作する。モデル選択システム100Aは、専用のハードウェアを使用して実現されていてもよい。すなわち、モデル選択システム100Aの、モデル生成部110、モデル更新部120、モデル評価部130、及びメモリ選択部140Aの一部又は全部が、それらの機能を実現する専用の回路によって実現されていてもよい。
記憶媒体8は、例えば、後述される実施形態に係るモデル選択システム100Bとして動作させるプログラムを記憶していてもよい。そして、図4に示す構成を備えるコンピュータのCPU1が、記憶媒体8に格納されているプログラムをメモリ2にロードする。CPU1がメモリ2にロードされたプログラムを実行することによって、そのコンピュータは、モデル選択システム100Bの、モデル評価部130B、及びメモリ選択部140Bとして動作する。モデル選択システム100Bは、専用のハードウェアによって実現されていてもよい。すなわち、モデル選択システム100Bの、モデル評価部130B、及びメモリ選択部140Bの一部又は全部が、それらの機能を実現する専用の回路によって実現されていてもよい。
(モデル選択システム100の動作の説明)
次に、第1の実施形態にかかるモデル選択システム100の動作の一例を説明する。図5は、モデル選択システム100の動作の一例を説明するフローチャートである。モデル更新部120は、記憶部200が記憶している既知データの集合に基づいて、各学習モデルを更新する(ステップS101)。モデル評価部130は、更新された学習モデルを評価する(ステップS102)。モデル選択部140は、所定の基準に基づいて、複数の学習モデルのうちから予測対象の予測に用いる学習モデルを選択する(ステップS103)。モデル選択部140は、選択した学習モデルを出力する(ステップS104)。
(モデル選択システム100が奏する効果の説明)
第1の実施形態にかかるモデル選択システム100によれば、予測対象について既知データが全く無い段階または非常に少ない段階から、予測対象について既知データが十分に蓄積された段階に遷移する過程において、当該予測対象の性質を精度よく予測することができる。その理由は、モデル選択部140が、予測対象学習モデルについての評価の結果が所定の基準を満たしたタイミングにおいて、上位学習モデルに代えて予測対象学習モデルを選択するからである。または、モデル選択部140が、予測対象学習モデルについての評価の結果が上位学習モデルについての評価の結果を上回ったタイミングにおいて、上位学習モデルに代えて予測対象学習モデルを選択するからである。
(評価の詳細の説明)
次に、モデル評価部130が学習モデルを評価する際の具体的な方法について説明する。以下に説明する評価の方法は、具体例に過ぎない。以下の説明は、本実施形態において評価を限定的に解釈するためのものではない。
モデル評価部130は、学習モデルを評価する際、下記に示す4つの観点のうち少なくとも1つの観点を用いて評価する。
(観点1):学習モデルが出力する予測値の誤差の大きさが小さいほど、当該学習モデルを高く評価する。
(観点2):学習モデルが出力する予測値の誤差の大きさが安定しているほど、当該学習モデルを高く評価する。
(観点3):学習モデルを生成する際の基になった既知データの数量が多いほど、当該学習モデルを高く評価する。
(観点4):予測対象を予測する際に用いる学習モデルが、予測対象に対してどの程度抽象的であるか、すなわち予測対象に対して何階層上位の学習モデルであるかに応じて、当該学習モデルを評価する。観点4においては、抽象的であるほど当該学習モデルを高く評価する場合と、抽象的であるほど当該学習モデルを低く評価する場合とがある。
モデル評価部130は、上述した複数の観点を組み合わせることによって、学習モデルを評価することが好ましい。その場合、モデル評価部130は、上述した複数の観点にそれぞれの重みを付けた上で、それらの観点を組み合わせてもよい。モデル評価部130が、どの観点にどの程度の重みを付けるかは、予測対象の性質または予測結果の用途などに依存する。
モデル評価部130は、好ましくはN分割交差検定を用いて、学習モデルを評価する。N分割交差検定は既知の方法である。以下、N分割交差検定を簡単に説明する。
モデル評価部130は、評価対象の学習モデルの基となった既知データセットをN個のブロックに分割する。この際、モデル評価部130は、各ブロックにできるだけ同じくらいの数量の既知データが含まれるように、既知データセットを分割する。例えば既知データセットが500個の既知データの集合であり、かつN=5である場合、モデル評価部130は、既知データセットを5つのブロックに分割する。この際、各ブロックに含まれる既知データの数量は100又は約100である。
モデル評価部130は、5つのブロックのうち、1つのブロックに含まれる既知データをテストデータとし、残り4つのブロックに含まれる既知データを訓練データとする。モデル評価部130は、訓練データと、テストデータに含まれる説明変数の値と、に基づいて、テストデータに含まれる目的変数の値を予測する。モデル評価部130は、予測した値と、テストデータに含まれる目的変数の実際の値とを比較する。モデル評価部130は、例えば、予測値と実際の値との誤差の平均値を算出する。
モデル評価部130は、テストデータとするブロックを換えながら、上述した処理(すなわち検定)をN回(上述の例では5回)繰り返す。モデル算出部は、N回(上述の例では5回)の検定における誤差の平均の値、および、分散の値を出力する。
例えばモデル評価部130は、予測対象学習モデルを評価した結果、N分割交差検定を用いて算出される、誤差の平均の値と、誤差の分散の値との両方が、あらかじめ定められたそれぞれの基準を満たしているか否かを評価してもよい。モデル評価部130は、誤差の平均の値及び誤差の分散の値両方の値が、それぞれの基準を満たしている場合に、上位学習モデルに代えて予測対象学習モデルを選択してもよい。
以上、モデル評価部130が学習モデルを評価する際の具体的な方法について説明した。
(上位学習モデルを生成する際の工夫の説明)
次に、モデル生成部110が上位学習モデルを生成する際の工夫について説明する。モデル更新部120が上位学習モデルを更新する際についても、同様の工夫を行う。
図1に示す意味階層モデルにおいて、例えば、品種Aについての既知データが50個蓄積されており、品種Bについての既知データが100個蓄積されており、品種Cについての既知データが200個蓄積されている、という状況を想定する。この状況において、モデル生成部110が、品種A、品種Bおよび品種Cを包含するグループの上位学習モデルを生成することを考える。
ここで、仮に、モデル生成部110が、品種Aについての50個の既知データと、品種Bについての100個の既知データと、品種Cについての200個の既知データとの、合計350個の既知データに基づいて上位学習モデルを生成するとする。この場合、生成された上位学習モデルには、既知データの数に応じた強さで、品種の特徴が反映される。生成された上位学習モデルは、品種Cの特徴が強く反映され、品種Aの特徴はあまり反映されていない学習モデルとなる。これは、上位学習モデルとして適当ではない。
モデル生成部110は、品種A、品種Bおよび品種Cのそれぞれから、できるだけ同じくらいの数量の既知データを取得し、取得した既知データを上位データセットとして使用する。そしてモデル生成部110は、各品種について、できるだけ同じくらいの数量の既知データを含む、その上位データセットに基づいて、上位学習モデルを生成する。
例えば、上述した例では、モデル生成部110は、品種A、品種Bおよび品種Cのそれぞれについて例えば50個ずつ、合計150個の既知データを取得する。そしてモデル生成部110は、取得した150個の既知データに基づいて上位学習モデルを生成する。
モデル生成部110がこのように上位学習モデルを生成することにより、上位学習モデルは、既知データが使用されたその上位学習モデルの学習に使用された品種の特徴を均等に反映した学習モデルになる。品種Cについての既知データが200個蓄積されているが、モデル生成部110は200個の既知データのうち、50個の既知データを、ランダムに選んでもよい。
以上、モデル生成部110が上位学習モデルを生成する際の工夫について説明した。
(学習モデルを選択する際の工夫の説明)
意味階層モデルが、少なくとも3階層を有している場合を想定する。この場合、モデル選択部140は、予測対象学習モデルと、上位学習モデルと、更に上位の上位学習モデルと、のうちから、一つの学習モデルを選択してもよい。予測対象学習モデルは、例えば図1におけるノード1についての学習モデルに相当する。上位学習モデルは、例えば図1におけるノード8についての学習モデルに相当する。更に上位の上位学習モデルは、例えば図1におけるノード11についての学習モデルに相当する。
(意味階層モデルのバリエーションの説明)
意味階層モデルは、図1に例示したような木構造には限定されない。以下、木構造以外の意味階層モデルの具体例を説明する。
図6は、概念的にテーブルとして例示する意味階層モデルの具体例を示す図である。図6に示す例は、品物が携帯電話である場合の例である。図6に示す情報は、図1に示す情報と対応している。図6には、品種Aから品種Gまでの7種類の品物が示されている。図6に示すように、それぞれの品種は、メーカー、種別および通信規格という3つの属性を有する。携帯電話の種別は、携帯電話がスマートフォンであるか又はフィーチャーフォンであるかを表す。
より具体的に、図6において、品種A、品種Bおよび品種Cは、hogehoge社製の品物であり、かつ4G及び3Gの規格をサポートするスマートフォンである。図6に示すように、品種Dおよび品種Eは、hogehoge社製の品物であり、かつ3Gの規格をサポートするスマートフォンである。図6に示すように、品種Fおよび品種Gは、hogehoge社製の品物であり、かつ3Gの規格をサポートするフィーチャーフォンである。これらの関係は、図1を参照して説明した意味階層モデルと同様である。
ここで、品種Aが予測対象の品種であるとする。このとき、品種Bおよび品種Cは、3つの属性のうち、全ての属性値が品種Aと共通している。従って、品種Bおよび品種Cは、品種Aと類似する品種である。
よって、品種A、品種Bおよび品種Cのそれぞれについての既知データの集合は、品種Aから見て上位データセットに相当する。
また、品種Aから品種Eまでの品種は、3つの属性のうち少なくとも2つの属性値が、品種Aと共通している。従って、品種A、品種B、品種C、品種Dおよび品種Eのそれぞれについての既知データの集合は、図1に例示した意味階層モデルにも示すように、品種Aから見て2階層上位のデータセットに相当する。
このように、意味階層モデルは必ずしも木構造で表現されている必要はない。予測対象が有する属性値と、他の対象が有する属性値とがどの程度共通しているかの度合いに応じて階層構造が定義されてもよい。以上、木構造以外の意味階層モデルの具体例を説明した。
(その他のバリエーションその1)
本実施形態において、学習モデルの用途は予測のみには限定されない。学習モデルは、有用な知見を発見する用途(すなわち知識発見)、問題を解決するための最適な解を発見する用途(すなわち最適化)、または、通常と異なるサンプルデータを見つけ出す用途(すなわち異常検知)などに用いられてもよい。
学習モデルがこれらの用途に用いられる場合においては、モデル選択システム100は、分析対象について既知データが全く無い段階または非常に少ない段階から、既知データが十分に蓄積された段階に遷移する過程において、当該分析対象の性質を精度よく分析することができる。
<第2の実施形態>
次に、上述した第1の実施形態を基本とする第2の実施形態について説明する。図7は、第2の実施形態におけるモデル選択システム100Aの構成を示すブロック図である。モデル選択システム100Aは、第1の実施形態におけるモデル選択部140に代えてモデル選択部140Aを備える。図3に示した構成と実質的に同一の構成については、同様の符号を付与し、説明を省略する
理解を容易にするため、以下に示す用語を定義する。
(類似データセット):類似データセットとは、一つまたは複数の類似データの集合である。
(類似学習モデル):類似学習モデルとは、類似データセットに基づいて生成された学習モデルである。
第1の実施形態においては、モデル選択部140は、予測対象学習モデルおよび上位学習モデルのうち、いずれかの学習モデルを、予測対象について予測を行う際の学習モデルとして選択することを説明した。
第2の実施形態においては、モデル選択部140Aは、予測対象モデルおよび類似学習モデルのうち、いずれかの学習モデルを、予測対象について予測を行う際の学習モデルとして選択する。
図1における意味階層モデルにおいて、品種Aが予測対象である場合、類似データセットは、品種Bについての既知データの集合であってもよい。あるいは、類似データは、品種Cについての既知データの集合であってもよい。あるいは、類似データセットは、品種Bおよび品種Cについての既知データの集合であってもよい。
モデル選択部140は、予測対象データの数量が少ない段階においては類似学習モデルを選択し、予測対象データが蓄積される過程において、類似学習モデルに代えて予測対象学習モデルを選択する。例えばモデル選択部140Aは、予測対象学習モデルにおける評価が所定の基準を満たしたタイミングにおいて、予測対象学習モデルを選択してもよい。または、モデル選択部140Aは、予測対象学習モデルにおける評価が類似学習モデルにおける評価を上回ったタイミングにおいて、予測対象学習モデルを選択してもよい。
第2の実施形態にかかるモデル選択システム100Aによれば、予測対象について既知データが全く無い段階または非常に少ない段階から、予測対象について既知データが十分に蓄積された段階に遷移する過程において、当該予測対象の性質を精度よく予測することができる。
<第3の実施形態>
図8は、第3の実施形態にかかるモデル選択システム100Bの構成を示すブロック図である。本実施形態は上述の第1及び第2の実施形態の最小構成を表す。図8に示すように、モデル選択システム100Bは、モデル評価部130Bと、モデル選択部140Bとを備える。
モデル評価部130Bは、学習モデルを評価する。モデル評価部130Bは、上述の、第1及び第2の実施形態のモデル評価部130が学習モデルを評価する方法と同様の方法で、学習モデルを評価すればよい。
モデル選択部140Bは、評価の結果に基づいて予測対象学習モデルおよび上位学習モデルのうち一方の学習モデルを選択する。モデル選択部140Bは、上述の、第1の実施形態のモデル選択部140又は第2の実施形態のモデル選択部140Aが学習モデルを選択する方法と同様の方法で、学習モデルを選択すればよい。
学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報である。対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルである。上位学習モデルは、複数の対象データおよび複数の類似データの集合である上位データセットに基づいて生成された学習モデルである。対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である。類似データは、特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である。
上述した各実施の形態は、適宜組み合わせて実施されることが可能である。
各ブロック図に示したブロック分けは、説明の便宜上から表された構成である。各実施形態を例に説明された本発明は、その実装に際して、各ブロック図に示した構成には限定されない。
以上、本発明を実施するための形態について説明したが、上記実施の形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明はその趣旨を逸脱することなく変更、改良され得ると共に、本発明にはその等価物も含まれる。
以下、参考形態の例を付記する。上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
学習モデルを評価するモデル評価部と、
前記評価の結果に基づいて対象学習モデルおよび上位学習モデルのうち一方の学習モデルを選択するモデル選択部と、を備え、
前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、
前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、
前記上位学習モデルは、複数の前記対象データおよび複数の類似データの集合である上位データセットに基づいて生成された学習モデルであり、
前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、
前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である、学習モデル選択システム。
(付記2)
前記モデル選択部は、前記評価の結果に基づいて前記対象学習モデルおよび前記上位学習モデルのうち一方の学習モデルを、特定の対象について予測を行う際に用いる学習モデルとして選択し、
前記学習モデルは、説明変数の値を入力とし、目的変数の値を予測する関数である、
付記1に記載の学習モデル選択システム。
(付記3)
前記対象データが蓄積される過程において、
前記対象データセットに基づいて前記対象学習モデルを更新し、前記上位データセットに基づいて前記上位学習モデルを更新する、モデル更新部を更に備える、
付記1または2に記載の学習モデル選択システム。
(付記4)
前記上位データセットは、前記対象データと、第1から第n(nは自然数)までの前記類似データと、を含む集合であり、
前記モデル更新部は、前記対象データの数量と、第1から第nまでのそれぞれの前記類似データの数量とがほぼ等しいような上位データセットに基づいて、前記上位学習モデルを更新する、
付記3に記載の学習モデル選択システム。
(付記5)
前記モデル選択部は、
前記対象データの数量が少ない段階においては前記上位学習モデルを選択し、前記対象データが蓄積される過程において、前記対象学習モデルにおける評価が所定の基準を満たしたタイミングにて、前記上位学習モデルに代えて前記対象学習モデルを選択する、
付記1から4までのいずれかに記載の学習モデル選択システム。
(付記6)
前記モデル選択部は、
前記対象データの数量が少ない段階においては前記上位学習モデルを選択し、前記対象データが蓄積される過程において、前記対象学習モデルにおける評価が前記上位学習モデルにおける評価を上回ったタイミングにて、前記上位学習モデルに代えて前記対象学習モデルを選択する、
付記1から4までのいずれかに記載の学習モデル選択システム。
(付記7)
少なくとも3階層を有する意味階層モデルにおいて、
前記意味階層モデルにおける或る階層に属する第1ノードは、前記特定の対象および前記対象データセットに相当し、
前記第1ノードを包含するノードである第2ノードは、前記上位データセットに相当し、
前記第2ノードを更に包含する第3ノードは、第2の上位データセットに相当し、
前記モデル生成部は、前記意味階層モデルの入力を受け付け、前記意味階層モデルにおける、前記第1ノードに相当する前記対象学習モデルと、前記第2ノードに相当する前記上位学習モデルと、前記第3ノードに相当する第2の上位学習モデルと、を生成し、
前記モデル更新部は、前記対象データが蓄積される過程において、前記対象学習モデルと、前記上位学習モデルと、前記第2の上位学習モデルと、を更新し、
前記モデル選択部は、前記対象データが蓄積される過程において、前記対象学習モデルと、前記上位学習モデルと、前記第2の上位学習モデルと、のうち、評価の高いモデルを選択する、
付記3から6までのいずれかに記載の学習モデル選択システム。
(付記8)
前記モデル評価部は、N分割交差検定法を用いて算出される、誤差を示す値の平均を示す値および分散を示す値に基づいて、学習モデルを評価する、付記1から7までのいずれかに記載の学習モデル選択システム。
(付記9)
前記モデル評価部は、前記意味階層モデルにおいて、前記第1ノードから何階層離れたノードに相当する学習モデルであるかを一つの評価指標として、当該学習モデルを評価する、付記1から7までのいずれかに記載の学習モデル選択システム。
(付記10)
学習モデルを評価し、
前記評価の結果に基づいて対象学習モデルおよび上位学習モデルのうち一方の学習モデルを選択し、
前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、
前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、
前記上位学習モデルは、複数の前記対象データおよび複数の類似データの集合である上位データセットに基づいて生成された学習モデルであり、
前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、
前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である、
学習モデル選択方法。
(付記11)
コンピュータに、
学習モデルを評価する第1の処理と、
前記評価の結果に基づいて対象学習モデルおよび上位学習モデルのうち一方の学習モデルを選択する第2の処理と、を実行させ、
前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、
前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、
前記上位学習モデルは、複数の前記対象データおよび複数の類似データの集合である上位データセットに基づいて生成された学習モデルであり、
前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、
前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である、
プログラム、又は、そのプログラムを記憶する記録媒体。
(付記12)
学習モデルを評価するモデル評価部と、
前記評価の結果に基づいて対象学習モデルおよび類似学習モデルのうち一方の学習モデルを選択するモデル選択部と、を備え、
前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、
前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、
前記類似学習モデルは、一つまたは複数の類似データの集合である類似データセットに基づいて生成された学習モデルであり、
前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、
前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である、
学習モデル選択システム。
(付記13)
前記モデル選択部は、前記評価の結果に基づいて前記対象学習モデルおよび前記類似学習モデルのうち一方の学習モデルを、特定の対象について予測を行う際に用いる学習モデルとして選択し、
前記学習モデルは、説明変数の値を入力とし、目的変数の値を予測する関数である、
付記12に記載の学習モデル選択システム。
(付記14)
前記対象データが蓄積される過程において、
前記対象データセットに基づいて前記対象学習モデルを更新し、前記類似データセットに基づいて前記類似学習モデルを更新する、モデル更新部を更に備える、
付記12または13に記載の学習モデル選択システム。
(付記15)
前記モデル選択部は、
前記対象データの数量が少ない段階においては前記類似学習モデルを選択し、前記対象データが蓄積される過程において、前記対象学習モデルにおける評価が所定の基準を満たしたタイミングにて、前記類似学習モデルに代えて前記対象学習モデルを選択する、
付記12から14までのいずれかに記載の学習モデル選択システム。
(付記16)
前記モデル選択部は、
前記対象データの数量が少ない段階においては前記類似学習モデルを選択し、前記対象データが蓄積される過程において、前記対象学習モデルにおける評価が前記類似学習モデルにおける評価を上回ったタイミングにて、前記類似学習モデルに代えて前記対象学習モデルを選択する、
付記12から14までのいずれかに記載の学習モデル選択システム。
(付記17)
前記モデル評価部は、N分割交差検定法を用いて算出される、誤差を示す値の平均を示す値および分散を示す値に基づいて、学習モデルを評価する、付記12から16までのいずれかに記載の学習モデル選択システム。
(付記18)
学習モデルを評価し、
前記評価の結果に基づいて対象学習モデルおよび類似学習モデルのうち一方の学習モデルを選択し、
前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、
前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、
前記類似学習モデルは、一つまたは複数の類似データの集合である類似データセットに基づいて生成された学習モデルであり、
前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、
前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である、
学習モデル選択方法。
(付記19)
コンピュータに、
学習モデルを評価する第1の処理と、
前記評価の結果に基づいて対象学習モデルおよび類似学習モデルのうち一方の学習モデルを選択する第2の処理と、を実行させ、
前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、
前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、
前記類似学習モデルは、一つまたは複数の類似データの集合である類似データセットに基づいて生成された学習モデルであり、
前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、
前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報である、
プログラム、又は、そのプログラムを記憶する記録媒体。
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2014年3月28日に出願された米国仮出願US61/971597を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明は、データマイニングなどに応用することができる。
1 CPU
2 メモリ
3 記憶装置
4 通信インターフェース
5 入力装置
6 出力装置
7 ドライブ装置
8 記憶媒体
100 モデル選択システム
100A モデル選択システム
100B モデル選択システム
110 モデル生成部
120 モデル更新部
130 モデル評価部
130B モデル評価部
140 モデル選択部
140A モデル選択部
140B モデル選択部
200 記憶部
300 予測システム

Claims (12)

  1. 学習モデルを評価するモデル評価手段と、
    前記評価の結果に基づいて対象学習モデルおよび上位学習モデルのうち一方の学習モデルを選択するモデル選択手段と、を備え、
    前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、
    前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、
    前記上位学習モデルは、複数の前記対象データおよび複数の類似データの集合である上位データセットに基づいて生成された学習モデルであり、
    前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、
    前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり
    前記対象データが蓄積される過程において、前記対象データセットに基づいて前記対象学習モデルを更新し、前記上位データセットに基づいて前記上位学習モデルを更新する、モデル更新手段と、
    モデル生成手段と、を更に備え、
    少なくとも3階層を有する階層モデルにおいて、
    前記階層モデルにおける或る階層に属する第1ノードは、前記特定の対象および前記対象データセットに相当し、
    前記第1ノードを包含するノードである第2ノードは、前記上位データセットに相当し、
    前記第2ノードを更に包含する第3ノードは、第2の上位データセットに相当し、
    前記モデル生成手段は、前記階層モデルの入力を受け付け、前記階層モデルにおける、前記第1ノードに相当する前記対象学習モデルと、前記第2ノードに相当する前記上位学習モデルと、前記第3ノードに相当する第2の上位学習モデルと、を生成し、
    前記モデル更新手段は、前記対象データが蓄積される過程において、前記対象学習モデルと、前記上位学習モデルと、前記第2の上位学習モデルと、を更新し、
    前記モデル選択手段は、前記対象データが蓄積される過程において、前記対象学習モデルと、前記上位学習モデルと、前記第2の上位学習モデルと、のうち、評価の高いモデルを選択する、
    学習モデル選択システム。
  2. 前記モデル選択手段は、前記評価の結果に基づいて対象学習モデルおよび上位学習モデルのうち一方の学習モデルを、特定の対象について予測を行う際に用いる学習モデルとして選択し、
    前記学習モデルは、説明変数の値を入力とし、目的変数の値を予測する関数である、
    請求項1に記載の学習モデル選択システム。
  3. 前記上位データセットは、前記対象データと、第1から第n(nは自然数)までの前記類似データと、を含む集合であり、
    前記モデル更新手段は、前記対象データの数量と、第1から第nまでのそれぞれの前記類似データの数量とが均等な上位データセットに基づいて、前記上位学習モデルを更新する、
    請求項1又は2に記載の学習モデル選択システム。
  4. 前記モデル選択手段は、
    前記対象データの数量が少ない段階においては前記上位学習モデルを選択し、前記対象データが蓄積される過程において、前記対象学習モデルにおける評価が所定の基準を満たしたタイミングにて、前記上位学習モデルに代えて前記対象学習モデルを選択する、
    請求項1からまでのいずれか1項に記載の学習モデル選択システム。
  5. 前記モデル選択手段は、
    前記対象データの数量が少ない段階においては前記上位学習モデルを選択し、前記対象データが蓄積される過程において、前記対象学習モデルにおける評価が前記上位学習モデルにおける評価を上回ったタイミングにて、前記上位学習モデルに代えて前記対象学習モデルを選択する、
    請求項1からまでのいずれか1項に記載の学習モデル選択システム。
  6. 前記モデル評価手段は、N分割交差検定法を用いて算出される、誤差を示す値の平均を示す値および分散を示す値に基づいて、学習モデルを評価する、請求項1から5までのいずれか1項に記載の学習モデル選択システム。
  7. 前記モデル評価手段は、前記階層モデルにおいて、前記第1ノードから何階層離れたノードに相当する学習モデルであるかを一つの評価指標として、当該学習モデルを評価する、請求項1からまでのいずれか1項に記載の学習モデル選択システム。
  8. コンピュータが、
    学習モデルを評価し、
    前記評価の結果に基づいて対象学習モデルおよび上位学習モデルのうち一方の学習モデルを選択し、
    前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、
    前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、
    前記上位学習モデルは、複数の前記対象データおよび複数の類似データの集合である上位データセットに基づいて生成された学習モデルであり、
    前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、
    前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり
    前記対象データが蓄積される過程において、前記対象データセットに基づいて前記対象学習モデルを更新し、前記上位データセットに基づいて前記上位学習モデルを更新し、
    少なくとも3階層を有する階層モデルにおいて、
    前記階層モデルにおける或る階層に属する第1ノードは、前記特定の対象および前記対象データセットに相当し、
    前記第1ノードを包含するノードである第2ノードは、前記上位データセットに相当し、
    前記第2ノードを更に包含する第3ノードは、第2の上位データセットに相当し、
    前記階層モデルの入力を受け付け、前記階層モデルにおける、前記第1ノードに相当する前記対象学習モデルと、前記第2ノードに相当する前記上位学習モデルと、前記第3ノードに相当する第2の上位学習モデルと、を生成し、
    前記対象データが蓄積される過程において、前記対象学習モデルと、前記上位学習モデルと、前記第2の上位学習モデルと、を更新し、
    前記対象データが蓄積される過程において、前記対象学習モデルと、前記上位学習モデルと、前記第2の上位学習モデルと、のうち、評価の高いモデルを選択する、
    学習モデル選択方法。
  9. コンピュータに、
    学習モデルを評価する第1の処理と、
    前記評価の結果に基づいて対象学習モデルおよび上位学習モデルのうち一方の学習モデルを選択する第2の処理と、を実行させ、
    前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、
    前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、
    前記上位学習モデルは、複数の前記対象データおよび複数の類似データの集合である上位データセットに基づいて生成された学習モデルであり、
    前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、
    前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり
    前記対象データが蓄積される過程において、前記対象データセットに基づいて前記対象学習モデルを更新し、前記上位データセットに基づいて前記上位学習モデルを更新する第3の処理と、
    第4の処理と、を前記コンピュータの更に実行させ、
    少なくとも3階層を有する階層モデルにおいて、
    前記階層モデルにおける或る階層に属する第1ノードは、前記特定の対象および前記対象データセットに相当し、
    前記第1ノードを包含するノードである第2ノードは、前記上位データセットに相当し、
    前記第2ノードを更に包含する第3ノードは、第2の上位データセットに相当し、
    前記第4の処理は、前記階層モデルの入力を受け付け、前記階層モデルにおける、前記第1ノードに相当する前記対象学習モデルと、前記第2ノードに相当する前記上位学習モデルと、前記第3ノードに相当する第2の上位学習モデルと、を生成し、
    前記第3の処理は、前記対象データが蓄積される過程において、前記対象学習モデルと、前記上位学習モデルと、前記第2の上位学習モデルと、を更新し、
    前記第2の処理は、前記対象データが蓄積される過程において、前記対象学習モデルと、前記上位学習モデルと、前記第2の上位学習モデルと、のうち、評価の高いモデルを選択する、
    プログラム。
  10. 学習モデルを評価するモデル評価手段と、
    前記評価の結果に基づいて対象学習モデルおよび類似学習モデルのうち一方の学習モデルを選択するモデル選択手段と、を備え、
    前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、
    前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、
    前記類似学習モデルは、一つまたは複数の類似データの集合である類似データセットに基づいて生成された学習モデルであり、
    前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、
    前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり
    前記対象データが蓄積される過程において、前記対象データセットに基づいて前記対象学習モデルを更新し、前記類似データセットに基づいて前記類似学習モデルを更新する、モデル更新手段と、
    モデル生成手段と、を更に備え、
    少なくとも3階層を有する階層モデルにおいて、
    前記階層モデルにおける或る階層に属する第1ノードは、前記特定の対象および前記対象データセットに相当し、
    前記第1ノードを包含するノードである第2ノードは、前記類似データセットに相当し、
    前記第2ノードを更に包含する第3ノードは、第2の類似データセットに相当し、
    前記モデル生成手段は、前記階層モデルの入力を受け付け、前記階層モデルにおける、前記第1ノードに相当する前記対象学習モデルと、前記第2ノードに相当する前記類似学習モデルと、前記第3ノードに相当する第2の類似学習モデルと、を生成し、
    前記モデル更新手段は、前記対象データが蓄積される過程において、前記対象学習モデルと、前記類似学習モデルと、前記第2の類似学習モデルと、を更新し、
    前記モデル選択手段は、前記対象データが蓄積される過程において、前記対象学習モデルと、前記類似学習モデルと、前記第2の類似学習モデルと、のうち、評価の高いモデルを選択する、
    学習モデル選択システム。
  11. コンピュータが、
    学習モデルを評価し、
    前記評価の結果に基づいて対象学習モデルおよび類似学習モデルのうち一方の学習モデルを選択し、
    前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、
    前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、
    前記類似学習モデルは、一つまたは複数の類似データの集合である類似データセットに基づいて生成された学習モデルであり、
    前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、
    前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり
    前記対象データが蓄積される過程において、前記対象データセットに基づいて前記対象学習モデルを更新し、前記類似データセットに基づいて前記類似学習モデルを更新し、
    少なくとも3階層を有する階層モデルにおいて、
    前記階層モデルにおける或る階層に属する第1ノードは、前記特定の対象および前記対象データセットに相当し、
    前記第1ノードを包含するノードである第2ノードは、前記類似データセットに相当し、
    前記第2ノードを更に包含する第3ノードは、第2の類似データセットに相当し、
    前記階層モデルの入力を受け付け、前記階層モデルにおける、前記第1ノードに相当する前記対象学習モデルと、前記第2ノードに相当する前記類似学習モデルと、前記第3ノードに相当する第2の類似学習モデルと、を生成し、
    前記対象データが蓄積される過程において、前記対象学習モデルと、前記類似学習モデルと、前記第2の類似学習モデルと、を更新し、
    前記対象データが蓄積される過程において、前記対象学習モデルと、前記類似学習モデルと、前記第2の類似学習モデルと、のうち、評価の高いモデルを選択する、
    学習モデル選択方法。
  12. コンピュータに、
    学習モデルを評価する第1の処理と、
    前記評価の結果に基づいて対象学習モデルおよび類似学習モデルのうち一方の学習モデルを選択する第2の処理と、を実行させ、
    前記学習モデルは、目的変数の値と、当該目的変数の値を説明する説明変数の値と、の間に見出された規則性を示す情報であり、
    前記対象学習モデルは、複数の対象データの集合である対象データセットに基づいて生成された学習モデルであり、
    前記類似学習モデルは、一つまたは複数の類似データの集合である類似データセットに基づいて生成された学習モデルであり、
    前記対象データは、特定の対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり、
    前記類似データは、前記特定の対象と類似する対象についての、目的変数の値と、当該目的変数の値を説明する説明変数の値とが関連付けられた情報であり
    前記対象データが蓄積される過程において、前記対象データセットに基づいて前記対象学習モデルを更新し、前記類似データセットに基づいて前記類似学習モデルを更新する第3の処理と、
    第4の処理と、を前記コンピュータの更に実行させ、
    少なくとも3階層を有する階層モデルにおいて、
    前記階層モデルにおける或る階層に属する第1ノードは、前記特定の対象および前記対象データセットに相当し、
    前記第1ノードを包含するノードである第2ノードは、前記類似データセットに相当し、
    前記第2ノードを更に包含する第3ノードは、第2の類似データセットに相当し、
    前記第4の処理は、前記階層モデルの入力を受け付け、前記階層モデルにおける、前記第1ノードに相当する前記対象学習モデルと、前記第2ノードに相当する前記類似学習モデルと、前記第3ノードに相当する第2の類似学習モデルと、を生成し、
    前記第3の処理は、前記対象データが蓄積される過程において、前記対象学習モデルと、前記類似学習モデルと、前記第2の類似学習モデルと、を更新し、
    前記第2の処理は、前記対象データが蓄積される過程において、前記対象学習モデルと、前記類似学習モデルと、前記第2の類似学習モデルと、のうち、評価の高いモデルを選択する、
    プログラム。
JP2016509979A 2014-03-28 2015-03-11 学習モデル選択システム、学習モデル選択方法及びプログラム Active JP6460095B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201461971597P 2014-03-28 2014-03-28
US61/971,597 2014-03-28
PCT/JP2015/001313 WO2015146026A1 (ja) 2014-03-28 2015-03-11 モデル選択システム、モデル選択方法およびプログラムを記憶する記録媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018245067A Division JP2019075159A (ja) 2014-03-28 2018-12-27 学習モデル選択システム、学習モデル選択方法およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2015146026A1 JPWO2015146026A1 (ja) 2017-04-13
JP6460095B2 true JP6460095B2 (ja) 2019-01-30

Family

ID=54194580

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016509979A Active JP6460095B2 (ja) 2014-03-28 2015-03-11 学習モデル選択システム、学習モデル選択方法及びプログラム
JP2018245067A Pending JP2019075159A (ja) 2014-03-28 2018-12-27 学習モデル選択システム、学習モデル選択方法およびプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2018245067A Pending JP2019075159A (ja) 2014-03-28 2018-12-27 学習モデル選択システム、学習モデル選択方法およびプログラム

Country Status (3)

Country Link
US (1) US20180181875A1 (ja)
JP (2) JP6460095B2 (ja)
WO (1) WO2015146026A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210050726A (ko) * 2019-10-29 2021-05-10 주식회사 꿀비 부동산 거래 정보 및 가격 예측 정보 제공 시스템 및 그 방법

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11593817B2 (en) * 2015-06-30 2023-02-28 Panasonic Intellectual Property Corporation Of America Demand prediction method, demand prediction apparatus, and non-transitory computer-readable recording medium
JP6804934B2 (ja) * 2016-10-26 2020-12-23 株式会社東芝 消費エネルギー予測装置及び消費エネルギー予測方法
US11049022B2 (en) * 2017-07-28 2021-06-29 Microsoft Technology Licensing, Llc Realtime response to network-transferred content requests using statistical prediction models
JP6875347B2 (ja) * 2018-10-12 2021-05-26 ファナック株式会社 熱変位補正装置及び数値制御装置
CN113454413B (zh) * 2019-02-19 2023-06-27 杰富意钢铁株式会社 操作结果预测方法、学习模型的学习方法、操作结果预测装置及学习模型的学习装置
WO2020250597A1 (ja) * 2019-06-12 2020-12-17 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
WO2021038759A1 (ja) * 2019-08-28 2021-03-04 富士通株式会社 モデル選択方法、モデル選択プログラムおよび情報処理装置
EP4024297A4 (en) * 2019-09-16 2022-11-09 Huawei Cloud Computing Technologies Co., Ltd. ARTIFICIAL INTELLIGENCE (AI) MODEL EVALUATION METHOD AND SYSTEM, AND DEVICE
WO2021095693A1 (ja) * 2019-11-14 2021-05-20 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
KR102122168B1 (ko) * 2020-01-08 2020-06-11 (주)유에스티21 해무 소산 예측 모델 학습 방법 선택 장치, 해무 소산 예측 모델 학습 방법 선택 방법, 해무 소산 예측 장치 및 해무 소산 예측 방법
JP7434065B2 (ja) * 2020-05-29 2024-02-20 株式会社Jij 機械学習モデルを構築する装置、方法及びそのためのプログラム
CN116097287A (zh) * 2020-07-30 2023-05-09 阿瑙特株式会社 计算机程序、学习模型的生成方法、手术辅助装置以及信息处理方法
JP7387573B2 (ja) * 2020-10-06 2023-11-28 キヤノン株式会社 情報処理システム、情報処理装置、情報処理方法及びプログラム
US11348035B2 (en) * 2020-10-27 2022-05-31 Paypal, Inc. Shared prediction engine for machine learning model deployment
JP7482055B2 (ja) 2021-01-28 2024-05-13 株式会社東芝 状態診断装置、システム、及び方法
JP2023025801A (ja) * 2021-08-11 2023-02-24 三菱重工業株式会社 予測装置、予測方法およびプログラム
JP7275365B1 (ja) 2022-07-25 2023-05-17 株式会社コーニッシュ 不動産取引の価格予測装置及び方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4093934B2 (ja) * 2003-07-16 2008-06-04 株式会社神戸製鋼所 モデルパラメータ決定方法及びそのプログラム,モデル予測方法及びそのプログラム
JP4971015B2 (ja) * 2007-04-10 2012-07-11 株式会社デンソー 推定装置
JP5408380B1 (ja) * 2013-06-17 2014-02-05 富士ゼロックス株式会社 情報処理プログラム及び情報処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210050726A (ko) * 2019-10-29 2021-05-10 주식회사 꿀비 부동산 거래 정보 및 가격 예측 정보 제공 시스템 및 그 방법
KR102353818B1 (ko) * 2019-10-29 2022-01-20 주식회사 꿀비 부동산 거래 정보 및 가격 예측 정보 제공 시스템 및 그 방법

Also Published As

Publication number Publication date
JPWO2015146026A1 (ja) 2017-04-13
WO2015146026A1 (ja) 2015-10-01
JP2019075159A (ja) 2019-05-16
US20180181875A1 (en) 2018-06-28

Similar Documents

Publication Publication Date Title
JP6460095B2 (ja) 学習モデル選択システム、学習モデル選択方法及びプログラム
JP6531821B2 (ja) 予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラム
TWI598812B (zh) 判定用於軟體開發之經推薦之最佳化策略
Chan et al. PredictionIO: a distributed machine learning server for practical software development
JP6299599B2 (ja) 情報システム構築支援装置、情報システム構築支援方法および情報システム構築支援プログラム
US8762417B2 (en) Event impact analysis
AU2019202454A1 (en) Smart advisory for distributed and composite testing teams based on production data and analytics
JPWO2006100753A1 (ja) コスト情報管理システム、コスト情報管理方法およびコスト情報管理プログラム
JP2021064049A (ja) 計算機システム及び数理モデルの生成支援方法
WO2018150550A1 (ja) 学習データ管理装置及び学習データ管理方法
US20200250691A1 (en) Information processing apparatus, control method, and program
JP2020187417A (ja) 物性予測装置及び物性予測方法
JP6094595B2 (ja) 情報システム構築支援装置、情報システム構築支援方法および情報システム構築支援プログラム
CN110610252A (zh) 预测系统以及预测方法
US20170351721A1 (en) Predicting index fragmentation caused by database statements
WO2016063502A1 (ja) 知識管理装置、知識管理方法、及び、プログラムの記録媒体
WO2015136885A1 (ja) 評価システム、評価方法およびコンピュータ読み取り可能な記憶媒体
US11200527B2 (en) Platform for evaluating and recommending process automations
US11887017B2 (en) Automatically predicting transaction likelihood information and transaction-related temporal information using machine learning techniques
JP6399206B2 (ja) 推定器管理システム
JP6094594B2 (ja) 情報システム構築支援装置、情報システム構築支援方法および情報システム構築支援プログラム
CN111309712A (zh) 基于数据仓库的优化任务调度方法、装置、设备及介质
JP2016207136A (ja) モデル推定システム、モデル推定方法およびモデル推定プログラム
CN105095616A (zh) 数据分析装置、数据分析方法
US20170004511A1 (en) Identifying Drivers for a Metric-of-Interest

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181217

R150 Certificate of patent or registration of utility model

Ref document number: 6460095

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150