JP7371690B2 - 分析システム、装置、制御方法、及びプログラム - Google Patents

分析システム、装置、制御方法、及びプログラム Download PDF

Info

Publication number
JP7371690B2
JP7371690B2 JP2021540620A JP2021540620A JP7371690B2 JP 7371690 B2 JP7371690 B2 JP 7371690B2 JP 2021540620 A JP2021540620 A JP 2021540620A JP 2021540620 A JP2021540620 A JP 2021540620A JP 7371690 B2 JP7371690 B2 JP 7371690B2
Authority
JP
Japan
Prior art keywords
information
template
display
item
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021540620A
Other languages
English (en)
Other versions
JPWO2021033338A5 (ja
JPWO2021033338A1 (ja
Inventor
範人 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2021033338A1 publication Critical patent/JPWO2021033338A1/ja
Publication of JPWO2021033338A5 publication Critical patent/JPWO2021033338A5/ja
Application granted granted Critical
Publication of JP7371690B2 publication Critical patent/JP7371690B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Educational Administration (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

特許法第30条第2項適用 [ウェブサイト] 2018年11月1日掲載、https://jpn.nec.com/press/201811/20181101_02.html https://jpn.nec.com/aapf/ https://jpn.nec.com/aapf/templates/index.html https://jpn.nec.com/manufacture/monozukuri/AI/AAPFST_ProdDemForecast.html https://jpn.nec.com/manufacture/monozukuri/AI/AAPFST_SerPartDemForecast.html [展示会] C&Cユーザーフォーラム & iEXPO 2018、2018年11月8日及び9日展示 [ウェブサイト] 2019年3月11日掲載、https://monoist.atmarkit.co.jp/mn/articles/1903/12/news005.html [展示会]NEC iEXPO KANSAI 2019、2019年7月12日展示
本発明は予測モデルの生成に関する。
過去のデータを分析して予測モデルを生成することで、将来の需要や異常発生などを予測する技術が開発されている。例えば、特許文献1には、事業者が位置するエリアに関する予約を行ったユーザの属性に基づいて、その事業者の事業の対象であってなおかつユーザの属性に対応する対象についての需要を予測する技術が開示されている。
特開2019-053737号公報 特開2000-285128号公報 米国特許出願公開第2014/0222741号明細書
福田 健二、「AIがもたらす金融サービスの変革」、NEC技報、vol.69、No.2、2016年、p.16-19
データ分析による予測を業務の現場に適用することは容易ではない。例えば、予測モデルを生成するための具体的な手法には様々なものが存在する。そのため、これらの様々な手法の中から、適切な手法を選択する必要がある。
この点、特許文献2は、テンプレートを用いて業務データの分析を容易にする技術が開示されている。しかしながら、特許文献2は、過去のデータを統計的に分析することで過去の実績を把握しやすくするためのものであり、予測を行うことについては言及されていない。そのため、データ分析による予測を容易にするための技術については開示されていない。
本発明は、上述の課題に鑑みてなされたものであり、その目的の一つは、データ分析による予測を容易化する技術を提供することである。
本発明の分析システムは、1)複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付部を有する。
テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含む。
本発明の分析システムは、さらに、2)指定されたテンプレート情報の項目定義情報で特定される各項目について、その項目に対応する入力データを取得し、指定されたテンプレート情報のアルゴリズム定義情報で特定されるアルゴリズムに基づいて取得した入力データを処理することにより、予測モデルを生成する予測モデル生成部と、3)指定されたテンプレート情報のビュー定義情報で特定される表示態様で生成した予測モデルに関する情報を表す表示情報を生成する表示情報生成部と、を有する。
前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められている。
前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示す。
前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する。
本発明の装置は、1)複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付部を有する。
テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含む。
入力受付部は、指定されたテンプレート情報の項目定義情報で特定される各項目について、その項目に対応する入力データの指定をさらに受け付ける。
本発明の装置は、さらに、2)指定されたテンプレート情報のビュー定義情報で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する表示情報生成部を有する。
予測モデルは、指定されたテンプレート情報のアルゴリズム定義情報で特定されるアルゴリズムに基づいて指定された入力データを処理することで生成される。
前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められている。
前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示す。
前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する。
本発明の第1の制御方法は、コンピュータによって実行される。当該制御方法は、1)複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付ステップを有する。
テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含む。
当該制御方法は、さらに、2)指定されたテンプレート情報の項目定義情報で特定される各項目について、その項目に対応する入力データを取得し、指定されたテンプレート情報のアルゴリズム定義情報で特定されるアルゴリズムに基づいて取得した入力データを処理することにより、予測モデルを生成する予測モデル生成ステップと、3)指定されたテンプレート情報のビュー定義情報で特定される表示態様で生成した予測モデルに関する情報を表す表示情報を生成する表示情報生成ステップと、を有する。
前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められている。
前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示す。
前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する。
本発明の第2の制御方法は、コンピュータによって実行される。当該制御方法は、1)複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付ステップを有する。
テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含む。
入力受付ステップにおいて、指定されたテンプレート情報の項目定義情報で特定される各項目について、その項目に対応する入力データの指定をさらに受け付ける。
当該制御方法は、さらに、2)指定されたテンプレート情報のビュー定義情報で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する表示情報生成ステップを有する。
予測モデルは、指定されたテンプレート情報のアルゴリズム定義情報で特定されるアルゴリズムに基づいて指定された入力データを処理することで生成される。
前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められている。
前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示す。
前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する。
本発明によれば、データ分析による予測を容易化する技術が提供される。
本実施形態の分析システムの概要を説明するための図である。 実施形態1の分析システムの機能構成を例示する図である。 分析システムを実現するための計算機を例示する図である。 分析システムの実現形態を例示する図である。 実施形態1の分析システムによって実行される処理の流れを例示するフローチャートである。 テンプレート情報の一覧を提供する検索画面を例示する図である。 入力データにおける小項目と項目定義情報における小項目との対応付けを指定する画面を例示する図である。 散布図画面を例示する図である。 一覧画面を例示する図である。 1つの予測対象についての散布図画面を例示する図である。 1つの予測対象についての一覧画面を例示する図である。 詳細画面を例示する図である。 売上数の予測に利用されるテンプレート情報を例示する図である。 客数の予測に利用されるテンプレート情報を例示する図である。 出荷数の予測に利用されるテンプレート情報を例示する図である。 製品の受注数量の予測に利用されるテンプレート情報を例示する図である。 保守部品の出庫数の予測に利用されるテンプレート情報を例示する図である。 機器の故障の予測に利用されるテンプレート情報を例示する図である。 故障状態か否かの判別に利用されるテンプレート情報を例示する図である。
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。また各ブロック図において、特に説明がない限り、各ブロックは、ハードウエア単位の構成ではなく機能単位の構成を表している。
[実施形態1]
<概要>
図1は、本実施形態の分析システム2000の概要を説明するための図である。なお、図1は、分析システム2000に対する理解を容易にするための例示であり、分析システム2000の機能は図1に表されているものに限定されない。
分析システム2000は、入力データを分析して予測モデルを生成し、生成した予測モデルに関する情報を出力する。ここで、予測モデルの生成方法や、生成した予測モデルについてどのような態様で情報を出力するかは、予めテンプレートとして定められている。以下、このテンプレートを表す情報を、テンプレート情報10と呼ぶ。
テンプレート情報10は、項目定義情報12、アルゴリズム定義情報14、及びビュー定義情報16を含む。項目定義情報12は、予測モデルの生成に利用する各入力データの項目を特定する情報である。例えば、店舗ごとの商品の売り上げを予測する予測モデルの生成に、商品に関する情報や店舗に関する情報を利用するとする。この場合、予測モデルを生成するためのテンプレート情報10において、項目定義情報12には、「商品に関する情報」に相当する項目(「商品マスタ」など)や、「店舗に関する情報」に相当する項目(「店舗マスタ」など)などが含まれる。
アルゴリズム定義情報14は、予測モデルを生成するためのアルゴリズムを特定する。例えば、予測モデルを生成するためのアルゴリズムを具現化したプログラムモジュールとして、複数種類の AI エンジンが用意されているとする。この場合、アルゴリズム定義情報14は、それら複数種類の AI エンジンのうちの1つを特定する情報(AI エンジンの識別情報)を示す。ただし、アルゴリズム定義情報14には、AI エンジンの識別情報ではなく、AI エンジンそのものが含まれていてもよい。また、予測モデルの生成に利用するアルゴリズムを具現化したものは、AI エンジンに限定されない。
ビュー定義情報16は、生成された予測モデルに関する情報の表示態様を特定する。例えばビュー定義情報16には、予測モデルに関する情報を表すために利用する図表の種類や構造、又は複数の図表の配置などが含まれる。
上述したテンプレート情報10を利用した予測モデルの生成等を実現するため、まず分析システム2000は、テンプレート情報10の指定を受け付ける。分析システム2000は、指定されたテンプレート情報10を取得し、テンプレート情報10に含まれる項目定義情報12によって特定される各項目に対応する入力データを取得する。また、分析システム2000は、テンプレート情報10に含まれるアルゴリズム定義情報14によって特定されるアルゴリズムに基づいて、取得した入力データを処理し、予測モデルを生成する。さらに分析システム2000は、テンプレート情報10に含まれるビュー定義情報16を利用して、表示情報を生成する。表示情報は、ビュー定義情報16で特定される表示態様で、予測モデルに関する情報を表す。
<作用効果の一例>
データ分析による予測を業務の現場に適用することは容易ではない。例えば、予測モデルの生成アルゴリズムを適切に選択することは難しい。また、予測モデルの生成にどのようなデータが必要なのかを把握することも難しい。さらには、予測結果の適切な見方も、把握が難しい。
この点、本実施形態の解析システム2000では、予測モデルの生成に利用する入力データの項目が定義された項目定義情報12、予測モデルの生成に利用するアルゴリズムが定義されたアルゴリズム定義情報14、及び分析結果の見せ方が定義されたビュー定義情報16をセットにしたテンプレート情報10が提供され、このテンプレート情報10を利用して予測モデルの生成及び分析結果の閲覧が行われる。そのため、ユーザは、業務に対応したテンプレート情報10を指定することで、自身の業務に関連するデータ分析を容易に行うことができる。よって、本発明によれば、データ分析を利用した予測を容易に行えるようになる。
ここで、一般に、業務に適したアルゴリズムの選定などは、データサイエンティストと呼ばれるデータ分析のプロフェッショナルによって行われる。しかしながら、データサイエンティストの数は限られているため、データ分析の度にデータサイエンティストに依頼をすると、データ分析に要する時間が長くなってしまったり、コストが高くなってしまったりするという問題がある。
この点、本発明を利用すれば、例えば、データサイエンティストが予め各業務に適したテンプレート情報10を作成しておくことで、データサイエンティストの知見を業務現場の人に容易に展開することができるようになる。そのため、データ分析に要する時間やコストの削減を実現することができる。また、データサイエンティストの知見をテンプレート情報10という形にまとめることができるため、類似の業務について個別にデータサイエンティストが対応する必要が無くなり、データサイエンティストの業務を効率化できるというメリットもある。
以下、本実施形態についてさらに詳細を述べる。
<機能構成の例>
図2は、実施形態1の分析システム2000の機能構成を例示する図である。分析システム2000は、入力受付部2020、予測モデル生成部2040、及び表示情報生成部2060を有する。入力受付部2020は、テンプレート情報10の指定を受け付ける。予測モデル生成部2040は、指定されたテンプレート情報10の項目定義情報12で特定される各項目について、その項目に対応する入力データを取得する。また、予測モデル生成部2040は、指定されたテンプレート情報10のアルゴリズム定義情報14で特定されるアルゴリズムに基づいて取得した入力データを処理することにより、予測モデルを生成する。表示情報生成部2060は、ビュー定義情報16を利用して表示情報を生成する。
<分析システム2000のハードウエア構成の例>
分析システム2000の各機能構成部は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、分析システム2000の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。
分析システム2000は、1つ以上の計算機を用いて実現される。図3は、分析システム2000を実現するための計算機1000を例示する図である。計算機1000は、任意の計算機である。例えば計算機1000は、PC(Personal Computer)やサーバマシンなどといった、据え置き型の計算機である。その他にも例えば、計算機1000は、スマートフォンやタブレット端末などといった可搬型の計算機である。
計算機1000は、分析システム2000を実現するために設計された専用の計算機であってもよいし、汎用の計算機であってもよい。後者の場合、例えば、計算機1000に対して所定のアプリケーションをインストールすることにより、計算機1000で、分析システム2000の機能の少なくとも一部が実現される。上記アプリケーションは、分析システム2000の機能構成部のいずれか1つ以上を実現するためのプログラムで構成されるアプリケーションである。
例えば後述するように、分析システム2000は、予測モデルの生成を行うバックエンドサーバ40、及びユーザ端末20とバックエンドサーバ40とのインタフェースとして機能するフロントエンドサーバ30によって構成されうる(図参照)。この場合、フロントエンドサーバ30とバックエンドサーバ40が、互いに異なる計算機1000によって実現される。この場合、フロントエンドサーバ30を実現する計算機1000には、分析システム2000の機能のうち、フロントエンドサーバ30に持たせる機能を実現するためのアプリケーションがインストールされる。一方で、バックエンドサーバ40を実現する計算機1000には、分析システム2000の機能のうち、バックエンドサーバ40に持たせる機能を実現するためのアプリケーションがインストールされる。
計算機1000は、バス1020、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120を有する。バス1020は、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1040などを互いに接続する方法は、バス接続に限定されない。
プロセッサ1040は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field-Programmable Gate Array)などの種々のプロセッサである。メモリ1060は、RAM(Random Access Memory)などを用いて実現される主記憶装置である。ストレージデバイス1080は、ハードディスク、SSD(Solid State Drive)、メモリカード、又は ROM(Read Only Memory)などを用いて実現される補助記憶装置である。
入出力インタフェース1100は、計算機1000と入出力デバイスとを接続するためのインタフェースである。例えば入出力インタフェース1100には、キーボードなどの入力装置や、ディスプレイ装置などの出力装置が接続される。
ネットワークインタフェース1120は、計算機1000を通信網に接続するためのインタフェースである。この通信網は、例えば LAN(Local Area Network)や WAN(Wide Area Network)である。例えば分析装置とユーザ端末は、ネットワークインタフェース1120を介して通信可能に接続される。
ストレージデバイス1080は、分析システム2000の各機能構成部を実現するプログラムモジュール(前述したアプリケーションを実現するプログラムモジュール)を記憶している。プロセッサ1040は、これら各プログラムモジュールをメモリ1060に読み出して実行することで、各プログラムモジュールに対応する機能を実現する。
<分析システム2000の実現形態の例>
前述したように、分析システム2000は1つ以上の計算機を用いて実現される。図4は、分析システム2000の実現形態を例示する図である。
図4において、分析システム2000は、フロントエンドサーバ30及びバックエンドサーバ40で構成されている。例えばフロントエンドサーバ30は、分析システム2000を利用するための Web サイトをユーザに提供する。分析システム2000を利用したいユーザは、まず、ユーザ端末20を利用してフロントエンドサーバ30にアクセスする。フロントエンドサーバ30は、テンプレート情報10や入力データを指定するための Web ページを、ユーザ端末20に提供する。ユーザは、提供された Web ページをユーザ端末20で利用することで、テンプレート情報10や入力データの指定を行う。
フロントエンドサーバ30は、指定されたテンプレート情報10及び入力データを利用して、バックエンドサーバ40に分析を実行させる。例えばフロントエンドサーバ30は、テンプレート情報10の識別情報等、ユーザ端末20から受信した情報が含まれる所定のコマンドをバックエンドサーバ40へ送信することで、バックエンドサーバ40に分析を実行させる。バックエンドサーバ40は、この指示を受けて分析を実行することで、予測モデルを生成する。
バックエンドサーバ40は、分析結果を表す情報(予測モデルに関する情報)をフロントエンドサーバ30へ送信する。フロントエンドサーバ30は、バックエンドサーバ40から受信した情報を、テンプレート情報10のビュー定義情報16を利用して加工することで、表示情報を生成する。そして、フロントエンドサーバ30は、ユーザ端末20に対して表示情報を出力する。例えばこの表示情報は、テンプレート情報10のビュー定義情報16で定義されている表示態様で予測モデルに関する情報を閲覧することができる Web ページである。その他にも例えば、表示情報は、PDF ファイルなどのファイルとして提供されてもよい。
分析システム2000の実現形態は、前述した例に限定されない。例えばフロントエンドサーバ30とバックエンドサーバ40は、1つの計算機で実現されてもよい。その他にも例えば、フロントエンドサーバ30と同等の機能をユーザ端末20に持たせてもよい。すなわち、テンプレート情報10や入力データの指定を受け付ける機能、バックエンドサーバ40に対して分析の実行を指示する機能、バックエンドサーバ40から分析結果を受信する機能、及び受信した分析結果から表示情報を生成する機能をユーザ端末20に持たせる(すなわち、バックエンドサーバ40とやりとりする機能を実現するアプリケーションを、ユーザ端末20にインストールする)。その他にも例えば、フロントエンドサーバ30とバックエンドサーバ40の機能の双方を、ユーザ端末20に持たせてもよい。すなわち、分析システム2000を、ユーザによって操作される計算機で実現する(分析システム2000の全ての機能を実現するアプリケーションを、ユーザ端末20にインストールする)。
<処理の流れ>
図5は、実施形態1の分析システム2000によって実行される処理の流れを例示するフローチャートである。入力受付部2020は、テンプレート情報10の指定を受け付ける(S102)。予測モデル生成部2040は、指定されたテンプレート情報10を取得する(S104)。予測モデル生成部2040は、取得したテンプレート情報10に含まれる項目定義情報12によって特定される各項目について、その項目に対応する入力データを取得する(S106)。予測モデル生成部2040は、取得したテンプレート情報10に含まれるアルゴリズム定義情報14によって特定されるアルゴリズムに基づいて、取得した入力データを分析することにより、予測モデルを生成する(S108)。表示情報生成部2060は、生成した予測モデルについて表示情報を生成する(S110)。表示情報生成部2060は、表示情報を出力する(S112)。
<テンプレート情報10の指定及び取得:S102、S104>
入力受付部2020は、テンプレート情報10の指定を受け付ける(S102)。例えば入力受付部2020は、利用可能なテンプレート情報10の一覧をユーザに提供し、ユーザにテンプレート情報10を指定(選択)させる。
図6は、テンプレート情報10の一覧を提供する検索画面50を例示する図である。検索画面50は、ユーザ端末20から制御可能なディスプレイ装置に表示される。例えば検索画面50は、前述したフロントエンドサーバ30によって提供される Web ページで実現される。
検索画面50は、識別情報指定エリア52、名称指定エリア54、検索ボタン56、検索結果表示エリア58を含む。識別情報指定エリア52や名称指定エリア54に何も入力されていない状態で検索ボタン56が押されると、検索結果表示エリア58には、テンプレート記憶装置60に格納されている全てのテンプレート情報10についての情報が表示される。一方、識別情報指定エリア52に入力が行われた状態で検索ボタン56が押されると、その識別情報に、識別情報指定エリア52に入力された文字列が含まれるテンプレート情報10のみについての情報が、検索結果表示エリア58に表示される。また、名称指定エリア54に入力が行われた状態で検索ボタン56が押されると、その名称に、名称指定エリア54に入力された文字列が含まれるテンプレート情報10のみについての情報が、検索結果表示エリア58に表示される。
なお、テンプレート情報10の検索は、識別情報や名称を用いるものに限定されない。例えば、テンプレート情報10に、そのテンプレートが利用されうる業界や、そのテンプレートを用いて提供されるソリューションなどを表す情報を含めておく。業界としては、例えば、リテール、製造、物流、保険、又は金融などといったものが含まれる。ソリューションとしては、例えば、需要予測や異常検知などが含まれる。これらの情報を利用する場合、検索画面50において、業界やソリューションを指定する入力エリアを設ける。そして、入力受付部2020は、指定された業界やソリューションでテンプレート情報10を検索し、該当するテンプレート情報10についての情報を検索結果表示エリア58に表示させる。これにより、業界やソリューションに応じてテンプレート情報10を容易に選択できるようになる。
その他にも例えば、入力受付部2020は、同一のユーザが過去に利用したテンプレート情報10を検索する機能を提供してもよい。こうすることで、ユーザは、過去に利用したテンプレート情報10を再度容易に利用することができる。
予測モデル生成部2040は、指定されたテンプレート情報10を取得する(S104)。ここで、指定されたテンプレート情報10を取得する具体的な技術には、既存の技術を利用することができる。例えば予測モデル生成部2040は、指定されたテンプレート情報10をテンプレート記憶装置60から読み出すことで取得する。
<入力データの取得:S106>
予測モデル生成部2040は、項目定義情報12で特定される項目に対応する入力データを取得する(S106)。項目定義情報12は、予測モデルの生成に利用する入力データの項目を表す情報が含まれる。入力データの項目は、入力データの種別ともいうことができる。例えば、項目としては、カレンダー、商品マスタ、店舗マスタ、気象データ、売上データ、又は客数データなどといった様々なものを採用できる。例えばテンプレート情報10に顧客マスタという項目が含まれる場合、予測モデル生成部2040は、顧客マスタを表す具体的なデータ(顧客に関する情報が記録されているファイルやデータベース上のテーブルなど)を取得する。
例えば入力データの取得は、項目定義情報12によって特定される項目に対応する入力データの指定をユーザから受け付けることによって実現される。例えばユーザは、項目定義情報12で特定される項目ごとに、その項目についての入力データが格納されている入力ファイルを、予測モデル生成部2040へ提供する。入力ファイルの提供は、例えば入力ファイルをユーザ端末20からフロントエンドサーバ30へ送信することで実現される。そのほかにも例えば、フロントエンドサーバ30からアクセス可能な記憶装置に予め入力ファイルを格納しておき、ユーザ端末20からフロントエンドサーバ30へ対し、その入力ファイルの識別情報(パスなど)の指定を行ってもよい。
入力データの提供方法は、ファイルを利用する方法に限定されない。例えば、入力データとして、データベースに格納されているデータを利用するとする。この場合、例えばユーザは、項目定義情報12によって特定される項目ごとに、その項目についてのデータが格納されているデータベース内のデータ(例えばテーブル)を指定してもよい。予測モデル生成部2040は、ユーザによる指定に従い、データベースから入力データを取得する。
ここで、1つの項目に対応するデータが、さらに細かい項目に分かれることがある。例えば、商品マスタという項目のデータは、各商品について、商品コードや商品名などといった複数の種類のデータを含みうる。以下、1つの項目に対してさらに細かい複数の項目が対応づけられている場合、前者の項目を大項目、後者の項目を小項目と呼ぶ。このように大項目に複数の小項目が対応づけられている場合、項目定義情報12において、大項目と小項目の対応付けがさらに定義される。
大項目に複数の小項目が対応づけられる場合、大項目に対応づけて得られた入力データを予測モデル生成部2040が正しく解釈するためには、予測モデル生成部2040が、その入力データを小項目ごとに分けて解釈できる必要がある。そのために、例えば入力データを、項目定義情報12で定義される小項目ごとに区別可能な形式で構成しておく。小項目ごとに入力データを区別可能なデータ形式としては、例えば、csv 形式を扱うことができる。一般に、csv ファイルには、各列の列名の定義と、各列それぞれにデータを有する1つ以上のレコードとを含むことができる。そこで、各列が1つの小項目を表すように入力データを構成することで、入力データを小項目ごとに区別して解釈することができる。ただし、入力ファイルの形式は、必ずしも csv 形式である必要はない。また、1つの大項目に対応する入力データをデータベース上のテーブルとし、そのテーブルの各列を小項目として扱うようにしてもよい。
予測モデル生成部2040は、項目定義情報12における小項目と、入力データにおける小項目との対応関係を特定できる必要がある。そこで例えば、入力データにおける各小項目の名称を、項目定義情報12における各小項目の名称と予め一致させておく。こうすることで、予測モデル生成部2040は、大項目に対応する入力データを、その大項目に対応する小項目ごとに解釈することができる。
ただし、入力データにおける各小項目の名称は、項目定義情報12における小項目の名称と一致していなくてもよい。この場合、例えば入力受付部2020が、入力データにおける小項目と、項目定義情報12における小項目との対応付けを指定する入力を受け付ける。予測モデル生成部2040は、指定された対応付けを用いて、入力データを解釈する。
図7は、入力データにおける小項目と項目定義情報12における小項目との対応付けを指定する画面70を例示する図である。画面70において、左側の表は、項目定義情報12において、商品マスタという大項目に対応付けられている小項目の一覧を示している。一方、右側の表は、商品マスタという大項目に対応する入力データとして与えられた、goods_master.csv というファイルにおける小項目の一覧を示している。なお、ここでファイルの代わりにデータベースのテーブルを指定した場合、右側の表には、指定したテーブルの各列の列名が表示される。
画面70において、ユーザは、右側の表が示す各小項目を、左側のマッピングという列のセルへドラッグ&ドロップすることができる。これにより、小項目の対応付けが実現される。例えばこの例において、ユーザは、右側の表の「group_code」という小項目を、左側の表の「分類コード」という小項目の隣のセルへドラッグ&ドロップしている。これにより、項目定義情報12における「分類コード」という小項目と、入力ファイルにおける「group_code」という小項目とが対応づけられる。
なお、項目定義情報12における小項目の名称と入力データにおける小項目の名称とが一致しない場合において、項目定義情報12における小項目と入力データにおける小項目との対応関係を特定する方法は、ユーザによる指定を受け付ける方法に限定されない。例えば、この対応関係は、小項目の順序によって特定されてもよい。例えば、「項目定義情報12における小項目の順序と、入力データにおける小項目の順序は一致する」というルールを予め定めておく。このルールを利用することで、予測モデル生成部2040は、項目定義情報12における小項目と、入力データにおける小項目との対応関係を把握することができる。
<予測モデルの生成:S108>
予測モデル生成部2040は、アルゴリズム定義情報14で特定されるアルゴリズムに基づいて入力データを処理することで、予測モデルを生成する。予測モデルを生成するアルゴリズムとしては、例えば、異種混合学習(特許文献3)、RAPID 時系列分析(非特許文献1)、ニューラルネットワーク、又は SVM(Support Vector Machine)などといった種々の機械学習アルゴリズムを扱うことができる。
例えば予測モデル生成部2040には、様々な機械学習アルゴリズムそれぞれについて、そのアルゴリズムを実現するプログラムモジュールである AI エンジンを設けておく。この場合、例えばアルゴリズム定義情報14には、これら複数の AI エンジンのうちの1つを特定する識別情報が含まれる。予測モデル生成部2040は、アルゴリズム定義情報14に含まれる識別情報で特定される AI エンジンを利用して、予測モデルの生成を行う。
ここで、同一の AI エンジンを複数の分析タイプ(回帰や判別など)で利用できることもある。この場合、アルゴリズム定義情報14には、行いたい分析のタイプ(生成したい予測モデルのタイプ)を示す情報をさらに含めておく。例えば、商品の売上げを予測する予測モデルを異種混合学習で生成するためのテンプレート情報10では、「AI エンジン:異種混合学習、分析タイプ:回帰」となる。一方、将来的に機器が故障するか否かを予測する予測モデルを異種混合学習で生成するためのテンプレート情報10では、「AI エンジン:異種混合学習、分析タイプ:判別」となる。
また、アルゴリズム定義情報14には、AI エンジンの目的変数や説明変数と、入力データとの対応付けを表す情報も含めておく。例えば、項目定義情報12で特定される小項目のうち、どの小項目を目的変数として用いるか、及びどの小項目を説明変数として用いるかが、アルゴリズム定義情報14に定められている。ただし、目的変数や説明変数は、項目定義情報12で特定される1つ以上の小項目と何らかの関係を持てばよく、小項目と完全に一致する必要はない。例えば、商品の売上数の予測において、売上実績データに商品の売上数を含めておき(売上実績データという大項目に対応する小項目に「売上数」を含めておき)、目的変数を「売上数の移動平均からの差分」とすることができる。
また、アルゴリズム定義情報14には、AI エンジンに設定するハイパーパラメータがさらに定められていてもよい。ハイパーパラメータとしては、異種混合学習における木の深さや、ニューラルネットワークにおける層の深さなどが挙げられる。
さらに、予測モデル生成部2040には、AI エンジンへ投入する前に入力データに対して施す前処理を特定する情報が定められていてもよい。AI エンジンで予測モデルを生成する際、入力データをそのまま用いるのではなく、スケール変換等を行うことで、学習精度を向上させることができる。そこで、項目定義情報12において、入力データに対して加えるべきこのような前処理を定義しておく。その他にも例えば、入力データの一部のみを処理対象として抽出する処理なども、前処理として定義しておく。その他にも例えば、入力データのフォーマットを AI エンジンごとに定められている所定のフォーマット(AI エンジンが解釈可能なフォーマット)に変換する処理も、前処理として定義しておく。
なお、アルゴリズム定義情報14には、前処理を実現するプログラムモジュールそのものが含まれていてもよいし、前処理を実現するプログラムを呼び出すための識別情報(関数名など)や設定情報(引数など)が含まれていてもよい。後者の場合、種々の前処理を予め予測モデル生成部2040に設けておく。そして、アルゴリズム定義情報14において、利用したい前処理の識別情報及びその前処理の設定情報を定めておくことで、予測モデル生成部2040によって所望の前処理が実行されるようにする。
ここで、1つのテンプレート情報10を利用した分析で生成される予測モデル(予測の対象)は、1つに限定されない。例えば、店舗ごと及び商品ごとに売上数を予測するためのテンプレート情報10が用意されているとする。この場合、予測の対象は、「店舗、商品」の組み合わせごとの売上数となる。よって、このテンプレート情報10を利用すると、店舗ごと及び商品ごとの予測モデルが生成される。
例えば簡単な例として、商品G1~G3という3種類の商品があり、店舗S1~S2という2つの店舗があるとする。この場合、6つの予測対象があるため、6個の予測モデルが生成される。具体的には、店舗S1とS2のそれぞれについて、商品G1~G3それぞれの売上数の予測モデルが生成される。
1つのテンプレート情報10を利用した分析によってどのような予測モデルが作られるかは、アルゴリズム定義情報14によって予め定義される。すなわち、店舗ごと及び商品ごとの売上数を予測する予測モデルを生成するためのテンプレート情報10では、「店舗ごと及び商品ごとの売り上げ」などといった形で、目的変数が予め定義されている。そのため、予測モデル生成部2040により、店舗ごと及び商品ごとに予測モデルが生成される。
ここで、予測モデル生成部2040は、予測モデルの生成だけでなく、その精度の評価(検証)も行うことが好適である。この場合、例えば予測モデル生成部2040は、入力データを学習用データと検証データに分割する。そして、予測モデル生成部2040は、学習用データを利用して予測モデルの生成(モデルの学習)を行い、検証データを利用して予測モデルの検証を行う。その他にも例えば、予測モデル生成部2040は、いわゆるクロスバリデーションを行ってもよい。このように入力データを分割してモデルの生成と評価を行う具体的な方法は、既存の技術を利用することができる。
さらに、予測モデル生成部2040は、予測モデルの生成や検証に加え、予測モデルを利用した予測を実行してもよい。この場合、例えば予測モデル生成部2040は、入力データを、予測に利用するテストデータと、それ以外のデータ(学習と検証に利用するデータ)に分割する。そして、予測モデル生成部2040は、後者で予測モデルの生成と検証を行った後、テストデータを利用して予測を実行する。なお、このように入力データを分割して、予測モデルの生成と検証、及び予測を行う具体的な方法には、既存の技術を利用することができる。
ただし、分析システム2000は、必ずしも、予測モデルを生成してすぐに予測を実行する必要はない。例えばユーザは、まず、分析システム2000を利用して、予測モデルの生成と検証を行っておく。生成された予測モデルは、分析システム2000からアクセス可能な記憶装置に格納される。その後、ユーザは、予測する必要が生じた際に、予め生成しておいた予測モデルを利用して、予測を行う。
ここで、入力データの分割方法は、テンプレート情報10によらずに固定で定められていてもよいし、テンプレート情報10で定められていてもよいし、ユーザによって指定されてもよい。例えば入力データを期間で分割する場合、ユーザは、学習用データ、検証データ、テストデータそれぞれについて、利用する入力データの期間を指定する。
なお、予測モデルを利用した予測の実行は、必ずしも分析システム2000で実行される必要はない。例えば前述したようにフロントエンドサーバ30とバックエンドサーバ40で分析システム2000が構成される場合に、予測モデルを利用した予測については、ユーザ端末20で実行されるようにしてもよい。この場合、分析システム2000によって生成された予測モデルを、ユーザ端末20からアクセス可能な記憶装置に格納しておく。
<表示情報の生成:S110>
表示情報生成部2060は、指定されたテンプレート情報10のビュー定義情報16によって定義される表示態様で、予測モデル生成部2040によって生成された予測モデルについての表示情報を生成する(S110)。例えば予測モデルに関する情報は、視覚的に把握しやすい図を使って表示される。そこで、ビュー定義情報16には、表示情報に含まれる1つ以上の図それぞれについて、種類や構造などの定義が含まれる。図の種類には、テーブル、散布図、折れ線グラフ、及び棒グラフなどといった任意の種類を採用できる。テーブルの構造には、例えば、各列の定義が含まれる。グラフの構造には、例えば、各軸の定義が含まれる。また、ビュー定義情報16には、複数の図やその他の情報の全体的な配置を定める情報がさらに含まれる。
以下、表示情報生成部2060が表示情報として生成しうる画面を例示しながら、そのような画面に対応するビュー定義情報16について説明する。
例えば表示情報は、散布図を表示する散布図画面、一覧表を表示する一覧画面、及び詳細情報を表示する詳細画面で構成される。これらの画面は、互いに行き来できるように構成される。以下で説明する例では、店舗S1~S3それぞれに関し、商品分類G1からG3それぞれについての売上数を予測する予測モデル(回帰モデル)が生成されている。すなわち、「店舗、商品分類」の各組み合わせに対する売上数が予測対象となっている。また予測モデルの生成にはクロスバリデーションが用いられている。そのため、予測対象ごとに複数の予測モデルが生成されている。例えば、入力データのうち、学習と検証に用いる入力データを、5つの期間に分割するとする。この場合、予測対象ごとに、5つの予測モデルが生成される。
図8は、散布図画面80を例示する図である。散布図の横軸は、検証用の入力データが示す売上数である。散布図の縦軸は、検証誤差率(予測モデルの検証における誤差率)としている。なお、ここでいう誤差率とは、予測モデルが出力した予測値と、入力データに示されている実績値との乖離度合いを表した値である。具体的には、誤差率は、実績値と予測値の差分の絶対値の平均を、実績値の絶対値の平均で割った値である。
散布図には、予測対象ごと(店舗と商品分類の組み合わせごと)に、代表とする1つの予測モデルについて、データ点がプロットされている。代表とする予測モデルは、所定の基準に基づいて表示情報生成部2060が選択した最良の予測モデルである。このような基準としては、誤差の大きさに関する基準や、説明変数の目的変数への影響度の大きさに関する基準などを採用できる。
最良の予測モデルを選択する基準は、例えば、ビュー定義情報16に定められている。ただし、最良の予測モデルを選択する基準は、ユーザ操作によって指定可能であってもよい。また、代表とする予測モデル自体も、ユーザ操作によって指定可能であってもよい。
図8において、ユーザがデータ点を選択する(例えばクリックする)と、そのデータ点に対応する予測モデルの詳細が表示される(ポップアップウインドウ82)。具体的には、予測対象の識別情報、最良の予測モデルの識別情報、最良の予測モデルの選択基準、各区間(学習区間、検証区間、及び予測区間)の評価指標(誤差率など)などの情報が表示される。
図9は、一覧画面を例示する図である。ユーザは、散布図画面80や後述する詳細画面130において、一覧ボタンを押すことで、一覧画面90へ画面を遷移させることができる。一覧画面90に含まれる一覧表は、予測対象ごとに、代表の予測モデルに関する情報を示している。
ここで、散布図画面80や一覧画面90で1つの予測対象を選択することにより、その予測対象について生成された全ての予測モデルの情報を閲覧できる画面に遷移できるようにしてもよい。以下、図10と図11を用いて説明する。
図10は、1つの予測対象についての散布図画面110を例示する図である。この散布図では、「店舗S1、商品分類G1」という1つの予測対象について生成された複数の予測モデルのそれぞれについて、データ点がプロットされている。横軸は学習誤差率(学習終了時における誤差率)であり、縦軸は検証誤差率である。この図でも、ユーザがデータ点を選択することで、そのデータ点に対応する予測モデルの詳細が表示される。
なお、図10の散布図では、所定の基準に基づいて自動で選択される最良の予測モデルと、ユーザによって指定された予測モデルについてのデータ点は、それぞれ他の予測モデルと識別できるように、強調表示(塗りつぶし)されている。
図11は、1つの予測対象についての一覧画面120を例示する図である。一覧画面120に含まれる一覧表では、1つの予測対象について生成された複数の予測モデルに関する情報が一覧表示されている。
なお、図8や図9で例示した画面のように、複数のモデルそれぞれについての情報を示す画面は、予測モデルが複数ある場合のみ生成される。そのため、この場合、図10や図11で例示した画面のように、1つの予測モデルに着目した画面が初期画面として表示されるようにする。
前述したように、表示情報には、詳細画面も含まれうる。詳細画面は、選択された1つの予測対象について、詳細な情報を示す画面である。詳細画面への遷移は、例えば、全ての予測対象についての情報が表示されている散布図画面80や一覧画面90において、1つの予測対象が選択された状態で詳細ボタンを押すことにより、実現できる。その他にも例えば、詳細画面への遷移は、選択された予測対象についての情報が表示されている散布図画面110や一覧画面120において、詳細ボタンを押すことで実現できる。
詳細画面には、評価指標に関する情報、説明変数に関する情報、誤差に関するグラフ、予測モデルの構成に関する情報、ハイパーパラメータに関する情報など、様々な情報が含まれうる。詳細画面に含まれる構成は、予測モデルの生成に利用された AI エンジンの種類などによって異なりうる。
図12は、詳細画面を例示する図である。この例は、AI エンジンとして異種混合学習が利用されたケースである。図12の詳細画面130は、評価指標エリア131、説明変数一覧エリア132、グラフエリア134、門木エリア135、予測式エリア136を含んでいる。
評価指標エリア131では、評価指標に関する情報が一覧表示されている。具体的には、各評価指標について、学習時(モデル生成時)、検証時、予測実行時のそれぞれについて算出された評価指標の値が示されている。評価指標としては、誤差率、平均平方二乗誤差(RMSE: Root Mean Square Error)、平均二乗誤差(MSE: Mean Square Error)などといった様々なものを利用することができる。
説明変数一覧エリア132では、各説明変数に関する情報が一覧表示されている。ここで、「NULL」は、その説明変数に対応するデータが含まれる入力のレコードのうち、いくつにおいてそのデータが欠落していたかを示している。例えば、「直近過去休日経過日数」という説明変数において、NULL が 3/358 となっているのは、358レコードのうち、3つのレコードにおいて、直近過去休日経過日数のデータが欠落していたことを示している。最小と最大はそれぞれ、その説明変数についての入力データにおける最小値と最大値を示している。
なお、説明変数によっては、曜日や天気など、カテゴリ値を示すものがある。この場合、最小と最大の代わりに、少なくとも1つのレコードに含まれていたカテゴリ値が列挙される。例えば、値として曜日を示す説明変数について、入力された100個のレコードの中に、「月、火、木、土、日」という5種類の値が示されており、「水、金」についてはいずれのレコードにも示されていなかったとする。この場合、説明変数一覧エリア132において、この説明変数については、最小と最大の代わりに、「月、火、木、土、日」という5つのカテゴリ値が示される。
グラフエリア134には、予測モデルに関する情報を表すグラフが表示される。横軸は時間を表している。図12のグラフエリア134には、学習時における予測値(予測モデルの出力)の時間変化、実績値(入力データの値)の時間変化、及び誤差の時間変化が示されている。また、「式番号」が選択されているため、予測に利用される式番号の時間変化(条件に合致する予測式の時間変化)も示されている。
門木エリア135には、異種混合学習で生成される予測モデルの全体構造が示されている。異種混合学習で生成される予測モデルは、条件分岐を表すツリー構造(門木)を持ち、なおかつ、各リーフにおいて予測式を持つ。そこで、門木エリア135には、門木と、各リーフにおける予測式についてのサンプル数(入力データに含まれるレコード数)が示されている。なお、図示の関係上、図12では、門木のノード内に示される条件を「条件1」などと記載しているが、実際には、ノード内には具体的な条件式が記載される。
予測式エリア136は、選択された予測式について、各説明変数の係数を示す。また、「積み上げ」が選択されると、各説明変数の係数を全ての予測式について合計した値が表示される。
前述したように、図12の詳細画面130は、AI エンジンとして異種混合学習を利用した場合に適した画面である。その他の AI エンジンを利用した場合には、少なくとも一部のエリアが異なるものとなる。例えば、RAPID 時系列分析の場合、門木エリアや予測式エリアに代えて、学習の収束状況を示すグラフや、ハイパーパラメータに関する情報を詳細画面に含めることが好適である。なお、ハイパーパラメータに関する情報については、異種混合学習も含め、その他の AI エンジンを利用した場合においても、詳細画面に含まれることが好適である。
前述した例では、予測モデルとして回帰モデルが生成されていた。この点、判別モデルについて提供すべき情報は、回帰モデルについて提供すべき情報と異なりうる。例えば判別モデルの評価指標は、回帰モデルの評価指標と異なる。そこで、判別モデルが生成される場合には、前述した各画面において、判別モデルの評価指標が表示される。例えば判別モデルの評価指標には、適合率(true positive/{true positive + false positive})や再現率(true positive/{true positive + false negative})、F 値(適合率と再現率の調和平均)などを採用できる。
ここで、前述した各画面は、予測モデルの精度に関する情報が多く含まれており、予測モデルの精度の確認に特に好適な画面である。しかしながら、分析システム2000によって提供される分析結果(すなわち、表示情報)は、予測モデルの精度の確認に特に好適なものだけに限定されず、別の目的に特に好適なものであってもよい。
例えば表示情報として、予測対象と各説明変数との関係性を確認することに特に好適な情報を提供してもよい。例えば、商品ごとに、どの広告媒体がその商品の売上げ増加に効果的であるかの分析を行うとする。この場合、商品の売上げを予測する予測モデルにおいて、広告媒体ごとの宣伝量などを説明変数として利用することができる。そして、各説明変数が予測に寄与する度合いを定量化可能な機械学習アルゴリズム(例えば、異種混合学習)を用いて予測モデルを生成することで、各広告媒体が商品の売上げに寄与する度合いを算出することができる。そこで例えば、分析システム2000は、表示情報として、予測対象である商品の売上げと説明変数である広告媒体との関係性(各広告媒体が売上げに寄与する度合いなど)を容易に確認することができる画面などを提供する。
<<表示情報を生成するタイミングについて>>
表示情報として複数種類の画面を扱う場合など、表示情報として、表示すべきタイミングが互いに異なる複数の情報を扱うことがある。このような場合、これら複数の情報は、一度に生成されてまとめてユーザに提供されてもよいし、それぞれ異なるタイミングで生成されて個別にユーザへ提供されてもよい。後者の場合、例えば表示情報生成部2060は、各情報を、その情報が表示されるべきタイミング(すなわち、ユーザが必要とするタイミング)で生成する。
例えば分析システム2000が、図4で例示した構成を持つとする。この場合、まずフロントエンドサーバ30は、分析結果として最初にユーザ端末20のディスプレイ装置に表示されるべき画面(分析結果の初期画面)を表す Web ページを生成し、ユーザ端末20へ送信する。その後、ユーザによって画面を遷移させる操作が行われたら、その操作に基づくリクエスト(押されたボタンの識別情報が示されるリクエストなど)が、ユーザ端末20からフロントエンドサーバ30へ送信される。フロントエンドサーバ30は、受信したリクエストに基づいて、ユーザ端末20へ提供すべき新たな画面(すなわち、遷移先の画面)を表す Web ページを生成し、生成した Web ページをユーザ端末20へ送信する。
<<ビュー定義情報16について>>
前述したように、表示情報として出力される画面は、予測モデルの生成に利用されるアルゴリズムの種類によって異なりうる。そこで例えば、ビュー定義情報16として、予測モデルの生成アルゴリズムの種類を表す情報を利用することができる。例えば、ビュー定義情報16は、予測モデルの生成に利用する AI エンジンの識別情報(異種混合学習、RAPID 時系列分析、又は SVM など)と、分析タイプ(回帰分析又は判別分析)を示す。この場合、AI エンジンの識別情報と分析タイプのペアごとに、そのペアがビュー定義情報16に示されているケースにおいて表示情報の生成に必要な情報(以下、表示テンプレート)を、記憶装置に格納しておく。表示テンプレートは、画面に含める図の種類や構造、各図の配置などを示す。表示情報生成部2060は、ビュー定義情報16が示す AI エンジンの識別情報と分析タイプに対応づけて格納されている表示テンプレートを上記記憶装置から読み出し、読み出した表示テンプレートを用いて表示情報を生成する。
なお、前述したように、AI エンジンの識別情報や分析タイプは、アルゴリズム定義情報14としても利用されうる。このようにアルゴリズム定義情報14とビュー定義情報16で共通の情報を利用する場合には、これら共通の情報を重複してテンプレート情報10に含める必要はなく、これら共通の情報をアルゴリズム定義情報14とビュー定義情報16の双方として扱うようにすることが好適である。
さらに、前述したように、表示情報は、予測モデルの精度の確認に特に好適なタイプ(以下、精度確認タイプ)のものや、予測対象と各説明変数との関係性を確認することに特に好適なタイプ(以下、関係性確認タイプ)のものなどに分類できる。そこで、ビュー定義情報16は、このような利用目的のタイプをさらに示してもよい。この場合、例えば、利用目的のタイプ、AI エンジンの識別情報、及び分析タイプの各組み合わせに対応づけて表示テンプレートを用意し、記憶装置に格納しておく。表示情報生成部2060は、ビュー定義情報16が示す利用目的のタイプ、AI エンジンの識別情報、及び分析タイプの組み合わせに対応する表示テンプレートを記憶装置から読み出し、読み出した表示テンプレートを用いて表示情報を生成する。
ビュー定義情報16には、さらに、表示情報に含める情報を指定するパラメータが含まれてもよい。例えば前述したように、予測モデルの評価指標には、誤差率、平均平方二乗誤差、又は平均二乗誤差などといった様々なものを採用しうる。そこで、ビュー定義情報16において、これら様々な評価指標のうちのどれを表示情報に含めるかを指定しておく。この場合、表示情報生成部2060は、ビュー定義情報16に示されている評価指標が含まれるように、表示情報を生成する。
その他のパラメータの例として、表示情報における評価指標の呼称が挙げられる。例えば、誤差率という評価指標を、モデルの信用度の低さを表す指標として利用するとする。この場合、ビュー定義情報16において、表示情報に含める評価指標として誤差率を指定し、誤差率の呼称として「モデルの信用度の低さ」を指定することができる。
<テンプレート情報10の具体例>
以下、テンプレート情報10の具体例を、図を用いて説明する。各図において、テンプレート情報10は、分析テンプレート名302、分析テンプレートID304、ソリューション306、概要308、エンジンタイプ310、目的変数312、出力値314、及び項目定義316という属性を有する。なお、各図に示す具体例では、ビュー定義情報16が省略されている。ビュー定義情報16の具体例については後述する。
分析テンプレート名302は、テンプレート情報10の名称を示す。また、分析テンプレートID304は、テンプレート情報10の識別情報を示す。これらの情報は、例えば、ユーザにテンプレート情報10の選択をさせる検索画面50に表示される(図6参照)。
ソリューション306は、テンプレート情報10が行う分析が提供するソリューションの種類を示す。例えば前述したように、ソリューションの種類は、テンプレート情報10の検索に利用することができる。
概要308は、テンプレート情報10が行う分析の概要を示す情報である。例えばこの情報は、前述した検索画面50などに表示することで、ユーザがテンプレート情報10を選択する際に参考とすることができる。
エンジンタイプ310、目的変数312、及び出力値314は、アルゴリズム定義情報14を構成する情報である。エンジンタイプ310は、予測モデルの生成に利用される AI エンジンの識別情報を示している。なお、図13等においては、説明を分かりやすくするためにエンジンタイプ310に AI エンジンの名称が示されている。しかし、エンジンタイプ310は、AI エンジンを特定できる任意の情報(識別番号など)とすることができる。
目的変数312は、生成する予測モデルの目的変数を表す。目的変数312は、入力データを用いた学習によって予測モデルを生成する際に、誤差を最小化する対象となる変数である。一方、出力値314は、予測モデルを利用した際に予測モデルから出力される値(予測モデルの予測結果)を示す。例えば図13におけるテンプレートT01では、目的変数が「店舗ごと及び商品分類ごとの、売上数の移動平均に対する1日先売上数の比率」であり、出力値は「店舗ごと及び商品分類ごとの、1日先の売上数」である。そのため、入力データを用いて予測モデルを生成する際には、店舗ごと及び商品分類ごとに「売上数の移動平均に対する1日先売上数の比率」が算出され、その誤差が最小化されるように学習が行われる。一方で、予測モデルから出力される予測結果としては、移動平均とそれに対する比率を利用して、1日先の売上数が出力される。
また、目的変数として、「売上数の対数」のように、所定の項目の値を対数変換したものを利用することも考えられる。この場合、例えば、目的変数から対数を外した値を出力値として用いることが好適である。
このように、目的変数に対して適切な加工を加えた値を予測モデルの最終的な出力とすることで、ユーザにとって有用な値を予測結果として提供することができる。そして、そのような加工の方法を予めテンプレート情報10で定義しておくことにより、データ分析の専門家でないユーザでも容易に適切なデータ分析を行うことができるようになる。
項目定義316は、項目定義情報12に相当する情報である。すなわち、項目定義316は、予測モデルに利用されるデータの項目を表す。ここで、図13等において、項目定義316に示されているのは大項目であり、小項目については省略されている。
なお、複数のテンプレート情報10で共通の大項目が利用されうるため、大項目と小項目の対応付けについては、テンプレート情報10とは別途用意しておくことが好適である。こうすることで、大項目と小項目の対応付けをテンプレート情報10とは別途管理することができ、その管理の手間が軽減される。
以下、図13から図19を利用して、テンプレート情報10の具体例を示す。図13から図19は、それぞれ以下の予測についてのテンプレートである。
・図13:売上数の予測
・図14:客数の予測
・図15:出荷数の予測
・図16:製品の受注数量の予測
・図17:保守部品の出庫数の予測
・図18:故障の予測
・図19:故障状態かどうかの判別
図13は、売上数の予測に利用されるテンプレート情報10を例示する図である。テンプレート情報T01、T02、T03は、目的変数312が互いに異なる。具体的には、テンプレート情報T01~T03はそれぞれ、「店舗ごと及び商品分類ごとの、売上数の移動平均に対する1日先の売上数の比率」、「店舗ごと及び商品分類ごとの、売上数の移動平均に対する1日先の売上数の差分」、及び「店舗ごと及び商品単品ごとの、売上数の移動平均に対する1日先の売上数の比率」を目的変数としている。
出力値314については、テンプレート情報T01とT02では共通である一方、テンプレート情報T03では他の2つと異なっている。具体的には、テンプレート情報T01とT02における出力値314は「店舗ごと及び商品分類ごとの1日先の売上数」であるのに対し、テンプレート情報T03における出力値314は「店舗ごと及び商品単品ごとの1日先の売上数」である。
一方、ソリューション306が「需要予測」であり、エンジンタイプ310が「異種混合学習」であり、項目定義316が「カレンダー、商品マスタ、店舗マスタ、気象データ、売上データ、及び客数データ」である点は、全てのテンプレート情報10で共通している。
図14は、客数の予測に利用されるテンプレート情報10を例示する図である。テンプレート情報T11、T12、T13は、目的変数312が互いに異なる。具体的には、テンプレート情報T11~T13はそれぞれ、「店舗ごとの、客数の移動平均に対する1日先の客数の比率」、「店舗ごとの、客数の移動平均に対する1日先の客数の差分」、及び「店舗ごとの1日先の客数」を目的変数としている。
一方で、出力値314が「1日先の客数」であり、ソリューション306が「需要予測」であり、エンジンタイプ310が「異種混合学習」であり、項目定義316が「カレンダー、店舗マスタ、気象データ、及び客数データ」である点は、全てのテンプレート情報10で共通している。
図15は、出荷数の予測に利用されるテンプレート情報10を例示する図である。テンプレート情報T21、T22、T23は、目的変数312が互いに異なる。具体的には、テンプレート情報T21~T23はそれぞれ、「出荷センタごと及び商品分類ごとの、出荷数の移動平均に対する1日先の出荷数の比率」、「出荷センタごと及び商品分類ごとの、出荷数の移動平均に対する1日先の出荷数の差分」、及び「出荷センタごと及び商品単品ごとの、出荷数の移動平均に対する1日先の出荷数の比率」を目的変数としている。
出力値314については、テンプレート情報T21とT22では共通である一方、テンプレート情報T23では他の2つと異なっている。具体的には、テンプレート情報T21とT22における出力値314は「出荷センタごと及び商品分類ごとの1日先の出荷数」であるのに対し、テンプレート情報T23における出力値314は「出荷センタごと及び商品単品ごとの1日先の出荷数」である。
一方、ソリューション306が「需要予測」であり、エンジンタイプ310が「異種混合学習」であり、項目定義316が「カレンダー、商品マスタ、気象データ、拠点マスタ、及び出荷データ」である点は、全てのテンプレート情報10で共通している。
図16は、製品の受注数量の予測に利用されるテンプレート情報10を例示する図である。テンプレート情報T31とT32では、目的変数312と出力値314がいずれも「製品ごとの、3ヶ月先の受注数量」となっている。一方、テンプレート情報T33では、目的変数312と出力値314がいずれも「製品ごとの、6ヶ月先の受注数量」となっている。
また、テンプレート情報T31とT33では、概要308に記載されているように、入力データを製品ごとに学習用と評価用に分割して、予測モデルの生成と評価が行われる。一方で、テンプレート情報T32では、概要308に記載されているように、入力データをランダムに学習用と評価用に分割して、予測モデルの生成と評価が行われる。このようなデータ分割の基準は、例えば、AI エンジンに与えるハイパーパラメータとしてアルゴリズム定義情報14に含まれている。
一方で、ソリューション306が「需要予測」であり、エンジンタイプ310が「異種混合学習」であり、項目定義316が「受注実績、大口案件受注実績、製品マスタ、帝国DI(Diffusion Index)、日銀短観、月次為替、見積もりデータ、カレンダ、追加カレンダ」という点は、全てのテンプレート情報10で共通している。
図17は、保守部品の出庫数の予測に利用されるテンプレート情報10を例示する図である。テンプレート情報T41~T43は、目的変数312が互いに異なる。具体的には、テンプレート情報T41~T43はそれぞれ、「部品別の1ヶ月先の出庫数」、「部品別の2ヶ月先の出庫数」、及び「部品別の3ヶ月先の出庫数」を目的変数としている。出力値314についても同様である。
一方、ソリューション306が「需要予測」であり、エンジンタイプ310が「異種混合学習」であり、項目定義316が「出庫実績、稼働実績、部品マスタ、カレンダー」である点は、全てのテンプレート情報10で共通している。
図18は、機器の故障の予測に利用されるテンプレート情報10を例示する図である。テンプレート情報T51~T53において、目的変数312と出力値314はいずれも、「機器ごとに、7日先に機器が故障するか否か」である。なお、図13~図17で例示したテンプレート情報10で生成される予測モデルはいずれも回帰モデルである一方、図18と後述する図19で例示するテンプレート情報10で生成される予測モデルは判別モデルとなる。
テンプレート情報T51~T53は、予測モデルの学習アルゴリズムに違いがある。まず、テンプレート情報T51とT52は、エンジンタイプ310が異種混合学習であるのに対し、テンプレート情報T53は、エンジンタイプ310が RAPID 時系列分析となっている。
エンジンタイプ310に加え、入力データに対して加える前処理についても違いがある。テンプレート情報T51では、機器の故障実績及び機器に搭載されているセンサー群のデータに対し、1時間単位に加工・集計する前処理が行われる。テンプレート情報T52では、機器の故障実績、機器に搭載されているセンサー群のデータ、及びその機器の周辺のセンサー群のデータに対し、1時間単位に加工・集計する前処理が行われる。テンプレート情報T53では、このような1時間単位に加工・集計する前処理が行われない。このような前処理の定義は、アルゴリズム定義情報14に含まれている。
一方で、ソリューション306が「異常検知」であり、項目定義316が「機器センサデータ、周辺機器センサデータ、故障実績データ」である点は、全てのテンプレート情報10で共通している。
図19は、故障状態か否かの判別に利用されるテンプレート情報10を例示する図である。テンプレート情報T61とT62において、目的変数312と出力値314はいずれも、「機器ごとに、機器が故障状態になるか否か」である。
テンプレート情報T61とT62は、入力データに対する前処理に違いがある。テンプレート情報T61では、機器の故障実績及び機器に搭載されているセンサー群のデータに対し、1時間単位に加工・集計する前処理が行われる。テンプレート情報T62では、機器の故障実績、機器に搭載されているセンサー群のデータ、及びその機器の周辺のセンサー群のデータに対し、1時間単位に加工・集計する前処理が行われる。
一方で、エンジンタイプ310が「異種混合学習」であり、ソリューション306が「異常検知」であり、項目定義316が「機器センサデータ、周辺機器センサデータ、故障実績データ」である点は、双方のテンプレート情報10で共通している。
<<ビュー定義情報16の具体例>>
前述したテンプレート情報10の具体例に関し、ビュー定義情報16の具体例をいくつか説明する。例えばテンプレート情報10には、ビュー定義情報16として、「分析タイプ」、「利用目的タイプ」、「評価指標の有無」、及び「評価指標の名称」などの情報を含めることができる。また、エンジンタイプ310も、ビュー定義情報16として利用することができる。具体的には、分析タイプ、エンジンタイプ、及び利用目的タイプの組みに対応づけて、表示テンプレートを用意しておく。
例えば、図13のテンプレート情報T01には、ビュー定義情報16として、以下の情報を付加することが好適である。
・分析タイプ:回帰
・利用目的タイプ:精度確認
・評価指標の利用有無:全ての評価指標を利用
・評価指標の名称:変更なし
ここで、「評価指標の利用有無:全ての評価指標を利用」は、分析タイプに対応づけて用意されている全ての評価指標を表示情報に含めることを意味する。例えばこのケースでは、分析タイプが回帰分析であるため、回帰分析用の評価指標として用意されている全ての評価指標(適用率、再現率、及び F 値など)が表示情報に含まれることになる。また、「評価指標の名称:変更なし」は、評価指標の呼称として評価指標の名称をそのまま用いる(例えば、誤差率をそのまま「誤差率」と表示する)ことを意味する。
その他にも例えば、図18のテンプレート情報T51には、ビュー定義情報16として、以下の情報を付加することが好適である。
・分析タイプ:判別
・利用目的タイプ:精度確認
・評価指標の利用有無:全ての評価指標
・評価指標の名称:変更なし
<ユーザによるテンプレート情報10のカスタマイズ>
テンプレート情報10の内容の一部をユーザがカスタマイズできるようにしておいてもよい。すなわち、ユーザは、予め登録されているテンプレート情報10から好きなものを選んでそのまま利用することもできるし、選んだテンプレート情報10の一部をカスタマイズして利用することもできる。
テンプレート情報10のカスタマイズは、分析を実行する際に行われてもよいし、分析に先立って予め行われてもよい。後者の場合、分析システム2000は、カスタマイズされたテンプレート情報10を、新たなテンプレート情報10として登録しておく(テンプレート記憶装置60に格納しておく)ことが好ましい。この場合、ユーザがテンプレート情報10の指定(S102)を行う際に、ユーザによってカスタマイズされたテンプレート情報10も、既存のテンプレート情報10と同様に選択可能となる。そこでユーザは、予めカスタマイズして登録しておいたテンプレート情報10を分析の際に指定することで、そのテンプレート情報10を利用した分析を実行することができる。
なお、分析を実行する際にテンプレート情報10のカスタマイズを行った場合でも、カスタマイズ後のテンプレート情報10を分析システム2000に登録できることが好適である。こうすることで、次回以降の分析に、カスタマイズしたテンプレート情報10が利用可能となる。
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記各実施形態の組み合わせ、又は上記以外の様々な構成を採用することもできる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
1. 複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付部を有し、
前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データを取得し、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記取得した入力データを処理することにより、予測モデルを生成する予測モデル生成部と、
前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で前記生成した予測モデルに関する情報を表す表示情報を生成する表示情報生成部と、を有する分析システム。
2. 前記入力受付部は、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、1.に記載の分析システム。
3. 前記項目定義情報は、1つ以上の大項目を示し、
前記大項目には、複数の小項目が対応づけられており、
前記入力受付部は、
前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、2.に記載の分析システム。
4. 前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、1.乃至3.いずれか一つに記載の分析システム。
5. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、4.に記載の分析システム。
6. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムによって生成される予測モデルの精度が向上する値に変換する前処理を含む、4.に記載の分析システム。
7. 前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、1.乃至6いずれか一つに記載の分析システム。
8. 前記表示テンプレートは、アルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的のタイプの組み合わせに対応づけて定められており、
前記ビュー定義情報は、前記表示情報の利用目的をさらに示し、
前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的の組み合わせに対応する前記表示テンプレートを取得する、7.に記載の分析システム。
9. 複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付部を有し、
前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
前記入力受付部は、前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データの指定をさらに受け付け、
前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する表示情報生成部を有し、
前記予測モデルは、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記指定された入力データを処理することで生成される、装置。
10. 前記入力受付部は、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、9.に記載の装置。
11. 前記項目定義情報は、1つ以上の大項目を示し、
前記大項目には、複数の小項目が対応づけられており、
前記入力受付部は、
前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、10.に記載の装置。
12. 前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、9.乃至11.いずれか一つに記載の装置。
13. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、12.に記載の装置。
14. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムによって生成される予測モデルの精度が向上する値に変換する前処理を含む、12.に記載の装置。
15. 前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、9.乃至14いずれか一つに記載の装置。
16. 前記表示テンプレートは、アルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的のタイプの組み合わせに対応づけて定められており、
前記ビュー定義情報は、前記表示情報の利用目的をさらに示し、
前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的の組み合わせに対応する前記表示テンプレートを取得する、15.に記載の装置。
17. コンピュータによって実行される制御方法であって、
複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付ステップを有し、
前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データを取得し、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記取得した入力データを処理することにより、予測モデルを生成する予測モデル生成ステップと、
前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で前記生成した予測モデルに関する情報を表す表示情報を生成する表示情報生成ステップと、を有する制御方法。
18. 前記入力受付ステップにおいて、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、17.に記載の制御方法。
19. 前記項目定義情報は、1つ以上の大項目を示し、
前記大項目には、複数の小項目が対応づけられており、
前記入力受付ステップにおいて、
前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、18.に記載の制御方法。
20. 前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、17.乃至19.いずれか一つに記載の制御方法。
21. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、20.に記載の制御方法。
22. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムによって生成される予測モデルの精度が向上する値に変換する前処理を含む、20.に記載の制御方法。
23. 前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、17.乃至22いずれか一つに記載の制御方法。
24. 前記表示テンプレートは、アルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的のタイプの組み合わせに対応づけて定められており、
前記ビュー定義情報は、前記表示情報の利用目的をさらに示し、
前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的の組み合わせに対応する前記表示テンプレートを取得する、23.に記載の制御方法。
25. コンピュータによって実行される制御方法であって、
複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付ステップを有し、
前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
前記入力受付ステップにおいて、前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データの指定をさらに受け付け、
前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する表示情報生成ステップを有し、
前記予測モデルは、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記指定された入力データを処理することで生成される、制御方法。
26. 前記入力受付ステップにおいて、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、25.に記載の制御方法。
27. 前記項目定義情報は、1つ以上の大項目を示し、
前記大項目には、複数の小項目が対応づけられており、
前記入力受付ステップにおいて、
前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、26.に記載の制御方法。
28. 前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、25.乃至27.いずれか一つに記載の制御方法。
29. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、28.に記載の制御方法。
30. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムによって生成される予測モデルの精度が向上する値に変換する前処理を含む、28.に記載の制御方法。
31. 前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、25.乃至30いずれか一つに記載の制御方法。
32. 前記表示テンプレートは、アルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的のタイプの組み合わせに対応づけて定められており、
前記ビュー定義情報は、前記表示情報の利用目的をさらに示し、
前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報、分析のタイプ、及び前記表示情報の利用目的の組み合わせに対応する前記表示テンプレートを取得する、31.に記載の制御方法。
33. 17.乃至32.いずれか一つに記載の制御方法の各ステップをコンピュータに実行させるプログラム。
この出願は、2019年8月22日に出願された日本出願特願2019-152096号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
10 テンプレート情報
12 項目定義情報
14 アルゴリズム定義情報
16 ビュー定義情報
20 ユーザ端末
30 フロントエンドサーバ
40 バックエンドサーバ
50 検索画面
52 識別情報指定エリア
54 名称指定エリア
56 検索ボタン
58 検索結果表示エリア
60 テンプレート記憶装置
70 画面
80 散布図画面
82 ポップアップウインドウ
90 一覧画面
110 散布図画面
120 一覧画面
130 詳細画面
131 評価指標エリア
132 説明変数一覧エリア
134 グラフエリア
135 門木エリア
136 予測式エリア
302 分析テンプレート名
304 分析テンプレートID
306 ソリューション
308 概要
310 エンジンタイプ
312 目的変数
314 出力値
316 項目定義
1000 計算機
1020 バス
1040 プロセッサ
1060 メモリ
1080 ストレージデバイス
1100 入出力インタフェース
1120 ネットワークインタフェース
2000 分析システム
2020 入力受付部
2040 予測モデル生成部
2060 表示情報生成部

Claims (9)

  1. 複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付部を有し、
    前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
    前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データを取得し、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記取得した入力データを処理することにより、予測モデルを生成する予測モデル生成部と、
    前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で前記生成した予測モデルに関する情報を表す表示情報を生成する表示情報生成部と、を有し、
    前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
    前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
    前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する分析システム。
  2. 複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付部を有し、
    前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
    前記入力受付部は、前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データの指定をさらに受け付け、
    前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する表示情報生成部を有し、
    前記予測モデルは、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記指定された入力データを処理することで生成し、
    前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
    前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
    前記表示情報生成部は、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、装置。
  3. 前記入力受付部は、前記項目定義情報で特定される各項目を表す表示を出力し、各前記項目について、その項目に対応する入力データの指定を受け付ける、請求項2に記載の装置。
  4. 前記項目定義情報は、1つ以上の大項目を示し、
    前記大項目には、複数の小項目が対応づけられており、
    前記入力受付部は、前記大項目に対応する入力データの指定を受け付け、さらに、その大項目に対応する複数の小項目と、前記入力データに含まれる複数の小項目との対応関係を指定する入力を受け付ける、請求項3に記載の装置。
  5. 前記アルゴリズム定義情報は、前記予測モデルの生成に利用される機械学習プログラムを含むか、又はその機械学習プログラムの識別情報を含む、請求項2乃至4いずれか一項に記載の装置。
  6. 前記アルゴリズム定義情報は、前記入力データに含まれる値を、前記機械学習プログラムが要求するフォーマットに変換する前処理を含む、請求項5に記載の装置。
  7. コンピュータによって実行される制御方法であって、
    複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付ステップを有し、
    前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
    前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データを取得し、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記取得した入力データを処理することにより、予測モデルを生成する予測モデル生成ステップと、
    前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で前記生成した予測モデルに関する情報を表す表示情報を生成する表示情報生成ステップと、を有し、
    前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
    前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
    前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する制御方法。
  8. コンピュータによって実行される制御方法であって、
    複数のテンプレート情報のうちの1つを指定する入力を受け付ける入力受付ステップを有し、
    前記テンプレート情報は、予測モデルの生成に利用される各入力データの項目を特定する項目定義情報、予測モデルの生成アルゴリズムを特定するアルゴリズム定義情報、及び予測モデルに関する情報の表示態様を特定するビュー定義情報を含み、
    前記入力受付ステップにおいて、前記指定されたテンプレート情報の前記項目定義情報で特定される各項目について、その項目に対応する入力データの指定をさらに受け付け、
    前記指定されたテンプレート情報の前記ビュー定義情報で特定される表示態様で、予測モデルに関する情報を表す表示情報を生成する表示情報生成ステップを有し、
    前記予測モデルは、前記指定されたテンプレート情報の前記アルゴリズム定義情報で特定されるアルゴリズムに基づいて前記指定された入力データを処理することで生成され
    前記予測モデルの生成に用いるアルゴリズムの識別情報と、前記予測モデルを用いた分析のタイプとの組み合わせに対応づけて、前記表示情報の生成に必要な情報を示す表示テンプレートが定められており、
    前記ビュー定義情報は、アルゴリズムの識別情報と分析のタイプを示し、
    前記表示情報生成ステップにおいて、前記指定されたテンプレート情報の前記ビュー定義情報によって示されているアルゴリズムの識別情報と分析のタイプの組み合わせに対応する前記表示テンプレートを取得し、前記表示テンプレートを利用して前記表示情報を生成する、制御方法。
  9. 請求項又はに記載の制御方法の各ステップをコンピュータに実行させるプログラム。
JP2021540620A 2019-08-22 2019-10-18 分析システム、装置、制御方法、及びプログラム Active JP7371690B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019152096 2019-08-22
JP2019152096 2019-08-22
PCT/JP2019/041150 WO2021033338A1 (ja) 2019-08-22 2019-10-18 分析システム、装置、制御方法、及びプログラム

Publications (3)

Publication Number Publication Date
JPWO2021033338A1 JPWO2021033338A1 (ja) 2021-02-25
JPWO2021033338A5 JPWO2021033338A5 (ja) 2022-04-25
JP7371690B2 true JP7371690B2 (ja) 2023-10-31

Family

ID=74661024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021540620A Active JP7371690B2 (ja) 2019-08-22 2019-10-18 分析システム、装置、制御方法、及びプログラム

Country Status (3)

Country Link
US (1) US20220351051A1 (ja)
JP (1) JP7371690B2 (ja)
WO (1) WO2021033338A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023276049A1 (ja) * 2021-06-30 2023-01-05 日本電気株式会社 店舗データ処理装置、店舗データ処理方法、及びプログラム
WO2023276051A1 (ja) * 2021-06-30 2023-01-05 日本電気株式会社 売上情報処理装置、売上情報処理方法、及びプログラム
JP7320809B1 (ja) 2022-10-18 2023-08-04 株式会社サマデイ Aiサーバ用インターフェースシステム、及び非認知スキルブラッシュアップシステム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001160045A (ja) 1999-12-03 2001-06-12 Hitachi Ltd 需要予測システム
JP2016134053A (ja) 2015-01-21 2016-07-25 日通システム株式会社 経営管理支援システム、経営管理支援方法、及び、経営管理支援プログラム
WO2017094207A1 (ja) 2015-11-30 2017-06-08 日本電気株式会社 情報処理システム、情報処理方法および情報処理用プログラム
JP2017520068A (ja) 2014-05-23 2017-07-20 データロボット, インコーポレイテッド 予測データ分析のためのシステムおよび技術

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001160045A (ja) 1999-12-03 2001-06-12 Hitachi Ltd 需要予測システム
JP2017520068A (ja) 2014-05-23 2017-07-20 データロボット, インコーポレイテッド 予測データ分析のためのシステムおよび技術
JP2016134053A (ja) 2015-01-21 2016-07-25 日通システム株式会社 経営管理支援システム、経営管理支援方法、及び、経営管理支援プログラム
WO2017094207A1 (ja) 2015-11-30 2017-06-08 日本電気株式会社 情報処理システム、情報処理方法および情報処理用プログラム

Also Published As

Publication number Publication date
WO2021033338A1 (ja) 2021-02-25
US20220351051A1 (en) 2022-11-03
JPWO2021033338A1 (ja) 2021-02-25

Similar Documents

Publication Publication Date Title
Lazzeri Machine learning for time series forecasting with Python
US20190265971A1 (en) Systems and Methods for IoT Data Processing and Enterprise Applications
JP7371690B2 (ja) 分析システム、装置、制御方法、及びプログラム
US20200363920A1 (en) Automated process discovery and facilitation within a cloud business application
US8024218B2 (en) Method and apparatus for determining the product marketability utilizing a percent coverage
US20180349446A1 (en) Interactive system employing machine learning and artificial intelligence to customize user interfaces
US9747574B2 (en) Project assessment tool
US20180096295A1 (en) Delivery status diagnosis for industrial suppliers
US20180349793A1 (en) Employing machine learning and artificial intelligence to generate user profiles based on user interface interactions
US20220351004A1 (en) Industry specific machine learning applications
US10592472B1 (en) Database system for dynamic and automated access and storage of data items from multiple data sources
US20230091610A1 (en) Systems and methods of generating and validating time-series features using machine learning
US10497059B1 (en) Method and system for providing real time access to relevant energy policy and regulatory data
US20240193481A1 (en) Methods and systems for identification and visualization of bias and fairness for machine learning models
US12050762B2 (en) Methods and systems for integrated design and execution of machine learning models
US20230065870A1 (en) Systems and methods of multimodal clustering using machine learning
Raith et al. Benchmarking using data envelopment analysis: application to stores of a post and banking business
Ramakrishnan et al. Default Prediction in Pakistan using Financial Ratios and Sector Level Variables
EP3596674B1 (en) User interface and runtime environment for process definition and process execution tracking
JP7499597B2 (ja) 学習モデル構築システムおよびその方法
JP2016532949A (ja) 従来の予測子の将来的変化を予測するためにある期間にわたって精選され、分析されたデータシグナルから重大変化属性を導出するためのシステム及び方法
Schobel et al. Business process intelligence tools
Yan et al. Teaching predictive audit data analytic techniques: Time-series forecasting with transactional and exogenous data
CN110826308A (zh) 财务报表生成方法、装置、计算机设备和可读存储介质
Amendola Input additionality of R&D tax reliefs: results from a panel LP-IV approach

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220208

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220208

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A801

Effective date: 20220209

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20220208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231002

R151 Written notification of patent or utility model registration

Ref document number: 7371690

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151