JP6784612B2 - 分析ソフトウェア管理システム及び分析ソフトウェア管理方法 - Google Patents

分析ソフトウェア管理システム及び分析ソフトウェア管理方法 Download PDF

Info

Publication number
JP6784612B2
JP6784612B2 JP2017038953A JP2017038953A JP6784612B2 JP 6784612 B2 JP6784612 B2 JP 6784612B2 JP 2017038953 A JP2017038953 A JP 2017038953A JP 2017038953 A JP2017038953 A JP 2017038953A JP 6784612 B2 JP6784612 B2 JP 6784612B2
Authority
JP
Japan
Prior art keywords
analysis
data
information
analytical
logic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017038953A
Other languages
English (en)
Other versions
JP2018147061A (ja
Inventor
山本 秀典
秀典 山本
岳志 半田
岳志 半田
祐子 山下
祐子 山下
川崎 健治
健治 川崎
修一郎 崎川
修一郎 崎川
高志 津野
高志 津野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2017038953A priority Critical patent/JP6784612B2/ja
Priority to KR1020197004404A priority patent/KR102213627B1/ko
Priority to PCT/JP2017/042813 priority patent/WO2018159042A1/ja
Priority to US16/331,573 priority patent/US11016758B2/en
Publication of JP2018147061A publication Critical patent/JP2018147061A/ja
Application granted granted Critical
Publication of JP6784612B2 publication Critical patent/JP6784612B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Stored Programmes (AREA)

Description

本発明は、分析ソフトウェア管理システム及び分析ソフトウェア管理方法に関するものであり、具体的には、データ分析の実施履歴の多寡に係わらずデータ分析部品の提案を可能とし、ひいては、データ分析用ソフトウェア作成の効率化やコスト低減を図る技術に関する。
いわゆるIoT(Internet of Things)技術の進展等もあり、様々な事象に関して膨大な計測データ等が収集、分析される傾向が強まっている。例えば、交通、電力、産業、その他分野の業務における様々な問題を解決するために、部署や業務を跨いで横断的に業務データを収集し、それらを活用しての分析実施が求められている。 しかし、大量の業務データの理解が必要であることや、業務知識に基づく属人性が高いこと、等が分析実施の妨げとなっている。そこで、データ分析・加工の知識や業務知識が十分に無い者でも、迅速かつ容易に分析できるよう、分析に係る各種の負担を低減することが求められる。
このような分析に関する従来技術としては、例えば、外部から取得したデータに対して複数の分析処理を行うデータ分析システムにおけるデータ分析方法であって、外部から取得したデータに対して分析処理を行う分析処理ステップと、前記分析処理ステップにおける分析処理と、データベースに蓄積された複数の過去の分析処理の履歴である分析履歴とに基づいて、前記分析処理ステップにおける分析処理の次に行う分析処理の候補を検索する検索ステップと、前記検索ステップで検索された分析処理の候補を分析利用者に提示する提示ステップと、を有し、前記分析履歴は複数の分析処理を含むことを特徴とするデータ分析方法(特許文献1参照)等が提案されている。
また、分析対象の実績データについてどのような分析を行うかを指定する条件の指定項目を条件指定画面から入力し、指定された条件に従って前記実績データを加工した分析データを表示する分析支援処理装置であって、前記条件指定画面により指定される条件の指定項目に対応づけられる分析対象となる実績の明細データからなる実績データを記憶する実績データ記憶手段と、各利用者が前記条件指定画面において選択した条件の指定項目の情報と、その利用者の担当業務の情報と、その利用者が選択した条件の指定項目に係る分析データを参照した時刻に関する情報とを含む履歴データを記憶する履歴データ記憶手段と、少なくとも各利用者の識別情報と担当業務との対応情報が格納された識別情報記憶手段と、入力された利用者の識別情報から前記識別情報記憶手段を参照して利用者の担当業務を特定する手段と、前記履歴データ記憶手段に記憶された履歴データから、前記特定した担当業務と同じ担当業務の利用者が所定の期間内に選択した条件の指定項目に係る分析データの参照回数を各指定項目ごとに集計する履歴データ集計手段と、前記履歴データ集計手段が集計した各指定項目ごとの参照回数情報を、前記条件指定画面の各指定項目内に記入した画面を編集する条件指定画面編集手段と、編集された条件指定画面を表示装置に表示する条件指定画面表示手段と、前記条件指定画面表示手段により表示した条件指定画面から条件の指定項目を入力する手段と、前記入力された条件の指定項目に従って前記実績データを加工した分析データを表示するための分析用表示画面を編集する分析用表示画面編集手段と、前記分析用表示画面編集手段により編集された分析用表示画面を表示装置に表示する実績表示画面表示手段と、前記入力された条件の指定項目と前記利用者の担当業務と前記分析用表示画面を表示した時刻とから前記履歴データ記憶手段における履歴データを更新する履歴データ更新手段とを備えることを特徴とする分析支援処理装置(特許文献2参照)等も提案されている。
特開2016−29516号公報 特開2010−237900号公報
従来技術においては、過去の分析実施履歴を参照して、分析処理や分析対象データの候補の提案を行っている。しかし、分析実績履歴が既に蓄積されていることが前提となるため、該当システムの導入時点、運用開始時には効果が得られない。また該技術による提案に従って選出した分析処理から、有用な分析結果を得られるか否かは、実際に実行してユーザが確認してみないと分かり得ず、確認に時間を要する。
そこで本発明は、上述した課題を考慮したものであって、データ分析の実施履歴の多寡に係わらずデータ分析部品の提案を可能とし、ひいては、データ分析用ソフトウェア作成の効率化やコスト低減を図る技術を提供する。
上記課題を解決する本発明の分析ソフトウェア管理システムは、複数の所定システムから収集された分析対象データを格納する記憶装置と、前記記憶装置に格納した前記分析対象データの間における関係性について、前記複数の所定システムを跨がって値の属性が共通する分析対象データ同士を対応付けるデータ関係の情報として特定し、前記データ関係の情報が示す各分析対象データを前記記憶装置での格納先から呼び出すためのSQL文をデータ突合せロジックとして生成し、前記各分析対象データと当該各分析対象データを分析に際して抽出する分析部品である前記データ突合せロジックとの紐付けについて前記記憶装置に格納し、分析関係情報を生成する処理と、前記分析関係情報に基づき、ユーザにより分析対象として指定された所定データに対して、利用可能な分析部品の組合せを特定する処理と、を実行する演算装置と、を備えることを特徴とする。
また、本発明の分析ソフトウェア管理方法は、情報処理システムが、複数の所定システムから収集された分析対象データを格納する記憶装置を備えて、前記記憶装置に格納した前記分析対象データの間における関係性について、前記複数の所定システムを跨がって値の属性が共通する分析対象データ同士を対応付けるデータ関係の情報として特定し、前記データ関係の情報が示す各分析対象データを前記記憶装置での格納先から呼び出すためのSQL文をデータ突合せロジックとして生成し、前記各分析対象データと当該各分析対象データを分析に際して抽出する分析部品である前記データ突合せロジックとの紐付けについて前記記憶装置に格納し、分析関係情報を生成する処理と、前記分析関係情報に基づき、ユーザにより分析対象として指定された所定データに対して、利用可能な分析部品の組合せを特定する処理と、を実行することを特徴とする。
本発明によれば、データ分析の実施履歴の多寡に係わらずデータ分析部品の提案を可能とし、ひいては、データ分析用ソフトウェア作成の効率化やコスト低減を図ることが可能となる。
本実施形態のデータ利活用基盤サーバを含むネットワーク構成例を示す図である。 本実施形態における分析ソフトウェア管理方法を実施する場合のユースケース例を示す図である。 本実施形態におけるデータ利活用基盤サーバのモジュール構成例を示す図である。 本実施形態における分析対象データ、分析部品、分析処理、分析目的、及び業務システムの関係例に対応した分析関係情報を示す図である。 本実施形態における分析対象データ紐付けテーブルの例を示す図である。 本実施形態における分析部品紐付けテーブルの例を示す図である。 本実施形態における分析部品−分析処理紐付けテーブルの例を示す図である。 本実施形態における分析処理−分析目的紐付けテーブルの例を示す図である。 本実施形態における分析目的−業務紐付けテーブルの例を示す図である。 本実施形態におけるデータ分析ロジックのメタ情報例を示す図である。 本実施形態におけるデータ突合せロジックのメタ情報例を示す図である。 本実施形態における分析対象データDBの構成例を示す図である。 本実施形態における分析結果DBの構成例を示す図である。 本実施形態における実績情報DBの構成例を示す図である。 本実施形態における分析ソフトウェア管理方法の処理シーケンス例を示す図である。 本実施形態における分析ソフトウェア管理方法のフロー例1を示す図である。 本実施形態における分析ソフトウェア管理方法のフロー例2を示す図である。 本実施形態における分析ソフトウェア管理方法のフロー例3を示す図である。 本実施形態における分析ソフトウェア管理方法のフロー例4を示す図である。 本実施形態における画面イメージ例を示す図である。
−−−ネットワーク構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態の分析ソフトウェア管理システムたるデータ利活用基盤サーバ101を含むネットワーク構成例を示す図である。図1に示すデータ利活用基盤サーバ101は、データ分析の実施履歴の多寡に係わらずデータ分析部品の提案を可能とし、ひいては、データ分析用ソフトウェア作成の効率化やコスト低減を図るコンピュータシステムである。
このデータ利活用基盤サーバ101は、分析対象となるデータすなわち分析対象データに対する分析処理を構成する分析部品の管理及び分析を行い、その分析部品の情報をユーザに提案するサーバ装置となる。
こうしたデータ利活用基盤サーバ101は、ネットワーク10を介してユーザ端末20と、また、ネットワーク11を介して業務システム30と、それぞれデータ通信可能に接続されている。ただし、業務システム30からデータ利活用基盤サーバ101へのデータ提供は、ネットワーク11を介した通信により実施する場合に限定しない。例えば、人手を介してのデータ利活用基盤サーバ101へのデータ格納を行う場合も想定出来る。
上述のネットワーク構成におけるユーザ端末20は、種々の業務システム30から得られるデータのうち分析対象データとなるものをデータ利活用基盤サーバ101に指定する操作や、データ利活用基盤サーバ101が提示してきた分析部品の組み合わせの確認、選択、及び分析実行と結果確認等の操作を行うための端末となる。
また、業務システム30は、分析対象データとなる各種データ(例:鉄道事業における鉄道車両の走行データや機器の温度、振動といった観測データ、メンテナンス履歴、等)の提供元システムである。この業務システム30は、分析による問題解決の対象となる。−−−ハードウェア構成−−−
また、上述のデータ利活用基盤サーバ101のハードウェア構成は以下の如くとなる。すなわち、データ利活用基盤サーバ101は、SSD(Solid State Drive)やハードディスクドライブ等の適宜な不揮発性記憶素子や、メモリ等の揮発性記憶素子を含む記憶装置111、記憶装置111に保持されるプログラム等を実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPU等の演算装置112、ネットワーク10、11と接続し他装置との通信処理を担う通信装置113、を備える。
こうしたハードウェア構成は、ユーザ端末20においても同様である。例えば、ユーザ端末20は、SSD(Solid State Drive)やハードディスクドライブ等の適宜な不揮発性記憶素子や、メモリ等の揮発性記憶素子を含む記憶装置121、記憶装置121に保持されるプログラム等を実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPU等の演算装置122、ネットワーク10と接続しデータ利活用基盤サーバ101の通信処理を担う通信装置123、を備える。
−−−ユースケース−−−
図2は、本実施形態における分析ソフトウェア管理方法を実施する場合のユースケースを示す図である。図2で示すユースケースにおける主な構成要素は、分析対象となるデータすなわち分析対象データを蓄積し、当該分析対象データに対する分析処理を構成する分析部品の管理及び分析を行ってユーザへの提案を行うデータ利活用基盤サーバ101、分析対象データの提供元である業務システム30、分析対象データに対する分析を行う分析者201、及び、分析部品等の開発を行う開発者202である。
このうち開発者202は、ソフトウェアプログラムである分析部品の開発を行い(221)、該開発した分析部品をデータ利活用基盤サーバ101へと登録する(222)。
また、業務システム30からネットワーク11を介した通信により、もしくは人手により、分析対象データがデータ利活用基盤サーバ101へと登録されると(241)、データ利活用基盤サーバ101にて分析関係情報を生成する(231)。
一方、分析者201は、分析を実施するためにユーザ端末20を用い、分析対象データを指定する(211)。
この場合、データ利活用基盤サーバ101は、分析者201に指定された分析対象データに対して適切な分析部品を選出し(232)、これを分析者201に提案する(233)。 分析者201は、この提案による分析部品候補及び関連する情報を閲覧する(212)。また分析者201は、閲覧した内容を基に、自身が指定した分析対象データに対して用いるべき分析部品の組合せを決定する(213)。分析者201は、こうして決定した分析部品の組合せによる分析処理を実行し(214、234)、その分析結果を確認する(215)。
−−−モジュール構成−−−
図3は、本実施形態におけるデータ利活用基盤サーバ101のモジュール構成を示す図である。
本実施形態のデータ利活用基盤サーバ101においては、分析対象データを蓄積して、この分析対象データに対する分析処理を構成する分析部品の管理及び分析を行い、ユーザへの当該分析部品の提案等の処理を実行するための、データ利活用ミドルウェア300が導入される。
このデータ利活用ミドルウェア300の主な構成要素は、分析部品303の組合せによる分析処理302の実行管理を行う分析実行管理部301、複数の業務システム30から
登録された分析対象のデータを格納する分析対象データDB304、分析処理の実行結果を格納する分析結果DB305、分析実行管理部301にて実行された分析処理に関する実績情報を格納する実績情報DB306、分析関係情報を格納する分析関係テーブル307、分析関係テーブル307を管理する分析関係情報管理部308、分析関係テーブル307を参照してユーザに対する分析部品組合せの提案を行う分析提案部309、データ利活用ミドルウェア300にアクセスして分析を行うユーザ及び業務を管理するユーザ・業務管理部310、ユーザ端末20に対してデータ利活用ミドルウェア300が提供する機能のインタフェースを提供するクライアント向けI/F提供部311、実績情報DB306を管理する分析処理実績管理部312、分析実行管理部301にて実行する分析部品303を管理する分析部品管理部313、分析対象データDB304に格納されるデータを管理するデータ管理部314、ネットワーク10、11を介してユーザ端末20や業務システム30との間で通信を行うデータ通信部315となる。
−−−分析関係情報−−−
図4は、本実施形態における分析対象データ、分析部品、分析処理、分析目的、及び業務システムの関係例に対応した分析関係情報401を示す図である。
本実施形態の分析関係情報401とは、分析に用いるデータ及び分析部品、それらの組合せによる分析処理、分析目的、該分析目的に対する業務システムにおける業務及び業務の実施先となる設備等の対象、との関係を表現するものである。なお、「関係」とは、関係付けられるもの同士を組合せて利用可能である、もしくは利用の実績が有る、ということを意味する。分析関係情報401は、データ利活用基盤サーバ101が、ユーザ指定の分析対象データに対して適切な分析部品を選出し提案するために参照する。
主な構成要素は、分析対象データ411、分析部品412、分析処理413、分析目的414、業務システム415の各情報であり、それぞれの情報ごとに階層に区切って管理される。このうち分析部品412は、データ突合せロジック421とデータ分析ロジック422とに分類される。ここで分析対象データに対する分析の実施に必要となる、データ突合せロジック及びデータ分析ロジックは、分析部品を構成するソフトウェア部品として再利用可能であるものとし、これらの部品の組合せにより分析処理を構成するものとする。
まず、分析対象データ411の階層では、分析対象となる複数の業務システム30からのデータ及び該データ間の関係が管理される。なおデータ関係は、例えば、特開2016−209063号公報による方法により作成されるものである。
また、分析部品412の階層では、1つ以上の分析対象データの組合せをデータベース等の蓄積媒体から抽出するための処理ロジック(例えばSQL文、等)であるデータ突合せロジック421、及び、上述の1つ以上の分析対象データに対して実施する分析のロジック(例えば系列データのグラフ化、相関分析、等)であるデータ分析ロジック422が管理される。
また、分析処理413の階層では、上述の1つ以上の分析対象データ及び1つ以上の分析部品の組合せにより作成するデータ分析処理を管理する。
また、分析目的414の階層では、分析を行う目的であるKPI情報が管理される。また、業務システム415の階層では、上述の分析目的であるKPIを必要とする業務システムにおける業務4151及び設備等の対象4152が管理される。
なお、各々の階層間では各階層の要素で関係のあるもの同士の紐付け(リンク付け)を行っている。
−−−テーブル−−−
図5A〜図6Bは、本実施形態のデータ利活用基盤サーバ101にて管理する、分析関係情報401における要素間の紐付け情報を格納する分析関係テーブル307の構成、及び分析部品のメタ情報のデータ構造を示す図である。
本実施形態において、分析関係情報401における要素間の紐付け情報を管理する分析関係テーブル307は、分析対象データ紐付けテーブル501、分析部品紐付けテーブル502、分析部品−分析処理紐付けテーブル503、分析処理−分析目的紐付けテーブル504、及び、分析目的−業務紐付けテーブル505を、含んで構成されている。
このうち図5Aに例示する分析対象データ紐付けテーブル501は、分析関係情報401の分析対象データ411と分析部品412におけるデータ突合せロジック421との間の紐付けに関する情報を格納するテーブルである。主な構成要素は、各紐付けを一意に特定する紐付け識別情報511、分析対象データ識別情報512、データ突合せロジック識別情報513、重み514、及び、更新日時515である。
上述の紐付け識別情報511には、該当紐付けを識別するための情報が格納される。また、分析対象データ識別情報512には、紐付けられる一方である分析対象データを識別するための情報が格納される。また、データ突合せロジック識別情報513には、紐付けられる他方であるデータ突合せロジックを識別するための情報が格納される。また、重み514には、当該紐付けの重みを示す情報が格納される。例えば該紐付けによる組合せが分析者等のユーザに多く使用される程、当該重みを表す数値は大きくなる。また、更新日時515には、上述の各項目511〜514のレコードが最後に更新された日時が格納される。なお1つの分析対象データに対して、複数の紐付けがありえるため、分析対象データ紐付けテーブル501にて、当該分析対象データに関して複数のレコードが格納され得る。
また、図5Bに例示する分析部品紐付けテーブル502は、分析関係情報401の分析部品412におけるデータ突合せロジック421とデータ分析ロジック422との間の紐付けに関する情報を格納するテーブルである。その主な構成要素は、紐付け識別情報521、データ突合せロジック識別情報522、データ分析ロジック識別情報523、重み524、及び、更新日時525である。
このうち紐付け識別情報521には、当該紐付けを一意に識別するための情報が格納される。また、データ突合せロジック識別情報522には、紐付けられる一方であるデータ突合せロジックを識別するための情報が格納される。また、データ分析ロジック識別情報523には、紐付けられる他方であるデータ分析ロジックを識別するための情報が格納される。また、重み524には、当該紐付けの重みを示す情報が格納される。例えば該紐付けによる組合せが分析者等のユーザに多く使用される程、重みを表す数値は大きくなる。また、更新日時525には、上述のデータ項目521〜524のレコードが最後に更新された日時が格納される。なお1つのデータ突合せロジック及びデータ分析ロジックに対して、複数の紐付けがありえるため、分析部品紐付けテーブル502にて、当該1つのデータ突合せロジック及びデータ分析ロジックに関して複数のレコードが格納され得る。
また、図5Cに例示する分析部品−分析処理紐付けテーブル503は、分析関係情報401の分析部品412におけるデータ分析ロジック422と、分析者等のユーザにより実行された分析処理413との間の紐付けに関する情報を格納するテーブルである。その主な構成要素は、紐付け識別情報531、データ分析ロジック識別情報532、分析処理識別情報533、重み534、及び、更新日時535である。
このうち紐付け識別情報531には、当該紐付けを一意に識別するための情報が格納さ
れる。また、データ分析ロジック識別情報532には、紐付けられる一方であるデータ分析ロジック422を識別するための情報が格納される。また、分析処理識別情報533には、紐付けられる他方である分析処理413を識別するための情報が格納される。また、重み534には、当該紐付けの重みを示す情報が格納される。例えば該紐付けによる組合せが分析者等のユーザにより多く使用される程、重みを表す数値は大きくなる。また、更新日時535には、上述の各データ項目531〜534のレコードが最後に更新された日時が格納される。なお1つデータ分析ロジック422に対して、複数の紐付けがありうるため、分析部品−分析処理紐付けテーブル503にて、当該1つのデータ分析ロジック422に関して複数のレコードが格納され得る。
また、図5Dに例示する分析処理−分析目的紐付けテーブル504は、分析処理302における実施された分析処理と分析目的414におけるKPIとの間の紐付けに関する情報を格納するテーブルである。その主な構成要素は、紐付け識別情報541、分析処理識別情報542、分析目的識別情報543、重み544、及び、更新日時545である。
このうち紐付け識別情報541には、当該紐付けを一意に識別するための情報が格納される。また、分析処理識別情報542には、紐付けられる一方である分析処理413を識別するための情報が格納される。また、分析目的識別情報543には、紐付けられる他方である分析目的414を識別するための情報が格納される。また、重み544には、当該紐付けの重みを示す情報が格納される。例えば該紐付けによる組合せが分析者等のユーザにより多く使用される程、重みを表す数値は大きくなる。また、更新日時545には、上述の各データ項目541〜544のレコードが最後に更新された日時が格納される。なお1つの分析処理413に対して、複数の紐付けがありえるため、分析処理−分析目的紐付けテーブル504において、当該1つの分析処理413に関して、複数のレコードが格納され得る。
また、図5Eに例示する分析目的−業務紐付けテーブル505は、分析目的414におけるKPIと業務システム415における業務及び設備等の対象との間の紐付けに関する情報を格納するテーブルである。その主な構成要素は、紐付け識別情報551、分析目的識別情報552、業務識別情報553、対象識別情報554、重み555、及び、更新日時556である。
このうち紐付け識別情報551には、当該紐付けを一意に識別するための情報が格納される。また、分析目的識別情報552には、紐付けられる一方である分析目的414を識別するための情報が格納される。また、業務識別情報553には、紐付けられる他方である業務4151を識別するための情報が格納される。また、対象識別情報554には、業務4151と合わせて紐付けられる対象4152を識別するための情報が格納される。また、重み555には、当該紐付けの重みを示す情報が格納される。例えば該紐付けによる組合せが分析者等のユーザにより多く使用される程、重みを表す数値は大きくなる。また、更新日時556には、上述の各データ項目551〜555のレコードが最後に更新された日時が格納される。なお1つの分析目的に対して、複数の紐付けがありうるため、分析目的−業務紐付けテーブル505において、上述の1つの分析目的に関して複数のレコードが格納され得る。
なお、本実施形態の分析関係テーブル307は、各データ分析ロジック422のメタ情報506、及び、各データ突合せロジック421のメタ情報507も格納している。
このうち、図6Aに例示するデータ分析ロジック422のメタ情報506には、当該データ分析ロジック422の入力となるデータに関する情報が格納される。その主な構成要素は、識別情報561、データ項目562、型563、及び、種別564である。
このうち識別情報561には、当該メタ情報506の各レコードを一意に識別するための情報が格納される。また、データ項目562には、当該データ項目に該当するデータの名称が格納される。ただし本項目の指定が無い場合もある。また、型563には、上述のデータ項目562に該当するデータのデータ型が格納される。また、種別564には、上述のデータ項目562に該当するデータの種別が格納される。
ここで種別564の値としては、“入力”、“キー”、等が想定され得る。このうち“入力”である場合、該当データ項目はデータ分析ロジックの入力データであることを示す。また、“キー”である場合、該当データ項目は、データ分析ロジックにおいて、複数データの突合せ、範囲指定、整列の軸となる共通インデックスであることを示す。
また、図6Bに例示するデータ突合せロジック421のメタ情報507には、当該データ突合せロジック421により提供されるデータに関する情報が格納される。その主な構成要素は、識別情報571、データ項目572、型573、サイズ574、及び、テーブル575である。
このうち識別情報571には、メタ情報507における各レコードを一意に識別するための情報が格納される。また、データ項目572には、当該データ項目572に該当するデータの名称が格納される。また、型573には、当該データ項目572に該当するデータのデータ型が格納される。また、サイズ574には、当該データ項目572に該当するデータのサイズが格納される。また、テーブル575には、当該データ項目572に該当するデータの抽出元のテーブルに関する情報が格納される。
図7Aは、本実施形態における分析対象データDB304の構成例を示す図である。本実施形態の分析対象データDB304は、業務システム30からデータ利活用基盤サーバ101にアップロードされた、或いは、適宜なユーザ等により記憶媒体経由で格納されたデータである。より具体的には、業務システム30で管理しているデータであって、例えば該当業務に使用されている車両や機器等のセンシングデータ等を想定出来る(勿論、これに限定せず、種々のデータを想定可能である)。
図7Aで例示する分析対象データDB304は、一例として、複数のテーブルから構成されている。これらのテーブルは、図6Bで示したメタ情報507(データ突合せロジックのもの)のテーブル575にて指定されるデータ抽出元のテーブルに対応する。また、各テーブルは、図示するように、例えば該当データを観測した日時、箇所、結果といった各値を含むレコードの集合体となっている
図7Bは、本実施形態における分析結果DB305の構成例を示す図である。本実施形態の分析結果DB305は、データ利活用基盤サーバ101が過去に提案した分析部品、或いはそれとは無関係に分析者201(或いは開発者202)が選定した分析部品、に基づき実際に実行した分析処理の内容を格納したDBである。具体的には、分析結果を一意に特定するIDをキーに、当該分析処理を構成する分析部品の、データ突合せロジック及びデータ分析ロジックの情報と、これらを用いて行った分析処理、その分析目的、業務、対象、結果(この場合、分析処理の実行結果として出力されるデータ値)といった値を含むレコードの集合体となっている。
図7Cは、本実施形態における実績情報DB306の構成例を示す図である。本実施形態の実績情報DB306は、実際に実行された分析処理の実績情報を格納するDBである。具体的には、分析処理を一意に特定する分析処理名をキーに、当該分析処理の実行頻度(例:直近一ヶ月での実行回数)、利用者数、定型登録数、及び、修正回数(例:当該分
析処理に関して分析者201や開発者202が修正を行った回数)、といった値を対応付けたレコードの集合体となっている。なお、上述の定型登録数とは、当該分析処理が高頻度で或いは広範に用いられるものと分析者等に認識され、定型の分析処理として設定された回数を示す。
−−−シーケンス例−−−
以下、本実施形態における分析ソフトウェア管理方法の実際手順について図に基づき説明する。以下で説明する分析ソフトウェア管理方法に対応する各種動作は、分析ソフトウェア管理システムたるデータ利活用基盤サーバ101が実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
図8は、本実施形態における分析ソフトウェア管理方法を実施する場合の処理シーケンスを示す図である。ここでは、既に図2にて示したユースケースを実行する場合の処理シーケンスについて示すものとする。
その主な構成要素は業務システム30、データ利活用基盤サーバ101にて稼働するデータ利活用ミドルウェア300に含まれるデータ管理部314、分析関係情報管理部308、分析処理実績管理部312、分析提案部309及び分析関係テーブル307とユーザ(分析者)201である。
このうち業務システム30にて、該業務システム30が有する業務データをデータ利活用基盤サーバ101に対して登録する(611)。この場合、データ利活用基盤サーバ101のデータ管理部314は、上述の業務システム30からの業務データの登録を受け付ける(621)。また、データ管理部314は、分析関係情報管理部308に対して、業務データ登録受付の通知を行う(622)。
一方、分析関係情報管理部308は、上述のデータ管理部314からの通知を受信すると、当該業務データから分析関係テーブル307を作成する(631)。
他方、ユーザ(分析者)201は、業務システムにおける問題を解決するために、分析を実施するとして、分析対象とするデータを指定する(661)。
この時、データ利活用基盤サーバ101の分析提案部309は、上述のユーザ(分析者)201からの分析対象データ指定を受け付けると、分析関係テーブル307を参照して(651)、当該分析対象データに対して利用可能な分析部品の組合せ候補を選出する(652)。また、分析提案部309は、選出した分析部品の組合せ候補をユーザ(分析者)201に対して提案する(653)。
ユーザ(分析者)201は、上述の分析提案部309から提案された分析部品の組合せ候補を閲覧し(662)、分析に利用する分析部品の組合せを決定する(663)。ユーザ201は、ここで提案された分析部品の組合せのいずれかを選択する、もしくは提案された分析部品の組合せの一部を変更することで、利用する分析部品を決定することとなる。また、ユーザは、上述にて決定した分析部品の組合せによる分析処理を実行する(664)。
一方、分析処理実績管理部312は、上述のユーザによる分析処理の実行を確認して、該分析処理実行に係る実績(分析部品の組合せ、処理実行の履歴、分析結果)を記録し(641)、分析関係情報管理部308に対して実績記録の通知を行う(642)。この場合、分析関係情報管理部308は、上述の分析処理実績管理部312からの通知を受信すると、当該実績から分析関係テーブルを更新する(632)。
−−−フロー例−−−
図9は、本実施形態における分析ソフトウェア管理方法のフロー例を示す図である。具体的には、データ利活用基盤サーバ101が、業務システム30から登録された所定データに基づき、分析関係テーブル307を生成するフローチャートである。
この場合、データ利活用基盤サーバ101は、業務システム30からのデータ登録を受け付ける(701)。ここで登録を受け付けるデータは、それぞれの業務システム30で保持する各種の業務データ、センシングデータ等である。
また、データ利活用基盤サーバ101は、上述のステップ701で得た登録データに対してデータ関係を生成する(702)。このデータ関係の生成処理は、既存技術を適宜に採用すればよいが、例えば、業務システム30を跨がって、値の観測箇所や時間帯、対象等の或る属性が1または複数共通するデータを対応付ける処理等を想定出来る
続いて、データ利活用基盤サーバ101は、上述のステップ702で生成したデータ関係に基づき、関係付けられた1つ以上のデータを分析対象データDB304より抽出するデータ突合せロジック及びメタ情報507を生成する(703)。
データ突合せロジックの生成は、上述のデータ関係が示す各分析対象データを、分析対象データDB304の該当テーブルから呼び出すためのSQL文を生成する処理が該当する。また、このSQL文の生成は、データ利活用基盤サーバ101が予め保持するSQL文の雛形に、呼び出し対象のテーブルとデータの識別情報等をセットするといった手法を採用すればよい。
また、メタ情報507の生成は、上述のデータ関係が示す各分析対象データの、文字列や数値といった型、サイズ、及び、格納先のテーブル名といった値を、それぞれの分析対象データから読み取り、これをメタ情報507としてテーブル化する処理となる。
また、データ利活用基盤サーバ101は、上述のステップ703で生成したデータ突合せロジックのメタ情報507を参照し(704)、分析対象データとデータ突合せロジックとの紐付けについて、分析対象データ紐付けテーブル501にレコードを追加する(705)。
続いて、データ利活用基盤サーバ101は、データ紐付けロジックのメタ情報507に記載される全てのデータに対して処理が終了しているか判定し、終了していないことが判明した場合(706:NO)、ステップ705、ステップ706の処理を繰り返す。
他方、ステップ706の判定において、データ紐付けロジックのメタ情報507に記載される全てのデータに対して処理が終了したことが判明した場合(706:YES)、データ利活用基盤サーバ101は、全てのデータ突合せロジックに対して処理が終了しているか判定する(707)。
この判定の結果、全てのデータ突合せロジックに対して処理が終了していることが判明した場合(707:NO)、データ利活用基盤サーバ101は、ステップ704〜706の処理を繰り返す。
他方、上述の判定の結果、全てのデータ突合せロジックに対して処理が終了していることが判明した場合(707:YES)、かつ、全てのデータ関係に対して処理が終了していないことが判明した場合(708:NO)、データ利活用基盤サーバ101は、ステップ703〜707の処理を繰り返す。
一方、上述のステップ708において、全てのデータ関係に対して処理が終了していることが判明した場合(708:YES)、データ利活用基盤サーバ101は、データ分析ロジックのメタ情報506を参照し(709)、また、データ突合せロジックのメタ情報507を参照する(710)。
次に、データ利活用基盤サーバ101は、上述のステップ709、710での参照の結果、データ分析ロジックのメタ情報506にデータ項目562の指定が無い場合(711:NO)、データ分析ロジックのメタ情報506とデータ突合せロジックのメタ情報507で型(563、573)の比較を行う(712)。
続いて、データ利活用基盤サーバ101は、上述のステップ712での比較の結果、データ突合せロジックのメタ情報507に、データ分析ロジックのメタ情報506におけるデータに合致するものが全て含まれることが判明した場合(713:YES)、データ突合せロジックとデータ分析ロジックの紐付けとして分析部品紐付けテーブル502にレコードを追加する(714)。
他方、上述のステップ711において、データ分析ロジックのメタ情報506にデータ項目562の指定が有ることが判明した場合(711:YES)、データ利活用基盤サーバ101は、データ分析ロジックのメタ情報506とデータ突合せロジックのメタ情報507とでデータ項目(562、572)の比較を行う(715)。
次に、データ利活用基盤サーバ101は、上述のステップ715での比較の結果、データ突合せロジックのメタ情報507にデータ分析ロジックのメタ情報506におけるデータに合致するものが全て含まれることが判明した場合(716:YES)、データ突合せロジックとデータ分析ロジックとの紐付けとして分析部品紐付けテーブル502にレコードを追加する(717)。
また、データ利活用基盤サーバ101は、上述のステップ717で紐付けたデータ突合せロジックのメタ情報507に、データ分析ロジックのメタ情報506にて種別564が“キー”であるデータに対応するデータが含まれるか判定する(718)。
この判定の結果、“キー”であるデータに対応するデータが含まれないことが判明した場合(718:NO)、データ利活用基盤サーバ101は、データ分析ロジックのメタ情報506にて種別564が“入力”であるデータからデータ関係を参照して、“キー”に該当するデータを検索する(719)。
また、データ利活用基盤サーバ101は、上述のステップ719で検索したデータとの紐付けとして、分析対象データ紐付けテーブル501にレコードを追加する(720)。
次に、データ利活用基盤サーバ101は、全てのデータ突合せロジックに対して処理が終了しているか判定する(721)。この判定の結果、全てのデータ突合せロジックに対して処理が終了していないことが判明した場合(721:NO)、データ利活用基盤サーバ101は、ステップ710〜720の処理を繰り返す。
他方、上述のステップ721において、全てのデータ突合せロジックに対して処理が終了していることが判明した場合(721:YES)、データ利活用基盤サーバ101は、全てのデータ分析ロジックに対して処理が終了しているか判定する(722)。
この判定の結果、全てのデータ分析ロジックに対して処理が終了していないことが判明した場合(722:NO)、データ利活用基盤サーバ101は、ステップ709〜721
の処理を繰り返す。他方、全てのデータ分析ロジックに対して処理が終了していることが判明した場合(722:YES)、データ利活用基盤サーバ101は、処理を終了する。
図10は、本実施形態における分析ソフトウェア管理方法のフロー例2を示す図である。具体的には、分析処理の実行実績に基づき分析関係テーブル307を更新する処理の流れを示すフローチャートである。
まず、データ利活用基盤サーバ101は、分析者201により実行された分析処理(分析部品の組合せ)に関する情報の、分析関係テーブル307への登録有無を確認する(801)。なお、分析者201により分析処理が実行されたこと自体は、例えば、分析結果DB305でのレコード登録イベントを通じて検知出来る。
続いて、データ利活用基盤サーバ101は、ステップ801の結果、分析関係テーブル307への分析処理の登録が確認された場合(802:YES)、該当分析処理(とこれを構成する分析部品、分析対象データ等)に関して、分析関係テーブル307の各テーブルにおいて互いに紐付いている各レコードの「重み」の情報を更新する(803)。この更新は、例えば、「重み」の値をインクリメントすることとなる。
他方、ステップ801の結果、分析関係テーブル307への分析処理の登録が確認出来なかった場合(802:NO)、データ利活用基盤サーバ101は、上述の実行した分析処理を構成する各々の分析部品、分析対象データの間の紐付けを、当該分析処理の情報に基づき確認する(804)。
次に、データ利活用基盤サーバ101は、上述の実行した分析処理の情報を、分析関係テーブル307へ新規登録する(805)。また、データ利活用基盤サーバ101は、上述の実行した分析処理に関する情報として、分析処理−分析目的紐付けテーブル504及び分析目的−業務紐付けテーブル505にレコードを追加する(806)。
また、データ利活用基盤サーバ101は、分析部品−分析処理紐付けテーブル503に該当する既存の紐付けレコードが有るか判定する(807)。この判定の結果、分析部品−分析処理紐付けテーブル503に該当する既存の紐付けレコードが有ることが判明した場合(807:YES)、データ利活用基盤サーバ101は、分析部品−分析処理紐付けテーブル503における該当レコードの重みの情報を更新する(808)。
続いて、データ利活用基盤サーバ101は、上述の807の判定の結果、分析部品−分析処理紐付けテーブル503に該当する既存の紐付けレコードが無いことが判明した場合(807:NO)、分析部品−分析処理紐付けテーブル503に、上述の実行した分析処理における紐付けに関するレコードを追加する(809)。
また、データ利活用基盤サーバ101は、分析部品紐付けテーブル502に、該当する既存の紐付けレコードが有るか判定する(810)。この判定の結果、分析部品紐付けテーブル502に、該当する既存の紐付けレコードが有ることが判明した場合(810:YES)、データ利活用基盤サーバ101は、分析部品紐付けテーブル502における該当レコードの重みの情報を更新する(811)。
他方、上述のステップ810での判定の結果、分析部品紐付けテーブル502に該当する既存の紐付けレコードが無いことが判明した場合(810:NO)、データ利活用基盤サーバ101は、分析部品紐付けテーブル502に、上述の実行した分析処理における紐付けに関するレコードを追加する(812)。
続いて、データ利活用基盤サーバ101は、分析対象データ紐付けテーブル501に、該当する既存の紐付けレコードが有るか判定する(813)。この判定の結果、分析対象データ紐付けテーブル501に、該当する既存の紐付けレコードが有ることが判明した場合(813:YES)、データ利活用基盤サーバ101は、分析対象データ紐付けテーブル501における該当レコードの重みの情報を更新する(814)。
他方、上述のステップ813の判定の結果、分析対象データ紐付けテーブル501に該当する既存の紐付けレコードが無いことが判明した場合(813:NO)、データ利活用基盤サーバ101は、分析対象データ紐付けテーブル501に、上述の実行した分析処理における紐付けに関するレコードを追加する(815)。
次に、データ利活用基盤サーバ101は上述の実行した分析処理の分析結果(分析処理の実行結果として出力されるデータ値。例えばKPIの値)を、上述の実行した分析処理との紐付けて、分析結果DB305に保存する(816、817)。
また、データ利活用基盤サーバ101は、上述の実行した分析処理に関して、実績情報DB06における実績情報を更新する(818)。具体的には、該当分析処理の、実行頻度、利用者数、定型登録数、修正回数といった値を更新することとなる。
図11は、本実施形態における分析ソフトウェア管理方法のフロー例3を示す図である。具体的には、データ利活用基盤サーバ101が分析関係テーブル307を参照して、ユーザ指定の分析対象データに対して分析を実行するために適切な分析部品の組合せを選出し提示するための処理の流れを示すフローチャートである。
この場合、データ利活用基盤サーバ101は、ユーザからの分析対象データの指定をユーザ端末20を介して受け付ける(901)。
また、データ利活用基盤サーバ101は、分析関係テーブル307を参照し(902)、上述のユーザ指定の分析対象データに紐付く分析部品(データ突合せ突合せロジック、データ分析ロジック)を抽出し(903)、分析部品組合せ候補を作成する(904)。この候補は、ステップ903で抽出できた分析部品のリストである。
続いて、データ利活用基盤サーバ101は、上述の分析部品組合せ候補それぞれについて、実績情報DB306での実績情報の蓄積があるか判定する(905)。
上述の判定の結果、実績情報の蓄積が無いことが判明した場合(905:NO)、データ利活用基盤サーバ101は、ステップ906から913までの処理を実施せず、ステップ914に処理を遷移させる。
他方、上述のステップ905において、実績情報DB306での実績情報の蓄積が有ることが判明した場合(905:YES)、データ利活用基盤サーバ101は、上述で作成した分析部品組合せ候補に類似する、実績情報の蓄積が実績情報DB306にある既存の分析処理を抽出する(906)。なお、本処理の詳細は図12にて後述する。
続いて、データ利活用基盤サーバ101は、ステップ906で抽出した類似処理の分析結果を、分析結果DB305から抽出する(907)。この分析結果は関連する情報としてユーザに提示するためのものである。
次に、データ利活用基盤サーバ101は、実績情報DB306を参照して、上述の類似処理の実行頻度を算出する(908)。また、データ利活用基盤サーバ101は、実績情報DB306を参照して、上述の類似処理の利用者数を算出する(909)。
また、データ利活用基盤サーバ101は、実績情報DB306を参照して、上述の類似処理の定型業務としての登録数を算出する(910)。
また、データ利活用基盤サーバ101は、実績情報DB306を参照して、上述の類似処理の修正回数を算出する(911)。また、データ利活用基盤サーバ101は、分析関係テーブル307を参照して、上述の類似処理の類似処理数を算出する(912)。
続いて、データ利活用基盤サーバ101は、上述のステップ907から912の結果を用いて、当該分析部品組合せの有用度を判定する(913)。ここでは、上述のステップ908〜912の各結果に重み付け加算による点数算出等を行う。
また、データ利活用基盤サーバ101は、全ての分析部品組合せ候補に対して処理が終了しているか判定する(914)。この判定の結果、全ての分析部品組合せ候補に対して処理が終了していないことが判明した場合(914:NO)、データ利活用基盤サーバ101は、ステップ906〜913の処理を繰り返す。
他方、上述の判定の結果、全ての分析部品組合せ候補に対して処理が終了していることが判明した場合(914:YES)、データ利活用基盤サーバ101は、処理の結果として、分析部品組合せ候補、有用度判定結果及び類似処理の分析結果を、ユーザ端末20に出力し(915)、当該ユーザに対して提示する。
図12は、本実施形態における分析ソフトウェア管理方法のフロー例4を示す図である。具体的には、データ利活用基盤サーバ101が、ユーザ指定の分析対象データに対して分析を実行するための、適切な分析部品の組合せを選出する際に、類似の既存分析処理を選出するフローチャートである。
この場合、データ利活用基盤サーバ101は、分析関係テーブル307を参照して、図11のフローにて選出した、指定された分析対象データに対する分析部品の組合せ候補と、分析処理の実績として蓄積されている既存の分析部品組合せとの比較を行う(1001)。 次に、データ利活用基盤サーバ101は、上述の分析部品組合せ候補と既存分析部品組合せとで入力データ項目が一致するか判定する(1002)。
この判定の結果、上述の分析部品組合せ候補と既存分析部品組合せとで入力データ項目が一致しないことが判明した場合(1002:NO)、データ利活用基盤サーバ101は、当該組合せ同士は類似しないと判定し(1009)、処理をステップ1010に遷移させる。
他方、上述の判定の結果、上述の分析部品組合せ候補と既存分析部品組合せとで入力データ項目が一致することが判明した場合(1002:YES)、データ利活用基盤サーバ101は、分析部品組合せ候補と既存分析部品組合せとで構成する分析部品の種別が一致する数が、指定された閾値以上か判定する(1003)。
上述の判定の結果、分析部品の種別が一致する数が、指定された閾値以上ではないことが判明した場合(1003:NO)、データ利活用基盤サーバ101は、当該組合せ同士は類似しないと判定し(1009)、処理をステップ1010に遷移させる。
他方、上述の判定の結果、分析部品の種別が一致する数が、指定された閾値以上であることが判明した場合(1003:YES)、データ利活用基盤サーバ101は、当該分析部品組合せ候補と既存分析部品組合せとで構成する分析部品の実行順序が一致するか判定する(1004)。
上述の判定の結果、分析部品の実行順序が一致しないことが判明した場合(1004:NO)、データ利活用基盤サーバ101は、当該組合せ同士は類似しないと判定し(1009)、処理をステップ10101に遷移させる。
他方、上述の判定の結果、分析部品の実行順序が一致することが判明した場合(1004:YES)、データ利活用基盤サーバ101は、分析関係情報としてKPI、業務、対象の情報が有るか判定する(1005)。
この判定の結果、KPI、業務、対象の情報が無いことが判明した場合(1005:NO)、データ利活用基盤サーバ101は、当該組合せ同士は一部分のみが類似する準類似であると判定し(1008)、処理をステップ1010に遷移させる。
他方、上述の判定の結果、KPI、業務、対象の情報があることが判明した場合(1005:YES)、データ利活用基盤サーバ101は、当該分析部品組合せ候補と既存分析部品組合せとでKPI、業務、対象が一致する数が、指定された閾値以上か判定する(1006)。
上述の判定の結果、KPI、業務、対象が一致する数が、指定された閾値以上ではないことが判明した場合(1006:NO)、データ利活用基盤サーバ101は、当該組合せ同士は一部分のみが類似する準類似であると判定し(1008)、処理をステップ10101に遷移させる。
他方、上述の判定の結果、KPI、業務、対象が一致する数が、指定された閾値以上であることが判明した場合(1006:YES)、データ利活用基盤サーバ101は、当該組合せ同士は類似であると判定し(1007)、処理をステップ1010に遷移させる。
次に、データ利活用基盤サーバ101は、全ての分析部品組合せ候補及び既存分析部品組合せに対して比較が終了しているか判定する(1010)。この判定の結果、全ての分析部品組合せ候補及び既存分析部品組合せに対して比較が終了していないことが判明した場合(1010:NO)、データ利活用基盤サーバ101は、上述のステップ1001から1009までの処理を繰り返す。
他方、上述の判定の結果、全ての分析部品組合せ候補及び既存分析部品組合せに対して比較が終了していることが判明した場合(1010:YES)、データ利活用基盤サーバ101は処理を終了する。
図13は、本実施形態における出力画面の例である。具体的には、上述のステップ915でユーザ端末20を介してユーザに対して提供する、分析対象データ(ユーザが選択したもの)に対する分析の実行に適切な分析部品の組合せ候補の確認画面の例である。
図13で例示する画面1101には、例えば、ユーザが指定する分析対象データを表示する、分析対象データ欄1111と、候補表示欄1112とを含んでいる。
このうち、候補表示欄1112は、ユーザ指定の分析対象データに対して分析処理の候補となる、データ突合せロジック及びデータ分析ロジックの組合せ、及び該組合せに関連付けられる分析処理、分析目的、業務、対象と、該組合せの有用度、関連分析結果(図7Bの分析結果DB305における該当レコードのID)を一覧表示する。なお該当する情報が無い場合は空白箇所を含めて表示する。
以上、本発明を実施するための最良の形態等について具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
こうした本実施形態によれば、データ分析等のデータ利活用を行うアプリケーションに対してデータ提供を行うシステムにて、当該システムの導入時点、運用開始時点からも、分析処理の作成向けに再利用可能な部品の提案が可能となる。これにより、例えば複数業務システムからのデータを分析するための分析アプリケーションの作成や準備の作業高速化を図りことが可能となり、データ分析処理をはじめとするデータ利活用の実施に要するコストを低減できる。
すなわち、データ分析の実施履歴の多寡に係わらず分析部品の提案を可能とし、ひいては、データ分析用ソフトウェア作成の効率化やコスト低減を図ることが可能となる。
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記分析関係情報を生成する処理において、各分析対象データの属性に基づく分析対象データの間における関係性に応じて複数の分析対象データを関係付け、当該複数の分析対象データを分析に際して抽出するデータ突合せロジックを、前記分析部品の1つとして所定アルゴリズムで生成するものである、としてもよい。
これによれば、様々な業務システム等から得られたデータ類について、適宜な属性に基づきグルーピングし、これを効率的に分析に供することが可能となる。
また、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記分析関係情報を生成する処理において、前記データ突合せロジックと、前記分析部品の1つであって前記データ突合せロジックが抽出する分析対象データに対して分析処理を実行するデータ分析ロジックとを、前記データ突合せロジック及び前記データ分析ロジックの各々の取扱いデータに関するメタ情報を比較することで紐付けするものである、としてもよい。
これによれば、分析部品を構成するデータ突合せロジックとデータ分析ロジックとを、それぞれで取り扱うデータ項目等の適合に基づき精度良く紐付け、効率的な分析部品の提案が可能となる。
また、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記分析部品による分析処理の実績情報に基づき、前記分析関係情報を更新する処理を更に実行するものである、としてもよい。
これによれば、ユーザに提示した分析部品のうち、実際にユーザが選択して利用したものに関して、その有用度を認める情報を管理可能となり、ひいては、その後の分析部品の組合せの特定精度をより適宜なものできる。
また、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記分析関係情報を更新するに際し、前記分析処理と、当該分析処理の目的、当該目的に対応した業務、及び、当該業務の対象、の少なくともいずれかの情報とを紐付けるものである、としてもよい。
これによれば、ユーザに提示した分析部品のうち、実際にユーザが選択して利用したものに関して、その目的、業務、業務の対象、といった具体的状況を踏まえた有用度を認める情報を管理可能となり、ひいては、その後の分析部品の組合せの特定精度を更に適宜なものとできる。
また、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記分析部品の組合せを特定する処理において、分析部品による分析処理の実績情報を有している場合、当該実績情報にも基づいて分析部品の組合せを特定するものである、としてもよい。
これによれば、分析部品の組合せの特定精度をより適宜なものできる。
また、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記特定した分析部品の組合せに類似する分析処理を、分析部品による分析処理の実績情報に基づいて特定し、当該類似の分析処理に関する所定事象の発生頻度の実績値に基づき、当該特定した分析部品の組み合わせの有用度を判定する処理を更に実行するものである、としてもよい。
これによれば、ユーザに提示した分析部品のうち、実際にユーザが選択して利用した事象等、当該分析部品の有用度を認めうる事象の発生頻度に基づき、分析部品の組合せの特定精度を更に適宜なものできる。
また、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記特定した分析部品の組合せに関する情報を、前記分析対象として指定された所定データの分析に適切な分析部品の組合せ候補の情報として、所定装置に出力する処理を更に実行するものである、としてもよい。
これによれば、ユーザに対して、分析対象データの分析に好適な分析部品の情報を提示することが可能となる。
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前記分析関係情報を生成する処理において、各分析対象データの属性に基づく分析対象データの間における関係性に応じて複数の分析対象データを関係付け、当該複数の分析対象データを分析に際して抽出するデータ突合せロジックを、前記分析部品の1つとして所定アルゴリズムで生成する、としてもよい。
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前記分析関係情報を生成する処理において、前記データ突合せロジックと、前記分析部品の1つであって前記データ突合せロジックが抽出する分析対象データに対して分析処理を実行するデータ分析ロジックとを、前記データ突合せロジック及び前記データ分析ロジックの各々の取扱いデータに関するメタ情報を比較することで紐付けする、としてもよい。
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前記分析部品による分析処理の実績情報に基づき、前記分析関係情報を更新する処理を更に実行する、としてもよい。
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前記分析関係情報を更新するに際し、前記分析処理と、当該分析処理の目的、当該目的に対応した業務、及び、当該業務の対象、の少なくともいずれかの情報とを紐付ける、としてもよい。
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前記分析部品の組合せを特定する処理において、分析部品による分析処理の実績情報を有している場合、当該実績情報にも基づいて分析部品の組合せを特定する、としてもよい。
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前
記特定した分析部品の組合せに類似する分析処理を、分析部品による分析処理の実績情報に基づいて特定し、当該類似の分析処理に関する所定事象の発生頻度の実績値に基づき、当該特定した分析部品の組み合わせの有用度を判定する処理を更に実行する、としてもよい。
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前記特定した分析部品の組合せに関する情報を、前記分析対象として指定された所定データの分析に適切な分析部品の組合せ候補の情報として、所定装置に出力する処理を更に実行する、としてもよい。
10、11 ネットワーク
20 ユーザ端末
30 業務システム
101 データ利活用基盤サーバ(分析ソフトウェア管理システム)
111、121 記憶装置
112、122 演算装置
113、123 通信装置
300 データ利活用ミドルウェア
301 分析実行管理部
302 分析処理
303 分析部品
304 分析対象データDB
305 分析結果DB
306 実績情報DB
307 分析関係テーブル
308 分析関係情報管理部
309 分析提案部
310 ユーザ・業務管理部
311 クライアント向けI/F提供部
312 分析処理実績管理部
313 分析部品管理部
314 データ管理部
315 データ通信部
401 分析関係情報
421 データ突合せロジック
422 データ分析ロジック
501 分析対象データ紐付けテーブル
502 分析部品紐付けテーブル
503 分析部品−分析処理紐付けテーブル
504 分析処理−分析目的紐付けテーブル
505 分析目的−業務紐付けテーブル
506 データ分析ロジックのメタ情報
507 データ突合せロジックのメタ情報

Claims (14)

  1. 複数の所定システムから収集された分析対象データを格納する記憶装置と、
    前記記憶装置に格納した前記分析対象データの間における関係性について、前記複数の所定システムを跨がって値の属性が共通する分析対象データ同士を対応付けるデータ関係の情報として特定し、前記データ関係の情報が示す各分析対象データを前記記憶装置での格納先から呼び出すためのSQL文をデータ突合せロジックとして生成し、前記各分析対象データと当該各分析対象データを分析に際して抽出する分析部品である前記データ突合せロジックとの紐付けについて前記記憶装置に格納し、分析関係情報を生成する処理と、前記分析関係情報に基づき、ユーザにより分析対象として指定された所定データに対して、利用可能な分析部品の組合せを特定する処理と、を実行する演算装置と、
    を備える分析ソフトウェア管理システム。
  2. 前記演算装置は、
    前記分析関係情報を生成する処理において、前記データ突合せロジックと、前記分析部品の1つであって前記データ突合せロジックが抽出する分析対象データに対して分析処理を実行するデータ分析ロジックとを、前記データ突合せロジック及び前記データ分析ロジックの各々の取扱いデータに関するメタ情報を比較することで紐付けするものである、
    ことを特徴とする請求項に記載の分析ソフトウェア管理システム。
  3. 前記演算装置は、
    前記分析部品による分析処理の実績情報に基づき、前記分析関係情報を更新する処理を更に実行するものである、
    ことを特徴とする請求項1に記載の分析ソフトウェア管理システム。
  4. 前記演算装置は、
    前記分析関係情報を更新するに際し、前記分析処理と、当該分析処理の目的、当該目的に対応した業務、及び、当該業務の対象、の少なくともいずれかの情報とを紐付けるものである、
    ことを特徴とする請求項に記載の分析ソフトウェア管理システム。
  5. 前記演算装置は、
    前記分析部品の組合せを特定する処理において、分析部品による分析処理の実績情報を有している場合、当該実績情報にも基づいて分析部品の組合せを特定するものである、
    ことを特徴とする請求項1に記載の分析ソフトウェア管理システム。
  6. 前記演算装置は、
    前記特定した分析部品の組合せに類似する分析処理を、分析部品による分析処理の実績情報に基づいて特定し、当該類似の分析処理に関する所定事象の発生頻度の実績値に基づき、当該特定した分析部品の組み合わせの有用度を判定する処理を更に実行するものである、
    ことを特徴とする請求項1に記載の分析ソフトウェア管理システム。
  7. 前記演算装置は、
    前記特定した分析部品の組合せに関する情報を、前記分析対象として指定された所定データの分析に適切な分析部品の組合せ候補の情報として、所定装置に出力する処理を更に実行するものである、
    ことを特徴とする請求項1に記載の分析ソフトウェア管理システム。
  8. 情報処理システムが、
    複数の所定システムから収集された分析対象データを格納する記憶装置を備えて、
    前記記憶装置に格納した前記分析対象データの間における関係性について、前記複数の所定システムを跨がって値の属性が共通する分析対象データ同士を対応付けるデータ関係の情報として特定し、前記データ関係の情報が示す各分析対象データを前記記憶装置での格納先から呼び出すためのSQL文をデータ突合せロジックとして生成し、前記各分析対象データと当該各分析対象データを分析に際して抽出する分析部品である前記データ突合せロジックとの紐付けについて前記記憶装置に格納し、分析関係情報を生成する処理と、前記分析関係情報に基づき、ユーザにより分析対象として指定された所定データに対して、利用可能な分析部品の組合せを特定する処理と、
    を実行することを特徴とする分析ソフトウェア管理方法。
  9. 前記情報処理システムが、
    前記分析関係情報を生成する処理において、前記データ突合せロジックと、前記分析部品の1つであって前記データ突合せロジックが抽出する分析対象データに対して分析処理を実行するデータ分析ロジックとを、前記データ突合せロジック及び前記データ分析ロジックの各々の取扱いデータに関するメタ情報を比較することで紐付けする、
    ことを特徴とする請求項8に記載の分析ソフトウェア管理方法。
  10. 前記情報処理システムが、
    前記分析部品による分析処理の実績情報に基づき、前記分析関係情報を更新する処理を更に実行する、
    ことを特徴とする請求項8に記載の分析ソフトウェア管理方法。
  11. 前記情報処理システムが、
    前記分析関係情報を更新するに際し、前記分析処理と、当該分析処理の目的、当該目的に対応した業務、及び、当該業務の対象、の少なくともいずれかの情報とを紐付ける、
    ことを特徴とする請求項10に記載の分析ソフトウェア管理方法。
  12. 前記情報処理システムが、
    前記分析部品の組合せを特定する処理において、分析部品による分析処理の実績情報を有している場合、当該実績情報にも基づいて分析部品の組合せを特定する、
    ことを特徴とする請求項8に記載の分析ソフトウェア管理方法。
  13. 前記情報処理システムが、
    前記特定した分析部品の組合せに類似する分析処理を、分析部品による分析処理の実績情報に基づいて特定し、当該類似の分析処理に関する所定事象の発生頻度の実績値に基づき、当該特定した分析部品の組み合わせの有用度を判定する処理を更に実行する、
    ことを特徴とする請求項8に記載の分析ソフトウェア管理方法。
  14. 前記情報処理システムが、
    前記特定した分析部品の組合せに関する情報を、前記分析対象として指定された所定データの分析に適切な分析部品の組合せ候補の情報として、所定装置に出力する処理を更に実行する、
    ことを特徴とする請求項8に記載の分析ソフトウェア管理方法。
JP2017038953A 2017-03-02 2017-03-02 分析ソフトウェア管理システム及び分析ソフトウェア管理方法 Active JP6784612B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2017038953A JP6784612B2 (ja) 2017-03-02 2017-03-02 分析ソフトウェア管理システム及び分析ソフトウェア管理方法
KR1020197004404A KR102213627B1 (ko) 2017-03-02 2017-11-29 분석 소프트웨어 관리 시스템 및 분석 소프트웨어 관리 방법
PCT/JP2017/042813 WO2018159042A1 (ja) 2017-03-02 2017-11-29 分析ソフトウェア管理システム及び分析ソフトウェア管理方法
US16/331,573 US11016758B2 (en) 2017-03-02 2017-11-29 Analysis software managing system and analysis software managing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017038953A JP6784612B2 (ja) 2017-03-02 2017-03-02 分析ソフトウェア管理システム及び分析ソフトウェア管理方法

Publications (2)

Publication Number Publication Date
JP2018147061A JP2018147061A (ja) 2018-09-20
JP6784612B2 true JP6784612B2 (ja) 2020-11-11

Family

ID=63370689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017038953A Active JP6784612B2 (ja) 2017-03-02 2017-03-02 分析ソフトウェア管理システム及び分析ソフトウェア管理方法

Country Status (4)

Country Link
US (1) US11016758B2 (ja)
JP (1) JP6784612B2 (ja)
KR (1) KR102213627B1 (ja)
WO (1) WO2018159042A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6784612B2 (ja) * 2017-03-02 2020-11-11 株式会社日立製作所 分析ソフトウェア管理システム及び分析ソフトウェア管理方法
JP7164333B2 (ja) * 2018-06-27 2022-11-01 株式会社日立製作所 個人情報分析システム
JP6827490B2 (ja) * 2019-04-04 2021-02-10 三菱電機株式会社 データ分析装置、データ分析方法及びデータ分析プログラム
JP7173315B2 (ja) * 2019-05-21 2022-11-16 日本電信電話株式会社 分析装置、分析システム、分析方法及びプログラム
US20220230193A1 (en) * 2019-06-11 2022-07-21 Sony Group Corporation Information processing apparatus, information processing method, and program
JP7247060B2 (ja) * 2019-09-02 2023-03-28 株式会社日立製作所 データの利活用のためのデータ準備を支援するシステム、及び、その方法
CN116820759B (zh) * 2023-06-19 2024-01-30 兴容(上海)信息技术股份有限公司 一种基于边缘节点的管理系统及方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7853508B2 (en) * 2003-05-19 2010-12-14 Serena Software, Inc. Method and system for object-oriented management of multi-dimensional data
US7333866B2 (en) * 2004-07-28 2008-02-19 Gregory John Knight Computer implemented management domain and method
WO2007083371A1 (ja) * 2006-01-18 2007-07-26 Fujitsu Limited データ統合装置、方法、プログラムを記録した記録媒体
US10042927B2 (en) * 2006-04-24 2018-08-07 Yeildbot Inc. Interest keyword identification
KR20090062270A (ko) * 2007-12-12 2009-06-17 (주)광개토연구소 출원인 명의 단위의 자동 분석 지원 특허 정보 시스템
KR100989453B1 (ko) * 2008-12-11 2010-10-26 주식회사 퓨전소프트 새로운 에스큐엘 함수와 연산자를 재귀적 질의에 사용하여 관계 데이터로부터 재귀적 구조의 엑스엠엘을 생성하는 방법과 컴퓨터 시스템, 그리고 그 방법을 구현한 프로그램을 기록한 컴퓨터-가독형 기록 매체
JP5359389B2 (ja) * 2009-03-06 2013-12-04 大日本印刷株式会社 データ分析支援装置、データ分析支援システム、及びプログラム
JP5216662B2 (ja) 2009-03-31 2013-06-19 株式会社富士通マーケティング 分析支援処理装置およびそのプログラム
JP5601066B2 (ja) * 2010-07-23 2014-10-08 富士通株式会社 情報統合プログラム、装置及び方法
US8762433B1 (en) * 2010-10-18 2014-06-24 Lockheed Martin Corporation Integration architecture for software and hardware development
US8930303B2 (en) * 2012-03-30 2015-01-06 International Business Machines Corporation Discovering pivot type relationships between database objects
JP6003637B2 (ja) * 2012-12-28 2016-10-05 富士通株式会社 情報処理装置、ノード抽出プログラムおよびノード抽出方法
US20160004757A1 (en) * 2013-10-04 2016-01-07 Hitachi, Ltd. Data management method, data management device and storage medium
JP6229512B2 (ja) * 2014-01-27 2017-11-15 富士通株式会社 情報処理プログラム、情報処理方法及び情報処理装置
JP2016029516A (ja) 2014-07-25 2016-03-03 株式会社日立製作所 データ分析方法、及びデータ分析システム
CN107851097B (zh) * 2015-03-31 2021-10-01 株式会社Fronteo 数据分析系统、数据分析方法、数据分析程序及存储介质
JP6784612B2 (ja) * 2017-03-02 2020-11-11 株式会社日立製作所 分析ソフトウェア管理システム及び分析ソフトウェア管理方法

Also Published As

Publication number Publication date
US20190213002A1 (en) 2019-07-11
WO2018159042A1 (ja) 2018-09-07
KR102213627B1 (ko) 2021-02-08
JP2018147061A (ja) 2018-09-20
US11016758B2 (en) 2021-05-25
KR20190029671A (ko) 2019-03-20

Similar Documents

Publication Publication Date Title
JP6784612B2 (ja) 分析ソフトウェア管理システム及び分析ソフトウェア管理方法
US11409764B2 (en) System for data management in a large scale data repository
US11461294B2 (en) System for importing data into a data repository
US20180157724A1 (en) Designating Fields in Machine Data Using Templates
US8671084B2 (en) Updating a data warehouse schema based on changes in an observation model
JP5919825B2 (ja) データ処理方法、分散処理システムおよびプログラム
CN111026433A (zh) 基于代码变更历史的软件代码质量问题自动修复方法、系统及介质
US9158599B2 (en) Programming framework for applications
US20210073655A1 (en) Rule mining for rule and logic statement development
Abbad Andaloussi et al. Toward an automated labeling of event log attributes
JP2004030221A (ja) 変更対象テーブル自動検出方法
Rozsnyai et al. Business process insight: An approach and platform for the discovery and analysis of end-to-end business processes
US20140136155A1 (en) Analyzing hardware designs based on component re-use
JP6244274B2 (ja) 相関ルール分析装置および相関ルール分析方法
Schobel et al. A predictive approach enabling process execution recommendations
Sarno et al. Workflow common fragments extraction based on WSDL similarity and graph dependency
US20210397745A1 (en) Data providing server device and data providing method
KR102432126B1 (ko) 데이터 이활용에 관한 데이터 준비 방법 및 데이터 이활용 시스템
JP6336922B2 (ja) 業務バリエーションに基づく業務影響箇所抽出方法および業務影響箇所抽出装置
JPWO2019012674A1 (ja) プログラムの統合解析管理装置及びその統合解析管理方法
US11294961B2 (en) Information search apparatus, search program, database update method, database update apparatus and database update program, for searching a specified search target item associated with specified relation item
JP6852002B2 (ja) データ検索方法、データ検索装置及びプログラム
JP2007316853A (ja) プロジェクトの管理方法及びシステム
JP2021140640A (ja) 検索システム及び検索方法
Xiao et al. A graphical query language for querying Petri nets

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201013

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201023

R150 Certificate of patent or registration of utility model

Ref document number: 6784612

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150