JP7453076B2 - 生成装置、生成方法、および生成プログラム - Google Patents

生成装置、生成方法、および生成プログラム Download PDF

Info

Publication number
JP7453076B2
JP7453076B2 JP2020115828A JP2020115828A JP7453076B2 JP 7453076 B2 JP7453076 B2 JP 7453076B2 JP 2020115828 A JP2020115828 A JP 2020115828A JP 2020115828 A JP2020115828 A JP 2020115828A JP 7453076 B2 JP7453076 B2 JP 7453076B2
Authority
JP
Japan
Prior art keywords
factor
feature
visualization
visualization element
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020115828A
Other languages
English (en)
Other versions
JP2022013338A5 (ja
JP2022013338A (ja
Inventor
泰穂 山下
琢磨 柴原
純一 桑田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2020115828A priority Critical patent/JP7453076B2/ja
Priority to US17/363,157 priority patent/US11907871B2/en
Publication of JP2022013338A publication Critical patent/JP2022013338A/ja
Publication of JP2022013338A5 publication Critical patent/JP2022013338A5/ja
Application granted granted Critical
Publication of JP7453076B2 publication Critical patent/JP7453076B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • G06F16/90328Query formulation using system suggestions using search space presentation or visualization, e.g. category or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2323Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Discrete Mathematics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、データを生成する生成装置、生成方法、および生成プログラムに関する。
時系列データ解析の目的は、時点ごとに特徴量セットの値が記された時系列データから、各時点各特徴量の間の関係性を見出してモデル化し、そのモデルを用いて未来予測を行い、さらに、モデルを解析することによって各時点各特徴量の間の関係性を理解することにある。
時系列データ解析の用途は、時系列な医療データから人々の未来の健康状態を予測する、時系列な市場データから金融商品の未来の市場価値を予測する、または、時系列な生化学データから細胞の状態がどう変化するか予測するなど多岐にわたる。
たとえば、時系列な医療データから将来患者が回復するか否かを予測するモデルを作成する場合、予測モデルを作成して未来予測を行うだけでなく、患者が回復するに至るシナリオを明らかにし、シナリオを視覚化した過程グラフを生成することが求められる。
シナリオとは、複数の特徴量がどのような順番で、どのように相互に作用して患者の回復するまたは回復しないに寄与するのか、そのとき各特徴量がどの時点にどのような値の場合に患者の回復を左右するのかを示す過程である。
下記特許文献1は、イベントストリームデータから決定グラフを生成する方法を開示する。この方法において、イベントストリームデータは複数のイベントを含み、各イベントは関連するタイムスタンプを含み、グラフの決定ノードを生成することを含み、決定ノードはそれぞれ、時間的要素を有する設問を含む。また、この方法は、それぞれレートパラメータを含むグラフのリーフノードを生成し、結果として生じるノードの結果の純度の測定値を最大化するためにグラフのノードを繰り返し分割およびマージする。
下記特許文献2は、時系列データより得られたモデルから未来予測に至る過程グラフを生成する手法として、各時刻における特徴量間の関係性と、その時間発展をグラフ化する手法を開示する。
米国特許公開2013-6915号公報 中国特許公開110059131号公報
特許文献1の手法では、有限個のノードからなる決定グラフでシナリオを表現するため、分岐の数を有限個に制限する必要がある。そのためには、各ノードに設定された設問において、特徴量になんらかの閾値を設定して離散化することが要請される。離散化にはなんらかの仮定を導入する必要がある。また、離散化によって元々は連続値として保持されていたデータの情報を簡略化してしまう。したがって、可能であれば連続値のままで特徴量を扱うことが望ましい。
特許文献2の手法によるグラフは、各時刻の特徴量間の関係性がどのように時間変化していくかでシナリオを表現するが、異なる時刻の間で各特徴量がどのように関連するかを直接表現しない。たとえば、当初は小さい影響度しかないが、プロセスを辿ると、大きな悪循環サイクルの入り口だったりするような因子を見逃してしまう可能性がある。また、このグラフは、特徴量がどのような値で未来予測を左右するかについての情報を表現していない。
本発明は上記に鑑みてなされたものであって、異なる時点の因子間の関係を連続的な特徴量を用いて提示することを目的とする。
本願において開示される発明の一側面となる生成装置は、プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する生成装置であって、前記プロセッサは、時系列に存在する複数の異なる因子の特徴量を含む時系列データに基づいて、前記因子ごとの特徴量の連続的な範囲である特徴量範囲を規定する特徴量範囲視覚化要素を生成し、前記複数の異なる因子のうち時間的に連続する第1因子の第1特徴量と第2因子の第2特徴量との関連性を規定する特徴量間視覚化要素を生成する視覚化要素生成処理と、前記視覚化要素生成処理によって生成された因子ごとの前記特徴量範囲視覚化要素のうち前記第1因子の第1特徴量範囲視覚化要素と前記第2因子の第2特徴量範囲視覚化要素との間に、前記特徴量間視覚化要素を関連付けることにより、前記複数の異なる因子に関する前記特徴量の関係性を示す視覚化情報を生成する視覚化情報生成処理と、を実行することを特徴とする。
本発明の代表的な実施の形態によれば、異なる時点の因子間の関係を連続的な特徴量を用いて提示することができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
図1は、実施例1にかかる、異なる時点の因子間の関係性を表すシナリオを図形化した過程グラフである。 図2は、実施例1にかかる、シナリオでの因子の特徴量の関係性を表す線グラフである。 図3は、生成システムのシステム構成例を示すブロック図である。 図4は、生成装置に入力される時系列データの一例を示す説明図である。 図5は、生成装置によって生成される関連度テーブルの一例を示す説明図である。 図6は、生成装置によって生成される接続タイプテーブル群の一例を示す説明図である。 図7は、生成装置の詳細な機能的構成例を示すブロック図である。 図8は、生成装置によるグラフ生成処理手順例を示すフローチャートである。 図9は、実施例1にかかるニューラルネットワークの構造例を示す説明図である。 図10は、線グラフの他の例を示す説明図である。 図11は、過程グラフの短縮例を示す説明図である。
実施例1では、ある地方自治体の高齢者において、2018年度の保健サービスデータを用いて、2019年度に要介護化するか否かを予測する予測モデルを作成し、その予測モデルから予測に至る過程グラフを生成する生成装置を例として説明する。生成装置が出力するグラフは、どのようなシナリオを通じて高齢者が要介護化するまたはしないのかを自治体が把握することを可能とし、要介護化を防ぐ手立てを講じるための大きな手掛かりとなる。このことは、自治体の保健サービスの質の向上や、国の医療・保健費の削減、国民の健康増進につながる。
<過程グラフ>
図1は、実施例1にかかる、異なる時点の因子間の関係性を表すシナリオを図形化した過程グラフである。過程グラフ100は、生成装置により生成される視覚化情報の一つであり、1以上のシナリオ(図1では例として、4本のシナリオSC1~SC4。シナリオSC1~SC4,…を区別しない場合は、単にシナリオSCと表記)と、シナリオSCに従った場合の正解ラベルCと、を含む。因子F(F1~F11,…の総称)とは、被験者に生じる結果(正解ラベルC)を引き起こす要素である。
シナリオSCは、時点が異なる複数の因子Fを示す矩形の図形の間を、関連度を示す黒線のリンクL(L12、L23、…の総称)で接続した図形データとして表現される。このような図形データを因子視覚化要素と称す。視覚化要素とは、画面に描画されることでユーザが視認可能な図形データや描画した領域の色である。因子Fを示す矩形の図形データは図1の左端(最古)から右端(最新)に向かって時系列に配列される。リンクLは、その太さにより両端の因子Fの関連度の大きさを示す。すなわち、リンクLの太さは、その関連度の値が高いほど太くなる。このような関連度の大きさを示すリンクLを関連度視覚化要素と称す。
たとえば、シナリオSC1は、因子F1(筋力低下)~F3(低栄養)が時系列順に配列されている図形データである。リンクL12は、因子F1と因子F2(外出頻度低下)とを接続し、その関連度は0.4である。リンクL23は、因子F2と因子F3とを接続し、その関連度は0.7である。
同様に、シナリオSC2は、因子F4(転倒経験)~F6(歩行速度低下)が時系列順に配列されている図形データである。リンクL45は、因子F4と因子F5(転倒不安<欠損>)とを接続し、その関連度は0.4である。リンクL56は、因子F5と因子F6とを接続し、その関連度は0.9である。
同様に、シナリオSC3は、因子F7(残存歯数減少)~F9(嚥下力低下)が時系列順に配列されている図形データである。リンクL78は、因子F7と因子F8(咀嚼力低下)とを接続し、その関連度は0.5である。リンクL89は、因子F8と因子F9とを接続し、その関連度は0.6である。
同様に、シナリオSC4は、因子F10(抑うつ状態)、F2、F11(会話量低下)が時系列順に配列されている図形データである。リンクL102は、因子F10と因子F2とを接続し、その関連度は0.3である。リンクL211は、因子F2と因子F11とを接続し、その関連度は0.3である。なお、図1では、リンクLの太さで関連度の大きさを表現したが、太さではなくリンクLの色(たとえば、色の濃淡)で関連度の大きさを表現してもよい。
正解ラベルCは、シナリオSCをたどった場合に該当する結果を示す。図1では、例として「要支援1」とする。要支援状態とは、たとえば、介護保険法第7条第2項によれば、身体上若しくは精神上の障害があるために入浴、排せつ、食事等の日常生活における基本的な動作の全部若しくは一部について厚生労働省令で定める期間にわたり継続して常時介護を要する状態の軽減若しくは悪化の防止に特に資する支援を要すると見込まれ、又は身体上若しくは精神上の障害があるために厚生労働省令で定める期間にわたり継続して日常生活を営むのに支障があると見込まれる状態をいう。
「要支援1」とは、要支援状態に該当し、かつ、日常生活上の基本的動作については、ほぼ自分で行うことが可能であるが、家事など生活する上で必要な活動に社会的支援が必要な状態である。なお、「要支援2」は、要支援状態に該当し、かつ、立ち上がりや歩行などの身体的な動作で不安で、要支援1よりも何らかの支援が必要な状態である。また、社会的支援がなくとも生活ができる状態を「自立」という。したがって、正解ラベルCには、3種類の値が存在するが、ここでは、正解ラベルが「要支援1」になるシナリオSC1~SC4を示している。
このような正解ラベルCを示す図形データを、結果視覚化要素と称す。なお、生成装置は、所定のしきい値(たとえば、0.3)以下の関連度を示すリンクLを削除または非表示にしてもよい。
<線グラフ>
図2は、実施例1にかかる、シナリオSCでの因子Fの特徴量の関係性を表す線グラフである。線グラフ200は、過程グラフ100の中から選ばれたいずれか1つのシナリオSCでの因子Fの特徴量の関係性を表する視覚化情報の一つである。図2では、例としてシナリオSC1での因子Fの特徴量の関係性を表す線グラフ200を示す。
線グラフ200は、シナリオSC1の因子F1~F3および正解ラベルCに関する特徴量の範囲(値域)を示す時点t1~t4(t1<t2<t3<t4)における縦軸A1~V3,VC(縦軸A1~A3,ACを区別しない場合は単に縦軸Aと表記)を、因子F1(筋力低下)~F3(低栄養)の時系列順(縦軸ACは右端)に配列した線グラフ200である。
縦軸A1は、時点t1(=2018年4月)での因子F1(筋力低下)に関する特徴量である「筋力低下度」の範囲を示す軸である。縦軸A2は、時点t2(=2018年7月)での因子F2(外出頻度低下)に関する特徴量である「外出頻度スコア」の範囲を示す軸である。縦軸A3は、時点t3(=2018年10月)での因子F3(低栄養)に関する特徴量である「栄養スコア」の範囲を示す軸である。縦軸ACは、時点t4(=2019年4月)での正解ラベルである要支援1となる確率の範囲を示す軸である。
なお、縦軸A1~A3のように、因子Fごとの特徴量の連続的な範囲(値域)である特徴量範囲を規定する数値軸を、特徴量範囲視覚化要素と称す。また、縦軸ACのように、予測値(要支援1となる確率)の連続的な範囲(値域)である予測値範囲を規定する数値軸を、予測値範囲視覚化要素と称す。連続的な範囲とは、特徴量の最下位桁の値が連続する範囲(値域)である。
隣接する縦軸A間には、線分が表示されている。線分は直線でも曲線でもよい。各線分は、隣接する一方の因子F(ここでは、Faとする)の縦軸A(ここでは、Aaとする)と、一方の因子Faに後続する他方の因子F(ここでは、Fbとする)の縦軸A(ここでは、Abとする)と、を結ぶ。線分の両端の一方は、縦軸Aaの因子Faの特徴量を示し、他方は、縦軸Abの因子Fbの特徴量を示す。たとえば、線分201は、ある被験者の時点t1での筋力低下度0.78と時点t2での外出頻度スコア「middle」とを示す。線分202は、ある被験者の時点t2での外出頻度スコア「low」と時点t3での栄養スコア「100」とを示す。線分203は、ある被験者の時点t3での栄養スコア「300」と時点t4での要支援1となる確率「0.1」とを示す。
なお、線分201,202のように、時間的に連続する因子Faの特徴量と因子Fbの特徴量との関連性を規定する線分を、特徴量間視覚化要素と称す。また、線分203のように、因子Fbよりも後に出現する因子Fc(たとえば、因子F3)の特徴量と要支援1となる確率との関連性を規定する線分を、特徴量予測値間視覚化要素と称す。
< システム構成例>
図3は、生成システムのシステム構成例を示すブロック図である。図3では、サーバ-クライアント型の生成システム3を例に挙げて説明するが、スタンドアロン型でもよい。(A)は、生成システム3のハードウェア構成例を示すブロック図であり、(B)は、生成システム3の機能的構成例を示すブロック図である。(A)および(B)において同一構成には同一符号を付す。
生成システム3は、クライアント端末300とサーバである生成装置320とがネットワーク310で通信可能に接続される構成である。
(A)において、クライアント端末300は、補助記憶装置であるHDD(hard disk drive)301、主記憶装置であるメモリ302、プロセッサ303、キーボードやマウスである入力装置304、モニタ325を有する。生成装置320は、補助記憶装置であるHDD321、主記憶装置であるメモリ322、プロセッサ323、キーボードやマウスである入力装置324、モニタ325を有する。なお、主記憶装置、補助記憶装置、および、図示しない可搬型の記憶媒体を総称して、記憶デバイスと称す。記憶デバイスは、図9で後述するニューラルネットワーク900およびこれらの学習パラメータ365を記憶する。
(B)において、クライアント端末300は、クライアントデータベース(DB)351を有する。クライアントDB351は、HDD301やメモリ302などの記憶デバイスとして実現される。クライアントDB351には、テストデータ集合352と、予測結果353と、が格納される。テストデータ集合352は、テストデータの集合である。予測結果353は、予測部362からネットワーク310経由で得られたデータである。なお、サーバ-クライアント型の場合、クライアント端末300は1台以上存在する。
生成装置320は、学習部361と、予測部362と、サーバデータベース(DB)363と、を有する。学習部361は、ニューラルネットワーク900を用いて、学習パラメータ365を出力する機能部である。
予測部362は、学習パラメータ365を用いて、ニューラルネットワーク900を構築し、ニューラルネットワーク900にテストデータが与えられることで、予測処理を実行し、予測結果353をクライアント端末300に出力する機能部である。学習部361および予測部362は、HDD321、メモリ322などの記憶デバイスに記憶されたプログラムをプロセッサ323に実行させることによりその機能を実現する。
サーバDB363は、訓練データ集合364と、学習パラメータ365と、を格納する。サーバDB363は、HDD321やメモリ322などの記憶デバイスとして実現される。なお、生成装置320は複数台で構成されてもよい。たとえば、負荷分散のため、生成装置320が複数存在してもよい。また、生成装置320は、機能ごとに複数台で構成されてもよい。
<時系列データ>
図4は、生成装置320に入力される時系列データの一例を示す説明図である。時系列データ400は、訓練データ集合364またはテストデータ集合352として、記憶デバイスに格納されている。時系列データ400は、フィールドとして、たとえば、ID401と、正解ラベル402と、因子群403と、時点404と、を含む。同一行の各フィールドの値の組み合わせであるエントリをサンプルと称す。
ID401は、被験者を一意に特定する識別情報である。ID401の値が同じであれば、同一被験者である。ID401の値が同じでもエントリ(行)が異なれば、同一被験者の異なるサンプルとなる。
正解ラベル402は、多値のいずれかの値であり、サンプルの正解を示す。たとえば、ID401が要支援状態か否かの対象となる被験者集団の場合、各サンプルにおける正解ラベル402の値である正解ラベルC=0が「自立」、C=1が「要支援1」、C=2が「要支援2」を示す。
因子群403は、2以上の因子F1,F2,F3,…,Fx(xは1以上の整数)の集合である。各サンプルの因子F1,F2,F3,…,Fxの値は、その因子F1,F2,F3,…,Fxの特徴量を示す。
時点404は、そのサンプルが得られた時間軸上の一点または時間間隔を示す。時点404の単位は、年、月、週、日、時、分、秒のいずれでもよい。図4では、例として、「2018/10」のように、月単位(日以下は省略)とした。図4の時系列データ400は、ID401の値が1~N(Nは1以上の整数)の被験者集団について、時点404が「2018/4」、「2018/7」、「2018/10」の3回にわたって検査した結果を示す。
<関連度テーブル>
図5は、生成装置320によって生成される関連度テーブルの一例を示す説明図である。関連度テーブル500は、時系列データ400が生成装置320に入力されることにより生成される中間データであり、異なる時点404での同一または異なる因子F間の関連度を示す。関連度テーブル500は、記憶デバイスに格納される。
関連度テーブル500は、フィールドとして、たとえば、第1因子501と、第1時点502と、第2因子503と、第2時点504と、関連度505と、を含む。同一行の各フィールドの値の組み合わせであるエントリは、たとえば、図1に示したリンクLおよびリンクLの両端の因子Fに対応する。
第1因子501は、因子群403内の因子Fである。第1時点502は、第1因子501の特徴量が取得された時点404である。第2因子503は、因子群403内の因子Fである。第2因子503は、第1因子501と同一因子Fでもよく異なる因子Fでもよい。
第2時点504は、第2因子503の特徴量が取得された時点404である。第2時点504は、第1時点502と異なる時点404である。第1因子501および第2因子503の組み合わせは、生成装置320によって、たとえば、総当たりで選択される。
関連度505は、第1因子501と第2因子503との関連性の高さ(共起の強さ)を示す指標値である。本例では、関連度505の値が大きいほど関連性が高いことを示し、リンクLが太くなる。関連度505は、生成装置320によって算出される。
<接続タイプテーブル>
図6は、生成装置320によって生成される接続タイプテーブル群の一例を示す説明図である。接続タイプテーブル群600は、複数の接続タイプテーブル601-1,601-2、601-3、…(これらを区別しない場合は、単に接続タイプテーブル601と表記)の集合である。
接続タイプテーブル601は、接続タイプを格納するテーブルである。接続タイプテーブル601は、ID401と、接続タイプ610と、を格納する。接続タイプ610とは、ID401ごとの、上述した因子Faの特徴量(以下、第1特徴量)611と、上述した因子Fbの特徴量(以下、第2特徴量)612と、の組み合わせである。
接続タイプテーブルごとに、因子Faと因子Fbとの組み合わせは異なる。接続タイプ610は、図2に示した縦軸A間の線分に対応する。接続タイプテーブル601は、生成装置320によって、時系列データ400から生成される。
<生成装置320の詳細な機能的構成例>
図7は、生成装置320の詳細な機能的構成例を示すブロック図である。生成装置320は、解析部701と、構造データ生成部702と、視覚化要素生成部703と、グラフ生成部704と、を有する。解析部701、構造データ生成部702、視覚化要素生成部703、およびグラフ生成部704は、具体的には、たとえば、図3に示したメモリ322のような記憶デバイスに記憶された生成プログラムをプロセッサ323に実行させることにより実現される。
解析部701は、時系列データ400内の因子の関連性を解析する。具体的には、たとえば、解析部701は、時系列データ400から、関連度テーブル500と、接続タイプテーブル群600と、を生成する。解析部701は、図3に示した学習部361と予測部362とを含む。
具体的には、たとえば、解析部701は、学習部361により、訓練データ集合364である時系列データ400を入力して予測モデルを生成する。また、解析部701は、予測部362により、訓練データ集合364である時系列データ400を予測モデルに入力して予測結果を出力するとともに、関連度テーブル500と、接続タイプテーブル群600と、を生成する。
構造データ生成部702は、解析部701の解析結果から構造データを生成する。具体的には、たとえば、構造データ生成部702は、関連度テーブル500のサンプル群を第1構造データに変換し、接続タイプテーブル群600に含まれる複数の接続タイプを第2構造データに変換する。第1構造データおよび第2構造データの詳細については後述する。
視覚化要素生成部703は、構造データ生成部702によって変換された第1構造データから、図1に示した過程グラフ100を構成する過程グラフ視覚化要素を生成し、構造データ生成部702によって変換された第2構造データから、図2に示した線グラフ200を構成する線グラフ視覚化要素を生成する。
過程グラフ視覚化要素は、過程グラフ100における時点t1~t3ごとの各因子Fの図形データ(因子Fの取得時点および名称含む)と、因子Fの図形データ間のリンクL(関連度含む)と、正解ラベルC(要支援1)の図形データ(正解ラベルの名称「要支援1」含む)と、を含む。
線グラフ視覚化要素は、線グラフ200における縦軸A(縦軸Aの目盛、因子Fの特徴量の名称、特徴量の取得時点tを含む)と、縦軸A間の線分201,202,203,…と、を含む。
グラフ生成部704は、視覚化要素生成部703によって生成された過程グラフ視覚化要素を用いて過程グラフ100を生成し、視覚化要素生成部703によって生成された線グラフ視覚化要素を用いて線グラフ200をシナリオSCごとに生成し、それぞれ記憶デバイスに格納する。グラフ生成部704は、過程グラフ100内のシナリオSCと線グラフ200とを関連付ける。
これにより、ユーザは、入力装置304,324を操作して、過程グラフ100からあるシナリオSCを選択すると、生成装置320は、選択したシナリオSCに関連付けられた線グラフ200を記憶デバイスから読み出して、モニタ325に表示したり、ネットワーク310を介してクライアント端末300に表示可能に送信したりする。
これにより、生成装置320は、時系列データ400の分析において、予測される未来に至るシナリオSCを表す過程グラフ100および線グラフ200を、その因子Fの特徴量の値を連続値として取り扱ったまま生成することができる。
<グラフ生成処理手順>
図8は、生成装置320によるグラフ生成処理手順例を示すフローチャートである。生成装置320は、記憶デバイスから訓練データ集合364としての時系列データ400を読み込む(ステップS801)。時系列データ400は、因子Fの特徴量を示す時系列な特徴量ベクトルx(n)(t)と、予測すべき未来の値である正解ラベルCを記述する目的変数Y(n)と、の組み合わせ{x(n)(t),y(n)}によりサンプルを構成するデータである。
n={1,…,N}は被験者を指定するためのインデックスであり、たとえば、N=30,000とする。また、t={1,…,T}は時点を表すインデックスである。たとえば、T=3とし、各時点t=1(図1、図2のt1),2(図1、図2のt2),3(図1、図2のt3)はそれぞれ、2018年4月、2018年7月、2019年10月を示す。
特徴量ベクトルx(n)(t)∈RはD(≧1)次元の実数値ベクトルであり、たとえば、被験者nの筋力や栄養状態などの身体情報、服薬や病歴などの医療情報、外出頻度や会話量などの情報を含む。
目的変数Y(n)は、正解ラベルC=0,1,2のいずれかのクラス値をとる。ここでは、時点t1=2018年4月時点で要介護認定を受けていない被験者集団において、Y(n)=0は、時点t4=2018年4月時点で要介護度「要支援1」および「要支援2」のいずれにも認定されていない被験者nを意味し、Y(n)=1は、時点t4で要介護度「要支援1」に認定された被験者nを意味し、Y(n)=2は、時点t4で要介護度「要支援2」に認定された被験者nを意味する。すなわち、時点t1から時点t4までの1年間で被験者nの要介護度がどのように変化したかを示す。
つぎに、生成装置320は、解析部701により、関連度と接続タイプとを算出する(ステップS802)。具体的には、たとえば、解析部701は、特徴量ベクトルx(n)(t)を用いて、以下に示すディープラーニングによる予測モデルを生成し、生成した予測モデルにテストデータ集合352としての特徴量ベクトルx(n)(t)を入力することにより、目的変数Y(n)=1(要支援1)となる確率p(n)を出力する。
この予測モデルは、本来ブラックボックスであるディープラーニングモデルにおいて、ホワイトボックス性を高めた予測モデルである。ここで、解析部701(学習部361および予測部362)が用いるニューラルネットワークの構造例および予測モデルの生成例について説明する。
[ニューラルネットワークの構造例]
図9は、実施例1にかかるニューラルネットワークの構造例を示す説明図である。以下では、説明の単純化するため、サンプルを指定するインデックス(n)を省略する場合がある。ニューラルネットワーク900は、時系列データ向けニューロン群902と、トランスフォームユニット群903と、リアロケーションユニット904と、ディシジョンユニット905と、インポータンスユニット906と、を有する。また、入力データとなる特徴量ベクトルx(1)~x(T)の集合を入力ユニット901として図示した。
時系列データ向けニューロン群902は、T個の時系列データ向けニューロン902(1)~902(T)の集合である。学習部361による学習時では、時系列データ向けニューロン902(t)は、訓練データ集合364としての特徴量ベクトルx(t)の入力を受け付ける。そして、時系列データ向けニューロン902(t)は、下記式(1)に示すように、特徴量ベクトルx(t)と内部状態パラメータc(t-1)とに基づいて、内部ベクトルh(t)および内部状態パラメータc(t)を算出する。
Figure 0007453076000001
右辺のRNN関数は、特徴量ベクトルx(t)とともに、取得時点(t-1)以前の時系列データ向けニューロン902(t-1)に入力された特徴量ベクトルx(0)~x(t-1)から集約された特徴量を再帰的に入力して、内部ベクトルh(t)および内部状態パラメータc(t)を算出する関数である。RNN関数は、重みとなる学習パラメータRWsを保持する。
学習パラメータRWsは、取得時点t毎の時系列データ向けニューロン902(t)に存在する学習パラメータRWの集合である。学習部361による学習時において、学習パラメータRWsの初期値はランダムに決定される。学習パラメータRWsは、学習部361による学習時において、特徴量ベクトルx(t)が時系列データ向けニューロン902(t)に入力される都度更新される。学習パラメータRWsは、後述する下記式(6)で最適化される。
内部ベクトルh(t)∈RD´(RD´はD´次元の実数。D´は1以上の整数。)は、特徴量ベクトルx(t)で特定される情報に、取得時点tよりも1取得時点前の取得時点(t-1)における内部状態パラメータc(t-1)∈RD´´(RD´´はD´´次元の実数。D´´は1以上の整数。)を反映した情報である。ただし、内部状態パラメータc(0)は、ゼロや乱数で初期化された値である。内部ベクトルh(t)は、後段のトランスフォームユニット群903に出力される。
一方、内部状態パラメータc(t)は、次の取得時点(t+1)の時系列データ向けニューロン902(t+1)に出力される。ただし、時系列データ向けニューロン902(T)は、内部状態パラメータc(T)を出力しない。内部状態パラメータc(t)は、取得時点tよりも1取得時点前の取得時点(t-1)以前の特徴量ベクトルx(1)~x(t-1)までの因子Fの特徴量がRNN関数により集約されたパラメータ(ベクトル)である。内部状態パラメータc(t)は、暗号化されたキャッシュ情報のように人間には理解不能なベクトルである。
なお、時系列データ向けニューロン902(t)におけるRNN関数の演算は、LSTM(long short‐term memory)、GRU(Gated Recurrent Unit)、CNN(convolutional neural Network)などの時系列データを扱うことのできる時系列ニューラルネットワークの演算を用いることができる。また、それらの時系列ニューラルネットワークを多層化して用いた構成をとることもできる。また、時系列データ向けニューロン902(t)の種類と層数、および内部ベクトルh(t)の次元数D´は、ユーザ操作で自由に設定可能である。
また、予測部362による予測時においても、時系列データ向けニューロン902(t)は、学習部361による学習時と同様に実行可能である。なお、以降において、予測部362による予測時に用いる各情報には、学習部361による学習時と区別するために、たとえば、特徴量ベクトルx´(t)のように、「´」を付す。ただし、テストデータである特徴量ベクトルx´(t)は、訓練データである特徴量ベクトルx(t)と同一の特徴量ベクトルでもよく、異なる特徴量ベクトルでもよい。予測部362による予測時では、時系列データ向けニューロン902(1)~902(T)はそれぞれ、テストデータ集合352としての特徴量ベクトルx´(1)~x´(T)の入力を受け付ける。
そして、時系列データ向けニューロン902(t)は、特徴量ベクトルx´(t)と、内部状態パラメータc´(t-1)と、学習部361による学習時に得られた学習パラメータRWsとを、RNN関数に与えて、上記式(1)により、内部ベクトルh´(t)および内部状態パラメータc´(t)を算出する。内部ベクトルh´(t)は、後段のトランスフォームユニット群903に出力される。
トランスフォームユニット群903は、T個のトランスフォームユニット903(1)~903(T)の集合である。学習部361による学習時においては、トランスフォームユニット903(t)は、下記式(2)により、内部ベクトルh(t)の入力を受け付けて、トランスフォームベクトルv(t)を算出する。トランスフォームベクトルv(t)は、後段のリアロケーションユニット904に出力される。
Figure 0007453076000002
上記式(2)では、アインシュタインの縮約記法を用いた。たとえば、Zα=Xα β・Yβにおいて、Xはα行β列の行列であり、Yはβ行の行列であり、Zはα行1列の行列(ベクトル)であることを示す。以降、演算を説明する際の式では、アインシュタインの縮約記法を用いる。また、α、βを省略する場合もある。
W∈RD×D´(RD×D´はD×D´次元の実数。)は学習パラメータ365の一つであり、取得時点t毎に存在する。学習部361による学習時において、学習パラメータWの初期値はランダムに決定される。学習パラメータWは、学習部361による学習時において、内部ベクトルh(t)がトランスフォームユニット903(t)に入力される都度更新される。トランスフォームベクトルv(t)は、取得時点tの特徴量空間に存在する特徴量ベクトルx(t)の位置を、その目的変数Yの値を区別しやすい位置に変換するためのベクトルである。
また、予測部362による予測時においても、トランスフォームユニット903(t)は、学習部361による学習時と同様に実行可能である。トランスフォームユニット903(1)~903(T)はそれぞれ、内部ベクトルh´(1)~h´(T)の入力を受け付ける。そして、トランスフォームユニット903(t)は、内部ベクトルh´(t)と、後述する下記式(9)で最適化された学習パラメータWとを、上記式(5)に与えて、トランスフォームベクトルv´(t)を算出する。トランスフォームベクトルv´(t)は、後段のリアロケーションユニット904に出力される。
リアロケーションユニット904は、訓練データ集合364である特徴量ベクトル群(x(1)(1)~x(N)(T))をその特徴量空間において再配置する。リアロケーションユニット904の演算を説明するために、2つの時系列ベクトルu(t=1,…,T)とv(t=1,…,T)との間のアダマール積の計算方法を下記式(3)により定義する。
Figure 0007453076000003
学習部361による学習時においては、リアロケーションユニット904は、下記式(4)により、特徴量ベクトルx(1)~x(T)とトランスフォームベクトルv(1)~v(T)との入力を受け付けて、リアロケーションベクトルR∈Rを算出する。リアロケーションベクトルRは、後段のディシジョンユニット905と、インポータンスユニット906と、に出力される。なお、右辺のr(t)は、取得時点tでのリアロケーションベクトルであり、トランスフォームベクトルv(t)と特徴量ベクトルx(t)とのアダマール積である。リアロケーションベクトルRは、リアロケーションベクトルr(1)~r(T)の平均値である。
Figure 0007453076000004
また、予測部362による予測時においても、リアロケーションユニット904は、学習部361による学習時と同様に実行可能である。予測部362による予測時では、リアロケーションユニット904は、特徴量ベクトルx´(1)~x´(T)とトランスフォームベクトルv´(t)~v´(t)との入力を受け付ける。そして、リアロケーションユニット904は、特徴量ベクトルx´(1)~x´(T)とトランスフォームベクトルv´(t)~v´(t)とを、上記式(4)に与えて、リアロケーションベクトルR´∈Rを算出する。リアロケーションベクトルR´は、後段のディシジョンユニット905と、インポータンスユニット906と、に出力される。
ディシジョンユニット905は、学習部361による学習時においては、下記式(5)により、目的変数Y(n)に対応する予測値y(n)を算出する。
Figure 0007453076000005
上記式(5)において、σはシグモイド関数、w∈Rは学習パラメータ、予測値y(n)は、要支援1になる目的変数Y(n)の確率値である。学習部361による学習時において、学習パラメータwの初期値はランダムに決定される。学習パラメータwは、学習部361による学習時において、リアロケーションベクトルRがリアロケーションユニット904に入力される都度更新される。なお、本実施例の自立、要支援1、要支援2のように、3以上のクラスの識別タスクを解く場合には、シグモイド関数σの代わりにsoftmax関数が適用される。
また、学習部361は、統計的勾配法を用いて、目的変数Y(n)と予測値y(n)とを、下記式(6)に与え、そのクロスエントロピーが最小化するように、学習パラメータ365である{RWs,W,w}を計算する。これにより、{RWs,W,w}が最適化される。学習部361は、最適化された{RWs,W,w}をサーバDB363に格納する。最適化された{RWs,W,w}をニューラルネットワーク900に適用すると予測モデルとなる。
Figure 0007453076000006
インポータンスユニット906は、予測部362による予測時において、重要度ベクトルξを算出する。インポータンスユニット906の演算を説明するために、ベクトルwと時系列ベクトルu(t=1,…,T)との間のアダマール積の計算方法を下記式(7)により定義する。
Figure 0007453076000007
インポータンスユニット906は、最適化された学習パラメータwとトランスフォームベクトルv´(t)の入力を受け付けて、上記式(7)を反映した下記式(8)により、特徴量ベクトルx´の重要度ベクトルξ(t)(x´)を算出する。重要度ベクトルξ(t)(x´)の各要素が、ある取得時点tにおいて、テストデータ集合352(特徴量ベクトルx´(1)~x´(T))内のn番の被験者における要支援1の予測に寄与した重要度を表す。予測部362は、重要度ベクトルξ(t)(x´)を予測結果353としてクライアントDB351に保存する。予測部362は、下記式(8)により、取得時点tごとにロジスティックリグレッションを実行する。
上記式(8)において、トランスフォームベクトルv´(t)は、上記式(2)のように、最適化された学習パラメータWと内部ベクトルh´(t)との内積により算出される。内部ベクトルh´(t)は、上記式(1)のように、最適化された学習パラメータRWsが適用されたRNN関数に、特徴量ベクトルx´(t)と1取得時点前の内部状態パラメータc(t-1)とを与えることにより得られる。
すなわち、RNN関数は、特徴量ベクトルx´(t)とともに、取得時点(t-1)以前の時系列データ向けニューロン902(t-1)に入力された特徴量ベクトルx´(0)~x´(t-1)から集約された特徴量を再帰的に入力して、内部ベクトルh´(t)および内部状態パラメータc´(t)を算出する。
ディシジョンユニット905は、予測部362による予測時において、上記式(8)で求めた重要度ベクトルξ(t)(x´)を用いて、下記式(9)により、特徴量ベクトルx´についての未知の予測値y´(n)を算出する。
Figure 0007453076000009
上記式(9)には、最適化された学習パラメータwとトランスフォームベクトルv´(t)とのアダマール積により算出された重要度ベクトルξ(t)(x´)が用いられている。したがって、ディシジョンユニット905は、上記式(9)に、テストデータ集合352である特徴量ベクトルx´(1)~x´(T)を与えることにより、最適化された学習パラメータ365{RWs,W,w}が反映されたニューラルネットワーク900により、特徴量ベクトルx´(1)~x´(T)についての未知の予測値y´(n)を算出する。
上記式(9)において、重要度ベクトルξ(t)(x´(n))は、特徴量ベクトルx´(n)(t)を識別する局所平面のパラメータに対応する。解析部701は、たとえば、予測値y´(n)を、重要度ベクトルξ(t)(x´(n))と関連付けて、予測結果353としてクライアントDB351に保存する。
解析部701は、下記式(10)または下記式(11)により、特徴量ベクトル群をその特徴量空間において再配置したリアロケーションベクトルrを用いて、第1時点502(時点t)における第1因子501の特徴量ベクトルx´(t)と第2時点504(時点t´)における第2因子503の特徴量ベクトルx´(t´)との間の関連度の大きさΓ(x´(t),x´(t´))を算出する。
Figure 0007453076000010
上記式(10),(11)の右辺は、カッコ内のデータ列の標本相関係数を表す。右辺のリアロケーションベクトルr1,(t)は、第1時点502(時点t)における第1因子501の特徴量ベクトルx´(t)に対応し、リアロケーションベクトルr2,(t´)は、第2時点504(時点t´)における第2因子503の特徴量ベクトルx´(t´)に対応する。
つぎに、解析部701による接続タイプの設定について説明する。接続タイプは、テストデータ集合352としての時系列データ400における、第1時点502(時点t)における第1因子501の特徴量ベクトルx´(t)と、第2時点504(時点t´)における第2因子503の特徴量ベクトルx´(t´)との組{x´(t),x´(t´)}によって表される。
なお、接続タイプ{x´(t),x´(t´)}の代わりに、リアロケーションベクトルの組{r´(t),r´(t´)}を用いてもよく、重み付きリアロケーションベクトルの組{w´(t),w´(t´)}または重要度ベクトルで重みづけされた特徴量ベクトルの組(下記式(12)を参照)を用いてもよい。
Figure 0007453076000011
リアロケーションベクトルの組{r1´(t),r2´(t´)}を用いることにより、予測モデルが考えた時系列データの性質(予測モデルが何を表したいか)を適用して、予測結果を得ることができる。また、重み付きリアロケーションベクトルの組{w´(t),w´(t´)}または重要度ベクトルで重みづけされた特徴量ベクトルの組(上記式(12)を参照)を用いることにより、予測モデルが考えた時系列データの性質をより重要視して、予測結果を得ることができる。
つぎに、図8において、生成装置320は、構造データ生成部702により、関連度と接続タイプ{x´(t),x´(t´)}とをそれぞれ第1構造データおよび第2構造データに変換する(ステップS803)。具体的には、たとえば、構造データ生成部702は、上記式(10)の関連度の大きさΓ(x´(t),x´(t´))を、1つの(T×D)行(T×D)列の第1構造データに変換する。
第1構造データの各行は、各時点tの各因子Fの特徴量を表し、各列も同様に各時点tの各因子Fの特徴量を表す。第1構造データの行列の各要素には、対応する行の時点tの因子Fの特徴量と対応する列の時点tの因子Fの特徴量との間の関連度の値が格納される。
また、構造データ生成部702は、接続タイプ{x´(t),x´(t´)}を、T×D個のN行2列の第2構造データ群に変換する。第2構造データ群の各第2構造データの各行は、各サンプルを表し、2つの列はそれぞれある時点tのある因子Fa,Fbの特徴量(第1特徴量611、第2特徴量612)である。
第2構造データの行列の要素には、対応する行のサンプルがもつ、対応する列の時点tの因子Fの特徴量が格納される。この第2構造データを全時点t=1,…,Tの全因子の特徴量の中から選んだ第1特徴量611、第2特徴量612の全組み合わせが第2構造データ群となる。
生成装置320は、第1構造データと第2構造データ群とを記憶デバイスに保存する。生成装置320は、第1構造データと第2構造データ群とを、モニタ325に表示してもよく、ネットワーク310を介してクライアント端末300に表示可能に送信してもよい。
つぎに、生成装置320は、視覚化要素生成部703により、第1構造データおよび第2構造データから第1可視化要素および第2可視化要素を生成する(ステップS804)。視覚化要素生成部703は、第1構造データの行列の各要素について、図1に示したように、その要素の行に対応する時点tの因子Fと列に対応する時点tの因子Fとを表す箱型の視覚化要素を生成し、それらの因子F間の関連度の大きさを示す黒線を、過程グラフ視覚化要素として生成する。
また、視覚化要素生成部703は、第2構造データ群の各第2構造データから、各第2構造データの列を構成する2つの特徴量(第1特徴量611、第2特徴量612)に対し、当該2つの特徴量を特徴づける接続タイプ{x´(t),x´(t´)}の値域を表現する二本の縦軸Aと、当該2つの特徴量の接続タイプ{x1(t ,x2(t´)}を示す線分群(線分201,202,203,…)とを、線グラフ視覚化要素として生成する。このとき、視覚化要素生成部703は、全サンプルについて、各サンプルに対して1つの接続タイプを示す線分を生成する。線分は、対応するサンプルの接続タイプ{x´(t),x´(t´)}の値の二本の縦軸A上の点を両端とする。
つぎに、生成装置320は、グラフ生成部704により、ステップS804で生成した過程グラフ視覚化要素を用いて過程グラフ100を生成し、ステップS804で生成した線グラフ視覚化要素を用いて線グラフ200を生成する(ステップS805)。
過程グラフ100を生成することにより、全因子Fまたは一部の因子Fの中で、どの因子Fがどの因子Fと関連することによって要介護化につながるかを可視化することができる。また、ユーザは、過程グラフ100を見ることにより、要介護化につながる様々なシナリオを把握することが可能となる。
線グラフ200は、図2に示したように、各時点tの因子Fa,Fbの特徴量(第1特徴量611、第2特徴量612)とその値域とを示す縦軸Aと、各時点tの因子F間の接続タイプを示す線分群とを含む。なお、線グラフ200の生成において、線分群のグレースケールを変化させる代わりに、他の因子や目的変数または基準に基づいて線分群のグレースケール、色または太さや形状を変化させてもよい。
このように、線グラフ200を生成することにより、ある一連の因子FからなるシナリオSCの中で、各因子Fがどのような特徴量をたどるときに要介護化につながるか、またはつながらないかを可視化することができる。生成装置320は、過程グラフ100および線グラフ200を記憶デバイスに保存する。さらに、生成装置320は、過程グラフ100および線グラフ200をモニタ325に表示してもよく、ネットワーク310を介してクライアント端末300に表示可能に送信してもよい。
なお、実施例1では、ニューラルネットワーク900の予測モデルを適用したが、リアロケーションベクトルr(n)(t)を用いない場合は、LSTM、GRU、CNNなどの時系列データ400を扱うことのできるニューラルネットワークで得られる予測モデルでもよい。この場合、第1時点502(時点t)における第1因子501の特徴量ベクトルx´(t)と第2時点504(時点t´)における第2因子503の特徴量ベクトルx´(t´)との間の関連度の大きさは、第1因子501の特徴量ベクトルx´(t)と第2因子503の特徴量ベクトルx´(t´)との相関係数でもよい。
このように、実施例1によれば、因子Fの特徴量を連続値として取り扱ったままで予測される未来に至るシナリオSCを表す過程グラフ100および線グラフ200を生成することができる。また、生成装置320は、連続値のままラベル付けした縦軸A1~A3、ACを使用する代わりに、離散化された数値でラベル付けされた縦軸を使用して線グラフ200を生成してもよい。
図10は、線グラフの他の例を示す説明図である。図10の線グラフ200の縦軸B1~B3、BCは、離散化された数値でラベル付けされている。たとえば、縦軸B1を例に挙げると、筋力低下度が数値0.84,0.83,0.82でラベル化されている。すなわち、縦軸B1~B3、BCの範囲(値域)は、特徴量の最下位桁の値が非連続となっている。0.84,0.83,0.82の各々の範囲(縦軸B1方向の長さ)は、ラベル化された数値0.84,0.83,0.82が接続タイプに含まれる線分の本数に比例する。したがって、ユーザは、どの数値が他の数値に比べてどのくらい接続タイプ、すなわち、線分が多いかを直感的に把握することができる。
また、生成装置320は、隣り合わない時点t(たとえば、t1とt3)の二つの因子(因子Fc、Fdとする)が、その時点t1~t3の間で所定数(たとえば、5個)以上の因子としきい値(たとえば、0.2)以下の関連度のリンクLで接続されているとき、当該所定数以上の因子Fの視覚化要素と当該しきい値以下の関連度の視覚化要素とを削除して、直接因子Fcと因子Fdとを新たな視覚化要素で接続してもよい。
図11は、過程グラフの短縮例を示す説明図である。たとえば、図11の短縮前のシナリオSC5Aにおいて、時点t1における因子F1の「筋力低下」と時点t3における因子F3の「低栄養」の各々が、時点t2のある8個の因子F2、F5、F8、F12~F17に各々関連度の値0.1のリンクL12、L15、L18、L112、L117、L23、L53、L83、L123、L173で接続されているとする。
このとき、生成装置320は、視覚化要素生成部703により、時点t1における因子F1と時点t3における因子F3とを当該しきい値以上となる関連度の値0.8(=0.1×8個)を示す太線のリンクL13を生成する。生成装置320は、グラフ生成部704により、F2、F5、F8、F12~F17の図形データおよびリンクL12、L15、L18、L112、L117、L23、L53、L83、L123、L173を削除し、因子F1の図形データと因子F3の図形データとをリンクL13で接続する。
これにより、短縮後のシナリオSC5Bが生成される。このように、シナリオSC5AからシナリオSC5Bに短縮することにより、過程グラフ100の簡略化を図ることができ、ユーザに対する視認性の向上を図ることができる。また、ユーザは、省略された8個の因子F2、F5、F8、F12~F17との関連度(各々0.1)が全体でどの程度であったかを、L12、L15、L18、L112、L117、L23、L53、L83、L123、L173を統合したリンクL13の太さおよび関連度の値0.8で認識することができる。
なお、生成装置320は、短縮後のシナリオSC5Bを含む過程グラフ100を直接生成してモニタ325に表示してもよく、短縮前のシナリオSC5Aを含む過程グラフ100を生成してモニタ305,325に表示してから、たとえば、ユーザ操作により、短縮後のシナリオSC5Bを含む過程グラフ100に更新してモニタ305,325に表示してもよい。
実施例2にかかる生成装置320は、抗がん剤の治験において、がん患者が治験の結果6ヶ月以上生存できるかどうかを予測する予測モデルを作成し、その予測モデルから予測に至るシナリオを表す過程グラフ100および線グラフ200を生成する。過程グラフ100および線グラフ200は、抗がん剤を販売する製薬会社がその適用手法を適切に設定することを可能とし、また、抗がん剤の作用機序を解明するための大きな手掛かりとなる。このことは医療の質の向上に貢献し、また、薬学および医学の進歩に大きく寄与する。
実施例2の場合、時系列データ400のn={1,…,N}は、ある患者の特徴量ベクトルx(n)(t)を指定するためのインデックスである。また、t={1,…,T}は、日々の問診や検査をした月日を時点とするインデックスである。特徴量ベクトルx(n)(t)∈RはD(≧1)次元の実数値ベクトルであり、日々の問診や検査の結果などの情報を含む。目的変数Y(n)は、0または1のいずれかのクラス値をとる。実施例2では、y(n)=1は、治験の結果6ヶ月以上生存できたことを意味し、y(n)=0は、治験の結果6ヶ月以上生存できなかったことを意味する。
実施例1と同様のグラフ生成処理手順を実行すれば、実施例2にかかる生成装置320は、日々の問診や検査の中で、どの問診や検査結果がどのような順序で生存または死亡につながるかを可視化できる過程グラフ100と、過程グラフ100で示されたシナリオSCのうち、どのような問診結果や検査値が生存または死亡を左右するかを把握することが可能となる線グラフ200を生成することができる。
実施例3にかかる生成装置320は、市場データから一年以内に金融商品の価値が急落するか否かを予測する予測モデルを作成し、その予測モデルから予測に至るシナリオを表す過程グラフ100および線グラフ200を生成する装置を例として説明する。過程グラフ100および線グラフ200は、金融商品の価値が急落する際にはどういった流れが市場全体に起こっているのかを理解することができ、危険な金融商品に投資するリスクを避ける助けとなる。また、膨大なデータからなる市場の動きの流れを理解可能な形に可視化することは、経済学の進歩の大きく寄与する。
実施例3の場合、時系列データ400のn={1,…,N}は、ある金融商品データの特徴量ベクトルx(n)(t)を指定するためのインデックスである。また、t={1,…,T}は、取引日時を時点とするインデックスである。特徴量ベクトルx(n)(t)∈RはD(≧1)次元の実数値ベクトルであり、金融商品に関連する企業の会計情報や市場全体の情報を含む。目的変数Y(n) は0または1のいずれかのクラス値をとる。実施例3では、y(n)=1は、一年以内に価値が急落したことを意味し、y(n)=0は、一年以内に価値が急落することはなかったことを意味する。
実施例1と同様のグラフ生成処理手順を実行すれば、実施例3にかかる生成装置320は、会計情報や市場情報の中で、どの要素がどのような順序で金融商品の価値の急落につながるかを可視化できる過程グラフ100と、過程グラフ100で示されたシナリオSCのうち、具体的にどのような帳簿上の値や市場上の数値が金融商品の価値を左右するかを把握することが可能となる線グラフ200を生成することができる。
なお、上述した実施例1~実施例3では、解析部701が予測モデルを生成することとしたが、予測モデルはあらかじめ実装されていてもよい。
また、上述した実施例1~実施例3にかかる生成装置320は、下記(1)~(9)のように構成することもできる。
(1)プログラムを実行するプロセッサ323と、プログラムを記憶する記憶デバイスと、を有する生成装置320では、プロセッサ323は、時系列に存在する複数の異なる因子Fの特徴量を含む時系列データ400に基づいて、因子Fごとの特徴量の連続的な範囲である特徴量範囲を規定する特徴量範囲視覚化要素(縦軸A1~A3)を生成し、複数の異なる因子Fのうち時間的に連続する第1因子Faの第1特徴量と第2因子Fbの第2特徴量との関連性を規定する特徴量間視覚化要素(線分201,202)を生成する視覚化要素生成処理と、視覚化要素生成処理によって生成された因子Fごとの特徴量範囲視覚化要素のうち第1因子Faの第1特徴量範囲視覚化要素(縦軸Aa)と第2因子Fbの第2特徴量範囲視覚化要素(縦軸Aa)との間に、特徴量間視覚化要素(線分201,202)を関連付けることにより、複数の異なる因子Fに関する特徴量の関係性を示す線グラフ200を生成するグラフ生成処理と、を実行する。
すなわち、生成装置320は、時系列データ400の分析において、予測される未来に至るシナリオSCを表す線グラフ200を、因子Fの特徴量の連続性を維持したまま生成する。これにより、異なる時点の因子F間の関係を連続的な特徴量を用いて提示することができる。したがって、時系列な因子群がどのような特徴量をたどるかを可視化することができる。
(2)また、上記(1)の生成装置320において、視覚化要素生成処理では、プロセッサ323は、時系列データ400と、複数の異なる因子に関連する結果の予測値(要支援1となる確率)と、に基づいて、予測値の連続的な範囲である予測値範囲を規定する予測値範囲視覚化要素(縦軸AC)を生成し、複数の異なる因子Fのうち第2因子Fbよりも後に出現する第3因子F3の第3特徴量と結果の予測値(要支援1となる確率)との関連性を規定する特徴量予測値間視覚化要素(線分203)を生成し、グラフ生成処理では、プロセッサ323は、さらに、第3因子Fcの第3特徴量範囲視覚化要素(縦軸A3)と予測値範囲視覚化要素(縦軸AC)との間に、特徴量予測値間視覚化要素(線分203)を関連付けることにより、線グラフ200を生成する。
これにより、異なる時点の因子F間や結果との関係を、連続的な特徴量を用いて提示することができる。したがって、時系列な因子群がどのような特徴量をたどるときにどのような予測結果になるかを可視化することができる。
(3)また、上記(1)に記載の生成装置320において、視覚化要素生成処理では、プロセッサ323は、時系列データ400に基づいて、因子Fごとの特徴量の連続値を示す特徴量範囲を因子ごとに規定する特徴量範囲視覚化要素(縦軸A1~A3)を生成する。
これにより、異なる時点の因子F間の関係を示す特徴量範囲を連続値のままで提示することができる。したがって、時系列な因子群がどのような特徴量をたどるかを可視化することができる。
(4)また、上記(1)に記載の生成装置320において、視覚化要素生成処理では、プロセッサ323は、時系列データ400に基づいて、因子Fごとの特徴量の複数の値の各々の範囲を、当該値を含む特徴量間視覚化要素(線分201,202)の数に応じて因子Fごとに規定する特徴量範囲視覚化要素(縦軸A1~A3)を生成する。
これにより、異なる時点の因子F間の関係を示す特徴量を、連続性のある離散値で提示することができる。したがって、どの程度のサンプルがどの因子のどの特徴量をたどるかを可視化することができる。
(5)また、上記(1)に記載の生成装置320において、視覚化要素生成処理では、プロセッサ323は、複数の異なる因子Fが時系列に配列されたシナリオSCが選択された場合に、シナリオSC内の複数の異なる因子Fの特徴量を含む時系列データ400に基づいて、特徴量範囲視覚化要素(縦軸A1~A3)を生成し、特徴量間視覚化要素(線分201,202)を生成する。
これにより、シナリオSCを構成する一連の因子F間の関係を、連続的な特徴量を用いて提示することができる。したがって、シナリオSCがどのような特徴量をたどるかを可視化することができる。
(6)また、上記(2)に記載の生成装置320において、プロセッサ323は、複数の異なる因子Fに関連する結果が特定の結果(要支援1)であることを予測する予測モデルに時系列データ400を入力した結果、特定の結果(要支援1)となる確率を予測値として出力する解析処理を実行し、視覚化要素生成処理では、プロセッサ323は、時系列データ400と、解析処理によって出力された予測値と、に基づいて、特徴量予測値間視覚化要素(線分203)を生成する。
これにより、時系列な一連の因子Fと予測値との関係を高精度に特定することができる。
(7)また、上記(1)に記載の生成装置320において、視覚化要素生成処理では、プロセッサ323は、複数の異なる因子Fの各々を規定する因子視覚化要素(因子Fの図形データ)と、第1因子Faと第2因子Fbとの第1関連度を規定する第1関連度視覚化要素(リンクLabとする。第1因子FaがF1、第2因子FbがF2であればリンクL12。)と、を生成し、グラフ生成処理では、プロセッサ323は、第1因子Faを規定する第1因子視覚化要素(因子Faの図形データ)と、第2因子Fbを規定する第2因子視覚化要素(因子Fbの図形データ)とを、第1関連度視覚化要素(リンクLab)で接続することにより、複数の異なる因子Fの過程を示す過程グラフ100を生成する。
これにより、どの因子Fがどのような順序をたどるかを示すシナリオSCを可視化することができる。
(8)また、上記(7)に記載の生成装置320において、プロセッサ323は、複数の異なる因子Fに関連する結果が特定の結果(要支援1)であることを予測する予測モデルに時系列データ400を入力した結果、特定の結果(要支援1)となる確率を予測値として出力するとともに、予測値を説明するための重要度を出力する解析処理を実行し、視覚化要素生成処理では、プロセッサ323は、解析処理によって出力された第1因子Faの第1重要度(重要度ベクトルξとする)と第2因子Fbの第2重要度(重要度ベクトルξとする)とに基づいて、第1関連度視覚化要素(リンクLab)と、を生成する。
これにより、因子Fの重要度ξを考慮した関連度を得ることができる。
(9)また、上記(7)に記載の生成装置320において、視覚化要素生成処理では、プロセッサ323は、第1関連度視覚化要素(リンクLab)の第1関連度と、第2因子視覚化要素(因子Fbの図形データ)と第2因子Fbの次の時点で出現する第4因子(Fdとする)を規定する第4因子視覚化要素(因子Fdの図形データ)とを接続する第2関連度視覚化要素(Lbdとする。第2因子FbがF2、第4因子FdがF3であればリンクL23。)の第2関連度と、がいずれもしきい値以下である場合、第1関連度と第2関連度とに基づいて、第1因子視覚化要素(因子Faの図形データ)と第4因子視覚化要素(因子Fdの図形データ)とを接続する第3関連度視覚化要素(リンクLadとする。第1因子FaがF1、第4因子FdがF3であればリンクL13。)を生成し、グラフ生成処理では、プロセッサ323は、第1因子視覚化要素(因子Faの図形データ)と、第4因子視覚化要素(因子Fdの図形データ)とを、第3関連度視覚化要素(リンクLad)で接続することにより、過程グラフ100を生成する。
これにより、過程グラフ100の簡略化を図ることができ、ユーザに対する視認性の向上を図ることができる。
なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。たとえば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加、削除、または置換をしてもよい。
また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、たとえば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサ323がそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、IC(Integrated Circuit)カード、SDカード、DVD(Digital Versatile Disc)の記録媒体に格納することができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。
A1~A3,AC 縦軸
SC シナリオ
100 過程グラフ
200 線グラフ
201,202,203 線分
320 生成装置
322 メモリ
323 プロセッサ
361 学習部
362 予測部
701 解析部
702 構造データ生成部
703 視覚化要素生成部
704 グラフ生成部

Claims (11)

  1. プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する生成装置であって、
    前記プロセッサは、
    時系列に存在する複数の異なる因子の特徴量を含む時系列データに基づいて、前記因子ごとの特徴量の連続的な範囲である特徴量範囲を規定する特徴量範囲視覚化要素を生成し、前記複数の異なる因子のうち時間的に連続する第1因子の第1特徴量と第2因子の第2特徴量との関連性を規定する特徴量間視覚化要素を生成する視覚化要素生成処理と、
    前記視覚化要素生成処理によって生成された因子ごとの前記特徴量範囲視覚化要素のうち前記第1因子の第1特徴量範囲視覚化要素と前記第2因子の第2特徴量範囲視覚化要素との間に、前記特徴量間視覚化要素を関連付けることにより、前記複数の異なる因子に関する前記特徴量の関係性を示す視覚化情報を生成する視覚化情報生成処理と、
    を実行することを特徴とする生成装置。
  2. 請求項1に記載の生成装置であって、
    前記視覚化要素生成処理では、前記プロセッサは、前記時系列データと、前記複数の異なる因子に関連する結果の予測値と、に基づいて、前記予測値の連続的な範囲である予測値範囲を規定する予測値範囲視覚化要素を生成し、前記複数の異なる因子のうち前記第2因子よりも後に出現する第3因子の第3特徴量と前記結果の予測値との関連性を規定する特徴量予測値間視覚化要素を生成し、
    前記視覚化情報生成処理では、前記プロセッサは、さらに、前記第3因子の第3特徴量範囲視覚化要素と前記予測値範囲視覚化要素との間に、前記特徴量予測値間視覚化要素を関連付けることにより、前記視覚化情報を生成する、
    ことを特徴とする生成装置。
  3. 請求項1に記載の生成装置であって、
    前記視覚化要素生成処理では、前記プロセッサは、前記時系列データに基づいて、前記因子ごとの特徴量の連続値を示す特徴量範囲を前記因子ごとに規定する特徴量範囲視覚化要素を生成する、
    ことを特徴とする生成装置。
  4. 請求項1に記載の生成装置であって、
    前記視覚化要素生成処理では、前記プロセッサは、前記時系列データに基づいて、前記因子ごとの特徴量の複数の値の各々の範囲を、当該値を含む前記特徴量視覚化要素の数に応じて前記因子ごとに規定する特徴量範囲視覚化要素を生成する、
    ことを特徴とする生成装置。
  5. 請求項1に記載の生成装置であって、
    前記視覚化要素生成処理では、前記プロセッサは、前記複数の異なる因子が時系列に配列されたシナリオが選択された場合に、前記シナリオ内の前記複数の異なる因子の特徴量を含む時系列データに基づいて、前記特徴量範囲視覚化要素を生成し、前記特徴量間視覚化要素を生成する、
    ことを特徴とする生成装置。
  6. 請求項2に記載の生成装置であって、
    前記プロセッサは、
    前記複数の異なる因子に関連する結果が特定の結果であることを予測する予測モデルに前記時系列データを入力した結果、前記特定の結果となる確率を予測値として出力する解析処理を実行し、
    前記視覚化要素生成処理では、前記プロセッサは、前記時系列データと、前記解析処理によって出力された予測値と、に基づいて、前記特徴量予測値間視覚化要素を生成する、
    ことを特徴とする生成装置。
  7. 請求項1に記載の生成装置であって、
    前記視覚化要素生成処理では、前記プロセッサは、前記複数の異なる因子の各々を規定する因子視覚化要素と、前記第1因子と前記第2因子との第1関連度を規定する第1関連度視覚化要素と、を生成し、
    前記視覚化情報生成処理では、前記プロセッサは、前記第1因子を規定する第1因子視覚化要素と、前記第2因子を規定する第2因子視覚化要素とを、前記第1関連度視覚化要素で接続することにより、前記複数の異なる因子の過程を示す過程視覚化情報を生成する、
    ことを特徴とする生成装置。
  8. 請求項7に記載の生成装置であって、
    前記プロセッサは、
    前記複数の異なる因子に関連する結果が特定の結果であることを予測する予測モデルに前記時系列データを入力した結果、前記特定の結果となる確率を予測値として出力するとともに、前記予測値を説明するための重要度を出力する解析処理を実行し、
    前記視覚化要素生成処理では、前記プロセッサは、前記解析処理によって出力された前記第1因子の第1重要度と前記第2因子の第2重要度とに基づいて、前記第1関連度視覚化要素と、を生成する、
    ことを特徴とする生成装置。
  9. 請求項7に記載の生成装置であって、
    前記視覚化要素生成処理では、前記プロセッサは、前記第1関連度視覚化要素の第1関連度と、前記第2因子視覚化要素と前記第2因子の次の時点で出現する第4因子を規定する第4因子視覚化要素とを接続する第2関連度視覚化要素の第2関連度と、がいずれもしきい値以下である場合、前記第1関連度と前記第2関連度とに基づいて、前記第1因子視覚化要素と前記第4因子視覚化要素とを接続する第3関連度視覚化要素を生成し、
    前記視覚化情報生成処理では、前記プロセッサは、前記第1因子視覚化要素と、前記第4因子視覚化要素とを、前記第3関連度視覚化要素で接続することにより、前記過程視覚化情報を生成する、
    ことを特徴とする生成装置。
  10. プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する生成装置が実行する生成方法であって、
    前記生成方法は、
    前記プロセッサが、
    時系列に存在する複数の異なる因子の特徴量を含む時系列データに基づいて、前記因子ごとの特徴量の連続的な範囲である特徴量範囲を規定する特徴量範囲視覚化要素を生成し、前記複数の異なる因子のうち時間的に連続する第1因子の第1特徴量と第2因子の第2特徴量との関連性を規定する特徴量間視覚化要素を生成する視覚化要素生成処理と、
    前記視覚化要素生成処理によって生成された因子ごとの前記特徴量範囲視覚化要素のうち前記第1因子の第1特徴量範囲視覚化要素と前記第2因子の第2特徴量範囲視覚化要素との間に、前記特徴量間視覚化要素を関連付けることにより、前記複数の異なる因子に関する前記特徴量の関係性を示す視覚化情報を生成する視覚化情報生成処理と、
    を実行することを特徴とする生成方法。
  11. プロセッサに、
    時系列に存在する複数の異なる因子の特徴量を含む時系列データに基づいて、前記因子ごとの特徴量の連続的な範囲である特徴量範囲を規定する特徴量範囲視覚化要素を生成し、前記複数の異なる因子のうち時間的に連続する第1因子の第1特徴量と第2因子の第2特徴量との関連性を規定する特徴量間視覚化要素を生成する視覚化要素生成処理と、
    前記視覚化要素生成処理によって生成された因子ごとの前記特徴量範囲視覚化要素のうち前記第1因子の第1特徴量範囲視覚化要素と前記第2因子の第2特徴量範囲視覚化要素との間に、前記特徴量間視覚化要素を関連付けることにより、前記複数の異なる因子に関する前記特徴量の関係性を示す視覚化情報を生成する視覚化情報生成処理と、
    を実行させることを特徴とする生成プログラム。
JP2020115828A 2020-07-03 2020-07-03 生成装置、生成方法、および生成プログラム Active JP7453076B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020115828A JP7453076B2 (ja) 2020-07-03 2020-07-03 生成装置、生成方法、および生成プログラム
US17/363,157 US11907871B2 (en) 2020-07-03 2021-06-30 Generation device, generation method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020115828A JP7453076B2 (ja) 2020-07-03 2020-07-03 生成装置、生成方法、および生成プログラム

Publications (3)

Publication Number Publication Date
JP2022013338A JP2022013338A (ja) 2022-01-18
JP2022013338A5 JP2022013338A5 (ja) 2023-03-17
JP7453076B2 true JP7453076B2 (ja) 2024-03-19

Family

ID=80169573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020115828A Active JP7453076B2 (ja) 2020-07-03 2020-07-03 生成装置、生成方法、および生成プログラム

Country Status (2)

Country Link
US (1) US11907871B2 (ja)
JP (1) JP7453076B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11423000B2 (en) * 2020-04-02 2022-08-23 Sap Se Data transfer and management system for in-memory database
US20230306058A1 (en) * 2020-09-28 2023-09-28 Nec Corporation Prediction device, prediction method, and recording medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015090689A (ja) 2013-11-07 2015-05-11 株式会社日立製作所 医療データ分析システム、及び医療データを分析する方法
WO2017141837A1 (ja) 2016-02-15 2017-08-24 株式会社サイカ プログラム、情報処理装置及び情報処理方法
JP2019079302A (ja) 2017-10-25 2019-05-23 日本電気株式会社 営業活動支援システム、営業活動支援方法および営業活動支援プログラム
JP2019125240A (ja) 2018-01-18 2019-07-25 株式会社日立製作所 分析装置および分析方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7242403B2 (en) * 2004-09-20 2007-07-10 Timothy Phelan Graphical display of multiple related variables
US9047560B2 (en) 2011-06-29 2015-06-02 Microsoft Technology Licensing, Llc Using event stream data to create a decision graph representing a race participant where leaf nodes comprise rates defining a speed of the race participant in a race simulation
JP5388154B1 (ja) * 2013-07-05 2014-01-15 ライフロボ株式会社 ヘルスケアシステム
CN110059131A (zh) 2018-11-30 2019-07-26 阿里巴巴集团控股有限公司 一种时序数据关系演化的可视化方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015090689A (ja) 2013-11-07 2015-05-11 株式会社日立製作所 医療データ分析システム、及び医療データを分析する方法
WO2017141837A1 (ja) 2016-02-15 2017-08-24 株式会社サイカ プログラム、情報処理装置及び情報処理方法
JP2019079302A (ja) 2017-10-25 2019-05-23 日本電気株式会社 営業活動支援システム、営業活動支援方法および営業活動支援プログラム
JP2019125240A (ja) 2018-01-18 2019-07-25 株式会社日立製作所 分析装置および分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
河東 孝,細菌検査データからの頻出二部エピソードの抽出,第79回 人工知能基本問題研究会資料 (SIG-FPAI-B002) ,社団法人人工知能学会,2010年09月17日,pp.27~30

Also Published As

Publication number Publication date
US20220004584A1 (en) 2022-01-06
US11907871B2 (en) 2024-02-20
JP2022013338A (ja) 2022-01-18

Similar Documents

Publication Publication Date Title
Fong et al. Composite Monte Carlo decision making under high uncertainty of novel coronavirus epidemic using hybridized deep learning and fuzzy rule induction
Zhang et al. Patient2vec: A personalized interpretable deep representation of the longitudinal electronic health record
Albahri et al. Novel dynamic fuzzy decision-making framework for COVID-19 vaccine dose recipients
Xu et al. A Bayesian nonparametric approach for estimating individualized treatment-response curves
Gothai et al. Prediction of COVID-19 growth and trend using machine learning approach
JP7453076B2 (ja) 生成装置、生成方法、および生成プログラム
Patil et al. A proposed model for lifestyle disease prediction using support vector machine
Krikunov et al. Complex data-driven predictive modeling in personalized clinical decision support for Acute Coronary Syndrome episodes
Jahn et al. On the role of data, statistics and decisions in a pandemic
Alharbi et al. Prediction of dental implants using machine learning algorithms
JP2020042645A (ja) 時系列データ分析装置、時系列データ分析方法、および時系列データ分析プログラム
Mago et al. Employing fuzzy cognitive map for periodontal disease assessment
Brailsford Healthcare: Human behavior in simulation models
Yadav et al. Supervised learning technique for prediction of diseases
CN116543917A (zh) 一种针对异构时间序列数据的信息挖掘方法
Kourou et al. Computational models for predicting resilience levels of women with breast cancer
Patayon Time series analysis of infected COVID-19 cases in the Zamboanga Peninsula, Philippines using long short-term memory neural networks
Soni Predicting length of stay of emergency department patients using tree-based machine learning models
Keerthy et al. Artificial intelligence in healthcare databases
Kasaie et al. Integrating machine learning algorithms and explainable artificial intelligence approach for predicting patient unpunctuality in psychiatric clinics
Bazilevych et al. Intelligent Decision-Support System for Epidemiological Diagnostics. II. Information Technologies Development
Usharani et al. Data visualization for healthcare
Hrabia et al. Machine learning in the context of covid-19 pandemic data analysis
Dey et al. U-Healthcare Monitoring Systems: Volume 1: Design and Applications
Shekapure et al. Clinical Data Analysis of Patient and Recommendation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230309

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240307

R150 Certificate of patent or registration of utility model

Ref document number: 7453076

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150