JP7245125B2 - Generation device, generation method, and generation program - Google Patents
Generation device, generation method, and generation program Download PDFInfo
- Publication number
- JP7245125B2 JP7245125B2 JP2019118136A JP2019118136A JP7245125B2 JP 7245125 B2 JP7245125 B2 JP 7245125B2 JP 2019118136 A JP2019118136 A JP 2019118136A JP 2019118136 A JP2019118136 A JP 2019118136A JP 7245125 B2 JP7245125 B2 JP 7245125B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- temporal
- generation
- feature
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Description
本発明は、データを生成する生成装置、生成方法、および生成プログラムに関する。 The present invention relates to a generation device, generation method, and generation program for generating data.
生命保険の加入審査では、加入希望者の健康状態に基づいて将来の発症や入院リスクが予測される。健康状態は健康診断結果や告知情報など多変量データで表現される。さらに、健康状態の変化を考慮する場合、複数年分の健康状態を考慮してリスク予測を行うため、多変量データの次元数はさらに膨大になる。 In life insurance enrollment screening, future onset and hospitalization risks are predicted based on the health condition of the applicant. Health conditions are represented by multivariate data such as health checkup results and notification information. Furthermore, when considering changes in health conditions, the number of dimensions of multivariate data becomes even more enormous because risk prediction is performed in consideration of health conditions for multiple years.
時系列データ分析のための手法として、ベクトル自己回帰モデルやLSTM(Long short‐term Memory)などがあり、また、各時点で独立した変数として回帰モデルやニューラルネットワークを用いて分析する方法がある。 Techniques for time-series data analysis include vector autoregression models and LSTM (Long short-term memory), and there are methods of analysis using regression models and neural networks as independent variables at each time point.
また、特許文献1は、複数年の健康状態を分析するデータ分析装置を開示する。このデータ分析装置は、ID及び時間情報をそれぞれ有する定量データ及び定性データを記憶し、前記定量データから時系列定量イベントデータを生成し、前記定性データから時系列定性イベントデータを生成し、前記時系列定量及び定性イベントデータの一方から変化がある特徴部分を抽出し、前記特徴部分に対応するイベントデータの集合から時系列イベントパターンを生成し、前記時系列イベントパターンに含まれるIDと、前記時系列定量及び定性イベントデータの他方に含まれるIDとを対応付け、前記対応づけられた時系列イベントパターンと、前記対応付けられた時系列定量及び定性イベントデータの他方と、を表示する。
Further,
しかしながら、分析に必要な特徴量を全探索的に抽出する場合、分析に不要な特徴量も生成され、計算コストが増加する。また、分析に不要な特徴量が、目的とする分析に悪影響を及ぼす可能性も生じる。 However, when extracting feature amounts necessary for analysis by exhaustive search, feature amounts unnecessary for analysis are also generated, increasing calculation costs. In addition, there is a possibility that feature amounts unnecessary for analysis may adversely affect the intended analysis.
本発明は、効率的かつ高精度なデータ分析を実現することを目的とする。 An object of the present invention is to realize efficient and highly accurate data analysis.
本願において開示される発明の一側面となる生成装置は、プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有する生成装置であって、経時データから得られる経時的な特徴を示す経時特徴情報と、前記経時データが所属すべき複数のグループが規定されたグループ分け情報と、にアクセス可能であり、前記プロセッサは、前記経時特徴情報に基づいて、分析対象の経時データから、前記経時的な特徴を示す複数の経時特徴データを生成する生成処理と、前記グループ分け情報に基づいて、前記生成処理によって生成された複数の経時特徴データを前記複数のグループに分割する分割処理と、前記分割処理によって分割された複数のグループの各々を次元圧縮し、分析対象の非経時データを次元圧縮する次元圧縮処理と、を実行することを特徴とする。 A generation device that is one aspect of the invention disclosed in the present application is a generation device that includes a processor that executes a program and a storage device that stores the program, and exhibits chronological characteristics obtained from chronological data. It is possible to access temporal characteristic information and grouping information that defines a plurality of groups to which the temporal data should belong, and the processor, based on the temporal characteristic information, selects, from the temporal data to be analyzed, the a generation process of generating a plurality of pieces of temporal feature data indicating characteristics over time; a division process of dividing the plurality of pieces of temporal feature data generated by the generation processing into the plurality of groups based on the grouping information; and dimension compression processing for dimensionally compressing each of the plurality of groups divided by the division processing, and dimensionally compressing the non-temporal data to be analyzed .
本発明の代表的な実施の形態によれば、効率的かつ高精度なデータ分析を実現することができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。 According to representative embodiments of the present invention, efficient and highly accurate data analysis can be achieved. Problems, configurations, and effects other than those described above will be clarified by the following description of the embodiments.
以下、添付図面を用いて本発明にかかる生成装置について説明する。本明細書では、生命保険の引受査定における保険金支払リスク予測の例を示す。引受査定では、契約希望者が告知した情報(以下、告知情報)に基づき、将来の保険金支払リスクが査定され、保険加入の承認または謝絶が決定される。告知情報は、健康診断の検査結果、問診、既往歴等を含む。 Hereinafter, a generation device according to the present invention will be described with reference to the accompanying drawings. Provided herein are examples of claim risk prediction in life insurance underwriting. In the underwriting assessment, based on the information notified by the applicant (hereinafter referred to as notification information), the future insurance claim payment risk is assessed and the approval or refusal of insurance enrollment is determined. The notification information includes test results of physical examinations, medical interviews, medical history, and the like.
<生成装置のハードウェア構成例>
図1は、生成装置のハードウェア構成例を示すブロック図である。生成装置100は、プロセッサ101と、記憶デバイス102と、入力デバイス103と、出力デバイス104と、通信インターフェース(通信IF)105と、を有する。プロセッサ101、記憶デバイス102、入力デバイス103、出力デバイス104、および通信IF105は、バス106により接続される。プロセッサ101は、生成装置100を制御する。記憶デバイス102は、プロセッサ101の作業エリアとなる。また、記憶デバイス102は、各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス102としては、たとえば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリがある。入力デバイス103は、データを入力する。入力デバイス103としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナがある。出力デバイス104は、データを出力する。出力デバイス104としては、たとえば、ディスプレイ、プリンタがある。通信IF105は、ネットワークと接続し、データを送受信する。
<Hardware configuration example of generation device>
FIG. 1 is a block diagram showing a hardware configuration example of a generation device. The
<生成装置100の機能的構成例>
図2は、実施例1にかかる生成装置100の機能的構成例を示すブロック図である。生成装置100は、判定部201と、生成部202と、分割部203と、次元圧縮部204と、結合部205と、分析部206と、を有する。判定部201、生成部202、分割部203、次元圧縮部204、結合部205、および分析部206は、具体的には、たとえば、図1に示した記憶デバイス102に記憶されたプログラムをプロセッサ101に実行させることにより実現される。
<Functional Configuration Example of
FIG. 2 is a block diagram of a functional configuration example of the
また、生成装置100は、少なくとも生成部202と分割部203と次元圧縮部204とを有していればよく、判定部201、結合部205、および分析部206は、生成装置100と通信可能な他のコンピュータで実現されてもよい。
Moreover, the
また、生成装置100は、告知情報300と、ドメイン知識400と、を記憶デバイス102に記憶する。告知情報300およびドメイン知識400は、あらかじめ生成装置100に記憶されていてもよく、生成装置100と通信可能な他のコンピュータから取得してもよい。まず、告知情報300について詳細に説明する。
The generating
図3は、告知情報300の記憶内容例を示す説明図である。告知情報300は、契約希望者が告知した保険契約に必要な情報であり、分析対象データとなる。告知情報300は、告知基本情報310と、健診結果320と、問診結果330と、既往歴340と、を有する。告知基本情報310は、契約希望者の告知に関する基本情報である。告知基本情報310は、氏名ID311と、生年月日312と、年齢313と、を含む。
FIG. 3 is an explanatory diagram showing an example of the contents of the
氏名ID311は、契約希望者を一意に特定する識別情報である。生年月日312は、契約希望者が生まれた年月日である。図3の氏名ID311が「0001」の契約希望者の3つのエントリは、当該契約希望者の過去3年分の分析対象データを示す。年齢313は、契約希望者の生年月日312から起算した年単位の経過年数である。後述する例において、氏名ID311が「0001」の契約希望者の3つのエントリについて、年齢313が「47」を時系列の1年目、「48」を時系列の2年目、「49」を時系列の3年目とする。
The
健診結果320は、契約希望者が受けた健康診断の結果である。健診結果320は、体重321と、BMI(Body Mass Index)322と、収縮期血圧323と、拡張期血圧324と、空腹時血糖325と、を含む。体重321は、契約希望者の体の重さである。BMI322は、人間の肥満度を表す体格指数であり、体重/(身長2)で算出される。BMI322は、その値が小さくなるほど痩せており、大きくなるほど太っていることを示す。
The
収縮期血圧323は、心臓から大動脈へ血液を送り出す状態において、心臓の収縮で押し出された血液によって大動脈の血管壁にかかる圧力である。拡張期血圧324は、心臓へ血液が戻る状態において、心臓の拡張で大動脈から心臓に血液が流入し大動脈の血液量が減少することで低下した大動脈の血管壁にかかる圧力である。空腹時血糖325は、空腹の状態で測定された血糖値である。
問診結果330は、契約希望者が受けた問診の結果である。問診結果330は、喫煙習慣331と、飲酒習慣332と、運動習慣333と、を含む。喫煙習慣331は、契約希望者の喫煙の有無や頻度、喫煙量である。飲酒習慣332は、契約希望者の飲酒の有無や頻度、飲酒量である。運動習慣333は、契約希望者の運動の有無や頻度、運動量である。
The
既往歴340は、契約希望者が既に受信または入院した履歴である。既往歴340は、高血圧症受診歴341と、高血圧症入院歴342と、糖尿病受診歴343と、を含む。高血圧症受診歴341は、契約希望者が高血圧症に関して受診した履歴である。高血圧症入院歴342は、契約希望者が高血圧症に関して入院した履歴である。糖尿病受診歴343は、契約希望者が糖尿病に関して受診した履歴である。
The
図4は、ドメイン知識400の記憶内容例を示す説明図である。ドメイン知識400は、告知情報300に含まれる健診結果320、問診結果330、既往歴340などの各種情報に対する定性的な情報であり、医学的知見に相当する。具体的には、たとえば、ドメイン知識400は、経時データ判定知識410と、経時特徴知識420と、経時特徴分割知識430と、を含む。
FIG. 4 is an explanatory diagram showing an example of the contents of the
経時データ判定知識410は、分析対象データである契約希望者の告知情報300が非経時データ231および経時データ232のいずれに該当するかを判定するための判定情報である。具体的には、たとえば、経時データ判定知識410は、非経時データ231および経時データ232に該当する告知情報300の項目を規定する。
The chronological
非経時データ項目411は、非経時データ231に該当する項目を含む。非経時データ231とは、データの時系列な変化がない、または当該変化はあっても意味のないデータである。非経時データ231には、たとえば、喫煙習慣331、飲酒習慣332、各種受診歴、各種入院歴が該当する。経時データ項目412は、経時データ232に該当する項目を含む。経時データ232とは、データの時系列な変化に意味がある時系列データである。経時データ232には、たとえば、体重321、BMI322、収縮期血圧323、拡張期血圧324、空腹時血糖325などが該当する。
経時特徴知識420は、経時データ232から得られる経時的な特徴(経時特徴)を示す経時特徴情報である。たとえば、経時特徴知識420は、基本統計量項目421と、変化量項目422と、変化割合項目423と、…を規定する。基本統計量項目421は、経時データ232から得られる基本統計量に該当する項目を含む。基本統計量は、たとえば、経時データ232の最大値、最小値、平均値である。
The
変化量項目422は、経時データ232のうち連続する2つの値の変化を示す変化量に該当する項目である。たとえば、経時データ232が1~3年分の年ごとの体重321である場合、変化量(1、2年目)は、1年目の体重321と2年目の体重321との差であり、変化量(2、3年目)は、2年目の体重321と3年目の体重321との差である。
The amount of
変化割合項目423は、経時データ232のうち連続する2つの値の変化の割合を示す値に該当する項目である。たとえば、経時データ232が1~3年分の年ごとの体重321である場合、変化割合(1、2年目)は、1年目の体重321と2年目の体重321との差を1年目の体重321で割った値であり、変化量(2、3年目)は、2年目の体重321と3年目の体重321との差を2年目の体重321で割った値である。
The
経時特徴分割知識430は、経時データ232が所属すべきグループが規定されたグループ分け情報である。経時特徴分割知識430は、具体的には、たとえば、統計学的知見あるいは医学的知見に基づいて規定される。具体的には、たとえば、経時特徴分割知識は、体型基本情報項目431と、血圧系検査値項目432と、血糖系検査値項目433と、肝機能系検査値項目434と、…を、それぞれグループとして含む。
The temporal
体型基本情報項目431は、体型基本情報に該当する項目を含む。体型基本情報とは、契約希望者の体型に関する基本情報である。体型基本情報項目431は、たとえば、年齢313、体重321、BMI322を項目として含む。
The body type
血圧系検査値項目432は、血圧系検査値に該当する項目を含む。血圧系検査値は、契約希望者の血圧に関する検査値である。血圧系検査値項目432は、たとえば、収縮期血圧323や拡張期血圧324を項目として含む。
The blood pressure
血糖系検査値項目433は、血糖系検査値に該当する項目を含む。血糖系検査値は、契約希望者の血糖に関する検査値である。血糖系検査値項目433は、たとえば、空腹時血糖325やHbA1cを項目として含む。
The blood sugar
肝機能系検査値項目434は、肝機能系検査値に該当する項目を含む。肝機能系検査値は、契約希望者の肝機能に関する検査値である。肝機能系検査値項目434は、たとえば、GOT(グルタミン酸オキサロ酢酸トランスアミナーゼ)、GPT(グルタミン酸ピルビン酸トランスアミナーゼ)、γ-GTP(γグルタミルトランスペプチダーゼ)を項目として含む。
The liver function
図2に戻り、判定部201は、経時データ判定知識410に基づいて、告知情報300が経時データ232および非経時データ231のいずれに該当するかを判定する。図3の告知情報300内の氏名ID311が「0001」のエントリを例に挙げる。年齢313、体重321、BMI322、収縮期血圧323、拡張期血圧324および空腹時血糖325は、経時データ項目412に含まれる。したがって、判定部201は、年齢313の「47」,「48」,「49」、体重321の「83.4」,「86.6」,「92.0」、BMI322の「22.8」,「24.3」,「26.0」、収縮期血圧323の「124.9」,「128.5」,「133.8」、拡張期血圧324の「80.7」,「86.1」,「90.0」、空腹時血糖325の「104.5」,「107.2」,「110.0」が、氏名ID311が「0001」である契約希望者の経時データ232である、と判定する。判定部201は、判定された経時データ232を判定結果として出力する。
Returning to FIG. 2 , the
また、喫煙習慣331、飲酒習慣332、運動習慣333、高血圧症受診歴341、高血圧症入院歴342および糖尿病受診歴343は、非経時データ項目411に含まれる。したがって、判定部201は、喫煙習慣331の「なし」,「なし」,「なし」、飲酒習慣332の「週1」,「週1」,「週2」、運動習慣333の「週1」,「週1」,「なし」、高血圧症受診歴341の「なし」,「なし」,「なし」、高血圧症入院歴342の「なし」,「なし」,「なし」、糖尿病受診歴343の「なし」,「なし」,「なし」が、氏名ID311が「0001」である契約希望者の非経時データ231である、と判定する。判定部201は、判定された非経時データ231を判定結果として出力する。
生成部202は、経時特徴知識420に基づいて、経時データ232から、経時的な特徴を示す経時特徴データを生成する。生成部202は、経時データ232について、基本統計量項目に含まれる最大値511、最小値512、平均値、…を算出する。生成部202は、経時データ232について、変化量項目に含まれる変化量(1,2年目)521、変化量(2,3年目)522…を算出する。生成部202は、経時データ232について、変化割合項目に含まれる変化割合(1,2年目)531、変化割合(2,3年目)532、…を算出する。
The
図3の告知情報300内の氏名ID311が「0001」のエントリを例に挙げる。たとえば、経時データ232に含まれる体重321の「83.4」,「86.6」,「92.0」の場合、最大値511は、3年目の体重321である「92.0」、最小値512は、1年目の体重321である「83.4」、平均値は、「83.4」,「86.6」,「92.0」を平均化した「87.3」である。
An entry in which the
また、変化量(1,2年目)521は、「86.6」から「83.4」を引いた「3.2」、変化量(2,3年目)522は、「92.0」から「86.6」を引いた「5.4」である。また、変化割合(1,2年目)531は、変化量(1,2年目)521である「3.2」を1年目の体重321の「83.4」で割った「0.04」、変化割合(2,3年目)532は、変化量(2,3年目)522である「5.4」を2年目の体重321の「86.6」で割った「0.06」である。体重321以外のBMI322、収縮期血圧323、拡張期血圧324および空腹時血糖325などについても同様である。生成部202は、生成結果を経時特徴データ500として出力する。
Further, the amount of change (1st and 2nd years) 521 is "3.2" obtained by subtracting "83.4" from "86.6", and the amount of change (2nd and 3rd years) 522 is "92.0". ' minus '86.6' is '5.4'. Also, the rate of change (first and second years) 531 is obtained by dividing the change amount (first and second years) 521 of "3.2" by the
図5は、経時特徴データ500の一例を示す説明図である。経時特徴データ500は、基本統計量510と、変化量520と、変化割合530と、を含む。基本統計量510は、基本統計量項目421に従って算出された最大値511、最小値512、平均値(不図示)、…を含む。変化量520は、変化量項目422に従って算出された変化量(1,2年目)521、変化量(2,3年目)522、…を含む。変化割合530は、変化量項目422に従って算出された変化割合(1,2年目)531、変化割合(2,3年目)532、…を含む。
FIG. 5 is an explanatory diagram showing an example of
基本統計量510、変化量520および変化割合530はそれぞれ、経時データ232の種類ごとに、生成部202によって生成される。図5に示した経時特徴内のエントリ501-1、501-2、…、502-1、502-2、…、501-3、503-2、…、504-1、504-2、…は、ある一人の契約希望者(たとえば、氏名ID311が「0001」の契約希望者)に関する経時特徴データである。生成部202は、契約希望者ごとにエントリ501-1、501-2、…、502-1、502-2、…、501-3、503-2、…、504-1、504-2、…を生成する。
The
エントリ501は、体型基本情報項目431に従った経時特徴データである。具体的には、たとえば、エントリ501-1は、体重321についての基本統計量、変化量および変化割合を示す経時特徴データである。エントリ501-2は、BMI322についての基本統計量、変化量および変化割合を示す経時特徴データである。
Entry 501 is characteristic data over time according to body type
エントリ502は、血圧系検査値項目432に従った経時特徴データである。具体的には、たとえば、エントリ502-1は、収縮期血圧323についての基本統計量、変化量および変化割合を示す経時特徴データである。エントリ502-2は、拡張期血圧324についての基本統計量、変化量および変化割合を示す経時特徴データである。
Entry 502 is characteristic data over time according to the blood pressure system
エントリ503は、血糖系検査値項目433に従った経時特徴データである。具体的には、たとえば、エントリ503-1は、空腹時血糖325についての基本統計量、変化量および変化割合を示す経時特徴データである。エントリ503-2は、HbA1cについての基本統計量、変化量および変化割合を示す経時特徴データである。
Entry 503 is chronological feature data according to blood glucose
エントリ504は、肝機能系検査値項目434に従った経時特徴データである。具体的には、たとえば、エントリ504-1は、GOTについての基本統計量、変化量および変化割合を示す経時特徴データである。エントリ504-2は、GPTについての基本統計量、変化量および変化割合を示す経時特徴データである。
Entry 504 is characteristic data over time according to liver function
図2に戻り、分割部203は、経時特徴分割知識430に基づいて、生成部202によって生成された複数の経時特徴データを複数のグループに分割し、分割経時特徴データ600を出力する。複数の経時特徴データとは、たとえば、図5に示した各エントリ501-1、501-2、…、502-1、502-2、…、501-3、503-2、…、504-1、504-2、…を構成する値の各々である。複数のグループは、分割経時特徴データ600-1,600-2、…、600-n(nは1以上の整数)である。分割経時特徴データ600-1,600-2、…、600-nの各々は、図4に示した経時特徴分割知識430の体型基本情報項目431、血圧系検査値項目432、血糖系検査値項目433、肝機能系検査値項目434、…として規定される。
Returning to FIG. 2 , the dividing
経時特徴分割知識430は、統計学的知見あるいは医学的知見に基づいて規定されている。(例1)BMI322は身長と体重321から算出される指数である。保険契約希望者の年代であれば身長の変化は大きくない。このため、BMI322の変化は体重321の変化と非常に強い相関がある。告知情報300の中で相関の強い項目が複数存在する場合、それらは冗長な情報となり、データ分析において非効率の原因となる。
The temporal
これに対し、経時特徴分割知識430を適用することにより、冗長さを含む複数の項目(年齢313、体重321、BMI322、…)の経時特徴データが、体型基本情報項目431という分割経時特徴データ600-1のグループ(以下、体型グループ600-1)にまとめられる。これにより、生成装置100は、当該複数の項目の値を用いて生成された経時特徴データを、体型グループとしてまとめて次元圧縮して高次元の特徴(以下、高次特徴)を抽出することが可能となり、データ分析の効率化を図ることができる。
On the other hand, by applying the temporal
(例2)収縮期血圧323と拡張期血圧324は、どちらも加齢とともに緩やかに悪化することが知られている。また、生活習慣の改善、悪化などで血圧が下降、上昇する場合も、収縮期血圧323と拡張期血圧324はバランスを保ったまま下降、上昇する。しかし、そのバランスに変化が生じたとき、動脈硬化などの高血圧疾患の予兆であると言われている。
(Example 2) Both the
そこで、経時特徴分割知識430を適用することにより、収縮期血圧323と拡張期血圧324の経時特徴データが、血圧系検査値項目432という分割経時特徴データ600-2のグループ(以下、血圧系グループ600-2)にまとめられる。これにより、生成装置100は、収縮期血圧323の値と拡張期血圧324の値とを用いて生成された経時特徴データを、血圧系グループとしてまとめて次元圧縮して高次特徴を抽出することで、データ分析に必要な複合的な特徴量を得ることができる。
Therefore, by applying the temporal
同様の理由で、空腹時血糖325とHbA1cの経時特徴データが、血糖系検査値項目433という分割経時特徴データ600-3のグループ(以下、血糖系グループ600-3)にまとめられ、GOT,GPT,γ-GTPの経時特徴データが、肝機能系検査値項目434という分割経時特徴データ600-4のグループ(以下、肝機能系グループ600-4)にまとめられる。
For the same reason, the fasting
図6は、分割経時特徴データ600の一例を示す説明図である。分割経時特徴は、体型グループ600-1と、血圧系グループ600-2と、血糖系グループ600-3と、肝機能系グループ600-4と、を含む。体型グループ600-1は、体型基本情報項目431に該当する経時特徴データを含むデータ集合である。血圧系グループ600-2は、血圧系検査値項目432に該当する経時特徴データを含むデータ集合である。血糖系グループ600-3は、血糖系検査値項目433に該当する経時特徴データを含むデータ集合である。肝機能系グループ600-4は、肝機能系検査値項目434に該当する経時特徴データを含むデータ集合である。
FIG. 6 is an explanatory diagram showing an example of divided
体型グループ600-1は、体重321の経時特徴データ601-1と、BMI322の経時特徴データ601-2と、を含む。体重321の経時特徴データ601-1のデータ列をベクトルUb1-1とする。BMI322の経時特徴データ601-2のデータ列をベクトルUb1-2とする。
Body type group 600-1 includes
血圧系グループ600-2は、収縮期血圧323の経時特徴データ602-1と、拡張期血圧324の経時特徴データ602-2と、を含む。収縮期血圧323の経時特徴データ602-1のデータ列をベクトルUb2-1とする。拡張期血圧324の経時特徴データ602-2のデータ列をベクトルUb2-2とする。
The blood pressure system group 600-2 includes temporal feature data 602-1 of the
血糖系グループ600-3は、空腹時血糖325の経時特徴データ603-1と、HbA1cの経時特徴データ602-2と、を含む。空腹時血糖325の経時特徴データ603-1のデータ列をベクトルUb3-1とする。HbA1cの経時特徴データ602-2のデータ列をベクトルUb3-2とする。
The blood glucose system group 600-3 includes
肝機能系グループ600-4は、GOTの経時特徴データ604-1と、GPTの経時特徴データ604-2と、を含む。GOTの経時特徴データ604-1のデータ列をベクトルUb4-1とする。GPTの経時特徴データ604-2のデータ列をベクトルUb4-2とする。 The liver function system group 600-4 includes GOT feature data over time 604-1 and GPT feature data over time 604-2. A data string of the GOT temporal feature data 604-1 is assumed to be a vector Ub4-1. A data string of the GPT chronological feature data 604-2 is assumed to be a vector Ub4-2.
図2に戻り、次元圧縮部204は、入力されてくるデータを次元圧縮して高次特徴データ700を生成する。具体的には、たとえば、次元圧縮部204は、分割部203によって分割された複数のグループの各々を次元圧縮する。具体的には、たとえば、次元圧縮部204は、分割経時特徴データ600-1~600-nの各々について次元圧縮をおこない、経時データ232に関する高次特徴データ702-1~702-nを生成する。
Returning to FIG. 2 , the
また、次元圧縮部204は、非経時データ231について次元圧縮をおこない、非経時データ231に関する高次特徴データ701を生成する。データの次元圧縮による高次特徴データの抽出は、Principal components analysis(PCA)や、Stacked autoencoderなど公知の次元圧縮方法により実現される。また、次元圧縮部204は、ニューラルネットワークなどを用いて、一度データの次元数を拡張することで高次特徴データを生成し、その後次元圧縮をしてもよい。
The
図7は、高次特徴データの一例を示す説明図である。高次特徴データは、非経時データ231に関する高次特徴データ701と、経時データ232に関する体型系高次特徴データ702-1と、経時データ232に関する血圧系高次特徴データ702-2と、経時データ232に関する血糖系高次特徴データ702-3と、経時データ232に関する肝機能系高次特徴データ702-4と、を含む。
FIG. 7 is an explanatory diagram showing an example of high-order feature data. The high-level feature data includes high-
非経時データ231に関する高次特徴データ701、経時データ232に関する体型系高次特徴データ702-1、経時データ232に関する血圧系高次特徴データ702-2、経時データ232に関する血糖系高次特徴データ702-3、および経時データ232に関する肝機能系高次特徴データ702-4はそれぞれ、次元圧縮により得られた特徴量1、特徴量2、…を含む。
High-
非経時データ231に関する高次特徴データ701の特徴量1の列における値の集合がベクトルVa1であり、特徴量2の列における値の集合がベクトルVa2である。経時データ232に関する体型系高次特徴データ702-1の特徴量1の列における値の集合がベクトルVba1-1であり、特徴量2の列における値の集合がベクトルVb1-2である。
A vector Va1 is a set of values in the
経時データ232に関する血圧系高次特徴データ702-2の特徴量1の列における値の集合がベクトルVb2-1であり、特徴量2の列における値の集合がベクトルVb2-2である。経時データ232に関する血糖系高次特徴データ702-3の特徴量1の列における値の集合がベクトルVb3-1であり、特徴量2の列における値の集合がベクトルVb3-2である。経時データ232に関する肝機能系高次特徴データ702-4の特徴量1の列における値の集合がベクトルVb4-1であり、特徴量2の列における値の集合がベクトルVb4-2である。
A vector Vb2-1 is a set of values in the
図2に戻り、結合部205は、次元圧縮部204による次元圧縮後の複数のグループを結合し、結合高次特徴データ710を生成する。次元圧縮後の複数のグループとは、分割経時特徴データ600-1~600-nが次元圧縮された場合、経時データ232に関する高次特徴データ702-1~702-nである。非経時データ231および分割経時特徴データ600-1~600-nが次元圧縮された場合、非経時データ231に関する高次特徴データ701および経時データ232に関する高次特徴データ702-1~702-nである。
Returning to FIG. 2 , the combining
図7を用いて結合部205による結合例を示す。結合部205は、Va1,Va2,…,Vb1-1,Vb1-2,…,Vb3-1,Vb3-2,…,Vb4-1,Vb4-2,…を結合して、高次特徴ベクトルVallを結合高次特徴データ710として生成する。高次特徴ベクトルVallの次元数は、Va1,vA2,…,Vb1-1,Vb1-2,…,Vb3-1,Vb3-2,…,Vb4-1,Vb4-2,…の各々の要素の総和である。
An example of coupling by the
図2に戻り、分析部206は、結合部205による結合結果(結合高次特徴データ710)を説明変数とし、対応する目的変数を出力する。たとえば、分析部206は、保険金支払リスク分析を行い、具体的には、死亡、入院、手術、通院などの将来の発生確率を目的変数として出力する。具体的には、たとえば、分析部206は、重回帰分析なのどの統計的手法や、ニューラルネットワークなどの機械学習手法など、公知の技術を用いてデータ分析を実行する。具体的には、たとえば、分析部206は、既存の告知情報300から得られる高次特徴ベクトルVallとその分析結果との組み合わせを訓練データとして学習モデルを生成し、新規の告知情報300から得られる高次特徴ベクトルVallを学習モデルに入力することで、新規の告知情報300に対応する新規の分析結果を得る。
Returning to FIG. 2, the
<画面例>
図8は、入出力画面例1を示す説明図である。入出力画面800は、生成装置100の出力デバイス104の一例であるディスプレイまたは生成装置100と通信可能な他のコンピュータのディスプレイに表示される。
<Screen example>
FIG. 8 is an explanatory diagram showing an input/output screen example 1. FIG. The input/
入出力画面800は、告知情報読込みボタン801と、ドメイン知識読込みボタン802と、特徴抽出手法選択プルダウン803と、分析手法選択プルダウン804と、分析実行ボタン805と、実行結果表示領域806と、を含む。告知情報読込みボタン801は、入力デバイス103で押下されるボタンである。告知情報読込みボタン801が押下されると、記憶デバイス102に記憶された契約希望者の告知情報300が読み込まれる。
The input/
告知情報300は、告知情報読込みボタン801を押下する方法以外に、告知情報入力ボタン807の押下により告知情報入力画面を表示し、入力デバイス103によって入力することもできる。図9は、告知情報入力画面例を示す説明図である。告知情報入力画面900は、健診結果入力領域901と、問診結果入力領域902と、を含む。健診結果入力領域901では、入力デバイス103により、収縮期血圧323、拡張期血圧324、空腹時血糖325などの値が設定可能である。問診結果入力領域902では、入力デバイス103により、喫煙習慣331、飲酒習慣332、運動習慣333などの有無が設定可能である。
The
図8に戻り、ドメイン知識読込みボタン802は、入力デバイス103で押下されるボタンである。ドメイン知識読込みボタン802が押下されると、記憶デバイス102に記憶されたドメイン知識400が読み込まれる。あるいは、ドメイン知識入力ボタン808の押下により、ドメイン知識を入力するための設定画面(不図示)を表示することができる。設定画面では、入力デバイス103により、経時データ判定知識410、経時特徴知識420、および経時特徴分割知識430の内容について追加、変更、削除が可能となる。
Returning to FIG. 8 , a domain knowledge read
特徴抽出手法選択プルダウン803は、入力デバイス103で複数の特徴抽出手法をプルダウン表示させ、いずれか1つを選択させるボタンである。複数の特徴抽出手法には、たとえば、上述したPCAやStacked autoencoderなど公知の次元圧縮方法が含まれる。たとえば、PCAが選択されると、生成装置100は、PCAで次元圧縮をおこなうことになる。
A feature extraction method selection pull-down 803 is a button for displaying a pull-down list of a plurality of feature extraction methods on the
分析手法選択プルダウン804は、入力デバイス103で複数の分析手法をプルダウン表示させ、いずれか1つを選択させるボタンである。複数の分析手法には、たとえば、上述した重回帰分析なのどの統計的手法やニューラルネットワークなどの機械学習手法など公知の手法が含まれる。たとえば、重回帰分析が選択されると、生成装置100は、重回帰分析でデータ分析をおこなうことになる。
An analysis method selection pull-down 804 is a button for displaying a pull-down display of a plurality of analysis methods on the
分析実行ボタン805は、入力デバイス103で押下されるボタンである。分析実行ボタンが押下されると、生成装置100は、告知情報300およびドメイン知識400を記憶デバイス102からロードし、特徴抽出手法選択プルダウン803で選択された手法により次元圧縮をおこない、分析手法選択プルダウン804で選択された手法により、データ分析を実行する。実行結果表示領域806は、分析実行ボタン805が押下されたことにより実行されたデータ分析の実行結果が表示される領域である。
An
図10は、入出力画面例2を示す説明図である。図10では、実行結果表示領域806に氏名ID311ごとの分析結果1000が表示される。
FIG. 10 is an explanatory diagram showing example 2 of the input/output screen. In FIG. 10 , an
<生成処理手順例>
図11は、生成装置100による生成処理手順例を示すフローチャートである。生成装置100は、分析実行ボタン805の押下により、告知情報300およびドメイン知識400を読み込み(ステップS1101)、告知情報300内における契約希望者の分析対象データの各々について、経時データ232であるか非経時データ231であるかを判定部201により判定する(ステップS1102)。経時データ232であると判定されたデータについて(ステップS1102:Yes)、生成装置100は、生成部202により経時特徴データ500を生成し(ステップS1103)、分割部203により複数の経時特徴データを複数のグループに分割する(ステップS1104)。
<Generation processing procedure example>
FIG. 11 is a flow chart showing an example of a generation processing procedure by the
非経時データ231であると判定されたデータについて(ステップS1102:No)、生成装置100は、次元圧縮部204により非経時データ231に関する高次特徴データ701を抽出する(ステップS1105)。同様に、生成装置100は、次元圧縮部204により経時データ232に関する高次特徴データ702-1~702-nを抽出する(ステップS1106-1~S1106-n)。
For the data determined to be non-temporal data 231 (step S1102: No), the generating
そして、生成装置100は、結合部205により高次特徴データ701、702-1~702-nを結合して、結合高次特徴データ710を生成し(ステップS1107)、分析部206によりデータ分析を実行して(ステップS1108)、分析結果1000を入出力画面800の実行結果表示領域806に表示する。これにより、一連の生成処理が終了する。
このように、実施例1によれば、経時特徴データ500が経時特徴分割知識430に従ってグループ分けされるため、分析に不要な特徴量の生成を抑制することができる。これにより、高品質な説明変数を生成することができ、データ分析の高精度化を図ることができる。また、分岐に不要な特徴量の生成を抑制することにより、計算コストが低減され、データ生成およびデータ分析における計算効率の向上を図ることができる。
As described above, according to the first embodiment, the
つぎに、実施例2について説明する。実施例2では、実施例1との相違点を中心に説明するため、実施例1と同一構成には同一符号を付し、その説明を省略する。 Next, Example 2 will be described. In the second embodiment, differences from the first embodiment will be mainly described, so that the same components as those in the first embodiment are denoted by the same reference numerals, and the description thereof will be omitted.
図12は、実施例2にかかる生成装置100の機能的構成例を示すブロック図である。実施例1にかかる生成装置100は、次元圧縮部204による次元圧縮処理、結合部205による結合処理、および分析部206による分析処理をそれぞれ独立した処理として実行したが、実施例2では、次元圧縮部204、結合部205および分析部206に替えて、マルチモーダルニューラルネットワーク1200を適用することで、次元圧縮部204による次元圧縮処理、結合部205による結合処理、および分析部206による分析処理を連続的に実行する。
FIG. 12 is a block diagram of a functional configuration example of the
図13は、マルチモーダルニューラルネットワーク1200の一例を示す説明図である。図14は、マルチモーダルニューラルネットワーク1200による分析結果1400を示す入出力画面例を示す説明図である。
FIG. 13 is an explanatory diagram showing an example of a multimodal
マルチモーダルニューラルネットワーク1200は、まず、複数のグループに分類された入力ベクトルに対し、各グループで分岐したニューラルネットワークf1,f2,…,fnで特徴抽出を行う。つぎに、マルチモーダルニューラルネットワーク1200は、ニューラルネットワークf1,f2,…,fnの出力ベクトルを結合し、全結合ネットワークgによって特徴抽出および分析を行い、出力層hにて分析結果を出力する。ニューラルネットワークf1,f2,…,fnが次元圧縮処理に対応し、全結合ネットワークgおよび出力層hが結合処理および分析処理に対応する。
The multimodal
マルチモーダルニューラルネットワーク1200の学習は、ニューラルネットワークf1,f2,…,fnに入力される入力ベクトルと、出力値である分析結果の教師あり学習である。マルチモーダルニューラルネットワーク1200は、グループごとの特徴抽出、全グループを結合した高次特徴抽出、分析の3つの処理を同時に学習することができる。したがって、ネットワークの構造やパラメータの設計次第で高精度な分析が可能である。マルチモーダルニューラルネットワーク1200の動作は、たとえば、図13に示した式(1)により表現される。
The learning of the multimodal
h=g(f(Ua),…,f(Ub1-1),f(Ub1-2),…,f(Ub3-1),f(Ub3-2),…,f(Ub4-1),f(Ub4-2),…)・・・(1) h=g(f(Ua), ..., f(Ub1-1), f(Ub1-2), ..., f(Ub3-1), f(Ub3-2), ..., f(Ub4-1), f(Ub4-2),...)...(1)
なお、式(1)において、ベクトルUaは、非経時データ231のベクトル表現である。ベクトルUaを関数fに与えることで、非経時データ231に関する高次特徴データ701のベクトルVa1、Va2、…が生成される。また、ベクトルUb1-1、ベクトルUb1-2、…を関数fに与えることで、経時データ232に関する高次特徴データ702-1のベクトルVb1-1、Vba1-2、…が生成される。
Note that in equation (1), the vector Ua is a vector representation of the
また、ベクトルUb2-1、ベクトルUb2-2、…を関数fに与えることで、経時データ232に関する高次特徴データ702-2のベクトルVb2-1、Vba2-2、…が生成される。また、ベクトルUb3-1、ベクトルUb3-2、…を関数fに与えることで、経時データ232に関する高次特徴データ702-3のベクトルVb3-1、Vba3-2、…が生成される。また、ベクトルUb4-1、ベクトルUb4-2、…を関数fに与えることで、経時データ232に関する高次特徴データ702-4のベクトルVb4-1、Vba4-2、…が生成される。 Also, by giving the vector Ub2-1, the vector Ub2-2, . . . to the function f, the vectors Vb2-1, Vba2-2, . Also, by giving the vector Ub3-1, the vector Ub3-2, . . . to the function f, the vectors Vb3-1, Vba3-2, . Also, by giving vector Ub4-1, vector Ub4-2, . . . to function f, vectors Vb4-1, Vba4-2, .
このように、実施例2によれば、次元圧縮部204による次元圧縮処理、結合部205による結合処理、および分析部206による分析処理が連続的に実行されるため、生成処理および分析処理の高速化および高精度化を図ることができる。
As described above, according to the second embodiment, since the dimension compression processing by the
また、上述した実施例1および実施例2では、生命保険の引受査定における保険金支払リスク予測を例にあげて説明したが、企業の財務分析にも適用可能である。この場合、告知情報300に替えて有価証券報告書に記載されたデータまたは当該データから算出される指標データとする。また、経時特徴分割知識430には、たとえば、上記データを、収益性、安全性、活動性、生産性および成長性の5つの観点でグループ分けした情報となる。
Further, in the first and second embodiments described above, the prediction of the insurance claim payment risk in the underwriting assessment of life insurance was explained as an example, but the present invention can also be applied to the financial analysis of companies. In this case, instead of the
収益性とは、企業がどれだけ利益を上げられているかを示す項目であり、売上高総利益率,売上高営業利益率,総資本経常利益率(ROA),自己資本当期利益率(ROE)を含む。安全性とは、銀行からの借入に対する返済能力といった企業の支払い能力を示す項目であり、流動比率,当座比率,営業キャッシュフロー,投資キャッシュフローなどを含む。活動性とは、資本を効率的に使い、多くの売り上げをあげているかを示す項目であり、総資本回転率,固定資産回転率,棚卸資産回転率などを含む。 Profitability is an item that indicates how much profit a company is making. Gross profit margin on sales, operating profit on sales, ordinary return on capital (ROA), return on equity (ROE) including. Safety is an item that indicates the ability of a company to pay for borrowings from banks, and includes current ratio, quick ratio, operating cash flow, investment cash flow, and the like. Activity is an item that indicates whether capital is used efficiently and sales are high, and includes total capital turnover, fixed asset turnover, inventory turnover, and the like.
生産性とは、企業が従業員や設備などを効率よく活用しているかどうかを示す項目であり、売上高付加価値率,労働分配率,労働生産性などを含む。成長性とは、企業の今後の成長可能性を示す項目であり、売上高伸び率,経常利益伸び率,当期純利益伸び率などを含む。このように、実施例1および実施例2にかかる生成装置100は、各種データ分析に適用可能である。
Productivity is an item that indicates whether a company is using its employees and facilities efficiently, and includes sales value added ratio, labor share, and labor productivity. Growth potential is an item that indicates the future growth potential of a company, and includes sales growth rate, current profit growth rate, current net profit growth rate, and the like. As described above, the
なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加、削除、または置換をしてもよい。 It should be noted that the present invention is not limited to the embodiments described above, but includes various modifications and equivalent configurations within the scope of the appended claims. For example, the above-described embodiments have been described in detail for easy understanding of the present invention, and the present invention is not necessarily limited to those having all the described configurations. Also, part of the configuration of one embodiment may be replaced with the configuration of another embodiment. Moreover, the configuration of another embodiment may be added to the configuration of one embodiment. Moreover, other configurations may be added, deleted, or replaced with respect to a part of the configuration of each embodiment.
また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサ101がそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。
Further, each configuration, function, processing unit, processing means, etc. described above may be realized by hardware, for example, by designing a part or all of them with an integrated circuit, and the
各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)等の記憶装置、又は、IC(Integrated Circuit)カード、SDカード、DVD(Digital Versatile Disc)の記録媒体に格納することができる。 Information such as programs, tables, files, etc. that realize each function is stored in storage devices such as memory, hard disk, SSD (Solid State Drive), or IC (Integrated Circuit) card, SD card, DVD (Digital Versatile Disc) recording Can be stored on media.
また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。 In addition, the control lines and information lines indicate those considered necessary for explanation, and do not necessarily indicate all the control lines and information lines necessary for mounting. In practice, it can be considered that almost all configurations are interconnected.
100 生成装置
101 プロセッサ
102 記憶デバイス
201 判定部
202 生成部
203 分割部
204 次元圧縮部
205 結合部
206 分析部
300 告知情報
400 ドメイン知識
500 経時特徴データ
600 分割経時特徴データ
700 高次特徴データ
710 結合高次特徴データ
1200 マルチモーダルニューラルネットワーク
100
Claims (7)
経時データから得られる経時的な特徴を示す経時特徴情報と、前記経時データが所属すべき複数のグループが規定されたグループ分け情報と、にアクセス可能であり、
前記プロセッサは、
前記経時特徴情報に基づいて、分析対象の経時データから、前記経時的な特徴を示す複数の経時特徴データを生成する生成処理と、
前記グループ分け情報に基づいて、前記生成処理によって生成された複数の経時特徴データを前記複数のグループに分割する分割処理と、
前記分割処理によって分割された複数のグループの各々を次元圧縮し、分析対象の非経時データを次元圧縮する次元圧縮処理と、
を実行することを特徴とする生成装置。 A generating device having a processor that executes a program and a storage device that stores the program,
Accessible to temporal feature information indicating temporal features obtained from the temporal data, and grouping information defining a plurality of groups to which the temporal data should belong,
The processor
a generation process of generating a plurality of pieces of temporal feature data indicating the temporal feature from the temporal data to be analyzed based on the temporal feature information;
a division process for dividing the plurality of temporal feature data generated by the generation process into the plurality of groups based on the grouping information;
Dimensional compression processing for dimensionally compressing each of the plurality of groups divided by the division processing, and dimensionally compressing non-temporal data to be analyzed ;
A generating device characterized by executing
前記経時データおよび非経時データのいずれに該当するかを判定する判定情報にアクセス可能であり、 Accessible to determination information for determining which of the chronological data and the non-chronological data corresponds,
前記プロセッサは、The processor
前記判定情報に基づいて、分析対象データが前記経時データおよび前記非経時データのいずれに該当するかを判定する判定処理を実行し、executing determination processing for determining whether the data to be analyzed corresponds to the temporal data or the non-temporal data based on the determination information;
前記生成処理では、前記プロセッサは、前記判定処理によって前記経時データであると判定された分析対象データを前記分析対象の経時データとし、前記経時特徴情報に基づいて、前記分析対象の経時データから、前記複数の経時特徴データを生成し、In the generation process, the processor treats the analysis target data determined to be the temporal data by the determination process as the analysis target temporal data, and based on the temporal feature information, the analysis target temporal data is: generating the plurality of temporal feature data;
前記次元圧縮処理では、前記プロセッサは、前記判定処理によって前記非経時データであると判定された分析対象データを前記分析対象の非経時データとし、前記分析対象の非経時データを次元圧縮する、In the dimension compression processing, the processor treats the analysis target data determined to be the non-temporal data by the determination processing as the analysis target non-temporal data, and dimensionally compresses the analysis target non-temporal data.
ことを特徴とする生成装置。A generating device characterized by:
前記次元圧縮処理による次元圧縮後の分析対象の非経時データと次元圧縮後の複数のグループとを結合する結合処理を実行することを特徴とする生成装置。A generating device that performs a combining process for combining non-temporal data to be analyzed after the dimension compression by the dimension compression process and a plurality of groups after the dimension compression.
前記プロセッサは、The processor
前記結合処理による結合結果を説明変数とし、対応する目的変数を出力する分析処理を実行することを特徴とする生成装置。A generation apparatus characterized by executing an analysis process for outputting a corresponding objective variable using a combination result obtained by the combination process as an explanatory variable.
前記次元圧縮処理、前記結合処理、および前記分析処理を、マルチモーダルニューラルネットワークにより実行することを特徴とする生成装置。A generating device, wherein the dimensionality compression processing, the connection processing, and the analysis processing are performed by a multimodal neural network.
前記生成装置は、経時データの経時的な特徴を示す経時特徴情報と、前記経時データが所属すべき複数のグループが規定されたグループ分け情報と、にアクセス可能であり、The generation device is capable of accessing temporal characteristic information indicating temporal characteristics of temporal data and grouping information defining a plurality of groups to which the temporal data should belong,
前記プロセッサは、The processor
前記経時特徴情報に基づいて、分析対象の経時データから、前記経時的な特徴を示す複数の経時特徴データを生成する生成処理と、a generation process of generating a plurality of pieces of temporal feature data indicating the temporal feature from the temporal data to be analyzed based on the temporal feature information;
前記グループ分け情報に基づいて、前記生成処理によって生成された複数の経時特徴データを前記複数のグループに分割する分割処理と、a division process for dividing the plurality of temporal feature data generated by the generation process into the plurality of groups based on the grouping information;
前記分割処理によって分割された複数のグループの各々を次元圧縮し、分析対象の非経時データを次元圧縮する次元圧縮処理と、Dimensional compression processing for dimensionally compressing each of the plurality of groups divided by the division processing, and dimensionally compressing non-temporal data to be analyzed;
を実行することを特徴とする生成方法。A generation method characterized by executing
前記プロセッサは、経時データの経時的な特徴を示す経時特徴情報と、前記経時データが所属すべき複数のグループが規定されたグループ分け情報と、にアクセス可能であり、The processor is capable of accessing temporal characteristic information indicating temporal characteristics of the temporal data and grouping information defining a plurality of groups to which the temporal data should belong,
前記プロセッサに、to the processor;
前記経時特徴情報に基づいて、分析対象の経時データから、前記経時的な特徴を示す複数の経時特徴データを生成する生成処理と、a generation process of generating a plurality of pieces of temporal feature data indicating the temporal feature from the temporal data to be analyzed based on the temporal feature information;
前記グループ分け情報に基づいて、前記生成処理によって生成された複数の経時特徴データを前記複数のグループに分割する分割処理と、a division process for dividing the plurality of temporal feature data generated by the generation process into the plurality of groups based on the grouping information;
前記分割処理によって分割された複数のグループの各々を次元圧縮し、分析対象の非経時データを次元圧縮する次元圧縮処理と、Dimensional compression processing for dimensionally compressing each of the plurality of groups divided by the division processing, and dimensionally compressing non-temporal data to be analyzed;
を実行させることを特徴とする生成プログラム。A generation program characterized by executing
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019118136A JP7245125B2 (en) | 2019-06-26 | 2019-06-26 | Generation device, generation method, and generation program |
PCT/JP2020/021214 WO2020261869A1 (en) | 2019-06-26 | 2020-05-28 | Generation device, generation method, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019118136A JP7245125B2 (en) | 2019-06-26 | 2019-06-26 | Generation device, generation method, and generation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021005191A JP2021005191A (en) | 2021-01-14 |
JP7245125B2 true JP7245125B2 (en) | 2023-03-23 |
Family
ID=74061215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019118136A Active JP7245125B2 (en) | 2019-06-26 | 2019-06-26 | Generation device, generation method, and generation program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7245125B2 (en) |
WO (1) | WO2020261869A1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4361598A1 (en) * | 2021-06-23 | 2024-05-01 | Sony Group Corporation | Particle analysis system, information processing device, and collecting device |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009050596A (en) | 2007-08-29 | 2009-03-12 | Hitachi Medical Corp | Abdominal girth estimating apparatus |
JP2010191556A (en) | 2009-02-17 | 2010-09-02 | Hitachi Ltd | Abnormality detecting method and abnormality detecting system |
JP2016041445A (en) | 2014-08-18 | 2016-03-31 | Jfeスチール株式会社 | Surface defect determination method and apparatus for continuous casting slab and method for manufacturing steel cast piece using surface defect determination method |
-
2019
- 2019-06-26 JP JP2019118136A patent/JP7245125B2/en active Active
-
2020
- 2020-05-28 WO PCT/JP2020/021214 patent/WO2020261869A1/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009050596A (en) | 2007-08-29 | 2009-03-12 | Hitachi Medical Corp | Abdominal girth estimating apparatus |
JP2010191556A (en) | 2009-02-17 | 2010-09-02 | Hitachi Ltd | Abnormality detecting method and abnormality detecting system |
JP2016041445A (en) | 2014-08-18 | 2016-03-31 | Jfeスチール株式会社 | Surface defect determination method and apparatus for continuous casting slab and method for manufacturing steel cast piece using surface defect determination method |
Non-Patent Citations (4)
Title |
---|
三好 利昇、外5名,特定健診・レセプトデータを用いたベイジアンネットワークによる生活習慣病の医療費予測モデルの構築,電子情報通信学会技術研究報告 Vol.113 No.493,日本,一般社団法人電子情報通信学会,2014年03月06日,第113巻,第493号,p.139-144 |
小林 薫樹、外6名,深層学習を用いた実時間非線形有限要素法による肝臓変形推定,電子情報通信学会技術研究報告,日本,一般社団法人電子情報通信学会,2016年01月12日,第115巻,第401号,p.321-325 |
島 圭介,次元圧縮機能を有するリカレント確率ニューラルネットの提案と時系列脳波パターン識別への応用,計測自動制御学会論文集,日本,公益社団法人計測自動制御学会,2012年04月30日,Vol.48,No.4 |
柴田 曉秀、外5名,弾性可変型模擬舌を用いた食品テクスチャセンシング,日本ロボット学会誌,日本,一般社団法人日本ロボット学会,2016年11月15日,第34巻,第9号,p.61-69 |
Also Published As
Publication number | Publication date |
---|---|
WO2020261869A1 (en) | 2020-12-30 |
JP2021005191A (en) | 2021-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11600390B2 (en) | Machine learning clinical decision support system for risk categorization | |
Krishnaiah et al. | Heart disease prediction system using data mining techniques and intelligent fuzzy approach: a review | |
Shahian et al. | Massachusetts cardiac surgery report card: implications of statistical methodology | |
Sk et al. | Coronary Heart Disease Prediction and Classification using Hybrid Machine Learning Algorithms | |
Agarwal et al. | A natural language processing framework for assessing hospital readmissions for patients with COPD | |
Einav et al. | Beyond statistics: the economic content of risk scores | |
Taloba et al. | Estimation and prediction of hospitalization and medical care costs using regression in machine learning | |
JP6803423B2 (en) | Model building system, information processing system and program | |
Hynninen et al. | Operationalization of utilitarian and egalitarian objectives for optimal allocation of health care resources | |
JP7245125B2 (en) | Generation device, generation method, and generation program | |
JP2021189585A (en) | Prediction device, prediction method, and prediction program | |
Baechle et al. | A cost sensitive approach to predicting 30-day hospital readmission in COPD patients | |
JP2006163489A (en) | Disease onset probability calculating device, and program | |
JP2021149423A (en) | Prediction apparatus, prediction method, and prediction program for patient state | |
JP2000348015A (en) | System, method for evaluating evaluation item of evalucated object having temporal variation, and recording medium | |
Eijkenaar et al. | Performance profiling in primary care: does the choice of statistical model matter? | |
Mansouri et al. | A hybrid machine learning approach for early mortality prediction of ICU patients | |
Singh et al. | Expert system based detection and classification of coronary artery disease using ranking methods and nonlinear attributes | |
JP2020135489A (en) | Health care data analyzer and health care data analysis method | |
Herazo-Padilla et al. | Profiling health prevention population for hypertension screening and ECG test rationing | |
Kumar et al. | Modeling trade–employment elasticity nexus: evidence from India | |
Battula et al. | Prediction of Hospital Re-admission Using Firefly Based Multi-layer Perceptron. | |
Sharma | Heart diseases prediction using hybrid ensemble learning | |
WO2023100735A1 (en) | Uncertainty estimation device, uncertainty estimation method, and program | |
US20220359082A1 (en) | Health state prediction system including ensemble prediction model and operation method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230228 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230310 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7245125 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |