JP2019067270A

JP2019067270A - 分類プログラム、分類方法、および分類装置

Info

Publication number: JP2019067270A
Application number: JP2017193865A
Authority: JP
Inventors: 孝明浜名; Takaaki Hamana; 藤田　大輔; Daisuke Fujita; 大輔藤田; 尚小山内; Hisashi Osanai; 史穂北本; Fumio Kitamoto; 孝之佐野; Takayuki Sano
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2017-10-03
Filing date: 2017-10-03
Publication date: 2019-04-25
Anticipated expiration: 2037-10-03
Also published as: JP6881203B2

Abstract

【課題】利用者が、対象データが正常または異常に分類された理由を把握するための情報を生成すること。【解決手段】分類装置１００は、決定木モデル１１０により対象データを分類する。分類装置１００は、名称が未設定である第１の葉ノードに対象データが分類された場合、ノード間の位置関係に基づいて、決定木モデル１１０のうち、名称が設定済みである第２の葉ノードを選択する。分類装置１００は、選択した第２の葉ノードの名称に基づいて、第１の葉ノードの名称を生成する。【選択図】図１

Description

本発明は、分類プログラム、分類方法、および分類装置に関する。

従来、学習データに基づいて、対象データを分類する条件を表すノードと対象データを分類する属性を表す葉ノードとを含む決定木モデルを生成し、生成した決定木モデルにより対象データを分類する技術がある。例えば、決定木モデルは、社会保障給付費の請求データを、正常な請求データまたは不正請求に関する異常な請求データに分類する際に利用される。

国際公開第２０１６／１８９６０６号特開２０１７−６２７１３号公報特表２００１−５１６１０７号公報

しかしながら、従来技術では、利用者は対象データが正常または異常に分類された理由を把握することが難しい。例えば、対象データを分類する過程において判定された条件の判定結果を羅列して利用者に通知することが考えられるが、判定された条件の数が増加するほど、利用者は、対象データが正常または異常に分類された理由を直観的に把握することが難しくなる。

１つの側面では、本発明は、利用者が、対象データが正常または異常に分類された理由を把握するための情報を生成する分類プログラム、分類方法、および分類装置を提供することを目的とする。

１つの実施態様によれば、対象データを分類する条件を表すノードと、前記対象データが正常であること、または、前記対象データが異常であることを表す葉ノードとを含む決定木モデルにより、前記対象データを分類し、名称が未設定である第１の葉ノードに前記対象データが分類された場合、ノード間の位置関係に基づいて、前記決定木モデルのうち、名称が設定済みである第２の葉ノードを選択し、選択した前記第２の葉ノードの名称に基づいて、前記第１の葉ノードの名称を生成する分類プログラム、分類方法、および分類装置が提案される。

一態様によれば、利用者が、対象データが正常または異常に分類された理由を把握するための情報を生成することが可能になる。

図１は、実施の形態にかかる分類方法の一実施例を示す説明図である。図２は、分類システム２００の一例を示す説明図である。図３は、分類装置１００のハードウェア構成例を示すブロック図である。図４は、請求データ４００のデータ構造の記憶内容の一例を示す説明図である。図５は、請求テーブル５００の記憶内容の一例を示す説明図である。図６は、端末装置２０１のハードウェア構成例を示すブロック図である。図７は、分類装置１００の機能的構成例を示すブロック図である。図８は、分類装置１００を利用する状況の具体例を示す説明図である。図９は、決定木モデル８０５を生成する流れを示す説明図である。図１０は、葉ノードに名称を設定する流れを示す説明図（その１）である。図１１は、葉ノードに名称を設定する流れを示す説明図（その２）である。図１２は、分類装置１００が葉ノードに名称を設定する動作例１を示す説明図（その１）である。図１３は、分類装置１００が葉ノードに名称を設定する動作例１を示す説明図（その２）である。図１４は、分類装置１００が葉ノードに名称を設定する動作例１を示す説明図（その３）である。図１５は、分類装置１００が葉ノードに名称を設定する動作例１を示す説明図（その４）である。図１６は、分類装置１００が葉ノードに名称を設定する動作例１を示す説明図（その５）である。図１７は、分類装置１００が葉ノードに名称を設定する動作例１を示す説明図（その６）である。図１８は、分類装置１００が葉ノードに名称を設定する動作例１を示す説明図（その７）である。図１９は、分類装置１００が葉ノードに名称を設定する動作例１を示す説明図（その８）である。図２０は、分類装置１００が葉ノードに名称を設定する動作例２を示す説明図（その１）である。図２１は、分類装置１００が葉ノードに名称を設定する動作例２を示す説明図（その２）である。図２２は、分類装置１００が葉ノードに名称を設定する動作例２を示す説明図（その３）である。図２３は、端末装置２０１における出力例１を示す説明図である。図２４は、端末装置２０１における出力例２を示す説明図である。図２５は、全体処理手順の一例を示すフローチャートである。図２６は、選択処理手順の一例を示すフローチャートである。図２７は、検索処理手順の一例を示すフローチャートである。

以下に、図面を参照して、本発明にかかる分類プログラム、分類方法、および分類装置の実施の形態を詳細に説明する。

（実施の形態にかかる分類方法の一実施例）
図１は、実施の形態にかかる分類方法の一実施例を示す説明図である。分類装置１００は、決定木モデルに基づいて対象データを分類するコンピュータである。

決定木モデルは、対象データを分類する条件を表すノードと、対象データを分類する属性を表す葉ノードとを含むモデルである。葉ノードは、例えば、対象データが正常であること、または、対象データが異常であることを表す。

以下の図面では、条件を表すノードの左側の子ノードに、条件の判定結果がＴｒｕｅの場合に対応する子ノードを表示し、右側の子ノードに、条件の判定結果がＦａｌｓｅの場合に対応する子ノードを表示し、ＴｒｕｅとＦａｌｓｅとの表示を省略する場合がある。

ここで、省庁や自治体などでは、社会保障給付費の請求書に対応する請求データを受け付け、異常な請求データがあるか否かをチェックすることがあり、請求データが膨大になるほど、省庁や自治体などの職員にかかる負担が増大してしまう。また、請求データが膨大になるほど、省庁や自治体などの職員は、異常な請求データを見落としやすくなってしまう。異常な請求データは、例えば、不正請求の請求データである。異常な請求データは、具体的には、水増し請求の請求データである。異常な請求データは、具体的には、架空請求の請求データである。

このため、請求データを対象データとして、正常な請求データまたは異常な請求データに自動で分類することが望まれる。例えば、請求データを、正常な請求データまたは異常な請求データに分類するために、決定木モデルを利用することが望まれる。決定木モデルは、例えば、過去の請求データに基づいて生成される。決定木モデルを利用する具体的な状況については、例えば、図８を用いて後述する。

また、病院や薬局などでは、カルテや処方箋、および、医療報酬の明細書などに対応する医療データを管理し、異常な医療データがあるか否かをチェックすることがあり、医療データが膨大になるほど、病院や薬局などの職員にかかる負担が増大してしまう。また、病院や薬局などの職員は、異常な医療データを見落としやすくなってしまう。異常な医療データは、具体的には、特定の病気の情報を含むが、特定の病気に対して必須な薬や検査の情報を含まない医療データである。異常な医療データは、具体的には、月に１回だけ申請可能な請求が月に２回ある医療データである。

このため、医療データを対象データとして、正常な医療データまたは異常な医療データに自動で分類することが望まれる。例えば、医療データを、正常な医療データまたは異常な医療データに分類するために、決定木モデルを利用することが望まれる。決定木モデルは、例えば、過去の医療データに基づいて生成される。

しかしながら、決定木モデルを利用する利用者は、対象データが正常または異常に分類された結果の細かい種別を把握することが難しく、対象データが正常または異常に分類された理由を把握することが難しい。具体的には、対象データが請求データであり、対象データが不正請求に分類された場合、利用者は、対象データが分類された不正請求の種別を把握することが難しく、対象データが分類された理由を把握することが難しい。

これに対し、対象データを分類する過程において判定された条件の判定結果を羅列して利用者に通知する場合が考えられる。しかしながら、この場合、判定された条件の数が増加するほど、利用者は、対象データが正常または異常に分類された理由を直観的に把握することが難しくなってしまう。

また、利用者に決定木モデルのすべての葉ノードに名称を設定させ、対象データが葉ノードに分類された際、対象データに対応付けて葉ノードに設定された名称を利用者に通知する場合が考えられる。しかしながら、この場合、利用者に決定木モデルのすべての葉ノードに名称を設定させることは難しい。例えば、葉ノードの数が増大するほど、利用者にかかる負担が増大してしまう。

また、教師なし学習を利用して、または、教師あり学習と教師なし学習とを併用して決定木モデルを生成する状況では、利用者は、教師なし学習によって決定木モデルに追加された葉ノードに、どのような対象データが分類されるのかを予め把握することが難しい。このため、利用者は、教師なし学習によって追加された葉ノードについては、名称を設定することは難しい。

そこで、本実施の形態では、決定木モデル上で名称が未設定の第１の葉ノードに対象データが分類された場合、名称が設定済みの第２の葉ノードに基づいて、第１の葉ノードの名称を生成することができる分類方法について説明する。この分類方法によれば、対象データを分類した葉ノードの名称を利用者に提示可能にすることができ、対象データが正常または異常に分類された理由を利用者が把握しやすくすることができる。

図１において、分類装置１００は、決定木モデル１１０を記憶する。分類装置１００は、例えば、学習データに基づいて決定木モデル１１０を生成して記憶する。分類装置１００は、例えば、学習データに基づいて決定木モデル１１０を生成する他装置から、決定木モデル１１０を受信して記憶してもよい。

決定木モデル１１０は、対象データを分類する条件を表すノードと、対象データが正常であること、または、対象データが異常であることを表す葉ノードとを含む。対象データは、例えば、何らかの事業者から提出される。対象データは、具体的には、社会保障給付費の請求書に対応する請求データである。図１の例では、決定木モデル１１０は、例えば、対象データを分類する条件を表すノード１１１〜１１６と、対象データが正常であること、または、対象データが異常であることを表す葉ノード１２１〜１２７とを含む。

分類装置１００は、決定木モデル１１０により対象データを分類する。分類装置１００は、例えば、決定木モデル１１０の根ノードから順に、ノードが表す条件を対象データが満たすか否かを判定し、判定した結果に基づいて、いずれかの葉ノードに対象データを分類する。葉ノードへの分類は、葉ノードが表す属性への分類に対応し、例えば、葉ノードが表す正常または異常への分類に対応する。図１の例では、分類装置１００は、具体的には、対象データを、葉ノード１２７に分類する。

分類装置１００は、名称が未設定である第１の葉ノードに対象データが分類された場合、ノード間の位置関係に基づいて、決定木モデル１１０のうち、名称が設定済みである第２の葉ノードを選択する。ノード間の位置関係は、例えば、ノード間の親子関係によって表される。分類装置１００は、例えば、ノード間の位置関係に基づいて、第１の葉ノードの近傍にある葉ノードの中から、第２の葉ノードを選択する。ノード間の距離は、例えば、ノード間を接続するエッジの数によって表される。近傍は、例えば、ノード間を接続するエッジの数が所定数以下であることに対応する。

図１の例では、分類装置１００は、具体的には、名称が未設定である葉ノード１２７に対象データが分類されたため、葉ノード１２７の近傍にある葉ノード１２３，１２６の中から、葉ノード１２３を選択する。第１の葉ノードの近傍にある葉ノードの中から第２の葉ノードを選択する具体例については、図１７および図１８を用いて後述する。

分類装置１００は、選択した第２の葉ノードの名称に基づいて、第１の葉ノードの名称を生成する。第２の葉ノードの名称は、対象データが分類された結果の細かい種別に対応し、対象データが分類された理由を示す名称である。第２の葉ノードの名称は、例えば、ＸＸサービスやＢ不正などである。第２の葉ノードの名称は、具体的には、水増し請求や架空請求などである。

図１の例では、分類装置１００は、例えば、選択した葉ノード１２３の名称「Ｂ不正」に基づいて、葉ノード１２７の名称「Ｂ不正に近い傾向が見られる」を生成する。また、分類装置１００は、例えば、葉ノード１２６を選択した場合であれば、葉ノード１２６の名称「ＸＸサービス」に基づいて、葉ノード１２７の名称「ＸＸサービスに関連する不正請求と考えられる」を生成する。

分類装置１００は、さらに、選択した第２の葉ノードに対象データが分類される場合に判定される条件の判定結果と、第１の葉ノードに対象データが分類される場合に判定される条件の判定結果との差異を、第１の葉ノードの名称に反映してもよい。差異は、例えば、根ノードから第１の葉ノードまでの経路上の各ノードが表す条件の判定結果と、根ノードから第２の葉ノードまでの経路上の各ノードが表す条件の判定結果との差異である。

分類装置１００は、例えば、選択した葉ノード１２６の名称「ＸＸサービス」と、判定条件の差異「（ＸＸサービスに比べて）Ｄ＞１００ではない」とに基づいて、葉ノード１２７の名称「ＸＸサービスに関連し、Ｄ＞１００ではない」を生成する。

これにより、分類装置１００は、生成した第１の葉ノードの名称を、対象データに対応付けて出力可能にすることができる。このため、分類装置１００は、利用者が、対象データが分類された結果の細かい種別を把握可能にし、対象データが分類された理由を把握可能にすることができる。

結果として、利用者は、対象データが膨大であっても、それぞれの対象データが分類された理由を参照して、効率よく異常な対象データがあるか否かをチェックすることができ、効率よく業務を行うことができ、負担の低減化を図ることができる。また、利用者は、異常な対象データを見落としにくくなり、効率よく業務を行うことができる。

また、利用者は、いずれの対象データが、比較的重大な異常に分類されたかを把握し、いずれの対象データを精査することが好ましいかを判断することができる。また、利用者は、対象データを提出した複数の事業者のうち、いずれの事業者が比較的重大な異常がある対象データを提出したかを判断することができ、監査することが好ましい事業者を特定することができる。

また、分類装置１００は、第１の葉ノードの名称を、第２の葉ノードの名称に基づいて生成することができ、利用者が直感的に理解しやすい名称を生成しやすくすることができる。このため、利用者は、対象データを分類する過程において判定された条件の判定結果を羅列した情報を参照する場合に比べて、対象データが分類された理由を把握しやすくなり、効率よく業務を行うことができる。

また、分類装置１００は、利用者が名称を設定していない葉ノードについて名称を生成することができる。このため、利用者は、決定木モデル１１０のすべての葉ノードに名称を設定しなくてもよく、負担の低減化を図ることができる。また、分類装置１００は、決定木モデル１１０に、教師なし学習によって追加された葉ノードについても、名称を設定することができる。このため、利用者は、対象データが、教師なし学習によって追加された葉ノードに分類された理由を把握することができる。

ここでは、分類装置１００が、対象データが分類された第１の葉ノードが、対象データが正常であることを表す葉ノードであっても、第１の葉ノードの名称を生成する場合について説明したが、これに限らない。例えば、分類装置１００が、対象データが分類された第１の葉ノードが、対象データが正常であることを表す葉ノードであれば、第１の葉ノードの名称を生成しない場合があってもよい。これにより、分類装置１００は、処理量の低減化を図ることができる。分類装置１００は、例えば、利用者が異常な対象データを発見することを求める場合、対象データが正常であることを表す葉ノードに名称を付けなくても、利用者の業務効率を低下させずに、処理量の低減化を図ることができる。

ここでは、分類装置１００が、ノード間の位置関係に基づいて、第１の葉ノードの近傍にある葉ノードの中から、第２の葉ノードを選択する場合について説明したが、これに限らない。例えば、分類装置１００が、ノード間の位置関係に基づいて、決定木モデル１１０のうち、第１の葉ノードを含む第１の部分木と同一または類似する第２の部分木に含まれる葉ノードの中から、第２の葉ノードを選択する場合があってもよい。第２の部分木に含まれる葉ノードの中から第２の葉ノードを選択する具体例については、図１９〜図２１を用いて後述する。

（分類システム２００の一例）
次に、図２を用いて、図１に示した分類装置１００を適用した、分類システム２００の一例について説明する。

図２は、分類システム２００の一例を示す説明図である。図２において、分類システム２００は、分類装置１００と、端末装置２０１とを含む。

分類システム２００において、分類装置１００と端末装置２０１とは、有線または無線のネットワーク２１０を介して接続される。ネットワーク２１０は、例えば、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、インターネットなどである。

分類装置１００は、端末装置２０１から学習データとなる請求データを受信し、決定木モデルを生成する。分類装置１００は、対象データとなる請求データを受信し、生成した決定木モデルの葉ノードに、請求データを分類する。分類装置１００は、請求データを分類した葉ノードに名称が未設定であれば、名称を生成する。

分類装置１００は、請求データを分類した結果に基づく情報を、端末装置２０１に出力させ、端末装置２０１の利用者に通知させる。分類装置１００は、例えば、請求データと、請求データを分類した葉ノードの名称とを対応付けて、端末装置２０１に表示させる。分類装置１００は、例えば、サーバやＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）などである。

端末装置２０１は、分類システム２００の利用者が利用するコンピュータである。利用者は、例えば、省庁や自治体、または、病院や薬局などの職員である。端末装置２０１は、例えば、省庁や自治体、または、病院や薬局などに設けられる。端末装置２０１は、学習データとなる請求データを、分類装置１００に送信する。端末装置２０１は、対象データとなる請求データを、分類装置１００に送信し、請求データを分類した結果に基づく情報を、分類装置１００から受信して出力する。端末装置２０１は、例えば、ＰＣ、タブレット端末、または、スマートフォンなどである。

ここでは、分類装置１００と端末装置２０１とが別の装置である場合について説明したが、これに限らない。例えば、分類装置１００が、端末装置２０１と一体である場合があってもよい。この場合、分類装置１００は、利用者の操作入力に基づいて、学習データとなる請求データ、または、対象データとなる請求データなどを受け付ける。

ここでは、分類装置１００が決定木モデルを生成し、対象データを分類する場合について説明したが、これに限らない。例えば、分類装置１００とは異なる他の装置が、決定木モデルを生成し、分類装置１００に送信する場合があってもよい。また、例えば、分類装置１００とは異なる他の装置が、対象データを分類した結果を、分類装置１００に送信する場合があってもよい。他の装置は、例えば、端末装置２０１である。

（分類装置１００のハードウェア構成例）
次に、図３を用いて、分類装置１００のハードウェア構成例について説明する。

図３は、分類装置１００のハードウェア構成例を示すブロック図である。図３において、分類装置１００は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）３０１と、メモリ３０２と、ネットワークＩ／Ｆ（Ｉｎｔｅｒｆａｃｅ）３０３と、記録媒体Ｉ／Ｆ３０４と、記録媒体３０５とを有する。また、各構成部は、バス３００によってそれぞれ接続される。

ここで、ＣＰＵ３０１は、分類装置１００の全体の制御を司る。メモリ３０２は、例えば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）およびフラッシュＲＯＭなどを有する。具体的には、例えば、フラッシュＲＯＭやＲＯＭが各種プログラムを記憶し、ＲＡＭがＣＰＵ３０１のワークエリアとして使用される。メモリ３０２に記憶されるプログラムは、ＣＰＵ３０１にロードされることで、コーディングされている処理をＣＰＵ３０１に実行させる。

ネットワークＩ／Ｆ３０３は、通信回線を通じてネットワーク２１０に接続され、ネットワーク２１０を介して他のコンピュータに接続される。そして、ネットワークＩ／Ｆ３０３は、ネットワーク２１０と内部のインターフェースを司り、他のコンピュータからのデータの入出力を制御する。ネットワークＩ／Ｆ３０３には、例えば、モデムやＬＡＮアダプタなどを採用することができる。

記録媒体Ｉ／Ｆ３０４は、ＣＰＵ３０１の制御に従って記録媒体３０５に対するデータのリード／ライトを制御する。記録媒体Ｉ／Ｆ３０４は、例えば、ディスクドライブ、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）ポートなどである。記録媒体３０５は、記録媒体Ｉ／Ｆ３０４の制御で書き込まれたデータを記憶する不揮発メモリである。記録媒体３０５は、例えば、ディスク、半導体メモリ、ＵＳＢメモリなどである。記録媒体３０５は、分類装置１００から着脱可能であってもよい。メモリ３０２、または、記録媒体３０５は、例えば、請求データや決定木モデルを記憶してもよい。

分類装置１００は、上述した構成部のほか、例えば、キーボード、マウス、ディスプレイ、プリンタ、スキャナ、マイク、スピーカーなどを有してもよい。また、分類装置１００は、記録媒体Ｉ／Ｆ３０４や記録媒体３０５を複数有していてもよい。また、分類装置１００は、記録媒体Ｉ／Ｆ３０４や記録媒体３０５を有していなくてもよい。

（請求データ４００のデータ構造）
次に、図４を用いて、分類装置１００が取得する請求データ４００のデータ構造について説明する。請求データ４００は、例えば、端末装置２０１から分類装置１００に送信される。

図４は、請求データ４００のデータ構造の記憶内容の一例を示す説明図である。図４に示すように、請求データ４００は、１以上の項目のフィールドを有する。請求データ４００は、各フィールドに情報を設定することにより、社会保障給付費の請求書の項目の値が記憶される。

項目のフィールドには、社会保障給付費の請求書の項目の値が設定される。項目は、例えば、項目Ａと、項目Ｂと、項目Ｃとである。項目は、具体的には、日付と、サービス区分と、金額と、利用量と、加算情報となどである。加算情報は、金額を増額して申請可能になる条件である。

（請求テーブル５００の記憶内容）
次に、図５を用いて、分類装置１００が取得した請求データ４００を管理する請求テーブル５００の記憶内容について説明する。請求テーブル５００は、例えば、図３に示した分類装置１００のメモリ３０２や記録媒体３０５などの記憶領域により実現される。

図５は、請求テーブル５００の記憶内容の一例を示す説明図である。図５に示すように、請求テーブル５００は、キーと、１以上の項目と、結果と、不正理由と、正常理由とのフィールドを有する。請求テーブル５００は、各フィールドに情報を設定することにより、請求データ４００と、請求データ４００を分類した結果に関する結果データがレコードとして記憶される。

キーのフィールドには、請求データ４００を識別するキーが設定される。項目のフィールドには、社会保障給付費の請求書の項目の値に対応し、キーによって識別される請求データ４００の項目のフィールドに設定された値が設定される。

結果のフィールドには、キーによって識別される請求データ４００を正常または不正請求に分類した結果が設定される。不正理由のフィールドには、請求データ４００が不正請求に分類された場合、請求データ４００が不正請求に分類された不正理由が設定される。不正理由は、例えば、水増し請求や架空請求などである。正常理由のフィールドには、請求データ４００が正常に分類された場合、請求データ４００が正常に分類された正常理由が設定される。正常理由は、例えば、居宅介護などである。

（学習データのデータ構造）
学習データは、過去の請求データ４００を含むため、学習データのデータ構造は、例えば、図４に示した請求データ４００のデータ構造と同様であるが、学習データは、結果のフィールドをさらに有してもよい。結果のフィールドには、過去の請求データ４００を利用者が正常または不正請求と判断した結果が設定される。

学習データは、例えば、学習テーブルを用いて記憶される。学習テーブルの一例は、例えば、図１２に示される。学習テーブルの記憶内容は、例えば、図５に示した請求テーブル５００の記憶内容と同様であるが、学習テーブルは、不正理由と正常理由とのフィールドを有さなくてもよい。

（端末装置２０１のハードウェア構成例）
次に、図６を用いて、端末装置２０１のハードウェア構成例について説明する。

図６は、端末装置２０１のハードウェア構成例を示すブロック図である。図５において、端末装置２０１は、ＣＰＵ６０１と、メモリ６０２と、ネットワークＩ／Ｆ６０３と、記録媒体Ｉ／Ｆ６０４と、記録媒体６０５と、ディスプレイ６０６と、入力装置６０７とを有する。また、各構成部は、バス６００によってそれぞれ接続される。

ここで、ＣＰＵ６０１は、端末装置２０１の全体の制御を司る。メモリ６０２は、例えば、ＲＯＭ、ＲＡＭおよびフラッシュＲＯＭなどを有する。具体的には、例えば、フラッシュＲＯＭやＲＯＭが各種プログラムを記憶し、ＲＡＭがＣＰＵ６０１のワークエリアとして使用される。メモリ６０２に記憶されるプログラムは、ＣＰＵ６０１にロードされることで、コーディングされている処理をＣＰＵ６０１に実行させる。

ネットワークＩ／Ｆ６０３は、通信回線を通じてネットワーク２１０に接続され、ネットワーク２１０を介して他のコンピュータに接続される。そして、ネットワークＩ／Ｆ６０３は、ネットワーク２１０と内部のインターフェースを司り、他のコンピュータからのデータの入出力を制御する。ネットワークＩ／Ｆ６０３には、例えば、モデムやＬＡＮアダプタなどを採用することができる。

記録媒体Ｉ／Ｆ６０４は、ＣＰＵ６０１の制御に従って記録媒体６０５に対するデータのリード／ライトを制御する。記録媒体Ｉ／Ｆ６０４は、例えば、ディスクドライブ、ＳＳＤ、ＵＳＢポートなどである。記録媒体６０５は、記録媒体Ｉ／Ｆ６０４の制御で書き込まれたデータを記憶する不揮発メモリである。記録媒体６０５は、例えば、ディスク、半導体メモリ、ＵＳＢメモリなどである。記録媒体６０５は、端末装置２０１から着脱可能であってもよい。

ディスプレイ６０６は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する。ディスプレイ６０６は、例えば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）、液晶ディスプレイ、有機ＥＬ（Ｅｌｅｃｔｒｏｌｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイなどを採用することができる。

入力装置６０７は、文字、数字、各種指示などの入力のためのキーを有し、データの入力を行う。入力装置６０７は、キーボードやマウスなどであってもよく、また、タッチパネル式の入力パッドやテンキーなどであってもよい。

端末装置２０１は、上述した構成部のほか、例えば、プリンタ、スキャナ、マイク、スピーカーなどを有してもよい。また、端末装置２０１は、記録媒体Ｉ／Ｆ６０４や記録媒体６０５を複数有していてもよい。また、端末装置２０１は、記録媒体Ｉ／Ｆ６０４や記録媒体６０５を有していなくてもよい。

（分類装置１００の機能的構成例）
次に、図７を用いて、分類装置１００の機能的構成例について説明する。

図７は、分類装置１００の機能的構成例を示すブロック図である。分類装置１００は、記憶部７００と、取得部７０１と、学習部７０２と、分類部７０３と、選択部７０４と、生成部７０５と、出力部７０６とを含む。

記憶部７００は、例えば、図３に示したメモリ３０２や記録媒体３０５などの記憶領域によって実現される。以下では、記憶部７００が、分類装置１００に含まれる場合について説明するが、これに限らない。例えば、記憶部７００が、分類装置１００とは異なる装置に含まれ、記憶部７００の記憶内容が分類装置１００から参照可能である場合があってもよい。

取得部７０１〜出力部７０６は、制御部の一例として機能する。取得部７０１〜出力部７０６は、具体的には、例えば、図３に示したメモリ３０２や記録媒体３０５などの記憶領域に記憶されたプログラムをＣＰＵ３０１に実行させることにより、または、ネットワークＩ／Ｆ３０３により、その機能を実現する。各機能部の処理結果は、例えば、図３に示したメモリ３０２や記録媒体３０５などの記憶領域に記憶される。

記憶部７００は、各機能部の処理において参照され、または更新される各種情報を記憶する。記憶部７００は、例えば、学習データを記憶してもよい。学習データは、例えば、過去のデータと、過去のデータが正常であるか異常であるかを利用者が判断した結果とを対応付けたデータである。過去のデータは、例えば、請求データ４００である。異常は、例えば、不正請求である。

記憶部７００は、例えば、学習データから決定木モデルを生成する生成ルールを記憶してもよい。決定木モデルは、複数のノードを含み、ノード間がエッジで接続されたモデルである。決定木モデルは、例えば、対象データを分類する条件を表すノードと、対象データが正常であること、または、対象データが異常であることを表す葉ノードとを含み、少なくともいずれかの葉ノードに名称が設定される。記憶部７００は、具体的には、生成ルールを有する機械学習ＦＷ（ＦｉｒｍＷａｒｅ）を記憶してもよい。

記憶部７００は、例えば、決定木モデルを記憶してもよい。記憶部７００は、例えば、決定木モデルの葉ノードの名称を生成する際に用いられる言語化ルールや名称テンプレートを記憶してもよい。言語化ルールは、例えば、不等号を用いた条件の判定結果を、「以上」、「以下」、「より大きい」、「より小さい」、「未満」、「範囲」などの文言を用いて書き換えるためのルールである。名称テンプレートは、例えば、「既知のＡに近い傾向が見られる」や「既知のＡに関連する不正請求である」などの文章である。Ａは、例えば、他の葉ノードに設定済みの名称が挿入される。

記憶部７００は、例えば、画面テンプレートを記憶してもよい。画面テンプレートは、端末装置２０１に表示させる画面を生成する際に用いられる。画面テンプレートは、例えば、請求テーブル５００の不正理由や正常理由を利用者に設定させる画面を生成する際に用いられる。画面テンプレートは、例えば、請求データ４００と、請求データ４００を分類した葉ノードの名称とを対応付けて出力する画面を生成する際に用いられる。

取得部７０１は、各機能部の処理に用いられる各種情報を取得し、各機能部に出力する。取得部７０１は、例えば、各機能部の処理に用いられる各種情報を記憶部７００から取得し、各機能部に出力してもよい。取得部７０１は、例えば、各機能部の処理に用いられる各種情報を、分類装置１００とは異なる装置から取得し、各機能部に出力してもよい。

取得部７０１は、具体的には、学習データを端末装置２０１から受信し、記憶部７００に記憶し、各機能部に出力する。取得部７０１は、具体的には、利用者の操作入力、または、記録媒体Ｉ／Ｆ３０４を介して、学習データの入力を受け付けてもよい。これにより、取得部７０１は、学習データを学習部７０２に出力し、学習部７０２で決定木モデルを生成可能にすることができる。

取得部７０１は、具体的には、対象データを端末装置２０１から受信し、記憶部７００に記憶し、各機能部に出力する。取得部７０１は、具体的には、利用者の操作入力、または、記録媒体Ｉ／Ｆ３０４を介して、対象データの入力を受け付けてもよい。これにより、取得部７０１は、対象データを分類部７０３に出力し、分類部７０３で対象データを分類開始させることができる。

学習部７０２は、生成ルールを参照し、学習データに基づいて決定木モデルを生成する。学習部７０２は、例えば、機械学習ＦＷを用いて、学習データに基づいて決定木モデルを生成する。これにより、学習部７０２は、分類部７０３が決定木モデルを参照可能にし、分類部７０３が対象データを分類可能にすることができる。

分類部７０３は、決定木モデルにより、対象データを分類する。分類部７０３は、例えば、決定木モデルの根ノードから順に、ノードが表す条件を対象データが満たすか否かを判定した結果に基づいて、子ノードを辿り、いずれかの葉ノードに対象データを分類する。これにより、分類部７０３は、対象データをいずれかの葉ノードに分類し、対象データを正常または異常に分類することができる。

選択部７０４は、名称が未設定である第１の葉ノードに対象データが分類された場合、ノード間の位置関係に基づいて、決定木モデルのうち名称が設定済みである第２の葉ノードを選択する。ノード間の位置関係は、例えば、ノード間の親子関係によって表される。

選択部７０４は、例えば、第１の葉ノードが、対象データが異常であることを表す葉ノードである場合、第２の葉ノードを選択する。これにより、選択部７０４は、利用者が重要視する傾向がある、対象データが異常であることを表す葉ノードの名称を生成することができる。

選択部７０４は、例えば、第１の葉ノードが、対象データが正常であることを表す葉ノードである場合、第２の葉ノードを選択しなくてもよい。これにより、選択部７０４は、対象データが異常に分類された理由を利用者が把握することが求められる場合、対象データが正常に分類された理由に対応する名称を生成しなくてもよいようにすることができる。このため、選択部７０４は、生成部７０５の処理量の低減化を図ることができる。

選択部７０４は、例えば、ノード間の位置関係に基づいて、第１の葉ノードの近傍にある葉ノードの中から、第２の葉ノードを選択する。ノード間の距離は、例えば、ノード間を接続するエッジの数によって表される。近傍は、例えば、ノード間を接続するエッジの数が所定数以下であることに対応する。第１の葉ノードの近傍にある葉ノードは、例えば、第１の葉ノードから所定数以下のエッジを経由して到達可能な葉ノードである。

選択部７０４は、具体的には、第１の葉ノードから所定数以下のエッジを経由して到達可能な葉ノードの中から、第２の葉ノードを選択する。これにより、選択部７０４は、第１の葉ノードと比較的類似する正常または異常を表す第２の葉ノードを選択しやすくすることができる。このため、選択部７０４は、第１の葉ノードについて、利用者が直感的に理解しやすい名称を生成しやすくすることができる。

第１の葉ノードの近傍にある葉ノードは、例えば、第１の葉ノードの上位にあり第１の葉ノードから所定数以下のエッジを経由して到達可能な上位ノードの下位にある葉ノードである。上位は、根ノードに近い方である。下位は、葉ノードに近い方である。

選択部７０４は、具体的には、第１の葉ノードの上位にあり第１の葉ノードから所定数以下のエッジを経由して到達可能な上位ノードの下位にある葉ノードの中から、第２の葉ノードを選択する。これにより、選択部７０４は、第１の葉ノードと比較的類似する正常または異常を表す第２の葉ノードを選択しやすくすることができる。このため、選択部７０４は、第１の葉ノードについて、利用者が直感的に理解しやすい名称を生成しやすくすることができる。

選択部７０４は、例えば、所定数を、決定木モデルの深さに基づいて設定する。選択部７０４は、具体的には、決定木モデルの深さが閾値を超える場合、所定数を、決定木モデルの深さ＊２０％に設定する。閾値は、例えば、２０である。選択部７０４は、具体的には、決定木モデルの深さが閾値以下であれば、所定数を固定値に設定してもよい。固定値は、例えば、２である。これにより、選択部７０４は、決定木モデルの深さに応じて、第１の葉ノードと比較的類似する正常または異常を表す第２の葉ノードを選択しやすくすることができる。また、選択部７０４は、決定木モデルの深さに応じて、選択対象の範囲を限定し、処理量の低減化を図ることができる。

選択部７０４は、ノード間の位置関係に基づいて、決定木モデルのうち、第１の部分木とは異なる位置にある第２の部分木に含まれる葉ノードの中から、第２の葉ノードを選択する。第１の部分木は、第１の葉ノードを含む部分木である。第２の部分木は、第１の部分木と異なる位置にあり、第１の部分木と同一の部分木である。第１の部分木と同一の部分木は、例えば、第１の部分木に含まれるノードと同一の条件を表すノードを含み、第１の部分木とノード間の位置関係が同一になる部分木である。

第２の部分木は、第１の部分木と異なる位置にあり、第１の部分木と類似する部分木であってもよい。第１の部分木と類似する部分木は、例えば、第１の部分木の一部に含まれるノードと同一の条件を表すノードを含み、第１の部分木の一部とノード間の位置関係が同一になる部分を含む部分木である。これにより、選択部７０４は、第１の葉ノードと比較的類似する正常または異常を表す第２の葉ノードを選択しやすくすることができる。

生成部７０５は、選択部７０４が選択した第２の葉ノードの名称に基づいて、第１の葉ノードの名称を生成する。生成部７０５は、さらに、第１の経路上の各ノードが表す条件に関する判定結果と、第２の経路上の各ノードが表す条件に関する判定結果との差異に基づいて、第１の葉ノードの名称を生成してもよい。

第１の経路は、例えば、決定木モデルの根ノードから第１の葉ノードまでの経路である。第２の経路は、例えば、決定木モデルの根ノードから第２の葉ノードまでの経路である。差異は、例えば、第１の経路上の各ノードが表す条件に関する判定結果のうち、第２の経路上の各ノードが表す条件に関する判定結果と重複しない判定結果である。

生成部７０５は、例えば、記憶部７００を参照し、差異になる判定結果を、「以上」、「以下」、「より大きい」、「より小さい」、「未満」、「範囲」などの文言を用いて書き換えた文章を生成する。生成部７０５は、例えば、記憶部７００を参照し、「既知のＡに近い傾向が見られる」の文章の「Ａ」に、選択した第２の葉ノードの名称を挿入した文章を生成する。

そして、生成部７０５は、生成した文章を組み合わせて、第１の葉ノードの名称を生成する。生成部７０５は、具体的には、名称「水増し請求に近い傾向が見られる。金額は１００以下であり、利用料は１０以上である。」などを生成する。これにより、生成部７０５は、第１の葉ノードの名称を、第２の葉ノードの名称に基づいて生成することができ、利用者が直感的に理解しやすい名称を生成しやすくすることができる。

また、生成部７０５は、差異になる判定結果を書き換えた文章を、利用者が参照可能にすることができる。このため、生成部７０５は、どのような条件の判定結果が異なるかを把握可能にすることができ、対象データが正常または異常に分類された理由を把握しやすい名称を生成することができる。

生成部７０５は、第１の葉ノードに、生成した第１の葉ノードの名称を設定する。これにより、生成部７０５は、次回、対象データが第１の葉ノードに分類された場合に、名称を生成し直さなくてもよくすることができ、処理量の低減化を図ることができる。

出力部７０６は、対象データに、生成した第１の葉ノードの名称を対応付けて出力する。出力形式は、例えば、ディスプレイへの表示、プリンタへの印刷出力、ネットワークＩ／Ｆ３０３による外部装置への送信、または、メモリ３０２や記録媒体３０５などの記憶領域への記憶である。これにより、出力部７０６は、利用者が、対象データが分類された結果の細かい種別を把握可能にし、対象データが分類された理由を把握可能にすることができる。

出力部７０６は、各機能部の処理結果を出力してもよい。これにより、出力部７０６は、各機能部の処理結果を利用者に通知可能にし、分類装置１００の管理や運用、例えば、分類装置１００の設定値の更新などを支援することができ、分類装置１００の利便性の向上を図ることができる。

（分類装置１００を利用する状況の具体例）
次に、図８を用いて、分類装置１００を利用する状況の具体例について説明する。

図８は、分類装置１００を利用する状況の具体例を示す説明図である。図８に示すように、分類装置１００は、例えば、省庁や自治体などの職員が、介護施設や養護施設などの事業者から社会保障給付費の請求データ８０６を収集し、事業者の指導監査業務を行うような状況において利用される。収集する請求データ８０６の数は、例えば、百万単位である。以下の説明では、省庁や自治体などの職員を「利用者」と表記する場合がある。

ここで、利用者が、限られた時間で、効率よく事業者の指導監査業務を行うことを可能にすることが望まれる。例えば、利用者が、収集した請求データ８０６から、不正請求の請求データ８０６を効率よく発見可能にすることが望まれる。

また、例えば、利用者が、いずれの事業者を優先して指導および監査することが好ましいかを判断可能にすることが望まれる。このため、利用者が、事業者ごとに不正請求の請求データ８０６の数を把握可能にすることが望まれる。また、利用者が、事業者ごと、かつ、不正請求の種別ごとに、不正請求の請求データ８０６の数を把握可能にすることが望まれる。

また、例えば、利用者が、いずれかの事業者を指導および監査するために、いずれかの事業者の所在地を訪れる前に、請求データ８０６に関する資料を作成することが望まれる。このため、利用者が、事業者の請求データ８０６の不正請求の種別を、請求データ８０６に関する資料を作成するために利用可能にすることが望まれる。

また、例えば、利用者が、いずれかの事業者を指導および監査する際、どのような種別の不正請求を優先して考慮することが好ましいかを判断可能にすることが望まれる。このため、利用者が、事業者の請求データ８０６に、どのような種別の不正請求の請求データ８０６があるかを把握可能にし、不正請求の種別ごとに、不正請求の請求データ８０６の数を把握可能にすることが望まれる。これに対し、分類装置１００は、下記に示すように動作する。

（８−１）分類装置１００は、省庁や自治体などの障害システムと連携し、過去の請求データ８０１を収集する。また、分類装置１００は、省庁や自治体などの職員から、過去の不正請求の事例データ８０２を収集する。次に、分類装置１００は、過去の請求データ８０１と、過去の不正請求の事例データ８０２とを加工して結合することにより、学習データ集合８０３を生成して記憶する。そして、分類装置１００は、機械学習ＦＷ８０４を用いて、学習データ集合８０３に基づいて、決定木モデル８０５を生成する。決定木モデル８０５を生成する流れについては、例えば、図９を用いて後述する。

（８−２）分類装置１００は、決定木モデル８０５により、新たな請求データ８０６を葉ノードに分類し、正常または不正請求に分類する。ここで、分類装置１００は、新たな請求データ８０６を分類した葉ノードの名称が未設定であれば、新たな請求データ８０６を分類した葉ノードの名称を生成し、葉ノードの名称を設定する。葉ノードの名称を設定する流れについては、例えば、図１０および図１１を用いて後述する。そして、分類装置１００は、新たな請求データ８０６と、新たな請求データ８０６を分類した葉ノードの名称とを対応付けて記憶する。

（８−３）分類装置１００は、新たな請求データ８０６と、新たな請求データ８０６を分類した葉ノードの名称とを対応付けた対応データ８０７を、利用者に提示する。また、分類装置１００は、事業者ごとに不正請求の請求データ８０６の数を算出し、利用者に提示してもよい。また、分類装置１００は、事業者ごと、かつ、不正請求の種別ごとに、不正請求の請求データ８０６の数を算出し、利用者に提示してもよい。

これにより、分類装置１００は、利用者が、限られた時間で、効率よく事業者の指導監査業務を行うことを支援することができる。分類装置１００は、例えば、決定木モデル８０５により、新たな請求データ８０６を分類するため、利用者が、不正請求の請求データ８０６を効率よく発見可能にすることができ、利用者にかかる負担の低減化を図ることができる。

また、分類装置１００は、例えば、事業者ごとに不正請求の請求データ８０６の数を、利用者に提示するため、利用者が、いずれの事業者を優先して指導および監査することが好ましいかを判断可能にすることができる。

また、分類装置１００は、例えば、事業者ごと、かつ、不正請求の種別ごとに、不正請求の請求データ８０６の数を、利用者に提示するため、利用者が、いずれの事業者を優先して指導および監査することが好ましいかを判断可能にすることができる。利用者は、例えば、日付ミスの不正請求の請求データ８０６が１０個の事業者と、水増し請求の不正請求の請求データ８０６が１０個の事業者とを区別可能になり、いずれの事業者を優先して指導および監査することが好ましいかを判断しやすくすることができる。

また、分類装置１００は、例えば、新たな請求データ８０６を分類した葉ノードの名称を、利用者に提示するため、利用者が、新たな請求データ８０６が分類された理由を把握しやすくすることができる。そして、利用者は、事業者を指導および監査するための、請求データ８０６に関する資料を作成しやすくすることができる。

また、分類装置１００は、例えば、新たな請求データ８０６を分類した葉ノードの名称を、利用者に提示するため、利用者が、事業者の請求データ８０６に、どのような種別の不正請求の請求データ８０６があるかを把握可能にすることができる。次に、図９の説明に移行し、決定木モデル８０５を生成する流れについて説明する。

（決定木モデル８０５を生成する流れ）
図９は、決定木モデル８０５を生成する流れを示す説明図である。ここで、決定木モデル８０５は、規模が比較的小さいことが好ましい。決定木モデル８０５の規模が比較的小さければ、対象データを分類する際に判定される条件の数が少なくなる傾向があり、処理量の低減化と、所要時間の低減化を図りやすい傾向があるため好ましい。

また、決定木モデル８０５は、いずれかのノードが表す条件で学習データ集合８０３を２分割した場合、それぞれ分割された学習データ部分集合に含まれる、正常な学習データの数と、異常な学習データの数とに偏りがあることが好ましい。偏りがあれば、正常な学習データと、異常な学習データとを分類するために用いられる条件の数が少なくなる傾向があるため好ましい。

また、１つのノードが１つの項目の値を用いる条件を表す場合、複数の項目の値の組み合わせを用いる条件は、複数のノードの組み合わせにより表されることになる。このため、決定木モデル８０５の上位の方では、経由するノードの数が比較的少ないため、比較的少ない項目の値に基づいて、複数の学習データが２分割されることになる。一方で、決定木モデル８０５の下位の方では、経由するノードの数が比較的多いため、比較的多くの項目の値に基づいて、複数の学習データが２分割されることになる。

このため、まず、分類装置１００は、決定木モデル８０５の上位の方に、学習データの１つの項目の値に基づいて、複数の学習データを比較的好ましく２分割することができる条件を表すノードを生成することが好ましい。そして、分類装置１００は、決定木モデル８０５の下位の方に、学習データの複数の項目の値に基づいて、複数の学習データを比較的好ましく２分割することができる複数の条件のそれぞれの条件を表すノードを生成することが好ましい。

図９に示すように、まず、分類装置１００は、学習データ集合８０３を、正常と異常が混じった学習データ部分集合９２１と、異常１の学習データ部分集合とに分類する条件を表すノード９０１を生成する。また、分類装置１００は、正常と異常が混じらずに異常１の学習データ部分集合を分類可能であるため、異常１を表す葉ノード９１１を生成する。

同様に、分類装置１００は、学習データ部分集合９２１を、正常と異常が混じった学習データ部分集合９２２と、正常の学習データ部分集合とに分類する条件を表すノード９０２を生成する。また、分類装置１００は、正常と異常が混じらずに正常の学習データ部分集合を分類可能であるため、正常を表す葉ノード９１２を生成する。

これにより、分類装置１００は、ノード９０１〜９０４と、葉ノード９１１〜９１５とを含む決定木モデル８０５を生成することができる。次に、図１０および図１１の説明に移行し、いずれかの請求データ８０６が分類された、名称が未設定である葉ノードに名称を設定する流れについて説明する。

（葉ノードに名称を設定する流れ）
図１０および図１１は、葉ノードに名称を設定する流れを示す説明図である。図１０において、分類装置１００は、決定木モデル１０００を記憶し、Ｎｏ１の請求データ８０６と、Ｎｏ２の請求データ８０６とを分類する際に、葉ノードに名称を設定する。決定木モデル１０００は、ノード１００１〜１００６と、葉ノード１０１１〜１０１７とを含む。

図１０に示すように、分類装置１００は、Ｎｏ１の請求データ８０６が、根ノード１００１が表す条件を満たすか否かを判定する。分類装置１００は、根ノード１００１が表す条件を満たすため、Ｎｏ１の請求データ８０６が、根ノード１００１のＴｒｕｅ側の子ノードであるノード１００２が表す条件を満たすか否かを判定する。

分類装置１００は、ノード１００２が表す条件を満たすため、Ｎｏ１の請求データ８０６が、ノード１００２のＴｒｕｅ側の子ノードであるノード１００４が表す条件を満たすか否かを判定する。分類装置１００は、ノード１００４が表す条件を満たすため、Ｎｏ１の請求データ８０６が、ノード１００４のＴｒｕｅ側の子ノードであるノード１００６が表す条件を満たすか否かを判定する。

分類装置１００は、ノード１００６が表す条件を満たすため、Ｎｏ１の請求データ８０６を、ノード１００６のＴｒｕｅ側の葉ノード１０１６に分類する。ここで、分類装置１００は、葉ノード１０１６が、名称が設定済みであり正常を表す命名済み正常であるため、名称を生成しなくてもよい。

分類装置１００は、Ｎｏ２の請求データ８０６が、根ノード１００１が表す条件を満たすか否かを判定する。分類装置１００は、根ノード１００１が表す条件を満たすため、Ｎｏ２の請求データ８０６が、根ノード１００１のＴｒｕｅ側の子ノードであるノード１００２が表す条件を満たすか否かを判定する。

分類装置１００は、ノード１００２が表す条件を満たすため、Ｎｏ２の請求データ８０６が、ノード１００２のＴｒｕｅ側の子ノードであるノード１００４が表す条件を満たすか否かを判定する。分類装置１００は、ノード１００４が表す条件を満たすため、Ｎｏ２の請求データ８０６が、ノード１００４のＴｒｕｅ側の子ノードであるノード１００６が表す条件を満たすか否かを判定する。

分類装置１００は、ノード１００６が表す条件を満たさないため、Ｎｏ２の請求データ８０６を、ノード１００６のＦａｌｓｅ側の葉ノード１０１７に分類する。ここで、分類装置１００は、葉ノード１０１７が、名称が未設定であり未知の異常を表すため、名称を生成する。分類装置１００は、例えば、葉ノード１０１７の近傍にある葉ノードを選択する。ここで、図１１の説明に移行し、葉ノードを選択する流れについて説明する。

図１１に示すように、分類装置１００は、下位にある葉ノードから順に、名称が設定済みである葉ノードを検索し、名称が設定済みである葉ノードを選択する。分類装置１００は、例えば、葉ノード１０１７の近傍にあり、名称が設定済みである葉ノード１０１３または葉ノード１０１６のうち、葉ノード１０１６を選択する。分類装置１００は、選択した葉ノード１０１６の名称に基づいて、葉ノード１０１７の名称を生成する。

ここで、例えば、決定木モデルにおいて、名称が未設定である葉ノードと、名称が未設定である葉ノードの近傍にある葉ノードとは、根ノードからの経路に重複する部分が含まれる傾向がある。換言すれば、名称が未設定である葉ノードに対象データが分類される場合と、名称が未設定である葉ノードの近傍にある葉ノードに対象データが分類される場合とで、重複する条件が用いられる傾向がある。このため、名称が未設定である葉ノードと、名称が未設定である葉ノードの近傍にある葉ノードとは、類似する内容を表す可能性が比較的大きい。

また、例えば、決定木モデルにおいて、相対的に下位にある葉ノードは、比較的多くの条件を用いて対象データが分類される傾向がある葉ノードである。このため、相対的に下位にある葉ノードは、対象データに含まれる複数の項目の値を参照しなければ発見困難である、利用者にとって比較的重要な異常を表す傾向がある。

これに対し、分類装置１００は、図１１に示したように、名称が未設定である葉ノードの近傍にあり、かつ、相対的に下位にある葉ノードから順に、名称が設定済みである葉ノードを検索する。

このため、分類装置１００は、名称が未設定である葉ノードの名称の生成に、名称が未設定である葉ノードと類似する内容を表す可能性が比較的大きい葉ノードの名称を用いることができる。結果として、分類装置１００は、名称が未設定である葉ノードが表す内容を正しく表している可能性が比較的大きい名称を生成しやすくすることができ、利用者が直感的に理解しやすい名称を生成しやすくすることができる。

また、分類装置１００は、名称が未設定である葉ノードの名称の生成に、利用者にとって比較的重要な異常を表す傾向がある葉ノードの名称を用いることができる。結果として、分類装置１００は、利用者にとって比較的重要な異常との、名称が未設定である葉ノードが表す内容との関連性を、利用者が把握しやすくすることができる。

（分類装置１００が葉ノードに名称を設定する動作例１）
次に、図１２〜図１９を用いて、分類装置１００が葉ノードに名称を設定する動作例１について説明する。動作例１は、名称が未設定の葉ノードの近傍にある、名称が設定済みの葉ノードを選択して、名称が未設定の葉ノードの名称を生成する一例である。

図１２〜図１９は、分類装置１００が葉ノードに名称を設定する動作例１を示す説明図である。図１２において、分類装置１００は、端末装置２０１から学習データ集合を受信し、学習テーブル１２００を用いて記憶する。学習テーブル１２００のデータ構造は、図５に示した請求テーブル５００のデータ構造と同様であるため、説明を省略する。次に、図１３の説明に移行する。

図１３において、分類装置１００は、機械学習ＦＷ８０４を用いて、学習テーブルに基づいて、決定木モデル１３００を生成する。決定木モデル１３００は、例えば、ノード１３０１〜１３０３と、葉ノード１３１１〜１３１３とを含む。次に、図１４の説明に移行する。

図１４において、分類装置１００は、端末装置２０１から請求データを受信し、請求テーブル１４００を用いて記憶する。ここでは、請求テーブル１４００の結果、不正理由、および、正常理由のフィールドは、空白である。次に、図１５の説明に移行する。

図１５において、分類装置１００は、決定木モデル１３００により、対象データを正常または異常に分類する。分類装置１００は、対象データを正常または異常に分類した結果を、請求テーブル１４００の結果のフィールドに設定する。次に、図１６の説明に移行する。

図１６において、分類装置１００は、端末装置２０１のディスプレイ６０６に、不正理由および正常理由の入力を受け付ける受付画面１６００を表示させる。端末装置２０１は、入力装置６０７による利用者の操作入力に基づいて、不正理由および正常理由の入力を受け付け、保存ボタンがクリックされると、分類装置１００に送信する。分類装置１００は、不正理由および正常理由を、端末装置２０１から受信する。

端末装置２０１は、具体的には、受付画面１６００の検索条件欄に入力された検索条件を、分類装置１００に送信し、検索条件に基づく請求テーブル１４００のレコードを、分類装置１００の制御に従って明細情報欄に表示する。端末装置２０１は、更新内容欄のリストから選択された不正理由や正常理由を、明細情報欄に表示されて選択ボックスにチェックされたレコードに反映し、保存ボタンのクリックに応じて、反映済みのレコードを分類装置１００に送信する。次に、図１７の説明に移行する。

図１７において、分類装置１００は、受信した不正理由および正常理由を、請求テーブル１４００を用いて記憶する。ここで、キー１に対応付けられた正常理由は設定される。また、キー２に対応付けられた不正理由は設定される。一方で、キー３に対応付けられた不正理由は、利用者に入力されず、不明である。次に、図１８の説明に移行する。

図１８において、分類装置１００は、葉ノード１３１１〜１３１３に名称を設定する。分類装置１００は、葉ノード１３１１〜１３１３に、キーを対応付けて、名称を設定する。分類装置１００は、例えば、葉ノード１３１１に、キー１を対応付けて、キー１に対応する正常理由を名称として設定する。

分類装置１００は、例えば、葉ノード１３１２に、キー２を対応付けて、キー２に対応する不正理由を名称として設定する。分類装置１００は、例えば、葉ノード１３１３に、キー３を対応付けるが、キー３に対応する不正理由は不明であり、名称が設定されない。次に、図１９の説明に移行する。

図１９において、分類装置１００は、名称が未設定である葉ノード１３１３の名称を生成する。分類装置１００は、例えば、葉ノード１３１３の近傍にある葉ノードを選択する。そして、分類装置１００は、選択した葉ノードの名称に基づいて、葉ノード１３１３の名称を生成する。

分類装置１００は、例えば、葉ノード１３１３の階層から、葉ノード１３１３の階層の所定数上位の階層までの範囲にある葉ノードの中から、いずれかの葉ノードを選択する。所定数は、例えば、決定木モデル１３００の深さ＊２０％である。

分類装置１００は、具体的には、葉ノード１３１３の階層から、葉ノード１３１３の階層の所定数上位の階層までの範囲にある葉ノードの中で、葉ノード１３１３から最も少ない数のエッジにより到達する葉ノードを選択する。

図１９の例では、分類装置１００は、葉ノード１３１３の階層から３段分上位の階層までの範囲にある葉ノード１３１１，１３１２を特定する。次に、分類装置１００は、葉ノード１３１１，１３１２のうち、葉ノード１３１３に最も近い葉ノード１３１２を選択する。そして、分類装置１００は、選択した葉ノード１３１２の名称に基づいて、葉ノード１３１３の名称を生成する。

ここでは、分類装置１００が、学習データとは異なる請求データを分類する際に、葉ノードの名称を生成する場合について説明したが、これに限らない。例えば、分類装置１００が、学習データに基づいて決定木モデルを生成した後、決定木モデルにより学習データの分類を試行しつつ、葉ノードの名称を生成しておく場合があってもよい。

（分類装置１００が葉ノードに名称を設定する動作例２）
次に、図２０〜図２２を用いて、分類装置１００が葉ノードに名称を設定する動作例２について説明する。動作例１は、名称が未設定の葉ノードの近傍にある、名称が設定済みの葉ノードを選択して、名称が未設定の葉ノードの名称を生成する一例である。これに対し、動作例２は、名称が未設定の葉ノードの近傍にない、名称が設定済みの葉ノードを選択して、名称が未設定の葉ノードの名称を生成する一例である。

図２０〜図２２は、分類装置１００が葉ノードに名称を設定する動作例２を示す説明図である。図２０において、分類装置１００は、決定木モデル２０００により、対象データを、葉ノード２００１に分類したとする。葉ノード２００１は、名称が未設定であったとする。

ここで、分類装置１００は、葉ノード２００１を含む部分木２０１０を特定する。分類装置１００は、例えば、葉ノード２００１の階層から、葉ノード２００１の階層の所定数上位の階層までの範囲にある部分木２０１０を特定する。所定数は、例えば、決定木モデルの深さ＊２０％である。次に、図２１の説明に移行し、部分木２０１０の一例について説明する。

図２１に示すように、部分木２０１０は、条件を表すノード２１０１〜２１０３と、葉ノード２１１１〜２１１４とを含む。また、部分木２０１０のノード間の親子関係は、例えば、ノード２１０１の子ノードに葉ノード２１１１とノード２１０２とがあるという関係などである。次に、図２２の説明に移行する。

図２２において、分類装置１００は、決定木モデルのうち、部分木２０１０と同一の部分木を検索する。部分木２０１０と同一の部分木は、例えば、ノード２１０１〜２１０３と同じ条件を表すノードを含み、部分木２０１０とノード間の親子関係が同一になる部分木である。

分類装置１００は、例えば、決定木モデルの部分木２２０１〜２２０４などの中から、部分木２０１０と同一の部分木２２０２，２２０４を特定する。次に、分類装置１００は、部分木２２０２，２２０４に含まれ、名称が設定済みの葉ノードを選択する。そして、分類装置１００は、選択した葉ノードの名称に基づいて、葉ノード２００１の名称を生成する。

分類装置１００は、例えば、相対的に下位にある部分木から葉ノードを選択してもよい。分類装置１００は、具体的には、部分木２２０２，２２０４のうち、相対的に下位にある部分木２２０２から葉ノードを選択する。これにより、分類装置１００は、葉ノード２００１の近傍に、名称が設定済みの葉ノードがなくても、他の葉ノードを選択することができる。

また、分類装置１００は、相対的に下位にある部分木から葉ノードを選択するため、名称が未設定である葉ノードの名称の生成に、利用者にとって比較的重要な異常を表す傾向がある葉ノードの名称を用いることができる。結果として、分類装置１００は、利用者にとって比較的重要な異常との、名称が未設定である葉ノードが表す内容との関連性を、利用者が把握しやすくすることができる。

ここでは、分類装置１００が、動作例１と動作例２とのいずれかを実行する場合について説明したが、これに限らない。例えば、分類装置１００が、動作例１と動作例２とを組み合わせる場合があってもよい。具体的には、分類装置１００が、動作例１により名称を生成することができなかったことに応じて、動作例２を実行するような場合があってもよい。図２５〜図２７に後述する各種フローチャートは、動作例１と動作例２とを組み合わせる場合に対応する。

（端末装置２０１における出力例１）
次に、図２３を用いて、端末装置２０１における出力例１について説明する。

図２３は、端末装置２０１における出力例１を示す説明図である。図２３において、分類装置１００は、動作例１または動作例２によって、葉ノードの名称を設定し、葉ノードに分類された請求データの元になった社会保障給付費の請求書の明細番号に対応付けて出力する。

分類装置１００は、例えば、表示内容２３００を、端末装置２０１のディスプレイ６０６に表示させる。表示内容２３００の内容のフィールドには、葉ノードの名称が設定される。これにより、分類装置１００は、利用者が、限られた時間で、効率よく事業者の指導監査業務を行うことを支援することができる。

分類装置１００は、例えば、請求データが分類された理由を把握しやすくすることができる。また、分類装置１００は、例えば、事業者の請求データに、どのような種別の不正請求の請求データがあるかを把握可能にすることができる。このため、利用者は、事業者を指導および監査するための、請求データに関する資料を作成しやすくすることができる。

（端末装置２０１における出力例２）
次に、図２４を用いて、端末装置２０１における出力例２について説明する。

図２４は、端末装置２０１における出力例２を示す説明図である。図２４において、分類装置１００は、動作例１または動作例２によって、事業者ごとに、不正請求に分類された請求データの数を算出して出力する。

分類装置１００は、例えば、表示内容２４００を、端末装置２０１のディスプレイ６０６に表示させる。表示内容２４００の件数のフィールドには、不正請求に分類された請求データの数が設定される。これにより、分類装置１００は、利用者が、限られた時間で、効率よく事業者の指導監査業務を行うことを支援することができる。利用者は、例えば、不正請求に分類された請求データの数を参照し、いずれの事業者を優先して指導および監査することが好ましいかを判断することができる。

また、分類装置１００は、例えば、事業者ごと、かつ、不正請求の種別ごとに、不正請求の請求データの数を表示してもよい。これにより、利用者は、いずれの事業者を優先して指導および監査することが好ましいかを判断することができる。

（全体処理手順）
次に、図２５を用いて、分類装置１００が実行する、全体処理手順の一例について説明する。全体処理は、例えば、図３に示したＣＰＵ３０１と、メモリ３０２や記録媒体３０５などの記憶領域と、ネットワークＩ／Ｆ３０３とによって実現される。

図２５は、全体処理手順の一例を示すフローチャートである。図２５において、まず、分類装置１００は、学習した決定木モデルに基づいて、複数の対象データのそれぞれの対象データを、正常または異常を表す葉ノードに分類する（ステップＳ２５０１）。

次に、分類装置１００は、分類した結果を請求テーブル５００に反映する（ステップＳ２５０２）。そして、分類装置１００は、少なくとも１以上の対象データのそれぞれの対象データが分類された理由の入力を受け付け、請求テーブル５００に反映する（ステップＳ２５０３）。

次に、分類装置１００は、受け付けた少なくとも１以上の対象データのそれぞれの対象データが分類された理由を、それぞれの対象データが分類された葉ノードの名称に設定する（ステップＳ２５０４）。そして、分類装置１００は、名称が未設定の葉ノードに分類された対象データがあれば、図２６に後述する選択処理を実行することにより、名称が設定済みの葉ノードを選択する（ステップＳ２５０５）。

次に、分類装置１００は、選択した葉ノードの名称を取得する（ステップＳ２５０６）。そして、分類装置１００は、根ノードから名称が未設定の葉ノードまでの経路上のノードが表す条件と、根ノードから選択した葉ノードまでの経路上のノードが表す条件との差異を特定する（ステップＳ２５０７）。

次に、分類装置１００は、選択した葉ノードの名称と、特定した差異とに基づいて、名称が未設定の葉ノードの名称を設定する（ステップＳ２５０８）。そして、分類装置１００は、全体処理を終了する。これにより、分類装置１００は、葉ノードの名称を設定し、葉ノードの名称を利用者に提示可能にすることができる。

（選択処理手順）
次に、図２６を用いて、ステップＳ２５０５で実行する、選択処理手順の一例について説明する。選択処理は、例えば、図３に示したＣＰＵ３０１と、メモリ３０２や記録媒体３０５などの記憶領域と、ネットワークＩ／Ｆ３０３とによって実現される。

図２６は、選択処理手順の一例を示すフローチャートである。図２６において、まず、分類装置１００は、名称が未設定の葉ノードの親ノードを基準ノードに設定する（ステップＳ２６０１）。

次に、分類装置１００は、基準ノードの右側の子ノードに名称が設定されているか否かを判定する（ステップＳ２６０２）。ここで、右側の子ノードに名称が設定されている場合（ステップＳ２６０２：Ｙｅｓ）、分類装置１００は、ステップＳ２６０４の処理に移行する。一方で、右側の子ノードに名称が設定されていない場合（ステップＳ２６０２：Ｎｏ）、分類装置１００は、ステップＳ２６０３の処理に移行する。

ステップＳ２６０３では、分類装置１００は、基準ノードの左側の子ノードに名称が設定されているか否かを判定する（ステップＳ２６０３）。ここで、左側の子ノードに名称が設定されている場合（ステップＳ２６０３：Ｙｅｓ）、分類装置１００は、ステップＳ２６０４の処理に移行する。一方で、左側の子ノードに名称が設定されていない場合（ステップＳ２６０３：Ｎｏ）、分類装置１００は、ステップＳ２６０５の処理に移行する。

ステップＳ２６０４では、分類装置１００は、基準ノードの子ノードのうち、名称が設定済みの葉ノードを選択する（ステップＳ２６０４）。そして、分類装置１００は、選択処理を終了する。

ステップＳ２６０５では、分類装置１００は、基準ノードの変更回数＞決定木の深さ＊１０％であるか否かを判定する（ステップＳ２６０５）。ここで、基準ノードの変更回数＞決定木の深さ＊１０％ではない場合（ステップＳ２６０５：Ｎｏ）、分類装置１００は、ステップＳ２６０６の処理に移行する。一方で、基準ノードの変更回数＞決定木の深さ＊１０％である場合（ステップＳ２６０５：Ｙｅｓ）、分類装置１００は、ステップＳ２６０７の処理に移行する。

ステップＳ２６０６では、分類装置１００は、基準ノードの親ノードを、基準ノードに変更する（ステップＳ２６０６）。そして、分類装置１００は、ステップＳ２６０２の処理に移行する。

ステップＳ２６０７では、分類装置１００は、基準ノードを変更せず、図２７に示す検索処理を実行することにより、決定木モデル全体から、名称が未設定の葉ノードの近傍の部分木と類似する他の部分木を検索する（ステップＳ２６０７）。

次に、分類装置１００は、検索した他の部分木の葉ノードのうち、名称が設定済みの葉ノードを選択する（ステップＳ２６０８）。そして、分類装置１００は、選択処理を終了する。これにより、分類装置１００は、葉ノードの名称を生成する際に用いられる葉ノードを選択することができる。

（検索処理手順）
次に、図２７を用いて、ステップＳ２５０５で実行する、検索処理手順の一例について説明する。検索処理は、例えば、図３に示したＣＰＵ３０１と、メモリ３０２や記録媒体３０５などの記憶領域と、ネットワークＩ／Ｆ３０３とによって実現される。

図２７は、検索処理手順の一例を示すフローチャートである。図２７において、まず、分類装置１００は、名称が未設定の葉ノードを含み、名称が未設定の葉ノードの階層よりも決定木の深さ＊１０％だけ上位の階層から、名称が未設定の葉ノードの階層までにある、部分木を特定する（ステップＳ２７０１）。

次に、分類装置１００は、特定した部分木に含まれるノードが表す条件と同一または類似する条件を表すノードが含まれる１以上の部分木を、決定木モデル全体から検索する（ステップＳ２７０２）。そして、分類装置１００は、検索した１以上の部分木のうち、最も深い階層にある部分木を検索する（ステップＳ２７０３）。その後、分類装置１００は、検索処理を終了する。これにより、分類装置１００は、葉ノードを選択する範囲になる部分木を検索することができる。

以上説明したように、分類装置１００は、決定木モデルにより、対象データを分類することができる。分類装置１００によれば、名称が未設定である第１の葉ノードに対象データが分類された場合、ノード間の位置関係に基づいて、決定木モデルのうち、名称が設定済みである第２の葉ノードを選択することができる。分類装置１００によれば、選択した第２の葉ノードの名称に基づいて第１の葉ノードの名称を生成することができる。これにより、分類装置１００は、利用者が、対象データが分類された結果の種別を把握可能にし、対象データが分類された理由を把握可能にすることができる。

分類装置１００によれば、第１の葉ノードが、対象データが異常であることを表す葉ノードである場合に、第２の葉ノードを選択することができる。これにより、分類装置１００は、処理量の低減化を図ることができる。

分類装置１００によれば、ノード間の位置関係に基づいて、第１の葉ノードの近傍にある葉ノードの中から、第２の葉ノードを選択することができる。これにより、分類装置１００は、第１の葉ノードと比較的類似する正常または異常を表す第２の葉ノードを選択しやすくすることができる。このため、分類装置１００は、第１の葉ノードについて、利用者が直感的に理解しやすい名称を生成しやすくすることができる。

分類装置１００によれば、第１の葉ノードから所定数以下のエッジを経由して到達可能な葉ノードの中から、第２の葉ノードを選択することができる。これにより、分類装置１００は、第１の葉ノードについて、利用者が直感的に理解しやすい名称を生成しやすくすることができる。

分類装置１００によれば、第１の葉ノードの上位にあり第１の葉ノードから所定数以下のエッジを経由して到達可能な上位ノードの下位にある葉ノードの中から、第２の葉ノードを選択することができる。これにより、分類装置１００は、第１の葉ノードについて、利用者が直感的に理解しやすい名称を生成しやすくすることができる。

分類装置１００によれば、第２の葉ノードを選択する際に用いられる所定数を、決定木モデルの深さに基づいて設定することができる。これにより、分類装置１００は、決定木モデルの深さに応じて、選択対象の範囲を限定し、処理量の低減化を図ることができる。

分類装置１００によれば、ノード間の位置関係に基づいて、決定木モデルのうち、第１の葉ノードを含む第１の部分木と同一または類似する第２の部分木に含まれる葉ノードの中から、第２の葉ノードを選択することができる。これにより、分類装置１００は、第１の葉ノードと比較的類似する正常または異常を表す第２の葉ノードを選択しやすくすることができる。また、分類装置１００は、第１の葉ノードの近傍に、名称が設定済みの葉ノードがなくても、第２の葉ノードを選択することができる。

分類装置１００によれば、第２の部分木として、第１の部分木に含まれるノードと同一の条件を表すノードを含み、第１の部分木とノード間の位置関係が同一である部分木を特定することができる。これにより、分類装置１００は、第１の葉ノードと比較的類似する正常または異常を表す第２の葉ノードを選択しやすくすることができる。

分類装置１００によれば、さらに、根ノードから第１の葉ノードまでの経路上の各ノードが表す条件に関する判定結果と、根ノードから第２の葉ノードまでの経路上の各ノードが表す条件に関する判定結果との差異を特定することができる。分類装置１００によれば、特定した差異に基づいて、第１の葉ノードの名称を生成することができる。これにより、分類装置１００は、どのような条件の判定結果が差異になるかを把握可能にすることができ、対象データが正常または異常に分類された理由を把握しやすい名称を生成することができる。

分類装置１００によれば、対象データに、生成した第１の葉ノードの名称を対応付けて出力することができる。これにより、分類装置１００は、利用者が、対象データが分類された第１の葉ノードの名称を把握可能にすることができる。

分類装置１００によれば、第１の葉ノードに、生成した第１の葉ノードの名称を設定することができる。これにより、分類装置１００は、次回、対象データが第１の葉ノードに分類された場合に、名称を生成し直さなくてもよくすることができ、処理量の低減化を図ることができる。

なお、本実施の形態で説明した分類方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本実施の形態で説明した分類プログラムは、ハードディスク、フレキシブルディスク、ＣＤ−ＲＯＭ、ＭＯ、ＤＶＤ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本実施の形態で説明した分類プログラムは、インターネット等のネットワークを介して配布してもよい。

上述した実施の形態に関し、さらに以下の付記を開示する。

（付記１）コンピュータに、
対象データを分類する条件を表すノードと、前記対象データが正常であること、または、前記対象データが異常であることを表す葉ノードとを含み、少なくともいずれかの葉ノードに名称が設定された決定木モデルにより、前記対象データを分類し、
名称が未設定である第１の葉ノードに前記対象データが分類された場合、ノード間の位置関係に基づいて、前記決定木モデルのうち、名称が設定済みである第２の葉ノードを選択し、
選択した前記第２の葉ノードの名称に基づいて前記第１の葉ノードの名称を生成する、
処理を実行させることを特徴とする分類プログラム。

（付記２）前記第１の葉ノードは、前記対象データが異常であることを表す葉ノードである、ことを特徴とする付記１に記載の分類プログラム。

（付記３）前記選択する処理は、
前記ノード間の位置関係に基づいて、前記第１の葉ノードの近傍にある葉ノードの中から、前記第２の葉ノードを選択する、ことを特徴とする付記１または２に記載の分類プログラム。

（付記４）前記第１の葉ノードの近傍にある葉ノードは、前記第１の葉ノードから所定数以下のエッジを経由して到達可能な葉ノードである、ことを特徴とする付記３に記載の分類プログラム。

（付記５）前記第１の葉ノードの近傍にある葉ノードは、前記第１の葉ノードの上位にあり前記第１の葉ノードから所定数以下のエッジを経由して到達可能な上位ノードの下位にある葉ノードである、ことを特徴とする付記３に記載の分類プログラム。

（付記６）前記所定数は、前記決定木モデルの深さに基づいて設定される、ことを特徴とする付記５に記載の分類プログラム。

（付記７）前記選択する処理は、
前記ノード間の位置関係に基づいて、前記決定木モデルのうち、前記第１の葉ノードを含む第１の部分木と同一または類似する第２の部分木に含まれる葉ノードの中から、前記第２の葉ノードを選択する、ことを特徴とする付記１〜６のいずれか一つに記載の分類プログラム。

（付記８）前記第２の部分木は、前記第１の部分木に含まれるノードと同一の条件を表すノードを含み、前記第１の部分木とノード間の位置関係が同一である、ことを特徴とする付記７に記載の分類プログラム。

（付記９）前記生成する処理は、さらに、前記決定木モデルの根ノードから前記第１の葉ノードまでの経路上の各ノードが表す条件に関する判定結果と、前記根ノードから前記第２の葉ノードまでの経路上の各ノードが表す条件に関する判定結果との差異に基づいて、前記第１の葉ノードの名称を生成する、ことを特徴とする付記１〜８のいずれか一つに記載の分類プログラム。

（付記１０）前記コンピュータに、
前記対象データに、生成した前記第１の葉ノードの名称を対応付けて出力する、処理を実行させることを特徴とする付記１〜９のいずれか一つに記載の分類プログラム。

（付記１１）前記コンピュータに、
前記第１の葉ノードに、生成した前記第１の葉ノードの名称を設定する、処理を実行させることを特徴とする付記１〜１０のいずれか一つに記載の分類プログラム。

（付記１２）コンピュータが、
対象データを分類する条件を表すノードと、前記対象データが正常であること、または、前記対象データが異常であることを表す葉ノードとを含み、少なくともいずれかの葉ノードに名称が設定された決定木モデルにより、前記対象データを分類し、
名称が未設定である第１の葉ノードに前記対象データが分類された場合、ノード間の位置関係に基づいて、前記決定木モデルのうち、名称が設定済みである第２の葉ノードを選択し、
選択した前記第２の葉ノードの名称に基づいて前記第１の葉ノードの名称を生成する、
処理を実行することを特徴とする分類方法。

（付記１３）対象データを分類する条件を表すノードと、前記対象データが正常であること、または、前記対象データが異常であることを表す葉ノードとを含み、少なくともいずれかの葉ノードに名称が設定された決定木モデルにより、前記対象データを分類し、
名称が未設定である第１の葉ノードに前記対象データが分類された場合、ノード間の位置関係に基づいて、前記決定木モデルのうち、名称が設定済みである第２の葉ノードを選択し、
選択した前記第２の葉ノードの名称に基づいて前記第１の葉ノードの名称を生成する、
制御部を有することを特徴とする分類装置。

１００分類装置
１１０，８０５，１０００，１３００決定木モデル
１１１〜１１６，９０１〜９０４，１００１〜１００６，１３０１〜１３０３，２１０１〜２１０３ノード
１２１〜１２７，９１１〜９１５，１０１１〜１０１７，１３１１〜１３１３，２００１，２１１１〜２１１４葉ノード
２００分類システム
２０１端末装置
２１０ネットワーク
３００，６００バス
３０１，６０１ＣＰＵ
３０２，６０２メモリ
３０３，６０３ネットワークＩ／Ｆ
３０４，６０４記録媒体Ｉ／Ｆ
３０５，６０５記録媒体
４００，８０１，８０６請求データ
５００，１４００請求テーブル
６０６ディスプレイ
６０７入力装置
７００記憶部
７０１取得部
７０２学習部
７０３分類部
７０４選択部
７０５生成部
７０６出力部
８０２事例データ
８０３学習データ集合
８０４機械学習ＦＷ
８０７対応データ
９２１，９２２学習データ部分集合
１２００学習テーブル
２０１０，２２０１〜２２０４部分木
２３００，２４００表示内容

Claims

コンピュータに、
対象データを分類する条件を表すノードと、前記対象データが正常であること、または、前記対象データが異常であることを表す葉ノードとを含み、少なくともいずれかの葉ノードに名称が設定された決定木モデルにより、前記対象データを分類し、
名称が未設定である第１の葉ノードに前記対象データが分類された場合、ノード間の位置関係に基づいて、前記決定木モデルのうち、名称が設定済みである第２の葉ノードを選択し、
選択した前記第２の葉ノードの名称に基づいて前記第１の葉ノードの名称を生成する、
処理を実行させることを特徴とする分類プログラム。
前記第１の葉ノードは、前記対象データが異常であることを表す葉ノードである、ことを特徴とする請求項１に記載の分類プログラム。
前記選択する処理は、
前記ノード間の位置関係に基づいて、前記第１の葉ノードの近傍にある葉ノードの中から、前記第２の葉ノードを選択する、ことを特徴とする請求項１または２に記載の分類プログラム。
前記選択する処理は、
前記ノード間の位置関係に基づいて、前記決定木モデルのうち、前記第１の葉ノードを含む第１の部分木と同一または類似する第２の部分木に含まれる葉ノードの中から、前記第２の葉ノードを選択する、ことを特徴とする請求項１〜３のいずれか一つに記載の分類プログラム。
前記生成する処理は、さらに、前記決定木モデルの根ノードから前記第１の葉ノードまでの経路上の各ノードが表す条件に関する判定結果と、前記根ノードから前記第２の葉ノードまでの経路上の各ノードが表す条件に関する判定結果との差異に基づいて、前記第１の葉ノードの名称を生成する、ことを特徴とする請求項１〜４のいずれか一つに記載の分類プログラム。
前記コンピュータに、
前記対象データに、生成した前記第１の葉ノードの名称を対応付けて出力する、処理を実行させることを特徴とする請求項１〜５のいずれか一つに記載の分類プログラム。
前記コンピュータに、
前記第１の葉ノードに、生成した前記第１の葉ノードの名称を設定する、処理を実行させることを特徴とする請求項１〜６のいずれか一つに記載の分類プログラム。
コンピュータが、
対象データを分類する条件を表すノードと、前記対象データが正常であること、または、前記対象データが異常であることを表す葉ノードとを含み、少なくともいずれかの葉ノードに名称が設定された決定木モデルにより、前記対象データを分類し、
名称が未設定である第１の葉ノードに前記対象データが分類された場合、ノード間の位置関係に基づいて、前記決定木モデルのうち、名称が設定済みである第２の葉ノードを選択し、
選択した前記第２の葉ノードの名称に基づいて前記第１の葉ノードの名称を生成する、
処理を実行することを特徴とする分類方法。
対象データを分類する条件を表すノードと、前記対象データが正常であること、または、前記対象データが異常であることを表す葉ノードとを含み、少なくともいずれかの葉ノードに名称が設定された決定木モデルにより、前記対象データを分類し、
名称が未設定である第１の葉ノードに前記対象データが分類された場合、ノード間の位置関係に基づいて、前記決定木モデルのうち、名称が設定済みである第２の葉ノードを選択し、
選択した前記第２の葉ノードの名称に基づいて前記第１の葉ノードの名称を生成する、
制御部を有することを特徴とする分類装置。