WO2022259313A1

WO2022259313A1 - 誤り判定装置、誤り判定方法、及びプログラム

Info

Publication number: WO2022259313A1
Application number: PCT/JP2021/021569
Authority: WO
Inventors: 英俊川口
Original assignee: 日本電信電話株式会社
Priority date: 2021-06-07
Filing date: 2021-06-07
Publication date: 2022-12-15
Also published as: JPWO2022259313A1

Abstract

分類対象データの分類を推定する分類推定部から推定過程のデータを取得し、当該データに基づいて推定過程特徴ベクトルを生成する分類推定過程観測部と、前記推定過程特徴ベクトルに基づいて、前記分類対象データのクラス毎の所属確率からなる推定確率ベクトルを生成する確率推定部と、前記推定確率ベクトルに基づいて、前記分類推定部による分類結果の正誤を判定し、前記分類結果、正誤の判定結果、及び前記推定確率ベクトルを出力する誤り判定部とを備える誤り判定装置。

Description

誤り判定装置、誤り判定方法、及びプログラム

　本発明は、情報を分類する技術に関連するものである。本技術の適用分野の一例として、ＩＰＳ(Intrusion Prevention System)やアンチウイルスソフトなどのサイバー攻撃に対するセキュリティシステムを扱うセキュリティ運用者が、脅威情報を機械学習技術等で自動的に分類する技術がある。

　サイバー攻撃に対するセキュリティシステムを扱うセキュリティ運用者は、サイバー攻撃活動について攻撃者、攻撃者の行動や手口、脆弱性などを脅威情報としてまとめる。この脅威情報は日々生成する必要があるため、セキュリティ運用者は継続的・逐次的に脅威情報の分類を行う必要がある。

　分類を行う従来技術として、例えば、特許文献１、２に開示された従来技術がある。これら従来技術では、データ分類の正誤を自動判定する技術が提案されており、これにより、誤りと思われるデータの分類作業を人間に委ねることで、データ分類作業を半自動化することを可能としている。

特開２０２０－０２４５１３号公報特開２０２０－１６０６４２号公報

　従来技術においては、データ分類を行って、その正誤の判定を高精度に行うことができるが、分類されたクラス毎の所属する確率を出力できないという課題があった。

　本発明は上記の点に鑑みてなされたものであり、あるデータに対する分類の正誤に加えて、クラス毎の所属する確率を出力することを可能とする技術を提供することを目的とする。

　開示の技術によれば、分類対象データの分類を推定する分類推定部から推定過程のデータを取得し、当該データに基づいて推定過程特徴ベクトルを生成する分類推定過程観測部と、
　前記推定過程特徴ベクトルに基づいて、前記分類対象データのクラス毎の所属確率からなる推定確率ベクトルを生成する確率推定部と、
　前記推定確率ベクトルに基づいて、前記分類推定部による分類結果の正誤を判定し、前記分類結果、正誤の判定結果、及び前記推定確率ベクトルを出力する誤り判定部と
　を備える誤り判定装置が提供される。

　開示の技術によれば、あるデータに対する分類の正誤に加えて、クラス毎の所属する確率を出力することが可能となる。

本発明の実施の形態の概要を説明するための図である。本発明の実施の形態の概要を説明するための図である。本発明の実施の形態における分類装置１００の構成図である。分類確率補正ベクトル算出部の生成方法を説明するためのフローチャートである。装置のハードウェア構成例を示す図である。

　以下、図面を参照して本発明の実施の形態（本実施の形態）を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。

　（実施の形態の概要）
　図１を参照して、本実施の形態の概要を説明する。図１（ａ）は、従来技術のイメージを示しており、分類の確信度を算出する関数（ニューラルネットワーク）から正解率１個のみを出力する。

　それに対し、図１（ｂ）に示す本実施の形態に係る技術では、分類の確信度を算出する関数は、各クラスへの所属確率を全て出力する。

　図２は、本実施の形態に係る分類装置の処理内容の概要を示している。Classifier（後述する分類推定部１１０に相当）は、入力データと、正解となるクラスを用いて学習を行う。その学習時に、分類推定部１１０は、何度もデータのクラスを予測する。予測されたクラスの割合をRejecter内の多クラス確信度算出関数（後述する分類確率補正ベクトル算出部１２２に相当）の訓練データとする。

　例えば、例えばあるデータについて、Classifierの教師あり学習の最中にクラスＡと予測した割合が７０回、クラスＢが２０回、クラスＣが１０回の場合は［０．７，０．２，０．１］がラベルになる。

　ここで予測されたクラスの割合（上記ラベル）を正解データとして使用して、多クラス確信度算出関数の学習を行う。これにより、あるデータに対する各クラスへの所属確率を高い精度で予測可能な多クラス確信度算出関数（分類確率補正ベクトル算出部１２２）を得ることができる。

　以下、本実施の形態に係る分類装置の構成と動作を詳細に説明する。

　（装置構成例）
　図３は、本発明の実施の形態における分類装置１００の機能構成図を示す。図１に示すように、分類装置１００は、分類推定部１１０、及び誤り判定処理部１２０を有する。誤り判定処理部１２０は、分類推定過程観測部１２１、分類確率補正ベクトル算出部１２２、分類確率推定部１２３、誤り判定部１２４を有する。

　また、分類装置１００は、学習部１３０を備えてもよい。学習部１３０は、分類推定部１１０、分類確率補正ベクトル算出部１２２等の教師あり学習において、パラメータ調整等の学習動作を実行する。なお、学習済みの状態においては、学習部１３０を備えないこととしてもよい。また、図３のように学習部１３０を含む装置を学習装置と呼んでもよい。

　なお、分類推定部１１０と誤り判定処理部１２０が別々の装置で構成され、これらがネットワークで接続されていてもよく、その場合、誤り判定処理部１２０を誤り判定装置と称してもよい。また、分類推定部１１０と誤り判定処理部１２０を含む装置を誤り判定装置と呼んでもよい。分類装置１００の推論時の各部の動作の概要は下記のとおりである。

　（動作概要）
　まず、分類対象データが分類推定部１１０に入力される。分類対象データは、本システムを使用して何かしらの分類を行いたいデータであり、例えば脅威情報が該当する。

　分類推定部１１０は、分類対象データの分類を推定する。推定するための方式・モデルは、ＳＶＭ・ニューラルネットワークなどの人工知能関連の技術を想定しているが、これらに限定されるわけではない。

　分類推定過程観測部１２１は、分類推定部１１０が分類対象データを推定する際の計算過程を観測し、特徴ベクトル（推定過程の特徴ベクトル）に変換し、当該特徴ベクトルを出力する。

　分類確率補正ベクトル算出部１２２は、分類推定過程観測部１２１から推定過程の特徴ベクトルを受け取り、分類確率を補正するためのベクトルを算出する。この分類確率補正ベクトル算出部１２２は機械学習で生成される。その生成方法は後述する。

　分類確率補正ベクトル算出部１２２から出力される分類確率補正ベクトルは、分類確率を補正するために用いる数値ベクトルであり、クラス数次元を持つ、実数値ベクトルである。なお、分類確率補正ベクトル算出部１２２から出力される分類確率補正ベクトルを、分類対象データの各クラスへの所属確率のベクトル（クラス毎の推定確率ベクトル）として使用してもよい。

　分類確率推定部１２３は、分類推定過程観測部１２１から推定過程の特徴ベクトルを受け取り、分類確率補正ベクトル算出部１２２から分類確率補正ベクトルを受け取り、分類対象データの各クラスへの所属確率を計算する。複数の実施方法があり、詳細は後述する。推定過程の特徴ベクトル、推定過程の特徴ベクトルの一部、又は、分類確率補正ベクトルをそのまま出力とする場合もある。すなわち、分類確率推定部１２３を備えずに、分類確率補正ベクトル算出部１２２を分類確率推定部１２３として使用してもよい。

　分類確率補正ベクトル算出部１２２と分類確率推定部１２３とを総称して「確率推定部」と称してもよい。分類確率補正ベクトル算出部１２２と分類確率推定部１２３とを含む機能部を「確率推定部」と称してもよい。

　誤り判定部１２４は、分類結果、推定過程の特徴ベクトル、分類毎の推定確率をそれぞれ分類推定部１１０、分類推定過程観測部１２１、分類確率推定部１２３から受け取り、それらをもとに、分類推定部１１０が推定した分類が「正しい」ものか「誤り」であるかを判定する。また、誤り判定部１２３は、誤り判定結果と、分類結果と、クラス毎の推定確率ベクトルをシステム全体の結果として出力する。

　分類結果は、分類対象データの分類結果であり、予め定められたクラス（分類）リストの中から決定された一つ以上の「クラス」を示す。

　クラス毎の推定確率ベクトルは、分類確率推定部１２３が出力した、各クラスの確率値である。例えば、あるデータをＡ，Ｂ，Ｃというクラスに分類する場合を想定した場合、分類がＡである確率が〇％、Ｂは□％、Ｃは△％となる。誤り判定結果は、分類が誤りか否かの判定結果である。

　以下、誤り判定処理部１２０における各部の処理動作を詳細に説明する。

　（分類推定過程観測部１２１）
　まず、分類推定過程観測部１２１について説明する。分類推定過程観測部１２１は、分類推定部１１０が分類対象データを推定する際の計算過程（推定過程のデータ）を観測して特徴ベクトル（推定過程の特徴ベクトル）を構成し、出力する。

　構成される特徴ベクトルは、基本的には分類推定部１１０内のモデルによって異なる。ここでは、代表的な特徴ベクトルの例として、下記の（１）、（２）、（３）について説明する。

　（１）任意の分類推定モジュールで共通して構成できる特徴ベクトル
　任意の分類推定モジュールで共通して構成できる特徴ベクトルの例として、下記の（１－１）、（１－２）がある。

　（１－１）分類対象データを数値ベクトルに変換した特徴ベクトル
　分類推定部１１０を機械学習モデルで構築している場合、内部では分類対象データが数値のベクトルである特徴ベクトルに変換されている。その数値のベクトルを観測し、推定過程の特徴ベクトルとする。

　（１－２）推定したクラス毎の推定確率ベクトル
　分類推定部１１０を、多クラス分類を行う機械学習モデルで構築している場合、クラス毎に分類のスコアリングを行っている。そのスコアリングを観測し、そのスコアリングを確率値に変換して並べることで、推定したクラス毎の確率ベクトルとし、これを推定過程の特徴ベクトルとする。

　具体的には、分類推定過程観測部１２１は、分類推定部１１０を観測して得られるクラス毎のスコア（実数値）から、ソフトマックス関数を用いることで確率のベクトルに変換する。すなわち、ｎクラス分類のとき、各クラスのスコアをａ_１，・・・，ａ_ｎとすると、クラスｋの確率ｐ_ｋは、以下のように計算できる。

　（２）ロジットベクトル
　分類推定部１１０がニューラルネットワークによりクラス分類を行う場合、分類推定部１１０は、基本的には、クラス毎のスコアから分類（クラス）毎の確率ベクトルを推定している。その手順は、各クラスのスコアａ_１，・・・，ａ_ｎにソフトマックス関数を適用するという、上述した「推定したクラス毎の確率ベクトル」の手順と同じである。分類推定過程観測部１２１は、このａ_１，・・・，ａ_ｎを、分類推定部１１０から観測して推定過程の特徴ベクトルとする。

　そのほか、任意の分類器の予測スコアを推定過程の特徴ベクトルとして使用してもよい。例えば、分類推定部１１０がSupport Vector Machine（ＳＶＭ）を用いてクラス分類を行う場合は、境界面との距離を予測スコアとして観測し、これを推定過程の特徴ベクトルとすることができる。

　（３）アンサンブル分類器の特徴ベクトル
　分類推定部１１０を、複数の機械学習モデルで構成している場合、それぞれの機械学習モデルで、上述した「分類対象データを数値ベクトルに変換した特徴ベクトル」、「推定したクラス毎の推定確率ベクトル」、「ロジットベクトル」のいずれか又は複数を取得できる。複数の機械学習モデルのそれぞれのベクトルを連結したベクトルを推定過程の特徴ベクトルとして出力することができる。

　（誤り判定部１２４）
　次に、誤り判定部１２４について説明する。図３に示したように、誤り判定部１２４は、分類結果、推定過程の特徴ベクトル、及びクラス毎の推定確率を受け取り、これらをもとに、分類推定部１１０が推定した分類が「正しい」ものか「誤り」であるかを判定する。なお、推定過程の特徴ベクトルとクラス毎の推定確率のうちの１つのみを使用してもよい。

　また、誤り判定部１２４は、誤り判定結果、分類結果、及びクラス毎の推定確率をシステム全体の結果として出力する。

　誤り判定部１２４が実行する誤り判定方法は、特定の方法に限定されないが、例えば、下記の方法１～３のうちのいずれかの方法を用いることができる。方法１～３のうちのいずれか２つ又は全部を組み合わせて適用してもよい。また、下記の方法１～３は例であり、下記の方法１～３以外の方法を用いてもよい。

　［方法１］
　方法１では、誤り判定部１２４は、確信度と呼ばれる指標を閾値判定する。具体的には、誤り判定部１２４は、クラス毎の推定確率のうちの最大値を取得し、その最大値を確信度とする。確信度が、設定された閾値以上であれば、そのクラスへの分類結果は「正しい」と判定し、設定された閾値未満であれば「誤り」と判定する。

　その他、確信度の計算には、分類結果、推定過程の特徴ベクトル、クラス毎の推定確率のいずれかを使った任意の計算を、使用者が誤り判定部１２４に対して任意に設定することも可能である。

　例えば、誤り判定部１２４は、クラス毎の推定確率の最大値（ｍ１）と、２番目に大きな値（ｍ２）の差分（ｍ１－ｍ２）を確信度とすることとしてもよい。最大値と３番目の値、４番目の値・・・と、任意の順位の推定確率も同様に計算可能である。

　［方法２］
　方法２では、誤り判定部１２４は、不確かさと呼ばれる指標を閾値判定する。具体的には、誤り判定部１２４は、クラス毎の推定確率の平均情報量（エントロピー）を算出し、その値を不確かさとする。不確かさが、設定された閾値以上であれば、分類結果は「誤り」と判定し、閾値未満であれば「正しい」と判定する。

　ｎクラス分類で、クラス毎の確率をｐ_１，・・・，ｐ_ｎとすると、平均情報量は以下のように計算することができる。

　その他、不確かさの計算には、分類結果、推定過程の特徴ベクトル、クラス毎の推定確率のいずれかを使った任意の計算を、使用者が誤り判定部１２４に対して任意に設定することも可能である。

　［方法３］
　特許文献１、２に開示されている従来技術と同じく機械学習により作成した誤り判定部により判定をすることとしてもよい。また、特許文献１、２に開示されている従来技術以外の任意の従来技術を使用して、判定を行うことも可能である。

　（分類確率推定部１２３）
　次に、分類確率推定部１２３について詳細に説明する。図３に示したとおり、分類確率推定部１２３は、推定過程の特徴ベクトルと分類確率補正ベクトルを受け取り、クラス毎の推定確率ベクトルを計算する。その実施方法は特定の方法に限られないが、例えば、以下で説明する方法１～３を使用できる。なお、実施できる方法は、推定過程の特徴ベクトルに何が含まれているかに依存する。

　［方法１］
　推定過程の特徴ベクトルに、「クラス毎の推定確率」が含まれている場合、分類確率推定部１２３は、「クラス毎の推定確率」を切り出し、それをクラス毎の推定確率ベクトルとして出力する。この場合、切り出した「クラス毎の推定確率」をそのまま出力してもよいし、分類確率補正ベクトルで補正をしたものを出力してもよい。補正とは、例えば、切り出した「クラス毎の推定確率」と、分類確率補正ベクトルにおけるクラス毎の推定確率との平均をとることであってもよいし、その他の処理を施したものであってもよい。

　［方法２］
　方法２では、分類確率推定部１２３は、分類確率補正ベクトルをそのままクラス毎の推定確率ベクトルとして出力する。この場合、分類確率推定部１２３を備えずに、分類確率補正ベクトル算出部１２２を分類確率推定部１２３として使用してもよい。

　［方法３］
　方法３では、推定過程の特徴ベクトルに、前述した分類推定過程観測部１２１の（２）で示した「ロジットベクトル」が含まれる場合、以下の方法３－１と方法３－２のうちのいずれかの方法でクラス毎の推定確率ベクトルを算出する。

　［方法３－１］
　ｎクラス分類のとき、ロジットベクトルを［ａ_１，・・・，ａ_ｎ］^Ｔ、分類確率補正ベクトルを［ｂ_１，・・・，ｂ_ｎ］^Ｔとした場合、クラスｋの確率ｐ_ｋは、以下のように計算できる。

　このｐ_ｋをすべてのクラスについて算出し、ベクトル［ｐ_１，・・・，ｐ_ｎ］^Ｔとしたものをクラス毎の推定確率ベクトルとする。

　［方法３－２］
　ｎクラス分類のとき、ロジットベクトルを［ａ_１，・・・，ａ_ｎ］^Ｔ、分類確率補正ベクトルを［ｂ_１，・・・，ｂ_ｎ］^Ｔとする。分類確率補正ベクトル内の要素の最大値ｂ_ｍａｘを取得し、クラスｋの確率ｐ_ｋを、以下のように計算する。

　（分類確率補正ベクトル算出部１２２）
　次に、分類確率補正ベクトル算出部１２２を詳細に説明する。図３に示したとおり、分類確率補正ベクトル算出部１２２は、推定過程の特徴ベクトルを受け取り、分類確率補正ベクトルを算出して出力する。分類確率補正ベクトルは、ｎクラス分類のとき、ｎ次元の実数値ベクトルである。

　分類確率補正ベクトル算出部１２２は、複数の実数値を推定できる機械学習モデルで構築する。分類確率補正ベクトル算出部１２２の生成方法（パラメータのチューニング方法）については後述する。

　分類確率補正ベクトル算出部１２２として使用される、複数の実数値を推定できる機械学習モデルとしては、例えば、ニューラルネットワーク、ロジスティック回帰、サポートベクター回帰（Support Vector Regression，ＳＶＲ）等を使用することができる。
等々である。

　ニューラルネットワークを分類確率補正ベクトル算出部１２２として使用する場合、単一のモデルで複数の実数値を推定できる。しかし、ロジスティック回帰やＳＶＲはそれ単体では複数の実数値を推定できない。そのような場合は、機械学習モデルをｎ個用意し、各クラスに対応する実数値を推論する。

　なお、ニューラルネットワーク、ロジスティック回帰、サポートベクター回帰など、列挙したものはあくまで一例であり、機械学習モデルを用いて複数の実数値を推定することができる構造であれば、任意の機械学習モデルを用いることができる。

　（分類確率補正ベクトル算出部１２２の生成方法）
　次に、分類確率補正ベクトル算出部１２２の生成方法（パラメータ調整方法）について、図４のフローチャートの手順に沿って説明する。ここでの前提として、分類数をｎとする。以下の説明では、説明を分かり易くするために、学習用分類対象データリストに（Ａ）を付し、学習用分類対象データ毎の分類比率リストに（Ｂ）を付し、推定過程特徴ベクトルリストに（Ｃ）を付す。以下の説明では、各部がニューラルネットワークで実装されることを想定しているが、これは一例に過ぎない。

　また、以下の学習に係る処理は、学習部１３０が実行する。学習部１３０は、学習用データを保持する機能、パラメータ調整機能（誤差逆伝搬手法を実行する機能等）等を含んでいる。

　　＜Ｓ１＞
　Ｓ１（ステップ１）において、（Ａ）学習用分類対象データリスト、及び、パラメータ調整前の分類推定部１１０を用意し、学習部１３０に保持する。

　　＜Ｓ２＞
　分類推定部１１０を、一般的な教師あり学習手法でパラメータ調整をする。その過程で、学習部１３０が、（Ｂ）学習用分類対象データ毎の分類比率リストを取得する。（Ｂ）学習用分類対象データ毎の分類比率リストについて説明する。

　ニューラルネットワークが代表例であるが、一般的な教師あり学習では、その過程で、データの分類を何度も行っている。その反復を通して、学習用分類対象データそれぞれに対する分類の比率をリストとして、（Ｂ）学習用分類対象データ毎の分類比率リストとしている。

　例えば、３クラスの分類を行う場合において、学習の過程でニューラルネットワークがデータ１とデータ２を１００回分類したとする。その過程で、データ１はクラス１に５０回、クラス２に３０回、クラス３に２０回分類されたとする。また、データ２はクラス１に１０回、クラス２に７０回、クラス３に２０回分類されたとする。この場合の（Ｂ）学習用分類対象データ毎の分類比率リストは［［０．５，０．３，０．２］^Ｔ，［０．１，０．７，０．２］^Ｔ］となる。

　　＜Ｓ３＞
　Ｓ３において、（Ａ）学習用分類対象データリストの各要素を、Ｓ２でパラメータ調整された分類推定部１１０に入力し、分類推定過程観測部１２１で推定過程の特徴ベクトルを取得し、それを（Ｃ）推定過程特徴ベクトルリストとする。

　　＜Ｓ４＞
　Ｓ４において、乱数等で生成した擬似的な特徴ベクトルを（Ｃ）推定過程特徴ベクトルリストに複数個追加する。また、全ての要素を１／ｎとするｎ次元ベクトルを、（Ｃ）へ追加した疑似的な特徴ベクトルと同数だけ、（Ｂ）学習用分類対象データ毎の分類比率リストに追加する。

　例えば、３クラスの分類を行う場合、（Ｂ）に追加されるベクトルは［１／３，１／３，１／３］^Ｔとなる。いくつ追加するかは、分類装置の利用者が設定するものとする。

　上記のような追加を行うことで、出鱈目な特徴ベクトルに頑強になり、未知の特徴を持つ脅威情報等への分類の精度が向上する。なお、Ｓ４は必須ではなく、Ｓ４を行わないこととしてもよい。

　　＜Ｓ５＞
　Ｓ５において、Ｓ４での処理がなされた（Ｃ）推定過程特徴ベクトルリストを入力、Ｓ４での処理がなされた（Ｂ）学習用分類対象データ毎の分類比率リストを出力（正解）として、分類確率補正ベクトル算出部１２２を教師あり学習で生成する。別の言い方をすれば、分類確率補正ベクトル算出部１２２のパラメータを教師あり学習で調整する。

　（ハードウェア構成例）
　上述した分類装置１００（誤り判定装置も同様）は、例えば、コンピュータに、本実施の形態で説明する処理内容を記述したプログラムを実行させることにより実現可能である。このコンピュータは、物理的なコンピュータであってもよいし、クラウド上の仮想マシンであってもよい。

　すなわち、分類装置１００は、コンピュータに内蔵されるＣＰＵやメモリ等のハードウェア資源を用いて、分類装置１００で実施される処理に対応するプログラムを実行することによって実現することが可能である。上記プログラムは、コンピュータが読み取り可能な記録媒体（可搬メモリ等）に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メール等、ネットワークを通して提供することも可能である。

　図５は、上記コンピュータのハードウェア構成例を示す図である。図５のコンピュータは、それぞれバスＢＳで相互に接続されているドライブ装置１０００、補助記憶装置１００２、メモリ装置１００３、ＣＰＵ１００４、インタフェース装置１００５、表示装置１００６、入力装置１００７、出力装置１００８等を有する。

　当該コンピュータでの処理を実現するプログラムは、例えば、ＣＤ－ＲＯＭ又はメモリカード等の記録媒体１００１によって提供される。プログラムを記憶した記録媒体１００１がドライブ装置１０００にセットされると、プログラムが記録媒体１００１からドライブ装置１０００を介して補助記憶装置１００２にインストールされる。但し、プログラムのインストールは必ずしも記録媒体１００１より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置１００２は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。

　メモリ装置１００３は、プログラムの起動指示があった場合に、補助記憶装置１００２からプログラムを読み出して格納する。ＣＰＵ１００４は、メモリ装置１００３に格納されたプログラムに従って、ライトタッチ維持装置１００に係る機能を実現する。インタフェース装置１００５は、ネットワークや各種計測装置、運動介入装置等に接続するためのインタフェースとして用いられる。表示装置１００６はプログラムによるＧＵＩ（Ｇｒａｐｈｉｃａｌ　Ｕｓｅｒ　Ｉｎｔｅｒｆａｃｅ）等を表示する。入力装置１００７はキーボード及びマウス、ボタン、又はタッチパネル等で構成され、様々な操作指示を入力させるために用いられる。出力装置１００８は演算結果を出力する。

　（実施の形態の効果）
　本実施の形態に係る技術により、正誤の判定に加えて、あるデータに対してクラス毎の確率を出力できるようになる。例えば、あるデータをＡ，Ｂ，Ｃというクラスに分類する場合を想定する。分類装置１００は、分類がＡである確率が〇％，　Ｂは□％，　Ｃは△％というように推定し人間に提示することが可能となる。

　また、本実施の形態に係る技術では、分類推定部１１０の学習中に、学習データ毎に学習中に推定された分類の割合を取得しておき、それを分類確率補正ベクトル算出部１２２の学習に用いている。このような工夫により、従来技術に比べて正誤の判定精度が向上するとともに、システム内部で推定しているクラス毎の確率を推定する精度が向上する。

　（実施の形態のまとめ）
　本明細書には、少なくとも下記各項の誤り判定装置、誤り判定方法、及びプログラムが開示されている。
（第１項）
　分類対象データの分類を推定する分類推定部から推定過程のデータを取得し、当該データに基づいて推定過程特徴ベクトルを生成する分類推定過程観測部と、
　前記推定過程特徴ベクトルに基づいて、前記分類対象データのクラス毎の所属確率からなる推定確率ベクトルを生成する確率推定部と、
　前記推定確率ベクトルに基づいて、前記分類推定部による分類結果の正誤を判定し、前記分類結果、正誤の判定結果、及び前記推定確率ベクトルを出力する誤り判定部と
　を備える誤り判定装置。
（第２項）
　前記確率推定部は、前記分類推定部の学習中に取得された、学習データ毎の各クラスへの分類の割合を正解データとして用いて学習された機械学習モデルを有する
　第１項に記載の誤り判定装置。
（第３項）
　前記誤り判定部は、前記推定確率ベクトルにおけるクラス毎の推定確率のうちの最大値と閾値とを比較することにより前記分類結果の正誤を判定する
　第１項又は第２項に記載の誤り判定装置。
（第４項）
　前記誤り判定部は、前記推定確率ベクトルにおけるクラス毎の推定確率の平均情報量と閾値とを比較することにより前記分類結果の正誤を判定する
　第１項又は第２項に記載の誤り判定装置。
（第５項）
　コンピュータが実行する誤り判定方法であって、
　分類対象データの分類を推定する分類推定部から推定過程のデータを取得し、当該データに基づいて推定過程特徴ベクトルを生成するステップと、
　前記推定過程特徴ベクトルに基づいて、前記分類対象データのクラス毎の所属確率からなる推定確率ベクトルを生成するステップと、
　前記推定確率ベクトルに基づいて、前記分類推定部による分類結果の正誤を判定し、前記分類結果、正誤の判定結果、及び前記推定確率ベクトルを出力するステップと
　を備える誤り判定方法。
（第６項）
　コンピュータを、第１項ないし第４項のうちいずれか１項に記載の誤り判定装置における確率推定部、分類推定過程観測部、及び誤り判定部として機能させるためのプログラム。

　以上、本実施の形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。

１００　分類装置
１１０　分類推定部
１２０　誤り判定処理部
１２１　分類推定過程観測部
１２２　分類確率補正ベクトル算出部
１２３　分類確率推定部
１２４　誤り判定部
１３０　学習部
１０００　ドライブ装置
１００１　記録媒体
１００２　補助記憶装置
１００３　メモリ装置
１００４　ＣＰＵ
１００５　インタフェース装置
１００６　表示装置
１００７　入力装置
１００８　出力装置

Claims

　分類対象データの分類を推定する分類推定部から推定過程のデータを取得し、当該データに基づいて推定過程特徴ベクトルを生成する分類推定過程観測部と、
　前記推定過程特徴ベクトルに基づいて、前記分類対象データのクラス毎の所属確率からなる推定確率ベクトルを生成する確率推定部と、
　前記推定確率ベクトルに基づいて、前記分類推定部による分類結果の正誤を判定し、前記分類結果、正誤の判定結果、及び前記推定確率ベクトルを出力する誤り判定部と
　を備える誤り判定装置。
　前記確率推定部は、前記分類推定部の学習中に取得された、学習データ毎の各クラスへの分類の割合を正解データとして用いて学習された機械学習モデルを有する
　請求項１に記載の誤り判定装置。
　前記誤り判定部は、前記推定確率ベクトルにおけるクラス毎の推定確率のうちの最大値と閾値とを比較することにより前記分類結果の正誤を判定する
　請求項１又は２に記載の誤り判定装置。
　前記誤り判定部は、前記推定確率ベクトルにおけるクラス毎の推定確率の平均情報量と閾値とを比較することにより前記分類結果の正誤を判定する
　請求項１又は２に記載の誤り判定装置。
　コンピュータが実行する誤り判定方法であって、
　分類対象データの分類を推定する分類推定部から推定過程のデータを取得し、当該データに基づいて推定過程特徴ベクトルを生成するステップと、
　前記推定過程特徴ベクトルに基づいて、前記分類対象データのクラス毎の所属確率からなる推定確率ベクトルを生成するステップと、
　前記推定確率ベクトルに基づいて、前記分類推定部による分類結果の正誤を判定し、前記分類結果、正誤の判定結果、及び前記推定確率ベクトルを出力するステップと
　を備える誤り判定方法。
　コンピュータを、請求項１ないし４のうちいずれか１項に記載の誤り判定装置における確率推定部、分類推定過程観測部、及び誤り判定部として機能させるためのプログラム。