JP2023131287A

JP2023131287A - 情報処理装置および学習方法

Info

Publication number: JP2023131287A
Application number: JP2022035944A
Authority: JP
Inventors: 深山嵜; Fukashi Yamazaki
Original assignee: Canon Inc; Canon Medical Systems Corp
Current assignee: Canon Inc; Canon Medical Systems Corp
Priority date: 2022-03-09
Filing date: 2022-03-09
Publication date: 2023-09-22
Also published as: US20230290119A1

Abstract

【課題】機械学習に基づく認識器（学習モデル）の学習において当該認識器による認識精度の低下を抑制することのできる技術を提供する。
【解決手段】本発明に係る情報処理装置は、学習画像データと、前記学習画像データに含まれる第１の領域の正解領域を表す正解領域画像データと、学習モデルが行う所定の認識に関する正解データとを取得する第１の取得部と、前記学習画像データに対する前記第１の領域の推定領域を表す推定領域画像データを取得する第２の取得部と、前記学習画像データと、前記正解領域画像データと、前記正解データとを含み構成される第１の教師データセットと、前記学習画像データと、前記推定領域画像データと、前記正解データとを含み構成される第２の教師データセットとを用いて、前記学習モデルを学習させる学習部とを有する。
【選択図】図１

Description

本明細書の開示は、情報処理装置および学習方法に関する。

機械学習による画像認識では、対象画像データと、対象画像データ中に描出される物体の領域を表す画像データとを認識器に入力し、対象画像データに対して認識する場合がある。この対象画像データ中に描出される物体の領域を表す画像データには、しばしば、別の認識器による認識結果が用いられる。非特許文献１には、機械学習に基づく認識器に対して、対象画像データであるＣＴ画像データと、別の認識器によってセグメンテーションされた膵臓の領域を表す画像データとを入力し、膵がんの領域を認識できるように学習する技術が開示されている。

ＦｅｎｇｚｅＬｉｕｅｔａｌ．， "ＦｕｓｉｏｎＮｅｔ：ＩｎｃｏｒｐｏｒａｔｉｎｇＳｈａｐｅａｎｄＴｅｘｔｕｒｅｆｏｒＡｂｎｏｒｍａｌｉｔｙＤｅｔｅｃｔｉｏｎｉｎ３ＤＡｂｄｏｍｉｎａｌＣＴＳｃａｎｓ"，ａｒＸｉｖ：１９０８．０７６５４［ｃｓ．ＣＶ］，２０１９．

しかしながら、別の認識器によってセグメンテーションされた領域の精度が低い場合に、機械学習に基づく認識器の学習が堅調に進まず、認識器による認識精度が低下することがあった。

本明細書の開示は、機械学習に基づく認識器（学習モデル）の学習において当該認識器による認識精度の低下を抑制することのできる技術を提供することを目的とする。

本発明に係る情報処理装置は、画像データと、当該画像データに含まれる第１の領域に関する領域画像データとを入力して、当該画像データに関する所定の認識を行う学習モデルの学習を行う情報処理装置であって、学習画像データと、前記学習画像データに含まれる前記第１の領域の正解領域を表す正解領域画像データと、前記認識に関する正解データとを取得する第１の取得部と、前記学習画像データに対する前記第１の領域の推定領域を表す推定領域画像データを取得する第２の取得部と、前記学習画像データと、前記正解領域画像データと、前記正解データとを含み構成される第１の教師データセットと、前記学習画像データと、前記推定領域画像データと、前記正解データとを含み構成される第２の教師データセットとを用いて、前記学習モデルを学習させる学習部とを有する。

本明細書の開示によれば、機械学習に基づく認識器（学習モデル）の学習において当該認識器による認識精度の低下を抑制することができる。

第１の実施形態に係る情報処理装置の機能構成の一例を示す図。第１の実施形態に係る情報処理装置のハードウェア構成の一例を示す図。第１の実施形態に係る情報処理装置の処理手順の一例を示す図。第１の実施形態に係る情報処理装置の処理手順の一例を示す図。第１の実施形態に係る画像を説明する図。第２の実施形態に係る情報処理装置の処理手順の一例を示す図。第３の実施形態に係る情報処理装置の機能構成の一例を示す図。第３の実施形態に係る情報処理装置の処理手順の一例を示す図。

以下、図面を参照して本明細書に開示の情報処理装置の実施形態について説明する。各図面に示される同一または同等の構成要素、部材、処理には、同一の符号を付するものとし、適宜重複した説明は省略する。また、各図面では適宜、構成要素、部材、処理の一部は省略して表示する。

以下では、Ｘ線コンピュータ断層撮像（Ｘ線ＣＴ）装置で撮影された腹部ＣＴ画像データ中に描出されている腹部組織を例に挙げて、本発明について説明する。しかしながら、本発明は腹部組織のみならず、あらゆる構造物に対して適用可能である。また、核磁気共鳴画像撮像（ＭＲＩ）装置、ポジトロン断層撮像（ＰＥＴ）装置、超音波撮像装置で撮像された断層画像や、カメラで撮影された通常の画像に対しても適用可能である。また、入力となる画像は２次元画像であっても、３次元画像であっても適用可能である。さらに、本発明は一般物体を撮影した画像に対しても適用可能である。なお、本発明の実施形態は以下の実施形態に限定されるものではない。

＜第１の実施形態＞
（概要）
本実施形態では、対象物が描出されている画像データである腹部ＣＴ画像データと、第１の領域の領域画像データである膵臓の領域画像データとを入力として、第２の領域である膵腫瘍の領域をセグメンテーションするための学習モデルの学習方法について説明する。以下、学習モデルを認識器と呼称する。

本実施形態に係る情報処理装置は、まず、腹部ＣＴ画像データと、腹部ＣＴ画像データ中の真の膵臓の領域を表す膵臓の正解領域画像データと、真の膵腫瘍の領域を表す膵腫瘍の正解領域画像データとを含む第１の教師データセットを用いて、認識器を学習させる。続いて、情報処理装置は、腹部ＣＴ画像データと、腹部ＣＴ画像データ中の膵臓の領域の推定結果を表す膵臓の推定領域画像データと、膵腫瘍の正解領域画像データとを含む第２の教師データセットを用いて、認識器を追加学習させる。ここで、腹部ＣＴ画像データ、膵臓の正解領域画像データ、膵臓の推定領域画像データ、膵腫瘍の正解領域画像データは、夫々、学習画像データ、第１の領域の正解領域画像データ、第１の領域の推定領域画像データ、学習画像データに対する正解データの一例である。

本実施形態では、畳込みニューラルネットワーク（ＣＮＮ）を認識器として用いる例を説明する。本実施形態におけるＣＮＮは、例えば、Ｕ－Ｎｅｔのような画像データから対象物体の領域をセグメンテーションするものである。

（機能構成）
以下、図１を参照して本実施形態に係る情報処理装置１００の機能構成について説明する。同図に示すように、情報処理装置１００は、第１の取得部１１０、推定部１２０、第２の取得部１３０、および学習部１４０によって構成されている。また、本実施形態に係る情報処理装置１００は、外部に記憶装置７０を具備する。

記憶装置７０はコンピュータが読み取り可能な記憶媒体の一例であり、ハードディスクドライブ（ＨＤＤ）やソリッドステイトドライブ（ＳＳＤ）に代表される大容量記憶装置
である。記憶装置７０は、腹部ＣＴ画像データ、膵臓の正解領域画像データ、膵腫瘍の正解領域画像データを保持している。また、記憶装置７０は、腹部ＣＴ画像データから膵臓の領域をセグメンテーションするように学習されたＣＮＮを保持する。以降では、腹部ＣＴ画像データから膵臓の領域をセグメンテーションするように学習されたＣＮＮを膵臓セグメンテーションＣＮＮと呼称する。記憶装置７０で保持されている膵臓セグメンテーションＣＮＮは、例えば、ＣＮＮのレイヤー構成およびパラメータ（重みやバイアス等）を保持したデータであってもよいし、パラメータのみを保持したデータであってもよい。

正解領域画像データとは、腹部ＣＴ画像に描出されている対象組織の領域を表す画像データであり、例えば、医師や放射線技師によってアノテーションされたものである。また、正解領域画像データでは、例えば、対象組織の領域に含まれるボクセルの値が１、それ以外のボクセルの値が０で表現されている。

なお、記憶装置７０は、情報処理装置１００の一機能として構成されてもよい。

第１の取得部１１０は、記憶装置７０から複数の腹部ＣＴ画像データと、複数の腹部ＣＴ画像データの夫々に対応する複数の膵臓の正解領域画像データおよび複数の膵腫瘍の正解領域画像データとを取得する。そして、第１の取得部１１０は、推定部１２０に腹部ＣＴ画像データを送信し、学習部１４０に腹部ＣＴ画像データ、膵臓の正解領域画像データ、および膵腫瘍の正解領域画像データを送信する。

推定部１２０は、まず、第１の取得部１１０から腹部ＣＴ画像データを受信し、記憶装置７０から膵臓セグメンテーションＣＮＮを取得する。推定部１２０は、取得した膵臓セグメンテーションＣＮＮに関するデータをもとに、ＣＮＮによる推定処理（後述）ができるようにＣＮＮを構築する。そして、推定部１２０は、腹部ＣＴ画像データを膵臓セグメンテーションＣＮＮに入力し、処理結果として膵臓の推定領域画像データを生成する。

推定領域画像データとは、腹部ＣＴ画像データに描出されている対象組織の領域を表す画像データである。推定領域画像データでは、例えば、対象組織の領域に含まれるボクセルの値が１、それ以外のボクセルの値が０で表現されている。

第２の取得部１３０は、推定部１２０から膵臓の推定領域画像データを取得し、学習部１４０に送信する。

学習部１４０は、第１の取得部１１０から複数の腹部ＣＴ画像データと、複数の腹部ＣＴ画像データの夫々に対応する複数の膵臓の正解領域画像データおよび複数の膵腫瘍の正解領域画像データとを受信する。また、第２の取得部１３０から複数の腹部ＣＴ画像データの夫々に対応する膵臓の推定領域画像データを受信する。次に、学習部１４０は、複数の腹部ＣＴ画像データと、それらの夫々に対応する膵臓の正解領域画像データと膵腫瘍の正解領域画像データとを含み構成される第１の教師データセットを用いて、認識器を学習させる。当該認識器は、腹部ＣＴ画像データと膵臓の領域画像データとを入力とするＣＮＮであり、膵腫瘍の領域をセグメンテーションするように学習される。すなわち、学習部１４０は、腹部ＣＴ画像データと、膵臓の領域画像データと、膵腫瘍の領域画像データとを一組の教師データとしてＣＮＮを学習させる。続いて、学習部１４０は、複数の腹部ＣＴ画像データと、それらの夫々に対応する膵臓の推定領域画像データと膵腫瘍の正解領域画像データとを含み構成される第２の教師データセットを用いて、第１の教師データセットによって学習されたＣＮＮを追加学習させる。追加学習とは、第１の教師データセットを用いて学習させることで得られた認識器（ＣＮＮ）のパラメータを初期値として、認識器のパラメータを再度更新することを指す。このとき、一部のパラメータを固定にして、残りのパラメータのみが更新されるようにしてもよい。そして、一連の学習処理を終えた
後、学習部１４０は、第２の教師データセットを用いて学習させたＣＮＮを記憶装置７０に保存する。以降では、学習部１４０によって膵腫瘍の領域をセグメンテーションするように学習されるＣＮＮを、膵腫瘍セグメンテーションＣＮＮと呼称する。

ここで、図５を用いて、本実施形態に係る画像データについて説明する。図５（ａ）は、腹部ＣＴ画像データ５１０を表している。本実施形態において、腹部ＣＴ画像データ５１０は、膵臓の領域５１２が含まれるようにクロップされた３次元画像である。腹部ＣＴ画像データ５１０中には、例えば、膵臓の領域５１２および膵腫瘍の領域５１１が描出されている。図５（ｂ）は、膵腫瘍の正解領域画像データ５２０を表しており、正解領域画像データ５２０は、腹部ＣＴ画像データ５１０中の真の膵腫瘍の領域である膵腫瘍の正解領域５２１を表している。また、図５（ｃ）は、腹部ＣＴ画像データ５１０中の真の膵臓の正解領域画像データ５３０を表し、図５（ｄ）は、推定部１２０によって生成される膵臓の推定領域画像データ５４０を表している。膵臓の正解領域画像データ５３０および膵臓の推定領域画像データ５４０は、それぞれ膵臓の正解領域５３２および膵臓の推定領域５４２を表している。膵臓の推定領域５４２は、腹部ＣＴ画像データ５１０中の膵臓の領域５１２を推定（セグメンテーション）した結果である。ここで、膵臓の正解領域５３２と膵臓の推定領域５４２は必ずしも一致せず、両者の間には差異が生ずることがある。図に示した例では、膵腫瘍の領域５１１が存在する付近で、膵臓の正解領域５３２との差異が生じている。このように真の膵臓の領域とは異なる推定領域画像データが含まれる第２の教師データセットのみを用いて認識器を学習させると、膵臓の推定領域画像データの誤りが学習の停滞等の悪影響を及ぼし、認識器の精度を低下させる可能性がある。一方で、腹部ＣＴ画像データからの完全自動な膵がんセグメンテーションを実現する場合には、膵がんセグメンテーションＣＮＮの推論時に、膵臓の領域画像データとして膵臓の推定領域画像データが入力される。そのため、膵臓の正解領域画像データが含まれる第１の教師データセットのみを用いて認識器を学習させると、学習時と推論時の領域画像データの違いから、認識器の精度が低下する可能性がある。そこで、本実施形態では、第１の教師データセットと第２の教師データセットとを用いることで、膵臓の領域画像データの特徴を効率良く認識器に学習させ、認識器の精度の低下を抑制する。

（ハードウェア構成）
続いて、図２を用いて、情報処理装置１００のハードウェア構成について説明する。情報処理装置１００は、公知のコンピュータ（情報処理装置）の構成を有する。情報処理装置１００は、そのハードウェア構成として、ＣＰＵ２０１、主メモリ２０２、磁気ディスク２０３、表示メモリ２０４、モニタ２０５、マウス２０６、キーボード２０７を含む。

ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２０１は、主として各構成要素の動作を制御する。主メモリ２０２は、ＣＰＵ２０１が実行する制御プログラムを格納したり、ＣＰＵ２０１によるプログラム実行時の作業領域を提供したりする。磁気ディスク２０３は、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）、周辺機器のデバイスドライバ、後述する処理等を行うためのプログラムを含む各種アプリケーションソフトを実現するためのプログラムを格納する。ＣＰＵ２０１が主メモリ２０２、磁気ディスク２０３等に格納されているプログラムを実行することにより、図１に示した情報処理装置１００の機能（ソフトウェア）及び後述するフローチャートにおける処理が実現される。

表示メモリ２０４は、表示用データを一時記憶する。モニタ２０５は、例えばＣＲＴモニタや液晶モニタ等であり、表示メモリ２０４からのデータに基づいて画像やテキスト等の表示を行う。マウス２０６及びキーボード２０７は、ユーザによるポインティング入力及び文字等の入力を夫々行う。上記各構成要素は、共通バス２０８により互いに通信可能に接続されている。

ＣＰＵ２０１はプロセッサまたは制御部の一例に相当する。情報処理装置１００は、ＣＰＵ２０１に加えて、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）やＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）の少なくともいずれかを有していてもよい。また、ＣＰＵ２０１に代えて、ＧＰＵやＦＰＧＡの少なくともいずれかを有していてもよい。主メモリ２０２および磁気ディスク２０３はメモリまたは記憶装置の一例に相当する。

（処理手順）
次に、本実施形態に係る情報処理装置１００の処理手順について、図３を用いて説明する。

（ステップＳ３００）
ステップＳ３００において、第１の取得部１１０は、記憶装置７０から複数の腹部ＣＴ画像データと、複数の腹部ＣＴ画像データの夫々に対応する複数の膵臓の正解領域画像データおよび複数の膵腫瘍の正解領域画像データとを取得する。そして、第１の取得部１１０は、推定部１２０に複数の腹部ＣＴ画像データを送信し、学習部１４０に複数の腹部ＣＴ画像データと、複数の膵臓の正解領域画像データと、複数の膵腫瘍の正解領域画像データとを送信する。

（ステップＳ３１０）
ステップＳ３１０において、推定部１２０は、記憶装置７０から腹部ＣＴ画像データから膵臓の領域をセグメンテーションするように学習された膵臓セグメンテーションＣＮＮを取得する。次に、推定部１２０は、第１の取得部１１０から受信した腹部ＣＴ画像データを膵臓セグメンテーションＣＮＮに入力し、腹部ＣＴ画像データ中に描出されている膵臓の領域を推定し、膵臓の推定領域画像データを生成する。このとき、推定部１２０は、膵臓の推定領域画像データに対して、任意の画像処理による後処理を実行してもよい。任意の画像処理とは、セグメンテーションされた膵臓の領域をリファインする処理であり、例えば、２値化処理、最大連結成分取得、モルフォロジー処理、グラフカット・セグメンテーションである。その他にも、解像度変換などを行ってもよい。そして、第２の取得部１３０は、推定部１２０から膵臓の推定領域画像データを取得し、それを学習部１４０に送信する。

（ステップＳ３２０）
ステップＳ３２０において、学習部１４０は、第１の取得部１１０から複数の腹部ＣＴ画像データと、複数の腹部ＣＴ画像データの夫々に対応する複数の膵臓の正解領域画像データおよび複数の膵腫瘍の正解領域画像データとを受信する。また、学習部１４０は、第２の取得部１３０から複数の腹部ＣＴ画像データの夫々に対応する複数の膵臓の推定領域画像データを受信する。本実施形態では、複数の腹部ＣＴ画像データと、複数の膵臓の正解領域画像データと、複数の膵腫瘍の正解領域画像データとを含む教示データセットを第１の教示データセットとして定義する。また、複数の腹部ＣＴ画像データと、複数の膵臓の推定領域画像データと、複数の膵腫瘍の正解領域画像データとを含む教示データセットを第２の教示データセットとして定義する。学習部１４０は、第１の教示データセットおよび第２の教示データセットを用いて、膵腫瘍セグメンテーションＣＮＮを学習させ、記憶装置７０に学習済みの膵腫瘍セグメンテーションＣＮＮを保存する。以下では、図４を用いて、ステップＳ３２０の処理手順を詳しく説明する。

（ステップＳ４２１）
ステップＳ４２１において、学習部１４０は、膵臓の正解領域画像データを含む第１の教師データセットを用いて、膵腫瘍セグメンテーションＣＮＮに対する学習処理を実行し、ＣＮＮが有するパラメータを更新する。ＣＮＮが有するパラメータとは、典型的には、
畳込み層のカーネルの重みやバイアス、バッチ正規化層のオフセットやスケール係数である。本実施形態において、膵腫瘍セグメンテーションＣＮＮは、腹部ＣＴ画像データと該腹部ＣＴ画像データに対応する膵臓の正解領域画像データとを入力として受け取り、膵腫瘍の領域をセグメンテーションするように学習される。そのため、学習部１４０は、腹部ＣＴ画像データと、膵臓の正解領域画像データと、膵腫瘍の正解領域画像データとを一組の教師データとして扱い、膵腫瘍セグメンテーションＣＮＮが有するパラメータを更新する。

本ステップでは、第１の教師データセットから、複数の教師データ（バッチ）を選択し、誤差逆伝播法などの公知の方法を用いて、膵腫瘍のセグメンテーションＣＮＮが有するパラメータを更新する。このとき、損失関数は、ＭｅａｎＳｑｕａｒｅｄＥｒｒｏｒ（ＭＳＥ）や、ＤｉｃｅＣｏｅｆｆｉｃｉｅｎｔＬｏｓｓなど、公知のものを利用すればよい。また、最適化手法も同様に、ＳｔｏｃｈａｓｔｉｃＧｒａｄｉｅｎｔＤｅｓｃｅｎｔ（ＳＧＤ）法やＡｄａｍ法のような公知の方法を利用すればよい。その他、学習率やバッチサイズなどのハイパーパラメータについても、適当な値を設定すればよい。

（ステップＳ４２２）
ステップＳ４２２において、学習部１４０は、第１の教師データセットを用いた膵腫瘍セグメンテーションＣＮＮの学習の終了条件を満たしているか否かを判定し、次のステップを決定する。学習の終了条件は、典型的には、学習開始からの経過エポック数が所定の数に達することや、損失関数の値が所定の値に達すること等であるが、それらに限定されない。例えば、第１の教師データセットとは別のデータセット（検証データセット）の精度が所定値に達することであってもよい。また、複数の終了条件を組み合わせてもよい。本実施形態では、学習開始からの経過エポック数が、予め設定したエポック数の上限値（最大エポック数）に達することを学習の終了条件とする。学習部１４０は、学習の終了条件を満たす場合にはステップＳ４２３に進み、それ以外の場合にはステップＳ４２１に戻る。

（ステップＳ４２３）
ステップＳ４２３において、学習部１４０は、第１の教師データセットを用いて学習させた膵腫瘍セグメンテーションＣＮＮに対して、膵臓の推定領域画像データを含む第２の教師データセットを用いて追加の学習処理を実行する。学習処理は、ステップＳ４２１と同様に、公知の方法を用いて実行される。このとき、損失関数、最適化手法、学習率、バッチサイズなどのハイパーパラメータは、第１の教師データセットを用いて膵腫瘍セグメンテーションＣＮＮを学習させる際のものと同一であってもよいし、一部を変更してもよい。

（ステップＳ４２４）
ステップＳ４２４において、学習部１４０は、第２の教師データセットを用いた膵腫瘍セグメンテーションＣＮＮの学習の終了条件を満たしているか否かを判定し、次のステップを決定する。学習の終了条件は、ステップＳ４２２に例示したような公知のものを用いる。なお、ステップＳ４２２と同一の終了条件を用いてもよいし、異なる終了条件を用いてもよい。学習部１４０は、学習の終了条件を満たす場合には、上記の学習処理により学習された膵腫瘍セグメンテーションＣＮＮを記憶装置７０に保存してステップＳ３２０を終了し、それ以外の場合にはステップＳ４２３に戻る。

以上に示した学習方法により、腹部ＣＴ画像データと、該腹部ＣＴ画像に含まれる膵臓の領域画像データとを入力として、膵腫瘍の領域をセグメンテーションする膵腫瘍セグメンテーションＣＮＮを生成できる。このように学習された膵腫瘍セグメンテーションＣＮＮ（認識器）は、認識処理（推論処理）に用いることができる。認識処理の一例として、
図１に不図示の認識部により、膵腫瘍の領域をセグメンテーションし、膵腫瘍の推定領域画像データを生成する方法を説明する。情報処理装置１００における認識部は、まず記憶装置７０から膵臓セグメンテーションＣＮＮを取得する。次に、認識部は、第１の取得部１１０から認識対象である腹部ＣＴ画像データを受信し、第２の取得部１３０から該腹部ＣＴ画像データに含まれる膵臓の領域画像データを受信する。続いて、認識部は、該腹部ＣＴ画像データと該膵臓の領域画像データとを膵腫瘍セグメンテーションＣＮＮに入力し、膵腫瘍の領域をセグメンテーションする。そして、認識部は、膵腫瘍の領域のセグメンテーション結果として、膵腫瘍の推定領域画像データを生成し、記憶部７０に保存する。なお、認識部は、情報処理装置１００に構成されていてもよいし、別の装置の機能として実現されていてもよい。

（効果）
以上に示したように、本実施形態に係る情報処理装置１００は、膵臓の正解領域画像データを含む第１の教師データセットで認識器を学習させ、該認識器に対して、膵臓の推定領域画像データを含む第２の教師データセットを用いて追加学習させる。このように段階的に学習させることで、膵臓の推定領域画像データが保持する膵臓の領域に誤りが存在する場合であっても、膵臓の領域画像データからの特徴を効率良く学習できるため、膵腫瘍セグメンテーションＣＮＮの精度低下を抑制できる。

（バリエーション）
上述の説明では、腹部ＣＴ画像データ中の膵臓や膵腫瘍を例に挙げたが、本発明は任意の画像データ中の任意の物体に対して適用可能である。すなわち、ＣＴ以外の医用画像データやカメラで撮影された画像データに対しても適用可能である。

上述の説明では、対象画像データ（腹部ＣＴ画像データ）と第１の領域（膵臓）の領域画像データを入力として、第２の領域（膵腫瘍）をセグメンテーションする画像認識タスクを例に挙げたが、適用可能な画像認識タスクはこれに限らない。例えば、対象画像データに対する画像分類や、第１の領域または第２の領域に対するクラス分類であってもよい。この場合、情報処理装置は、対象画像データと第１の領域の正解領域画像データとに対応する正解データとして、分類対象に対応するラベル（対象画像データ、第１の領域、または第２の領域が属するクラスを示すデータ）を取得し、認識器を学習させる。また、第１の領域または第２の領域の位置を特定するような画像認識タスクであってもよい。第１の領域または第２の領域のセグメンテーションであれば、対象画像データと第１の領域の正解領域画像データとに対応する正解データとして、分類対象である第１の領域または第２の領域に対応する正解領域画像データを取得し、認識器を学習させる。バウンディングボックス検出やランドマーク検出であれば、正解データとして、分類対象である第１の領域または第２の領域に対応する正解座標データを取得し、認識器を学習させる。その他、対象画像データと第１の領域の領域画像データとを入力とする構成であれば、いかなる画像認識タスクに対しても適用可能である。また、第１の領域や第２の領域は複数存在していてもよい。

上述の説明では、推定部１２０は、情報処理装置１００の一機能として構成されていたが、外部装置の一機能として構成されていてもよい。この場合、情報処理装置１００は、ステップＳ３１０において、第２の取得部１３０よって、推定部１２０の機能を有する外部装置、または膵臓の推定領域画像データが記憶されている外部記憶装置から膵臓の推定領域画像データを取得する。

上述の説明では、正解領域画像データおよび推定領域画像データは、ボクセル値が０または１で表現される２値画像データであったが、この表現形式は一例であり、対象組織の領域を表現可能な任意の形式でよい。例えば、対象組織の領域らしさを連続値で表す画像
データであってもよいし、複数の対象組織を多値で表現した画像データであってもよい。また、正解領域画像データと推定領域画像データの表現形式は同一であってもよいし、夫々異なっていてもよい。

上述の説明では、認識器としてＣＮＮのような深層学習に基づく認識器を例示したが、これに限らない。例えば、ＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅ（ＳＶＭ）やＲａｎｄｏｍＦｏｒｅｓｔなどの分類木を認識器として利用してもよい。この場合、学習方法は、認識器によって適切な方法を用いる。また、推定部１２０における認識器は、上述の機械学習に基づく手法に限らず、画像処理に基づく手法であれば何れの方法でもよい。例えば、臓器の存在確率アトラスとの位置合わせに基づく手法や、しきい値処理をベースとした手法であってもよい。

上述の説明では、正解領域画像データとして、医師や放射線技師によってアノテーションされたデータを用いる場合を例として説明したが、正解領域画像データはこれに限らず、推定領域画像データよりも信頼度が高い任意のデータを利用できる。例えば、正解領域画像データは、高精度な領域推定が期待できる第１の認識器によって生成し、推定領域画像データは、第１の認識器と比較して計算が簡易な第２の認識器によって生成されたものでもよい。これによれば、医師などによってアノテーションされた領域画像データがなくても、本明細書に開示の効果を享受できる。なお、膵臓の領域のセグメンテーションから膵腫瘍の領域のセグメンテーションまでの一連の推論処理を実行する際に、計算コスト（計算時間や計算リソース）の制約により、高精度な領域推定を期待できる認識器を用いることが困難な場合がある。このような場合において、本明細書に開示の学習方法を適用することで、簡易な認識器で生成された領域画像データの精度の低さによる悪影響を低減することが可能になる。

上述の説明では、推定部１２０における膵臓セグメンテーションＣＮＮと、学習部１４０における膵腫瘍セグメンテーションＣＮＮの入力として、同一の腹部ＣＴ画像データを用いる場合を例として説明したが、異なる画像データを用いてもよい。例えば、夫々の入力に異なる平滑化フィルタを適用したり、何れか一方だけに平滑化フィルタを適用したりしてもよい。他にも、夫々の入力として互いに解像度が異なる腹部ＣＴ画像データを用いてもよい。また、夫々の入力として、位置合わせ済みの造影状態が異なる画像データを用いてもよいし、異なるモダリティの画像データを用いてもよい。

＜第２の実施形態＞
（概要）
第１の実施形態では、膵臓の正解領域画像データを含む第１の教師データセットと、膵臓の推定領域画像データを含む第２の教師データセットとを用いて、認識器（学習モデル）を段階的に学習させた。第２の実施形態では、第１の教師データセットと第２の教師データセットに基づいて第３の教師データセットを構築し、第３の教師データセットを用いて認識器を学習させる方法について説明する。このとき、本実施形態に係る情報処理装置は、所定の条件を満たした場合に、第１の教師データセットに含まれる教師データと、第２の教師データセットに含まれる教師データとの比率を変更しながら第３の教師データセットを構築する。より具体的には、各学習のステップであるエポックの開始時（所定の条件の一例）に、学習開始時からのエポックの回数（エポック数）に応じて第１の教師データセットからサンプリングする教師データの数を徐々に減少するように、第３の教師データセットを構築する。逆説的に言うと、エポック数の増加に伴って、徐々に第３の教師データセット中の第２の教師データセットに含まれる教師データの占める割合が増えるように、第３の教師データセットを構築する。

（機能構成）
本実施形態に係る情報処理装置の構成は、第１の実施形態に係る情報処理装置１００と同じである。以下では、図１を参照して、本実施形態に係る情報処理装置の機能構成について、第１の実施形態に係る情報処理装置との重複部分を省略して説明する。記憶装置７０、第１の取得部１１０、推定部１２０、および第２の取得部１３０は第１の実施形態と同様であるため、説明を省略する。

学習部１４０は、第１の実施形態と同様に、複数の腹部ＣＴ画像データと、複数の腹部ＣＴ画像データの夫々に対応する複数の膵臓の正解領域画像データ、複数の膵腫瘍の正解領域画像データ、および複数の膵臓の推定領域画像データを受信する。次に、学習部１４０は、膵臓の正解領域画像データを含む第１の教師データセットと、膵臓の推定領域画像データを含む第２の教師データセットとに基づいて第３の教師データセットを構築し、膵腫瘍セグメンテーションＣＮＮに対する学習処理を実行する。本実施形態では、学習部１４０は、エポックの開始時に、エポック数に応じて第１の教師データセットからサンプリングする教師データの数が徐々に減少するように、第３の教師データセットを構築する。そして、一連の学習処理を終えた後、学習部１４０は、学習させた膵腫瘍セグメンテーションＣＮＮを記憶装置７０に保存する。

（ハードウェア構成）
本実施形態に係る情報処理装置１００のハードウェア構成は、第１の実施形態と同一であるため、説明を省略する。

（処理手順）
次に、図３を用いて、本実施形態における情報処理装置１００の処理手順について説明する。以下では、第１の実施形態に係る情報処理装置１００の説明との重複部分を省略して説明する。

（ステップＳ３００，Ｓ３１０）
ステップＳ３００，Ｓ３１０は、第１の実施形態におけるステップＳ３００，Ｓ３１０と同一のため、説明を省略する。

（ステップＳ３２０）
ステップＳ３２０において、学習部１４０は、第１の取得部１１０から複数の腹部ＣＴ画像データと、複数の腹部ＣＴ画像データの夫々に対応する複数の膵臓の正解領域画像データおよび複数の膵腫瘍の正解領域画像データとを受信する。また、学習部１４０は、第２の取得部１３０から複数の腹部ＣＴ画像データの夫々に対応する複数の膵臓の推定領域画像データを受信する。本実施形態において、第１の実施形態と同様に、複数の腹部ＣＴ画像データと、複数の膵臓の正解領域画像データと、複数の膵腫瘍の正解領域画像データとを含む教示データセットを第１の教示データセットとして定義する。また、複数の腹部ＣＴ画像データと、複数の膵臓の推定領域画像データと、複数の膵腫瘍の正解領域画像データとを含む教示データセットを第２の教示データセットとして定義する。学習部１４０は、第１の教示データセットおよび第２の教示データセットに基づいて第３の教師データセットを構築する。そして、学習部１４０は、第３の教師データセットを逐次更新しながら膵腫瘍セグメンテーションＣＮＮを学習させ、記憶装置７０に学習済みの膵腫瘍セグメンテーションＣＮＮを保存する。図６を用いて、ステップＳ３２０の処理手順を説明する。

（ステップＳ６２１）
ステップＳ６２１において、学習部１４０は、膵臓の正解領域画像データを含む第１の教師データセットと、膵臓の推定領域画像データを含む第２の教師データセットに基づいて、第３の教師データセットを構築する。本実施形態では、エポック開始時に、第３の教
師データセットに占める第１の教師データセットに含まれる教師データの数が、学習開始からのエポック数に応じて徐々に減少するように、第３の教師データセットを構築する。例えば、第１の教師データセットに含まれる教師データの総数をｍ_１として、第３の教師データセットを構築する際に第１の教師データセットからサンプリングする教師データの数ｍ_１’を以下の式で決定する。
ｍ_１’＝ｍ_１×（１－ｎ_{ｃｕｒｒｅｎｔ}／ｎ_{ｍａｘｉｍｕｍ}）

ここで、ｎ_{ｃｕｒｒｅｎｔ}とｎ_{ｍａｘｉｍｕｍ}は、それぞれ学習開始からのエポック数とエポック数の上限値を表す。エポック数の上限値とは、後述するステップＳ６２３における学習の終了条件の一例である。つまり、エポック数が増加するにつれて、第１の教師データセットからサンプリングする教師データの数は徐々に減少し、最終エポック（エポック数の上限値に到達したエポック）ではｍ_１’＝０になる。一方で、第３の教師データセットを構築する際の第２の教師データセットから選択される教師データの数は、エポックに応じて変化させない。すなわち、第２の教師データセットに含まれる教師データの総数をｍ_２として、第３の教師データセットを構築する際に第２の教師データセットからサンプリングする教師データの数を常にｍ_２’＝ｍ_２とする。これにより、第３の教師データセットを構成する第１の教師データセットおよび第２の教師データセットの夫々に含まれる教師データの割合は、ｍ_１×（１－ｎ_{ｃｕｒｒｅｎｔ}／ｎ_{ｍａｘｉｍｕｍ}）：ｍ_２となる。このように、エポック開始時（所定の条件の一例）に、第１の教師データセットに含まれる教師データと、第２の教師データセットに含まれる教師データとの比率を変更しながら第３の教師データセットを構築する。

（ステップＳ６２２）
ステップＳ６２２において、学習部１４０は、第３の教師データセットを用いて、膵腫瘍セグメンテーションＣＮＮに対する学習処理を実行し、ＣＮＮが有するパラメータを更新する。学習処理は、第１の実施形態におけるステップＳ４２１と同様に、公知の方法を用いて実行される。このとき、損失関数、最適化手法、学習率、バッチサイズなどのハイパーパラメータは、適切な値を任意に設定するものとする。

（ステップＳ６２３）
ステップＳ６２３において、学習部１４０は、第３の教師データセットを用いた膵腫瘍セグメンテーションＣＮＮの学習の終了条件を満たしているか否かを判定し、次のステップを決定する。学習の終了条件は、第１の実施形態におけるステップＳ４２２に例示したような公知のものを用いる。学習部１４０は、学習の終了条件を満たす場合には、上記の学習処理により学習された膵腫瘍セグメンテーションＣＮＮを記憶装置７０に保存してステップＳ３２０を終了し、それ以外の場合にはステップＳ６２１に戻る。

（効果）
以上に示したように、本実施形態に係る情報処理装置１００は、膵臓の正解領域画像データを含む第１の教師データセットと、膵臓の推定領域画像データを含む第２の教師データセットとに基づいて第３の教師データセットを構築し、認識器を学習させる。このように認識器を学習させることで、膵臓の推定領域画像データが保持する膵臓の領域に誤りが存在する場合であっても、膵臓の領域画像データからの特徴を効率良く学習できるため、膵腫瘍セグメンテーションＣＮＮの精度低下を抑制できる。

（バリエーション）
上述の説明では、各学習のステップであるエポックの開始時に第１の教師データセットに含まれる教師データと、第２の教師データセットに含まれる教師データとの比率を変更する例を示したが、これに限らない。例えば、学習におけるエポック内の所定のステージ（エポックの開始時や終了時など）に達することを条件として比率を変更してもよいし、
学習の評価指標（損失関数や、その他の指標）が所定の値に達することを条件として比率を変更してもよい。例えば、損失関数の値が所定の値に達することを所定の条件として用いる場合、学習の開始時にｍ_１’：ｍ_２’＝１：１、第１の所定の値に達した場合にｍ_１’：ｍ_２’＝１：２、第２の所定の値に達した場合にｍ_１’：ｍ_２’＝１：３となるように第３の教師データセットを構築する。また、上述の説明では、第３の教師データセットを構築する際に、第１の教師データセットからサンプリングする教師データの数を徐々に減少させることで、第２の教師データセットに含まれる教師データの数との比率を変更したが、これに限らない。例えば、第１の教師データセットからサンプリングする教師データの数は所定の数に固定し、第２の教師データセットからサンプリングする教師データの数を、学習開始からのエポック数に応じて徐々に増やすようにしてもよい。また、第１の教師データセットまたは第２の教師データセットからサンプリングする教師データの数を単調に増加／減少しなくてもよく、学習の途中でサンプリングする数を増加または減少するようにしてもよい。また、上記の方法に限らず、学習の途中で第１の教師データセットと第２の教師データセットの夫々に含まれる教師データの比率を変更するように、第３の教師データセットを構築するための条件や比率を変更する任意の方法を用いてもよい。

上述の説明では、所定の条件を満たした場合に、第３の教師データセットを構成する第１の教師データセットと第２の教師データセットの夫々に含まれる教師データの数の比率を変更したが、比率を変更しなくてもよい。すなわち、一連の学習において、第１の教師データセットと第２の教師データセットの夫々に含まれるすべての教師データを用いて第３の教師データセットを構築してもよい。また、一定の比率で各々のデータセットからランダムにサンプリングして第３の教師データセットを構築してもよい。

＜第３の実施形態＞
（概要）
第１の実施形態では、膵臓の正解領域画像データを含む第１の教師データセットを用いて膵腫瘍セグメンテーションＣＮＮを学習させ、膵臓の推定領域画像データを含む第２の教師データセットを用いて膵腫瘍セグメンテーションＣＮＮを追加で学習させる方法について説明した。本実施形態では、膵臓の正解領域画像データを含む第１の教師データセットを用いて学習された膵腫瘍セグメンテーションＣＮＮを外部から取得し、これに対して第２の教師データセットを用いて追加で学習させる例を説明する。

（機能構成）
以下、図７を参照して本実施形態に係る情報処理装置７００の機能構成について説明する。同図に示すように、情報処理装置７００は、教師データ取得部７１０、学習モデル取得部７２０、および学習部７３０によって構成されている。また、本実施形態に係る情報処理装置７００は、外部に記憶装置７０を具備する。

記憶装置７０は、腹部ＣＴ画像データ、膵臓の推定領域画像データ、膵腫瘍の正解領域画像データを保持している。また、記憶装置７０は、腹部ＣＴ画像データと、膵臓の正解領域画像データと、膵腫瘍の正解領域画像データとを含む第１の教師データセットによって学習された膵腫瘍セグメンテーションＣＮＮを保持している。

教師データ取得部７１０は、記憶装置７０から複数の腹部ＣＴ画像データと、複数の腹部ＣＴ画像データの夫々に対応する複数の膵臓の推定領域画像データおよび複数の膵腫瘍の正解領域画像データとを取得し、それらを学習部７３０に送信する。

学習モデル取得部７２０は、記憶装置７０から、膵臓の正解領域画像データを含む第１の教師データセットを用いて学習された膵腫瘍セグメンテーションＣＮＮを取得し、それを学習部７３０に送信する。

学習部７３０は、教師データ取得部７１０から複数の腹部ＣＴ画像データと、複数の腹部ＣＴ画像データの夫々に対応する複数の膵臓の推定領域画像データおよび複数の膵腫瘍の正解領域画像データとを受信する。これらの画像データのセットを第２の教師データセットと呼称する。また、学習部７３０は、学習モデル取得部７２０から、第１の教師データセットによって学習された膵腫瘍セグメンテーションＣＮＮを取得する。次に、学習部７３０は、膵臓の推定領域画像データを含む第２の教師データセットを用いて、第１の教師データセットによって学習された膵腫瘍セグメンテーションＣＮＮを追加学習させる。そして、学習処理を終えた後、学習部７３０は、第２の教師データセットを用いて学習させた膵腫瘍セグメンテーションＣＮＮを記憶装置７０に保存する。

（ハードウェア構成）
本実施形態に係る情報処理装置７００のハードウェア構成は、第１の実施形態と同一であるため、説明を省略する。

（処理手順）
次に、図８を用いて、本実施形態に係る情報処理装置７００の処理手順について説明する。

（ステップＳ８００）
ステップＳ８００において、教師データ取得部７１０は、記憶装置７０から複数の腹部ＣＴ画像データと、複数の膵臓の推定領域画像データと、複数の膵腫瘍の正解領域画像データとを取得し、それらを学習部７３０に送信する。

（ステップＳ８１０）
ステップＳ８１０において、学習モデル取得部７２０は、記憶装置７０から、膵臓の正解領域画像データを含む第１の教師データセットを用いて学習された膵腫瘍セグメンテーションＣＮＮを取得し、それを学習部７３０に送信する。

（ステップＳ８２０）
ステップＳ８２０において、学習部７３０は、教師データ取得部７１０から複数の腹部ＣＴ画像データと、複数の腹部ＣＴ画像データの夫々に対応する複数の膵臓の推定領域画像データおよび複数の膵腫瘍の正解領域画像データとを受信する。これらの画像データのセットを第２の教師データセットと呼称する。また、学習部７３０は、学習モデル取得部７２０から、第１の教師データセットによって学習された膵腫瘍セグメンテーションＣＮＮを取得する。続いて、学習部７３０は、複数の腹部ＣＴ画像データと、複数の腹部ＣＴ画像に対応する複数の膵臓の推定領域画像データと、複数の膵腫瘍の正解領域画像データとを含む第２の教師データセットを用いて、膵腫瘍セグメンテーションＣＮＮを追加学習させる。学習処理は、第１の実施形態におけるステップＳ４２１と同様に、公知の方法を用いて実行される。このとき、損失関数、最適化手法、学習率、バッチサイズなどのハイパーパラメータは、適当な値を用いればよい。

（ステップＳ８３０）
ステップＳ８３０において、学習部７３０は、第２の教師データセットを用いた膵腫瘍セグメンテーションＣＮＮの学習の終了条件を満たしているか否かを判定し、次のステップを決定する。学習の終了条件は、第１の実施形態におけるステップＳ４２２に例示したような公知のものを用いる。学習部７３０は、学習の終了条件を満たす場合には、上記の学習処理により学習された膵腫瘍セグメンテーションＣＮＮを記憶装置７０に保存して、一連の処理を終了し、それ以外の場合にはステップＳ８２０に戻る。

（効果）
以上に示したように、本実施形態に係る情報処理装置７００は、膵臓の正解領域画像データを含む第１の教師データセットを用いて学習された認識器に対して、膵臓の推定領域画像データを含む第２の教師データセットを用いて追加学習させる。このように学習させることで、膵臓の推定領域画像データが保持する膵臓の領域に誤りが存在する場合であっても、膵臓の領域画像データからの特徴を効率良く学習できるため、膵腫瘍セグメンテーションＣＮＮの精度低下を抑制できる。

１００：情報処理装置
１１０：第１の取得部１２０：推定部１３０：第２の取得部１４０：学習部
７００：情報処理装置
７１０：教師データ取得部７２０：学習モデル取得部７３０：学習部

Claims

画像データと、当該画像データに含まれる第１の領域に関する領域画像データとを入力して、当該画像データに関する所定の認識を行う学習モデルの学習を行う情報処理装置であって、
学習画像データと、前記学習画像データに含まれる前記第１の領域の正解領域を表す正解領域画像データと、前記認識に関する正解データとを取得する第１の取得部と、
前記学習画像データに対する前記第１の領域の推定領域を表す推定領域画像データを取得する第２の取得部と、
前記学習画像データと、前記正解領域画像データと、前記正解データとを含み構成される第１の教師データセットと、前記学習画像データと、前記推定領域画像データと、前記正解データとを含み構成される第２の教師データセットとを用いて、前記学習モデルを学習させる学習部と
を有することを特徴とする情報処理装置。
前記正解データは、前記学習画像データが属するクラス、前記第１の領域が属するクラス、または前記学習画像データに対する第２の領域が属するクラスを示すデータであることを特徴とする請求項１に記載の情報処理装置。
前記正解データは、前記第１の領域の正解領域画像データ、または前記学習画像データに対する第２の領域の正解領域画像データであることを特徴とする請求項１に記載の情報処理装置。
前記正解データは、前記第１の領域に関する位置を表す正解座標データ、または前記学習画像データに対する第２の領域に関する位置を表す正解座標データであることを特徴とする請求項１に記載の情報処理装置。
前記学習画像データに対して、第１の領域を推定する第１の領域の推定部をさらに有し、前記第２の取得部は、前記推定部による推定に基づいて前記第１の領域の推定領域画像データを取得することを特徴とする請求項１乃至請求項４のいずれか１項に記載の情報処理装置。
前記推定部は、画像データを入力して、当該画像データに含まれる第１の領域の推定領域を表す推定領域画像データを生成することを特徴とする請求項５に記載の情報処理装置。
前記学習部は、前記第１の教師データセットを用いて、前記学習モデルを学習させて更新された学習モデルを生成し、さらに、前記第２の教師データセットを用いて、当該更新された学習済みモデルを更に学習させることを特徴とする請求項１乃至請求項６のいずれか１項に記載の情報処理装置。
前記学習部は、前記第１の教師データセットに含まれる教師データと、前記第２の教師データセットに含まれる教師データとから第３の教師データセットを構築し、前記第３の教師データセットを用いて、前記学習モデルを学習させることを特徴とする請求項１乃至請求項６のいずれか１項に記載の情報処理装置。
前記学習部は、所定の条件を満たした場合に、前記第１の教師データセットに含まれる教師データの数と、前記第２の教師データセットに含まれる教師データの数との比率を変更して第３の教師データセットを構築することを特徴とする請求項８に記載の情報処理装置。
前記所定の条件は、学習における所定のステージに達すること、または学習の評価指標が所定の値に達することであることを特徴とする請求項９に記載の情報処理装置。
画像データと、当該画像データに含まれる第１の領域に関する領域画像データとを入力して、当該画像データに関する所定の認識を行う学習済みモデルである学習モデルを取得する学習モデル取得部と、
学習画像データと、前記認識に関する正解データとを取得するデータ取得部と、
前記学習画像データに基づいて、第１の領域を推定した推定領域画像データを生成する推定部と、
前記学習画像データと、前記推定領域画像データと、前記正解データとを含み構成される教師データセットを用いて、前記学習モデルを追加学習させる学習部と、
を有することを特徴とする情報処理装置。
前記学習部による学習処理によって、学習された学習済みモデルを用いて、対象の画像データに対して、所定の認識処理を行う認識部をさらに有することを特徴とする請求項１乃至１１のいずれか１項に記載の情報処理装置。
画像データと、当該画像データに含まれる第１の領域に関する領域画像データとを入力して、当該画像データに関する所定の認識を行う学習モデルの学習方法であって、
学習画像データと、前記学習画像データに含まれる前記第１の領域の正解領域を表す正解領域画像データと、前記認識に関する正解データとを取得する第１の取得ステップと、
前記学習画像データに対する前記第１の領域の推定領域を表す推定領域画像データを取得する第２の取得ステップと、
前記学習画像データと、前記正解領域画像データと、前記正解データとを含み構成される第１の教師データセットと、前記学習画像データと、前記推定領域画像データと、前記正解データとを含み構成される第２の教師データセットとを用いて、前記学習モデルを学習させる学習ステップと
を有することを特徴とする学習方法。
画像データと、当該画像データに含まれる第１の領域に関する領域画像データとを入力して、当該画像データに関する所定の認識を行う学習済みモデルである学習モデルを取得する学習モデル取得ステップと、
学習画像データと、前記認識に関する正解データとを取得するデータ取得ステップと、
前記学習画像データに基づいて、第１の領域を推定した推定領域画像データを生成する推定ステップと、
前記学習画像データと、前記推定領域画像データと、前記正解データとを含み構成される教師データセットを用いて、前記学習モデルを追加学習させる学習ステップと
を有することを特徴とする学習方法。
請求項１３または請求項１４に記載の学習方法によって、学習された学習済みモデルを用いて、所定の認識処理を行う認識方法であって、
認識対象のデータを取得する取得ステップと、
前記認識対象のデータに対して、所定の認識処理を行う認識ステップと、
を有することを特徴とする認識方法。
請求項１３または１４に記載の学習方法もしくは、請求項１５に記載の認識方法をコンピュータで実行するためのプログラム。