WO2023238565A1

WO2023238565A1 - データ処理装置、データ処理方法、及びプログラム

Info

Publication number: WO2023238565A1
Application number: PCT/JP2023/017249
Authority: WO
Inventors: 遼池田
Original assignee: 富士フイルム株式会社
Priority date: 2022-06-07
Filing date: 2023-05-08
Publication date: 2023-12-14

Abstract

効果的な学習を学習モデルに行える教師データセットをデータ拡張により生成する、データ処理装置、データ処理方法、及びプログラムを提供する。データ処理装置（１０）は、プロセッサ（１４）を含むデータ処理装置（１０）であって、プロセッサ（１４）は、撮影時に受光素子がセンシングした物理量に応じて画素値が定まる、又は物理量に可逆変換を行うことで画素値が定まるシングルチャンネル画像であって、第１の教師データセットを構成するシングルチャンネル画像の画素値を反転させた反転画像を、第１の教師データセットを拡張して得られる第２の教師データセットの学習データとして生成し、第１の教師データセットを構成するシングルチャンネル画像の正解ラベルに基づいて、反転画像に対応させた反転ラベルを、第２の教師データセットを構成する正解ラベルとして生成する。

Description

データ処理装置、データ処理方法、及びプログラム

　本発明は、データ処理装置、データ処理方法、及びプログラムに関し、特に、教師データセットを生成するデータ処理装置、データ処理方法、及びプログラムに関する。

　一般に、機械学習では、解くべき問題の複雑さに対して、教師データセットの不足が問題となる。そこで、少数の教師データセットからできるだけ多くのバリエーションを有する教師データセットを確保するために、既存の教師データセットからデータ拡張を行って新たに教師データセットを生成することが行われている。ここで、教師データセットとは、学習モデルに学習を行わせる学習データと、その学習データの正解を示す正解ラベルとで構成される。

　例えば、特許文献１では、透過Ｘ線画像をデータ拡張して、数十万枚のデータセットを生成することが記載されている。

特開２０２１－１１０７５３号公報

　本開示の技術にかかる一つの実施形態は、効果的な学習を学習モデルに行える教師データセットをデータ拡張により生成する、データ処理装置、データ処理方法、及びプログラムを提供することである。

　本発明の第１の態様であるデータ処理装置は、プロセッサを含むデータ処理装置であって、プロセッサは、撮影時に受光素子がセンシングした物理量に応じて画素値が定まる、又は物理量に可逆変換を行うことで画素値が定まるシングルチャンネル画像であって、第１の教師データセットを構成するシングルチャンネル画像の画素値を反転させた反転画像を、第１の教師データセットを拡張して得られる第２の教師データセットの学習データとして生成し、第１の教師データセットを構成するシングルチャンネル画像の正解ラベルに基づいて、反転画像に対応させた反転ラベルを、第２の教師データセットを構成する正解ラベルとして生成する。

　本発明の第２の態様であるデータ処理装置は、好ましくは、第１の態様において、シングルチャンネル画像は、被写体を透過した放射線を受光する、デジタルディテクタアレイ（ＤＤＡ）で撮像した画像、又はイメージングプレート（ＩＰ）が受光信号を読み取り装置によりデジタル値で出力させたコンピューテッドラジオグラフィ（ＣＲ）撮像画像である。

　本発明の第３の態様であるデータ処理装置は、好ましくは、第１又は第２の態様において、シングルチャンネル画像は、レンズフリーイメージングによる画像である。

　本発明の第４の態様であるデータ処理装置は、好ましくは、第１から第３の態様のいずれか一つの態様において、シングルチャンネル画像の各画素は、対応する受光素子における受光量に比例したデジタル値、又は受光量と相関関係のあるデジタル値を有する。

　本発明の第５の態様であるデータ処理装置は、好ましくは、第１から第４の態様のいずれか一つの態様において、シングルチャンネル画像の各画素は、対応する被写体の各点における物理量と相関関係のあるデジタル値を有する。

　本発明の第６の態様であるデータ処理装置は、好ましくは、第１から第５の態様のいずれか一つの態様において、第１の教師データセットは、第１の教師データセットを拡張した場合に、反転ラベルにおいて矛盾が生じないものが選択されている。

　本発明の第７の態様であるデータ処理装置は、好ましくは、第１から第６の態様のいずれか一つの態様において、第１の教師データセットは、第１の教師データセットを拡張した場合に、反転ラベルが学習に有効であるものが選択されている。

　本発明の第８の態様であるデータ処理装置は、好ましくは、第１から第７の態様のいずれか一つの態様において、プロセッサは、シングルチャンネル画像の一部の領域に対して、画素値を反転させて反転画像を生成し、一部の領域に対応するシングルチャンネル画像の正解ラベルに基づいて、第２の教師データセットを構成する正解ラベルとして生成する。

　本発明の第９の態様であるデータ処理装置は、好ましくは、第１から第８の態様のいずれか一つの態様において、プロセッサは、学習データに対して正規化又は標準化を行う。

　本発明の第１０の態様であるデータ処理装置は、好ましくは、第１から第９の態様のいずれか一つの態様において、プロセッサは、第２の教師データセットを構成する正解ラベルのクラス設計を、反転画像を学習データとすることに対応して編集する。

　本発明の第１１の態様であるデータ処理装置は、好ましくは、第１から第１０の態様のいずれか一つの態様において、可逆変換は、線形変換、対数変換、及び画素値対応テーブルを用いた非線形変換のうち少なくとも一つである。

　本発明の第１２の態様であるデータ処理方法は、プロセッサが、撮影時に受光素子がセンシングした物理量に応じて画素値が定まる、又は物理量に可逆変換を行うことで画素値が定まるシングルチャンネル画像であって、第１の教師データセットを構成するシングルチャンネル画像の画素値を反転させた反転画像を、第１の教師データセットを拡張して得られる第２の教師データセットの学習データとして生成する工程と、第１の教師データセットを構成するシングルチャンネル画像の正解ラベルに基づいて、反転画像に対応させた反転ラベルを、第２の教師データセットを構成する正解ラベルとして生成する工程と、を行う。

　本発明の第１３の態様であるプログラムは、プロセッサに、撮影時に受光素子がセンシングした物理量に応じて画素値が定まる、又は物理量に可逆変換を行うことで画素値が定まるシングルチャンネル画像であって、第１の教師データセットを構成するシングルチャンネル画像の画素値を反転させた反転画像を、第１の教師データセットを拡張して得られる第２の教師データセットを構成する学習データとして生成する工程と、第１の教師データセットを構成するシングルチャンネル画像の正解ラベルに基づいて、反転画像に対応させた反転ラベルを、第２の教師データセットを構成する正解ラベルとして生成する工程と、を含むデータ処理方法を実行させる。

　本発明によれば、効果的な学習を学習モデルに対して行える教師データセットを、既存の教師データセットからデータ拡張により生成することができる。

図１は、データ処理装置のハードウェアの構成例を示すブロック図である。図２は、プロセッサがメモリに記憶されているデータ処理プログラムを実行することにより、実現される機能Ｆの機能ブロックを示す図である。図３は、シングルチャンネル画像の撮影に関して説明する模式図である。図４は、シングルチャンネル画像を示す図である。図５は、正解ラベルのクラス読み替え処理に関して説明する図である。図６は、正解ラベルのクラス読み替え処理に関して説明する図である。図７は、第２の教師データセットの正解ラベル（反転ラベル）のクラス設計を編集することを説明する図である。図８は、第１の教師データセットと第２の教師データとの具体例を説明する図である。図９は、データ処理方法を説明するフローチャートである。図１０は、画像を構成する画素値を示す図である。図１１は、第３の実施形態の第１の教師データセット及び第２の教師データセットに関して説明する図である。図１２は、撮影システムの構成例を概略的に示すブロック図である。

　以下、添付図面にしたがって本発明の好ましい実施の形態について説明する。

　＜第１の実施形態＞
　＜データ処理装置＞
　図１は、本発明のデータ処理装置のハードウェアの構成例を示すブロック図である。

　データ処理装置１０は、プロセッサ１４と、非一時的な有体物で構成されるメモリ１６と、入出力インターフェース１２とを含む。データ処理装置１０として機能するコンピュータは、ワークステーションであってもよいし、パーソナルコンピュータであってもよいし、タブレット端末であってもよく、あるいは、サーバであってもよい。

　プロセッサ１４はＣＰＵ（Central Processing Unit）で構成される。また、プロセッサ１４、ＧＰＵ（Graphics Processing Unit）により構成されてもよい。プロセッサ１４は、バス８を介して、メモリ１６、及び入出力インターフェース１２と接続される。

　入出力インターフェース１２を介して、データ処理装置１０に情報が入力される。また、入出力インターフェース１２を介して、情報が出力される。例えば、入出力インターフェース１２を介して、教師データセットＤＢ（データベース：Database）２２がデータ処理装置１０に接続され、第１の教師データセット及び第２の教師データセットがデータ処理装置１０に入力される。

　メモリ１６は、主記憶装置であるメモリ及び補助記憶装置であるストレージを含む。メモリ１６は、例えば、半導体メモリ、ハードディスク（Hard Disk Drive：ＨＤＤ）装置、若しくはソリッドステートドライブ（Solid State Drive：ＳＳＤ）装置又はこれらの複数の組み合わせであってもよい。

　メモリ１６には、データ処理装置１０を制御するプログラムが記憶されている。例えば、データ処理方法を実行するためのデータ処理プログラム１８が記憶されている。またメモリ１６には、データ処理装置１０を作動させる一般的なプログラムを記憶している。

　図１に示した場合では、データ処理装置１０には、外付けの教師データセットＤＢ２２に接続されている。なお、教師データセットＤＢは、データ処理装置１０に備えられてもよい。

　教師データセットＤＢ２２は、第１の教師データセットＤＢ２４、及び第２の教師データセットＤＢ２６を含む。第１の教師データセット及び第２の教師データセットは、学習モデル４０（図８）が学習を行うための学習データとその学習データの正解ラベルとで構成される。第１の教師データセットＤＢ２４には、複数の第１の教師データセットが記憶されている。例えば、第１の教師データセットは、撮影システム５００（図１２）で撮影されたシングルチャンネル画像（学習データに相当）と、そのシングルチャンネル画像で読影された欠陥（正解ラベルに相当）とで構成される。第２の教師データセットＤＢ２６には、複数の第２の教師データセットが記憶されている。第２の教師データは、シングルチャンネル画像の反転画像（学習データに相当）と、正解ラベルを読み替え処理した反転ラベル（正解ラベルに相当）とで構成される。第２の教師データセットは、第１の教師データからデータ拡張された教師データセットであり、データ処理装置１０により生成される。

　なお、図１では、教師データセットＤＢ２２に第１の教師データセットＤＢ２４と第２の教師データセットＤＢ２６とが含まれている例について示したが、第１の教師データセットＤＢ２４と第２の教師データセットＤＢ２６とが別々に設けられてもよい。

　図２は、プロセッサ１４がメモリ１６に記憶されているデータ処理プログラム１８を実行することにより、実現される機能Ｆの機能ブロックを示す図である。

　プロセッサ１４がデータ処理プログラム１８を実行することにより実現される機能Ｆは、シングルチャンネル画像取得部３０、正解ラベル取得部３２、反転画像生成部３４、及び反転ラベル生成部３６を備える。上述の機能Ｆの各々が実現されることにより、第１の教師データセットがデータ拡張されて第２の教師データセットが生成される。

　シングルチャンネル画像取得部３０は、教師データセットＤＢ２２から第１の教師データセットの学習データであるシングルチャンネル画像を取得する。ここでシングルチャンネル画像とは、撮影時に、受光素子がセンシングした物理量に応じて、画素値が定まる画像、物理量に可逆変換を行うことで画素値が定まる画像である。なおここで、具体的な可逆変換は、線形変換、対数変換、及び画素値対応テーブルを用いた非線形変換のうち少なくとも一つである。また、シングルチャンネル画像は、元の物理現象に逆変換で辿れる変換のみが施されている画像である。すなわち、シングルチャンネル画像は、不可逆変換が行われていない画像であるとも言える。シングルチャンネル画像の具体例としては、Ｒａｗ画像が挙げられる。ここでＲａｗ画像とは、受光素子である撮像素子から出力された未現像の画像データで構成されており、各受光素子で受光した光量と受光素子が出力した信号値とが線形性の関係を有する。またシングルチャンネル画像の他の具体例としては、例えば赤のフィルタを通して顕微鏡で取得した画像など、特定のスペクトル（色）の波長における光量をとらえたモノクロ画像である。また、シングルチャンネル画像は、被写体を透過した放射線を受光する、デジタルディテクタアレイ（ＤＤＡ）で撮像した画像、又はイメージングプレート（ＩＰ）が受光信号を読み取り装置によりデジタル値で出力させたコンピューテッドラジオグラフィ（ＣＲ）撮像画像である。また、シングルチャンネル画像は、レンズフリーイメージングによる画像である。

　図３は、シングルチャンネル画像の撮影に関して説明する模式図である。

　図３では、放射線源５０、被検査体ＯＢＪ、及びディテクタ５４が示されている。なお、ディテクタ５４は、受光パネルで構成され、受光素子の一例である。

　放射線源５０から出射した放射線は、被検査体ＯＢＪに照射される。被検査体ＯＢＪを透過した放射線は、ディテクタ５４に受光される。ディテクタ５４は、被検査体ＯＢＪのシングルチャンネル画像５６を出力する。

　図４は、ディテクタ５４で取得された被検査体ＯＢＪのシングルチャンネル画像５６を示す図である。シングルチャンネル画像５６の画素Ｑは、ディテクタ５４と放射線源５０とを結んだ直線Ｌ上にある被写体を透過してきた放射線の強度、に応じて値が定まり、直線Ｌで貫かれた被写体の領域Ｐに対応する。したがって、シングルチャンネル画像の各画素は、対応するディテクタ５４における受光量に比例したデジタル値、又は受光量と相関関係のあるデジタル値を有する。また、シングルチャンネル画像の各画素は、対応する被検査体ＯＢＪ（被写体）の各点（例えばＰ点）における物理量と相関関係のあるデジタル値を有する。

　次に、本発明におけるシングルチャンネル画像では無い具体例を参考のために説明する。元の物理量に対する特性が不明となってしまうために、低ビットモニタを通して読み取った画素値など、２次的な特性不明の外部装置を介して読み取った画素値で構成される画像は、シングルチャンネル画像ではない。また、白飛びや黒飛びが発生するようなＬＵＴ（Look Up Table）変換が行われた画像は、シングルチャンネル画像ではない。また、複数の値が一つの値に集約されてしまうような、「多対１」になるような変換が行われた画像も、情報量が落ちているため、シングルチャンネル画像ではない。ガンマ補正などの非線形処理が行われた画像も、反転画像生成部３４で反転処理が行われたときに非対称となるので、シングルチャンネル画像ではない。但し、補正の逆変換が理論的に定義できて、その変換で情報が劣化しないならば、シングルチャンネル画像とすることが可能である。しかしながら、理論関数が計算できたとしても、量子化との兼ね合いで対応が取れなければシングルチャンネル画像とすることができない。

　正解ラベル取得部３２（図２）は、教師データセットＤＢ２２から第１の教師データセットの正解ラベルを取得する。

　ここで、正解ラベルは、シングルチャンネル画像を学習データとして学習モデル４０に学習させた場合の正解に関する情報を有している。例えば、正解ラベルは、シングルチャンネル画像から読影された欠陥の情報を有する。

　反転画像生成部３４（図２）は、シングルチャンネル画像をデータ拡張することにより反転画像を生成する。反転画像生成部３４は、第１の教師データセットを構成するシングルチャンネル画像の画素値を反転させて、反転画像を生成する。

　反転画像生成部３４で行われる反転処理の具体例としては、シングルチャンネル画像の画素値の最小値が０、最大値が６５５３５である場合に、各座標における画素値「ｐ」を、「６５５３５－ｐ」に置き換えるという処理を行う。

　また、反転画像生成部３４で行われる反転処理の他の具体例としては、関数による変換を途中に挟んだ反転処理を行う。反転画像生成部３４は、画素が物理量の対数に比例して構成される場合に、画像を構成する画素値「ｐ」を、「ｅｘｐ（ｐ）」に変換したうえで、変換後の最大値及び最小値を算出したうえで線形な反転（ｍａｘ（ｅｘｐ（ｐ））－ｅｘｐ（ｐ））を行い、その値の対数をとる、という反転処理を行うことができる。

　また、反転画像生成部３４の反転処理は、上述した反転処理に限定されず、相対的に画素値の高い点と、画素値の低い点が、低い点と高い点になるような、予め任意に定めた画素値と画素値の対応表（ＬＵＴ；look up table）による変換などのその他の処理も含む。

　なお、シングルチャンネル画像の画素値は、輝度信号に基づく値である場合、ＬｉＤＡＲ（Light Detection and Ranging）カメラで撮影した深さ情報を表す画素値信号に基づく場合、Ｘ線を透過させたフィルム検査の濃淡を読み取った濃度情報に基づく場合などであり、画素が表している物理量の解釈は、輝度とは限定されない。

　以上より、反転画像生成部３４では、物理現象が画素値に表されるという関係がある場合に、反転させた画素値がその物理現象と対応する物理現象が想定可能な変換を行う。一方で、反転画像生成部３４での変換の前後で、もとの欠陥に対してどのように変換されたものであるかが、不明となってしまう変換は、反転画像生成部３４で行われる変換から除外される。

　反転ラベル生成部３６（図２）は、正解ラベルをデータ拡張することにより反転ラベルを生成する。

　反転ラベル生成部３６は、シングルチャンネル画像が反転処理される場合に、シングルチャンネル画像の正解ラベルのクラス読み替え処理を行う。例えば、シングルチャンネル画像が透過画像の場合は、被検査体ＯＢＪが凹んでいるのか余分に盛り上がっているのか、という情報が、透過画像であるシングルチャンネル画像の輝度値の高低に現れる。このような場合には、輝度値の高低が欠陥の種別を区別するために重要な情報となる場合がある。この場合には、正解ラベルにおけるクラスの読み替え処理を行って、正解ラベルのデータ拡張を行い、反転ラベルを生成する。

　図５は、反転ラベル生成部３６での正解ラベルのクラス読み替え処理に関して説明する図である。

　図５は、低密度欠陥を示す画像６０及び高密度欠陥を示す画像６２が示されている。

　画像６０は、ＦＭＬＤ（Foreign Material Less Dense）を示す領域６６を有する。領域６６は、背景６４よりも暗くなる。ここで、ＦＭＬＤは、低密度の異物の総称である。例えば欠けていたり、鋳造金属の流れ込みが不足していたり、傷ついて削れてしまっている場合、気泡やガスが混入した場合に、それらの領域（ＦＭＬＤを示す領域（領域６６））は周囲（背景６４）よりも暗く表示される。なお、画像６０と第１の教師データセットを構成する、正解ラベル７２はＦＭＬＤとなる。

　画像６２は、ＦＭＭＤ（Foreign Material More Dense）を示す領域７０を有する。領域７０は、背景６８よりも明るくなる。ここで、ＦＭＭＤは高密度の異物の総称である。例えば、部材がアルミニウムでできており、それが鋳造の過程で必要以上に盛り上がってしまった場合や、飛び散った金属が付着している場合、内部にアルミニウムよりも高い密度の不純物が埋まっている場合に、それらの領域（ＦＭＭＤを示す領域（領域７０）はＸ線を透過しにくいため、「白く」（明るく）表示される。すなわち、ＦＭＭＤを示す領域（領域７０）では、通常時と比べて、画素値が大きくなる。なお、画像６２を学習データとした場合には、正解ラベル７４はＦＭＭＤとなる。

　上述したように、ＦＭＬＤを示す領域６６と背景６４との関係と、ＦＭＭＤを示す領域７０と背景６８との関係は、反転した関係となる。したがって、異物や欠陥が存在する領域（ＦＭＬＤを示す領域６６及びＦＭＭＤを示す領域７０）、及び、背景の領域（背景６４及び背景６８）、をまとめて画像全体を「モノクロ反転」させると、相対的に、背景に対する欠陥領域の高低が逆転する。この場合、正解ラベル７２も反転させて反転ラベル（正解ラベル７４）に変換する。

　なお、図５では、ＦＭＬＤを示す領域６６を有する画像６０からＦＭＭＤを示す領域７０を有する画像６２にモノクロ反転させる場合について説明したがこれに限定されるものではない。図６に示すように、ＦＭＭＤを示す領域７０を有する画像６２からＦＭＭＬＤを示す領域６６を有する画像６０にモノクロ反転させることも、同様に行うことができる。

　なお、正解ラベルの読み替えを行うことにより、同一画像内に両者のカテゴリーの欠陥が混在していることも、問題なく扱うことができる。

　以上で説明した場合では、ＦＭＬＤとＦＭＭＤとが１対１に対応する場合について説明をした。しかしながら、必ずしもＦＭＬＤとＦＭＭＤとが１対１に対応するとは限らない。このように１対１に対応しない場合には、第２の教師データセットを構成する正解ラベルのクラス設計を、反転画像を学習データとすることに対応して編集することが好ましい。

　図７は、第２の教師データセットの正解ラベル（反転ラベル）のクラス設計を編集することを説明する図である。

　図７（Ａ）は、正解ラベルＦＭＭＤの読み替え先が複数になる場合を説明する図である。気体等が混入して生じるガス欠陥は、背景に対して相対的に暗く（画素値が小さく）写るので、上述したＦＭＬＤに共通する。したがって、ＦＭＭＤの正解ラベルを反転ラベルとした場合に、読み替え先がＦＭＬＤとガス欠陥の複数になってしまう（図７（Ａ）参照）。したがって、ガス欠陥とＦＭＬＤとを正解ラベルにおいて別々のクラスとみなす余地がある場合であっても、ガス欠陥とＦＭＬＤとを１つの新しいクラスとして編集し集約して扱うようにする。

　図７（Ｂ）は、正解ラベルＦＭＭＤの読み替え先の正解ラベルのクラス設計を編集し集約した場合を説明する図である。図７（Ｂ）に示した場合では、読み替え先の正解ラベルをＦＭＬＤ又はガス欠陥という一つの正解ラベルになるように編集して新しいクラスとして集約して扱っている。これにより、読み替え先が複数になることがなく、検出又は分類モデルの学習において、効果的な学習を行うことができる。

　また、本発明の第１の教師データセットは、第１の教師データセットを拡張した場合に、反転ラベルにおいて矛盾が生じないものが選択されることが好ましい。具体的には、正解ラベルがある欠陥を示してる場合に、反転ラベルとした場合の欠陥が存在するものが、第１の教師データセットとして選択されることが好ましい。また、第１の教師データセットは、第１の教師データセットを拡張した場合に、反転ラベルが学習に有効であるものが選択されことが好ましい。

　上述したようなデータ拡張において、画像に紐づく正解ラベル（たとえば分類クラス）が、データ拡張前後で変化しないという制約を加える場合がある。これは、データ拡張を行った結果、誤ったクラス（存在する事がないデータ）、にならないようにするためである。

　本発明においても同様に、特定のクラスだけを、選択的に反転させることが考えられる。例えば、Porosity（＝微小なガス）欠陥は、異物混入とは異なり、広範囲に密集して発生する傾向がある。このPorosity欠陥を含む画像も、同様に画素反転させて、多数の白い欠陥と同視することは可能である。しかしながら、検査対象物に、反転させた結果の画像、すなわち「高密度であって、密集して発生する」欠陥が、実際には生じえない場合や、発生する可能性はあっても、製品の品質に悪影響を与えないため、検査項目の対象外である場合には、学習をする必要がない場合がある。

　そのような状況下では、Porosity欠陥を含まない画像に限り、画素反転を適用することが好ましい。

　このように、本発明の第１の教師データセットは、第１の教師データセットを拡張した場合に、反転ラベルにおいて矛盾が生じないものが選択されることが好ましい。また、第１の教師データセットは、第１の教師データセットを拡張した場合に、反転ラベルが学習に有効であるものが選択されことが好ましい。

　図８は、第１の教師データセットと第２の教師データとの具体例を説明する図である。

　第１の教師データセットＳは、学習データであるＲａｗ画像４２及び正解ラベル４４とで構成される。

　Ｒａｗ画像４２は、反転画像生成部３４により反転処理が行われ、モノクロ反転画像４６が生成される。また、正解ラベル４４は、反転ラベル生成部３６によりクラス読み替え処理が行われ、反転ラベル４８が生成される。そして、モノクロ反転画像４６と反転ラベル４８とは、第２の教師データセットＴを構成する。第１の教師データセットＳと第２の教師データセットＴとは、学習モデル４０の機械学習の学習データとして使用される。

　以上で説明したように、第１の教師データセットＳからデータ拡張を行うことにより第２の教師データセットＴが生成される。そして、学習モデル４０は、第１の教師データセットＳ及び第２の教師データセットＴにより学習が行われる。これにより、効果的な学習を学習モデル４０に行わせることが可能となる。

　図９は、データ処理装置１０を用いて実行されるデータ処理方法を説明するフローチャートである。なお、図８で説明を行った具体例に沿ってフローチャートの説明を行う。また、データ処理装置１０のプロセッサ１４がデータ処理プログラム１８を実行することにより各ステップが実行する。

　先ず、シングルチャンネル画像取得部３０は、教師データセットＤＢ２２から、Ｒａｗ画像４２を取得する（ステップＳ１０）。その後、正解ラベル取得部３２は、教師データセットＤＢ２２から、Ｒａｗ画像４２の正解ラベル４４を取得する（ステップＳ１１）。次に、反転画像生成部３４は、Ｒａｗ画像４２に対して反転処理を行うことにより、モノクロ反転画像４６を生成する（第２の教師データセットの学習データとして生成する工程：ステップＳ１２）。その後、反転ラベル生成部３６は、正解ラベル４４のクラス読み替えを行って反転ラベル４８を生成する（第２の教師データセットを構成する正解ラベルとして生成する工程：ステップＳ１３）。その後、データ処理装置１０は、入出力インターフェース１２からモノクロ反転画像及び反転ラベルを出力し、モノクロ反転画像及び反転ラベルを第２の教師データセットＤＢ２６に記憶させる（ステップＳ１４）。

　上述したように、第１の教師データセットＳを構成するＲａｗ画像４２と正解ラベル４４とをデータ拡張（反転処理、クラス読み替え処理）を行うことにより、第２の教師データセットＴを構成するモノクロ反転画像４６と反転ラベル４８が生成される。そして、生成された第１の教師データセットＳと第２の教師データセットＴとは共に学習モデル４０の学習に使用される。これにより、学習モデル４０に効果的な学習を行わせることができる。

　上記実施形態において、各種の処理を実行する処理部（processing unit）（シングルチャンネル画像取得部３０、正解ラベル取得部３２、反転画像生成部３４、及び反転ラベル生成部３６）のハードウェア的な構造は、次に示すような各種のプロセッサ（processor）である。各種のプロセッサには、ソフトウェア（プログラム）を実行して各種の処理部として機能する汎用的なプロセッサであるＣＰＵ（Central Processing Unit）、ＦＰＧＡ（Field Programmable Gate Array）などの製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス（Programmable Logic Device：ＰＬＤ）、ＡＳＩＣ（Application Specific Integrated Circuit）などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路などが含まれる。

　１つの処理部は、これら各種のプロセッサのうちの１つで構成されていてもよいし、同種又は異種の２つ以上のプロセッサ（例えば、複数のＦＰＧＡ、あるいはＣＰＵとＦＰＧＡの組み合わせ）で構成されてもよい。また、複数の処理部を１つのプロセッサで構成してもよい。複数の処理部を１つのプロセッサで構成する例としては、第１に、クライアントやサーバなどのコンピュータに代表されるように、１つ以上のＣＰＵとソフトウェアの組合せで１つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第２に、システムオンチップ（System On Chip：ＳｏＣ）などに代表されるように、複数の処理部を含むシステム全体の機能を１つのＩＣ（Integrated Circuit）チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサを１つ以上用いて構成される。

　さらに、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子などの回路素子を組み合わせた電気回路（circuitry）である。

　上述の各構成及び機能は、任意のハードウェア、ソフトウェア、或いは両者の組み合わせによって適宜実現可能である。例えば、上述の処理ステップ（処理手順）をコンピュータに実行させるプログラム、そのようなプログラムを記録したコンピュータ読み取り可能な記録媒体（非一時的記録媒体）、或いはそのようなプログラムをインストール可能なコンピュータに対しても本発明を適用することが可能である。

　＜第２の実施形態＞
　次に、第２の実施形態に関して説明する。本実施形態では、学習データに対して正規化又は標準化が行われる。本実施形態によれば、反転したことによる画素値の偏りを防ぐことができ、学習モデル４０に対して効果的な学習を行わせることができる。

　図１０は、画像を構成する画素値を示す図である。図１０（Ａ）では、Ｒａｗ画像ａを構成する画素値が示されており、図１０（Ｂ）では、Ｒａｗ画像ａを反転画像生成部３４で反転処理して得られた反転画像ａを構成する画素値が示されている。なお、図１０では、横軸に画素値、縦軸に画素数が示されている。

　図１０（Ａ）に示した場合では、画像の取り得る画素値が０～６５５３５である場合に、Ｒａｗ画像ａの注目領域を構成する画素値が１００００～２５０００の範囲に存在する（図１０（Ａ）の範囲Ｒを参照）。この場合には、反転画像ａにおける注目領域を構成する画素値は、およそ４００００～５５０００に分布する（図１０（Ｂ）の範囲Ｒを参照）。このように、注目領域の画素値が、Ｒａｗ画像ａと反転画像ａとの間で大きく異なる場合には、これらを学習データとする第１の教師データセット及び第２の教師データセットを学習モデル４０に入力したとしても、学習モデル４０が適切に学習を行えない可能性がある。

　そこで、本実施形態では、Ｒａｗ画像ａに対して正規化又は標準化を行うことにより、画素値分布の相対的な高低のみに注目できるため、正規化又は標準化の影響は抑制され、第１の教師データセット及び第２の教師データセットを学習モデル４０が効果的に学習できるようになる。

　なお、上述した説明では、Ｒａｗ画像ａに対して正規化又は標準化する手法について説明を行ったが、注目領域の画素値が、Ｒａｗ画像ａと反転画像ａとの間で大きく異なる場合の対処法として、学習モデル４０の入力層に、Layer Normalization など、パッチ画像ごとに高低を抑える機構を備えてもよい。

　＜第３の実施形態＞
　次に、第３の実施形態に関して説明する。本実施形態では、シングルチャンネル画像の一部の領域に対して、画素値を反転させて反転画像を生成し、一部の領域に対応するシングルチャンネル画像の正解ラベルに基づいて、第２の教師データセットを構成する正解ラベルとして生成する。

　図１１は、本実施形態の第１の教師データセット及び第２の教師データセットに関して説明する図である。

　シングルチャンネル画像８０は、部品領域Ｃ１と、部品領域Ｃ１以外の背景領域Ｄとを有する。なお、シングルチャンネル画像８０に、マスク画像を重畳させて、部品領域Ｃ１と背景領域Ｄとを分離してもよい。

　反転画像生成部３４は、シングルチャンネル画像８０の部品領域Ｃ１のみを反転処理し、反転画像８２を生成する。反転画像８２は、部品領域Ｃ２のみ部品領域Ｃ１が反転処理した画像で構成され、背景領域Ｄはシングルチャンネル画像８０の背景領域Ｄのままである。また、部品領域Ｃ１における正解ラベル８４はＦＭＬＤであり、反転ラベル生成部３６により正解ラベル８６（ＦＭＭＤ）に読み替え処理が行われる。

　このように、本実施形態では、部品領域などの注目領域に対してのみ反転画像を生成し、注目領域に対しての正解ラベルに基づいて反転ラベルを生成する。これにより、注目領域にフォーカスして第２の教師データセットを生成することができるので、より効果的に学習モデル４０に学習を行わすことができる。

　＜撮影システムの構成例＞
　次に、被検査体ＯＢＪの画像（シングルチャンネル画像）を撮影するための撮影システム５００の例について説明する。図１２は、撮影システム５００の構成例を概略的に示すブロック図である。撮影システム５００は、撮影室５１４内に置かれた被検査体ＯＢＪを撮影するためのものであり、撮影制御部５０２、撮影操作部５０４、画像記録部５０６、カメラ５０８及び放射線源５１０、５１２を備えている。

　撮影制御部５０２は、撮影システム５００の各部の動作を制御するＣＰＵを含む。撮影制御部５０２は、撮影操作部５０４を介してオペレータ（撮影者）からの操作入力を受け付け、この操作入力に応じた制御信号を撮影システム５００の各部に送信して各部の動作を制御する。

　撮影操作部５０４は、オペレータからの操作入力を受け付ける入力装置を含む。オペレータは、撮影操作部５０４を介して、被検査体ＯＢＪに関する情報の入力、カメラ５０８に対する撮影条件の指示及び撮影実行の指示の入力、放射線源５１０及び５１２に対する放射線の照射条件の指示の入力、撮影により得られた画像を画像記録部５０６に記録する指示の入力などを行うことができる。撮影条件には、例えば、露出時間、焦点距離、絞り等の撮影条件、撮影角度及び撮影箇所等が含まれる。放射線の照射条件には、照射開始時間、照射継続時間、照射角度及び照射強度等が含まれる。

　画像記録部５０６は、カメラ５０８によって撮影された被検査体ＯＢＪの画像データ（受光画像）を記録する。画像記録部５０６には、被検査体ＯＢＪを特定するための情報が画像データと関連付けられて記録される。

　カメラ５０８、放射線源５１０及び５１２は、撮影室５１４の内部に配置されている。放射線源５１０及び５１２は、例えば、Ｘ線源であり、撮影室５１４と外部との間の隔壁及び出入口には、Ｘ線防護材料（例えば、鉛又はコンクリート等）によりＸ線防護が施されている。なお、被検査体ＯＢＪに可視光を照射して撮影を行う場合には、防護を施した撮影室５１４を用いる必要はない。

　放射線源５１０及び５１２は、撮影制御部５０２からの指示にしたがって、撮影室５１４内に置かれた被検査体ＯＢＪに放射線を照射する。

　カメラ５０８は、撮影制御部５０２からの撮影実行の指示にしたがって、放射線源５１０から被検査体ＯＢＪに照射されて被検査体ＯＢＪにより反射された放射線、又は放射線源５１２から被検査体ＯＢＪに照射されて被検査体ＯＢＪを透過した放射線を受光して被検査体ＯＢＪを撮影する。被検査体ＯＢＪは、不図示の保持部材（例えば、マニピュレーター、載置台又は可動式の載置台など）によって撮影室５１４内に保持されており、被検査体ＯＢＪは、カメラ５０８、放射線源５１０及び５１２に対する距離及び角度が調整可能となっている。操作者は、撮影制御部５０２を介して、被検査体ＯＢＪ、カメラ５０８、放射線源５１０及び５１２の相対位置を制御可能となっており、被検査体ＯＢＪの所望の箇所を撮影可能となっている。

　放射線源５１０及び５１２は、カメラ５０８による撮影の実行の終了に同期して、被検査体ＯＢＪに対する放射線の照射を終了する。

　なお、図１２に示す例では、カメラ５０８は、撮影室５１４の内部に配置されているが、カメラ５０８は、撮影室５１４内の被検査体ＯＢＪを撮影可能であれば、外部に配置されていてもよい。また、図１２に示す例では、カメラ５０８が１台、放射線源５１０及び５１２が２台設けられているが、カメラ及び放射線源の台数はこれに限定されるものではない。例えば、カメラ及び放射線源は、それぞれ複数台あってもよいし、１つずつであってもよい。撮影制御部５０２、撮影操作部５０４及び画像記録部５０６は、コンピュータのハードウェアとソフトウェアとの組み合わせを用いて実現できる。

　データ処理装置１０は、撮影システム５００と通信可能に接続されてもよいし、データ処理装置１０が撮影システム５００の撮影制御部５０２、撮影操作部５０４及び画像記録部５０６として機能するように構成されてもよい。

　以上で本発明の例に関して説明してきたが、本発明は上述した実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々の変形が可能であることは言うまでもない。

８　　　　：バス
１０　　　：データ処理装置
１２　　　：入出力インターフェース
１４　　　：プロセッサ
１６　　　：メモリ
１８　　　：データ処理プログラム
３０　　　：シングルチャンネル画像取得部
３２　　　：正解ラベル取得部
３４　　　：反転画像生成部
３６　　　：反転ラベル生成部
４０　　　：学習モデル
４２　　　：Ｒａｗ画像
４４　　　：正解ラベル
４６　　　：モノクロ反転画像
４８　　　：反転ラベル
５０　　　：放射線源
５４　　　：ディテクタ
５６　　　：シングルチャンネル画像

Claims

　プロセッサを含むデータ処理装置であって、
　前記プロセッサは、
　撮影時に受光素子がセンシングした物理量に応じて画素値が定まる、又は前記物理量に可逆変換を行うことで前記画素値が定まるシングルチャンネル画像であって、第１の教師データセットを構成する前記シングルチャンネル画像の前記画素値を反転させた反転画像を、前記第１の教師データセットを拡張して得られる第２の教師データセットの学習データとして生成し、
　前記第１の教師データセットを構成する前記シングルチャンネル画像の正解ラベルに基づいて、前記反転画像に対応させた反転ラベルを、前記第２の教師データセットを構成する正解ラベルとして生成する、データ処理装置。
　前記シングルチャンネル画像は、被写体を透過した放射線を受光する、デジタルディテクタアレイ（ＤＤＡ）で撮像した画像、又はイメージングプレート（ＩＰ）が受光信号を読み取り装置によりデジタル値で出力させたコンピューテッドラジオグラフィ（ＣＲ）撮像画像である請求項１に記載のデータ処理装置。
　前記シングルチャンネル画像は、レンズフリーイメージングによる画像である請求項１に記載のデータ処理装置。
　前記シングルチャンネル画像の各画素は、対応する前記受光素子における受光量に比例したデジタル値、又は前記受光量と相関関係のあるデジタル値を有する請求項１に記載のデータ処理装置。
　前記シングルチャンネル画像の各画素は、対応する被写体の各点における前記物理量と相関関係のあるデジタル値を有する請求項１に記載のデータ処理装置。
　前記第１の教師データセットは、前記第１の教師データセットを拡張した場合に、前記反転ラベルにおいて矛盾が生じないものが選択されている請求項１に記載のデータ処理装置。
　前記第１の教師データセットは、前記第１の教師データセットを拡張した場合に、前記反転ラベルが学習に有効であるものが選択されている請求項１に記載のデータ処理装置。
　前記プロセッサは、
　前記シングルチャンネル画像の一部の領域に対して、前記画素値を反転させて前記反転画像を生成し、
　前記一部の領域に対応する前記シングルチャンネル画像の正解ラベルに基づいて、前記第２の教師データセットを構成する正解ラベルとして生成する請求項１に記載のデータ処理装置。
　前記プロセッサは、前記学習データに対して正規化又は標準化を行う請求項１に記載のデータ処理装置。
　前記プロセッサは、前記第２の教師データセットを構成する前記正解ラベルのクラス設計を、前記反転画像を前記学習データとすることに対応して編集する請求項１に記載のデータ処理装置。
　前記可逆変換は、線形変換、対数変換、及び画素値対応テーブルを用いた非線形変換のうち少なくとも一つである請求項１に記載のデータ処理装置。
　プロセッサが、
　撮影時に受光素子がセンシングした物理量に応じて画素値が定まる、又は前記物理量に可逆変換を行うことで前記画素値が定まるシングルチャンネル画像であって、第１の教師データセットを構成する前記シングルチャンネル画像の前記画素値を反転させた反転画像を、前記第１の教師データセットを拡張して得られる第２の教師データセットの学習データとして生成する工程と、
　前記第１の教師データセットを構成する前記シングルチャンネル画像の正解ラベルに基づいて、前記反転画像に対応させた反転ラベルを、前記第２の教師データセットを構成する正解ラベルとして生成する工程と、を行うデータ処理方法。
　プロセッサに、
　撮影時に受光素子がセンシングした物理量に応じて画素値が定まる、又は前記物理量に可逆変換を行うことで前記画素値が定まるシングルチャンネル画像であって、第１の教師データセットを構成する前記シングルチャンネル画像の前記画素値を反転させた反転画像を、前記第１の教師データセットを拡張して得られる第２の教師データセットを構成する学習データとして生成する工程と、
　前記第１の教師データセットを構成する前記シングルチャンネル画像の正解ラベルに基づいて、前記反転画像に対応させた反転ラベルを、前記第２の教師データセットを構成する正解ラベルとして生成する工程と、を含むデータ処理方法を実行させるプログラム。
　非一時的かつコンピュータ読取可能な記録媒体であって、請求項１３に記載のプログラムが記録された記録媒体。