JP7459357B1

JP7459357B1 - 画像認識方法、装置、デバイスおよび記憶媒体

Info

Publication number: JP7459357B1
Application number: JP2023119935A
Authority: JP
Inventors: 聞▲タオ▼ 朱; 少杰李; 海亮黄; 楊　徳富; 成鋼顔
Original assignee: 之江実験室
Priority date: 2023-04-19
Filing date: 2023-07-24
Publication date: 2024-04-01
Anticipated expiration: 2043-07-24
Also published as: CN116152246A; CN116152246B

Abstract

【課題】コンピュータ断層撮影（ＣＴ）画像の認識精度を向上させた画像認識方法、装置、デバイスおよび記憶媒体を提供する。【解決手段】方法は、認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値に基づいて、認識すべきＣＴ画像の統計データを抽出し、認識モデルによって、認識すべきＣＴ画像の統計データに基づいて認識すべきＣＴ画像の第１の特徴表現を決定し、認識すべきＣＴ画像に基づいて認識すべきＣＴ画像の第２の特徴表現を決定し、認識すべきＣＴ画像の統計データと、認識すべきＣＴ画像の画像情報とに基づいて認識すべきＣＴ画像を認識する。【選択図】図１

Description

本発明は、データ処理の技術分野に関し、特に、画像認識方法、装置、デバイスおよび記憶媒体に関する。

現在、コンピュータ断層撮影（ＣｏｍｐｕｔｅｄＴｏｍｏｇｒａｐｈｙ、ＣＴ）画像は、例えば、患者の肺のＣＴ画像に基づく慢性閉塞性肺疾患（ＣＯＰＤ）などの疾患の診断などの画像診断に広く使用されている。

先行技術では、深層学習モデルによってＣＴ画像から特徴を抽出し、ＣＴ画像に含まれる患者の身体の特定部位の画像に基づいて、患者の身体の特定部位の病変の有無を認識することができるが、この認識方法の精度は低い。

従って、ＣＴ画像の認識精度をいかに向上させるかが喫緊の課題となっている。

本発明は先行技術の上記問題点を解決するための画像認識方法、装置、デバイスおよび記憶媒体を提供する。

本発明に用いられる技術的解決手段は、以下のとおりである。

本発明は画像認識方法を提供し、前記方法は、
ユーザの認識すべきコンピュータ断層撮影（ＣＴ）画像を取得するステップと、
前記認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値に基づいて、前記認識すべきＣＴ画像に対応する画像ヒストグラムを決定するステップであって、前記画像ヒストグラムは前記認識すべきＣＴ画像に関わる各ＣＴ値に対応するボクセルの数を表すために用いられるステップと、
前記画像ヒストグラムに基づいて、前記認識すべきＣＴ画像の少なくとも１つの統計データを決定するステップであって、前記統計データは、前記認識すべきＣＴ画像に含まれる指定のボクセルに対応するＣＴ値と、ＣＴ値が指定範囲内にあるボクセルの数がすべてのボクセルの総数に占める割合とを含むステップと、
前記統計データを予め訓練された認識モデルの第１の特徴抽出層に入力して第１の特徴表現を得、前記認識すべきＣＴ画像を前記認識モデルの第２の特徴抽出層に入力して第２の特徴表現を得るステップと、
前記第１の特徴表現と前記第２の特徴表現とに基づいて、前記認識すべきＣＴ画像の認識結果を得るステップと、を含む。

オプションで、ユーザの認識すべきＣＴ画像を取得するステップは、具体的に、
ユーザのオリジナルコンピュータ断層撮影（ＣＴ）画像を取得するステップと、
前記オリジナルＣＴ画像を分割して、前記ユーザの身体の特定部位に対応するＣＴ画像を得るステップと、
前記ユーザの身体の特定部位に対応するＣＴ画像をリサンプリングして、認識すべきＣＴ画像を得るステップと、を含む。

オプションで、前記統計データを予め訓練された認識モデルの第１の特徴抽出層に入力して第１の特徴表現を得るステップは、具体的に、
前記統計データの少なくとも一部を正規化して、処理後の統計データを得るステップと、
前記処理後の統計データを前記予め訓練された認識モデルの第１の特徴抽出層に入力して前記第１の特徴表現を得るステップと、を含む。

オプションで、前記認識すべきＣＴ画像を前記認識モデルの第２の特徴抽出層に入力して第２の特徴表現を得るステップは、具体的に、
前記認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値を正規化して、処理後の認識すべきＣＴ画像を得るステップと、
前記処理後の認識すべきＣＴ画像を前記予め訓練された認識モデルの第２の特徴抽出層に入力して前記第２の特徴表現を得るステップと、を含む。

オプションで、前記第１の特徴表現と前記第２の特徴表現とに基づいて、前記認識すべきＣＴ画像の認識結果を得るステップは、具体的に、
前記第１の特徴表現と前記第２の特徴表現とを融合して融合特徴表現を得るステップと、
前記融合特徴表現に基づいて、前記認識すべきＣＴ画像の認識結果を得るステップと、を含む。

オプションで、前記方法は、前記認識モデルを訓練するステップをさらに含み、具体的に、
各サンプルユーザの認識すべきＣＴ画像を取得するステップであって、前記サンプルユーザは、身体の特定部位の少なくとも一部に病変を有する患者と、身体の特定部位の少なくとも一部に病変を有しない非患者とを含むステップと、
少なくとも一部のサンプルユーザの認識すべきＣＴ画像を訓練セットとし、他のサンプルユーザの認識すべきＣＴ画像をテストセットとするステップと、
前記訓練セット内の認識すべきＣＴ画像によって前記認識モデルを初期訓練し、初期訓練された認識モデルを得るステップと、
前記テストセット内の各認識すべきＣＴ画像について、当該認識すべきＣＴ画像を前記初期訓練された認識モデルに入力して、前記初期訓練された認識モデルによって当該認識すべきＣＴ画像の認識結果を得るステップと、
前記初期訓練された認識モデルによって得られた当該認識すべきＣＴ画像の認識結果と、当該認識すべきＣＴ画像の実際の認識結果との差を最小化することを最適化の目標として、前記認識モデルを訓練するステップと、を含む。

本発明は画像認識装置を提供し、前記装置は、
ユーザの認識すべきコンピュータ断層撮影（ＣＴ）画像を取得するための取得モジュールと、
前記認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値に基づいて、前記認識すべきＣＴ画像に対応する画像ヒストグラムを決定するための決定モジュールであって、前記画像ヒストグラムは前記認識すべきＣＴ画像に関わる各ＣＴ値に対応するボクセルの数を表すために用いられる、決定モジュールと、
前記画像ヒストグラムに基づいて、前記認識すべきＣＴ画像の少なくとも１つの統計データを決定するための統計モジュールであって、前記統計データは、前記認識すべきＣＴ画像に含まれる指定のボクセルに対応するＣＴ値と、ＣＴ値が指定範囲内にあるボクセルの数がすべてのボクセルの総数に占める割合とを含む、統計モジュールと、
前記統計データを予め訓練された認識モデルの第１の特徴抽出層に入力して第１の特徴表現を得、前記認識すべきＣＴ画像を前記認識モデルの第２の特徴抽出層に入力して第２の特徴表現を得るための特徴抽出モジュールと、
前記第１の特徴表現と前記第２の特徴表現とに基づいて、前記認識すべきＣＴ画像の認識結果を得るための認識モジュールと、を含む。

オプションで、前記取得モジュールは、具体的に、
ユーザのオリジナルコンピュータ断層撮影（ＣＴ）画像を取得し、
前記オリジナルＣＴ画像を分割して、前記ユーザの身体の特定部位に対応するＣＴ画像を得、
前記ユーザの身体の特定部位に対応するＣＴ画像をリサンプリングして、認識すべきＣＴ画像を得るために用いられる。

オプションで、前記特徴抽出モジュールは、具体的に、
前記統計データの少なくとも一部を正規化して、処理後の統計データを得、
前記処理後の統計データを前記予め訓練された認識モデルの第１の特徴抽出層に入力して前記第１の特徴表現を得るために用いられる。

オプションで、前記特徴抽出モジュールは、具体的に、
前記認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値を正規化して、処理後の認識すべきＣＴ画像を得、
前記処理後の認識すべきＣＴ画像を前記予め訓練された認識モデルの第２の特徴抽出層に入力して前記第２の特徴表現を得るために用いられる。

オプションで、前記認識モジュールは、具体的に、
前記第１の特徴表現と前記第２の特徴表現とを融合して融合特徴表現を得、
前記融合特徴表現に基づいて、前記認識すべきＣＴ画像の認識結果を得るために用いられる。

オプションで、前記装置は、訓練モジュールをさらに含み、
前記訓練モジュールは、具体的に、
各サンプルユーザの認識すべきＣＴ画像を取得し、前記サンプルユーザは、身体の特定部位の少なくとも一部に病変を有する患者と、身体の特定部位の少なくとも一部に病変を有しない非患者とを含み、
少なくとも一部のサンプルユーザの認識すべきＣＴ画像を訓練セットとし、他のサンプルユーザの認識すべきＣＴ画像をテストセットとし、
前記訓練セット内の認識すべきＣＴ画像によって前記認識モデルを初期訓練し、初期訓練された認識モデルを得、
前記テストセット内の各認識すべきＣＴ画像について、当該認識すべきＣＴ画像を前記初期訓練された認識モデルに入力して、前記初期訓練された認識モデルによって当該認識すべきＣＴ画像の認識結果を得、
前記初期訓練された認識モデルによって得られた当該認識すべきＣＴ画像の認識結果と、当該認識すべきＣＴ画像の実際の認識結果との差を最小化することを最適化の目標として、前記認識モデルを訓練するために用いられる。

本発明はコンピュータ可読記憶媒体を提供し、前記コンピュータ可読記憶媒体はコンピュータプログラムを記憶しており、前記コンピュータプログラムがプロセッサによって実行されると、上記画像認識方法が実施される。

本発明は電子デバイスを提供し、前記電子デバイスは、メモリと、プロセッサと、前記メモリに記憶され、前記プロセッサ上で実行可能なコンピュータプログラムとを含み、前記プロセッサが前記コンピュータプログラムを実行すると、上記画像認識方法を実施する。

本発明で用いられる上記技術的解決手段の少なくとも１つは、以下の有益な効果を達成することができる。

本発明にて提供される画像認識方法は、まずユーザの認識すべきコンピュータ断層撮影（ＣＴ）画像を取得し、認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値に基づいて、認識すべきＣＴ画像に対応する画像ヒストグラムを決定し、画像ヒストグラムは認識すべきＣＴ画像に関わる各ＣＴ値に対応するボクセルの数を表すために用いられ、画像ヒストグラムに基づいて、認識すべきＣＴ画像の少なくとも１つの統計データを決定し、統計データは、認識すべきＣＴ画像に含まれる指定のボクセルに対応するＣＴ値と、ＣＴ値が指定範囲内にあるボクセルの数がすべてのボクセルの総数に占める割合とを含み、統計データを予め訓練された認識モデルの第１の特徴抽出層に入力して第１の特徴表現を得、認識すべきＣＴ画像を認識モデルの第２の特徴抽出層に入力して第２の特徴表現を得、第１の特徴表現と第２の特徴表現とに基づいて、認識すべきＣＴ画像の認識結果を得る。

上記方法から分かるように、認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値に基づいて、認識すべきＣＴ画像の統計データを抽出でき、認識モデルによって、認識すべきＣＴ画像の統計データに基づいて認識すべきＣＴ画像の第１の特徴表現を決定し、認識すべきＣＴ画像に基づいて認識すべきＣＴ画像の第２の特徴表現を決定することができるため、認識すべきＣＴ画像の統計データと、認識すべきＣＴ画像の画像情報とに基づいて認識すべきＣＴ画像を認識することができ、認識の精度を向上させることができる。

ここで説明される添付図面は、本発明の理解を深めるために用いられ、本発明の一部を構成し、本発明の例示的な実施形態およびその説明は、本発明を説明するために用いられ、本発明の不当な限定を構成するものではない。
本発明にて提供される画像認識方法のフローを示す概略図である。本発明にて提供される認識すべきＣＴ画像に対応する画像ヒストグラムである。本発明にて提供される認識すべきＣＴ画像の認識プロセスを示す概略図である。本発明にて提供される画像認識装置を示す概略図である。本発明にて提供される電子デバイスを示す概略図である。

本発明の目的、技術的解決手段および利点をより明確にするために、以下、本発明の特定の実施形態および対応する添付図面と併せて、本発明の技術的解決手段を明確かつ完全に説明する。明らかに、説明された実施形態は、本発明の実施形態の一部に過ぎず、そのすべてではない。本発明の実施形態に基づいて、当業者が創作的な労力を要することなく得られる他のすべての実施形態は、いずれも本発明の保護範囲に属する。

以下、添付図面と併せて、本発明の各実施形態にて提供される技術的解決手段を詳細に説明する。

図１は、本発明にて提供される画像認識方法のフローを示す概略図であり、以下のステップを含む。

Ｓ１０１において、ユーザの認識すべきコンピュータ断層撮影（ＣＴ）画像を取得する。

本発明において、業務プラットフォームは、ユーザのオリジナルコンピュータ断層撮影（ＣＴ）画像を取得し、取得したユーザのオリジナルＣＴ画像を分割して、ユーザのオリジナルＣＴ画像からユーザの身体の特定部位に対応するＣＴ画像を得てもよい。

上記において、業務プラットフォームが、取得したユーザのオリジナルＣＴ画像を分割することは、所定の分割モデルにユーザのオリジナルＣＴ画像を入力して、所定の分割モデルにより、ユーザの身体の特定部位に対応するＣＴ画像を得ることであってもよい。ここでの分割モデルは、ＵＮｅｔ、ＵＮｅｔ＋＋などのニューラルネットワークモデルであってもよい。

さらに、ユーザの身体の特定部位に対応するＣＴ画像をリサンプリングして、認識すべきＣＴ画像を得てもよい。ここで、リサンプリングにより、認識すべきＣＴ画像におけるボクセルのサイズを正規化することができる。

なお、リサンプリングにより得られた認識すべきＣＴ画像のサイズは、オリジナル画像のサイズと異なる場合があるため、リサンプリングにより得られた認識すべきＣＴ画像のサイズが、分割前のユーザのオリジナルＣＴ画像のサイズと同じになるように、リサンプリングにより得られた認識すべき画像に対してトリミングなどの操作を行ってもよい。

上記におけるユーザの身体の特定部位は、例えば、肺、肝臓などの部位であってもよい。上記におけるボクセルは、ボリュームピクセル（ＶｏｌｕｍｅＰｉｘｅｌ）であり、３次元空間での最小単位である。２次元空間におけるピクセルと類似し、３次元空間における３次元画像は、ボクセルと呼ばれる複数の小さな立方体から構成され得ると理解してもよい。

なお、異なるユーザの身体の特定部位に対応するＣＴ画像のサイズが異なる場合があり（各ユーザの特定部位の体積が異なり、身体に占める割合も異なるため、分割されたユーザの身体の特定部位に対応するＣＴ画像のサイズが異なる場合がある）、異なるユーザの身体の特定部位に対応するＣＴ画像に含まれるボクセルのサイズも異なる場合がある。例えば、あるユーザの身体の特定部位に対応するＣＴ画像に含まれるボクセルのサイズは（０．８７８９０６，０．８７８９０６，０．６２５）であり得るが、他のユーザの身体の特定部位に対応するＣＴ画像に含まれるボクセルのサイズは（１，１，１）であり得る。従って、異なる認識すべきＣＴ画像に含まれるボクセルの大きさが異なることによる、認識モデルが出力する認識結果への影響を回避するため、リサンプリングにより、認識すべきＣＴ画像におけるボクセルのサイズを正規化する必要があり、また、分割されたユーザの身体の特定部位に対応するＣＴ画像を、分割前のユーザのオリジナルＣＴ画像と同じサイズにする必要がある。

本発明において、画像認識方法を実行するための実行主体は、サーバなどの、業務プラットフォーム上に設置された指定のデバイスであってもよいし、ノートパソコン、デスクトップパソコンなどのデバイスであってもよい。説明の便宜上、以下、実行主体としてサーバのみを例に、本発明にて提供される画像認識方法について説明する。

Ｓ１０２において、前記認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値に基づいて、前記認識すべきＣＴ画像に対応する画像ヒストグラムを決定し、前記画像ヒストグラムは前記認識すべきＣＴ画像に関わる各ＣＴ値に対応するボクセルの数を表すために用いられる。

さらに、サーバが、認識すべきＣＴ画像を取得した後、認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値を決定し、認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値に基づいて、図２に示すような、認識すべきＣＴ画像に対応する画像ヒストグラムを決定してもよい。

図２は、本発明にて提供される認識すべきＣＴ画像に対応する画像ヒストグラムである。

図２から分かるように、認識すべきＣＴ画像に対応する画像ヒストグラムは、各ＣＴ値に対応するボクセルの数を表すために用いられる。例えば、図２における、ＣＴ値が－９５０ＨＵのボクセルの数は５１００である。なお、ここでの５１００は、ＣＴ値－９５０ＨＵに対応する周波数値、即ち認識すべきＣＴ画像における、ＣＴ値が－９５０ＨＵのボクセルの数である。

上記のＣＴ値は、ハンスフィールドユニット（ＨｏｕｎｓｆｉｅｌｄＵｎｉｔ、ＨＵ）値とも呼ばれ、Ｘ線が異なる組織を通過する際の減衰係数に対応する値を指す。

実際の応用シナリオでは、認識すべきＣＴ画像には、ＣＴ値が－１０２４ＨＵより小さいボクセルと、ＣＴ値が１９０ＨＵより大きいボクセルも含まれることがあり、サーバはこれらのボクセルに対して閾値処理を行ってもよい。

具体的に、サーバは、ＣＴ値が－１０２４ＨＵより小さいボクセルに対応するＣＴ値を－１０２４ＨＵに設定し、ＣＴ値が１９０ＨＵより大きいボクセルに対応するＣＴ値を１９０ＨＵに設定してもよい。

Ｓ１０３において、前記画像ヒストグラムに基づいて、前記認識すべきＣＴ画像の少なくとも１つの統計データを決定し、前記統計データは、前記認識すべきＣＴ画像に含まれる指定のボクセルに対応するＣＴ値と、ＣＴ値が指定範囲内にあるボクセルの数がすべてのボクセルの総数に占める割合とを含む。

さらに、サーバは、画像ヒストグラムに基づいて、認識すべきＣＴ画像の少なくとも１つの統計データを決定してもよく、ここでの統計データは、認識すべきＣＴ画像に含まれる指定のボクセルに対応するＣＴ値と、ＣＴ値が指定範囲内にあるボクセルの数がすべてのボクセルの総数に占める割合とを含む。ここでのすべてのボクセルは、認識すべきＣＴ画像に含まれるユーザの身体の特定部位に対応するすべてのボクセルを指す。

ここで、認識すべきＣＴ画像に含まれる指定のボクセルは、画像ヒストグラムの指定のパーセンタイルにあるボクセルであってもよく、例えば、画像ヒストグラムの１５パーセンタイルにあるボクセルを指定のボクセルとして使用してもよい。言い換えれば、ここでの１５パーセンタイルにあるボクセルは、すべてのボクセルを、対応するＣＴ値の大きさに従って、小さい順にソートした後、すべてのボクセルの１５％に位置するボクセルである。

また、認識すべきＣＴ画像に含まれる指定のボクセルは、各ＣＴ値のうち、最も周波数値の高いＣＴ値に対応するボクセルを指してもよい。

また、上記における指定範囲は、所定の第１の指定範囲および第２の指定範囲を指してもよい。ＣＴ値が第１の指定範囲内にあることは、ＣＴ値が－９５０ＨＵ以下であってもよい。ＣＴ値が第２の指定範囲内にあることは、ＣＴ値が［－１０２４，－９２０］にあること、ＣＴ値が（－９２０，－７２０）にあること、ＣＴ値が［－７２０，１９０］にあることのうちの少なくとも１つであってもよい。

なお、ＣＴ値が上記の第１の指定範囲内にあるボクセルの数がすべてのボクセルの総数に占める割合は、全体的に、ユーザの身体の特定部位の病変状況を反映することができ、上記の各第２の指定範囲は、ユーザの身体の特定部位の異なる領域の病変状況を反映することができる。

Ｓ１０４において、前記統計データを予め訓練された認識モデルの第１の特徴抽出層に入力して第１の特徴表現を得、前記認識すべきＣＴ画像を前記認識モデルの第２の特徴抽出層に入力して第２の特徴表現を得る。

なお、上記第１の特徴抽出層および上記第２の特徴抽出層は、実際のニーズに応じて選択してもよく、例えば、上記第１の特徴抽出層は線形層であってもよく、上記第２の特徴抽出層はＲｅｓＮｅｔ１８ネットワーク層であってもよい。

さらに、サーバが統計データを決定した後、決定された統計データの少なくとも一部を正規化して、処理後の統計データを得、処理後の統計データを予め訓練された認識モデルの第１の特徴抽出層に入力して第１の特徴表現を得てもよい。

例示的に、統計データは、画像ヒストグラムの１５パーセンタイルにあるボクセルに対応するＣＴ値、最も周波数値の高いＣＴ値、ＣＴ値が－９５０ＨＵ以下のボクセルの数がすべてのボクセルの総数に占める割合、ＣＴ値が［－１０２４，－９２０］にあるボクセルの数がすべてのボクセルの総数に占める割合、ＣＴ値が（－９２０，－７２０）にあるボクセルの数がすべてのボクセルの総数に占める割合、ＣＴ値が［－７２０，１９０］にあるボクセルの数がすべてのボクセルの総数に占める割合の６つの統計データを含む。この場合、サーバは、上記の６つの統計データを決定した後、画像ヒストグラムの１５パーセンタイルにあるボクセルに対応するＣＴ値と、最も周波数値の高いＣＴ値とを正規化し、正規化された２つの統計データを、残りの４つの統計データとともに予め訓練された認識モデルの第１の特徴抽出層に入力し、第１の特徴抽出層を介して、正規化された２つの統計データと残りの４つの統計データとを結合して、線形変換を行うことにより、第１の特徴表現を得る。第１の特徴表現は、サイズが１×２５６の特徴ベクトルであってもよい。

また、サーバは、認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値を正規化して、処理後の認識すべきＣＴ画像を得、処理後の認識すべきＣＴ画像を予め訓練された認識モデルの第２の特徴抽出層に入力して第２の特徴表現を得てもよい。

例示的に、第２の特徴表現は、サイズが１×５１２の特徴ベクトルであってもよい。

Ｓ１０５において、前記第１の特徴表現と前記第２の特徴表現とに基づいて、前記認識すべきＣＴ画像の認識結果を得る。

さらに、サーバは、第１の特徴表現と第２の特徴表現とに基づいて、認識すべきＣＴ画像の認識結果を得てもよい。

具体的に、サーバは、認識モデルの全結合層を介して、認識すべきＣＴ画像の第１の特徴表現と第２の特徴表現とを融合して融合特徴表現を得、得られた融合特徴表現を認識モデルの意思決定層に入力して、認識すべきＣＴ画像の認識結果を得てもよい。

また、実際の適用では、認識モデルをサーバにデプロイして認識すべきＣＴ画像を認識する前に、認識モデルを予め訓練する必要がある。

ここで、認識モデルを訓練する方法は、各サンプルユーザの認識すべきＣＴ画像を取得するステップであって、サンプルユーザは、身体の特定部位の少なくとも一部に病変を有する患者と、身体の特定部位の少なくとも一部に病変を有しない非患者とを含むステップと、少なくとも一部のサンプルユーザの認識すべきＣＴ画像を訓練セットとし、他のサンプルユーザの認識すべきＣＴ画像をテストセットとするステップと、訓練セット内の認識すべきＣＴ画像によって認識モデルを初期訓練し、初期訓練された認識モデルを得るステップと、テストセット内の各認識すべきＣＴ画像について、当該認識すべきＣＴ画像を初期訓練された認識モデルに入力して、初期訓練された認識モデルによって当該認識すべきＣＴ画像の認識結果を得るステップと、初期訓練された認識モデルによって得られた当該認識すべきＣＴ画像の認識結果と、当該認識すべきＣＴ画像の実際の認識結果との差を最小化することを最適化の目標として、認識モデルを訓練するステップと、を含み得る。

上記をさらに詳しく説明するために、本発明は、図３に示すような、前記認識モデルによる画像認識のプロセスを示す概略図をさらに提供する。

図３は、本発明にて提供される認識すべきＣＴ画像の認識プロセスを示す概略図である。

図３から分かるように、サーバは、認識すべきＣＴ画像および認識すべきＣＴ画像に含まれる少なくとも１つの統計データを予め訓練された認識モデルに入力して、認識モデルの第１の特徴抽出層により認識すべきＣＴ画像の第１の特徴表現を得、認識モデルの第２の特徴抽出層により認識すべきＣＴ画像の第２の特徴表現を得てもよい。

さらに、認識モデルは全結合層を介して、認識すべきＣＴ画像の第１の特徴表現と第２の特徴表現とを融合して融合特徴表現を得、意思決定層により、融合特徴表現に基づいて、認識すべきＣＴ画像を認識し、認識すべきＣＴ画像の認識結果を得てもよい。

上記から分かるように、サーバは、認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値に基づいて、認識すべきＣＴ画像の統計データを抽出でき、認識モデルによって、認識すべきＣＴ画像の統計データに基づいて認識すべきＣＴ画像の第１の特徴表現を決定し、認識すべきＣＴ画像に基づいて認識すべきＣＴ画像の第２の特徴表現を決定することができるため、認識すべきＣＴ画像の統計データと、認識すべきＣＴ画像の画像情報とに基づいて認識すべきＣＴ画像を認識することができ、認識の精度を向上させることができる。

以上が、本発明の１つまたは複数の実施形態にて提供される画像認識方法であり、同じ考えに基づいて、本発明は図４に示すような、対応する画像認識装置をさらに提供する。

図４は、本発明にて提供される画像認識装置を示す概略図であり、前記装置は、
ユーザの認識すべきコンピュータ断層撮影（ＣＴ）画像を取得するための取得モジュール４０１と、
前記認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値に基づいて、前記認識すべきＣＴ画像に対応する画像ヒストグラムを決定するための決定モジュール４０２であって、前記画像ヒストグラムは前記認識すべきＣＴ画像に関わる各ＣＴ値に対応するボクセルの数を表すために用いられる、決定モジュール４０２と、
前記画像ヒストグラムに基づいて、前記認識すべきＣＴ画像の少なくとも１つの統計データを決定するための統計モジュール４０３であって、前記統計データは、前記認識すべきＣＴ画像に含まれる指定のボクセルに対応するＣＴ値と、ＣＴ値が指定範囲内にあるボクセルの数がすべてのボクセルの総数に占める割合とを含む、統計モジュール４０３と、
前記統計データを予め訓練された認識モデルの第１の特徴抽出層に入力して第１の特徴表現を得、前記認識すべきＣＴ画像を前記認識モデルの第２の特徴抽出層に入力して第２の特徴表現を得るための特徴抽出モジュール４０４と、
前記第１の特徴表現と前記第２の特徴表現とに基づいて、前記認識すべきＣＴ画像の認識結果を得るための認識モジュール４０５と、を含む。

オプションで、前記取得モジュール４０１は、具体的に、
ユーザのオリジナルコンピュータ断層撮影（ＣＴ）画像を取得し、
前記オリジナルＣＴ画像を分割して、前記ユーザの身体の特定部位に対応するＣＴ画像を得、
前記ユーザの身体の特定部位に対応するＣＴ画像をリサンプリングして、認識すべきＣＴ画像を得るために用いられる。

オプションで、前記特徴抽出モジュール４０４は、具体的に、
前記統計データの少なくとも一部を正規化して、処理後の統計データを得、
前記処理後の統計データを前記予め訓練された認識モデルの第１の特徴抽出層に入力して前記第１の特徴表現を得るために用いられる。

オプションで、前記特徴抽出モジュール４０４は、具体的に、
前記認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値を正規化して、処理後の認識すべきＣＴ画像を得、
前記処理後の認識すべきＣＴ画像を前記予め訓練された認識モデルの第２の特徴抽出層に入力して前記第２の特徴表現を得るために用いられる。

オプションで、前記認識モジュール４０５は、具体的に、
前記第１の特徴表現と前記第２の特徴表現とを融合して融合特徴表現を得、
前記融合特徴表現に基づいて、前記認識すべきＣＴ画像の認識結果を得るために用いられる。

オプションで、前記装置は、訓練モジュール４０６をさらに含み、
前記訓練モジュール４０６は、具体的に、
各サンプルユーザの認識すべきＣＴ画像を取得し、前記サンプルユーザは、身体の特定部位の少なくとも一部に病変を有する患者と、身体の特定部位の少なくとも一部に病変を有しない非患者とを含み、
少なくとも一部のサンプルユーザの認識すべきＣＴ画像を訓練セットとし、他のサンプルユーザの認識すべきＣＴ画像をテストセットとし、
前記訓練セット内の認識すべきＣＴ画像によって前記認識モデルを初期訓練し、初期訓練された認識モデルを得、
前記テストセット内の各認識すべきＣＴ画像について、当該認識すべきＣＴ画像を前記初期訓練された認識モデルに入力して、前記初期訓練された認識モデルによって当該認識すべきＣＴ画像の認識結果を得、
前記初期訓練された認識モデルによって得られた当該認識すべきＣＴ画像の認識結果と、当該認識すべきＣＴ画像の実際の認識結果との差を最小化することを最適化の目標として、前記認識モデルを訓練するために用いられる。

本発明はコンピュータ可読記憶媒体をさらに提供し、当該コンピュータ可読記憶媒体はコンピュータプログラムを記憶しており、コンピュータプログラムは上記図１の方法を実行するために用いられる。

本発明は図５に示す電子デバイスをさらに提供する。図５に示すように、ハードウェアレベルでは、当該電子デバイスは、プロセッサ、内部バス、ネットワークインタフェース、内部メモリ、および不揮発性メモリを含み、もちろん、他の動作に必要なハードウェアも含み得る。プロセッサは、不揮発性メモリから対応するコンピュータプログラムを内部メモリに読み込んで実行し、上記図１で説明した方法を実施する。

もちろん、ソフトウェアによる実現の他に、本発明は、論理デバイスやハードウェアとソフトウェアの組み合わせなど、他の実現方式を排除するものではなく、つまり、以下の処理プロセスの実行主体は、各の論理ユニットに限定されず、ハードウェアや論理デバイスであってもよい。

１９９０年代には、ある技術の改良は、ハードウェアの改良（ダイオード、トランジスタ、スイッチなどの回路構造の改良など）とソフトウェアの改良（方法フローの改良）に明確に区別することができる。しかし、技術の発展に伴い、現在の方法フローの改良の多くは、ハードウェア回路構造に対する直接的な改良と見なすことができるようになった。設計者は、改良された方法フローをハードウェア回路にプログラミングすることで、対応するハードウェア回路構造を得ることがほとんどである。従って、方法フローの改良がハードウェア物理モジュールにより実現できないとは言い切れない。例えば、プログラマブルロジックデバイス（ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ、ＰＬＤ）（例えばフィールドプログラマブルゲートアレイ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ、ＦＰＧＡ））はこのような集積回路であり、その論理機能がデバイスのユーザによるプログラミングによって決定される。チップメーカーが専用の集積回路チップを設計・製造する代わりに、設計者がプログラミングしてデジタルシステムを１枚のＰＬＤ上に「集積」する。そして、現在では、集積回路チップを手作りする代わりに、このプログラミングは「論理コンパイラ（ｌｏｇｉｃｃｏｍｐｉｌｅｒ）」というソフトウェアを使って実現されることがほとんどであり、これは、プログラムを書くときに使うソフトウェアコンパイラと類似し、前のオリジナルコードをコンパイルするためには、特定のプログラミング言語で書く必要があり、これはハードウェア記述言語（ＨａｒｄｗａｒｅＤｅｓｃｒｉｐｔｉｏｎＬａｎｇｕａｇｅ、ＨＤＬ）と呼ばれ、ＨＤＬは１種類だけではなく、ＡＢＥＬ（ＡｄｖａｎｃｅｄＢｏｏｌｅａｎＥｘｐｒｅｓｓｉｏｎＬａｎｇｕａｇｅ）、ＡＨＤＬ（ＡｌｔｅｒａＨａｒｄｗａｒｅＤｅｓｃｒｉｐｔｉｏｎＬａｎｇｕａｇｅ）、Ｃｏｎｆｌｕｅｎｃｅ、ＣＵＰＬ（ＣｏｒｎｅｌｌＵｎｉｖｅｒｓｉｔｙＰｒｏｇｒａｍｍｉｎｇＬａｎｇｕａｇｅ）、ＨＤＣａｌ、ＪＨＤＬ（ＪａｖａＨａｒｄｗａｒｅＤｅｓｃｒｉｐｔｉｏｎＬａｎｇｕａｇｅ）、Ｌａｖａ、Ｌｏｌａ、ＭｙＨＤＬ、ＰＡＬＡＳＭ、ＲＨＤＬ（ＲｕｂｙＨａｒｄｗａｒｅＤｅｓｃｒｉｐｔｉｏｎＬａｎｇｕａｇｅ）など、多くの種類があり、現在最もよく使われているのはＶＨＤＬ（Ｖｅｒｙ－Ｈｉｇｈ－ＳｐｅｅｄＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔＨａｒｄｗａｒｅＤｅｓｃｒｉｐｔｉｏｎＬａｎｇｕａｇｅ）とＶｅｒｉｌｏｇである。方法フローを、上記のハードウェア記述言語のいくつかでちょっと論理的にプログラミングして集積回路にプログラミングするだけで、論理的な方法フローを実現するハードウェア回路は簡単に得られることは、当業者には明らかであろう。

コントローラは、任意の適切な方法で実現されてもよく、例えば、コントローラはマイクロプロセッサまたはプロセッサと、当該（マイクロ）プロセッサによって実行可能なコンピュータ可読プログラムコード（例えば、ソフトウェアまたはファームウェア）を記憶するコンピュータ可読記憶媒体と、論理ゲート、スイッチ、特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ、ＡＳＩＣ）、プログラマブルロジックコントローラおよび埋め込みマイクロコントローラの形態を採用してもよく、コントローラの例として、ＡＲＣ６２５Ｄ、ＡｔｍｅｌＡＴ９１ＳＡＭ、ＭｉｃｒｏｃｈｉｐＰＩＣ１８Ｆ２６Ｋ２０、ＳｉｌｉｃｏｎｅＬａｂｓＣ８０５１Ｆ３２０などのマイクロコントローラを含むが、これらに限定されず、メモリコントローラはさらに、メモリの制御ロジックの一部として実現されることも可能である。また、純粋なコンピュータ可読プログラムコードでコントローラを実現することに加えて、方法ステップを論理的にプログラミングすることで、コントローラに、論理ゲート、スイッチ、特定用途向け集積回路、プログラマブルロジックコントローラおよび埋め込みマイクロコントローラなどの形態で同じ機能を実行させることも完全に可能であることは、当業者には明らかであろう。従って、このようなコントローラを、ハードウェアコンポーネントとみなしてもよく、様々な機能を実現するためのその中に含まれる装置も、ハードウェアコンポーネント内の構造とみなしてもよい。または、さらに、様々な機能を実現するための装置を、方法を実現するソフトウェアモジュールであってもよいし、ハードウェアコンポーネント内の構造であってもよいと、みなしてもよい。

上記実施形態で説明したシステム、装置、モジュールまたはユニットは、具体的には、コンピュータチップ、エンティティ、または何らかの機能を有する製品によって実現されてもよい。典型的な実現デバイスはコンピュータである。具体的に、コンピュータは例えば、パーソナルコンピュータ、ラップトップコンピュータ、携帯電話、カメラ付き電話、スマートフォン、パーソナルデジタルアシスタント、メディアプレーヤ、ナビゲーションデバイス、電子メールデバイス、ゲーム機、タブレット、ウェアラブルデバイス、またはこれらのデバイスの任意のいくつかの組み合わせであってもよい。

なお、説明の便宜上、上記の装置を説明するときに機能によって様々なユニットに分けてそれぞれ説明する。もちろん、本発明を実施する際に、各ユニットの機能を同一または複数のソフトウェアおよび／またはハードウェアで実現することも可能である。

当業者であれば分かるように、本発明の実施形態が、方法、システム、またはコンピュータプログラム製品として提供されてもよい。従って、本発明は、ハードウェアだけからなる実施形態、ソフトウェアだけからなる実施形態、またはソフトウェアとハードウェアを組み合わせた実施形態なる形態を用いてもよい。さらに、本発明は、コンピュータで使用可能なプログラムコードを含む１つまたは複数のコンピュータで使用可能な記憶媒体（磁気ディスクメモリ、ＣＤ－ＲＯＭ、光学メモリなどを含むが、これらに限定されない）において実施されるコンピュータプログラム製品の形態であってもよい。

本発明は、本発明の実施形態による方法、デバイス（システム）、およびコンピュータプログラム製品のフローチャートおよび／またはブロック図を参照して説明される。フローチャートおよび／またはブロック図における各フローおよび／またはブロック、並びにフローチャートおよび／またはブロック図におけるフローおよび／またはブロックの組み合わせは、コンピュータプログラム命令によって実現されてもよいことが理解すべきである。これらのコンピュータプログラム命令は、マシンを生成するために、汎用コンピュータ、専用コンピュータ、埋め込みプロセッサ、または他のプログラム可能なデータ処理デバイスのプロセッサに提供されてもよく、それにより、コンピュータまたは他のプログラム可能なデータ処理デバイスのプロセッサによって実行される命令により、フローチャートの１つまたは複数のフロー、および／またはブロック図の１つまたは複数のブロックにおいて指定される機能を実現するための装置が生成される。

これらのコンピュータプログラム命令は、コンピュータまたは他のプログラム可能なデータ処理デバイスに特定の方法で作業するように指示することができるコンピュータ可読メモリに記憶されてもよく、その結果、当該コンピュータ可読メモリに記憶されている命令により、フローチャートの１つまたは複数のフローおよび／またはブロック図の１つまたは複数のブロックにおいて指定される機能を実現する命令装置を含む製品が生成される。

これらのコンピュータプログラム命令は、コンピュータまたは他のプログラム可能なデータ処理デバイスにロードしてもよく、それにより、一連の動作ステップがコンピュータまたは他のプログラム可能なデバイス上で実行されることで、コンピュータにより実施される処理が生成され、それにより、コンピュータまたは他のプログラム可能なデバイス上で実行される命令により、フローチャートの１つまたは複数のフロー、および／またはブロック図の１つまたは複数のブロック内で指定される機能を実現するためのステップが提供される。

典型的な構成では、コンピューティングデバイスは、１つ以上のプロセッサ（ＣＰＵ）、入力／出力インタフェース、ネットワークインタフェース、およびメモリを含む。

メモリは、コンピュータ可読記憶媒体のうちの揮発性メモリ、ランダムアクセスメモリ（ＲＡＭ）および／または不揮発性メモリなどの形態を含み得、例えば、読み出し専用メモリ（ＲＯＭ）またはフラッシュメモリ（ｆｌａｓｈＲＡＭ）である。メモリは、コンピュータ可読記憶媒体の一例である。

コンピュータ可読記憶媒体は不揮発性および揮発性媒体、移動可能および非移動可能な媒体を含み、任意の方法または技術により情報記憶を実現し得る。情報はコンピュータ可読命令、データ構造、プログラムモジュールまたは他のデータであってもよい。コンピュータの記憶媒体は、相変化メモリ（ＰｈａｓｅＣｈａｎｇｅＲＡＭ、ＰＲＡＭ）、スタティックランダムアクセスメモリ（ＳｔａｔｉｃＲａｎｄｏｍ－ＡｃｃｅｓｓＭｅｍｏｒｙ、ＳＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ、ＤＲＡＭ）、他のタイプのランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、電気的消去可能プログラマブル読み出し専用メモリ（ＥｌｅｃｔｒｉｃａｌｌｙＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄＯｎｌｙＭｅｍｏｒｙ、ＥＥＰＲＯＭ）、フラッシュメモリ（ｆｌａｓｈＭｅｍｏｒｙ）または他のメモリ技術、コンパクトディスク読み出し専用メモリ（ＣｏｍｐａｃｔＤｉｓｃＲｅａｄＯｎｌｙＭｅｍｏｒｙ、ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ、ＤＶＤ）または他の光学記憶、磁気カセットテープ、磁気テープ磁気ディスク記憶または他の磁気記憶デバイス、またはコンピューティングデバイスからアクセス可能な情報を記憶するために使用され得る任意の他の非伝送媒体を含むがそれらに限定されない。本明細書の定義によれば、コンピュータ可読記憶媒体は一時記憶コンピュータ可読記憶媒体（ｔｒａｎｓｉｔｏｒｙＭｅｄｉａ）、例えば変調されたデータ信号およびキャリアを含まない。

また、用語「含む」、「含有」またはそのいずれかの他の変形は、非排他的な含有を含むことを意図し、それにより一連の要素を含むプロセス、方法、物品またはデバイスはそれらの要素を含むだけでなく、また明確に列挙されていない他の要素も含み、またはこのようなプロセス、方法、物品またはデバイスの固有の要素も含む。より多くの制限がない場合、文「１つの…を含む」により限定された要素は、前記要素を含むプロセス、方法、物品またはデバイスにさらに他の同じ要素が存在することを排除するものではない。

本発明は、プログラムモジュールのようなコンピュータによって実行されるコンピュータ実行可能命令の一般的な文脈で記述され得る。一般的に、プログラムモジュールは、特定のタスクを実行する、または特定の抽象データ型を実現するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。本発明は、通信ネットワークを介して接続されたリモート処理デバイスによってタスクが実行される分散コンピューティング環境においても実施され得る。分散コンピューティング環境において、プログラムモジュールは、記憶デバイスを含むローカルおよびリモートコンピュータ記憶媒体に配置され得る。

本発明における各実施形態はいずれも漸進の方式で説明され、各実施形態の間の同じまたは類似する部分は互いに参照すればよく、各実施形態の重点的に説明されたのは他の実施形態との相違点である。特に、システムの実施形態に対して、それは基本的に方法の実施形態と類似するため、簡単に説明し、関連する部分は方法の実施形態の一部の説明を参照すればよい。

上記は、本発明の実施形態にすぎず、本発明を限定するために使用されるものではない。当業者にとって、本発明は、様々な変更および変化があり得る。本発明の趣旨と原理から逸脱せず行った任意の修正、同等な置換、改善など、いずれも本発明の特許請求の範囲に含まれるものとするべきである。

Claims

ユーザの認識すべきコンピュータ断層撮影（ＣＴ）画像を取得するステップと、
前記認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値に基づいて、前記認識すべきＣＴ画像に対応する画像ヒストグラムを決定するステップであって、前記画像ヒストグラムは前記認識すべきＣＴ画像に関わる各ＣＴ値に対応するボクセルの数を表すために用いられるステップと、
前記画像ヒストグラムに基づいて、前記認識すべきＣＴ画像の少なくとも１つの統計データを決定するステップであって、前記統計データは、前記認識すべきＣＴ画像に含まれる指定のボクセルに対応するＣＴ値と、ＣＴ値が指定範囲内にあるボクセルの数がすべてのボクセルの総数に占める割合とを含むステップと、
前記統計データを予め訓練された認識モデルの第１の特徴抽出層に入力して第１の特徴表現を得、前記認識すべきＣＴ画像を前記認識モデルの第２の特徴抽出層に入力して第２の特徴表現を得るステップと、
前記第１の特徴表現と前記第２の特徴表現とに基づいて、前記認識すべきＣＴ画像の認識結果を得るステップと、を含み、
ここで、前記認識モデルを訓練するためのサンプルとして、サンプルユーザの認識すべきＣＴ画像を採用し、前記認識モデルによって得られた当該認識すべきＣＴ画像の認識結果と、当該認識すべきＣＴ画像の実際の認識結果との差を最小化することを最適化の目標として、前記認識モデルを訓練し、前記サンプルユーザは、身体の特定部位の少なくとも一部に病変を有する患者と、身体の特定部位の少なくとも一部に病変を有しない非患者とを含む、
ことを特徴とする画像認識方法。
ユーザの認識すべきＣＴ画像を取得するステップは、
ユーザのオリジナルコンピュータ断層撮影（ＣＴ）画像を取得するステップと、
前記オリジナルＣＴ画像を分割して、前記ユーザの身体の特定部位に対応するＣＴ画像を得るステップと、
前記ユーザの身体の特定部位に対応するＣＴ画像をリサンプリングして、認識すべきＣＴ画像を得るステップと、を含む、
ことを特徴とする請求項１に記載の方法。
前記統計データを予め訓練された認識モデルの第１の特徴抽出層に入力して第１の特徴表現を得るステップは、
前記統計データの少なくとも一部を正規化して、処理後の統計データを得るステップと、
前記処理後の統計データを前記予め訓練された認識モデルの第１の特徴抽出層に入力して前記第１の特徴表現を得るステップと、を含む、
ことを特徴とする請求項１に記載の方法。
前記認識すべきＣＴ画像を前記認識モデルの第２の特徴抽出層に入力して第２の特徴表現を得るステップは、
前記認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値を正規化して、処理後の認識すべきＣＴ画像を得るステップと、
前記処理後の認識すべきＣＴ画像を前記予め訓練された認識モデルの第２の特徴抽出層に入力して前記第２の特徴表現を得るステップと、を含む、
ことを特徴とする請求項１に記載の方法。
前記第１の特徴表現と前記第２の特徴表現とに基づいて、前記認識すべきＣＴ画像の認識結果を得るステップは、
前記第１の特徴表現と前記第２の特徴表現とを融合して融合特徴表現を得るステップと、
前記融合特徴表現に基づいて、前記認識すべきＣＴ画像の認識結果を得るステップと、を含む、
ことを特徴とする請求項１に記載の方法。
前記認識モデルの訓練は、
少なくとも一部のサンプルユーザの認識すべきＣＴ画像を訓練セットとし、他のサンプルユーザの認識すべきＣＴ画像をテストセットとするステップと、
前記訓練セット内の認識すべきＣＴ画像によって前記認識モデルを初期訓練し、初期訓練された認識モデルを得るステップと、
前記テストセット内の各認識すべきＣＴ画像について、当該認識すべきＣＴ画像を前記初期訓練された認識モデルに入力して、前記初期訓練された認識モデルによって当該認識すべきＣＴ画像の認識結果を得るステップと、
前記初期訓練された認識モデルによって得られた当該認識すべきＣＴ画像の認識結果と、当該認識すべきＣＴ画像の実際の認識結果との差を最小化することを最適化の目標として、前記認識モデルを訓練するステップと、を含む、
ことを特徴とする請求項１に記載の方法。
ユーザの認識すべきコンピュータ断層撮影（ＣＴ）画像を取得するための取得モジュールと、
前記認識すべきＣＴ画像に含まれる各ボクセルに対応するＣＴ値に基づいて、前記認識すべきＣＴ画像に対応する画像ヒストグラムを決定するための決定モジュールであって、前記画像ヒストグラムは前記認識すべきＣＴ画像に関わる各ＣＴ値に対応するボクセルの数を表すために用いられる、決定モジュールと、
前記画像ヒストグラムに基づいて、前記認識すべきＣＴ画像の少なくとも１つの統計データを決定するための統計モジュールであって、前記統計データは、前記認識すべきＣＴ画像に含まれる指定のボクセルに対応するＣＴ値と、ＣＴ値が指定範囲内にあるボクセルの数がすべてのボクセルの総数に占める割合とを含む、統計モジュールと、
前記統計データを予め訓練された認識モデルの第１の特徴抽出層に入力して第１の特徴表現を得、前記認識すべきＣＴ画像を前記認識モデルの第２の特徴抽出層に入力して第２の特徴表現を得るための特徴抽出モジュールと、
前記第１の特徴表現と前記第２の特徴表現とに基づいて、前記認識すべきＣＴ画像の認識結果を得るための認識モジュールと、を含み、
ここで、前記認識モデルを訓練するためのサンプルとして、サンプルユーザの認識すべきＣＴ画像を採用し、前記認識モデルによって得られた当該認識すべきＣＴ画像の認識結果と、当該認識すべきＣＴ画像の実際の認識結果との差を最小化することを最適化の目標として、前記認識モデルを訓練し、前記サンプルユーザは、身体の特定部位の少なくとも一部に病変を有する患者と、身体の特定部位の少なくとも一部に病変を有しない非患者とを含む、
ことを特徴とする画像認識装置。
コンピュータプログラムを記憶しているコンピュータ可読記憶媒体であって、前記コンピュータプログラムがプロセッサによって実行されると、請求項１～６のいずれか１項に記載の方法が実施される、
ことを特徴とするコンピュータ可読記憶媒体。
メモリと、プロセッサと、前記メモリに記憶され、前記プロセッサ上で実行可能なコンピュータプログラムとを含む電子デバイスであって、前記プロセッサが前記コンピュータプログラムを実行すると、請求項１～６のいずれか１項に記載の方法を実施する、
ことを特徴とする電子デバイス。