JP7305046B2 - 画像分類方法及び装置並びに機器 - Google Patents

画像分類方法及び装置並びに機器 Download PDF

Info

Publication number
JP7305046B2
JP7305046B2 JP2022527909A JP2022527909A JP7305046B2 JP 7305046 B2 JP7305046 B2 JP 7305046B2 JP 2022527909 A JP2022527909 A JP 2022527909A JP 2022527909 A JP2022527909 A JP 2022527909A JP 7305046 B2 JP7305046 B2 JP 7305046B2
Authority
JP
Japan
Prior art keywords
image
array
classified
signal waveform
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022527909A
Other languages
English (en)
Other versions
JP2023522511A (ja
Inventor
張冬冬
Original Assignee
北京至真互聯網技術有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 北京至真互聯網技術有限公司 filed Critical 北京至真互聯網技術有限公司
Publication of JP2023522511A publication Critical patent/JP2023522511A/ja
Application granted granted Critical
Publication of JP7305046B2 publication Critical patent/JP7305046B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/86Arrangements for image or video recognition or understanding using pattern recognition or machine learning using syntactic or structural representations of the image or video pattern, e.g. symbolic string recognition; using graph matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/34Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Ophthalmology & Optometry (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Eye Examination Apparatus (AREA)

Description

本出願は、2021年03月26日に中国特許庁に提出された、出願番号202110322703.6、発明の名称が「画像分類方法及び装置並びに機器」である中国特許出願の優先権を主張し、その内容全体は参照により本出願に組み込まれる。
本発明は、画像分類・認識の技術分野に関し、特に画像分類方法及び装置並びに機器に関する。
通常、医用画像の記憶、伝送及び医師の診断、病気の経過の追跡等はすべて、患者の次元で実行される。複雑で様々な種類の画像が混在していることは、必然的に後続の様々なカテゴリの画像の仕分け、ファイリング及び研究に大きな迷惑をもたらす。関連技術では、画像認識モデル又は現在人気のある深層学習ネットワークモデルCNNを使用して画像分類を実施することができる。しかし、画像認識モデルを使用して画像を分類する場合に認識モデルを予め構築しておく必要がある。認識モデルの構築過程では、特徴抽出、特徴符号化、空間制約、分類器設計及びモデル融合等のいくつかの段階が必要であり、研究開発サイクルが長く、アルゴリズム設計者自身の専門的技能、アルゴリズム展開等に対する要求が高い。深層学習ネットワークモデルCNNを使用して画像分類を実施することで、労働力を解放し、迅速で効率的な自動仕分けを実施することができるが、初期段階でニューラルネットワークモデルを構築し、トレーニングデータセットをラベル付けし、モデルパラメータをトレーニングし、最適化する等には多くの時間がかかり、これらも高い技術的閾値及びハードウェア構成を必要とするため、従来の画像分類方法の再現性と汎化能力が低くなり、すぐに使用でき、迅速に複製し、様々な複雑で変わりやすい臨床医学の場面に普及させることは困難である。
これに基づいて、画像を迅速かつ正確に区別できるだけでなく、すぐに使用でき、迅速に複製し、様々な応用場面に適することもできる、画像分類方法及び装置並びに機器を提供する必要がある。
上記目的を達成するために、本発明は、以下の解決手段を提供する。
本出願の一態様によれば、
分類対象の画像を含む、分類対象の画像データセットを入力することと、
前記分類対象の画像の中心を基準中心点とし、特定領域を含むプリセットサイズの画像を標準画像として切り取ることと、
前記標準画像におけるいずれかの単一チャネルの画素値配列を選択し、前記画素値配列に基づいて、対応する信号波形図を描画することと、
前記信号波形図に基づいて前記分類対象の画像のカテゴリを決定することと、を含む、画像分類方法を提供する。
1つの可能な実施形態では、分類対象の画像データセットを入力した後、
画像サイズ及び/又は画像色に基づいて、前記画像データセットにおける分類対象の画像をフィルタリングする操作をさらに含む。
1つの可能な実施形態では、前記標準画像におけるいずれかの単一チャネルの画素値配列を選択し、前記画素値配列に基づいて、対応する信号波形図を描画することは、
前記標準画像におけるいずれかの単一チャネルの画素値配列を選択することと、
前記画素値配列における行画素配列と列画素配列に対してそれぞれ行圧縮と列圧縮を実行して、行画素圧縮配列と列画素圧縮配列を得ることと、
前記行画素圧縮配列と前記列画素圧縮配列に対して曲線平滑化処理を実行することと、
平滑化処理後の前記行画素圧縮配列と前記列画素圧縮配列に基づいて、対応する前記信号波形図を描画することと、を含む。
1つの可能な実施形態では、前記画素値配列における行画素配列と列画素配列に対してそれぞれ行圧縮と列圧縮を実行する場合、
y_row=img_r.sum(axis=0)#画素値行圧縮と、
y_col=img_r.sum(axis=1)#画素値列圧縮とを使用して実行し、
ここで、axisは、画素値の和の次元を表し、axis=0は、各行の画素値の和を表し、axis=1は、各列の画素値の和を表す。
1つの可能な実施形態では、前記行画素圧縮配列と前記列画素圧縮配列に対して曲線平滑化処理を実行した後、平滑化処理後の行画素圧縮配列と列画素圧縮配列に対して対数演算処理を実行する操作をさらに含む。
1つの可能な実施形態では、前記信号波形図に基づいて前記分類対象の画像のカテゴリを決定することは、
前記信号波形図における信号波形曲線における画素値変化率のパーセント、前記信号波形曲線における各ピークの尖度及び前記信号波形曲線における列振幅の行振幅に占めるパーセントのうちの少なくとも1つに基づいて、前記分類対象の画像のカテゴリを決定することを含む。
1つの可能な実施形態では、前記画素値配列に基づいて、対応する信号波形図を描画するとき、
ピーク属性に基づいて前記信号波形図における各ピークを検出し、前記信号波形図における各ピークの尖度を計算し、各ピークの尖度に基づいて前記信号波形図を処理することをさらに含み、
ここで、各ピークの尖度に基づいて前記信号波形図を処理することは、尖度が予め設定された尖度の最小閾値より小さいピークを除去する操作を含む。
1つの可能な実施形態では、
前記分類対象の画像を前処理し、前記分類対象の画像におけるラベル領域を位置決めし、位置決めされた前記ラベル領域の形状に基づいて前記分類対象の画像のカテゴリを決定することをさらに含む。
本出願の一態様によれば、データ入力モジュール、画像切り取りモジュール、波形図描画モジュール及び第1カテゴリ決定モジュールを含む、画像分類装置をさらに提供し、
前記データ入力モジュールは、分類対象の画像を含む、分類対象の画像データセットを入力するように配置され、
前記画像切り取りモジュールは、前記分類対象の画像の中心を基準中心点とし、特定領域を含むプリセットサイズの画像を標準画像として切り取るように配置され、
前記波形図描画モジュールは、前記標準画像におけるいずれかの単一チャネルの画素値配列を選択し、前記画素値配列に基づいて、対応する信号波形図を描画するように配置され、
前記第1カテゴリ決定モジュールは、前記信号波形図に基づいて、前記分類対象の画像のカテゴリを決定するように配置される。
本出願の別の態様によれば、
プロセッサと、
プロセッサ実行可能命令を記憶するためのメモリと、を含む、画像分類機器をさらに提供し、
そのうち、前記プロセッサは、前記実行可能命令を実行するときに前のいずれかに記載の方法を実施するように配置される。
分類対象の画像の特定領域を切り取った後、切り取って得られた標準画像からいずれかの単一チャネルの画素値配列を選択し、その後、選択された該単一チャネルの画素値配列に基づいて信号波形図を描画し、それにより分類対象の画像のカテゴリを区別するとき、描画して得られた信号波形図に基づいて区別する。関連技術における画像認識モデル及び深層学習ネットワークモデルCNN等の方法に比べて、様々な画像の分類を迅速、正確かつ効率的に完了できるだけでなく、分類対象の画像に対して上記処理を実行して、対応する信号波形図を生成するだけで済み、大量のサンプルデータを収集及びラベル付けする必要がなく、認識モデルをトレーニングする等の操作も必要がなく、これにより本出願の実施例による画像分類方法は、すぐに使用できる目的を達成することができ、サンプルデータに依存せず、様々な画像分類の応用場面により適し、最終的に画像分類方法の再現性と汎化能力を効果的に向上させることができる。
本発明の実施例又は従来技術における技術的解決手段をより明確に説明するために、以下に実施例に必要な図面を簡単に紹介し、以下に説明する図面は本発明のいくつかの実施例に過ぎず、当業者であれば、創造的な労力を要することなく、これらの図面に基づいて他の図面に想到し得る。
図1は、本出願の一実施例による画像分類方法のフローチャートである。 図2は、本出願の一実施例による画像分類方法の別のフローチャートである。 図3は、本出願の一実施例による画像分類方法における、画像色に基づいて画像データセットにおける分類対象の画像をフィルタリングするときに依拠するHSV色空間における異なる色の色相閾値分布図である。 図4は、本出願の一実施例による画像分類方法における、描画して得られた信号波形図における各ピークの尖度を検出する原理図である。 図5a及び図5bは、それぞれ、本出願の一実施例による画像分類方法における、最終的に描画して得られた眼底画像に対応する信号波形図及び外眼画像に対応する信号波形図である。 図6は、本出願の一実施例による画像分類方法における、位置決めされた瞳孔領域の形状に基づいて、分類対象の画像が外眼画像として検出されるときの効果図である。 図7は、本出願の一実施例による画像分類装置の構造ブロック図である。 図8は、本出願の一実施例による画像分類機器の構造ブロック図である。
以下に本発明の実施例における図面を参照して本発明の実施例における技術的解決手段を明確かつ完全に説明し、説明された実施例は、本発明の一部の実施例に過ぎず、すべての実施例ではない。本発明の実施例に基づき、当業者が創造的な労力を要さずに想到し得る他の実施例はすべて、本発明の技術的範囲に属する。
本発明の上記目的、特徴及び利点をより分かりやすくするために、以下に図面及び具体的な実施形態を参照して本発明をさらに詳細に説明する。
図1は、本出願の一実施例による画像分類方法のフローチャートを示す。図1に示すように、該方法は以下のステップを含む。分類対象の画像データセットを入力するステップS100。なお、画像データセットは複数枚の分類対象の画像を含み、これらの分類対象の画像のカテゴリは異なる。具体的には、眼部画像データについて、画像データセットは、OCT、眼部B超音波、グラフィックレポート、FFA画像、眼底カメラによって収集された眼底画像、外眼画像等の様々な画像を含むことができる。分類対象の画像の中心を基準中心点とし、特定領域を含むプリセットサイズの画像を標準画像として切り取るステップS200。さらにステップS300により、標準画像におけるいずれかの単一チャネルの画素値配列を選択し、画素値配列に基づいて、対応する信号波形図を描画する。最後に、ステップS400により、描画して得られた信号波形図に基づいて分類対象の画像のカテゴリを決定する。
これにより、本出願の実施例による画像分類方法では、分類対象の画像の特定領域を切り取った後、切り取って得られた標準画像からいずれかの単一チャネルの画素値配列を選択し、その後、選択された該単一チャネルの画素値配列に基づいて信号波形図を描画し、それにより分類対象の画像のカテゴリを区別するとき、描画して得られた信号波形図に基づいて区別する。関連技術における画像認識モデル及び深層学習ネットワークモデルCNN等の方法に比べて、様々な画像の分類を迅速、正確かつ効率的に完了できるだけでなく、分類対象の画像に対して上記処理を実行して、対応する信号波形図を生成するだけで済み、大量のサンプルデータを収集及びラベル付けする必要はなく、認識モデルをトレーニングする等の操作も必要がなく、これにより本出願の実施例による画像分類方法は、すぐに使用できる目的を達成することができ、サンプルデータに依存せず、様々な画像分類の応用場面により適し、最終的に画像分類方法の再現性と汎化能力を効果的に向上させることができる。
なお、分類対象の画像の中心を基準中心点とし、特定領域を含むプリセットサイズの画像を標準画像として切り取る場合、切り取られた特定領域は、画像データセットに含まれる分類対象の画像の属する大分類に関連付けられる。
つまり、画像データセットに含まれる分類対象の画像は複数枚であり、異なる分類対象の画像のカテゴリも異なるが、それらはすべて同じ大分類に属する。例えば、臨床医学画像を例に挙げると、画像データセットに含まれる分類対象の画像は眼部検出データという大分類に属するが、異なる分類対象の画像は眼部検出画像における異なる画像データに対応する。例えば、分類対象の画像は、眼底カメラによって収集された眼底画像、又は外眼画像であってもよく、分類対象の画像はさらに眼部B超音波、OCT、FFA等であってもよい。別の例として、画像データセットに含まれる分類対象の画像は胸部検出データという大分類に属する場合、含まれる分類対象の画像は胸部CT、胸部B超音波等のデータであってもよい。また、画像データセットにおける分類対象の画像は、他の応用分野で収集された画像データであってもよく、ここでは例を挙げてそれぞれ説明しない。
すなわち、画像データセットは、様々な応用場面で収集された様々な画像データであってもよい。しかし、なお、画像データセットにおける分類対象の画像はすべて、同じ応用場面で得られた様々な形式又は様々なカテゴリの画像データに属する。
同時に、分類対象の画像を切り取るとき、切り取られた特定領域は、画像データセットにおける各分類対象の画像が属する具体的な応用場面に応じて決定することができる。同様に、臨床医学画像における眼部検出データを例に挙げると、切り取られた特定領域は、瞳孔又は黄斑全体を含む領域である。同様に、プリセットサイズは、画像データセットにおける分類対象の画像が属する具体的な応用場面に応じて設定することもできる。異なる応用場面で設定されたプリセットサイズは異なる。
さらに、本出願の実施例による画像分類方法では、分類対象の画像データセットを入力した後、画像サイズ及び/又は画像色に基づいて、画像データセットにおける分類対象の画像をフィルタリングする操作をさらに含むことができる。なお、グラフィックスサイズ及び画像色という2つの情報に基づいて、画像データセットにおける分類対象の画像をフィルタリングする場合、その前後順序は実際の状況に応じて柔軟に設定することができる。
例えば、図2を参照すると、1つの可能な実施形態では、画像データセットが臨床医学の眼部データである場合、ステップS100により、分類対象の画像データセットを入力した後、最初にステップS021により、画像サイズに基づいて画像データセットにおける分類対象の画像をフィルタリングし、画像データセットにおけるOCT、眼部B超音波及びグラフィックレポート等の小さなサイズの画像データをフィルタリングすることができる。その後、ステップS022により、画像色に基づいて、フィルタリングされた画像データセットにおける残りの分類対象の画像を再度フィルタリングし、FFA画像等のデータを認識及びフィルタリングする。
より具体的には、画像色に基づいて画像データセットにおける残りの分類対象の画像を再度フィルタリングする場合、使用された色認識原理は、具体的には、「HSV色空間における様々な色の色相閾値分布」(図3を参照)に基づいて区別することができる。
これは、FFA画像が階調画像であり、眼底画像、外眼画像等がRGB3チャネルカラー画像であり、色認識を使用して3種類の画像をさらに細分化し、FFA画像をフィルタリングできるためである。そのうち、眼底画像と外眼画像の色度値はすべて、[‘red2’,‘red’,‘orange’]の色相区間内にある。
上記方法で画像データセットにおける分類対象の画像を事前にフィルタリング及び認識した後、ステップS200を実行でき、分類対象の画像の中心を基準中心点とし、特定領域を含むプリセットサイズの画像を標準画像として切り取る。ここで、上記によれば、特定領域の選択及びプリセットサイズの設定は、画像データセットが属する具体的な応用場面に応じて実行することができる。臨床医学の眼部画像データについて、切り取られた特定領域は、瞳孔又は黄斑全体を含む領域である。プリセットサイズは、辺長700pxに設定することができる。分類対象の画像を切り取ることにより、エッジノイズの干渉を除去でき、後続の操作を実行しやすい。
分類対象の画像を標準画像として切り取った後、ステップS300を実行でき、標準画像におけるいずれかの単一チャネルの画素値配列を選択し、画素値配列に基づいて、対応する信号波形図を描画する。なお、画像におけるいずれかの単一チャネルの画素値配列を選択して、対応する信号波形図を描画して生成する場合、現在認識及び区別されている分類対象の画像の地色に基づいて選択することができる。すなわち、本出願の実施例による画像分類方法では、選択された単一チャネルは、現在認識及び区別されている分類対象の画像の地色に近いチャネルである。
同様に、眼底画像データを例に挙げると、眼底画像の地色が黄色に近いため、標準画像における単一チャネルRの画素値配列を選択し、その後、選択されたRチャネルの画素値配列に基づいて信号波形図を描画することができる。
ここで、1つの可能な実施形態では、標準画像におけるいずれかの単一チャネルの画素値配列を選択し、画素値配列に基づいて、対応する信号波形図を描画することは、以下の方法で実施することができる。
すなわち、まず、標準画像におけるいずれかの単一チャネルの画素値配列を選択する。その後、画素値配列における行画素配列と列画素配列に対してそれぞれ行圧縮と列圧縮を実行して、行画素圧縮配列と列画素圧縮配列を得る。さらに、行画素圧縮配列と列画素圧縮配列におけるノイズ点を除去するために、行画素圧縮配列と列画素圧縮配列に対して曲線平滑化処理を実行する。最後に、平滑化処理後の行画素圧縮配列と列画素圧縮配列に基づいて、対応する信号波形図を描画する。
ここで、選択された標準画像のある単一チャネルの画素値配列に対してそれぞれ行圧縮と列圧縮を実行する場合、以下の式で計算して得ることができる。
y_row=img_r.sum(axis=0)#画素値行圧縮。
y_col=img_r.sum(axis=1)#画素値列圧縮。
ここで、axisは、画素値の和の次元を表し、axis=0は、各行の画素値の和を表し、axis=1は、各列の画素値の和を表す。
選択された単一チャネル画素値配列の行圧縮と列圧縮を完了した後、行画素圧縮配列と列画素圧縮配列に対して曲線平滑化処理を実行することができる。ここで、1つの可能な実施形態では、行画素圧縮配列と列画素圧縮配列におけるノイズ点を除去するために、cipy.signalライブラリにおけるsavgol_filterを呼び出して平滑化処理を実行することができる。
より具体的には、行画素圧縮配列と列画素圧縮配列に対して曲線平滑化フィルタリング処理を実行する場合の計算式は、
Figure 0007305046000001
である。
ここで、
Figure 0007305046000002
は、平滑化係数であり、
Figure 0007305046000003
は、フィルタウィンドウの幅(すなわち、測定点の総数)を表し、各測定点
Figure 0007305046000004
である。
さらに、行画素圧縮配列と列画素圧縮配列に対して平滑化処理を実行した後、平滑化処理後の行画素圧縮配列と列画素圧縮配列に対して対数演算処理を実行する操作をさらに含む。平滑化処理後の行画素圧縮配列と列画素圧縮配列に対してそれぞれ対数演算を実行することにより、データの絶対数値を縮小し、便利に計算できるだけでなく、データの性質と相関関係を変更せずに、変数のスケールを圧縮し、モデルの共線性、分散不均一性等も弱める。
上記により平滑化処理後の行画素圧縮配列と列画素圧縮配列を得た後、平滑化処理後の行画素圧縮配列と列画素圧縮配列に基づいて、対応する信号波形図を描画することができる。
1つの可能な実施形態では、圧縮画素値の信号波形図を描画するとき、matplotlib.pyplotライブラリにおけるplt.plot関数を直接呼び出して実施することができる。
選択された単一チャネル画素値の信号波形図を描画して生成した後、ステップS400を実行でき、信号波形図に基づいて分類対象の画像のカテゴリを決定する。
具体的には、信号波形図に基づいて分類対象の画像のカテゴリを決定する場合、描画された信号波形図に基づいて、信号波形曲線における画素値変化率のパーセント、信号波形曲線における各ピークの尖度及び信号波形曲線における列振幅の行振幅に占めるパーセントを得ることができ、その後、信号波形曲線における画素値変化率のパーセント、信号波形曲線における各ピークの尖度及び信号波形曲線における列振幅の行振幅に占めるパーセントのうちの少なくとも1つに基づいて、分類対象の画像のカテゴリを認識及び決定する。
より具体的には、本出願の一実施例による画像分類方法では、信号波形曲線における画素値変化率のパーセントは、描画された信号波形図に基づいて計算して得ることができる。その計算式は
Figure 0007305046000005
であり、ここで、deltaは、信号波形曲線における画素値変化率のパーセントであり、
Figure 0007305046000006
は、Savitzky-Golay平滑化フィルタリング後の最大画素値であり、
Figure 0007305046000007
は、Savitzky-Golay平滑化フィルタリング後の最小画素値である。
さらに、1つの可能な実施形態では、信号波形曲線における各ピークの尖度は以下の方法で実施することができる。
すなわち、まず、ピーク属性に基づいて信号波形図内の各ピークを検出する。具体的には、scipy.signalライブラリにおけるfind_peaksを直接呼び出す方法によって信号波形図のピーク検出を実施することができ、認識された同一周期内の各ピーク信号間の位置間隔はパラメータdistanceによって制御され、ピーク信号が満たす必要がある最小閾値
Figure 0007305046000008
は、
Figure 0007305046000009
を使用して計算される。
その後、検出されたピークごとに尖度を検出及び計算する。1つの可能な実施形態では、scipy.signalライブラリにおけるpeak_prominencesを呼び出す方法によって、信号波形図における各ピークの尖度を計算及び検出することができる。各ピークの尖度を計算及び検出した後、本出願の一実施例による画像分類方法では、信号波形図を後処理するために尖度が小さいピークを除去して、尖度が小さいピークが後続の波形認識に干渉することを避けることをさらに含む。すなわち、信号波形曲線における尖度が予め設定された尖度の最小閾値より小さいピークを除去して、最終的な信号波形図を得る。なお、予め設定された尖度の最小閾値の取り得る値の範囲は
Figure 0007305046000010
であってもよい。
ここで、尖度prominenceの基本原理は図4に示すとおりである。図4に示される垂直矢印は、それぞれ3つのピークに対応する尖度を示し、計算式は
Figure 0007305046000011
である。
次に、処理された信号波形図に基づいて、信号波形曲線における列振幅の行振幅に占めるパーセントを計算する。ここで、col振幅のrow振幅に占めるパーセントpercent_col_in_rowは、眼底画像と外眼画像を判定する基準の1つであり、検出された明らかなピーク信号を信号波形図に表示する。
ここで、図5a及び図5bを参照すると、それぞれ分類対象の画像が眼底画像である場合の対応する信号波形図及び分類対象の画像が外眼画像である場合の対応する信号波形図を示す。この2枚の信号波形図では、検出された明らかなピーク信号を波形図においてラベル付け及び表示する。
上記方法で対応する信号波形図を最終的に描画して生成した後、信号波形図から得られた信号波形曲線における画素値変化率のパーセント、信号波形曲線における各ピークの尖度及び信号波形曲線における列振幅の行振幅に占めるパーセントのうちの少なくとも1つに基づいて、分類対象の画像のカテゴリを決定することができる。
ここで、上記方法に基づいて分類対象の画像のカテゴリを認識及び決定する場合、信号波形曲線の単調性により、分類対象の画像が眼底画像であるか否かを最初に認識することもできる。信号波形曲線の単調性により、分類対象の画像が眼底画像に一致しないと認識された場合、前の3つの情報のうちの少なくとも1つに基づいて認識及び決定する。
すなわち、1つの可能な実施形態では、信号波形図における信号波形曲線が単調増加又は単調減少であるか否かを最初に判断することができる。信号波形曲線が単調増加又は単調減少であると判断された場合、分類対象の画像が眼底画像であると直接決定することができる。なお、信号波形曲線の単調性は、信号波形曲線の一次導関数が0以上(すなわち、≧0)であるか、又は0以下(すなわち、≦0)であるか否かを計算することによって判断することができる。信号波形曲線が0以上又は0以下であると計算された場合、信号波形曲線が単調増加又は単調減少であることを示し、したがって、該信号波形図に対応する分類対象の画像が眼底画像であると直接決定することができる。
信号波形曲線に単調性がないと判断された場合、すなわち、信号波形曲線が単調増加又は単調減少ではない場合、信号波形曲線における行方向と列方向の画素値変化率のパーセントdeltaが第1プリセット値より小さいか否か(a)、及び信号波形曲線における行方向と列方向には尖度が第2プリセット値より大きい明らかなピークがないか否か(b)を判断する。
信号波形曲線における行方向と列方向の画素値変化率のパーセントdeltaが第1プリセット値より小さく、信号波形曲線における行方向と列方向には尖度が第2プリセット値より大きい明らかなピークがないと判断された場合、該信号波形図に対応する分類対象の画像が眼底画像であると決定することができる。
そのうち、第1プリセット値と第2プリセット値の取り得る値は、実際の状況に応じて柔軟に設定することができる。すなわち、第1プリセット値と第2プリセット値の取り得る値は、現在認識しようとする画像のカテゴリ、具体的な応用場面及び応用ニーズ等の要因に応じて設定することができる。1つの可能な実施形態では、現在認識及び決定しようとする画像のカテゴリが眼底画像又は外眼画像である場合、第1プリセット値の取り得る値は6%であってもよく、第2プリセット値の取り得る値は0.02であってもよい。
描画して生成された信号波形図がいずれも上記条件を満たさない場合、信号波形図の信号波形曲線におけるcol振幅のrow振幅に占めるパーセントpercent_col_in_rowが第3プリセット値を超えるか否か、及び信号波形曲線における行方向と列方向に沿う画素値変化率のパーセントdeltaの少なくとも1つが第4プリセット値より小さいか否かを判断する。
信号波形曲線におけるcol振幅のrow振幅に占めるパーセントpercent_col_in_rowが第3プリセット値を超え、且つ信号波形曲線における行方向と列方向に沿う画素値変化率のパーセントdeltaの少なくとも1つが第4プリセット値より小さいと判断された場合、該信号波形図に対応する分類対象の画像が外眼画像であると判定することができる。
そのうち、第3プリセット値と第4プリセット値の取り得る値は、同様に現在認識しようとする画像のカテゴリ、具体的な応用場面及び応用ニーズ等の要因に応じて設定することができる。1つの可能な実施形態では、現在認識及び決定しようとする画像のカテゴリが眼底画像又は外眼画像である場合、第3プリセット値の取り得る値は40%であってもよく、第4プリセット値の取り得る値は6%であってもよい。
また、1つの可能な実施形態では、信号波形曲線におけるcol振幅のrow振幅に占めるパーセントpercent_col_in_rowが第5プリセット値より小さいと判断された場合、該信号波形図に対応する分類対象の画像が眼底画像であると直接決定することができる。ここで、第5プリセット値の取り得る値は30%であってもよい。第5プリセット値の取り得る値は、実際の状況における認識しようとする画像のカテゴリ、具体的な応用場面及び応用ニーズ等の要因に応じてテスト及び選択することもでき、ここでは具体的に限定しない。
さらに、画像データセットには、通常、複数枚の分類対象の画像を含むため、前のいずれかの方法で各分類対象の画像のカテゴリを認識及び決定するとき、直接認識できない分類対象の画像がまだ存在する場合、本出願の実施例による画像分類方法では、図2を参照すると、分類対象の画像を前処理し、分類対象の画像におけるラベル領域を位置決めし、位置決めされたラベル領域の形状に基づいて分類対象の画像のカテゴリを決定するステップS500をさらに含む。なお、ラベル領域は、分類対象の画像の属性を特徴付けるためのラベル位置である。ここで、分類対象の画像の属性が画像の属するカテゴリであることは、当業者に理解できる。
例えば、画像データセットが臨床医学の眼部画像である場合、ラベル領域は瞳孔領域を指す。画像データセットが他の画像である場合、ラベル領域は、該画像が属するカテゴリを特徴付けることができる代表的な位置である。ここでは例を挙げてそれぞれ説明しない。
ここで、分類対象の画像を前処理し、分類対象の画像におけるラベル領域を位置決めし、位置決めされたラベル領域の形状に基づいて分類対象の画像のカテゴリを決定する場合、具体的には、以下の方法で実施することができる。
分類対象の画像を前処理することは、分類対象の画像をトリミングし、分類対象の画像を標準画像にトリミングすることを含む。ここで、トリミング方法は前記切り取り方法を直接使用することができ、これにより、分類対象の画像の中心を基準中心点とし、特定領域を含むプリセットサイズの画像を切り取った標準画像を直接読み取ることができる。
その後、標準画像を前処理し、白黒2値画像を得る。具体的には、1つの可能な実施形態では、標準画像に対する前処理は、
フィルタリング、階調変換、2値化等の処理を含むことができる。すなわち、前処理操作は、具体的には、以下のとおりである。標準画像に対してガウスフィルタリングを実行し、一部のノイズ点を除去し、ここで、cv2.GaussianBlurを使用してガウスフィルタリングを実行することができ、ガウスカーネルサイズは(5,5)を選択する。
フィルタリングされた元の標準画像を階調画像に変換し、ここで、cv2.cvtColorcを使用して階調変換を実行することができる。
変換して得られた階調画像を2値化し、例えば、cv2.thresholdを使用して階調画像の2値化を実施することができる。
上記いずれかの方法で標準画像に対する前処理を実施した後、以下のステップを実行する。2値画像における各連通領域を検出するステップ。ここで、1つの可能な実施形態では、前処理後の2値化画像に対して順に閉演算、開演算を実行し、孤立したノイズ点をフィルタリングし、その後、2値化画像における密な画素点で形成された連通領域を認識する。ここで、1つの可能な実施形態では、cv2.morphologyExを使用して、2値化画像における密な画素点で形成された連通領域の正確な認識を実施することができる。
次に、検出された連通領域から面積が最大の連通領域を選択して画像の最適な適応トリミングサイズを決定し、さらに決定された最適な適応トリミングサイズに応じて2値化画像に対応するサイズの矩形ボックスを描画するステップ。該過程は、cv2.contourAreaを使用して連通領域の面積を計算することができる。ここで、選択された連通領域の面積は20000より大きく、連通領域と2値化画像のエッジ輪郭との許容誤差面積は2000個の画素点より大きくなければならない。
その後、ノイズ干渉を除去し、瞳孔位置を位置決めする操作を実行するステップ。ここで、ノイズ干渉を除去するとき、cv2.getStructuringElement方法を使用して2値画像周囲のノイズ干渉を除去することができ、瞳孔位置の位置決めはcv2.morphologyExによって完了することができる。なお、本出願の一実施例による画像分類方法では、瞳孔中心の位置は[200px,660px]の区間範囲内に設定することができる。
上記方法で現在認識及び区別されている分類対象の画像のラベル領域を位置決めすることができる。ラベル領域を位置決めした後、位置決めされたラベル領域の形状に基づいて分類対象の画像のカテゴリを判定することができる。
具体的には、cv2.fitEllipseによって楕円検出を実行し、眼底画像、外眼画像の分類を完了することができる。図6を参照すると、標準画像で短軸半径が指定された区間範囲内の楕円構造として検出された場合、該画像は外眼画像であると判定する。ここで、1つの可能な実施形態では、外眼画像について、その瞳孔の短軸半径の指定された区間範囲は[82px,700px]であってもよい。
これにより、本出願の実施例による画像分類方法は、信号波形図に基づいて画像データセットにおける分類対象の画像を認識及び決定する過程で、同時に画像におけるラベル領域の形状を組み合わせて決定することにより、画像データセットにおける93.7%の画像の区別を実現することができ、これにより画像分類の精度を大幅に向上させ、様々な目の位置、様々な目の形、様々な病巣、様々な撮影画角及び様々な露出度と飽和度等の応用場面で収集された様々な画像を正確に区別及び認識することができ、画像分類方法の柔軟性及びロバスト性も効果的に向上させる。
それに対応して、前のいずれかに記載の画像分類方法に基づいて、本出願は、画像分類装置をさらに提供する。本出願が提供する画像分類装置の動作原理は、本出願の画像分類方法の原理と同じ又は類似しているため、重複する説明は省略する。
図7を参照すると、本出願が提供する画像分類装置100は、データ入力モジュール110、画像切り取りモジュール120、波形図描画モジュール130及び第1カテゴリ決定モジュール140を含む。そのうち、データ入力モジュール110は、分類対象の画像を含む分類対象の画像データセットを入力するように配置される。画像切り取りモジュール120は、分類対象の画像の中心を基準中心点とし、特定領域を含むプリセットサイズの画像を標準画像として切り取るように配置される。波形図描画モジュール130は、標準画像におけるいずれかの単一チャネルの画素値配列を選択し、画素値配列に基づいて、対応する信号波形図を描画するように配置される。第1カテゴリ決定モジュール140は、信号波形図に基づいて分類対象の画像のカテゴリを決定するように配置される。
1つの可能な実施形態では、第2カテゴリ決定モジュール(図示せず)をさらに含む。ここで、第2カテゴリ決定モジュールは、分類対象の画像を前処理し、分類対象の画像におけるラベル領域を位置決めし、位置決めされたラベル領域の形状に基づいて分類対象の画像のカテゴリを決定するように配置される。
さらに、本出願の別の態様によれば、画像分類機器200をさらに提供する。図8を参照すると、本出願の実施例による画像分類機器200は、プロセッサ210及びプロセッサ210によって実行可能な命令を記憶するためのメモリ220を含む。そのうち、プロセッサ210は、実行可能命令を実行するときに前のいずれかに記載の画像分類方法を実施するように配置される。
なお、プロセッサ210の数は1つ又は複数であってもよい。同時に、本発明の実施例による画像分類機器200は、入力装置230及び出力装置240をさらに含むことができる。そのうち、プロセッサ210、メモリ220、入力装置230及び出力装置240は、バスを介して接続されてもよく、他の方法で接続されてもよく、ここでは具体的に限定しない。
メモリ220は、コンピュータ可読記憶媒体として、ソフトウェアプログラム、コンピュータ実行可能プログラム及び様々なモジュール、例えば本出願の実施例による画像分類方法に対応するプログラム又はモジュールを記憶するために使用することができる。プロセッサ210は、メモリ220に記憶されたソフトウェアプログラム又はモジュールを実行することにより、画像分類機器200の様々な機能アプリケーション及びデータ処理を実行する。
入力装置230は、入力されたデジタルまたは信号を受信するために使用することができる。そのうち、信号は、機器/端末/サーバのユーザ設定及び機能制御に関連するキー信号であってもよい。出力装置240は、表示画面等の表示機器を含むことができる。
本明細書における各実施例は漸進的に説明され、各実施例は他の実施例との相違点を重点的に説明し、各実施例の間の同じ又は類似の部分は互いに参照することができる。実施例に開示されたシステムについては、実施例に開示された方法に対応するため、説明が簡単であり、関連する部分は方法部分の説明を参照することができる。
本明細書において具体的な例を使用して本発明の原理及び実施形態を説明したが、以上の実施例の説明は本発明の方法及びその中核思想の理解を助けるためのものに過ぎず、それとともに、当業者であれば、本発明の思想に基づいて具体的な実施形態及び応用範囲を変更可能である。要約すると、本明細書の内容は本発明に対する制限として理解されるべきではない。

Claims (10)

  1. 分類対象の画像を含む、分類対象の画像データセットを入力することと、
    前記分類対象の画像の中心を基準中心点とし、特定領域を含むプリセットサイズの画像を標準画像として切り取ることと、
    前記標準画像におけるいずれかの単一チャネルの画素値配列を選択し、前記画素値配列に基づいて、対応する信号波形図を描画することと、
    前記信号波形図に基づいて前記分類対象の画像のカテゴリを決定することと、を含むことを特徴とする画像分類方法。
  2. 分類対象の画像データセットを入力した後、
    画像サイズ及び/又は画像色に基づいて前記画像データセットにおける分類対象の画像をフィルタリングする操作をさらに含むことを特徴とする請求項1に記載の方法。
  3. 前記標準画像におけるいずれかの単一チャネルの画素値配列を選択し、前記画素値配列に基づいて、対応する信号波形図を描画することは、
    前記標準画像におけるいずれかの単一チャネルの画素値配列を選択することと、
    前記画素値配列における行画素配列と列画素配列に対してそれぞれ行圧縮と列圧縮を実行して、行画素圧縮配列と列画素圧縮配列を得ることと、
    前記行画素圧縮配列と前記列画素圧縮配列に対して曲線平滑化処理を実行することと、
    平滑化処理後の前記行画素圧縮配列と前記列画素圧縮配列に基づいて、対応する前記信号波形図を描画することと、を含むことを特徴とする請求項1に記載の方法。
  4. 前記画素値配列における行画素配列と列画素配列に対してそれぞれ行圧縮と列圧縮を実行する場合、
    y_row=img_r.sum(axis=0)#画素値行圧縮と、
    y_col=img_r.sum(axis=1)#画素値列圧縮とを使用して実行し、
    ここで、axisは、画素値の和の次元を表し、axis=0は、各行の画素値の和を表し、axis=1は、各列の画素値の和を表すことを特徴とする請求項3に記載の方法。
  5. 前記行画素圧縮配列と前記列画素圧縮配列に対して曲線平滑化処理を実行した後、平滑化処理後の行画素圧縮配列と列画素圧縮配列に対して対数演算処理を実行する操作をさらに含むことを特徴とする請求項3に記載の方法。
  6. 前記信号波形図に基づいて前記分類対象の画像のカテゴリを決定することは、
    前記信号波形図における信号波形曲線における画素値変化率のパーセント、前記信号波形曲線における各ピークの尖度及び前記信号波形曲線における列振幅の行振幅に占めるパーセントのうちの少なくとも1つに基づいて、前記分類対象の画像のカテゴリを決定することを含むことを特徴とする請求項1~5のいずれか一項に記載の方法。
  7. 前記画素値配列に基づいて、対応する信号波形図を描画するとき、
    ピーク属性に基づいて前記信号波形図における各ピークを検出し、前記信号波形図における各ピークの尖度を計算し、各ピークの尖度に基づいて前記信号波形図を処理することをさらに含み、
    ここで、各ピークの尖度に基づいて前記信号波形図を処理することは、尖度が予め設定された尖度の最小閾値より小さいピークを除去する操作を含むことを特徴とする請求項1又は3に記載の方法。
  8. 前記分類対象の画像を前処理し、前記分類対象の画像におけるラベル領域を位置決めし、位置決めされた前記ラベル領域の形状に基づいて前記分類対象の画像のカテゴリを決定することをさらに含む請求項1~5のいずれか一項に記載の方法。
  9. データ入力モジュール、画像切り取りモジュール、波形図描画モジュール及び第1カテゴリ決定モジュールを含み、
    前記データ入力モジュールは、分類対象の画像を含む、分類対象の画像データセットを入力するように配置され、
    前記画像切り取りモジュールは、前記分類対象の画像の中心を基準中心点とし、特定領域を含むプリセットサイズの画像を標準画像として切り取るように配置され、
    前記波形図描画モジュールは、前記標準画像におけるいずれかの単一チャネルの画素値配列を選択し、前記画素値配列に基づいて、対応する信号波形図を描画するように配置され、
    前記第1カテゴリ決定モジュールは、前記信号波形図に基づいて、前記分類対象の画像のカテゴリを決定するように配置されることを特徴とする画像分類装置。
  10. プロセッサと、
    プロセッサ実行可能命令を記憶するためのメモリと、を含み、
    そのうち、前記プロセッサは、前記実行可能命令を実行するときに請求項1~8のいずれか一項に記載の方法を実施するように配置されることを特徴とする画像分類機器。
JP2022527909A 2021-03-26 2021-08-17 画像分類方法及び装置並びに機器 Active JP7305046B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202110322703.6A CN112801049B (zh) 2021-03-26 2021-03-26 图像分类方法和装置及设备
CN202110322703.6 2021-03-26
PCT/CN2021/112932 WO2022198898A1 (zh) 2021-03-26 2021-08-17 图像分类方法和装置及设备

Publications (2)

Publication Number Publication Date
JP2023522511A JP2023522511A (ja) 2023-05-31
JP7305046B2 true JP7305046B2 (ja) 2023-07-07

Family

ID=75815763

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022527909A Active JP7305046B2 (ja) 2021-03-26 2021-08-17 画像分類方法及び装置並びに機器

Country Status (4)

Country Link
US (1) US20240046632A1 (ja)
JP (1) JP7305046B2 (ja)
CN (1) CN112801049B (ja)
WO (1) WO2022198898A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7368656B2 (ja) 2021-09-30 2023-10-24 旭化成ワッカーシリコーン株式会社 熱伝導性シリコーン組成物および該組成物を使用するギャップフィラーの製造方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112801049B (zh) * 2021-03-26 2021-07-23 北京至真互联网技术有限公司 图像分类方法和装置及设备
CN116320459B (zh) * 2023-01-08 2024-01-23 南阳理工学院 一种基于人工智能的计算机网络通信数据处理方法及系统
CN116071725B (zh) * 2023-03-06 2023-08-08 四川蜀道新能源科技发展有限公司 一种路面标线识别方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080085048A1 (en) 2006-10-05 2008-04-10 Department Of The Navy Robotic gesture recognition system
CN106446936A (zh) 2016-09-06 2017-02-22 哈尔滨工业大学 基于卷积神经网络的空谱联合数据转波形图的高光谱数据分类方法
CN108596169A (zh) 2018-03-12 2018-09-28 北京建筑大学 基于视频流图像的分块信号转换与目标检测方法及装置
CN108921076A (zh) 2018-09-21 2018-11-30 南京信息工程大学 基于图像的道面裂缝病害自适应恒虚警检测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109359693A (zh) * 2018-10-24 2019-02-19 国网上海市电力公司 一种电能质量扰动分类方法
CN111814564B (zh) * 2020-06-09 2024-07-12 广州视源电子科技股份有限公司 基于多光谱图像的活体检测方法、装置、设备和存储介质
CN112801049B (zh) * 2021-03-26 2021-07-23 北京至真互联网技术有限公司 图像分类方法和装置及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080085048A1 (en) 2006-10-05 2008-04-10 Department Of The Navy Robotic gesture recognition system
CN106446936A (zh) 2016-09-06 2017-02-22 哈尔滨工业大学 基于卷积神经网络的空谱联合数据转波形图的高光谱数据分类方法
CN108596169A (zh) 2018-03-12 2018-09-28 北京建筑大学 基于视频流图像的分块信号转换与目标检测方法及装置
CN108921076A (zh) 2018-09-21 2018-11-30 南京信息工程大学 基于图像的道面裂缝病害自适应恒虚警检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7368656B2 (ja) 2021-09-30 2023-10-24 旭化成ワッカーシリコーン株式会社 熱伝導性シリコーン組成物および該組成物を使用するギャップフィラーの製造方法

Also Published As

Publication number Publication date
CN112801049A (zh) 2021-05-14
US20240046632A1 (en) 2024-02-08
CN112801049B (zh) 2021-07-23
JP2023522511A (ja) 2023-05-31
WO2022198898A1 (zh) 2022-09-29

Similar Documents

Publication Publication Date Title
JP7305046B2 (ja) 画像分類方法及び装置並びに機器
CN110120040B (zh) 切片图像处理方法、装置、计算机设备和存储介质
Shoieb et al. Computer-aided model for skin diagnosis using deep learning
CN109978890B (zh) 基于图像处理的目标提取方法、装置及终端设备
EP2888718B1 (en) Methods and systems for automatic location of optic structures in an image of an eye, and for automatic retina cup-to-disc ratio computation
Liu et al. A framework of wound segmentation based on deep convolutional networks
CN109154978A (zh) 用于检测植物疾病的系统和方法
EP2323418A1 (en) Image processing apparatus, method and program
Raffei et al. A low lighting or contrast ratio visible iris recognition using iso-contrast limited adaptive histogram equalization
CN110879982A (zh) 一种人群计数系统及方法
CN110880177A (zh) 一种图像识别方法及装置
Guo et al. EMFN: enhanced multi-feature fusion network for hard exudate detection in fundus images
CN113344894A (zh) 眼底豹纹斑特征提取及特征指数确定的方法和装置
CN116758336A (zh) 一种基于人工智能的医学图像智能分析系统
Chayadevi et al. Usage of art for automatic malaria parasite identification based on fractal features
Abusham Image Processing Technique for the Detection of Alberseem Leaves Diseases Based on Soft Computing
Badeka et al. Evaluation of LBP variants in retinal blood vessels segmentation using machine learning
Fondón et al. Automatic optic cup segmentation algorithm for retinal fundus images based on random forest classifier
CN112669273A (zh) 眼底图像中玻璃膜疣自动分割方法、装置及可读存储介质
KR102430946B1 (ko) 소장 정결도를 진단하는 시스템 및 방법
CN112288697A (zh) 用于量化异常程度的方法、装置、电子设备及可读存储介质
Roy et al. Detection of retinal microaneurysms using fractal analysis and feature extraction technique
Zhou et al. Automatic fovea center localization in retinal images using saliency-guided object discovery and feature extraction
Reza et al. Automatic detection of optic disc in fundus images by curve operator
CN115100178A (zh) 一种眼底血管形态特征评估的方法、装置、介质和设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20220623

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220510

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20220623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230613

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230627

R150 Certificate of patent or registration of utility model

Ref document number: 7305046

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150