JP7344692B2 - 情報処理装置及び情報処理方法及びプログラム - Google Patents

情報処理装置及び情報処理方法及びプログラム Download PDF

Info

Publication number
JP7344692B2
JP7344692B2 JP2019134801A JP2019134801A JP7344692B2 JP 7344692 B2 JP7344692 B2 JP 7344692B2 JP 2019134801 A JP2019134801 A JP 2019134801A JP 2019134801 A JP2019134801 A JP 2019134801A JP 7344692 B2 JP7344692 B2 JP 7344692B2
Authority
JP
Japan
Prior art keywords
image
recognition
coordinates
information processing
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019134801A
Other languages
English (en)
Other versions
JP2021018676A (ja
Inventor
彰市 星野
敦史 野上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019134801A priority Critical patent/JP7344692B2/ja
Priority to PCT/JP2020/022820 priority patent/WO2021014807A1/ja
Publication of JP2021018676A publication Critical patent/JP2021018676A/ja
Priority to US17/575,672 priority patent/US12106460B2/en
Application granted granted Critical
Publication of JP7344692B2 publication Critical patent/JP7344692B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B11/00Measuring arrangements characterised by the use of optical techniques
    • G01B11/30Measuring arrangements characterised by the use of optical techniques for measuring roughness or irregularity of surfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30132Masonry; Concrete

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Length Measuring Devices By Optical Means (AREA)
  • Image Processing (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)

Description

本発明は、画像の認識技術に関するものである。
橋梁などの構造物壁面の点検や、部品や製品外装の外観検査等では、検査対象を撮影した画像を用いた画像点検が行われている。画像点検では、調査技術者が、画像を元にひび割れや欠陥などの変状の位置や形状等を入力し、画像と変状情報を対応付けて記録する。特許文献1には、構造物壁面の画像と図面データを対応付けて表示し、変状の入力を行うシステムが提案されている。特許文献1のように、図面と、壁面画像と、壁面の変状情報を関連付けることにより、点検結果の管理や閲覧が容易になる。
画像上で、ひび割れなどの微細な変状を確認するためには、十分に高い解像度で撮影した画像を用いる必要がある。その結果、構造物全体の画像のデータ量は、非常に大きなサイズとなるため、変状入力作業のコストが高い。その作業効率化のため、近年、壁面画像から変状を認識する技術が提案されている。
特開2005-310044号公報 特許第6099479号公報 特開2017-227595号公報
しかし、情報処理装置のメモリ等の制約により、認識処理を実行可能な画像サイズには上限がある。従って、構造物全体の大きな画像に対して、一度に変状の認識処理を実行することは難しい。
本発明は、かかる問題に鑑み成されたものであり、部分画像の認識を行い、各部分画像の認識結果を画像全体に対応付けて管理する技術を提供しようとするものである。
この課題を解決するため、例えば本発明の情報処理装置は以下の構成を備える。すなわち、
グローバル座標に対応付けられた第一の画像から、当該第一の画像の一部である部分画像を第二の画像として作成する画像作成手段と、
前記第二の画像に対し、予め設定された特徴についての認識処理を実行し、前記第二の画像に関するローカル座標に対応付けた認識結果を作成する認識処理手段と、
前記認識結果の座標を前記ローカル座標から前記グローバル座標に変換する座標変換手段とを備える。
本発明によれば、部分画像の認識を行い、各部分画像の認識結果を画像全体に対応付けて管理することができるようになる。
実施形態の概要を説明するための図。 実施形態の装置のハードウェア構成図と機能ブロック図。 グローバル座標と第一の画像を説明するための図。 実施形態における処理手順を示すフローチャート。 実施形態における第二の画像を作成する例を説明するための図。 第二の画像を作成する例を説明する図。 第二の画像とグローバル座標との関係を示す図。 第二の画像に対する認識結果を説明するための図。 画像と認識結果を図面に対応づけて管理する例を説明するための図。 第2の実施形態の機能ブロック図。 第2の実施形態の処理手順を示すフローチャート。 認識結果を合成する処理を説明するための図。 認識結果を合成する処理を説明するための図。 第3の実施形態の機能ブロック図。 第3の実施形態の処理手順を示すフローチャート。 第二の画像に対する解像度変換処理を説明するための図。 第4の実施形態の機能ブロック図。 第4の実施形態の処理手順を示すフローチャート。 3次元図面から第二の画像を作成する処理を説明する図。
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものでない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
[第1の実施形態]
第1の実施形態として、検査対象の全体画像に対して認識を行い、認識結果を図面と対応付けて管理する処理の例を説明する。特に本実施形態では、橋梁などの構造物の経年劣化を点検するようないわゆるインフラ点検を行うため情報処理システムを例に説明する。
この課題を解決するため、例えば本発明の情報処理装置は以下の構成を備える。すなわち、
グローバル座標に対応付けられた第一の画像から、当該第一の画像の一部である部分画像を第二の画像として作成する第一の画像作成手段と、
前記第二の画像に対し、予め設定された特徴についての認識処理を実行し、前記第二の画像に関するローカル座標に対応付けた認識結果を作成する認識処理手段と、
前記認識結果の座標を前記ローカル座標から前記グローバル座標に変換する座標変換手段と
複数の前記認識結果に基づいて、第一の画像から第二の部分画像を作成する第二の画像作成手段とを備える。
インフラ構造物の壁面の点検では、点検者は、コンクリート壁面のひび割れ等の変状を記録する。画像を用いた点検では、点検者は、構造物の壁面を撮影し、撮影した画像の中から、変状の位置や範囲を記録することにより点検結果を作成する。作成した点検結果は、画像とともに構造物の図面に対応づけて管理する。このとき、画像の中から、全ての変状を発見、記録する作業は大変な作業となる。従って、機械による認識処理により、画像から自動的に変状を識別することが好ましい。
構造物画像は高解像で撮影するため、画像サイズは非常に大きくなる。一方で、情報処理装置のメモリ等の制約により、認識処理を実行可能な画像サイズには上限がある。そのため、大きなサイズの画像に対して一度に認識処理を実行することは難しい。そこで、本実施形態では、構造物画像から認識処理に適した部分画像ごとに認識処理を実行し、認識結果を取得する。取得した認識結果を、元の図面にマッピングする。これにより、構造物図面に対応づけられた認識結果を取得し、図面で管理することができる。本実施形態における主な処理の流れを図1に示す。
図1(a)は、図面100に、インフラ構造物の例として、橋梁の床版を撮影した画像101を張り付けた状態を示している。画像101は、高解像度で撮影した画像のため、サイズが非常に大きく(画素数が非常に多く)、このままでは認識処理を実行することは難しい。そこで、まず、認識処理を実行可能なサイズの部分画像を作成する。部分画像を作成する方法として、例えば、元の構造物画像を、認識処理を実行可能なサイズに分割する。図1(b)は、画像101を、認識処理を実行可能なサイズに分割した、部分画像111、112、113、114を示している。次に、部分画像111、112、113、114の中から、認識処理を実行する部分画像を1つ指定する。選択順番は特に問わない。例えば、分割前の画像101のうち、左下に位置する部分画像113を選択する。そして、選択した部分画像113に対して、認識処理を行い、ひび割れ等の認識結果を取得する。図1(c)は、部分画像113に対して認識処理を行い、取得した認識結果121を重畳している状態を示している。その後、認識結果を図面に戻す処理を行う。図1(d)は、図面100上に、画像101と認識結果121を張り付けた状態を示している。構造物画像全体に対して、網羅的に認識結果を取得する場合には、部分画像の作成位置を変更しながら、認識処理を繰り返し実行する。このように、構造物を撮影した画像が非常に大きく、そのままでは認識処理を実行することが難しい場合であっても、認識処理を実行し、図面に対応づけられた認識結果を取得、管理することができる。
<情報処理装置>
図2(a)は、本実施形態に係る情報処理装置200のハードウェア構成図である。図2(a)に示すように、情報処理装置200は、CPU201と、ROM202と、RAM203と、HDD204と、表示部205と、操作部206と、通信部207とを有している。CPU201は、中央演算装置(Central Processing Unit)であり、各種処理のための演算や論理判断等を行い、システムバス208に接続された各構成要素を制御する。ROM(Read-Only Memory)202は、プログラムメモリであって、後述する各種処理手順を含むCPU201による制御のためのプログラムを保持する。RAM(Random Access Memory)203は、CPU201の主メモリ、ワークエリア等の一時記憶領域として用いられる。尚、情報処理装置200に接続された外部記憶装置等からRAM203にプログラムをロードすることで、プログラムメモリを実現しても構わない。
HDD204は、本実施形態に係る電子データやプログラムを記憶しておくためのハードディスクである。同様の役割を果たすものとして外部記憶装置を用いてもよい。ここで、外部記憶装置は、例えば、メディア(記録媒体)と、当該メディアへのアクセスを実現するための外部記憶ドライブとで実現することができる。このようなメディアとしては、例えば、フレキシブルディスク(FD)、CD-ROM、DVD、USBメモリ、MO、フラッシュメモリ等が知られている。また、外部記憶装置は、ネットワークで接続されたサーバ装置等であってもよい。
表示部205は、例えばCRTディスプレイや、液晶ディスプレイ等であって、表示画面に画像を出力するデバイスである。なお表示部205は、情報処理装置200と有線あるいは無線で接続された外部デバイスでも構わない。操作部206は、キーボードやマウスを有し、ユーザによる各種操作を受け付ける。通信部207は、公知の通信技術により、他の情報処理装置や通信機器、外部記憶装置等との間で、有線又は無線による双方向の通信を行う。
<機能ブロック図>
図2(b)は、情報処理装置200の機能構成を示すブロック図の一例である。これらの各機能部は、CPU201が、ROM202に格納されたプログラムをRAM203に展開し、後述する各フローチャートに従った処理を実行することで実現されている。そして、各処理の実行結果をRAM203に保持する。また例えば、CPU201を用いたソフトウェア処理の代替としてハードウェアを構成する場合には、ここで説明する各機能部の処理に対応させた演算部や回路を構成すればよい。
データ管理部221は、記憶部225(HDD204に対応するものとする)に記憶された、グローバル座標に対応づけられた第一の画像および認識結果を管理する。画像作成部222は、第一の画像から第二の画像を作成し、合わせて、第二の画像とグローバル座標の関係を作成する。認識処理部223は、学習済みモデルを用いて、第二の画像に対して認識処理を実行し、第二の画像のローカル座標系で認識結果を作成する。座標変換部224は、認識結果をローカル座標からグローバル座標に変換する処理を行う。グローバル座標に変換した認識結果は、データ管理部221が、記憶部225へ記憶する。
<グローバル座標と第一の画像との関係>
本実施形態を説明するにあたって、グローバル座標と第一の画像について説明する。
画像点検において、構造物壁面を撮影した画像は、図面と対応づけて管理することが好ましい。図3(a)は、インフラ構造物の1つの例として、橋梁の壁面を撮影した画像301、302、303を、図面300へ張り付けた状態を示している。ここで画像301は、橋梁の床版を撮影した画像304と画像305を並べて連結した画像であり、画像302および画像303は、橋脚を撮影した個々の画像である。図面300は、点310を原点とした図面座標321をもつ。本実施形態では、図面座標321をグローバル座標と呼び、画像301、302、303を第一の画像とよぶ。第一の画像のグローバル座標上の位置は、画像左上の頂点座標で定義される。例えば、画像301の座標は、頂点311の位置(Xg1、Yg1)である。第一の画像は、座標情報とともに、記憶部225に記憶されている。
インフラ構造物の画像点検で使用する画像は、微細なひび割れなどを確認できるよう高解像度(例:1画素あたり1mm)で撮影するため、そのサイズが非常に大きい。例えば、図3(a)の画像301が、水平方向20m、垂直方向5mの橋梁の床版を撮影した画像であるとする。この場合、画像解像度が1画素あたり1mm(1mm/pixel)の場合、画像301の画像サイズは20,000pixel × 5,000pixelとなる。大きなサイズの画像読み出しには時間がかかるため、例えば、読み出し処理を並列化するために、図3(b)のように、第一の画像をあらかじめ分割して記憶してもよい。図3(b)の画像302は、壁面画像を一定サイズで分割した分割画像322、323、324、325を図面300上で並べた状態を示している。第一の画像を分割して記憶する場合には、分割画像ごとにグローバル座標上の位置座標を記憶しておく必要がある。
<フローチャート>
図4は、本実施形態における情報処理装置のメイン処理の流れを表すフローチャートである。以下、各工程(ステップ)は、それら符号の先頭にはSを付与して説明することとする。本実施形態では、第一の画像は、図面に対応付けられた構造物全体の画像(以下、全体画像)とし、グローバル座標は、構造物の図面座標とする。第二の画像は、第一の画像から作成する部分画像とし、ローカル座標は、部分画像に対応する画像座標とする。本実施形態では、操作部206が、認識処理開始の入力を受け付けて、図4のフローチャートの処理を開始する。そして、認識結果の記憶が完了したら、処理が終了する。
<第二の画像の作成>
まず、S401において、画像作成部222が、第一の画像から第二の画像を作成する。第二の画像は、第一の画像のうち、認識に適した範囲を指定した部分画像であり、画像作成部222は、この範囲を決定する処理を実行する。認識に適した範囲を決定する方法として、例えば、情報処理装置のメモリ等の制約に基づいて決定する方法がある。本実施形態では、後述するS403において、認識処理部223が、認識処理を実行する画像をRAM203に読み出し、認識処理を実行する。すなわち、認識処理を実行可能な画像サイズの上限は、RAM203に読み出し可能なサイズに依存する。そこで、実施形態では、RAM203のサイズに基づいて、読み出し可能な画像サイズを決定し、認識に適した範囲を決定する。
図5に、第二の画像を作成する例を示す。図5(a)は、図面300に、第一の画像501を張り付けた状態を示す図である。この図面300は、グローバル座標500をもつ。第一の画像501の座標位置は、頂点511(Xg1,Yg1)で定義され、大きさは10、000pixel×10、000pixelである。このとき、まず、画像作成部222が、装置が有する処理に係るリソース、具体的には、RAM203のサイズを取得し、画像読み出しサイズの上限を求める(例えば2500pixel×2500pixel)。次に、第一の画像501を、読み出し可能なサイズ上限ごとに領域分割する。図5(b)は、第一の画像を分割した状態を示しており、点線グリッド521が分割線を表している。そして、分割された複数の領域の中から、1つの領域を指定し、認識に適した範囲とする。複数の領域の中から1つの領域を選択する方法は、ユーザが指定する方法がある。例えば、図5(b)の領域522をユーザが指定したとすると、操作部206は、ユーザからの入力を受け付ける。そして、画像作成部222が、受け付けた入力に基づいて、領域522を認識処理に適した範囲に設定する。複数の領域の中から1つの領域を選択する方法は、その他の方法でもよい。例えば、第一の画像全体にわたって認識結果を取得する場合には、第一の画像から作成する全ての第二の画像に対して、認識処理を実行する。そこで、複数の領域の中から、端から順に自動選択し、順次認識処理を実行するようにしてもよい。
このように、RAM203のサイズに基づいて読み出し可能な画像サイズを求め、認識処理に適した範囲を設定し、第二の画像を作成することができる。図5(c)は、第一の画像501と、作成した第二の画像502の位置関係を示している。画像502の位置は、頂点512の座標で定義される。頂点512の座標は、頂点511の位置から、グローバル座標500の各軸方向に2,500pixelずつ移動した位置である。第一の画像を分割する分割領域の形状は、第一の画像のサイズ以下で、かつ、RAM203に読み出し可能な画像サイズ以下であれば、任意の形状でも構わない。例えば、1,250pixel×5,000pixelの長方形の形状としてもよい。
また、第二の画像のサイズは、RAM203の空きメモリサイズ(利用可能なメモリサイズ)に応じて、動的に決めてもよい。特に、図2に示す情報処理装置200が、パーソナルコンピュータに代表される汎用の情報処理装置の場合、RAM203にはOS(オペレーティングシステム)がロードされている。また、RAM203には、他のアプリケーションや常駐プログラムが保持されている可能性もある。そこで、本実施形態に示すアプリケーションプログラムをRAM203にロードし、実行を開始したときの初期段階で、RAM203にて利用可能なメモリサイズを求め、その求めた利用可能なメモリサイズから認識処理の画像の上限サイズを決定し、その上限サイズ以内で第二の画像のサイズを決定するようにしても良い。
第一の画像から認識に適した範囲を決定する他の方法として、例えば、構造物中の目地や部材間のつなぎ目などを境界として使用する方法がある。認識対象の1つであるひび割れは、目地をまたぐことが少ない。また、コンクリート壁面画像における点検において、構造物中のメタル部材は点検対象ではないことが多い。したがって、構造物の目地や部材の継ぎ目は、認識に適した範囲を決定する境界に適している。構造物中の目地などを境界として用い認識に適した範囲を決定する処理について、図6を用いて説明する。図6(a)は、図面300に、コンクリート壁面を撮影した画像601を張り付けた図である。画像601には、水平方向と垂直方向に目地を持つ構造物が映っている。この画像601に対して、画像処理を用いて目地を示す線分を取得する。目地等の線分を決定する方法は、例えば、画像処理を用いた直線成分を取得する方法がある。まず、画像に対して、Canny法などのエッジ抽出手法を適用し、エッジ画像を取得する。次に、作成したエッジ画像に対して、ハフ変換処理を施し、直線を取得する。この直線を、目地等の境界とみなす。図6(b)は、図面300に、画像601と、取得した線分602、603、604を重畳表示した図である。画像601は、線分602、603、604により、複数の領域に分割されている。その分割された複数領域の中から領域を1つ選択することにより、第二の画像とする。複数の分割領域の中から1つの領域を選択する方法は、どのような方法でもよいが、例えば、図5の説明と同様に、ユーザが、領域611を指定する。ユーザが領域を指定する場合、操作部206が、ユーザからの入力を受け付ける。そして、画像作成部222が、受け付けた入力に基づいて、領域611を認識に適した範囲に決定し、第二の画像を作成する。このように、目地等の境界を、認識に適した範囲として使用し、第二の画像を作成することができる。構造物の目地や部材の繋ぎ目等などの境界を決定する方法として、他の方法を用いてもよい。例えば、FFTにより得られる画像の空間周波数情報に基づいて、類似するテクスチャごとに領域を分割する。この分割境界を、目地や部材の繋ぎ目としてもよい。このとき、テクスチャに応じた第二の画像ごとに、使用する学習モデルを変更する、など認識方法を切り替えて認識処理を実行してもよい。また、ユーザが目地等を直接指定してもよい。ユーザが指定する場合、表示部205に表示された第一の画像を確認しながら、目地等の位置や形状を入力する。操作部206は、ユーザからの入力を受け付け、画像作成部222が、受け付けた入力を、目地等の境界として取得する。
第一の画像から認識に適した範囲を決定する他の方法として、複数の方法を組み合わせて使用してもよい。例えば、情報処理装置のメモリ等の制約に基づいて決定する方法と、構造物中の目地や部材間のつなぎ目などを境界として使用する方法を組み合わせてもよい。まず、第一の画像から目地等の境界を取得し、第一の画像を複数の部分画像に分割する。次に、各部分画像を、RAMサイズに基づいて認識処理を実行可能なサイズごとに分割する。このように、複数の方法を組み合わせることにより、構造物の目地を境界として使用しながら、確実に認識処理を実行可能なサイズの部分画像を作成することができる。
第一の画像が、複数の撮影画像から構成されている場合には、その画像境界を、認識に適した範囲の境界に使用してもよい。撮影条件が変わると、画像の色味やピントなどが変化するため、構造物画像上のひび割れ等の見え方も異なる。そのため、撮影境界は、認識処理に適した範囲を決定する境界に適している。例えば、図3(a)の画像301は、個別に撮影した画像304と画像305を、重ならないように連結した全体画像である。画像304と画像305の間の撮影境界(画像境界)306を、認識に適した範囲を決定する際の境界として使用してもよい。もしくは、連結前の画像304と画像305を、それぞれ部分画像とみなし、いずれか一方を第二の画像としてもよい。また、壁面の高解像度画像を作成するために、一部の撮影範囲が重複するように撮影し、撮影した複数の画像を、重ねるようにスティッチすることにより、第一の画像を作成する場合がある。このような場合、このスティッチ境界を、認識に適した範囲の境界として使用してもよい。
逆に、1枚の撮影画像から構成される第一の画像が、データ管理上、複数の小画像に分割して記憶部225に記憶することがある。このような場合には、小画像の分割境界を、認識に適した範囲の境界として使用してもよい。1つの小画像を第二の画像としてもよいし、2つ以上の小画像を連結した画像を、第二の画像としてもよい。例えば、図3(b)の画像302は、4つの分割画像(322、323、324、325)に分割されて記憶されている。この分割画像のうち、例えば、分割画像324を選択し、第二の画像としてもよいし、分割画像323、325を連結した画像を、第二の画像としてもよい。
<第二の画像とグローバル座標の関係算出>
S402において、画像作成部222は、グローバル座標上における第二の画像の位置を算出する。第二の画像の位置を算出するために、グローバル座標上の第一の画像の位置情報と、第一の画像と第二の画像の位置関係の情報を用いる。グローバル座標上の第一の画像の位置は、画像左上の頂点の座標で示され、本実施形態では既知である。第一の画像と第二の画像の位置関係は、画像解像度と、各画像の左上頂点間における、各軸方向の画素数から求める。これらの情報を用いて、グローバル座標の第二の画像の位置を算出する方法を、図7を用いて説明する。なお、グローバル座標上の単位はm(メートル)とし、画像解像度は、実物の構造物壁面の画像上のサイズを示し、ここでは定数R(mm/pixel)とする。図7は、グローバル座標700に対応づけられた、第一の画像711と第二の画像712を表示している図である。第一の画像711の位置は、画像左上の頂点座標721(Xg1、Yg1)とする。また、第二の画像712の位置は、画像左上の頂点座標722(Xg2、Yg2)とする。また、頂点座標721と頂点座標722の間の各軸方向の画素数(距離画素数)を(Xp,Yp)とする。このとき、グローバル座標上の第二の画像の頂点座標722(Xg2、Yg2)は、次式(1)、(2)で表される。
Xg2 = Xg1 + (Xp × R × 0.001) …(1)
Yg2 = Yg1 + (Yp × R × 0.001) …(2)
式(1)、(2)における数値の0.001は、画像解像度のmm(ミリメートル)からグローバル座標のm(メートル)へ単位変換する変換係数である。この変換係数は、画像解像度やグローバル座標の単位に合わせて変更する。式(1)、式(2)を用いることにより、グローバル座標における第二の画像の位置を求めることができる。
<認識処理の実行>
S403において、認識処理部223は、第二の画像に対して認識処理を実行し、認識結果を取得する。本実施形態では、1例として、認識対象がひび割れの場合の認識処理について図8を用いて説明する。
図8は、ローカル座標800に対応づけられた第二の画像801と、取得した認識結果のひび割れ811を重畳表示している図である。ローカル座標は、第二の画像に対応づけられた画像座標である。説明のため、第二の画像の左上の頂点810を、ローカル座標800の原点とする。ひび割れ811は、ベクターデータとして出力され、点P1~Pmを持つ。ひび割れ811の点P1~Pmは、それぞれローカル座標の位置座標を持つ点であり、各点を直線で結ぶことによりひび割れを表現している。なお、ひび割れ811は、ラスターデータとして出力してもよい。ひび割れをラスターデータとして取得する場合には、ローカル座標上の点の集合が、ひび割れを表現することになる。
S403で実行する認識処理は、例えば、予め機械学習により学習された学習済みモデルを用いる実行することができる。学習済みモデルは、例えば、ニューラルネットワークモデルで構成可能である。ひび割れの種類ごとに、異なる学習データを用いて学習された学習済みモデルを用意しておき、認識したいひび割れごとに学習済みモデルを使い分けてもよいし、様々な種類のひび割れを認識可能な汎用的な学習済みモデルを使用してもよい。また、第二の画像のテクスチャ情報に基づいて、学習モデルを使い分けてもよい。第二の画像からテクスチャ情報を求める方法は、例えば、FFTにより得られる画像の空間周波数情報に基づいて決定する方法がある。また、ひび割れの認識手法は、これに限らず、画像処理による方法でもよい。例えば、特許文献2では、ウェーブレット変換によりひび割れを検知する方法が開示されている。また、ひび割れをはじめとする変状の認識結果は、ベクターデータに限らず、ラスターデータとしてもよい。
S403による認識処理は、並列実行してもよい。S403の認識処理を並列に実行することは、好適な処理方法の1つである。並列処理を行う場合、S401とS402で、第一の画像から第二の画像を1つ作成し、グローバル座標の位置情報を算出する。このS401とS402の処理を繰り返して、第二の画像を複数作成しておく。そして、作成した第二の画像1つ1つに対して、認識処理部223が、認識処理を並列実行し、それぞれの画像に対する認識結果を取得する。取得した認識結果は、第二の画像ごとに対応づけられたローカル座標のベクターデータとして出力される。
<認識結果をグローバル座標に変換>
S404にて、座標変換部224は、ローカル座標に対応づけられた認識結果を、グローバル座標に変換する処理を行う。認識結果を座標変換する例として、図8のひび割れ811のベクターデータの点P1~Pmの座標を、グローバル座標へ変換する処理を説明する。点P1~Pmの座標は、ローカル座標に対応づけられた座標(Xlp1,Ylp1)~(Xlpm,Ylpm)とする。このとき、グローバル座標に変換した点P1~点Pの座標(Xgp1,Ygp1)~(Xgpm,Ygpm)は、次式(3)、(4)で求めることができる。
Xgpi = Xg2+(Xlpi × R × 0.001) (pi=p1,p2,…,pm) …(3)
Ygpi = Yg2+(Ylpi × R × 0.001) (pi=p1,p2,…,pm) …(4)
式(3)および(4)中のRは、第一の画像の画像解像度を示すパラメータであり、mm/pixel単位の数値で表す。末尾の数字0.001は、mmからmへの単位変換を行う変換係数である。この変換係数は、式(1)および(2)の変換係数と同じく、画像解像度の単位とグローバル座標の単位に合わせて変更する。Xg2とYg2は、式(1)および(2)により算出される、グローバル座標上の第二の画像の位置(画像左上の頂点座標)である。式(3)、(4)を用いることにより、ローカル座標上の認識結果を、グローバル座標へ変換することができる。
<認識結果の格納>
S405にて、データ管理部221は、グローバル座標に変換された認識結果を、記憶部225に記憶する処理を行う。認識結果は、グローバル座標、すなわち構造物全体の図面座標に対応づけられた座標を持つため、図面や第一の画像と対応づけて認識結果を記録、管理できるようになる。図9に、図面300と、図面に対応づけられた第一の画像901、および認識結果902を表示している状態を示す。
[第1の実施形態の変形例]
ここまで第1の実施形態では、部分画像ごとに認識結果を取得し、逐次座標変換する実施形態について説明した。しかし、複数の部分画像の認識結果を蓄積し、一括で座標変換して図面に対応づける処理を行ってもよい。座標変換前の認識結果は、座標変換パラメータとともにHDD204等に保持しておく。そして、例えば、ユーザが認識結果を参照する場合、認識結果と座標変換パラメータを読み込む。そして、参照に必要な認識結果のみ座標変換処理を実行し、図面に対応づけられた認識結果を取得する。このように、一括で座標変換を行うことにより、座標変換処理の回数を削減することができる。
<他分野への適用例>
以上の実施形態では、インフラ点検における検査対象を撮影した画像に対する認識結果を図面と対応付けて管理する実施形態について説明した。しかし、適用先は特定の分野に限定されない。例えば、超解像度画像を用いた検査点検処理などにも有効である。具体的に示すのであれば、工場における半導体ウエハ検査工程である。半導体ウエハの検査工程では、半導体ウエハを撮影した画像から傷などの欠陥を認識し、その認識結果を図面に対応付けて管理する。半導体ウエハ上の微細な傷を認識するためには、超高解像度で撮影した画像に対して認識処理を実行する必要があるため、画像サイズは非常に大きくなる。したがって、全体画像に対して一度に認識処理を実行することは難しい。そのため、全体画像から部分画像を切り出し、部分画像ごとに認識処理を実行する。ところで、半導体ウエハ製造工程では、ウエハ表面上の碁盤目状の境界に合わせて規則的に回路パターンを焼き付け、その後境界に沿ってダイシングを行う。つまり、認識処理を実行可能な部分画像を作成する際の区切りとして、碁盤目状の境界を使用することが好適な方法である。部分画像ごとに取得した傷などの認識結果を図面に座標変換することにより、ウエハ全体の欠陥情報を容易に管理できるようになる。
以上説明した第1の実施形態によれば、構造物画像サイズが非常に大きく、構造物画像に対して認識処理を実行することが難しい場合において、認識処理を実行できるようになる。また、認識処理により取得した認識結果を、構造物図面と対応付けて記録、管理することができるようになる。
[第2の実施形態]
上記第1の実施形態では、部分画像ごとに認識結果を取得し、図面と対応付けて管理する例を説明した。変状が、部分画像境界をまたいで存在している場合、部分画像の境界付近で途切れた認識結果となる。そのため、ユーザは、画像と見比べながら認識結果の途切れを修正することになる。第2の実施形態では、部分画像境界付近の認識結果を合成し、認識結果の途切れを抑制する例を示す。具体的には、部分画像境界付近の、異なる部分画像に対応付けられた認識結果において、位置が近い認識結果同士を同一の変状の認識結果であるとみなし、合成する処理を行う。これにより、認識結果が連結され、管理および閲覧しやすくなる。以下、第1の実施形態との差分を中心に、第2の実施形態を説明する。
第2の実施形態に係る情報処理装置200のハードウェア構成は、図2(a)に示した第1の実施形態の構成に準じるため、説明を省略する。図10は、第2の実施形態の構成に係る情報処理装置200の機能ブロック図の一例を示す図である。第1の実施形態において図2(b)に示した構成に対して、算出部226と、判定部227と、合成部228が追加されている点が異なる。算出部226は、CPU201の機能部であって、グローバル座標に変換された認識結果を合成するか否かを判定する指標を算出する。判定部227は、CPU201の機能部であって、算出部226で算出した指標に基づいて、認識結果を合成するか否かの判定を行う。合成部228は、CPU201の機能部であって、判定部227の判定結果に基づいて、認識結果を合成する処理を行う。
図11は、第2の実施形態に係る情報処理装置200が実行するメイン処理の一例を示すフローチャートである。図11のフローチャートにおいて、第1の実施形態で説明した図4のフローチャートと同じ番号を付したステップでは、第1の実施形態と同様の処理が実行される。第2の実施形態の場合、S404で認識結果の座標変換処理が実行された後、処理はS1101へ進む。本第2の実施形態では、部分画像境界を跨いで認識結果を合成する処理を説明する。そのため、S401からS404の処理を、複数の部分画像に対して実行し、複数の認識結果を取得しておくことを前提としている。
S1101では、算出部226が、画像境界付近の認識結果を合成するか否かを判断する指標を算出する。算出する指標は、例えば、認識結果間(既にグローバル座標に変換済みである点に注意されたい)の距離である。続くS1102では、S1101で算出した指標に基づいて、認識結果を合成するか否かを判定し、合成すると判断した場合には、S1103へ進み認識結果の合成処理を実行する。合成しない(S1102でNo)と判断した場合には、S405へ進む。S1103では、認識結果を合成する処理を行う。その後、S405で、データ管理部221が認識結果を記憶部225に記憶する処理を行い終了する。
ここで、図12を用いて、認識結果同士を合成するか否かを判断する指標を算出するS1101の処理の詳細を説明する。本第2の実施形態における認識結果は、第1の実施形態と同様に、構造物表面のひび割れとする。S1101では、異なる部分画像に対応付けられたひび割れ同士を、画像境界を跨いで連結してもよいかどうか判断する指標を算出する。算出する指標として、例えば、ひび割れの端点間の距離dを求める。図12(a)は、構造物画像1211と、ひび割れ1222、1223、1224、1225を、図面1200上に表示している図である。部分画像1212、1213は、それぞれ構造物画像1211の部分画像である。ひび割れ1222、1223は部分画像1212に対応付けられており、ひび割れ1224、1225は部分画像1213に対応付けられている。
S1101では、部分画像1212上の各ひび割れに対して、部分画像1213上のひび割れの中から、最短距離となるひび割れを探索し、その最短距離を取得する。まず、部分画像1212に対応付けられたひび割れの中から、1つのひび割れ1222を選択する。次に、部分画像1213に対応付けられたひび割れの中から、1つのひび割れ1224を選択する。図12(b)は、選択したひび割れ1222、1224を示している図である。ひび割れ1222、1224は、それぞれベクターデータであり、各点の位置座標はグローバル座標に変換済みとする。このとき、選択したひび割れ1222の端点1231と、ひび割れ1224の端点1232の間の距離dを、次式(5)を用いて算出する。式(5)は、画像境界1214に最も近いひび割れの端点同士の距離dを算出する式である。
d={(Xg1-Xg2)2+(Yg1-Yg2 )21/2 …(5)
式中のXg1、Yg1は端点1231の位置座標を示し、Xg2、Yg2は端点1232の位置座標を示すパラメータである。この端点間の距離dの算出処理を、ひび割れ1222は固定のままで、部分画像1213上の各ひび割れに対して実行する。これにより、ひび割れ1222に対して、最短距離となる部分画像1213上のひび割れを決定し、その時の最短距離dを取得する。以上の処理を、部分画像1212の各ひび割れに対して繰り返し実行することにより、各ひび割れに対応する最短距離を取得する。
続くS1102では、判定部227が、S1101で算出した指標d(距離d)に基づいて、ひび割れを合成するか否かを、ひび割れごとに判定する。例えば次式(6)の条件を満たす場合に、判定部227は合成するとして判定し、そうでない場合は合成しないと判定する。
D≧d …(6)
式中のDは、画像境界を跨いで認識結果を合成するか否かを判断する基準値を示す定数(閾値)である。この定数Dは、例えば、実験的に求めた値を使用する。
本第2の実施形態では、S1101で算出した指標dが、式(6)の条件を満足する場合、S1103へ進み、指標dを算出したときの2つのひび割れを表すベクターデータを合成する処理を行う。また、式(6)の条件を満たさない場合、ひび割れの連結処理をスキップしてS405へ進み、第1の実施形態と同様に、データ管理部221が、ひび割れを記憶部225へ記憶する処理を行い、処理を終了する。
S1103にて、合成部228は、認識結果の合成処理を行う。認識結果の合成処理の例として、図12(b)のひび割れ1222とひび割れ1224を連結する処理を説明する。ひび割れの連結処理では、もっとも距離の近い端点同士を連結する。すなわち、端点1231と端点1232を連結する。図12(c)に、連結により新たに作成したひび割れ1226を示す。ひび割れ1226は、部分画像の境界1214を跨いだ長いひび割れとなっている。
上記例では、ひび割れ1224の端点1232の間の距離を式(5)に従って算出し、その後で閾値Dと比較した。しかし、単純に2つのひび割れ間の距離の大小が判定できれば良いので、次のようにしても良い。まず、式(5)の代わりに次式(5’)に従って距離の指標d’を求める。そして、求めた指標値d’とそれに応じた閾値D’と比較することで、合成/非合成を判定するよう。式(5’)の場合、ルート演算が不要になるぶん、演算が単純化でき、処理の高速化が期待できる。
d’=(Xg1-Xg2)2+(Yg1-Yg2 )2 …(5’)
本第2の実施形態では、ひび割れの端点間の距離を算出し、その距離が基準値以下である場合に、ひび割れを連結する処理について説明したが、その他の指標を使用してもよい。例えば、ひび割れの端点間の距離に加え、ひび割れの端点付近の向きの差(角度差)を用いてもよい。一般的に、ひび割れは、途中から急に大きく折れまがることは少ない。つまり、ひび割れを連結したときに、大きく折れ曲がるようなひび割れは、不自然なひび割れであるといえる。したがって、ひび割れを連結した時の角度変化が小さいかどうかを判定条件として追加することにより、より自然な連結ひび割れを作成することができる。以下、ひび割れの端点間の距離と、ひび割れの端点付近の向きの差を指標として用い、ひび割れを連結する処理の概要を説明する。
はじめに、S1101にて、算出部226が2つの指標を算出する。図12(d)は、異なる部分画像に対応付けられたひび割れ1227とひび割れ1228と、画像境界1215を示す図である。まず、算出部226は、1つ目の指標として、端点1233と端点1234の間の距離dを、式(5)を用いて求める。次に、算出部226は、2つ目の指標として、端点1233と端点1234を連結した時の、端点ごとの角度をそれぞれ求める。図12(e)は、端点1233の角度θ1233と、端点1234の角度θ1234を示す図である。角度θ1233は、直線1241と直線1242のなす角度である。ここで、直線1241は、端点1233とその隣の点1235を通る直線であり、直線1242は、端点1233と端点1234を通る直線である。また、角度θ1234は、直線1242と直線1243のなす角度である。ここで、直線1243は、端点1234とその隣の点1236を通る直線である。
次に、S1102で、判定部227は、算出した指標を基に認識結果を連結するかどうか判定を行う。1つ目の指標である距離は、式6を用いて基準値以下かどうかを判定する。2つ目の指標である角度θ1233、θ1234がいずれも次式(7)を用いて基準角度以下かどうかを判定する。
Θ≧θ …(7)
式7中のΘは、基準角度を示す定数(閾値)であり、例えば、実験的に求めた値を使用する。
S1102にて、判定部227は、式(6)、(7)の両条件を満たすか否かを判定する。両条件を満たすと判定した場合、判定部227は処理をS1103に進める。一方、式(6)、(7)のいずれかが満たさない場合、判定部227は処理をS405へ進める。S1103の合成処理は、これまでの説明と同様のため、説明を省略する。このように、ひび割れの向きを指標として追加することにより、より自然な連結処理のみを実行することができる。
<領域を持つ認識結果を合成する処理>
本実施形態では、認識結果の例として、面積を持たないひび割れを連結する処理を説明したが、漏水や浮きなどのような面積を持つ認識結果に対しても有効である。ここで、面積をもつ認識結果がベクターデータであるとする。面積を持つ認識結果を連結するか否かを判断する方法は、例えば、認識結果を構成する境界のうち、一部の境界が近接し、かつ向きが揃っているかどうかを使用する方法がある。すなわち、各認識結果を構成する線分のうち、もっとも距離の近い線分の組合せを選択し、その時の線分間距離と線分のなす角度を算出する。算出した距離と角度が、いずれも基準値以下である場合に、認識結果を合成する処理を行う。領域を持つ認識結果を合成するかを判断する指標の算出処理の概要を、図13を参照して説明する。
図13(a)は、画像境界1301と、認識結果1311と1312を表示している図である。まず、認識結果1311、1312を構成する各線分の中から、最短距離となる線分の組み合わせを選択する。図13(b)は、最短距離の線分の組合せとなる線分1321と線分1322を示している。この2つの線分を用いて2つの指標を算出する。1つ目の指標は、線分間の最短距離であり、この図では、線分1321の端点1331と、線分1322間の距離d1333である。2つ目の指標は、線分1321と、線分1322を並行移動させた線分1323とのなす角度θ1334である。
求めた2つの指標が、それぞれ基準値以下である場合、つまり式(6)と(7)を満たす場合に、認識結果1311と認識結果1312を連結する処理を行う。認識結果の連結処理は、例えば、近接する線分1321と線分1322の端点同士を連結することにより実行すればよい。図13(c)は、連結後にできる新たな認識結果1313を示しており、画像境界1301をまたいで認識結果が連結されていることがわかる。
[第2の実施形態の変形例]
上記第2の実施形態では、部分画像境界付近で途切れる認識結果を合成する方法について説明した。部分画像境界を跨ぐ認識結果の合成では、不自然な認識結果が作成されることがある。そこで、全体画像から、合成候補の認識結果を含む部分画像を新たに作成し、認識処理を実行して認識結果を取得しなおす。これにより、画像境界付近で途切れのない自然な認識結果を取得することができる。
図13(d)を用いて、合成候補の認識結果を含む部分画像を作成する処理を説明する。図13(d)は、図面1300に、全体画像1341と、部分画像(1342、1343)と、認識結果(1351、1352)を表示している図である。認識結果1351と認識結果1352は、画像境界1361付近で途切れている。ここで、認識結果1351、1352を含む新たな部分画像1344を作成する。この部分画像1344は、認識結果1351と認識結果1352の間の画像境界1361付近の領域も含む。そのため、部分画像1344に対して認識処理を実行して取得する認識結果は、画像境界1361付近で途切れることがない。したがって、画像境界をまたいで合成した認識結果よりも、自然な認識結果が得られる。そして、得られた認識結果を座標変換し、図面座標に対応付けられた新たな認識結果として記憶する。なお、認識結果は重複管理しないよう、例えば、元々の合成候補の認識結果は削除することが好ましい。
以上説明したように、画像境界付近で認識結果が途切れてしまう場合において、本実施形態で説明する方法を用いることにより、画像境界を跨いで認識結果を合成することができる。
[第3の実施形態]
第1の実施形態では、微細なひび割れの認識結果を取得するために、部分画像を作成し、認識処理を実行して認識結果を取得する例を説明したが、認識対象に応じて、使用する部分画像の解像度を変更してもよい。例えば、微細なひび割れを認識するためには、高解像度な画像を使用する必要がある。一方、広範囲に及ぶ漏水領域や太いひび割れなどの変状は、比較的低解像度な画像でも視認できるため、低解像度化した画像を使用しても、認識できることが多い。低解像度化した画像を用いることにより、認識処理における情報処理装置の負荷が軽減されるため、認識処理を高速化することができる。したがって、認識対象に応じて、認識処理を実行する画像の解像度を変換することにより、認識処理を高速化することができる。ただし、取得する認識結果は、低解像度画像に対応する認識結果である。そのため、取得した認識結果を、もとの解像度画像に対応づける処理を行う必要がある。以下、第1の実施形態との差分を中心に、第3の実施形態を説明する。
第3の実施形態に係る情報処理装置200のハードウェア構成は、図2(a)に示した第1の実施形態の構成に準じるため、説明を省略する。図14は、第3の実施形態の構成に係る情報処理装置200の機能ブロック図である。第1の実施形態の図2(b)に示した構成に対して、認識対象設定部229と画像加工部230が追加されている点が、主な相違点である。認識対象設定部229は、CPU201の機能部であって、認識対象を設定する処理を実行する。画像加工部230は、CPU201の機能部であって、認識対象設定部229が設定した認識対象に基づいて、第二の画像を加工する処理を行う。第二の画像を加工する処理は、例えば、画像解像度を変更する処理である。なお、画像加工パラメータはRAM203などに記憶しておく。そして、座標変換部224が、画像加工パラメータを使用して、認識結果を加工前の画像に対応づけられた画像座標に変換する処理を行う。これにより、認識結果を図面座標へ適切に変換することができる。
図15は、第3の実施形態に係る情報処理装置200が実行するメイン処理の一例を示すフローチャートである。図15のフローチャートにおいて、第1の実施形態で説明した図4のフローチャートと同じ参照符号を付したステップでは、第1の実施形態と同様の処理が実行されるものとする。
本第3の実施形態の場合、S1501で、認識対象を設定する処理を行う。本実施形態では、たとえば、ユーザが認識対象を設定し、操作部206が、ユーザの入力を受け付ける。認識対象設定部229は、操作部206の受付に基づいて、認識対象を設定する処理を行う。続くS1502では、画像加工部230が、認識対象設定部229で設定した認識対象に基づいて、画像加工方法を決定し、第二の画像に対して画像加工処理を実行する。S1503は、座標変換部224の処理で、S403で取得した認識結果に対して、画像加工パラメータを用いて、画像加工前の画像に対応付ける座標変換処理を実行する。その後、認識結果をグローバル座標へ変換したのち、記憶部225へ記憶する処理を行って終了する。
ここで、図16を用いて、認識対象に基づいて第二の画像に対して画像加工処理を実行するS1502の処理の概要を説明する。図16(a)は、図面1600に、構造物壁面を撮影した全体画像1611と、部分画像1612、部分画像1613を示した図である。部分画像1612上には、漏水領域1621が映っており、部分画像1613上には、微細なひび割れ1622が映っている。S1502は、画像加工部230の処理で、認識対象に基づいて、部分画像に対する加工処理を実行する。本第3の実施形態では、例として、解像度変換を実行する処理を説明する。解像度変換を実行するためには、予め、認識対象と解像度変換係数を対応づける必要がある。そこで、例えば、認識対象と解像度変換係数を対応づけた変換テーブルを、例えばHDD204に記憶保持させておく。そして、S1501で設定した認識対象に基づいて、変換テーブルから解像度変換係数を取得し、部分画像に対して解像度変換処理を実行する。本実施形態では、S1501で、漏水領域を設定したものとし、変換テーブル上の漏水領域に対応づけられた解像度変換係数は0.5であるとする。図16(b)に、解像度(水平、垂直とも)を0.5倍に変換した部分画像1614、1615を示す。なお、解像度変換方法の種類は問わないが、例えば0.5倍の場合には、オリジナルの画像の2×2画素の平均値を、解像度変換後の1画素にすれば良い。
一般的に、微細なひび割れを認識するためには高解像度な画像を使用する必要がある。例えば、部分画像1615のように、認識処理で実行する画像を低解像度化すると、微細なひび割れ1624のように一部(もしくは全て)が視認できなくなる。そのため、認識結果の性能が低下しやすい。その一方、漏水領域は、微細なひび割れと比較して、広範囲に及ぶ変状であり、低解像度化した画像でも視認しやすい(漏水領域1623)。そのため、低解像度化した画像を用いて漏水領域を認識する処理を実行しても、認識結果の性能は低下しにくい。認識処理を実行する画像を低解像度化することにより、認識処理で用いる情報処理装置の負荷が軽減されるため、認識処理にかかる処理時間を削減することができる。
その後、S403で解像度変換後の画像に対して認識処理を実行し、認識結果を取得する。取得する認識結果は、画像変換後の画像に対応づけられた認識結果であるため、グローバル座標に変換する前に、S1503で、解像度変換前の画像座標へ変換する処理を実施する。例えば、S403で取得する認識結果の任意の点の位置座標(Xlb、Ylb)を解像度変換前の画像に対応づける座標変換式(8)、(9)を以下に示す。
Xla = Xlb/C (C≠0) …(8)
Yla = Ylb/C (C≠0) …(9)
式(8)及び(9)中のパラメータ“C”は、解像度変換係数である。また、Xla、Ylaパラメータは、解像度変換前画像の画像座標に対応づけられた認識結果である。式(8)、(9)を用いることにより、元の解像度変換前の認識結果を取得することができる。
本第3の実施形態では、認識処理を実行する画像に対して、1つの認識対象に対応する解像度変換処理を行う方法について説明した。認識処理を実行する同一の画像から、複数の認識結果を取得する場合には、認識対象ごとに異なる解像度変換処理を行い、認識対象ごとに異なる解像度の画像を用いて認識結果を取得、統合してもよい。例えば、認識処理を実行する1つの部分画像から、ひび割れと漏水領域の2つの変状を認識するために、異なる解像度画像を作成する。ここで、ひび割れに対応する解像度変換係数をC1、漏水領域に対応する解像度変換係数をC2とする。そして、2つの異なる解像度の画像に対して、個々に認識処理を実行し、ひび割れの認識結果と漏水領域の認識結果を取得する。そして、解像度変換係数C1と式(8)、式(9)を用いてひび割れの認識結果を解像度変換前の画像座標に変換する。同様に、解像度変換係数C2と式(8)、式(9)を用いて、漏水領域の認識結果も変換する。その後、各認識結果をグローバル座標に変換することにより、2つの認識結果と1つの画像を、同一の図面上で管理することができる。
以上のように、認識対象に応じて、画像解像度を変換することにより、認識結果の影響を抑えつつ、認識処理の高速化を図ることができる。なお、本第3の実施形態では、認識対象に応じた認識処理を実行する画像加工処理として、解像度変換(拡大縮小変換)を適用する処理について説明したが、その他の加工処理を用いてもよい。例えば、認識対象に応じて、認識処理を実行する画像に対して、回転変換(画像の向きを変化)も適用可能であることは言うまでもない。
[第4の実施形態]
第1の実施形態では、2次元図面に対応づけられた画像から作成した部分画像の認識結果を、図面と対応づけて管理する例を説明したが、3次元図面に対応づけられた画像を用いてもよい。3次元図面データとは、例えば、3DCADソフトウェア等を用いて作成した3Dモデルに、構造物を様々な方向から撮影した画像を張り付けたデータである。このような場合、例えば、3次元図面における任意視点からの部分画像を作成して、認識処理を実行する。これにより、構造上劣化しやすい箇所を含む部分画像を作成して認識処理を行う、といった効率的な点検が可能となる。取得した認識結果は、3次元図面に対応づけて記憶することにより、3次元図面上で、画像と認識結果を容易に管理することができる。以下、第1の実施形態との差分を中心に、第4の実施形態を説明する。なお、本第4の実施形態において、第一の画像は、3Dモデルに張り付けられた壁面画像とし、第二の画像は、3次元図面上から切り出した部分画像であるとする。また、グローバル座標は、3次元図面に対応づけられた3次元図面座標とし、ローカル座標は部分画像に対応づけられた局所座標とする。
第4の実施形態に係る情報処理装置200のハードウェア構成は、図2(a)に示した第1の実施形態の構成に準じるため、その説明は省略する。図17は、第4の実施形態の構成に係る情報処理装置200の機能ブロック図である。第1の実施形態における図2(b)の画像作成部222を、着目画像作成部231に置きかえた点が異なる。着目画像作成部231は、CPU201の機能部であって、3次元図面上の第一の画像から、着目している範囲の部分画像を第二の画像として作成する処理を実行する。3次元図面上の第一の画像から第二の画像を作成する方法は、例えば、3次元図面上に3Dモデルに第一の画像を張り付けておき、任意視点からの表示範囲を切り出して第二の画像とする方法である。合わせて、作成した第二の画像と、3次元図面座標との関係を算出する処理を行う。なお、記憶部225には、構造物の3Dモデルデータと、構造物を様々な方向から撮影した画像、および認識結果が記憶される。
図18は、第4の実施形態に係る情報処理装置200が実行するメイン処理の一例を示すフローチャートである。図18のフローチャートにおいて、第1の実施形態で説明した図4のフローチャートと同じ参照符号を付したステップでは、第1の実施形態と同様の処理が実行される。本第4の実施形態の場合、S1801にて、着目画像作成部231が、3次元図面上の第一の画像から第二の画像を作成する。本実施形態では、たとえば、構造物を撮影した第一の画像が張り付けられた3Dモデルを任意視点から見た時の部分画像を、第二の画像として作成する処理を行う。3次元図面上で視点等を設定する方法は、例えば、ユーザが指定する方法がある。表示部205に構造物画像を張り付けた3Dモデルを表示させ、ユーザは、表示部205を見ながら、視点位置や表示範囲等を設定して、操作部206が、ユーザからの入力を受け付ける。着目画像作成部231は、操作部206の受付に基づいて、視点位置や表示範囲等を設定し、第二の画像を作成する処理を行う。続くS1802にて、着目画像作成部231は、第二の画像とグローバル座標との関係を算出する。第二の画像は、3次元図面上における部分画像であり、局所座標をもつ。局所座標とグローバル座標との関係を算出する方法は、公知の技術を利用して実行する。そのため詳細な説明は省略するが、例えば、特許文献3のような方法を用いて実施することができる。S1803にて、座標変換部224は、S403で取得した第二の画像に対する認識結果を、3次元図面座標に変換する処理を実行する。認識結果を3次元図面座標に変換する処理も、公知の技術を利用して、S1802と逆の処理により実現することができる。その後、S405にて、データ管理部221が、3次元図面座標に変換された認識結果を記憶部225へ記憶する処理を行って終了する。
図19を参照して、3次元図面上のユーザが設定した視点から第二の画像を作成する処理の概要を説明する。図19(a)は、3次元図面1900上に、3次元図面座標1901と、橋梁の3Dモデル1911を示した図である。3Dモデル1911は、CADソフトウェア等を用いて作成した3Dモデルでもよいし、構造物を撮影した画像をもとに3次元再構成により作成した3Dモデルでもよい。3Dモデル1911の表面には、橋梁を様々な方向から撮影した画像が張り付けられているものとする。S1801にて、着目画像作成部231は、3Dモデル1911表面の構造物画像のうち、ユーザの設定に従った視点および表示範囲内の画像を切り出し、第二の画像を作成する。図19(a)の視点1912および表示範囲1913から作成した部分画像を図19(b)に示す。図19(b)は、3Dモデル1911の複数の面をまたぐ画像であり、局所座標1902を持つ。ユーザが望む視点から部分画像を作成することにより、例えば、構造上劣化しやすい箇所の部分画像を作成して認識処理を行う、といった効率的な点検が可能となる。
[第4の実施形態の変形例]
上記第4の実施形態では、3次元図面に対応づけられた画像に対して、3次元図面上のユーザが設定した視点から部分画像を作成する方法について説明した。3次元図面に対応づけられた画像から部分画像を作成する方法として、3Dモデルの展開図を使用してもよい。例えば、3次元図面上の任意視点から作成した部分画像は、隠れてしまう箇所は部分画像に表示されない。そのため、構造物が複雑な形状の場合、部分画像を複数作成することになり、作業が煩雑となる。このような場合、3Dモデルの展開図を使用して部分画像を作成することにより、効率的に部分画像を作成することができる。図19(c)に、展開図を用いて作成した、3Dモデル1911の橋脚1921における部分画像の例を示す。図19(c)は、橋脚1921の四方の壁面画像(1922、1923、1924、1925)を含む部分画像であり、1視点からでは隠れてしまう壁面も部分画像として容易に作成することができる。このように、3Dモデルの展開図を用いることにより、複数方向視点からの部分画像を容易に作成することができる。
以上のように、3次元図面に対応づけられた画像を用いた場合であっても、認識に適した部分画像を作成し、認識結果を3次元図面に対応づけることにより容易に管理することができる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
221…データ管理部、222…画像作成部、223…認識処理部、224…座標変換部、225…記憶部

Claims (13)

  1. グローバル座標に対応付けられた第一の画像から、当該第一の画像の一部である部分画像を第二の画像として作成する第一の画像作成手段と、
    前記第二の画像に対し、予め設定された特徴についての認識処理を実行し、前記第二の画像に関するローカル座標に対応付けた認識結果を作成する認識処理手段と、
    前記認識結果の座標を前記ローカル座標から前記グローバル座標に変換する座標変換手段と、
    複数の前記認識結果に基づいて、第一の画像から第二の部分画像を作成する第二の画像作成手段と
    を備えることを特徴とする情報処理装置。
  2. 前記第一の画像作成手段は、
    前記認識処理を実行する情報処理装置のリソースに基づいて、前記第二の画像のサイズを決定する手段を含み、
    前記第一の画像から前記サイズ以内の部分画像を前記第二の画像として作成することを特徴とする請求項1に記載の情報処理装置。
  3. 前記第一の画像作成手段は、
    前記第一の画像から算出した画像の特徴に基づいて、前記第二の画像の範囲を決定する手段を含み、
    前記第一の画像から前記範囲の部分画像を作成し第二の画像とすることを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記第一の画像作成手段は、
    前記認識処理を実行する情報処理装置のリソースと前記第一の画像から算出した画像の特徴に基づいて、前記第二の画像のサイズ、及び、範囲を決定する手段を含み、
    前記第一の画像から前記サイズ以内の前記範囲の部分画像を前記第二の画像として作成することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 複数の前記認識結果の位置と形状の少なくとも一方に基づいて、前記認識結果同士を合成する合成手段をさらに備えることを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. 前記グローバル座標は、検査対象となる構造物の図面に対応づけられた図面座標であり、
    前記第一の画像は、前記構造物を撮影した前記グローバル座標に対応づけられた画像であり、
    前記ローカル座標とは、前記第一の画像から作成する前記部分画像に対応づけられた局所座標であって、
    前記第一の画像作成手段は、前記第一の画像から前記部分画像である、前記第二の画像を作成することを特徴とする請求項1乃至のいずれか1項に記載の情報処理装置。
  7. 前記認識処理手段は、
    構造物の表面に生じた変状の位置を含む情報を、前記第二の画像により抽出し、前記ローカル座標に対応づけて取得することを特徴とする請求項1乃至のいずれか1項に記載の情報処理装置。
  8. 前記変状は、前記構造物の表面に生じたひび割れを含むことを特徴とする請求項に記載の情報処理装置。
  9. 前記認識処理手段の認識対象の種類に応じて、前記第二の画像の解像度を変換する変換手段を更に有することを特徴とする請求項1乃至のいずれか1項に記載の情報処理装置。
  10. 前記図面は、前記構造物の2次元図面もしくは3次元図面であり、
    前記第一の画像作成手段は、前記第一の画像の部分画像を前記第二の画像として作成する
    ことを特徴とする請求項に記載の情報処理装置。
  11. 前記座標変換手段は、前記図面に対応づけられた前記グローバル座標と前記認識結果に対応づけられた局所座標に基づいて、局所座標の前記認識結果を前記グローバル座標へ変換することを特徴とする請求項10に記載の情報処理装置。
  12. 情報処理装置が実行する情報処理方法であって、
    グローバル座標に対応付けられた第一の画像から、当該第一の画像の一部である部分画像を第二の画像として作成する第一の画像作成工程と、
    前記第二の画像に対し、予め設定された特徴についての認識処理を実行し、前記第二の画像に関するローカル座標に対応付けた認識結果を作成する認識処理工程と、
    前記認識結果の座標を前記ローカル座標から前記グローバル座標に変換する座標変換工程と、
    複数の前記認識結果に基づいて、第一の画像から第二の部分画像を作成する第二の画像作成工程と
    を備えることを特徴とする情報処理方法。
  13. コンピュータが読み込み実行することで、前記コンピュータを、請求項1乃至11のいずれか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
JP2019134801A 2019-07-22 2019-07-22 情報処理装置及び情報処理方法及びプログラム Active JP7344692B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019134801A JP7344692B2 (ja) 2019-07-22 2019-07-22 情報処理装置及び情報処理方法及びプログラム
PCT/JP2020/022820 WO2021014807A1 (ja) 2019-07-22 2020-06-10 情報処理装置及び情報処理方法及びプログラム
US17/575,672 US12106460B2 (en) 2019-07-22 2022-01-14 Information processing apparatus, information processing method, and non- transitory computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019134801A JP7344692B2 (ja) 2019-07-22 2019-07-22 情報処理装置及び情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2021018676A JP2021018676A (ja) 2021-02-15
JP7344692B2 true JP7344692B2 (ja) 2023-09-14

Family

ID=74193005

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019134801A Active JP7344692B2 (ja) 2019-07-22 2019-07-22 情報処理装置及び情報処理方法及びプログラム

Country Status (3)

Country Link
US (1) US12106460B2 (ja)
JP (1) JP7344692B2 (ja)
WO (1) WO2021014807A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021014754A1 (ja) * 2019-07-23 2021-01-28 富士フイルム株式会社 ひび割れ評価装置、ひび割れ評価方法、及びひび割れ評価プログラム
JP7499210B2 (ja) 2021-04-26 2024-06-13 大成建設株式会社 ひび割れ検出方法とひび割れ検出装置、及びプログラム
WO2023152810A1 (ja) * 2022-02-08 2023-08-17 日本電信電話株式会社 画像処理装置、画像処理方法およびプログラム
CN116030486B (zh) * 2023-02-20 2024-02-09 中国建筑西南设计研究院有限公司 构件特征数据提取方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017126367A1 (ja) 2016-01-22 2017-07-27 富士フイルム株式会社 ひび割れ情報編集装置、ひび割れ情報編集方法およびひび割れ情報編集プログラム
WO2018037689A1 (ja) 2016-08-22 2018-03-01 富士フイルム株式会社 画像処理装置及び画像処理方法
JP2018156317A (ja) 2017-03-16 2018-10-04 阪神高速技術株式会社 ひび割れ検出処理装置、およびひび割れ検出処理プログラム
JP2018195001A (ja) 2017-05-16 2018-12-06 株式会社パスコ 線状図形抽出装置、線状図形抽出プログラム及びニューラルネットワークの学習方法
JP2019087050A (ja) 2017-11-07 2019-06-06 株式会社ベイシスコンサルティング 構造物維持管理業務支援システム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63228269A (ja) * 1987-03-17 1988-09-22 Komatsu Ltd 線状パタ−ン認識装置
JP2005310044A (ja) 2004-04-26 2005-11-04 Constec Engi Co データ処理装置、データ処理方法、及びデータ処理プログラム
JP2011090408A (ja) 2009-10-20 2011-05-06 Canon Inc 情報処理装置、その行動推定方法及びプログラム
JP6099479B2 (ja) 2013-05-21 2017-03-22 大成建設株式会社 ひび割れ検出方法
WO2017119202A1 (ja) * 2016-01-06 2017-07-13 富士フイルム株式会社 構造物の部材特定装置及び方法
JP2017227595A (ja) 2016-06-24 2017-12-28 富士フイルム株式会社 損傷図作成支援システム及び損傷図作成支援方法
WO2018216629A1 (ja) 2017-05-22 2018-11-29 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017126367A1 (ja) 2016-01-22 2017-07-27 富士フイルム株式会社 ひび割れ情報編集装置、ひび割れ情報編集方法およびひび割れ情報編集プログラム
WO2018037689A1 (ja) 2016-08-22 2018-03-01 富士フイルム株式会社 画像処理装置及び画像処理方法
JP2018156317A (ja) 2017-03-16 2018-10-04 阪神高速技術株式会社 ひび割れ検出処理装置、およびひび割れ検出処理プログラム
JP2018195001A (ja) 2017-05-16 2018-12-06 株式会社パスコ 線状図形抽出装置、線状図形抽出プログラム及びニューラルネットワークの学習方法
JP2019087050A (ja) 2017-11-07 2019-06-06 株式会社ベイシスコンサルティング 構造物維持管理業務支援システム

Also Published As

Publication number Publication date
US20220136979A1 (en) 2022-05-05
US12106460B2 (en) 2024-10-01
WO2021014807A1 (ja) 2021-01-28
JP2021018676A (ja) 2021-02-15

Similar Documents

Publication Publication Date Title
JP7344692B2 (ja) 情報処理装置及び情報処理方法及びプログラム
JP4615951B2 (ja) 形状モデル作成方法、および構造最適化システム
Alsadik et al. Automated camera network design for 3D modeling of cultural heritage objects
JP7045721B2 (ja) 写真画像に映ったトンネル内の壁面の位置を同定する同定装置、同定方法、ならびに、プログラム
JP6807459B2 (ja) 損傷図作成方法、損傷図作成装置、損傷図作成システム、及び記録媒体
JP2005308553A (ja) 三次元画像計測装置及び方法
JP7434032B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2000163590A (ja) 三次元モデル変換装置及び方法
JP5499261B2 (ja) 画像処理装置
JP7193728B2 (ja) 情報処理装置および蓄積画像選択方法
US20220405878A1 (en) Image processing apparatus, image processing method, and image processing program
JP7557600B2 (ja) 情報表示装置、方法及びプログラム
JP4170469B2 (ja) 検査点位置取得方法および装置
Verykokou et al. A Comparative analysis of different software packages for 3D Modelling of complex geometries
US20220406018A1 (en) Three-dimensional display device, three-dimensional display method, and three-dimensional display program
JP2009122998A (ja) ソリッド/サーフェースモデルから外形線を抽出する方法及びコンピュータソフトウエアプログラム
JP2004021578A (ja) 画像処理方法
KR100490885B1 (ko) 직각 교차 실린더를 이용한 영상기반 렌더링 방법
JP2004227095A (ja) テクスチャマップ作成方法、テクスチャマップ作成用プログラムおよびテクスチャマップ作成装置
JP7408337B2 (ja) 画像処理方法、および画像処理装置
Liu et al. A Quantitative Texture Feature Preserving Method for Simplifying 3D Building Models
JP2023007662A (ja) 損傷図作成方法
JP2022178076A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2022186523A (ja) 3次元点群処理装置、3次元点群処理方法、及び3次元点群処理プログラム
JP5504142B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230526

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230904

R151 Written notification of patent or utility model registration

Ref document number: 7344692

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151