JP7039882B2 - 画像解析装置及び画像解析プログラム - Google Patents

画像解析装置及び画像解析プログラム Download PDF

Info

Publication number
JP7039882B2
JP7039882B2 JP2017157278A JP2017157278A JP7039882B2 JP 7039882 B2 JP7039882 B2 JP 7039882B2 JP 2017157278 A JP2017157278 A JP 2017157278A JP 2017157278 A JP2017157278 A JP 2017157278A JP 7039882 B2 JP7039882 B2 JP 7039882B2
Authority
JP
Japan
Prior art keywords
area
image analysis
image
height
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017157278A
Other languages
English (en)
Other versions
JP2019036146A (ja
Inventor
大祐 辰巳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2017157278A priority Critical patent/JP7039882B2/ja
Priority to US15/912,926 priority patent/US10984277B2/en
Priority to CN201810311174.8A priority patent/CN109409180B/zh
Publication of JP2019036146A publication Critical patent/JP2019036146A/ja
Application granted granted Critical
Publication of JP7039882B2 publication Critical patent/JP7039882B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は、画像解析装置及び画像解析プログラムに関する。
特許文献1には、画像として入力された図面全体を文字、記号及び線分として認識した後、該認識された文字、記号及び線分の相対的位置をもとに前記文字及び記号を局所的に再認識処理を行うことを特徴とする図面認識方法が開示されている。
特許文献2には、文字、記号、線分等の図形データを有する画像を入力する入力手段と、この入力手段で入力された画像から図形データを抽出する抽出手段と、文字、記号、線分等の図形データに関する複数の描画規則を登録する登録手段と、この登録手段に登録されている複数の描画規則と前記抽出手段によって抽出された図形データとを照合し、複数の描画規則の中からこの図形データと類似する描画規則を識別する識別手段と、この識別手段にて識別された描画規則の図形データにおける文字、記号、線分等を前記抽出手段にて抽出された図形データに対して位置合せを行った上で配置する配置手段と、を具備することを特徴とする図面認識装置が開示されている。
特許文献3には、図形枠と文字列と引き出し線によって構成される図面を認識するにおいて、図面画像から文字より大きい枠の図形を抽出し、この図形を構成するポリラインのうち両側に端点があるものを引き出し線として分離し、前記分離した引き出し線の2つの端点位置の周辺について文字列を探索し、前記探索で検索された文字列を図面から切り出し、前記分離した引き出し線が指し示す図形枠と前記検索された文字列の対応付けを行い、前記検索された文字列を図形及び他の文字列から独立した文字列として分離し、前記分離した文字列について引き出し線が付いていない文字列を該文字列が位置する図形枠に関連する文字列とすることを特徴とする図面の認識方法が開示されている。
特許第3909697号公報 特開2001-092967号公報 特開平10-134144号公報
本発明は、画像内に含まれる文章に関わりがない対象物について考慮せずに、画像内の文字認識を行う場合と比較して、画像内において文字からなる文章領域と判断された領域内に当該対象物が存在している場合であっても、精度良く文字認識を行うことができる画像解析装置及び画像解析プログラムを提供することを目的とする。
上記目的を達成するために、請求項1に記載の画像解析装置は、対象画像から文字を含む領域である文章領域を抽出する抽出手段と、予め定めた対象物の条件を取得する取得手段と、前記抽出手段により抽出された前記文章領域内について、前記予め定めた対象物の条件を満たす前記対象物を探索して、前記対象物及び前記対象物に重なる文字を文字認識の対象から除外する除外手段と、前記対象物及び前記対象物に重なる文字を除いた前記文章領域内の文字を認識する認識手段と、を備える。
また、請求項9に記載の発明は、対象画像から文字を含む領域である文章領域を抽出する抽出手段と、予め定めた対象物の条件を取得する取得手段と、前記抽出手段により抽出された前記文章領域内について、前記予め定めた対象物の条件を満たす前記対象物を探索して、前記対象物に囲まれた領域を文字認識の対象から除外する除外手段と、前記対象物に囲まれた領域を除いた前記文章領域内の文字を認識する認識手段と、を備える。
また、請求項2に記載の発明は、請求項1に記載の発明において、前記除外手段は、前記文章領域から探索した前記対象物及び前記対象物に重なる文字を消去し、前記認識手段は、前記除外手段により前記対象物及び前記対象物に重なる文字が消去された前記文章領域内の文字を認識する。
また、請求項10に記載の発明は、請求項9に記載の発明において、前記除外手段は、前記文章領域から探索した前記対象物に囲まれた領域を消去し、前記認識手段は、前記除外手段により前記対象物に囲まれた領域が消去された前記文章領域内の文字を認識する。
また、請求項3に記載の発明は、請求項2に記載の発明において、前記取得手段は、前記対象物を構成する線の配置を取得し、前記除外手段は、前記対象物を構成する線の配置により前記対象物を探索して、探索した前記対象物及び前記対象物に重なる文字を構成する線を消去する。
また、請求項11に記載の発明は、請求項10に記載の発明において、前記取得手段は、前記対象物を構成する線の配置を取得し、前記除外手段は、前記対象物を構成する線の配置により前記対象物を探索して、探索した前記対象物に囲まれた領域を構成する線を消去する。
また、請求項に記載の発明は、請求項1~の何れか1項記載の発明において、前記取得手段は、前記対象物を示す参照画像を取得し、前記除外手段は、前記参照画像を用いて前記対象物を探索して、前記対象物及び前記対象物に重なる文字を文字認識の対象から除外する。
また、請求項12に記載の発明は、請求項9~11の何れか1項記載の発明において、前記取得手段は、前記対象物を示す参照画像を取得し、前記除外手段は、前記参照画像を用いて前記対象物を探索して、前記対象物に囲まれた領域を文字認識の対象から除外する。
また、請求項に記載の発明は、請求項1~の何れか1項記載の発明において、前記取得手段は、前記対象物の高さ、大きさ、及び位置の何れかに関する条件を取得し、前記除外手段は、前記対象物の高さ、大きさ、及び位置の何れかが前記対象物の高さ、大きさ、及び位置の何れかに関する条件を満たした前記対象物及び前記対象物に重なる文字を文字認識の対象から除外する。
また、請求項13に記載の発明は、請求項9~12の何れか1項記載の発明において、前記取得手段は、前記対象物の高さ、大きさ、及び位置の何れかに関する条件を取得し、前記除外手段は、前記対象物の高さ、大きさ、及び位置の何れかが前記対象物の高さ、大きさ、及び位置の何れかに関する条件を満たした前記対象物に囲まれた領域を文字認識の対象から除外する。
また、請求項に記載の発明は、請求項1~の何れか1項記載の発明において、前記取得手段は、前記対象物の高さ、大きさ、及び位置の何れかに関する条件を取得し、前記除外手段は、前記除外手段により探索された前記対象物のうち、前記対象物の高さ、大きさ、及び位置の何れかが前記対象物の高さ、大きさ、及び位置の何れかに関する条件を満たした前記対象物及び前記対象物に重なる文字を文字認識の対象から除外する。
また、請求項14に記載の発明は、請求項9~12の何れか1項記載の発明において、前記取得手段は、前記対象物の高さ、大きさ、及び位置の何れかに関する条件を取得し、前記除外手段は、前記除外手段により探索された前記対象物のうち、前記対象物の高さ、大きさ、及び位置の何れかが前記対象物の高さ、大きさ、及び位置の何れかに関する条件を満たした前記対象物に囲まれた領域を文字認識の対象から除外する。
また、請求項17に記載の発明は、請求項5、6、13、14の何れか1項記載の発明において、前記対象物の高さ、大きさ、及び位置の何れかに関する条件は、前記対象物の高さが、前記認識手段による文字認識の対象とする文字の高さよりも高いこと、又は、前記対象物の大きさが、前記認識手段による文字認識の対象とする文字の大きさよりも大きいこと、及び、前記対象物の高さ方向における位置が前記文章領域内の文章の各行の行間であることの何れかである。
また、請求項に記載の発明は、請求項1~の何れか1項記載の発明において、前記取得手段は、前記予め定めた対象物の条件として、前記対象物の前記文章領域内での配置領域に関する条件を取得し、前記除外手段は、前記対象物の前記文章領域内での配置領域が、前記対象物の前記文章領域内での配置領域に関する条件を満たす前記対象物及び前記対象物に重なる文字を文字認識の対象から除外する。
また、請求項15に記載の発明は、請求項9~14の何れか1項記載の発明において、前記取得手段は、前記予め定めた対象物の条件として、前記対象物の前記文章領域内での配置領域に関する条件を取得し、前記除外手段は、前記対象物の前記文章領域内での配置領域が、前記対象物の前記文章領域内での配置領域に関する条件を満たす前記対象物に囲まれた領域を文字認識の対象から除外する。
また、請求項に記載の発明は、請求項1~の何れか1項記載の発明において、前記取得手段は、前記文章領域の一部の領域である探索領域を取得し、前記除外手段は、前記探索領域内について、前記対象物を探索して、前記対象物及び前記対象物に重なる文字を文字認識の対象から除外する。
また、請求項16に記載の発明は、請求項9~15の何れか1項記載の発明において、前記取得手段は、前記文章領域の一部の領域である探索領域を取得し、前記除外手段は、前記探索領域内について、前記対象物を探索して、前記対象物に囲まれた領域を文字認識の対象から除外する。
また、請求項18に記載の発明は、請求項8又は16記載の発明において、前記対象物が含まれる範囲は、前記文章領域の端部を含む前記文章領域の一部の領域である。
また、請求項19に記載の発明は、請求項4又は12記載の発明において、前記除外手段は、前記参照画像を拡大または縮小させた画像を用いて前記対象物を探索する。
また、請求項20に記載の発明は、請求項4、12、19の何れか1項記載の発明において、前記参照画像は文字、記号、又は図形である。
一方、上記目的を達成するために、請求項21に記載の画像解析プログラムは、コンピュータを、請求項1~20の何れか1項記載の画像解析装置を構成する各手段として機能させるためのプログラムである。
請求項1、9、21に記載の発明によれば、画像内に含まれる文章に関わりがない対象物について考慮せずに、画像内の文字認識を行う場合と比較して、画像内において文字からなる文章領域と判断された領域内に当該対象物が存在している場合であっても、精度良く文字認識を行うことができる。
請求項2、10に記載の発明によれば、画像内に含まれる文章に関わりがない対象物に対応する領域を非文章領域として文章領域から分離して、画像内の文字認識を行う場合と比較して、文字認識の対象とする領域を再設定することなく文字認識を行うことができる。
請求項3、11に記載の発明によれば、画像内に含まれる文章に関わりがない対象物を消去して、画像内の文字認識を行う場合と比較して、当該対象物に含まれる文字についても文字認識を行うことができる。
請求項4、12に記載の発明によれば、画像内に含まれる文章に関わりがない対象物を、当該対象物を構成する線の配置を用いて探索する場合と比較して、当該対象物を構成する線の配置を抽出することなく対象物を探索することができる。
請求項5、13に記載の発明によれば、画像内に含まれる文章に関わりがない対象物を、当該対象物を示す参照画像、又は当該対象物を構成する線の配置を用いて探索する場合と比較して、参照画像を用意することなく対象物を探索することができる。
請求項6、14に記載の発明によれば、画像内に含まれる文章に関わりがない対象物を、当該対象物の高さ、大きさ、及び位置の何れかを考慮せずに探索する場合と比較して、精度良く対象物を探索することができる。
請求項17に記載の発明によれば、画像内に含まれる文章に関わりがない対象物を、認識対象の文字の高さ、大きさ、及び位置の何れかを考慮せずに探索する場合と比較して、不要な対象物が探索されることを抑制することができる。
請求項7、15に記載の発明によれば、画像内に含まれる文章に関わりがない対象物を、当該対象物の文章領域内での配置領域を考慮せずに探索する場合と比較して、精度良く対象物を探索することができる。
請求項8、16に記載の発明によれば、画像内に含まれる文章に関わりがない対象物を、文章領域の全領域について探索する場合と比較して、短時間で対象物を探索することができる。
請求項18に記載の発明によれば、画像内に含まれる文章に関わりがない対象物を、文章領域の中央部について探索する場合と比較して、効率良く対象物を探索することができる。
実施形態に係る画像解析装置により識別される画像が形成された用紙の一例を示す正面図である。 実施形態に係る文章領域の一例を示す正面図である。 実施形態に係る文章領域に対する文字認識の結果の一例を示す正面図である。 実施形態に係る文章領域の別例を示す正面図である。 実施形態に係る文章領域における一纏まりの文章の一例を示す正面図である。 実施形態に係る画像解析システムの構成を示すブロック図である。 第1実施形態及び第2実施形態に係る画像解析装置の機能を示すブロック図である。 実施形態に係る対象物を示す参照画像の一例を示す模式図である。 実施形態に係る対象物を構成する線の配置の一例を示す模式図である。 実施形態に係る対象物を示す参照画像の別例を示す模式図である。 実施形態に係る対象物を構成する線の配置の別例を示す模式図である。 実施形態に係る対象物を消去した文章領域の一例を示す正面図である。 実施形態に係る対象物を探索する領域の一例を示す模式図である。 実施形態に係る対象物を探索する領域の別例を示す模式図である。 実施形態に係る対象物を探索する領域の別例を示す模式図である。 第1実施形態に係る画像解析処理のプログラムの流れを示すフローチャートである。 第2実施形態に係る画像解析処理のプログラムの流れを示すフローチャートである。 実施形態に係る対象物の高さの一例を示す模式図である。 実施形態に係る対象物の高さの別例を示す模式図である。 実施形態に係る対象物を消去した文章領域の一例を示す正面図である。 実施形態に係る対象物を構成する線を消去した文章領域の別例を示す正面図である。 実施形態に係る文章領域及び非文章領域の一例を示す正面図である。 実施形態に係る非文章領域を分離した文章領域の一例を示す正面図である。 第3実施形態に係る画像解析処理のプログラムの流れを示すフローチャートである。
以下、添付図面を参照して、本発明の実施形態について詳細に説明する。
〔第1実施形態〕
まず、本実施形態に係る画像解析装置により識別される画像について説明する。図1は、本実施形態に係る画像形成装置により識別される画像が形成された記録媒体である用紙の一例を示す正面図である。
一例として図1に示すように、画像解析装置により識別される画像(例えば、設計図面)が描画された用紙Pには、画像全体を区分する線30が描画されている。本実施形態では、画像全体を区分する線30が矩形状の図枠である場合について説明する。
本実施形態では、一例として図1に示すように、画像全体を区分する線30の内部に、対象画像から文字を含む領域である文章領域32A、32B、表を含む領域である表領域34、画像を含む領域である画像領域36等が配置されている場合について説明する。
一例として図2に示すように、文章領域32Aには、1行目に「文章」が配置され、2行目に「2行目を訂正」が配置された文章40が記述されている。また、文章領域32Aには、文章40の左側に、すなわち文章40に対してX方向に隣接し、1行目と2行目とを跨ぐように、画像内に含まれる文章に関わりがない文字、記号、図形等(以下、「対象物」という。)42が記述されている場合がある。
なお、本実施形態では、対象物42は三角形の枠を有している場合について説明するが、これに限らず、対象物42は、円形、楕円形、四角形、多角形等の枠を有していても良い。また、対象物42は、枠を有さず、数字、アルファベット、マーク等の記号そのものであっても良い。
また、対象物42の種別としては、改訂事項に関する記号、形状等の幾何公差を表す記号、表面粗さを表す記号、要注意箇所を表す記号等が例示される。
ここで、文章領域32A、32Bに記述されている文章は、公知の文字認識の処理を行うことにより認識される。一例として図2に示すように、文章領域32Aに文章40に加えて対象物42が記述されていた場合、文章領域32Aに対して文字認識を行った際に、対象物42が文章40の一部であると誤認識されてしまう場合がある。その場合には、上述した「文章」及び「2行目を訂正」との2行の記述が1行の記述と誤認識されることにより、一例として図3に示すように、文章領域32Aに対する文字認識の結果である文章領域44において「△藷目を訂正」と誤認識されてしまう可能性がある。
また、一例として図4に示すように、文章領域46に、1行目に「レーザー印刷面」が配置され、2行目に「アートワークNo.X参照のこと。」が配置され、3行目に「書体及び位置はアートワークに従うこと。」が配置された文章48が記述されていたとする。また、文章48の右側に、文章48の1行目と2行目とを跨ぐように、文章48の2行分の高さ(Y方向の長さ)の対象物50が記述されていたとする。
このような場合には、一例として図5に示すように、文章領域46の文章48の1行目及び2行目と対象物50とが一纏まりの文章(1行の文章)48Aであり、文章48の3行目が一纏まりの文章(1行の文章)48Bであると認識されてしまう可能性がある。
そこで、本実施形態に係る画像解析装置は、対象画像から文字を含む領域である文章領域を抽出し、予め定めた対象物の条件を取得する。また、抽出した文章領域内について、予め定めた対象物の条件を満たす対象物を探索して、文字認識の対象から除外し、対象物を除いた文章領域内の文字を認識する。なお、予め定めた対象物の条件については、後述する。
次に、本実施形態に係る画像識別システムの構成、及び画像解析装置の機能について説明する。図6は、本実施形態に係る画像識別システム10の構成を示すブロック図である。また、図7は、本実施形態に係る画像解析装置12の機能を示すブロック図である。
図6に示すように、画像識別システム10は、画像解析装置12、及び、画像読取装置14を有している。なお、画像読取装置14は、所謂スキャナであり、用紙Pに描画された図面を読み取って、カラー画像データ又は白黒画像データを生成し、生成した画像データを画像解析装置12に出力する。また、図7に示すように、画像解析装置12は、機能的には、抽出部20、取得部22、除外部24、及び、認識部26を有している。
なお、本実施形態に係る画像解析装置12は、ハードウェア構成としては、装置全体の動作を司るCPU(Central Processing Unit)により制御されることにより実現される。すなわち、画像解析装置12は、上記CPU、各種プログラムや各種パラメータ等が予め記憶されたROM(Read Only Memory)、CPUによる各種プログラムの実行時のワークエリア等として用いられるRAM(Random Access Memory)、及びフラッシュメモリ等の不揮発性メモリを含む記憶部を備える。
また、画像解析装置12は、外部装置と通信情報の送受信を行う通信回線I/F(Interface)部を備える。また、画像解析装置12は、画像解析装置12に対するユーザからの指示を受け付けると共に、ユーザに対して画像解析装置12の動作状況等に関する各種情報を通知する操作表示部を備える。なお、操作表示部は、例えば、データを表示するディスプレイ、データを入力するキーボード、マウス等を含む。また、表示操作部はこれに限らず、例えば、プログラムの実行により操作指示の受け付けを実現する表示ボタンや各種情報が表示されるタッチパネル式のディスプレイ、及びテンキーやスタートボタン等のハードウェアキーを含んでいても良い。
抽出部20は、画像読取装置14から画像データを入力し、入力した画像データによって示される読取画像を、文字認識の対象とする画像(以下、「対象画像」という。)として取得する。なお、本実施形態では、抽出部20は、画像読取装置14から画像データを入力する場合について説明するが、これに限らず、画像データを外部装置から通信回線I/Fを介して受信しても良い。また、画像データが記憶部に記憶されている場合には、記憶部から画像データを読み出しても良い。
また、抽出部20は、取得した対象画像から、レイアウト解析を行うことにより、対象画像に含まれている文章領域を抽出する。なお、本実施形態では、錯綜を回避するために、対象画像が、白色の背景に黒色で図面が描画された用紙Pが白黒画像データとして読み取られた画像である場合について説明する。また、抽出部20は、抽出手段の一例である。
はじめに、抽出部20は、レイアウト解析を行うことにより対象画像を複数の領域に分割する。ここでは、レイアウト解析を行うことにより対象画像を複数の領域に分割する方法の一例として、投影法を用いた場合について説明する。
すなわち、対象画像を予め定めた第1方向(例えばX軸の沿った方向)に投影することにより、対象画像における黒画素のヒストグラム(投影分布)において、黒画素が多い部分に対応する山と、黒画素が少ない部分に対応する谷とが表れる。この山谷のうちの谷の部分が、領域の区切りであるか否かを判定するための判定条件を満たす場合に、投影方向に沿って領域を分割する。同様に、対象画像を上記第1方向とは交差する方向(例えばY軸に沿った方向)に投影し、対象画像における黒画素のヒストグラムの山谷から、谷が上記判定条件を満たす場合に、投影方向に沿って領域を分割する。このような2方向の分割を再帰的に繰り返すことにより、対象画像を複数の分割領域に分割する。
次に、抽出部20は、各々の分割領域に含まれる各要素(オブジェクト)に基づいて、各々の分割領域に記述されている内容の種別を判別する。ここでいう種別は、文章、表、画像等である。図1に示す例では、判別された種別に基づき、文章に対応する文章領域32A、32B、表に対応する表領域34、及び画像に対応する画像領域36の4つの領域が判別される。
そして、抽出部20は、判別された領域から、文章領域を抽出する。図1に示す例では、上記4つの領域から、文章領域32A、及び文章領域32Bの2つの領域が抽出される。
取得部22は、例えば記憶部に記憶されている予め定めた対象物の条件を示すデータを読み出すことにより、予め定めた対象物の条件を取得する。予め定めた対象物の条件は、文章領域に含まれる文字、記号、図形等が対象物であると判定するための基準とする条件である。予め定めた対象物の条件としては、後述する対象物を示す参照画像に基づく条件、対象物を構成する線の配置に基づく条件、対象物の高さ等の条件等が例示される。なお、取得部22は、取得手段の一例である。
除外部24は、抽出部20により抽出された文章領域内について、取得部22により取得された予め定めた対象物の条件を満たす対象物を探索して、探索により得られた対象物を、認識部26による文字認識の対象から除外する。なお、除外部24は、除外手段の一例である。
本実施形態では、対象物を探索する方法の一例として、下記(1)又は(2)の何れかの方法を用いる場合について説明する。
(1)予め定めた対象物の条件として、除外対象とする対象物を示す参照画像を取得し、取得した参照画像と類似する文字、記号、図形等を探索する方法。
(2)予め定めた対象物の条件として、除外対象とする対象物を構成する線の配置を示すデータを取得し、取得したデータによって示される線の配置と類似する文字、記号、図形等を探索する方法。
まず、上記(1)の方法を用いて対象物を探索する場合について説明する。
取得部22は、予め定めた対象物の条件として、除外対象とする対象物を示す参照画像52を取得する。取得部22は、例えば、図2に示す対象物42のような、三角形の記号を除外したい場合には、一例として図8に示すように、三角形の記号を示す参照画像52を取得する。
除外部24は、例えば二値化、ラベリング等により、文章領域から文字、記号、図形等に対応する文字候補領域を抽出する。また、除外部24は、抽出した文字候補領域と参照画像52との類似度を算出する。類似度を算出する方法としては、例えば、パターンマッチング手法で一般的に用いられる類似度指標であるSAD(Sum of Abusolute Difference),ZNCC(Zero-means Normalized Cross-Correlation)が挙げられる。また、類似度を算出する他の方法としては、算出対象とする各々の領域を複数の領域(例えば、5×5の格子状の複数の領域)に区分けし、区分けした各々の領域における線の有無、線の長さ、線の向き等に基づく類似度を算出し、算出した類似度を加算する等の方法が挙げられる。
ここでいう線の向きは、例えば水平方向の線(X方向に並行な線)、垂直方向の線(Y方向に並行な線)、左下から右上へと延びる斜めの線(X方向の値が大きくなるに従ってY方向の値が大きくなる線)、左上から右下へと延びる斜めの線(X方向の値が大きくなるに従ってY方向の値が小さくなる線)等である。しかし、類似度を算出する方法としては、一般的に用いられている如何なる既知の方法を用いて良い。
この際、抽出した文字候補領域及び参照画像52の少なくとも一方を拡大又は縮小させることにより、抽出した領域と参照画像52とが等しい大きさ、又は比較し易い大きさとなるようにすると良い。
また、除外部24は、算出した類似度が閾値以上であった場合に、抽出した領域に示される文字、記号、図形等を対象物とみなし、認識部26による文字認識の対象から除外する。
次に、上記(2)の方法を用いて対象物を探索する場合について説明する。
取得部22は、予め定めた対象物の条件として、除外対象とする対象物を構成する線の配置を示すデータを取得する。取得部22は、例えば、図1に示す対象物42のような、三角形の記号を除外したい場合には、一例として図9に示すような三角形を構成する3本の線の配置を示すデータを取得する。図9に示す例では、下記(a)乃至(c)の3本の線が配置されることを示すデータが取得される。これにより、対象画像に含まれる各要素のみを用いて対象物が探索される。
(a)類似度を算出する領域内における左側の領域に、左下から右上へと延びる斜めの線54Aが配置される。
(b)類似度を算出する領域内における右側の領域に、左上から右下へと延びる斜めの線54Bが配置される。
(c)類似度を算出する領域内における下側の領域に、水平方向の線54Cが配置される。
除外部24は、例えば二値化、ラベリング出等により、文章領域から文字、記号、図形等に対応する文字候補領域を抽出する。また、除外部24は、抽出した文字候補領域に含まれる線の配置と、除外対象とする対象物を構成する線の配置との類似度を算出する。類似度を算出する方法としては、一般的に用いられている既知の方法を用いて良い。また、除外部24は、算出した類似度が閾値以上であった場合に、抽出した領域に示される記号又は文字を対象物とみなし、認識部26による文字認識の対象から除外する。
なお、本実施形態では、対象物が三角形である場合について説明したが、対象物の形状はこれに限らない。例えば、五角形の記号を除外したい場合であって、上記(1)の方法を用いる場合には、一例として図10Aに示すように、五角形の記号を示す参照画像56を取得する。また、例えば、五角形の記号を除外したい場合であって、上記(2)の方法を用いる場合には、一例として図10Bに示すように、下記(d)乃至(h)の5本の線が配置されることを示すデータが取得される。
(d)類似度を算出する領域内における左側の領域に、垂直方向の線58Aが配置される。
(e)類似度を算出する領域内における上側の領域に、水平方向の線58Bが配置される。
(f)類似度を算出する領域内における下側の領域に、水平方向の線58Cが配置される。
(g)類似度を算出する領域内における右上側の領域に、左上から右下へと延びる斜めの線58Dが配置される。
(h)類似度を算出する領域内における右下側の領域に、左下から右上へと延びる斜めの線58Eが配置される。
除外部24は、文章領域32Aから、一例として図11に示すように、対象物42を消去することにより、対象物42を認識部26による文字認識の対象から除外する。これにより、文章領域32Aに対して文字認証を行う際に、文章領域32Aの文章40に対して文字認識が行われる。
なお、本実施形態では、文章領域の全体について、取得部22により取得された予め定めた対象物の条件を満たす対象物を探索して、探索により得られた対象物を、認識部26による文字認識の対象から除外する場合について説明した。しかし、これに限らず、文章領域内の一部の領域である探索領域について、取得部22により取得された予め定めた対象物の条件を満たす対象物を探索して、探索により得られた対象物を、認識部26による文字認識の対象から除外しても良い。
本実施形態では、探索領域は、文章領域内において対象物が含まれることが予測される領域である。例えば、改訂事項に関する記号等の対象物は、一例として図2及び図4に示すように、文章領域内の右側の端部を含む端部領域、又は左側の端部を含む端部領域に配置されることが多い。
そこで、一例として図12Aに示すように、文章領域32Aの左側の端部60Aを含む、文章領域の一部の領域である端部領域60(図12Aでドットで示す領域)内について、取得部22により取得された予め定めた対象物の条件を満たす対象物を探索しても良い。なお、端部領域60は、探索領域の一例である。
又は、一例として図12Bに示すように、文章領域46の右側の端部62Aを含む、文章領域の一部の領域である端部領域62(図12Bでドットで示す領域)内について、取得部22により取得された予め定めた対象物の条件を満たす対象物を探索しても良い。なお、端部領域62は、探索領域の一例である。なお、探索領域は、図12Bに示す端部領域62内に限らず、文章領域46に記述されている1行単位の文章の右側端部を探索しても良い。
あるいは、一例として図12Cに示すように、文章領域64の外周部66Aを含む、文章領域の一部の領域である外周領域66(図12Cでドットで示す領域)内について、取得部22により取得された予め定めた対象物の条件を満たす対象物を探索しても良い。なお、外周領域66は、探索領域の一例である。
さらには、文章領域の最も右側に位置する文字、記号、図形等、及び、文章領域の最も左側に位置する文字、記号、図形等の少なくとも一方について、予め定めた対象物の条件を満たすか否かを判定することにより、対象物を探索しても良い。この場合には、文章領域の最も端部に位置し、かつ予め定めた対象物の条件を満たすと判定された文字、記号、図形等が、対象物であると判定される。これにより、文章領域における端部領域又は外周領域等の領域にかかわらず、文章領域内の文字、記号、図形等の配列によって、対象物が探索される。
認識部26は、除外部24により対象物が除外された場合は、除外部24により対象物が除外された文章領域内の文字を認識する。また、認識部26は、文章領域において対象物が見つからず、除外部24により対象物が除外されなかった場合は、抽出部20により抽出された文章領域内の文字を認識する。なお、認識部26は、認識手段の一例である。
次に、本実施形態に係る画像解析装置12が、予め定めた実行指示が入力された場合に実行する画像解析処理の流れを、図13のフローチャートを参照して説明する。なお、本実施形態では、画像解析処理のプログラムは予め記憶部に記憶されているが、これに限らない。例えば、画像解析処理のプログラムが通信回線I/F部を介して外部装置から受信されて記憶部に記憶されても良い。また、CD-ROM等の記録媒体に記録された画像解析処理のプログラムがCD-ROMドライブ等で読み込まれることにより、画像解析処理が実行されるようにしてもよい。
ステップS101では、抽出部20が、画像読取装置14から画像データを入力することにより、対象画像を取得する。
ステップS103では、抽出部20が、入力した対象画像に対してレイアウト解析を行うことにより、対象画像内における文章領域を抽出する。
ステップS105では、取得部22が、予め定めた対象物の条件を取得する。
ステップS107では、除外部24が、抽出された文章領域内について、取得した予め定めた対象物の条件を満たす対象物を探索する。
ステップS109では、除外部24が、抽出された文章領域内に、探索によって対象物が見つかったか否かを判定する。ステップS109で対象物が見つかったと判定した場合(S109、Y)はステップS111に移行する。また、ステップS109で対象物が見つからなかったと判定した場合(S109,N)はステップS113に移行する。
ステップS111では、除外部24が、探索により見つかった対象物を、文字認識の対象から除外する。
ステップS113では、認識部26が、対象物を除いた文章領域内の文字を認識する。
ステップS115では、認識部26が、認識した対象物に関する情報を認識情報として記憶部に記憶させる。
ステップS117では、抽出部20が、次の対象画像が存在するか否かを判定する。ステップS113で次の対象画像が存在すると判定した場合(S117,Y)はステップS101に移行し、次の対象画像について、ステップS101乃至S117の処理を行う。また、次の対象画像が存在しないと判定した場合(S117,N)は本画像解析処理のプログラムの実行を終了する。
このように、本実施形態では、対象画像から文字を含む領域である文章領域を抽出し、予め定めた対象物の条件を取得する。また、抽出された文章領域内について、予め定めた対象物の条件を満たす対象物を探索して、文字認識の対象から除外し、対象物を除いた文章領域内の文字を認識する。対象物を文字認識の対象から除外する際には、文章領域から探索した対象物を消去し、対象物が消去された文章領域内の文字を認識する。
なお、本実施形態では、予め定めた対象物の条件を満たす対象物を探索する場合について説明した。しかし、これに限らず、対象物の文章領域内での配置領域に関する条件を取得し、対象物の文章領域内での配置領域が、対象物の前記文章領域内での配置領域に関する条件を満たす対象物を文字認識の対象から除外しても良い。対象物の文章領域内での配置領域に関する条件としては、例えば、上述した文章領域における外周部を含む外周領域66に配置されていること、文章領域の端部を含む端部領域60、62に配置されていること等が挙げられる。
〔第2実施形態〕
次に、第2実施形態に係る画像解析装置について説明する。
上記第1実施形態では、文章領域内の全ての対象物を消去することにより、当該対象物を認識部26による文字認識の対象から除外する場合について説明した。一方、本第2実施形態では、文章領域内の対象物のうち、高さ、大きさ、及び位置の何れかに関する条件(以下、「高さ等の条件」という。)を満たす対象物のみを消去することにより、当該対象物を認識部26による文字認識の対象から除外する場合について説明する。
第2実施形態に係る画像解析装置の構成は、上記第1実施形態に係る画像解析装置12と同じであるため、各構成の説明を省略する。
次に、本実施形態に係る画像解析装置12が、予め定めた実行指示が入力された場合に実行する画像解析処理の流れを、図14のフローチャートを参照して説明する。なお、本実施形態では、画像解析処理のプログラムは予め記憶部に記憶されているが、これに限らない。例えば、画像解析処理のプログラムが通信回線I/F部を介して外部装置から受信されて記憶部に記憶されても良い。また、CD-ROM等の記録媒体に記録された画像解析処理のプログラムがCD-ROMドライブ等で読み込まれることにより、画像解析処理が実行されるようにしてもよい。
ステップS101乃至S103では、第1実施形態のステップS101乃至S103と同様の処理を行う。
ステップS105では、取得部22が、予め定めた対象物の条件を取得する。この際、取得部22は、除外対象とする対象物を示す参照画像52、又は除外対象とする対象物を構成する線の配置を取得すると共に、高さ等の条件を取得する。ここでいう対象物の高さは、対象物のY方向の長さであり、ここでいう対象物の大きさは、対象物のX方向の長さ及びY方向の長さの少なくとも一方に基づく対象物の大きさである。ここでいう対象物の位置は、対象物のXY座標上における位置である。
また、ここでいう高さ等の条件は、文章領域内の文章を文字認識することを妨げない対象物の高さ、大きさ、及び位置として予め規定された条件である。本実施形態では、高さ等の条件のうちの高さに関する条件を、対象物の高さが文字認識の対象とする文字の高さよりも高いこととする。また、高さ等の条件のうちの大きさに関する条件を、対象物の大きさが、文字認識の対象とする文字の大きさよりも大きいこととする。また、高さ等の条件のうちの位置に関する条件を、対象物のY方向における位置が文章領域内の文章の各行の行間であること等とする。ここでいう「行間である」とは、対象物の高さ方向(Y方向)における位置の範囲が複数の行を跨いでいることとする。また、文字認識の対象とする文字の高さ又は大きさは、予め記憶部に記憶されていても良く、抽出された文字、記号、図形等の各々の高さ又は大きさに基づいて算出しても良い。
なお、上記高さに関する条件は、文字認識における誤差を踏まえて、対象物42の高さが、誤差分を含んだ認識対象の文字の高さの最高値よりも高いこととしても良い。又は、対象物42の高さが、文字認識における誤認識が発生しないことが予め確認された値よりも高いこととしても良い。
同様に、上記大きさに関する条件は、文字認識における誤差を踏まえて、対象物42の大きさが、誤差分を含んだ認識対象の文字の大きさの最高値よりも大きいこととしても良い。又は、対象物42の大きさが、文字認識における誤認識が発生しないことが予め確認された値よりも高いこととしても良い。
また、同様に、上記位置に関する条件は、文字認識における誤差を踏まえて、対象物42の高さ方向における位置の範囲が、高さ方向(Y方向)の長さを、認識対象の文字行の行間の長さの平均値、中央値、最頻値、もしくは最小値とした、認識対象の文字行の行間を跨いでいることとしても良い。又は、上記位置に関する条件に、対象物42の高さ方向における位置の範囲が、認識対象の文字行の行間の平均値、中央値、最頻値、もしくは最小値よりも大きいこと、との追加条件を付加しても良い。あるいは、対象物42の高さ方向における位置の範囲が、文字認識における誤認識が発生しないことが予め確認された位置の範囲であることとしても良い。
ステップS107乃至S111では、第1実施形態のステップS107乃至S111と同様の処理を行う。
一例として図15Aに示すように、文章領域32Aにおける対象物42の高さaが、認識対象の対象となる文章40の文字の高さの最高値bより高い場合には、対象物42は高さ等の条件を満たしている。そのため、抽出された文章領域32A内に、探索によって対象物42が見つかったと判定される。
また、一例として図15Bに示すように、文章領域70における対象物72の高さcが、認識対象の対象となる文章71の文字の高さの最高値dより高くない場合には、対象物72は、高さ等の条件を満たしていない。そのため、抽出された他の対象物も同様に、高さ等の条件を満たしていない場合には、抽出された文章領域70内に、探索によって対象物が見つからなかったと判定される。
なお、文章領域70から、対象物72を消去する場合には、一例として図16に示すように、対象物72を消去することにより、対象物72を認識部26による文字認識の対象から除外する。
ただし、対象物72を構成する線の配置に基づいて対象物72を探索した場合(上記(2)の方法を用いた場合)には、一例として図17に示すように、対象物72を構成する線のみを消去しても良い。この場合には、対象物72を構成する線の内部に記述されている「3」との文字は消去されず、「3」との文字は、認識部26による文字認識の対象となる。
ステップS113乃至S117では、第1実施形態のステップS113乃至S117と同様の処理を行う。
このように、本実施形態では、対象画像から文字を含む領域である文章領域を抽出し、予め定めた対象物の条件を取得する。また、抽出された文章領域内について、予め定めた対象物の条件を満たす対象物を探索する。また、探索された対象物のうち、対象物の高さ、大きさ、及び位置のうちの少なくとも1つが高さ等の条件を満たした対象物を文字認識の対象から除外する。
なお、本実施形態では、予め定めた対象物の条件を満たしている対象物に対して、高さ等の条件を満たしているか否かを判定する場合について説明した。しかし、これに限らず、文章領域に記述された文字、記号、図形等に対して、高さ等の条件を満たしているか否かを判定しても良い。この場合には、予め定めた対象物の条件に関わらず、高さ等の条件を満たしている文字、記号、図形等を対象物として文字認識の対象から除外すると良い。
あるいは、高さ等の条件を満たしている文字、記号、図形等に対して、予め定めた対象物の条件を満たしているか否かを判定し、予め定めた対象物の条件を満たしている文字、記号、図形等を対象物として文字認識の対象から除外しても良い。
〔第3実施形態〕
次に、第3実施形態に係る画像解析装置について説明する。
上記第1実施形態及び第2実施形態では、文章領域内の対象物を消去することにより、当該対象物を認識部26による文字認識の対象から除外する場合について説明した。一方、本第3実施形態では、文章領域内における対象物に対応する領域を非文章領域として文章領域から分離することにより、当該対象物を認識部26による文字認識の対象から除外する場合について説明する。
第2実施形態に係る画像解析装置12の構成は、上記第1実施形態及び第2実施形態に係る画像解析装置12と同じであるため、各構成の説明を省略する。
本実施形態では、除外部24は、抽出部20により抽出された文章領域内について、取得部22により取得された予め定めた対象物の条件を満たす対象物を探索して、探索により得られた対象物に対応する領域を非文章領域として、文章領域から分離する。これにより、探索により得られた対象物は、認識部26による文字認識の対象から除外される。なお、除外手段24は、分離手段の一例でもある。
一例として図18に示すように、文章領域32Aに文章40と対象物42とが記述されていた場合に、除外部24は、文章40に対応する領域80と、対象物42に対応する非文章領域82とを認識し、文章領域32Aから、非文章領域82を分離する。そして、一例として図19に示すように、除外部24は、文章40に対応する領域80のみを文章領域84とする。
なお、除外部24により対象物を探索する方法は、上記第1実施形態の(1)又は(2)の方法と同様である。
次に、本実施形態に係る画像解析装置12が、予め定めた実行指示が入力された場合に実行する画像解析処理の流れを、図20のフローチャートを参照して説明する。なお、本実施形態では、画像解析処理のプログラムは予め記憶部に記憶されているが、これに限らない。例えば、画像解析処理のプログラムが通信回線I/F部を介して外部装置から受信されて記憶部に記憶されても良い。また、CD-ROM等の記録媒体に記録された画像解析処理のプログラムがCD-ROMドライブ等で読み込まれることにより、画像解析処理が実行されるようにしてもよい。
ステップS201乃至S209では、第1実施形態(図13)又は第2実施形態(図14)のS101乃至S109と同様の処理を行う。
ステップS211では、除外部24が、探索により見つかった対象物に対応する領域を非文章領域として、文章領域から非文章領域を分離することにより、対象物を文字認識の対象から除外する。
ステップS213乃至S217では、第1実施形態(図13)又は第2実施形態(図14)のS113乃至S117と同様の処理を行う。
このように、文章領域内における対象物に対応する領域を非文章領域とし、文章領域から分離し、非文章領域が分離された文章領域内の文字を認識する。
また、上記各実施形態で説明した画像解析装置12、12の構成(図6、図7参照。)は一例である。すなわち、本発明の主旨を逸脱しない範囲内において不要な部分を削除したり、新たな部分を追加したりしてもよいことは言うまでもない。
また、上記各実施形態で説明した各種プログラムの処理の流れ(図13、図14、図20参照。)も一例である。すなわち、本発明の主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよいことは言うまでもない。
10 画像解析システム
12 画像解析装置
14 画像読取装置
20 抽出部
22 取得部
24 除外部
26 認識部

Claims (21)

  1. 対象画像から文字を含む領域である文章領域を抽出する抽出手段と、
    予め定めた対象物の条件を取得する取得手段と、
    前記抽出手段により抽出された前記文章領域内について、前記予め定めた対象物の条件を満たす前記対象物を探索して、前記対象物及び前記対象物に重なる文字を文字認識の対象から除外する除外手段と、
    前記対象物及び前記対象物に重なる文字を除いた前記文章領域内の文字を認識する認識手段と、
    を備えた画像解析装置。
  2. 前記除外手段は、前記文章領域から探索した前記対象物及び前記対象物に重なる文字を消去し、
    前記認識手段は、前記除外手段により前記対象物及び前記対象物に重なる文字が消去された前記文章領域内の文字を認識する
    請求項1記載の画像解析装置。
  3. 前記取得手段は、前記対象物を構成する線の配置を取得し、
    前記除外手段は、前記対象物を構成する線の配置により前記対象物を探索して、探索した前記対象物及び前記対象物に重なる文字を構成する線を消去する
    請求項2記載の画像解析装置。
  4. 前記取得手段は、前記対象物を示す参照画像を取得し、
    前記除外手段は、前記参照画像を用いて前記対象物を探索して、前記対象物及び前記対象物に重なる文字を文字認識の対象から除外する
    請求項1~の何れか1項記載の画像解析装置。
  5. 前記取得手段は、前記対象物の高さ、大きさ、及び位置の何れかに関する条件を取得し、
    前記除外手段は、前記対象物の高さ、大きさ、及び位置の何れかが前記対象物の高さ、大きさ、及び位置の何れかに関する条件を満たした前記対象物及び前記対象物に重なる文字を文字認識の対象から除外する
    請求項1~の何れか1項記載の画像解析装置。
  6. 前記取得手段は、前記対象物の高さ、大きさ、及び位置の何れかに関する条件を取得し、
    前記除外手段は、前記除外手段により探索された前記対象物のうち、前記対象物の高さ、大きさ、及び位置の何れかが前記対象物の高さ、大きさ、及び位置の何れかに関する条件を満たした前記対象物及び前記対象物に重なる文字を文字認識の対象から除外する
    請求項1~の何れか1項記載の画像解析装置。
  7. 前記取得手段は、前記予め定めた対象物の条件として、前記対象物の前記文章領域内での配置領域に関する条件を取得し、
    前記除外手段は、前記対象物の前記文章領域内での配置領域が、前記対象物の前記文章領域内での配置領域に関する条件を満たす前記対象物及び前記対象物に重なる文字を文字認識の対象から除外する
    請求項1~の何れか1項記載の画像解析装置。
  8. 前記取得手段は、前記文章領域の一部の領域である探索領域を取得し、
    前記除外手段は、前記探索領域内について、前記対象物を探索して、前記対象物及び前記対象物に重なる文字を文字認識の対象から除外する
    請求項1~の何れか1項記載の画像解析装置。
  9. 対象画像から文字を含む領域である文章領域を抽出する抽出手段と、
    予め定めた対象物の条件を取得する取得手段と、
    前記抽出手段により抽出された前記文章領域内について、前記予め定めた対象物の条件を満たす前記対象物を探索して、前記対象物に囲まれた領域を文字認識の対象から除外する除外手段と、
    前記対象物に囲まれた領域を除いた前記文章領域内の文字を認識する認識手段と、
    を備えた画像解析装置。
  10. 前記除外手段は、前記文章領域から探索した前記対象物に囲まれた領域を消去し、
    前記認識手段は、前記除外手段により前記対象物に囲まれた領域が消去された前記文章領域内の文字を認識する
    請求項記載の画像解析装置。
  11. 前記取得手段は、前記対象物を構成する線の配置を取得し、
    前記除外手段は、前記対象物を構成する線の配置により前記対象物を探索して、探索した前記対象物に囲まれた領域を構成する線を消去する
    請求項10記載の画像解析装置。
  12. 前記取得手段は、前記対象物を示す参照画像を取得し、
    前記除外手段は、前記参照画像を用いて前記対象物を探索して、前記対象物に囲まれた領域を文字認識の対象から除外する
    請求項11の何れか1項記載の画像解析装置。
  13. 前記取得手段は、前記対象物の高さ、大きさ、及び位置の何れかに関する条件を取得し、
    前記除外手段は、前記対象物の高さ、大きさ、及び位置の何れかが前記対象物の高さ、大きさ、及び位置の何れかに関する条件を満たした前記対象物に囲まれた領域を文字認識の対象から除外する
    請求項12の何れか1項記載の画像解析装置。
  14. 前記取得手段は、前記対象物の高さ、大きさ、及び位置の何れかに関する条件を取得し、
    前記除外手段は、前記除外手段により探索された前記対象物のうち、前記対象物の高さ、大きさ、及び位置の何れかが前記対象物の高さ、大きさ、及び位置の何れかに関する条件を満たした前記対象物に囲まれた領域を文字認識の対象から除外する
    請求項12の何れか1項記載の画像解析装置。
  15. 前記取得手段は、前記予め定めた対象物の条件として、前記対象物の前記文章領域内での配置領域に関する条件を取得し、
    前記除外手段は、前記対象物の前記文章領域内での配置領域が、前記対象物の前記文章領域内での配置領域に関する条件を満たす前記対象物に囲まれた領域を文字認識の対象から除外する
    請求項14の何れか1項記載の画像解析装置。
  16. 前記取得手段は、前記文章領域の一部の領域である探索領域を取得し、
    前記除外手段は、前記探索領域内について、前記対象物を探索して、前記対象物に囲まれた領域を文字認識の対象から除外する
    請求項15の何れか1項記載の画像解析装置。
  17. 前記対象物の高さ、大きさ、及び位置の何れかに関する条件は、前記対象物の高さが、前記認識手段による文字認識の対象とする文字の高さよりも高いこと、前記対象物の大きさが、前記認識手段による文字認識の対象とする文字の大きさよりも大きいこと、及び、前記対象物の高さ方向における位置が前記文章領域内の文章の各行の行間であることの何れかである
    請求項5、6、13、14の何れか1項記載の画像解析装置。
  18. 前記対象物が含まれる範囲は、前記文章領域の端部を含む前記文章領域の一部の領域である
    請求項8又は16記載の画像解析装置。
  19. 前記除外手段は、前記参照画像を拡大または縮小させた画像を用いて前記対象物を探索する、
    請求項4又は12記載の画像解析装置。
  20. 前記参照画像は文字、記号、又は図形である
    請求項4、12、19の何れか1項記載の画像解析装置。
  21. コンピュータを、請求項1~20の何れか1項記載の画像解析装置の各手段として機能させるためのプログラム。
JP2017157278A 2017-08-16 2017-08-16 画像解析装置及び画像解析プログラム Active JP7039882B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017157278A JP7039882B2 (ja) 2017-08-16 2017-08-16 画像解析装置及び画像解析プログラム
US15/912,926 US10984277B2 (en) 2017-08-16 2018-03-06 Image analysis apparatus, image analysis method, and non-transitory computer readable medium
CN201810311174.8A CN109409180B (zh) 2017-08-16 2018-04-09 图像分析装置和图像分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017157278A JP7039882B2 (ja) 2017-08-16 2017-08-16 画像解析装置及び画像解析プログラム

Publications (2)

Publication Number Publication Date
JP2019036146A JP2019036146A (ja) 2019-03-07
JP7039882B2 true JP7039882B2 (ja) 2022-03-23

Family

ID=65361284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017157278A Active JP7039882B2 (ja) 2017-08-16 2017-08-16 画像解析装置及び画像解析プログラム

Country Status (3)

Country Link
US (1) US10984277B2 (ja)
JP (1) JP7039882B2 (ja)
CN (1) CN109409180B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019067025A (ja) * 2017-09-29 2019-04-25 京セラドキュメントソリューションズ株式会社 画像形成装置
JP7446320B2 (ja) 2019-09-12 2024-03-08 株式会社ソニー・インタラクティブエンタテインメント 画像処理装置、ヘッドマウントディスプレイ、および空間情報取得方法
CN111046168B (zh) * 2019-12-19 2023-12-01 智慧芽信息科技(苏州)有限公司 用于生成专利概述信息的方法、装置、电子设备和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092967A (ja) 1999-09-22 2001-04-06 Toshiba Corp 図面認識装置および図面認識方法
JP2004122084A (ja) 2002-10-07 2004-04-22 Toshiba Corp 料額印認識装置、料額印認識方法、郵便物処理装置および郵便物処理方法
JP2011243201A (ja) 2010-05-13 2011-12-01 King Abdulaziz City For Science & Technology (Kacst) 光学式文字認識用に画像を前処理するための方法およびシステム
JP2014191825A (ja) 2013-03-27 2014-10-06 Fujitsu Ltd 画像処理方法及び画像処理装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69032712T2 (de) * 1989-06-14 1999-07-01 Hitachi, Ltd., Tokio/Tokyo Hierarchischer vorsuch-typ dokument suchverfahren, vorrichtung dazu, sowie eine magnetische plattenanordnung für diese vorrichtung
JPH07131641A (ja) * 1993-11-08 1995-05-19 Canon Inc 画像処理装置
JP3442847B2 (ja) * 1994-02-17 2003-09-02 三菱電機株式会社 文字読取装置
JP3307782B2 (ja) * 1994-10-11 2002-07-24 三菱電機株式会社 文字マーク認識装置
JP3190794B2 (ja) * 1994-10-26 2001-07-23 沖電気工業株式会社 文字切り出し装置
JP3086653B2 (ja) * 1996-03-15 2000-09-11 三洋電機株式会社 文字認識方法及び文字認識装置
JPH10134144A (ja) 1996-10-29 1998-05-22 Meidensha Corp 図面の認識方法
JP2002057873A (ja) * 2000-08-08 2002-02-22 Nec Eng Ltd プレ印刷除去装置及び方法
US7272258B2 (en) * 2003-01-29 2007-09-18 Ricoh Co., Ltd. Reformatting documents using document analysis information
JP3909697B2 (ja) 2003-01-31 2007-04-25 株式会社日立製作所 図面認識方法及びその装置
JP4423076B2 (ja) * 2004-03-22 2010-03-03 キヤノン株式会社 認識対象切出し装置および方法
JP4384240B2 (ja) * 2008-05-28 2009-12-16 株式会社東芝 画像処理装置、画像処理方法、画像処理プログラム
JP4623169B2 (ja) * 2008-08-28 2011-02-02 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US9189472B2 (en) * 2009-03-30 2015-11-17 Touchtype Limited System and method for inputting text into small screen devices
CN102446274B (zh) * 2010-09-30 2014-04-16 汉王科技股份有限公司 带有下划线的文本图像预处理方法和装置
JP5874497B2 (ja) * 2012-03-30 2016-03-02 ブラザー工業株式会社 画像処理装置および画像処理プログラム
JP6071289B2 (ja) * 2012-07-09 2017-02-01 キヤノン株式会社 画像処理装置、画像処理方法、およびプログラム
JP5831420B2 (ja) * 2012-09-28 2015-12-09 オムロン株式会社 画像処理装置および画像処理方法
CN104537376B (zh) * 2014-11-25 2018-04-27 深圳创维数字技术有限公司 一种识别台标的方法及相关设备、系统
JP6607122B2 (ja) * 2016-03-30 2019-11-20 ブラザー工業株式会社 画像解析装置
JP6708476B2 (ja) * 2016-05-27 2020-06-10 キヤノン株式会社 文書保存処理システム
CN106250816A (zh) * 2016-07-19 2016-12-21 武汉依迅电子信息技术有限公司 一种基于双摄像头的车道线识别方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092967A (ja) 1999-09-22 2001-04-06 Toshiba Corp 図面認識装置および図面認識方法
JP2004122084A (ja) 2002-10-07 2004-04-22 Toshiba Corp 料額印認識装置、料額印認識方法、郵便物処理装置および郵便物処理方法
JP2011243201A (ja) 2010-05-13 2011-12-01 King Abdulaziz City For Science & Technology (Kacst) 光学式文字認識用に画像を前処理するための方法およびシステム
JP2014191825A (ja) 2013-03-27 2014-10-06 Fujitsu Ltd 画像処理方法及び画像処理装置

Also Published As

Publication number Publication date
CN109409180A (zh) 2019-03-01
CN109409180B (zh) 2023-08-18
JP2019036146A (ja) 2019-03-07
US10984277B2 (en) 2021-04-20
US20190057276A1 (en) 2019-02-21

Similar Documents

Publication Publication Date Title
JP6878034B2 (ja) 情報処理装置、制御方法、およびプログラム
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP7039882B2 (ja) 画像解析装置及び画像解析プログラム
EP2241999A2 (en) Underline removal apparatus
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP4704601B2 (ja) 文字認識方法,プログラム及び記録媒体
EP2816506A1 (en) Character-recognition method and character-recognition device and program using said method
JP5538812B2 (ja) 画像処理装置、画像処理方法及びプログラム
KR20020009476A (ko) 문서처리장치 및 방법
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP7338159B2 (ja) 情報処理装置及びプログラム
JP6561876B2 (ja) 情報処理装置及びプログラム
JP5039659B2 (ja) 文字認識方法及び文字認識装置
JP4078045B2 (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JPS6245581B2 (ja)
JP2917427B2 (ja) 図面読取装置
JP6489041B2 (ja) 情報処理装置及びプログラム
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP3133797B2 (ja) 文字認識方法及びその装置
JP5361315B2 (ja) 情報処理装置及び情報処理方法
JP5344956B2 (ja) 文字認識方法および文字認識装置
JP4878057B2 (ja) 文字認識方法,プログラム及び記録媒体
JP5630098B2 (ja) 情報処理装置およびプログラム
JP2005242825A (ja) 帳票読取装置及び帳票読取装置による帳票方向判定方法
JP4915337B2 (ja) 印刷データ処理プログラム、方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200717

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220221

R150 Certificate of patent or registration of utility model

Ref document number: 7039882

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150