JP2012204906A - 画像処理装置およびプログラム - Google Patents

画像処理装置およびプログラム Download PDF

Info

Publication number
JP2012204906A
JP2012204906A JP2011065403A JP2011065403A JP2012204906A JP 2012204906 A JP2012204906 A JP 2012204906A JP 2011065403 A JP2011065403 A JP 2011065403A JP 2011065403 A JP2011065403 A JP 2011065403A JP 2012204906 A JP2012204906 A JP 2012204906A
Authority
JP
Japan
Prior art keywords
color
character string
character
image
color component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011065403A
Other languages
English (en)
Other versions
JP5673277B2 (ja
Inventor
Kunitoshi Yamamoto
訓稔 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2011065403A priority Critical patent/JP5673277B2/ja
Publication of JP2012204906A publication Critical patent/JP2012204906A/ja
Application granted granted Critical
Publication of JP5673277B2 publication Critical patent/JP5673277B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】ユーザによる書き込みがなされた原稿から、該書き込みを反映した文字列を取得する。
【解決手段】画像データを複数の色成分に分解する色分解部211と、複数の色成分のうち、K色成分の画像データにおいて、予め定めた領域Aに対して文字認識処理を行い、ファイル名候補文字列を抽出する文字列抽出部212と、K色成分とは異なる他の色成分の画像データにおいてファイル候補文字列を含む領域Bに存在する他の色成分の画像と、ファイル名候補文字列とが予め定めた関係にある場合に、他の色成分の画像データにおいて、領域Bに対して文字認識処理を行い、他の色成分の文字を認識する他色文字認識部215と、他の色成分の画像とファイル名候補文字列との関係、及び、他色文字認識部215により認識された他の色成分の文字の少なくともいずれかに基づいて、抽出された文字列を修正する修正部213と、を備える。
【選択図】図3

Description

本発明は、画像処理装置およびプログラムに関する。
スキャナ等の画像読取手段で読み取った原稿画像中の文字を認識し、認識した文字列を利用する技術が開発されている。
特許文献1には、画像ファイルに付与すべきファイル名を生成する生成手段と、ファイル名を付与するべき画像ファイルに対して文字認識処理を行い、ファイル名を構成する要素となる文字列を抽出文字列として抽出可能な文字列抽出手段と、を備えるファイル名生成システムが開示されている。
特許文献2には、イメージデータから最大文字サイズの文字列を探索し、探索された最大文字サイズの文字列を含む所定領域のイメージデータを抽出して文書タイトルとして登録する電子ファイル装置が開示されている。
特許文献3には、印鑑が押印された印影領域を検出し、印影領域のカラー画像から印影を消去した2値画像を生成し、入力された白黒2値画像に当該印影を消去した2値画像を貼り付け合成し、合成した2値画像を基に文字を認識する帳票読取装置が開示されている。
特開2010−165019号公報 特開平7−200625号公報 特開2005−92543号公報
本発明は、ユーザによる書き込みがなされた原稿から、該書き込みを反映した文字列を取得する画像処理装置及びプログラムを提供することを目的とする。
請求項1に記載の画像処理装置は、原稿を読み取って生成した画像データを複数の色成分に分解する色分解部と、前記複数の色成分のうち、第1の色成分の画像データにおいて、予め定めた第1の領域に対して文字認識処理を行い、文字列を抽出する文字列抽出部と、前記第1の色成分とは異なる他の色成分の画像データにおいて前記文字列を含む第2の領域に存在する他の色成分の画像と、前記抽出された文字列とが予め定めた関係にある場合に、前記他の色成分の画像データにおいて、前記第2の領域に対して文字認識処理を行い、前記他の色成分の文字を認識する他色文字認識部と、前記他の色成分の画像と前記抽出された文字列との関係、及び、前記他色文字認識部により認識された前記他の色成分の文字の少なくともいずれかに基づいて、前記抽出された文字列を修正する修正部と、を備える。
請求項2に記載の画像処理装置は、請求項1に記載の画像処理装置において、前記修正部は、前記抽出された文字列に前記他の色成分の画像が重なる場合、前記抽出された文字列に含まれる文字のうち、前記他の色成分の画像と重なる文字を、前記抽出された文字列から削除することを特徴とする。
請求項3に記載の画像処理装置は、請求項1又は2に記載の画像処理装置において、前記修正部は、前記抽出された文字列に前記他の色成分の画像が重なる場合、前記抽出された文字列に含まれる文字のうち、前記他の色成分の画像と重なる文字を、前記他色文字認識部が認識した前記他の色成分の文字によって置換することを特徴とする。
請求項4に記載の画像処理装置は、請求項1から3のいずれか1項に記載の画像処理装置において、前記他の色成分の画像データにおいて、前記第2の領域に予め定められた記号が存在する場合、前記修正部は、前記他色文字認識部が認識した文字を前記抽出した文字列に挿入することを特徴とする。
請求項5に記載の画像処理装置は、請求項1から4のいずれか1項に記載の画像処理装置において、ユーザに使用されたことがある文字列を格納する辞書格納部と、前記修正部が修正した文字列が前記辞書格納部に含まれない場合、前記辞書格納部に格納された文字列の中から、前記修正部により修正された文字列と類似する文字列を検出し、前記第1の領域に含まれる文字列の抽出結果として決定する文字列決定部と、を備えることを特徴とする。
請求項6に記載のプログラムは、コンピュータに、原稿を読み取って生成した画像データを複数の色成分に分解する色分解ステップと、前記複数の色成分のうち、第1の色成分の画像データにおいて、予め定めた第1の領域に対して文字認識処理を行い、文字列を抽出する文字列抽出ステップと、前記第1の色成分とは異なる他の色成分の画像データにおいて前記抽出された文字列を含む第2の領域に存在する他の色成分の画像と、前記抽出された文字列とが予め定めた関係にある場合に、前記他の色成分の画像データにおいて、前記第2の領域に対して文字認識処理を行い、前記他の色成分の文字を認識する他色文字認識ステップと、前記他の色成分の画像と前記抽出された文字列との関係、及び、前記他色文字認識部により認識された前記他の色成分の文字の少なくともいずれかに基づいて、前記抽出された文字列を修正する修正ステップと、を実行させる。
請求項1に記載の画像処理装置によれば、ユーザによる書き込みがなされた原稿から、該書き込みを反映した文字列が取得される。
請求項2に記載の画像処理装置によれば、ユーザが元の原稿に対して行った、削除を意図する書き込みを反映した文字列が取得される。
請求項3に記載の画像処理装置によれば、ユーザが元の原稿に対して行った、置換を意図する書き込みを反映した文字列が取得される。
請求項4に記載の画像処理装置によれば、ユーザが元の原稿に対して行った、文字の挿入を意図する書き込みを反映した文字列が取得される。
請求項5に記載の画像処理装置によれば、本構成を有しない場合と比較して、抽出結果として提示される文字列の認識精度が向上する。
請求項6に記載のプログラムによれば、ユーザによる書き込みがなされた原稿から、該書き込みを反映した文字列が取得される。
実施形態に係る画像処理装置を含む画像処理システムの構成の一例を示す図である。 画像処理装置のハードウェア構成の一例を示す図である。 画像処理装置が備える機能の一例を示す機能ブロック図である。 色分解部の処理により作成される画像データの一例を示す図である。 ファイル名の候補となる文字列を抽出する領域、及び、ファイル名の候補となる文字列を含む領域について説明するための図である。 記号格納部に格納される情報の例を示す図である。 辞書格納部に格納されるユーザ辞書の一例を示す図である。 画像処理装置が実行するファイル名決定処理の一例を示すフローチャートである。 画像処理装置が実行するファイル名決定処理の一例を示すフローチャートである。 画像読取装置から受け付けた各画像データに対し、図8のステップS11〜ステップS47の処理を実行した場合に得られるファイル名候補1を説明するための図である。
以下、本発明の実施形態について、添付図面を参照しつつ説明する。
まず、実施形態に係る画像処理装置について説明する。図1(A)及び(B)は、実施形態に係る画像処理装置を含む画像処理システムの構成の一例を示す図である。
図1(A)において、画像処理システム100Aは、情報処理装置200と画像形成装置300とを備える。情報処理装置200と画像形成装置300とは、通信手段400で接続されており、相互に通信が可能である。情報処理装置200としては、例えば、パーソナルコンピュータが挙げられる。画像形成装置300としては、例えば、コピー機、プリンタ、及びファクシミリ(FAX)送受信装置等の他、コピー機能、プリント機能、FAX送受信機能等のうちいずれか複数の機能を備える、いわゆる複合機があげられる。
画像形成装置300は、通信装置10、画像処理装置20、画像読取装置30、及び画像出力装置40を備える。通信装置10は、通信手段400を介して画像形成装置300と接続する他の装置(例えば、情報処理装置200)とデータの送受信を行う。例えば、通信装置10は、画像処理を施した画像を画像処理装置20から受付け、情報処理装置200に送信する。また、通信装置10は、例えば、情報処理装置200から受け付けた画像データを画像処理装置20に出力する。
画像読取装置30は、例えばスキャナであり、原稿台に置かれた原稿を読み取り、読み取った原稿画像を画像処理装置30に出力する。
画像処理装置20は、通信装置10から受け付けた画像データを、画像出力装置40が出力可能なデータ形式に変換する。また、画像処理装置20は、画像読取装置30が読み取った画像データを画像読取装置30から受付け、画像出力装置40が出力可能なデータ形式に変換する。画像処理装置20は、変換した画像データを画像出力装置40に出力する。
また、画像処理装置20は、画像読取装置30が読み取った画像データに基づき、当該画像データに対して付されるファイル名を自動で決定し、通信装置10を介して情報処理装置200へと送信する。
画像出力装置40は、画像処理装置20から出力対象の画像データを受け付け、受け付けた画像データに基づく画像を用紙上に形成し、出力する。
図1(A)では、画像形成装置300が画像処理装置20を備える実施形態について示した。図1(B)では、情報処理装置(例えば、パーソナルコンピュータ等)が画像処理装置として機能する実施形態について示す。図1(B)において、画像処理システム100Bは、画像処理装置として機能する情報処理装置500と、画像読取装置600とを備える。情報処理装置500及び画像読取装置600は、通信手段400により接続され相互に通信可能である。画像読取装置600は、例えばスキャナであり、情報処理装置500からの指示に基づいて、原稿台に置かれた原稿を読み取り、読み取った原稿画像を情報処理装置500に送信する。
情報処理装置500は、画像読取装置600に対して、原稿の読み取りを指示し、画像読取装置600が読み取った原稿画像を受信する。情報処理装置500は、受信した原稿画像を情報処理装置500が備える記憶装置に記憶する。情報処理装置500は、原稿画像を記憶装置に記憶する際のファイル名を、原稿画像に基づき決定する。
以降は、画像形成装置300が備える画像処理装置20について説明を行う。しかしながら、図1(B)の情報処理装置500が、画像処理装置として機能してもよい。また、以降の説明では、画像読取装置30が読み取った画像データ中の文字列を認識し、認識した文字列をファイル名として利用する例について説明する。また、以下の説明では、ユーザが書き込みを行う前の原稿を「元の原稿(または、元原稿)」と記載し、ユーザが書き込みを行った後の原稿を単に「原稿」と記載する。また、本実施形態において、元の原稿は白黒印刷されており、ユーザによる書き込みは、黒以外の色を用いて行われているものとする。
画像処理装置20のハードウェア構成の一例について説明する。図2は、画像処理装置20のハードウェア構成の一例を示す図である。
画像処理装置20は、入出力部201、ROM(Read Only Memory)202、CPU(Central Processing Unit)203、RAM(Random Access Memory)204、及びHDD(Hard Disk Drive)205を備える。
入出力部201は、通信装置10、画像読取装置30、及び画像出力装置40とデータの送受信を行う。ROM202は、画像読取装置30から受け付けた画像データからファイル名を作成するプログラム(詳細は、後述する)等を格納する。CPU203は、ROM202に格納されたプログラムを読み込んで実行する。RAM204は、プログラムを実行する際に使用される一時的なデータを保存する。HDD205は、画像読取装置30から受け付けた画像データ、画像データからファイル名を作成するプログラムで使用される挿入系記号に係るデータ(詳細は後述する)等を記憶する。
次に、画像処理装置20が備える機能の一例について説明する。図3は、画像処理装置20が備える機能の一例を示す機能ブロック図である。画像処理装置20は、色分解部211、文字列抽出部212、修正部213、記号格納部214、他色文字認識部215、ファイル名決定部216、及び辞書格納部217を備える。記号格納部214及び辞書格納部217は、例えば、HDD205で構成される。色分解部211、文字列抽出部212、修正部213、他色文字認識部215、及びファイル名決定部216は、ROM202に格納されたプログラムのCPU203による演算によって実現される。なお、ファイル名決定部216は、文字列決定部の一例である。
色分解部211は、画像読取装置30からファイル名を作成する対象となる画像データを受け付ける。なお、色分解部211は、HDD205等に保存されている画像データを、ファイル名を作成する対象となる画像データとして取得してもよい。
色分解部211は、画像読取装置30から受け付けた画像データを、例えば、CMYK(C:シアン、M:マゼンタ、Y:イエロー、K:クロ)の各色成分の画像データに分解する。あるいは、色分解部211は、K色の画像データとK色以外の色成分の画像データ(以後、他色の画像データと記載する)とに画像データを分解してもよい。例えば、色分解部211が、図4(A)に示す画像データを画像読取装置30から受け付けたとする。ここで、図4(A)においては、「標準化規格会議議事録」及び「■日時:2010/10/15」以降の文字が、あらかじめ元の原稿に印刷されており、それ以外の文字や図形(図4(C))が、ユーザによって書き込まれたものとする。また、「標準化規格会議議事録」及び「■日時:2010/10/15」以降の文字の色は、K色である。この場合、色分解部211は、K色の画像データ(図4(B))と、他色の画像データ(図4(C))とに、画像読取装置30から受け付けた画像データを分解する。
色分解部211は、各色成分の画像データを文字列抽出部212、修正部213、及び他色文字認識部215に出力する。
文字列抽出部212は、色分解部211から各色成分の画像データを受け付ける。文字列抽出部212は、各色成分の画像データのうち、例えば、K色の画像データからファイル名候補となる文字列(以下、ファイル名候補文字列と記載する)を抽出する。具体的には、文字列抽出部212は、K色の画像データにおいて、予め定められた領域(領域Aと記載する)に対して文字認識を行い、ファイル名候補となる文字列を抽出する。例えば、K色の画像データに含まれる最初の一行をファイル名として利用するとする。この場合、領域Aは、例えば、K色の画像データの左上原点から、2行目のK色文字列(■日時:2010/10/15)の前の行までの矩形の領域(図5(A)に破線で示す)となる。なお、領域Aの決定方法は、本実施形態に限られるものではない。
文字列抽出部212は、抽出した文字列を修正部213に出力する。なお、図5(A)の例では、文字列抽出部212は、「標準化規格会議議事録」の文字列を抽出する。この場合、「標準化規格会議議事録」がファイル名候補文字列となる。また、文字列抽出部212は、抽出した文字列が存在する画像上の座標情報を、修正部213に出力する。
修正部213は、色分解部211から、各色成分の画像データを受け付ける。また、修正部213は、文字列抽出部212から、ファイル名候補文字列、及び、ファイル名候補文字列が存在する画像上の座標情報を受け付ける。
修正部213は、K色の画像データにおいて存在するファイル名候補文字列と、K色以外の色成分(CMY色)の画像データに基づいて、ファイル名候補文字列を修正する。具体的には、修正部213は、他色の画像データにおいて、ファイル名候補文字列を含む領域(領域Bと記載する)に存在する図形、記号、及び文字に基づいて、ファイル名候補文字列を修正する。なお、本実施形態では、図5(B)に示すように、領域Bは、画像データの左上を原点として垂直方向をY軸、水平方向をX軸とした場合に、ファイル名候補文字列が存在するY座標(図中、点線で表示)を中心とし、垂直方向に予め定めた画素数を含む領域(図中、一点鎖線で示す)であるとする。なお、本実施形態では、領域Aと領域Bとは、位置及び大きさが異なっているが、領域Aと領域Bとは同一の領域でもよい。
修正部213は、後述する記号格納部214に格納されている図形が、他色の画像データの領域Bに存在するか否か、及び、他色の画像データに含まれる画像が、ファイル名候補文字列と重なる位置に存在するか否か判定する。領域Bに記号格納部214に格納されている図形が存在する場合、または、他色の画像データに含まれる画像がファイル名候補文字列と重なる位置に存在する場合、修正部213は、他色の画像データに対して文字認識処理を行うよう、他色文字認識部215に指示する。他色文字認識部215によって文字が認識された場合、修正部213は、認識された文字を用いて、ファイル名候補文字列を修正する。他色文字認識部215によって文字が認識されなかった場合、ファイル名候補文字列と他色の画像データに含まれる画像との関係に基づいて、ファイル名候補文字列を修正する。ファイル名候補文字列の修正処理の詳細については、後にフローチャートを用いて詳述する。
修正部213は、修正したファイル名候補文字列をファイル名決定部216に出力する。
記号格納部214は、文字列に対する修正が必要なことを意味する図形に関する情報を格納する。ここで、図6を用いて記号格納部214が格納する情報について説明する。図6(A)は、記号格納部214に格納される情報の一例を示す図である。
図6(A)に示すように、記号格納部214は、例えば、「No.」、「図形」、「K色文字列に対する相対位置」、「意味」、及び「手書き文字の位置」を格納する。「No.」は、各データを一意に識別するための番号である。
「図形」は、ファイル名候補文字列を含む領域Bに存在するか否かが判定される図形を表す。「K色文字列に対する相対位置」は、「図形」が、ファイル名候補文字列に対して相対的に上に位置するのか、下に位置するのかを表す。「意味」は、「図形」が「K色文字列に対する相対位置」に存在する場合に、ファイル名候補文字列に対して実行される処理を表す。図6(A)の例では、「意味」は、ユーザが元の原稿に書き入れた文字を、いずれの位置に挿入すればよいかを表す。例えば、“右下挿入”は、図形の右下が指す位置に、手書き文字を挿入することを意味する。
「手書き文字の位置」は、「図形」が「K色文字列に対する相対位置」にある場合に、「図形」に対してどの位置に存在する手書きの文字を、ファイル候補文字列に対して挿入するのかを表す。例えば、“規定矩形内、左上”は、ファイル候補文字列を含む予め定めた領域(領域B)内であって、「図形」に対して左上に存在する手書きの文字をファイル候補文字列に対して挿入することを表す。
例えば、図6(B)に示す画像データが存在し、「標準化企会議議事録」のみが、K色の文字列であるとする。この場合、他色の画像データに含まれる図形は、K色の文字列に対して相対的に上の位置に存在するため、No.2の図形に該当する。この場合、図形の右上に存在する「画」の手書きの文字が、図形の左下が指す「企」と「会」との間に挿入される。
また、例えば、図6(C)に示す画像データが存在し、「標準化企会議議事録」のみが、K色の文字列であるとする。この場合、他色の画像データに含まれる図形は、K色の文字列に対して相対的に下の位置に存在し、No.9の図形に該当する。この場合、図形の下に存在する「画」の手書きの文字が、図形の頂点の上の位置(「企」と「会」との間)に挿入される。
また、例えば、図6(D)に示す画像データが存在し、「標準化企会議議事録」のみが、K色の文字列であるとする。この場合、他色の画像データに含まれる図形は、K色の文字列に対して相対的に上の位置に存在し、No.10の図形に該当する。この場合、図形の上に存在する「画」の手書きの文字が、図形の頂点の下の位置(「企」と「会」との間)に挿入される。
図3に戻り説明を続ける。他色文字認識部215は、色分解部211から、各色成分の画像データを受け付ける。また、他色文字認識部215は、他色の画像データに対する文字認識処理の実行指示を修正部213から受け付ける。他色文字認識部215は、文字列の抽出が行われたK色以外の色成分の画像データにおいて、文字認識処理を行う。他色文字認識部215は、認識した文字を修正部213に出力する。
辞書格納部217は、過去にファイル名として使用された文字列を登録したユーザ辞書を格納する。図7は、ユーザ辞書の一例を示す図である。図7に示すように、ユーザ辞書は、「文字列」と「登録日」とを項目として有している。「文字列」には、ユーザが過去にファイル名として使用した文字列が格納される。「登録日」には、「文字列」が登録された日付が格納される。例えば、「標準化会議議事録」という文字列は、2010年10月10日に登録されている。
ファイル名決定部216は、修正部213からファイル名候補文字列を受け付ける。ファイル名決定部216は、ファイル名候補文字列が、辞書格納部217に格納されたユーザ辞書に存在するか否か判定する。ファイル名候補文字列が辞書格納部217に格納されたユーザ辞書に存在する場合、ファイル名決定部216は、修正部213から受け付けたファイル名候補文字列をユーザに提示する。ユーザが提示したファイル名候補文字列を承認した場合、修正部213は、ファイル名候補文字列をファイル名として決定し、通信装置10に出力する。
また、ファイル名候補文字列が辞書格納部217に格納された辞書に存在しない場合、ファイル名決定部216は、辞書格納部217に格納された辞書に存在する文字列の中から、ファイル名候補文字列と類似度が高い文字列を取得する。ファイル名決定部216は、取得した文字列と、ファイル名候補文字列とをユーザに提示し、ファイル名の選択を受け付ける。ファイル名決定部216は、選択されたファイル名を通信装置10に出力する。通信装置10は、画像読取装置30で読み取った画像データに、ファイル名決定部216が決定したファイル名を付して、情報処理装置200に送信する。なお、ファイル名候補文字列と、ユーザ辞書に存在する文字列との類似度は、例えば、特開2011−8553号公報等に記載の技術の他、従来から存在する技術を用いて算出される。
次に、画像処理装置20が実行するファイル名の決定処理の一例について説明する。図8及び9は、画像処理装置20が実行する処理の一例を示すフローチャートである。
まず、画像処理装置20は、画像読取装置30が読み取った画像データに対して付すファイル名を、ユーザがマニュアルで入力するのか、画像処理装置20が自動で決定するのかについてファイル名の決定方法をユーザから受け付ける(ステップS11)。具体的には、画像処理装置20は、不図示の表示装置に表示された操作画面を介して、ユーザからファイル名の決定方法を受け付ける。
次に、色分解部211は、ファイル名を画像処理装置20が自動で決定するファイル名の自動決定が選択されたか否か判定する(ステップS13)。
ファイル名の自動決定が選択されていない場合(ステップS13/NO)、ファイル名決定部216は、操作画面を介してファイル名の入力を受け付け(ステップS47)、本処理を終了する。
ファイル名の自動決定が選択された場合(ステップS13/YES)、色分解部211は、画像読取装置30から受け付けた画像を、CMYKの各色成分に分解する。次に、色分解部211は、各色成分に分解された画像に対し2値化処理を行い、色成分毎の2値化画像を生成する(ステップS17)。この2値化画像のデータが、各色成分の画像データとなる。
次に、文字列抽出部212が、ファイル名候補文字列を抽出する画像データとして、K色の画像データを選択する(ステップS19)。文字列抽出部212は、K色の画像データの領域Aに対して文字認識処理を行い、ファイル名候補文字列を抽出する(ステップS21)。
次に、修正部213は、ファイル名候補文字列が含まれる矩形領域Bを決定する(ステップS23)。修正部213は、CMY各色成分の画像データにおいて、矩形領域B内にCMY色の画像(図形画像や文字画像等)が存在するか否か判定する(ステップS25)。領域B内に、CMY色の画像が存在しない場合(ステップS25/NO)、修正部213は、ファイル名候補文字列に対する修正は無いと判断する(ステップS27)。修正部213は、ステップS21で抽出したファイル名候補文字列を、ファイル名候補1として、例えばHDD205に保存する(ステップS45)。
矩形領域B内にCMY色の画像が存在する場合(ステップS25/YES)、修正部213は、他色(CMY色のいずれか)の画像が、ステップS21で取得したK色の文字列に重なるか否か判定する(ステップS27)。
他色(CMY色のいずれか)の画像が、K色の文字列に重なる場合(ステップS27/YES)、修正部213は、他色の画像と重なるK色の文字を修正対象と判断する(ステップS29)。
次に、他色文字認識部215が、他色の画像と重なるK色文字を含む領域Cで、他色の画像データの文字認識処理を行う(ステップS31)。ここで、本実施形態では、他色の画像と重なるK色文字を含む領域Cは、例えば、他色の画像と重なるK色文字が存在するY座標から垂直方向に予め定めた画素数を含む領域であるとするが、領域Cは任意の領域に設定可能である。
修正部213は、他色の画像データにおいて、文字が認識されたか否か判定する(ステップS33)。
他色の画像データにおいて文字が認識されなかった場合(ステップS33/NO)、修正部213は、他色と重なるK色文字を文字列から削除する(ステップS35)。他色の画像データにおいて文字が認識された場合(ステップS33/YES)、修正部213は、他色と重なるK色文字を、ステップS31で認識した他色の文字で置換する(ステップS37)。
次に、修正部213は、矩形領域B内に挿入系記号が存在するか否か判定する(ステップS39)。ここで、挿入系記号とは、図4(A)に示すように、記号格納部214に格納される、文字と文字との間に他の文字の挿入することを表す記号をいう。言い換えれば、修正部213は、記号格納部214に格納された記号が、矩形領域B内に存在するか否か判定する。
矩形領域B内に挿入系記号が存在する場合(ステップS39/YES)、他色文字認識部215は、他色の画像データの領域Bにおいて、文字認識処理を行い、他色文字を認識する(ステップS41)。そして、修正部213は、ステップS41で認識された他色文字のうち、図6(A)の「手書き文字の位置」に存在する文字を、記号が示すK色文字列の文字間に挿入する(ステップS43)。
ファイル名決定部216は、ステップS27〜ステップS43の処理で得られた文字列を、ファイル名候補1として保存する(ステップS47)。
ここで、図10を用いて、ステップS11〜ステップS47の処理によって得られるファイル名候補1の例について説明する。図10は、画像読取装置30から受け付けた各画像データに対し、ステップS11〜ステップS47の処理を実行した場合に得られるファイル名候補1を説明するための図である。
図10のAの例において、元画像データ中、「標準化規格会議議事録」の文字のみが、K色であったと仮定する。この場合、ステップS21で抽出されるファイル名候補文字列は、「標準化規格会議議事録」となる。Aの例では、領域Bに他色の画像が存在するため(ステップS25/YES)、修正部213は、他色画像がK色の文字列に重なるか否か判定する(ステップS27)。Aの例では、他色画像(削除を表す「X」の図形画像)が、K色文字列のうち、「規格」と重なっているため(ステップS27)、修正部213は、他色画像と重なるK色文字「規格」を修正対象と判断する(ステップS29)。そして、他色文字認識部215は、他色画像と重なるK色文字を含む領域Cに対して、文字認識処理を行う(ステップS31)。Aの例では、他色の画像データにおいて、「規格」を含む領域Cに対して文字認識処理が行われ、「企画」の文字が他色文字として認識される(ステップS33/YES)。修正部213は、他色画像と重なるK色文字(規格)を、他色文字(企画)で置換する(ステップS37)。Aの例では、領域Bに挿入系記号が存在しないため(ステップS39/NO)、ステップS41の処理は行われない。この結果、Aの元画像データに基づくファイル名候補1は「標準化企画会議議事録」となる。
続いて、Bの例において、元画像データ中、「標準化企画会議議事録」の文字のみがK色であったと仮定する。この場合、ステップS21で抽出されるファイル名候補文字列は、「標準化企画会議議事録」である。Bの例では、領域Bに他色の画像が存在するため(ステップS25/YES)、修正部213は、他色画像がK色の文字列に重なるか否か判定する(ステップS27)。Bの例では、他色画像(削除を表す「X」の図形画像)が、K色文字列のうち、「規格」と重なっているため(ステップS27)、修正部213は、他色画像と重なるK色文字「規格」を修正対象と判断する(ステップS29)。そして、他色文字認識部215は、他色画像と重なるK色文字を含む領域Cに対して、文字認識処理を行う(ステップS31)。Bの例では、他色の画像データにおいて、「規格」を含む領域Cに対して文字認識処理が行われるが、領域Cに他色文字が存在しないため(ステップS31/NO)、修正部213は、他色の画像と重なるK色文字(規格)を、文字列から削除する(ステップS35)。Bの例では、領域Bに挿入系記号が存在しないため(ステップS39/NO)、ステップS41の処理は行われない。この結果、Bの元画像データに基づくファイル名候補1は「標準化会議議事録」となる。
さらに、Cの例において、元画像データ中、「標準化格会議議事録」の文字のみがK色であったと仮定する。この場合、ステップS21で抽出されるファイル名候補文字列は、「標準化格会議議事録」である。Cの例では、領域Bに他色の画像が存在するため(ステップS25/YES)、修正部213は、他色画像がK色の文字列に重なるか否か判定する(ステップS27)。Cの例では、他色画像(削除を表す「X」の図形画像)が、K色文字列のうち、「格」と重なっているため(ステップS27/YES)、修正部213は、他色画像と重なるK色文字「規格」を修正対象と判断する(ステップS29)。そして、他色文字認識部215は、他色画像と重なるK色文字を含む領域Cに対して、文字認識処理を行う(ステップS31)。Cの例では、他色の画像データにおいて、「格」を含む領域Cに対して文字認識が行われ、「画」の文字が他色文字として認識される(ステップS33/YES)。修正部213は、他色画像と重なるK色文字(格)を、他色文字(画)で置換する(ステップS37)。ステップS37の処理後のファイル名候補文字列は「標準化画会議議事録」となる。また、Cの例では、領域Bに挿入系記号が存在するため(ステップS39/YES)、他色文字認識部215は、他色の画像データにおいて、領域Bに対して文字認識処理を行う(ステップS41)。ステップS41の処理の結果、「企」及び「画」の文字が他色文字として認識される。修正部213は、「企」及び「画」のうち、挿入系記号に対し左上に存在する「企」の文字を、図形が示す「化」と「格」の間に挿入する(ステップS43)。この結果、Cの元画像データに基づくファイル名候補1は、「標準化企画会議議事録」となる。
次に、図6を参照し、ステップS45及びS47以降の処理について説明する。ファイル名決定部216は、ファイル名候補1を辞書格納部217に格納されているユーザ辞書と比較する(ステップS51)。ファイル名決定部216は、ファイル名候補1がユーザ辞書に存在するか否か判定する(ステップS53)。
ファイル名候補1がユーザ辞書に存在する場合(ステップS53/YES)、ファイル名決定部216は、ファイル名候補1のみをユーザに提示する(ステップS55)。例えば、ファイル名決定部216は、画像形成装置300が備える表示装置に、ファイル名候補1を表示する。
次に、ファイル名候補1は、ステップS55で提示したファイル名候補1が、ユーザによりファイル名として承認されたか否か判定する(ステップS57)。ファイル名候補1がファイル名としてユーザに承認された場合(ステップS57/YES)、ファイル名決定部216は、ファイル名候補1をファイル名として決定し(ステップS59)、処理を終了する。
ファイル名候補1が辞書に存在しない場合(ステップS53/NO)、ファイル名決定部216は、ユーザ辞書から、ファイル名候補1との類似度が高い単語を検索し、ファイル名候補2とする(ステップS61)。次に、ファイル名決定部216は、ファイル名候補1及びファイル名候補2をユーザに提示する(ステップS63)。例えば、ファイル名候補1が「標準化会議議事録」であったとする。この場合に、図7に示したユーザ辞書に、「標準化会議議事録」は存在しない。そこで、ファイル名決定部216は、「標準化会議議事録」との類似度が高い「標準会議議事録」をファイル名候補2とする。そして、ファイル名決定部216は、「標準化会議議事録」と「標準会議議事録」とを、ユーザに提示する。
次に、ファイル名決定部216は、ファイル名候補1がユーザにより選択されたか否か判定する(ステップS65)。ファイル名決定部216は、ファイル名候補1がユーザにより選択された場合(ステップS65)、ファイル名候補1をユーザ辞書に追記する(ステップS67)。そして、ファイル名決定部216は、ファイル名候補1をファイル名として決定し(ステップS69)、処理を終了する。
ファイル名候補1がユーザにより選択されなかった場合(ステップS65/NO)、ファイル名決定部216は、ファイル名候補2が選択されたか否か判定する(ステップS71)。ファイル名候補2が選択された場合(ステップS71/YES)、ファイル名決定部216は、ファイル名候補2をファイル名として決定し(ステップS73)、処理を終了する。なお、ファイル名候補2は、ユーザ辞書に既に登録されているため、ファイル名決定部216はユーザ辞書への登録を行わない。
ファイル名候補2が選択されなかった場合(ステップS71/NO)、又は、ステップS57において、ユーザがファイル名候補1をファイル名として承認しなかった場合(ステップS57/NO)、ファイル名決定部216は、ファイル名の入力をユーザから受け付ける(ステップS75)。
ファイル名決定部216は、入力されたファイル名をユーザ辞書に追記する(ステップS77)。そして、ファイル名決定部216は、入力されたファイル名をファイル名として決定し(ステップS79)、処理を終了する。
以上の説明から明らかなように、上述の実施形態によれば、色分解部211は、ユーザによる書き込みがなされた原稿を読み取って生成した画像データを複数の色成分に分解し、文字列抽出部212は、K色成分の画像データにおいて、予め定めた領域Aに対して文字認識処理を行い、ファイル名候補となる文字列を抽出する。これにより、K色で印刷された元の原稿に対して、K色以外の色(例えば、赤や青)を用いてユーザによる書き込みがなされた場合でも、ファイル名候補となる文字列が正確に認識される。例えば、色分解していない図4(A)に示す原稿画像に対し文字認識処理を行った場合、K色以外の色で書かれた「企画」の文字や、削除を表す「X」の図形も文字の一部として認識されてしまうため、ファイル名候補文字列を正しく認識できない。例えば、図4(A)の例では、「標準化規格会議議事録」の文字を含む画像データに対し文字認識処理を行うと、「標準化硫会会議議事録」と認識されてしまう。一方、本実施形態によれば、文字列抽出部212は、色分解されたK色の画像データに対して文字認識処理を行うため、ユーザにより書き込まれた図形や文字の影響を受けずに文字認識処理が実行される。これにより、ユーザによる書き込みがなされた場合でも、ファイル名候補となる文字列が正しく認識されるため、文字認識処理の精度が向上する。
そして、他色文字認識部215は、K色成分とは異なる他色の画像データにおいてファイル名候補文字列を含む領域Bに存在する他色の画像が、ファイル名候補文字列と重なる場合、または、他色の画像データにおいて領域Bに記号格納部214に格納された図形画像が存在する場合に、他色の画像データの領域Bに対して文字認識処理を行い、他色文字を認識する。修正部213は、他色の画像とファイル名候補文字列との関係、及び、他色文字認識部215により認識された他色文字の少なくともいずれかに基づいて、ファイル名候補文字列を修正する。これにより、K色の文字列に対してユーザがK色以外の色を用いて行った書き込みが反映されたファイル名候補文字列が取得される。
上述の実施形態では、修正部213は、ファイル名候補文字列に他色の画像が重なる場合、ファイル名候補文字列に含まれる文字のうち、他色の画像と重なる文字を、ファイル名文字列から削除する。これにより、ユーザが元の原稿に対して行った、削除を意図する書き込みを反映したファイル名候補文字列が取得される。
また、修正部213は、ファイル候補名文字列に他色の画像が重なる場合、ファイル名候補文字列に含まれる文字のうち、他色の画像と重なる文字を、他色文字認識部215が認識した他色文字によって置換する。これにより、ユーザが元の原稿に対して行った、置換を意図する書き込みを反映したファイル名候補文字列が取得される。
また、修正部213は、他色の画像データにおいて、領域Bに挿入系記号が存在する場合、他色文字認識部215が認識した他色文字をファイル名候補文字列に挿入する。これにより、ユーザが元の原稿に対して行った、文字の挿入を意図する書き込みを反映したファイル名候補文字列が取得される。
また、辞書格納部217は、ユーザに使用されたことがある文字列を登録したユーザ辞書を格納し、ファイル名決定部216は、ファイル名候補文字列が辞書格納部217に含まれない場合、辞書格納部217に格納された文字列の中から、ファイル名候補文字列と類似する文字列を検出し、ファイル名としてユーザに提示する。ファイル名候補文字列がユーザ辞書にない場合、文字列抽出部212及び他色文字認識部215が実行する文字認識処理において、文字を誤検知している可能性が高い。ユーザ辞書を用いて、ファイル名候補文字列が過去にファイル名として使用されたことのある文字列か否かを判定することにより、ファイル名の認識精度が向上する。
上述した実施の形態は、本発明の実施形態の一部である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
上述した実施の形態において、領域B内に記号格納部214に格納された図形が存在する場合、他色文字認識部215は、領域Bに対して文字認識処理を実行していた。しかしながら、他色文字認識部215は、例えば、挿入系記号を含む、領域Bとは異なる領域(例えば、領域D)を決定し、領域Dに対して文字認識処理を実行してもよい。
上述の実施形態では、画像データ中に含まれる文字列をファイル名として利用する処理について説明した。しかしながら、元の文書原稿に対してユーザにより書き込みが行われた原稿をOCR(Optical Character Recognition)処理する場合に、本発明を適用してもよい。
なお、上記の画像処理装置20が有する機能は、CPU、ROM、RAM等を備えるコンピュータによって実現することができる。その場合、画像処理装置20が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD−ROM(Compact Disc Read Only Memory)などの可搬型記録媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
20…画像処理装置
30…画像読取装置
211…色分解部
212…文字列抽出部
213…修正部
214…記号格納部
215…他色文字認識部
216…ファイル名決定部
217…辞書格納部
500…情報処理装置
600…画像読取装置

Claims (6)

  1. 原稿を読み取って生成した画像データを複数の色成分に分解する色分解部と、
    前記複数の色成分のうち、第1の色成分の画像データにおいて、予め定めた第1の領域に対して文字認識処理を行い、文字列を抽出する文字列抽出部と、
    前記第1の色成分とは異なる他の色成分の画像データにおいて前記文字列を含む第2の領域に存在する他の色成分の画像と、前記抽出された文字列とが予め定めた関係にある場合に、前記他の色成分の画像データにおいて、前記第2の領域に対して文字認識処理を行い、前記他の色成分の文字を認識する他色文字認識部と、
    前記他の色成分の画像と前記抽出された文字列との関係、及び、前記他色文字認識部により認識された前記他の色成分の文字の少なくともいずれかに基づいて、前記抽出された文字列を修正する修正部と、
    を備えることを特徴とする画像処理装置。
  2. 前記修正部は、前記抽出された文字列に前記他の色成分の画像が重なる場合、前記抽出された文字列に含まれる文字のうち、前記他の色成分の画像と重なる文字を、前記抽出された文字列から削除することを特徴とする請求項1に記載の画像処理装置。
  3. 前記修正部は、前記抽出された文字列に前記他の色成分の画像が重なる場合、前記抽出された文字列に含まれる文字のうち、前記他の色成分の画像と重なる文字を、前記他色文字認識部が認識した前記他の色成分の文字によって置換することを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記他の色成分の画像データにおいて、前記第2の領域に予め定められた記号が存在する場合、前記修正部は、前記他色文字認識部が認識した文字を前記抽出した文字列に挿入することを特徴とする請求項1から3のいずれか1項に記載の画像処理装置。
  5. ユーザに使用されたことがある文字列を格納する辞書格納部と、
    前記修正部が修正した文字列が前記辞書格納部に含まれない場合、前記辞書格納部に格納された文字列の中から、前記修正部により修正された文字列と類似する文字列を検出し、前記第1の領域に含まれる文字列の抽出結果として決定する文字列決定部と、
    を備えることを特徴とする請求項1から4のいずれか1項に記載の画像処理装置。
  6. コンピュータに、
    原稿を読み取って生成した画像データを複数の色成分に分解する色分解ステップと、
    前記複数の色成分のうち、第1の色成分の画像データにおいて、予め定めた第1の領域に対して文字認識処理を行い、文字列を抽出する文字列抽出ステップと、
    前記第1の色成分とは異なる他の色成分の画像データにおいて前記抽出された文字列を含む第2の領域に存在する他の色成分の画像と、前記抽出された文字列とが予め定めた関係にある場合に、前記他の色成分の画像データにおいて、前記第2の領域に対して文字認識処理を行い、前記他の色成分の文字を認識する他色文字認識ステップと、
    前記他の色成分の画像と前記抽出された文字列との関係、及び、前記他色文字認識部により認識された前記他の色成分の文字の少なくともいずれかに基づいて、前記抽出された文字列を修正する修正ステップと、
    を実行させることを特徴とするプログラム。
JP2011065403A 2011-03-24 2011-03-24 画像処理装置およびプログラム Expired - Fee Related JP5673277B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011065403A JP5673277B2 (ja) 2011-03-24 2011-03-24 画像処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011065403A JP5673277B2 (ja) 2011-03-24 2011-03-24 画像処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2012204906A true JP2012204906A (ja) 2012-10-22
JP5673277B2 JP5673277B2 (ja) 2015-02-18

Family

ID=47185449

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011065403A Expired - Fee Related JP5673277B2 (ja) 2011-03-24 2011-03-24 画像処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5673277B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961069A (zh) * 2017-12-26 2019-07-02 精工爱普生株式会社 图像处理装置以及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019220153A2 (en) 2018-05-14 2019-11-21 Hydromat D.O.O. Axial valve of the modular concept of construction

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108791A (ja) * 1991-10-18 1993-04-30 Ricoh Co Ltd 画像編集装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108791A (ja) * 1991-10-18 1993-04-30 Ricoh Co Ltd 画像編集装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961069A (zh) * 2017-12-26 2019-07-02 精工爱普生株式会社 图像处理装置以及存储介质
JP2019115011A (ja) * 2017-12-26 2019-07-11 セイコーエプソン株式会社 画像処理装置および画像処理プログラム
US11151367B2 (en) 2017-12-26 2021-10-19 Seiko Epson Corporation Image processing apparatus and image processing program
JP7059624B2 (ja) 2017-12-26 2022-04-26 セイコーエプソン株式会社 画像処理装置および画像処理プログラム

Also Published As

Publication number Publication date
JP5673277B2 (ja) 2015-02-18

Similar Documents

Publication Publication Date Title
JP4600491B2 (ja) 画像処理装置及び画像処理プログラム
US7640269B2 (en) Image processing system and image processing method
JP3796500B2 (ja) 画像処理装置及びその制御方法、プログラム
US8126270B2 (en) Image processing apparatus and image processing method for performing region segmentation processing
US7925082B2 (en) Information processing apparatus, information processing method, computer readable medium, and computer data signal
US7321688B2 (en) Image processor for character recognition
JP5121599B2 (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP2006023945A (ja) 画像処理システム及び画像処理方法
US8391607B2 (en) Image processor and computer readable medium
US20100008585A1 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
US20060008113A1 (en) Image processing system and image processing method
US20080209549A1 (en) Computer readable medium, document processing apparatus, document processing system, document processing method, and computer data signal
US7844080B2 (en) Image processing system and image processing method, and computer program
JP4338189B2 (ja) 画像処理システム及び画像処理方法
US20100007912A1 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
US20210397798A1 (en) Information processing apparatus and non-transitory computer readable medium
JP6191500B2 (ja) 画像処理装置、画像処理システム及び画像処理プログラム
JP2006023944A (ja) 画像処理システム及び画像処理方法
JP5673277B2 (ja) 画像処理装置およびプログラム
JP7379876B2 (ja) 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
JP6780271B2 (ja) 画像処理装置及び画像処理プログラム
JP4780184B2 (ja) 画像処理装置及び画像処理プログラム
JP2004127203A (ja) 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
US8295602B2 (en) Image processing apparatus and image processing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140826

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141215

R150 Certificate of patent or registration of utility model

Ref document number: 5673277

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees