JP2016062412A - 画像処理システム、フォントサイズ決定方法及びフォントサイズ決定プログラム - Google Patents
画像処理システム、フォントサイズ決定方法及びフォントサイズ決定プログラム Download PDFInfo
- Publication number
- JP2016062412A JP2016062412A JP2014191131A JP2014191131A JP2016062412A JP 2016062412 A JP2016062412 A JP 2016062412A JP 2014191131 A JP2014191131 A JP 2014191131A JP 2014191131 A JP2014191131 A JP 2014191131A JP 2016062412 A JP2016062412 A JP 2016062412A
- Authority
- JP
- Japan
- Prior art keywords
- determination
- font size
- character
- region
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】画像データ中の1文字の画像毎に外接矩形を検出すると共に(ステップS11)、画像データを複数の塊に区分し、仮判定領域として設定する(ステップS12)。各仮判定領域単位で構成要素である個々の文字の画像の外接矩形の高さに関する度数分布を作成し(ステップS13)、有効な外接矩形の高さが2種類以上ある仮判定領域を正規判定領域とみなす(ステップS14でYES、ステップS17)。正規判定領域とみなされなかった仮判定領域について(ステップS14でNO)、正規判定領域の条件を満たすまで隣接する他の判定領域と統合し(ステップS16)、正規判定領域毎に、その中の文字画像の外接矩形のうち最大の高さを代表値としてフォントサイズを決定する(ステップS18)。
【選択図】図3
Description
原稿上には様々なフォントサイズの文字が記載されるが、一般的なOCR処理では文字コード列を作成するだけであり、フォントサイズの検出までは行わない。
ところが、例えば、マイクロソフト社のWordやExcelなどのアプリケーションでは、OCR処理により読み取られたテキストデータがテキストボックスやセルの形でそのまま表示されるので、個々の文字のフォントサイズを正しく認識しなければ、原画像との間に違和感が生じる。
原稿上に記載された文字のフォントサイズを検出する従来の技術として、例えば、行毎の文字列の画像の外接矩形を抽出し、当該外接矩形の高さを基準にしてフォントサイズを検出する方法がある(以下、「第1の従来技術」という。)。
例えば、アルファベットのフォントサイズを検出する際において、大文字もしくは「b、d、f、h、i、k、l」等の背の高い小文字の画像の外接矩形の高さを標準とすると、これらの標準の文字と、「g、j、p、q、y」等の下方に突出する部分を持つ特定の小文字とが混在する文字列の場合に、当該文字列の画像全体の外接矩形が個々の文字の画像の外接矩形よりも高くなるため、文字列中の文字の画像のフォントサイズを実際よりも大き目に検出してしまうという問題がある。また、反対に、当該文字列が、「a、c、e、m、n、o、r、s、u、v、w、x、z」等のように上記標準の文字よりも背の低い小文字のみからなるような場合には、当該文字列の画像全体の外接矩形が標準の文字の外接矩形よりも低くなるため、文字列中の文字の画像のフォントサイズを実際よりも小さ目に検出してしまうという問題がある。
ここで、前記領域拡大部は、前記判定部において正規な判定領域とされなかった判定領域内に含まれる文字画像の外接矩形サイズの代表値と、当該判定領域に隣接する他の判定領域内の複数の文字画像の外接矩形サイズの代表値との差異が、第1の範囲よりも大きくなる場合には、当該隣接する他の判定領域を統合の対象としないことが望ましい。
また、前記フォントサイズ検出部で判定領域毎のフォントサイズを検出した結果、第1のフォントサイズの判定領域と、これと大きさの異なる第2のフォントサイズの判定領域が存在する場合に、第1と第2のフォントサイズの差異が、第2の範囲内である場合には、第1と第2のいずれか一方のフォントサイズを、他方のフォントサイズに揃えるフォントサイズ整合部を備えることとしてもよい。
ここで、前記所定の範囲は、フォントサイズの検出対象となっている文字画像領域の全域であるとしてもよい。
また、前記画像処理システムは、さらに、前記画像データに文字認識処理を施して、文字コード列に変換する文字認識手段を備え、原稿の画像データに対して、前記文字認識手段による文字認識処理を実行した後に、前記フォントサイズ決定手段によるフォントサイズ決定処理を実行するように構成してもよい。
<全体構成>
図1は、本実施形態に係る画像処理システム100の全体構成の概略を示す機能ブロック図である。
画像処理システム100は、原稿の画像データから、文字コードを作成するとともに、フォントサイズを検出する機能を備えており、画像取得部110、文字認識部120、フォントサイズ決定部130及び電子データ生成部140を備えおり、例えば、パーソナルコンピューターに、以下に説明する処理を実行するためのプログラムをインストールして構成される。
画像取得部110は、外部の端末からLANを介して、もしくは、USBメモリなどの携帯記憶媒体から、原稿の画像データを取得する。スキャナーや内蔵カメラ等を用いて、文書を含む原稿を読み取って画像データを取得するように構成してもよい。
(2)文字認識部120
文字認識部120は、上記取得した原稿の画像データをページメモリに展開して、文字画像の領域と、それ以外の図形や写真などの階調を有する画像(以下、単に「写真画像」という。)の領域を検出する。
そして、写真画像の領域が検出されれば、その領域内の画像データと位置情報(メモリアドレス)を写真領域画像データとして電子データ生成部140に送信する。
例えば、文字領域の画像データについて、水平方向及び垂直方向における濃度ヒストグラムを作成して、1文字ずつ画像を切り出し、切り出した各文字画像から特徴点(例えば、閉ループや独立点の個数およびそれらの位置など)を抽出して、予め用意していたテーブルに納められていた文字のパターンとのマッチングを行って、その文字コードを特定する。
文字認識部120は、文字領域画像について文字認識処理して得られた文字コードをその位置情報と共に文字コードデータとして電子データ生成部140に送信する。
フォントサイズ決定部130は、矩形検出部131、仮設定部132、解析部133、判定部134、領域拡大部135、調整部136及びフォントサイズ検出部137を備え、文字認識部120から送信されてきた文字領域の画像データに基づき各文字についてフォントサイズを決定する。
本実施の形態では、上記のように文字認識部120において、濃度ヒストグラムに基づき1文字ずつ画像を切り出しているので、矩形検出部131は、その結果を利用して当該切り出した文字画像に外接する矩形(外接矩形)を検出し、その対向する2頂点(例えば、左上角と右下角の頂点)のメモリ上のアドレスを取得して、これにより各文字画像の外接矩形のサイズを得るようにしている。
例えば、原稿の文章が英文である場合、単語と単語の間には必ずスペースが挿入されるので、水平方向に走査して得た濃度ヒストグラムにより、当該スペースを検出してこれにより単語毎に区分けしてそれぞれを判定領域とすることができる。
解析部133は、仮設定部132により仮設定された判定領域(以下、「仮判定領域」という。)毎に、その構成要素である個々の文字の画像の外接矩形の大きさの特徴について解析する。より詳細には、横軸の階調を外形矩形の高さ方向における大きさ(以下、単に「外接矩形高さ」という。)とし、縦軸の度数を該当する外接矩形高さを有する文字画像の個数として度数分布表を作成する。
本実施の形態では、同じフォントサイズの文字の中でも背の高い文字種のうち一番数の多い文字の外接矩形の高さを標準値とし、各フォントサイズに対応した標準値を予め求めてテーブルに格納し、これと比較することにより文字画像のフォントサイズを決定するようにしている。例えば、アルファベットの場合には、「J」以外の大文字は同じ高さなので、それらの外接矩形高さを標準値とする。
もし、前者である場合に上記のフォントサイズ標準値と比較すると、実際よりも小さなフォントサイズであると認識されてしまい、原稿通りに再現することができない。
なお、高さの極端に低い文字種、例えば、「.」「。」「、」「,」などは、フォントサイズ決定の決め手にならないので、判定部134における判定領域適合条件の判定対象から除外するようにしている。詳しくは後述する。
反対に、外接矩形高さが1種類のみである場合には、仮決定のまま、次段の領域拡大部135に通知する。
領域拡大部135は、判定部134により正規判定領域と見なされなかった仮判定領域を、当該仮判定領域に隣接している他の判定領域と統合し、新たな仮判定領域として設定する。このように仮判定領域を拡大すれば、それだけ背の異なる文字種が含まれる蓋然性が高くなり、フォントサイズが正確に決定しやすくなるからである。
フォントサイズ検出部137は、判定部134により正規設定された判定領域毎に、フォントサイズを検出する。
電子データ生成部140は、フォントサイズ決定部130により決定されたフォントサイズで、認識部120により作成された文字コードの文字を表示することができるように、各文字のフォントサイズと文字コードを、それらの位置情報に基づき関連付けると共に、画像取得部110により取得された画像データの写真領域と統合して、所定の編集アプリケーションで編集できる形式の電子データを生成する。
以下、上記のフォントサイズ決定部130で実行されるフォントサイズの検出動作の内容についてフローチャートに基づき説明する。
なお、以下の説明では文字認識の対象となる原稿の文字領域の文章が、アルファベットによって表現される文章(英文)である場合を例にして説明する。アルファベットは、フォントサイズが同じであっても文字種によって、文字の高さが異なるため、本実施の形態による効果を顕著に得られるからである。
そして、文字認識部120は、文字領域の画像データに対して、文字認識処理を実行して、上記のようにして当該画像データから文字コードを作成する(ステップS3)。
電子データ生成部140において、文字認識部120からの文字コードデータとフォントサイズ決定部130からのフォントサイズデータに基づき、文字コードごとにフォントサイズを関連付けると共に、文字領域における電子データと、写真領域の電子データと統合して、所定の編集アプリケーションにおいて、文字領域と写真領域が、原稿画像と同じ配置で表示できるように電子データを生成する(ステップS5)。
また、図4〜図6は、フォントサイズ決定処理の対象が、英文である場合のフォントサイズ決定の手順を説明するための具体例である。
まず、ステップS11において、矩形検出部131により画像データ中の文字画像について1文字ずつ外接矩形を検出する。
例えば、図4の「A.原稿」に示すように、原稿の文字領域中の画像が横書きで、「This is a hen.」である場合において、各文字画像の外接矩形を求めると、「B.外接矩形」で示すような形状となる。
英文においては、単語と単語との間に必ずスペースが介在するので、本実施の形態では、濃度ヒストグラムにより、このスペースを検出して、1単語ずつを1つの塊に区分して、各単語を仮判定領域として設定するようにしている。但し、ピリオドやカンマの前にはスペースがないので、直前の単語の一部と見なすようにしている。
各仮判定領域において、それらに含まれる文字の外接矩形高さについて度数分布(ヒストグラム)を作成する(ステップS13)。
そうすると各仮判定領域における外接矩形高さの分布は、図4のCに示すようになるが、「hen.」におけるピリオド「.」(高さh3)は、極端に小さい上に、フォントサイズ毎にそれほど大きさに差はなく、フォントサイズの判定対象になりにくい。そこで、極端に低い外接矩形(例えば、仮判定領域で検出された他の外接矩形の最大高さの3分の1未満の高さ)のものは、フォントサイズ判定のための対象文字から外し(図4の「D.不要な構成要素を除外」参照)、それより大きな外接矩形高さをフォントサイズ判定のために有効な外接矩形高さ(以下、「有効外接矩形高さ」という。)とする。
前述の通り、アルファベットの文字については、フォントサイズは同じであっても、背の高さが異なる文字種があるので、仮判定領域中の文字の有効外接矩形高さが、1種類の場合には、それが全て背の高いアルファベットからなっているのか、背の低いアルファベットからなっているのか不明であり、もし、後者の場合に大文字の高さを基準にしてフォントサイズを決定すると実際よりも小さなフォントサイズに決定され、文字コードと組み合わせて再現するとその部分だけ原稿よりも小さな表示となってしまうからである。
そこで、本実施の形態では、統合する前に隣接する仮判定領域について、その統合適合性を判定している。
しかし、図5のAに示すように、「a」の後方に隣接する判定領域「pen」が、「a」のフォントサイズよりも明らかに大きいため、その比が第1の範囲内になく、統合適合性を有しない。しかし、前方に隣接する仮判定領域(「is」)は、統合適合性を有するので、「is」と「a」を統合して新たな仮判定領域に設定することになる(図5のE参照)。
図6の例では、「one ocean」の前方に「is」があり、この判定領域は統合適合性を有しているので、「is」と「one ocean」を統合して「is one ocean」を一つの仮判定領域に設定する(図6のE参照)。この新たな仮判定領域は、有効外接矩形高さが2種類あるので、判定領域適合条件を有する。
ステップS17では、判定領域適合条件を満たした仮判定領を正規判定領域とみなし、ステップS18において、各正規判定領域内における外接矩形の最大高さを代表値とし、当該代表値に基づき各正規判定領域毎にフォントサイズを決定する(ステップS18)。
この場合には、仕方がないので仮判定領域「a」を他の判定領域と統合することなく、そのままで正規判定領域とみなし(ステップS17)、もし、フォントサイズが誤認定された場合には、最終的にユーザーの手動による修正を受付けるようにすればよい。
以上のようにして、全ての正規判定領域について決定されたフォントサイズが、そのまま該当する正規判定領域に含まれる構成文字のフォントサイズとして決定される。
上述のように、正規判定領域は、ステップS15でNOと判定されるような特異な例を除き、2種類の外接矩形高さの文字画像を必ず含んでいるので、その背の高い方の文字は、各フォントサイズの標準値に設定されている文字種と同じ種類の文字であると推定され、正規判定領域内の外接矩形の高さのうち一番高いものをその判定領域の代表値として、その文字のフォントサイズを決めても、現実のフォントサイズと大差がない。
以上のようにして、判定対象となる画像データの文字領域における全ての正規判定領域におけるフォントサイズを決定した後、図2のフローチャートにリターンする。
<変形例>
本発明の技術的範囲には、上記実施の形態に限定されず、次のような変形例も含まれる。
図7は、本変形例においてフォントサイズ決定部130で実行されるフォントサイズ決定処理の内容を示すフローチャートである。ステップS11〜S17までは、実施の形態における図3のフローチャートと全く同じなので、同図では、最初の一部のステップの図示を省略してステップS17から示している。
例えば、先に説明した図4のAに示すように対象文字画像が、「This is a hen.」の場合には、最終的に正規判定領域は、「This」、「is」、「a hen.」の3つになり、それぞれの代表値が等しいので(ステップS20でYES)、フォントサイズ候補の度数分布において度数を生じるフォントサイズ候補が一つだけになり(図4のG参照)、ステップS21において「NO」と判定する。
ところが、度数分布においてフォントサイズ候補が2種類出現した場合には(ステップS20でYES)、最終的にどのようにフォントサイズに決すべきか問題となる。上述のようにフォントサイズが同じでも「t」や「J」などの外接矩形高さが代表値となる場合には、実際のフォントサイズと若干異なる値になるからである。
例えば、図8のAに示すように、フォントサイズの判定対象となる文字画像の文章が、「This is a tax.」であった場合には、上述した手順により、正規判定領域が「This」、「is」、「a tax.」の3つに設定される(図8のF参照)。
そこで、本変形例では、図8のGの度数分布から出現頻度の高い方のフォントサイズP1を判定対象となった3つの正規判定領域のフォントサイズとしている(図8のH)。
図8のように、「This is a tax.」のような極めて短い文章の場合であっても3つの正規判定領域「This」、「is」、「a tax.」のうち「t」の外接矩形高さを代表値とするものは、1個しかない。したがって、一度にフォントサイズの決定するための文字領域の範囲が大きいほど、「t」の外接矩形高さを代表値とする正規判定領域の出現する頻度は、その他の標準文字の外接矩形高さを代表値とする正規判定領域の出現よりも確実に少なくなる。
したがって、フォントサイズ決定の対象となる文字領域に含まれる複数の正規判定領域について、2種類以上のフォントサイズ候補が出現し、かつ、それらの差異が予め設定された所定の範囲(第2の範囲)内の場合には(ステップS21でYES)、出現頻度の一番高いフォントサイズに決定する(ステップS22)。
例えば、図9のAに示すように原稿の文字画像が「This is a hen.」であって、「This」のフォントサイズが他の単語よりかなり大きい場合には、正規判定領域について、フォントサイズ候補の度数分布を求めれば、図9のGのように度数の発生するフォントサイズ候補P1、P4として両者の大きさに一定以上の差が生じる。
フォントサイズの大きさに応じて、第2の範囲とすべき値も変化すると考えられるので、そのフォントサイズ候補ごとに第2の範囲を示すテーブルを持つのが望ましい。
なお、フォントサイズ決定部130でのフォントサイズ決定処理は、画像取得部110で取得してフォントサイズの決定対象となっている文字領域の画像データの全てについて一括して行ってもよいし、そのうちの所定量の画像データ(例えば、1頁分もしくは数行分)に分割して、順次行うようにしても構わない。一括して処理するデータ量が多いほど、第2の範囲内の差異を有するフォントサイズ候補の出現頻度の差が顕著に現れるので、図7のステップS22においてフォントサイズを揃える処理をより的確に実行できる。
(3)上記実施形態では、フォントサイズ検出部137が外接矩形の高さ方向の大きさに応じてフォントサイズを検出したが、外接矩形サイズを示すパラメーターとして外接矩形高さ以外に、その幅もしくは面積が、フォントサイズに密接に対応している文字体系があれば、それらの値をパラメーターとしてフォントサイズを検出するようにしてもよい。
このように文字認識部120による文字認識処理と、フォントサイズ決定部130におけるフォントサイズ決定処理を並行して行うことにより、全体の処理時間を短縮させることができる。
また、画像処理システムは、図11(a)(b)に示すように、パーソナルコンピューターなどの端末に、画像取得部、フォントサイズ決定部、電子データ生成部を設けて、この端末と社内LANやインターネットを介して接続されたサーバーもしくはウェブサイトに外部アプリケーションとして設けられた文字認識部とで構成するようにしてもよい。
図11(a)は、外部アプリケーションにおける文字認識処理と、端末におけるフォントサイズ決定処理がシリアルで実行される構成を示しており、図11(b)は、外部アプリケーションにおける文字認識処理と、端末におけるフォントサイズ決定処理がパラレルに実行される構成を示している。
MFPと端末間は、LANなどで接続され、端末と外部アプリケーションは、インターネットで接続される。
ユーザーは、MFPの画像取得部(スキャナー)で読み込んだ原稿の画像データを取得して外部アプリケーションに送信して文字認識処理を実行させて、その認識結果を受信すると共に、自装置においてフォントサイズ決定処理を実行し、電子データを生成する。
図11(b)および図12(b)では、文字認識処理は外部アプリケーションにて実行されるので、フォントサイズ決定処理と文字認識処理をパラレル処理するように構成しても、図10(b)の場合に比べ、端末のCPUにおける負担は大きくならない。
(5)画像処理システム100により実行されるフォントサイズ決定処理の内容は、CPU71で実行されるプログラムに関する発明として捉えることが可能である。
110 画像取得部
120 文字認識部
130 フォントサイズ決定部
131 矩形検出部
132 仮設定部
133 解析部
134 判定部
135 領域拡大部
136 調整部
137 フォントサイズ検出部
140 電子データ生成部
Claims (11)
- 原稿の画像データから文字コードを生成すると共に、フォントサイズ決定手段により各文字コードに対応するフォントサイズを検出する画像処理システムであって、
前記フォントサイズ決定手段は、
前記画像データ中の1文字の画像毎に、その外接矩形のサイズを取得する外接矩形取得部と、
前記画像データを、所定の基準により文字画像の塊に区分し、それぞれの区分を、フォントサイズを検出するための判定領域として仮設定する仮設定部と、
前記仮設定された各判定領域について、異なる2種類以上の外接矩形サイズの文字画像が含まれるという条件を満たしているか否かを判定する判定部と、
前記仮設定された判定領域が、前記条件を満たしている場合に、当該仮設定された判定領域を正規の判定領域として決定する決定部と、
前記決定部により正規な判定領域として決定されなかった判定領域を拡大する領域拡大部と、
前記領域拡大部により拡大された新たな判定領域に対して、前記判定部、前記決定部及び前記領域拡大部による一連の処理を繰り返し実行させて判定領域を調整する調整部と、
正規の判定領域毎に、当該判定領域内に含まれる文字画像の外接矩形サイズの代表値を取得し、その代表値に基づき当該判定領域に含まれる文字のフォントサイズを検出するフォントサイズ検出部と
を備えることを特徴とする画像処理システム。 - 前記領域拡大部は、
前記決定部において正規な判定領域とされなかった判定領域について、当該判定領域に隣接する他の判定領域と統合することにより判定領域を拡大すること
を特徴とする請求項1に記載の画像処理システム。 - 前記領域拡大部は
前記判定部において正規な判定領域とされなかった判定領域内に含まれる文字画像の外接矩形サイズの代表値と、当該判定領域に隣接する他の判定領域内の複数の文字画像の外接矩形サイズの代表値との差異が、第1の範囲よりも大きくなる場合には、当該隣接する他の判定領域を統合の対象としないこと
を特徴とする請求項2に記載の画像処理システム。 - 前記各文字画像の外接矩形サイズは、当該外接矩形の高さ方向の大きさで規定されており、前記判定領域内の代表値とは、当該判定領域に含まれる文字画像の外接矩形の高さの最大値である
ことを特徴とする請求項1から3までのいずれかに記載の画像処理システム。 - 前記フォントサイズ検出部で判定領域毎のフォントサイズを検出した結果、第1のフォントサイズの判定領域と、これと大きさの異なる第2のフォントサイズの判定領域が存在する場合に、第1と第2のフォントサイズの差異が、第2の範囲内である場合には、第1と第2のいずれか一方のフォントサイズを、他方のフォントサイズに揃えるフォントサイズ整合部を備える
ことを特徴とする請求項1から4までのいずれかに記載の画像処理システム。 - 前記フォントサイズ整合部は、原稿の画像データのうち、フォントサイズの検出対象となる文字画像領域内の所定の範囲内の判定領域について、第1もしくは第2のフォントサイズのうち出現頻度の高い方のフォントサイズに揃える
ことを特徴とする請求項5に記載の画像処理システム。 - 前記所定の範囲は、フォントサイズの検出対象となっている文字画像領域の全域である
ことを特徴とする請求項6に記載の画像処理システム。 - 前記画像処理システムは、さらに、
前記画像データに文字認識処理を施して、文字コード列に変換する文字認識手段を備え、
原稿の画像データに対して、前記文字認識手段による文字認識処理と、前記フォントサイズ決定手段によるフォントサイズ決定処理が並行して実行される構成であること
を特徴とする請求項1〜7のいずれかに記載の画像処理システム。 - 前記画像処理システムは、さらに、
前記画像データに文字認識処理を施して、文字コード列に変換する文字認識手段を備え、
原稿の画像データに対して、前記文字認識手段による文字認識処理を実行した後に、前記フォントサイズ決定手段によるフォントサイズ決定処理を実行するように構成されていること
を特徴とする請求項1〜7のいずれかに記載の画像処理システム。 - 画像データに含まれる文字画像について、そのフォントサイズを決定するフォントサイズ決定方法であって、
前記画像データ中の1文字の画像毎に、その外接矩形のサイズを取得する外接矩形取得ステップと、
前記画像データを、所定の基準により文字画像の塊に区分し、それぞれの区分を、フォントサイズを検出するための判定領域として仮設定する仮設定ステップと、
前記仮設定された各判定領域について、異なる2種類以上の外接矩形サイズの文字画像が含まれるという条件を満たしているか否かを判定する判定ステップと、
前記仮設定された判定領域が、前記条件を満たしている場合に、当該仮設定された判定領域を正規の判定領域として決定する決定ステップと、
前記決定ステップにより正規な判定領域として決定されなかった判定領域を拡大する領域拡大ステップと、
前記領域拡大ステップにより拡大された新たな判定領域に対して、前記判定ステップ、前記決定ステップ及び前記領域拡大ステップによる一連の処理を繰り返し実行させて判定領域を調整する調整ステップと、
正規の判定領域毎に、当該判定領域内に含まれる文字画像の外接矩形サイズの代表値を取得し、その代表値に基づき当該判定領域に含まれる文字のフォントサイズを検出するフォントサイズ検出ステップと、
を含むことを特徴とするフォントサイズ決定方法。 - 画像データに含まれる文字画像について、そのフォントサイズを決定するフォントサイズ決定処理を、画像処理システムに実行させるフォントサイズ決定プログラムであって、
前記フォントサイズ決定処理は、
前記画像データ中の1文字の画像毎に、その外接矩形のサイズを取得する外接矩形取得ステップと、
前記画像データを、所定の基準により文字画像の塊に区分し、それぞれの区分を、フォントサイズを検出するための判定領域として仮設定する仮設定ステップと、
前記仮設定された各判定領域について、異なる2種類以上の外接矩形サイズの文字画像が含まれるという条件を満たしているか否かを判定する判定ステップと、
前記仮設定された判定領域が、前記条件を満たしている場合に、当該仮設定された判定領域を正規の判定領域として決定する決定ステップと、
前記決定ステップにより正規な判定領域として決定されなかった判定領域を拡大する領域拡大ステップと、
前記領域拡大ステップにより拡大された新たな判定領域に対して、前記判定ステップ、前記決定ステップ及び前記領域拡大ステップによる一連の処理を繰り返し実行させて判定領域を調整する調整ステップと、
正規の判定領域毎に、当該判定領域内に含まれる文字画像の外接矩形サイズの代表値を取得し、その代表値に基づき当該判定領域に含まれる文字のフォントサイズを検出するフォントサイズ検出ステップと、
を含むことを特徴とするフォントサイズ決定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014191131A JP6387761B2 (ja) | 2014-09-19 | 2014-09-19 | 画像処理システム、フォントサイズ決定方法及びフォントサイズ決定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014191131A JP6387761B2 (ja) | 2014-09-19 | 2014-09-19 | 画像処理システム、フォントサイズ決定方法及びフォントサイズ決定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016062412A true JP2016062412A (ja) | 2016-04-25 |
JP6387761B2 JP6387761B2 (ja) | 2018-09-12 |
Family
ID=55796078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014191131A Active JP6387761B2 (ja) | 2014-09-19 | 2014-09-19 | 画像処理システム、フォントサイズ決定方法及びフォントサイズ決定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6387761B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05120469A (ja) * | 1991-10-25 | 1993-05-18 | Ricoh Co Ltd | 画像処理装置 |
JPH10254994A (ja) * | 1997-03-14 | 1998-09-25 | Ricoh Co Ltd | サイズ識別方法および記憶媒体 |
JPH10334186A (ja) * | 1997-06-03 | 1998-12-18 | Brother Ind Ltd | 文字認識装置及び文字認識処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2011248415A (ja) * | 2010-05-24 | 2011-12-08 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
-
2014
- 2014-09-19 JP JP2014191131A patent/JP6387761B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05120469A (ja) * | 1991-10-25 | 1993-05-18 | Ricoh Co Ltd | 画像処理装置 |
JPH10254994A (ja) * | 1997-03-14 | 1998-09-25 | Ricoh Co Ltd | サイズ識別方法および記憶媒体 |
JPH10334186A (ja) * | 1997-06-03 | 1998-12-18 | Brother Ind Ltd | 文字認識装置及び文字認識処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2011248415A (ja) * | 2010-05-24 | 2011-12-08 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6387761B2 (ja) | 2018-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190304066A1 (en) | Synthesis method of chinese printed character images and device thereof | |
RU2437152C2 (ru) | Устройство обработки изображений, способ и компьютерная программа обработки изображений | |
JP5274305B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
EP2270714B1 (en) | Image processing device and image processing method | |
JP5121599B2 (ja) | 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 | |
JP2011141598A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP5321109B2 (ja) | 情報処理装置及び情報処理プログラム | |
US11521365B2 (en) | Image processing system, image processing apparatus, image processing method, and storage medium | |
JP2004046315A (ja) | 文字認識装置および文字認識方法、プログラムおよび記憶媒体 | |
JP2019125353A (ja) | 電子文書中の文字列塊を推測する方法 | |
US9741142B2 (en) | Method and apparatus for enabling text editing in a scanned document while maintaining fidelity of the appearance of the text | |
JP5950700B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
US11146705B2 (en) | Character recognition device, method of generating document file, and storage medium | |
JP2012205181A (ja) | 画像処理装置およびプログラム | |
JP2006209353A (ja) | 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体 | |
US9792263B2 (en) | Human input to relate separate scanned objects | |
JP6387761B2 (ja) | 画像処理システム、フォントサイズ決定方法及びフォントサイズ決定プログラム | |
US11715317B1 (en) | Automatic generation of training data for hand-printed text recognition | |
JP2006276905A (ja) | 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム | |
KR20160053544A (ko) | 후보 문자의 추출 방법 | |
JP5159588B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
US20210182477A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
US9400926B2 (en) | Image processing apparatus, image processing method, and non-transitory computer readable medium | |
JP2011040075A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP2020099031A (ja) | 情報処理装置、及び情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170817 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180717 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180730 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6387761 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |