JP2015103114A - テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム - Google Patents

テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム Download PDF

Info

Publication number
JP2015103114A
JP2015103114A JP2013244437A JP2013244437A JP2015103114A JP 2015103114 A JP2015103114 A JP 2015103114A JP 2013244437 A JP2013244437 A JP 2013244437A JP 2013244437 A JP2013244437 A JP 2013244437A JP 2015103114 A JP2015103114 A JP 2015103114A
Authority
JP
Japan
Prior art keywords
character
text data
embedding
specific
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013244437A
Other languages
English (en)
Other versions
JP6201686B2 (ja
Inventor
昭 大畑
Akira Ohata
昭 大畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2013244437A priority Critical patent/JP6201686B2/ja
Publication of JP2015103114A publication Critical patent/JP2015103114A/ja
Application granted granted Critical
Publication of JP6201686B2 publication Critical patent/JP6201686B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】空白文字、句読点等の特定の文字が存在していても、埋め込まれるテキストデータの文字画像との位置ずれやサイズの不揃い等の問題を解消できるテキストデータの埋め込み装置等を提供する。
【解決手段】文字認識処理部19により認識された各文字の中から特定の文字が検出された場合は、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定し、出力ファイルに埋め込む。
【選択図】 図2

Description

この発明は、スキャナ部で読み取った画像に対して文字認識処理を行い、認識された各文字のテキストデータを、スキャナ部の出力ファイルに埋め込むテキストデータの埋め込み装置、該装置を備えた例えば多機能デジタル複合機であるMFP(Multi Function Perirheral)等の画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラムに関する。
画像処理装置として、スキャナ部で読み取った原稿の画像をPDF(Portable Document Format)等のファイルに変換して外部装置に送信したり、自装置内に保存する機能を備えた画像形成装置が既に提供されている。
しかし、このようなファイルにはテキストデータが含まれていないため、文字列の検索を行うことができない。
そこで、スキャナ部で読み取った画像に対して文字認識処理装置により文字認識処理を行って文字画像をテキストデータ化し、このテキストデータを画像ファイルに埋め込むことが行われている(例えば特許文献1、2)。テキストデータを埋め込むときはJPEG等の出力ファイル(画像ファイル)の文字部分に重ねてテキストデータを透明フォントで埋め込み、これによりユーザーは読み込んだ原稿画像の文字列を検索することが可能となり、いくつかのフォーマットに応用されている。それをPDFに応用したものがサーチャブルPDFとして一般的に知られている。
文字認識処理装置からは、1つ1つの文字の上下左右の位置を示す位置情報と、1行単位の文字座標位置の情報が送られてきており、画像ファイルへのテキストデータの埋め込む位置やサイズなどはこの結果を元に決定されている。
上記のようなテキストデータ埋め込み処理において、1つの埋め込み文字群の文字数制限は特に存在せず、1文字単位であっても複数文字であっても可能である。埋め込みで指定できるパラメータは、テキストデータの先頭の座標位置、フォントサイズ、横方向(文字列方向)の倍率等があるが、テキストデータの後端を指定することができない。このため、テキストデータの文字の位置と画像ファイルの文字画像との位置を合わせるためには、テキストデータの横方向の倍率を計算する必要がある。ちなみに、埋め込むフォントが等幅フォントの場合は横方向の長さが正確に計算できるため一致するが、通常の文書で使用されやすい非等幅のプロポーショナルフォントの場合は文字列の長さの推定が一致しない場合がある。特に文字群の文字数が多くなると、倍率計算の誤差の影響で文字画像との位置がずれる可能性が高くなる。
そこで、各行に含まれる文字列を、行毎に、複数の文字グループに区切って1つの文字グループを短くすることで、原稿の文字画像との横方向の位置ずれを抑制する方法が考えられている。
特許第5197694号公報 特許第4590433号公報
ところで、原稿に含まれる文字として特殊な文字、例えば空白文字(スペース)がある。空白文字は実際に原稿に空白文字として存在するわけではなく、文字と文字との間隔が開いている等の条件判断を文字認識処理装置が行うことで、その部分を空白文字として認識している。また、空白文字の位置情報等も統一されておらず、文字認識処理装置の仕様によりまちまちである。たとえば、
(1)開始位置、終了位置の座標をともに(0,0)とする、
(2)前の文字の終了位置を開始位置、後の文字の開始位置を終了位置とする、
等の違いがある。
前者(1)の場合、実際の空白文字とは全く関係のない位置であるため、例えば複数に区切られた文字グループの最後に空白文字が検出されたような場合、図2(A)に示すように、その文字グループは原点Pから開始されるものと判断され、文字グループの座標計算やサイズ設定が異常な結果になり、文字画像との大きな位置ずれや文字サイズの不揃いを生じる。このため、文字列検索時に抽出された文字が反転表示されたときに文字高さやサイズに不揃いが生じたり、ドラッグによる選択時に画像と埋め込み文字の位置が一致せず、意図しない埋め込み文字を選択してしまうという問題があった。
また後者(2)の場合には、空白文字2個分程度の文字間隔があった場合、横長の1個の空白文字として文字認識装置から通知されるため、やはり文字グループ単位でテキストデータ化する場合に、文字画像との位置ずれの原因となる。
このような文字画像との位置ずれ等の問題は、空白文字に限られず、句読点、カンマ、ドット等、他の文字に較べてサイズが極端に小さな文字についても同様に生じるものであった。特に、欧米系の非等幅(プロポーショナル)フォントの場合には、比較的影響は少ないが、日本語等の等幅フォントの全角文字を使用する言語系では、通常の文字とのサイズ差が大きくなるため、位置ずれ等の不具合がより顕著となる。
この発明は、このような技術的背景に鑑みてなされたものであり、空白文字、句読点等の特定の文字が存在していても、埋め込まれるテキストデータの文字画像との位置ずれやサイズの不揃い等の問題を解消できるテキストデータの埋め込み装置及び該装置を備えた画像処理装置を提供し、さらにはテキストデータの埋め込み方法及びテキストデータの埋め込みプログラムを提供することを課題とする。
上記課題は、以下の手段によって解決される。
(1)画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識手段と、前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む際に、埋め込まれる前記テキストデータのサイズ及び位置を決定する決定手段と、前記決定手段により決定されたサイズ及び位置に基づいて、前記テキストデータを前記出力ファイルに埋め込む埋め込み手段と、前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出手段と、を備え、前記特定文字検出手段により前記特定の文字が検出された場合は、前記決定手段は、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定することを特徴とするテキストデータの埋め込み処理装置。
(2)前記特定の文字は空白文字である前項1に記載のテキストデータの埋め込み処理装置。
(3)前記空白文字の前後に文字が存在しない場合、該空白文字を削除する前項2に記載のテキストデータの埋め込み処理装置。
(4)前記空白文字が行頭に存在する場合は、該空白文字を削除する前項2または3に記載のテキストデータの埋め込み処理装置。
(5)前記特定の文字は句読点、カンマ、ドットの少なくともいずれかである前項1に記載のテキストデータの埋め込み処理装置。
(6)前記文字の言語が全角文字を含む2バイト文字の言語である場合に限り、前記決定手段は、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報に基づいて、前記特定の文字のサイズ及び位置を決定する前項1〜5のいずれかに記載のテキストデータの埋め込み処理装置。
(7)画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識手段と、前記文字認識処理により認識された文字列を、予め設定された規則に従って複数の文字グループに区切る文字列区切り手段と、前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む埋め込み手段と、前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出手段と、前記特定文字検出手段により検出された特定文字の位置を判定する判定手段と、を備え、前記特定文字検出手段により前記特定の文字が検出され、かつ前記判定手段により検出された特定文字の位置が前記文字列区切り手段により区切られた文字グループの先頭でかつ行頭でないと判定された場合は、前記埋め込み手段は、前記特定の文字をその前の文字グループの最後に連結させて埋め込むことを特徴とするテキストデータの埋め込み処理装置。
(8)前記文字列区切り手段は、文字数、空白文字、句読点、カンマ、ドットの少なくともいずれかに基づいて、各行の文字列を複数の文字グループに区切る前項7に記載のテキストデータの埋め込み処理装置。
(9)画像を読み取る読み取り手段と、前項1〜8のいずれかに記載のテキストデータの埋め込み処理装置とを備えた画像処理装置。
(10)画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む際に、埋め込まれる前記テキストデータのサイズ及び位置を決定する決定ステップと、前記決定ステップにより決定されたサイズ及び位置に基づいて、前記テキストデータを前記出力ファイルに埋め込む埋め込みステップと、前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、を備え、前記特定文字検出ステツプにより前記特定の文字が検出された場合は、前記決定ステップでは、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定することを特徴とするテキストデータの埋め込み処理方法。
(11)画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、前記文字認識ステップにより認識された文字列を、予め設定された規則に従って複数の文字グループに区切る文字列区切りステップと、前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む埋め込みステップと、前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、前記特定文字検出ステップにより検出された特定文字の位置を判定する判定ステップと、を備え、前記特定文字検出ステップにより前記特定の文字が検出され、かつ前記判定ステップにより検出された特定文字の位置が前記文字列区切りステップにより区切られた文字グループの先頭でかつ行頭でないと判定された場合は、前記埋め込みステップでは、前記特定の文字をその前の文字グループの最後に連結させて埋め込むことを特徴とするテキストデータの埋め込み処理方法。
(12)画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む際に、埋め込まれる前記テキストデータのサイズ及び位置を決定する決定ステップと、前記決定ステップにより決定されたサイズ及び位置に基づいて、前記テキストデータを前記出力ファイルに埋め込む埋め込みステップと、前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、をテキストデータの埋め込み処理装置のコンピュータに実行させ、さらに、前記特定文字検出ステツプにより前記特定の文字が検出された場合は、前記決定ステップでは、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定する処理を、前記コンピュータに実行させるためのテキストデータの埋め込み処理方法。
(13)画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、前記文字認識ステップにより認識された文字列を、予め設定された規則に従って複数の文字グループに区切る文字列区切りステップと、前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む埋め込みステップと、前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、前記特定文字検出ステップにより検出された特定文字の位置を判定する判定ステップと、をテキストデータの埋め込み処理装置のコンピュータに実行させ、さらに、前記特定文字検出ステップにより前記特定の文字が検出され、かつ前記判定ステップにより検出された特定文字の位置が前記文字列区切りステップにより区切られた文字グループの先頭でかつ行頭でないと判定された場合は、前記埋め込みステップでは、前記特定の文字をその前の文字グループの最後に連結させて埋め込む処理を、前記コンピュータに実行させるためのテキストデータの埋め込み処理方法。
前項(1)に記載の発明によれば、文字認識処理により認識された各文字の中から特定の文字が検出された場合は、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置が決定され、出力ファイルに埋め込まれるから、前記特定の文字のサイズ及び位置を例えば1文字前の文字または1文字後の文字のサイズと同一のサイズにして、1文字前の文字の後または1文字後の文字の前に埋め込むことができる。このため、特定の文字について認識処理手段から(0,0)の位置座標情報が出力されたり、空白文字2個分程度の文字間隔があったような場合でも、適正なサイズ及び位置で特定の文字を埋め込むことができ、文字画像との位置ずれやサイズの不揃い等の不具合が発生するのを防止できる。
その結果、文字列検索時に抽出された文字が反転表示されたときに文字高さやサイズに不揃いが生じたり、ドラッグによる選択時に画像と埋め込み文字の位置が一致せず、意図しない埋め込み文字を選択してしまうという問題を解消することができる。
前項(2)に記載の発明によれば、空白文字(スペース)が存在している場合に、埋め込み時の文字画像との位置ずれ等を防止できる。
前項(3)に記載の発明によれば、空白文字の前後に文字が存在しない場合、該空白文字は削除されるから、不要な空白文字の埋め込み処理を回避できる。
前項(4)に記載の発明によれば、空白文字が行頭に存在する場合は、該空白文字は削除され、埋め込みが行われないから、空白文字がドラッグ等により選択されるのを防止できる。
前項(5)に記載の発明によれば、句読点、カンマ、ドットの少なくともいずれかが存在している場合に、埋め込み時の文字画像との位置ずれ等を防止できる。
前項(6)に記載の発明によれば、文字の言語が全角文字を含む2バイト文字の言語である場合は、特定の文字の存在による文字画像との位置ずれ等を発生しやすいことから、この場合に限り、特定の文字のサイズ及び位置の制御が行うことで、処理の簡素化を図りながら位置ずれ等の発生を効率的に防止できる。
前項(7)に記載の発明によれば、文字認識処理により認識された文字列が、予め設定された規則に従って複数の文字グループに区切られるとともに、前記特定の文字が前記区切られた文字グループの先頭に存在しかつ行頭でない場合は、前記特定の文字をその前の文字グループの最後に連結させて埋め込むから、通常の文字がその文字グループの先頭に配置されることになる。このため、その文字グループの埋め込み位置の設定が容易となり、位置ずれの発生を益々防止できる。
前項(8)に記載の発明によれば、文字数、空白文字、句読点、カンマ、ドットの少なくともいずれかに基づいて、各行の文字列が複数の文字グループに区切られる。
前項(9)に記載の発明によれば、特定の文字について認識処理手段から(0,0)の位置座標情報が出力されたり、空白文字2個分程度の文字間隔があったような場合でも、適正なサイズ及び位置で特定の文字を埋め込むことができ、文字画像との位置ずれやサイズの不揃い等の不具合が発生するのを防止できる画像処理装置となる。
前項(10)に記載の発明によれば、特定の文字について認識処理結果として(0,0)の位置座標情報が出力されたり、空白文字2個分程度の文字間隔があったような場合でも、適正なサイズ及び位置で特定の文字を埋め込むことができ、文字画像との位置ずれやサイズの不揃い等の不具合が発生するのを防止できる。
前項(11)に記載の発明によれば、特定の文字が前記区切られた文字グループの先頭に存在しかつ行頭でない場合は、前記特定の文字をその前の文字グループの最後に連結させて埋め込むから、特定の文字が排除されたその文字グループの埋め込み位置の設定が容易となり、位置ずれの発生を益々防止できる。
前項(12)に記載の発明によれば、特定の文字について認識処理手段として(0,0)の位置座標情報が出力されたり、空白文字2個分程度の文字間隔があったような場合でも、適正なサイズ及び位置で特定の文字を埋め込むことができる処理を、テキストデータの埋め込み処理装置のコンピュータに実行させることができる。
前項(13)に記載の発明によれば、特定の文字が前記区切られた文字グループの先頭に存在しかつ行頭でない場合は、前記特定の文字をその前の文字グループの最後に連結させて埋め込む処理を、テキストデータの埋め込み処理装置のコンピュータに実行させることができる。
この発明の一実施形態に係る画像形成装置の基本構成を示すブロック図である。 従来の埋め込み処理と本発明の実施形態に係る埋め込み処理の相違を説明するための図である。 図2に示したような従来処理と本発明の一本実施形態に係る埋め込み処理との相違を示す図である。 従来の埋め込み処理と本発明の他の実施形態に係る埋め込み処理の相違を説明するための図である。 図4に示したような従来処理と本発明の一本実施形態に係る埋め込み処理との相違を示す表である。 従来の埋め込み処理と本発明のさらに他の実施形態に係る埋め込み処理の相違を説明するための図である。 図6に示したような従来処理と本発明の一本実施形態に係る埋め込み処理との相違を示す表である。 図1の画像形成装置による埋め込み処理を示すフローチャートである。 図1の画像形成装置による埋め込み処理の他の例を示すフローチャートである。 図8及び図9のフローチャートにおける文字列区切り処理の内容を示すフローチャートである。
以下、この発明の実施形態を図面に基づいて説明する。
図1は、この発明の一実施形態に係る画像形成装置1の基本構成を示すブロック図である。この実施形態では、画像形成装置として、コピー機能、プリンタ機能、スキャン機能等を備えた前述のMFPが用いられている。
画像形成装置1は、CPU11と、ROM12と、RAM13と、スキャナ部14と、記憶部15と、プリンタ部16と、操作パネル17と、ネットワークコントローラ(N1C)18と、文字認識処理部19等を備えている。
前記CPU11は、画像形成装置1の全体を統括制御し、コピー機能、プリンタ機能、スキャン機能、ファクシミリ機能等の基本機能を使用可能に制御する。また、スキャナ部14で読み取った原稿の画像に文字認識処理部19による文字認識処理を施して文字画像をテキストデータ化し、このテキストデータを、読み取った画像のファイルに透明フォントで埋め込み、PDF等のファイルに変換してユーザーの端末装置等に送信したり、記憶部15に保存する等の処理を行うが、詳細は後述する。
前記ROM12は、CPU11の動作プログラム等を格納するメモリである。
前記RAM13は、CPU11が動作プログラムに基づいて動作する際の作業領域を提供するメモリである。
前記スキャナ部14は、原稿台(図示せず)に置かれた原稿の画像を読み取り、画像データに変換する読み取り手段である。
前記記憶部15は、例えばハードディスクドライブ(HDD)などの不揮発性の記憶デバイスにより構成されており、スキャナ部24で読み取られた原稿の画像データや、他の画像形成装置あるいはユーザー端末等から送信されてきたデータ、各種のアプリケーション等が記憶されている。
前記プリンタ部16は、前記スキャナ部14で読み取られた原稿の画像データやユーザ端末からのプリントデータ等を、指示されたモードに従って印刷するものである。
前記操作パネル17は、各種入力操作等のために使用されるものであり、メッセージや操作画面等を表示するタッチパネル式液晶等からなる表示部と、テンキー、スタートキー、ストップキー等を備えたキー入力部を備えている。
前記ネットワークコントローラ18は、ネットワーク上の他の画像形成装置や、その他の外部機器例えばユーザー端末等との間での通信を制御することにより、データの送受信を行うものである。
前記文字認識処理部19は、スキャナ部14で読み取られた原稿の画像に対して文字認識処理を行い、文字画像をテキストデータに変換する処理を行う。この文字認識処理部19は、CPU11の機能の一部として構成される。
次に、画像形成装置1で実行される、この発明の一実施形態に係るテキストデータの埋め込み方法について説明する。
まず、文字を含む原稿をスキャナ部14で読み取るとともに、読み取った原稿の画像データを文字認識処理部19で文字認識処理し、文字画像をテキストデータに変換する。
次いで、CPU11は各行に含まれるテキストデータからなる文字列を、行毎に、予め設定された規則に従って複数の文字グループに区切る。この例では、文字が「well over」という英語系文字であり、空白文字(スペースともいう)を区切りとして文字列を複数の文字グループに区切る場合について説明する。なお、英語系文字をスペースで区切るのではなく、カンマやドットに基づいて区切る構成であっても良く、スペース、カンマ、ドットの少なくともいずれかを用いて区切られるのが望ましい。
文字認識処理部19からは文字認識処理の結果として、図2(A)の破線に示すように、各文字画像100について1文字単位の外接矩形101を正確に切り出した座標位置と、それぞれのテキストコードが出力される。このようなテキストコードの出力結果に基づき、文字と文字との間隔が開いている等の条件判定からスペース500を検出し、スペース500が発見されたところまでを1つの文字グループとして扱うことで、「well+スペース」と「over」というワード単位の複数(この例では2個)の文字グループ201、202が生成される。なお、「well+スペース」とは「well」の後ろに「スペース」が存在しているという意味である。カンマやドットに基づいて区切る場合も同様である。
文字認識処理では出力されるスペース500の位置情報等については文字認識処理部19の仕様によって一定ではなく、例えば原点座標を示す(0,0)の情報が出力される。つまり、「well+スペース」の文字グループ201が原点座標から開始されている出力となるため、文字グループの座標計算やサイズ設定が異常な結果になる。つまり、テキストデータの切り出し領域は、図2(A)に示すように、原点Pと2つめの「l」の右下の点Qを対角座標とする矩形領域300であると計算され、従って埋め込まれるテキストデータの文字(埋め込み文字)400のサイズは図2(A)のように大きくなり、各文字の埋め込み開始位置も文字画像100と大きくずれてしまい、結果的に埋め込み文字400と文字画像100との位置ずれやフォントサイズのばらつきを生じてしまう。これでは、文字列検索時に抽出された文字が反転表示されたときに文字高さやサイズに不揃いが生じたり、ドラッグによる選択時に画像と埋め込み文字の位置が一致せず、意図しない埋め込み文字が選択されてしまうという問題がある。
そこで、この実施形態では、文字認識結果として得られるスペース500についての位置情報である原点座標位置は無視し、スペース500の1つ前の文字情報である「l」のサイズ及び位置情報を用いて、スペース500のサイズや位置を決定する。具体的には、図2(B)に示すように、「l」とほぼ同一サイズの領域501を「l」の後に連続させて形成する。
その結果、図2(B)に示すように、文字画像「well」の各文字の開始位置と同じ座標位置から、対応する埋め込み文字の埋め込みが開始され、「l」の後に適正なスペース501を有するテキストデータが埋め込まれる。このため、埋め込み文字400と文字画像100との位置ずれや他の文字グループの文字に対する文字サイズのばらつき等が解消される。図2(B)の符号301は、このような処理により計算される矩形の切り出し領域である。
なお、スペースの1つ前の文字情報が存在しないような場合は、1つ後ろの文字情報のサイズ、位置情報を用いて、スペースのサイズや位置を決定しても良い。
なお、文字グループ「over」についてはスペースが存在しないから、従来と同様の埋め込み処理が実行されるが、図2では切り出し領域310のみを記載し、埋め込まれる文字についての記載は省略している。
図2で説明したような従来処理と本実施形態に係る処理との相違を図3に示す。
図3(A)に示すように、原点座標Pから文字列方向(右方向)をx方向、下方向をy方向とする。図3(B)の表の「従来処理」の項目において、「w」「e」「l」「l」「スペース」の各文字についてのA座標は各文字の左上角部の座標であり、B座標は各文字の右下角部の座標であり、いずれも文字認識処理部19から出力される座標位置である。「スペース」については、A座標、B座標ともに(0,0)が出力されている。また、「上記文字列を含む矩形」とは、文字認識処理部19から出力された各文字の座標から計算された、文字グループ「well」についてのテキストデータの切り出し領域300(図2(A)に示す)であり、A座標は該領域の左上角部の座標を示し、B座標は前記領域の右下角部の座標である。
上記表から理解されるように、従来では「スペース」についてのA座標、B座標がともに(0,0)であるから、テキストデータの切り出し領域300のサイズが大きくなり、このため図2(A)に示したように、該領域300に対応する文字サイズも大きく各文字のx方向の位置ずれも大きくなる。
一方、図3(B)の表の「本実施形態の処理」の項目において、「w」「e」「l」「l」「スペース」の各文字についてのA座標、B座標は、文字認識処理部19から出力された座標に基づいて計算された、埋め込まれる各テキストデータの左上角部の座標と右下角部の座標である。「スペース」については、1つ前の文字である「l」のサイズ及び位置に基づいて、サイズ及び位置が決定されている。
また、「本実施形態の処理」の項目において、「上記文字列を含む矩形」は、文字認識処理部19から出力された各文字の座標から計算された、文字グループ「well」についてのテキストデータの切り出し領域301(図2(B))であり、A座標は該領域301の左上角部の座標を示し、B座標は前記領域301の右下角部の座標である。
図3の表から明らかなように、「本実施形態」における各文字のA座標及びB座標は、文字認識処理部19から出力された各文字のA座標及びB座標と同じであり、従って文字画像と埋め込み文字とに位置ずれはなく、また文字グループの中の最後の文字である「l」の後に適正なスペース501が形成されることがわかる。
このように、この実施形態では、文字認識処理により認識された各文字の中から空白文字(スペース)500が検出された場合は、該空白文字500の1文字前の文字「l」のサイズ及び位置情報を用いて、空白文字500のサイズ及び位置が決定され、出力ファイルに埋め込まれる。従って、空白文字500のサイズ及び位置を1文字前の文字「l」のサイズと例えば同一のサイズにして、1文字前の文字の後に埋め込むことができるから、空白文字500について認識処理部19から(0,0)の位置座標情報が出力された場合でも、適正なサイズ及び位置で空白文字を埋め込むことができ、文字画像100と埋め込み文字400の位置ずれやサイズの不揃い等の不具合が発生するのを防止できる。
図4は、この発明の他の実施形態を示すものである。この実施形態では、空白文字については、前の文字の終了位置を開始位置、後の文字の開始位置を終了位置とする位置情報が、文字認識処理部19から出力される例を示す。また、この実施形態においても、「well over」という文字列が空白文字502を区切りとして「well+スペース」と「over」というワード単位の2個の文字グループ201、202に区切られている。
空白文字(スペース)502について、1文字「l」の終了位置を開始位置、後の文字「o」の開始位置を終了位置とする位置情報が、文字認識処理部19から出力される場合、図4(A)に示すように空白文字502の幅が大きいと、横長の1個の空白文字として判断されるため、文字「w」から「スペース」502までがテキストコードの切り出し領域320として計算される。このため、文字画像100と埋め込み文字400との間で位置ずれが発生してしまう。
そこで、この実施形態では、「スペース」502の1つ前の文字情報である「l」のサイズ及び位置情報を用いて、「スペース」502のサイズや位置を決定する。具体的には、「l」とほぼ同一サイズの「スペース」を「l」の後に連続させて形成する。
その結果、図4(B)に示すように、文字画像「well」の文字開始位置と同じ座標位置から開始され「l」の後に適正な「スペース」503を有する切り出し領域321が形成され、テキストデータが埋め込まれる。このため、文字画像100との位置ずれが解消される。
図4で説明したような従来処理と本実施形態に係る処理との相違を図5の表に示す。
図5の表の「従来処理」の項目において、「w」「e」「l」「l」「スペース」の各文字についてのA座標は各文字の左上角部の座標であり、B座標は各文字の右下角部の座標であり、また、「上記文字列を含む矩形」は、文字認識処理部19から出力された各文字の座標から計算された、文字グループ「well」についてのテキストデータの切り出し領域 320(図4(A))であり、A座標は該領域320の左上角部の座標を示し、B座標は前記領域320の右下角部の座標である。
上記表から理解されるように、従来では「スペース」502についてのB座標が(74,26)であるから、テキストデータの切り出し領域のx方向のサイズが大きくなっており、このため図4(A)に示したように、各埋め込み文字400と文字画像100のx方向の位置ずれも大きくなる。
一方、図5の表の「本実施形態の処理」の項目において、「w」「e」「l」「l」「スペース」の各文字についてのA座標、B座標は、文字認識処理部19から出力された座標に基づいて計算された、埋め込まれる各テキストデータの左上角部の座標と右下角部の座標である。「スペース」については、1つ前の文字である「l」のサイズ及び位置に基づいて、サイズ及び位置が決定されている。
また、「本実施形態の処理」の項目において、「上記文字列を含む矩形」は、文字認識処理部19から出力された各文字の座標から計算された、文字グループ「well」についてのテキストデータの切り出し領域321(図4(B))であり、A座標は該領域321の左上角部の座標を示し、B座標は前記領域321の右下角部の座標である。
図5の表から明らかなように、「本実施形態」における各文字のA座標及びB座標は、文字認識処理部19から出力された各文字のA座標及びB座標と同じであり、従って文字画像と埋め込み文字とに位置ずれはなく、また文字グループ201の中の最後の文字である「l」の後に適正なスペース503が形成されることがわかる。
このように、この実施形態では、文字認識処理により認識された各文字の中から空白文字502が検出された場合は、該空白文字502の1文字前の文字「l」のサイズ及び位置情報を用いて、空白文字502のサイズ及び位置が決定され、出力ファイルに埋め込まれる。従って、空白文字502のサイズ及び位置を1文字前の文字「l」のサイズと同一のサイズにして、1文字前の文字「l」の後に埋め込むことができるから、適正なサイズ及び位置で空白文字を埋め込むことができ、文字画像100との位置ずれやサイズの不揃い等の不具合が発生するのを防止できる。
図6はこの発明のさらに他の実施形態を示すものである。この実施形態では、文字の言語が全角文字を含む2バイト文字の言語である例えば日本語であり、原稿の文字列が「今回で、完成。」であり、特定の文字が句点100aまたは読点100bである場合を示している。
まず、「今回で、完成。」という文字列を複数の文字グループに区切る。この実施形態では、一定の文字数毎に文字列を区切る場合を示しており、具体的には4文字ごとに「今回で、」と「完成。」という2個の文字グループ203、204に区切っている。
従来では、各文字を外接矩形100で切り出すとともに、各文字グループ201、202毎に、切り出した複数の外接矩形100を基に、「今」から「、」までの領域をテキストデータの切り出し領域330、340として決定する。しかし、「今回で、」という文字グループにおいては、句点100aのサイズが極端に小さいため、切り出し領域330のx方向の長さが短くなる。そして、この切り出し領域330に「今回で、」の各文字を割り当てて埋め込むと、図6(A)に示すように、一文字の幅が小さくなり、このため文字画像100と埋め込み文字400とに位置ずれが発生する。
そこで、この実施形態では、サイズの小さい句点100aが検出されると、その一文字前の文字である「で」のサイズ及び位置情報を用いて、句点100aのサイズや位置を決定する。具体的には、「で」のサイズとほぼ同じサイズの領域を「で」の後に連続して形成する。これにより、図6(B)に示すように、句点100aの埋め込み用の適正な領域504が確保され、文字画像100と埋め込み文字400の位置ずれの発生を防止できる。
なお、図示は省略したが、文字グループ「完成。」における読点100bについても同様に処理される。また、句読点100a、100bだけでなく、文字列にカンマやドットが含まれている場合も、句点や読点と同様に処理すればよい。
図6で説明したような従来処理と本実施形態に係る処理との相違を図7の表に示す。
図7の表の「従来処理」の項目において、「今」「回」「で」「、(句点)」の各文字についてのA座標は各文字の左上角部の座標であり、B座標は各文字の右下角部の座標であり、いずれも文字認識処理部19から出力される座標位置である。また、「上記文字列を含む矩形」とは、文字認識処理部19から出力された各文字の座標から計算された、文字グループ「今回で、」についてのテキストデータの切り出し領域330(図6(A))であり、A座標は該領域330の左上角部の座標を示し、B座標は前記領域330の右下角部の座標である。
上記表から理解されるように、従来では「、」についてのB座標が(63,25)であるから、テキストデータの切り出し領域330のx方向のサイズが小さく、このため図6(A)に示したように、各埋め込み文字400と文字画像100のx方向の位置ずれが大きくなる。
一方、図7の表の「本実施形態の処理」の項目において、「今」「回」「で」「、(句点)」の各文字についてのA座標、B座標は、文字認識処理部19から出力された座標に基づいて計算された、埋め込まれる各テキストデータの左上角部の座標と右下角部の座標である。「、」については、1つ前の文字である「で」のサイズ及び位置に基づいて、サイズ及び位置が決定されている。
また、「本実施形態の処理」の項目において、「上記文字列を含む矩形」は、文字認識処理部19から出力された各文字の座標から計算された、文字グループ「今回で、」についてのテキストデータの切り出し領域331(図6(B))であり、A座標は該領域331の左上角部の座標を示し、B座標は前記領域331の右下角部の座標である。
図7の表から明らかなように、「本実施形態」における「今」「回」「で」の各文字のA座標及びB座標は、文字認識処理部19から出力された各文字のA座標及びB座標と同じであり、また「、」のA座標と文字認識処理部19から出力された「、」のA座標におけるx座標位置は同じである。従って文字画像と埋め込み文字とにx方向の位置ずれは発生していないことがわかる。
このように、この実施形態では、文字認識処理により認識された各文字の中から句点101a、読点101b、カンマ、ドット等の特定の文字が検出された場合は、該特定の文字の1文字前の文字のサイズ及び位置情報を用いて、特定の文字のサイズ及び位置が決定され、出力ファイルに埋め込まれる。従って、特定の文字のサイズ及び位置を例えば1文字前の文字のサイズと同一のサイズにして、1文字前の文字の後に埋め込むことができるから、適正なサイズ及び位置で特定の文字を埋め込むことができ、文字画像との位置ずれやサイズの不揃い等の不具合が発生するのを防止できる。
以上の実施形態では、空白文字、句読点、カンマ、ドット等の特定の文字の埋め込みサイズや位置を、一文字前の文字のサイズ及び位置情報を用いて設定したが、特定の文字の一文字後ろの文字のサイズ及び位置情報を用いて、特定の文字のサイズ及び位置を決定しても良い。また、一文字前の文字が存在しない場合に一文字後ろの文字のサイズ及び位置情報を用いても良い。なお、1文字前の文字も1文字後ろの文字も存在しない場合は、スペースを削除するのがよい。
図8は、画像処理装置1で実行される、空白文字が検出された場合のテキストデータの埋め込み処理を示すフローチャートである。この処理は、画像処理装置1のCPU11がROM12等に記録された動作プログラムに従って動作することにより実行される。
ステップS1で、文字認識処理部19から文字コード及び各文字の座標情報を受け取り、ステップS2で、文字区切り処理を行い、文字列を複数の文字グループに区切る。文字区切り処理については後述する。
次いでステップS3で、文字が空白文字(スペース)か否かを判断する。つまりスペースを検出する。スペースでなければ(ステップS3でNO)、従来と同様にして各文字のサイズ、埋め込み位置を決定した後、ステップS6に進み、テキストコードを出力ファイルである画像データに透明レイヤで埋め込む。
ステップS3でスペースであれば(ステップS3でYES)、ステップS4に進み、スペースの一文字前に文字が存在するかどうかを判断する。一文字前に文字が存在すれば(ステップS4でYES)、ステップS5で、その文字のサイズ、位置情報からスペースのサイズ、位置を決定したのち、ステップS6でテキストコードを埋め込む。
ステップS4で、一文字前に文字が存在しなければ(ステップS4でNO)、ステップS7で、スペースの一文字後ろに文字が存在するかどうかを判断する。一文字後ろに文字が存在すれば(ステップS7でYES)、ステップS8で、その文字のサイズ、位置情報からスペースのサイズ、位置を決定したのち、ステップS6でテキストコードを埋め込む。
ステップS7で、一文字後ろに文字が存在しなければ(ステップS7でNO)、ステップS9でスペースを削除したのち、ステップS6で、他の文字についてテキストコードを埋め込む。
図9は、画像処理装置1で実行される、句読点が検出された場合のテキストデータの埋め込み処理を示すフローチャートである。この処理は、画像処理装置1のCPU11がROM12等に記録された動作プログラムに従って動作することにより実行される。
ステップS11で、文字認識処理部19から文字コード及び各文字の座標情報を受け取り、ステップS12で、文字区切り処理を行い、文字列を複数の文字グループに区切る。文字区切り処理については後述する。
次いでステップS13で、句読点処理を行うかどうかを、言語の文字が全角かどうかを調べることにより判断する。句読点処理を行うかどうかは予め設定されていても良い。例えば、日本語等の全角文字の場合は行う設定とし、英語等の半角文字の場合は行わない設定としても良い。日本語等の場合、非プロポーショナルフォントが比較的多く用いられており、その場合句読点と他の通常文字とのサイズ差が顕著になり、その分位置ずれが問題となるため、句読点処理を行う設定とするのがよい。一方、英語等の場合はプロポーショナルフォントが一般的であるため、句読点の処理をしなくても良い場合が多く、句読点処理を行わない設定とするのがよい。また、ユーザーによって設定可能に構成されても良い。
ステップS13において、句読点処理を行うと判断された場合、換言すれば文字が全角の場合(ステップS13でYES)、ステップS14に進む。句読点処理を行わないと判断された場合、換言すれば文字が全角でない場合(ステップS13でNO)、ステップS19で、従来と同様にして各文字のサイズ、埋め込み位置を決定した後、テキストコードを出力ファイルである画像データに透明フォントで埋め込む。
ステップS14では文字が句読点か否かを判断する。つまり句読点を検出する。句読点でなければ(ステップS14でNO)、ステップS19でテキストコードを埋め込む。
ステップS14で句読点であれば(ステップS14でYES)、ステップS15で句読点の一文字前に文字が存在するかどうかを判断する。一文字前に文字が存在すれば(ステップS15でYES)、ステップS16で、その文字のサイズ、位置情報から句読点のサイズ、位置を決定したのち、ステップS19でテキストコードを埋め込む。
ステップS15で、一文字前に文字が存在しなければ(ステップS15でNO)、ステップS17で、句読点の一文字後ろに文字が存在するかどうかを判断する。一文字後ろに文字が存在すれば(ステップS17でYES)、ステップS18で、その文字のサイズ、位置情報から句読点のサイズ、位置を決定したのち、ステップS19でテキストコードを埋め込む。
ステップS17で、一文字後ろに文字が存在しなければ(ステップS17でNO)、ステップS19で、従来と同様の処理でテキストコードを埋め込む。
図10は、図8のフローチャートにおけるステップS2、及び図9のフローチャートにおけるステップS12の文字列区切り処理の内容を示すフローチャートである。
ステップS31では、特定の文字かどうかを判断し、特定の文字でなければ(ステップS31でNO)、ステップS39で、予めN文字区切りとして設定されているN文字目に該当するかどうかを調べる。N文字目でなければ(ステップS39でNO)、ステップS41に進む。N文字目であれば(ステップS39でYES)、ステップS40で、ここで文字列を区切ったのち、ステップS41に進む。
なお、日本語、中国語、韓国語等のような全角文字に対して、特定の文字またはN文字単位で文字列を区切る場合、Nの値は通常は2〜10程度に設定される。英語等の半角文字に対して特定の文字だけで区切る場合、Nは十分に大きな値(例えばN=255)に設定される。
ステップS31で、特定の文字であれば(ステップS31でYES)、ステップS32で、その特定の文字が文字グループの先頭かどうかを調べる。先頭でなければ(ステップS32でNO)、ステップS40で、その特定の文字で文字列を区切った後、ステップS41に進む。
ステップS32で、特定の文字が文字グループの先頭であれば(ステップS32でYES)、ステップS33で、前に文字グループが存在しているかどうかを判断する。存在していれば(ステップS33でYES)、ステップS34で、その特定の文字を前の文字グループの最後に連結した後、ステップS41に進む。この連結処理により、特定の文字でない通常の文字がその文字グループの先頭に配置されることになる。このため、その文字グループの埋め込み位置の設定が容易となり、位置ずれの発生を益々防止できる。
ステップS33で、前に文字グループが存在していなければ(ステップS33でNO)、ステップS36で、その特定の文字がスペースかどうかを調べ、スペースであれば(ステップS36でYES)、ステップS37で、行の先頭のスペースを削除する設定がなされているかどうかを判断する。行の先頭の余白は、スペースかインデントかの判断はできないが、通常はスペースを入れない方が検索時に有利となるため、行の先頭のスペースを削除する設定がデフォルトでなされている。ただし、ユーザーによって設定できるようにしても良い。また、日本語等のような全角文字の場合には、行の先頭のスペースを削除する設定とし、英語系言語のような半角文字の場合は非設定としても良い。
ステップS37で、行の先頭のスペースを削除する設定がなされている場合(ステップS37でYES)、ステップS38でスペースを無効なデータとして削除した後、ステップS41に進む。行の先頭のスペースを削除する設定がなされていない場合(ステップS37でNO)、スペースを削除することなくステップS41に進む。
ステップS41では、次の文字があるかどうかを調べ、あれば(ステップS41でYES)、ステップS31に戻る。次の文字がなければ(ステップS41でNO)、図8または図9のフローチャートに戻る。
以上、本発明の一実施形態を説明したが、本発明は上記実施形態に限定されることはない。例えば、テクストデータの埋め込み処理装置が画像処理装置1である場合を説明したが、画像処理装置に限定されることはなく、他の装置に適用しても良い。
1 画像形成装置
11 CPU
12 ROM
14 スキャナ部
15 記憶部
17 操作パネル
18 ネットワークコントローラ
19 文字認識部
100 文字画像
100a 句点
100b 読点
200 各文字の外接矩形
300、301、310、330、331、340 切り出し領域
400 埋め込み文字
500 スペース

Claims (13)

  1. 画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識手段と、
    前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む際に、埋め込まれる前記テキストデータのサイズ及び位置を決定する決定手段と、
    前記決定手段により決定されたサイズ及び位置に基づいて、前記テキストデータを前記出力ファイルに埋め込む埋め込み手段と、
    前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出手段と、
    を備え、
    前記特定文字検出手段により前記特定の文字が検出された場合は、前記決定手段は、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定することを特徴とするテキストデータの埋め込み処理装置。
  2. 前記特定の文字は空白文字である請求項1に記載のテキストデータの埋め込み処理装置。
  3. 前記空白文字の前後に文字が存在しない場合、該空白文字を削除する請求項2に記載のテキストデータの埋め込み処理装置。
  4. 前記空白文字が行頭に存在する場合は、該空白文字を削除する請求項2または3に記載のテキストデータの埋め込み処理装置。
  5. 前記特定の文字は句読点、カンマ、ドットの少なくともいずれかである請求項1に記載のテキストデータの埋め込み処理装置。
  6. 前記文字の言語が全角文字を含む2バイト文字の言語である場合に限り、前記決定手段は、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報に基づいて、前記特定の文字のサイズ及び位置を決定する請求項1〜5のいずれかに記載のテキストデータの埋め込み処理装置。
  7. 画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識手段と、
    前記文字認識処理により認識された文字列を、予め設定された規則に従って複数の文字グループに区切る文字列区切り手段と、
    前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む埋め込み手段と、
    前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出手段と、
    前記特定文字検出手段により検出された特定文字の位置を判定する判定手段と、
    を備え、
    前記特定文字検出手段により前記特定の文字が検出され、かつ前記判定手段により検出された特定文字の位置が前記文字列区切り手段により区切られた文字グループの先頭でかつ行頭でないと判定された場合は、前記埋め込み手段は、前記特定の文字をその前の文字グループの最後に連結させて埋め込むことを特徴とするテキストデータの埋め込み処理装置。
  8. 前記文字列区切り手段は、文字数、空白文字、句読点、カンマ、ドットの少なくともいずれかに基づいて、各行の文字列を複数の文字グループに区切る請求項7に記載のテキストデータの埋め込み処理装置。
  9. 画像を読み取る読み取り手段と、請求項1〜8のいずれかに記載のテキストデータの埋め込み処理装置とを備えた画像処理装置。
  10. 画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、
    前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む際に、埋め込まれる前記テキストデータのサイズ及び位置を決定する決定ステップと、
    前記決定ステップにより決定されたサイズ及び位置に基づいて、前記テキストデータを前記出力ファイルに埋め込む埋め込みステップと、
    前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、
    を備え、
    前記特定文字検出ステツプにより前記特定の文字が検出された場合は、前記決定ステップでは、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定することを特徴とするテキストデータの埋め込み処理方法。
  11. 画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、
    前記文字認識ステップにより認識された文字列を、予め設定された規則に従って複数の文字グループに区切る文字列区切りステップと、
    前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む埋め込みステップと、
    前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、
    前記特定文字検出ステップにより検出された特定文字の位置を判定する判定ステップと、
    を備え、
    前記特定文字検出ステップにより前記特定の文字が検出され、かつ前記判定ステップにより検出された特定文字の位置が前記文字列区切りステップにより区切られた文字グループの先頭でかつ行頭でないと判定された場合は、前記埋め込みステップでは、前記特定の文字をその前の文字グループの最後に連結させて埋め込むことを特徴とするテキストデータの埋め込み処理方法。
  12. 画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、
    前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む際に、埋め込まれる前記テキストデータのサイズ及び位置を決定する決定ステップと、
    前記決定ステップにより決定されたサイズ及び位置に基づいて、前記テキストデータを前記出力ファイルに埋め込む埋め込みステップと、
    前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、
    をテキストデータの埋め込み処理装置のコンピュータに実行させ、さらに、
    前記特定文字検出ステツプにより前記特定の文字が検出された場合は、前記決定ステップでは、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定する処理を、前記コンピュータに実行させるためのテキストデータの埋め込み処理方法。
  13. 画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、
    前記文字認識ステップにより認識された文字列を、予め設定された規則に従って複数の文字グループに区切る文字列区切りステップと、
    前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む埋め込みステップと、
    前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、
    前記特定文字検出ステップにより検出された特定文字の位置を判定する判定ステップと、
    をテキストデータの埋め込み処理装置のコンピュータに実行させ、さらに、
    前記特定文字検出ステップにより前記特定の文字が検出され、かつ前記判定ステップにより検出された特定文字の位置が前記文字列区切りステップにより区切られた文字グループの先頭でかつ行頭でないと判定された場合は、前記埋め込みステップでは、前記特定の文字をその前の文字グループの最後に連結させて埋め込む処理を、前記コンピュータに実行させるためのテキストデータの埋め込み処理方法。
JP2013244437A 2013-11-26 2013-11-26 テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム Active JP6201686B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013244437A JP6201686B2 (ja) 2013-11-26 2013-11-26 テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013244437A JP6201686B2 (ja) 2013-11-26 2013-11-26 テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム

Publications (2)

Publication Number Publication Date
JP2015103114A true JP2015103114A (ja) 2015-06-04
JP6201686B2 JP6201686B2 (ja) 2017-09-27

Family

ID=53378744

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013244437A Active JP6201686B2 (ja) 2013-11-26 2013-11-26 テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム

Country Status (1)

Country Link
JP (1) JP6201686B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133615A (zh) * 2016-02-26 2017-09-05 佳能株式会社 信息处理设备和信息处理方法
CN107729898A (zh) * 2016-08-10 2018-02-23 富士通株式会社 检测文本图像中的文本行的方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04236685A (ja) * 1991-01-18 1992-08-25 Ricoh Co Ltd 文字間スペース認識方法
JP2008059527A (ja) * 2006-09-04 2008-03-13 Ricoh Co Ltd 画像処理装置およびプログラム
JP2009009527A (ja) * 2007-06-29 2009-01-15 Canon Inc 画像処理装置、画像処理方法、コンピュータプログラム
JP2009223363A (ja) * 2008-03-13 2009-10-01 Fuji Xerox Co Ltd 文書処理装置および文書処理プログラム
JP2010211470A (ja) * 2009-03-10 2010-09-24 Ricoh Co Ltd 文書データ生成装置と文書データ生成方法
JP2013080349A (ja) * 2011-10-03 2013-05-02 Canon Inc 画像処理装置、画像処理方法、およびプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04236685A (ja) * 1991-01-18 1992-08-25 Ricoh Co Ltd 文字間スペース認識方法
JP2008059527A (ja) * 2006-09-04 2008-03-13 Ricoh Co Ltd 画像処理装置およびプログラム
JP2009009527A (ja) * 2007-06-29 2009-01-15 Canon Inc 画像処理装置、画像処理方法、コンピュータプログラム
JP2009223363A (ja) * 2008-03-13 2009-10-01 Fuji Xerox Co Ltd 文書処理装置および文書処理プログラム
JP2010211470A (ja) * 2009-03-10 2010-09-24 Ricoh Co Ltd 文書データ生成装置と文書データ生成方法
JP2013080349A (ja) * 2011-10-03 2013-05-02 Canon Inc 画像処理装置、画像処理方法、およびプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133615A (zh) * 2016-02-26 2017-09-05 佳能株式会社 信息处理设备和信息处理方法
KR20170101125A (ko) * 2016-02-26 2017-09-05 캐논 가부시끼가이샤 정보 처리장치, 정보 처리방법, 및 기억매체
US10395131B2 (en) 2016-02-26 2019-08-27 Canon Kabushiki Kaisha Apparatus, method and non-transitory storage medium for changing position coordinates of a character area stored in association with a character recognition result
KR102090973B1 (ko) * 2016-02-26 2020-03-19 캐논 가부시끼가이샤 정보 처리장치, 정보 처리방법, 및 기억매체
CN107133615B (zh) * 2016-02-26 2021-08-13 佳能株式会社 信息处理设备和信息处理方法
CN107729898A (zh) * 2016-08-10 2018-02-23 富士通株式会社 检测文本图像中的文本行的方法和装置
CN107729898B (zh) * 2016-08-10 2020-12-22 富士通株式会社 检测文本图像中的文本行的方法和装置

Also Published As

Publication number Publication date
JP6201686B2 (ja) 2017-09-27

Similar Documents

Publication Publication Date Title
US10528679B2 (en) System and method for real time translation
US10860785B2 (en) Apparatus for setting file name and the like for scan image, control method thereof, and storage medium
EP2162859B1 (en) Image processing apparatus, image processing method, and computer program
US9442899B2 (en) Image forming apparatus, text data embedding method, and recording medium
JP7159608B2 (ja) 操作画面の表示装置、画像処理装置及びプログラム
JP2009146064A (ja) 画像処理装置、画像処理方法、そのプログラム及び記憶媒体
JP6427964B2 (ja) 画像処理システム、情報処理装置及びプログラム
US9614984B2 (en) Electronic document generation system and recording medium
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
US20110075932A1 (en) Image processing method and image processing apparatus for extracting heading region from image of document
US20090150359A1 (en) Document processing apparatus and search method
US20220068276A1 (en) Information processor, print system, and control method
JP6201686B2 (ja) テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム
JP5412916B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP7147544B2 (ja) 情報処理装置、及び情報処理方法
US9400926B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
JP6205973B2 (ja) 変更履歴出力装置、プログラム
JP7115162B2 (ja) 電子機器、画像形成装置、電子メール作成支援方法、及び電子メール作成支援プログラム
JP2017072941A (ja) 文書振り分けシステム、情報処理方法及びプログラム
JP2020099030A (ja) 情報処理装置、及び情報処理方法
US20230325126A1 (en) Information processing apparatus and method and non-transitory computer readable medium
US11006015B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP5935376B2 (ja) 複写装置
US20240129416A1 (en) Method of producing image data and image reading system
JP2017011605A (ja) 画像形成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170627

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170814

R150 Certificate of patent or registration of utility model

Ref document number: 6201686

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150