JP5915628B2 - 画像形成装置、テキストデータの埋め込み方法及び埋め込みプログラム - Google Patents

画像形成装置、テキストデータの埋め込み方法及び埋め込みプログラム Download PDF

Info

Publication number
JP5915628B2
JP5915628B2 JP2013244436A JP2013244436A JP5915628B2 JP 5915628 B2 JP5915628 B2 JP 5915628B2 JP 2013244436 A JP2013244436 A JP 2013244436A JP 2013244436 A JP2013244436 A JP 2013244436A JP 5915628 B2 JP5915628 B2 JP 5915628B2
Authority
JP
Japan
Prior art keywords
character
font size
embedding
image
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013244436A
Other languages
English (en)
Other versions
JP2015103113A (ja
Inventor
大木 亮
亮 大木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2013244436A priority Critical patent/JP5915628B2/ja
Priority to US14/546,776 priority patent/US9442899B2/en
Priority to CN201410683389.4A priority patent/CN104683629B/zh
Publication of JP2015103113A publication Critical patent/JP2015103113A/ja
Application granted granted Critical
Publication of JP5915628B2 publication Critical patent/JP5915628B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K15/00Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers
    • G06K15/02Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers using printers
    • G06K15/18Conditioning data for presenting it to the physical printing elements
    • G06K15/1827Accessing generic data, e.g. fonts
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3261Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal
    • H04N2201/3266Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal of text or character information, e.g. text accompanying an image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Controls And Circuits For Display Device (AREA)

Description

この発明は、例えば多機能デジタル複合機であるMFP(Multi Function Perirheral)等の画像形成装置、該画像形成装置で実行されるテキストデータの埋め込み方法、及び画像形成装置のコンピュータに前記テキストデータの埋め込み方法を実行させるためのテキストデータの埋め込みプログラムに関する。
画像形成装置として、スキャナ部で読み取った原稿の画像をPDF(Portable Document Format)等のファイルに変換して外部装置に送信したり、自装置内に保存する機能を備えた画像形成装置が既に提供されている。
しかし、このようなファイルにはテキストデータが含まれていないため、文字列の検索を行うことができない。
そこで、スキャナ部で読み取った画像に対して文字認識処理装置により文字認識処理を行って文字画像をテキストデータ化し、このテキストデータを画像ファイルに埋め込むことが行われている(例えば特許文献1、2)。テキストデータを埋め込むときはJPEG等の画像ファイルを手前にし、その背後にテキストデータを透明フォントで埋め込み、これによりユーザーは読み込んだ原稿画像の文字列を検索することが可能となる。
文字認識処理装置からは、1つ1つの文字の上下左右の位置を示す位置情報と、1行単位の文字座標位置の情報が送られてきており、画像ファイルへのテキストデータの埋め込む位置やサイズなどはこの結果を元に決定されている。
上記のようなテキストデータ埋め込み処理において、1つの埋め込み文字群の文字数制限は特に存在せず、1文字単位であっても複数文字であっても可能である。埋め込みで指定できるパラメータは、テキストデータの先頭の座標位置、フォントサイズ、横方向(文字列方向)の倍率等があるが、テキストデータの後端を指定することができない。このため、テキストデータの文字の位置と画像ファイルの文字画像との位置を合わせるためには、テキストデータの横方向の倍率を計算する必要がある。ちなみに、埋め込むフォントが等幅フォントの場合は横方向の長さが正確に計算できるため一致するが、通常の文書で使用されやすい文字毎に幅が相違するプロポーショナルのフォントの場合は文字列の長さの推定が一致しない場合がある。特に文字群の文字数が多くなると、倍率計算の誤差の影響で文字画像との位置がずれる可能性が高くなる。
そこで、各行に含まれる文字列を、行毎に、複数の文字グループに区切って1つの文字グループを短くすることで、原稿の文字画像との横方向の位置ずれを抑制する方法が考えられている。例えば、
(1)埋め込み文字群を1文字単位とし、1文字単位で原稿の文字画像位置と一致させる、とか
(2)欧米系言語では、カンマ、ドット、スペースを区切り目とすることで、複数個の文字グループに区切り、各文字グループ毎に原稿の文字画像位置と一致させる、
等の方法が考えられている。
特許第5197694号公報 特許第4590433号公報
しかしながら、一行の文字列を複数の文字グループに区切って文字画像との位置ずれを抑制する従来の方法では次のような問題があった。
即ち、画像ファイルに埋め込む文字のフォントサイズは、文字認識処理により認識された文字の上下の座標から文字高さを算出することにより決定されるが、一行の文字列を複数の文字グループに区切った場合、従来では、文字グループに含まれている文字の高さを用いて、文字グループ毎にフォントサイズを決定していた。
例えば、「well over a million」という英文文字列をスペースを基に「well」「over」「a」「million」と4つの文字グループに区切った場合、「well」と「million」の方が「over」と「a」よりも文字の最大高さが大きいためフォントサイズが大きくなる一方、「over」と「a」は全てが小さい文字のためフォントサイズが小さくなる。
このような文字グループ毎に決定したフォントサイズのテキストデータを画像ファイルに埋め込んだ状態を図2に示す。
図2(A)は原稿の文字画像100を示し、同図(B)は実線で示す文字画像100に、透明フォントでテキストコードが埋め込まれている状態を示し、黒塗りで示す文字が埋め込み文字200であり、「over」と「a」の文字グループがサイズの小さいフォントとなっている。
この状態で、テキストデータが埋め込まれたファイルに対して、ユーザーがファイル中のデータ「well over a million」という文字列を検索した場合、該当する文字列が抽出されると、該文字列の文字領域は、図2(C)に示すように白黒反転して表示されるが、埋め込まれたテキストデータには、フォントサイズの大きな文字グループとフォントサイズの小さな文字グループが含まれているから、同図(C)に示すように、反転された文字のフォントサイズも文字グループ間で異なる状態となる。このため、反転表示された文字領域の高さ方向に凹凸が生じてしまい、ユーザーにとって見にくい状態となるという問題があった。
この発明は、このような技術的背景に鑑みてなされたものであり、文字認識処理により認識されたテキストデータを画像ファイルに埋め込むことが可能な画像形成装置であって、テキストデータが埋め込まれたファイルに対して文字検索が行われ、抽出された該当文字列の文字領域における文字と文字以外の部分が反転表示された場合に、反転表示部分に凹凸が発生せず見やすい表示状態となるようにテキストデータを埋め込むことができる画像形成装置、及び該画像形成装置で実行されるテキストデータの埋め込み方法を提供し、さらには前記画像形成装置のコンピュータに前記テキストデータの埋め込み方法を実行させるためのテキストデータの埋め込みプログラムを提供することを課題とする。
上記課題は、以下の手段によって解決される。
(1)画像を読み取る読み取り手段と、前記読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識手段と、前記文字認識処理により認識された各行に含まれる文字列を、行毎に、予め設定された規則に従って複数の文字グループに区切る文字列区切り手段と、前記各行の行単位で一定のフォントサイズを決定するフォントサイズ決定手段と、文字列方向をx方向としたときに、前記文字列区切り手段により区切られた前記複数の文字グループのそれぞれにおいて、前記文字認識処理により認識された先頭の文字の前記x方向の座標位置を基準としてx方向の埋め込み位置を決定する埋め込み位置決定手段と、前記埋め込み位置決定手段により決定されたx方向の埋め込み位置において、前記フォントサイズ決定手段により決定されたフォントサイズにて、各文字グループのテキストデータを画像ファイルに埋め込む埋め込み手段と、を備えたことを特徴とする画像形成装置。
(2)文字列方向と直交する方向をy方向とし、前記文字グループに含まれる文字の最大高さで文字グループの高さを規定したとき、前記埋め込み位置決定手段は、各行において、最大高さを有する文字グループのy方向の座標位置、最小高さを有する文字グループのy方向の座標位置、各文字グループのy方向の座標位置の平均値、行の先頭の文字グループのy方向の座標位置のいずれかを基準として、各文字グループ共通のy方向の座標位置を決定する前項1に記載の画像形成装置。
(3)前記フォントサイズは、各行において、その行に含まれる文字の最大高さ、最小高さ及び平均高さのうちのいずれかに対応するサイズである前項1または2に記載の画像形成装置。
(4)各行において、一定以上大きいまたは小さい特殊サイズ文字が含まれている場合、前記文字列区切り手段は、前記特殊サイズ文字を1文字の文字グループとして区切り、前記フォントサイズ決定手段は、前記特殊サイズ文字を除外して行単位のフォントサイズを決定するとともに、前記特殊サイズ文字についてはその高さサイズに相当するフォントサイズを前記特殊サイズ文字のフォントサイズとして決定する前項1〜3のいずれかに記載の画像形成装置。
(6)前記文字列区切り手段は、カンマ、ドット、スペースの少なくともいずれかに基づいて、各行の文字列を複数の文字グループに区切る前項1〜5のいずれかに記載の画像形成装置。
(7)前記文字列区切り手段は、N(Nは1以上の整数)文字毎に、各行の文字列を複数の文字グループに区切る前項1〜5のいずれかに記載の画像形成装置。
(8)前記Nの値を、ファイルサイズを優先する場合の大きな値と、テキストデータの埋め込み位置の精度を優先する場合の小さい値との間で切り替える切替手段を備えている前項7に記載の画像形成装置。
(9)前記Nの値を、前記読み取り手段の画像読み取りに対する指定解像度が高解像度である場合の小さな値と、低解像度である場合の大きな値との間で切り替える切替手段を備えている前項7に記載の画像形成装置。
(10)画像形成装置で実行されるテキストデータの埋め込み方法であって、画像を読み取る読み取りステップと、前記画像読み取りステップにより読み取られた画像に対して文字認識処理を行う文字認識ステップと、前記文字認識処理により認識された各行に含まれる文字列を、行毎に、予め設定された規則に従って複数の文字グループに区切る文字列区切りステップと、前記各行の行単位で一定のフォントサイズを決定するフォントサイズ決定ステップと、文字列方向をx方向としたときに、前記文字列区切りステップにより区切られた前記複数の文字グループのそれぞれにおいて、前記文字認識処理により認識された先頭の文字の前記x方向の座標位置を基準としてx方向の埋め込み位置を決定する埋め込み位置決定ステップと、前記埋め込み位置決定ステップにより決定されたx方向の埋め込み位置において、前記フォントサイズ決定ステップにより決定されたフォントサイズにて、各文字グループのテキストデータを画像ファイルに埋め込む埋め込みステップと、を備えたことを特徴とするテキストデータの埋め込み方法。
(11)画像を読み取る読み取りステップと、前記画像読み取りステップにより読み取られた画像に対して文字認識処理を行う文字認識ステップと、前記文字認識処理により認識された各行に含まれる文字列を、行毎に、予め設定された規則に従って複数の文字グループに区切る文字列区切りステップと、前記各行の行単位で一定のフォントサイズを決定するフォントサイズ決定ステップと、文字列方向をx方向としたときに、前記文字列区切りステップにより区切られた前記複数の文字グループのそれぞれにおいて、前記文字認識処理により認識された先頭の文字の前記x方向の座標位置を基準としてx方向の埋め込み位置を決定する埋め込み位置決定ステップと、前記埋め込み位置決定ステップにより決定されたx方向の埋め込み位置において、前記フォントサイズ決定ステップにより決定されたフォントサイズにて、各文字グループのテキストデータを画像ファイルに埋め込む埋め込みステップと、を画像形成装置のコンピュータに実行させるためのテキストデータの埋め込みプログラム。
前項(1)に記載の発明によれば、読み取り手段で読み取られた画像に対して文字認識処理が行われるとともに、文字認識処理により認識された各行に含まれる文字列が、行毎に、予め設定された規則に従って複数の文字グループに区切られる。一方、各行の行単位で一定のフォントサイズが決定される。また、文字列方向をx方向としたときに、前記区切られた複数の文字グループのそれぞれにおいて、先頭の文字のx方向の座標位置を基準としてx方向の埋め込み位置が決定され、この決定されたx方向の埋め込み位置において、前記決定されたフォントサイズにて、各文字グループのテキストデータが画像ファイルに埋め込まれる。
つまり、フォントサイズは文字グループ毎ではなく行単位で決定されるから、異なる文字グループであっても文字のフォントサイズは一行の中で統一される。このため、画像ファイルに埋め込まれた文字列の検索が行われた場合に、抽出された文字列において文字部分と文字以外の部分が反転表示されても、各文字グループ間で反転表示部分に凹凸が生じることはなく、ユーザーにとって見やすい状態となる。
もちろん、各行における文字画像とテキストデータの文字とのx方向の位置ずれは、各文字グループにおける先頭の文字のx方向の座標位置を基準として、各文字グループのテキストデータが埋め込まれることにより、抑制することができる。
前項(2)に記載の発明によれば、文字列方向と直交する方向をy方向とし、文字グループに含まれる文字の最大高さで文字グループの高さを規定したとき、各行において、最大高さを有する文字グループのy方向の座標位置、最小高さを有する文字グループのy方向の座標位置、各文字グループのy方向の座標位置の平均値、行の先頭の文字グループのy方向の座標位置のいずれかを基準として、各文字グループ共通のy方向の座標位置が決定されるから、y方向においても文字画像との位置ずれを少なくすることができるとともに、y方向の埋め込み位置の相違に起因する反転表示時の凹凸を防止でき、より見栄えの良い反転表示状態を実現できる。
前項(3)に記載の発明によれば、フォントサイズは、各行において、その行に含まれる文字の最大高さ、最小高さ及び平均高さのうちのいずれかに対応するサイズに決定されるから、容易にフォントサイズを決定することができる。
前項(4)に記載の発明によれば、各行において、一定以上大きいまたは小さい特殊サイズ文字が含まれている場合、前記特殊サイズ文字は1文字の文字グループとして区切られ、特殊サイズ文字を除外して行単位のフォントサイズが決定されるとともに、特殊サイズ文字についてはその文字高さに対応するフォントサイズがその特殊サイズ文字のフォントサイズとして決定されるから、特殊サイズ文字がその行のフォントサイズの決定に与える影響を軽減でき、行全体で文字が巨大化するといった不都合を防止できる。
前項(5)に記載の発明によれば、各行において、一定以上大きいまたは小さい特殊サイズ文字が含まれている場合、各文字グループ毎にフォントサイズが決定されるから、例えば特殊サイズ文字が複数存在するような場合に、これらの特殊サイズ文字に影響を受けてフォントサイズが巨大化することによる大きな検索位置のずれ等の発生を防止できる。
前項(6)に記載の発明によれば、カンマ、ドット、スペースの少なくともいずれかに基づいて、各行の文字列が複数の文字グループに区切られるから、例えば英語系の言語文字に対して有効な区切りを行うことができる。
前項(7)に記載の発明によれば、N(Nは1以上の整数)文字毎に、各行の文字列が複数の文字グループに区切られるから、カンマ、ドット、スペースの使用頻度の少ない日本語等の言語文字に対して有効な区切りを行うことができる。
前項(8)に記載の発明によれば、前記Nの値を、ファイルサイズを優先する場合の大きな値と、テキストデータの埋め込み位置の精度を優先する場合の小さい値との間で切り替えることができる。
前項(9)に記載の発明によれば、前記Nの値を、前記読み取り手段の画像読み取りに対する指定解像度が高解像度である場合の小さな値と、低解像度である場合の大きな値との間で切り替えることができる。
前項(10)に記載の発明によれば、画像ファイルに埋め込まれた文字列の検索が行われた場合に、抽出された文字列において文字部分と文字以外の部分が反転表示されても、各文字グループ間で反転表示部分に凹凸が生じることはなく、ユーザーにとって見やすい状態を実現できる。
前項(11)に記載の発明によれば、画像ファイルに埋め込まれた文字列の検索が行われた場合に、抽出された文字列において文字部分と文字以外の部分が反転表示されても、各文字グループ間で反転表示部分に凹凸が生じることはなく、ユーザーにとって見やすい状態を実現できる処理を、画像形成装置のコンピュータに実行させることができる。
この発明の一実施形態に係る画像形成装置の基本構成を示すブロック図である。 従来の埋め込み処理と本発明の実施形態に係る埋め込み処理の相違を説明するための図である。 認識処理により認識されたテキストデータの文字列を複数の文字グループに区切った状態を示す図である。 本発明の実施形態に係る処理方法で処理した文字グループの文字領域を示す図である。 従来の処理結果と本発明の実施形態に係る処理結果を示す表である。 この発明の他の実施形態を説明するための図である。 この発明のさらに他の実施形態を説明するための図である。 図1の画像形成装置の動作を示すフローチャートである。
以下、この発明の実施形態を図面に基づいて説明する。
図1は、この発明の一実施形態に係る画像形成装置1の基本構成を示すブロック図である。この実施形態では、画像形成装置として、コピー機能、プリンタ機能、スキャン機能等を備えた前述のMFPが用いられている。
画像形成装置1は、CPU11と、ROM12と、RAM13と、スキャナ部14と、記憶部15と、プリンタ部16と、操作パネル17と、ネットワークコントローラ(N1C)18と、文字認識処理部19等を備えている。
前記CPU11は、画像形成装置1の全体を統括制御し、コピー機能、プリンタ機能、スキャン機能、ファクシミリ機能等の基本機能を使用可能に制御する。また、スキャナ部14で読み取った原稿の画像に文字認識処理部19による文字認識処理を施して文字画像をテキストデータ化し、このテキストデータを読み取った画像のファイルに埋め込み、PDF等のファイルに変換してユーザーの端末装置等に送信したり、記憶部15に保存する等の処理を行うが、詳細は後述する。
前記ROM12は、CPU11の動作プログラム等を格納するメモリである。
前記RAM13は、CPU11が動作プログラムに基づいて動作する際の作業領域を提供するメモリである。
前記スキャナ部14は、原稿台(図示せず)に置かれた原稿の画像を読み取り、画像データに変換する読み取り手段である。
前記記憶部15は、例えばハードディスクドライブ(HDD)などの不揮発性の記憶デバイスにより構成されており、スキャナ部24で読み取られた原稿の画像データや、他の画像形成装置あるいはユーザー端末等から送信されてきたデータ、各種のアプリケーション等が記憶されている。
前記プリンタ部16は、前記スキャナ部14で読み取られた原稿の画像データやユーザ端末からのプリントデータ等を、指示されたモードに従って印刷するものである。
前記操作パネル17は、各種入力操作等のために使用されるものであり、メッセージや操作画面等を表示するタッチパネル式液晶等からなる表示部と、テンキー、スタートキー、ストップキー等を備えたキー入力部を備えている。
前記ネットワークコントローラ18は、ネットワーク上の他の画像形成装置や、その他の外部機器例えばユーザー端末等との間での通信を制御することにより、データの送受信を行うものである。
前記文字認識処理部19は、スキャナ部14で読み取られた原稿の画像に対して文字認識処理を行い、文字画像をテキストデータに変換する処理を行う。この文字認識処理部19は、CPU11の機能の一部として構成される。
次に、画像形成装置1で実行される、この発明の一実施形態に係るテキストデータの埋め込み方法について説明する。
まず、文字を含む原稿をスキャナ部14で読み取るとともに、読み取った原稿の画像データを文字認識処理部19で文字認識処理し、文字画像をテキストデータに変換する。
次いで、CPU11は各行に含まれるテキストデータからなる文字列を、行毎に、予め設定された規則に従って複数の文字グループに区切る。この例では、文字が「well over a million」という英語系文字であり、スペースを区切りとして文字列を複数の文字グループに区切る場合について説明する。なお、英語系文字をスペースで区切るのではなく、カンマやドットに基づいて区切る構成であっても良く、スペース、カンマ、ドットの少なくともいずれかを用いて区切られるのが望ましい。
文字認識処理部19からは文字認識処理の結果として、図3の破線に示すように1文字単位の外接矩形101を正確に切り出した座標位置と、それぞれのテキストコードが出力される。このようなテキストコードからスペースを検出し、スペースが発見さたところまでを1つの文字グループとして扱うことで、「well」「over」「a」「million」というワード単位の複数(この例では4個)の文字グループ201〜204が生成される。カンマやドットに基づいて区切る場合も同様である。
文字認識処理ではフォントサイズまでは情報として出力されないため、従来では、各文字グループ201〜204において、切り出された外接矩形221〜224の高さ、換言すれば各文字グループ201〜204の中の文字の最大高さに対応するフォントサイズを、各文字グループ201〜204のフォントサイズとして決定していた。なお、前記外接矩形221〜224は各文字グループ201〜204にそれぞれ含まれる文字の外接矩形101に外接するものであって各文字グループ201〜204の文字領域の範囲であり、文字列の検索抽出時にはこの文字領域が反転表示されるものである。
そして、図5(A)に示すように文字列方向(文字の幅方向)をx方向としたときに、前記区切られた複数の文字グループ201〜204のそれぞれにおいて、文字認識処理により認識された先頭の文字のx方向の基準座標位置を基準として、x方向の埋め込み位置を決定し、この決定された位置において、各文字グループのテキストデータを各文字グループ毎に決定されたフォントサイズにて画像ファイルに埋め込んでいた。
一例を挙げると、図3に示すように、各文字グループ201〜204における先頭の文字「w」「o」「a」「m」の外接矩形101の左上角部を各先頭文字の基準座標位置101a〜104aとし、各文字グループ201〜204の外接矩形221〜224の矩形切り出しの開始位置となる左上角部を各文字グループ201〜204の第1の基準座標位置221a〜224aとすると、各文字グループ201〜204の第1の基準座標位置221a〜224aのx座標が、各先頭文字の基準座標位置101a〜104aのx座標にそれぞれ一致するように、テキストデータを埋め込んでいた。
また、図5(A)に示すように文字列方向と垂直な方向(文字の高さ方向)をy方向としたとき、埋め込みを行うy方向の位置も各文字グループ毎に決定されていた。
しかし、各文字グループ201〜204単位でフォントサイズを決定すると、各文字グループ201〜204でフォントサイズが異なってしまい、外接矩形221〜224の高さがばらつくため、ファイルの文字検索が行われ反転表示されたときに、図2(C)に示すように、各文字グループ間で高さに凹凸が発生して見づらくなる。また、y方向の埋め込み位置についても各文字グループ毎に決定されていたため、各文字グループ間でy方向の位置ずれも発生する恐れがあり、文字検索による反転表示時の凹凸の発生がさらに助長される恐れがあった。
そこで、この実施形態では、フォントサイズの決定については1行全体の文宇列を1つの文字グループとして捉え、1行全体で共通のフォントサイズを決定する。
フォントサイズの決定方法として、この実施形態では、1行全体の文字の中の最大高さに対応するフォントサイズを共通のフォントサイズとしているが、最小高さを採用しても良いし、各文字の平均高さを採用しても良い。このような方法でフォントサイズを決定することにより、フォントサイズの決定が容易となるが、フォントサイズの決定方法はこれらに限定されることはない。
このように、フォントサイズについては1行単位で統一されたフォントサイズを採用するため、図4に示すように、埋め込まれる各文字グループ201〜204の矩形の文字領域231〜234の高さは同じになる。その結果、図2(D)に示すように、文字検索時に該当する文字列が文字領域231〜234において白黒反転表示されても、フォントサイズの相違に起因する高さ方向の凹凸は解消され、見やすくなる。
また、決定されたフォントサイズによるテキストデータの埋め込み位置は、x方向については、図4に示すように、各文字グループ201〜204の矩形の文字領域231〜234の左上角部を、各文字グループ201〜204の第2の基準座標位置231a〜234aとすると、これら第2の基準座標位置231a〜234aのx座標が、各文字グループ201〜204における先頭の文字「w」「o」「a」「m」の基準座標位置101a〜104a(図3に示す)のx座標にそれぞれ一致するように、決定する。
このような処理により、x方向において文字画像と埋め込まれるテキストデータとの位置ずれを防止しつつ、文字検索による反転表示時の各文字グループ間での凹凸をなくすことができる。
また、y方向についてのテキストデータの埋め込み位置は、文字画像と重複する位置であれば良いが、この実施形態では次のようにして決定している。即ち、各文字グループ201〜204に含まれる文字の最大高さで文字グループ201〜204の高さを規定したとき、最大高さを有する文字グループのy方向の基準座標位置を、各文字グループ共通のy方向の基準座標位置として決定している。
具体的には、文字グループ201〜204における文字の最大高さが反映された図3に示す外接矩形221〜224のうち、最大高さを有する外接矩形例えば外接矩形224の第1の基準座標位置224aのy座標を、各文字グループ201〜204の共通のy座標として決定し、埋め込まれる各文字グループ201〜204の第2の基準座標位置231a〜234aのy座標が、前記共通のy座標に一致するように埋め込む。
このような処理により、y方向においても文字画像と埋め込まれるテキストデータとの位置ずれを可及的に防止できる。しかも各文字グループ201〜204のy方向の位置が行単位で統一されるから、文字検索による反転表示時に、各文字グループ間でy方向の位置が異なることによる凹凸をも解消することができ、より一層見やすい状態となる。
なお、この実施形態では、各文字グループ共通のy方向の座標位置を、最大高さを有する文字グループ204のy方向の座標位置を基に決定したが、各文字グループ共通のy座標として、最小高さの文字グループ203の第1の基準座標位置223aのy座標を採用しても良いし、各文字グループ201〜204の第1の基準座標位置221a〜223aのy座標の平均値を採用しても良いし、行の先頭の文字グループ201の第1の基準座標位置221aのy座標を採用しても良い。
以上の処理は各行について行われる。上記処理により決定された各文字グループのフォントサイズと基準座標位置の一例を図5(B)に示す。
図5(B)の表から理解されるように、従来処理ではフォントサイズ(文字サイズ)及びy方向の位置が、各文字グループ毎の算出結果により設定されているが、本実施形態では、フォントサイズ及びy方向の位置が行単位で統一されることになる。
ところで、文字認識処理結果により得られた1行の文字列の中で、いくつかの文字のフォントサイズが特に大きい場合がある。例えば、図6(A)に示す「Well」のように、先頭の文字「W」を大きくした書き出しは、英語の雑誌などでよく利用される。この場合、一行中の文字の最大高さを基にフォントサイズを決定すると、他の文字のサイズも徒に大きくなり、文字画像と大きく位置ずれを起こす恐れがある。逆に、いくつかの文字のフォントサイズが特に小さい場合は、一行中の最小高さを基にフォントサイズを決定すると、他の文字のサイズも徒に小さくなり、文字画像と大きく位置ずれを起こす恐れがある。
そこで、この実施形態では、一行中に、各文字に対してある一定以上大きなもしくは小さな特殊サイズ文字が存在した場合、特殊サイズ文字を1文字の文字グループとして区切るとともに、特殊サイズ文字を除外して行単位のフォントサイズを決定するものとする。また、前記特殊サイズ文字についてはその高さを基にフォントサイズを決定する。
例えば、図6(A)の文字列において「W」が特殊サイズ文字であるとすると、図6(B)に示すように、「W」を1つの文字グループ301とし、「W」を除外して「ell」「over」「a」「million」という4個の文字グループ302〜305に区切る。
そして、特殊サイズ文字「W」を除外し、「ell」「over」「a」「million」について行単位のフォントサイズを決定し、さらに各文字グループ301〜305を埋め込む座標位置を決定する。フォントサイズ及び座標位置の決定方法については、図2〜図4で説明した特殊サイズ文字を含まない場合のフォントサイズ及び座標位置の決定方法と同様にして行えばよい。
特殊サイズ文字である「W」については、その文字の高さを基にフォントサイズを決定すればよい。
このような処理を行ったテキストデータを図6(B)に示す。この例では、特殊サイズ文字「W」の文字グループ301を除いて、各文字グループ302〜305のフォントサイズが統一されているから、各文字グループ302〜305の文字領域312〜315に高さ方向の凹凸がなく、従って文字検索による反転表示時にも凹凸がなく見栄えの良いものとなる。
また、特殊サイズ文字が発生しうる場所は先頭とは限らないし、1文宇だけとも限らない。特に複数発生した場合は、どの文字が同じ文字グループに属するか等を判断することは容易でなく、制御が複雑になる。
そこで、特殊サイズ文字を含む場合の他の処理例として、「W」を1つの文字グループ301とし、「W」を除外して「ell」「over」「a」「million」という4個の文字グループ302〜305に区切ったのち、各文字グループ301〜305毎にフォントサイズと座標位置を決定する処理を行っても良い。この場合は、図6(C)に示すように、各文字グループ301〜305の文字表示領域321〜325に高さ方向の凹凸が発生するが、文字が巨大化、または極小化することによる大きな検索位置のずれは防止される。
なお、「W」を除外することなく「Well」を1つの文字グループとし、各文字グループ毎にフォントサイズと座標位置を決定する構成であっても良い。
こうして、テキストデータが埋め込まれたファイルは、PDFやその他のファイル形式に変換されて例えばユーザー端末に送信され、あるいは記憶部15に記憶される。埋め込まれたテキストデータによりユーザーは画像ファイルに対する文字検索が可能となる。
以上の実施形態では、文字が英語系文字であり、スペース、カンマ、ドット等に基づいて複数の文字グループに区切る場合を説明した。
しかし、日本語などではスペース、カンマ、ドット等の使用頻度は少ないため、スペース、カンマ、ドット等に基づいて文字列を区切ることは実用的でない。
そこで、日本語等の場合には、文字列をN個の文字毎に区切って複数個の文字グループを形成しても良い。Nの値は1以上の整数であればよい。
N文字毎に文字列を区切る場合の一例を図7に示す。図7の例はN=3の場合を示しており、「新しい価値の創造」という文字列が「新しい」「価値の」「創造」という3個の文字グループ401〜403に区切られている。
そして、3個の文字グループ401〜403に共通するフォントサイズを決定する。この実施形態では、文字認識処理の結果から得られた、1行全体の文字の中の最大高さに対応するフォントサイズを共通のフォントサイズとしている。なお、最小高さを採用しても良いし、各文字の平均高さを採用しても良い。
このように、1行単位で統一されたフォントサイズを採用するため、埋め込まれる各文字グループ401〜403の矩形の文字領域411〜413の高さは同じになる。その結果、文字検索時に該当する文字列が文字領域411〜413において白黒反転表示されても、フォントサイズの相違に起因する高さ方向の凹凸は解消され、見やすくなる。
また、3個の文字グループ401〜403のx方向の埋め込み位置は、各文字グループ401〜403の矩形の文字領域411〜413の左上角部を、各文字グループ401〜403の第3の基準座標位置411a〜413aとすると、これら第3の基準座標位置411a〜413aのx座標が、各文字グループ401〜403における先頭の文字「新」「価」「創」の基準座標位置111a〜113aのx座標にそれぞれ一致するように、決定する。
このような処理により、x方向において文字画像と埋め込まれるテキストデータとの位置ずれを防止しつつ、文字検索による反転表示時の凹凸をなくすことができる。
また、3個の文字グループ401〜403のy方向の埋め込み位置については、文字グループに含まれる文字の最大高さで文字グループの高さを規定したとき、各文字グループ401〜403のうち最大高さを有する文字グループのy方向の基準座標位置を、各文字グループ401〜403におけるy方向の共通の基準座標位置としている。つまり、各文字グループ401〜403における第3の基準座標位置411a〜413aのy座標が、共通の基準座標位置のy座標に一致するように、埋め込みを行う。
このような処理により、y方向において文字画像と埋め込まれるテキストデータとの位置ずれを防止でき、しかも各文字グループ401〜403のy方向の位置が行単位で統一されるから、文字検索による反転表示時に、各文字グループのy方向の位置がばらつくことによる凹凸をも解消することができ、より一層見やすい状態となる。
なお、各文字グループ共通のy方向の座標位置を、最大高さを有する文字グループのy方向の座標位置を基に決定したが、最小高さの文字グループの座標位置や、各文字グループ301〜303の平均座標位置や、行の先頭の文字グループ301の座標位置を基に決定しても良い。
前述したようにNの値は1以上の整数であればよいが、Nの値を小さくして文字の区切りの単位を小さくすると、テキストデータの埋め込み時に記述するデータ量が増えるため、結果的にファイルサイズが増加してしまう。逆にNの値が大きくなると1つの文字グループが長くなることから座標の位置ずれが発生しやすくなる。ファイルサイズを優先する場合はNを大きい値とし、埋め込む文字の位置精度を優先する場合はNを小さい値としても良い。Nを何れの値に設定するかは、ファイルサイズ優先/位置精度優先の切替スイッチを設けてユーザに選択させても良いし、ユーザーにより一般的なPDFファイルの作成が指定された時には位置精度優先と判断してNを小さい値に設定し、コンパクトPDFファイルの作成が指定された場合はファイルサイズ優先と判断して、Nを大きい値に切り替えても良い。
また、スキャナ部14による原稿の読み取り時に指定された解像度が高解像度(例えば400dpiあるいは600dpi)の場合はNの値を小さい値に設定し、低解像度の場合は大きい値に切り替えても良い。
これらの切り替えによって、ユーザーのニーズに応じて最適な文字区切りが得られる。
図8は、画像形成装置1によって実行されるテキストテータ埋め込み処理を示すフローチャートである。この処理は、CPU11がROM12等の記録媒体に記録された動作プログラムに従って動作することにより実行される。
ステップS01では、文字認識処理部19による文字認識処理結果に基づき、各文字の文字コードと座標位置を受け取り、ステップS02で、英語系言語の文字かどうかを判断する。英語系言語の文字かどうかは、全角文字か半角文字かを調べ、半角文字であれば英語系言語の文字と判断すればよい。
英語系言語の文字であれば(ステップS02でYES)、ステップS03で、スペース、カンマ、ドットの少なくともいずれかの単位で文字列を区切ったのち、ステップS09に進む。英語系言語の文字でなければ(ステップS02でNO)、ステップS04で、ファイルサイズ優先の設定かどうかを調べ、ファイルサイズ優先の設定であれば(ステップS04でYES)、ステップS05で、コンパクトPDFが設定されているかどうかを調べる。
コンパクトPDFが設定されていれば(ステップS05でYES)、ステップS06で、低解像度の設定かどうかを判断し、低解像度の設定であれば(ステップS06でYES)、ステップS07で、Nを大きい値に設定してN文字単位で文字を区切ったのち、ステップS09に進む。
ステップS04でファイルサイズ優先の設定でない場合(ステップS04でNO)、ステップS05でコンパクトPDFが設定されていない場合(ステップS05でNO)、ステップS06で低解像度の設定でない場合(ステップS06でNO)は、何れもステップS08に進み、Nを小さい値に設定してN文字単位で文字を区切ったのち、ステップS09に進む。
ステップS09では、全ての文字列グループについて、各文字グループ毎に、1つ前の文字グループのフォントサイズ(最大フォントサイズ)に対してフォントサイズ(最大フォントサイズ)がA倍以下かどうかを判断する。つまり、サイズの極めて大きな特殊サイズ文字が含まれているかどうかを判断する。なお、サイズの極めて小さな特殊サイズ文字が含まれているかどうかをも判断しても良い。また、その行の先頭の文字グループについてはその行の最後の文字グループと比較すればよい。また、各文字毎に1つ前の文字とのサイズを比較しても良い。
全ての文字グループにおいてフォントサイズがA倍以下であれば(ステップS10でYES)、特殊サイズ文字は含まれていないから、ステップS10で、1行単位で決定したフォントサイズを各文字グループの共通のフォントサイズとし、各文字グループのx方向の座標位置と、各グループ共通のy方向の座標位置を決定する。そして、決定に従いテキストデータを画像ファイルに埋め込む。
フォントサイズがA倍以下でなければ(ステップS10でNO)、特殊サイズ文字が含まれているから、ステップS11で、各文字グループ単位でフォントサイズ及び座標位置を決定し、決定に従いテキストデータを画像ファイルに埋め込む。なお、フォントサイズがA倍以下でない場合、この特殊サイズ文字を除外して、各文字グループ共通のフォントサイズを決定しても良い。
1 画像形成装置
11 CPU
12 ROM
14 スキャナ部
15 記憶部
17 操作パネル
18 ネットワークコントローラ
19 文字認識部
100 文字画像
101 各文字の外接矩形
101a〜104a 基準座標位置
200 埋め込み文字
201〜204 文字グループ
221〜224 文字グループの外接矩形
221a〜224a 第1の基準座標位置
231〜234 文字領域
213a〜234a 第2の基準座標位置
411〜413 文字領域
411a〜413a 第3の基準座標位置

Claims (11)

  1. 画像を読み取る読み取り手段と、
    前記読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識手段と、
    前記文字認識処理により認識された各行に含まれる文字列を、行毎に、予め設定された規則に従って複数の文字グループに区切る文字列区切り手段と、
    前記各行の行単位で一定のフォントサイズを決定するフォントサイズ決定手段と、
    文字列方向をx方向としたときに、前記文字列区切り手段により区切られた前記複数の文字グループのそれぞれにおいて、前記文字認識処理により認識された先頭の文字の前記x方向の座標位置を基準としてx方向の埋め込み位置を決定する埋め込み位置決定手段と、
    前記埋め込み位置決定手段により決定されたx方向の埋め込み位置において、前記フォントサイズ決定手段により決定されたフォントサイズにて、各文字グループのテキストデータを画像ファイルに埋め込む埋め込み手段と、
    を備えたことを特徴とする画像形成装置。
  2. 文字列方向と直交する方向をy方向とし、前記文字グループに含まれる文字の最大高さで文字グループの高さを規定したとき、前記埋め込み位置決定手段は、各行において、最大高さを有する文字グループのy方向の座標位置、最小高さを有する文字グループのy方向の座標位置、各文字グループのy方向の座標位置の平均値、行の先頭の文字グループのy方向の座標位置のいずれかを基準として、各文字グループ共通のy方向の座標位置を決定する請求項1に記載の画像形成装置。
  3. 前記フォントサイズは、各行において、その行に含まれる文字の最大高さ、最小高さ及び平均高さのうちのいずれかに対応するサイズである請求項1または2に記載の画像形成装置。
  4. 各行において、一定以上大きいまたは小さい特殊サイズ文字が含まれている場合、前記文字列区切り手段は、前記特殊サイズ文字を1文字の文字グループとして区切り、前記フォントサイズ決定手段は、前記特殊サイズ文字を除外して行単位のフォントサイズを決定するとともに、前記特殊サイズ文字についてはその高さサイズに相当するフォントサイズを前記特殊サイズ文字のフォントサイズとして決定する請求項1〜3のいずれかに記載の画像形成装置。
  5. 各行において、一定以上大きいまたは小さい特殊サイズ文字が含まれている場合、前記フォントサイズ決定手段は、各文字グループ毎にフォントサイズを決定する請求項1〜3のいずれかに記載の画像形成装置。
  6. 前記文字列区切り手段は、カンマ、ドット、スペースの少なくともいずれかに基づいて、各行の文字列を複数の文字グループに区切る請求項1〜5のいずれかに記載の画像形成装置。
  7. 前記文字列区切り手段は、N(Nは1以上の整数)文字毎に、各行の文字列を複数の文字グループに区切る請求項1〜5のいずれかに記載の画像形成装置。
  8. 前記Nの値を、ファイルサイズを優先する場合の大きな値と、テキストデータの埋め込み位置の精度を優先する場合の小さい値との間で切り替える切替手段を備えている請求項7に記載の画像形成装置。
  9. 前記Nの値を、前記読み取り手段の画像読み取りに対する指定解像度が高解像度である場合の小さな値と、低解像度である場合の大きな値との間で切り替える切替手段を備えている請求項7に記載の画像形成装置。
  10. 画像形成装置で実行されるテキストデータの埋め込み方法であって、
    画像を読み取る読み取りステップと、
    前記画像読み取りステップにより読み取られた画像に対して文字認識処理を行う文字認識ステップと、
    前記文字認識処理により認識された各行に含まれる文字列を、行毎に、予め設定された規則に従って複数の文字グループに区切る文字列区切りステップと、
    前記各行の行単位で一定のフォントサイズを決定するフォントサイズ決定ステップと、
    文字列方向をx方向としたときに、前記文字列区切りステップにより区切られた前記複数の文字グループのそれぞれにおいて、前記文字認識処理により認識された先頭の文字の前記x方向の座標位置を基準としてx方向の埋め込み位置を決定する埋め込み位置決定ステップと、
    前記埋め込み位置決定ステップにより決定されたx方向の埋め込み位置において、前記フォントサイズ決定ステップにより決定されたフォントサイズにて、各文字グループのテキストデータを画像ファイルに埋め込む埋め込みステップと、
    を備えたことを特徴とするテキストデータの埋め込み方法。
  11. 画像を読み取る読み取りステップと、
    前記画像読み取りステップにより読み取られた画像に対して文字認識処理を行う文字認識ステップと、
    前記文字認識処理により認識された各行に含まれる文字列を、行毎に、予め設定された規則に従って複数の文字グループに区切る文字列区切りステップと、
    前記各行の行単位で一定のフォントサイズを決定するフォントサイズ決定ステップと、
    文字列方向をx方向としたときに、前記文字列区切りステップにより区切られた前記複数の文字グループのそれぞれにおいて、前記文字認識処理により認識された先頭の文字の前記x方向の座標位置を基準としてx方向の埋め込み位置を決定する埋め込み位置決定ステップと、
    前記埋め込み位置決定ステップにより決定されたx方向の埋め込み位置において、前記フォントサイズ決定ステップにより決定されたフォントサイズにて、各文字グループのテキストデータを画像ファイルに埋め込む埋め込みステップと、
    を画像形成装置のコンピュータに実行させるためのテキストデータの埋め込みプログラム。
JP2013244436A 2013-11-26 2013-11-26 画像形成装置、テキストデータの埋め込み方法及び埋め込みプログラム Active JP5915628B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013244436A JP5915628B2 (ja) 2013-11-26 2013-11-26 画像形成装置、テキストデータの埋め込み方法及び埋め込みプログラム
US14/546,776 US9442899B2 (en) 2013-11-26 2014-11-18 Image forming apparatus, text data embedding method, and recording medium
CN201410683389.4A CN104683629B (zh) 2013-11-26 2014-11-25 图像形成装置以及文本数据的嵌入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013244436A JP5915628B2 (ja) 2013-11-26 2013-11-26 画像形成装置、テキストデータの埋め込み方法及び埋め込みプログラム

Publications (2)

Publication Number Publication Date
JP2015103113A JP2015103113A (ja) 2015-06-04
JP5915628B2 true JP5915628B2 (ja) 2016-05-11

Family

ID=53182429

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013244436A Active JP5915628B2 (ja) 2013-11-26 2013-11-26 画像形成装置、テキストデータの埋め込み方法及び埋め込みプログラム

Country Status (3)

Country Link
US (1) US9442899B2 (ja)
JP (1) JP5915628B2 (ja)
CN (1) CN104683629B (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106155508B (zh) * 2015-04-01 2021-01-01 腾讯科技(上海)有限公司 一种信息处理方法及客户端
CN106709489B (zh) * 2015-07-13 2020-03-03 腾讯科技(深圳)有限公司 一种字符识别的处理方法和装置
US9768218B2 (en) 2015-08-26 2017-09-19 Taiwan Semiconductor Manufacturing Co., Ltd. Self-aligned back side deep trench isolation structure
CN106909296A (zh) * 2016-06-07 2017-06-30 阿里巴巴集团控股有限公司 数据的提取方法、装置及终端设备
JP6963728B2 (ja) * 2018-02-26 2021-11-10 京セラドキュメントソリューションズ株式会社 画像処理装置
TWI698740B (zh) * 2018-08-27 2020-07-11 宏碁股份有限公司 還原映像檔的部署方法與使用此方法的電子裝置
CN110443202B (zh) * 2019-08-06 2022-11-01 超级知识产权顾问(北京)有限公司 论文字体工整度即时分析系统、方法及存储介质
CN111523286B (zh) * 2020-04-16 2023-07-07 维沃移动通信有限公司 图片显示方法、装置、电子设备及计算机可读存储介质
CN112241739A (zh) * 2020-12-17 2021-01-19 北京沃东天骏信息技术有限公司 识别文本错误的方法、装置、设备和计算机可读介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
JPH10177641A (ja) * 1996-12-18 1998-06-30 Fuji Xerox Co Ltd 文書ファイリング装置
JP2008059527A (ja) * 2006-09-04 2008-03-13 Ricoh Co Ltd 画像処理装置およびプログラム
JP4590433B2 (ja) * 2007-06-29 2010-12-01 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
CN101354703B (zh) * 2007-07-23 2010-11-17 夏普株式会社 文档图像处理装置和文档图像处理方法
JP2009042968A (ja) * 2007-08-08 2009-02-26 Nec Corp 情報選別システム、情報選別方法及び情報選別用プログラム
JP4772888B2 (ja) * 2009-03-27 2011-09-14 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP5197694B2 (ja) 2010-08-31 2013-05-15 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US8768061B2 (en) * 2012-05-02 2014-07-01 Xerox Corporation Post optical character recognition determination of font size

Also Published As

Publication number Publication date
CN104683629A (zh) 2015-06-03
JP2015103113A (ja) 2015-06-04
CN104683629B (zh) 2018-11-23
US20150146220A1 (en) 2015-05-28
US9442899B2 (en) 2016-09-13

Similar Documents

Publication Publication Date Title
JP5915628B2 (ja) 画像形成装置、テキストデータの埋め込み方法及び埋め込みプログラム
US10929657B2 (en) Apparatus, method, and storage medium for setting information related to scanned image
JP4181892B2 (ja) 画像処理方法
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US10528679B2 (en) System and method for real time translation
JP5672953B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US8538154B2 (en) Image processing method and image processing apparatus for extracting heading region from image of document
US9659018B2 (en) File name producing apparatus that produces file name of image
JP5412903B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
US8780404B2 (en) Information processing apparatus, method for controlling same, and storage medium on which computer program has been recorded
US20090150359A1 (en) Document processing apparatus and search method
US7738737B2 (en) Image processing apparatus and image processing method
JP5412916B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
JP6201686B2 (ja) テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2010105191A (ja) 画像処理装置
JP2005149218A (ja) 印刷データ作成装置、プログラム及び記録媒体
US20230325126A1 (en) Information processing apparatus and method and non-transitory computer readable medium
JP2020099031A (ja) 情報処理装置、及び情報処理方法
JP2008181383A (ja) 文字認識装置、文字認識装置の制御方法、および文字認識装置の制御プログラム
US11645025B2 (en) Image processing apparatus, that displays content in an alternative item when a highest priority item has no content, display control method, and computer-readable storage medium for storing program
US20220377186A1 (en) Image processing device, control method, and non-transitory computer readable medium
JP2019097049A (ja) 情報処理装置及び情報処理プログラム
JP2007174079A (ja) 履歴出力装置、履歴出力方法およびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160321

R150 Certificate of patent or registration of utility model

Ref document number: 5915628

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150