JP2014056321A - Image processor and image forming apparatus - Google Patents

Image processor and image forming apparatus Download PDF

Info

Publication number
JP2014056321A
JP2014056321A JP2012199550A JP2012199550A JP2014056321A JP 2014056321 A JP2014056321 A JP 2014056321A JP 2012199550 A JP2012199550 A JP 2012199550A JP 2012199550 A JP2012199550 A JP 2012199550A JP 2014056321 A JP2014056321 A JP 2014056321A
Authority
JP
Japan
Prior art keywords
character
value
amount
correction
thinning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012199550A
Other languages
Japanese (ja)
Other versions
JP5904066B2 (en
Inventor
Takahiro Tsutsumi
隆弘 堤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2012199550A priority Critical patent/JP5904066B2/en
Publication of JP2014056321A publication Critical patent/JP2014056321A/en
Application granted granted Critical
Publication of JP5904066B2 publication Critical patent/JP5904066B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To reduce the difference in thickness between characters without losing a shape representing a character possessed by the character.SOLUTION: An image processor determines a character thickness value for each of a plurality of character groups within an image, and sets a value between the maximum value and the minimum value of the character thickness values as an object value for both of a thinning correction and a thickening correction. The image processor performs the thinning correction with respect to a thick character group whose character thickness value is larger than the object value in such a manner that a thinning amount is not beyond both of the difference between the character thickness value of the thick character group and the object value, and a thinning limitation amount which is the maximum thinning amount within a range in which the character does not lose a shape representing the character, and performs the thickening correction with respect to a thin character group whose character thickness value is smaller than the object value in such a manner that a thickening amount is not beyond both of the difference between the character thickness value of the thin character group and the object value, and a thickening limitation amount which is the maximum thickening amount within a range in which the character does not lose a shape representing the character.

Description

本発明は、画像内の文字を表す部分に対する画像処理に関する。   The present invention relates to image processing for a part representing a character in an image.

ラスター画像内の文字のサイズおよび太さを変える画像処理が特許文献1によって開示されている。同文献における画像処理の対象であるラスター画像は、用紙の記入枠内に手書きされた文字列(記入者の名前)をスキャナーによって読み取り、用紙4枚分の読取り画像を1つにまとめた編集画像である。この編集画像では、文字列ごとに記入者が異なりまた記入に使用する筆記具の種類に限定がないことから、必然的に四つの文字列の文字サイズおよび文字太さが不均一である。同文献には、複数の文字列における整然性に鑑み、文字サイズを記入枠に収まる所定サイズに揃えるとともに、過度に細い文字についてその線幅を許容範囲内になるように段階的に大きくする線幅調整を実施することが記載されている。線幅調整において文字の潰れが生じた場合、潰れが生じる直前の線幅が調整後の線幅とされる。   Patent Document 1 discloses image processing for changing the size and thickness of characters in a raster image. The raster image, which is the object of image processing in this document, is an edited image in which a character string (name of the writer) handwritten in a paper entry frame is read by a scanner, and the read images for four sheets of paper are combined into one. It is. In this edited image, the character is different for each character string and there is no limitation on the type of writing instrument used for the entry. Therefore, the character size and the character thickness of the four character strings are inevitably nonuniform. In view of the orderliness of a plurality of character strings, this document describes a line in which the character size is aligned to a predetermined size that can be accommodated in an entry frame, and the line width of an excessively thin character is gradually increased so as to be within an allowable range. It is described that the width adjustment is performed. When the character is crushed in the line width adjustment, the line width immediately before the crushed is taken as the adjusted line width.

特開2006−157761号公報JP 2006-157771 A

上述の先行技術における細い文字を太くする線幅調整は、太い文字とは無関係に行なわれ、線幅が許容範囲内の値になった時点で終了する。この線幅調整によって、太い文字と細い文字との間の文字太さの差異はある程度低減される。   The line width adjustment for thickening thin characters in the prior art described above is performed regardless of the thick characters, and ends when the line width reaches a value within the allowable range. By this line width adjustment, the difference in character thickness between a thick character and a thin character is reduced to some extent.

しかし、許容範囲の下限よりも大幅に大きい線幅をもつ太い文字が処理対象の画像内に存在する場合、線幅調整を終えた状態の画像において文字太さの不均一が目立ってしまう。また、許容範囲外の細い文字が無い場合、文字太さが不均一であってもそれが是正されないままとなる。   However, when a thick character having a line width significantly larger than the lower limit of the allowable range exists in the image to be processed, the unevenness of the character thickness becomes conspicuous in the image after the line width adjustment is completed. If there is no thin character outside the allowable range, even if the character thickness is non-uniform, it remains uncorrected.

本発明は、このような事情に鑑み、同程度の太さの文字があつまるように太さの異なる複数の文字が配置された画像における、文字の太さの均一化に有用な装置を提供することを目的としている。   In view of such circumstances, the present invention provides an apparatus useful for uniformizing the thickness of characters in an image in which a plurality of characters having different thicknesses are arranged so that characters having the same thickness are collected. The purpose is that.

上記目的を達成する画像処理装置は、文字を対象とする画像処理を行なう画像処理装置であって、画像から当該画像内の配置によって区分される複数の文字グループを抽出する手段と、抽出された前記複数の文字グループのそれぞれについて、当該文字グループに属する文字の太さを代表する文字太さ値を定める手段と、前記複数の文字グループについて定められた文字太さ値のうちの最大値と最小値との間の値を、文字を細くする細らせ補正および文字を太らす太らせ補正の両方の目標値に設定する手段と、前記複数の文字グループのうちの前記文字太さ値が前記目標値よりも大きい文字グループである太文字グループについて、前記細らせ補正を行なうときの補正される文字が当該文字を表す形状を失わない範囲内での最大限の細らせ量である限界細らせ量を求める手段と、前記複数の文字グループのうちの前記文字太さ値が前記目標値よりも小さい文字グループである細文字グループについて、前記太らせ補正を行なうときの補正される文字が当該文字を表す形状を失わない範囲内での最大限の太らせ量である限界太らせ量を求める手段と、前記太文字グループに対して、細らせ量が当該太文字グループの文字太さ値と前記目標値との差分である目標細らせ量および前記限界細らせ量の両方を超えないように前記細らせ補正を行うとともに、前記細文字グループに対して、太らせ量が当該細文字グループの文字太さ値と前記目標値との差分である目標太らせ量および前記限界太らせ量の両方を超えないように前記太らせ補正を行なう手段と、を備える。   An image processing apparatus that achieves the above-described object is an image processing apparatus that performs image processing on characters, and that extracts a plurality of character groups that are segmented by arrangement in the image from the image, For each of the plurality of character groups, a means for determining a character thickness value representative of the thickness of the characters belonging to the character group, and a maximum value and a minimum value among the character thickness values determined for the plurality of character groups Means for setting a value between values as a target value for both thinning correction for thinning a character and thickening correction for thickening a character, and the character thickness value of the plurality of character groups For a bold character group that is a character group larger than the target value, the maximum amount of thinning within a range in which the character to be corrected when the thinning correction is performed does not lose the shape representing the character. Means for obtaining a certain amount of thinning, and correction when performing the thickening correction on a thin character group of which the character thickness value is smaller than the target value among the plurality of character groups; Means for obtaining a limit thickening amount that is a maximum thickening amount within a range in which the character representing the character does not lose its shape, and the thinning amount of the bold character group The thinning correction is performed so as not to exceed both the target thinning amount and the limit thinning amount, which are the differences between the character thickness value and the target value, and Means for performing the thickening correction so that the amount of weighting does not exceed both the target weighting amount and the limit weighting amount, which are the difference between the character thickness value of the fine character group and the target value.

本発明によれば、同程度の太さの文字があつまるように太さの異なる複数の文字が配置された画像において、文字がもつ当該文字を表す形状を消失させることなく、文字間の太さの差異を低減することができる。   According to the present invention, in an image in which a plurality of characters having different thicknesses are arranged so that characters of the same thickness are gathered, the thickness between the characters is lost without losing the shape representing the characters that the character has. Difference can be reduced.

本発明の実施形態に係る画像形成装置の構成を示すブロック図である。1 is a block diagram illustrating a configuration of an image forming apparatus according to an embodiment of the present invention. 画像処理の対象となる画像としての目次ページの作成要領の例を示す図である。It is a figure which shows the example of the preparation point of the table of contents page as an image used as the object of an image process. 文字サイズ調整による画像の変化を模式的に示す図である。It is a figure which shows typically the change of the image by character size adjustment. 文字太さ調整による画像の変化を模式的に示す図である。It is a figure which shows typically the change of the image by character thickness adjustment. 文字に対する過度の細らせ補正および過度の太らせ補正の不都合を示す図である。It is a figure which shows the disadvantage of the excessive thinning correction | amendment with respect to a character, and the excessive fattening correction | amendment. 複数の文字グループの文字太さ値とそれらに基づいて定められる複数の量との関係を示す図である。It is a figure which shows the relationship between the character thickness value of a some character group, and the some quantity defined based on them. 画像形成装置によるドキュメントのデータ化の手順を示すフローチャートである。4 is a flowchart illustrating a procedure for converting a document into data by the image forming apparatus. 文字太さ調整ルーチンのフローチャートである。It is a flowchart of a character thickness adjustment routine. 文字サイズ調整ルーチンのフローチャートである。It is a flowchart of a character size adjustment routine. 文字グループ間で文字色が異なる場合の目次ページの形成手順の一例を示す図である。It is a figure which shows an example of the formation procedure of a table of contents page in case a character color differs between character groups. 目次ページの色調整の他の例を示す図である。It is a figure which shows the other example of the color adjustment of a table of contents page.

ラスター画像内の文字の太さを均一化する画像処理が画像形成装置において行なわれる例を挙げる。ただし、画像データを扱う任意の機器において同様の画像処理を実現することができる。   An example will be given in which image processing for uniformizing the thickness of characters in a raster image is performed in an image forming apparatus. However, similar image processing can be realized in any device that handles image data.

図1に例示される画像形成装置1は、MFP(Multi-functional Peripheral)と呼ばれる複合型の情報機器である。画像形成装置1は、コピーおよびネットワークプリンティングといった画像形成装置としての機能の他に、紙ドキュメントをスキャニングによりデータ化して外部装置へ送信したり自装置内で記憶したりする機能を有している。   An image forming apparatus 1 illustrated in FIG. 1 is a composite information device called an MFP (Multi-functional Peripheral). In addition to functions as an image forming apparatus such as copying and network printing, the image forming apparatus 1 has a function of converting a paper document into data by scanning and transmitting it to an external apparatus or storing it in the apparatus itself.

画像形成装置1の操作パネル6において、紙ドキュメントのデータ化動作の開始を指示する操作がユーザーによって行なわれると、メインコントローラー3からの指示を受けてADF(Auto Document Feeder)4が紙ドキュメントのシートをイメージスキャナー5へ搬送する。イメージスキャナー5は、搬送されたシートから画像を読み取り、シートの片面分の画像を1ページとするシート枚数に応じたページ数の画像データを出力する。イメージスキャナー5によって得られた画像データを、データ処理回路10が例えばPDF(Portable Document Format)といった予め指定された形式のファイルに変換してメインコントローラー3に引き渡す。   When an operation for instructing the start of the data conversion operation for the paper document is performed by the user on the operation panel 6 of the image forming apparatus 1, the ADF (Auto Document Feeder) 4 receives the instruction from the main controller 3 and the sheet of the paper document is received. Is conveyed to the image scanner 5. The image scanner 5 reads an image from the conveyed sheet, and outputs image data of the number of pages corresponding to the number of sheets with one page of the image for one side of the sheet. The data processing circuit 10 converts the image data obtained by the image scanner 5 into a file of a predesignated format such as PDF (Portable Document Format), and delivers it to the main controller 3.

メインコントローラー3は、データ化されたドキュメントとしてのファイルをユーザーの指定した動作に応じた送り先へ転送する。外部のパーソナルコンピューターや他の装置へ送信する動作が指定されている場合、ファイルは外部とのネットワーク接続を担う通信インタフェース8に転送される。画像形成装置1の内部で記憶する動作が指定されている場合、ストレージ9としてのハードディスクドライブに設けられたボックスと呼ばれるメモリ領域にファイルが格納される。   The main controller 3 transfers the data file as a document to a destination corresponding to the operation designated by the user. When an operation to transmit to an external personal computer or another device is designated, the file is transferred to the communication interface 8 that is responsible for network connection with the outside. When an operation to be stored inside the image forming apparatus 1 is designated, a file is stored in a memory area called a box provided in a hard disk drive as the storage 9.

また、目次ページを付加するコピー動作が指定されている場合、後述するようにデータ処理回路10によって作成された目次ページがメインコントローラー3に引き渡される。この場合、メインコントローラー3は、イメージスキャナー5の出力する画像データとデータ処理回路10からの目次ページとを印刷に適した形式の画像データに変換してプリンターエンジン7に与える。プリンターエンジン7は与えられた画像データを印刷する。これにより、紙ドキュメントの複製物と目次の印刷物とが形成される。   When a copy operation for adding a table of contents page is designated, the table of contents page created by the data processing circuit 10 is delivered to the main controller 3 as will be described later. In this case, the main controller 3 converts the image data output from the image scanner 5 and the table of contents page from the data processing circuit 10 into image data in a format suitable for printing and supplies the image data to the printer engine 7. The printer engine 7 prints the given image data. Thereby, a copy of the paper document and a printed matter of the table of contents are formed.

このような画像形成装置1において、データ処理回路10は、上述のファイルを作成するファイル作成部11に加えて、ドキュメントのデータ化の付加機能に係る目次ページ作成部12および文字補正部13を有する。   In such an image forming apparatus 1, the data processing circuit 10 includes a table of contents page creation unit 12 and a character correction unit 13 related to an additional function of document data conversion in addition to the file creation unit 11 that creates the above-described file. .

目次ページ作成部12は、データ化されたドキュメントの閲覧に有用な目次ページ51を作成する。詳しくは、目次ページ作成部12は、データ化されたドキュメントからその記載内容のタイトルや見出しといった特定の文字列(単一の文字である場合も含む)を抽出し、抽出した文字列を空白ページに貼り付ける。目次ページ51のページ数は、抽出する文字列の個数およびサイズに依存する。ドキュメントに元から有るページに目次ページ51が付加されることにより、ドキュメントを閲覧する際に、閲覧者が記載内容の概要を把握し易くなる。   The table of contents page creation unit 12 creates a table of contents page 51 that is useful for browsing data-formatted documents. Specifically, the table of contents page creation unit 12 extracts a specific character string (including a case of a single character) such as a title and a heading of the description content from a data document, and the extracted character string is a blank page. Paste to. The number of pages of the table of contents page 51 depends on the number and size of character strings to be extracted. When the table of contents page 51 is added to a page that originally exists in the document, it is easy for the viewer to grasp the outline of the description contents when browsing the document.

文字補正部13は、目次ページ51の見栄えを良くするための画像処理手段である。すなわち、文字補正部13は、ラスター画像である目次ページ51内の文字のサイズおよび太さを均一化する。文字補正部13によって文字が補正された後の目次ページ53がファイル作成部11に送られ、ドキュメントのファイルに組み込まれる。   The character correction unit 13 is image processing means for improving the appearance of the table of contents page 51. That is, the character correction unit 13 equalizes the size and thickness of characters in the index page 51 that is a raster image. The table of contents page 53 after the characters are corrected by the character correction unit 13 is sent to the file creation unit 11 and incorporated into the document file.

図2は目次ページの作成要領の一例を示している。図示の例では、別個に作成された四つの紙ドキュメント41,42,43,44が一括にスキャニングされ、一つのドキュメント50としてデータ化されている。このドキュメント50から四つのページ(ページ1、6、12、15)のそれぞれの上端部に記載された文字列g1,g2,g3,g4が抽出され、ドキュメント50の先頭ページの前に挿入する形で追加される目次ページ51が作成されている。目次ページ51において、文字列g1,g2,g3,g4は、抽出元のページ配列順に上から下へ並べられている。そして、文字列g1,g2,g3,g4のそれぞれが配置された領域に対して抽出元のページを紐付けるハイパーリンクが設けられている。このハイパーリンクにより、ドキュメント50の閲覧に際して、表示された目次ページ51上での領域選択操作に呼応して選択領域に対応したページへ表示を切り替える制御を行うことができる。閲覧者は所望のページを簡便に表示させることができる。   FIG. 2 shows an example of how to create a table of contents page. In the illustrated example, four paper documents 41, 42, 43, and 44 created separately are collectively scanned and converted into data as one document 50. Character strings g1, g2, g3, and g4 described at the upper end of each of the four pages (pages 1, 6, 12, and 15) are extracted from the document 50 and inserted before the first page of the document 50. A table of contents page 51 to be added is created. In the table of contents page 51, the character strings g1, g2, g3, and g4 are arranged from top to bottom in the page layout order of the extraction source. A hyperlink that links an extraction source page to an area where each of the character strings g1, g2, g3, and g4 is arranged is provided. With this hyperlink, when browsing the document 50, it is possible to control to switch the display to a page corresponding to the selected area in response to the area selecting operation on the displayed table of contents page 51. The viewer can easily display a desired page.

なお、ドキュメント50からどのような文字列を抽出するかについては、予め取り決めておけばよい。例えば、文字領域と図形領域とを判別する公知の属性判別手法を用いて文字を判別し、周囲と比べて大きかったり太かったり色が異なっていたりする文字からなる列を抽出することができる。文字配置に係る様式が決まっている場合は、所定の部位に記載された文字列を抽出するようにすればよい。   Note that what character string is to be extracted from the document 50 may be determined in advance. For example, it is possible to discriminate characters by using a known attribute discriminating method for discriminating between a character region and a graphic region, and to extract a string of characters that are larger, thicker, or different in color than the surroundings. When the style related to the character arrangement is determined, the character string described in the predetermined part may be extracted.

ところで、ページごとの画像の集合であるドキュメント50からその一部を切り出して白紙ページに貼り付ける手法によれば、切り出した部分の文字情報をそのまま伝える目次ページ51を得ることができる。つまり、文字情報が失われることも変化してしまうこともない。   By the way, according to the technique of cutting out a part from the document 50 that is a set of images for each page and pasting it on a blank page, it is possible to obtain a table of contents page 51 that conveys the character information of the cut out part as it is. That is, the character information is not lost or changed.

これに対して、ドキュメント50が有する文字情報をOCRのような文字認識技術を用いてテキストデータに変換し、テキストデータから文字列を抽出する手法を採用した場合、文字の誤認識によって正しい目次の得られないおそれがある。抽出すべき文字列が抽出されなかったり、他の文字に置き換わったりする。特に、抽出すべき文字がある程度以上大きかったり文字の近くに飾り模様があったりすると、文字の誤認識が置き易い。したがって、目次としての情報の正確さの観点では、切り出した画像を貼り付ける手法が優れている。   On the other hand, when a method of converting character information held in the document 50 into text data using a character recognition technique such as OCR and extracting a character string from the text data, the correct table of contents is detected due to erroneous character recognition. May not be obtained. The character string to be extracted is not extracted or replaced with another character. In particular, if a character to be extracted is larger than a certain size or has a decorative pattern near the character, erroneous recognition of the character is easy to place. Therefore, from the viewpoint of the accuracy of information as a table of contents, a method of pasting a cut-out image is excellent.

しかし、フォントを任意に設定することができるテキストデータからなる目次とは違って、文字列としての画像を貼り付けた目次ページ51では、複数の文字列の間で文字の太さやサイズが異なる場合がある。極端な差異は、文字情報としての目次ページ51の品位を損なう。   However, unlike a table of contents consisting of text data in which fonts can be arbitrarily set, in the table of contents page 51 pasted with an image as a character string, the thickness and size of the characters are different among a plurality of character strings. There is. An extreme difference impairs the quality of the table of contents page 51 as character information.

そこで、画像形成装置1のデータ処理回路10に文字補正部13が設けられている。文字補正部13は文字サイズを均一化する文字サイズ調整および文字太さを均一化する文字太さ調整を行なう。図3のように、文字サイズ調整では、目次ページ51における比較的に大きい文字を小さくするとともに、比較的に小さい文字を大きくする。文字サイズ調整により、目次ページ51と比べて文字サイズの不均一さの低減した目次ページ52が得られる。この目次ページ52に対して文字太さ調整が行なわれる。図4のように、文字太さ調整では、目次ページ52における比較的に太い文字を細くするとともに、比較的に細い文字を太くする。文字太さ調整により、目次ページ52と比べて文字太さの不均一さの低減した目次ページ53が得られる。この目次ページ53がドキュメントに付加される。   Therefore, the character correction unit 13 is provided in the data processing circuit 10 of the image forming apparatus 1. The character correction unit 13 performs character size adjustment for making the character size uniform and character thickness adjustment for making the character thickness uniform. As shown in FIG. 3, in the character size adjustment, a relatively large character on the table of contents page 51 is reduced and a relatively small character is increased. By adjusting the character size, a table of contents page 52 with reduced character size non-uniformity compared to the table of contents page 51 is obtained. Character thickness adjustment is performed on this table of contents page 52. As shown in FIG. 4, in the character thickness adjustment, a relatively thick character in the table of contents page 52 is thinned and a relatively thin character is thickened. By adjusting the character thickness, the table of contents page 53 in which the unevenness of the character thickness is reduced as compared with the table of contents page 52 is obtained. This table of contents page 53 is added to the document.

文字太さ調整において、文字を細くする“細らせ補正”および文字を太くする“太らせ補正”の両方を行なうことにより、これら補正のいずれか片方のみを行う場合に起こり易い図5に示される文字破損の発生を抑えて、文字太さを均一化することができる。図5(A)のように細らせ補正のみを行った場合、文字を構成する線要素のうちの細い線要素が無くなったり途切れたりする破損が起こり易い。図示では細らせ補正の対象である太い文字の一つである「青」という漢字において、下側の一部(2本の横線要素)が消失している。この消失により、漢字の「青」は「青」でない単なる図柄になってしまっている。つまり、「青」という漢字がもつ「青」を表す形状が失われている。形状が失われることは文字の意味が失われることでもある。また、図5(B)のように太らせ補正のみを行った場合、線要素間の間隙が無くなる破損(潰れを呼ばれる)が起こり易い。図示では太らせ補正の対象である細い文字のうち、アルファベットの「A」と漢字の「青」とが潰れている。潰れによって、「A」を表す形状および「青」を表す形状が失われている。   As shown in FIG. 5, which is likely to occur when only one of these corrections is performed by adjusting both the “thinning correction” for thinning the character and “thickening correction” for thickening the character. Therefore, it is possible to make the thickness of the characters uniform. When only the thinning correction is performed as shown in FIG. 5A, the thin line elements among the line elements constituting the character are easily broken or broken. In the figure, in the Chinese character “blue” which is one of the thick characters to be thinned, a part of the lower side (two horizontal line elements) has disappeared. Due to this disappearance, the Chinese character “blue” has become a simple design that is not “blue”. That is, the shape representing “blue” of the Chinese character “blue” is lost. Losing the shape also means losing the meaning of the characters. In addition, when only thickening correction is performed as shown in FIG. 5B, breakage (called crushing) in which the gaps between the line elements disappear is likely to occur. In the drawing, among thin characters that are targets for thickening correction, the alphabet “A” and the Chinese character “blue” are crushed. Due to the collapse, the shape representing “A” and the shape representing “blue” are lost.

次に、文字太さ調整を中心に文字補正部13の動作をさらに詳しく説明する。   Next, the operation of the character correction unit 13 will be described in more detail with a focus on character thickness adjustment.

文字太さ調整では、目次ページ52内の文字をグループ分けした文字グループごとに文字太さ値を定める。各文字グループは、目次ページ52内の配置によって区分される文字列である。本実施形態では、ドキュメント50から抽出された複数の文字列g1,g2,g3,g4が所定の間隔を設けて配置されるので、これら文字列g1,g2,g3,g4のそれぞれが文字グループとなる。すなわち、グループ分けのために画像を解析することなく、文字列g1,g2,g3,g4を貼り付ける段階で目次ページ作成部12によって生成された配置情報によって文字グループが特定される。以下では、文字列g1,g2,g3,g4に図4に示される文字グループG1,G2,G3,G4が順に対応するものとする。   In the character thickness adjustment, a character thickness value is determined for each character group obtained by grouping characters in the table of contents page 52. Each character group is a character string divided by the arrangement in the table of contents page 52. In the present embodiment, since a plurality of character strings g1, g2, g3, and g4 extracted from the document 50 are arranged with a predetermined interval, each of these character strings g1, g2, g3, and g4 is a character group. Become. That is, the character group is specified by the layout information generated by the table of contents page creation unit 12 when the character strings g1, g2, g3, and g4 are pasted without analyzing the images for grouping. In the following, it is assumed that the character groups G1, G2, G3, and G4 shown in FIG. 4 correspond to the character strings g1, g2, g3, and g4 in order.

文字太さ値は、文字グループに属する文字の太さを代表する値である。文字グループは同じページから抽出された文字の集合であるので、文字グループ内で文字のフォントは共通であって、文字間で太さが極端に異なることはないと考えられる。ただし、通常、個々の文字において、線要素の幅は一様でない。これらのことを踏まえ、本実施形態における文字太さ値は、文字に適用するフィルタサイズを段階的に切り替えて繰り返し実施したOpening処理の結果に基づいて算定される。Opening処理では、まず収縮処理(Erosion)を行い、次に膨張処理(Dilation)を行なう。収縮処理で文字の線要素が消失すると、膨張処理で文字が復元されず、処理の前後で文字画素数が減少する。文字画素の50%以上が消失するフィルタサイズから文字太さ値が定められる。   The character thickness value is a value representing the thickness of characters belonging to the character group. Since the character group is a set of characters extracted from the same page, the font of the characters is common within the character group, and it is considered that the thickness is not extremely different between characters. However, the width of the line element is usually not uniform in each character. Based on these things, the character thickness value in this embodiment is calculated based on the result of the Opening process repeatedly performed by switching the filter size applied to a character in steps. In the opening process, first, the contraction process (Erosion) is performed, and then the expansion process (Dilation) is performed. When the line element of the character disappears in the contraction process, the character is not restored by the expansion process, and the number of character pixels decreases before and after the process. The character thickness value is determined from the filter size at which 50% or more of the character pixels disappear.

図6において、四つの文字グループG1,G2,G3,G4のそれぞれの文字太さ値T1,T2,T3,T4の中で、文字グループG1の文字太さ値T1が最大値であり、文字グループG2の文字太さ値T2が最小値である。言い換えれば、太さの差が最も大きい文字グループの組は文字グループG1と文字グループG2との組である。そこで、文字補正部13は、これら文字グループG1と文字グループG2とについて太さを均一化するための必要補正量Xとして、最大の文字太さ値T1と最小の文字太さ値T2との差分を算出する。必要補正量Xは、文字太さ調整の要否の指標となる。必要補正量Xが十分に小さい場合、文字太さ調整は不要である。   In FIG. 6, among the character thickness values T1, T2, T3, and T4 of the four character groups G1, G2, G3, and G4, the character thickness value T1 of the character group G1 is the maximum value. The character thickness value T2 of G2 is the minimum value. In other words, the set of character groups having the largest difference in thickness is the set of character group G1 and character group G2. Therefore, the character correction unit 13 determines the difference between the maximum character thickness value T1 and the minimum character thickness value T2 as the necessary correction amount X for making the thickness uniform for the character group G1 and the character group G2. Is calculated. The necessary correction amount X is an indicator of the necessity of character thickness adjustment. When the necessary correction amount X is sufficiently small, the character thickness adjustment is unnecessary.

太さの均一化のために細らせ補正および太らせ補正の両方を行なうとすると、これら補正の目標値TXは、必然的に文字太さ値T1(最大値)と文字太さ値T2(最小値)との間の値となる。目標値TXとして、単純に最大値と最小値との間の中央値を設定してもよいし、最大値の文字グループおよび最小値の文字グループのそれぞれの占有率(目次ページ52における占有領域の割合)に応じた値を設定してもよい。中央値にする場合は、細らせ補正および太らせ補正の補正量が均一化される。占有率を考慮する必要が無いので処理が簡単になる利点がある。一方、占有率に応じた値にする場合には、目標値TXを中央値よりも占有率の大きい方の文字グループの文字太さ値に近い値にすることで、占有率の大きい文字グループに対しては補正量を少なく設定する。これにより全体の補正量の総量が少なくなり、文字の劣化を最小化することができる。   If both thinning correction and thickening correction are performed to make the thickness uniform, the target value TX of these corrections inevitably is the character thickness value T1 (maximum value) and the character thickness value T2 ( It is a value between (minimum value). As the target value TX, a median value between the maximum value and the minimum value may be simply set, or the occupancy rates of the maximum value character group and the minimum value character group (the occupied area of the index page 52). You may set the value according to the ratio. When the median value is used, the correction amounts for the thinning correction and the thickening correction are made uniform. Since there is no need to consider the occupation ratio, there is an advantage that the processing is simplified. On the other hand, when setting the value according to the occupation ratio, the target value TX is set to a value close to the character thickness value of the character group having the larger occupation ratio than the median value. On the other hand, the correction amount is set small. As a result, the total amount of correction is reduced, and character deterioration can be minimized.

目標値TXが定まると、文字グループG1,G2,G3,G4のそれぞれについて細らせ補正および太らせ補正のいずれを行なうべきかが決まる。すなわち、目標値TXよりも文字太さ値の大きい文字グループである太文字グループが細らせ補正の対象となり、目標値TXよりも文字太さ値の小さい文字グループである細文字グループが太らせ補正の対象となる。図6では、文字グループG1,G3が太文字グループであり、文字グループG2,G4が細文字グループである。   When the target value TX is determined, it is determined which of the character groups G1, G2, G3, and G4 is to be thinned or thickened. That is, a thick character group that is a character group having a character thickness value larger than the target value TX is subject to thinning correction, and a thin character group that is a character group having a character thickness value smaller than the target value TX is thickened. Subject to correction. In FIG. 6, character groups G1 and G3 are bold character groups, and character groups G2 and G4 are fine character groups.

太文字グループ(文字グループG1,G3)に対する細らせ補正の補正量は、限界細らせ量L11,L13を超えない範囲内で目標細らせ量M11,M13に演算精度の上で最も近い値とされる。また、細文字グループ(文字グループG2,G4)に対する太らせ補正の補正量は、限界太らせ量L22,L24を超えない範囲で目標太らせ量M22,M24に演算精度の上で最も近い値とされる。図6では、限界細らせ量L11,L13が目標細らせ量M11,M13よりも多いので、目標細らせ量M11,M13が細らせ補正の補正量となる。同様に、限界太らせ量L22,L24が目標太らせ量M22,M24よりも多いので、目標太らせ量M22,M24が太らせ補正の補正量となる。   The correction amount of the thinning correction for the bold character groups (character groups G1 and G3) is closest to the target thinning amounts M11 and M13 in terms of calculation accuracy within a range not exceeding the limit thinning amounts L11 and L13. Value. The correction amount of the thickening correction for the fine character groups (character groups G2 and G4) is the closest value in terms of calculation accuracy to the target thickening amounts M22 and M24 within a range not exceeding the limit thickening amounts L22 and L24. Is done. In FIG. 6, since the limit thinning amounts L11 and L13 are larger than the target thinning amounts M11 and M13, the target thinning amounts M11 and M13 are thinning correction amounts. Similarly, since the limit fattening amounts L22 and L24 are larger than the target fattening amounts M22 and M24, the target fattening amounts M22 and M24 are correction amounts for thickening correction.

目標細らせ量M11,M13とは、太文字グループの文字太さ値T1,T3と目標値TXとの差分であり、目標太らせ量M22,M24とは、細文字グループの文字太さ値T2,T4と目標値TXとの差分である。そして、限界細らせ量L11,L13とは、補正される文字が当該文字を表す形状を失わない範囲内での最大限の細らせ量であり、限界太らせ量L22,L24とは、補正される文字が当該文字を表す形状を失わない範囲内での最大限の細らせ量である。   The target thinning amounts M11 and M13 are differences between the character thickness values T1 and T3 of the thick character group and the target value TX, and the target thinning amounts M22 and M24 are the character thickness values of the thin character group. This is the difference between T2 and T4 and the target value TX. The limit thinning amounts L11 and L13 are the maximum thinning amounts within a range in which the character to be corrected does not lose the shape representing the character. The limit thinning amounts L22 and L24 are: This is the maximum amount of thinning within a range where the character to be corrected does not lose the shape representing the character.

限界細らせ量L11,L13は、例えば上述のOpening処理において文字画素数が急激に減少する直前のフィルタサイズとして検出される。限界太らせ量L22,L24は、Opening処理とは逆に膨張処理(Dilation)の後に収縮処理(Erosion)をするClosing処理を段階的にフィルタサイズを切り替えて実施し、文字画素数が急激に減少する直前のフィルタサイズとして検出される。   For example, the limit thinning amounts L11 and L13 are detected as filter sizes immediately before the number of character pixels rapidly decreases in the above-described opening process. For the limit thickening amounts L22 and L24, the Closing process that performs the erosion process (Erosion) after the dilation process (Dilation) contrary to the Opening process is performed by switching the filter size step by step, and the number of character pixels decreases rapidly. It is detected as the filter size immediately before.

細らせ補正および太らせ補正の各補正量の具体例として、必要補正量Xが4ドットであり、文字グループG1の限界細らせ量L11および文字グループ文字G2の限界太らせ量L22がともに3ドットであるとする。また、太い文字グループG1の占有率が10%で、細い文字グループG2の占有率が90%であるとする(ここでは複数の文字グループが文字グループG1,G2の二つである場合を想定している)。目標値TXを必要補正量Xの中央値とする場合、文字グループG1の文字を2ドット細らせ、文字グループG2の文字を2ドット太らせる。占有率を加味して目標値TXを定める場合、占有率の多い細い文字グループG2の補正量が少なくなるよう、例えば文字グループG1の文字を3ドット細らせ、文字グループG2の文字を1ドット太らせる。   As a specific example of each correction amount for thinning correction and thickening correction, the necessary correction amount X is 4 dots, and the limit thinning amount L11 of the character group G1 and the limit thickening amount L22 of the character group character G2 are both. It is assumed that there are 3 dots. Further, it is assumed that the occupation ratio of the thick character group G1 is 10% and the occupation ratio of the thin character group G2 is 90% (here, a case where a plurality of character groups are two character groups G1 and G2). ing). When the target value TX is the median value of the necessary correction amount X, the characters in the character group G1 are thinned by 2 dots, and the characters in the character group G2 are thickened by 2 dots. When the target value TX is determined in consideration of the occupation rate, for example, the characters of the character group G1 are thinned by 3 dots and the characters of the character group G2 are 1 dot so that the correction amount of the thin character group G2 having a large occupation rate is reduced. Fatten.

なお、太さの異なる複数の文字グループが3以上存在する場合でも同じ考え方で細らせ補正および太らせ補正を実施すればよい。占有率に応じて目標値TXを定める場合、最も太い文字グループおよび最も細い文字グループの占有率を基に定めてもよいし、全ての文字グループのそれぞれの占有率を基に全体の補正量の総量が少なくなるように定めてもよい。収縮処理(Erosion)により細らせることができ、膨張処理(Dilation)により太らせることができる。   Even when there are three or more character groups having different thicknesses, thinning correction and thickening correction may be performed based on the same concept. When the target value TX is determined according to the occupancy rate, the target value TX may be determined based on the occupancy rate of the thickest character group and the thinnest character group, or the entire correction amount based on the occupancy rates of all the character groups. You may decide so that total amount may become small. It can be thinned by an erosion process (Erosion), and can be made thick by an expansion process (Dilation).

図7は画像形成装置1によるドキュメントのデータ化動作のフローチャートである。イメージスキャナー5が紙ドキュメント41,42,43,44を読み取り(#1)、データ処理回路10のファイル作成部11がデータ化されたドキュメント50としての画像データファイルを作成する(#2)。目次ページ作成部12が目次ページ51を作成し(#3)、文字補正部13が文字サイズ調整および文字太さ調整を順に行なう(#4、#5)。   FIG. 7 is a flowchart of document data conversion operation by the image forming apparatus 1. The image scanner 5 reads the paper documents 41, 42, 43, and 44 (# 1), and the file creation unit 11 of the data processing circuit 10 creates an image data file as the document 50 converted into data (# 2). The table of contents page creation unit 12 creates a table of contents page 51 (# 3), and the character correction unit 13 performs character size adjustment and character thickness adjustment in order (# 4, # 5).

文字補正部13による調整後の目次ページ53をファイル作成部11が画像データファイルに付加する(#6)。そして、データ処理回路10が画像データファイルを出力する(#7)。目次ページ53の付加された画像データファイルは、外部装置へ送信され、またはストレージ9に格納される。   The file creation unit 11 adds the table of contents page 53 adjusted by the character correction unit 13 to the image data file (# 6). Then, the data processing circuit 10 outputs an image data file (# 7). The image data file to which the table of contents page 53 is added is transmitted to an external device or stored in the storage 9.

図8は文字太さ調整ルーチンのフローチャートである。   FIG. 8 is a flowchart of the character thickness adjustment routine.

文字補正部13は、目次ページ生成部12による文字列の抽出情報に基づいて、文字サイズ調整後のラスター画像である目次ページ52における文字グループを特定する(#61)。各文字グループについて文字太さ値を定め(#62)、文字太さ値の最大値と最小値との差分である必要補正量Xを算出する(#63)。   The character correction unit 13 specifies a character group in the table of contents page 52, which is a raster image after the character size adjustment, based on the character string extraction information from the table of contents page generation unit 12 (# 61). A character thickness value is determined for each character group (# 62), and a necessary correction amount X that is a difference between the maximum value and the minimum value of the character thickness value is calculated (# 63).

必要補正量Xと所定の閾値とを比較して文字太さ調整の要否チェックを行なう(#64)。必要補正量Xが閾値よりも小さい場合(#64でNO)、文字太さ調整は不要である。この場合、処理の流れは図7のフローにリターンする。   The necessary correction amount X is compared with a predetermined threshold value to check the necessity of character thickness adjustment (# 64). When the necessary correction amount X is smaller than the threshold value (NO in # 64), the character thickness adjustment is not necessary. In this case, the processing flow returns to the flow of FIG.

文字太さ調整が必要である場合(#64でYES)、文字補正部13は各文字グループの占有率を算出し(#65)、目標値TXを定める(#66)。これにより、文字グループは太文字グループと細文字グループとに区分される。文字太さ値と目標値TXとの差分が所定値以上であり、かつ占有率が所定値(例えば80%)未満である文字グループを補正対象に選定する(#67)。占有率を加味するのは、補正量の総量を少なくするとともに補正による文字の変化を目立ち難くするためである。   When character thickness adjustment is necessary (YES in # 64), the character correction unit 13 calculates the occupancy ratio of each character group (# 65) and determines a target value TX (# 66). Thereby, the character group is divided into a bold character group and a thin character group. A character group in which the difference between the character thickness value and the target value TX is equal to or greater than a predetermined value and the occupation ratio is less than a predetermined value (for example, 80%) is selected as a correction target (# 67). The reason why the occupation ratio is taken into account is to reduce the total amount of the correction amount and make the change of the character due to the correction less noticeable.

補正対象に選定された文字グループについて、限界補正量(限界細らせ量と限界太らせ量との総称)を算出する。すなわち、太文字グループについては限界細らせ量を算出し(#68、#69)、細文字グループについては限界太らせ量を算出する(#68、#70)。   For a character group selected as a correction target, a limit correction amount (a general term for a limit thinning amount and a limit thickening amount) is calculated. That is, the limit thinning amount is calculated for the thick character group (# 68, # 69), and the limit thinning amount is calculated for the thin character group (# 68, # 70).

目標補正量(目標細らせ量と目標太らせ量との総称)が限界補正量を超える文字グループが無ければ(#71でNO)、目標補正量を文字太さ調整の補正量に設定する(#73)。目標補正量が限界補正量を超える文字グループが有れば(#71でYES)、そのグループについて限界補正量を補正量に設定し、他のグループについて目標補正量を補正量に設定する(#72)。補正量を定めると、文字補正部13は太らせ補正および細らせ補正を実施する(#74)。   If there is no character group in which the target correction amount (the generic name of the target thinning amount and the target thickening amount) exceeds the limit correction amount (NO in # 71), the target correction amount is set as the correction amount for character thickness adjustment. (# 73). If there is a character group whose target correction amount exceeds the limit correction amount (YES in # 71), the limit correction amount is set as the correction amount for that group, and the target correction amount is set as the correction amount for the other groups (# 72). When the correction amount is determined, the character correction unit 13 performs thickening correction and thinning correction (# 74).

図9は文字サイズ調整ルーチンのフローチャートである。文字サイズ調整は基本的には文字太さ調整と同様の手順で行なわれる。文字サイズもページ内で均一であるのが望ましい。ページ内の占有率の大きいサイズに均一化することでオリジナルページとの統一性が最も高くなるが、占有率の大きい文字サイズが大サイズであったり、文字量が多かったりすると、目次のページ数が増大し、閲覧の利便性を損なう場合がある。逆に、占有率の小さい文字サイズが小サイズであると、視認性を損なう場合がある。そこで、作成される目次ページの数から限界拡大量を規定し、視認性を確保できると規定した最小文字サイズから限界縮小量を規定する。   FIG. 9 is a flowchart of the character size adjustment routine. The character size adjustment is basically performed in the same procedure as the character thickness adjustment. It is desirable that the character size is uniform within the page. Uniformity with the original page is maximized by uniformizing to a large occupancy size in the page, but if the character size with a large occupancy size is large or the amount of characters is large, the number of pages in the table of contents May increase the convenience of browsing. On the contrary, if the character size with a small occupation rate is a small size, the visibility may be impaired. Therefore, the limit enlargement amount is defined from the number of table of contents pages to be created, and the limit reduction amount is defined from the minimum character size that is defined as ensuring visibility.

文字補正部13は、目次ページ生成部12による文字列の抽出情報に基づいて、目次ページ生成部12によって作成された目次ページ51における文字グループを特定する(#41)。各文字グループについて文字サイズ値を定め(#42)、文字サイズ値の最大値と最小値との差分である必要サイズ補正量を算出する(#43)。   The character correction unit 13 specifies the character group in the table of contents page 51 created by the table of contents page generation unit 12 based on the character string extraction information by the table of contents page generation unit 12 (# 41). A character size value is determined for each character group (# 42), and a necessary size correction amount which is a difference between the maximum value and the minimum value of the character size value is calculated (# 43).

必要サイズ補正量と所定の閾値とを比較して文字サイズ調整の要否チェックを行なう(#44)。必要サイズ補正量が閾値よりも小さい場合(#44でNO)、文字サイズ調整は不要である。この場合、処理の流れは図7のフローにリターンする。   The necessary size correction amount is compared with a predetermined threshold value to check the necessity of character size adjustment (# 44). When the necessary size correction amount is smaller than the threshold value (NO in # 44), the character size adjustment is unnecessary. In this case, the processing flow returns to the flow of FIG.

文字サイズ調整が必要である場合(#44でYES)、文字補正部13は各文字グループの占有率を算出し(#45)、目標値を定める(#46)。これにより、文字グループは縮小すべき大文字グループと拡大すべき小文字グループとに区分される。文字サイズ値と目標値との差分が所定値以上であり、かつ占有率が所定値未満である文字グループを補正対象に選定する(#47)。占有率を加味するのは、補正量の総量を少なくするためである。   When character size adjustment is necessary (YES in # 44), the character correction unit 13 calculates the occupancy ratio of each character group (# 45) and determines a target value (# 46). As a result, the character group is divided into a capital letter group to be reduced and a small letter group to be enlarged. A character group in which the difference between the character size value and the target value is greater than or equal to a predetermined value and the occupation ratio is less than the predetermined value is selected as a correction target (# 47). The reason why the occupation ratio is taken into account is to reduce the total amount of correction.

補正対象に選定された文字グループについて、限界サイズ補正量(限界縮小量と限界拡大量との総称)を算出する。すなわち、大文字グループについては限界縮小量を算出し(#48、#49)、小文字グループについては限界拡大量を算出する(#48、#50)。限界縮小量とは、文字を予め定められた最小文字サイズ値(例えば12pt)まで小さくする最大限の縮小量である。限界拡大量とは、目次ページ51内の全文字グループが所定ページ数分の領域(例えば元と同じ1ページ)に収まる最大限の拡大量である。   For a character group selected as a correction target, a limit size correction amount (a general term for a limit reduction amount and a limit enlargement amount) is calculated. That is, the limit reduction amount is calculated for the uppercase group (# 48, # 49), and the limit enlargement amount is calculated for the lowercase group (# 48, # 50). The limit reduction amount is a maximum reduction amount for reducing characters to a predetermined minimum character size value (for example, 12 pt). The limit enlargement amount is the maximum enlargement amount that allows all character groups in the table of contents page 51 to fit in an area for a predetermined number of pages (for example, the same one page as the original).

目標サイズ補正量(目標縮小量と目標拡大量との総称)が限界サイズ補正量を超える文字グループが無ければ(#51でNO)、目標サイズ補正量を文字サイズ調整の補正量に設定する(#53)。目標サイズ補正量が限界サイズ補正量を超える文字グループが有れば(#51でYES)、そのグループについて限界サイズ補正量を補正量に設定し、他のグループについて目標サイズ補正量を補正量に設定する(#52)。補正量を定めると、文字補正部13は拡大補正および縮小補正を実施する(#54)。   If there is no character group whose target size correction amount (generic name of target reduction amount and target expansion amount) exceeds the limit size correction amount (NO in # 51), the target size correction amount is set as the correction amount for character size adjustment ( # 53). If there is a character group whose target size correction amount exceeds the limit size correction amount (YES in # 51), the limit size correction amount is set as the correction amount for that group, and the target size correction amount is set as the correction amount for the other groups. Set (# 52). When the correction amount is determined, the character correction unit 13 performs enlargement correction and reduction correction (# 54).

例えば、文字サイズ値が20ptである文字グループの占有率が80%、10ptである文字グループの占有率が20%とする。この場合、10ptの文字サイズを調整することで全体の補正量が少なくなるので、10ptの文字を10pt拡大し、全ての文字を20ptとすれば文字サイズが統一される。しかし、その場合に貼り付けるページ数が2ページとなってしまい、文字サイズが全て18ptであれば1ページに収まるとする。そうすると、占有率が大きい20pt文字の補正量を最小としつつ、ページ数が1枚に収まるように、20pt文字を2pt縮小して18ptとし、10pt文字は8pt拡大して18ptとする方法が考えられる。   For example, the occupation ratio of a character group with a character size value of 20 pt is 80%, and the occupation ratio of a character group with a character size of 10 pt is 20%. In this case, the total correction amount is reduced by adjusting the character size of 10 pt. Therefore, if the character of 10 pt is enlarged by 10 pt and all characters are 20 pt, the character size is unified. However, in this case, the number of pages to be pasted is two pages, and if the character size is all 18 pt, it will fit on one page. Then, a method of reducing the 20pt character by 2pt to 18pt while minimizing the correction amount of the 20pt character having a large occupancy rate to 18 pages by reducing the 20pt character by 2pt is possible. .

逆に、8pt文字の占有率が80%、20pt文字の占有率が20%の場合、20pt文字を12pt縮小して8ptとすれば文字サイズが統一される。しかし、視認性の観点から12pt以上の文字を使用すると規定されているとすると、占有率が大きい8pt文字の補正量を最小としつつ、すべての文字が12pt以上となるように、8pt文字を4pt拡大して12ptとし、20Pt文字を8pt縮小して12ptとする。   Conversely, if the occupation rate of 8pt characters is 80% and the occupation rate of 20pt characters is 20%, the character size is unified by reducing the 20pt characters by 12pt to 8pt. However, if it is stipulated that characters of 12pt or more are used from the viewpoint of visibility, 8pt characters are converted to 4pt so that all characters are 12pt or more while minimizing the correction amount of 8pt characters having a large occupation rate. Enlarged to 12pt, reduced 20pt character by 8pt to 12pt.

図10は文字グループ間で文字色が異なる場合の目次ページの形成手順の一例を示す図である。目次ページ内で文字の色を統一するのが望ましい。そのため、占有率の大きい文字グループの色に統一するように色補正を行なう。このとき、文字グループ間の色だけでなく、文字列の抽出元のドキュメント50bの各ページの下地色と文字色の関係に配慮する必要がある。例えば、白抜き文字の文字形状のみを切り出し、白紙に白い文字を貼り付けると当然視認できない。   FIG. 10 is a diagram showing an example of a table of contents page formation procedure when the character color differs between character groups. It is desirable to unify the color of characters in the table of contents page. Therefore, color correction is performed so as to unify the colors of character groups having a large occupation rate. At this time, it is necessary to consider not only the color between character groups but also the relationship between the base color and the character color of each page of the document 50b from which the character string is extracted. For example, if only the character shape of a white character is cut out and a white character is pasted on a blank paper, it cannot be visually recognized.

したがって、文字と下地の明度差が一定以上になるように限界色補正量を規定する。ドキュメント50bから文字列を抽出して目次ページ51bを作成する際に、文字形状のみを切り出す場合と、下地も含めて画像を切り出す場合とが考えられるが、技術的には前者が一般的かつ効果的であるため、前者について以下に記載する。   Therefore, the limit color correction amount is defined so that the brightness difference between the character and the background becomes a certain level or more. When creating a table of contents page 51b by extracting a character string from the document 50b, there are a case where only the character shape is cut out and a case where an image including the background is cut out. The former is described below.

図10のように目次ページ51bの下地色を一般的な紙の色(白)に固定する場合において、例えば白抜き文字の占有率が80%で、黒文字の占有率が20%であったとき、本来は占有率の多い方に合わせるので、すべて白抜き文字とするべきであるが、そうすると下地紙の色が白のため視認できない。そこで、下地色と文字色の最低必要明度差を予め規定しておき、最低でもその明度差を保持する。この例では、例えば下地と文字の最低必要明度差が256階調(8ビット)での100とし、下地の白が255であるすると、文字の明度は155以下にする必要がある。すなわち、白抜き文字の限界最低補正量(最低でもこの量は補正しなければならない)は明度−100となる。黒文字の文字明度を0とすると、明度155までは加算することが可能である。文字グループの占有率から、黒文字について+155の明度補正をし、白抜き文字について−100の明度補正をすることで文字色を統一することができる。   When the background color of the table of contents page 51b is fixed to a general paper color (white) as shown in FIG. 10, for example, when the occupancy of white characters is 80% and the occupancy of black characters is 20% Since it should match the one with a higher occupation rate, it should be all white characters, but then the base paper color is white and cannot be seen. Therefore, the minimum necessary brightness difference between the base color and the character color is defined in advance, and the brightness difference is held at least. In this example, for example, if the minimum required brightness difference between the background and the character is 100 at 256 gradations (8 bits) and the background white is 255, the brightness of the character needs to be 155 or less. In other words, the limit minimum correction amount of white characters (this amount must be corrected at least) is lightness-100. If the character brightness of a black character is 0, it is possible to add up to brightness 155. From the occupancy rate of the character group, it is possible to unify the character color by correcting the brightness by +155 for black characters and by correcting the brightness by -100 for white characters.

図11は目次ページの色調整の他の例を示す図である。目次ページ51cの下地色も調整対象とする場合について、上述の例と同じく、白抜き文字の占有率を80%、黒文字の占有率を20%として考える。占有率が大きい白抜き文字を優先する考え方に則して、文字をすべて白抜き文字(明度255)とすればよい。この場合、背景は低明度下地である必要がある。下地と文字の最低必要明度差が100に規定されているとすると、下地を明度155として、下地を塗り潰す。この処理により、占有率の大きい文字グループの色を保持しつつ、文字色を統一することができる。   FIG. 11 is a diagram showing another example of the color adjustment of the table of contents page. In the case where the background color of the table of contents page 51c is also subject to adjustment, as in the above example, the white character occupancy rate is assumed to be 80% and the black character occupancy rate is assumed to be 20%. In accordance with the idea of giving priority to white characters having a large occupation rate, all the characters may be white characters (brightness 255). In this case, the background needs to be a low brightness background. If the minimum required brightness difference between the background and the character is defined as 100, the background is filled with the brightness of 155. By this processing, it is possible to unify the character colors while maintaining the color of the character group having a large occupation rate.

なお、文字太さ調整と同様に、文字グループ間で明度差が閾値以下であれば、すなわち色が似通っている場合は色調整を行わないようにすることができる。また、占有率が閾値値以上であればその文字グループについては色調整を行わないようにしてもよい。文字グループ間で明度だけでなく色相も異なる場合、基本的には占有率の大きい文字グループに合わせるように色相を調整すればよい。色文字の場合でも下地は無彩色であってよい。   Similar to the character thickness adjustment, if the brightness difference between character groups is equal to or smaller than the threshold value, that is, if the colors are similar, the color adjustment can be made not to be performed. If the occupation ratio is equal to or greater than the threshold value, color adjustment may not be performed for the character group. When not only the brightness but also the hue differs between character groups, basically the hue may be adjusted to match a character group with a large occupation rate. Even in the case of colored characters, the background may be achromatic.

以上の実施形態において、画像形成装置1および画像処理装置としてのデータ処理回路10の機能構成、ハードウェア構成、および動作などは例示に限らず、本発明の趣旨に沿う範囲内で適宜変更してもよい。例えば、文字補正部13は文字サイズ調整および文字太さ調整のうちの文字太さ調整のみを行なうものであってもよい。逆に文字サイズ調整のみを行なうようにすることもできる。文字太さ調整後に文字サイズ調整を行なってもよい。   In the above embodiment, the functional configuration, hardware configuration, operation, and the like of the image forming apparatus 1 and the data processing circuit 10 as the image processing apparatus are not limited to examples, and may be changed as appropriate within the scope of the present invention. Also good. For example, the character correction unit 13 may perform only character thickness adjustment among character size adjustment and character thickness adjustment. Conversely, only character size adjustment can be performed. The character size may be adjusted after adjusting the character thickness.

目次ページ52に限らず、太さの異なる文字が混在する任意のラスター画像について、文字太さ調整を行なうことができる。その場合、文字と図形とを判別する画像属性判別技術によって文字を判別し、例えば文字間の間隔の大小に基づいて文字のグループ分けをすることができる。また、判別した文字を内包する最小の矩形のサイズが近い文字どうしを1グループにまとめるグループ分けをしてもよい。   In addition to the table of contents page 52, the character thickness can be adjusted for an arbitrary raster image in which characters having different thicknesses are mixed. In that case, the characters can be discriminated by image attribute discrimination technology for discriminating between characters and graphics, and for example, the characters can be grouped based on the size of the interval between the characters. Further, it is possible to perform grouping in which characters having a minimum rectangular size containing the determined characters are grouped into one group.

1 画像形成装置
10 データ処理回路(画像処理装置)
52 目次ページ(画像)
g1、g2、g3、g4 文字列
G1,G2,G3,G4 文字グループ
T1,T2,T3,T4 文字太さ値
TX 目標値
L11,L13 限界細らせ量
L22,L24 限界太らせ量
M11、M13 目標細らせ量
M22,M24 目標太らせ量
DESCRIPTION OF SYMBOLS 1 Image forming apparatus 10 Data processing circuit (image processing apparatus)
52 Table of Contents Page (Image)
g1, g2, g3, g4 Character string G1, G2, G3, G4 Character group T1, T2, T3, T4 Character thickness value TX Target value L11, L13 Limit thinning amount L22, L24 Limit thickening amount M11, M13 Target thinning amount M22, M24 Target thickening amount

Claims (9)

文字を対象とする画像処理を行なう画像処理装置であって、
画像から当該画像内の配置によって区分される複数の文字グループを抽出する手段と、
前記画像から抽出された前記複数の文字グループのそれぞれについて、当該文字グループに属する文字の太さを代表する文字太さ値を定める手段と、
前記複数の文字グループについて定められた文字太さ値のうちの最大値と最小値との間の値を、文字を細くする細らせ補正および文字を太らす太らせ補正の両方の目標値に設定する手段と、
前記複数の文字グループのうちの前記文字太さ値が前記目標値よりも大きい文字グループである太文字グループについて、前記細らせ補正を行なうときの補正される文字が当該文字を表す形状を失わない範囲内での最大限の細らせ量である限界細らせ量を求める手段と、
前記複数の文字グループのうちの前記文字太さ値が前記目標値よりも小さい文字グループである細文字グループについて、前記太らせ補正を行なうときの補正される文字が当該文字を表す形状を失わない範囲内での最大限の太らせ量である限界太らせ量を求める手段と、
前記太文字グループに対して、細らせ量が当該太文字グループの文字太さ値と前記目標値との差分である目標細らせ量および前記限界細らせ量の両方を超えないように前記細らせ補正を行うとともに、前記細文字グループに対して、太らせ量が当該細文字グループの文字太さ値と前記目標値との差分である目標太らせ量および前記限界太らせ量の両方を超えないように前記太らせ補正を行なう手段と、を備える
ことを特徴とする画像処理装置。
An image processing apparatus that performs image processing on characters,
Means for extracting from the image a plurality of character groups divided by the arrangement in the image;
For each of the plurality of character groups extracted from the image, means for determining a character thickness value representative of the thickness of the characters belonging to the character group;
A value between a maximum value and a minimum value among the character thickness values determined for the plurality of character groups is set as a target value for both the thinning correction for thinning the character and the thickening correction for thickening the character. Means for setting;
Of the plurality of character groups, for a thick character group whose character thickness value is larger than the target value, the character to be corrected when performing the thinning correction loses the shape representing the character. A means for obtaining a limit thinning amount that is a maximum thinning amount within a non-existing range;
Of the plurality of character groups, with respect to a fine character group whose character thickness value is smaller than the target value, the character to be corrected when performing the thickening correction does not lose the shape representing the character. A means for obtaining a limit fattening amount that is the maximum fatening amount within the range;
For the bold character group, the thinning amount does not exceed both the target thinning amount and the limit thinning amount that are the difference between the character thickness value of the bold character group and the target value. While performing the thinning correction, for the fine character group, the thickening amount is a difference between the character thickness value of the fine character group and the target value, and the target thickening amount and the limit thickening amount. An image processing apparatus comprising: means for performing the fattening correction so as not to exceed both.
前記太文字グループおよび前記細文字グループのそれぞれについて、前記画像における占有領域の割合である占有率を算出する手段と、
占有率の小さい文字グループの補正量が占有率の大きい文字グループの補正量よりも多くなるように、前記太文字グループに対する前記細らせ補正の細らせ量および前記細文字グループに対する前記太らせ補正の太らせ量を設定する手段と、をさらに備える
請求項1記載の画像処理装置。
Means for calculating an occupancy ratio that is a ratio of an occupied area in the image for each of the bold character group and the fine character group;
The thinning amount of the thinning correction for the thick character group and the thickening for the thin character group so that the correction amount of the character group having a small occupation ratio is larger than the correction amount of the character group having a large occupation ratio. The image processing apparatus according to claim 1, further comprising: a unit for setting a correction fattening amount.
細らせ量および太らせ量を設定する前記手段は、占有率が閾値以上である文字グループについては、細らせ量および太らせ量を零に設定する
請求項2記載の画像処理装置。
The image processing apparatus according to claim 2, wherein the thinning amount and the thickening amount setting unit sets the thinning amount and the thickening amount to zero for a character group whose occupation ratio is equal to or greater than a threshold value.
細らせ補正および太らせ補正を行なう前記手段は、細らせ量が前記目標細らせ量および前記限界細らせ量の両方を超えない範囲内での最大限の前記細らせ補正を行なうとともに、太らせ量が前記目標太らせ量および前記限界太らせ量の両方を超えない範囲内での最大限の前記太らせ補正を行なう
請求項1記載の画像処理装置。
The means for performing the thinning correction and the thickening correction performs the maximum thinning correction within a range in which the thinning amount does not exceed both the target thinning amount and the limit thinning amount. The image processing apparatus according to claim 1, wherein the thickening correction is performed to a maximum extent within a range in which the fattening amount does not exceed both the target fattening amount and the limit fattening amount.
前記文字太さ値のうちの前記最大値と前記最小値との差分が閾値以下である場合には、前記複数の文字グループのいずれについても前記細らせ補正および前記太らせ補正を行わない
請求項1ないし4のいずれかに記載の画像処理装置。
If the difference between the maximum value and the minimum value of the character thickness values is less than or equal to a threshold value, the thinning correction and the thickening correction are not performed for any of the plurality of character groups. Item 5. The image processing apparatus according to any one of Items 1 to 4.
前記目標値を設定する手段は、当該目標値として前記最大値と前記最小値との間の中央の値を設定する
請求項1ないし5のいずれかに記載の画像処理装置。
The image processing apparatus according to claim 1, wherein the target value setting unit sets a central value between the maximum value and the minimum value as the target value.
前記画像から抽出された前記複数の文字グループのそれぞれについて、当該文字グループに属する文字のサイズを代表する文字サイズ値を定める手段と、
前記複数の文字グループについて定められた文字サイズ値のうちの最大値と最小値との間の値を、文字を小さくする縮小補正および文字を大きくする拡大補正の両方の目標サイズ値に設定する手段と、
前記複数の文字グループのうちの前記文字サイズ値が前記目標サイズ値よりも大きい文字グループである大文字グループについて、前記縮小補正を行なうときの予め定められた最小文字サイズ値まで小さくする最大限の縮小量である限界縮小量を求める手段と、
前記大文字グループに対して、縮小量が当該大文字グループの文字サイズ値と前記目標サイズ値との差分である目標縮小量および前記限界縮小量の両方を超えないように前記縮小補正を行うとともに、前記複数の文字グループのうちの前記文字サイズ値が前記目標サイズ値よりも小さい文字グループである小文字グループに対して、拡大量が当該小文字グループの文字サイズ値と前記目標サイズ値との差分である目標太らせ量および前記文字サイズ値の最大値の両方を超えないように前記拡大補正を行なう手段と、を備える
請求項1ないし6のいずれかに記載の画像処理装置。
For each of the plurality of character groups extracted from the image, means for determining a character size value representative of the size of the characters belonging to the character group;
Means for setting a value between a maximum value and a minimum value among the character size values determined for the plurality of character groups as a target size value for both reduction correction for reducing a character and enlargement correction for increasing a character. When,
Maximum reduction that reduces the character size value of the plurality of character groups to a predetermined minimum character size value when performing the reduction correction for an uppercase character group that is a character group whose character size value is larger than the target size value A means for obtaining a limit reduction amount that is a quantity;
For the uppercase group, the reduction correction is performed so that the reduction amount does not exceed both the target reduction amount and the limit reduction amount that are the difference between the character size value of the uppercase group and the target size value, and A target whose enlargement amount is a difference between a character size value of the lowercase letter group and the target size value with respect to a lowercase letter group that is a character group whose character size value is smaller than the target size value among a plurality of character groups The image processing apparatus according to claim 1, further comprising a unit that performs the enlargement correction so as not to exceed both a fattening amount and a maximum value of the character size value.
前記複数の文字グループに対して、前記縮小補正および前記拡大補正を行った後に、前記文字太さ値を定めて前記細らせ補正および前記太らせ補正を行う
請求項7記載の画像処理装置。
The image processing apparatus according to claim 7, wherein after the reduction correction and the enlargement correction are performed on the plurality of character groups, the thinning correction and the thickening correction are performed by determining the character thickness value.
原稿シートから原稿画像を読み取るイメージスキャナーと、
前記イメージスキャナーによって読み取られた複数の原稿画像から複数の文字グループを抽出し、当該複数の文字グループが並んだ編集画像を形成する手段と、
前記編集画像における前記複数の文字グループのそれぞれについて、当該文字グループに属する文字の太さを代表する文字太さ値を定める手段と、
前記複数の文字グループについて定められた文字太さ値のうちの最大値と最小値との間の値を、文字を細くする細らせ補正および文字を太らす太らせ補正の両方の目標値に設定する手段と、
前記複数の文字グループのうちの前記文字太さ値が前記目標値よりも大きい文字グループである太文字グループについて、前記細らせ補正を行なうときの補正される文字が当該文字を表す形状を失わない範囲内での最大限の細らせ量である限界細らせ量を求める手段と、
前記複数の文字グループのうちの前記文字太さ値が前記目標値よりも小さい文字グループである細文字グループについて、前記太らせ補正を行なうときの補正される文字が当該文字を表す形状を失わない範囲内での最大限の太らせ量である限界太らせ量を求める手段と、
前記太文字グループに対して、細らせ量が当該太文字グループの文字太さ値と前記目標値との差分である目標細らせ量および前記限界細らせ量の両方を超えないように前記細らせ補正を行うとともに、前記細文字グループに対して、太らせ量が当該細文字グループの文字太さ値と前記目標値との差分である目標太らせ量および前記限界太らせ量の両方を超えないように前記太らせ補正を行なう手段と、を備える
ことを特徴とする画像形成装置。
An image scanner that reads a document image from a document sheet;
Means for extracting a plurality of character groups from a plurality of document images read by the image scanner and forming an edited image in which the plurality of character groups are arranged;
For each of the plurality of character groups in the edited image, means for determining a character thickness value representing the thickness of the characters belonging to the character group;
A value between a maximum value and a minimum value among the character thickness values determined for the plurality of character groups is set as a target value for both the thinning correction for thinning the character and the thickening correction for thickening the character. Means for setting;
Of the plurality of character groups, for a thick character group whose character thickness value is larger than the target value, the character to be corrected when performing the thinning correction loses the shape representing the character. A means for obtaining a limit thinning amount that is a maximum thinning amount within a non-existing range;
Of the plurality of character groups, with respect to a fine character group whose character thickness value is smaller than the target value, the character to be corrected when performing the thickening correction does not lose the shape representing the character. A means for obtaining a limit fattening amount that is the maximum fatening amount within the range;
For the bold character group, the thinning amount does not exceed both the target thinning amount and the limit thinning amount that are the difference between the character thickness value of the bold character group and the target value. While performing the thinning correction, for the fine character group, the thickening amount is a difference between the character thickness value of the fine character group and the target value, and the target thickening amount and the limit thickening amount. An image forming apparatus comprising: means for performing the fattening correction so as not to exceed both.
JP2012199550A 2012-09-11 2012-09-11 Image processing apparatus and image forming apparatus Active JP5904066B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012199550A JP5904066B2 (en) 2012-09-11 2012-09-11 Image processing apparatus and image forming apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012199550A JP5904066B2 (en) 2012-09-11 2012-09-11 Image processing apparatus and image forming apparatus

Publications (2)

Publication Number Publication Date
JP2014056321A true JP2014056321A (en) 2014-03-27
JP5904066B2 JP5904066B2 (en) 2016-04-13

Family

ID=50613601

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012199550A Active JP5904066B2 (en) 2012-09-11 2012-09-11 Image processing apparatus and image forming apparatus

Country Status (1)

Country Link
JP (1) JP5904066B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09186854A (en) * 1996-01-08 1997-07-15 Sharp Corp Image processor
JP2002262076A (en) * 2001-02-28 2002-09-13 Ricoh Co Ltd Image processing unit
JP2006157761A (en) * 2004-12-01 2006-06-15 Dainippon Screen Mfg Co Ltd Method and device for adjusting handwritten character

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09186854A (en) * 1996-01-08 1997-07-15 Sharp Corp Image processor
JP2002262076A (en) * 2001-02-28 2002-09-13 Ricoh Co Ltd Image processing unit
JP2006157761A (en) * 2004-12-01 2006-06-15 Dainippon Screen Mfg Co Ltd Method and device for adjusting handwritten character

Also Published As

Publication number Publication date
JP5904066B2 (en) 2016-04-13

Similar Documents

Publication Publication Date Title
US7940434B2 (en) Image processing apparatus, image forming apparatus, method of image processing, and a computer-readable storage medium storing an image processing program
US20100245870A1 (en) Image processing apparatus, image forming apparatus, and image processing method
US7995238B2 (en) Image processing that can use both process and spot color plates
US20060072135A1 (en) Image forming apparatus and method
JP6254002B2 (en) CONVERSION PROCESSING DEVICE, INFORMATION PROCESSING DEVICE EQUIPPED WITH THE SAME, PROGRAM, AND RECORDING MEDIUM
CN108012046B (en) Apparatus, method and storage medium for forming image on printing medium
US8355175B2 (en) Image forming apparatus capable of reproducing fine line of high quality
US20090154763A1 (en) Image processing method for generating easily readable image
US9888147B2 (en) Image processing apparatus, electronic file generating method, and recording medium
US7379207B2 (en) Method and system for device-independent color gamut mapping
JP5058695B2 (en) Image processing apparatus, image processing method, and image processing program
US7809199B2 (en) Image processing apparatus
JP5904066B2 (en) Image processing apparatus and image forming apparatus
JP6736299B2 (en) Printing device, printing method, and program
JP2002281306A (en) Method and apparatus for forming image, and recording medium
JP4548302B2 (en) Image output system, image output control device, image output method, image output program, and storage medium storing this program in a computer-readable manner
JP4165408B2 (en) Image forming apparatus and image forming program
JP7313879B2 (en) Image processing device, image processing method and program
JP2005260404A (en) Image processor
JPH11129547A (en) Method for processing image information and information recording medium
US8300268B2 (en) Image processing device
JP6809010B2 (en) Scanned image correction device, scanned image correction method, and computer program
JP6358198B2 (en) Image forming apparatus and program
JP2005269072A (en) Image processing apparatus
JP2022040712A (en) Image processing device, image processing method, and image processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160229

R150 Certificate of patent or registration of utility model

Ref document number: 5904066

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150