JP5577763B2 - Image processing apparatus, an image processing system, and image processing program - Google Patents

Image processing apparatus, an image processing system, and image processing program Download PDF

Info

Publication number
JP5577763B2
JP5577763B2 JP2010052068A JP2010052068A JP5577763B2 JP 5577763 B2 JP5577763 B2 JP 5577763B2 JP 2010052068 A JP2010052068 A JP 2010052068A JP 2010052068 A JP2010052068 A JP 2010052068A JP 5577763 B2 JP5577763 B2 JP 5577763B2
Authority
JP
Japan
Prior art keywords
character
image processing
group
means
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010052068A
Other languages
Japanese (ja)
Other versions
JP2011188293A (en
Inventor
勝也 小柳
真太郎 安達
裕義 上條
和宏 大谷
ちひろ 松隈
Original Assignee
富士ゼロックス株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士ゼロックス株式会社 filed Critical 富士ゼロックス株式会社
Priority to JP2010052068A priority Critical patent/JP5577763B2/en
Publication of JP2011188293A publication Critical patent/JP2011188293A/en
Application granted granted Critical
Publication of JP5577763B2 publication Critical patent/JP5577763B2/en
Application status is Active legal-status Critical
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像処理装置、画像処理システム、及び画像処理プログラムに関する。 The present invention relates to an image processing apparatus, an image processing system, and an image processing program.

特許文献1には、画像から文字列を抽出する文字列抽出装置であって、入力した画像から画素の色に基づいて、画素の色が連なる連結成分を抽出する連結成分抽出手段と、連結成分の相対的位置、および、連結成分の太さに基づいて、連結成分を共通の文字列または文字列群を構成する可能性が高いグループにわけるグルーピング手段と、グループ毎に文字認識処理を行い、その結果の書く文字の第1位認識候補の距離値に基づいてグループの文字認識度を決める文字認識手段と、グループの文字認識度にグループが占める矩形領域の面積によって重み付けしたものをグループの評価値とし、全てのグループの組合せについてグループの評価値の和を組合せの評価値とする組合せ評価手段と、組合せの評価値が最も高いグループの組合せを文 Patent Document 1, a character string extraction apparatus for extracting a character string from an image, on the basis of the input image to the color of the pixel, and a connecting component extracting means for extracting a connected component the color of pixels is contiguous, connected components the relative positions of, and, based on the thickness of the connecting component, perform a grouping means for dividing the likely groups constituting a common string or group of connected components, a character recognition process for each group, evaluation of the results and the character recognition means for determining the character recognition level of a group based on the distance value of the first of recognition candidate characters writing, groups those weighted by the area of ​​the rectangular area in which the group occupies the character recognition level of the group a value, text and combination evaluation means for the sum of the evaluation values ​​of groups and evaluation values ​​of the combination for the combination of all groups, the combination of the evaluation value of the combination is the highest group 列として抽出する文字列抽出手段と、を備えることを特徴とする文字列抽出装置が記載されている。 Character string extraction apparatus characterized by comprising: a character string extraction means for extracting as a column, a is described.

特開平11−238098号公報 JP 11-238098 discloses

本発明は、文字の背景領域の色を考慮せずに文字を統合する場合に比べて、元の画像に近い画像が再現される、画像処理装置、画像処理システム、及び画像処理プログラムを提供することを目的とする。 The present invention, as compared to integrate the characters without considering the color of the background area of ​​the character, the image is reproduced closer to the original image, to provide an image processing apparatus, an image processing system, and image processing program and an object thereof.

上記目的を達成するために、請求項1に記載の画像処理装置は、画像データから複数の文字を抽出する第1の抽出手段と、前記第1の抽出手段で抽出された文字の背景となる背景領域の色を文字毎に抽出する第2の抽出手段と、前記第1の抽出手段で抽出された文字を予め定められた方向毎の第1の文字群に統合する第1の統合手段と、 前記第1の文字群毎に、前記第2の抽出手段で抽出された背景領域の色の頻度情報と、前記第1の文字群の背景となる背景領域の面積に対する前記第2の抽出手段で抽出された背景領域の色を示す領域の面積の割合とに基づいて、前記第1の文字群毎に当該第1の文字群の背景となる背景領域の色を決定する決定手段と、前記決定手段で決定した背景領域の色が同一とみなせる、隣接する前記第1の統合手 In order to achieve the above object, an image processing apparatus according to claim 1, comprising a first extraction means for extracting a plurality of characters from the image data, the background of the first character extracted by the extraction means second extracting means for extracting the color of the background area for each character, a first integrating means for integrating the first character group of the first extraction means predetermined different directions the extracted character the every first character group, said second color frequency information of the background region extracted by the extraction means, the first of the to the area of the background region as the background of the character group second extracting means in on the basis of the ratio of the area of the region indicating the color of the extracted background region, and determining means for determining the color of the first background to become the background region of the first character group for each character group, the the color of the background area determined by determination means causes identical to everyone, the first integrated hand adjacent で統合された前記第1の文字群が複数の場合には該第1の文字群を、第2の文字群に統合する第2の統合手段と、を備える。 In the case it integrated the first group of characters of the plurality comprises a second integrating means for integrating the first character group, the second group of characters, the.

請求項に記載の画像処理装置は、請求項に記載の画像処理装置において、前記第1の抽出手段で抽出された文字に関する情報を文字毎に抽出する第3の抽出手段を備え、前記第1の統合手段は、前記第3の抽出手段で抽出された文字に関する情報が同一であるとみなせる、予め定められた方向に隣接する文字を統合する。 The image processing apparatus according to claim 2, in the image processing apparatus according to claim 1, comprising a third extraction means for extracting information about the first character extracted by the extraction means for each character, the first integration means can be regarded as information related to the third character extracted by the extraction means are the same, to integrate the character adjacent to the predetermined direction.

請求項に記載の画像処理装置は、請求項に記載の画像処理装置において、前記文字に関する情報は、文字同士の距離及び文字の大きさを含む。 The image processing apparatus according to claim 3, in the image processing apparatus according to claim 2, information on the character, including distance and character size of the characters with each other.

請求項に記載の画像処理装置は、請求項に記載の画像処理装置において、前記文字に関する情報は、文字の色を含む。 The image processing apparatus according to claim 4, in the image processing apparatus according to claim 3, information on the character, including character color.

請求項に記載の画像処理装置は、請求項1から請求項のいずれか1項に記載の画像処理装置において、予め文字群の数が設定される設定手段と、前記設定手段に設定されている文字群の数に基づいて、前記第2の統合手段で前記第1の文字群を前記第2の文字群に統合するか否かを判定し、前記第2の文字群に統合しない場合は、前記第1の文字群を前記第2の文字群に統合しないように前記第2の統合手段を制御する制御手段と、を備える。 The image processing apparatus according to claim 5, in the image processing apparatus according to any one of claims 1 to 4, a setting unit number of pre-character group is set, it is set in the setting means and based on the number of character groups are, if said second of said first group of characters in the integration unit determines whether or not integrated into the second group of characters, not integrated into the second character group comprises a control means for controlling the second integration means so as not to integrate the first character group in said second group of characters.

請求項に記載の画像処理システムは、文字を含む画像を読み取る読取手段と、前記読取手段で読み取った画像の画像データから抽出した文字を、第1の文字群に統合し、統合された第1の文字群を第2の文字群に統合する請求項1から請求項5のいずれか1項に記載の画像処理装置と、を備える。 The image processing system according to claim 6, reading means for reading an image including a character, a character extracted from the image data of the image read by the reading means, integrated into the first character group, integrated the first character group includes the image processing apparatus according to any one of claims 1 to 5 integrated into a second character group, the.

請求項9に記載の画像処理プログラムは、 コンピュータを画像データから複数の文字を抽出する第1の抽出手段、前記第1の抽出手段で抽出された文字の背景となる背景領域の色を文字毎に抽出する第2の抽出手段、前記第1の抽出手段で抽出された文字を予め定められた方向毎の第1の文字群に統合する第1の統合手段、前記第1の文字群毎に、前記第2の抽出手段で抽出された背景領域の色の頻度情報と、前記第1の文字群の背景となる背景領域の面積に対する前記第2の抽出手段で抽出された背景領域の色を示す領域の面積の割合とに基づいて、前記第1の文字群毎に当該第1の文字群の背景となる背景領域の色を決定する決定手段と、前記決定手段で決定した背景領域の色が同一とみなせる、隣接する前記第1の統合手段で統合され The image processing program according to claim 9, first extracting means, said first character per the color of the background to become the background region of the extracted character extracting means for extracting from the image data a plurality of character computer a second extraction means for extracting a first integrating means for integrating the first character group of the first extraction means predetermined different directions the extracted characters, for each of the first character group the color frequency information of the background region extracted by the second extraction means, the color of the first is the background of the character group background region and the second background region extracted by the extraction means to the area of based on the ratio of the area of the indicated area, the color of the determination means for determining the color of the background area to the each of the character group becomes the first character group background, the background area determined by the determining means There can be regarded as the same, it is integrated with the adjacent said first integrating means 前記第1の文字群が複数の場合には該第1の文字群を、第2の文字群に統合する第2の統合手段、として実行させるためのものである。 The first group of characters if the first character group is plural, is intended to execute a second integrating means for integrating the second character group, as.

請求項1、請求項 、及び請求項に記載の発明によれば、文字の背景領域の色を考慮せずに文字を統合する場合に比べて、元の画像に近い画像が再現される。 Claim 1, according to the invention described in claim 6, and claim 7, compared to integrate the characters without considering the color of the background area of the character, the image is reproduced closer to the original image .

請求項に記載の発明によれば、文字に関する情報に基づかないで第1の文字群を統合する場合に比べて、適切に文字が第1の文字群に統合される。 According to the invention described in claim 2, compared with the case of integrating the first character group is not based on information related to the character, suitably characters are integrated in the first character group.

請求項に記載の発明によれば、文字同士の距離及び文字の大きさに基づかないで第1の文字群を統合する場合に比べて、適切に文字が第1の文字群に統合される。 According to the invention described in claim 3, in comparison with the case of integrating the first character group is not based on the distance and the character size of a character between appropriately characters are integrated in the first character group .

請求項に記載の発明によれば、文字の色に基づかないで第1の文字群を統合する場合に比べて、適切に文字が第1の文字群に統合される。 According to the invention of claim 4, compared to the case of integrating the first character group is not based on the color of text, suitably characters are integrated in the first character group.

請求項に記載の発明によれば、第1の文字群を第2の文字群に統合しないように第2の統合手段を制御しない場合に比べて、文字群の数が出力先の制限を超えることを抑制する。 According to the invention of claim 5, the first character group as compared with the case of not controlling the second integration means so as not to integrate into a second character group, the number of character group is the destination limit suppresses be exceeded.

本実施の形態に係る画像処理装置の概略構成の一例を示す機能ブロック図である。 Is a functional block diagram showing an example of a schematic configuration of an image processing apparatus according to this embodiment. 本実施の形態に係る画像処理装置で実行される文字統合処理の流れの一例の概略を示すブロック図である。 Is a block diagram showing an outline of an example of the flow of letters integration process executed by the image processing apparatus according to this embodiment. 本実施の形態に係る画像処理装置の制御部で実行される文字統合処理の具体的一例のフローチャートである。 It is a flowchart of a specific example of a character integration processing executed by the control unit of the image processing apparatus according to this embodiment. 本実施の形態に係る画像処理装置で実行される第2の文字統合処理、及びその効果の具体的例であり、第1行目の背景色が第2行目及び第3行目と異なり、文字色が同一であり、第1行目と第2行目との距離が近接している場合を説明するための説明図である。 Second character combining process executed by the image processing apparatus according to this embodiment, and is a specific example of the effect, the background color of the first row is different from the second row and the third row, text color are the same, it is an explanatory diagram for explaining a case where the distance between the first row and the second row are close. 本実施の形態に係る画像処理装置で実行される第2の文字統合処理、及びその効果の具体的例であり、第1行目の背景色及び文字色が第2行目及び第3行目と異なり、第1行目と第2行目との距離が近接している場合を説明するための説明図である。 Second character combining process executed by the image processing apparatus according to this embodiment, and is a specific example of the effect, the background color and font color of the first row second row and the third row Unlike an explanatory diagram for explaining a case where the distance between the first row and the second row are close. 背景色を考慮せずに文字統合処理を行った場合の比較例を説明するための説明図である。 It is an explanatory diagram for explaining a comparative example in the case of performing character integrating process without considering the background color. 本実施の形態に係る画像処理装置で実行される第2の文字統合処理、及びその効果の具体的例であり、第1行目の背景色が第2行目及び第3行目と異なり、文字色が同一であり、第1行目と第2行目との距離が離れている場合を説明するための説明図である。 Second character combining process executed by the image processing apparatus according to this embodiment, and is a specific example of the effect, the background color of the first row is different from the second row and the third row, text color are the same, it is an explanatory diagram for explaining a case where the distance between the first row and the second row are separated. 本実施の形態に係る画像処理装置で実行される第2の文字統合処理、及びその効果の具体的例であり、第1行目の背景領域の一部分の色が他と異なる場合を説明するための説明図である。 Second character combining process executed by the image processing apparatus according to this embodiment, and is a specific example of the effect, since the color of a portion of the first row of the background area will be described a case where other different it is an illustration of. 本実施の形態に係る画像処理装置で実行される第2の文字統合処理、及びその効果の具体的例であり、第1行目〜第3行目の背景色及び文字色が同一であり、第1行目と第2行目との距離が離れている場合を説明するための説明図である。 Second character combining process executed by the image processing apparatus according to this embodiment, and is a specific example of the effect, first line to third line of the background color and text color are the same, it is an explanatory view for explaining a case where the distance between the first row and the second row are separated. 本実施の形態に係る画像処理装置で実行される第2の文字統合処理、及びその効果の具体的例であり、第1行目〜第3行目の背景色が同一であり、第1行目の文字色が第2行目及び第3行目と異なり、第1行目と第2行目との距離が近接している場合を説明するための説明図である。 Second character combining process executed by the image processing apparatus according to this embodiment, and is a specific example of the effect, a first line to third line of the background color are the same, the first row eye character color is different from the second row and the third row is an explanatory view for explaining a case where the distance between the first row and the second row are close.

以下、図面を参照して本発明の実施の形態を詳細に説明する。 Hereinafter, the embodiments of the present invention will be described in detail with reference to the accompanying drawings.

まず、本実施の形態の画像処理装置の構成について説明する。 First, the configuration of the image processing apparatus of this embodiment. 図1に、本実施の形態の画像処理装置の概略構成の一例の機能ブロック図を示す。 Figure 1 shows a functional block diagram of an example of a schematic configuration of an image processing apparatus of this embodiment.

図1に示した本実施の形態の画像処理装置は、制御部12、画像読取部14、記憶部16、オブジェクト分離部18、OCR部20、第1文字統合部22、背景色抽出部24、第2文字統合部26、フォーマット変換部28、U/I部30、及び出力部32を備えて構成されている。 The image processing apparatus of the present embodiment shown in FIG. 1, the control unit 12, the image reading unit 14, storage unit 16, an object separation section 18, OCR unit 20, the first character integrating unit 22, a background color extraction unit 24, second character integrating unit 26, and is configured to include the format converting unit 28, U / I unit 30, and an output unit 32.

制御部12は、画像処理装置10全体の制御を行うものであり、具体的には、CPU40、ROM42、及びRAM44を含んで構成されている。 Control unit 12, which controls the entire image processing apparatus 10, specifically, is configured to include a CPU 40, ROM 42, and RAM 44. CPU40で実行される処理のプログラム43は、ROM42に格納されている。 Program 43 of the processing performed by the CPU40 is stored in ROM 42. なお、本実施の形態では、プログラム43は、予め格納されている構成としているがこれに限らず、プログラム43をCD−ROMやリムーバブルディスク等の記録媒体等に記憶しておき記録媒体から制御部12にインストールするようにしてもよいし、インターネット等の通信回線を介して外部装置から制御部12にインストールするようにしてもよい。 In the present embodiment, the program 43 has a configuration that is stored in advance is not limited to this, the control unit of the program 43 from the recording medium is stored in a recording medium such as a CD-ROM or a removable disk it may be installed in 12, it may be installed from an external device to the control unit 12 via a communication line such as the Internet. RAM44は、CPU40でプログラム43を実行する際の作業用の領域を確保するものである。 RAM44 is intended to secure a space for work for performing programming 43 with CPU 40.

画像読取部14は、記録媒体上に形成されている画像を読み取って、画像データを出力する機能を有するものであり、具体的一例としては、スキャナ等が挙げられる。 The image reading unit 14 reads an image formed on a recording medium, has a function of outputting the image data, as a specific example, a scanner and the like. 記憶部16は、画像読取部14で読み取った画像データを一時的に記憶する等、画像処理に要するデータ類等を記憶する機能を有するものである。 Storage unit 16 has an equal to temporarily store the image data read by the image reading unit 14, a function of storing data and the like required for image processing.

オブジェクト分離部18は、画像読取部14で読み取った画像データから、文字画像、写真画像、及び表画像等の各オブジェクトを分離する機能を有するものである。 Object separation section 18 from the image data read by the image reading unit 14 has a function of separating a character image, photographic image, and each object in the table image, or the like.

OCR(光学的文字読取)部20は、オブジェクト分離部18で分離された文字画像から個々の文字を抽出する機能を有するものであり、一般的なOCRソフトの機能を用いればよく、特に限定されない。 OCR (optical reading character) portion 20 has a function of extracting the individual characters from the character image separated by the object separation section 18, may be used the general function of OCR software is not particularly limited . OCR部20は文字情報抽出部21を有しており、抽出された各文字の大きさ、相対的位置(文字同士の距離)、文字色の頻度情報、及び文字の書体(フォント)等を抽出する機能を有するものである。 The OCR unit 20 has a character information extracting section 21, the size of the characters are extracted, the relative position (Distance characters between), frequency information of a character color, and character font (font) and the like of the extracted It has a function to be. なお、文字情報抽出部21における文字情報抽出処理は、一般的なOCRソフトの機能等を用いるようにしてもよく、文字毎に予め定められた種類の文字情報を取得できるものであれば、特にその手法は限定されない。 The character information extraction process in the character information extracting section 21 may be used to function like a general OCR software, as long as it can acquire the predetermined type of character information for each character, in particular the technique is not limited.

第1文字統合部22は、OCR部20で抽出された文字を、文字情報抽出部21で抽出された文字情報に基づいて、文字画像が横書きの場合は、行方向に配列された隣接する文字を行に、また、文字画像が縦書きの場合は、列方向に配列された隣接する文字を列に、統合する機能を有するものである。 Character first character integrating unit 22, a character extracted by the OCR unit 20, based on the character information extracted by the character information extracting section 21, if the character image is horizontally written, adjacent arranged in the row direction in a row, also if the character image is a vertical, a character adjacent arranged in the column direction in the column, has a function to integrate.

背景色抽出部24は、各文字毎に、文字の背景となる領域の色(背景色)を抽出し、第1文字統合部22で統合された行毎、または列毎に背景色の頻度情報に基づいて、各文字行または各文字列の背景色を決定する機能を有するものである。 Background color extraction unit 24, for each character, extracts the color area to be the character of the background (background color), each row being integrated by the first character integrating unit 22 or the background color frequency information for each column, based on, and has a function of determining a background color of each character row or each string. なお、本実施の形態では、具体的一例として、文字の背景となる領域とは、各文字に外接する矩形の(文字字体を除く)領域をいう。 In this embodiment, as a specific example, the area where the character of the background, (excluding characters font) rectangle circumscribing each character refers to a region. また、背景色の頻度情報の抽出は、例えば、文字の色頻度情報の抽出と同様の手法で行えばよく、各文字毎に当該文字の背景となる領域の色頻度情報を取得できるものであれば、特にその手法は限定されない。 The extraction of the frequency information of the background color, for example, as long as may be performed in a manner similar extraction of color frequency information of the character, the color frequency information of the area to be the background of the character for each character can be obtained if, in particular, the technique is not limited.

第2文字統合部26は、各文字行の、または各文字列の背景色の情報に基づいて、隣接する行、または列を文字群に統合する機能を有するものである。 Second character integrating unit 26, the respective character lines, or on the basis of the background color information for each string has a function to integrate adjacent rows or columns, the character group.

フォーマット変換部28は、第2文字統合部26により統合された文字群の文字画像データを出力先のフォーマットに合わせた文字画像データに変換する機能を有するものである。 Format converter 28 has a function of converting the character image data combined with text image data of the character group that is integrated by the second character integrating unit 26 to the destination format.

U/I(ユーザインターフェイス)部30は、ユーザが出力先のフォーマット(ファイル形式)等を設定する機能を有するものである。 U / I (user interface) unit 30 has a function the user sets the like output destination format (file format). 出力部32は、フォーマット変換部28により出力先のフォーマットに合わせて変換されたファイルを外部の装置等に出力する機能を有するものである。 The output unit 32 has a function of outputting the converted file according to the output destination format by the format conversion unit 28 or the like to an external device.

次に、本実施の形態の画像処理装置10の動作について説明する。 Next, the operation of the image processing apparatus 10 of this embodiment. 図2は、本実施の形態の画像処理装置10で実行される文字統合処理の流れの一例の概略を示したブロック図である。 Figure 2 is a block diagram showing an outline of an example of the flow of letters integration process executed by the image processing apparatus 10 of this embodiment. 図2を参照して、文字統合処理の流れの概略を説明する。 Referring to FIG. 2, an outline of the flow of letters integration process. 画像読取部14により画像が入力されると、オブジェクト分離部18により、オブジェクト分離処理が行われ、文字画像が分離される。 When an image is inputted by the image reading unit 14, the object separation section 18, the object separation processing is performed, character images are separated. 分離された文字画像はOCR部20により各文字が抽出され、文字情報抽出部21により抽出された文字情報に基づいて第1文字統合部22で第1文字統合処理(行または列に統合する処理)が行われる。 Processing the separated character image each character is extracted by the OCR unit 20, which integrates the first character integrating unit 22 first character integration process (in the row or column based on the character information extracted by the character information extracting section 21 ) is carried out. 一方、文字情報抽出部21により抽出された文字行毎または文字列毎の文字の色頻度情報、及び背景色抽出部24により抽出された文字行毎または文字列毎の背景色の色頻度情報に基づいて、色情報抽出処理が行われ、さらに抽出された色情報に基づいて、第2文字統合部26で行または列が文字群に統合される。 On the other hand, the character color frequency information of the character information extracting section for each character lines extracted by 21 or each string, and the background color color frequency information of the background color extraction unit for each character lines extracted by 24 or each string based on the color information extraction process is performed, based on further extracted color information, a row or column are integrated into a character group in the second character integrating unit 26. 統合された文字群は、フォーマット変換部28で予め定められた出力先のフォーマットに変換されファイルに出力される。 Integrated character group is converted to a predetermined output destination format by format converter 28 is output to a file.

次に、具体的例を参照して、文字統合処理について詳細に説明する。 Next, with reference to specific examples, the character combining process will be described in detail. 図3に、本実施の形態の画像処理装置10の制御部12で実行される文字統合処理の具体的一例のフローチャートを示す。 Figure 3 shows a flowchart of a specific example of a character integration processing executed by the control unit 12 of the image processing apparatus 10 of this embodiment.

ステップ100では、画像読取部14で読み取った画像データからOCR処理により各文字を抽出し、次のステップ102では、文字情報を抽出する。 In step 100, it extracts each character by OCR processing from the image data read by the image reading unit 14, the next step 102, extracts the character information. 本実施の形態では、文字情報として、各文字の大きさ及び文字同士の距離(相対的位置)を抽出する。 In this embodiment, as the character information, it extracts each character size and distance of the characters between the (relative position). 次のステップ104では、抽出された文字情報に基づいて、第1文字統合処理を行う。 In the next step 104, based on the extracted character information, the first character integration process. 本実施の形態では、文書が横書きの場合は行方向、縦書きの場合は列方向に隣接する文字同士の距離が予め定められた範囲内の距離であり、かつ文字同士の大きさの違いが予め定められた範囲内である隣接する文字同士を文字行または文字列に統合する。 In this embodiment, the row direction if the document is written horizontally, in the case of vertical writing is the distance within the distance of a character adjacent to each other in the column direction is predetermined, and the size of the characters between differences integrating character adjacent to a within a predetermined range in character line or string. なお、第1の統合処理は、少なくとも隣接する文字同士の距離及び大きさに基づいて行えばよいが、さらに色が同一とみなせるか否かにより文字同士を統合することにより、より適切に文字同士が統合され、出力されたファイルにより画像を再現する際に、元の画像(画像読取部14が読み取った画像)により近い画像が再現される。 The first integration processing may be performed based on the distance and size of the characters with each other at least adjacent, but by further integrating the character together by whether the color can be regarded as identical, more appropriately characters together There are integrated, when reproducing an image by the output file, the image is reproduced closer to the original image (image picture reading unit 14 has read).

次のステップ106では、色情報抽出処理により、文字毎に文字の色を抽出し、第1の文字統合処理により統合された文字行または文字列毎に、文字の色頻度情報を生成する。 In the next step 106, the color information extraction process to extract the text color for each character, each first character line or string that is integrated by the character integration process to generate a color frequency information of a character. また、文字毎に当該文字の背景色を抽出し、第1の文字統合処理により統合された文字行または文字列毎に、背景色の色頻度情報を生成する。 Also, the background color of the character is extracted for each character, each first character line or string that is integrated by the character integration process to generate a color frequency information of the background color.

次のステップ108では、ステップ106で生成した各文字行または各文字列毎の文字の色頻度情報、及び背景色の色頻度情報に基づいて、各文字行または各文字列の背景色を決定する。 In the next step 108, based on the character line or character color frequency information of each character string generated in step 106, and the color frequency information of the background color, to determine the background color of each character row or each string . 例えば、生成された色頻度情報(一例としては、明度に関する頻度情報等)により、頻度がもっとも多い色を背景色として決定してもよいし、頻度順に並べたときに予め定められた順番にあたる色を背景色として決定してもよい。 For example, (as an example, frequency information concerning brightness) generated color frequency information by, to the highest color frequency may be determined as the background color, the color corresponding to a predetermined order when arranged in order of frequency the may be determined as the background color. なお、具体的一例を挙げて詳細を後述するが、文字行または文字列の領域の面積に対して、背景色の領域が予め定められた面積未満の場合は、当該背景色をその文字行または文字列の背景色として決定しない。 As will be described later in detail by way of specific example, the area of ​​the region of the character line or string, if it is less than the area defined area of ​​the background color in advance, the background color character row or not determined as the background color of a character string. このような場合は、その背景色が占める領域を別のオブジェクトとして分離して、取り扱うようにする。 In such cases, to separate the area in which the background color occupies as a separate object, so that handling.

次のステップ110では、ステップ108で決定された背景色に基づいて、各文字行または各文字列を文字群に統合する第2文字統合処理を行う。 In the next step 110, based on the background color determined in step 108 performs the second character integration processing for integrating each character row or each string to a character group. 本実施の形態では、背景色が同一とみなせる隣接する文字行同士または文字列同士を同一の文字群に統合する。 In this embodiment, integrating character line or between the string between adjacent background color can be regarded as identical to the same group of characters.

次のステップ112では、設定されている出力先のフォーマットが制限を有しているかを判断する。 In the next step 112, it is determined whether the format of the output destination set has a limit. 例えば、出力先(アプリケーション)のフォーマットによっては、文字群の数に上限値が設けられている場合がある。 For example, depending on the format of the output destination (application), there is a case where an upper limit is provided to the number of character group. また、出力先によっては、第2の統合を行わずに第1の統合のみを行った状態が望まれる場合がある。 In addition, depending on the destination, there is a case where a state where only the first integration is desired without the second integration. 本ステップでは、予め指定されている出力先や、ユーザによりU/I部30によって設定された出力先のフォーマットにこのような制限が設けられているかを判断する。 In this step, and the output destination designated in advance to determine whether this limitation to the set output destination format by a U / I unit 30 is provided by the user. 制限が設けられていない場合は、否定されてステップ118へ進む。 If restrictions are not provided, the process proceeds denied to step 118.

一方、制限が設けられている場合は、肯定されてステップ114へ進む。 On the other hand, if the restriction is provided, the process proceeds to positive has been step 114. ステップ114では、第2文字統合処理で統合された文字群の数が制限されている条件を満たしているかを判断する。 At step 114, it is determined whether the condition is satisfied the number of integrated character group in the second character integration process is limited. 満たしている場合は、肯定されてステップ118へ進む。 If you meet, the process proceeds to positive has been step 118. 一方、満たしていない場合は、ステップ116へ進み、統合方法を、出力先のフォーマットの制限を満たす方法に変更し、変更した方法に応じた文字群への統合を行った後、ステップ118へ進む。 On the other hand, if not satisfied, the process proceeds to step 116, the integration method, after changed the method that satisfies the limitation of the output destination of formats, were integrated into a character group in accordance with the modified method, the process proceeds to step 118 . 例えば、文字群の数に上限値が設けられている場合は、背景色を考慮せずに統合する方法(背景色が異なる文字行または文字列であっても同一の文字群に統合する方法)としてもよい。 For example, (how to integrate the same group of characters even background color different character rows or strings) if the upper limit on the number of character group is provided, a method to integrate without considering the background color it may be. また、上限値に達しないうちは第2文字統合処理を行い、上限値に達しそうになったらそれ以降は、背景色を考慮せずに統合する方法に変更するようにしてもよい。 Further, among which does not reach the upper limit value is carried out a second character combining process, when turned about to reach the upper limit value after that, it may be changed in how to integrate without considering the background color. また、第1の統合のみを行った状態が望まれる場合は、第2の統合は行わないことにするようにすればよい。 Also, when the state where only the first integration is desired, the second integration may be so as to not to perform.

ステップ118では、統合された文字群の画像データを出力先のフォーマットに変換し、文字データをファイルに出力した後、本処理を終了する。 In step 118, it converts the image data of the integrated character group in the destination format, after outputting the character data to a file, the process ends.

本実施の形態による第2の文字統合処理、及びその効果について具体的例を挙げて詳細に説明する。 Second character integration processing according to this embodiment, and it will be described in detail by way of specific examples of the effect. 以下、画像読取部14で読み取った文字画像の原文が横書きの文章であり、「この特許の目的を説明するために」、「資料を用意いたしました」、「確認をお願いいたします」という3つの行に第1の統合処理により統合された場合について説明する。 Below, the image reading unit 14 in the original text of the character image that has been read is a sentence of horizontal writing, that "in order to explain the purpose of this patent", "we have the documentation", "thank you for confirmation" 3 It will be described integrated by the first integrating process one row.

図4は、「資料を用意いたしました」という行(以下、第2行目という)及び「確認をお願いいたします」という行(以下、第3行目という)の背景色が同一であり、「この特許の目的を説明するために」という行(以下、第1行目という)文字の背景色が異なる場合を示している。 Figure 4 is a line that says "we have the documentation" (hereinafter, the second row that) and "thank you for confirmation" that the line (hereinafter, referred to as a third line) is the background color of the same, line "in order to describe the purpose of this patent" (hereinafter, the first line of) the background color of a character indicates a case where different. また、図4に示した例では、第1行目〜第3行目の文字色は同一であり、第1行目と第2行目との距離が近接している(同一の文字群とみなせる距離)場合を示している。 Further, in the example shown in FIG. 4, first line to third line of the character color is the same, the first row and the second row distance and are close (the same group of characters It shows the considered distance) case.

このような場合では、第2統合処理では、第1行目は他の行と統合せずに単独で1つの文字群50とし、第2行目及び第3行目を統合して1つの文字群52とする。 In such case, the second integration process, the first row is set to one character group 50 alone without integrating with other lines, integrating the second row and the third row a single character the group 52. このようにすることにより、文字群50に対して背景色の情報が付加された状態でファイルに出力されるため、再現時には、図4に示すように、原文の状態が再現される。 By doing so, since the output state information of the background color is added to the character group 50 to the file, when reproduced, as shown in FIG. 4, the state of the original is reproduced.

また、図5は、第1行目の文字色及び背景色が、第2行目及び第3行目の文字色及び背景色と異なっており、第1行目と第2行目との距離が近接している場合を示している。 Further, FIG. 5, character color and background color of the first row is different from the second row and the third row of the character color and the background color, the distance between the first row and the second row There has been shown the case in close proximity. なお、以下の図では、図示の都合上、文字の字体を斜体にすることにより、文字の色が異なることを表現している。 In the following figures, for convenience of illustration, by the font character italic, it expresses that the color of the character is different.

このような場合では、第2統合処理では、第1行目は他の行と統合せずに単独で1つの文字群54とし、第2行目及び第3行目を統合して1つの文字群56とする。 In such case, the second integration process, the first row is set to one character group 54 alone without integrating with other lines, integrating the second row and the third row a single character the group 56. このようにすることにより、文字群54に対して背景色の情報が付加された状態でファイルに出力されるため、再現時には、図5に示すように、原文の状態が再現される。 By doing so, since the output state information of the background color is added to the character group 54 to the file, when reproduced, as shown in FIG. 5, the state of the original is reproduced. なお、本実施の形態のように、背景色によらずに文字列を統合する場合、第1行目〜第3行目は1つの文字群に統合されるため、当該文字群に対して背景色の情報が付加されるため、再現時には、図5に示すようにはならず、図6に示すように、第1行目〜第3行目全ての背景色が同一となってしまい、原文とは異なる状態が再現されることになる。 Incidentally, as in this embodiment, for the case of integrating the string irrespective of the background color, the first row to third row are combined into one group of characters, background for that character group since the color information is added, at the time of reproduction, not become as shown in FIG. 5, as shown in FIG. 6, will first row to third row all background color becomes the same, original so that the different states can be reproduced from.

また、図7は、第1行目の背景色が、第2行目及び第3行目の文字色及び背景色と異なっており、文字色は同一であり、第1行目と第2行目との距離が図4及び図5の状態よりも離れている場合を示している。 Further, FIG. 7, the background color of the first row is different from the second row and the third row of the character color and background color, text color are the same, the first row and the second row the distance between the eye indicates a case where apart than in the state of FIGS.

このような場合では、第2統合処理では、第1行目は他の行と統合せずに単独で1つの文字群58とし、第2行目及び第3行目を統合して1つの文字群60とする。 In such case, the second integration process, the first row is set to one character group 58 alone without integrating with other lines, integrating the second row and the third row a single character the group 60. このようにすることにより、文字群58に対して背景色の情報が付加された状態でファイルに出力されるため、再現時には、図7に示すように、原文の状態が再現される。 By doing so, since the output state information of the background color is added to the character group 58 to the file, when reproduced, as shown in FIG. 7, the state of the original is reproduced.

このように図4〜図7を参照して説明したように、本実施の形態では、背景色が異なる文字行同士は、文字色及び文字行同士の距離にかかわらず、別の文字群に統合することにより、元の画像の状態が再現される。 As thus described with reference to FIGS. 4 to 7, in this embodiment, character lines each other background colors are different, regardless of the character color and distance of the character lines to each other, integrated into another character group by the state of the original image is reproduced.

また、図8に示すように、第1行目の背景領域の一部分が、第2行目及び第3行目の背景色と異なっている場合について説明する。 Further, as shown in FIG. 8, a portion of the first row of the background area, the case is different with the second row and the third row of the background color. 当該背景領域の一部分の占める領域の面積が、第1行目の文字領域の面積(第1行目の文字の背景領域全体の面積)に対して予め定められた割合(具体的一例としては50%)未満である場合は、第1行目〜第3行目の背景色は同一色であるとして、第2統合処理が行われる。 The area of ​​a region occupied by the portion of the background area, as a percentage (specific example that has been predetermined for the area of ​​the first row of the character area (area of ​​the entire background area of ​​the first line's characters) 50 %) than if it is a first line to third line of the background color are the same color, the second integration processing is performed. 従って、第1行目〜第3行目は1つの文字群62に統合される。 Thus, the first row to third row are combined into one character group 62. また、色が他と異なった第1行目の背景領域の一部分は、別のオブジェクト64としてファイルに出力される。 Further, a portion of the first row of the background area color different from the other is output as a separate object 64 to a file. このようにすることにより、再現時には、文字データのオブジェクト62と、オブジェクト64とが合成されるため、図8に示すように、原文の状態が再現される。 By doing so, at the time of reproduction, the object 62 character data, since where the object 64 are combined, as shown in FIG. 8, state of the original is reproduced.

またさらに、図9は、第1行目〜第3行目の文字色及び背景色が同一であり、第1行目と第2行目との距離が図4及び図5の状態よりも離れている場合を示している。 Further, FIG. 9, first line to third line of the character color and background color are the same, the distance between the first row and the second row away than the state of FIG. 4 and FIG. 5 shows a case in which. このような場合では、第2統合処理では、第1行目〜第3行目を統合して1つの文字群66とする。 In such cases, the second integration process integrates the first row to third row as one character group 66. このようにすることにより、再現時には、図9に示すように、再現される。 By doing so, at the time of reproduction, as shown in FIG. 9, it is reproduced. なお原文の状態よりも第1行目と第2行目との距離が近接した状態に再現されているが、このような相違は目立たないことが多い等の理由により、本実施の形態ではファイルの再利用性や見栄えの観点で1つの文字群に統合している。 Although than the state of the original distance between the first row and the second row is reproduced in a state of close, because, for example often these differences are not conspicuous, the file in this embodiment It is integrated into one group of characters in terms of reusability and appearance of.

また、図10は、第1行目〜第3行目の背景色が同一であり、第1行目の文字色が異なり、第1行目と第2行目との距離が近接している場合を示している。 Further, FIG. 10 is a first row to third row of the background color are the same, different first line of text color, the distance between the first row and the second row are close It shows the case. このような場合では、第2統合処理では、第1行目〜第3行目を統合して1つの文字群68とする。 In such cases, the second integration process, by integrating the first line to third line and one character group 68. このようにすることにより、再現時には、図10に示すように、再現される。 By doing so, at the time of reproduction, as shown in FIG. 10, it is reproduced.

このように図9及び図10を参照して説明したように、本実施の形態では、背景色が同一の文字行同士は、文字色及び文字行同士の距離にかかわらず、同一の文字群に統合することにより、元の画像の状態が再現される。 As thus described with reference to FIGS. 9 and 10, in this embodiment, the background color is the same character line each other, regardless of the character color and distance of the character lines to each other, the same group of characters by integrating the state of the original image is reproduced. なお、本実施の形態では文字行同士の距離にかかわらずに統合しているが、なお、見栄えが悪くなるとして予め定められた距離以上に文字行同士が離れた場合は、第2の統合手段が同一の文字群に統合しないようにしてもよい。 Although in this embodiment it is integrated into regardless of the distance between character lines, In the case where the appearance is away character line between more than predetermined distance to a worse, second integration means There may not be integrated into the same group of characters.

以上説明したように本実施の形態では、画像読取部14で読み取った画像データの文字画像からOCR部20で文字を抽出し、文字情報抽出部21で抽出された文字情報である文字の大きさ及び相対的位置に基づいて、抽出された文字を第1文字統合部22が文字行または文字列に統合する。 In the present embodiment as described, to extract characters in OCR unit 20 from the character image of the image data read by the image reading unit 14, a character information extracted by the character information extracting section 21 character size or and based on the relative position, the extracted character is first character integrating unit 22 integrates the character line or string. 背景色抽出部24で各文字毎に背景となる領域の色(背景色)を抽出して、統合された文字行毎または文字列毎に背景色の頻度情報を生成する。 Extracts the color area to be the background for each character in the background color extraction section 24 (the background color), to produce a frequency information of the background color for each integrated character line or every string. また、文字情報抽出部21で抽出された文字の色に基づいて各文字行毎または各文字列毎に文字の色頻度情報を生成する。 Further, it generates each character line or each color frequency information of the character in each string based on the color of the characters extracted by the character information extracting section 21. さらに文字行または文字列毎に、背景色の頻度情報及び文字色の頻度情報に基づいて、当該文字行または文字列の背景色を決定する。 Furthermore every character lines or characters, based on the frequency information and character color frequency information of the background color, to determine the background color of the character row or string. 第2文字統合部26は、決定された背景色が同じ隣接する文字行または文字列を文字群に統合する。 Second character integrating unit 26, the background color determined to integrate character line or string to the same adjacent character group.

このようにすることにより、文字群毎に背景色の情報が付加された状態でファイルに出力されるため、文字の背景領域の色を考慮せずに文字を統合する場合に比べて、元の画像に近い画像が再現される、 By doing so, since the state information of the background color is added to each character group is output to a file, as compared to integrate the characters without considering the color of the background area of ​​the character, the original images are reproduced closer to the image,
また、本実施の形態では、第2文字統合部26で統合された文字群の数が設定されている出力先のフォーマットの制限を超える場合は、制限を越えない数以内に文字群の数を収めるように、統合された文字群の数が少なくなる文字の統合方法に文字の統合方法を変更するため、文字群の数が出力先の制限を超えることを抑制する。 Further, in this embodiment, when the number of integrated character group in the second character integrating unit 26 exceeds the limit of the destination format is set, the number of character groups within a few not exceeding limits fit manner, for changing the integrated number of character group is reduced character how to integrate the method in character integration, it suppresses the number of character groups exceeds the output destination of the restriction. 従って、再利用性が向上される。 Therefore, reusability is improved.

なお、本実施の形態では画像読取部14で読み取った画像データから抽出した文字を文字群に統合する文字統合処理を行っているがこれに限らず、例えば、他の装置から入力された画像データをから抽出した文字を文字群に統合する文字統合処理を行う画像処理装置10であってもよい。 In the present embodiment has performed the character integrating process for integrating text extracted from image data read by the image reading unit 14 to the character group is not limited to this, for example, image data input from another apparatus it may be an image processing apparatus 10 performing character integration processing for integrating the extracted character in a group from the. なおこの場合、画像読取部14は、必須の構成ではない。 It should be noted that in this case, the image reading unit 14 is not an essential element.

なお、本実施の形態は具体的一例を示したものであり、本発明を制限するものではない。 Note that this embodiment are those showing a specific example and is not intended to limit the present invention.

10 画像処理装置12 制御部14 画像読取部20 OCR部21 文字情報抽出部22 第1文字統合部24 背景色抽出部26 第2文字統合部28 フォーマット変換部30 U/I部43 プログラム 10 image processing apparatus 12 control unit 14 the image reading unit 20 OCR unit 21 character information extracting section 22 first character integrating unit 24 background color extraction unit 26 second character integrating unit 28 format conversion unit 30 U / I unit 43 program

Claims (7)

  1. 画像データから複数の文字を抽出する第1の抽出手段と、 First extracting means for extracting a plurality of characters from the image data,
    前記第1の抽出手段で抽出された文字の背景となる背景領域の色を文字毎に抽出する第2の抽出手段と、 Second extracting means for extracting the color of the background and becomes the background area of ​​the character extracted by the first extracting means for each character,
    前記第1の抽出手段で抽出された文字を予め定められた方向毎の第1の文字群に統合する第1の統合手段と、 A first integrating means for integrating the first character group for each of the first direction defined the extracted character advance in the extraction means,
    前記第1の文字群毎に、前記第2の抽出手段で抽出された背景領域の色の頻度情報と、前記第1の文字群の背景となる背景領域の面積に対する前記第2の抽出手段で抽出された背景領域の色を示す領域の面積の割合とに基づいて、前記第1の文字群毎に当該第1の文字群の背景となる背景領域の色を決定する決定手段と、 For each of the first group of characters, in the color frequency information of the background region extracted by the second extraction means, said second extracting means to the area of the background to become the background region of the first character group based on the ratio of the area of the region indicating the color of the extracted background region, and determining means for determining the color of the first background to become the background region of the first character group for each character group,
    前記決定手段で決定した背景領域の色が同一とみなせる、隣接する前記第1の統合手段で統合された前記第1の文字群が複数の場合には該第1の文字群を、第2の文字群に統合する第2の統合手段と、 The color of the background area determined by the determining means causes identical to all, the first character group in the case the integrated adjacent said first integrating means the first character group is plural, the second second integrating means for integrating the character group of
    を備えた画像処理装置。 The image processing apparatus provided with.
  2. 前記第1の抽出手段で抽出された文字に関する情報を文字毎に抽出する第3の抽出手段を備え、前記第1の統合手段は、前記第3の抽出手段で抽出された文字に関する情報が同一であるとみなせる、予め定められた方向に隣接する文字を統合する、請求項1に記載の画像処理装置。 A third extracting means for extracting information on the first character that has been extracted by the extraction means for each character, the first integration means, information relating to the third character extracted by the extraction means of the same regarded as being to integrate the character adjacent to the predetermined direction, the image processing apparatus according to claim 1.
  3. 前記文字に関する情報は、文字同士の距離及び文字の大きさを含む、請求項に記載の画像処理装置。 Information about the characters, including the distance and character size of a character between the image processing apparatus according to claim 2.
  4. 前記文字に関する情報は、文字の色を含む、請求項に記載の画像処理装置。 Information about the characters, including the color of the text, the image processing apparatus according to claim 3.
  5. 予め文字群の数が設定される設定手段と、 Setting means for preliminarily number of character group is set,
    前記設定手段に設定されている文字群の数に基づいて、前記第2の統合手段で前記第1の文字群を前記第2の文字群に統合するか否かを判定し、前記第2の文字群に統合しない場合は、前記第1の文字群を前記第2の文字群に統合しないように前記第2の統合手段を制御する制御手段と、 Based on the number of character group set in the setting means, said second of said first group of characters in the integration unit determines whether to integrate the second character group, the second If you do not integrate into the character group, and control means for controlling said second integrating means so as not to integrate the first character group in said second group of characters,
    を備えた請求項1から請求項のいずれか1項に記載の画像処理装置。 The image processing apparatus according to any one of claims 1 to 4 comprising a.
  6. 文字を含む画像を読み取る読取手段と、 Reading means for reading an image including a character,
    前記読取手段で読み取った画像の画像データから抽出した文字を、第1の文字群に統合し、統合された第1の文字群を第2の文字群に統合する請求項1から請求項のいずれか1項に記載の画像処理装置と、 Characters extracted from the image data of the image read by the reading means, integrated into the first character group, claims 1 to integrate the first character group, which is integrated in the second character group according to claim 5 an image processing apparatus according to any one,
    を備えた画像処理システム。 The image processing system having a.
  7. コンピュータを The computer
    画像データから複数の文字を抽出する第1の抽出手段、 First extracting means for extracting a plurality of characters from the image data,
    前記第1の抽出手段で抽出された文字の背景となる背景領域の色を文字毎に抽出する第2の抽出手段、 Second extracting means for extracting the color of the background region as the background of the character extracted by the first extracting means for each character,
    前記第1の抽出手段で抽出された文字を予め定められた方向毎の第1の文字群に統合する第1の統合手段、 First integrating means for integrating the first character group for each of the first direction defined the extracted character advance in the extraction means,
    前記第1の文字群毎に、前記第2の抽出手段で抽出された背景領域の色の頻度情報と、前記第1の文字群の背景となる背景領域の面積に対する前記第2の抽出手段で抽出された背景領域の色を示す領域の面積の割合とに基づいて、前記第1の文字群毎に当該第1の文字群の背景となる背景領域の色を決定する決定手段と、 For each of the first group of characters, in the color frequency information of the background region extracted by the second extraction means, said second extracting means to the area of the background to become the background region of the first character group based on the ratio of the area of the region indicating the color of the extracted background region, and determining means for determining the color of the first background to become the background region of the first character group for each character group,
    前記決定手段で決定した背景領域の色が同一とみなせる、隣接する前記第1の統合手段で統合された前記第1の文字群が複数の場合には該第1の文字群を、第2の文字群に統合する第2の統合手段、 Considered color of the background region is the same as determined by the determining means, the first character group when integrated the first character group in an adjacent said first integration means a plurality of second second integrating means for integrating the character group,
    として実行させるための画像処理プログラム。 The image processing program for executing a.
JP2010052068A 2010-03-09 2010-03-09 Image processing apparatus, an image processing system, and image processing program Active JP5577763B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010052068A JP5577763B2 (en) 2010-03-09 2010-03-09 Image processing apparatus, an image processing system, and image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010052068A JP5577763B2 (en) 2010-03-09 2010-03-09 Image processing apparatus, an image processing system, and image processing program

Publications (2)

Publication Number Publication Date
JP2011188293A JP2011188293A (en) 2011-09-22
JP5577763B2 true JP5577763B2 (en) 2014-08-27

Family

ID=44794028

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010052068A Active JP5577763B2 (en) 2010-03-09 2010-03-09 Image processing apparatus, an image processing system, and image processing program

Country Status (1)

Country Link
JP (1) JP5577763B2 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3748164B2 (en) * 1998-02-06 2006-02-22 富士通株式会社 The pattern extracting device
JP4275866B2 (en) * 2000-01-27 2009-06-10 富士通株式会社 Apparatus and method for extracting a character string pattern from the color image
JP4337251B2 (en) * 2000-09-04 2009-09-30 コニカミノルタビジネステクノロジーズ株式会社 Image processing apparatus, image processing method and an image processing program recorded computer-readable recording medium
JP4089905B2 (en) * 2004-06-22 2008-05-28 株式会社リコー Image processing apparatus, image processing method, program, and information recording medium
JP4817108B2 (en) * 2004-11-05 2011-11-16 富士ゼロックス株式会社 Image processing apparatus, image processing method and image processing program
JP2007317034A (en) * 2006-05-27 2007-12-06 Ricoh Co Ltd Image processing apparatus, image processing method, program, and recording medium

Also Published As

Publication number Publication date
JP2011188293A (en) 2011-09-22

Similar Documents

Publication Publication Date Title
JP4600491B2 (en) Image processing apparatus and image processing program
JP4845715B2 (en) Image processing method, image processing apparatus, program, and storage medium
JP2011159283A (en) Method and apparatus for authenticating printed document using image comparison at a plurality of levels based on document characteristic
CN102685466A (en) Adaptive video capture decode system
JPH0721319A (en) Automatic asian language determining device
KR101037458B1 (en) Image processing apparatus, image processing method, and storage medium
JP5528121B2 (en) Image processing apparatus, image processing method, and program
JP2006079220A (en) Image retrieval device and method
US20070081179A1 (en) Image processing device, image processing method, and computer program product
JPH076206A (en) Automatic character classifying device
US7321688B2 (en) Image processor for character recognition
JP4817821B2 (en) An image processing apparatus and a control method thereof, and computer program and computer readable storage medium
CN101360193A (en) Video subtitle processing apparatus and method
JP2002042143A (en) Frame recognition device and recording medium
JP2010033541A (en) Image processing apparatus and method
JP4383157B2 (en) An image processing apparatus, program and storage medium
JP4920814B2 (en) Image processing method, apparatus and a recording medium
JP4442562B2 (en) Printing device and an output device, output method, program
JP2006085665A (en) Image processing device, image processing program, storage medium, image processing method, and image forming apparatus
JP4232679B2 (en) Image forming apparatus and program
AU2009200948B2 (en) Image processing apparatus, image processing method and image processing program
JP3711810B2 (en) Image converter, storage medium and image conversion method
CN102782702B (en) Paragraph recognition in an optical character recognition (OCR) process
US8289562B2 (en) Image processing apparatus, method and recording medium
JP5017031B2 (en) Image processing apparatus, image processing method, image processing program, and a storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140114

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140610

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140623

R150 Certificate of patent or registration of utility model

Ref document number: 5577763

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150