JP2002366899A - Method and device for character information recognition - Google Patents

Method and device for character information recognition

Info

Publication number
JP2002366899A
JP2002366899A JP2001171484A JP2001171484A JP2002366899A JP 2002366899 A JP2002366899 A JP 2002366899A JP 2001171484 A JP2001171484 A JP 2001171484A JP 2001171484 A JP2001171484 A JP 2001171484A JP 2002366899 A JP2002366899 A JP 2002366899A
Authority
JP
Japan
Prior art keywords
character
recognition
information
majority decision
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001171484A
Other languages
Japanese (ja)
Inventor
Takahisa Matsushima
貴久 松島
Koichi Saito
貢市 斎藤
Kojiro Hara
香次郎 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toppan Inc
Original Assignee
Toppan Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toppan Printing Co Ltd filed Critical Toppan Printing Co Ltd
Priority to JP2001171484A priority Critical patent/JP2002366899A/en
Publication of JP2002366899A publication Critical patent/JP2002366899A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method and a device for character information recognition which can efficiently detect an error in character recognition and correct character data even if the number of recognized deviates. SOLUTION: For the recognizing method for recognizing character information from image information, a plurality of optical character recognition devices are used and if characters recognized by the optical character recognition devices are different, a character recognized by making a majority decision among the optical character recognition devices is determined. One arbitrary optical character recognition device among the optical character recognition devices is determined as a standard optical character device and the majority decision is made while the recognition results of other optical character recognition devices having performed recognition different in the character recognition number of a row-by-row or column-by-column character recognition from the recognition result of the standard device are excluded from reference to the majority decision making.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は文字を含む画像情報
から文字パターンのデータ(以下文字データとする)を
認識する文字情報認識方法に関し、特に画像から光学的
に画像情報を読み取り、文字データを認識する光学的文
字認識装置(以下OCRとする)及びこの文字認識のエ
ラーの検出と文字データの修正を行う文字情報認識方法
及び装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character information recognizing method for recognizing character pattern data (hereinafter referred to as character data) from image information including characters, and more particularly, to optically reading image information from an image and reconstructing the character data. The present invention relates to an optical character recognition device (hereinafter referred to as OCR) for recognition, and a character information recognition method and device for detecting an error in character recognition and correcting character data.

【0002】[0002]

【従来の技術】近年になり、急速に印刷におけるプリプ
レスのDTP化が進み、画像情報からの文字データの読
み取りも大量に行われるようになってきた。それに伴
い、0CRによる文字認識も精度を要求されるようにな
ってきているが、読み取りエラーを完全になくす有効な
手段は未だに無い。このため、文字認識のエラーの検出
と文字データの修正を人手により行う必要があり、時間
や労力がかさむものとなっていた。
2. Description of the Related Art In recent years, the use of DTP in prepress in printing has rapidly progressed, and a large amount of character data has been read from image information. Accordingly, the accuracy of character recognition by 0CR is also required to be accurate, but there is still no effective means for completely eliminating a reading error. For this reason, it is necessary to manually detect an error in character recognition and correct character data, which increases time and labor.

【0003】一方、複数のOCRを用いて、読み取りエ
ラーを相互補完する多数決による文字情報認識を決定す
る方法が知られている。しかしながらこの方法でも、文
字フォントとその大きさ、行間隔、欧文フォントの挿入
など、文字位置のズレにより文字1つが認識されなかっ
たり、本来1つの文字が2つに認識されることが発生す
る。そのような場合、多数決による文字認識では、その
ような文字認識数のズレが発生した以降の文字に関し
て、正確に認識しているものも多数決では違う文字を認
識したものとされてしまうという不都合が発生してしま
う。
On the other hand, there is known a method of determining character information recognition by majority decision using a plurality of OCRs to mutually complement reading errors. However, even with this method, one character may not be recognized or two characters may be originally recognized due to a character position shift such as insertion of a character font and its size, line spacing, and Western font. In such a case, in character recognition by majority vote, the inconvenience that the characters recognized correctly after the occurrence of such a difference in the number of recognized characters is regarded as a different character by majority rule. Will occur.

【0004】[0004]

【発明が解決しようとする課題】本発明はこのような問
題点を解決するためになされたものであり、その課題と
するところは、文字認識数がズレたものであっても、文
字認識のエラーの検出と文字データの修正を効率よく行
うことを可能とする文字情報認識方法及び文字情報認識
装置を提供することにある。
SUMMARY OF THE INVENTION The present invention has been made to solve such a problem, and an object thereof is to solve the problem of character recognition even if the number of character recognition is shifted. It is an object of the present invention to provide a character information recognizing method and a character information recognizing device capable of efficiently detecting an error and correcting character data.

【0005】[0005]

【課題を解決するための手段】本発明はこの課題を解決
するため、すなわち請求項1記載の発明は、画像情報か
ら文字情報を認識する認識方法で複数の光学的文字認識
装置を用い、前記複数の光学的文字認識装置間で認識さ
れた文字の相違がある場合、複数の光学的文字認識装置
間の多数決によって認識された文字を決定する文字情報
認識方法において、前記複数の光学的文字認識装置から
任意の1つを標準の光学的文字認識装置とし、その認識
結果に対するその他の光学的文字認識装置の、行または
列単位での文字認識結果の文字認識数が異なる認識をし
た前記その他の光学的文字認識装置の認識結果を多数決
の参照から除いて多数決を行うことを特徴とする文字情
報認識方法である。
According to the present invention, there is provided a method for recognizing character information from image information using a plurality of optical character recognition devices. In the character information recognition method for determining a character recognized by a majority decision between a plurality of optical character recognition devices when there is a difference in characters recognized between the plurality of optical character recognition devices, the plurality of optical character recognition Any one of the devices may be a standard optical character recognition device, and the other optical character recognition devices for the recognition result may recognize the different number of character recognition of the character recognition result in units of rows or columns. This is a character information recognition method characterized by performing a majority decision by excluding a recognition result of an optical character recognition device from a majority decision reference.

【0006】本発明はこの手段により、行または列単位
で文字認識数が一致するもののみで多数決を行うので、
常に比較する認識する文字が一致した状態で多数決を行
うことが可能となり、より正確な文字認識を行うことが
可能となる。
According to the present invention, by this means, a majority decision is made only for those having the same character recognition number for each row or column.
It is possible to make a majority decision in a state where the characters to be compared always match, and it is possible to perform more accurate character recognition.

【0007】また請求項2記載の発明は、画像情報から
文字情報を認識する認識方法で複数の光学的文字認識装
置を用い、前記複数の光学的文字認識装置間で認識され
た文字の相違がある場合、複数の光学的文字認識装置間
の多数決によって認識された文字を決定する文字情報認
識方法において、前記複数の光学的文字認識装置から任
意の1つを標準の光学的文字認識装置とし、その認識結
果に対するその他の光学的文字認識装置の、行または列
単位での文字認識結果の一致率を測定し、一致率が所定
値以下の場合、その行または列に関する前記その他の光
学的文字認識装置の認識結果を多数決の参照から除いて
多数決を行うことを特徴とする文字情報認識方法であ
る。
According to a second aspect of the present invention, there is provided a recognition method for recognizing character information from image information, wherein a plurality of optical character recognition devices are used. In some cases, in a character information recognition method for determining a character recognized by majority vote between a plurality of optical character recognition devices, any one of the plurality of optical character recognition devices as a standard optical character recognition device, The other optical character recognition device for the recognition result measures the matching rate of the character recognition result in units of rows or columns, and when the matching rate is equal to or less than a predetermined value, the other optical character recognition for the row or column. This is a character information recognition method characterized in that a majority decision is made by excluding a recognition result of the apparatus from a majority decision reference.

【0008】本発明はこの手段により、行または列単位
の末尾近傍で文字認識数がずれた場合の認識結果も多数
決の対象として採用することが可能となり、より正確な
文字認識を行うことが可能となる。
According to the present invention, by this means, the recognition result when the character recognition number is shifted near the end of each row or column can be adopted as a majority decision object, and more accurate character recognition can be performed. Becomes

【0009】また請求項3記載の発明は、前記画像情報
と、前記文字情報を前記多数決の結果を文字毎に色分け
して、階層表示にして重ねて表示することを特徴とする
請求項1、2のいずれか記載の文字情報認識方法であ
る。
According to a third aspect of the present invention, the image information and the character information are displayed in a hierarchical display by color-coding the result of the majority decision for each character. 2. The character information recognition method according to any one of 2.

【0010】本発明はこの手段により、多数決の結果を
色分けして、元の画像情報の文字と重ねて表示すること
で、画像情報での文字の比較で未時認識のエラーの検出
に際して多数決の結果を視覚的に認識することが可能と
なり、エラーの検出がさらに容易に可能となる。
According to the present invention, by this means, the result of the majority decision is color-coded and superimposed and displayed on the character of the original image information, so that the comparison of the character in the image information detects the unrecognized error at the time of the majority decision. The result can be visually recognized, and the error can be more easily detected.

【0011】また請求項4記載の発明は、前記多数決の
結果の文字毎の色分けを、前記一致率毎に色階調を変化
させて表示することを特徴とする請求項3記載の文字情
報認識方法である。
According to a fourth aspect of the present invention, in the character information recognition apparatus as set forth in the third aspect, the color classification of each character as a result of the majority decision is displayed by changing a color gradation for each of the coincidence rates. Is the way.

【0012】本発明はこの手段により、一致率毎に色階
調を変化させて表示することにより、一致率の結果を視
覚的に認識することが可能となり、エラーの検出がさら
に容易に可能となる。
According to the present invention, it is possible to visually recognize the result of the coincidence rate by changing the color gradation for each coincidence rate and displaying the result, thereby making it easier to detect an error. Become.

【0013】また請求項5記載の発明は、前記画像情報
から文字情報を認識するその他の複数の手段と、前記1
つの手段の文字情報の認識結果と前記その他の複数の手
段の文字情報の認識結果の多数決を行うに関して、認識
結果の1行または1列単位で認識された文字数を求め
て、前記その他の複数の手段の文字情報の認識結果が前
記1つの手段の文字情報の認識結果と一致しない場合、
その行または列に関する前記その他の文字認識手段の認
識結果を多数決の参照から除いて多数決を行う手段と、
前記画像情報と、前記文字情報を前記多数決の結果を文
字毎に色分けして、階層表示にして重ねて表示する手段
と、前記文字パターンを修正可能とする手段と、を有す
ることを特徴とする文字情報認識装置である。
According to a fifth aspect of the present invention, there is provided the image processing apparatus according to the first aspect of the invention, further comprising:
Regarding the majority decision between the recognition result of the character information of one means and the recognition result of the character information of the other plurality of means, the number of characters recognized in one line or one column of the recognition result is obtained, and When the recognition result of the character information of the means does not match the recognition result of the character information of the one means,
Means for performing a majority vote by excluding the recognition result of the other character recognition means for the row or column from the majority vote reference,
The image information, the character information, means for color-coding the result of the majority decision for each character, displaying the information in a hierarchical display in a superimposed manner, and means for correcting the character pattern. It is a character information recognition device.

【0014】本発明はこの手段により、行または列単位
で文字認識数が一致するもののみで多数決を行うので、
常に比較する認識する文字が一致した状態で多数決を行
うことが可能となり、より正確な文字認識を行うことが
可能となる。
According to the present invention, by this means, a majority decision is made only for those having the same character recognition number in row or column units.
It is possible to make a majority decision in a state where the characters to be compared always match, and it is possible to perform more accurate character recognition.

【0015】また請求項6記載の発明は、画像情報から
文字情報を認識する1つの手段と、前記画像情報から文
字情報を認識するその他の複数の手段と、前記1つの手
段の文字情報の認識結果と前記その他の複数の手段の文
字情報の認識結果の多数決を行うに関して、前記その他
の複数の手段の文字情報の認識結果と前記1つの手段の
文字情報の認識結果の1行または1列単位の一致率を求
めて、一致率が所定値以下の場合、その行または列に関
する前記その他の文字認識手段の認識結果を多数決の参
照から除いて多数決を行う手段と、前記画像情報と、前
記文字情報を前記多数決の結果を文字毎に色分けして、
階層表示にして重ねて表示する手段と、前記文字パター
ンを修正可能とする手段と、を有することを特徴とする
文字情報認識装置である。
According to a sixth aspect of the present invention, there is provided one means for recognizing character information from image information, a plurality of other means for recognizing character information from the image information, and the character information recognition of the one means. Regarding the majority decision of the result and the character information recognition result of the other plurality of means, one line or one column unit of the character information recognition result of the other plurality of means and the character information recognition result of the one means Means for performing a majority decision by excluding the recognition result of the other character recognition means for the row or column from reference to a majority decision, when the match rate is equal to or less than a predetermined value, the image information, and the character The information is color-coded by character for the result of the majority decision,
A character information recognizing device comprising: means for displaying a hierarchical display in a superimposed manner; and means for enabling the character pattern to be corrected.

【0016】本発明はこの手段により、行または列単位
の末尾近傍で文字認識数がずれた場合の認識結果も多数
決の対象として採用することが可能となり、より正確な
文字認識を行うことが可能となる。
According to the present invention, by this means, the recognition result when the character recognition number is shifted near the end of each row or column can be adopted as a majority decision object, and more accurate character recognition can be performed. Becomes

【0017】[0017]

【発明の実施の形態】以下、本発明を図面に基づき詳細
に説明する。図1に本発明の一実施例における、文字情
報認識方法の工程を示す。まず画像情報となる原稿デー
タ1を標準となるOCR1、およびその他のOCR2,
3,4において文字認識を行う。画像が紙媒体に示され
たものである場合は、画像情報の読み取りを1つのスキ
ャナーで読み取ってデータ化してからから複数のOCR
ソフトで認識させても良いし、複数のスキャナーで読み
取って、それをそれぞれOCRソフトで認識させても良
い。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, the present invention will be described in detail with reference to the drawings. FIG. 1 shows steps of a character information recognition method according to an embodiment of the present invention. First, original data 1 serving as image information is converted into a standard OCR 1 and other OCRs 2.
Character recognition is performed in 3 and 4. If the image is shown on a paper medium, the image information is read by one scanner and converted into data, and then a plurality of OCRs are read.
It may be recognized by software, or may be read by a plurality of scanners and each of them may be recognized by OCR software.

【0018】次いで、各OCRソフトにおいて、最初の
1行または1行の、1行または1列毎の文字列における
文字認識数をカウントする。次いで、標準となるOCR
ソフトの文字認識数と他のOCRの文字認識数を比較す
る。一致したものが1つもない場合は、その行全体の文
字を比較対象外文字として色分けして標準OCRで認識
した文字を表示して次の行の処理に移る。
Next, in each OCR software, the number of recognized characters in the first one line or one line of a character string in each line or column is counted. Next, the standard OCR
The character recognition number of the software is compared with the character recognition number of another OCR. If there is no match, the characters of the entire line are color-coded as non-comparison characters, the characters recognized by the standard OCR are displayed, and the process proceeds to the next line.

【0019】文字認識数が一致したOCRが存在する場
合は、その中で各文字につき多数決を行う。全部が一致
した場合は全一致文字として、多数決の結果が標準OC
Rに一致した場合は標準文字一致文字として、多数決の
結果が標準文字と一致しなかった場合は標準文字外文字
として、それぞれ色分けして、標準OCRで認識した文
字を表示させる。その後、次の文字に移り、次の文字が
なければ次の行の文字認識数の比較に移る。
If there is an OCR whose character recognition number matches, a majority decision is made for each character in the OCR. If all match, the result of majority decision is standard OC
Characters recognized by the standard OCR are displayed by being color-coded as standard character matching characters when the character matches R, and as non-standard character when the result of majority rule does not match the standard character. After that, the process moves to the next character. If there is no next character, the process proceeds to the comparison of the character recognition numbers of the next line.

【0020】図2に本発明のその他の実施例における、
文字情報認識方法の工程を示す。画像情報を各OCRソ
フトで認識するまでは図1と同様である。次いで標準の
OCRソフト以外のOCRソフトの最初の1行または1
列について、その文字認識結果を比較して、一致率を計
測する。一致率が70%以上のものが1つもない場合
は、その行全体の文字を比較対象外文字として色分けし
て標準OCRで認識した文字を表示して次の行の処理に
移る。
FIG. 2 shows another embodiment of the present invention.
The steps of the character information recognition method will be described. Until image information is recognized by each OCR software, it is the same as FIG. Then the first line or 1 of OCR software other than the standard OCR software
The character recognition results of the columns are compared to measure the matching rate. If there is no one having a matching rate of 70% or more, characters in the entire line are color-coded as non-comparison characters, characters recognized by the standard OCR are displayed, and the process proceeds to the next line.

【0021】文字認識結果の一致率が70%以上のもの
が存在する場合は、その中で各文字につき多数決を行
う。全部が一致した場合は全一致文字として、多数決の
結果が標準OCRに一致した場合は標準文字一致文字と
して、多数決の結果が標準文字と一致しなかった場合は
標準文字外文字として、それぞれ色分けして、標準OC
Rで認識した文字を表示させる。その後、次の文字に移
り、次の文字がなければ次の行の文字認識結果の一致率
の測定に移る。
If there is a character recognition result having a matching rate of 70% or more, a majority decision is made for each character. If all match, all characters are matched, if majority result matches standard OCR, standard character match character, and if majority result does not match standard character, non-standard character is color-coded. And standard OC
The character recognized by R is displayed. Thereafter, the process proceeds to the next character, and if there is no next character, the process proceeds to measurement of the matching rate of the character recognition result of the next line.

【0022】図3に本発明の文字情報認識装置の構造の
概略を示す。CPUは中央演算処理装置であって、内部
にフォントデータや文字コードデータを有する読み出し
専用メモリ(ROM)や、各種プログラムや入力部から
のデータ、フォントデータ等を一時保存する書き込み可
能メモリ(RAM)を有し、以下に示す各部とそれぞれ
はバスラインにて接続される。その他、バスラインは図
示しない外部(LAN、CD−ROMドライブ、ネット
ワーク等)と接続することも可能である。
FIG. 3 schematically shows the structure of the character information recognition apparatus of the present invention. The CPU is a central processing unit and has a read-only memory (ROM) having font data and character code data therein, and a writable memory (RAM) for temporarily storing various programs, data from an input unit, font data, and the like. And each of the following units is connected by a bus line. In addition, the bus line can be connected to an external device (not shown) (LAN, CD-ROM drive, network, etc.).

【0023】表示部はカラーLCD等のディスプレイ、
入力部はキーボード、マウス等を示す。VRAMは表示
用書込み専用メモリを示し、HDは外部記憶装置となる
ハードディスクを示すもので各種フォントデータが記録
保存されているが、場合によっては新規のフォントデー
タも外部より入力登録、保存される。あるいは修正後の
文字データを記録保存する。PRTはプリンター等の他
媒体への出力装置であり、修正後の文字データを出力す
るものであるが、特に必要というものではなく、適宜設
けるものであって良い。
The display unit is a display such as a color LCD,
The input unit indicates a keyboard, a mouse, and the like. VRAM indicates a display write-only memory, and HD indicates a hard disk serving as an external storage device, in which various font data are recorded and stored. In some cases, new font data is input, registered, and stored from outside. Alternatively, the corrected character data is recorded and saved. The PRT is an output device to another medium such as a printer, and outputs the corrected character data. However, the PRT is not particularly necessary and may be provided as appropriate.

【0024】画像情報読取部は画像のイメージデータを
ビットマップイメージで読み取るもので、このデータを
画像情報メモリに格納する。本発明においては画像情報
は画像をこの画像情報読取部で読み取っても良いし、元
からビットマップイメージで得られた画像情報を画像情
報メモリに直接格納しても良い。情報を画像情報メモリ
に直接格納しても良い。
The image information reading section reads image data of an image as a bitmap image, and stores the data in an image information memory. In the present invention, the image information may be obtained by reading the image with the image information reading unit, or the image information originally obtained as a bitmap image may be directly stored in the image information memory. Information may be stored directly in the image information memory.

【0025】文字データ認識部は前記画像情報より文字
を切り出し、文字データとして認識するもので、このデ
ータを文字データメモリに格納する。この文字の切り出
しに関しては、文字データ認識部の違いにより、複数の
文字データ認識部を用いて認識結果について多数決を行
い、その結果文字数の違いを測定する場合は文字数計測
部により、一致率による場合は一致率測定部により、そ
の行の多数決を行うかどうかを判定する。判定結果から
多数決を行うことが決定した場合は、多数決処理部にお
いて多数決を行い、これらの結果から、文字を表示する
場合の処理を決定する。
The character data recognizing section cuts out characters from the image information and recognizes them as character data, and stores the data in a character data memory. Regarding the extraction of characters, a majority decision is made on the recognition result using a plurality of character data recognition units due to differences in the character data recognition units. Determines whether or not to make a majority decision on the line by the coincidence rate measuring unit. If it is determined from the determination result that a majority decision is to be made, a majority decision is made in the majority decision processing unit, and processing for displaying characters is determined from these results.

【0026】本発明において用いる光学的文字認識装置
としては、画像情報において、ルビなどのフォントやサ
イズが異なる文字に関しては、読み取りを行わないで標
準と認識した文字のフォントやサイズにおいて1行また
は1列の文字を認識するものが好ましい。また、行間に
1行空けるような設定があるとすれば、それをなくすも
しくは全ての行の間に1行入る設定が行えるものが好ま
しい。その他、半角スペース、全角スペースは読み飛ば
して比較するという認識設定、行末尾設定(改行マーク
の認識や挿入)などについても認識の設定変更が行える
ものが好ましいが、特に限定するものではなく、現在流
通しているOCRソフトであれば適宜使用可能である
As the optical character recognition device used in the present invention, in the image information, for characters such as ruby and the like having different fonts and sizes, one line or one line in the font and size of the character recognized as the standard without reading. Those that recognize the characters in the column are preferred. Further, if there is a setting to leave one line between the lines, it is preferable that the setting can be eliminated or one line can be set between all the lines. In addition, it is preferable that the recognition setting that the half-width space and full-width space are skipped and compared, and that the recognition setting can be changed also for the end of line setting (recognition and insertion of a line feed mark) are preferable, but there is no particular limitation. Any commercially available OCR software can be used as appropriate

【0027】本発明における標準の光学的文字認識装置
は、予め画像情報のサンプルを用意し、その認識結果と
画像情報の文字を目視で比較して一番整合性の高いもの
を用いるのが好ましいが、上記のような認識に関する設
定変更可能なとの機能が一番好ましいOCRソフトを選
定するということであってもよい。
In the standard optical character recognition apparatus of the present invention, it is preferable to prepare a sample of image information in advance and visually compare the recognition result with the character of the image information to use the one having the highest consistency. However, it may also mean that the OCR software having the function of enabling the setting change regarding the recognition as described above is the most preferable.

【0028】本発明における、複数の光学的文字認識装
置の、行または列単位の文字認識結果の一致率の所定値
としては、50%以上であることが好ましく、現在のO
CRの適合率が90%程度あることを考慮し、文字数の
ずれが原因となる可能性を考えれば60〜80%、最も
好ましくは70%以上であることが好ましい。
In the present invention, the predetermined value of the coincidence rate of the character recognition results in units of rows or columns of the plurality of optical character recognition devices is preferably 50% or more.
Taking into account that the matching rate of CR is about 90%, and considering the possibility of a shift in the number of characters, it is preferably 60 to 80%, most preferably 70% or more.

【0029】図4の本発明における多数決の結果の文字
毎に色分けして、階層表示にして重ねて表示する、また
文字毎の色分けを、前記一致率毎に色階調を変化させて
表示する方法の一例を示す。多数決の結果、全一致文字
1は通常の表示と同じ色調で表示し、多数決で標準のO
CRと一致した標準文字2はそれよりやや濃い色で表
示、多数決で標準のOCRと一致しなかった標準外文字
3はそれよりもさらに濃い色で表示することで、目視に
よる画像情報との比較をより容易に効率よく行うことを
可能としている。なお図では示さなかったが、違いを文
字毎に斜体にしたり、色調を濃淡以外の色の違いで、例
えば信号機のように全一致文字を青、標準文字を黄色、
標準外文字を赤、というように表現してもよい。また、
比較対象外行などの文字表示などは、多数決の結果を色
の違いで表示する場合では、行全体を斜体表示とすると
かアンダーラインを入れるなど、全く別の表示方法によ
り視認できるように表示し表現すると好ましい。
In FIG. 4, the result of the majority decision in the present invention is classified by character and displayed in a hierarchical display in a superimposed manner, and the character by character is displayed by changing the color gradation for each matching rate. An example of the method will be described. As a result of the majority decision, all matching characters 1 are displayed in the same color tone as the normal display, and the standard O
Standard characters 2 that match CR are displayed in a slightly darker color, and non-standard characters 3 that do not match the standard OCR by majority are displayed in a darker color, allowing comparison with visual image information. Can be performed more easily and efficiently. Although not shown in the figure, the difference is italicized for each character, or the color tone is a color difference other than light and shade, for example, all matching characters are blue like a traffic light, standard characters are yellow,
Non-standard characters may be represented as red. Also,
When displaying the result of majority decision in different colors, the display of characters such as non-comparison lines is displayed and expressed in a completely different way, such as displaying the entire line in italics or underlining. It is preferable.

【0030】[0030]

【発明の効果】以上に示すように本発明の請求項1記載
の発明によれば、行または列単位で文字認識数が一致す
るもののみで多数決を行うので、常に比較する認識する
文字が一致した状態で多数決を行うことが可能となり、
より正確な文字認識を行うことが可能となるという作用
効果を奏する。
As described above, according to the first aspect of the present invention, the majority decision is made only on the character recognition number in the row or column unit, so that the characters to be compared always match. It is possible to make a majority decision with
There is an operational effect that more accurate character recognition can be performed.

【0031】また請求項2記載の発明によれば、行また
は列単位の末尾近傍で文字認識数がずれた場合の認識結
果も多数決の対象として採用することが可能となり、よ
り正確な文字認識を行うことが可能となるという作用効
果を奏する。
According to the second aspect of the present invention, the recognition result when the character recognition number is shifted near the end of each row or column can be adopted as a majority decision object, and more accurate character recognition can be performed. This has the effect of being able to perform the operation.

【0032】また請求項3記載の発明によれば、多数決
の結果を色分けして、元の画像情報の文字と重ねて表示
することで、画像情報での文字の比較で未時認識のエラ
ーの検出に際して多数決の結果を視覚的に認識すること
が可能となり、エラーの検出がさらに容易に可能となる
という作用効果を奏する。
Further, according to the third aspect of the present invention, the result of the majority decision is color-coded and superimposed on the character of the original image information and displayed, so that the error of the unrecognized error in the comparison of the character in the image information is obtained. At the time of detection, it is possible to visually recognize the result of the majority decision, and it is possible to detect an error more easily.

【0033】また請求項4記載の発明によれば、一致率
毎に色階調を変化させて表示することにより、一致率の
結果を視覚的に認識することが可能となり、エラーの検
出がさらに容易に可能となるという作用効果を奏する。
According to the fourth aspect of the present invention, since the color gradation is changed and displayed for each coincidence rate, it is possible to visually recognize the result of the coincidence rate, and the error can be further detected. There is an effect of being easily possible.

【0034】また請求項5記載の発明によれば、行また
は列単位で文字認識数が一致するもののみで多数決を行
うので、常に比較する認識する文字が一致した状態で多
数決を行うことが可能となり、より正確な文字認識を行
うことが可能となるという作用効果を奏する。
According to the fifth aspect of the present invention, a majority decision is made only on a character having the same number of recognized characters in units of rows or columns, so that a majority decision can be made in a state where the characters to be compared always match. Thus, there is an operational effect that more accurate character recognition can be performed.

【0035】また請求項6記載の発明によれば、行また
は列単位の末尾近傍で文字認識数がずれた場合の認識結
果も多数決の対象として採用することが可能となり、よ
り正確な文字認識を行うことが可能となるという作用効
果を奏する。
According to the present invention, the recognition result when the number of recognized characters is shifted near the end of each row or column can be adopted as a majority decision object, and more accurate character recognition can be performed. This has the effect of being able to perform the operation.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例における、文字情報認識方法
の工程を示す説明図である。
FIG. 1 is an explanatory diagram showing steps of a character information recognition method according to an embodiment of the present invention.

【図2】本発明のその他の実施例における、文字情報認
識方法の工程を示す説明図である。
FIG. 2 is an explanatory diagram showing steps of a character information recognition method according to another embodiment of the present invention.

【図3】本発明の文字情報認識装置の構造の概略を示す
説明図である。
FIG. 3 is an explanatory view schematically showing the structure of the character information recognition device of the present invention.

【図4】本発明における多数決の結果の文字毎に色分け
して、階層表示にして重ねて表示する、また文字毎の色
分けを、前記一致率毎に色階調を変化させて表示する方
法の一例を示す説明図である。
FIG. 4 is a diagram showing a method of displaying a color by color for each character as a result of a majority decision and superimposing them in a hierarchical display according to the present invention, and displaying a color for each character by changing a color gradation for each coincidence rate. It is explanatory drawing which shows an example.

【符号の説明】[Explanation of symbols]

1…全一致文字 2…標準文字 3…標準外文字 1: All matched characters 2: Standard characters 3: Non-standard characters

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】画像情報から文字情報を認識する認識方法
で複数の光学的文字認識装置を用い、前記複数の光学的
文字認識装置間で認識された文字の相違がある場合、複
数の光学的文字認識装置間の多数決によって認識された
文字を決定する文字情報認識方法において、 前記複数の光学的文字認識装置から任意の1つを標準の
光学的文字認識装置とし、その認識結果に対するその他
の光学的文字認識装置の、行または列単位での文字認識
結果の文字認識数が異なる認識をした前記その他の光学
的文字認識装置の認識結果を多数決の参照から除いて多
数決を行うことを特徴とする文字情報認識方法。
1. A method for recognizing character information from image information, wherein a plurality of optical character recognition devices are used, and when there is a difference in recognized characters among the plurality of optical character recognition devices, a plurality of optical character recognition devices are used. In a character information recognition method for determining a character recognized by a majority decision between character recognition devices, any one of the plurality of optical character recognition devices may be used as a standard optical character recognition device, and other optics for the recognition result may be used. The character recognition result of the other optical character recognition device that recognizes the character recognition result of the character recognition result in a unit of row or column different from each other, and performs majority voting by excluding from the reference of majority voting. Character information recognition method.
【請求項2】画像情報から文字情報を認識する認識方法
で複数の光学的文字認識装置を用い、前記複数の光学的
文字認識装置間で認識された文字の相違がある場合、複
数の光学的文字認識装置間の多数決によって認識された
文字を決定する文字情報認識方法において、 前記複数の光学的文字認識装置から任意の1つを標準の
光学的文字認識装置とし、その認識結果に対するその他
の光学的文字認識装置の、行または列単位での文字認識
結果の一致率を測定し、一致率が所定値以下の場合、そ
の行または列に関する前記その他の光学的文字認識装置
の認識結果を多数決の参照から除いて多数決を行うこと
を特徴とする文字情報認識方法。
2. A method for recognizing character information from image information, wherein a plurality of optical character recognition devices are used, and when there is a difference in recognized characters among the plurality of optical character recognition devices, a plurality of optical character recognition devices are used. In a character information recognition method for determining a character recognized by a majority decision between character recognition devices, any one of the plurality of optical character recognition devices may be used as a standard optical character recognition device, and other optics for the recognition result may be used. The matching rate of the character recognition result of the target character recognition device in units of rows or columns is measured, and when the matching ratio is equal to or less than a predetermined value, the recognition result of the other optical character recognition device for the row or column is determined by majority. A character information recognition method characterized by performing a majority decision excluding from a reference.
【請求項3】前記画像情報と、前記文字情報を前記多数
決の結果を文字毎に色分けして、階層表示にして重ねて
表示することを特徴とする請求項1、2のいずれか記載
の文字情報認識方法。
3. The character according to claim 1, wherein the image information and the character information are displayed in a hierarchical display by superimposing the result of the majority decision by color for each character. Information recognition method.
【請求項4】前記多数決の結果の文字毎の色分けを、前
記一致率毎に色階調を変化させて表示することを特徴と
する請求項3記載の文字情報認識方法
4. The character information recognizing method according to claim 3, wherein a color classification for each character as a result of the majority decision is displayed by changing a color gradation for each of the coincidence rates.
【請求項5】画像情報から文字情報を認識する1つの手
段と、 前記画像情報から文字情報を認識するその他の複数の手
段と、 前記1つの手段の文字情報の認識結果と前記その他の複
数の手段の文字情報の認識結果の多数決を行うに関し
て、認識結果の1行または1列単位で認識された文字数
を求めて、前記その他の複数の手段の文字情報の認識結
果が前記1つの手段の文字情報の認識結果と一致しない
場合、その行または列に関する前記その他の文字認識手
段の認識結果を多数決の参照から除いて多数決を行う手
段と、 前記画像情報と、前記文字情報を前記多数決の結果を文
字毎に色分けして、階層表示にして重ねて表示する手段
と、前記文字パターンを修正可能とする手段と、 を有することを特徴とする文字情報認識装置。
5. A means for recognizing character information from image information; a plurality of other means for recognizing character information from the image information; and a recognition result of character information of the one means and the other plurality of means. Regarding the majority decision of the recognition result of the character information of the means, the number of characters recognized in one line or one column of the recognition result is obtained, and the recognition result of the character information of the plurality of other means is the character of the one means. If the information does not match the recognition result, the majority of the row or column is excluded by referring to the recognition result of the other character recognition unit from the majority decision, and the image information and the character information are converted to the result of the majority decision. A character information recognizing device comprising: means for color-coding each character to display in a hierarchical display in a superimposed manner; and means for enabling the character pattern to be corrected.
【請求項6】画像情報から文字情報を認識する1つの手
段と、 前記画像情報から文字情報を認識するその他の複数の手
段と、 前記1つの手段の文字情報の認識結果と前記その他の複
数の手段の文字情報の認識結果の多数決を行うに関し
て、前記その他の複数の手段の文字情報の認識結果と前
記1つの手段の文字情報の認識結果の1行または1列単
位の一致率を求めて、一致率が所定値以下の場合、その
行または列に関する前記その他の文字認識手段の認識結
果を多数決の参照から除いて多数決を行う手段と、 前記画像情報と、前記文字情報を前記多数決の結果を文
字毎に色分けして、階層表示にして重ねて表示する手段
と、 前記文字パターンを修正可能とする手段と、 を有することを特徴とする文字情報認識装置。
6. A means for recognizing character information from image information, a plurality of other means for recognizing character information from the image information, a recognition result of character information of the one means and the other plurality of means. Regarding the majority decision of the recognition result of the character information of the means, the match rate of the recognition result of the character information of the plurality of other means and the recognition result of the character information of the one means is obtained in one row or one column unit, When the matching rate is equal to or less than a predetermined value, a unit that performs a majority decision by excluding the recognition result of the other character recognition unit regarding the row or column from the majority decision reference, and the image information and the character information are used as a result of the majority decision. A character information recognizing device comprising: means for color-coding each character to display in a hierarchical display in a superimposed manner; and means for enabling the character pattern to be corrected.
JP2001171484A 2001-06-06 2001-06-06 Method and device for character information recognition Withdrawn JP2002366899A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001171484A JP2002366899A (en) 2001-06-06 2001-06-06 Method and device for character information recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001171484A JP2002366899A (en) 2001-06-06 2001-06-06 Method and device for character information recognition

Publications (1)

Publication Number Publication Date
JP2002366899A true JP2002366899A (en) 2002-12-20

Family

ID=19013251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001171484A Withdrawn JP2002366899A (en) 2001-06-06 2001-06-06 Method and device for character information recognition

Country Status (1)

Country Link
JP (1) JP2002366899A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006146901A (en) * 2004-11-16 2006-06-08 Internatl Business Mach Corp <Ibm> Apparatus, system, program and method for detecting fraudulent character (apparatus, system and method for detecting fraudulent character using multiple scanning technologies)
JP6474504B1 (en) * 2018-01-23 2019-02-27 株式会社野村総合研究所 Handwritten character recognition system
CN111027556A (en) * 2019-03-11 2020-04-17 广东小天才科技有限公司 Question searching method based on image preprocessing and learning equipment
JP2020135296A (en) * 2019-02-18 2020-08-31 京セラドキュメントソリューションズ株式会社 Information processing apparatus and information processing system
JP7492404B2 (en) 2020-08-13 2024-05-29 株式会社Pfu Information processing device, input data error estimation method and program

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006146901A (en) * 2004-11-16 2006-06-08 Internatl Business Mach Corp <Ibm> Apparatus, system, program and method for detecting fraudulent character (apparatus, system and method for detecting fraudulent character using multiple scanning technologies)
JP6474504B1 (en) * 2018-01-23 2019-02-27 株式会社野村総合研究所 Handwritten character recognition system
JP2019128690A (en) * 2018-01-23 2019-08-01 株式会社野村総合研究所 Handwritten character recognition system
JP2020135296A (en) * 2019-02-18 2020-08-31 京セラドキュメントソリューションズ株式会社 Information processing apparatus and information processing system
JP7298178B2 (en) 2019-02-18 2023-06-27 京セラドキュメントソリューションズ株式会社 Information processing device and information processing system
CN111027556A (en) * 2019-03-11 2020-04-17 广东小天才科技有限公司 Question searching method based on image preprocessing and learning equipment
CN111027556B (en) * 2019-03-11 2023-12-22 广东小天才科技有限公司 Question searching method and learning device based on image preprocessing
JP7492404B2 (en) 2020-08-13 2024-05-29 株式会社Pfu Information processing device, input data error estimation method and program

Similar Documents

Publication Publication Date Title
CN105320951B (en) Optical character recognition device and optical character recognition method
JPH0519753B2 (en)
JPS63158678A (en) Inter-word space detecting method
JP2002366899A (en) Method and device for character information recognition
US20180246041A1 (en) Print data processing method, print data processing device, and recording medium having recorded therein print data processing program
JP2011112398A (en) Inspection method, inspection device and inspection program for image forming state
US20050186002A1 (en) Printing condition inspection method, a character string inspection method and an inspection apparatus using the methods
JPH05274467A (en) Data input device
US20130141767A1 (en) Print Verification Database Mechanism
JP2004046723A (en) Method for recognizing character, program and apparatus used for implementing the method
JP2001331765A (en) Character recognizing device and character processing method
US11710331B2 (en) Systems and methods for separating ligature characters in digitized document images
JPH0277891A (en) Character recognition device
KR100837887B1 (en) Optical Mark Recognition method by image process and Optical Mark Recognition card
JP2022051199A (en) Image determination device, image determination method, and program
JPH04276885A (en) Character segmenting appartus
JPH07306911A (en) Ocr reading result correcting device
JPS62295192A (en) Optical character image reader
JPH08123872A (en) Optical character reader
JP2878772B2 (en) Optical character reader
JPS5953977A (en) Character recognizing device
JPH06243294A (en) Character recognition postprocessing device
CN116067497A (en) Color measuring system, terminal device, processing method, and recording medium
JPH03122786A (en) Optical character reader
JPS6010671B2 (en) pattern reading device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050324

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070803