JP2002366899A - Method and device for character information recognition - Google Patents
Method and device for character information recognitionInfo
- Publication number
- JP2002366899A JP2002366899A JP2001171484A JP2001171484A JP2002366899A JP 2002366899 A JP2002366899 A JP 2002366899A JP 2001171484 A JP2001171484 A JP 2001171484A JP 2001171484 A JP2001171484 A JP 2001171484A JP 2002366899 A JP2002366899 A JP 2002366899A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- information
- majority decision
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は文字を含む画像情報
から文字パターンのデータ(以下文字データとする)を
認識する文字情報認識方法に関し、特に画像から光学的
に画像情報を読み取り、文字データを認識する光学的文
字認識装置(以下OCRとする)及びこの文字認識のエ
ラーの検出と文字データの修正を行う文字情報認識方法
及び装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character information recognizing method for recognizing character pattern data (hereinafter referred to as character data) from image information including characters, and more particularly, to optically reading image information from an image and reconstructing the character data. The present invention relates to an optical character recognition device (hereinafter referred to as OCR) for recognition, and a character information recognition method and device for detecting an error in character recognition and correcting character data.
【0002】[0002]
【従来の技術】近年になり、急速に印刷におけるプリプ
レスのDTP化が進み、画像情報からの文字データの読
み取りも大量に行われるようになってきた。それに伴
い、0CRによる文字認識も精度を要求されるようにな
ってきているが、読み取りエラーを完全になくす有効な
手段は未だに無い。このため、文字認識のエラーの検出
と文字データの修正を人手により行う必要があり、時間
や労力がかさむものとなっていた。2. Description of the Related Art In recent years, the use of DTP in prepress in printing has rapidly progressed, and a large amount of character data has been read from image information. Accordingly, the accuracy of character recognition by 0CR is also required to be accurate, but there is still no effective means for completely eliminating a reading error. For this reason, it is necessary to manually detect an error in character recognition and correct character data, which increases time and labor.
【0003】一方、複数のOCRを用いて、読み取りエ
ラーを相互補完する多数決による文字情報認識を決定す
る方法が知られている。しかしながらこの方法でも、文
字フォントとその大きさ、行間隔、欧文フォントの挿入
など、文字位置のズレにより文字1つが認識されなかっ
たり、本来1つの文字が2つに認識されることが発生す
る。そのような場合、多数決による文字認識では、その
ような文字認識数のズレが発生した以降の文字に関し
て、正確に認識しているものも多数決では違う文字を認
識したものとされてしまうという不都合が発生してしま
う。On the other hand, there is known a method of determining character information recognition by majority decision using a plurality of OCRs to mutually complement reading errors. However, even with this method, one character may not be recognized or two characters may be originally recognized due to a character position shift such as insertion of a character font and its size, line spacing, and Western font. In such a case, in character recognition by majority vote, the inconvenience that the characters recognized correctly after the occurrence of such a difference in the number of recognized characters is regarded as a different character by majority rule. Will occur.
【0004】[0004]
【発明が解決しようとする課題】本発明はこのような問
題点を解決するためになされたものであり、その課題と
するところは、文字認識数がズレたものであっても、文
字認識のエラーの検出と文字データの修正を効率よく行
うことを可能とする文字情報認識方法及び文字情報認識
装置を提供することにある。SUMMARY OF THE INVENTION The present invention has been made to solve such a problem, and an object thereof is to solve the problem of character recognition even if the number of character recognition is shifted. It is an object of the present invention to provide a character information recognizing method and a character information recognizing device capable of efficiently detecting an error and correcting character data.
【0005】[0005]
【課題を解決するための手段】本発明はこの課題を解決
するため、すなわち請求項1記載の発明は、画像情報か
ら文字情報を認識する認識方法で複数の光学的文字認識
装置を用い、前記複数の光学的文字認識装置間で認識さ
れた文字の相違がある場合、複数の光学的文字認識装置
間の多数決によって認識された文字を決定する文字情報
認識方法において、前記複数の光学的文字認識装置から
任意の1つを標準の光学的文字認識装置とし、その認識
結果に対するその他の光学的文字認識装置の、行または
列単位での文字認識結果の文字認識数が異なる認識をし
た前記その他の光学的文字認識装置の認識結果を多数決
の参照から除いて多数決を行うことを特徴とする文字情
報認識方法である。According to the present invention, there is provided a method for recognizing character information from image information using a plurality of optical character recognition devices. In the character information recognition method for determining a character recognized by a majority decision between a plurality of optical character recognition devices when there is a difference in characters recognized between the plurality of optical character recognition devices, the plurality of optical character recognition Any one of the devices may be a standard optical character recognition device, and the other optical character recognition devices for the recognition result may recognize the different number of character recognition of the character recognition result in units of rows or columns. This is a character information recognition method characterized by performing a majority decision by excluding a recognition result of an optical character recognition device from a majority decision reference.
【0006】本発明はこの手段により、行または列単位
で文字認識数が一致するもののみで多数決を行うので、
常に比較する認識する文字が一致した状態で多数決を行
うことが可能となり、より正確な文字認識を行うことが
可能となる。According to the present invention, by this means, a majority decision is made only for those having the same character recognition number for each row or column.
It is possible to make a majority decision in a state where the characters to be compared always match, and it is possible to perform more accurate character recognition.
【0007】また請求項2記載の発明は、画像情報から
文字情報を認識する認識方法で複数の光学的文字認識装
置を用い、前記複数の光学的文字認識装置間で認識され
た文字の相違がある場合、複数の光学的文字認識装置間
の多数決によって認識された文字を決定する文字情報認
識方法において、前記複数の光学的文字認識装置から任
意の1つを標準の光学的文字認識装置とし、その認識結
果に対するその他の光学的文字認識装置の、行または列
単位での文字認識結果の一致率を測定し、一致率が所定
値以下の場合、その行または列に関する前記その他の光
学的文字認識装置の認識結果を多数決の参照から除いて
多数決を行うことを特徴とする文字情報認識方法であ
る。According to a second aspect of the present invention, there is provided a recognition method for recognizing character information from image information, wherein a plurality of optical character recognition devices are used. In some cases, in a character information recognition method for determining a character recognized by majority vote between a plurality of optical character recognition devices, any one of the plurality of optical character recognition devices as a standard optical character recognition device, The other optical character recognition device for the recognition result measures the matching rate of the character recognition result in units of rows or columns, and when the matching rate is equal to or less than a predetermined value, the other optical character recognition for the row or column. This is a character information recognition method characterized in that a majority decision is made by excluding a recognition result of the apparatus from a majority decision reference.
【0008】本発明はこの手段により、行または列単位
の末尾近傍で文字認識数がずれた場合の認識結果も多数
決の対象として採用することが可能となり、より正確な
文字認識を行うことが可能となる。According to the present invention, by this means, the recognition result when the character recognition number is shifted near the end of each row or column can be adopted as a majority decision object, and more accurate character recognition can be performed. Becomes
【0009】また請求項3記載の発明は、前記画像情報
と、前記文字情報を前記多数決の結果を文字毎に色分け
して、階層表示にして重ねて表示することを特徴とする
請求項1、2のいずれか記載の文字情報認識方法であ
る。According to a third aspect of the present invention, the image information and the character information are displayed in a hierarchical display by color-coding the result of the majority decision for each character. 2. The character information recognition method according to any one of 2.
【0010】本発明はこの手段により、多数決の結果を
色分けして、元の画像情報の文字と重ねて表示すること
で、画像情報での文字の比較で未時認識のエラーの検出
に際して多数決の結果を視覚的に認識することが可能と
なり、エラーの検出がさらに容易に可能となる。According to the present invention, by this means, the result of the majority decision is color-coded and superimposed and displayed on the character of the original image information, so that the comparison of the character in the image information detects the unrecognized error at the time of the majority decision. The result can be visually recognized, and the error can be more easily detected.
【0011】また請求項4記載の発明は、前記多数決の
結果の文字毎の色分けを、前記一致率毎に色階調を変化
させて表示することを特徴とする請求項3記載の文字情
報認識方法である。According to a fourth aspect of the present invention, in the character information recognition apparatus as set forth in the third aspect, the color classification of each character as a result of the majority decision is displayed by changing a color gradation for each of the coincidence rates. Is the way.
【0012】本発明はこの手段により、一致率毎に色階
調を変化させて表示することにより、一致率の結果を視
覚的に認識することが可能となり、エラーの検出がさら
に容易に可能となる。According to the present invention, it is possible to visually recognize the result of the coincidence rate by changing the color gradation for each coincidence rate and displaying the result, thereby making it easier to detect an error. Become.
【0013】また請求項5記載の発明は、前記画像情報
から文字情報を認識するその他の複数の手段と、前記1
つの手段の文字情報の認識結果と前記その他の複数の手
段の文字情報の認識結果の多数決を行うに関して、認識
結果の1行または1列単位で認識された文字数を求め
て、前記その他の複数の手段の文字情報の認識結果が前
記1つの手段の文字情報の認識結果と一致しない場合、
その行または列に関する前記その他の文字認識手段の認
識結果を多数決の参照から除いて多数決を行う手段と、
前記画像情報と、前記文字情報を前記多数決の結果を文
字毎に色分けして、階層表示にして重ねて表示する手段
と、前記文字パターンを修正可能とする手段と、を有す
ることを特徴とする文字情報認識装置である。According to a fifth aspect of the present invention, there is provided the image processing apparatus according to the first aspect of the invention, further comprising:
Regarding the majority decision between the recognition result of the character information of one means and the recognition result of the character information of the other plurality of means, the number of characters recognized in one line or one column of the recognition result is obtained, and When the recognition result of the character information of the means does not match the recognition result of the character information of the one means,
Means for performing a majority vote by excluding the recognition result of the other character recognition means for the row or column from the majority vote reference,
The image information, the character information, means for color-coding the result of the majority decision for each character, displaying the information in a hierarchical display in a superimposed manner, and means for correcting the character pattern. It is a character information recognition device.
【0014】本発明はこの手段により、行または列単位
で文字認識数が一致するもののみで多数決を行うので、
常に比較する認識する文字が一致した状態で多数決を行
うことが可能となり、より正確な文字認識を行うことが
可能となる。According to the present invention, by this means, a majority decision is made only for those having the same character recognition number in row or column units.
It is possible to make a majority decision in a state where the characters to be compared always match, and it is possible to perform more accurate character recognition.
【0015】また請求項6記載の発明は、画像情報から
文字情報を認識する1つの手段と、前記画像情報から文
字情報を認識するその他の複数の手段と、前記1つの手
段の文字情報の認識結果と前記その他の複数の手段の文
字情報の認識結果の多数決を行うに関して、前記その他
の複数の手段の文字情報の認識結果と前記1つの手段の
文字情報の認識結果の1行または1列単位の一致率を求
めて、一致率が所定値以下の場合、その行または列に関
する前記その他の文字認識手段の認識結果を多数決の参
照から除いて多数決を行う手段と、前記画像情報と、前
記文字情報を前記多数決の結果を文字毎に色分けして、
階層表示にして重ねて表示する手段と、前記文字パター
ンを修正可能とする手段と、を有することを特徴とする
文字情報認識装置である。According to a sixth aspect of the present invention, there is provided one means for recognizing character information from image information, a plurality of other means for recognizing character information from the image information, and the character information recognition of the one means. Regarding the majority decision of the result and the character information recognition result of the other plurality of means, one line or one column unit of the character information recognition result of the other plurality of means and the character information recognition result of the one means Means for performing a majority decision by excluding the recognition result of the other character recognition means for the row or column from reference to a majority decision, when the match rate is equal to or less than a predetermined value, the image information, and the character The information is color-coded by character for the result of the majority decision,
A character information recognizing device comprising: means for displaying a hierarchical display in a superimposed manner; and means for enabling the character pattern to be corrected.
【0016】本発明はこの手段により、行または列単位
の末尾近傍で文字認識数がずれた場合の認識結果も多数
決の対象として採用することが可能となり、より正確な
文字認識を行うことが可能となる。According to the present invention, by this means, the recognition result when the character recognition number is shifted near the end of each row or column can be adopted as a majority decision object, and more accurate character recognition can be performed. Becomes
【0017】[0017]
【発明の実施の形態】以下、本発明を図面に基づき詳細
に説明する。図1に本発明の一実施例における、文字情
報認識方法の工程を示す。まず画像情報となる原稿デー
タ1を標準となるOCR1、およびその他のOCR2,
3,4において文字認識を行う。画像が紙媒体に示され
たものである場合は、画像情報の読み取りを1つのスキ
ャナーで読み取ってデータ化してからから複数のOCR
ソフトで認識させても良いし、複数のスキャナーで読み
取って、それをそれぞれOCRソフトで認識させても良
い。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, the present invention will be described in detail with reference to the drawings. FIG. 1 shows steps of a character information recognition method according to an embodiment of the present invention. First, original data 1 serving as image information is converted into a standard OCR 1 and other OCRs 2.
Character recognition is performed in 3 and 4. If the image is shown on a paper medium, the image information is read by one scanner and converted into data, and then a plurality of OCRs are read.
It may be recognized by software, or may be read by a plurality of scanners and each of them may be recognized by OCR software.
【0018】次いで、各OCRソフトにおいて、最初の
1行または1行の、1行または1列毎の文字列における
文字認識数をカウントする。次いで、標準となるOCR
ソフトの文字認識数と他のOCRの文字認識数を比較す
る。一致したものが1つもない場合は、その行全体の文
字を比較対象外文字として色分けして標準OCRで認識
した文字を表示して次の行の処理に移る。Next, in each OCR software, the number of recognized characters in the first one line or one line of a character string in each line or column is counted. Next, the standard OCR
The character recognition number of the software is compared with the character recognition number of another OCR. If there is no match, the characters of the entire line are color-coded as non-comparison characters, the characters recognized by the standard OCR are displayed, and the process proceeds to the next line.
【0019】文字認識数が一致したOCRが存在する場
合は、その中で各文字につき多数決を行う。全部が一致
した場合は全一致文字として、多数決の結果が標準OC
Rに一致した場合は標準文字一致文字として、多数決の
結果が標準文字と一致しなかった場合は標準文字外文字
として、それぞれ色分けして、標準OCRで認識した文
字を表示させる。その後、次の文字に移り、次の文字が
なければ次の行の文字認識数の比較に移る。If there is an OCR whose character recognition number matches, a majority decision is made for each character in the OCR. If all match, the result of majority decision is standard OC
Characters recognized by the standard OCR are displayed by being color-coded as standard character matching characters when the character matches R, and as non-standard character when the result of majority rule does not match the standard character. After that, the process moves to the next character. If there is no next character, the process proceeds to the comparison of the character recognition numbers of the next line.
【0020】図2に本発明のその他の実施例における、
文字情報認識方法の工程を示す。画像情報を各OCRソ
フトで認識するまでは図1と同様である。次いで標準の
OCRソフト以外のOCRソフトの最初の1行または1
列について、その文字認識結果を比較して、一致率を計
測する。一致率が70%以上のものが1つもない場合
は、その行全体の文字を比較対象外文字として色分けし
て標準OCRで認識した文字を表示して次の行の処理に
移る。FIG. 2 shows another embodiment of the present invention.
The steps of the character information recognition method will be described. Until image information is recognized by each OCR software, it is the same as FIG. Then the first line or 1 of OCR software other than the standard OCR software
The character recognition results of the columns are compared to measure the matching rate. If there is no one having a matching rate of 70% or more, characters in the entire line are color-coded as non-comparison characters, characters recognized by the standard OCR are displayed, and the process proceeds to the next line.
【0021】文字認識結果の一致率が70%以上のもの
が存在する場合は、その中で各文字につき多数決を行
う。全部が一致した場合は全一致文字として、多数決の
結果が標準OCRに一致した場合は標準文字一致文字と
して、多数決の結果が標準文字と一致しなかった場合は
標準文字外文字として、それぞれ色分けして、標準OC
Rで認識した文字を表示させる。その後、次の文字に移
り、次の文字がなければ次の行の文字認識結果の一致率
の測定に移る。If there is a character recognition result having a matching rate of 70% or more, a majority decision is made for each character. If all match, all characters are matched, if majority result matches standard OCR, standard character match character, and if majority result does not match standard character, non-standard character is color-coded. And standard OC
The character recognized by R is displayed. Thereafter, the process proceeds to the next character, and if there is no next character, the process proceeds to measurement of the matching rate of the character recognition result of the next line.
【0022】図3に本発明の文字情報認識装置の構造の
概略を示す。CPUは中央演算処理装置であって、内部
にフォントデータや文字コードデータを有する読み出し
専用メモリ(ROM)や、各種プログラムや入力部から
のデータ、フォントデータ等を一時保存する書き込み可
能メモリ(RAM)を有し、以下に示す各部とそれぞれ
はバスラインにて接続される。その他、バスラインは図
示しない外部(LAN、CD−ROMドライブ、ネット
ワーク等)と接続することも可能である。FIG. 3 schematically shows the structure of the character information recognition apparatus of the present invention. The CPU is a central processing unit and has a read-only memory (ROM) having font data and character code data therein, and a writable memory (RAM) for temporarily storing various programs, data from an input unit, font data, and the like. And each of the following units is connected by a bus line. In addition, the bus line can be connected to an external device (not shown) (LAN, CD-ROM drive, network, etc.).
【0023】表示部はカラーLCD等のディスプレイ、
入力部はキーボード、マウス等を示す。VRAMは表示
用書込み専用メモリを示し、HDは外部記憶装置となる
ハードディスクを示すもので各種フォントデータが記録
保存されているが、場合によっては新規のフォントデー
タも外部より入力登録、保存される。あるいは修正後の
文字データを記録保存する。PRTはプリンター等の他
媒体への出力装置であり、修正後の文字データを出力す
るものであるが、特に必要というものではなく、適宜設
けるものであって良い。The display unit is a display such as a color LCD,
The input unit indicates a keyboard, a mouse, and the like. VRAM indicates a display write-only memory, and HD indicates a hard disk serving as an external storage device, in which various font data are recorded and stored. In some cases, new font data is input, registered, and stored from outside. Alternatively, the corrected character data is recorded and saved. The PRT is an output device to another medium such as a printer, and outputs the corrected character data. However, the PRT is not particularly necessary and may be provided as appropriate.
【0024】画像情報読取部は画像のイメージデータを
ビットマップイメージで読み取るもので、このデータを
画像情報メモリに格納する。本発明においては画像情報
は画像をこの画像情報読取部で読み取っても良いし、元
からビットマップイメージで得られた画像情報を画像情
報メモリに直接格納しても良い。情報を画像情報メモリ
に直接格納しても良い。The image information reading section reads image data of an image as a bitmap image, and stores the data in an image information memory. In the present invention, the image information may be obtained by reading the image with the image information reading unit, or the image information originally obtained as a bitmap image may be directly stored in the image information memory. Information may be stored directly in the image information memory.
【0025】文字データ認識部は前記画像情報より文字
を切り出し、文字データとして認識するもので、このデ
ータを文字データメモリに格納する。この文字の切り出
しに関しては、文字データ認識部の違いにより、複数の
文字データ認識部を用いて認識結果について多数決を行
い、その結果文字数の違いを測定する場合は文字数計測
部により、一致率による場合は一致率測定部により、そ
の行の多数決を行うかどうかを判定する。判定結果から
多数決を行うことが決定した場合は、多数決処理部にお
いて多数決を行い、これらの結果から、文字を表示する
場合の処理を決定する。The character data recognizing section cuts out characters from the image information and recognizes them as character data, and stores the data in a character data memory. Regarding the extraction of characters, a majority decision is made on the recognition result using a plurality of character data recognition units due to differences in the character data recognition units. Determines whether or not to make a majority decision on the line by the coincidence rate measuring unit. If it is determined from the determination result that a majority decision is to be made, a majority decision is made in the majority decision processing unit, and processing for displaying characters is determined from these results.
【0026】本発明において用いる光学的文字認識装置
としては、画像情報において、ルビなどのフォントやサ
イズが異なる文字に関しては、読み取りを行わないで標
準と認識した文字のフォントやサイズにおいて1行また
は1列の文字を認識するものが好ましい。また、行間に
1行空けるような設定があるとすれば、それをなくすも
しくは全ての行の間に1行入る設定が行えるものが好ま
しい。その他、半角スペース、全角スペースは読み飛ば
して比較するという認識設定、行末尾設定(改行マーク
の認識や挿入)などについても認識の設定変更が行える
ものが好ましいが、特に限定するものではなく、現在流
通しているOCRソフトであれば適宜使用可能であるAs the optical character recognition device used in the present invention, in the image information, for characters such as ruby and the like having different fonts and sizes, one line or one line in the font and size of the character recognized as the standard without reading. Those that recognize the characters in the column are preferred. Further, if there is a setting to leave one line between the lines, it is preferable that the setting can be eliminated or one line can be set between all the lines. In addition, it is preferable that the recognition setting that the half-width space and full-width space are skipped and compared, and that the recognition setting can be changed also for the end of line setting (recognition and insertion of a line feed mark) are preferable, but there is no particular limitation. Any commercially available OCR software can be used as appropriate
【0027】本発明における標準の光学的文字認識装置
は、予め画像情報のサンプルを用意し、その認識結果と
画像情報の文字を目視で比較して一番整合性の高いもの
を用いるのが好ましいが、上記のような認識に関する設
定変更可能なとの機能が一番好ましいOCRソフトを選
定するということであってもよい。In the standard optical character recognition apparatus of the present invention, it is preferable to prepare a sample of image information in advance and visually compare the recognition result with the character of the image information to use the one having the highest consistency. However, it may also mean that the OCR software having the function of enabling the setting change regarding the recognition as described above is the most preferable.
【0028】本発明における、複数の光学的文字認識装
置の、行または列単位の文字認識結果の一致率の所定値
としては、50%以上であることが好ましく、現在のO
CRの適合率が90%程度あることを考慮し、文字数の
ずれが原因となる可能性を考えれば60〜80%、最も
好ましくは70%以上であることが好ましい。In the present invention, the predetermined value of the coincidence rate of the character recognition results in units of rows or columns of the plurality of optical character recognition devices is preferably 50% or more.
Taking into account that the matching rate of CR is about 90%, and considering the possibility of a shift in the number of characters, it is preferably 60 to 80%, most preferably 70% or more.
【0029】図4の本発明における多数決の結果の文字
毎に色分けして、階層表示にして重ねて表示する、また
文字毎の色分けを、前記一致率毎に色階調を変化させて
表示する方法の一例を示す。多数決の結果、全一致文字
1は通常の表示と同じ色調で表示し、多数決で標準のO
CRと一致した標準文字2はそれよりやや濃い色で表
示、多数決で標準のOCRと一致しなかった標準外文字
3はそれよりもさらに濃い色で表示することで、目視に
よる画像情報との比較をより容易に効率よく行うことを
可能としている。なお図では示さなかったが、違いを文
字毎に斜体にしたり、色調を濃淡以外の色の違いで、例
えば信号機のように全一致文字を青、標準文字を黄色、
標準外文字を赤、というように表現してもよい。また、
比較対象外行などの文字表示などは、多数決の結果を色
の違いで表示する場合では、行全体を斜体表示とすると
かアンダーラインを入れるなど、全く別の表示方法によ
り視認できるように表示し表現すると好ましい。In FIG. 4, the result of the majority decision in the present invention is classified by character and displayed in a hierarchical display in a superimposed manner, and the character by character is displayed by changing the color gradation for each matching rate. An example of the method will be described. As a result of the majority decision, all matching characters 1 are displayed in the same color tone as the normal display, and the standard O
Standard characters 2 that match CR are displayed in a slightly darker color, and non-standard characters 3 that do not match the standard OCR by majority are displayed in a darker color, allowing comparison with visual image information. Can be performed more easily and efficiently. Although not shown in the figure, the difference is italicized for each character, or the color tone is a color difference other than light and shade, for example, all matching characters are blue like a traffic light, standard characters are yellow,
Non-standard characters may be represented as red. Also,
When displaying the result of majority decision in different colors, the display of characters such as non-comparison lines is displayed and expressed in a completely different way, such as displaying the entire line in italics or underlining. It is preferable.
【0030】[0030]
【発明の効果】以上に示すように本発明の請求項1記載
の発明によれば、行または列単位で文字認識数が一致す
るもののみで多数決を行うので、常に比較する認識する
文字が一致した状態で多数決を行うことが可能となり、
より正確な文字認識を行うことが可能となるという作用
効果を奏する。As described above, according to the first aspect of the present invention, the majority decision is made only on the character recognition number in the row or column unit, so that the characters to be compared always match. It is possible to make a majority decision with
There is an operational effect that more accurate character recognition can be performed.
【0031】また請求項2記載の発明によれば、行また
は列単位の末尾近傍で文字認識数がずれた場合の認識結
果も多数決の対象として採用することが可能となり、よ
り正確な文字認識を行うことが可能となるという作用効
果を奏する。According to the second aspect of the present invention, the recognition result when the character recognition number is shifted near the end of each row or column can be adopted as a majority decision object, and more accurate character recognition can be performed. This has the effect of being able to perform the operation.
【0032】また請求項3記載の発明によれば、多数決
の結果を色分けして、元の画像情報の文字と重ねて表示
することで、画像情報での文字の比較で未時認識のエラ
ーの検出に際して多数決の結果を視覚的に認識すること
が可能となり、エラーの検出がさらに容易に可能となる
という作用効果を奏する。Further, according to the third aspect of the present invention, the result of the majority decision is color-coded and superimposed on the character of the original image information and displayed, so that the error of the unrecognized error in the comparison of the character in the image information is obtained. At the time of detection, it is possible to visually recognize the result of the majority decision, and it is possible to detect an error more easily.
【0033】また請求項4記載の発明によれば、一致率
毎に色階調を変化させて表示することにより、一致率の
結果を視覚的に認識することが可能となり、エラーの検
出がさらに容易に可能となるという作用効果を奏する。According to the fourth aspect of the present invention, since the color gradation is changed and displayed for each coincidence rate, it is possible to visually recognize the result of the coincidence rate, and the error can be further detected. There is an effect of being easily possible.
【0034】また請求項5記載の発明によれば、行また
は列単位で文字認識数が一致するもののみで多数決を行
うので、常に比較する認識する文字が一致した状態で多
数決を行うことが可能となり、より正確な文字認識を行
うことが可能となるという作用効果を奏する。According to the fifth aspect of the present invention, a majority decision is made only on a character having the same number of recognized characters in units of rows or columns, so that a majority decision can be made in a state where the characters to be compared always match. Thus, there is an operational effect that more accurate character recognition can be performed.
【0035】また請求項6記載の発明によれば、行また
は列単位の末尾近傍で文字認識数がずれた場合の認識結
果も多数決の対象として採用することが可能となり、よ
り正確な文字認識を行うことが可能となるという作用効
果を奏する。According to the present invention, the recognition result when the number of recognized characters is shifted near the end of each row or column can be adopted as a majority decision object, and more accurate character recognition can be performed. This has the effect of being able to perform the operation.
【図1】本発明の一実施例における、文字情報認識方法
の工程を示す説明図である。FIG. 1 is an explanatory diagram showing steps of a character information recognition method according to an embodiment of the present invention.
【図2】本発明のその他の実施例における、文字情報認
識方法の工程を示す説明図である。FIG. 2 is an explanatory diagram showing steps of a character information recognition method according to another embodiment of the present invention.
【図3】本発明の文字情報認識装置の構造の概略を示す
説明図である。FIG. 3 is an explanatory view schematically showing the structure of the character information recognition device of the present invention.
【図4】本発明における多数決の結果の文字毎に色分け
して、階層表示にして重ねて表示する、また文字毎の色
分けを、前記一致率毎に色階調を変化させて表示する方
法の一例を示す説明図である。FIG. 4 is a diagram showing a method of displaying a color by color for each character as a result of a majority decision and superimposing them in a hierarchical display according to the present invention, and displaying a color for each character by changing a color gradation for each coincidence rate. It is explanatory drawing which shows an example.
1…全一致文字 2…標準文字 3…標準外文字 1: All matched characters 2: Standard characters 3: Non-standard characters
Claims (6)
で複数の光学的文字認識装置を用い、前記複数の光学的
文字認識装置間で認識された文字の相違がある場合、複
数の光学的文字認識装置間の多数決によって認識された
文字を決定する文字情報認識方法において、 前記複数の光学的文字認識装置から任意の1つを標準の
光学的文字認識装置とし、その認識結果に対するその他
の光学的文字認識装置の、行または列単位での文字認識
結果の文字認識数が異なる認識をした前記その他の光学
的文字認識装置の認識結果を多数決の参照から除いて多
数決を行うことを特徴とする文字情報認識方法。1. A method for recognizing character information from image information, wherein a plurality of optical character recognition devices are used, and when there is a difference in recognized characters among the plurality of optical character recognition devices, a plurality of optical character recognition devices are used. In a character information recognition method for determining a character recognized by a majority decision between character recognition devices, any one of the plurality of optical character recognition devices may be used as a standard optical character recognition device, and other optics for the recognition result may be used. The character recognition result of the other optical character recognition device that recognizes the character recognition result of the character recognition result in a unit of row or column different from each other, and performs majority voting by excluding from the reference of majority voting. Character information recognition method.
で複数の光学的文字認識装置を用い、前記複数の光学的
文字認識装置間で認識された文字の相違がある場合、複
数の光学的文字認識装置間の多数決によって認識された
文字を決定する文字情報認識方法において、 前記複数の光学的文字認識装置から任意の1つを標準の
光学的文字認識装置とし、その認識結果に対するその他
の光学的文字認識装置の、行または列単位での文字認識
結果の一致率を測定し、一致率が所定値以下の場合、そ
の行または列に関する前記その他の光学的文字認識装置
の認識結果を多数決の参照から除いて多数決を行うこと
を特徴とする文字情報認識方法。2. A method for recognizing character information from image information, wherein a plurality of optical character recognition devices are used, and when there is a difference in recognized characters among the plurality of optical character recognition devices, a plurality of optical character recognition devices are used. In a character information recognition method for determining a character recognized by a majority decision between character recognition devices, any one of the plurality of optical character recognition devices may be used as a standard optical character recognition device, and other optics for the recognition result may be used. The matching rate of the character recognition result of the target character recognition device in units of rows or columns is measured, and when the matching ratio is equal to or less than a predetermined value, the recognition result of the other optical character recognition device for the row or column is determined by majority. A character information recognition method characterized by performing a majority decision excluding from a reference.
決の結果を文字毎に色分けして、階層表示にして重ねて
表示することを特徴とする請求項1、2のいずれか記載
の文字情報認識方法。3. The character according to claim 1, wherein the image information and the character information are displayed in a hierarchical display by superimposing the result of the majority decision by color for each character. Information recognition method.
記一致率毎に色階調を変化させて表示することを特徴と
する請求項3記載の文字情報認識方法4. The character information recognizing method according to claim 3, wherein a color classification for each character as a result of the majority decision is displayed by changing a color gradation for each of the coincidence rates.
段と、 前記画像情報から文字情報を認識するその他の複数の手
段と、 前記1つの手段の文字情報の認識結果と前記その他の複
数の手段の文字情報の認識結果の多数決を行うに関し
て、認識結果の1行または1列単位で認識された文字数
を求めて、前記その他の複数の手段の文字情報の認識結
果が前記1つの手段の文字情報の認識結果と一致しない
場合、その行または列に関する前記その他の文字認識手
段の認識結果を多数決の参照から除いて多数決を行う手
段と、 前記画像情報と、前記文字情報を前記多数決の結果を文
字毎に色分けして、階層表示にして重ねて表示する手段
と、前記文字パターンを修正可能とする手段と、 を有することを特徴とする文字情報認識装置。5. A means for recognizing character information from image information; a plurality of other means for recognizing character information from the image information; and a recognition result of character information of the one means and the other plurality of means. Regarding the majority decision of the recognition result of the character information of the means, the number of characters recognized in one line or one column of the recognition result is obtained, and the recognition result of the character information of the plurality of other means is the character of the one means. If the information does not match the recognition result, the majority of the row or column is excluded by referring to the recognition result of the other character recognition unit from the majority decision, and the image information and the character information are converted to the result of the majority decision. A character information recognizing device comprising: means for color-coding each character to display in a hierarchical display in a superimposed manner; and means for enabling the character pattern to be corrected.
段と、 前記画像情報から文字情報を認識するその他の複数の手
段と、 前記1つの手段の文字情報の認識結果と前記その他の複
数の手段の文字情報の認識結果の多数決を行うに関し
て、前記その他の複数の手段の文字情報の認識結果と前
記1つの手段の文字情報の認識結果の1行または1列単
位の一致率を求めて、一致率が所定値以下の場合、その
行または列に関する前記その他の文字認識手段の認識結
果を多数決の参照から除いて多数決を行う手段と、 前記画像情報と、前記文字情報を前記多数決の結果を文
字毎に色分けして、階層表示にして重ねて表示する手段
と、 前記文字パターンを修正可能とする手段と、 を有することを特徴とする文字情報認識装置。6. A means for recognizing character information from image information, a plurality of other means for recognizing character information from the image information, a recognition result of character information of the one means and the other plurality of means. Regarding the majority decision of the recognition result of the character information of the means, the match rate of the recognition result of the character information of the plurality of other means and the recognition result of the character information of the one means is obtained in one row or one column unit, When the matching rate is equal to or less than a predetermined value, a unit that performs a majority decision by excluding the recognition result of the other character recognition unit regarding the row or column from the majority decision reference, and the image information and the character information are used as a result of the majority decision. A character information recognizing device comprising: means for color-coding each character to display in a hierarchical display in a superimposed manner; and means for enabling the character pattern to be corrected.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001171484A JP2002366899A (en) | 2001-06-06 | 2001-06-06 | Method and device for character information recognition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001171484A JP2002366899A (en) | 2001-06-06 | 2001-06-06 | Method and device for character information recognition |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002366899A true JP2002366899A (en) | 2002-12-20 |
Family
ID=19013251
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001171484A Withdrawn JP2002366899A (en) | 2001-06-06 | 2001-06-06 | Method and device for character information recognition |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002366899A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006146901A (en) * | 2004-11-16 | 2006-06-08 | Internatl Business Mach Corp <Ibm> | Apparatus, system, program and method for detecting fraudulent character (apparatus, system and method for detecting fraudulent character using multiple scanning technologies) |
JP6474504B1 (en) * | 2018-01-23 | 2019-02-27 | 株式会社野村総合研究所 | Handwritten character recognition system |
CN111027556A (en) * | 2019-03-11 | 2020-04-17 | 广东小天才科技有限公司 | Question searching method based on image preprocessing and learning equipment |
JP2020135296A (en) * | 2019-02-18 | 2020-08-31 | 京セラドキュメントソリューションズ株式会社 | Information processing apparatus and information processing system |
JP7492404B2 (en) | 2020-08-13 | 2024-05-29 | 株式会社Pfu | Information processing device, input data error estimation method and program |
-
2001
- 2001-06-06 JP JP2001171484A patent/JP2002366899A/en not_active Withdrawn
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006146901A (en) * | 2004-11-16 | 2006-06-08 | Internatl Business Mach Corp <Ibm> | Apparatus, system, program and method for detecting fraudulent character (apparatus, system and method for detecting fraudulent character using multiple scanning technologies) |
JP6474504B1 (en) * | 2018-01-23 | 2019-02-27 | 株式会社野村総合研究所 | Handwritten character recognition system |
JP2019128690A (en) * | 2018-01-23 | 2019-08-01 | 株式会社野村総合研究所 | Handwritten character recognition system |
JP2020135296A (en) * | 2019-02-18 | 2020-08-31 | 京セラドキュメントソリューションズ株式会社 | Information processing apparatus and information processing system |
JP7298178B2 (en) | 2019-02-18 | 2023-06-27 | 京セラドキュメントソリューションズ株式会社 | Information processing device and information processing system |
CN111027556A (en) * | 2019-03-11 | 2020-04-17 | 广东小天才科技有限公司 | Question searching method based on image preprocessing and learning equipment |
CN111027556B (en) * | 2019-03-11 | 2023-12-22 | 广东小天才科技有限公司 | Question searching method and learning device based on image preprocessing |
JP7492404B2 (en) | 2020-08-13 | 2024-05-29 | 株式会社Pfu | Information processing device, input data error estimation method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105320951B (en) | Optical character recognition device and optical character recognition method | |
JPH0519753B2 (en) | ||
JPS63158678A (en) | Inter-word space detecting method | |
JP2002366899A (en) | Method and device for character information recognition | |
US20180246041A1 (en) | Print data processing method, print data processing device, and recording medium having recorded therein print data processing program | |
JP2011112398A (en) | Inspection method, inspection device and inspection program for image forming state | |
US20050186002A1 (en) | Printing condition inspection method, a character string inspection method and an inspection apparatus using the methods | |
JPH05274467A (en) | Data input device | |
US20130141767A1 (en) | Print Verification Database Mechanism | |
JP2004046723A (en) | Method for recognizing character, program and apparatus used for implementing the method | |
JP2001331765A (en) | Character recognizing device and character processing method | |
US11710331B2 (en) | Systems and methods for separating ligature characters in digitized document images | |
JPH0277891A (en) | Character recognition device | |
KR100837887B1 (en) | Optical Mark Recognition method by image process and Optical Mark Recognition card | |
JP2022051199A (en) | Image determination device, image determination method, and program | |
JPH04276885A (en) | Character segmenting appartus | |
JPH07306911A (en) | Ocr reading result correcting device | |
JPS62295192A (en) | Optical character image reader | |
JPH08123872A (en) | Optical character reader | |
JP2878772B2 (en) | Optical character reader | |
JPS5953977A (en) | Character recognizing device | |
JPH06243294A (en) | Character recognition postprocessing device | |
CN116067497A (en) | Color measuring system, terminal device, processing method, and recording medium | |
JPH03122786A (en) | Optical character reader | |
JPS6010671B2 (en) | pattern reading device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050324 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20070803 |