JP2003223608A - Method and device for correcting recognized character string, and computer program - Google Patents

Method and device for correcting recognized character string, and computer program

Info

Publication number
JP2003223608A
JP2003223608A JP2002022303A JP2002022303A JP2003223608A JP 2003223608 A JP2003223608 A JP 2003223608A JP 2002022303 A JP2002022303 A JP 2002022303A JP 2002022303 A JP2002022303 A JP 2002022303A JP 2003223608 A JP2003223608 A JP 2003223608A
Authority
JP
Japan
Prior art keywords
character
result
replacement
function
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002022303A
Other languages
Japanese (ja)
Other versions
JP4110786B2 (en
Inventor
Yuji Nakajima
雄二 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2002022303A priority Critical patent/JP4110786B2/en
Publication of JP2003223608A publication Critical patent/JP2003223608A/en
Application granted granted Critical
Publication of JP4110786B2 publication Critical patent/JP4110786B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To increase the accuracy of character correction while enabling the batch correction of the results of recognition. <P>SOLUTION: Any character based on an operation instruction from an operator is selected from among the text data of the results of recognition, and the selected character C1 is substituted for a substitute character C2 based on the operation instruction from the operator. Next the processed character is moved on the text data from the selected character C1 backward to determine whether character is the same as or similar to the selected character C1 (S270, S275). When the character is determined to be the same as or similar to the selected character, the character as an automatically corrected character Cm is temporarily substituted for the substitute character C2 (S290). Then the syntax at the front and rear of the substitute character C2 is analyzed (S300) and, when the syntax is discriminated to be correct, the substitution for the substitute character C2 is defined to be reasonable (S310 to 330). <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】この発明は、原稿を画像情報
として入力して文字の認識を行なう文字認識処理によっ
て得られた文字列を修正する技術に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a technique for correcting a character string obtained by a character recognition process in which an original is input as image information and characters are recognized.

【0002】[0002]

【従来の技術】文字認識処理を行なう文字認識装置にお
いては、予め用意しておいた文字辞書の各文字と入力文
字とを比較し、一致度の最も高い文字を認識結果として
いる。しかし、この認識結果は必ずしも正しいとは限ら
ないので、その後、認識結果としての文字列をディスプ
レイに表示し、誤って認識された文字を画面上で修正可
能な構成となっていた。つまり、画面上で修正対象文字
が指示されると、認識時に一致度が比較的高かった複数
の文字を次の順位の候補文字として表示し、そのなかに
正解文字があればその文字を選択させ、なければ、例え
ば、かな漢字変換方式などによりキーボードから正解文
字を入力させる。
2. Description of the Related Art In a character recognition apparatus for performing character recognition processing, each character in a character dictionary prepared in advance is compared with an input character, and the character with the highest degree of coincidence is taken as the recognition result. However, since the recognition result is not always correct, the character string as the recognition result is then displayed on the display, and the erroneously recognized character can be corrected on the screen. In other words, when the character to be corrected is specified on the screen, multiple characters that have a relatively high degree of matching at the time of recognition are displayed as candidate characters in the next rank, and if there is a correct character among them, the character is selected. If not, for example, the correct character is input from the keyboard by the kana-kanji conversion method or the like.

【0003】ところで、上記文字認識装置では、同じ文
字を複数箇所で誤って認識することが多々ある。こうし
た場合に、一文字一文字、上記の修正作業を行っていて
は、作業性が悪く、誤り修正に要する時間は長時間に及
んでしまう。このために、1つの誤認識文字を修正する
際に、その誤認識文字と一致した画像情報も探し出し、
一度に複数の箇所を修正できる一括修正機能を搭載した
文字認識装置が提案されている。
By the way, in the above character recognition device, the same character is often erroneously recognized at a plurality of places. In such a case, if the above-mentioned correction work is performed character by character, the workability is poor and the time required for error correction extends for a long time. For this reason, when correcting one misrecognized character, the image information that matches the misrecognized character is also searched for,
A character recognition device equipped with a batch correction function capable of correcting a plurality of points at once has been proposed.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、上記従
来の技術では、画像情報として読み取った文字が、上記
修正対象文字と類似する文字である場合、この類似する
文字も一括して修正されることになり、正しく認識され
た文字まで誤って変更されることがあった。この結果、
文字修正の精度が低下するという問題があった。
However, in the above conventional technique, when the character read as the image information is a character similar to the correction target character, the similar character is also collectively corrected. Sometimes, even correctly recognized characters were changed accidentally. As a result,
There was a problem that the accuracy of character correction was reduced.

【0005】この発明は、上記問題に鑑みてなされたも
ので、認識結果の一括修正を可能としながらも、文字修
正の精度の向上を図ることを目的としている。
The present invention has been made in view of the above problems, and an object thereof is to improve the accuracy of character correction while enabling batch correction of recognition results.

【0006】[0006]

【課題を解決するための手段およびその作用・効果】前
述した課題の少なくとも一部を解決するための手段とし
て、以下に示す構成をとった。
[Means for Solving the Problem and Its Action / Effect] As a means for solving at least a part of the above-mentioned problems, the following constitution is adopted.

【0007】この発明の認識文字列修正方法は、原稿を
画像情報として入力して文字の認識を行なう文字認識処
理によって得られた文字列を修正する認識文字列修正方
法であって、(a)作業者の操作指令に基づいて、前記
文字列の中から任意の文字を選択するステップと、
(b)該選択された任意の文字を、作業者の操作指令に
従う所定の文字に置換するステップと、(c)前記文字
列の中から、前記ステップ(a)により選択された任意
の文字と略一致する文字を自動修正対象文字として順に
選択するステップと、(d)前記自動修正対象文字を、
前記所定の文字に置換するステップと、(e)前記ステ
ップ(d)により置換された文字の前後についての構文
を解析するステップと、(f)前記ステップ(e)によ
る構文の解析の結果に基づいて、前記ステップ(d)に
よる置換の結果を正当なものと確定するステップとを備
えることを特徴としている。
The recognized character string correction method of the present invention is a recognized character string correction method for correcting a character string obtained by a character recognition process of inputting a document as image information and recognizing characters. A step of selecting an arbitrary character from the character string based on an operator's operation command;
(B) a step of replacing the selected arbitrary character with a predetermined character according to an operator's operation command, and (c) an arbitrary character selected from the character string in the step (a). A step of sequentially selecting substantially matching characters as a character to be automatically corrected, and (d) the character to be automatically corrected,
Based on the result of the syntax analysis by the step (e), the step of substituting with the predetermined character; (e) the step of analyzing the syntax before and after the character replaced by the step (d); And the step of determining the result of the replacement in step (d) as valid.

【0008】ここで、上記文字認識処理は、原稿を表わ
す画像情報を入力するものであれば、画像情報読取装置
を駆動して原稿の画像情報を直接、読み取るものであっ
てもよいし、画像情報読取装置を用いて予め得た原稿の
画像情報を記憶装置から読み出すものであってもよい。
また、上記略一致とは、完全に一致するものであっても
よいし、類似するものであってもよいし、一致と類似の
両方を含むものであってもよい。
The character recognition processing may be performed by driving the image information reading device to directly read the image information of the original as long as the image information representing the original is input. The image information of the document obtained in advance by using the information reading device may be read from the storage device.
In addition, the above-mentioned “substantial match” may be a complete match, a similar match, or a match and a similar match.

【0009】上記構成(以下、基本構成と呼ぶ)の認識
文字列修正方法によれば、ステップ(a)、(b)によ
り、作業者の操作指令に基づいて、認識された文字列
(以下、認識文字列と呼ぶ)の中から任意の文字が選択
されて、所定の文字に置換される。ステップ(c)によ
り、認識文字列の中から、その選択された任意の文字と
略一致する文字が、自動修正対象文字として順に選択さ
れ、ステップ(d)により、所定の文字に一旦置換され
る。その置換された文字の前後についての構文が、ステ
ップ(e)により解析されて、その解析の結果に基づい
て、ステップ(f)により、上位置換の結果が正当なも
のに確定される。
According to the method for correcting a recognized character string having the above configuration (hereinafter referred to as a basic configuration), the recognized character string (hereinafter, referred to as the character string based on the operation instruction of the operator is executed in steps (a) and (b). An arbitrary character is selected from among the recognition character strings) and is replaced with a predetermined character. In step (c), the characters that substantially match the selected arbitrary character are sequentially selected from the recognized character strings as automatic correction target characters, and in step (d), they are once replaced with predetermined characters. . The syntax before and after the replaced character is analyzed in step (e), and based on the result of the analysis, in step (f), the result of the upper replacement is determined to be valid.

【0010】したがって、この発明の認識文字列修正方
法によれば、自動的に行なった文字の修正が正しい構文
となる場合に限り、その修正が正当なものと確定され
る。このために、文字修正の精度を向上することができ
るという効果を奏する。
Therefore, according to the recognized character string correction method of the present invention, the correction is confirmed as valid only when the automatically corrected character has the correct syntax. Therefore, there is an effect that the accuracy of character correction can be improved.

【0011】上記構成の認識文字列修正方法において、
(g)前記ステップ(f)による構文の解析の結果が正
しい構文でないことを示すものであるとき、前記自動修
正対象文字を前記ステップ(d)による置換がなされる
前の状態に戻すステップを備える構成とすることができ
る。
In the recognition character string correction method having the above structure,
(G) a step of returning the automatic correction target character to the state before the replacement in step (d) when the result of the syntax analysis in step (f) indicates that the syntax is not correct It can be configured.

【0012】この構成によれば、自動的に行なった文字
の修正が正しい構文でない場合に、その修正は元に戻さ
れる。このために、文字修正の精度をより向上すること
ができる。
According to this structure, when the automatically made correction of the character is not the correct syntax, the correction is undone. Therefore, the accuracy of character correction can be further improved.

【0013】上記構成の認識文字列修正方法において、
(h)前記ステップ(f)によって正当なものと確定さ
れた置換の文字を、他の文字に対して識別可能に表示す
るステップを備える構成とすることができる。
In the recognition character string correction method having the above structure,
(H) It may be configured to include a step of displaying the replacement character determined to be valid in the step (f) so as to be distinguishable from other characters.

【0014】この構成によれば、置換の結果が正当なも
のと確定されたものについて、他の文字に対して識別可
能に表示がなされる。このために、自動的に修正された
文字であることを、作業者はその表示から知ることがで
きる。
According to this structure, a character whose substitution result is determined to be valid is displayed in a distinguishable manner with respect to other characters. Therefore, the operator can know from the display that the characters are automatically corrected.

【0015】上記構成の認識文字列修正方法において、
前記ステップ(f)は、(f−1)前記ステップ(f)
による構文の解析の結果が正しい構文であることを示す
ものであるとき、前記ステップ(d)による置換の結果
を受け入れるかを、作業者に問い合わせるステップと、
(f−2)前記ステップ(f−1)の問い合わせに対す
る作業者からの操作指令に基づいて前記置換の結果を受
け入れると判定されたとき、前記ステップ(d)による
置換の結果を正当なものと確定するステップとを備える
構成とすることができる。
In the recognition character string correction method having the above structure,
The step (f) includes (f-1) the step (f)
When the result of parsing the syntax by means of correct syntax is inquired to the operator whether to accept the result of the replacement by the step (d),
(F-2) When it is determined that the result of the replacement is accepted based on the operation command from the operator in response to the inquiry in the step (f-1), the result of the replacement in the step (d) is validated. And a step of confirming.

【0016】この構成によれば、作業者に対して、修正
の結果を受け入れることができるかを問い合わせること
ができることから、文字修正の精度をより一層向上する
ことができる。
According to this structure, since it is possible to inquire of the operator whether or not the result of the correction can be accepted, it is possible to further improve the accuracy of the character correction.

【0017】この構成によれば、複数の候補文字列デー
タの中から照合結果の優れた候補文字列データを選ん
で、その選んだ候補文字列データを変換結果として出力
することが可能となる。
According to this structure, it is possible to select candidate character string data having an excellent matching result from a plurality of candidate character string data and output the selected candidate character string data as a conversion result.

【0018】上記構成の認識文字列修正方法において、
前記ステップ(a)により選択される任意の文字が、連
続する複数の文字から構成されるとき、前記ステップ
(b)による置換は、前記連続する複数の文字を一つの
所定の文字に置換する構成とすることができる。
In the recognition character string correction method having the above structure,
When the arbitrary character selected in the step (a) is composed of a plurality of continuous characters, the replacement in the step (b) replaces the plurality of continuous characters with one predetermined character. Can be

【0019】この構成によれば、1文字を表わす画像デ
ータから複数の文字が認識された場合、例えば、「時」
の画像データから「日」の文字と「寺」の文字が分離さ
れて認識された場合に、これらを元の1文字に修正する
ことができる。
According to this structure, when a plurality of characters are recognized from the image data representing one character, for example, "hour"
When the characters of "day" and the characters of "temple" are recognized separately from the image data of, it is possible to correct them to the original one character.

【0020】上記構成の認識文字列修正方法において、
前記ステップ(b)による置換は、1文字を複数の文字
に置換する構成とすることができる。
In the recognition character string correction method having the above structure,
The replacement in step (b) can be configured to replace one character with a plurality of characters.

【0021】この構成によれば、複数の文字を表わす画
像データから1文字が認識された場合に、これを元の複
数の文字に修正することができる。
According to this structure, when one character is recognized from the image data representing a plurality of characters, it can be corrected to the original plurality of characters.

【0022】この発明の認識文字列修正装置は、原稿を
画像情報として入力して文字の認識を行なう文字認識処
理によって得られた文字列を修正する認識文字列修正装
置であって、作業者の操作指令に基づいて、前記文字列
の中から任意の文字を選択する手動修正対象文字選択手
段と、該選択された任意の文字を、作業者の操作指令に
従う所定の文字に置換する手動修正手段と、前記文字列
の中から、前記手動修正対象文字選択手段により選択さ
れた任意の文字と略一致する文字を自動修正対象文字と
して順に選択する自動修正対象文字選択手段と、前記自
動修正対象文字を、前記所定の文字に置換する自動修正
手段と、前記自動修正手段により置換された文字の前後
についての構文を解析する構文解析手段と、前記構文解
析手段による構文の解析の結果に基づいて、前記自動修
正手段による置換の結果を正当なものと確定する修正結
果確定手段とを備えることを特徴としている。
The recognized character string correction device of the present invention is a recognized character string correction device for correcting a character string obtained by a character recognition process for inputting a document as image information and recognizing characters. Manual correction target character selection means for selecting an arbitrary character from the character string based on an operation command, and manual correction means for replacing the selected arbitrary character with a predetermined character according to an operation command of an operator. And an automatic correction target character selecting unit that sequentially selects, as the automatic correction target character, a character that substantially matches an arbitrary character selected by the manual correction target character selecting unit from the character string, and the automatic correction target character Is replaced by the predetermined character, an automatic correction means, a syntax analysis means for analyzing the syntax before and after the character replaced by the automatic correction means, and a syntax by the syntax analysis means Based on the results of the analysis, it is characterized by comprising a modification result determination means for determining a valid result of substitution by the automatic correction means.

【0023】上記構成の認識文字列修正方法は、上記発
明の認識文字列修正装置と同様な作用・効果を有してお
り、文字修正の精度を向上することができる。
The recognized character string correcting method having the above-described structure has the same operation and effect as the recognized character string correcting apparatus of the present invention, and can improve the accuracy of character correction.

【0024】この発明のコンピュータプログラムは、原
稿を画像情報として入力して文字の認識を行なう文字認
識処理によって得られた文字列を修正する処理を実行す
るコンピュータプログラムであって、(a)作業者の操
作指令に基づいて、前記文字列の中から任意の文字を選
択する機能と、(b)該選択された任意の文字を、作業
者の操作指令に従う所定の文字に置換する機能と、
(c)前記文字列の中から、前記機能(a)により選択
された任意の文字と略一致する文字を自動修正対象文字
として順に選択する機能と、(d)前記自動修正対象文
字を、前記所定の文字に置換する機能と、(e)前記機
能(d)により置換された文字の前後についての構文を
解析する機能と、(f)前記機能(e)による構文の解
析の結果に基づいて、前記機能(d)による置換の結果
を正当なものと確定する機能とを、コンピュータに実現
させることを特徴としている。
A computer program according to the present invention is a computer program for executing a process of correcting a character string obtained by a character recognition process of inputting a document as image information and recognizing a character. A function of selecting an arbitrary character from the character string based on the operation command of (b), and a function of (b) replacing the selected arbitrary character with a predetermined character according to an operation command of the operator,
(C) a function of sequentially selecting, from the character strings, characters that substantially match an arbitrary character selected by the function (a) as a character to be automatically corrected; and (d) the character to be automatically corrected, Based on the function of replacing with a predetermined character, (e) the function of analyzing the syntax before and after the character replaced by the function (d), and (f) the result of the syntax analysis by the function (e). , A function of determining the result of the replacement by the function (d) as a valid one is realized by a computer.

【0025】上記構成のコンピュータプログラムは、上
記発明の認識文字列修正装置や認識文字列修正方法と同
様な作用・効果を有しており文字修正の精度を向上する
ことができる。
The computer program having the above configuration has the same operation and effect as the recognized character string correction device and the recognized character string correction method of the present invention, and can improve the accuracy of character correction.

【0026】この発明の記録媒体は、この発明のコンピ
ュータプログラムを記録したコンピュータ読み取り可能
な記録媒体を特徴としている。この記録媒体は、この発
明の各コンピュータプログラムと同様な作用・効果を有
している。
The recording medium of the present invention is characterized by a computer-readable recording medium recording the computer program of the present invention. This recording medium has the same operations and effects as the computer programs of the present invention.

【0027】[0027]

【発明の他の態様】この発明は、以下のような他の態様
も含んでいる。その第1の態様は、この発明のコンピュ
ータプログラムを通信経路を介して供給するプログラム
供給装置としての態様である。この第1の態様では、コ
ンピュータプログラムをコンピュータネットワーク上の
サーバなどに置き、通信経路を介して、必要なプログラ
ムをコンピュータにダウンロードし、これを実行するこ
とで、上記の装置や方法を実現することができる。
Other Embodiments of the Invention The present invention also includes the following other embodiments. A first aspect thereof is an aspect as a program supply device for supplying the computer program of the present invention via a communication path. In the first aspect, the computer program is placed in a server or the like on a computer network, the necessary program is downloaded to a computer via a communication path, and the computer is executed to realize the above-described device or method. You can

【0028】[0028]

【発明の実施の形態】以上説明したこの発明の構成・作
用を一層明らかにするために、以下この発明の実施の形
態を実施例に基づき説明する。
BEST MODE FOR CARRYING OUT THE INVENTION In order to further clarify the structure and operation of the present invention described above, the embodiments of the present invention will be described below based on Examples.

【0029】1.ハードウェアの全体構成 図1は、この発明の第1実施例を適用するコンピュータ
システムのハードウェアの概略構成を示すブロック図で
ある。このコンピュータシステムは、いわゆるパーソナ
ルコンピュータ(以下、単にコンピュータと呼ぶ)を中
心に備え、その周辺にCRTディスプレイ12およびイ
メージスキャナ14を備える。コンピュータは、コンピ
ュータ本体16とキーボード18とマウス20を備え
る。なお、このコンピュータ本体16には、CD−RO
M22の内容を読み取るCDドライブ24が搭載されて
いる。
1. Overall Hardware Configuration FIG. 1 is a block diagram showing the schematic hardware configuration of a computer system to which the first embodiment of the present invention is applied. The computer system mainly includes a so-called personal computer (hereinafter, simply referred to as a computer), and a CRT display 12 and an image scanner 14 are provided around the personal computer. The computer includes a computer main body 16, a keyboard 18, and a mouse 20. It should be noted that the computer main body 16 includes a CD-RO.
A CD drive 24 for reading the contents of M22 is mounted.

【0030】コンピュータ本体16は、中央演算処理装
置としてのCPU30を中心にバスにより相互に接続さ
れたROM31、RAM32、表示画像メモリ33、マ
ウスインタフェース34、キーボードインタフェース3
5、CDC36、HDC37、CRTC38、入出力機
用インタフェース40およびI/Oポート41を備え
る。ROM31は、内蔵されている各種プログラム等を
記憶する読み出し専用のメモリである。RAM32は、
各種データ等を記憶する読み出し・書込み可能なメモリ
である。表示画像メモリ33は、CRTディスプレイ1
2に表示する画像の画像データを記憶するメモリであ
る。
The computer main body 16 has a CPU 31, which is a central processing unit, as a center, and a ROM 31, a RAM 32, a display image memory 33, a mouse interface 34, and a keyboard interface 3 which are interconnected by a bus.
5, CDC 36, HDC 37, CRTC 38, I / O interface 40 and I / O port 41. The ROM 31 is a read-only memory that stores therein various programs and the like. RAM32 is
It is a readable / writable memory that stores various data. The display image memory 33 is the CRT display 1
2 is a memory for storing the image data of the image to be displayed in 2.

【0031】マウスインタフェース34は、マウス20
とのデータ等のやり取りを司るインタフェースである。
キーボードインタフェース35は、キーボード18から
のキー入力を司るインタフェースである。CDC36
は、CDドライブ(CDD)24を制御するCDコント
ローラである。HDC37は、ハードディスクドライブ
(HDD)42を制御するハードディスクコントローラ
である。HDD42には、後述するコンピュータプログ
ラムや、後述する文字認識に用いられる文字辞書や、後
述する構文解析に用いられる単語辞書およびルール辞書
等が予め記憶されている。
The mouse interface 34 is used for the mouse 20.
It is an interface that controls the exchange of data and so on.
The keyboard interface 35 is an interface that controls key input from the keyboard 18. CDC36
Is a CD controller that controls the CD drive (CDD) 24. The HDC 37 is a hard disk controller that controls a hard disk drive (HDD) 42. The HDD 42 stores in advance a computer program described later, a character dictionary used for character recognition described later, a word dictionary and a rule dictionary used for syntax analysis described later, and the like.

【0032】CRTC38は、表示画像メモリ33に記
憶される表示画像データに基づいてCRTディスプレイ
12における画像の表示を制御するCRTコントローラ
である。入出力機用インタフェース40は、外部に接続
された入出力機器、この実施例ではイメージスキャナ1
4へのデータの入出力を制御するインタフェースであ
る。I/Oポート41は、シリアル出力のポートを備え
ており、モデム44に接続されており、このモデム44
を介して、公衆電話回線46に接続されている。コンピ
ュータ本体16は、モデム44を介して、外部のネット
ワークに接続されており、特定のサーバ47に接続可能
となっている。
The CRTC 38 is a CRT controller that controls the display of an image on the CRT display 12 based on the display image data stored in the display image memory 33. The input / output device interface 40 is an input / output device connected to the outside, which is the image scanner 1 in this embodiment.
4 is an interface for controlling input / output of data to / from. The I / O port 41 has a serial output port and is connected to the modem 44.
Is connected to the public telephone line 46 via. The computer main body 16 is connected to an external network via a modem 44 and can be connected to a specific server 47.

【0033】このコンピュータシステムでは、オペレー
ティングシステムはHDD42に記憶されており、コン
ピュータ本体16に電源を投入すると、HDD42のブ
ートブロックに書き込まれたローダに従ってRAM32
の所定の領域にロードされる。また、イメージスキャナ
14で取り込んだ画像(以下、スキャン画像と呼ぶ)を
テキストデータに変換する文字認識用ソフトウェア(コ
ンピュータプログラム)は、CD−ROM22に予め格
納されており、所定のインストールプログラムを起動す
ることで、CDドライブ24からコンピュータ本体16
にインストールされる。このインストールされたコンピ
ュータプログラムは、HDD42に記憶されており、所
定の起動命令を受けたときに、RAM32の所定の領域
にロードされる。
In this computer system, the operating system is stored in the HDD 42, and when the computer main body 16 is powered on, the RAM 32 follows the loader written in the boot block of the HDD 42.
Is loaded into a predetermined area of. Further, character recognition software (computer program) for converting an image captured by the image scanner 14 (hereinafter referred to as a scan image) into text data is stored in the CD-ROM 22 in advance and starts a predetermined installation program. From the CD drive 24 to the computer body 16
Installed on. The installed computer program is stored in the HDD 42 and is loaded into a predetermined area of the RAM 32 when a predetermined start command is received.

【0034】このコンピュータプログラムをCPU30
が実行することによって本発明の各種構成要件は実現さ
れる。このコンピュータプログラムは、前述したよう
に、CD−ROM22に格納されたものであるが、これ
に替えて、フロッピィディスク、光磁気ディスク、IC
カード等の他の携帯型記録媒体(可搬型記録媒体)に格
納された構成としてもよい。また、前述したコンピュー
タプログラムは、外部のネットワークに接続される特定
のサーバ47から、ネットワークを介して提供されるプ
ログラムデータをダウンロードして、RAM32または
HDD42に転送することにより得るようにすることも
できる。なお、上記ネットワークとしては、インターネ
ットであってもよく、特定のホームページからダウンロ
ードして得たコンピュータプログラムであってもよい。
あるいは、電子メールの添付ファイルの形態で供給され
たコンピュータプログラムであってもよい。
This computer program is executed by the CPU 30.
By executing the above, various constituent requirements of the present invention are realized. As described above, this computer program is stored in the CD-ROM 22, but instead of this, a floppy disk, a magneto-optical disk, an IC
It may be configured to be stored in another portable recording medium (portable recording medium) such as a card. Further, the computer program described above can be obtained by downloading program data provided via a network from a specific server 47 connected to an external network and transferring the program data to the RAM 32 or the HDD 42. . The network may be the Internet or a computer program downloaded from a specific home page.
Alternatively, it may be a computer program supplied in the form of an email attachment.

【0035】以上説明したハードウェア構成を有するコ
ンピュータシステムによる文字認識用ソフトウェアに従
う制御処理の様子について次に説明する。図2は、コン
ピュータ本体16によって実行される文字認識用ソフト
ウェア50に従う処理の様子を示すブロック図である。
The state of control processing according to the character recognition software by the computer system having the above-described hardware configuration will be described below. FIG. 2 is a block diagram showing a state of processing according to the character recognition software 50 executed by the computer main body 16.

【0036】図2に示すように、コンピュータ本体16
の内部で動作している文字認識用ソフトウェア50によ
れば、まず、スキャン画像取込部51によりスキャナド
ライバ60を動作させてイメージスキャナ14から文書
の記載された原稿Pの画像(スキャン画像)を取り込む
処理を行なう。次いで、スキャン画像取込部51によっ
て取り込まれたスキャン画像についての文字認識を、文
字列認識モジュール52によって行なう。この文字列認
識モジュール52によって、原稿に記載された文字列の
データ(テキストデータ)が得られる。
As shown in FIG. 2, the computer main body 16
According to the character recognizing software 50 operating inside, first, the scanner driver 60 is operated by the scan image capturing unit 51 so that the image (scan image) of the document P in which the document is written is obtained from the image scanner 14. Perform the import process. Then, the character string recognition module 52 performs character recognition on the scanned image captured by the scanned image capturing unit 51. By the character string recognition module 52, the data (text data) of the character string written on the document can be obtained.

【0037】続いて、文字列認識モジュール52により
得られた文字列のデータを、認識文字列修正モジュール
53によって修正する。認識文字列修正モジュール53
の働きは、詳しくは、次のようなものである。まず、作
業者によるマウス20もしくはキーボード18の操作指
令に基づいて、手動修正対象文字選択部53aにより、
前記テキストデータの中から任意の文字を選択する。次
いで、その選択された任意の文字を、作業者によるキー
ボード18もしくはマウス20の操作指令に従う所定の
文字に、手動修正部53bにより置換する。
Next, the recognized character string correction module 53 corrects the character string data obtained by the character string recognition module 52. Recognition character string correction module 53
The function of is, in detail, as follows. First, based on the operation command of the mouse 20 or the keyboard 18 by the operator, the manual correction target character selection unit 53a
An arbitrary character is selected from the text data. Then, the selected arbitrary character is replaced with a predetermined character according to an operation command of the keyboard 18 or the mouse 20 by the operator by the manual correction unit 53b.

【0038】続いて、文字列認識モジュール52によっ
て得られた文字列のデータの中から、手動修正対象文字
選択部53aにより選択された任意の文字と略一致する
文字を、自動修正対象文字選択部53cによって、自動
修正対象文字として順に選択する。その後、その自動修
正対象文字を、自動修正部53dにより、前記所定の文
字に置換する。続いて、その自動修正部53dにより置
換された文字の前後についての構文を、構文解析部53
eにより解析する。続いて、その構文の解析の結果に基
づいて、自動修正部53dによる置換の結果を、修正結
果確定部53fにより正当なものと確定する。
Next, from the character string data obtained by the character string recognition module 52, a character that substantially matches an arbitrary character selected by the manual correction target character selection section 53a is selected as an automatic correction target character selection section. The characters 53c are sequentially selected as the characters to be automatically corrected. After that, the automatic correction target character is replaced by the predetermined character by the automatic correction unit 53d. Next, the syntax before and after the character replaced by the automatic correction unit 53d is analyzed by the syntax analysis unit 53d.
Analyze by e. Then, based on the result of the syntax analysis, the result of replacement by the automatic correction unit 53d is confirmed by the correction result confirmation unit 53f as valid.

【0039】手動修正部53bおよび修正結果確定部5
3fにより定まった文字列データは、ディスプレイドラ
イバ70を介してCRTディスプレイ12へ送られて表
示される。
Manual correction unit 53b and correction result confirmation unit 5
The character string data determined by 3f is sent to the CRT display 12 via the display driver 70 and displayed.

【0040】コンピュータ本体16のCPU30で文字
認識用ソフトウェア50を実行することで、上述した文
字列認識モジュール52および認識文字列修正モジュー
ル53を実現している。文字認識用ソフトウェア50に
従う制御処理について、以下詳細に説明する。図3は、
この制御処理のルーチンを示すフローチャートである。
このルーチンは、文字認識用ソフトウェア50を実行さ
せる旨の指示がなされた以後、所定時間毎に繰り返し実
行される。
By executing the character recognition software 50 by the CPU 30 of the computer main body 16, the above-mentioned character string recognition module 52 and the recognized character string correction module 53 are realized. The control processing according to the character recognition software 50 will be described in detail below. Figure 3
It is a flow chart which shows the routine of this control processing.
This routine is repeatedly executed at predetermined time intervals after the instruction to execute the character recognition software 50 is issued.

【0041】図示するように、処理が開始されると、C
PU30は、まず、この文字認識用ソフトウェア50の
起動後、最初であるか否かを判別する(ステップS10
0)。ここで、最初であると判別されたときには、アプ
リケーションウィンドウWDを初期状態でCRTディス
プレイ12に表示する処理を行なう(ステップS11
0)。図4は、初期状態のアプリケーションウィンドウ
WDを示す説明図である。図示するように、アプリケー
ションウィンドウWDには、メニューバーBR1とツー
ルバーBR2,BR3とが設けられている。ツールバー
BR2には、後述する一括修正ボタンBT11と結合ボ
タンBT12と分離ボタンBT13と再認識ボタンBT
14が設けられている。ツールバーBR3には、作業手
順に従った順にコマンドを実行するための「スキャ
ン」、「領域抽出」、「認識」、「保存」のボタンBT
1,BT2,BT3,BT4が設けられている。なお、
図3に戻って、ステップS100で最初でないと判別さ
れたときには、ステップS110の処理は実行しない。
As shown, when the process is started, C
The PU 30 first determines whether or not it is the first time after the activation of the character recognition software 50 (step S10).
0). Here, when it is determined that it is the first time, a process of displaying the application window WD on the CRT display 12 in the initial state is performed (step S11).
0). FIG. 4 is an explanatory diagram showing the application window WD in the initial state. As shown in the figure, the application window WD is provided with a menu bar BR1 and toolbars BR2, BR3. The toolbar BR2 includes a batch correction button BT11, a combination button BT12, a separation button BT13, and a re-recognition button BT, which will be described later.
14 are provided. On the toolbar BR3, the buttons BT for "scan", "area extraction", "recognition", and "save" for executing the commands in order according to the work procedure.
1, BT2, BT3, BT4 are provided. In addition,
Returning to FIG. 3, when it is determined in step S100 that it is not the first, the process of step S110 is not executed.

【0042】次いで、CPU30は、ツールバーBR3
上の「スキャン」のボタンBT1が、マウス20によっ
てクリック操作されたか否かを判別する(ステップS1
20)。ここで、肯定判別されたときには、CPU30
は、文字認識の対象となる原稿Pをスキャンするスキャ
ン処理を実行する(ステップS130)。原稿Pは、例
えば、文書の記載された書類である。ステップS130
では、CPU30は、スキャナドライバ60を動作させ
て、原稿Pがセットされたイメージスキャナ14から原
稿Pの画像を示すスキャン画像データを取り込む。ステ
ップS130の実行後、「リターン」に抜けて処理を一
旦終了する。なお、このステップS130の構成に替え
て、イメージスキャナを用いて取り込んだ原稿Pのスキ
ャン画像を予めHDD42に格納しておき、このHDD
42内のスキャン画像を読み出す構成とすることもでき
る。すなわち、原稿Pを画像情報として入力できるもの
であれば、イメージスキャナを用いてその都度読み出す
構成としてもよいし、予めHDD42等の記憶手段に用
意しておき、その記憶手段から読み出す構成とすること
もできる。また、原稿の画像情報をネットワークを介し
て外部から取り込む構成とすることもできる。
Next, the CPU 30 causes the toolbar BR3.
It is determined whether or not the "scan" button BT1 above is clicked by the mouse 20 (step S1).
20). Here, when the determination is affirmative, the CPU 30
Performs scan processing for scanning the document P that is the target of character recognition (step S130). The manuscript P is, for example, a document in which a document is described. Step S130
Then, the CPU 30 operates the scanner driver 60 to take in the scan image data indicating the image of the document P from the image scanner 14 on which the document P is set. After the execution of step S130, the process returns to "return" to end the process once. It should be noted that, instead of the configuration of step S130, the scan image of the document P captured by using the image scanner is stored in the HDD 42 in advance, and this HDD is stored.
It is also possible to adopt a configuration in which the scan image in 42 is read out. That is, as long as the document P can be input as image information, the image scanner may be used to read each time, or it may be prepared in advance in a storage unit such as the HDD 42 and read from the storage unit. You can also Further, the image information of the document may be taken in from the outside via a network.

【0043】一方、ステップS120で否定判別された
ときには、CPU30は、ステップS140に処理を進
めて、「領域抽出」のボタンBT2が、マウス20によ
ってクリック操作されたか否かを判別する。ここで、肯
定判別されたときには、CPU30は、領域抽出処理を
実行する(ステップS150)。この領域抽出処理は、
ステップS130のスキャン処理により取り込まれたス
キャン画像データから、文字列認識の対象となる任意の
画像領域を抽出するものである。作業者は、アプリケー
ションウィンドウWDに表示された原稿Pのスキャン画
像に対して、マウス20を用いて、文字列認識の対象と
したい画像領域の範囲を指定する操作を行なう。CPU
30は、この作業者によるマウス操作を受けて、そのマ
ウス20によって指定された画像領域のデータをスキャ
ン画像データの中から抽出する。この領域抽出処理が終
了すると、「リターン」に抜けてこの処理を一旦終了す
る。
On the other hand, when a negative decision is made in step S120, the CPU 30 advances the processing to step S140, and decides whether or not the "area extraction" button BT2 has been clicked by the mouse 20. Here, when the determination is affirmative, the CPU 30 executes a region extraction process (step S150). This area extraction process
From the scan image data taken in by the scan processing of step S130, an arbitrary image area that is a target of character string recognition is extracted. Using the mouse 20, the operator performs an operation of designating the range of the image area to be the target of character string recognition for the scan image of the document P displayed in the application window WD. CPU
In response to the mouse operation by the operator, the reference numeral 30 extracts the data of the image area designated by the mouse 20 from the scan image data. When this area extraction processing is completed, the process returns to "return" and this processing is once completed.

【0044】一方、ステップS140で否定判別された
場合には、ステップS160に処理を進める。なお、フ
ローチャートには詳細に記載されていないが、ステップ
S140で肯定判別された場合でも、ステップS130
のスキャン処理の実行後でない場合には、ステップS1
60に処理を進める。
On the other hand, if the determination in step S140 is negative, the process proceeds to step S160. Although not described in detail in the flow chart, even if a positive determination is made in step S140, step S130
If it is not after the execution of the scan processing in step S1, step S1
The process proceeds to 60.

【0045】ここまでの処理によって、HDD42に
は、文字認識の対象となる画像データ(以下、認識対象
画像データと呼ぶ)として、ステップS150の領域抽
出処理により得られた抽出画像データが用意されること
になる。なお、ステップS130のスキャン処理が実行
されただけで、ステップS150の領域抽出処理が実行
されていない場合には、ステップS130のスキャン処
理で得られたスキャン画像データが、そのまま認識対象
画像データとなる。
By the processing up to this point, the extracted image data obtained by the area extraction processing in step S150 is prepared in the HDD 42 as image data to be subjected to character recognition (hereinafter referred to as recognition target image data). It will be. If only the scan process of step S130 is executed but the region extraction process of step S150 is not executed, the scan image data obtained by the scan process of step S130 becomes the recognition target image data as it is. .

【0046】ステップS160に処理が移行すると、ツ
ールバーBR3上の「認識」のボタンBT3が、マウス
20によってクリック操作されたか否かを判別する。こ
こで、肯定判別されたときには、CPU30は、認識対
象画像データをテキストデータに変換する文字列認識処
理を実行する(ステップS170)。この文字列認識処
理は、HDD42に予め用意した文字辞書(この文字認
識用ソフトウェア50で用意されている)の各文字と、
認識対象画像データで表わされる各文字についての画像
とを比較し、一致度の最も高い文字を認識結果とする周
知の技術であり、ここでは詳しい説明は省略する。
When the process proceeds to step S160, it is determined whether or not the "recognition" button BT3 on the toolbar BR3 has been clicked by the mouse 20. Here, when the determination is affirmative, the CPU 30 executes a character string recognition process for converting the recognition target image data into text data (step S170). This character string recognition processing is performed by using each character in a character dictionary (prepared by this character recognition software 50) prepared in advance in the HDD 42,
This is a well-known technique in which an image of each character represented by the recognition target image data is compared and the character having the highest degree of coincidence is used as the recognition result, and detailed description thereof will be omitted here.

【0047】図5は、上記文字列認識処理の終了後のア
プリケーションウィンドウWDの一例を示す説明図であ
る。図示するように、アプリケーションウィンドウWD
のツールバーBR3の下方には、原画像表示用のウィン
ドウF1と認識結果表示用のウィンドウF2とが用意さ
れる。ステップS170の文字列認識処理の終了後に
は、原画像ウィンドウF1に、上記認識対象画像データ
TDが表示され、認識結果ウィンドウF2には、この文
字列認識処理の認識結果である文字列(テキストデー
タ)が表示される。また、認識結果ウィンドウF2の下
方には、候補文字フィールドF3が用意されており、こ
の候補文字フィールドF3には、認識結果ウィンドウF
2に表示されたテキストデータ中のカーソルのある位置
の文字についての認識の次候補が表示される。図示の例
では、そのテキストデータ中の文頭にカーソルが位置し
(文字列認識処理の終了直後には、文頭にカーソルが位
置するものと設計されている)、その文頭のテキストデ
ータ、すなわち、図示の例ではスペースについての認識
の次候補(実際には図示のように全てスペース)が表示
される。
FIG. 5 is an explanatory diagram showing an example of the application window WD after completion of the character string recognition processing. As shown, application window WD
Below the toolbar BR3, a window F1 for displaying an original image and a window F2 for displaying a recognition result are prepared. After the character string recognition processing in step S170 is completed, the recognition target image data TD is displayed in the original image window F1, and the recognition result window F2 displays the character string (text data) which is the recognition result of this character string recognition processing. ) Is displayed. A candidate character field F3 is prepared below the recognition result window F2, and the recognition result window F3 is provided in this candidate character field F3.
The next candidate for recognition of the character at the position of the cursor in the text data displayed in 2 is displayed. In the illustrated example, the cursor is located at the beginning of the sentence in the text data (the cursor is designed to be located at the beginning of the sentence immediately after the character string recognition processing). In this example, the next candidate for recognition of spaces (actually all spaces as shown) is displayed.

【0048】図3に戻り、ステップS160で否定判別
された場合には、ステップS180に処理を進める。な
お、フローチャートには詳細に記載されていないが、ス
テップS160で肯定判別された場合でも、ステップS
130のスキャン処理の実行後でない場合には、ステッ
プS180に処理を進める。ステップS180では、ツ
ールバーBR3上の「保存」のボタンBT4が、マウス
20によってクリック操作されたか否かを判別して、こ
こで、肯定判別されたときには、CPU30は、文字列
認識処理ルーチンで得られたテキストデータを保存する
(ステップS190)。ステップS190の実行後、ま
たはステップS190で否定判別された場合には、「リ
ターン」に抜けてこの制御処理のルーチンを一旦終了す
る。
Returning to FIG. 3, if a negative decision is made in step S160, the process proceeds to step S180. Although not described in detail in the flow chart, even if a positive determination is made in step S160,
If it is not after the execution of the scanning process of 130, the process proceeds to step S180. In step S180, it is determined whether or not the "save" button BT4 on the toolbar BR3 has been clicked by the mouse 20, and if an affirmative determination is made here, the CPU 30 obtains the character string recognition processing routine. The saved text data is saved (step S190). After execution of step S190, or when a negative determination is made in step S190, the process returns to "return" and the control processing routine is temporarily terminated.

【0049】ステップS170の文字列認識処理の実行
後には、CRTディスプレイ12には、前述したよう
に、図5に示されるアプリケーションウィンドウWDが
表示される。作業者は、このアプリケーションウィンド
ウWDの認識結果ウィンドウF2に表示されるテキスト
データを、原画像表示用のウィンドウF1に表示される
画像データと比較しながら見ることで、文字列認識処理
が正しく行なわれているか否かを確認することができ
る。作業者は、認識結果であるそのテキストデータに誤
りを発見したときには、その誤っている文字を修正する
作業を行なう。この修正の作業は、CPU30により実
行される認識文字列修正ルーチンに従って行なわれる。
以下、この認識文字列修正ルーチンについて詳述する。
After execution of the character string recognition processing in step S170, the application window WD shown in FIG. 5 is displayed on the CRT display 12, as described above. By comparing the text data displayed in the recognition result window F2 of the application window WD with the image data displayed in the window F1 for displaying the original image, the operator can correctly perform the character string recognition process. It can be confirmed whether or not. When an operator finds an error in the text data as a recognition result, he / she corrects the erroneous character. This correction work is performed according to a recognition character string correction routine executed by the CPU 30.
Hereinafter, this recognition character string correction routine will be described in detail.

【0050】図6および図7は、CPU30により実行
される認識文字列修正ルーチンを示すフローチャートで
ある。この認識文字列修正ルーチンは、所定時間毎に繰
り返し実行される。図6に示すように、処理が開始され
ると、CPU30は、まず、マウス20またはキーボー
ド18から操作信号を取り込んで、認識結果である上記
テキストデータの中から所望の文字を選択する操作がな
されたか否かを判別する(ステップS200)。この文
字の選択操作は、作業者によるマウス20またはキーボ
ード18を用いた操作であり、マウス20を用いる場合
には、CRTディスプレイ12の画面に表示されたその
テキストデータの所望の位置をクリックして1文字を選
択するといった操作を行なう。ステップS200で、そ
の文字選択の操作がなされていないと判別されたときに
は、CPU30は、リターンに処理を進めて、この認識
文字列修正ルーチンの処理を一旦終了する。
FIGS. 6 and 7 are flowcharts showing a recognized character string correction routine executed by the CPU 30. This recognition character string correction routine is repeatedly executed at predetermined time intervals. As shown in FIG. 6, when the process is started, the CPU 30 first receives an operation signal from the mouse 20 or the keyboard 18 and performs an operation of selecting a desired character from the text data as a recognition result. It is determined whether or not (step S200). This character selection operation is an operation performed by the operator using the mouse 20 or the keyboard 18, and when the mouse 20 is used, a desired position of the text data displayed on the screen of the CRT display 12 is clicked. An operation such as selecting one character is performed. When it is determined in step S200 that the character selection operation has not been performed, the CPU 30 advances the process to return, and once ends the process of the recognized character string correction routine.

【0051】一方、ステップS200で、その文字選択
の操作がなされたと判別されたときには、以下の処理を
実行する。まず、CPU30は、その文字選択の操作、
すなわちマウス20またはキーボード18の操作によっ
て定まる位置(テキストデータにおける位置であり、以
下、所定位置P0と呼ぶ)の文字C1を選択する処理を
行なう(ステップS210)。図8は、このステップS
210の処理後のアプリケーションウィンドウWDの一
例を示す説明図である。図9は、図8の認識結果ウィン
ドウF2周辺の拡大図である。CPU30の処理によっ
て、図9に示すように、認識結果ウィンドウF2に表示
されるテキストデータ中の第2行目の「異例の列草だ」
の内の「草」の文字が、文字(以下、選択文字と呼ぶ)
C1として選択される。このとき、候補文字フィールド
F3には、認識の次候補である「車」、「卓」、
「串」、…が順に表示されている。
On the other hand, if it is determined in step S200 that the character selection operation has been performed, the following processing is executed. First, the CPU 30 operates to select the character,
That is, a process of selecting the character C1 at a position determined by the operation of the mouse 20 or the keyboard 18 (a position in the text data, hereinafter referred to as a predetermined position P0) is performed (step S210). FIG. 8 shows this step S
It is explanatory drawing which shows an example of the application window WD after the process of 210. FIG. 9 is an enlarged view around the recognition result window F2 in FIG. By the processing of the CPU 30, as shown in FIG. 9, in the text data displayed in the recognition result window F2, the second line, “It is an unusual row of grass”.
The character of "grass" in the character is a character (hereinafter referred to as the selected character)
Selected as C1. At this time, in the candidate character field F3, “car”, “desk”, which are the next candidates for recognition,
“Skewer”,… are displayed in order.

【0052】図6に戻り、次いで、CPU30は、選択
文字C1を、記憶用選択文字C1XとしてRAM32に
一旦記憶する(ステップS215)。続いて、CPU3
0は、上記テキストデータ中の選択文字C1を、マウス
20またはキーボード18からの作業者による操作指令
に従う所定の文字C2に置換する処理を行なう(ステッ
プS220)。図9の例では、作業者は、候補文字フィ
ールドF3に表示される次候補群から、上記誤認識した
「草」に替わる正しい「車」の文字をマウス20を用い
てクリックする操作を行なう。ステップS220では、
このマウス20からの操作信号を取り込んで、マウス2
0の操作によって定まる候補文字(この例の場合、
「車」)を上記所定の文字C2として、上記テキストデ
ータにおける選択文字C1に上書きする。
Returning to FIG. 6, the CPU 30 then temporarily stores the selected character C1 in the RAM 32 as the memory selected character C1X (step S215). Then, CPU3
At 0, the selected character C1 in the text data is replaced with a predetermined character C2 in accordance with an operation command from the mouse 20 or the keyboard 18 by the operator (step S220). In the example of FIG. 9, the operator uses the mouse 20 to click the correct character “car” in place of the “grass” that was erroneously recognized from the next candidate group displayed in the candidate character field F3. In step S220,
The operation signal from this mouse 20 is taken in and the mouse 2
Candidate character determined by 0 operation (in this example,
“Vehicle”) is set as the predetermined character C2, and the selected character C1 in the text data is overwritten.

【0053】図6に戻り、ステップS220の実行後、
CPU30は、一括修正機能を働かせる指示が予め設定
されているか否かを判別する(ステップS230)。こ
の指示は、アプリケーションウィンドウWD上での作業
者によるマウス操作によって指示されるものである。ア
プリケーションウィンドウWDのツールバーBR2に
は、一括修正ボタンBT11(図8参照)が設けられて
いるが、この一括修正ボタンBT11がマウスクリック
されると、一括修正機能を働かせる指示をコンピュータ
本体16に対して設定することができる。ステップS2
30では、この一括修正機能を働かせる指示が予め設定
されているか否かを判別する。ここで、その指示が設定
されていないと判別されたときには、「リターン」に抜
けて処理を一旦終了する。
Returning to FIG. 6, after the execution of step S220,
The CPU 30 determines whether or not an instruction to activate the batch correction function is set in advance (step S230). This instruction is given by a mouse operation by the operator on the application window WD. A batch correction button BT11 (see FIG. 8) is provided on the toolbar BR2 of the application window WD. When the batch correction button BT11 is clicked with the mouse, an instruction to activate the batch correction function is given to the computer main body 16. Can be set. Step S2
At 30, it is determined whether or not an instruction to operate this collective correction function is set in advance. If it is determined that the instruction has not been set, the process returns to "return" and the process ends.

【0054】一方、ステップS230で、一括修正機能
を働かせる指示が予め設定されていると判別されたとき
には、CPU30は、以下の処理を行なう。まず、認識
対象画像データから、上記所定位置P0に対応する文字
の範囲の画像データ(以下、文字画像データと呼ぶ)P
Dを抽出してRAM32に記憶する(ステップS24
0)。この文字画像データPDは、選択文字C1に対応
する文字画像データである。次いで、CPU30は、変
数mに値1をセットする(ステップS250)。
On the other hand, when it is determined in step S230 that the instruction to activate the collective correction function is preset, the CPU 30 performs the following process. First, from the recognition target image data, image data (hereinafter referred to as character image data) P in a character range corresponding to the predetermined position P0.
D is extracted and stored in the RAM 32 (step S24)
0). The character image data PD is character image data corresponding to the selected character C1. Next, the CPU 30 sets the value 1 to the variable m (step S250).

【0055】その後、CPU30は、認識結果である上
記テキストデータにあって上記所定位置P0から上記変
数mの値だけ後方に、認識された文字が存在するか否か
を判別する(ステップS260)。ここで、存在しない
と判別された場合には、「リターン」に抜けて処理を一
旦終了する。一方、ステップS260で認識文字が存在
すると判別された場合には、CPU30は、図7のステ
ップS270に処理が進む。
After that, the CPU 30 determines whether or not there is a recognized character in the text data which is the recognition result, behind the predetermined position P0 by the value of the variable m (step S260). Here, if it is determined that there is not, the process returns to "return" and the process ends. On the other hand, if it is determined in step S260 that the recognized character exists, the CPU 30 advances the process to step S270 in FIG.

【0056】ステップS270では、CPU30は、ス
テップS260で存在すると判断された上記所定位置P
0から上記変数mの値だけ後方の文字(以下、m番目の
文字と呼ぶ)Cmが、ステップS215で得られた記憶
用選択文字C1Xと同一であるか否かを判別する。ここ
で、同一であると判別されると、そのm番目の文字Cm
を修正前文字CmXとしてRAM32に一旦記憶して
(ステップS280)、認識結果のテキストデータ上に
おいてそのm番目の文字(特許請求の範囲でいう自動修
正対象文字に該当)Cmを、ステップS220で用いた
所定の文字(以下、置換文字と呼ぶ)C2に置き換える
(ステップS290)。
In step S270, the CPU 30 determines the predetermined position P determined to exist in step S260.
It is determined whether or not a character (hereinafter, referred to as the m-th character) Cm that is located behind 0 by the value of the variable m is the same as the selected storage character C1X obtained in step S215. Here, when it is determined that they are the same, the m-th character Cm
Is temporarily stored in the RAM 32 as the uncorrected character CmX (step S280), and the m-th character (corresponding to the automatic correction target character in claims) Cm on the text data of the recognition result is used in step S220. The specified character (hereinafter referred to as a replacement character) C2 is replaced (step S290).

【0057】一方、ステップS270でm番目の文字C
mが記憶用選択文字C1Xと同一でないと判別されたと
きには、CPU30は、ステップS275に処理を進め
て、上記m番目の文字Cmに対応する文字画像データ
が、ステップS240で記憶した文字画像データPDと
類似しているか否かを判別する。この類似度の判定は、
文字画像データで示される画像の特徴を抽出して、特徴
の一致度を数量的に演算して、その演算結果から判定を
行なう。ステップS275で、類似していると判別され
た場合には、ステップS280に処理を進める。すなわ
ち、ステップ270で、m番目の文字Cmが、ステップ
210で選択された選択文字C1と同一であるか、その
m番目の文字Cmに対応する文字画像データが、その選
択文字C1に対応する文字画像データと類似する場合
に、ステップ280に処理が進められる。
On the other hand, in step S270, the m-th character C
When it is determined that m is not the same as the selected character C1X for storage, the CPU 30 advances the process to step S275, and the character image data corresponding to the m-th character Cm is the character image data PD stored in step S240. And is similar to. This similarity judgment is
The feature of the image represented by the character image data is extracted, the degree of coincidence of the feature is quantitatively calculated, and the determination is made from the calculation result. If it is determined in step S275 that they are similar, the process proceeds to step S280. That is, in step 270, the mth character Cm is the same as the selected character C1 selected in step 210, or the character image data corresponding to the mth character Cm is the character corresponding to the selected character C1. If it is similar to the image data, the process proceeds to step 280.

【0058】なお、このステップS270とステップS
275を備える構成に替えて、ステップS275を削除
してステップS270だけを備える構成としてもよい。
この場合、ステップS270で否定判別されたときに
は、ステップS350に処理を進める。また、ステップ
S270を削除してステップS275だけを備える構成
としてもよい。この場合、ステップS260の後にステ
ップS275が続く。
Note that this step S270 and step S
Instead of the configuration including 275, step S275 may be deleted and only step S270 may be included.
In this case, when a negative determination is made in step S270, the process proceeds to step S350. Alternatively, step S270 may be deleted and only step S275 may be provided. In this case, step S260 is followed by step S275.

【0059】ステップS290で文字C2への置換が行
なわれた後、CPU30は、ステップS300に処理を
進めて、認識結果である上記テキストデータにおける置
換文字C2の前後についての構文を解析する処理を行な
う。構文解析の処理は、入力テキストを形態素と呼ばれ
る最小言語単位に分割し、それら形態素に分割された文
を文節と呼ばれる単位までまとめて、その文の構文構造
を解析するものである。上記形態素への分割は、すべて
の品詞の入った単語辞書を基に行なわれる。構文構造の
解析は、各文節の係り受け構造を解析しようとするもの
で、構文解析に必要な知識を格納したルール辞書を基に
行なわれる。単語辞書およびルール辞書は、前述したよ
うにHDD42に予め記憶されている。
After the replacement with the character C2 is performed in step S290, the CPU 30 advances the process to step S300 to analyze the syntax before and after the replacement character C2 in the text data as the recognition result. . The processing of parsing is to divide an input text into minimum linguistic units called morphemes, collect sentences divided into morphemes into units called bunsetsu, and analyze the syntactic structure of the sentence. The division into the above morphemes is performed based on a word dictionary containing all parts of speech. The analysis of the syntactic structure attempts to analyze the dependency structure of each clause, and is performed based on a rule dictionary that stores knowledge necessary for the syntactic analysis. The word dictionary and the rule dictionary are stored in the HDD 42 in advance as described above.

【0060】文節の係り受け構造とは、その文節が修飾
することができる相手の文節の種類、およびその文節が
修飾を受けることができる相手の文節の種類を分類し、
それぞれ係り、受けとした構造である。上記構文構造の
解析では、この文節の係り受け構造を解析して、文節の
係り受けの強さの度合い、すなわち文節の意味的な結び
つきの強さの度合いを評価する。具体的な構文解析の手
法については周知のものであることから、ここではその
説明は省略する。ステップS300では、認識結果であ
るテキストデータにおいて上記置換文字C2を中心に所
定の文字数の文字列を抽出して、これを上記入力テキス
トとして構文解析の処理を行なう。なお、構文解析の方
法については、上記の記述に限定されるものではなく、
構文を意味的に解析可能なものであればどのようなもの
でもよい。また、上記前後の範囲は所定の文字数から必
ずしも定まる必要はなく、適当な文節で抽出してもよい
し、文にて抽出してもよい。
The dependency structure of a bunsetsu classifies the type of partner's bunsetsu that the bunsetsu can modify, and the type of the other bunsetsu that the bunsetsu can receive,
It has a structure that is related to and receives each. In the analysis of the syntactic structure, the dependency structure of the bunsetsu is analyzed to evaluate the degree of the dependency of the bunsetsu, that is, the degree of the semantic connection of the bunsetsu. Since a specific syntax analysis method is well known, its description is omitted here. In step S300, a character string of a predetermined number of characters centering on the replacement character C2 is extracted from the text data that is the recognition result, and the parsing process is performed by using this character string as the input text. Note that the syntax analysis method is not limited to the above description,
Anything can be used as long as it can semantically parse the syntax. Further, the ranges before and after the above need not necessarily be determined from the predetermined number of characters, and may be extracted with appropriate clauses or sentences.

【0061】ステップS300の構文解析を終えると、
次いで、CPU30は、その構文解析の評価結果に基づ
いて、この構文(テキストデータにおける置換文字C2
前後の構文)が正しいか否かを判別する(ステップS3
10)。すなわち、評価結果が文節の意味的な結びつき
の強さの度合いが大きい場合(所定値以上の場合)に
は、ステップS310で、その構文は正しいと判別さ
れ、CPU30は、ステップS320に処理を進めて、
「先回り修正の確認」のダイアログボックスDB1をC
RTディスプレイ12に表示する処理を行なう。
When the syntax analysis in step S300 is completed,
Next, the CPU 30 uses this syntax (the replacement character C2 in the text data as the replacement character C2 based on the evaluation result of the syntax analysis.
It is determined whether the syntax before and after is correct (step S3)
10). That is, if the evaluation result shows that the degree of the semantic connection between the clauses is large (equal to or more than a predetermined value), the syntax is determined to be correct in step S310, and the CPU 30 advances the process to step S320. hand,
C on the dialog box DB1 of "Confirm advanced correction"
Processing for displaying on the RT display 12 is performed.

【0062】図10は、「先回り修正の確認」のダイア
ログボックスDB1をアプリケーションウィンドウWD
とともに示す説明図である。図11は、ダイアログボッ
クスDB1の拡大図である。図11に示すように、この
ダイアログボックスDB1には、修正前の文字データ
(修正前文字CmX)と修正後の文字データ(置換文字
C2)と共に、「この部分を修正しますか?」という問
い合わせのメッセージが記載されている。作業者は、認
識結果表示用のウィンドウF2に表示されるテキストデ
ータとともに、ダイアログボックスDB1を見て、認識
結果の修正が正しいか否か(修正を受け入れることがで
きるか否か)を判定する。作業者は受け入れると判定し
た場合には、ダイアログボックスDB1の「はい」のボ
タンBT21をクリックする。一方、作業者は、その修
正を受け入れることができないと判定した場合には、ダ
イアログボックスDB1の「いいえ」のボタンBT22
をクリックする。
In FIG. 10, the dialog box DB1 for "Confirm advanced correction" is displayed in the application window WD.
It is an explanatory view shown with. FIG. 11 is an enlarged view of the dialog box DB1. As shown in FIG. 11, this dialog box DB1 asks "Do you want to modify this part?" Along with the character data before modification (character CmX before modification) and the character data after modification (replacement character C2). Message is described. The operator looks at the dialog box DB1 together with the text data displayed in the recognition result display window F2 to determine whether the correction of the recognition result is correct (whether the correction can be accepted). When it is determined that the worker accepts, the operator clicks the "Yes" button BT21 of the dialog box DB1. On the other hand, when the worker determines that the correction cannot be accepted, the “No” button BT22 in the dialog box DB1.
Click.

【0063】図7に戻り、ステップS320で「先回り
修正の確認」のダイアログボックスDB1の表示がなさ
れると、次いで、CPU30は、マウス20からの出力
信号を読み取って上記作業者の操作が、「はい」のボタ
ンBT21と「いいえ」のボタンBT22のいずれがク
リックされたかを判定する(ステップS330)。ここ
で、「いいえ」のボタンBT22がクリックされたと判
別された場合には、ステップS340に処理を進めて、
ステップS290で置き換えた置換文字C2を、置換前
の文字、すなわちステップS280で記憶した修正前文
字CmXに戻す。ステップS340の実行後、CPU3
0は、上記変数mを値1だけインクリメントする(ステ
ップS350)。
Returning to FIG. 7, when the dialog box DB1 of "Confirm advanced correction" is displayed in step S320, the CPU 30 then reads the output signal from the mouse 20 and the operation of the operator is " It is determined which of the "Yes" button BT21 and the "No" button BT22 has been clicked (step S330). Here, if it is determined that the “No” button BT22 is clicked, the process proceeds to step S340,
The replacement character C2 replaced in step S290 is returned to the character before replacement, that is, the uncorrected character CmX stored in step S280. After execution of step S340, CPU3
0 increments the variable m by 1 (step S350).

【0064】一方、ステップS330で「はい」のボタ
ンBT21がクリックされたと判別された場合には、ス
テップS340を実行することなしにステップS350
に処理を進める。すなわち、認識結果の修正が正しいと
作業者により判別された場合には、CPU30は、ステ
ップS290で行なわれた文字C2への置換は、正当で
あるものと確定して、直ちにステップS350に処理を
進める。
On the other hand, if it is determined in step S330 that the "Yes" button BT21 has been clicked, step S340 is executed without executing step S340.
Proceed to. That is, when the operator determines that the correction of the recognition result is correct, the CPU 30 determines that the replacement with the character C2 performed in step S290 is valid, and immediately proceeds to step S350. Proceed.

【0065】ステップS350の実行後、CPU30
は、図6のステップS260に処理を戻して、ステップ
S260ないしS350の処理を、値1だけインクリメ
ントされた新たな変数mから定まる自動修正対象文字
(m番目の文字)Cmに対して行なう。なお、ステップ
S275で否定判別、すなわち、自動修正対象文字Cm
に対応する画像データが、文字画像データPDに類似し
ていないと判別された場合には、CPU30は、そのま
まステップS350に処理を進めて、変数mを値1だけ
インクリメントする。
After execution of step S350, the CPU 30
Returns the processing to step S260 of FIG. 6 and performs the processing of steps S260 to S350 on the automatic correction target character (mth character) Cm determined from the new variable m incremented by the value 1. Note that a negative determination is made in step S275, that is, the automatic correction target character Cm
When it is determined that the image data corresponding to is not similar to the character image data PD, the CPU 30 advances the process directly to step S350 and increments the variable m by the value 1.

【0066】上記構成の認識文字列修正ルーチンによれ
ば、まず、ステップS210の処理により、認識結果の
テキストデータの中から、作業者の操作指令に基づく任
意の文字、例えば、図9の例では、第2行目の「異例の
列草だ」の内の「草」の文字C1が選択される。その
後、ステップS220の処理により、その選択された文
字C1が、作業者の操作指令に基づいて置換文字C2に
置き換えられる。次いで、ステップS250ないしS2
75の処理により、上記「草」の文字C1に続く「だ」
の文字C1′について選択文字C1(記憶用選択文字C
1X)と同一か、もしくは類似しているかの判定がなさ
れる。「だ」の文字C1′は「草」の文字C1Xと同一
でないと判別され、またそれぞれの文字画像データは類
似でないと判定されることから、「だ」の文字C1′に
ついては特別な処理を行なわずに、処理対象を続く文字
に移行する。ステップS260ないしS350の繰り返
しの処理により、テキストデータの後方に向かって一文
字ずつ、「草」の文字C1Xと一致するか、あるいはそ
れぞれの文字画像データが類似しているかの判定がなさ
れる。
According to the recognized character string correction routine having the above-described structure, first, by the process of step S210, an arbitrary character based on the operation command of the operator is selected from the text data of the recognition result, for example, in the example of FIG. , The character C1 of "grass" in "the unusual row of grass" on the second line is selected. Then, by the process of step S220, the selected character C1 is replaced with the replacement character C2 based on the operator's operation command. Then, steps S250 to S2
By the processing of 75, "da" following the letter C1 of "grass" above
Character C1 'of the selected character C1 (selected character for storage C
It is determined whether or not it is the same as or similar to 1X). Since it is determined that the character C1 'of "Da" is not the same as the character C1X of "Grass" and that the respective character image data are not similar, special processing is performed for the character C1' of "Da". The processing target is shifted to the subsequent character without performing the processing. By repeating the processing of steps S260 to S350, it is determined whether or not the characters match the character C1X of "grass" toward the rear of the text data or the respective character image data are similar.

【0067】図9の例では、テキストデータにおける第
14行目の「11号草」の内の「草」の文字C1′′に
処理対象が移行すると、「草」の文字C1Xとの一致が
見られる。その文字を自動修正対象文字Cmとして、置
換文字C2に一旦置き換えられる。そうして、その置換
文字C2の前後についての構文を解析して、その構文が
正しくないと判別された場合には、置換文字C2に置換
された自動修正対象文字Cmを置換前の状態に戻す。一
方、構文解析によりその構文が正しいと判別された場合
には、図10に例示するように、「先回り修正の確認」
のダイアログボックスDB1が表示され、作業者に対し
てその置換の結果を受け入れるか否かの判断を促した上
で、その文字Cmの置換文字C2への置き換えを正当な
ものとして確定する。
In the example of FIG. 9, when the object to be processed moves to the character C1 ″ of “grass” in the “11th grass” on the 14th line in the text data, a match with the character C1X of “grass” occurs. Can be seen. The character is once replaced with the replacement character C2 as the automatic correction target character Cm. Then, the syntax before and after the replacement character C2 is analyzed, and when it is determined that the syntax is incorrect, the automatic correction target character Cm replaced by the replacement character C2 is returned to the state before the replacement. . On the other hand, when the syntax analysis determines that the syntax is correct, as shown in FIG.
Dialog box DB1 is displayed to prompt the operator to decide whether or not to accept the result of the replacement, and then the replacement of the character Cm with the replacement character C2 is confirmed as valid.

【0068】したがって、この第1実施例によれば、認
識結果であるテキストデータに対して一括修正を行なう
に際して、その修正が正しい構文となる場合に限り、そ
の修正が正当なものと確定される。このために、文字修
正の精度を向上することができるという効果を奏する。
また、この第1実施例によれば、修正が正しい構文でな
い場合は、自動的にその修正は元に戻される。このため
に、文字修正の精度をより向上することができる。
Therefore, according to the first embodiment, when batch correction is performed on the text data as the recognition result, the correction is determined to be valid only when the correction has the correct syntax. . Therefore, there is an effect that the accuracy of character correction can be improved.
Also, according to this first embodiment, if the modification is not the correct syntax, the modification is automatically reverted. Therefore, the accuracy of character correction can be further improved.

【0069】さらに、この第1実施例によれば、構文解
析によりその構文が正しいと判別された場合には、「先
回り修正の確認」のダイアログボックスDB1が表示さ
れ、作業者に対してその置換の結果を受け入れることが
できるかを問い合わせることができる。このために、文
字修正の精度をより向上することができる。
Further, according to the first embodiment, if the syntax is determined to be correct by the syntax analysis, the dialog box DB1 of "Confirm advanced correction" is displayed, and the operator replaces it. You can ask if you can accept the results of. Therefore, the accuracy of character correction can be further improved.

【0070】この第1実施例についてさらに説明を続け
る。この第1実施例では、前記ステップS210により
選択される任意の文字は、「草」で例示した1文字であ
るものと説明したが、この任意の文字は、必ずしも1文
字である必要はなく、連続する複数の文字を選択するこ
とが可能となっている。図9に示した認識結果ウィンド
ウF2に表示されるテキストデータ中の第2行目には、
「日」と「寺」といった連続する2文字が含まれるが、
ステップS210では、この「日」と「寺」の2文字が
選択される構成とすることができる。この後に、作業者
は、アプリケーションウィンドウWDのツールバーBR
2に設けられた結合ボタンBT12(図8参照)をマウ
ス20を用いてクリックする操作を行なうが、この場合
には、ステップS220では、このマウス20からの操
作信号を取り込んで、前記連続する複数の文字が結合し
た1つの文字、すなわち上記の例では、「時」の文字を
置換文字C2として、選択文字C1が置換文字C2に置
換される。
Further description of the first embodiment will be continued. In the first embodiment, it is explained that the arbitrary character selected in step S210 is one character exemplified by "grass", but this arbitrary character does not necessarily have to be one character. It is possible to select multiple consecutive characters. On the second line in the text data displayed in the recognition result window F2 shown in FIG. 9,
It contains two consecutive characters such as "day" and "temple",
In step S210, the two characters "day" and "temple" can be selected. After this, the worker selects the toolbar BR of the application window WD.
The combining button BT12 (see FIG. 8) provided in No. 2 is clicked using the mouse 20. In this case, in step S220, the operation signal from the mouse 20 is fetched and the continuous plural The selected character C1 is replaced with the replacement character C2 with the single character in which the characters are combined, that is, the character "hour" in the above example as the replacement character C2.

【0071】この構成によれば、1文字を表わす画像デ
ータから複数の文字が誤認識された場合、例えば、
「時」の画像データから「日」の文字と「寺」の文字が
分離されて認識された場合に、これらを元の1文字に修
正することができる。なお、複数の文字に分離される文
字の例としては、「唄」、「林」、「甥」、「艶」、
「蚊」等、様々なものがある。
According to this configuration, when a plurality of characters are erroneously recognized from the image data representing one character, for example,
When the characters of "day" and "temple" are recognized separately from the image data of "hour", they can be corrected to the original one character. In addition, as an example of the character separated into a plurality of characters, "uta", "bayashi", "nephew", "luster",
There are various things such as "mosquitoes".

【0072】また、文字認識の結果、2文字が1文字と
して認識されるような場合もあり得る。例えば、00とい
った半角2文字を、}といった全角1文字に誤認識する
ことがあるが、この場合には、前記ステップS210に
より選択される任意の文字を、}の文字とする。この後
に、作業者は、アプリケーションウィンドウWDのツー
ルバーBR2に設けられた分離ボタンBT13(図8参
照)をマウス20を用いてクリックする操作を行なう
が、この場合には、ステップS220では、このマウス
20からの操作信号を取り込んで、複数の文字、すなわ
ち上記の例では、「00」を置換文字C2として、選択文
字C1が置換文字C2に置換される。
Further, as a result of character recognition, two characters may be recognized as one character. For example, two half-width characters such as 00 may be erroneously recognized as one full-width character such as}. In this case, the arbitrary character selected in step S210 is set to the character of}. After this, the operator performs an operation of clicking the separation button BT13 (see FIG. 8) provided on the toolbar BR2 of the application window WD with the mouse 20, but in this case, in step S220, the mouse 20 is clicked. By taking in the operation signal from, the selected character C1 is replaced with the replacement character C2 with a plurality of characters, that is, "00" in the above example as the replacement character C2.

【0073】この構成によれば、複数の文字を表わす画
像データから1文字が誤認識された場合に、これを元の
複数の文字に修正することができる。
According to this structure, when one character is erroneously recognized from the image data representing a plurality of characters, it can be corrected to the original plurality of characters.

【0074】この発明の第2実施例について次に説明す
る。この第2実施例は、第1実施例と比較して、同一の
ハードウェアの構成を備える。ソフトウェアの構成もほ
ぼ同じで、認識文字列修正ルーチンの一部が相違するだ
けである。図12は、この第2実施例における認識文字
列修正ルーチンの後半部分を示すフローチャートであ
る。この第2実施例における認識文字列修正ルーチンの
前半部分は、第1実施例と同一であり、図6で示される
ものである。この第2実施例における認識文字列修正ル
ーチンの後半部分は、図12に示すように、第1実施例
と同一の処理内容のステップS270ないしS310お
よびステップS340を備える。
The second embodiment of the present invention will be described below. The second embodiment has the same hardware configuration as that of the first embodiment. The software configuration is almost the same, and only a part of the recognition character string correction routine is different. FIG. 12 is a flow chart showing the latter half of the recognized character string correction routine in the second embodiment. The first half of the recognized character string correction routine in the second embodiment is the same as that in the first embodiment and is shown in FIG. As shown in FIG. 12, the latter half of the recognized character string correction routine in the second embodiment includes steps S270 to S310 and step S340 which have the same processing contents as those in the first embodiment.

【0075】ステップS310で、構文解析の評価結果
に基づいて、その構文が正しいと判別された場合には、
CPU30は、認識結果のテキストデータ上におけるス
テップS290で置き換えた置換文字C2をハイライト
表示する(ステップS400)。ここでいうハイライト
表示とは、その置換文字C2の背景部分を黒色として、
その置換文字C2を白抜きにて表わす表示である。ステ
ップS400の結果、その置換文字C2は正当なものと
して確定されることになる。ステップS400の実行
後、CPU30は、ステップS350に処理を進める。
If it is determined in step S310 that the syntax is correct based on the evaluation result of the syntax analysis,
The CPU 30 highlights the replacement character C2 replaced in step S290 on the text data of the recognition result (step S400). The highlight display here means that the background portion of the replacement character C2 is black,
The replacement character C2 is displayed in white. As a result of step S400, the replacement character C2 is confirmed as valid. After executing step S400, the CPU 30 advances the process to step S350.

【0076】上記構成の認識文字列修正ルーチンによれ
ば、自動修正対象文字Cmが自動的に全て置換文字C2
に置換され、その置換文字C2の前後の構文が正しいと
解析されたものについては、その置換結果はハイライト
表示された上で、正当なものに確定される。図13は、
認識文字列修正ルーチンの終了後のアプリケーションウ
ィンドウWDの一例を示す説明図である。図14は、図
13の認識結果ウィンドウ周辺の拡大図である。これら
図に示すように、自動的に置換され、構文が正しいと解
析された全ての置換文字C2は、ハイライト表示され
る。
According to the recognition character string correction routine having the above structure, all the characters Cm to be automatically corrected are automatically replaced by the replacement character C2.
When the syntax before and after the replacement character C2 is analyzed to be correct, the replacement result is highlighted and confirmed as a valid one. Figure 13
It is explanatory drawing which shows an example of the application window WD after completion | finish of a recognition character string correction routine. FIG. 14 is an enlarged view around the recognition result window of FIG. As shown in these figures, all replacement characters C2 that have been automatically replaced and parsed as syntactically correct are highlighted.

【0077】以上のように構成された第2実施例によれ
ば、第1実施例と同様に、文字修正の精度を向上するこ
とができる。特に、この第2実施例では、第1実施例の
ように、修正を行なう毎に、「先回り修正の確認」のダ
イアログボックスDB1が表示され、作業者に対してそ
の置換の結果を受け入れることができるかを問い合わせ
るようなことはない。修正対象文字は即座に修正され、
その修正した個所は、CRTディスプレイ12の画面上
からハイライト表示にて容易に知ることができる。
According to the second embodiment constructed as described above, the accuracy of character correction can be improved, as in the first embodiment. Particularly, in the second embodiment, as in the first embodiment, a dialog box DB1 of "confirmation of advance correction" is displayed every time the correction is performed, and the operator can accept the result of the replacement. There is no such thing as inquiring about what can be done. The correction target character is corrected immediately,
The corrected portion can be easily known by highlighting it on the screen of the CRT display 12.

【0078】なお、上記ハイライト表示は、置換文字C
2を他の文字に対して識別可能な表示であればどのよう
なものであってもよく、アンダーラインを付す構成とし
てもよいし、太字にて表示する構成としてもよい。
The above highlighted display shows the replacement character C.
2 may be any display as long as it can be distinguished from other characters, and may be underlined or bold.

【0079】本発明の他の実施形態について、次に説明
する。第1および第2実施例では、作業者が置換文字C
2を入力する操作としては、候補文字フィールドF3に
表示される次候補群から、上記誤認識した「草」に替わ
る正しい「車」の文字をマウス20を用いてクリックす
る操作を行なっていた。これに加えて、候補文字フィー
ルドF3に表示される次候補群に正解の文字がないよう
な場合には、文字認識に用いた文字辞書を収録数の多い
文字辞書(あるいは、専門分野に偏った文字辞書)に変
換して、文字の再認識の処理を行なう構成とすることが
できる。作業者は、アプリケーションウィンドウWDの
ツールバーBR2に設けられた再認識用ボタンBT14
(図8参照)をマウス20を用いてクリックする操作を
行なうことにより、上記再認識の処理の実行を指示する
ことができる。CPU30は、置換文字C2を入力する
に際して、上記再認識用ボタンBT14がクリックされ
る操作信号を取り込んで、上記再認識の処理を実行する
とともに、その再認識により得られた候補を最初の認識
処理と同様に候補文字フィールドF3に表示させて、そ
の候補文字フィールドF3に表示される候補群から指令
される候補文字を置換文字C2として定める。この実施
形態によれば、文字修正の精度をより一層向上すること
ができる。
Another embodiment of the present invention will be described below. In the first and second embodiments, the operator uses the replacement character C
As an operation of inputting 2, a correct "car" character, which replaces the "erroneously recognized" grass ", is clicked using the mouse 20 from the next candidate group displayed in the candidate character field F3. In addition to this, when there is no correct character in the next candidate group displayed in the candidate character field F3, the character dictionary used for character recognition is a character dictionary with a large number of records (or biased to a specialized field). A character dictionary) can be converted to a character re-recognition process. The worker recognizes the re-recognition button BT14 provided on the toolbar BR2 of the application window WD.
By performing an operation of clicking (see FIG. 8) with the mouse 20, it is possible to instruct the execution of the re-recognition process. When inputting the replacement character C2, the CPU 30 takes in an operation signal for clicking the re-recognition button BT14, executes the re-recognition process, and recognizes the candidate obtained by the re-recognition as the first recognition process. Similarly, the candidate character field F3 is displayed, and the candidate character designated by the candidate group displayed in the candidate character field F3 is determined as the replacement character C2. According to this embodiment, the accuracy of character correction can be further improved.

【0080】第1および第2実施例では、認識結果であ
るテキストデータ上で自動修正対象文字Cmを置換文字
C2に置換して、その後、その置換された文字の前後
(テキストデータ上の前後)についての構文を解析し
て、その構文の解析の結果に基づいて、その置換の結果
を正当なものと確定していた。これに替えて、認識結果
であるテキストデータ上から、自動修正対象文字Cmの
前後所定範囲の文字列データを抽出して、その文字列デ
ータをRAMの別の領域に一旦転送して、この転送され
た文字列データのうちの上記自動修正対象文字Cmを置
換文字C2に置き換え、その後、その文字列データの構
文を解析して、この構文の解析の結果が正しい構文であ
ると判別されたときに、この置換結果が正当なものであ
るとして、その文字列データを上記テキストデータ上に
戻す構成とすることもできる。この構成によっても、第
1および第2実施例と同様に、文字修正の精度を向上す
ることができる。
In the first and second embodiments, the automatic correction target character Cm is replaced with the replacement character C2 on the text data which is the recognition result, and then the replaced character is before and after (before and after on the text data). Was parsed, and based on the result of parsing the syntax, the result of the substitution was confirmed as valid. Instead of this, character string data in a predetermined range before and after the automatic correction target character Cm is extracted from the text data as the recognition result, and the character string data is once transferred to another area of the RAM, and this transfer is performed. When the above-mentioned automatic correction target character Cm in the generated character string data is replaced with the replacement character C2, and then the syntax of the character string data is analyzed, and the result of the analysis of this syntax is determined to be the correct syntax. In addition, it can be configured such that the character string data is returned to the text data on the assumption that the replacement result is valid. With this configuration, the accuracy of character correction can be improved as in the first and second embodiments.

【0081】以上、本発明の一実施例を詳述してきた
が、本発明は、こうした実施例に何等限定されるもので
はなく、本発明の要旨を逸脱しない範囲において種々な
る態様にて実施することができるのは勿論のことであ
る。
Although one embodiment of the present invention has been described in detail above, the present invention is not limited to such an embodiment and can be carried out in various modes without departing from the gist of the present invention. Of course, you can.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の第1実施例を適用するコンピュータ
システムのハードウェアの概略構成を示すブロック図で
ある。
FIG. 1 is a block diagram showing a schematic configuration of hardware of a computer system to which a first embodiment of the present invention is applied.

【図2】コンピュータ本体16によって実行される文字
認識用ソフトウェア50に従う処理の様子を示すブロッ
ク図である。
FIG. 2 is a block diagram showing a state of processing according to the character recognition software 50 executed by the computer main body 16.

【図3】文字認識用ソフトウェア50に従う制御処理の
ルーチンを示すフローチャートである。
FIG. 3 is a flowchart showing a control processing routine according to the character recognition software 50.

【図4】初期状態のアプリケーションウィンドウWDを
示す説明図である。
FIG. 4 is an explanatory diagram showing an application window WD in an initial state.

【図5】文字列認識処理の終了後のアプリケーションウ
ィンドウWDの一例を示す説明図である。
FIG. 5 is an explanatory diagram showing an example of an application window WD after completion of character string recognition processing.

【図6】CPU30により実行される認識文字列修正ル
ーチンの前半部分を示すフローチャートである。
FIG. 6 is a flowchart showing a first half portion of a recognized character string correction routine executed by CPU 30.

【図7】CPU30により実行される認識文字列修正ル
ーチンの後半部分を示すフローチャートである。
FIG. 7 is a flowchart showing the latter half of the recognized character string correction routine executed by the CPU 30.

【図8】ステップS210で修正しようとする選択文字
C1を指定した後のアプリケーションウィンドウWDの
一例を示す説明図である。
FIG. 8 is an explanatory diagram showing an example of an application window WD after designating a selected character C1 to be modified in step S210.

【図9】図8の認識結果ウィンドウF2周辺の拡大図で
ある。
9 is an enlarged view around the recognition result window F2 in FIG.

【図10】「先回り修正の確認」のダイアログボックス
DB1をアプリケーションウィンドウWDとともに示す
説明図である。
FIG. 10 is an explanatory diagram showing a dialog box DB1 for “confirm advance correction” together with an application window WD.

【図11】ダイアログボックスDB1の拡大図である。FIG. 11 is an enlarged view of a dialog box DB1.

【図12】この発明の第2実施例における認識文字列修
正ルーチンの後半部分を示すフローチャートである。
FIG. 12 is a flow chart showing the latter half of the recognized character string correction routine in the second embodiment of the present invention.

【図13】認識文字列修正ルーチンの終了後のアプリケ
ーションウィンドウWDの一例を示す説明図である。
FIG. 13 is an explanatory diagram showing an example of an application window WD after completion of a recognized character string correction routine.

【図14】図13の認識結果ウィンドウ周辺の拡大図で
ある。
FIG. 14 is an enlarged view around the recognition result window in FIG.

【符号の説明】[Explanation of symbols]

12…CRTディスプレイ 14…イメージスキャナ 16…コンピュータ本体 18…キーボード 20…マウス 30…CPU 31…ROM 32…RAM 33…表示画像メモリ 34…マウスインタフェース 35…キーボードインタフェース 36…CDC 37…HDC 38…CRTC 40…入出力機用インタフェース 41…I/Oポート 42…ハードディスクドライブ 44…モデム 46…公衆電話回線 47…サーバ 50…文字認識用ソフトウェア 51…スキャン画像取込部 52…文字列認識モジュール 53…認識文字列修正モジュール 53a…手動修正対象文字選択部 53b…手動修正部 53c…自動修正対象文字選択部 53d…自動修正部 53e…構文解析部 53f…修正結果確定部 P…原稿 WD…アプリケーションウィンドウ F1…原画像ウィンドウ F2…認識結果ウィンドウ F3…候補文字フィールド BT11…一括修正ボタン BT12…結合ボタン BT13…分離ボタン BT14…再認識ボタン C1…選択文字 C1X…記憶用選択文字 C2…置換文字 Cm…自動修正対象文字 CmX…修正前文字 DB1…「先回り修正の確認」のダイアログボックス 12 ... CRT display 14 ... Image scanner 16 ... Computer body 18 ... Keyboard 20 ... Mouse 30 ... CPU 31 ... ROM 32 ... RAM 33 ... Display image memory 34 ... Mouse interface 35 ... Keyboard interface 36 ... CDC 37 ... HDC 38 ... CRTC 40 ... I / O interface 41 ... I / O port 42 ... Hard disk drive 44 ... Modem 46 ... Public telephone line 47 ... server 50 ... Character recognition software 51 ... Scan image capturing unit 52 ... Character string recognition module 53 ... Recognized character string correction module 53a ... Character selection part for manual correction 53b ... Manual correction unit 53c ... Character selection part for automatic correction 53d ... Automatic correction unit 53e ... syntax analysis unit 53f ... Correction result confirmation section P ... manuscript WD ... application window F1 ... Original image window F2 ... Recognition result window F3 ... Candidate character field BT11 ... Batch correction button BT12 ... Combine button BT13 ... Separation button BT14 ... Re-recognition button C1 ... Selected character C1X ... Selection character for storage C2 ... Substitution character Cm ... Characters for automatic correction CmX ... Character before correction DB1 ... Dialog box for "Confirmation of advanced correction"

Claims (16)

【特許請求の範囲】[Claims] 【請求項1】 原稿を画像情報として入力して文字の認
識を行なう文字認識処理によって得られた文字列を修正
する認識文字列修正方法であって、(a)作業者の操作
指令に基づいて、前記文字列の中から任意の文字を選択
するステップと、(b)該選択された任意の文字を、作
業者の操作指令に従う所定の文字に置換するステップ
と、(c)前記文字列の中から、前記ステップ(a)に
より選択された任意の文字と略一致する文字を自動修正
対象文字として順に選択するステップと、(d)前記自
動修正対象文字を、前記所定の文字に置換するステップ
と、(e)前記ステップ(d)により置換された文字の
前後についての構文を解析するステップと、(f)前記
ステップ(e)による構文の解析の結果に基づいて、前
記ステップ(d)による置換の結果を正当なものと確定
するステップとを備える認識文字列修正方法。
1. A recognition character string correction method for correcting a character string obtained by a character recognition process for inputting a document as image information and recognizing characters, comprising: (a) an operator's operation command. , A step of selecting an arbitrary character from the character string, (b) a step of replacing the selected arbitrary character with a predetermined character in accordance with an operation command of an operator, and (c) the character string From among these, a step of sequentially selecting a character that substantially matches the arbitrary character selected in step (a) as an automatic correction target character, and (d) a step of replacing the automatic correction target character with the predetermined character And (e) a step of analyzing the syntax before and after the character replaced in the step (d), and (f) a step of (d) based on the result of the syntax analysis of the step (e). Yo A method for correcting a recognized character string, which comprises the step of confirming the result of the replacement as valid.
【請求項2】 請求項1に記載の認識文字列修正方法で
あって、(g)前記ステップ(f)による構文の解析の
結果が正しい構文でないことを示すものであるとき、前
記自動修正対象文字を前記ステップ(d)による置換が
なされる前の状態に戻すステップを備える認識文字列修
正方法。
2. The recognition character string correction method according to claim 1, wherein when (g) the result of the syntax analysis in step (f) indicates that the syntax is not correct, the automatic correction target A method for correcting a recognized character string, which comprises a step of returning a character to a state before the replacement in the step (d).
【請求項3】 請求項1または2に記載の認識文字列修
正方法であって、(h)前記ステップ(f)によって正
当なものと確定された置換の文字を、他の文字に対して
識別可能に表示するステップを備える認識文字列修正方
法。
3. The method for correcting a recognized character string according to claim 1 or 2, wherein (h) a replacement character determined to be valid in step (f) is identified with respect to another character. A method for correcting a recognized character string, which comprises a step of displaying the character string.
【請求項4】 請求項1または2に記載の認識文字列修
正方法であって、前記ステップ(f)は、(f−1)前
記ステップ(f)による構文の解析の結果が正しい構文
であることを示すものであるとき、前記ステップ(d)
による置換の結果を受け入れるかを、作業者に問い合わ
せるステップと、(f−2)前記ステップ(f−1)の
問い合わせに対する作業者からの操作指令に基づいて前
記置換の結果を受け入れると判定されたとき、前記ステ
ップ(d)による置換の結果を正当なものと確定するス
テップとを備える認識文字列修正方法。
4. The recognition character string correction method according to claim 1, wherein in step (f), the result of the syntax analysis by (f-1) step (f) is a correct syntax. If it indicates that the step (d)
It is determined that the result of the replacement is accepted based on the step of inquiring the operator whether to accept the result of the replacement by (f-2), and (f-2) the operation command from the operator in response to the inquiry in the step (f-1). At this time, the recognition character string correction method comprising the step of determining the result of the replacement in step (d) as valid.
【請求項5】 前記ステップ(a)により選択される任
意の文字が、連続する複数の文字から構成されるとき、
前記ステップ(b)による置換は、前記連続する複数の
文字を一つの所定の文字に置換する構成である請求項1
ないし4のいずれかに記載の認識文字列修正方法。
5. When the arbitrary character selected in step (a) is composed of a plurality of consecutive characters,
The replacement according to the step (b) is a structure for replacing the plurality of consecutive characters with one predetermined character.
5. The method for correcting a recognized character string according to any one of 1 to 4.
【請求項6】 前記ステップ(b)による置換は、1文
字を複数の文字に置換する構成である請求項1ないし4
のいずれかに記載の認識文字列修正方法。
6. The replacement according to the step (b) is a structure in which one character is replaced with a plurality of characters.
A method for correcting a recognized character string according to any one of 1.
【請求項7】 原稿を画像情報として入力して文字の認
識を行なう文字認識処理によって得られた文字列を修正
する認識文字列修正装置であって、作業者の操作指令に
基づいて、前記文字列の中から任意の文字を選択する手
動修正対象文字選択手段と、該選択された任意の文字
を、作業者の操作指令に従う所定の文字に置換する手動
修正手段と、前記文字列の中から、前記手動修正対象文
字選択手段により選択された任意の文字と略一致する文
字を自動修正対象文字として順に選択する自動修正対象
文字選択手段と、前記自動修正対象文字を、前記所定の
文字に置換する自動修正手段と、前記自動修正手段によ
り置換された文字の前後についての構文を解析する構文
解析手段と、前記構文解析手段による構文の解析の結果
に基づいて、前記自動修正手段による置換の結果を正当
なものと確定する修正結果確定手段とを備える認識文字
列修正装置。
7. A recognition character string correction device for correcting a character string obtained by a character recognition process for recognizing a character by inputting an original as image information, wherein the character is corrected based on an operation command from an operator. Manual correction target character selection means for selecting an arbitrary character from a string, manual correction means for replacing the selected arbitrary character with a predetermined character according to an operator's operation command, and among the character strings , An automatic correction target character selection unit that sequentially selects, as an automatic correction target character, a character that substantially matches an arbitrary character selected by the manual correction target character selection unit, and replaces the automatic correction target character with the predetermined character Based on the result of the syntax analysis by the syntactic analysis unit, the automatic correction unit for analyzing the syntax before and after the character replaced by the automatic correction unit, A recognition character string correction device comprising correction result confirmation means for confirming that the result of replacement by the correction means is valid.
【請求項8】 請求項7に記載の認識文字列修正装置で
あって、前記修正結果確定手段による構文の解析の結果
が正しい構文でないことを示すものであるとき、前記自
動修正対象文字を前記自動修正手段による置換がなされ
る前の状態に戻す手段を備える認識文字列修正装置。
8. The recognition character string correction device according to claim 7, wherein when the result of the syntax analysis by the correction result determination means indicates that the syntax is not correct, the automatic correction target character is A recognition character string correction device comprising means for returning to a state before replacement by automatic correction means.
【請求項9】 請求項7または8に記載の認識文字列修
正装置であって、前記修正結果確定手段は、前記置換結
果確定手段による構文の解析の結果が正しい構文である
ことを示すものであるとき、前記自動修正手段による置
換の結果を受け入れるかを、作業者に問い合わせる手段
と、前期問い合わせに対する作業者からの操作指令に基
づいて前記置換の結果を受け入れると判定されたとき、
前記自動修正手段による置換の結果を正当なものと確定
する手段とを備える認識文字列修正装置。
9. The recognition character string correction device according to claim 7 or 8, wherein the correction result confirmation means indicates that the result of the syntax analysis by the replacement result confirmation means is a correct syntax. At some time, whether to accept the result of the replacement by the automatic correction means, when it is determined to accept the result of the replacement based on an operation command from the operator and a means for inquiring to the worker,
A recognition character string correction device, comprising: means for deciding that the result of replacement by the automatic correction means is valid.
【請求項10】 原稿を画像情報として入力して文字の
認識を行なう文字認識処理によって得られた文字列を修
正する処理を実行するコンピュータプログラムであっ
て、(a)作業者の操作指令に基づいて、前記文字列の
中から任意の文字を選択する機能と、(b)該選択され
た任意の文字を、作業者の操作指令に従う所定の文字に
置換する機能と、(c)前記文字列の中から、前記機能
(a)により選択された任意の文字と略一致する文字を
自動修正対象文字として順に選択する機能と、(d)前
記自動修正対象文字を、前記所定の文字に置換する機能
と、(e)前記機能(d)により置換された文字の前後
についての構文を解析する機能と、(f)前記機能
(e)による構文の解析の結果に基づいて、前記機能
(d)による置換の結果を正当なものと確定する機能と
を、コンピュータに実現させるためのコンピュータプロ
グラム。
10. A computer program for executing a process of correcting a character string obtained by a character recognition process for recognizing a character by inputting a document as image information, comprising: (a) an operation command from an operator. A function of selecting an arbitrary character from the character string, (b) a function of replacing the selected arbitrary character with a predetermined character according to an operator's operation command, and (c) the character string From among the above, a function of sequentially selecting, as an automatic correction target character, a character that substantially matches an arbitrary character selected by the function (a), and (d) replacing the automatic correction target character with the predetermined character. A function, (e) a function of analyzing the syntax before and after the character replaced by the function (d), and (f) the function (d) based on the result of the syntax analysis by the function (e). Positive result of replacement by A computer program that causes a computer to realize a function that is determined to be appropriate.
【請求項11】 請求項10に記載のコンピュータプロ
グラムであって、(g)前記機能(f)による構文の解
析の結果が正しい構文でないことを示すものであると
き、前記自動修正対象文字を前記機能(d)による置換
がなされる前の状態に戻す機能を、コンピュータに実現
させるためのコンピュータプログラム。
11. The computer program according to claim 10, wherein when (g) the result of the syntax analysis by the function (f) indicates that the syntax is not correct, the automatic correction target character is A computer program for causing a computer to realize a function of returning to a state before replacement by the function (d).
【請求項12】 請求項10または11に記載のコンピ
ュータプログラムであって、(h)前記機能(f)によ
って正当なものと確定された置換の文字を、他の文字に
対して識別可能に表示する機能を、コンピュータに実現
させるためのコンピュータプログラム。
12. The computer program according to claim 10, wherein (h) the replacement character that has been determined to be valid by the function (f) is displayed in a distinguishable manner from other characters. A computer program that causes a computer to realize the function to perform.
【請求項13】 請求項10または11に記載のコンピ
ュータプログラムであって、 前記機能(f)は、(f−1)前記機能(f)による構
文の解析の結果が正しい構文であることを示すものであ
るとき、前記機能(d)による置換の結果を受け入れる
かを、作業者に問い合わせる機能と、(f−2)前記機
能(f−1)の問い合わせに対する作業者からの操作指
令に基づいて前記置換の結果を受け入れると判定された
とき、前記機能(d)による置換の結果を正当なものと
確定する機能とを備えるコンピュータプログラム。
13. The computer program according to claim 10, wherein the function (f) indicates that (f-1) the result of the syntax analysis by the function (f) is a correct syntax. If it is, the function (d) is based on the function of inquiring the operator whether to accept the replacement result by the function (d), and (f-2) the operation command from the operator for the inquiry of the function (f-1). A computer program having a function of determining the result of the replacement by the function (d) as valid when it is determined to accept the result of the replacement.
【請求項14】 前記機能(a)により選択される任意
の文字が、連続する複数の文字から構成されるとき、前
記機能(b)による置換は、前記連続する複数の文字を
一つの所定の文字に置換する構成である請求項10ない
し13のいずれかに記載のコンピュータプログラム。
14. When the arbitrary character selected by the function (a) is composed of a plurality of consecutive characters, the replacement by the function (b) replaces the plurality of consecutive characters by one predetermined character. The computer program according to any one of claims 10 to 13, wherein the computer program is configured to substitute characters.
【請求項15】 前記機能(b)による置換は、1文字
を複数の文字に置換する構成である請求項10ないし1
3のいずれかに記載のコンピュータプログラム。
15. The replacement according to the function (b) is configured to replace one character with a plurality of characters.
The computer program according to any one of 3 above.
【請求項16】 請求項10ないし15のいずれかに記
載のコンピュータプログラムを記録したコンピュータ読
み取り可能な記録媒体。
16. A computer-readable recording medium in which the computer program according to claim 10 is recorded.
JP2002022303A 2002-01-30 2002-01-30 Recognized character string correction method and apparatus, and computer program Expired - Fee Related JP4110786B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002022303A JP4110786B2 (en) 2002-01-30 2002-01-30 Recognized character string correction method and apparatus, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002022303A JP4110786B2 (en) 2002-01-30 2002-01-30 Recognized character string correction method and apparatus, and computer program

Publications (2)

Publication Number Publication Date
JP2003223608A true JP2003223608A (en) 2003-08-08
JP4110786B2 JP4110786B2 (en) 2008-07-02

Family

ID=27745329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002022303A Expired - Fee Related JP4110786B2 (en) 2002-01-30 2002-01-30 Recognized character string correction method and apparatus, and computer program

Country Status (1)

Country Link
JP (1) JP4110786B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8953910B2 (en) 2011-09-30 2015-02-10 International Business Machines Corporation Proof reading of text data generated through optical character recognition
JP2021009625A (en) * 2019-07-02 2021-01-28 コニカミノルタ株式会社 Information processing device, character recognition method, and character recognition program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8953910B2 (en) 2011-09-30 2015-02-10 International Business Machines Corporation Proof reading of text data generated through optical character recognition
US8971670B2 (en) 2011-09-30 2015-03-03 International Business Machines Corporation Proof reading of text data generated through optical character recognition
JP2021009625A (en) * 2019-07-02 2021-01-28 コニカミノルタ株式会社 Information processing device, character recognition method, and character recognition program

Also Published As

Publication number Publication date
JP4110786B2 (en) 2008-07-02

Similar Documents

Publication Publication Date Title
US6151570A (en) Translating apparatus, dictionary search apparatus, and translating method
JP4217349B2 (en) Document browsing support system, document browsing support method, and storage medium
US7818173B2 (en) Information retrieval system, method, and program
US20020138250A1 (en) Translation supporting apparatus and method and translation supporting program
JP3331134B2 (en) Data link method, data link system, and computer system
JP2001249920A (en) Method and system for providing candidate for text from inference input source
US20040220919A1 (en) Information searching apparatus and method, information searching program, and storage medium storing the information searching program
JP2006343870A (en) Document retrieval device, method and storage medium
JP2000122768A (en) Character input device, its method and recording medium
JP4110786B2 (en) Recognized character string correction method and apparatus, and computer program
JP7176272B2 (en) Information processing device and program
US7523031B1 (en) Information processing apparatus and method capable of processing plurality type of input information
EP0720105B1 (en) System and method to review the processing of data according to user entered corrections
JP2000330683A (en) Help message outputting device
JPH07244491A (en) Conversion system for text sound
JP2002156996A (en) Voice recognition device, recognition result correcting method, and recording medium
JP2870375B2 (en) Sentence correction device
JP4189040B2 (en) Sentence proofreading apparatus and proofreading method
CN110782899B (en) Information processing apparatus, storage medium, and information processing method
JP2001188640A (en) Technology for translating non-text display generation data expressing indicator into text variables
JPH0778138A (en) Method for appending comment and document processor
JPWO2009038209A1 (en) Machine translation system, machine translation method, and machine translation program
JP3362036B2 (en) Machine translation method and apparatus
JP3192686B2 (en) Natural language processing system
JP2001092821A (en) Sentence proofreading device and computer-readable recording medium recording sentence proofreading program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040917

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080331

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140418

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees