JPH1063773A - Recognition result editing method, pattern recognition system, and information recording medium - Google Patents
Recognition result editing method, pattern recognition system, and information recording mediumInfo
- Publication number
- JPH1063773A JPH1063773A JP8231435A JP23143596A JPH1063773A JP H1063773 A JPH1063773 A JP H1063773A JP 8231435 A JP8231435 A JP 8231435A JP 23143596 A JP23143596 A JP 23143596A JP H1063773 A JPH1063773 A JP H1063773A
- Authority
- JP
- Japan
- Prior art keywords
- editing
- recognition result
- recognition
- result
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、パターン認識処理
(例えば文字認識処理)を行なって得られる認識結果を編
集する認識結果編集方法およびパターン認識システムお
よび情報記録媒体に関する。The present invention relates to a pattern recognition process.
The present invention relates to a recognition result editing method for editing a recognition result obtained by performing (for example, character recognition processing), a pattern recognition system, and an information recording medium.
【0002】[0002]
【従来の技術】一般に、文字認識システムでは、原稿等
の文書をスキャナ等で読込み、文書画像とした後、この
文書画像から文字画像を切り出して文字認識処理を行な
い、認識結果を得るようになっている。このような文字
認識システムでは、文字認識処理自体には差程の時間を
要しないが、認識結果の確認,修正等の編集に相当の時
間を要する。すなわち、認識結果の確認,修正等の編集
は、元の文書(あるいは文書画像)とその認識結果とを全
文(全ページ,全行)にわたって突き合わせチェックする
ことによってなされ、また、通常は、正確さを期すため
に、このような全文の突き合わせチェックを2回繰り返
して行なっていた。2. Description of the Related Art In general, in a character recognition system, a document such as a manuscript is read by a scanner or the like to form a document image, and then a character image is cut out from the document image to perform a character recognition process to obtain a recognition result. ing. In such a character recognition system, the character recognition process itself does not take much time, but it takes considerable time to confirm and correct the recognition result. In other words, confirmation of the recognition result, editing such as correction, etc., are performed by matching the original document (or document image) with the recognition result over the entire text (all pages, all lines), and usually, the accuracy is corrected. In order to achieve this, the matching check of such a whole sentence was repeated twice.
【0003】[0003]
【発明が解決しようとする課題】このように、従来で
は、認識結果の確認,修正等の編集を行なう場合、通
常、認識結果とその元となった文書(あるいは文書画像)
との全文にわたる突き合わせチェックを2回繰り返して
行なっていたので、認識結果の確認,修正等の編集に相
当の時間を要し、特に大量の文書の認識結果の確認,修
正等の編集を行なう場合に、作業効率が著しく低下して
しまうという問題があった。As described above, conventionally, when editing such as confirmation and correction of a recognition result, the recognition result and a document (or a document image) based on the recognition result are conventionally used.
The matching check over the whole sentence was repeated twice, so it took a considerable amount of time to confirm the recognition result and edit the correction, etc., especially when checking the recognition result of a large number of documents and editing the correction etc. In addition, there is a problem that the working efficiency is significantly reduced.
【0004】本発明は、文書が大量のものである場合に
も、認識結果の確認,修正などの編集を、効率良く行な
うことの可能な認識結果編集方法およびパターン認識シ
ステムおよび情報記録媒体を提供することを目的として
いる。[0004] The present invention provides a recognition result editing method, a pattern recognition system, and an information recording medium capable of efficiently performing confirmation such as confirmation and correction of a recognition result even when a large number of documents are present. It is intended to be.
【0005】[0005]
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の発明は、所定の文書画像にパターン
認識処理を行なって得られる認識結果に対して編集処理
を施す認識結果編集方法において、認識結果に対して少
なくとも2回の編集処理を施し、その際、各編集処理に
おいて、認識結果の抜き取り率を互いに相違させ、各編
集処理において、所定の抜き取り率で認識結果の抜き取
りがなされたとき、抜き取られた認識結果に対しての
み、編集処理を施すことを特徴としている。In order to achieve the above object, according to the present invention, there is provided a recognition result editing apparatus for performing an editing process on a recognition result obtained by performing a pattern recognition process on a predetermined document image. In the method, the recognition result is subjected to at least two editing processes, and in each editing process, the recognition result sampling rates are made different from each other, and in each editing process, the recognition result sampling is performed at a predetermined sampling rate. When performed, only the extracted recognition result is edited.
【0006】また、請求項2記載の発明は、請求項1記
載の認識結果編集方法において、パターン認識処理で認
識結果とともに認識結果の確信度が算出されるとき、1
回目の編集処理では、所定の閾値以上の確信度の認識結
果をスキップさせ、低確信度の認識結果のみを修正させ
ることを特徴としている。According to a second aspect of the present invention, in the recognition result editing method of the first aspect, when the certainty factor of the recognition result is calculated together with the recognition result in the pattern recognition process.
The third editing process is characterized in that the recognition result with the certainty factor equal to or higher than the predetermined threshold value is skipped, and only the recognition result with the low certainty factor is corrected.
【0007】また、請求項3記載の発明は、請求項1記
載の認識結果編集方法において、各編集処理では、編集
前後の修正履歴を管理し、該修正履歴により、修正頻度
の高い文字についての情報を出力することを特徴として
いる。According to a third aspect of the present invention, in the recognition result editing method of the first aspect, in each editing process, a correction history before and after editing is managed, and a character having a high frequency of correction is managed by the correction history. It is characterized by outputting information.
【0008】また、請求項4記載の発明は、請求項1記
載の認識結果編集方法において、2回目の編集処理で修
正がなされた割合いを修正率として出力することを特徴
としている。According to a fourth aspect of the present invention, in the recognition result editing method according to the first aspect, a ratio of correction performed in the second editing process is output as a correction ratio.
【0009】また、請求項5記載の発明は、認識用の辞
書と、文書画像に対して辞書を用いてパターン認識処理
を施す認識処理手段と、該認識処理手段による認識結果
に対して編集処理を行なう編集処理手段とを備え、編集
処理手段は、認識結果に対して少なくとも2回の編集処
理を施し、その際、各編集処理において、認識結果の抜
き取り率を互いに相違させ、各編集処理において、所定
の抜き取り率で認識結果の抜き取りがなされたとき、抜
き取られた認識結果に対してのみ、編集処理を施すこと
を特徴としている。According to a fifth aspect of the present invention, there is provided a dictionary for recognition, recognition processing means for performing pattern recognition processing on a document image using the dictionary, and editing processing for a recognition result by the recognition processing means. Editing processing means for performing at least two times of editing processing on the recognition result. At this time, in each editing processing, the recognition result sampling rates are made different from each other, and in each editing processing, When a recognition result is extracted at a predetermined extraction rate, an editing process is performed only on the extracted recognition result.
【0010】また、請求項6記載の発明は、請求項5記
載のパターン認識システムにおいて、抜き取り率は、更
新可能に設定されることを特徴としている。According to a sixth aspect of the present invention, in the pattern recognition system of the fifth aspect, the sampling rate is set to be updatable.
【0011】また、請求項7記載の発明は、請求項5記
載のパターン認識システムにおいて、認識処理手段で認
識結果とともに認識結果の確信度が算出されるとき、編
集処理手段は、1回目の編集処理では、所定の閾値以上
の確信度の認識結果をスキップさせ、低確信度の認識結
果のみを修正させるようになっていることを特徴として
いる。According to a seventh aspect of the present invention, in the pattern recognition system according to the fifth aspect, when the recognition processing means calculates the reliability of the recognition result together with the recognition result, the editing processing means performs the first editing. The processing is characterized in that the recognition result with a certainty factor equal to or higher than a predetermined threshold value is skipped, and only the recognition result with a low certainty factor is modified.
【0012】また、請求項8記載の発明は、請求項7記
載のパターン認識システムにおいて、編集処理手段は、
さらに、2回目の編集処理で修正がなされた割合いを修
正率として出力する機能を有しており、確信度の閾値
は、編集処理手段から出力される修正率に応じて更新可
能になっていることを特徴としている。According to an eighth aspect of the present invention, in the pattern recognition system according to the seventh aspect, the editing processing means comprises:
Furthermore, it has a function of outputting the rate of correction made in the second editing process as a correction rate, and the threshold of certainty can be updated according to the correction rate output from the editing processing means. It is characterized by having.
【0013】また、請求項9記載の発明は、請求項5記
載のパターン認識システムにおいて、さらに、辞書を管
理する辞書管理手段が設けられており、辞書管理手段
は、編集処理手段において修正頻度の高い文字について
の情報が修正文字情報として出力されるとき、該修正文
字情報に基づいて辞書の更新を行なう機能を有している
ことを特徴としている。According to a ninth aspect of the present invention, in the pattern recognition system of the fifth aspect, dictionary management means for managing a dictionary is further provided. When information on a high character is output as modified character information, the dictionary has a function of updating the dictionary based on the modified character information.
【0014】また、請求項10記載の発明は、請求項9
記載のパターン認識システムにおいて、辞書の更新の都
度、抜き取り率を低下させることを特徴としている。The invention described in claim 10 is the same as the claim 9.
The described pattern recognition system is characterized in that the sampling rate is reduced each time a dictionary is updated.
【0015】また、請求項11記載の発明は、所定の文
書画像にパターン認識処理を行なって得られる認識結果
に対して少なくとも2回の編集処理を施し、その際、各
編集処理において、認識結果の抜き取り率を互いに相違
させ、各編集処理において、所定の抜き取り率で認識結
果の抜き取りがなされたとき、抜き取られた認識結果に
対してのみ、編集処理を施すためのプログラムが記録さ
れていることを特徴としている。According to an eleventh aspect of the present invention, a recognition result obtained by performing a pattern recognition process on a predetermined document image is subjected to at least two editing processes. In each editing process, when a recognition result is extracted at a predetermined sampling rate, a program for performing an editing process only on the extracted recognition result is recorded. It is characterized by.
【0016】また、請求項12記載の発明は、パターン
認識処理では認識結果とともに認識結果の確信度を算出
し、認識結果を編集する際には所定の閾値以上の確信度
の文字をスキップさせて修正させるためのプログラムが
記録されていることを特徴としている。According to a twelfth aspect of the present invention, in the pattern recognition processing, the confidence of the recognition result is calculated together with the recognition result. It is characterized in that a program for correction is recorded.
【0017】請求項1乃至請求項12記載の発明は、認
識結果の確認,修正などの編集において、編集の作業効
率を著しく向上させることができる。According to the first to twelfth aspects of the present invention, the editing work efficiency can be significantly improved in editing such as confirmation and correction of the recognition result.
【0018】特に、請求項1,請求項5,請求項6,請
求項11記載の発明は、認識結果に対して少なくとも2
回の編集処理を施し、その際、各編集処理において、認
識結果の抜き取り率を互いに相違させ、各編集処理にお
いて、所定の抜き取り率で認識結果の抜き取りがなされ
たとき、抜き取られた認識結果に対してのみ、編集処理
を施すので、認識結果の確認,修正などの編集を効率良
く行なうことができる。In particular, the invention according to claim 1, claim 5, claim 6, or claim 11 provides at least two
In each editing process, the sampling rate of the recognition result is made different from each other, and in each editing process, when the recognition result is sampled at a predetermined sampling rate, the recognition result is extracted. Since the editing process is performed only on the recognition result, editing such as confirmation and correction of the recognition result can be efficiently performed.
【0019】また、請求項2,請求項7,請求項12記
載の発明は、パターン認識処理で認識結果とともに認識
結果の確信度が算出されるとき、1回目の編集処理で
は、所定の閾値以上の確信度の認識結果をスキップさ
せ、低確信度の認識結果のみを修正させる。これによ
り、認識結果の確認,修正等の際に、利用者は文書全体
に目を通す必要がなくなり、作業効率を高めることがで
きる。According to the second, seventh and twelfth aspects of the present invention, when the certainty factor of the recognition result is calculated together with the recognition result in the pattern recognition process, the first editing process requires a certain threshold or more. Is skipped, and only the recognition result with low confidence is corrected. This eliminates the need for the user to look through the entire document at the time of confirming or correcting the recognition result, and can increase the work efficiency.
【0020】また、請求項3,請求項9記載の発明は、
編集処理手段において修正頻度の高い文字についての情
報が修正文字情報として出力されるとき、該修正文字情
報に基づいて辞書の更新を行なうことで、認識率を向上
させることができる。Further, the invention according to claim 3 or claim 9 is as follows:
When information on a character having a high frequency of correction is output as corrected character information in the editing processing means, the recognition rate can be improved by updating the dictionary based on the corrected character information.
【0021】また、請求項4,請求項8記載の発明は、
2回目の編集処理で修正がなされた割合いを修正率とし
て出力し、該修正率に応じて確信度の閾値を更新するこ
とで、認識率を向上させることができる。The invention according to claim 4 or claim 8 is
By outputting the rate of correction in the second editing process as a correction rate, and updating the certainty threshold in accordance with the correction rate, the recognition rate can be improved.
【0022】また、請求項10記載の発明は、辞書の更
新の都度、抜き取り率を低下させる。これにより、使用
する毎に、作業効率を徐々に高めることが可能となる。Further, the invention according to claim 10 reduces the sampling rate each time the dictionary is updated. This makes it possible to gradually increase the work efficiency each time it is used.
【0023】[0023]
【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図1は本発明に係るパターン認識シ
ステムの構成例を示す図である。なお、図1の例では、
パターン認識システムは、文書中の文字を認識する文字
認識システムとして構成されている。Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram showing a configuration example of a pattern recognition system according to the present invention. In the example of FIG. 1,
The pattern recognition system is configured as a character recognition system that recognizes characters in a document.
【0024】図1を参照すると、この文字認識システム
は、原稿などの文書を文書画像として入力する画像入力
部1と、画像入力部1で読込まれた文書画像を記憶する
文書画像記憶部2と、認識対象となる各文字について例
えばその標準パターンや標準的な特徴量が登録されてい
る認識用の辞書5と、画像入力部1から入力された文書
画像から認識対象となる文字画像を切り出して該文字画
像の特徴を抽出して辞書5と比較する文字認識処理を行
なう認識処理部4と、認識処理部4からの認識結果を記
憶する認識結果記憶部6と、認識結果についての確認,
修正などの編集を行なう編集処理部8と、編集処理部8
からの編集処理結果を記憶する編集処理結果記憶部9
と、辞書5の更新等の管理を行なう辞書管理部10と、
認識結果に対する編集処理などの条件を設定するための
条件設定部40とを有している。Referring to FIG. 1, the character recognition system includes an image input unit 1 for inputting a document such as a document as a document image, a document image storage unit 2 for storing the document image read by the image input unit 1, For example, a character image to be recognized is cut out from a recognition dictionary 5 in which a standard pattern and a standard feature amount of each character to be recognized are registered and a document image input from the image input unit 1. A recognition processing unit 4 for performing a character recognition process of extracting the characteristics of the character image and comparing it with the dictionary 5; a recognition result storage unit 6 for storing the recognition result from the recognition processing unit 4;
An edit processing unit 8 for editing such as correction, and an edit processing unit 8
Edit processing result storage unit 9 for storing the edit processing result from
A dictionary management unit 10 that manages updating of the dictionary 5 and the like;
A condition setting unit 40 for setting conditions such as an editing process for the recognition result.
【0025】図2は図1の文字認識システムのハードウ
ェア構成例を示す図である。図2を参照すると、この文
字認識システムは、例えばパーソナルコンピュータ等で
実現され、全体を制御するCPU11と、CPU11の
制御プログラム等が記憶されているROM12と、CP
U11のワークエリア等として使用されるRAM13
と、原稿等の文書を文書画像として読込むスキャナ14
と、スキャナ14で読込まれた文書画像(あるいは、文
書画像から認識用に切り出された文字画像)が例えばペ
ージ単位で例えば圧縮されて記憶される文書画像ファイ
ル15と、文字認識用の辞書が記憶される辞書ファイル
16と、文書画像(文字画像)に対して文字認識処理を行
なって得られた認識結果がテキスト(コード化された情
報)として記憶されるテキストファイル17と、認識結
果の編集処理結果が記憶される編集処理結果ファイル4
1と、編集処理時に一時的な記憶領域として用いられる
テンポラリファイル42と、認識結果に対する編集処理
の条件を設定したり、認識結果に対して確認,修正など
の編集を行なったりするのに用いられる表示装置18お
よび入力装置19とを有している。FIG. 2 is a diagram showing an example of a hardware configuration of the character recognition system of FIG. Referring to FIG. 2, this character recognition system is realized by, for example, a personal computer or the like, and controls a CPU 11 that controls the entire system, a ROM 12 that stores a control program of the CPU 11, and the like.
RAM 13 used as a work area of U11
And a scanner 14 for reading a document such as a manuscript as a document image
A document image file 15 in which a document image read by the scanner 14 (or a character image cut out from the document image for recognition) is compressed and stored, for example, in page units, and a dictionary for character recognition is stored. A dictionary file 16, a text file 17 in which recognition results obtained by performing a character recognition process on a document image (character image) are stored as text (coded information), and a recognition result editing process. Editing result file 4 in which results are stored
1, a temporary file 42 used as a temporary storage area at the time of editing processing, and used to set conditions for editing processing for the recognition result, and to perform editing such as confirmation and correction on the recognition result. It has a display device 18 and an input device 19.
【0026】ここで、スキャナ14,文書画像ファイル
15,辞書16,テキストファイル17,編集処理結果
ファイル41は、図1の画像入力部1,文書画像記憶部
2,辞書5,認識結果記憶部6,編集処理結果記憶部9
にそれぞれ対応している。また、CPU11は、図1の
認識処理部4,編集処理部8の機能を有している。さら
に、後述のように、CPU11は、図1の辞書管理部1
0の機能を有することもできる。Here, the scanner 14, the document image file 15, the dictionary 16, the text file 17, and the editing result file 41 are the image input unit 1, the document image storage unit 2, the dictionary 5, and the recognition result storage unit 6 of FIG. , Edit processing result storage unit 9
Respectively. The CPU 11 has the functions of the recognition processing unit 4 and the editing processing unit 8 in FIG. Further, as will be described later, the CPU 11 stores the dictionary management unit 1 of FIG.
It can also have a function of zero.
【0027】また、図2の表示装置18,入力装置1
9,CPU11,RAM13などは、図1の条件設定部
40としての機能も有している。すなわち、編集処理な
どの条件を、入力装置19等から入力させて、CPU1
1によりRAM13内に設定することができる。The display device 18 and the input device 1 shown in FIG.
9, the CPU 11, the RAM 13, and the like also have a function as the condition setting unit 40 in FIG. That is, conditions such as editing processing are input from the input device 19 or the like, and the CPU 1
1 can be set in the RAM 13.
【0028】なお、CPU11におけるこのような認識
処理部,編集処理部,辞書管理部,さらには条件設定部
等としての機能は、例えばソフトウェアパッケージ(具
体的には、CD−ROM等の情報記録媒体)の形で提供
することができ、このため、図2の例では、情報記録媒
体20がセットさせるとき、これを駆動する媒体駆動装
置21が設けられている。The functions of the recognition processing unit, the editing processing unit, the dictionary management unit, the condition setting unit, and the like in the CPU 11 are, for example, a software package (specifically, an information recording medium such as a CD-ROM). 2), and therefore, in the example of FIG. 2, when the information recording medium 20 is set, a medium driving device 21 that drives the information recording medium 20 is provided.
【0029】また、入力装置19には、例えばキーボー
ド,マウス等を用いることができ、表示装置18には、
CRTやLCDなどのディスプレイを用いることができ
る。この場合、ディスプレイ18の画面に表示されてい
るアイコン等をマウスによってポイントすることで、処
理の選択や、所定処理の開始,終了指示などを行なった
り、キーボードやマウスにより、画面上で、カーソル移
動を行なったり、さらには、スクロールを行なったりす
ることができる。For the input device 19, for example, a keyboard, a mouse or the like can be used.
A display such as a CRT or LCD can be used. In this case, an icon or the like displayed on the screen of the display 18 is pointed by a mouse to select a process, to start or end a predetermined process, or to move a cursor on the screen by a keyboard or a mouse. Or scrolling can be performed.
【0030】換言すれば、本発明のパターン認識システ
ム(文字認識システム)は、イメージスキャナ,ディスプ
レイ等を備えた汎用の計算機システムにCD−ROM等
の情報記録媒体に記録されたプログラムコードを読み込
ませて、この汎用計算機システムのマイクロプロセッサ
にパターン認識処理(文字認識処理)を実行させる装置構
成においても実施することが可能である。この場合、本
発明のパターン認識処理プログラムや編集処理プログラ
ムや辞書管理プログラムなどを格納する情報記憶媒体と
しては、CD−ROMに限られるものではなく、RO
M,RAM,FD等が用いられても良い。また、文書画
像の入力は、スキャナを使用しないで、画像イメージフ
ァイルとして与えられても良い。In other words, the pattern recognition system (character recognition system) of the present invention causes a general-purpose computer system having an image scanner, a display, and the like to read a program code recorded on an information recording medium such as a CD-ROM. The present invention can also be implemented in an apparatus configuration in which a microprocessor of this general-purpose computer system executes pattern recognition processing (character recognition processing). In this case, the information storage medium for storing the pattern recognition processing program, the editing processing program, the dictionary management program, and the like according to the present invention is not limited to a CD-ROM, but may be an RO.
M, RAM, FD, etc. may be used. The input of the document image may be given as an image file without using a scanner.
【0031】また、図1,図2の文字認識システムにお
いて、認識処理部4は、認識結果を求めるとともに、そ
の認識結果の確信度(確からしさ)をも求めるようになっ
ていても良い。この確信度の算出処理については、例え
ば特開平4−211883号に開示の仕方で行なうこと
ができる。In the character recognition system shown in FIGS. 1 and 2, the recognition processing section 4 may obtain the recognition result and also obtain the certainty (reliability) of the recognition result. The process of calculating the certainty factor can be performed by, for example, a method disclosed in Japanese Patent Application Laid-Open No. 4-212883.
【0032】すなわち、確信度とは、最終認識結果の文
字がどの程度確からしいかを表わすもので、0%から1
00%の数値で表わされたり、あるいは、その数値を何
段階かに量子化して表わすことができる。例えば、次の
A,B,Cの3ランクで表わすことができる。 Aランク:認識結果は正しい。 Bランク:認識結果は怪しい(正しいか間違いか分から
ない)。 Cランク:認識結果は間違い。That is, the degree of certainty indicates how likely the character of the final recognition result is to be.
It can be represented by a numerical value of 00%, or can be represented by quantizing the numerical value in several steps. For example, it can be represented by the following three ranks A, B, and C. A rank: The recognition result is correct. B rank: The recognition result is suspicious (I do not know whether it is correct or wrong). C rank: The recognition result is wrong.
【0033】この場合、認識処理部4では、最終の認識
結果を得るための複数段階の処理により得られる情報に
基づき、総合的に確信度を決定する。例えば、パターン
マッチング処理から第一候補の評価値あるいは第一候補
と第二候補との評価値の差,パス選択処理からパス決定
時の評価値,ルール処理から、どのようなルールが適用
され修正されたかを表わす情報,言語処理から言語修正
の結果を表わす情報を集め、これらの情報を証拠として
例えばデンプスター・シェーファー(Dempster& Shafer)
の確率理論を使って確信度を総合的に判断する。In this case, the recognition processing section 4 comprehensively determines a certainty factor based on information obtained by a plurality of stages of processing for obtaining a final recognition result. For example, from the pattern matching processing, the evaluation value of the first candidate or the difference between the evaluation values of the first candidate and the second candidate, the path selection processing, the evaluation value at the time of determining the path, and the rule processing, which rule is applied and modified. Gathering information indicating whether or not it was done, and information indicating the result of language correction from language processing, and using this information as evidence, for example, Dempster & Shafer
Comprehensively evaluates the confidence using the probability theory of
【0034】このような確信度の決定は、最終の処理段
階で、それまでの処理段階で得られた情報を集めて一括
して行なうか、あるいは各処理段階で得られた情報に基
づき候補の確信度を求め、これによって前処理段階まで
に求められた確信度を更新する操作を最終処理段階まで
繰り返すことにより行なう。The determination of such a certainty factor may be performed in the final processing stage by collecting information obtained in the previous processing stages and collectively, or may be performed based on the information obtained in each processing stage. The operation of obtaining the certainty factor and updating the certainty factor obtained by the pre-processing stage by this operation is repeated until the final processing stage.
【0035】このように、認識処理部4において、確信
度が求められる場合には、後述のように、編集処理部8
における認識結果の確認,修正等の編集処理において、
かかる確信度に応じて、認識結果の表示の際に色や輝度
などの視覚的条件を変化させ、あるいは認識結果に対応
させて文字または記号を表示すれば、装置利用者は、認
識結果の確信度を容易に認識し、修正が必要な文字を素
早く的確に見つけ、その修正作業を効率よく行なうこと
ができる。As described above, when certainty is required in the recognition processing unit 4, as described later, the editing processing unit 8
In editing processing such as confirmation and correction of recognition results in
By changing visual conditions such as color and brightness when displaying the recognition result or displaying characters or symbols in accordance with the recognition result in accordance with the certainty, the apparatus user can be sure of the recognition result. It is possible to easily recognize the degree, find the character that needs correction quickly and accurately, and perform the correction work efficiently.
【0036】また、編集処理部8は、認識処理部4から
の認識結果に対して、第1回目の編集処理を行ない(よ
り具体的には、認識結果記憶部6に記憶されている認識
結果に対して編集処理を行ない)、この編集処理結果を
編集処理結果記憶部9の第1の結果記憶部9a(図2の
第1の結果ファイル41a)に格納する第1の編集処理
部31と、認識処理部4からの認識結果に対して第2回
目以後の編集処理を行ない(より具体的には、第1の結
果記憶部9a(図2の第1の結果ファイル41a)に格納
されている第1回目の編集処理結果に対してさらに編集
処理を行ない)、編集処理結果記憶部9の第2の結果記
憶部9b(図2の第2の結果ファイル41b)に格納する
第2の編集処理部32とを備えている。The editing unit 8 performs a first editing process on the recognition result from the recognition unit 4 (more specifically, the recognition result stored in the recognition result storage unit 6). And a first edit processing unit 31 that stores the result of the edit processing in a first result storage unit 9a (first result file 41a in FIG. 2) of the edit processing result storage unit 9. The second and subsequent editing processes are performed on the recognition result from the recognition processing unit 4 (more specifically, the result is stored in the first result storage unit 9a (the first result file 41a in FIG. 2). The first edit processing result is further edited), and the second edit stored in the second result storage unit 9b of the edit processing result storage unit 9 (the second result file 41b in FIG. 2). And a processing unit 32.
【0037】ここで、第1の編集処理部31および第2
の編集処理部32は、認識結果に対する編集処理を行な
う場合、例えば、表示装置18の画面上に、認識結果あ
るいは編集処理結果を表示する際の基準線を表示し、こ
の基準線の一方の側には、該基準線に沿って現在編集対
象となる認識結果あるいは編集処理結果を表示し、ま
た、該基準線の他方の側には、該基準線の一方の側に表
示される現在編集対象となる認識結果あるいは編集処理
結果に対応した文書画像(文字画像)を該基準線に沿って
表示することができる。Here, the first edit processing section 31 and the second
When performing the editing process on the recognition result, the editing processing unit 32 displays, for example, a reference line for displaying the recognition result or the editing process result on the screen of the display device 18 and one side of the reference line. Displays a recognition result or an edit processing result which is a current edit target along the reference line, and displays the current edit target displayed on one side of the reference line on the other side of the reference line. A document image (character image) corresponding to the recognition result or the edit processing result can be displayed along the reference line.
【0038】図3には、ある1ページ分の文書の例が示
されており、図4(a),(b)には、図3の文書の認識結
果あるいは編集処理結果を確認,修正等するための表示
装置18における表示例がそれぞれ示されている。FIG. 3 shows an example of a document for a certain page. FIGS. 4A and 4B show the results of recognition or editing of the document shown in FIG. The display examples on the display device 18 for performing the operations are shown.
【0039】図4(a)の表示例では、画面上に縦の基準
線L1を表示し、この基準線L1に沿って、そのすぐ右側
には、現在編集対象となる認識結果列あるいは編集処理
結果列“本日は晴天なり、”を行方向(=縦)に表示し、
また、そのすぐ左側には、上記編集対象となる認識結果
列あるいは編集処理結果列に対応した文書画像(文字画
像)列“本日は晴天なり、”を縦の基準線L1に沿って行
方向(=縦)に表示している。In the display example of FIG. 4A, a vertical reference line L 1 is displayed on the screen, and along the reference line L 1 , immediately next to the reference line L 1 , a recognition result sequence or a recognition result sequence to be edited is displayed. The edit result column “Today is fine weather” is displayed in the row direction (= vertical),
Moreover, its is immediately to the left, the editing subject to recognition result string or editing result document image corresponding to the columns (character image) string "today becomes fine weather," row direction along the longitudinal reference line L 1 (= Vertical).
【0040】また図4(b)の表示例では、画面上の横の
基準線H1を表示し、この基準線H1に沿って、そのすぐ
上側には、現在編集対象となる認識結果列あるいは編集
処理結果列“本日は晴天なり、”を行方向(=横)に表示
し、また、そのすぐ下側には、上記編集対象となる認識
結果列あるいは編集処理結果列に対応した文書画像(文
字画像)列“本日は晴天なり、”を横の基準線H1に沿っ
て行方向(=横)に表示している。In the display example of FIG. 4B, a horizontal reference line H 1 on the screen is displayed, and a recognition result sequence to be edited is displayed immediately above the reference line H 1. Alternatively, the edit processing result column “Today is fine weather” is displayed in the row direction (= horizontal), and the document image corresponding to the recognition result sequence to be edited or the edit processing result sequence is immediately below. (character image) string "today becomes fine weather," are displayed in the row direction (= horizontal) along the side of the reference line H 1.
【0041】なお、表示画面上において、図4(a)のよ
うに行方向を縦にするか、あるいは、図4(b)のように
行方向を横にするかは、例えば認識処理開始時などに、
例えば図1の条件設定部40(図2の入力装置19)など
において、行方向を「縦」または「横」と指定すること
で設定できる。Note that, on the display screen, whether the row direction is vertical as shown in FIG. 4A or the row direction is horizontal as shown in FIG. For example,
For example, the condition can be set by designating the row direction as “vertical” or “horizontal” in the condition setting unit 40 (input device 19 in FIG. 2) in FIG.
【0042】また、第1の編集処理部31および第2の
編集処理部32は、表示装置18の表示画面上で、基準
線の一方の側に表示される認識結果(テキスト)と基準線
の他方の側に表示される文書画像(文字画像)とを、常に
連動させて、スクロールあるいは移動させる機能を有し
ている。具体的に、例えば図4(a)の状態で、基準線L
1の右側に表示されている認識結果(テキスト)を例えば
右方向に1行分移動させると、図5に示すように、これ
と連動させて、基準線L1の左側に表示されている文書
画像(文字画像)も右方向に1行分移動させるような表示
制御を行なうことができる。また、例えば図4(a)の状
態で、基準線L1の右側に表示されている認識結果(テキ
スト)を例えば上方向に2文字分移動させると、図6に
示すように、これと連動させて、基準線L1の左側に表
示されている文書画像(文字画像)も上方向に2文字分移
動させるような表示制御を行なうことができる。The first edit processing unit 31 and the second edit processing unit 32 display the recognition result (text) displayed on one side of the reference line on the display screen of the display device 18 and the reference line. It has a function of constantly scrolling or moving the document image (character image) displayed on the other side in conjunction with it. Specifically, for example, in the state of FIG.
Moving one row 1 of the display has been that the recognition result to the right (the text), for example, in the right direction, as shown in FIG. 5, in conjunction with this, the document that is displayed on the left side of the reference line L 1 Display control can be performed such that the image (character image) is also moved rightward by one line. Further, for example, in the state of FIG. 4 (a), the right to view has been that the recognition result of the reference line L 1 is moved two characters (text), for example, in the upward direction, as shown in FIG. 6, in conjunction with this is allowed, the document image (character image) displayed on the left side of the reference line L 1 also can be displayed control to move two characters upward.
【0043】このように、表示装置18の表示画面上
で、基準線の一方の側に表示される認識結果あるいは編
集処理結果と基準線の他方の側に表示される文書画像
(文字画像)とを、常に対応させて表示する機能(基準線
に沿って、かつ、該基準線を挾んで互いに対向して(並
列に)表示する機能)を第1の編集処理部31および第2
の編集処理部32が有している場合には、認識結果ある
いは編集処理結果とこれに対応した文書画像(文字画像)
列との対比が容易になり、オペレータは、認識結果ある
いは編集処理結果の確認,修正を容易に行なうことがで
きる。As described above, on the display screen of the display device 18, the recognition result or the edit processing result displayed on one side of the reference line and the document image displayed on the other side of the reference line.
(Character image) and the function of always displaying them (corresponding to the reference line and displaying them in parallel with each other across the reference line). Second
When the editing processing unit 32 has the recognition result or the editing processing result and the corresponding document image (character image)
The comparison with the column is facilitated, and the operator can easily confirm and correct the recognition result or the edit processing result.
【0044】また、認識結果あるいは編集処理結果の確
認,修正を行なう際、表示装置18の画面上で、現在修
正中の文字については、これが現在修正中であることを
識別可能に表示することもできる。具体的に、図4(a)
の例において、例えば図7のように、“天”が“夫”と
誤認識されており、認識結果あるいは編集処理結果中で
現在修正中の文字が“夫”である場合、認識結果の表示
領域において“夫”の文字のところを例えば矩形で囲
み、また、文書画像の表示領域において、これに対応し
た“天”の文字画像のところを例えば赤色の矩形で囲む
こともできる。When the recognition result or the edit processing result is confirmed or corrected, a character currently being corrected may be displayed on the screen of the display device 18 so as to be identifiable that the character is currently being corrected. it can. Specifically, FIG.
In the example shown in FIG. 7, when "heaven" is erroneously recognized as "husband" and the character currently being corrected in the recognition result or the editing processing result is "husband" as shown in FIG. 7, the recognition result is displayed. In the area, the character of "husband" may be surrounded by, for example, a rectangle, and in the display area of the document image, the corresponding character image of "heaven" may be surrounded by, for example, a red rectangle.
【0045】また、図4(a),(b)などの表示例におい
て、文書画像(文字画像)を表示する場合、後述のよう
に、文書画像ファイル15に例えば圧縮されて格納され
ている文書画像(文字画像)を拡大して、例えばスキャナ
入力時の文書画像と等倍で表示することもできる。In the display examples shown in FIGS. 4A and 4B, when a document image (character image) is displayed, for example, a document stored in the document image file 15 in a compressed state as described later. It is also possible to enlarge the image (character image) and display it at, for example, the same size as the document image input at the time of the scanner.
【0046】また、図4(a),(b)などの表示例では、
画面には、認識結果(テキスト)と文書画像(文字画像)の
みしか表示されていないが、この画面において、さら
に、例えば編集対象ページのイメージ全体を表示し、ま
た、編集対象ページにおいて、修正した文字,低確信度
の文字数,総文字数等の情報などを表示する機能を第1
の編集処理部31,第2の編集処理部32にもたせるこ
とも可能である。In the display examples shown in FIGS. 4A and 4B,
On the screen, only the recognition result (text) and the document image (character image) are displayed, but on this screen, for example, the entire image of the page to be edited is further displayed, and the correction is performed on the page to be edited. The first function to display information such as characters, the number of characters with low confidence, the total number of characters, etc.
It is also possible to provide the editing processing unit 31 and the second editing processing unit 32 of the above.
【0047】このように、第1の編集処理部31と第2
の編集処理部32とは、上記のような1つの表示画面内
での基本的な表示制御機能に関しては、これらを同じも
のにすることができる。As described above, the first edit processing unit 31 and the second
With regard to the basic display control function within one display screen as described above, these can be the same.
【0048】しかしながら、認識結果の確認,修正等の
編集を効率良く行なうため、本発明では、第1の編集処
理部31と第2の編集処理部32とで、編集処理機能を
互いに相違させている。However, in order to efficiently perform editing such as confirmation and correction of the recognition result, in the present invention, the first editing processing unit 31 and the second editing processing unit 32 have different editing processing functions. I have.
【0049】すなわち、第1の編集処理部31の編集処
理機能と第2の編集処理部32の編集処理機能とを同じ
ものにする場合には、編集処理を同じ仕方で2回以上繰
り返して行なうことと等価であり、この編集処理が、認
識結果とその元になった文書との全文にわたる突き合わ
せチェックを行なうものである場合、前述したように、
作業効率が著しく低下してしまう。That is, when the editing processing function of the first editing processing section 31 and the editing processing function of the second editing processing section 32 are to be the same, the editing processing is repeated twice or more in the same manner. If the editing process is to perform a full-text matching check between the recognition result and the source document, as described above,
Work efficiency is significantly reduced.
【0050】本発明では、従来におけるこのような問題
を解決するため、第1の編集処理部31の編集処理機能
が、例えば、認識結果とその元になった文書との全文に
わたる突き合わせチェックを行なうものである場合、第
2の編集処理部32は、全文にわたる認識結果(すなわ
ち、この場合、編集処理結果)をチェックするのではな
く、全文にわたる編集処理結果の中から、所定の抜き取
り率で、認識結果(編集処理結果)を抜き出し、抜き出し
た認識結果(編集処理結果)に対してのみ、確認,修正な
どの編集処理を行なうようになっている。In the present invention, in order to solve such a problem in the related art, the editing processing function of the first editing processing unit 31 performs, for example, a matching check over the entire text between the recognition result and the original document. If it is, the second editing unit 32 does not check the recognition result over the entire sentence (that is, in this case, the editing result), but instead of checking the recognition result over the whole sentence, at a predetermined sampling rate, A recognition result (edit processing result) is extracted, and editing processing such as confirmation and correction is performed only on the extracted recognition result (edit processing result).
【0051】より具体的に、文書画像記憶部2に会議録
原稿等の文書の文書画像がページ単位に、例えばnペー
ジ分格納され、認識処理部4がnページ分の文書画像に
対してページ単位に認識処理を行ない、nページ分の認
識結果が認識結果記憶部6(テキストファイル17)に記
憶されるとき、第1の編集処理部31は、例えば、nペ
ージ分の認識結果を全ページ(nページ)、ページ単位に
編集処理(確認,修正)するよう機能する一方、第2の編
集処理部32は、全ページを対象に編集処理を行なうの
ではなく、例えば、全ページ(nページ)分の認識結果
(編集処理結果)から、所定の抜き取り率w(0<w<1)
でページ単位に、n×wページ分の認識結果(編集処理
結果)を抜き出し、抜き出したn×wページ分の認識結
果(編集処理結果)のみをページ単位に編集処理する機能
を有している。More specifically, for example, n pages of document images of a document such as a meeting minutes document are stored in the document image storage unit 2 in units of pages, and the recognition processing unit 4 stores the page images for the n pages of document images. When the recognition processing is performed for each unit and the recognition results for n pages are stored in the recognition result storage unit 6 (text file 17), the first editing processing unit 31 stores the recognition results for n pages in all pages, for example. (n pages), while the second edit processing unit 32 functions to perform edit processing (confirmation and correction) in page units, instead of performing edit processing for all pages, for example, for all pages (n pages) ) Minutes recognition result
From the (editing result), a predetermined extraction rate w (0 <w <1)
Has a function to extract recognition results (editing results) for n × w pages in page units, and to edit only the extracted recognition results (editing results) for n × w pages in page units .
【0052】ここで、nページ分の認識結果(編集処理
結果)から、所定の抜き取り率wでn×wページ分の認
識結果(編集処理結果)を抜き出す仕方として、例えば1
からnまでの範囲内で、n×w個の乱数値を発生させ、
この乱数によって、nページ分からn×wページ分をラ
ンダムに抽出する(抜き出す)ことができる。Here, as a method for extracting the recognition result (editing result) for n × w pages at a predetermined sampling rate w from the recognition result (editing result) for n pages, for example, 1
Generate n × w random numbers in the range from to
With this random number, n × w pages can be randomly extracted (extracted) from n pages.
【0053】なお、nページ分の認識結果(編集処理結
果)から、上記のような仕方で、n×wページ分の認識
結果(編集処理結果)を抜き出したときに、抜き出したn
×wページ分の認識結果(編集処理結果)は、編集処理が
なされるに先立って、テンポラリファイル42に一時格
納されるようになっている。また、編集処理において、
図4(a),(b)のような表示制御処理が行なわれる場
合、n×wページ分の認識結果(編集処理結果)に対応し
た元の文書画像もテンポラリファイル42に一時格納さ
れるようになっている。When the recognition result (editing result) for n × w pages is extracted from the recognition result (editing result) for n pages in the manner described above, the extracted n
Recognition results (editing process results) for xw pages are temporarily stored in a temporary file 42 before the editing process is performed. In the editing process,
When the display control processing as shown in FIGS. 4A and 4B is performed, the original document image corresponding to the recognition result (edit processing result) for n × w pages is also temporarily stored in the temporary file 42. It has become.
【0054】また、抜き取り率wは、例えばユーザによ
って、条件設定部40(表示装置18,入力装置19)に
より、任意のものに設定可能となっており、また、抜き
取り率wは、これを更新(変更)可能になっている。ま
た、抜き取り率wは、これが一旦設定されると、更新
(変更)がなされるまで、例えばRAM13内に現在の抜
き取り率として保持されるようになっている。The sampling rate w can be arbitrarily set by the user, for example, by the condition setting section 40 (the display device 18 and the input device 19), and the sampling rate w is updated. (Change) is possible. The sampling rate w is updated once it is set.
Until (change) is made, for example, the current extraction rate is held in the RAM 13.
【0055】具体的に、抜き取り率wの設定は、次のよ
うな仕方で行なうことができる。先ず、図8のような初
期画面が表示されている状態で、ユーザが「抜き取り率
設定」のアイコン(%)をポイントすると、図9のような
抜き取り率設定画面が表示される。ここで、抜き取り率
設定画面の抜き取り率設定窓には、現在の抜き取り率w
(%)が表示される。なお、このシステムの初期状態(セ
ットアップ直後)では、抜き取り率wとしてデフォルト
値“100”が設定されており、従って、この段階で
は、抜き取り表示窓には“100”が表示される。ユー
ザは、これを所望の抜き取り率に設定(変更)したい場合
には、例えば入力装置19から、所望の抜き取り率の数
値(%),すなわち1〜100の範囲の数値を入力する。
例えば、編集対象となる会議録原稿の総ページ数が10
0ページであり、このうちの20ページ分を抜き取りた
いときには、抜き取り率wは、20/100=20(%)
であるので、ユーザは“20”を入力する。Specifically, the setting of the sampling rate w can be performed in the following manner. First, in a state where the initial screen as shown in FIG. 8 is displayed, when the user points at the icon (%) of “sampling rate setting”, a sampling rate setting screen as shown in FIG. 9 is displayed. Here, the current sampling rate w is displayed in the sampling rate setting window of the sampling rate setting screen.
(%) Is displayed. In the initial state of this system (immediately after setup), a default value “100” is set as the sampling rate w, and therefore, “100” is displayed in the sampling display window at this stage. When the user wants to set (change) this to a desired sampling rate, the user inputs, for example, a numerical value (%) of the desired sampling rate, that is, a numerical value in the range of 1 to 100 from the input device 19.
For example, if the total number of pages of the conference copy manuscript to be edited is 10
When there are 0 pages and 20 pages are to be extracted, the extraction rate w is 20/100 = 20 (%).
Therefore, the user inputs "20".
【0056】これにより、抜き取り率設定窓の数値は、
“100”から“20”に変わる。抜き取り率wが20
(%)で良い場合は、ユーザは、抜き取り率設定窓の数値
が“20”であることを確認して、抜き取り率設定画面
のアイコン(OK)をポイントする。これにより、抜き取
り率wは、20(%)に確定し、これが更新(変更)されな
い限り、例えばRAM13内にパラメータとして保持さ
れる。なお、この設定を取り消したいとき、例えば、こ
の数値“20”とは異なる数値にしたいときには、ユー
ザは、抜き取り率設定画面のアイコン(キャンセル)をポ
イントする。これにより、画面は初期画面に戻り、再び
上記の操作を行なって抜き取り率設定画面を表示させ、
所望の抜き取り率の数値を入力する。Thus, the numerical value of the sampling rate setting window is
It changes from “100” to “20”. The sampling rate w is 20
If (%) is sufficient, the user confirms that the numerical value of the sampling rate setting window is “20”, and points to the icon (OK) on the sampling rate setting screen. As a result, the sampling rate w is determined to be 20 (%), and is held as a parameter in, for example, the RAM 13 unless it is updated (changed). When the user wants to cancel this setting, for example, to change the numerical value from “20”, the user points to the icon (cancel) on the sampling rate setting screen. As a result, the screen returns to the initial screen, and performs the above operation again to display the sampling rate setting screen,
Enter the value of the desired extraction rate.
【0057】このようにして、抜き取り率wの設定,更
新(変更)等を行なうことができる。In this manner, setting, updating (changing), and the like of the sampling rate w can be performed.
【0058】図10は第1の編集処理部31の処理動作
例,操作例を説明するためのフローチャートである。図
10を参照すると、第1の編集処理部31は、図4
(a),(b)に示したような画面を表示して、ユーザにペ
ージ単位での確認,修正などの編集処理を行なわせるこ
とができる。すなわち、第1の編集処理部31は、先
ず、終了ボタンあるいは次ページボタンあるいは確定ボ
タンが選択されたか否かを判断する(ステップS1,S
2,S3)。FIG. 10 is a flowchart for explaining a processing operation example and an operation example of the first editing processing section 31. Referring to FIG. 10, the first edit processing unit 31
By displaying a screen as shown in (a) and (b), the user can be made to perform editing processing such as confirmation and correction in page units. That is, the first editing processing unit 31 first determines whether the end button, the next page button, or the confirm button has been selected (steps S1 and S1).
2, S3).
【0059】この結果、次ページボタンが選択されたと
きには、認識結果記憶部6(テキストファイル17)およ
び文書画像記憶部2(文書画像ファイル15)に格納され
ているnページ分の認識結果および文書画像のうち、未
処理分の先頭ページを例えば図4(a),(b)に示したよ
うに画面表示する(ステップS4)。これにより、ユーザ
は、このページの認識結果を前述のようにして確認,修
正等することができる(ステップS5)。このようにし
て、1ページ分の編集処理が終了すると、再びステップ
S1に戻り、上述したと同様の処理が繰り返される。す
なわち、この繰り返し処理において、ユーザが順次に次
ページボタンを選択すると(ステップS2)、認識結果記
憶部6(テキストファイル17)および文書画像記憶部2
(文書画像ファイル15)に格納されているnページ分の
認識結果および文書画像がページ単位に順次に画面表示
され、ユーザは、nページ分の認識結果をページ単位
に、順次、確認,修正することができる。As a result, when the next page button is selected, the recognition result and the document for n pages stored in the recognition result storage unit 6 (text file 17) and the document image storage unit 2 (document image file 15) are displayed. The first page of the unprocessed image is displayed on the screen as shown in FIGS. 4A and 4B (step S4). Thus, the user can confirm and correct the recognition result of this page as described above (step S5). When the editing process for one page is completed in this way, the process returns to step S1, and the same process as described above is repeated. That is, in this repetition processing, when the user sequentially selects the next page button (step S2), the recognition result storage unit 6 (text file 17) and the document image storage unit 2
The recognition results and document images for n pages stored in the (document image file 15) are sequentially displayed on the screen in page units, and the user sequentially confirms and corrects the recognition results for n pages in page units. be able to.
【0060】このような一連の処理において、ユーザが
確定ボタンを選択すると(ステップS3)、第1の編集処
理部31は、nページ分の認識結果の編集(確認,修正
等)を全て行なったかをチェックする(ステップS6)。
この結果、nページ分の認識結果の編集(確認,修正等)
を全て行なったときには、認識結果に対する編集(nペ
ージ分の編集)を確定し、この編集処理結果を第2の結
果記憶部9b(第2の結果ファイル41b)に格納する
(ステップS7)。In such a series of processing, when the user selects the confirm button (step S3), the first editing processing section 31 checks whether all the recognition results for n pages have been edited (confirmation, correction, etc.). Is checked (step S6).
As a result, edit (confirmation, correction, etc.) the recognition results for n pages
Are performed, the editing of the recognition result (editing for n pages) is determined, and the result of the editing process is stored in the second result storage unit 9b (the second result file 41b).
(Step S7).
【0061】また、上記一連の処理において、ユーザが
終了ボタンを選択すると(ステップS1)、第1の編集処
理部31における編集処理(プログラム)の実行を終了す
る。In the above series of processing, when the user selects the end button (step S1), the execution of the editing processing (program) in the first editing processing section 31 ends.
【0062】なお、上述の処理例では、次ページボタン
によって次ページを順次に選択する処理しか示されてい
ないが、前ページボタンをさらに設け、前ページボタン
を選択すると前ページへ戻るなどの処理を追加すること
も可能である。In the above-described processing example, only the processing of sequentially selecting the next page by the next page button is shown. Can also be added.
【0063】また、図11,図12は第2の編集処理部
32の処理動作例,操作例を説明するためのフローチャ
ートである。図11,図12を参照すると、例えば図8
に示したような初期画面が表示されている状態で(ステ
ップS11)、所望のページ数分のページの抜き出しが
すでになされてテンポラリファイル42に格納されてい
るか否かを判断する(ステップS12)。FIGS. 11 and 12 are flow charts for explaining an example of processing operation and an example of operation of the second editing processing section 32. Referring to FIGS. 11 and 12, for example, FIG.
Is displayed (step S11), it is determined whether or not the desired number of pages have been extracted and stored in the temporary file 42 (step S12).
【0064】所望のページ数分のページの抜き出しが未
だなされていないときには、総ページから所望のページ
数分のページの抜き出しを行ないこれらをテンポラリフ
ァイル42に格納するまでの処理(ステップS13乃至
S18)を行なう。If the desired number of pages have not been extracted yet, the pages corresponding to the desired number of pages are extracted from the total pages, and the processing until these are stored in the temporary file 42 (steps S13 to S18). Perform
【0065】すなわち、抜き取り率wが所望の値に設定
されているか否かを判断し(ステップS13)、所望の値
に設定されていないときには、ユーザは、前述のよう
に、抜き取り率設定画面を表示して、所望の抜き取り率
wを設定する(ステップS14)。このようにして、例え
ば、RAM13内に所望の抜き取り率wが設定されたと
きには、第2の編集処理部32は、総ページ数nの値の
範囲内で、この抜き取り率wで、乱数値を発生させ(ス
テップS15)、発生させた乱数値によって、総ページ
数nからランダムにn×w(%)分のページ番号を抽出す
る(ステップS16)。次いで、抽出したn×w(%)ペー
ジ分の上記ページ番号に対応する各ページの認識結果
(編集処理結果)および文書画像を第1の結果記憶部9a
(第1の結果ファイル41a)および文書画像記憶部2
(文書画像ファイル15)からそれぞれ読み出し、これら
を、テンポラリファイル42に格納する(ステップS1
7)。That is, it is determined whether or not the sampling rate w is set to a desired value (step S13). When the sampling rate w is not set to the desired value, the user sets the sampling rate setting screen as described above. It is displayed and a desired extraction rate w is set (step S14). In this way, for example, when the desired extraction rate w is set in the RAM 13, the second editing processing unit 32 sets the random number value at this extraction rate w within the range of the total number of pages n. A page number for n × w (%) is randomly extracted from the total page number n by using the generated random number (step S15). Next, the recognition result of each page corresponding to the page number of the extracted n × w (%) pages
(Editing result) and the document image are stored in the first result storage unit 9a.
(First result file 41a) and document image storage unit 2
(Document image file 15) and store them in the temporary file 42 (step S1).
7).
【0066】このようにして抜き出したn×w(%)ペー
ジ分の認識結果(編集処理結果)および文書画像がテンポ
ラリファイル42に格納された後、第2の編集処理部3
2は、抜き出したページに関する情報(例えばn×wペ
ージ分のページ番号)の一覧表を画面に表示する(ステッ
プS18)。After the recognition results (editing process results) and document images for the n × w (%) pages extracted in this way are stored in the temporary file 42, the second editing unit 3
2 displays a list of information on the extracted pages (for example, page numbers for n × w pages) on the screen (step S18).
【0067】この段階で、第2の編集処理部32は、図
4(a),(b)に示したような画面を表示して、ユーザに
ページ単位での確認,修正などの編集処理を行なわせる
ことができる。すなわち、第2の編集処理部32は、終
了ボタンあるいは抽出ボタンあるいは確定ボタンが選択
されたか否かを判断する(ステップS19,S20,S
21)。At this stage, the second editing processing unit 32 displays a screen as shown in FIGS. 4A and 4B and allows the user to perform editing processing such as confirmation and correction in page units. Can be done. That is, the second editing unit 32 determines whether the end button, the extraction button, or the confirmation button has been selected (steps S19, S20, S20).
21).
【0068】この結果、抽出ボタンが選択されたときに
は、抜き出されてテンポラリファイル42に格納されて
いるn×w(%)ページ分の認識結果(編集処理結果)およ
び文書画像のうち、未処理分の先頭ページを例えば図4
(a),(b)に示したように画面表示する(ステップS2
2)。これにより、ユーザは、このページの認識結果(編
集処理結果)を前述のようにして確認,修正等すること
ができる(ステップS23)。このようにして、1ページ
分の編集処理が終了すると、再びステップS12に戻
り、上述したと同様の処理が繰り返される。すなわち、
この繰り返し処理において、ユーザが順次に抽出ボタン
を選択すると(ステップS20)、抜き出されてテンポラ
リファイル42に格納されているn×w(%)ページ分の
認識結果(編集処理結果)および文書画像がページ単位に
順次に画面表示され、ユーザは、n×w(%)ページ分の
認識結果をページ単位に、順次、確認,修正することが
できる。As a result, when the extraction button is selected, among the recognition results (editing results) and document images of n × w (%) pages extracted and stored in the temporary file 42, For example, the top page of
The screen is displayed as shown in (a) and (b) (step S2
2). Thus, the user can confirm and correct the recognition result (editing result) of this page as described above (step S23). When the editing process for one page is completed in this way, the process returns to step S12, and the same process as described above is repeated. That is,
In this repetition processing, when the user sequentially selects the extraction button (step S20), the recognition results (editing processing results) and document images for the n × w (%) pages extracted and stored in the temporary file 42 are displayed. Are sequentially displayed on the screen in page units, and the user can sequentially confirm and correct the recognition results for n × w (%) pages in page units.
【0069】このような一連の処理において、ユーザが
確定ボタンを選択すると(ステップS21)、第2の編集
処理部32は、n×w(%)ページ分の認識結果(編集処
理結果)の編集(確認,修正等)を全て行なったかをチェ
ックする(ステップS24)。この結果、n×w(%)ペー
ジ分の認識結果(編集処理結果)の編集(確認,修正等)を
全て行なったときには、認識結果(編集処理結果)に対す
る抜き取り編集(n×w(%)ページ分の編集)を確定し、
この編集処理結果を第2の結果記憶部9b(第2の結果
ファイル41b)に格納する(ステップS25)。In such a series of processing, when the user selects the confirm button (step S21), the second editing processing unit 32 edits the recognition result (editing processing result) for n × w (%) pages. It is checked whether all (confirmation, correction, etc.) have been performed (step S24). As a result, when all the edits (confirmation, correction, etc.) of the recognition results (edit processing results) for n × w (%) pages are performed, the sampling edit (n × w (%)) for the recognition results (edit processing results) is performed. Confirm (Edit for page),
The result of this editing process is stored in the second result storage unit 9b (second result file 41b) (step S25).
【0070】また、上記一連の処理において、ユーザが
終了ボタンを選択すると(ステップS19)、第2の編集
処理部32における抜き取り編集処理(プログラム)の実
行を終了する。In the above series of processes, when the user selects the end button (step S19), the execution of the sampling and editing process (program) in the second editing unit 32 is ended.
【0071】また、認識処理部4において認識結果とと
もに確信度が求められる場合、第1の編集処理部31お
よび第2の編集処理部32は、認識結果あるいは編集処
理結果の確認,修正を行なう際、認識結果あるいは編集
処理結果中の低確信度文字については、これを他の文字
と識別可能に表示することもできる。例えば、認識結果
あるいは編集処理結果の表示領域において、認識結果あ
るいは編集処理結果中の低確信度文字を反転表示し、ま
た、文書画像(文字画像)の表示領域において、低確信度
文字を反転表示することもできる。When the recognition processing unit 4 obtains a certainty factor together with the recognition result, the first editing processing unit 31 and the second editing processing unit 32 check and correct the recognition result or the editing processing result. The low confidence character in the recognition result or the edit processing result can be displayed so as to be distinguishable from other characters. For example, in the display area of the recognition result or the editing processing result, the low confidence character in the recognition result or the editing processing result is reversely displayed, and in the display area of the document image (character image), the low confidence character is reversely displayed. You can also.
【0072】また、このように、認識結果とともに確信
度が算出されるとき、第1の編集処理部31および第2
の編集処理部32は、認識結果あるいは編集処理結果の
確認,修正などの編集を行なうような場合に、表示装置
18の画面上に表示される認識結果あるいは編集処理結
果中および/または文書画像(文字画像)中の確信度が所
定の閾値(例えば90%)以上の文字をスキップさせて、
低確信度の文字のみを順番に表示することもできる。す
なわち、認識結果あるいは編集処理結果中および/また
は文書画像(文字画像)中から、確信度が所定閾値(例え
ば90%)以下の文字を抽出して、この文字についての
み、認識結果(編集処理結果)および/または文字画像を
次々と表示させることもできる。When the confidence is calculated together with the recognition result, the first edit processing unit 31 and the second
The editing processing unit 32 of the present embodiment displays the recognition result or the editing process result and / or the document image (or the document image) displayed on the screen of the display device 18 when editing such as confirmation or correction of the recognition result or the editing process result. Characters with a certainty factor (for example, 90%) or more in character images) are skipped.
Only characters with low confidence may be displayed in order. In other words, a character whose certainty factor is equal to or less than a predetermined threshold (for example, 90%) is extracted from the recognition result or the editing process result and / or the document image (character image), and only the character is recognized as the recognition result (editing result ) And / or character images can be displayed one after another.
【0073】なお、この場合、上記確信度の閾値は、例
えば条件設定部40(あるいは図2の入力装置19)によ
り更新可能に設定される。In this case, the certainty threshold is set to be updatable by, for example, the condition setting unit 40 (or the input device 19 in FIG. 2).
【0074】また、このような低確信度文字のスキップ
表示は、例えば図4(a),(b)のような、基準線の一方
の側には、該基準線に沿って現在編集対象となる認識結
果列あるいは編集処理結果列を表示し、また、該基準線
の他方の側には、該基準線の一方の側に表示される現在
編集対象となる認識結果列あるいは編集処理結果列に対
応した文書画像(文字画像)列を該基準線に沿って表示画
面において行なうこともできるし、あるいは、認識結果
あるいは編集処理結果のみの表示画面,あるいは文書画
像(文字画像)のみの表示画面において行なうこともでき
る。In addition, such a skip display of the low certainty character is performed by, for example, as shown in FIGS. 4A and 4B, one side of the reference line is displayed along with the current edit target along the reference line. Is displayed on the other side of the reference line, and the recognition result sequence or the edit processing result column to be currently edited displayed on one side of the reference line is displayed on the other side of the reference line. A corresponding document image (character image) sequence can be displayed on the display screen along the reference line, or a display screen of only the recognition result or the edit processing result, or a display screen of only the document image (character image) can be displayed. You can do it.
【0075】このように、第1の編集処理部31および
第2の編集処理部32において、所定の閾値以上の確信
度の文字についてはこれをスキップさせて(飛ばして)、
低確信度の文字のみを表示する機能をもたせれば、認識
結果あるいは編集処理結果の確認,修正等の際に、利用
者は文書全体に目を通す必要がなくなり、作業効率を高
めることができる。As described above, the first editing processing unit 31 and the second editing processing unit 32 skip (skip) characters having a certainty factor equal to or higher than a predetermined threshold value,
If a function of displaying only characters with low confidence is provided, the user does not need to look through the entire document when checking or correcting the recognition result or the editing result, thereby improving work efficiency. .
【0076】上述の例では、このような確信度に基づく
スキップ表示機能(スキップ修正機能)を、第1の編集処
理部31と第2の編集処理部32との両方にもたせると
したが、このようなスキップ修正機能を、全ページを編
集対象にする第1の編集処理部31にのみもたせ、全ペ
ージから抜き出した所定のページだけを編集対象にする
第2の編集処理部32には、スキップ修正機能をもたせ
ないようにすることも可能である。In the above-described example, the skip display function (skip correction function) based on the certainty factor is provided in both the first edit processing unit 31 and the second edit processing unit 32. Such a skip correction function is provided only to the first edit processing unit 31 that edits all pages, and the second edit processing unit 32 that edits only a predetermined page extracted from all pages is skipped. It is also possible not to have the correction function.
【0077】すなわち、第1の編集処理部31にスキッ
プ修正機能をもたせることで、全ページを対象にする場
合にも、このスキップ修正機能により修正作業を効率良
く行なうことができる。一方、このスキップ修正機能を
第2の編集処理部32にもたせない場合にも、第2の編
集処理部32における編集対象は、第1の編集処理部3
1においてスキップ修正がなされた結果の編集処理結果
であり、また、第2の編集処理部32では、全ページの
うちの一部のページだけを編集対象とするので、スキッ
プ修正せずに1文字毎に逐次確認,修正を行なわせる場
合にも、修正作業効率は差程低下せず、また、スキップ
修正しないことにより確認精度,修正精度をより一層向
上させることができる。That is, by providing the first edit processing section 31 with the skip correction function, the correction work can be efficiently performed by the skip correction function even when the entire page is targeted. On the other hand, even if this skip correction function is not provided to the second edit processing unit 32, the edit target in the second edit processing unit 32 is the first edit processing unit 3.
1 is the result of the editing process resulting from the skip correction, and the second editing processing unit 32 edits only a part of all pages. Even in the case where the confirmation and the correction are sequentially performed every time, the correction work efficiency does not decrease so much, and the confirmation accuracy and the correction accuracy can be further improved by not performing the skip correction.
【0078】なお、利用者の要望等により、上記とは逆
に、このようなスキップ修正機能を、全ページから抜き
出した所定のページだけを編集対象にする第2の編集処
理部32にのみもたせ、全ページを編集対象にする第1
の編集処理部31には、スキップ修正機能をもたせない
ようにすることも可能である。また、第1の編集処理部
31,第2の編集処理部32のいずれにも、スキップ修
正機能をもたせないようにすることも可能である。According to the user's request, the skip correction function is provided only in the second edit processing section 32 which edits only a predetermined page extracted from all pages. , The first to edit all pages
It is also possible to prevent the edit processing unit 31 from having the skip correction function. In addition, it is also possible that neither the first edit processing unit 31 nor the second edit processing unit 32 has the skip correction function.
【0079】さらに、本発明において、第1の編集処理
部31および第2の編集処理部32は、編集(確認,修
正等)前後の履歴(修正履歴)を作成管理するようになっ
ており、このような修正履歴により、修正頻度の高い文
字についての情報を修正文字情報として管理し、ユーザ
により図8の修正文字通知ボタンが操作されたとき、例
えば図13に示すように、修正文字情報画面を表示装置
18に表示し、ユーザに修正頻度の高い文字を通知する
機能をも有している。Further, in the present invention, the first edit processing section 31 and the second edit processing section 32 create and manage histories (correction histories) before and after editing (confirmation, correction, etc.). Based on such a correction history, information on characters having a high frequency of correction is managed as corrected character information. When the user operates the corrected character notification button in FIG. 8, for example, as shown in FIG. Is displayed on the display device 18 to notify the user of a frequently corrected character.
【0080】具体的に、修正頻度の高い文字としては、
第1の編集処理部31および第2の編集処理部32にお
いて、例えば20回以上修正されている文字とすること
ができ、このような文字が存在することによって、修正
の頻度が高くなり、修正作業の効率を低下させている。Specifically, the characters having a high correction frequency include:
In the first edit processing unit 31 and the second edit processing unit 32, for example, a character that has been corrected 20 times or more can be used, and the presence of such a character increases the frequency of correction. The work efficiency has been reduced.
【0081】従って、上記のように修正頻度の高い文字
をユーザに通知することによって、ユーザは、辞書管理
部10を起動して、辞書5内のこの文字の標準パターン
や標準的な特徴量を修正し、この文字について認識処理
部4で正確な認識がなされるようにすることができる。
すなわち、修正文字情報(修正頻度の高い文字の情報)を
通知することで、辞書管理部10により認識用の辞書5
が更新(学習)され、この認識処理システムの認識精度を
逐次向上させることが可能となる。Therefore, by notifying the user of a character having a high frequency of correction as described above, the user activates the dictionary management unit 10 to check the standard pattern and the standard feature amount of the character in the dictionary 5. The character can be corrected so that the recognition processing section 4 can accurately recognize the character.
That is, by notifying the corrected character information (information of frequently corrected characters), the dictionary management unit 10 allows the dictionary 5 for recognition to be notified.
Are updated (learned), and the recognition accuracy of this recognition processing system can be sequentially improved.
【0082】また、上記の例では、辞書5内のこの文字
の標準パターンや標準的な特徴量の修正を、ユーザによ
り行なわせるとしたが、辞書管理部10において、自動
的に辞書5を更新(学習)するよう構成することも可能で
ある。すなわち、第1の編集処理部31および第2の編
集処理部32からの修正文字情報を辞書管理部10に与
え、辞書管理部10において、第1の編集処理部31お
よび第2の編集処理部32からの修正文字情報に基づい
て、修正頻度の高い文字についての標準パターンや標準
的な特徴量を修正頻度が少なくなる方向に自動更新し、
辞書5を自動更新(学習)することも可能である。In the above-described example, the user is allowed to correct the standard pattern and the standard feature amount of the character in the dictionary 5, but the dictionary management unit 10 automatically updates the dictionary 5. (Learning) is also possible. That is, the modified character information from the first edit processing unit 31 and the second edit processing unit 32 is provided to the dictionary management unit 10, and the first edit processing unit 31 and the second edit processing unit 32, based on the corrected character information from 32, automatically updates a standard pattern or a standard feature amount of a frequently corrected character in a direction in which the correction frequency decreases.
The dictionary 5 can be automatically updated (learned).
【0083】なお、このような辞書5の更新処理は、例
えばページ毎に行なわれても良いし、nページ分の文書
全体(例えばnページ分の会議録原稿)の編集処理が完了
した時点で行なわれても良い。Note that such a process of updating the dictionary 5 may be performed, for example, for each page, or at the time when the editing process of the entire n-page document (for example, n-page meeting minutes manuscript) is completed. May be done.
【0084】また、このような辞書5の更新(学習)がな
されることによって、認識処理部4の認識精度が向上
し、修正頻度が低下すると考えられるので、辞書5の更
新管理がなされる毎に、抜き取り率wを低くすることが
できる。It is considered that the updating (learning) of the dictionary 5 improves the recognition accuracy of the recognition processing unit 4 and decreases the frequency of correction. In addition, the extraction rate w can be reduced.
【0085】例えば、第2の編集処理部32における抜
き取り率wを、システムの稼働当初は、例えば、100
%に設定して処理を行なわせ、次いで、辞書5が更新さ
れると、抜き取り率wを100%から例えば80%に設
定変更し、次いで、辞書5が更新されると、抜き取り率
wを80%から例えば60%に設定変更するというよう
に、抜き取り率wを辞書5の更新の都度、下げることが
できる。これにより、使用する毎に、作業効率を徐々に
高めることが可能となる。For example, the sampling rate w in the second editing unit 32 is set to, for example, 100
%, The processing is performed, and when the dictionary 5 is updated, the sampling rate w is changed from 100% to, for example, 80%. When the dictionary 5 is updated, the sampling rate w is set to 80. The sampling rate w can be reduced each time the dictionary 5 is updated, such as changing the setting from% to, for example, 60%. This makes it possible to gradually increase the work efficiency each time it is used.
【0086】さらに、本発明において、上記第2の編集
処理部32は、抜き出したページについての認識結果
(編集処理結果)の確認,修正等の編集を行なったとき、
どの程度の割合いで修正がなされたかの情報,すなわち
修正率の情報を出力(例えばユーザに通知)する機能をも
有している。このような機能をも有している場合、ユー
ザは、この修正率の情報を見ることで、第1回目の編集
処理において確認修正もれの度合を知ることができる。
すなわち、第2の編集処理部32での編集処理におい
て、修正率が高いと、第1回目の編集処理において確認
修正もれが多いことがわかる。これにより、ユーザは、
第1回目の編集処理にスキップ修正が用いられる場合、
この修正率情報に基づき確信度の閾値の変更を行ない、
第1回目の編集処理における確認修正もれの度合いを少
なくすることができる。例えば、修正率が高い場合に
は、確信度の閾値をより高く設定し直す一方、修正率が
低い場合は、確信度の閾値をより低く設定し直すことが
できる。Further, in the present invention, the second edit processing section 32 outputs the recognition result of the extracted page.
When editing (confirmation of editing process results), modification, etc.
It also has a function of outputting information (for example, notifying the user) of information on how much the correction has been made, that is, information on the correction rate. In the case where the user also has such a function, the user can know the degree of the check correction omission in the first editing process by looking at the information of the correction rate.
That is, in the editing processing in the second editing processing unit 32, if the correction rate is high, it is understood that there are many confirmation correction omissions in the first editing processing. This allows the user to
If skip correction is used in the first editing process,
The threshold of the certainty factor is changed based on the correction rate information,
It is possible to reduce the degree of check and correction leakage in the first editing process. For example, when the correction rate is high, the certainty threshold can be reset higher, while when the correction rate is low, the certainty threshold can be reset lower.
【0087】なお、このような確信度の閾値の変更をユ
ーザによらずに自動的に行なうこともできる。すなわ
ち、修正率情報の出力に応じて、確信度の閾値を自動的
に更新することもできる。It is also possible to automatically change the certainty threshold value without depending on the user. That is, the threshold of the certainty factor can be automatically updated according to the output of the correction rate information.
【0088】上述の説明では、第1の編集処理部31で
は抜き取り処理を行なわず、第2の編集処理部32で抜
き取り処理を行なうとしたが、これとは逆に、第1の編
集処理部31で抜き取り処理を行ない、第2の編集処理
部32で抜き取り処理を行なわないようにすることもで
きる。また、この場合、例えば、第1の編集処理部31
ではスキップ修正処理を行なわず、第2の編集処理部3
2でスキップ修正処理を行なうようにすることもでき
る。なお、ここで、抜き取り処理を行なわないことは、
抜き取り率wを100%にすることを意味する。In the above description, the sampling processing is not performed in the first editing processing section 31 and the sampling processing is performed in the second editing processing section 32. On the contrary, the first editing processing section 31 does not. It is also possible that the sampling process is performed at 31 and the sampling process is not performed at the second editing unit 32. In this case, for example, the first edit processing unit 31
Does not perform the skip correction processing, the second edit processing unit 3
In step 2, the skip correction process may be performed. Here, the fact that the sampling process is not performed is as follows.
This means that the extraction rate w is set to 100%.
【0089】また、上述の説明では、説明の便宜上、編
集処理部8が第1の編集処理部31と第2の編集処理部
32とからなるものとしたが、第1の編集処理部31,
第2の編集処理部32のそれぞれの機能を、1つの編集
処理部8にもたせることも可能である。In the above description, for convenience of explanation, the editing processing unit 8 is composed of the first editing processing unit 31 and the second editing processing unit 32, but the first editing processing unit 31,
Each function of the second edit processing unit 32 can be provided to one edit processing unit 8.
【0090】また、上述の説明では、抜き取り率wを、
ページ単位に設定したが(全ページに対する抜き取りペ
ージ数として設定したが)、ページ単位に限らず、任意
の単位(例えば行単位,あるいはブロック単位)に設定す
ることも可能である。In the above description, the extraction rate w is
Although set in page units (set as the number of extracted pages for all pages), it is also possible to set not only in page units but also in arbitrary units (for example, line units or block units).
【0091】換言すれば、本発明は、認識結果に対して
少なくとも2回の編集処理を施し、その際、各編集処理
において、認識結果の抜き取り率を互いに相違させ、各
編集処理において、所定の抜き取り率で認識結果の抜き
取りがなされたとき、抜き取られた認識結果に対しての
み、編集処理を施すことを特徴としている。In other words, according to the present invention, at least two editing processes are performed on the recognition result, and at that time, the extraction rates of the recognition results are made different from each other in each editing process. When a recognition result is extracted at a sampling rate, an editing process is performed only on the extracted recognition result.
【0092】次に、このような構成の文字認識システム
の処理動作の具体例について説明する。本発明の文字認
識システムがソフトウェアパッケージ(情報記録媒体)2
0の形で提供される場合、ユーザは、この情報記録媒体
20を媒体駆動装置21にセットし、文字認識システム
ソフトを例えばRAM13にロードする。この段階で、
CPU11は、例えばRAM13にロードされた文字認
識システムソフトに従って、処理を実行することができ
る。Next, a specific example of the processing operation of the character recognition system having such a configuration will be described. The character recognition system of the present invention is a software package (information recording medium) 2
When provided in the form of "0", the user sets the information recording medium 20 in the medium driving device 21 and loads the character recognition system software into the RAM 13, for example. At this stage,
The CPU 11 can execute processing according to, for example, character recognition system software loaded on the RAM 13.
【0093】スキャナ14が例えばADFである場合、
スキャナ14に例えば複数枚の原稿をセットすると、ス
キャナ14は、複数枚の原稿を順次に読取る。説明を簡
単にするため、各原稿が片面単票原稿であるとすると、
1枚の原稿が1ページに対応し、従って、例えばn(n
≧1)枚の原稿を読取ると、nページ分の文書画像がペ
ージ単位に得られ、これらが、文書画像ファイル15に
順次に格納される。When the scanner 14 is, for example, an ADF,
When a plurality of documents are set on the scanner 14, for example, the scanner 14 sequentially reads the plurality of documents. For simplicity, if each document is a single-sided single-sheet document,
One document corresponds to one page, and therefore, for example, n (n
When ≧ 1) originals are read, n pages of document images are obtained for each page, and these are sequentially stored in the document image file 15.
【0094】CPU11では、文書画像ファイル15に
格納されたnページ分の文書画像に対し、辞書ファイル
16中の辞書を用いてページ単位に文字認識処理を行な
い、ページ毎の認識結果をテキストとして、テキストフ
ァイル17に順次に格納する。The CPU 11 performs a character recognition process for each page of the document images of n pages stored in the document image file 15 by using the dictionary in the dictionary file 16, and recognizes the recognition result for each page as text. These are sequentially stored in the text file 17.
【0095】ユーザは、例えばこの段階で、テキストフ
ァイル17にページ単位に格納されたnページ分の認識
結果(テキスト)に対して、ページ単位に確認,修正等の
編集処理(第1回目の編集処理)を行なうことができる。
すなわち、ユーザはページ毎に誤認識文字等を修正する
ことができる。この編集処理は、前述の第1の編集処理
部31によって全ページnを対象に行なわれる。この場
合、この編集処理は、ユーザが修正の必要な箇所にマウ
ス等でカーソルを移動させて行なうこともできるが、前
述のようなスキップ修正機能が備わっている場合、低確
信度文字のところに、カーソルを自動的にスキップさ
せ、低確信度文字についての認識結果をユーザに確認さ
せ、また、修正させるようにすることもできる。すなわ
ち、例えば1ページ分の認識結果(テキスト)の先頭から
低確信度文字をサーチし、低確信度文字が検出されたと
きには、この文字のところにカーソルを自動設定して、
ユーザに確認,修正等を行なわせ、この文字について確
認,修正等が終了した旨のキー操作がなされると、次の
低確信度文字のところにカーソルを自動的にスキップ
し、ユーザにこの文字について確認,修正を行なわせる
ような表示制御を行なうこともできる。これにより、認
識結果の確認,修正等の際に、ユーザは文書全体に目を
通す必要がなくなり、作業効率を高めることができる。At this stage, for example, at this stage, the user edits the recognition results (text) for n pages stored in the text file 17 in page units, such as confirmation and correction in page units (first editing). Processing).
That is, the user can correct an erroneously recognized character or the like for each page. This editing process is performed on all pages n by the above-described first editing processing unit 31. In this case, this editing process can be performed by moving the cursor with a mouse or the like to a place where the user needs to correct, but if the skip correction function as described above is provided, the editing process is performed at the position of the low confidence character. , The cursor may be automatically skipped, and the recognition result of the low certainty character may be confirmed and corrected by the user. That is, for example, a low confidence character is searched from the beginning of the recognition result (text) for one page, and when a low confidence character is detected, a cursor is automatically set to this character,
When the user confirms or corrects the character and performs a key operation indicating that the character has been confirmed or corrected, the cursor is automatically skipped to the next low confidence character and the user is prompted to confirm the character. It is also possible to perform a display control for confirming and correcting. This eliminates the need for the user to look through the entire document at the time of confirming and correcting the recognition result, and can increase the work efficiency.
【0096】このようにして、全ページn分の認識結果
に対する確認,修正等の編集が終了すると、この全ペー
ジn分の編集処理結果(認識結果)を第1の結果ファイル
41aに格納する。When editing such as confirmation and correction of the recognition results for all pages n is completed, the editing results (recognition results) for all pages n are stored in the first result file 41a.
【0097】この段階で、ユーザは、認識結果に対して
第2回目の編集処理を行なうことができる。すなわち、
第1の結果ファイル41aに格納された認識結果(編集
処理結果)に対し、さらに編集処理を行なうことができ
る。この編集処理は、前述の第2の編集処理部32によ
って、第1の結果ファイル41aに格納された全ページ
n分の認識結果(編集処理結果)の中から所定の抜き取り
率wで(予め設定された抜き取り率wで)任意のページを
ランダムに抜き出して行なわれる。すなわち、利用者
は、抜き出したページについて、誤認識文字等を修正す
ることができる。この場合、この編集処理は、例えばス
キップ修正機能を働かせることなく、行なわれる。この
ようにして抜き出したページの認識結果(編集処理結果)
に対する確認,修正等の編集が終了すると、この編集処
理結果を第2の結果ファイル41bに格納する。このよ
うにして、第1回目,第2回目の編集処理を行なうこと
ができる。また、必要に応じて、第3回目の編集処理を
行なうこともできる。At this stage, the user can perform the second editing process on the recognition result. That is,
Editing processing can be further performed on the recognition result (editing result) stored in the first result file 41a. This editing processing is performed by the second editing processing unit 32 at a predetermined extraction rate w from the recognition results (editing processing results) for all pages n stored in the first result file 41a (set in advance). An arbitrary page is randomly extracted at the extracted extraction rate w). That is, the user can correct an erroneously recognized character or the like in the extracted page. In this case, this editing process is performed without, for example, activating the skip correction function. Recognition result of the page extracted in this way (editing processing result)
When editing such as confirmation and correction is completed, the result of the editing process is stored in the second result file 41b. In this manner, the first and second editing processes can be performed. Further, if necessary, the third editing process can be performed.
【0098】上記のように第1回目,第2回目の編集処
理がなされるとき、辞書管理部10では、第1回目の編
集前後の修正履歴、および第2回目の編集前後の修正履
歴を利用して、修正頻度の高い文字について、辞書5
(例えば、ユーザパターン辞書、あるいはユーザ言語辞
書など)のメンテナンス(更新など)を行なう。なお、こ
の辞書メンテナンスは、例えば、この処理の専門家によ
って行なうことができる。修正頻度の高い文字がどの程
度存在するかの情報は、上記修正履歴中の「修正文字情
報」により、容易に確認可能であり、例えば、ある文字
についての標準パターンなどを更新後、ある一定の期間
様子を見て、この文字について更新した標準パターンを
辞書5に登録しても大丈夫だと判断した場合には、この
文字について更新した標準パターンを辞書5に登録して
用いることができる。When the first and second editing processes are performed as described above, the dictionary management unit 10 uses the correction history before and after the first editing and the correction history before and after the second editing. Then, for the frequently corrected characters, the dictionary 5
(Eg, a user pattern dictionary or a user language dictionary) is maintained (updated, etc.). The dictionary maintenance can be performed by, for example, an expert of this processing. Information on how many characters with a high correction frequency are present can be easily confirmed by the "correction character information" in the correction history.For example, after updating a standard pattern for a certain character, a certain amount of information can be obtained. If it is determined that it is safe to register the updated standard pattern for this character in the dictionary 5 while observing the period, the updated standard pattern for this character can be registered in the dictionary 5 and used.
【0099】また、ユーザは、第2回目の編集処理を行
なったとき、そのときの修正率の情報を得ることができ
る。すなわち、ユーザは、第2回目の編集処理で得られ
た修正率情報により、第1回目の編集処理において確認
修正漏れがどの程度発生しているかを任意のタイミング
で確認することができ、これによって、確信度の閾値を
適切なものに設定変更することができる。When the user performs the second editing process, the user can obtain information on the correction rate at that time. In other words, the user can confirm at an arbitrary timing how much omission of confirmation correction has occurred in the first editing process, based on the correction rate information obtained in the second editing process. In addition, the setting of the certainty threshold can be changed to an appropriate one.
【0100】また、上述の例では、nページ分の認識結
果(編集処理結果)から、所定の抜き取り率wでn×wペ
ージ分の認識結果(編集処理結果)を抜き出す仕方とし
て、例えば1からnまでの範囲内で、n×w個の乱数値
を発生させ、この乱数によって、nページ分からn×w
ページ分をランダムに抽出する(抜き出す)ようにしてい
るが、所定の抜き取り率wでn×wページ分の認識結果
(編集処理結果)を抜き出す仕方として、乱数を発生させ
てランダムに抽出する方法以外の任意の抜き出し法を用
いることもできる。例えば、第1ページ目(表紙部分)は
必ず抜き取って検査しなければならないような場合、上
述のようなランダムな抜き取り法では、第1ページ目
(表紙部分)が抜き取られないことがある。従って、この
ような場合には、必ず第1ページ目(表紙部分)が抜き取
られるような任意の演算法で、nページからn×wペー
ジを抽出し、抜き取ることもできる。In the above example, the recognition result (editing result) for n × w pages is extracted at a predetermined extraction rate w from the recognition result (editing result) for n pages. In the range up to n, n × w random number values are generated.
Although the pages are randomly extracted (extracted), the recognition result for n × w pages at a predetermined extraction rate w
As a method of extracting (editing result), any extraction method other than the method of generating random numbers and extracting them at random can be used. For example, if the first page (the cover part) must be sampled and inspected, the random sampling method as described above uses the first page.
(Cover part) may not be extracted. Therefore, in such a case, an n × w page can be extracted from the n page and extracted by an arbitrary operation method that always extracts the first page (the cover portion).
【0101】[0101]
【発明の効果】以上に説明したように、請求項1乃至請
求項12記載の発明によれば、認識結果の確認,修正な
どの編集において、編集の作業効率を著しく向上させる
ことができる。As described above, according to the first to twelfth aspects of the present invention, the editing work efficiency can be significantly improved in editing such as confirmation and correction of the recognition result.
【0102】特に、請求項1,請求項5,請求項6,請
求項11記載の発明によれば、認識結果に対して少なく
とも2回の編集処理を施し、その際、各編集処理におい
て、認識結果の抜き取り率を互いに相違させ、各編集処
理において、所定の抜き取り率で認識結果の抜き取りが
なされたとき、抜き取られた認識結果に対してのみ、編
集処理を施すので、認識結果の確認,修正などの編集を
効率良く行なうことができる。In particular, according to the first, fifth, sixth, and eleventh aspects of the present invention, at least two editing processes are performed on the recognition result. The sampling rate of the result is made different from each other, and in each editing process, when the recognition result is extracted at a predetermined sampling rate, the editing process is performed only on the extracted recognition result, so that the recognition result is confirmed and corrected. Editing can be performed efficiently.
【0103】また、請求項2,請求項7,請求項12記
載の発明によれば、パターン認識処理で認識結果ととも
に認識結果の確信度が算出されるとき、1回目の編集処
理では、所定の閾値以上の確信度の認識結果をスキップ
させ、低確信度の認識結果のみを修正させるので、認識
結果の確認,修正等の際に、利用者は文書全体に目を通
す必要がなくなり、作業効率を高めることができる。According to the second, seventh and twelfth aspects of the present invention, when the certainty factor of the recognition result is calculated together with the recognition result in the pattern recognition process, a predetermined editing process is performed in the first editing process. Since the recognition result with the certainty higher than the threshold value is skipped and only the recognition result with the lower certainty is corrected, the user does not have to look through the entire document when confirming or correcting the recognition result, thereby improving work efficiency. Can be increased.
【0104】また、請求項3,請求項9記載の発明によ
れば、編集処理手段において修正頻度の高い文字につい
ての情報が修正文字情報として出力されるとき、該修正
文字情報に基づいて辞書の更新を行なうことで、認識率
を向上させることができる。According to the third and ninth aspects of the present invention, when information on a character having a high frequency of correction is output as corrected character information by the editing processing means, the dictionary data is output based on the corrected character information. By performing the update, the recognition rate can be improved.
【0105】また、請求項4,請求項8記載の発明によ
れば、2回目の編集処理で修正がなされた割合いを修正
率として出力し、該修正率に応じて確信度の閾値を更新
することで、認識率を向上させることができる。According to the fourth and eighth aspects of the present invention, the rate of correction made in the second editing process is output as a correction rate, and the certainty threshold is updated in accordance with the correction rate. By doing so, the recognition rate can be improved.
【0106】また、請求項10記載の発明によれば、辞
書の更新の都度、抜き取り率を低下させるので、使用す
る毎に、作業効率を徐々に高めることが可能となる。According to the tenth aspect of the present invention, the sampling rate is reduced each time the dictionary is updated, so that the working efficiency can be gradually increased each time the dictionary is used.
【図1】本発明に係る文字認識システムの構成例を示す
図である。FIG. 1 is a diagram showing a configuration example of a character recognition system according to the present invention.
【図2】図1の文字認識システムのハードウェア構成例
を示す図である。FIG. 2 is a diagram illustrating an example of a hardware configuration of the character recognition system in FIG. 1;
【図3】ある1ページ分の文書の例を示す図である。FIG. 3 is a diagram illustrating an example of a document for a certain page.
【図4】図3の文書の認識結果あるいは編集処理結果を
確認,修正等するための表示例を示す図である。FIG. 4 is a view showing a display example for confirming and correcting the recognition result or the editing processing result of the document shown in FIG. 3;
【図5】表示画面上で、基準線の一方の側に表示される
認識結果あるいは編集処理結果と基準線の他方の側に表
示される文書画像(文字画像)とを、常に連動させて、ス
クロールあるいは移動させる機能を説明するための図で
ある。FIG. 5 is a diagram showing an example in which a recognition result or an edit processing result displayed on one side of a reference line and a document image (character image) displayed on the other side of the reference line are always linked on a display screen. FIG. 4 is a diagram for explaining a function of scrolling or moving.
【図6】表示画面上で、基準線の一方の側に表示される
認識結果あるいは編集処理結果と基準線の他方の側に表
示される文書画像(文字画像)とを、常に連動させて、ス
クロールあるいは移動させる機能を説明するための図で
ある。FIG. 6 is a diagram showing an example in which a recognition result or an editing result displayed on one side of a reference line and a document image (character image) displayed on the other side of the reference line are always linked on a display screen; FIG. 4 is a diagram for explaining a function of scrolling or moving.
【図7】図3の文書の認識結果を確認,修正等するため
の表示例を示す図である。FIG. 7 is a diagram showing a display example for confirming and correcting the recognition result of the document of FIG. 3;
【図8】編集処理の初期画面の一例を示す図である。FIG. 8 is a diagram illustrating an example of an initial screen of an editing process.
【図9】抜き取り設定画面の一例を示す図である。FIG. 9 is a diagram illustrating an example of a sampling setting screen.
【図10】第1の編集処理部の処理例を示すフローチャ
ートである。FIG. 10 is a flowchart illustrating a processing example of a first editing processing unit.
【図11】第2の編集処理部の処理例を示すフローチャ
ートである。FIG. 11 is a flowchart illustrating a processing example of a second editing processing unit.
【図12】第2の編集処理部の処理例を示すフローチャ
ートである。FIG. 12 is a flowchart illustrating a processing example of a second editing processing unit.
【図13】修正文字情報画面の表示例を示す図である。FIG. 13 is a diagram showing a display example of a modified character information screen.
1 画像入力部 2 文書画像記憶部 4 認識処理部 5 辞書 6 認識結果記憶部 8 編集処理部 9 編集処理結果記憶部 9a 第1の結果記憶部 9b 第2の結果記憶部 10 辞書管理部 11 CPU 12 ROM 13 RAM 14 スキャナ 15 文書画像ファイル 16 辞書ファイル 17 テキストファイル 18 表示装置 19 入力装置 20 情報記録媒体 21 媒体駆動装置 31 第1の結果記憶部 32 第2の結果記憶部 40 条件設定部 41 編集処理結果ファイル 41a 第1の結果ファイル 41b 第2の結果ファイル 42 テンポラリファイル Reference Signs List 1 image input unit 2 document image storage unit 4 recognition processing unit 5 dictionary 6 recognition result storage unit 8 editing processing unit 9 editing processing result storage unit 9a first result storage unit 9b second result storage unit 10 dictionary management unit 11 CPU Reference Signs List 12 ROM 13 RAM 14 Scanner 15 Document image file 16 Dictionary file 17 Text file 18 Display device 19 Input device 20 Information recording medium 21 Medium drive device 31 First result storage unit 32 Second result storage unit 40 Condition setting unit 41 Editing Processing result file 41a First result file 41b Second result file 42 Temporary file
Claims (12)
なって得られる認識結果に対して編集処理を施す認識結
果編集方法において、認識結果に対して少なくとも2回
の編集処理を施し、その際、各編集処理において、認識
結果の抜き取り率を互いに相違させ、各編集処理におい
て、所定の抜き取り率で認識結果の抜き取りがなされた
とき、抜き取られた認識結果に対してのみ、編集処理を
施すことを特徴とする認識結果編集方法。1. A recognition result editing method for performing an editing process on a recognition result obtained by performing a pattern recognition process on a predetermined document image, wherein the recognition result is edited at least twice. In each editing process, the recognition result sampling rates are made different from each other, and in each editing process, when the recognition results are extracted at a predetermined sampling rate, the editing process is performed only on the extracted recognition results. Recognition result editing method to feature.
て、前記パターン認識処理で認識結果とともに認識結果
の確信度が算出されるとき、前記1回目の編集処理で
は、所定の閾値以上の確信度の認識結果をスキップさ
せ、低確信度の認識結果のみを修正させることを特徴と
する認識結果編集方法。2. The recognition result editing method according to claim 1, wherein when the certainty factor of the recognition result is calculated together with the recognition result in the pattern recognition process, the certainty factor that is equal to or more than a predetermined threshold value is used in the first editing process. A recognition result editing method characterized in that the recognition result is skipped and only the recognition result with low confidence is corrected.
て、各編集処理では、編集前後の修正履歴を管理し、該
修正履歴により、修正頻度の高い文字についての情報を
出力することを特徴とする認識結果編集方法。3. The recognition result editing method according to claim 1, wherein in each editing process, a correction history before and after editing is managed, and information on a character having a high correction frequency is output based on the correction history. Recognition result editing method.
て、2回目の編集処理で修正がなされた割合いを修正率
として出力することを特徴とする認識結果編集方法。4. The recognition result editing method according to claim 1, wherein a rate of correction in the second editing process is output as a correction rate.
辞書を用いてパターン認識処理を施す認識処理手段と、
該認識処理手段による認識結果に対して編集処理を行な
う編集処理手段とを備え、前記編集処理手段は、認識結
果に対して少なくとも2回の編集処理を施し、その際、
各編集処理において、認識結果の抜き取り率を互いに相
違させ、各編集処理において、所定の抜き取り率で認識
結果の抜き取りがなされたとき、抜き取られた認識結果
に対してのみ、編集処理を施すことを特徴とするパター
ン認識システム。5. A recognition dictionary, and recognition processing means for performing pattern recognition processing on a document image using the dictionary,
Editing processing means for performing editing processing on the recognition result by the recognition processing means, wherein the editing processing means performs at least two times of editing processing on the recognition result,
In each editing process, the recognition result sampling rates are made different from each other, and in each editing process, when the recognition results are extracted at a predetermined sampling rate, the editing process is performed only on the extracted recognition results. Characteristic pattern recognition system.
おいて、前記抜き取り率は、更新可能に設定されること
を特徴とするパターン認識システム。6. The pattern recognition system according to claim 5, wherein the sampling rate is set to be updatable.
おいて、前記認識処理手段で認識結果とともに認識結果
の確信度が算出されるとき、前記編集処理手段は、1回
目の編集処理では、所定の閾値以上の確信度の認識結果
をスキップさせ、低確信度の認識結果のみを修正させる
ようになっていることを特徴とするパターン認識システ
ム。7. The pattern recognition system according to claim 5, wherein when the recognition processing means calculates the confidence level of the recognition result together with the recognition result, the editing processing means performs a predetermined threshold processing in the first editing processing. A pattern recognition system characterized in that the above recognition result of certainty is skipped and only the recognition result of low certainty is corrected.
おいて、前記編集処理手段は、さらに、2回目の編集処
理で修正がなされた割合いを修正率として出力する機能
を有しており、前記確信度の閾値は、前記編集処理手段
から出力される修正率に応じて更新可能になっているこ
とを特徴とするパターン認識システム。8. The pattern recognition system according to claim 7, wherein said editing processing means further has a function of outputting, as a correction rate, a ratio of corrections made in a second editing process. A pattern recognition system, wherein the degree threshold value can be updated in accordance with a correction rate output from the editing processing means.
おいて、さらに、前記辞書を管理する辞書管理手段が設
けられており、前記辞書管理手段は、前記編集処理手段
において修正頻度の高い文字についての情報が修正文字
情報として出力されるとき、該修正文字情報に基づいて
辞書の更新を行なう機能を有していることを特徴とする
パターン認識システム。9. The pattern recognition system according to claim 5, further comprising dictionary management means for managing said dictionary, wherein said dictionary management means stores information on characters frequently corrected by said editing processing means. A pattern recognition system having a function of updating a dictionary based on corrected character information when is output as corrected character information.
において、辞書の更新の都度、抜き取り率を低下させる
ことを特徴とするパターン認識システム。10. The pattern recognition system according to claim 9, wherein a sampling rate is reduced each time the dictionary is updated.
行なって得られる認識結果に対して少なくとも2回の編
集処理を施し、その際、各編集処理において、認識結果
の抜き取り率を互いに相違させ、各編集処理において、
所定の抜き取り率で認識結果の抜き取りがなされたと
き、抜き取られた認識結果に対してのみ、編集処理を施
すためのプログラムが記録されていることを特徴とする
情報記録媒体。11. A recognition result obtained by performing a pattern recognition process on a predetermined document image is subjected to at least two editing processes, and in each editing process, the recognition result sampling rates are made different from each other. In each editing process,
An information recording medium characterized by recording a program for performing an editing process only on the extracted recognition result when the recognition result is extracted at a predetermined sampling rate.
に認識結果の確信度を算出し、認識結果を編集する際に
は所定の閾値以上の確信度の文字をスキップさせて修正
させるためのプログラムが記録されていることを特徴と
する情報記録媒体。12. A program for calculating a certainty factor of a recognition result together with a recognition result in a pattern recognition process, and for editing a recognition result, a program for skipping and correcting a character having a certainty factor equal to or higher than a predetermined threshold value is recorded. An information recording medium characterized in that:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23143596A JP3619333B2 (en) | 1996-08-13 | 1996-08-13 | Pattern recognition system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23143596A JP3619333B2 (en) | 1996-08-13 | 1996-08-13 | Pattern recognition system |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1063773A true JPH1063773A (en) | 1998-03-06 |
JP3619333B2 JP3619333B2 (en) | 2005-02-09 |
Family
ID=16923511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23143596A Expired - Fee Related JP3619333B2 (en) | 1996-08-13 | 1996-08-13 | Pattern recognition system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3619333B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008003740A (en) * | 2006-06-21 | 2008-01-10 | Fuji Xerox Co Ltd | Input correction method, postscript information processing method, postscript information processor, and program |
EP1973061A2 (en) | 2007-03-15 | 2008-09-24 | NEC Corporation | Character recognition system, character recognition method and automated mail sorting system |
JP2009230658A (en) * | 2008-03-25 | 2009-10-08 | Mitsubishi Electric Corp | Character retrieval system |
JP2013130997A (en) * | 2011-12-21 | 2013-07-04 | Kyocera Document Solutions Inc | Image forming apparatus |
JP6464440B1 (en) * | 2017-12-27 | 2019-02-06 | 株式会社日本デジタル研究所 | Accounting processing apparatus, accounting processing system, accounting processing method and program |
JP2021068292A (en) * | 2019-10-25 | 2021-04-30 | 株式会社 ゆうちょ銀行 | Information processor, information processing method and information processing program |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57162081A (en) * | 1981-03-31 | 1982-10-05 | Toshiba Corp | Optical character reader |
JPH03185582A (en) * | 1989-12-14 | 1991-08-13 | Fujitsu Ltd | Dictionary correction system for character recognizing device |
JPH05346970A (en) * | 1991-04-04 | 1993-12-27 | Fuji Xerox Co Ltd | Document recognizing device |
JPH0728766A (en) * | 1993-06-24 | 1995-01-31 | Toshiba Corp | Pattern recognition system and monitor system |
JPH0793485A (en) * | 1993-09-22 | 1995-04-07 | Toshiba Corp | Image filing device |
JPH08202485A (en) * | 1995-01-31 | 1996-08-09 | Toshiba Corp | Tablet deterioration detecting method, tablet deterioration informing method, and method and device for character recognition |
-
1996
- 1996-08-13 JP JP23143596A patent/JP3619333B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57162081A (en) * | 1981-03-31 | 1982-10-05 | Toshiba Corp | Optical character reader |
JPH03185582A (en) * | 1989-12-14 | 1991-08-13 | Fujitsu Ltd | Dictionary correction system for character recognizing device |
JPH05346970A (en) * | 1991-04-04 | 1993-12-27 | Fuji Xerox Co Ltd | Document recognizing device |
JPH0728766A (en) * | 1993-06-24 | 1995-01-31 | Toshiba Corp | Pattern recognition system and monitor system |
JPH0793485A (en) * | 1993-09-22 | 1995-04-07 | Toshiba Corp | Image filing device |
JPH08202485A (en) * | 1995-01-31 | 1996-08-09 | Toshiba Corp | Tablet deterioration detecting method, tablet deterioration informing method, and method and device for character recognition |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008003740A (en) * | 2006-06-21 | 2008-01-10 | Fuji Xerox Co Ltd | Input correction method, postscript information processing method, postscript information processor, and program |
EP1973061A2 (en) | 2007-03-15 | 2008-09-24 | NEC Corporation | Character recognition system, character recognition method and automated mail sorting system |
JP2009230658A (en) * | 2008-03-25 | 2009-10-08 | Mitsubishi Electric Corp | Character retrieval system |
JP2013130997A (en) * | 2011-12-21 | 2013-07-04 | Kyocera Document Solutions Inc | Image forming apparatus |
JP6464440B1 (en) * | 2017-12-27 | 2019-02-06 | 株式会社日本デジタル研究所 | Accounting processing apparatus, accounting processing system, accounting processing method and program |
JP2019117527A (en) * | 2017-12-27 | 2019-07-18 | 株式会社日本デジタル研究所 | Accounting processing apparatus, accounting processing system, accounting processing method and program |
JP2021068292A (en) * | 2019-10-25 | 2021-04-30 | 株式会社 ゆうちょ銀行 | Information processor, information processing method and information processing program |
Also Published As
Publication number | Publication date |
---|---|
JP3619333B2 (en) | 2005-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4313422B2 (en) | Method and apparatus for presenting alternatives for selection using adaptive learning | |
JPH1021326A (en) | Recognized result displaying method, character recognizing system and information recording medium | |
US10902278B2 (en) | Image processing apparatus, image processing system, computer program product, and image processing method | |
JPH1063773A (en) | Recognition result editing method, pattern recognition system, and information recording medium | |
JP2006277001A (en) | Input image displaying method, and input image displaying program | |
US11042695B2 (en) | Information processing apparatus and non-transitory computer readable medium for generating input screen information | |
JPH07271916A (en) | Learning pattern generating device and character recognizing device using the same | |
JP4162195B2 (en) | Image processing apparatus and image processing program | |
JP2007184842A (en) | Image processing apparatus, image processing method, and image processing program | |
JP2010134766A (en) | Document data processing apparatus and program thereof | |
JP7076173B2 (en) | Document management device and document management system | |
JPH0388086A (en) | Document reader | |
JPH06348889A (en) | Character recognizing device | |
JPH0520492A (en) | Document recognizing/correcting device | |
JPH09185615A (en) | Kana/kanji converting method | |
JPH06251187A (en) | Method and device for correcting character recognition error | |
JP2001282429A (en) | Character data input device | |
JP2890788B2 (en) | Document recognition device | |
JPH10283393A (en) | Design support system | |
CN117132985A (en) | Semi-automatic labeling method, device and equipment based on optical character recognition model | |
JP2019185344A (en) | Image processing device, image processing method, and image processing program | |
JP4390723B2 (en) | Information embedding device, information extracting device, information embedding method, information extracting method, information embedding program, information extracting program, and recording medium | |
JP2005267394A (en) | Information processing device, method for changing area, and program and recording medium thereof | |
JP3077580B2 (en) | Character reader | |
JP2006330780A (en) | Character recognition device and character recognition program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040810 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041006 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041112 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071119 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081119 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081119 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091119 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101119 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111119 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111119 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121119 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131119 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |