JP2002279353A - Character recognition device, method therefor, and recording medium - Google Patents

Character recognition device, method therefor, and recording medium

Info

Publication number
JP2002279353A
JP2002279353A JP2001075106A JP2001075106A JP2002279353A JP 2002279353 A JP2002279353 A JP 2002279353A JP 2001075106 A JP2001075106 A JP 2001075106A JP 2001075106 A JP2001075106 A JP 2001075106A JP 2002279353 A JP2002279353 A JP 2002279353A
Authority
JP
Japan
Prior art keywords
character
word
character recognition
recognition result
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001075106A
Other languages
Japanese (ja)
Other versions
JP4718699B2 (en
Inventor
Toshio Miyazawa
利夫 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001075106A priority Critical patent/JP4718699B2/en
Publication of JP2002279353A publication Critical patent/JP2002279353A/en
Application granted granted Critical
Publication of JP4718699B2 publication Critical patent/JP4718699B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a character recognition device, improving the working efficiency of postprocessing of a character recognition result. SOLUTION: This character recognition device recognizes characters relative to a character region of an inputted image, calculates sureness of the character recognition result of the respective characters, searches characters in the front/ rear of a character, having low sureness of the recognition result relative to the respective characters, when post-processing the character recognition result, and corrects the word so as to improve the working efficiency of the postprocessing of the user.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字認識装置、そ
の方法および記録媒体に関し、特に、文字認識処理結果
後の認識結果の後処理に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device, a method thereof, and a recording medium, and more particularly to post-processing of a recognition result after a character recognition processing result.

【0002】[0002]

【従来の技術】スキャナ等から計算機に取り込んだ文書
画像データ中の文字画像を識別し、文字コードとして出
力する光学的文字読取(OCR)ソフトウェアは、近年
非常に広範囲に用いられている。これは、文字コードと
して電子データ化した情報は紙ベースのものや画像デー
タと比較して、再利用が容易であって、保管や交換も効
率的に行えるというメリットを持つためである。しかし
ながら、文字認識においては、文字画像からの1文字単
位の認識では誤認識を完全に排除することはきわめて困
難である。このため後処理として、文字認識された結果
の文字列に対して、言語的制約を与えて候補の選択を行
ったり、単語照合や形態素解析等により自動的に修正す
ることが行われることが多い。この方法は多くの誤りを
除去できるが、適用の仕方によっては誤訂正のために新
たな誤りを作り出す場合もある。また、この修正によっ
て100%修正されるわけではないため、他の文字切り
出し方法による認識結果と比較して、確信度の高い認識
結果を採用したり(例えば、特開平9−274645号
公報参照)、各文字に確信度を付与してユーザへ通知し
て、ユーザに修正を任せたりしている。例えば、文字認
識の後処理方法として、特開平5−40853号公報の
技術は、文字認識結果の各単語に対して候補単語の作成
と確信度の算出を行い、その確信度が大きな単語との文
法的関係を用いて確信度の小さな単語の認識結果を修正
するものである。確信度の計算としては、例えば、特開
平9−134410号公報の技術のように、確信度計算
に先立つ言語処理や単語の表記長、品詞、出現頻度、前
接する語との接続の強度等のパラメータを合成して算出
している。
2. Description of the Related Art Optical character reading (OCR) software for identifying a character image in document image data taken into a computer from a scanner or the like and outputting it as a character code has been widely used in recent years. This is because information that has been converted into electronic data as a character code has the advantage that it can be easily reused and stored and exchanged more efficiently than paper-based information and image data. However, in character recognition, it is extremely difficult to completely eliminate erroneous recognition by character-by-character recognition from a character image. For this reason, as a post-processing, a character string resulting from character recognition is often subjected to linguistic constraints to select a candidate, or automatically corrected by word matching, morphological analysis, or the like. . Although this method can eliminate many errors, depending on how it is applied, it may create new errors due to erroneous correction. In addition, since this correction does not result in 100% correction, a recognition result having a higher degree of certainty may be adopted as compared with a recognition result obtained by another character cutout method (for example, see Japanese Patent Application Laid-Open No. 9-274645). For example, a certainty factor is assigned to each character to notify the user and leave the correction to the user. For example, as a post-processing method of character recognition, the technology disclosed in Japanese Patent Application Laid-Open No. 5-40853 creates candidate words and calculates certainty for each word of the character recognition result, and determines whether or not the word has a large certainty. It corrects the recognition result of a word with low certainty using grammatical relations. As the calculation of the certainty factor, for example, as in the technique of Japanese Patent Application Laid-Open No. 9-134410, the language processing prior to the certainty factor calculation, the word notation length, the part of speech, the appearance frequency, the strength of the connection with the preceding word, etc. It is calculated by combining parameters.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、文字認
識の後処理として単語辞書、文法知識を用いて言語処理
を行っても、もともと文法的誤りや、認識不能の領域、
文法的に特殊な領域等では、結果を改善することは期待
できない。結局、ユーザに文字認識結果を提示し、これ
を修正することに落ち着くことになる。ユーザに提示さ
れた認識結果の修正を手助けする技術としては、例え
ば、特開平5−46803号公報では、認識結果の確か
らしさが低い認識結果に網掛けし、文字種に応じてさら
に区別が可能な識別子を同時に表示することによって、
ユーザがカタカナの「リ」と平仮名の「り」のように類
似する文字に対する認識結果を修正し易くしている。ま
た、誤認識結果の修正を容易に行うために、特開平6−
176189号公報では、認識結果が怪しいと判断され
た文字と前後1文字ずつの合計3文字の候補を表示した
り、特公平7−113951号公報や特許第29154
17号公報では、認識結果と原画像を同時に表示したり
している。しかしながら、上記従来の技術では、主に視
覚情報に頼った表示方法であるため、どの文字が不確か
な認識結果であるかを視覚障害者等には判断できなかっ
た。本発明は、上記の問題点を解決するために、認識結
果を視覚情報、聴覚情報や触覚情報等を用いて認識結果
を修正し、後処理の効率を向上させる文字認識装置、そ
の方法および記録媒体を提供することを目的とする。特
に、視覚障害者であっても、文字認識後の後処理の作業
効率が向上する文字認識装置、その方法および記録媒体
を提供することを目的とする。
However, even if language processing is performed using a word dictionary and grammatical knowledge as post-processing of character recognition, grammatical errors or unrecognizable areas may occur.
It is not expected to improve the results in grammatically specific areas. Eventually, the result of presenting the character recognition result to the user and correcting the result will calm down. As a technique for assisting the correction of the recognition result presented to the user, for example, in Japanese Patent Application Laid-Open No. 5-46803, a recognition result having a low likelihood of the recognition result is shaded, and further distinction can be made according to the character type. By displaying the identifier at the same time,
It is easy for the user to correct the recognition result for characters similar to katakana “ri” and hiragana “ri”. Also, in order to easily correct the misrecognition result, Japanese Patent Laid-Open No.
In Japanese Patent Application Publication No. 176189, a total of three character candidates including a character whose recognition result is determined to be suspicious and one character before and after the character are displayed, and Japanese Patent Publication No. Hei 7-113951 and Japanese Patent No. 29154.
In Japanese Patent Publication No. 17, a recognition result and an original image are simultaneously displayed. However, in the above-mentioned conventional technology, since the display method mainly relies on visual information, it is impossible for a visually impaired person or the like to determine which character is an uncertain recognition result. SUMMARY OF THE INVENTION The present invention provides a character recognition apparatus, a method and a recording method for correcting a recognition result using visual information, auditory information, tactile information, and the like to improve the efficiency of post-processing. The purpose is to provide a medium. In particular, it is an object of the present invention to provide a character recognition device, a method thereof, and a recording medium that improve the work efficiency of post-processing after character recognition even for a visually impaired person.

【0004】[0004]

【課題を解決するための手段】上記の問題を解決するた
めに、本発明の請求項1の文字認識装置は、文書画像の
文字認識結果に後処理を行って認識結果を得る文字認識
装置において、文書画像を入力する画像入力部と、前記
画像入力部で入力された画像の文字領域に対して文字認
識する文字認識部と、前記文字認識部から得た各文字に
対する文字認識結果の確からしさを算出する確信度算出
部と、前記文字認識部から得た文字認識結果を後処理
し、その結果を出力する結果出力部とを備え、前記結果
出力部は、文字認識結果の後処理の際、前記確信度算出
部で計算された各文字に対する認識結果の確からしさが
低い文字の前後の文字を探索し、その認識結果の確から
しさが低い文字を含む単語を抽出し、この単語を後処理
するようにしたことを特徴とする。また、本発明の請求
項2の文字認識装置は、請求項1に記載の文字認識装置
において、前記結果出力部は、認識結果の確からしさが
低いと判定された単語と、低いと判定されなかった単語
とを視覚的に区別して出力し、ユーザが後処理しやすく
したことを特徴とする。また、本発明の請求項3の文字
認識装置は、請求項1に記載の文字認識装置において、
前記結果出力部は、認識結果の確からしさが低いと判定
された単語と、低いと判定されなかった単語とを聴覚的
に区別して出力し、ユーザが後処理しやすくしたことを
特徴とする。また、本発明の請求項4の文字認識装置
は、請求項1に記載の文字認識装置において、前記結果
出力部は、認識結果の確からしさが低いと判定された単
語と、低いと判定されなかった単語とを触覚的に区別し
て出力し、ユーザが後処理しやすくしたことを特徴とす
る。
According to a first aspect of the present invention, there is provided a character recognition apparatus for obtaining a recognition result by performing post-processing on a character recognition result of a document image. An image input unit for inputting a document image, a character recognizing unit for recognizing a character in a character area of the image input by the image input unit, and a certainty of a character recognition result for each character obtained from the character recognizing unit. And a result output unit that post-processes the character recognition result obtained from the character recognition unit and outputs the result, wherein the result output unit performs post-processing of the character recognition result. Searching for characters before and after a character with low probability of recognition result for each character calculated by the certainty factor calculation unit, extracting a word including a character with low probability of recognition result, and post-processing this word What I did And it features. Further, in the character recognition device according to claim 2 of the present invention, in the character recognition device according to claim 1, the result output unit does not determine a word whose probability of recognition result is determined to be low and a word whose probability is low. The word is visually distinguished and output, and the user can easily perform post-processing. According to a third aspect of the present invention, there is provided the character recognition device according to the first aspect,
The result output unit is characterized in that a word determined to have low probability of the recognition result and a word not determined to be low are audibly distinguished and output to facilitate post-processing by the user. Also, in the character recognition device according to claim 4 of the present invention, in the character recognition device according to claim 1, the result output unit does not determine a word whose probability of recognition result is determined to be low and a word whose probability is low. The word is tactilely distinguished and output, so that the user can easily perform post-processing.

【0005】また、本発明の請求項5の文字認識装置
は、請求項1乃至請求項4のいずれかひとつに記載の文
字認識装置において、前記結果出力部は、確からしくな
い単語が修正されたとき、確からしくない単語をこの修
正した単語によって置き換え、次の確からしくない単語
の後処理へ移るようにしたことを特徴とする。また、本
発明の請求項6の文字認識方法は、文字画像に対して文
字認識を行い、その認識結果に後処理する文字認識方法
において、認識結果の確からしさが低い文字の前後の文
字を探索し、その認識結果の確からしさが低い文字を含
む単語を抽出し、その単語を修正するようにして、後処
理の作業効率が向上するようにしたことを特徴とする。
また、本発明の請求項7の記録媒体は、コンピュータ
を、文書画像の文字認識結果に後処理を行って認識結果
を得る文字認識装置として機能させるためのプログラム
を記録したコンピュータ読み取り可能な記録媒体であっ
て、文書画像を入力する画像入力部と、前記画像入力部
で入力された画像の文字領域に対して文字認識する文字
認識部と、前記文字認識部から得た各文字に対する文字
認識結果の確からしさを算出する確信度算出部と、前記
文字認識部から得た文字認識結果を後処理し、その結果
を出力する結果出力部とを備え、前記結果出力部は、文
字認識結果の後処理の際、前記確信度算出部で計算され
た各文字に対する認識結果の確からしさが低い文字の前
後の文字を探索し、その認識結果の確からしさが低い文
字を含む単語を抽出し、この単語を後処理するようにし
た文字認識プログラムを記録した。
According to a fifth aspect of the present invention, there is provided the character recognition apparatus according to any one of the first to fourth aspects, wherein the result output unit corrects an uncertain word. In some cases, the uncertain word is replaced by the corrected word, and the process proceeds to post-processing of the next uncertain word. In a character recognition method according to a sixth aspect of the present invention, in a character recognition method for performing character recognition on a character image and performing post-processing on the recognition result, a character before and after a character having a low probability of the recognition result is searched. Then, a word including a character having a low probability of the recognition result is extracted, and the word is corrected so that the post-processing work efficiency is improved.
Further, a recording medium according to claim 7 of the present invention is a computer-readable recording medium recording a program for causing a computer to function as a character recognition device that performs post-processing on a character recognition result of a document image to obtain a recognition result. An image input unit for inputting a document image, a character recognition unit for recognizing characters in a character area of the image input by the image input unit, and a character recognition result for each character obtained from the character recognition unit And a result output unit for post-processing the character recognition result obtained from the character recognition unit and outputting the result, wherein the result output unit is configured to output the result after the character recognition result. At the time of processing, search for characters before and after a character with low probability of recognition result for each character calculated by the certainty factor calculation unit, and extract a word including a character with low probability of recognition result. They were recorded character recognition program to be worked up words.

【0006】[0006]

【発明の実施の形態】以下に、図面を用いて本発明の実
施の形態の構成および動作を詳細に述べる。 <実施例> (1) 実施例の構成 図1は、本発明の実施例の文字認識装置の構成を示すブ
ロック図である。本発明の実施例の文字認識装置100
は、制御部10、画像入力部20、文字認識部30、確
信度算出部40、結果出力部50、原画像記憶部25、
認識辞書35、認識結果記憶部45、言語辞書55から
構成されている。さらに、結果出力部50は低確信度抽
出部60を含んでいる。制御部10は、スキャナやファ
イルからの画像を読取り、画像情報から文字認識し、最
終結果である認識結果を出力するまでの全体を制御す
る。画像入力部20は、スキャナやファイルからの画像
を読取り、その画像データを原画像記憶部25へ格納す
る。文字認識部30は、原画像記憶部25に記憶された
画像情報から文字画像領域を判別し、その文字領域から
行を切り出し、切り出された行から文字を切り出し、そ
の文字部分を囲む矩形の対角座標値を抽出し、その文字
部分の大きさの正規化やノイズ(汚れ等)除去し、特徴
量を計算し、その特徴量と標準パターンを保持する認識
辞書35とでパターンマッチングを行い、1文字あたり
単数または複数の認識候補文字とその順位、およびそれ
らに対応する標準パターンとの距離値を認識結果記憶部
45へ記憶する。認識辞書35は、文字ごとに文字コー
ド、その文字の標準パターンの特徴量等の情報を保持す
る。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The construction and operation of an embodiment of the present invention will be described below in detail with reference to the drawings. Embodiment (1) Configuration of Embodiment FIG. 1 is a block diagram illustrating a configuration of a character recognition device according to an embodiment of the present invention. Character recognition device 100 according to an embodiment of the present invention
Are the control unit 10, the image input unit 20, the character recognition unit 30, the certainty calculation unit 40, the result output unit 50, the original image storage unit 25,
It comprises a recognition dictionary 35, a recognition result storage unit 45, and a language dictionary 55. Further, the result output unit 50 includes a low confidence extractor 60. The control unit 10 controls the entire process from reading an image from a scanner or a file, recognizing characters from the image information, and outputting a final recognition result. The image input unit 20 reads an image from a scanner or a file, and stores the image data in the original image storage unit 25. The character recognizing unit 30 determines a character image area from the image information stored in the original image storage unit 25, cuts out a line from the character area, cuts out a character from the cut out line, and sets a rectangular pair surrounding the character part. The angular coordinate values are extracted, the size of the character portion is normalized, noise (dirt, etc.) is removed, the feature amount is calculated, and pattern matching is performed between the feature amount and the recognition dictionary 35 holding the standard pattern. The recognition result storage unit 45 stores one or more recognition candidate characters per character, their order, and the distance value between the character and the standard pattern corresponding to the character. The recognition dictionary 35 holds information such as a character code for each character and a feature amount of a standard pattern of the character.

【0007】次に、文字認識部30は、各文字位置を開
始点とする単語候補を生成して言語辞書55の単語辞書
を検索し、マッチした単語とその品詞情報を取り出し、
処理対象領域の先頭から候補単語を接続して単語パスを
生成すると同時に言語辞書55の品詞間接続コストテー
ブルを用いてその単語パスのコストを計算する。この生
成された単語パスが一定数以下になるように、その単語
パスのコストの高い順に選択し、もっともコストの小さ
い単語パスに基づいて認識候補文字を修正し、認識結果
記憶部45を更新する。言語辞書55は、単語の表記、
よみ、品詞等の情報を保持する単語辞書と、連接する単
語の品詞が接続可能かどうかを示す重みを保持する品詞
間接続コストテーブルとからなっている。例えば、日本
語の場合は、単語の表記に、漢字のみの単語の他に、
「漢字+かな」、「漢字+英字」等も登録できる。確信
度算出部40は、確信度を算出するためのパラメータ
に、以下のような条件に適合する数値(重み)を割り当
て、これらのパラメータの一次結合や平均値として確信
度を算出する(例えば、特開平9−134410号公
報)。 (A)その文字が画像中の同一文字に対する認識結果の
中で高い順位にあるほど確信度は高い。 (B)その文字の文字認識における類似度が高いほど、
確信度は高い。 (C)その文字が属すると判定された単語の表記長が長
いほど確信度は大きい。 (D)その文字またはその文字のカテゴリーと前後の文
字のそれとの間の連接可能性が大きいほど、確信度は高
い。 (E)その単語と前後の単語との接続可能性が大きいほ
ど確信度は大きい。 この規則は、予め多くの文書の統計的性質やヒューリス
ティックなルールとして、例えば、ルールテーブルや品
詞間接続コストテーブル等に保持しておく。結果出力部
50は、後処理を行わせるために認識結果記憶部45に
格納されている認識結果とそれに対応する原画像データ
と対応させて出力する。この出力された結果をユーザ
は、参照することによって認識結果に誤りがあれば修正
して、最終結果をディスプレイ、プリンタやファイル等
の出力装置に出力したり、ネットワークを介して他のコ
ンピュータへ送信したりする。
Next, the character recognizing unit 30 generates a word candidate starting from each character position, searches the word dictionary of the language dictionary 55, and extracts the matched word and its part of speech information.
A candidate word is connected from the beginning of the processing target area to generate a word path, and at the same time, the cost of the word path is calculated using the part-of-speech connection cost table of the language dictionary 55. The word paths are selected in descending order of cost so that the number of generated word paths is equal to or less than a certain number, the recognition candidate character is corrected based on the word path with the smallest cost, and the recognition result storage unit 45 is updated. . The language dictionary 55 is a notation of words,
It consists of a word dictionary that holds information such as reading and part of speech, and a part-of-speech connection cost table that holds weights that indicate whether or not the part of speech of connected words can be connected. For example, in the case of Japanese, in addition to words containing only kanji,
"Kanji + Kana" and "Kanji + English" can also be registered. The certainty calculating unit 40 assigns numerical values (weights) that meet the following conditions to the parameters for calculating the certainty, and calculates the certainty as a linear combination or an average value of these parameters (for example, JP-A-9-134410). (A) The higher the character is in the recognition result for the same character in the image, the higher the certainty is. (B) The higher the similarity in the character recognition of the character,
Confidence is high. (C) The longer the written length of the word determined to belong to the character, the greater the certainty. (D) The greater the likelihood of connection between the character or the category of the character and that of the preceding and following characters, the higher the certainty. (E) The degree of certainty increases as the possibility of connection between the word and the preceding and succeeding words increases. This rule is stored in advance as a statistical property or a heuristic rule of many documents in, for example, a rule table or a part-of-speech connection cost table. The result output unit 50 outputs the recognition result stored in the recognition result storage unit 45 and the corresponding original image data in order to perform post-processing. By referring to the output result, the user can correct the recognition result if it is incorrect by referring to the output result, output the final result to an output device such as a display, a printer or a file, or transmit the final result to another computer via a network. Or

【0008】この後処理において、従来の方法では、誤
認識した文字のみを修正することを念頭においているた
めに、正解文字を入力する際に、1文字の「単字」を入
力している。しかし、ユーザは、漢字の場合、同音の単
漢字が多いのでなかなか正解文字を選択することができ
ないが、単語単位で考えると、同音の単語は単漢字に比
べるとその数は少なく、誤認識した文字のみを修正する
のではなく、その前後の正解している文字も含め、単語
単位で修正を行ったほうが効率が良い場合が多い。一
方、確信度算出部40で算出した認識結果の確信度が低
い文字を含んでいる単語があるということは、言語辞書
55とのマッチングがとれなかった場合が多い。このよ
うな場合には、低確信度抽出部60は、まず、単語パス
中に確信度の低い認識結果の文字を探し、この検出され
た認識文字の前後に2字以上の単語として登録されてい
ない隣接した単字を単語パスの中に探し、それらを1つ
の文字列として連結し、その文字列を1つの単語(以
下、本発明では、この文字列も単語と呼ぶ。)として抽
出する。例えば、図2を参照すると、「周辺イメージ表
示処理」という画像データを文字認識した結果、「周辺
イメージ麦示処理」という文字列が得られ、単語パスは
「周辺」、「イメージ」、「麦」、「示」、「処理」が
得られている場合を考える。また、それぞれの文字に対
する確信度は、「90」、「89」、「80」、「75」、「7
0」、「80」、「50」、「80」、「99」、「92」と算出
されたとする。低い確信度「50」の「麦」が検出される
ので、「麦」から前後に探索をすると、前方向には「イ
メージ」という単語があり、後ろ方向には、単字の
「示」と単語の「処理」があるので、確からしさの低い
単語として「麦示」が抽出される。
In the post-processing, in the conventional method, one character "single character" is input when the correct character is input in order to correct only the incorrectly recognized character. However, the user cannot easily select the correct character in the case of kanji because there are many single kanji of the same sound. In many cases, it is more efficient to correct not only the characters but also the correct characters before and after it, in units of words. On the other hand, the fact that there is a word including a character with a low degree of certainty in the recognition result calculated by the certainty degree calculating unit 40 often means that matching with the language dictionary 55 could not be achieved. In such a case, the low confidence extracting unit 60 first searches the word path for a character having a low confidence in the recognition result, and the character is registered as two or more words before and after the detected recognized character. Non-adjacent single characters are searched for in a word path, concatenated as one character string, and the character string is extracted as one word (hereinafter, this character string is also called a word in the present invention). For example, referring to FIG. 2, as a result of character recognition of image data of “peripheral image display processing”, a character string of “peripheral image wheat display processing” is obtained, and the word paths are “peripheral”, “image”, “wheat”. , "Show", and "process" are obtained. The confidence for each character is “90”, “89”, “80”, “75”, “7”
It is assumed that the calculated values are “0”, “80”, “50”, “80”, “99”, and “92”. Since "barley" with a low confidence of "50" is detected, when searching forward and backward from "barley", there is a word "image" in the forward direction and a single character "indicator" in the backward direction. Since there is a word “processing”, “barley” is extracted as a word with low probability.

【0009】次に、結果出力部50は、認識された結果
の後処理を行うときに、低確信度抽出部60で上記のよ
うに抽出した確信度が低い単語と、確信度の高い単語と
を区別して表示する。例えば、表示の方法として、色を
変えたり、フォントの大きさを変えたり、下線を引いた
り、ウインクさせたりして視覚的に区別できるようにす
る。この後処理では、1つの単語を修正すると、この修
正された単語によって認識結果記憶部45を更新した
後、次の確信度の低い単語に移るようにする。これによ
り、ユーザはキーボードから手を離すことなく、単語単
位で効率的に誤認識の修正ができる。このように実施例
を構成することにより、従来のように文字単位で修正せ
ずに、単語単位で確信度の低い単語を表示させて、単語
単位で修正するので、ユーザの入力の手間も減り、正し
い単語へ修正しやすくなり、編集作業の効率も向上す
る。
Next, when performing post-processing of the recognized result, the result output unit 50 outputs the low confidence word extracted by the low confidence extraction unit 60 as described above and the high confidence word. Are displayed separately. For example, as a display method, a color, a font size, an underline, and a wink are displayed so that the characters can be visually distinguished. In this post-processing, when one word is corrected, the recognition result storage unit 45 is updated with the corrected word, and then the process moves to the next word having a lower degree of certainty. As a result, the user can efficiently correct erroneous recognition in word units without releasing the hand from the keyboard. By configuring the embodiment in this manner, a word having a low degree of certainty is displayed in units of words, instead of being corrected in units of characters as in the related art, and correction is performed in units of words. This makes it easier to correct the correct word and improves the efficiency of editing work.

【0010】(2) 処理手順 図3は、本実施例の処理手順を示すフローチャートであ
る。スキャナやファイルからの画像を読取り、その画像
データを原画像記憶部25へ格納する(ステップS10
0)。これにより画像入力部20を構成する。原画像記
憶部25に記憶された画像情報から文字画像領域を判別
し、その文字領域から行を切り出す(ステップS11
0)。切り出された行から文字を切り出し、その文字部
分を囲む矩形の対角座標値を抽出し、その文字部分の大
きさの正規化やノイズ(汚れ等)除去し、特徴量を計算
する(ステップS120)。この特徴量と標準パターン
を保持する認識辞書35とからパターンマッチングを行
い、1文字あたり単数または複数の認識候補文字とその
順位、およびそれらに対応する標準パターンとの距離値
を認識結果記憶部45へ記憶する(ステップS13
0)。認識結果記憶部45に登録した認識候補を基に、
各文字位置を開始点とする単語候補を生成して言語辞書
55の単語辞書を検索し、マッチした単語とその品詞情
報を取り出し、処理対象領域の先頭から候補単語を接続
して単語パスを生成すると同時に言語辞書55の品詞間
接続コストテーブルを用いてその単語パスのコストを計
算する。この生成された単語パスが一定数以下になるよ
うに、その単語パスのコストの高い順に選択し、もっと
もコストの小さい単語パスに基づいて認識候補文字を修
正し、認識結果記憶部45を更新する(ステップS14
0)。ステップS110からステップ140で文字認識
部30を構成する。確信度を算出するためのパラメータ
に対して、例えば、ルールテーブルや品詞間接続コスト
テーブル等に保持してある重みを取り出して、その一次
結合や平均値として確信度を算出する(ステップS15
0)。これにより確信度算出部40を構成する。ステッ
プS140で生成された単語パス中に確信度の低い認識
結果の文字を探し、この検出された認識文字の前後に2
字以上の単語として登録されていない隣接した単字を単
語パスの中に探し、それらを1つの文字列として連結
し、その文字列を1つの単語として抽出する(ステップ
S160)。これにより低確信度抽出部60を構成す
る。認識結果の後処理を行わせるために認識結果記憶部
45に格納されている認識結果とそれに対応する原画像
データと対応させ、ステップS160で抽出した確信度
が低い単語と、確信度の高い単語とを色を変えたり、フ
ォントの大きさを変えたり、下線を引いたり、ウインク
させることによって、視覚的に区別して出力する。この
出力された結果をユーザは、参照することによって認識
結果に誤りがあれば修正する(ステップS170)。こ
の後処理のとき、1つの単語を修正すると、この修正さ
れた単語によって認識結果記憶部45を更新した後、次
の確信度の低い単語に移るようにする。すべての認識結
果の後処理が終了した後、認識結果記憶部45に記憶さ
れた最終結果をディスプレイ、プリンタやファイル等の
出力装置に出力したり、ネットワークを介して他のコン
ピュータへ送信したりする(ステップS180)。ステ
ップS160からステップS180により結果出力部5
0を構成する。
(2) Processing Procedure FIG. 3 is a flowchart showing the processing procedure of this embodiment. An image from a scanner or a file is read, and the image data is stored in the original image storage unit 25 (step S10).
0). Thus, the image input unit 20 is configured. The character image area is determined from the image information stored in the original image storage unit 25, and a line is cut out from the character area (step S11).
0). A character is cut out from the cut-out line, diagonal coordinate values of a rectangle surrounding the character portion are extracted, the size of the character portion is normalized, noise (dirt, etc.) is removed, and a feature amount is calculated (step S120). ). Pattern matching is performed from the feature amount and the recognition dictionary 35 that holds the standard pattern, and one or more recognition candidate characters per character, their rank, and the distance value between the corresponding standard pattern and the recognition result storage unit 45 are stored. (Step S13)
0). Based on the recognition candidates registered in the recognition result storage unit 45,
A word candidate starting from each character position is generated, a word dictionary of the language dictionary 55 is searched, a matched word and its part of speech information are extracted, and a candidate word is connected from the beginning of the processing target area to generate a word path. At the same time, the cost of the word path is calculated using the part-of-speech connection cost table of the language dictionary 55. The word paths are selected in descending order of cost so that the number of generated word paths is equal to or less than a certain number, the recognition candidate character is corrected based on the word path with the smallest cost, and the recognition result storage unit 45 is updated. (Step S14
0). The character recognition unit 30 is configured by steps S110 to S140. For parameters for calculating a certainty factor, for example, a weight held in a rule table, a part-of-speech connection cost table, or the like is extracted, and the certainty factor is calculated as a linear combination or an average value (step S15).
0). This constitutes the certainty factor calculation unit 40. In the word path generated in step S140, a character having a low degree of certainty is searched for, and two characters before and after the detected recognized character are searched.
A search is made for adjacent single characters that are not registered as words of one or more characters in the word path, concatenate them as one character string, and extract the character string as one word (step S160). This constitutes the low confidence extractor 60. In order to perform post-processing of the recognition result, the recognition result stored in the recognition result storage unit 45 and the corresponding original image data are associated with each other, and the low confidence word and the high confidence word extracted in step S160 are extracted. By visually changing the color, changing the font size, underlining, or winking, the output is visually distinguished. The user corrects any error in the recognition result by referring to the output result (step S170). In this post-processing, when one word is corrected, the recognition result storage unit 45 is updated with the corrected word, and then the next word having a low degree of certainty is moved to. After the post-processing of all the recognition results is completed, the final result stored in the recognition result storage unit 45 is output to an output device such as a display, a printer or a file, or transmitted to another computer via a network. (Step S180). From step S160 to step S180, the result output unit 5
0.

【0011】<変形例1>一方、視覚障害者の場合、認
識結果を読み上げることによって、情報を得ていること
が多い。しかし、上記実施例の方法では、確からしさに
よって、視覚的に判断することは可能であるが、視覚障
害者には利用できるものではない。そこで、本変形例1
では、結果出力部50の後処理のときに、低い確信度の
単語を抽出し、この単語を視覚的に表示する代わりに、
読み上げる音声情報を確信度によって、音質を変えた
り、音の大きさを変えたりすることにより区別できるよ
うにする。この低確信度の単語を読むときには、単語と
しての意味をなしていないので、単語としてではなく1
文字ごとに複数候補を読み上げるようにする。例えば、
ステレオ方式で音声を出力するときには、確信度が高い
ときは、右と左信号を同時に出力するが、低確信度のと
きは、右のみまたは左のみの信号に出力するなど、音声
の出力先を変更するようにしても構わない。また、認識
結果を読み上げる前後に、区別するための信号音やメッ
セージを入れてもよい。また、視覚障害者には、画像を
見ることができないので、完全に正しい文字に修正する
ことは不可能かもしれないが、前後の流れ等から、推測
し修正することや、想像することは可能であろう。従っ
て、後処理で、確信度の低い単語を修正した後、次の低
確信度の単語を直接読み上げるのではなく、その単語の
近辺も合わせて読むようにすることによって、視覚障害
者が何を修正すべきかをわかるようにする。
<Modification 1> On the other hand, in the case of a visually impaired person, information is often obtained by reading out the recognition result. However, according to the method of the above embodiment, it is possible to visually judge by certainty, but it is not available to visually impaired persons. Therefore, the first modification example
Then, at the time of post-processing of the result output unit 50, instead of extracting a word with low confidence and visually displaying this word,
The voice information to be read can be distinguished by changing the sound quality or changing the loudness of the sound according to the certainty factor. When reading this low confidence word, it does not make sense as a word, so
Read multiple candidates for each character. For example,
When outputting sound in stereo, if the confidence is high, the right and left signals are output simultaneously, but if the confidence is low, the output destination of the sound is output, such as outputting only the right or left signal. It may be changed. Further, before and after reading out the recognition result, a signal sound or a message for distinguishing may be inserted. Also, it may not be possible for visually impaired people to see the image, so it may not be possible to completely correct the characters, but it is possible to guess and correct or imagine from the flow before and after Will. Therefore, instead of reading out the next low-confidence word directly after correcting the low-confidence word in post-processing, what the visually impaired does Make sure you know what to fix.

【0012】または、聴覚障害者の場合には、次の低確
信度の単語へジャンプするのではなく、順番にすべて読
んでいくようにしてもよい。健常者では、このような読
み方をせず、次の低確信度の単語へジャンプする方が作
業効率が上がるので、健常者と視覚障害者の場合とで、
ジャンプするかどうかを指定して、使い分けるようにし
てもよい。本変形例1のように構成することにより、視
覚障害者でも単語単位で確信度の低い単語を読み上げる
ので、ユーザが正しい単語へ修正しやすくなり、編集作
業の効率も向上する。また、この後処理で認識結果を出
力するときには、視覚的と聴覚的を合わせて出力するよ
うにしておけば、視覚障害者とその介助者とが共同して
作業できるので、より編集作業の効率が向上する。ま
た、視覚的にチェックしたとき、似た形の文字では修正
漏れを起こすことがあるので、視覚的と聴覚的を合わせ
て出力するようにしておけば、似た形の文字を音声で読
み上げることによって、健常者であっても誤りを発見し
やすくなり、より編集作業の効率が向上する。
Alternatively, in the case of a hearing-impaired person, instead of jumping to the next word of low confidence, all the words may be read in order. For a healthy person, jumping to the next low confidence word without such reading increases work efficiency, so in the case of a healthy person and a visually impaired person,
You may specify whether to jump and use it properly. With the configuration as in the first modification, even a visually impaired person reads out a word having a low degree of certainty on a word-by-word basis, so that the user can easily correct a correct word, and the efficiency of editing work is improved. Also, when outputting the recognition result in this post-processing, if the visual and auditory outputs are output together, the visually impaired person and his / her helper can work together, so that the editing work is more efficient. Is improved. Also, when visually checked, similar shaped characters may cause omission of correction, so if you output both visual and auditory, you can read out similar shaped characters aloud Thereby, even a healthy person can easily find an error, and the efficiency of editing work is further improved.

【0013】<変形例2>また、視覚障害者の場合は、
認識結果を点字によって情報を得ていることが多い。し
かし、上記実施例の方法では、確からしさによって、視
覚的に判断することは可能であるが、視覚障害者には利
用できるものではない。そこで、本変形例2では、結果
出力部50の後処理のときに、低い確信度の単語を抽出
し、この単語を視覚的に表示する代わりに、点字出力装
置によって触覚的に判断可能な方式、例えば、点字の凹
凸の高さを変更したり、低確信度の文字や単語の前後に
区別するための、マークなどを入れるようにする。ま
た、低確信度の単語を後処理で修正するとき、この低確
信度の単語へのジャンプは、低確信度の単語を含む行ま
たはその周辺を点字のカーソル行(点字のピンが出る)
で示すようにする。本変形例2のように構成することに
より、視覚障害者でも単語単位で確信度の低い単語を点
字として出力するので、ユーザが正しい単語へ修正しや
すくなり、編集作業の効率も向上する。また、この後処
理で認識結果を出力するときには、触覚的と聴覚的とを
合わせて出力するようにしておけば、視覚障害者が聴覚
的に聞き漏らしたときも、触覚的に確かめられるので、
より編集作業の効率が向上する。尚、本実施の形態で
は、文字認識部30で認識された候補の中から言語辞書
55によって、単語パスを作成し、この単語パスの中か
ら確信度の低い文字を含む文字列(単語)を抽出してい
るが、結果出力部50の認識結果の後処理において、認
識結果に対して言語辞書55に単語として登録されてい
ない未知語を探すように構成しても、同一の効果をもた
らすことができる。
<Modification 2> In the case of a visually impaired person,
In many cases, the recognition result is obtained by using Braille. However, according to the method of the above embodiment, it is possible to visually judge by certainty, but it is not available to visually impaired persons. Therefore, in the second modification, at the time of post-processing of the result output unit 50, instead of extracting a word with a low degree of certainty and visually displaying this word, a method that can be tactilely determined by a braille output device is used. For example, the height of the unevenness of Braille is changed, and a mark or the like for distinguishing before and after characters or words with low confidence is inserted. When the low confidence word is corrected in the post-processing, the jump to the low confidence word is performed by using the braille cursor line (the braille pin comes out) on or around the line including the low confidence word.
As shown. With the configuration as in the second modification, even a visually impaired person outputs a word having a low degree of certainty as braille in word units, so that the user can easily correct a correct word and the efficiency of editing work is improved. In addition, when outputting the recognition result in this post-processing, if the tactile and auditory are output together, even if the visually impaired auditoryly misses, it can be checked tactilely,
Editing work is more efficient. In the present embodiment, a word path is created from the candidates recognized by the character recognition unit 30 by using the language dictionary 55, and a character string (word) including a character having a low degree of certainty is extracted from the word path. Although the extraction is performed, the same effect can be obtained even if the recognition result is searched for an unknown word that is not registered as a word in the language dictionary 55 in the post-processing of the recognition result of the result output unit 50. Can be.

【0014】<コンピュータによる実施例>さらに、本
発明は上記の実施の形態のみに限定されたものではな
い。例えば、図1に示した文字認識装置100は、図4
のようなハードウェア構成を持つコンピュータ装置20
0によっても実現が可能である。即ち、コンピュータ装
置200は、キーボード、マウス、タッチパネル、スキ
ャナ、点字入力装置等により構成され、情報の入力に使
用される入力装置1と、種々の出力情報や入力装置1か
らの入力された情報などを表示したり、プリンタや点字
出力装置等へ出力させる出力装置2と、種々のプログラ
ムを動作させるCPU(Central Processing Unit;中
央処理ユニット)3と、プログラム自身を保持し、また
そのプログラムがCPU3によって実行されるときに一
時的に作成される情報等を保持するメモリ4と、本発明
の文字認識装置の原画像記憶部25、認識辞書35、認
識結果記憶部45、言語辞書55およびプログラムやプ
ログラム実行時の一時的な情報等を保持する記憶装置5
と、プログラムやデータ等を記憶した記録媒体を装着し
てそれらを読み込み、メモリ4または記憶装置5へ格納
するのに用いられる媒体駆動装置6と、ネットワーク9
へ接続するためのインタフェースであるネットワーク接
続装置7とから構成され、それらはバス8で接続されて
いる。また、ネットワーク9は、コンピュータ装置20
0と他のコンピュータ装置200とを結合するための伝
送路であって、一般には、ケーブルで実現され、通信プ
ロトコルにはTCP/IPが使われる。但し、伝送路と
してはケーブルだけではなく、それらの間の通信プロト
コルが一致するものであれば無線、有線または放送波の
いずれでもよく、例えば、LAN(Local Area Networ
k)、WAN(WideArea Network)、インターネット、ア
ナログ電話網、デジタル電話網(ISDN:Integral S
ervice Digital Network)、PHS(パーソナルハン
ディホンシステム)、携帯電話網、衛星通信網などを用
いることができる。
<Embodiment by Computer> Further, the present invention is not limited to the above embodiment. For example, the character recognition device 100 shown in FIG.
Computer device 20 having a hardware configuration such as
It can be realized by setting the value to 0. That is, the computer device 200 includes a keyboard, a mouse, a touch panel, a scanner, a Braille input device, and the like, and includes an input device 1 used for inputting information, various output information, information input from the input device 1, and the like. Output device 2 for displaying or outputting to a printer or Braille output device, a CPU (Central Processing Unit) 3 for operating various programs, and a program itself. A memory 4 for holding information temporarily created when executed, an original image storage unit 25, a recognition dictionary 35, a recognition result storage unit 45, a language dictionary 55, a program and a program of the character recognition device of the present invention Storage device 5 for storing temporary information at the time of execution
A medium drive device 6 used to load a recording medium storing programs, data, and the like, read them, and store them in the memory 4 or the storage device 5;
And a network connection device 7 which is an interface for connecting to the network. The network 9 is connected to a computer device 20.
This is a transmission path for connecting the computer 0 and another computer device 200, and is generally realized by a cable, and TCP / IP is used as a communication protocol. However, the transmission path is not limited to cables, but may be any of wireless, wired, or broadcast waves as long as the communication protocol between them is the same. For example, LAN (Local Area Network)
k), WAN (Wide Area Network), Internet, analog telephone network, digital telephone network (ISDN: Integral S)
ervice Digital Network), PHS (Personal Handy Phone System), mobile phone network, satellite communication network, and the like.

【0015】このようなコンピュータ装置200の構成
において、図1に示した文字認識装置を構成する各機能
をそれぞれプログラム化し、予めCD−ROM等の記録
媒体に書き込んでおき、このCD−ROMを各サイトの
CD−ROMドライブのような媒体駆動装置6を搭載し
たコンピュータ装置200に装着して、これらのプログ
ラムをそれぞれのコンピュータ装置200のメモリ4あ
るいは記憶装置5に格納し、それを実行することによっ
て、上記の実施の形態と同様な機能を実現することがで
きる。尚、記録媒体としては半導体媒体(例えば、RO
M、ICメモリカード等)、光媒体(例えば、DVD、
MO、MD、CD−R等)、磁気媒体(例えば、磁気テ
ープ、フレキシブルディスク等)等のいずれであっても
よい。また、コンピュータ装置200のメモリ4へロー
ドしたプログラムを実行することにより上記した実施の
形態の機能が実現されるだけでなく、そのプログラムの
指示に基づき、オペレーティングシステム等が実際の処
理の一部または全部を行い、その処理によって上記した
実施の形態の機能が実現される場合も含まれる。また、
上記した実施の形態を実現するプログラムがROM等の
ような半導体の記録媒体である場合には、媒体駆動装置
6からではなく、直接、メモリ4へロードして実行され
る。
In such a configuration of the computer device 200, each function constituting the character recognition device shown in FIG. 1 is programmed and written in advance on a recording medium such as a CD-ROM. By installing the program in a computer 200 equipped with a medium drive device 6 such as a CD-ROM drive at a site, storing these programs in the memory 4 or the storage device 5 of each computer device 200, and executing the program. The functions similar to those of the above-described embodiment can be realized. In addition, as a recording medium, a semiconductor medium (for example, RO
M, IC memory card, etc.), optical media (eg, DVD,
MO, MD, CD-R, etc.), magnetic media (eg, magnetic tape, flexible disk, etc.) and the like. In addition, not only the functions of the above-described embodiment are realized by executing the program loaded into the memory 4 of the computer device 200, but also the operating system or the like can execute a part of the actual processing or It also includes a case where all the operations are performed and the functions of the above-described embodiment are realized by the processing. Also,
When a program for realizing the above-described embodiment is a semiconductor recording medium such as a ROM, the program is directly loaded into the memory 4 instead of the medium driving device 6 and executed.

【0016】<本発明のネットワーク環境での運用>図
5は、本発明を有線または無線の通信ネットワークに接
続して運用する形態の構成を示している。例えば、文字
認識プログラムを保持するサーバー210と複数のユー
ザが利用する端末220とをネットワーク9で接続す
る。この場合、サーバー210およびユーザの端末22
0は、図4に示した汎用のコンピュータ装置200で構
成される。ユーザは、端末220からサーバー210に
対してログインしたり、文字認識のための画像データを
入力し、サーバー210の文字認識プログラムへ文字認
識の実行を依頼する。サーバー210の文字認識プログ
ラムは、送信された画像データの文字領域に対する文字
認識結果を要求元の端末220へ戻す。ユーザの端末2
20は、この認識結果やもとの画像データとを対比させ
ながら出力したり、後処理を行ったりする。このように
することで、常に最新の文字認識プログラムを使えると
いう利点がある。また、図5のようにサーバー210と
端末220とを有線または無線の通信ネットワークで接
続した場合、サーバー210の磁気ディスク等の記憶装
置に本発明の機能を実現する文字認識プログラムを格納
しておき、端末220に対してダウンロード等の形式で
頒布することも可能である。さらに、本発明の機能を実
現する文字認識プログラムを媒体や放送波による配布で
提供するようにしてもよい。
<Operation in Network Environment of the Present Invention> FIG. 5 shows a configuration of an embodiment in which the present invention is connected to a wired or wireless communication network for operation. For example, a server 210 holding a character recognition program and a terminal 220 used by a plurality of users are connected via the network 9. In this case, the server 210 and the user terminal 22
0 is constituted by the general-purpose computer device 200 shown in FIG. The user logs in to the server 210 from the terminal 220 or inputs image data for character recognition, and requests the character recognition program of the server 210 to execute character recognition. The character recognition program of the server 210 returns a character recognition result for the character area of the transmitted image data to the requesting terminal 220. User terminal 2
20 outputs the recognition result and the original image data while comparing the recognition result and the original image data, and performs post-processing. This has the advantage that the latest character recognition program can always be used. When the server 210 and the terminal 220 are connected via a wired or wireless communication network as shown in FIG. 5, a character recognition program for realizing the functions of the present invention is stored in a storage device such as a magnetic disk of the server 210. It can also be distributed to the terminal 220 in a form such as download. Further, a character recognition program for realizing the functions of the present invention may be provided by distribution through a medium or a broadcast wave.

【0017】[0017]

【発明の効果】以上説明したように、本発明によれば、
視覚・聴覚などの障害の有無によらず、認識結果の確か
らしさを確認することが可能となる。また、単語単位で
確からしくない単語を抽出するので、その単語の修正が
容易となり、後処理の作業効率が向上する。
As described above, according to the present invention,
It is possible to confirm the certainty of the recognition result irrespective of the presence / absence of visual or auditory disturbance. In addition, since a word that is not certain is extracted for each word, it is easy to correct the word, and the work efficiency of post-processing is improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】実施例の機能構成を示すブロック図である。FIG. 1 is a block diagram illustrating a functional configuration of an embodiment.

【図2】従来例と本発明の文字認識結果を説明する図で
ある。
FIG. 2 is a diagram illustrating character recognition results of a conventional example and the present invention.

【図3】実施例の処理手順を説明するフローチャートで
ある。
FIG. 3 is a flowchart illustrating a processing procedure according to the embodiment.

【図4】本発明の文字認識装置が稼動するためのコンピ
ュータ装置を示す図である。
FIG. 4 is a diagram showing a computer device for operating the character recognition device of the present invention.

【図5】本発明のネットワーク環境での運用例を説明す
るための図である。
FIG. 5 is a diagram for explaining an operation example in a network environment according to the present invention.

【符号の説明】[Explanation of symbols]

1 入力装置、2 出力装置、3 CPU、4 メモ
リ、5 記憶装置、6 媒体駆動装置、7 ネットワー
ク接続装置、8 バス、9 ネットワーク、10制御
部、20 画像入力部、25 原画像記憶部、30 文
字認識部、35 認識辞書、40 確信度算出部、45
認識結果記憶部、50 結果出力部、55言語辞書、
60 低確信度抽出部、100 文字認識装置、200
コンピュータ装置、210 サーバー、220 端末
Reference Signs List 1 input device, 2 output device, 3 CPU, 4 memory, 5 storage device, 6 medium drive device, 7 network connection device, 8 bus, 9 network, 10 control unit, 20 image input unit, 25 original image storage unit, 30 Character recognition unit, 35 recognition dictionary, 40 confidence calculation unit, 45
Recognition result storage unit, 50 result output unit, 55 language dictionary,
60 low confidence extractor, 100 character recognition device, 200
Computer device, 210 server, 220 terminal

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 文書画像の文字認識結果に後処理を行っ
て認識結果を得る文字認識装置において、 文書画像を入力する画像入力部と、 前記画像入力部で入力された画像の文字領域に対して文
字認識する文字認識部と、 前記文字認識部から得た各文字に対する文字認識結果の
確からしさを算出する確信度算出部と、 前記文字認識部から得た文字認識結果を後処理し、その
結果を出力する結果出力部とを備え、 前記結果出力部は、文字認識結果の後処理の際、前記確
信度算出部で計算された各文字に対する認識結果の確か
らしさが低い文字の前後の文字を探索し、その認識結果
の確からしさが低い文字を含む単語を抽出し、この単語
を後処理するようにしたことを特徴とする文字認識装
置。
1. A character recognition apparatus for performing a post-process on a character recognition result of a document image to obtain a recognition result, comprising: an image input unit for inputting a document image; and a character area of the image input by the image input unit. A character recognition unit for recognizing a character, a confidence calculation unit for calculating the certainty of the character recognition result for each character obtained from the character recognition unit, and a post-processing of the character recognition result obtained from the character recognition unit. A result output unit for outputting a result, wherein the result output unit is a character before and after a character for which the likelihood of the recognition result for each character calculated by the certainty factor calculation unit is low during post-processing of the character recognition result. A character recognition device characterized by searching for a word, extracting a word including a character having a low probability of the recognition result, and post-processing this word.
【請求項2】 請求項1に記載の文字認識装置におい
て、 前記結果出力部は、認識結果の確からしさが低いと判定
された単語と、低いと判定されなかった単語とを視覚的
に区別して出力し、ユーザが後処理しやすくしたことを
特徴とする文字認識装置。
2. The character recognition device according to claim 1, wherein the result output unit visually distinguishes a word determined to have low probability of the recognition result from a word not determined to be low. A character recognizing device which outputs and facilitates post-processing by a user.
【請求項3】 請求項1に記載の文字認識装置におい
て、 前記結果出力部は、認識結果の確からしさが低いと判定
された単語と、低いと判定されなかった単語とを聴覚的
に区別して出力し、ユーザが後処理しやすくしたことを
特徴とする文字認識装置。
3. The character recognition device according to claim 1, wherein the result output unit aurally distinguishes between a word determined to have low probability of the recognition result and a word not determined to be low. A character recognizing device which outputs and facilitates post-processing by a user.
【請求項4】 請求項1に記載の文字認識装置におい
て、 前記結果出力部は、認識結果の確からしさが低いと判定
された単語と、低いと判定されなかった単語とを触覚的
に区別して出力し、ユーザが後処理しやすくしたことを
特徴とする文字認識装置。
4. The character recognition device according to claim 1, wherein the result output unit tactilely distinguishes between a word determined to have low probability of the recognition result and a word not determined to be low. A character recognizing device which outputs and facilitates post-processing by a user.
【請求項5】 請求項1乃至請求項4のいずれかひとつ
に記載の文字認識装置において、 前記結果出力部は、確からしくない単語が修正されたと
き、確からしくない単語をこの修正した単語によって置
き換え、次の確からしくない単語の後処理へ移るように
したことを特徴とする文字認識装置。
5. The character recognition device according to claim 1, wherein, when the uncertain word is corrected, the unreliable word is replaced by the corrected word. A character recognition device, characterized in that the character is replaced and the process proceeds to the post-processing of the next uncertain word.
【請求項6】 文字画像に対して文字認識を行い、その
認識結果に後処理する文字認識方法において、 認識結果の確からしさが低い文字の前後の文字を探索
し、その認識結果の確からしさが低い文字を含む単語を
抽出し、その単語を修正するようにして、後処理の作業
効率が向上するようにしたことを特徴とする文字認識方
法。
6. A character recognition method for performing character recognition on a character image and post-processing the recognition result, searching for characters before and after a character having a low probability of the recognition result, and determining the probability of the recognition result. A character recognition method characterized by extracting a word including a low character and correcting the word so as to improve post-processing work efficiency.
【請求項7】 コンピュータを、文書画像の文字認識結
果に後処理を行って認識結果を得る文字認識装置として
機能させるためのプログラムを記録したコンピュータ読
み取り可能な記録媒体であって、 文書画像を入力する画像入力部と、 前記画像入力部で入力された画像の文字領域に対して文
字認識する文字認識部と、 前記文字認識部から得た各文字に対する文字認識結果の
確からしさを算出する確信度算出部と、 前記文字認識部から得た文字認識結果を後処理し、その
結果を出力する結果出力部とを備え、 前記結果出力部は、文字認識結果の後処理の際、前記確
信度算出部で計算された各文字に対する認識結果の確か
らしさが低い文字の前後の文字を探索し、その認識結果
の確からしさが低い文字を含む単語を抽出し、この単語
を後処理するようにした文字認識プログラムを記録した
コンピュータ読み取り可能な記録媒体。
7. A computer-readable recording medium in which a program for causing a computer to function as a character recognition device that performs post-processing on a character recognition result of a document image to obtain a recognition result is provided. An image input unit, a character recognition unit that recognizes a character in a character region of an image input by the image input unit, and a confidence that calculates a certainty of a character recognition result for each character obtained from the character recognition unit. A calculation unit, and a result output unit that post-processes the character recognition result obtained from the character recognition unit and outputs the result, wherein the result output unit calculates the certainty factor during the post-processing of the character recognition result. Search for characters before and after the character with low confidence in the recognition result for each character calculated in the section, extract words containing characters with low confidence in the recognition result, and post-process this word Computer readable recording medium character recognition program recorded you so that.
JP2001075106A 2001-03-15 2001-03-15 Character recognition device, character recognition method, program, and computer-readable recording medium Expired - Fee Related JP4718699B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001075106A JP4718699B2 (en) 2001-03-15 2001-03-15 Character recognition device, character recognition method, program, and computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001075106A JP4718699B2 (en) 2001-03-15 2001-03-15 Character recognition device, character recognition method, program, and computer-readable recording medium

Publications (2)

Publication Number Publication Date
JP2002279353A true JP2002279353A (en) 2002-09-27
JP4718699B2 JP4718699B2 (en) 2011-07-06

Family

ID=18932235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001075106A Expired - Fee Related JP4718699B2 (en) 2001-03-15 2001-03-15 Character recognition device, character recognition method, program, and computer-readable recording medium

Country Status (1)

Country Link
JP (1) JP4718699B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006259830A (en) * 2005-03-15 2006-09-28 Toshiba Corp Optical character recognition device and optical character recognition result confirmation method
JP2009193356A (en) * 2008-02-14 2009-08-27 Canon Inc Image processing apparatus, image processing method, program, and storage medium
JP2013069182A (en) * 2011-09-26 2013-04-18 Fuji Xerox Co Ltd Information processing device and information processing program
CN111652130A (en) * 2020-06-02 2020-09-11 上海语识信息技术有限公司 Method for identifying numbers, symbols and letter groups of unspecific fonts

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021149439A (en) * 2020-03-18 2021-09-27 富士フイルムビジネスイノベーション株式会社 Information processing apparatus and information processing program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04280389A (en) * 1991-03-08 1992-10-06 Ricoh Co Ltd Character recognizer
JPH04302070A (en) * 1991-03-29 1992-10-26 Toshiba Corp Character recognizing device
JPH05120470A (en) * 1991-10-30 1993-05-18 Canon Inc Reader device
JPH0668261A (en) * 1992-08-17 1994-03-11 Nippon Telegr & Teleph Corp <Ntt> Pattern recognizing device
JPH0850631A (en) * 1994-08-05 1996-02-20 Ricoh Co Ltd Character recognition device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04280389A (en) * 1991-03-08 1992-10-06 Ricoh Co Ltd Character recognizer
JPH04302070A (en) * 1991-03-29 1992-10-26 Toshiba Corp Character recognizing device
JPH05120470A (en) * 1991-10-30 1993-05-18 Canon Inc Reader device
JPH0668261A (en) * 1992-08-17 1994-03-11 Nippon Telegr & Teleph Corp <Ntt> Pattern recognizing device
JPH0850631A (en) * 1994-08-05 1996-02-20 Ricoh Co Ltd Character recognition device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006259830A (en) * 2005-03-15 2006-09-28 Toshiba Corp Optical character recognition device and optical character recognition result confirmation method
JP2009193356A (en) * 2008-02-14 2009-08-27 Canon Inc Image processing apparatus, image processing method, program, and storage medium
JP2013069182A (en) * 2011-09-26 2013-04-18 Fuji Xerox Co Ltd Information processing device and information processing program
CN111652130A (en) * 2020-06-02 2020-09-11 上海语识信息技术有限公司 Method for identifying numbers, symbols and letter groups of unspecific fonts
CN111652130B (en) * 2020-06-02 2023-09-15 上海语识信息技术有限公司 Method for identifying number, symbol and letter group of non-specific font

Also Published As

Publication number Publication date
JP4718699B2 (en) 2011-07-06

Similar Documents

Publication Publication Date Title
US9484034B2 (en) Voice conversation support apparatus, voice conversation support method, and computer readable medium
US7219050B2 (en) Automatic interpreting system including a system for recognizing errors
US6173253B1 (en) Sentence processing apparatus and method thereof,utilizing dictionaries to interpolate elliptic characters or symbols
TWI437449B (en) Multi-mode input method and input method editor system
WO2020215554A1 (en) Speech recognition method, device, and apparatus, and computer-readable storage medium
JP2009187349A (en) Text correction support system, text correction support method and program for supporting text correction
US10025772B2 (en) Information processing apparatus, information processing method, and program
JP2991178B2 (en) Voice word processor
JP2002279353A (en) Character recognition device, method therefor, and recording medium
JP2005241829A (en) System and method for speech information processing, and program
JP2011008784A (en) System and method for automatically recommending japanese word by using roman alphabet conversion
CN113268981B (en) Information processing method and device and electronic equipment
JP2000089786A (en) Method for correcting speech recognition result and apparatus therefor
JP3309174B2 (en) Character recognition method and device
JP2017151768A (en) Translation program and information processing device
JP2010197709A (en) Voice recognition response method, voice recognition response system and program therefore
JP3274014B2 (en) Character recognition device and character recognition method
JP2003263190A (en) Automatic speech question-answer device
JPH11110379A (en) Method and device for retrieving information
US11935425B2 (en) Electronic device, pronunciation learning method, server apparatus, pronunciation learning processing system, and storage medium
JPH09185674A (en) Device and method for detecting and correcting erroneously recognized character
JP2002279354A (en) Character recognition device and method, and recording medium
JP2001109740A (en) Device and method for preparing chinese document
JP2006309469A (en) Retrieval device, retrieval method, program, and computer-readable recording medium
JP2827066B2 (en) Post-processing method for character recognition of documents with mixed digit strings

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080306

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110401

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140408

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees