JPH04157582A - 文字認識処理制御方法 - Google Patents

文字認識処理制御方法

Info

Publication number
JPH04157582A
JPH04157582A JP2283773A JP28377390A JPH04157582A JP H04157582 A JPH04157582 A JP H04157582A JP 2283773 A JP2283773 A JP 2283773A JP 28377390 A JP28377390 A JP 28377390A JP H04157582 A JPH04157582 A JP H04157582A
Authority
JP
Japan
Prior art keywords
processing
character
recognition
character recognition
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2283773A
Other languages
English (en)
Inventor
Tsuyoshi Kitani
木谷 強
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Group Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP2283773A priority Critical patent/JPH04157582A/ja
Publication of JPH04157582A publication Critical patent/JPH04157582A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、0CR(Optical  Charact
er  Reader、光学式文字読取装置)などの文
字認識装置の文字認識処理の制御方法に係り、特に、手
書き文字や印刷文字など、様々な入力条件の文字に対応
して、効率の良い文字W!Pjliを行なうのに好適な
文字認識処理制御方法に間するものである。
〔従来の技術] 現在、紙面上のイメージデータとしての文字を認識し、
コンピュータへ入力する装置として、OCRなどの文字
認識装置が広く用いられている。
例えば、OCRは、紙面に書かれた、あるいは、印刷さ
れた文字に光を当て、その反射光線を受けて観測し、そ
の文字が何であるかを識別して符号化し、この符号化し
た情報をコンピュータに送出するものである。
従来の文字認識装置の文字認識処理制御方法は、ある入
力イメージデータに対して、文字切出し、文字認識、認
識後処理、表示・修正の各処理の実行順序を固定し、こ
の固定した順番で呼出して実行していた。
しかし、特に手書き文字を対象とする場合には、従来の
文字認識処理方法では、文字の切りだし誤りが多く発生
した。このような問題に対応した従来の文字認識処理制
御技術には、例えば、特開昭63−121989号公報
に記載のように、異なる文字切出し位置の組合せを複数
個作り、その組合せに対応して、文字認識処理と認識後
処理を繰り返し実行させるものがあった。
[発明が解決しようとする課題] 従来の文字認識処理制御方法は、入力イメージデータに
対して1文字切出し1文字認識、認識後処理、表示・修
正の各処理モジュールを一定の順番で実行し、例えば、
認識後処理で、認識結果が言語的知識に適合しないと判
断した場合には、再度、文字切出しから繰り返して処理
を実行していた。
これは、従来の文字認識処理方法は、文字切出し、文字
認識、認識後処理、表示・修正の各処理の実行順序、お
よび、各処理におけるそれぞれの処理パラメータが固定
されており、各処理モジュールの処理状況に応じて、処
理パラメータを動的に変化させることができないからで
ある。
このように、従来の文字認識処理方法は、処理状況に応
じて実行しなければならない処理モジュールを選択する
ことができず、さらに、入力条件が異なる文字に対して
も同一の処理パラメータで処理を行なっていた。
そのために、従来の文字認識処理の制御方法では、文字
認識処理の効率が十分ではなく、かつ、文字の認識精度
を低下させていた。
本発明の目的は、これら従来技術の課題を解決し、各処
理モジュールの処理結果毎に、その処理結果に対応して
、処理モジュールの実行順序と処理パラメータを動的に
変化させ、入力文字に対する文字認識処理の認識精度の
向上を可能とする文字認識処理制御方法を提供すること
である。
〔課題を解決するための手段1 上記目的を達成するため、本発明の文字認識処理制御方
法は、文字切出し部、文字認識部、認識後処理部、そし
て、表示・修正部の順序で、それぞれの処理パラメータ
に基づき処理を導め、イメ7ング一タ、として読み済−
をだ卒字列のヌ字認識処理責行なう文字認識装置に町1
て51.文で切出し部、文字認識部、認識後処理部、お
よび、表示・修正部のそれぞれの処理の終了毎に、終了
した処理の結果に対応する予め定められた次の実行処理
手続きを参照し、この予め定めた次の実行処理手続きに
基づき、処理順序と処理パラメータを変更し、次の処理
を実行することを特徴とする。
[作用〕 本発明では、各処理部の処理状況に応じて、各処理部の
実行順序、および、各処理部の処理パラメータを動的に
変更させる。
従来の文字認識装置では、文字切出し、文字認識、認識
後処理、表示・修正の各処理の実行順序、および、各処
理におけるそれぞれの処理パラメータは固定されていた
。そのために、間違った文字認識結果が出力された場合
には、表示・修正の処理における利用者からの操作によ
り、最初の文字の舛理終I毎iF; 、(−(p処理部
、−に対応する一次?処!を選択、して実行する。
このことにより、精度の良い文字認識結果を、効率良く
得ることができる。
〔実施例〕 以下、本発明の実施例を図面によって詳細に説明する。
明に係る構成部分の一実施例を示すブロック図である。
文字認識処理部10は、図示されていない文字イメージ
データ読み取り部を介して入力されたイメージデータか
ら、各文字の区切り位置を判断する文字切出し部1、文
字切出し部1により切り出された各文字のイメージデー
タに対して、類似する文字候補を決定する文字認識部2
、言語的な知識を利用して、文字認識部2により決定さ
れた文字候補から確からしい文字を選ぶ認識後処理部3
、認識後処理部3の選択結果を表示出力して、利用者か
らの修正を入力する表示・修正W54、そして、本発明
に係レバ文字認識処理部10の動作全体を制御する認識
制御部5、認識制御部5が参照するプロダクション・ル
ールを格納した認識制御知識部6から構成されている。
これら、文字切出し部1、文字認識部2、認識後処理部
3、表示・修正部4、および、認識制御部5は、全て独
立した実行単位であり、それぞれ平行して動作する。
また、各処理部間は、メツセージ通信機能により、情報
を交換する。
そして、認識制御部5は、各処理部から共通的にアクセ
スされるデータを管理する共通データ管理部51、およ
び、認識制御知識部6のプロダクション・ルールを参照
して、次に行なうべき処理を決定する推論エンジン部5
2から構成される。
認識制御知識部6には、各処理部から送られてくる情報
に基づき、m識制御部5の推論エンジン部52が、次に
実行する処理と処理パラメータを決定するための知識が
プロダクション・ルール61〜62の形で蓄えられてい
る。
本実施例では、認識制御知識部6には、条件部が「認識
後処理部より、10文字目から英数字の要求がある場合
」で、基本的作用部がr文字認識部で、10文字目から
英数モードで認識を実行」のプロダクション・ルール6
1と、条件部が「表示・修正部より、正解文字が認識結
果の比較的下位の順位に存在する場合」で、基本的作用
部が「認識結果の第何位までを処理対象とするかを示す
パラメータの値を増やす」のプロダクション・ルール6
2が格納されている。
このような構成により、本実施例の文字認識処理装置は
、精度の良い文字認識処理を行なう。
以下、文字認識処理装置の本発明に係る処理動作を説明
する。
文字認識処理装置は、認識制御部5を介して、通常は、
文字切出し部1、文字認識部2、認識後処理部3、表示
・修正部4の順に制御を移していく。
今、あるイメージデータに対して、文字切出し部l、文
字認識部2、認識後処理部3まで処理が進み、認識後処
理部3の処理の途中で、英数字が必要な文字位置に英数
字の認識結果が含まれていない場合を仮定する。
このようなことは、例えば、住所文字−列の番地部′分
を解析するときに起こりつる。
ここで、認識後処理部3は、メツセージ通信機能により
、認識制御部5に対して、該当文字位置の英数字の認識
結果を要求する。
認識制御部5は、従来技術のように次の処理を表示修正
部4に依頼するのではなく、認識制御知識部6のプロダ
クション・ルール、すなわち、プロダクション・ルール
61を参照し、その内容に基づき、文字認識部2に対し
、文字位置を指定して英数モードでの認識を依頼する。
この依頼に基づく文字認識部2の英数モードでの認識処
理が終了すると、認識制御部5は、通常の処理順序に従
って、認識後処理部3に制御を移す。
このようにして、従来は、表示・修正部4の処理まで進
み、さらに、利用者による修正まで必要であった処理が
、本実施例では、認識後処理部3における処理段階で、
かつ、自動的に′U識処理を再度行なう。このことによ
り、無駄な処理を省くことができ、かつ、出力される文
字の認識精度が高くなる。
次に、表示・修正部4の処理途中で、ユーザが文字認識
結果の確認と修正を行なった結果、正解文字が認識候補
文字の比較的下位の順゛位に多く存在した場合を仮定す
る。
このような状況は、文字認識部2の精度が比較的悪い場
合に起こる。
このような場合、表示・修正部4は、メツセージ通信機
能により、この情報を認識制御部5に通知する。認識制
御部5は、認識制御知識部6のプロダクション・ルール
62を参照し、認識後処理部3が参照するパラメータで
あり、認識結果の第何位までを処理対象とするかを示す
パラメータの値を増やす。
このことによって、次に認識後処理部3が実行されると
きは、増加したパラメータ値を用い゛て処理を行なうの
で、文字認識結果の順位の下の方まで処理対象とするこ
とができ、文字認識部2の精度が悪い場合でも、認識後
処理部3によって、認識精度を向上させることができる
尚、この処理において、文字切出し部1、文字認識部2
、認識後処理部3、表示・修正部4の処理結果は、全て
認識制御部5が、共通データ管理部51で共通的に管理
しており、各処理部は、必要に応じて、このデータを参
照する。
以下、文字認識処理制御部5の制御動作を、フローチャ
ートを用いて説明する。
第2図は、第1図における文字認識処理制御部の本発明
に係る動作の一実施例を示すフローチャートである。
まず、文字切出し部の処理が終了するのを待ち(ステッ
プ201)、処理が終了したならば(ステップ202)
、処理結果を判読する(ステップ203)。
処理結果に問題がなければ(ステップ204)、文字認
識部に処理を移し、文学誌m部の処理が終了するのを待
つ(ステップ205)。
文字認識部の処理が終了したならば(ステップ206)
、その処理結果を判読する(ステップ207)。文字認
識部の処理結果に問題がなければ(ステップ208)、
認識後処理部に処理を移し、認識後処理部の処理が終了
するのを待つ(ステップ209)。
認識後処理部の処理が終了したならば(ステップ210
)、その処理結果を判読する(ステップ211) 、認
識後処理部の処理結果に問題がなければ(ステップ21
2)、表示・修正部に処理を移し、表示・修正部の処理
が終了するのを待つ(ステップ213)。
表示・修正部の処理が終了したならば(ステップ214
)、その処理結果を判読する(ステップ215)、表示
・修正部の処理結果に問題がなければ(ステップ216
)、処理を終了する。
一方、ステップ204.208.212.216におい
て、それぞれの処理結果に問題があれば、認識制御知識
部内のプロダクション・ルールを参照しくステップ21
7)、対応する次の処理を選出する(ステップ218)
、そして、それぞれ対応する処理を、文字切出し部(ス
テップ219)、文字認識部(ステップ220)、認識
後処理部(ステップ221)、表示・修正部(ステップ
222)へ依頼する。
このようにして、本実施例では、各処理部における処理
順序や処理パラメータを、状況に応じて動的に変更する
以上、第1図〜第2図で説明したように、本実施例では
、例えば、対象分野、記入者の違い、あるいは、文字の
丁寧さなどの記入条件が様々に変化する入力文に対応し
て、各処理モジュールの実行順序、および、処理パラメ
ータを動的に変化させる。このことにより、入力文字に
対する認識性能が向上する。
尚、本実施−においては、rIF  条件部 THEN
  基本的作用部」からなるプロダクション・ルールで
表現する問題解決システムであるプロダクション・シス
テムを用いている。しかし、本発明は、プロダクション
・システムの利用に限るものではない。
また、本実施例では、各処理部は、メツセージ通信機能
により情報を交換し、処理を進めているが、認識制御部
で、全ての情報のやり取り、および、各処理部の動作制
御を行なう方法でも良い。
要は、各処理部の処理終了毎に、各処理の処理結果に基
づき、次に実行すべき処理を選択できる方法であれば良
い。
〔発明の効果〕
本発明によれば、様々な記入条件の入力文字に対する精
度の高い認識結果を、効率良く得ることができる。
【図面の簡単な説明】
図面は本発明の実施例を示し、第1図は本発明を施した
文字Sa装置の本発明に係る構成の一実施例を示すブロ
ック図、第2図は第1図における認識制御部の本発明に
係る動作の一実施例を示すフローチャートである。 に文字切出し部、2:文字認識部、3:認識後処理部、
4:表示・修正部+5+1!!識制御部、6:認識制御
知識部、10:文字認識処理部、51:共通データ管理
部、52:推論エンジン部、61〜62:プロダクショ
ン・ルール。 第1図 第2図

Claims (1)

    【特許請求の範囲】
  1. (1)イメージデータとして読み込んだ文字列の各文字
    の区切り位置を判断し、一文字分のイメージデータを切
    り出す文字切出し手段と、該文字切出し手段により切り
    出された上記イメージデータと類似する文字候補を決定
    する文字認識手段と、言語的な知識を利用して、上記文
    字認識手段で決定された文字候補から、確からしい文字
    を選ぶ認識後処理手段と、該認識後処理手段で選出した
    上記確からしい文字を表示出力し、利用者からの確認と
    修正を入力する表示・修正手段とを有し、上記文字切出
    し手段、文字認識手段、認識後処理手段、そして、表示
    ・修正手段の順序で、それぞれの処理パラメータに基づ
    き処理を進め、上記イメージデータとして読み込んだ文
    字列の文字認識処理を行なう文字認識装置の文字認識処
    理制御方法において、上記文字切出し手段、文字認識手
    段、認識後処理手段、および、表示・修正手段のそれぞ
    れの処理の終了毎に、該終了した処理の結果に対応する
    予め定められた次の実行処理手続きを参照し、該予め定
    めた次の実行処理手続きに基づき、上記処理順序と処理
    パラメータを変更し、次の処理を実行することを特徴と
    する文字認識処理制御方法。
JP2283773A 1990-10-22 1990-10-22 文字認識処理制御方法 Pending JPH04157582A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2283773A JPH04157582A (ja) 1990-10-22 1990-10-22 文字認識処理制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2283773A JPH04157582A (ja) 1990-10-22 1990-10-22 文字認識処理制御方法

Publications (1)

Publication Number Publication Date
JPH04157582A true JPH04157582A (ja) 1992-05-29

Family

ID=17669937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2283773A Pending JPH04157582A (ja) 1990-10-22 1990-10-22 文字認識処理制御方法

Country Status (1)

Country Link
JP (1) JPH04157582A (ja)

Similar Documents

Publication Publication Date Title
EP0424032B1 (en) Naturel language processing apparatus
US5784489A (en) Apparatus and method for syntactic signal analysis
CN113221545A (zh) 一种文本处理方法、装置、设备及介质、程序产品
JP3794716B2 (ja) 単語を語形変化させる方法及びその方法を実行するデータ処理装置
CN111581971B (zh) 词库的更新方法、装置、终端及存储介质
JP2611904B2 (ja) 文字認識装置
EP0720105B1 (en) System and method to review the processing of data according to user entered corrections
JPH04157582A (ja) 文字認識処理制御方法
KR102235097B1 (ko) 텍스트 객체로부터 키워드를 추출하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체
RU2785207C1 (ru) Способ и система автоматического поиска и коррекции ошибок в текстах на естественном языке
KR102668118B1 (ko) 자연어 기반의 비디오 검색을 위한 학습 장치 및 학습 방법
JPH0528324A (ja) 英文字認識装置
US20220405488A1 (en) Providing a well-formed alternate phrase as a suggestion in lieu of a not well-formed phrase
US8972239B2 (en) Syntax analysis information generation apparatus, translation apparatus, translation system, syntax analysis information generating method and computer program
KR100276835B1 (ko) 펜 인식 시스템과 그 제어 방법
WO2023069396A1 (en) Semantic frame identification using transformers
JPH0540853A (ja) 文字認識結果の後処理方式
CN117910458A (zh) 一种基于大语言模型的文本数据清洗系统
CN115641598A (zh) 文本识别方法、装置、电子设备及存储介质
CN116522913A (zh) 中文阅读辅助方法、装置及存储介质
CN114580438A (zh) 文本序列生成方法、预训练方法、存储介质及程序产品
JPS62271054A (ja) 翻訳装置における形態素解析結果修正方式
JPH04252390A (ja) 文字認識結果の後処理方法
JPH02155073A (ja) 未知語認定装置
JPH0756924A (ja) 対訳装置