JPH07230531A - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法

Info

Publication number
JPH07230531A
JPH07230531A JP6020983A JP2098394A JPH07230531A JP H07230531 A JPH07230531 A JP H07230531A JP 6020983 A JP6020983 A JP 6020983A JP 2098394 A JP2098394 A JP 2098394A JP H07230531 A JPH07230531 A JP H07230531A
Authority
JP
Japan
Prior art keywords
character
recognition
candidate
character string
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6020983A
Other languages
English (en)
Inventor
Hideki Yamamoto
英樹 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6020983A priority Critical patent/JPH07230531A/ja
Publication of JPH07230531A publication Critical patent/JPH07230531A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】データ種類の判別率および認識率を向上させた
文字認識装置及び文字認識方法を提供することを目的と
する。 【構成】文字認識装置20側において、文字認識部25
を通じて名刺に記入された文字列の認識結果として複数
の候補を得る。CPU21はRAM22に格納されたデ
ータ種類判別用のキーワード情報の文字列と上記認識結
果として得られる第1候補の文字列とを比較し、第1候
補の文字列の中にキーワード情報の文字列と一致しない
文字が存在する場合に、当該文字を第2候補以降の文字
列の中から探し出し、第1候補と入替える。この候補入
替えた後の認識結果を用いてデータ種類を判別し、ま
た、その認識結果を最終結果として出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の名刺を管理する
名刺管理システムに用いられる文字認識装置に係り、特
にキーワードを用いて認識結果のデータ種類を判別する
文字認識装置及び文字認識方法に関する。
【0002】
【従来の技術】従来、名刺管理システムは、ホスト装置
と文字認識装置とからなり、文字認識装置で読取った名
刺のデータをホスト装置で管理するように構成されてい
る。この場合、名刺には、会社名、氏名、住所、電話番
号、FAX番号といった項目がある。文字認識装置で
は、名刺に記入された文字列を上記各項目毎に分類して
認識し、その認識結果をホスト装置に出力している。
【0003】ところで、文字認識装置では、読取った名
刺上の文字列を上記各項目毎に分類して出力する際、認
識結果として得られる第1候補の文字列とキーワードと
して与えられた文字列とを比較することにより、その第
1候補の文字列がキーワードと一致する場合に、その前
後の文字列を該当するキーワードに付随するデータ種類
として判断していた。すなわち、例えば「TEL」とい
うキーワードが登録されていた場合、その「TEL」の
文字列と第1候補の文字列とが一致したら、その付近は
電話番号であると判断される。
【0004】
【発明が解決しようとする課題】文字認識装置では、認
識処理の性能や文字の形、濃さ、大きさ等の要因で、正
しい文字が第1候補として得られない場合がある。従来
の装置では、第1候補の文字列のみを対象にキーワード
との比較を行うため、その文字列がキーワードと一致し
ない場合には、データ種類を判別することができない。
この場合、ユーザ自身が認識データの訂正と共にその項
目を判断して分類する必要があり、非常に面倒な作業を
強いられることになる。特に名刺管理システムでは、複
数の名刺を読取ることから、その作業は多大なものとな
る。
【0005】また、データ種類の判別に用いられるキー
ワードはキーワード辞書に予め登録されているが、珍し
い役職名などについては辞書に登録されていないのが一
般的である。キーワード辞書に必要なキーワードが登録
されていないと、正しい認識結果が得られたとしても、
そのデータ種類を判別することはできない。このため、
ユーザ自身が項目を判断して分類しなければならず、非
常に面倒な作業を強いられることになる。
【0006】また、従来の文字認識装置では、ユーザが
認識データを訂正した場合、その訂正内容は次の認識処
理に反映されることはない。このため、前回と同じよう
な認識データが得られた場合でも、前回と同様の訂正を
行う必要があり、非常に効率の悪いものであった。
【0007】本発明は上記のような点に鑑みなされたも
ので、データ種類の判別率および認識率を向上させた文
字認識装置及び文字認識方法を提供することを目的と
し、特に、キーワードを用いたデータ種類の判別に際
し、第1候補に正しい認識結果が存在しない場合であっ
ても、その判別を可能とし、同時に正しい認識結果を出
力し得ることを第1の目的とし、また、任意のキーワー
ドを用いて難解な文字列に対するデータ種類の判別を可
能とすることを第2の目的とし、また、認識結果の訂正
内容を以後の認識処理に反映させることを第3の目的と
する。
【0008】
【課題を解決するための手段】本発明の文字認識装置
は、読取り対象の認識結果として複数の候補を得、予め
登録されたデータ種類判別用のキーワード情報の文字列
と上記認識結果として得られる第1候補の文字列とを比
較し、この比較の結果、上記第1候補の文字列の中に上
記キーワード情報の文字列と一致しない文字が存在する
場合に、当該文字を第2候補以降の文字列の中から探し
出し、上記第1候補と入替えるようにしたものである。
【0009】また、本発明の文字認識装置は、読取り対
象を認識結果として複数の候補を得、予め登録されたデ
ータ種類判別用のキーワード情報に同情報とは別の任意
のキーワード情報を加え、そのキーワード情報の文字列
と上記認識結果として得られる第1候補の文字列とを比
較し、この比較の結果、上記第1候補の文字列の中に上
記キーワード情報の文字列と一致しない文字が存在する
場合に、当該文字を第2候補以降の文字列の中から探し
出し、上記第1候補と入替えるようにしたものである。
【0010】また、本発明の文字認識装置は、読取り対
象の認識結果を訂正した際に、その訂正内容を学習し、
以後の認識処理で得られる認識結果を上記学習した内容
に従って訂正するようにしたものである。
【0011】
【作用】上記の構成によれば、第1候補の文字列がキー
ワード情報の文字列と一致しない場合に、第2候補以降
の文字列からキーワード情報と一致する文字が検索され
て第1候補と入替えられる。したがって、キーワードを
用いたデータ種類の判別に際し、第1候補に正しい認識
結果が存在しない場合であっても、その判別を行うこと
ができる。また、候補入替え後の第1候補の文字列はキ
ーワード情報の文字列と同じであるため、これを正しい
認識結果として出力することができる。
【0012】また、予め登録されたキーワード情報とは
別の任意のキーワード情報を加えて、上述したように候
補入替え処理を行うことができる。したがって、難解な
文字列であっても、その文字列に対応するキーワード辞
書を登録しておけば、データ種類を判別することができ
る。
【0013】また、上記の構成によれば、認識結果を訂
正すると、その訂正内容が学習される。したがって、以
後の認識処理で同様な認識結果が得られた場合に、学習
した訂正内容に従って簡単に訂正することができる。
【0014】
【実施例】以下、図面を参照して本発明の実施例を説明
する。図1は名刺管理システムの構成を示すブロック図
である。名刺管理システムは、ホスト装置10と文字認
識装置20とからなり、文字認識装置20で読取った名
刺のデータをホスト装置10で管理するように構成され
ている。ホスト装置10と文字認識装置20はケーブル
30で電気的に接続されている。名刺には、会社名、氏
名、住所、電話番号、FAX番号といった項目がある。
文字認識装置20では、名刺に記入された各種の文字列
を上記各項目毎に分類して認識し、その認識結果をホス
ト装置20に出力している。
【0015】ホスト装置10は、CPU11、フロッピ
ーディスク装置(以下、FDDと称す)12、RAM1
3、キーボード14、表示装置15を有する。CPU1
1は、ホスト装置10側での名刺管理制御を行う。FD
D12は、データベース(ここでは、複数の名刺デー
タ)を保存するための記憶装置である。RAM13は、
ホスト装置10側での作業に必要な各種のデータを格納
する。キーボード14は、文字等のデータを入力するた
めの入力装置である。表示装置15は、文字等のデータ
を表示するためのものであり、例えばCRT(Cathode R
ay Tube)表示装置あるいはLCD(Liquid Crystal Disp
lay)装置からなる。
【0016】文字認識装置20は、CPU21、RAM
22、システムROM23、イメージスキャナ24、文
字認識部25を有する。CPU21は、文字認識装置2
0側での名刺読取・認識制御を行うものであり、ここで
は文字認識処理の他、候補入替え処理、キーワード登録
処理、学習処理等を実行する。
【0017】システムROM23は、図2に示すよう
に、名刺読取・認識制御プログラムを格納するためのプ
ログラム領域23a、データ種類を判別するために必要
なキーワード辞書および姓名辞書を格納するための辞書
領域23bを有する。キーワード辞書および姓名辞書に
ついては、図4および図5を参照して後に説明する。
【0018】RAM22は、文字認識装置20側での作
業に必要な各種のデータを格納するメモリであって、こ
こでは図3に示すように、複数の候補からなる認識結果
を格納するための認識結果領域22a、認識結果の訂正
情報を格納するための訂正情報領域22b、ユーザ辞書
を格納するためのユーザ辞書領域22cを有する。ユー
ザ辞書は、ユーザが新規に登録する辞書であって、ここ
ではキーワード辞書と姓名辞書がある。
【0019】イメージスキャナ24は、用紙に書かれて
いる文字や図形等をイメージデータとして読取るための
画像入力装置であり、ここでは名刺のイメージデータを
読取るために用いられる。文字認識部25は、文字を認
識するための装置であり、ここではイメージスキャナ2
4を通じて入力された名刺のイメージデータから名刺に
記入された各種の文字列(会社名、氏名、住所、電話番
号、FAX番号等)を認識する。
【0020】図4はキーワード辞書の構成を示す図であ
る。キーワード辞書は、名刺に記入された文字列のデー
タ種類を判別するためのものであり、キーワードとなる
文字列と、その属性が設定されている。図4の例では、
「株式会社」というキーワード文字列に「会社名」とい
う属性が設定されている。同様に、「東京都」というキ
ーワード文字列に「住所」、「TEL」というキーワー
ド文字列に「電話番号」、「FAX」というキーワード
文字列に「FAX番号」という属性が設定されている。
システムROM23の辞書領域23bには、装置製造時
に作成されたキーワード辞書が格納されている。RAM
22のユーザ辞書領域22cには、ユーザによって任意
に作成されたキーワード辞書が格納されている。
【0021】図5は姓名辞書の構成を示す図である。姓
名辞書は、氏名(姓名)とその読みとを対応させた辞書
であり、同一氏名に対し、複数の読みがある場合には、
所定の優先順位を持って各読みが登録されている。図5
の例では、「東」という氏名に対しては、「ひがし」,
「あずま」,「あづま」という3つの読みが優先順位を
示す情報(括弧内の数字で示す)と共に登録されてい
る。この優先順位は、その読みの使用頻度によって予め
決められている。システムROM23の辞書領域23b
には、装置製造時に作成された姓名辞書が格納されてい
る。RAM22のユーザ辞書領域22cには、ユーザに
よって任意に作成された姓名辞書が格納されている。
【0022】次に、同実施例に動作を説明する。本発明
において、文字認識装置20には、(a)候補入替え機
能、(b)キーワード登録機能、(c)学習機能といっ
た3つの特定の機能が設けられている。以下、これらの
機能の動作について説明する。
【0023】(a)候補入替え機能 候補入替え機能とは、キーワードを用いたデータ種類の
判別に際し、認識結果として得られた第1候補の文字列
とキーワードの文字列とのマッチングが取れなかった場
合において、一致しない文字を第2候補以降の文字列か
ら探し出し、その文字を第1候補と入替える機能であ
る。
【0024】具体的に説明すると、例えば「株式会社」
というキーワードがキーワード辞書に登録されていた場
合において、図6(a)に示すような認識結果に対し、
キーワードの文字列に合わせて、第1候補の「林」と第
2候補の「株」とを入替ることである。これにより、同
図(b)に示すように、「株式会社」という文字列を第
1候補で得ることができ、そのデータ種類を当該キーワ
ードの属性から「会社名」と正しく判断することができ
る。また、このとき得られる第1候補の文字列はキーワ
ードの文字列と同じであるため、正しい認識結果として
出力することができる。
【0025】図7は候補入替え機能の処理動作を示すフ
ローチャートである。文字認識装置20において、CP
U21は認識結果として得られた第1候補の文字列とキ
ーワードの文字列とを比較する(ステップA1)。な
お、認識結果は図3に示すRAM22の認識結果領域2
2aに格納されている。また、キーワードは図2に示す
システムROM23の辞書領域23bに格納されてい
る。
【0026】ここで、第1候補の文字列とキーワードの
文字列とが一致しなかった場合(ステップA2のN
o)、CPU21はRAM22の認識結果領域22aを
アクセスし、不一致の文字を第2候補以降の文字列から
探し出す(ステップA3)。その結果、該当する文字が
あった場合には(ステップA4のYes)、CPU21
はその文字を第1候補の文字と入替える(ステップA
5)。
【0027】このように、キーワードに基づいて認識結
果を修正することで、常に正しい認識結果を第1候補と
して出力することができ、また、そのデータ種類を正し
く判別することができる。
【0028】(b)キーワード登録機能 キーワード登録機能とは、予め登録されたキーワードと
は別の任意のキーワードをキーワード辞書に登録する機
能である。ここでは、予め登録されたキーワードは図2
に示すシステムROM23の辞書領域23bに格納され
ており、キーワード登録機能により新規に登録されたキ
ーワードは図3に示すRAM22のユーザ辞書領域22
cに格納されるようになっている。
【0029】図8はキーワード登録機能の処理動作を示
すフローチャートである。ホスト装置10側において、
キーボード14上の特定のキー操作により、キーワード
登録機能を指示すると、図8に示すようなキーワード登
録画面が表示装置15に表示される。このキーワード登
録画面において、キーワードとなる文字列を入力すると
共に(ステップB2)、そのデータ種類を予め用意され
た項目の中から選択する(ステップB3)。このキーワ
ード文字列およびデータ種類は、ケーブル30を介して
文字認識装置20に与えられ、同装置20内におけるC
PU21の制御の下で、RAM22のユーザ辞書領域2
2cに格納される。
【0030】このように、予め登録されたキーワードと
は別の任意のキーワードを登録することができる。以
後、この新規登録されたキーワードを含めて、上述した
ような候補入替え処理等が行われる。したがって、珍し
い役職名など、難解な文字列が記入された名刺の読取り
に際し、その文字列に対応するキーワードを新規に登録
しておけば、データ種類を正しく判別することができ
る。
【0031】(c)学習機能 学習機能とは、認識結果を訂正した場合に、その訂正内
容を学習し、以後の認識処理に反映させる機能である。
【0032】具体的に説明すると、例えば「東京」とい
う文字列の認識において、図10(a)に示すような認
識結果に対し、第1候補の「束」と第3候補の「東」と
を入替えて訂正した際、その訂正内容を学習(記憶)し
ておき、以後の認識処理で同様なケースがあった場合
に、同図(b)に示すように訂正することである。
【0033】図11は学習機能の処理動作を示すフロー
チャートである。文字認識装置20側において、文字認
識部25を通じて文字認識した結果を訂正した場合(ス
テップC1のYes)、CPU21はそのときの訂正内
容を図2に示すRAM22の訂正情報領域22bに格納
しておく(ステップC2)。
【0034】次の文字認識処理において(ステップC
3)、CPU21は認識結果をRAM22の認識結果領
域22aに一時格納し(ステップC4)、その認識結果
が前回と同じケースであれば(ステップC5のYe
s)、CPU21は訂正情報領域22bから該当する訂
正情報を読出し、同情報に基づいて今回の認識結果を訂
正する(ステップC6)。なお、認識結果が前回と同じ
ケースとは、認識結果として得られる各候補の文字が前
回の認識処理で得られた各候補の文字と共通しているこ
とを示す。
【0035】このように、訂正内容を学習しておくこと
で、同じケースの認識結果が出現した場合には、面倒な
作業を必要とせずに、簡単に訂正することができる。次
に、上述した(a)〜(c)の各機能を用いて、名刺に
記入された文字列を読取る場合の動作について説明す
る。
【0036】図12は同実施例の名刺読取り処理の動作
を示すフローチャートである。まず、文字認識装置20
側において、イメージスキャナ24を通じて名刺のイメ
ージデータを読取る(ステップD1)。この場合、イメ
ージスキャナ24では、名刺の読取り面に光を当て、そ
の反射光をCCD(Charge Coupled Device) などでディ
ジタル信号に変換してイメージデータを生成する。
【0037】文字認識部25では、この名刺イメージデ
ータの中から名刺に記入された各種の文字列(会社名、
氏名、住所、電話番号、FAX番号等)を認識し、その
認識結果をCPU21の制御の下で、RAM22の認識
結果領域22aに格納する(ステップD2)。なお、文
字認識の方法としては、OCR(Optical CharacterRea
der) などで一般的に用いられている方法を用いるもの
とし、ここではその説明を省略する。
【0038】ここで、「株式会社東京青梅工場」という
文字列を認識した際に、図13(a)に示すような認識
結果が得られた場合を想定して、以下の動作を説明す
る。なお、RAM22の訂正情報領域22bには、既に
「束京」を「東京」に訂正するための訂正情報が格納さ
れているものとする。
【0039】認識結果が得られると、CPU21は、ま
ず、学習機能を実行し、訂正情報領域22bに格納され
た訂正情報に従って訂正可能な認識文字があれば、訂正
を施す(ステップD3)。この場合、図13(a)に示
すように、第1候補の文字列の第5文字目に「束」があ
り、第3候補の文字列の第5文字目に「東」があるた
め、訂正情報に従って、両者の文字を図13(b)に示
すように入替える。
【0040】次に、CPU21は、キーワード検索を実
行し、認識結果として得られる第1候補の文字列の中で
キーワード辞書に登録されたキーワードと一致する文字
を検索する(ステップD4)。この場合、図4に示すよ
うに「株式会社(属性=会社)」というキーワードがキ
ーワード辞書に登録されており、第1候補の文字列で
は、第3文字目の「合」以外はキーワードと一致する。
【0041】次に、CPU21は、候補入替え機能を実
行し、第1候補の文字列の中でキーワードと一致しなか
った文字を第2候補以降の文字列の中から探し出して、
第1候補と入替える(ステップD5)。この場合、第2
候補の文字列の第3文字目に「会」があるため、図13
(c)に示すように、この第2候補の「会」と第1候補
の「合」とを入替える。
【0042】このようにして、キーワードと一致する第
1候補の文字列が得られると、CPU21は当該キーワ
ードの持つ属性からデータ種類を判断する(ステップD
6)。この場合、図4に示すように、キーワード「株式
会社」の属性は「会社」であるため、第1候補として得
られた「株式会社東京青梅士場」は会社名であると判断
される。
【0043】次に、CPU21は、訂正機能を実行し、
ユーザによって指示された箇所の訂正を行う(ステップ
D7)。この場合、現段階では、図13(c)に示すよ
うに、第1候補の文字列は「株式会社東京青梅士場」で
あり、第9文字目の「士」に誤りがある。第2候補の文
字列の第9文字目の「工」があるため、この「工」と第
1候補の「士」とを入替えるような訂正を行う。また、
CPU21は、このときの訂正情報をRAM22の訂正
情報領域22bに格納しておき、以後の認識処理に備え
る。この場合には、図14(b)に示すように、「士」
と「工」を入替えて、「士場」を「工場」に訂正した旨
の情報が格納される。
【0044】このようにして、CPU21は、キーワー
ドに基づいてデータ種類を判別し、最終的な認識結果を
得ると、それらの情報をホスト装置10に転送する(ス
テップD8)。この場合、データ種類として「会社
名」、認識結果の第1候補として「株式会社東京青梅工
場」が出力されることになる。したがって、ホスト装置
10側において、ユーザ自身が認識データの項目を判断
して分類する必要がなく、また、認識データを訂正する
必要もない。これにより、データ種類の判別率および認
識率を向上させて、ユーザの負担を軽減することができ
る。
【0045】なお、名刺の「氏名」に関しては、図5に
示す姓名辞書に登録された氏名の文字列をキーワードと
して用いることにより、上記同様の処理を行うことがで
きる。
【0046】また、読取り対象は名刺に限らず、例えば
帳票など、各種のデータが記入された用紙であれば、そ
の用紙を読取り対象として、上記同様の処理を行うこと
ができる。
【0047】
【発明の効果】以上のように本発明によれば、第1候補
の文字列がキーワード情報の文字列と一致しない場合
に、第2候補以降の文字列からキーワード情報と一致す
る文字を検索して第1候補と入替えるようにしたため、
キーワードを用いたデータ種類の判別に際し、第1候補
に正しい認識結果が存在しない場合であっても、その判
別を行うことができる。この場合、候補入替え後の第1
候補の文字列はキーワード情報の文字列と同じであるた
め、これを正しい認識結果として出力することができ
る。
【0048】また、予め登録されたキーワード情報とは
別の任意のキーワード情報を加えて、上述したように候
補入替え処理を行うことができため、難解な文字列であ
っても、その文字列に対応するキーワード辞書を登録し
ておけば、データ種類を判別することができる。
【0049】また、認識結果の訂正内容を学習しておく
ことで、以後の認識処理で同様な認識結果が得られた場
合に、学習した訂正内容に従って簡単に訂正することが
できる。
【0050】これにより、データ種類の判別率および認
識率を向上させることができ、例えば名刺管理システム
において、複数の名刺を読取る場合に、ユーザ自身が認
識データを訂正したり、その項目を判断して分類する必
要がなくなり、ユーザの負担を軽減することができるも
のである。
【図面の簡単な説明】
【図1】本発明の一実施例に係る装置構成を示すブロッ
ク図。
【図2】図1に示される文字認識装置内のROMの構成
を示す図。
【図3】図1に示される文字認識装置内のRAMの構成
を示す図。
【図4】上記ROMに設けられたキーワード辞書の構成
を示す図。
【図5】上記ROMに設けられた姓名辞書の構成を示す
図。
【図6】本発明の候補入替え機能を説明するための図。
【図7】上記候補入替え機能の処理動作を示すフローチ
ャート。
【図8】本発明のキーワード登録機能の処理動作を示す
フローチャート。
【図9】上記キーワード登録機能で表示されるキーワー
ド登録画面を示す図。
【図10】本発明の学習機能を説明するための図。
【図11】上記学習機能の処理動作を示すフローチャー
ト。
【図12】上記各機能を用いた名刺読取り処理の動作を
説明するためのフローチャート。
【図13】上記名刺読取り処理時での認識結果の状態を
示す図。
【図14】上記名刺読取り処理時での訂正情報の状態を
示す図。
【符号の説明】
10…ホスト装置、11…CPU、12…FDD、13
…RAM、14…キーボード、15…表示装置、20…
文字認識装置、21…CPU、22…RAM、22a…
認識結果領域、22b…訂正情報領域、22c…ユーザ
辞書領域、23…システムROM、23a…プログラム
領域、23b…辞書領域、24…イメージスキャナ、2
5…文字認識部、30…ケーブル。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 読取り対象を文字認識し、その認識結果
    として複数の候補を出力する文字認識手段と、 データ種類を判別するためのキーワード情報を記憶した
    キーワード記憶手段と、 このキーワード記憶手段に記憶された上記キーワード情
    報の文字列と上記文字認識手段から認識結果として得ら
    れる第1候補の文字列とを比較する比較手段と、 この比較手段の結果、上記第1候補の文字列の中に上記
    キーワード情報の文字列と一致しない文字が存在する場
    合に、当該文字を第2候補以降の文字列の中から探し出
    し、上記第1候補と入替える候補入替え手段とを具備し
    たことを特徴とする文字認識装置。
  2. 【請求項2】 上記キーワード記憶手段に予め登録され
    たキーワード情報とは別の任意のキーワード情報を登録
    するキーワード登録手段を具備したことを特徴とする請
    求項1記載の文字認識装置。
  3. 【請求項3】 読取り対象を文字認識し、その認識結果
    を出力する文字認識手段と、 この文字認識手段から得られる認識結果を訂正する訂正
    手段と、 この訂正手段の訂正情報を記憶する訂正情報記憶手段
    と、 この訂正内容記憶手段に記憶された上記訂正情報に基づ
    いて、以後の上記文字認識手段から得られる認識結果を
    訂正する学習手段とを具備したことを特徴とする文字認
    識装置。
  4. 【請求項4】 読取り対象を文字認識し、その認識結果
    として複数の候補を得、 予め登録されたデータ種類判別用のキーワード情報の文
    字列と上記認識結果として得られる第1候補の文字列と
    を比較し、 この比較の結果、上記第1候補の文字列の中に上記キー
    ワード情報の文字列と一致しない文字が存在する場合
    に、当該文字を第2候補以降の文字列の中から探し出
    し、上記第1候補と入替えるようにしたことを特徴とす
    る文字認識方法。
  5. 【請求項5】 読取り対象を文字認識し、その認識結果
    として複数の候補を得、 予め登録されたデータ種類判別用のキーワード情報に同
    情報とは別の任意のキーワード情報を加え、 そのキーワード情報の文字列と上記認識結果として得ら
    れる第1候補の文字列とを比較し、 この比較の結果、上記第1候補の文字列の中に上記キー
    ワード情報の文字列と一致しない文字が存在する場合
    に、当該文字を第2候補以降の文字列の中から探し出
    し、上記第1候補と入替えるようにしたことを特徴とす
    る文字認識方法。
  6. 【請求項6】 読取り対象の文字認識結果を訂正した際
    に、 その訂正内容を学習し、 以後の認識処理で得られる認識結果を上記学習した内容
    に従って訂正するようにしたことを特徴とする文字認識
    方法。
JP6020983A 1994-02-18 1994-02-18 文字認識装置及び文字認識方法 Pending JPH07230531A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6020983A JPH07230531A (ja) 1994-02-18 1994-02-18 文字認識装置及び文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6020983A JPH07230531A (ja) 1994-02-18 1994-02-18 文字認識装置及び文字認識方法

Publications (1)

Publication Number Publication Date
JPH07230531A true JPH07230531A (ja) 1995-08-29

Family

ID=12042396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6020983A Pending JPH07230531A (ja) 1994-02-18 1994-02-18 文字認識装置及び文字認識方法

Country Status (1)

Country Link
JP (1) JPH07230531A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013069150A (ja) * 2011-09-22 2013-04-18 Toshiba Corp 文字入力装置、文字入力方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013069150A (ja) * 2011-09-22 2013-04-18 Toshiba Corp 文字入力装置、文字入力方法

Similar Documents

Publication Publication Date Title
US5251273A (en) Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms
US5235654A (en) Advanced data capture architecture data processing system and method for scanned images of document forms
US7081975B2 (en) Information input device
US10552674B2 (en) Computer, document identification method, and system
US5305396A (en) Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms
US8064703B2 (en) Property record document data validation systems and methods
KR100627195B1 (ko) 광학문자인식으로 생성된 전자문서 검색방법 및 그 시스템
JP7029813B2 (ja) 辞書作成装置、辞書作成方法及び辞書作成プログラム
US20070217691A1 (en) Property record document title determination systems and methods
JPH11232296A (ja) 文書ファイリングシステムおよび文書ファイリング方法
JPH07230531A (ja) 文字認識装置及び文字認識方法
JP4054453B2 (ja) 文字認識装置およびプログラム記録媒体
JP2932667B2 (ja) 情報の検索方法および情報蓄積装置
JPH1063813A (ja) イメージ文書管理方法及びその装置
JP2000132635A (ja) 認識データ確認方法
JP3210842B2 (ja) 情報処理装置
JP3924899B2 (ja) テキスト検索装置およびテキスト検索方法
JPH07230530A (ja) 文字認識装置及び読み推定方法
JPH05210635A (ja) 入力装置
CN117009998A (zh) 一种数据检验方法及系统
JPH10154157A (ja) 電子ファイリングシステム
JPH05120471A (ja) 文字認識装置
JPH0863487A (ja) 文書検索方法及び文書検索装置
JP2002123815A (ja) ファイリング装置
JPH11232381A (ja) 文字読取装置