JP2003108918A - 文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法 - Google Patents

文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法

Info

Publication number
JP2003108918A
JP2003108918A JP2001375018A JP2001375018A JP2003108918A JP 2003108918 A JP2003108918 A JP 2003108918A JP 2001375018 A JP2001375018 A JP 2001375018A JP 2001375018 A JP2001375018 A JP 2001375018A JP 2003108918 A JP2003108918 A JP 2003108918A
Authority
JP
Japan
Prior art keywords
character
paper sheet
reading
recognizing
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001375018A
Other languages
English (en)
Other versions
JP2003108918A5 (ja
Inventor
Yoshihiro Nakazawa
吉裕 中澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001375018A priority Critical patent/JP2003108918A/ja
Publication of JP2003108918A publication Critical patent/JP2003108918A/ja
Publication of JP2003108918A5 publication Critical patent/JP2003108918A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 この発明は、文字認識処理の性能によらず
に、誤りやすい文字を正しく変換する確率を向上させる
ことができる。 【解決手段】 この発明は、予め誤りやすい文字をデー
タベースに登録しておき、文字認識処理の認識結果とし
て得られた文字データに対して、文字列の文字数、文字
列中の文字位置、あるいは前後の文字の文字種等に基づ
いて誤認識の可能性が高い文字を判断し、前記データベ
ースの登録内容に従って誤認識の可能性が高い文字を変
換するようにしたものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、例えば、申請書
の画像を読取り、この読取った画像に対して文字認識処
理を行うことにより前記申請書の記載データを文字認識
し、文字認識結果を参照しつつ記載データの入力作業を
行う文字認識装置、データ入力装置、文字認識方法、及
びデータ入力方法に関する。
【0002】
【従来の技術】従来、データ入力装置では、例えば、申
請書の画像を読取り、この読取った画像に対してOCR
(オプティカルキャラクターリーダ)処理を行うことに
より記載データを文字認識して、記載データの入力作業
を効率化させている。このようなデータ入力装置では、
OCRで読み取ったデータは、そのまま表示部に表示す
るようになっている。
【0003】しかしながら、このようなデータ入力装置
では、カタカナの「エ」「ー」「ロ」と漢字の「工」
「一」「口」のように、OCRが誤認識した結果を操作
者も気づかずにそのまま確定してしまい易い文字があ
る。このような文字を操作者が誤ってそのまま確定して
しまうことによって正しく入力されず、事後にデータを
利用する際に字が異なる、検索できないといった問題が
起こる可能性がある。
【0004】また,建物名や組織名ではカタカナと漢字
を併用した名称が多く、また、最近、外国人との婚姻等
により、氏名にミドルネームのようにカタカナを用いる
例が増えてきている。そのため上記のような誤入力が増
加している。
【0005】
【発明が解決しようとする課題】この発明は、上記した
ような問題点を解決するもので、文字認識処理で誤認識
しすく、操作者も確認しにくいような文字の認識精度を
向上させた文字認識装置及び文字認識方法を提供するこ
とを目的とする。また、誤認識された文字を操作者が発
見し易いデータ入力装置及びデータ入力方法を提供する
ことを目的とする。
【0006】
【課題を解決するための手段】この発明の文字認識装置
は、紙葉類に記載されている文字を認識するものにおい
て、文字が記載されている紙葉類の画像を読取る読取手
段と、この読取手段により読取った紙葉類の画像により
紙葉類に記載されている文字を認識処理する文字認識手
段と、この文字認識手段により認識した文字に予め設定
されている類似文字が存在する場合、当該文字の文字種
と当該文字以外の文字の文字種とに基づいて当該文字を
変換処理する類似文字変換手段とを有する。
【0007】この発明のデータ入力装置は、紙葉類に記
載されている記載データを入力するものにおいて、入力
すべきデータが記載されている紙葉類の画像を読取る読
取手段と、この読取手段により読取った紙葉類の画像に
より当該紙葉類に記載されている文字を認識処理する文
字認識手段と、この文字認識手段により認識した各文字
を文字種ごとに異なる色で表示する表示手段と、この表
示手段により表示された各文字の修正あるいは確定を行
う操作手段と、この操作手段により確定された各文字を
記憶する記憶手段とを有する。
【0008】この発明の文字認識方法は、紙葉類に記載
されている文字を認識する方法において、文字が記載さ
れている紙葉類の画像を読取る読取工程と、この読取工
程により読取った紙葉類の画像により紙葉類に記載され
ている文字を認識処理する文字認識工程と、この文字認
識工程により認識した文字に予め設定されている類似文
字が存在する場合、当該文字の文字種と当該文字以外の
文字の文字種とに基づいて当該文字を変換処理する類似
文字変換工程とを有する。
【0009】この発明のデータ入力方法は、紙葉類に記
載されている記載データを入力する方法において、入力
すべきデータが記載されている紙葉類の画像を読取る読
取工程と、この読取工程により読取った紙葉類の画像に
より当該紙葉類に記載されている文字を認識処理する文
字認識工程と、この文字認識工程により認識した各文字
を文字種ごとに異なる色で表示する表示工程と、この表
示工程により表示された各文字の修正あるいは確定を行
う操作工程と、この操作工程により確定された各文字を
記憶する記憶工程とを有する。
【0010】
【発明の実施の形態】以下、この発明の実施の形態につ
いて図面を参照して説明する。図1は、この発明のID
カード作成システムの全体を示し、図2は、IDカード
作成システムの概略ブロック構成を示している。すなわ
ち、このIDカード作成システムは、ホストコンピュー
タ1とカード作成機2とを有し、ホストコンピュータ1
とカード作成機2とは通信回線としてのLAN3により
接続されている。上記ホストコンピュータ1とカード作
成機2にはそれぞれオペレータが配置されるようになっ
ている。このIDカード作成システムでは、申請者から
の申請書Sの画像を読取ってOCR処理により文字認識
し、この認識結果をオペレータが確認あるいは訂正する
ことにより記載データ(属性、姓、名、組織名、住所
等)を入力するようになっている。この入力された記載
データは、データベースに登録(あるいは更新)され
る。このデータベースに登録された記載データは、申請
者の顔画像(顔写真)とともにカード券面に印刷され、
IDカードが作成される。
【0011】上記ホストコンピュータ1は、図2に示す
ように、キーボード10、表示部11、データベース
(DB) 12、読取部13、インターフェース14、
及び制御部15を有している。上記キーボード10は、
申請書Sに手書きされている申請内容としての記載デー
タを入力する。上記表示部11は、入力内容を表示す
る。上記データベース12は、入力された記載データが
登録される。このデータベース12には、後述する類似
候補文字データベース12a及び氏名住所データベース
12bを有している。
【0012】上記読取部13は申請書Sの画像を光学的
に読取るものである。上記インターフェース14は、L
AN3を介してカード作成機2との通信を行うものであ
る。上記制御部15は、パーソナルコンピュータにより
構成され、ホストコンピュータ1全体を制御するもので
ある。この制御部15は、上記読取部13により読取っ
た申請書の画像から文字を認識する機能を有している。
【0013】上記カード作成機2は、図2に示すよう
に、撮像部21、記憶部23、操作部24、印刷部2
5、インターフェース26、及び制御部27などを有し
ている。上記撮像部21は、IDカードを作成する申請
者の顔画像(顔写真)を撮像する。上記記憶部23は、
上記撮像部21で撮像した顔画像を記憶する。上記操作
部24は、発行の指示等を行う。
【0014】上記印刷部25は、IDカードを印刷発行
するものである。上記インターフェース26は、上記L
AN3を介して上記ホストコンピュータ1との通信を行
うものである。上記制御部27は、カード作成機全体の
制御を司る。上記制御部27は、ホストコンピュータ1
から申請者の記載データを取得し、この取得した申請者
の記載データと上記撮影機21で撮影した申請者の顔画
像とをカード券面に印刷することによりIDカードを作
成するようになっている。
【0015】次に、上記のように構成されるIDカード
作成システムにおける申請書の記載データの入力作業に
ついて概略的に説明する。まず、操作者は、申請書Sを
上記読取部13の読取り位置にセットする。上記読取部
13は、申請書Sから読取った画像データを制御部15
に送信する。上記制御部15は、内蔵しているOCR機
能により上記申請書から読取った画像に対して文字認識
処理を行う。この際、上記制御部15が有するOCR機
能は、特に、手書き文字を認識する機能が適しているよ
うに設定されている。また、OCR機能は、読取部13
に内蔵されていてもかまわない。その場合、読取り画像
ではなく文字データが制御部15に送られるようにな
る。
【0016】文字認識の結果としての文字データが得ら
れると、制御部15は、文字データを類似候補文字DB
を参照しつつ後述する変換規則にて変換し、表示部11
上に表示する。例えば、文字種(漢字・カタカナ・ひら
がな・アルファベット等)が異なる場合、表示部11に
は、予め文字種ごとに定義されている色で表示される。
操作者は、表示部11に表示されたOCRによる認識結
果を確認あるいは修正してデータを確定する。確定され
たデータは、データベース(メインDB)12に蓄積さ
れる。
【0017】図2は、類似候補文字データベース12a
の構成例を示す図である。ここで、類似候補文字とは、
「エ」、「ー」、「ロ」のようにOCRが誤認識した結
果を操作者がそのまま確定してしまい易い文字であり、
予め類似候補文字として登録される文字である。図2に
示すように、類似候補文字DB12aは、類似候補文字
番号、カタカナ、漢字、ひらがな等が対応して登録され
ている。上記類似候補文字番号は、該当する類似候補に
固有な番号である。漢字・カタカナ・ひらがなは、それ
ぞれの類似候補文字の文字種である。例えば、カタカナ
の「エ」、「オ」、「カ」、「チ」には、それぞれ、漢
字の「工」、「才」、「力」、「千」などが類似候補文
字として登録されており、カタカナの「ヘ」、「リ」に
は、それぞれ、ひらがなの「へ」、「り」などが類似候
補文字として登録されている。この類似候補文字DB1
2aに登録される類似候補文字は、追加・削除が可能で
あるものとする。
【0018】図3は、氏名住所データベース12bの構
成例を示す図である。図3に示すように、氏名住所デー
タベース12bは、番号、属性、姓、名、組織名、住所
などが登録される。上記番号は、システムが付加する
か、または、申請書Sに人手で書き込んで管理する固有
の数字である。上記属性、姓、名、組織名、及び住所
は、申請書Sに書き込まれる各項目であり、これらの各
項目は、申請書Sの記載データとしてOCR処理が行わ
れる項目である。これらの項目は、作成するIDカード
の運用等に応じて変更可能なものである。この氏名住所
データベース12bは、例えば、公共機関、民間企業等
の申請業務あるいは申し込み業務等で使用されるものを
想定するものとする。
【0019】次に、このIDカード作成システムにおけ
る申請書Sの記載データの入力(登録)処理について説
明する。図4は、申請書Sの記載データの入力処理の流
れのフローチャートである。まず、操作者は申請者から
記入済みの申請書Sを受取る。すると、操作者は申請者
から受取った申請書Sの画像を読取部13により読み取
る(ST1)。この読取部13にて読取った申請書Sの
画像は、制御部15へ送られる。制御部15は、OCR
機能により前記申請書Sの読取画像に対する文字認識処
理を行う(ST2)。この文字認識処理により申請書S
の記載データが文字データ化される。
【0020】次に、制御部15は、文字認識処理により
得られた文字データに対する類似文字処理(類似文字変
換手段)を行う。まず、制御部15は、文字認識処理に
より得られた各文字列の先頭文字(あるいは単独の1文
字)に対して先頭文字長音処理を行う(ST3)。この
先頭文字長音処理は、各文字列の先頭文字がカタカナの
「ー(長音)」の場合、この先頭文字を漢字の「一(い
ち)」に置き換える処理である。これは、文字列の先頭
には、カタカナの長音は、通常有り得ないため、カタカ
ナの「ー(長音)」に対する類似候補文字として類似候
補文字データベース12aに登録されている漢字の「一
(いち)」に変換するものである。
【0021】次に、制御部15は、各文字列の文字数
(文字長)に応じた類似文字処理を行う(ST4)。こ
の時、文字長が1文字だけである場合にはステップ9へ
進む。前記文字認識処理により得られた文字列が2文字
の場合(ST4、2文字)、制御部15は、2文字の場
合の類似文字処理(2文字処理)を行う(ST8)。こ
の2文字処理は、当該文字列の各文字の文字種が異な
り、かつ、2文字のうち何れか一方の文字に類似候補文
字が存在する場合に、類似候補文字でない方の文字の文
字種に合わせるように、前記類似候補文字の文字を類似
候補文字データベース12aに従って変換するものであ
る。つまり、当該文字列の各文字の文字種が「カタカ
ナ」+「ひらがな」、「カタカナ」+「漢字」、「ひら
がな」+「漢字」というように異なる場合に、当該文字
列の2文字とも、類似候補文字が存在しない文字の文字
種にする処理である。この2文字処理が終了すると、ス
テップS9へ進む。
【0022】また、文字長が3文字以上の場合(ST
5)、制御部15は、3文字以上の文字列に対する処理
として先頭処理(ST6)、中間処理(ST7)、末尾
処理(ST8)を順次行う。まず、前記先頭処理(ST
6)は、文字列の先頭文字が類似候補文字で、かつ2文
字目及び3文字目と文字種が異なり、その上、2文字目
と3文字目が同じ文字種である場合に、先頭文字を2文
字目及び3文字目と同じ文字種に変換する処理である。
つまり、先頭文字が2文字目の文字の文字種と異なる可
能性は低いので、類似候補文字である先頭文字の文字種
を2文字目と3文字目の文字種に合わせるようにするも
のである。
【0023】前記中間処理(ST7)は、文字列中の先
頭でも末尾でもない文字(中間に位置する文字)につい
て、当該文字が類似候補文字であり、かつ、その前後の
文字の文字種が当該文字の文字種と異なり、その上、前
後の文字どうしが同じ文字種である場合、当該文字を前
後の文字と同じ文字種に変換する処理である。つまり、
文字列中に1文字だけ前後の文字の文字種と異なる文字
種の文字が混在する可能性は低いので、文字列中に前後
の文字の文字種と異なる文字種の類似候補文字が存在す
る場合、前後の文字種と合わせるように当該文字を変換
するようにしたものである。
【0024】前記末尾処理(ST8)は、文字列の末尾
文字が類似候補文字で、かつ、末尾から2文字目及び3
文字目と文字種が異なり、その上、末尾から2文字目と
3文字目とが同じ文字種である場合、末尾文字を末尾か
ら2文字目及び3文字目と同じ文字種に変換する処理で
ある。つまり、末尾文字が末尾から2文字目の文字の文
字種と異なる可能性は低いので、類似候補文字である末
尾文字の文字種を末尾から2文字目と3文字目の文字種
に合わせるようにするものである。以上のように、3文
字以上の文字列に対する上記のような処理を終了する
と、制御部15は、類似文字処理ルーチンを抜けてステ
ップ9へ進む。
【0025】上記のような類似文字処理が終了すると、
制御部15は、文字データを文字種ごとに色を変えて表
示部11に表示する処理を行う(ST9)。すなわち、
文字認識処理により得られた文字データに対する類似文
字処理が終了すると、制御部15は、文字データにおけ
る各文字の文字種を判別し、この判別結果に基づいて各
文字を文字種ごとに異なる色で表示する。例えば、漢字
はピンク、カタカナは薄むらさき、ひらがなは水色とい
うように色を変えて、文字データを表示部11に表示す
る。この表示処理のように色の混在があると、操作者
は、文字認識処理にて誤変換があったことを容易に判断
できる。このため、上記類似文字処理でも正しく変換し
きれない文字の修正入力する際に、操作者に注意を促す
効果がある。これにより、簡単に、申請書のデータを確
実に入力することができる。
【0026】このような表示処理により表示部11に文
字データが表示されると、操作者は、キーボード10に
て文字の修正あるいは確定操作を行う(ST10)。つ
まり、操作者は、表示部11に表示された文字と申請書
Sとを見比べて、誤っている文字があれば修正を行い、
正しければ文字を確定する操作を行う。このような操作
により文字データが確定されると、制御部15は、確定
した文字データを上記氏名住所データベース12bに書
込み(ST11)、当該データについての処理を終了す
る。
【0027】なお、このような処理によりデータ入力を
行った結果、従来のシステムで操作者が誤って類似した
文字にて確定した約8割のケースについて、正しく文字
を入力できることが確認できた。また、表示画面に不自
然に色が混在している状態でデータを確定することがな
くなり確実にデータが行えることが確認できた。
【0028】上記のように、予め誤りやすい文字をデー
タベースに登録しておき、文字認識処理の認識結果とし
て得られた文字データに対して、文字列の文字数、文字
列中の文字位置、あるいは前後の文字の文字種等に基づ
いて誤認識の可能性が高い文字を判断し、前記データベ
ースの登録内容に従って誤認識の可能性が高い文字を変
換するようにしたものである。これにより、文字認識処
理の性能(例えば、1文字ごとの認識精度)によらず
に、誤りやすい文字を正しく変換する確率を向上させる
ことができる。
【0029】また、漢字、カタカナ、ひらがな、アルフ
ァベット等の文字種ごとに色を変えて表示するようにし
たため、表示内容に不自然に色が混在していることによ
って操作者が誤入力であることを容易に知ることがで
き、文字認識処理で誤認識した結果を操作者も気づかず
に、そのまま確定してしまうことを少なくすることがで
きる。
【0030】
【発明の効果】以上詳述したように、この発明によれ
ば、文字認識処理で誤認識しすく、操作者も確認しにく
いような文字の認識精度を向上させた文字認識装置及び
文字認識方法を提供できる。また、誤認識された文字を
操作者が発見し易いデータ入力装置及びデータ入力方法
を提供できる。
【図面の簡単な説明】
【図1】この発明の実施の形態に係るIDカード作成シ
ステムの概略構成を示す図。
【図2】ホストコンピュータ及びカード作成機の構成を
概略的に示すブロック図。
【図3】類似候補文字データベースの構成例を示す図。
【図4】氏名住所データベースの構成例を示す図。
【図5】文字データの入力処理の流れ説明するためのフ
ローチャート。
【符号の説明】
1…ホストコンピュータ(文字認識装置、データ入力装
置)、10…キーボード(操作手段)、11…表示部
(表示手段)、12…データベース、13…読取部(読
取手段)、15…制御部(文字認識手段、類似文字変換
手段)、12a…類似候補文字データベース、12b…
氏名住所データベース(記憶手段)

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 紙葉類に記載されている文字を認識する
    文字認識装置において、 文字が記載されている紙葉類の画像を読取る読取手段
    と、 この読取手段により読取った紙葉類の画像により紙葉類
    に記載されている文字を認識処理する文字認識手段と、 この文字認識手段により認識した文字に予め設定されて
    いる類似文字が存在する場合、当該文字の文字種と当該
    文字以外の文字の文字種とに基づいて当該文字を変換処
    理する類似文字変換手段と、 を具備したことを特徴とする文字認識装置。
  2. 【請求項2】 前記類似文字変換手段は、前記文字認識
    手段により認識した文字の各文字列で先頭となる文字が
    長音である場合に、当該文字を「一」に置き換える、こ
    とを特徴とする文字認識装置。
  3. 【請求項3】 紙葉類に記載されている文字を認識する
    文字認識装置において、 文字が記載されている紙葉類の画像を読取る読取手段
    と、 この読取手段により読取った紙葉類の画像により紙葉類
    に記載されている文字を認識処理する文字認識手段と、 この文字認識手段により認識した文字の各文字列のうち
    2文字で構成される文字列について何れかの文字に予め
    設定されている類似文字が存在し、かつ、一方の文字種
    と他方の文字種とが異なる場合、類似文字が存在しない
    方の文字の文字種に基づいて変換処理する類似文字変換
    手段と、 を具備したことを特徴とする文字認識装置。
  4. 【請求項4】 紙葉類に記載されている文字を認識する
    文字認識装置において、 文字が記載されている紙葉類の画像を読取る読取手段
    と、 この読取手段により読取った紙葉類の画像により紙葉類
    に記載されている文字を認識処理する文字認識手段と、 この文字認識手段により認識した文字の各文字列のうち
    3文字以上で構成される文字列の先頭文字に予め設定さ
    れている類似文字が存在する場合、当該文字列の2文字
    目の文字種に基づいて前記先頭文字を変換処理する類似
    文字変換手段と、 を具備したことを特徴とする文字認識装置。
  5. 【請求項5】 紙葉類に記載されている文字を認識する
    文字認識装置において、 文字が記載されている紙葉類の画像を読取る読取手段
    と、 この読取手段により読取った紙葉類の画像により紙葉類
    に記載されている文字を認識処理する文字認識手段と、 この文字認識手段により認識した文字の各文字列のうち
    3文字以上で構成される文字列の先頭でも末尾でもない
    文字に予め設定されている類似文字が存在する場合、当
    該文字の前後に存在する文字の文字種に基づいて当該文
    字を変換処理する類似文字変換手段と、 を具備したことを特徴とする文字認識装置。
  6. 【請求項6】 紙葉類に記載されている文字を認識する
    文字認識装置において、 文字が記載されている紙葉類の画像を読取る読取手段
    と、 この読取手段により読取った紙葉類の画像により紙葉類
    に記載されている文字を認識処理する文字認識手段と、 この文字認識手段により認識した文字の各文字列のうち
    3文字以上で構成される文字列の末尾文字に予め設定さ
    れている類似文字が存在する場合、当該文字列の末尾か
    ら2文字目の文字種に基づいて前記末尾文字を変換処理
    する類似文字変換手段と、 を具備したことを特徴とする文字認識装置。
  7. 【請求項7】 紙葉類に記載されている記載データを入
    力するデータ入力装置において、 入力すべきデータが記載されている紙葉類の画像を読取
    る読取手段と、 この読取手段により読取った紙葉類の画像により当該紙
    葉類に記載されている文字を認識処理する文字認識手段
    と、 この文字認識手段により認識した各文字を文字種ごとに
    異なる色で表示する表示手段と、 この表示手段により表示された各文字の修正あるいは確
    定を行う操作手段と、 この操作手段により確定された各文字を記憶する記憶手
    段と、 を具備したことを特徴とするデータ入力装置。
  8. 【請求項8】 紙葉類に記載されている文字を認識する
    文字認識方法において、 文字が記載されている紙葉類の画像を読取る読取工程
    と、 この読取工程により読取った紙葉類の画像により紙葉類
    に記載されている文字を認識処理する文字認識工程と、 この文字認識工程により認識した文字に予め設定されて
    いる類似文字が存在する場合、当該文字の文字種と当該
    文字以外の文字の文字種とに基づいて当該文字を変換処
    理する類似文字変換工程と、 を有することを特徴とする文字認識方法。
  9. 【請求項9】 前記類似文字変換工程は、前記文字認識
    工程により認識した文字の各文字列で先頭となる文字が
    長音である場合に、当該文字を「一」に置き換える、こ
    とを特徴とする文字認識方法。
  10. 【請求項10】 紙葉類に記載されている文字を認識す
    る文字認識方法において、 文字が記載されている紙葉類の画像を読取る読取工程
    と、 この読取工程により読取った紙葉類の画像により紙葉類
    に記載されている文字を認識処理する文字認識工程と、 この文字認識工程により認識した文字の各文字列のうち
    2文字で構成される文字列について何れかの文字に予め
    設定されている類似文字が存在し、かつ、一方の文字種
    と他方の文字種とが異なる場合、類似文字が存在しない
    方の文字の文字種に基づいて変換処理する類似文字変換
    工程と、 を有することを特徴とする文字認識方法。
  11. 【請求項11】 紙葉類に記載されている文字を認識す
    る文字認識方法において、 文字が記載されている紙葉類の画像を読取る読取工程
    と、 この読取工程により読取った紙葉類の画像により紙葉類
    に記載されている文字を認識処理する文字認識工程と、 この文字認識工程により認識した文字の各文字列のうち
    3文字以上で構成される文字列の先頭文字に予め設定さ
    れている類似文字が存在する場合、当該文字列の2文字
    目の文字種に基づいて前記先頭文字を変換処理する類似
    文字変換工程と、 を有することを特徴とする文字認識方法。
  12. 【請求項12】 紙葉類に記載されている文字を認識す
    る文字認識方法において、 文字が記載されている紙葉類の画像を読取る読取工程
    と、 この読取工程により読取った紙葉類の画像により紙葉類
    に記載されている文字を認識処理する文字認識工程と、 この文字認識工程により認識した文字の各文字列のうち
    3文字以上で構成される文字列の先頭でも末尾でもない
    文字に予め設定されている類似文字が存在する場合、当
    該文字の前後に存在する文字の文字種に基づいて当該文
    字を変換処理する類似文字変換工程と、 を有することを特徴とする文字認識方法。
  13. 【請求項13】 紙葉類に記載されている文字を認識す
    る文字認識方法において、 文字が記載されている紙葉類の画像を読取る読取工程
    と、 この読取工程により読取った紙葉類の画像により紙葉類
    に記載されている文字を認識処理する文字認識工程と、 この文字認識工程により認識した文字の各文字列のうち
    3文字以上で構成される文字列の末尾文字に予め設定さ
    れている類似文字が存在する場合、当該文字列の末尾か
    ら2文字目の文字種に基づいて前記末尾文字を変換処理
    する類似文字変換工程と、 を有することを特徴とする文字認識方法。
  14. 【請求項14】 紙葉類に記載されている記載データを
    入力するデータ入力方法において、 入力すべきデータが記載されている紙葉類の画像を読取
    る読取工程と、 この読取工程により読取った紙葉類の画像により当該紙
    葉類に記載されている文字を認識処理する文字認識工程
    と、 この文字認識工程により認識した各文字を文字種ごとに
    異なる色で表示する表示工程と、 この表示工程により表示された各文字の修正あるいは確
    定を行う操作工程と、 この操作工程により確定された各文字を記憶する記憶工
    程と、 を有することを特徴とするデータ入力方法。
JP2001375018A 2001-09-29 2001-09-29 文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法 Pending JP2003108918A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001375018A JP2003108918A (ja) 2001-09-29 2001-09-29 文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001375018A JP2003108918A (ja) 2001-09-29 2001-09-29 文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法

Publications (2)

Publication Number Publication Date
JP2003108918A true JP2003108918A (ja) 2003-04-11
JP2003108918A5 JP2003108918A5 (ja) 2008-09-04

Family

ID=19183471

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001375018A Pending JP2003108918A (ja) 2001-09-29 2001-09-29 文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法

Country Status (1)

Country Link
JP (1) JP2003108918A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009031846A (ja) * 2007-07-24 2009-02-12 Sansei Integrated Equipment Corp 計測装置、走行距離管理装置およびコンピュータプログラム
JP2014081867A (ja) * 2012-10-18 2014-05-08 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2015170037A (ja) * 2014-03-05 2015-09-28 株式会社東芝 住所データベース構築装置、住所データベース構築システム、および住所データベース構築方法
DE102018115158A1 (de) 2017-07-03 2019-01-17 Fanuc Corporation NC-Programm-Umwandlungseinrichtung

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342415A (ja) * 1992-06-10 1993-12-24 Nagano Nippon Denki Software Kk 類似文字判定方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05342415A (ja) * 1992-06-10 1993-12-24 Nagano Nippon Denki Software Kk 類似文字判定方式

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009031846A (ja) * 2007-07-24 2009-02-12 Sansei Integrated Equipment Corp 計測装置、走行距離管理装置およびコンピュータプログラム
JP2014081867A (ja) * 2012-10-18 2014-05-08 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2015170037A (ja) * 2014-03-05 2015-09-28 株式会社東芝 住所データベース構築装置、住所データベース構築システム、および住所データベース構築方法
DE102018115158A1 (de) 2017-07-03 2019-01-17 Fanuc Corporation NC-Programm-Umwandlungseinrichtung
US10410080B2 (en) 2017-07-03 2019-09-10 Fanuc Corporation NC-program conversion device

Similar Documents

Publication Publication Date Title
EP1365349B1 (en) Natural input recognition tool
US6917438B1 (en) Information input device
JP2003108918A (ja) 文字認識装置、データ入力装置、文字認識方法、及びデータ入力方法
JP2006127499A (ja) イメージ処理装置
JP4208566B2 (ja) 文書画像検索装置及びその方法、文書画像検索システム、プログラム
WO2022097189A1 (ja) データ処理装置、データ処理方法及びプログラム
JP7271987B2 (ja) 情報処理装置及びプログラム
JP2008242541A (ja) 電子フォーム入力システム
CN114511858A (zh) 基于ai和rpa的公文文件处理方法、装置、设备和介质
JPH10105654A (ja) 帳票用文字認識装置
JP2020135172A (ja) 情報処理装置及びプログラム
JPH0696288A (ja) 文字認識装置及び機械翻訳装置
JP3083171B2 (ja) 文字認識装置及び方法
JP4101345B2 (ja) 文字認識装置
JPH06119485A (ja) Ocr検証システム
JP2012128789A (ja) 辞書機能を備えた電子機器およびプログラム
JP3928739B2 (ja) 文書ファイリングシステム
JP4092768B2 (ja) 文字認識装置および文字認識方法
JP2986255B2 (ja) 文字認識装置
JP3929560B2 (ja) 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体
JP2024003769A (ja) 文字認識システム、コンピュータによる文字の認識方法、および文字検索システム
JPH04293185A (ja) ファイリング装置
JPH05210635A (ja) 入力装置
JP2002245470A (ja) 言語特定装置及び翻訳装置及び言語特定方法
JP2829186B2 (ja) 光学的文字読取装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080718

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100713

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101109