JPH06348889A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH06348889A
JPH06348889A JP5133121A JP13312193A JPH06348889A JP H06348889 A JPH06348889 A JP H06348889A JP 5133121 A JP5133121 A JP 5133121A JP 13312193 A JP13312193 A JP 13312193A JP H06348889 A JPH06348889 A JP H06348889A
Authority
JP
Japan
Prior art keywords
character
character string
correction
input
homonym
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5133121A
Other languages
English (en)
Inventor
Kimito Takeda
公人 武田
Etsuo Ito
悦雄 伊藤
Hideki Hirakawa
秀樹 平川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5133121A priority Critical patent/JPH06348889A/ja
Publication of JPH06348889A publication Critical patent/JPH06348889A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 従来、誤認識された文字の修正は、文字を単
位とする修正方法しか提供されおらず、単語を単位とす
るかな漢字変換方式での修正に対して考慮がされていな
かった。本発明は、単語の一部が誤認識された文字の修
正を効率良く行えることを目的とする。 【構成】 修正前の文字列と修正入力された文字列を比
較し、かな漢字変換された同音異義語の中に修正前の文
字列の一部を含む同音異義語を優先して出力する。 【効果】 従来、誤認識された文字の修正に前後の正し
い文字の情報を利用することで同音異義語の選択を減少
させることでき、同音異義語の選択誤りを大幅に軽減で
きる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識された文字コ
ードの誤り修正を効率的に行うことができる文字認識装
置に関する。
【0002】
【従来の技術】近年の文書処理の電子化に伴い、紙に印
刷された文書を読み取り、電子メディア化する文字読取
り装置が開発されている。従来の文字読取装置は、各種
文書が記載された原稿を読み取り部で読み取る。この
時、読み取り部は、原稿を文字の集まりとしてとらえる
のではなく、点の集まりからなる画像データとして読み
取る。そして、読み取った画像データから文字認識部が
任意の範囲を切り出し、認識用辞書に格納している標準
文字パターンとのパターン照合を行う。この結果、文字
認識部で照合ができれば、この文字は出力部へ出力され
ると共に記憶部に記録される。これらの処理を行うこと
により装置内で原稿上の文字がコード化される。
【0003】また、原稿の文字かすれなどにより認識文
字を一つに決められない場合は、文字認識部で曖昧性が
ある他の認識候補と合わせて出力する。このため、後処
理として、認識した文字を単語毎にまとめて、その単語
が語彙辞書に存在するか否かを判断し、存在しない場合
には曖昧性があるとして出力された他の認識候補に対し
ても語彙辞書に存在するか否かを判断している。他の認
識候補が語彙辞書に存在する場合は出力の順番を入れ替
えてオペレータに提示する。この入れ替えを行った文字
や全ての認識候補の組み合わせが語彙辞書に存在しない
場合には読み取り誤りである可能性があるとしてオペレ
ータに知らせるている。
【0004】しかし、従来の文字認識装置では、認識誤
りの可能性のある箇所をオペレータに知らせるが、オペ
レータの修正は、文字を単位とした修正しかできず、誤
りの修正作業にかかる負担が非常に大きかった。
【0005】また、同じ認識誤りが他の場所で何回か発
生している場合においても、修正した時点では判断がで
きず、同じ修正を他の場所でも繰り返す必要があり、誤
り修正の時間が増大されていた。
【0006】
【発明が解決しようとする課題】このように従来の文字
認識装置では、認識誤りの修正は文字を単位として行っ
ていたため、特に修正入力にかな漢字変換を用いている
場合は入力単位が単語なので単語の一部の文字が誤って
いる場合でも他の正しく認識されている文字を一旦削除
した後、誤って認識された文字を含む単語を入力してい
た。又、この時の修正入力は、かな漢字変換で行うの
で、新たに同音異義語の曖昧性が発生し修正誤りを発生
するなど操作する上で多くの問題点があった。
【0007】本発明はかかる事情を考慮してなされたも
ので、その目的とするところは、従来漢字単位であった
誤りの修正を単語単位で効率良く行うことのできる文字
認識装置を提供することにある。
【0008】また、同じ認識誤りが他の場所にある場合
は、修正後(例えば文字の入力以外のオペレーション)
にオペレータにその旨を知らせ、他の場所にある同じ認
識誤りは確認だけでおこなうことのできる文字認識装置
を提供することにある。
【0009】
【課題を解決するための手段】本発明による文字認識装
置は、文字を画像パターンとして入力するイメージ入力
手段と、このイメージ入力手段により入力された画像パ
ターンと予め記憶された第1の辞書の文字パターンとを
照合して、類似度が所定値以上の文字パターンの文字を
選択する文字認識手段と、この文字認識手段によって得
られた文字列の中で誤って認識された文字列をかな漢字
変換方式により修正文字を入力して修正する手段を具備
した文字認識装置において、修正前の文字列と修正入力
された文字列とを比較し、修正前の文字列の一部が修正
入力された文字列の同音異義語に含まれるとき、その同
音異義語を優先して出力する同音異義語出力制御手段を
具備することを特徴とする。
【0010】また、修正の対象となった文字列が、他の
場所にも存在するとき、オペレータに知らせるととも
に、他の場所の修正対象は確認するだけで修正ができる
ことを特徴とするものである。
【0011】
【作用】本発明によれば、認識された文字列に誤りがあ
る場合、誤まっている文字の削除をすることなく単語単
位で誤りの修正がを行うことができる。また、修正の対
象となった文字列が他の場所にも存在するとき、他の場
所の修正対象は確認するだけで修正を行うことができ
る。
【0012】
【実施例】以下、図面を参照しながら本発明の一実施例
について説明する。図1は、本発明の一実施例に係る文
字認識装置の構成を表すブロック図を示す。図1におい
て入力部1は本発明における文字認識装置の動作に必要
なコマンドを入力したり、認識結果に対する修正文字を
入力したりできるもので、キーボードやマウス、タッチ
ッパネルなどが用いられる。また、最近は音声認識を通
して認識されたコマンド、文字などを入力できる。
【0013】イメージ入力部2は、印刷、又は手書きさ
れた原稿を1枚、又は複数枚セットされた状態から紙面
のイメージを工学的に読み取る。例えばラインイメージ
センサを備えたスキャナが用いられる。なお、このスキ
ャンの解像度により認識率は大きく影響する。読み取っ
たイメージは文字認識制御部3に送られ、圧縮等の処理
を経てイメージ記憶部4に記憶される。複数の頁がセッ
トされている場合は、順に最後の頁まで読み取る。ま
た、途中でオペレータの要求で再読取りや頁の挿入等を
するときにも利用される。
【0014】文字認識制御部3は、システム全体を制御
するためのもので、実施例では、入力部1、イメージ入
力部2、イメージ記憶部4、文字認識部5、文字コード
記憶部6、文字コード編集部7、かな漢字変換部8、同
音語出力制御部9、及び表示部10を制御するようにな
っている。
【0015】イメージ記憶部4は、読み取ったイメージ
を頁単位で記憶する。文字認識部5は、読み取ったイメ
ージを文字認識する。文字認識の技術については公知の
技術であるので説明を省略する。
【0016】文字コード記憶部6は、文字認識部5で認
識された文字コードを記憶する。文字コード編集部7
は、文字認識部5で認識された文字コードを表示部10
に表示し、オペレータの指示により挿入、削除等の編集
を行う。例えば、文字認識部5で認識された文字列の中
で、曖昧な文字については検索することができる。この
とき、曖昧性のある文字列の近辺には、イメージ記憶部
4に記憶されている読み取りイメージの該当する部分を
切り出して表示する。
【0017】かな漢字変換部8は、入力部1から入力さ
れるかな文字列を漢字かな混じり文字列に変換する。同
音異義語出力制御部9は、オペレータから修正入力が行
われたとき、文字コード編集部7で修正対象の範囲が判
断され、修正前の文字列が抽出される。この修正前の文
字列と修正入力されたかな漢字変換された同音異義語を
受け取り、修正前の文字を含む同音異義語を優先して出
力されるように同音異義語の順番を入れ替える。
【0018】表示部10は入力部1より入力されたコマ
ンドや文字の表示、イメージ入力部2から入力された画
像イメージ及び文字認識部5で認識された文字列、修正
候補などを表示できるもので、通常ビットマップディス
プレイなどが使用される。なお、画面を分割して、画像
イメージと認識された文字列を同時に表示させたり、認
識文字に対応させて拡大画像イメージを表示することも
できる。
【0019】次にこのように構成した本システムの動作
を説明する。まず、図2は、本発明における文字認識装
置の全体の処理の流れを説明するための状態遷移図であ
る。
【0020】図3は文字認識装置の初期画面である。オ
ペレータは、まず、読み取る文書の名前を入力する。そ
の後、「イメージ読取り」ボタンをマウスで選択する。
この操作によって、イメージ入力部2が動作を開始する
(ステップ201)。イメージ入力部2が動作中は、図
4に示す読み取りイメージが順に画面に表示される。
【0021】イメージ読み取りが終了すると図3に戻る
(ステップ203)。初期画面に戻った状態では、次の
頁の入力や文書名を変更して別の原稿を入力することも
できる。ここでは複数頁の入力についての説明は省略す
る(ステップ202)。
【0022】イメージ入力後、その紙面の文字認識を実
行する場合は、「認識」ボタンをマウスで選択する(ス
テップ204)。本実施例の文字認識装置では、文字認
識を開始する前に原稿のレイアウトを自動で認識する。
認識したレイアウトに誤りがないかオペレータに提示す
る。図5にレイアウト認識の結果をオペレータに知らせ
る画面を示す。この画面において、誤って認識されたブ
ロックの順番は、「入れ替え」ボタンを使って変更す
る。また、「全指定」ボタンで順に認識するブロックを
指定することもできる。その他、文字認識する範囲を指
定したり、認識する必要のない部分は「削除」ボタンで
削除することもできる。例えば、入力する必要のない頁
番号、ヘッダ、フッタ等を削除したり、図形の中の文字
を認識する範囲から外すことができる。
【0023】また、本実施例では、すぐにレイアウト認
識を行う例で説明しているが、レイアウト認識する前
に、一旦読み取ったイメージの表示を行い、認識する範
囲や縦横の変換を行うようにしてもよい。特にこの縦横
の変換は日本語の原稿を読み取るときに有効となる。な
ぜならば、縦書きの原稿をスキャナにセットするとき、
どの向きにセットすれば良いか判断に迷うことが多い。
オペレータがセットした方向と機械が認識する方向がず
れているときには、この画面で確認を行い、ずれている
ときは、イメージを回転すれば認識を行うことができ、
読み直す手間を省くことができる。
【0024】読み取ったイメージが鮮明でないときに
は、「再読取り」ボタンを選択する(ステップ20
5)。この操作でイメージ入力部2から読み取った状態
(濃淡、コントラスト、原稿位置)を変更したイメージ
を再入力することができる。また、イメージの入力の段
階で抜けてしまった頁は「頁挿入」ボタンを選択するこ
とで簡単に頁を挿入することができる。
【0025】レイアウトの確認がなされたら、図5の
「文字認識開始」ボタンを選択すると認識したレイアウ
トの順にしたがって、文字認識を開始する。認識中は、
図6の左側の画面にどの位置を認識中か表示する(ステ
ップ206)。認識した文字コードは右側の画面に順次
表示する。文字認識が終了すると、図7が表示される。
このとき、読み取った原稿の濃度の指定を誤ったり、原
稿を傾けて置いたりすると、認識された文字に誤りが多
くなる。このときは、「再読取り」ボタンを選択するこ
とで、再度、該当する頁を読み直すことができる(ステ
ップ207)。
【0026】図7の画面で「次候補」ボタンを選択する
と文字認識において曖昧性のある文字を検索する(ステ
ップ208)。曖昧性のある文字が見付かると、図8の
ように曖昧性のある文字の近辺にイメージが表示され
る。オペレータは、そのイメージを参照しながら文字の
修正を行う。
【0027】この修正は、図1の文字コード編集部7で
行われる。次に、単語の一部が読み誤っている時の修正
の方法について、図9のフローチャートを用いて詳細に
説明する。ここでの説明は、「工期」という文字列を読
みとって認識したとき、「工」を誤って他の文字、例え
ば、カタカナの「エ」に認識された仮定する。また、修
正入力された、「こうき」なるかなをかな漢字変換する
と同音異義語として、「高貴、好機、綱紀、工期、後
記、好奇、後期、校旗、香気」等が出力されたとする。
実施例では、前記、同音異義語の順番に優先度が付けら
れていると仮定する。まず、前記、「次候補」ボタンで
曖昧性のある文字列として、カーソルが「エ期」に移動
した状態から説明する。このカーソルの移動は、オペレ
ータが移動しても良い。図11に曖昧性がある文字にカ
ーソルが移動した画面例を示す。ここで文字認識部5
は、「エ」、「工」、「土」、「士」が類似していると
認識しているものとする。
【0028】オペレータが修正入力文字として「こう
き」と入力する(ステップ901)。この入力された文
字列は、かな漢字変換部8で漢字混じり文字列に変換さ
れ、前記、同音異義語が得られる(ステップ902)。
【0029】文字コード編集部7は、修正入力として得
られたこの同音異義語の最長文字列に該当する修正前の
文字列、実施例の説明では、「エ期」を取り出す(ステ
ップ903)。修正入力として得られた文字列に同音異
義語があるかチェックする(ステップ904)。同音異
義語が無い場合は、同音異義語出力制御を終了する。
【0030】同音異義語が存在するときは、同音異義語
抽出カウンタをクリアする(ステップ905)。同音異
義語抽出カウンタが示す同音異義語と修正前の文字列と
を順次比較する(ステップ906)。修正前の文字列の
どれかが一致したときは、同音異義語抽出カウンタが示
す同音異義語が最初に出力されるように入れ替える。
(ステップ907)。実施例では、「高貴、好機、綱
紀、工期、後記、好奇、後期、校旗、香気」の順にかな
漢字変換で出力された同音異義語の中で「エ期」に一致
する単語として、「工期」があるので、「工期」を最初
になるような入れ替えを行い、「工期、高貴、好機、綱
紀、後記、好奇、後期、校旗、香気」を得る。
【0031】この比較の方法を実施例の「こうき」で詳
細に説明すると、まず、「エ期」の「エ」とかな漢字変
換された同音異義語の最初に出力された「高貴」の
「高」が比較される。この場合は、一致しないので、続
いて、「エ期」の「期」と「高貴」の「貴」が比較され
る。この比較によっても一致しないので、この同音異義
語の「高貴」は優先されない。この様に、順次、かな漢
字変換された同音異義語に対して比較を行う。そして、
実施例では、修正前の文字列「エ期」の後の漢字「期」
と同音異義語の「工期」と「後期」の後の漢字「期」が
一致するので「工期」と「後期」を同音異義語の最初に
出力されるように並び替えを行う。しかし、ここで「後
期」の「後」は、文字認識部5が類似度が大きいと判断
する「エ、工、土、士」とかけ離れているため、「後
期」は優先対象からはずれ、前記のような出力が得られ
る。
【0032】修正前の文字列の入れ替えが終了したら同
音異義語出力制御を終了する。一致しないときは、同音
異義語抽出カウンタに1を加える(ステップ908)。
同音異義語抽出カウンタが示す位置にまだ同音異義語が
あるかチェックする(ステップ909)。他の同音異義
語があるときは、ステップ906で次の同音異義語の比
較をする。他の同音異義語が無いときは同音異義語出力
制御を終了する。
【0033】同音異義語出力制御部9で出力された同音
異義の最初の文字列と修正前の文字列を入れ替える(ス
テップ910)。これにより、「エ期」が「工期」が修
正された。
【0034】この様に、単語の一部が認識誤りしている
とき、かな漢字変換の同音異義語の選択を非常に削減す
ることができる。以下、順次認識誤りの修正を頁の最後
まで行う。1頁分の編集が終了したら、「次頁」ボタン
を選択する(ステップ209)。続く頁イメージがある
ときは、次の頁のレイアウト認識が開始される。続く頁
が無いときは「終了」ボタン選択すると図3の初期画面
に戻る。
【0035】全ての原稿の文字認識が終了したときは、
図3の「出力」ボタンを選択することで入力された複数
頁の文字コードを一つのファイルとして外部に出力す
る。出力の詳細な説明は公知の技術であるので省略す
る。
【0036】以上で状態遷移図による文字認識装置の全
体の処理の流れを説明を終了する。次に、前記フローで
説明した修正と同じ認識誤りが他の場所にある場合の文
字コード編集部7の処理について図10のフローを用い
て説明する。このフローは、修正の入力が行われた入力
以外のオペレーション、例えば、次候補、カーソル移動
などの動作が行われたときに動作する。
【0037】まず、他に同じ修正候補があるかをカウン
トするカウンタをクリアする(ステップ1001)。修
正入力以外のオペレーションがなされたタイミングで入
れ替え前に記憶されている修正前の文字列と修正後の文
字列を取り出す(ステップ1002)。、カーソルが示
す後の位置に、修正前の文字列があるか順次比較する
(ステップ1003)。文末まで比較したかチェックす
る(ステップ1004)。
【0038】文末でないときは、この比較によって修正
前の文字列が見付かったときで、実施例では、その文字
列を反転表示する(ステップ1005)。他に修正候補
があるカウンタにを一つ加算する(ステップ100
6)。そして、ステップ1003に戻り続きをチェック
する。ステップ1004で文末までチェックが終了した
ときは、オペレータに他に修正候補があるか知らせるた
めに、まず、カウンタをチェックし、0のときは、要求
のオペレーションに移る(ステップ1007)。
【0039】カウンタが0でないときは、オペレータに
カウンタの数値とリーバース表示を行う(ステップ10
08)。図12に他の場所に修正候補が存在する場合の
画面例を示す。オペレータが“修正しない”を指示した
ときは(ステップ1009)、リバース表示を元の状態
に戻し、要求のオペレーションに移る(ステップ101
0)。
【0040】“修正する”が指示されたときは、修正前
の文字列を修正入力された文字列に置き換える(ステッ
プ1011)。図13に修正指示がなされたときの画面
例を示す。実施例では、一回の確認で全の置き換えを行
うように示したが、修正候補ごとにオペレータの確認を
行うようにしても良い。全ての修正候補の入れ替えが終
了したら、要求されたオペレーションに移る。
【0041】以上、説明したように、修正した文字列が
他の場所にあるとき、修正後の次のオペレーションでオ
ペレータにその旨を知らせ、他の場所にある同じ認識誤
りを確認だけで簡単に修正することができる。オペレー
タが確認するとき、他の修正候補はリーバース表示で示
されているので誤った修正候補があるか簡単に判断する
ことできる。
【0042】この他、ここで抽出された修正前の文字列
と、修正入力された文字列を対応させて記憶しておくこ
とにより、他の頁の修正に利用することができる。例え
ば、文字認識が終了したタイミングで、上記記憶されて
いる修正候補と順次比較を行い、該当する修正候補が存
在するときは、オペレータにその旨を知らせ、前もって
修正をすることができる。また、これらの修正前の文字
列と修正入力された文字列を外部記憶装置、例えば、磁
気ディスクに名前を付けて保存して置き、同じ様な活字
の原稿を読むときに、上記付けた名前でを指示して利用
することもできる。
【0043】次に、修正入力された文字の置き換えの方
法について、図14のフローチャートを用いて詳細に説
明する。ここでの説明は、「新聞記事」という文字列を
読みとって認識したとき、「聞」を誤って他の文字、例
えば、「間」に誤って認識されたと仮定する。また、修
正入力された、「しんぶん」なるかなをかな漢字変換す
ると、「新聞」が出力されたと仮定する。まず、前記、
「次候補」ボタンで曖昧性のある文字列として、カーソ
ルが「新間記事」の「間」に移動した状態から説明す
る。このカーソルの移動は、オペレータが移動しても良
い。
【0044】カーソルが示す位置の前後の修正前の文字
を取り出し、記憶する(ステップ1401)。実施例で
は、「間」の前後の文字、「新」と「記」が取り出され
る。オペレータが修正入力文字として「しんぶん」と入
力する(ステップ1402)。この入力された文字列
は、かな漢字変換部8で漢字混じり文字列に変換され、
同音異義語が得られる(ステップ1403)。文字コー
ド編集部7は、修正入力として得られた文字列に同音異
義語が存在する調べ(ステップ1404)、同音異義語
が存在する場合は選択する(ステップ1405)。この
選択は、前記説明した方法で同音異義語の入替え後、出
力されるので大部分は選択する必要がない。また、従来
技術のオペレータに提示して選択する方法で選択しても
良い。本実施例の「しんぶん」では、同音異義語がない
ので同音異義語の選択は省略される。
【0045】修正入力された文字列と、前記ステップ1
401で記憶された、カーソルが示す前後の文字と比較
する(ステップ1406)。不一致の場合は、入力され
た文字列の削除は行われず、入力文字列がそのまま置き
換えの対象になる。修正入力された文字列と修正前の文
字の前後の文字に一致する文字がある場合は、修正入力
された文字列から、一致する文字を削除して、入力文字
列とする(ステップ1407)。実施例では、「しんぶ
ん」に対して、「新聞」がかな漢字変換されて修正入力
文字列として得られるので、ステップ1401で記憶さ
れた「新」と「記」と比較される。ここでは、「新」が
同じであることが分かるので、「新聞」から、「新」削
除され、「聞」が修正入力文字として出力される。
【0046】このようにして得られた修正入力文字列
と、カーソルで指示された文字とを置き換えることで誤
り修正ができる(ステップ1408)。また、これまで
の説明では、入力された文字と修正前の文字の前後を比
較して、同じ文字が存在するときに、入力文字列から削
除して、置き換える例を示したが、修正入力された文字
列と修正指示された文字列を置き換えた後で、前後の文
字列に連続して同じ文字がある場合に削除するようにし
ても良い。例えば、修正指示された「間」を「新聞」に
置換えると、その結果、「新新聞記」なる文字列が得ら
れるので、この文字列の中で同じ文字が繰返される文字
「新」を1つ削除すれば、「新聞記」が得られる。な
お、上述の実施例では文字認識装置の認識文字コードの
修正について説明したが、例えば、音声認識された文字
列を修正することもできる。
【0047】
【発明の効果】本発明によれば、従来漢字単位であった
誤りの修正を単語単位で効率良く行うことができ、オペ
レータの労力を大幅に軽減できる。また、同じ認識誤り
が他の場所にある場合は、修正後にオペレータにその旨
を知らせ、他の場所にある同じ認識誤りは確認配慮 だ
けでおこなうことのできるので修正に要していた時間を
大幅に短縮できる。
【図面の簡単な説明】
【図1】本発明の文字認識装置の一実施例における構成
を示した図である。
【図2】本発明の文字認識装置の一実施例における流れ
を示した状態遷移図である。
【図3】本発明の文字認識装置の一実施例における画面
の例を示した図である。
【図4】本発明の文字認識装置の一実施例における画面
の例を示した図である。
【図5】本発明の文字認識装置の一実施例における画面
の例を示した図である。
【図6】本発明の文字認識装置の一実施例における画面
の例を示した図である。
【図7】本発明の文字認識装置の一実施例における画面
の例を示した図である。
【図8】本発明の文字認識装置の一実施例における画面
の例を示した図である。
【図9】本発明の文字認識装置の一実施例における同音
異義語出力制御部の動作の手順を示す図である。
【図10】本発明の文字認識装置の一実施例における文
字コード編集部の修正動作の手順を示した図である。
【図11】本発明の文字認識装置の一実施例における画
面の例を示した図である。
【図12】本発明の文字認識装置の一実施例における画
面の例を示した図である。
【図13】本発明の文字認識装置の一実施例における画
面の例を示した図である。
【図14】本発明の文字認識装置の一実施例における入
力された修正文字列の置き換え動作の手順を示した図で
ある。
【符号の説明】
1 入力部 2 イメージ入力部 3 文字認識制御部 4 イメージ記憶部 5 文字認識部 6 文字コード記憶部 7 文字コード編集部 8 かな漢字変換部 9 同音異義語出力制御部 10 表示部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】文字を画像パターンとして入力するイメー
    ジ入力手段と、 このイメージ入力手段により入力された画像パターンと
    予め記憶された第1の辞書の文字パターンとを照合し
    て、類似度が所定値以上の文字パターンの文字を選択す
    る文字認識手段と、 この文字認識手段によって得られた文字列の中で誤って
    認識された文字列をかな漢字変換方式により修正文字を
    入力して修正する手段を具備した文字認識装置におい
    て、 修正前の文字列と修正入力された文字列とを比較し、修
    正前の文字列の一部が修正入力された文字列の同音異義
    語に含まれるとき、その同音異義語を優先して出力する
    同音異義語出力制御手段を具備することを特徴とする文
    字認識装置。
  2. 【請求項2】文字を画像パターンとして入力するイメー
    ジ入力手段と、 このイメージ入力手段により入力された画像パターンと
    予め記憶された第1の辞書の文字パターンとを照合し
    て、類似度が所定値以上の文字パターンの文字を選択す
    る文字認識手段と、 この文字認識手段によって得られた文字列の中で誤って
    認識された文字列をかな漢字変換方式により修正文字を
    入力して修正する手段を備えた文字認識装置において、 修正前の文字列の前後の文字と修正入力された文字列を
    比較し、前記修正前の文字列の前後の文字が、前記修正
    入力された文字列に含まれるとき、修正入力された文字
    列から、前記修正前の文字列の前後の文字と同一の文字
    を削除して出力する同音異義語出力制御手段を具備する
    ことを特徴とする文字認識装置。
  3. 【請求項3】修正の対象となった文字列と同じ文字列が
    前記文字認識手段によって得られた文字列の他の位置に
    存在するとき、前記文字列を修正する手段が修正の対象
    となった文字列と同じ文字列を修正することを特徴とす
    る請求項1および請求項2記載の文字認識装置。
JP5133121A 1993-06-03 1993-06-03 文字認識装置 Pending JPH06348889A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5133121A JPH06348889A (ja) 1993-06-03 1993-06-03 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5133121A JPH06348889A (ja) 1993-06-03 1993-06-03 文字認識装置

Publications (1)

Publication Number Publication Date
JPH06348889A true JPH06348889A (ja) 1994-12-22

Family

ID=15097286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5133121A Pending JPH06348889A (ja) 1993-06-03 1993-06-03 文字認識装置

Country Status (1)

Country Link
JP (1) JPH06348889A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008293109A (ja) * 2007-05-22 2008-12-04 Toshiba Corp テキスト処理装置及びプログラム
JP2016091135A (ja) * 2014-10-31 2016-05-23 京セラドキュメントソリューションズ株式会社 画像処理装置および画像処理システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008293109A (ja) * 2007-05-22 2008-12-04 Toshiba Corp テキスト処理装置及びプログラム
JP2016091135A (ja) * 2014-10-31 2016-05-23 京セラドキュメントソリューションズ株式会社 画像処理装置および画像処理システム

Similar Documents

Publication Publication Date Title
EP0439951B1 (en) Data processing
EP0180047B1 (en) Text editor for speech input
JP4071328B2 (ja) 文書画像処理装置および方法
JPS63155386A (ja) 帳票デ−タ読取装置
JPH06274680A (ja) 文書認識方法およびシステム
US5265171A (en) Optical character reading apparatus for performing spelling check
JPH0554073A (ja) デジタル翻訳装置
JPH0221024B2 (ja)
US20010016068A1 (en) Electronic document generating apparatus, electronic document generating method, and program thereof
JPH06348889A (ja) 文字認識装置
JPH05303619A (ja) 電子スクラップブック
JPH0696288A (ja) 文字認識装置及び機械翻訳装置
RU2166207C2 (ru) Способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения
JP3083171B2 (ja) 文字認識装置及び方法
JPH08221558A (ja) 文書ファイリング方法及び装置
JPH0991371A (ja) 文字表示装置
JPH0728801A (ja) イメージデータ処理方法及びその装置
JP3457376B2 (ja) 光学式読み取り装置における文字修正方法
JPH0388086A (ja) 文書読取装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP4633773B2 (ja) 文書画像処理装置および方法
JP2829186B2 (ja) 光学的文字読取装置
JPH0451871B2 (ja)
JPH0562008A (ja) 文字認識方法
JP2682873B2 (ja) 表形式文書の認識装置