JPH06325202A - 文字列修正装置 - Google Patents

文字列修正装置

Info

Publication number
JPH06325202A
JPH06325202A JP5114782A JP11478293A JPH06325202A JP H06325202 A JPH06325202 A JP H06325202A JP 5114782 A JP5114782 A JP 5114782A JP 11478293 A JP11478293 A JP 11478293A JP H06325202 A JPH06325202 A JP H06325202A
Authority
JP
Japan
Prior art keywords
character string
candidate
correction
recognition
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5114782A
Other languages
English (en)
Inventor
Masumi Shimizu
真澄 清水
Mayumi Hatano
真由美 秦野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP5114782A priority Critical patent/JPH06325202A/ja
Publication of JPH06325202A publication Critical patent/JPH06325202A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 原稿読取り装置などから出力されたデータに
おいて、複数個含まれた同一の対応候補を容易に、か
つ、適正に修正することが可能な文字列修正装置を提供
する。 【構成】 原稿のイメージデータを読取り(S1)、文
字認識処理を経て、各単語に対応する認識候補と修正候
補を決定する(S2〜S4)。認識候補は、修正候補の
中から適当な修正文字列を選択する(S10)、また
は、新規に修正文字列を入力する(S11)ことにより
修正する。修正文字列を新規入力した場合は、修正した
認識候補と同等の文字列を認識候補もしくは修正候補と
する他の単語について、その修正候補に入力文字列を追
加する(S12,S13)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、原稿読取り装置などか
ら出力された文字列を修正するための装置に関する。
【0002】
【従来の技術】昨今、原稿を光学的方法などによって読
取るための原稿読取り装置などが多く用いられている。
これらの装置は、通常、文字列を変換するための辞書機
能を有しており、読取った画像に含まれている単語を辞
書を参照して文字列(以下、「対応候補」という)に変
換し、出力するものである。
【0003】原稿読取り装置の場合は、一般に、単語画
像の形状特徴量などを抽出し、辞書に含まれる活字体の
文字の形状と照合して、予め定められた条件に従って該
当する文字列を出力する。したがって、たとえば読取る
原稿が手書きであり、文字の形状が活字体のものとかな
り異なっているときなどには、辞書機能のみによっては
正しい対応候補が出力されないことがある。
【0004】このような不具合の対策として、従来は、
原稿読取り装置などから出力される対応候補のそれぞれ
に、修正候補となる文字列(以下、単に「修正候補」と
いう)を付与しておき、文字列修正装置を用いて修正候
補を対応候補に置換えることにより、文字列の修正を行
なっている。
【0005】図10ないし図12を参照して従来の文字
列修正処理について説明する。図10は、原稿を光学的
に読取り、読取った画像情報に基づいて文字列データを
生成するための原稿読取り用コンピュータシステム(以
下、単に「システム」という)220の構成例を示す図
である。システム220は、CPU(Central Processi
ng Unit )226に、イメージスキャナ222、文字認
識装置224、メインメモリ228、コンソール23
0、キーボード232、マウス234、フレキシブルデ
ィスク装置236、ハードディスク装置238などが、
コントローラ239,240,242,244やインタ
フェイス245,246などを介して接続されてなる。
【0006】文字認識装置224は、図11に示すよう
に、メインCPU250と、メインメモリ256と、サ
ブCPU258およびサブメモリ260からなる文字認
識処理用ユニット262と、スキャナI/Fコントロー
ラ254とを有し、SCSI(Small Computer System
Interface )コントローラ252を介して、システム2
20本体と接続されている。
【0007】図12は、システム220の動作を示すフ
ローチャートである。原稿読取りを開始すると、イメー
ジスキャナ222によって原稿のイメージデータを読込
む(ステップ(以下、単に「S」という)101)。読
取ったイメージデータの中に含まれる画像を単語ごとに
切出す(S102)。文字認識処理を経て、切出した各
単語に対応する文字列の認識候補(上記の対応候補に該
当する)を決定する(S103)。さらに、認識候補が
不確定な単語については、修正候補を決定する(S10
4)。
【0008】決定された認識候補を表示し(S10
5)、文字列を修正する場合は(S106にて修正)、
修正候補を表示し(S107)、その中に適当な文字列
があれば(S108にてYES)、その修正候補を選択
指示して認識候補に置換える(S109)。修正候補の
中に適当な文字列がなければ(S108にてNO)、新
たに文字列を入力して認識候補を修正する(S11
0)。文字列の修正が終われば、データを登録して(S
111)、終了する。
【0009】
【発明が解決しようとする課題】しかしながら、上述し
た読取り原稿の中に固有名詞や記号列のような特殊な単
語が含まれていることがある。このような特殊な単語に
ついては、その文字列が辞書の中に登録されていないこ
とが多いため、上記の対応候補(認識候補)もしくは修
正候補として適当な文字列が出力される可能性が少な
い。対応候補を修正するにあたって、修正候補の中に所
望する文字列がないときは、キーボードなどから新たに
文字列を入力して修正しなければならないので、修正作
業に手間がかかることがある。
【0010】さらに、読取り原稿中に同一の単語が複数
個含まれている場合には、通常、それらは同一の対応候
補として読取られる。したがって、その単語が上述した
ような特殊なものであり対応候補を修正しなければなら
ないときには、複数個の同一対応候補の各々について新
規に文字列を入力する作業を繰返す必要があるので、作
業が煩雑になり、また、誤修正の原因にもなる。
【0011】本発明は、上述したような問題点を解決す
るためになされたものであり、原稿読取り装置などから
出力されたデータにおいて、複数個含まれた同一の対応
候補を容易に、かつ、適正に修正することが可能な文字
列修正装置を提供することを目的とする。
【0012】
【課題を解決するための手段】上記の目的を達成するた
めに本発明は、仮決定された文字列とその文字列に置換
える候補となる候補文字列とが含まれた候補文字列群を
入力するための候補文字列群入力手段と、候補文字列群
入力手段によって入力される候補文字列群を格納するた
めの文字列格納テーブルと、文字列格納テーブルを参照
し、仮決定された文字列の1つを対象文字列として指示
するための指示手段と、指示手段によって指示された対
象文字列の候補文字列を文字列格納テーブルから読出し
て表示するための表示手段と、表示手段によって表示さ
れた候補文字列の中から対象文字列に置換える修正文字
列を選択するための修正文字列選択手段と、対象文字列
に置換える修正文字列を新規に入力するための修正文字
列入力手段と、修正文字列選択手段によって選択された
修正文字列、または、文字列入力手段によって入力され
た修正文字列を対象文字列に置換えるための文字列置換
え手段と、文字列置換え手段によって対象文字列に置換
えられた修正文字列が、修正文字列入力手段による入力
文字列であれば、候補文字列群のうち、対象文字列を含
む候補文字列群以外のものであって、かつ、対象文字列
と同等の文字列を候補文字列として含むものの中に、入
力文字列を追加するための入力文字列追加手段とを含む
ものである。
【0013】
【作用】上記構成により、仮決定された文字列とそれに
置換える候補文字列とが含まれた候補文字列群が候補文
字列群入力手段から入力されると、その候補文字列群を
文字列格納テーブルが格納する。指示手段によって文字
列格納テーブルが参照され、仮決定された文字列のうち
の1つが対象文字列として指示されると、表示手段が対
象文字列の候補文字列を文字列格納テーブルから読出し
て表示する。修正文字列選択手段によって表示手段が表
示した候補文字列の中から対象文字列に置換えるための
修正文字列が選択されるか、または、修正文字列入力手
段によって修正文字列が新規に入力されると、この選択
された修正文字列または入力された修正文字列を、文字
列置換え手段が対象文字列に置換える。置換えられた修
正文字列が修正文字列入力手段によって入力された入力
文字列である場合は、入力文字列追加手段が、その入力
文字列を候補文字列群のうち、対象文字列を含む候補文
字列群以外のものであって、かつ、対象文字列と同等の
文字列を候補文字列として含むものの中に追加する。追
加された入力文字列は、表示手段によって表示すること
が可能となる。
【0014】
【実施例】以下、本発明を具体化した一実施例について
説明する。
【0015】図1は、本発明の文字列修正装置を搭載し
た原稿読取り用コンピュータシステム(以下、単に「シ
ステム」という)20の全体構成を示すブロック図であ
る。システム20は、光学的方法によって原稿を読取る
ためのイメージスキャナ22と、このイメージスキャナ
22に接続され、読取ったイメージデータを文字列デー
タに変換するための文字認識装置24と、全体を制御す
るためのCPU26と、CPU26にて実行中のプログ
ラムや処理データを一時的に保持するためのメインメモ
リ28と、データを表示するためのコンソール30と、
データを入力したり動作を指示したりするためのキーボ
ード32と、コンソール30の表示領域内を指示するた
めのマウス34と、データを記録媒体であるフレキシブ
ルディスクに記録したり、フレキシブルディスクから読
出したりするためのフレキシブルディスク装置36と、
データやプログラムを格納するためのハードディスク装
置38とから構成されている。
【0016】文字認識装置24とハードディスク装置3
8とはSCSIコントローラ39を介してCPU26に
より制御される。メインメモリ28、コンソール30、
フレキシブルディスク装置36は、それぞれのコントロ
ーラ40,42,44を介してCPU26により制御さ
れる。また、キーボード32およびマウス34は、それ
ぞれのインタフェイス45,46を介してCPU26と
接続されている。マウス34は、後述する画面上のカー
ソルをコントロールするものであり、左右2つのボタン
(図示を省略)が設けられている。左ボタンを押す(以
下、「左クリック」という)と、コンソール30の画面
に表示されたカーソルがその時点で示す位置(箇所やメ
ニューなど)が指定される。右ボタンを押す(以下、
「右クリック」という)とその時点における指定が解除
(以下、「キャンセル」という)される。なお、前記カ
ーソルのコントロールは、マウス34の他、キーボード
32の矢印キーで行なってもよい。
【0017】図2は、図1に示した文字認識装置24の
基本構成を示すブロック図である。文字認識装置24
は、装置24の全体を制御するためのメインCPU50
と、システム本体20(図1)とのインタフェイス(S
CSI)を制御するためのSCSIコントローラ52
と、イメージスキャナ22(図1)とのインタフェイス
を制御するためのスキャナI/Fコントローラ54と、
ローカルデータを保管するためのメインメモリ56と、
サブCPU58とサブメモリ60とからなる文字認識処
理用ユニット62などから構成されている。なお、文字
認識処理用ユニット62には、実際はサブCPUとサブ
メモリとが4つずつ含まれているが、説明を簡略化する
ために各々1つずつが含まれているものとする。
【0018】メインメモリ56に保管されるローカルデ
ータとしては、イメージスキャナ22から出力されたイ
メージデータ70や、このイメージデータ70に基づい
て本装置24にて生成した文字認識データ72などがあ
る。文字認識処理用ユニット62のサブメモリ60は、
ROM(Read-Only Memory)で構成され、後述する各種
の処理を行なうためのイメージ読込みプログラム80、
文字認識プログラム82、文字列修正プログラム84
と、文字認識処理において参照される文字認識用辞書8
6などを格納している。なお、上述したプログラム8
0,82,84による処理は、サブCPU58によって
制御される。
【0019】図3は、図2に示したイメージ読込みプロ
グラム80によってコンソール30(図1)に表示され
るOCR領域指定画面(以下、単に「領域指定画面」と
いう)100の構成を示す図である。イメージスキャナ
22(図1)によって原稿のイメージを読込むときに
は、まず、走査(スキャン)範囲内のすべての画像情報
をプレデータとして読取り、領域指定画面100に表示
する。そして、マウス34(図1)を用いてカーソル1
02を動かし、後述する文字認識処理の対象とする領域
を領域線104で囲む。この領域線104で囲まれた範
囲内の画像がイメージデータ70(図2)としてメイン
メモリ56(図2)に格納される。
【0020】図4は、図2に示したメインメモリ56に
格納される文字認識データ72の構成を示す模式図であ
る。文字認識データ72は、文字認識プログラム82
(図2)によって、イメージデータ70に基づいて生成
されるものであり、請求項1記載の文字列格納テーブル
に対応する(詳細は後述する)。イメージデータ70に
含まれる各単語に対応する文字列が、予め定められた対
応条件に従って決定され、認識候補文字列(以下、単に
「認識候補」という)として、先頭から順に格納される
(C1,1 ,・・・・,Cα,1,・・・・,Cn,1 )。
【0021】このとき、認識候補が確定的でない単語に
ついては、認識候補に置換えるための文字列を決定し、
上記対応条件を満足する度合いが大きいものから順に修
正候補文字列(以下、単に「修正候補」という)として
格納する(C1,2 〜C1,m ,C2,2 〜C2,m ,・・・
・,Cα,2〜Cα,m,・・・・,Cn,2 〜Cn,m )。た
だし、修正候補の数は、上記対応条件などにより単語ご
とに異なる。なお、上述した認識候補は、請求項1記載
の「仮決定された文字列」に対応し、また、修正候補
は、同「候補文字列」に対応する。
【0022】図5および図6は、図2に示した文字列修
正プログラム84によって、コンソール30(図1)に
表示されるOCR認識結果編集画面(以下、単に「編集
画面」という)110の構成を示す図である。編集画面
110は、図4に示した文字認識データ72から各単語
の認識候補を読出して表示し、修正候補と置換えたり、
または、新規に文字列を入力したりして認識候補を修正
するための画面である。
【0023】図5に示したように、編集画面110に
は、認識候補を表示するための編集領域112と、編集
領域112に表示する範囲を移動させるための縦スクロ
ール指示領域114および横スクロール指示領域116
と、選択メニューとして編集の「終了」を指示するため
の終了ボタン118および認識結果の「登録」を指示す
るための登録ボタン119と、カーソル120で指示さ
れた認識候補の画像を表示するためのイメージ表示領域
122と、文字列を新規に入力するための文字列入力領
域124とが設けられている。
【0024】編集領域112に表示される認識候補のう
ち、文字認識データ72(図4)に修正候補を持つもの
は、オペレータに修正候補を持つことを知らせるため、
図示した「‘byte”,」や「Tbe」のように反転
表示される。この反転表示された認識候補をカーソル1
20で左クリック(指示)すると、図6に示すように、
指示された認識候補の画像がイメージ表示領域122に
表示されるとともに、修正候補表示領域130が表示さ
れる。修正候補表示領域130内には、指示された認識
候補(例では「‘byte”,」)に対応する第2と第
3の候補(例では、「‘byte’,」と「“byt
e’,」)および「文字修正入力」という文字が表示さ
れる。
【0025】表示された第2および第3の修正候補のう
ちのいずれかをカーソル120で指示(左クリック)す
ると、その修正候補が編集領域112中の認識候補に置
換えられる。一方、「文字修正入力」を指示すると、文
字列入力モードになり、文字列入力領域124にキーボ
ード32(図1)から文字列を入力すると、それが認識
候補に置換えられる。
【0026】上述した構成によるシステム20の動作に
ついて述べる。図7は、システム20における原稿読取
り・文字認識・文字列修正の一連の処理手順を示すフロ
ーチャートである。イメージスキャナ22に原稿をセッ
トし、キーボード32(図1)からスタート命令を入力
すると、システム20のCPU26が文字認識装置24
のメインCPU50(図2)へ原稿読取り指令を送る。
この指令に応答してメインCPU50がイメージスキャ
ナ22を駆動し、走査範囲内の画像情報をプレデータと
して読取る。イメージ読込みプログラム80が起動し、
図3に示した領域指定画面100にプレデータを表示す
る。オペレータによって、処理対象領域が指定される
と、領域内の画像をイメージデータ70としてメインメ
モリ56(図2)に格納する(S1)。
【0027】次に、文字認識プログラム82(図2)が
起動する。文字認識プログラム82は、イメージデータ
70に含まれる画像を単語ごとに切出す(S2)。そし
て、各単語の特徴を抽出し、文字認識用辞書86(図
2)を参照するなどの処理を経て、予め定められた対応
条件に基づいて各単語に対応する認識候補(前述)を決
定し(S3)、さらに、必要に応じて修正候補(前述)
を決定して(S4)、図4に示した文字認識データ72
としてメインメモリ56に格納する。
【0028】続いて、文字列修正プログラム84が起動
する。文字列修正プログラム84は、図5に示した編集
画面110を表示し、文字認識データ72から各単語の
認識候補(第1候補)を読出して、編集領域112に表
示する(S5)。認識候補が表示されると、文字列修正
の「終了」、もしくは文字列の「登録」、もしくは文字
列(認識候補)の「修正」の選択待ちとなる(S6)。
【0029】認識候補を修正する場合は(S6にて修
正)、図5に示したように、その認識候補をカーソル1
20で指示する。例として、指示された認識候補を図4
におけるCα,1とし、その文字列を図5における「‘b
yte”,」とする。認識候補Cα,1(例では、「‘b
yte”,」)が指示されると、図6に示したように、
その画像をイメージデータ70(図2)から読出して、
イメージ表示領域122に表示し、修正候補表示領域1
30に第2の修正候補Cα,2(例では、「‘byt
e’,」)と第3の修正候補Cα,3(例では、「“by
te’,」)と「文字修正入力」を表示する(S7)。
なお、指示された認識候補が、反転表示されていないも
の、すなわち、修正候補を持たない認識候補の場合に
は、修正候補表示領域130内に修正候補を表示しな
い。
【0030】イメージ表示領域122に表示された画像
と認識候補とを比較し、修正の必要がないと判断した場
合は(S8にてNO)、マウス34を右クリック(キャ
ンセル)する。修正がキャンセルされると、イメージ表
示領域122内の画像と修正候補表示領域130とを消
去し、S6に戻って選択待ちとなる。
【0031】S8にて、修正の必要があると判断した場
合は(S8にてYES)、表示された修正候補の中に適
当な文字列があるか否かを判断し(S9)、適当な候補
があれば(S9にてYES)、表示された2つの修正候
補Cα,2,Cα,3のいずれか1つをカーソル120で指
示(左クリック)して選択し、認識候補と置換える(S
10)。適当な候補がなければ(S9にてNO)、「文
字修正入力」を指示し、文字列入力領域124(図6)
にキーボード32から新規に文字列を入力して認識候補
を修正する(S11)。
【0032】上記S10に進んだ場合では、例えば編集
画面110上で編集領域112内の認識候補の文字列
(図6では「‘byte”,」)を修正候補表示領域1
30内の選択された修正候補の文字列(図6では「‘b
yte’,」もしくは「“byte’,」)とを置換
え、さらに、文字認識データ72(図4)において認識
候補Cα,1と、修正候補Cα,2もしくはCα,3とを置換
える。その後、S6に戻って選択待ちとなる。
【0033】一方、S11に進んだ場合は「文字修正入
力」がカーソル120で指示(左クリック)された後、
文字列入力モードになり、編集領域112の認識候補
(「‘byte”,」)を文字列入力領域124から入
力された文字列(以下、「入力文字列」という)に修正
し(たとえば「“byte”,」)、文字認識データ7
2の認識候補Cα,1を入力文字列に修正する。さらに、
S12にて、文字認識データ72における他の単語の中
で、修正された認識候補Cα,1と同等の文字列(「‘b
yte”,」)を認識候補もしくは修正候補とするもの
があるか否かを調べる。該当する単語があれば(S12
にてYES)、その単語の第2の修正候補として上記の
入力文字列を加え、元の修正候補Cα,2〜Cα,mについ
ては、その候補番号(図4参照)を1ずつ繰下げる(S
13)。その後、S6に戻って選択待ちとなる。
【0034】上述したように、修正した認識候補Cα,1
と同等の文字列を認識候補とする、もしくは修正候補と
する単語について、その第2の修正候補として入力文字
列を追加することにより、認識候補Cα,1と同等の他の
認識候補を修正するときには、修正候補表示領域130
に必ず先に入力した入力文字列が表示されるようにな
る。さらに、認識候補Cα,1と同等の文字列を修正候補
に含むものについても、その修正時に必ず入力文字列が
表示される。
【0035】S6にて、現時点での認識候補を読取り文
字列として登録する場合は、登録ボタン119(図5)
をカーソル120で指示(左クリック)する(S6にて
登録)。登録が指示されると、文字認識データ72の中
の認識候補(C1,1 ,C2,1,・・・・,Cα,1,・・
・・,Cn,1 )を読出し、登録データとしてシステム2
0のハードディスク装置38(図1)に格納する(S1
4)。
【0036】S6にて、文字列修正処理を終了する場合
は、終了ボタン118(図5)をカーソル120で指示
(左クリック)する。終了が指示されると、文字列修正
プログラム84が終了し、システム20が停止する。
【0037】図8は、図7に示したS12とS13の処
理を詳細に示すフローチャートであり、図9は、文字認
識データ72において入力文字列を第2の候補として修
正候補に追加する様子を示す模式図である。図8および
図9を参照して修正候補に入力文字列Dを追加する手順
について説明する。
【0038】図8において、検索する文字列(以下、
「検索文字列」という)Ci,j の文字認識データ72
(図4参照)における単語番号iおよび候補番号jを1
にセットする(S21)。単語番号iと候補番号jは、
それぞれ図4における行番号と列番号に対応する番号で
ある。図7のS11にて「文字修正入力」によって修正
された認識候補Cα,1の単語番号αと検索文字列Ci,j
の単語番号iとが等しいか否かを調べる(S22)。等
しければ(S22にてYES)、後述するS24へ進
む。等しくなければ(S22にてNO)、認識候補Cα
,1と検索文字列Ci,jが同等か否かを調べる(S2
3)。同等であれば後述するS28〜S32の処理によ
って入力文字列Dを追加する。同等でなければ、S24
へ進む。
【0039】S24〜S27は、検索文字列Ci,j の単
語番号iもしくは候補番号jを変える処理である。候補
番号jが最大候補数mに至ったか否かを調べ(S2
4)、至っていなければ(S24にてNO)、候補番号
jを1加算して(S25)、S22に戻る。jがmに至
っていれば(S24にてYES)、その単語について
は、Cα,1と同等の文字列を候補としては含んでいない
と判断し、続いて、単語番号iが単語数nに至ったか否
かを調べる(S26)。iがnに至っていなければ(S
26にてNO)iを1加算するとともにjを1にセット
してS22に戻る。
【0040】S28〜S32では、i番目の単語の修正
候補に入力文字列Dを加える処理を行なう。候補番号変
数kに、1単語当たりの候補の最大数mをセットする
(S28)。Ci,k-1 をCi,k に置換えた後(S2
9)、変数kを1減算して(S30)、kが2と等しく
なったか否かを調べ(S31)、等しくなければ(S3
1にてNO)、S29,S30の処理を繰返し、逐次、
修正候補の候補番号を1ずつ繰下げ、kが2と等しくな
れば(S31にてYES)、第2の候補Ci,2 に入力文
字列Dをセットして(S32)、S26へ戻る。すべて
の単語についてチェックが終了すれば(S26にてYE
S)、処理を終了する。なお、図9は、上述したような
入力文字列Dを追加する様子を入力文字列が「“byt
e”,」、i=β,m=4の場合を例にして示したもの
である。
【0041】以上説明したように、本実施例のシステム
20では、原稿のイメージデータに基づいて生成した認
識候補を新規に文字列を入力して修正したとき、この修
正した認識候補と同等の文字列である他の認識候補の修
正候補の中、および、修正した認識候補の他の認識候補
であって、修正した認識候補と同等の文字列を修正候補
に含むものの修正候補の中に、新規に入力した文字列を
第2の候補として追加する。これにより、修正した認識
候補と同等の他の認識候補を修正する際には、必ず先に
入力した文字列が表示され、さらには、認識候補が類似
する単語についても入力文字列が表示される可能性が高
くなる。
【0042】したがって、同等の単語や類似した単語が
複数個含まれた原稿を読取った場合に、それらの修正候
補に適当な文字列が含まれていないときでも、最初に修
正文字列を入力すれば、他の単語については、修正候補
を選択することで容易に文字列の修正が行なえる。
【0043】上述した実施例構成において、システム2
0のCPU26、メインメモリ28、文字認識装置24
の文字認識処理用ユニット62、メインCPU50、文
字列修正プログラム84などは、請求項1記載の発明を
構成するすべての手段に関わる。上記以外に個々の手段
に対応するものとしては、文字認識プログラム82が請
求項1記載の「候補文字列群入力手段」に、文字認識デ
ータ72が同「文字列格納テーブル」に、マウス34、
編集画面110、編集領域112、カーソル120が同
「指示手段」に、コンソール30、編集画面110、修
正候補表示領域130が同「表示手段」に対応する。さ
らに、マウス34、イメージ表示領域122、カーソル
120が同「修正文字列選択手段」に、修正候補表示領
域130中の「文字修正入力」メニュー、文字列入力領
域124、キーボード32が同「修正文字列入力手段」
に対応する。なお、本発明は本実施例に限られるもので
はなく、さまざまな変形が可能である。たとえば、本実
施例では、入力文字列を他の認識候補の第2の候補とし
て修正候補に追加したが、認識候補が修正した認識候補
と同等である単語については、直接、認識候補を入力文
字列に置換えるようにしてもよく、さらには、類似単語
(前述)についても同様にしてもよい。また、本発明は
本実施例に示したような原稿読取りシステムのみなら
ず、その他の文字列修正に関わる装置に広く適用できる
ものである。
【0044】
【発明の効果】以上説明したように本発明によれば、仮
決定された文字列の1つを新規に入力した文字列に置換
えて修正すると、この仮決定された文字列と同等の文字
列である他の仮決定された文字列に対応する候補文字列
群の中に、および、他の仮決定された文字列に対応する
候補文字列群であって、前記仮決定された文字列と同等
の文字列を候補文字列として含む候補文字列群の中に前
記新規に入力した文字列を追加する。したがって、同等
の文字列や類似した文字列を修正するときには、それら
の候補文字列群の中に置換えを所望する文字列が含まれ
る頻度が高くなり、新規に文字列を入力することなく、
候補文字列の中から選択するという手順によって仮決定
した文字列を置換え得る場合が多くなる。これにより、
文字列修正作業の省力化、迅速化を図れ、さらには、誤
修正の発生を少なくすることができるので、原稿読取り
装置などの文字列出力手段から出力されたデータにおい
て複数個含まれる同一のおよび類似の対応候補を容易
に、かつ、適正に修正することが可能な文字列修正装置
を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例による原稿読取り用コンピュ
ータシステムの全体構成を示すブロック図である。
【図2】原稿読取り用コンピュータシステムの文字認識
装置の基本構成を示すブロック図である。
【図3】原稿読取り用コンピュータシステムのコンソー
ルに表示されるOCR領域指定画面の構成図である。
【図4】文字認識装置のメインメモリに格納される文字
認識データの構成を示す模式図である。
【図5】原稿読取り用コンピュータシステムのコンソー
ルに表示されるOCR認識結果編集画面の構成図であ
る。
【図6】同OCR認識結果編集画面において修正候補を
表示した様子を示す図である。
【図7】原稿読取り用コンピュータシステムの処理手順
を示すフローチャートである。
【図8】文字認識データに入力文字列を追加する処理の
詳細手順を示すフローチャートである。
【図9】入力文字列を修正候補における第2の候補とし
て追加する様子を示す模式図である。
【図10】従来の原稿読取り用コンピュータシステムの
全体構成を示すブロック図である。
【図11】従来の文字認識装置の基本構成を示すブロッ
ク図である。
【図12】従来の原稿読取り用コンピュータシステムの
処理手順を示すフローチャートである。
【符号の説明】
20 原稿読取り用コンピュータシステム 22 イメージスキャナ 24 文字認識装置 26 CPU 28 メインメモリ 30 コンソール 32 キーボード 34 マウス 50 メインCPU 56 メインメモリ 58 サブCPU 60 サブメモリ 62 文字認識処理用ユニット 72 文字認識データ 82 文字認識プログラム 84 文字列修正プログラム 110 OCR認識結果編集画面 112 編集領域 124 文字列入力領域 130 修正候補表示領域

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 仮決定された文字列とその文字列に置換
    える候補となる候補文字列とが含まれた候補文字列群を
    入力するための候補文字列群入力手段と、 前記候補文字列群入力手段によって入力される候補文字
    列群を格納するための文字列格納テーブルと、 前記文字列格納テーブルを参照し、前記仮決定された文
    字列の1つを対象文字列として指示するための指示手段
    と、 前記指示手段によって指示された対象文字列の候補文字
    列を前記文字列格納テーブルから読出して表示するため
    の表示手段と、 前記表示手段によって表示された候補文字列の中から前
    記対象文字列に置換える修正文字列を選択するための修
    正文字列選択手段と、 前記対象文字列に置換える修正文字列を新規に入力する
    ための修正文字列入力手段と、 前記修正文字列選択手段によって選択された修正文字
    列、または、前記文字列入力手段によって入力された修
    正文字列を前記対象文字列に置換えるための文字列置換
    え手段と、 前記文字列置換え手段によって前記対象文字列に置換え
    られた修正文字列が、前記修正文字列入力手段による入
    力文字列であれば、前記候補文字列群のうち、前記対象
    文字列を含む候補文字列群以外のものであって、かつ、
    前記対象文字列と同等の文字列を候補文字列として含む
    ものの中に、前記入力文字列を追加するための入力文字
    列追加手段とを含む文字列修正装置。
JP5114782A 1993-05-17 1993-05-17 文字列修正装置 Withdrawn JPH06325202A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5114782A JPH06325202A (ja) 1993-05-17 1993-05-17 文字列修正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5114782A JPH06325202A (ja) 1993-05-17 1993-05-17 文字列修正装置

Publications (1)

Publication Number Publication Date
JPH06325202A true JPH06325202A (ja) 1994-11-25

Family

ID=14646548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5114782A Withdrawn JPH06325202A (ja) 1993-05-17 1993-05-17 文字列修正装置

Country Status (1)

Country Link
JP (1) JPH06325202A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006099806A (ja) * 2005-12-16 2006-04-13 Brother Ind Ltd 通信装置及び通信方法
JP2007206985A (ja) * 2006-02-01 2007-08-16 Sharp Corp 文字列抽出装置、文字列抽出方法、そのプログラムおよび記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006099806A (ja) * 2005-12-16 2006-04-13 Brother Ind Ltd 通信装置及び通信方法
JP2007206985A (ja) * 2006-02-01 2007-08-16 Sharp Corp 文字列抽出装置、文字列抽出方法、そのプログラムおよび記録媒体

Similar Documents

Publication Publication Date Title
US5241674A (en) Electronic dictionary system with automatic extraction and recognition of letter pattern series to speed up the dictionary lookup operation
JPS61120275A (ja) 日本語ワ−ドプロセツサ
JP3466689B2 (ja) 手書き文字認識方法及びその装置
JPH06325202A (ja) 文字列修正装置
JP2000029901A (ja) 画像検索装置及び方法
JPH0728801A (ja) イメージデータ処理方法及びその装置
JPH11212705A (ja) 文字列予測装置及び文字列予測方法
JP3529880B2 (ja) データ管理装置及びその方法
JP3749292B2 (ja) 仮名漢字変換装置
JP2592793B2 (ja) 文字処理方法
JP2606563B2 (ja) ワードプロセッサ装置及びワードプロセッサ装置における表示方法
JP3437049B2 (ja) 文字入力装置
JPS63265367A (ja) 電子フアイリングシステムにおける画像更新方法
JPH0922411A (ja) 文書処理方法及びその装置
JPH0565898B2 (ja)
JPS6398788A (ja) 認識装置
JPH0697455B2 (ja) 仮名漢字変換装置
JPH06119314A (ja) 文書作成装置
JPH0962666A (ja) 文書処理方法及びその装置
JPH086941A (ja) 文書作成装置
JP2001175645A (ja) 中国語入力変換処理装置、中国語入力変換処理方法及び記録媒体
JPH08329052A (ja) 読み表記変換方法
JPH0778135A (ja) 文書処理装置
JP2000163422A (ja) 翻訳装置及び翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH06348889A (ja) 文字認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000801