JPH096893A - 情報処理装置及び方法 - Google Patents

情報処理装置及び方法

Info

Publication number
JPH096893A
JPH096893A JP7151495A JP15149595A JPH096893A JP H096893 A JPH096893 A JP H096893A JP 7151495 A JP7151495 A JP 7151495A JP 15149595 A JP15149595 A JP 15149595A JP H096893 A JPH096893 A JP H096893A
Authority
JP
Japan
Prior art keywords
character
recognition
candidate
candidates
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7151495A
Other languages
English (en)
Inventor
Tadanori Nakatsuka
忠則 中塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP7151495A priority Critical patent/JPH096893A/ja
Publication of JPH096893A publication Critical patent/JPH096893A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字認識結果の全体としての良否の判定が容
易に行なえ、どの文字に注意すれば良いのかも一目瞭然
とさせる。 【構成】 入力部2を介して入力した文書画像はメモリ
5に格納され、前処理部7及び認識部8を経て、文字認
識される。そして、認識結果の第1候補を表示部10に
表示する際、候補数の大小に応じて異なる色を割り当
て、多段階にして表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は情報処理装置及び方法、
詳しくは文字認識して得られた結果を出力する情報処理
装置及び方法に関するものである。
【0002】
【従来の技術】一般に、文字認識装置においては、イメ
ージスキャナ等から文書原稿をデジタル画像データとし
て入力し、入力したデジタル画像データに基づいて文字
の分布を検出し、文字イメージの切り出しては認識処理
するという手順を踏む。
【0003】そして、表示画面には、文字認識処理によ
って得られた候補群中の第1候補で構成される文字列
(文章)を表示し、操作者が指定した文字については第
2候補以降を表示し、その中の1つを選択させて正しい
文章に修正する作業を要する。
【0004】また、場合によっては、候補中に意図した
文字がない場合もある。このような場合には、キーボー
ド等から正しい文字を入力することになる。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来例では、認識した得られた結果をまんべんなくチェッ
クしなければならず、操作者に与える負担は無視できな
い。
【0006】また、上記のような文字認識及び修正処理
においては、第2候補以降に意図した文字が存在しない
ことがわかったはじめて、キーボード等の他の手段によ
る文字入力作業を行う。つまり、無駄な作業(第2候補
以降に意図した文字がないことを確認するという作業)
を操作者に強いることになる。
【0007】
【課題を解決するための手段】及び
【作用】本発明は上記課題に鑑みなされたものであり、
文字認識結果の全体としての良否の判定が容易に行な
え、どの文字に注意すれば良いのかも一目瞭然とさせる
情報処理装置及び方法を提供しようとするものである。
【0008】この課題を解決するため、たとえば本発明
の情報処理装置は以下に示す構成を備える。すなわち、
文字認識して得られた結果を出力する情報処理装置であ
って、文字認識して得られたそれぞれの文字イメージの
第1候補の文字を可視出力する出力手段と、得られた認
識結果の候補数に従って前記第1候補の出力形態を多段
階に制御する制御手段とを備える。
【0009】また、本発明の好適な実施態様に従えば、
前記制御手段は、少なくとも認識候補数が1つの場合
と、それより多い候補数を有する場合とで区別可能な形
態で、第1候補の出力形態を制御することが望ましい。
この結果、候補数が1つだけの文字かどうかが一目瞭然
となり、且つ、候補を選択する作業が無駄になるか否か
を事前に把握することも可能になる。
【0010】また、前記出力形態は、色形態であること
が望ましい。これによって、ここの認識結果を注視する
ことなく、出力された全体を見ただけで、視覚的にどの
部分の認識結果が良好であったのか、不良であったのか
を判断することが可能になる。
【0011】
【実施例】以下、添付図面に従って本発明に係る実施例
を詳細に説明する。
【0012】図1は実施例の文字認識装置の概略構成を
示すブロック図である。図1において、1は第1の実施
例の文字認識装置を示している。2は文書画像を読取っ
て入力する入力部で、例えばスキャナ等により構成さ
れ、読み取った原稿画像データをデジタルに変換して出
力する。3は装置1全体を制御する演算処理用の中央処
理装置(以下、CPUという)を示している。4はRO
Mで、CPU3の図3以降のフローチャートで示された
制御プログラムや各種データを格納している。5はメモ
リ(RAM)で、CPU3のワークエリアとして使用さ
れると共に、入力部2より入力された文書画像データを
記憶する領域、前処理部7で切り出された文字パターン
の位置、大きさを記憶する領域を記憶する領域を備えて
いる。6は認識結果修正部で文字認識結果を修正する。
7は前処理部で、メモリ5に記憶された文書画像の1文
字のパターンを切出す。8は認識部で、前処理部7によ
って前処理されたパターンから幾何学的特徴を抽出し、
予め認識用辞書9に格納されている標準パターンと照合
して文書画像の文字認識を行っている。10は表示部
で、入力された文書画像を表示するイメージ表示部1
4、認識結果表示部15からなる。11はシステムバス
で、CPU3よりのデータバス、アドレスバス及び制御
信号バス等を含んでいる。12は外部の出力装置、例え
ばプリンタ13等とのインタフェース制御を行うインタ
フェース部を示している。また、16はキーボード及び
マウス(ポインティングデバイスの一種)である。
【0013】さて、一般に、文字認識処理を行う場合に
は、先ず、入力した画像中の個々の文字イメージの位置
の検出及び文字イメージの切り出し処理を行なう。そし
て、切り出した文字イメージから特徴量を抽出し、それ
と認識辞書に記憶されている情報とを比較し、最も近い
特徴量を持つ文字から第1候補、第2候補…として文字
コードを出力する。
【0014】尚、文字認識処理結果、1つの文字候補の
みを出力する場合には、その確からしさは高いと判断さ
れる。逆に、候補数が多ければ多いほど候補群を差別化
することが困難であることを意味することから、その第
1候補の確からしさは低いことを意味することが多い。
【0015】本実施例でも、このような文字認識処理を
採用するものとして説明する。尚、第1候補の確からし
さが高いと判断するための根拠は、たとえば内部的に得
られた第1候補と第2候補との確からしさ(認識対象の
文字イメージから得られた特徴量と、辞書に記憶された
標準特徴量との差分が小さいとき確からしさが高いとい
う)の差が、所定以上の場合である。すなわち、第1の
候補が第2の候補に対して十分な確からしさの差を有し
ている場合である。
【0016】但し、文字認識処理自身に本願発明の特徴
があるのではないので、ここではこの程度の説明にし、
詳細は省略する。
【0017】<認識結果ウインドウの説明(図2)>図
2は実施例の文字認識装置1で認識処理された結果の画
面に表示されるウインドウを示している。図示の符号2
1が認識結果を表示する領域であるウインドウを示して
いる。
【0018】実施例においては、個々の認識結果(認識
して得られた第1候補の文字コードに基づいて発生した
文字パターン)をウインドウ21内に表示するとき、図
5に示すテーブル(ROM4に格納されている)を参照
して、認識候補数に応じた色で表示する。
【0019】すなわち、候補数が“1”、つまり、認識
して得られた候補が1つの場合には、黒文字を表示す
る。そして、認識候補数が2〜4個である場合には青
色、認識候補が5〜7である場合には緑色、そして8個
以上の場合には赤色で表示する。すなわち、候補数の大
小におうじて表示形態を変えるものである。
【0020】従って、認識候補が多いほど、その第1候
補の確からしさが低いことになるわけであるから、認識
結果の注意をはらうべきところを配分でき、効率良く認
識結果のチェックが行なえる。
【0021】尚、操作者は、たとえばマウス16に連動
するカーソル(図示の符号24)で、たとえば青、緑、
もしくは赤色で表示された文字(すなわち、候補数が2
以上の第1候補文字)に移動させ、そこでマウス16に
設けられたボタンを押下(クリックという)すると、第
2候補以下(第1候補を含めても良い)を図示のポップ
アップメニューに表示する。逆に、黒文字の位置にカー
ソル24を移動させて、クリックしても候補は表示され
ない。
【0022】図示では、第1候補“認”がクリックされ
た状態を示している。図示の如く、第1候補“認”の近
傍に、第1候補を含めた第2候補以下の“誌”、
“語”、“話”、“詰”、“訴”の全部で計6個の文字
を含む選択ウインドウが表示される。この選択ウインド
ウ中の所望とする文字をクリックすることで、表示され
た文字を選択した文字で置き換える(内部の認識結果の
情報も置き変わる)。尚、候補文字数がある程度の個数
以上の場合には、選択ウインドウ中にスクロールバー
(図示の認識結果ウインドウ21の右端もしくは下単に
表示されたスクロール量を設定するためのコントロー
ル)を表示させる。
【0023】尚、図示における文字22は青(候補数が
2〜4)を、文字23は黒(候補文字が1つ)であるこ
とを示している。
【0024】以上の結果、操作者にしてみれば、認識処
理で得られた認識結果を見ただけで、認識結果の誤認識
されている可能性が高い文字とそうでない文字とが一目
瞭然となる。
【0025】たとえば、手書き文字でかかれた原稿の場
合と、プリンタ等で印刷された原稿とを認識させた場合
には、前者の場合には、黒以外の文字が多く発生し、後
者の場合には黒文字で表示される割合が高くなる傾向に
なることが予想されるので、原稿の種別判断にも適応で
きる。また、黒文字の文字の割合が高ければ高いほど、
文章全体として認識結果は良好であったと判断でき、認
識結果として注意するべき文字も瞬時に判断できること
にもなる。
【0026】図3は上記実施例の処理内容を示すフロー
チャート(CPU3が処理する手順)で、この処理に対
応する制御プログラムはROM4に記憶されている。
【0027】まずステップS31で、操作者によりセッ
トされた文書画像を入力部2(スキャナ)により読取っ
て入力し、メモリ5に記憶する。
【0028】次にステップS32に進み、前処理部7に
よって前処理された個々の文字パターンから幾何学的特
徴を抽出し、予め認識用辞書9に格納されている標準パ
ターンと照合して文書画像の文字認識を行う。認識結果
が確からしい時は候補文字数が少なくなり、確からしい
時は候補文字を多く出力している。
【0029】次にステップS33に進み、認識結果表示
部14で認識結果を表示し、ステップS34では認識結
果修正部6によって操作者の指示に従い認識結果を修正
する。
【0030】図4は、図3のステップS33の認識結果
表示処理を示すフローチャートである。
【0031】まずステップS41で、注目文字イメージ
に対する認識結果の候補数を調べる。ここで、認識した
結果がかなり確からしいと思われる文字は候補が1つ、
あるいは少なく、逆に確からしさが低い場合には認識候
補数が多くなる傾向にある。次にステップS42で、注
目している文字イメージに対する認識処理で得られた候
補数と図5に示したテーブルを参照して、認識結果の第
1候補の表示色を決定し、決定された色で第1候補を表
示する。
【0032】次いで、ステップS43に進み、全ての認
識文字について処理を終えたか否かを判断し、否の場合
にはステップS41に戻り、上記処理を繰り返す。
【0033】以上の結果、認識結果の表示画面を見ただ
けで、認識結果の候補数に応じた形態の第1候補文字が
表示されるので、誤認識している可能性の高い文字とそ
うでない文字とが一目瞭然に判断できる。従って、確か
らしい文字と疑わしい文字とを識別することが可能にな
り、文章の文字をチェックする際に注意すべき文字とそ
うでない文字とを区別することが可能になる。
【0034】特に、候補数が1つの場合の文字を区別可
能に表示することで、他の候補があるものと判断して候
補選択を行うという無駄な作業を行わいで済む。
【0035】また、上記例では、出力先として表示画面
を例にしたが、出力先としてプリンタ13を採用する場
合には、 認識結果内に候補を持つ文字と持たない文字が存在
し、認識結果修正を行う場合でも混乱を招かず容易に修
正ができる. 確からしい文字は候補がない、または少ないので、属
性を変えて表示することによって、ユーザはすべての認
識結果の確認をするのではなく、確からしくない文字の
み認識結果の確認をすればよいので、修正がかなり容易
になり短時間ですむという、ユーザによって使い易い文
字認識装置を実現することができる。
【0036】<第2の実施例>上記実施例(第1の実施
例)では、図4のステップS42において、候補文字と
して1〜7及び8以上のケースにつき、4色を割り当て
る例を説明したが、これによって本願発明が限定される
ものではなく、候補数の大小が判別できるのであれば良
いので、候補文字数の範囲や表示形態は如何なるもので
あっても良い。但し、認識候補が1つの場合の候補につ
いては、他の候補数と混同する色にしないことが望まれ
る。
【0037】<第3の実施例>また、候補数の範囲とそ
れに滞欧する表示形態は操作者が自由に設定できるよう
にしても良い。たとえば表示形態としては、色に限ら
ず、太文字や、アンダーラインの有無等、フォント(明
朝体とかゴシック体等)または文字の大きさ、色の濃
さ、網かけの有無、下線の有無、囲み罫の有無、圏点の
有無、ルビの有無、反転文字か否か等、如何なる表示形
態にしても良い。すなわち、候補数によってそれぞれの
文字を異なる形態で表示、もしくは出力(プリントアウ
トも含む)すれば良いからである。
【0038】また、設定した内容は次回の作業にも有効
にするため、不揮発性メモリ(たとえばハードディスク
等)に記憶させるようにしても良い。
【0039】<第4の実施例>第1の実施例では、図4
のステップS41において、単純に候補の数を調べてい
るが、キーボードなどからの入力した文字、つまり文字
認識結果以外の文字を除いて、文字認識による候補数の
みを調べても良い。
【0040】以上の説明により第4の実施例においても
前述の第1の実施例と同様の作用・効果を得ることがで
きる。
【0041】<第5の実施例>以上の説明により第5の
実施例においても前述の第1の実施例と同様の作用・効
果を得ることができる。
【0042】以上説明したように本実施例によれば、 認識結果内に候補を持つ文字と持たない文字が存在
し、認識結果修正を行う場合でも混乱を招かずに容易に
修正ができる、 確からしい文字は候補が1つ、または少ないので、属
性を変えて表示する事によって、ユーザはすべての認識
結果の確認をするのではなく、確からしくない文字を重
点的に確認をすれば良いので、修正が作業に伴う操作者
の負担を軽減させることが可能になる。
【0043】尚、本発明は単独の装置或いは複数の機器
から構成されるシステムに適応しても、装置或いはシス
テムに外部からプログラムを供給することでもって実現
しても良いのは言うまでもないことでである。従って、
本願発明を実現するプログラムを内蔵させた記憶媒体に
も容易に適応することも可能になる。
【0044】また、実施例では、処理対象の原稿画像は
イメージスキャナ等から入力するものとして説明した
が、イメージを記憶した記憶媒体(例えばフロッピーデ
ィスク等)や、回線を介して受信した場合にも適応でき
るので、上記例によって本願発明が限定されるものでは
ない。
【0045】
【発明の効果】以上説明した様に本発明によれば、文字
認識結果の全体としての良否が容易に判定でき、どの文
字に注意すれば良いのかも一目瞭然となる。
【0046】
【図面の簡単な説明】
【図1】第1の実施例の文字認識装置の概略構成を示す
ブロック図である。
【図2】第1の実施例の文字認識装置における認識結果
の表示例を示す図である。
【図3】第1の実施例の文字認識装置の処理を示すフロ
ーチャートである。
【図4】図3におけるステップS33の詳細を示すフロ
ーチャートである。
【図5】第1の実施例における認識候補文字の表示色テ
ーブルの例を示す図である。
【符号の説明】
1 文字認識装置 2 入力部 3 CPU 4 ROM 5 メモリ 6 認識結果修正部 7 前処理部 8 認識部 9 認識用辞書 10 表示部 11 システムバス 12 インタフェース部 13 プリンタ 14 イメージ表示部 15 認識結果表示部 16 キーボード及びマウス

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 文字認識して得られた結果を出力する情
    報処理装置であって、 文字認識して得られたそれぞれの文字イメージの第1候
    補の文字を可視出力する出力手段と、 得られた認識結果の候補数に従って前記第1候補の出力
    形態を多段階に制御する制御手段とを備えることを特徴
    とする情報処理装置。
  2. 【請求項2】 前記制御手段は、少なくとも認識候補数
    が1つの場合と、それより多い候補数を有する場合とで
    区別可能な形態で、第1候補の出力形態を制御すること
    を特徴とする請求項第1項に記載の情報処理装置。
  3. 【請求項3】 前記出力形態は、色形態であることを特
    徴とする請求項第1項に記載の情報処理装置。
  4. 【請求項4】 文字認識して得られた結果を出力する情
    報処理方法であって、 文字認識して得られたそれぞれの文字イメージの第1候
    補の文字を可視出力する出力工程と、 得られた認識結果の候補数に従って前記第1候補の出力
    形態を多段階に制御する制御工程とを備えることを特徴
    とする情報処理方法。
  5. 【請求項5】 前記制御工程は、少なくとも認識候補数
    が1つの場合と、それより多い候補数を有する場合とで
    区別可能な形態を区別するよう制御することを特徴とす
    る請求項第4項に記載の情報処理方法。
  6. 【請求項6】 前記出力工程は、色形態であることを特
    徴とする請求項第4項に記載の情報処理方法。
JP7151495A 1995-06-19 1995-06-19 情報処理装置及び方法 Withdrawn JPH096893A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7151495A JPH096893A (ja) 1995-06-19 1995-06-19 情報処理装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7151495A JPH096893A (ja) 1995-06-19 1995-06-19 情報処理装置及び方法

Publications (1)

Publication Number Publication Date
JPH096893A true JPH096893A (ja) 1997-01-10

Family

ID=15519756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7151495A Withdrawn JPH096893A (ja) 1995-06-19 1995-06-19 情報処理装置及び方法

Country Status (1)

Country Link
JP (1) JPH096893A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005004041A1 (ja) * 2003-07-03 2005-01-13 Sharp Kabushiki Kaisha 手書き入力装置、手書き入力方法、手書き入力プログラム、および、プログラム記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005004041A1 (ja) * 2003-07-03 2005-01-13 Sharp Kabushiki Kaisha 手書き入力装置、手書き入力方法、手書き入力プログラム、および、プログラム記録媒体

Similar Documents

Publication Publication Date Title
US11348331B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JPH096893A (ja) 情報処理装置及び方法
JPH096892A (ja) 情報処理装置及び方法
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム
JPH0916582A (ja) 文書作成装置及び同装置に用いられる認識結果出力方法
JP4218517B2 (ja) 色修正装置
US9229911B1 (en) Detecting continuation of flow of a page
US7118297B2 (en) Print option setting method and system for image forming devices
JP2016162211A (ja) 情報処理装置、制御方法及びプログラム
JP2006072877A (ja) 文書編集装置、文書編集方法、文書編集プログラムおよびその記録媒体
US8913294B2 (en) Image processing apparatus and image processing system
JPH09282309A (ja) 文書編集校正処理装置
JP2024066597A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
JPH07262307A (ja) 認識結果表示方法及び表示制御装置
JP2002049890A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3200249B2 (ja) 文書処理装置
US20190362176A1 (en) Image processing device and image processing method
JPH09305698A (ja) 文字入力表示装置
JPH06223221A (ja) 文字認識装置
JPH096899A (ja) 画像処理装置及び方法
JP3333075B2 (ja) 文書処理方法
JP2858581B2 (ja) 画像処理方法及び装置
JPH07261918A (ja) 情報入力装置および手書き文字処理方法
JPH1091618A (ja) 文書作成装置及び文書作成装置制御プログラムを記憶した媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020903