JPH11110479A - 文字処理方法及び装置及び記憶媒体 - Google Patents

文字処理方法及び装置及び記憶媒体

Info

Publication number
JPH11110479A
JPH11110479A JP9269902A JP26990297A JPH11110479A JP H11110479 A JPH11110479 A JP H11110479A JP 9269902 A JP9269902 A JP 9269902A JP 26990297 A JP26990297 A JP 26990297A JP H11110479 A JPH11110479 A JP H11110479A
Authority
JP
Japan
Prior art keywords
character
item type
item
area
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9269902A
Other languages
English (en)
Inventor
Akiyoshi Koshiba
晃良 小柴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP9269902A priority Critical patent/JPH11110479A/ja
Publication of JPH11110479A publication Critical patent/JPH11110479A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 住所録など、複数の項目に分かれた情報の項
目自動判別の精度を向上させる。 【解決手段】 読取った画像から罫線を抽出してセルを
識別し(S206)、第1行目の文字を認識して項目種
別を判別し(S501)、判別された項目種別と領域を
表示して編集を可能とし(S502)、領域の文字を認
識した結果とその領域の項目種別とを対応付けて記憶す
る(S503)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字処理方法及び
装置及び記憶媒体に関し、特に文字情報から構成される
複数の項目を管理することの可能な文字処理方法及び装
置及び記憶媒体に関するものである。
【0002】
【従来の技術】従来、住所録一覧の画像情報を入力し、
認識して文字情報に変換する場合、罫線部分を抽出して
罫線により分割されるセルを抽出し、セル内の文字列を
認識することによって、そのセルにつながる文字列の項
目が何であるかを判別し、項目毎に分類して認識結果の
文字列を記憶するものがあった。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の技術では、読み取った原稿が汚れていたり、原稿の
文字が小さかったためかすれてしまった場合など、1行
目のセル内の文字列が不鮮明であった時には、項目種類
の判定が出来なかったり、誤認識してしまうことがあ
る。項目の認識の種類が誤った場合には、誤った項目と
して認識結果の文字列が記憶されてしまうという欠点が
あった。
【0004】また、同じ種類の項目が複数あったと判定
された場合、あらかじめ決められた規則に従って、優先
される項目のみがその項目として認識され、他方はその
項目として認識されないという欠点があった。
【0005】
【課題を解決するための手段】上記課題を解決するため
に、本発明は、画像情報を入力し、前記入力した画像情
報を文字認識し、前記文字認識した結果に応じて項目種
別を判別し、前記判別された項目種別と、該項目に属す
る領域とを対応付けて表示する文字処理方法及び装置及
び記憶媒体を提供する。
【0006】上記課題を解決するために、本発明は、好
ましくは前記項目種別は、第1行目の文字画像の認識結
果に応じて判別する。
【0007】上記課題を解決するために、本発明は、好
ましくは前記項目に属する領域は、該項目を判別した文
字画像に続く位置に存在する文字画像の領域とする。
【0008】上記課題を解決するために、本発明は、好
ましくは前記画像情報に含まれる文字列の書式を判別
し、前記判別された書式に応じて前記文字認識の結果表
示画面を切り替える。
【0009】上記課題を解決するために、本発明は、好
ましくは前記文字認識の結果表示画面において、画像情
報と認識結果のテキスト情報とを共に表示し、前記画像
情報と認識結果のテキスト情報の表示レイアウトを前記
書式に応じて切り替える。
【0010】上記課題を解決するために、本発明は、好
ましくは前記判別する書式は、文字列が縦書きであるか
横書きであるかとする。
【0011】上記課題を解決するために、本発明は、入
力画像に、該入力画像を文字認識して得た項目種別と、
該項目種別に属すると判断された領域を示す情報とを重
ねて表示し、移動指示ボタンの入力に応じて前記領域に
おける選択領域を切り替え、選択可能な項目種別を表わ
すボタンを表示し、前記項目種別を表わすボタンの入力
に応じて、当該項目種別を前記選択領域に対応付けて記
憶する文字処理方法及び装置及び記憶媒体を提供する。
【0012】上記課題を解決するために、本発明は、好
ましくは前記入力画像から複数の領域を抽出し、前記移
動指示ボタンの入力毎に前記領域における選択領域を順
次一つずつ切り替えて表示する。
【0013】上記課題を解決するために、本発明は、好
ましくは前記項目種別の入力に応じて、該項目種別が入
力された領域の項目種別情報を変更する。
【0014】上記課題を解決するために、本発明は、好
ましくは前記入力された項目種別が対応付けられている
他の領域を検出し、該検出した領域の項目種別情報を解
除する。
【0015】上記課題を解決するために、本発明は、好
ましくは前記選択領域を他の領域と識別可能な表示にす
る。
【0016】上記課題を解決するために、本発明は、表
画像データから複数のブロックを検出し、表画像データ
に含まれる文字を認識して項目種別を判別し、前記判別
された項目種別と前記検出されたブロックとを対応付け
て記憶する文字処理方法及び装置及び記憶媒体を提供す
る。
【0017】上記課題を解決するために、本発明は、好
ましくは前記検出するブロックは、縦に繋がる複数のセ
ルとする。
【0018】上記課題を解決するために、本発明は、好
ましくは前記検出するブロックは、横に繋がる複数のセ
ルとする。
【0019】上記課題を解決するために、本発明は、好
ましくは前記項目種別は、前記検出されたブロックの先
頭文字画像から検出する。
【0020】上記課題を解決するために、本発明は、好
ましくは前記記憶した項目種別とブロックとの対応関係
を表示する。
【0021】
【発明の実施の形態】本発明に係る実施の形態を、図を
使用して説明する。
【0022】図9は、本実施の形態における装置の構成
を示すブロック図である。
【0023】91はCPU(中央処理装置)であって、
ROM92、RAM93、或は本装置に着脱可能な記憶
媒体(図示せず)に記憶された制御プログラムに従って
処理を実行する。92はROMであって、後述するフロ
ーチャートの制御プログラムや表示等に用いるフォーム
データやフォントデータ、文字の認識に用いる辞書など
を記憶しておく。93はRAMであって、各種処理を行
っている途中で必要となるワーク領域はこのRAM93
上に確保される。また、後述するフローチャートの処理
は、本装置に着脱可能な記憶媒体から読み込んだ制御プ
ログラムやパラメータ、或は公衆回線を介して他端末か
ら入手した制御プログラムやパラメータ等と、このRA
M93に格納して実行しても良い。尚、本装置に着脱可
能な外部記憶媒体は、CD−ROMや光磁気ディスク
等、制御プログラムやパラメータを記憶することのでき
るものであればその種類を問わない。また、図8に示し
た各種データ領域もこのRAM93上に確保される。9
4はCRTやLCDなどの表示装置であって、後述する
表示画面はこの表示装置94に表示される。95は表示
装置94に表示する表示データを格納するVRAM、9
6は文字の入力やファンクションの指示を行う為のキー
ボードや、座標入力やボタンのクリックによる選択指示
入力の為のマウスやデジタイザ、タブレットなどの入力
装置(以後これらを総称してKBとする)、98は入出
力インターフェースであり、プリンタへのイメージの出
力、イメージスキャナからの画像イメージの入力、或は
公衆回線を介してのデータの授受を制御するインタフェ
ース、97は各構成間でデータ伝送をするためのバスで
ある。
【0024】本実施の形態においては、装置がワードプ
ロセッサであって、その一機能として入力画像の文字認
識処理があるものとして説明するが、本発明はこの形態
に限定されるものではなく、コンピュータ等、文字列の
画像の表示と、編集処理が可能な装置であれば、本発明
を実施することが可能であることはもちろんである。
【0025】図9のKB96による活字文字認識処理起
動を指示する操作に応じて、ワードプロセッサのメニュ
ー画面から活字文字認識処理を起動すると図9のROM
92より活字文字認識処理の制御プログラムを読みだ
し、RAM93にセットして動作を開始する。活字文字
認識処理全体の処理を図2のフローチャートに示し、説
明する。
【0026】尚、後述する表示画面(図10〜図20)
は、ウインドウとして表示装置94の一部に表示するも
のであっても良い。
【0027】活字文字認識処理が起動したら、まず認識
パターン選択処理を実行する(S201)。認識モード
選択処理S201では、認識モード選択画面(図10)
を表示装置94に表示する。
【0028】認識パターン選択操作画面(図10)で、
オペレータは所望の認識処理の方法を指定する。認識処
理の方法は、KB96のカーソルキー、或はマウスによ
る直接指示により、認識パターン101から104の中
の所望のパターンを選択し、実行ボタン106をクリッ
クすることにより、その選択されていた認識パターン
を、指定された認識パターンとしてRAM93の認識パ
ターン格納部801に格納する。認識パターンの選択操
作、実行指示、認識パターンの格納という認識パターン
選択処理が完了したらS202に進み、原稿読取画面
(図11)を表示装置94に表示する。
【0029】原稿読取画面(図11)では、インターフ
ェース98から入力する原稿の画像イメージの読取りサ
イズ(操作部113)、読取り濃度(操作部114)を
KB96により設定し、実行ボタン116のKB96に
よる指示に応じてスキャナによる原稿の読取操作を開始
する。読取られた原稿イメージは、順次読取り画像デー
タ格納部802に格納し、かつ読取り画像イメージ表示
領域111に表示する。原稿の読み取りが終了したら、
ステップS203に進み、読取確認画面(図12)を表
示装置94に表示する。
【0030】読取確認画面(図12)では、ステップS
202で読み取った原稿イメージの確認をオペレータに
促し、読み取ったイメージ中の文字を正立させるための
画像の回転操作の指示を受け付ける。読取画像データ格
納部602に格納されている画像データを読取確認画面
(図12)に表示し(121)、表示倍率指示ボタン1
23及び回転指示ボタン124を表示する為の読取確認
ウインドウ122を表示する。読取確認ウインドウ12
2においてKB94の操作による変更の指示が入力され
たならば、その指示に応じて画像データ121を変更
し、表示を切り替える。図12〜図16に示す各画面に
おいて可能としている表示倍率を変更する操作は、読取
画像データ格納部802に格納されている画像データを
表示装置94に表示する倍率をオペレータにより指定す
るものである。回転指示ボタン(124−1〜124−
4)の指示により画像の回転が指示された場合は、その
指示に応じて読取画像データ格納部802の画像データ
を回転させて更新するか、或は回転情報を記憶させる。
実行ボタン126が指示されたならば、ステップS20
4に進む。
【0031】ステップS204では認識パターン格納部
801に格納されているデータを読み出して、ステップ
S201で指定された認識パターンを判定し、この判定
された認識パターンに応じてステップS205の処理を
実行するか否かを切り替える。判定された認識パターン
が「文字列のみ」であった場合には、ステップS205
の処理を実行する。
【0032】ステップS205では、認識領域指定画面
(図13)を表示装置94に表示する。この画面におい
て、読取画像データ格納部802に格納されている画像
データの全体を文字認識対象とするか、それとも一部分
を文字認識対象とするかの指定を受け付ける。全体指定
ボタン132−1が指示された場合は、読取画像データ
格納部802に格納されている画像データ全体を認識対
象とし、部分指定ボタン132−2が指示された場合
は、図14の部分指定操作画面を表示装置94に表示
し、認識対象とする部分の指定操作を受け付ける。部分
指定操作画面においては、部分領域を示す枠144と、
その枠の大きさを変更させる為の特徴点ボタン145を
読取画像に重ねて表示し、このボタン145をKB96
で指示して移動させることにより、オペレータが所望の
領域を認識対象領域として設定することを可能とする。
【0033】ステップS204で判定された認識パター
ンが「文字列のみ」でない場合、即ち「罫線のみ」、
「罫線・文字列」、「一覧表形式」であった場合には、
ステップS205の領域指定を行わずにステップS20
6に進み、読取画像データ格納部802の画像データ全
体を認識対象領域とする。
【0034】ステップS206では、読取画像データ格
納部802の画像データから罫線と文字領域の抽出処理
を行う。この処理の詳細を図3のフローチャートを使用
して説明する。
【0035】まずステップS301で、読取画像データ
格納部802に格納されている画像データを解像度変換
し、解像度変換後画像データ格納部803に格納する。
罫線及び文字領域を抽出する処理をより低い解像度の画
像データで行うことにより、読取画像データ格納部に格
納されているままの画像データで処理するよりも高速化
することを可能とする。
【0036】次にステップS302では解像度変換後画
像データ格納部803に格納された画像データの横ヒス
トグラムおよび縦ヒストグラムを算出する。
【0037】ステップS302で算出したヒストグラム
を用いて、ステップS303で罫線データ、罫線の始点
及び終点座標等を判定し、罫線データ格納部804に格
納する。罫線成分の判定は、S302で算出したヒスト
グラムが所定の条件、例えば一部分に極端に高い値を算
出する等の条件を満たす位置を求めることにより、可能
である。
【0038】ステップS304では罫線データを用い
て、罫線で囲まれる領域を判定し、その判定された領域
の位置を表わす領域データ、例えば領域の対角点の座標
等をブロックデータ格納部806に格納する。S303
において罫線が抽出されなかった場合は、画像データ全
体を1つのブロックとした時の領域データをブロックデ
ータ格納部806に格納する。
【0039】次にステップS305で、ブロックデータ
格納部806に格納されている領域データの各領域内の
画像データを解析して、各文字列のつながり方向、すな
わちその領域内の文字列が縦書き書式か横書き書式かを
判定し、書式データ格納部809に格納する。文字列の
つながり方向は、例えば領域データにより特定される一
つの領域の画像データをのヒストグラムをとって文字画
像を切り出し、その文字画像の配置から、文字画像が接
近して配置されている方向を検出し、それを文字列のつ
ながり方向と決定すること等により可能である。
【0040】ステップS306では、ブロックデータ格
納部806に格納されている領域データに基づいて各領
域の文字列成分を抽出し、文字列枠データ格納部805
に格納する。
【0041】図3のフローチャートに示した罫線及び文
字領域抽出の処理が終了したら、図2のステップS20
7に進む。
【0042】ステップS207では、読取原稿データ格
納部802に格納されている画像データと文字列枠デー
タ805を元に、図15の認識領域確認画面を表示装置
94に表示する。この画面は、読取画像データに文字列
枠を重ねて表示したものであって、抽出された各文字領
域が正しいかを確認するための画面である。文字列枠を
変更する場合は取消ボタン153を指示し、文字枠の編
集を行う。実行ボタン154が指示されたら本画面を終
了し、ステップS208の文字認識処理に進む。
【0043】ステップS208の文字認識処理の詳細
を、図4のフローチャートを用いて説明する。
【0044】ステップS401では、認識パターン格納
部801に格納されている認識パターンを読み出し、認
識パターンに従って、それぞれの認識処理を切り替える
処理を行う。S401で判定された認識パターンが「文
字列のみ」の場合は、ステップS402で認識領域確認
画面(図15)で表示された領域内の文字列のみの認識
処理を実行する。S401で判定された認識パターンが
「罫線のみ」の場合は、ステップS403で罫線のみの
認識処理を実行する。S401で判定された認識パター
ンが「文字・罫線」の場合は、ステップS404で文字
列及び罫線の認識処理を実行する。S401で判定され
た認識パターンが「住所録」の場合は、ステップS40
5の住所録認識処理を実行する。住所録認識処理の詳細
を図5のフローチャートを用いて説明する。
【0045】ステップS501ではブロックデータ格納
部806に格納されている領域データに従って、列方向
につながっているセルを判定し、各列の1行目のセル内
の文字画像の文字認識を行う。この1行目のセルとは、
図16における161の行であり、「氏名」「郵便番
号」「住所」「電話番号」の各項目を判定するための文
字列を含むセルである。
【0046】ステップS501の文字認識の結果によ
り、各ブロックが「氏名」「郵便番号」「住所」「電話
番号」のいずれの項目であるかを判別する。項目の判別
は、例えば各項目に対応する文字として予めRAM93
等の記憶装置に記憶させておいた文字がS501の文字
認識結果に含まれている場合に、そのブロックをその項
目として判別することにより可能である。項目に対応さ
せて予め記憶させておく文字は、一つの項目に対して複
数持つことにより、項目を表現する文字が異なる複数種
の原稿に対処することが可能となる。項目が判別された
ら、判別した項目データと、その項目に属する列方向の
領域を特定する情報を項目管理データ格納部807に格
納し、ステップS502において、図17の項目種別確
認画面を表示装置94に表示する。また、入力した画像
が縦、即ち列方向に繋がるフォーマットの表画像ではな
く、横、即ち行方向に繋がるフォーマットの表画像であ
った場合には、項目に属する領域は行方向の領域とす
る。
【0047】この項目種別確認画面(図17)では、画
像データ170に、項目管理データ格納部807に格納
されている情報に基づいた項目を示す枠と種類を示すパ
ターン(172〜175)を表示する。
【0048】S501の項目判定処理において、すべて
の項目種別が判別できた場合は、項目種別確認画面(図
17)においてアラートメッセージ171を表示し、オ
ペレータによる認識処理の実行指示(実行ボタン17
7)或は領域種別の変更指示(取り消しボタン176)
を受け付ける。取消ボタン176が指示され、項目種別
の変更操作が指定された場合、或はS501における項
目種別の自動判定で、判定できなかった項目があった場
合、項目種別指定画面(図1)を表示する。この画面で
は、ブロックデータ格納部806に格納されている領域
データに基づいて列方向につながる領域(105)を反
転表示し、かつ各領域種別を示す枠及び文字列(172
〜175)を表示する。この反転表示領域は文字方向キ
ーなどで移動が可能であり、項目指定対象の所望の列を
反転させた状態でソフトキー(101〜104)により
項目の種別を指定する。項目種別が確定していない領域
に対して項目種別を指定すると、指定された項目種別が
その領域の項目として設定され、項目管理データ格納部
807に項目データとその項目に属する列方向の領域を
特定する情報が格納される。また、項目の設定に応じ
て、画面上の設定されている項目を示すパターン(17
2〜175)の変更も行う。項目管理データ格納部80
7に項目種別がセットされている領域に対してソフトキ
ー(101〜104)により項目種別の設定操作がなさ
れた場合は、項目管理データ格納部807に格納されて
いる項目データの変更操作が行われ、指定された項目デ
ータに更新される。この時1つの種別が複数の列に対し
て指定されないように、指定操作がなされた項目データ
が他の列に対して設定されていないか、項目管理データ
格納部807を検索し、指定した項目種別が既に他の列
に対して設定されていると判定された場合は、既に設定
されていた他の列の種別を解除し、新たに指定操作がな
された領域に対しての処理を有効とする。ここで、種別
の解除は、項目管理データ格納部807におけるその列
の項目種別情報を消去するか、或は項目種別見設定情報
を記憶させることにより可能である。ソフトキー(10
1〜104)には、その時点で設定可能な項目種別を表
示させる。この、設定可能な項目種別とは、例えば住所
録であるのか、チェックリストであるのかといった、読
取画像の種類に応じて、その画像の種類に適した項目種
別とすれば良い。この読取画像の種類の判別は、モード
によりオペレータが選択した情報を用いても良いし、或
は読取った画像情報から画像の種類を識別するに足る情
報、例えばタイトル文字の認識等により情報を得ても良
い。また、全ての画像の種類から得られる全ての項目を
設定可能な項目種別として表示するようにしても良い。
或は、ステップS501で認識した項目種別のみを設定
可能な項目種別として表示しても良い。
【0049】項目種別確認画面(図17)において実行
ボタン177が指示されるか、或は項目種別指定画面
(図1)において項目種別の指定操作が完了したことが
指示された場合は、ステップS503に進み、住所録の
各行の文字認識処理を行い、認識結果を項目情報と共に
認識結果データ格納部808に格納する。
【0050】文字認識処理が終了したら、ステップS2
09の認識文字編集処理を行う。認識文字編集処理の詳
細を、図6のフローチャートを用いて説明する。
【0051】ステップS601では、認識パターン格納
部801に格納されているデータを読み出して認識パタ
ーンを判別し、認識パターンに応じてステップS602
からS605の各処理を行う。S601で判別された認
識パターンが「罫線のみ」の場合はS603に進み、罫
線のみ編集処理を行う。S601で判別された認識パタ
ーンが「文字・罫線」の場合はS604に進み、文字及
び罫線編集処理を行う。S601で判別された認識パタ
ーンが「住所録」の場合はS605に進み、図18の住
所録認識文字編集画面を表示して編集操作を行う。住所
録認識文字編集画面(図18)では、カーソルキー等の
操作により所望のセル位置に編集対象位置を設定できる
ようにする。設定されている編集対象位置のセル(18
6)は、セルを囲む罫線を強調表示(181)する等し
て他のセルと識別可能にする。画面内に認識文字編集ウ
インドウ(182)を表示し、編集対象位置のセル内の
文字をウインドウ内に表示する。このウインドウ内にお
いて、通常のテキスト入力画面と同様の文字編集環境を
設け、所望の文字への編集を可能とする。実行ボタン1
85を指示することにより、編集領域183内の文字列
が編集対象セル内の文字として確定され、認識結果デー
タ808も更新する。
【0052】S601で判別された認識パターンが「文
字列のみ」の場合は、ステップS602に進み、文字列
のみ編集処理を行う。この文字列のみ編集処理の詳細を
図7のフローチャートを用いて説明する。
【0053】ステップS701では書式データ格納部8
09に格納されている書式データを読み出し、書式デー
タが横書きの場合はステップS702に進み、図19の
ように画面を上下に分割して一方には認識データ格納部
808から読み出した認識結果のテキストを表示し、一
方には読取画像データ格納部802に格納されている画
像データを表示する。テキスト表示領域においては、カ
ーソル194をカーソルキーにより所望の位置に移動さ
せ、文字の編集を行うことができる。テキスト表示領域
においてカーソルが位置している文字を認識した文字画
像を、画像データ表示領域において枠で囲む(195)
等して他の文字から識別できるように表示することによ
り、イメージとテキストの対応を文字単位で可能とし、
テキストの編集作業を確実にすることができる。S70
1で読み出された書式データが縦書きであった場合は、
S703に進み、画面を左右に分割して一方には画像デ
ータを、他方には認識結果のテキストを表示する。画像
データとテキストの表示における動作はS702と同様
である。S702及びS703の画面分割により、書式
に適した画面で編集操作が行え、操作性が向上する。
【0054】また、S702及びS703では画面を分
割して表示したが、イメージ表示用のウインドウとテキ
スト表示用のウインドウを別個に設け、各々を表示する
レイアウトを書式情報に応じて変更するようにしても良
い。
【0055】ステップS704では、ステップS702
またはS703で分割表示した各ウィンドウに読取画像
データ802と認識結果データ808を表示する。
【0056】ステップS705において、各編集処理を
行う。
【0057】各編集操作が終了すると、図20のような
各データの保存処理を行って、活字文字認識処理を終了
する。
【0058】
【発明の効果】以上説明したように、本発明によれば画
像情報を入力し、前記入力した画像情報を文字認識し、
前記文字認識した結果に応じて項目種別を判別し、前記
判別された項目種別と、該項目に属する領域とを対応付
けて表示することにより、画像を認識して得た項目情報
を確認することができる。
【0059】以上説明したように、本発明によれば、好
ましくは前記項目種別は、第1行目の文字画像の認識結
果に応じて判別することにより、項目種別を自動的に判
別することができる。
【0060】以上説明したように、本発明によれば、好
ましくは前記項目に属する領域は、該項目を判別した文
字画像に続く位置に存在する文字画像の領域とすること
により、項目に属する領域の判別も自動的に行うことが
可能となる。
【0061】以上説明したように、本発明によれば、好
ましくは前記画像情報に含まれる文字列の書式を判別
し、前記判別された書式に応じて前記文字認識の結果表
示画面を切り替えることにより、書式に応じた認識結果
画面にでき、認識結果の確認環境を良好にすることがで
きる。
【0062】以上説明したように、本発明によれば、好
ましくは前記文字認識の結果表示画面において、画像情
報と認識結果のテキスト情報とを共に表示し、前記画像
情報と認識結果のテキスト情報の表示レイアウトを前記
書式に応じて切り替えることにより、画像情報とテキス
ト情報とを書式に適した効率的で見易い画面に表示でき
る。
【0063】以上説明したように、本発明によれば、好
ましくは前記判別する書式は、文字列が縦書きであるか
横書きであるかとすることにより、文字の配列を考慮し
た効率の良い文字認識の結果表示画面を提供することで
きる。
【0064】以上説明したように、本発明によれば入力
画像に、該入力画像を文字認識して得た項目種別と、該
項目種別に属すると判断された領域を示す情報とを重ね
て表示し、移動指示ボタンの入力に応じて前記領域にお
ける選択領域を切り替え、選択可能な項目種別を表わす
ボタンを表示し、前記項目種別を表わすボタンの入力に
応じて、当該項目種別を前記選択領域に対応付けて記憶
することにより、簡単な操作で入力画像とその画像から
得た項目とを対応付けながら項目の編集を行うことがで
き、操作性が向上する。
【0065】以上説明したように、本発明によれば、好
ましくは前記入力画像から複数の領域を抽出し、前記移
動指示ボタンの入力毎に前記領域における選択領域を順
次一つずつ切り替えて表示することにより、選択領域の
指示操作を簡単で確実に行うことを可能とする。
【0066】以上説明したように、本発明によれば、好
ましくは前記項目種別の入力に応じて、該項目種別が入
力された領域の項目種別情報を変更することにより、項
目種別の変更操作を簡単で確実に行うことを可能とす
る。
【0067】以上説明したように、本発明によれば、好
ましくは前記入力された項目種別が対応付けられている
他の領域を検出し、該検出した領域の記憶されている項
目種別情報を解除することにより、一つの項目を複数領
域に対して設定することを防ぐことが可能となる。
【0068】以上説明したように、本発明によれば、好
ましくは前記選択領域を他の領域と識別可能な表示にす
ることにより、選択領域の指示を確実にすることができ
る。
【0069】以上説明したように、本発明によれば、好
ましくは表画像データから複数のブロックを検出し、表
画像データに含まれる文字を認識して項目種別を判別
し、前記判別された項目種別と前記検出されたブロック
とを対応付けて記憶することにより、表における項目の
判定と項目に対応付ける情報の検出とを自動化すること
が可能となる。
【0070】以上説明したように、本発明によれば、好
ましくは前記検出するブロックは、縦に繋がる複数のセ
ルとすることにより、表におけるブロック検出の自動化
精度を向上させることが可能となる。
【0071】以上説明したように、本発明によれば、好
ましくは前記検出するブロックは、横に繋がる複数のセ
ルとすることにより、表におけるブロック検出の自動化
精度を向上させることが可能となる。
【0072】以上説明したように、本発明によれば、好
ましくは前記項目種別は、前記検出されたブロックの先
頭文字画像から検出することにより、表における項目判
別の自動化精度を向上させることが可能となる。
【0073】以上説明したように、本発明によれば、好
ましくは前記記憶した項目種別とブロックとの対応関係
を表示することにより、自動検出された情報を確認で
き、確実な情報分類を可能とする。
【図面の簡単な説明】
【図1】認識項目確認画面を示す図
【図2】活字文字認識処理全体のフローチャート
【図3】罫線・文字領域抽出処理のフローチャート
【図4】文字認識処理のフローチャート
【図5】住所録認識処理のフローチャート
【図6】認識文字編集のフローチャート
【図7】文字列のみ編集処理のフローチャート
【図8】RAM内のデータを示す図
【図9】構成ブロック図
【図10】認識パターン選択画面を示す図
【図11】原稿読取り画面を示す図
【図12】読取確認画面を示す図
【図13】認識領域指定画面を示す図
【図14】部分指定画面を示す図
【図15】認識領域確認画面を示す図
【図16】認識領域確認画面(住所録)を示す図
【図17】認識項目確認画面を示す図
【図18】認識文字編集画面(住所録)を示す図
【図19】認識文字編集画面(文字列のみ)を示す図
【図20】データ保存画面を示す図

Claims (35)

    【特許請求の範囲】
  1. 【請求項1】 画像情報を入力し、 前記入力した画像情報を文字認識し、 前記文字認識した結果に応じて項目種別を判別し、 前記判別された項目種別と、該項目に属する領域とを対
    応付けて表示することを特徴とする文字処理方法。
  2. 【請求項2】 前記項目種別は、第1行目の文字画像の
    認識結果に応じて判別することを特徴とする請求項1に
    記載の文字処理方法。
  3. 【請求項3】 前記項目に属する領域は、該項目を判別
    した文字画像に続く位置に存在する文字画像の領域とす
    ることを特徴とする請求項1に記載の文字処理方法。
  4. 【請求項4】 前記画像情報に含まれる文字列の書式を
    判別し、 前記判別された書式に応じて前記文字認識の結果表示画
    面を切り替えることを特徴とする請求項1に記載の文字
    処理方法。
  5. 【請求項5】 前記文字認識の結果表示画面において、
    画像情報と認識結果のテキスト情報とを共に表示し、 前記画像情報と認識結果のテキスト情報の表示レイアウ
    トを前記書式に応じて切り替えることを特徴とする請求
    項1に記載の文字処理方法。
  6. 【請求項6】 前記判別する書式は、文字列が縦書きで
    あるか横書きであるかとすることを特徴とする請求項4
    に記載の文字処理方法。
  7. 【請求項7】 入力画像に、該入力画像を文字認識して
    得た項目種別と、該項目種別に属すると判断された領域
    を示す情報とを重ねて表示し、 移動指示ボタンの入力に応じて前記領域における選択領
    域を切り替え、 選択可能な項目種別を表わすボタンを表示し、 前記項目種別を表わすボタンの入力に応じて、当該項目
    種別を前記選択領域に対応付けて記憶することを特徴と
    する文字処理方法。
  8. 【請求項8】 前記入力画像から複数の領域を抽出し、 前記移動指示ボタンの入力毎に前記領域における選択領
    域を順次一つずつ切り替えて表示することを特徴とする
    請求項7に記載の文字処理方法。
  9. 【請求項9】 前記項目種別の入力に応じて、該項目種
    別が入力された領域の項目種別情報を変更することを特
    徴とする請求項7に記載の文字処理方法。
  10. 【請求項10】 前記入力された項目種別が対応付けら
    れている他の領域を検出し、 該検出した領域の記憶されている項目種別情報を解除す
    ることを特徴とする請求項7に記載の文字処理方法。
  11. 【請求項11】 前記選択領域を他の領域と識別可能な
    表示にすることを特徴とする請求項7に記載の文字処理
    方法。
  12. 【請求項12】 表画像データから複数のブロックを検
    出し、 表画像データに含まれる文字を認識して項目種別を判別
    し、 前記判別された項目種別と前記検出されたブロックとを
    対応付けて記憶することを特徴とする文字処理方法。
  13. 【請求項13】 前記検出するブロックは、縦に繋がる
    複数のセルとすることを特徴とする請求項12に記載の
    文字処理方法。
  14. 【請求項14】 前記検出するブロックは、横に繋がる
    複数のセルとすることを特徴とする請求項12に記載の
    文字処理方法。
  15. 【請求項15】 前記項目種別は、前記検出されたブロ
    ックの先頭文字画像から検出することを特徴とする請求
    項12に記載の文字処理方法。
  16. 【請求項16】 前記記憶した項目種別とブロックとの
    対応関係を表示することを特徴とする請求項12に記載
    の文字処理方法。
  17. 【請求項17】 画像情報を入力する画像入力手段と、 前記入力した画像情報を文字認識する文字認識手段と、 前記文字認識した結果に応じて項目種別を判別する項目
    種別判別手段と、 前記判別された項目種別と、該項目に属する領域とを対
    応付けて表示するよう制御する表示制御手段とを有する
    ことを特徴とする文字処理装置。
  18. 【請求項18】 前記項目種別判別手段は、第1行目の
    文字画像の認識結果に応じて項目種別を判別することを
    特徴とする請求項17に記載の文字処理装置。
  19. 【請求項19】 前記項目に属する領域は、該項目を判
    別した文字画像に続く位置に存在する文字画像の領域と
    することを特徴とする請求項17に記載の文字処理装
    置。
  20. 【請求項20】 前記画像情報に含まれる文字列の書式
    を判別する書式判別手段と、 前記判別された書式に応じて前記文字認識の結果表示画
    面を切り替える表示画面切り替え手段とを有することを
    特徴とする請求項17に記載の文字処理装置。
  21. 【請求項21】 前記表示画面切り替え手段は、画像情
    報と認識結果のテキスト情報とを共に表示するレイアウ
    トを前記書式に応じて切り替えることを特徴とする請求
    項17に記載の文字処理装置。
  22. 【請求項22】 前記書式判別手段は、文字列が縦書き
    であるか横書きであるかを判別することを特徴とする請
    求項20に記載の文字認識装置。
  23. 【請求項23】 入力画像に、該入力画像を文字認識し
    て得た項目種別と、該項目種別に属すると判断された領
    域を示す情報とを重ねて表示する表示制御手段と、 移動指示ボタンの入力に応じて前記領域における選択領
    域を切り替える選択領域移動手段と、 選択可能な項目種別を指示可能にする項目種別指示手段
    と、 前記項目種別を表わすボタンの入力に応じて、当該項目
    種別を前記選択領域に対応付けて記憶する記憶手段とを
    有することを特徴とする文字処理装置。
  24. 【請求項24】 前記入力画像から複数の領域を抽出す
    る領域抽出手段と、 前記選択領域移動手段は、移動指示ボタンの入力毎に前
    記領域抽出手段により抽出された領域における選択領域
    を順次一つずつ切り替えて表示することを特徴とする請
    求項23に記載の文字処理装置。
  25. 【請求項25】 前記項目種別指示手段の指示に応じ
    て、前記記憶手段における該項目種別種別が指示された
    領域の項目種別情報を変更することを特徴とする請求項
    23に記載の文字処理装置。
  26. 【請求項26】 前記指示された項目種別が対応付けら
    れて記憶されている他の領域を検出する検出手段と、 該検出した領域の項目種別情報を解除する解除手段とを
    有することを特徴とする請求項23に記載の文字処理装
    置。
  27. 【請求項27】 前記表示制御手段は、前記選択領域を
    他の領域と識別可能な表示にすることを特徴とする請求
    項23に記載の文字処理装置。
  28. 【請求項28】 表画像データから複数のブロックを検
    出するブロック検出手段と、 表画像データに含まれる文字を認識して項目種別を判別
    する項目種別判別手段と、 前記判別された項目種別と前記検出されたブロックとを
    対応付けて記憶する記憶手段とを有することを特徴とす
    る文字処理装置。
  29. 【請求項29】 前記検出手段は、縦に繋がる複数のセ
    ルをブロックとして検出することを特徴とする請求項2
    8に記載の文字処理装置。
  30. 【請求項30】 前記検出手段は、横に繋がる複数のセ
    ルをブロックとして検出することを特徴とする請求項2
    8に記載の文字処理装置。
  31. 【請求項31】 前記項目種別判別手段は、前記検出さ
    れたブロックの先頭文字画像を文字認識した結果から項
    目種別を判別することを特徴とする請求項28に記載の
    文字処理装置。
  32. 【請求項32】 前記記憶手段に記憶されている項目種
    別とブロックとの対応関係を表示する表示手段を有する
    ことを特徴とする請求項28に記載の文字処理装置。
  33. 【請求項33】 画像情報を入力する工程のプログラム
    と、 前記入力した画像情報を文字認識する工程のプログラム
    と、 前記文字認識した結果に応じて項目種別を判別する工程
    のプログラムと、 前記判別された項目種別と、該項目に属する領域とを対
    応付けて表示する工程のプログラムとを記憶した、コン
    ピュータにより読取可能な記憶媒体。
  34. 【請求項34】 入力画像に、該入力画像を文字認識し
    て得た項目種別と、該項目種別に属すると判断された領
    域を示す情報とを重ねて表示する工程のプログラムと、 移動指示ボタンの入力に応じて前記領域における選択領
    域を切り替える工程のプログラムと、 選択可能な項目種別を表わすボタンを表示する工程のプ
    ログラムと、 前記項目種別を表わすボタンの入力に応じて、当該項目
    種別を前記選択領域に対応付けて記憶する工程のプログ
    ラムとを記憶した、コンピュータにより読取可能な記憶
    媒体。
  35. 【請求項35】 表画像データから複数のブロックを検
    出する工程のプログラムと、 表画像データに含まれる文字を認識して項目種別を判別
    する工程のプログラムと、 前記判別された項目種別と前記検出されたブロックとを
    対応付けて記憶する工程のプログラムとを記憶した、コ
    ンピュータにより読取可能な記憶媒体。
JP9269902A 1997-10-02 1997-10-02 文字処理方法及び装置及び記憶媒体 Pending JPH11110479A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9269902A JPH11110479A (ja) 1997-10-02 1997-10-02 文字処理方法及び装置及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9269902A JPH11110479A (ja) 1997-10-02 1997-10-02 文字処理方法及び装置及び記憶媒体

Publications (1)

Publication Number Publication Date
JPH11110479A true JPH11110479A (ja) 1999-04-23

Family

ID=17478814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9269902A Pending JPH11110479A (ja) 1997-10-02 1997-10-02 文字処理方法及び装置及び記憶媒体

Country Status (1)

Country Link
JP (1) JPH11110479A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2136316A2 (en) 2008-06-20 2009-12-23 Fujitsu Frontech Limited Form recognition apparatus, method, database generation apparatus, method, and storage medium
US8259326B2 (en) 2006-09-14 2012-09-04 Sharp Kabushiki Kaisha Image readout system, server apparatus, image readout apparatus, and terminal apparatus
KR101436182B1 (ko) * 2006-12-05 2014-09-01 덴끼 가가꾸 고교 가부시키가이샤 아크릴계 고무 조성물 및 그 가황물
JP2016018327A (ja) * 2014-07-07 2016-02-01 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
JP2016027681A (ja) * 2014-07-07 2016-02-18 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
JP2018081578A (ja) * 2016-11-17 2018-05-24 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
US10607381B2 (en) 2014-07-07 2020-03-31 Canon Kabushiki Kaisha Information processing apparatus
KR20230027605A (ko) * 2021-08-19 2023-02-28 (주)복부인 부동산 계약서 자동 분석 및 관리 장치

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8259326B2 (en) 2006-09-14 2012-09-04 Sharp Kabushiki Kaisha Image readout system, server apparatus, image readout apparatus, and terminal apparatus
KR101436182B1 (ko) * 2006-12-05 2014-09-01 덴끼 가가꾸 고교 가부시키가이샤 아크릴계 고무 조성물 및 그 가황물
EP2136316A2 (en) 2008-06-20 2009-12-23 Fujitsu Frontech Limited Form recognition apparatus, method, database generation apparatus, method, and storage medium
US8891871B2 (en) 2008-06-20 2014-11-18 Fujitsu Frontech Limited Form recognition apparatus, method, database generation apparatus, method, and storage medium
JP2016018327A (ja) * 2014-07-07 2016-02-01 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
JP2016027681A (ja) * 2014-07-07 2016-02-18 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
US10607381B2 (en) 2014-07-07 2020-03-31 Canon Kabushiki Kaisha Information processing apparatus
JP2018081578A (ja) * 2016-11-17 2018-05-24 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
KR20230027605A (ko) * 2021-08-19 2023-02-28 (주)복부인 부동산 계약서 자동 분석 및 관리 장치

Similar Documents

Publication Publication Date Title
JP4897520B2 (ja) 情報配信システム
EP1764999B1 (en) Image display device image display method, and computer product
JPH11196257A (ja) 画像処理システム
JPH11110479A (ja) 文字処理方法及び装置及び記憶媒体
JP2003209643A (ja) 画像処理装置
JPH0221024B2 (ja)
JPS6019227A (ja) 文書処理方法
US6504540B1 (en) Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
JP3388451B2 (ja) 手書き入力装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JPH0778148A (ja) 情報処理装置及び方法
JPH08286881A (ja) 画面プレゼンテーション機能を持つ文書作成装置及び画面プレゼンテーション方法
JP4109738B2 (ja) 画像処理方法及び装置及びその記憶媒体
JPH0728801A (ja) イメージデータ処理方法及びその装置
JP3791937B2 (ja) ワードプロセッサ装置
JPH103516A (ja) 情報処理方法及び装置
JPH0388086A (ja) 文書読取装置
JP2939150B2 (ja) 情報処理方法
JPH0962749A (ja) 表形式エディタ
JPH0744299A (ja) 文字入力装置
JPH096899A (ja) 画像処理装置及び方法
JP2593975B2 (ja) 電子組版装置における文字列抽出方法及び文字列抽出装置
JP2004086630A (ja) 差異表示プログラムおよび装置
JPH09179285A (ja) 検版装置
JPH0922411A (ja) 文書処理方法及びその装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040930

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070626

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080513