JP2003108919A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2003108919A
JP2003108919A JP2001305532A JP2001305532A JP2003108919A JP 2003108919 A JP2003108919 A JP 2003108919A JP 2001305532 A JP2001305532 A JP 2001305532A JP 2001305532 A JP2001305532 A JP 2001305532A JP 2003108919 A JP2003108919 A JP 2003108919A
Authority
JP
Japan
Prior art keywords
character string
character
image
screen
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001305532A
Other languages
English (en)
Inventor
Mitsuru Yamamoto
充 山本
Hirobumi Noda
博文 納田
Kenta Yanagida
健太 柳田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2001305532A priority Critical patent/JP2003108919A/ja
Publication of JP2003108919A publication Critical patent/JP2003108919A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 表示された画像を確認しつつ文字を訂正する
際、操作者の負担が軽減可能な文字認識装置を提供す
る。 【解決手段】 文字列表記を含む画像から文字列を認識
し、認識の妥当性を示す情報を生成するする文字認識部
122と、認識した文字列を画面上に表示し、前記文字
列表記を含む画像に前記情報を付加して画面上に表示す
る画面表示制御部124とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像に対して文字
認識を行って文字を表示する文字認識装置に関する。
【0002】
【従来の技術】従来より、画像として読み込まれた文字
列を、文字列データに変換する装置として文字認識装置
がある。この文字認識装置は、スキャナなどにより読み
込んだ文章の画像に対してOCR(Optical Character
Recognition)機能により文字認識を行い、その結果得
られた文字列と読み込んだ文章の画像とを画面上に表示
して、操作者からこの文字列の誤りの訂正を受付ける装
置である。
【0003】読み込まれる文章の画像は、例えば、定型
の処方箋であり、文章の記入位置が予めこの文字認識装
置に記憶されている。そして、この文字認識装置は、既
に記入がなされた処方箋の画像を読み込み、上述の記入
位置にある画像に対し、文字認識を実行し、認識した文
字列と読み込んだ文章の画像とを画面上に表示する。
【0004】さらに、この文字認識装置は、表示した文
字列を訂正するための入力を操作者から受付ける。図1
0は、このような従来の文字認識装置での文字入力の一
例を説明するための図である。表示画面1000は、こ
の文字認識装置において表示される画面であり、文書全
体の画像を表示する画像表示領域1001と、この画像
内に含まれる文字列毎に、この文字列に対して文字認識
を行った結果得られる文字列を表示し、この文字列の訂
正入力を行うための文字入力領域1011、1012及
び1013とを有する。
【0005】この文字認識装置は、画像内の画像表示範
囲1002、1003及び1004にある文字列の画像
に対し、OCR機能により文字認識を実行する。操作者
は、画像内の画像表示範囲1002、1003及び10
04に表示されている文字列の画像を確認し、文字入力
領域1011、1012及び1013に表示された文字
列が適切か否かの判断を行い、この文字列が不適切であ
る場合、キーボード等の入力機器を用いて文字入力領域
1011、1012及び1013に適切な文字列を入力
し、文字列の訂正を行う。
【0006】以下、画像中における文字列と、文字とし
て認識された文字列とを区別するため、便宜的に前者を
文字列画像と呼び、後者を文字列データと呼ぶこととす
る。なお、文字認識を行って得られたれた文字列データ
及び操作者により入力された文字列データは、テキスト
などの決められた形式で記録される。このように、従来
の文字認識装置によると、文章中の文字列画像と、当該
文字列画像に対して文字認識を行って得られた文字列デ
ータとを並行して画面上に表示し、文字列データについ
ての訂正が操作者に促されるので、操作者は、文字列デ
ータを簡便に訂正することができる。
【0007】
【発明が解決しようとする課題】しかしながら、このよ
うな文字認識装置を用いて、文字データを訂正する場
合、文字列画像が適切な文字列データに変換されている
か否かの判断は、操作者に委ねられており、操作者は、
全ての文字列データについて訂正の可否判断を行わなけ
ればならず、しかも、この判断に際して、対応関係にあ
る文字列画像及び文字列を探し出して比較参照しなけれ
ばならず、操作者の負担は多大なものとなる。
【0008】そこで本発明は、これらを考慮してなされ
たものであり、表示された画像を確認しつつ文字を訂正
する際、操作者の負担が軽減される文字認識装置を提供
することを目的とする。
【0009】
【課題を解決するための手段】上記の目的を達成するた
めの本発明に文字認識装置は、文字列表記を含む画像か
ら文字列を認識する認識手段と、前記認識した文字列の
妥当性を示す情報を生成する生成手段と、認識した文字
列を画面上に表示する第1表示手段と、前記文字列表記
を含む画像に前記情報を付加して画面上に表示する第2
表示手段とを備えることを特徴とする。
【0010】また、本発明に係る文字認識方法は、文字
列表記を含む画像から文字列を認識する認識ステップ
と、前記認識の妥当性を示す情報を生成する生成ステッ
プと、認識した文字列を画面上に表示する第1表示ステ
ップと、前記文字列表記を含む画像に前記情報を付加し
て画面上に表示する第2表示ステップとを含むことを特
徴とする。
【0011】また、本発明に係るプログラムを記録した
コンピュータ読み取り可能な記録媒体は文字列表記を含
む画像から文字列を認識する認識ステップと、前記認識
の妥当性を示す情報を生成する生成ステップと、認識し
た文字列を画面上に表示する第1表示ステップと、前記
文字列表記を含む画像に前記情報を付加して画面上に表
示する第2表示ステップとを実行させることを特徴とす
る。
【0012】
【発明の実施の形態】本発明の実施の形態について、図
面を参照しながら詳細に説明する。 <構成>図1は、本発明の実施の形態の1つであるFA
X―OCR装置100の機能ブロック図である。
【0013】FAX―OCR装置100は、外部から画
像データを受信し、この画像に含まれている文字列画像
を文字データに変換して記憶する装置であり、FAX受
信部110と、制御部120と、受付部130と、記憶
部140と、表示部145とを有する。さらに、図1
は、上述のFAX―OCR装置100の他に、FAX―
OCR装置100に対して画像データを送信するFAX
送信装置180も合わせて示している。
【0014】なお、FAX―OCR装置100及びFA
X送信装置180は、公衆通信回線を介して接続されて
いる。受付部130は、キーボード及びマウスなどの入
力装置からなり、操作者からの入力を受付ける。表示部
145は、CRTなどの表示装置からなり、受信した信号
にもとづいて表示する。
【0015】FAX受信部110は、FAX送信装置1
80から送信される画像データを受信し、制御部120
に出力する。制御部120は、CPUなどの演算部を有
し、さらに、画像データ管理部121と、文字認識部1
22と、色対応づけ部123と、画面表示制御部124
とを有する。
【0016】画像データ管理部121は、FAX受信部
110から出力された画像データ151を受信し、記憶
部140内に新たなディレクトリ150を生成し、この
ディレクトリに受信した画像データを格納する。画像デ
ータ管理部121は、新たに画像データをFAX受信部
110から受信する毎に、上述のようなディレクトリの
生成と画像データの格納を実施する。
【0017】その結果、記憶部140内には、例えば、
ディレクトリ150、160及び170の3つのディレ
クトリが存在することとする。画像データ管理部121
は、受付部130から到来する記憶部140内の画像デ
ータを読み出す指示により、記憶部140内に格納した
画像データを読出し、読み出した画像データを文字認識
部122及び画面表示制御部124に出力する。
【0018】画面表示制御部124に出力される上述の
画像データは、画像データを一旦、表示部145に表示
させ、画像データの画面上の位置を基準の位置に合わせ
るために用いられる。即ち、操作者は、表示部145の
画面上に表示された画像データが、上述の基準位置から
ずれていることを認識し、このずれを解消するように受
付部130に指示を入力する。
【0019】また、画像データ管理部121は、受付部
130から画面上の画像データの位置を修正するための
指示(以下、「画像位置修正指示」という。)を受け取
り、この指示を画面表示制御部124に出力する。この
画像位置修正指示は、具体的には、操作者によるマウス
及びキーボード操作により生成される信号のことであ
る。
【0020】文字認識部122は、前記調整が終了した
後の画像データについて、文字認識を実行する。より具
体的には、前記調整が完了すると文字認識部122は、
記憶部140に格納されている文字列画像表示範囲記録
ファイル142読出し、文字認識の対象となる画像の範
囲及びこの範囲に対応づけられている文字列IDを取得
し、この範囲の画像に対して文字認識を実行する。
【0021】なお、上述の文字列IDは、上述の範囲と、
この範囲に含まれている画像と、この画像にもとづいて
文字認識を行って得られる文字列と、この文字列を表示
する文字入力領域とを対応づけるためのキーとしての役
割を果たす。また、文字認識部122は、上述の文字認
識に伴って、一番妥当と推測される文字列、即ち、文字
列データと、この推測の妥当性の度合いが百分率で示さ
れた確信度を生成する。
【0022】このような確信度の生成は、従来の文字認
識装置においても行われており、公知技術であるため、
確信度の生成については、説明を省略する。文字認識部
122は、文字列画像表示範囲記録ファイル142に示
されている画像の範囲に対する文字認識を全て完了し、
各文字認識毎に、文字列データと確信度の生成を終える
と、生成したこれら文字列データと確信度の組を画像デ
ータ毎に用意されるファイル、即ち、ここでは文字列デ
ータファイル400に含め、文字認識を実施した画像デ
ータ151が格納されているディレクトリ150内に格
納すると共に、上述の文字列データと確信度の組、文字
認識を行った画像の範囲及びこの範囲に対応づけられて
いる文字列IDを色対応づけ部123に出力する。
【0023】また、文字認識部122は、受付部130
から文字データを訂正するためのデータを受け取り、こ
のデータに従って文字列データファイル152内の指定
された文字列データを更新する。なお、上述の指定は、
画面上の文字列画像又は文字列データをクリックするこ
とにより行われる。
【0024】その際、文字認識部122は、指定された
文字列データに対応づけられている確信度の値の代わり
に、操作者による文字列データの入力が完了している旨
を示すCコードを格納すると共に、このCコードを対応づ
けた文字列データの背景色及びこれに対応する文字列画
像の色を黒に調整するよう、色対応づけ部123に指示
する。
【0025】色対応づけ部123は、確信度が対応づけ
られていない文字列画像については、背景を白色とし、
文字列自体を黒色とするように、画面表示制御部124
に指示する。一方、確信度が対応づけられている文字列
画像について、色対応づけ部123は、その画像の背景
を上述の確信度に対応する色にするように、画面表示制
御部124に指示すると共に、この文字列画像に対して
文字認識を行って得られた文字列データの画面上の背景
色を前記確信度に対応する色にするように画面表示制御
部124に指示する。
【0026】より具体的には、画面表示制御部124
は、文字列データと確信度の組、文字認識を行った画像
の範囲及びこの範囲に対応づけられている文字列IDを文
字認識部122から受け取ると、記憶部140内に記憶
されている確信度色対応ファイル141を読み出し、こ
の確信度色対応ファイル141内に示されている確信度
と色の対応づけに従って、文字認識を行った画像の範囲
に含まれる背景、即ち、文字列画像の背景色及び文字列
データの背景色を確信度に対応する色とするように画面
表示制御部124に指示する。
【0027】画面表示制御部124は、先ず、画像デー
タ管理部121から画像データを受け取り、この画像デ
ータを表示するための信号を表示部145に出力する。
また、画像データ管理部121から画像位置修正指示を
受け取ると、画面表示制御部124は、この画像位置修
正指示に従い、表示部145において表示される画像デ
ータの画像位置、即ち、画面上における上下左右の位置
及び角度を調整する。
【0028】また、画面表示制御部124は、色対応づ
け部123から画面上に表示する文字列画像の背景色及
び文字列データの背景色についての指示を受け取った場
合、この指示にもとづいて、文字列画像の背景色及び文
字列データの背景色を調整して、表示部145に表示さ
せる。さらに、画面表示制御部124は、受付部130
から文字列画像の表示画面を拡大して表示する拡大表示
モードか、このような拡大を行わずに表示する通常表示
モードかの指示を受け取り、各モードに応じた表示のた
めの処理を実施する。
【0029】以下、画面表示制御部124が、拡大表示
モードの指示を受付部130から受け取っている場合に
ついて説明する。黒以外の色の指定がなされた文字列画
像の表示範囲及び文字列データが表示されている文字入
力領域がクリックされた場合、画面表示制御部124
は、上述の文字列画像を画面上の中心に再配置して予め
決められた倍率で拡大して表示する。
【0030】さらに、拡大表示された文字列画像の表示
範囲において、再度クリックがなされると、画面表示制
御部124は、この文字列画像を元の倍率及び位置に戻
して表示する。また、上述の拡大表示中に、黒以外の色
の指定がなされた他の文字列画像の表示範囲及び他の文
字列データが表示されている文字入力領域がクリックさ
れた場合、画面表示制御部124は、その文字列画像を
画面上の中心に再配置して予め決められた倍率で拡大し
て表示する。
【0031】次に、画面表示制御部124が、通常表示
モードの指示を受付部130から受け取っている場合に
ついて説明する。この場合、画面表示制御部124は、
黒以外の色の指定がなされた文字列画像の表示範囲及び
文字列データが表示されている文字入力領域がクリック
された場合であっても、上述のような拡大表示せず、文
字列画像を含む画像全体が操作者に確認できる倍率でこ
の画像を表示する。
【0032】なお、拡大表示モードか通常表示モードか
に関わらず、画面表示制御部124は、文字列データが
表示される文字入力領域を画面上において同倍率で表示
する。つまり、画面上の中央から左右に区切られ、例え
ば、左側が、文字列画像を含む画像専用で、表示モード
に応じて表示における倍率が変化する表示画面となって
おり、右側が文字入力領域専用で、固定倍率の表示画面
となっている。
【0033】記憶部140は、ハードディスクなどの記
録媒体からなり、画像データ管理部121から受け取っ
た画像データと以下の3種類のファイルを記憶してい
る。1種類目のファイルは、画像データ中の文字認識す
べき文字列の表示範囲を記録している文字列画像表示範
囲記録ファイルあり、2種類目のファイルは、確信度の
値と赤、橙、黄などの各色とを対応づけた確信度色対応
ファイルであり、このファイルは、予め記憶部140に
格納されている。
【0034】3種類目のファイルは、画像データ中の文
字列画像に対して文字認識を行って得られた文字列デー
タを格納する文字列データファイルあり、文字認識がな
された画像データと共に、同一のディレクトリ下に置か
れ、互いに関連づけられている。上述のディレクトリ
は、新たに画像データが取得される毎に画像データ管理
部121よって生成され、その中に、上述と同様、画像
データ及び文字列データファイルが格納される。 <データ>図2は、文字列画像表示範囲記録ファイル2
00のデータ構成を示す図である。
【0035】文字列ID列201は、上述の各種類のファ
イルに示されているデータとの対応を図るためのキーと
なる文字列ID「ID1」、「ID2」、「ID3」…などを示
している。XL列202は、文字列画像が表示される矩
形の範囲(以下、「矩形表示範囲」という。)の左上隅
の画面上におけるX座標を示し、YL列203は、前記
矩形表示範囲の左上隅の画面上におけるY座標を示す。
【0036】XR列204は、前記矩形表示範囲の右下
隅の画面上におけるX座標を示し、YR列205は、前
記矩形表示範囲の右下隅の画面上におけるY座標を示
す。つまり、外部より取得される画像データは、処方箋
などの一定様式の文章の画像であり、この文章中の記入
欄は決められた範囲に設けられており、上述の文字列画
像表示範囲記録ファイル200は、この記入欄の矩形表
示範囲を示す座標を予め記憶している。
【0037】なお、色対応づけ部123は、上述の矩形
表示範囲を、文字列画像の背景の範囲として認識する。
図3は、確信度色対応ファイル300のデータ構成を示
す図である。確信度列301は、文字認識部122によ
る文字認識の妥当性を示す確信度の範囲を百分率で示し
ている。
【0038】この確信度の範囲は5つに区分され、各範
囲は、0パーセントから100パーセントまでの確信度
の値を20パーセント毎に区切った範囲となっている。
ここで、例えば、確信度列301の最上段には、80〜
100と示されているが、これは、確信度の値が80%
を超え100%以下の範囲を意味する。色列303は、
赤、橙、黄、水色、青などの互いに異なる色を示してい
る。
【0039】例えば、確信度が低い範囲、即ち、確信度
の値が0%を超え20%以下の範囲では、警戒色として
よく用いられる赤が対応づけられ、また、その逆に確信
度が高い範囲、即ち、確信度の値が80%を超え100
%以下の範囲では、青が対応づけられている。図4は、
文字列データファイル400のデータ構成を示す図であ
る。
【0040】文字列ID列401は、図2と同様、上述
の各種類のファイルに示されているデータとの対応を図
るためのキーとなる文字列ID「ID1」、「ID2」、「ID
3」…などを示している。文字データ列403は、文字
認識部122による文字認識により得られた文字列デー
タを示している。
【0041】確信度列403は、文字認識の妥当性の度
合いを示す確信度の値を示している。なお、欄404に
おいて、確信度の値以外のCコードが示されているが、
これは、この欄の同行にある文字列データに対する操作
者による訂正が完了したため、文字認識部122がその
旨を示すCコードことを確信度の値に代えて格納したこ
とによる。 <動作>図5は、FAX―OCR装置100における処
理を示すフローチャートである。
【0042】FAX受信部110は、FAX送信装置1
80から画像データを受信し、この画像データを画像デ
ータ管理部121に出力する(ステップS500)。画
像データ管理部121は、デファオルトの画面である後
述の図7に示す表示画面700を表示するように画面表
示制御部124に指示する。そして、この指示を受け取
った画面表示制御部124は、上述の表示画面700を
先ず表示部145に表示させる(ステップS501)。
【0043】以下、画面表示制御部124が行う処理に
おいて、「表示させる」とあるのは、表示部145に表
示させることを意味するものとする。また、画像データ
管理部121は、FAX受信部110から受け取った画
像データを文字認識部122及び画面表示制御部124
に出力すると共に、画面表示制御部124に対し、この
画像データを、上述の表示画面700中にある画像表示
領域701内に、この画像データ全体が収まる予め決め
られた倍率で表示するよう指示する。
【0044】この指示を受けた画面表示制御部124
は、この画像データを画像表示領域701内に表示させ
る(ステップS502)。表示された画像データの位置
が基準点よりズレている場合、受付部130は、このズ
レを解消するための修正指示を受付け、この指示が画面
表示制御部124に出力され、その結果、画面表示制御
部124は、上述のズレを解消して表示させる(ステッ
プS503)。
【0045】文字認識部122は、画像データ管理部1
21から画像データを受け取ると、記憶部140から文
字列画像表示範囲記録ファイル142を読み込み(ステ
ップS504)、文字認識をする画像中の範囲を特定
し、この範囲の画像に対して文字認識を実施し、その結
果、文字列データ及び確信度の組を生成する(ステップ
S505)。
【0046】文字認識部122は、生成した上述の組と
文字認識を実施し画像中の範囲とこの範囲に対応づけら
れている文字列IDとを色対応づけ部123に出力す
る。そして、これらを受け取ると色対応づけ部123
は、記憶部140から確信度色対応ファイル141を読
み込み(ステップS506)、確信度の値と色との対応
づけを把握し、この対応関係にしたがって、画像中にお
ける文字列画像の背景の色を調整するように画面表示制
御部124に指示する。
【0047】この指示にしたがい、画面表示制御部12
4は、文字列画像の背景の色を調整して表示させる(ス
テップS507)。さらに、文字認識部122は、上述
の表示画面700中の文字入力領域711、712、7
13などに、文字認識の結果得られた文字列データを表
示するよう画面表示制御部124に指示する。
【0048】その際、文字認識部122は、文字列デー
タとその表示位置、即ち、入力領域との対応関係を示す
ために、上述の文字列データに文字列IDを付随させ、
前記指示を行う。文字入力領域711、712、713
には、上述の文字列IDがそれぞれ対応づけられてお
り、画面表示制御部124は、文字列IDをキーとし
て、文字列データをこの文字列データに対応する入力領
域内に表示させる(ステップS508)。
【0049】また、文字認識部122は、画像中におけ
る文字列画像の背景色を調整するのに伴い、上述の文字
入力領域711、712、713内に表示される文字列
データの背景色をこの文字列データが生成される際に行
われた文字認識の確信度に対応する色にするように画面
表示制御部124に指示する。この指示にしたがい、画
面表示制御部124は、上述の文字入力領域711、7
12、713内に表示される文字列データの背景色を上
述の確信度に対応する色にして表示させる(ステップS
509)。
【0050】そして、画面表示制御部124は、表示さ
れた文字列データの訂正を行う処理(以下、「訂正処
理」という。)を実施して(ステップS510)処理を
終了する。図6は、この訂正処理の詳細を示すフローチ
ャートである。文字認識部122は、受付部130にお
いて文字列データがクリックされたか否かを判断し(ス
テップS601)、クリックされた場合、この文字列デ
ータを訂正の対象する(ステップS602)。
【0051】つまり、新たな文字入力がなされると、こ
の文字列データが更新されることとなる。そして、画面
表示制御部124は、現在、拡大表示モードか否かを判
断し(ステップS603)、拡大表示モードである場
合、クリックされた文字列データに対応する文字列画像
の表示範囲を文字列IDとキーとして見つけ出し(ステ
ップS604)、この表示範囲を画面の中心に配置して
拡大し、表示させる(ステップS605)。
【0052】文字認識部122は、受付部130が訂正
入力を受付けたか否かを判断し(ステップS606)、
訂正入力を受付けた場合、この入力にしたがい、文字列
データを訂正し、表示するように画面表示制御部124
に指示する。この指示にしたがい、画面表示制御部12
4は、訂正がなされた文字列データを対応する文字入力
領域に表示させる(ステップS607)。
【0053】さらに、画面表示制御部124は、現在、
上述の拡大表示を実施し、かつ、拡大表示とトリガとな
ったクリックがなされた表示対象、即ち、文字列画像又
は文字列データが再度クリックされたか否かを判断し
(ステップS608)、この条件に適合する場合、文字
列画像の拡大表示をもとの表示サイズに戻して表示させ
(ステップS609)、画面表示制御部124による文
字列データがクリックされたか否かを判断するステップ
S601に戻る。
【0054】一方、上述の条件に適合しない場合、画面
表示制御部124は、画面表示制御部124による文字
列データがクリックされたか否かを判断するステップS
601に戻る。また、ステップS603における判断に
おいて、現在拡大表示モードでない場合、文字認識部1
22は、受付部130が訂正入力を受付けたか否かを判
断するステップS606を実行する。
【0055】また、画面表示制御部124による、文字
列データがクリックされたか否かを判断するステップS
601において、文字列データがクリックされていない
場合、文字認識部122は、文字列画像がクリックされ
たか否かを判断し(ステップS610)、この文字列画
像がクリックされた場合、この文字列画像に対応する文
字列データを訂正の対象とする(ステップS611)。
【0056】なお、この文字列画像と文字列データとの
対応関係の把握は、文字列IDを用いて行われる。そし
て、画面表示制御部124は、クリックされた文字列画
像に対応する文字列画像の表示範囲を取得し(ステップ
S612)、この表示範囲を画面の中心に配置して拡大
して表示させるステップS605を実行する。
【0057】文字認識部122による、文字列画像がク
リックされたか否かを判断するステップS610におい
て、この文字列画像がクリックされなかった場合、及
び、受付部130が訂正入力を受付けたか否かを判断す
るステップS606において、訂正入力が受付けられな
かった場合、文字認識部122は、受付部130が訂正
終了の指示を受付けたか否かを判断し(ステップS61
3)、訂正終了の指示を受付けた場合、処理を終了す
る。
【0058】一方、訂正終了の指示を受付けなかった場
合、文字認識部122による、受付部130において文
字列データがクリックされたか否かを判断するステップ
S601に戻る。 <表示>図7は、図5中におけるステップS501にお
いて表示される表示画面700を示す図である。
【0059】画像表示領域701は、画像データを表示
するために用意される表示領域である。文字入力領域7
11、712、713は、文字データが表示され、この
文字データの訂正を行うために用意される表示領域であ
る。拡大表示チェックボックス720は、拡大表示モー
ドを設定するためのチェックボックスであり、操作者
は、このボックスをクリックすることにより、チェック
マークを付すことができ、通常表示モードから拡大表示
モードへの切り替えがなされる。
【0060】逆に、拡大表示モードから通常表示モード
への切り替えは、操作者が拡大表示チェックボックス7
20を、再度クリックされることにより実現される。そ
の際、上述のチェックマークは、消去されることとな
る。表示範囲730、731、732は、文字列画像表
示範囲記録ファイル200に示される座標により特定さ
れる矩形の範囲、即ち、文字列画像が表示される範囲で
ある。
【0061】図8は、文字認識部122による文字認識
が行われた後の表示画面700の表示状態を示す図であ
る。この状態は、図5におけるステップS509におけ
る状態に相当する。位置合わせマーク831、832、
833及び834は、画像データに含まれているマーク
であって、これらマークを画像表示領域701の四隅に
表示させることにより、画像データの画面上における位
置を基準位置に合わせるためのものである。
【0062】カーソル840は、表示画面700の文字
列画像及び文字列データを指定するためのものである。
ここで、文字列画像の背景色及びこの文字列画像に対し
て文字認識を行った結果得られる文字列データの背景色
は、この文字認識における確信度の値に対応する色に調
整されて表示されている。
【0063】なお、図中において、白及び黒以外の色を
表現できないため、便宜上、これら以外の色を示すもの
として、小さなドットの集まりで構成されるパターンを
用いている。これは、後述の図9においても同様であ
る。図9は、図8のカーソル840の位置において、ク
リックがなされた場合の表示画面700の図である。
【0064】クリックされた文字列画像は、画像表示領
域701の中心に配置され、拡大表示されている。ま
た、カーソル841は、カーソル840と同様のもので
あるが、拡大表示チェックボックス720がチェックさ
れている状態で、図9におけるカーソル841の位置で
クリックしても、上述と同様な拡大表示がなされる。
【0065】ここでも、文字列画像の背景色及びこの文
字列画像に対して文字認識を行った結果得られる文字列
データの背景色は、この文字認識における確信度の値に
対応する色に調整されて表示されている。以上のよう
に、本実施形態によれば、FAX―OCR装置100に
おいて、表示された画像を確認しつつ文字を訂正する場
合であっても、文字列画像に対して文字認識を実行して
得られた文字データの確信度の値に対応する色を背景色
として、文字列画像及び文字データに付加され、この色
が操作者に対し、この文字訂正についての要否を示唆す
るので、操作者の訂正要否の判断における負担が軽減さ
れる。
【0066】また、画像表示領域701内に表示される
文字列画像の背景色と、文字入力領域内に表示されるこ
の文字列画像を文字認識して得られた文字データの背景
色とが同じ色であるため、操作者によるこれら対応関係
の把握が容易になる。なお、本実施の形態では、確信度
の値に対応する色を、文字列画像の背景と、文字列画像
を文字認識して得られた文字データの背景とに付した
が、文字自体に付しても構わず、また、これらにアンダ
ーラインを引き、このアンダーラインに前記色を付して
もよく、さらに、これらそれぞれを枠で囲み、この枠に
前記色を付してもよい。
【0067】また、明細書中に記載の「クリック」とあ
るのは、「ダブルクリック」と読み替えてもよい。
【0068】
【発明の効果】以上の説明から明らかなように、本発明
に係る文字認識装置は、文字列表記を含む画像から文字
列を認識する認識手段と、前記認識した文字列の妥当性
を示す情報を生成する生成手段と、認識した文字列を画
面上に表示する第1表示手段と、前記文字列表記を含む
画像に前記情報を付加して画面上に表示する第2表示手
段とを備えることを特徴とし、本発明に係る文字認識方
法は、文字列表記を含む画像から文字列を認識する認識
ステップと、前記認識の妥当性を示す情報を生成する生
成ステップと、認識した文字列を画面上に表示する第1
表示ステップと、前記文字列表記を含む画像に前記情報
を付加して画面上に表示する第2表示ステップとを含む
ことを特徴とし、また、本発明に係るプログラムを記録
したコンピュータ読み取り可能な記録媒体は、文字列表
記を含む画像から文字列を認識する認識ステップと、前
記認識の妥当性を示す情報を生成する生成ステップと、
認識した文字列を画面上に表示する第1表示ステップ
と、前記文字列表記を含む画像に前記情報を付加して画
面上に表示する第2表示ステップとを実行させることを
特徴とする。
【0069】これにより、操作者は、画面上の文字列表
記を確認する際、視線変更を要さずにこの文字列表記に
付加されている情報により推測の妥当性を把握すること
ができ、当該文字列表記に相当する文字列を訂正すべき
か否かの判断の参考とすることができるため、当該判断
における操作者の負担の軽減化が図られる。また、前記
文字認識装置は、さらに、認識すべき文字列表記の画像
範囲を複数記憶している記憶手段を備え、前記認識手段
は、前記各画像範囲から前記認識を行い、前記第2表示
手段は、前記認識を行った各画像範囲に当該認識の妥当
性を示す情報を付加するとしてもよい。
【0070】これにより、画像中に認識が不要な文字列
表記があった場合でも、認識が必要な文字列表記のみが
文字認識され、不要な文字認識の実行が回避される。さ
らに、操作者による文字列表記の参照に伴って、視点移
動を要さず容易に文字認識の妥当性を示す情報が参照さ
れる。また、前記第2表示手段は、前記認識のもととな
った画像範囲の色属性の色を当該認識の妥当性に応じた
色に変更することにより前記付加を実施するとしてもよ
い。
【0071】これにより、画像範囲に付加されている色
により前記妥当性が示されるため、操作者により文字列
表記が確認される際、一見して前記妥当性が認識され
る。また、前記文字認識装置は、さらに、前記第1表示
手段により表示された文字列に対する訂正を、操作者か
ら受付ける受付手段を備えるとしてもよい。これによ
り、訂正の必要がある文字列については、操作者により
訂正がなされる。
【0072】また、前記文字認識装置は、さらに、前記
第2表示手段により表示されている前記画像範囲のうち
いずれか1つの指定を操作者から受付ける指定受付手段
と、前記指定がなされた画像範囲を画面上に拡大して表
示する拡大表示手段とを備えるとしてもよい。これによ
り、指定がなされた画像範囲、即ち、文字列表記が拡大
表示され、その内容が操作者により容易に把握される。
【0073】また、前記指定は、前記画像範囲をクリッ
ク又はダブルクリックすることにより行うとしてもよ
い。これにより、前記拡大表示のための操作は、拡大表
示の対象となる画像範囲、即ち、文字列表記を直接クリ
ック又はダブルクリックすることにより実行され、当該
操作は、視点移動を伴わずに実施可能なため、操作者の
負担の軽減化が図られる。
【0074】また、前記文字認識装置は、さらに、前記
第1表示手段により表示されている文字列のうちいずれ
か1つの指定を操作者から受付ける指定受付手段と、前
記指定がなされた文字列の認識のもととなった画像範囲
を画面上に拡大して表示する拡大表示手段とを備えると
してもよい。これにより、文字列を指定することによ
り、指定がなされた文字列の認識のもととなった画像範
囲、即ち、文字列表記が画面上に拡大表示されるため、
操作者によりこれらの比較参照が容易になされる。
【0075】また、前記指定は、画面上の文字列をクリ
ック又はダブルクリックすることにより行うとしてもよ
い。これにより、前記拡大表示のための操作は、内容を
確認したい文字列をクリック又はダブルクリックするこ
とにより実行され、当該操作は、視点移動を伴わずに実
施可能なため、操作者の負担の軽減化が図られる。
【0076】前記第1表示手段は、文字列の色属性の色
を、当該文字列の認識の妥当性に応じた色に変更すると
してもよい。これにより、画面上の文字列に付加された
色によって、当該文字列の前記認識の妥当性が操作者に
より容易に把握される。そして、前記第2表示手段は、
前記画像範囲における文字列表記の背景を前記色にする
ことにより、前記変更を実施するとしてもよく、前記画
像範囲における文字列表記に前記色のアンダーラインを
付すことにより、前記変更を実施するとしてもよく、前
記画像範囲を前記色の枠で囲むことにより、前記変更を
実施するとしてもよく、また、前記画像範囲における文
字列表記を前記色にすることにより、前記変更を実施す
るとしてもよい。
【0077】これにより、画像範囲、即ち、文字列表記
から視点移動を要さず、当該文字列表記に対応する文字
列の前記認識の妥当性が操作者により把握される。さら
に、第1表示手段は、画面上に表示された前記文字列の
背景を前記色にすることにより、前記変更を実施すると
してもよく、画面上に表示された前記文字列に前記色の
アンダーラインを付すことにより、前記変更を実施する
としてもよく、画面上に表示された前記文字列を前記色
の枠で囲むことにより、前記変更を実施するとしてもよ
く、また、画面上に表示された前記文字列を前記色にす
ることにより、前記変更を実施するとしてもよい。
【0078】これにより、文字列から視点移動を要さ
ず、当該文字列の前記認識の妥当性が操作者により把握
される。
【図面の簡単な説明】
【図1】本発明の実施の形態の1つであるFAX―OC
R装置の機能ブロック図である。
【図2】文字列画像表示範囲記録ファイルのデータ構成
を示す図である。
【図3】確信度色対応ファイルのデータ構成を示す図で
ある。
【図4】文字列データファイルのデータ構成を示す図で
ある。
【図5】FAX―OCR装置における処理を示すフロー
チャートである。
【図6】訂正処理の詳細を示すフローチャートである。
【図7】図5中におけるステップS501において表示
される表示画面を示す図である。
【図8】文字認識部による文字認識が行われた後の表示
画面の表示状態を示す図である。
【図9】図8のカーソル840の位置において、クリッ
クがなされた場合の表示画面の図である。
【図10】従来の文字認識装置での文字入力の一例を説
明するための図である。
【符号の説明】
100 OCR装置 110 FAX受信部 120 制御部 121 画像データ管理部 122 文字認識部 123 色対応づけ部 124 画面表示制御部 130 受付部 140 記憶部 141 確信度色対応ファイル 142 文字列画像表示範囲記録ファイル 145 表示部 150、160、170 ディレクトリ 151 画像データ 152 文字列データファイル 180 FAX送信装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 柳田 健太 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5B064 AA01 BA01 EA05 EA08 EA11 EA14 FA05 FA10 FA13

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 文字列表記を含む画像から文字列を認識
    する認識手段と、 前記認識した文字列の妥当性を示す情報を生成する生成
    手段と、 認識した文字列を画面上に表示する第1表示手段と、 前記文字列表記を含む画像に前記情報を付加して画面上
    に表示する第2表示手段とを備えることを特徴とする文
    字認識装置。
  2. 【請求項2】 さらに、 認識すべき文字列表記の画像範囲を複数記憶している記
    憶手段を備え、 前記認識手段は、前記各画像範囲から前記認識を行い、 前記第2表示手段は、前記認識を行った各画像範囲に当
    該認識の妥当性を示す情報を付加することを特徴とする
    請求項1記載の文字認識装置。
  3. 【請求項3】 前記第2表示手段は、前記認識のもとと
    なった画像範囲の色属性の色を当該認識の妥当性に応じ
    た色に変更することにより前記付加を実施することを特
    徴とする請求項2記載の文字認識装置。
  4. 【請求項4】 さらに、 前記第1表示手段により表示された文字列に対する訂正
    を、操作者から受付ける受付手段を備えることを特徴と
    する請求項1記載の文字認識装置。
  5. 【請求項5】 さらに、 前記第2表示手段により表示されている前記画像範囲の
    うちいずれか1つの指定を操作者から受付ける指定受付
    手段と、 前記指定がなされた画像範囲を画面上に拡大して表示す
    る拡大表示手段とを備えることを特徴とする請求項2記
    載の文字認識装置。
  6. 【請求項6】 前記指定は、前記画像範囲をクリック又
    はダブルクリックすることにより行うことを特徴とする
    請求項5記載の文字認識装置。
  7. 【請求項7】 さらに、 前記第1表示手段により表示されている文字列のうちい
    ずれか1つの指定を操作者から受付ける指定受付手段
    と、 前記指定がなされた文字列の認識のもととなった画像範
    囲を画面上に拡大して表示する拡大表示手段とを備える
    ことを特徴とする請求項2記載の文字認識装置。
  8. 【請求項8】 前記指定は、画面上の文字列をクリック
    又はダブルクリックすることにより行うことを特徴とす
    る請求項7記載の文字認識装置。
  9. 【請求項9】 前記第1表示手段は、文字列の色属性の
    色を、当該文字列の認識の妥当性に応じた色に変更する
    ことを特徴とする請求項2記載の文字認識装置。
  10. 【請求項10】 前記第2表示手段は、前記画像範囲に
    おける文字列表記の背景を前記色にすることにより、前
    記変更を実施することを特徴とする請求項3記載の文字
    認識装置。
  11. 【請求項11】 前記第2表示手段は、前記画像範囲に
    おける文字列表記に前記色のアンダーラインを付すこと
    により、前記変更を実施することを特徴とする請求項3
    記載の文字認識装置。
  12. 【請求項12】 前記第2表示手段は、前記画像範囲を
    前記色の枠で囲むことにより、前記変更を実施すること
    を特徴とする請求項3記載の文字認識装置。
  13. 【請求項13】 前記第2表示手段は、前記画像範囲に
    おける文字列表記を前記色にすることにより、前記変更
    を実施することを特徴とする請求項3記載の文字認識装
    置。
  14. 【請求項14】 前記第1表示手段は、画面上に表示さ
    れた前記文字列の背景を前記色にすることにより、前記
    変更を実施することを特徴とする請求項9記載の文字認
    識装置。
  15. 【請求項15】 前記第1表示手段は、画面上に表示さ
    れた前記文字列に前記色のアンダーラインを付すことに
    より、前記変更を実施することを特徴とする請求項9記
    載の文字認識装置。
  16. 【請求項16】 前記第1表示手段は、画面上に表示さ
    れた前記文字列を前記色の枠で囲むことにより、前記変
    更を実施することを特徴とする請求項9記載の文字認識
    装置。
  17. 【請求項17】 前記第1表示手段は、画面上に表示さ
    れた前記文字列を前記色にすることにより、前記変更を
    実施することを特徴とする請求項9記載の文字認識装
    置。
  18. 【請求項18】 文字列表記を含む画像から文字列を認
    識する認識ステップと、 前記認識の妥当性を示す情報を生成する生成ステップ
    と、 認識した文字列を画面上に表示する第1表示ステップ
    と、 前記文字列表記を含む画像に前記情報を付加して画面上
    に表示する第2表示ステップとを含むことを特徴とする
    文字認識方法。
  19. 【請求項19】 文字列表記を含む画像から文字列を認
    識する認識ステップと、 前記認識の妥当性を示す情報を生成する生成ステップ
    と、 認識した文字列を画面上に表示する第1表示ステップ
    と、 前記文字列表記を含む画像に前記情報を付加して画面上
    に表示する第2表示ステップとを実行させるためのプロ
    グラムが記録されているコンピュータ読み取り可能な記
    録媒体。
JP2001305532A 2001-10-01 2001-10-01 文字認識装置 Withdrawn JP2003108919A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001305532A JP2003108919A (ja) 2001-10-01 2001-10-01 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001305532A JP2003108919A (ja) 2001-10-01 2001-10-01 文字認識装置

Publications (1)

Publication Number Publication Date
JP2003108919A true JP2003108919A (ja) 2003-04-11

Family

ID=19125309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001305532A Withdrawn JP2003108919A (ja) 2001-10-01 2001-10-01 文字認識装置

Country Status (1)

Country Link
JP (1) JP2003108919A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007029625A1 (ja) * 2005-09-06 2007-03-15 Tosho Inc. 処方箋受付装置
JP2007140632A (ja) * 2005-11-15 2007-06-07 Tosho Inc 処方箋受付装置
WO2012147369A1 (ja) * 2011-04-27 2012-11-01 パナソニック株式会社 手書き文字入力装置及び手書き文字入力方法
JP2013012223A (ja) * 2012-08-29 2013-01-17 Canon Software Inc 画像処理装置及び方法、並びにプログラム
JP6462930B1 (ja) * 2018-03-28 2019-01-30 AI inside株式会社 文字認識装置、方法およびプログラム
JP2022033817A (ja) * 2018-01-23 2022-03-02 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP2022064870A (ja) * 2020-10-14 2022-04-26 公立大学法人和歌山県立医科大学 画像情報認識装置、画像情報記憶媒体構築方法、画像情報認識方法、そのためのコンピュータプログラム、及び保健情報管理方法
JP7487394B2 (ja) 2020-01-21 2024-05-20 キヤノン株式会社 文書を電子化する画像処理システム、その制御方法及びプログラム

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007029625A1 (ja) * 2005-09-06 2007-03-15 Tosho Inc. 処方箋受付装置
JP2007140632A (ja) * 2005-11-15 2007-06-07 Tosho Inc 処方箋受付装置
JP4548843B2 (ja) * 2005-11-15 2010-09-22 株式会社トーショー 処方箋受付装置
WO2012147369A1 (ja) * 2011-04-27 2012-11-01 パナソニック株式会社 手書き文字入力装置及び手書き文字入力方法
JP2012238295A (ja) * 2011-04-27 2012-12-06 Panasonic Corp 手書き文字入力装置及び手書き文字入力方法
JP2013012223A (ja) * 2012-08-29 2013-01-17 Canon Software Inc 画像処理装置及び方法、並びにプログラム
JP2022033817A (ja) * 2018-01-23 2022-03-02 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP7150967B2 (ja) 2018-01-23 2022-10-11 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP6462930B1 (ja) * 2018-03-28 2019-01-30 AI inside株式会社 文字認識装置、方法およびプログラム
JP2019175037A (ja) * 2018-03-28 2019-10-10 AI inside株式会社 文字認識装置、方法およびプログラム
JP7487394B2 (ja) 2020-01-21 2024-05-20 キヤノン株式会社 文書を電子化する画像処理システム、その制御方法及びプログラム
JP2022064870A (ja) * 2020-10-14 2022-04-26 公立大学法人和歌山県立医科大学 画像情報認識装置、画像情報記憶媒体構築方法、画像情報認識方法、そのためのコンピュータプログラム、及び保健情報管理方法
JP7470887B2 (ja) 2020-10-14 2024-04-19 公立大学法人和歌山県立医科大学 画像情報認識装置、画像情報記憶媒体構築方法、画像情報認識方法、そのためのコンピュータプログラム、及び保健情報管理方法

Similar Documents

Publication Publication Date Title
US7483187B2 (en) Method and apparatus of adjusting image tone and graphic user interface for the same
US6396598B1 (en) Method and apparatus for electronic memo processing for integrally managing document including paper document and electronic memo added to the document
JP5187057B2 (ja) レイアウト印刷システム、レイアウト文書閲覧方法、及びプログラム
US20070064279A1 (en) Image processing apparatus, image processing method, and computer program product
JPH0535938A (ja) 画像処理装置
JP2003108919A (ja) 文字認識装置
JP4143549B2 (ja) 画像処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2002007951A (ja) 帳票入力方法及びその実施装置並びにその処理プログラムを記録した記録媒体
JP5089524B2 (ja) 文書処理装置、文書処理システム、文書処理方法、及び、文書処理プログラム
JP3951492B2 (ja) 画像処理装置
JPS638889A (ja) 画像処理方法
JPH0962662A (ja) 文書処理装置
JPH11353411A (ja) 文字認識装置
JPH11296334A (ja) プリンタ制御装置およびその方法並びに記録媒体
JPH06342461A (ja) 表示情報切換装置
JP7271889B2 (ja) 情報処理装置及びプログラム
JPS6132109A (ja) 数値制御装置におけるデ−タ設定画面表示方式
KR101680235B1 (ko) 영상 인식기의 구동 장치 및 방법, 관리 서버, 영상 인식 시스템 및 그 구동 방법
JP2004357197A (ja) 帳票処理装置、及びプログラム
JPH1055431A (ja) 画像処理装置
JPH0973515A (ja) 文字認識装置
JP4285187B2 (ja) プリンタ制御装置およびその方法並びに記録媒体
JP2017049969A (ja) 文書校正サーバ、文書校正端末および文書校正システム
JPH0236482A (ja) 情報記録装置
JPH09160906A (ja) 文字入力方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040927

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20061102