JP2001060251A - 画像処理装置、画像処理方法、及び記録媒体 - Google Patents

画像処理装置、画像処理方法、及び記録媒体

Info

Publication number
JP2001060251A
JP2001060251A JP11236184A JP23618499A JP2001060251A JP 2001060251 A JP2001060251 A JP 2001060251A JP 11236184 A JP11236184 A JP 11236184A JP 23618499 A JP23618499 A JP 23618499A JP 2001060251 A JP2001060251 A JP 2001060251A
Authority
JP
Japan
Prior art keywords
character
image
string
shape
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11236184A
Other languages
English (en)
Inventor
Yuji Takenaka
裕二 竹中
Yoshihiro Ito
嘉広 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP11236184A priority Critical patent/JP2001060251A/ja
Publication of JP2001060251A publication Critical patent/JP2001060251A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 所定の条件に基づいて画像から手書文字を認
識し文字情報を生成する画像処理装置。 【解決手段】 画像に関する情報を処理する画像処理装
置であって、画像のうち文字認識の対象となる認識領域
の位置に対応付けて、当該認識領域に含まれる可能性が
高い文字列の文字コード列を選択条件として格納する選
択条件格納部と、文字コード列に含まれる文字コードを
当該文字コードに対応する文字形状と共に文字形状条件
として格納する文字形状条件格納部と、選択条件及び文
字形状条件に基づいて認識領域に含まれる文字から文字
情報を生成する文字情報生成部とを備える。選択条件格
納部は、認識領域に対応する選択条件に追加の選択条件
を含める手段をさらに有し、文字情報生成部は、追加の
選択条件を含む選択条件と文字形状条件とに基づいて文
字情報を生成する。選択条件格納部は、選択条件のうち
いずれの文字コード列に基づいて文字情報を生成したか
を示す履歴情報を追加の選択条件として格納する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像処理装置、画
像処理方法、及び記録媒体に関する。特に本発明は、画
像から文字を認識する画像処理装置に関する。
【0002】
【従来の技術】従来、画像から文字を認識する方法とし
て、特開平5−20505号(公開日平成5年1月29
日)及び特開平9−114857号(公開日平成9年5
月2日)は、文字列のキーワードに基づいた文字認識の
方法を開示している。また、特開平2−56086号
(公開日平成2年2月26日)は、文字列ブロックに対
する意味カテゴリーの相互関係を利用した文字認識の結
果の修正方法を開示している。
【0003】文字認識の対象によっては、文字列領域ご
とに文字をある程度特定しやすい場合が考えられる。例
えば、工事写真における黒板画像においては、「工
種」、「撮影月日」等、項目ごとに記載される内容があ
る程度予想しやすいといえる。
【0004】
【発明が解決しようとする課題】従来から、記載される
位置と項目内容とを特定しやすい場合の文字認識の精度
と効率の向上が望まれていた。また、記載される文字の
変更が少ない場合における、効率よい認識も望まれてい
た。
【0005】そこで本発明は、上記の課題を解決するこ
とのできる画像処理装置、画像処理方法、及び記録媒体
を提供することを目的とする。この目的は特許請求の範
囲における独立項に記載の特徴の組み合わせにより達成
される。また従属項は本発明の更なる有利な具体例を規
定する。
【0006】
【課題を解決するための手段】上記課題を解決するため
に、本発明の第1の実施形態においては、画像に関する
情報を処理する画像処理装置であって、前記画像のうち
文字認識の対象となる認識領域の位置に対応付けて、当
該認識領域に含まれる可能性が高い文字列の文字コード
列を選択条件として格納する選択条件格納部と、前記文
字コード列に含まれる文字コードを当該文字コードに対
応する文字形状と共に文字形状条件として格納する文字
形状条件格納部と、前記選択条件及び前記文字形状条件
に基づいて前記認識領域に含まれる文字から文字情報を
生成する文字情報生成部とを備える。
【0007】前記選択条件格納部は、前記認識領域に対
応する前記選択条件に追加の前記選択条件を含める手段
をさらに有し、前記文字情報生成部は、前記追加の選択
条件を含む前記選択条件と前記文字形状条件とに基づい
て前記文字情報を生成してもよい。
【0008】前記選択条件格納部は、前記選択条件のう
ちいずれの文字コード列に基づいて文字情報を生成した
かを示す履歴情報を前記追加の選択条件として格納す
る。
【0009】前記選択条件格納部は、前記文字情報生成
部が前記文字情報を生成する場合に、前記選択条件に含
まれる前記文字コード列のうちいずれを優先させるかを
前記追加の選択条件として格納してもよい。
【0010】前回認識した画像中の文字列と今回認識す
べき画像中の文字列とを比較する比較部をさらに備え、
前記比較部が同一の文字列であると判断した場合に、前
記文字情報生成部は、前回生成された前記文字情報を今
回認識すべき画像中の前記文字列に対する前記文字情報
として生成してもよい。
【0011】前記文字形状条件格納部は、前記認識領域
に含まれる文字の形状を追加の前記文字形状として前記
文字コードに対応付けて格納する手段を有し、前記文字
情報生成部は、前記選択条件と前記追加の文字形状を含
む前記文字形状条件と前記選択条件とに基づいて前記文
字情報を生成してもよい。
【0012】前記認識領域に含まれる文字が手書文字か
否かを判断する文字種別判断部をさらに備え、前記文字
形状条件格納部は、前記手書文字の形状を前記追加の文
字形状として前記文字コードに対応付けて格納してもよ
い。
【0013】前記文字情報生成部は、前記選択条件及び
前記文字形状条件に基づいて前記認識領域に含まれ得る
文字列の候補を生成する手段と、前記文字列の候補から
操作者の操作により一つの文字列を決定して前記文字情
報を生成する手段を有し、前記文字形状条件格納部は、
前記文字情報生成部により決定された前記文字列に含ま
れる文字の前記文字形状を前記追加の文字形状として前
記文字コードに対応付けて格納してもよい。
【0014】同一の文字列の手書文字を複数回文字認識
した場合に、前記手書文字の形状を前記追加の文字形状
として前記文字コードと対応付けて格納してもよい。
【0015】画像を入力する入力部と、前記画像から文
字領域を検出する文字領域検出部と、前記文字領域から
文字認識の対象となる前記認識領域を抽出する抽出部と
をさらに備えてもよい。
【0016】画像を入力する入力部と、前記画像から所
定の文字列を検出する文字列検出部と、前記文字列検出
部により検出された前記文字列の前記画像における位置
に基づいて文字認識の対象となる前記認識領域を前記画
像から抽出する抽出部とをさらに備えてもよい。
【0017】本発明の第2の実施形態においては、画像
に関する情報を処理する画像処理方法であって、前記画
像のうち文字認識の対象となる認識領域に含まれる可能
性が高い文字列の文字コード列を抽出する段階と、前記
抽出された文字コード列に含まれる文字コードに対応す
る文字形状を前記認識領域に含まれる文字の形状と比較
して、文字情報を生成する段階とを備えてもよい。
【0018】本発明の第3の実施形態においては、画像
を認識するプログラムを記録したコンピュータ読み取り
可能な記憶媒体であって、前記プログラムが、前記画像
のうち文字認識の対象となる認識領域に含まれる可能性
が高い文字列の文字コード列を抽出するモジュールと、
前記抽出された文字コード列に含まれる文字コードに対
応する文字形状を前記認識領域に含まれる文字の形状と
比較して、文字情報を生成するモジュールとを備えても
よい。
【0019】なお上記の発明の概要は、本発明の必要な
特徴の全てを列挙したものではなく、これらの特徴群の
サブコンビネーションも又発明となりうる。
【0020】
【発明の実施の形態】以下、発明の実施の形態を通じて
本発明を説明するが、以下の実施形態はクレームにかか
る発明を限定するものではなく、又実施形態の中で説明
されている特徴の組み合わせの全てが発明の解決手段に
必須であるとは限らない。
【0021】以下、本発明の画像処理装置が工事現場の
写真画像から文字を認識する実施形態を説明する。本実
施形態においては、画像処理装置が画像から文字認識の
対象となる領域(以下、「認識領域」という。)を抽出
する。そして、画像処理装置が、認識領域に含まれる可
能性が高い文字列を定めた選択条件に基づいて文字を認
識する。
【0022】図1に沿って本発明の第一実施形態を説明
する。図1は、画像処理装置の一例として、デジタルカ
メラ100の構成を示す。このデジタルカメラ100
は、入力部10と処理部20と選択入力部80と記録部
40と出力部50とを備える。
【0023】入力部10は、画像を撮影し、その画像を
処理部20に入力する。処理部20は、入力された画像
から文字を認識して文字情報を生成する。処理部20
は、画像と文字情報とが関連する情報であることを示す
関連情報を生成する。選択入力部80は、操作者が入力
する情報を処理部20に送って文字認識を補う。
【0024】記録部40は、処理部20から受け取る画
像及び文字情報を記録媒体に記録する。記録媒体として
は、メモリーカード等の着脱自在な不揮発性の半導体メ
モリ、フロッピーディスク等の磁気記録媒体等が考えら
れる。また、記録部40は、磁気記録部を備えたAPS
(Advanced Photo System)フイルムの磁気記録部に
文字情報を記録してもよい。記録部40は、カメラが内
蔵する半導体メモリ、磁気ディスク等に文字情報を記録
してもよい。
【0025】出力部50は、処理部20から受け取る画
像及び文字情報を出力する。出力部50としては、例え
ば画像及び文字情報を画面表示する、カメラ内蔵型の液
晶モニタ等が考えられる。また、出力部50として例え
ば画像及び文字情報を印刷する、カメラ内蔵の小型プリ
ンタ等が考えられる。
【0026】図2は、処理部20の機能ブロック図であ
る。処理部20は、文字領域検出部22と抽出部24と
比較部26と文字情報生成部28と関連情報生成部30
と文字種別判断部32と選択条件格納部34と文字形状
条件格納部36と日付機構44とを有する。
【0027】文字領域検出部22は、認識領域を少なく
とも一つ以上含む文字領域の検出に用いる文字領域検出
条件を有する。文字領域検出部22は、入力部10によ
って撮影された画像から文字領域検出条件に基づいて文
字領域を検出する。本実施形態における文字領域は、例
えば工事写真に含まれる黒板の画像領域が該当する。抽
出部24は、認識領域の抽出に用いる抽出条件を有す
る。抽出部24は、文字領域から抽出条件に基づいて認
識領域を抽出する。抽出条件としては、文字領域におけ
る認識領域の相対位置情報等が考えられる。
【0028】比較部26は、抽出部24から認識領域の
画像を受け取って、保持する。比較部26は、保持する
画像と、次に文字認識する認識領域の画像とを比較す
る。すなわち、比較部26は、前回抽出部24から受け
取った認識領域の画像に含まれる文字列と、今回認識す
べき認識領域に含まれる文字列とを比較することとな
る。比較部26は、前回の文字列と今回の文字列とが同
一であると判断した場合、同一の文字列であることを示
す情報を文字情報生成部28に送る。このように、認識
領域の記載内容が前回と同一である場合、文字認識を簡
略化できるので、認識の速度を速めることができる。例
えば、工事写真の撮影において、黒板の中の項目によっ
ては、記載内容が撮影毎に変わらない場合があるので、
黒板から文字を認識する速度を速めることができる。
【0029】文字種別判断部32は、認識領域に含まれ
る文字列が手書きの文字列かどうかを判断する。文字情
報生成部28は、認識領域に含まれる文字列を所定の選
択条件と所定の文字形状条件とに基づいて文字認識し、
文字情報を生成する。ここで、選択条件とは、認識領域
に含まれる可能性の高い文字の文字コード列を認識領域
の位置情報に対応付けた条件であり、選択条件格納部3
4に格納される。文字形状条件には、文字の文字形状と
対応する文字コードとが含まれ、文字形状条件格納部3
6に格納される。文字形状条件には、文字形状として手
書文字の形状を含めてもよい。
【0030】文字情報生成部28は、認識領域に含まれ
る可能性の高い文字の文字コード列として、認識領域の
位置に対応する文字コード列を選択条件から抽出する。
次に、抽出された文字コード列に含まれる文字コードに
対応する文字形状を文字形状条件より抽出し、認識領域
に含まれる文字の形状と比較する。比較の結果、文字の
形状同士が一致又は近似したときに、文字情報生成部2
8は、文字同士が一致したと判断する。文字同士が一致
した場合、文字情報生成部28は、一致した文字に対応
する文字コード列を含む文字情報を生成する。このよう
に、認識領域に含まれる可能性の高い文字列に基づいて
文字認識を行うので、文字認識の速度を速めることがで
きる。
【0031】文字情報生成部28は、選択条件に含まれ
る複数の文字コード列の中から、対応する文字形状が認
識領域の文字形状に最も近似する文字コード列を選択し
てもよい。文字情報生成部28は、選んだ文字コード列
を含む文字情報を生成する。この場合、認識領域の文字
形状と選択すべき文字形状との近似の度合いが低かった
としても、他の文字コード列との違いが大きければ、正
しい文字コード列を選択できる。従って、認識領域に記
載された文字列が、確実に選択条件に含まれる場合にお
いては、文字認識の精度を高くすることができる。
【0032】文字情報生成部28は、認識領域に含まれ
る文字列が文字種別判断部32によって、手書文字列で
あると判断された場合、手書文字の文字形状を用いて文
字を認識する。
【0033】文字情報生成部28は、認識する文字列が
選択条件に含まれない場合、従来から知られた通常の文
字認識方法で文字情報を生成してもよい。
【0034】文字情報生成部28は、選択条件格納部3
4に格納された選択条件に追加の選択条件を含めさせて
もよい。この場合、文字情報生成部28は、追加の選択
条件を含む選択条件に基づいて文字情報を生成する。
【0035】文字情報生成部28は、選択条件のうちい
ずれの文字コード列を優先するかを示す情報を追加の選
択条件として選択条件に含めさせてもよい。また、文字
情報生成部28は、例えば文字認識において選択条件の
うちいずれの文字コード列に基づいて文字情報を生成し
たかを示す履歴情報を追加の選択条件として選択条件に
含めさせてもよい。これらの追加の選択条件を含むこと
によって、文字情報生成部28は、認識領域に含まれ得
る、より可能性の高い文字列を優先的に抽出することが
できるため文字認識の速度を速めることができる。
【0036】文字情報生成部28は、文字形状条件格納
部36に格納された文字形状条件に追加の文字形状を含
めさせてもよい。この場合、文字情報生成部28は、追
加の文字形状を含む文字形状条件に基づいて文字情報を
生成する。
【0037】文字情報生成部28は、文字情報生成部2
8が手書文字を文字認識した場合、手書文字の形状を追
加の文字形状として文字コードに対応付けて文字形状条
件に含めさせてもよい。
【0038】文字情報生成部28は、文字情報を生成す
る前段階として、文字情報を生成するための候補を生成
して操作者に選ばせてもよい。操作者は、選択入力部8
0を操作して、候補から1つを選ぶ。文字情報生成部2
8は、選択入力部80より入力された情報に基づいて文
字情報を生成する。文字情報の生成に用いた文字コード
列を選択条件格納部34に、文字形状を文字形状条件格
納部36にそれぞれ追加してもよい。
【0039】日付機構44は、日付情報を生成する。文
字情報生成部28は、日付情報に基づいて日付に関する
文字列を文字認識してもよい。例えば工事写真に含まれ
る黒板は、撮影月日を記載する欄を有しており、この欄
に記載された数字と日付機構44が生成する日付情報と
を比較することで、通常の認識よりも速く文字認識する
ことができる。
【0040】関連情報生成部30は、入力部10によっ
て入力された画像と、文字情報とが対応する情報である
ことを示す関連情報を生成する。関連情報生成部30
は、画像と文字情報とを関連情報と共に記録部40と出
力部50に出力する。
【0041】図3に沿って、文字領域検出部22が画像
から文字領域を検出する場合の検出方法を説明する。図
3は、文字領域の一例として、黒板90の画像パターン
を示す。本実施形態では、文字領域検出条件として、黒
板90の画像パターンの特徴を定める条件を文字領域検
出部22に記憶させる。例えば、長方形の輪郭形状、画
像パターンの内側部分の色相と異なる色相を有する輪郭
線、及び所定の位置に突形部分を有する輪郭線を有する
という特徴を文字領域検出条件として記憶させておいて
もよい。文字領域検出部22は、この文字領域検出条件
に基づいて黒板90を検出することができる。黒板90
には「工事名」、「工種」などの項目が記載されてお
り、項目ごとの記載欄が本実施形態における認識領域と
なる。
【0042】図4には、黒板90に含まれる認識領域を
示す。本実施形態においては、抽出部24が文字領域か
ら項目内容が記載されたフィールド95bを認識領域と
して抽出する。抽出部24は、抽出するフィールド95
bの位置座標を認識領域に対する相対位置情報として有
する。例えば、文字情報生成部28は、相対位置座標と
して黒板の左下の頂点Aを原点としたときの黒板の左上
の頂点Bと右下の頂点Cの座標に対するフィールド95
bの4つの頂点D,E,F及びGの相対的な座標を有し
てもよい。抽出部24は、黒板の絶対座標A,B及びC
と、フィールド95bの相対座標とに基づいて、フィー
ルド95bを抽出する。同様にして、フィールド95
a,c〜gを抽出する。
【0043】他の形態においては、文字情報生成部28
は、相対位置情報として黒板90の辺の長さ及び頂点A
の位置を有してもよい。
【0044】図5は、図4におけるフィールド95bに
対応する選択条件を示す。選択条件には、フィールド9
5bの位置情報と共に位置情報に対応する文字コード列
が含まれる。フィールド95bには「工種」に関する内
容が記載される。この場合、選択条件には、フィールド
95bの相対座標と、「工種」に含まれる可能性の高い
文字列に対応する文字コード列が含まれる。フィールド
95bの相対座標としては、頂点D,E,F及びGのう
ち少なくとも1頂点の相対座標を含んでいればよい。こ
のように、認識領域に対応した選択条件を有するため、
文字情報生成部28は、速く文字を認識することができ
る。
【0045】選択条件に含まれる文字コード列は、認識
領域に記載される可能性が高い順に記憶されてもよい。
文字情報生成部28は、文字コード列を上段から順番に
抽出する。従って、文字情報生成部28は可能性の高い
文字コード列を優先して選択条件から抽出することがで
きる。
【0046】図6は、追加の選択条件の一例としての、
選択条件に含まれる文字コード列の優先順位を示す。左
に示すのが認識に用いる選択条件で、右に示すのが文字
認識後の選択条件である。このように選択条件に含まれ
る文字コード列の順位が変化する。黒板90における
「工種」の欄に「水道工」という文字を認識した場合、
次回の文字認識から、「工種」に対する選択条件のうち
「水道工」という文字を最優先に用いる。そして、文字
認識する度に選択条件に含まれる文字列の優先順位を変
更する。文字情報生成部28は、認識領域に含まれる文
字列を、可能性が高い順に抽出できるため、文字認識の
速度を速めることができる。
【0047】図7は、追加の選択条件の一例としての履
歴情報を示す。図7に示す選択条件のテーブルにおい
て、文字情報生成部28は文字コード列にフラグを与え
ることにより履歴情報を生成する。例えば、文字情報生
成部28は、文字認識した後に、図7に示す選択条件の
テーブルにおいて、文字情報の生成に用いた文字コード
列にフラグを1つ与える。文字情報生成部28は、より
最近認識した文字コード列から順に大きく重み付けす
る。そして、文字情報生成部28は、フラグの数と重み
付けとによる優先順位に基づいて文字認識する。これに
よって、認識に利用された頻度に加えて、より最近認識
した文字列を優先して利用することができる。
【0048】図8は、文字形状条件の内容を示す。文字
形状条件には、文字コードと文字コードに対応する文字
形状とが含まれる。文字形状は、複数含まれてもよい。
文字形状は、手書文字の形状を含んでもよい。文字情報
生成部28が手書文字を文字認識した場合、手書文字の
形状を文字形状として文字コードに対応付けて文字形状
条件に含ませてもよい。このように、手書文字認識に関
する情報が蓄積されるので、文字情報生成部28は、手
書文字を高い精度で文字認識することができる。
【0049】文字形状条件格納部36は、文字情報生成
部28が同一の文字コード列に対応する手書文字列を複
数回文字認識した場合に限り、手書文字の形状を追加の
文字形状として文字コードに対応付けて文字形状条件に
追加させてもよい。このように、頻出する文字に限り手
書文字認識に関する情報が蓄積されるため、毎回文字形
状を追加する場合に比べて、記憶するデータ量が少量で
済み、必要な最低限の情報を追加することができる。
【0050】図9は、本実施形態における画像処理方法
を示すフローチャートである。デジタルカメラ100
は、動作を開始し(S100)、入力部10が画像を入
力する(S102)。次に、認識領域を抽出する(S1
04)。次に、文字情報生成部28は、認識領域に含ま
れる文字列から文字情報を生成する(S106)。次
に、文字情報生成部28が文字情報を生成すると、追加
の選択条件が生成される(S108)。次に、文字情報
生成部28は、文字認識した文字の文字形状を追加の文
字形状として生成する(S108)。次に、関連情報生
成部30は、画像と文字情報とが対応する情報であるこ
とを示す関連情報を生成する(S112)。次に、出力
部50は、画像、文字情報及び関連情報に基づいて出力
する(S114)。次に、記録部40は、画像、文字情
報及び関連情報を記録する。(S116)。記録が完了
すると、デジタルカメラ100による動作が終了する
(S118)。
【0051】図10は、図8における認識領域抽出段階
(S104)の詳細な動作を示すフローチャートであ
る。文字領域検出部22は、文字領域検出条件に基づい
て画像から文字領域を検出する(S120)。次に、抽
出部24は、文字領域から認識領域を抽出する(S12
2)。
【0052】図11は、図8における文字情報生成段階
(S106)の詳細な動作を示すフローチャートであ
る。比較部26は、前回認識した認識領域に含まれる文
字列と今回認識すべき認識領域に含まれる文字列とを比
較する(S130)。前回の文字列と今回の文字列とが
同一である場合、文字情報生成部28は、前回生成した
文字情報を今回認識する文字列の文字情報とする(S1
32)。認識領域の文字列が前回の文字列と同一でない
場合、文字種別判断部32は、認識領域に含まれる文字
が手書文字か否かを判断する(S134)。
【0053】次に、文字情報生成部28は、選択条件格
納部34に格納された選択条件に基づいて文字コード列
を抽出する(S136)。次に、文字情報生成部28
は、抽出された文字コード列に含まれる文字コードに対
応する文字形状を文字形状条件格納部36より抽出し、
認識領域に含まれる文字の形状と比較する(S13
8)。文字種別判断部32が、手書文字と判断した場合
は、文字情報生成部28は、抽出された文字コード列に
含まれる文字コードに対応する手書文字の文字形状を文
字形状条件格納部36より抽出し、認識領域に含まれる
文字の形状と比較する。比較の結果、文字同士が一致し
た場合(S140)、その文字に対応する文字コード列
を含む文字情報を生成する。文字情報生成部28は、抽
出された文字コード列を認識すべき文字列の文字情報と
して生成する(S146)。また、比較の結果、文字同
士が一致しない場合は、文字情報生成部28は、従来か
ら知られた通常の文字認識をする(S142)。次に、
文字情報生成部28は、文字情報を生成する前段階とし
て、文字情報の候補を生成する(S144)。次に、操
作者に候補から1つ選ばせることによって、文字情報生
成部28は文字情報を生成してもよい(S146)。
【0054】次に第2実施形態を説明する。本実施形態
の基本的な構成及び動作は、図1、及び図3〜図10に
示される基本的な構成及び動作と同様である。
【0055】図12は、第2実施形態における図2に示
した処理部20の構成図である。本実施形態におけるデ
ジタルカメラ100全体の構成は図1に記載したデジタ
ルカメラ100の構成と同一であるので説明を省略す
る。本実施形態では、認識領域を抽出する過程が第1実
施形態と異なる。すなわち、本実施形態における処理部
20は、第1実施形態における文字領域検出部22の代
わりに特定文字検出部42を有する。処理部20におけ
る文字領域検出部22と特定文字検出部42以外の構成
については、図2で説明した第1実施形態の構成と同一
なので説明を省略する。特定文字検出部42は、特定の
文字列を検出するための特定文字条件を有する。特定文
字検出部42は、特定文字条件に基づいて、入力部10
によって撮影された画像から特定文字列を検出する。例
えば、黒板90の場合「工事名」、「工種」等が特定文
字列として特定文字条件に含まれる。
【0056】抽出部24は、特定文字検出部42に格納
された特定文字列と共に特定文字列の位置と認識領域と
の相対位置関係を抽出条件として格納する。抽出部24
は、相対位置関係に基づいて画像から認識領域を抽出す
る。
【0057】次に本実施形態における画像処理方法を説
明する。本実施形態における基本的な動作は、図9に示
される基本的な動作と同様であるので、説明は省略す
る。本実施形態においては、図9における認識領域抽出
段階(S104)の詳細な動作が第1実施形態と異な
る。
【0058】図13は、図9における認識領域抽出段階
(S104)の詳細な動作を示すフローチャートであ
る。特定文字検出部42は、特定文字列を検出するため
の特定文字条件に基づいて、特定文字列を検出する(S
124)。次に、抽出部24は、特定文字列と認識領域
の相対位置関係に基づいて認識領域を抽出する(S12
6)。
【0059】次に第3実施形態を説明する。本実施形態
の画像処理装置には、例えばカメラを搭載するノート型
のコンピュータや、カメラを搭載する携帯型端末及び電
子手帳等が含まれる。図14は、本実施形態における処
理部20のハードウェア構成図である。CPU60はR
OM62及びRAM64に格納されたプログラムに基づ
いて動作する。選択入力部80は、操作者が入力する情
報を入力装置61に送る。入力装置61は、操作者によ
り入力された情報をCPU60やRAM64に送る。補
助記憶装置63は、画像等のデータ、及びCPU60を
動作させるプログラムを格納する。データ読取部35は
記録媒体200からデータ又はプログラムを読み取り、
RAM64、補助記憶装置63及びCPU60の少なく
ともいずれかに提供する。
【0060】CPU60が実行するプログラムのソフト
ウエアは、記録媒体200に格納されて利用者に提供さ
れる。記録媒体200に格納されたソフトウエアは圧縮
されていても非圧縮であってもよい。ソフトウエアは記
録媒体200から補助記憶装置63にインストールさ
れ、RAM64に読み出されてCPU60により実行さ
れる。
【0061】CPU60が実行するプログラムのソフト
ウエア、すなわち記録媒体200に格納されて提供され
るソフトウエアは、図2に示された処理部20と同様の
機能構成で、文字領域検出モジュール122と抽出モジ
ュール124と比較モジュール126と文字情報生成モ
ジュール128と関連情報生成モジュール130と文字
種別判断モジュール132と選択条件モジュール134
と文字形状条件モジュール136とをプログラムモジュ
ールとして備える。各モジュールの構成及び動作は、図
3から図12を用いて説明した処理部20における各部
の構成及び動作と同様であるので詳細な説明は省略す
る。記録媒体200には、本出願で説明した処理部20
の動作の一部又は全ての機能を格納することができる。
また記録媒体200には他の装置の動作の一部又は全て
の機能を格納することができる。これらのプログラムは
記録媒体から直接RAM64に読み出されて実行されて
もよい。
【0062】記録媒体200としては、CD−ROM、
DVD及びPD等の光学記録媒体、フロッピーディスク
やミニディスク(MD)等の磁気記録媒体、MO等の光
磁気記録媒体、テープ状記録媒体、不揮発性の半導体メ
モリカード等を用いることができる。上記のプログラム
を格納した記録媒体は、画像処理装置を製造するために
のみ使用されるものであり、そのような記録媒体の業と
しての製造および販売等が本出願に基づく特許権の侵害
を構成することは明らかである。
【0063】以上のように、第1乃至第3実施形態によ
れば、比較部26は、前回抽出部24から受け取った認
識領域の画像に含まれる文字列と、今回認識すべき認識
領域に含まれる文字列とを比較する。比較部26は、前
回の文字列と今回の文字列とが同一であると判断した場
合、同一の文字列であることを示す情報を文字情報生成
部28に送る。このように、認識領域の記載内容が前回
と同一である場合、文字認識を簡略化できるので、認識
の速度を速めることができる。例えば、工事写真の撮影
において、黒板の中の項目によっては、記載内容が撮影
毎に変わらない場合があるので、黒板から文字を認識す
る速度を速めることができる。
【0064】上記実施形態によれば、文字情報生成部2
8は、選択条件に含まれる複数の文字コード列の中か
ら、対応する文字形状が認識領域の文字形状に最も近似
する文字コード列を選択してもよい。文字情報生成部2
8は、選んだ文字コード列を含む文字情報を生成する。
この場合、認識領域の文字形状と選択すべき文字形状と
の近似の度合いが低かったとしても、他の文字コード列
との違いが大きければ、正しい文字コード列を選択でき
る。従って、認識領域に記載された文字列が、確実に選
択条件に含まれる場合においては、文字認識の精度を高
くすることができる。
【0065】上記実施形態によれば、文字情報生成部2
8は、追加の選択条件を含む選択条件に基づいて文字情
報を生成してもよい。これによって、文字情報生成部2
8は、認識領域に含まれ得る、より可能性の高い文字列
を優先的に抽出することができるため文字認識の速度を
速めることができる。
【0066】上記実施形態によれば、日付機構44は、
日付情報を生成する。文字情報生成部28は、日付情報
に基づいて日付に関する文字列を文字認識してもよい。
例えば工事写真に含まれる黒板は、撮影月日を記載する
欄を有しており、この欄に記載された数字と日付機構4
4が生成する日付情報とを比較することで、通常の認識
よりも速く文字認識することができる。
【0067】上記実施形態によれば、選択条件格納部3
4は、認識領域に対応した選択条件を有するため、文字
情報生成部28は、速く文字を認識することができる。
【0068】上記実施形態によれば、選択条件に含まれ
る文字コード列は、認識領域に記載される可能性が高い
順に記憶されてもよい。文字情報生成部28は、文字コ
ード列を上段から順番に抽出する。従って、文字情報生
成部28は可能性の高い文字コード列を優先して選択条
件から抽出することができる。
【0069】上記実施形態によれば、追加の選択条件が
選択条件に含まれる文字コード列の優先順位であった場
合、文字情報生成部28は、文字認識する度に選択条件
に含まれる文字列の優先順位を変更する。これにより、
文字情報生成部28は、認識領域に含まれる文字列を、
可能性が高い順に抽出できるため、文字認識の速度を速
めることができる。
【0070】上記実施形態によれば、文字情報生成部2
8が手書文字を文字認識した場合、手書文字の形状を文
字形状として文字コードに対応付けて文字形状条件に含
ませてもよい。このように、手書文字認識に関する情報
が蓄積されるので、文字情報生成部28は、手書文字を
高い精度で文字認識することができる。
【0071】上記実施形態によれば、文字形状条件格納
部36は、文字情報生成部28が同一の文字コード列に
対応する手書文字列を複数回文字認識した場合に限り、
手書文字の形状を追加の文字形状として文字コードに対
応付けて文字形状条件に追加させてもよい。このよう
に、頻出する文字に限り手書文字認識に関する情報が蓄
積されるため、毎回文字形状を追加する場合に比べて、
記憶するデータ量が少量で済み、必要な最低限の情報を
追加することができる。
【0072】以上、本発明を実施の形態を用いて説明し
たが、本発明の技術的範囲は上記実施の形態に記載の範
囲には限定されない。上記実施の形態に、多様な変更又
は改良を加えることができる。その様な変更又は改良を
加えた形態も本発明の技術的範囲に含まれ得ることが、
特許請求の範囲の記載から明らかである。
【発明の効果】上記説明から明らかなように、本発明に
よれば画像から文字を速い速度で認識することができ
る。
【図面の簡単な説明】
【図1】デジタルカメラ100の構成図である。
【図2】処理部20の機能ブロック図である。
【図3】黒板90の画像パターンを示す図である。
【図4】黒板90に含まれる認識領域を示す図である。
【図5】図4におけるフィールド95bに対応する選択
条件の図である。
【図6】追加の選択条件の一例として、選択条件に含ま
れる文字コード列の優先順位を示す図である。
【図7】追加の選択条件の一例として履歴情報を示す図
である。
【図8】文字形状条件の内容を示す図である。
【図9】画像処理方法を示すフローチャートである。
【図10】図9における認識領域抽出段階(S104)
の詳細な動作を示すフローチャートである。
【図11】図9における文字情報生成段階(S106)
の詳細な動作を示すフローチャートである。
【図12】第2実施形態における処理部20の機能ブロ
ック図である。
【図13】第2実施形態における認識領域抽出段階(S
104)の詳細な動作を示すフローチャートである。
【図14】第3実施形態における処理部20のハードウ
ェアの機能構成を示すブロック図である。
【符号の説明】
100 デジタルカメラ 10 入力部 20 処理部 22 文字領域検出部 24 抽出部 26 比較部 28 文字情報生成部 30 関連情報生成部 32 文字種別判断部 34 選択条件格納部 36 文字形状条件格納部 40 記録部 42 特定文字検出部 44 日付機構 50 出力部 60 CPU 61 入力装置 62 ROM 63 補助記憶装置 64 RAM 65 データ読み取り部 80 操作部 90 黒板 95 フィールド 122 文字領域検出モジュール 124 抽出モジュール 126 比較モジュール 128 文字情報生成モジュール 130 関連情報精製モジュール 132 文字種別判断モジュール 134 選択条件モジュール 136 文字形状条件モジュール 200 記録媒体

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 画像に関する情報を処理する画像処理装
    置であって、前記画像のうち文字認識の対象となる認識
    領域の位置に対応付けて、当該認識領域に含まれる可能
    性が高い文字列の文字コード列を選択条件として格納す
    る選択条件格納部と、前記文字コード列に含まれる文字
    コードを当該文字コードに対応する文字形状と共に文字
    形状条件として格納する文字形状条件格納部と、前記選
    択条件及び前記文字形状条件に基づいて前記認識領域に
    含まれる文字から文字情報を生成する文字情報生成部と
    を備えることを特徴とする画像処理装置。
  2. 【請求項2】 前記選択条件格納部は、前記認識領域に
    対応する前記選択条件に追加の前記選択条件を含める手
    段をさらに有し、前記文字情報生成部は、前記追加の選
    択条件を含む前記選択条件と前記文字形状条件とに基づ
    いて前記文字情報を生成することを特徴とする請求項1
    に記載の画像処理装置。
  3. 【請求項3】 前記選択条件格納部は、前記選択条件の
    うちいずれの文字コード列に基づいて文字情報を生成し
    たかを示す履歴情報を前記追加の選択条件として格納す
    ることを特徴とする請求項2に記載の画像処理装置。
  4. 【請求項4】 前記選択条件格納部は、前記文字情報生
    成部が前記文字情報を生成する場合に、前記選択条件に
    含まれる前記文字コード列のうちいずれを優先させるか
    を前記追加の選択条件として格納することを特徴とする
    請求項2又は3に記載の画像処理装置。
  5. 【請求項5】 前回認識した画像中の文字列と今回認識
    すべき画像中の文字列とを比較する比較部をさらに備
    え、 前記比較部が同一の文字列であると判断した場合に、前
    記文字情報生成部は、前回生成された前記文字情報を今
    回認識すべき画像中の前記文字列に対する前記文字情報
    として生成することを特徴とする請求項2乃至4のいず
    れかに記載の画像処理装置。
  6. 【請求項6】 前記文字形状条件格納部は、前記認識領
    域に含まれる文字の形状を追加の前記文字形状として前
    記文字コードに対応付けて格納する手段を有し、 前記文字情報生成部は、前記選択条件と前記追加の文字
    形状を含む前記文字形状条件と前記選択条件とに基づい
    て前記文字情報を生成することを特徴とする請求項1乃
    至5のいずれかに記載の画像処理装置。
  7. 【請求項7】 前記認識領域に含まれる文字が手書文字
    か否かを判断する文字種別判断部をさらに備え、前記文
    字形状条件格納部は、前記手書文字の形状を前記追加の
    文字形状として前記文字コードに対応付けて格納するこ
    とを特徴とする請求項6に記載の画像処理装置。
  8. 【請求項8】 前記文字情報生成部は、前記選択条件及
    び前記文字形状条件に基づいて前記認識領域に含まれ得
    る文字列の候補を生成する手段と、前記文字列の候補か
    ら操作者の操作により一つの文字列を決定して前記文字
    情報を生成する手段を有し、 前記文字形状条件格納部は、前記文字情報生成部により
    決定された前記文字列に含まれる文字の前記文字形状を
    前記追加の文字形状として前記文字コードに対応付けて
    格納することを特徴とする請求項6又は7に記載の画像
    処理装置。
  9. 【請求項9】 同一の文字列の手書文字を複数回文字認
    識した場合に、前記手書文字の形状を前記追加の文字形
    状として前記文字コードと対応付けて格納することを特
    徴とする請求項7又は8に記載の画像処理装置。
  10. 【請求項10】 画像を入力する入力部と、前記画像か
    ら文字領域を検出する文字領域検出部と、 前記文字領域から文字認識の対象となる前記認識領域を
    抽出する抽出部とをさらに備えることを特徴とする請求
    項1乃至9のいずれかに記載の画像処理装置。
  11. 【請求項11】 画像を入力する入力部と、前記画像か
    ら所定の文字列を検出する文字列検出部と、前記文字列
    検出部により検出された前記文字列の前記画像における
    位置に基づいて文字認識の対象となる前記認識領域を前
    記画像から抽出する抽出部とをさらに備えることを特徴
    とする請求項1乃至9のいずれか記載の画像処理装置。
  12. 【請求項12】 画像に関する情報を処理する画像処理
    方法であって、前記画像のうち文字認識の対象となる認
    識領域に含まれる可能性が高い文字列の文字コード列を
    抽出する段階と、前記抽出された文字コード列に含まれ
    る文字コードに対応する文字形状を前記認識領域に含ま
    れる文字の形状と比較して、文字情報を生成する段階と
    を備えることを特徴とする画像処理方法。
  13. 【請求項13】 画像を認識するプログラムを記録した
    コンピュータ読み取り可能な記録媒体であって、前記プ
    ログラムが、前記画像のうち文字認識の対象となる認識
    領域に含まれる可能性が高い文字列の文字コード列を抽
    出するモジュールと、前記抽出された文字コード列に含
    まれる文字コードに対応する文字形状を前記認識領域に
    含まれる文字の形状と比較して、文字情報を生成するモ
    ジュールとを備えることを特徴とする記録媒体。
JP11236184A 1999-08-23 1999-08-23 画像処理装置、画像処理方法、及び記録媒体 Pending JP2001060251A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11236184A JP2001060251A (ja) 1999-08-23 1999-08-23 画像処理装置、画像処理方法、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11236184A JP2001060251A (ja) 1999-08-23 1999-08-23 画像処理装置、画像処理方法、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2001060251A true JP2001060251A (ja) 2001-03-06

Family

ID=16997028

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11236184A Pending JP2001060251A (ja) 1999-08-23 1999-08-23 画像処理装置、画像処理方法、及び記録媒体

Country Status (1)

Country Link
JP (1) JP2001060251A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010191554A (ja) * 2009-02-17 2010-09-02 Hitachi Ltd 文字図形認識方法、情報処理システムおよび情報処理装置
WO2023276599A1 (ja) * 2021-07-01 2023-01-05 ダイキン工業株式会社 文字認識装置、文字認識方法及び文字認識プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010191554A (ja) * 2009-02-17 2010-09-02 Hitachi Ltd 文字図形認識方法、情報処理システムおよび情報処理装置
WO2023276599A1 (ja) * 2021-07-01 2023-01-05 ダイキン工業株式会社 文字認識装置、文字認識方法及び文字認識プログラム
JP2023007011A (ja) * 2021-07-01 2023-01-18 ダイキン工業株式会社 文字認識装置、文字認識方法及び文字認識プログラム
JP7235995B2 (ja) 2021-07-01 2023-03-09 ダイキン工業株式会社 文字認識装置、文字認識方法及び文字認識プログラム
CN117501324A (zh) * 2021-07-01 2024-02-02 大金工业株式会社 字符识别装置、字符识别方法以及字符识别程序

Similar Documents

Publication Publication Date Title
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
US6549913B1 (en) Method for compiling an image database, an image database system, and an image data storage medium
US8331672B2 (en) Method and apparatus for recognizing character in character recognizing apparatus
JP2004348591A (ja) 文書検索方法及び装置
US20060285748A1 (en) Document processing device
EP4134914A1 (en) Tenprint card input device, tenprint card input method and storage medium
JP2006065477A (ja) 文字認識装置
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
JP2008282094A (ja) 文字認識処理装置
JP2006236217A (ja) 人物認識システム、人物認識方法、及び人物認識プログラム
JP2001060251A (ja) 画像処理装置、画像処理方法、及び記録媒体
JP4517822B2 (ja) 画像処理装置及びプログラム
JPH11282956A (ja) 帳票識別方法、装置および記録媒体
JP2010102734A (ja) 画像処理装置及びプログラム
JP4823049B2 (ja) 文書画像検索装置及びプログラム
JP6303742B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP6582469B2 (ja) 文字変換支援装置、日記作成支援装置、文字変換支援方法、及び、プログラム
JP2001094711A (ja) ドキュメント画像処理装置及びドキュメント画像処理方法
JP4592447B2 (ja) 画像データファイリングシステム
JP2006163446A (ja) 情報処理装置およびデータ検索方法およびプログラムおよび記録媒体
JP2007026263A (ja) 文字認識装置及びコンピュータプログラム
JP2006330873A (ja) 指紋照合装置、方法およびプログラム
JP2003208611A (ja) 画像処理装置、画像処理方法、及びプログラム
CN112417936A (zh) 信息处理装置及记录媒体
JP2002024743A (ja) 画像読取システムおよび画像読取方法