JP2001060251A

JP2001060251A - 画像処理装置、画像処理方法、及び記録媒体

Info

Publication number: JP2001060251A
Application number: JP11236184A
Authority: JP
Inventors: Yuji Takenaka; 裕二竹中; Yoshihiro Ito; 嘉広伊藤
Original assignee: Fuji Photo Film Co Ltd
Current assignee: Fujifilm Holdings Corp
Priority date: 1999-08-23
Filing date: 1999-08-23
Publication date: 2001-03-06

Abstract

(57)【要約】【課題】所定の条件に基づいて画像から手書文字を認
識し文字情報を生成する画像処理装置。【解決手段】画像に関する情報を処理する画像処理装
置であって、画像のうち文字認識の対象となる認識領域
の位置に対応付けて、当該認識領域に含まれる可能性が
高い文字列の文字コード列を選択条件として格納する選
択条件格納部と、文字コード列に含まれる文字コードを
当該文字コードに対応する文字形状と共に文字形状条件
として格納する文字形状条件格納部と、選択条件及び文
字形状条件に基づいて認識領域に含まれる文字から文字
情報を生成する文字情報生成部とを備える。選択条件格
納部は、認識領域に対応する選択条件に追加の選択条件
を含める手段をさらに有し、文字情報生成部は、追加の
選択条件を含む選択条件と文字形状条件とに基づいて文
字情報を生成する。選択条件格納部は、選択条件のうち
いずれの文字コード列に基づいて文字情報を生成したか
を示す履歴情報を追加の選択条件として格納する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、画像処理装置、画
像処理方法、及び記録媒体に関する。特に本発明は、画
像から文字を認識する画像処理装置に関する。

【０００２】

【従来の技術】従来、画像から文字を認識する方法とし
て、特開平５−２０５０５号（公開日平成５年１月２９
日）及び特開平９−１１４８５７号（公開日平成９年５
月２日）は、文字列のキーワードに基づいた文字認識の
方法を開示している。また、特開平２−５６０８６号
（公開日平成２年２月２６日）は、文字列ブロックに対
する意味カテゴリーの相互関係を利用した文字認識の結
果の修正方法を開示している。

【０００３】文字認識の対象によっては、文字列領域ご
とに文字をある程度特定しやすい場合が考えられる。例
えば、工事写真における黒板画像においては、「工
種」、「撮影月日」等、項目ごとに記載される内容があ
る程度予想しやすいといえる。

【０００４】

【発明が解決しようとする課題】従来から、記載される
位置と項目内容とを特定しやすい場合の文字認識の精度
と効率の向上が望まれていた。また、記載される文字の
変更が少ない場合における、効率よい認識も望まれてい
た。

【０００５】そこで本発明は、上記の課題を解決するこ
とのできる画像処理装置、画像処理方法、及び記録媒体
を提供することを目的とする。この目的は特許請求の範
囲における独立項に記載の特徴の組み合わせにより達成
される。また従属項は本発明の更なる有利な具体例を規
定する。

【０００６】

【課題を解決するための手段】上記課題を解決するため
に、本発明の第１の実施形態においては、画像に関する
情報を処理する画像処理装置であって、前記画像のうち
文字認識の対象となる認識領域の位置に対応付けて、当
該認識領域に含まれる可能性が高い文字列の文字コード
列を選択条件として格納する選択条件格納部と、前記文
字コード列に含まれる文字コードを当該文字コードに対
応する文字形状と共に文字形状条件として格納する文字
形状条件格納部と、前記選択条件及び前記文字形状条件
に基づいて前記認識領域に含まれる文字から文字情報を
生成する文字情報生成部とを備える。

【０００７】前記選択条件格納部は、前記認識領域に対
応する前記選択条件に追加の前記選択条件を含める手段
をさらに有し、前記文字情報生成部は、前記追加の選択
条件を含む前記選択条件と前記文字形状条件とに基づい
て前記文字情報を生成してもよい。

【０００８】前記選択条件格納部は、前記選択条件のう
ちいずれの文字コード列に基づいて文字情報を生成した
かを示す履歴情報を前記追加の選択条件として格納す
る。

【０００９】前記選択条件格納部は、前記文字情報生成
部が前記文字情報を生成する場合に、前記選択条件に含
まれる前記文字コード列のうちいずれを優先させるかを
前記追加の選択条件として格納してもよい。

【００１０】前回認識した画像中の文字列と今回認識す
べき画像中の文字列とを比較する比較部をさらに備え、
前記比較部が同一の文字列であると判断した場合に、前
記文字情報生成部は、前回生成された前記文字情報を今
回認識すべき画像中の前記文字列に対する前記文字情報
として生成してもよい。

【００１１】前記文字形状条件格納部は、前記認識領域
に含まれる文字の形状を追加の前記文字形状として前記
文字コードに対応付けて格納する手段を有し、前記文字
情報生成部は、前記選択条件と前記追加の文字形状を含
む前記文字形状条件と前記選択条件とに基づいて前記文
字情報を生成してもよい。

【００１２】前記認識領域に含まれる文字が手書文字か
否かを判断する文字種別判断部をさらに備え、前記文字
形状条件格納部は、前記手書文字の形状を前記追加の文
字形状として前記文字コードに対応付けて格納してもよ
い。

【００１３】前記文字情報生成部は、前記選択条件及び
前記文字形状条件に基づいて前記認識領域に含まれ得る
文字列の候補を生成する手段と、前記文字列の候補から
操作者の操作により一つの文字列を決定して前記文字情
報を生成する手段を有し、前記文字形状条件格納部は、
前記文字情報生成部により決定された前記文字列に含ま
れる文字の前記文字形状を前記追加の文字形状として前
記文字コードに対応付けて格納してもよい。

【００１４】同一の文字列の手書文字を複数回文字認識
した場合に、前記手書文字の形状を前記追加の文字形状
として前記文字コードと対応付けて格納してもよい。

【００１５】画像を入力する入力部と、前記画像から文
字領域を検出する文字領域検出部と、前記文字領域から
文字認識の対象となる前記認識領域を抽出する抽出部と
をさらに備えてもよい。

【００１６】画像を入力する入力部と、前記画像から所
定の文字列を検出する文字列検出部と、前記文字列検出
部により検出された前記文字列の前記画像における位置
に基づいて文字認識の対象となる前記認識領域を前記画
像から抽出する抽出部とをさらに備えてもよい。

【００１７】本発明の第２の実施形態においては、画像
に関する情報を処理する画像処理方法であって、前記画
像のうち文字認識の対象となる認識領域に含まれる可能
性が高い文字列の文字コード列を抽出する段階と、前記
抽出された文字コード列に含まれる文字コードに対応す
る文字形状を前記認識領域に含まれる文字の形状と比較
して、文字情報を生成する段階とを備えてもよい。

【００１８】本発明の第３の実施形態においては、画像
を認識するプログラムを記録したコンピュータ読み取り
可能な記憶媒体であって、前記プログラムが、前記画像
のうち文字認識の対象となる認識領域に含まれる可能性
が高い文字列の文字コード列を抽出するモジュールと、
前記抽出された文字コード列に含まれる文字コードに対
応する文字形状を前記認識領域に含まれる文字の形状と
比較して、文字情報を生成するモジュールとを備えても
よい。

【００１９】なお上記の発明の概要は、本発明の必要な
特徴の全てを列挙したものではなく、これらの特徴群の
サブコンビネーションも又発明となりうる。

【００２０】

【発明の実施の形態】以下、発明の実施の形態を通じて
本発明を説明するが、以下の実施形態はクレームにかか
る発明を限定するものではなく、又実施形態の中で説明
されている特徴の組み合わせの全てが発明の解決手段に
必須であるとは限らない。

【００２１】以下、本発明の画像処理装置が工事現場の
写真画像から文字を認識する実施形態を説明する。本実
施形態においては、画像処理装置が画像から文字認識の
対象となる領域（以下、「認識領域」という。）を抽出
する。そして、画像処理装置が、認識領域に含まれる可
能性が高い文字列を定めた選択条件に基づいて文字を認
識する。

【００２２】図１に沿って本発明の第一実施形態を説明
する。図１は、画像処理装置の一例として、デジタルカ
メラ１００の構成を示す。このデジタルカメラ１００
は、入力部１０と処理部２０と選択入力部８０と記録部
４０と出力部５０とを備える。

【００２３】入力部１０は、画像を撮影し、その画像を
処理部２０に入力する。処理部２０は、入力された画像
から文字を認識して文字情報を生成する。処理部２０
は、画像と文字情報とが関連する情報であることを示す
関連情報を生成する。選択入力部８０は、操作者が入力
する情報を処理部２０に送って文字認識を補う。

【００２４】記録部４０は、処理部２０から受け取る画
像及び文字情報を記録媒体に記録する。記録媒体として
は、メモリーカード等の着脱自在な不揮発性の半導体メ
モリ、フロッピーディスク等の磁気記録媒体等が考えら
れる。また、記録部４０は、磁気記録部を備えたＡＰＳ
（Advanced Photo System）フイルムの磁気記録部に
文字情報を記録してもよい。記録部４０は、カメラが内
蔵する半導体メモリ、磁気ディスク等に文字情報を記録
してもよい。

【００２５】出力部５０は、処理部２０から受け取る画
像及び文字情報を出力する。出力部５０としては、例え
ば画像及び文字情報を画面表示する、カメラ内蔵型の液
晶モニタ等が考えられる。また、出力部５０として例え
ば画像及び文字情報を印刷する、カメラ内蔵の小型プリ
ンタ等が考えられる。

【００２６】図２は、処理部２０の機能ブロック図であ
る。処理部２０は、文字領域検出部２２と抽出部２４と
比較部２６と文字情報生成部２８と関連情報生成部３０
と文字種別判断部３２と選択条件格納部３４と文字形状
条件格納部３６と日付機構４４とを有する。

【００２７】文字領域検出部２２は、認識領域を少なく
とも一つ以上含む文字領域の検出に用いる文字領域検出
条件を有する。文字領域検出部２２は、入力部１０によ
って撮影された画像から文字領域検出条件に基づいて文
字領域を検出する。本実施形態における文字領域は、例
えば工事写真に含まれる黒板の画像領域が該当する。抽
出部２４は、認識領域の抽出に用いる抽出条件を有す
る。抽出部２４は、文字領域から抽出条件に基づいて認
識領域を抽出する。抽出条件としては、文字領域におけ
る認識領域の相対位置情報等が考えられる。

【００２８】比較部２６は、抽出部２４から認識領域の
画像を受け取って、保持する。比較部２６は、保持する
画像と、次に文字認識する認識領域の画像とを比較す
る。すなわち、比較部２６は、前回抽出部２４から受け
取った認識領域の画像に含まれる文字列と、今回認識す
べき認識領域に含まれる文字列とを比較することとな
る。比較部２６は、前回の文字列と今回の文字列とが同
一であると判断した場合、同一の文字列であることを示
す情報を文字情報生成部２８に送る。このように、認識
領域の記載内容が前回と同一である場合、文字認識を簡
略化できるので、認識の速度を速めることができる。例
えば、工事写真の撮影において、黒板の中の項目によっ
ては、記載内容が撮影毎に変わらない場合があるので、
黒板から文字を認識する速度を速めることができる。

【００２９】文字種別判断部３２は、認識領域に含まれ
る文字列が手書きの文字列かどうかを判断する。文字情
報生成部２８は、認識領域に含まれる文字列を所定の選
択条件と所定の文字形状条件とに基づいて文字認識し、
文字情報を生成する。ここで、選択条件とは、認識領域
に含まれる可能性の高い文字の文字コード列を認識領域
の位置情報に対応付けた条件であり、選択条件格納部３
４に格納される。文字形状条件には、文字の文字形状と
対応する文字コードとが含まれ、文字形状条件格納部３
６に格納される。文字形状条件には、文字形状として手
書文字の形状を含めてもよい。

【００３０】文字情報生成部２８は、認識領域に含まれ
る可能性の高い文字の文字コード列として、認識領域の
位置に対応する文字コード列を選択条件から抽出する。
次に、抽出された文字コード列に含まれる文字コードに
対応する文字形状を文字形状条件より抽出し、認識領域
に含まれる文字の形状と比較する。比較の結果、文字の
形状同士が一致又は近似したときに、文字情報生成部２
８は、文字同士が一致したと判断する。文字同士が一致
した場合、文字情報生成部２８は、一致した文字に対応
する文字コード列を含む文字情報を生成する。このよう
に、認識領域に含まれる可能性の高い文字列に基づいて
文字認識を行うので、文字認識の速度を速めることがで
きる。

【００３１】文字情報生成部２８は、選択条件に含まれ
る複数の文字コード列の中から、対応する文字形状が認
識領域の文字形状に最も近似する文字コード列を選択し
てもよい。文字情報生成部２８は、選んだ文字コード列
を含む文字情報を生成する。この場合、認識領域の文字
形状と選択すべき文字形状との近似の度合いが低かった
としても、他の文字コード列との違いが大きければ、正
しい文字コード列を選択できる。従って、認識領域に記
載された文字列が、確実に選択条件に含まれる場合にお
いては、文字認識の精度を高くすることができる。

【００３２】文字情報生成部２８は、認識領域に含まれ
る文字列が文字種別判断部３２によって、手書文字列で
あると判断された場合、手書文字の文字形状を用いて文
字を認識する。

【００３３】文字情報生成部２８は、認識する文字列が
選択条件に含まれない場合、従来から知られた通常の文
字認識方法で文字情報を生成してもよい。

【００３４】文字情報生成部２８は、選択条件格納部３
４に格納された選択条件に追加の選択条件を含めさせて
もよい。この場合、文字情報生成部２８は、追加の選択
条件を含む選択条件に基づいて文字情報を生成する。

【００３５】文字情報生成部２８は、選択条件のうちい
ずれの文字コード列を優先するかを示す情報を追加の選
択条件として選択条件に含めさせてもよい。また、文字
情報生成部２８は、例えば文字認識において選択条件の
うちいずれの文字コード列に基づいて文字情報を生成し
たかを示す履歴情報を追加の選択条件として選択条件に
含めさせてもよい。これらの追加の選択条件を含むこと
によって、文字情報生成部２８は、認識領域に含まれ得
る、より可能性の高い文字列を優先的に抽出することが
できるため文字認識の速度を速めることができる。

【００３６】文字情報生成部２８は、文字形状条件格納
部３６に格納された文字形状条件に追加の文字形状を含
めさせてもよい。この場合、文字情報生成部２８は、追
加の文字形状を含む文字形状条件に基づいて文字情報を
生成する。

【００３７】文字情報生成部２８は、文字情報生成部２
８が手書文字を文字認識した場合、手書文字の形状を追
加の文字形状として文字コードに対応付けて文字形状条
件に含めさせてもよい。

【００３８】文字情報生成部２８は、文字情報を生成す
る前段階として、文字情報を生成するための候補を生成
して操作者に選ばせてもよい。操作者は、選択入力部８
０を操作して、候補から１つを選ぶ。文字情報生成部２
８は、選択入力部８０より入力された情報に基づいて文
字情報を生成する。文字情報の生成に用いた文字コード
列を選択条件格納部３４に、文字形状を文字形状条件格
納部３６にそれぞれ追加してもよい。

【００３９】日付機構４４は、日付情報を生成する。文
字情報生成部２８は、日付情報に基づいて日付に関する
文字列を文字認識してもよい。例えば工事写真に含まれ
る黒板は、撮影月日を記載する欄を有しており、この欄
に記載された数字と日付機構４４が生成する日付情報と
を比較することで、通常の認識よりも速く文字認識する
ことができる。

【００４０】関連情報生成部３０は、入力部１０によっ
て入力された画像と、文字情報とが対応する情報である
ことを示す関連情報を生成する。関連情報生成部３０
は、画像と文字情報とを関連情報と共に記録部４０と出
力部５０に出力する。

【００４１】図３に沿って、文字領域検出部２２が画像
から文字領域を検出する場合の検出方法を説明する。図
３は、文字領域の一例として、黒板９０の画像パターン
を示す。本実施形態では、文字領域検出条件として、黒
板９０の画像パターンの特徴を定める条件を文字領域検
出部２２に記憶させる。例えば、長方形の輪郭形状、画
像パターンの内側部分の色相と異なる色相を有する輪郭
線、及び所定の位置に突形部分を有する輪郭線を有する
という特徴を文字領域検出条件として記憶させておいて
もよい。文字領域検出部２２は、この文字領域検出条件
に基づいて黒板９０を検出することができる。黒板９０
には「工事名」、「工種」などの項目が記載されてお
り、項目ごとの記載欄が本実施形態における認識領域と
なる。

【００４２】図４には、黒板９０に含まれる認識領域を
示す。本実施形態においては、抽出部２４が文字領域か
ら項目内容が記載されたフィールド９５ｂを認識領域と
して抽出する。抽出部２４は、抽出するフィールド９５
ｂの位置座標を認識領域に対する相対位置情報として有
する。例えば、文字情報生成部２８は、相対位置座標と
して黒板の左下の頂点Ａを原点としたときの黒板の左上
の頂点Ｂと右下の頂点Ｃの座標に対するフィールド９５
ｂの４つの頂点Ｄ，Ｅ，Ｆ及びＧの相対的な座標を有し
てもよい。抽出部２４は、黒板の絶対座標Ａ，Ｂ及びＣ
と、フィールド９５ｂの相対座標とに基づいて、フィー
ルド９５ｂを抽出する。同様にして、フィールド９５
ａ，ｃ〜ｇを抽出する。

【００４３】他の形態においては、文字情報生成部２８
は、相対位置情報として黒板９０の辺の長さ及び頂点Ａ
の位置を有してもよい。

【００４４】図５は、図４におけるフィールド９５ｂに
対応する選択条件を示す。選択条件には、フィールド９
５ｂの位置情報と共に位置情報に対応する文字コード列
が含まれる。フィールド９５ｂには「工種」に関する内
容が記載される。この場合、選択条件には、フィールド
９５ｂの相対座標と、「工種」に含まれる可能性の高い
文字列に対応する文字コード列が含まれる。フィールド
９５ｂの相対座標としては、頂点Ｄ，Ｅ，Ｆ及びＧのう
ち少なくとも１頂点の相対座標を含んでいればよい。こ
のように、認識領域に対応した選択条件を有するため、
文字情報生成部２８は、速く文字を認識することができ
る。

【００４５】選択条件に含まれる文字コード列は、認識
領域に記載される可能性が高い順に記憶されてもよい。
文字情報生成部２８は、文字コード列を上段から順番に
抽出する。従って、文字情報生成部２８は可能性の高い
文字コード列を優先して選択条件から抽出することがで
きる。

【００４６】図６は、追加の選択条件の一例としての、
選択条件に含まれる文字コード列の優先順位を示す。左
に示すのが認識に用いる選択条件で、右に示すのが文字
認識後の選択条件である。このように選択条件に含まれ
る文字コード列の順位が変化する。黒板９０における
「工種」の欄に「水道工」という文字を認識した場合、
次回の文字認識から、「工種」に対する選択条件のうち
「水道工」という文字を最優先に用いる。そして、文字
認識する度に選択条件に含まれる文字列の優先順位を変
更する。文字情報生成部２８は、認識領域に含まれる文
字列を、可能性が高い順に抽出できるため、文字認識の
速度を速めることができる。

【００４７】図７は、追加の選択条件の一例としての履
歴情報を示す。図７に示す選択条件のテーブルにおい
て、文字情報生成部２８は文字コード列にフラグを与え
ることにより履歴情報を生成する。例えば、文字情報生
成部２８は、文字認識した後に、図７に示す選択条件の
テーブルにおいて、文字情報の生成に用いた文字コード
列にフラグを１つ与える。文字情報生成部２８は、より
最近認識した文字コード列から順に大きく重み付けす
る。そして、文字情報生成部２８は、フラグの数と重み
付けとによる優先順位に基づいて文字認識する。これに
よって、認識に利用された頻度に加えて、より最近認識
した文字列を優先して利用することができる。

【００４８】図８は、文字形状条件の内容を示す。文字
形状条件には、文字コードと文字コードに対応する文字
形状とが含まれる。文字形状は、複数含まれてもよい。
文字形状は、手書文字の形状を含んでもよい。文字情報
生成部２８が手書文字を文字認識した場合、手書文字の
形状を文字形状として文字コードに対応付けて文字形状
条件に含ませてもよい。このように、手書文字認識に関
する情報が蓄積されるので、文字情報生成部２８は、手
書文字を高い精度で文字認識することができる。

【００４９】文字形状条件格納部３６は、文字情報生成
部２８が同一の文字コード列に対応する手書文字列を複
数回文字認識した場合に限り、手書文字の形状を追加の
文字形状として文字コードに対応付けて文字形状条件に
追加させてもよい。このように、頻出する文字に限り手
書文字認識に関する情報が蓄積されるため、毎回文字形
状を追加する場合に比べて、記憶するデータ量が少量で
済み、必要な最低限の情報を追加することができる。

【００５０】図９は、本実施形態における画像処理方法
を示すフローチャートである。デジタルカメラ１００
は、動作を開始し（Ｓ１００）、入力部１０が画像を入
力する（Ｓ１０２）。次に、認識領域を抽出する（Ｓ１
０４）。次に、文字情報生成部２８は、認識領域に含ま
れる文字列から文字情報を生成する（Ｓ１０６）。次
に、文字情報生成部２８が文字情報を生成すると、追加
の選択条件が生成される（Ｓ１０８）。次に、文字情報
生成部２８は、文字認識した文字の文字形状を追加の文
字形状として生成する（Ｓ１０８）。次に、関連情報生
成部３０は、画像と文字情報とが対応する情報であるこ
とを示す関連情報を生成する（Ｓ１１２）。次に、出力
部５０は、画像、文字情報及び関連情報に基づいて出力
する（Ｓ１１４）。次に、記録部４０は、画像、文字情
報及び関連情報を記録する。（Ｓ１１６）。記録が完了
すると、デジタルカメラ１００による動作が終了する
（Ｓ１１８）。

【００５１】図１０は、図８における認識領域抽出段階
（Ｓ１０４）の詳細な動作を示すフローチャートであ
る。文字領域検出部２２は、文字領域検出条件に基づい
て画像から文字領域を検出する（Ｓ１２０）。次に、抽
出部２４は、文字領域から認識領域を抽出する（Ｓ１２
２）。

【００５２】図１１は、図８における文字情報生成段階
（Ｓ１０６）の詳細な動作を示すフローチャートであ
る。比較部２６は、前回認識した認識領域に含まれる文
字列と今回認識すべき認識領域に含まれる文字列とを比
較する（Ｓ１３０）。前回の文字列と今回の文字列とが
同一である場合、文字情報生成部２８は、前回生成した
文字情報を今回認識する文字列の文字情報とする（Ｓ１
３２）。認識領域の文字列が前回の文字列と同一でない
場合、文字種別判断部３２は、認識領域に含まれる文字
が手書文字か否かを判断する（Ｓ１３４）。

【００５３】次に、文字情報生成部２８は、選択条件格
納部３４に格納された選択条件に基づいて文字コード列
を抽出する（Ｓ１３６）。次に、文字情報生成部２８
は、抽出された文字コード列に含まれる文字コードに対
応する文字形状を文字形状条件格納部３６より抽出し、
認識領域に含まれる文字の形状と比較する（Ｓ１３
８）。文字種別判断部３２が、手書文字と判断した場合
は、文字情報生成部２８は、抽出された文字コード列に
含まれる文字コードに対応する手書文字の文字形状を文
字形状条件格納部３６より抽出し、認識領域に含まれる
文字の形状と比較する。比較の結果、文字同士が一致し
た場合（Ｓ１４０）、その文字に対応する文字コード列
を含む文字情報を生成する。文字情報生成部２８は、抽
出された文字コード列を認識すべき文字列の文字情報と
して生成する（Ｓ１４６）。また、比較の結果、文字同
士が一致しない場合は、文字情報生成部２８は、従来か
ら知られた通常の文字認識をする（Ｓ１４２）。次に、
文字情報生成部２８は、文字情報を生成する前段階とし
て、文字情報の候補を生成する（Ｓ１４４）。次に、操
作者に候補から１つ選ばせることによって、文字情報生
成部２８は文字情報を生成してもよい（Ｓ１４６）。

【００５４】次に第２実施形態を説明する。本実施形態
の基本的な構成及び動作は、図１、及び図３〜図１０に
示される基本的な構成及び動作と同様である。

【００５５】図１２は、第２実施形態における図２に示
した処理部２０の構成図である。本実施形態におけるデ
ジタルカメラ１００全体の構成は図１に記載したデジタ
ルカメラ１００の構成と同一であるので説明を省略す
る。本実施形態では、認識領域を抽出する過程が第１実
施形態と異なる。すなわち、本実施形態における処理部
２０は、第１実施形態における文字領域検出部２２の代
わりに特定文字検出部４２を有する。処理部２０におけ
る文字領域検出部２２と特定文字検出部４２以外の構成
については、図２で説明した第１実施形態の構成と同一
なので説明を省略する。特定文字検出部４２は、特定の
文字列を検出するための特定文字条件を有する。特定文
字検出部４２は、特定文字条件に基づいて、入力部１０
によって撮影された画像から特定文字列を検出する。例
えば、黒板９０の場合「工事名」、「工種」等が特定文
字列として特定文字条件に含まれる。

【００５６】抽出部２４は、特定文字検出部４２に格納
された特定文字列と共に特定文字列の位置と認識領域と
の相対位置関係を抽出条件として格納する。抽出部２４
は、相対位置関係に基づいて画像から認識領域を抽出す
る。

【００５７】次に本実施形態における画像処理方法を説
明する。本実施形態における基本的な動作は、図９に示
される基本的な動作と同様であるので、説明は省略す
る。本実施形態においては、図９における認識領域抽出
段階（Ｓ１０４）の詳細な動作が第１実施形態と異な
る。

【００５８】図１３は、図９における認識領域抽出段階
（Ｓ１０４）の詳細な動作を示すフローチャートであ
る。特定文字検出部４２は、特定文字列を検出するため
の特定文字条件に基づいて、特定文字列を検出する（Ｓ
１２４）。次に、抽出部２４は、特定文字列と認識領域
の相対位置関係に基づいて認識領域を抽出する（Ｓ１２
６）。

【００５９】次に第３実施形態を説明する。本実施形態
の画像処理装置には、例えばカメラを搭載するノート型
のコンピュータや、カメラを搭載する携帯型端末及び電
子手帳等が含まれる。図１４は、本実施形態における処
理部２０のハードウェア構成図である。ＣＰＵ６０はＲ
ＯＭ６２及びＲＡＭ６４に格納されたプログラムに基づ
いて動作する。選択入力部８０は、操作者が入力する情
報を入力装置６１に送る。入力装置６１は、操作者によ
り入力された情報をＣＰＵ６０やＲＡＭ６４に送る。補
助記憶装置６３は、画像等のデータ、及びＣＰＵ６０を
動作させるプログラムを格納する。データ読取部３５は
記録媒体２００からデータ又はプログラムを読み取り、
ＲＡＭ６４、補助記憶装置６３及びＣＰＵ６０の少なく
ともいずれかに提供する。

【００６０】ＣＰＵ６０が実行するプログラムのソフト
ウエアは、記録媒体２００に格納されて利用者に提供さ
れる。記録媒体２００に格納されたソフトウエアは圧縮
されていても非圧縮であってもよい。ソフトウエアは記
録媒体２００から補助記憶装置６３にインストールさ
れ、ＲＡＭ６４に読み出されてＣＰＵ６０により実行さ
れる。

【００６１】ＣＰＵ６０が実行するプログラムのソフト
ウエア、すなわち記録媒体２００に格納されて提供され
るソフトウエアは、図２に示された処理部２０と同様の
機能構成で、文字領域検出モジュール１２２と抽出モジ
ュール１２４と比較モジュール１２６と文字情報生成モ
ジュール１２８と関連情報生成モジュール１３０と文字
種別判断モジュール１３２と選択条件モジュール１３４
と文字形状条件モジュール１３６とをプログラムモジュ
ールとして備える。各モジュールの構成及び動作は、図
３から図１２を用いて説明した処理部２０における各部
の構成及び動作と同様であるので詳細な説明は省略す
る。記録媒体２００には、本出願で説明した処理部２０
の動作の一部又は全ての機能を格納することができる。
また記録媒体２００には他の装置の動作の一部又は全て
の機能を格納することができる。これらのプログラムは
記録媒体から直接ＲＡＭ６４に読み出されて実行されて
もよい。

【００６２】記録媒体２００としては、ＣＤ−ＲＯＭ、
ＤＶＤ及びＰＤ等の光学記録媒体、フロッピーディスク
やミニディスク（ＭＤ）等の磁気記録媒体、ＭＯ等の光
磁気記録媒体、テープ状記録媒体、不揮発性の半導体メ
モリカード等を用いることができる。上記のプログラム
を格納した記録媒体は、画像処理装置を製造するために
のみ使用されるものであり、そのような記録媒体の業と
しての製造および販売等が本出願に基づく特許権の侵害
を構成することは明らかである。

【００６３】以上のように、第１乃至第３実施形態によ
れば、比較部２６は、前回抽出部２４から受け取った認
識領域の画像に含まれる文字列と、今回認識すべき認識
領域に含まれる文字列とを比較する。比較部２６は、前
回の文字列と今回の文字列とが同一であると判断した場
合、同一の文字列であることを示す情報を文字情報生成
部２８に送る。このように、認識領域の記載内容が前回
と同一である場合、文字認識を簡略化できるので、認識
の速度を速めることができる。例えば、工事写真の撮影
において、黒板の中の項目によっては、記載内容が撮影
毎に変わらない場合があるので、黒板から文字を認識す
る速度を速めることができる。

【００６４】上記実施形態によれば、文字情報生成部２
８は、選択条件に含まれる複数の文字コード列の中か
ら、対応する文字形状が認識領域の文字形状に最も近似
する文字コード列を選択してもよい。文字情報生成部２
８は、選んだ文字コード列を含む文字情報を生成する。
この場合、認識領域の文字形状と選択すべき文字形状と
の近似の度合いが低かったとしても、他の文字コード列
との違いが大きければ、正しい文字コード列を選択でき
る。従って、認識領域に記載された文字列が、確実に選
択条件に含まれる場合においては、文字認識の精度を高
くすることができる。

【００６５】上記実施形態によれば、文字情報生成部２
８は、追加の選択条件を含む選択条件に基づいて文字情
報を生成してもよい。これによって、文字情報生成部２
８は、認識領域に含まれ得る、より可能性の高い文字列
を優先的に抽出することができるため文字認識の速度を
速めることができる。

【００６６】上記実施形態によれば、日付機構４４は、
日付情報を生成する。文字情報生成部２８は、日付情報
に基づいて日付に関する文字列を文字認識してもよい。
例えば工事写真に含まれる黒板は、撮影月日を記載する
欄を有しており、この欄に記載された数字と日付機構４
４が生成する日付情報とを比較することで、通常の認識
よりも速く文字認識することができる。

【００６７】上記実施形態によれば、選択条件格納部３
４は、認識領域に対応した選択条件を有するため、文字
情報生成部２８は、速く文字を認識することができる。

【００６８】上記実施形態によれば、選択条件に含まれ
る文字コード列は、認識領域に記載される可能性が高い
順に記憶されてもよい。文字情報生成部２８は、文字コ
ード列を上段から順番に抽出する。従って、文字情報生
成部２８は可能性の高い文字コード列を優先して選択条
件から抽出することができる。

【００６９】上記実施形態によれば、追加の選択条件が
選択条件に含まれる文字コード列の優先順位であった場
合、文字情報生成部２８は、文字認識する度に選択条件
に含まれる文字列の優先順位を変更する。これにより、
文字情報生成部２８は、認識領域に含まれる文字列を、
可能性が高い順に抽出できるため、文字認識の速度を速
めることができる。

【００７０】上記実施形態によれば、文字情報生成部２
８が手書文字を文字認識した場合、手書文字の形状を文
字形状として文字コードに対応付けて文字形状条件に含
ませてもよい。このように、手書文字認識に関する情報
が蓄積されるので、文字情報生成部２８は、手書文字を
高い精度で文字認識することができる。

【００７１】上記実施形態によれば、文字形状条件格納
部３６は、文字情報生成部２８が同一の文字コード列に
対応する手書文字列を複数回文字認識した場合に限り、
手書文字の形状を追加の文字形状として文字コードに対
応付けて文字形状条件に追加させてもよい。このよう
に、頻出する文字に限り手書文字認識に関する情報が蓄
積されるため、毎回文字形状を追加する場合に比べて、
記憶するデータ量が少量で済み、必要な最低限の情報を
追加することができる。

【００７２】以上、本発明を実施の形態を用いて説明し
たが、本発明の技術的範囲は上記実施の形態に記載の範
囲には限定されない。上記実施の形態に、多様な変更又
は改良を加えることができる。その様な変更又は改良を
加えた形態も本発明の技術的範囲に含まれ得ることが、
特許請求の範囲の記載から明らかである。

【発明の効果】上記説明から明らかなように、本発明に
よれば画像から文字を速い速度で認識することができ
る。

【図面の簡単な説明】

【図１】デジタルカメラ１００の構成図である。

【図２】処理部２０の機能ブロック図である。

【図３】黒板９０の画像パターンを示す図である。

【図４】黒板９０に含まれる認識領域を示す図である。

【図５】図４におけるフィールド９５ｂに対応する選択
条件の図である。

【図６】追加の選択条件の一例として、選択条件に含ま
れる文字コード列の優先順位を示す図である。

【図７】追加の選択条件の一例として履歴情報を示す図
である。

【図８】文字形状条件の内容を示す図である。

【図９】画像処理方法を示すフローチャートである。

【図１０】図９における認識領域抽出段階（Ｓ１０４）
の詳細な動作を示すフローチャートである。

【図１１】図９における文字情報生成段階（Ｓ１０６）
の詳細な動作を示すフローチャートである。

【図１２】第２実施形態における処理部２０の機能ブロ
ック図である。

【図１３】第２実施形態における認識領域抽出段階（Ｓ
１０４）の詳細な動作を示すフローチャートである。

【図１４】第３実施形態における処理部２０のハードウ
ェアの機能構成を示すブロック図である。

【符号の説明】

１００デジタルカメラ１０入力部２０処理部２２文字領域検出部２４抽出部２６比較部２８文字情報生成部３０関連情報生成部３２文字種別判断部３４選択条件格納部３６文字形状条件格納部４０記録部４２特定文字検出部４４日付機構５０出力部６０ＣＰＵ６１入力装置６２ＲＯＭ６３補助記憶装置６４ＲＡＭ６５データ読み取り部８０操作部９０黒板９５フィールド１２２文字領域検出モジュール１２４抽出モジュール１２６比較モジュール１２８文字情報生成モジュール１３０関連情報精製モジュール１３２文字種別判断モジュール１３４選択条件モジュール１３６文字形状条件モジュール２００記録媒体

Claims

【特許請求の範囲】

【請求項１】画像に関する情報を処理する画像処理装
置であって、前記画像のうち文字認識の対象となる認識
領域の位置に対応付けて、当該認識領域に含まれる可能
性が高い文字列の文字コード列を選択条件として格納す
る選択条件格納部と、前記文字コード列に含まれる文字
コードを当該文字コードに対応する文字形状と共に文字
形状条件として格納する文字形状条件格納部と、前記選
択条件及び前記文字形状条件に基づいて前記認識領域に
含まれる文字から文字情報を生成する文字情報生成部と
を備えることを特徴とする画像処理装置。
【請求項２】前記選択条件格納部は、前記認識領域に
対応する前記選択条件に追加の前記選択条件を含める手
段をさらに有し、前記文字情報生成部は、前記追加の選
択条件を含む前記選択条件と前記文字形状条件とに基づ
いて前記文字情報を生成することを特徴とする請求項１
に記載の画像処理装置。
【請求項３】前記選択条件格納部は、前記選択条件の
うちいずれの文字コード列に基づいて文字情報を生成し
たかを示す履歴情報を前記追加の選択条件として格納す
ることを特徴とする請求項２に記載の画像処理装置。
【請求項４】前記選択条件格納部は、前記文字情報生
成部が前記文字情報を生成する場合に、前記選択条件に
含まれる前記文字コード列のうちいずれを優先させるか
を前記追加の選択条件として格納することを特徴とする
請求項２又は３に記載の画像処理装置。
【請求項５】前回認識した画像中の文字列と今回認識
すべき画像中の文字列とを比較する比較部をさらに備
え、前記比較部が同一の文字列であると判断した場合に、前
記文字情報生成部は、前回生成された前記文字情報を今
回認識すべき画像中の前記文字列に対する前記文字情報
として生成することを特徴とする請求項２乃至４のいず
れかに記載の画像処理装置。
【請求項６】前記文字形状条件格納部は、前記認識領
域に含まれる文字の形状を追加の前記文字形状として前
記文字コードに対応付けて格納する手段を有し、前記文字情報生成部は、前記選択条件と前記追加の文字
形状を含む前記文字形状条件と前記選択条件とに基づい
て前記文字情報を生成することを特徴とする請求項１乃
至５のいずれかに記載の画像処理装置。
【請求項７】前記認識領域に含まれる文字が手書文字
か否かを判断する文字種別判断部をさらに備え、前記文
字形状条件格納部は、前記手書文字の形状を前記追加の
文字形状として前記文字コードに対応付けて格納するこ
とを特徴とする請求項６に記載の画像処理装置。
【請求項８】前記文字情報生成部は、前記選択条件及
び前記文字形状条件に基づいて前記認識領域に含まれ得
る文字列の候補を生成する手段と、前記文字列の候補か
ら操作者の操作により一つの文字列を決定して前記文字
情報を生成する手段を有し、前記文字形状条件格納部は、前記文字情報生成部により
決定された前記文字列に含まれる文字の前記文字形状を
前記追加の文字形状として前記文字コードに対応付けて
格納することを特徴とする請求項６又は７に記載の画像
処理装置。
【請求項９】同一の文字列の手書文字を複数回文字認
識した場合に、前記手書文字の形状を前記追加の文字形
状として前記文字コードと対応付けて格納することを特
徴とする請求項７又は８に記載の画像処理装置。
【請求項１０】画像を入力する入力部と、前記画像か
ら文字領域を検出する文字領域検出部と、前記文字領域から文字認識の対象となる前記認識領域を
抽出する抽出部とをさらに備えることを特徴とする請求
項１乃至９のいずれかに記載の画像処理装置。
【請求項１１】画像を入力する入力部と、前記画像か
ら所定の文字列を検出する文字列検出部と、前記文字列
検出部により検出された前記文字列の前記画像における
位置に基づいて文字認識の対象となる前記認識領域を前
記画像から抽出する抽出部とをさらに備えることを特徴
とする請求項１乃至９のいずれか記載の画像処理装置。
【請求項１２】画像に関する情報を処理する画像処理
方法であって、前記画像のうち文字認識の対象となる認
識領域に含まれる可能性が高い文字列の文字コード列を
抽出する段階と、前記抽出された文字コード列に含まれ
る文字コードに対応する文字形状を前記認識領域に含ま
れる文字の形状と比較して、文字情報を生成する段階と
を備えることを特徴とする画像処理方法。
【請求項１３】画像を認識するプログラムを記録した
コンピュータ読み取り可能な記録媒体であって、前記プ
ログラムが、前記画像のうち文字認識の対象となる認識
領域に含まれる可能性が高い文字列の文字コード列を抽
出するモジュールと、前記抽出された文字コード列に含
まれる文字コードに対応する文字形状を前記認識領域に
含まれる文字の形状と比較して、文字情報を生成するモ
ジュールとを備えることを特徴とする記録媒体。