JP2008010980A - 文字画像処理装置及び文字画像処理方法 - Google Patents

文字画像処理装置及び文字画像処理方法 Download PDF

Info

Publication number
JP2008010980A
JP2008010980A JP2006177169A JP2006177169A JP2008010980A JP 2008010980 A JP2008010980 A JP 2008010980A JP 2006177169 A JP2006177169 A JP 2006177169A JP 2006177169 A JP2006177169 A JP 2006177169A JP 2008010980 A JP2008010980 A JP 2008010980A
Authority
JP
Japan
Prior art keywords
edge
character
image data
character image
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006177169A
Other languages
English (en)
Other versions
JP4576358B2 (ja
Inventor
Yoshihiro Ishimaru
義博 石丸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006177169A priority Critical patent/JP4576358B2/ja
Publication of JP2008010980A publication Critical patent/JP2008010980A/ja
Application granted granted Critical
Publication of JP4576358B2 publication Critical patent/JP4576358B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】携帯端末で撮影した文字画像データのコントラストが悪い場合に、かかる文字画像データから効率的かつ簡易に適正な文字画像データを取得することを課題とする。
【解決手段】文字画像処理部16cが、記憶部15から文字画像データ31を読み出し、この文字画像データ31にエッジ抽出処理を行ってエッジ画像データ32を取得し、このエッジ画像データ32のエッジのエッジ位置を文字内部方向に補正して位置補正エッジ画像データ33を生成し、この位置補正エッジ画像データ33に画素値補正処理を行って背景の影響を除去した疑似文字画像データ34を生成する。
【選択図】 図3

Description

本発明は、携帯端末で文字を撮像した文字画像データから背景の影響を除去して文字の鮮鋭化処理を行う文字画像処理装置及び文字画像処理方法に関し、特に、携帯端末で撮影した文字画像データのコントラストが悪い場合に、かかる文字画像データから効率的かつ簡易に適正な文字画像データを取得することが可能な文字画像処理装置及び文字画像処理方法に関する。
従来、携帯電話端末に搭載されたカメラ等で手書き文字を撮影し、撮影した画像データから手書き文字を認識することにより、利用者による文字入力を簡略する技術が知られている。例えば、特許文献1には、携帯電話端末に内蔵されたデジタルカメラで撮影した文字又はコードの画像データを信号処理して、URL、メールアドレス又は電話番号等の文字情報を取得するよう構成した携帯電話端末が開示されている。
この特許文献1のように、屋内環境下で携帯電話端末に搭載されたカメラ等で手書き文字を撮像しようとすると、屋内に設けられた電灯が撮影用の照明となるので、この電灯と撮影者やカメラの位置関係によっては、撮影者やカメラの影が画像に写り込んでしまいコントラストが劣化してしまう。
例えば、図11に示した文字画像データ11aのように、背景濃度が比較的均一である場合には、輝度補正を行って比較的容易に文字画像データ11bを得ることができるが、文字画像データ11c及び文字画像データ11eのように、撮影者やカメラの影の影響を受けた部分と影の影響を受けない部分が共存する場合には、一律に輝度補正を行ったとしても、文字画像データ11dのような文字のかすれが生じたり、文字画像データ11fのような影部分が強調された文字画像となってしまう。
このため、カメラで撮影した手書き文字画像のコントラストが悪い場合に、コントラストの悪い入力画像から線状パターンを適切に検出して二値化処理を行う従来技術が知られている。例えば、特許文献2には、つぶれ気味の線状パターンを含み背景ノイズを含まない2値画像と、線状パターンの形状を保存するが背景ノイズを含む2値画像とを生成し、これらの2値画像を画素毎にAND合成して、線状パターンの形状を保存しつつ背景ノイズを含まない2値画像を生成する画像処理装置が開示されている。
このため、この特許文献2を用いると、手書き文字の画像データのコントラストが悪い場合であっても、かかる画像データから線状パターンを正確に取得して文字認識し、この文字をURLやメールアドレスとして利用することができる。
特開2003−198674号公報 特開2002−271611号公報
しかしながら、携帯電話端末のようなリソースの乏しい機器で上記特許文献2に係る処理を行うとなると、その処理の複雑性に起因して膨大な処理時間を要してしまい、かえって携帯電話端末の本来の性能を劣化させる原因になるという問題がある。
このため、携帯電話端末で撮影した文字画像データのコントラストが悪い場合に、いかに効率的かつ簡易に適正な文字画像データを取得するかが重要な課題となっている。なお、かかる課題は、携帯電話端末で手書き文字を撮影した場合のみならず、比較的処理性能が低いデジタルカメラ等の各種携帯端末で文字を撮影した場合にも同様に生ずる課題である。
この発明は、上記課題(問題点)に鑑みてなされたものであり、携帯端末で撮影した文字画像データのコントラストが悪い場合に、かかる文字画像データから効率的かつ簡易に適正な文字画像データを取得することが可能な文字画像処理装置及び文字画像処理方法を提供することを目的とする。
上述した課題を解決するため、本発明は、携帯端末で文字を撮像した文字画像データから背景の影響を除去して文字の鮮鋭化処理を行う携帯端末用の文字画像処理装置であって、前記文字画像データに含まれる文字のエッジを抽出するエッジ抽出手段と、前記エッジ抽出手段で抽出された各エッジのエッジ位置を文字内部方向に向けて補正するエッジ位置補正手段と、前記エッジ位置補正手段で位置補正された各エッジ以外の背景の影響を除去する背景除去手段とを備えたことを特徴とする。
また、本発明は、上記発明において、前記エッジ抽出手段は、文字画像データに対して微分オペレータを適用して該文字画像データに含まれる各エッジの画素値並びにエッジ方向を抽出し、前記エッジ位置補正手段は、前記エッジ抽出手段で抽出された各エッジのエッジ方向に基づいて該エッジのエッジ位置を文字内部方向に補正することを特徴とする。
また、本発明は、上記発明において、前記背景除去手段は、前記エッジ位置補正手段で位置補正されたエッジ画像データの濃度ヒストグラムを生成する濃度ヒストグラム生成手段と、前記濃度ヒストグラム生成手段により生成された濃度ヒストグラムに基づいて背景画素の画素値とそれ以外の画素の画素値を区別する第1の閾値を算定する閾値算定手段と、前記エッジ画像データを形成する各画素の画素値が前記第1の閾値以上である場合には該画素の画素値を前記背景画素に付与する所定の画素値に変換する画素値変換手段とを備えたことを特徴とする。
また、本発明は、上記発明において、前記閾値算定手段は、前記濃度ヒストグラム生成手段により生成された濃度ヒストグラムに基づいて文字画素の画素値とそれ以外の画素の画素値を区別する第2の閾値を算定し、前記画素値変換手段は、前記エッジ画像データを形成する各画素の画素値が前記第2の閾値以下である場合には該画素の画素値を前記文字画素に付与する所定の画素値に変換することを特徴とする。
また、本発明は、携帯端末で文字を撮像した文字画像データから背景の影響を除去して文字の鮮鋭化処理を行う携帯端末用の文字画像処理方法であって、前記文字画像データに含まれる文字のエッジを抽出するエッジ抽出工程と、前記エッジ抽出工程で抽出された各エッジのエッジ位置を文字内部方向に向けて補正するエッジ位置補正工程と、前記エッジ位置補正工程で位置補正された各エッジ以外の背景の影響を除去する背景除去工程とを含んだことを特徴とする。
本発明によれば、文字画像データに含まれる文字のエッジを抽出し、抽出した各エッジのエッジ位置を文字内部方向に向けて位置補正し、該位置補正された各エッジ以外の背景の影響を除去するよう構成したので、携帯端末で撮影した文字画像データのコントラストが悪い場合に、かかる文字画像データから効率的かつ簡易に適正な文字画像データを取得することが可能となる。
以下に添付図面を参照して、本発明に係る文字画像処理装置及び文字画像処理方法の好適な実施例を詳細に説明する。なお、ここでは本発明を携帯電話端末で手書き文字を撮影した場合を示すこととする。
まず、本実施例1に係る携帯電話端末10の構成について説明する。図1は、本実施例1に係る携帯電話端末10の構成を示す機能ブロック図である。図1に示す携帯電話端末10は、携帯電話又はPHS(Personal Handyphone System)等の撮像機能を有する携帯型電話機であり、操作部11と、表示部12と、撮像部13と、無線通信部14と、記憶部15と、制御部16とを有する。
操作部11は、数字や文字の入力操作、通話接続操作並びに撮像操作を行う際に利用するテンキー等からなる操作部であり、表示部12は、液晶パネル又はLED等からなる表示部である。
撮像部13は、CCD等の撮像素子を用いて白黒濃淡画像又はカラー画像を撮像することができるデジタルカメラ等の撮像部であり、無線通信部14は、図示しない基地局を介して他の携帯電話端末や固定電話と無線通信を確立する通信ユニットである。なお、以下では256階調の白黒濃淡画像を撮像する場合を示すこととする。
記憶部15は、フラッシュメモリ等の不揮発性メモリ又はハードディスク装置等からなる記憶デバイスであり、撮像部13で撮像された画像や各種設定データを記憶する。なお、この記憶部15の所定の記憶領域には、後述するようにこの携帯電話端末10を動作させるための各種プログラムについても記憶する。
制御部16は、音声通話接続処理、Eメール送受信処理及びインターネット接続処理等の各種制御を行う制御部であり、通信処理部16a、撮像処理部16b及び文字画像処理部16cを有する。なお、ここでは説明の便宜上その詳細な説明を省略するが、この制御部16には、音声通話用の電話帳、Eメール送受信を行う際に利用するメーラ、インターネット上のサイトを閲覧する際に利用するブラウザ等についても搭載している。
通信処理部16aは、音声通話接続処理、Eメール送受信処理、インターネット接続処理等の各種通信関連処理を行う際に必要となる無線通信処理を司る処理部である。この通信処理部16aは、無線通信確立要求を受け付けたならば、図示しない基地局に通信接続要求を行って通信回線を確立したり、基地局を介したパケット送信を行うことになる。
撮像処理部16bは、撮像部13を用いた被写体の撮像制御を行う制御部であり、撮像部13で被写体を撮像した場合には、撮像された画像データをメモリ上に展開して一時的に保持するとともに、この画像データをファイルとして記憶部15に格納することができる。なお、本実施例1では、この撮像処理部16bにより、用紙に描かれた手書き文字を撮像した文字画像データ(256階調の白黒濃淡画像)を取得して記憶部15に記憶した場合を示している。
文字画像処理部16cは、撮像部13を用いて手書き文字を撮像した文字画像データから背景の影響を除去して文字の鮮鋭化処理を行う本発明に係る処理部であり、具体的には、文字画像データに微分オペレータを適用して微分画像データを取得し、この微分画像データを形成する各エッジのエッジ位置を文字内部方向に向けて補正して位置補正エッジ画像データを取得し、この位置補正エッジ画像データの各エッジ以外の背景の影響を除去した疑似文字画像データを生成する処理を行う。
具体的には、この文字画像処理部16cは、文字画像データに対して微分オペレータを適用して該文字画像データに含まれる各エッジの画素値並びにエッジ方向を抽出するとともに、抽出した各エッジのエッジ方向に基づいて該エッジのエッジ位置を文字内部方向に補正して位置補正エッジ画像データを取得することになる。
また、この文字画像処理部16cが背景を除去する際には、位置補正エッジ画像データの濃度ヒストグラムを生成し、生成した濃度ヒストグラムに基づいて背景を形成する画素(以下「背景画素」と言う)の画素値とそれ以外の画素の画素値を区別する閾値T1と、文字を形成する画素(以下「文字画素」と言う)の画素値とそれ以外の画素の画素値を区別する閾値T2を求め、位置補正エッジ画像データを形成する各画素の画素値が閾値T1以上である場合には該画素の画素値を背景画素に付与する所定の画素値(例えば白画素を示す画素値「255」)に変換し、位置補正エッジ画像データを形成する各画素の画素値が閾値T2以下である場合には該画素の画素値を文字画素に付与する所定の画素値(例えば黒画素を示す画素値「0」)に変換する。
次に、本実施例1に係る携帯電話端末10のハードウエア構成について説明する。図2は、図1に示した携帯電話端末10のハードウエア構成を示す図である。同図に示すように、この携帯電話端末10は、操作ユニット21、液晶パネル22、カメラ23、無線通信ユニット24、不揮発性メモリ25及びCPU26がバスを介して接続された構成となる。ここで、この操作ユニット21は図1の操作部11に対応し、液晶パネル22は図1の表示部12に対応し、カメラ23は図1の撮像部13に対応し、無線通信ユニット24は図1の無線通信部14に対応し、不揮発性メモリ25は図1の記憶部15に対応し、CPU26は図1の制御部16に対応する。
そして、この不揮発性メモリ25の所定の領域には、通信処理プログラム25a、撮像処理プログラム25b及び文字画像処理プログラム25c等のプログラムが格納されており、CPU26がこれらのプログラムを不揮発性メモリ25からロードして実行すると、通信処理プロセス26a、撮像処理プロセス26b及び文字画像処理プロセス26cが動作する。この通信処理プロセス26aが図1の通信処理部16aに対応し、撮像処理プロセス26bが図1の撮像処理部16bに対応し、文字画像処理プロセス26cが図1の文字画像処理部16cに対応する。
なお、ここでは図1に示した機能ブロックとの関係を明確化するために説明の便宜上マルチプロセスとして動作させる場合を示したが、実際にはこれらのプログラムをサブルーチンとして内在する一つのプログラムを不揮発性メモリ25に格納しておき、CPU26がこのプログラムを実行して同様の動作を行わせることになる。
次に、図1に示した文字画像処理部16cの処理手順について説明する。図3は、図1に示した文字画像処理部16cの処理手順を示すフローチャートである。なお、ここでは撮像部13を用いて手書き文字を撮像した文字画像データがあらかじめ記憶部15内に格納されているものとする。
図3に示すように、この文字画像処理部16cは、記憶部15に記憶した図4に示した文字画像データ31を読み出し(ステップS101)、この文字画像データ31に微分オペレータを適用して文字画像データ内の文字部分のエッジを検出する(ステップS102)。
例えば、図5に示したソーベル(sobel)の微分オペレータを用いた場合には、図4に示したエッジ画像データ32を得ることができる。ここで、x方向の微分をfx、y方向の微分をfyで表すと、その際のエッジ強度(グラジエントの強度)は、SQRT(fx2+fy2)の算定式により得られ、エッジ方向(グラジエントの方向)は、tan-1(fx/fy)の算定式により得られる。なお、上記「SRQRT」は2乗平方根を示している。ただし、エッジ強度とエッジ方向を算定することができればいかなる微分オペレータを用いることもできる。
このようにして、エッジ画像データ32を得たならば、エッジ位置補正処理を行い(ステップS103)、図4に示す位置補正エッジ画像データ33を取得する。かかるエッジ位置の補正を行う理由は、一次微分の微分オペレータエッジ部分に適用すると2画素のエッジが検出されてしまい、見かけ上文字を形成する線分の文字幅が太くなってしまうからである。本実施例1では、この位置補正エッジ画像データ33の濃度を補正したエッジ画像データ34を擬似的な文字画像データとして取り扱う関係上、エッジ画像データ32のエッジ位置を本来のエッジ位置に戻す必要があるのである。この意味で、以下ではエッジ画像データ34を疑似文字画像データ34と言う。
具体的には、図6に示すように、文字幅が4画素の縦線からなる文字画像データ51に微分オペレータを適用してエッジ画像データ52を取得すると、エッジ画像データ52内の各エッジのエッジ位置をエッジ方向を利用して文字内部方向に一画素分シフトする補正を行い、位置補正エッジ画像データ53を取得する。この位置補正エッジ画像データ53は、同図に示す文字画像データ51と同様のデータとなるため、この位置補正エッジ画像データ53の画素値を変換した疑似文字画像データを文字画像データ51の代替えとして利用することができる。
このようにして、位置補正エッジ画像データ33を得たならば、この位置補正エッジ画像データ33に対して画素値補正処理を行って(ステップS104)、図4に示した疑似文字画像データ34を取得する。この疑似文字画像データ34は、厳密に言うとエッジ部分にのみ画素値を持つエッジ画像データであるが、本実施例1では、このエッジ画像データを擬似的に文字画像データとしての扱いとしている。その理由は、本来文字画像データを微分すると文字の中心部が中抜けしたエッジのみで形成されるエッジ画像データとなるが、このエッジを文字内部方向に位置補正すると、文字幅を本来の文字幅に戻せるだけではなく文字幅が5画素以内の場合には文字の中抜けを解消できるため、エッジ画像データとしてではなく文字画像データとして取り扱えるためである。
図8は、画素値補正処理手順を示すフローチャートであり、同図に示すように、画素値補正処理を行う際には、図7に示すように位置補正エッジ画像データ33の濃度ヒストグラムを生成し(ステップS201)、生成した濃度ヒストグラムを用いて閾値T1と閾値T2を決定する(ステップS202)。
そして、位置補正エッジ画像データ33の各画素の画素値が閾値T1以上である場合には(ステップS203肯定)、この画素が背景画素であるとみなしてその画素値を「255」とし(ステップS204)、位置補正エッジ画像データ33の各画素の画素値が閾値T2以下である場合には(ステップS205肯定)、この画素が文字画素であるとみなしてその画素値を「0」とする(ステップS206)。
かかる一連の処理を位置補正エッジ画像データ33の全ての画素について繰り返し(ステップS207肯定)、全ての画素について処理を行ったならば(ステップS207否定)処理を終了する。これにより、文字画素の画素値は「0」すなわち黒画素となり、背景画素の画素値は「255」すなわり白画素となるため、背景の影響が除去されることになる。
なお、ここでは位置補正エッジ画像データ33の各画素の画素値Aが閾値T2〜T1の間である場合には何らの処理も行わないこととしたが、A×(253/(T1−T2))の算定式を用いて画素値1〜254の値に変換することもできる。
上述してきたように、本実施例1では、文字画像処理部16cが、記憶部15から文字画像データ31を読み出し、この文字画像データにエッジ抽出処理を行ってエッジ画像データ32を取得し、このエッジ画像データ32のエッジのエッジ位置を文字内部方向に補正して位置補正エッジ画像データ33を作成し、この位置補正エッジ画像データ33に画素値補正処理を行って背景の影響を除去した疑似文字画像データ34を取得するよう構成したので、携帯電話端末10で撮影した文字画像データ31のコントラストが悪い場合に、かかる文字画像データ31から効率的かつ簡易に適正な疑似文字画像データ34を取得することが可能となる。
ところで、上記実施例1では、疑似文字画像データ34を文字画像データ31の代替えとして用いることとしたが、この疑似文字画像データ34の本質がエッジ画像データであるために、文字幅が太くなると中抜けが生じてしまう。具体的には、図6に示したような文字幅が4画素である場合には位置補正により中抜けが生じないが、文字幅が5画素以上である場合には位置補正したとしても中抜けが生じてしまう。そこで、本実施例2では、かかる中抜けを防止する場合について説明する。
図9は、本実施例2に係る携帯電話端末60の構成を示す機能ブロック図である。ここでは、図1に示した携帯電話端末10の構成部位と同様の機能を有する部分には同一符号を付すこととしてその詳細な説明を省略する。図9に示す携帯電話端末60は、文字画像処理部61の内部に中抜け防止処理部62が設けられている点で携帯電話端末10と異なる。
この中抜け防止処理部62は、疑似文字画像データ34内に含まれる文字の文字幅を求め、この文字幅が5画素未満である場合には中抜けが生じないため中抜け防止処理を行わず、文字幅が5画素以上である場合に中抜け処理を行うものである。
ここで、本実施例2では、撮像部13により撮像された文字画像データ31内に含まれる各文字の文字幅は均一であると仮定して、疑似文字画像データ34内の全ての文字の文字幅を利用するのではなく、疑似文字画像データ34内の特定の小領域に所在する文字の文字幅のみを利用する。このようにした理由は、通常は携帯電話端末10の表示部12に文字画像として表示する程度の文字数であれば同じ筆記具を用いて筆記されているものと想定され、また全ての文字を対象とすると却って処理負荷が大きくなるためである。
具体的には、図4に示した疑似文字エッジ画像データ34を用いると効率的に文字幅を判定することができる。例えば、文字幅が「5画素」であると判定された場合には、微分オペレータの適用及びエッジ位置補正により4画素のエッジが存在し、エッジ間すなわち文字画素間には「1画素」の背景画素が存在するはずである。このため、各エッジ間に1画素の背景画素が存在するケースが多い場合には文字幅が「5画素」であると判定する。同様に、各エッジ間に「2画素」の背景画素が存在するケースが多い場合には文字幅が「6画素」であると判定し、エッジ間に背景画素が存在しないケースが多い場合には文字幅が「4画素以下」であると判定する。
また、中抜け防止処理としては、求めた文字幅と同じ大きさのマスクパターンを使用するとともに、このマスクパターン上の対角に位置する画素が文字画素である場合にはその間の背景画素を文字画素の画素値に置き換える処理を行うことになる。なお、かかる中抜け防止処理を行うと、本来文字画素ではない背景画素についても文字画素とされる可能性があるが、文字画像データは利用者が文字を認識されできれば良いので問題がない。
特に、利用者が中抜けの生じる程度の太いペン先の筆記具を利用した場合には、用紙上に比較的大きな文字が描かれるのが通常であるので、背景画素の一部を文字画素としても文字判読上の影響は少ない。むしろ、携帯電話端末10の処理性能を考慮すると、かかる軽易な処理とすることが望ましいのである。
図10は、図9に示した中抜け防止処理部62による中抜け防止処理手順を示すフローチャートである。同図に示すように、この中抜け防止処理部62は、文字画像データ内に含まれる各文字の文字幅を判定する文字幅判定処理を行う(ステップS301)。
その後、判定した文字幅が5画素以上であるか否かを調べ(ステップS302)、この文字幅が4画素以下である場合には(ステップS302否定)、中抜け防止処理を行うことなく処理を終了する。
これに対して、判定した文字幅が5画素以上である場合には(ステップS302肯定)、疑似文字画像データ34の文字画素と文字画素の間に(文字幅−4)個連接する背景画素が存在するか否かを調べ(ステップS303)、かかる背景画素が存在する場合には(ステップS303肯定)、この背景画素の画素値を文字画素の画素値に置換する(ステップS304)。なお、かかる背景画素が存在しない場合には(ステップS303否定)、ステップS305に移行する。
上記一連の処理を疑似文字画像データ34の各画素について繰り返し(ステップS305)、全画素について背景画素の存在の確認を終えたならば(ステップS305肯定)、かかる中抜け防止処理を終了する。
上述してきたように、本実施例2では、疑似文字画像データ34の一部の領域に含まれるエッジを用いて文字幅を判定し、判定した文字幅が4画素以下である場合に、中抜け防止処理を行うよう構成したので、迅速かつ効率的に疑似文字画像データ34を中抜けのない適正な文字画像データとして取り扱うことができる。
なお、本実施例1及び2では、本発明を携帯電話端末10に適用した場合を示したが、本発明はこれに限定されるものではなく、デジタルカメラ等の他の携帯端末に対しても適用することができる。また、本実施例1及び2では、手書き文字を撮像する場合について説明したが、本発明はこれに限定されるものではなく、書籍等に印刷された文字を撮像する場合にも同様に適用することができる。
さらに、本実施例1及び2では、携帯電話端末10で撮像した文字画像データを一旦記憶部15に格納した後に文字画像処理部16c及び61による文字画像処理を行う場合を示したが、本発明はこれに限定されるものではなく、携帯電話端末10で撮像した文字画像データを記憶部15に格納することなく、メモリに展開した状態で文字画像処理部16c及び61による文字画像処理を行うこともできる。
また、本実施例1及び2では、2種類の閾値T1及びT2を用いることとしたが、本発明はこれに限定されるものではなく、一種類の閾値Tのみを採用し、この閾値T以上の画素を背景画素とし、閾値T未満の画素を文字画素とすることもできる。
(付記1)携帯端末で文字を撮像した文字画像データから背景の影響を除去して文字の鮮鋭化処理を行う携帯端末用の文字画像処理装置であって、
前記文字画像データに含まれる文字のエッジを抽出するエッジ抽出手段と、
前記エッジ抽出手段で抽出された各エッジのエッジ位置を文字内部方向に向けて補正するエッジ位置補正手段と、
前記エッジ位置補正手段で位置補正された各エッジ以外の背景の影響を除去する背景除去手段と
を備えたことを特徴とする文字画像処理装置。
(付記2)前記エッジ抽出手段は、文字画像データに対して微分オペレータを適用して該文字画像データに含まれる各エッジの画素値並びにエッジ方向を抽出し、前記エッジ位置補正手段は、前記エッジ抽出手段で抽出された各エッジのエッジ方向に基づいて該エッジのエッジ位置を文字内部方向に補正することを特徴とする付記1に記載の文字画像処理装置。
(付記3)前記背景除去手段は、前記エッジ位置補正手段で位置補正されたエッジ画像データの濃度ヒストグラムを生成する濃度ヒストグラム生成手段と、前記濃度ヒストグラム生成手段により生成された濃度ヒストグラムに基づいて背景画素の画素値とそれ以外の画素の画素値を区別する第1の閾値を算定する閾値算定手段と、前記エッジ画像データを形成する各画素の画素値が前記第1の閾値以上である場合には該画素の画素値を前記背景画素に付与する所定の画素値に変換する画素値変換手段とを備えたことを特徴とする付記1又は2に記載の文字画像処理装置。
(付記4)前記閾値算定手段は、前記濃度ヒストグラム生成手段により生成された濃度ヒストグラムに基づいて文字画素の画素値とそれ以外の画素の画素値を区別する第2の閾値を算定し、前記画素値変換手段は、前記エッジ画像データを形成する各画素の画素値が前記第2の閾値以下である場合には該画素の画素値を前記文字画素に付与する所定の画素値に変換することを特徴とする付記3に記載の文字画像処理装置。
(付記5)前記背景除去手段は、前記画素値変換手段により画素値が変換された各画素のうち文字画素であるにも係わらず背景画素の画素値が付与された画素の画素値を前記文字画素の画素値に変換して文字の中抜け防止処理を行う中抜け防止処理手段をさらに備えたことを特徴とする付記3又は4に記載の文字画像処理装置。
(付記6)前記中抜け防止処理手段は、前記文字画像データに含まれる文字の文字幅を算定する文字幅算定手段と、前記文字幅算定手段により算定された文字幅と前記エッジ位置補正手段で位置補正された各エッジの間隔とに基づいて文字画素であるにも係わらず背景画素の画素値が付与された画素を特定する特定手段と、前記特定手段により特定された画素の画素値を前記文字画素の画素値に変換する第2の画素値変換手段とを備えたことを特徴とする付記5に記載の文字画像処理装置。
(付記7)携帯端末で文字を撮像した文字画像データから背景の影響を除去して文字の鮮鋭化処理を行う文字画像処理方法であって、
前記文字画像データに含まれる文字のエッジを抽出するエッジ抽出工程と、
前記エッジ抽出工程で抽出された各エッジのエッジ位置を文字内部方向に向けて補正するエッジ位置補正工程と、
前記エッジ位置補正工程で位置補正された各エッジ以外の背景の影響を除去する背景除去工程と
を含んだことを特徴とする文字画像処理方法。
(付記8)文字を撮像した文字画像データから背景の影響を除去して文字の鮮鋭化処理を行う携帯端末用の文字画像処理プログラムであって、
前記文字画像データに含まれる文字のエッジを抽出するエッジ抽出手順と、
前記エッジ抽出手順で抽出された各エッジのエッジ位置を文字内部方向に向けて補正するエッジ位置補正手順と、
前記エッジ位置補正手順で位置補正された各エッジ以外の背景の影響を除去する背景除去手順と
をコンピュータに実行させることを特徴とする文字画像処理プログラム。
本発明にかかる文字画像処理装置及び文字画像処理方法は、携帯端末で撮影した手書き文字の画像データのコントラストが悪い場合に、かかる画像データから効率的かつ簡易に判読可能な手書き文字を内在する画像データを取得する場合に有用である。
本実施例1に係る携帯電話端末の構成を示す機能ブロック図である。 図1に示した携帯電話端末のハードウエア構成を示す図である。 図1に示した文字画像処理部の処理手順を示すフローチャートである。 図1に示した文字画像処理部による文字画像処理の適用例を示す図である。 エッジ抽出処理で用いる微分オペレータの一例を示す図である。 エッジ位置補正処理の概念を説明するための説明図である。 画素値補正処理で用いる閾値処理の説明図である。 画素値補正処理手順を示すフローチャートである。 本実施例2に係る携帯電話端末の構成を示す機能ブロック図である。 図9に示した中抜け防止処理部による中抜け防止処理手順を示すフローチャートである。 従来技術の問題を説明するための説明図である。
符号の説明
10 携帯電話端末
11 操作部
12 表示部
13 撮像部
14 無線通信部
15 記憶部
16 制御部
16a 通信処理部
16b 撮像処理部
16c 文字画像処理部
21 操作ユニット
22 液晶パネル
23 カメラ
24 無線通信ユニット
25 不揮発性メモリ
25a 通信処理プログラム
25b 撮像処理プログラム
25c 文字画像処理プログラム
26 CPU
26a 通信処理プロセス
26b 撮像処理プロセス
26c 文字画像処理プロセス
31 文字画像データ
32 エッジ画像データ
33 位置補正エッジ画像データ
34 疑似文字画像データ
41,41 ソーベルの一次微分オペレータ
51 文字画像データ
52 エッジ画像データ
53 位置補正エッジ画像データ
60 携帯電話端末
61 文字画像処理部
62 中抜け防止処理部

Claims (5)

  1. 携帯端末で文字を撮像した文字画像データから背景の影響を除去して文字の鮮鋭化処理を行う携帯端末用の文字画像処理装置であって、
    前記文字画像データに含まれる文字のエッジを抽出するエッジ抽出手段と、
    前記エッジ抽出手段で抽出された各エッジのエッジ位置を文字内部方向に向けて補正するエッジ位置補正手段と、
    前記エッジ位置補正手段で位置補正された各エッジ以外の背景の影響を除去する背景除去手段と
    を備えたことを特徴とする文字画像処理装置。
  2. 前記エッジ抽出手段は、文字画像データに対して微分オペレータを適用して該文字画像データに含まれる各エッジの画素値並びにエッジ方向を抽出し、前記エッジ位置補正手段は、前記エッジ抽出手段で抽出された各エッジのエッジ方向に基づいて該エッジのエッジ位置を文字内部方向に補正することを特徴とする請求項1に記載の文字画像処理装置。
  3. 前記背景除去手段は、前記エッジ位置補正手段で位置補正されたエッジ画像データの濃度ヒストグラムを生成する濃度ヒストグラム生成手段と、前記濃度ヒストグラム生成手段により生成された濃度ヒストグラムに基づいて背景画素の画素値とそれ以外の画素の画素値を区別する第1の閾値を算定する閾値算定手段と、前記エッジ画像データを形成する各画素の画素値が前記第1の閾値以上である場合には該画素の画素値を前記背景画素に付与する所定の画素値に変換する画素値変換手段とを備えたことを特徴とする請求項1又は2に記載の文字画像処理装置。
  4. 前記閾値算定手段は、前記濃度ヒストグラム生成手段により生成された濃度ヒストグラムに基づいて文字画素の画素値とそれ以外の画素の画素値を区別する第2の閾値を算定し、前記画素値変換手段は、前記エッジ画像データを形成する各画素の画素値が前記第2の閾値以下である場合には該画素の画素値を前記文字画素に付与する所定の画素値に変換することを特徴とする請求項3に記載の文字画像処理装置。
  5. 携帯端末で文字を撮像した文字画像データから背景の影響を除去して文字の鮮鋭化処理を行う携帯端末用の文字画像処理方法であって、
    前記文字画像データに含まれる文字のエッジを抽出するエッジ抽出工程と、
    前記エッジ抽出工程で抽出された各エッジのエッジ位置を文字内部方向に向けて補正するエッジ位置補正工程と、
    前記エッジ位置補正工程で位置補正された各エッジ以外の背景の影響を除去する背景除去工程と
    を含んだことを特徴とする文字画像処理方法。
JP2006177169A 2006-06-27 2006-06-27 文字画像処理装置及び文字画像処理方法 Expired - Fee Related JP4576358B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006177169A JP4576358B2 (ja) 2006-06-27 2006-06-27 文字画像処理装置及び文字画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006177169A JP4576358B2 (ja) 2006-06-27 2006-06-27 文字画像処理装置及び文字画像処理方法

Publications (2)

Publication Number Publication Date
JP2008010980A true JP2008010980A (ja) 2008-01-17
JP4576358B2 JP4576358B2 (ja) 2010-11-04

Family

ID=39068825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006177169A Expired - Fee Related JP4576358B2 (ja) 2006-06-27 2006-06-27 文字画像処理装置及び文字画像処理方法

Country Status (1)

Country Link
JP (1) JP4576358B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9378426B2 (en) 2013-04-02 2016-06-28 3M Innovative Properties Company Systems and methods for note recognition
JP2021013124A (ja) * 2019-07-08 2021-02-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0437258A (ja) * 1990-05-31 1992-02-07 Fuji Xerox Co Ltd 画像処理装置
JPH08329252A (ja) * 1995-05-31 1996-12-13 Sony Corp エッジ検出方法及びエッジ検出装置
JP2005341249A (ja) * 2004-05-27 2005-12-08 Konica Minolta Business Technologies Inc 画像処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0437258A (ja) * 1990-05-31 1992-02-07 Fuji Xerox Co Ltd 画像処理装置
JPH08329252A (ja) * 1995-05-31 1996-12-13 Sony Corp エッジ検出方法及びエッジ検出装置
JP2005341249A (ja) * 2004-05-27 2005-12-08 Konica Minolta Business Technologies Inc 画像処理装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9378426B2 (en) 2013-04-02 2016-06-28 3M Innovative Properties Company Systems and methods for note recognition
JP2016525729A (ja) * 2013-04-02 2016-08-25 スリーエム イノベイティブ プロパティズ カンパニー メモ認識システム及び方法
JP2021013124A (ja) * 2019-07-08 2021-02-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP7341758B2 (ja) 2019-07-08 2023-09-11 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
JP4576358B2 (ja) 2010-11-04

Similar Documents

Publication Publication Date Title
KR100912335B1 (ko) 화상 처리 장치, 화상 처리 방법 및 화상 처리 프로그램을기록한 기록 매체
US9002061B2 (en) Image processing device, image processing method and computer-readable medium
KR101907414B1 (ko) 촬영 이미지 기반의 문자 인식 장치 및 방법
EP1886249A1 (en) Image processing for pattern detection
JP2011045078A (ja) カメラベースの文書画像処理のための適応的ボケ除去
US8538191B2 (en) Image correction apparatus and method for eliminating lighting component
CN108965646B (zh) 图像处理装置、图像处理方法
JP4453016B2 (ja) 携帯端末、文字読取方法および文字読取プログラム
JP2010056827A (ja) 画像処理装置および画像処理プログラム
US9361500B2 (en) Image processing apparatus, image processing method, and recording medium
JP4576358B2 (ja) 文字画像処理装置及び文字画像処理方法
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
CN110245537A (zh) 图形码解码方法,装置,存储介质及电子设备
CN106682717B (zh) 一种半色调二维码的生成方法和系统
US20070274594A1 (en) Outline definition apparatus and outline definition method, and image processing apparatus
JP2019047418A (ja) 情報処理装置、情報処理方法、コンピュータプログラム
JP2009105637A (ja) 画像のぼけ判断方法、その装置及びそのプログラム
JP7102128B2 (ja) プログラム、画像処理装置、および画像処理方法
Nakamura et al. Fast watermark detection scheme from camera-captured images on mobile phones
CN116452471B (zh) 超高清图像的处理方法、装置、终端设备及计算机介质
JP4504140B2 (ja) 筆記面再生方法、筆記面再生装置及び筆記面再生プログラム
JP7106672B2 (ja) 画像処理装置、制御方法及び制御プログラム
JP2010102376A (ja) 情報表示画素群抽出方法、情報表示画素群抽出装置及び情報表示画素群抽出プログラム
CN116630197A (zh) 一种基于浏览器的证件照纠正方法、装置、设备及介质
JP2007004330A (ja) 携帯情報端末およびその制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100817

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100823

R150 Certificate of patent or registration of utility model

Ref document number: 4576358

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees