JP2008282094A - 文字認識処理装置 - Google Patents
文字認識処理装置 Download PDFInfo
- Publication number
- JP2008282094A JP2008282094A JP2007123564A JP2007123564A JP2008282094A JP 2008282094 A JP2008282094 A JP 2008282094A JP 2007123564 A JP2007123564 A JP 2007123564A JP 2007123564 A JP2007123564 A JP 2007123564A JP 2008282094 A JP2008282094 A JP 2008282094A
- Authority
- JP
- Japan
- Prior art keywords
- logo
- information
- attribute
- company name
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
【課題】 文字認識処理装置において、名刺からデータを作成する際にロゴを使用することにより、会社名の認識精度を向上させる。
【解決手段】 文字認識処理装置において、名刺等の画像を入力する画像入力手段と、入力された画像データの特徴量を抽出する画像特徴量抽出手段と、テーブル、テキスト、ピクチャなどのブロックに領域分割されて前記抽出された画像特徴量からテキスト領域を文字認識し、属性(氏名、住所、会社名等)を判断する属性判断手段と、抽出された画像特徴量の図形領域からロゴマークを判断するロゴ判断手段と、ロゴに対応する会社名等の情報を登録するロゴ情報登録手段と、前記登録したロゴ情報から、ロゴに対応した会社名等の情報を取得するロゴ情報取得手段と、取得したロゴに対応する会社名等の情報を使用して、属性判断した属性の文字を補正する文字補正手段からなる。
【選択図】 図1
【解決手段】 文字認識処理装置において、名刺等の画像を入力する画像入力手段と、入力された画像データの特徴量を抽出する画像特徴量抽出手段と、テーブル、テキスト、ピクチャなどのブロックに領域分割されて前記抽出された画像特徴量からテキスト領域を文字認識し、属性(氏名、住所、会社名等)を判断する属性判断手段と、抽出された画像特徴量の図形領域からロゴマークを判断するロゴ判断手段と、ロゴに対応する会社名等の情報を登録するロゴ情報登録手段と、前記登録したロゴ情報から、ロゴに対応した会社名等の情報を取得するロゴ情報取得手段と、取得したロゴに対応する会社名等の情報を使用して、属性判断した属性の文字を補正する文字補正手段からなる。
【選択図】 図1
Description
本発明は文字認識処理装置に関する。
従来、名刺等の画像を領域識別し、テキストを会社名、住所、電話番号、氏名等の属性に分類して、会社名、住所、氏名などは、それぞれの単語辞書と照合して、テキストを補正していた。
従来例としては、例えば特許文献1と特許文献2をあげることが出来る。
特開平11−167532号公報
特開2000−357175号公報
しかし、従来の文字認識処理装置では、名刺等に印刷されている会社名がロゴである場合、文字認識の精度が著しく低下し、テキストを補正する正確な会社名を得られなかった。
本発明は、名刺等の画像を属性判断し、ロゴを使用して、属性毎に文字認識した文字を補正し、認識精度を向上させることを目的とする。
本発明に係る文字認識処理装置は、名刺等の画像を入力する画像入力手段と、前記入力された画像データの特徴量を抽出する画像特徴量抽出手段と、テーブル、テキスト、ピクチャなどのブロックに領域分割されて前記抽出された画像特徴量からテキスト領域を文字認識し、属性(氏名、住所、会社名等)を判断する属性判断手段と、前記抽出された画像特徴量の図形領域からロゴを判断するロゴ判断手段と、前記ロゴに対応する会社名等の情報を登録するロゴ情報登録手段と、前記登録したロゴ情報からロゴに対応した会社名等の情報を取得するロゴ情報取得手段と、前記取得したロゴに対応する会社名等の情報を使用して、前記属性判断した属性の文字を補正する文字補正手段とを有することを特徴とする。
本発明によれば、ロゴ情報を使用して、ロゴから会社名を補正するので、会社名がロゴになっている場合でも補正することができる。ロゴ情報を使用して、他の領域の文字を補正することにより、文字の認識精度を向上させることができる。
次に本発明に係る文字認識処理装置の一実施形態を図面に基づいて説明する。
図1は、本発明に係る文字認識処理装置の一実施形態を示すブロック図、図2は、名刺画像の例を示す図、図3は、ロゴ情報を示す図である。
図1において、文字認識処理装置は、スキャナ、カメラ、あるいはファイル読み込み装置などの画像入力手段11を有し、この画像入力手段11から会社名、ロゴを含む名刺等を画像データとして入力する。
画像入力手段11はバス17に接続され、バス17を介して文字認識処理を実行するプロセッサ12に接続されている。
バス17にはさらにキーボード13、ディスク14、メモリ15、出力手段16が接続されている。
メモリ15は、プロセッサ12において処理制御情報を作成する際の一時データ記憶、あるいは画像入力手段11で読み込んだ名刺画像を蓄積する。また登録したロゴ情報等が、ディスク14等から読み込まれて、保持される。また、後述するフローチャートに対応するような処理をコンピュータに実行させるための制御プログラム15cが格納される。
プロセッサ12は、メモリ15に格納された制御プログラム15cを実行することにより、画像特徴量抽出手段12a、属性判断手段12b、文字補正手段12cとして機能する。
キーボード13は、ロゴの登録などの指示操作を行い、ディスク14は、補助記憶装置として機能する。
出力手段16は、ディスプレイ、プリンタ等であり、補正結果等の各種情報を出力する。
画像入力手段11で読み取った帳票の画像は、名刺画像15bとしてメモリ15に格納される。名刺画像15bはプロセッサ12に設けられた画像処理手段(図示せず。)等により2値化処理されて、画像特徴量抽出手段12aに送られ、ヒストグラム法や輪郭線追跡などの手法により、テーブル、テキスト、ピクチャなどのブロックに領域分割されて分類される。
その分類された情報から、属性判断手段12bにより、テキストを会社名、住所、氏名等に属性判断し、テキストを属性毎にメモリ11およびディスク14に保存する。
図2は、名刺画像の例を示す図である。図2において、21はロゴ、22は所属、23は役職、24は氏名、25は会社、26は住所、27は電話番号、28は電子メールアドレスである。この画像から特徴量抽出すると、21のロゴはピクチャ領域に、22〜28の領域は、テキスト領域となる。テキスト領域を文字認識し、属性(会社名、住所、氏名等)を判断する。属性は、各領域の文字認識した結果に含まれる文字列から判断できる。例えば、文字認識した結果の文字列に、「本部」「開発部」「部」「課」等の文字を含んでいる場合は属性は「所属」とし、「部長」「課長」「研究員」等の文字を含んでいる場合は「役職」、都道府県名、市郡名を含んでいる場合は「住所」、「電話」「TEL」等の文字を含んでいる場合は「電話番号」、「E−mail」「@」の文字を含んでいる場合は「電子メール」等とし、属性を判断できる。属性を判断して、住所、氏名等の領域の文字は、住所辞書、氏名辞書等と照合して、文字を補正することもできる。
図3はロゴ情報を示す図である。ロゴデータには、色、形状、輪郭線等の特徴量データを記録する。会社名はロゴに対応する会社名である。1つのロゴに複数の会社名が対応する場合もある。レイアウト情報は、属性(所属、役職、氏名、会社名、住所、電話番号、電子メール等)の位置情報等である。レイアウト情報は会社名に対応していて、図5に示すような情報からなる。図3では、ロゴAに会社A、レイアウトAが対応している。ロゴBには、会社B、会社C、会社Dが対応している。
ロゴを識別した結果、会社名が複数の場合は、例えば、名刺画像から抽出したロゴを識別した結果、ロゴBと一致した場合、会社B、会社C、会社Dのレイアウト情報レイアウトB、レイアウトC、レイアウトDと、名刺画像の会社名の領域を照合し、照合結果から会社名を判断する。
図5はレイアウト情報を示す図である。会社名毎の属性の位置情報を持っている。また、属性情報として、文字列や書体情報等の付属する情報を持つ。図5の場合、所属、役職、氏名の属性情報はゴシック体、住所の属性情報は会社名で住所が固定の場合は会社名の住所の文字列を持っている。
このようにロゴから会社名を判断することができ、会社名から、属性情報等より、他の領域の情報を得ることができる。
図4は、文字補正処理の一実施形態を示すフローチャートである。
予め、ロゴ情報を登録しておく。
ステップS41:名刺を画像入力手段11から画像を読み込み、頁画像としてメモリに転送する。
ステップS42:画像から特徴量を抽出する。
ステップS43:抽出された特徴量からテキスト領域を文字認識し、その文字列に、ある文字列が含まれるかを判断する等して、属性を判断する。
ステップS44:ステップS42で、抽出した特徴量からピクチャ領域をロゴ情報テーブルと比較し、登録したロゴ情報で一致するものがあるか、判断する。一致するロゴ情報がある場合はステップS45に進み、ない場合は、終了する。
ステップS45:一致したロゴに対応する情報を取得する。会社名が複数ある場合は、複数の会社名と比較して一致するものを選択する。
ステップS46:取得した会社名で、会社名を補正する。また、会社名に対応するレイアウト情報を使用して、他の情報の補正も行ってもよい。
また、一致するロゴ情報がない場合は、ロゴ情報を保存しておき、会社名等が確定したときに登録してもよい。そうすると、予めロゴ情報を登録していなくても、自動でロゴ情報を登録した辞書を作成できる。
以上の実施形態に示したように、ロゴ領域を抽出し、ロゴ情報を取得することにより、会社名を補正することができる。また、会社名に対応するレイアウト情報から他の領域の文字列を補正することもできる。
11 スキャナ、カメラ等の画像入力手段
12 プロセッサ
12a 画像特徴量抽出手段
12b 属性判断手段
12c 文字補正手段
13 キーボード
14 ディスク
15 メモリ
15a ロゴ情報
15b 名刺画像
15c 制御プログラム
16 ディスプレイ、プリンタ等の出力手段
12 プロセッサ
12a 画像特徴量抽出手段
12b 属性判断手段
12c 文字補正手段
13 キーボード
14 ディスク
15 メモリ
15a ロゴ情報
15b 名刺画像
15c 制御プログラム
16 ディスプレイ、プリンタ等の出力手段
Claims (1)
- 画像を入力する画像入力手段と、
前記入力された画像データの特徴量を抽出する画像特徴量抽出手段と、
ブロックに領域分割されて、前記抽出された画像特徴量からテキスト領域を文字認識し、属性を判断する属性判断手段と、
前記抽出された画像特徴量の図形領域からロゴマークを判断するロゴ判断手段と、
前記ロゴに対応する情報を登録するロゴ情報登録手段と、
前記登録したロゴ情報から、ロゴに対応した情報を取得するロゴ情報取得手段と、
前記取得したロゴに対応する情報を使用して、前記属性判断した属性の文字を補正する文字補正手段と、
を有することを特徴とする文字認識処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007123564A JP2008282094A (ja) | 2007-05-08 | 2007-05-08 | 文字認識処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007123564A JP2008282094A (ja) | 2007-05-08 | 2007-05-08 | 文字認識処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008282094A true JP2008282094A (ja) | 2008-11-20 |
Family
ID=40142880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007123564A Pending JP2008282094A (ja) | 2007-05-08 | 2007-05-08 | 文字認識処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008282094A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012252449A (ja) * | 2011-06-01 | 2012-12-20 | Nec Corp | 名刺管理装置及び方法 |
KR101499379B1 (ko) * | 2011-06-29 | 2015-03-05 | 퀄컴 인코포레이티드 | 객체에서 텍스트 정보를 인식하기 위한 시스템 및 방법 |
KR101520558B1 (ko) | 2010-10-22 | 2015-05-14 | 퀄컴 인코포레이티드 | 휴대용 컴퓨팅 디바이스로 토큰 데이터를 캡처하기 위한 시스템 및 방법 |
JP2019149073A (ja) * | 2018-02-28 | 2019-09-05 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置 |
US11403798B2 (en) | 2018-09-06 | 2022-08-02 | Fujifilm Corporation | Image processing apparatus, method, and program |
-
2007
- 2007-05-08 JP JP2007123564A patent/JP2008282094A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101520558B1 (ko) | 2010-10-22 | 2015-05-14 | 퀄컴 인코포레이티드 | 휴대용 컴퓨팅 디바이스로 토큰 데이터를 캡처하기 위한 시스템 및 방법 |
US9349063B2 (en) | 2010-10-22 | 2016-05-24 | Qualcomm Incorporated | System and method for capturing token data with a portable computing device |
JP2012252449A (ja) * | 2011-06-01 | 2012-12-20 | Nec Corp | 名刺管理装置及び方法 |
KR101499379B1 (ko) * | 2011-06-29 | 2015-03-05 | 퀄컴 인코포레이티드 | 객체에서 텍스트 정보를 인식하기 위한 시스템 및 방법 |
US9418304B2 (en) | 2011-06-29 | 2016-08-16 | Qualcomm Incorporated | System and method for recognizing text information in object |
JP2019149073A (ja) * | 2018-02-28 | 2019-09-05 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置 |
US11403798B2 (en) | 2018-09-06 | 2022-08-02 | Fujifilm Corporation | Image processing apparatus, method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4926004B2 (ja) | 文書処理装置、文書処理方法及び文書処理プログラム | |
JP4829920B2 (ja) | フォーム自動埋込方法及び装置、グラフィカルユーザインターフェース装置 | |
JP5623079B2 (ja) | ハード・コピーの書式からの書式定義の自動発生 | |
US7783472B2 (en) | Document translation method and document translation device | |
US8213717B2 (en) | Document processing apparatus, document processing method, recording medium and data signal | |
JP4854491B2 (ja) | 画像処理装置及びその制御方法 | |
US7840092B2 (en) | Medium processing method, copying apparatus, and data filing apparatus | |
JP5938393B2 (ja) | 画像処理装置 | |
JP5661549B2 (ja) | 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム | |
JP2008282094A (ja) | 文字認識処理装置 | |
JP4807618B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4935459B2 (ja) | 文字認識方法、文字認識プログラムおよび文字認識装置 | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
JP5483467B2 (ja) | 帳票読取装置、角印検出方法、および、角印検出プログラム | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
JP2022151533A (ja) | 読取システム、読取プログラムおよび読取方法 | |
JP2006053622A (ja) | 文書リンク情報取得システム | |
JP5724286B2 (ja) | 帳票作成装置、帳票作成方法、プログラム | |
JP2021152696A (ja) | 情報処理装置及びプログラム | |
JP5169648B2 (ja) | 原画像探索装置及び原画像探索プログラム | |
JPH10207981A (ja) | 帳票認識方法 | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2005208934A (ja) | 文書配信処理装置及び文書配信処理プログラム | |
JP4280939B2 (ja) | 位置面システム画像認識コンピューターソフトウェア | |
US10659654B2 (en) | Information processing apparatus for generating an image surrounded by a marking on a document, and non-transitory computer readable recording medium that records an information processing program for generating an image surrounded by a marking on a document |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100201 |