JP2005044132A - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP2005044132A
JP2005044132A JP2003277659A JP2003277659A JP2005044132A JP 2005044132 A JP2005044132 A JP 2005044132A JP 2003277659 A JP2003277659 A JP 2003277659A JP 2003277659 A JP2003277659 A JP 2003277659A JP 2005044132 A JP2005044132 A JP 2005044132A
Authority
JP
Japan
Prior art keywords
character
image data
characters
image
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003277659A
Other languages
English (en)
Inventor
Kenji Dokuni
賢治 堂国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Murata Machinery Ltd
Original Assignee
Murata Machinery Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Murata Machinery Ltd filed Critical Murata Machinery Ltd
Priority to JP2003277659A priority Critical patent/JP2005044132A/ja
Publication of JP2005044132A publication Critical patent/JP2005044132A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

【課題】画像に含まれる文字を認識するためには、時間がかかった。
【解決手段】入力部102は、RGB形式の画像データを入力する。色空間変換部104は、RGB形式の画像データをLab形式の色空間の画像データに変換する。認識部106は、明度成分Lについて文字認識を行う。文字形態検出部108は、認識した文字の色を検出する。出力部110は、文字と文字色とを対応付けて認識結果12を出力する。これにより、画像処理装置100は、比較的短期間でカラー画像に含まれる文字を認識することができる。
【選択図】図1

Description

この発明は画像処理技術に関し、とくに画像に含まれる文字を認識する文字認識装置に関する。
近年、通信技術が進歩し、コンピュータ、ファクシミリ装置、スキャナ装置、MFP(Multi Functional Peripheral)などの機器がネットワークに接続されるようになってきた。こうしたことから、例えば業務における書類等のデジタル化が進み、各種情報をデジタルデータとして取り扱うことが注目されるようになってきた。こうした中、手書き文字や印刷された文字を光学的に読み取り、テキストデータに変換する技術としてOCR(Optical Character Reader)がある。OCRは、例えば文字の印刷された紙面をスキャナで読み取り、読み取った画像データに画像処理を施すことにより紙面に印字された文字をテキストデータに変換する技術である。こうした技術は、紙面に白黒2値で記載された文字を読み取ることを主として発達してきたが、近年ではカラープリンタなどの普及にともない、カラーで手書きもしくは印刷された文字を認識する必要性も高まってきた。そうしたカラー画像に含まれる文字をテキストデータに変換する技術がある(例えば、特許文献1参照。)。
特開平8−123901号公報
特許文献1に開示された技術において、カラー画像に含まれる文字を認識する場合、赤(R)、緑(G)、青(B)のそれぞれの色成分毎に、色範囲を設定して文字認識を行う。このため、文字の認識処理に時間がかかった。また色範囲を適切に設定しないと、文字の認識精度が著しく低下してしまう。
本発明はこうした点に鑑みてなされたもので、その目的は、比較的短時間で画像中の文字を認識し、テキストデータに変換する技術の提供にある。
本発明のある態様は、画像処理装置である。この装置は、画像データの入力を受け付ける手段と、画像データに含まれる色情報を明度成分と色成分とを含む色空間に変換する手段と、明度成分に基づいて、画像データに基づいて形成される画像に含まれる文字を認識する手段とを備える。これにより、明度成分について文字認識を行えばよいので、短時間で画像中の文字を認識することができる。
本発明の別の態様も、画像処理装置である。この装置は、画像データの入力を受け付ける手段と、画像データに含まれる色情報を輝度成分と色成分とを含む色空間に変換する手段と、輝度成分に基づいて、画像データに基づいて形成される画像に含まれる文字を認識する手段とを備える。これにより、輝度成分について文字認識を行えばよいので、短時間で画像中の文字を認識することができる。
本発明の更に別の態様も、画像処理装置である。この装置は、所定の画像データの入力を受け付ける手段と、画像データに基づいて形成される画像に含まれる文字を認識する手段と、認識した文字の形態を検出する手段と、認識した文字とその文字の形態を特定する情報とを関連付けて所定の文書記述言語に準じた形式で出力する手段とを備える。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、画像中に含まれる文字を、明度成分または輝度成分に基づいて認識してテキストデータに変換できる。これにより、比較的短時間で文字認識処理を行うことができる画像処理装置を提供できる。
図1は、実施の形態に係る画像処理装置100とスキャナ装置20とを示す図である。画像処理装置100の各構成要素は、ハードウエアコンポーネントで言えば、任意のコンピュータのCPU、メモリ、メモリにロードされた本図の構成要素を実現するプログラム、そのプログラムを格納するROM、RAM、ハードディスクなどの記憶ユニット、ネットワーク接続用インターフェース等を中心に実現されるが、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。これから説明する各図は、ハードウエア単位の構成ではなく、機能単位のブロックを示している。
文書10は、例えば色の付いた文字が記載された用紙である。スキャナ装置20は、文書10を読み込んで、赤、緑、青の3つの成分からなる色空間を利用して各画素の色を表現するRGB形式の画像データを画像処理装置100に出力する。画像処理装置100は、スキャナ装置20から画像データを受け付け、明度成分または輝度成分を含む他の色空間に変換する。そして、画像処理装置100は、明度成分または輝度成分に基づいて、文字認識を行い、認識結果12としてテキストデータを出力する。
画像処理装置100は、RGB形式の画像データの入力を受け付ける入力部102、画像データの色空間を変換する色空間変換部104、明度成分または輝度成分に基づいて文字認識を行う認識部106、検出した文字の形態を検出する文字形態検出部108、および認識結果を出力する出力部110を有する。
入力部102は、スキャナ装置20からRGB形式の画像データの入力を受け付ける。また、他の例では、入力部102は、フレキシブルディスク、メモリカードなどの任意の記憶媒体や、ネットワークを介して画像データの入力を受け付けてもよい。入力部102は、受け付けた画像データを色空間変換部104に出力する。色空間変換部104は、RGB形式の画像データをLabやYCrCbなどの明度成分(L)や輝度成分(Y)を含むいずれかの色空間に変換する。以下、RGB形式の画像データをLab形式に変換した場合を例に、後段の処理を説明する。
認識部106は、明度成分Lに基づいて、画像データに含まれる文字を認識する。ここでLabにおける明度成分Lは、人の目の視認特性に応じて経験的に定義されている。このため、明度成分Lについて、例えばパターンマッチングなどの既知の文字認識処理を行うことで、認識部106は、人が視認できる文字を容易に認識することができる。また、人が視認し難い例えば明るい黄色などで記載された文字は、明度成分Lについて文字認識を行っても認識することが難しい。そこで、認識部106は、黄色の補色にあたるRGB形式の青成分Bについて、更に文字認識処理を施してもよい。このように、明度成分Lと青成分Bについて文字認識処理を行うことにより、画像データに含まれる文字を適切に認識できる。明度成分Lについて、文字認識処理を行うことにより、従来、赤成分R、緑成分G、青成分Bのそれぞれについて文字認識を行い、3ステップで行っていた処理を、明度成分Lのみの1ステップ、もしくは明度成分Lおよび青成分Bの2ステップで行うことができる。
認識部106は、認識した文字の位置情報を文字形態検出部108に出力する。例えば、認識部106は位置情報として、認識した文字を形成する画素を特定する情報を文字形態検出部108に出力する。文字形態検出部108は、認識部106から供給された位置情報で特定される文字の例えば色、フォント、大きさ等の文字形態を検出する。例えば、文字色を検出する場合、文字形態検出部108は認識部106から供給された位置情報で特定される画素のRGB値を、色空間変換部104から供給されるRGB形式の画像データから色情報として取得する。また、フォントや大きさ等形状を検出する場合、文字形態検出部108は、認識部106から認識した文字の外形を受け取り、例えばパターンマッチングなど既知の手法によりフォントや大きさを特定してもよい。
そして、文字形態検出部108は、検出した文字形態を示す情報を出力部110に出力する。出力部110は、認識部106から供給された文字と、文字形態検出部108から供給された文字形態とを対応付けてテキスト形式の認識結果12を出力する。出力部110は、例えばHTMLなどの文書記述言語に準じた形式で認識結果12を生成してもよい。HTML形式で認識結果12を生成する場合、出力部110は、文字の色やフォント等の形態を指定するためのフォントタグ16を、認識した文字に対応付ける。例えば、文書10に第1文字列12aとして青色で「あいう」と記載され、第2文字列12bとして赤色で「ABC」と記載されている場合、認識結果12の「あいう」には青色であることを示すフォントタグ16aが対応付けられ、「ABC」には赤色であることを示すフォントタグ16bが対応付けられる。また、他の例では、出力部110は、文字形態を対応付けずに、単に認識した文字をテキストデータとして出力してもよい。
図2は、図1の画像処理装置100における処理のフローチャートの一例である。まず、図1の入力部102は、画像データの入力を受け付ける(S10)。そして、図1の色空間変換部104は、画像データの色空間をLab形式に変換する(S12)。図1の認識部106は、明度成分Lについて文字認識を行い(S14)、認識した文字の位置情報を図1の文字形態検出部108に出力する。文字形態検出部108は、位置情報で特定される位置における文字の形態を検出する(S16)。図1の出力部110は、認識した文字と、文字の形態とを関連付け(S18)、テキストデータとして出力する(S20)。
このように明度成分Lに基づいて、画像データに基づいて形成される画像に含まれる文字を認識することにより、利用者の視認特性に基づいて認識しやすい色で記載された文字を優先的に文字認識できる。また、明度成分Lや輝度成分Yに基づいて文字を認識した場合、黄色の文字を認識しにくくなる。そこで、黄色を多く吸収する青成分Bについて、更に文字認識を行ってもよい。これにより、明度成分Lや輝度成分Yで認識しにくい色で記載された文字の認識もできる。
以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
そうした変形例として、図1の画像処理装置100を、手書きで作成した文書10を自動的にHTMLに変換する変換装置として利用してもよい。変換装置として利用する場合、認識部106では、前述した文字認識の手法だけでなく、従来のRGBそれぞれの成分で文字認識する手法やその他任意の文字認識手法を利用してもよい。このような変換装置により、手書きでホームページのイメージを記載し、この変換装置で読み込むことにより、自動的にHTMLに変換することができる。これにより、例えば文字入力の苦手な利用者もホームページを容易に作成することができる。
実施の形態に係る画像処理装置とスキャナ装置とを示す図である。 図1の画像処理装置における処理のフローチャートの一例である。
符号の説明
10 文書、12 認識結果、20 スキャナ装置、100 画像処理装置、102 入力部、104 色空間変換部、106 認識部、108 文字形態検出部、110 出力部。

Claims (3)

  1. 画像データの入力を受け付ける手段と、
    前記画像データに含まれる色情報を明度成分と色成分とを含む色空間に変換する手段と、
    前記明度成分に基づいて、前記画像データに基づいて形成される画像に含まれる文字を認識する手段と、
    を備えることを特徴とする画像処理装置。
  2. 画像データの入力を受け付ける手段と、
    前記画像データに含まれる色情報を輝度成分と色成分とを含む色空間に変換する手段と、
    前記輝度成分に基づいて、前記画像データに基づいて形成される画像に含まれる文字を認識する手段と、
    を備えることを特徴とする画像処理装置。
  3. 所定の画像データの入力を受け付ける手段と、
    前記画像データに基づいて形成される画像に含まれる文字を認識する手段と、
    認識した文字の形態を検出する手段と、
    認識した文字とその文字の形態を特定する情報とを関連付けて出力する手段と、
    を備えることを特徴とする画像処理装置。
JP2003277659A 2003-07-22 2003-07-22 画像処理装置 Pending JP2005044132A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003277659A JP2005044132A (ja) 2003-07-22 2003-07-22 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003277659A JP2005044132A (ja) 2003-07-22 2003-07-22 画像処理装置

Publications (1)

Publication Number Publication Date
JP2005044132A true JP2005044132A (ja) 2005-02-17

Family

ID=34264320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003277659A Pending JP2005044132A (ja) 2003-07-22 2003-07-22 画像処理装置

Country Status (1)

Country Link
JP (1) JP2005044132A (ja)

Similar Documents

Publication Publication Date Title
US8610929B2 (en) Image processing apparatus, control method therefor, and program
JP5972578B2 (ja) 画像処理装置、画像形成装置、プログラム、記録媒体
US9454696B2 (en) Dynamically generating table of contents for printable or scanned content
JP7387339B2 (ja) 画像処理システム、画像処理方法、及びプログラム
US10373030B2 (en) Image processing apparatus that executes halftone process on target image data including edge pixel
WO2014045788A1 (ja) 画像処理装置、画像形成装置、および記録媒体
JP4582204B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP2007004621A (ja) 文書管理支援装置、文書管理支援方法およびプログラム
JP2008154106A (ja) 秘匿処理方法,画像処理装置および画像形成装置
JP4582200B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
US8830487B2 (en) System and method for separating image and text in a document
JP4905275B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US10887491B2 (en) Image processing apparatus for processing of highlighted regions
JP6540597B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
US20110157659A1 (en) Information processing apparatus, method for controlling the information processing apparatus, and storage medium
US20100245862A1 (en) Image-processing device, image-forming device, image-processing method, and computer readable medium
JP2005044132A (ja) 画像処理装置
JP2012049860A (ja) 画像処理装置、画像処理方法およびプログラム
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
US8390907B2 (en) Image-processing device, image-forming device, image-processing method, and computer readable medium
JP2008193234A (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP2000316082A (ja) 画像抽出装置および該装置を備える画像処理装置並びにファイリング装置
US8300271B2 (en) Image process system, image process method and image process program
JP2005108124A (ja) 画像処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070328

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070522