JP4818091B2 - 情報処理装置、画像処理装置、情報処理装置の制御方法及び画像処理装置の制御方法 - Google Patents

情報処理装置、画像処理装置、情報処理装置の制御方法及び画像処理装置の制御方法 Download PDF

Info

Publication number
JP4818091B2
JP4818091B2 JP2006336385A JP2006336385A JP4818091B2 JP 4818091 B2 JP4818091 B2 JP 4818091B2 JP 2006336385 A JP2006336385 A JP 2006336385A JP 2006336385 A JP2006336385 A JP 2006336385A JP 4818091 B2 JP4818091 B2 JP 4818091B2
Authority
JP
Japan
Prior art keywords
character
image
pattern
mask pattern
temporary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006336385A
Other languages
English (en)
Other versions
JP2008146608A (ja
JP2008146608A5 (ja
Inventor
玲 呂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006336385A priority Critical patent/JP4818091B2/ja
Priority to CN200710194875XA priority patent/CN101201936B/zh
Priority to KR1020070130168A priority patent/KR100905857B1/ko
Publication of JP2008146608A publication Critical patent/JP2008146608A/ja
Publication of JP2008146608A5 publication Critical patent/JP2008146608A5/ja
Application granted granted Critical
Publication of JP4818091B2 publication Critical patent/JP4818091B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/88Image or video recognition using optical means, e.g. reference filters, holographic masks, frequency domain filters or spatial domain filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Input (AREA)

Description

本発明は、電子文書に透かし情報を埋め込む技術に関するものである。
光学式文字認識装置(OCR)では、光学的に読み取った文書画像から文字単位で文字切り出しを行い、切り出された文字毎に文字認識が行われる。しかし、文字切り出し処理は、文字を文字単位で正確に認識することが難しく、これまでに様々な方法が提案されている。
例えば、特許文献1では、入力する文書画像において、文書画像中の文字を順番に1文字ずつ切り出し、特徴抽出及び類似度演算を行い、類似度が低い文字画像の文字切り出しを変更し、特徴抽出及び類似度演算を繰り返す技術が開示されている(図15)。
また、特許文献2では、読み取り文字列から文字を切り出し、各切り出し文字の横幅dxと縦幅dyとの比率に基づいて、各切り出し文字に2文字以上が含まれているか否かを判断する技術が開示されている(図16)。
特開平5−128299号公報 特開平9−237316号公報
特許文献1で開示されている技術は、文字切り出しに起因する誤認識を低減できる点で望ましい。
また、特許文献2で開示されている技術は、各切り出し文字に2文字以上が含まれていると判断され、かつ、当該切り出し文字の認識ができなかった場合には、少なくとも2文字分の文字認識結果が訂正記号及びスペースによって、表示部の画面に表示される。このため、文字認識結果の訂正に要する時間を短縮できる点で望ましい。
しかしながら、特許文献1では、文書画像中の文字を順番に1文字ずつ類似度計算を繰り返すため、処理時間が無用に掛かってしまうという問題がある。
また、特許文献2では、半角文字と全角文字とが混在する際の文字切り出しが困難である(図17)。また、扁と旁で構成されるような文字が、2つの文字に切り出されてしまう場合がある。
そこで、本発明の目的は、文書画像を生成する際には、文字の切り出しが正しく行われやすくする文書画像を生成することにある。また、文字認識等の後処理を行う場合には、文字切り出しが正常に行われやすくすることにある。
本発明によれば、文字コードで構成される文章情報に基づいて、文書画像データを生成する情報処理装置であって、互いに異なる複数のマスクパターンを記憶する記憶手段と、章情報を入力する入力手段と、該入力手段によって入力された前記文章情報の中の文章を構成する文字コードに基づいて、対応する文字パターンを生成する文字パターン生成手段と、該文字パターン生成手段で注目文字コードに対応する文字パターンを生成する場合、前記注目文字コードの1つ前の文字コードで選択したマスクパターンとは異なるマスクパターンを前記記憶手段から選択する選択手段と、前記注目文字コードに対応する文字パターンと、前記選択手段で選択されたマスクパターンとを合成し、合成後の文字パターンをページ画像の一部として出力する合成手段と、を備えることを特徴とする情報処理装置が提供される。
また、本発明によれば、互いに異なる複数のマスクパターンを記憶する記憶手段を備え、文字コードで構成される文章情報に基づき、文書画像データを生成する情報処理装置の制御方法であって、入力手段が文章情報を入力する入力工程と、該入力工程によって前記文章情報の中の文章を構成する文字コードに基づいて、文字パターン生成手段が対応する文字パターンを生成する文字パターン生成工程と、該文字パターン生成工程で注目文字コードに対応する文字パターンを生成する場合、選択手段が前記注目文字コードの1つ前の文字コードで選択したマスクパターンとは異なるマスクパターンを前記記憶手段から選択する選択工程と、合成手段が、前記注目文字コードに対応する文字パターンと、前記選択手段で選択されたマスクパターンとを合成し、合成後の文字パターンをページ画像の一部として出力する合成工程と、を備えることを特徴とする情報処理装置の制御方法が提供される。
以上述べた通り、本発明によれば、文書画像を生成する際には、文字の切り出しが正しく行われやすくする文書画像を生成することができる。また、文字認識等の後処理を行う場合には、文字切り出しが正常に行われやすくすることができる。
以下、添付図面に従って、本発明に係る実施形態を詳細に説明する。
<第1の実施形態>
図1は、本発明の一実施形態に係るマスクパターン合成装置及び文字切り出し装置の電気的構成を示す図である。
コンピュータ101は、一般に普及しているパーソナルコンピュータ等の汎用の情報処理装置であり、スキャナ117から画像を読み取り、編集や保管を行うことが可能である。また、スキャナ117で読み取られた画像をプリンタ116から印刷させることができる。なお、ユーザからの各種指示等は、ポインティングデバイスであるマウス113、キーボード114、タッチパネル119からの入力操作により行われる。コンピュータ101の内部では、後述する各ブロックがバス107で接続され、種々のデータを授受することができる。
CPU102は、コンピュータ101内部の各ブロックの動作を制御し、あるいは内部に記憶されたコンピュータプログラムを実行することができる。
主記憶装置(RAMで構成される)103は、CPU102で行われる処理のために、一時的にコンピュータプログラムや処理対象の画像データを格納する装置である。
CPU102は、キーボード114等からの入力指示により主記憶装置103に記憶したコンピュータプログラムを実行することにより、マスクパターン合成装置又は文字切り出し装置として機能することになる。
ハードディスク(HDD)104は、主記憶装置103等に転送されるプログラムや画像データを格納したり、処理後の画像データを保存したりすることのできる装置である。
スキャナインタフェース(I/F)115は、スキャナ117と接続され、スキャナ117で読み取られた画像データを入力することができるI/Fである。
プリンタインタフェース108は、プリンタ116と接続され、印刷する画像データをプリンタ116に送信することができるI/Fである。
CDドライブ109は、外部記憶媒体の1つであるCD(CD−R/CD−RW)に記憶されたデータの読み込みや、書き出しをすることができる装置である。
DVDドライブ110は、外部記憶媒体の1つであるDVDに記憶されたデータの読み込みや、書き出しをすることができる装置である。
FDDドライブ111は、外部記憶媒体の1つであるFDDに記憶されたデータの読み込みや、書き出しをすることができる装置である。
なお、CD、DVD、FDD等に画像編集用のプログラム又はプリンタドライバが記憶されている場合には、このプログラムをハードディスク104にインストールし、必要に応じて主記憶装置103に転送されるようになっている。
インタフェース(I/F)112は、マウス113及びキーボード114からの入力指示を受けるために接続されるI/Fである。
インタフェース(I/F)118は、タッチパネル119からの入力指示を受けるために接続されるI/Fである。
モニタ106は、マスクパターンの抽出処理結果や処理過程を表示することができる表示装置である。
ビデオコントローラ105は、表示データをモニタ106に送信するための装置である。
図2は、本発明の一実施形態に係るマスクパターン合成装置の構成を示す図であり、図3は、本発明の一実施形態に係るマスクパターン合成装置の動作手順を示すフローチャートである。
文章情報200は、文字コード(例えばアスキーコード)で構成され、文章情報入力部201から入力される(ステップS300)。文章情報入力部201は、キーボード114とするが、コンピュータ可読記憶媒体に記憶されたデータファイルを使用してもよい。
なお、文章情報200は、アプリケーションプログラム固有の形式、テキスト形式等の電子データでもよい。また、文書編集アプリケーションプログラムを利用して作成された電子データであってもよい。また、文章情報200は、ハードディスク104やCDドライブ109、DVDドライブ110、FDDドライブ111等に接続された各コンピュータ可読記憶媒体に格納されたものであってもよい。
次に、文字パターン生成部202において、文章情報入力部201によって入力された文章情報200の中の文章を構成する文字コードの順番に、該文字コードを読取り、対応する文字パターンを生成する(ステップS301)。
マスクパターン記憶部203は、2つの互いに異なるマスクパターンを記憶している。本実施形態では、例えば、「0」と「1」が記憶されている。次に、マスクパターン選択部204において、この2つのマスクパターンの中から従前に選択したマスクパターンとは異なるマスクパターンを交互に選択する(ステップS302)。本実施形態の場合、マスクパターン記憶部203には、2つのマスクパターンが記憶されているため、マスクパターン選択部204では、1文字分の文字パターンが生成される度に、2つのマスクパターンの一方を交互に選択する。
次に、合成部205において、注目文字コードに対応する文字パターンと、マスクパターン選択部204で選択されたマスクパターンとを合成する(ステップS30)。文字パターンはステップS301で生成されたものであり、マスクパターンはステップS302でマスクパターン記憶部203から選択したものである。なお、文字パターンとマスクパターンとの合成方法については後述する。
次に、文字パターンとマスクパターンとが合成された文字が文字パターンの最終文字であるか否かが判断される(ステップS304)。その結果、最終文字でないと判断された場合は、ステップS301に戻り、同様の処理を繰り返す。一方、最終文字であると判断された場合は、合成後の文字パターンがページ画像206の一部として、プリンタ116から出力される(ステップS305)。
なお、本実施形態では、出力手段はプリンタ116を使用するが、ハードディスク104に画像データとして記憶してもよい。また、ネットワークで他の端末に送信するような構成としてもよい。
係る構成により、文字コードで構成される文章情報に基づき、文書画像データを生成する。
図4は、本発明の一実施形態に係るマスクパターン合成装置で文字パターンとマスクパターンとを合成する方法を説明する図である。
文字401はマスクパターンが合成されていない文字「イ」である。この文字401をそれぞれ異なるドットパターンで形成することで、それぞれ異なるマスクパターンを有する文字402、403を得る。パターン0(404)、パターン1(405)で示されるドットパターンでそれぞれ異なる情報を有する文字402、403となる。
次に、情報処理装置が出力したページ画像206から、文字画像単位の後処理のために各文字画像を切り出す処理について説明する。
図5は、本発明の一実施形態に係る文字切り出し装置の構成を示す図であり、図6は、本発明の一実施形態に係る文字切り出し装置の動作手順を示すフローチャートである。
まず、ページ画像入力部501からマスクパターンが合成されたページ画像206が入力される(ステップS600)。
次に、ヒストグラム作成部502において、入力したページ画像206を、垂直、水平方向に射影し、有意画素の分布を示すヒストグラムを作成する(ステップS601)。
次に、マスクパターン仮抽出部503において、ヒストグラム作成部502で作成されたヒストグラムに基づき、有意画素の領域を仮文字画像領域として抽出する(ステップS602)。
次に、マスクパターン判別部504において、マスクパターン仮抽出部503で抽出した仮文字画像が、マスクパターン記憶部505に記憶されたいずれのマスクパターンと合成されたかを判別する(ステップS603)。
次に、マスクパターン判定部506において、マスクパターン判別部504によって判別された注目仮文字画像のマスクパターンの種類と、直前位置の仮文字画像に合成されたマスクパターンの種類が同じであるか否かを判定する(ステップS604)。
次に、マスクパターン判定部506によりマスクパターンの種類が同じであると判定した場合には、マスクパターン制御部507において、注目仮文字画像と直前位置にある仮文字画像を含む領域の画像を新たな仮文字画像として更新する(ステップS605)。その後、後処理に出力する(ステップS606)。一方、マスクパターン判定部506により、マスクパターンの種類が異なると判定した場合には、注目仮文字画像の直前位置における仮文字画像が正規の文字画像の切り出し画像として後処理に出力する(ステップS606)。
なお、ページ画像206は、印刷物をスキャナ117から入力し、それをビットマップ化したものでも良い。また、文書編集アプリケーションプログラムを使用して作成された電子データであってもよい。さらに、ハードディスク104、CDドライブ109、DVDドライブ110、FDDドライブ111等に接続された各コンピュータ可読記憶媒体に格納されたアプリケーションプログラム固有の形式であってもよい。さらに、テキスト形式等の電子データを画像処理ソフト等によって変換し、ビットマップ化したものでもよい。
図7は、本発明の一実施形態に係る文字切り出し処理を具体的に説明するための図である。
まず、図7(a)で示す入力画像文字「大石静」から射影をとる方法で文字切り出しを行う。その結果、図7(b)で示す「大石青争」という4つの仮文字画像が得られる。
次に、この4つの仮文字画像から、図7(c)で示すマスクパターン「0100」を抽出する。入力画像文字には、交互に「0」と「1」が合成されているため、注目仮文字画像と直前位置の仮文字画像のマスクパターンの種類が同じである場合には、文字切り出しの誤りであることがわかる。従って、その場合には、注目仮文字画像と直前位置にある仮文字画像を含む領域の画像を新たな仮文字画像として更新する。
図7(c)で示すように、3番目「0」と4番目「0」が同じ種類のマスクパターンであるため、両者を合併して訂正する。係る手順で文字切り出しを訂正すると、文字切り出しは図7(d)に示す状態「大石静」となる。
これにより、マスクパターンを利用することで、文字切り出しの誤りを訂正することができる。
〈変形例1〉
第1の実施形態の変形例1として、文字切り出しに誤りが発生しやすい文字パターンのみにマスクパターンを合成するように、さらに工夫を加えた。
図8は、本発明の一実施形態に係るマスクパターン合成装置の動作手順を示すフローチャートである。
なお、装置は第1の実施形態と同様であるため、説明を省略する。また、本変形例の処理で前述の第1の実施形態との共通部分については共通のステップの参照番号を付して説明を省略する。
まず、文字パターン生成部202において、入力された文字コードに対応する文字パターンが生成される(ステップS301)。ここまでの処理は、第1の実施形態と相違がない。
次に、注目文字パターンが、独立した有意画素の分布領域を2以上で構成されるか否かを判断する(ステップS801)。本実施形態では、注目文字パターンを構成する有意画素の水平、垂直方向の射影ヒストグラムを作成し、当該ヒストグラムに基づいて、独立した有意画素の分布領域が2以上あるか否かを判断する。
この結果、注目文字パターンが、独立した有意画素の分布領域を2以上で構成されると判断した場合、従前に選択したマスクパターンとは異なるマスクパターンをマスクパターン記憶部から選択する(ステップS302)。その後、選択されたマスクパターンと文字パターンとを合成し(ステップS303)、次の処理に進む。
一方、注目文字パターンが、独立した有意画素の分布領域を2以上で構成されていないと判断した場合には、ステップS302、ステップS303の処理を省略し、次の処理に進む。これにより、注目文字パターンが、独立した有意画素の分布領域を2以上で構成される文字パターンにのみマスクパターンが合成されたページ画像が生成される。
なお、文字切り出しを訂正する時は、同じマスクパターンが抽出された、それぞれの独立した有意画素の分布領域を合併すればよい。
これらの処理について、図9に示す文章情報が入力された場合を想定して具体的に説明する。
図9は、本発明の一実施形態に係る文字切り出し処理を具体的に説明する図である。
図9(a)で示す「ラリルレロ」が文章情報として入力されたことを想定する。図9(b)は、「リ」と「ル」にそれぞれ異なるマスクパターン「1」「0」が合成されていることを示す。その他の文字には、マスクパターンは合成されていないため、「_」で表示している。全体としては、「_10__」の状態でマスクパターンが合成されている。
この方法でマスクパターンが合成された文字列の文字切り出しを行うと、図9(c)で示すように、7つのブロックに分けられる。次に、図9(d)は、7つのブロックからマスクパターン「_1100__」を抽出する。隣同士の文字ブロックから同じマスクパターン(「1」と「1」、「0」と「0」)が抽出されたので、それぞれを合併する。その結果、マスクパターンは、「_10__」となるため、図9(e)で示すように、「ラリルレロ」と文字切り出しを訂正することができる。
これにより、変形例1では一部の文字パターンのみにマスクパターンを合成するので、文字画質を保つことができると共に、ページ画像生成及び文字切り出し訂正の処理が高速にできる。
〈変形例2〉
第1の実施形態の変形例2として、文字切り誤りが発生しやすい文字の選定を高速に行うことができるように工夫を加えた。
図10は、本発明の一実施形態に係るマスクパターン合成装置の動作手順を示すフローチャートである。
なお、装置は第1の実施形態と同様であるため、説明を省略する。また、本変形例の処理で第1の実施形態との共通部分については共通のステップの参照番号を付して説明を省略する。
本変形例では、有意画素の独立した分布領域を2以上有する文字を示す文字コードを示す辞書情報を記憶する辞書記憶部を有する。
文字パターン生成部202において、入力された文字コードに対応する文字パターンが生成される(ステップS301)。ここまでの処理は、実施形態1と相違がない。
入力された文字コードが辞書記憶部に登録されているか否かを検出する(ステップS1001)。
入力された文字コードが辞書記憶部に登録されている場合、その文字パターンに合成するためのマスクパターンを選択する(ステップS302)。
次に、選択されたマスクパターンを文字パターンに合成し(ステップS303)、次の処理に進む。
一方、入力された文字コードが辞書記憶部に登録されていない場合、ステップS302及びステップS303の処理を省略し、次の処理に進む。
変形例2は、有意画素の独立した分布領域を2以上有する文字のみにマスクパターンを合成する点で共通するが、辞書記憶部に登録されている辞書データを使用するため、処理を高速に行うことができる。
<第2の実施形態>
本実施形態では、符号の認識を正確に行うため、さらに工夫を加えた。
図11は、本発明の一実施形態に係るマスクパターン合成装置の動作手順を示すフローチャートである。
なお、装置は第1の実施形態と同様であるため、説明を省略する。また、本実施形態の処理で第1の実施形態の変形例2との共通部分については共通のステップの参照番号を付して説明を省略する。
文字パターン生成部202において、入力された文字コードに対応する文字パターンが生成される(ステップS301)。ここまでの処理は、第1の実施形態と相違がない。
次に、前述の変形例2では、入力された文字コードが、辞書記憶部に登録されているか否かが判断された(ステップS1001)。しかし、本実施形態では、ステップS1001の直前に注目文字パターンの直後の文字が符号であるか否かを判断する(ステップS1101)。
その結果、符号である場合、ステップS1001の処理を省略し、マスクパターン記憶部203から特定マスクパターンが選択される(ステップS302)。例えば、前述のマスクパターン「0」及び「1」と異なる「2」が選択される。なお、マスクパターンの合成方法として、1つの文字に2ビット以上を合成することができる方法を使う。次の文字が符号でない場合、第1の実施形態の変形例2と同様の処理を行う。
図12は、本発明の一実施形態に係る文字切り出し装置の構成を示す図である。
なお、第1の実施形態と同様である構成に関しては、同様の符号を付し、説明を省略する。
まず、マスクパターン判別部504において、マスクパターン記憶部505に記憶されているどのマスクパターンが注目文字画像から抽出されたかを識別する。ここまでの処理は、第1実施形態と共通である。
特定マスクパターンが合成されていると判別した場合には、符号認識部1201において、注目文字画像の直後が符号であると認識し、新たな文字画像として更新を行う。その後の処理は、第1実施形態と同様である。
文字切り出し処理の流れは第1の実施形態の変形例2と共通するが、ステップS604の処理に追加がある。
図13は、本発明の一実施形態に係るステップS604の詳細な動作手順を示すフローチャートである。
まず、マスクパターン判別部504において、抽出したマスクパターンが特定マスクパターンであるか否かが判断される(ステップS604a)。例えば、前述のマスクパターン「0」「1」と異なる「2」を特定マスクパターンとすることができる。
ステップS604aにおいて、特定マスクパターンと判断された場合、次の文字の文字認識を行う(ステップS604b)。次に、符号認識部1201において、文字認識された文字が符号であるか否かが判断される(ステップS604c)。文字認識された文字が符号である場合、正確な文字切り出しが完了したと判断し、処理を終了する。符号でない場合、第1の実施形態の変形例2と同様に文字切り出しの誤り箇所指定が行われる(ステップS604f)。
一方、特定マスクパターンではないと判断された場合、注目文字画像の次の文字からマスクパターンを抽出し(ステップS604d)、該マスクパターンと注目文字画像から抽出したマスクパターンとを比較する(ステップS604e)。これらのマスクパターンが異なる場合、処理を終了する。同じである場合には、文字切り出しの誤り箇所指定を行い(ステップS604f)、処理を終了する。
このような処理について、ある文字画像が入力された場合を想定して、具体的に説明する。
図14は、本発明の一実施形態に係る文字切り出し処理を具体的に説明するための図である。
まず、(a)で示すように、「する。次に」という文字パターンが生成される。
次に、(b)で示すように、「_2_01」というマスクパターンが文字パターンに埋め込まれる。その結果、(c)で示すように、文字切り出しが行われる。
また、(d)は各有意画素から抽出されたマスクパターン「_201」を示す。このマスクパターンには、2文字目に特定マスクパターンである「2」が含まれているため、符号が含まれていると判断し、文字と符号とを分離する処理を行う。
その結果、(e)で示すように、「る」と「。」が2つの文字ブロックに分離される。 本実施形態では、記号前の文字に特定マスクパターン(例えば「2」)を埋め込み、文字と記号を分離する方法を示した。この方法と同様にして、注目文字画像の周辺部に文字以外の画像を有している場合、該注目文字画像に特定マスクパターンを合成する。例えば、表の線等が注目文字画像の周辺部に配されている場合には、該文字画像に特定マスクパターン(例えば「3」)を合成することで、文字と表の線等とを分離することができる。
これにより、表の中の文字や記号の切り出しを正確に行うことができる。
<その他の実施形態>
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェース機器、リーダ、プリンタ等)から構成されるシステムに適用しても、1つの機器からなる装置(例えば、複写機、ファクシミリ装置等)に適用してもよい。
また、前述した実施形態の機能を実現するコンピュータプログラムを記憶した記憶媒体を装置に供給し、該装置のコンピュータ(又はCPU、MPU)がコンピュータ可読記憶媒体に格納されたコンピュータプログラムを実行することによって達成される。
この場合、コンピュータ可読記憶媒体から読み出されたコンピュータプログラム自体が前述した実施形態の機能を実現するため、そのコンピュータプログラムを記憶したコンピュータ可読記憶媒体は本発明を構成する。
また、コンピュータが読込んだコンピュータプログラムに基づいて、コンピュータ上で稼働するオペレーティングシステム(OS)等が実際の処理を行うため、その処理によって前述した実施形態の機能が実現される場合も含まれる。
さらに、コンピュータ可読記憶媒体に格納されたコンピュータプログラムが、コンピュータに接続された機能拡張カード又は機能拡張ユニットに備わるメモリに書き込まれた後、コンピュータプログラムの指示に基づき、CPU等が実際の処理を行う場合がある。係る場合も前述した実施形態の機能を実現することができるため、本発明に含まれることは言うまでもない。
本発明をコンピュータ可読記憶媒体に適用する場合、そのコンピュータ可読記憶媒体には、前述したフローチャートに対応するコンピュータプログラムが格納される。
本発明の一実施形態に係るマスクパターン合成装置及び文字切り出し装置の電気的構成を示す図である。 本発明の一実施形態に係るマスクパターン合成装置の構成を示す図である。 本発明の一実施形態に係るマスクパターン合成装置の動作手順を示すフローチャートである。 本発明の一実施形態に係るマスクパターン合成装置でマスクパターンを合成する方法を説明する図である。 本発明の一実施形態に係る文字切り出し装置の構成を示す図である。 本発明の一実施形態に係る文字切り出し装置の動作手順を示すフローチャートである。 本発明の一実施形態に係る文字切り出し処理を具体的に説明するための図である。 本発明の一実施形態に係るマスクパターン合成装置の動作手順を示すフローチャートである。 本発明の一実施形態に係る文字切り出し処理を具体的に説明するための図である。 本発明の一実施形態に係るマスクパターン合成装置の動作手順を示すフローチャートである。 本発明の一実施形態に係るマスクパターン合成装置の動作手順を示すフローチャートである。 本発明の一実施形態に係る文字切り出し装置の構成を示す図である。 本発明の一実施形態に係るステップS604の詳細な動作手順を示すフローチャートである。 本発明の一実施形態に係る文字切り出し処理を具体的に説明するための図である。 従来の文字切り出しの誤り訂正処理について説明するための図である。 従来の文字切り出しの誤り訂正処理について説明するための図である。 従来の文字切り出しの誤り訂正処理について説明するための図である。
符号の説明
200 文章情報
206 ページ画像

Claims (18)

  1. 文字コードで構成される文章情報に基づいて、文書画像データを生成する情報処理装置であって、
    互いに異なる複数のマスクパターンを記憶する記憶手段と、
    章情報を入力する入力手段と、
    該入力手段によって入力された前記文章情報の中の文章を構成する文字コードに基づいて、対応する文字パターンを生成する文字パターン生成手段と、
    該文字パターン生成手段で注目文字コードに対応する文字パターンを生成する場合、前記注目文字コードの1つ前の文字コードで選択したマスクパターンとは異なるマスクパターンを前記記憶手段から選択する選択手段と、
    前記注目文字コードに対応する文字パターンと、前記選択手段で選択されたマスクパターンとを合成し、合成後の文字パターンをページ画像の一部として出力する合成手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記記憶手段は、2つのマスクパターンを記憶し、
    前記選択手段は、1文字分の文字パターンが生成される度に、前記2つのマスクパターンの一方を交互に選択することを特徴とする請求項1に記載の情報処理装置。
  3. 前記記憶手段は、3つのマスクパターンを記憶し、
    前記選択手段は、1文字分の文字パターンが生成される度に、次の文字が符号でない場合には、前記3つのマスクパターンの内の第1マスクパターン又は第2マスクパターンからいずれか1つのマスクパターンを選択し、次の文字が符号である場合には、前記第1マスクパターン及び第2マスクパターンとは異なる第3マスクパターンを選択することを特徴とする請求項1に記載の情報処理装置。
  4. 前記合成手段は、印刷手段に出力することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 請求項1乃至4のいずれか1項に記載の情報処理装置が出力したページ画像から、文字画像単位の後処理のために各文字画像を切り出す画像処理装置であって、
    互いに異なる複数のマスクパターンを記憶する記憶手段と、
    ページ画像を入力する入力手段と、
    入力したページ画像を、垂直、水平方向に射影し、有意画素の分布を示すヒストグラムを作成する作成手段と、
    作成されたヒストグラムに基づき、有意画素の領域を仮文字画像領域として抽出する仮抽出手段と、
    該仮抽出手段で抽出した仮文字画像領域中の仮文字画像が、前記記憶手段に記憶されたいずれのマスクパターンと合成されたかを判別するマスクパターン判別手段と、
    該マスクパターン判別手段によって判別された注目仮文字画像のマスクパターンの種類と、直前位置の仮文字画像に合成されたマスクパターンの種類が同じであるか否かを判定する判定手段と、
    該判定手段により、注目仮文字画像と直前位置の仮文字画像のマスクパターンの種類が同じであると判定した場合には、注目仮文字画像と直前位置にある仮文字画像を含む領域の画像を新たな仮文字画像として更新し、
    前記判定手段により、注目仮文字画像と直前位置の仮文字画像のマスクパターンの種類が異なると判定した場合には、注目仮文字画像の直前位置における仮文字画像正規の文字画像の切り出し画像として後処理に出力する制御手段と、
    を備えることを特徴とする画像処理装置。
  6. 前記制御段は前記注目仮文字画像の直前位置における仮文字画像を文字認識手段に出力することを特徴とする請求項5に記載の画像処理装置。
  7. 互いに異なる複数のマスクパターンを記憶する記憶手段を備え、文字コードで構成される文章情報に基づき、文書画像データを生成する情報処理装置の制御方法であって、
    入力手段が文章情報を入力する入力工程と、
    該入力工程によって前記文章情報の中の文章を構成する文字コードに基づいて、文字パターン生成手段が対応する文字パターンを生成する文字パターン生成工程と、
    該文字パターン生成工程で注目文字コードに対応する文字パターンを生成する場合、選択手段が前記注目文字コードの1つ前の文字コードで選択したマスクパターンとは異なるマスクパターンを前記記憶手段から選択する選択工程と、
    合成手段が、前記注目文字コードに対応する文字パターンと、前記選択手段で選択されたマスクパターンとを合成し、合成後の文字パターンをページ画像の一部として出力する合成工程と、
    を備えることを特徴とする情報処理装置の制御方法。
  8. 互いに異なる複数のマスクパターンを記憶する記憶手段を備え、請求項1乃至4のいずれか1項に記載の情報処理装置が出力したページ画像から、文字画像単位の後処理のために各文字画像を切り出す画像処理装置の制御方法であって、
    入力手段がページ画像を入力する入力工程と、
    作成手段が、入力したページ画像を、垂直、水平方向に射影し、有意画素の分布を示すヒストグラムを作成する作成工程と、
    仮抽出手段が、作成されたヒストグラムに基づき、有意画素の領域を仮文字画像領域として抽出する仮抽出工程と、
    マスクパターン判別手段が、該仮抽出工程で抽出した仮文字画像が前記記憶手段に記憶されたいずれのマスクパターンと合成されたかを判別するマスクパターン判別工程と、
    判定手段が、該マスクパターン判別工程によって判別された注目仮文字画像のマスクパターンの種類と、直前位置の仮文字画像に合成されたマスクパターンの種類が同じであるか否かを判定する判定工程と、
    制御手段が、該判定工程により、注目仮文字画像と直前位置の仮文字画像のマスクパターンの種類が同じであると判定した場合には、注目仮文字画像と直前位置にある仮文字画像を含む領域の画像を新たな仮文字画像として更新し、
    前記判定工程により、注目仮文字画像と直前位置の仮文字画像のマスクパターンの種類が異なると判定した場合には、注目仮文字画像の直前位置における仮文字画像正規の文字画像の切り出し画像として後処理に出力する制御工程と、
    を備えることを特徴とする画像処理装置の制御方法。
  9. 文字コードで構成される文章情報に基づき、文書画像データを生成する情報処理装置であって、
    互いに異なる複数のマスクパターンを記憶する記憶手段と、
    文章情報を入力する入力手段と、
    該入力手段によって入力された前記文章情報の中の文章を構成する文字コードに基づいて、対応する文字パターンを生成する文字パターン生成手段と、
    注目文字パターンの独立した有意画素の分布領域が2以上で構成されるか否かを判断する判断手段と、
    該判断手段によって、注目文字パターンの独立した有意画素の分布領域が、1つで構成されると判断された場合には、注目文字パターンを、ページ画像の一部として出力する第1の出力手段と、
    前記判断手段によって、注目文字パターンの独立した有意画素の分布領域が、2以上で構成されると判断された場合には、前記注目文字パターンの1つ前の文字パターンで選択したマスクパターンとは異なるマスクパターンを前記記憶手段から選択する選択手段と、
    注目文字パターンと、前記選択手段で選択されたマスクパターンとを合成し、合成後の文字パターンをページ画像の一部として出力する第2の出力手段と、
    を備えることを特徴とする情報処理装置。
  10. 前記判断手段は、注目文字パターンを構成する有意画素の水平、又は、垂直方向の射影ヒストグラムを作成し、当該ヒストグラムに基づいて、独立した有意画素の分布領域が2以上あるか否かを判断することを特徴とする請求項に記載の情報処理装置。
  11. 更に、有意画素の独立した分布領域を2以上有する文字を示す文字コードを示す辞書情報を記憶する辞書記憶手段を備え、
    前記判断手段は、注目文字コードが前記辞書情報に登録されているか否かを検出することで、注目文字パターンの独立した有意画素の分布領域が2以上で構成されるか否かを判断することを特徴とする請求項に記載の情報処理装置。
  12. 前記選択手段は、直後の文字パターンが符号である注目文字パターンには、従前に選択したマスクパターンとは異なるマスクパターンを選択することを特徴とする請求項に記載の情報処理装置。
  13. 前記選択手段は、周辺部に文字以外の画像を有する注目文字画像には、従前に選択したマスクパターンとは異なるマスクパターンを選択することを特徴とする請求項に記載の情報処理装置。
  14. 請求項9乃至13のいずれか1項に記載の情報処理装置が出力したページ画像から、文字画像単位の後処理のために各文字画像を切り出す画像処理装置であって、
    互いに異なる複数のマスクパターンを記憶する記憶手段と、
    ページ画像を入力する入力手段と、
    入力したページ画像を、垂直、水平方向に射影し、有意画素の分布を示すヒストグラムを作成する作成手段と、
    作成されたヒストグラムに基づき、有意画素の領域を仮文字画像領域として抽出する仮抽出手段と、
    前記仮文字画像領域内の仮文字画像が、前記記憶手段に記憶されたマスクパターンのいずれかと合成されているか否かを判別し、合成されている場合には、そのマスクパターンを識別するマスクパターン判別手段と、
    該マスクパターン判別手段によって、注目仮文字画像が、前記記憶手段に記憶されたマスクパターンのいずれかとも合成されていないと判別された場合、注目仮文字画像を正規の文字画像の切り出し画像として後処理に出力し、
    前記マスクパターン判別手段によって判別された注目仮文字画像が前記マスクパターンで合成されていると判別した場合、注目仮文字画像と隣接する仮文字画像の中で、同じマスクパターンで合成された仮文字画像を含む領域を、正規の文字画像の切り出し画像として後処理に出力する出力手段と、
    を備えることを特徴とする画像処理装置。
  15. 互いに異なる複数のマスクパターンを記憶する記憶手段を備え、文章を構成する文字コードで構成される文章情報に基づいて、文書画像データを生成する情報処理装置の制御方法であって、
    入力手段が文章情報を入力する入力工程と、
    該入力工程によって入力された前記文章情報の中の文章を構成する文字コードの順番に、文字パターン生成手段が対応する文字パターンを生成する文字パターン生成工程と、
    判断手段が、注目文字パターンの独立した有意画素の分布領域が、2以上で構成されるか否かを判断する判断工程と、
    該判断工程によって注目文字パターンが、独立した有意画素の分布領域が1つで構成されると判断した場合には、第1の出力手段が、注目文字パターンを、ページ画像の一部として出力する第1の出力工程と、
    前記判断工程によって、注目文字パターンの独立した有意画素の分布領域が2以上で構成されると判断された場合には、選択手段が前記注目文字パターンの1つ前の文字パターンで選択したマスクパターンとは異なるマスクパターンを前記記憶手段から選択する選択工程と、
    第2の出力手段が、注目文字パターンと、前記選択工程で選択されたマスクパターンとを合成し、合成後の文字パターンをページ画像の一部として出力する第2の出力工程と、
    を備えることを特徴とする情報処理装置の制御方法。
  16. 互いに異なる複数のマスクパターンを記憶する記憶手段を備え、請求項9乃至13のいずれか1項に記載の情報処理装置が出力したページ画像から、文字画像単位の後処理のために各文字画像を切り出す画像処理装置の制御方法であって、
    入力手段がページ画像を入力する入力工程と、
    作成手段が、入力したページ画像を、垂直、水平方向に射影し、有意画素の分布を示すヒストグラムを作成する作成工程と、
    仮抽出手段が、作成されたヒストグラムに基づき、有意画素の領域を仮文字画像領域として抽出する仮抽出工程と、
    マスクパターン判別手段が、該仮抽出工程で抽出した仮文字画像が前記記憶手段に記憶されたマスクパターンのいずれかと合成されているか否かを判断し、合成されている場合には、そのマスクパターンを識別するマスクパターン判別工程と、
    該マスクパターン判別工程によって、注目仮文字画像が、前記記憶手段に記憶されたマスクパターンのいずれかとも合成されていないと判別された場合、出力手段が注目仮文字画像を正規の文字画像の切り出し画像として後処理に出力し、
    前記マスクパターン判別工程によって判別された注目仮文字画像が前記マスクパターンで合成されていると判別した場合、出力手段が、注目仮文字画像と隣接する仮文字画像の中で、同じマスクパターンで合成された仮文字画像を含む領域を、正規の文字画像の切り出し画像として後処理に出力する出力工程と、
    を備えることを特徴とする画像処理装置の制御方法。
  17. コンピュータが読込み実行することで、請求項7、8、15、16のいずれか1項に記載の各工程を実行させるコンピュータプログラム。
  18. 請求項17に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
JP2006336385A 2006-12-13 2006-12-13 情報処理装置、画像処理装置、情報処理装置の制御方法及び画像処理装置の制御方法 Expired - Fee Related JP4818091B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006336385A JP4818091B2 (ja) 2006-12-13 2006-12-13 情報処理装置、画像処理装置、情報処理装置の制御方法及び画像処理装置の制御方法
CN200710194875XA CN101201936B (zh) 2006-12-13 2007-12-13 信息处理装置以及信息处理装置的控制方法
KR1020070130168A KR100905857B1 (ko) 2006-12-13 2007-12-13 정보 처리 장치 및 정보 처리 장치의 제어 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006336385A JP4818091B2 (ja) 2006-12-13 2006-12-13 情報処理装置、画像処理装置、情報処理装置の制御方法及び画像処理装置の制御方法

Publications (3)

Publication Number Publication Date
JP2008146608A JP2008146608A (ja) 2008-06-26
JP2008146608A5 JP2008146608A5 (ja) 2009-10-08
JP4818091B2 true JP4818091B2 (ja) 2011-11-16

Family

ID=39517089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006336385A Expired - Fee Related JP4818091B2 (ja) 2006-12-13 2006-12-13 情報処理装置、画像処理装置、情報処理装置の制御方法及び画像処理装置の制御方法

Country Status (3)

Country Link
JP (1) JP4818091B2 (ja)
KR (1) KR100905857B1 (ja)
CN (1) CN101201936B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100988309B1 (ko) 2008-12-11 2010-10-29 주식회사 엘아이텍 문서식별자의 삽입방법 및 그의 해독방법
CN102074042B (zh) * 2010-12-29 2012-11-14 律国甦 可利用日常物品生成丰富图案效果的图案生成系统及方法
CN102968764B (zh) * 2012-10-26 2015-04-29 北京航空航天大学 一种基于笔画的汉字图像修复方法
JP6330388B2 (ja) * 2014-03-14 2018-05-30 オムロン株式会社 画像処理方法、画像処理装置、並びに、当該方法を実行するプログラム、及び、当該プログラムを記録する記録媒体
WO2016024200A2 (en) * 2014-08-12 2016-02-18 Mantisvision Ltd. Structured light projection and imaging
JP2018120338A (ja) * 2017-01-24 2018-08-02 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
CN109903261B (zh) * 2019-02-19 2021-04-09 北京奇艺世纪科技有限公司 一种图像处理方法、装置及电子设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6274183A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
JP2002279344A (ja) * 2001-03-16 2002-09-27 Ricoh Co Ltd 文字認識装置、文字認識方法および記録媒体
JP3938176B2 (ja) * 2003-12-10 2007-06-27 キヤノン株式会社 画像処理方法、画像処理装置、プログラム及び記録媒体
CN100364260C (zh) * 2004-01-18 2008-01-23 哈尔滨工业大学 数字签名和数字水印条码的制作及验证方法
JP3990375B2 (ja) * 2004-03-30 2007-10-10 東芝ソリューション株式会社 画像処理装置および画像処理方法
JP2006050551A (ja) * 2004-06-30 2006-02-16 Canon Inc 画像処理装置及びその方法、並びにプログラム及び記憶媒体
CN100573577C (zh) * 2004-12-08 2009-12-23 株式会社理光 在文档图像中嵌入和提取附加信息
JP2006217035A (ja) * 2005-02-01 2006-08-17 Canon Inc 印刷装置、画像処理装置、画像処理システム、画像処理方法
JP4310288B2 (ja) * 2005-04-12 2009-08-05 キヤノン株式会社 画像処理装置及びその方法、プログラム並びに記憶媒体

Also Published As

Publication number Publication date
JP2008146608A (ja) 2008-06-26
KR20080055710A (ko) 2008-06-19
CN101201936B (zh) 2010-04-14
CN101201936A (zh) 2008-06-18
KR100905857B1 (ko) 2009-07-02

Similar Documents

Publication Publication Date Title
JP4818091B2 (ja) 情報処理装置、画像処理装置、情報処理装置の制御方法及び画像処理装置の制御方法
JP4310288B2 (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
US8078005B2 (en) Method for controlling the combining of original image data and coded image data
JP4623169B2 (ja) 画像処理装置及び画像処理プログラム
JP5321109B2 (ja) 情報処理装置及び情報処理プログラム
JP4194462B2 (ja) 電子透かし埋め込み方法、電子透かし埋め込み装置、及びそれらを実現するプログラム並びにコンピュータ可読記憶媒体
JP2006050551A (ja) 画像処理装置及びその方法、並びにプログラム及び記憶媒体
JP4673200B2 (ja) 印刷処理システムおよび印刷処理方法
JP4921335B2 (ja) ドキュメント処理装置及び検索方法
JP2008146608A5 (ja)
JP2005117154A (ja) 電子透かし埋め込み方法、電子透かし埋め込み装置、電子透かし抽出方法、電子透かし抽出装置、上記各方法を実行可能なコンピュータプログラム、及びこれを記憶した記憶媒体
JP2002232679A (ja) 画像処理方法及び装置及びコンピュータプログラム及び記憶媒体
JP2006270589A (ja) 情報処理装置、情報処理方法、プログラムおよび記録媒体
JP4164458B2 (ja) 情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2009278181A (ja) 電子透かし情報埋め込み装置及び方法、並びに、電子透かし情報抽出装置及び方法
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP2006074166A (ja) 画像処理装置及びその方法
JP2009141525A (ja) 画像処理装置及び画像処理方法
JP5720166B2 (ja) 画像処理装置及び画像処理プログラム
JP2008098946A (ja) 画像処理装置及びその制御方法
JP5062076B2 (ja) 情報処理装置及び情報処理プログラム
JP2007142986A (ja) 画像処理装置及び画像処理方法
JPH11203402A (ja) 画像処理装置及び画像処理方法
US20090241063A1 (en) Information processing apparatus, information processing method, and computer readable medium for designing a gui
JP2007221293A (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090826

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090826

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110826

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110830

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees