JP2007199919A - 画像処理装置および方法 - Google Patents

画像処理装置および方法 Download PDF

Info

Publication number
JP2007199919A
JP2007199919A JP2006016388A JP2006016388A JP2007199919A JP 2007199919 A JP2007199919 A JP 2007199919A JP 2006016388 A JP2006016388 A JP 2006016388A JP 2006016388 A JP2006016388 A JP 2006016388A JP 2007199919 A JP2007199919 A JP 2007199919A
Authority
JP
Japan
Prior art keywords
image
document image
information
paragraph
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006016388A
Other languages
English (en)
Inventor
Tadayoshi Koyama
小山忠義
Kota Iwanami
剛太 岩浪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Infocity KK
Original Assignee
Infocity KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Infocity KK filed Critical Infocity KK
Priority to JP2006016388A priority Critical patent/JP2007199919A/ja
Publication of JP2007199919A publication Critical patent/JP2007199919A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】 文字認識を行うことなく表示環境に合わせて文書画像表示を行う。
【解決手段】 画像入力装置10の画像読読取部11は、原稿の文書を光学的に走査して画素情報を生成する。文字切出部12は、文字の切り出しを行う。整形情報認識部13は、段落(改行)、行区切り、句点、読点を認識する。文書画像情報構成部14は、切り出した各文字の画像セグメントおよび整形情報を含む文書画像情報を構成する。文書画像情報構成部14は文書画像情報を文書画像情報記憶部15に記憶する。
【選択図】 図1

Description

この発明は、文書画像を処理する技術に関し、とくに、表示環境に合わせて文書画像表示を適合化できるようにしたものである。
印刷物を画像として表示する場合、表示領域が小さすぎるとその内容を読むことができなくなる。拡大して表示領域をずらしながら表示することも可能であるが、操作性がわるい。印刷物を文字認識技術を用いてデジタル化して表示領域に併せて表示することも可能である(たとえば特許文献1)。しかしながら、文字認識を行うにはかなりの計算量が必要となる。また、印刷物の文字固有の特徴が捨象されてしまう。さらに、手作業で査読・修正を行わなければならない場合もあり、作業が煩雑になる。
特開2000−029984公報
この発明は、以上の事情を考慮してなされたものであり、文字認識を用いたデジタル化を行うことなく表示環境に合わせて文書画像表示を行える画像処理技術を提供することを目的としている。
この発明の一側面によれば、上述の目的を達成するために、特許請求の範囲に記載のとおりの構成を採用している。ここでは、発明を詳細に説明するのに先だって、特許請求の範囲の記載について補充的に説明を行なっておく。
すなわち、この発明の一側面によれば、上述の目的を達成するために、画像処理装置に:文書画像を読み込む手段と;読み込んだ文書画像の部品領域を抽出する手段と;文書画像中の段落を認識する手段と;部品領域の各画像セグメントと、認識した段落の情報とを含む文書画像情報を構成する手段とを設けている。
文書画像情報は、1つのファイルとして構成されても良いし、1組のファイルとして構成されてもよい。例えば、所定のフォーマットの1つのファイルに各画像セグメントおよび段落の情報を含んでも良いし、1つの構成ファイルと複数の画像セグメントのファイルとからなってもよい。
この構成においては、部品領域の各画像セグメントを用いて原画像に対応する画像を表示でき、しかも、段落情報を用いて、表示領域に応じて段落整形を行える。
この構成において、部品領域は、典型的には、1または複数の文字で構成されるが、これに限定されず、単語または単語部分で構成されてもよい。
段落は典型的には改行として認識されるが、これに限定されず、行区切りを含む行または段落整形用の記号を含む。
段落を認識する手段は、段落に代えてまたは段落とともに句読点を認識してもよい。要するに、行や段落を整形する領域またはこれに対応する記号であればどのようなものでもよい。
また、この発明の他の側面によれば、上述の目的を達成するために、画像表示装置に:文書画像の部品領域をなす各画像セグメントと、上記文書画像の段落の情報とを含む文書画像情報を受け取る手段と;上記文書画像情報に基づいて上記各画像セグメントと上記段落の情報に応じて空白を画像メモリに展開する手段と;上記画像メモリに展開された内容に応じて文書画像を表示する手段とを設けるようにしている。
この構成においては、表示領域に応じて文書画像を整形して表示できる。
また、この発明のさらに他の側面によれば、画像表示装置に:文書画像の部品領域を抽出する手段と;文書画像中の段落を認識する手段と;部品領域の各画像セグメントと、認識した段落の情報とを含む文書画像情報を構成する手段と;上記文書画像情報に基づいて上記各画像セグメントと上記段落の情報に応じて空白を画像メモリに展開する手段と;上記画像メモリに展開された内容に応じて文書画像を表示する手段とを設けている。
この構成においても、表示領域に応じて文書画像を整形して表示できる。元の文書画像は画像読取装置から取得しても良いし、外部から通信または放送により取得しても良い。
なお、この発明は装置またはシステムとして実現できるのみでなく、方法としても実現可能である。また、そのような発明の一部をソフトウェアとして構成することができることはもちろんである。またそのようなソフトウェアをコンピュータに実行させるために用いるソフトウェア製品もこの発明の技術的な範囲に含まれることも当然である。
この発明の上述の側面および他の側面は特許請求の範囲に記載され以下実施例を用いて詳述される。
この発明によれば、表示領域に応じて文書画像を整形して表示できる。
以下、この発明の実施例について説明する。
この実施例では画像処理システムを画像入力装置および画像表示装置から構成する。画像入力装置は、文書を光学的に読み取って文字ごとの画像セグメントおよび段落等の整形情報を含む文書画像情報を生成するものである。画像表示装置は、画像入力装置により生成された文書画像情報を用いて、固有の表示領域に適合した態様で文書画像を表示するものである。
図1は、この発明の実施例の画像処理システムの画像入力装置10を示しており、この図において、画像入力装置10は、画像読取部11、文字切出部12、整形情報認識部13、文書画像情報構成部14、文書画像情報記憶部15等を含んで構成されている。画像読読取部11は、原稿の文書を光学的に走査して画素情報を生成するものである。文字切出部12は、例えば、文書の文字の並びの行方向・列方向のプロファイル(文字がその射影)を用いて文字の切り出しを行う。これは通常の文字認識の前処理に慣用的に行われるものであるが、他の任意の手法を採用できる。整形情報認識部13は、段落(改行)、行区切り、句点、読点を認識するものである。段落は、後続の領域に所定の大きさのブランク(空白)があることにより認識できる。段落は典型的には改行であるが、行区切りでもよい。行の並び方に応じて改行および行区切りを区別しても良い。句点および読点は、切り出した領域の縦横のプロフィールから認識することができるが、これに限定されない。文書画像情報構成部14は、切り出した各文字の画像セグメントおよび整形情報を含む文書画像情報を構成する。文書画像情報の構成例については後に説明する。文書画像情報構成部14は文書画像情報を文書画像情報記憶部15に記憶する。なお、画像読取部11で読み取った原画像の情報を原画像記憶部16に一時記憶しても良い。画像読取部11の代わりに、またはこれに加えて原画像入力部(図示しない)を設けて外部から原画像を受け取って処理するようにしても良い。
図2は、この実施例の画像処理システムの画像表示装置20を示しており、この図において、画像表示装置20は、文書画像情報入力部21、画像展開部22、画像メモリ23および表示装置24等を含んで構成されている。文書画像情報入力部21は、図1の画像入力装置10により構成された文書画像情報を入力するものである。入力された文書画像情報は文書画像情報記憶部25に一時記憶されても良い。画像展開部22は文書画像情報の各文字の画像セグメントおよび整形情報を用いて画像メモリ23のメモリ領域にビット画像を展開していく。文書画像情報が圧縮されているときには画像展開部22または他の機能ブロックが伸長を行う。画像メモリ23は、表示装置24の表示サイズに応じたメモリ領域を保持して展開画像を一時記憶する。表示装置24は、液晶表示装置、その他の表示手法の表示装置からなるものであり、画像メモリ23に展開されたビット画像を用いて表示を行う。
図3は、この実施例の画像処理の概要を示しており、この図において、原稿は例えば(a)に示すようなものであり、「こんにちは」のあとに段落を設けられている。図1の画像入力装置10は、(a)に示すような原稿を光学的に読み込んで、文字の切り出しと整形情報を認識取得する。この例では、「こ」、「ん」、「に」、「ち」、および「は」を切り出して対応する画像セグメントを取得し、さらに「こんにちは」のあとにブランクがあることを認識して整形情報として改行を抽出する。この結果、文書画像情報は(b)に示すような情報を含み、これが、文書画像情報記憶部15に記憶される。
文書画像情報は、1つのファイルで構成されても良いし、複数のファイルの組み合わせて構成されても良い。
図4(a)は、所定のフォーマットを用いて1つのファイルで構成する例を示しており、この例では、文書画像情報のファイルはヘッダ、整形情報および連結画像を含んで形成される。ヘッダは、ファイルのタイプ、文字の画像セグメントのサイズ、圧縮の有無等を記述している。整形情報は、改行、行区切り、句点、読点等の整形情報のタイプおよび位置(例えば先頭からの文字位置)等を含んでいる。連結画像は、藻序ごとの画像セグメントを順番に連結させたものであるが、これに限定されない。各セグメントのサイズを固定とすれば、バイト位置で各文字の画像を抽出できる。なお、区切りコード(ビットパターン)を用いて文字の画像を区切るようにしても良い。改行の後の空白文字は省略しても良いし、そのまま画像として連結させても良い(ただし、表示装置24において空白文字が行末で折り返した後は、空白は削除する)。
図4(b)は、ヘッダおよび統合情報からなる統合ファイルと部品画像(文字の画像セグメント)のファイルとからなる文書画像情報を示す。ヘッダは文書画像情報のタイプ等を表す。統合情報は、整形情報(改行、行区切り、句点、読点等)や部品画像の配置を記述するものである。例えば、マークアップ文書中に整形情報と部品画像のファイル名とを記述して、この記述に従い部品情報を取り出し、さらに整形を行ない、画像を貼り付け表示できるようにしてもよい。
図3(c)は、画像表示装置20により表示例を示している。この例では横幅が狭い表示装置24を用いているのでそれに応じて頻繁に折り返しがあるが、それに加えて整形情報(段落)を用いて適宜に段落の整形を行える。
図3の例では、段落による整形を説明したが、句点、読点の整形情報を用いて禁則処理を反映した表示を行える。この場合、句点および読点を前の文字の領域に組みこんで表示するが、それに限定されず、禁則処理を行う行の各文字幅を少しずつ削減するようにしても良い。すこしずつ削減して切り込むことにより最後の文字位置に句点または読点を表示できる。
なお、図1の画像入力装置10は、各機能ブロックに対応して、画像読取ステップ、文字きりだしステップ、整形情報認識ステップ、文書画像情報構成ステップおよび文書画像情報記憶ステップを行う。この処理はコンピュータプログラムにより実行されても良い。
また図2の画像表示装置20は、各機能ブロックに対応して、文書画像情報入力ステップ、画像展開ステップ、画像表示ステップを行う。この処理もコンピュータブロックにより実行されても良い。
図5は画像処理システムの変形例を示しており、この図において図1および図2に対応する箇所には対応する符号を付した。この例では、1つの画像処理装置30が文書画像情報の生成および表示を行う。この画像処理装置30は、例えば、携帯型の表示装置(携帯電話機等)として実現しても良い。
図5では、原画像入力部31または画像読取部11から原画像を入手し、これを文書画像情報に変換する。そして表示装置24に表示する。
この変形例では、比較的サイズの大きい画像を整形情報付きで切り出して表示装置(例えば比較的小さな表示領域)のサイズに適合して比較的小さな表示領域に流し込み表示を行える。また、画像または画像セグメントを拡大・縮小して、その大きさで表示領域に流し込み表示してもよい。
なお、この発明は上述の実施例に限定されるものではなくその趣旨を逸脱しない範囲で種々変更が可能である。例えば上述の例では、原画像の文字の並び方向と表示の文字の並び方向とが同一であったが、表示時にその方向(縦を横に、横を縦に、左右を逆に、上下を逆に)を指定して変更しても良い。また、原画像から文書画像情報を生成するときに、文字の向きの指定を行っても良い。この場合、原画像に合わせ得ても良いし、それとは異なるものに設定しても良い。文字の向きの指定は例えば、ヘッダに含ませることができるが、これに限定されない。また、文字情報に加えて、イメージ情報を表示処理できるようにしてもよいし、イメージ情報を削除するようにしても良い。イメージは、図4(a)、(b)において文字の情報と同じに扱うことができる。この場合、例えば図6のように表示される。イメージについては所定の大きさに拡大縮小してもよく、そのような指示を文書画像情報に含ませても良い。
この発明の実施例の画像処理システムの画像入力装置の構成を示すブロック図である。 上述実施例の画像処理システムの画像表示装置の構成を示すブロック図である。 上述実施例の画像処理例を模式的に説明する図である。 上述実施例の文書画像情報のファイル構成の例を説明する図である。 上述実施例の変形例を説明するブロック図である。 上述実施例の変形例の画像展開の例を説明する図である。
符号の説明
10 画像入力装置
11 画像読取部
11 画像読読取部
12 文字切出部
13 整形情報認識部
14 文書画像情報構成部
15 文書画像情報記憶部
16 原画像記憶部
20 画像表示装置
21 文書画像情報入力部
22 画像展開部
23 画像メモリ
24 表示装置
25 文書画像情報記憶部
30 画像処理装置
31 原画像入力部

Claims (10)

  1. 文書画像を読み込む手段と、
    読み込んだ文書画像の部品領域を抽出する手段と、
    文書画像中の段落を認識する手段と、
    部品領域の各画像セグメントと、認識した段落の情報とを含む文書画像情報を構成する手段とを有することを特徴とする画像処理装置。
  2. 部品領域は1または複数の文字で構成される請求項1記載の画像処理装置。
  3. 部品領域は単語または単語部分で構成される請求項1記載の画像処理装置。
  4. 段落は改行として認識される請求項1〜3のいずれかに記載の画像処理装置。
  5. 段落を認識する手段は、段落に代えてまたは段落とともに句読点を認識する請求項1〜4に記載のいずれかに記載の画像処理装置。
  6. 文書画像の部品領域をなす各画像セグメントと、上記文書画像の段落の情報とを含む文書画像情報を受け取る手段と、
    上記文書画像情報に基づいて上記各画像セグメントと上記段落の情報に応じて空白を画像メモリに展開する手段と、
    上記画像メモリに展開された内容に応じて文書画像を表示する手段とを有することを特徴とする画像表示装置。
  7. 文書画像の部品領域を抽出する手段と、
    文書画像中の段落を認識する手段と、
    部品領域の各画像セグメントと、認識した段落の情報とを含む文書画像情報を構成する手段と、
    上記文書画像情報に基づいて上記各画像セグメントと上記段落の情報に応じて空白を画像メモリに展開する手段と、
    上記画像メモリに展開された内容に応じて文書画像を表示する手段とを有することを特徴とする画像表示装置。
  8. 読み込み手段が文書画像を読み込むステップと、
    部品領域抽出手段が、読み込んだ文書画像の部品領域を抽出するステップと、
    認識手段が段落を認識するステップと、
    文書画像情報構成手段が、部品領域の各画像セグメントと、認識した段落の情報との組み合わせから文書画像情報を構成するステップとを有することを特徴とする画像処理方法。
  9. 読み込み手段が文書画像を読み込むステップと、
    部品領域抽出手段が、読み込んだ文書画像の部品領域を抽出するステップと、
    認識手段が段落を認識するステップと、
    文書画像情報構成手段が、部品領域の各画像セグメントと、認識した段落の情報とを含む文書画像情報を構成するステップとをコンピュータに実行させるために用いられることを特徴とする画像処理用コンピュータプログラム。
  10. 抽出手段が文書画像の部品領域を抽出するステップと、
    認識手段が文書画像中の段落を認識するステップと、
    文書画像情報構成手段が、部品領域の各画像セグメントと、認識した段落の情報とを含む文書画像情報を構成するステップと、
    展開手段が、上記文書画像情報に基づいて上記各画像セグメントと上記段落の情報に応じて空白を画像メモリに展開するステップと、
    表示手段が、上記画像メモリに展開された内容に応じて文書画像を表示するステップとをコンピュータに実行させるために用いられることを特徴とする画像表示用コンピュータプログラム。
JP2006016388A 2006-01-25 2006-01-25 画像処理装置および方法 Pending JP2007199919A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006016388A JP2007199919A (ja) 2006-01-25 2006-01-25 画像処理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006016388A JP2007199919A (ja) 2006-01-25 2006-01-25 画像処理装置および方法

Publications (1)

Publication Number Publication Date
JP2007199919A true JP2007199919A (ja) 2007-08-09

Family

ID=38454496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006016388A Pending JP2007199919A (ja) 2006-01-25 2006-01-25 画像処理装置および方法

Country Status (1)

Country Link
JP (1) JP2007199919A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014086006A (ja) * 2012-10-26 2014-05-12 Toshiba Corp 電子機器および方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63291162A (ja) * 1987-05-22 1988-11-29 Matsushita Graphic Commun Syst Inc 文書編集装置
JPH0991462A (ja) * 1995-09-28 1997-04-04 Sony Corp 画像処理装置および方法
JPH09297759A (ja) * 1996-05-07 1997-11-18 Canon Inc 文書編集方法とその装置
JP2000163044A (ja) * 1998-11-30 2000-06-16 Sharp Corp 画像表示装置
JP2001273509A (ja) * 2000-03-28 2001-10-05 Toshiba Corp 文書画像編集装置及び文書画像編集方法
JP2003348326A (ja) * 2002-05-29 2003-12-05 Ricoh Co Ltd 文書画像変換方法、文書画像変換プログラム及び文書画像変換装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63291162A (ja) * 1987-05-22 1988-11-29 Matsushita Graphic Commun Syst Inc 文書編集装置
JPH0991462A (ja) * 1995-09-28 1997-04-04 Sony Corp 画像処理装置および方法
JPH09297759A (ja) * 1996-05-07 1997-11-18 Canon Inc 文書編集方法とその装置
JP2000163044A (ja) * 1998-11-30 2000-06-16 Sharp Corp 画像表示装置
JP2001273509A (ja) * 2000-03-28 2001-10-05 Toshiba Corp 文書画像編集装置及び文書画像編集方法
JP2003348326A (ja) * 2002-05-29 2003-12-05 Ricoh Co Ltd 文書画像変換方法、文書画像変換プログラム及び文書画像変換装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014086006A (ja) * 2012-10-26 2014-05-12 Toshiba Corp 電子機器および方法
US9025879B2 (en) 2012-10-26 2015-05-05 Kabushiki Kaisha Toshiba Electronic apparatus and handwritten document processing method

Similar Documents

Publication Publication Date Title
JP5121599B2 (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
KR100905857B1 (ko) 정보 처리 장치 및 정보 처리 장치의 제어 방법
JP2009087270A (ja) 画像処理装置及びプログラム
JP2007199919A (ja) 画像処理装置および方法
JP4867401B2 (ja) 画像処理装置及びプログラム
JP2006243935A (ja) 文書処理装置および方法並びにプログラム
JP4281577B2 (ja) 画像処理システム
JP7302175B2 (ja) 情報処理装置、及び情報処理プログラム
JP6074893B2 (ja) 情報処理装置及びプログラム
JP5612974B2 (ja) セリフチェック装置、セリフチェック方法、及びプログラム
JP5604276B2 (ja) 文書画像生成装置および文書画像生成方法
JP2009017041A (ja) 画像処理複合機
JP2006350959A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2011146852A (ja) 制御装置及び制御方法
JP6651563B2 (ja) 電子図書閲覧プログラム及び電子図書閲覧装置
JP7127365B2 (ja) 文字切り出し装置、文字切り出し方法、及びプログラム
JP2009141525A (ja) 画像処理装置及び画像処理方法
JP2011151703A (ja) 画像処理装置、文字拡大処理方法および文字拡大プログラム
JP2005050094A (ja) 光学的文字読取装置
JPH01292586A (ja) 文字認識支援装置
JP2007079979A (ja) 文書管理装置、文書管理システムおよび文書管理方法
JP2001184349A (ja) 文書編集装置および文書編集方法および記録媒体
JP2004288220A (ja) 文書作成装置
JP2005267394A (ja) 情報処理装置および領域変更方法およびプログラムおよび記録媒体
JPH1011530A (ja) 画像入出力方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111205

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120221