JP2010129023A - 情報処理装置、文字処理方法、プログラム及び記憶媒体 - Google Patents

情報処理装置、文字処理方法、プログラム及び記憶媒体 Download PDF

Info

Publication number
JP2010129023A
JP2010129023A JP2008305929A JP2008305929A JP2010129023A JP 2010129023 A JP2010129023 A JP 2010129023A JP 2008305929 A JP2008305929 A JP 2008305929A JP 2008305929 A JP2008305929 A JP 2008305929A JP 2010129023 A JP2010129023 A JP 2010129023A
Authority
JP
Japan
Prior art keywords
character
information
character shape
shape information
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008305929A
Other languages
English (en)
Inventor
Taisuke Ishiguro
泰輔 石黒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008305929A priority Critical patent/JP2010129023A/ja
Publication of JP2010129023A publication Critical patent/JP2010129023A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Controls And Circuits For Display Device (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】 文字の字形情報を分類することで、文字のイアウトが横書きから縦書き、或いは縦書きから横書きに変更されても、レイアウト形式に対応する正常な文字を出力することである。
【解決手段】 文字認識部705が認識した文字の形状を特定する字形情報と、前記字形情報で特定される文字を矩形領域に出力するための位置情報と、当該文字の文字コードとを受け付ける。そして、文字画像分類得707が受け付けた前記字形情報と前記位置情報とに基づき前記文字を分類する。そして、文字画像分類部707が分類した分類結果に基づき字形生成部708が字形情報から新たな字形情報を生成することを特徴とする。
【選択図】 図7

Description

本発明は、文字を処理する情報処理装置に関する。
従来、文書画像から文字画像を抽出し、文字画像の並び替え、文字画像のサイズ変更などを行う文字画像のレイアウト技術が知られている。
また、文字コードによる文字判定を行い、必要に応じて横書き用の字形データから縦書き用の字形データを生成する技術が知られている。
たとえば、長音「ー」などは、横書きの場合「ー」であるが、縦書きの場合は形状が異なっているため、横書きとは異なる字形データが必要である。
このように文字コードは同じでも、字形データが複数(横書き用と縦書き用)存在する文字は多数存在するため、予め横書き用と縦書き用の字形データを用意しておくのには煩雑な作業が発生する。
そこで、字形データの作成は横書き用のみを作成しておき、前述したように縦書き用の字形は文字コードにより縦書き用字形の必要性を判定し、自動的に作成することが行われている。
特開平04−336683号公報 特開2004−133163号公報
しかしながら、従来の文字画像のレイアウト技術ではレイアウトが横書きから縦書きへの変換に関して考慮されていなかった。
具体的には、横書きから縦書きへ変更された場合でも、文字画像には縦書き用の文字画像が存在しなかったため、横書き用にデザインされた字形の文字画像を縦方向に並べることしかできなかった。
また、文字画像に対して文字認識処理を行い、文字コードを取得することができれば、従来技術を適用して縦書き用の字形を持つ文字画像を生成することはできる。しかし、この場合は文字認識処理の誤認識の影響を大きく受けてしまうという問題がある。
本発明は、上記の課題を解決するためになされたもので、本発明の目的は、文字の字形情報を分類することで、文字のイアウトが横書きから縦書き、或いは縦書きから横書きに変更されても、レイアウト形式に対応する正常な文字を出力できる仕組みを提供することである。
上記目的を達成する本発明の情報処理装置は以下に示す構成を備える。
文字を処理する情報処理装置であって、文字の形状を特定する字形情報と、前記字形情報で特定される文字を矩形領域に出力するための位置情報と、当該文字の文字コードとを受け付ける受付手段と、前記受付手段が受け付けた前記字形情報と前記位置情報とに基づき前記文字を分類する分類手段と、前記分類手段が分類した分類結果に基づき前記字形情報から新たな字形情報を生成する字形生成手段とを備えることを特徴とする。
本発明によれば、文字の字形情報を分類することで、文字のイアウトが横書きから縦書き、或いは縦書きから横書きに変更されても、縦書きの字形情報から横書きの字形情報を生成してレイアウト形式に対応する正常な文字を出力できる。
文字の字形情報を分類することで、文字のイアウトが横書きから縦書き、或いは縦書きから横書きに変更されても、横書きの字形情報から縦書きの字形情報を生成してレイアウト形式に対応する正常な文字を出力できる。
次に本発明を実施するための最良の形態について図面を参照して説明する。
<システム構成の説明>
〔第1実施形態〕
図1は、本実施形態を示す情報処理装置より構成されるネットワークシステムを示すブロック図である。
図1において、ネットワークシステムは各種データの伝送媒体となるネットワーク102上に複数の情報処理装置が接続されている。
ネットワーク102は、例えばEthernet(登録商標)のようなLAN(Local Area Network)あるいはインターネットのような広域情報通信網であってもよい。各情報処理装置1乃至情報処理装置5は図2において後述する通信装置208を介して接続されている。
図2は、本実施形態を示す情報処理装置のハードウェア構成を示すブロック図である。
図2において、201はCPU(Central Processing Unit)であり、各処理のための演算、論理判断等を行い、バス209を介してそれらのバスに接続された各構成要素を制御する。
202はROMであり、実行される処理プログラム等の制御プログラムコードを記憶する。
203は書き込み可能なRAM(Random Access Memory)であり、各構成要素からの各種データの一時記憶に用いられる。
204は入力装置であり、情報(データ)の入力に用いられる。205は表示装置で、例えば陰極線管CRT(Cathod-Ray Tube)や液晶パネル等で構成され、ドット構成の表示パターンおよびカーソルの表示を表示装置コントローラ206で制御する。
207は外部記憶装置であり、種々の情報が格納される。また、これらのデータおよびプログラムを格納する記憶媒体としては、ROM、CD−ROM、DVD−ROM、メモリカード、光磁気ディスクなどを用いることができる。
208は通信装置であり、Ethernet(登録商標)などのネットワークに接続し、ネットワークシステムにおいて複数の情報処理装置同士を接続する役割を担う。
このように構成された情報処理装置は、入力装置204からの各種の入力および通信装置208から提供されるネットワーク経由の入力に応じて作動するものである。
入力装置204からの入力および通信装置208からの入力が供給されると、インタラプト信号がCPU201に送られる。そのCPU201が外部記憶装置207内に記憶してある各種の制御信号を読み出し、それらの制御信号に従って、各種の制御が行われる。
また、本発明に係わるプログラムを格納した記憶媒体をシステムあるいは装置に供給し、そのシステムあるいは装置のコンピュータが、記憶媒体に格納されたプログラムコードを読み出し実行することによっても本発明は達成される。
以下、図3から図13を用いて与えられた文字画像を解析して、画像中の横書き文字を縦書きレイアウトとする場合における縦書き字形を作成する処理について説明する。
図3は、本実施形態を示す情報処理装置における文書処理の概要を示す図である。
図3において、301は紙文書で、スキャナ303にて文書画像化される。なお、スキャナ303はネットワークに接続されるネットワークスキャナであってもよいし、双方向インタフェース、例えばUSBインタフェース等を介して接続されるローカルなスキャナであってもよい。
紙文書301には、拡大して文字列を示すように文字列の領域302が含まれている。次に、スキャナ303により生成された文書画像は、情報処理装置304においてレイアウト変更処理を含む画像処理が行われる。
305は文書で、レイアウト変更が行われた状態の文書である。文書305で示す例では、紙文書301の横長のレイアウトから縦長のレイアウトへ変更されており、内部の文字列は横書きから縦書きへ変更されている。
また、文字列が横書きから縦書きへ変更になったことに伴い、必要な縦書き用字形が自動的に生成されている。たとえば、「ー(長音)」は横書きから縦書きに変更されたことで、字形の変更が行われている。
文書領域306は、レイアウト変更処理により内部の文字列が縦書きに変更された様子を示している。
図4は、本実施形態を示す情報処理装置におけるデータ処理手順の一例を示すフローチャートである。本例は、原稿のレイアウトを変更した文書を生成する処理例である。なお、S400〜S406は各ステップを示す。また、各ステップは、図2に示すCPU201がROM202から読み取る制御プログラムをRAM203にロードして実行することで実現される。
まず、S400では、CPU201は、詳細は後述する画像処理により、スキャナ303から入力された紙文書から文書画像情報を生成する。
次に、S401では、CPU201は後述する画像処理により、S400にて生成された文書画像情報を解析する。ここで、文書画像解析処理は、既存の文書解析技術を用いて文書を構成する文字列や写真などの要素を抽出する。なお、文書解析処理の詳細に関しては後述する。
次に、S402では、CPU201は後述する画像処理により、S401で文字列と解析された領域から個々の文字を特定し、文字毎に文字画像を生成する文字切り処理を行う。文字切り処理は、既存の文字切り出し処理を用いて実現する。
そして、S403では、S402で切り出された文字画像の文字認識処理を行う。文字認識処理は、既存の文字認識処理を用いることで実現する。そして、S404では、CPU201は後述する画像処理により、S402で切り出された文字画像のフォント認識を行う。フォント認識処理は、既存のフォント認識処理を用いる。
なお、S402からS404にて取得した情報は、RAM203で管理する文字画像情報テーブルに記録される。文字画像情報テーブルに関しては、図8を用いて後述する。
次に、S405では、CPU201は、文字画像情報テーブルの内容に基づき、字形を生成する。なお、S405における字形生成処理の詳細に関しては、図9を用いて後述する。
次に、S406では、CPU201は、S401にて抽出された文書構成要素をレイアウトする。ここでいうレイアウト処理とは、図3を用いて一例を示したように、横長の文書を縦長の文書にレイアウトすることである。
また、レイアウト処理において、文字列に関しては、横書きの文字列を縦書きの文字列として並び替える処理を含んでいる。
このレイアウト処理における文字列並び替え処理では、必要に応じてS405において生成した字形を用いる。例えば、横書きから縦書きに変更があった場合に、縦書き用の字形が必要な文字(前述したように長音など)に関しては、S405で生成された字形を用いる。
ここで、レイアウト処理は、既存のレイアウト技術を用いて行う。所定の領域へ要素を並べる技術は従来から広く知られており、本実施形態では当該既存技術を使用することでレイアウト処理を実現する。
次に、図4に示したS401の文書解析処理について詳細について図5を用いて説明する。ここで、文書解析処理とは、画像から意味のあるブロックをかたまりとして認識して、該ブロック各々の属性を判定し、異なる属性を持つブロックに分割する処理である。
図5は、本実施形態を示す情報処理装置における画像処理の一例を説明する図である。
例えば、CPU201が図5の(a)のラスタ画像に対して文書画像解析処理を行うと、図5の(b)のように文字列、画像などのブロックB1〜B4として分割される。
前述したように、文書画像解析処理は既存の文書画像解析処理技術を用いて行う。以下、簡単に文書画像解析処理の一例を示す。
CPU201は、スキャナ303から入力画像情報を受け取ると、白黒画像に二値化する。そして、CPU201は、輪郭線追跡を行い黒画素輪郭で囲まれる画素のかたまりを抽出する。ここで、一定面積以上の黒画素の場合は、内部にある白画素に対しても輪郭線追跡を行い白画素のかたまりを抽出する。さらに、CPU201は、抽出した白画素のかたまりが一定面積以上であれば、さらに黒画素のかたまりを抽出する。当該抽出処理は、抽出されたかたまりが一定面積以上であれば、再帰的に実行する。
CPU201は、上記の画像処理で得られた黒画素のかたまりを大きさおよび形状により様々な属性を持つブロックとして分類する。
文書画像解析処理では、分類したブロックの位置情報や属性などを図6に一例を示す文書構成データテーブルに記憶する。
図6は、図2に示したRAM203上で管理される文書構成データテーブルの一例を示す図である。
図6において、文書構成データ情報は、各データを一意に決定するためのID601、構成データのデータ属性602、位置情報603、604(X、Y)、外接矩形の幅(W)605および高さ(H)606で構成される。なお、データ属性602において、1は文字列に対応し、2は図面に対応し、3は写真に対応する。
ここで、構成データの位置座標は、原稿画像の左上を原点(0、0)とした場合の位置座標である。構成データの幅Wおよび高さHは画素数で表現される。
図7は、本実施形態を示す情報処理装置における画像処理構成を説明するブロック図である。
図7において、入力部701、出力部702、文書解析部703、文字切り部704、文字認識部705、フォント認識部706、文字画像分類部707、字形生成部708、レイアウト部709から構成される。
入力部701は、操作者による入力および文書画像を受け付ける。出力部702は、レイアウト部709のレイアウト結果を出力する。文書解析部703は、入力部701から入力された文書画像情報を解析し、文書の構成要素(文字列や画像など)を抽出する。
文字切り部704は、文書構成要素として抽出された文字列領域から、文字画像を切り出す。切り出された文字画像の情報は、図8に一例を示す文字画像情報テーブルに記憶する。
文字認識部705は、切り出された文字画像に対して文字認識処理を行い、文字コードを特定する。文字認識の結果は、図8に示す文字画像情報テーブルに記憶する。
フォント認識部706は、切り出された文字画像に対してフォント認識処理を行い、フォント、例えばゴシック体、明朝体等を特定する。フォント認識の結果は、図8に示す文字画像情報テーブルに記憶する。
文字画像分類部707は、切り出された文字画像の情報および文字認識結果、フォント認識結果に基づき、文字画像の分類を行う。文字画像の情報および文字、フォント認識の結果は、図8に示す文字画像情報テーブルに保持されている。
字形生成部708は、レイアウト変更に備えて文字画像の分類結果に基づき字形を生成する。文字画像分類部707および字形生成部708における処理の詳細に関しては、後に図9を用いて詳細に説明する。
レイアウト部709は、文書構成要素のレイアウト処理を行う。このレイアウト処理は、前述したように既存のレイアウト技術を用いて行う。文字列要素のレイアウト変更として、横書き/縦書き間での変更があった場合は、必要に応じて字形生成部708により生成された字形を使用する。
図8は、本実施形態を示す情報処理装置で管理される文字画像情報テーブルの一例を示す図である。なお、文字画像情報テーブルはRAM203上に保持され、CPU201で管理される。
図8において、字形情報を管理する文字画像情報テーブルは、外接矩形情報801、仮想ボディ情報802、文字コード情報803、フォント情報804、文字画像データ805から構成される。
外接矩形情報801は、文字画像の外接矩形を示す情報として、該外接矩形の左上の座標を示す座標情報(X、Y)、幅を示すW、高さを示すHから構成される。外接矩形情報は、図4におけるS401で行われる文字切り処理により取得される。
仮想ボディ情報802は、組版において通常使用される情報と同様に、文字画像の行内における位置を特定するための情報であり、仮想ボディの矩形を示す情報で構成される。
仮想ボディ矩形情報は、当該矩形の左上を示す座標情報(X、Y)、幅を示すW、高さを示すHから構成される。仮想ボディ情報は、行の高さと個々の文字画像幅の平均値を用いて算出される。行の高さや文字画像の幅の算出は、既存の文字切り処理において一般的に実施されており、本実施形態においても既存処理を用いることで算出を行う。
文字コード情報803およびフォント情報804は、先に述べたように、文字画像に対する文字認識およびフォント認識の結果を示す情報である。
文字画像データ805は、文字画像の字形データを示す情報であり、文字画像の字形をベクトル化したデータとして表現される。
なお、ベクトル化データの生成は、既存のベクトル化技術を用いて行う。ここでは、字形を示す情報として、ベクトル化されたデータを用いたが、字形を示す情報であれば他のフォーマットを用いてもよい。たとえば、文字画像の画像データをビットマップ形式などで保持してもよい。以下、本実施形態における文字処理について図9を参照して説明する。
図9は、本実施形態を示す情報処理装置におけるデータ処理手順の一例を示すフローチャートである。本例は、S405に対応する字形生成処理例である。S900、S901は各ステップを示し、各ステップは、図2に示すCPU201がROM202から読み取る制御プログラムをRAM203にロードして実行することで実現される。また、本実施形態では、図4に示したS400〜S404で処理された図8に示す字形情報と文字コードを受付ることで処理が開始される例である。
S900では、図8に示す文字画像情報テーブルおよび、図2に示したROM202或いは図示しない外部記憶装置に記憶される分類条件テーブル(図10)を参照して、文字画像の分類処理を行う。
図10は、本実施形態を示す情報処理装置における分類条件テーブルの一例を示す図である。
図11は、図10に示す分類条件に基づく文字の分類例を示す図である。本例は、図10に示す分類条件に従い図11の(a)に示す横書きの「チョコレート」を図11(b)に示すように分類した例を示す。
本実施形態では、図10に示すように、分類条件テーブルは、分類タイプ1001と分類条件1002から構成されている。
分類条件1002は、図8に示した文字画像情報テーブルに保持されている情報を用いて条件を判断できるよう構成されている。例えば、図11の(a)に示す文字列を分類条件1002にしたがって分類すると、図11の(b)のように分類される。各文字画像に対する分類結果は、不図示の分類結果テーブルとしてRAM203上に保持される。
S901では、S900における分類結果に基づき字形の生成を行う。字形生成処理では、字形生成方法テーブル(図12)を参照して字形生成方法を決定し、文字画像に対して字形生成処理を行う。
文字画像の字形データは、図8における文字画像データ805に保持されているので、文字画像データ805に対して字形生成処理を行うことになる。字形生成処理の結果は、文字画像データ805のデータとして更新する。図4のS407におけるレイアウト処理では、このようにして生成された文字画像データ805を用いて字形が変形された文字画像データのレイアウトを実施する。以下、図12を参照して実際の字形生成処理の一例を説明する。
図12は、本実施形態を示す情報処理装置が管理する字形生成方法テーブルの一例を示す図である。以下、字形生成部708の処理を説明する。以下、字形生成部708は、CPU201が実行するモジュールで実現されるものとする。
図12において、字形生成方法テーブルは、分類タイプ1201と生成方法1202から構成される。
図13は、本実施形態を示す情報処理装置における字形生成処理を説明する図である。なお、図13において、太い枠は、矩形領域を示し、各文字が矩形領域内に出力される相対的を示している。また、この相対的な文字の位置は、各文字毎に図8に示した仮想ボディに対応づけれて管理されている。
S900の結果である分類結果テーブル(不図示)を参照して、分類タイプを決定し、分類タイプと対応付けられる生成方法を決定する。例えば、分類タイプが「A」である場合は、生成方法は、文字認識結果に基づくフォントデータの参照である。
分類タイプごとに具体的な生成方法の説明を行う。分類タイプ「A」の場合は、字形生成部708は、前述したように、文字認識結果(すなわち文字コード)を用いてフォントデータを参照して、字形データを取得する。
分類タイプ「B」の場合は、字形生成部708は、文字画像データ805に対して、時計回りに90度回転処理を行う。図13の(a−1)の字形データの場合、90度回転処理を行った字形データは、図13の(a−2)に示すものになる。なお、図13の(a−2)が横書きに対応する字形データであって、これを時計回りに90度回転処理したものが図13の(a−1)に示す縦書きに対応する字形データである。
分類タイプ「C」の場合は、字形生成部708は、文字画像情報テーブルを参照して、処理対象となっている文字画像の前後の文字画像データを取得する。
続いて、字形生成部708は、不図示の辞書データを参照し、前後の文字画像データとの関係から、処理対象の文字画像データが数字とみなせるか判断する。ここで、字形生成部708が当該処理対象文字画像が数字と判断された場合は、字形変更処理は行わない。一方、数字ではないと字形生成部708が判断した場合は、字形生成部708は、文字画像データ805に対して、90度時計回りの回転処理、並びに左右反転処理を行う。
図13の(b−1)に示す字形データの場合、字形生成部708が字形変更処理を行った結果は、図13の(b−2)に示すような形状になる。
分類タイプ「D」の場合は、字形生成部708は、仮想ボディ矩形の幅W分だけX軸方向に、高さH分だけY軸方向に字形データを移動する移動処理を行う。
図13の(c−1)に示す字形データの場合、字形変更処理を行った結果は、図13の(c−2)に示すような形状になる。
分類タイプ「E」の場合は、字形生成部708は、処理対象の前に位置する文字画像の分類結果を参照して、分類結果が「B」の場合は、字形データを90度時計回りに回転させる。分類タイプが「B」以外の場合は、字形生成部708は、字形変更処理を行わない。
このように処理することで、前文字の変形に依存する文字の字形変更が可能になる。例えば、「/(スラッシュ)」のように、縦書き時において2種類の形状を持つ文字に対して字形変更が可能になる(図13の(d))。このように本実施形態では、前文字の変形に依存する文字を処理する際に、基点とすべき文字の前または後に位置する文字の文字コードを参照して、基点とすべき文字を分類する。これにより、図13の(d)に示すように、基点の文字の前と後ろの文字がアルファベットの場合と、基点の文字の前と後ろの文字がカタカナの場合とで適切な文字処理を実行することが可能となる。
分類タイプ「F」の場合は、字形生成部708は、横書き用字形と縦書き用字形が同じであるため、字形変更処理は行わない。
以上、説明したように本実施形態による字形生成処理では、文字認識を行わない(もしくは文字認識を実施できない)場合にも、字形の変更処理を行うことができる。
本実施形態では、字形の生成処理において、補助的に文字認識およびフォント認識の結果を示したが、文字認識およびフォント認識の結果は必ずしも必要ではない。
文字の画像を分類する処理において、元画像の形状を元に画像を分類することで、文字認識およびフォント認識によらず分類処理を行うことができる。
また、本実施形態では、文字、写真等を含む文書画像を解析して文字画像を取得し、当該文字画像に認識処理等を実行して字形の生成を行ったが、入力が文書画像である必要がないことは明らかである。
つまり、文字画像が入力される構成であれば、入力された文字画像に合わせて字形の変更を行うことができる。
例えば、フォントデータの生成においても、横書きと縦書き用の字形すべてをデザインすることは非常に煩雑な処理を必要とするが、本発明によれば、横書き用の字形から縦書き用の字形を生成することができる。
さらに、本実施形態では、横書き用の字形を解析し縦書き用の字形を生成したが、縦書き用の字形から横書き用の字形を生成してもよい。
以下、図14に示すメモリマップを参照して本発明に係る情報処理装置で読み取り可能なデータ処理プログラムの構成について説明する。
図14、本発明に係る情報処理装置で読み取り可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
なお、特に図示しないが、記憶媒体に記憶されるプログラム群を管理する情報、例えばバージョン情報,作成者等も記憶され、かつ、プログラム読み出し側のOS等に依存する情報、例えばプログラムを識別表示するアイコン等も記憶される場合もある。
さらに、各種プログラムに従属するデータも上記ディレクトリに管理されている。また、各種プログラムをコンピュータにインストールするためのプログラムや、インストールするプログラムが圧縮されている場合に、解凍するプログラム等も記憶される場合もある。
本実施形態におけるフローチャートに示す機能が外部からインストールされるプログラムによって、ホストコンピュータにより遂行されていてもよい。そして、その場合、CD−ROMやフラッシュメモリやFD等の記憶媒体により、あるいはネットワークを介して外部の記憶媒体から、プログラムを含む情報群を出力装置に供給される場合でも本発明は適用されるものである。
以上のように、前述した実施形態の機能を実現するソフトウエアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。
この場合、記憶媒体から読み出されたプログラムコード自体が本発明の新規な機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
従って、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記憶媒体としては、例えばフレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVDなどを用いることができる。
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶したコンピュータ読み取り可能な記憶媒体は本発明を構成することになる。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、該ホームページから本発明のコンピュータプログラムそのもの、もしくは、圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバやftpサーバ等も本発明の請求項に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけではない。例えばそのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行う。そして、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込ませる。その後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施形態の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。
本発明の様々な例と実施形態を示して説明したが、当業者であれば、本発明の趣旨と範囲は、本明細書内の特定の説明に限定されるのではない。
本実施形態を示す情報処理装置より構成されるネットワークシステムを示すブロック図である。 本実施形態を示す情報処理装置のハードウェア構成を示すブロック図である。 本実施形態を示す情報処理装置における文書処理の概要を示す図である。 本実施形態を示す情報処理装置におけるデータ処理手順の一例を示すフローチャートである。 本実施形態を示す情報処理装置における画像処理の一例を説明する図である。 図2に示したRAM203上で管理される文書構成データテーブルの一例を示す図である。 本実施形態を示す情報処理装置における画像処理構成を説明するブロック図である。 本実施形態を示す情報処理装置で管理される文字画像情報テーブルの一例を示す図である。 本実施形態を示す情報処理装置におけるデータ処理手順の一例を示すフローチャートである。 本実施形態を示す情報処理装置における分類条件テーブルの一例を示す図である。 図10に示す分類条件に基づく文字の分類例を示す図である。 本実施形態を示す情報処理装置が管理する字形生成方法テーブルの一例を示す図である。 本実施形態を示す情報処理装置における字形生成処理を説明する図である。 本発明に係る情報処理装置で読み取り可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
符号の説明
701 入力装置
702 出力装置
703 文書解析装置
704 文字切り装置
705 文字認識装置
706 フォント認識装置
707 文字画像分類装置
708 字形生成装置
709 レイアウト装置

Claims (11)

  1. 文字を処理する情報処理装置であって、
    文字の形状を特定する字形情報と、前記字形情報で特定される文字を矩形領域に出力するための位置情報と、当該文字の文字コードとを受け付ける受付手段と、
    前記受付手段が受け付けた前記字形情報と前記位置情報とに基づき前記文字を分類する分類手段と、
    前記分類手段が分類した分類結果に基づき前記字形情報から新たな字形情報を生成する字形生成手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記字形情報または前記字形生成手段が新たに生成した字形情報を用いて文字をレイアウトするレイアウト手段を備えることを特徴とする請求項1記載の情報処理装置。
  3. 前記分類手段は、基点とすべき文字の前または後に位置する文字の文字コードを参照して、基点とすべき文字を分類することを特徴とする請求項1記載の情報処理装置。
  4. 原稿画像から切り出される文字画像を認識して文字の形状を特定する字形情報と、前記字形情報で特定される文字を矩形領域に出力するための位置情報と、当該文字の文字コードを生成する文字処理手段を備え、
    前記受付手段は、前記文字処理手段が生成した文字の形状を特定する字形情報と、前記字形情報で特定される文字を矩形領域に出力するための位置情報と、当該文字の文字コードとを受け付けることを特徴とする請求項1記載の情報処理装置。
  5. 文字を処理する情報処理装置における文字処理方法であって、
    文字の形状を特定する字形情報と、前記字形情報で特定される文字を矩形領域に出力するための位置情報と、当該文字の文字コードとを受け付ける受付ステップと、
    前記受付ステップが受け付けた前記字形情報と前記位置情報とに基づき前記文字を分類する分類ステップと、
    前記分類ステップが分類した分類結果に基づき前記字形情報から新たな字形情報を生成する字形生成ステップと、
    を備えることを特徴とする文字処理方法。
  6. 前記字形情報または前記字形生成手段が新たに生成した字形情報を用いて文字をレイアウトするレイアウト手段を備えることを特徴とする請求項5記載の文字処理方法。
  7. 前記分類ステップは、基点とすべき文字の前または後に位置する文字の文字コードを参照して、基点とすべき文字を分類することを特徴とする請求項5記載の文字処理方法。
  8. 原稿画像から切り出される文字画像を認識して文字の形状を特定する字形情報と、前記字形情報で特定される文字を矩形領域に出力するための位置情報と、当該文字の文字コードを生成する文字処理ステップを備え、
    前記受付ステップは、前記文字処理ステップが生成した文字の形状を特定する字形情報と、前記字形情報で特定される文字を矩形領域に出力するための位置情報と、当該文字の文字コードとを受け付けることを特徴とする請求項5記載の文字処理方法。
  9. 請求項5乃至8のいずれか1項に記載の文字処理方法をコンピュータに実行させることを特徴とするプログラム。
  10. 請求項5乃至8のいずれか1項に記載の文字処理方法をコンピュータに実行させるためのプログラムを格納したことを特徴とするコンピュータが読み取り可能な記憶媒体。
  11. 文字画像を入力する入力手段と、
    前記入力手段により入力された文字画像を分類する分類手段と、
    前記分類手段による分類結果に応じて、文字画像の回転処理、文字画像の回転処理と左右反転処理、及び文字画像の移動処理のいずれかを実行する実行手段とを有することを特徴とする情報処理装置。
JP2008305929A 2008-12-01 2008-12-01 情報処理装置、文字処理方法、プログラム及び記憶媒体 Withdrawn JP2010129023A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008305929A JP2010129023A (ja) 2008-12-01 2008-12-01 情報処理装置、文字処理方法、プログラム及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008305929A JP2010129023A (ja) 2008-12-01 2008-12-01 情報処理装置、文字処理方法、プログラム及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2010129023A true JP2010129023A (ja) 2010-06-10

Family

ID=42329338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008305929A Withdrawn JP2010129023A (ja) 2008-12-01 2008-12-01 情報処理装置、文字処理方法、プログラム及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2010129023A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102629467A (zh) * 2012-03-29 2012-08-08 苏州佳世达光电有限公司 影像处理器、文字型屏幕显示装置及显示方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102629467A (zh) * 2012-03-29 2012-08-08 苏州佳世达光电有限公司 影像处理器、文字型屏幕显示装置及显示方法

Similar Documents

Publication Publication Date Title
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP4724517B2 (ja) 画像処理システムおよび画像処理方法およびプログラムおよび記憶媒体
JP4757001B2 (ja) 画像処理装置、画像処理方法
JP5121599B2 (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JPH11282829A (ja) フォント共有システムおよび方法ならびにフォント共有方法を実行するためのプログラムを格納した記録媒体
JPH08249329A (ja) ポータブル電子文書に記載されている単語を識別する方法及び装置
JPH11203491A (ja) 画像処理装置及び方法
JPH08305778A (ja) ユーザの作成したマークの存在を調査するための方法
JP2000200350A (ja) 情報処理方法及び装置
US9779064B2 (en) Cloud assisted rendering
JP2010123002A (ja) 文書画像レイアウト装置
JP5538812B2 (ja) 画像処理装置、画像処理方法及びプログラム
US11055526B2 (en) Method, system and apparatus for processing a page of a document
US8533590B2 (en) Information processing apparatus and layout processing method
JP2006227824A (ja) 図面認識方法および装置
JP2010129023A (ja) 情報処理装置、文字処理方法、プログラム及び記憶媒体
JP5794154B2 (ja) 画像処理プログラム、画像処理方法、及び画像処理装置
US9692936B2 (en) Image processing apparatus and image processing method for clipping, from a second image, an area at a position corresponding to designated position in a first image
JPH10312407A (ja) 図面表示装置
JP7035852B2 (ja) 筆記選択プログラム、筆記選択方法および情報処理装置
JP2022090469A (ja) 書式定義装置、書式定義方法、及びプログラム
JP5612975B2 (ja) セリフデータ生成装置、セリフデータ生成方法、及びプログラム
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP5361315B2 (ja) 情報処理装置及び情報処理方法
JP2010009146A (ja) 文書処理方法および文書処理装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120207