JP2000293624A - 画像処理方法、装置及び記憶媒体 - Google Patents

画像処理方法、装置及び記憶媒体

Info

Publication number
JP2000293624A
JP2000293624A JP11101980A JP10198099A JP2000293624A JP 2000293624 A JP2000293624 A JP 2000293624A JP 11101980 A JP11101980 A JP 11101980A JP 10198099 A JP10198099 A JP 10198099A JP 2000293624 A JP2000293624 A JP 2000293624A
Authority
JP
Japan
Prior art keywords
character
style
image processing
character string
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11101980A
Other languages
English (en)
Inventor
Junichiro Kizaki
純一郎 木▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP11101980A priority Critical patent/JP2000293624A/ja
Publication of JP2000293624A publication Critical patent/JP2000293624A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 入力画像から文字を認識して編集可能な文字
コードに変換するのみならず、文字のスタイルをも判別
する。 【解決手段】 画像からテキストブロックを抽出し(S
53)、テキストブロックの属性或は所定位置の文字に
従って各ブロックのスタイルを判定し(S55、S7
5)、そのスタイルの書式を登録する(S56、S7
6)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像を入力し、文
書に変換することのできる画像処理方法、装置及び記憶
媒体に関するものである。
【0002】
【従来の技術】従来、画像読み取り装置によって読み取
った原稿のイメージを、文字認識処理を行い、テキスト
データを抽出することにより、既存の印刷文書をコンピ
ュータで扱うことができるデジタルデータに変換するこ
とが可能となっていた。また、文字サイズの相違なども
認識することが可能であり、印刷文書のレイアウトを忠
実に再現することが可能となっている。
【0003】
【発明が解決しようとする課題】通常の文書の場合、文
字サイズ、書体、色など、レイアウト上の強調は、同時
に、文脈上でも何らかの意味が与えられているのが普通
である。例えば、見出しなどは、レイアウト上で他の部
分との区切りを表すと同時に、文脈上でも、意味が区切
れるという役割を持っている。しかしながら、一般の文
字認識装置では、文脈の分析まではしないため、せっか
く、コンピュータで扱えるデジタルデータに変換されて
も、その後の編集が困難になる場合が多かった。
【0004】
【課題を解決するための手段】上記従来技術の課題を解
決する為に、本発明は、入力画像から抽出した複数の文
字列の所定位置の文字を識別し、前記識別された文字に
従って、その文字を含む文字列のスタイルを判定し、前
記判定されたスタイルの書式として、前記識別された文
字を登録する画像処理方法、装置及び記憶媒体を提供す
る。
【0005】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記所定位置は、文字列の先頭文字と
する。
【0006】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記所定位置の文字が、予め登録され
ている文字であると識別される場合に、当該文字列のス
タイルを前記登録されていた文字に対応するスタイルと
判定する。
【0007】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記所定位置の文字を識別する文字列
は、予め定めた種類の文字列とする。
【0008】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記スタイルは、箇条書きスタイルと
する。
【0009】上記従来技術の課題を解決する為に、本発
明は、入力画像から抽出した複数の文字列の属性を識別
し、前記識別された属性の相互関係に従って、各文字列
の種類を判断し、前記判断された種類の書式として前記
属性を登録する画像処理方法、装置及び記憶媒体を提供
する。
【0010】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記識別する文字列の属性は、文字サ
イズとする。
【0011】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記文字列の属性を識別する文字列
は、予め定めた種類以外の文字列とする。
【0012】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記文字列の属性を識別する文字列
は、本文以外の文字列とする。
【0013】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記入力画像はスキャナより読み取っ
た画像とする。
【0014】
【発明の実施の形態】以下、図面を用いて本発明に係る
実施の形態を詳細に説明する。
【0015】図1は本発明に係る装置のシステムブロッ
ク図である。
【0016】システムバス1は、後述する各構成間での
データの授受を可能にするものである。CPU(Cen
tral Processing Unit)2は、後
述するPMEM3に格納されている制御プログラムに従
って、本発明に係る各種処理を実行するものである。後
述するフローチャートに示す処理も、CPU2により実
行される。PMEM(メモリ)3は、本発明に係る各種
処理の制御プログラムを、適宜ハードディスク10から
選択して読み込み、格納するメモリである。後述するフ
ローチャートに示す処理の制御プログラムもこのPME
M3に格納される。また、PMEM3はテキストメモリ
としても機能し、キーボード12から入力されたテキスト
データや、外部記憶制御部8の制御により外部記憶媒体
9やハードディスク10から読み取ったテキストデータ
も格納する。通信制御部4は、通信ポート5における入
出力データの制御を行なう。通信ポート5は、通信制御
部4による制御の基、LANやWAN等の通信回線6を
介してネットワーク上の他の装置の通信ポート7と接続
し、データの送信及び受信を行なう。ネットワークに接
続されているプリンタへの印字データの送出や、同じく
ネットワークに接続されているスキャナからのデータの
入力も、この通信ポート5を介して行なう。
【0017】外部記憶制御部8は、データファイル用の
メモリ、例えばハードディスク(HD)10や本装置に
着脱可能な外部記憶媒体(例えばフロッピーディスクや
MO、CD−R等)9からのデータの読み込み及びデー
タの書きこみを制御する。入力制御部11は、キーボー
ド12やマウス13等の入力装置からのデータの入力を
せいぎょする。ここで、マウス13はCRT16の表示
画面上で指示される位置の座標を入力する座標入力手段
として機能するものであれば良く、タブレットやタッチ
パネル等であっても良い。更に、指示した座標位置で、
ボタンの押下やタップ等により、選択指示を可能とする
ものであれば良い。マウスを操作することによって、マ
ウスカーソルで表示される指示位置を所望の位置とし、
例えばコマンドメニュー上のコマンドアイコン上に位置
させて、ボタンを押下することによって、そのコマンド
アイコンで表されているコマンドを入力することもでき
る。また、編集対象の指示及び描画位置の指示もマウス
13により可能である。操作者はキーボード12を操作す
ることにより、文字コードの入力及び各種動作命令の入
力を行なう。
【0018】ビデオイメージメモリ(VRAM)14
は、例えばCRT等の表示器に表示する画像を保持する
メモリであり、表示出力制御部15の制御により、表示
データがビットマップデータに展開して書きこまれ、C
RT16に表示される。表示器は、CRTに限定するも
のではなく、液晶表示器であっても良い。プリンタ制御
部17は、接続されているプリンタ18に対するデータ
の出力制御を行なう。プリンタ18は、画像を印字する
手段として機能するものであって、LBP、インクジェ
ットプリンタ等である。画像入力機器制御部1Aは、接
続されている画像入力機器1Bの制御を行なう。画像入
力機器1Bは、載置した原稿を光学的に読みこむスキャ
ナであっても、或はフィルムスキャナであっても良い。
或は画像データを記憶したメモリから読み込む機能を実
行するものであっても良い。図1においては、プリンタ
制御部17とプリンタ18、及び画像入力機器1Bと画
像入力機器制御部1Aとを別の構成として記載したが、
これらは物理的に別々のコンポーネントであっても、一
つのコンポーネントであっても良いことは勿論である。
【0019】図8は、プリンタをネットワークに接続す
るためのネットワークボード(NB)101を、開放型
アーキテクチャをも持つプリンタ102へつなげた場合
のネットワークシステム構成図であって、本発明はこの
ようなネットワークの中で、処理を分担して行なっても
良い。NB101はローカルエリアネットワーク(LA
N)100へ、例えば同軸コネクタをもつEthern
etインタフェース10Base−2や、RJ−45を
持つ10Base−T等のLANインタフェースを介し
て接続されている。
【0020】PC103、PC104、PC111、P
C112やPC115等の複数のパーソナルコンピュー
タ(PC)がLANに接続されており、ネットワークオ
ペレーティングシステムの制御の下、これらのPCはN
B101と通信し、ネットワークに接続された各デバイ
スとして機能するようにすることができる。また、例え
ばPC103を、ネットワークデバイス管理用PCとし
て使用するように指定することができ、このPC103
によってプリンタ102やPC104にローカル接続さ
れたプリンタ105におけるプリント処理を制御しても
良い。
【0021】また、LAN100にファイルサーバPC
104を接続し、このPC104の表示画面上で入力さ
れた指示に応じてLAN100を介してファイルサーバ
106にアクセスし、大容量(例ーえば100億バイ
ト)のネットワークディスク107に記憶されたファイ
ルからのデータの読み込み及びデータの書き込み、記憶
を管理する。ファイルサーバPC104は、ファイル管
理部として、LANメンバ間でデータのファイルの受信
や、記憶、キューイング、キャッシング、及び送信を行
なう。例えば、PC104自身やPC103によって作
られたデータファイルは、ファイルサーバPC104の
制御のもとファイルサーバ106へ送られ、ファイルサ
ーバ106はこれらのデータファイルを順に並べ、そし
てプリントサーバ104からのコマンドに従って、並べ
られたデータファイルをプリンタ110へ送信する。
【0022】スキャナサーバ115は、ローカル接続さ
れたスキャナ117や、遠隔にあるスキャナ110を制
御して画像の入力を行なわせる。複写機118は、イメ
ージプロセッシングユニット119を介してLAN11
0につながり、ネットワーク110を介して接続される
PCの制御のもと、スキャナやプリンタとしても機能す
る。
【0023】またPC103とPC104はそれぞれ、
データファイルの生成や、生成したデータファイルのL
AN100への送信や、また、LAN100からのファ
イルの受信や、更にそのようなファイルの表示及び処理
を行なうことのできる通常のPCで構成される。尚、図
8ではパーソナルコンピュータ機器を図示したが、ネッ
トワークソフトウェアを実行するのに適切であるよう
な、他のコンピュータ機器であっても良い。通常、LA
N100やLAN110などのLANは、一つの建物内
の一つの階又は接続した複数の階でのユーザグループ等
の、幾分ローカルなユーザグループにサービスを提供す
るが、例えば、ユーザが他の建物や他県にいるなど、あ
るユーザが他のユーザから離れるに従って、ワイドエリ
アネットワーク(WAN)を作っても良い。WANは、
基本的には、いくつかのLANを高速度サービス総合デ
ジタルネットワーク(ISDN)電話線等の高速度デジ
タルラインで接続して形成された集合体である。従っ
て、図8に示すように、LAN100と、LAN110
と、LAN120とはバックボーン140を介して接続
されてWANを形成する。これらの接続は、数本のバス
による単純な電気的接続である。それぞれのLANは専
用のPCを含み、また、必ずしも必要なわけではない
が、通常はファイルサーバ及びプリントサーバを含む。
LAN100と、LAN110と、LAN120とに接
続されている機器は、WAN接続を介して、他のLAN
の機器の機能にアクセスすることができる。
【0024】図3は、画像データの一つのサンプルであ
る。
【0025】通常の文書データは、テキスト、画像、
表、図形などのデータからなっている。本サンプルで
は、簡便のため、テキストと画像からなるデータとす
る。画像が右下にあり、その他の領域にテキストが流し
込まれている。
【0026】文字群31は、この文書のタイトルであ
り、通常は、大見出し、見出し1などと設定されて出力
された文字列である。
【0027】文字群32及び文字群34は、文章の区切
れのタイトルであり、通常は、中見出し、小見出し、見
出し2などと設定されて出力された文字列である。
【0028】文字群33及び文字群35は、通常の本文
領域である。
【0029】見出しは通常、本文の文字サイズより大き
く設定されているような場合が多い。以下、文字サイズ
の違いから、見出しを設定する処理の説明を行う。
【0030】図4は、図3の画像データを後述するS5
2の処理で汎用的な画像データにした後の画像的特徴に
基づいて抽出されたブロックを点線で示した図であり、
各ブロックごとに作成したデータが図2である。
【0031】図2に示したデータ構造は、全体画像(図
3)のサイズ(201)、画像の解像度(202)、各
ブロックごとにブロック全体を表わすブロック領域サイ
ズ、位置、ブロック内データを格納している。ブロック
ごとのデータは、テキストデータ(203)、画像デー
タ(204)等ブロックの属性に従ってブロック内デー
タの種類も異なる。画像データ204はブロック内の画
像データそのまま或は圧縮データであるが、テキストデ
ータ203は、テキストの組方向、各文字画像を文字認
識(OCR)した結果の候補文字コード(206、20
7)、書体(208)、文字サイズ(209)、各種修
飾情報(210)を格納している。各ブロック(41〜
46)を文字認識(文字画像の抽出も含む)した結果、
予め定め、HD10に格納しておいた所定数以上の優良
候補文字(類似度が、所定値以上)を検出できたか、等
の基準により、テキストのみと判断されるテキストブロ
ック、テキストと表(縦及び横方向に引かれた直線)で
構成された表ブロック、画像ブロックの識別を行なう。
また、同じテキストブロックでも、構成される文字サイ
ズが異なる場合や、空白により区切られている場合は、
別のテキストブロックと判断してブロック分割の処理を
行なう場合もある。
【0032】図4のサンプルの場合、ブロック46は、
所定の類似度以上の文字データが認識されないため、画
像ブロックとして識別する。ブロック41〜45まで
は、いづれも文字データが認識されているが、各々文字
サイズが異なるため、異なるテキストブロックとして識
別し、各テキストブロックから認識した候補文字、文字
サイズ等のデータを含めて5個のテキストデータ(20
3)としてHD10に格納する。
【0033】図5は、本発明に係る処理のフローチャー
トである。
【0034】ユーザにより、画像の読み取りが指定され
ると、画像読み取り装置制御モジュールを介して、画像
入力機器1Bにセットされている用紙の画像を読み取る
(S51)。このとき、読み取り解像度、読み取るサイ
ズなどがユーザによりキーボード12或はマウス13を
用いて入力されることにより指定される場合もある。読
み取られたデータは、読み取りサイズ、読み取り解像度
と共に、汎用的な画像データとして生成し、HD10に
格納する(S52)。この画像データは、HD10或は
外部記憶媒体9に記憶されていたデータを用いても良
い。
【0035】画像領域解析モジュールにより、汎用的な
画像データの解析を行い、画像的特徴に基づいて連続し
たひとまとまりの領域であると判断される矩形の領域群
に分け、各領域の位置及びサイズデータを抽出する。図
3の画像を解析した結果抽出される領域を図示したのが
図4であり、6つの領域(ブロック)が抽出されてい
る。
【0036】各ブロック内の画像データを文字認識す
る。文字認識の結果、予め定めておいたしきい値を超え
る類似度の候補文字が、所定数以上得られたブロックテ
キストブロックと判断し、このブロック内の画像データ
から文字認識モジュールにより、ひとつひとつの文字デ
ータを抽出し、各文字データを作成する(S53)。こ
こで、文字データとは、候補文字群、書体、文字サイ
ズ、修飾情報を含むものであって、抽出された1つの文
字画像から得られるデータを1つのまとまりとしてHD
10に格納する。
【0037】1つの原稿画像から得て、テキストブロッ
クと判断されたブロック群のすべての文字データを検証
し、文字サイズ、文字種の各々について多数を占める文
字サイズ及び文字種を識別し、その文字サイズ及び文字
種を本文書式として決定し、HD10に格納する。ま
た、本文書式の文字サイズ、及び、文字種が多数を占め
るブロックを本文領域と決定する(S54)。図4の例
では、ブロック43及びブロック45内の大多数の文字
の文字サイズである10ポイントの文字が原稿画像40
に含まれるテキストブロック内の多数の文字の文字サイ
ズであるため、本文書式における文字サイズを10ポイ
ントに設定し、10ポイントの文字が多数を占めるブロ
ック43とブロック45を本文ブロックに決定し、本文
であるという属性をテキストデータ203内に格納す
る。文字種についても文字サイズと同様の処理を行な
う。ただし、本文ブロックであるか否かの判断は、文字
種データよりも文字サイズデータを優先する。この優先
順位は、予めHD10に格納しておくものとする。
【0038】本文書式を決定した後、本文ブロック以外
の文字サイズ、文字種を検証する。もっとも大きいサイ
ズの文字が多数を占めるブロックを検索し(S55)、
そのブロックを見出し1スタイルブロックと決定し、見
出し1スタイルブロックであるという属性をそのブロッ
クのテキストデータ203内に格納する。また、ここ
で、他に同じサイズが多数を占めるブロックがある場合
は、それらのブロックも同じスタイルとしてデータをH
D10に格納する(S56)。図4でいうと、ブロック
41はすべて16ポイントの文字からなっており、他の
どのブロック内文字よりも大きいサイズのため、それを
見だし1スタイルと決定し、その文字サイズを見出し1
スタイルの書式としてHD10に格納する(S57)。
ここで、見出し1スタイルとは、テキストブロックに対
して設定する書式の名称の一つであり、このようなスタ
イルの中には本文、見出し、箇条書き、索引等のスタイ
ル種がある。更に、各スタイル種の中でレベルがあり、
見出し1スタイルは見出しスタイルの中で第一位レベル
にあるものである。続いて見出し2スタイル、見出し3
スタイル・・・と続き、レベルによって、アピール度
(文字サイズや強調文字、字下げ)や番号のふり方を変
えて書式に設定することにより、出力結果でレベルがわ
かるようにすることができるものである。また、下位レ
ベルのスタイルは一つ上のレベルのスタイルに付随する
ものである。順次残りの領域を検索し、大きいサイズの
文字が多数を占める領域から順に見出し2,見出し3を
設定する。図4では、ブロック42がすべて14ポイン
トの文字で構成され、ブロック41に次いで大きいサイ
ズのため、見出し2スタイルを設定する。続いてブロッ
ク44もブロック42と同様に14ポイントの文字から
なっているため、見出し2を設定する。S58で本文ブ
ロック以外のテキストブロックの全てにスタイルが設定
されたと判断されるまで、S55でスタイル未設定のテ
キストブロックを検索してS55〜S57の処理を繰り
返す。
【0039】このような箇条書きのテキストブロックを
識別する為の処理のフローチャートを図7に示す。
【0040】図6は、先に述べたスタイルの中の箇条書
きとして設定すべきテキストを含む原稿画像の例であ
り、S52の処理で抽出されたブロックが601〜61
1の11個であり、ブロックを点線枠により示した。こ
のような画像から箇条書きされているテキストブロック
を識別する為に、S55では文字サイズを基準とした特
徴を抜き出す他に、箇条書きであることを示すマーク
や、シリアルに付けられた番号を識別する処理を行な
い、S57ではその識別した特殊情報を格納する。更
に、ここでは、各領域の先頭の持続性から、箇条書きス
タイルを設定する処理を行なっても良い。
【0041】図7の例では、S54での本文識別処理で
テキストの多数を占めている10ポイントの文字サイズ
が本文書式の文字サイズとして適切であると判断し、1
0ポイントの文字が多数を占めるブロックである、ブロ
ック701からブロック711までの11個のすべての
テキストブロックを本文ブロックとする。
【0042】その後、順次本文テキストブロック内の先
頭文字を識別し、予め定め、HD10に箇条書き識別情
報として格納してある記号や、数値で始まるテキストブ
ロックを抜き出す(S75)。ブロック602は、記号
で始まっているのが最初にみつけられたブロック(最上
ブロック)の箇条書き1スタイルと決定し、ブロック6
02のテキストデータ203に箇条書き1スタイルとい
う属性を、更に箇条書き1スタイルの書式の先頭文字
に、「・」を設定してHD10に記憶する(S77)。
おなじように「・」で始まるブロックもS75で検索し
(S75)、ブロック603、ブロック604、ブロッ
ク610、ブロック611を箇条書き1スタイルとして
先のブロック702と同様にデータを格納する。
【0043】続いて、ブロック606が数値で始まって
いると判別し(S75)、箇条書き2スタイルを設定し
(S76)、箇条書き2スタイルの先頭文字に、「数
値」を設定するS(77)。同じように数値で始まるブ
ロック607、ブロック608も同様に箇条書き2スタ
イルに設定する。
【0044】以上の処理により、文字サイズが異なって
いたり、領域の先頭文字が、記号や数値になっているな
どの、本文と決定した領域と異なる特徴を見つけだし、
それらの領域にスタイルを設定することにより、元の印
刷文書のレイアウトだけでなく、文脈のつながりまでも
忠実に再現してデジタルデータ化することが可能とな
り、文字認識した後のデータの編集を容易にすることが
可能となる。
【図面の簡単な説明】
【図1】本発明に係る装置のシステム・ブロック図
【図2】画像データ構造の例示図
【図3】サンプル画像の図
【図4】画像のブロック抽出結果例示図
【図5】本発明に係る処理フローチャート
【図6】他のサンプル画像と、そのブロック抽出結果例
示図
【図7】本発明に係る第二の処理フローチャート
【図8】本発明に係るネットワークのシステム図

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 入力画像から抽出した複数の文字列の所
    定位置の文字を識別し、 前記識別された文字に従って、その文字を含む文字列の
    スタイルを判定し、 前記判定されたスタイルの書式として、前記識別された
    文字を登録することを特徴とする画像処理方法。
  2. 【請求項2】 前記所定位置は、文字列の先頭文字とす
    ることを特徴とする請求項1に記載の画像処理方法。
  3. 【請求項3】 前記所定位置の文字が、予め登録されて
    いる文字であると識別される場合に、当該文字列のスタ
    イルを前記登録されていた文字に対応するスタイルと判
    定することを特徴とする請求項1に記載の画像処理方
    法。
  4. 【請求項4】 前記所定位置の文字を識別する文字列
    は、予め定めた種類の文字列とすることを特徴とする請
    求項1に記載の画像処理方法。
  5. 【請求項5】 前記スタイルは、箇条書きスタイルとす
    ることを特徴とする請求項1に記載の画像処理方法。
  6. 【請求項6】 入力画像から抽出した複数の文字列の属
    性を識別し、 前記識別された属性の相互関係に従って、各文字列の種
    類を判断し、 前記判断された種類の書式として前記属性を登録するこ
    とを特徴とする画像処理方法。
  7. 【請求項7】 前記識別する文字列の属性は、文字サイ
    ズとすることを特徴とする請求項6に記載の画像処理方
    法。
  8. 【請求項8】 前記文字列の属性を識別する文字列は、
    予め定めた種類以外の文字列とすることを特徴とする請
    求項6に記載の画像処理方法。
  9. 【請求項9】 前記文字列の属性を識別する文字列は、
    本文以外の文字列とすることを特徴とする請求項6に記
    載の画像処理方法。
  10. 【請求項10】 前記入力画像はスキャナより読み取っ
    た画像とすることを特徴とする請求項6に記載の画像処
    理方法。
  11. 【請求項11】 入力画像から抽出した複数の文字列の
    所定位置の文字を識別する文字識別手段と、 前記識別された文字に従って、その文字を含む文字列の
    スタイルを判定するスタイル判定手段と、 前記判定されたスタイルの書式として、前記識別された
    文字を登録する書式登録手段とを有することを特徴とす
    る画像処理装置。
  12. 【請求項12】 前記所定位置は、文字列の先頭文字と
    することを特徴とする請求項11に記載の画像処理装
    置。
  13. 【請求項13】 前記スタイル判定手段は、前記所定位
    置の文字が予め登録されている文字であると識別される
    場合に、当該文字列のスタイルを前記登録されていた文
    字に対応するスタイルと判定することを特徴とする請求
    項11に記載の画像処理装置。
  14. 【請求項14】 前記文字識別手段は、予め定めた種類
    の文字列の所定位置の文字を識別することを特徴とする
    請求項11に記載の画像処理装置。
  15. 【請求項15】 前記スタイルは、箇条書きスタイルと
    することを特徴とする請求項11に記載の画像処理装
    置。
  16. 【請求項16】 入力画像から抽出した複数の文字列の
    属性を識別する属性識別手段と、 前記識別された属性の相互関係に従って、各文字列の種
    類を判断する判断手段と、 前記判断された種類の書式として前記属性を登録する書
    式登録手段とを有することを特徴とする画像処理装置。
  17. 【請求項17】 前記属性識別手段は、属性として、文
    字サイズを識別することを特徴とする請求項16に記載
    の画像処理装置。
  18. 【請求項18】 前記識別手段は、予め定めた種類以外
    の文字列の属性を識別することを特徴とする請求項16
    に記載の画像処理装置。
  19. 【請求項19】 前記識別手段は、本文以外の文字列の
    属性を識別することを特徴とする請求項16に記載の画
    像処理装置。
  20. 【請求項20】 前記画像を入力する画像入力手段を有
    することを特徴とする請求項16に記載の画像処理装
    置。
  21. 【請求項21】 コンピュータにより読み取り可能な記
    憶媒体であって、 入力画像から抽出した複数の文字列の所定位置の文字を
    識別する為の制御プログラムと、 前記識別された文字に従って、その文字を含む文字列の
    スタイルを判定する為の制御プログラムと、 前記判定されたスタイルの書式として、前記識別された
    文字を登録する為の制御プログラムとを記憶したことを
    特徴とする記憶媒体。
  22. 【請求項22】 前記所定位置の文字が、予め登録され
    ている文字であると識別される場合に、当該文字列のス
    タイルを前記登録されていた文字に対応するスタイルと
    判定する為の制御プログラムを記憶したことを特徴とす
    る請求項21に記載の記憶媒体。
  23. 【請求項23】 前記スタイルは、箇条書きスタイルと
    することを特徴とする請求項21に記載の記憶媒体。
  24. 【請求項24】 コンピュータにより読み取り可能な記
    憶媒体であって、 入力画像から抽出した複数の文字列の属性を識別する為
    の制御プログラムと、 前記識別された属性の相互関係に従って、各文字列の種
    類を判断する為の制御プログラムと、 前記判断された種類の書式として前記属性を登録する為
    の制御プログラムとを記憶したことを特徴とする記憶媒
    体。
JP11101980A 1999-04-09 1999-04-09 画像処理方法、装置及び記憶媒体 Withdrawn JP2000293624A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11101980A JP2000293624A (ja) 1999-04-09 1999-04-09 画像処理方法、装置及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11101980A JP2000293624A (ja) 1999-04-09 1999-04-09 画像処理方法、装置及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2000293624A true JP2000293624A (ja) 2000-10-20

Family

ID=14315015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11101980A Withdrawn JP2000293624A (ja) 1999-04-09 1999-04-09 画像処理方法、装置及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2000293624A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003216944A (ja) * 2002-01-23 2003-07-31 Fujitsu Ltd 画像結合装置
JP2005297269A (ja) * 2004-04-08 2005-10-27 Casio Comput Co Ltd 文字出力装置
JP2014086006A (ja) * 2012-10-26 2014-05-12 Toshiba Corp 電子機器および方法
JP2015118488A (ja) * 2013-12-17 2015-06-25 株式会社日本デジタル研究所 会計データ入力システム、方法、およびプログラム
CN113239717A (zh) * 2021-02-26 2021-08-10 北京百度网讯科技有限公司 用于处理题目的方法、装置、设备、介质和程序产品

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003216944A (ja) * 2002-01-23 2003-07-31 Fujitsu Ltd 画像結合装置
JP2005297269A (ja) * 2004-04-08 2005-10-27 Casio Comput Co Ltd 文字出力装置
JP2014086006A (ja) * 2012-10-26 2014-05-12 Toshiba Corp 電子機器および方法
US9025879B2 (en) 2012-10-26 2015-05-05 Kabushiki Kaisha Toshiba Electronic apparatus and handwritten document processing method
JP2015118488A (ja) * 2013-12-17 2015-06-25 株式会社日本デジタル研究所 会計データ入力システム、方法、およびプログラム
CN113239717A (zh) * 2021-02-26 2021-08-10 北京百度网讯科技有限公司 用于处理题目的方法、装置、设备、介质和程序产品

Similar Documents

Publication Publication Date Title
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
US5907835A (en) Electronic filing system using different application program for processing drawing commands for printing
US5428727A (en) Method and system for registering and filing image data
US8139257B2 (en) Document editing apparatus, image forming apparatus, document editing method, and computer program product
JP4970714B2 (ja) 指定されたドキュメント・エリアからのメタデータの抽出
JP4897520B2 (ja) 情報配信システム
US20090110288A1 (en) Document processing apparatus and document processing method
US20080244384A1 (en) Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus
KR100287096B1 (ko) 문서처리방법및문서처리시스템
US6930789B1 (en) Image processing method, apparatus, system and storage medium
JP2000293624A (ja) 画像処理方法、装置及び記憶媒体
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP3537753B2 (ja) 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
JP2000293521A (ja) 画像処理方法、装置及び記憶媒体
JP2000293622A (ja) 画像処理方法、装置及び記憶媒体
JP2000293671A (ja) 画像処理方法、装置及び記憶媒体
JP4329370B2 (ja) 画像データ分類装置及びプログラム
JP2011023836A (ja) スライドデータ作成装置、スライドデータ作成方法及びプログラム
JP2011186835A (ja) 画像処理装置及び画像処理プログラム
JP2001028032A (ja) 画像情報処理装置及びマークシート
JPH08202859A (ja) 電子ファイリング装置及びその方法
JP2993880B2 (ja) 電子ファイル装置
JPH11282873A (ja) 画像データベース検索装置及びその検索方法並びに記録媒体
JPH11203410A (ja) 画像処理方法及び装置及びその記憶媒体
JP4765831B2 (ja) 画像処理システムおよび画像処理プログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060704