JPH05342405A - 文書編集方法及び装置 - Google Patents

文書編集方法及び装置

Info

Publication number
JPH05342405A
JPH05342405A JP4145131A JP14513192A JPH05342405A JP H05342405 A JPH05342405 A JP H05342405A JP 4145131 A JP4145131 A JP 4145131A JP 14513192 A JP14513192 A JP 14513192A JP H05342405 A JPH05342405 A JP H05342405A
Authority
JP
Japan
Prior art keywords
character
document
character image
document data
specified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4145131A
Other languages
English (en)
Inventor
Hiroaki Ikeda
裕章 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP4145131A priority Critical patent/JPH05342405A/ja
Publication of JPH05342405A publication Critical patent/JPH05342405A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 既存文書の文字画像を入力し、予め設定され
ている文書形式に従って、その文字画像を文字認識した
結果である文書データを出力できる文書編集方法及び装
置を提供することを目的とする。 【構成】 文字画像を入力してディスプレイに表示し、
ポインティングデバイスにより、その文字画像の認識範
囲を指定する。この範囲指定された文字画像を文字認識
した文書データの出力形式を予め指定しておくと、指定
された範囲の文字画像の文字を認識し、予め指定されて
いる出力形式に従って認識した文書データを出力する。

Description

【発明の詳細な説明】
【0001】
【産業状の利用分野】本発明は、文字画像を入力し、そ
の入力した文字画像の文字部分を文字認識して文書デー
タを入力する文書編集方法及び装置に関するものであ
る。
【0002】
【従来の技術】近年、日本語ワードプロセッサや卓上の
軽印刷システム等の普及により、手軽に高品位の印刷物
を作成するできるようになった。また、印刷された活字
文字や手書き文字等により作成された既存原稿の文字を
読取り、自動的に文字認識して文字コードに変換するこ
とも、文字認識技術の発達により容易になりつつある。
このような文字認識技術を用いて多量の文字を一度に入
力すると、従来の原稿を読みながらキーボードより一文
字ずつ入力するような、多大な労力を軽減することがで
きる。
【0003】しかし一般に、従来の光学式文字認識装置
は、文字画像を文書コードに置き換えるものであり、ま
ずイメージスキャナ等で文字画像を入力し、自動的に或
いは手動等により文字画像の認識範囲を限定する。そし
て、その限定された範囲内の文字画像を1文字ずつ切り
出し、公知の技術を用いて文字画像を認識し、その認識
した結果である文字コードを出力し、表示あるいはファ
イルとして記憶するように構成されている。また、この
ような文字認識装置では、字下げや空白については、行
内の標準的な文字間隔を求める等して、予測される位置
に文字画像が存在しない場合には、空白として出力する
装置もある。
【0004】
【発明が解決しようとする課題】しかしながら上記従来
例では、文字認識とその認識された結果である文書デー
タの編集処理とは別々に行うように設定されている。こ
のように、文字認識を行った結果である文書データは、
認識対象である文字画像が単に文字コードに置き換わっ
ただけであるため、文書データの編集、例えば文字の大
きさや文字フォントの種類等といった、文字の属性や段
組の数といった文書データの書式やレイアウト等は、そ
の認識された文書データを再度編集する形式でしか指定
することができなかった。
【0005】本発明は上記従来例に鑑みてなされたもの
で、既存文書の文字画像を入力し、予め設定されている
文書形式に従って、その文字画像を文字認識した結果で
ある文書データを出力できる文書編集方法及び装置を提
供することを目的とする。
【0006】
【課題を解決するための手段】上記目的を達成するため
に本発明の文書編集装置は以下の様な構成を備える。即
ち、文字画像を入力し、前記文字画像に含まれる文字部
分を文字認識して文書データを作成する文書編集装置で
あって、文字画像を入力する入力手段と、前記入力手段
により入力された文字画像の範囲を指定する範囲指定手
段と、前記範囲指定手段で指定された文字画像を文字認
識した文書データの出力形式を指定する指定手段と、前
記範囲指定手段で指定された文字画像の文字を認識し、
前記指定手段で指定された出力形式で認識した文書デー
タを出力する文字認識手段とを有する。
【0007】上記目的を達成するために本発明の文書編
集方法は以下の様な工程を備える。即ち、文字画像を入
力し、前記文字画像に含まれる文字部分を文字認識して
文書データを作成する文書編集方法であって、文字画像
を入力する工程と、入力された文字画像の範囲を指定す
る工程と、その指定された文字画像を文字認識した文書
データの出力形式を指定する工程と、指定された文字画
像の文字を認識し、その認識結果である文書データを指
定された出力形式で出力する工程とを有する。
【0008】
【作用】以上の構成において、文字画像を入力し、その
入力した文字画像の範囲を指定する。この指定された文
字画像を文字認識した文書データの出力形式を指定して
おくと、指定された文字画像の文字を認識し、その出力
形式で認識した文書データを出力するように動作する。
【0009】
【実施例】以下、添付図面を参照して本発明の好適な実
施例を詳細に説明する。
【0010】図1は、本実施例の文書編集装置の概略構
成を示すブロック図である。
【0011】図1において、101は装置全体を制御す
るCPU、102はROMで、CPU101が実行する
例えば図2及び図3のフローチャートに示すような処理
の制御プログラムや各種データ等を格納している。10
3はRAMで、スキャナ107や外部記憶装置104よ
り入力した画像データを格納したり、画像データに含ま
れる文字部分の認識結果を格納するため等に用いられる
とともに、CPU101のワークエリアとしても利用さ
れ各種データを一次的に記憶することができる。104
は磁気デイスク等の外部記憶装置である。105はキー
ボードで、文字データや各種機能指示を入力するための
キーを備えている。106はマウスやディジタイザ等の
ポインティングデバイスである。107はスキャナで、
原稿画像を読取り、その読み取った画像データをインタ
ーフェース部108を介してシステムバス113に出力
している。
【0012】109はプリンタで、インターフェース部
110を介して送られてくる画像データに基づいて、記
録紙等の被記録媒体にその画像を記録している。111
はディスプレイで、スキャナ107により読み取られた
画像データを表示すると共に、キーボード105より入
力された文書データ或いはオペレータへの各種メッセー
ジ等を表示している。112は類似度計算部で、例えば
スキャナ107から入力された文字画像を1文字ずつ切
り出し、その切り出された文字画像の特徴を抽出し、各
カテゴリとの類似度を計算している。
【0013】尚、本実施例の文書処理装置における文書
編集機能は、一般的に知られているように、外部記憶装
置104から読み出された文書データはRAM103に
入力されて記憶されるとともにディスプレイ111に表
示される。そして、キーボード105やポインティング
デバイス106より入力される各種指示に従って、CP
U101の制御の下に実行されるものとする。
【0014】図2及び図3は、図1に示された文書編集
装置における、文字認識処理を用いた文書入力処理の流
れを示すフローチャートである。また図4は、入力画像
とテキストとをディスプレイ111に表示する画面の表
示例を示す図である。この表示画面上で、メニュー部分
に表示されている各項目401〜407のそれぞれをポ
インティングデバイス106で指示することにより、そ
の指示された項目に対応する処理を行うことが可能とな
る。
【0015】図2のフローチャートは、メニューの項目
「終了」407が指示されるまで実行され、ステップS
24で「終了」が指示された時点で、この処理プログラ
ムが終了する。まずステップS1で、ポインティングデ
バイス106により「画像入力」401が指示されたか
どうかを調べ、項目「画像入力」401が指示されると
ステップS2に進み、スキャナ107を起動して原稿画
像データの読取りを開始し、その読み取った画像データ
はCPU101の制御の下にインターフェース部108
を介してRAM103に送られて記憶される。また、こ
の画像データはディスプレイ111にも表示される。
【0016】次にステップS4では、メニュー項目「認
識範囲指定」402が指示されたかどうかを調べ、「範
囲指定」402が指示された時はステップS5に進み、
他の指示がされるまで範囲指定処理が続けられる。ステ
ップS6で、ポインティングデバイス106によりディ
スプレイ111上の2点が指定されると、その座標値を
RAM103に記憶し、次にステップS7で、これら2
点を対角とする矩形を指定範囲とし、ディスプレイ11
1にその矩形を描く。
【0017】次にステップS8で、項目「属性設定」4
03が選択されるとステップS9に進み、他の指示がさ
れるまで処理が続けられる。ステップS10で、ディス
プレイ111上の1点が指定されると、その点を含む指
定範囲の属性の変更ができるようになる。次にステップ
S11に進み、指定された範囲の属性変更を行う。この
属性の変更処理は、その範囲の近くに設定ウインドを表
示して行うこの設定用ウインドウの表示例を図4に示
す。
【0018】図4では、入力画像の領域502にカーソ
ル200が移動されて、その領域50内が指示されるこ
とにより、領域502の属性の設定をウインドウ503
を用いて行っている。この属性の指定には、図示のよう
に文字サイズの大小、文字間の長さ(文字ピッチ)、文
字種(明朝、ゴシック等)等を指定できるものとする。
【0019】次にステップS13で、メニューの項目
「認識」404が指示されて文字認識処理が指定される
とステップS14に進み、例えば図4の指定された範囲
502内の文字画像データを1文字ずつ切り出し(ステ
ップS15)、その切り出した文字画像データの類似度
を類似度計算部112で求める(ステップS16)。次
にステップS17で、その類似度が最大であるカテゴリ
を、前述の属性の指示処理により設定された属性に従っ
てディスプレイ111のテキスト部分に表示する。
【0020】次にステップS18で、メニュー項目の
「印刷」405が指示されるとステップS19に進み、
ディスプレイ111に表示されている文書データがある
かどうかを調べ、表示文書がある時はステップS20に
進み、その文書データをプリンタ109に出力する。ま
た、ステップS21でメニュー項目の「ファイル化」が
指示されるとステップS22に進み、ディスプレイ11
1に表示されている文書データがあるかどうかを調べ、
表示文書がある時はステップS23に進み、その文書デ
ータを外部記憶装置104に出力する。また、設定され
た範囲、属性を保有して記憶しておく機能や、こうして
保存され記憶された範囲や属性を呼び出す機能を前述の
実施例に付加することにより、メニュー画面を用いた各
種設定作業の工程を減少させることもできる。
【0021】また本実施例に従えば、入力した文字画像
の文字認識を行う前に、出力文書の書式等を決定するこ
ととが可能となり、従来例の様に認識した段階での文字
の羅列を編集するのに比べて編集作業がし易く、かつ文
字認識後、直に所望の文書形式の文書データが得られる
という効果がある。
【0022】尚、前述したメニューの項目やメニュー項
目の選択操作の方法等については本実施例で説明した事
項に限定されるものでなく、例えば属性の指定範囲はメ
ニューからではなく、指定された範囲のワークエリアを
ポインティングデバイス106で指示する等の方法をと
っても良い。
【0023】図6、図7、図8は、本発明の他の実施例
の文書編集装置における、文字認識を行って文字を入力
する処理の流れを示すフローチャートで、前述の図2及
び図3のフローチャートと共通する部分は同じステップ
番号で示し、それらの説明を省略する。
【0024】ステップS61〜S69の処理は、文字認
識を行い、その結果をテキストとして出力するテキスト
の書式を認識前に予め決定しておく処理を示している。
【0025】図9は、この実施例におけるディスプレイ
111の表示画面例を示す図で、メニュー項目には「書
式設定」の項目701が追加して示されている。
【0026】この項目701をポインティングデバイス
105で指示することによりステップS62に進み、図
9の書式設定に対するメニュー702を表示し、前述し
たように既に登録されている属性情報の呼び出しが指示
されたかを調べ、そうであればステップS63に進み、
その指示された登録属性を読み出して新たな属性として
設定する。ステップS62で属性の呼びだし処理でない
時はステップS64に進み、個別の設定指示かどうかを
調べ、そうであればステップS65に進み、テキスト画
面411に文字を表示・出力する位置を決定する。図9
の例では、テキスト画面411の上部にタイトル欄とし
て601を指定し、本文の領域602を指定している。
【0027】次にステップS66に進み、ステップS6
5で指定した出力位置の文字サイズや文字種等の属性情
報を設定する。この指定用のメニュー画面は、図9のウ
インドウ603で示されている。次にステップS67に
進み、ステップS65で指定された位置に流し込む文字
を、入力画素の認識指定範囲から選択する。ステップS
68では、このテキスト全体の書式を登録する指示が入
力されたかを判定し、この指示が入力されると、この登
録した書式を保存し、随時呼び出して使用することが出
来るようになる。尚、前述のステップS62、S64及
びS68の指示は、図9のメニュー欄702を用いて、
ポインティングデバイス106により指示される。
【0028】尚、図9において、604,605,60
6は、前述のステップS4で指示された文字認識の範囲
を示しており、その範囲の認識された文字が、テキスト
欄411のどの部分に流し込まれるかが、テキスト欄4
11の各領域601,602の左上に数字で表示してい
る。
【0029】以上説明したように、この実施例によれ
ば、予め決められている書式に文字認識した文書データ
を編集、或いは清書する場合、文字認識された結果がそ
のまま指定された書式の文書として作成されるため、文
字認識後の編集作業を行わなくてもよく、認識結果に基
づく文書データの編集作業量が大幅に軽減される。
【0030】尚、本発明は複数の機器から構成されるシ
ステムに適用しても、1つの機器からなる装置に適用し
ても良い。また、本発明はシステム或は装置に、本発明
を実施するプログラムを供給することによって達成され
る場合にも適用できることはいうまでもない。
【0031】以上説明したように本実施例によれば、文
字認識を行う前に、その文字認識されて出力される文書
データの属性やレイアウト等を予め決定しておくだけ
で、文字認識された文書が所望の文書として出力され
る。これにより既存文書や下書き文書を入力して、所望
の文書レイアウトに変更する等の文書編集の作業が大幅
に軽減される効果がある。
【0032】
【発明の効果】以上説明したように本発明によれば、既
存文書の文字画像を入力し、予め設定されている文書形
式に従って、その文字画像を文字認識した結果である文
書データを出力できる効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の文書編集装置の概略構成を
示すブロック図である。
【図2】本発明の一実施例の文書編集装置における範囲
指定、属性指示等の文字認識処理を示すフローチャート
である。
【図3】本発明の一実施例の文書編集装置における範囲
指定、属性指示等の文字認識処理を示すフローチャート
である。
【図4】本実施例の文字認識装置におけるメニュー表示
画面例を示す図である。
【図5】本実施例の文字認識装置における入力画像を文
字認識して出力する属性を設定する処理時の表示画面例
を示す図である。
【図6】本発明の他の実施例の文書編集装置における範
囲指定、属性指示等の文字認識処理を示すフローチャー
トである。
【図7】本発明の他の実施例の文書編集装置における範
囲指定、属性指示等の文字認識処理を示すフローチャー
トである。
【図8】本発明の他の実施例の文書編集装置における範
囲指定、属性指示等の文字認識処理を示すフローチャー
トである。
【図9】他の実施例の書式設定を行う際の表示画面例を
示す図である。
【符号の説明】
101 CPU 102 ROM 103 RAM 104 外部記憶装置 105 キーボード 106 ポインティングデバイス 107 イメージスキャナ 109 プリンタ 111 ディスプレイ 112 類似度計算部 410 入力画像領域 411 テキスト領域

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文字画像を入力し、前記文字画像に含ま
    れる文字部分を文字認識して文書データを作成する文書
    編集装置であって、 文字画像を入力する入力手段と、 前記入力手段により入力された文字画像の範囲を指定す
    る範囲指定手段と、 前記範囲指定手段で指定された文字画像を文字認識した
    文書データの出力形式を指定する指定手段と、 前記範囲指定手段で指定された文字画像の文字を認識
    し、前記指定手段で指定された出力形式で認識した文書
    データを出力する文字認識手段と、 を有することを特徴とする文書編集装置。
  2. 【請求項2】 前記指定手段で指定された出力形式を記
    憶する記憶手段と、前記記憶手段に記憶されている出力
    形式を読出し、デフォルト値として設定する書式設定手
    段を更に有することを特徴とする請求項1に記載の文書
    編集装置。
  3. 【請求項3】 文字画像を入力し、前記文字画像に含ま
    れる文字部分を文字認識して文書データを作成する文書
    編集装置であって、 文字画像を入力する入力手段と、 前記入力手段により入力された文字画像を表示し、前記
    文字画像の範囲を指定する範囲指定手段と、 前記範囲指定手段で指定された文字画像を文字認識した
    結果を、文書データのどの領域に出力するかを指定する
    指定手段と、 前記範囲指定手段で指定された文字画像の文字を認識
    し、前記指定手段で指定された文書データの領域に出力
    する文字認識手段と、 を有することを特徴とする文書編集装置。
  4. 【請求項4】 前記指定手段は文書データの領域ととも
    に、該領域に出力する文書データの書式をも指定するこ
    とを特徴とする請求項3に記載の文書編集装置。
  5. 【請求項5】 文字画像を入力し、前記文字画像に含ま
    れる文字部分を文字認識して文書データを作成する文書
    編集方法であって、 文字画像を入力する工程と、 入力された文字画像の範囲を指定する工程と、 その指定された文字画像を文字認識した文書データの出
    力形式を指定する工程と、 指定された文字画像の文字を認識し、その認識結果であ
    る文書データを指定された出力形式で出力する工程と、 を有することを特徴とする文書編集方法。
JP4145131A 1992-06-05 1992-06-05 文書編集方法及び装置 Withdrawn JPH05342405A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4145131A JPH05342405A (ja) 1992-06-05 1992-06-05 文書編集方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4145131A JPH05342405A (ja) 1992-06-05 1992-06-05 文書編集方法及び装置

Publications (1)

Publication Number Publication Date
JPH05342405A true JPH05342405A (ja) 1993-12-24

Family

ID=15378127

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4145131A Withdrawn JPH05342405A (ja) 1992-06-05 1992-06-05 文書編集方法及び装置

Country Status (1)

Country Link
JP (1) JPH05342405A (ja)

Similar Documents

Publication Publication Date Title
JP3471854B2 (ja) 文字処理装置及びその方法
JPH05342405A (ja) 文書編集方法及び装置
JP3076348B2 (ja) 文書整形装置及び文書整形方法
JPH103516A (ja) 情報処理方法及び装置
JP2851840B2 (ja) 文書処理装置
JP3154790B2 (ja) 光学的文字読取装置
JP3404770B2 (ja) 文書処理装置
JP2764944B2 (ja) 文字出力装置
JP2974638B2 (ja) 文書処理装置及び方法
JPH103371A (ja) 頁レイアウト比較装置と頁レイアウト表示装置
JPS61229161A (ja) 文書作成編集装置
JPH0749851A (ja) 文書整形装置
JPH08293033A (ja) 情報処理装置
JPH11110372A (ja) 文書編集装置及びその文書編集方法並びに記録媒体
JPH03161861A (ja) 表作成機能を備えた文書処理装置
JPS605470B2 (ja) 組版システム
JPH07230453A (ja) 文書処理装置及び文書処理方法
JPH08171555A (ja) ワードプロセッサ装置
JPH01216462A (ja) 文書作成装置
JPH0520493A (ja) 画像処理装置
JPH03147017A (ja) 画像処理装置
JPH0573548A (ja) 文書整形装置
JPH0573544A (ja) 文章編集装置
JPH0589096A (ja) 文書処理方法
JPH10320393A (ja) 文書編成方式

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990831