JPH117493A - 文字認識処理装置 - Google Patents

文字認識処理装置

Info

Publication number
JPH117493A
JPH117493A JP9158341A JP15834197A JPH117493A JP H117493 A JPH117493 A JP H117493A JP 9158341 A JP9158341 A JP 9158341A JP 15834197 A JP15834197 A JP 15834197A JP H117493 A JPH117493 A JP H117493A
Authority
JP
Japan
Prior art keywords
character
page
image data
unit
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9158341A
Other languages
English (en)
Inventor
Mitsuru Fujiwara
満 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP9158341A priority Critical patent/JPH117493A/ja
Publication of JPH117493A publication Critical patent/JPH117493A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 複数ページにわたる文章をスキャナーで読み
込み、活字認識する場合、最初のページの行の切り出し
情報、文字の切り出し情報を有効活用して、2ページ目
以降のページの文字の切り出しを大幅に簡略化する。 【解決手段】 スキャナ部1から読み取った文章Cの画
像データを記憶装置2から制御部8のメモリへ読み込
み、その画像データが最初のページであれば、画像の傾
きを補正した後、行の切り出し、文字の切り出しを行
い、これにより1文字の大きさの枠Lを決定する。次い
で、最初のページと後続のページとの位置合わせのため
の指標として原始点pを抽出し、これを用いて原点oを
抽出し、その結果を以って認識を開始する。最初のペー
ジに検出した文字枠データは文字枠データ記憶部5に記
憶する。2ページ目以降は決定した文字枠Lを利用し、
原点oの位置合わせを行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、スキャナ等の読取
手段から読み取った文章データを一旦、ハードディスク
等の記憶手段に格納し、全てのページの読み取りを完了
した後、まとめてその画像データから活字文字を認識
し、その結果を記憶する機能を有する文字認識処理装置
に関するものである。
【0002】
【従来の技術】従来、この種の文字認識処理装置は、ス
キャナ等の読取手段から読み取った画像データを、縦方
向に画像データの有無を集積することで行の切り出しを
行い、その切り出した1行毎に、横方向に画像データの
有無を集積することで文字の切り出しを行っており、こ
れによって切り出した文字毎に活字文字認識処理を行っ
ていた。
【0003】このような文字の切り出し方法による従来
の処理形態では、認識対象の1文字のデータを画像デー
タの中から抽出するのに多くの時間を要し、しかも、複
数ページの文書を処理する場合にも、この処理形態で全
てのページ、全ての行、全ての文字に対して行っていた
ため、文字の認識よりも文字の切り出しに多くの時間を
要することが問題となっていた。
【0004】
【発明が解決しようとする課題】また、この種の文字認
識処理装置の先行技術例である特開平6−325216
号公報には数通りの文字の切り出しの方法が開示されて
いるが、各ページ毎に同じ処理を繰り返し、最初のペー
ジで検出した行間の情報及び文字間の情報は、それ以降
のページに活用されることはなかった。
【0005】このため、全ページにわたって行間、文字
間隔が同一の書式パターンとなっている文書であって
も、それぞれのページで行の切り出し、文字の切り出し
を繰り返さなければならない。したがって、最初のペー
ジの行の切り出し及び文字の切り出しに要した時間は、
それ以降のページの行の切り出し及び文字の切り出しに
も要し、このことが最終的な認識結果を得るまでの時間
の短縮の妨げになっていた。
【0006】本発明は、上記のような活字文字の認識処
理を行ううえで、その時間短縮の妨げの要因となる文字
の切り出しに関わる問題点を解決するもので、複数ペー
ジにわたる文章をスキャナーで読み込み、活字認識する
場合、最初のページの行の切り出し情報、文字の切り出
し情報を有効活用して、2ページ目以降のページの文字
の切り出しを大幅に簡略化し、その時間短縮を図った文
字認識処理装置を提供することを目的とするものであ
る。
【0007】
【課題を解決するための手段】本発明の文字認識処理装
置は、活字からなる文書を画像データとして取り込む読
取手段と、この読取手段から読み込んだ複数ページにわ
たる画像データを1ページ毎に行の切り出し及び文字の
切り出しを行う切り出し手段と、この切り出し手段によ
り切り出し処理された文字群の認識処理を行う認識処理
手段と、前記画像データ及び前記認識処理手段による認
識結果を表示する表示手段とを具備している。
【0008】そして、上記目的を達成するために本発明
では、前記切り出し手段で作成された最初のページの切
り出し情報を格納する切り出し情報記憶手段と、この切
り出し情報記憶手段に格納された最初のページの画像の
原点と後続ページの画像の原点との位置合わせを行う切
り出し情報処理手段を設けることにより、読取手段から
読み込んだ画像データに対する行の切り出し及び文字の
切り出し情報として最初のページに対して得たデータを
2ページ目以降に活用し、2ページ目以降の文字の切り
出しの高速化を図るようにしている。
【0009】ところで、文書を読取手段から読み込むと
き、操作の不手際等によって読み込んだ画像データが傾
いた状態となる場合が往々にして生じる。そこで本発明
では、上記構成において、前記読取手段から読み込んだ
複数ページにわたる画像データから前記読取手段が傾い
た状態で読み込んだ画像データを検出して、各ページ毎
にその傾きを補正する傾き補正手段を設け、この傾き補
正手段での処理を終えた後、切り出し手段の処理に移行
するように構成している。
【0010】この構成では、傾いて読取手段から入力し
た画像に対しても、その傾き角度を検出し、その角度分
を逆方向に回転させて傾きのない画像にしたうえで、最
初のページの文字の切り出しデータを用いて文字の切り
出しを高速化することが可能となり、2ページ目以降の
文字切り出し時間短縮を実現することができる。
【0011】また、読取手段から読み込んだ画像データ
が逆さになっていないこと等の確認を行うため、1度は
活字認識する前に読み込みデータをオペレータが見るの
が―般的であるが、この作業習慣を積極的に利用すれ
ば、オペレータが画像データに文字にあった文字枠を被
せることで認識装置に文字の切り出し情報を予め与え、
2ページ目以降には、その際の情報を自動的に活用し、
文字の切り出し時間の短縮を図ることが可能となる。
【0012】そこで本発明では、前記読取手段から読み
込み表示手段の画面上に映し出された画像データにおけ
る最初のページの文章に対し切り出し手段で得られた切
り出し情報に基づいて1文字毎の枡目を生成する枠座標
生成手段を備え、前記表示手段の画面上の画像データに
前記枡目が被せられることによって行の切り出し及び文
字の切り出しが可能に構成しており、これによって読み
込んだ画像データに対しオペレータが枡目を被せる形
で、装置に対して1文字の枠を知らせることにより、文
字の切り出しを簡単化し、高速化を図るようにしてい
る。
【0013】また、この構成では、オペレータによって
画像データに枡目を被せるのは、最初のページのみと
し、2ページ目以降は1ページ目のデータに基づいて文
字の切り出しを行うことができるため、枡目を被せる作
業が不要となる。
【0014】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しながら説明する。図1は本実施形態の構成を示
している。この図に示す文字認識処理装置は、読取手段
としてのスキャナ部1、装置外部に設けた記憶装置2、
切り出し手段としての行の切り出し部3及び文字の切り
出し部4、切り出し情報記憶手段としての文字枠データ
記憶部5、認識処理手段としての認識部6、入力部7、
情報処理手段を含む制御部8、後処理部9、表示部1
0、及び認識辞書11と単語辞書12により構成されて
いる。
【0015】スキャナ部1は活字からなる文書Cを画像
データとして取り込む。記憶装置2はハードディスク等
により構成されており、スキャナ部1から取り込んだ複
数ページにわたる画像データを一旦、格納する。行の切
り出し部3は記憶装置2に画像データを取り込み終わっ
た後に文書Cを1ページずつ処理する。文字の切り出し
部4は行の切り出し部3において、行の切り出し処理を
実行した後、それぞれの行中の文字列を構成する各文字
の切り出しを行う。
【0016】文字枠データ記憶部5は1ページ目(最初
のページ)の枠データを記憶する。認識部6は行の切り
出し部3と文字の切り出し部4とにより切り出し処理さ
れた文字群を認識辞書11に基づいて1文字毎に認識す
る。入力部7はオペレータが所要の操作を行うためのキ
ーボード、ペン、マウス等を備えている。
【0017】制御部8はスキャナ部1、行の切り出し部
3、文字の切り出し部4、文字枠データ記憶部5、認識
部6、入力部7、後処理部9及び表示部10の各部を制
御する。後処理部9は各文字を認識した後に単語辞書1
2に基づいて単語単位で認識結果の正否をチェックす
る。表示部10は認識結果をオペレータが確認するため
に設けられたもので、陰極線管や液晶表示パネルにより
構成されている。
【0018】上記構成の文字認識処理装置では、複数ペ
ージを有する文書Cをスキャナ部1で画像データとして
取り込んで、一旦、記憶装置2に格納し、文書Cの全ペ
ージの格納を完了した後、行の切り出し部3において該
文書Cの最初のページの行の切り出し処理を行い、次い
で、文字の切り出し部4において、各行の文字の切り出
しを行う。そして、文字枠データ記憶部5において、文
書Cの2ページ目以降の文字の切り出しを簡単化するた
めに1ページ目の枠データを記憶する。
【0019】このようにして最初のページの枠データの
作成を終えると、認識部6において認識辞書11に基づ
いて1文字毎に認識し、さらに、後処理部9において単
語辞書12に基づいて単語単位で認識結果の正否をチェ
ックし、その結果を表示部10に表示する。
【0020】図2は行の切り出し部3の処理の様子を示
している。行の切り出し部3では、読み込んだ画像デー
タに対し、縦方向に画像データを加算して、画像の集ま
った部分と画像の存在しない部分を区別し、画像の存在
しない部分を行の隙間であると判断する。図2におい
て、1行目から順に「あいうえお」、「かきくけこ」、
「さしすせそ」と並ぶ文字列がある場合に、画像の集ま
った部分である各行の文字列部分は画像データの信号値
が「高」となり、画像の存在しない部分である行間の隙
間部分は画像データの信号値が「低」となる。
【0021】このとき、画像データによっては、画像中
にゴミのような微小な画像が入ることがあるので、必ず
しも図2に示す信号I1のような整った信号形態となら
ない場合がある。このため、行の切り出し部3では、画
像の有無は、画像存在の基準となる閾値t1を設定し、
その閾値t1以上であれば画像が存在する、また、その
閾値t1以下であれば画像が存在しないと判断する。
【0022】図3は文字の切り出し部4の処理の様子を
示している。文字の切り出し部4では、行の切り出し部
3によって切り出された各行に対し、横方向に画像を加
算して、画像の集まった部分と画像の存在しない部分と
を区別し、画像の存在しない部分を文字間の隙間である
と判断する。図3において、1行目の文字列「あいうえ
お」について言えば、画像の集まった部分は画像データ
の信号値が「高」となり、画像の存在しない部分である
行間の隙間部分は画像データの信号値が「低」となる。
【0023】この文字の切り出し部4においても、画像
中のゴミのような微小な画像の有無は、図4に示す画像
データの信号I2に関して画像存在の基準となる閾値t2
を設定し、その閾値t2以上であれば画像が存在する、
また、その閾値t2以下であれば画像が存在しないと判
断する。
【0024】本実施形態では1ページ目の枠データを2
ページ目以降に活用するために、1ページ目の原点と2
ページ目の原点の位置合わせを行っている。すなわち、
図4は文字枠データ記憶部5での2ページ目における1
ページ目の画像データとの原点合わせの様子を示してい
る。
【0025】この図において、画像の左隅を原点とした
場合、例えば左隅の3列、3行についての行の切り出
し、文字の切り出しを行ったときの最初の行と文字の1
文字目(1列目)の交点を原始点pとする。この原始点
pは最初の1行目1文字目の枠の中点であり、且つ、文
字枠の大きさは枠データ中で全て同一サイズに決定され
ているのから、1文字目の枠の左上隅の座標は容易に割
り出すことができる。この座標を各画像の原点oとす
る。
【0026】図5は文字を切り出した後の2ページ目に
おける文字切り出しデータの枠座標の一例を示してい
る。図中、は(0,0)、(0,Y)、(X,Y)、(X,0)の座標で囲
まれる枠により文字「あ」が切り出されたことを示す。
は(X,0)、(X,Y)、(2X,Y)、(2X,0)の座標で囲まれる枠
により文字「い」が切り出されたことを示す。同様に
は(0,Y)、(0,2Y)、(X,2Y)、(X,Y)の座標で囲まれる枠に
より文字「か」が切り出されたことを示す。
【0027】図6は表示部10に表示した画像データに
対し、オペレータが文字枠Lを被せた状態を示してい
る。この図に示すように、1つの枠Lに1つの文字が入
るように文字枠Lを被せることにより、制御部8が文字
の切り出しの繁雑な計算を実行しなくても、各文字の入
っている枠Lを判断することができる。
【0028】図7は被せる文字枠Lを示している。この
図に示すように、各文字枠Lを囲む座標値が認識される
ことにより、文字の切り出しの計算をしなくとも、画像
データの中から各文字を切り出すことかできる。
【0029】図8は文字枠データ記憶部5の構成例を示
している。この図に示すように、文字枠データ記憶部5
は、2ページ目以降の文字の切り出しを簡単化するため
に、1ページで検出した文字の枠データ及び原点oを格
納する。具体的には、文字枠Lの横方向(X軸)の幅と
縦方向(Y軸)の幅、及び画像の位置決めのための原点
座標データを格納する。
【0030】図9は画像データの傾き補正の様子を示し
ている。この図に示すように、スキャナ部1から読み取
った画像データIが傾いているのを検出された場合に、
画像データIを傾いている方向とは逆方向に回転させ
て、傾きを補正する。この後、2ページ目以降であれ
ば、図4に示したように原点oの位置合わせを実行後、
1ページ目で得た枠データを適用し文字の枠Lを決定す
る。
【0031】図10は装置内部での行の切り出し、文字
の切り出しを行う場合の処理の流れを示している。ま
ず、ステップ#100でスキャナ部1から読み取った複
数ページにわたる文章Cの画像データを一旦格納してい
る記憶装置2から制御部8のメモリへ読み込み、ステッ
プ#105で、その画像データが1ページ目か否かを判
定し、1ページであれば、ステップ#110で画像の傾
きを補正した後、ステップ#115で行の切り出しを行
う。
【0032】ステップ#115では、メモリに展開した
画像データを図2に示したように縦方向に画像データを
加算すると、データが多くある部分、無い部分と区分で
きる。この画像データがある部分の集まりが1行と判断
できる。これにより行の切り出しを行う。また、行の切
り出しが完了すると、ステップ#120で文字の切り出
しを行う。
【0033】ステップ#120では、切り出した行毎に
横方向に画像データを加算すると、各文字毎に画像デー
タが多く存在する部分と存在しない部分とを区分するこ
とができる。この画像データが集まった部分を1文字と
判定し、画像データの存在しない部分を文字と文字の区
切りと判定する。これにより文字の切り出しを行う。こ
のように行の切り出しと文字の切り出しを行うことによ
り、1ページ目の画像データのなかの1文字の大きさを
定めることが可能となる。
【0034】この場合の文字切り出しデータの枠座標は
前掲の図5に示すようになり、1文字の大きさの枠Lを
決定できる。また、各文字の枠Lの大きさは原点(0,0)
からの座標により決定することができ、前掲の図7は各
文字枠Lの座標例を示している。
【0035】次いで、ステップ#125では2ページ目
以降の画像との位置合わせのため、原始点pを抽出した
後、原点oを抽出する。すなわち、ステップ#125で
は、後続のページとの位置合わせのための指標として原
始点pを抽出し、これを用いて原点oを抽出し、ステッ
プ#130ではその結果を以って認識を開始する。この
1ページ目に検出した文字枠データは文字枠データ記憶
部5に前掲の図8の構成をもって記憶する。
【0036】また、2ページ目以降は1ページ目におい
て図7に示すように、各文字枠Lの大きさが決定できて
いるので、ステップ#140で原点oの位置合わせを行
う。この場合、スキャナ部1から読み込んだ画像データ
が傾いているような場合に、ステップ#135でステッ
プ#110と同様にして画像の傾き補正を行うだけで文
字の切り出しを行うことができる。
【0037】なお、読み込んだ画像データの傾き補正に
関しては、まず傾きの程度を検出することが必要である
が、この傾き角度検出方法は例えば特開平7−3346
18号公報等において開示されている手法を用いること
ができる。そして、画像データの傾き角度を検出した
後、その角度分だけ、逆方向に回転することにより、傾
きのない正しい画像データを得ることができる。
【0038】ステップ#140の処理手順について、更
に詳細に説明すると、2ページ目については、まず左上
隅に原点oが存在することを前提とし、図4に示すよう
に、左上隅の縦3行、横3文字を原点o抽出のために用
いる。原点o抽出のための縦行数、横文字数は予めオペ
レータが定めることができるものとする。
【0039】ステップ#140の原点oの抽出は、縦方
向に画像データの加算した結果と横方向に画像データの
加算した結果とを用いて図4に示すように、画像の1行
目と1文字目(1列目)を割り出し、その交点を原始点
pとする。さらに、その原始点pは1行目の1文字目の
中心点であることから、その1文字目の枠Lの左上頂点
が2ページ目の原点oとして得ることができる。
【0040】原点oを抽出した後は、図8に示したデー
タを読み込む。このデータは文字枠データ記憶部5に格
納したデータ、すなわち1ページ目で得た行のデータ及
び文字のデータであるところの各文字の枠Lの大きさに
対応するものである。この文字の枠Lのデータを読み込
んだ後、図5に示すように、文書画像の各文字の切り出
しを行う。画像の中で各文字の枠Lの座標、例えば図5
における1行目2文字目の枠Lは、(X,0)、(2X,0)、(X,
Y)、(2X,Y)の座標で囲まれる領域に「い」という文字が
切り出され、2行目3文字目の枠Lは図5に示すよう
に、(2X,Y)、(3X,Y)、(2X,2Y)、(3X,2Y)の座標で囲まれ
る領域に「く」が切り出される。
【0041】図11はオペレータが1ページ目に表示部
10を用いて図6に示すように画像データに枠Lを被
せ、それにより認識部6に対して文字枠情報を与え、そ
れをもとに文字の切り出しを行う場合の処理の流れを示
している。まず、ステップ#200でスキャナ部1から
読み取った複数ページにわたる文章Cの画像データを一
旦格納している記憶装置2から制御部8のメモリへ読み
込み、ステップ#205で、その画像データが1ページ
目か否かを判定し、1ページであって、画像が傾いてい
る場合は、ステップ#210で図9に示すように画像の
傾きを補正する。
【0042】1ページ目ではステップ#215で、オペ
レータが表示部10の画面を確認しながら入力部7を操
作し、図6に示すように、画像に文字枠Lを被せ、各文
字の大きさを制御部8に伝える。これにより制御部8は
文字の切り出しの計算は行わずに図7に示すような文字
枠Lを検出し、そのデータを図8に示すような形態で、
文字枠データ記憶部5に記憶させる。この後、ステップ
#220で原点oを抽出し、ステップ#225では、認
識部6によって、これまでの情報により認識を実行す
る。
【0043】ステップ#205で2ページ目以降である
と判定したときは、ステップ#230で画像の傾き補正
を行った後、ステップ#235で図4に示すように原点
oの抽出を行う。この場合、1ページ目の原点oと位置
合わせすることにより、図7に示す1ページ目の文字粋
が使用可能となり、文字の切り出し処理の計算は不要に
なる。
【0044】すなわち、2ページ目においては1ページ
目において各文字枠Lの大きさが図7に示したように決
定できているので、そのデータを原点oの位置合わせ及
びスキャナ部1から読み込んだ画像データが傾いている
ような場合に、ステップ#230で、図9に示すように
その傾き補正を行うだけで文字の切り出しを実行するこ
とができる。
【0045】ステップ#235の処理手順について、更
に詳細に説明すると、2ページ目については、まず左上
隅に原点oが存在することを前提とし、図4に示すよう
に、左上隅の縦3行、横3文字を原点o抽出のために用
いる。原点o抽出のための縦行数、横文字数は予めオペ
レータが定めることができるものとする。
【0046】ステップ#235の原点oの抽出は、縦方
向に画像データの加算した結果と横方向に画像データの
加算した結果とを用いて図4に示すように、画像の1行
目と1文字目(1列目)を割り出し、その交点を原始点
pとする。さらに、その原始点pは1行目の1文字目の
中心点であることから、その1文字目の枠Lの左上頂点
が2ページ目の原点oとして得ることができる。
【0047】原点oを抽出した後は、図8に示したデー
タを読み込む。このデータは文字枠データ記憶部5に格
納したデータ、すなわち、1ページ目で得た行のデータ
及び文字のデータであるところの各文字の枠Lの大きさ
に対応するものである。この文字の枠Lのデータを取り
込んだ後、図7に示す文字の枠Lを用いて文書画像の各
文字の切り出しを行う。画像の中で各文字の枠Lの座
標、例えば図5における1行目2文字目の枠Lは、(X,
0)、(2X,0)、(X,Y)、(2X,Y)の座標で囲まれる領域に
「い」という文字が切り出され、2行目3文字目の枠L
は図5に示すように、(2X,Y)、(3X,Y)、(2X,2Y)、(3X,2
Y)の座標で囲まれる領域に「く」が切り出される。
【0048】
【発明の効果】以上説明したように本発明の請求項1に
よるときは、複数ページからなる文章を認識する場合、
最初のページの認識の際に行った行の切り出し及び文字
の切り出し情報を格納し、その画像の原点と後続ページ
の画像の原点との位置合わせを行うようにしているの
で、読取手段から読み込んだ画像データに対する行の切
り出し及び文字の切り出し情報を最初のページに対して
得たデータを2ページ目以降の後続ページにも活用する
ことができ、これによって後続ページの行の切り出し、
文字の切り出しの高速化による作業時間短縮を実現する
ことができる。
【0049】請求項2によるときは、読取手段から読み
込んだ複数ページにわたる画像データから前記読取手段
が傾いた状態で読み込んだ画像データを検出して、各ペ
ージ毎にその傾きを補正し、その処理を終えた後、切り
出し手段の処理に移行するようにしているので、傾いて
読取手段から入力した画像に対しても、その傾き角度を
検出し、その角度分を逆方向に回転させて傾きのない画
像にしたうえで、最初のページの文字の切り出しデータ
を用いて文字の切り出しを高速化することができる。
【0050】請求項3によるときは、読取手段から読み
込み、表示手段の画面上に映し出された画像データにお
ける1ページ目の文章に対し切り出し手段で得られた切
り出し情報に基づいて1文字毎の枡目を生成する枠座標
生成手段を備え、前記表示手段の画面上の画像データに
前記枡目が被せられることによって行の切り出し及び文
字の切り出しが可能に構成しているので、一般的に活字
認識に先立って行われている読み込み画像データの確認
時に、オペレータが画像データに文字にあった枡目を被
せることで、装置に文字の切り出し情報を予め与えるこ
とができる。したがって、文字の切り出しを簡単化し、
高速化を図ることができる。
【0051】また、オペレータによって画像データに枡
目を被せるのは、最初のページのみとし、2ページ目以
降には、最初のページのデータに基づいて文字の切り出
しを行うことができるため、枡目を被せる作業が不要と
なり、文字の切り出し時間を短縮することができる。
【図面の簡単な説明】
【図1】 本発明の実施の形態に係る文字認識処理装置
の全体構成を示すブロック図。
【図2】 行の切り出しを説明するための図。
【図3】 文字の切り出しを説明するための図。
【図4】 2ページ目における1ページ目のデータとの
原点合わせを説明するための図。
【図5】 2ページ目における文字切り出しデータの構
成例を示す図。
【図6】 画像に被せる枠の一例を示す図。
【図7】 枠座標の一例を示す図。
【図8】 文字枠データ記憶部の構成を示す図。
【図9】 画像データの傾き補正を説明するための図。
【図10】 請求項1、2に対応する処理の流れを示す
フローチャート。
【図11】 請求項2、3に対応する処理の流れを示す
フローチャート。
【符号の説明】
1 スキャナ部 2 記憶装置 3 行の切り出し部 4 文字の切り出し部 5 文字枠データ記憶部 6 認識部 7 入力部 8 制御部 9 後処理部 10 表示部 11 認識辞書 12 単語辞書 C 文書

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 活字からなる文書を画像データとして取
    り込む読取手段と、この読取手段から読み込んだ複数ペ
    ージにわたる画像データを1ページ毎に行の切り出し及
    び文字の切り出しを行う切り出し手段と、この切り出し
    手段により切り出し処理された文字群の認識処理を行う
    認識処理手段と、前記画像データ及び前記認識処理手段
    による認識結果を表示する表示手段とを具備する文字認
    識処理装置において、前記切り出し手段で作成された最
    初のページの切り出し情報を格納する切り出し情報記憶
    手段と、この切り出し情報記憶手段に格納された最初の
    ページの画像の原点と後続ページの画像の原点との位置
    合わせを行う切り出し情報処理手段を設けたことを特徴
    とする文字認識処理装置。
  2. 【請求項2】 読取手段から読み込んだ複数ページにわ
    たる画像データから前記読取手段が傾いた状態で読み込
    んだ画像データを検出して、各ページ毎にその傾きを補
    正する傾き補正手段を具備し、この傾き補正手段での処
    理を終えた後、切り出し手段の処理に移行するように構
    成されている請求項1の文字認識処理装置。
  3. 【請求項3】 読取手段から読み込み表示手段の画面上
    に映し出された画像データにおける最初のページの文章
    に対し切り出し手段で得られた切り出し情報に基づいて
    1文字毎の枡目を生成する枠座標生成手段を具備し、前
    記表示手段の画面上の画像データに前記枡目が被せられ
    ることによって行の切り出し及び文字の切り出しが可能
    に構成されている請求項1または2の文字認識処理装
    置。
JP9158341A 1997-06-16 1997-06-16 文字認識処理装置 Pending JPH117493A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9158341A JPH117493A (ja) 1997-06-16 1997-06-16 文字認識処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9158341A JPH117493A (ja) 1997-06-16 1997-06-16 文字認識処理装置

Publications (1)

Publication Number Publication Date
JPH117493A true JPH117493A (ja) 1999-01-12

Family

ID=15669531

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9158341A Pending JPH117493A (ja) 1997-06-16 1997-06-16 文字認識処理装置

Country Status (1)

Country Link
JP (1) JPH117493A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075744A (ja) * 2007-09-19 2009-04-09 Spirit21:Kk 基板実装部品の管理システム
US7565012B2 (en) 2004-07-12 2009-07-21 Samsung Electronics Co., Ltd. Method and apparatus for generating electronic document by continuously photographing document in moving picture
US8345305B2 (en) 2009-06-24 2013-01-01 Fuji Xerox Co., Ltd. Image-processing device and image-processing method
WO2024018553A1 (ja) * 2022-07-20 2024-01-25 合同会社Ada 被翻訳データ作成装置、被翻訳データ作成方法、及び被翻訳データ作成プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7565012B2 (en) 2004-07-12 2009-07-21 Samsung Electronics Co., Ltd. Method and apparatus for generating electronic document by continuously photographing document in moving picture
JP2009075744A (ja) * 2007-09-19 2009-04-09 Spirit21:Kk 基板実装部品の管理システム
US8345305B2 (en) 2009-06-24 2013-01-01 Fuji Xerox Co., Ltd. Image-processing device and image-processing method
WO2024018553A1 (ja) * 2022-07-20 2024-01-25 合同会社Ada 被翻訳データ作成装置、被翻訳データ作成方法、及び被翻訳データ作成プログラム

Similar Documents

Publication Publication Date Title
JP2835178B2 (ja) 文書読取装置
JPH06176188A (ja) 認識文字の情報作成方法及び装置
JP2013171309A (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JPH117493A (ja) 文字認識処理装置
JPH08329187A (ja) 文書読取装置
JP2000113106A (ja) 文書画像処理装置
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JP2000082110A (ja) 罫線消去装置および文字画像抽出装置および罫線消去方法および文字画像抽出方法および記録媒体
JP2803736B2 (ja) 文字認識方式
JPH1166225A (ja) 表情報抽出装置及び方法並びに記録媒体
JPH01292586A (ja) 文字認識支援装置
JP2962525B2 (ja) テキストブロック認識方法
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH08272900A (ja) 文書読取装置
JP3534997B2 (ja) 罫線抽出装置および方法
JP3761923B2 (ja) 画像処理装置及び方法
JPH05303661A (ja) イメージデータ部分取得表示装置
JP4442977B2 (ja) 文字認識装置、文字イメージ補間方法及び文字イメージ補間プログラムを記録した記録媒体
JPH09269970A (ja) 文字認識方法とその装置
JPH11242716A (ja) 画像処理方法および記録媒体
JPH09288714A (ja) 表認識方法および装置
JP2917394B2 (ja) 文字認識装置及び文字切り出し方法
JPH07160811A (ja) 文字認識装置
JPS61198375A (ja) 光学的文字読取装置
JPH1011530A (ja) 画像入出力方法及び装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040413