JPH06176188A - 認識文字の情報作成方法及び装置 - Google Patents

認識文字の情報作成方法及び装置

Info

Publication number
JPH06176188A
JPH06176188A JP4323944A JP32394492A JPH06176188A JP H06176188 A JPH06176188 A JP H06176188A JP 4323944 A JP4323944 A JP 4323944A JP 32394492 A JP32394492 A JP 32394492A JP H06176188 A JPH06176188 A JP H06176188A
Authority
JP
Japan
Prior art keywords
character
information
recognized
box
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4323944A
Other languages
English (en)
Other versions
JP2979109B2 (ja
Inventor
Tadaki Hirayama
唯樹 平山
Tomio Amano
富夫 天野
Akio Yamashita
晶夫 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IBM Japan Ltd
Original Assignee
IBM Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IBM Japan Ltd filed Critical IBM Japan Ltd
Priority to JP4323944A priority Critical patent/JP2979109B2/ja
Priority to US08/151,080 priority patent/US5509092A/en
Publication of JPH06176188A publication Critical patent/JPH06176188A/ja
Application granted granted Critical
Publication of JP2979109B2 publication Critical patent/JP2979109B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

(57)【要約】 (修正有) 【目的】認識された文字を、記載されているテキストと
文字の大きさや位置等を等しく、アウトフォントで描く
ことができることを実現する。 【構成】テキストコード情報と文字のレイアウト情報を
有する認識文字に関する情報を得る認識手段と、文字の
アウトフォントデータを保持するアウトフォントテーブ
ル34と、これを参照して、得られた認識文字に外接す
る矩形を、アウトラインフォントの文字ボックスと描か
れる文字部領域との比で拡大し、拡大された外接矩形を
文字ボックスデータとして用いて情報を修正する文字ボ
ックス拡大手段31と、認識された文字列中の区切りを
判定する手段と、当該区切りの間の文字数で文字ボック
スの幅を均等に割り付けて得られた幅で拡大された外接
矩形からなる文字ボックスデータを修正する手段32
と、を有し、情報に基づいてアウトフォントにより文字
を描いた時に小さくなることを回避し、また、区切られ
た文字列をまとめて取り扱うことを可能としている。

Description

【発明の詳細な説明】
【産業上の利用分野】本発明は、光学的文字認識装置
(以下OCRという)により入力された文字に関する情
報の処理に関するものである。
【0001】
【従来の技術】従来のOCRシステムの出力は、認識結
果のテキスト(文字コード)のみか、またはテキストの
中に空白を挿入して文字列の頭揃え(インデント)をし
て元のドキュメントとレイアウトを似せたものである。
OCRシステムのユーザは、得られた文字に関する情報
をワードプロセッサやエディタなどのテキスト処理シス
テムへ出力して文書作成に利用していた。
【0002】しかしながら近年、ワードプロセッサの機
能をさらに高度化したものとしてDTP(DeskTop Publ
ishing) システムが広まっている。このシステムは、デ
ータとしてテキストコードだけでなく、テキストの位
置、大きさなどの属性情報を持ち、ワードプロセッサよ
りも自由で複雑な情報を扱うことができる。したがっ
て、DTPシステムに対応するためには、OCRシステ
ムもテキストコード情報だけでなく、文字の位置、大き
さなどのレイアウト情報も出力することが必要である。
【0003】また、レイアウト情報も出力するようにす
ると、これに伴って、現在のようにテキストコードの修
正だけができるユーザインターフェースではなく、レイ
アウト情報をも修正できるユーザーインターフェースが
必要になる。
【0004】認識文字をオリジナルイメージと同じよう
な位置に同じような大きさで出力するシステムとして、
特開昭63−216187号公報に記載の発明がある
が、これはテキストコードの認識結果の修正だけが目的
のものであり、レイアウト情報を修正するものではな
い。また、この発明においては、認識文字を文字イメー
ジの大きさへ拡大縮小する手法がいかなるものか開示さ
れていない。
【0005】
【発明が解決しようとする課題】認識対象の印刷物に記
載されたテキストをOCRシステムで読み取って、得ら
れた認識テキストの文字コードデータ、位置情報、大き
さ情報をそのままアウトラインフォントを用いるDTP
システム等へ出力して利用とすると次のような問題が生
じてしまう。
【0006】例えば、認識対象の印刷物の文字が図15
の(A)に示すものであると、OCRシステムは認識文
字の文字コードデータの他に、図15の(B)に示すよ
うに当該文字にそれぞれ外接する矩形(外接矩形、図1
5の(C))として文字の位置情報、大きさ情報を保持
する。これらの情報を何等特別な処理を施さずにそのま
まDTPシステムへ出力すると、図15の(D)に示す
ようにDTPシステムでは前記外接矩形を文字ボックス
としてアウトラインフォントにより文字を描くこととな
るため、図15の(E)に示すように、元の印刷物に比
べ文字が小さくなる、文字のベースラインが一致しな
い、一文字一文字がデータとしてバラバラになり、大き
さもまちまちになってしまうなどの問題点が生じる。
【0007】本発明は上記従来の事情に鑑みなされたも
ので、OCRシステムにより得られた文字に関する情報
からDTPシステム等においてオリジナルイメージと同
じあるいは同じような文字として処理させることを目的
としている。
【0008】
【課題を解決するための手段】本発明の認識文字の情報
作成方法では、印刷文字を光学的に読み取って認識した
文字に外接する矩形を、アウトラインフォントの文字ボ
ックスと当該文字ボックス内に描かれる文字部領域との
比で拡大し、当該拡大された外接矩形をアウトラインフ
ォントの文字ボックスデータとして用いて認識文字に関
する情報を作成ことにより、この情報に基づいてアウト
フォントにより文字を描いた時に描かれた文字が実際よ
り小さなものとなってしまうことを回避している。
【0009】また、本発明の認識文字の情報作成方法で
は、更に、認識された文字列中の区切りを判定し、当該
区切りの間の文字数で文字ボックスの幅を均等に割り付
け、当該均等割り付けで得られた文字ボックスの幅で前
記拡大された外接矩形からなる文字ボックスデータを修
正して認識文字に関する情報を作成することにより、編
集処理等において区切られた文字列をひとまとまりとし
て取り扱うことを可能とし、処理の能率向上を図ってい
る。
【0010】また、本発明の認識文字の情報作成装置
は、上記方法を実現するため、印刷文字を光学的に読み
取って認識し、テキストコード情報と文字のレイアウト
情報をを有する認識文字に関する情報を得る認識手段
と、文字のアウトフォントデータを保持するアウトフォ
ントテーブルと、アウトフォントテーブルを参照して、
認識手段で得られた認識文字に外接する矩形を、アウト
ラインフォントの文字ボックスと当該文字ボックス内に
描かれる文字部領域との比で拡大し、当該拡大された外
接矩形をアウトラインフォントの文字ボックスデータと
して用いて認識文字に関する情報を修正する文字ボック
ス拡大手段と、を備えている。
【0011】また、本発明の認識文字の情報作成装置
は、更に、認識された文字列中の区切りを判定する手段
と、当該区切りの間の文字数で文字ボックスの幅を均等
に割り付けて得られた文字ボックスの幅で前記拡大され
た外接矩形からなる文字ボックスデータを修正する手段
と、を備えている。
【0012】また、本発明の認識文字の情報作成装置
は、更に、オペレータによる区切り位置の指示を入力す
る手段を備え、システムによる誤りを修正することを可
能にしている。
【0013】また、本発明の認識文字の情報作成装置
は、更に、光学的に読み取られた文字列を表示するウイ
ンドウと、認識されてアウトフォントにより描かれた文
字列を表示するウインドウと、前記ウインドウに表示さ
れる文字列がテキスト内のどこの部分であるかを表示す
るウインドウとを同一画面上に表示する表示手段を備
え、オペレータ操作に便利を図っている。
【0014】
【実施例】第1図はこの発明の一実施例によるシステム
全体の概略構成を示す。システムは、印刷物等に記載さ
れたテキストを光学的に読み込むスキャナ1、読み込ま
れたテキスト文字を認識するOCR装置2、認識された
文字のデータに修正等の処理を加えるユーザインタフェ
ース3、前記修正等の指示を入力するキーボードやマウ
ス等からなる入力手段4、認識処理されるテキストを表
示するCRT等からなる表示手段5を備えている。尚、
ユーザインタフェース3からの出力はDTPシステム6
に入力されて、プリンタ7を通してDTPシステムから
出力される。また、OCR装置2及びユーザインタフェ
ース3はCPUや必要な記憶手段を備えたパーソナルコ
ンピュータにより実現されている。
【0015】上記ユーザインタフェース3の更に詳しい
構成を図2に示す。ユーザインタフェース3は、アウト
ラインフォントテーブル34に保持されている各文字の
アウトラインフォント情報に対してその文字ボックスを
拡大するように修正を加える文字ボックス拡大手段31
と、テキスト文字列に修正を加える文字列修正手段32
と、図12に示すように、スキャナ1で読み取ったテキ
スト文字列のイメージ21、所定の修正を加えた認識結
果のテキスト文字列22、表示部分が全体のテキスト中
のどの部分かを表示手段5にウインドウに分けて表示さ
せ、更には、修正を加えたテキスト文字列の情報(テキ
ストコード情報及びレイアウト情報)をDTPシステム
6へ出力する出力制御手段33を備えている。
【0016】ここで、アウトフォントテーブル34に保
持されているアウトフォント情報は、各文字毎にキャラ
クタコード、文字ボックスの大きさに係る縦横比デー
タ、文字ボックス内に描かれる文字部の位置座標デー
タ、フォント形状データ等であり、描かれる文字の大き
さは文字ボックスの大きさに係るデータを或る大きさを
規定する値に定めることにより決定される。
【0017】上記文字列修正手段32の更に詳しい構成
を図3に示す。文字列修正手段32は、テキスト文字列
中における漢字、数字、仮名等の文字種類の変化を判定
してその変化位置にマークを施すキャラクタ判定・マー
キング手段321と、テキスト文字列中のマークで区切
られた部分をその部分の文字数で割った幅に均等割り付
けする均等割り付け手段322と、文字に関する情報中
のこれら手段321、322の修正対象以外の属性(文
字コード、フォント等)を修正する文字情報修正手段3
23を備えており、各手段にはユーザによる修正指示も
できるように入力手段4からの指示が入力されるように
なっている。
【0018】図4に示すフローチャートに沿って上記し
たシステムの動作を説明する。まず、スキャナ1で認識
対象の原稿をスキャンしてテキストが読取られ(ステッ
プS1)、OCR装置2にこのテキストの白黒の2値画
像データが送られる。そして、OCR装置2で画像デー
タが解析されて文字認識が行なわれ(ステップS2)、
各文字の情報がユーザインタフェース3へ入力される。
【0019】ここで得られたテキスト中の各文字毎の情
報は、図5に示すように、キャラクタコードCC、アウ
トラインフォントの文字ボックスの大きさに関するデー
タRD、アウトラインフォントの文字ボックス内での黒
画素部(文字部)の位置座標データCD、アウトライン
フォントの形状データSD、等からなっている。各文字
毎の情報をこのような構造とするのはアウトフォントに
対応するためであり、アウトフォントでは定められた大
きさの文字ボックス内の定められた位置に定められたフ
ォント形状で文字を描く。
【0020】ここで、データRDは、図6に示すよう
に、アウトラインフォントの文字ボックス41の高さh
1と幅d1のアウトラインフォントにより描かれる文字
(例えば「へ」)の高さh2と幅d2の比h1/h2及びd
1/d2を認識結果の文字に外接する矩形(外接矩形)の
高さ及び幅にそれぞれ乗じた値であり、この値を後にア
ウトラインフォントにより文字を描く際に文字ボックス
として用い、これによって描かれる文字の大きさが決定
される。また、データCDは描かれる文字の位置を決定
するデータであり、これらデータRD、CDが文字の位
置や大きさに係るレイアウト情報となって、テキストコ
ード情報に係るデータCCと共に各文字に関する情報を
構成している。
【0021】ユーザインタフェース3に入力された文字
に関する情報は、まず、文字ボックス拡大手段31でテ
キストのイメージと同じ大きさの文字がアウトラインフ
ォントで描かれるように処理がなされる(ステップS
3)。
【0022】すなわち、図7に示すように、スキャナで
読み取ったイメージ文字に外接する矩形(外接矩形)を
文字ボックスとしてアウトラインフォントにより文字を
描くと、文字は文字ボックス内に或る程度の余白をもっ
て描かれるため、実際にアウトラインフォントで描かれ
る文字は認識された文字(外接矩形)より小さなものと
なってしまう。これを修正するため、文字ボックス拡大
手段31では、外接矩形の高さをh1/h2倍し、幅をd
1/d2倍して拡大し、アウトラインフォントでイメージ
文字と同じ大きさの文字が描かれるようにしている。
【0023】この文字ボックスの拡大処理に応じて、各
文字に関する情報は、図8に示すように、データRDが
データRD^に書き替えられ、データCDがデータCD^
に書き替えられ、文字列修正手段32に入力される。
【0024】文字列修正手段32では、文字ボックス拡
大手段31から送られてきた各文字毎の情報を一行或は
一文といったひとまとまりの文字列として文字ボックス
の幅を更に修正する処理を行う(ステップS4)。
【0025】まず、例えば一行分の文字列を文字列分割
アルゴリズムにしたがって分割し、分割された文字グル
ープごとにグループ全体の幅を文字数で割って一つ一つ
の文字ボックスの幅を決定する。すなわち、一つの文字
グループ内では均等割によって一つ一つの文字ボックス
の幅を決定する。
【0026】本実施例では文字列分割アルゴリズムとし
て、平仮名、漢字、カタカナ、英数字をひとまとまりと
して文字種が変化したところ、文字の大きさが大きく変
化しているところ、および、文字間距離が大きくはなれ
ているところをキャラクタ判定・マーキング手段321
で判定して、マーク付けを行っている。すなわち、図1
0に示すように、多数の文字毎の情報の並びからなる一
行分の情報に対し、そのキャラクタデータCC、文字ボ
ックスデータRC等を検査して変化位置を見つけ、この
位置に切れ目を示すマーキング情報(>)を挿入するこ
とにより文字列を分割する。そして、均等割付手段32
2によって、分割された文字グループの幅を文字数で均
等割り付けして文字ボックスの幅を決定する。
【0027】この文字列の修正処理に応じて、各文字に
関する情報は、図9に示すように、データRD^がデー
タRD^^に書き替えられ、データCD^がデータCD^^
に書き替えられ、出力制御手段33に入力される。ここ
で、本実施例では、文字列のベースラインは分割前の行
のベースラインを用いており、文字の高さはその文字が
属するグループ内で最大のものを用いている。
【0028】尚、文字列分割アルゴリズムとしては、上
記の他に、ダイナミックプログラミングの手法を用いる
こともできる。すなわち、文字列分割の評価関数を用意
し、その評価関数が最適値になるような分割を求める方
法であり、その評価関数は切れ目が少ない時、元の外接
矩形との左右方向のずれが少ない時、切れ目の位置が文
字種の変化した場所であるときに最適値を示ようにし
て、当該変化位置を判定するようにしてもよい。
【0029】上記した一連の処理によって、スキャナ1
で読み取られたイメージ(図11の(A)参照)に極め
て近い文字データとしてシステムにとり込まれ、表示手
段5に表示されるとともに(ステップS5)、DTPシ
ステム6へ出力される。
【0030】すなわち、OCR装置2で認識されたテキ
スト(図11の(B)参照)からそれぞれの文字の外接
矩形が求められ、この外接矩形がアウトラインフォント
テーブル34から求められる比h1/h2およびd1/d2
をもって文字ボックス拡大手段で拡大され、この拡大さ
れた外接矩形を文字ボックスに用いてアウトラインフォ
ントにより文字が描かれる(図11の(C)参照)。そ
して更に、文字列修正手段により文字列の分割修正がな
され(図11の(D)参照)、アウトラインフォントで
描かれる整形されたテキストが前記イメージと近い形で
得られることとなる(図11の(E)参照)。
【0031】また、表示手段5の画面には、図12に示
すように3つのウィンドウ21、22、23があり、オ
リジナルイメージのテキスト、認識結果を上記の処理を
したのちアウトラインフォントを用いて描いたテキス
ト、イメージウィンドウと認識結果ウィンドウが全体の
ページのうちでどの部分を表示しているかを示すレイア
ウトが同時に表示される。。これら3つのウィンドウは
連動しており、一つのウィンドウの表示を移動させると
他の2つのウィンドウも同じ位置に移動する。したがっ
て、オリジナルのイメージウィンドウを見ながら認識結
果ウィンドウを直接マウス等で操作して認識結果を修正
することができる。
【0032】前記図4のフローチャートに戻って、表示
画面に表示された結果を見たユーザが修正を加える場合
には(ステップS6)、文字列修正手段32に処理が戻
され入力手段4からの指示に基づいて認識結果に所定の
修正が加えられる。すなわち、一文字ごとの認識結果の
文字コード、フォントおよびその他の属性の修正、或
は、マーキング手段321により区切られた文字列ごと
の文字コード、フォントおよびその他の属性の修正が文
字情報修正手段323によってなされる。
【0033】また、上記の機能に加えて、文字列修正手
段32全体として単に文字コードの修正、文字の表示位
置・大きさの修正を入力手段4からの指示に基づいて行
う。
【0034】例えば、図13の(A)に示すテキストに
おいて、OCR装置2の文字認識ルーチンが文字の切れ
目を間違えたために、図13の(B)に示すように元の
テキストの文字数と認識結果の文字数が異なってしまっ
ている場合(切り出し誤り)、オペレータが誤った文字
列を入力手段4で指定して正しく修正すると(図13の
(C))、新たなる文字列を指定すると、その文字列部
分の文字ボックスを再構成され、文字列の区切りもこれ
に応じて変化する(図13の(D))。
【0035】また、例えば、図14の(A)に示す「開
始」だけが大きなフォントとなっているテキストにおい
て、アウトラインフォントの表示のために文章を切って
作った文字列の切れ目が間違っているために、図14の
(B)に示すように全体の文字の高さが「開始」のもの
にあってしまって表示がおかしい場合、図14の(C)
に示すようにオペレータが入力手段4からその切れ目を
修正することができる。この結果、新たに指定された切
れ目に基づいて文字ボックスの位置および大きさが計算
されて各文字に文字ボックスが割り振られ、正しい大き
さのフォントによって文字が描かれる(図14の
(D))。
【0036】上記した一連の修正結果もDTPシステム
6へ出力される文字に関する情報(図9)に反映され、
DTPシステム6において効果的に利用することができ
る。
【0037】尚、上記のような修正は文字列を切れ目で
区切ってマーキングしたことにより実現されるが、本発
明において、文字ボックスの拡大処理を行うだけでもア
ウトフォントによりオリジナルに近い文字を描くことが
でき、これを目的とする場合には上記修正機能は必須な
ものではない。
【0038】
【発明の効果】この発明によれば、OCRシステムにお
いて認識された各文字の情報を文字コード情報だけでな
く、レイアウト情報をも含めて作成することができ、こ
のレイアウト情報もアウトラインフォントで文字を描い
た時にオリジナルに近い形となるように処理が加えられ
たものであるため、DTPなどのシステムで効果的に利
用可能なデータが生成され、文書作成や編集等の能率を
高めることができる。また、テキスト文字列をまとまり
のあるグループ化した単位とすることがきることから、
これらの文字列単位で修正等の処理ができ、修正や編集
作業の能率向上が図れる。また、認識結果だけでなく、
文字の位置・大きさ・フォントなどの属性情報もオペレ
ータが効率良く修正することが可能なユーザインターフ
ェースが実現されるという効果がある。
【0039】
【図面の簡単な説明】
【図1】システムの全体構成を示すブロック図である。
【図2】ユーザインタフェース部分の構成を示すブロッ
ク図である。
【図3】文字列修正手段部分の構成を示すブロック図で
ある。
【図4】処理動作を説明するフローチャートである。
【図5】データの構造を示す概念図である。
【図6】文字ボックスの拡大を説明する概念図である。
【図7】外接矩形と文字ボックスの関係を説明する概念
図である。
【図8】データの構造を示す概念図である。
【図9】データの構造を示す概念図である。
【図10】文字列のデータの並びを示す概念図である。
【図11】テキストの様子を示す図である。
【図12】表示画面を示す図である。
【図13】テキストの様子を示す図である。
【図14】テキストの様子を示す図である。
【図15】アウトラインフォントで描かれる文字を説明
する図である。
【符号の説明】
1 スキャナ 2 OCR装置 3 ユーザインタフェース 4 入力手段 5 表示手段 6 DTPシステム 7 プリンタ 31 文字ボックス拡大手段 32 文字列修正手段 34 アウトフォントテーブル 321 キャラクタ判定・マーキング手段 322 均等割付手段 323 文字情報修正手段

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】印刷文字を光学的に読み取って認識し、当
    該認識文字をキャラクタコード及びアウトラインフォン
    トの文字ボックスデータを有する情報として作成するに
    際し、 認識文字に外接する矩形を、アウトラインフォントの文
    字ボックスと当該文字ボックス内に描かれる文字部領域
    との比で拡大し、当該拡大された外接矩形をアウトライ
    ンフォントの文字ボックスデータとして用いて認識文字
    に関する情報を作成ことを特徴とする認識文字の情報作
    成方法。
  2. 【請求項2】認識された文字列中の区切りを判定し、当
    該区切りの間の文字数で文字ボックスの幅を均等に割り
    付け、当該均等割り付けで得られた文字ボックスの幅で
    前記拡大された外接矩形からなる文字ボックスデータを
    修正して認識文字に関する情報を作成することを特徴と
    する請求項1に記載の認識文字の情報作成方法。
  3. 【請求項3】印刷文字を光学的に読み取って認識し、テ
    キストコード情報と文字のレイアウト情報をを有する認
    識文字に関する情報を得る認識手段と、 文字のアウトフォントデータを保持するアウトフォント
    テーブルと、 アウトフォントテーブルを参照して、認識手段で得られ
    た認識文字に外接する矩形を、アウトラインフォントの
    文字ボックスと当該文字ボックス内に描かれる文字部領
    域との比で拡大し、当該拡大された外接矩形をアウトラ
    インフォントの文字ボックスデータとして用いて認識文
    字に関する情報を修正する文字ボックス拡大手段と、 を備えたことを特徴とする認識文字の情報作成装置。
  4. 【請求項4】認識された文字列中の区切りを判定する手
    段と、 当該区切りの間の文字数で文字ボックスの幅を均等に割
    り付けて得られた文字ボックスの幅で前記拡大された外
    接矩形からなる文字ボックスデータを修正する手段と、 を有することを特徴とする請求項3に記載の認識文字の
    情報作成装置。
  5. 【請求項5】オペレータによる区切り位置の指示を入力
    する手段を有することを特徴とする請求項4に記載の認
    識文字の情報作成装置。
  6. 【請求項6】光学的に読み取られた文字列を表示するウ
    インドウと、認識されてアウトフォントにより描かれた
    文字列を表示するウインドウと、前記ウインドウに表示
    される文字列がテキスト内のどこの部分であるかを表示
    するウインドウとを同一画面上に表示する表示手段を有
    することを特徴とする請求項3乃至5のいずれか1項に
    記載の認識文字の情報作成装置。
JP4323944A 1992-12-03 1992-12-03 認識文字の情報作成方法及び装置 Expired - Fee Related JP2979109B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP4323944A JP2979109B2 (ja) 1992-12-03 1992-12-03 認識文字の情報作成方法及び装置
US08/151,080 US5509092A (en) 1992-12-03 1993-11-12 Method and apparatus for generating information on recognized characters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4323944A JP2979109B2 (ja) 1992-12-03 1992-12-03 認識文字の情報作成方法及び装置

Publications (2)

Publication Number Publication Date
JPH06176188A true JPH06176188A (ja) 1994-06-24
JP2979109B2 JP2979109B2 (ja) 1999-11-15

Family

ID=18160378

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4323944A Expired - Fee Related JP2979109B2 (ja) 1992-12-03 1992-12-03 認識文字の情報作成方法及び装置

Country Status (2)

Country Link
US (1) US5509092A (ja)
JP (1) JP2979109B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120201A (ja) * 1997-10-16 1999-04-30 Bunsei Shoin:Kk 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体
JP2015014846A (ja) * 2013-07-03 2015-01-22 日本電信電話株式会社 文字認識装置、方法、及びプログラム

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152865A (ja) * 1993-11-30 1995-06-16 Canon Inc 情報認識装置及びその方法
JPH07288722A (ja) * 1994-04-15 1995-10-31 Canon Inc 撮像装置
EP0769175B9 (en) * 1994-07-01 2005-01-12 Palm Computing, Inc. Multiple pen stroke character set and handwriting recognition system
US5940583A (en) * 1994-11-15 1999-08-17 Canon Kabushiki Kaisha Image forming apparatus
DE69608035T2 (de) * 1995-06-19 2000-09-28 Canon K.K., Tokio/Tokyo Gerät und Verfahren zur Zeichenerkennung
JP3553575B2 (ja) * 1995-11-14 2004-08-11 株式会社リコー 画像処理装置
WO1999024969A1 (en) * 1997-11-12 1999-05-20 Kurzweil Educational Systems, Inc. Reading system that displays an enhanced image representation
JP4071328B2 (ja) * 1997-11-18 2008-04-02 富士通株式会社 文書画像処理装置および方法
JP4338155B2 (ja) * 1998-06-12 2009-10-07 キヤノン株式会社 画像処理装置及びその方法、コンピュータ可読メモリ
WO2000026851A1 (fr) * 1998-10-29 2000-05-11 Mitsuo Nakayama Scanner d'image et dispositif de reconnaissance optique de caracteres mettant en oeuvre ledit scanner
JP4150842B2 (ja) * 2000-05-09 2008-09-17 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
WO2004107257A1 (ja) * 2003-05-30 2004-12-09 Fujitsu Limited 帳票処理プログラム、方法及び装置
US7499588B2 (en) 2004-05-20 2009-03-03 Microsoft Corporation Low resolution OCR for camera acquired documents
JP4385873B2 (ja) * 2004-07-09 2009-12-16 カシオ計算機株式会社 電子カメラおよびプログラム
JP4715278B2 (ja) 2005-04-11 2011-07-06 ソニー株式会社 情報処理装置および情報処理方法、プログラム格納媒体、プログラム、並びに提供装置
JP2007180789A (ja) * 2005-12-27 2007-07-12 Brother Ind Ltd 複写機能付画像形成装置
JP5121599B2 (ja) * 2008-06-30 2013-01-16 キヤノン株式会社 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP2012009000A (ja) * 2010-05-24 2012-01-12 Pfu Ltd 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法
JP5583542B2 (ja) 2010-05-24 2014-09-03 株式会社Pfu 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法
US9256592B1 (en) * 2012-11-07 2016-02-09 Amazon Technologies, Inc. System for detecting and correcting broken words
CN106293431A (zh) * 2015-05-26 2017-01-04 富泰华工业(深圳)有限公司 手写输入识别方法、系统与电子装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62247485A (ja) * 1986-04-21 1987-10-28 Ricoh Co Ltd 文字認識装置における認識結果出力方法
JPH02195488A (ja) * 1989-01-25 1990-08-02 Toshiba Corp 文字認識結果修正方法
JPH0388085A (ja) * 1989-08-31 1991-04-12 Toshiba Corp 光学的文字読取装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60140472A (ja) * 1983-12-28 1985-07-25 Hitachi Ltd 対話型フオント・パタ−ン作成・修正・合成制御装置
US5142613A (en) * 1987-07-23 1992-08-25 Minolta Camera Kabushiki Kaisha Font managing apparatus for a character generator
JPH02201588A (ja) * 1989-01-31 1990-08-09 Toshiba Corp 文字読取装置
JPH0816918B2 (ja) * 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62247485A (ja) * 1986-04-21 1987-10-28 Ricoh Co Ltd 文字認識装置における認識結果出力方法
JPH02195488A (ja) * 1989-01-25 1990-08-02 Toshiba Corp 文字認識結果修正方法
JPH0388085A (ja) * 1989-08-31 1991-04-12 Toshiba Corp 光学的文字読取装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120201A (ja) * 1997-10-16 1999-04-30 Bunsei Shoin:Kk 検索可能な画像データの作成方法及び装置、画像データの検索方法及び装置、検索可能な画像データの作成プログラム及び画像データの検索プログラムを記録した記憶媒体、及び検索可能な画像データを記録した記憶媒体
JP2015014846A (ja) * 2013-07-03 2015-01-22 日本電信電話株式会社 文字認識装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP2979109B2 (ja) 1999-11-15
US5509092A (en) 1996-04-16

Similar Documents

Publication Publication Date Title
JPH06176188A (ja) 認識文字の情報作成方法及び装置
JP2536966B2 (ja) テキスト編集システム
JPH06274680A (ja) 文書認識方法およびシステム
JPH05151254A (ja) 文書処理方法およびシステム
JPH0554073A (ja) デジタル翻訳装置
US6504540B1 (en) Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
JPH08161309A (ja) 文書作成装置
JPH1166065A (ja) 画像配置装置およびそのプログラム記録媒体
JPH117493A (ja) 文字認識処理装置
JP3761923B2 (ja) 画像処理装置及び方法
JP2504471B2 (ja) 文章編集装置
JP2003256772A (ja) 文字認識装置及び記録媒体
JPH103516A (ja) 情報処理方法及び装置
JPH0736433A (ja) 文字データベース作成装置
JP3424942B2 (ja) 対訳画像形成装置
JPH09269970A (ja) 文字認識方法とその装置
JPH0916717A (ja) 文書読取装置
JPS63265377A (ja) 光学文字読取装置における辞書作成方法
JPH0581467A (ja) 画像処理方法及び装置
JPH1011530A (ja) 画像入出力方法及び装置
JPH11282962A (ja) 文字認識装置及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05342405A (ja) 文書編集方法及び装置
JPH08287050A (ja) レイアウトデザイン装置
JPH08249416A (ja) 光学的文字読取システム及びその帳票作成方法
JPS6321170A (ja) 文書処理方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees