JP2003099709A - 誤読文字修正方法及び光学的文字認識装置 - Google Patents

誤読文字修正方法及び光学的文字認識装置

Info

Publication number
JP2003099709A
JP2003099709A JP2001292002A JP2001292002A JP2003099709A JP 2003099709 A JP2003099709 A JP 2003099709A JP 2001292002 A JP2001292002 A JP 2001292002A JP 2001292002 A JP2001292002 A JP 2001292002A JP 2003099709 A JP2003099709 A JP 2003099709A
Authority
JP
Japan
Prior art keywords
character
similar
correction
recognition
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001292002A
Other languages
English (en)
Inventor
Kazuji Kiyono
和司 清野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001292002A priority Critical patent/JP2003099709A/ja
Publication of JP2003099709A publication Critical patent/JP2003099709A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】本発明は、大量の文字を含む文書画像を処理対
象に文字認識を行った際の文字認識方式の傾向等による
同一性の認識誤りに対して、その修正作業を直接的に効
率よく、しかも簡単な操作で容易かつ迅速に行うことが
できる光学的文字認識装置を提供することを課題とす
る。 【解決手段】修正処理部28は、表示部3に表示される
図2に示すような認識結果修正画面上で誤読文字につい
て文字修正がなされた際に、類似字形集合ファイル27
を参照して、中間ファイル25内の上記修正された文字
が含まれる類似字形のすべてに修正された文字を反映さ
せ、一括して修正する処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば書籍等の印
刷文書に於ける文字認識結果の確認、修正作業に適用し
て好適な誤読修正方法及び光学的文字認識装置に関す
る。
【0002】
【従来の技術】光学的文字認識装置(OCR)に於い
て、特に書籍等の印刷文書を対象に文字認識を行うドキ
ュメントリーダでは、その文字認識方式の傾向(癖、偏
り、習性等)により、誤読する文字パターンが存在す
る。従来、この誤読に対して、文字パターンの即時学習
などの機能が提供されている場合が多いが、ユーザ指定
による登録では、登録の手間が煩雑である。また、自動
登録の場合には、パターンを誤って学習してしまうこと
があるなど、簡易で信頼性の高い機能は実現されていな
い。また、従来では、文字認識方式の傾向(癖)によ
る、同じような誤読(認識誤り)文字について、その修
正を直接的に行うことのてきる修正機能を持つ装置は存
在しなかった。
【0003】このため、従来では、ドキュメントリーダ
により、例えば学会の論文誌、本一冊分など、同一ある
いは類似した文字フォントを使用して印刷された大量の
文字を含む文書画像を処理対象に文字認識処理を行った
結果、文字認識方式の傾向(癖)による多くの誤読を引
き起こし、これにより、漢字活字等の同じような誤読
(認識誤り)文字が多数箇所に存在した際に、その誤読
文字のそれぞれについて、繰返し修正作業を行わなけれ
ばならず、従って修正に多くの時間と労力を要してい
た。
【0004】
【発明が解決しようとする課題】上述したように、従来
では、ドキュメントリーダにより、大量の文字を含む文
書画像を処理対象に文字認識処理を行った結果、文字認
識方式の傾向(癖)による、同じような誤読(認識誤
り)文字が多数箇所に存在した際、その誤読文字のそれ
ぞれについて、繰返し修正作業を行わなければならず、
従って修正作業に多くの時間と労力を要するという問題
があった。
【0005】本発明は上記実情に鑑みなされたもので、
大量の文字を含む文書画像を処理対象に文字認識を行っ
た際の文字認識方式の傾向等による同一性の認識誤りに
対して、その修正作業を直接的に効率よく、しかも簡単
な操作で容易かつ迅速に行うことのできる、誤読修正方
法及び光学的文字認識装置を提供することを目的とす
る。
【0006】
【課題を解決するための手段】本発明は、認識した読取
対象の中で、文字認識として正しく認識できるか否かは
別にして、形状が類似している文字を類似字形と分類
し、これを全ての認識文字に対して実行して、類似字形
集合情報を動的に生成する。そして、文字認識確認・修
正作業に於いて、オペレータによる修正が行われた場合
に、その修正された文字と同じ類似字形集合に属する文
字に対して一括修正を自動的に実行することを特徴とす
る。
【0007】即ち、本発明は、OCRに於ける文字認識
結果の誤読修正方法に於いて、文字認識処理の対象とし
て切り出されたすべての文字パターンに対し、当該各文
字パターン相互の類似性に基づきクラスタリングを行
い、同一クラスに属する文字を類似字形とする類似字形
集合情報を生成し、文字認識結果の修正作業で文字修正
がなされた際に、前記類似字形集合情報を参照し、修正
された文字と同一クラスに属する文字を一括して自動修
正することを特徴とする。
【0008】また、本発明は、OCRに於ける文字認識
結果の誤読修正方法に於いて、読取イメージデータから
文字パターンを抽出するステップと、前記抽出された文
字パターンの文字認識を行うステップと、前記抽出され
た文字パターンと前記認識結果をもとに中間ファイルを
作成するステップと、前記中間ファイル内の全文字パタ
ーンに対して、字形の類似性により類似字形を判定分類
し、類似字形集合情報を作成するステップと、前記中間
ファイル内のデータをもとに認識結果修正画面を表示す
るステップと、前記認識結果修正画面上で誤読文字に対
し文字修正がなされた際に、前記類似字形集合情報を参
照して、前記中間ファイル内の前記修正された文字が分
類される類似字形のすべてを一括して修正するステップ
とを具備することを特徴とする。
【0009】また、本発明は、OCR装置に於いて、文
字認識処理の対象として切り出されたすべての文字パタ
ーンに対し、当該各文字パターン相互の類似性に基づき
クラスタリングを行い、同一クラスに属する文字を類似
字形とする類似字形集合情報を生成する類似字形集合生
成手段と、文字認識結果の修正作業で文字修正がなされ
た際に、前記類似字形集合生成手段からの類似字形集合
情報を参照し、修正された文字と同一クラスのの類似字
形を一括して自動修正する処理手段とを具備することを
特徴とする。
【0010】また、本発明は、OCR装置に於いて、文
字認識対象として抽出された文字パターン、及びその抽
出された文字パターンの文字認識結果が格納される中間
ファイルと、前記中間ファイル内の全文字パターンを対
象に字形の類似性を判定して分類された類似字形集合情
報が格納される類似字形集合情報ファイルと、前記中間
ファイルを用いて作成された文字認識修正画面で修正操
作された場合、前記類似字形集合情報ファイルを参照し
て、その修正文字が分類された類似字形を一括して自動
修正する処理手段とを具備することを特徴とする。
【0011】また、本発明は、OCR装置に於いて、読
取イメージデータから文字パターンを抽出する文字パタ
ーン抽出処理手段と、前記文字パターン抽出処理手段で
抽出された文字パターンの文字認識を行う文字認識手段
と、前記文字パターン抽出処理手段で抽出された文字パ
ターンと前記文字認識手段の認識結果をもとに中間ファ
イルを作成する中間ファイル作成手段と、前記中間ファ
イル作成手段により作成された中間ファイル内の全文字
パターンに対して、字形の類似性により類似字形を判定
分類し、類似字形集合情報ファイルを作成する類似字形
集合情報ファイル作成手段と、前記中間ファイル内のデ
ータをもとに文字認識結果修正画面を表示し、誤読文字
について文字修正がなされた際に、前記類似字形集合情
報ファイルを参照して、前記修正文字が分類された類似
字形を一括して修正する修正処理手段とを具備すること
を特徴とする。
【0012】上記したような本発明の誤読修正機能をも
つことにより、例えば印刷活字ドキュメントの文字認識
において、文字認識装置の癖によって同じような文字を
全て誤認識する傾向に対し、認識文字のクラスタリング
により類似字形集合情報を作成することによって、同一
クラスに分類された文字を一括して修正することを可能
とし、誤読文字修正作業が簡単な操作で容易かつ迅速に
行うことができる。
【0013】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。
【0014】図1は本発明の実施形態に於ける誤読修正
処理機能をもつOCR装置の構成を示すブロック図であ
り、ここでは、イメージスキャナ1、活字認識装置2、
表示部3、操作入力部4等を有して構成される。
【0015】イメージスキャナ1は、既存のOCRと同
様のイメージスキャン処理を行う。この実施形態では、
例えば学会の論文誌、本一冊分など、同一あるいは類似
した文字フォントを使用して印刷された大量の文字を含
む文書(ドキュメント)を読取対象に、複数ページの紙
ドキュメントに於けるページ単位のイメージスキャン処
理を行って、読み取ったイメージデータを活字認識装置
2に送出する。
【0016】活字認識装置2は、レイアウト解析処理部
21、文字抽出処理部22、文字認識処理部23、イメ
ージデータファイル24、中間ファイル25、クラスタ
リング処理部26、類似字形集合ファイル27、修正処
理部28等の構成要素を有して、上述したような本発明
に係る類似字形集合を参照した文字認識結果の一括修正
機能を実現している。
【0017】表示部3、及び操作入力部4は、オペレー
タが介在する文字認識結果の確認・訂正作業に於けるマ
ンマシンインターフェース機構を実現するもので、ここ
では、例として、表示部3上に於いて、図2、図3に示
すような認識結果修正画面(確認・訂正画面)を用いて
文字認識結果の確認・訂正作業が行われる。
【0018】活字認識装置2に於いて、レイアウト解析
処理部21、文字抽出処理部22、および文字認識処理
部23は、それぞれ既存のOCRと同様の処理を行う。
また、イメージデータファイル24、中間ファイル2
5、及び類似字形集合ファイル27はそれぞれ図示しな
いディスク記憶装置上に置かれる。
【0019】レイアウト解析処理部21は、イメージス
キャナ1で読み取ったページ単位のイメージデータから
文字領域、イメージ領域等の像域認識を行い、その領域
の情報を含む所定のレイアウト解析結果の情報を原画像
と共にイメージデータファイル24に貯える。そして、
文字切り出し対象となる文字領域のイメージデータを文
字抽出処理部22に送出する。
【0020】文字抽出処理部22は、レイアウト解析処
理部21で認識された文字領域内の文字パターンの抽出
(切出し)処理を行い、その切り出した文字パターンと
位置情報等を中間ファイル25に貯えるとともに、切り
出した文字パターンを文字認識処理部23に送出する。
【0021】文字認識処理部23は、文字抽出処理部2
2で切出した文字パターンに対する文字認識処理を行
い、その認識結果の情報を中間ファイル25に貯える。
【0022】これにより、中間ファイル25には、切り
出した各文字パターンと、文字抽出処理部22で抽出さ
れた、各切り出し文字の1文字毎に、ページ番号、領域
番号、行番号、パターン番号等の各位置情報と、その各
切り出し文字に対応して文字認識処理部23で認識され
た認識結果の情報がそれぞれ確認・修正処理の対象とし
て保存される。
【0023】クラスタリング処理部26は、中間ファイ
ル25に記憶される各文字パターンについて、そのパタ
ーンの類似度からクラスタリング処理(類似形状と見做
されるパターンの集合を動的に求める処理)を行うもの
で、文字パターンそれぞれの字形の類似性により、類似
字形を判定分類し、この類似字形判定分類を中間ファイ
ル25内の全文字パターンデータに対し実行して類似字
形集合情報を作成し、その類似字形集合情報を類似字形
集合ファイル27に格納する。
【0024】これにより、類似字形集合ファイル27に
は、中間ファイル25内の全文字パターンについて、ク
ラスタリング処理部26のクラスタリング処理により類
似形状と見なされた文字パターンの集合を定義するデー
タが類似字形集合情報として保存される。
【0025】修正処理部28は、中間ファイル25に格
納される情報から図2に示すような認識結果修正画面を
表示部3に表示し、誤読文字について文字修正がなされ
た際に、類似字形集合ファイル27を参照して、中間フ
ァイル25内の上記修正された文字が含まれる類似字形
のすべてに修正された文字を反映させ、中間ファイル2
5内の全ての認識結果を一括して修正する処理を行う。
【0026】図2及び図3は、それぞれ修正処理部28
の制御に応じて表示部3に表示される認識結果修正画面
の一例を示したもので、ここでは、「東」を「束」と誤
読した際の修正処理を例に示している。図2は、誤読文
字位置をカーソル(斜線で示す)で指定して、当該位置
の誤読文字「束」に対し訂正文字「東」を入力した状態
を示す図、図3は、その動作を説明するための図であ
る。上記認識結果修正画面上の認識結果修正領域には確
認・訂正の対象となる認識結果が表示され、イメージ表
示領域には切り出した文字パターンのイメージが表示さ
れる。
【0027】ここで上記各図を参照して、本発明の実施
形態に於ける動作を説明する。
【0028】先ず、誤読修正処理に於いて適用される類
似字形集合ファイル27が作成されるまでの処理につい
て説明する。
【0029】印刷活字ドキュメントや文書作成装置で作
成されたドキュメントを対象に、イメージスキャナ1に
よって読取動作が行われ、そのページ単位の読取イメー
ジデータは、活字認識装置2のレイアウト解析処理部2
1に送出される。
【0030】活字認識装置2のレイアウト解析処理部2
1は、イメージスキャナ1から出力されるページ単位の
読取イメージデータを受信して、その読取イメージデー
タから文字領域、イメージ領域等の像域認識を行い、そ
の領域の情報を含む所定のレイアウト解析結果の情報を
原画像(イメージデータ)と共にイメージデータファイ
ル24に格納するとともに、文字切り出し対象となる文
字領域のイメージデータを文字抽出処理部22に送出す
る。
【0031】文字抽出処理部22は、レイアウト解析処
理部21によってレイアウト解析されたイメージデータ
の内、文字領域内の文字パターンの抽出(文字切り出
し)処理を行い、その切り出した文字パターンと位置情
報等を中間ファイル25に格納するとともに、切り出し
た文字パターンを文字認識処理部23に送出する。
【0032】そして、文字認識処理部23は、文字抽出
処理部22から出力される切り出した文字パターンに対
する文字認識処理を行い、その認識結果の情報を中間フ
ァイル25に格納する。これにより、中間ファイル25
には、切り出した各文字パターンと、文字抽出処理部2
2で抽出された、各切り出し文字の1文字毎にページ番
号、領域番号、行番号、パターン番号等の各位置情報
と、文字認識処理部23で認識された認識結果の情報が
それぞれ確認・修正処理の対象として保存される。
【0033】文字認識が完了するとクラスタリング処理
部26が動作して、上記中間ファイル25に記憶された
各文字パターンについて、字形の類似性により、類似字
形を判定分類する。この判定分類には公知のクラスタリ
ング処理を適用して構わない。そして、この類似字形判
定分類を中間ファイル25内の全文字パターンデータに
対し実行して類似字形集合情報を作成し、その類似字形
集合情報を類似字形集合ファイル27に格納する。
【0034】これにより、類似字形集合ファイル27に
は、中間ファイル25内の全文字パターンについて、ク
ラスタリング処理部26のクラスタリング処理により類
似形状と見なされた文字パターンの集合を定義するデー
タが類似字形集合情報として保存される。
【0035】本発明では、このようにして作成された類
似字形集合ファイル27を修正処理部28が参照して、
オペレータの修正操作に従う誤読文字の修正を一括して
処理することを可能とする。
【0036】その一例を、図2、図3を用いて説明す
る。例えば、図2に示すような認識結果修正画面が表示
部3に表示されていたとする。この画面は、修正処理部
28が中間ファイル25をアクセスして表示部3に表示
するものである。そして、図2では認識結果領域の行L
10aの切り出し文字パターンがイメージ表示領域L1
0bに表示されており、ここでは「東」の認識率が低い
として誤読(リジェクト)表示(斜線表示)されている
ことを示している。オペレータは、原画像「東」と認識
文字「束」を見比べ、文字認識が誤っていること認識す
る。そして、リジェクト文字修正処理として、行L10
aの「束」の文字を「東」に修正するよう操作入力部4
から入力されると、修正処理部28はその修正結果を中
間ファイルに反映する。
【0037】このリジェクト文字修正操作がなされた際
に、修正処理部28は同時に類似字形集合ファイル27
を参照して、中間ファイル25内の上記修正された文字
が含まれる類似字形のすべてに修正された文字を反映さ
せ、中間ファイル25内の全ての認識結果を一括して修
正する処理を行う。この例では、類似字形集合ファイル
27に「東」と「束」が類似字形として分類されている
ことから、「束」を「東」と修正したことにより、中間
ファイル25内の全ての「束」の文字が「東」に一括修
正される。図3にはその修正例が示されている。
【0038】このような誤読修正機能により、文字認識
装置の癖によって同じような文字を全て誤認識する傾向
に対し、認識文字のクラスタリングにより類似字形集合
情報を作成することによって、同一クラスに分類された
文字を一括して修正することができる。
【0039】尚、上記した実施形態では、修正処理部2
8の誤読修正処理に於いて、誤読文字について文字訂正
がなされた際に、後続する認識結果のすべてについて類
似字形集合ファイル27を参照して中間ファイル25内
の修正文字が含まれる類似字形のすべてに修正文字を反
映させて、修正文字以降のすべての認識結果を一括して
修正しているが、これに限らず、例えば、上記操作入力
部4上で一括して修正する認識結果の範囲を指定するこ
とで、修正処理部28は、誤読文字について文字訂正が
なされた際に、上記指定された範囲のすべての認識結果
について類似字形集合ファイル27を参照して中間ファ
イル25内の修正文字が含まれる類似字形のすべてに修
正文字を反映させて、上記指定された範囲のすべての認
識結果を一括して修正することも可能である。更に、一
括して修正された各認識結果の文字パターンそれぞれを
操作入力部4上で確認操作が行われるまで特定の表示形
態で表示することも可能である。または、認識結果の修
正画面上で誤読文字について文字修正がなされた際に、
中間ファイル25内の類似字形の全ての認識結果につい
て、文字単位若しくは画面単位で確認操作を介在するこ
とも可能であり、更に、この際、認識結果が修正画面に
収まらないとき、上記確認操作に伴って認識結果修正画
面をスクロールすることも可能である。
【0040】
【発明の効果】以上詳記したように本発明によれば、例
えば印刷活字ドキュメントの文字認識において、文字認
識装置の癖によって同じような文字を全て誤認識する傾
向に対し、認識文字のクラスタリングにより類似字形集
合情報を作成することによって、同一クラスに分類され
た文字を一括して修正することを可能とし、誤読文字修
正作業が簡単な操作で容易かつ迅速に行うことができ
る。
【図面の簡単な説明】
【図1】本発明の実施形態に於ける誤読修正処理機能を
もつOCR装置の構成を示すブロック図。
【図2】上記実施形態に於ける認識結果修正画面の一例
を示す図。
【図3】上記実施形態の動作説明図。
【符号の説明】
1…イメージスキャナ 2…活字認識装置 3…表示部 4…操作入力部 21…レイアウト解析処理部 22…文字抽出処理部 23…文字認識処理部 24…イメージデータファイル 25…中間ファイル 26…クラスタリング処理部 27…類似字形集合ファイル 28…修正処理部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 文字認識処理の対象として切り出された
    すべての文字パターンに対し、当該各文字パターン相互
    の類似性に基づきクラスタリングを行い、同一クラスに
    属する文字を類似字形とする類似字形集合情報を生成
    し、 文字認識結果の修正作業で文字修正がなされた際に、前
    記類似字形集合情報を参照し、修正された文字と同一ク
    ラスに属する文字を一括して自動修正することを特徴と
    する誤読文字修正方法。
  2. 【請求項2】 前記類似字形集合情報は、文字認識結果
    をもとに動的に生成されることを特徴とする請求項1記
    載の誤読文字修正方法。
  3. 【請求項3】 読取イメージデータから文字パターンを
    抽出するステップと、 前記抽出された文字パターンの文字認識を行うステップ
    と、 前記抽出された文字パターンと前記認識結果をもとに中
    間ファイルを作成するステップと、 前記中間ファイル内の全文字パターンに対して、字形の
    類似性により類似字形を判定分類し、類似字形集合情報
    を作成するステップと、 前記中間ファイル内のデータをもとに認識結果修正画面
    を表示するステップと、 前記認識結果修正画面上で誤読文字に対し文字修正がな
    された際に、前記類似字形集合情報を参照して、前記中
    間ファイル内の前記修正された文字が分類される類似字
    形のすべてを一括して修正するステップとを具備するこ
    とを特徴とする誤読文字修正方法。
  4. 【請求項4】 文字認識処理の対象として切り出された
    すべての文字パターンに対し、当該各文字パターン相互
    の類似性に基づきクラスタリングを行い、同一クラスに
    属する文字を類似字形とする類似字形集合情報を生成す
    る類似字形集合生成手段と、 文字認識結果の修正作業で文字修正がなされた際に、前
    記類似字形集合生成手段からの類似字形集合情報を参照
    し、修正された文字と同一クラスのの類似字形を一括し
    て自動修正する処理手段とを具備することを特徴とする
    光学的文字認識装置。
  5. 【請求項5】 文字認識対象として抽出された文字パタ
    ーン、及びその抽出された文字パターンの文字認識結果
    が格納される中間ファイルと、 前記中間ファイル内の全文字パターンを対象に字形の類
    似性を判定して分類された類似字形集合情報が格納され
    る類似字形集合情報ファイルと、 前記中間ファイルを用いて作成された文字認識修正画面
    で修正操作された場合、前記類似字形集合情報ファイル
    を参照して、その修正文字が分類された類似字形を一括
    して自動修正する処理手段とを具備することを特徴とす
    る光学的文字認識装置。
  6. 【請求項6】 読取イメージデータから文字パターンを
    抽出する文字パターン抽出処理手段と、 前記文字パターン抽出処理手段で抽出された文字パター
    ンの文字認識を行う文字認識手段と、 前記文字パターン抽出処理手段で抽出された文字パター
    ンと前記文字認識手段の認識結果をもとに中間ファイル
    を作成する中間ファイル作成手段と、 前記中間ファイル作成手段により作成された中間ファイ
    ル内の全文字パターンに対して、字形の類似性により類
    似字形を判定分類し、類似字形集合情報ファイルを作成
    する類似字形集合情報ファイル作成手段と、 前記中間ファイル内のデータをもとに文字認識結果修正
    画面を表示し、誤読文字について文字修正がなされた際
    に、前記類似字形集合情報ファイルを参照して、前記修
    正文字が分類された類似字形を一括して修正する修正処
    理手段とを具備することを特徴とする光学的文字認識装
    置。
  7. 【請求項7】 前記一括して修正する認識結果の範囲を
    指定する修正範囲指定手段を有し、前記修正処理手段
    は、誤読文字について文字修正がなされた際に、前記修
    正範囲指定手段で指定された範囲のすべての認識結果に
    ついて、前記類似字形集合ファイルを参照して、前記修
    正文字が分類される類似字形を一括して修正する請求項
    6記載の光学的文字認識装置。
JP2001292002A 2001-09-25 2001-09-25 誤読文字修正方法及び光学的文字認識装置 Pending JP2003099709A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001292002A JP2003099709A (ja) 2001-09-25 2001-09-25 誤読文字修正方法及び光学的文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001292002A JP2003099709A (ja) 2001-09-25 2001-09-25 誤読文字修正方法及び光学的文字認識装置

Publications (1)

Publication Number Publication Date
JP2003099709A true JP2003099709A (ja) 2003-04-04

Family

ID=19114049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001292002A Pending JP2003099709A (ja) 2001-09-25 2001-09-25 誤読文字修正方法及び光学的文字認識装置

Country Status (1)

Country Link
JP (1) JP2003099709A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055142A (ja) * 2008-08-26 2010-03-11 Fuji Xerox Co Ltd 文書処理装置およびプログラム
US8953910B2 (en) 2011-09-30 2015-02-10 International Business Machines Corporation Proof reading of text data generated through optical character recognition
KR20200055840A (ko) * 2018-11-12 2020-05-22 전자부품연구원 선별적 딥러닝을 이용한 문자 인식 장치 및 방법

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055142A (ja) * 2008-08-26 2010-03-11 Fuji Xerox Co Ltd 文書処理装置およびプログラム
JP4661921B2 (ja) * 2008-08-26 2011-03-30 富士ゼロックス株式会社 文書処理装置およびプログラム
US8280175B2 (en) 2008-08-26 2012-10-02 Fuji Xerox Co., Ltd. Document processing apparatus, document processing method, and computer readable medium
US8953910B2 (en) 2011-09-30 2015-02-10 International Business Machines Corporation Proof reading of text data generated through optical character recognition
US8971670B2 (en) 2011-09-30 2015-03-03 International Business Machines Corporation Proof reading of text data generated through optical character recognition
KR20200055840A (ko) * 2018-11-12 2020-05-22 전자부품연구원 선별적 딥러닝을 이용한 문자 인식 장치 및 방법
KR102331982B1 (ko) * 2018-11-12 2021-11-26 한국전자기술연구원 선별적 딥러닝을 이용한 문자 인식 장치 및 방법

Similar Documents

Publication Publication Date Title
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
JPH06274680A (ja) 文書認識方法およびシステム
US20210149931A1 (en) Scalable form matching
JP2000293626A (ja) 文字認識方法及び装置ならびに記憶媒体
JPH0772906B2 (ja) 文書認識装置
JP2010061471A (ja) 文字認識装置およびプログラム
JP3573945B2 (ja) フォーマット認識装置及び文字読み取り装置
JP2003099709A (ja) 誤読文字修正方法及び光学的文字認識装置
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP3319203B2 (ja) 文書ファイリング方法及び装置
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JP3159087B2 (ja) 文書照合装置および方法
JP3930466B2 (ja) 文字認識装置、文字認識プログラム
CN112348022A (zh) 一种基于深度学习的自由格式文档识别方法
JP3000349B2 (ja) キー入力編集方法及び編集装置
JPH07152856A (ja) 光学的文字読取装置
JP4224914B2 (ja) 文字読取システム及び文字読取方法
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JPH0589279A (ja) 文字認識装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JP2024029410A (ja) 文字認識器学習装置、文字認識器学習方法、及び文字認識器学習プログラム
JP2829186B2 (ja) 光学的文字読取装置
JP2931485B2 (ja) 文字切出し装置及び方法
JP2000339405A (ja) 光学的文字認識システム、同システムに於ける帳票のフォーマットコントロール作成方法、及び同方法が格納された記憶媒体
JPH08194772A (ja) 光学的文字読取り装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070724

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070921

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071016