JP2006092027A - 文字認識装置、文字認識方法および文字認識プログラム - Google Patents

文字認識装置、文字認識方法および文字認識プログラム Download PDF

Info

Publication number
JP2006092027A
JP2006092027A JP2004273932A JP2004273932A JP2006092027A JP 2006092027 A JP2006092027 A JP 2006092027A JP 2004273932 A JP2004273932 A JP 2004273932A JP 2004273932 A JP2004273932 A JP 2004273932A JP 2006092027 A JP2006092027 A JP 2006092027A
Authority
JP
Japan
Prior art keywords
handwritten
type
character recognition
processing unit
handwriting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004273932A
Other languages
English (en)
Inventor
Teruka Saito
照花 斎藤
Toshiya Koyama
俊哉 小山
Masayoshi Sakakibara
正義 榊原
Shoichi Tateno
昌一 舘野
Kei Tanaka
圭 田中
Kotaro Nakamura
浩太郎 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004273932A priority Critical patent/JP2006092027A/ja
Priority to CNA2005100535676A priority patent/CN1752992A/zh
Priority to US11/218,492 priority patent/US20060062459A1/en
Publication of JP2006092027A publication Critical patent/JP2006092027A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/2455Discrimination between machine-print, hand-print and cursive writing

Abstract

【課題】 活字と手書き文字が混在した文書の電子化を可能とした文字認識装置、文字認識方法および文字認識プログラムを提供する。
【解決手段】 画像入力部11によって、活字と手書き文字が混在した原稿の画像が生成され、この画像は活字部/手書き部分離処理部12によって、前記活字による活字部と前記手書き文字による手書き部とに分離される。それぞれに対し、活字部OCR処理部13と手書き部OCR処理部18によりOCR処理が行われ、活字OCRの結果は登録辞書17に登録される。手書き部OCR処理部18による手書き部の認識候補が複数で、その近傍の活字OCR結果に一致する活字があったとき、この活字を利用して手書き部のOCR処理を行い、この結果をOCR結果合成処理部21で活字OCRに合成する。
【選択図】 図1

Description

本発明は、原稿の文字認識装置、文字認識方法および文字認識プログラムに関し、特に、活字と手書き文字が混在した文書の電子化を可能とした文字認識装置、文字認識方法および文字認識プログラムに関する。
近年、Eメールなど電子による文書の流通が増加しているが、その一方で、紙として出力される文書も多く存在する。これは、紙面への手書きによる追記が容易であるということが、理由の一つになっている。
文字コードなどの電子情報を紙で出力した活字文字に対しては、光学的文字認識(OCR:Optical Character Reader)ソフトウェアを用いることにより、高い確率でデジタル化した電子情報に戻すことができる。しかし、手書きで記述した文字情報は、従来、マス目指定、数字のみ等の条件を厳しく制限しなければ、実用的な認識率が得られず、オンライン/オフライン情報変換の妨げとなっていた。
手書き文字を認識する従来の文字認識装置として、例えば、文字読み取り手段からの文字データに対し、パターンマッチングにより認識する印刷文字認識手段と特徴抽出による手書き文字認識手段とによって同時に認識し、それぞれの認識結果を比較して、いずれか結果の良い方を選択する読み取り装置が知られている(例えば、特許文献1参照。)。
また、例えば、FAXの送り状などは、文面が形式化されており、その文面中の送信者、所属部所などの一部の項目についてのみ手書きをして送信する場合が多い。このような場合、手書き部分を認識することかできれば、受信文書を電子情報にして転送したり保存したりすることが容易になる。
このような用途に使用できる可能性の高い文字認識装置として、特許文献2に示されるものがある。この特許文献2に記載された光学読取方法は、読取シート上のマークと印刷または手書きされた文字等の情報とを光学的に読み取り、光学的に読み取られた文字データを複数の認識手段に送信し、これら複数の認識手段によって文字データを認識し、マークデータと複数の認識手段によって認識された文字認識データとを合成し、マークと印刷または手書きで書かれた文字が混在する読取シートを高速に読み取ることができるようにしている。
特開平7−37034号公報([0019]、[0023]、[0024]、図1、図3) 特開2000−315246号公報([0020]〜[0036]、図1、図2、図3)
しかし、従来の文字認識装置によると、特許文献1の場合、活字認識と手書き認識を単独に処理しており、例えば、活字データを手書きの認識処理に反映させるような処理はなされておらず、従って、手書き認識のための制限が多くなり、郵便物、帳票、申込書のような大量用途など特定の場面でしか手書き入力を利用できなかった。
また、特許文献2によると、読取シート上のマークと活字/手書き文字が対象であり、適用対象の原稿は限られ、マークを含まない一般的な文書の手書き認識は行えない。また、読取シートを登録する負荷が大きく、柔軟な書式変更が難しい。更に、マス目指定、数字のみ等の条件が厳しいため、一般的な文書では、実用的な認識率は得られず、オンライン/オフライン情報変換に用いることは難しい。
従って、本発明の目的は、活字と手書き文字が混在した文書の電子化を可能とした文字認識装置、文字認識方法および文字認識プログラムを提供することにある。
本発明は、上記目的を達成するため、活字と手書き文字が混在した文書データを活字部と手書き部とに分離する分離処理部と、前記活字部を文字認識する活字部認識処理部と、前記活字部の文字認識結果を利用して前記手書き部を文字認識する手書き部認識処理部とを備えたことを特徴とする文字認識装置を提供する。
活字部の文字認識率の方が手書き部の文字認識率よりも高いことから、活字部の文字認識結果を利用して手書き部を文字認識することにより、手書き部の文字認識率を高めることが可能となる。
上記手書き部認識処理部は、活字部の文字の位置あるいは使用頻度に基づいて利用する範囲を決定し、その決定した範囲の活字部の文字認識結果を利用して手書き部を文字認識してもよい。手書き部に近い活字、あるいは使用頻度の高い活字に関連して手書き部が追記される傾向にあることから、手書き部に近い活字、頻度の高い活字を利用する範囲と決定し、その決定した範囲の活字部の文字認識結果を利用することにより、手書き文字の認識率が高くなる。
また、上記手書き部認識処理部は、活字部の文字認識結果、およびその関連語、類義語および反対語を利用して手書き部を文字認識してもよい。手書き部と同じ文字の活字部が存在しない場合でも、手書き部に何らかの関係を有する活字部を利用することができるため、手書き文字の認識率が高くなる。
さらに、上記手書き部認識処理部は、活字部の文字認識結果を活字部の文字の位置あるいは使用頻度に応じて重み付けを付加して利用し、手書き部を文字認識してもよい。手書き部に近い活字、あるいは使用頻度の高い活字に関連して手書き部が追記される傾向にあることから、手書き部に近い活字ほど、使用頻度が高いほど重み付けを大きくすることにより、手書き文字の認識率が高くなる。
本発明は、上記目的を達成するため、活字と手書き文字が混在した文書データを活字部と手書き部とに分離する分離処理部と、前記活字部を文字認識する活字部認識処理部と、
前記活字部の文字認識結果を利用して前記手書き部を文字認識する手書き部認識処理部と、
前記活字部の文字認識結果と前記手書き部の文字認識結果とを合成する合成処理部とを備えたことを特徴とする文字認識装置を提供する。
活字部の文字認識結果と手書き部の文字認識結果とを合成して出力することによって活字と手書き文字が混在した文書データを電子データの形態に変換することができる。
本発明は、上記目的を達成するため、活字と手書き文字が混在した文書データを活字部と手書き部とに分離する分離処理部と、属性に関する辞書を参照して前記活字部を文字認識する活字部認識処理部と、前記手書き部を文字認識する手書き部認識処理部と、前記活字部の文字認識結果のうち前記属性に対応する手書き部の文字列を対応させるマッチング処理部とを備えたことを特徴とする文字認識装置を提供する。
属性に関する辞書を参照することにより文書データ中の活字部に含まれる属性を認識することができ、属性に対応する手書き部をマッチングさせることができる。
本発明は、上記目的を達成するため、活字と手書き文字が混在した複数の文書データを活字部と手書き部とに分離する分離処理部と、前記複数の文書データの前記活字部を文字認識するとともに、頻度の高い文字列を属性として記憶する活字部認識処理部と、前記手書き部を文字認識する手書き部認識処理部と、前記活字部の文字認識結果のうち前記属性に対応する手書き部の文字列を対応させるマッチング処理部とを備えたことを特徴とする文字認識装置を提供する。
属性に関する辞書を用いなくても、複数の文書データで頻度の高い文字列を属性とすることにより、属性に対応する手書き部をマッチングさせることができる。
上記マッチング処理部は、手書き部の文字認識結果を、活字部の文字認識結果のうち手書き部の周辺に位置する活字と関連づけて記憶する構成としてもよい。また、上記マッチング処理部は、手書き部の文字認識結果を、活字部の文字認識結果のうち手書き部の上、下、左または右に位置する活字と関連づけて記憶する構成としてもよい。
本発明は、上記目的を達成するため、活字と手書き文字が混在した文書データを活字部と手書き部とに分離し、前記活字部を文字認識し、前記活字部の文字認識結果を利用して前記手書き部を文字認識することを特徴とする文字認識方法を提供する。
本発明は、上記目的を達成するため、活字と手書き文字が混在した文書データを活字部と手書き部とに分離し、属性に関する辞書を参照して前記活字部を文字認識し、前記手書き部を文字認識し、前記活字部の文字認識結果のうち前記属性に対応する手書き部の文字列を対応させることをマッチング処理部とを特徴とする文字認識方法を提供する。
本発明は、上記目的を達成するため、活字と手書き文字が混在した複数の文書データを活字部と手書き部とに分離し、前記複数の文書データの前記活字部を文字認識するとともに、頻度の高い文字列を属性として記憶し、前記手書き部を文字認識し、前記活字部の文字認識結果のうち前記属性に対応する手書き部の文字列を対応させることを特徴とする文字認識方法を提供する。
本発明は、上記目的を達成するため、活字と手書き文字が混在した文書データを活字部と手書き部とに分離する分離処理手段と、前記活字部を文字認識する活字部認識処理手段と、前記活字部の文字認識結果を利用して前記手書き部を文字認識する手書き部認識処理手段とをコンピュータに実行させるための文字認識プログラムを提供する。
本発明は、上記目的を達成するため、活字と手書き文字が混在した文書データを活字部と手書き部とに分離する分離処理手段と、属性に関する辞書を参照して前記活字部を文字認識する活字部認識処理手段と、前記手書き部を文字認識する手書き部認識処理手段と、前記活字部の文字認識結果のうち前記属性に対応する手書き部の文字列を対応させるマッチング処理手段とをコンピュータに実行させるための文字認識プログラムを提供する。
本発明は、上記目的を達成するため、活字と手書き文字が混在した複数の文書データを活字部と手書き部とに分離する分離処理手段と、前記複数の文書データの前記活字部を文字認識するとともに、頻度の高い文字列を属性として記憶する活字部認識処理手段と、前記手書き部を文字認識する手書き部認識処理手段と、前記活字部の文字認識結果のうち前記属性に対応する手書き部の文字列を対応させるマッチング処理手段とをコンピュータに実行させるための文字認識プログラムを提供する。
本発明によれば、活字と手書き文字が混在した文書の電子化が可能となる。
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る文字認識装置を示す。この文字認識装置1は、スキャナ等により原稿を読み取って画像データを入力する画像入力部11と、画像入力部11により読み取られた画像データを活字部と手書き部に分離する活字部/手書き部分離処理部12と、活字部の文字認識処理を実行する活字部OCR処理部13と、活字OCRのための辞書が格納されている活字部OCR辞書14と、登録辞書17への登録処理を行う辞書登録処理部15と、関連語、類義語および反対語が格納されている関連語・類義語・反対語辞書16と、活字OCRによる文字、単語群が登録される登録辞書17と、特徴抽出法等によって手書き部の文字認識処理を実行する手書き部OCR処理部18と、手書きOCRのための辞書が格納されている手書きOCR辞書19と、活字部および手書き部の文字認識結果が格納されるOCR結果記憶部20と、活字部と手書き部の文字認識結果を合成するOCR結果合成処理部21と、OCR結果合成処理部21によって合成された結果を出力するOCR結果出力部22と、OCR結果出力部22から出力された内容を格納する最終OCR結果記憶部23とを備える。なお、手書き部OCR処理部18とOCR結果合成処理部21により、出力処理部を構成している。
活字部/手書き部分離処理部12は、画像データ内の画素の濃淡および文字色等に基づいてヒストグラムを生成し、これに基づいて画像データを活字部からなる画像データと手書き部からなる画像データとに分離するものである。なお、活字部からなる画像データを特定できれば、それ以外の場所に存在する画像部分を手書き部と見なしてもよい。
活字部OCR処理部13は、切り出された活字の文字パターンと活字OCR辞書14に登録されている活字パターンとをパターンマッチング法により比較し、類似度の最も高いものを活字部の認識結果として出力するものである。
活字部OCR辞書14、関連語・類義語・反対語辞書16、登録辞書17、手書きOCR辞書19、OCR結果記憶部20、および最終OCR結果記憶部23は、それぞれ1または複数のハードディスクにそれぞれの領域を確保する構成にすることができる。
登録辞書17は、登録辞書情報として、活字内の個別文字/単語(名詞/固有名詞)、および活字内の単語の類義語(意味的に似ている単語)、関連語、分野に対応する用語等が登録される。分野に対応する用語としては、例えば、「弊社」、「貴社」等の文字に対してはビジネス用語辞書、「氏名」等の文字に対しては人名辞書、「メモリ」、「CPU」等に対しては「コンピュータ用語辞書」がある。
手書き部OCR処理部18は、傾き補正や、画像データから文字を含む矩形領域を1文字ずつ切り出す等の前処理を行う前処理部180と、前処理部180によって切り出された矩形領域について手書きOCR辞書19を用いて1文字ずつ文字認識処理を行う個別文字認識部181と、登録辞書17を用いて単語単位等の文字列で言語処理等を行う後処理部182とを備える。
個別文字認識部181は、切り出された手書き文字から抽出した特徴データと手書きOCR辞書19に登録されている文字の特徴データとを比較し、類似度の最も高いものを手書き文字の認識結果として出力するものである。
また、手書き部OCR処理部18は、活字部OCR処理部13による活字部の認識結果を利用して手書き部の文字認識を行うものであり、その利用する活字の範囲および処理は以下のものが考えられる。
(1)段落または文字ブロック内、ページ内、文書内、同文書群内とする。
(2)手書き文字と、活字文字との近接度合いや使用頻度によって利用する活字の範囲を決定する。
(3)手書き文字と活字文字との近接度合いや使用頻度によって活字登録情報の重み付けを行う。なお、文書校正で使用する場合、最も近いものは誤字の可能性があるため、最も位置的に近いものは除外する。
(4)他の手書き文字周辺の活字は、同じものを訂正している場合があるので、重み付けを上げる。
(第1の実施の形態の動作)
次に、第1の実施の形態の動作を図2〜図5を参照して説明する。図2は、活字および手書きが混在したOCR対象の原稿の一例を示す。図3は、取り込んだ画像から活字部分と手書き部分を分離した認識結果を示し、(a)は活字部認識結果、(b)は手書き認識結果を示す。図4は、登録辞書17における登録内容を示し、図5は、OCR結果合成処理部21による処理結果を示す。
図2に示すスキャン原稿25は、パーソナルコンピュータやワードプロセッサで原稿を作製し、プリントアウトした活字部250による文書中に、ユーザの手書きによる手書き部251として、例えば、「自動で」の文字を追記したものである。この手書き部251は、本実施の形態では、活字領域との区別を容易にするため、活字部250の色とは異なる赤色等の色の筆記具を用いて記入している。
画像入力部11によってスキャン原稿25を読み取ると、スキャン原稿25はデジタル信号化され、活字部/手書き部分離処理部12に出力される。
活字部/手書き部分離処理部12は、入力されたスキャン原稿25の画像データを、図3(a)に示すように、活字部250を含んだ活字画像データ26と、同図(b)に示すように、手書き部251を含んだ手書き画像データ27とに分離する。
次に、活字部OCR処理部13は、活字部OCR辞書14を参照して図3(a)の活字部250について文字認識処理を行い、その結果を活字認識結果としてOCR結果記憶部20に保存する。
次に、辞書登録処理部15は、図4に示すように、活字部250内の語句の出現する頻度、語句の位置(座標)を把握し、更に、各語句に対する関連語、類義語、反対語を、関連語・類義語・反対語辞書16を参照して抽出し、それらを登録辞書17に保存する。例えば、「インストール」の語句は、図3の(a)に示す活字部250内には、1行目、3行目、7行目の3箇所に表記されている。従って、「インストール」の頻度は「3」であり、その反対語として「アンインストール」が有るが、類義語はない。また、「マニュアル」の語句は、1行目のみであるため、その頻度は「1」であり、反対語は無いが、類義語として「説明書」がある。その他の語句についても、同様にして辞書登録の処理が行われる。
次に、手書き部OCR処理部18は、図3(b)に示す手書き部251に対するOCR処理を行う。すなわち、前処理部180によって切り出しなどを行った後、個別文字認識部181によって「自動で」の文を1文字単位で認識し、更に後処理部182で言語処理が行われる。この段階では、「自動」、「で」に対する認識候補が決定されている。手書き文字は、書いた人によって様々な字体になるため、候補単語が1つとは限らない。そのため、通常は、「自動」が「自動」として確定される機会は少なく、近いと判定された複数の単語が認識候補として提示される。表1は、その認識候補の一例を示す。なお、認識候補が1つだけであれば、それを選択する。
表1は、手書き部251の内容に対して、複数の認識候補が示されている場合を示す。ここでは、「自動」、「自働」、「自衛」、「白線」が手書き部251の文に対する候補単語として示されている。このとき、それぞれの単語について、「自動で」の「自動」の部分に対するOCR処理上の信頼度が%で算出される。ここでは、3つの単語が同じ30%になっている。
後処理部182は、登録辞書17を参照し、「自動」、「自働」、「自衛」、「白線」の内のいずれを選択すべきかを決定する。それぞれの単語について、スキャン原稿25上の「自動」に対する位置の近さや活字の出現頻度を用いて、複数の単語のそれぞれの確からしさを算出する。図3および図4に示すように、「自動」が活字部250内に存在し、その頻度も多く、手書き部251に近い位置に「自動」の活字が存在するため、4つの候補単語の内、「自動」の優先順位(信頼度)を上げ、これをOCR結果として確定する。確定した結果は、手書き認識結果としてOCR結果記憶部20に保存される。
次に、手書き部OCR処理部18の処理が終了すると、OCR結果合成処理部21は、OCR結果記憶部20から活字部250に対するOCR処理結果と手書き部251に対するOCR処理結果を読み出して図5のように活字部250と活字部252とを合成してOCR結果合成画像28を得る。このOCR結果合成画像28は、OCR結果出力部22によって最終OCR結果記憶部23に保存される。以上により、原稿画像の電子化が完了する。
(第1の実施の形態の効果)
この第1の実施の形態によれば、以下の効果が得られる。
(イ)手書きOCRよりも認識率の高い活字OCRの結果を利用して手書き部251の文字または文字列のOCR処理を手書き部OCR処理部18によって行うようにしたため、手書き文字の認識率を向上させることができる。
(ロ)手書き認識に制限がなくなり、特定の帳票等に頼らない手書き文字の電子化や活用を可能にすることができる。
[第2の実施の形態]
図6は、本発明の第2の実施の形態に係る文字認識装置を示す。この文字認識装置1は、第1の実施の形態において、辞書登録処理部15、関連語・類義語・反対語辞書16、登録辞書17およびOCR結果記憶部20を除くとともに、画像入力部11による画像入力に際して属性を定義する属性定義部31を付加し、OCR結果合成処理部21に代えてマッチング処理部32を設けたものであり、その他の構成は、第1の実施の形態と同様である。
属性定義部31は、ユーザの入力操作によって読取対象の原稿、例えば、FAX送付票から取り出したい送付先、送信者、枚数等の属性に対応する項目名と、これらの項目名に対する類義語等の見出し語群を属性定義として活字OCR辞書14に登録するものである。
活字部OCR処理部13は、この実施の形態では、見出し語群も単語認識結果として出力するようになっている。
マッチング処理部32は、活字部OCR処理部13および手書き部OCR処理部18によるOCR結果のマッチング処理を行うものである。
(第2の実施の形態の動作)
次に、第2の実施の形態の動作を図7を参照して説明する。
図7は、第2の実施の形態で扱われる活字および手書きが混在したOCR対象の原稿の一例を示し、同図中、(a)は原稿としてのFAX送付票を示し、(b)は別のFAX送付票を示す。原稿としてのFAX送付票33は、送付先、送信者、送信枚数、送信内容等の項目名を含む活字部330による属性と、この属性に対して役職名、送信者の氏名、送信枚数を示す数字、送信内容を示す文章等が手書きで書き込まれた手書き部331とを有している。
ユーザは、予め図7に示すFAX送付票33から取り出したい属性と、類義語などの見出し語群を属性定義として、活字OCR辞書14に表2のように登録しておく。これによって、図7の(a)のFAX送付票33の「送付先」も図7の(b)のFAX送付票34の「宛先」も、共に「属性:送信先」が割り当てられる。
次に、画像入力部11によりFAX送付票33をスキャナ等でスキャンして入力する。活字部/手書き部分離処理部12は、入力されたFAX送付票33の画像データを、第1の実施の形態で説明したように、活字部330と手書き部331に分離する。活字部OCR処理部13は、活字OCR辞書14を参照して活字部330のOCR処理を行い、手書き部OCR処理部18は、手書きOCR辞書19を参照して手書き部331のOCR処理を行う。
マッチング処理部32は、活字部OCR処理部13および手書き部OCR処理部18によるOCR結果のマッチング処理を行う。この処理は、登録されている見出し語群と手書き部OCR処理部18によるOCR結果をマッチングさせ、記入位置に最も近い属性を手書き部OCR処理部18によるOCR結果に割り当てる。また、FAX送付票33上における手書き部331の位置情報も保存する。次に、活字部330と手書き部331の位置関係から、両者をマッチングさせる。図7の(a)のFAX送付票33では、活字OCR結果の「送付先」と、手書きOCR結果の「海外事業部長殿」がマッチングされる。このとき、属性が付与されている活字だけをマッチングさせても良い。
最後に、OCR結果出力部22は、組となった属性(送付先、送信者等)と属性値(海外事業部長殿、A社中央支社山田等)、属性および属性値が活字部330,331として活字化された電子情報を最終OCR結果記憶部23に保存する。
(第2の実施の形態の効果)
この第2の実施の形態によれば、下記の効果が得られる。
(イ)活字部330と手書き部331が混在するFAX送付票33に対し、属性と手書きによる属性値との組を認識し、FAX送付票33から電子情報へのフォームの変更を行うことにより、決まったフォームを厳密に登録することなく手書きデータの収集を容易に行うことができる。
(ロ)フォームを厳密に登録する必要がないため、フォームの変更を容易にすることができ、手書き部331と活字部330の厳密な位置合わせが不要なため、位置合わせ処理の時間短縮が可能になる他、読み取りエラーを減少させることができる。
(ハ)属性と属性値とをマッチングしているので、FAX送信票を受信したとき、これを電子情報にして、FAX送信票とは異なるフォーマットのEメールにより、送信先の“海外事業部長”へ転送することも可能になる。
[第3の実施の形態]
図8は、本発明の第3の実施の形態に係る文字認識装置を示す。本実施の形態は、第2の実施の形態において、属性定義は行わず、最終OCR結果記憶部23に代えて属性・属性値抽出結果記憶部41を設け、この属性・属性値抽出結果記憶部41に活字部OCR処理部13および手書き部OCR処理部18によるOCR結果を保存する構成にしたものであり、他の構成は、第2の実施の形態と同様である。
活字部OCR処理部13は、この実施の形態では、抽出した単語をカウントし、頻度が多い単語を属性として属性・属性値抽出結果記憶部41に登録するようにしている。
(第3の実施の形態の動作)
次に、第3の実施の形態の動作を図9〜図11を参照して説明する。
図9は、画像入力部11に入力される原稿としての会員申込書を示す。図10は、図9の会員申込書から活字部OCR処理部により抽出された属性の一例を示し、図11は、属性・属性値抽出結果記憶部41に保存された属性と属性値の一例を示す。
会員申込書42は、規定の印刷フォームが活字による活字部420と罫線により形成されており、この印刷フォーム内に手書きによる氏名、住所等が手書き部421として記入されている。この会員申込書42は、氏名等の異なる複数枚が用意されている。
まず、複数枚の会員申込書42が、スキャナ等により順次スキャンされることによって画像入力部11に入力される。次に、活字部/手書き部分離処理部12は、第1の実施の形態で説明したように、画像データを活字部420と手書き部421に分離する。活字部OCR処理部13は、活字OCR辞書14を参照して活字部420のOCR処理を行い、手書き部OCR処理部18は、手書きOCR辞書19を参照して手書き部421のOCR処理を行う。
活字部OCR処理部13の処理においては、抽出された単語をカウントし、会員申込書42の全枚数に対する割合が大きい、すなわち頻度が多い単語を属性とした登録内容43が、図10のように、属性・属性値抽出結果記憶部41に登録される。また、それぞれの会員申込書42ごとに、会員申込書42上の単語の位置も属性・属性値抽出結果記憶部41に保存する。なお、予め属性を属性・属性値抽出結果記憶部41に登録しておいてもよい。
次に、活字部420と手書き部42Bの距離、手書き部421の上下、左右にある活字部420等の位置関係から、マッチング処理部32によって両者をマッチングさせる。ここでは、同じ罫線内、枠内、下地の色内の活字部420と、手書き部421とをマッチングさせるルールとしている。なお、二重の関連づけを回避するため、一度関連づけられた活字部420はリストから除外する。最後に、OCR結果出力部22により、組となった属性と属性値が、図11のような形で属性・属性値抽出結果記憶部41に登録内容44として保存される。
(第3の実施の形態の効果)
この第3の実施の形態によれば、以下の効果が得られる。
(イ)予めフォームを登録しておくことなく、属性を付与した手書きデータの収集を行うことができる。
(ロ)アンケートを集計する際、質問票をスキャンすると、質問と回答を組にして蓄積するといった用途にも適用することができる。
なお、第3の実施の形態においては、会員申込書42を例に説明したが、本発明は、会員申込書42に限定されるものではなく、同一のフォームを有し、かつ活字部と手書き部を有する複数の原稿の全てに適用可能である。
[他の実施の形態]
なお、本発明は、上記各実施の形態に限定されず、その要旨を変更しない範囲内で種々の変形が可能であり、各実施の形態間で構成要素の組み合わせを任意に行うことができる。
本発明の第1の実施の形態に係る文字認識装置を示すブロック図である。 活字および手書きが混在したOCR対象の原稿の一例を示す平面図である。 図1の画像入力部に取り込んだ画像から活字部分と手書き部分を分離した画像データを示し、(a)は活字部の画像データを示す図、(b)は手書き部の画像データを示す図である。 登録辞書における登録内容を示す説明図である。 図1のOCR結果合成処理部による処理結果を示す画像図である。 本発明の第2の実施の形態に係る文字認識装置を示すブロック図である。 第2の実施の形態で扱われる活字および手書きが混在したOCR対象の原稿の一例を示し、(a)は原稿としてのFAX送付票を示す平面図、(b)は別のFAX送付票を示す平面図である。 本発明の第3の実施の形態に係る文字認識装置を示すブロック図である。 画像入力部に入力される原稿としての会員申込書を示す。 図9の会員申込書から活字部OCR処理部により抽出された属性の登録内容を示す説明図である。 図8の属性・属性値抽出結果記憶部に保存された属性と属性値の登録内容を示す説明図である。
符号の説明
1 文字認識装置
11 画像入力部
12 活字部/手書き部分離処理部
13 活字部OCR処理部
14 活字部OCR辞書
15 辞書登録処理部
16 関連語・類義語・反対語辞書
17 登録辞書
18 手書き部OCR処理部
19 手書きOCR辞書
20 OCR結果記憶部
21 OCR結果合成処理部
22 OCR結果出力部
23 最終OCR結果記憶部
25 スキャン原稿
26 活字認識結果
27 手書き認識結果
28 OCR結果合成画像
31 属性定義部
32 マッチング処理部
33 FAX送付票
34 FAX送付票
41 属性・属性値抽出結果記憶部
42 会員申込書
43,44 登録内容
180 前処理部
181 個別文字認識部
182 後処理部
250 活字部
251 手書き部
252 活字部
330 活字部
331,332 手書き部
420 活字部
421 手書き部

Claims (15)

  1. 活字と手書き文字が混在した文書データを活字部と手書き部とに分離する分離処理部と、
    前記活字部を文字認識する活字部認識処理部と、
    前記活字部の文字認識結果を利用して前記手書き部を文字認識する手書き部認識処理部とを備えたことを特徴とする文字認識装置。
  2. 前記手書き部認識処理部は、前記活字部の文字の位置あるいは使用頻度に基づいて利用する範囲を決定し、その決定した範囲の前記活字部の文字認識結果を利用して前記手書き部を文字認識することを特徴とする請求項1に記載の文字認識装置。
  3. 前記手書き部認識処理部は、前記活字部の文字認識結果、およびその関連語、類義語および反対語を利用して前記手書き部を文字認識することを特徴とする請求項1に記載の文字認識装置。
  4. 前記手書き部認識処理部は、前記活字部の文字認識結果を前記活字部の文字の位置あるいは使用頻度に応じて重み付けを付加して利用し、前記手書き部を文字認識することを特徴とする請求項1に記載の文字認識装置。
  5. 活字と手書き文字が混在した文書データを活字部と手書き部とに分離する分離処理部と、
    前記活字部を文字認識する活字部認識処理部と、
    前記活字部の文字認識結果を利用して前記手書き部を文字認識する手書き部認識処理部と、
    前記活字部の文字認識結果と前記手書き部の文字認識結果とを合成する合成処理部とを備えたことを特徴とする文字認識装置。
  6. 活字と手書き文字が混在した文書データを活字部と手書き部とに分離する分離処理部と、
    属性に関する辞書を参照して前記活字部を文字認識する活字部認識処理部と、
    前記手書き部を文字認識する手書き部認識処理部と、
    前記活字部の文字認識結果のうち前記属性に対応する手書き部の文字列を対応させるマッチング処理部とを備えたことを特徴とする文字認識装置。
  7. 活字と手書き文字が混在した複数の文書データを活字部と手書き部とに分離する分離処理部と、
    前記複数の文書データの前記活字部を文字認識するとともに、頻度の高い文字列を属性として記憶する活字部認識処理部と、
    前記手書き部を文字認識する手書き部認識処理部と、
    前記活字部の文字認識結果のうち前記属性に対応する手書き部の文字列を対応させるマッチング処理部とを備えたことを特徴とする文字認識装置。
  8. 前記マッチング処理部は、前記手書き部の文字認識結果を、前記活字部の文字認識結果のうち前記手書き部の周辺に位置する活字と関連づけて記憶することを特徴とする請求項6又は7に記載の文字認識装置。
  9. 前記マッチング処理部は、前記手書き部の文字認識結果を、前記活字部の文字認識結果のうち前記手書き部の上、下、左または右に位置する活字と関連づけて記憶することを特徴とする請求項6又は7に記載の文字認識装置。
  10. 活字と手書き文字が混在した文書データを活字部と手書き部とに分離し、
    前記活字部を文字認識し、
    前記活字部の文字認識結果を利用して前記手書き部を文字認識することを特徴とする文字認識方法。
  11. 活字と手書き文字が混在した文書データを活字部と手書き部とに分離し、
    属性に関する辞書を参照して前記活字部を文字認識し、
    前記手書き部を文字認識し、
    前記活字部の文字認識結果のうち前記属性に対応する手書き部の文字列を対応させることをマッチング処理部とを特徴とする文字認識方法。
  12. 活字と手書き文字が混在した複数の文書データを活字部と手書き部とに分離し、
    前記複数の文書データの前記活字部を文字認識するとともに、頻度の高い文字列を属性として記憶し、
    前記手書き部を文字認識し、
    前記活字部の文字認識結果のうち前記属性に対応する手書き部の文字列を対応させることを特徴とする文字認識方法。
  13. 活字と手書き文字が混在した文書データを活字部と手書き部とに分離する分離処理手段と、
    前記活字部を文字認識する活字部認識処理手段と、
    前記活字部の文字認識結果を利用して前記手書き部を文字認識する手書き部認識処理手段とをコンピュータに実行させるための文字認識プログラム。
  14. 活字と手書き文字が混在した文書データを活字部と手書き部とに分離する分離処理手段と、
    属性に関する辞書を参照して前記活字部を文字認識する活字部認識処理手段と、
    前記手書き部を文字認識する手書き部認識処理手段と、
    前記活字部の文字認識結果のうち前記属性に対応する手書き部の文字列を対応させるマッチング処理手段とをコンピュータに実行させるための文字認識プログラム。
  15. 活字と手書き文字が混在した複数の文書データを活字部と手書き部とに分離する分離処理手段と、
    前記複数の文書データの前記活字部を文字認識するとともに、頻度の高い文字列を属性として記憶する活字部認識処理手段と、
    前記手書き部を文字認識する手書き部認識処理手段と、
    前記活字部の文字認識結果のうち前記属性に対応する手書き部の文字列を対応させるマッチング処理手段とをコンピュータに実行させるための文字認識プログラム。
JP2004273932A 2004-09-21 2004-09-21 文字認識装置、文字認識方法および文字認識プログラム Pending JP2006092027A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004273932A JP2006092027A (ja) 2004-09-21 2004-09-21 文字認識装置、文字認識方法および文字認識プログラム
CNA2005100535676A CN1752992A (zh) 2004-09-21 2005-03-08 文字识别装置、文字识别方法及文字识别程序
US11/218,492 US20060062459A1 (en) 2004-09-21 2005-09-06 Character recognition apparatus, character recognition method, and recording medium in which character recognition program is stored

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004273932A JP2006092027A (ja) 2004-09-21 2004-09-21 文字認識装置、文字認識方法および文字認識プログラム

Publications (1)

Publication Number Publication Date
JP2006092027A true JP2006092027A (ja) 2006-04-06

Family

ID=36074051

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004273932A Pending JP2006092027A (ja) 2004-09-21 2004-09-21 文字認識装置、文字認識方法および文字認識プログラム

Country Status (3)

Country Link
US (1) US20060062459A1 (ja)
JP (1) JP2006092027A (ja)
CN (1) CN1752992A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100440250C (zh) * 2007-03-09 2008-12-03 清华大学 印刷体蒙古文字符识别方法
JP2012155662A (ja) * 2011-01-28 2012-08-16 Hitachi Ltd 文書処理装置及び文書処理方法
JP2012190114A (ja) * 2011-03-09 2012-10-04 Seiko Epson Corp 印刷データを用いた売上分析用プログラム、売上情報取得装置、及び、売上情報取得方法
KR20170087357A (ko) * 2016-01-20 2017-07-28 엘지전자 주식회사 이동 단말기 및 그 제어 방법
JP2018036794A (ja) * 2016-08-30 2018-03-08 コニカミノルタ株式会社 画像処理装置及びプログラム
JP2020101843A (ja) * 2018-12-19 2020-07-02 キヤノン株式会社 画像処理システム、画像処理方法、画像処理装置
CN111723807A (zh) * 2019-03-20 2020-09-29 Sap欧洲公司 使用端到端深度学习识别机打字符和手写字符
WO2022190900A1 (ja) * 2021-03-08 2022-09-15 株式会社 東芝 情報処理装置、プログラム及びシステム
JP7387339B2 (ja) 2019-08-30 2023-11-28 キヤノン株式会社 画像処理システム、画像処理方法、及びプログラム

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007179276A (ja) * 2005-12-27 2007-07-12 Internatl Business Mach Corp <Ibm> 適合判定方法、装置、およびプログラム
JP4810287B2 (ja) * 2006-04-13 2011-11-09 キヤノン株式会社 データ処理装置及びそのデータ登録方法
JP2008299780A (ja) * 2007-06-04 2008-12-11 Fuji Xerox Co Ltd 画像処理装置、及び画像処理プログラム
JP4590433B2 (ja) * 2007-06-29 2010-12-01 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP2009076240A (ja) * 2007-09-19 2009-04-09 Canon Inc 電子放出装置及びこれを用いた画像表示装置
JP5376795B2 (ja) * 2007-12-12 2013-12-25 キヤノン株式会社 画像処理装置、画像処理方法、そのプログラム及び記憶媒体
JP5247177B2 (ja) * 2008-02-08 2013-07-24 キヤノン株式会社 文書管理装置、文書管理方法およびプログラム
JP5363591B2 (ja) * 2009-12-15 2013-12-11 富士通フロンテック株式会社 文字認識方法、文字認識装置および文字認識プログラム
CN101901075B (zh) * 2010-06-25 2012-08-15 北京捷通华声语音技术有限公司 一种点密度非线性归一化文字识别方法和装置
CN101980156A (zh) * 2010-11-22 2011-02-23 上海合合信息科技发展有限公司 自动提取电子邮件地址并新建电子邮件的方法
US9256592B1 (en) * 2012-11-07 2016-02-09 Amazon Technologies, Inc. System for detecting and correcting broken words
US8941874B2 (en) * 2012-11-07 2015-01-27 Xerox Corporation Method and apparatus for automatically entering data in a print order based upon a prose attribute entry
JP2016015115A (ja) * 2014-06-09 2016-01-28 株式会社リコー 情報処理装置、情報処理方法、及び記録媒体
WO2016061292A1 (en) * 2014-10-17 2016-04-21 SimonComputing, Inc. Method and system for imaging documents in mobile applications
CN106326887B (zh) * 2016-08-29 2019-05-21 东方网力科技股份有限公司 一种光学字符识别结果的校验方法及装置
US10949662B2 (en) * 2017-12-27 2021-03-16 Seiko Epson Corporation Image processing apparatus
JP7247496B2 (ja) * 2018-09-14 2023-03-29 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US10783323B1 (en) * 2019-03-14 2020-09-22 Michael Garnet Hawkes Analysis system
JP2022092119A (ja) * 2020-12-10 2022-06-22 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP2022148922A (ja) * 2021-03-24 2022-10-06 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2022162474A (ja) * 2021-04-12 2022-10-24 キヤノン株式会社 画像処理システム、画像処理方法、及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5181255A (en) * 1990-12-13 1993-01-19 Xerox Corporation Segmentation of handwriting and machine printed text
JPH0772906B2 (ja) * 1991-07-10 1995-08-02 富士ゼロックス株式会社 文書認識装置
JP2001184453A (ja) * 1999-12-22 2001-07-06 Hitachi Ltd 帳票処理システムおよび帳票ファイリングシステム
US7254269B2 (en) * 2000-08-31 2007-08-07 Hewlett-Packard Development Company, L.P. Character recognition system
US6909805B2 (en) * 2001-01-31 2005-06-21 Matsushita Electric Industrial Co., Ltd. Detecting and utilizing add-on information from a scanned document image
US20050289182A1 (en) * 2004-06-15 2005-12-29 Sand Hill Systems Inc. Document management system with enhanced intelligent document recognition capabilities

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100440250C (zh) * 2007-03-09 2008-12-03 清华大学 印刷体蒙古文字符识别方法
JP2012155662A (ja) * 2011-01-28 2012-08-16 Hitachi Ltd 文書処理装置及び文書処理方法
JP2012190114A (ja) * 2011-03-09 2012-10-04 Seiko Epson Corp 印刷データを用いた売上分析用プログラム、売上情報取得装置、及び、売上情報取得方法
KR20170087357A (ko) * 2016-01-20 2017-07-28 엘지전자 주식회사 이동 단말기 및 그 제어 방법
KR102574900B1 (ko) 2016-01-20 2023-09-06 엘지전자 주식회사 이동 단말기 및 그 제어 방법
JP2018036794A (ja) * 2016-08-30 2018-03-08 コニカミノルタ株式会社 画像処理装置及びプログラム
JP2020101843A (ja) * 2018-12-19 2020-07-02 キヤノン株式会社 画像処理システム、画像処理方法、画像処理装置
JP7262993B2 (ja) 2018-12-19 2023-04-24 キヤノン株式会社 画像処理システム、画像処理方法、画像処理装置
CN111723807A (zh) * 2019-03-20 2020-09-29 Sap欧洲公司 使用端到端深度学习识别机打字符和手写字符
CN111723807B (zh) * 2019-03-20 2023-12-26 Sap欧洲公司 使用端到端深度学习识别机打字符和手写字符
JP7387339B2 (ja) 2019-08-30 2023-11-28 キヤノン株式会社 画像処理システム、画像処理方法、及びプログラム
WO2022190900A1 (ja) * 2021-03-08 2022-09-15 株式会社 東芝 情報処理装置、プログラム及びシステム

Also Published As

Publication number Publication date
US20060062459A1 (en) 2006-03-23
CN1752992A (zh) 2006-03-29

Similar Documents

Publication Publication Date Title
JP2006092027A (ja) 文字認識装置、文字認識方法および文字認識プログラム
US7801392B2 (en) Image search system, image search method, and storage medium
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
US9158833B2 (en) System and method for obtaining document information
US20120066213A1 (en) Information processing apparatus, information processing method, and computer program product
US7088859B1 (en) Apparatus for processing machine-readable code printed on print medium together with human-readable information
JP4785655B2 (ja) 文書処理装置及び文書処理方法
KR101078086B1 (ko) 문자 인식 장치, 문자 인식 프로그램, 및 문자 인식 방법
US20150310269A1 (en) System and Method of Using Dynamic Variance Networks
JP2007122403A (ja) 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
US11657367B2 (en) Workflow support apparatus, workflow support system, and non-transitory computer readable medium storing program
JP2012190314A (ja) 画像処理装置およびプログラム
JP2008257543A (ja) 画像処理システム及びプログラム
JP2007241355A (ja) 画像処理装置及び画像処理プログラム
JP2007011683A (ja) 文書管理支援装置
JP2006276904A (ja) ファックス装置
JP7271987B2 (ja) 情報処理装置及びプログラム
JP2007323415A (ja) 情報検索装置、情報検索システム、情報検索装置の制御方法、及び制御プログラムを提供する媒体
JPH08287189A (ja) 文書処理装置
JP2024003769A (ja) 文字認識システム、コンピュータによる文字の認識方法、および文字検索システム
CN112446273A (zh) 信息处理装置以及存储介质
JPH08297720A (ja) 一般文書読み取り装置
JPH0696285A (ja) 文字認識装置
JPH1153477A (ja) 誤記自動修正方法および読取装置ならびに誤記自動修正プログラムを格納した記録媒体