JP3954247B2 - 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置 - Google Patents

文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置 Download PDF

Info

Publication number
JP3954247B2
JP3954247B2 JP22731999A JP22731999A JP3954247B2 JP 3954247 B2 JP3954247 B2 JP 3954247B2 JP 22731999 A JP22731999 A JP 22731999A JP 22731999 A JP22731999 A JP 22731999A JP 3954247 B2 JP3954247 B2 JP 3954247B2
Authority
JP
Japan
Prior art keywords
correction
character
document
input
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP22731999A
Other languages
English (en)
Other versions
JP2001052111A (ja
JP2001052111A5 (ja
Inventor
正樹 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
National Institute of Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Agency
National Institute of Japan Science and Technology Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency, National Institute of Japan Science and Technology Agency filed Critical Japan Science and Technology Agency
Priority to JP22731999A priority Critical patent/JP3954247B2/ja
Priority to PCT/JP2000/002484 priority patent/WO2001013325A1/ja
Publication of JP2001052111A publication Critical patent/JP2001052111A/ja
Publication of JP2001052111A5 publication Critical patent/JP2001052111A5/ja
Application granted granted Critical
Publication of JP3954247B2 publication Critical patent/JP3954247B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置に係る。本発明は、特に、オフィス等で利用される情報機器分野に利用可能で、認識された文字の修正を行うことのできる文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置に関する。
【0002】
【従来の技術】
従来より、文書を光学式文字読み取り装置(Optical Character Reader, OCR)等を用いて入力し、キーボード、ディスプレイを用いずに読み取り結果を修正する文書入力装置がある(例えば、特開昭63−220383号公報参照)。
【0003】
図13に、従来の文書入力装置の構成図を示す。また、図14に、従来の文書入力処理に関する説明図を示す。
この文書入力装置は、光電変換手段101、文字認識手段102、文書ファイル記憶手段103、印刷手段104、修正記号・文字認識手段106、対応付け手段107、修正手段108を備える。
【0004】
この文書入力装置では、まず、読みとるべき入力文書110を、光電変換手段101により電子データとし、文字認識手段102で読み取り、その結果を文書ファイル記憶手段103に記憶する。文書ファイル記憶手段103に記憶された文書ファイルは、印刷手段104より印刷され、出力文書105(認識出力111)が出力される。ここで、認識出力111上に誤りを修正するため、記号、文字を記入し修正入力112を作成する。この修正入力112を、光電変換手段101で再び電子データにし、修正記号・文字認識手段106において、記入した記号、文字を読みとる。さらに、それらが記入された位置と文書ファイルとの位置の対応付けを対応付け手段107で行い、記入された修正記号に従った処理を修正手段108で行い、修正結果113を得ることができる。このようにすることによって、キーボード、ディスプレイを使えない人にとっても、電子文書の作成及び修正が可能になる。
【0005】
【発明が解決しようとする課題】
しかしながら、従来においては、修正のため出力文書に手書きで記入された漢字等の文字認識が、正しく行われることが前提である。従来は、すなわち、もともとの認識処理で正確に認識されなかったものを同様の認識処理で繰返し認識するのみに過ぎず、手書き文字を正確に認識することは、現状ではかなり実現が困難である。
【0006】
本発明は、以上の点に鑑み、文字イメージや読み取り結果の候補文字等の中間処理結果を記憶しておき、この中間処理結果と認識手段及び修正手段等を用いることにより、文字の修正をかならずしも文字を記入せずに、誤って認識された文字の修正を行うことを目的とする。また、本発明によると、従来のように文字を記入した場合の修正についても適用することを目的とする。
【0007】
【課題を解決するための手段】
本発明の第1の解決手段によると、
文字認識により作成された文書ファイルを、文書ファイルの文字がドットの集合として複数のドットにより印刷されたドット文字によるイメージでプリントアウトする出力ステップと、
前記出力ステップにより出力された文書に対して、単語として文字認識する単語処理又は文字の結合処理又は文字の分離処理による修正内容を指示するため修正記号が記入された修正入力文書をイメージ入力する入力ステップと、
前記入力ステップにより入力された修正入力文書について、各画素の収縮処理を実行して、前記ドット文字を消去することにより修正記号を抽出し、又は、画素の連結成分を求め、求められた連結成分の画素数に基づき修正記号を抽出し、抽出された修正記号を切り出し修正内容を認識する修正認識ステップと、
前記修正認識ステップにより認識された修正内容と修正すべき文字との対応関係を判断する対応付けステップと、
前記対応付けステップによる判断結果に基づき、修正内容である前記単語処理又は前記結合処理又は前記分離処理に応じて文書ファイルを修正する修正ステップと
を含む文書入力方法、及び、各ステップをコンピュータに実行させるための文書入力プログラムを記録した記録媒体が提供される。
【0008】
本発明の第2の解決手段によると、
文字認識により作成された文書ファイルを記憶する文書ファイル記憶手段と、
前記文字ファイル記憶手段に記憶された文書ファイルを、文書ファイルの文字がドットの集合として複数のドットにより印刷されたドット文字によるイメージでプリントアウトする出力手段と、
前記出力手段により出力された文書に対して、単語として文字認識する単語処理又は文字の結合処理又は文字の分離処理による修正内容を指示するため修正記号が記入された修正入力文書をイメージ入力する入力手段と、
前記入力手段により入力された修正入力文書について、各画素の収縮処理を実行して、前記ドット文字を消去することにより修正記号を抽出し、又は、画素の連結成分を求め、求められた連結成分の画素数に基づき修正記号を抽出し、抽出された修正記号を切り出し修正内容を認識する修正認識手段と、
前記修正認識手段により認識された修正内容と修正すべき文字との対応関係を判断する対応付け手段と、
前記対応付け手段による判断結果に基づき、修正内容である前記単語処理又は前記結合処理又は前記分離処理に応じて文書ファイルを修正する修正手段と
を備えた文書入力装置が提供される。
【0009】
【発明の実施の形態】
図1に、本発明に係る文書入力装置の構成図を示す。
この文書入力装置は、光電変換手段1、文字認識手段2、文書ファイル記憶手段3、出力手段4、入力手段5、修正認識手段6、対応付け手段7、修正手段8、中間処理ファイル記憶手段9を備える。
【0010】
光電変換手段1は、例えばOCRで構成され、読み取り対象となる文書を読みとり、電子データとする。文字認識手段2は、光電変換手段1により読み取られた電子データから文字・文書を認識する。文書ファイル記憶手段3は、文字認識手段2により作成された文書ファイルを記憶する。出力手段4は、文字ファイル記憶手段3に記憶された文書ファイルを表示又は出力する。出力手段4は、印刷手段により出力文書をプリントアウトする装置又はディスプレイ上に出力文書を表示する装置等である。なお、出力手段4として、外部装置のインタフェースをとるための装置、伝送装置、各種記録媒体の駆動装置等を用いることもできる。入力手段5は、マウス、タッチペン等のポインティングデバイス、キーボード等適宜の入力装置である。
【0011】
操作者は、出力手段4により出力された認識結果を参照して、修正内容の指示を行う。修正内容の指示は、例えば、プリンタ等の出力手段4による出力プリントアウトの場合、その印刷結果に修正記号を記入するようにしてもよい。この場合、記入された修正記号は、修正認識手段6により、切り出される。また、修正内容の指示は、ディスプレイ等の出力手段4による表示画面の場合、画面を見ながら入力手段5のポインティングデバイス等で修正内容及び修正位置を指示するようにしてもよい。
【0012】
修正認識手段6は、出力手段4により出力された文書又は表示画面に対して指示された修正内容(修正記号、文字等)を認識する。出力手段4により、認識結果としての文書がプリントアウトされた場合、光電変換手段1より修正内容が入力される。一方、認識結果としての文書がディスプレイ上に表示された場合、入力手段5により、修正内容及び位置が適宜入力される。なお、修正認識手段6は、修正記号のみならず、上述した従来のような修正文字及び修正箇所についても認識することができる。修正認識手段6は、例えば、単語として複数文字を認識するための単語処理、複数文字に対する文字パターンをひとつの文字パターンとして認識するための結合処理、ひとつの文字に対応する文字パターンを複数の文字パターンとして認識するための分離処理等を実行する場合の修正記号や修正文字を認識することができる。
【0013】
対応付け手段7は、修正認識手段6により認識された修正内容と修正すべき文字又は文字の位置との対応関係を判断する。すなわち、記入された修正記号、文字が、出力された文字のどこに対する処理なのかを対応づける。
【0014】
修正手段8は、再度認識した際の、対応付け手段7による判断結果に基づき、中間処理ファイル記憶手段9を参照して、修正内容に応じて文書ファイル記憶手段3に記憶された文書ファイルを修正する。修正手段8は、例えば、対応付け手段7に従い文書ファイルの位置情報により指示された文字を、中間処理ファイル記憶手段9に先の認識時に記憶されている候補の中から別の候補文字に修正する。修正手段8は、上述した従来のような修正処理についても実行することができる。修正手段8は、例えば、単語処理の場合、指示された複数文字をひとつの単語として認識し、結合処理の場合、複数文字に対する文字パターンをひとつの文字パターンとして認識し、また、分離処理の場合、ひとつの文字に対応する文字パターンを複数の文字パターンとして分離して認識することができ、それぞれ該当する修正処理を実行する。なお、本発明は、修正するためのこの他の指示についても、適宜適用することができる。
【0015】
中間処理ファイル記憶手段9は、文字認識手段2で認識を行う際に、途中の処理データ、すなわち文字パターン及びその位置、行位置、認識候補文字を含む認識結果等が記憶される。文字認識手段2は、文字認識処理の際、中間処理ファイル記憶手段9に、これら情報を記憶する。
修正手段8は、文字の再認識及び修正処理を実行する場合、対応する文字又は行についての位置情報と候補文字を中間処理ファイル記憶手段9から取り出す。
【0016】
図2に、本発明に係る文書入力方法の第1の実施の形態のフローチャートを示す。また、図3に、文書入力処理に関する説明図を示す。ここでは、出力結果が紙等にプリントアウトとされた場合を例に説明する。
【0017】
まず、光電変換手段1から入力文書10がイメージ入力され(S101)、中間処理ファイル記憶手段9にデータを記憶する。文字認識手段2は、入力されたイメージから文字を切り出し(S103)、中間処理ファイル記憶手段9に文字又は行の位置情報、認識候補等を記憶する。文字認識手段2は、文字認識をし(S105)、認識結果を文書ファイル記憶手段3に記憶する。出力手段4は、認識結果を出力する(S107)。ここで、認識出力11が出力されたとする。
【0018】
紙出力の場合は、操作者は、十分な認識がなされていない文字・文書に修正内容の指示を行う(S111)。ここでの修正内容の指示は、例えば、記号文字が記入された修正入力12の中の、第1記号12a、第2記号12b、第3記号12cの修正記号で行われる。この修正記号の例において、第1記号12a、第2記号12b、第3記号12cはそれぞれ、単語処理、文字パターンの結合、文字パターンの分離処理を指示する記号である。
【0019】
修正認識手段6は、記入された修正記号を切り出す(S113)。修正記号の切り出しは、例えば、活字位置の行間や文字間を検出することにより、その行間又は文字間に記入された修正記号を検出することができる。また、出力手段4によるプリントアウトに、文字の位置情報が印刷されている場合、それ以外の位置に記入されたものを修正記号として認識することもできる。さらに、出力手段4によるプリントアウトが、ドット文字で印刷されている場合、画素の連続性、太さ等により、修正記号を識別することができる。この点については、後述する。
【0020】
ここで、切り出された修正文字が、単語処理と認識された場合は、認識候補文字において、この記号に対応する文字の組で候補文字の組み合わせから単語としてもっとも可能性の高い組み合わせを求める単語処理を行う(S117)。
【0021】
図4に、単語処理の説明図を示す。一般に文字認識は、個々の文字パターンごとに認識して、認識候補文字の一番目を認識結果として出力する。これを単語として例えば2文字の組み合わせで判断した場合、1文字目と2文字目の組み合わせのうち、単語として成り立つものの制限があることから、誤認識が少なくなる。例えば、1文字目を認識した結果、4つの文字が認識候補として判断されたとする。即ち、第1候補「持」、第2候補「特」、第3候補「侍」、第4候補「稼」である。また、2文字目を認識した結果、3つの文字が認識候補として判断されたとする。即ち、第1候補「微」、第2候補「徴」、第3候補「働」である。1文字毎の認識結果では、各々第1候補の「特」及び「微」が選択された。しかし、単語処理では、これら2文字を単語として認識するように指示されたため、各文字の各候補の組合わせを検討する。例えば、第2候補「特」及び第2候補「徴」との組合わせが候補の優先順位の和4(2+2)であり、また、第4候補「稼」及び第3候補「働」との組合わせが候補の優先順位の和7(4+3)であることが、判断される。したがって、単語処理結果として、優先順位が高い順に(即ち、優先順位の和が小さい順に)、第1候補「特徴」及び第2候補「稼働」が認識候補として判断される。ここでは、第1候補の「特徴」が、単語処理の結果として認識される。
【0022】
また、文字パターンの結合処理と認識された場合は、対応する複数の文字パターンをあわせ、ひとつの文字として認識する結合処理を実行する(S119)。
【0023】
図5に、結合処理の説明図を示す。結合処理は、修正記号により指示された2個以上の文字に対応する文字パターン(中間処理ファイル記憶手段9に記憶)を、ひとつの文字パターンとして再度認識する。ここでは、認識結果の「T」と「由」とを結合する指示がなされたため、再度の認識の結果、「抽」が認識された。
【0024】
文字パターンの分離処理と認識された場合は、対応する文字パターンについて、再度文字切り出しから行う分離処理が実行される(S117)。
【0025】
図6に、分離処理の説明図を示す。分離処理は、修正記号により指示された文字に対応する文字パターン(中間処理ファイル記憶手段9に記憶)を、2つの文字パター−ンとして切り出して再度認識する。ここでは、認識結果の「和」を分離する指示がなされたため、再度の認識の結果、「f」と「e」とが認識された。
【0026】
修正手段8は、各処理に応じて文書ファイル記憶手段3を修正し(S123)、修正結果13を出力する(S125)。ここで、満足する結果が得られない場合(S129)は、さらに、ステップS111に戻って処理を繰り返す。十分に修正が行われたら、処理を終了する。
【0027】
つぎに、図7に、本発明に係る文書入力方法の第2の実施の形態のフローチャートを示す。これは、認識出力11がディスプレイによる出力手段4で出力された場合の動作を示す。ステップS101〜S107、S117〜S127の各処理については、図2と同様である。図2のステップS111及びS113が、この図のステップS115と置換されている。
【0028】
ディスプレイ出力の場合は、マウス等の入力手段5を用いて、修正内容及び該当する文字位置を指示する(S115)。よって、修正認識手段6及び対応付け手段7は、マウス等による指示から直接修正内容と位置を把握することができる。また、修正文字自体を入力手段4のキーボード等から入力することもできる。
【0029】
図8に、本発明に係る文書入力方法の第3の実施の形態のフローチャートを示す。ステップS101〜S107、S115〜S127の各処理については、図2と同様である。また、ステップS115の処理については、図7と同様である。ここでは、出力手段4による認識出力11が、紙出力かディスプレイ出力かの判断のためのステップS109が加えられている。紙出力の場合は第1の実施の形態と同様に、ディスプレイ出力の場合は第2の実施の形態と同様の処理が実行される。
【0030】
以下に、出力手段4によるプリントアウトが、ドット文字の場合の修正記号の切り出し及び識別について説明する。
なお、ドット文字は、従来ドットプリンタで印字された文字の意味で主に用いられた経緯があるが、プリンタの方式に限らず、後述の図11(文書イメージ入力41)、図12(文書イメージ入力51)及びそれらの説明箇所等に記載されるように、印刷された結果が互いに接しない独立した黒領域(点や線分)の集合として印字された文字を指す。ドット文字を用いることにより、人間にはグレーに見えるため書き込みに違和感はなく、読み取り装置にとっては、ある一定値サイズ以下の黒画素連結領域(周りを白画素で囲まれた接続する黒画素集合)の集まりとして取り込まれるため、それらの収縮・膨張、あるいは、連結黒画素数によるしきい値処理等の画像処理技術などによって、上書きされた手書きを切り出すときは元の文書を除去し、本等の文書の文字位置を求める時には上書きされた手書きを除去するなどが容易に行える。
【0031】
図9に、ドット文字の場合の修正記号の切り出し及び識別についてのフローチャートを示す。また、図10に、図9の文書処理に関する説明図を示す。
【0032】
出力手段4は、文書ファイル記憶手段3に記憶された文書ファイルをドット文字イメージでプリントアウトを出力する(S201)。操作者は、このプリントアウト上に修正のための記号、また、必要に応じて文字を記入し、修正入力文書14を作成する(S203)。さらに、光電変換手段1により、修正入力文書14がイメージ入力され、電子データ化され電子データ蓄積手段6に蓄積される(S205)。
【0033】
修正認識手段6は、出力手段4により出力された文書中で、修正記号が記入された文字の位置を検出する(S207)。また、修正認識手段6は、活字がドットで印字されていることに注目して、電子化された文書画像から行及び文字位置を検出する。詳細は後述する。また、修正認識手段6は、修正入力文書14に記入された修正記号や文字を、認識する(S211)。なお、修正すべき正しい文字は、例えば、文字認識手段2等により、認識することもできる。
【0034】
対応付け手段7は、修正認識手段6により検出された文字の位置と、修正認識手段6により認識された修正記号とを対応付け、修正対象文字を特定する(S213)。すなわち、記入された修正記号や文字が、出力された文字のどこに対応するのかを対応付ける。このようにして、記号検出・認識結果15が得られる。
【0035】
修正手段8は、対応付け手段7の対応付けに従い、該当する文字を修正記号に対応する修正処理により修正する(S215)。修正手段8は、修正認識手段6により認識された修正記号に従い文書ファイル記憶手段3に記憶された文書ファイルを修正する。ここでは、図10中、斜線による指示は、例えば、対応する活字をその上に記入された文字と置き換える記号を表すので、修正手段8は、このような記入文字に対応して、「埋」を「理」に修正する処理を、文書ファイル記憶手段3に対して行う。ここでは、文字認識手段2又は修正認識手段6等により、修正すべき正しい文字として「理」が認識される。なお、修正手段8は、この他にも、例えば、単語認識処理、結合処理、分割処理を実行し、文書ファイルを修正することができる。
【0036】
出力手段4は、修正された文書ファイルを文書ファイル記憶手段3から読み出し、修正結果16を出力する(S217)。この際、プリントアウトに限らずディスプレイ上に出力して確認しても良い。
【0037】
図11に、プリントアウト文字位置検出の説明図を示す。
修正認識手段6は、入力文書のエッジ画像について、横方向及び縦方向のそれぞれに画素数を積算することにより、文字の位置を検出するようにする。具体的には、例えば、まず輪郭画像を作成して、これを強調し、この輪郭画像上で、水平方向に黒画素数を数えて行位置を検出し、次に各行毎に垂直方向に黒画素数を計数することにより文字位置を検出する。
【0038】
この例では、修正認識手段6による、第1行目「本論文では」及び第2行目「取り装置の」とプリントアウトされた文字の位置検出について説明する。まず、修正記号を記入済みの文字イメージ41が入力される。この文字イメージに基づき、各画素の輪郭を検出を行い、輪郭画像42を求める。さらに、検出された輪郭画素42について、横方向に画素を積算又は加算して横方向周辺分布43を求める。この横方向分布により行の位置を検出することができる。つぎに、求められた各行について、同様に、検出された輪郭画素44を切り出し、これについて縦方向に画素を積算又は加算して縦方向周辺分布45を求める。この縦方向周辺分布45により各行の文字の位置(横方向位置)を求めることができる。以上のように、ある文字について、行と列が特定され文字位置検出画像46が得られる。さらに、各文字の最も外側の画素を検出することで、各文字を切り出すことができる。
【0039】
図12に、修正記号の認識の説明図を示す。
修正認識手段6は、修正記号の抽出(記入文字の検出)において、修正入力文書14から、画素の連結成分を求め、求められた連結成分の画素数に基づき、あらかじめ決められた大きさ以下の黒連結成分を除くことにより、修正記号のみを残し、残された修正記号の各々を切り出す。修正認識手段6は、修正記号を切り出す際、例えば、白画素に隣接する黒画素をエッジとして、そのエッジを元の画像から除去する収縮処理を備える。
【0040】
この例では、「取り装置の」とプリントアウトされた文字の「装」に記入された修正記号について説明する。まず、修正記号が記入済みの文字イメージ51が入力される。つぎに、各画素を収縮処理(収縮処理)した収縮画像52に変換する。
【0041】
この収縮処理を適宜の回数実行して、ドット文字を消去することにより、修正記号を抽出した修正記号抽出画像53を得る。ドット文字を消去する方法としては、例えば、黒画素が連結した部分である連結成分を求めて、各連結成分の黒画素数を求める。さらに、この黒画素数が予め決められた閾値以上である連結成分を残すことにより修正記号を抽出することができる。つぎに、修正認識手段6は、修正記号を切り出し、どのような修正指示を行うための修正記号かを認識することで修正記号認識結果54が得られる。
【0042】
なお、各処理間の入出力については、インターネット等の通信を用いても良い。
【0043】
【発明の効果】
本発明によると、以上のように、文字イメージや読み取り結果の候補文字等の中間処理結果を記憶しておき、この中間処理結果と認識手段及び修正手段等を用いることにより、文字の修正をかならずしも文字を記入せずに、誤って認識された文字の修正を行うことができる。また、本発明によると、従来のように文字を記入した場合の修正についても適用することができる。
【図面の簡単な説明】
【図1】 本発明に係る文書入力装置の構成図。
【図2】 本発明に係る文書入力方法の第1の実施の形態のフローチャート。
【図3】 文書入力処理に関する説明図。
【図4】 単語処理の説明図。
【図5】 結合処理の説明図。
【図6】 分離処理の説明図。
【図7】 本発明に係る文書入力方法の第2の実施の形態のフローチャート。
【図8】 本発明に係る文書入力方法の第3の実施の形態のフローチャート。
【図9】 ドット文字の場合の修正記号の切り出し及び識別についてのフローチャート。
【図10】 図9の文書処理に関する説明図。
【図11】 プリントアウト文字位置検出の説明図。
【図12】 修正記号の認識の説明図。
【図13】 従来の文書入力装置の構成図。
【図14】 従来の文書入力処理に関する説明図。
【符号の説明】
1 光電変換手段
2 文字認識手段
3 文書ファイル記憶手段
4 出力手段
5 入力手段
6 修正認識手段
7 対応付け手段
8 修正手段
9 中間処理ファイル記憶手段

Claims (8)

  1. 文字認識により作成された文書ファイルを、文書ファイルの文字がドットの集合として複数のドットにより印刷されたドット文字によるイメージでプリントアウトする出力ステップと、
    前記出力ステップにより出力された文書に対して、単語として文字認識する単語処理又は文字の結合処理又は文字の分離処理による修正内容を指示するため修正記号が記入された修正入力文書をイメージ入力する入力ステップと、
    前記入力ステップにより入力された修正入力文書について、各画素の収縮処理を実行して、前記ドット文字を消去することにより修正記号を抽出し、又は、画素の連結成分を求め、求められた連結成分の画素数に基づき修正記号を抽出し、抽出された修正記号を切り出し修正内容を認識する修正認識ステップと、
    前記修正認識ステップにより認識された修正内容と修正すべき文字との対応関係を判断する対応付けステップと、
    前記対応付けステップによる判断結果に基づき、修正内容である前記単語処理又は前記結合処理又は前記分離処理に応じて文書ファイルを修正する修正ステップと
    含む文書入力方法。
  2. 入力された文書に基づき認識された文字又は行についての位置情報と候補文字を中間処理ファイルに記憶する文字認識ステップをさらに備え、
    前記修正ステップは、前記文字認識ステップにより記憶された中間処理ファイルを参照して、文書ファイルの位置情報により指示された文字を別の候補文字に修正することを特徴とする請求項1に記載の文書入力方法。
  3. 前記出力ステップは、さらに、認識結果をディスプレイ上に表示し、
    表示された画面上で修正内容及び修正位置を指示するための入力ステップをさらに備えたことを特徴とする請求項1又は2に記載の文書入力方法。
  4. 前記修正認識ステップは、
    単語として複数文字を認識するための単語処理、複数文字に対する文字パターンをひとつの文字パターンとして認識するための結合処理、又は、ひとつの文字に対応する文字パターンを複数の文字パターンとして認識するための分離処理のいずれか又は複数を認識することを特徴とする請求項1乃至のいずれかに記載の文書入力方法。
  5. 前記修正ステップは、
    指示された修正内容が単語処理の場合、指示された複数文字をひとつの単語として認識し、
    指示された修正内容が結合処理の場合、複数文字に対する文字パターンをひとつの文字パターンとして認識し、
    指示された修正内容が分離処理の場合、ひとつの文字に対応する文字パターンを複数の分離された文字パターンとして認識することを特徴とする請求項1乃至のいずれかに記載の文書入力方法。
  6. 文字認識により作成された文書ファイルを、文書ファイルの文字がドットの集合として複数のドットにより印刷されたドット文字によるイメージでプリントアウトする出力ステップと、
    前記出力ステップにより出力された文書に対して、単語として文字認識する単語処理又は文字の結合処理又は文字の分離処理による修正内容を指示するため修正記号が記入された修正入力文書をイメージ入力する入力ステップと、
    前記入力ステップにより入力された修正入力文書について、各画素の収縮処理を実行し て、前記ドット文字を消去することにより修正記号を抽出し、又は、画素の連結成分を求め、求められた連結成分の画素数に基づき修正記号を抽出し、抽出された修正記号を切り出し修正内容を認識する修正認識ステップと、
    前記修正認識ステップにより認識された修正内容と修正すべき文字との対応関係を判断する対応付けステップと、
    前記対応付けステップによる判断結果に基づき、修正内容である前記単語処理又は前記結合処理又は前記分離処理に応じて文書ファイルを修正する修正ステップと
    コンピュータに実行させるための文書入力プログラムを記録した記録媒体。
  7. 文字認識により作成された文書ファイルを記憶する文書ファイル記憶手段と、
    前記文字ファイル記憶手段に記憶された文書ファイルを、文書ファイルの文字がドットの集合として複数のドットにより印刷されたドット文字によるイメージでプリントアウトする出力手段と、
    前記出力手段により出力された文書に対して、単語として文字認識する単語処理又は文字の結合処理又は文字の分離処理による修正内容を指示するため修正記号が記入された修正入力文書をイメージ入力する入力手段と、
    前記入力手段により入力された修正入力文書について、各画素の収縮処理を実行して、前記ドット文字を消去することにより修正記号を抽出し、又は、画素の連結成分を求め、求められた連結成分の画素数に基づき修正記号を抽出し、抽出された修正記号を切り出し修正内容を認識する修正認識手段と、
    前記修正認識手段により認識された修正内容と修正すべき文字との対応関係を判断する対応付け手段と、
    前記対応付け手段による判断結果に基づき、修正内容である前記単語処理又は前記結合処理又は前記分離処理に応じて文書ファイルを修正する修正手段と
    を備えた文書入力装置。
  8. 入力された文書に基づき認識された、文字又は行についての位置情報と候補文字を記憶する中間処理ファイル記憶手段をさらに備え、
    前記修正手段は、前記中間処理ファイル記憶手段を参照して、文書ファイルの位置情報により指示された文字を別の候補文字に修正することを特徴とする請求項に記載の文書入力装置。
JP22731999A 1999-08-11 1999-08-11 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置 Expired - Fee Related JP3954247B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP22731999A JP3954247B2 (ja) 1999-08-11 1999-08-11 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置
PCT/JP2000/002484 WO2001013325A1 (fr) 1999-08-11 2000-04-17 Procede d'entree de document, support d'impression, programme d'entree de document a imprimer et dispositif d'entree de document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22731999A JP3954247B2 (ja) 1999-08-11 1999-08-11 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置

Publications (3)

Publication Number Publication Date
JP2001052111A JP2001052111A (ja) 2001-02-23
JP2001052111A5 JP2001052111A5 (ja) 2005-04-07
JP3954247B2 true JP3954247B2 (ja) 2007-08-08

Family

ID=16858951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22731999A Expired - Fee Related JP3954247B2 (ja) 1999-08-11 1999-08-11 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置

Country Status (2)

Country Link
JP (1) JP3954247B2 (ja)
WO (1) WO2001013325A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6102374B2 (ja) * 2013-03-15 2017-03-29 オムロン株式会社 読取文字訂正用のプログラムおよび文字読取装置
JP2016218638A (ja) * 2015-05-18 2016-12-22 京セラドキュメントソリューションズ株式会社 電子機器

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63220383A (ja) * 1987-03-10 1988-09-13 Mitsubishi Electric Corp 文字入力装置
JPH06325214A (ja) * 1993-05-14 1994-11-25 Sanyo Electric Co Ltd 文字認識後処理装置
JPH0744655A (ja) * 1993-08-03 1995-02-14 Sony Corp 手書き入力表示装置

Also Published As

Publication number Publication date
JP2001052111A (ja) 2001-02-23
WO2001013325A1 (fr) 2001-02-22

Similar Documents

Publication Publication Date Title
Shamilian et al. A retargetable table reader
US7712028B2 (en) Using annotations for summarizing a document image and itemizing the summary based on similar annotations
CN114299528B (zh) 一种针对扫描文档的信息提取和结构化方法
US6614929B1 (en) Apparatus and method of detecting character writing area in document, and document format generating apparatus
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JP2000278514A (ja) 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
US7965293B2 (en) Image processing device, image processing method, and image processing program for reconstructing data
JPH04195692A (ja) 文書読取装置
JP3954246B2 (ja) 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置
JPH07105312A (ja) 光学式文字読取装置における文字イメージのごみ除去方法及び装置
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3954247B2 (ja) 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置
JP5357711B2 (ja) 文書処理装置
JP5041775B2 (ja) 文字切出方法及び文字認識装置
JP4867894B2 (ja) 画像認識装置、画像認識方法及びプログラム
Kumar et al. Line based robust script identification for indianlanguages
JP3090070B2 (ja) 帳票識別方法及び装置
JP4117648B2 (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
EP0692768A2 (en) Full text storage and retrieval in image at OCR and code speed
JP2006092345A (ja) 文字認識装置、文字認識方法および文字認識プログラム
JP3239965B2 (ja) 文字認識装置
JP3412441B2 (ja) 画像処理装置
JP5248074B2 (ja) 楽譜認識装置、楽譜認識方法、及びコンピュータプログラム
JPH04309B2 (ja)

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20031031

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040507

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070410

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070426

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees