JP5284342B2 - 文字認識システムおよび文字認識プログラム - Google Patents

文字認識システムおよび文字認識プログラム Download PDF

Info

Publication number
JP5284342B2
JP5284342B2 JP2010286313A JP2010286313A JP5284342B2 JP 5284342 B2 JP5284342 B2 JP 5284342B2 JP 2010286313 A JP2010286313 A JP 2010286313A JP 2010286313 A JP2010286313 A JP 2010286313A JP 5284342 B2 JP5284342 B2 JP 5284342B2
Authority
JP
Japan
Prior art keywords
character
font
recognition
old
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010286313A
Other languages
English (en)
Other versions
JP2012133653A (ja
Inventor
和章 横田
典子 堀部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2010286313A priority Critical patent/JP5284342B2/ja
Publication of JP2012133653A publication Critical patent/JP2012133653A/ja
Application granted granted Critical
Publication of JP5284342B2 publication Critical patent/JP5284342B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明の実施形態は、文字認識システムおよび文字認識プログラムに関する。
一般に、文字認識装置では、新字体と旧字体の文字が混在する文書を文字認識する場合、旧字体は、現在の字体(現字体または正字という)に置き換えて認識される。
例えば"▲氣▼"という旧字体の文字画像を文字認識装置が文字認識した場合に、通常では"気"という現字体(正字)が出力される。また、"▲辯▼"、"▲瓣▼"、"▲辨▼"などの旧字体の文字画像を文字認識装置が文字認識した場合には、"琲"など全く意味の違う現在の字体の文字に誤読して認識される。
旧字体を直接認識できる文字認識装置も存在するが、これら字体の文字は極めて類似している場合が多く、誤読が多く発生するため、認識後には誤読訂正の作業が必須である。
従来、このように文書を光学的に読み取った画像を文字認識した結果の文字を訂正する訂正機能では、認識結果の文字列が表示されたエリア(欄)にキー操作で直接テキストを入力、つまり文字をタイプし、変換操作で一覧表示された漢字の中から該当する漢字を選択し確定操作することにより文字の訂正が行える。
ところで、現字体の辞書を主に用いる仮名漢字変換機能では、選択候補として旧字体の文字が表示されない場合があり、キーボードから直接入力すること自体が難しい。したがって、通常、手書き文字認識機能などを利用して旧字体の漢字そのものを特定した上で訂正することになる。
特開平7−239901号公報
しかしながら、上記の訂正機能は、あくまで氏名のような、出現頻度の低い旧字体に対するものであり、例えば明治時代の新聞や書籍などのように旧字体が文章中に極めて多数存在する場合、訂正機能で一つの文字に対して漢字一覧を都度読み出してその中から選択するような操作を行っていたのでは作業効率が悪いという問題があった。
本発明が解決しようとする課題は、異なる字種が混在する文字の訂正を効率よく行える文字認識システムおよび文字認識プログラムを提供することにある。
実施形態の文字認識システムは、記憶部、訂正部、文字認識部を備える。記憶部は、文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する。第1の訂正部は、記憶部に認識結果として旧字体の同一の文字コードが記憶されている文字画像の一覧を画面に表示し、画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、指定された文字画像を新字体を対象として文字認識することを指定する。第2の訂正部は、記憶部に認識結果として新字体の同一の文字コードが記憶されている文字画像の一覧を画面に表示し、画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、指定された文字画像を旧字体を対象として文字認識指定することを指定する。第1または第2の訂正部で指定された文字画像を第1または第2の訂正部で指定された新字体または旧字体を対象に文字認識する。
実施形態の文字認識システムの構成を示す図である。 新字体の文字コードの一例を示す図である。 旧字体の文字コードの一例を示す図である。 文字認識装置の動作を示すフローチャートである。 文字訂正装置の動作を示すフローチャートである。 新字体に分類された文字群を示す図である。 旧字体に分類された文字群を示す図である。 一覧表示された文字画像群の中から誤読文字を選択して訂正を行うための訂正画面の一例を示す図である。
以下、図面を参照して実施形態を詳細に説明する。図1は一つの実施形態の文字認識システムの構成を示す図である。
図1に示すように、この実施形態の文字認識システムは、スキャナ1が接続された文字認識装置2、文字訂正装置3、訂正端末4,5が相互にネットワーク6を介して接続して構成されている。
スキャナ1は、認識対象の文書を光学的に読み取り、読み取った画像(以下これを「文書画像」という)を文字認識装置2に出力する。認識対象の文書としては、例えば明治、大正、昭和などの年代(時代)の新聞、雑誌、一般書籍などがある。
訂正端末4,5は、文字認識装置2に対してネットワーク6を通じてアクセスし、入力装置(キーボード、マウス)および出力装置(モニタ、プリンタなど)として機能する端末である。
文字認識装置2および文字訂正装置3は、例えばCPU、メモリ、ハードディスク装置、CD−ROM、DVD−ROMなどの記録媒体を再生する再生装置としてのディスク再生装置などを有するコンピュータである。コンピュータでは、ディスク再生装置からハードディスク装置にインストールされた制御ソフトウェアをCPUがメモリ上に読み出し、そのソフトウェアの処理を実行することで、コンピュータが文字認識装置、文字訂正装置として機能する。
文字認識装置2は、受付部20、文字認識結果が記憶される記憶部としてのメモリ21、レイアウト解析部22、文字認識部23、出力部28を有している。
受付部20は、スキャナ1が、文字が記載された文書を光学的に読み取った文書画像を受け付け、メモリ21に記憶する。
メモリ21は、各部が行う処理の作業領域として機能する他、文字認識部23での文字認識結果を記憶する。このメモリ21に記憶される文字認識結果は、文字認識対象となった文書画像とその文字認識結果(文字コード)と連続番号とが対応付けられて記憶されている。
レイアウト解析部22は、メモリ21に記憶された文書画像を読み出し、文書画像に対してレイアウト解析を行うことで、読み取り元の文書の構造(画像のどの位置に文字または文字列が記載されているかなど)を得る。
文字認識部23は、レイアウト解析部22により解析された文書構造に従い文書画像を文字の単位(文字画像)に切り出し、この切り出した文字画像を文字認識する。文字認識部23は、文字認識対象の文字画像と、この文字画像の文字認識結果である文字コードとを対応付け、連続番号を付与して、メモリ21に記憶する。
日本における漢字の使用年代(切り替わり年代)として、例えば1790年〜1946年(昭和21年)の第1年代には康煕字典(文字数:49030文字)が使われ、1946年(昭和21年)〜1981年(昭和56年)の第2年代には当用漢字(文字数:1850文字)が使われ、1981年(昭和56年)以降の第3年代は常用漢字(文字数:1945文字)が使われている。
この実施形態で利用される文字認識用の辞書は、認識対象の文書が作成された年代の字体が使われているもの、例えば昭和21年以前などの古い新聞であれば、旧字体が使われている康煕字典漢字辞書(旧字体辞書)などを利用し、その後、字体が当用漢字などに改訂された昭和21年以降などの現在の新聞などであれば、JIS第1および第2水準相当の現在の辞書である当用漢字・常用漢字辞書(新字体辞書)を利用するものとする。
文書の文字認識処理が終了すると、出力部28はメモリ21から文字認識した結果得られた連続番号、文字コード、文字画像を、ネットワーク6を介して文字訂正装置3へ送る。
文字訂正装置3は、受付部31、メモリ32、新旧字体分類部33、新字体訂正部34、旧字体訂正部35、辞書記憶部37、文字認識部38を有している。
受付部31は、文字認識装置2から送られてきた文字認識結果(連続番号、文字コード、文字画像)を受け付け、メモリ32に記憶する。また受付部31は、訂正端末4,5に対して新字体専用の訂正画面(図8参照)または旧字体専用の訂正画面を送り、文字訂正の機能を提供する。
新旧字体分類部33は、文字画像をメモリ32から読み出し、文字認識結果として旧字体の文字コードが付与されている(対応付けられている)文字画像と新字体の文字コードが付与されている(対応付けられている)文字画像とに字種を分類(分離)する。この分類には、例えば文字コードの先頭の番号が「4」までが新字体、「5」以上を旧字体などといった識別ルールを用いる。
すなわち、新旧字体分類部33は、メモリ32に記憶された文字画像を、第1の字種(新字体)の文字(漢字)の文字コードが認識結果として対応付けられている文字画像の群と、第2の字種(旧字体)の文字(漢字)の文字コードが認識結果として対応付けられている文字画像の群に分類する。
新旧字体分類部33では、予め文字コード毎に旧字体か新字体かを識別するためのルールが決められており、分類はそのルールに従って行われる。そして、旧字体の文字画像は、旧字体専用の訂正端末5の訂正画面に一覧表示されて訂正される。また新字体の文字画像は、新字体専用の訂正端末4の訂正画面に一覧表示されて訂正される。
新字体訂正部34は、新字体専用の訂正端末4に訂正画面70(図8参照)を表示し、誤読文字のユーザの訂正操作により訂正処理を行う。旧字体訂正部35は、旧字体専用の訂正端末5に訂正画面(図示せず)を表示し、誤読文字のユーザの訂正操作により訂正処理を行う。
なお、この例では、新字体と旧字体とをそれぞれ別個の訂正端末で訂正を行う例について説明しているが、一つの端末の一つのモニターの画面に、新字体用の訂正画面と旧字体用の訂正画面を表示して作業してもよい。
これら新旧の訂正部34,35は、それぞれメモリ32から文字認識結果として同じ文字コードが付与された(対応付けられている)文字画像を読み出して一覧表示し、文字コードとの対応関係を訂正する必要がある(誤読訂正の必要がある)文字画像に対する選択操作により再度文字認識を指示するための訂正画面を新字体専用の訂正端末4または旧字体専用の訂正端末5に表示する訂正指示部として機能する。各訂正部は、新旧字体分類部33により分類された字種毎に訂正画面を表示する。
例えば新字体訂正部34は、図8に示す訂正画面70において、同じ字種(新字体)として分類された文字画像群の中から、誤読された訂正対象の文字画像がマウスの左クリック操作で選択された後の右クリック操作で、その文字画像を他の字種として再度文字認識することを指示するためのボタン(「旧字体」)を文字画像近傍にポップアップ表示する。なお旧字体訂正部35の訂正画面の場合、ボタンは「新字体」と表示される。
図2に示すように、新字体の漢字は、JISのコード体系で、新字体の文字コードと区点コードが対応している。例えば"亜"という新字体の文字コードは「3021」、区点コードは「1601」である。
図3に示すように、旧字体の漢字は、JISのコード体系で、旧字体の文字コードと区点コードが対応している。例えば"▲亞▼"という旧字体の文字コードは「5033」、区点コードは「4819」である。
文字認識部38は、新字体訂正部34からの指示により、認識対象を旧字体に絞り旧字体辞書を参照して、選択された文字画像に対して再度文字認識(再認識処理)を行う。
また文字認識部38は、旧字体訂正部35からの指示により、認識対象を新字体に絞り、新字体辞書を参照して、選択された文字画像に対して再度文字認識(再認識処理)を行う。
続いて、図4乃至図8を参照してこの実施形態の文字認識システムの動作を説明する。
この文字認識システムの場合、スキャナ1にセットされた認識対象の文書(例えば新字体および旧字体の文字が混在する新聞や雑誌など)が光学的に読み取られると、その読み取られ文書画像が文字認識装置2へ入力される。
文字認識装置2では、スキャナ1からの文書画像が受付部20により受け付けられ、メモリ21に記憶される(図4のステップS101)。
レイアウト解析部22は、メモリ21に記憶された文書画像に対してレイアウト解析を行い(ステップS102)、レイアウト解析結果を文字認識部23に通知する。
レイアウト解析結果を受けた文字認識部23は、受け取ったレイアウト解析結果を基に文書画像に対して1文字ずつ文字認識を行い(ステップS103)、文字認識結果として、文字認識対象の文字画像と、この文字画像の文字認識結果である文字コードとを対応付け、連続番号を付与して、メモリ21に記憶する。
そして、文書画像の文字認識がすべて終了すると(ステップS104)、出力部28はメモリ21から文字認識した結果得られた文字画像、文字コード、連続番号ネットワーク6を介して文字訂正装置3へ送信する。(ステップS105)。
文字訂正装置3では、受付部31が文字認識装置2から送られてきた文字認識結果(連続番号、文字コード、文字画像)を受け付け、メモリ32に記憶する。
新旧字体分類部33は、メモリ32から文字認識結果を読み出し、旧字体の文字コードが付与されている文字画像と新字体の文字コードが付与されている文字画像とに分類(分離)する(ステップS112)。
さらに、新旧字体分類部33は、新字体として分類された文字画像群を同じ文字コード毎にグループ分けしメモリ32に記憶する(ステップS113)。つまり文字コード毎のディレクトリ(フォルダ)を生成し各ディレクトリ(フォルダ)に同じ文字コードを持つ文字画像群を格納する。
分類の結果、例えば図6に示すように、新字体の"気"という文字コード「3524」を文字認識結果として持つ文字画像50のグループが生成される。各文字画像50には、対応付けられている連続番号51と文字コード52が図示されている。
また、同じ意味を持つ文字(漢字)であっても、図7に示すように、例えば旧字体の"▲氣▼"という文字コード「5D66」を持つ文字画像60のグループが旧字体の別グループとして分類される(ステップS114)。各文字画像60には、連続番号61と文字コード62が付与されている。
文字認識率は100%とはならず、どうしても若干の誤認識(誤読)が発生するため、文字認識結果の訂正作業を行うことになる。
このため、各訂正端末4,5において、誤読文字の確認と、その訂正作業が行われる。
新字体訂正部34は、メモリ32から文字認識結果として新字体の文字コードが得られた文字画像群を、例えば「あ」行から順に読み出し、訂正画面70(図8参照)を訂正端末4へ送る。これにより、新字体の文字画像群を一覧表示した訂正画面70が訂正端末4に表示される(ステップS115)。以下、一例として「気」という文字コードが文字認識結果として得られた文字画像群の誤読の確認とその訂正処理をする場合について説明する。
訂正端末4の操作者は、図8に示すような訂正画面70の文字画像一覧の中から、誤読文字を目視で確認する。この例では、新字体の"気"の文字コード「3524」を持つ文字画像の中で、例えば旧字体の"▲氣▼"という連続番号「0002」の文字画像があり、これが誤読文字71である。
この場合、操作者は、誤読文字71にカーソルを合わせて選択した後、例えばマウスを右クリック操作することで、プルダウンメニュー72が表示されるので、表示されたメニューから「旧字体」ボタン73を選択する(ステップS116)。
すると、文字訂正サーバ3では、新字体訂正部34が、文字認識部38に対して、選択された文字画像"▲氣▼"について、認識対象を旧字体に絞った再認識を行うよう指示する。
この指示により、文字認識部38は、認識対象を旧字体に絞り、つまり旧字体の認識辞書だけを用いて再度文字認識(再認識処理)を行う(ステップS117)。
これにより、旧字体の"▲氣▼"という文字画像に対して、その文字認識結果として旧字体の"▲氣▼"の文字コード「5D66」が付与され、メモリ32の文字認識結果が変更される。つまりメモリ32の文字認識結果の文字画像"▲氣▼"に付与されていた文字コード「3524」が「5D66」に変更される。
すなわち、文字認識部38は、再度文字認識が指示された文字画像に対して、再度の文字認識を行い、新たに文字認識した結果でメモリ32の文字認識結果を更新する。
再認の文字識処理では、認識対象を旧字体に限定しているので、文字画像は正しく認識される可能性が高い。
一方、旧字体訂正部35は、メモリ32から文字認識結果として旧字体の文字コードが得られた文字画像群を、例えば「あ」行から順に読み出し、訂正画面を訂正端末5へ送る。これにより、旧文字画像群を一覧表示した訂正画面70(図8参照)が訂正端末5に表示される(ステップS118)。
訂正端末5の操作者は、訂正画面70の文字画像一覧の中から、誤読文字を目視で確認する。
この文字画像一覧の中に誤読文字が発見された場合には、操作者は、誤読文字にカーソルを合わせて選択した後、例えばマウスを右クリック操作することで、プルダウンメニューが表示されるので、表示されたメニューから「新字体」ボタンを選択する(ステップS119)。
すると、旧字体訂正部35が、文字認識部38に対して、選択された文字画像について、認識対象を新字体に絞った再認識を指示する。
この指示により、文字認識部38は、認識対象を新字体に絞り、つまり新字体の認識辞書だけを用いて再度文字認識(再認識処理)を行う(ステップS120)。
すなわち、文字認識部38は、再度文字認識が指示された文字画像に対して、再度の
文字認識を行い、新たに文字認識した結果でメモリ32の文字認識結果を更新する。
再認の文字識処理では、認識対象を新字体に限定しているので、文字画像は正しく認識される可能性が高い。
旧字体の文字訂正は、現在の日本人にはなじみが薄く訂正が難しい画面となるが、逆に香港や台湾などの地域では今でも日本の旧字体に相当する文字が一般的に使われており、これらの文字は各地域の入力方法により容易に訂正可能である。
例えば台湾では注音符号と呼ばれる、読みを現す台湾独自の記号がキーボードに印刷されており、この記号をキーボードでタイプすることにより、漢字に変換して各文字を入力できる。このときの画面には日本語の言語的な特長は現れていないため、特に日本語に関する知識がない一般の台湾人オペレータでも文字の訂正が可能である。
このようにこの実施形態によれば、文字訂正の作業において、同じ字体として認識された文字画像の中から誤読した文字の再認識の指示を容易に行うことができ、文字認識結果の訂正作業を効率よく行うことができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
上記実施形態では、文字認識装置と文字訂正装置とを別の筐体として構成したが、一つの筐体(装置)として構成してもよい。
また上記実施形態では、訂正対象の文字画像を選択し、マウスの右クリック操作でメニューを表示し、旧字体または新字体への再認識を指示したが、文字画像を選択するだけの操作で旧字体または新字体への再認識を指示してもよい。この場合、さらに文字訂正の作業を効率化することができる。
さらに上記実施形態では、字種として漢字の新字体と旧字体との相互での誤読訂正を説明したが、これに限定されない。例えば、数字と英文字との字種相互での誤読訂正をする実施形態でも良い。
また上記実施形態では、各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現したが、上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。電子媒体としては、例えばCD−ROM,DVD−ROM等の記録媒体やフラッシュメモリ、リムーバブルメディア:Removable media等が含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。
1…スキャナ、2…文字認識装置、3…文字訂正装置、4…新字体訂正用の訂正端末、5…旧字体訂正用の訂正端末、6…ネットワーク、20…受付部、21…メモリ、22…レイアウト解析部、23…文字認識部、28…出力部、31…受付部、32…メモリ、33…新旧字体分類部、34…新字体訂正部、35…旧字体訂正部、38…文字認識部。

Claims (4)

  1. 文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する記憶部と、
    前記記憶部に認識結果として旧字体の同一の文字コードが記憶されている文字画像の一覧を画面に表示し、前記画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、前記指定された文字画像を新字体を対象として文字認識することを指定するための第1の訂正部と、
    前記記憶部に認識結果として新字体の同一の文字コードが記憶されている文字画像の一覧を画面に表示し、前記画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、前記指定された文字画像を旧字体を対象として文字認識することを指定するための第2の訂正部と、
    前記第1または第2の訂正部で指定された文字画像を前記第1または第2の訂正部で指定された新字体または旧字体を対象に文字認識する文字認識部と、
    を具備する文字認識システム。
  2. 前記記憶部に認識結果として記憶されている前記旧字体の文字コードの一覧を、前記第1の訂正部に出力し、また前記記憶部に認識結果として記憶されている前記新字体の文字コードの一覧を、前記第2の訂正部に出力する出力部を、
    さらに具備する請求項1記載の文字認識システム。
  3. 文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを記憶する記憶部と、
    前記記憶部に認識結果として旧字体の同一の文字コードが記憶されている文字画像の一覧を旧字体専用端末の画面に表示し、前記画面に表示された文字画像の一覧に基づいて前記旧字体専用端末から誤読訂正する文字画像を指定すると共に、前記指定された文字画像を新字体を対象として文字認識することを指定するための第1の訂正部と、
    前記記憶部に認識結果として新字体の同一の文字コードが記憶されている文字画像の一覧を新字体専用端末の画面に表示し、前記画面に表示された文字画像の一覧に基づいて前記新字体専用端末から誤読訂正する文字画像を指定すると共に、前記指定された文字画像を旧字体を対象として文字認識することを指定するための第2の訂正部と、
    前記第1または第2の訂正部で指定された文字画像を前記第1または第2の訂正部で指定された新字体または旧字体を対象に文字認識する文字認識部と、
    を具備する文字認識システム。
  4. 記憶部を持つコンピュータに処理を実行させる文字認識プログラムにおいて、
    前記コンピュータを、
    文書から読み取った文書画像を文字認識した認識結果である文字コードと、当該文字コードに対応する文字画像とを前記記憶部に記憶させる記憶手段と、
    前記記憶手段に認識結果として旧字体の同一の文字コードが記憶されている文字画像の一覧を画面に表示し、前記画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、前記指定された文字画像を新字体を対象として文字認識することを指定するための第1の訂正手段と、
    前記記憶手段に認識結果として新字体の同一の文字コードが記憶されている文字画像の一覧を画面に表示し、前記画面に表示された文字画像の一覧に基づいて誤読訂正する文字画像を指定すると共に、前記指定された文字画像を旧字体を対象として文字認識指定することを指定するための第2の訂正手段と、
    前記第1または第2の訂正部で指定された文字画像を前記第1または第2の訂正部で指定された新字体または旧字体を対象に文字認識する文字認識手段
    として機能させるための文字認識プログラム。
JP2010286313A 2010-12-22 2010-12-22 文字認識システムおよび文字認識プログラム Expired - Fee Related JP5284342B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010286313A JP5284342B2 (ja) 2010-12-22 2010-12-22 文字認識システムおよび文字認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010286313A JP5284342B2 (ja) 2010-12-22 2010-12-22 文字認識システムおよび文字認識プログラム

Publications (2)

Publication Number Publication Date
JP2012133653A JP2012133653A (ja) 2012-07-12
JP5284342B2 true JP5284342B2 (ja) 2013-09-11

Family

ID=46649166

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010286313A Expired - Fee Related JP5284342B2 (ja) 2010-12-22 2010-12-22 文字認識システムおよび文字認識プログラム

Country Status (1)

Country Link
JP (1) JP5284342B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6325218B2 (ja) * 2013-09-10 2018-05-16 株式会社東芝 文字認識結果検証装置及び文字読取システム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3457376B2 (ja) * 1994-02-28 2003-10-14 沖電気工業株式会社 光学式読み取り装置における文字修正方法
JPH11213087A (ja) * 1998-01-23 1999-08-06 Ricoh Co Ltd 文字認識装置
JP2010134833A (ja) * 2008-12-08 2010-06-17 Ricoh Co Ltd 文書処理装置、文書処理方法、プログラムおよび記録媒体

Also Published As

Publication number Publication date
JP2012133653A (ja) 2012-07-12

Similar Documents

Publication Publication Date Title
JP4311365B2 (ja) 文書処理装置およびプログラム
US9262104B2 (en) Information processing apparatus, image processing apparatus, and information processing system
US20060217958A1 (en) Electronic device and recording medium
US20060285748A1 (en) Document processing device
JP2013196479A (ja) 情報処理システム、情報処理プログラム、情報処理方法
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
JP5284342B2 (ja) 文字認識システムおよび文字認識プログラム
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
JP7027757B2 (ja) 情報処理装置及び情報処理プログラム
US11508139B2 (en) Information processing apparatus and non-transitory computer readable medium
JP6325218B2 (ja) 文字認識結果検証装置及び文字読取システム
US11972208B2 (en) Information processing device and information processing method
US11006015B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
US11170211B2 (en) Information processing apparatus for extracting portions filled with characters from completed document without user intervention and non-transitory computer readable medium
JP7271987B2 (ja) 情報処理装置及びプログラム
US20110033114A1 (en) Image processing apparatus and computer readable medium
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP5604276B2 (ja) 文書画像生成装置および文書画像生成方法
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム
JP2018120338A (ja) 情報処理装置及び情報処理プログラム
US11763582B2 (en) Information processing apparatus, control method of information processing apparatus, and non-transitory storage medium
JP2014044555A (ja) 画像処理装置、画像処理システム及びプログラム
JP7463675B2 (ja) 情報処理装置、及び情報処理プログラム
JP2011048491A (ja) 筆記情報処理装置、筆記情報処理システム、及びプログラム
US20230105904A1 (en) Image processing apparatus generating image of review question, control method therefor, and storage medium storing control program therefor

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130318

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130529

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees