JP4110786B2 - 認識文字列修正方法およびその装置並びにコンピュータプログラム - Google Patents

認識文字列修正方法およびその装置並びにコンピュータプログラム Download PDF

Info

Publication number
JP4110786B2
JP4110786B2 JP2002022303A JP2002022303A JP4110786B2 JP 4110786 B2 JP4110786 B2 JP 4110786B2 JP 2002022303 A JP2002022303 A JP 2002022303A JP 2002022303 A JP2002022303 A JP 2002022303A JP 4110786 B2 JP4110786 B2 JP 4110786B2
Authority
JP
Japan
Prior art keywords
character
result
character string
replacement
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002022303A
Other languages
English (en)
Other versions
JP2003223608A (ja
Inventor
雄二 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2002022303A priority Critical patent/JP4110786B2/ja
Publication of JP2003223608A publication Critical patent/JP2003223608A/ja
Application granted granted Critical
Publication of JP4110786B2 publication Critical patent/JP4110786B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、原稿を画像情報として入力して文字の認識を行なう文字認識処理によって得られた文字列を修正する技術に関する。
【0002】
【従来の技術】
文字認識処理を行なう文字認識装置においては、予め用意しておいた文字辞書の各文字と入力文字とを比較し、一致度の最も高い文字を認識結果としている。しかし、この認識結果は必ずしも正しいとは限らないので、その後、認識結果としての文字列をディスプレイに表示し、誤って認識された文字を画面上で修正可能な構成となっていた。つまり、画面上で修正対象文字が指示されると、認識時に一致度が比較的高かった複数の文字を次の順位の候補文字として表示し、そのなかに正解文字があればその文字を選択させ、なければ、例えば、かな漢字変換方式などによりキーボードから正解文字を入力させる。
【0003】
ところで、上記文字認識装置では、同じ文字を複数箇所で誤って認識することが多々ある。こうした場合に、一文字一文字、上記の修正作業を行っていては、作業性が悪く、誤り修正に要する時間は長時間に及んでしまう。このために、1つの誤認識文字を修正する際に、その誤認識文字と一致した画像情報も探し出し、一度に複数の箇所を修正できる一括修正機能を搭載した文字認識装置が提案されている。
【0004】
【発明が解決しようとする課題】
しかしながら、上記従来の技術では、画像情報として読み取った文字が、上記修正対象文字と類似する文字である場合、この類似する文字も一括して修正されることになり、正しく認識された文字まで誤って変更されることがあった。この結果、文字修正の精度が低下するという問題があった。
【0005】
この発明は、上記問題に鑑みてなされたもので、認識結果の一括修正を可能としながらも、文字修正の精度の向上を図ることを目的としている。
【0006】
【課題を解決するための手段およびその作用・効果】
前述した課題の少なくとも一部を解決するための手段として、以下に示す構成をとった。
【0007】
この発明の認識文字列修正方法は、
原稿を画像情報として入力して文字の認識を行なう文字認識処理によって得られた文字列を修正する認識文字列修正方法であって、
(a)作業者の操作指令に基づいて、前記文字列の中から任意の文字を選択するステップと、
(b)前記選択された任意の文字を、作業者の操作指令に従う所定の文字に置換するステップと、
(c)前記文字列の中から、前記ステップ(a)により選択された任意の文字と一致もしくは類似する文字を自動修正対象文字として順に選択するステップと、
(d)前記ステップ(c)により選択された自動修正対象文字を、前記所定の文字に置換するステップと、
(e)前記文字列における前記ステップ(d)により置換された前記所定の文字の前後についての構文を解析するステップと、
(f)前記ステップ(e)による構文の解析の結果に基づいて、前記ステップ(d)による置換の結果を正当なものと確定するステップと
を備えることを特徴としている。
【0008】
ここで、上記文字認識処理は、原稿を表わす画像情報を入力するものであれば、画像情報読取装置を駆動して原稿の画像情報を直接、読み取るものであってもよいし、画像情報読取装置を用いて予め得た原稿の画像情報を記憶装置から読み出すものであってもよい。また、上記略一致とは、完全に一致するものであってもよいし、類似するものであってもよいし、一致と類似の両方を含むものであってもよい。
【0009】
上記構成(以下、基本構成と呼ぶ)の認識文字列修正方法によれば、ステップ(a)、(b)により、作業者の操作指令に基づいて、認識された文字列(以下、認識文字列と呼ぶ)の中から任意の文字が選択されて、所定の文字に置換される。ステップ(c)により、認識文字列の中から、その選択された任意の文字と略一致する文字が、自動修正対象文字として順に選択され、ステップ(d)により、所定の文字に一旦置換される。その置換された文字の前後についての構文が、ステップ(e)により解析されて、その解析の結果に基づいて、ステップ(f)により、上位置換の結果が正当なものに確定される。
【0010】
したがって、この発明の認識文字列修正方法によれば、自動的に行なった文字の修正が正しい構文となる場合に限り、その修正が正当なものと確定される。このために、文字修正の精度を向上することができるという効果を奏する。
【0011】
上記構成の認識文字列修正方法において、(g)前記ステップ(f)による構文の解析の結果が正しい構文でないことを示すものであるとき、前記自動修正対象文字を前記ステップ(d)による置換がなされる前の状態に戻すステップを備える構成とすることができる。
【0012】
この構成によれば、自動的に行なった文字の修正が正しい構文でない場合に、その修正は元に戻される。このために、文字修正の精度をより向上することができる。
【0013】
上記構成の認識文字列修正方法において、(h)前記ステップ(f)によって正当なものと確定された置換の文字を、他の文字に対して識別可能に表示するステップを備える構成とすることができる。
【0014】
この構成によれば、置換の結果が正当なものと確定されたものについて、他の文字に対して識別可能に表示がなされる。このために、自動的に修正された文字であることを、作業者はその表示から知ることができる。
【0015】
上記構成の認識文字列修正方法において、前記ステップ(f)は、(f−1)前記ステップ(f)による構文の解析の結果が正しい構文であることを示すものであるとき、前記ステップ(d)による置換の結果を受け入れるかを、作業者に問い合わせるステップと、(f−2)前記ステップ(f−1)の問い合わせに対する作業者からの操作指令に基づいて前記置換の結果を受け入れると判定されたとき、前記ステップ(d)による置換の結果を正当なものと確定するステップとを備える構成とすることができる。
【0016】
この構成によれば、作業者に対して、修正の結果を受け入れることができるかを問い合わせることができることから、文字修正の精度をより一層向上することができる。
【0017】
この構成によれば、複数の候補文字列データの中から照合結果の優れた候補文字列データを選んで、その選んだ候補文字列データを変換結果として出力することが可能となる。
【0018】
上記構成の認識文字列修正方法において、前記ステップ(a)により選択される任意の文字が、連続する複数の文字から構成されるとき、前記ステップ(b)による置換は、前記連続する複数の文字を一つの所定の文字に置換する構成とすることができる。
【0019】
この構成によれば、1文字を表わす画像データから複数の文字が認識された場合、例えば、「時」の画像データから「日」の文字と「寺」の文字が分離されて認識された場合に、これらを元の1文字に修正することができる。
【0020】
上記構成の認識文字列修正方法において、前記ステップ(b)による置換は、1文字を複数の文字に置換する構成とすることができる。
【0021】
この構成によれば、複数の文字を表わす画像データから1文字が認識された場合に、これを元の複数の文字に修正することができる。
【0022】
この発明の認識文字列修正装置は、
原稿を画像情報として入力して文字の認識を行なう文字認識処理によって得られた文字列を修正する認識文字列修正装置であって、
作業者の操作指令に基づいて、前記文字列の中から任意の文字を選択する手動修正対象文字選択手段と、
前記選択された任意の文字を、作業者の操作指令に従う所定の文字に置換する手動修正手段と、
前記文字列の中から、前記手動修正対象文字選択手段により選択された任意の文字と一致もしくは類似する文字を自動修正対象文字として順に選択する自動修正対象文字選択手段と、
前記自動修正対象文字選択手段により選択された自動修正対象文字を、前記所定の文字に置換する自動修正手段と、
前記文字列における前記自動修正手段により置換された前記所定の文字の前後についての構文を解析する構文解析手段と、
前記構文解析手段による構文の解析の結果に基づいて、前記自動修正手段による置換の結果を正当なものと確定する修正結果確定手段と
を備えることを特徴としている。
【0023】
上記構成の認識文字列修正装置は、上記発明の認識文字列修正方法と同様な作用・効果を有しており、文字修正の精度を向上することができる。
【0024】
この発明のコンピュータプログラムは、
原稿を画像情報として入力して文字の認識を行なう文字認識処理によって得られた文字列を修正する処理を実行するコンピュータプログラムであって、
(a)作業者の操作指令に基づいて、前記文字列の中から任意の文字を選択する機能と、
(b)前記選択された任意の文字を、作業者の操作指令に従う所定の文字に置換する機能と、
(c)前記文字列の中から、前記機能(a)により選択された任意の文字と一致もしくは類似する文字を自動修正対象文字として順に選択する機能と、
(d)前記機能(c)により選択された自動修正対象文字を、前記所定の文字に置換する機能と、
(e)前記文字列における前記機能(d)により置換された前記所定の文字の前後についての構文を解析する機能と、
(f)前記機能(e)による構文の解析の結果に基づいて、前記機能(d)による置換の結果を正当なものと確定する機能と
を、コンピュータに実現させることを特徴としている。
【0025】
上記構成のコンピュータプログラムは、上記発明の認識文字列修正装置や認識文字列修正方法と同様な作用・効果を有しており文字修正の精度を向上することができる。
【0026】
この発明の記録媒体は、この発明のコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体を特徴としている。この記録媒体は、この発明の各コンピュータプログラムと同様な作用・効果を有している。
【0027】
【発明の他の態様】
この発明は、以下のような他の態様も含んでいる。その第1の態様は、この発明のコンピュータプログラムを通信経路を介して供給するプログラム供給装置としての態様である。この第1の態様では、コンピュータプログラムをコンピュータネットワーク上のサーバなどに置き、通信経路を介して、必要なプログラムをコンピュータにダウンロードし、これを実行することで、上記の装置や方法を実現することができる。
【0028】
【発明の実施の形態】
以上説明したこの発明の構成・作用を一層明らかにするために、以下この発明の実施の形態を実施例に基づき説明する。
【0029】
1.ハードウェアの全体構成
図1は、この発明の第1実施例を適用するコンピュータシステムのハードウェアの概略構成を示すブロック図である。このコンピュータシステムは、いわゆるパーソナルコンピュータ(以下、単にコンピュータと呼ぶ)を中心に備え、その周辺にCRTディスプレイ12およびイメージスキャナ14を備える。コンピュータは、コンピュータ本体16とキーボード18とマウス20を備える。なお、このコンピュータ本体16には、CD−ROM22の内容を読み取るCDドライブ24が搭載されている。
【0030】
コンピュータ本体16は、中央演算処理装置としてのCPU30を中心にバスにより相互に接続されたROM31、RAM32、表示画像メモリ33、マウスインタフェース34、キーボードインタフェース35、CDC36、HDC37、CRTC38、入出力機用インタフェース40およびI/Oポート41を備える。ROM31は、内蔵されている各種プログラム等を記憶する読み出し専用のメモリである。RAM32は、各種データ等を記憶する読み出し・書込み可能なメモリである。表示画像メモリ33は、CRTディスプレイ12に表示する画像の画像データを記憶するメモリである。
【0031】
マウスインタフェース34は、マウス20とのデータ等のやり取りを司るインタフェースである。キーボードインタフェース35は、キーボード18からのキー入力を司るインタフェースである。CDC36は、CDドライブ(CDD)24を制御するCDコントローラである。HDC37は、ハードディスクドライブ(HDD)42を制御するハードディスクコントローラである。HDD42には、後述するコンピュータプログラムや、後述する文字認識に用いられる文字辞書や、後述する構文解析に用いられる単語辞書およびルール辞書等が予め記憶されている。
【0032】
CRTC38は、表示画像メモリ33に記憶される表示画像データに基づいてCRTディスプレイ12における画像の表示を制御するCRTコントローラである。入出力機用インタフェース40は、外部に接続された入出力機器、この実施例ではイメージスキャナ14へのデータの入出力を制御するインタフェースである。I/Oポート41は、シリアル出力のポートを備えており、モデム44に接続されており、このモデム44を介して、公衆電話回線46に接続されている。コンピュータ本体16は、モデム44を介して、外部のネットワークに接続されており、特定のサーバ47に接続可能となっている。
【0033】
このコンピュータシステムでは、オペレーティングシステムはHDD42に記憶されており、コンピュータ本体16に電源を投入すると、HDD42のブートブロックに書き込まれたローダに従ってRAM32の所定の領域にロードされる。また、イメージスキャナ14で取り込んだ画像(以下、スキャン画像と呼ぶ)をテキストデータに変換する文字認識用ソフトウェア(コンピュータプログラム)は、CD−ROM22に予め格納されており、所定のインストールプログラムを起動することで、CDドライブ24からコンピュータ本体16にインストールされる。このインストールされたコンピュータプログラムは、HDD42に記憶されており、所定の起動命令を受けたときに、RAM32の所定の領域にロードされる。
【0034】
このコンピュータプログラムをCPU30が実行することによって本発明の各種構成要件は実現される。このコンピュータプログラムは、前述したように、CD−ROM22に格納されたものであるが、これに替えて、フロッピィディスク、光磁気ディスク、ICカード等の他の携帯型記録媒体(可搬型記録媒体)に格納された構成としてもよい。また、前述したコンピュータプログラムは、外部のネットワークに接続される特定のサーバ47から、ネットワークを介して提供されるプログラムデータをダウンロードして、RAM32またはHDD42に転送することにより得るようにすることもできる。なお、上記ネットワークとしては、インターネットであってもよく、特定のホームページからダウンロードして得たコンピュータプログラムであってもよい。あるいは、電子メールの添付ファイルの形態で供給されたコンピュータプログラムであってもよい。
【0035】
以上説明したハードウェア構成を有するコンピュータシステムによる文字認識用ソフトウェアに従う制御処理の様子について次に説明する。図2は、コンピュータ本体16によって実行される文字認識用ソフトウェア50に従う処理の様子を示すブロック図である。
【0036】
図2に示すように、コンピュータ本体16の内部で動作している文字認識用ソフトウェア50によれば、まず、スキャン画像取込部51によりスキャナドライバ60を動作させてイメージスキャナ14から文書の記載された原稿Pの画像(スキャン画像)を取り込む処理を行なう。次いで、スキャン画像取込部51によって取り込まれたスキャン画像についての文字認識を、文字列認識モジュール52によって行なう。この文字列認識モジュール52によって、原稿に記載された文字列のデータ(テキストデータ)が得られる。
【0037】
続いて、文字列認識モジュール52により得られた文字列のデータを、認識文字列修正モジュール53によって修正する。認識文字列修正モジュール53の働きは、詳しくは、次のようなものである。まず、作業者によるマウス20もしくはキーボード18の操作指令に基づいて、手動修正対象文字選択部53aにより、前記テキストデータの中から任意の文字を選択する。次いで、その選択された任意の文字を、作業者によるキーボード18もしくはマウス20の操作指令に従う所定の文字に、手動修正部53bにより置換する。
【0038】
続いて、文字列認識モジュール52によって得られた文字列のデータの中から、手動修正対象文字選択部53aにより選択された任意の文字と略一致する文字を、自動修正対象文字選択部53cによって、自動修正対象文字として順に選択する。その後、その自動修正対象文字を、自動修正部53dにより、前記所定の文字に置換する。続いて、その自動修正部53dにより置換された文字の前後についての構文を、構文解析部53eにより解析する。続いて、その構文の解析の結果に基づいて、自動修正部53dによる置換の結果を、修正結果確定部53fにより正当なものと確定する。
【0039】
手動修正部53bおよび修正結果確定部53fにより定まった文字列データは、ディスプレイドライバ70を介してCRTディスプレイ12へ送られて表示される。
【0040】
コンピュータ本体16のCPU30で文字認識用ソフトウェア50を実行することで、上述した文字列認識モジュール52および認識文字列修正モジュール53を実現している。文字認識用ソフトウェア50に従う制御処理について、以下詳細に説明する。図3は、この制御処理のルーチンを示すフローチャートである。このルーチンは、文字認識用ソフトウェア50を実行させる旨の指示がなされた以後、所定時間毎に繰り返し実行される。
【0041】
図示するように、処理が開始されると、CPU30は、まず、この文字認識用ソフトウェア50の起動後、最初であるか否かを判別する(ステップS100)。ここで、最初であると判別されたときには、アプリケーションウィンドウWDを初期状態でCRTディスプレイ12に表示する処理を行なう(ステップS110)。図4は、初期状態のアプリケーションウィンドウWDを示す説明図である。図示するように、アプリケーションウィンドウWDには、メニューバーBR1とツールバーBR2,BR3とが設けられている。ツールバーBR2には、後述する一括修正ボタンBT11と結合ボタンBT12と分離ボタンBT13と再認識ボタンBT14が設けられている。ツールバーBR3には、作業手順に従った順にコマンドを実行するための「スキャン」、「領域抽出」、「認識」、「保存」のボタンBT1,BT2,BT3,BT4が設けられている。なお、図3に戻って、ステップS100で最初でないと判別されたときには、ステップS110の処理は実行しない。
【0042】
次いで、CPU30は、ツールバーBR3上の「スキャン」のボタンBT1が、マウス20によってクリック操作されたか否かを判別する(ステップS120)。ここで、肯定判別されたときには、CPU30は、文字認識の対象となる原稿Pをスキャンするスキャン処理を実行する(ステップS130)。原稿Pは、例えば、文書の記載された書類である。ステップS130では、CPU30は、スキャナドライバ60を動作させて、原稿Pがセットされたイメージスキャナ14から原稿Pの画像を示すスキャン画像データを取り込む。ステップS130の実行後、「リターン」に抜けて処理を一旦終了する。なお、このステップS130の構成に替えて、イメージスキャナを用いて取り込んだ原稿Pのスキャン画像を予めHDD42に格納しておき、このHDD42内のスキャン画像を読み出す構成とすることもできる。すなわち、原稿Pを画像情報として入力できるものであれば、イメージスキャナを用いてその都度読み出す構成としてもよいし、予めHDD42等の記憶手段に用意しておき、その記憶手段から読み出す構成とすることもできる。また、原稿の画像情報をネットワークを介して外部から取り込む構成とすることもできる。
【0043】
一方、ステップS120で否定判別されたときには、CPU30は、ステップS140に処理を進めて、「領域抽出」のボタンBT2が、マウス20によってクリック操作されたか否かを判別する。ここで、肯定判別されたときには、CPU30は、領域抽出処理を実行する(ステップS150)。この領域抽出処理は、ステップS130のスキャン処理により取り込まれたスキャン画像データから、文字列認識の対象となる任意の画像領域を抽出するものである。作業者は、アプリケーションウィンドウWDに表示された原稿Pのスキャン画像に対して、マウス20を用いて、文字列認識の対象としたい画像領域の範囲を指定する操作を行なう。CPU30は、この作業者によるマウス操作を受けて、そのマウス20によって指定された画像領域のデータをスキャン画像データの中から抽出する。この領域抽出処理が終了すると、「リターン」に抜けてこの処理を一旦終了する。
【0044】
一方、ステップS140で否定判別された場合には、ステップS160に処理を進める。なお、フローチャートには詳細に記載されていないが、ステップS140で肯定判別された場合でも、ステップS130のスキャン処理の実行後でない場合には、ステップS160に処理を進める。
【0045】
ここまでの処理によって、HDD42には、文字認識の対象となる画像データ(以下、認識対象画像データと呼ぶ)として、ステップS150の領域抽出処理により得られた抽出画像データが用意されることになる。なお、ステップS130のスキャン処理が実行されただけで、ステップS150の領域抽出処理が実行されていない場合には、ステップS130のスキャン処理で得られたスキャン画像データが、そのまま認識対象画像データとなる。
【0046】
ステップS160に処理が移行すると、ツールバーBR3上の「認識」のボタンBT3が、マウス20によってクリック操作されたか否かを判別する。ここで、肯定判別されたときには、CPU30は、認識対象画像データをテキストデータに変換する文字列認識処理を実行する(ステップS170)。この文字列認識処理は、HDD42に予め用意した文字辞書(この文字認識用ソフトウェア50で用意されている)の各文字と、認識対象画像データで表わされる各文字についての画像とを比較し、一致度の最も高い文字を認識結果とする周知の技術であり、ここでは詳しい説明は省略する。
【0047】
図5は、上記文字列認識処理の終了後のアプリケーションウィンドウWDの一例を示す説明図である。図示するように、アプリケーションウィンドウWDのツールバーBR3の下方には、原画像表示用のウィンドウF1と認識結果表示用のウィンドウF2とが用意される。ステップS170の文字列認識処理の終了後には、原画像ウィンドウF1に、上記認識対象画像データTDが表示され、認識結果ウィンドウF2には、この文字列認識処理の認識結果である文字列(テキストデータ)が表示される。また、認識結果ウィンドウF2の下方には、候補文字フィールドF3が用意されており、この候補文字フィールドF3には、認識結果ウィンドウF2に表示されたテキストデータ中のカーソルのある位置の文字についての認識の次候補が表示される。図示の例では、そのテキストデータ中の文頭にカーソルが位置し(文字列認識処理の終了直後には、文頭にカーソルが位置するものと設計されている)、その文頭のテキストデータ、すなわち、図示の例ではスペースについての認識の次候補(実際には図示のように全てスペース)が表示される。
【0048】
図3に戻り、ステップS160で否定判別された場合には、ステップS180に処理を進める。なお、フローチャートには詳細に記載されていないが、ステップS160で肯定判別された場合でも、ステップS130のスキャン処理の実行後でない場合には、ステップS180に処理を進める。ステップS180では、ツールバーBR3上の「保存」のボタンBT4が、マウス20によってクリック操作されたか否かを判別して、ここで、肯定判別されたときには、CPU30は、文字列認識処理ルーチンで得られたテキストデータを保存する(ステップS190)。ステップS190の実行後、またはステップS190で否定判別された場合には、「リターン」に抜けてこの制御処理のルーチンを一旦終了する。
【0049】
ステップS170の文字列認識処理の実行後には、CRTディスプレイ12には、前述したように、図5に示されるアプリケーションウィンドウWDが表示される。作業者は、このアプリケーションウィンドウWDの認識結果ウィンドウF2に表示されるテキストデータを、原画像表示用のウィンドウF1に表示される画像データと比較しながら見ることで、文字列認識処理が正しく行なわれているか否かを確認することができる。作業者は、認識結果であるそのテキストデータに誤りを発見したときには、その誤っている文字を修正する作業を行なう。この修正の作業は、CPU30により実行される認識文字列修正ルーチンに従って行なわれる。以下、この認識文字列修正ルーチンについて詳述する。
【0050】
図6および図7は、CPU30により実行される認識文字列修正ルーチンを示すフローチャートである。この認識文字列修正ルーチンは、所定時間毎に繰り返し実行される。図6に示すように、処理が開始されると、CPU30は、まず、マウス20またはキーボード18から操作信号を取り込んで、認識結果である上記テキストデータの中から所望の文字を選択する操作がなされたか否かを判別する(ステップS200)。この文字の選択操作は、作業者によるマウス20またはキーボード18を用いた操作であり、マウス20を用いる場合には、CRTディスプレイ12の画面に表示されたそのテキストデータの所望の位置をクリックして1文字を選択するといった操作を行なう。ステップS200で、その文字選択の操作がなされていないと判別されたときには、CPU30は、リターンに処理を進めて、この認識文字列修正ルーチンの処理を一旦終了する。
【0051】
一方、ステップS200で、その文字選択の操作がなされたと判別されたときには、以下の処理を実行する。まず、CPU30は、その文字選択の操作、すなわちマウス20またはキーボード18の操作によって定まる位置(テキストデータにおける位置であり、以下、所定位置P0と呼ぶ)の文字C1を選択する処理を行なう(ステップS210)。図8は、このステップS210の処理後のアプリケーションウィンドウWDの一例を示す説明図である。図9は、図8の認識結果ウィンドウF2周辺の拡大図である。CPU30の処理によって、図9に示すように、認識結果ウィンドウF2に表示されるテキストデータ中の第2行目の「異例の列草だ」の内の「草」の文字が、文字(以下、選択文字と呼ぶ)C1として選択される。このとき、候補文字フィールドF3には、認識の次候補である「車」、「卓」、「串」、…が順に表示されている。
【0052】
図6に戻り、次いで、CPU30は、選択文字C1を、記憶用選択文字C1XとしてRAM32に一旦記憶する(ステップS215)。続いて、CPU30は、上記テキストデータ中の選択文字C1を、マウス20またはキーボード18からの作業者による操作指令に従う所定の文字C2に置換する処理を行なう(ステップS220)。図9の例では、作業者は、候補文字フィールドF3に表示される次候補群から、上記誤認識した「草」に替わる正しい「車」の文字をマウス20を用いてクリックする操作を行なう。ステップS220では、このマウス20からの操作信号を取り込んで、マウス20の操作によって定まる候補文字(この例の場合、「車」)を上記所定の文字C2として、上記テキストデータにおける選択文字C1に上書きする。
【0053】
図6に戻り、ステップS220の実行後、CPU30は、一括修正機能を働かせる指示が予め設定されているか否かを判別する(ステップS230)。この指示は、アプリケーションウィンドウWD上での作業者によるマウス操作によって指示されるものである。アプリケーションウィンドウWDのツールバーBR2には、一括修正ボタンBT11(図8参照)が設けられているが、この一括修正ボタンBT11がマウスクリックされると、一括修正機能を働かせる指示をコンピュータ本体16に対して設定することができる。ステップS230では、この一括修正機能を働かせる指示が予め設定されているか否かを判別する。ここで、その指示が設定されていないと判別されたときには、「リターン」に抜けて処理を一旦終了する。
【0054】
一方、ステップS230で、一括修正機能を働かせる指示が予め設定されていると判別されたときには、CPU30は、以下の処理を行なう。まず、認識対象画像データから、上記所定位置P0に対応する文字の範囲の画像データ(以下、文字画像データと呼ぶ)PDを抽出してRAM32に記憶する(ステップS240)。この文字画像データPDは、選択文字C1に対応する文字画像データである。次いで、CPU30は、変数mに値1をセットする(ステップS250)。
【0055】
その後、CPU30は、認識結果である上記テキストデータにあって上記所定位置P0から上記変数mの値だけ後方に、認識された文字が存在するか否かを判別する(ステップS260)。ここで、存在しないと判別された場合には、「リターン」に抜けて処理を一旦終了する。一方、ステップS260で認識文字が存在すると判別された場合には、CPU30は、図7のステップS270に処理が進む。
【0056】
ステップS270では、CPU30は、ステップS260で存在すると判断された上記所定位置P0から上記変数mの値だけ後方の文字(以下、m番目の文字と呼ぶ)Cmが、ステップS215で得られた記憶用選択文字C1Xと同一であるか否かを判別する。ここで、同一であると判別されると、そのm番目の文字Cmを修正前文字CmXとしてRAM32に一旦記憶して(ステップS280)、認識結果のテキストデータ上においてそのm番目の文字(特許請求の範囲でいう自動修正対象文字に該当)Cmを、ステップS220で用いた所定の文字(以下、置換文字と呼ぶ)C2に置き換える(ステップS290)。
【0057】
一方、ステップS270でm番目の文字Cmが記憶用選択文字C1Xと同一でないと判別されたときには、CPU30は、ステップS275に処理を進めて、上記m番目の文字Cmに対応する文字画像データが、ステップS240で記憶した文字画像データPDと類似しているか否かを判別する。この類似度の判定は、文字画像データで示される画像の特徴を抽出して、特徴の一致度を数量的に演算して、その演算結果から判定を行なう。ステップS275で、類似していると判別された場合には、ステップS280に処理を進める。すなわち、ステップ270で、m番目の文字Cmが、ステップ210で選択された選択文字C1と同一であるか、そのm番目の文字Cmに対応する文字画像データが、その選択文字C1に対応する文字画像データと類似する場合に、ステップ280に処理が進められる。
【0058】
なお、このステップS270とステップS275を備える構成に替えて、ステップS275を削除してステップS270だけを備える構成としてもよい。この場合、ステップS270で否定判別されたときには、ステップS350に処理を進める。また、ステップS270を削除してステップS275だけを備える構成としてもよい。この場合、ステップS260の後にステップS275が続く。
【0059】
ステップS290で文字C2への置換が行なわれた後、CPU30は、ステップS300に処理を進めて、認識結果である上記テキストデータにおける置換文字C2の前後についての構文を解析する処理を行なう。構文解析の処理は、入力テキストを形態素と呼ばれる最小言語単位に分割し、それら形態素に分割された文を文節と呼ばれる単位までまとめて、その文の構文構造を解析するものである。上記形態素への分割は、すべての品詞の入った単語辞書を基に行なわれる。構文構造の解析は、各文節の係り受け構造を解析しようとするもので、構文解析に必要な知識を格納したルール辞書を基に行なわれる。単語辞書およびルール辞書は、前述したようにHDD42に予め記憶されている。
【0060】
文節の係り受け構造とは、その文節が修飾することができる相手の文節の種類、およびその文節が修飾を受けることができる相手の文節の種類を分類し、それぞれ係り、受けとした構造である。上記構文構造の解析では、この文節の係り受け構造を解析して、文節の係り受けの強さの度合い、すなわち文節の意味的な結びつきの強さの度合いを評価する。具体的な構文解析の手法については周知のものであることから、ここではその説明は省略する。ステップS300では、認識結果であるテキストデータにおいて上記置換文字C2を中心に所定の文字数の文字列を抽出して、これを上記入力テキストとして構文解析の処理を行なう。なお、構文解析の方法については、上記の記述に限定されるものではなく、構文を意味的に解析可能なものであればどのようなものでもよい。また、上記前後の範囲は所定の文字数から必ずしも定まる必要はなく、適当な文節で抽出してもよいし、文にて抽出してもよい。
【0061】
ステップS300の構文解析を終えると、次いで、CPU30は、その構文解析の評価結果に基づいて、この構文(テキストデータにおける置換文字C2前後の構文)が正しいか否かを判別する(ステップS310)。すなわち、評価結果が文節の意味的な結びつきの強さの度合いが大きい場合(所定値以上の場合)には、ステップS310で、その構文は正しいと判別され、CPU30は、ステップS320に処理を進めて、「先回り修正の確認」のダイアログボックスDB1をCRTディスプレイ12に表示する処理を行なう。
【0062】
図10は、「先回り修正の確認」のダイアログボックスDB1をアプリケーションウィンドウWDとともに示す説明図である。図11は、ダイアログボックスDB1の拡大図である。図11に示すように、このダイアログボックスDB1には、修正前の文字データ(修正前文字CmX)と修正後の文字データ(置換文字C2)と共に、「この部分を修正しますか?」という問い合わせのメッセージが記載されている。作業者は、認識結果表示用のウィンドウF2に表示されるテキストデータとともに、ダイアログボックスDB1を見て、認識結果の修正が正しいか否か(修正を受け入れることができるか否か)を判定する。作業者は受け入れると判定した場合には、ダイアログボックスDB1の「はい」のボタンBT21をクリックする。一方、作業者は、その修正を受け入れることができないと判定した場合には、ダイアログボックスDB1の「いいえ」のボタンBT22をクリックする。
【0063】
図7に戻り、ステップS320で「先回り修正の確認」のダイアログボックスDB1の表示がなされると、次いで、CPU30は、マウス20からの出力信号を読み取って上記作業者の操作が、「はい」のボタンBT21と「いいえ」のボタンBT22のいずれがクリックされたかを判定する(ステップS330)。ここで、「いいえ」のボタンBT22がクリックされたと判別された場合には、ステップS340に処理を進めて、ステップS290で置き換えた置換文字C2を、置換前の文字、すなわちステップS280で記憶した修正前文字CmXに戻す。ステップS340の実行後、CPU30は、上記変数mを値1だけインクリメントする(ステップS350)。
【0064】
一方、ステップS330で「はい」のボタンBT21がクリックされたと判別された場合には、ステップS340を実行することなしにステップS350に処理を進める。すなわち、認識結果の修正が正しいと作業者により判別された場合には、CPU30は、ステップS290で行なわれた文字C2への置換は、正当であるものと確定して、直ちにステップS350に処理を進める。
【0065】
ステップS350の実行後、CPU30は、図6のステップS260に処理を戻して、ステップS260ないしS350の処理を、値1だけインクリメントされた新たな変数mから定まる自動修正対象文字(m番目の文字)Cmに対して行なう。なお、ステップS275で否定判別、すなわち、自動修正対象文字Cmに対応する画像データが、文字画像データPDに類似していないと判別された場合には、CPU30は、そのままステップS350に処理を進めて、変数mを値1だけインクリメントする。
【0066】
上記構成の認識文字列修正ルーチンによれば、まず、ステップS210の処理により、認識結果のテキストデータの中から、作業者の操作指令に基づく任意の文字、例えば、図9の例では、第2行目の「異例の列草だ」の内の「草」の文字C1が選択される。その後、ステップS220の処理により、その選択された文字C1が、作業者の操作指令に基づいて置換文字C2に置き換えられる。次いで、ステップS250ないしS275の処理により、上記「草」の文字C1に続く「だ」の文字C1′について選択文字C1(記憶用選択文字C1X)と同一か、もしくは類似しているかの判定がなされる。「だ」の文字C1′は「草」の文字C1Xと同一でないと判別され、またそれぞれの文字画像データは類似でないと判定されることから、「だ」の文字C1′については特別な処理を行なわずに、処理対象を続く文字に移行する。ステップS260ないしS350の繰り返しの処理により、テキストデータの後方に向かって一文字ずつ、「草」の文字C1Xと一致するか、あるいはそれぞれの文字画像データが類似しているかの判定がなされる。
【0067】
図9の例では、テキストデータにおける第14行目の「11号草」の内の「草」の文字C1′′に処理対象が移行すると、「草」の文字C1Xとの一致が見られる。その文字を自動修正対象文字Cmとして、置換文字C2に一旦置き換えられる。そうして、その置換文字C2の前後についての構文を解析して、その構文が正しくないと判別された場合には、置換文字C2に置換された自動修正対象文字Cmを置換前の状態に戻す。一方、構文解析によりその構文が正しいと判別された場合には、図10に例示するように、「先回り修正の確認」のダイアログボックスDB1が表示され、作業者に対してその置換の結果を受け入れるか否かの判断を促した上で、その文字Cmの置換文字C2への置き換えを正当なものとして確定する。
【0068】
したがって、この第1実施例によれば、認識結果であるテキストデータに対して一括修正を行なうに際して、その修正が正しい構文となる場合に限り、その修正が正当なものと確定される。このために、文字修正の精度を向上することができるという効果を奏する。また、この第1実施例によれば、修正が正しい構文でない場合は、自動的にその修正は元に戻される。このために、文字修正の精度をより向上することができる。
【0069】
さらに、この第1実施例によれば、構文解析によりその構文が正しいと判別された場合には、「先回り修正の確認」のダイアログボックスDB1が表示され、作業者に対してその置換の結果を受け入れることができるかを問い合わせることができる。このために、文字修正の精度をより向上することができる。
【0070】
この第1実施例についてさらに説明を続ける。この第1実施例では、前記ステップS210により選択される任意の文字は、「草」で例示した1文字であるものと説明したが、この任意の文字は、必ずしも1文字である必要はなく、連続する複数の文字を選択することが可能となっている。図9に示した認識結果ウィンドウF2に表示されるテキストデータ中の第2行目には、「日」と「寺」といった連続する2文字が含まれるが、ステップS210では、この「日」と「寺」の2文字が選択される構成とすることができる。この後に、作業者は、アプリケーションウィンドウWDのツールバーBR2に設けられた結合ボタンBT12(図8参照)をマウス20を用いてクリックする操作を行なうが、この場合には、ステップS220では、このマウス20からの操作信号を取り込んで、前記連続する複数の文字が結合した1つの文字、すなわち上記の例では、「時」の文字を置換文字C2として、選択文字C1が置換文字C2に置換される。
【0071】
この構成によれば、1文字を表わす画像データから複数の文字が誤認識された場合、例えば、「時」の画像データから「日」の文字と「寺」の文字が分離されて認識された場合に、これらを元の1文字に修正することができる。なお、複数の文字に分離される文字の例としては、「唄」、「林」、「甥」、「艶」、「蚊」等、様々なものがある。
【0072】
また、文字認識の結果、2文字が1文字として認識されるような場合もあり得る。例えば、00といった半角2文字を、}といった全角1文字に誤認識することがあるが、この場合には、前記ステップS210により選択される任意の文字を、}の文字とする。この後に、作業者は、アプリケーションウィンドウWDのツールバーBR2に設けられた分離ボタンBT13(図8参照)をマウス20を用いてクリックする操作を行なうが、この場合には、ステップS220では、このマウス20からの操作信号を取り込んで、複数の文字、すなわち上記の例では、「00」を置換文字C2として、選択文字C1が置換文字C2に置換される。
【0073】
この構成によれば、複数の文字を表わす画像データから1文字が誤認識された場合に、これを元の複数の文字に修正することができる。
【0074】
この発明の第2実施例について次に説明する。この第2実施例は、第1実施例と比較して、同一のハードウェアの構成を備える。ソフトウェアの構成もほぼ同じで、認識文字列修正ルーチンの一部が相違するだけである。図12は、この第2実施例における認識文字列修正ルーチンの後半部分を示すフローチャートである。この第2実施例における認識文字列修正ルーチンの前半部分は、第1実施例と同一であり、図6で示されるものである。この第2実施例における認識文字列修正ルーチンの後半部分は、図12に示すように、第1実施例と同一の処理内容のステップS270ないしS310およびステップS340を備える。
【0075】
ステップS310で、構文解析の評価結果に基づいて、その構文が正しいと判別された場合には、CPU30は、認識結果のテキストデータ上におけるステップS290で置き換えた置換文字C2をハイライト表示する(ステップS400)。ここでいうハイライト表示とは、その置換文字C2の背景部分を黒色として、その置換文字C2を白抜きにて表わす表示である。ステップS400の結果、その置換文字C2は正当なものとして確定されることになる。ステップS400の実行後、CPU30は、ステップS350に処理を進める。
【0076】
上記構成の認識文字列修正ルーチンによれば、自動修正対象文字Cmが自動的に全て置換文字C2に置換され、その置換文字C2の前後の構文が正しいと解析されたものについては、その置換結果はハイライト表示された上で、正当なものに確定される。図13は、認識文字列修正ルーチンの終了後のアプリケーションウィンドウWDの一例を示す説明図である。図14は、図13の認識結果ウィンドウ周辺の拡大図である。これら図に示すように、自動的に置換され、構文が正しいと解析された全ての置換文字C2は、ハイライト表示される。
【0077】
以上のように構成された第2実施例によれば、第1実施例と同様に、文字修正の精度を向上することができる。特に、この第2実施例では、第1実施例のように、修正を行なう毎に、「先回り修正の確認」のダイアログボックスDB1が表示され、作業者に対してその置換の結果を受け入れることができるかを問い合わせるようなことはない。修正対象文字は即座に修正され、その修正した個所は、CRTディスプレイ12の画面上からハイライト表示にて容易に知ることができる。
【0078】
なお、上記ハイライト表示は、置換文字C2を他の文字に対して識別可能な表示であればどのようなものであってもよく、アンダーラインを付す構成としてもよいし、太字にて表示する構成としてもよい。
【0079】
本発明の他の実施形態について、次に説明する。第1および第2実施例では、作業者が置換文字C2を入力する操作としては、候補文字フィールドF3に表示される次候補群から、上記誤認識した「草」に替わる正しい「車」の文字をマウス20を用いてクリックする操作を行なっていた。これに加えて、候補文字フィールドF3に表示される次候補群に正解の文字がないような場合には、文字認識に用いた文字辞書を収録数の多い文字辞書(あるいは、専門分野に偏った文字辞書)に変換して、文字の再認識の処理を行なう構成とすることができる。作業者は、アプリケーションウィンドウWDのツールバーBR2に設けられた再認識用ボタンBT14(図8参照)をマウス20を用いてクリックする操作を行なうことにより、上記再認識の処理の実行を指示することができる。CPU30は、置換文字C2を入力するに際して、上記再認識用ボタンBT14がクリックされる操作信号を取り込んで、上記再認識の処理を実行するとともに、その再認識により得られた候補を最初の認識処理と同様に候補文字フィールドF3に表示させて、その候補文字フィールドF3に表示される候補群から指令される候補文字を置換文字C2として定める。この実施形態によれば、文字修正の精度をより一層向上することができる。
【0080】
第1および第2実施例では、認識結果であるテキストデータ上で自動修正対象文字Cmを置換文字C2に置換して、その後、その置換された文字の前後(テキストデータ上の前後)についての構文を解析して、その構文の解析の結果に基づいて、その置換の結果を正当なものと確定していた。これに替えて、認識結果であるテキストデータ上から、自動修正対象文字Cmの前後所定範囲の文字列データを抽出して、その文字列データをRAMの別の領域に一旦転送して、この転送された文字列データのうちの上記自動修正対象文字Cmを置換文字C2に置き換え、その後、その文字列データの構文を解析して、この構文の解析の結果が正しい構文であると判別されたときに、この置換結果が正当なものであるとして、その文字列データを上記テキストデータ上に戻す構成とすることもできる。この構成によっても、第1および第2実施例と同様に、文字修正の精度を向上することができる。
【0081】
以上、本発明の一実施例を詳述してきたが、本発明は、こうした実施例に何等限定されるものではなく、本発明の要旨を逸脱しない範囲において種々なる態様にて実施することができるのは勿論のことである。
【図面の簡単な説明】
【図1】この発明の第1実施例を適用するコンピュータシステムのハードウェアの概略構成を示すブロック図である。
【図2】コンピュータ本体16によって実行される文字認識用ソフトウェア50に従う処理の様子を示すブロック図である。
【図3】文字認識用ソフトウェア50に従う制御処理のルーチンを示すフローチャートである。
【図4】初期状態のアプリケーションウィンドウWDを示す説明図である。
【図5】文字列認識処理の終了後のアプリケーションウィンドウWDの一例を示す説明図である。
【図6】CPU30により実行される認識文字列修正ルーチンの前半部分を示すフローチャートである。
【図7】CPU30により実行される認識文字列修正ルーチンの後半部分を示すフローチャートである。
【図8】ステップS210で修正しようとする選択文字C1を指定した後のアプリケーションウィンドウWDの一例を示す説明図である。
【図9】図8の認識結果ウィンドウF2周辺の拡大図である。
【図10】「先回り修正の確認」のダイアログボックスDB1をアプリケーションウィンドウWDとともに示す説明図である。
【図11】ダイアログボックスDB1の拡大図である。
【図12】この発明の第2実施例における認識文字列修正ルーチンの後半部分を示すフローチャートである。
【図13】認識文字列修正ルーチンの終了後のアプリケーションウィンドウWDの一例を示す説明図である。
【図14】図13の認識結果ウィンドウ周辺の拡大図である。
【符号の説明】
12…CRTディスプレイ
14…イメージスキャナ
16…コンピュータ本体
18…キーボード
20…マウス
30…CPU
31…ROM
32…RAM
33…表示画像メモリ
34…マウスインタフェース
35…キーボードインタフェース
36…CDC
37…HDC
38…CRTC
40…入出力機用インタフェース
41…I/Oポート
42…ハードディスクドライブ
44…モデム
46…公衆電話回線
47…サーバ
50…文字認識用ソフトウェア
51…スキャン画像取込部
52…文字列認識モジュール
53…認識文字列修正モジュール
53a…手動修正対象文字選択部
53b…手動修正部
53c…自動修正対象文字選択部
53d…自動修正部
53e…構文解析部
53f…修正結果確定部
P…原稿
WD…アプリケーションウィンドウ
F1…原画像ウィンドウ
F2…認識結果ウィンドウ
F3…候補文字フィールド
BT11…一括修正ボタン
BT12…結合ボタン
BT13…分離ボタン
BT14…再認識ボタン
C1…選択文字
C1X…記憶用選択文字
C2…置換文字
Cm…自動修正対象文字
CmX…修正前文字
DB1…「先回り修正の確認」のダイアログボックス

Claims (16)

  1. 原稿を画像情報として入力して文字の認識を行なう文字認識処理によって得られた文字列を修正する認識文字列修正方法であって、
    (a)作業者の操作指令に基づいて、前記文字列の中から任意の文字を選択するステップと、
    (b)前記選択された任意の文字を、作業者の操作指令に従う所定の文字に置換するステップと、
    (c)前記文字列の中から、前記ステップ(a)により選択された任意の文字と一致もしくは類似する文字を自動修正対象文字として順に選択するステップと、
    (d)前記ステップ(c)により選択された自動修正対象文字を、前記所定の文字に置換するステップと、
    (e)前記文字列における前記ステップ(d)により置換された前記所定の文字の前後についての構文を解析するステップと、
    (f)前記ステップ(e)による構文の解析の結果に基づいて、前記ステップ(d)による置換の結果を正当なものと確定するステップと
    を備える認識文字列修正方法。
  2. 請求項1に記載の認識文字列修正方法であって、
    (g)前記ステップ(f)による構文の解析の結果が正しい構文でないことを示すものであるとき、前記自動修正対象文字を前記ステップ(d)による置換がなされる前の状態に戻すステップ
    を備える認識文字列修正方法。
  3. 請求項1または2に記載の認識文字列修正方法であって、
    (h)前記ステップ(f)によって正当なものと確定された置換の文字を、他の文字に対して識別可能に表示するステップ
    を備える認識文字列修正方法。
  4. 請求項1または2に記載の認識文字列修正方法であって、
    前記ステップ(f)は、
    (f−1)前記ステップ(f)による構文の解析の結果が正しい構文であることを示すものであるとき、前記ステップ(d)による置換の結果を受け入れるかを、作業者に問い合わせるステップと、
    (f−2)前記ステップ(f−1)の問い合わせに対する作業者からの操作指令に基づいて前記置換の結果を受け入れると判定されたとき、前記ステップ(d)による置換の結果を正当なものと確定するステップと
    を備える認識文字列修正方法。
  5. 前記ステップ(a)により選択される任意の文字が、連続する複数の文字から構成されるとき、前記ステップ(b)による置換は、前記連続する複数の文字を一つの所定の文字に置換する構成である請求項1ないし4のいずれかに記載の認識文字列修正方法。
  6. 前記ステップ(b)による置換は、1文字を複数の文字に置換する構成である請求項1ないし4のいずれかに記載の認識文字列修正方法。
  7. 原稿を画像情報として入力して文字の認識を行なう文字認識処理によって得られた文字列を修正する認識文字列修正装置であって、
    作業者の操作指令に基づいて、前記文字列の中から任意の文字を選択する手動修正対象文字選択手段と、
    前記選択された任意の文字を、作業者の操作指令に従う所定の文字に置換する手動修正手段と、
    前記文字列の中から、前記手動修正対象文字選択手段により選択された任意の文字と一致もしくは類似する文字を自動修正対象文字として順に選択する自動修正対象文字選択手段と、
    前記自動修正対象文字選択手段により選択された自動修正対象文字を、前記所定の文字に置換する自動修正手段と、
    前記文字列における前記自動修正手段により置換された前記所定の文字の前後についての構文を解析する構文解析手段と、
    前記構文解析手段による構文の解析の結果に基づいて、前記自動修正手段による置換の結果を正当なものと確定する修正結果確定手段と
    を備える認識文字列修正装置。
  8. 請求項7に記載の認識文字列修正装置であって、
    前記修正結果確定手段による構文の解析の結果が正しい構文でないことを示すものであるとき、前記自動修正対象文字を前記自動修正手段による置換がなされる前の状態に戻す手段
    を備える認識文字列修正装置。
  9. 請求項7または8に記載の認識文字列修正装置であって、
    前記修正結果確定手段は、
    前記置換結果確定手段による構文の解析の結果が正しい構文であることを示すものであるとき、前記自動修正手段による置換の結果を受け入れるかを、作業者に問い合わせる手段と、
    前期問い合わせに対する作業者からの操作指令に基づいて前記置換の結果を受け入れると判定されたとき、前記自動修正手段による置換の結果を正当なものと確定する手段と
    を備える認識文字列修正装置。
  10. 原稿を画像情報として入力して文字の認識を行なう文字認識処理によって得られた文字列を修正する処理を実行するコンピュータプログラムであって、
    (a)作業者の操作指令に基づいて、前記文字列の中から任意の文字を選択する機能と、
    (b)前記選択された任意の文字を、作業者の操作指令に従う所定の文字に置換する機能と、
    (c)前記文字列の中から、前記機能(a)により選択された任意の文字と一致もしくは類似する文字を自動修正対象文字として順に選択する機能と、
    (d)前記機能(c)により選択された自動修正対象文字を、前記所定の文字に置換する機能と、
    (e)前記文字列における前記機能(d)により置換された前記所定の文字の前後についての構文を解析する機能と、
    (f)前記機能(e)による構文の解析の結果に基づいて、前記機能(d)による置換の結果を正当なものと確定する機能と
    を、コンピュータに実現させるためのコンピュータプログラム。
  11. 請求項10に記載のコンピュータプログラムであって、
    (g)前記機能(f)による構文の解析の結果が正しい構文でないことを示すものであるとき、前記自動修正対象文字を前記機能(d)による置換がなされる前の状態に戻す機能
    を、コンピュータに実現させるためのコンピュータプログラム。
  12. 請求項10または11に記載のコンピュータプログラムであって、
    (h)前記機能(f)によって正当なものと確定された置換の文字を、他の文字に対して識別可能に表示する機能
    を、コンピュータに実現させるためのコンピュータプログラム。
  13. 請求項10または11に記載のコンピュータプログラムであって、
    前記機能(f)は、
    (f−1)前記機能(f)による構文の解析の結果が正しい構文であることを示すものであるとき、前記機能(d)による置換の結果を受け入れるかを、作業者に問い合わせる機能と、
    (f−2)前記機能(f−1)の問い合わせに対する作業者からの操作指令に基づいて前記置換の結果を受け入れると判定されたとき、前記機能(d)による置換の結果を正当なものと確定する機能と
    を備えるコンピュータプログラム。
  14. 前記機能(a)により選択される任意の文字が、連続する複数の文字から構成されるとき、前記機能(b)による置換は、前記連続する複数の文字を一つの所定の文字に置換する構成である請求項10ないし13のいずれかに記載のコンピュータプログラム。
  15. 前記機能(b)による置換は、1文字を複数の文字に置換する構成である請求項10ないし13のいずれかに記載のコンピュータプログラム。
  16. 請求項10ないし15のいずれかに記載のコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2002022303A 2002-01-30 2002-01-30 認識文字列修正方法およびその装置並びにコンピュータプログラム Expired - Fee Related JP4110786B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002022303A JP4110786B2 (ja) 2002-01-30 2002-01-30 認識文字列修正方法およびその装置並びにコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002022303A JP4110786B2 (ja) 2002-01-30 2002-01-30 認識文字列修正方法およびその装置並びにコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2003223608A JP2003223608A (ja) 2003-08-08
JP4110786B2 true JP4110786B2 (ja) 2008-07-02

Family

ID=27745329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002022303A Expired - Fee Related JP4110786B2 (ja) 2002-01-30 2002-01-30 認識文字列修正方法およびその装置並びにコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP4110786B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5771108B2 (ja) 2011-09-30 2015-08-26 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム
JP2021009625A (ja) * 2019-07-02 2021-01-28 コニカミノルタ株式会社 情報処理装置、文字認識方法および文字認識プログラム

Also Published As

Publication number Publication date
JP2003223608A (ja) 2003-08-08

Similar Documents

Publication Publication Date Title
US20020138250A1 (en) Translation supporting apparatus and method and translation supporting program
US6151570A (en) Translating apparatus, dictionary search apparatus, and translating method
JP3331134B2 (ja) データリンク方法及びデータリンクシステム、コンピュータシステム
CN100416591C (zh) 字符识别电子设备和字符识别方法
EP2144189A2 (en) Method for recognizing and translating characters in camera-based image
JP2001249920A (ja) 推測入力源からのテキストに対して候補を提供する方法およびシステム
RU2665274C2 (ru) Всплывающая панель верификации
JP2006343870A (ja) 文書検索装置及び方法と記憶媒体
JP4587165B2 (ja) 情報処理装置及びその制御方法
JP4110786B2 (ja) 認識文字列修正方法およびその装置並びにコンピュータプログラム
JP7176272B2 (ja) 情報処理装置およびプログラム
WO2022004097A1 (ja) 情報処理装置、情報処理方法、及びコンピュータプログラム
US7523031B1 (en) Information processing apparatus and method capable of processing plurality type of input information
JP2007052613A (ja) 翻訳装置、翻訳システムおよび翻訳方法
JP2021135584A (ja) 文字認識システムおよび方法
JP2002117024A (ja) 文章入力方法
JP4446715B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP3221968B2 (ja) 文字認識装置
CN110782899B (zh) 信息处理装置、存储介质及信息处理方法
JPWO2009038209A1 (ja) 機械翻訳システム、機械翻訳方法及び機械翻訳プログラム
JP3362036B2 (ja) 機械翻訳方法および装置
JP2004046388A (ja) 情報処理システムおよび文字修正方法
JP2006343797A (ja) 文字認識装置、文字認識方法およびコンピュータプログラム
JP3815073B2 (ja) 文字変換方法、その方法を実施するための文字変換装置および文字変換用の記録媒体
JP2007179505A (ja) 検索装置、検索システム、検索方法、検索プログラムおよび記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040917

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080331

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140418

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees