JP2005267129A - 文字画像テキスト化システム - Google Patents
文字画像テキスト化システム Download PDFInfo
- Publication number
- JP2005267129A JP2005267129A JP2004077405A JP2004077405A JP2005267129A JP 2005267129 A JP2005267129 A JP 2005267129A JP 2004077405 A JP2004077405 A JP 2004077405A JP 2004077405 A JP2004077405 A JP 2004077405A JP 2005267129 A JP2005267129 A JP 2005267129A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- text
- divided
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【課題】
キーボードによる日本語入力ができない人がインターネットを用いたメール送信や掲示板投稿のためのテキスト入力をプライバシー保護とセキュリティを確保しつつ実現する。
【解決手段】
上記課題を解決するために、文書上に記載された文字情報をデジタル画像データに変換し、該デジタル画像データから、オペレータを介して文字情報をテキスト化するシステムにおいて、一つのテキスト化対象フィールド画像を複数に分割する手段と、それぞれの分割されたフィールドの各分割画像を複数のオペレータに配信する手段と、各オペレータは配信された該分割画像を参照して、画像に含まれる文字情報に対応するテキストを入力する手段と、を備えることを特徴とする文字画像テキスト化システムを提供する。
【選択図】 図1
キーボードによる日本語入力ができない人がインターネットを用いたメール送信や掲示板投稿のためのテキスト入力をプライバシー保護とセキュリティを確保しつつ実現する。
【解決手段】
上記課題を解決するために、文書上に記載された文字情報をデジタル画像データに変換し、該デジタル画像データから、オペレータを介して文字情報をテキスト化するシステムにおいて、一つのテキスト化対象フィールド画像を複数に分割する手段と、それぞれの分割されたフィールドの各分割画像を複数のオペレータに配信する手段と、各オペレータは配信された該分割画像を参照して、画像に含まれる文字情報に対応するテキストを入力する手段と、を備えることを特徴とする文字画像テキスト化システムを提供する。
【選択図】 図1
Description
本発明は、インターネットを用いた掲示板又はメールを配信するネットワークシステムに関し、特にOCR又は人手により文字を入力してテキストにするテキスト化システムに関するものである。
インターネットの普及により、WEBサイトで掲示板サービスを提供したり、利用者同士のメール配信サービスが盛んに行われている。これらのサービスに対し、キーボードを操作できる人にとっては、物理的な制約を超えて多くの人とのコミュニケーションや情報収集を実現することが可能である。しかし、キーボードの操作が苦手な所謂デジタルデバイドの問題を抱える人にとっては、そのサービスの利用には敷居が高く、サービスがなかなか普及していないのが現状である。
一方、キーボードの操作が苦手な人のために、機械による音声認識や適当な帳票に文字を記入してOCR(Optical Character Reader、光学文字読取装置)によって文字コードに変換する入力補助が考えられる。しかし、現在の認識精度を考えると、実用的には人間の目視確認が不可欠である。この目視確認と誤認識修正をキーパンチャが行うという方法が考えられる。しかし、メールなど個人のプライバシーを優先したい内容は、例え、キーパンチャとは言え、受信者以外の他人には知られたくないものであり、利用する側にとっては抵抗感がある。
特許文献1では、振込依頼書等の記入項目に対する目視確認のセキュリティ確保という観点から、以下の方法を提示している。ファクシミリ装置で読み取られた帳票のイメージデータは、分割手段によって「口座番号」や「住所」といった複数の領域の部分イメージに分割され、修正手段によってその部分イメージの文字認識が行われて認識結果と部分イメージが表示される。操作員によって確認・修正処理が行われた部分イメージの認識結果は、統合手段によって統合されて元の帳票に対応する帳票データが生成される。
しかし、上記手法を送付メールのテキスト化に適用しようとした場合、入力対象フィールドはタイトルやメッセージとなる。タイトルとメッセージを別々のオペレータに開示したところで、メッセージの内容がオペレータに開示されてしまい、メールの送信者にとっては内容を全てオペレータに把握されることに等しいと感じる。
本発明では、特に、入力対象の文章に関するプライバシーやセキュリティを確保しつつ、オペレータの目視確認と修正が可能になる方法を提供することを目的としている。
また、掲示板投稿やメール送信には一般にテキストである文字コードが使用される。しかし、活字フォントではあじけないとか、人の手書きの温かみが伝わらないなどの問題点があり、手紙と同様に手書き文字をそのまま掲示、あるいは、送信したいというニーズに応えるシステムを提供することを目的とする。
上記課題の少なくとも一部又は全部を解決するため、本発明は、文書上に記載された文字情報のうち、一つのフィールド画像データを分割し、異なる複数のオペレータ端末に配信する手段を有する。また、分割に当たって、それぞれの一部を重複させる手段を有する。また文字に電話番号等が含まれているとき、その一部を入れ換える手段を有する。またオペレータ端末にて確認又は修正されたテキストデータの不一致判定、統合手段を有する。
本発明によれば、キーボードによる日本語入力が困難な人であっても、インターネットを利用したメール送信や掲示板投稿が可能になる。一方、同時にオペレータによる目視確認の際にメール本文の画像とテキストを複数に分割してそれぞれを別々のオペレータに配信することにより、入力ミスの低減とメール本文の内容に関するプライバシー保護とセキュリティ確保というニーズを実現することが可能になる。
また、メール送信者は縦書きに書いた帳票を、目視確認するオペレータは横書きで見るという具合に、それぞれの好みに応じてタイトルやメッセージのテキストに関して縦書きと横書きを選択することが可能になる。
また、手書き手紙の感覚と同じように本人自筆の温かみを残したまま、メール送信や掲示板投稿が可能になる。もちろん、プライバシー保護とセキュリティ確保を実現することが可能になる。
以下、本発明のテキスト化システム及びその方法について説明する。
本発明の第1の実施形態を図1から図17を用いて説明する。
図1は、本実施形態に係るシステム全体の概略を示す構成図である。複数の各家庭101(図では一家庭)では、メール送信又は掲示板に掲載するためのテキスト入力用の帳票102を送信するFAX装置103、テキスト入力された結果やメールなどのインターネット情報を見る端末104がネットワーク105で接続されており、それらが、広域ネットワーク106を介してプロバイダセンタ107につながっている。家庭の操作者はテキスト入力用の帳票102に記入内容を書き込んだ後、FAX装置103にてその帳票を読み取り、その読み取った帳票画像データをセンタ107に送信する。
図1は、本実施形態に係るシステム全体の概略を示す構成図である。複数の各家庭101(図では一家庭)では、メール送信又は掲示板に掲載するためのテキスト入力用の帳票102を送信するFAX装置103、テキスト入力された結果やメールなどのインターネット情報を見る端末104がネットワーク105で接続されており、それらが、広域ネットワーク106を介してプロバイダセンタ107につながっている。家庭の操作者はテキスト入力用の帳票102に記入内容を書き込んだ後、FAX装置103にてその帳票を読み取り、その読み取った帳票画像データをセンタ107に送信する。
センタ107はメール配信や掲示板サービスを行うWEBサーバ108、各家庭から送付された帳票画像(画像データ)を格納して、帳票画像をOCRで文字認識し、その結果を格納する画像/文字認識サーバ(単に認識サーバとも言う)109、文字認識結果の目視確認と修正を行う確認・修正端末群110、この装置110で確認した結果を再検証する再確認・修正端末111がLAN112を介して接続されている。なお、確認・修正端末110、再確認・修正端末111はオペレータが操作する端末であることからオペレータ端末とも言い、CPU、メモリ、ディスク、表示部、入力部等を備えている。
図2は画像/文字認識サーバ109の構成を説明する図である。各部を統合して制御する中央演算装置201、FAX画像やOCRの文字認識結果等を送受信するための通信制御部202、メモリ203、FAX画像やOCRの文字認識結果等を格納する画像・認識結果データベース208がバス209を介して相互に接続されている。メモリ203には各家庭から送付された帳票画像を読み取り、その帳票の種類を識別する帳票識別モジュール204、帳票の読取対象フィールドの文字を認識して文字コードに変換したり、1文字ごとに文字画像を切出す文字認識モジュール205、オペレータによる目視確認用に文字認識した結果と帳票画像を分割する認識結果・画像分割モジュール206、認識結果・画像分割モジュール206の出力をオペレータに配信した後、目視確認と修正結果を統合する確認修正結果統合モジュール207からなる。文字認識モジュール205には、文字形状を識別して文字コードに変換するための文字識別辞書や、文字形状の識別結果を表記ルールや地名データベースを用いて修正するための知識処理辞書が含まれる。これら各モジュールはソフトウェア上のプログラムに相当し、各機能別に分けているが1つのプログラムで構成しても良い。またこれら各モジュールは中央演算装置201を構成するCPUのハードによってその機能が処理、制御されることは言うまでもない。勿論、プログラムをハードにて構成することも可能であり、これらを包含するものとして、モジュール、制御部又は単に手段と言う。
図3を中心に用いて、メールを送信する場合における装置やシステムの動作を説明する。細枠で囲われた処理は図1の各家庭101において、太枠で囲われた処理はプロバイダセンタ107においてそれぞれ処理されることを示す。
任意の家庭101にいる操作者はメール送信用帳票102に手書きで文字を記入する(ステップ301)。この記入されたメール送信用帳票の例を図8に示す。801は帳票の種類を判別するための識別番号であり、例えば「12021」は「メール送信用帳票」、「12022」は「掲示板投稿用帳票」等、帳票の種類と一対一に対応付けられた番号を示し、センタ107にて認識される。802から805はメッセージに含まれる本人情報に関わる記述を示すチェックマークであり、例えば、802の「メールアドレス有」にチェックがあれば、メッセージ中にメールアドレスが含まれていることを示す。登録番号806はメール送信者の登録番号であり、サービスプロバイダがメール送信者を管理するための管理番号である。登録者名807はメール送信者のペンネームを示す。シート番号808は、メッセージが長くなり複数の帳票に分けて書く場合のシート番号を示し、図では1枚のシートであることを示す。809は送信したいメールのタイトルであり、810は送信したいメールのメッセージ(本文)である。
任意の家庭101にいる操作者はメール送信用帳票102に手書きで文字を記入する(ステップ301)。この記入されたメール送信用帳票の例を図8に示す。801は帳票の種類を判別するための識別番号であり、例えば「12021」は「メール送信用帳票」、「12022」は「掲示板投稿用帳票」等、帳票の種類と一対一に対応付けられた番号を示し、センタ107にて認識される。802から805はメッセージに含まれる本人情報に関わる記述を示すチェックマークであり、例えば、802の「メールアドレス有」にチェックがあれば、メッセージ中にメールアドレスが含まれていることを示す。登録番号806はメール送信者の登録番号であり、サービスプロバイダがメール送信者を管理するための管理番号である。登録者名807はメール送信者のペンネームを示す。シート番号808は、メッセージが長くなり複数の帳票に分けて書く場合のシート番号を示し、図では1枚のシートであることを示す。809は送信したいメールのタイトルであり、810は送信したいメールのメッセージ(本文)である。
ステップ302では、FAX装置103を用いてステップ301で記入した帳票(図8)を読み取らせ、装置103はその読み取った帳票を帳票画像データに変換してプロバイダセンタ107に送信する。プロバイダセンタ107はFAX装置103より送信される画像データを、通信制御部202を介して受信し、画像/文字認識サーバ109にこの帳票画像を格納する。そして、プロバイダセンタ107の画像/文字認識サーバ109において、各家庭から送信された帳票画像に対してOCRとオペレータによる目視確認と修正によりタイトルやメッセージをテキスト化する(ステップ303)。図2、図4を用いてステップ303の詳細処理を説明する。
上述した家庭101のFAX装置103より送信された画像データは画像/文字認識サーバ109の画像・認識DB208に記憶され、その帳票画像をこの画像・認識結果DB208から読み出す(ステップ401)。そしてこの読み出した帳票画像に対してOCR処理(ステップ402)を行うが、その詳細処理について図5,8を用いて説明する。なお、上述したように各処理は中央演算装置201のCPU等から処理、制御される。
ステップ501では、メモリ203の帳票識別モジュール204を用いて、読み出した帳票画像を読み出す、具体的には、図8の帳票識別番号801を読み取り、帳票画像の種類を識別する。また帳票上に含まれる符号802から805のチェックマークを認識してメールのメッセージ810中にそれぞれの本人特定情報が含まれるかの情報を抽出する(ステップ502)。続いて、符合806から810のそれぞれのフィールド(フィールド画像データとも言う)に対して、帳票の記入文字枠のレイアウト情報を基に1文字毎に文字画像を切り出すと共にその座標情報を格納する(ステップ503)。
ステップ503で切り出された文字に対して、文字の種類又は文字コードを特定するために、文字の形状を格納した文字識別辞書506を参照しながら文字識別処理を行う(ステップ504)。また切り出された文字画像のうち電話番号等に対しては、電話番号やメールアドレスの表記ルール又は全国に存在する住所データベースの情報を格納した知識処理辞書507を参照しながら、ステップ504で出力された文字識別処理結果がより尤もらしい文字列になるように文字識別処理結果の修正を行う(ステップ505)。
以上ステップ501から507の処理によりステップ402の帳票画像に対するOCR処理が実行され、1文字毎に切り出した文字枠の座標情報、文字認識されたテキストを含む認識結果テーブルが得られる。認識結果テーブルの例を図27に示す。
本テーブルは図8の帳票に記載されたメッセージ810の一部の画像データと、それに対するテキストデータとを記憶、管理するために必要であり、一文字分、すなわち、メッセージ810を切り分ける(罫線)枠単位でその結果を記憶する。図27の認識結果テーブルの符号2701は1文字枠を切り出した画像データを示し、符号2702から2705はそれぞれ1文字枠の左上X座標,左上Y座標,右下X座標,右下Y座標を示し、符号2706は文字認識結果のテキストデータ(テキストコードとも言う)を示す。ここのX座標、Y座標は或る原点を基準とした座標値を示し、例えば、メッセージ810内の「会」に着目すると、その左上X座標’203’、左上Y座標’59’、右下X座標’249’、右下Y座標’99’という値を示している。
以上のOCR処理(ステップ402)した帳票の識別結果を用いて、帳票はメール送信用か、掲示板用かを判断する(ステップ403)。この判断から送付帳票がメール送信用であればステップ404へ、掲示板用であればステップ405に分岐させる。図8の帳票例にもあるように、帳票種としては「メール送信帳票」を示しているので、ここではステップ404に進む。このステップ404では、図1の確認・修正端末群110を用いて、メール用認識結果の目視確認・修正処理を行う。
図6を用いてステップ404の詳細を説明する。図6において太枠はオペレータによる処理、細枠は画像/文字認識サーバによる処理を示している。
最初に確認・修正端末群110、すなわちオペレータ端末に図8の帳票のタイトル809、メッセージ810の目視確認修正用の画像データと、ステップ402(詳細は図5)にてOCR認識処理をした結果(図27のテキストデータ2706参照)を配信する。このとき、単に画像、テキストデータを配信するのではなく、帳票画像における画像データと、そのOCR認識結果の分割・切出し処理を行う(ステップ601)。つまり、特に図8のメッセージ810に含まれる画像データ、およびそのテキストデータはプライベート的な要素であり、一台のオペレータ端末に配信され、その内容が表示されると、一人のオペレータにその内容が把握されてしまい好ましくない。そこでこのようなメッセージ810(一つの閉じた意味を持たせることが可能な最小単位のデータ、連続したキャラクタデータ、又は1文字単位の枠ではなく、メッセージ枠に囲まれたデータとも言う)のフィールドを予め決められた分割処理にて分割し、複数のオペレータ端末に配信する。
最初に確認・修正端末群110、すなわちオペレータ端末に図8の帳票のタイトル809、メッセージ810の目視確認修正用の画像データと、ステップ402(詳細は図5)にてOCR認識処理をした結果(図27のテキストデータ2706参照)を配信する。このとき、単に画像、テキストデータを配信するのではなく、帳票画像における画像データと、そのOCR認識結果の分割・切出し処理を行う(ステップ601)。つまり、特に図8のメッセージ810に含まれる画像データ、およびそのテキストデータはプライベート的な要素であり、一台のオペレータ端末に配信され、その内容が表示されると、一人のオペレータにその内容が把握されてしまい好ましくない。そこでこのようなメッセージ810(一つの閉じた意味を持たせることが可能な最小単位のデータ、連続したキャラクタデータ、又は1文字単位の枠ではなく、メッセージ枠に囲まれたデータとも言う)のフィールドを予め決められた分割処理にて分割し、複数のオペレータ端末に配信する。
図9を用いて画像データとOCR認識結果の分割処理(手段)、方法を説明する。図9は各オペレータA〜Dに配信される目視確認・修正用の画像とOCR認識結果のテキストを示す。原理を説明するために、図ではメッセージ810の画像とOCR結果を仮想的に1行に並べた上で、それぞれに配信する画像の位置を揃えて示している。もちろん、オペレータ端末も4台あることを想定している。
本例では目視確認・修正対象が5文字、あるいは、10文字である場合を示す。オペレータAには、メッセージの文字行画像901と対応するOCR結果902が配信され、同様にオペレータBには、文字行画像903とOCR結果904がという具合である。図に示すように、各オペレータには文章の一部を他のオペレータに配信する分とずらして配信され、一人のオペレータが文書全体を把握することができないようになっている。このように、メッセージ810に含まれる画像データ及びそのOCR認識結果(テキストデータ)を分割処理するとき、或る部分で完全に分割するのではなく、第1の画像・認識結果と第2の画像・認識結果とが重複した状態で(完全重複ではなく一部重複)、分割処理するのも特徴の一つである。これを重複分割処理(手段)とも言う。
また、図9の文字行画像の網掛け部分、例えばオペレータCの’会’’場’’不’’明’の4画像データは、目視確認・修正対象ではない。しかし、オペレータが確認・修正し易いように前後の一部の文字をオペレータ端末にて表示するために配信される画像部分である。これは、文脈に依存して文章に含まれる各文字の種類が決定される性質を考慮している。例えば、OCR認識結果として大文字英字の”O”と句点”。”が出てきた時に、その前に「です」という文字があれば句点の方が正しいことが分り、オペレータは判断し易い。このように、各オペレータ端末に配信される分割画像、認識結果の関係として、認識結果より分割画像データを広く、多く表示する点も特徴がある。つまり、分割テキストデータ以上の分割画像データを表示し、更に、確認部分とそうでない部分とに分けて表示している。
上述したように、オペレータによる目視確認・修正のミスを防ぐため、本例では各オペレータに目視確認対象画像とテキストが一部重複して配信されている(重複分割処理)。これにより、各オペレータから回収したテキストを互いにマッチングさせて一致しているかどうかを判定し、不一致の場合は再度別のオペレータによって確認・修正してオペレータによる修正ミスを防ぐことができる。
この図9の説明は図8のメッセージ810に含まれる一般的な文章における分割処理についてであるが、同メッセージ中には電話番号や住所、氏名、メールアドレスといった、本人を特定するための手掛かりになる情報も含まれており、特にセキュリティに注意して扱う必要がある。そのため、これらの情報はオペレータに分からないようにしたい。一方、電話番号などを含むこれらの情報は、画像を任意の位置で分割されると目視確認や修正がやりづらく、全体が見られた方が処理し易い。この相矛盾する要求を満たす方法を、図10を用いて電話番号を例に画像とOCR認識結果を複数のオペレータ端末に配信する方法について説明する。
今、図5のステップ505の知識処理において、電話番号の表記ルールが格納された知識処理辞書507と文字識別結果をマッチングさせるため、電話番号が記載されている場所を特定できる。また図8の帳票においてメールアドレス有りのチェックマーク802が付いている場合は、それを補助情報としてOCR結果があいまいな場合でも、より積極的にメール記載部分を抽出できる。図10の電話番号部分の画像1001と対応するテキスト1002が元のOCR結果として得られる。そして、オペレータA(第1オペレータ端末)に対しては矢印で示した”34”と”◇○”部分の画像とテキストを入れ換えたデータを、オペレータB(第2オペレータ端末)には”12”と”◇○”部分の画像とテキストを入れ換えたデータをそれぞれ配信する。入れ換える部分はシステムが適当に設定し、オペレータはどの部分が入れ換えられたかは分からないため、配信された電話番号を見てもメール送信者の書いた番号を特定することはできない。これを入換処理とも言う。
一方、システム側(サーバ)は電話番号の桁のどこを入れ換えたかを把握しているので、それぞれのオペレータ端末から回収した確認・修正結果のテキストをマッチングさせて一致するかどうかを調べることにより、電話番号の修正ミスを防ぐことができる。不一致の場合は、上述したように再度別の確認修正端末111のオペレータによって確認・修正を行う。電話番号のように1文字の間違いが致命的になるような文字列に対しては、複数オペレータの処理結果の比較は重要である。このように、任意の文字を入れ換えることによりセキュリティを確保しつつ、オペレータの修正ミスを防ぐことができる。
以上、画像及び認識データの分割処理について詳述したが、次に、図6のステップ602では、ステップ601で生成したオペレータ配信用画像とOCR結果のテキストを各オペレータ端末に配信する。各オペレータ端末は配信された画像とOCRテキストをその表示部に表示し、オペレータはその表示データ見比べて確認し、また必要に応じて入力部によりテキストを修正する(ステップ603)。図11にオペレータの修正画面の例を示す。1101と1102は、それぞれ図9で説明した分割された文字行画像とOCRテキストを示す。オペレータは文字行画像1101とOCRテキスト1102を見比べて、必要に応じて1102の文字コードを修正する。図の例では句点が大文字英字の“O”と誤認識しているので、この部分を句点に修正する必要がある。一通り確認・修正が終われば、完了・送信ボタン1103を押して結果を画像/文字認識サーバ109に返送する。
画像/文字認識サーバ109は各オペレータ端末より送信されるデータ(画像、修正データ含む)、即ち確認修正結果を受信し(ステップ604)、各オペレータ端末に重複して配信された目視確認修正結果を統合して全体のテキストを生成する。そしてオペレータ端末から回収したテキストで不一致部分を抽出する(ステップ605)。このステップ605における統合処理、不一致抽出処理において、不一致テキストがあるかどうかを判定し(ステップ606)、あればステップ607に処理を移行し、なければ処理を終了する。
ステップ607では、不一致データを含む分割画像とOCRテキストを再確認・修正端末群111を操作するオペレータに再度配信する。本端末を修正オペレータ端末ともいう。そしてこの修正オペレータ端末は受信した分割画像データとテキストデータとを表示部に表示し、一方オペレータはステップ603と同様に再度OCRテキストの目視確認と修正を行う(ステップ608)。続いて、修正オペレータ端末はその修正されたデータをサーバに送信し、画像/文字認識サーバ109がその確認修正結果(データ)を受信する(ステップ609)。そして、このステップ609で受信したOCRテキストの目視確認結果を再統合し、ステップ605で検出した不一致部分を修正して最終的な全体のタイトルあるいはメッセージを生成する(ステップ610)。この再統合処理は、例えば最初に目視確認した結果と今回の確認結果との多数決を用いる、または今回の確認結果を優先するなど、適切な方法により実行するのが望ましい。
以上のステップ601から610の処理により、ステップ404のメール用帳票に対するOCRテキストの目視確認・修正が行われ、ステップ401から404の処理によりステップ303のメール送信用帳票に対するテキスト化処理が完了する。
続いて、ステップ304では、テキスト化した図8の「メール送信帳票」のデータを図1のWEB/メールサーバ108にアップロードする。それと共に、メールやFAX等の通信手段を用いて、各家庭101の帳票送信者の端末104に対してテキスト化してアップロードが完了したことを通知する。通知を受けた送信者は、端末104等を使用してWEB/メールサーバ108にログインして、自分が意図したテキストになっているかを確認し、修正が必要な場合は修正箇所をマークしてプロバイダに通知する(ステップ305)。
図12に確認・修正箇所をマークする画面の一例を示す。この画面は家庭101の端末104に表示される。登録番号1201、登録者1202は、それぞれ図8の806、807に該当するテキストである。「メッセージ参照」ボタン1203は、例えば掲示板に投稿された記事に返信する場合や受信したメールに返信する場合のオリジナルの記事やメールを参照するためのボタン(入力部、以下同じ)である。タイトル1204、メッセージ1205は、それぞれ図8の809、810をテキスト化したデータを示す。本図にあるように、図8の帳票の画像に対応している。1206は画面に表示されたメールを送信するためのボタンであり、1207はメッセージなどを修正したい場合、修正箇所をマークするためのボタンである。1210は修正マークを示した例であり、ボタン1207を押して、マウスで修正したい箇所をなぞると1210のように修正したい箇所がマーク付けされる。1208は修正マークを付けたテキストの修正をプロバイダに依頼するボタンである。1209は処理を終了するための終了ボタンである。
この図12の画面に表示された内容で図12の送信ボタン1206を押すと、そのテキストデータ化された内容にてメールを送信する(ステップ306)。このように、ステップ301から306の処理により、利用者は帳票の画像を送信し、それをサーバ側にてOCR認識処理、修正処理などにてテキスト化し、そのテキスト化された顧客を確認することで、利用者が最初に書いた手書き帳票によるメール送信が可能になる。
次に、図3を用いて掲示板に記事を投稿する場合における装置やシステムの動作を説明する。なお、上述したメール送信帳票と同様な処理については適宜省略する。
家庭にいる操作者はWEB掲示板投稿用帳票に手書きで文字を記入する(ステップ301)。記入されたメール送信用帳票の例を図13に示す。1301は掲示板投稿用帳票であることを識別するための識別番号である。1302は投稿する掲示板の種類を示す掲示板番号である。1303は掲示版番号に対応する掲示板の名称であり、掲示板番号の入力間違いを防ぐために記入する。シート番号1304は、メッセージが長くなり複数の帳票に分けて書く場合のシート番号を示す。1305、1306それぞれは投稿したい記事のタイトルとメッセージである。
家庭にいる操作者はWEB掲示板投稿用帳票に手書きで文字を記入する(ステップ301)。記入されたメール送信用帳票の例を図13に示す。1301は掲示板投稿用帳票であることを識別するための識別番号である。1302は投稿する掲示板の種類を示す掲示板番号である。1303は掲示版番号に対応する掲示板の名称であり、掲示板番号の入力間違いを防ぐために記入する。シート番号1304は、メッセージが長くなり複数の帳票に分けて書く場合のシート番号を示す。1305、1306それぞれは投稿したい記事のタイトルとメッセージである。
続いて、FAX装置103を用いてステップ301で記入した帳票画像をプロバイダセンタ107に送信し(ステップ302)、帳票画像は画像/文字認識サーバ109に格納される。プロバイダセンタ107の画像/文字認識サーバ109において、各家庭から送信された帳票画像に対してOCRとオペレータによる目視確認と修正によりテキスト化する(ステップ303)。このステップ303の詳細処理は上述と略同様で図4に示され、帳票画像をテキスト化する。特に、ステップ403では帳票識別で得られた帳票識別番号により帳票がメール送信用か掲示板投稿用かを判別するが、図13のとおり、帳票は「掲示板送信帳票」であり、その種類は1301により識別されるのでステップ405に進む。
ステップ405では、確認・修正端末群110を用いて、掲示板投稿用認識結果の目視確認・修正処理を行う。この詳細処理は図7に示すが、図6の各処理と比較しても明らかなように、帳票画像データ・認識結果の分割処理(ステップ601)が省略されている。掲示板投稿の場合、投稿時には不特定多数のアクセス者に参照されるので、上述のメール送信と異なりタイトルやメッセージのプライバシーをオペレータから保護する必要性が低い。そのため、図6のステップ601のようにプライバシーとセキュリティ保護のための画像とOCR認識結果の分割配信は必要ないので、図7ではそれに該当する処理がない。
配信用画像データと、OCR結果のテキストデータを各オペレータに配信する(ステップ701)。メール送信時と異なりタイトルやメッセージを分割する必要が無いので、各オペレータには分割せずに全体を配信する。各オペレータは配信された画像とOCRテキストを見比べて、必要に応じてテキストを修正する(ステップ702)。図14にオペレータ端末に表示される修正画面の一例を示す。メッセージ画像1401とOCRテキスト1402を見比べて、必要に応じて1402の文字コードを修正する。一通り確認・修正が終われば、完了・送信ボタン1403を押して結果を画像/文字認識サーバ109に返送する。そして、画像/文字認識サーバ109は、各オペレータの確認修正結果を受信し(ステップ703)、各オペレータに重複して配信された目視確認修正結果を統合して(ステップ704)、全体のタイトルあるいはメッセージを生成すると共に、重複配信部分で不一致テキストがあるかどうかを判定する(ステップ705)。不一致が無ければ処理は終了し、あればステップ706に処理を移行し、不一致データを含む分割画像とOCRテキストを再確認・修正端末群111を操作するオペレータに再度配信する。続いて、オペレータはステップ702と同様に再度OCRテキストの目視確認と修正を行い(ステップ707)、各オペレータの確認修正結果を画像/文字認識サーバ109が受信する(ステップ708)。受信したOCRテキストの目視確認結果を再統合し(ステップ709)、ステップ704で検出した不一致部分を修正して最終的な全体のタイトルあるいはメッセージを生成する。このステップ701から709の処理により、ステップ404の掲示板投稿用帳票に対するOCRテキストの目視確認・修正が行われ、ステップ401から404の処理により掲示板投稿用帳票に対するテキスト化303の処理が完了する。
ステップ304では、テキスト化したメールのデータをWEB/メールサーバ108にアップロードする。それと共に、メールやFAX等の通信手段を用いて、各家庭101の帳票送信者に対してテキスト化してアップロードが完了したことを通知する。ステップ305では、通知を受けた送信者がWEB/メールサーバ108にログインして、自分が意図したテキストになっているかを確認し、修正が必要な場合は修正箇所をマークしてプロバイダに通知する。図15に確認・修正箇所をマークする画面の例を示す。勿論、利用者の端末104に表示される。掲示番号1501、掲示板名1502は、それぞれ図13の1302、1303に該当するテキストである。「掲示板参照」ボタン1503は、例えば掲示板に直接投稿したり、投稿された記事に返信投稿する場合の元の記事を参照するためのボタンである。タイトル1504、メッセージ1505は、それぞれ図13の1305、1306をテキスト化したデータを示す。1506は画面に表示された記事を投稿するためのボタンであり、1507はメッセージなどを修正したい場合、修正箇所をマークするためのボタンである。1508は修正マークを付けたテキストの修正をプロバイダに依頼するボタンである。1509は処理を終了するための終了ボタンである。
ステップ306では、画面に表示された内容で図15の送信ボタン1506を押して記事を投稿する。掲示板に投稿された記事の一覧を表示した例を図16に示す。1601は掲示板の名称を示し、図15の1502に相当する。1602は投稿された記事のデータを示す各コラムの内容を表示している。1603から1604は投稿された記事の一覧データを示しており、特に符号1603の内容は図15の記事に該当するデータを示している。1603をクリックすると図17に示すような投稿記事の内容が表示される。1701は掲示板の名称を示し、図15の1502に相当する。1702は投稿した記事の内容である。1703は投稿された記事に対する返信投稿するためのボタンであり、1704、1705はそれぞれ現在参照している記事の前、あるいは、後の投稿記事を参照するためのボタンである。以上のステップ301から306の処理により手書き帳票による掲示板への記事投稿が可能になる。
次に、この掲示板投稿の例を用いて縦書き帳票を用いた実施例を説明する。手書き帳票を用いて投稿する場合、人によっては縦書きの方が書きやすいという投稿者も存在する。一方、コンピュータの操作になれたオペレータにとっては縦書きよりも横書きの方が作業しやすいことが多い。これを両立するためには、送信帳票は縦書きであるが、オペレータの目視確認と修正時には横書きに変換されている必要がある。本実施例を図3、図5、図7、図14、図18を用いて説明する。
前述した掲示板投稿処理の場合と大きく異なるのは、(1)図3のステップ301で記入する帳票のレイアウト、(2)ステップ303のOCRによる文字認識時の文字の切り出し処理又は方法、(3)オペレータに配信する画像とテキストの生成処理又は方法である。以下では上記3つの異なる部分のみを説明する。
縦書きの場合の帳票レイアウト例を図18に示す。1801は掲示板投稿用の縦書き帳票であることを識別するための識別番号である。1802、1803、1804はそれぞれ図13の横書き帳票にもある1302、1303、1304と同様に、掲示板番号、掲示板名称、シート番号を示す。1805、1806はそれぞれ投稿したい記事のタイトルとメッセージであり図示するように縦書きになっている。
図3のステップ303の詳細を説明した図4のステップ402、さらにステップ402の詳細を説明した図5のステップ503において縦書き文字に対するOCRによる文字認識時の文字切り出し処理が実行される。ステップ501における帳票識別により縦書きの帳票であることを判断し、その情報に基づいて一マスごとに書かれた文字画像を縦方向に切り出す。
オペレータに配信する画像とテキストの生成は、図7のステップ701で実行される。1文字ごとに切り出された文字画像と対応するテキストを横方向に並べ替える処理を実行し、各オペレータに配信する。これにより横書き帳票の場合と同様に図14のような横書き画像が端末に表示される。よって、オペレータは縦書きを意識することなく目視確認と修正を行うことができる。以上のような修正を加える事で、掲示板投稿者は縦書きに文字を書き、オペレータは横書きに表示で目視確認ができ、両者のニーズを満足することが可能になる。
次に、帳票に記載された文字を1文字ごとに切り出して文字画像として配信する他の実施例を図1、図2、図8、図19から図25を用いて説明する。本実施例においては、利用者の記入した帳票画像をメール又は掲示板にて使用する場合でも、それをテキスト表示するのではなく、記入した画像を生かした状態で帳票画像を編集処理し、画像としてメール送信又は掲示板掲載を行うことを特徴とする。なお、メール送信の場合を例に説明するが掲示板投稿にも適用できることは言うまでもない。各家庭101から送信された帳票は図8(又は図13,18)に示されるようなテキストに変換する帳票レイアウトと同じレイアウトを使用可能である。
図19を用いて、メールを送信する場合における装置やシステムの動作を説明する。細枠で囲われた処理は図1の各家庭101において、太枠で囲われた処理はプロバイダセンタ107においてそれぞれ処理されることを示す。ステップ1901、ステップ1902では上述のステップ301、302と同様に家庭にいる操作者がメール送信用帳票(図8参照)に手書きで文字を記入して、FAX装置103を用いてプロバイダセンタ107に送信する。プロバイダセンタ107の画像/文字認識サーバ109において、各家庭から送信された帳票画像に対して文字画像切出処理やOCR認識処理等を実行し、更に、オペレータによる目視確認と修正によりタイトルとメッセージの文字画像を1文字ずつ切り出してインデックス付けする。また、OCR処理により、切り出された各文字画像に文字コードと文字コードを参照して得られるレイアウト上の禁則処理コードを付与する(ステップ1903)。このステップ1903に関して図20を用いて詳細処理を説明する。
図2の画像・認識結果DB208から受信した帳票画像を読み出す(ステップ2001)。そして読み出した帳票画像に対して次の画像処理を行う(ステップ2002)。第1に、読み出した帳票画像に対して文字画像切出処理を実行する。図8のメッセージ810のフィールドはそれ自体で1つの画像であり、これを1文字毎に切り分ける処理である。第2に、1文字毎に切り出された画像に対してインデックス付けを行うインデックス付加処理を実行する。インデックスは文字枠の座標情報を基に1文字毎に画像を切り出し、文章を構成する文字が並ぶ順番にインデックスを画像に付与する。第3に、各切り出された文字画像に対するOCR処理により文字コードを付与する。上述で説明したテキスト化処理に該当するものである。第4に、文字コードを参照して、文章のレイアウト上の禁則処理に関するコードを付与する。この禁則処理に関するコードとは、例えば句読点等文字行の先頭に現れるのが適切でない文字コードに対して、文末に来るようにその文字コードに対応する文字画像のレイアウトを調整するためのコードである。本実施例では句読点に対して「R」のコードを付与している。これら第1〜4画像処理の各画像処理(ステップ2002)で出力されるテーブルを図21に示す。図21において、2101は切り出した文字画像に対応するインデックステーブルを表し、2102は1文字毎に切り出された文字画像を示す。2103は文字画像に対応する文字コード、2104は禁則処理コードである。
ここで、第2画像処理のインデックス処理を説明する。プロバイダ107側にて受信する例えばメッセージ810(図8参照)はそれ自体では一塊の画像データである。これを第1画像処理にて各文字単位で切り出すが、その際、何の処理も施さないと復元時に画像の順番が入れ換えられる等して、本来の文章の意味をなさなくなってしまう。また利用者に画像処理後の編集された画像を送信する際、後述する文章区切れでの「改行」、個々の文字画像の「縮小又は拡大」にも対応するために、本インデックス付加処理が有効である。
第3画像処理のOCR処理(又は認識処理、文字コード付加処理、テキスト化処理)について説明する。上述したとおり、本実施例では利用者が記載した文字画像通りのものを利用者に送信し、メール送信又は掲示板掲載においても、その画像(認識後のテキストではなく)を使用する。しかし、図8のメッセージ810には通常の平仮名、漢字以外にも、電話番号、メールアドレス等のような文字画像も含まれる。そこでこのような文字画像(平仮名等と区別するため特殊文字と表現する)においては、この特殊文字の前の文章から改行された方が、一層この特殊文字を際立たせることができる。これにより利用者から第3者へのメール送信又は掲示板掲載において、その特殊文字が重要であることを伝えることができる。例えば、図8のように原文字画像が「メールアドレ(改行)スxx_yy@…」となっているとき、アドレスの部分を図5のステップ504等にて特別に認識することで、後述の図24のように「メールアドレス(改行)xx_yy@…」との適切な画像表示をすることである。またアドレス部分のみ(英数字)の画像を拡大したり等の後処理も可能となる。
第4画像処理の禁則処理を説明する。上述したように、句読点等、文字行の先頭にこないようにする処理であり、例えば、図8の原文字画像は「…公民館です(改行)。ご不明な場合は…」となっており、「。」が2行目の先頭行にある。この「。」を禁則処理して図24のように「…公民館です。(改行)ご不明な場合は…」と適切な処理を施すことができる。
第3画像処理のOCR処理(又は認識処理、文字コード付加処理、テキスト化処理)について説明する。上述したとおり、本実施例では利用者が記載した文字画像通りのものを利用者に送信し、メール送信又は掲示板掲載においても、その画像(認識後のテキストではなく)を使用する。しかし、図8のメッセージ810には通常の平仮名、漢字以外にも、電話番号、メールアドレス等のような文字画像も含まれる。そこでこのような文字画像(平仮名等と区別するため特殊文字と表現する)においては、この特殊文字の前の文章から改行された方が、一層この特殊文字を際立たせることができる。これにより利用者から第3者へのメール送信又は掲示板掲載において、その特殊文字が重要であることを伝えることができる。例えば、図8のように原文字画像が「メールアドレ(改行)スxx_yy@…」となっているとき、アドレスの部分を図5のステップ504等にて特別に認識することで、後述の図24のように「メールアドレス(改行)xx_yy@…」との適切な画像表示をすることである。またアドレス部分のみ(英数字)の画像を拡大したり等の後処理も可能となる。
第4画像処理の禁則処理を説明する。上述したように、句読点等、文字行の先頭にこないようにする処理であり、例えば、図8の原文字画像は「…公民館です(改行)。ご不明な場合は…」となっており、「。」が2行目の先頭行にある。この「。」を禁則処理して図24のように「…公民館です。(改行)ご不明な場合は…」と適切な処理を施すことができる。
以上のように、種々の画像処理を行い、ステップ2003では、OCR処理した帳票の帳票種識別結果を用いて、送付帳票がメール送信用であればステップ2004へ、掲示板用であればステップ2005に分岐させるための判別処理を行う。今の場合はメール送信帳票を前提としているので、ステップ2004に進む。このステップ2004では、確認・修正端末群110を用いて、メール用文字画像切り出し結果の目視確認・修正処理を行う。図22を用いてステップ2004の詳細を説明する。図において太枠はオペレータによる処理、細枠は画像/文字認識サーバ109による処理を示している。OCR結果のテキスト修正の場合と異なり、オペレータ修正における文字画像の1画素2画素の違いは人間の見た目には大きな影響を与えない。よって、図6の場合と異なり、複数のオペレータ修正結果の不一致判定とその結果に基づく処理は削除されている。
ステップ2201では、確認・修正端末群110に対して、図8のメールタイトル809とメッセージ810の目視確認修正用の参照画像(原帳票画像)と、1文字毎の文字画像切出結果(上記画像処理後の編集帳票画像)を配信するために、上述と同様に帳票画像における画像データ・文字画像切出結果の分割・切出し処理を行う。そして、生成したオペレータ配信用画像を各オペレータに配信する(ステップ2202)。
各オペレータは端末110に配信された帳票の参照用画像と1文字毎に切り出された文字画像を見比べて、必要に応じて文字画像を修正する。図23にオペレータの修正画面の例を示す。2301と2302は、それぞれ分割された参照用文字行画像と1文字毎に切り出された文字画像を示す。オペレータは参照用文字行画像2301と切り出された文字画像2302を見比べて、必要に応じて2302の文字画像を修正する。一通り確認・修正が終われば、完了・送信ボタン2303を押して結果を画像/文字認識サーバ109に返送する。この修正の必要性として、文字パターンが文字枠に接触して文字画像として正しく切り出せない場合があるためである。さらに図23には図示していないが、図21のOCR認識結果2103を同一画面に表示してオペレータが修正するのが望ましい。この修正の必要性としては、原画像には句読点などとして「。」が記載されていたものを、OCR認識処理にて「0」(ゼロ)と認識してしまう場合があるためである。(ゼロ)と認識されると句点として解釈されないため、文頭にこないようなレイアウトの禁則処理を正しく実行できない。これを回避するため、オペレータによる文字コードの修正作業が必要になる。
続いて、各オペレータの確認修正結果を画像/文字認識サーバ109が受信し(ステップ2204)、各オペレータから配信された目視確認修正結果を統合して全体のタイトルあるいはメッセージを生成する(ステップ2205)。さらに,図21におけるテーブル2104の禁則コードを修正された文字コードに合わせて再度付与し直す(ステップ2206)。これらステップ2201から2206の処理により、ステップ2204のメール用帳票に対する文字切出し画像の目視確認・修正が行われる。
以上説明した図19のステップ1903詳細処理が終了すると、画像処理後の編集帳票画像データ、つまり切り出したメールの文字画像データをWEB/メールサーバ108にアップロードする(ステップ1904)。それと共に、メールやFAX等の通信手段を用いて、各家庭101の帳票送信者に対して文字画像を切り出してアップロードが完了したことを通知する。そして、通知を受けた送信者がWEB/メールサーバ108にログインして、自分が意図したテキストになっているかを確認し(ステップ1905)、修正が必要な場合は修正箇所をマークしてプロバイダに通知する。図24は利用者側の端末104に表示される内容で、確認・修正箇所をマークする画面の例を示す。登録番号2401から2403は図12の1201から1203と同じ内容を示す。タイトル2404、メッセージ2405は、それぞれ図8の809、810を1文字毎に画像を切り出したデータを示す。2406から2409は図12と同じである。2410は図12と同様に修正マークを示した例である。上述したとおり、文字画像に付与された禁則処理コードを用いたレイアウト調整により図8の帳票レイアウトと異なり、読点「。」の画像データが文末に配置、また「メールアドレス」の単語全体が1行になるように文字画像データが配置し直されている。そして、画面に表示された内容で図24の送信ボタン2406を押してメールを送信する(ステップ1906)。以上のステップ1901から1906の処理により1文字毎に切り出した文字画像によるメール送信が可能になる。
次に、掲示板に関する処理を説明する。1文字毎に切り出された文字画像によるメッセージは上記メール送信の一例と同様である。メール送信処理の場合と異なるのは図20におけるステップ2005の処理に分岐すること、および、図19におけるステップ1905である。このステップ2005の処理はメールの場合と同様に図22の手順に従い確認修正処理を行う。メールの場合と異なる処理はステップ2203であり、オペレータが操作する画面の例は図25のようになる。2505がテキストの代わりに切り出された文字画像になっているだけで、他は図15と同じである。なお、ステップ1905では、掲示板投稿者が操作する画面のタイトル・メッセージが図15のテキストの代わりに図26の2604、2605に示すように切り出された文字画像に変わることである。これら処理により1文字毎に切り出された文字画像による掲示板への記事投稿が可能になる。
以上説明したとおり、本実施例では帳票はFAXによる送信を例に説明したが、スキャナで読み取った画像を、インターネットを介してプロバイダに送信してもよい。本装置を画像読取装置又はイメージ読取装置とも言う。また、センタにある目視確認・修正端末はセキュリティ対策を施した上、ネットワークを介してセンタ外の別の場所に設置してもよい。さらに、実施例ではWEBサーバと画像/文字認識サーバを分けて説明したが、両者を統合して1台で実現してもよい。合わせて単にサーバとも言う。
図1において確認・修正端末110と再確認・修正端末111は実施例の説明では分けたが、これらを統合し、最初に確認・修正したオペレータとは別のオペレータによる再確認・修正を行ってもよい。さらに、実施例ではオペレータ確認・修正のミスを防ぐために重複配信(又は重複分割)の例を説明したが、重要度が低い帳票種の場合は画像とOCR結果を重複がないように分割して配信してもよい。本処理は、帳票種の識別結果に応じて決定するのが望ましい。また、上記実施例ではOCRによる帳票画像のテキスト化を用いた説明を行ったが、OCRを介さずに直接オペレータによるテキスト化入力を行ってもよい。
101…各家庭、102…テキスト入力用の帳票、103…FAX装置、104…インターネット情報を見るための端末、105…家庭内ネットワーク、106…広域ネットワーク、107…プロバイダセンタ、108…WEBサーバ、109…画像/文字認識サーバ、110…確認・修正端末群、111…再確認・修正端末群、112…LAN
Claims (10)
- 文書上に記載された文字情報を画像データに変換し、該画像データをテキスト化するシステムにおいて、
連続したキャラクタデータからなる一つのフィールド画像データと、該フィールド画像を認識したテキストデータとを複数に分割する手段と、
分割された各分割画像データ及び該分割画像データに対応する各分割テキストデータとを異なる複数のオペレータ端末に配信する手段と、
前記オペレータ端末は配信された前記分割画像データ及び分割テキストデータとを対に表示する手段と、表示された前記分割テキストデータに修正入力する手段とを有する
ことを特徴とする文字画像テキスト化システム。 - 請求項1記載の文字画像テキスト化システムにおいて、分割される前の前記フィールド画像データは、タイトル又はメッセージを含むことを特徴とする文字画像テキスト化システム。
- 請求項2記載の文字画像テキスト化システムにおいて、前記メッセージに電話番号又はメールアドレス等が含まれていたとき、予め決められた手順に従ってその一部を入れ換えて前記分割画像データを生成する入換手段を有することを特徴とする文字画像テキスト化システム。
- 請求項1記載の文字画像テキスト化システムにおいて、前記フィールド画像を分割するとき、第1分割画像データと第2分割画像データとのそれぞれの一部を重複させて分割する重複分割手段を有することを特徴とする文字画像テキスト化システム。
- 請求項1記載の文字画像テキスト化システムにおいて、前記複数のオペレータ端末から送信される複数の分割テキストデータの一致不一致を抽出する手段を有することを特徴とする文字画像テキスト化システム。
- 請求項1記載の文字画像テキスト化システムにおいて、前記複数のオペレータ端末から送信される複数の分割テキストデータを統合する手段を有することを特徴とする文字画像テキスト化システム。
- 請求項1記載の文字画像テキスト化システムにおいて、前記フィールド画像データが縦書きに記載された文章のとき、横書きの画像データに変換する手段を有することを特徴とする文字画像テキスト化システム。
- 請求項1記載の文字画像テキスト化システムにおいて、前記オペレータ端末は、前記分割テキストデータ以上の前記分割画像データを表示すると共に、前記分割画像データを確認部分とそうでない部分とに分けて表示する手段を有することを特徴とする文字画像テキスト化システム。
- 帳票に記載された文字画像データをテキスト化するシステムにおいて、
連続文字の一塊のフィールド画像データを、文字単位で区分する区分手段と、
前記区分された文字を認識する認識手段と、
区分した画像の順番を規定するインデックス処理手段と、
任意の画像に対して禁則処理を実行する禁則処理手段とを有する
ことを特徴とする文字画像テキスト化システム。 - 前記認識手段及び前記禁則処理手段の処理結果に応じて、前記フィールド画像データの所望の位置に改行処理を施すことを特徴とする請求項9記載の文字画像テキスト化システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004077405A JP2005267129A (ja) | 2004-03-18 | 2004-03-18 | 文字画像テキスト化システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004077405A JP2005267129A (ja) | 2004-03-18 | 2004-03-18 | 文字画像テキスト化システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005267129A true JP2005267129A (ja) | 2005-09-29 |
Family
ID=35091627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004077405A Pending JP2005267129A (ja) | 2004-03-18 | 2004-03-18 | 文字画像テキスト化システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005267129A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009104397A1 (ja) * | 2008-02-19 | 2009-08-27 | Matsuda Hiroaki | データ入力システム |
JP2013047912A (ja) * | 2011-08-29 | 2013-03-07 | Oki Electric Ind Co Ltd | 帳票処理装置、帳票処理方法、プログラムおよび帳票処理システム |
WO2014045753A1 (ja) * | 2012-09-19 | 2014-03-27 | 富士フイルム株式会社 | 文書画像解析装置および文書画像表示制御装置ならびにそれらの動作制御方法およびそれらの動作制御プログラム |
JP2020187677A (ja) * | 2019-05-17 | 2020-11-19 | 株式会社日立システムズ | 文字一致性確認システム、文字一致性確認装置、文字一致性確認方法及び文字一致性確認プログラム |
-
2004
- 2004-03-18 JP JP2004077405A patent/JP2005267129A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009104397A1 (ja) * | 2008-02-19 | 2009-08-27 | Matsuda Hiroaki | データ入力システム |
JP2013047912A (ja) * | 2011-08-29 | 2013-03-07 | Oki Electric Ind Co Ltd | 帳票処理装置、帳票処理方法、プログラムおよび帳票処理システム |
CN103093380A (zh) * | 2011-08-29 | 2013-05-08 | 冲电气工业株式会社 | 帐票处理装置、帐票处理方法、程序以及帐票处理系统 |
WO2014045753A1 (ja) * | 2012-09-19 | 2014-03-27 | 富士フイルム株式会社 | 文書画像解析装置および文書画像表示制御装置ならびにそれらの動作制御方法およびそれらの動作制御プログラム |
JP2020187677A (ja) * | 2019-05-17 | 2020-11-19 | 株式会社日立システムズ | 文字一致性確認システム、文字一致性確認装置、文字一致性確認方法及び文字一致性確認プログラム |
JP7236928B2 (ja) | 2019-05-17 | 2023-03-10 | 株式会社日立システムズ | 文字一致性確認システム、文字一致性確認装置、文字一致性確認方法及び文字一致性確認プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8489388B2 (en) | Data detection | |
US8203743B2 (en) | Form processing device including a written image extraction device | |
US7711191B2 (en) | Electronic transaction processing server with automated transaction evaluation | |
US20020143825A1 (en) | Ensuring proper rendering order of bidirectionally rendered text | |
JP6087452B1 (ja) | 紙文書管理システム | |
CN111062791A (zh) | 一种报销填单方法、装置和设备 | |
US8577826B2 (en) | Automated document separation | |
JP2012014573A (ja) | 宛先表示装置、宛先表示方法及び宛先表示プログラム | |
JP6253354B2 (ja) | 帳票読取装置、プログラムおよび帳票読取システム | |
CN111211970A (zh) | 一种邮件联系人添加方法、装置及存储介质 | |
JP2005267129A (ja) | 文字画像テキスト化システム | |
KR20190061342A (ko) | 민원서류 처리 방법 및 시스템 | |
TWI688868B (zh) | 用於提取訊息並使用所述訊息擷取聯絡人訊息的系統、非暫時性電腦可讀媒體和方法 | |
CN111669312A (zh) | 消息交互方法、电子设备及介质 | |
JP7317612B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2006190093A (ja) | Ocr為替集中処理システム | |
JP6201638B2 (ja) | 帳票処理装置及びプログラム | |
JP4409408B2 (ja) | 電子申請支援サーバ、電子申請支援方法、および電子申請支援プログラム | |
CN110942068A (zh) | 信息处理装置、存储介质及信息处理方法 | |
JP2020052480A (ja) | 情報処理装置及びプログラム | |
WO2009122696A1 (ja) | 文字認識装置、文字認識プログラム、及び、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
KR102605981B1 (ko) | 온라인 계약체결 관리시스템 | |
JPH1063813A (ja) | イメージ文書管理方法及びその装置 | |
JP2004272658A (ja) | 携帯情報端末のテキストデータ入力支援方法及び装置 | |
WO2009104397A1 (ja) | データ入力システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060509 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060821 |