JP2010009130A - ネットワークocrシステムおよびクライアント装置 - Google Patents

ネットワークocrシステムおよびクライアント装置 Download PDF

Info

Publication number
JP2010009130A
JP2010009130A JP2008164800A JP2008164800A JP2010009130A JP 2010009130 A JP2010009130 A JP 2010009130A JP 2008164800 A JP2008164800 A JP 2008164800A JP 2008164800 A JP2008164800 A JP 2008164800A JP 2010009130 A JP2010009130 A JP 2010009130A
Authority
JP
Japan
Prior art keywords
client
network
ocr system
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008164800A
Other languages
English (en)
Inventor
Mika Aoyagi
美香 青柳
Taro Takamatsu
太郎 高松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008164800A priority Critical patent/JP2010009130A/ja
Publication of JP2010009130A publication Critical patent/JP2010009130A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】
クライアントでスキャンされたデータをOCR処理し、クライアントに提供するシステムにおいて、クライアントで有効にデータを利用可能とするシステムを提供する。
【解決手段】
クライアント装置と、このクライアント装置とネットワークを介して接続された情報処理装置を備えたネットワークシステムであり、情報処理装置は、クライアント装置から受信したイメージデータについて文字認識処理を行ってテキストデータを生成する。生成されたテキストデータは、データベースに構築されるなど加工、整理され、クライアントにとって利用しやすい形態で記憶装置に格納される。
【選択図】 図1

Description

この発明は、原稿をスキャンして得られたイメージデータを解析し、文字認識処理を行ってテキストデータを得るOCRシステムであって、特にクライアントからネットワーク経由で受領したイメージデータについてOCR処理を行い、その結果をサーバに格納して管理するネットワークOCRシステムに関する。また、そのようなネットワークOCRシステムに適用されるクライアント装置に関する。
従来から、原稿をスキャンして得られたイメージデータを解析し、テキストデータに変換するOCR(Optical Character Recognition)システムが知られている。
一般的なOCRシステムは、原稿を光学的に読み取り、文字認識を行うものである。すなわち、読み取った原稿画像内に存在する各々の文字について、文字領域の決定、パターン認識などのステップを実行し、何のキャラクタ情報であるかを判定する。そして、そのキャラクタ情報に対応するテキスト情報を生成、出力するものである。このようなOCR装置は公知であり、専用のOCR装置のほか、汎用のPC(Personal Computer)上で動作するOCRプログラムも多数販売されている。
汎用のPCにOCRソフトウェアをインストールし、当該PCをOCR装置として用いる場合には、そのOCRソフトウェアのバージョンアップなどの際に手間がかかる。すなわち、それぞれのPCのユーザーは、ソフトウェアがバージョンアップされる度に、バージョンアップされたソフトウェアを入手しなければならない。そして、バージョンアップされたソフトウェアを、PCにインストールしなければならない。特に企業内のように多数のPCを有している場合は、それらのPCの全てについてバージョンアップ作業を行う必要があり、大変面倒である。
一方、端末装置にネットワークを介して接続されたホスト装置にて、OCR処理を行うシステムも知られている。たとえばFAX−OCRと称されるシステムは、ファクシミリ端末で原稿を読み取り、その読み取りで得られたイメージデータをファクス通信によりホスト装置に送信する。ホスト装置は、ファクシミリ端末から送られたイメージデータについてOCR処理を行うものである。なお、FAX−OCR以外にも、端末で原稿を読み取って得たイメージデータをホストに送信して、ホストにおいてOCR処理するシステムが知られている。
特許文献1には、ファクシミリ装置から送られたイメージデータをOCR処理し、その結果に応じた処理を行うFAX−OCRシステムが開示されている。
特許文献2には、営業店にて原稿(振込依頼書)をスキャンして得たイメージデータをセンタに送信し、センタにてOCR処理を行う金融システムが開示されている。
特許文献3には、センター装置でOCR処理した結果をクライアントのブラウザにて表示する、ウェブベースのOCRシステムが開示されている。
特開2000−331071号公報 特開2006−190093号公報 特開2005−327258号公報
しかし、特許文献1および特許文献2に記載のシステムは、センタでテキスト化された情報は、センタにおける情報処理のために用いられている。これらのシステムでは、端末装置は、単に原稿の読み取り装置に過ぎない。
また特許文献3に記載のシステムは、センタでテキスト化された情報を単にクライアントに返送するのみである。したがって、生成されたテキスト情報はクライアント側で加工され整理される必要がある。
この発明は、以上のような状況を鑑みてなされたものである。すなわち、この発明は、端末装置において読み取られたイメージデータを端末装置で利用するためのシステムを提供する。しかも、OCR処理をホスト装置で行うことによる集中化により、多数のクライアント装置にOCR機能をインストールするような煩雑さを回避し、かつ、センタで得られたデータをクライアント装置で有効に利用可能とするシステムを提供することを目的とする。
この発明のOCRシステムは、クライアント装置と、このクライアント装置とネットワークを介して接続された情報処理装置を備えている。ここで情報処理装置は、クライアント装置から送信されたイメージデータを受信して、このイメージデータについてOCR処理を行ってテキストデータを生成する。
OCRシステムは、生成されたテキストデータを記憶する記憶部を有する。この記憶部に記憶される際、テキストデータは、データベースに構築されるなど加工、整理され、クライアントにとって利用しやすい形態で格納される。OCRシステムは、さらに、記憶部に格納されたデータをクライアント装置に対して提供するデータ提供部とを有する。
なお、この明細書においてOCR処理とは、何らかの方法により作成されたイメージデータについて文字認識処理を行い、認識された文字情報に対応するテキストデータ、すなわち一連の文字コードを生成することをいう。特に原稿を読み取ること自体は問わない。
この発明は、以上のように構成されているので、OCR処理をホスト装置で行うことによる集中化により、多数のクライアント装置にOCR機能をインストールするような煩雑さを回避できる。さらに、センタで得られたデータをセンタで加工、整理してクライアントに提供するので、クライアントに対してより有効なサービスを提供できる。
以下、この発明を実施するための最良の形態について、図面を参照して詳細に説明する。図1は、本実施形態におけるOCRシステムのネットワーク構成を示す図である。
このOCRシステムは、クライアントのオフィスに配置されるクライアントシステム1と、サーバ側に備えられるOCRサーバ(以下、単にサーバと称する)2とを含む。これらクライアントシステム1とサーバ2とは、ネットワーク3を介して接続されている。なお図1では、クライアントシステム1が、クライアントPC11と、MFP12とを有している例を示している。これらのクライアントPC11とMFP12とはLAN13で接続されている。一方サーバ2には、データベースを格納する記憶装置4が接続されている。
次に図2を用いて、クライアントのオフィスに配置されるクライアントシステムを説明する。
MFPは、制御部21と、原稿をスキャンする読み取り部22を有している。クライアントは、このMFPの読み取り部22に原稿をセットし、読み取りスタートボタン(図示せず)を押下する。この操作に応じて制御部21が読み取り部22を動作開始させることで原稿がスキャンされる。このスキャンにより原稿の記載内容がイメージデータとして取得される。制御部22は、逐次取得されるイメージデータをメモリ23に一時蓄積する。
MFPは、さらにネットワークI/F24を有している。制御部21は、原稿のスキャンが終了すると、メモリ23に蓄積されているイメージデータを読み出し、これをネットワークI/F24およびネットワーク3を介してサーバ2に送信する。
なお、原稿のスキャンのためには、この形態ではなくクライアントPC11を用いる形態でもよい。すなわち、クライアントPC11にスキャナ(図示せず)が接続されていて、このスキャナを原稿のスキャンのために用いる形態でもよい。この場合は、クライアントPC11内のCPUがスキャナを駆動して原稿の読み取りを行い、イメージデータはPC内のメモリに一時蓄積された後、PC内のネットワークI/Fを介してイメージデータをサーバ2宛てに送信すればよい。
次に図3を用いて、サーバ2の構成を説明する。サーバ2は、ネットワークI/F31を有しており、クライアントシステム1から送信されてきたデータは、このネットワークI/F31を介して受信される。サーバ2は、さらに、制御部32、メモリ33、およびOCR部34を有する。
制御部32は、クライアントシステム1からイメージデータが送られてくると、これをいったんメモリ33に格納する。イメージデータの受信が完了すると、制御部32は次に、メモリ33からイメージデータを読み出し、これをOCR部34に与える。OCR部34は、このイメージデータについてOCR処理を施し、テキストデータを生成する。このテキストデータは制御部32に送られ、制御部32によりメモリ33に格納される。
なお、OCR部34は、制御部32から与えられたイメージデータに関して、(1)全体についてOCR処理を行うか、あるいは(2)あらかじめ制御部32から指示された一定範囲についてOCR処理を行う。何れの処理を行うかは、クライアントが予め指定しておいた内容に従えばよい。したがってサーバ2は、複数のクライアント各々について、クライアントから送信されてくるイメージデータのフォーマット、そのイメージデータの何れの部分をOCR処理するのかなどの情報をデータベースとして保有している。このデータベースは、記憶装置4に格納されている。なお、図3には、サーバ2と記憶装置4とが直接接続されている形態を示した。しかし記憶装置4は、ネットワークを介してサーバ2とは遠隔地に設置されていてもよい。
制御部32は、OCR部34により生成されたテキストデータを記憶装置4に格納する。クライアントはOCR処理の結果を持たず、必要に応じてサーバ2にアクセスして、この結果を利用する。したがって、クライアントでデータの加工、整理、メンテナンスやバックアップなどを行う必要はなく、また一般にクライアントが有するPCよりも高い処理能力を有するサーバでデータを扱うことにより、高度なサービスを提供することができる。
クライアントは、周知の技術、たとえばWebブラウザにより、サーバ2に含まれるWebサーバ35にアクセスする。すなわちクライアントは、クライアントPC11を用いてWebサーバ35にアクセスし、IDやパスワード入力などの周知の認証プロセスを経て、自己に必要なデータを取得する。Webサーバ35は、クライアントのアクセスに応じて、記憶装置4のデータを検索する。そして検索されたデータを読み出し、Webサイトに掲示すればよい。
これらの他にも、適当な方法でデータがクライアントシステム1に提供されればよい。なお、クライアントシステム1とサーバ2、あるいはサーバ2と記憶装置4との間で授受されるイメージデータや、OCR処理の結果として生成されるテキストデータは、暗号化されていても良いことは言うまでもない。
ところでサーバ2は、単にテキストデータを記憶装置4に格納するだけでなく、テキストデータからデータベースなどを構築した上で、この内容を記憶装置4に格納してもよい。たとえば文書データベース、住所録データベース、電話帳データベースなどである。すなわち制御部32は、クライアントからの検索指示に応じてデータベース内を検索する。そして記憶装置4から検索結果であるデータを検索・抽出し、このデータをクライアントに提示してもよい。
以下、図4を用いて、上述したクライアント、サーバ2、および記憶装置4の間の情報の流れを説明する。
(A)まずクライアントは、サーバ2に対してユーザ登録を行う。このユーザ登録の際には、ユーザからサーバ2に対して、ユーザーIDやユーザの住所、メールアドレスなどのユーザデータが送信される。サーバ2は、ユーザから受信したこれらのユーザデータを記憶装置4に構築されたデータベース(図示せず)に格納する(A2)。すなわちサーバ2は、データベース内に新規レコードを作成し、ここに当該ユーザのユーザデータを格納する。これにより新規のユーザ登録が行われる。
(B)次にクライアントは、原稿の読み取りに先立って、サーバ2に対してOCR処理を行う範囲を指示する。すなわち前述したように、OCR部34がイメージデータの全体に関してOCR処理を行うか、あるいはイメージデータの一部についてOCR処理を行うかを指示する。この指示は、クライアントPC11に表示される範囲指定画面にて、クライアントがキーボードを用いてOCR範囲の座標を入力して行ってもよいし、あるいはクライアントPC11に接続されるマウスやトラックパッドあるいはタブレットなどの入力機器を用いて行ってもよい。クライアントPCのCPU(図示せず)は、ここで指定された座標あるいは範囲をサーバ2に送信する。
なお、この指示にあたってクライアントは、OCR範囲の指定とともにクライアントIDもサーバ2に送信することは言うまでもない。サーバ2は、このOCR範囲の指示を記憶装置4に与える(B2)。記憶装置4は、クライアントIDを用いてデータベース中から当該クライアントのレコードを検索し、この指示を書き込むことでレコードを更新する。
ところで、このスキャン範囲の指定は、原稿読み取りの際に限らず、(A)ユーザ登録の際にあわせて行われてもよい。この場合は、読み取りの都度OCR範囲を指定しなくて済み、クライアントの操作が簡単になる。一方でOCR範囲がユーザ登録の際に定めたものになってしまう点ではクライアントにとって自由度が少ない。よって、読み取り時にクライアントからOCR範囲の指定があればそれに従い、指定がなければユーザ登録の際に定めたものをデフォルト値として用いればよい。
(C)次に、クライアントは原稿の読み取りを行う。この結果、クライアントからサーバ2に対して、クライアントIDとイメージデータとが送信される。サーバ2では、制御部32が、このイメージデータを受信し、いったんメモリ33に逐次格納する。次いで制御部32は、記憶装置4のデータベースにアクセスして、当該クライアントのレコードから、クライアントが指定したOCR範囲を参照する(C2)。制御部32は、ここで参照したOCR範囲に基づいてイメージデータの文字認識処理を行い、テキストデータを生成する。
(D)制御部32が生成したテキストデータは、記憶装置4に与えられ、当該クライアントと対応付けてデータベースに記憶される。このとき、前述したようにテキストデータ自体が記憶されてもよいし、あるいはサーバ2による統計処理などが行われた結果が記憶されてもよい。
(E)OCR処理が終了すると、クライアントは、クライアントPC11を用いてサーバ2のWebサーバ35にアクセスする。Webサーバ35は、このアクセスに応じて記憶装置4から必要なデータを読み出し(E2)、クライアントに提供する(E3)。
以下、この発明を利用してアンケート集計サービスを実現する実施例について特に説明する。
クライアントは、自己のビジネスの改善や問題点の発見などのため、消費者にアンケートを実施することがある。このアンケートは、近年では消費者がWebブラウザでサーバにアクセスすることでも行われるが、アンケート用紙に質問事項や解答欄を印刷し、消費者に記入してもらう形の調査も引き続き行われている。アンケート用紙を用いて調査が行われた場合、この結果を集計する作業は通常は人手により行われており、手間のかかるものであった。この実施例では、クライアントがアンケート用紙をMFP12で読み取らせ、その結果をサーバ2にてOCR処理してクライアントに返送することで、集計の手間を軽減する。
以下、この実施例における情報の流れを説明する。基本的には図4に示したものと同様であるので、適宜図4も参照して説明する。
まず、クライアントがサーバ2に対してユーザ登録を行う点(A)は、図4に示した流れと同様である。
次いでクライアントは、消費者に対するアンケート項目を決定する。そして、この項目に基づいて、アンケート用紙に記載する質問文や解答欄などのレイアウトを決定する。クライアントは、ユーザ登録の際、あるいはその後に原稿の読取を行うより以前に、こうして決定されたアンケート用紙をサーバ2に示しておくことが望ましい(B)。また、これとあわせてOCR範囲を示しておくことが望ましい。この結果サーバ2は、実際にアンケート用紙を読み取る際には、このアンケート用紙についてOCR処理を行う範囲を認識できている(B2)。
あるいは、アンケート用紙のレイアウトなどは、クライアントからの委託を受けてサーバ2の管理者が決定してもよい。この場合は、クライアントからOCR範囲を指定するわけではないが、サーバ2がアンケート用紙を作成することにより、サーバ2がアンケート用紙についてOCR処理を行う範囲をあらかじめ認識できていることは同様である。
クライアントは、このようにしてレイアウトを決定したアンケート用紙を作成し、これを用いて消費者に対するアンケートを実施する。このアンケート結果は手書きであるので、クライアントは、この用紙をMFP12を用いてイメージデータに変換する。この作業は、前述したように、クライアントがMFPの読み取り部22に記入済みのアンケート用紙をセットし、読み取りスタートボタン(図示せず)を押下すればよい(C)。
サーバ2の制御部32は、アンケート用紙についてあらかじめOCR処理を行う範囲を認識しているので(C2)、この範囲についてOCR処理を行う。その後、OCR処理によって生成されたテキストデータが記憶装置4に格納されるのは同様である(D)。
なお、ここで、前述した、OCR範囲を示しておく点について、より詳しく説明する。一般にアンケート用紙では、質問事項が記載されている領域と、その質問事項に対する回答を記入する領域とが1セットとなっている。そして、一般的なアンケート用紙には、この質問および回答の領域のセットが複数記載されている。この回答記入領域を、OCR処理を行う範囲として示しておく(図4(B))。
アンケートの回答方法には、あらかじめいくつかの選択肢を提示しておき、その中から適切な選択肢を回答させるものと、自由に記述させるものとがある。この例を、図5を用いて説明する。図5は、この実施例での読み取り対象であるアンケート用紙の一例を示す図である。ここでは、回答者に対して健康状態を記入させる例を示している。
このアンケート用紙には、Q1からQ3まで、3問の設問が記載されている。それぞれの設問は、それぞれ質問領域Q11、Q21、およびQ31と、回答記入領域Q12、Q22、およびQ32とからなる。設問Q1およびQ2は、複数の選択肢から1を選択させる形式の設問である。よって回答記入領域Q12およびQ22には、選択肢であるAからEまでの、いずれかの文字が記入される。設問Q3は、自由記述欄であり、特に選択肢を示していない。よって回答記入領域Q32には、回答者が任意の形式で記載した文章が記入される。
すなわち、この実施例におけるアンケート用紙は、回答の内容は複数あっても、回答そのものはいずれの用紙でも同じ位置に記入される。この点が、選択肢の選択結果に応じて回答の位置が異なるマークシートと異なる。したがって、クライアントは、このようなアンケート用紙をあらかじめサーバ2に提示して、回答記入領域Q12、Q22、およびQ32をOCR範囲として指定する。
この後、サーバ2は、格納された複数のアンケート結果について集計処理、統計処理などを行い、その結果をあわせて記憶装置4に格納する。こういった集計処理、統計処理は、サーバ2が自動で行ってもよいし、あるいは、このような自動処理に加えてサーバ2のオペレーターが何らかのマニュアル処理を行ってもよい。
集計処理、統計処理として、具体的には様々なサービスが考えられる。たとえば、アンケート用紙に配置されるそれぞれの項目について、消費者が記入した回答を単純にテキスト化して一覧表を作成する処理が考えられる。あるいは、アンケート用紙に配置されるそれぞれの項目について、消費者が記入した回答をテキスト化し、さらに機械翻訳する処理が考えられる。さらに、アンケート項目が、複数の選択肢から一ないし複数のものを選択して数字を記入する回答を要求しているものである場合は、回答の文字について文字認識し、この文字の出現頻度をカウントすることで、それぞれの項目の回答数を集計したり、出願頻度順に並べ替えたりすることができる。
以上述べたような処理を行うため、この実施例において、制御部32を詳細に説明すると図6のようになる。すなわちサーバ2の制御部32は、OCR処理の結果として生成され、記憶装置4に格納されたテキストデータを受信するテキストデータ入力部321を有する。このテキストデータ入力部321には、ファイル書き出し部322、形態素解析部323、および出現頻度カウンタ324が、それぞれ接続されている。また、ファイル書き出し部322、形態素解析部323、および出現頻度カウンタ324は、データ出力部325に接続されている。データ出力部325は、Webサーバ35に接続されている。したがってデータは、Webサーバ35を介してクライアントに提供される。
記憶装置4に格納されているテキストデータは、テキストデータ入力部321に与えられる。このテキストデータがファイル書き出し部322に与えられる。ファイル書き出し部322は、このテキストデータをテキストファイル形式、あるいはCSV形式など適切な形式に変換する。そして、変換後のデータをテキストデータ出力部325に与える。
また、テキストデータ入力部321に与えられたテキストデータは、形態素解析部323に与えられる。形態素解析部323は、与えられたテキストデータについて形態素解析を行い、さらに、翻訳辞書326を用いて機械翻訳を行う。こうして作成された翻訳結果は、データ出力部325に与えられる。ここでいう機械翻訳は、単に第1の言語から第2の言語に翻訳するのみならず、たとえば自然言語からプログラム言語への翻訳など、別の形式への翻訳も含んでいてよい。
なお、このようにサーバ2が形態素解析機能を有していれば、生成されたテキストデータを全文検索することも可能になる。すなわちテキストデータ入力部321に与えられたテキストデータは、形態素解析部323に与えられる。形態素解析部323は、与えられたテキストデータについて形態素解析を行い、テキストデータを形態素に分解する。この結果が出現頻度カウンタ324に与えられる。
出現頻度カウンタ324は、与えられた形態素の出現頻度をカウントする。そして、それぞれの形態素に出現頻度を付加して、データ出力部325に与える。もちろん、すべての形態素について出現頻度をカウントする必要はなく、名詞のみとか、名詞と動詞のみとか、適宜選択すればよい。この結果、出現頻度の高い語句をキーとして回答をランク付けすることも可能になる。
さらに、アンケート項目が、複数の選択肢から一ないし複数のものを選択して数字を記入する回答を要求しているものである場合は、以下のような処理が行われる。まず、図4に示す(B)の段階で、制御部32は、アンケート用紙のいずれの部分が選択肢の解答欄であるかを認識しておく。
次に、OCR部34によるOCR処理の際、制御部32は、選択肢の解答欄から生成されたテキストデータを記憶装置4から受信して、出現頻度カウンタ324に与える。出現頻度カウンタ324により出現頻度がカウントされると、制御部32は、当該出現頻度の高かったデータが、いずれの解答欄から生成されたものであったかを判断する。この処理により、それぞれの項目の回答数を集計したり、回答数の順に並べ替えたりすることができる。
なお、上述した中、テキストデータをファイル書き出しする具体的な方法自体、形態素解析の具体的な方法自体はこの発明の本質ではないので、詳しい説明は省略する。
こうして作成された集計処理、統計処理などの結果は、記憶装置4に格納される。クライアントは、Webサーバ35にアクセスして、これらの集計結果を閲覧する(E)。
こうしてデータベースに格納された集計結果は、Webサーバ35を介してクライアントに提供される。クライアントでは、クライアントPC11の表示装置に、これらの結果が表示されればよい。この表示は、周知のWebページの形式で行われればよい。クライアントは、OCR結果であるテキストデータを利用して各種資料を作成したり、サーバ2から提供された集計あるいは統計データを用いて、今後の販売戦略や新製品の開発計画を立案したりすることができる。
なお、図6で示した制御部32は、あくまで機能ブロックとして示したものであり、これらの各ブロックはハードウェアとして実現されていてもよいし、あるいは制御部32で実行されるソフトウェアで実現されてるものでもよい。
このようなシステムにおいて、サーバはクライアントに対して、OCR処理を行った用紙の枚数に応じて課金するとか、あるいはアンケート用紙のレイアウト作成について支払いを受けるなど、適切な方法で対価を得ればよい。
この発明が適用されるネットワークシステムを示す概念図 この発明のクライアントシステムの構成を示す図 この発明のクライアントシステムの構成を示す図 クライアント、サーバ、および記憶装置の間の情報の流れを説明する図 アンケート用紙の一例を示す図 制御装置の機能を示す機能ブロック図
符号の説明
1 クライアントシステム
2 サーバ
3 ネットワーク
4 記憶装置
11 クライアントPC
12 MFP

Claims (9)

  1. クライアント装置と、前記クライアント装置とネットワークを介して接続された情報処理装置を備えるネットワークOCRシステムにおいて、前記情報処理装置は、
    前記クライアント装置から送信されたイメージデータを受信する受信手段と、
    前記受信したイメージデータについて文字認識処理を行う文字認識処理手段と、
    前記文字認識処理部の処理結果から、前記イメージデータに対応するテキストデータを生成するテキストデータ生成手段と、
    前記テキストデータ生成部の生成したテキストデータを格納する第1の記憶手段と、
    前記クライアント装置に対して、前記記憶部に格納されたデータを提供するデータ提供手段とを有することを特徴とする、
    ネットワークOCRシステム。
  2. 請求項1記載のネットワークOCRシステムであって、
    前記クライアント装置は、前記イメージデータのうち文字認識処理を行う領域を指示する領域指示情報を、あらかじめ前記情報処理装置に指示しておく指示手段を有することを特徴とする、
    ネットワークOCRシステム。
  3. 請求項2記載のネットワークOCRシステムであって、
    前記情報処理装置は、前記指示部から受領した領域指示情報を格納する第2の記憶手段と、
    この第2の記憶手段から前記領域指示情報を読み出して、この領域指示情報にしたがって前記文字認識処理を行う制御手段とを有することを特徴とする、
    ネットワークOCRシステム。
  4. 請求項3記載のネットワークOCRシステムであって、
    前記情報処理装置は、前記テキストデータをファイル化するファイル化出力手段を有することを特徴とする、
    ネットワークOCRシステム。
  5. 請求項3記載のネットワークOCRシステムであって、
    前記情報処理装置は、前記テキストデータを解析する解析手段と、
    この解析手段の解析結果を受けて、前記テキストデータを他の形式に翻訳する翻訳手段を有することを特徴とする、
    ネットワークOCRシステム。
  6. 請求項3記載のネットワークOCRシステムであって、
    前記情報処理装置は、前記テキストデータを解析する解析手段と、
    この解析手段の解析結果を受けて、前記テキストデータ内で特定結果の出現頻度をカウントする頻度カウント手段を有することを特徴とする、
    ネットワークOCRシステム。
  7. 請求項1記載のネットワークOCRシステムであって、前記情報処理装置は、
    テキストデータをデータベース化して前記記憶部に格納することを特徴とする、
    ネットワークOCRシステム。
  8. 請求項7記載のネットワークOCRシステムであって、前記情報処理装置は、
    前記記憶部に格納されたデータベースに対する検索部を有し、
    前記クライアントからの検索指示により、前記データベース内のデータを検索して、前記クライアントに提示することを特徴とする、
    ネットワークOCRシステム。
  9. 請求項1から8いずれかに記載のネットワークOCRシステムに適用されるクライアント装置であって、
    原稿を読み取ってイメージデータ化する読み取り部と、
    前記イメージデータを前記情報処理装置に対して送信する情報送信部と、
    前記情報処理装置に対してネットワーク経由でアクセスを行い、前記記憶部に格納されたデータを取得するデータ取得部とを有することを特徴とする、
    クライアント装置。
JP2008164800A 2008-06-24 2008-06-24 ネットワークocrシステムおよびクライアント装置 Pending JP2010009130A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008164800A JP2010009130A (ja) 2008-06-24 2008-06-24 ネットワークocrシステムおよびクライアント装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008164800A JP2010009130A (ja) 2008-06-24 2008-06-24 ネットワークocrシステムおよびクライアント装置

Publications (1)

Publication Number Publication Date
JP2010009130A true JP2010009130A (ja) 2010-01-14

Family

ID=41589583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008164800A Pending JP2010009130A (ja) 2008-06-24 2008-06-24 ネットワークocrシステムおよびクライアント装置

Country Status (1)

Country Link
JP (1) JP2010009130A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016025559A (ja) * 2014-07-23 2016-02-08 シミックPms株式会社 報告書作成システム
JP2020113054A (ja) * 2019-01-11 2020-07-27 京セラドキュメントソリューションズ株式会社 情報処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016025559A (ja) * 2014-07-23 2016-02-08 シミックPms株式会社 報告書作成システム
JP2020113054A (ja) * 2019-01-11 2020-07-27 京セラドキュメントソリューションズ株式会社 情報処理装置
JP7322407B2 (ja) 2019-01-11 2023-08-08 京セラドキュメントソリューションズ株式会社 情報処理装置

Similar Documents

Publication Publication Date Title
JP7110636B2 (ja) 情報処理システム、情報処理装置、及び情報処理方法
US11112958B2 (en) Information processing system, service providing system, and flow setting method
US10992831B2 (en) Information processing system for setting dependency relationships for input items on a screen related to a process flow
JP7073888B2 (ja) メッセージ提供装置及びプログラム
JP2017219924A (ja) 仲介サーバ
US11336788B2 (en) Information processing apparatus and non-transitory computer readable medium for combining written information with image of document
US20090027724A1 (en) Data processing method, data management device, and information processing device
JP2017016496A (ja) 検索システム、検索方法、およびコンピュータプログラム
JP2011227767A (ja) 情報処理装置および情報処理方法
US20080036779A1 (en) Method and system for managing apparatus
US20130050733A1 (en) Information processing apparatus that displays web page, method of controlling information processing apparatus, and storage medium
KR101278496B1 (ko) 오답 노트 생성 시스템 및 오답 노트 생성 방법
JP2008035240A (ja) スキャンシステム、スキャン装置及びデータ処理方法
US9591092B2 (en) Relaying device, image processing device, and system comprising image processing device, relaying device and service server
US8941870B2 (en) Automated file generation using a multifunction peripheral
JP2010009130A (ja) ネットワークocrシステムおよびクライアント装置
JP4645731B2 (ja) 画像処理装置、画像データ管理方法、およびコンピュータプログラム
US20090260076A1 (en) Workflow management apparatus and workflow management method
US11363162B2 (en) System and method for automated organization of scanned text documents
JP2003067668A (ja) 回答フォームを使用するデータ取得システムおよび方法
JP2020024582A (ja) 画像処理装置及びその制御方法、並びにプログラム
JP2015069496A (ja) 名刺情報管理システム、画像形成装置、及び名刺情報管理方法
JP2022120902A (ja) 情報処理装置、学習装置、及び情報処理装置の制御方法
JP2022129828A (ja) サービス提供システム、情報処理方法、及びプログラム
JP6699624B2 (ja) アンケート管理システム及びアンケート管理方法