JP2002269497A - 文書入力代行方法、文書入力代行システム及び記録媒体 - Google Patents
文書入力代行方法、文書入力代行システム及び記録媒体Info
- Publication number
- JP2002269497A JP2002269497A JP2001064016A JP2001064016A JP2002269497A JP 2002269497 A JP2002269497 A JP 2002269497A JP 2001064016 A JP2001064016 A JP 2001064016A JP 2001064016 A JP2001064016 A JP 2001064016A JP 2002269497 A JP2002269497 A JP 2002269497A
- Authority
- JP
- Japan
- Prior art keywords
- document
- image
- recognition
- service provider
- user terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】 本発明は、紙文書の電子化業務における認識
性能を向上させるとともに、文書における機密を保持し
た安全な文書入力代行を提供する。 【解決手段】 本発明の文書入力システムは、利用者端
末1と、利用者端末1と通信回線を介して接続され、利
用者端末1より供給された画像を複数の画像に分割する
領域識別手段と分割された画像を解析する画像解析手段
とを備えるサービス提供器3と、サービス提供器3で解
析された画像を認識する複数の文書認識サーバ4〜7と
から構成されている。
性能を向上させるとともに、文書における機密を保持し
た安全な文書入力代行を提供する。 【解決手段】 本発明の文書入力システムは、利用者端
末1と、利用者端末1と通信回線を介して接続され、利
用者端末1より供給された画像を複数の画像に分割する
領域識別手段と分割された画像を解析する画像解析手段
とを備えるサービス提供器3と、サービス提供器3で解
析された画像を認識する複数の文書認識サーバ4〜7と
から構成されている。
Description
【0001】
【発明の属する技術分野】本発明は、文書等を認識する
方法に関し、特に複数の文書認識サーバを用いた文書入
力代行方法に関する。
方法に関し、特に複数の文書認識サーバを用いた文書入
力代行方法に関する。
【0002】
【従来の技術】従来、文字領域や図表領域等の属性の異
なる情報領域が混在した文書等の文字認識を行う文字認
識装置(OCR)が提案されている。
なる情報領域が混在した文書等の文字認識を行う文字認
識装置(OCR)が提案されている。
【0003】また、複数の文書認識サーバを用いる従来
の例として、複数の文字認識エンジンを用いる方法が提
案されている(特開平7−28946号公報)。この特
開平7−28946号公報に示される技術は、認識した
文章を各領域に識別した後に認識対象領域毎に異なる認
識演算手段を用いることで、処理の高速化を図るもので
ある。また、ネットワークを介して文書の入力を行うシ
ステムとして、オフィスや出張先等で自由に利用できる
情報処理装置が提案されている(特開2000−172
428号公報)。
の例として、複数の文字認識エンジンを用いる方法が提
案されている(特開平7−28946号公報)。この特
開平7−28946号公報に示される技術は、認識した
文章を各領域に識別した後に認識対象領域毎に異なる認
識演算手段を用いることで、処理の高速化を図るもので
ある。また、ネットワークを介して文書の入力を行うシ
ステムとして、オフィスや出張先等で自由に利用できる
情報処理装置が提案されている(特開2000−172
428号公報)。
【0004】
【発明が解決しようとする課題】しかしながら、特開平
7−28946号公報に示されているように、複数の文
字認識エンジンを用いる手法は、処理の高速化を主眼と
したものであり、同じ文字認識エンジンを複数用意して
処理を行っているため、認識性能の向上を図ることがで
きないという問題がある。また、特開2000−172
428号公報に記載されている情報処理装置は、ネット
ワークを介してアクセスするものであるが、単一あるい
は同じ性能を持ったサーバを用いたものであるであるた
め、認識精度の向上を図ることはできないという問題も
ある。
7−28946号公報に示されているように、複数の文
字認識エンジンを用いる手法は、処理の高速化を主眼と
したものであり、同じ文字認識エンジンを複数用意して
処理を行っているため、認識性能の向上を図ることがで
きないという問題がある。また、特開2000−172
428号公報に記載されている情報処理装置は、ネット
ワークを介してアクセスするものであるが、単一あるい
は同じ性能を持ったサーバを用いたものであるであるた
め、認識精度の向上を図ることはできないという問題も
ある。
【0005】また、複数の文字認識サーバを利用して紙
文書の電子化業務を行う場合、文字認識サーバは外部の
異なる会社、団体が運営していることもあるため、画像
データを各画像毎に文字認識サーバに振り分けると、各
文字認識サーバ上で画像(文書)の内容が閲覧されてし
まい、電子化業務における内容の機密保持が困難となる
という問題がある。また、複数の文字認識サーバを利用
する場合、文字の認識に関して、文字認識サーバ毎に得
手、不得手があるという問題もある。
文書の電子化業務を行う場合、文字認識サーバは外部の
異なる会社、団体が運営していることもあるため、画像
データを各画像毎に文字認識サーバに振り分けると、各
文字認識サーバ上で画像(文書)の内容が閲覧されてし
まい、電子化業務における内容の機密保持が困難となる
という問題がある。また、複数の文字認識サーバを利用
する場合、文字の認識に関して、文字認識サーバ毎に得
手、不得手があるという問題もある。
【0006】さらに、特開平成7−28946号公報の
ような文書認識装置は提案されているものの、ネットワ
ークを介して複数の文書認識サーバを用いて文書の入力
を行う方法に関する従来技術は見当たらない。また、文
書入力代行システムとしての提案もはなされていない。
ような文書認識装置は提案されているものの、ネットワ
ークを介して複数の文書認識サーバを用いて文書の入力
を行う方法に関する従来技術は見当たらない。また、文
書入力代行システムとしての提案もはなされていない。
【0007】本発明はこのような問題点に鑑みなされた
もので、紙文書の電子化業務における認識性能を向上さ
せるとともに、文書における機密を保持した安全な文書
入力代行を提供する。
もので、紙文書の電子化業務における認識性能を向上さ
せるとともに、文書における機密を保持した安全な文書
入力代行を提供する。
【0008】
【課題を解決するための手段】上記課題は、以下の本発
明の手段により解決される。
明の手段により解決される。
【0009】請求項1記載の発明の文書入力代行方法
は、通信回線を介して接続された利用者端末より供給さ
れた画像を領域識別手段により複数の画像に分割し、分
割された該分割画像を画像解析手段により解析し、解析
された該解析画像に基づいてサーバ選択手段により複数
の文書認識サーバの中から適切な文書認識サーバを選択
し、前記分割画像をサーバ送信手段により選択された該
文書認識サーバにそれそれ送信し、該各文書認識サーバ
から得られた複数の電子化データを合成手段により合成
し、合成された該電子化データを前記利用者端末に送信
することを特徴とするものである。
は、通信回線を介して接続された利用者端末より供給さ
れた画像を領域識別手段により複数の画像に分割し、分
割された該分割画像を画像解析手段により解析し、解析
された該解析画像に基づいてサーバ選択手段により複数
の文書認識サーバの中から適切な文書認識サーバを選択
し、前記分割画像をサーバ送信手段により選択された該
文書認識サーバにそれそれ送信し、該各文書認識サーバ
から得られた複数の電子化データを合成手段により合成
し、合成された該電子化データを前記利用者端末に送信
することを特徴とするものである。
【0010】請求項2記載の発明の文書入力代行方法
は、請求項1記載の文書入力代行方法において、前記画
像解析手段が画像中の文字サイズを解析することを特徴
とするものである。
は、請求項1記載の文書入力代行方法において、前記画
像解析手段が画像中の文字サイズを解析することを特徴
とするものである。
【0011】請求項3記載の発明の文書入力代行方法
は、請求項2記載の文書入力代行方法において、前記画
像解析手段が画像の品質を解析することを特徴とするも
のである。
は、請求項2記載の文書入力代行方法において、前記画
像解析手段が画像の品質を解析することを特徴とするも
のである。
【0012】請求項4記載の発明は、請求項1乃至3記
載の文書入力代行方法を実行させるプログラムが記憶さ
れたコンピュータ読み取り可能な記憶媒体である。
載の文書入力代行方法を実行させるプログラムが記憶さ
れたコンピュータ読み取り可能な記憶媒体である。
【0013】請求項5記載の発明の文書入力代行システ
ムは、通信回線に接続された利用者端末と、該利用者端
末と通信回線を介して接続され、該利用者端末より供給
された画像を複数の画像に分割する領域識別手段と分割
された該画像を解析する画像解析手段とを備えるサービ
ス提供器と、該サービス提供器と通信回線を介して接続
され、該画像解析手段により解析された画像を認識する
複数の文書認識サーバとから構成されることを特徴とす
るものである。
ムは、通信回線に接続された利用者端末と、該利用者端
末と通信回線を介して接続され、該利用者端末より供給
された画像を複数の画像に分割する領域識別手段と分割
された該画像を解析する画像解析手段とを備えるサービ
ス提供器と、該サービス提供器と通信回線を介して接続
され、該画像解析手段により解析された画像を認識する
複数の文書認識サーバとから構成されることを特徴とす
るものである。
【0014】上記請求項1乃至5の発明によれば、画像
の内容に応じて適切なサーバに認識処理を行わせること
で、認識性能の向上を図るとともに、文書における機密
を保持した安全な文書入力代行を提供することができ
る。
の内容に応じて適切なサーバに認識処理を行わせること
で、認識性能の向上を図るとともに、文書における機密
を保持した安全な文書入力代行を提供することができ
る。
【0015】
【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて具体的に説明する。
に基づいて具体的に説明する。
【0016】図1は、本発明を実施するためのシステム
構成の一例を示している。図1に示されるように、本シ
ステムは、端末1、画像入力装置2、サービス提供器
3、文書認識サーバ4、文書認識サーバ5、文書認識サ
ーバ6、文書認識サーバ7によって構成されている。
構成の一例を示している。図1に示されるように、本シ
ステムは、端末1、画像入力装置2、サービス提供器
3、文書認識サーバ4、文書認識サーバ5、文書認識サ
ーバ6、文書認識サーバ7によって構成されている。
【0017】画像入力装置2は、スキャナやデジタルカ
メラ等の画像を入力する装置であって、文書入力作業を
依頼するユーザは、この画像入力装置2を用いて紙面上
の文書等を画像に変換する。端末1は、画像入力装置2
で変換した画像を通信回線を介してサービス提供器3に
送るためのものである。
メラ等の画像を入力する装置であって、文書入力作業を
依頼するユーザは、この画像入力装置2を用いて紙面上
の文書等を画像に変換する。端末1は、画像入力装置2
で変換した画像を通信回線を介してサービス提供器3に
送るためのものである。
【0018】サービス提供器3は、本発明の基本的な部
分をなすものであり、ユーザの端末1から送られてきた
画像に対して領域識別処理を行い、画像を複数の領域に
分割する。また、この分割された領域に対して、文書画
像解析を行い、その結果の応じて適切な文書認識サーバ
4〜7の選択を行う。さらに、サービス提供器3は、文
書認識サーバ4〜7での認識結果を電子化データとして
受け取る。この各文書認識サーバからの認識結果を合成
して端末1に送信する。
分をなすものであり、ユーザの端末1から送られてきた
画像に対して領域識別処理を行い、画像を複数の領域に
分割する。また、この分割された領域に対して、文書画
像解析を行い、その結果の応じて適切な文書認識サーバ
4〜7の選択を行う。さらに、サービス提供器3は、文
書認識サーバ4〜7での認識結果を電子化データとして
受け取る。この各文書認識サーバからの認識結果を合成
して端末1に送信する。
【0019】文書認識サーバ4〜7は、サービス提供器
3から送られてきた画像を電子化データにするためのサ
ーバである。 (実施例1)図1に示されるシステムの基本的な動作を
以下に説明する。
3から送られてきた画像を電子化データにするためのサ
ーバである。 (実施例1)図1に示されるシステムの基本的な動作を
以下に説明する。
【0020】図1において、入力作業を依頼するユーザ
は、画像入力装置2を用いて紙上の文書を画像に変換
し、端末1を用いてサービス提供器3に、この画像を送
信する。端末1から送られてきた画像は、サービス提供
器3において、領域識別処理を用いて画像の分割を行
う。この領域識別処理方法としては多くの手法が提案さ
れているが、例えば、特開平7−334614に示され
ているような手法を用いることができる。
は、画像入力装置2を用いて紙上の文書を画像に変換
し、端末1を用いてサービス提供器3に、この画像を送
信する。端末1から送られてきた画像は、サービス提供
器3において、領域識別処理を用いて画像の分割を行
う。この領域識別処理方法としては多くの手法が提案さ
れているが、例えば、特開平7−334614に示され
ているような手法を用いることができる。
【0021】図2は、サービス提供器3で行なわれた領
域識別例を示している。図2に示されるように、領域識
別の結果、2つの文書領域1、文書領域2、1つの表領
域1、1つの写真領域1が得られたものとする。
域識別例を示している。図2に示されるように、領域識
別の結果、2つの文書領域1、文書領域2、1つの表領
域1、1つの写真領域1が得られたものとする。
【0022】次に、サービス提供器3は、この領域識別
の結果得られた画像に基づいて、文書画像解析を行う。
文書画像解析を行う前に、本発明の実施の形態で用いる
文書認識サーバ4〜7の特性例をについて図3を用いて
説明する。図3において、文書識別サーバは、図1で示
した文書管理サーバ1〜4を示している。また、文字サ
イズ特性は、文書認識サーバ4〜7の文字認識率が一定
の基準以上を達成できる文字のサイズを示している。品
質特性は、文書認識サーバ4〜7の文字認識率が一定の
基準以上を達成できる文字の品質を示している。文字の
品質を評価する方法はいくつか提案されているが、ここ
では、文字画像のかすれ、つぶれをあらわすパラメータ
として、輪郭長2/画素数(面積)を用いている。表処
理は、文書認識サーバが表を処理できるかどうかを示し
ている。
の結果得られた画像に基づいて、文書画像解析を行う。
文書画像解析を行う前に、本発明の実施の形態で用いる
文書認識サーバ4〜7の特性例をについて図3を用いて
説明する。図3において、文書識別サーバは、図1で示
した文書管理サーバ1〜4を示している。また、文字サ
イズ特性は、文書認識サーバ4〜7の文字認識率が一定
の基準以上を達成できる文字のサイズを示している。品
質特性は、文書認識サーバ4〜7の文字認識率が一定の
基準以上を達成できる文字の品質を示している。文字の
品質を評価する方法はいくつか提案されているが、ここ
では、文字画像のかすれ、つぶれをあらわすパラメータ
として、輪郭長2/画素数(面積)を用いている。表処
理は、文書認識サーバが表を処理できるかどうかを示し
ている。
【0023】次に、サービス提供器3が行う文書画像解
析について具体的に説明する。まず、サービス提供器3
は、領域識別の結果、分割したそれぞれの文書領域に対
して、画像中の連結矩形成分の数を算出する。連結成分
の数は大雑把に文字数に比例するが、日本語文書の場
合、1文字が複数の連結成分から構成される文字も多い
ので、距離の近い連結成分を統合する処理を追加するこ
とで、更に精度よく文字の大きさを推定できる。最も簡
単な方法としては、連結成分外接矩形の中心間距離があ
らかじめ定めたしきい値より小さい場合には、その連結
成分を統合する方法がある。この統合処理の結果得られ
た矩形のサイズの統計を取ることで、原稿中の文字の大
きさを推測することが出来る。本実施の形態では、この
推測値をもって、文字のサイズとする。最も簡単な方法
としては、連結成分の外接矩形の平均値を持って、文書
中の文字のサイズとする方法がある。また、文書画像中
の総輪郭長(エッジの数)と総黒画素数を求め、品質=
総輪郭長2/総黒画素数を算出する。
析について具体的に説明する。まず、サービス提供器3
は、領域識別の結果、分割したそれぞれの文書領域に対
して、画像中の連結矩形成分の数を算出する。連結成分
の数は大雑把に文字数に比例するが、日本語文書の場
合、1文字が複数の連結成分から構成される文字も多い
ので、距離の近い連結成分を統合する処理を追加するこ
とで、更に精度よく文字の大きさを推定できる。最も簡
単な方法としては、連結成分外接矩形の中心間距離があ
らかじめ定めたしきい値より小さい場合には、その連結
成分を統合する方法がある。この統合処理の結果得られ
た矩形のサイズの統計を取ることで、原稿中の文字の大
きさを推測することが出来る。本実施の形態では、この
推測値をもって、文字のサイズとする。最も簡単な方法
としては、連結成分の外接矩形の平均値を持って、文書
中の文字のサイズとする方法がある。また、文書画像中
の総輪郭長(エッジの数)と総黒画素数を求め、品質=
総輪郭長2/総黒画素数を算出する。
【0024】図4は、以上のようにしてサービス提供器
3で解析した結果を、文書画像解析結果例として示して
いる。図4に示されてように、文書領域1については、
文字サイズが30、品質が24と解析され、文書領域2
については、文字サイズが10、品質が28と解析され
たことを示している。
3で解析した結果を、文書画像解析結果例として示して
いる。図4に示されてように、文書領域1については、
文字サイズが30、品質が24と解析され、文書領域2
については、文字サイズが10、品質が28と解析され
たことを示している。
【0025】次に、サービス提供器3は、上記文書画像
解析処理の結果に基づいて、文書認識サーバの選択を行
う。まず、表領域1について、サービス提供器3による
文書認識サーバの選択について説明する。サービス提供
器3は、図3に示されるように、文書認識サーバ1〜4
の特性例から表領域1を処理できる文書認識サーバは、
文書認識サーバ3のみであると判断する。そして、サー
ビス提供器3では、文書認識サーバ3に表領域の画像を
送り、文書認識サーバ3から電子化情報を得る。
解析処理の結果に基づいて、文書認識サーバの選択を行
う。まず、表領域1について、サービス提供器3による
文書認識サーバの選択について説明する。サービス提供
器3は、図3に示されるように、文書認識サーバ1〜4
の特性例から表領域1を処理できる文書認識サーバは、
文書認識サーバ3のみであると判断する。そして、サー
ビス提供器3では、文書認識サーバ3に表領域の画像を
送り、文書認識サーバ3から電子化情報を得る。
【0026】次に、文書領域1、2について、サービス
提供器3による文書認識サーバの選択について説明す
る。文書領域1について、文書認識サーバの選択を行
う。なお、文書領域については全てのサーバで処理が可
能であるとする。サービス提供器3は、文字サイズ及び
品質に関して、その特性の範囲内にある文書認識サーバ
を選択する。文書領域1については、サービス提供器3
での文書画像解析の結果、図4に示されるように、文字
サイズが30、品質が24であると解析されている。こ
の場合、図3に示されるように、文書認識サーバ2のみ
がこの条件を満たしている。そこで、サービス提供器3
は、文書領域1の画像を文書認識サーバ2に送り、文書
認識サーバ3から電子化データを得る。文書領域2につ
いては、サービス提供器3での文書画像解析の結果、図
4に示されるように、文字サイズが10、品質が28で
あると解析されている。この場合、文字サイズ及び品質
の条件を満たすのは、図3に示されるように、文書認識
サーバ1と文書認識サーバ2である。
提供器3による文書認識サーバの選択について説明す
る。文書領域1について、文書認識サーバの選択を行
う。なお、文書領域については全てのサーバで処理が可
能であるとする。サービス提供器3は、文字サイズ及び
品質に関して、その特性の範囲内にある文書認識サーバ
を選択する。文書領域1については、サービス提供器3
での文書画像解析の結果、図4に示されるように、文字
サイズが30、品質が24であると解析されている。こ
の場合、図3に示されるように、文書認識サーバ2のみ
がこの条件を満たしている。そこで、サービス提供器3
は、文書領域1の画像を文書認識サーバ2に送り、文書
認識サーバ3から電子化データを得る。文書領域2につ
いては、サービス提供器3での文書画像解析の結果、図
4に示されるように、文字サイズが10、品質が28で
あると解析されている。この場合、文字サイズ及び品質
の条件を満たすのは、図3に示されるように、文書認識
サーバ1と文書認識サーバ2である。
【0027】ここで、既に文書認識サーバ2には、文書
領域1の画像が送られており、文書認識サーバ2に文書
領域2の画像を送付すると、文書認識サーバ2におい
て、文書全体の内容を推測することが容易となり、機密
性の保持に問題が生じる可能性が高くなる。そこで、こ
のような文書領域に対して、複数の文書認識サーバが利
用可能な場合には、まだ選択されていない文書認識サー
バの中から適当なものを選らぶするようにする。サービ
ス提供器3は、文書領域2については、文書認識サーバ
1を選択し、文書領域2の画像を文書認識サーバ1に送
り、文書認識サーバ2から電子化データを得る。
領域1の画像が送られており、文書認識サーバ2に文書
領域2の画像を送付すると、文書認識サーバ2におい
て、文書全体の内容を推測することが容易となり、機密
性の保持に問題が生じる可能性が高くなる。そこで、こ
のような文書領域に対して、複数の文書認識サーバが利
用可能な場合には、まだ選択されていない文書認識サー
バの中から適当なものを選らぶするようにする。サービ
ス提供器3は、文書領域2については、文書認識サーバ
1を選択し、文書領域2の画像を文書認識サーバ1に送
り、文書認識サーバ2から電子化データを得る。
【0028】サービス提供器3は、それぞれの文書領域
について、文書認識サーバ1〜4から電子化データが得
られたならば、それぞれの文書領域の座標等必要な情報
を付加して合成処理を行い、端末1に送付する。これに
より、サービス提供器3によって、文字の部分を異なる
複数の文書認識サーバ4〜7に送るため、各文書認識サ
ーバ4〜7では文書の内容を十分には知ることが出来な
いようにするこができ、文書の機密性を守ることができ
る。また、各分割画像毎に適当な文書認識サーバ4〜7
を用いることで、認識精度の向上も期待できる。(実施
例2)精度や機密性の向上のためには、実施例1に示し
た以外にも、以下の様な手法を用いることが出来る。
について、文書認識サーバ1〜4から電子化データが得
られたならば、それぞれの文書領域の座標等必要な情報
を付加して合成処理を行い、端末1に送付する。これに
より、サービス提供器3によって、文字の部分を異なる
複数の文書認識サーバ4〜7に送るため、各文書認識サ
ーバ4〜7では文書の内容を十分には知ることが出来な
いようにするこができ、文書の機密性を守ることができ
る。また、各分割画像毎に適当な文書認識サーバ4〜7
を用いることで、認識精度の向上も期待できる。(実施
例2)精度や機密性の向上のためには、実施例1に示し
た以外にも、以下の様な手法を用いることが出来る。
【0029】本実施例の特徴点は、サービス提供器3
が、実施例1で説明したような領域識別処理のみではな
く、行切り出し処理まで行い、各行毎に異なる文書認識
サーバを用いて電子化を行う。ここで、行切り出し処理
とは、各行毎に文書認識を行うための前処理をいう。
が、実施例1で説明したような領域識別処理のみではな
く、行切り出し処理まで行い、各行毎に異なる文書認識
サーバを用いて電子化を行う。ここで、行切り出し処理
とは、各行毎に文書認識を行うための前処理をいう。
【0030】図1、図5、図6を用いて具体的に説明す
る。なお、実施例1では、図1に示す通り、文書認識処
理を4つの文書認識サーバで行っていたが、本実施例で
は、4つの文書領域を持つ画像を5つの文書認識サーバ
で電子化する場合について説明する。まず、サービス提
供器3は、図1に示されるように、端末1から送信され
る画像の領域識別処理、行切り出し処理を行う。次に、
サービス提供器3は、領域識別処理、行切り出し処理の
結果、得られた行画像に対して文書画像解析の処理を行
う。この文書画像解析については、上述したものと同一
であるため説明を省略する。次に、サービス提供器は、
各文書領域について2つずつ文書認識サーバを選択す
る。
る。なお、実施例1では、図1に示す通り、文書認識処
理を4つの文書認識サーバで行っていたが、本実施例で
は、4つの文書領域を持つ画像を5つの文書認識サーバ
で電子化する場合について説明する。まず、サービス提
供器3は、図1に示されるように、端末1から送信され
る画像の領域識別処理、行切り出し処理を行う。次に、
サービス提供器3は、領域識別処理、行切り出し処理の
結果、得られた行画像に対して文書画像解析の処理を行
う。この文書画像解析については、上述したものと同一
であるため説明を省略する。次に、サービス提供器は、
各文書領域について2つずつ文書認識サーバを選択す
る。
【0031】図5は、サービス提供器3で行なわれた文
書認識サーバの選択結果を示している。図5に示される
ように、文書領域1〜4に対して、文書認証サーバがそ
れぞれ2つずつ選択されている。文書領域1は文書認識
サーバ1、3が、文書領域2は文書認識サーバ2、5
が、文書領域3は文書認識サーバ3、4が、文書領域4
は文書認識サーバ1、5がそれぞれ選択されたことを示
している。サービス提供器3の選択に基づいて、各文書
認識サーバ1〜5で認識処理が行なわれる。サービス提
供器3は、この認識処理の結果を電子化データとして各
サーバ1〜5から受け取り、これらの電子化データの合
成を行う。
書認識サーバの選択結果を示している。図5に示される
ように、文書領域1〜4に対して、文書認証サーバがそ
れぞれ2つずつ選択されている。文書領域1は文書認識
サーバ1、3が、文書領域2は文書認識サーバ2、5
が、文書領域3は文書認識サーバ3、4が、文書領域4
は文書認識サーバ1、5がそれぞれ選択されたことを示
している。サービス提供器3の選択に基づいて、各文書
認識サーバ1〜5で認識処理が行なわれる。サービス提
供器3は、この認識処理の結果を電子化データとして各
サーバ1〜5から受け取り、これらの電子化データの合
成を行う。
【0032】サービス提供器3での合成の方法として、
最も簡単な方法は、それぞれの文字に対して、認識結果
の確信度の高いものを選択して、認識結果を合成すると
いう方法がある。例えば、図5に示される文書領域1に
ついては、文書認識サーバ1と文書認識サーバ3とで認
識結果の確信度が高いものを選択して、認識結果のよい
ものを最終的な認識結果とすることができる。
最も簡単な方法は、それぞれの文字に対して、認識結果
の確信度の高いものを選択して、認識結果を合成すると
いう方法がある。例えば、図5に示される文書領域1に
ついては、文書認識サーバ1と文書認識サーバ3とで認
識結果の確信度が高いものを選択して、認識結果のよい
ものを最終的な認識結果とすることができる。
【0033】図6は、文書領域1についてのサービス提
供器3での認識結果の選択例を示している。図6におい
て、一番上に文書認識サーバ1の結果を示しており、そ
の下に文書認識サーバ1の確信度を示している。次に、
文書認識サーバ3の結果を示しており、その下に、文書
認識サーバ3の確信度を示している。最後はサービス提
供器3での選択結果を示している。図6に示すように、
文書認識サーバ1の結果「宿」は確信度88を示してお
り、文書認識サーバ3の結果「阿」は確信度58を示し
ている。その結果、文書認識サーバ1の確信度の方が高
いため、文書認識サーバ1の結果である「宿」が選択さ
れる。
供器3での認識結果の選択例を示している。図6におい
て、一番上に文書認識サーバ1の結果を示しており、そ
の下に文書認識サーバ1の確信度を示している。次に、
文書認識サーバ3の結果を示しており、その下に、文書
認識サーバ3の確信度を示している。最後はサービス提
供器3での選択結果を示している。図6に示すように、
文書認識サーバ1の結果「宿」は確信度88を示してお
り、文書認識サーバ3の結果「阿」は確信度58を示し
ている。その結果、文書認識サーバ1の確信度の方が高
いため、文書認識サーバ1の結果である「宿」が選択さ
れる。
【0034】実施例2では、1つの文書領域(同じ文書
領域)を複数の文書認識サーバに送り、得られた電子化
データを適宜合成してつなぎ合わせ、これを端末1に送
付することとしているので、認識精度の更なる向上を図
ることができる。
領域)を複数の文書認識サーバに送り、得られた電子化
データを適宜合成してつなぎ合わせ、これを端末1に送
付することとしているので、認識精度の更なる向上を図
ることができる。
【0035】以上本発明の好ましい実施例について詳述
したが、本発明は係る特定の実施形態に限定されるもの
ではなく、特許請求の範囲に記載された本発明の要旨の
範囲内において、種々の変形・変更が可能である
したが、本発明は係る特定の実施形態に限定されるもの
ではなく、特許請求の範囲に記載された本発明の要旨の
範囲内において、種々の変形・変更が可能である
【発明の効果】請求項1乃至5記載の発明によれば、画
像の内容に応じて適切な文書認識サーバに認識処理を行
わせることで、紙文書の電子化業務における認識性能を
向上させることができる。また、分割された画像を複数
の文書認識サーバに認識処理を行わせることで、複数の
文書における機密を保持した安全な文書入力代行を提供
することができる。
像の内容に応じて適切な文書認識サーバに認識処理を行
わせることで、紙文書の電子化業務における認識性能を
向上させることができる。また、分割された画像を複数
の文書認識サーバに認識処理を行わせることで、複数の
文書における機密を保持した安全な文書入力代行を提供
することができる。
【図1】本実施の形態に係るシステム構成の一例を示し
た図である。
た図である。
【図2】サービス提供器で行なわれる領域識別の例を示
した図である。
した図である。
【図3】本実施の形態で用いる文書認識サーバの特性例
を示した図である。
を示した図である。
【図4】サービス提供器で行なわれる文書画像解析の結
果例を示した図である。
果例を示した図である。
【図5】サービス提供器で行なわれた文書認識サーバの
選択結果を示した図である。
選択結果を示した図である。
【図6】サービス提供器での認識結果の選択例を示した
図である。
図である。
1 端末 2 画像入力装置 3 サービス提供器 4,5,6,7 文書認識サーバ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鈴木 俊博 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 大黒 慶久 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 宮澤 利夫 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 井上 浩一 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 内山 幸央 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 Fターム(参考) 5B064 AA01 BA01 CA08 DA10 EA39 FA18
Claims (5)
- 【請求項1】 通信回線を介して接続された利用者端末
より供給された画像を領域識別手段により複数の画像に
分割し、分割された該分割画像を画像解析手段により解
析し、解析された該解析画像に基づいてサーバ選択手段
により複数の文書認識サーバの中から適切な文書認識サ
ーバを選択し、前記分割画像をサーバ送信手段により選
択された該文書認識サーバにそれそれ送信し、該各文書
認識サーバから得られた複数の電子化データを合成手段
により合成し、合成された該電子化データを前記利用者
端末に送信することを特徴とする文書入力代行方法。 - 【請求項2】 請求項1記載の文書入力代行方法におい
て、前記画像解析手段が画像中の文字サイズを解析する
ことを特徴とする文書入力代行方法。 - 【請求項3】 請求項2記載の文書入力代行方法におい
て、前記画像解析手段が画像の品質を解析することを特
徴とする文書入力代行方法。 - 【請求項4】 請求項1乃至3記載の文書入力代行方法
を実行させるプログラムが記憶されたコンピュータ読み
取り可能な記憶媒体。 - 【請求項5】 通信回線に接続された利用者端末と、該
利用者端末と通信回線を介して接続され、該利用者端末
より供給された画像を複数の画像に分割する領域識別手
段と分割された該画像を解析する画像解析手段とを備え
るサービス提供器と、該サービス提供器と通信回線を介
して接続され、該画像解析手段により解析された画像を
認識する複数の文書認識サーバとから構成されることを
特徴とする文書入力代行システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001064016A JP2002269497A (ja) | 2001-03-07 | 2001-03-07 | 文書入力代行方法、文書入力代行システム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001064016A JP2002269497A (ja) | 2001-03-07 | 2001-03-07 | 文書入力代行方法、文書入力代行システム及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002269497A true JP2002269497A (ja) | 2002-09-20 |
Family
ID=18922911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001064016A Withdrawn JP2002269497A (ja) | 2001-03-07 | 2001-03-07 | 文書入力代行方法、文書入力代行システム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002269497A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005352692A (ja) * | 2004-06-09 | 2005-12-22 | Canon Inc | 画像処理システム及び画像処理方法 |
JP2006172284A (ja) * | 2004-12-17 | 2006-06-29 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
JP2007026027A (ja) * | 2005-07-15 | 2007-02-01 | Fujitsu Ltd | 文字認識プログラム、文字認識装置及び文字認識方法 |
JP2015201077A (ja) * | 2014-04-09 | 2015-11-12 | コニカミノルタ株式会社 | 画像処理装置、画像処理方法、および画像処理プログラム |
JP2016071892A (ja) * | 2014-09-30 | 2016-05-09 | キヤノンマーケティングジャパン株式会社 | 帳票システムと、その処理方法及びプログラム |
-
2001
- 2001-03-07 JP JP2001064016A patent/JP2002269497A/ja not_active Withdrawn
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005352692A (ja) * | 2004-06-09 | 2005-12-22 | Canon Inc | 画像処理システム及び画像処理方法 |
JP4717380B2 (ja) * | 2004-06-09 | 2011-07-06 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム、その画像処理装置を含む画像処理システム |
JP2006172284A (ja) * | 2004-12-17 | 2006-06-29 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
JP4681870B2 (ja) * | 2004-12-17 | 2011-05-11 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP2007026027A (ja) * | 2005-07-15 | 2007-02-01 | Fujitsu Ltd | 文字認識プログラム、文字認識装置及び文字認識方法 |
JP2015201077A (ja) * | 2014-04-09 | 2015-11-12 | コニカミノルタ株式会社 | 画像処理装置、画像処理方法、および画像処理プログラム |
JP2016071892A (ja) * | 2014-09-30 | 2016-05-09 | キヤノンマーケティングジャパン株式会社 | 帳票システムと、その処理方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10104204B1 (en) | Image registration system | |
US7952775B2 (en) | Gray scale image cleaning system and method | |
US8055900B2 (en) | Information processing apparatus, information processing system, information processing method, storage medium and program | |
US5907835A (en) | Electronic filing system using different application program for processing drawing commands for printing | |
JP3345350B2 (ja) | 文書画像認識装置、その方法、及び記録媒体 | |
US8107670B2 (en) | Scanning images for pornography | |
US20060168659A1 (en) | Security information estimating apparatus, a security information estimating method, a security information estimating program, and a recording medium thereof | |
JP2004320701A (ja) | 画像処理装置、画像処理プログラムおよび記憶媒体 | |
JP4791776B2 (ja) | セキュリティ情報推定装置、セキュリティ情報推定方法、セキュリティ情報推定プログラム及び記録媒体 | |
JP4350778B2 (ja) | 画像処理装置、画像処理プログラムおよび記録媒体 | |
US7848572B2 (en) | Image processing apparatus, image processing method, computer program | |
US7339691B2 (en) | Systems and methods for providing content filtering of a print job | |
US7426054B1 (en) | Image processing apparatus, image reproduction apparatus, system, method and storage medium for image processing and image reproduction | |
US7120670B2 (en) | Data communication device, data communication method and data communication program that can send reply to blind carbon copy recipients and computer-readable recording medium storing said program | |
US7139428B2 (en) | Image encoder, image encoding method, recording medium and computer data signal embodied in a carrier wave | |
KR20050012184A (ko) | 전자 메일 서버 | |
JP2002269497A (ja) | 文書入力代行方法、文書入力代行システム及び記録媒体 | |
EP2141612A1 (en) | Method and system for content classification | |
JP6892625B2 (ja) | データ処理装置、および、コンピュータプログラム | |
US8284459B2 (en) | Image processing apparatus and image processing method | |
JP2008123245A (ja) | 画像処理装置及び画像処理プログラム | |
JP2004153298A (ja) | 画像処理装置、画像処理プログラムおよび記憶媒体 | |
JP4411244B2 (ja) | 画像処理装置、画像処理方法、プログラム | |
JP4169674B2 (ja) | 画像処理装置、画像処理プログラムおよび記憶媒体 | |
JP2007280105A (ja) | アップロード要求装置、アップロード要求方法およびアップロード要求プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050916 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20080218 |