JP2002269497A

JP2002269497A - 文書入力代行方法、文書入力代行システム及び記録媒体

Info

Publication number: JP2002269497A
Application number: JP2001064016A
Authority: JP
Inventors: Hideaki Yamagata; 秀明山形; Junichi Hara; 潤一原; Toshihiro Suzuki; 俊博鈴木; Yoshihisa Oguro; 慶久大黒; Toshio Miyazawa; 利夫宮澤; Koichi Inoue; 浩一井上; Yukihisa Uchiyama; 幸央内山
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2001-03-07
Filing date: 2001-03-07
Publication date: 2002-09-20

Abstract

(57)【要約】【課題】本発明は、紙文書の電子化業務における認識
性能を向上させるとともに、文書における機密を保持し
た安全な文書入力代行を提供する。【解決手段】本発明の文書入力システムは、利用者端
末１と、利用者端末１と通信回線を介して接続され、利
用者端末１より供給された画像を複数の画像に分割する
領域識別手段と分割された画像を解析する画像解析手段
とを備えるサービス提供器３と、サービス提供器３で解
析された画像を認識する複数の文書認識サーバ４〜７と
から構成されている。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、文書等を認識する
方法に関し、特に複数の文書認識サーバを用いた文書入
力代行方法に関する。

【０００２】

【従来の技術】従来、文字領域や図表領域等の属性の異
なる情報領域が混在した文書等の文字認識を行う文字認
識装置（ＯＣＲ）が提案されている。

【０００３】また、複数の文書認識サーバを用いる従来
の例として、複数の文字認識エンジンを用いる方法が提
案されている（特開平７−２８９４６号公報）。この特
開平７−２８９４６号公報に示される技術は、認識した
文章を各領域に識別した後に認識対象領域毎に異なる認
識演算手段を用いることで、処理の高速化を図るもので
ある。また、ネットワークを介して文書の入力を行うシ
ステムとして、オフィスや出張先等で自由に利用できる
情報処理装置が提案されている（特開２０００−１７２
４２８号公報）。

【０００４】

【発明が解決しようとする課題】しかしながら、特開平
７−２８９４６号公報に示されているように、複数の文
字認識エンジンを用いる手法は、処理の高速化を主眼と
したものであり、同じ文字認識エンジンを複数用意して
処理を行っているため、認識性能の向上を図ることがで
きないという問題がある。また、特開２０００−１７２
４２８号公報に記載されている情報処理装置は、ネット
ワークを介してアクセスするものであるが、単一あるい
は同じ性能を持ったサーバを用いたものであるであるた
め、認識精度の向上を図ることはできないという問題も
ある。

【０００５】また、複数の文字認識サーバを利用して紙
文書の電子化業務を行う場合、文字認識サーバは外部の
異なる会社、団体が運営していることもあるため、画像
データを各画像毎に文字認識サーバに振り分けると、各
文字認識サーバ上で画像（文書）の内容が閲覧されてし
まい、電子化業務における内容の機密保持が困難となる
という問題がある。また、複数の文字認識サーバを利用
する場合、文字の認識に関して、文字認識サーバ毎に得
手、不得手があるという問題もある。

【０００６】さらに、特開平成７−２８９４６号公報の
ような文書認識装置は提案されているものの、ネットワ
ークを介して複数の文書認識サーバを用いて文書の入力
を行う方法に関する従来技術は見当たらない。また、文
書入力代行システムとしての提案もはなされていない。

【０００７】本発明はこのような問題点に鑑みなされた
もので、紙文書の電子化業務における認識性能を向上さ
せるとともに、文書における機密を保持した安全な文書
入力代行を提供する。

【０００８】

【課題を解決するための手段】上記課題は、以下の本発
明の手段により解決される。

【０００９】請求項１記載の発明の文書入力代行方法
は、通信回線を介して接続された利用者端末より供給さ
れた画像を領域識別手段により複数の画像に分割し、分
割された該分割画像を画像解析手段により解析し、解析
された該解析画像に基づいてサーバ選択手段により複数
の文書認識サーバの中から適切な文書認識サーバを選択
し、前記分割画像をサーバ送信手段により選択された該
文書認識サーバにそれそれ送信し、該各文書認識サーバ
から得られた複数の電子化データを合成手段により合成
し、合成された該電子化データを前記利用者端末に送信
することを特徴とするものである。

【００１０】請求項２記載の発明の文書入力代行方法
は、請求項１記載の文書入力代行方法において、前記画
像解析手段が画像中の文字サイズを解析することを特徴
とするものである。

【００１１】請求項３記載の発明の文書入力代行方法
は、請求項２記載の文書入力代行方法において、前記画
像解析手段が画像の品質を解析することを特徴とするも
のである。

【００１２】請求項４記載の発明は、請求項１乃至３記
載の文書入力代行方法を実行させるプログラムが記憶さ
れたコンピュータ読み取り可能な記憶媒体である。

【００１３】請求項５記載の発明の文書入力代行システ
ムは、通信回線に接続された利用者端末と、該利用者端
末と通信回線を介して接続され、該利用者端末より供給
された画像を複数の画像に分割する領域識別手段と分割
された該画像を解析する画像解析手段とを備えるサービ
ス提供器と、該サービス提供器と通信回線を介して接続
され、該画像解析手段により解析された画像を認識する
複数の文書認識サーバとから構成されることを特徴とす
るものである。

【００１４】上記請求項１乃至５の発明によれば、画像
の内容に応じて適切なサーバに認識処理を行わせること
で、認識性能の向上を図るとともに、文書における機密
を保持した安全な文書入力代行を提供することができ
る。

【００１５】

【発明の実施の形態】以下、本発明の実施の形態を図面
に基づいて具体的に説明する。

【００１６】図１は、本発明を実施するためのシステム
構成の一例を示している。図１に示されるように、本シ
ステムは、端末１、画像入力装置２、サービス提供器
３、文書認識サーバ４、文書認識サーバ５、文書認識サ
ーバ６、文書認識サーバ７によって構成されている。

【００１７】画像入力装置２は、スキャナやデジタルカ
メラ等の画像を入力する装置であって、文書入力作業を
依頼するユーザは、この画像入力装置２を用いて紙面上
の文書等を画像に変換する。端末１は、画像入力装置２
で変換した画像を通信回線を介してサービス提供器３に
送るためのものである。

【００１８】サービス提供器３は、本発明の基本的な部
分をなすものであり、ユーザの端末１から送られてきた
画像に対して領域識別処理を行い、画像を複数の領域に
分割する。また、この分割された領域に対して、文書画
像解析を行い、その結果の応じて適切な文書認識サーバ
４〜７の選択を行う。さらに、サービス提供器３は、文
書認識サーバ４〜７での認識結果を電子化データとして
受け取る。この各文書認識サーバからの認識結果を合成
して端末１に送信する。

【００１９】文書認識サーバ４〜７は、サービス提供器
３から送られてきた画像を電子化データにするためのサ
ーバである。（実施例１）図１に示されるシステムの基本的な動作を
以下に説明する。

【００２０】図１において、入力作業を依頼するユーザ
は、画像入力装置２を用いて紙上の文書を画像に変換
し、端末１を用いてサービス提供器３に、この画像を送
信する。端末１から送られてきた画像は、サービス提供
器３において、領域識別処理を用いて画像の分割を行
う。この領域識別処理方法としては多くの手法が提案さ
れているが、例えば、特開平７−３３４６１４に示され
ているような手法を用いることができる。

【００２１】図２は、サービス提供器３で行なわれた領
域識別例を示している。図２に示されるように、領域識
別の結果、２つの文書領域１、文書領域２、１つの表領
域１、１つの写真領域１が得られたものとする。

【００２２】次に、サービス提供器３は、この領域識別
の結果得られた画像に基づいて、文書画像解析を行う。
文書画像解析を行う前に、本発明の実施の形態で用いる
文書認識サーバ４〜７の特性例をについて図３を用いて
説明する。図３において、文書識別サーバは、図１で示
した文書管理サーバ１〜４を示している。また、文字サ
イズ特性は、文書認識サーバ４〜７の文字認識率が一定
の基準以上を達成できる文字のサイズを示している。品
質特性は、文書認識サーバ４〜７の文字認識率が一定の
基準以上を達成できる文字の品質を示している。文字の
品質を評価する方法はいくつか提案されているが、ここ
では、文字画像のかすれ、つぶれをあらわすパラメータ
として、輪郭長^２／画素数（面積）を用いている。表処
理は、文書認識サーバが表を処理できるかどうかを示し
ている。

【００２３】次に、サービス提供器３が行う文書画像解
析について具体的に説明する。まず、サービス提供器３
は、領域識別の結果、分割したそれぞれの文書領域に対
して、画像中の連結矩形成分の数を算出する。連結成分
の数は大雑把に文字数に比例するが、日本語文書の場
合、１文字が複数の連結成分から構成される文字も多い
ので、距離の近い連結成分を統合する処理を追加するこ
とで、更に精度よく文字の大きさを推定できる。最も簡
単な方法としては、連結成分外接矩形の中心間距離があ
らかじめ定めたしきい値より小さい場合には、その連結
成分を統合する方法がある。この統合処理の結果得られ
た矩形のサイズの統計を取ることで、原稿中の文字の大
きさを推測することが出来る。本実施の形態では、この
推測値をもって、文字のサイズとする。最も簡単な方法
としては、連結成分の外接矩形の平均値を持って、文書
中の文字のサイズとする方法がある。また、文書画像中
の総輪郭長（エッジの数）と総黒画素数を求め、品質＝
総輪郭長^２／総黒画素数を算出する。

【００２４】図４は、以上のようにしてサービス提供器
３で解析した結果を、文書画像解析結果例として示して
いる。図４に示されてように、文書領域１については、
文字サイズが３０、品質が２４と解析され、文書領域２
については、文字サイズが１０、品質が２８と解析され
たことを示している。

【００２５】次に、サービス提供器３は、上記文書画像
解析処理の結果に基づいて、文書認識サーバの選択を行
う。まず、表領域１について、サービス提供器３による
文書認識サーバの選択について説明する。サービス提供
器３は、図３に示されるように、文書認識サーバ１〜４
の特性例から表領域１を処理できる文書認識サーバは、
文書認識サーバ３のみであると判断する。そして、サー
ビス提供器３では、文書認識サーバ３に表領域の画像を
送り、文書認識サーバ３から電子化情報を得る。

【００２６】次に、文書領域１、２について、サービス
提供器３による文書認識サーバの選択について説明す
る。文書領域１について、文書認識サーバの選択を行
う。なお、文書領域については全てのサーバで処理が可
能であるとする。サービス提供器３は、文字サイズ及び
品質に関して、その特性の範囲内にある文書認識サーバ
を選択する。文書領域１については、サービス提供器３
での文書画像解析の結果、図４に示されるように、文字
サイズが３０、品質が２４であると解析されている。こ
の場合、図３に示されるように、文書認識サーバ２のみ
がこの条件を満たしている。そこで、サービス提供器３
は、文書領域１の画像を文書認識サーバ２に送り、文書
認識サーバ３から電子化データを得る。文書領域２につ
いては、サービス提供器３での文書画像解析の結果、図
４に示されるように、文字サイズが１０、品質が２８で
あると解析されている。この場合、文字サイズ及び品質
の条件を満たすのは、図３に示されるように、文書認識
サーバ１と文書認識サーバ２である。

【００２７】ここで、既に文書認識サーバ２には、文書
領域１の画像が送られており、文書認識サーバ２に文書
領域２の画像を送付すると、文書認識サーバ２におい
て、文書全体の内容を推測することが容易となり、機密
性の保持に問題が生じる可能性が高くなる。そこで、こ
のような文書領域に対して、複数の文書認識サーバが利
用可能な場合には、まだ選択されていない文書認識サー
バの中から適当なものを選らぶするようにする。サービ
ス提供器３は、文書領域２については、文書認識サーバ
１を選択し、文書領域２の画像を文書認識サーバ１に送
り、文書認識サーバ２から電子化データを得る。

【００２８】サービス提供器３は、それぞれの文書領域
について、文書認識サーバ１〜４から電子化データが得
られたならば、それぞれの文書領域の座標等必要な情報
を付加して合成処理を行い、端末１に送付する。これに
より、サービス提供器３によって、文字の部分を異なる
複数の文書認識サーバ４〜７に送るため、各文書認識サ
ーバ４〜７では文書の内容を十分には知ることが出来な
いようにするこができ、文書の機密性を守ることができ
る。また、各分割画像毎に適当な文書認識サーバ４〜７
を用いることで、認識精度の向上も期待できる。（実施
例２）精度や機密性の向上のためには、実施例１に示し
た以外にも、以下の様な手法を用いることが出来る。

【００２９】本実施例の特徴点は、サービス提供器３
が、実施例１で説明したような領域識別処理のみではな
く、行切り出し処理まで行い、各行毎に異なる文書認識
サーバを用いて電子化を行う。ここで、行切り出し処理
とは、各行毎に文書認識を行うための前処理をいう。

【００３０】図１、図５、図６を用いて具体的に説明す
る。なお、実施例１では、図１に示す通り、文書認識処
理を４つの文書認識サーバで行っていたが、本実施例で
は、４つの文書領域を持つ画像を５つの文書認識サーバ
で電子化する場合について説明する。まず、サービス提
供器３は、図１に示されるように、端末１から送信され
る画像の領域識別処理、行切り出し処理を行う。次に、
サービス提供器３は、領域識別処理、行切り出し処理の
結果、得られた行画像に対して文書画像解析の処理を行
う。この文書画像解析については、上述したものと同一
であるため説明を省略する。次に、サービス提供器は、
各文書領域について２つずつ文書認識サーバを選択す
る。

【００３１】図５は、サービス提供器３で行なわれた文
書認識サーバの選択結果を示している。図５に示される
ように、文書領域１〜４に対して、文書認証サーバがそ
れぞれ２つずつ選択されている。文書領域１は文書認識
サーバ１、３が、文書領域２は文書認識サーバ２、５
が、文書領域３は文書認識サーバ３、４が、文書領域４
は文書認識サーバ１、５がそれぞれ選択されたことを示
している。サービス提供器３の選択に基づいて、各文書
認識サーバ１〜５で認識処理が行なわれる。サービス提
供器３は、この認識処理の結果を電子化データとして各
サーバ１〜５から受け取り、これらの電子化データの合
成を行う。

【００３２】サービス提供器３での合成の方法として、
最も簡単な方法は、それぞれの文字に対して、認識結果
の確信度の高いものを選択して、認識結果を合成すると
いう方法がある。例えば、図５に示される文書領域１に
ついては、文書認識サーバ１と文書認識サーバ３とで認
識結果の確信度が高いものを選択して、認識結果のよい
ものを最終的な認識結果とすることができる。

【００３３】図６は、文書領域１についてのサービス提
供器３での認識結果の選択例を示している。図６におい
て、一番上に文書認識サーバ１の結果を示しており、そ
の下に文書認識サーバ１の確信度を示している。次に、
文書認識サーバ３の結果を示しており、その下に、文書
認識サーバ３の確信度を示している。最後はサービス提
供器３での選択結果を示している。図６に示すように、
文書認識サーバ１の結果「宿」は確信度８８を示してお
り、文書認識サーバ３の結果「阿」は確信度５８を示し
ている。その結果、文書認識サーバ１の確信度の方が高
いため、文書認識サーバ１の結果である「宿」が選択さ
れる。

【００３４】実施例２では、１つの文書領域（同じ文書
領域）を複数の文書認識サーバに送り、得られた電子化
データを適宜合成してつなぎ合わせ、これを端末１に送
付することとしているので、認識精度の更なる向上を図
ることができる。

【００３５】以上本発明の好ましい実施例について詳述
したが、本発明は係る特定の実施形態に限定されるもの
ではなく、特許請求の範囲に記載された本発明の要旨の
範囲内において、種々の変形・変更が可能である

【発明の効果】請求項１乃至５記載の発明によれば、画
像の内容に応じて適切な文書認識サーバに認識処理を行
わせることで、紙文書の電子化業務における認識性能を
向上させることができる。また、分割された画像を複数
の文書認識サーバに認識処理を行わせることで、複数の
文書における機密を保持した安全な文書入力代行を提供
することができる。

【図面の簡単な説明】

【図１】本実施の形態に係るシステム構成の一例を示し
た図である。

【図２】サービス提供器で行なわれる領域識別の例を示
した図である。

【図３】本実施の形態で用いる文書認識サーバの特性例
を示した図である。

【図４】サービス提供器で行なわれる文書画像解析の結
果例を示した図である。

【図５】サービス提供器で行なわれた文書認識サーバの
選択結果を示した図である。

【図６】サービス提供器での認識結果の選択例を示した
図である。

【符号の説明】

１端末２画像入力装置３サービス提供器４，５，６，７文書認識サーバ

───────────────────────────────────────────────────── フロントページの続き (72)発明者鈴木俊博東京都大田区中馬込１丁目３番６号株式会社リコー内 (72)発明者大黒慶久東京都大田区中馬込１丁目３番６号株式会社リコー内 (72)発明者宮澤利夫東京都大田区中馬込１丁目３番６号株式会社リコー内 (72)発明者井上浩一東京都大田区中馬込１丁目３番６号株式会社リコー内 (72)発明者内山幸央東京都大田区中馬込１丁目３番６号株式会社リコー内Ｆターム(参考） 5B064 AA01 BA01 CA08 DA10 EA39 FA18

Claims

【特許請求の範囲】

【請求項１】通信回線を介して接続された利用者端末
より供給された画像を領域識別手段により複数の画像に
分割し、分割された該分割画像を画像解析手段により解
析し、解析された該解析画像に基づいてサーバ選択手段
により複数の文書認識サーバの中から適切な文書認識サ
ーバを選択し、前記分割画像をサーバ送信手段により選
択された該文書認識サーバにそれそれ送信し、該各文書
認識サーバから得られた複数の電子化データを合成手段
により合成し、合成された該電子化データを前記利用者
端末に送信することを特徴とする文書入力代行方法。
【請求項２】請求項１記載の文書入力代行方法におい
て、前記画像解析手段が画像中の文字サイズを解析する
ことを特徴とする文書入力代行方法。
【請求項３】請求項２記載の文書入力代行方法におい
て、前記画像解析手段が画像の品質を解析することを特
徴とする文書入力代行方法。
【請求項４】請求項１乃至３記載の文書入力代行方法
を実行させるプログラムが記憶されたコンピュータ読み
取り可能な記憶媒体。
【請求項５】通信回線に接続された利用者端末と、該
利用者端末と通信回線を介して接続され、該利用者端末
より供給された画像を複数の画像に分割する領域識別手
段と分割された該画像を解析する画像解析手段とを備え
るサービス提供器と、該サービス提供器と通信回線を介
して接続され、該画像解析手段により解析された画像を
認識する複数の文書認識サーバとから構成されることを
特徴とする文書入力代行システム。