JP2003006315A - 情報入力支援サービスシステム - Google Patents

情報入力支援サービスシステム

Info

Publication number
JP2003006315A
JP2003006315A JP2001187447A JP2001187447A JP2003006315A JP 2003006315 A JP2003006315 A JP 2003006315A JP 2001187447 A JP2001187447 A JP 2001187447A JP 2001187447 A JP2001187447 A JP 2001187447A JP 2003006315 A JP2003006315 A JP 2003006315A
Authority
JP
Japan
Prior art keywords
information input
server
user
service system
input support
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001187447A
Other languages
English (en)
Inventor
Koichi Inoue
浩一 井上
Toshihiro Suzuki
俊博 鈴木
Yoshihisa Oguro
慶久 大黒
Toshio Miyazawa
利夫 宮澤
Hideaki Yamagata
秀明 山形
Yukihisa Uchiyama
幸央 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001187447A priority Critical patent/JP2003006315A/ja
Publication of JP2003006315A publication Critical patent/JP2003006315A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 文書情報を文字認識処理によって電子化する
際、認識結果の修正品質を維持しつつ安価に利用できる
情報入力支援サービスシステムを提供する。 【解決手段】 この情報入力支援サービスシステムは、
利用者端末と、サービス提供者の運営するサーバと、そ
のサービスの協力者端末とをネットワークを介して接続
している。利用者が文字認識結果情報とそのもととなる
画像データとを用意し、利用者端末からこれらをサービ
ス提供者のサーバへ送信する。サービス提供者のサーバ
は、利用者から送信されたデータを受信し、画像を文字
単位に分割し、この分割された画像とそれに対する文字
認識結果情報とを多数の協力者へ配分し、その協力者端
末へ送信する。協力者は配信された画像とその文字認識
結果情報とから判断した文字認識結果の修正を返信し、
サービス提供者のサーバで、返信された修正結果を集計
し、利用者へ報告する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報入力支援サー
ビスシステムに関し、詳細にはインターネットを利用し
て文書の文字認識結果を修正するサービスシステムに関
する。
【0002】
【従来の技術】今日のインターネット・アクセスの一般
化はめざましく、コンピュータのみならず携帯電話やP
DA(personal digital assistants)等の小型で安価
な端末装置からも情報の参照・発信が可能となった。こ
れにより、従来とは比較にならない多数のユーザがイン
ターネットに接続され、地域を越えて巨大なコミュニテ
ィを形成しつつある。
【0003】産業のあり方も変化しつつある。インター
ネットを経由するwebや電子メールを利用した広告は
多数のユーザに同時に、あるいはその広告に興味を持ち
そうなユーザに選択的に広告効果を与えることができ、
しかも費用的にも有利である。また、会社や組織の壁を
越えてネットワーク経由でサービスを提供するASP事
業も広がりを見せている。
【0004】このように見てくると、インターネットに
接続される人口の増加を隠れた労働力の増加と見ること
もできる。したがって、小さな対価と引き替えに小さな
労働力の提供を求めることは比較的容易であり、その結
果を容易に合成できるならば大きな効果を得ることがで
きるにちがいない。
【0005】
【発明が解決しようとする課題】一方、活字・手書き文
書に対する光学式文字読みとり(OCR)技術は長年の
開発を経てほぼ成熟してきている。例えば、このOCR
技術には、手書きまたは印刷された文書を電子化すると
きに画像を小領域に分割して入力する方法は以前から提
案されている(例えば、特開平11−282612号公
報の発明「情報入力方法及びシステム」を参照)。
【0006】しかし、紙文書を入力として端末側で文字
入力あるいは文字認識をするOCR処理して電子文書を
得ようとすると、この認識結果が未だ100%の認識率
とはならないため、必ず人手によって修正が必要となっ
てくる。この作業を上述したようなインターネットに接
続された労働力を活用して、OCR処理結果の修正を行
うようにすることが考えられる。しかしながら、これま
でOCR処理システムの結果を1人に修正依頼すると、
以下のような、不都合が生じてしまう。 ・修正作業は、文書を通読することになるため時間と労
力がかかる。 ・そのため修正作業の費用が多大となる。 ・対象とする文書が個人情報や企業秘密を含む場合に
は、プライバシーの観点から、依頼者と作業遂行者の間
には機密保持などの特約が必要となる。 これらの要因により、通常のOCR利用で気軽に修正を
依頼することはできなくなる。
【0007】本発明は、上記の問題点を解決するため
に、文書情報を文字認識処理によって電子化する際、ネ
ットワークを介して文字認識処理結果の修正依頼・修正
作業の分配・修正結果の集計・依頼者への返信までの管
理と、この作業に携わった人への対価または課金を管理
することによって、認識結果の修正品質を維持しつつ安
価に利用できる情報入力支援サービスシステムを提供す
ることを目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、本発明の請求項1の情報入力支援サービスシステム
は、利用者端末と、サービス提供者の運営するサーバ
と、そのサービスの協力者端末とをネットワークを介し
て接続した情報入力支援サービスシステムであって、前
記利用者端末は、利用者が文字認識結果情報とそのもと
となる画像データとを用意し、これらを前記サービス提
供者のサーバへ送信する、前記サービス提供者のサーバ
は、前記利用者から送信されたデータを前記ネットワー
クを介して受信し、画像を文字単位に分割し、この分割
された画像とそれに対する文字認識結果情報とを多数の
前記協力者へ配分し、その協力者端末へ送信する、前記
協力者端末は、配信された画像とその文字認識結果情報
とから判断した文字認識結果の修正を返信するように
し、前記サービス提供者のサーバは、協力者から返信さ
れた修正結果を集計し、前記利用者端末へ報告すること
を特徴とする。したがって、対象とする文書が個人情報
や企業秘密を含む場合であっても、その文書の分割単位
が小さいので、プライバシーや機密が漏れることがない
ので、本サービスの利用者と本サービスの提供者側との
間に機密保持などの特約が必要とならない。また、文字
認識結果の修正依頼をネットワークを通じて多数の協力
者に配信するため、協力者あたりの1回の労力を小さく
押さえることができる。
【0009】また、本発明の請求項2は、請求項1に記
載の情報入力支援サービスシステムにおいて、前記サー
ビス提供者のサーバは、前記画像を分割する際、文字認
識の確信度が低い場合には連続して近接する文字画像と
して分割することを特徴とする。したがって、判読が1
文字では困難と考えられるものであっても、周辺の画像
を見ることにより、その文字を容易に判読できるように
なり、正解を得易くなる。
【0010】また、本発明の請求項3は、請求項1また
は2に記載の情報入力支援サービスシステムにおいて、
前記サービス提供者のサーバは、協力者から返信が得ら
れないか、もしくは修正結果の確定ができなかった文字
の修正結果として、前記利用者端末から受信した文書画
像の他の部分で同じパターンの文字があれば、その同一
の文字に対する修正結果を用いることを特徴とする。し
たがって、文書内のすべての文字についての修正結果が
集まらない場合でも結果を確定することが可能となる。
【0011】また、本発明の請求項4は、請求項1、2
または3に記載の情報入力支援サービスシステムにおい
て、前記サービス提供者のサーバは、前記利用者端末か
ら受信した文書の属する分野を明示されたとき、その指
定された分野に適合する知識分野を持つ協力者に優先的
に分配することを特徴とする。したがって、分野が指定
された場合は同じ知識分野に登録されている協力者に優
先的に配信することで、誤りの修正がより正確に行われ
るようになる。
【0012】また、本発明の請求項5は、請求項1、
2、3または4に記載の情報入力支援サービスシステム
において、前記利用者は、報告された修正結果に対して
評価をフィードバックすることを特徴とする。したがっ
て、利用者は、修正後の認識結果に対する評価を0〜1
00点程度の点数としてサービス提供者にフィードバッ
クし、この点数を協力者のランク付けに利用することに
より、協力者のモチベーションをはかり、それによりサ
ービスの質を維持することができる。
【0013】また、本発明の請求項6は、請求項5記載
の情報入力支援サービスシステムにおいて、前記サービ
ス提供者のサーバは、協力者の修正の速さ、修正の正確
さ、利用者からの評価からこの協力者へのランクを決定
し、このランクから協力者への対価を決定することを特
徴とする。したがって、協力者の協力度に合わせて報酬
が支払われることにより、協力者のモチベーションを維
持することができる。
【0014】また、本発明の請求項7は、請求項6記載
の情報入力支援サービスシステムにおいて、前記サービ
ス提供者のサーバは、高いランクを持つ協力者の割合が
異なる複数のグループを構成し、これらのグループに占
める高いランクの協力者の割合に応じて利用者への料金
を見積もることを特徴とする。したがって、発注段階で
修正見積額をグループごとに示されるので、利用者は求
める正確さと料金に応じて品質を選べる。
【0015】また、本発明の請求項8は、請求項1乃至
7のいずれか1に記載の情報入力支援サービスシステム
において、前記協力者端末への分配に携帯電話メールを
用いて配信することを特徴とする。したがって、協力者
は場所と時間を選ばずに修正することができる。
【0016】また、本発明の請求項9は、請求項8に記
載の情報入力支援サービスシステムにおいて、協力者へ
の報酬を携帯電話の利用料金を一部または全額代理支払
いとすることを特徴とする。したがって、協力者は、携
帯電話の使用料金を払ってもらえるので、携帯電話の使
用時間を気にすることがなく修正することができる。
【0017】また、本発明の請求項10は、請求項1乃
至7のいずれか1に記載の情報入力支援サービスシステ
ムにおいて、前記協力者端末への分配に前記サービス提
供者から協力者へ無料で貸し出されたメールアカウント
によるメールを用いて配信することを特徴とする。した
がって、協力者は、報酬としての無料メールアカウント
を使用でき、且つ、時間を選ばずに修正することができ
る。
【0018】
【発明の実施の形態】以下、図面をもとに本発明の実施
の形態を詳細に説明する。
【0019】(1)情報入力支援サービスシステムの概
要 図1は、本発明の実施例の情報入力支援サービスシステ
ム(以下、本システムという)を説明する全体構成図で
ある。図1において、本システムは、情報入力支援サー
ビスを提供するサービス提供者100が保有する複数の
サーバ(50、60、70、80)にネットワーク90
を介して接続されるサービス利用者側の端末10、この
サービス実施にあたって協力する協力者側の端末20と
から構成される。この協力者が携帯電話またはPDA(P
ersonal Digital Assistant)等の携帯端末30を用いて
インターネット90へ接続するときには、インターネッ
トサービスプロバイダ40を経由して行うことになる。
これらの利用者側の端末10および協力者側の端末(2
0、30)は任意の数だけ接続してもよい。また、ネッ
トワーク90は、サービス提供者100側の各サーバ、
利用者側端末10、協力者側端末20およびインターネ
ットサービスプロバイダ40のサーバとを結合するため
の伝送路であって、一般には、ケーブルで実現され、通
信プロトコルにはTCP/IPが使われる。但し、伝送
路としてはケーブルだけではなく、それらの間の通信プ
ロトコルが一致するものであれば無線、有線および放送
波のいずれでもよい。なお、本実施例では、サービス提
供者のサーバ(50,60,70,80)を独立のサー
バとして説明するが、適宜組み合わせて、受注サーバ5
0とダウンロードサーバ60を1つのサーバで、サービ
ス提供サーバ70とデータベースサーバ80を1つのサ
ーバでそれぞれ運用してもよいし、すべて1つのサーバ
で運用してもよい。
【0020】このような構成において、先ず、紙文書か
ら文字認識処理を行って電子化された情報を作成したい
本サービスの利用者は、紙文書をスキャナ等により入力
された画像を文字認識処理して、その結果を自分の端末
10へ保存しておく。次に、利用者側の端末10からイ
ンターネット90を介してサービス提供者100の管理
する受注サーバ50へアクセスする。利用者はこの受注
サーバ50を使って、利用者の登録を行い、先に変換し
た文字認識結果を受注サーバ50へ送信し、その認識結
果を修正するのに要する費用の見積もりを経て、修正の
発注を行う。また、修正結果の登録されたURL(Unifo
rm Resource Locator)を電子メールで受信し、そのUR
Lにアクセスして、修正結果をダウンロードし、その修
正結果の評価結果を返信することによって、利用者への
課金が行われる。また、評価結果を見ることによって、
各協力者の評価ランクが決まり、報酬が決まる。
【0021】本サービスを提供するサービス提供者10
0は、受注サーバ50とダウンロードサーバ60とをイ
ンターネット90を介して利用者とのコミュニケーショ
ンを提供する。また、サービス提供処理サーバ70はイ
ンターネット90を介して電子メールによるコミュニケ
ーションをとり、データベースサーバ80はサービス提
供者100の管理する他のサーバ(50、70)がサー
ビスを提供するための種々のデータをインターネット9
0を介して授受する。この受注サーバ50は、本サービ
スの利用者に対して利用者登録を行わせる。この利用者
に関するデータはデータベースサーバ80に記憶する。
この登録された利用者の認証と、利用者の送信した文字
認識結果に対する協力者のレベルに応じた費用の見積も
りを提示する。この見積もりにはデータベースサーバ8
0に蓄積されたグループの対価を使って決定される。利
用者から発注されると、これをサービス提供サーバ70
へ送信し、実際のサービスの処理が行われる。
【0022】サービス提供処理サーバ70は、受注サー
バ50から受信した文字認識結果から1文字ごとに画像
を分割する。このとき、文字確信度が低い文字に関して
は隣接の文字画像を結合して適切な文字列に分割する。
発注時に指定された協力者グループに属する協力者をデ
ータベースサーバ80によって抽出し、この分割された
文字をこの抽出された協力者へ分配する。このとき発注
時に指定された文書内容の属する分野を持った協力者に
は優先的に配分するようにする。この配分にしたがっ
て、協力者の端末(20または30)へ分割した1文字
の認識結果とその画像を電子メールによって送信する。
ここで、1つの文字を複数人の協力者へまた1人の協力
者へ複数の分割文字を分配することになる。この分配し
た状況はデータベースサーバ80へ記録され、協力者へ
の報酬や協力者のランクの再計算に用いられる。協力者
への配信後、修正結果が協力者から返信されると、その
修正結果をもとの文字に対応して記憶させる。また、協
力者からの返信がいつなされたかも記憶しておく。一定
期間経過するか、または協力者からの返信がすべて揃っ
た時点で、集まった1つの文字に対する複数の修正結果
から多数決で最終的な修正結果を決定する。集計時点
で、修正結果が1つも返信されてこなかった文字につい
ては、返信された文字の中から同じ画像パターンをもつ
ものを探して、同じものがあればその同じ文字画像の修
正結果をその画像の結果とする。すべての修正結果をま
とめてダウンロードサーバ60へ登録し、その登録され
たURLを発注者へ電子メールにて報告する。
【0023】ダウンロードサーバ60は、発注者へ報告
する修正結果をダウンロードできるように登録管理す
る。通知を受けた発注者からのアクセスをうけ、その修
正結果をダウンロードさせるときに本人であるかを認証
してから、ダウンロードさせる。また、ダウンロードさ
せたあと、この納入品(修正結果)に対する評価を発注
者に行ってもらい、その結果により各協力者の評価が決
定される。また、ダウンロードをしたことにより、発注
者への課金を計算し、徴収する。
【0024】文字認識処理結果の修正を行う協力者は、
端末(20または30)により受注サーバ50へアクセ
スして、協力者として自分の得意とする知識分野(例え
ば、医学、光学、コンピュータ技術等)を登録依頼す
る。受注サーバ50は、協力者として適切であればデー
タベースサーバ80へ登録する。協力者は、サービス提
供処理サーバ70から受信した文字の修正依頼に対し
て、修正候補のなかから選択するか、正しいと判断され
る文字コードを返信する。この依頼の受信から返信まで
の応答の速さ、正確性、利用者からの評価によって自分
の報酬が決定される。以下、図2〜図7を用いて、各処
理の詳細な動作を説明する。
【0025】(2)サービスの依頼 図2は利用者が文字認識結果の修正を本サービス提供者
へ発注するまでの処理経過を説明するための図である。
本サービスを希望する利用者は、あらかじめユーザ認証
と課金のためにサービス提供者に登録する。このために
利用者の端末10からネットワーク90を介して本サー
ビス提供者100の受注サーバ50へアクセスする(ス
テップU10)。利用者からのアクセスで受注サーバ5
0は、発注および利用者登録のWebページを送信する
(ステップJ10)。利用者は新規利用者登録の場合に
は、このWebページにしたがって、利用者名、修正結
果等を受信するためのメールアドレスおよび支払方法等
の書誌的事項を入力して、受注サーバ50へ返信する
(ステップU11)。この利用者登録の依頼を受信した
受注サーバ50は、送られてきた利用者の情報をデータ
ベースサーバ80に送信して、利用者登録ファイルへ登
録してもらう(ステップJ11)。データベースサーバ
80は、利用者を利用者登録ファイルへ登録するととも
に利用者識別子(利用者ID)とパスワードを発行し、
受注サーバ50へ戻す(ステップJ12)。この利用者
IDとパスワードを利用者へ返信する(ステップJ1
3)。これで利用者は、この利用者IDとパスワードに
よって、本サービスの提供を受けることができるように
なる。
【0026】一方、既に利用者登録が済んでいる場合に
は、受注サーバ50へアクセスしたあと送られてきた、
Webページへ利用者IDとパスワードを入力して返信
する(ステップU12)。受注用サーバ50は、この利
用者IDとパスワードを確認するために、これをデータ
ベースサーバ80へ送信して、登録されているかを調べ
てもらう(ステップJ14)。データベースサーバ80
では、この情報が利用者登録ファイルに登録されている
かをチェックし、その結果を受信サーバ50へ戻す(ス
テップJ15)。この結果、受信サーバ50は利用者の
認証を行い、登録されていれば修正対象となる文字認識
結果を送信してくれるようにWebページを返信する
(ステップJ16)。利用者は、このWebページ画面
に従って、文字認識処理に使った認識対象の文書画像と
認識結果情報とを送信する(ステップU13)。この認
識結果情報には1文字ごとに文字認識処理結果の複数位
までの認識結果と元画像上でのその文字の領域情報が含
まれる。
【0027】受注サーバ50は、利用者から送られてき
た修正対象の情報を発注が確定するまで一時的に格納し
ておく(ステップJ17)。この修正対象の文字数と協
力者グループごとに定めた見積もりのための対価に基づ
いて計算した料金を見積金額として、利用者へ返信する
(ステップJ18)。この協力者のグループは、データ
ベースサーバ80に管理されており、少なくとも次の項
目からなっている(図3参照)。 グループID:グループの識別子を表す。協力者の処理
スピード・正確さ・利用者からの評価をもとに決定され
た報酬でランク付けし、高いランクの協力者が占める割
合の異なる複数のグループを構成する。 見積もりのための対価:このグループの協力者を使って
修正を行ったときの1文字あたりの修正料金であり、グ
ループに占める高いランクの協力者の割合に応じて決め
ておく。 協力者IDリスト:このグループに属する協力者の識別
子のリストである。
【0028】利用者は、送られてきた見積もり一覧のな
かから予算や処理の緊急性を勘案して、妥当と思われる
協力者グループを選択し、必要ならば対象文書の属する
分野を添えて受注サーバ50へ発注する(ステップU1
4)。発注依頼を受信した受注サーバ50は、一時記憶
した修正対象の情報と文書の分野を添えてサービス提供
処理サーバ70へ知らせ(ステップJ19)、発注確認
の電子メールを利用者へ送信する(ステップJ20)。
【0029】また、本サービスに協力したい協力者は、
自分の端末(20または30)を使って受注サーバ(ま
たは独自に協力者登録サーバを用いてもよい)50へア
クセスして、自分の名前、自分の得意とする知識分野
(たとえば医学、光学、コンピュータ技術等)、端末2
0の時にはメールアドレスを携帯端末30であれば携帯
電話番号等を入力し、その情報をデータベースサーバ8
0の協力者登録ファイル(図4参照)へ登録しておく。
このメールアドレスは本サービスにあたって協力者の無
料のアカウントを取り、そのアカウントに応じて発行す
るものであってもよい。また、端末からではなくサービ
ス提供者100が発行する協力者登録用紙を用いて、提
供者側でデータベースサーバ80の協力者登録ファイル
へ登録するようにしてもよい。
【0030】(3)受注したサービス依頼の処理 図5は発注された修正対象の協力者への依頼から回収し
て最終的な修正結果を得るまでの処理経過を説明するた
めの図である。サービス提供処理サーバ70は、受注サ
ーバ50から送られてきた発注者の送ってきた修正対象
の文書画像とその文字認識結果情報とをデータベースサ
ーバ80へ送信して、利用者登録ファイルへ保管しても
らう(ステップS10)。
【0031】データベースサーバ80は、これらの情報
を図6にあげたような形式で登録する(ステップS1
1)。図6によると、利用者登録ファイルは、少なくと
も次のような項目を利用者ごとに登録し、発注内容とそ
れに関する修正状況と課金管理をする。 利用者名:登録者の名前である。 メールアドレス:サービス提供者との連絡に使う電子メ
ールアドレスである。利用者IDとパスワード:本サー
ビスを受けるときに本人認証を行うための利用者識別子
およびパスワードである。 利用金額:本サービスを利用したときの課金情報であ
り、これをもとに、例えば、月単位で利用者へ支払い請
求を発行する。 URL:修正結果を利用者へ通知するときに、その修正
結果を保持するダウンロードサーバ60における修正結
果の所在を知らせるためのものであって、利用者はこの
URLを参照して、その結果を取り出し、その結果の評
価を行う。さらに、このURLから利用者がダウンロー
ドを行ったかどうかを記しておき、課金をするかどうか
を決めるようにしてもよい。 画像ファイル:文字認識処理を行うもとの文書の画像を
保存したファイルのファイル名リストである。 OCR結果ファイル:各画像ファイルに対応した文字認
識結果の情報ファイルである(この内容は後述する)。 上記の項目以外にも、利用金額を請求するとき用いる住
所や利用金額を引き落とす金融機関名、口座番号等など
も記録しておく必要がある。
【0032】OCR結果ファイルには、受注した文字認
識結果を1文字ごとに次の情報を持たせる。 領域番号:文書に含まれるすべての文字に対して唯一の
番号を付ける。 領域情報:この文字が画像ファイルのどの位置にあるか
を示す情報である。これにより、1文字の画像が切り出
せる。 OCR結果の文字コードと確信度:1つの文字に対する
認識結果を確信度の順位が大きい既定の数(この図6で
は5個)だけ保持する。協力者はこの認識結果の中から
選択するか、または、新たに入力することになる。 修正結果:協力者から返信した結果を集計した最終の修
正結果である。 協力者の送付リスト:この文字が協力者の誰に配分され
ているかを示し、1人の協力者に対し、協力者ID、修
正依頼した発信日、修正結果を受信した返信日、および
その修正結果の4つ組みからなる。
【0033】次に、サービス提供処理サーバ70は、認
識結果情報中の領域情報を参照して文書の画像を1文字
ごとの領域に分割する。この分割時に、その文字の認識
結果の確信度が低い文字に関しては隣接するいくつかの
文字とあわせた画像を作成する。これらの情報から、1
文字の認識結果(複数の認識結果とその確信度)、上記
の分割画像およびこの文字を一意に識別する領域番号と
からなる修正作業用メッセージをすべての文字について
作成する(ステップS12)。
【0034】次に、サービス提供処理サーバ70は、発
注者から指定された協力者グループに属する協力者のリ
ストを送るようにデータベースサーバ80へ依頼する
(ステップS13)。データベースサーバ80は、協力
者グループファイル(図3参照)から指定された協力者
グループに属する協力者IDリストを取り出し、この協
力者IDをもとに協力者登録ファイルから各協力者の協
力者名、知識分野、連絡先(メールアドレス、携帯電話
番号等)等を取り出し、返信する(ステップS14)。
【0035】取り出された協力者に対して、ステップS
12で作成した修正作業用メッセージを1つのメッセー
ジあたり複数人へ、また、1人あたり複数のメッセージ
を割り当てる。発注者から文書の属する分野が指定され
ていれば、この取り出した協力者の中で指定知識分野を
得意とする協力者に優先的に割り当てる。協力者へ割り
当てられたこれらの修正作業用メッセージは、その協力
者の連絡先へ以下の2通りの方法で配送される。また、
このメッセージに含まれている文字に対する協力者ごと
にこのメッセージの発信日を記録しておく(図6参照)
(ステップS15)。 ・電子メールアカウントを用いた方法 協力者の所有するメールアドレス、または、本サービス
によって提供された無料メールアカウントに対して配信
される。 ・携帯電話メールを用いた方法 修正作業用メッセージは、必要であればその選択を簡素
化するプログラムまたはフォームを含んだ携帯電話上で
表示可能な形式のハイパーテキストに変換され、メール
として協力者に配信される。
【0036】協力者は受信端末(20または30)で修
正作業用メッセージを受信する(ステップC10)。協
力者は、このメッセージに対して多くの場合、認識結果
として正しいと思われる文字を選択し、サービス提供者
へ送信する(ステップC11)。送られてきた文字認識
結果の候補中にはないが、断片化された文字画像から判
断できるものであれば、その文字コードを返信する。そ
れでも判読が困難な場合には「不明」、文字として成立
しがたい場合(1文字としての領域選択が誤っている場
合を含む)「非文字」を選択して返信する。
【0037】サービス提供処理サーバ70は、データベ
ースサーバ80へ依頼して協力者から返信された返信日
と修正結果を登録する(図6参照)(ステップS16、
S17)。また、サービス提供処理サーバ70は、協力
者へ配信されたメッセージに対する返信がすべて返って
きたか、または、一定の期間(既定の日数)が過ぎたの
かを監視する(ステップS18)。すべて返ってきたか
または一定期間が過ぎた場合、協力者から返信された修
正結果を1文字ごとに集計する。この集計は、各々の修
正結果文字について、最も多く選択された文字を最終的
な修正結果として確定する(ステップS19)。しか
し、一定割合以上「不明」が選択された結果文字につい
ては、その文字の確信度を下げるとともに、周囲の文字
領域を含んだ画像を作成して再度協力者(同一の協力者
である必要はない)に配送し、それでも「不明」が一定
割合以上ある場合は元の認識結果中の1位の候補を出力
する。
【0038】さらに、文書画像のある位置の文字Xが協
力者から一定期間経ても集まらない場合、もしくは、
「不明」の比率が一定より高い場合に、この文字Xから
特徴量を算出し、修正結果が確定しており、文字Xと十
分に近い特徴量を持つ文字Yが同一文書画像内にあるか
を調べる。もし存在すれば、文字Xの修正結果を文字Y
の修正結果で置き換えるようにしてもよい。このように
した場合、文書内のすべての文字についての修正結果が
集まらない場合でも結果を確定することが可能となる。
【0039】図7は、協力者からの修正結果の集計後の
発注者への報告および課金を行うときの処理経過を説明
するための図である。図5のステップS19で集計され
た修正結果を納品物として、受注したときと同じ順番に
整列し、これをダウンロードサーバ60へ登録し、その
登録された納品物のURLを得る。このURLは発注者
の利用者登録ファイルへも登録される(図6参照)(ス
テップS20、D10)。サービス提供処理サーバ70
は、発注者(利用者)に対して修正完了の旨と結果ダウ
ンロードページのURLを含んだ電子メールを送信する
(ステップS21)。
【0040】利用者(発注者)は、納品の電子メールを
受信し、このURLにアクセスする(ステップU20、
U21)。アクセスを受けたダウンロードサーバ60
は、ダウンロード用のWebページを返信し(ステップ
D11)、利用者はこのページにより利用者であること
の認証を受けてから(ステップU22、D12、D1
3)、修正結果のダウンロードを行うことができる(ス
テップD14)。ダウンロードが完了すると、ダウンロ
ードサーバ60は、修正結果に対する評価を行ってくれ
るように利用者へ依頼し(ステップD15)、利用者が
ダウンロードを完遂したことをデータベースサーバ80
の利用者登録ファイルへ登録する(ステップD16)。
【0041】利用者は、ダウンロードした修正結果であ
る納品物を検討し、再度ダウンロードした納品物のUR
Lをアクセスしてその修正結果に対する評価を0〜10
0点程度の満足度として送信する(ステップU23)。
サービス提供処理サーバ70は、利用者からの評価結果
をダウンロードサーバ60から受信して、利用者への課
金を計算し、利用者登録ファイルへ登録する(ステップ
D17、S22、S23)。この課金は、協力者によっ
て回答を得られた文字数に指定された協力者グループの
対価を掛け、回答を得られなかった文字数および認識不
能の文字数にあらかじめ定めた料金を掛けたものと管理
費等とを加えて計算される。ここで計算された利用者へ
の課金は、あらかじめ受注時に決めた時期(即時または
月末等)に請求を行う(ステップS24)。
【0042】サービス提供処理サーバ70は、文書の修
正を行った協力者グループを構成する協力者それぞれに
対して、修正結果の受信から返信までの遅延状況、返信
された結果に対する「不明」選択の割合、修正結果の利
用者からの評価点をパラメータとして評価し、ランクを
決定する(ステップS25)。この評価では、利用者の
評価点はプラスに、返信の遅延状況および「不明」の割
合はマイナスの効果を持つものとする。
【0043】協力者のランクが更新されると、高いラン
クを持つ協力者の割合を変えたグループを作り、それぞ
れのグループに協力者を配置し、グループの見積もり対
価を決定してグループ再編成を行い、データベースサー
バ80の協力者グループリストファイルを更新する(図
3参照)(ステップS26、S27)。
【0044】サービス提供処理サーバ70は、協力者に
対しては、先に計算された協力者のランクに応じた対価
によって算出する額を報酬として支払う(ステップS2
8、S29)。このように協力者にランクを与えること
で、作業への意欲を維持することができる。また、携帯
端末が携帯電話を使って修正作業を行った協力者に対し
ては、携帯電話料金の一部減額あるいは全額を代理支払
いの形で対価として支払うようにしてもよい。これによ
り、協力者は場所と時間を選ばずに修正を行うことがで
きる。
【0045】
【発明の効果】以上説明したように、本発明によれば、
文書情報を文字認識処理によって電子化する際、ネット
ワークを介して文字認識処理結果の修正依頼・修正作業
の分配・修正結果の集計・依頼者への返信までの管理
と、この作業に携わった人への対価または課金を管理す
ることができるので、認識結果の修正品質を維持しつつ
安価に利用できる情報入力支援サービスシステムを提供
することができる。
【0046】また、本発明の請求項1によれば、対象と
する文書が個人情報や企業秘密を含む場合であっても、
その文書の分割単位が小さいので、プライバシーや機密
が漏れることがないので、本サービスの利用者と本サー
ビスの提供者側との間に機密保持などの特約が必要とな
らない。また、文字認識結果の修正依頼を、ネットワー
クを通じて多数の協力者に配信するため、協力者あたり
の1回の労力を小さく押さえることができる。
【0047】また、本発明の請求項2によれば、判読が
1文字では困難と考えられるものであっても、周辺の画
像を見ることにより、その文字を容易に判読できるよう
になり、正解を得易くなる。
【0048】また、本発明の請求項3によれば、文書内
のすべての文字についての修正結果が集まらない場合で
も結果を確定することが可能となる。
【0049】また、本発明の請求項4によれば、分野が
指定された場合は同じ知識分野に登録されている協力者
に優先的に配信することで、誤りの修正がより正確に行
われるようになる。
【0050】また、本発明の請求項5によれば、利用者
は、修正後の認識結果に対する評価を0〜100点程度
の点数としてサービス提供者にフィードバックし、この
点数を協力者のランク付けに利用することにより、協力
者のモチベーションをはかり、それによりサービスの質
を維持することができる。
【0051】また、本発明の請求項6によれば、協力者
の協力度に合わせて報酬が支払われることにより、協力
者のモチベーションを維持することができる。
【0052】また、本発明の請求項7によれば、発注段
階で修正見積額をグループごとに示されるので、利用者
は求める正確さと料金に応じて品質を選べる。
【0053】また、本発明の請求項8によれば、協力者
は場所と時間を選ばずに修正することができる。
【0054】また、本発明の請求項9によれば、協力者
は、携帯電話の使用料金を払ってもらえるので、携帯電
話の使用時間を気にすることがなく修正することができ
る。
【0055】また、本発明の請求項10によれば、協力
者は、報酬としての無料メールアカウントを使用でき、
且つ、時間を選ばずに修正することができる。
【図面の簡単な説明】
【図1】 本発明の実施例の情報入力支援サービスシス
テムを説明する全体構成図である。
【図2】 利用者が文字認識結果の修正を本サービス提
供者へ発注するまでの処理経過を説明するための図であ
る。
【図3】 協力者グループリストファイルのデータ構造
を説明する図である。
【図4】 協力者登録ファイルのデータ構造を説明する
図である。
【図5】 発注された修正対象の協力者への依頼から回
収して最終的な修正結果を得るまでの処理経過を説明す
るための図である。
【図6】 利用者登録ファイルのデータ構造を説明する
図である。
【図7】 協力者からの修正結果の集計後の発注者への
報告および課金を行うときの処理経過を説明するための
図である。
【符号の説明】
10…利用者端末、20…協力者端末、30…協力者の
携帯端末、40…インターネットサービスプロバイダ、
50…受注サーバ、60…ダウンロードサーバ、70…
サービス提供処理サーバ、80…データベースサーバ、
90…インターネット、100…サービス提供者。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 宮澤 利夫 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 山形 秀明 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 内山 幸央 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 Fターム(参考) 5B064 AA07

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 利用者端末と、サービス提供者の運営す
    るサーバと、そのサービスの協力者端末とをネットワー
    クを介して接続した情報入力支援サービスシステムであ
    って、前記利用者端末は、利用者が文字認識結果情報と
    そのもととなる画像データとを用意し、これらを前記サ
    ービス提供者のサーバへ送信する、前記サービス提供者
    のサーバは、前記利用者から送信されたデータを前記ネ
    ットワークを介して受信し、画像を文字単位に分割し、
    この分割された画像とそれに対する文字認識結果情報と
    を多数の前記協力者へ配分し、その協力者端末へ送信す
    る、前記協力者端末は、配信された画像とその文字認識
    結果情報とから判断した文字認識結果の修正を返信する
    ようにし、前記サービス提供者のサーバは、協力者から
    返信された修正結果を集計し、前記利用者端末へ報告す
    ることを特徴とする情報入力支援サービスシステム。
  2. 【請求項2】 請求項1に記載の情報入力支援サービス
    システムにおいて、前記サービス提供者のサーバは、前
    記画像を分割する際、文字認識の確信度が低い場合には
    連続して近接する文字画像として分割することを特徴と
    する情報入力支援サービスシステム。
  3. 【請求項3】 請求項1または2に記載の情報入力支援
    サービスシステムにおいて、前記サービス提供者のサー
    バは、協力者から返信が得られないか、もしくは修正結
    果の確定ができなかった文字の修正結果として、前記利
    用者端末から受信した文書画像の他の部分で同じパター
    ンの文字があれば、その同一の文字に対する修正結果を
    用いることを特徴とする情報入力支援サービスシステ
    ム。
  4. 【請求項4】 請求項1、2または3に記載の情報入力
    支援サービスシステムにおいて、前記サービス提供者の
    サーバは、前記利用者端末から受信した文書の属する分
    野を明示されたとき、その指定された分野に適合する知
    識分野を持つ協力者に優先的に分配することを特徴とす
    る情報入力支援サービスシステム。
  5. 【請求項5】 請求項1、2、3または4に記載の情報
    入力支援サービスシステムにおいて、前記利用者は、報
    告された修正結果に対して評価をフィードバックするこ
    とを特徴とする情報入力支援サービスシステム。
  6. 【請求項6】 請求項5記載の情報入力支援サービスシ
    ステムにおいて、前記サービス提供者のサーバは、協力
    者の修正の速さ、修正の正確さ、利用者からの評価から
    この協力者へのランクを決定し、このランクから協力者
    への対価を決定することを特徴とする情報入力支援サー
    ビスシステム。
  7. 【請求項7】 請求項6記載の情報入力支援サービスシ
    ステムにおいて、前記サービス提供者のサーバは、高い
    ランクを持つ協力者の割合が異なる複数のグループを構
    成し、これらのグループに占める高いランクの協力者の
    割合に応じて利用者への料金を見積もることを特徴とす
    る情報入力支援サービスシステム。
  8. 【請求項8】 請求項1乃至7のいずれか1に記載の情
    報入力支援サービスシステムにおいて、前記協力者端末
    への分配に携帯電話メールを用いて配信することを特徴
    とする情報入力支援サービスシステム。
  9. 【請求項9】 請求項8に記載の情報入力支援サービス
    システムにおいて、協力者への報酬を携帯電話の利用料
    金を一部または全額代理支払いとすることを特徴とする
    情報入力支援サービスシステム。
  10. 【請求項10】 請求項1乃至7のいずれか1に記載の
    情報入力支援サービスシステムにおいて、前記協力者端
    末への分配に前記サービス提供者から協力者へ無料で貸
    し出されたメールアカウントによるメールを用いて配信
    することを特徴とする情報入力支援サービスシステム。
JP2001187447A 2001-06-21 2001-06-21 情報入力支援サービスシステム Pending JP2003006315A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001187447A JP2003006315A (ja) 2001-06-21 2001-06-21 情報入力支援サービスシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001187447A JP2003006315A (ja) 2001-06-21 2001-06-21 情報入力支援サービスシステム

Publications (1)

Publication Number Publication Date
JP2003006315A true JP2003006315A (ja) 2003-01-10

Family

ID=19026733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001187447A Pending JP2003006315A (ja) 2001-06-21 2001-06-21 情報入力支援サービスシステム

Country Status (1)

Country Link
JP (1) JP2003006315A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010277168A (ja) * 2009-05-26 2010-12-09 Fuji Xerox Co Ltd データ入力システム、データ入力受付装置及びプログラム
WO2012176784A1 (ja) * 2011-06-20 2012-12-27 株式会社コナミデジタルエンタテインメント 管理装置および管理方法
JP2019191713A (ja) * 2018-04-19 2019-10-31 ヤフー株式会社 決定プログラム、決定方法、及び決定装置
JP2022030672A (ja) * 2020-08-07 2022-02-18 株式会社Michiru 読取支援装置、および読取支援システム
JP2023144089A (ja) * 2018-07-18 2023-10-06 株式会社 ディー・エヌ・エー ライブ動画を配信するためのシステム、方法、及びプログラム
JP7410673B2 (ja) 2019-08-28 2024-01-10 株式会社ラクス 帳票発行システム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010277168A (ja) * 2009-05-26 2010-12-09 Fuji Xerox Co Ltd データ入力システム、データ入力受付装置及びプログラム
WO2012176784A1 (ja) * 2011-06-20 2012-12-27 株式会社コナミデジタルエンタテインメント 管理装置および管理方法
JP2013030159A (ja) * 2011-06-20 2013-02-07 Konami Digital Entertainment Co Ltd 管理装置および管理方法
JP2019191713A (ja) * 2018-04-19 2019-10-31 ヤフー株式会社 決定プログラム、決定方法、及び決定装置
JP2023144089A (ja) * 2018-07-18 2023-10-06 株式会社 ディー・エヌ・エー ライブ動画を配信するためのシステム、方法、及びプログラム
JP2023144080A (ja) * 2018-07-18 2023-10-06 株式会社 ディー・エヌ・エー ライブ動画を配信するためのシステム、方法、及びプログラム
JP7431375B2 (ja) 2018-07-18 2024-02-14 株式会社 ディー・エヌ・エー ライブ動画を配信するためのシステム、方法、及びプログラム
JP7459361B2 (ja) 2018-07-18 2024-04-01 株式会社 ディー・エヌ・エー ライブ動画を配信するためのシステム、方法、及びプログラム
JP7410673B2 (ja) 2019-08-28 2024-01-10 株式会社ラクス 帳票発行システム
JP2022030672A (ja) * 2020-08-07 2022-02-18 株式会社Michiru 読取支援装置、および読取支援システム

Similar Documents

Publication Publication Date Title
US7412412B2 (en) Network reverse auction and spending analysis methods
US20190188411A1 (en) Systems and Methods for Decentralizing Consumer Preferences, Consent and Permissions Management with Reward and Reputation Network for Enterprises Using a Blockchain Ledger
CA2260272C (en) Method and apparatus for a cryptographically-assisted commercial network system designed to facilitate and support expert-based commerce
US7076447B1 (en) Systems and methods for aggregating buyers for the purchase of telecommunication services via a network
US20020016727A1 (en) Systems and methods for interactive innovation marketplace
US20040122730A1 (en) Electronic messaging system and method thereof
US20140095598A1 (en) Systems, methods and interfaces for evaluating an online entity presence
CN101197727A (zh) 事件更新管理系统
US7302467B2 (en) Information processing device and information processing method, service providing system, and computer-executable program for the same
CN105913279B (zh) 一种基于移动互联网服务应用的服务费用预算系统
CN101901453A (zh) 一种交互式网络广告方法
JP5397527B2 (ja) 手続管理システム
US20070136310A1 (en) Procedure to collect, maintain, and distribute workers' preferences for professional recruiter contact
US20130212194A1 (en) Communication system and method
WO2007059295A1 (en) Computerized system enabling self-service creation and management of online coupons
JP2002032611A (ja) 手続管理システム
US20220239611A1 (en) Managing exchange of instant messages using an assigned communication code
CN104145288A (zh) 基于消费者进行储存、检索和传输推广内容到其他消费者的系统及方法
US20030018572A1 (en) Method enabling a bid caller to send an invitation to bid to one or several selected providers
JP2003006315A (ja) 情報入力支援サービスシステム
KR100524562B1 (ko) 기술평가 방법 및 그 시스템
US20030050838A1 (en) Communication system for managing premium points exchangeable among different virtual shops
JP6703667B1 (ja) プレスリリース配信装置、プレスリリース配信方法及びプログラム
US7729944B1 (en) System and methods for buying and selling telecommunication services via a network
CN111260335A (zh) 一种用作人力资源服务推广的裂变式利益分成模式