以下、本発明の実施形態に係るデータ処理システム、データ管理装置、方法およびプログラム、データ処理装置、方法およびプログラムについて図面を参照しながら説明する。なお、実施形態を説明する全図において、共通の構成要素には同一の符号を付し、繰り返しの説明を省略する。
以下では、一例として、顧客端末装置側において、処理対象となる画像データを分割し、分割した分割画像データを順不同でデータ処理装置に送信し、データ処理装置側において、分割画像データに対して所定の処理を行い、処理後のデータを顧客端末装置へ送信することにより、提供元である顧客端末装置で生成されたオリジナルの画像データをそのままの状態でデータ処理装置側が保持することなく、データ処理装置でデータの処理を行うデータ処理システムの構成と動作について説明する。
データ処理システム1は、図1に示すように、データ管理装置3が接続された顧客端末装置2と、データ処理装置4とがネットワークNを介して接続される。顧客端末装置2は、例えば、スマートフォン、タブレット、パーソナルコンピュータ(PC)などの情報処理装置である。データ管理装置3は、CPU、メモリ、インターフェイスなどを有する小型のコンピュータ装置である。顧客端末装置2とデータ管理装置3とは、所定のインターフェイス(例えば、USB(登録商標)やLAN)により相互に通信可能に接続されている。また、顧客端末装置2とデータ管理装置3との接続は、有線でも無線でもよい。なお、顧客端末装置2とデータ管理装置3とは、ネットワークNを介して接続される構成でもよい。また、以下では、データ管理装置3は、顧客端末装置2とは独立して存在するものとして説明するが、これに限られず、データ管理装置3の各構成要素が、顧客端末装置2に含まれる構成であってもよい。
データ管理装置3は、図2に示すように、記憶部10と、分割部11と、連結情報生成部12と、分割画像データ送信部13と、処理後データ受信部14と、特定部15と、連結部16とを備える。
分割部11は、顧客端末装置2から送信されてきた画像データを分割する。分割部11は、分割した分割画像データを記憶部10に保存する。具体的には、分割部11は、各分割画像データを2値のバイナリデータ(以下、画像バイナリ情報という)に変換し、変換後の画像バイナリ情報を記憶部10に保存する。本実施例では、「分割画像データ」と「画像バイナリ情報」とは、同義として扱う。
ここで、分割画像データを生成する手順について説明する。顧客端末装置2は、書類をスキャナ等で画像化して画像データに変換し、変換した画像データをデータ管理装置3の分割部11に送信する。分割部11は、例えば、画像データを読み込んで、予め取り込む書類の項目が配置されている場所を示す座標データに基づいて、画像データを項目ごとに分割する。なお、分割部11は、画像データを読み込んで、罫線抽出、枠構造解析、読取対象枠の位置推定などの構造解析を行い、画像データを項目ごとに分割してもよい。図3に示す例では、画像データAから4つのデータ(分割画像データa1〜a4)に分割した様子を示す。
連結情報生成部12は、記憶部10を参照し、分割部11により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号を関連付けて連結情報を生成する。連結情報生成部12は、生成した連結情報を記憶部10に保存する。連結情報には、後述するように、固有の項目番号も含む。なお、連結情報には、他の項目(例えば、「氏名」や「住所」などの項目ジャンル)が追加されてもよい。
ここで、連結情報の具体例について図4を参照しながら説明する。連結情報Lは、図4に示すように、エントリー番号(図4中のエントリーID)と、画像バイナリ情報と、項目番号(図4中の項目ID)とから構成されている。エントリーIDは、分割画像データを元の画像データに関連付けるためのIDである。画像バイナリ情報は、上述したように、各分割画像データのバイナリデータである。項目IDは、上述したように、分割画像データに関連付けられる固有のIDである。
図4に示す例では、エントリーID「A1」には、分割画像データ「a1」の画像バイナリ情報「4D5A 003B AF38 0871・・・」と、項目ID「ABX1・・・」とが関連付けられており、エントリーID「A2」には、分割画像データ「a2」の画像バイナリ情報「FF00 53DA 88BB FFDD・・・」と、項目ID「QB14・・・」とが関連付けられており、エントリーID「A3」には、分割画像データ「a3」の画像バイナリ情報「BBFA 8800 BD54 600F・・・」と、項目ID「56Z7・・・」とが関連付けられており、エントリーID「A4」には、分割画像データ「a4」の画像バイナリ情報「CC00 FAFF BA5D 3300・・・」と、項目ID「19QZ・・・」とが関連付けられており、エントリーID「B1」には、分割画像データ「b1」の画像バイナリ情報「51AA SS11 15WE 001D・・・」と、項目ID「1DDG・・・」とが関連付けられており、エントリーID「B2」には、分割画像データ「b2」の画像バイナリ情報「ER45 45TY FD34 MN22・・・」と、項目ID「15DG・・・」とが関連付けられている。
分割画像データ送信部13は、記憶部10にアクセスして、分割画像データを読み出し、分割部11で分割された分割画像データを順不同でデータ処理装置4に送信する。例えば、画像データがn個(画像データA,B,C・・・)あり、各画像データに分割画像データがm個(分割画像データa1,a2・・・b1,b2・・・c1,c2・・・)あった場合、分割画像データ送信部13は、画像データBの分割画像データb2をデータ処理装置4に送信し、つぎに、画像データFの分割画像データf4をデータ処理装置4に送信し、つぎに、画像データAの分割画像データa3をデータ処理装置4に送信するなどして、すべての画像データの分割画像データを順不同でデータ処理装置4に送信する。このように順不同に分割画像データをデータ処理装置4に送信することにより、データ処理装置4において、送信されてきた分割画像データから元の画像データの生成を困難にすることができる。
処理後データ受信部14は、データ処理装置4から送信されてきた処理後データを受信する。
特定部15は、記憶部10に保存されている連結情報に基づいて、処理後データ受信部14により受信した処理後データのエントリー番号を特定する。
連結部16は、特定部15で特定されたエントリー番号から元の画像データを構成する処理後データ同士を連結する。
また、データ処理装置4は、図5に示すように、記憶部30と、分割画像データ受信部31と、処理後データ送信部33とを備える。
分割画像データ受信部31は、分割画像データ送信部13から順不同で送信されてきた分割画像データを受信する。分割画像データ受信部31は、受信した分割画像データを記憶部30に保存する。処理後データ送信部33は、記憶部30にアクセスして処理後データを読み出し、読み出した分割画像データの処理後データをデータ管理装置3に送信する。
ここで、分割画像データの処理後データを生成する構成について説明する。処理後データは、図5に示すように、データ処理部32によって生成する。データ処理部32は、分割画像データ受信部31で受信した分割画像データを処理する。具体的には、データ処理部32は、記憶部30にアクセスして分割画像データを読み出し、読み出した分割画像データを処理する。データ処理部32は、処理後の分割画像データ(以下、処理後データという)を記憶部30に保存する。なお、データ処理部32の具体的な構成と動作については、後述する。
処理後データ送信部33は、データ処理部32で処理した処理後データをデータ管理装置3に送信する。具体的には、処理後データ送信部33は、記憶部30にアクセスして処理後データを読み出し、読み出した処理後データをデータ管理装置3に送信する。
よって、データ処理システム1は、顧客端末装置2に接続されているデータ管理装置3において、処理対象となる画像データを分割し、分割画像データを順不同でデータ処理装置4に送信し、データ処理装置4において、分割画像データに対して所定の処理を行い、処理後のデータをデータ管理装置3に送信することにより、提供元である顧客端末装置2で生成されたオリジナルの画像データをそのままの状態でデータ処理装置4が保持することなく、データ処理装置4でデータの処理を行うことができる。
なお、データ管理装置3で分割した分割画像データは、データ管理装置3から直接ネットワークNを介してデータ処理装置4に送信されてもよいし、一旦、顧客端末装置2に送信されてから、顧客端末装置2からネットワークNを介してデータ処理装置4に送信されてもよい。また、データ処理装置4で処理された処理後データは、直接ネットワークNを介してデータ管理装置3に送信されてもよいし、一旦、ネットワークNを介して顧客端末装置2に送信されてから、顧客端末装置2からデータ管理装置3に送信されてもよい。
また、データ管理装置3は、図2に示すように、項目番号送信部17と、キー受信部18と、暗号化部19とを備える。なお、本実施形態の暗号化方式は、共通鍵方式でもよいし公開鍵方式でもよい。
連結情報生成部12は、図4に示すように、分割部11により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号と、固有の項目番号とを関連付けて連結情報を生成する。
項目番号送信部17は、記憶部10に保存されている連結情報を参照して、項目番号をデータ処理装置4に送信する。
キー受信部18は、データ処理装置4から送信されてきた暗号キーを受信する。暗号キーは、固有の項目番号に対応する固有のキーである。
暗号化部19は、キー受信部18で受信した暗号キーにより、項目番号送信部17で送信した項目番号の分割画像データを暗号化する。暗号化部19は、暗号化した分割画像データ(以下、暗号化分割画像データという)を記憶部10に保存する。また、暗号化部19は、分割画像データを暗号化した後、暗号キーを保存せずに破棄する。
分割画像データ送信部13は、記憶部10にアクセスして、暗号化分割画像データを読み出し、暗号化分割画像データに対応する項目番号を付して、順不同でデータ処理装置4に送信する。
特定部15は、データ処理装置4の処理後データ受信部14から処理後データを受信し、記憶部10に保存されている連結情報に基づいて、処理後データに付されている項目番号からエントリー番号を特定する。
よって、データ処理システム1は、顧客端末装置2に接続されているデータ管理装置3において、処理対象となる画像データを分割し、分割画像データにデータ処理装置4で項目番号から生成した固有の暗号キーによって暗号化し、順不同でデータ処理装置4に送信するので、提供元である顧客端末装置2で生成されたオリジナルの画像データをそのままの状態でデータ処理装置4が保持することなく、データ処理装置4でデータの処理を行わせることができる。
また、データ処理装置4は、図5に示すように、キー生成部34と、キー送信部35と、暗号化分割画像データ復号部36とを備える。
キー生成部34は、項目番号送信部17から送信されてきた項目番号に対して固有の暗号キーを生成する。なお、本実施例では、データ管理装置3から項目番号が送信されてくる度に当該項目番号に対して固有の暗号キーを生成するものとして説明するが、これに限られない。例えば、キー生成部34は、所定期間(例えば、発行時から3時間など)有効となる暗号キーを生成し、生成した暗号キーをデータ管理装置3に送信する構成でもよい。当該構成の場合、キー生成部34は、所定期間が経過するときに、新たに暗号キーを生成し、生成した新たな暗号キーをデータ管理装置3に送信する。このような構成によれば、データ処理装置4は、頻繁に暗号キーを生成しなくてもよく、処理負担の軽減を図ることができる。
キー送信部35は、キー生成部34により生成した暗号キーをデータ管理装置3に送信する。
また、分割画像データ受信部31は、データ管理装置3の分割画像データ送信部13から送信されてきた暗号化分割画像データを受信する。分割画像データ受信部31は、受信した暗号化分割画像データを記憶部30に保存する。
暗号化分割画像データ復号部36は、分割画像データ受信部31により受信した暗号化分割画像データを復号する。具体的には、暗号化分割画像データ復号部36は、記憶部30にアクセスして暗号化分割画像データを読み出し、読み出した暗号化分割画像データを復号する。暗号化分割画像データ復号部36は、復号した暗号化分割画像データを記憶部30に保存する。
データ処理部32は、暗号化分割画像データ復号部36で復号した分割画像データを処理する。具体的には、データ処理部32は、記憶部30にアクセスして復号された分割画像データを読み出し、読み出した分割画像データを処理する。データ処理部32は、処理後の分割画像データ(以下、処理後データという)を記憶部30に保存する。なお、データ処理部32の具体的な構成と動作については、後述する。
処理後データ送信部33は、データ処理部32で処理した処理後データをデータ管理装置3に送信する。具体的には、処理後データ送信部33は、記憶部30にアクセスして処理後データを読み出し、読み出した処理後データに対応する項目番号を付してデータ管理装置3に送信する。
よって、データ処理システム1は、データ処理装置4において、項目番号に基づいて固有の暗号キーを生成してデータ管理装置3に送信し、当該暗号キーによって暗号化された分割画像データを受信して、復号後に分割画像データに対して所定の処理を行い、処理後のデータをデータ管理装置3に送信するので、提供元である顧客端末装置2で生成されたオリジナルの画像データをそのままの状態で保持することなく、データの処理を行うことができる。
また、処理後データ送信部33は、データ処理部32で処理した処理後データに暗号化を行い、暗号化された処理後データ(以下、暗号化処理後データという)をデータ管理装置3に送信する構成でもよい。
当該構成の場合、データ管理装置3は、図2に示すように、処理後データ送信部33から送信されてきた暗号化処理後データを復号する暗号化処理後データ復号部20を備える。
具体的には、処理後データ受信部14は、暗号化処理後データを受信する。処理後データ受信部14は、受信した処理後データが暗号化されているので、当該データを暗号化処理後データ復号部20に送る。暗号化処理後データ復号部20は、暗号化処理後データに対応する項目番号をデータ処理装置4に送信して、復号キーの生成を依頼する。データ処理装置4は、受信した項目番号に基づいて固有の復号キーを生成し、データ管理装置3に送信する。
キー受信部18は、データ処理装置4から復号キーを受信し、受信した復号キーを暗号化処理後データ復号部20に送る。暗号化処理後データ復号部20は、復号キーによって暗号化処理後データを復号し、復号したデータ(処理後データ)を特定部15に送る。
特定部15は、記憶部10に保存されている連結情報に基づいて、暗号化処理後データ復号部20から送られた処理後データのエントリー番号を特定する。
よって、データ処理システム1は、データ処理部32で処理した処理後データに暗号化を行い、暗号化処理後データをデータ管理装置3に送信し、データ管理装置3から送信されてきた項目番号に固有の復号キーを生成してデータ管理装置3に送信するので、処理後データを安全にデータ管理装置3に送信することができる。なお、データ処理システム1は、セキュリティレベルは下がるが、暗号キーをデータ管理装置3で作成する構成でもよいし、分割画像データの暗号化を行わずにデータ処理装置4に送信する構成でもよい。
<データ処理部32の第1実施例>
また、分割部11は、画像データを所定の項目ごとに分割する構成でもよい。当該構成の場合、データ処理部32は、分割画像データの文字認識処理を行ってテキストデータに変換する。また、処理後データ送信部33は、データ処理部32により変換されたテキストデータを処理後データとしてデータ管理装置3に送信する。
ここで、データ処理部32の第1実施例について説明する。なお、以下では、複数の項目に個人を特定し得る情報(例えば、氏名、口座番号など)が手書きされている口座振替依頼書をスキャナ等で画像化した画像データを対象とし、当該画像データを分割した分割画像データがデータ管理装置3からデータ処理装置4に送信されている場合を想定して説明する。
データ処理部32は、概念的には、バックプロパゲーション(誤差逆伝播法)によって、入力層、一または複数の中間層、および出力層から構成される多層のニューラルネットワークを学習させるアルゴリズムを利用して、文字認識を行う。
具体的には、データ処理部32は、図6に示すように、記憶部50と、画像認識部51と、自然言語処理部52と、判断部53と、出力部54とを備える。
記憶部50は、データ処理部32の専用の記憶部として説明するが、記憶部30の一部として構成されてもよい。画像認識部51は、分割画像データを認識してテキストを生成する。自然言語処理部52は、画像認識部51により生成されたテキストを自然言語処理する。判断部53は、画像認識部51により生成されたテキストと自然言語処理部52により自然言語処理されたテキストを対比する。また、データ処理部32は、判断部53から出力されるテキストを出力する出力部54を備える。出力部54は、判断部53から出力されたテキストを処理後データとして記憶部30に保存する。また、データ処理部32は、画像認識部51、自然言語処理部52および判断部53とを独立に機能させ、それぞれの出力結果が相互に出力結果に影響を与えることにより、所定以上の尤度のテキストを出力する。
ここで、画像認識部51の動作について説明する。画像認識部51は、分割画像データに基づいて、読取対象である文字行を抽出する。画像認識部51は、文字行画像から文字パターン候補の切出しと、各文字パターンの文字識別を行う。
つぎに、文字識別の手順について説明する。画像認識部51は、図7に示すように、切出した1個の文字パターンの分割画像データに対して特徴抽出を行う。そして、画像認識部51は、文字のストロークの方向成分などを抽出して、分割画像データを1つのベクトルに変換する。図7に示す例では、分割画像データXが多層のニューラルネットワークに入力され、方向や位置等の特徴を捉えて特徴抽出をされている様子を模式的に示している。また、図7に示す例では、ベクトルX1と、ベクトルX2と、ベクトルX3とに変換された様子を模式的に示している。
画像認識部51は、図8に示すように、変換されたベクトルに基づいて、字種が何であるかを判定する。画像認識部51は、当該判定において、事前に大量のパターンを使った分布の様子から、どの字種が特徴空間上のどの辺に分布しているかを保持している辞書データを参照し、未知の入力パターンである分割画像データの候補を決定する。図8に示す例では、辞書データにおいて、字種「中」、字種「申」および字種「十」の情報が記憶されている様子を概念的に示している。
画像認識部51は、以上のプロセスにより、複数のテキスト候補(例えば、中、申、十)と、各テキスト候補の尤度を取得する。なお、各テキスト候補の尤度は、特徴空間内における各候補の中心と、未知の入力パターンである分割画像データとの距離で算出することができる。
画像認識部51は、図6に示すように、第1画像認識部51aと、第2画像認識部51bとから構成されている。
第1画像認識部51aは、記憶部50から分割画像データを読み出し、多層のニューラルネットワークを用いて当該分割画像データから特徴点を抽出し、複数のテキスト候補と尤度を出力する。
第2画像認識部51bは、記憶部50から分割画像データを読み出し、多層のニューラルネットワークを用いて当該分割画像データから特徴点を抽出し、テキストよりも小さい因子である素因子テキストに分離されたテキスト候補と尤度を出力する。
第1画像認識部51aと第2画像認識部51bとの主な違いは、画像認識の機械学習を行う際に利用する学習データの違いである。第1画像認識部51aは1文字を1文字として出力するように学習データが用意されているのに対し、第2画像認識部51bは1文字をより小さい因子である素因子テキストに分離して出力するように学習データが用意されている。
よって、データ処理部32は、様々な手書き文字が含まれている書類について、所定以上の尤もらしさが得られるまで処理を繰り返すので、信頼性の高い高精度な文字認識を行うことができる。
また、判断部53は、自然言語処理部52により出力されたテキスト候補の中で、尤度の高いテキスト候補を第1画像認識部51aにより出力されたテキスト候補よりも優先的に扱う構成でもよい。
当該構成の場合には、データ処理部32は、より自然言語処理部52による処理を優先するので、自然言語処理に適しているといえ、文章の文字認識に対して強みを発揮する。
また、判断部53は、対比した結果、2つのテキスト候補の差分が所定の閾値を超えない場合に、所定以上の尤度のテキストであると判断して出力する構成でもよい。つまり、判断部53は、自然言語処理部52により出力されたテキスト候補と、第1画像認識部51aにより出力されたテキスト候補とがほぼ一致している場合に、所定以上の尤度のテキストであると判断する。
当該構成の場合には、データ処理部32は、自然言語処理部52と第1画像認識部51aの二つの処理の結果を利用して文字認識を行っているので、高精度に文字認識を行うことができる。
データ処理部32は、図6に示すように、処理にかかる時間を設定する設定部55を備える構成でもよい。設定部55は、例えば、ユーザの指示にしたがって、処理時間を10分などに設定する。
判断部53は、第1画像認識部51aにより出力された最も尤度の高いテキスト候補と、自然言語処理部52により出力された最も尤度の高いテキスト候補とを対比し、所定以上の尤もらしさを得られなかった場合、設定部55によって設定された時間以内において、所定以上の尤もらしさが得られるまで、尤度の高い順に他の候補同士の対比を行う。
よって、データ処理部32は、設定された時間内において、所定以上の尤もらしさが得られるまで処理を繰り返すので、認識処理を何回行っても所定以上の尤もらしさが得られないような認識困難な分割画像データに対して何度も試行を繰り返すことがないメリットがある。
また、判断部53は、所定以上の尤もらしさが得られなかったテキストを伏字にして出力する構成でもよい。
伏字とは、文字認識ができなかった箇所を示すものであり、例えば、「○」や「△」などである。具体的には、氏名「特許太郎」の「太」の箇所に対して所定以上の尤もらしさが得られなかった場合には、判断部53は、「特許○郎」を出力する。
よって、データ処理部32は、文字識別できた箇所と文字識別ができなかった箇所を明示して出力することができる。なお、伏字にした箇所について、正しい文字(本実施例では、「○」の箇所は「太」である)をデータ処理部32にフィードバックしてもよい。当該フィードバックにより、データ処理部32は、次回の文字認識において、前回「○」となった分割画像データを正しいテキスト「太」として出力することができる。
また、第2画像認識部51bは、項目ごとに適した多層のニューラルネットワークを機械学習により有しており、分割画像データに含まれる項目を探索し、当該項目に適した多層のニューラルネットワークを用いて分割画像データから特徴点を抽出し、テキストよりも小さい因子である素因子テキストに分離されたテキスト候補を出力する構成でもよい。
例えば、「申込日」のような項目には、「2015年5月1日」等の申込日に関する情報が入力されることが予想できる。つまり、「申込日」のような項目は、数字「0〜9」と、漢字「年」,「月」,「日」が入力され、他の文字は入力されない。よって、第2画像認識部51bは、認識する項目が「申込日」のような場合には、数字「0〜9」と、漢字「年」,「月」,「日」とを出力するようなニューラルネットワークを用いて分割画像データから特徴点を抽出し、テキストよりも小さい因子である素因子テキストに分離されたテキスト候補を出力する。
また、「氏名_フリガナ」のような項目には、「トッキョタロウ」等の氏名のカタカナに関する情報が入力されることが予想できる。つまり、「氏名_フリガナ」のような項目は、カタカナ「ア〜ン」等が入力され、他の文字(漢字、数字等)は入力されない。よって、第2画像認識部51bは、認識する項目が「氏名_フリガナ」のような場合には、カタカナを出力するようなニューラルネットワークを用いて分割画像データから特徴点を抽出し、テキストよりも小さい因子である素因子テキストに分離されたテキスト候補を出力する。
また、「電話番号(TEL)」のような項目には、「03−3581−1111」等の電話番号に関する情報が入力されることが予想できる。つまり、「電話番号(TEL)」のような項目は、数字「0〜9」とハイフン「−」が入力され、他の文字(漢字、ひらがな等)は入力されない。よって、第2画像認識部51bは、認識する項目が「電話番号(TEL)」のような場合には、数字「0〜9」とハイフン「−」を出力するようなニューラルネットワークを用いて分割画像データから特徴点を抽出し、テキストよりも小さい因子である素因子テキストに分離されたテキスト候補を出力する。
よって、データ処理システム1は、データ管理装置3において、処理対象となる画像データを項目単位で分割した分割画像データをデータ処理装置4に送信し、データ処理装置4において、分割画像データに対して高精度な文字認識処理を行い、処理後のデータをデータ管理装置3に送信するので、提供元である顧客端末装置2で生成されたオリジナルの画像データをそのままの状態でデータ処理装置4が保持することなく、データ処理装置4でデータの処理を行うことができる。
<データ処理部32の第2実施例>
また、分割部11は、画像データの特徴部分を抽出する構成でもよい。当該構成の場合、データ処理部32は、分割画像データの画像認識処理を行って画像認識データを生成する。また、処理後データ送信部33は、データ処理部32により生成された画像認識データを処理後データとしてデータ管理装置3に送信する。
ここで、データ処理部32の第2実施例について説明する。なお、以下では、防犯カメラなどにより撮像された画像データ(図9中のG)を対象とする。分割部11は、当該画像データから特徴部分(図9中のg1,g2,g3)を抽出し、抽出した特徴部分を分割する。データ管理装置3は、分割画像データをデータ処理装置4に送信する。なお、本実施例では、特徴部分の一例を顔として説明するが、これに限らず、全身でもよいし、人以外の物(動物、車、建物など)でもよい。
例えば、データ処理部32は、粗い画質の分割画像データを処理し、鮮明な画質のデータを生成する構成でもよい。当該構成の場合、データ処理装置4は、鮮明な画質のデータを処理後データとしてデータ管理装置3に送信する。
また、データ処理部32は、分割画像データを解析処理して顔の特徴を特定し、顔の特徴から性別を判定する性別判定DBを参照して、分割画像データに映っている人物の性別を推定したり、顔の特徴から年齢を判定する年齢判定DBを参照して、分割画像データに映っている人物の年齢を推定する。当該構成の場合、データ処理装置4は、性別情報や年齢情報などを処理後データとしてデータ管理装置3に送信する。
よって、データ処理システム1は、データ管理装置3において、処理対象となる画像データの特徴部分である分割画像データをデータ処理装置4に送信し、データ処理装置4において、分割画像データに対して画像認識処理を行い、処理後のデータをデータ管理装置3に送信するので、提供元である顧客端末装置2で生成されたオリジナルの画像データをそのままの状態でデータ処理装置4が保持することなく、データ処理装置4でデータの処理を行うことができる。
つぎに、データ処理システム1を構成する顧客端末装置2とデータ管理装置3とデータ処理装置4の動作の流れについて図10〜図13を参照しながら説明する。なお、以下では、顧客端末装置2とデータ管理装置3とは接続されており、ファイル同期が可能な状態にある。
ステップS1において、顧客端末装置2は、接続されているスキャナによって書類(例えば、口座振替依頼書)をスキャンする。なお、スキャンされたデータは、例えば、pdfファイル形式で取り込まれるものとする。
ステップS2において、顧客端末装置2は、スキャンしたデータをメモリに保存する。このとき、同期処理によって顧客端末装置2からデータ管理装置3にデータが送信される。
ステップS3において、データ管理装置3は、同期処理によって顧客端末装置2から送信されてきたデータの読み込み前処理を行う。読み込み前処理により、画像データは、例えば、JPEG形式に変換される。
ステップS4において、分割部11は、画像データを項目ごとに分割して、分割画像データを生成する。
ステップS5において、連結情報生成部12は、ステップS4の工程において分割された各分割画像データに、元の画像データの一部として関連付けるためのエントリー番号と、固有の項目番号とを連結して連結情報Lを生成する。
ステップS6において、データ管理装置3は、図11に示すように、分割画像データの暗号化を行い、暗号化した分割画像データをデータ処理装置4に送信する。
具体的には、項目番号送信部17は、項目番号をデータ処理装置4に送信する。データ処理装置4のキー生成部34は、項目番号送信部17から送信されてきた項目番号に対して固有の暗号キーを生成する。キー送信部35は、キー生成部34により生成した暗号キーをデータ管理装置3に送信する。
ステップS7において、データ管理装置3のキー受信部18は、データ処理装置4から送信されてきた暗号キーを受信する。暗号化部19は、キー受信部18で受信した暗号キーにより、項目番号送信部17で送信した項目番号の分割画像データを暗号化する。例えば、暗号化部19は、項目ID「ABX1・・・」の暗号キーによって、分割画像データa1を暗号化(図11中の暗号化分割画像データA1)する。
また、データ管理装置3は、ステップS3の工程の読み込み前処理により変換した画像データを削除する。
ステップS8において、データ管理装置3の分割画像データ送信部13は、図12に示すように、暗号化部19で暗号化された暗号化分割画像データに対応する項目番号を付して順不同でデータ処理装置4に送信する。データ管理装置3は、元の画像データの書類IDやエントリーIDなどをデータ処理装置4に送信しない。つまり、データ管理装置4は、個人を特定し得る情報を扱わないといえる。
ステップS9において、データ処理装置4は、分割画像データの処理を行う。具体的には、分割画像データ受信部31は、分割画像データ送信部13から送信されてきた暗号化分割画像データを受信する。暗号化分割画像データ復号部36は、分割画像データ受信部31により受信した暗号化分割画像データを復号する。データ処理部32は、暗号化分割画像データ復号部36で復号した分割画像データの文字認識処理を行ってテキストデータに変換する。
ステップS10において、処理後データ送信部33は、データ処理部32で処理した処理後データ(テキストデータ)に暗号化を行い、暗号化された処理後データに対応する項目番号を付してデータ管理装置3に送信する。データ処理装置4は、データ管理装置3に送信した暗号化処理後データを削除する。
ステップS11において、データ管理装置3は、図13に示すように、暗号化処理後データを受信し、復号し、整形する。具体的には、処理後データ受信部14は、データ処理装置4から送信されてきた処理後データを受信する。
ステップS12において、暗号化処理後データ復号部20は、暗号化処理後データに対応する項目番号をデータ処理装置4に送信して、復号キーの生成を依頼する。データ処理装置4は、受信した項目番号に基づいて固有の復号キーを生成し、データ管理装置3に送信する。暗号化処理後データ復号部20は、復号キーによって暗号化処理後データを復号する。なお、データ管理装置4は、データ管理装置3に送信した復号キーを保存せずに破棄する。
特定部15は、連結情報に基づいて、処理後データに付されている項目番号からエントリー番号を特定する。連結部16は、特定部15で特定されたエントリー番号から元の画像データを構成する処理後データ同士を関連付ける。
よって、データ処理システム1は、顧客端末装置2に接続されているデータ管理装置3において、処理対象となる画像データを分割し、分割画像データを順不同でデータ処理装置4に送信し、データ処理装置4において、分割画像データに対して所定の処理を行い、処理後のデータをデータ管理装置3に送信することにより、提供元である顧客端末装置2で生成されたオリジナルの画像データをそのままの状態でデータ処理装置4が保持することなく、データ処理装置4でデータの処理を行うことができる。
なお、ステップS10からステップS12の工程は、データ処理装置4側で行う構成でもよい。当該構成の場合、データ処理装置4は、分割画像データを暗号テキストの形式で保持する。データ管理装置3は、項目ID(例えば、項目ID「ABX1・・・」)をデータ処理装置4に送信すると、データ処理装置4において当該項目IDに対応する暗号テキストが復号され、復号された復号後テキスト(例えば、複合後テキストA′′「特許」)がデータ処理装置4から送信されてくる。
また、上述では、処理後データは、データ処理部32で生成されるとして説明してきたが、これに限られない。例えば、データ処理装置4は、図14に示すように、記憶部30と、分割画像データ受信部31と、受付部40、操作部41と、処理後データ送信部33とを備える構成でもよい。受付部40は、分割画像データ受信部31で受信した分割画像データに基づいた操作部41による入力操作を受け付ける。処理後データ送信部33は、受付部40で受け付けた入力操作に基づく処理後データをデータ管理装置3に送信する。
例えば、オペレータは、ディスプレイに表示されている分割画像データを見ながら、キーボード等の操作部41を操作する。受付部40は、操作部41による入力操作に基づいて、テキストデータを生成し、生成したテキストデータを処理後データとして記憶部30に保存する。処理後データ送信部33は、記憶部30に記憶されている処理後データを読み出してデータ管理装置3に送信する。
このような構成によれば、データ処理装置4は、処理後データを生成する工程において、BPOで行われているサービス(データ入力代行サービス)を活用することができる。
また、本実施例では、主に、提供元で生成されたオリジナルのデータをそのままの状態で保持することなくデータの処理を行うことができるデータ処理システム1、データ管理装置3、データ処理装置4の構成と動作について説明したが、これに限られず、各構成要素を備え、提供元で生成されたオリジナルのデータをそのままの状態で保持することなくデータの処理を行うための方法、およびプログラムとして構成されてもよい。
さらに、データ管理装置を構成する各機能を実現するためのプログラムをコンピュータで読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、指示することによって実現してもよい。
具体的には、当該プログラムは、顧客端末装置2から送信されてきた画像データを分割する分割工程と、分割工程により分割された各分割画像データに、元の画像データの一工程として関連付けるためのエントリー番号とを連結して連結情報を生成する連結情報生成工程と、分割工程で分割された分割画像データを順不同でデータ処理装置4に送信する分割画像データ送信工程と、データ処理装置4から送信されてきた処理後データを受信する処理後データ受信工程と、連結情報に基づいて、処理後データ受信工程により受信した処理後データのエントリー番号を特定する特定工程と、特定工程で特定されたエントリー番号から元の画像データを構成する処理後データ同士を関連付ける関連付け工程と、をコンピュータによって実現するためのデータ管理プログラムである。
また、データ処理装置を構成する各機能を実現するためのプログラムをコンピュータで読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、指示することによって実現してもよい。
具体的には、当該プログラムは、データ管理装置3から順不同で送信されてきた分割画像データを受信する分割画像データ受信工程と、分割画像データの処理後データをデータ管理装置3に送信する処理後データ送信工程と、をコンピュータによって実現するためのデータ処理プログラムである。
ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータで読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータで読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
上記目的を達成するために、本発明の一態様におけるデータ処理システムは、データ管理装置とデータ処理装置とがネットワークを介して接続されるデータ処理システムにおいて、前記データ管理装置は、画像データを分割する分割部と、前記分割部により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号を関連付けて連結情報を生成する連結情報生成部と、前記分割部で分割された分割画像データを順不同で前記データ処理装置に送信する分割画像データ送信部と、前記データ処理装置から送信されてきた処理後データを受信する処理後データ受信部と、前記連結情報に基づいて、前記処理後データ受信部により受信した処理後データのエントリー番号を特定する特定部と、前記特定部で特定されたエントリー番号から元の画像データを構成する処理後データ同士を連結する連結部とを備え、前記データ処理装置は、前記分割画像データ送信部から順不同で送信されてきた分割画像データを受信する分割画像データ受信部と、前記分割画像データの処理後データを前記データ管理装置に送信する処理後データ送信部とを備え、前記データ管理装置では、前記連結情報生成部は、前記分割部により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号と、固有の項目番号とを関連付けて前記連結情報を生成し、項目番号を前記データ処理装置に送信する項目番号送信部と、前記データ処理装置から送信されてきた暗号キーを受信するキー受信部と、前記キー受信部で受信した暗号キーにより、前記項目番号送信部で送信した項目番号の分割画像データを暗号化する暗号化部とを備え、前記分割画像データ送信部は、前記暗号化部で暗号化された暗号化分割画像データに対応する項目番号を付して前記データ処理装置に送信し、前記特定部は、前記連結情報に基づいて、前記処理後データ受信部により受信した処理後データに付されている項目番号からエントリー番号を特定し、前記データ処理装置は、前記項目番号送信部から送信されてきた項目番号に対して固有の暗号キーを生成するキー生成部と、前記キー生成部により生成した暗号キーを前記データ管理装置に送信するキー送信部と、前記分割画像データ受信部は、前記分割画像データ送信部から送信されてきた暗号化分割画像データを受信し、前記分割画像データ受信部により受信した暗号化分割画像データを復号する暗号化分割画像データ復号部とを備え、前記処理後データ送信部は、対応する項目番号を付して処理後データを前記データ管理装置に送信する。
上記目的を達成するために、本発明の一態様におけるデータ管理装置は、画像データを分割する分割部と、前記分割部により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号を関連付けて連結情報を生成する連結情報生成部と、前記分割部で分割された分割画像データを順不同でデータ処理装置に送信する分割画像データ送信部と、前記データ処理装置から送信されてきた処理後データを受信する処理後データ受信部と、前記連結情報に基づいて、前記処理後データ受信部により受信した処理後データのエントリー番号を特定する特定部と、前記特定部で特定されたエントリー番号から元の画像データを構成する処理後データ同士を連結する連結部と、を備え、前記連結情報生成部は、前記分割部により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号と、固有の項目番号とを関連付けて前記連結情報を生成し、項目番号を前記データ処理装置に送信する項目番号送信部と、前記データ処理装置から送信されてきた暗号キーを受信するキー受信部と、前記キー受信部で受信した暗号キーにより、前記項目番号送信部で送信した項目番号の分割画像データを暗号化する暗号化部とを備え、前記分割画像データ送信部は、前記暗号化部で暗号化された暗号化分割画像データに対応する項目番号を付して前記データ処理装置に送信し、前記特定部は、前記連結情報に基づいて、前記処理後データ受信部により受信した処理後データに付されている項目番号からエントリー番号を特定する。
上記目的を達成するために、本発明の一態様におけるデータ管理方法は、画像データを分割する分割工程と、前記分割工程により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号を関連付けて連結情報を生成する連結情報生成工程と、項目番号をデータ処理装置に送信する項目番号送信工程と、前記データ処理装置から送信されてきた暗号キーを受信するキー受信工程と、前記キー受信工程で受信した暗号キーにより、前記項目番号送信工程で送信した項目番号の分割画像データを暗号化する暗号化工程と、前記分割工程で分割された分割画像データを順不同で前記データ処理装置に送信する分割画像データ送信工程と、前記データ処理装置から送信されてきた処理後データを受信する処理後データ受信工程と、前記連結情報に基づいて、前記処理後データ受信工程により受信した処理後データのエントリー番号を特定する特定工程と、前記特定工程で特定されたエントリー番号から元の画像データを構成する処理後データ同士を連結する連結工程と、を備え、前記連結情報生成工程は、前記分割工程により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号と、固有の項目番号とを関連付けて前記連結情報を生成し、前記分割画像データ送信工程は、前記暗号化工程で暗号化された暗号化分割画像データに対応する項目番号を付して前記データ処理装置に送信し、前記特定部は、前記連結情報に基づいて、前記処理後データ受信部により受信した処理後データに付されている項目番号からエントリー番号を特定する。
上記目的を達成するために、本発明の一態様におけるデータ管理プログラムは、画像データを分割する分割工程と、前記分割工程により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号を関連付けて連結情報を生成する連結情報生成工程と、項目番号をデータ処理装置に送信する項目番号送信工程と、前記データ処理装置から送信されてきた暗号キーを受信するキー受信工程と、前記キー受信工程で受信した暗号キーにより、前記項目番号送信工程で送信した項目番号の分割画像データを暗号化する暗号化工程と、前記分割工程で分割された分割画像データを順不同で前記データ処理装置に送信する分割画像データ送信工程と、前記データ処理装置から送信されてきた処理後データを受信する処理後データ受信工程と、前記連結情報に基づいて、前記処理後データ受信工程により受信した処理後データのエントリー番号を特定する特定工程と、前記特定工程で特定されたエントリー番号から元の画像データを構成する処理後データ同士を連結する連結工程と、をコンピュータによって実現するためのプログラムであって、前記連結情報生成工程は、前記分割工程により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号と、固有の項目番号とを関連付けて前記連結情報を生成し、前記分割画像データ送信工程は、前記暗号化工程で暗号化された暗号化分割画像データに対応する項目番号を付して前記データ処理装置に送信し、前記特定部は、前記連結情報に基づいて、前記処理後データ受信部により受信した処理後データに付されている項目番号からエントリー番号を特定するプログラムである。
上記目的を達成するために、本発明の一態様におけるデータ管理方法は、画像データを分割する分割工程と、前記分割工程により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号を関連付けて連結情報を生成する連結情報生成工程と、項目番号をデータ処理装置に送信する項目番号送信工程と、前記データ処理装置から送信されてきた暗号キーを受信するキー受信工程と、前記キー受信工程で受信した暗号キーにより、前記項目番号送信工程で送信した項目番号の分割画像データを暗号化する暗号化工程と、前記分割工程で分割された分割画像データを順不同で前記データ処理装置に送信する分割画像データ送信工程と、前記データ処理装置から送信されてきた処理後データを受信する処理後データ受信工程と、前記連結情報に基づいて、前記処理後データ受信工程により受信した処理後データのエントリー番号を特定する特定工程と、前記特定工程で特定されたエントリー番号から元の画像データを構成する処理後データ同士を連結する連結工程と、を備え、前記連結情報生成工程は、前記分割工程により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号と、固有の項目番号とを関連付けて前記連結情報を生成し、前記分割画像データ送信工程は、前記暗号化工程で暗号化された暗号化分割画像データに対応する項目番号を付して前記データ処理装置に送信し、前記特定工程は、前記連結情報に基づいて、前記処理後データ受信工程により受信した処理後データに付されている項目番号からエントリー番号を特定する。
上記目的を達成するために、本発明の一態様におけるデータ管理プログラムは、画像データを分割する分割工程と、前記分割工程により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号を関連付けて連結情報を生成する連結情報生成工程と、項目番号をデータ処理装置に送信する項目番号送信工程と、前記データ処理装置から送信されてきた暗号キーを受信するキー受信工程と、前記キー受信工程で受信した暗号キーにより、前記項目番号送信工程で送信した項目番号の分割画像データを暗号化する暗号化工程と、前記分割工程で分割された分割画像データを順不同で前記データ処理装置に送信する分割画像データ送信工程と、前記データ処理装置から送信されてきた処理後データを受信する処理後データ受信工程と、前記連結情報に基づいて、前記処理後データ受信工程により受信した処理後データのエントリー番号を特定する特定工程と、前記特定工程で特定されたエントリー番号から元の画像データを構成する処理後データ同士を連結する連結工程と、をコンピュータによって実現するためのプログラムであって、前記連結情報生成工程は、前記分割工程により分割された各分割画像データに、元の画像データの一部であることを示すエントリー番号と、固有の項目番号とを関連付けて前記連結情報を生成し、前記分割画像データ送信工程は、前記暗号化工程で暗号化された暗号化分割画像データに対応する項目番号を付して前記データ処理装置に送信し、前記特定工程は、前記連結情報に基づいて、前記処理後データ受信工程により受信した処理後データに付されている項目番号からエントリー番号を特定するプログラムである。