JP2016167712A - 情報処理装置、プログラム及び制御方法 - Google Patents
情報処理装置、プログラム及び制御方法 Download PDFInfo
- Publication number
- JP2016167712A JP2016167712A JP2015046431A JP2015046431A JP2016167712A JP 2016167712 A JP2016167712 A JP 2016167712A JP 2015046431 A JP2015046431 A JP 2015046431A JP 2015046431 A JP2015046431 A JP 2015046431A JP 2016167712 A JP2016167712 A JP 2016167712A
- Authority
- JP
- Japan
- Prior art keywords
- information
- property
- document
- received document
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Facsimiles In General (AREA)
Abstract
【課題】 本発明は受信文書に自動的にプロパティを付与して保存することで、ユーザーに利便性の高いシステムを提供することを目的とする。【解決手段】 本発明の情報処理装置は、ユーザー操作に基づく履歴座標を保存し、受信文書の文字認識を行い、履歴データの座標と受信文書の座標を比較し、座標が一致した場合に識別情報を決定し、画像の特徴量を用いて受信文書を分類し、受信文書にプロパティを付与し、プロパティが付与された受信文書を保存する指示を行い、決定手段により決定した識別情報に基づいて付与手段が受信文書にプロパティを付与する。【選択図】 図5
Description
本発明は受信文書にプロパティを付与する技術に関する。
従来、スキャンした文書や受信したFAXを紙で出力するのではなく、イメージとしてPC端末に取り込み、表示することによって、ペーパーレスを実現するシステムがある。特許文献1は、FAXにより受信された注文票をPC端末で表示し、FAXに含まれる情報をシステムに入力するFAX注文票ペーパーレス入力システムに関する技術を開示している。
特許文献1では必要な情報だけをデータベースに入力していた。この方法では最終的に保存したい情報が受信文書そのものである場合に対応できない。また、単に受信文書のみを保存してしまうと検索性が悪いという課題があった。
よって、本発明は受信文書に自動的にプロパティを付与して保存することで、ユーザーに利便性の高いシステムを提供することを目的とする。
上記の目的を達成するための本発明に係る情報処理装置は、
ユーザー操作に基づく履歴座標を保存する保存手段と、
受信文書の文字認識を行う認識手段と、
履歴データの座標と受信文書の座標を比較し、座標が一致した場合に識別情報を決定する決定手段と、
画像の特徴量を用いて受信文書を分類する分類手段と、
受信文書にプロパティを付与する付与手段と、
前記プロパティが付与された前記受信文書を保存する指示を行う保存手段と、を有し、
前記決定手段により決定した識別情報に基づいて前記付与手段が前記受信文書にプロパティを付与することを特徴とする。
ユーザー操作に基づく履歴座標を保存する保存手段と、
受信文書の文字認識を行う認識手段と、
履歴データの座標と受信文書の座標を比較し、座標が一致した場合に識別情報を決定する決定手段と、
画像の特徴量を用いて受信文書を分類する分類手段と、
受信文書にプロパティを付与する付与手段と、
前記プロパティが付与された前記受信文書を保存する指示を行う保存手段と、を有し、
前記決定手段により決定した識別情報に基づいて前記付与手段が前記受信文書にプロパティを付与することを特徴とする。
本発明によれば、受信文書にプロパティを付与して保存することで、ユーザーに利便性の高いシステムを提供することができる。
以下、本発明を実施するための形態について図面などを参照して説明する。なお、実施形態は、本発明を限定するものではなく、また、実施形態で説明されている全ての構成が本発明の課題を解決するための手段に必須であるとは限らない。
(第1実施形態)
[システム構成]
本実施形態に係る情報処理システムの一例として、スキャン文書管理システムを例に説明する。
[システム構成]
本実施形態に係る情報処理システムの一例として、スキャン文書管理システムを例に説明する。
図1は、スキャン文書管理システム1000の全体構成の一例を示す図である。
スキャン文書管理システム1000は、画像形成装置101、文書管理サーバー102、端末の一例であるモバイル端末103を有する。
スキャン文書管理システム1000は、画像形成装置101、文書管理サーバー102、端末の一例であるモバイル端末103を有する。
画像形成装置101は、ユーザー環境に配置された装置であり、ネットワーク100に接続される。文書管理サーバー102、モバイル端末103は、ユーザー環境に配置された装置であり、ネットワーク100を介して互いに通信可能に接続されている。
なお、図1において画像形成装置101、文書管理サーバー102、モバイル端末103は、同一ネットワークに属しているが、これに限定されるものではない。それぞれの装置は、独立したネットワークに属しているか、又はインターネット110に直接接続されていても構わない。また、各サーバーは、1台で構成されていてもよいし、複数台で構成されていてもよい。
モバイル端末103は画像形成装置101と同一のネットワークに存在し、HTTPプロトコルや、SMB(Server Message Block)プロトコル等で通信を行い、画像形成装置101でスキャンされたイメージを取得する。また、モバイル端末103は画像形成装置101と直接通信を行わないで、イントラネット内のストレージサーバーや、インターネットに接続された公知の一般的なストレージサーバーを経由する構成などであっても構わない。一般的なストレージサーバーの例としては、Microsoft(登録商標)社のOneDrive(登録商標)やGoogle(登録商標)社のGoogleドライブなどがある。
文書管理サーバー102は、文書ファイルおよび関連するプロパティ情報602の記憶、検索などを行える、文書の管理を行うサーバーである。
文章ファイルは文書管理サーバー102がサポートする画像フォーマットであり、スキャンデータから文章ファイルへの画像変換が必要な場合はモバイルアプリ304が行う。
文書管理サーバー102を経由することで、モバイル端末103から登録された文書やプロパティを、別の端末で検索、表示することが可能である。
本発明において、文書管理サーバー102が受け付ける情報、および、それに基づいて実行する処理については、規定されるものではない。また、入力元の情報がスキャンされたイメージから抽出された情報であることを、必ずしも想定する必要はない。文書管理サーバー102は、モバイル端末103で動作するアプリケーションを通じて文書情報の入力を受け付け、処理を行う。文書情報は、文章ファイルおよび、そのプロパティ情報602から構成される。文書情報は、モバイルアプリ304が文書管理サーバー102に設定する。
図1に示すスキャン文書管理システム1000構成において、画像形成装置101がスキャンしたイメージは、モバイル端末103上で動作するソフトウェアにより取得、文書の解析を行う。
さらに、モバイル端末103上で動作するソフトウェアは、文書の解析結果から、文書情報を文書管理サーバー102に登録する。
文書情報としては、文書ファイル、および、文書ファイルに関連した1個以上のプロパティ情報602が含まれる。文書ファイルのフォーマットは、文書管理サーバー102が認識可能なフォーマットであれば、画像、テキスト、その他の文書フォーマットなど特定のフォーマットである必要はない。
[ハードウェア構成]
図2は、スキャン文書管理システム1000を構成する各装置(画像形成装置101、文書管理サーバー102、及びモバイル端末103)のハードウェアの構成の一例を示す図である。
図2は、スキャン文書管理システム1000を構成する各装置(画像形成装置101、文書管理サーバー102、及びモバイル端末103)のハードウェアの構成の一例を示す図である。
スキャン文書管理システム1000を構成する各装置201は、各種のユニット(202〜207)を含んで構成される。
なお、スキャン文書管理システム1000を構成する各装置のハードウェア構成は同一でも構わないし、それぞれ異なっていても構わない。
CPU(Central Processing Unit)202は、各種のプログラムを実行し、様々な機能を実現するユニットである。ROM(Read Only Memory)204は、各種のプログラム等を記憶するユニットである。RAM(Random Access Memory)203は、各種の情報を記憶するユニットである。また、RAM203は、CPU202の一時的な作業記憶領域としても利用されるユニットである。例えば、CPU202は、ROM204に記憶されているプログラムをRAM203にロードしてプログラムを実行する。
加えて、CPU202がフラッシュメモリ、HDD(Hard Disk Drive)又はSSD(Solid State Disk)といった外部記憶装置に記憶されているプログラムに基づき処理を実行する。これにより、図3に示されるようなスキャン文書管理システム1000を構成する各装置のソフトウェア構成及び後述するシーケンスの各ステップの処理が実現される。
なお、各装置の機能及び後述するシーケンスに係る処理の全部又は一部については専用のハードウェアを用いて実現してもよい。
Input/Outputインターフェース205は、各装置に接続されているディスプレイ(不図示)にデータを送信する他、同じく各装置に接続されているポインティングデバイス(不図示)からデータを受信するユニットである。
NIC(Network Interface Card)206は、装置をネットワーク100に接続するためのユニットである。上述したユニットは、バス207を介してデータの送受信を行うことが可能に構成されている。
さらに、画像形成装置101は、スキャンユニット(不図示)を搭載しており、バス207を介して各ユニットとデータを送受信することが可能に構成されている。
ここで、画像形成装置101は、印刷ユニット(不図示)を更に搭載していても構わない。印刷ユニットは、バス207を介して各ユニットとデータを送受信することが可能に構成されている。なお、印刷ユニットは、ラスタイメージを紙などの記録媒体に記録(印刷)することが可能なユニットである。
そして、画像形成装置101は、スキャナユニット(不図示)を更に搭載していても構わない。スキャナユニットは、バス207を介して各ユニットとデータを送受信することが可能に構成されている。なお、スキャナユニットは、画像を入力することが可能なユニットである。
また、モバイル端末103では、Input/Outputインターフェース205にタッチパネル(不図示)が接続されている。タッチパネルは、ディスプレイ等の表示部の一例であり、出力(表示)と入力との2つの機能を備えている。
[ソフトウェア構成(全般)]
次に、スキャン文書管理システム1000を構成する各装置のソフトウェアの構成について説明する。図3は、各装置のソフトウェア構成の一例を示す図である。
次に、スキャン文書管理システム1000を構成する各装置のソフトウェアの構成について説明する。図3は、各装置のソフトウェア構成の一例を示す図である。
図3に示される各ソフトウェア(アプリケーション)における機能(モジュール部)を実現するプログラムは、各装置のROM204等に記憶されている。
[ソフトウェア構成(モバイル端末)]
次に、モバイル端末103におけるソフトウェアの構成について説明する。なお、モバイル端末103は、携帯端末の一例であり、無線通信機能などの装備によって自由な場所で利用できる端末である。
次に、モバイル端末103におけるソフトウェアの構成について説明する。なお、モバイル端末103は、携帯端末の一例であり、無線通信機能などの装備によって自由な場所で利用できる端末である。
モバイル端末103のOS(Operating System)(不図示)は、後述する各モジュール(画像管理部301、アドレス管理部302、及び通知処理部303)を有する。
画像管理部301は、画像やアプリケーションデータを管理する。OSは、画像管理部301を利用するための制御API(Application ProgrammingInterface)を提供している。各アプリはその制御APIを利用することで画像管理部301が管理する画像やアプリケーションデータの取得や保存を行う。
アドレス管理部302は、氏名や電話番号、住所などのアドレス情報を管理する。アドレス管理部302も画像管理部301と同様に、各アプリが利用するための制御APIを提供している。
通知処理部303は、通知サーバー(不図示)から通知情報を受信し、通知情報内のアプリのトークンを用いて通知の受信先であるアプリを特定し、アプリに対して通知情報を伝搬する。
モバイルアプリ(モバイルアプリケーション)304は、モバイル端末103のOSのインストール機能(例えばApple StoreやGoogle Play)を利用して、ダウンロードしインストールすることにより実行可能なアプリケーションである。モバイルアプリ304は、文書管理サーバー102が管理するデータに対する各種のデータ処理を行う。
メイン制御部305は、モバイル端末103用のアプリケーション(モバイルアプリ)304を制御し、後述する各モジュール部(306〜319)に対する指示、及び管理を行う。
情報表示部306は、メイン制御部305からの指示に従い、モバイルアプリ304のユーザインタフェース(UI)をユーザーに提供する。
図4は、モバイルアプリ304のUI(携帯端末用のUI)を提供する画面の一例(モバイル端末画面(400)を示す図である。モバイル端末画面400は、モバイル端末103のタッチパネルに表示される。また、モバイル端末画面400では、表示および操作領域401にスキャンデータが表示され、文書等に対するユーザーによる操作(ユーザ操作)を、表示されたUIを介して受け付ける。OCRボタン402は、後述のOCR画面1400に画面遷移するボタンである。
スキャンデータは画像形成装置101でスキャンされ、画像形成装置101がサポートする画像フォーマットで保存された画像ファイルである。
なお、モバイルアプリ304のUIの形態(位置、大きさ、範囲、配置、表示内容など)は、図に示す形態に限定されるものではなく、モバイル端末103の機能を実現することができる適宜の構成を採用することができる。
再び図3に戻ってモバイルアプリ304の各モジュールの説明を行う。
操作情報取得部307は、情報表示部306により表示されたモバイルアプリ304のUIがユーザー操作された情報を取得し、取得した情報をメイン制御部305に通知する。例えば、表示および操作領域401をユーザーが手で触れると、操作情報取得部307は、触れられた画面上の位置の情報を感知し、感知した位置の情報をメイン制御部305に送信する。
データ送受信部308は、画像形成装置101、文書管理サーバー102とデータの送信および受信を行い、送受信するデータをメイン制御部305とやり取りする。データ送受信部308は、スキャンデータ操作及びスキャンデータ編集によるファイルの更新を文書管理サーバー102に要求する。
記憶部309は、操作情報取得部307を介して、換言するならばモバイルアプリ304のUIを介して、ユーザーにより入力された設定値を保存(永続化)する。画像形成装置101から受信したスキャンデータ(受信文書)を記憶する。さらに記憶部309は、データ送受信部308で文書管理サーバー102から受信したプロパティ定義情報601を保存する。
プロパティ定義情報601は、文書管理サーバー102が定義し、モバイルアプリ304が取得してスキャンデータにプロパティを設定するために利用する。
画像解析部310は、スキャンデータの画像を解析して、レイアウト情報を生成する。レイアウト情報には、スキャンデータから抽出された矩形領域とその種別(文字、図形、線、表など)とが含まれる。
OCR部311は、画像解析部310で抽出した矩形領域の中で、文字と判定された矩形領域に対して、OCR(光学文字認識)処理を行う。
コマンド生成部312は、文書管理サーバー102の文書管理アプリ321に送信するコマンドを生成する。コマンドには、プロパティ情報602として、OCR部311で処理した結果やユーザーが入力した結果のテキスト情報が含まれる。
コマンド送受信部313は、文書管理サーバー102の文書管理アプリ321に、コマンド生成部312で生成したコマンドを送信し、その応答コマンド(応答情報)を受信する。コマンド解析部314は、コマンド送受信部313で受信した文書管理サーバー102の文書管理アプリ321からの応答コマンドを解析し、スキャンデータに対する処理を実行する。
画像分類部315は、画像形成装置101から受信したスキャンデータに対して、予め学習処理を行った特徴量を用いて分類処理を行い、スキャンデータの分類を行う。
操作履歴管理部316は、ユーザーが選択した短形領域の座標情報、OCR結果のテキスト情報、文書管理アプリ321に送信したコマンド等をDB部317のデータベースを用いて管理する。
DB部317はデータベース機能を有し、操作履歴情報を管理する。
座標処理部318は、データベースへ座標情報を登録する際の座標正規化処理やデータベースへの座標問い合わせ時の座標補正処理行う。
プロパティ管理部319は、プロパティ定義情報601およびプロパティ情報602を管理する。スキャンデータに応じて必要なプロパティ定義情報601を文書管理サーバー102から取得し、プロパティ定義情報601に基づいて文書管理サーバー102に設定するプロパティ情報602の値を管理する。
[ソフトウェア構成(文書管理サーバー)]
次に、文書管理サーバー102におけるソフトウェアの構成について説明する。
次に、文書管理サーバー102におけるソフトウェアの構成について説明する。
文書管理サーバー102は、PCにインストールされたOS上で動作するアプリケーションである。
文書管理アプリ321のモジュール構成について説明する。
文書管理アプリ321のモジュール構成について説明する。
メイン制御部322は、文書管理を行うための後述する各モジュール部(323〜327)に対する指示、管理を行う。
記憶部323は、文書管理アプリ321の設定情報や、プロパティ定義情報601、文書情報である文章ファイルやプロパティ情報602を保存する。文書管理サーバー102は、文章ファイルに必要なプロパティ情報602を、事前にプロパティ定義情報601として定義しておく。
画像形成装置101がスキャン時に作成するスキャンデータをモバイルアプリ304が取得する。そして、文書管理アプリ321は、スキャンデータから生成される文章ファイルに対してプロパティ情報602を付与して、プロパティ情報602が付与された文章ファイルを文書管理サーバー102に保存するための指示を行う。
プロパティ定義情報601は、1個以上のプロパティ情報602の定義から構成されていて、必須でないプロパティ情報602については、モバイルアプリ304が設定をしなくてもエラーとしない。
コマンド受信部324は、モバイル端末103のモバイルアプリ304からコマンドを受信する。
コマンド管理部325は、コマンド受信部324で受信したコマンドを解析する。
スクリプト実行部326は、コマンド管理部325がコマンドを解析した結果、コマンドの内容に含まれる処理内容を実行する。
文書管理部327は、メイン制御部322からの指示で記憶部323に対してプロパティ定義情報601、文書情報などの管理を行う。
文書管理サーバー102は、複数のプロパティ定義情報601の管理を行い、1つのプロパティ定義情報601には、複数のプロパティの定義が含まれる。文書管理サーバー102は、プロパティ定義情報601に紐付けられた各文書情報を管理する。
プロパティ定義情報601は、文書管理サーバー102が定義し、モバイルアプリ304が取得して利用する。
文書管理サーバー102で定義されるプロパティ定義情報601は、管理する文書をカテゴライズして各カテゴリに対して所定の属性を付与するために定義する。
プロパティ定義情報601に示されるプロパティ定義情報は、3階層のエレメントを含む。
1階層目は、文書管理サーバー102の文書管理アプリ321を識別する情報として、文書管理アプリ識別情報を含む。2階層目は、文書管理アプリ321の保持する文書カテゴリを識別する情報を含む。このエレメントにより管理する文書カテゴリを指定する事が可能である。3階層目は、各文書カテゴリに含まれる複数のプロパティを含む。各プロパティ情報は、それぞれ複数の属性を含む。
一例としてサンプルのプロパティ定義情報601を示す。
また、プロパティ情報602(プロパティ)は、モバイルアプリ304がプロパティ定義情報601に基づいて値を文書管理サーバー102に設定する。
一例としてサンプルのプロパティ情報602を示す。
文書管理サーバー102は、これらの情報を、モバイルアプリ304から入出力できるインターフェースを備えている。
なお、本発明において、文書管理アプリ321は、プロパティ定義情報601の定義を行う機能を備える。
また、文書情報として、文章ファイルおよび、プロパティ定義情報601に基づいたプロパティ情報602を管理できる機能を備えればよいため、その詳細については省略する。
[ソフトウェア構成(画像形成装置)]
次に、画像形成装置101におけるソフトウェアの構成について説明する。
次に、画像形成装置101におけるソフトウェアの構成について説明する。
画像形成装置101は、画像形成装置101のオペレーティングシステム(不図示)上で複数のアプリケーションを実行する。図3では複数のアプリケーションの一つであるスキャンアプリ341について記載している。以降ではこのスキャンアプリ341のモジュール構成について説明する。
メイン制御部342は、スキャンアプリ341の各モジュールを制御し、各モジュールに対して指示し、各モジュールの管理を行う。
スキャンアプリ341がスキャンしたスキャンデータは、ネットワーク100上の情報機器のストレージに保存する事が可能である。
また、画像形成装置101上の記憶部346であるストレージに保存されているスキャンデータをネットワーク100上の情報機器から参照、取得する事も可能である。
情報表示部343は、メイン制御部342からの指示に従い、ユーザーは、このUI上でスキャンデータの保存先(モバイル端末103)を指定することができる。
操作情報取得部344は、情報表示部343により表示されたスキャンアプリ341のUI上のユーザー操作を情報として取得し、取得した情報をメイン制御部342に通知する。
データ送受信部345は、文書管理サーバー102とデータの送信および受信を行う。
記憶部346は、情報表示部343及び操作情報取得部344を介してユーザーにより入力された設定値(例えば電話番号毎の振り分け先情報など)及び送受信するスキャンデータの一時保存などを実行する。
[基本フロー]
次に、スキャン文書管理システム1000の基本的な処理フローについて図5を用いて説明する。
次に、スキャン文書管理システム1000の基本的な処理フローについて図5を用いて説明する。
S501で画像形成装置101は、ユーザーのスキャン開始指示を受けてスキャンを実行し、スキャンデータの作成をする。スキャン画像とスキャン情報(解像度や各種フォーマット情報など)をスキャンデータとして画像形成装置101内のRAMに保存する。
スキャンデータの例としては、JPEG(Joint Photographic Experts Group:ISO/IEC JTC 1/SC 29/WG 1)ファイル、TIFF(Tagged Image File Format)ファイル、PDF(ISO 32000−1:2008)ファイルフォーマットなどが利用できる。
スキャンアプリ341のメイン制御部342は、記憶部346は、RAMに保存されたスキャンデータを記憶する。
S502で画像形成装置101のメイン制御部342は、データ送受信部345を介してスキャンデータをモバイル端末103へ送信する。
スキャンアプリ341は、プッシュスキャンの送信先としてモバイル端末103が設定されている場合、記憶部346に記憶されたスキャンデータを指定されたモバイル端末103へ送信する。
本実施例では、プッシュスキャンの例を示したが、モバイル端末103から画像形成装置101へのプルスキャンの場合は、モバイル端末103が画像形成装置101のスキャンデータを監視することで、同様の処理を行える。また、画像形成装置101とモバイル端末103間の通信方式については問わない。
S503でモバイル端末103のモバイルアプリ304のメイン制御部305は、スキャンデータを画像形成装置101からS502のスキャンデータを取得し、情報表示部306は、スキャンデータに基づいてUI(User Interface)を表示する。
S504で、画像分類部315は、スキャンデータを解析してスキャンデータの分類を判定する。画像分類処理の方法については図7以降を用いて後述する。
画像分類部はスキャンデータについて該当する分類が無いと判定した場合、ユーザーからの分類情報入力を受け付け、ユーザーの入力した分類をスキャンデータに設定する。また、画像分類部315が判定したスキャンデータの分類についても、ユーザーの訂正入力した分類をスキャンデータに設定する。
S505で、プロパティ管理部319は、S504で設定された分類(710)に対応するプロパティ定義情報601を文書管理サーバー102から取得する。
本実施例においては、プロパティ管理部319は、スキャンデータから設定された分類1(704)に紐付いたプロパティ定義情報601であるclassification1のプロパティ定義情報601が記憶部309に存在するか判定を行う。
記憶部309にclassification1のプロパティ定義情報601が保存されている場合は、保存されたclassification1のプロパティ定義情報601を取得し、S511に処理を進める。
記憶部309にclassification1のプロパティ定義情報601が保存されていない場合は、S507に処理を進める。
なお、画像分類部315は、スキャンデータの分類(710)が2の場合はプロパティ定義情報601がclassification2と判定を行う。また、スキャンデータの分類(710)が3の場合はプロパティ定義情報601がclassification3と判定を行う。
S506で文書管理サーバー102の文書管理アプリ321のメイン制御部322は、文書カテゴリ毎にプロパティ定義情報601を事前に設定しておく。文書カテゴリは、文書管理アプリ321で規定する文書の分類カテゴリをあらわす。
一般に、文書カテゴリは複数設定可能であり、文書管理サーバー102は、文書カテゴリ毎に文書情報を記憶部323に記憶することで、保存された文章ファイルを、紐付けられたプロパティ情報602から検索可能となる。
S507で、文書管理サーバー102の文書管理アプリ321のメイン制御部322は、モバイル端末103のモバイルアプリ304からコマンドを受信する。受信コマンドから定義情報取得リクエストと判断された場合はS508に処理を進める。
S508で、文書管理サーバー102の文書管理アプリ321は、S505でモバイル端末103から要求されたclassification1のプロパティ定義情報601を返信する。
本実施例のclassification1のプロパティ定義情報601の例を図6の601に示す。
S509で、モバイル端末103のモバイルアプリ304は、S508で文書管理サーバー102が送信したプロパティ定義情報601を受信する。
S510で、モバイルアプリ304の情報表示部306は、S503で取得したスキャンデータとプロパティ定義情報601に基づきスキャンデータをUIに表示する。
本実施例でのプロパティ定義情報601に基づいたUI表示例を図13に示す。
図13のUI表示例では、画面上部のプロパティ定義情報に基づいてプロパティ情報を入力するためのプロパティ定義情報テキスト表示エリア1310と、画面下部のスキャンデータを表示するOCR画面1309とで構成されている。
情報表示部306は、プロパティ定義情報テキスト表示エリア1310にプロパティ情報602を入力できるUIの表示を行う。
プロパティ定義情報テキスト表示エリア1310は、文書管理サーバー102から取得したがプロパティ定義情報601で定義されるプロパティ項目を表示することでプロパティ情報602の入力を行う。
具体的には、ItemPropertyの1項目目(Internalnameが”companyName”)を会社名表示エリア1311として表示を行う。DisplayNameの”会社名”を会社名表示エリア1311に表示し、ここで入力された値をcompanyNameの設定値としてプロパティ情報602に設定する。
同様に、ItemProperty2項目目(Internalnameが”tel”)をユーザー電話番号表示エリア1312として表示を行う。ItemProperty3項目目(Internalnameが”date”)を日付表示エリア1313として表示を行う。ItemProperty4項目目(Internalnameが”code”)を商品コード表示エリア1314として表示を行う。ItemProperty5項目目(Internalnameが”num”)を数量入力表示エリア1315として表示を行う。
S511で、モバイル端末103のモバイルアプリ304は、OCR処理および、操作履歴処理を実行し、スキャンデータに表示する。
画像解析部310は、スキャンデータに含まれるスキャンデータを解析してレイアウト情報を取得する。文字と認識された領域に関して、OCR部311はOCR処理を行い、テキスト情報を生成する。
OCR処理および、操作履歴処理の詳細は、図12および、図13を用いて後述する。
S512で、文書情報(イメージから抽出した情報とプロパティ情報602、分類カテゴリ、および、登録先情報)をボタン操作で送る。文書情報に含まれる文書ファイルの登録先情報は、S504で設定されたスキャンデータの分類に基づいて決定される。
ユーザー操作によりUI上の送信ボタン1308を押下することにより、コマンド生成部312は生成したプロパティ情報602の送信を指示する。コマンド生成部312はプロパティ情報602から文書管理サーバー102の文書管理アプリ321に送信するコマンドを生成する。コマンド送受信部313は、コマンド生成部312が生成したコマンドを文書管理サーバー102の文書管理アプリ321に送信する。
S513で文書管理サーバー102の文書管理アプリ321はS512でモバイル端末103が送信したコマンドをコマンド受信部324で受信する。コマンド管理部325は、コマンドに含まれる文書情報を解析する。
S514で文書管理サーバー102のコマンド管理部325は、S512で設定された文書情報をもとに記憶部323に保存する。記憶部323に保存する内容としては、文書情報に含まれる文章ファイルをS512で設定された登録先情報をもとに保存先ディレクトリが決定され、格納し、さらに文章ファイルに紐付けたプロパティ情報602を記憶する。
S515で文書管理サーバー102のメイン制御部322は、文書管理部327の処理結果を取得し、応答コマンドとして、モバイル端末103のモバイルアプリ304に返信する。
S516でモバイル端末103のモバイルアプリ304は、S515の処理結果を表示して文書登録処理を終了する。
[データ構造]
次に、モバイル端末103のモバイルアプリ304と、文書管理サーバー102の文書管理アプリ321との間で送受信されるコマンドについて説明する。
次に、モバイル端末103のモバイルアプリ304と、文書管理サーバー102の文書管理アプリ321との間で送受信されるコマンドについて説明する。
図6は、本実施形態におけるコマンドのデータ構造の一例を示す図である。
コマンド601は、文書管理サーバー102で定義され、S508で文書管理サーバー102の文書管理アプリ321が、モバイル端末103のモバイルアプリ304に送信するプロパティ定義情報601の例を示す。
プロパティ定義情報601は、文書管理サーバー102で定義され、文書をカテゴライズして各カテゴリに対して所定の属性を付与するために定義する(S506)。
プロパティ定義情報601に示されるプロパティ定義情報は、<Root>エレメントに3階層のエレメントを含む。
<Root>エレメントから1階層目は、文書管理サーバー102の文書管理アプリ321を識別する情報として、<DocumentService>の文書管理アプリ識別情報エレメントを含む。<DocumentService Version=”1.0”>は、文書管理サーバー102において複数の文書管理アプリが動作している場合においても、クライアントであるモバイル端末103のモバイルアプリ304が文書管理アプリ識別情報により特定ができる。
<Root>エレメントから2階層目は、文書管理アプリ321の保持する文書カテゴリを識別する情報として、<classification1>エレメントを含む。このエレメントにより管理する文書カテゴリを指定する事が可能である。本実施例では、文書カテゴリとして、文書管理サーバー102において、704、705、706で分類可能な文書を登録する。
文書カテゴリは、それぞれ異なるカテゴリclassification1、classification2、classification3として登録することで、それぞれのカテゴリに属する文書を異なるプロパティ定義情報601として管理できる。
classification1としては、文書に紐付くプロパティとして、識別子(Internalname)として、”companyName”,”tel”,”date”,”code”,”num”のプロパティ情報602を記憶する(S514)ことが可能である。
また、別の文書カテゴリとしてclassification2を定義する場合の例を示す。
<classification2>
Internalname="companyName" Type="String" DisplayName="会社名" Required="False" Visible="True"></ItemProperty>
Internalname="tel" Type="String" DisplayName="ユーザー電話番号" Required="False" Visible="True"></ItemProperty>
</classification2>
この例では、分類2(classification2)の文書カテゴリで指定された文書に対して、モバイルアプリ304は、Internalname=”companyName”と”tel”のみプロパティ情報602として入力するUIを表示し、文書管理サーバー102に登録することが可能となる。
<classification2>
Internalname="companyName" Type="String" DisplayName="会社名" Required="False" Visible="True"></ItemProperty>
Internalname="tel" Type="String" DisplayName="ユーザー電話番号" Required="False" Visible="True"></ItemProperty>
</classification2>
この例では、分類2(classification2)の文書カテゴリで指定された文書に対して、モバイルアプリ304は、Internalname=”companyName”と”tel”のみプロパティ情報602として入力するUIを表示し、文書管理サーバー102に登録することが可能となる。
<Root>エレメントの3階層目は、分類<classification1>に含まれる複数のプロパティ(ItemProperty)を含む。各プロパティ情報は、それぞれ、複数の属性を含む。
「Internalname」属性は、文書管理サーバー102が該当の文書カテゴリで管理する属性を示す。
文書管理サーバーでは文書カテゴリ毎に、複数の属性を設定できる。本実施例では、”companyName”,”tel”,”date”,”code”,”num”などの例を示したがこの限りではない。
「Type」属性は、プロパティ識別情報(Internalname)の値の型を示す。
「DisplayName」属性は、プロパティ識別情報(Internalname)をUIに表示するための文字列を示す。
「Required」属性は、プロパティ識別情報(Internalname)の値が、該当の文書カテゴリにおいて必須であるかを示す。必須の場合は”True”、必須でない場合は”False”をセットする。
「Visible」属性は、プロパティ識別情報(Internalname)の値を、UIで表示するかを示す。表示する場合は”True”、表示しない場合は”False”をセットする。
コマンド602は、S512でモバイル端末103のモバイルアプリ304が、図13で示すUIで入力された情報により、文書管理サーバー102の文書管理アプリ321に送信するプロパティ情報602の例を示す。
プロパティ定義情報テキスト表示エリア1310の会社名表示エリア1311に入力された値は、プロパティ情報602のinternalnameが”companyName”の値として設定される。
同様に、ユーザー電話番号表示エリア1312に入力された値は、プロパティ情報602のinternalnameが”tel”の値として設定される。日付表示エリア1313に入力された値は、プロパティ情報602のinternalnameが”date”の値として設定される。商品コード表示エリア1314に入力された値は、プロパティ情報602のinternalnameが”code”の値として設定される。数量入力表示エリア1315に入力された値は、プロパティ情報602のinternalnameが”num”の値として設定される。
プロパティ情報602は、モバイルアプリ304がプロパティ定義情報601に基づいて値を文書管理サーバー102に設定される(S514)。
なお、モバイルアプリ304が文書管理アプリ321に登録する文書情報は、文章ファイルおよび、文章ファイルに紐付けるプロパティ情報602が含まれる。
なお、本XMLは一例であり、他のコマンドフォーマット、プロトコル、通信方式を利用した場合においても、本実施例で示した同様の処理を行う事が可能である。
[画像分類処理]
次に、画像分類部315が行うスキャンデータの分類について図7を用いて説明する。画像分類部315は、学習処理部701と分類処理部702から構成される。画像分類部315は、予め学習処理部701で学習処理を行い、特徴量データをDB部317の特徴量DB707に蓄えておく。さらに画像分類部315は、特徴量DB707の情報に基づき分類処理部702で分類処理を行い、分類を決定する。
次に、画像分類部315が行うスキャンデータの分類について図7を用いて説明する。画像分類部315は、学習処理部701と分類処理部702から構成される。画像分類部315は、予め学習処理部701で学習処理を行い、特徴量データをDB部317の特徴量DB707に蓄えておく。さらに画像分類部315は、特徴量DB707の情報に基づき分類処理部702で分類処理を行い、分類を決定する。
一般的にイメージの特徴を表す特徴量データは、多次元のデータで表し、特徴ベクトルと呼ばれる。
学習処理部701で行う学習処理は、分類毎の複数の学習画像から特徴抽出を行い、各学習画像に対して、100次元の特徴ベクトルを算出する。さらに複数の学習画像の特徴ベクトルを元に、100次元の特徴ベクトルからその分類を特徴づける10次元の特徴ベクトルを決定する。この次元削減処理を行うソフトウェアモジュールをフィルタと呼ぶ。分類毎に算出した特徴ベクトル(10次元)及びにフィルタは、DB部317の特徴量DB707で管理する。
分類処理部702で行う分類処理は、入力スキャンデータ703の特徴抽出を行い、特徴ベクトル(100次元)を算出する。入力スキャンデータ703の特徴ベクトル(100次元)に対して特徴量DB707の各分類のフィルタを適用(主成分分析)し、各分類に対応した特徴ベクトル(10次元)を算出する。そして入力スキャンデータ703の特徴ベクトル(10次元)と特徴量DBの特徴ベクトル(10次元)を比較し、類似度判定により分類を決定する。
図7の学習結果709は、学習処理により特徴量DB707に蓄えられたデータの一例を表している。特徴量DB707には、分類1(704)、分類2(705)、分類3(706)を分類可能な特徴ベクトル(10次元)とフィルタが蓄えられている。また分類710は、分類処理により入力画像と特徴量DB707の情報を元に分類が決定した例を表している。入力スキャンデータ703を入力し、分類1(704)、分類2(705)、分類3(706)の中から入力画像の分類結果708が分類1(704)に判別されたことを示している。なお、画像分類部315が行う画像分類は、本形態に限定されるものではなく、本機能を実現することができる適宜の手法を採用することができる。
本実施例において、スキャンデータの分類に紐付けて、文書管理サーバ(102)のプロパティ管理部319にプロパティ定義情報601を設定する。
モバイルアプリ304は、分類(710)からスキャンデータに応じて文書管理サーバー(102)が必要なプロパティ定義情報601を判定できる。
[座標処理]
次に、座標処理部318が行う座標正規化処理について図8を用いて説明する。
次に、座標処理部318が行う座標正規化処理について図8を用いて説明する。
座標正規化処理は、元画像の縦横に依存しない、かつdpiが異なる場合でも対応可能にするために行うもの処理である。
ユーザーが行った送信操作の選択領域の座標情報をDB部317へ登録する際、また登録された操作履歴をDB部317に問い合わせる際に行われる。
まず座標系には、ディスプレイ座標(ディスプレイのどの位置)、スキャンデータ座標(スキャンデータのどの位置)、データベース登録座標がある。
座標正規化処理とは、ユーザーによりディスプレイで選択された選択座標からスキャンデータ座標に変換し、さらにデータベース登録座標に変換する処理のことである。
データベース登録座標はスキャンデータ座標の全体に対する割合に10000を掛け合わしたものとする。
ここでは単純化のためにディスプレイ座標とスキャンデータ座標は一致しており、スキャンデータ801の横が1500px、縦が2000pxの場合で説明する。選択領域802の左上座標803が(X,Y)=(200,700)、右下座標804が(400、750)の場合、データベース登録座標は(1333、3500)、(2666,3750)となる。以下、データベース登録座標の左上X座標をminX、右下X座標をmaxX、左上Y座標をminY、右下Y座標をmaxYとする。
[データ構造(DB)]
次に、DB部317の操作履歴データベース900について説明する。図9は、本実施形態における操作履歴データベース900のデータ構造の一例を示す図である。操作履歴データベース900は、送信履歴Table901と送信領域Table902から構成される。
次に、DB部317の操作履歴データベース900について説明する。図9は、本実施形態における操作履歴データベース900のデータ構造の一例を示す図である。操作履歴データベース900は、送信履歴Table901と送信領域Table902から構成される。
送信履歴Table901は、idカラム、Internalnameカラム、classificationカラム、ocrresultカラム、sendmessageカラムから構成される。idカラムは送信履歴Table901にレコードが追加されるたびに1インクリメンタルされる値で、TableのPrimary keyである。Internalnameカラムは送信結果のプロパティ識別情報を格納する。classificationカラムは、スキャンデータの分類結果(例えば図11の1108)を格納する。ocrresultカラムは選択領域のOCR結果を格納する。sendmessageは送信結果(送信したテキスト情報)を格納する。
送信領域Table902は、idカラム、minXカラム,maxXカラム,minYカラム,maxYカラムから構成される。minXカラムは、選択領域の左上X座標を格納する。maxXカラムは、選択領域右下X座標を格納する。minYカラムは、選択領域の左上Y座標を格納する。maxYカラムは、選択領域右下Y座標を格納する。また送信領域Table902は、R−treeインデックス(多次元情報のインデックス付け)手法を使うことにより領域検索を高速に行える構成になっている。
SQL文903〜910は、操作履歴データベース900に対する各種問い合わせSQL文を表現した例である。SQL文903は送信履歴Table901を新規作成するためのSQL文である。SQL文904は送信領域Table902を新規作成するためのSQL文である。SQL文903、904は、アプリの初期化時に実行され、作成されたTableはDB部317に保存する。SQL文905は、同一分類の送信履歴があるかどうかを確認するSQL文である。SQL文906は、同一分類で、選択座標と一致するもがあるかどうかを確認するSQL文である。SQL文907は、同一分類で、選択座標が一致した履歴のプロパティ識別情報がすべて一致するかどうかを確認するSQL文である。SQL文908は、同一分類で、座標が一致した履歴の送信結果がすべて一致するかどうかを確認するSQL文である。SQL文909は、同一分類で、OCR結果が一致したものがあるかどうかを確認するSQL文である。SQL文910は、分類情報をキーに送信履歴を保存するSQL文である。
[OCR画面(モバイル端末)]
次に、モバイル端末103におけるOCR画面について図10を用いて説明する。OCR画面1000は、モバイル端末画面400のOCRボタン402を押すと表示される画面である。OCR画面表示時にスキャンイメージに対して、オブジェクトをブロックとして認識し、そのブロックに対してOCR処理する。さらにテキストと認識されたものを1009,1011に示すように選択可能領域として、四角で囲って選択可能状態で表示する。選択可能領域1009,1011は、オブジェクト認識、OCRの結果としてテキストと認識されたものが四角で囲って選択できるようになったものである。ボタン表示領域1002は、ボタン設定画面(不図示)で設定したボタンを表示するための領域である。ボタン1004〜1006を押した後に選択可能領域を押すと選択可能領域のOCR結果を文書管理アプリ321にコマンド送信することが出来る。表示名領域1008は、ボタンに定義した表示名を表示する領域である。選択済み領域は、選択可能領域をユーザーが選択した時に選択されたことが分かるように、1010に示すように選択可能領域に印が付いたものである。ユーザーが選択可能領域を選択すると、その領域は選択済み領域になり、後述する送信確認画面1100に遷移する。
次に、モバイル端末103におけるOCR画面について図10を用いて説明する。OCR画面1000は、モバイル端末画面400のOCRボタン402を押すと表示される画面である。OCR画面表示時にスキャンイメージに対して、オブジェクトをブロックとして認識し、そのブロックに対してOCR処理する。さらにテキストと認識されたものを1009,1011に示すように選択可能領域として、四角で囲って選択可能状態で表示する。選択可能領域1009,1011は、オブジェクト認識、OCRの結果としてテキストと認識されたものが四角で囲って選択できるようになったものである。ボタン表示領域1002は、ボタン設定画面(不図示)で設定したボタンを表示するための領域である。ボタン1004〜1006を押した後に選択可能領域を押すと選択可能領域のOCR結果を文書管理アプリ321にコマンド送信することが出来る。表示名領域1008は、ボタンに定義した表示名を表示する領域である。選択済み領域は、選択可能領域をユーザーが選択した時に選択されたことが分かるように、1010に示すように選択可能領域に印が付いたものである。ユーザーが選択可能領域を選択すると、その領域は選択済み領域になり、後述する送信確認画面1100に遷移する。
[送信確認画面(モバイル端末)]
次に、モバイル端末103における送信確認画面について図11を用いて説明する。1100は送信確認画面である。送信確認画面1100では、ユーザーが選択した領域のOCR結果を見て、間違いがないと判断すれば文書管理アプリ321に送信する。さらに間違いがあれば、修正あるいは送信をキャンセルするための画面である。選択済み画像表示領域1101は、ユーザーが選択した選択可能領域の画像を拡大して表示する。テキスト入力エリア1102は、選択された選択可能領域のOCR処理結果のテキスト情報、あるいは操作履歴データベース900から決定された送信結果情報を初期値として編集可能な入力エリアである。テキストクリアボタン1103は、テキスト入力エリアのテキスト値をクリアするボタンである。OCR結果が間違っていた場合などに使用する。送信実行ボタン1104は、送信を実行するボタンである。ボタンを押すとコマンドが文書管理アプリ321に送信される。キャンセルボタン1105は、画面をキャンセルするボタンであり、OCR画面に戻る。
次に、モバイル端末103における送信確認画面について図11を用いて説明する。1100は送信確認画面である。送信確認画面1100では、ユーザーが選択した領域のOCR結果を見て、間違いがないと判断すれば文書管理アプリ321に送信する。さらに間違いがあれば、修正あるいは送信をキャンセルするための画面である。選択済み画像表示領域1101は、ユーザーが選択した選択可能領域の画像を拡大して表示する。テキスト入力エリア1102は、選択された選択可能領域のOCR処理結果のテキスト情報、あるいは操作履歴データベース900から決定された送信結果情報を初期値として編集可能な入力エリアである。テキストクリアボタン1103は、テキスト入力エリアのテキスト値をクリアするボタンである。OCR結果が間違っていた場合などに使用する。送信実行ボタン1104は、送信を実行するボタンである。ボタンを押すとコマンドが文書管理アプリ321に送信される。キャンセルボタン1105は、画面をキャンセルするボタンであり、OCR画面に戻る。
[操作履歴データベースの一例]
次に、操作履歴データベース900が保持する情報の一例について図12を用いて説明する。
次に、操作履歴データベース900が保持する情報の一例について図12を用いて説明する。
スキャンデータ1200に対して画像分類部315が、分類を「分類1」と決定し、ユーザーが選択領域1201〜1205を文書管理アプリ321に送信した場合の具体例が、送信履歴Table具体例1206と送信領域Table具体例1207である。
送信履歴レコード1208は、スキャンデータ1200の選択領域1201を選択し、プロパティ識別情報を「tel」、OCR結果が「080−1284−1234」であるものを送信確認画面1100で修正し、「080−1234−1234」として送信したことを示す。また送信履歴レコード1209は、スキャンデータ1200の選択領域1202を選択し、プロパティ識別情報を「code」、OCR結果が「2301119」であるものを送信確認画面1100で修正し、「2801119」として送信したことを示す。また送信履歴レコード1210は、スキャンデータ1200の選択領域1203を選択し、プロパティ識別情報を「code」、OCR結果が「3891120」であるものを送信確認画面1100で修正することなくそのまま送信したことを示す。また送信履歴レコード1201は、スキャンデータ1200の選択領域1204を選択し、プロパティ識別情報を「num」、OCR結果が「3」であるものを送信確認画面1100で修正することなくそのまま送信したことを示す。また送信履歴レコード1212は、スキャンデータ1200の選択領域1205を選択し、プロパティ識別情報を「num」、OCR結果が「3」であるものを送信確認画面1100で修正することなくそのまま送信したことを示す。
[プロパティ情報602入力画面の一例]
次に、モバイル端末103におけるプロパティ情報602入力画面について図13を用いて説明する。
次に、モバイル端末103におけるプロパティ情報602入力画面について図13を用いて説明する。
キャンセルボタン1301は、画面をキャンセルするボタンであり、OCR画面に戻る。
ボタン表示領域1302は、ボタン設定画面(不図示)で設定したボタンを表示するための領域である。ボタン1303〜1306を押した後に選択可能領域を押すと選択可能領域のOCR結果を文書管理アプリ321にメッセージ送信することが出来る。
クリアボタン1303は、テキスト入力エリアのテキスト値をクリアするボタンである。OCR結果が間違っていた場合などに使用する。
電話番号ボタン1304は、プロパティ定義情報601の識別情報であるInternalname=”tel”のプロパティ情報602を入力するためのボタンである。
電話番号ボタン1304を押下してから、OCR画面1309上の選択可能エリア1011を選択することで、ユーザーが直接Internalname=”tel”のプロパティ情報602を入力することも可能である。
本実施例では、自動選択により、識別情報がtelと判別された選択領域1332の値が、ユーザー電話番号表示エリア1312に入力されるため、電話番号ボタン1304を押下しなくても良い。
本実施例において、S512で送信されるプロパティ情報602のInternalname=”tel”の例を以下に示す。
Internalname="tel" Type="String" DisplayName="ユーザー電話番号" Required="False" Visible="True">080-1234-1234</ItemProperty>
商品Codeボタン1305は、Internalname=”code”のプロパティ情報602を入力するためのボタン。
Internalname="tel" Type="String" DisplayName="ユーザー電話番号" Required="False" Visible="True">080-1234-1234</ItemProperty>
商品Codeボタン1305は、Internalname=”code”のプロパティ情報602を入力するためのボタン。
商品数量ボタン1306Internalname=”num”のプロパティ情報602を入力するためのボタン。
送信ボタン1308は、ユーザーにより押下されると、コマンド送受信部313により、文書情報として、文章ファイルおよび、設定されたプロパティ情報602が送信される。
OCR画面1309は、モバイル端末画面400のOCRボタン402を押すと表示される画面である。OCR画面表示時にスキャンイメージに対して、オブジェクトをブロックとして認識し、そのブロックに対してOCR処理する。さらにテキストと認識されたものを1331〜1335などに示すように選択可能領域として、四角で囲って選択可能状態で表示する。選択可能領域1331〜1335は、オブジェクト認識、OCRの結果としてテキストと認識されたものが四角で囲って選択できるようになったものである。
プロパティ定義情報601テキスト表示エリア1310は、S509で文書管理サーバー102から取得したプロパティ定義情報601に基づき、プロパティ情報602を表示、入力、編集するためのエリアである。
プロパティ定義情報テキスト表示エリア1310の会社名表示エリア1311に入力された値は、プロパティ情報602のinternalnameが”companyName”の値として設定される。
同様に、ユーザー電話番号表示エリア1312に入力された値は、プロパティ情報602のinternalnameが”tel”の値として設定される。日付表示エリア1313に入力された値は、プロパティ情報602のinternalnameが”date”の値として設定される。商品コード表示エリア1314に入力された値は、プロパティ情報602のinternalnameが”code”の値として設定される。数量入力表示エリア1315に入力された値は、プロパティ情報602のinternalnameが”num”の値として設定される。
このため、本実施例では、プロパティ定義情報601のInternalname=”companyName”,”tel”,”date”,”code”,”num”に5項目が含まれているため、プロパティ定義情報601テキスト表示エリア1310はこれらの5項目の表示を行う。
これらのエリアは、選択された選択可能領域のOCR処理結果のテキスト情報、あるいは操作履歴データベース900から決定された送信結果情報を初期値として編集可能な入力エリアである。
会社名表示エリア1311は、識別情報がcompanyNameと判別された選択領域1331に対応した表示エリアである。ユーザー電話番号表示エリア1312は、識別情報がtelと判別された選択領域1332に対応した表示エリアである。日付表示エリア1313は、識別情報がdateと判別された選択領域1333に対応した表示エリアである。商品コード表示エリア1314は、識別情報がcodeと判別された選択領域1334に対応した表示エリアである。数量入力表示エリア1315は、識別情報がnumと判別された選択領域1335に対応した表示エリアである。
会社名修正ボタン1321、ユーザー電話番号修正ボタン1322、日付修正ボタン1323、商品コード修正ボタン1324、数量修正ボタン1325は提示されたテキスト情報を修正したい場合に押す。各ボタンを押すと送信確認画面1100に遷移する。遷移した送信画面の送信実行ボタン1104は、非表示状態になり、その代り、戻るボタン(不図示)が表示状態になる。ユーザーは本画面でテキスト情報を修正し、戻るボタンを押すことにより、OCR画面1309に戻ることが出来る。
さらに、プロパティ定義情報601テキスト表示エリア1310は、S509で文書管理サーバー102から取得したプロパティ定義情報601に基づき、表示エリアの表示項目が変更可能である。
[抽出情報送信処理のフローチャート]
イメージから抽出した情報をボタン操作で送る図5の処理S505の詳細なフローについて図14を用いて説明する。本フローは、モバイル端末103のモバイル端末画面400でスキャンデータを表示している時にユーザーがOCRボタン402を押したことをトリガーに開始する。
イメージから抽出した情報をボタン操作で送る図5の処理S505の詳細なフローについて図14を用いて説明する。本フローは、モバイル端末103のモバイル端末画面400でスキャンデータを表示している時にユーザーがOCRボタン402を押したことをトリガーに開始する。
S1401で、画像解析部310は、スキャンデータに含まれるスキャンデータを解析してオブジェクトとしてブロックを認識する。
S1402で、OCR部311は、各ブロックに対してOCR処理を行い、テキスト情報を抽出する。
S1403で、画像分類部315の分類処理部702は、分類処理を行い、スキャンデータを分類する。以下主に図12のデータベースが既に作成されている状況を前提に説明する。具体的には操作履歴データベース900として送信履歴Table具体例1206と送信領域Table具体例1207が既に作成されている場合である。
S1404で、スキャンデータが分類できた場合は、S1405へ遷移する。スキャンデータが分類できなかった場合は、S1426に遷移する。
S1405で、スキャンデータの分類結果に該当するプロパティ定義情報601を決定し取得する。
決定されたプロパティ定義情報601は、プロパティ管理部319を介して記憶部309から取得できた場合はS1407に遷移する。プロパティ定義情報601が記憶部309から取得できなかった場合はS1406に遷移する。
S1406で、コマンド送受信部313は、文書管理サーバー102からS1405で決定したプロパティ定義情報を取得する。
S1407で、操作履歴管理部316は、DB部317の操作履歴データベース900に対して、分類情報、例として分類1(704)をキーに検索を実行し、同一分類ですでに送信した履歴情報があるかどうかを確認する。この時操作履歴データベース900に問い合わせるSQL文は905である。
S1408で、一致した履歴情報がある場合はS1409に遷移する。一致した履歴情報がなければS1426に遷移する。送信履歴Table具体例1206でいうと分類1(704)のレコード(1208〜1212)が5つヒットするのでS1409に遷移する。
S1409で、操作履歴管理部316は、座標処理部318でOCR領域の座標情報を取得する。
S1410で、操作履歴管理部316は、S1409で取得したOCRブロック数を繰り返す。
S1411で、操作履歴管理部316は、図8を用いて説明した座標正規化処理を行い、座標を補正する。
S1412で、操作履歴管理部316は、分類情報が分類1(704)で、選択済み領域と操作履歴データベース900の座標で一致するものがあるかどうかを確認する。この時操作履歴データベース900に問い合わせる問い合わせのSQL文は911である。送信履歴Table具体例1206でいうとレコード1208が1つヒットする。
S1413で、一致した履歴情報があれば、S1414へと遷移する。一致した履歴がなければS1410に遷移する。
S1414で、一致した履歴のプロパティ識別情報(internalname)がすべて同一であれば、S1413に遷移する。一致した履歴のプロパティ識別情報がすべて同一でなければ、S1421に遷移する。この時操作履歴データベース900に問い合わせるSQL文は907である。送信履歴Table具体例1206でいうと、プロパティ識別情報はすべて「tel」であるので、すべて同一でないと判断し、S1415に遷移する。
S1415で、操作履歴管理部316は、OCRブロックのプロパティ識別情報を決定する。
S1416で、情報表示部306は、プロパティ定義情報テキスト表示エリア領域1310を作成する。
本実施例では、スキャンデータの分類が1のため、classification1のプロパティ定義情報601を文書管理サーバー102から取得する。
情報表示部306は、プロパティ定義情報601をもとに、プロパティ定義情報テキスト表示エリア領域1310を描画する。
情報表示部306は、プロパティ定義情報601のclassification1エレメントのItemPropertyを抽出する。ItemPropertyは5個のエレメントを含むため、UI部に1311〜1315のリスト領域を描画する。リストの各行の第一カラムには、各ItemPropertyの属性:DisplayNameの値を設定する。本例では、1311〜1315の第一カラムは、”会社名”、”ユーザー電話番号”、”日付”、”商品コード1”、”数量1”を設定する。各ItemPropertyの属性:Visible=”True”であるため、ItemPropertyは5個のエレメントを表示するが、Visible=”False”のエレメントに対して表示を行わない。
また、各ItemPropertyの値については、この時点で未定のため未設定のままである。各ItemPropertyの値は、以降のステップにより自動的に決定される場合は、その値が情報表示部306によって設定される。
コマンド生成部312は、プロパティ定義情報テキスト表示エリア領域1310に値が設定された場合、操作履歴管理部316の自動入力、ユーザーの手動入力に関わらず、対応するinternalnameの値を含むプロパティ情報602を生成する。
S1417で、操作履歴管理部316は、S1413で一致した履歴の送信結果(sendmessage)を確認する。この時操作履歴データベース900に問い合わせるSQL文は908である。
S1418で、送信結果(sendmessage)がすべて同一であれば、S1420へ遷移する。同一でなければS1419へ遷移する。
S1419で、操作履歴管理部316は、送信結果を表示することを決定する。送信履歴Table具体例1206でいうとレコード1208の送信結果「080−1234−1234」に決定する。
S1420で、操作履歴管理部316は、選択済み領域1410のOCR結果と一致するテキストが操作履歴データベースのOCR結果(ocrresult)にあるかを確認する。一致するものがあれば、S1421に遷移する。なければS1424に遷移する。この時操作履歴データベース900に問い合わせるSQL文は909である。
S1421で、操作履歴管理部316は、複数の送信結果があるかどうかを確認する。複数の送信結果の場合はS1422へ遷移する。複数の送信結果でない場合は、S1423へ遷移する。
S1422で、操作履歴管理部316は、送信回数の多い送信結果を表示することを決定する。
S1423で、操作履歴管理部316は、送信結果を表示することを決定する。
S1424で操作履歴管理部316は、対象のOCR領域のOCR結果を表示することを決定する。
S1425で、情報表示部306は、プロパティ定義情報テキスト表示エリア領域1310に送信結果、またはOCR結果のテキスト情報を設定する。
S1426で、情報表示部306は、図13のOCR画面1309を表示する。
S1427で、ユーザーにより修正ボタン1321〜1325が押されると、情報表示部306は、図11の送信確認画面1100を表示する。
S1728で、ユーザーにより送信実行ボタン1308が押されたことをトリガーとして、コマンド生成部312は、プロパティ定義情報テキスト表示エリア領域1310の値をプロパティ情報602として生成する。この時生成されたコマンドは図6のプロパティ情報602である。さらにコマンド送受信部313が、文書管理アプリ321に対してコマンドを送信する。
S1429で、メイン制御部305は送信履歴を保存する。この時操作履歴データベース900に問い合わせるSQL文は1310である。
S1430で、操作履歴管理部316は、送信履歴座標が既存の検索領域の枠内に含まれるかを確認し、枠外の場合は検索領域情報を更新する。
以上のように、本実施形態によれば、モバイル端末で取り込んだスキャンデータのOCR結果、または履歴情報の送信結果のテキスト情報は、履歴情報を元に自動的に決定したプロパティ識別情報とともにPC端末の文書管理アプリに送信される。これにより、ユーザーのサーバー装置への情報の入力の煩雑さを解消することができる。
また、文書管理アプリが、モバイル端末が作成したプロパティ情報を文書ファイルに設定する事により、文書記憶装置内の格納場所に関わらず、文書に関連する属性を付与できるようになる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以上、本発明の好ましい実施形態について説明したが、本発明は、これらの実施形態に限定されず、その要旨の範囲内で種々の変形および変更が可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以上、本発明の好ましい実施形態について説明したが、本発明は、これらの実施形態に限定されず、その要旨の範囲内で種々の変形および変更が可能である。
101 画像形成装置
102 文書管理サーバー
103 モバイル端末
1000 スキャン文書管理システム
102 文書管理サーバー
103 モバイル端末
1000 スキャン文書管理システム
Claims (7)
- ユーザー操作に基づく履歴座標を保存する保存手段と、
受信文書の文字認識を行う認識手段と、
履歴データの座標と受信文書の座標を比較し、座標が一致した場合に識別情報を決定する決定手段と、
画像の特徴量を用いて受信文書を分類する分類手段と、
受信文書にプロパティを付与する付与手段と、
前記プロパティが付与された前記受信文書を保存する指示を行う保存手段と、を有し、
前記決定手段により決定した識別情報に基づいて前記付与手段が前記受信文書にプロパティを付与することを特徴とする情報処理装置。 - 文書管理サーバーからプロパティ定義情報を取得する取得手段と、
プロパティ定義情報を用いて、テキスト表示エリアを表示する表示手段と、を有し、
テキスト表示エリアに入力された情報からプロパティ情報が生成されることを特徴とする請求項1に記載の情報処理装置。 - 前記プロパティ情報に紐付く文章ファイルを含む文書情報を前記文書管理サーバーに送信するコマンド送受信手段と、を有し、
前記文書管理サーバーは受信した文書情報を記憶部に記憶することを特徴とする請求項2に記載の情報処理装置。 - コンピュータに、
ユーザー操作に基づく履歴座標を保存する保存工程と、
受信文書の文字認識を行う認識工程と、
履歴データの座標と受信文書の座標を比較し、座標が一致した場合に識別情報を決定する決定工程と、
画像の特徴量を用いて受信文書を分類する分類工程と、
受信文書にプロパティを付与する付与工程と、
前記プロパティが付与された前記受信文書を保存する指示を行う保存工程と、を実行させ、
前記決定工程により決定した識別情報に基づいて前記付与工程で前記受信文書にプロパティを付与することを特徴とするプログラム。 - 前記コンピュータに、
文書管理サーバーからプロパティ定義情報を取得する取得工程と、
プロパティ定義情報を用いて、テキスト表示エリアを表示する表示工程と、を実行させ、
テキスト表示エリアに入力された情報からプロパティ情報が生成されることを特徴とする請求項4に記載のプログラム。 - 前記コンピュータに、
前記プロパティ情報に紐付く文章ファイルを含む文書情報を前記文書管理サーバーに送信するコマンド送受信工程と、を実行させ、
前記文書管理サーバーは受信した文書情報を記憶部に記憶することを特徴とする請求項5に記載のプログラム。 - ユーザー操作に基づく履歴座標を保存する保存工程と、
受信文書の文字認識を行う認識工程と、
履歴データの座標と受信文書の座標を比較し、座標が一致した場合に識別情報を決定する決定工程と、
画像の特徴量を用いて受信文書を分類する分類工程と、
受信文書にプロパティを付与する付与工程と、
前記プロパティが付与された前記受信文書を保存する指示を行う保存工程と、を有し、
前記決定工程により決定した識別情報に基づいて前記付与工程で前記受信文書にプロパティを付与することを特徴とする制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015046431A JP2016167712A (ja) | 2015-03-09 | 2015-03-09 | 情報処理装置、プログラム及び制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015046431A JP2016167712A (ja) | 2015-03-09 | 2015-03-09 | 情報処理装置、プログラム及び制御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016167712A true JP2016167712A (ja) | 2016-09-15 |
Family
ID=56898757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015046431A Pending JP2016167712A (ja) | 2015-03-09 | 2015-03-09 | 情報処理装置、プログラム及び制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016167712A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106790129A (zh) * | 2016-12-27 | 2017-05-31 | 中国银联股份有限公司 | 一种身份认证的方法及装置 |
JP2019128727A (ja) * | 2018-01-23 | 2019-08-01 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
-
2015
- 2015-03-09 JP JP2015046431A patent/JP2016167712A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106790129A (zh) * | 2016-12-27 | 2017-05-31 | 中国银联股份有限公司 | 一种身份认证的方法及装置 |
JP2019128727A (ja) * | 2018-01-23 | 2019-08-01 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
JP7034730B2 (ja) | 2018-01-23 | 2022-03-14 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6064392B2 (ja) | 検索装置、検索方法、検索プログラムおよび検索システム | |
JP4237215B2 (ja) | 画像読取システム、サーバ装置、画像読取装置、および端末装置 | |
JPWO2007004519A1 (ja) | 検索システム及び検索方法 | |
JP2006120125A (ja) | ドキュメント画像情報管理装置及びドキュメント画像情報管理プログラム | |
JP2016021088A (ja) | 電子文書生成システム、電子文書生成装置およびプログラム | |
US10097724B2 (en) | System, control method, and recording medium | |
US11503170B2 (en) | Image processing apparatus, image processing method, and storage medium | |
US8219594B2 (en) | Image processing apparatus, image processing method and storage medium that stores program thereof | |
US11887390B2 (en) | Information processing apparatus, information processing system, information processing method, and non-transitory recording medium | |
US20210166284A1 (en) | Information processing system, information processing method, and non-transitory recording medium | |
JP2016167712A (ja) | 情報処理装置、プログラム及び制御方法 | |
US11320964B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2017084198A (ja) | システム、プログラム及び制御方法 | |
JP2022137608A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP2018072985A (ja) | イメージスキャンシステム、イメージスキャナ、情報取得方法及び情報取得プログラム | |
JP2007011762A (ja) | 領域抽出装置及び領域抽出方法 | |
KR101659886B1 (ko) | 명함 주문 시스템 및 방법 | |
JP6165595B2 (ja) | 帳票識別システム | |
US8675236B2 (en) | Image processing method | |
US20230076217A1 (en) | Form creating system and non-transitory computer readable medium | |
JP5404593B2 (ja) | アドレス帳サーバ及びこれを備えたデータ処理システム | |
JP5223328B2 (ja) | 情報管理装置及び情報管理方法ならびにそのプログラム | |
JP2007282100A (ja) | 画像処理システムおよび画像処理方法 | |
US20130194588A1 (en) | Image processing adapter and method | |
US20130194615A1 (en) | Image scanning and processing system |