JP2017084198A - システム、プログラム及び制御方法 - Google Patents
システム、プログラム及び制御方法 Download PDFInfo
- Publication number
- JP2017084198A JP2017084198A JP2015213560A JP2015213560A JP2017084198A JP 2017084198 A JP2017084198 A JP 2017084198A JP 2015213560 A JP2015213560 A JP 2015213560A JP 2015213560 A JP2015213560 A JP 2015213560A JP 2017084198 A JP2017084198 A JP 2017084198A
- Authority
- JP
- Japan
- Prior art keywords
- area
- identification information
- coordinates
- created
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 65
- 230000005540 biological transmission Effects 0.000 claims abstract description 93
- 238000012545 processing Methods 0.000 claims abstract description 70
- 230000008569 process Effects 0.000 claims description 55
- 238000003860 storage Methods 0.000 claims description 46
- 238000012790 confirmation Methods 0.000 claims description 17
- 230000010365 information processing Effects 0.000 claims description 2
- 238000012015 optical character recognition Methods 0.000 description 52
- 239000013598 vector Substances 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 238000012937 correction Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 238000010606 normalization Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000007717 exclusion Effects 0.000 description 4
- 238000010191 image analysis Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 238000003825 pressing Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【課題】送信結果の履歴に基づいて、領域の座標を比較し、識別情報を付与することにより、より高速にシステムへ入力を行うことを目的とする。【解決手段】受信した文書に対するブロックセレクション処理で抽出された領域、および、ユーザーが指定した任意の領域に対して、領域の座標と、履歴の領域の座標を比較し、その比較結果と履歴に基づいて、それぞれの領域の座標に対応する識別情報を決定して、その領域に対する文字認識に基づくテキスト情報と決定された識別情報を送信して、送信された識別情報に基づいて特定される、テキスト情報をアプリケーションに入力するためのスクリプトを実行する。【選択図】図17
Description
本発明は、システム、プログラム及び制御方法に関する。
従来、受信したFAXを紙で出力するのではなく、イメージとしてPC端末に取り込み、表示することによって、ペーパーレスを実現するシステムがある。特許文献1は、FAXにより受信された注文票をPC端末で表示し、FAXに含まれる情報をシステムに入力するFAX注文票ペーパーレス入力システムに関する技術を開示している。
本明細書ではFAXに含まれる情報をシステムに入力する方法として、識別情報に基づいたスクリプトを実行することでアプリケーションにOCR(光学的文字認識)で認識されたテキスト情報を入力する構成について検討する。スクリプトとは、ソースコードを記述するだけで容易に実行が可能な簡易的なプログラムである。特許文献2は、ユーザーの手動操作によって、OCRで認識されたテキスト情報に対する識別情報を特定する帳票読取システムに関する技術を開示している。
しかしながら、ユーザーが識別情報を毎回手動操作で特定していては操作が煩雑であり、操作にかかる時間によってシステムへの入力が遅くなる。
そこで、本発明は、送信結果の履歴に基づいて、領域の座標を比較し、識別情報を特定することにより、より高速にシステムへ入力を行うことを目的とする。
上記の目的を達成するために、本発明に係るシステムは、
文書内の領域の座標と、前記領域に対応する識別情報を保存する保存手段と、
新たに受信した文書から、受信した文書内における文字認識用の複数の領域を作成する作成手段と、
前記作成手段によって作成される領域は、文書に対するブロックセレクション処理によって抽出される領域と、ユーザーが指定する任意の領域とを含み、
前記作成手段によって作成された領域の座標と、前記保存手段によって保存された領域の座標を比較する比較手段と、
前記比較手段による比較の結果と、前記保存手段によって保存された領域に対応する識別情報に基づいて、前記作成手段によって作成された領域の座標に対応する識別情報を決定する決定手段と、
前記決定手段によって決定された前記識別情報と、前記作成手段によって作成された領域に対する文字認識に基づくテキスト情報を送信する送信手段と、
前記送信手段によって送信された前記識別情報に基づいて、テキスト情報をアプリケーションに入力するためのスクリプトを特定し、特定されたスクリプトを実行する実行手段と、を有し、
前記保存手段は、前記送信手段による送信の結果に基づいて、前記作成手段によって作成された領域の座標と、前記領域に対応する識別情報を保存することを特徴とする。
文書内の領域の座標と、前記領域に対応する識別情報を保存する保存手段と、
新たに受信した文書から、受信した文書内における文字認識用の複数の領域を作成する作成手段と、
前記作成手段によって作成される領域は、文書に対するブロックセレクション処理によって抽出される領域と、ユーザーが指定する任意の領域とを含み、
前記作成手段によって作成された領域の座標と、前記保存手段によって保存された領域の座標を比較する比較手段と、
前記比較手段による比較の結果と、前記保存手段によって保存された領域に対応する識別情報に基づいて、前記作成手段によって作成された領域の座標に対応する識別情報を決定する決定手段と、
前記決定手段によって決定された前記識別情報と、前記作成手段によって作成された領域に対する文字認識に基づくテキスト情報を送信する送信手段と、
前記送信手段によって送信された前記識別情報に基づいて、テキスト情報をアプリケーションに入力するためのスクリプトを特定し、特定されたスクリプトを実行する実行手段と、を有し、
前記保存手段は、前記送信手段による送信の結果に基づいて、前記作成手段によって作成された領域の座標と、前記領域に対応する識別情報を保存することを特徴とする。
本発明に係るシステムによれば、送信結果の履歴に基づいて、領域の座標を比較し、識別情報を特定することにより、より高速にシステムへ入力を行うことができる。
以下、本発明を実施するための形態について図面などを参照して説明する。なお、実施形態は、本発明を限定するものではなく、また、実施形態で説明されている全ての構成が本発明の課題を解決するための手段に必須であるとは限らない。
(第1実施形態)
[システム構成]
本実施形態に係る情報処理システムの一例として、FAX受注システムを例に説明する。
[システム構成]
本実施形態に係る情報処理システムの一例として、FAX受注システムを例に説明する。
図1はFAX受注システム1000の全体構成の一例を示す図である。
FAX受注システム2000は、画像形成装置101、FAX保管サーバー102、基幹業務サーバー103、端末の一例であるモバイル端末104、及びPC端末105を有する。
画像形成装置101は、ユーザー環境に配置された装置であり、ネットワーク100に接続されるとともに、FAXを受信するための公衆回線111に接続されている。FAX保管サーバー102、基幹業務サーバー103、モバイル端末104、及びPC端末105は、ユーザー環境に配置された装置であり、ネットワーク100を介して互いに通信可能に接続されている。
なお、図1においてFAX保管サーバー102、基幹業務サーバー103、モバイル端末104、及びPC端末105は、同一ネットワークに属しているが、これに限定されるものではない。それぞれの装置は、独立したネットワークに属しているか、又はインターネット110に直接接続されていても構わない。また、各サーバーは、1台で構成されていてもよいし、複数台で構成されていてもよい。
FAX保管サーバー102は、画像形成装置101と同一のネットワークに存在するオンプレミスのSMB(Server Message Block)サーバー等である。また、FAX保管サーバー102は、インターネットに接続された公知の一般的なストレージサーバーであっても構わない。一般的なストレージサーバーの例としては、Microsoft(登録商標)社のOneDrive(登録商標)やGoogle(登録商標)社のGoogleドライブなどがある。
基幹業務サーバー103は、特定の業務に関して、PC端末105で動作する基幹システム接続アプリケーションを通じて情報の入力を受け付け、処理を行うサーバーである。本発明において、基幹業務サーバー103が受け付ける情報、および、それに基づいて実行する処理については、規定されるものではない。また、入力元の情報がFAXから抽出された情報であることを、必ずしも想定する必要はない。基幹業務サーバー103は、単に、PC端末105で動作する基幹システム接続アプリケーションを通じて情報の入力を受け付け、処理を行うという条件だけを満たせばよい。図1に示すシステム構成において、PC端末105が備える中継アプリケーションが、モバイル端末104が取り込んだFAXイメージに含まれる情報を基幹業務サーバー103へ入力する。
[ハードウェア構成]
図2はFAX受注システム1000を構成する各装置(画像形成装置101、FAX保管サーバー102、基幹業務サーバー103、モバイル端末104、及びPC端末105)のハードウェアの構成の一例を示す図である。
図2はFAX受注システム1000を構成する各装置(画像形成装置101、FAX保管サーバー102、基幹業務サーバー103、モバイル端末104、及びPC端末105)のハードウェアの構成の一例を示す図である。
FAX受注システム1000を構成する各装置201は、各種のユニット(202〜207)を含んで構成される。なお、FAX受注システム1000を構成する各装置のハードウェア構成は同一でも構わないし、それぞれ異なっていても構わない。
CPU(Central Processing Unit)202は、各種のプログラムを実行し、様々な機能を実現するユニットである。ROM(Read Only Memory)204は、各種のプログラム等を記憶するユニットである。RAM(Random Access Memory)203は、各種の情報を記憶するユニットである。また、RAM203は、CPU202の一時的な作業記憶領域としても利用されるユニットである。例えば、CPU202は、ROM204に記憶されているプログラムをRAM203にロードしてプログラムを実行する。
加えて、CPU202がフラッシュメモリ、HDD(Hard Disk Drive)又はSSD(Solid State Disk)といった外部記憶装置に記憶されているプログラムに基づき処理を実行する。これにより、図3に示されるようなFAX受注システム1000を構成する各装置のソフトウェア構成及び後述するシーケンスの各ステップの処理が実現される。
なお、各装置の機能及び後述するシーケンスに係る処理の全部又は一部については専用のハードウェアを用いて実現してもよい。
Input/Outputインターフェース205は、各装置に接続されているディスプレイ(不図示)にデータを送信する他、同じく各装置に接続されているポインティングデバイス(不図示)からデータを受信するユニットである。
NIC(Network Interface Card)206は、装置をネットワーク100に接続するためのユニットである。上述したユニットは、バス207を介してデータの送受信を行うことが可能に構成されている。
さらに、画像形成装置101は、FAXユニット(不図示)を搭載しており、バス207を介して各ユニットとデータを送受信することが可能に構成されている。FAXユニットは、各装置より受けたFAX制御言語をイメージに展開し不図示の公衆回線、又はインターネット110(IP−FAX)を介して他のFAX装置(不図示)へ転送することができる。
ここで、画像形成装置101は、印刷ユニット(不図示)を更に搭載していても構わない。印刷ユニットは、バス207を介して各ユニットとデータを送受信することが可能に構成されている。なお、印刷ユニットは、ラスタイメージを紙などの記録媒体に記録(印刷)することが可能なユニットである。
そして、画像形成装置101は、スキャナユニット(不図示)を更に搭載していても構わない。スキャナユニットは、バス207を介して各ユニットとデータを送受信することが可能に構成されている。なお、スキャナユニットは、画像を入力することが可能なユニットである。
また、モバイル端末104では、Input/Outputインターフェース205にタッチパネル(不図示)が接続されている。タッチパネルは、ディスプレイ等の表示部の一例であり、出力(表示)と入力との2つの機能を備えている。
[ソフトウェア構成(全般)]
次に、FAX受注システム1000を構成する各装置のソフトウェアの構成について説明する。図3は、各装置のソフトウェア構成の一例を示す図である。
次に、FAX受注システム1000を構成する各装置のソフトウェアの構成について説明する。図3は、各装置のソフトウェア構成の一例を示す図である。
図3に示される各ソフトウェア(アプリケーション)における機能(モジュール部)を実現するプログラムは、各装置のROM204等に記憶されている。
[ソフトウェア構成(モバイル端末)]
次に、モバイル端末104におけるソフトウェアの構成について説明する。なお、モバイル端末104は、携帯端末の一例であり、無線通信機能などの装備によって自由な場所で利用できる端末である。
次に、モバイル端末104におけるソフトウェアの構成について説明する。なお、モバイル端末104は、携帯端末の一例であり、無線通信機能などの装備によって自由な場所で利用できる端末である。
モバイル端末104のOS(Operating System)(不図示)は、後述する各モジュール(画像管理部301、アドレス管理部302、及び通知処理部303)を有する。
画像管理部301は、画像やアプリケーションデータを管理する。OSは、画像管理部301を利用するための制御API(Application ProgrammingInterface)を提供している。各アプリはその制御APIを利用することで画像管理部301が管理する画像やアプリケーションデータの取得や保存を行う。
アドレス管理部302は、氏名や電話番号、住所などのアドレス情報を管理する。アドレス管理部302も画像管理部301と同様に、各アプリが利用するための制御APIを提供している。
通知処理部303は、通知サーバー(不図示)から通知情報を受信し、通知情報内のアプリのトークンを用いて通知の受信先であるアプリを特定し、アプリに対して通知情報を伝搬する。
モバイルアプリ(モバイルアプリケーション)304は、モバイル端末104のOSのインストール機能(例えばApple StoreやGoogle Play)を利用して、ダウンロードしインストールすることにより実行可能なアプリケーションである。モバイルアプリ304は、FAX保管サーバー102が管理するデータに対する各種のデータ処理を行う。
メイン制御部305は、モバイル端末104用のアプリケーション(モバイルアプリ)304を制御し、後述する各モジュール部(306〜317)に対する指示、及び管理を行う。
情報表示部306は、メイン制御部305からの指示に従い、モバイルアプリ304のユーザーインタフェース(UI)をユーザーに提供する。
図4はモバイルアプリ304のUI(携帯端末用のUI)を提供する画面の一例(モバイル端末画面400)を示す図である。
モバイル端末画面400は、モバイル端末104のタッチパネルに表示される。また、モバイル端末画面400では、表示および操作領域401にFAXデータが表示され、文書等に対するユーザーによる操作(ユーザー操作)を、表示されたUIを介して受け付ける。OCRボタン402は、後述のOCR画面1400に画面遷移するボタンである。
なお、モバイルアプリ304のUIの形態(位置、大きさ、範囲、配置、表示内容など)は、図に示す形態に限定されるものではなく、モバイル端末104の機能を実現することができる適宜の構成を採用することができる。
再び図3に戻ってモバイルアプリ304の各モジュールの説明を行う。
操作情報取得部307は、情報表示部306により表示されたモバイルアプリ304のUIがユーザー操作された情報を取得し、取得した情報をメイン制御部305に通知する。例えば、表示および操作領域401をユーザーが手で触れると、操作情報取得部307は、触れられた画面上の位置の情報を感知し、感知した位置の情報をメイン制御部305に送信する。
データ送受信部308は、FAX保管サーバー102とデータの送信および受信を行い、送受信するデータをメイン制御部305とやり取りする。データ送受信部308は、FAXデータ操作及びFAXデータ編集によるファイルの更新をFAX保管サーバー102に要求する。
記憶部309は、操作情報取得部307を介して、換言するならばモバイルアプリ304のUIを介して、ユーザーにより入力された設定値を保存(永続化)する。さらに記憶部309は、データ送受信部308でFAX保管サーバー102から受信したデータを保存する。
FAX画像解析部310は、FAXイメージを解析して、レイアウト情報を生成する。レイアウト情報には、FAXイメージから抽出された矩形領域とその種別(文字、図形、線、表など)とが含まれる。
OCR部311は、FAX画像解析部310で抽出した矩形領域の中で、文字と判定された矩形領域、あるいは、操作情報取得部307で取得したユーザー操作によって指定された矩形領域に対して、OCR(光学文字認識)処理を行う。
メッセージ生成部312は、PC端末105の中継アプリ(中継アプリケーション)321に送信するメッセージを生成する。メッセージには、例えば、OCR部311で処理した結果やユーザーが入力した結果のテキスト情報が含まれる。
メッセージ送受信部313は、PC端末105の中継アプリ321に、メッセージ生成部312で生成したメッセージを送信し、その応答メッセージ(応答情報)を受信する。メッセージ解析部314は、メッセージ送受信部313で受信したPC端末105の中継アプリ321からの応答メッセージを解析し、FAXイメージに対する処理を実行する。
画像分類部315は、FAX保管サーバー102から受信したFAXイメージに対して、予め学習処理を行った特徴量を用いて分類処理を行い、FAXイメージの分類を行う。
操作履歴管理部316は、ユーザーが選択した短形領域の座標情報、OCR結果のテキスト情報、中継アプリ321に送信したメッセージ等をDB部317のデータベースを用いて管理する。
DB部317はデータベース機能を有し、操作履歴情報を管理する。
座標処理部318は、データベースへ座標情報を登録する際の座標正規化処理やデータベースへの座標問い合わせ時の座標補正処理行う。
[ソフトウェア構成(PC端末)]
次に、PC端末105におけるソフトウェアの構成について説明する。
次に、PC端末105におけるソフトウェアの構成について説明する。
PC端末105は、PC端末105にインストールされたOS上で複数のアプリケーションを実行することが可能である。図3では、複数のアプリケーションの一つである中継アプリ321と基幹システム接続アプリ(基幹システム接続アプリケーション)331について記載している。
なお、基幹システム接続アプリ331は、ユーザーからの入力を受け付け、基幹業務サーバー103に送信するアプリケーションである。基幹システム接続アプリ331の詳細については図9を用いて後述する。
中継アプリ321のモジュール構成について説明する。
メイン制御部322は、モバイルアプリ304と基幹システム接続アプリ331との間を中継する中継アプリ321を制御し、後述する各モジュール部(323〜326)に対する指示、管理を行う。
記憶部323は、ユーザーによって作成されたスクリプトを保存する。スクリプトは、モバイル端末104のモバイルアプリ304から受信したテキスト情報が含まれるメッセージにしたがって中継アプリ321が実行する簡単なプログラムである。詳細は後述するが、中継アプリ321がスクリプトを実行することによって基幹業務サーバー103に情報の入力が行われる。
メッセージ受信部324は、モバイル端末104のモバイルアプリ304からメッセージを受信する。
メッセージ解析部325は、メッセージ受信部324で受信したメッセージを解析する。
スクリプト実行部326は、メッセージ解析部325がメッセージを解析した結果、メッセージの内容に含まれる識別情報に紐付く、記憶部323に保存されているスクリプトを実行する。
[ソフトウェア構成(画像形成装置)]
次に、画像形成装置101におけるソフトウェアの構成について説明する。
次に、画像形成装置101におけるソフトウェアの構成について説明する。
画像形成装置101は、Java(登録商標)のプラットフォーム上で複数のアプリケーションを実行する。図3では複数のアプリケーションの一つであるFAX受信アプリ341について記載している。以降ではこのFAX受信アプリ341のモジュール構成について説明する。
メイン制御部342は、FAX受信アプリ341の各モジュールを制御し、各モジュールに対して指示し、各モジュールの管理を行う。
情報表示部343は、メイン制御部342からの指示に従い、FAX受信アプリ341のUIをユーザーに提供する。ユーザーは、このUI上でFAXイメージの保存先(FAX保管サーバー102)を指定することができる。
操作情報取得部344は、情報表示部343により表示されたFAX受信アプリ341のUI上のユーザー操作を情報として取得し、取得した情報をメイン制御部342に通知する。
データ送受信部345は、FAX保管サーバー102とデータの送信および受信を行う。
記憶部346は、情報表示部343及び操作情報取得部344を介してユーザーにより入力された設定値(例えば電話番号毎の振り分け先情報など)及び送受信するFAXイメージの一時保存などを実行する。
[基本フロー]
次に、FAX受注システム1000の基本的な処理フローについて図5を用いて説明する。
次に、FAX受注システム1000の基本的な処理フローについて図5を用いて説明する。
本フローは、画像形成装置101におけるFAXユニットが他のFAX装置からFAXイメージを受信したことをトリガーに開始する。
S501で、画像形成装置101は、FAXイメージを受信する。そして、受信したFAXイメージとFAX情報(送り元電話番号、FAX受信時間などのFAXヘッダ)を画像形成装置101内のRAM等に保存する。FAXイメージを受信したことをトリガーとして、FAX受信アプリ341のメイン制御部342は、FAX情報の送り元電話番号をキーにしてアドレス帳を調べ、電話番号が一致するアドレスの情報を元にFAX受信書誌情報を作成する。記憶部346は、FAX受信データ(FAXイメージとFAX受信書誌情報)を保存する。
S502で、メイン制御部342は、FAX受信データを、データ送受信部345を介してFAX保管サーバー102に送信する。
S503で、モバイル端末104のモバイルアプリ304のメイン制御部305は、FAX保管サーバー102から、FAX受信データをダウンロードする。
S504で、情報表示部306は、FAX受信データに基づいてUI(User Interface)を表示する。
S505で、FAX画像解析部310は、FAX受信データに含まれるFAXイメージを解析してレイアウト情報を取得する。文字と認識された領域に関して、OCR部311はOCR処理を行い、テキスト情報を生成する。ユーザー操作、例えばUI上のボタン操作により生成したテキスト情報の送信を指示する操作をトリガーとして、メッセージ生成部312は、テキスト情報からPC端末105の中継アプリ321に送信するメッセージを生成する。メッセージ送受信部313は、メッセージ生成部312が生成したメッセージをPC端末105の中継アプリ321に送信する。
S506で、PC端末105の中継アプリ321のメイン制御部322は、モバイル端末104のモバイルアプリ304からメッセージを受信する。
S507で、中継アプリ321はスクリプトの検索と実行を行う。S507の詳細な処理に関しては図8を用いて後述する。
S508で、メイン制御部322は、基幹システム接続アプリ331から受注番号を読み取り、応答メッセージとして、モバイル端末104のモバイルアプリ304に送信する。
S509で、モバイル端末104のモバイルアプリ304のメイン制御部305は、PC端末105の中継アプリ321から受信した受注番号をFAXデータの付加情報(アノテーション)として保存する。
[データ構造]
次に、モバイル端末104のモバイルアプリ304と、PC端末105の中継アプリ321との間で送受信されるメッセージについて説明する。
次に、モバイル端末104のモバイルアプリ304と、PC端末105の中継アプリ321との間で送受信されるメッセージについて説明する。
図6は本実施形態におけるメッセージのデータ構造の一例を示す図である。
メッセージ601は、messageキーとそれに対する値を含む。また、messageキーの値は、子プロパティ602を含む。子プロパティ602は、bodyキー、internal−nameキー、display−nameキーを含む。bodyキーの値は、PC端末105の中継アプリ321がスクリプトを実行した際に、基幹システム接続アプリ331に入力される値(情報)である。internal−nameキーの値は、モバイル端末104のモバイルアプリ304と、PC端末105の中継アプリ321との間で、メッセージの種類(項目)を一意に識別するための値である。display−nameキーの値は、モバイル端末104のモバイルアプリ304、および、PC端末105の中継アプリ321で表示に使用する値である。
メッセージ603〜607は、メッセージの内容をJSON(JavaScript(登録商標) Object Notation)形式で表現した例である。メッセージ603は、基幹システム接続アプリ331への入力をクリアする際に使用する。メッセージ604、605、606は、それぞれ基幹システム接続アプリ331に、電話番号、商品コード、商品数量を入力する際に使用するメッセージである。メッセージ607は、メッセージ604、605、606で、基幹システム接続アプリ331に入力した値を確定し、基幹システム接続アプリに表示される注文番号を取得する際に使用するメッセージである。
[中継アプリで保持する情報]
図7はPC端末105の中継アプリ321で保持する情報の一例を示す図である。
図7はPC端末105の中継アプリ321で保持する情報の一例を示す図である。
接続先情報711は、モバイル端末104との通信を開始するために使用する。接続先情報711は、接続先アドレスとポート番号を含み、それぞれ、モバイル端末104のアドレスと、モバイルアプリ304の待ち受けポート番号である。中継アプリ321は、アプリ起動時に、接続先情報711を使用して、モバイル端末104のモバイルアプリ304との間に、通信コネクションを確立する。スクリプトファイル情報712は、モバイルアプリ304から受信したメッセージに対して、実行するスクリプトファイル(スクリプト)を示す。スクリプトファイル情報712は、識別名とスクリプトファイル名を含む。識別名は、モバイルアプリ304から受信したメッセージに含まれるinternal−nameキーの値である。接続先情報711、および、スクリプトファイル情報712は、記憶部323で保持される。
[中継アプリの基本フロー]
図8は図5のフローのS507の処理の詳細を示す図である。
図8は図5のフローのS507の処理の詳細を示す図である。
PC端末105の中継アプリ321は、S801でモバイル端末104のモバイルアプリ304からのメッセージを受信する。
S802で、メッセージ解析部325は、メッセージを解析し、メッセージに含まれるinternal−nameキーの値を取得する。
S803で、スクリプト実行部326は、スクリプトファイル情報712を参照して、internal−nameキーに対応付けられたスクリプトファイル名を取得する。これによって、後述する図18のS1811で送信される識別情報に基づいてスクリプトが特定され、特定されたスクリプトが実行される。
S804で、スクリプト実行部326は、スクリプトファイルを記憶部323から読み出し、スクリプトを実行する。実行される処理は、スクリプトファイルの内容に依存する。
S805で、スクリプト実行部326は、スクリプトの実行結果を取得する。
S806で、スクリプト実行部326は、スクリプトの実行結果に値(応答情報)が含まれているかどうかを判断し、値が含まれていなければ終了する。
S806で、スクリプトの実行結果に値が含まれていると判断した場合は、S807で、メイン制御部322は、その値をモバイルアプリ304に送信する。
[基幹システム接続アプリの画面]
図9は基幹システム接続アプリ331の操作画面の一例を示す図である。
図9は基幹システム接続アプリ331の操作画面の一例を示す図である。
本実施形態における基幹システム接続アプリ331は、ユーザーの入力をGUIで受け付けるアプリケーションであれば、どのようなアプリケーションでもよい。本実施形態では基幹システム接続アプリ331は、基幹業務サーバー103に情報を入出力するための図9のようなGUIを持つアプリケーションであることを前提として、以降の説明を行う。
なお、本実施形態では、中継アプリ321がスクリプトを実行することにより、以降の説明でユーザーが行う入力やボタン押下等の操作を自動化することができる。中継アプリ321がスクリプトを実行する処理の詳細は、図10を用いて後述する。また、中継アプリ321がスクリプトを実行することで入力された情報を、ユーザーが操作画面上でさらに編集することも当然可能である。
900は、基幹システム接続アプリ331のメインウィンドウである。表示欄901、902、及び903は、それぞれ、顧客社名表示欄、顧客名称表示欄、顧客部署表示欄である。電話番号入力欄905は、電話番号を入力する入力欄であり、ユーザーがFAXイメージからFAXの送信元電話番号を読み取って、入力する。904は、検索ボタンであり、検索ボタン904が押下されると電話番号入力欄905に入力された電話番号を元に、基幹業務サーバー103のデータベースから顧客情報を検索し、検索結果を表示欄901、902、及び903に表示(出力)する。
906は、注文入力欄である。注文入力欄906は、複数行から成り、(1行目のタイトル行を除く)各行は、商品コード入力欄907、商品名称表示欄908、数量入力欄909、単価表示欄910、金額表示欄911から成る。ユーザーは、FAXイメージから注文された商品の商品コードを読み取って、商品コード入力欄907に商品コードを入力する。商品コードが入力されると、基幹業務サーバー103のデータベースから商品情報が検索され、検索結果が同じ列の商品名称表示欄908、及び単価表示欄910に表示される。
さらに、ユーザーが、FAXイメージから注文された商品の数量を読み取って、数量入力欄909に数量を入力すると、単価と数量から算出された金額が同じ列の金額表示欄911に表示される。受注した商品が複数ある場合は、商品コード入力欄907への入力と、数量入力欄909への入力を繰り返す。
913は、受注発行ボタンであり、914は、受注番号表示欄である。ユーザーが受注番号発行ボタン913を押下すると、表示欄901〜905に表示されている顧客情報と、注文入力欄906に表示されている情報が注文情報として基幹業務サーバー103のデータベースとして登録される。このとき、基幹業務サーバー103から発行される受注番号が、受注番号表示欄914に表示される。912は、クリアボタンである。ユーザーが、クリアボタン912を押下することにより、メインウィンドウ900の表示が初期化され、各表示欄が空欄となる。
[スクリプトで実行される処理のフロー]
図10は後述するように、S803で電話番号用のスクリプトが特定され、図8のS804で実行される電話番号用のスクリプトが実行される際の処理フローをより詳細に示した図である。
図10は後述するように、S803で電話番号用のスクリプトが特定され、図8のS804で実行される電話番号用のスクリプトが実行される際の処理フローをより詳細に示した図である。
本明細書のスクリプトは、図9で示したGUIを持つ基幹システム接続アプリ331への入力を前提に作成している。中継アプリがスクリプトを実行することにより、ウィンドウメッセージのやりとりが行われ、ユーザーが手動で入力することなしに、基幹システム接続アプリ331への情報の入力を自動的に行うことができる。以降、より具体的に説明する。
図8のS803では、モバイル端末104のモバイルアプリ304から受信したメッセージのinternal−nameキーの値に、telが設定されていた場合に、スクリプトとしてtel.ps1が特定される。図10はそのtel.ps1を実行することで行われる処理を示したフローである。S1101で、PC端末105で動作する複数のアプリケーションの中から、基幹システム接続アプリ331が特定される。S1102で、基幹システム接続アプリ331のメインウィンドウ900が特定される。S1103で、メインウィンドウ900に表示されているGUIコントロールの中から、電話番号入力欄905(項目)が特定される。S1104で、電話番号入力欄905に、モバイルアプリ304から受信したメッセージのbodyキーの値が設定される。S1105で、メインウィンドウ900に表示されているGUIコントロールの中から、検索ボタン904が特定される。S1106で、検索ボタン904の押下が実行される。
[画像分類処理]
次に、画像分類部315が行うFAXイメージの分類について図11を用いて説明する。
次に、画像分類部315が行うFAXイメージの分類について図11を用いて説明する。
画像分類部315は、学習処理部1101と分類処理部1102から構成される。画像分類部315は、予め学習処理部1101で学習処理を行い、特徴量データをDB部317の特徴量DB1107に蓄えておく。さらに画像分類部315は、特徴量DB1107の情報に基づき分類処理部1102で分類処理を行い、分類を決定する。
一般的にイメージの特徴を表す特徴量データは、多次元のデータで表し、特徴ベクトルと呼ばれる。次元数は特徴の種類が何種類あるかを示している。
学習処理部1101で行う学習処理は、分類毎の複数の学習画像から特徴抽出を行い、各学習画像に対して、100次元の特徴ベクトルを算出する。さらに複数の学習画像の特徴ベクトルを元に、100次元の特徴ベクトルからその分類の中で際立った特徴を有する10次元の特徴ベクトルを決定する。この次元削減処理はフィルタと呼ばれるソフトウェアコンポーネントによって実行される。分類毎に算出した特徴ベクトル(10次元)及びにフィルタは、DB部317の特徴量DB1107で管理する。
分類処理部1102で行う分類処理は、入力FAXイメージ1103の特徴抽出を行い、特徴ベクトル(100次元)を算出する。入力FAXイメージ1103の特徴ベクトル(100次元)に対して特徴量DB1107の各分類のフィルタを適用(主成分分析)し、各分類に対応した特徴ベクトル(10次元)を算出する。そして入力FAXイメージ1103の特徴ベクトル(10次元)と特徴量DBの特徴ベクトル(10次元)を比較し、類似度判定により分類を決定する。
図11の学習結果1109は、学習処理により特徴量DB1107に蓄えられたデータの一例を表している。特徴量DB1107には、分類1(1104)、分類2(1105)、分類3(1106)を分類可能な特徴ベクトル(10次元)とフィルタが蓄えられている。また分類結果1110は、分類処理により入力画像と特徴量DB1107の情報を元に分類が決定した例を表している。入力FAXイメージ1103を入力し、分類1(1104)、分類2(1105)、分類3(1106)の中から入力画像の分類結果1108が分類1(1104)に判別されたことを示している。なお、画像分類部315が行う画像分類は、本形態に限定されるものではなく、本機能を実現することができる適宜の手法を採用することができる。
[座標処理]
次に、座標処理部318が行う座標正規化処理について図12を用いて説明する。座標正規化処理は、元画像の縦横に依存しない、かつdpiが異なる場合でも対応可能にするために行うものである。ユーザーが行った送信操作の選択領域の座標情報をDB部317へ登録する際、また登録された操作履歴をDB部317に問い合わせる際に行われる。まず座標系には、ディスプレイ座標(ディスプレイのどの位置)、FAXイメージ座標(FAXイメージのどの位置)、データベース登録座標がある。座標正規化処理とは、ユーザーによりディスプレイで選択された選択座標からFAXイメージ座標に変換し、さらにデータベース登録座標に変換する処理のことである。データベース登録座標はFAXイメージ座標の全体に対する割合に10000を掛け合わしたものとする。
次に、座標処理部318が行う座標正規化処理について図12を用いて説明する。座標正規化処理は、元画像の縦横に依存しない、かつdpiが異なる場合でも対応可能にするために行うものである。ユーザーが行った送信操作の選択領域の座標情報をDB部317へ登録する際、また登録された操作履歴をDB部317に問い合わせる際に行われる。まず座標系には、ディスプレイ座標(ディスプレイのどの位置)、FAXイメージ座標(FAXイメージのどの位置)、データベース登録座標がある。座標正規化処理とは、ユーザーによりディスプレイで選択された選択座標からFAXイメージ座標に変換し、さらにデータベース登録座標に変換する処理のことである。データベース登録座標はFAXイメージ座標の全体に対する割合に10000を掛け合わしたものとする。
ここでは単純化のためにディスプレイ座標とFAXイメージ座標は一致しており、FAXイメージ1201の横が1500px、縦が2000pxの場合で説明する。選択領域1202の左上座標1203が(X,Y)=(200,700)、右下座標1204が(400、750)の場合、データベース登録座標は(1333、3500)、(2666,3750)となる。以下、データベース登録座標の左上X座標をminX、右下X座標をmaxX、左上Y座標をminY、右下Y座標をmaxYとする。
[データ構造(DB)]
次に、DB部317の操作履歴データベース1300について説明する。
次に、DB部317の操作履歴データベース1300について説明する。
図13は本実施形態における操作履歴データベース1300のデータ構造の一例を示す図である。
操作履歴データベース1300は、送信履歴Table1301と送信領域Table1302から構成される。
送信履歴Table1301は、idカラム、internalnameカラム、classificationカラム、ocrresultカラム、sendmessageカラムから構成される。idカラムは送信履歴Table1301にレコードが追加されるたびに1インクリメンタルされる値で、TableのPrimary keyである。internalnameカラムは送信結果の識別情報を格納する。classificationカラムは、FAXイメージの分類結果(例えば図11の1108)を格納する。ocrresultカラムは選択領域のOCR結果を格納する。sendmessageは送信結果(送信したテキスト情報)を格納する。
送信領域Table1302は、idカラム、minXカラム,maxXカラム,minYカラム,maxYカラムから構成される。minXカラムは、選択領域の左上X座標を格納する。maxXカラムは、選択領域右下X座標を格納する。minYカラムは、選択領域の左上Y座標を格納する。maxYカラムは、選択領域右下Y座標を格納する。また送信領域Table1302は、R-treeインデックス(多次元情報のインデックス付け)手法を使うことにより領域検索を高速に行える構成になっている。
SQL文1303〜1310は、操作履歴データベース1300に対する各種問い合わせSQL文を表現した例である。SQL文1303は送信履歴Table1301を新規作成するためのSQL文である。SQL文1304は送信領域Table1302を新規作成するためのSQL文である。SQL文1303、1304は、アプリの初期化時に実行され、作成されたTableはDB部317に保存する。SQL文1305は、同一分類の送信履歴があるかどうかを確認するSQL文である。SQL文1306は、同一分類で、選択座標と一致するもがあるかどうかを確認するSQL文である。SQL文1307は、同一分類で、選択座標が一致した履歴の識別情報がすべて一致するかどうかを確認するSQL文である。SQL文1308は、同一分類で、座標が一致した履歴の送信結果がすべて一致するかどうかを確認するSQL文である。SQL文1309は、同一分類で、OCR結果が一致したものがあるかどうかを確認するSQL文である。SQL文1310は、分類情報をキーに送信履歴を保存するSQL文である。
[OCR画面(モバイル端末)]
次に、モバイル端末104におけるOCR画面1400について図14を用いて説明する。
次に、モバイル端末104におけるOCR画面1400について図14を用いて説明する。
OCR画面1400は、モバイル端末画面400のOCRボタン402を押すと表示される画面である。OCR画面表示時にFAX表示画面で表示していたFAXのイメージ画像に対して、OCR用のブロック(領域)を作成し、そのブロックに対してOCR処理する。さらにブロックのうちテキストと認識されたものを1409に示すように選択可能領域として、四角で囲って選択可能状態で表示する。選択可能領域1409は、オブジェクト認識、OCRの結果としてテキストと認識されたものが四角で囲って選択できるようになったものである。OCR画面1400は、すべての選択領域が履歴情報を元に識別情報が決定され、識別可能に可視化して表示している一例を表している。
ボタン表示領域1402は、ボタン設定画面(不図示)で設定したボタンを表示するための領域である。ボタン1404〜1406を押した後に選択可能領域を押すと選択可能領域のOCR結果を中継アプリ321にメッセージ送信することが出来る。図6のメッセージ604は、電話番号ボタンを押して送信したメッセージの例である。商品Codeボタン1405、商品数量ボタン1406を押してメッセージ送信した例が、図6のメッセージ605、メッセージ606である。表示名領域1408は、ボタンに定義した表示名を表示する領域である。ユーザーが選択可能領域を選択すると、後述する送信確認画面1500に遷移する。選択領域1410は、識別情報が「tel」と決定された選択領域である。選択領域1411は、識別情報が「code」と決定された選択領域である。選択領域1412は、識別情報が「code」と決定された選択領域である。選択領域1413は、識別情報が「code」と決定された選択領域である。選択領域1414は、識別情報が「num」と決定された選択領域である。選択領域1415は、識別情報が「num」と決定された選択領域である。選択領域1416は、識別情報が「num」と決定された選択領域である。識別情報が決定された選択領域は、識別情報毎に、例えば色を変えて表示することにより、ユーザーにより判別可能にする。
[送信確認画面(モバイル端末)]
次に、モバイル端末104における送信確認画面について図15を用いて説明する。
次に、モバイル端末104における送信確認画面について図15を用いて説明する。
1500は送信確認画面である。送信確認画面1500では、ユーザーが選択した領域のOCR結果を見て、間違いがないと判断すれば中継アプリ321に送信する。さらに間違いがあれば、修正あるいは送信をキャンセルするための画面である。選択済み画像表示領域1501は、ユーザーが選択した選択可能領域の画像を拡大して表示する。テキスト入力エリア1502は、選択された選択可能領域のOCR処理結果のテキスト情報、あるいは操作履歴データベース1300から決定された送信結果情報を初期値として編集可能な入力エリアである。テキストクリアボタン1503は、テキスト入力エリアのテキスト値をクリアするボタンである。OCR結果が間違っていた場合などに使用する。送信実行ボタン1504は、送信を実行するボタンである。ボタンを押すとメッセージが中継アプリ321に送信される。キャンセルボタン1505は、画面をキャンセルするボタンであり、OCR画面に戻る。
[操作履歴データベースの一例]
次に、操作履歴データベース1300が保持する情報の一例について図16を用いて説明する。
次に、操作履歴データベース1300が保持する情報の一例について図16を用いて説明する。
FAXイメージ1600に対して画像分類部315が、分類を「分類1」と決定し、ユーザーが選択領域1601〜1605を中継アプリ321に送信した場合について示している。送信履歴Table1301と送信領域Table1302の具体例が、送信履歴Table具体例1606と送信領域Table具体例1607である。
送信履歴レコード1608は、FAXイメージ1600の選択領域1601を選択し、識別情報を「tel」、OCR結果が「080-1284-1234」であるものを送信確認画面1500で修正し、「080-1234-1234」として送信したことを示す。また送信履歴レコード1609は、FAXイメージ1600の選択領域1602を選択し、識別情報を「code」、OCR結果が「2301119」であるものを送信確認画面1500で修正し、「2801119」として送信したことを示す。また送信履歴レコード1610は、FAXイメージ1600の選択領域1603を選択し、識別情報を「code」、OCR結果が「3891120」であるものを送信確認画面1500で修正することなくそのまま送信したことを示す。また送信履歴レコード1611は、FAXイメージ1600の選択領域1604を選択し、識別情報を「num」、OCR結果が「3」であるものを送信確認画面1500で修正することなくそのまま送信したことを示す。また送信履歴レコード1612は、FAXイメージ1600の選択領域1605を選択し、識別情報を「num」、OCR結果が「3」であるものを送信確認画面1500で修正することなくそのまま送信したことを示す。
[検索領域絞り込み処理]
次に、操作履歴管理部316で行う検索領域絞り込み処理について、図21を用いて説明する。
次に、操作履歴管理部316で行う検索領域絞り込み処理について、図21を用いて説明する。
図14のような第2のOCR画面1400を表示させる場合、FAXイメージに対して抽出した選択可能領域すべてに対して識別情報を決定する必要がある。そこで予め履歴情報の座標情報から検索必要領域2101と検索除外領域2102を識別しておくことにより、入力があったFAXイメージ2103の選択可能領域から検索必要領域2104と検索除外領域2105を決定する。そうすることで検索必要領域2104に対してのみ識別情報を決定することで検索対象を減らすことが出来るため、表示の速度が向上する。検索必要領域2101と検索除外領域2102の識別は、メッセージ送信後に操作履歴データベースに履歴を登録するときに行う。既存の検索領域と操作履歴情報の座標情報を比較し、既存の検索領域と座標情報のAND条件の領域を検索領域とする。
[抽出情報送信処理のフローチャート]
イメージから抽出した情報をボタン操作で送る図5の処理S505の詳細なフローについて図17〜図19を用いて説明する。
イメージから抽出した情報をボタン操作で送る図5の処理S505の詳細なフローについて図17〜図19を用いて説明する。
本フローは、モバイル端末104のモバイル端末画面400でFAXイメージを表示している時にユーザーがOCRボタン402を押したことをトリガーに開始する。
図17はFAXイメージから抽出した情報を表示するまでの処理のフローについて説明している。
S1701で、FAX画像解析部310は、FAX受信データに含まれるFAXイメージを解析して、FAXイメージ内における文字認識用の複数のブロックを作成する。この処理をブロックセレクション処理と呼ぶ。
S1702で、OCR部311は、各ブロックに対してOCR処理を行い、テキスト情報を抽出する。
S1703で、画像分類部315の分類処理部1102は、分類処理を行い、FAXイメージを分類する。以下主に図16のデータベースが既に作成されている状況を前提に説明する。具体的には操作履歴データベース1300として送信履歴Table具体例1606と送信領域Table具体例1607が既に作成されている場合である。
S1704で、FAXイメージが分類できた場合は、S1705へ遷移する。FAXイメージが分類できなかった場合は、S2104に遷移する。
S1705で、操作履歴管理部316は、DB部317の操作履歴データベース1300に対して、分類情報、例として分類1(1104)をキーに検索を実行し、同一分類ですでに送信した履歴情報があるかどうかを確認する。この時操作履歴データベース1300に問い合わせるSQL文は1305である。
S1706で、一致した履歴情報がある場合はS1707に遷移する。
S1707で、操作履歴管理部316は、図21を用いて説明した検索領域絞り込み処理を行う。一致した履歴情報がなければS1719に遷移する。送信履歴Table具体例1606でいうと分類1(1104)のレコード(1608〜1612)が5つヒットするのでS1708に遷移する。
S1708で、操作履歴管理部316は、FAXイメージから作成されたブロックそれぞれに対して検索必要領域2104に含まれているかどうかを判断する。判断の結果、対象のブロックが検索必要領域2104に含まれている場合は、S1709へ遷移する。ブロックが検索除外領域2105の場合は、次のブロックへ遷移し、再度S1708で次のブロックに対する判断処理を行う。
S1709で、操作履歴管理部316は、座標処理部318で、S1801で選択した選択済み領域1410の座標情報の座標補正処理および図12を用いて説明した座標正規化処理を行う。
ここで座標補正処理とS1710で行う内包問い合わせ、オーバーラップ問い合わせの詳細について、図20を使って説明する。
選択済み領域1419の座標情報を使って操作履歴データベース1300に問い合わせる方法として、内包問い合わせ2001とオーバーラップ問い合わせ2002の2種類がある。内包問い合わせ2001とは、問い合わせ領域に対して、内包している領域のみを検索する問い合わせであり、内包問い合わせ領域2007に対して、内包領域2008を探す問い合わせである。内包問い合わせ2001は、問い合わせに対する処理速度が速い反面、ヒットしない例2003のように問い合わせに一致しないということがある。
一方、オーバーラップ問い合わせ2002は、問い合わせ領域に対して、重なり合う領域を検索する問い合わせであり、オーバーラップ問い合わせ領域2009に対して、オーバーラップ領域2010を検索する問い合わせである。オーバーラップ問い合わせ2002は、確実にヒットする代わりに、問い合わせに対する処理速度が遅い、またノイズがヒットする可能性があるということがある。
ヒットしない例2003は、問い合わせ領域2011とヒットしない領域2012が交差しており内包していないため、内包問い合わせにヒットしない例である。このように内包問い合わせ2001は、少しでも座標がずれると問い合わせにヒットしない。
またヒットしない例2004は、問い合わせ領域2013とヒットしない領域2014が内包もオーバーラップもしていないため、どちらの問い合わせに対しても検索にヒットしない例である。例えば、図16で説明したように商品コードとして1602や1603の2つの履歴が保存してある場合に、図14のOCR画面のように3つ目の商品コードが記載されたFAXイメージを新たに読み込んだ場合を意味する。S1801で1410の代わりに選択可能領域1411が選択された場合に、問い合わせに一致しないということを示している。
まずヒットしない例2003に対応するためにS1709で座標補正処理を行い、座標位置を補正する。座標補正処理の具体例を、図20の2000を使って説明する。ユーザーが選択した座標が図に示すように左上座標1203と右下座標1204である場合に、図に示すように補正後左上座標2005と補正後右下座標2006に座標を補正する。
またヒットしない例2004に対応するために後述のS1710で、内包問い合わせ2001で一致するのもがない場合、オーバーラップ問い合わせ2002で再度検索を行う。
以降、再度図17の説明を行う。
S1710で、操作履歴管理部316は、分類情報が分類1(1104)で、選択済み領域と操作履歴データベース1300の座標を比較して、一致するものがあるかどうかを確認する。具体的には、まず前述の内包問い合わせ2001を行い、一致するものがない場合、前述のオーバーラップ問い合わせを行う。この時操作履歴データベース1300に問い合わせる内包問い合わせのSQL文は1306であり、オーバーラップ問い合わせのSQL文は、1311である。送信履歴Table具体例1606でいうとレコード1608が1つヒットする。
S1711で、一致した履歴情報があれば、S1712へと遷移する。一致した履歴がなければ、次のブロックへ遷移し、再度S1708で次のブロックに対する判断処理を行う。
S1712で、一致した履歴の識別情報がすべて同一であれば、S1713に遷移する。一致した履歴の識別情報がすべて同一でなければ、次のブロックへ遷移し、再度S1708で次のブロックに対する判断処理を行う。この時操作履歴データベース1300に問い合わせるSQL文は1307である。送信履歴Table具体例1606でいうと、識別情報はすべて「tel」であるので、すべて同一であると判断し、S1713に遷移する。
S1713で、操作履歴管理部316は、各ブロックの識別情報を決定する。さらに情報表示部306は、FAXイメージに対してブロックの領域の色を変える。さらに情報表示部306は、識別情報毎に色を変える。またこれら領域を選択可能状態にする。
すべてのブロックに対してS1708〜S1712の処理が終了したら、S1714で、操作履歴管理部316は、ブロックに一致しなかった履歴を抽出する。
S1715で、抽出した履歴の中で、領域が一部、または、全部が重なっている履歴に対して、それらの領域すべてを包含するような一つの領域(矩形)を生成する。
図22はS1715の処理の一例を示した図である。
2205、2209は、FAXイメージ2200に対して、S1714で抽出した送信履歴と送信領域の具体例である。この例では、ブロックに一致しなかった三つの履歴2206、2207、2208が抽出されている。これらの履歴の領域をFAXイメージ2200に図示したのが、2201、2202、2203である。図を見てわかる通り、これら三つの領域は互いに重なっている。この三つの領域に対して、これらをすべて包含するような領域として生成された領域が2204である。2204の左上座標は、送信領域2209のminXの最小値とminYの最小値、つまり、x座標が700、y座標が3450である。2204の右下座標は、送信領域2209のmaxXの最大値とmaxYの最大値、つまり、x座標が7710、y座標が4090である。
S1716で、生成した領域それぞれに対して、領域を包含する履歴の識別情報がすべて同一であれば、S1717に遷移する。領域を包含する履歴の識別情報がすべて同一でなければ、S1718に遷移する。
S1717で、操作履歴管理部316は、領域の識別情報を決定する。さらに情報表示部306は、FAXイメージに対して領域の色を変える。さらに情報表示部306は、識別情報毎に色を変える。また領域を選択可能状態にする。
S1718で、OCR部311は、選択可能領域に対してOCR処理を行い、テキスト情報を抽出する。S1715で生成した領域すべてに対してS1716〜S1718の処理が終了したら、S1719に遷移する。
S1719で、情報表示部306は、OCR画面1400を表示し、終了する。
図18はユーザーによりOCR画面1400で選択された選択可能領域に関する情報を送信するまでの処理のフローを説明している。
S1801で、ユーザーによりOCR画面1400で送信したい選択可能領域が選択されると、情報表示部306は、選択された選択可能領域を選択状態にする。選択状態になることによって、選択済み領域が選択可能領域とは識別可能に表示される。
S1802で、操作履歴管理部316は、S1711で一致した履歴の送信結果(sendmessage)を確認する。この時操作履歴データベース1300に問い合わせるSQL文は1308である。
S1803で、送信結果(sendmessage)がすべて同一であれば、S1804へ遷移する。同一でなければS1805へ遷移する。
S1804で、操作履歴管理部316は、送信結果を表示することを決定する。送信履歴Table具体例1606でいうとレコード1608の送信結果「080-1234-1234」に決定する。
S1805で、操作履歴管理部316は、選択済み領域1410のOCR結果と一致するテキストが操作履歴データベースのOCR結果(ocrresult)にあるかを確認する。一致するものがあれば、S1806に遷移する。なければS1809に遷移する。この時操作履歴データベース1300に問い合わせるSQL文は1309である。
S1806で、操作履歴管理部316は、複数の送信結果があるかどうかを確認する。複数の送信結果の場合はS1807へ遷移する。複数の送信結果でない場合は、S1808へ遷移する。
S1807で、操作履歴管理部316は、送信回数の多い送信結果を表示することを決定する。
S1808で、操作履歴管理部316は、送信結果を表示することを決定する。
S1809で操作履歴管理部316は、選択済み領域1410のOCR結果を表示することを決定する。
S1810で、メイン制御部305は、操作履歴管理部316から受け取った情報を元に、送信確認画面1500を表示する。選択済み画像表示領域1501の画像は、選択済み領域1410の画像である。またテキスト入力エリア1502の値は、上記ステップで決定した送信結果またはOCR結果を格納する。選択状態ボタン1506は、電話番号ボタン1404が選択状態になっていることを表している。S1713で識別情報が決定していない場合は、ユーザーが識別情報を判断し、ボタン1404〜1406を選択する必要がある。
S1811で、ユーザーにより送信実行ボタン1504が押されたことをトリガーとして、メッセージ生成部312は、PC端末105の中継アプリ321に送信するメッセージを生成する。具体的には、テキスト入力エリア1502の値「080-1234-1234」と、電話番号ボタン1404に設定されている識別情報「tel」を送信するメッセージである。この時生成されたメッセージは、図6のメッセージ604である。さらにメッセージ送受信部313が、中継アプリ321に対してメッセージを送信する。これによって、S1713で決定された識別情報と、S1701で作成されたブロックに対する文字認識に基づくテキスト情報が送信される。
S1812で、メイン制御部305は送信履歴を操作履歴データベース1300に保存する。この時操作履歴データベース1300に問い合わせるSQL文は1310である。これによって、モバイルアプリ304の送信結果に基づいて、文書内の領域の座標と、領域に対応する識別情報が保存される。
S1813で、操作履歴管理部316は、送信履歴座標が既存の検索領域の枠内に含まれるかを確認し、枠外の場合は検索領域情報を更新し、終了する。
図19はユーザー操作によりOCR画面1400で指定された領域に関する情報を送信するまでの処理のフローを説明している。ここで、ユーザー操作により指定される任意の領域とは、FAXイメージに対してブロックセレクション処理を行った結果、ブロックとして抽出されなかった領域である。なお、既に説明したステップと同じ処理については、既に説明したステップの番号と同一の番号を付与し、特に断りが無い限り説明は省略する。
S1901で、ユーザー操作によりOCR画面1400で任意の領域が指定されると、情報表示部306は、指定された領域を選択状態にする。選択状態になることによって、選択済み領域が選択可能領域とは識別可能に表示される。
S1902で、OCR部311は、指定された領域に対してOCR処理を行い、テキスト情報を抽出する。
以上のように、本実施形態によれば、モバイル端末で取り込んだFAXイメージのOCR結果、または履歴情報の送信結果のテキスト情報は、履歴情報を元に自動的に決定した識別情報とともにPC端末の中継アプリに送信される。中継アプリが、識別情報により特定されるスクリプトを実行することによって、ユーザーのシステムへの入力操作を自動化することができる。
また、FAXイメージに対するブロックセレクション処理で、ブロックとして認識されなかった領域に関しても、履歴情報を元に領域を生成して、選択可能な領域としてユーザーに提示することができる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以上、本発明の好ましい実施形態について説明したが、本発明は、これらの実施形態に限定されず、その要旨の範囲内で種々の変形および変更が可能である。
101 画像形成装置、102 FAX保管サーバー、103 基幹業務サーバー、
104 モバイル端末、105 PC端末
104 モバイル端末、105 PC端末
Claims (12)
- 文書内の領域の座標と、前記領域に対応する識別情報を保存する保存手段と、
新たに受信した文書から、受信した文書内における文字認識用の複数の領域を作成する作成手段と、
前記作成手段によって作成される領域は、文書に対するブロックセレクション処理によって抽出される領域と、ユーザーが指定する任意の領域とを含み、
前記作成手段によって作成された領域の座標と、前記保存手段によって保存された領域の座標を比較する比較手段と、
前記比較手段による比較の結果と、前記保存手段によって保存された領域に対応する識別情報に基づいて、前記作成手段によって作成された領域の座標に対応する識別情報を決定する決定手段と、
前記決定手段によって決定された前記識別情報と、前記作成手段によって作成された領域に対する文字認識に基づくテキスト情報を送信する送信手段と、
前記送信手段によって送信された前記識別情報に基づいて、テキスト情報をアプリケーションに入力するためのスクリプトを特定し、特定されたスクリプトを実行する実行手段と、を有し、
前記保存手段は、前記送信手段による送信の結果に基づいて、前記作成手段によって作成された領域の座標と、前記領域に対応する識別情報を保存することを特徴とするシステム。 - 前記作成手段によって作成される領域は、前記保存手段によって保存された領域で、かつ、文書に対するブロックセレクション処理によって抽出されなかった領域を含むことを特徴とする請求項1に記載のシステム。
- 前記新たに受信した文書を特徴に基づいて分類する分類手段と、を有し、
前記保存手段は、前記分類手段による分類と、前記文書内の領域の座標と、前記識別情報を対応付けて保存し、
前記決定手段は、前記比較手段の結果と、前記保存手段によって保存された前記分類と前記領域に対応する識別情報に基づいて、前記作成手段によって作成された領域の座標に対応する識別情報を決定することを特徴とする請求項1又は請求項2に記載のシステム。 - 前記実行手段によって前記スクリプトが実行されることにより、ウィンドウメッセージのやりとりが行われ、システム接続アプリケーションへの情報の入力が行われることを特徴とする請求項1乃至請求項3の何れか一項に記載のシステム。
- 前記保存手段は、前記テキスト情報と、前記文書内の領域の座標と、前記識別情報を対応付けて保存し、
前記情報処理装置はさらに、
前記保存手段によって保存された前記テキスト情報又は前記作成手段によって作成された領域に対する文字認識の結果を表示し、前記文字認識の結果を修正して前記テキスト情報として送信するための確認画面を表示する表示手段と、を有し、
前記送信手段は、前記確認画面で前記文字認識の結果が修正された場合、前記決定手段によって決定された前記識別情報と、前記確認画面で修正された前記テキスト情報を送信することを特徴とする請求項1乃至請求項4の何れか一項に記載のシステム。 - コンピュータに、
文書内の領域の座標と、前記領域に対応する識別情報を保存する保存工程と、
新たに受信した文書から、受信した文書内における文字認識用の複数の領域を作成する作成工程と、
前記作成工程によって作成される領域は、文書に対するブロックセレクション処理によって抽出される領域と、ユーザーが指定する任意の領域とを含み、
前記作成工程によって作成された領域の座標と、前記保存工程によって保存された領域の座標を比較する比較工程と、
前記比較工程による比較の結果と、前記保存工程によって保存された領域に対応する識別情報に基づいて、前記作成工程によって作成された領域の座標に対応する識別情報を決定する決定工程と、
前記決定工程によって決定された前記識別情報と、前記作成工程によって作成された領域に対する文字認識に基づくテキスト情報を送信する送信工程と、
前記送信工程によって送信された前記識別情報に基づいて、テキスト情報をアプリケーションに入力するためのスクリプトを特定し、特定されたスクリプトを実行する実行工程と、を実行させ、
前記保存工程は、前記送信工程による送信の結果に基づいて、前記作成工程によって作成された領域の座標と、前記領域に対応する識別情報を保存することを特徴とするプログラム。 - 前記作成工程によって作成される領域は、前記保存工程によって保存された領域で、かつ、文書に対するブロックセレクション処理によって抽出されなかった領域を含むことを特徴とする請求項6に記載のプログラム。
- 前記コンピュータに、
前記新たに受信した文書を特徴に基づいて分類する分類工程と、を実行させ、
前記保存工程は、前記分類工程による分類と、前記文書内の領域の座標と、前記識別情報を対応付けて保存し、
前記決定工程は、前記比較工程の結果と、前記保存工程によって保存された前記分類と前記領域に対応する識別情報に基づいて、前記作成工程によって作成された領域の座標に対応する識別情報を決定することを特徴とする請求項6又は請求項7に記載のプログラム。 - 前記実行工程によって前記スクリプトが実行されることにより、ウィンドウメッセージのやりとりが行われ、システム接続アプリケーションへの情報の入力が行われることを特徴とする請求項6乃至請求項8の何れか一項に記載のプログラム。
- 前記保存工程は、前記テキスト情報と、前記文書内の領域の座標と、前記識別情報を対応付けて保存し、
前記コンピュータにさらに、
前記保存工程によって保存された前記テキスト情報又は前記作成工程によって作成された領域に対する文字認識の結果を表示し、前記文字認識の結果を修正して前記テキスト情報として送信するための確認画面を表示する表示工程と、を実行させ、
前記送信工程は、前記確認画面で前記文字認識の結果が修正された場合、前記決定工程によって決定された前記識別情報と、前記確認画面で修正された前記テキスト情報を送信することを特徴とする請求項6乃至請求項9の何れか一項に記載のプログラム。 - 文書内の領域の座標と、前記領域に対応する識別情報を保存する保存工程と、
新たに受信した文書から、受信した文書内における文字認識用の複数の領域を作成する作成工程と、
前記作成工程によって作成される領域は、文書に対するブロックセレクション処理によって抽出される領域と、ユーザーが指定する任意の領域とを含み、
前記作成工程によって作成された領域の座標と、前記保存工程によって保存された領域の座標を比較する比較工程と、
前記比較工程による比較の結果と、前記保存工程によって保存された領域に対応する識別情報に基づいて、前記作成工程によって作成された領域の座標に対応する識別情報を決定する決定工程と、
前記決定工程によって決定された前記識別情報と、前記作成工程によって作成された領域に対する文字認識に基づくテキスト情報を送信する送信工程と、
前記送信工程によって送信された前記識別情報に基づいて、テキスト情報をアプリケーションに入力するためのスクリプトを特定し、特定されたスクリプトを実行する実行工程と、を有し、
前記保存工程は、前記送信工程による送信の結果に基づいて、前記作成工程によって作成された領域の座標と、前記領域に対応する識別情報を保存することを特徴とする制御方法。 - 前記作成工程によって作成される領域は、前記保存工程によって保存された領域で、かつ、文書に対するブロックセレクション処理によって抽出されなかった領域を含むことを特徴とする請求項11に記載の制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015213560A JP2017084198A (ja) | 2015-10-30 | 2015-10-30 | システム、プログラム及び制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015213560A JP2017084198A (ja) | 2015-10-30 | 2015-10-30 | システム、プログラム及び制御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017084198A true JP2017084198A (ja) | 2017-05-18 |
Family
ID=58710993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015213560A Pending JP2017084198A (ja) | 2015-10-30 | 2015-10-30 | システム、プログラム及び制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017084198A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019032798A (ja) * | 2017-08-10 | 2019-02-28 | 富士ゼロックス株式会社 | 情報処理装置、及びプログラム |
JP2019128727A (ja) * | 2018-01-23 | 2019-08-01 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
-
2015
- 2015-10-30 JP JP2015213560A patent/JP2017084198A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019032798A (ja) * | 2017-08-10 | 2019-02-28 | 富士ゼロックス株式会社 | 情報処理装置、及びプログラム |
JP2019128727A (ja) * | 2018-01-23 | 2019-08-01 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
JP7034730B2 (ja) | 2018-01-23 | 2022-03-14 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9268987B2 (en) | Method of recognizing QR code in image data and apparatus and method for converting QR code in content data into touchable object | |
JP6064392B2 (ja) | 検索装置、検索方法、検索プログラムおよび検索システム | |
US8589781B2 (en) | Information processing device, information processing method, program, and information processing system | |
JP6056219B2 (ja) | 検索装置および検索方法、ならびに、プログラム | |
US20210209291A1 (en) | Systems and methods for presentation of a terminal application screen | |
US20150237082A1 (en) | Dynamically enabling an interactive element within a non-interactive view of a screen sharing session | |
CN105637509A (zh) | 在图像内搜索和注释 | |
US20150143488A1 (en) | Information sharing system and information sharing method | |
JP2016167156A (ja) | システム、プログラム及び制御方法 | |
US10482393B2 (en) | Machine-based learning systems, methods, and apparatus for interactively mapping raw data objects to recognized data objects | |
US10803233B2 (en) | Method and system of extracting structured data from a document | |
CN103678706A (zh) | 一种基于截图信息的识图方法、系统、设备及装置 | |
JP2017084198A (ja) | システム、プログラム及び制御方法 | |
US10698574B2 (en) | Display control program, display control method, and display control apparatus | |
US11875587B2 (en) | Information processing system, information processing method, and non-transitory recording medium | |
KR101483611B1 (ko) | 이미지에서 객체를 추출하기 위한 방법 및 단말기 | |
US20150082215A1 (en) | Operation process creating method and information processing apparatus | |
JP2021196840A (ja) | 情報処理装置、情報処理方法、プログラム及び情報処理システム | |
KR20150097250A (ko) | 태그 정보를 이용한 스케치 검색 시스템, 사용자 장치, 서비스 제공 장치, 그 서비스 방법 및 컴퓨터 프로그램이 기록된 기록매체 | |
US20210271350A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20230044463A1 (en) | System and method for locating products | |
JP2016066335A (ja) | 情報処理システム、情報処理装置、情報処理システムの制御方法、及びプログラム | |
CN104219308A (zh) | 设备间的资源传输方法和装置 | |
JP7456131B2 (ja) | 情報処理システム、情報処理方法及びプログラム | |
US20230244860A1 (en) | Information processing apparatus, information processing method, and information processing system |