JP2016167156A - システム、プログラム及び制御方法 - Google Patents

システム、プログラム及び制御方法 Download PDF

Info

Publication number
JP2016167156A
JP2016167156A JP2015046430A JP2015046430A JP2016167156A JP 2016167156 A JP2016167156 A JP 2016167156A JP 2015046430 A JP2015046430 A JP 2015046430A JP 2015046430 A JP2015046430 A JP 2015046430A JP 2016167156 A JP2016167156 A JP 2016167156A
Authority
JP
Japan
Prior art keywords
identification information
area
coordinates
result
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015046430A
Other languages
English (en)
Inventor
嘉仁 七海
Yoshihito Nanaumi
嘉仁 七海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015046430A priority Critical patent/JP2016167156A/ja
Priority to US15/061,855 priority patent/US10097724B2/en
Priority to KR1020160027454A priority patent/KR101937525B1/ko
Priority to CN201910784129.9A priority patent/CN110321880B/zh
Priority to CN201610129764.XA priority patent/CN105955683B/zh
Publication of JP2016167156A publication Critical patent/JP2016167156A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/235Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on user input or interaction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00355Mark-sheet input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00355Mark-sheet input
    • H04N1/00376Means for identifying a mark sheet or area
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32037Automation of particular transmitter jobs, e.g. multi-address calling, auto-dialing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32358Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device using picture signal storage, e.g. at transmitter
    • H04N1/324Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device using picture signal storage, e.g. at transmitter intermediate the transmitter and receiver terminals, e.g. at an exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/43Editing text-bitmaps, e.g. alignment, spacing; Semantic analysis of bitmaps of text without OCR

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Automation & Control Theory (AREA)
  • Artificial Intelligence (AREA)
  • Facsimiles In General (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】 本発明は、送信結果の履歴に基づいて、領域の座標を比較し、識別情報を付与することにより、より高速にシステムへ入力を行うことを目的とする。【解決手段】 本発明のシステムは、受信した文書内における文字認識用の複数の領域を作成し、作成された領域の座標と、履歴の領域の座標を比較し、その比較結果と履歴に基づいて、作成された領域の座標に対応する識別情報を決定して、作成された領域に対する文字認識に基づくテキスト情報と決定された識別情報を送信して、送信された識別情報に基づいて特定される、テキスト情報をアプリケーションに入力するためのスクリプトを実行する。【選択図】 図17

Description

本発明は、システム、プログラム及び制御方法に関する。
従来、受信したFAXを紙で出力するのではなく、イメージとしてPC端末に取り込み、表示することによって、ペーパーレスを実現するシステムがある。特許文献1は、FAXにより受信された注文票をPC端末で表示し、FAXに含まれる情報をシステムに入力するFAX注文票ペーパーレス入力システムに関する技術を開示している。
特開2009−20642号公報
本明細書ではFAXに含まれる情報をシステムに入力する方法として、識別情報に基づいたスクリプトを実行することでアプリケーションにOCRで認識されたテキスト情報を入力する構成について検討する。しかしながら、ユーザーが識別情報を毎回手動操作で特定していては操作が煩雑であり、付与する操作にかかる時間によってシステムへの入力が遅くなる。
これに対して本発明は、送信結果の履歴に基づいて、領域の座標を比較し、識別情報を特定することにより、より高速にシステムへ入力を行うことを目的とする。
上記の目的を達成するための本発明に係るシステムは、
文書内の領域の座標と、前記領域に対応する識別情報を保存する保存手段と、
新たに受信した文書から、受信した文書内における文字認識用の複数の領域を作成する作成手段と、
前記作成手段によって作成された領域の座標と、前記保存手段によって保存された領域の座標を比較する比較手段と、
前記比較手段による比較の結果と、前記保存手段によって保存された領域に対応する識別情報に基づいて、前記作成手段によって作成された領域の座標に対応する識別情報を決定する決定手段と、
前記決定手段によって決定された前記識別情報と、前記作成手段によって作成された領域に対する文字認識に基づくテキスト情報を送信する送信手段と、
前記送信手段によって送信された前記識別情報に基づいて、テキスト情報をアプリケーションに入力するためのスクリプトを特定し、特定されたスクリプトを実行する実行手段と、を有し、
前記保存手段は、前記送信手段による送信の結果に基づいて、前記作成手段によって作成された領域の座標と、前記領域に対応する識別情報を保存することを特徴とする。
本発明のシステムによれば、送信結果の履歴に基づいて、領域の座標を比較し、識別情報を特定することにより、より高速にシステムへ入力を行うことができる。
システムの全体構成の一例を示す図である。 各装置のハードウェア構成の一例を示す図である。 各装置のソフトウェア構成の一例を示す図である。 モバイルアプリのUIの一例を示す図である。 システムの基本的な処理フローの一例を示す図である。 メッセージのデータ構造の一例を示す図である。 中継アプリで保持する情報の一例を示す図である。 図5のステップS507の処理の詳細を示す図である。 基幹システム接続アプリの操作画面の一例を示す図である。 スクリプト実行時の処理フローの一例を示す図である。 画像分類処理の一例を示す図である。 座標処理の一例を示す図である。 送信履歴データベースのデータ構造の一例を示す図である。 モバイルアプリのUIの一例を示す図である。 モバイルアプリのUIの一例を示す図である。 送信履歴データベースが保持する情報の一例を示す図である。 モバイルアプリの処理フローの一例を示す図である。 座標補正処理の一例を示す図である。 モバイルアプリのUIの一例を示す図である。 検索領域絞り込み処理の一例を示す図である。 モバイルアプリの処理フローの一例を示す図である。 モバイルアプリのUIの一例を示す図である。 モバイルアプリの処理フローの一例を示す図である。 モバイルアプリの処理フローの一例を示す図である。 システムの全体構成、及び各装置のソフトウェア構成の一例を示す図である。
以下、本発明を実施するための形態について図面などを参照して説明する。なお、実施形態は、本発明を限定するものではなく、また、実施形態で説明されている全ての構成が本発明の課題を解決するための手段に必須であるとは限らない。
(第1実施形態)
[システム構成]
本実施形態に係る情報処理システムの一例として、FAX受注システムを例に説明する。
図1は、FAX受注システム2000の全体構成の一例を示す図である。FAX受注システム2000は、画像形成装置101、FAX保管サーバー102、基幹業務サーバー103、端末の一例であるモバイル端末104、及びPC端末105を有する。
画像形成装置101は、ユーザー環境に配置された装置であり、ネットワーク100に接続されるとともに、FAXを受信するための公衆回線111に接続されている。FAX保管サーバー102、基幹業務サーバー103、モバイル端末104、及びPC端末105は、ユーザー環境に配置された装置であり、ネットワーク100を介して互いに通信可能に接続されている。
なお、図1においてFAX保管サーバー102、基幹業務サーバー103、モバイル端末104、及びPC端末105は、同一ネットワークに属しているが、これに限定されるものではない。それぞれの装置は、独立したネットワークに属しているか、又はインターネット110に直接接続されていても構わない。また、各サーバーは、1台で構成されていてもよいし、複数台で構成されていてもよい。
FAX保管サーバー102は、画像形成装置101と同一のネットワークに存在するオンプレミスのSMB(Server Message Block)サーバー等である。また、FAX保管サーバー102は、インターネットに接続された公知の一般的なストレージサーバーであっても構わない。一般的なストレージサーバーの例としては、Microsoft(登録商標)社のOneDrive(登録商標)やGoogle(登録商標)社のGoogleドライブなどがある。
基幹業務サーバー103は、特定の業務に関して、PC端末105で動作する基幹システム接続アプリケーションを通じて情報の入力を受け付け、処理を行うサーバーである。本発明において、基幹業務サーバー103が受け付ける情報、および、それに基づいて実行する処理については、規定されるものではない。また、入力元の情報がFAXから抽出された情報であることを、必ずしも想定する必要はない。基幹業務サーバー103は、単に、PC端末105で動作する基幹システム接続アプリケーションを通じて情報の入力を受け付け、処理を行うという条件だけを満たせばよい。図1に示すシステム構成において、PC端末105が備える中継アプリケーションが、モバイル端末104が取り込んだFAXイメージに含まれる情報を基幹業務サーバー103へ入力する。
[ハードウェア構成]
図2は、FAX受注システム2000を構成する各装置(画像形成装置101、FAX保管サーバー102、基幹業務サーバー103、モバイル端末104、及びPC端末105)のハードウェアの構成の一例を示す図である。FAX受注システム2000を構成する各装置201は、各種のユニット(202〜207)を含んで構成される。
なお、FAX受注システム2000を構成する各装置のハードウェア構成は同一でも構わないし、それぞれ異なっていても構わない。
CPU(Central Processing Unit)202は、各種のプログラムを実行し、様々な機能を実現するユニットである。ROM(Read Only Memory)204は、各種のプログラム等を記憶するユニットである。RAM(Random Access Memory)203は、各種の情報を記憶するユニットである。また、RAM203は、CPU202の一時的な作業記憶領域としても利用されるユニットである。例えば、CPU202は、ROM204に記憶されているプログラムをRAM203にロードしてプログラムを実行する。
加えて、CPU202がフラッシュメモリ、HDD(Hard Disk Drive)又はSSD(Solid State Disk)といった外部記憶装置に記憶されているプログラムに基づき処理を実行する。これにより、図3に示されるようなFAX受注システム2000を構成する各装置のソフトウェア構成及び後述するシーケンスの各ステップの処理が実現される。
なお、各装置の機能及び後述するシーケンスに係る処理の全部又は一部については専用のハードウェアを用いて実現してもよい。
Input/Outputインターフェース205は、各装置に接続されているディスプレイ(不図示)にデータを送信する他、同じく各装置に接続されているポインティングデバイス(不図示)からデータを受信するユニットである。
NIC(Network Interface Card)206は、装置をネットワーク100に接続するためのユニットである。上述したユニットは、バス207を介してデータの送受信を行うことが可能に構成されている。
さらに、画像形成装置101は、FAXユニット(不図示)を搭載しており、バス207を介して各ユニットとデータを送受信することが可能に構成されている。FAXユニットは、各装置より受けたFAX制御言語をイメージに展開し不図示の公衆回線、又はインターネット110(IP−FAX)を介して他のFAX装置(不図示)へ転送することができる。
ここで、画像形成装置101は、印刷ユニット(不図示)を更に搭載していても構わない。印刷ユニットは、バス207を介して各ユニットとデータを送受信することが可能に構成されている。なお、印刷ユニットは、ラスタイメージを紙などの記録媒体に記録(印刷)することが可能なユニットである。
そして、画像形成装置101は、スキャナユニット(不図示)を更に搭載していても構わない。スキャナユニットは、バス207を介して各ユニットとデータを送受信することが可能に構成されている。なお、スキャナユニットは、画像を入力することが可能なユニットである。
また、モバイル端末104では、Input/Outputインターフェース205にタッチパネル(不図示)が接続されている。タッチパネルは、ディスプレイ等の表示部の一例であり、出力(表示)と入力との2つの機能を備えている。
[ソフトウェア構成(全般)]
次に、FAX受注システム2000を構成する各装置のソフトウェアの構成について説明する。図3は、各装置のソフトウェア構成の一例を示す図である。
図3に示される各ソフトウェア(アプリケーション)における機能(モジュール部)を実現するプログラムは、各装置のROM204等に記憶されている。
[ソフトウェア構成(モバイル端末)]
次に、モバイル端末104におけるソフトウェアの構成について説明する。なお、モバイル端末104は、携帯端末の一例であり、無線通信機能などの装備によって自由な場所で利用できる端末である。
モバイル端末104のOS(Operating System)(不図示)は、後述する各モジュール(画像管理部301、アドレス管理部302、及び通知処理部303)を有する。
画像管理部301は、画像やアプリケーションデータを管理する。OSは、画像管理部301を利用するための制御API(Application ProgrammingInterface)を提供している。各アプリはその制御APIを利用することで画像管理部301が管理する画像やアプリケーションデータの取得や保存を行う。
アドレス管理部302は、氏名や電話番号、住所などのアドレス情報を管理する。アドレス管理部302も画像管理部301と同様に、各アプリが利用するための制御APIを提供している。
通知処理部303は、通知サーバー(不図示)から通知情報を受信し、通知情報内のアプリのトークンを用いて通知の受信先であるアプリを特定し、アプリに対して通知情報を伝搬する。
モバイルアプリ(モバイルアプリケーション)304は、モバイル端末104のOSのインストール機能(例えばApple StoreやGoogle Play)を利用して、ダウンロードしインストールすることにより実行可能なアプリケーションである。モバイルアプリ304は、FAX保管サーバー102が管理するデータに対する各種のデータ処理を行う。
メイン制御部305は、モバイル端末104用のアプリケーション(モバイルアプリ)304を制御し、後述する各モジュール部(306〜317)に対する指示、及び管理を行う。
情報表示部306は、メイン制御部305からの指示に従い、モバイルアプリ304のユーザインタフェース(UI)をユーザーに提供する。
図4は、モバイルアプリ304のUI(携帯端末用のUI)を提供する画面の一例(モバイル端末画面400)を示す図である。モバイル端末画面400は、モバイル端末104のタッチパネルに表示される。また、モバイル端末画面400では、表示および操作領域401にFAXデータが表示され、文書等に対するユーザーによる操作(ユーザ操作)を、表示されたUIを介して受け付ける。OCRボタン402は、後述のOCR画面1400に画面遷移するボタンである。
なお、モバイルアプリ304のUIの形態(位置、大きさ、範囲、配置、表示内容など)は、図に示す形態に限定されるものではなく、モバイル端末104の機能を実現することができる適宜の構成を採用することができる。
再び図3に戻ってモバイルアプリ304の各モジュールの説明を行う。
操作情報取得部307は、情報表示部306により表示されたモバイルアプリ304のUIがユーザー操作された情報を取得し、取得した情報をメイン制御部305に通知する。例えば、表示および操作領域401をユーザーが手で触れると、操作情報取得部307は、触れられた画面上の位置の情報を感知し、感知した位置の情報をメイン制御部305に送信する。
データ送受信部308は、FAX保管サーバー102とデータの送信および受信を行い、送受信するデータをメイン制御部305とやり取りする。データ送受信部308は、FAXデータ操作及びFAXデータ編集によるファイルの更新をFAX保管サーバー102に要求する。
記憶部309は、操作情報取得部307を介して、換言するならばモバイルアプリ304のUIを介して、ユーザーにより入力された設定値を保存(永続化)する。さらに記憶部309は、データ送受信部308でFAX保管サーバー102から受信したデータを保存する。
FAX画像解析部310は、FAXイメージを解析して、レイアウト情報を生成する。レイアウト情報には、FAXイメージから抽出された矩形領域とその種別(文字、図形、線、表など)とが含まれる。
OCR部311は、FAX画像解析部310で抽出した矩形領域の中で、文字と判定された矩形領域に対して、OCR(光学文字認識)処理を行う。
メッセージ生成部312は、PC端末105の中継アプリ(中継アプリケーション)321に送信するメッセージを生成する。メッセージには、例えば、OCR部311で処理した結果やユーザーが入力した結果のテキスト情報が含まれる。
メッセージ送受信部313は、PC端末105の中継アプリ321に、メッセージ生成部312で生成したメッセージを送信し、その応答メッセージ(応答情報)を受信する。メッセージ解析部314は、メッセージ送受信部313で受信したPC端末105の中継アプリ321からの応答メッセージを解析し、FAXイメージに対する処理を実行する。
画像分類部315は、FAX保管サーバー102から受信したFAXイメージに対して、予め学習処理を行った特徴量を用いて分類処理を行い、FAXイメージの分類を行う。
操作履歴管理部316は、ユーザーが選択した短形領域の座標情報、OCR結果のテキスト情報、中継アプリ321に送信したメッセージ等をDB部317のデータベースを用いて管理する。
DB部317はデータベース機能を有し、操作履歴情報を管理する。
座標処理部318は、データベースへ座標情報を登録する際の座標正規化処理やデータベースへの座標問い合わせ時の座標補正処理行う。
[ソフトウェア構成(PC端末)]
次に、PC端末105におけるソフトウェアの構成について説明する。
PC端末105は、PC端末105にインストールされたOS上で複数のアプリケーションを実行することが可能である。図3では、複数のアプリケーションの一つである中継アプリ321と基幹システム接続アプリ(基幹システム接続アプリケーション)331について記載している。
なお、基幹システム接続アプリ331は、ユーザーからの入力を受け付け、基幹業務サーバー103に送信するアプリケーションである。基幹システム接続アプリ331の詳細については図9を用いて後述する。
中継アプリ321のモジュール構成について説明する。
メイン制御部322は、モバイルアプリ304と基幹システム接続アプリ331との間を中継する中継アプリ321を制御し、後述する各モジュール部(323〜326)に対する指示、管理を行う。
記憶部323は、ユーザーによって作成されたスクリプトを保存する。スクリプトは、モバイル端末104のモバイルアプリ304から受信したテキスト情報が含まれるメッセージにしたがって中継アプリ321が実行する簡単なプログラムである。詳細は後述するが、中継アプリ321がスクリプトを実行することによって基幹業務サーバー103に情報の入力が行われる。
メッセージ受信部324は、モバイル端末104のモバイルアプリ304からメッセージを受信する。
メッセージ解析部325は、メッセージ受信部324で受信したメッセージを解析する。
スクリプト実行部326は、メッセージ解析部325がメッセージを解析した結果、メッセージの内容に含まれる識別情報に紐付く、記憶部323に保存されているスクリプトを実行する。
[ソフトウェア構成(画像形成装置)]
次に、画像形成装置101におけるソフトウェアの構成について説明する。
画像形成装置101は、Java(登録商標)のプラットフォーム上で複数のアプリケーションを実行する。図3では複数のアプリケーションの一つであるFAX受信アプリ341について記載している。以降ではこのFAX受信アプリ341のモジュール構成について説明する。
メイン制御部342は、FAX受信アプリ341の各モジュールを制御し、各モジュールに対して指示し、各モジュールの管理を行う。
情報表示部343は、メイン制御部342からの指示に従い、FAX受信アプリ341のUIをユーザーに提供する。ユーザーは、このUI上でFAXイメージの保存先(FAX保管サーバー102)を指定することができる。
操作情報取得部344は、情報表示部343により表示されたFAX受信アプリ341のUI上のユーザー操作を情報として取得し、取得した情報をメイン制御部342に通知する。
データ送受信部345は、FAX保管サーバー102とデータの送信および受信を行う。
記憶部346は、情報表示部343及び操作情報取得部344を介してユーザーにより入力された設定値(例えば電話番号毎の振り分け先情報など)及び送受信するFAXイメージの一時保存などを実行する。
[基本フロー]
次に、FAX受注システム2000の基本的な処理フローについて図5を用いて説明する。
本フローは、画像形成装置101におけるFAXユニットが他のFAX装置からFAXイメージを受信したことをトリガーに開始する。
S501で、画像形成装置101は、FAXイメージを受信する。そして、受信したFAXイメージとFAX情報(送り元電話番号、FAX受信時間などのFAXヘッダ)を画像形成装置101内のRAM等に保存する。FAXイメージを受信したことをトリガーとして、FAX受信アプリ341のメイン制御部342は、FAX情報の送り元電話番号をキーにしてアドレス帳を調べ、電話番号が一致するアドレスの情報を元にFAX受信書誌情報を作成する。記憶部346は、FAX受信データ(FAXイメージとFAX受信書誌情報)を保存する。
S502で、メイン制御部342は、FAX受信データを、データ送受信部345を介してFAX保管サーバー102に送信する。
S503で、モバイル端末104のモバイルアプリ304のメイン制御部305は、FAX保管サーバー102から、FAX受信データをダウンロードする。
S504で、情報表示部306は、FAX受信データに基づいてUI(User Interface)を表示する。
S505で、FAX画像解析部310は、FAX受信データに含まれるFAXイメージを解析してレイアウト情報を取得する。文字と認識された領域に関して、OCR部311はOCR処理を行い、テキスト情報を生成する。ユーザー操作、例えばUI上のボタン操作により生成したテキスト情報の送信を指示する操作をトリガーとして、メッセージ生成部312は、テキスト情報からPC端末105の中継アプリ321に送信するメッセージを生成する。メッセージ送受信部313は、メッセージ生成部312が生成したメッセージをPC端末105の中継アプリ321に送信する。
S506で、PC端末105の中継アプリ321のメイン制御部322は、モバイル端末104のモバイルアプリ304からメッセージを受信する。
S507で、中継アプリ321はスクリプトの検索と実行を行う。S507の詳細な処理に関しては図8を用いて後述する。
S508で、メイン制御部322は、基幹システム接続アプリ331から受注番号を読み取り、応答メッセージとして、モバイル端末104のモバイルアプリ304に送信する。
S509で、モバイル端末104のモバイルアプリ304のメイン制御部305は、PC端末105の中継アプリ321から受信した受注番号をFAXデータの付加情報(アノテーション)として保存する。
[データ構造]
次に、モバイル端末104のモバイルアプリ304と、PC端末105の中継アプリ321との間で送受信されるメッセージについて説明する。
図6は、本実施形態におけるメッセージのデータ構造の一例を示す図である。
メッセージ601は、messageキーとそれに対する値を含む。また、messageキーの値は、子プロパティ602を含む。子プロパティ602は、bodyキー、internal−nameキー、display−nameキーを含む。bodyキーの値は、PC端末105の中継アプリ321がスクリプトを実行した際に、基幹システム接続アプリ331に入力される値(情報)である。internal−nameキーの値は、モバイル端末104のモバイルアプリ304と、PC端末105の中継アプリ321との間で、メッセージの種類(項目)を一意に識別するための値である。display−nameキーの値は、モバイル端末104のモバイルアプリ304、および、PC端末105の中継アプリ321で表示に使用する値である。メッセージ603〜607は、メッセージの内容をJSON(JavaScript(登録商標) Object Notation)形式で表現した例である。メッセージ603は、基幹システム接続アプリ331への入力をクリアする際に使用する。メッセージ604、605、606は、それぞれ基幹システム接続アプリ331に、電話番号、商品コード、商品数量を入力する際に使用するメッセージである。メッセージ607は、メッセージ604、605、606で、基幹システム接続アプリ331に入力した値を確定し、基幹システム接続アプリに表示される注文番号を取得する際に使用するメッセージである。
[中継アプリで保持する情報]
図7は、PC端末105の中継アプリ321で保持する情報の一例を示す図である。接続先情報711は、モバイル端末104との通信を開始するために使用する。接続先情報711は、接続先アドレスとポート番号を含み、それぞれ、モバイル端末104のアドレスと、モバイルアプリ304の待ち受けポート番号である。中継アプリ321は、アプリ起動時に、接続先情報711を使用して、モバイル端末104のモバイルアプリ304との間に、通信コネクションを確立する。スクリプトファイル情報712は、モバイルアプリ304から受信したメッセージに対して、実行するスクリプトファイル(スクリプト)を示す。スクリプトファイル情報712は、識別名とスクリプトファイル名を含む。識別名は、モバイルアプリ304から受信したメッセージに含まれるinternal−nameキーの値である。接続先情報711、および、スクリプトファイル情報712は、記憶部323で保持される。
[中継アプリの基本フロー]
図8は、図5のフローのS507の処理の詳細を示す図である。PC端末105の中継アプリ321は、S801でモバイル端末104のモバイルアプリ304からのメッセージを受信する。S802で、メッセージ解析部325は、メッセージを解析し、メッセージに含まれるinternal−nameキーの値を取得する。S803で、スクリプト実行部326は、スクリプトファイル情報712を参照して、internal−nameキーに対応付けられたスクリプトファイル名を取得する。これによって、後述する図17のS1723で送信される識別情報に基づいてスクリプトが特定され、特定されたスクリプトが実行される。S804で、スクリプト実行部326は、スクリプトファイルを記憶部323から読み出し、スクリプトを実行する。実行される処理は、スクリプトファイルの内容に依存する。S805で、スクリプト実行部326は、スクリプトの実行結果を取得する。S806で、スクリプト実行部326は、スクリプトの実行結果に値(応答情報)が含まれているかどうかを判断し、値が含まれていなければ終了する。S806で、スクリプトの実行結果に値が含まれていると判断した場合は、S807で、メイン制御部322は、その値をモバイルアプリ304に送信する。
[基幹システム接続アプリの画面]
図9は、基幹システム接続アプリ331の操作画面の一例を示す図である。
本実施形態における基幹システム接続アプリ331は、ユーザーの入力をGUIで受け付けるアプリケーションであれば、どのようなアプリケーションでもよい。本実施形態では基幹システム接続アプリ331は、基幹業務サーバー103に情報を入出力するための図9のようなGUIを持つアプリケーションであることを前提として、以降の説明を行う。
なお、本実施形態では、中継アプリ321がスクリプトを実行することにより、以降の説明でユーザーが行う入力やボタン押下等の操作を自動化することができる。中継アプリ321がスクリプトを実行する処理の詳細は、図10を用いて後述する。また、中継アプリ321がスクリプトを実行することで入力された情報を、ユーザーが操作画面上でさらに編集することも当然可能である。
900は、基幹システム接続アプリ331のメインウィンドウである。表示欄901、902、及び903は、それぞれ、顧客社名表示欄、顧客名称表示欄、顧客部署表示欄である。電話番号入力欄905は、電話番号を入力する入力欄であり、ユーザーがFAXイメージからFAXの送信元電話番号を読み取って、入力する。904は、検索ボタンであり、検索ボタン904が押下されると電話番号入力欄905に入力された電話番号を元に、基幹業務サーバー103のデータベースから顧客情報を検索し、検索結果を表示欄901、902、及び903に表示(出力)する。906は、注文入力欄である。注文入力欄906は、複数行から成り、(1行目のタイトル行を除く)各行は、商品コード入力欄907、商品名称表示欄908、数量入力欄909、単価表示欄910、金額表示欄911から成る。ユーザーは、FAXイメージから注文された商品の商品コードを読み取って、商品コード入力欄907に商品コードを入力する。商品コードが入力されると、基幹業務サーバー103のデータベースから商品情報が検索され、検索結果が同じ列の商品名称表示欄908、及び単価表示欄910に表示される。
さらに、ユーザーが、FAXイメージから注文された商品の数量を読み取って、数量入力欄909に数量を入力すると、単価と数量から算出された金額が同じ列の金額表示欄911に表示される。受注した商品が複数ある場合は、商品コード入力欄907への入力と、数量入力欄909への入力を繰り返す。
913は、受注発行ボタンであり、914は、受注番号表示欄である。ユーザーが受注番号発行ボタン913を押下すると、表示欄901〜905に表示されている顧客情報と、注文入力欄906に表示されている情報が注文情報として基幹業務サーバー103のデータベースとして登録される。このとき、基幹業務サーバー103から発行される受注番号が、受注番号表示欄914に表示される。912は、クリアボタンである。ユーザーが、クリアボタン912を押下することにより、メインウィンドウ900の表示が初期化され、各表示欄が空欄となる。
[スクリプトで実行される処理のフロー]
図10は、後述するように、S803で電話番号用のスクリプトが特定され、図8のS804で実行される電話番号用のスクリプトが実行される際の処理フローをより詳細に示した図である。本明細書のスクリプトは、図9で示したGUIを持つ基幹システム接続アプリ331への入力を前提に作成されている。中継アプリがスクリプトを実行することにより、ウィンドウメッセージのやりとりが行われ、ユーザーが手動で入力することなしに、基幹システム接続アプリ331への情報の入力を自動的に行うことができる。以降、より具体的に説明する。
図8のS803では、モバイル端末104のモバイルアプリ304から受信したメッセージのinternal−nameキーの値に、telが設定されていた場合に、スクリプトとしてtel.ps1が特定される。図10はそのtel.ps1を実行することで行われる処理を示したフローである。S1101で、PC端末105で動作する複数のアプリケーションの中から、基幹システム接続アプリ331が特定される。S1102で、基幹システム接続アプリ331のメインウィンドウ900が特定される。S1103で、メインウィンドウ900に表示されているGUIコントロールの中から、電話番号入力欄905(項目)が特定される。S1104で、電話番号入力欄905に、モバイルアプリ304から受信したメッセージのbodyキーの値が設定される。S1105で、メインウィンドウ900に表示されているGUIコントロールの中から、検索ボタン904が特定される。S1106で、検索ボタン904の押下が実行される。
[画像分類処理]
次に、画像分類部315が行うFAXイメージの分類について図11を用いて説明する。画像分類部315は、学習処理部1101と分類処理部1102から構成される。画像分類部315は、予め学習処理部1101で学習処理を行い、特徴量データをDB部317の特徴量DB1107に蓄えておく。さらに画像分類部315は、特徴量DB1107の情報に基づき分類処理部1102で分類処理を行い、分類を決定する。
一般的にイメージの特徴を表す特徴量データは、多次元のデータで表し、特徴ベクトルと呼ばれる。次元数は特徴の種類が何種類あるかを示している。
学習処理部1101で行う学習処理は、分類毎の複数の学習画像から特徴抽出を行い、各学習画像に対して、100次元の特徴ベクトルを算出する。さらに複数の学習画像の特徴ベクトルを元に、100次元の特徴ベクトルからその分類の中で際立った特徴を有する10次元の特徴ベクトルを決定する。この次元削減処理はフィルタと呼ばれるソフトウェアコンポーネントによって実行される。分類毎に算出した特徴ベクトル(10次元)及びにフィルタは、DB部317の特徴量DB1107で管理する。
分類処理部1102で行う分類処理は、入力FAXイメージ1103の特徴抽出を行い、特徴ベクトル(100次元)を算出する。入力FAXイメージ1103の特徴ベクトル(100次元)に対して特徴量DB1107の各分類のフィルタを適用(主成分分析)し、各分類に対応した特徴ベクトル(10次元)を算出する。そして入力FAXイメージ1103の特徴ベクトル(10次元)と特徴量DBの特徴ベクトル(10次元)を比較し、類似度判定により分類を決定する。
図11の学習結果1109は、学習処理により特徴量DB1107に蓄えられたデータの一例を表している。特徴量DB1107には、分類1(1104)、分類2(1105)、分類3(1106)を分類可能な特徴ベクトル(10次元)とフィルタが蓄えられている。また分類結果1110は、分類処理により入力画像と特徴量DB1107の情報を元に分類が決定した例を表している。入力FAXイメージ1103を入力し、分類1(1104)、分類2(1105)、分類3(1106)の中から入力画像の分類結果1108が分類1(1104)に判別されたことを示している。なお、画像分類部315が行う画像分類は、本形態に限定されるものではなく、本機能を実現することができる適宜の手法を採用することができる。
[座標処理]
次に、座標処理部318が行う座標正規化処理について図12を用いて説明する。座標正規化処理は、元画像の縦横に依存しない、かつdpiが異なる場合でも対応可能にするために行うものであり、ユーザーが行った送信操作の選択領域の座標情報をDB部317へ登録する際、また登録された操作履歴をDB部317に問い合わせる際に行われる。まず座標系には、ディスプレイ座標(ディスプレイのどの位置)、FAXイメージ座標(FAXイメージのどの位置)、データベース登録座標がある。座標正規化処理とは、ユーザーによりディスプレイで選択された選択座標からFAXイメージ座標に変換し、さらにデータベース登録座標に変換する処理のことである。データベース登録座標はFAXイメージ座標の全体に対する割合に10000を掛け合わしたものとする。
ここでは単純化のためにディスプレイ座標とFAXイメージ座標は一致しており、FAXイメージ1201の横が1500px、縦が2000pxの場合で説明する。選択領域1202の左上座標1203が(X,Y)=(200,700)、右下座標1204が(400、750)の場合、データベース登録座標は(1333、3500)、(2666,3750)となる。以下、データベース登録座標の左上X座標をminX、右下X座標をmaxX、左上Y座標をminY、右下Y座標をmaxYとする。
[データ構造(DB)]
次に、DB部317の操作履歴データベース1300について説明する。図13は、本実施形態における操作履歴データベース1300のデータ構造の一例を示す図である。操作履歴データベース1300は、送信履歴Table1301と送信領域Table1302から構成される。
送信履歴Table1301は、idカラム、internalnameカラム、classificationカラム、ocrresultカラム、sendmessageカラムから構成される。idカラムは送信履歴Table1301にレコードが追加されるたびに1インクリメンタルされる値で、TableのPrimary keyである。internalnameカラムは送信結果の識別情報を格納する。classificationカラムは、FAXイメージの分類結果(例えば図11の1108)を格納する。ocrresultカラムは選択領域のOCR結果を格納する。sendmessageは送信結果(送信したテキスト情報)を格納する。
送信領域Table1302は、idカラム、minXカラム、maxXカラム、minYカラム、maxYカラムから構成される。minXカラムは、選択領域の左上X座標を格納する。maxXカラムは、選択領域右下X座標を格納する。minYカラムは、選択領域の左上Y座標を格納する。maxYカラムは、選択領域右下Y座標を格納する。また送信領域Table1302は、R−treeインデックス(多次元情報のインデックス付け)手法を使うことにより領域検索を高速に行える構成になっている。
SQL文1303〜1310は、操作履歴データベース1300に対する各種問い合わせSQL文を表現した例である。SQL文1303は送信履歴Table1301を新規作成するためのSQL文である。SQL文1304は送信領域Table1302を新規作成するためのSQL文である。SQL文1303、1304は、アプリの初期化時に実行され、作成されたTableはDB部317に保存する。SQL文1305は、同一分類の送信履歴があるかどうかを確認するSQL文である。SQL文1306は、同一分類で、選択座標と一致するもがあるかどうかを確認するSQL文である。SQL文1307は、同一分類で、選択座標が一致した履歴の識別情報がすべて一致するかどうかを確認するSQL文である。SQL文1308は、同一分類で、座標が一致した履歴の送信結果がすべて一致するかどうかを確認するSQL文である。SQL文1309は、同一分類で、OCR結果が一致したものがあるかどうかを確認するSQL文である。SQL文1310は、分類情報をキーに送信履歴を保存するSQL文である。
[OCR画面(モバイル端末)]
次に、モバイル端末104におけるOCR画面について図14を用いて説明する。OCR画面1400は、モバイル端末画面400のOCRボタン402を押すと表示される画面である。OCR画面表示時にFAX表示画面で表示していたFAXのイメージ画像に対して、OCR用のブロック(領域)を作成し、そのブロックに対してOCR処理する。さらにブロックのうちテキストと認識されたものを1409、1411に示すように選択可能領域として、四角で囲って選択可能状態で表示する。選択可能領域1409、1411は、オブジェクト認識、OCRの結果としてテキストと認識されたものが四角で囲って選択できるようになったものである。ボタン表示領域1402は、ボタン設定画面(不図示)で設定したボタンを表示するための領域である。ボタン1404〜1406を押した後に選択可能領域を押すと選択可能領域のOCR結果を中継アプリ321にメッセージ送信することが出来る。図6のメッセージ604は、電話番号ボタンを押して送信したメッセージの例である。商品Codeボタン1405、商品数量ボタン1406を押してメッセージ送信した例が、図6のメッセージ605、メッセージ606である。表示名領域1408は、ボタンに定義した表示名を表示する領域である。選択済み領域は、選択可能領域をユーザーが選択した時に選択されたことが分かるように、1410に示すように選択可能領域に印が付いたものである。ユーザーが選択可能領域を選択すると、その領域は選択済み領域になり、後述する送信確認画面1500に遷移する。
[送信確認画面(モバイル端末)]
次に、モバイル端末104における送信確認画面について図15を用いて説明する。1500は送信確認画面である。送信確認画面1500では、ユーザーが選択した領域のOCR結果を見て、間違いがないと判断すれば中継アプリ321に送信する。さらに間違いがあれば、修正あるいは送信をキャンセルするための画面である。選択済み画像表示領域1501は、ユーザーが選択した選択可能領域の画像を拡大して表示する。テキスト入力エリア1502は、選択された選択可能領域のOCR処理結果のテキスト情報、あるいは操作履歴データベース1300から決定された送信結果情報を初期値として編集可能な入力エリアである。テキストクリアボタン1503は、テキスト入力エリアのテキスト値をクリアするボタンである。OCR結果が間違っていた場合などに使用する。送信実行ボタン1504は、送信を実行するボタンである。ボタンを押すとメッセージが中継アプリ321に送信される。キャンセルボタン1505は、画面をキャンセルするボタンであり、OCR画面に戻る。
[操作履歴データベースの一例]
次に、操作履歴データベース1300が保持する情報の一例について図16を用いて説明する。FAXイメージ1600に対して画像分類部315が、分類を「分類1」と決定し、ユーザーが選択領域1601〜1605を中継アプリ321に送信した場合の送信履歴Table1301と送信領域Table1302の具体例が、送信履歴Table具体例1606と送信領域Table具体例1607である。送信履歴レコード1608は、FAXイメージ1600の選択領域1601を選択し、識別情報を「tel」、OCR結果が「080−1284−1234」であるものを送信確認画面1500で修正し、「080−1234−1234」として送信したことを示す。また送信履歴レコード1609は、FAXイメージ1600の選択領域1602を選択し、識別情報を「code」、OCR結果が「2301119」であるものを送信確認画面1500で修正し、「2801119」として送信したことを示す。また送信履歴レコード1610は、FAXイメージ1600の選択領域1603を選択し、識別情報を「code」、OCR結果が「3891120」であるものを送信確認画面1500で修正することなくそのまま送信したことを示す。また送信履歴レコード1611は、FAXイメージ1600の選択領域1604を選択し、識別情報を「num」、OCR結果が「3」であるものを送信確認画面1500で修正することなくそのまま送信したことを示す。また送信履歴レコード1612は、FAXイメージ1600の選択領域1605を選択し、識別情報を「num」、OCR結果が「3」であるものを送信確認画面1500で修正することなくそのまま送信したことを示す。
[抽出情報送信処理のフローチャート]
イメージから抽出した情報をボタン操作で送る図5の処理S505の詳細なフローについて図17を用いて説明する。本フローは、モバイル端末104のモバイル端末画面400でFAXイメージを表示している時にユーザーがOCRボタン402を押したことをトリガーに開始する。
S1701で、FAX画像解析部310は、FAX受信データに含まれるFAXイメージを解析して、FAXイメージ内における文字認識用の複数のブロックを作成する。
S1702で、OCR部311は、各ブロックに対してOCR処理を行い、テキスト情報を抽出する。
S1703で、情報表示部306は、FAXイメージに対してOCRできたブロックの領域の色を変え、選択可能状態にし、図14に示すOCR画面1400を表示する。
S1704で、ユーザーによりOCR画面1400で送信したい選択可能領域が選択されると、情報表示部306は、選択された選択可能領域を選択状態にする。選択状態になることによって、図14で示したように選択済み領域が選択可能領域とは識別可能に表示される。例えば図14の080−1234−1234と記載された領域が選択されると、選択済み領域1410として表示される。
S1705で、画像分類部315の分類処理部1102は、分類処理を行い、FAXイメージを分類する。以下主に図16のデータベースが既に作成されている状況を前提に説明する。具体的には操作履歴データベース1300として送信履歴Table具体例1606と送信領域Table具体例1607が既に作成されている場合である。
S1706で、FAXイメージが分類できた場合は、S1707へ遷移する。FAXイメージが分類できなかった場合は、S1721に遷移する。
S1707で、操作履歴管理部316は、DB部317の操作履歴データベース1300に対して、分類情報、例として分類1(1104)をキーに検索を実行し、同一分類ですでに送信した履歴情報があるかどうかを確認する。この時操作履歴データベース1300に問い合わせるSQL文は1305である。
S1708で、一致した履歴情報がある場合はS1709に遷移する。一致した履歴情報がなければS1721に遷移する。送信履歴Table具体例1606でいうと分類1(1104)のレコード(1608〜1612)が5つヒットするのでS1709に遷移する。
S1709で、操作履歴管理部316は、座標処理部318で、S1704で選択した選択済み領域1410の座標情報の座標補正処理および図12を用いて説明した座標正規化処理を行う。
ここで座標補正処理とS1710で行う内包問い合わせ、オーバーラップ問い合わせの詳細について、図18を使って説明する。選択済み領域1419の座標情報を使って操作履歴データベース1300に問い合わせる方法として、内包問い合わせ1801とオーバーラップ問い合わせ1802の2種類がある。内包問い合わせ1801とは、問い合わせ領域に対して、内包している領域のみを検索する問い合わせであり、内包問い合わせ領域1807に対して、内包領域1808を探す問い合わせである。内包問い合わせ1801は、問い合わせに対する処理速度が速い反面、ヒットしない例1803のように問い合わせに一致しないということがある。
一方、オーバーラップ問い合わせ1802は、問い合わせ領域に対して、重なり合う領域を検索する問い合わせであり、オーバーラップ問い合わせ領域1809に対して、オーバーラップ領域1810を検索する問い合わせである。オーバーラップ問い合わせ1802は、確実にヒットする代わりに、問い合わせに対する処理速度が遅い、またノイズがヒットする可能性があるということがある。
ヒットしない例1803は、問い合わせ領域1811とヒットしない領域1812が交差しており内包していないため、内包問い合わせにヒットしない例である。このように内包問い合わせ1801は、少しでも座標がずれると問い合わせにヒットしない。
またヒットしない例1804は、問い合わせ領域1813とヒットしない領域1814が内包もオーバーラップもしていないため、どちらの問い合わせに対しても検索にヒットしない例である。例えば、図16で説明したように商品コードとして1602や1603の2つの履歴が保存してある場合に、図14のOCR画面のように3つ目の商品コードが記載されたFAXイメージを新たに読み込んだ場合を意味する。S1704で1410の代わりに選択可能領域1411が選択された場合に、問い合わせに一致しないということを示している。
まずヒットしない例1803に対応するためにS1709で座標補正処理を行い、座標位置を補正する。座標補正処理の具体例を、図18の1800を使って説明する。ユーザーが選択した座標が図に示すように左上座標1203と右下座標1204である場合に、図に示すように補正後左上座標1805と補正後右下座標1806に座標を補正する。
またヒットしない例1804に対応するために後述のS1710で、内包問い合わせ1801で一致するのもがない場合、オーバーラップ問い合わせ1802で再度検索を行う。
以降、再度図17の説明を行う。S1710で、操作履歴管理部316は、分類情報が分類1(1104)で、選択済み領域と操作履歴データベース1300の座標を比較して、一致するものがあるかどうかを確認する。具体的には、まず前述の内包問い合わせ1801を行い、一致するものがない場合、前述のオーバーラップ問い合わせを行う。この時操作履歴データベース1300に問い合わせる内包問い合わせのSQL文は1306であり、オーバーラップ問い合わせのSQL文は、1311である。送信履歴Table具体例1606でいうとレコード1608が1つヒットする。
S1711で、一致した履歴情報があれば、S1712へと遷移する。一致した履歴がなければS1721に遷移する。
S1712で、一致した履歴の識別情報がすべて同一であれば、S1713に遷移する。一致した履歴の識別情報がすべて同一でなければ、S1721に遷移する。この時操作履歴データベース1300に問い合わせるSQL文は1307である。送信履歴Table具体例1606でいうと、識別情報はすべて「tel」であるので、すべて同一であると判断し、S1713に遷移する。
S1713で、送信領域Tableに対応する送信履歴Tableの識別情報に基づいて、S1704で選択された領域に対する識別情報が決定され、情報表示部306は、ボタンを選択状態にする。送信履歴Table具体例1606でいうと識別情報が「tel」に決定され、電話番号ボタン1404が選択状態になる。選択状態のボタンがどのように表示されるかは図15を用いて後述する。
S1714で、操作履歴管理部316は、S1711で一致した履歴の送信結果(sendmessage)を確認する。この時操作履歴データベース1300に問い合わせるSQL文は1308である。
S1715で、送信結果(sendmessage)がすべて同一であれば、S1716へ遷移する。同一でなければS1717へ遷移する。
S1716で、操作履歴管理部316は、送信結果を表示することを決定する。送信履歴Table具体例1606でいうとレコード1608の送信結果「080−1234−1234」に決定する。
S1717で、操作履歴管理部316は、選択済み領域1410のOCR結果と一致するテキストが操作履歴データベースのOCR結果(ocrresult)にあるかを確認する。一致するものがあれば、S1718に遷移する。なければS1721に遷移する。この時操作履歴データベース1300に問い合わせるSQL文は1309である。
S1718で、操作履歴管理部316は、複数の送信結果があるかどうかを確認する。複数の送信結果の場合はS1719へ遷移する。複数の送信結果でない場合は、S1720へ遷移する。
S1719で、操作履歴管理部316は、送信回数の多い送信結果を表示することを決定する。
S1720で、操作履歴管理部316は、送信結果を表示することを決定する。
S1721で操作履歴管理部316は、選択済み領域1410のOCR結果を表示することを決定する。
S1722で、メイン制御部305は、操作履歴管理部316から受け取った情報を元に、送信確認画面1500を表示する。選択済み画像表示領域1501の画像は、選択済み領域1410の画像である。またテキスト入力エリア1502の値は、上記ステップで決定した送信結果またはOCR結果を格納する。選択状態ボタン1506は、電話番号ボタン1404が選択状態になっていることを表している。S1713で識別情報が決定していない場合は、ユーザーが識別情報を判断し、ボタン1404〜1406を選択する必要がある。
S1723で、ユーザーにより送信実行ボタン1504が押されたことをトリガーとして、メッセージ生成部312は、テキスト入力エリア1502の値「080−1234−1234」と、電話番号ボタン1404に設定されている識別情報「tel」をPC端末105の中継アプリ321に送信するメッセージを生成する。この時生成されたメッセージは、図6のメッセージ604である。さらにメッセージ送受信部313が、中継アプリ321に対してメッセージを送信する。これによって、S1713で決定された識別情報と、S1701で作成されたブロックに対する文字認識に基づくテキスト情報が送信される。
S1724で、メイン制御部305は送信履歴を操作履歴データベース1300に保存する。この時操作履歴データベース1300に問い合わせるSQL文は1310である。これによって、モバイルアプリ304の送信結果に基づいて、文書内の領域の座標と、領域に対応する識別情報が保存される。
以上のように、本実施形態によれば、モバイル端末で取り込んだFAXイメージのOCR結果、または履歴情報の送信結果のテキスト情報は、履歴情報を元に自動的に決定した識別情報とともにPC端末の中継アプリに送信される。中継アプリが、識別情報により特定されるスクリプトを実行することによって、ユーザーのシステムへの入力操作を自動化することができる。
(実施例2)
本実施例では、第2の抽出情報送信処理について説明する。前の実施例で説明した構成や処理フローの詳細な説明は省略する。実施例1では、ユーザーにより選択された選択可能領域に対して、選択時に履歴情報とOCR情報を使って識別情報を決定していたが、本実施例では、後述のOCR画面1900表示時に予め履歴情報を元にすべての選択領域の識別情報を自動決定し、ユーザーに可視化して表示する。
[OCR画面(モバイル端末)]
モバイル端末104における第2のOCR画面1900について図19を用いて説明する。OCR画面1900は、すべての選択領域が履歴情報を元に識別情報が決定され、識別可能に可視化して表示している一例を表している。選択領域1901は、識別情報が「tel」と決定された選択領域である。選択領域1902は、識別情報が「code」と決定された選択領域である。選択領域1903は、識別情報が「code」と決定された選択領域である。選択領域1904は、識別情報が「code」と決定された選択領域である。選択領域1905は、識別情報が「num」と決定された選択領域である。選択領域1906は、識別情報が「num」と決定された選択領域である。選択領域1907は、識別情報が「num」と決定された選択領域である。識別情報が決定された選択領域は、識別情報毎に、例えば色を変えて表示することにより、ユーザーにより判別可能にする。
[検索領域絞り込み処理]
次に、操作履歴管理部316で行う検索領域絞り込み処理について、図20を用いて説明する。図19のような第2のOCR画面1900を表示させる場合、FAXイメージに対して抽出した選択可能領域すべてに対して識別情報を決定する必要がある。そこで予め履歴情報の座標情報から検索必要領域2001と検索除外領域2002を識別しておくことにより、入力があったFAXイメージ2003の選択可能領域から検索必要領域2004と検索除外領域2005を決定する。そうすることで検索必要領域2004に対してのみ識別情報を決定することで検索対象を減らすことが出来るため、表示の速度が向上する。検索必要領域2001と検索除外領域2002の識別は、メッセージ送信後に操作履歴データベースに履歴を登録するときに行う。既存の検索領域と操作履歴情報の座標情報を比較し、既存の検索領域と座標情報のAND条件の領域を検索領域とする。
[抽出情報送信処理のフローチャート]
イメージから抽出した情報をボタン操作で送る第2の処理(図5のS505)のフローについて図21を用いて説明する。本フローは、モバイル端末104のモバイル端末画面400でFAXを表示している時にユーザーがOCRボタン402を押したことをトリガーに開始する。
なお、既に説明したステップと同じ処理については、既に説明したステップの番号と同一の番号を付与し、特に断りが無い限り説明は省略する。
S2101で、操作履歴管理部316は、図20を用いて説明した検索領域絞り込み処理を行う。
S2102で、操作履歴管理部316は、FAXイメージから作成されたブロックにそれぞれに対して検索必要領域2004に含まれているかどうかを判断する。判断の結果、対象のブロックが検索必要領域2004に含まれている場合は、S1709へ遷移する。ブロックが検索除外領域2005の場合は、次のブロックへ遷移し、再度本S2102で次のブロックに対する判断処理を行う。
S2103で、操作履歴管理部316は、各ブロックの識別情報を決定する。さらに情報表示部306は、FAXイメージに対してブロックの領域の色を変える。さらに情報表示部306は、識別情報毎に色を変える。またこれら領域を選択可能状態にする。
S2104で、情報表示部306は、OCR画面1900を表示する。
S2105で、操作履歴管理部316は、送信履歴座標が既存の検索領域の枠内に含まれるかを確認し、枠外の場合は検索領域情報を更新する。
以上のように、本実施形態によれば、モバイル端末で取り込んだFAXイメージに対してOCR画面で、履歴情報を元に選択領域の識別情報を自動決定し、可視化して表示することができる。
(実施例3)
本実施例では、第3の抽出情報送信処理について説明する。前の実施例で説明した構成や処理フローの詳細な説明は省略する。実施例2では、OCR画面1900表示時に予め履歴情報を元にすべての選択領域の識別情報を自動決定し、ユーザーに可視化して表示していた。本実施例では、後述のOCR画面2200表示時に自動決定した識別情報と共に、決定したOCR結果、または送信結果のテキスト情報を表示する。
[OCR画面(モバイル端末)]
モバイル端末104における第3のOCR画面2200について図22を用いて説明する。動的生成表示エリア2201は、識別情報が判別された選択領域のテキスト情報を元に動的に生成される。本実施例の例では5つの表示エリアが生成されている。電話番号表示エリア2202は、選択領域1901に対応した表示エリアである。商品コード表示エリア2203は、選択領域1902に対応した表示エリアである。数量表示エリア2204は、選択領域1905に対応した表示エリアである。商品コード表示エリア2205は、選択領域1903に対応した表示エリアである。数量表示エリア2206は、選択領域1906に対応した表示エリアである。商品コード表示エリア2207は、選択領域1904に対応した表示エリアである。数量表示エリア2208は、選択領域1906に対応した表示エリアである。電話番号修正ボタン2209、商品コード修正ボタン2210、数量修正ボタン2211、商品コード修正ボタン2212、数量修正ボタン2213、商品コード修正ボタン2214、数量修正ボタン2215は提示されたテキスト情報を修正したい場合に押す。各ボタンを押すと送信確認画面1500に遷移する。遷移した送信画面の送信実行ボタン1504は、非表示状態になり、その代り、戻るボタン(不図示)が表示状態になる。ユーザーは本画面でテキスト情報を修正し、戻るボタンを押すことにより、OCR画面2200に戻ることが出来る。さらに動的生成表示エリア2201は、ユーザー操作により表示エリアの追加削除を行うことが出来る。
[抽出情報送信処理のフローチャート]
イメージから抽出した情報をボタン操作で送る第3の処理S505のフローについて図24を用いて説明する。本フローは、モバイル端末104のモバイル端末画面400でFAXを表示している時にユーザーがOCRボタン402を押したことをトリガーに開始する。
なお、既に説明したステップと同じ処理については、既に説明したステップの番号と同一の番号を付与し、特に断りが無い限り説明は省略する。
S2401で、情報表示部306は、表示エリア領域を作成する。
S2402で、情報表示部306は、表示エリア領域に送信結果、またはOCR結果のテキスト情報を設定する。
S2403で、S2103で識別情報が決定したものが2つ以上ある場合はS2404に遷移し、それ以外の場合は、S2104に遷移する。
S2404で、情報表示部306は、図22のOCR画面2200を表示する。
S2405で、ユーザーにより修正ボタン2209〜2215が押されると、情報表示部306は、図15の送信確認画面1500を表示する。
以上のように、本実施形態によれば、モバイル端末で取り込んだFAXイメージに対してOCR画面で、履歴情報を元に選択領域の識別情報を自動決定し、識別情報に基づく種別とテキスト情報を一覧で表示することができる。
(実施例4)
本実施例では、第2のシステム構成について説明する。前の実施例で説明した構成や処理フローの詳細な説明は省略する。本実施例では、分類処理を画像形成装置で行い、その結果をモバイル端末が利用する。さらに履歴情報はサーバーに蓄積され、複数のモバイル端末から利用可能な構成について説明する。
[システム構成]
本実施形態に係る情報処理システムの一例として、FAX受注システム3000を例に図25を用いて説明する。
モバイル端末107は、モバイル端末104と同様の構成を持ち、ネットワーク100を介して互いに通信可能に接続されている。
操作履歴管理サーバー106は、モバイル端末104、105で行われた操作履歴情報を管理するサーバーである。
[ソフトウェア構成(画像形成装置)]
次に、画像形成装置101におけるソフトウェアの構成について説明する。
画像分類部2501は、画像分類部315と同様に、図11を用いて説明したように、FAXイメージに対して予め学習処理を行った特徴量DB1107を用いて分類処理を行い、FAXイメージの分類を行う。
[ソフトウェア構成(モバイル端末)]
データ送受信部308は、操作履歴管理部316で発行した問い合わせを操作履歴管理サーバー106に要求し、情報取得、情報更新を行う。
[ソフトウェア構成(操作履歴管理サーバー106)]
操作履歴管理サーバー106の履歴管理アプリ2500は、操作履歴管理部2502、DB部2503を持つ。操作履歴管理部2502はモバイル端末104、105のデータ送受信部308とデータの送受信を行う。DB部2503は操作履歴管理部2502からの問い合わせに応じて操作履歴Tableから情報取得、情報更新を行う。
[基本フロー]
次に、FAX受注システム3000の基本的な処理フローについて図26を用いて説明する。
本フローは、画像形成装置101におけるFAXユニットが他のFAX装置からFAXイメージを受信したことをトリガーに開始する。
ステップS2601で、画像分類部2501は、FAXイメージを分類する。その分類情報はFAX受信書誌情報として保存する。
ステップS2602で、メイン制御部305は、FAX受信書誌情報に含まれる分類情報を認識する。さらに操作履歴管理部316は、データ送受信部308を通して操作履歴管理サーバー106に対して各種問い合わせを行い、操作履歴情報を取得する。
ステップS2603で、に操作履歴管理部316は、データ送受信部308を通して操作履歴管理サーバー106に対して操作履歴情報を送信する。操作履歴管理サーバー106は受信した操作履歴情報をDB部に格納する。
以上のように、本実施形態によれば、操作履歴を外部のサーバーに保存し、複数のモバイル端末で共有することができる。なお、操作履歴はPC端末105や画像形成装置101が保存するように構成しても構わない。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以上、本発明の好ましい実施形態について説明したが、本発明は、これらの実施形態に限定されず、その要旨の範囲内で種々の変形および変更が可能である。
104 モバイル端末

Claims (11)

  1. 文書内の領域の座標と、前記領域に対応する識別情報を保存する保存手段と、
    新たに受信した文書から、受信した文書内における文字認識用の複数の領域を作成する作成手段と、
    前記作成手段によって作成された領域の座標と、前記保存手段によって保存された領域の座標を比較する比較手段と、
    前記比較手段による比較の結果と、前記保存手段によって保存された領域に対応する識別情報に基づいて、前記作成手段によって作成された領域の座標に対応する識別情報を決定する決定手段と、
    前記決定手段によって決定された前記識別情報と、前記作成手段によって作成された領域に対する文字認識に基づくテキスト情報を送信する送信手段と、
    前記送信手段によって送信された前記識別情報に基づいて、テキスト情報をアプリケーションに入力するためのスクリプトを特定し、特定されたスクリプトを実行する実行手段と、を有し、
    前記保存手段は、前記送信手段による送信の結果に基づいて、前記作成手段によって作成された領域の座標と、前記領域に対応する識別情報を保存することを特徴とするシステム。
  2. 前記新たに受信した文書を特徴に基づいて分類する分類手段と、を有し、
    前記保存手段は、前記分類手段による分類と、前記文書内の領域の座標と、前記識別情報を対応付けて保存し、
    前記決定手段は、前記比較手段の結果と、前記保存手段によって保存された前記分類と前記領域に対応する識別情報に基づいて、前記作成手段によって作成された領域の座標に対応する識別情報を決定することを特徴とする請求項1に記載のシステム。
  3. 前記実行手段によって前記スクリプトが実行されることにより、ウィンドウメッセージのやりとりが行われ、システム接続アプリケーションへの情報の入力が行われることを特徴とする請求項1又は請求項2に記載のシステム。
  4. 前記保存手段は、前記テキスト情報と、前記文書内の領域の座標と、前記識別情報を対応付けて保存し、
    前記情報処理装置はさらに、
    前記保存手段によって保存された前記テキスト情報又は前記作成手段によって作成された領域に対する文字認識の結果を表示し、前記文字認識の結果を修正して前記テキスト情報として送信するための確認画面を表示する表示手段と、を有し、
    前記送信手段は、前記確認画面で前記文字認識の結果が修正された場合、前記決定手段によって決定された前記識別情報と、前記確認画面で修正された前記テキスト情報を送信することを特徴とする請求項1乃至3のいずれか1項に記載のシステム。
  5. 前記保存手段は、前記文字認識の結果と、前記テキスト情報と、前記文書内の領域の座標と、前記識別情報を対応付けて保存し、
    前記表示手段は、前記作成手段によって作成された領域に対する文字認識の結果と、前記保存手段によって保存された前記文字認識の結果が同一である場合に、前記保存手段によって保存された前記テキスト情報を表示することを特徴とする請求項4に記載のシステム。
  6. コンピュータに、
    文書内の領域の座標と、前記領域に対応する識別情報を保存する保存工程と、
    新たに受信した文書から、受信した文書内における文字認識用の複数の領域を作成する作成工程と、
    前記作成工程によって作成された領域の座標と、前記保存工程によって保存された領域の座標を比較する比較工程と、
    前記比較工程による比較の結果と、前記保存工程によって保存された領域に対応する識別情報に基づいて、前記作成工程によって作成された領域の座標に対応する識別情報を決定する決定工程と、
    前記決定工程によって決定された前記識別情報と、前記作成工程によって作成された領域に対する文字認識に基づくテキスト情報を送信する送信工程と、
    前記送信工程によって送信された前記識別情報に基づいて、テキスト情報をアプリケーションに入力するためのスクリプトを特定し、特定されたスクリプトを実行する実行工程と、を実行させ、
    前記保存工程は、前記送信工程による送信の結果に基づいて、前記作成工程によって作成された領域の座標と、前記領域に対応する識別情報を保存することを特徴とするプログラム。
  7. 前記コンピュータに、
    前記新たに受信した文書を特徴に基づいて分類する分類工程と、を実行させ、
    前記保存工程は、前記分類工程による分類と、前記文書内の領域の座標と、前記識別情報を対応付けて保存し、
    前記決定工程は、前記比較工程の結果と、前記保存工程によって保存された前記分類と前記領域に対応する識別情報に基づいて、前記作成工程によって作成された領域の座標に対応する識別情報を決定することを特徴とする請求項6に記載のプログラム。
  8. 前記実行工程によって前記スクリプトが実行されることにより、ウィンドウメッセージのやりとりが行われ、システム接続アプリケーションへの情報の入力が行われることを特徴とする請求項6又は請求項7に記載のプログラム。
  9. 前記保存工程は、前記テキスト情報と、前記文書内の領域の座標と、前記識別情報を対応付けて保存し、
    前記コンピュータにさらに、
    前記保存工程によって保存された前記テキスト情報又は前記作成工程によって作成された領域に対する文字認識の結果を表示し、前記文字認識の結果を修正して前記テキスト情報として送信するための確認画面を表示する表示工程と、を実行させ、
    前記送信工程は、前記確認画面で前記文字認識の結果が修正された場合、前記決定工程によって決定された前記識別情報と、前記確認画面で修正された前記テキスト情報を送信することを特徴とする請求項6乃至8のいずれか1項に記載のプログラム。
  10. 前記保存工程は、前記文字認識の結果と、前記テキスト情報と、前記文書内の領域の座標と、前記識別情報を対応付けて保存し、
    前記表示工程は、前記作成工程によって作成された領域に対する文字認識の結果と、前記保存工程によって保存された前記文字認識の結果が同一である場合に、前記保存工程によって保存された前記テキスト情報を表示することを特徴とする請求項9に記載のプログラム。
  11. 文書内の領域の座標と、前記領域に対応する識別情報を保存する保存工程と、
    新たに受信した文書から、受信した文書内における文字認識用の複数の領域を作成する作成工程と、
    前記作成工程によって作成された領域の座標と、前記保存工程によって保存された領域の座標を比較する比較工程と、
    前記比較工程による比較の結果と、前記保存工程によって保存された領域に対応する識別情報に基づいて、前記作成工程によって作成された領域の座標に対応する識別情報を決定する決定工程と、
    前記決定工程によって決定された前記識別情報と、前記作成工程によって作成された領域に対する文字認識に基づくテキスト情報を送信する送信工程と、
    前記送信工程によって送信された前記識別情報に基づいて、テキスト情報をアプリケーションに入力するためのスクリプトを特定し、特定されたスクリプトを実行する実行工程と、を有し、
    前記保存工程は、前記送信工程による送信の結果に基づいて、前記作成工程によって作成された領域の座標と、前記領域に対応する識別情報を保存することを特徴とする制御方法。
JP2015046430A 2015-03-09 2015-03-09 システム、プログラム及び制御方法 Pending JP2016167156A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2015046430A JP2016167156A (ja) 2015-03-09 2015-03-09 システム、プログラム及び制御方法
US15/061,855 US10097724B2 (en) 2015-03-09 2016-03-04 System, control method, and recording medium
KR1020160027454A KR101937525B1 (ko) 2015-03-09 2016-03-08 시스템 및 제어 방법
CN201910784129.9A CN110321880B (zh) 2015-03-09 2016-03-08 系统和控制方法
CN201610129764.XA CN105955683B (zh) 2015-03-09 2016-03-08 系统和控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015046430A JP2016167156A (ja) 2015-03-09 2015-03-09 システム、プログラム及び制御方法

Publications (1)

Publication Number Publication Date
JP2016167156A true JP2016167156A (ja) 2016-09-15

Family

ID=56888371

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015046430A Pending JP2016167156A (ja) 2015-03-09 2015-03-09 システム、プログラム及び制御方法

Country Status (4)

Country Link
US (1) US10097724B2 (ja)
JP (1) JP2016167156A (ja)
KR (1) KR101937525B1 (ja)
CN (2) CN110321880B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020201797A (ja) * 2019-06-12 2020-12-17 株式会社リコー 情報処理装置、情報処理方法、プログラム及び情報処理システム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170022490A (ko) * 2015-08-20 2017-03-02 엘지전자 주식회사 이동 단말기 및 그 제어방법
US10511730B1 (en) * 2018-06-07 2019-12-17 Kyocera Document Solutions Inc. Method to create a secure distributed data validation system using a distributed storage system and artificial intelligence
EP3933678A1 (en) * 2020-06-30 2022-01-05 Ricoh Company, Ltd. Information processing system, data output system, image processing method, and carrier means

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001013315A1 (fr) * 1999-08-16 2001-02-22 Fujitsu Limited Appareil de transaction automatique
JP4847220B2 (ja) * 2006-06-07 2011-12-28 キヤノン株式会社 データ処理装置及びその制御方法、プログラム、記憶媒体
JP2009020642A (ja) 2007-07-11 2009-01-29 Data Fair Kk ファクシミリ注文票ペーパーレス入力システム
JP5098614B2 (ja) * 2007-12-11 2012-12-12 コニカミノルタビジネステクノロジーズ株式会社 文章処理装置の制御方法および文章処理装置
JP5113545B2 (ja) 2008-02-06 2013-01-09 キヤノン株式会社 文書処理システム、文書処理システムの制御方法、プログラム及び記憶媒体
JP5187057B2 (ja) * 2008-08-07 2013-04-24 株式会社リコー レイアウト印刷システム、レイアウト文書閲覧方法、及びプログラム
JP5412916B2 (ja) * 2009-03-27 2014-02-12 コニカミノルタ株式会社 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP5361574B2 (ja) * 2009-07-01 2013-12-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP2013196479A (ja) * 2012-03-21 2013-09-30 Toshiba Corp 情報処理システム、情報処理プログラム、情報処理方法
JP5974657B2 (ja) 2012-06-15 2016-08-23 株式会社リコー 情報処理装置、情報処理方法および情報処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020201797A (ja) * 2019-06-12 2020-12-17 株式会社リコー 情報処理装置、情報処理方法、プログラム及び情報処理システム
JP7346926B2 (ja) 2019-06-12 2023-09-20 株式会社リコー 情報処理装置、情報処理方法、プログラム及び情報処理システム

Also Published As

Publication number Publication date
CN105955683B (zh) 2019-09-06
KR101937525B1 (ko) 2019-01-10
KR20160110151A (ko) 2016-09-21
CN110321880B (zh) 2024-02-09
US20160269586A1 (en) 2016-09-15
CN110321880A (zh) 2019-10-11
CN105955683A (zh) 2016-09-21
US10097724B2 (en) 2018-10-09

Similar Documents

Publication Publication Date Title
US9268987B2 (en) Method of recognizing QR code in image data and apparatus and method for converting QR code in content data into touchable object
JP6064392B2 (ja) 検索装置、検索方法、検索プログラムおよび検索システム
EP3188034A1 (en) Display terminal-based data processing method
US8589781B2 (en) Information processing device, information processing method, program, and information processing system
US20170168695A1 (en) Graphical User Interface for Generating Structured Search Queries
CN107368550B (zh) 信息获取方法、装置、介质、电子设备、服务器及系统
US20110225520A1 (en) Website browsing system and server
JP2016167156A (ja) システム、プログラム及び制御方法
CN102799603A (zh) 提供链接列表的方法和应用所述方法的显示设备
CN103678704A (zh) 一种基于图片信息的识图方法、系统、设备及装置
US20150143488A1 (en) Information sharing system and information sharing method
EP3491513A1 (en) Systems and methods for presentation of a terminal application screen
CN103678706A (zh) 一种基于截图信息的识图方法、系统、设备及装置
JP2022091686A (ja) データ注釈方法、装置、電子機器および記憶媒体
US20210279460A1 (en) Information processing system, information processing method, and non-transitory recording medium
JP2017084198A (ja) システム、プログラム及び制御方法
KR101483611B1 (ko) 이미지에서 객체를 추출하기 위한 방법 및 단말기
US11314793B2 (en) Query processing
US11320964B2 (en) Information processing apparatus and non-transitory computer readable medium
KR20150097250A (ko) 태그 정보를 이용한 스케치 검색 시스템, 사용자 장치, 서비스 제공 장치, 그 서비스 방법 및 컴퓨터 프로그램이 기록된 기록매체
JP5811435B2 (ja) 表示装置及び表示制御プログラム
US20150082215A1 (en) Operation process creating method and information processing apparatus
JP2021149336A (ja) 情報処理装置、情報処理方法、プログラム、情報処理システム
KR101592725B1 (ko) 스마트 기기를 기반으로 하는 이미지 링크 어플리케이션 장치
CN110888676A (zh) 一种快捷键处理的方法和装置