CN105955683B - 系统和控制方法 - Google Patents

系统和控制方法 Download PDF

Info

Publication number
CN105955683B
CN105955683B CN201610129764.XA CN201610129764A CN105955683B CN 105955683 B CN105955683 B CN 105955683B CN 201610129764 A CN201610129764 A CN 201610129764A CN 105955683 B CN105955683 B CN 105955683B
Authority
CN
China
Prior art keywords
region
information
unit
identification information
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610129764.XA
Other languages
English (en)
Other versions
CN105955683A (zh
Inventor
七海嘉仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to CN201910784129.9A priority Critical patent/CN110321880B/zh
Publication of CN105955683A publication Critical patent/CN105955683A/zh
Application granted granted Critical
Publication of CN105955683B publication Critical patent/CN105955683B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/235Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on user input or interaction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1456Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on user interactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00355Mark-sheet input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00352Input means
    • H04N1/00355Mark-sheet input
    • H04N1/00376Means for identifying a mark sheet or area
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32037Automation of particular transmitter jobs, e.g. multi-address calling, auto-dialing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32358Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device using picture signal storage, e.g. at transmitter
    • H04N1/324Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device using picture signal storage, e.g. at transmitter intermediate the transmitter and receiver terminals, e.g. at an exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/43Editing text-bitmaps, e.g. alignment, spacing; Semantic analysis of bitmaps of text without OCR

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Automation & Control Theory (AREA)
  • Artificial Intelligence (AREA)
  • Facsimiles In General (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Character Discrimination (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种系统和控制方法。本发明的系统在接收的区域生成要进行字符识别的多个区域,比较生成的区域的坐标和历史中的区域的坐标,根据比较的结果和历史确定与生成的区域的坐标对应的识别信息,并执行根据确定的识别信息指定的、用于向应用输入基于对生成的区域执行的字符识别的文本信息的脚本。

Description

系统和控制方法
技术领域
本发明涉及一种系统和控制方法。
背景技术
通常,通过在PC终端中作为图像获取接收的FAX数据来替代输出到片材、并显示该图像来实现无纸化的系统已经被广泛应用。日本特开第2009-20642号公报公开一种关于FAX订单无纸化输入系统的技术,在该系统中,在PC终端中显示作为FAX数据接收的订单、并向系统输入FAX数据中包含的信息。
发明内容
在本说明书中,作为向系统输入FAX数据中包含的信息的方法,探讨了通过基于识别信息来执行脚本而向应用输入通过光学字符识别(OCR)所识别的文本信息的配置。然而,如果用户每次都手动指定识别信息,则需要复杂的操作。因此,由于操作需要花费长时间,因此需要花费长时间来向系统输入信息。
然而,本发明通过根据传送结果的历史对区域坐标进行比较以指定识别信息来实现向系统的高速输入。
根据本发明的系统包括:显示单元,其显示第一显示区和第二显示区,所述第一显示区中显示文档,所述第二显示区用于指定对在第一显示区域的文档中选择的区域执行处理;存储单元,其在第一显示区中的区域的选择和第二显示区中的处理的选择之上,存储关于所述文档的特征值的信息,存储用于指定所述处理的识别信息,以及存储所述区域的坐标;生成单元,其在最新接收的文档中生成要进行字符识别的多个区域;比较单元,其比较所述生成单元生成的区域的坐标与所述存储单元中存储的区域的坐标;确定单元,其根据与所述存储单元中存储的区域对应的识别信息以及所述比较单元的比较结果,确定与所述生成单元生成的区域的坐标对应的识别信息;以及执行单元,其根据所述确定单元确定的识别信息指定用于向应用输入通过对所述生成单元生成的区域执行的所述字符识别而获得的文本信息的脚本,并执行所指定的脚本。
根据以下参照附图对示例性实施例的详细描述,本发明的其他特征将变得清楚。
附图说明
图1是例示系统的整个配置的图。
图2是例示设备的硬件配置的图。
图3A到图3C是例示设备的软件配置的图。
图4是例示移动应用的UI的图。
图5是例示系统的基本处理流程的图。
图6A到图6G是例示消息的数据配置的图。
图7A和图7B是例示中继应用中存储的信息的图。
图8是例示图5的步骤S507中执行的处理的流程图。
图9是例示核心系统连接应用的操作画面的图。
图10是例示执行脚本的处理的流程图。
图11A和图11B是例示图像分类处理的图。
图12A和图12B是例示坐标处理的图。
图13A到图13J是例示传送历史数据库的数据配置和SQL语句的图。
图14是例示移动应用的UI的图。
图15是例示移动应用的UI的图。
图16A到图16C是例示传送历史数据库中存储的信息的图。
图17A和图17B是例示移动应用执行的处理的流程图。
图18A到图18E是例示坐标校正处理的图。
图19是例示移动应用的UI的图。
图20是例示搜索区域缩小处理的图。
图21A和图21B是例示移动应用执行的处理的流程图。
图22是例示移动应用的UI的图。
图23是例示移动应用执行的处理的流程图。
图24A和图24B是例示移动应用执行的处理的流程图。
图25A到图25E是例示系统的整个配置和设备的软件配置的图。
具体实施方式
以下将参照附图描述本发明的实施例。这些实施例并不限制本发明,并且并非实施例中描述的所有配置都必须作为用于解决根据本发明的问题的手段。
第一实施例
系统配置
将描述FAX订单系统作为根据第一实施例的信息处理系统的示例。
图1是例示FAX订单系统2000的整体配置的图。FAX订单系统2000包括图像形成装置101、FAX存储服务器102、核心企业服务器(core corporate server)103、作为终端示例的移动终端104以及PC终端105。
将用户环境中安装的图像形成装置101连接到网络100和用于接收FAX数据的公用线路111。通过网络100使用户环境中安装的FAX存储服务器102、核心企业服务器103、移动终端104和PC终端105相互连接以便相互通信。
请注意,在图1中,尽管FAX存储服务器102、核心企业服务器103、移动终端104和PC终端105属于相同网络,但本发明并不限于此。不同的设备可以属于不同的网络或者可以与互联网直接连接。可以使用单独一台或多台服务器作为各服务器。
FAX存储服务器102的示例包括在含有图像形成装置101的网络中所包括的本地(on-premises)服务器信息块(SMB)服务器。可选地,FAX存储服务器102可以是与互联网连接的通用存储服务器。通用存储服务器的示例包括Microsoft(注册商标)公司的OneDrive(注册商标)和Google(注册商标)公司的Google drive(谷歌云端硬盘)。
核心企业服务器103在通过在PC终端105中运行的针对特定操作的核心系统连接应用而接收信息的输入后,执行处理。在本发明中,并未预先定义通过核心企业服务器103接收的信息和基于信息执行的处理。此外,不需要假定从FAX数据提取关于输入源的信息。核心企业服务器103仅满足如下条件:核心企业服务器103在通过PC终端105中运行的核心系统连接应用而接收信息的输入后执行处理。在图1例示的系统配置中,PC终端105中包括的中继应用向核心企业服务器103输入在通过移动终端104获得的FAX图像中所包含的信息。
硬件配置
图2是例示FAX订单系统2000中包括的设备(图像形成装置101、FAX存储服务器102、核心企业服务器103、移动终端104和PC终端105)的硬件配置的图。FAX订单系统2000中包括的设备中的代表设备201包括各种单元(202到207)。
FAX订单系统2000中包括的设备的硬件配置可以彼此相同或互不相同。
中央处理单元(CPU)202执行各种程序以实现各种功能。只读存储器(ROM)204存储各种程序等。随机存储存储器(RAM)203存储各种类型的信息。RAM 203还用作CPU 202的临时工作存储区。例如,CPU 202将ROM 204中存储的程序加载到RAM 203并执行程序。
此外,CPU 202根据诸如闪速存储器、硬盘驱动器(HDD)或固态硬盘(SSD)等的外部存储设备中存储的程序执行处理。由此实现图3中例示的FAX订单系统2000中包括的设备的软件配置和在如下顺序的各步骤中的处理。
通过专用硬件可以实现设备的全部或部分功能和下述顺序中的全部或部分处理。
输入/输出接口205向与设备连接的显示器(未示出)发送数据并从同样与各种设备连接的定点设备(pointing device)(未示出)接收数据。
网络接口卡(NIC)206用于将设备与网络100连接。上述单元可以通过总线207发送和接收数据。
此外,图像形成装置101包括FAX单元(未示出),并能够通过总线207向各单元发送数据并从各单元接收数据。FAX单元可以将从各设备接收的FAX控制语言展开为图像,并通过公用线路(未示出)或互联网(IP-FAX)向其他FAX装置(未示出)传送该图像。
图像形成装置101还可以包括打印单元(未示出)。打印单元能够通过总线207向各单元发送数据并从各单元接收数据。请注意,打印单元能够在诸如片材等的记录介质上记录(打印)光栅图像。
图像形成装置101还包括扫描器单元(未示出)。扫描器单元能够通过总线207向各单元发送数据并从各单元接收数据。扫描器单元能够输入图像。
此外,在移动终端104中,触摸面板(未示出)与输入/输出接口205连接。触摸面板是诸如显示器的显示单元的示例,并具有输出(显示)功能和输入功能这两种功能。
软件配置(通用)
接下来,将描述FAX订单系统2000中包括的各设备的软件配置。图3A到图3C是例示各设备的软件配置的图。
在各设备中的ROM 204等中存储实现图3A到图3C中例示的软件(应用)的功能(模块部)的程序。
软件配置(移动终端)
接下来,将描述移动终端104的软件配置。移动终端104是便携式终端的示例,并可以用于使用无线通信功能等的各种场所。
移动终端104的操作系统(OS)(未示出)包括下述各种模块(图像管理单元301、地址管理单元302及通知处理单元303)。
图像管理单元301管理图像和应用数据。OS提供用于使用图像管理单元301的控制应用程序接口(API,application programming interface)。各应用使用控制API获得并存储由图像管理单元301管理的图像和应用数据。
地址管理单元302管理包括姓名、电话号码和地址的地址信息。与图像管理单元301一样,地址管理单元302提供要通过各应用使用的控制API。
通知处理单元303从通知服务器(未示出)接收通知信息,使用该通知信息中包括的应用的标记来指定作为通知的接收目的地的应用,并向该应用发送该通知信息。
通过使用移动终端104的OS的安装功能(诸如Apple Store或Google Play等)进行下载及安装来执行移动应用304。移动应用304对FAX存储服务器102管理的数据执行各种数据处理。
主控制器305控制移动终端104的移动应用304以向下述模块单元(306至317)发出指令并管理模块单元。
信息显示单元306根据主控制器305发出的指令为用户提供移动应用304的用户界面(UI)。
图4是例示了提供移动应用304的UI(便携式终端的UI)的画面(移动终端画面400)的图。在移动终端104的触摸面板中显示移动终端画面400。此外,在移动终端画面400中,在操作区域401中显示FAX数据,并且通过显示的UI接受用户对文档等执行的操作(用户操作)。使用OCR按钮402将画面变更为下述OCR画面1400。
移动应用304的UI的形式(位置、大小、范围、配置、显示内容等)并不限于图4中例示的那些,只要实现移动终端104的功能则可以采用任何配置。
返回参考图3A到图3C继续描述移动应用304的模块。
操作信息获得单元307获得与在信息显示单元306显示的移动应用304的UI上执行的用户操作对应的信息,并向主控制器305发送获得的信息。例如,如果用户触摸显示器和操作区域401,则操作信息获得单元307检测画面上触摸的位置的信息并向主控制器305发送检测的位置的信息。
数据发送/接收单元308向FAX存储服务器102发送数据并从FAX存储服务器102接收数据,并进一步接收从主控制器305发送的数据,并向主控制器305发送接收的数据。数据发送/接收单元308通过FAX数据操作和FAX数据编辑请求FAX存储服务器102以更新文件。
存储单元309(永久地)存储用户通过操作信息获得单元307或移动应用304的UI输入的设置值。此外,存储单元309存储从FAX存储服务器102提供并通过数据发送/接收单元308接收的数据。
FAX图像分析单元310分析FAX图像并生成布局信息。布局信息包括从FAX图像提取的矩形区域和区域的类型(字符、图形、线、表等)。
OCR单元311对被确定出在FAX图像分析单元310提取的矩形区域中包括字符的矩形区域执行OCR处理。
信息生成单元312生成要向PC终端105的中继应用321发送的消息。该消息包括例如作为OCR单元311执行的处理的结果或用户输入的结果的文本信息。
消息发送/接收单元313向PC终端105的中继应用321发送消息生成单元312生成的消息,并接收已发送消息的应答消息(应答信息)。消息分析单元314分析从PC终端105的中继应用321提供并通过消息发送/接收单元313接收的应答消息,并对FAX图像执行处理。
图像分类单元315使用预先对从FAX存储服务器102提供的FAX图像进行了学习处理的特征值执行分类处理,以对FAX图像进行分类。
操作历史管理单元316使用DB单元317中包括的数据库管理用户选择的矩形区域的坐标信息、OCR结果的文本信息、向中继应用321发送的消息等。
DB单元317具有数据库功能并管理操作历史信息。
坐标处理单元318在数据库中注册坐标信息时执行坐标标准化处理,并在向数据库询问坐标时执行坐标校正处理。
软件配置(PC终端)
接下来,将描述PC终端105的软件配置。
PC终端105能够执行PC终端105中安装的OS上的多个应用。在图3A到图3C中,在多个应用中例示了中继应用321和核心系统连接应用331。
核心系统连接应用331用于接收用户的输入并向核心企业服务器103发送该输入。下文将参照图9详细描述核心系统连接应用331。
现在将描述中继应用321的模块配置。
主控制器322控制作为移动应用304和核心系统连接应用331之间的中继的中继应用321以向下述模块单元(323到326)发送指令,并管理各模块单元。
存储单元323存储用户生成的脚本。脚本是要根据包括从移动终端104的移动应用304接收的文本信息的消息而通过中继应用321执行的简单程序。尽管未作详细描述,但在中继应用321执行脚本时向核心企业服务器103输入信息。
消息接收单元324从移动终端104的移动应用304接收消息。
消息分析单元325分析消息接收单元324接收的消息。
脚本执行单元326执行脚本,该脚本与作为由消息分析单元325执行的消息分析的结果而获得的消息的内容中所包括的识别信息相关联,并存储于存储单元323中。
软件配置(图像形成装置)
接下来,将描述图像形成装置101的软件配置。
图像形成装置101在Java(注册商标)平台上执行多个应用。在图3A到图3C中,例示了作为多个应用中的一者的FAX接收应用341。现在将描述FAX接收应用341的模块配置。
主控制器342控制FAX接收应用341的各模块,向各模块发出指令并管理各模块。
信息显示单元343根据主控制器342发出的指令为用户提供FAX接收应用341的UI。用户可以使用UI指定FAX图像的存储目的地(FAX存储服务器102)。
操作信息获得单元344获得表示在信息显示单元343显示的移动应用341的UI上执行的用户操作的信息,并向主控制器342发送获得的信息。
数据发送/接收单元345向FAX存储服务器102发送数据,并从FAX存储服务器102接收数据。
存储单元346临时存储用户通过信息显示单元343和操作信息获得单元344输入的设置值(例如,各电话号码的分配目的地的信息)以及要发送和接收的FAX图像。
基本流程
接下来,将参照图5描述FAX订单系统2000的基本处理流程。
在图像形成装置101中包括的FAX单元从其他FAX装置接收FAX图像时开始此流程。
在步骤S501中,图像形成装置101接收FAX图像。其后,图像形成装置101在图像形成装置101的RAM 203等中存储接收的FAX图像和FAX信息(包括发送人的电话号码和FAX接收时间的数据头)。在接收到FAX图像时,FAX接收应用341的主控制器342使用FAX信息的发送人的电话号码作为关键字(key)来检查电话薄,并基于与电话号码对应的地址的信息生成FAX接收目录信息。存储单元346存储FAX接收数据(FAX图像和FAX接收目录信息)。
在步骤S502中,主控制器342通过数据发送/接收单元345向FAX存储服务器102发送FAX接收数据。
在步骤S503中,移动终端104的移动应用304的主控制器305从FAX存储服务器102下载FAX接收数据。
在步骤S504中,信息显示单元306根据FAX接收数据显示UI。
在步骤S505中,FAX图像分析单元310分析FAX接收数据中包括的FAX图像,以获得布局信息。OCR单元311对识别为字符区域的区域执行OCR处理,以生成文本信息。在用户操作时,例如进行指示发送通过UI上的按钮操作生成的文本信息的操作时,消息生成单元312使用文本信息生成要向PC终端105的中继应用321发送的消息。消息发送/接收单元313向PC终端105的中继应用321发送由消息生成单元312生成的消息。
在步骤S506中,PC终端105的中继应用321的主控制器322从移动终端104的移动应用304接收消息。
在步骤S507中,中继应用321搜索并执行脚本。下文将参照图8详细描述步骤S507中的处理。
在步骤S508中,主控制器322从核心系统连接应用331读出订单号,并向移动终端104的移动应用304发送订单号作为应答消息。
在步骤S509中,移动终端104的移动应用304的主控制器305存储从PC终端105的中继应用321接收的订单号作为FAX数据的附加信息(注释)。
数据配置
接下来,将描述移动终端104的移动应用304和PC终端105的中继应用321之间发送并接收的消息。
图6A到图6G是例示此实施例的消息的数据配置的图。
消息601包括消息关键字(message key)和与消息关键字对应的值。消息关键字的值包括子属性602。子性能602包括主体关键字(body key)、内部名关键字(internal-namekey)和显示名关键字(display-name key)。主体关键字具有在PC终端105的中继应用321执行脚本时要输入到核心系统连接应用331的值(信息)。内部名关键字具有用于唯一地识别移动终端104的移动应用304和PC终端105的中继应用321之间的消息的类型(项目)的值。显示名关键字具有用于通过移动终端104的移动应用304和PC终端105的中继应用321进行显示的值。消息603到607是通过Java script(注册商标)对象表现法(JSON,Java scriptobject notation)格式所表示的消息的内容的示例。消息603用于清除向核心系统连接应用331进行的输入。消息604到606分别用于向核心系统连接应用331输入电话号码、产品代码和产品数量。消息607用于确定使用消息604到606向核心系统连接应用331输入的值,并获得要在核心系统连接应用331中显示的订单号。
中继应用中存储的信息
图7A和图7B是例示PC终端105的中继应用321中存储的信息的图。连接目的地信息711用于开始与移动终端104的通信。连接目的地信息711包括分别与移动终端104的地址和移动应用304的监听(listen)端口号对应的连接目的地地址和端口号。中继应用321在启动应用321时使用连接目的地信息711,并与移动终端104的移动应用304建立通信连接。脚本文件信息712表示响应于从移动应用304提供的消息而要执行的脚本文件(脚本)。脚本文件信息712包括识别名和脚本文件名。识别名与从移动应用304提供的消息中包括的内部名关键字的值对应。在存储单元323中存储连接目的地信息711和脚本文件信息712。
中继应用的基本流程
图8是详细例示图5的步骤S507中执行的处理的流程图。在步骤S801中,PC终端105的中继应用321从移动终端104的移动应用304接收消息。在步骤S802中,消息分析单元325分析消息并获得消息中包括的内部名关键字的值。在步骤S803中,脚本执行单元326参照脚本文件信息712获得与内部名关键字关联的脚本文件名。由此,根据下述图17A和图17B的步骤S1723中发送的识别信息指定脚本,并执行指定的脚本。在步骤S804中,脚本执行单元326从存储单元323读出脚本文件并执行该脚本。要执行的处理取决于脚本文件的内容。在步骤S805中,脚本执行单元326获得脚本执行结果。在步骤S806中,脚本执行单元326确定脚本执行结果中是否包括值(应答信息)。在确定是否定时,则终止处理。在步骤S806中,在确定是肯定时,在步骤S807中,主控制器322向移动应用304发送该值。
核心系统连接应用画面
图9是例示核心系统连接应用331的操作画面的图。
可以将任何应用作为本实施例的核心系统连接应用331,只要该应用接受通过GUI进行的用户输入即可。假定核心系统连接应用331具有图9例示的用于向/从核心企业服务器103输入/输出信息的GUI,则本实施例的核心系统连接应用331执行以下操作。
请注意,在本实施例中,通过中继应用321执行脚本可以自动执行以下描述中由用户执行的输入操作、按钮按下等。下文将参照图10详细描述通过中继应用321执行的脚本执行处理。此外,用户可以在操作画面上进一步编辑通过中继应用321执行脚本而输入的信息。
附图标记900表示核心系统连接应用331的主窗口。显示栏901到903对应于客户公司名显示栏、客户名显示栏和客户部门显示栏。将电话号码输入到电话号码输入栏905,并且用户从FAX图像读出FAX发送人的电话号码,并输入电话号码。在按下搜索按钮904时,使用输入到电话号码输入栏905的电话号码从核心企业服务器103的数据库搜索客户信息,并在显示栏901到903中显示(输出)搜索结果。附图标记906表示订单输入栏。订单输入栏906具有多行(除第一行中的标题行外),并且各行具有产品代码输入栏907、产品名显示栏908、数量输入栏909、单价显示栏910以及总金额显示栏911。用户从FAX图像读出订购的产品的产品代码,并在产品代码输入栏907中输入产品代码。在输入产品代码后,从核心企业服务器103的数据库搜索产品信息,并在相同行的产品名显示栏908和单价显示栏910中显示搜索结果。
此外,在用户从FAX图像读出订购的产品的编号并在数量输入栏909中输入数量时,在相同行的总金额显示栏911中显示通过单价和数量计算的总金额。在订购多个产品时,反复执行向产品代码输入栏907的输入和向数量输入栏909的输入。
附图标记913表示订单号发出按钮,附图标记914表示订单号显示栏。在用户按下订单号发出按钮913时,在核心企业服务器103的数据库中注册显示栏901到905中显示的客户信息和订单输入栏906中显示的信息作为订单信息。这里,在订单号显示栏914中显示核心企业服务器103发出的订单号。附图标记912表示清除按钮。如果用户按下清除按钮912,则初始化主窗口900中的显示,即,清空所有显示栏。
通过脚本执行的处理流程
图10是详细例示在图8的步骤S803中指定针对电话号码的脚本和步骤S804中执行针对电话号码的脚本时执行的处理流程的流程图。在向具有图9例示的GUI的核心系统连接应用331输入脚本的假设下,生成本说明书的脚本。在中继应用321执行脚本时,发送并接收窗口消息,并向核心系统连接应用331自动输入信息,而无需用户手动输入。下文将详细描述此操作。
在图8的步骤S803中,如果将“tel”设置为从移动终端104的移动应用304接收的消息的内部名关键字的值,则指定“tel.ps 1”为脚本。图10是例示在执行脚本tel.ps 1时执行的处理的流程图。在步骤S1101中,从PC终端105中运行的多个应用中指定核心系统连接应用331。在步骤S1102中,指定核心系统连接应用331的主窗口900。在步骤S1103中,在主窗口900中显示的GUI控制中指定电话号码输入栏905(项目)。在步骤S1104中,将从移动应用304接收的消息的主体关键字的值设置给电话号码输入栏905。在步骤S1105中,在主窗口900中显示的GUI控制中指定搜索按钮904。在步骤S1106中,按下搜索按钮904。
图像分类处理
接下来,将参照图11A和图11B描述通过图像分类单元315执行的FAX图像的分类。图像分类单元315包括学习处理单元1101和分类处理单元1102。图像分类单元315预先在学习处理单元1101中执行学习处理,并在DB单元317的特征值DB 1107中存储特征值数据。此外,图像分类单元315根据特征值DB 1107中包括的信息在分类处理单元1102中执行分类处理,以确定分类。
通常,通过多维数据表示表明图像的特征的特征值数据,并将特征值数据称为特征向量。维数表示特征的类型数。
作为学习处理单元1101执行的学习处理,对各分类组的多个学习图像执行特征提取,并获得各学习图像的100维特征向量。此外,从100维特征向量确定分类组中具有显著特征的10维特征向量。通过称作滤波器的软件组件执行维度削减处理。通过DB单元317的特征值DB 1107管理针对各分类组计算的(10维)特征向量和滤波器。
作为在分类处理单元1102中执行的分类处理,对输入的FAX图像1103执行特征提取,并计算(100维)特征向量。向输入的FAX图像1103的(100维)特征向量分配针对特征值DB1107的各分类组的滤波器(主成分分析),以计算与各分类组对应的(10维)特征向量。然后,将输入的FAX图像1103的(10维)特征向量与特征值DB 1107的(10维)特征向量作比较,以便根据相似的确定执行分类。
图11B的学习结果1109表示学习处理中的特征值DB 1107中存储的数据的示例。特征值DB 1107存储可以用于分为分类组1(1104)、分类组2(1105)和分类组3(1106)的分类中的(10维)特征向量和滤波器。分类结果1110表示基于通过分类处理获得的输入图像和特征值DB1107中存储的信息的分类的结果的示例。分类结果1110表示输入的FAX图像1103被输入以及分类组1(1104)、分类组2(1105)和分类组3(1106)中的分类组1(1104)中包括输入图像的分类结果1108被确定。请注意,图像分类单元315执行的图像分类并不限于本实施例中的描述,而可以采用实现上述功能的任何方法。
坐标处理
接下来,将参照图12A和图12B描述通过坐标处理单元318执行的坐标标准化处理。执行坐标标准化处理以处理图像不依赖原始图像的长宽比(aspect ratio)且采用不同的dpi的情况。具体地说,在DB单元317中注册作为用户执行的发送操作的结果而获得的选择区域的坐标信息时或向DB单元317询问注册的操作历史时执行坐标标准化处理。首先,坐标系统的示例包括显示坐标(显示器中的位置)、FAX图像坐标(FAX图像中的位置)和数据库注册坐标。在坐标标准化处理中,将用户在显示中选择的选择坐标传送至FAX图像坐标,并进一步传送至数据库注册坐标。通过将FAX图像坐标与全部像素的比率乘以10000来获得数据库注册坐标。
这里,为了简化描述,假定显示坐标与FAX图像坐标彼此一致,并且FAX图像1201具有2000px乘1500px的矩阵的像素。在通过(X,Y)=(200,700)表示选择区域1202中的左上坐标1203且通过(400,750)表示右下坐标1204的情况下,通过(1333,3500)和(2666,3750)表示数据库注册坐标。在下文中,通过minX表示数据库注册坐标中的左上X坐标、通过maxX表示右下X坐标、通过minY表示左上Y坐标,并通过maxY表示右下Y坐标。
数据配置(DB)
接下来,将描述DB单元317中包括的操作历史数据库1300。图13A到13J是例示本实施例的操作历史数据库1300的数据配置和SQL语句的图。操作历史数据库1300包括发送历史表1301和发送区域表1302。
发送历史表1301包括id栏、内部名(internalname)栏、分类(classfication)栏、OCR结果(ocrresult)栏和发送消息(sendmessage)栏。id栏包括每向发送历史表1301增加记录就以一递增的值,并且是表格中的主关键字(primary key)。internalname栏存储发送结果的识别信息。classfication栏存储FAX图像的分类结果(例如,图11A和图11B的1108)。ocrresult栏存储选择区域的OCR结果。sendmessage栏存储发送结果(发送的文本信息)。
发送区域表1302包括id栏、minX栏、maxX栏、minY栏和maxY栏。minX栏存储选择区域的左上X坐标。maxX栏存储选择区域的右下X坐标。minY栏存储选择区域的左上Y坐标。maxY栏存储选择区域的右下Y坐标。此外,以使通过R-tree索引(多维信息索引)方法对发送区域表1302执行高速区域搜索的方式配置发送区域表1302。
SQL语句1303到1310是用于对操作历史数据库1300的各种询问的SQL语句的示例。SQL语句1303用于重新生成发送历史表1301。SQL语句1304用于重新生成发送区域表1302。在初始化应用时执行SQL语句1303和1304,并在DB单元317中存储生成的表格。SQL语句1305用于检查是否存在相同分类组的发送历史。SQL语句1306用于检查是否存在相同分类组的且具有相同选择坐标的发送历史。SQL语句1307用于检查是否检测到相同分类组的且具有相同选择坐标的发送历史的所有识别信息的匹配。SQL语句1308用于检查是否检测到相同分类组的且与选择坐标对应的发送历史的所有发送结果的匹配。SQL语句1309用于检查是否存在相同分类组的且具有相同OCR结果的发送历史。SQL语句1310用于使用分类信息作为关键字来存储发送历史。
OCR画面(移动终端)
接下来,将参照图14描述移动终端104中的OCR画面。在按下移动终端画面400的OCR按钮402时显示OCR画面1400。在显示OCR画面1400时,在FAX显示画面中显示的FAX图像中生成针对OCR的各模块(区域),并对各模块执行OCR处理。此外,在各模块中,被识别出包含文本的模块被矩形围成由附图标记1409和1411表示的可选择区域,以显示为可选择状态。作为目标识别或OCR的结果,将可选择区域1409和1411识别为文本区域,通过矩形围住并可进行选择。按钮显示区域1402用于显示按钮设置画面(未例示)中设置的按钮。在按下按钮1404到1406中的一者后按下可选择区域中的一者时,作为消息向中继应用321发送可选择区域中的OCR的结果。图6D中的消息604是按下电话号码按钮的情况下发送的消息的示例。同样地,图6E中的消息605和图6F中的消息606是在分别按下产品代码按钮1405和按下产品数量按钮1406的情况下所发送的消息的示例。显示名区域1408用于显示向按钮分配的名称。在如附图标记1410表示的那样标记可选择区域中的一者来识别用户选择了可选择区域时,将区域1410称作选择完成区域1410。在用户选择可选择区域中的一者时,将该区域称作选择完成区域,并显示下述发送确认画面1500。
发送确认画面(移动终端)
接下来,将参照图15描述移动终端104的发送确认画面1500。在发送确认画面1500中,用户检查用户选择的区域的OCR结果,并且,如果用户对OCR结果满意,则向中继应用321发送OCR结果。另一方面,如果用户对OCR结果不满意,则执行校正或者在发送确认画面1500中取消发送。选择完成图像显示区域1501放大显示用户选择的可选择区域的图像。文本输入区1502包括作为对选择的可选择区域执行的OCR处理的结果的文本信息或使用操作历史数据库1300而作为初始值确定的可编辑的发送结果信息。文本清除按钮1503用于清除文本输入区1502的文本值。在获得错误的OCR结果等时使用文本清除按钮1503。发送执行按钮1504用于执行发送。在按下发送执行按钮1504时,向中继应用321发送消息。取消按钮1505用于取消发送确认画面1500以便再次显示OCR画面1400。
操作历史数据库的示例
接下来,将参照图16A到图16C描述操作历史数据库1300中存储的信息的示例。在图像分类单元315将FAX图像1600的分类组确定为“分类组1”,并且用户向中继应用321发送选择区域1601到1605的情况下,获得发送历史表1606和发送区域表1607作为发送历史表1301和发送区域表1302的具体示例。发送历史记录1608表示选择了FAX图像1600的选择区域1601,识别信息是“tel”,并且在发送前在发送确认画面1500中将OCR结果“080-1284-1234”校正为“080-1234-1234”。此外,发送历史记录1609表示选择了FAX图像1600的选择区域1602,识别信息是“code”,并且在发送前在发送确认画面1500中将OCR结果“2301119”校正为“2801119”。此外,发送历史记录1610表示选择了FAX图像1600的选择区域1603,识别信息是“code”,并且不在发送确认画面1500中进行校正而发送OCR结果“3891120”。此外,发送历史记录1611表示选择了FAX图像1600的选择区域1604,识别信息是“num”,并且不在发送确认画面1500中进行校正而发送OCR结果“3”。此外,发送历史记录1612表示选择了FAX图像1600的选择区域1605,识别信息是“num”,并且不在发送确认画面1500中进行校正而发送OCR结果“3”。
提取信息发送处理的流程图
图17A和图17B是详细例示通过图5的步骤S505中执行的按钮操作发送从图像提取的信息的处理的流程图。在移动终端104的移动终端画面400中显示FAX图像时,在用户按下OCR按钮402时开始此流程。
在步骤S1701中,FAX图像分析单元310分析FAX接收数据中包括的FAX图像,以获得用于识别FAX图像中的字符的多个模块。
在步骤S1702中,OCR单元311对各模块执行OCR处理以提取文本信息。
在步骤S1703中,信息显示单元306变更通过对FAX图像执行的OCR而获得的模块的区域的颜色,以使模块进入可选择状态,并显示图14中例示的OCR画面1400。
在步骤S1704中,在用户在OCR画面1400中选择了要发送的可选择区域中的一者时,信息显示单元306使选择的可选择区域进入可选择状态。在选择的状态下,显示选择完成区域以如图14中例示的那样从可选择区域中区别开来。例如,如果选择了描述了“080-1234-1234”的区域,则将区域显示为选择完成区域1410。
在步骤S1705中,图像分类单元315的分类处理单元1102执行分类处理以分类FAX图像。在下文中,在预先生成了图16B和图16C中例示的数据库的假设下而进行描述。具体地说,预先生成发送历史表1606和发送区域表1607作为操作历史数据库1300。
在确定已在步骤S1706中分类了FAX图像时,处理进入步骤S1707。在还未分类FAX图像时,处理进入步骤S1721。
在步骤S1707中,操作历史管理单元316在DB单元317的操作历史数据库1300中搜索历史信息,该历史信息是在相同分类组、且使用例如分类组1(1104)的分类信息作为关键字而发送的。这里,针对对操作历史数据库1300的询问而发出SQL语句1305。
在步骤S1708中,在命中此类历史信息时,处理进入步骤S1709。在没有命中此类历史信息时,处理进入步骤S1721。在发送历史表1606的示例中,在分类组1(1104)中命中了五条记录(1608到1612),因此,处理进入步骤S1709。
在步骤S1709中,操作历史管理单元316使坐标处理单元318对步骤S1704中选择的选择完成区域1410的坐标信息执行坐标校正处理以及如图12描述的坐标标准化处理。
这里,将参照图18A到图18E描述坐标校正处理以及步骤S1710中执行的包含询问(inclusion inquiry)和重叠询问(overlapping inquiry)。采用包含询问1801和重叠询问1802这两种询问作为使用选择完成区域1410的坐标信息向操作历史数据库1300发送询问的方法。发出包含询问1801以在询问区域中仅搜索询问区域中包含的区域。例如,发出包含询问1801以在包含询问区域1807中搜索包含区域1808。尽管,响应于包含询问1801执行的处理速度高,但可能如非命中示例1803表示的那样针对询问而毫无命中。
另一方面,发出重叠询问1802以在询问区域中搜索重叠区域。例如,发出重叠询问1802以在重叠询问区域1809中搜索重叠区域1810。尽管在发出重叠询问1802时确定无疑地至少命中区域,但响应于重叠询问1802执行的处理速度可能低,并且可能会命中噪音。
在询问区域1811与非命中区域1812部分重叠时获得非命中示例1803,即,询问区域1811不包含非命中区域1812,因此,不会响应于包含询问命中非命中区域1812。通过这种方式,如果坐标轻微偏移,则在发出包含询问1801时不会命中任何区域。
此外,在询问区域1813既不包含也不与非命中区域1814部分重叠时获得非命中示例1804,因此,在发出包含询问1801和重叠询问1802中的任一者时,不会命中区域1814。在例如存储了诸如图16A中例示的产品代码1602和1603等的两个历史的状态下,在最新读出包括如图14的OCR画面中例示的第三产品代码的FAX图像的情况中获得非命中示例1804。非命中示例1804表示在步骤S1704中代替区域1410而选择了可选择区域1411的情况下,没有对任何询问命中任何区域。
为了处理非命中示例1803,在步骤S1709中执行坐标校正处理以校正坐标位置。将如图18A到图18E的附图标记1800详细描述坐标校正处理。在用户选择如例示的左上坐标1203和右下坐标1204的情况下,将左上坐标1203和右下坐标1204分别校正为如例示的左上坐标1805和右下坐标1806。
此外,为了处理非命中示例1804,在步骤S1710中不存在满足包含询问1801的区域的情况下,发出重叠询问1802以再次执行搜索。
在下文中,再次参照图17A和图17B进行描述。在步骤S1710中,操作历史管理单元316比较分类信息的分类组1(1104)中的选择完成区域的坐标与操作历史数据库1300中的坐标以确定操作历史数据库1300中的其中一个坐标是否与选择完成区域的坐标匹配。更具体地说,发出上述包含询问1801,而如果没有检测到匹配,则发出上述重叠询问1802。这里,针对要向操作历史数据库1300发送的包含询问1801发出SQL语句1306,并针对重叠询问1802发出SQL语句1311。在发送历史表1606的示例中,仅命中记录1608。
在步骤S1711中,在命中历史信息时,处理进入步骤S1712。否则,处理进入步骤S1721。
在步骤S1712中,在所有的命中历史信息的识别信息都相同时,处理进入步骤S1713。否则,处理进入步骤S1721。这里,发出SQL语句1307作为向操作历史数据库1300的询问。在发送历史表1606的示例中,所有识别信息都是“tel”,因此,确定所有识别信息都相同,并且处理进入步骤S1713。
在步骤S1713中,根据与发送区域表对应的发送历史表中的识别信息确定步骤S1704中选择的区域的识别信息,并且信息显示单元306使按钮进入选择的状态。在发送历史表1606的示例中,将识别信息确定为“tel”,并且使电话号码按钮1404进入选择的状态。以下将参照图15描述选择状态下的按钮的显示方法。
在步骤S1714中,操作历史管理单元316检查步骤S1711中命中的历史的发送结果(sendmessage)。这里,针对要向操作历史数据库1300发送的询问发出SQL语句1308。
在步骤S1715中,在所有发送结果(sendmessage)都相同时,处理进入步骤S1716。否则,处理进入步骤S1717。
在步骤S1716中,操作历史管理单元316确定要显示的发送结果。在发送历史表1606中,确定将记录1608中的“080-1234-1234”显示为发送结果。
在步骤S1717中,操作历史管理单元316检查操作历史数据库1300的OCR结果(ocrresult)中是否包括与选择完成区域1410的OCR结果匹配的文本。在检测到匹配时,处理进入步骤S1718。否则,处理进入步骤S1721。这里,针对要向操作历史数据库1300发送的询问发出SQL语句1309。
在步骤S1718中,操作历史管理单元316确定是否获得了多个发送结果。在确定是肯定时,处理进入步骤S1719。在确定是否定时,处理进入步骤S1720。
在步骤S1719中,操作历史管理单元316确定要显示与最大发送计数对应的发送结果中的一者。
在步骤S1720中,操作历史管理单元316确定要显示发送结果。
在步骤S1721中,操作历史管理单元316确定要显示选择完成区域1410的OCR结果。
在步骤S1722中,主控制器305根据从操作历史管理单元316提供的信息显示发送确认画面1500。选择完成图像显示区域1501的图像与选择完成区域1410的图像对应。此外,存储上述步骤中确定的发送结果或OCR结果作为文本输入区1502的值。选择状态按钮1506表示电话号码按钮1404处于选择状态中。在步骤S1713中还未确定识别信息时,用户需要确定识别信息并选择按钮1404到1406中的一者。
在步骤S1723中,在用户按下发送执行按钮1504时,消息生成单元312生成如下的消息,该消息表示要向中继应用321发送文本输入区1502中的值“080-1234-1234”和电话号码按钮1404中设置的识别信息“tel”。这里生成的消息与图6A到图6G的消息604对应。此外,消息发送/接收单元313向中继应用321发送消息。通过这种方式,发送步骤S1713中确定的识别信息和基于对步骤S1701中生成的模块执行的OCR的文本信息。
在步骤S1724中,主控制器305在操作历史数据库1300中存储发送历史。这里,针对要向操作历史数据库1300发送的询问发出SQL语句1310。通过这种方式,根据移动应用304的发送结果存储原稿中的区域的坐标和与区域对应的识别信息。
如上所述,根据此实施例,与根据历史信息自动确定的识别信息一起向PC终端105中的中继应用321发送对通过移动终端104获得的FAX图像执行的OCR的结果或历史信息的发送结果的文本信息。在中继应用321执行由识别信息指定的脚本时,自动在系统上执行输入操作代替用户手动输入。
第二实施例
在第二实施例中,将描述第二提取信息发送处理。省略前述实施例中描述的配置和处理流程的详细描述。在第一实施例中,尽管在选择时使用历史信息和OCR信息确定用户选择的可选择区域的识别信息,但在后述OCR画面1900显示时预先根据历史信息自动确定所有选择区域的识别信息,以向用户可视化地进行显示。
OCR画面(移动终端)
将参照图19描述移动终端104中的第二OCR画面1900。在OCR画面1900中,根据历史信息确定所有选择区域的识别信息,并作为示例可视化地显示识别信息。在选择区域1901中,将识别信息确定为“tel”。在选择区域1902中,将识别信息确定为“code”。在选择区域1903中,将识别信息确定为“code”。在选择区域1904中,将识别信息确定为“code”。在选择区域1905中,将识别信息确定为“num”。在选择区域1906中,将识别信息确定为“num”。在选择区域1907中,将识别信息确定为“num”。对各识别信息以不同的颜色显示确定了其的识别信息的选择区域,以使用户可以区分识别信息。
搜索区域缩小处理
接下来,将参照图20描述通过操作历史管理单元316执行的搜索区域缩小处理。在要显示图19中例示的第二OCR画面1900的情况下,需要确定从FAX图像提取的所有可选择区域的识别信息。因此,预先使用历史信息的坐标信息来区分搜索请求区域2001和搜索例外区域2002,以便在输入FAX图像2003中的可选择区域中确定搜索请求区域2004和搜索例外区域2005。通过这种方式,由于仅确定了搜索请求区域2004的识别信息,所以可以减少搜索目标的数量,因此,提高了显示速度。在消息发送后,在操作历史数据库1300中注册历史时识别搜索请求区域2001和搜索例外区域2002。将现有的搜索区域和操作历史信息的坐标信息互相作比较,以便将与现有搜索区域和坐标信息之间的AND条件对应的区域确定为搜索区域。
提取信息发送处理的流程图
图21A和图21B是例示通过按钮操作发送从图像提取的信息的第二处理(图5的步骤S505)的流程图。在移动终端104的移动终端画面400中显示FAX图像时,在用户按下OCR按钮402时开始此流程。
请注意,向与前文描述的步骤相同的处理分配与向前文例示的步骤分配的步骤标号相同的步骤标号,并且除非特别注明,否则将省略对其的描述。
在步骤S2101中,操作历史管理单元316执行参照图20描述的搜索区域缩小处理。
在步骤S2102中,操作历史管理单元316确定搜索请求区域2004中是否分别包括FAX图像中生成的模块。作为确定结果而在搜索请求区域2004的一者中包括目标模块的情况下,处理进入步骤S1709。另一方面,在模块与搜索例外区域2005对应的情况下,聚焦下一个模块,并在步骤S2102中对下一个模块执行确定处理。
在步骤S2103中,操作历史管理单元316确定模块的识别信息。此外,信息显示单元306变更FAX图像中的模块的区域的颜色。此外,信息显示单元306变更各识别信息的颜色。此外,使区域进入可选择状态。
在步骤S2104中,信息显示单元306显示OCR画面1900。
在步骤S2105中,操作历史管理单元316确定现有搜索区域的帧中是否包括发送历史坐标。在确定为否定时,操作历史管理单元316更新搜索区域信息。
如上所述,根据此实施例,在OCR画面1900中可以根据历史信息自动确定通过移动终端104获得的FAX图像中的选择区域的识别信息,并可视化地进行显示。
第三实施例
在第三实施例中,将描述第三提取信息发送处理。省略前述实施例中描述的配置和处理流程的详细描述。在第二实施例中,在OCR画面1900显示时,根据历史信息自动确定所有选择区域的识别信息,以便用户可视化地确认识别信息。在第三实施例中,在OCR画面2200显示时,与自动确定的识别信息一起显示确定的OCR结果或发送结果的文本信息。
OCR画面(移动终端)
将参照图22描述移动终端104中的第三OCR画面2200。根据识别了识别信息的选择区域中的文本信息而动态地生成动态生成显示区2201。在此实施例中,生成了七个显示区域。电话号码显示区2202与选择区域1901对应。产品代码显示区2203与选择区域1902对应。数量显示区2204与选择区域1905对应。产品代码显示区2205与选择区域1903对应。数量显示区2206与选择区域1906对应。产品代码显示区2207与选择区域1904对应。数量显示区2208与选择区域1907对应。在要校正显示的文本信息时按下电话号码校正按钮2209、产品代码校正按钮2210、数量校正按钮2211、产品代码校正按钮2212、数量校正按钮2213、产品代码校正按钮2214或数量校正按钮2215。在按下其中一个按钮时,显示发送确认画面1500。使显示的发送确认画面1500中的发送执行按钮1504进入非显示状态,而显示返回按钮(未例示)。用户校正此画面中的文本信息并按下返回按钮,以再次显示OCR画面2200。此外,可以通过用户操作增加或删除动态生成显示区2201中的显示区。
提取信息发送处理的流程图
图24A和图24B是详细例示图5的步骤S505中作为第三处理执行的通过按钮操作发送从图像提取的信息的处理的流程图。在移动终端104的移动终端画面400中显示FAX图像时,在用户按下OCR按钮402时开始此流程。
请注意,向与前文描述的步骤相同的处理分配与向前文例示的步骤分配的步骤标号相同的步骤标号,并且除非特别注明,否则将省略对其的描述。
在步骤S2401中,信息显示单元306生成显示区区域。
在步骤S2402中,信息显示单元306在显示区区域设置发送结果或OCR结果的文本信息。
在步骤S2403中,在存在步骤S2103中确定了识别信息的至少两个发送历史的情况下,处理进入步骤S2404,否则,处理进入步骤S2104。
在步骤S2404中,信息显示单元306显示图22的OCR画面2200。
在步骤S2405中,在用户按下校正按钮2209到2215中的一者时,信息显示单元306显示图15的发送确认画面1500。
如上所述,根据此实施例,可以根据历史信息自动在OCR画面中确定通过移动终端104获得的FAX图像中的选择区域的识别信息,并可以用列表显示基于识别信息的类型以及文本信息。
第四实施例
在第四实施例中,将描述第二系统配置。省略前述实施例中描述的配置和处理流程的详细描述。在此实施例中,通过图像形成装置执行分类处理,并且通过移动终端使用分类处理的结果。此外,在服务器中存储历史信息,并可以通过多个移动终端使用历史信息。
系统配置
将参照图25A到图25E描述FAX订单系统3000作为根据此实施例的信息处理系统的示例。
与移动终端104类似地配置移动终端107,并通过网络100以可通信的方式与其他设备连接。
操作历史管理服务器106管理关于使用PC终端104和107执行的操作的操作历史信息。
软件配置(图像形成装置)
接下来,将描述图像形成装置101的软件配置。
图像分类单元2501同图像分类单元315一样,如参照图11A和图11B所描述那样使用预先对FAX图像执行了学习处理的特征值DB 1107执行分类处理,以分类FAX图像。
软件配置(移动终端)
数据传送/接收单元308请求向操作历史管理服务器106发送通过操作历史管理单元316发出的询问,并执行信息获得和信息更新。
软件配置(操作历史管理服务器106)
操作历史管理服务器106的历史管理应用2500包括操作历史管理单元2502和DB单元2503。操作历史管理单元2502向/从移动终端104和107的数据发送/接收单元308发送并接收数据。DB单元2503响应从操作历史管理单元2502提供的询问而使用操作历史表获得并更新信息。
基本流程
接下来,将参照图23描述FAX订单系统3000的基本处理流程。
在图像形成装置101中包括的FAX单元从其他FAX装置接收FAX图像时开始此流程。
在步骤S2601中,图像分类单元2501分类FAX图像。将分类的信息存储为FAX接收目录信息。
在步骤S2602中,主控制器305识别FAX接收目录信息中包括的分类信息。此外,操作历史管理单元316通过数据传送/接收单元308向操作历史管理服务器106发出各种询问,以获得操作历史信息。
在步骤S2603中,操作历史管理单元316通过数据传送/接收单元308向操作历史管理服务器106发送操作历史信息。操作历史管理服务器106在DB单元中存储接收的操作历史信息。
如上所述,根据此实施例,可以将操作历史存储于外部服务器中,并通过多个移动终端进行分享。可以将操作历史存储于PC终端105或图像形成装置101中。
其他实施例
可以通过网络或存储介质向系统或装置提供实现上述实施例中的至少一项功能的程序,并通过系统或装置的计算机中包括的至少一个处理器读取并执行该程序来实现本发明。此外,可以通过实现至少一项功能的电路(例如,ASIC)来实现本发明。
尽管上文描述了本发明的优选实施例,但本发明并不限于这些实施例,并且可以在本发明的范围内进行各种变型和改变。
根据本发明的系统,可以根据发送结果的历史比较区域的坐标以指定识别信息来实现向系统的高速输入。
本发明的实施例还可以通过如下的方法来实现,即,通过网络或者各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装置,该系统或装置的计算机或是中央处理单元(CPU)、微处理单元(MPU)读出并执行程序的方法。
虽然参照示例性实施例描述了本发明,但是应当理解,本发明并不限于所公开的示例性实施例。应当对权利要求的范围赋予最宽的解释,以使其涵盖所有这些变型例以及等同的结构及功能。

Claims (12)

1.一种信息处理系统,所述系统包括:
显示单元,其显示第一显示区和第二显示区,所述第一显示区中显示文档,所述第二显示区用于指定对在第一显示区的文档中选择的区域执行处理;
存储单元,其在第一显示区中的区域的选择和第二显示区中的处理的选择之上,存储关于所述文档的特征值的信息,存储用于指定所述处理的识别信息,以及存储所述区域的坐标;
生成单元,其在最新接收的文档中生成要进行字符识别的多个区域;
比较单元,其比较所述生成单元生成的区域的坐标与所述存储单元中存储的区域的坐标;
确定单元,其根据与所述存储单元中存储的区域对应的识别信息以及所述比较单元的比较结果,确定与所述生成单元生成的区域的坐标对应的识别信息;以及
执行单元,其根据所述确定单元确定的识别信息,指定用于向应用输入通过对所述生成单元生成的区域执行的所述字符识别而获得的文本信息的脚本,并执行所指定的脚本。
2.根据权利要求1所述的信息处理系统,所述系统还包括:
发送单元,其发送所述确定单元确定的识别信息以及通过对所述生成单元生成的区域执行的所述字符识别而获得的文本信息,
其中,所述执行单元根据所述发送单元发送的识别信息指定用于向所述应用输入所述文本信息的脚本,并执行所指定的脚本,以及
所述存储单元根据所述发送单元执行的发送的结果,存储所述生成单元生成的区域的坐标以及所述区域的识别信息。
3.根据权利要求1所述的信息处理系统,所述系统还包括:
分类单元,其根据特征来分类所述最新接收的文档,
其中,所述存储单元互相关联地存储作为所述分类单元执行的分类的结果而获得的分类组、所述文档中的区域的坐标以及所述识别信息,以及
所述确定单元根据所述比较单元执行的比较的结果、所述存储单元存储的分类组以及所述区域的识别信息,确定与所述生成单元生成的区域的坐标对应的识别信息。
4.根据权利要求1所述的信息处理系统,其中,在所述执行单元执行所述脚本时,发送并接收窗口消息,并向系统连接应用输入信息。
5.根据权利要求1所述的信息处理系统,其中,
所述存储单元存储互相关联的所述文本信息、所述文档中的区域的坐标和所述识别信息,
所述系统还包括:
显示单元,其显示所述存储单元中存储的文本信息或对所述生成单元生成的区域执行的所述字符识别的结果,并显示用于校正所述字符识别的结果并作为所述文本信息发送该结果的确认画面,以及
在所述确认画面中校正了所述字符识别的结果的情况下,所述发送单元发送所述确定单元确定的识别信息和所述确认画面中校正的文本信息。
6.根据权利要求5所述的信息处理系统,其中,
所述存储单元存储互相关联的所述字符识别的结果、所述文本信息、所述文档中的区域的坐标以及所述识别信息,以及
在对所述生成单元生成的区域执行的所述字符识别的结果与所述存储单元中存储的所述字符识别的结果匹配的情况下,所述显示单元显示所述存储单元中存储的文本信息。
7.一种信息处理的控制方法,所述控制方法包括:
显示步骤,其显示第一显示区和第二显示区,所述第一显示区中显示文档,所述第二显示区用于指定对在第一显示区域的文档中选择的区域执行处理;
存储步骤,其在第一显示区中的区域的选择和第二显示区中的处理的选择之上,存储关于所述文档的特征值的信息,存储用于指定所述处理的识别信息,以及存储所述区域的坐标;
生成步骤,其在最新接收的文档中生成要进行字符识别的多个区域;
比较步骤,其比较所述生成步骤中生成的区域的坐标与所述存储步骤中存储的区域的坐标;
确定步骤,其根据与所述存储步骤中存储的区域对应的识别信息和所述比较步骤中的比较结果,确定与所述生成步骤中生成的区域的坐标对应的识别信息;以及
执行步骤,其在根据所述确定步骤中确定的识别信息指定用于向应用输入通过对所述生成步骤中生成的区域执行的所述字符识别而获得的文本信息的脚本之后,执行所述脚本。
8.根据权利要求7所述的信息处理的控制方法,所述控制方法还包括:
发送步骤,其发送所述确定步骤中确定的识别信息和通过对所述生成步骤中生成的区域执行的所述字符识别而获得的文本信息,
其中,在根据所述发送步骤中发送的识别信息指定用于向所述应用输入所述文本信息的脚本之后,所述执行步骤执行所指定的脚本,以及
所述存储步骤根据所述发送步骤中执行的发送的结果存储所述生成步骤中生成的区域的坐标和所述区域的识别信息。
9.根据权利要求7所述的信息处理的控制方法,所述控制方法还包括:
分类步骤,其根据特征来分类所述最新接收的文档,
其中,所述存储步骤互相关联地存储作为所述分类步骤的结果获得的分类组、所述文档中的区域的坐标以及所述识别信息,以及
所述确定步骤根据所述比较步骤的结果、所述存储步骤中存储的分类组以及所述区域的识别信息确定与所述生成步骤中生成的区域的坐标对应的识别信息。
10.根据权利要求7所述的信息处理的控制方法,其中,在所述执行步骤执行所述脚本时,发送并接收窗口消息,并向系统连接应用输入信息。
11.根据权利要求7所述的信息处理的控制方法,其中,
所述存储步骤存储互相关联的所述文本信息、所述文档中的区域的坐标以及所述识别信息,
所述控制方法还包括:
显示所述存储步骤中存储的文本信息或对所述生成步骤中生成的区域执行的所述字符识别的结果,并显示用于校正所述字符识别的结果并作为所述文本信息发送该结果的确认画面的步骤,以及
在所述确认画面中校正了所述字符识别的结果的情况下,所述发送步骤发送所述确定步骤中确定的识别信息和所述确认画面中校正的文本信息。
12.根据权利要求11所述的信息处理的控制方法,其中,
所述存储步骤存储互相关联地所述字符识别的结果、所述文本信息、所述文档中的区域的坐标和所述识别信息,以及
在对所述生成步骤中生成的区域执行的所述字符识别的结果与所述存储步骤中存储的所述字符识别的结果匹配的情况下,所述显示步骤显示所述存储步骤中存储的文本信息。
CN201610129764.XA 2015-03-09 2016-03-08 系统和控制方法 Active CN105955683B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910784129.9A CN110321880B (zh) 2015-03-09 2016-03-08 系统和控制方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015046430A JP2016167156A (ja) 2015-03-09 2015-03-09 システム、プログラム及び制御方法
JPJP2015-046430 2015-03-09

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201910784129.9A Division CN110321880B (zh) 2015-03-09 2016-03-08 系统和控制方法

Publications (2)

Publication Number Publication Date
CN105955683A CN105955683A (zh) 2016-09-21
CN105955683B true CN105955683B (zh) 2019-09-06

Family

ID=56888371

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201610129764.XA Active CN105955683B (zh) 2015-03-09 2016-03-08 系统和控制方法
CN201910784129.9A Active CN110321880B (zh) 2015-03-09 2016-03-08 系统和控制方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201910784129.9A Active CN110321880B (zh) 2015-03-09 2016-03-08 系统和控制方法

Country Status (4)

Country Link
US (1) US10097724B2 (zh)
JP (1) JP2016167156A (zh)
KR (1) KR101937525B1 (zh)
CN (2) CN105955683B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170022490A (ko) * 2015-08-20 2017-03-02 엘지전자 주식회사 이동 단말기 및 그 제어방법
US10511730B1 (en) * 2018-06-07 2019-12-17 Kyocera Document Solutions Inc. Method to create a secure distributed data validation system using a distributed storage system and artificial intelligence
JP7346926B2 (ja) * 2019-06-12 2023-09-20 株式会社リコー 情報処理装置、情報処理方法、プログラム及び情報処理システム
EP3933678A1 (en) * 2020-06-30 2022-01-05 Ricoh Company, Ltd. Information processing system, data output system, image processing method, and carrier means

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009020642A (ja) * 2007-07-11 2009-01-29 Data Fair Kk ファクシミリ注文票ペーパーレス入力システム
CN101505351A (zh) * 2008-02-06 2009-08-12 佳能株式会社 文档处理系统及用于文档处理系统的控制方法
CN103513884A (zh) * 2012-06-15 2014-01-15 株式会社理光 信息处理装置、信息处理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001013315A1 (fr) * 1999-08-16 2001-02-22 Fujitsu Limited Appareil de transaction automatique
JP4847220B2 (ja) * 2006-06-07 2011-12-28 キヤノン株式会社 データ処理装置及びその制御方法、プログラム、記憶媒体
JP5098614B2 (ja) * 2007-12-11 2012-12-12 コニカミノルタビジネステクノロジーズ株式会社 文章処理装置の制御方法および文章処理装置
JP5187057B2 (ja) * 2008-08-07 2013-04-24 株式会社リコー レイアウト印刷システム、レイアウト文書閲覧方法、及びプログラム
JP5412916B2 (ja) * 2009-03-27 2014-02-12 コニカミノルタ株式会社 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP5361574B2 (ja) * 2009-07-01 2013-12-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP2013196479A (ja) * 2012-03-21 2013-09-30 Toshiba Corp 情報処理システム、情報処理プログラム、情報処理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009020642A (ja) * 2007-07-11 2009-01-29 Data Fair Kk ファクシミリ注文票ペーパーレス入力システム
CN101505351A (zh) * 2008-02-06 2009-08-12 佳能株式会社 文档处理系统及用于文档处理系统的控制方法
CN103513884A (zh) * 2012-06-15 2014-01-15 株式会社理光 信息处理装置、信息处理方法

Also Published As

Publication number Publication date
CN110321880A (zh) 2019-10-11
US20160269586A1 (en) 2016-09-15
US10097724B2 (en) 2018-10-09
KR20160110151A (ko) 2016-09-21
CN105955683A (zh) 2016-09-21
KR101937525B1 (ko) 2019-01-10
CN110321880B (zh) 2024-02-09
JP2016167156A (ja) 2016-09-15

Similar Documents

Publication Publication Date Title
EP3437019B1 (en) Optical character recognition in structured documents
CN109919014A (zh) Ocr识别方法及其电子设备
CN105955683B (zh) 系统和控制方法
CN107368550B (zh) 信息获取方法、装置、介质、电子设备、服务器及系统
US20170270506A1 (en) Display terminal-based data processing method
CN106575300A (zh) 用于识别文档中的对象的基于图像的搜索
US11894021B2 (en) Data processing method and system, storage medium, and computing device
KR102440198B1 (ko) 시각 검색 방법, 장치, 컴퓨터 기기 및 저장 매체 (video search method and apparatus, computer device, and storage medium)
CN113821296B (zh) 可视化界面生成方法、电子设备及存储介质
CN107168635A (zh) 信息呈现方法和装置
US10038785B1 (en) Methods and systems for automatically recognizing actions in a call center environment using video data
CN115631374A (zh) 控件操作方法、控件检测模型的训练方法、装置和设备
JP2018106524A (ja) 対話装置、対話方法、およびプログラム
CN113783770B (zh) 图像分享方法、图像分享装置和电子设备
CN106776634A (zh) 一种用于网络访问的方法、装置及终端设备
JP2017084198A (ja) システム、プログラム及び制御方法
KR20190020281A (ko) 시각적 입력의 처리
US11868393B2 (en) Methods and systems for determining color labeling for a vehicle search service
US20220358283A1 (en) Computer implemented cognitive functioning system
CN112183149B (zh) 图形码处理方法及装置
CN114248572B (zh) 会计凭证的打印方法、装置及存储介质
US20230144394A1 (en) Systems and methods for managing digital notes
US20240126562A1 (en) Automated configuration of software systems using images of computing devices or peripherals
US20240146781A1 (en) Systems and methods for managing digital notes for collaboration
US20220164231A1 (en) Determine specific devices from follow-up questions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant