CN105308554A - 数据传输系统、传输数据的方法、以及系统 - Google Patents
数据传输系统、传输数据的方法、以及系统 Download PDFInfo
- Publication number
- CN105308554A CN105308554A CN201380077280.XA CN201380077280A CN105308554A CN 105308554 A CN105308554 A CN 105308554A CN 201380077280 A CN201380077280 A CN 201380077280A CN 105308554 A CN105308554 A CN 105308554A
- Authority
- CN
- China
- Prior art keywords
- parameter
- data transmission
- electronic document
- format
- key word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/12—Digital output to print unit, e.g. line printer, chain printer
- G06F3/1201—Dedicated interfaces to print systems
- G06F3/1223—Dedicated interfaces to print systems specifically adapted to use a particular technique
- G06F3/1275—Print workflow management, e.g. defining or changing a workflow, cross publishing
- G06F3/1276—Print workflow management, e.g. defining or changing a workflow, cross publishing within a printer driver, e.g. driver resides either on a server or on a client
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/12—Digital output to print unit, e.g. line printer, chain printer
- G06F3/1201—Dedicated interfaces to print systems
- G06F3/1202—Dedicated interfaces to print systems specifically adapted to achieve a particular effect
- G06F3/1203—Improving or facilitating administration, e.g. print management
- G06F3/1206—Improving or facilitating administration, e.g. print management resulting in increased flexibility in input data format or job format or job type
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/12—Digital output to print unit, e.g. line printer, chain printer
- G06F3/1201—Dedicated interfaces to print systems
- G06F3/1223—Dedicated interfaces to print systems specifically adapted to use a particular technique
- G06F3/1237—Print job management
- G06F3/1244—Job translation or job parsing, e.g. page banding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/12—Digital output to print unit, e.g. line printer, chain printer
- G06F3/1201—Dedicated interfaces to print systems
- G06F3/1223—Dedicated interfaces to print systems specifically adapted to use a particular technique
- G06F3/1275—Print workflow management, e.g. defining or changing a workflow, cross publishing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/12—Digital output to print unit, e.g. line printer, chain printer
- G06F3/1201—Dedicated interfaces to print systems
- G06F3/1278—Dedicated interfaces to print systems specifically adapted to adopt a particular infrastructure
- G06F3/1285—Remote printer device, e.g. being remote from client or server
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Record Information Processing For Printing (AREA)
- Accessory Devices And Overall Control Thereof (AREA)
- Document Processing Apparatus (AREA)
Abstract
一种数据传输系统,包括:虚拟打印机驱动器,用于从第一系统接收报表,并且用于生成表示所述报表的电子文档,所述报表采用打印作业的形式;以及提取模块,用于从所述电子文档提取参数,以第一格式格式化所述参数,并且将采用所述第一格式的所述参数提供到第二系统。
Description
背景技术
在制造环境中,各种IT系统可被用于工厂内的过程控制以及财务处理和商务交易。可利用生产管理和过程优化工具,并且可提供API(应用程序接口)以方便过程控制系统和生产管理系统之间的数据传输。例如,在打印产品的生产中,打印服务提供商可提供工厂内过程控制等,并且可经由API与生产管理系统通信。
附图说明
在下文中参照附图进一步描述本发明的示例,附图中:
图1示出根据示例的管理系统的示例。
图2示出根据示例的方法的示例。
图3示出用于在打印生产过程中使用的作业单的示例。
图4示出由提取模块执行的方法的示例。
图5a示出作业单的一部分的示例。图5b示出表示图5a的作业单的一部分的html代码的示例。
图6a和图6b示出作业单的一部分的示例。图6c示出提取的信息的示例。
图7示出根据一个示例的由提取模块执行的方法的示例。
图8示出基于图5a的示例提取的且格式化的参数的示例。
具体实施方式
打印服务提供商可定义作业的工作流。一个或多个打印服务提供商的每项作业可具有不同工作流。生产管理器可从一个或多个打印服务提供商收集关于所有作业的数据,并且可提供优化工具以组织工作流并向各作业分配资源。在某些示例中,作业是打印生产作业。如本文所使用的,打印生产作业描述例如一客户的一组工作,并且在某些情况下可包括各种相关的和关联的处理步骤,用以生产一个或多个打印产品。相比之下,本文使用的术语“打印作业”用来描述要被打印且采用打印就绪形式的电子存储文档(或与之类似)。打印作业可以例如是在打印队列中的文档或即将被添加到打印队列中的文档。
在单个地点内,可存在具有用于过程控制的相应IT系统的各种装备。这些系统可利用不同软件,可能采用各种编程语言。在同一基础软件被用在两个或更多个系统上的情况下,可能使用不同的软件版本。为每个IT系统准备API会需要相当大的资源,对于不被支持的较旧的系统尤其如此。
某些过程控制系统生成描述特定作业的作业单。作业单可包含产品的基本信息和用于生产作业的员工所要求的所有其他信息。例如,在打印产品的生产中,可以为每个作业产生作业单。作业单可描述以下中的一个或多个:作业或产品的类型(例如“名片”或“广告小册子”)、过程控制信息(例如数量、页面大小、整饰、底面等)、客户信息(例如联系方式等)、交付详情(例如地址、到期日等)、生产步骤(诸如预处理、绑定等)或特种处理。该列表不是穷举的,并且可在作业单上提供其他信息。
图1示出根据示例的管理系统100的示例。该系统包括服务提供商IT系统110,其可以是遗留系统(legacysystem)。服务提供商IT系统生成作业单115,作业单115描述要执行的作业的细节。作业单115采用打印作业的形式,并且通常会被发送到打印机以提供作业单的复印件。
作业单115被虚拟打印机驱动器120接收,并且基于作业单115生成电子文档125。电子文档125表示作业单115。电子文档125可以是包括指令的文件,指令在被解译(例如通过计算机或处理器)时提供作业单115的可视化表示,例如适合于显示在屏幕上。在某些示例中,电子文档125可以是pdf(便携式文档格式)文件。虚拟打印机驱动器可以是现成的软件,诸如Amyunipdf打印机驱动器。
在某些示例中,还可由硬件打印机打印作业单115以生成作业单115的复印件。然而,在某些示例中,没有复印件产生。
电子文档125被提供给提取模块130,以从电子文档125提取一个或多个参数。从电子文档125提取的参数被译成可由生产管理器140解译的格式(例如文件类型和设置),并且随后,格式化的参数135被传递到生产管理器140。在某些示例中,格式化的参数是XML(可扩展标记语言)格式。
可在作业单115中提供生产管理器140所需的许多或所有信息。根据上述示例,作业单中的信息可被提供给生产管理器140而无需服务提供商系统110和生产管理器140之间的API。因此,根据某些示例,可以避免资源的高消耗和与产生API关联的长的集成时间。
某些示例允许与“遗留系统”集成而无需遗留系统适于与较新的生产系统一起工作。这可能在以下情况下是显著的优势:使用旧的或“不再被支持的”软件并且该软件不可能被容易地修改。
图2示出根据示例的方法200。方法200从210开始。在220处,虚拟打印机驱动器120接收作业单115,并且在230处,生成电子文档125。在240处,从电子文档提取参数,并且在250处,格式化参数。在260处,输出格式化的参数135,并且方法在270处终止。
图3示出用于在打印生产过程中使用的作业单的示例,作业单描述打印生产作业。作业单可包括例如:
●客户信息,诸如客户姓名、联系方式等。
●客户账户信息,诸如账户管理者、账号等。
●作业信息,诸如作业号、作业名称、到期日、数量等。
●打印/处理信息,诸如打印/处理方法、页面大小和数量、整饰信息(例如关于折叠、缝接、装订等)、印前信息、底面信息等。
●交付/派送信息,诸如交付地址、交付方法、到期日等。
●质量控制信息,诸如前检查信息、样张信息等。
图4示出由提取模块130执行的方法300的示例。方法从310开始。在320处,提取模块130接收作业单115的可视化表示(例如由可视化打印机驱动器120生成的电子文档125)。在330处,识别可视化表示中的一个或多个字段,并且在340处,使用所识别的字段来识别可视化表示的区域。在350处,从所识别的区域中提取一个或多个参数。在360处,格式化所提取的参数,并且在370处,输出(例如到生产管理器140)。该方法在380处终止。
如下面更详细描述的,可基于关键字、位置、格式等中的一种或多种而识别字段和/或参数。
在某些示例中,关键字可包括标题(例如栏目标题、字段名称等)。在某些示例中,关键字可包括特定格式的每个作业单上的相同的字,并且不会在作业单的实例间改变(例如与变量数据或参数不对应的字段名称)。
在某些示例中,相同或类似的关键字被用在不同格式的作业单115中。因此,可通过搜索常用关键字来检测关键字。常用关键字列表可以是预生成的,并且可搜索列表上的关键字。在某些示例中,可为特定格式的作业单115生成关键字的自定义列表。自定义列表可仅包括作业单115的格式所需的关键字。在某些示例中,自定义列表基于总的预生成列表,具有基于特定作业单115的附加关键字。
在某些示例中,格式信息可被用于识别字段或关键字。例如,图5a示出作业单115的一部分的示例,其中文本主要是在白色上的黑色,而某些标题则是黑色上的白色且具有更大文本。在此示例中,关键字可包括“Estimate”510和“ItemDesc”520、“JobDescription”530。图5b示出表示文本的上部(在黑色上的白色)行的html代码的示例。该代码包括该行的文本内容以及格式化和定位/位置信息。
可通过利用格式信息来简化关键字的识别,以识别关键字的可能的候选者,或者使能够仅搜索电子文档125的具体部分(即具有相关格式的那些部分)。例如,格式可以是根据预设定的规则预先确定的。
位置信息也可被用于识别字段。例如,在图5a中,“Job#”540位于文档的左上部。在某些示例中,位置相对于电子文档125的一个或多个其他特征的位置(即,在图像基于电子文档125生成时,所显示特征的显示位置)来确定。由于页面大小和方向可能改变,并且字段位置和大小可能在实例之间改变,因此相对位置可比绝对位置(例如以相对于页面边缘的固定单位定义)更加可靠。在某些情况下,作业单115可扩展到单个页面外,并且任何分页符的位置可在各实例之间改变。在图5a中,参数“PrintProof”550被定位在条形码560下面,并且这可用于识别该参数。
在某些示例中,表示作业单115的电子文档125可以采用其中作业单115上的文本信息中的至少一些被存储为计算机可读文本信息(即,以可由计算机直接解译为文本的格式存储,作业单的文本内容被编码为电子文档125中的文本)的格式。例如,电子文档125可以是文档标记语言,诸如html。在某些示例中,可由提取模块130以一种格式接收电子文档,并在提取参数之前转换成另一种格式。例如,可以以pdf格式接收电子文档125,并在提取参数之前转换成html格式。从pdf到html的转换可利用pdf2html命令。因此,在某些示例中,可通过搜索(例如通过使用正则表达式匹配)电子文档125的文本(即,描述页面格式和内容的文本)来确定关键字、格式和位置信息。
在某些示例中,电子文档125被提取模块130以其中文本不可由计算机直接可读的格式接收。在某些示例中,提取模块130可对作业单115的可视化表示(如由电子文档125表示)执行光学字符识别(OCR),以从电子文档125获取计算机可读文本,计算机可读文本表示作业单115中的信息。由OCR处理产生的计算机可读文本可包括关于作业单115中的对应文本的位置和格式的信息。
在某些示例中,所识别的作业单115的可视化表示的关键字和/或其他特征可被用作锚定以定义可从其中提取特定数据和/或参数的作业单115的区域。通过图示方式,图6a示出作业单115的一部分的示例。所示出的部分与JobDescription(作业描述)字段有关。根据此示例,具有在黑色上的白色文本格式(也可使用诸如文本大小和字体的其他格式信息)的关键字(文本字符串)“JobDescription”610被搜索。如图6b中所示,这通过定义区域640的上边界620和最左侧边界630,来定义区域640的左上部。在此示例中,上边界620被选择为紧靠文本“JobDescription”的下方,并且最左侧边界被选择为紧靠文本“JobDescription”的左侧。可预先确定用于相对于文本“JobDescription”放置这些边界的规范。
在这种情况下,选择具有相同格式的紧挨着“JobDescription”右侧的下一文本字符串来定义区域640的最右侧边界650。
通过查找“JobDescription”下方与“JobDescription”具有相同格式的文本字符串来设定下边界660。在这种情况下,通过文本“Pre-Press”确定下边界660。上边界620、下边界660、最左侧边界630和最右侧边界650定义区域640,图6b中以阴影示出。
在确定区域640之后,可提取与特定字段有关的参数(数据)(在图6b的示例中,与“JobDescription”字段有关的参数)。提取可包括滤除不在区域640内的所有文本,并且对剩余的字符串(即,区域640中的那些)进行排序。例如,可从上到下然后从左到右对区域640中的文本字符串进行排序。图6c示出所提取的信息的示例。排序的顺序可例如依赖于打印单115的语言的书写方向。
在参数(数据)已被提取时,参数(数据)可以以可被管理系统140理解的方式(例如以XML格式)进行格式化,并且随后被传递给管理系统140。
在某些示例中,使用算法从电子文档130中提取参数。在某些示例中,算法可以是脚本的形式,诸如PERL脚本。在某些示例中,可定义或确定一组规则(例如针对每个地点、每个客户或每个作业单格式的一组规则)。规则可存储在规则文件中,并且算法可访问规则文件以允许从与规则文件对应的作业单格式中识别并提取参数。例如,规则文件可以是XML格式。规则文件可定义要从其中提取参数的区域的关键字和边界。例如,规则可以以与图6a和图6b中给出的示例类似的方式来定义边界。规则可以基于关键字和格式,并且可相对于匹配的关键字/格式定义边界的位置。规则文件可指定要从作业单提取的字段。
在某些示例中,算法可以是通用的,使得相同的算法可大体上应用于任何作业单115,并且针对待处理作业单的每种格式创建适合的规则文件。
图7示出根据示例的由提取模块执行的方法700。该方法从710开始,并且在720处,打开或访问相关规则文件。在730处,应用规则文件中的规则以识别包括要提取的参数的区域。在740处,提取所识别的区域中的文本字符串。在750处,针对字段数据(例如由规则文件定义的字段数据)搜索所提取的文本字符串。在760处,对与搜索标准相匹配的数据进行排序,并且在770处,存储排序的数据。步骤780确定是否要应用任何进一步的规则,并且重复步骤750至780直至将所有规则应用到电子文档125。随后,在790处,输出排序的数据,并且该方法在795处终止。在某些示例中,该方法可包括转换电子文档的格式,诸如将收到的pdf文档转换成html,并且对html文档执行剩余的步骤。这种转换步骤可先于提取模块130对电子文档125的其他操作,例如在图7的示例中的730之前。770中的存储可包括将参数存储为XML格式。类似地,790处的输出可包括以XML格式输出。输出790可包括将格式化的参数提供到管理系统140。
图8示出基于图5a的示例提取的且格式化的参数的示例。
更一般地,在本文描述的示例中,服务提供商系统110可以是第一系统并且生产管理器140可以是第二系统。本文的示例与打印生产有关,但某些示例可应用到其他生产过程和应用。
本文的示例使用作业单115,但更一般地,可使用任何适合的报表。报表可包括关于生产过程的信息。在某些示例中,报表可包括要从一个系统传递到另一个系统的采用打印就绪形式的信息。
根据某些示例,可以从被设置成生成打印输出的第一系统(例如遗留系统)向第二系统提供数据或参数而不需要API。在与提供两个系统之间的通信关联的尝试和资源方面,这可提供显著的减少。生成API可能花费许多周的熟练工作,然而规则文件的生成仅花费几个小时。
电子文档可以是除pdf格式之外的格式。例如,电子文档可以是postscript(ps)格式、图像格式(位图、jpeg、tiff等)、或文档标记语言(例如html、TeX等)。
识别关键字、格式和位置可包括解析表示格式化的计算机可读文本字符串以及诸如作业单115的html描述(电子文档)的文本内容。
根据某些示例的设备可由处理设备体现,诸如CPU、专用计算设备、个人计算机、便携式电脑、平板电脑等。某些示例的方法可执行使用这种处理设备的指令。根据某些示例的方法可以以软件或固件、或两者组合的形式实现。根据某些示例,引起处理设备执行示例方法的指令可存储在非瞬态计算机可读存储介质上,诸如光盘、硬盘、闪盘驱动器等。
贯穿本说明书的描述和权利要求书,词语“包括”和“包含”以及它们的变形意味着“包括但不限于”,并且它们的目的不在于(且不)排除其他添加物、部件、整数或步骤。贯穿本说明书的描述和权利要求书,单数形式涵盖复数形式,除非上下文另外要求。具体地,在使用不定冠词的情况下,说明书应当被理解为考虑复数以及单数,除非上下文另外要求。
结合本发明的特定方面或示例描述的特征、整数、特性或分组将被理解为适合于本文描述的任何其他方面或示例,除非它们互不兼容。在说明书(包括任何随附的权利要求书、摘要和附图)中公开的全部特征和/或公开的任何方法或过程的所有步骤可以以任何组合形式进行组合,除了这些特征和/或步骤中的至少一些相互排斥情况。本发明不受限于任何前述示例的细节。本发明扩展到说明书(包括任何随附的权利要求书、摘要和附图)中公开的特征中的任何一个新颖的特征、或任何新颖的组合,或者扩展到公开的任何方法或过程的步骤中的任何一个新颖的步骤、或任何新颖的组合。
读者的注意力被导向与本申请的说明书同时提交或在之前提交的所有文件和文档,并且这些文件和文档与本说明书一起向公众公开,且本文通过参考结合了所有这些文件和文档的内容。
Claims (15)
1.一种数据传输系统,包括:
虚拟打印机驱动器,用于从第一系统接收报表,并且用于生成表示所述报表的电子文档,所述报表采用打印作业的形式;以及
提取模块,用于从所述电子文档提取参数,以第一格式格式化所述参数,并且将采用所述第一格式的所述参数提供到第二系统。
2.根据权利要求1所述的数据传输系统,其中所述电子文档包括指令,所述指令在被解译时提供所述报表的可视化表示。
3.根据权利要求2所述的数据传输系统,其中所述提取模块用于识别所述可视化表示中的关键字、格式信息和位置信息中的至少一种。
4.根据权利要求3所述的数据传输系统,其中所述提取模块用于:
识别所述可视化表示中的关键字;
基于所述关键字的位置识别区域;以及
从所识别的区域中提取参数。
5.根据权利要求4所述的数据传输系统,其中所述提取模块用于使用格式信息来识别所述区域。
6.根据前述权利要求中任一项所述的数据传输系统,其中所述报表在被打印时用于包括所述参数的文本描述。
7.根据前述权利要求中任一项所述的数据传输系统,其中所述第一系统是打印服务提供商,所述报表描述打印生产作业,并且所述第二系统是生产管理器。
8.根据前述权利要求中任一项所述的数据传输系统,其中所述报表是作业单。
9.一种系统,包括:
打印服务提供商系统,用于生成采用打印作业形式的报表;
虚拟打印机驱动器,用于接收所述报表,并且用于生成表示所述报表的电子文档;
提取模块,用于从所述电子文档提取参数,并且用于以第一格式格式化所述参数;以及
生产管理器,用于从所述提取模块接收采用所述第一格式的所述参数。
10.一种传输数据的方法,所述方法包括:
在虚拟打印机驱动器处从第一系统接收报表,所述作业单采用打印作业的形式;
由所述虚拟打印机驱动器生成表示所述报表的电子文档;
从所述电子文档提取参数;
以第一格式格式化所述参数;以及
将采用所述第一格式的所述参数提供到第二系统。
11.根据权利要求10所述的方法,其中所述电子文档包括指令,所述指令在被解译时提供所述报表的可视化表示。
12.根据权利要求11所述的数据传输系统,其中所述提取包括以下至少之一:识别所述可视化表示中的关键字、识别所述可视化表示中的格式信息和识别所述可视化表示中的位置信息。
13.根据权利要求12所述的数据传输系统,其中所述提取包括:
识别所述可视化表示中的关键字;
基于所述关键字的位置识别区域;以及
从所识别的区域中提取参数。
14.根据权利要求11-13中任一项所述的数据传输系统,其中所述报表在被打印时用于包括所述参数的文本描述。
15.根据权利要求11-14中任一项所述的数据传输系统,其中所述第一系统是打印服务提供商,所述报表描述打印生产作业,并且所述第二系统是生产管理器。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2013/057472 WO2014166531A1 (en) | 2013-04-10 | 2013-04-10 | Data transfer system, method of transferring data, and system |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105308554A true CN105308554A (zh) | 2016-02-03 |
CN105308554B CN105308554B (zh) | 2019-08-06 |
Family
ID=48143269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380077280.XA Expired - Fee Related CN105308554B (zh) | 2013-04-10 | 2013-04-10 | 数据传输系统、传输数据的方法、以及系统 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9727287B2 (zh) |
EP (1) | EP2984554A1 (zh) |
CN (1) | CN105308554B (zh) |
WO (1) | WO2014166531A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926587A (zh) * | 2021-02-19 | 2021-06-08 | 北京大米未来科技有限公司 | 一种文本识别的方法、装置、可读存储介质和电子设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10891086B2 (en) | 2019-03-04 | 2021-01-12 | Ricoh Company, Ltd. | Job ticket conflict resolution for print jobs |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1225484A (zh) * | 1998-01-22 | 1999-08-11 | 富士通株式会社 | 地址识别设备和方法 |
CN1367460A (zh) * | 2001-01-24 | 2002-09-04 | 富士通株式会社 | 字符串识别装置、字符串识别方法及其存储介质 |
CN1605081A (zh) * | 2001-12-17 | 2005-04-06 | Zih公司 | Xml打印机系统 |
CN101216828A (zh) * | 2007-12-27 | 2008-07-09 | 北大方正集团有限公司 | 一种图像文件转换方法及装置 |
US20110080604A1 (en) * | 2009-10-06 | 2011-04-07 | Yue Liu | Methods and structure for substantially automated device capabilities file generation using xml schema |
CN102207837A (zh) * | 2011-04-26 | 2011-10-05 | 北京猛犸科技有限公司 | 一种基于虚拟打印方式获取数据的方法及系统 |
CN102681804A (zh) * | 2011-03-04 | 2012-09-19 | 佳能株式会社 | 图像处理装置及图像处理方法 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4965763A (en) * | 1987-03-03 | 1990-10-23 | International Business Machines Corporation | Computer method for automatic extraction of commonly specified information from business correspondence |
US4970554A (en) * | 1988-10-24 | 1990-11-13 | Xerox Corporation | Job processing system for high speed electronic copying/printing machines |
JP2523898B2 (ja) | 1988-10-24 | 1996-08-14 | ゼロックス コーポレーション | 原稿印刷ジョブ処理方法 |
US5051779A (en) * | 1990-10-10 | 1991-09-24 | Fuji Xerox Co., Ltd. | Job control sheet for image processing system |
US6336094B1 (en) * | 1995-06-30 | 2002-01-01 | Price Waterhouse World Firm Services Bv. Inc. | Method for electronically recognizing and parsing information contained in a financial statement |
US6487568B1 (en) * | 1997-07-18 | 2002-11-26 | Tesseron, Ltd. | Method and system for flowing data to an arbitrary path defined by a page description language |
US7394558B2 (en) | 2003-01-28 | 2008-07-01 | Hewlett-Packard Development Company, L.P. | Modifying printing based on print job clues |
JP2004272822A (ja) * | 2003-03-12 | 2004-09-30 | Seiko Epson Corp | 文字認識装置および文字認識方法並びにコンピュータプログラム |
ATE356389T1 (de) * | 2003-08-20 | 2007-03-15 | Oce Tech Bv | Dokumentenscanner |
JP2006065839A (ja) * | 2004-07-30 | 2006-03-09 | Canon Inc | 情報処理装置及び印刷情報処理方法、並びにコンピュータプログラム |
US7716198B2 (en) * | 2004-12-21 | 2010-05-11 | Microsoft Corporation | Ranking search results using feature extraction |
US7125179B1 (en) * | 2005-07-19 | 2006-10-24 | Xerox Corporation | System and method of evaluating print shop consolidation options in an enterprise |
US7907299B2 (en) * | 2005-12-16 | 2011-03-15 | Xerox Corporation | Method and server for processing an electronic workflow |
JP2007233913A (ja) * | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
US8319999B2 (en) | 2009-02-18 | 2012-11-27 | Ricoh Company, Ltd. | Method and apparatus for printing a locked print job |
US8896860B2 (en) | 2009-09-29 | 2014-11-25 | Xerox Corporation | Method and apparatus for transmitting image production device-related information to a remote service facility |
US9239952B2 (en) * | 2010-01-27 | 2016-01-19 | Dst Technologies, Inc. | Methods and systems for extraction of data from electronic images of documents |
US20120092722A1 (en) | 2010-10-18 | 2012-04-19 | Aventura Hq, Inc. | Managing printer feedback in a distributed printing environment |
US9092167B2 (en) | 2011-04-04 | 2015-07-28 | Hewlett-Packard Development Company, L.P. | Systems and methods for managing a print job |
US8902456B2 (en) * | 2011-07-11 | 2014-12-02 | Xerox Corporation | System to enable use of PDL metadata to drive printing outcomes |
US8755595B1 (en) * | 2011-07-19 | 2014-06-17 | Google Inc. | Automatic extraction of character ground truth data from images |
JP5871521B2 (ja) * | 2011-08-26 | 2016-03-01 | キヤノン株式会社 | 印刷データ処理方法、印刷データ処理装置及びプログラム |
-
2013
- 2013-04-10 EP EP13717745.7A patent/EP2984554A1/en not_active Withdrawn
- 2013-04-10 WO PCT/EP2013/057472 patent/WO2014166531A1/en active Application Filing
- 2013-04-10 CN CN201380077280.XA patent/CN105308554B/zh not_active Expired - Fee Related
- 2013-04-10 US US14/782,760 patent/US9727287B2/en not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1225484A (zh) * | 1998-01-22 | 1999-08-11 | 富士通株式会社 | 地址识别设备和方法 |
CN1367460A (zh) * | 2001-01-24 | 2002-09-04 | 富士通株式会社 | 字符串识别装置、字符串识别方法及其存储介质 |
CN1605081A (zh) * | 2001-12-17 | 2005-04-06 | Zih公司 | Xml打印机系统 |
CN101216828A (zh) * | 2007-12-27 | 2008-07-09 | 北大方正集团有限公司 | 一种图像文件转换方法及装置 |
US20110080604A1 (en) * | 2009-10-06 | 2011-04-07 | Yue Liu | Methods and structure for substantially automated device capabilities file generation using xml schema |
CN102681804A (zh) * | 2011-03-04 | 2012-09-19 | 佳能株式会社 | 图像处理装置及图像处理方法 |
CN102207837A (zh) * | 2011-04-26 | 2011-10-05 | 北京猛犸科技有限公司 | 一种基于虚拟打印方式获取数据的方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926587A (zh) * | 2021-02-19 | 2021-06-08 | 北京大米未来科技有限公司 | 一种文本识别的方法、装置、可读存储介质和电子设备 |
CN112926587B (zh) * | 2021-02-19 | 2024-03-29 | 北京大米未来科技有限公司 | 一种文本识别的方法、装置、可读存储介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
US9727287B2 (en) | 2017-08-08 |
US20160041802A1 (en) | 2016-02-11 |
CN105308554B (zh) | 2019-08-06 |
WO2014166531A1 (en) | 2014-10-16 |
EP2984554A1 (en) | 2016-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5623079B2 (ja) | ハード・コピーの書式からの書式定義の自動発生 | |
US9613267B2 (en) | Method and system of extracting label:value data from a document | |
US8705081B2 (en) | System and method for including input method information on a printed document | |
CN101443790A (zh) | 数字图像中的非回流内容的有效处理 | |
US20100302604A1 (en) | System and method for setting data extraction fields for scanner input | |
JP2009224958A (ja) | 業務手順推定システム及びプログラム | |
US9143628B2 (en) | Quality checks for printed pages using target images that are generated external to a printer | |
CN101257554A (zh) | 文档处理装置、文档处理系统和文档处理方法 | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
CN1398378A (zh) | 具有固定目录和可变数据的成像文档 | |
US8049921B2 (en) | System and method for transferring invoice data output of a print job source to an automated data processing system | |
EP2884425B1 (en) | Method and system of extracting structured data from a document | |
JP2007058622A (ja) | 文書管理装置及び文書管理方法 | |
JP2013164740A (ja) | 会計情報読取りシステム、会計情報読取り方法、及びプログラム | |
US20130063769A1 (en) | Information management apparatus and method, information management system, and non-transitory computer readable medium | |
US7857209B2 (en) | Print system, information processing apparatus, print log information extraction method, and program | |
US7454397B2 (en) | Method and system for classifying print product descriptions | |
JP2020181369A (ja) | 書類読取システム | |
JP2007058621A (ja) | 文書管理装置及び文書管理方法 | |
CN105308554A (zh) | 数据传输系统、传输数据的方法、以及系统 | |
US20110102860A1 (en) | Device for identifying types of document files | |
CN103895386B (zh) | 装订方法和装置 | |
US20100023517A1 (en) | Method and system for extracting data-points from a data file | |
US8234237B2 (en) | System and method for automatic return letter generation | |
US20140246486A1 (en) | Printing barcodes from an enterprise resource planning (erp) system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190806 Termination date: 20210410 |