CN1664810A - 辅助表格填充 - Google Patents

辅助表格填充 Download PDF

Info

Publication number
CN1664810A
CN1664810A CN2005100531726A CN200510053172A CN1664810A CN 1664810 A CN1664810 A CN 1664810A CN 2005100531726 A CN2005100531726 A CN 2005100531726A CN 200510053172 A CN200510053172 A CN 200510053172A CN 1664810 A CN1664810 A CN 1664810A
Authority
CN
China
Prior art keywords
field
user
unlabelled
medium
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2005100531726A
Other languages
English (en)
Inventor
T·T·克里斯蒂安松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1664810A publication Critical patent/CN1664810A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • EFIXED CONSTRUCTIONS
    • E03WATER SUPPLY; SEWERAGE
    • E03FSEWERS; CESSPOOLS
    • E03F5/00Sewerage structures
    • E03F5/14Devices for separating liquid or solid substances from sewage, e.g. sand or sludge traps, rakes or grates
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02BHYDRAULIC ENGINEERING
    • E02B5/00Artificial water canals, e.g. irrigation canals
    • E02B5/08Details, e.g. gates, screens

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Water Supply & Treatment (AREA)
  • Civil Engineering (AREA)
  • Structural Engineering (AREA)
  • Public Health (AREA)
  • Hydrology & Water Resources (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mechanical Engineering (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Manufacture And Refinement Of Metals (AREA)
  • Treatment Of Water By Ion Exchange (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

揭示了帮助辅助用户填充表格的系统和方法。本发明可解析未标记的媒质,例如email等等,以识别可被用于填充表格的元素。所识别的元素可被自动插入到表格中对应的字段中,且状态指示符可与之相关联并向用户指示以警告用户需要对表格中特定的字段进行审阅。此外,未标记的媒质和表格可被并发地呈现给用户以帮助用户在辅助表格填充期间进行监督以及/或者互动。

Description

辅助表格填充
技术领域
本发明一般涉及计算机,更具体地说,涉及帮助完成计算机表格的系统和方法。
背景技术
计算机和网络技术从高花费、低性能的数据处理系统向低花费、高性能的通信的演化,问题解决和娱乐系统提供了一种经济有效的、省时的方式来减少处理每天的任务,诸如书信往来、付账、购物、预算以及信息采集的负担。例如,一通过有线或者无线技术接入到互联网的计算系统可向用户提供一信道,该信道可近乎即时地接入到来自网页库和分布在全球的服务器的丰富的信息,只需用户手指轻点。
最近的研究表明大约7000万工人(美国工作的成年人中的59%)一般将完成表格作为他们工作责任的一部分。对于这7000万工人来说,至少25%一般填充电子表格(例如,在计算机上),并且这个百分比每天都在增加。因此,加入到表格中的数据显示在计算机的显示器上是一个很普通的动作。填充表格是单调、耗时并且高度受到人类错误的影响。因此,在本领域中对于帮助更快更准确进行表格填充的系统和方法存在未满足的需求。
发明内容
下面展现了对于本发明的简单的概述,以提供对于本发明的一些方面的基础理解。该概述不是对于本发明的广泛的综述。其不是为了识别本发明的关键/确定性的元素或者描绘本发明的范围。其目的仅仅是为了以一种简单的形式展现本发明的一些概念,并作为之后展现的更加详细的描述的前序。
本发明提供通过使用存在于未标记的文本格式(例如,email文本、web页、以及/或者其他计算机可读格式)中的数据来帮助辅助用户快速填充计算机表格的系统和方法。按照本发明的一方面,用户可从,例如用户所接收的email中选择未标记的文本。该未标记的文本可在未标记媒质图形用户接口(GUI)的文本框中显示给用户,并可被解析以识别潜在的用户在填充表格的字段时感兴趣的元素。例如,如果email包含诸如人名、城市、州…的项目,则这些名称可被识别为潜在感兴趣的元素。此外,这些名称可被放置在它们在通过表格GUI显示给用户的表格中的相应的字段中。表格GUI和未标记的媒质GUI可被并发地显示给用户。
按照本发明的另一方面,用户可验证所识别的元素是否被精确地插入到它们在表格中对应的字段中。例如,色彩标示可被用于表示表格中一个具体元素和一个具体字段之间的联系,例如,当填充(populating)联系表时,被识别为名的未标记的文本被用蓝色高亮显示(highlight),而对应的表格中的“名”字段可被以蓝色显示给用户。用户将高亮显示的名下拉到名字段中,或者更有效地,该系统可自动将名插入到其字段中。
按照本发明的相关方面,状态标示可与表格中的每一个字段相关以警告用户任何潜在的错位的信息,以这种形式,用户可验证所识别的元素是否被正确地插入到正确的字段中。例如,诸如“Lincoln”的元素可被插入到“姓”字段中,但也可以被插入到“城市”字段中。与名字“Lincoln”所插入的字段相邻的状态指示器可警告用户要求对插入到该字段中的内容的正确性进行验证。状态指示器还可以使用颜色来视觉地警告用户关于字段信息的状态(例如,用户验证、回顾……的重要性等级)。
按照本发明的另一方面,人工智能技术以及/或者反馈/前馈信息可被用于帮助自动插入到表格字段中的元素增加可信度等级。例如,隐性马尔可夫(Markov)模型是使用隐性和显性随机变量的概率论(probabilistic)模型的一种类型。这样的模型可被用于增加本系统和方法插入未标记的媒质元素至表格字段中的效率。按照这种方式,用户的参与可潜在地被降低到仅仅在保存并打印所完成的表格之前确定表格中的信息是否是正确的。
按照本发明的另一方面,校正传播可被用于至少部分基于由用户进行的单个字段的校正而帮助校正各个字段的信息。例如,被验证为正在由用户校正以及/或者已经由用户校正的信息可被估计以帮助关于其他信息是否被正确分配给一给定字段的推断。按照这种方式,对一个字段输入的校正传播到其他的字段。
为了达到上述的以及相关的目的,本发明的某些所示出的方面在此处结合下面的说明以及附图进行描述。然而,这些方面示出了仅仅是本发明的原理可被应用的各种方法中的一小部分,而本发明试图包括所有的方面以及它们的等价内容。本发明的其他优势和创新的特征可从下面结合附图考虑的对本发明的详细说明中变得明显。
附图说明
图1是说明一种按照本发明的一方面帮助辅助用户填充表格中的字段的表格填充接口系统100。
图2是说明按照本发明的一方面帮助辅助填表的系统200。
图3是说明包括按照本发明的一方面帮助辅助填表的人工智能组件的系统300。
图4是说明帮助辅助用户填充表格中的字段的隐性马尔可夫模型的一个示例400。
图5是说明本发明在辅助用户填充表格时的效率的柱状图500。
图6是说明按照本发明的一个方面的方法600。
图7是说明按照本发明的一个方面的方法700。
图8是说明按照本发明的一个方面的方法800。
图9是说明按照本发明的一个方面的方法900。
图10和11是说明按照本发明的一个方面的计算环境1000和1100的一个示例。
具体实施方式
本发明现在参考附图进行描述,其中相似的标记被始终用于表示相同的元素。在下面的描述中,为了简明,说明了许多具体的细节以提供对于本发明的彻底的理解。然而,可以证明本发明可以不具备这些具体的细节而被实现。在其他的情况下,公知的结构和设备以框图的形式示出以帮助表示本发明。
如在本申请中所使用的,术语“组件”被用于表示计算机相关实体、或者硬件、硬件和软件的组合、软件、或者正在执行的软件。例如,组件可以是但是不限于在处理器上运行的进程、处理器、对象、可执行的软件执行线程、程序,以及/或者计算机。作为说明,在服务器上运行的应用程序以及该服务器可以是计算机组件。一个或多个组件可驻留在进程中以及/或者执行线程中而组件可被本地放置于一个计算机以及/或者分布在两个或更多个计算机中。“线程”是操作系统核心调度用于执行的进程中的一个实体。如在本领域中所熟知的,每个线程具有相关的“环境”,该“环境”是和线程的执行相关的易失性数据。线程的环境包括系统寄存器的内容和属于该线程的进程的虚拟地址的内容。因此,包含线程的环境的真实数据在其执行时改变。
如这里所使用的,术语“推断”一般是指从一组通过事件以及/或者数据捕获的观察中推出或者推断系统、环境、以及/或者用户的状态的过程。例如,推断可被用于识别一具体的环境或者动作、或者可产生在状态上的概率分布。推断可以是或然性的(probabilistic)——也就是说,在感兴趣的状态上的概率分布的计算是基于数据和事件的考虑。推断还指所使用的用于从一组时间以及/或者数据中组成高等级事件的技术。这些推断会导致从一组观察的事件以及/或者存储的事件数据中构建新的事件或者动作,不论该事件是否在紧靠的时间附近(close temporal proximity)相关,以及不论该事件和数据是否来自一个或数个事件和数据源。
最近的研究表明大约7000万工人(美国工作的成年人中的59%)一般将完成表格作为他们工作责任的一部分。对于这7000万工人来说,至少25%一般填充电子表格(例如,在计算机上),并且这个百分比每天都在增加。因此,加入到表格中的数据显示在计算机的显示器上是一个很普通的动作。填充表格是单调、耗时并且高度受到人类错误的影响。在许多情况下,被用于填充表格中的字段的数据可容易地以计算机可读的格式供使用,诸如在文本文件、email、以及或者web页上。从这样的数据中识别和提取(例如,解析)相关信息的技术是存在的,但是是高度不可靠的,并且因此不是很合适于直接填充数据库或者添加元数据(metadata)。例如,自然语言处理技术以及/或者其他的人工智能(AI)技术可识别计算机可读文档中的具体类型的信息元素,例如名字、地址、电话号码等等,但是这样的方法不能避免错误。本发明允许用户比通过传统的系统和方法更快地输入数据到电子表格中。此外,本发明通过允许使用不可靠的解析技术和允许用户视觉验证并校正由解析器造成的错误来允许用户在存在未标记的计算机可读数据时更加有效地输入信息。
图1是说明了帮助电子表格的辅助表格填充的系统100。按照说明,表格填充接口(FFI)102被展现给用户以辅助用户通过传输未标示的数据至标示的数据(例如,XML-格式的数据,…),或者至数据库中来填充表格。FFI 102(此处也称为“屏幕”)包括表格数据图形用户接口(GUI)104(此处也称为“表格”)而未标示的媒质GUI 106(此处也称为“文本框”),它们可在屏幕上位于相互紧临的位置以方便用户。表格数据GUI 104包括数个字段108,这样每个字段被保留用于具体的信息片(piece of information)(例如,名、姓、街道地址、邮政编码……)。状态指示器110可与每一个字段108相关地操作以通知用户在具体字段中的信息的当前状态。此外,可信度指示符112可与每一个字段108相关以通知用户关于与字段108中的信息的正确性相关联的概率。
在图1中说明的FFI 102示出了用于输入联系信息的接口。起初,表格数据GUI 104(例如,典型的联系信息表格、货物以及/或者服务定购表格…)以及空的文本框106被展现给用户。用户可复制文本段至文本框106(例如,通过从email剪切和复制…),而系统100可试图分类、或者解析未标记的数据以识别在未标示的数据中的元素。当未标示的数据被解析时,系统100可在具有所识别的元素的计算机终端上填充表格104中的字段108。文本框106和表格104中的原始未标记的数据可被同时显示在屏幕102上,而未标记的数据可被增加以视觉地表示相关性(例如,使用色彩编码……)。例如,系统100可使用紫色来表示未标示文本中的某个元素已经被用于填充表格104中的地址字段。按照该示例,其他的色彩(例如,橙色)可被用于标示系统100已经确定具体的文本是潜在的感兴趣的,但是可信度等级并不足以高到将其分配到字段中,并且,因此用户可以做出确定是否具体的文本是否应该被分配给具体的字段。
按照本发明的相关方面,用户可在表格的一部分中进行填充,而系统100可在可供使用的未标记的计算机可读媒质中搜索,定位潜在的字段输入候选,显示该定位的文档以及/或者元素,并填充表格中的剩余字段。以这种方式,可执行部分的自动填充。
用户可快速验证解析的正确性。如果解析存在错误,用户可校正它们(例如,通过从未标记的文本中拖曳元素并将它放置在表格的相应字段中、通过直接在字段中键入、通过在文本框106中校正文本等等)。此外,解析协议可利用侧信息(side information),例如由用户提供的校正或者添加。例如,如果用户输入信息至字段或者校正了起始的解析,该用户可指令系统重新解析该未标记的文本并依靠由用户提供的侧信息(通过点击图1中标有“AutoFill”的按钮),继续本发明,名称“Charles Stanly”说明“Charles”是特定联系人的名而“Stanely”是特定联系人的姓。然而,用户可发现联系人的姓和名颠倒了,无论是由于意外还是其他原因,并且可使用上述的拖-放技术将“Stanely”放置到名字段中。此外,字段可被提供下拉式菜单,以使在文本框中显示的未标记数据包含多余一个的名时,例如,一个名可被显示在名字段中而其他可在下拉式菜单中被提供,这样用户可简单地打开菜单(例如,点击,拖曳…)并在字段要求校正时选择一其他名称(alternate name)。
在进行该动作时,系统可自动将“Chaeles”移动到姓字段中,降低填充表格所要求的用户动作的数量且同时增加姓字段的可信度等级,这是基于用户验证“Stanley”是联系人的名且因而不会是联系人的姓的事实。这样的自动粘贴用户动作(post-user-action)字段填充是校正传播的一个示例。
在一些情况中,允许用户识别哪一个字段可被用作侧信息(例如在所填充的字段中的信息以及/或者由用户校正的信息…)是有利的,且哪个字段是系统允许覆盖的(例如,不包括侧信息的字段)。这种允许可通过状态指示器110来辅助,状态指示器110可指示用户没有在该字段上采取动作、或者已经验证了、校正了、以及/或者输入了信息至该字段。例如,每个字段的信息可以是“未填充以及未验证”、“自动填充但是未验证”、或者“用户或者自动填充并且验证”。
例如,“未填充以及未验证”的字段可以是第一色彩(例如,红色)的状态指示器110。如果系统100填充了字段(例如,字段是自动填充的),之后状态指示器可升级至第二状态指示器色彩(例如,黄色)以警告用户字段已经被自动填充但是未经验证。这样的指示器可警告用户一种要求用户验证的情况,但是不需要校正的情况,如上述的“Charles Stanley”例子。如果用户验证在字段中的信息是正确的,状态指示器可被升级到第三色彩(例如,绿色)以表示状态“填充并验证”。继续该示例,如果用户输入信息至具有红色状态指示器的字段,则状态指示器可被直接升级至绿色,因为用户已经填充了该字段并通过完成该动作来验证该信息是正确的。因此该字段现在是“填充并验证的”。此外,另一个字段的可信度可被更新以及/或者通过用户验证以及/或者第一字段的校正来改善。例如,在“Charles Stanley”的示例中,如果没有验证哪一个名称是名以及/或者哪一个名称是姓,姓字段可具有黄色状态指示器。如果用户验证“Charles”是正确的名,则系统100将名字段的状态升级到“(用户)填充并验证”(例如,具有绿色的状态指示器)。因为用户已经验证“Charles”是名(并且因而不会是姓),系统可将“Stanley”保留在姓字段中,且因此姓字段的可信度指示器也被从黄色升级到绿色(例如,自动填充并验证)。
按照本发明的相关方面,色彩编码的可信度指示器112可与具体的字段108相关(例如,字段的边界色彩,字段以及/或者文本的背景色彩,等等)。例如,难以让系统100以高可信度因素填充的字段可被按照可向用户表示该字段少于所希望的可信度阀值的色彩方案标记。可信度指示符可以不同灰度的色彩阴影表示从0到1的值。此外,该示例中的可信度指示器112可以是,例如,实心(solid)指示器、闪烁(blinking)指示器、全亮度、对比度等等的淡进淡出(fade in and out)指示器、或者任何可按照所论指示字段可信度的不同等级的其他适合的指示器方案。
按照一个示例,包括“@”或者“.com”的信息片可被自动插入到表格中的“email”字段。类似的,具有格式(nnn)nnn-nnnn、nnn-nnn-nnnn、nnn-nnnn等等的信息,其中n是整数,该信息可被以高度的可信度自动插入到电话号码字段中。需要理解高可信度指示可与其他类型的信息相关,该信息是针对这些信息将要被写入的字段中,而这些信息的自动插入不限于email以及/或者电话号码字段。
图2是说明了帮助辅助表格填充的系统200,包括控制组件202,其可操作的耦合于未标示的媒体GUI 204、表格数据GUI 206、以及解析组件208中的每一个。控制组件202可接收并分析未标记的数据以帮助填充表格中的字段。这些未标记的字段可通过未标记的媒体GUI 204展现给用户。未标记的数据可以是,例如,由用户粘贴到未标记的媒体GUI 204的email摘录。在将未标记的数据粘贴到未标记的媒体GUI 204中后,数据可被保存在未标记的媒体存储器210中。解析组件208可解析保存在未标记的媒体数据存储器206中的未标记的数据以确定潜在的表格填充数据(例如,诸如名称的合适的名词、诸如地址、电话号码、邮政编码的数字数据组…),它们可被保存在表格数据存储器212中。保存在表格数据存储器212中的数据可被用于填充表格中的字段,并通过表格数据GUI 206展现给用户。如结合图1所描述的,之后用户可验证或者校正表格中个别字段,且这些验证以及/或者校正可被作为侧信息保存在侧信息存储器214中。解析组件208可使用所保存的侧信息来按照由用户进行的验证以及/或者改变来升级表格数据存储器212。在这种方式中,文本分类以及/或者标记可被更新,其允许和自动填充的字段相关的状态等级响应用户验证以及/或者字段的校正而升级。
需要理解此处描述的数据存储(例如,存储器)组件可以是易失性或者非易失性存储器,或者可包括易失性或者非易失性存储器两者。为了说明而不是限制,非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电子可编程ROM(ROM)、电子可擦写ROM(EEPROM)、或者闪存。易失性存储器可包括随机存取存储器(RAM),其是作为外部高速缓存。为了说明而不是限制,RAM可以多种形式存在,诸如同步RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据速率SDRAM(DDR SDRAM)、增强SDRAM(ESDRAM)、同步链路DRAM(SLDRAM)、以及直接存储器总线RAM(DRRAM)。本系统和方法的存储器试图包括,但不限于这些以及任何其他合适类型的存储器。
图3说明了按照本发明的一方面并且以类似于在上面参考图2描述的方式来帮助辅助表格填充的系统300。系统300包括控制组件302,其可操作地耦合于未标示的媒体GUI 304、表格数据GUI 306、以及解析组件308中的每一个。控制组件302分析未标记的数据以填充表格中的字段。这些未标记的字段可通过未标记的媒体GUI 304展现给用户。未标记的数据可以是,例如,由用户粘贴到未标记的媒体GUI 304的email摘录。在将未标记的数据粘贴到未标记的媒体GUI 304中后,数据可被保存在未标记的媒体存储器310中。解析组件308可解析保存在未标记的媒体数据存储器306中的未标记的数据以确定潜在的表格填充数据(例如,诸如名字的合适的名词、诸如地址、电话号码、邮政编码的数字数据集合…),它们可被保存在表格数据存储器312中。保存在表格数据存储器312中的数据可被用于填充表格中的字段,并通过表格数据GUI 306展现给用户。如结合图1所描述的,然后用户可验证或者校正表格中个别字段,且这些验证以及/或者校正可被作为侧信息保存在侧信息存储器314中。解析组件308可使用所保存的侧信息来按照由用户进行的验证以及/或者改变升级表格数据存储器312。在这种方式中,与自动填充字段相关联的可信度以及文本分类和/或标记可被更新,以响应用户验证以及/或者字段的校正而有利于校正传播。此外,解析组件308可操作地耦合于人工智能(AI)组件316,其可做出针对大多数可输入特定数据片的字段的推断。
如这里所使用的,术语“推断”一般是指从一组通过事件以及/或者数据捕获的观察中推出或者推断系统、环境、以及/或者用户的状态的过程。例如,推断可被用于识别一具体的环境或者动作、或者可产生在状态上的概率分布。推断可以是或然的(probabilistic)——也就是说,在感兴趣的状态上的概率分布的计算是基于数据和事件的考虑。推断还指所使用的用于从一组时间以及/或者数据中合成高等级事件的技术。这些推断会导致从一组观察的事件以及/或者保存的事件数据中构建新的事件或者动作,不论该事件是否在紧靠的时间附近(close temporal proximity)相关,以及不论该事件和数据是否来自一个或数个事件和数据源。多种分类方案以及/或者系统(例如,支持向量机器、神经网络、专家系统、Bayesian确信网络、模糊逻辑、数据融合(fusion)引擎…)可被与执行和本发明相关的自动以及/或者推断的动作相关联。此外,推断可被本发明使用,例如,基于隐性马尔可夫模型(HMM),就如下面将要推断图4讨论的,参考下文。
图4说明了按照本发明的一方面使用HMM来帮助辅助表格填充的方案400。HMM和其他的或然论模型可被用于从用户接口“回-信道”信息至一解析器以帮助校正传播,其允许在单个字段由用户校正时校正邻居字段。HMM是具有一组状态Q、一输出字母,O、转换概率,A、输出概率,B以及初始状态概率,П的有限状态机变量。当前的状态一般不是可观察的。相反,每个状态可产生具有特定概率,B的输出。通常状态Q以及输出O是被了解的,所以HMM被认为是三元组的,(A、B、П),具有下列的属性:
A=[aij=P(qj at t+1|qi at t)]
其中P(a|b)是对于一给出的b的条件概率,t≥1,以及qi∈Q。
非正式的,A是下一个状态是qj而给定当前状态是qi的概率。
B=[bik=P(ok|qi)]
其中ok∈Q。
非正式的,B是输出是ok而给定当前状态是qi的概率。
П=[pi=P(qi at t=1)]
按照图4,示出了不同的随机变量Xl至Xn,它们可表示表格中的字段。这些字段可以是字段组中的一部分,包括{名、后缀(suffix)、姓、街道地址号、街道名称、城市、州、邮政编码、电话号码、email地址…}。还需要理解可被输入到其中的X字段的组以及信息片Y不限于上面描述的示例信息字段,但是还可包括任何其他合适的信息片以及/或者字段。Y可表示对应于给出的X的真实信息片,这样如果Y1等于“John”,且如果X1=“first name”为真(例如,P(X1=first name=1)),则“John”可以插入到用X1所表示的字段中。类似的,如果Y2=“Smith”而X2=“last name”为真,则“Smith”可被插入到与X2相关联的字段中。因此,当Y的值是被观察到时,X仍然是隐性的。一般,概率分布将是被观察到的(例如,(P(X1=名)=0.23,P(X1=姓)=0.03,P(X1=城市名称)=0.093等等),这样显示具有最高分的标记(例如,按照该示例是“first name”)可被选择。这样的推断有利于寻找隐性变量的最佳设置。在隐性马尔可夫模型的情况下,可找到最有可能的状态序列。例如:
arg max x 1 , . . . , x n p ( Y 1 . . . Y n | X 1 = x 1 , . . . X n = x n )
按照类似的示例,具体的X可和条件“5个数字”相关,这样如果Y具有7个数字(555-1234)则其将注册一较低的概率(例如,P(Y=555-1234|X=0.00001)用于具体的所论的X。相反的,包括诸如12345的信息Y将被注册一高的概率(例如,P(Y=555-1234)|X=0.9989)用于具体的X并可被插入到表格中相关的字段中。类似的,上面描述的7个数字的Y对于具有条件“7个数字”的X将注册高概率的结果。本发明可使用任何数量的可是的变量或者测试来确定哪一个具体的Y满足和具体X相关的条件以帮助辅助表格填充。
本发明可利用(capitalize)或然论模型的优势,诸如上述的HMM,其包含隐性和显性的随机变量,通过设置隐性变量(X)至对应具体的字段的标签的状态。例如,HMM中的Y随机变量是“显性”的随机变量,其中每个变量对应一个记号(token)。一个记号(token)是记号定界符(delimiter)(例如,空格、破折号、逗号等等)之间的文本的片段。例如,文本串“this-isa,test”将被记号化成:
“this”=记号1
“is”=记号2
“a”=记号3
“test”=记号4
1是隐性变量,X表示具有每一个允许的标记的记号的概率(例如,记号在标记上的分布)。在信息提取字段中,最通常的,由于没有使用“侧信息”,X仍然是非显性的。为了强迫或然论模型使用侧信息(例如,在具有用户提供的文本的文本字段的表格中),对应于用户提供的文本的记号可被搜索而对应的隐性变量X可被设置为对应于该字段的标记的状态。这可被视为设置p(X1=名)=1以及P(X1=姓)=0等等,并且在推断期间不进行更新。例如,如果用户键入“Smith”至表格的姓字段,可在所有的记号中进行搜索以查找“Smith”。之后,设置p(X2=姓)=1,并且在推断期间不更新概率分布。
校正传播还可以进一步完成将回信道信息从用户接口传送至解析器。在这种形式下,邻居字段可在单个字段由用户校正时被填充。如,本发明可使用基于规则的解析方法,其中简化版本的规则表示“如果姓字段是由用户设置,则在未标记的文本中查找名并且将紧靠在姓之前的单词标记为名”。也可以对应用于姓的规则。在这种形式下,对于名的校正“传播”至姓。需要理解此处描述的校正传播不限于姓和名,还可被应用于任何的以及所有相关类型的信息、文本等等。
此外,本发明可使用条件随机字段(CRF),其是HMM和最大熵模型两者的推广。CRF允许引入任意的非局部特征并捕获标记之间的独立性,允许估计所解析的信息片的可信度。在这种方式中,本发明可在信息具有高可信度等级时自动分配所解析的信息片至一字段,并可标示具有低可信度等级的信息片以供用户回顾以及/或者校正。
图5说明了随机不正确字段被校正前后CRF之间的关系的柱状图500。在填充表格期间,针对字段验证和校正的用户动作可被通过数个用户互动模型(UIM)预测以及/或者模型化。例如,在简单的情况中,UMI1,一用户可被展现一自动填充的表格并被要求校正所有的错误(例如,不进行校正传播)。因此,所要求的用户动作的数量等于在自动填充表格期间发生的错误的总数。
按照第2种情况,UIM2,假设一初始的自动字段分配,基于系统可起始校正传播,用户执行单一、随机选择的校正。如此反复直到所有的字段被校正。
按照第3种情况,UIM3,假设一初始自动字段分配,而用户在最少可信度不正确字段上进行校正。例如,可按照可信度(例如,按可信度指示符)视觉地向用户发出关于字段的警告直到错误被找到。校正传播可按照最少可信度字段执行,而用户可被提示校正任何剩下的错误。
表格填充一般要求完美的精确性。因此,所带来的好处可在无论何时填充时间减少了,还是对用户的认知负担减少了,或者两者减少时被认识到。本发明使用有效的测量,称为预期的用户动作数量(ENUA)来辅助其他的标准性能测量。ENUA被定义为正确填充表格中的所有字段所要求的用户动作的数量(例如,点击…)。ENUA可根据UIM而变化,如上面所描述的。为了表示ENUA,使用符号P(i:j),其是在i次人工校正之后错误j的数量的概率分布。该分布可使用图5中的柱状图表示:
例如,在UIM1下,ENUA为:
ENUA = Σ n = 0 ∞ nP ( 0 ; n )
其中P(0:n)是不正确字段(参考图2)上的分布。
例如,按照UIM2和UIM3模型,ENUA为:
ENYA 1 = ( 1 - P ( 0 ; 0 ) ) + Σ n nP ( 1 ; n )
其中P(0:0)是所有字段被正确地初始分配的概率而P(1:n)是在一个字段被校正之后表格中不正确字段的数量的分布。不同的分布是根据哪一个UIM被使用。ENUA1的上标1表示校正传播被执行了一次。
还是参考图5,表格被按照在每个表格中包含错误的字段的数量而分组。实心条表示在任何校正之前使用基于CRF的解析的结果,而虚框表示在一个随机不正确的字段被校正之后的分布。这样的信息可分别被用于估计P(0;n)和P(1;n)。
同时,为了解释简单,此处示出的一个或多个方法,例如以流程图的形式示出的,被作为一系列的动作示出并描述,需要理解并领悟本发明并不为动作的顺序所限,一些动作可按照本发明以不同的顺序出现以及/或者与其他在此处示出或者描述的动作同时出现。例如,熟悉本领域的人员将会理解和领悟方法也可以被展现为一系列相互关联的状态或者事件,诸如在一状态图中。此外,并不是所有的所示出的动作是实现按照本发明的方法所要求的。
图6是说明按照本发明的一方面用于辅助自动填充表格的方法600。在602,选择的未标记的媒质被插入到一未标记的媒质GUI中的文本框中。在604,插入的媒质被解析以确定可潜在被用于填充表格中的字段的元素。在606,状态可被分配给输入到字段中的元素并被指示给用户。例如,所选择的未标记的媒质,诸如“John Smith and Jane Doe will be at the convention nextweekend”包含两个名和两个姓。如果“John”被用于填充例如一联系人列表中的“名”字段,则其可与其状态指示符相关(例如,“填充但是未验证”),其可警告用户“John”可能不是在名字段中正确的(例如,期望的)输入。此外,“Jane”可通过下拉式菜单而变得对用户可用以帮助潜在的用户校正姓字段。指示符可以是,例如,紧靠名字段的色彩编码的状态指示符“亮”。继续该示例,一红-黄-绿协议可被用于指示不同的状态等级,其中红色表示字段未填充且未验证,黄色表示字段已填充但是未验证,而绿色表示字段被填充(或者自动填充或者由用户填充)并且验证。在本示例中,姓字段可具有黄色的状态指示器,表示姓字段被填充,但是姓“John”还没有被验证。
在608,用户被提醒验证以及/或者校正表格字段,而具体的表格字段展现了少于,例如绿色状态的任何东西(例如,在示例的情况中绿色表示填充且验证的状态)。然后,在步骤610,针对用户是否校正(例如,改变了)了任何信息做出确定。按照本示例,如果“John”不希望在“名”字段中输入,则用户可点击文本框中的“Jane”并拉曳“Jane”至姓字段以校正该输入。此外,“Jane”可从已经展现在该名字段中的下拉式菜单中选择。如果用户已经校正了任何的信息,则该方法可进入612,其中字段可以根据用户的输入作更新同时文本可被重新解析。本方法可被转换到606用作属性升级以及使数据输入到表格的字段中,该字段可以针对用户输入发生。如果用户在610没有校正信息,那么能在614作出一个确定针对是否用户验证了字段输入。如果用户没有在614验证字段输入,则该方法可转换到608以进一步提示用户在展现除了“填充且验证”以外的状态的字段输入上采取动作。如果用户在614验证精确的信息,那么其他的字段相应的属性标示可在616被更新。例如,“John”是姓字段所需要的输入,则指示符的状态可在616从黄色升级到绿色。
图7说明了根据本发明的一个方面帮助辅助用户填充表格的方法700。在702,所选择的未标记的媒质被粘贴到表格填充界面中的文本框中。在704,未标记的媒质被粘贴到所识别的潜在的元素中(例如,名称、地址、电话号码…),它们可被用于填充表格中的字段。在706元素可被输入,而状态可与输入的元素相关并显示给用户以表示特定的输入是否正确插入到相关的字段中。在708,针对是否所有的字段展现了最高可能性状态的确定被做出(例如,是否所有的字段是“填充并且验证”的)。如果所有的字段在708显示了“填充且验证”的指示,则用户不需要被提示采取行动而该方法可终止。然而,如果任何字段展现了少于“填充且验证”的状态,那么方法进入到710,其中用户被提示校正以及/或者验证任何有疑问的字段。在712,可针对用户是否已经校正了一个字段输入的确定被做出。如果是这样,则在714,表格字段可根据用户输入被更新,而文本框可被重新解析,在转换到706进行状态升级和将元素输入到字段之前。如果确定用户没有在712校正任何的字段,那么在714针对用户是否验证了有疑问的字段的确定可被做出。如果用户没有验证具有少于所希望的状态的字段,那么该方法可转换到710以进一步提示用户采取行动。如果在716确定用户已经验证了有疑问的信息,则在718字段可被更新且其相关的状态可被升级。
图8说明了按照本发明的一个方面的方法800,按照该方法802未标记的媒质被解析。在步骤804,隐性马尔可夫模型(HMM)被使用以确定可输入特定元素的正确字段。在806,元素被显示在具有一状态指示符的所确定的正确字段中。用户在808被提示验证和/或校正输入在字段中的信息。在810,作出针对用户校正是否被检测的确定,如果是这样则在812用户校正的字段以及通过校正传播而校正的其他字段可被更新,而状态也可因而升级。该方法然后转换到806,其中原素被显示而状态被按照用户输入而指示。如果校正没有在810被检测到,则在814针对用户验证是否发生的确定被做出。如果用户没有验证输入的信息是正确的,则该方法可转换到808以进一步提示用户采取行动。如果在814,确定用户已经验证了在有疑问的字段中的信息是正确的,则该方法进入到816,其中验证的元素被显示在正确地字段中,同时升级的状态也被显示。
图9说明了按照本发明的一个方面的方法900。在902,未标记的媒质被读取到未标记的媒质存储器中,在904,侧信息(例如,从用户动作,诸如数据输入、验证、校正…中收集的信息)被读取到侧信息存储器中。在906未标记的媒质可被解析以识别可潜在填充表格字段的元素。所识别的元素可在908被写入到别个数据存储器中。之后在910,所识别的数据可在表格GUI中的表格字段中显示给用户,在912,未标记的媒质GUI中的未标记媒质可与帮助辅助用户填充表格字段的视觉指示符一起被显示。例如:文本框中的名可被用一特定色彩(例如:橙色)色彩编码以表示它们可被输入到表格GUI的名字段中,该字段也用橙色进行色彩编码。按照另一个示例解析的未标记的包括一个“@”符号的文本可被编码成例如:蓝色,以表示该文本可被输入到表格GUI的“email”字段中,该GUI也是蓝色.
在914用户可被提示进行验证以及/或者校正在表格GUI的字段中的元素分配。然后,在916可作出决定再一次解析该未标记的媒质。如果做出了决定,则在918,用户输入被添加到侧信息存储器,而系统转换到906重新重复进行未标记的媒质解析和元素识别。如果确定在916没有附加的解析,则在920,表格数据存储器的内容可被写入到数据库或者文件中。
为了提供附加的环境用户实现本发明的多个方面,图10和11以及下述的讨论是为了提供一个合适的计算环境1000的简要、概括的描述,其中本发明的不同方面可被实现。虽然本发明在上面结合可在本地计算机以及/或者远程计算机上运行的计算机程序的计算机可执行指令的一般环境描述,本领域的技术人员将会认识到本发明也可以结合其他程序模块实施。一般,程序模块包括例程、程序、组件、数据结构等等,它们可执行具体的任务以及/或者实现具体的抽象数据类型。此外,本领域的技术人员还会认识到本发明的方法可在其他计算机系统配置中实现,包括单个处理器或者多个处理器的计算系统、迷你计算机、大型计算机、以及个人计算机、手持计算设备、基于微处理器以及或者可编程消费者电子设备,等等。其中的每一个可可操作地与一个或多个相关的设备通信。所示出的本发明的方面还可以在分布式计算环境中实现,其中特定的任务可由通过通信网络链接的远程处理设备执行。然而,本发明的一些,但不是全部的方面可在单个的计算机上实现。在分布式计算环境中,程序模块可位于本地以及/或者远程存储储存设备上。
如在该应用中所使用的,术语“组件”用于指计算机相关的实体,可以是硬件、硬件和软件的组合、软件、或者所执行的软件。例如,一组件可以是,但不限于在处理其上运行的进程、处理器、对象、可执行的执行线程、程序、以及计算机。为了说明,在服务器上的运行的应用程序以及/或者服务器可以是组件。此外,组件可包括一个或多个子组件。
参考图10,用于实现本发明的多个方面的示例系统环境1000包括传统计算机1002,其包括处理器单元1004、系统存储器1006、以及其耦合各种系统组件,包括将系统存储器耦合至处理器单元1004的系统总线1008。处理器单元1004可以是商业可用的或者专有的处理器。此外,处理器单元可被实现为由多余一个的处理器所形成的多处理器,例如可以是并行连接的。
系统总线1008可以是多种类型的总线结构中的任何一种,包括存储器总线或者存储器控制器、外围总线、以及使用诸如PCI、VESA、微通道、ISA、以及EISA(仅仅列出一小部分)的多种传统总线结构中的任何一种的本地总线。系统存储器1006包括只读存储器(ROM)1010和随机存取存储器(RAM)1012。包括帮助在计算机1002中的元件之间传递信息的基本例程,例如在启动期间的基本输入/输出系统(BIOS)1014被保存在ROM 1010中。
计算机1002还可包括,例如,硬盘驱动器1016、磁盘驱动器1018,例如用于读取或者写入至可移动盘1020、以及光盘驱动器1022,例如,用于读取或者写入CD-ROM盘1024或者其他光媒质。硬盘驱动器1016、磁盘驱动器1018、以及光盘驱动器1022分别通过硬盘驱动器接口1026、磁盘驱动器接口1028、以及光盘驱动器接口1030连接到系统总线1008。驱动器1016-1022以及它们相关的计算机可读媒质提供对于用于计算机1002的数据、数据结构、计算机可读指令等等的非易失性存储。尽管上面对于计算机可读媒质的描述是针对硬盘、可移动磁盘和CD,本领域的技术人员可以理解其他可被计算机读取的媒质的类型,例如磁带、闪存卡、数字视频光盘、Bernoulli盒式磁盘等等,也可以被用于示例操作环境1000,且进一步任何这样的媒质可包含用于执行本发明的方法的计算机可读指令。
数个程序模块可被保存在驱动器1016-1022的存储器和RAM 1012中,包括操作系统1032、一个或多个应用程序1034、其他程序模块1036、以及程序数据1038。操作系统1032可以是任何合适的操作系统或者操作系统的组合。为了举例,应用程序1034和应用模块1036可包括按照本发明的一个方面帮助基于客户的网络浏览(web-crawling)。
用户可通过一个或多个用户输入设备,诸如键盘1040和指示设备(例如,鼠标1042)输入命令和信息至计算机1002。其他的输入设备(没有示出)可包括麦克风、游戏杆、游戏盘、圆盘卫星天线、无线遥控器、扫描仪等等。这些或者其他的输入设备经常通过耦合至系统总线1008的串行接口1044连接到处理器单元1004,但是也可以通过其他接口,诸如并行端口、游戏端口或者通用串行总线(USB)连接。监视器1046或者其他类型的显示设备也可以通过诸如视频适配器1048的接口连接到系统总线1008。除了监视器1046,计算机1002可包括其他的外围输出设备(没有示出),例如扬声器、打印机等等。
需要理解计算机1002可在使用逻辑连接至一个或多个远程计算机1060的网络化环境中操作。远程计算机1060可以是工作站、服务器计算机、路由器、对等设备或者其他公共网络节点,并一般包与合计算机1002相关描述的许多或者全部元件,尽管为了简明的目的,仅仅存储储存设备1062在图10中被示出。在图10中说明的逻辑连接可包括局域网(LAN)1064和广域网(WAN)1066。这样的网络环境在办公室、企业范围的计算机网络、内联网和互联网上是常见的。
例如,当在LAN网络环境中使用时,计算机1002通过网络接口或适配器1068连接至局域网1064。当在WAN网络环境中使用时,计算机1002一般可包括调制解调器(例如,电话机、DSL、电缆…)1070、或者连接到LAN上的通信服务器,或者具有其他用于在WAN 1066,诸如互联网上建立通信的装置。调制解调器1070相对于计算机1002可以是内置或外置的,通过串行端口接口1044连接至系统总线1008。在网络化环境中,程序模块(包括应用程序1034)以及/或者程序数据1038可储存在远程存储器存储设备1062中。可以理解,示出的网络连接是示例性的,也可以使用在计算机1002和1060之间建立通信链路的其他装置(例如,有线或者无线的)来实现本发明的一方面。
按照本领域中的技术人员实现的计算机编程,本发明已经参考可由计算机,例如计算机1002或者远程计算机1060执行的操作的动作和符号表现进行描述,除非另有表示。这样的动作和操作有时被称为是由计算机执行。可以理解动作和符号表现的操作包括由处理单元1004对表现数据比特的电气信号进行的操作,该数据比特会导致电气信号表现的变换或者转化,将该数据比特维持在存储器系统(包括系统存储器1006、硬盘驱动器1016、软盘驱动器1020、CD-ROM 1024、以及远程存储器1062)中的存储位置以重新配置或者改变计算机系统的操作以及对信号的其他处理。数据位所维持的存储器位置是具有对应于该数据比特的特定电、磁或者光学属性的物理位置。
图11示出了另一个本发明可交互的示例计算环境1100的示意框图。系统1100进一步示出了包括一个或多个客户机1102的系统。客户机1102可以是硬件和/或软件(如,线程、进程、计算装置)。系统1100也包括一个或多个服务器1104。服务器1104也可以是硬件和/或软件(如,线程、进程、计算装置)。例如,服务器1104可容纳线程,以通过使用本发明执行变换。客户机1102和服务器1104之间的一个可能的通信可以是适用于在两个或多个计算机进程之间传输的数据分组的形式。系统1100包括可用于便于在客户机1102和服务器1104之间通信的通信框架1106。客户机1102操作上连接至可用于储存对客户机1102本地的信息的一个或多个客户机数据存储1108。类似地,服务器1104操作上连接至可用于储存对服务器1104本地的信息的一个或多个服务器数据存储1110。
在本发明的一种情况中,数据分组在两个或者多个帮助网络浏览的计算机组件之间发射,数据分组包括,至少部分和使用至少部分用于网络浏览的分布式系统的网络浏览相关的信息。
在本发明的另一种情况中,计算机可读媒质保存用于帮助网络浏览的的系统的计算机可执行组件,其包括至少部分,用于确定至少部分由用于网络浏览的分布式系统编译的维持用于web页的信息的网络浏览系统。
需要理解本发明的系统以及/或者方法可被用在帮助计算机组件和类似的与计算机无关的组件的网络浏览系统中。此外,熟悉本领域的技术人员会认识到本发明的系统以及/或者方法可被用在多种和电子相关的技术中,包括但不限于,计算机、服务器以及/或者手持电子设备以及类似的有线以及/或者无线等等的设备。
熟悉本领域的技术人员还将认识到本发明不仅可用于基于服务器到客户机的浏览系统,还可以用于对等的浏览系统。客户机执行一般和“服务器”行为相关联的任务也是可能的,且因此在本发明的一些情况中将一些和服务器相关联的特征转换到客户机上。本发明的这种情况的一个示例是执行至其他的客户机的“子浏览”以确定以及/或者导出信息并发送给服务器的客户机。这种情况可能是有益的,例如,在某个客户机可服务器之间存在瓶颈的网络中。数据可使用至服务器的最佳接入被传送到服务器。在本发明的另一个情况中,客户机可通过起始内联网系统中的子浏览来展现服务器的行为,因此可仅仅从单个以及/或者呈现在内联网中数量明显减少的客户机中报告信息至服务器。在这种方式下,搜索服务器可在客户机中起始多个子浏览以扩展其浏览资源。
上文所描述的包括本发明的示例。当然,不可能为了描述本发明而描述组件或方法的每一可想象的组合,但是本领域的普通技术人员可以认识到,本发明的许多另外的组合和置换是可能的。因此,本发明旨在包含落入所附权利要求书的精神和范围中的所有这样的改变、修改和变化。此外,在术语“包括”用于详细描述和权利要求书的意义上,这类术语旨在以与术语“包含”用作权利要求书中的过渡词语所解释的类似的方式为包含性的。

Claims (32)

1.一种帮助辅助表格填充的系统,包括:
控制组件,接收未标记的文本输入信息;
解析组件,至少部分基于未标记的文本信息填充表格的子集;以及
显示组件,显示未标记的文本信息和填充的表格。
2.如权利要求1所述的系统,所述解析组件包括一人工智能(AI)组件,作出关于至少部分基于未标记的文本信息填充表格的推断。
3.如权利要求2所述的系统,所述AI组件使用隐性马尔可夫模型(HMM)来确定表格中所解析的文本信息可被输入的正确的字段。
4.如权利要求1所述的系统,所述显示组件使用色彩来表示至少一个所解析的未标记的文本元素和表格中至少一个的字段的兼容性。
5.如权利要求1所述的系统,还包括至少一个状态指示符,表示和表格中至少一个所填充的字段相关联的状态等级。
6.如权利要求5所述的系统,所述至少一个状态指示符是按照表示至少一个表格中的所填充的字段的状态等级的色彩编码而彩色化。
7.一种用于辅助表格填充的方法,包括:
接收未标记的媒质;
解析未标记的媒质以识别元素;
自动用所识别的元素填充表格;以及
向用户显示未标记的媒质并所填充表格。
8.如权利要求7所述的方法,还包括使用色彩来表示所识别的元素是与表格中的特定字段兼容的。
9.如权利要求7所述的方法,还包括使用至少一个隐性马尔可夫模型(HMM)来确定所识别的元素可被输入的合适的字段。
10.如权利要求7所述的方法,还包括表示和至少一个字段中的一个元素相关联的状态等级。
11.如权利要求11所述的方法,还包括如果和该至少一个字段中的至少一个元素相关联的状态等级低于希望的等级,提示用户验证以及/或者校正至少一个字段中的至少一个元素。
12.如权利要求11所述的方法,还包括按照用户验证以及/或者对于至少一个字段中的至少一个元素的校正来更新所填充的表格。
13.如权利要求12所述的方法,还包括至少部分基于用户验证以及/或者对于至少一个元素的校正而升级和至少一个元素相关的状态等级。
14.如权利要求11所述的方法,还包括使用不同的色彩表示状态的不同等级。
15.如权利要求7所述的方法,还包括如果所有字段中的所有元素的可信度等级高于希望的可信度阀值,存储所述填充的表格至数据存储器。
16.一种用户辅助用户填充表格的方法,包括:
读取未标记的媒质至未标记的媒质存储器中;
读取侧信息至侧信息存储器中;
解析未标记的媒质以识别用于填充表格的元素;
写入所识别的元素至表格数据存储器;以及
在表格图形用户接口的字段中显示所识别的元素。
17.如权利要求16所述的方法,还包括在未标记的媒质图形用户接口中显示具有视觉指示符的未标记的媒质。
18.如权利要求17所述的方法,其特征在于所述视觉指示符是指示至少一个所识别的元件和至少一个表格中的字段的兼容性的色彩。
19.如权利要求16所述的方法,还包括指示和填充一给定的字段的元素相关联的可信度等级。
20.如权利要求19所述的方法,其特征在于不同的状态等级由不同的色彩指示。
21.如权利要求19所述的方法,还包括如果字段包含至少一个错误,允许用户校正表格中的至少一个字段。
22.如权利要求21所述的方法,还包括附加从表格中的至少一个字段的校正中采集的信息至侧信息存储器。
23.如权利要求22所述的方法,还包括在附加从至少一个字段的校正中采集的信息之后重新解析未标记的媒质以传播对于至少一个字段的校正至至少一个其他字段。
24.如权利要求16所述的方法,还包括允许用户验证在至少一个字段中的至少一个元素是正确的。
25.如权利要求24所述的方法,还包括将表格中的至少一个字段的验证中采集的信息添加到侧信息存储器。
26.如权利要求25所述的方法,还包括在添加至少一个字段的验证中采集的信息之后重新解析未标记的媒质以传播至少一个字段的校正至至少一个其他字段。
27.如权利要求16所述的方法,还包括如果没有错误在表格中呈现,将表格数据存储器的内容写入到文件中。
28.一种在表格填写中减少错误和所需时间的系统,包括:
用于接收未标记媒质输入的装置;
用于解析未标记媒质的装置;
用于使用所解析的未标记位置填充表格的装置;以及
用户并发显示未标记的媒质和被填充的表格的装置。
29.如权利要求28所述的系统,还包括用于指示和所填充的表格中的至少一个字段相关的状态等级。
30.如权利要求28所述的系统,还包括用于校正以及/或者验证所填充的表格中至少一个字段的装置。
31.如权利要求28所述的系统,还包括用户指示所解析的未标记的媒质元素和表格中的字段之间的兼容性的装置。
32.一种计算机可读媒质,存储有计算机可读指令,用于:
接收未标记的媒质;
解析未标记的媒质以识别元素;
用所识别的元素填充表格中的字段;
指示与表格中所填充的字段相关联的状态;以及
允许对所填充的表格中的字段中的元素进行校正以及/或者验证。
CN2005100531726A 2004-03-03 2005-03-03 辅助表格填充 Pending CN1664810A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/792,519 US7426496B2 (en) 2004-03-03 2004-03-03 Assisted form filling
US10/792,519 2004-03-03

Publications (1)

Publication Number Publication Date
CN1664810A true CN1664810A (zh) 2005-09-07

Family

ID=34750607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005100531726A Pending CN1664810A (zh) 2004-03-03 2005-03-03 辅助表格填充

Country Status (5)

Country Link
US (1) US7426496B2 (zh)
EP (1) EP1571560A3 (zh)
JP (1) JP4758116B2 (zh)
KR (1) KR101114194B1 (zh)
CN (1) CN1664810A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102956022A (zh) * 2011-08-12 2013-03-06 富士通株式会社 诊疗信息输入装置以及诊疗信息输入方法
CN103324661A (zh) * 2013-04-10 2013-09-25 广东全通教育股份有限公司 一种基于用户习惯的数据搜索与自动填充方法及系统
CN105556509A (zh) * 2013-06-14 2016-05-04 微软技术许可有限责任公司 智能填充
CN108132922A (zh) * 2016-12-01 2018-06-08 珠海金山办公软件有限公司 一种基于表格的自动填充方法及装置
US10409892B2 (en) 2011-01-26 2019-09-10 Microsoft Technology Licensing, Llc Formatting data by example
CN111523021A (zh) * 2019-02-01 2020-08-11 国际商业机器公司 一种信息处理系统及其执行的方法
TWI711021B (zh) * 2018-05-10 2020-11-21 台灣人壽保險股份有限公司 電子要保文件顯示方法及裝置
CN112307728A (zh) * 2019-07-29 2021-02-02 国际商业机器公司 来自一组联合数据提供方的自动表格完成
CN113449496A (zh) * 2021-06-25 2021-09-28 北京京东振世信息技术有限公司 一种自动生成维修单据的方法和装置

Families Citing this family (131)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1387291A3 (en) * 2002-07-30 2005-10-19 Canon Kabushiki Kaisha Apparatus, method, recording medium and program for form processing
US7958443B2 (en) 2003-02-28 2011-06-07 Dictaphone Corporation System and method for structuring speech recognized text into a pre-selected document format
US20040243545A1 (en) * 2003-05-29 2004-12-02 Dictaphone Corporation Systems and methods utilizing natural language medical records
US8200487B2 (en) 2003-11-21 2012-06-12 Nuance Communications Austria Gmbh Text segmentation and label assignment with user interaction by means of topic specific language models and topic-specific label statistics
US7747601B2 (en) * 2006-08-14 2010-06-29 Inquira, Inc. Method and apparatus for identifying and classifying query intent
US8082264B2 (en) 2004-04-07 2011-12-20 Inquira, Inc. Automated scheme for identifying user intent in real-time
US8612208B2 (en) 2004-04-07 2013-12-17 Oracle Otc Subsidiary Llc Ontology for use with a system, method, and computer readable medium for retrieving information and response to a query
US7251782B1 (en) * 2004-06-22 2007-07-31 Sun Microsystems, Inc. Method and apparatus for validating user input fields in a graphical display
US8626730B2 (en) * 2004-06-28 2014-01-07 Sap Ag Data processing methods, systems and computer programs for providing a payment using a web service
US20060015526A1 (en) * 2004-07-16 2006-01-19 Juergen Sattler Method and apparatus for supporting context links for application program text
US7653694B2 (en) * 2004-12-15 2010-01-26 Microsoft Corporation E-mail containing a web-based form
US8122354B1 (en) * 2005-02-25 2012-02-21 The Mathworks, Inc. Systems and methods for providing an indicator of detection of input related to an element of a user interface
US7644351B1 (en) * 2005-06-27 2010-01-05 Information Sciences Corporation Data collection and processing system and methods
CA2614233A1 (en) * 2005-07-05 2007-01-11 Dictaphone Corporation System and method for auto-reuse of document text
DE102005032046A1 (de) * 2005-07-08 2007-01-11 Océ Document Technologies GmbH Verfahren, System und Computerprogramm-Produkt zum Übertragen von Daten aus einer Dokumentenanwendung in eine Datenanwendung
US20070022085A1 (en) * 2005-07-22 2007-01-25 Parashuram Kulkarni Techniques for unsupervised web content discovery and automated query generation for crawling the hidden web
US8010610B2 (en) * 2005-08-03 2011-08-30 Research In Motion Limited Handheld electronic device providing assisted entry of contact information, and associated method
KR100735375B1 (ko) * 2005-08-25 2007-07-04 삼성전자주식회사 이동통신단말기에서 어플리케이션 구동 방법 및 그이동통신단말기
US8935379B1 (en) * 2005-09-07 2015-01-13 Reversevision, Inc. Methods, systems, and products for evaluating electronic data and electronic forms
JP2007094818A (ja) * 2005-09-29 2007-04-12 Internatl Business Mach Corp <Ibm> 複数データの一括コピー及びペースト方法、装置、およびコンピュータ・プログラム
US7512574B2 (en) * 2005-09-30 2009-03-31 International Business Machines Corporation Consistent histogram maintenance using query feedback
DE102005048600B4 (de) * 2005-10-06 2008-09-25 Klaus Rehm Verfahren zum Erfassen von Daten
US7603438B2 (en) * 2005-10-13 2009-10-13 Kabushiki Kaisha Toshiba System and method for assisted entry of database schema data
JP2009520246A (ja) * 2005-10-25 2009-05-21 キャラクテル リミテッド カスタマゼーションによらない書式データ抽出
US7353073B2 (en) * 2005-12-01 2008-04-01 Sandisk Corporation Method for managing appliances
US7739078B2 (en) * 2005-12-01 2010-06-15 Sandisk Corporation System for managing appliances
US20070133876A1 (en) * 2005-12-14 2007-06-14 Nokia Corporation Device, method, and computer program product for enhancing the use of electronic forms in mobile devices
US20070156977A1 (en) * 2005-12-29 2007-07-05 Ritter Gerd M Automatic location data determination in an electronic document
US20070179956A1 (en) * 2006-01-18 2007-08-02 Whitmyer Wesley W Jr Record protection system for networked databases
US7992128B2 (en) * 2006-01-27 2011-08-02 Sap Ag Computer software adaptation method and system
US8270720B1 (en) * 2006-02-21 2012-09-18 Gruntworx, Llc Method and system for secure data entry
JP4890051B2 (ja) * 2006-02-28 2012-03-07 富士通株式会社 ブラウザ画面の表示装置およびそのためのプログラム
US20070203869A1 (en) * 2006-02-28 2007-08-30 Microsoft Corporation Adaptive semantic platform architecture
US7921099B2 (en) * 2006-05-10 2011-04-05 Inquira, Inc. Guided navigation system
KR100798147B1 (ko) * 2006-06-30 2008-01-28 주식회사 케이티프리텔 표준 항목 리포지터리 기반의 화면간 자동 데이터 전송시스템 및 그 방법
US8781813B2 (en) 2006-08-14 2014-07-15 Oracle Otc Subsidiary Llc Intent management tool for identifying concepts associated with a plurality of users' queries
US20080059961A1 (en) * 2006-08-31 2008-03-06 Microsoft Corporation Output of Help Elements that Correspond to Selectable Portions of Content
US7890442B2 (en) * 2006-10-20 2011-02-15 International Business Machines Corporation Method and system for autocompletion of multiple fields in electronic forms
US20080120257A1 (en) * 2006-11-20 2008-05-22 Yahoo! Inc. Automatic online form filling using semantic inference
US8095476B2 (en) * 2006-11-27 2012-01-10 Inquira, Inc. Automated support scheme for electronic forms
JP2008158989A (ja) * 2006-12-26 2008-07-10 Canon Inc Gui生成装置及びgui生成方法
US20080158161A1 (en) * 2006-12-29 2008-07-03 Sap Ag Data entry processing
US20080158160A1 (en) * 2006-12-29 2008-07-03 Christof Engel Central storage for data entry processing
US20100313112A1 (en) * 2007-01-11 2010-12-09 Sxip Identity Corp. Method And System For Indicating A Form Mapping
US8996587B2 (en) * 2007-02-15 2015-03-31 International Business Machines Corporation Method and apparatus for automatically structuring free form hetergeneous data
US7849398B2 (en) * 2007-04-26 2010-12-07 Xerox Corporation Decision criteria for automated form population
US20090006940A1 (en) * 2007-06-27 2009-01-01 Hardt Dick C Simplified Persona Selector and Indication System
US8214362B1 (en) * 2007-09-07 2012-07-03 Google Inc. Intelligent identification of form field elements
US8351703B2 (en) * 2007-10-30 2013-01-08 Perot Systems Corporation System and method for extracting and organizing data from electronic images
US8234562B1 (en) * 2007-10-31 2012-07-31 Intuit Inc. Error checking for data entry
US8910073B2 (en) * 2007-11-26 2014-12-09 Qualcomm Incorporated Enhancing visual continuity in scrolling operations
US8196042B2 (en) 2008-01-21 2012-06-05 Microsoft Corporation Self-revelation aids for interfaces
GB2458891A (en) * 2008-03-31 2009-10-07 Triad Group Plc Automatic form filling by extracting components form a text file
JP5366178B2 (ja) * 2008-05-22 2013-12-11 インターナショナル・ビジネス・マシーンズ・コーポレーション ウェブページの入力項目への入力を支援する方法、コンピュータ・プログラム及び端末
US20100037219A1 (en) * 2008-08-05 2010-02-11 International Buisness Machines Corporation Predictive logic for automatic web form completion
JP5347370B2 (ja) * 2008-08-12 2013-11-20 富士通モバイルコミュニケーションズ株式会社 電子機器
US20100050101A1 (en) * 2008-08-21 2010-02-25 Palm, Inc. Converting Information Objects
US20100057861A1 (en) * 2008-08-29 2010-03-04 International Business Machines Corporation Dynamic Email Recipients Based on Entered Subject
US8074179B2 (en) * 2008-09-15 2011-12-06 International Business Machines Corporation User interface including question verification indicators
US8225213B2 (en) * 2008-10-07 2012-07-17 Siegal Bess L M User interface (UI) control for attestation process
US8805861B2 (en) * 2008-12-09 2014-08-12 Google Inc. Methods and systems to train models to extract and integrate information from data sources
US8140565B2 (en) * 2009-01-20 2012-03-20 International Business Machines Corporation Autonomic information management system (IMS) mainframe database pointer error diagnostic data extraction
US8527897B2 (en) * 2009-01-26 2013-09-03 International Business Machines Corporation System, method, and computer program product for toggling back and forth between unformatted and formatted editable views of data
US11195169B1 (en) * 2009-01-30 2021-12-07 United Services Automobile Association (Usaa) Systems and methods for digital wallet
EP2491545B8 (en) * 2009-10-21 2021-04-14 Citrix Systems, Inc. Computer form action zone summary system and method
US20110154221A1 (en) * 2009-12-22 2011-06-23 International Business Machines Corporation Subject suggestion based on e-mail recipients
US20110153564A1 (en) * 2009-12-23 2011-06-23 Telcordia Technologies, Inc. Error-sensitive electronic directory synchronization system and methods
US8560935B2 (en) 2010-08-31 2013-10-15 American Sterling Dental Plan, Llc Segmenting forms for multiple user completion
US9323722B1 (en) * 2010-12-07 2016-04-26 Google Inc. Low-latency interactive user interface
US8589805B2 (en) * 2011-04-28 2013-11-19 Brian Knight Customizable constituent communication method, system, and computer readable medium
CN102214244A (zh) * 2011-07-07 2011-10-12 深圳市万兴软件有限公司 docx文件信息解析方法及系统
US8996981B2 (en) * 2011-09-06 2015-03-31 Onevizion, Inc. Managing forms in electronic documents
US8737599B2 (en) * 2011-11-23 2014-05-27 24/7 Customer, Inc. Interaction management
US20130191714A1 (en) * 2012-01-25 2013-07-25 Microsoft Corporation Fill by example animation and visuals
US20130219257A1 (en) * 2012-02-19 2013-08-22 International Business Machines Corporation Textual and formatted data presentation
US20130317805A1 (en) * 2012-05-24 2013-11-28 Google Inc. Systems and methods for detecting real names in different languages
US20130339836A1 (en) * 2012-06-14 2013-12-19 International Business Machines Corporation Compliance Verification Using Field Monitoring in a Computing Environment
JP5663114B2 (ja) * 2012-09-24 2015-02-04 楽天株式会社 情報処理装置、情報処理装置の制御方法、及びプログラム
US9639597B2 (en) 2012-10-30 2017-05-02 FHOOSH, Inc. Collecting and classifying user information into dynamically-updated user profiles
US9251467B2 (en) * 2013-03-03 2016-02-02 Microsoft Technology Licensing, Llc Probabilistic parsing
GB2511749A (en) * 2013-03-11 2014-09-17 Theeword Ltd Webform monitoring
US10445417B2 (en) * 2013-08-01 2019-10-15 Oracle International Corporation Entry of values into multiple fields of a form using touch screens
KR101597307B1 (ko) * 2013-10-23 2016-02-24 농협은행(주) 모아 쓰기를 이용한 은행 업무용 전자 문서 시스템 및 그 처리 방법
US11087340B1 (en) * 2013-12-17 2021-08-10 EMC IP Holding Company LLC Systems and methods for configuring converged infrastructure components
US9430464B2 (en) 2013-12-20 2016-08-30 International Business Machines Corporation Identifying unchecked criteria in unstructured and semi-structured data
US10013411B2 (en) * 2014-04-30 2018-07-03 Adobe Systems Incorporated Automating data entry for fields in electronic documents
US10824799B2 (en) 2014-06-30 2020-11-03 Microsoft Technology Licensing, Llc Summary data autofill
US10515151B2 (en) * 2014-08-18 2019-12-24 Nuance Communications, Inc. Concept identification and capture
SG11201808317XA (en) 2014-09-23 2018-10-30 Fhoosh Inc Secure high speed data storage, access, recovery, and transmission
US10088979B2 (en) * 2014-09-26 2018-10-02 Oracle International Corporation Recasting a form-based user interface into a mobile device user interface using common data
US10042837B2 (en) 2014-12-02 2018-08-07 International Business Machines Corporation NLP processing of real-world forms via element-level template correlation
KR101734156B1 (ko) * 2014-12-05 2017-05-24 농협은행(주) 이동 통신 단말을 이용한 전자 문서 시스템 및 그 처리 방법
US20160180352A1 (en) * 2014-12-17 2016-06-23 Qing Chen System Detecting and Mitigating Frustration of Software User
US9928227B2 (en) 2015-08-20 2018-03-27 International Business Machines Corporation Techniques for utilizing information associated with an action command to select an appropriate form
US9805511B2 (en) * 2015-10-21 2017-10-31 International Business Machines Corporation Interacting with data fields on a page using augmented reality
US10776571B2 (en) * 2016-05-04 2020-09-15 Google Llc Dispatch of user input to multiple input fields in a user interface
US10204091B2 (en) 2016-05-18 2019-02-12 International Business Machines Corporation Providing data quality feedback while end users enter data in electronic forms
US10803237B2 (en) * 2016-09-28 2020-10-13 Netsuite, Inc. Systems and methods for data entry into a region of a display
US11010677B2 (en) 2017-09-30 2021-05-18 Oracle International Corporation Event management system
US11062411B2 (en) 2017-09-30 2021-07-13 Oracle International Corporation Student retention system
US11301945B2 (en) 2017-09-30 2022-04-12 Oracle International Corporation Recruiting and admission system
US11151672B2 (en) 2017-10-17 2021-10-19 Oracle International Corporation Academic program recommendation
US11989774B1 (en) * 2017-11-20 2024-05-21 Wells Fargo Bank, N.A. Systems and methods for providing digital trusted data
KR102458338B1 (ko) * 2017-11-30 2022-10-25 삼성전자주식회사 컴퓨팅 장치의 정보 입력 방법 및 그 컴퓨팅 장치
US10360252B1 (en) * 2017-12-08 2019-07-23 Palantir Technologies Inc. Detection and enrichment of missing data or metadata for large data sets
US10949608B2 (en) * 2018-02-21 2021-03-16 Oracle International Corporation Data feedback interface
US11349656B2 (en) 2018-03-08 2022-05-31 Ubiq Security, Inc. Systems and methods for secure storage and transmission of a data stream
US10956402B2 (en) 2018-04-13 2021-03-23 Visa International Service Association Method and system for automatically detecting errors in at least one date entry using image maps
US11941649B2 (en) 2018-04-20 2024-03-26 Open Text Corporation Data processing systems and methods for controlling an automated survey system
US11687537B2 (en) 2018-05-18 2023-06-27 Open Text Corporation Data processing system for automatic presetting of controls in an evaluation operator interface
US11212312B2 (en) * 2018-08-09 2021-12-28 Microsoft Technology Licensing, Llc Systems and methods for polluting phishing campaign responses
US11321519B1 (en) * 2018-08-29 2022-05-03 Applied Statistics & Management Inc. Data parsing and verification in a network environment
US10607040B1 (en) 2019-02-21 2020-03-31 Motorola Solutions, Inc. Automated form fill
US10635906B1 (en) 2019-02-21 2020-04-28 Motorola Solutions, Inc. Video annotation
US11373035B1 (en) * 2019-04-30 2022-06-28 Axon Enterprise, Inc. Systems and methods for structured report generation
US10922481B2 (en) 2019-06-14 2021-02-16 International Business Machines Corporation Visual user attention redirection while form filling to enhance auto-fill accuracy
US10628633B1 (en) * 2019-06-28 2020-04-21 Decision Engines, Inc. Enhancing electronic form data based on hierarchical context information
UA128522C2 (uk) * 2019-09-24 2024-08-07 Аура Саб, Ллс Спосіб, система та машинозчитуваний носій інформації, призначені для класифікації полів і груп полів вводу вебсторінки
CN111191429A (zh) * 2019-09-27 2020-05-22 深圳逻辑汇科技有限公司 数据表格自动填充的系统和方法
CN112861497A (zh) * 2019-11-27 2021-05-28 贝壳技术有限公司 合同模板的生成方法及系统
US11057519B1 (en) 2020-02-07 2021-07-06 Open Text Holdings, Inc. Artificial intelligence based refinement of automatic control setting in an operator interface using localized transcripts
US11556502B2 (en) 2020-02-28 2023-01-17 Ricoh Company, Ltd. Intelligent routing based on the data extraction from the document
US11182439B2 (en) * 2020-02-28 2021-11-23 Ricoh Company, Ltd. Automatic data capture of desired data fields and generation of metadata based on captured data fields
US12039538B2 (en) 2020-04-01 2024-07-16 Visa International Service Association System, method, and computer program product for breach detection using convolutional neural networks
CN112380477B (zh) * 2020-11-13 2024-04-30 广东巴金斯科技有限公司 表单组件结构
DE102020214362A1 (de) 2020-11-16 2022-05-19 Volkswagen Aktiengesellschaft Verfahren zum Verwalten von Daten von einer Vielzahl von Entitäten und Vorrichtung zur Datenverarbeitung
US11947904B2 (en) * 2021-02-05 2024-04-02 Quick Click E-Forms, LLC System and method for completing multiple electronic forms
US11532023B2 (en) * 2021-02-24 2022-12-20 Kumar N Senthil System and method for streamlining a checkout process of e-commerce websites
US11748341B2 (en) * 2021-03-30 2023-09-05 Konica Minolta Business Solutions U.S.A., Inc. Method, apparatus, and system for form auto-registration using virtual table generation and association
US11907652B2 (en) * 2022-06-02 2024-02-20 On Time Staffing, Inc. User interface and systems for document creation
US20240046030A1 (en) * 2022-08-02 2024-02-08 Capital One Services, Llc Accelerated form completion with email address analytics

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736913A (ja) * 1993-07-16 1995-02-07 Ricoh Co Ltd 言語解析システム
US5664109A (en) * 1995-06-07 1997-09-02 E-Systems, Inc. Method for extracting pre-defined data items from medical service records generated by health care providers
US6166734A (en) * 1996-10-01 2000-12-26 Diamond Multimedia Systems, Inc. Portable interactive graphics display tablet and communications system
US6157935A (en) * 1996-12-17 2000-12-05 Tran; Bao Q. Remote data access and management system
US6411313B1 (en) 1999-06-14 2002-06-25 Microsoft Corporation User interface for creating a spreadsheet pivottable
JP4160206B2 (ja) * 1999-06-18 2008-10-01 株式会社東芝 文字認識装置を利用したデータベース登録方法
US6651217B1 (en) * 1999-09-01 2003-11-18 Microsoft Corporation System and method for populating forms with previously used data values
US6542635B1 (en) * 1999-09-08 2003-04-01 Lucent Technologies Inc. Method for document comparison and classification using document image layout
AU2001289074A1 (en) 2000-09-08 2002-03-22 Agentai, Inc. A point-of-sale commercial transaction processing system using artificial intelligence assisted by human intervention
US6671670B2 (en) * 2001-06-27 2003-12-30 Telelogue, Inc. System and method for pre-processing information used by an automated attendant
JP3557605B2 (ja) * 2001-09-19 2004-08-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 文切り方法及びこれを用いた文切り処理装置、機械翻訳装置並びにプログラム
US20040205526A1 (en) 2001-09-28 2004-10-14 Vadim Borodovski Prompted form filling mechanism
JP3921390B2 (ja) * 2002-01-23 2007-05-30 Necインフロンティア株式会社 電話帳情報抽出方式及びその方法
US6817982B2 (en) * 2002-04-19 2004-11-16 Sonosite, Inc. Method, apparatus, and product for accurately determining the intima-media thickness of a blood vessel

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10409892B2 (en) 2011-01-26 2019-09-10 Microsoft Technology Licensing, Llc Formatting data by example
CN102956022A (zh) * 2011-08-12 2013-03-06 富士通株式会社 诊疗信息输入装置以及诊疗信息输入方法
CN103324661A (zh) * 2013-04-10 2013-09-25 广东全通教育股份有限公司 一种基于用户习惯的数据搜索与自动填充方法及系统
CN105556509A (zh) * 2013-06-14 2016-05-04 微软技术许可有限责任公司 智能填充
US10229101B2 (en) 2013-06-14 2019-03-12 Microsoft Technology Licensing, Llc Smart fill
CN105556509B (zh) * 2013-06-14 2020-10-30 微软技术许可有限责任公司 智能填充
CN108132922A (zh) * 2016-12-01 2018-06-08 珠海金山办公软件有限公司 一种基于表格的自动填充方法及装置
TWI711021B (zh) * 2018-05-10 2020-11-21 台灣人壽保險股份有限公司 電子要保文件顯示方法及裝置
CN111523021A (zh) * 2019-02-01 2020-08-11 国际商业机器公司 一种信息处理系统及其执行的方法
CN111523021B (zh) * 2019-02-01 2023-10-10 国际商业机器公司 一种信息处理系统及其执行的方法
CN112307728A (zh) * 2019-07-29 2021-02-02 国际商业机器公司 来自一组联合数据提供方的自动表格完成
CN113449496A (zh) * 2021-06-25 2021-09-28 北京京东振世信息技术有限公司 一种自动生成维修单据的方法和装置
CN113449496B (zh) * 2021-06-25 2024-05-17 北京京东振世信息技术有限公司 一种自动生成维修单据的方法和装置

Also Published As

Publication number Publication date
KR20060043384A (ko) 2006-05-15
JP2005251205A (ja) 2005-09-15
EP1571560A2 (en) 2005-09-07
JP4758116B2 (ja) 2011-08-24
US20050198563A1 (en) 2005-09-08
US7426496B2 (en) 2008-09-16
EP1571560A3 (en) 2007-01-17
KR101114194B1 (ko) 2012-02-22

Similar Documents

Publication Publication Date Title
CN1664810A (zh) 辅助表格填充
US20210165955A1 (en) Methods and systems for modeling complex taxonomies with natural language understanding
US20210256047A1 (en) System and method for providing technology assisted data review with optimizing features
CN106020950B (zh) 基于复杂网络分析的函数调用图关键节点识别和标识方法
AU2020200909A1 (en) Evaluation control
US8468167B2 (en) Automatic data validation and correction
US8868609B2 (en) Tagging method and apparatus based on structured data set
US10210211B2 (en) Code searching and ranking
AU2016203856A1 (en) System and method for automating information abstraction process for documents
US9104709B2 (en) Cleansing a database system to improve data quality
US9852217B2 (en) Searching and ranking of code in videos
CN101911067A (zh) 信息过滤系统、信息过滤方法以及信息过滤程序
CN102571403A (zh) 通用数据质量管控适配器的实现方法和装置
US20230214679A1 (en) Extracting and classifying entities from digital content items
US20140075299A1 (en) Systems and methods for generating extraction models
CN101976394A (zh) 数据采集和统计系统及方法
CN110909768B (zh) 一种标注数据获取方法及装置
CN114491044A (zh) 日志的处理方法及装置
CN104182416A (zh) 文件下载系统及方法
WO2019080419A1 (zh) 标准知识库的构建方法、电子装置及存储介质
CN107220249A (zh) 基于分类的全文搜索
CN114328169A (zh) 一种动态页面的测试方法及其系统
CN105893241A (zh) 测试数据的更新方法和装置
CN108304430B (zh) 一种修改数据库的方法
CN116204670B (zh) 车辆目标检测数据的管理方法、系统及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20050907