CN111523021B - 一种信息处理系统及其执行的方法 - Google Patents
一种信息处理系统及其执行的方法 Download PDFInfo
- Publication number
- CN111523021B CN111523021B CN202010068500.4A CN202010068500A CN111523021B CN 111523021 B CN111523021 B CN 111523021B CN 202010068500 A CN202010068500 A CN 202010068500A CN 111523021 B CN111523021 B CN 111523021B
- Authority
- CN
- China
- Prior art keywords
- fields
- completed
- incomplete
- current
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0489—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using dedicated keyboard keys or combinations thereof
- G06F3/04895—Guidance during keyboard input operation, e.g. prompting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开涉及一种信息处理系统及其执行的方法。提供一种方法,其中信息处理系统分析与一组已完成的表格对应的一组历史表格数据。所述一组历史表格数据包括指示在所述一组已完成的表格中,完成一组字段的历史顺序的信息。接下来,信息处理系统基于所述一组历史表格数据,确定完成包括在当前表格中的一组未完成字段的当前顺序。然后,信息处理系统在显示器上显示当前表格和用户界面,所述用户界面指示完成当前表格上的未完成字段的当前顺序。
Description
技术领域
本发明的实施例涉及信息处理的领域。更特别地,本发明的实施例涉及一种信息处理系统及其执行的方法。
背景技术
在因特网上沟通和办理业务已经成为用户的日常体验。为了购买产品、请求信息或提交问题,因特网用户通常被要求完成大量的表格。一些表格相对简单,而其他表格较复杂,并且依赖于从其他表格获得的信息,比如IRS 1040纳税申报表格。
复杂的表格并不总是最佳地按照表格字段被编号、安排或呈现给用户的顺序来完成。另外,复杂的表格一般有许多不同的“路径”或字段排列序列(“点击流”),用户可以遵循它们来导航和完成表格。例如,当用户完成包含几个从属表格(比如附表A分项扣除表、附表C损益表、附表D资本利得/损失表等等)的IRS 1040纳税申报表格时,可能存在许多的排列序列。
因特网的爆炸式增长和电子商务的出现导致了推荐系统的发展,这些系统使用个性化的信息过滤技术来识别用户感兴趣的一组事项。目前的推荐系统通过基于用户已经完成的字段推荐用户应该完成哪个字段,来指导用户完成表格。尽管这些推荐系统基于相似性推荐下一个字段,但是它们没有考虑历史上完成各个字段的顺序。
发明内容
按照本公开的一个实施例,提供一种方法,其中信息处理系统分析与一组已完成的表格对应的一组历史表格数据。所述一组历史表格数据包括指示在所述一组已完成的表格中完成一组字段的历史顺序的信息。接下来,信息处理系统基于所述一组历史表格数据,确定完成包括在当前表格中的一组未完成字段的当前顺序。然后,信息处理系统在显示器上显示当前表格和用户界面,所述用户界面指示完成当前表格上的未完成字段的当前顺序。
上面所述是概要,因此必然包含细节的简化、概括和省略;从而,本领域的技术人员会意识到该概要仅仅是例证性的,并没有任何限制的意图。在下面陈述的非限制性详细说明中,仅由权利要求书限定的本公开的其他方面、发明特征和优点将变得明显。
附图说明
参考附图,可更好地理解本公开,并且可使本公开的众多目的、特征和优点对本领域的技术人员来说变得明显,附图中:
图1是其中可以实现记载在本文中的方法的数据处理系统的方框图;
图2提供图1中所示的信息处理系统环境的扩展,以便图解说明记载在本文中的方法可以在网络环境中工作的多种多样的信息处理系统上执行;
图3是说明动态字段输入排列序列推荐系统的例证示图,所述动态字段输入排列序列推荐系统基于历史数据分析,向用户提供字段输入排列序列推荐;
图4是说明表格和字段输入排列序列推荐覆盖图的例证示图;
图5是表示为训练动态字段输入排列序列推荐系统所采取的步骤的例证流程图;
图6是说明将历史表格数据转换为依据其训练关联规则模型的关联规则的例证示图;
图7是表示为向用户动态提供字段输入排列序列推荐所采取的步骤的例证流程图;
图8是表示为分析用户输入并推荐接下来要完成的字段所采取的步骤的例证流程图。
具体实施方式
这里使用的术语只是用于说明特定的实施例,并不意图限制本公开。这里使用的单数形式意图还包括复数形式,除非上下文明确地另有所示。另外要明白的是当用在说明书中时,用语“包括”和/或“包含”指定陈述的特征、整数、步骤、操作、元件和/或组件的存在,但不排除一个或多个其它特征、整数、步骤、操作、元件、组件和/或它们的群体的存在或增加。
下面的权利要求书中的所有装置或步骤加功能要素的对应结构、材料、动作和等同物意图包括与明确主张的其他要求保护的要素结合地执行所述功能的任何结构、材料或动作。本公开的说明只是出于举例说明的目的给出的,而不是穷尽的,也不意图把本发明局限于公开的形式。对本领域的普通技术人员来说,许多修改和变化是明显的,而不脱离本公开的范围和精神。选择和说明实施例是为了更好地解释本公开的原理和实际应用,从而使本领域的其他普通技术人员能够关于具有适合于预期的特定应用的各种修改的各个实施例,理解本公开。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是——但不限于——电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言-诸如Smalltalk、C++等,以及常规的过程式编程语言-诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络-包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。下面的详细说明将遵循如上所述的本公开的概要,进一步酌情解释和扩展本公开的各个方面和实施例的定义。
图1图解说明信息处理系统100,信息处理系统100是能够执行记载在本文中的计算操作的计算机系统的简化例子。信息处理系统100包括耦接到处理器接口总线112的一个或多个处理器110。处理器接口总线112把处理器110连接到北桥115,北桥115也被称为存储器控制器中心(MCH)。北桥115连接到系统存储器120,为处理器110提供访问系统存储器的手段。图形控制器125也连接到北桥115。在一个实施例中,外围组件互连(PCI)Express总线118把北桥115连接到图形控制器125。图形控制器125连接到显示设备130,比如计算机监视器。
北桥115和南桥135利用总线119相互连接。在一些实施例中,该总线是在北桥115和南桥135之间双向高速传送数据的直接媒体接口(DMI)总线。在一些实施例中,PCI总线连接北桥和南桥。也被称为输入/输出(I/O)控制器中心(ICH)的南桥135是通常实现与北桥提供的能力相比以较慢的速度运行的能力的芯片。南桥135一般提供用于连接各种组件的各种总线。这些总线例如包括PCI和PCI Express总线、ISA总线、系统管理总线(SMBus orSMB)、和/或低管脚计数(LPC)总线。LPC总线通常连接低带宽设备,比如引导ROM 196和“传统”I/O设备(利用“超级I/O”芯片)。“传统”I/O设备(198)例如可包括串行和并行端口、键盘、鼠标、和/或软盘控制器。通常包括在南桥135中的其他组件包括直接存储器存取(DMA)控制器、可编程中断控制器(PIC)和存储设备控制器,其利用总线184把南桥135连接到非易失性存储设备185,比如硬盘驱动器。
ExpressCard 155是将可热插拔设备连接到信息处理系统的插槽。ExpressCard155支持PCI Express和通用串行总线(USB)连接性两者,因为它使用USB和PCI Express总线两者连接到南桥135。南桥135包括向连接到USB的设备提供USB连接性的USB控制器140。这些设备包括网络摄像头(相机)150、红外(IR)接收器148、键盘和触控板144、和提供无线个域网(PAN)的蓝牙设备146。USB控制器140还向其他各种各样的USB连接的设备142(比如鼠标、可拆卸的非易失性存储设备145、调制解调器、网卡、综合业务数字网络(ISDN)连接器、传真机、打印机、USB集线器和许多其他种类的USB连接的设备)提供USB连接性。尽管可拆卸的非易失性存储设备145被表示成USB连接的设备,不过,可拆卸的非易失性存储设备145可以利用不同的接口,比如火线接口等来连接。
无线局域网(LAN)设备175通过PCI或PCI Express总线172连接到南桥135。LAN设备175一般实现都使用相同协议在信息处理系统100和其他计算机系统或设备之间进行无线通信的无线调制技术的电气和电子工程师协会(IEEE)802.11标准之一。光存储设备190使用串行模拟电话适配器(ATA)(SATA)总线188连接到南桥135。串行ATA适配器和设备通过高速串行链路进行通信。串行ATA总线还把南桥135连接到其他形式的存储设备,比如硬盘驱动器。诸如声卡之类的音频电路160通过总线158连接到南桥135。音频电路160还提供与音频硬件(比如音频线路输入和光学数字音频输入端口162、光学数字输出和耳机插口164、内部扬声器166和内部麦克风168)关联的功能。以太网控制器170利用诸如PCI或PCIExpress总线之类的总线,连接到南桥135。以太网控制器170把信息处理系统100连接到诸如局域网(LAN)、因特网及其他公共和专用计算机网络之类的计算机网络。
尽管图1表示了一种信息处理系统,不过信息处理系统可以采取许多形式。例如,信息处理系统可以采取桌上型计算机、服务器、便携式计算机、膝上型计算机、笔记本计算机或其他形状因数的计算机或数据处理系统的形式。另外,信息处理系统可以采取形状因数,比如个人数字助手(PDA)、游戏机、自动柜员机(ATM)、便携式电话机、通信设备或者包括处理器和存储器的其他设备。
图2提供图1中所示的信息处理系统环境的扩展,以图解说明记载在本文中的方法可在网络环境中工作的多种多样的信息处理系统上执行。信息处理系统的种类从诸如手持计算机/移动电话机210之类的小型手持设备到诸如大型计算机270之类的大型主机系统。手持计算机210的例子包括个人数字助手(PDA)、诸如运动图像专家组第三层音频(MP3)播放器之类的个人娱乐设备、便携式电视机和光盘播放器。信息处理系统的其他例子包括笔输入计算机或平板计算机220、膝上型计算机或笔记本计算机230、工作站240、个人计算机系统250和服务器260。未在图2中单独示出的其他种类的信息处理系统用信息处理系统280表示。如图所示,可以利用计算机网络200,使各种信息处理系统联网。可用于互连各种信息处理系统的计算机网络的种类包括局域网(LAN)、无线局域网(WLAN)、因特网、公共交换电话网(PSTN)、其他无线网络、以及可用于互连信息处理系统的任何其他网络拓扑。许多信息处理系统包括非易失性数据存储装置,比如硬盘驱动器和/或非易失性存储器。图2中所示的信息处理系统的实施例包括单独的非易失性数据存储装置(更具体地,服务器260利用非易失性数据存储装置265,大型计算机270利用非易失性数据存储装置275,而信息处理系统280利用非易失性数据存储装置285)。非易失性数据存储装置可以是在各种信息处理系统之外的组件,或者可以在信息处理系统之一内部。另外,可以利用各种技术,比如把可拆卸的非易失性存储设备145连接到信息处理系统的USB端口或者其他连接器,来在两个或更多个信息处理系统之间共享可拆卸的非易失性存储设备145。
如上所述,目前的推荐系统不基于历史数据分析,动态指导用户完成复杂的表格。图3-8描述由信息处理系统实现的一种方法,所述信息处理系统分析历史表格数据,并向正在完成当前表格的用户提供动态字段序列进展指导。这里讨论的信息处理系统基于从来自其他用户的以前完成的表格的真实例子观察历史数据输入模式,在当前表格之上覆盖个性化的推荐完成顺序。另外,所述信息处理系统使用预先已知的或者利用自然语言处理分析推断的统计上已知的排列序列。
在一个实施例中,信息处理系统评估准备了类似表格的许多其他用户。所述评估包括学习最适用的字段,学习哪些字段是一起完成的,以及学习用户为完成表格的字段输入排列序列。信息处理系统学习最适用的字段,以及填写表格字段的最佳序列。然后,信息处理系统基于一个个字段(字段类型)地或者基于字段组(部分)(“批处理”)地实时向用户提供完成当前表格的指导。
在一个实施例中,信息处理系统部署应用程序接口(API),该应用程序接口向用户提供逐步的字段输入排列序列指示,以完成表格(按字段类型或字段组)。在另一个实施例中,信息处理系统部署批处理系统,该批处理系统允许用户“复查”他们(部分或全部)完成的表格,并将他们完成的表格与他们的同伴用户完成的表格进行比较,可能识别出用户遗漏的其他必需字段。
图3是说明动态字段输入排列序列推荐系统的例证示图,所述动态字段输入排列序列推荐系统基于历史数据分析,向用户提供字段输入排列序列推荐。如下详细所述,动态字段输入排列序列推荐(DFPSR)系统320使用DFPSR系统训练器340来训练关联规则模型325、评分函数330和推荐模型335。一旦经过训练,动态字段输入排列顺序推荐系统320就可通过用户界面API 310与用户300面接,以帮助用户300完成复杂的表格。
在训练期间,DFPSR系统训练器340通过形成字段数据并将从项目到项目的协同过滤推荐引擎应用于USER和FIELD列来准备以前完成的表格395,以学习哪些字段彼此关联。接下来,动态字段输入排列序列推荐系统训练器340利用FIELD和SEQUENCE列来训练关联规则模型325,以学习/归纳使一个或多个前因(antecedent)字段与相关的后果(consequent)字段相联系的规则,比如在完成字段B之前,用户需要完成字段A(更多的细节请参见图6及对应的文本)。
在一个实施例中,关联规则模型325随着时间的过去识别字段数据之间的关系。输出是描述这些关系的一组多个规则,比如IF(前因)THEN(后果)格式。在这个实施例中,动态字段输入排列序列推荐系统训练器340训练关联规则模型325,以找出描述在完成不同的字段(后果)之前,需要首先完成哪些字段(前因)的那些关联规则。
在运行时,动态字段输入排列序列推荐系统320通过用户界面310接收用户输入,并评估在向用户300显示的当前表格上完成哪些字段。动态字段输入排列序列推荐系统320评估已完成的字段,并1)应用推荐器系统提出前N个相关字段,和2)使用关联规则把所述N个字段重新排序成正确的序列。
评分函数330将关联规则模型325和推荐模型335接合起来,形成推荐用户300接下来应完成哪些字段,以及应按其完成这些字段的顺序的系统。在一个实施例中,每当被调用时,评分函数330执行三个任务。首先,评分函数330确定表格的当前状态(已完成的字段、未完成的字段),并创建与哪些字段已完成相对应的0和1的输入向量。例如,对于字段[F1,F2,...,FM]这M个字段,评分函数330生成充当指示哪些字段已完成(填写)的标志列表的向量[0,1,0,1,...,0]。其次,评分函数330把输入向量传递给推荐模型335,推荐模型335基于输入向量,确定接下来要完成的N个推荐字段。
在一个实施例中,推荐模型335使用表格的当前状态(即,哪些字段已被填写的二元向量),并提出用户接下来应填写的多达N个字段。例如,N可以是1(逐个字段),不过在许多情况下,N可以是N=5或N=10或更大。在这个实施例中,推荐模型335使用已知算法“从项目到项目的协同过滤”来基于来自之前的历史表格的例子来学习项目之间的联系(例如“填写了这个字段的人也填写了那个字段”)。在这个实施例中,关联规则模型325提出应按其填写所述N个字段的顺序。
评分函数330随后把N个推荐字段传递给关联规则模型325,关联规则模型325把与N个推荐字段对应的规则识别为后果。例如,N个推荐字段是字段x、字段y和字段z,关联规则A包括作为前因字段的“字段c”和作为后果字段的“字段z”。在本例中,评分函数330把关联规则A识别为具有与N个推荐字段之一对应的后果字段。
对于每个识别的规则,评分函数330识别其对应的前因字段,并把前因记录在联合的(unioned)集合中。利用上面讨论的例子,评分函数把“字段c”识别为关联规则A中的前因字段。对于每个前因字段,评分函数330基于识别已完成/未完成的字段的输入向量,确定前因字段是否已完成。对于还未完成的前因字段,评分函数330确定它们是否包含在所述N个推荐字段中。如果是,那么评分函数330会向用户300推荐接下来完成这些字段(更多的细节请参见图8及对应的文本)。
在一个实施例中,当动态字段输入排列序列推荐系统320未能推荐特定字段(比如新增的独特字段)时,动态字段输入排列序列推荐系统320增加关联规则模型325检测出、但是推荐模型335遗漏的额外推荐。
图4是说明表格和字段输入排列序列推荐覆盖图的例证示图。用户界面视图310包括IRS 1040纳税申报表格400和字段输入排列序列推荐410。每个字段输入排列序列推荐410指向覆盖在表格400上的文本块。图4中所示的实施例基于字段组地提供字段输入排列序列推荐。正如文中所讨论的,动态字段输入排列序列推荐系统320还基于一个个字段地提供字段输入排列序列推荐。
图5是表示为训练动态字段输入排列序列推荐系统320所采取的步骤的例证流程图。图5的处理始于500,然后在步骤510,该处理格式化已完成的表格字段和用户历史(更多的细节请参见图6,附图标记610和对应的文本)。在步骤520,处理把从逐个项目的协同过滤推荐引擎应用于格式化的数据,以学习字段关联。在一个实施例中,学习是在操作期间的任何时刻发生的,评分函数联合前因/后果。在步骤530,处理训练关联规则模型325,以学习/归纳使前因字段与相关的后果字段相联系的规则。
在步骤540,处理创建把许多已完成的字段作为输入的评分函数330,调用推荐模型335来识别接下来要完成的前N个推荐字段,并使用关联规则模型325把所述N个推荐字段重新排序成正确的序列(更多的细节请参见图8及对应的文本)。在步骤550,处理部署API,图5的处理之后在595终止。
图6是说明将历史表格数据转换为依据其训练关联规则模型325的关联规则的例证示图。数据格式化器600检索已完成的表格395,并执行解析/格式化步骤,从而以数据610中所示的格式捕捉数据。在一个实施例中,利用电子表格结构,数据格式化器600为每个可能的字段创建字段ID目录(多列)。这包括在哪些字段上,用户填写了表格字段的历史数据,比如“电子表格中的每个用户一行”,加上用户填写的每个“列”中的值。在这个实施例中,每个填写的“列”中的值是指示用户填写表格的序列的整数。在一个实施例中,某些事件可具有相同的序列id,指示它们在时间上具有相同的优先级(例如,姓和名的顺序不适用)。数据格式化器600然后生成数据610。
关联规则模型训练器620接收格式化数据,并利用诸如k-相似度归一化和条件概率相似度之类的算法,使用USER和FIELD列训练从项目到项目协同过滤器。在一个实施例中,关联规则模型训练器620确定在用户之间优化推荐的相似度截止阈值。
关联规则模型训练器620随后训练关联规则模型325来学习字段之间在时间方面的关系。这包括使用FIELD和SEQUENCE列,以及诸如APRIORI或CARMA(SPSS)或任何类似技术之类的任意规则归纳算法。输出是一组使前因字段与后果字段相联系的关联规则,以及规则置信度和规则支持。如文中所定义的,规则支持是数据610中显示该模式的许多例子。规则置信度是数据610中遵循该规则的例子的百分比,其中高置信度值比高支持值更重要。结果是规定在可完成另一个字段之前,需要输入哪些字段的关联规则模型325。
图7是表示为向用户动态提供字段输入排列序列推荐所采取的步骤的例证流程图。图7的API处理始于700,然后在步骤710,处理检测用户输入。处理确定是否查询动态字段输入排列序列推荐系统320(判定720)。在一个实施例中,API被配置成每次用户300输入数据时,查询动态字段输入排列序列推荐系统320。在另一个实施例中,API被配置成当用户300完成表格上某一部分中的字段时,查询动态字段输入排列序列推荐系统320。
如果API应查询动态字段输入排列序列推荐系统320,那么判定720分支到“是”分支,然后在步骤725,处理把用户输入发送给动态字段输入排列序列推荐系统320。在步骤730,处理接收来自动态字段输入排列序列推荐系统320的推荐,之后在步骤740,处理把推荐覆盖在表格上(更多的细节请参见图4及对应的文本)。另一方面,如果API处理不应查询动态字段输入排列序列推荐系统320,那么判定720分支到绕过步骤725-740的“否”分支。
处理确定用户是否完成了表格(判定750)。如果用户未完成表格,那么判定750分支到“否”分支,该“否”分支循环回去检测和处理更多的用户输入。继续该循环,直到用户完成表格为止,此时判定750分支到退出循环的“否”分支。图7的API处理之后在760终止。
图7的动态字段输入排列序列推荐系统处理始于770,然后在步骤775,处理接收用户输入。在预先定义的处理780,处理分析已完成的字段,并相应地提供字段输入排列序列推荐(处理细节请参见图8及对应的文本)。
处理确定是否继续(判定790)。如果处理应继续,那么判定790分支到“是”分支,该分支循环回去接收更多的用户输入。继续该循环,直到处理应终止为止,比如在用户300完成了表格时,此时判定790分支到退出循环的“否”分支。图7的处理之后在795终止。
图8是表示为分析用户输入并推荐接下来要完成的字段所采取的步骤的例证流程图。图8的处理始于800,之后在步骤810,处理识别哪些字段已完成,并创建对应的输入向量。例如,对于字段[F1,F2,...,FM]这M个字段,处理生成充当指示哪些字段已完成(已填写)的标志列表的向量[0,1,0,1,...,0]。
在步骤820,处理分析输入向量,并确定接下来要完成的N个推荐字段。在步骤830,如上所述,处理识别把N个字段中的任意字段作为后果的规则。对于每个规则,处理分析前因字段,并把前因字段记录在联合的集合中。
在步骤840,对于各个前因字段,处理确定哪些字段已完成,并创建上下文输入向量。例如,当用户正在完成一组纳税申报表格时,处理基于到当前时刻,用户已经填写了所有表格中的哪些字段,来创建上下文输入向量。该上下文输入向量由0(如果字段空白的话)和1(如果字段包括值的话(比如文本、下拉值、钩号等))组成。长度M的上下文输入向量是整个一组表格(一个或多个表格)中的所有字段的序列化表示。在一个实施例中,作为类比,上下文输入向量是数据库中的行。
在步骤850,处理确定在N个推荐字段中是否包含任何未完成的字段,并利用该信息生成给用户300的字段输入排列序列推荐。继续上面的例子,上下文输入向量被输入推荐模型335,基于上下文输入向量中值为1的元素,推荐模型335推荐所述处理基于推荐模型335已从历史数据中学习到的信息,确定用户接下来应填写的多达N个字段。此时,所述处理向用户通知接下来应填写哪N个字段。在一个实施例中,所述处理使用关联规则模型325来排列前N个推荐字段,从而形成完成各个字段的逻辑顺序。在这个实施例中,关联规则也是从历史数据中学习的。
在一个实施例中,关联规则模型325捕捉需要在其他给定字段之前完成的所需字段。对于推荐模型335所返回的前N个字段中的每个字段,关联规则模型325确定需要首先完成哪些字段。
在步骤860,将关于任何其他未填写字段的字段输入推荐添加到字段输入排列序列推荐中。例如,当关联规则模型325识别出不是前N个结果的一部分的需要填写的特定字段时,关联规则模型325把识别出的字段添加到前N个结果中。图8的处理之后在895返回到调用例程(参见图7)。
尽管表示和说明了本公开的特定实施例,不过基于文中的教导,对本领域的技术人员来说,显然可以作出各种变化和修改,而不脱离本公开及其更广泛的方面。于是,所附的权利要求书将在其范围内包含在本公开的真实精神和范围内的所有这样的变化和修改。此外,要明白的是本公开仅仅由所附的权利要求书限定。本领域的技术人员会理解如果引入的权利要求要素的特定数量是有意的,那么该意图将明确地记载在权利要求中,而在不存在这种记载的情况下,就不存在这样的限制。对于非限制性例子,作为对理解的帮助,下面所附的权利要求书包含引入短语“至少一个”和“一个或多个”的使用,以引入权利要求要素。然而,这种短语的使用不应被理解为暗示利用不定冠词“a”或“an”对权利要求要素的引入,把包含这类引入的权利要求要素的任何特定权利要求局限于只包含一个这类要素的公开内容,即使当同一权利要求包含引入短语“一个或多个”或者“至少一个”以及诸如“a”或“an”之类的不定冠词时;这同样适用于定冠词在权利要求书中的使用。
Claims (8)
1.一种由包括存储器和处理器的信息处理系统实现的方法,所述方法包含:
分析与一组已完成的表格对应的一组历史表格数据,其中所述一组历史表格数据包括指示在所述一组已完成的表格中,完成一组字段的历史顺序的信息;
基于所述一组历史表格数据,确定完成包括在当前表格中的一组未完成字段的当前顺序;和
在显示器上显示当前表格和用户界面覆盖图,其中所述用户界面覆盖图指示完成当前表格上的未完成字段的当前顺序;
其中所述分析还包含训练关联规则模型,所述方法还包含:
基于所述历史顺序,从所述一组字段中识别一个或多个前因字段和一个或多个后果字段,其中在所述一组已完成的表格上,所述一个或多个前因字段是在所述一个或多个后果字段之前完成的;和
基于识别出的所述一个或多个前因字段和一个或多个后果字段,生成一组关联规则;和
基于所述一组关联规则,训练关联规则模型,
其中基于所述一组历史表格数据确定完成包括在当前表格中的一组未完成字段的当前顺序包括:
确定与当前表格对应的当前表格类型;和
利用历史表格数据的子集来确定完成包含在当前表格中的所述一组未完成字段的顺序,其中所述历史表格数据的子集对应于与所述表格类型匹配的已完成表格的子集。
2.按照权利要求1所述的方法,还包括:
创建基于所述一组关联规则和用户完成的当前表格上的一组已完成的字段,对所述一组未完成字段评分的评分函数。
3.按照权利要求2所述的方法,还包括:
基于当前表格上的所述一组已完成的字段,生成输入向量;
基于所述输入向量,确定要完成的一个或多个推荐字段;
识别所述一组关联规则中的把一个或多个推荐字段中的至少一个指示为后果字段的一个或多个关联规则;
从识别出的一个或多个关联规则中检索前因字段中的一个或多个;
选择所述一组未完成字段的与所述一个或多个前因字段匹配的子集;和
在用户界面上推荐接下来要完成的未完成字段的子集。
4.按照权利要求1所述的方法,还包括:
接收包含完成所述一组未完成字段中的至少一个的数据输入的用户输入;
基于所述用户输入,动态确定完成包含在当前表格中的一组修正后的未完成字段的修正后顺序;和
动态修改用户界面,以指示完成所述一组修正后的未完成字段的修正后顺序。
5.按照权利要求1所述的方法,还包括:
基于其对应的字段类型,把所述一组未完成字段组织成一组未完成字段组;和
显示确定的作为所述一组未完成字段组地完成所述未完成字段的顺序。
6.一种信息处理系统,包括:
一个或多个处理器;
耦接到所述处理器至少之一的存储器;
一组计算机程序指令,所述一组计算机程序指令保存在所述存储器中,并由所述处理器至少之一执行,以便进行权利要求1-5之一中的步骤的动作。
7.一种包含计算机程序代码的计算机可读存储介质,当由信息处理系统执行时,所述计算机程序代码使所述信息处理系统进行权利要求1-5之一中的步骤的动作。
8.一种信息处理系统,包含用于进行权利要求1-5之一中的步骤的动作的装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/265,507 | 2019-02-01 | ||
US16/265,507 US11188837B2 (en) | 2019-02-01 | 2019-02-01 | Dynamic field entry permutation sequence guidance based on historical data analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111523021A CN111523021A (zh) | 2020-08-11 |
CN111523021B true CN111523021B (zh) | 2023-10-10 |
Family
ID=71836563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010068500.4A Active CN111523021B (zh) | 2019-02-01 | 2020-01-21 | 一种信息处理系统及其执行的方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11188837B2 (zh) |
CN (1) | CN111523021B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11250213B2 (en) * | 2019-04-16 | 2022-02-15 | International Business Machines Corporation | Form-based transactional conversation system design |
JP7354697B2 (ja) * | 2019-08-30 | 2023-10-03 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及び情報処理プログラム |
US20220083883A1 (en) * | 2020-09-17 | 2022-03-17 | Servicenow, Inc. | Probabilistic Error Detection and Correction in Form-Based Input of a User Interface |
CN112307029B (zh) * | 2020-11-03 | 2024-06-21 | 彩讯科技股份有限公司 | 账单数据存储和账单生成方法、装置、服务器及存储介质 |
US11513885B2 (en) | 2021-02-16 | 2022-11-29 | Servicenow, Inc. | Autonomous error correction in a multi-application platform |
CN114118035A (zh) * | 2021-11-24 | 2022-03-01 | 深圳市北科瑞声科技股份有限公司 | 表单异常数据识别方法、装置、电子设备及存储介质 |
CN114936310B (zh) * | 2022-05-19 | 2023-10-27 | 南京数睿数据科技有限公司 | 图表显示方法、装置、电子设备和计算机可读介质 |
CN118193544B (zh) * | 2024-05-20 | 2024-07-30 | 浪潮通用软件有限公司 | 一种业务数据的自动标注方法、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1492377A (zh) * | 2002-10-21 | 2004-04-28 | 株式会社日立制作所 | 表格处理系统及方法 |
CN1664810A (zh) * | 2004-03-03 | 2005-09-07 | 微软公司 | 辅助表格填充 |
CN103294340A (zh) * | 2012-02-19 | 2013-09-11 | 国际商业机器公司 | 文本和格式化数据呈现方法和系统 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4899276A (en) * | 1984-08-14 | 1990-02-06 | International Business Machines Corporation | Field-directed screen help technique |
US6202052B1 (en) | 1997-05-08 | 2001-03-13 | Simplification, Llc | Fully-automated system for tax reporting, payment and refund |
US6697056B1 (en) | 2000-01-11 | 2004-02-24 | Workonce Wireless Corporation | Method and system for form recognition |
US7962483B1 (en) * | 2002-12-20 | 2011-06-14 | Oracle International Corporation | Association rule module for data mining |
US7660779B2 (en) | 2004-05-12 | 2010-02-09 | Microsoft Corporation | Intelligent autofill |
US7742958B1 (en) | 2004-11-08 | 2010-06-22 | Hrb Tax Group, Inc. | System and method for preparing a tax return using electronically distributed tax return data |
US7890442B2 (en) | 2006-10-20 | 2011-02-15 | International Business Machines Corporation | Method and system for autocompletion of multiple fields in electronic forms |
US8635127B1 (en) | 2007-09-14 | 2014-01-21 | Hrb Innovations, Inc. | System and method for identifying tax documents to customize preparation of a tax return |
US20090204881A1 (en) | 2008-02-08 | 2009-08-13 | M/S. Scmooth (India) Private Limited | Method and system for knowledge-based filling and verification of complex forms |
US9275029B2 (en) * | 2009-12-02 | 2016-03-01 | International Business Machines Corporation | Automated form layout based upon usage patterns |
US9405426B2 (en) * | 2010-03-01 | 2016-08-02 | Salesforce.Com, Inc. | Method and system for providing an adaptive input user interface for data entry applications |
US20140029046A1 (en) | 2012-07-27 | 2014-01-30 | Xerox Corporation | Method and system for automatically checking completeness and correctness of application forms |
US20140201102A1 (en) | 2013-01-15 | 2014-07-17 | Xerox Corporation | Methods and systems for automatic form filling and validation |
US9727549B2 (en) * | 2014-03-06 | 2017-08-08 | Microsoft Technology Licensing, Llc | Adaptive key-based navigation on a form |
US10365780B2 (en) | 2014-05-05 | 2019-07-30 | Adobe Inc. | Crowdsourcing for documents and forms |
US9436670B2 (en) * | 2014-06-17 | 2016-09-06 | International Business Machines Corporation | Webpage based form entry aid |
US10088979B2 (en) * | 2014-09-26 | 2018-10-02 | Oracle International Corporation | Recasting a form-based user interface into a mobile device user interface using common data |
US10089292B2 (en) * | 2015-09-11 | 2018-10-02 | Adobe Systems Incorporated | Categorization of forms to aid in form completion |
GB201705016D0 (en) * | 2016-03-31 | 2017-05-10 | Sei Global Services Inc | Dynamic generation of electronic forms and documents |
US20180174243A1 (en) * | 2016-12-20 | 2018-06-21 | Intuit Inc. | Systems, methods and apparatus for enhanced navigation in preparation of an electronic tax return |
US10482171B2 (en) * | 2017-11-08 | 2019-11-19 | Adobe Inc. | Digital form optimization |
-
2019
- 2019-02-01 US US16/265,507 patent/US11188837B2/en active Active
-
2020
- 2020-01-21 CN CN202010068500.4A patent/CN111523021B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1492377A (zh) * | 2002-10-21 | 2004-04-28 | 株式会社日立制作所 | 表格处理系统及方法 |
CN1664810A (zh) * | 2004-03-03 | 2005-09-07 | 微软公司 | 辅助表格填充 |
CN103294340A (zh) * | 2012-02-19 | 2013-09-11 | 国际商业机器公司 | 文本和格式化数据呈现方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
US20200250550A1 (en) | 2020-08-06 |
CN111523021A (zh) | 2020-08-11 |
US11188837B2 (en) | 2021-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111523021B (zh) | 一种信息处理系统及其执行的方法 | |
US11119738B2 (en) | Generating data mappings for user interface screens and screen components for an application | |
EP3692438B1 (en) | Automatic generation of a graphic user interface (gui) based on a gui screen image | |
US10606450B2 (en) | Method and system for visual requirements and component reuse driven rapid application composition | |
WO2014008450A1 (en) | Generalization and/or specialization of code fragments | |
CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
CN109829375A (zh) | 一种机器学习方法、装置、设备及系统 | |
WO2020003109A1 (en) | Facet-based query refinement based on multiple query interpretations | |
US20240152700A1 (en) | List-based entity name detection | |
US20160110364A1 (en) | Realtime Ingestion via Multi-Corpus Knowledge Base with Weighting | |
CN112182178A (zh) | 智能问答方法、装置、设备及可读存储介质 | |
CN113516491B (zh) | 推广信息展示方法、装置、电子设备及存储介质 | |
US20190227634A1 (en) | Contextual gesture-based image searching | |
CN112990625A (zh) | 标注任务的分配方法、装置及服务器 | |
KR102712013B1 (ko) | 정보를 송신하는 방법 및 장치 | |
US11775493B2 (en) | Information retrieval system | |
CN110489563B (zh) | 图结构的表示方法、装置、设备及计算机可读存储介质 | |
US20240248901A1 (en) | Method and system of using domain specific knowledge in retrieving multimodal assets | |
CN115269989B (zh) | 对象推荐方法、装置、电子设备和存储介质 | |
WO2018223993A1 (zh) | 一种应用软件搜索方法、装置及服务器 | |
CN113641933B (zh) | 异常网页识别方法、异常站点识别方法及装置 | |
CN112597377A (zh) | 信息提取模块生成方法、信息提取方法及装置 | |
CN112308074A (zh) | 用于生成缩略图的方法和装置 | |
US20200117752A1 (en) | Context Aware Document Advising | |
US20190347078A1 (en) | Generating Application Mock-Ups Based on Captured User Sessions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |