CN116992081A - 页面表单的数据处理方法、装置和用户终端 - Google Patents

页面表单的数据处理方法、装置和用户终端 Download PDF

Info

Publication number
CN116992081A
CN116992081A CN202311100997.3A CN202311100997A CN116992081A CN 116992081 A CN116992081 A CN 116992081A CN 202311100997 A CN202311100997 A CN 202311100997A CN 116992081 A CN116992081 A CN 116992081A
Authority
CN
China
Prior art keywords
target
data
page
user
auxiliary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311100997.3A
Other languages
English (en)
Inventor
叶志远
吴磊
刘东东
刘永贤
胡孙强
冯艳刚
万光明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
CCB Finetech Co Ltd
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN202311100997.3A priority Critical patent/CN116992081A/zh
Publication of CN116992081A publication Critical patent/CN116992081A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本说明书提供了页面表单的数据处理方法、装置和用户终端,涉及人工智能领域。基于该方法,用户终端向用户展示包含有待填写的目标表单的和辅助组件的目标页面;接收并响应用户针对辅助组件的触发操作,通过调用辅助组件,在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;再通过辅助组件获取并根据目标表单的表单数据,生成针对目标表单的目标提示词;通过辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;并将目标物料数据和目标提示词组合后发送至云服务器。云服务器根据目标提示词利用预设的大语言模型处理目标物料数据以得到用于填充目标表单的目标内容数据;用户终端接收并根据目标内容数据,自动填充目标页面中的目标表单。

Description

页面表单的数据处理方法、装置和用户终端
技术领域
本说明书属于人工智能技术领域,尤其涉及页面表单的数据处理方法、装置和用户终端。
背景技术
在许多业务场景中,用户在浏览相关业务网站的相关网页办理具体业务时,常常需要先填写该网页中的网页表单,以提供诸如账户数据、交易信息、身份凭证等相关内容数据,进而相关业务服务器可以基于上述内容数据为用户办理具体业务。
但是,基于现有方法,往往需要用户人工在上述网页表单中手动输入相应的内容数据,导致用户操作较为繁琐、复杂,影响用户的交互体验。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本说明书提供了一种页面表单的数据处理方法、装置和用户终端,能够较好地适用于多种不同的业务场景,辅助用户准确、高效地完成相关页面中表单的自动填写,有效地简化了用户侧的操作,使得用户可以获得较好的交互体验。
本说明书提供了一种页面表单的数据处理方法,应用于用户终端,包括:
向用户展示目标页面;其中,所述目标页面至少包含有待填写的目标表单;所述目标页面还布设有辅助组件;
接收并响应针对所述辅助组件的触发操作,通过辅助组件在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,所述辅助交互悬浮窗内嵌有与目标页面关联的数据接口;
通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;
通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;
将所述目标物料数据和目标提示词组合后发送至云服务器;其中,所述云服务器配置有预设的大语言模型;所述云服务器根据所述目标提示词利用预设的大语言模型处理所述目标物料数据得到用于填写目标表单的目标内容数据;
接收并根据目标内容数据,填充目标页面中的目标表单。
在一个实施例中,通过辅助组件获取目标表单的表单数据,包括:
通过辅助组件确定出辅助交互悬浮窗当前悬停的页面作为目标页面;
在目标页面的网页数据中,通过检索表单结构标签字段,确定出与目标页面中的网页表单结构对应的表单结构区域;其中,所述表单结构标签字段包括:form字段和/或input字段;
从所述目标页面的网页数据的表单结构区域中提取得到目标表单的表单数据。
在一个实施例中,所述网页表单结构包括以下至少之一:输入框、复选框、单选框、表格。
在一个实施例中,在通过辅助组件获取目标表单的表单数据之后,所述方法还包括:
根据目标表单的表单数据,提取得到针对目标表单的关键特征;
根据目标表单的关键特征,查询预设的匹配特征表,以确定出用于填充目标表单的目标物料数据的数据名称和数据类型;
根据目标物料数据的数据名称和数据类型,生成相应的物料数据上传提示信息;
通过辅助交互悬浮窗向用户展示所述物料数据上传提示信息,以提示用户通过辅助交互悬浮窗上传符合要求的目标物料数据。
在一个实施例中,所述目标物料数据的数据类型包括以下至少之一:文本数据、语音数据、图片数据、视频数据。
在一个实施例中,根据目标表单的表单数据生成针对目标表单的目标提示词,包括:
利用预设的中间交互结构层处理所述目标表单的表单数据,以生成针对目标表单的目标提示词;其中,所述中间交互结构层包括LangChain。
在一个实施例中,所述预设的大语言模型至少包含有物料分类器,以及多个预设的语义处理模型;
相应的,所述云服务器根据所述目标提示词利用预设的大语言模型处理所述目标物料数据以得到用于填写目标表单的目标内容数据,包括:云服务器利用预设的大语言模型通过物料分类器处理目标物料数据,确定出目标物料数据的数据类型;利用预设的大语言模型根据目标物料数据的数据类型,从多个预设的语义处理模型中确定出相匹配的目标语义处理模型;利用预设的大语言模型通过目标语义处理模型处理目标物料数据,以从目标物料数据中提取得到中间语义处理结果;利用预设的大语言模型根据预设的拼接规则,拼接中间语义处理结果和目标提示词,得到拼接后的中间语义处理结果;利用预设的大语言模型处理所述拼接后的中间语义处理结果,得到用于填写目标表单的目标内容数据。
在一个实施例中,在通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据之后,所述方法还包括:
通过辅助交互悬浮窗接收用户输入的自定义提示词;
根据所述自定义提示词和目标提示词,生成联合提示词;
将所述目标物料数据和联合提示词组合后发送至云服务器。
在一个实施例中,接收并根据目标内容数据,填充目标页面中的目标表单,包括:
接收云服务器反馈的目标内容数据;
通过辅助交互悬浮窗向用户展示目标内容数据;
接收并响应用户针对所述辅助交互悬浮框中的目标内容数据的确认操作,将目标内容数据进行格式转换,得到与目标表单相匹配的格式转换后的目标内容数据;
通过与目标页面关联的数据接口,利用所述格式转换后的目标内容数据,填充目标页面中的目标表单。
在一个实施例中,在通过辅助交互悬浮窗向用户展示目标内容数据之后,所述方法还包括:
通过辅助交互悬浮窗接收用户针对目标内容数据的修改数据;
根据所述修改数据,修改目标内容数据,得到修改后的目标内容数据。
在一个实施例中,在通过辅助交互悬浮窗接收用户针对目标内容数据的修改数据之后,所述方法还包括:
组合目标内容数据、修改数据、目标物料数据,以及目标提示词,得到模型训练数据;
将所述模型训练数据发送至云服务器;其中,所述云服务器利用所述模型训练数据训练并更新预设的大语言模型。
本说明书还提供了一种页面表单的数据处理装置,应用于用户终端,包括:
第一展示模块,用于向用户展示目标页面;其中,所述目标页面至少包含有待填写的目标表单;所述目标页面还布设有辅助组件;
第二展示模块,用于接收并响应针对所述辅助组件的触发操作,通过辅助组件在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,所述辅助交互悬浮窗内嵌有与目标页面关联的数据接口;
第一处理模块,用于通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;
接收模块,用于通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;
发送模块,用于将所述目标物料数据和目标提示词组合后发送至云服务器;其中,所述云服务器配置有预设的大语言模型;所述云服务器根据所述目标提示词利用预设的大语言模型处理所述目标物料数据得到用于填写目标表单的目标内容数据;
第二处理模块,用于接收并根据目标内容数据,填充目标页面中的目标表单。
本说明书还提供了一种用户终端,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述页面表单的数据处理方法的相关步骤。
本说明书还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被处理器执行时实现以下步骤:向用户展示目标页面;其中,所述目标页面至少包含有待填写的目标表单;所述目标页面还布设有辅助组件;接收并响应针对所述辅助组件的触发操作,通过辅助组件在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,所述辅助交互悬浮窗内嵌有与目标页面关联的数据接口;通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;将所述目标物料数据和目标提示词组合后发送至云服务器;其中,所述云服务器配置有预设的大语言模型;所述云服务器根据所述目标提示词利用预设的大语言模型处理所述目标物料数据得到用于填写目标表单的目标内容数据;接收并根据目标内容数据,填充目标页面中的目标表单。
本说明书还提供了一种计算机程序产品,包含有计算机程序,所述计算机程序被处理器执行时实现所述页面表单的数据处理方法的相关步骤。
基于本说明书提供的页面表单的数据处理方法、装置和用户终端,用户终端可以先在向用户展示的包含有待填写的目标表单的目标页面中提前布设好相应的辅助组件。相应的,用户终端可以接收并响应用户针对该辅助组件的触发操作,通过调用该辅助组件,在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,该辅助交互悬浮窗内嵌有与目标页面关联的数据接口。再通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;通过辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;并将目标物料数据和目标提示词组合后发送至云服务器。云服务器根据目标提示词利用预设的大语言模型处理目标物料数据以得到用于填写目标表单的目标内容数据;再将该目标内容数据反馈给用户终端。用户终端接收并根据目标内容数据,自动填充目标页面中的目标表单。从而能够较好地适用于多种不同的业务场景,辅助用户准确、高效地完成相关页面中表单的自动填写,有效地简化了用户侧的操作,使得用户可以获得较好的交互体验。
附图说明
为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书的一个实施例提供的页面表单的数据处理方法的流程示意图;
图2是在一个场景示例中,应用本说明书实施例提供的页面表单的数据处理方法的一种实施例的示意图;
图3是在一个场景示例中,应用本说明书实施例提供的页面表单的数据处理方法的一种实施例的示意图;
图4是在一个场景示例中,应用本说明书实施例提供的页面表单的数据处理方法的一种实施例的示意图;
图5是在一个场景示例中,应用本说明书实施例提供的页面表单的数据处理方法的一种实施例的示意图;
图6是在一个场景示例中,应用本说明书实施例提供的页面表单的数据处理方法的一种实施例的示意图;
图7是在一个场景示例中,应用本说明书实施例提供的页面表单的数据处理方法的一种实施例的示意图;
图8是本说明书的一个实施例提供的用户终端的结构组成示意图;
图9是本说明书的一个实施例提供的页面表单的数据处理装置的结构组成示意图;
图10是在一个场景示例中,应用本说明书实施例提供的页面表单的数据处理方法的一种实施例的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
需要说明的是,在本说明书中所涉及到的与用户,或者用户操作相关的信息数据,均为在用户知晓且同意的前提下获取、使用的;且,对于上述信息数据的获取、存储、处理、使用等均符合相关的法律规定。
参阅图1所示,本说明书实施例提供了一种页面表单的数据处理方法。其中,该方法具体应用于用户终端一侧。具体实施时,该方法可以包括以下内容:
S101:向用户展示目标页面;其中,所述目标页面至少包含有待填写的目标表单;所述目标页面还布设有辅助组件;
S102:接收并响应针对所述辅助组件的触发操作,通过辅助组件在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,所述辅助交互悬浮窗内嵌有与目标页面关联的数据接口;
S103:通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;
S104:通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;
S105:将所述目标物料数据和目标提示词组合后发送至云服务器;其中,所述云服务器配置有预设的大语言模型;所述云服务器根据所述目标提示词利用预设的大语言模型处理所述目标物料数据得到用于填写目标表单的目标内容数据;
S106:接收并根据目标内容数据,填充目标页面中的目标表单。
基于上述实施例,当用户需要填写目标页面中的目标表单时,首先,用户终端可以启动预先布设于目标页面中的被用户触发的辅助组件,并通过该辅助组件自动获取并根据当前所处的目标页面中的目标表单数据,生成对应的目标提示词;同时,通过该辅助组件所生成的辅助交互悬浮窗接收用户上传的目标物料数据。接着,用户终端可以将上述目标提示词和目标物料数据发送至云端服务器,以便云端服务器可以利用预设的大语言模型根据上述目标提示词,有针对地处理目标物料数据,自动提取得到用于填充目标表单的目标内容数据。进而,用户终端可以根据云服务器所反馈的目标内容数据,完成目标表单的自动填充。从而一方面,可以有效地简化用户侧的操作,使得用户可以获得较好的交互体验;另一方面,也使得技术人员不需要针对不同的业务场景分别单独设计和编写相对应的表单自动填充程序,有效地降低了处理成本,能够较好地适用于多种不同的业务场景。
在一些实施例中,上述页面表单的数据处理方法具体可以应用于用户终端一侧。
具体的,参阅图2所示,上用户终端可以与云服务器通过有线或无线的方式相连。其中,上述云服务器可以配置有预先训练好的预设的大语言模型。上述用户终端可以配置有用于辅助用户完成页面表单的自动填写的辅助组件,以及中间交互结构层。
其中,上述云服务器具体可以包括一种应用于云服务平台一侧,能够实现数据传输、数据处理等功能的后台服务器。具体的,所述云服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述云服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述云服务器所包含的服务器的数量。所述云服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
上述用户终端具体可以包括一种应用于用户一侧,能够实现数据采集、数据传输等功能的前端。具体的,所述用户终端例如可以为台式电脑、平板电脑、笔记本电脑、智能手机等电子设备。或者,所述用户终端也可以为能够运行于上述电子设备中的软件应用。例如,可以是在智能手机上运行的云服务平台的客户端APP,或者浏览器APP等。
具体实施时,用户可以使用用户终端浏览与云服务平台关联的网页页面。当用户浏览到包含有待用户填写的诸如输入框、复选框、单选框等结构的目标表单的网页页面时,用户终端可以将该网页页面确定为目标页面。在向用户展示的包含有目标表单的目标页面中还会展示有上述辅助组件。具体可以参阅图3所示。
当用户希望自动完成目标表单填充时,可以通过点击目标页面中的辅助组件,以发起对应的触发操作。
相应的,用户终端接收并响应上述触发操作,通过辅助组件在目标页面中展示出与辅助组件关联的辅助交互悬浮窗。具体可以参阅图4所示。同时,用户终端还会通过辅助组件,通过处理目标页面的网页数据,自动获取目标表单的表单数据;并且,还通过辅助组件调用预设的中间交互结构层(例如,LangChain)基于所获得目标表单的表单数据,生成针对该目标表单的,且预设的大语言模型能够识别和处理的目标提示词(例如,Prompt)。
此外,用户终端还可以通过辅助组件,利用所述辅助交互悬浮窗接收用户上传的用于填充目标表单的目标物料数据(例如,用户的身份证图片等)。
进一步,用户终端可以将上述目标物料数据和目标提示词组合后发送至云服务器。
云服务器在接收到目标物料数据和目标提示词后,可以利用预设的大语言模型基于上述目标提示词,区分具体的业务场景,有针对性地处理该目标物料数据,以从目标物料数据中提取得到与该业务场景匹配的,能够用于填充目标表单的目标内容数据;并将该目标内容数据返回给用户终端。
用户终端通过辅助交互浮窗向用户展示上述目标内容数据。
用户在确认辅助交互浮窗所展示的目标内容数据没有问题的情况下,可以根据提示信息,将辅助交互浮窗中展示的目标内容数据拖移到目标页面的目标表单中,以发起针对该目标内容数据的确认操作。
用户终端接收并响应上述确认操作,通过辅助组件将目标内容数据转换为相匹配的格式(例如,JSON格式)后,利用辅助交互悬浮窗有与目标页面之间的数据接口,将上述目标内容数据自动填充到目标表单中。
这样,用户不需要自己人工手动地填写目标页面中的目标表单,通过辅助组件就能高效、精准地帮助用户完成目标表单的自动填写,从而有效地简化了用户操作,使得用户能够获得较好的交互体验。
在一些实施例中,上述目标页面具体可以理解为用户当前想要访问浏览的网页页面。其中,上述目标页面具体可以包括含有待填写的目标表单。其中,上述目标表单具体可以包括狭义上的待用户填写的数据表等表格类的表单结构,也可以包括广义上的待用户填写的诸如输入框、复选框、单选框等非表格类的表单结构。
在目标页面包含有的目标表单的情况下,用户终端准备并向用户展示的目标页面进一步还可以布设有辅助组件。其中,上述辅助组件具体可以理解为一种用于辅助用户完成目标表单的自动填写的插件程序。
需要说明的是,上述目标页面具体可以是任意一个包含有待填写的目标表单的网页页面。上述辅助组件不与某个具体的目标页面对应,而是与部署于云服务器的预设的大语言模型组合后能够较为全面、有效地适用于多种不同业务场景下的包含不同目标表单的不同目标页面,具有较广泛的适用性。这样,技术人员不需要针对不同业务场景下包含不同网页表单的不同网页页面单独分别设计开发相对应的用于自动填写网页表单的插件程序,而只需要设计并开发上述辅助组件这一个插件程序就能够解决绝大部分的业务场景下的绝大部分的网页页面的表单的自动填写。从而能够有效地降低插件开发成本,获得较好的适用性。
在一些实施例中,上述辅助组件的关联程序代码具体可以内嵌于用户终端的浏览器,或者客户端中。当用户使用用户终端向云服务器发送关于目标页面的访问请求后,用户终端会接收到云服务器返回的关于目标页面的网页数据。用户终端的浏览器或者客户端在根据上述目标页面的网页数据,生成并准备向用户展示出目标页面的同时,辅助组件的关联程序代码会自动对该目标页面的网页数据进行表单结构标签字段的检测,以确定待展示的目标页面中是否存在需要用户填写的目标表单;在确定目标页面中存在上述目标表单的情况下,辅助组件的关联程序代码会在基于目标页面的网页数据生成的目标页面中布设辅助组件。进而,用户终端可以通过浏览器或客户端向用户展示上述布设有辅助组件的目标页面。
进一步,上述辅助组件的关联程序代码还可以在目标页面中辅助组件的邻近位置处设置关于使用辅助组件自动填表的提示信息,以引导用户发起相关触发操作,以启动辅助组件,协助用户完成自动填表。
在一些实施例中,参阅图5所示,上述通过辅助组件获取目标表单的表单数据,具体实施时,可以包括以下内容:
S1:通过辅助组件确定出辅助交互悬浮窗当前悬停的页面作为目标页面;
S2:在目标页面的网页数据中,通过检索表单结构标签字段,确定出与目标页面中的网页表单结构对应的表单结构区域;其中,所述表单结构标签字段包括:form字段和/或input字段;
S3:从所述目标页面的网页数据的表单结构区域中提取得到目标表单的表单数据。
具体实施时,用户终端通过辅助组件可以基于HTML(Hyper Text MarkupLanguage,超文本标记语言)语言规则,在目标页面的网页数据中,通过检索诸如form字段和/或input字段等表单结构标签字段,找出与目标页面中的网页表单结构对应的表单结构对应的表单结构区域;进一步可以从目标页面的网页数据的表单结构区域中提取出相应键值字段(具体的例如,name、id、value等字段),以及其他的参数信息,作为目标表单的表单数据。
具体的,上述目标表单数据具体可以包括:目标表单的名称、目标表单中待填写的项目项的名称、与目标表单关联的业务的业务信息等等。
基于上述实施例,用户终端可以通过辅助组件,自动获取得到目标页面中的目标表单的表单数据。
在一些实施例中,所述网页表单结构包括以下至少之一:输入框、复选框、单选框、表格等。当然,需要说明的是,上述所列举的网页表单结构只是一种示意性说明。具体实施时,根据具体的业务场景和处理需求,上述网页表单结构还可以包括其他类型的输入结构。对此,本说明书不作限定。
在一些实施例中,参阅图6所示,在通过辅助组件获取目标表单的表单数据之后,所述方法具体实施时,还可以包括以下内容:
S1:根据目标表单的表单数据,提取得到针对目标表单的关键特征;
S2:根据目标表单的关键特征,查询预设的匹配特征表,以确定出用于填充目标表单的目标物料数据的数据名称和数据类型;
S3:根据目标物料数据的数据名称和数据类型,生成相应的物料数据上传提示信息;
S4:通过辅助交互悬浮窗向用户展示所述物料数据上传提示信息,以提示用户通过辅助交互悬浮窗上传符合要求的目标物料数据。
具体实施时,用户终端可以从目标表单的表单数据中提取并根据业务信息,确定该目标表单对应的目标业务场景,获取目标业务场景的场景标识;同时,从目标表单的表单数据中提取出目标表单的名称和目标表单中项目项的名称进行组合得到目标表单的表单信息;再拼接目标业务场景的场景标识和目标表单的表单信息,得到目标表单的关键特征。
上述预设的匹配特征表具体可以包含有与预设的表单关键特征对应的物料数据的数据名称和数据类型。上述预设的匹配特征表具体可以是预先通过对大量不同业务场景下待填写的网页表单,以及所使用到的物料数据进行聚类整理所得到的。
其中,与一个预设的表单的关键特征对应的物料数据的数据名称可以有一个,但数据类型可以有多个。例如,与某个预设的表单的关键特征对应的物料数据的数据名称为身份证这一个名称,但数据类型可以包括:图片数据、文本数据、视频数据等多种数据类型,供用户选择使用。
基于上述实施例,用户终端可以通过辅助组件自动确定出针对目标表单的需要用户提供并上传的目标物料数据的数据名称和数据类型,生成并通过辅助交互悬浮窗向用户展示相关的物料数据上传提示信息,以引导用户准确地上传符合要求的目标物料数据,进一步简化了用户操作提高了用户的交互体验。相应的,用户可以根据上述物料数据上传提示信息,准备好对应的目标物料数据,并通过辅助交互悬浮窗上传该目标物料数据。
在一些实施例中,所述目标物料数据的数据类型具体可以包括以下至少之一:文本数据、语音数据、图片数据、视频数据等等。当然,需要说明的是,上述所列举的物料数据的数据类型只是一种示意性说明。具体实施时,根据具体情况和处理需求,上述物料数据的数据类型还可以包括其他数据类型。对此,本说明书不作限定。
在一些实施例中,用户终端在通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据之后,进一步,还可以根据目标物料数据的数据名称和数据类型,对用户当前上传的目标物料数据进行检测,以确定用户当前上传的目标物料数据是否符合要求;如果检测发现用户当前上传的目标物料数据的数据名称存在错误,和/或,数据类型存在错误,用户终端可以生成对应的报错提示;并通过辅助交互悬浮窗向用户展示该报错提示,以提示并引导用户及时地修改并上传符合要求的目标物料数据。
在一些实施例中,上述根据目标表单的表单数据生成针对目标表单的目标提示词,具体实施时,可以包括以下内容:利用预设的中间交互结构层处理所述目标表单的表单数据,以生成针对目标表单的目标提示词;其中,所述中间交互结构层包括LangChain。
其中,上述中间交互结构层具体可以部署于用户终端本地,并与相关的数据接口,以及本地数据库相连。
具体的,上述中间交互结构层包括LangChain。其中,LangChain具体可以是指一种用于开发基于语言模型的应用程序开发框架。总体来说,LangChain可以理解为一个面向用户程序和预设的大语言模型之间的中间层。其中,上述LangChain至少可以包括:内容识别模型、提示词模板(Prompts)等结构。进一步,上述LangChain还可以包括:索引部分、代理部分、记忆部分等其他结构。
其中,上述提示词模板包含有多个预设提示词,以及各个预设提示词与内容数据之间的映射关系。上述提示词(Prompt)具体可以理解为一种针对人工智能模型的指令参数,包含有按照指定格式编写的描述字段。基于上述提示词,预设的大语言模型可以有针对性地采用合适的策略或方式处理物料数据,以提取得到所需要的内容数据。其中,上述提示词具体可以包括:目标表单中待填充的表单数据的项目项标识、目标表单所隶属的业务场景、目标表单中表单数据的数据格式,以及针对目标表单填写时的特殊指示参数(例如,指示所填写的数值数据只保留小数点前一位等)。
上述预设的大语言模型具体可以理解为预先通过对大量涉及不同业务场景的不同网页表单的样本数据训练得到的,能够同时有效处理不同业务场景下的不同数据类型的物料数据的大语言模型(Large Language Model,LLM,简称大模型)。其中,大语言模型具体可以一种深度学习模型,能够同时处理多种不同数据类型的物料数据,得到相对应的基于自然语言文本或理解语言文本的具体语义结果。
在本实施例中,可以利用上述LangChain作为中间交互结构层来通过处理目标表单数据,确定出需要从目标物料数据中提取的目标内容数据;并生成预设的大语言模型能够识别,且能够引导预设的大语言模型有针对性地处理目标物料数据提取上述目标内容数据的指令参数,作为目标提示词。
具体的,可以利用上述LangChain作为中间交互结构层调用Template功能指令语句(例如,代码语句fstring_template),结合提示词模板,检索目标页面的网页数据的代码语句,找出与提示词模板相匹配的关键字段(作为content信息);再将上述关键字段封装成一个JSON串输出,得到对应的目标提示词。
具体实施时,用户终端可以通过辅助组件利用内容识别模型处理目标表单的表单数据,确定出待提取的目标内容数据;再根据待提取的目标内容数据,从提示词模板中确定出相匹配的预设提示词,作为目标提示词。
基于上述实施例,用户终端可以通过中间交互结构层高效地自动提取得到与预设的大语言模型相适配的目标提示词。
在一些实施例中,所述预设的大语言模型至少包含有物料分类器,以及多个预设的语义处理模型;其中,预设的语义处理模型对应一种数据类型,支持对该数据类型的物料数据进行基于自然语言(NLP)的粗粒度的语义处理,得到并输出相对应的,属于统一的文本类型的,基于粗粒度的中间语义处理结果。物料分类器用于获取并根据输入的物料数据的数据特征,确定并输出相对应的数据类型。
相对的,上述预设的大语言模型则可以支持结合提示词,对上述中间语义处理结果进行细粒度的语义处理;并基于细粒度的语义处理结果,有针对性地提取并输出所需要的用于填写目标表单的目标内容数据。
相应的,所述云服务器根据所述目标提示词利用预设的大语言模型处理所述目标物料数据以得到用于填写目标表单的目标内容数据,具体实施时,包括以下内容:云服务器利用预设的大语言模型通过物料分类器处理目标物料数据,确定出目标物料数据的数据类型;利用预设的大语言模型根据目标物料数据的数据类型,从多个预设的语义处理模型中确定出相匹配的目标语义处理模型;利用预设的大语言模型通过目标语义处理模型处理目标物料数据,以从目标物料数据中提取得到中间语义处理结果;利用预设的大语言模型根据预设的拼接规则,拼接中间语义处理结果和目标提示词,得到拼接后的中间语义处理结果;利用预设的大语言模型处理所述拼接后的中间语义处理结果,得到用于填写目标表单的目标内容数据。
具体实施时,可以根据预设的拼接规则,使用指定的拼接符号(例如,符号“/”)按序依次拼接目标提示词和中间语义处理结果,以得到预设的大语言模型支持处理的拼接后的中间语义处理结果。
具体实施时,预设的大语言模型可以先根据与预设的拼接规则对应的预设的读取规则,从拼接后的中间语义处理结果中先读取出目标提示词;再根据目标提示词从预先训练学习的多个内置的策略中选中并使用相匹配的策略有针对性地处理该拼接后的中间语义处理结果,以进行细粒度的精处理,得到并输出精度较高的目标内容数据。
具体实施前,云服务器可以分别利用相应的样本数据训练得到大语言模型、物料分类器,以及多个预设的语义处理模型;再组合上述大语言模型、物料分类器,以及多个预设的语义处理模型得到上述预设的大语言模型。在得到预设的大语言模型之后,进一步还可以针对某些比较关注的业务场景,获取并利用该业务场景的样本数据,对预设的大语言模型进行针对性的微调操作(fine-tune),从而可以得到与业务场景相对更匹配、使用效果相对更好的预设的大语言模型。
在一些实施例中,用户终端可以将目标物料数据和目标提示词组合后发送至云服务器。云服务器在接收到目标物料数据和目标提示词之后,还可以先确定出目标物料数据的数据类型;再将数据类型与目标提示词按照一定规则组合后,得到与目标物料数据关联的辅助指令信息;拼接上述辅助指令信息与目标物料数据,得到处理后的目标物料数据;再将上述处理后的目标物料数据输入至预设的大语言模型中,并运行预设的大语言模型,从而可以使得预设的大语言模型基于辅助指令信息,采用相匹配的策略或方式来处理目标物料数据,以得到所需要的,能够用于填充目标页面的目标表单的目标内容数据。
基于上述实施例,可以通过云服务器根据目标提示词利用预设的大语言模型自动处理目标物料数据,以获得所需要的目标内容数据。
在一些实施例中,在通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据之后,所述方法具体实施时,还可以包括以下内容:
S1:通过辅助交互悬浮窗接收用户输入的自定义提示词;
S2:根据所述自定义提示词和目标提示词,生成联合提示词;
S3:将所述目标物料数据和联合提示词组合后发送至云服务器。
具体实施时,用户终端还可以通过辅助交互悬浮窗接收用户输入的自定义提示词,再根据上述自定义提示和目标提示词生成得到准确度相对更高、效果相对更好的联合提示词。
此外,用户终端还可以通过辅助交互悬浮窗向用户展示出自动生成的目标提示词,并接收用户通过辅助交互悬浮窗输入的针对该目标提示词的修改参数;根据修改参数修改目标提示词,以得到修改后的目标提示词。
在一些实施例中,参阅图7所示,上述接收并根据目标内容数据,填充目标页面中的目标表单,具体实施时,可以包括以下内容:
S1:接收云服务器反馈的目标内容数据;
S2:通过辅助交互悬浮窗向用户展示目标内容数据;
S3:接收并响应用户针对所述辅助交互悬浮框中的目标内容数据的确认操作,将目标内容数据进行格式转换,得到与目标表单相匹配的格式转换后的目标内容数据;
S4:通过与目标页面关联的数据接口,利用所述格式转换后的目标内容数据,填充目标页面中的目标表单。
具体实施时,云服务器可以将所得到的目标内容数据发送给用户终端。用户终端在接收到目标内容数据之后,可以通过交互悬浮窗向用户展示出上述目标内容数据。用户在确定目标内容数据没问题的情况下,可以发起确认操作。相应的,用户终端可以响应上述确认操作,利用上述目标内容数据完成目标表单的自动填充。
其中,格式转换后的目标内容数据具体可以是基于JOSN格式的目标内容数据。
在一些实施例中,在通过辅助交互悬浮窗向用户展示目标内容数据之后,所述方法具体实施时,还可以包括以下内容:
S1:通过辅助交互悬浮窗接收用户针对目标内容数据的修改数据;
S2:根据所述修改数据,修改目标内容数据,得到修改后的目标内容数据。
基于上述实施例,用户终端还可以通过辅助交互悬浮窗与用户进行交互,对目标内容数据进行相应的修改,以便得到准确度相对更高、效果相对更好的目标内容数据。
在一些实施例中,在通过辅助交互悬浮窗接收用户针对目标内容数据的修改数据之后,所述方法具体实施时,还可以包括以下内容:
S1:组合目标内容数据、修改数据、目标物料数据,以及目标提示词,得到模型训练数据;
S2:将所述模型训练数据发送至云服务器;其中,所述云服务器利用所述模型训练数据训练并更新预设的大语言模型。
在本实施例中,遭到用户修改的目标内容数据,可以理解为预设的大语言模型的处理效果不理想的数据。针对这类目标内容数据,用户终端可以先在本地查询获取与该目标内容数据对象的目标物料数据、目标提示词,以修改数据;再组合目标内容数据、目标物料数据、目标提示词,以及修改数据,得到一组模型训练数据;并将组模型训练数据存入本地缓存中。每间隔预设的时间段(例如,24小时),用户终端搜集本地缓存中存储的模型训练数据,并将上述模型训练数据发送至云服务器。相应的,云服务器可以每间隔预设的时间段,利用所接收到的模型训练数据继续训练并根据预设的大语言模型,以不断地提高预设的大语言模型的模型精度。
在一些实施例中,上述利用所述格式转换后的目标内容数据,填充目标页面中的目标表单,具体实施时,可以包括:在目标页面的网页数据中搜索与目标内容数据对应的键值字段;根据搜索到的键值字段,确定出目标表单中与目标内容数据对象的目标填充区域;将所述目标内容数据,填充至该目标填充区域中。
在一些实施例中,在填充目标页面中的目标表单之后,所述方法具体实施时,还可以包括以下内容:根据目标页面中已填充的目标表单,响应用户的业务请求,为该用户进行相关业务办理。
由上可见,基于本说明书实施例提供的页面表单的数据处理方法,用户终端可以先在向用户展示的包含有待填写的目标表单的目标页面中提前布设好相应的辅助组件。相应的,用户终端可以接收并响应用户针对该辅助组件的触发操作,通过调用该辅助组件,在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,该辅助交互悬浮窗内嵌有与目标页面关联的数据接口。再通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;通过辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;并将目标物料数据和目标提示词组合后发送至云服务器。云服务器根据目标提示词利用预设的大语言模型处理目标物料数据以得到用于填写目标表单的目标内容数据;再将该目标内容数据反馈给用户终端。用户终端接收并根据目标内容数据,自动填充目标页面中的目标表单。从而能够较好地适用于多种不同的业务场景,辅助用户准确、高效地完成相关页面中表单的自动填写,有效地简化了用户侧的操作,使得用户可以获得较好的交互体验。
本说明书实施例还提供一种用户终端,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:向用户展示目标页面;其中,所述目标页面至少包含有待填写的目标表单;所述目标页面还布设有辅助组件;接收并响应针对所述辅助组件的触发操作,通过辅助组件在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,所述辅助交互悬浮窗内嵌有与目标页面关联的数据接口;通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;将所述目标物料数据和目标提示词组合后发送至云用户终端;其中,所述云用户终端配置有预设的大语言模型;所述云用户终端根据所述目标提示词利用预设的大语言模型处理所述目标物料数据得到用于填写目标表单的目标内容数据;接收并根据目标内容数据,填充目标页面中的目标表单。
为了能够更加准确地完成上述指令,参阅图8所示,本说明书实施例还提供了另一种具体的用户终端,其中,所述用户终端包括网络通信端口801、处理器802以及存储器803,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口801,具体可以用于接收用户发起的针对目标页面的访问请求。
所述处理器802,具体可以用于响应访问请求,向用户展示目标页面;其中,所述目标页面至少包含有待填写的目标表单;所述目标页面还布设有辅助组件;接收并响应针对所述辅助组件的触发操作,通过辅助组件在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,所述辅助交互悬浮窗内嵌有与目标页面关联的数据接口;通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;将所述目标物料数据和目标提示词组合后发送至云用户终端;其中,所述云用户终端配置有预设的大语言模型;所述云用户终端根据所述目标提示词利用预设的大语言模型处理所述目标物料数据得到用于填写目标表单的目标内容数据;接收并根据目标内容数据,填充目标页面中的目标表单。
所述存储器803,具体可以用于存储相应的指令程序。
在本实施例中,所述网络通信端口801可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的端口,也可以是负责进行FTP数据通信的端口,还可以是负责进行邮件数据通信的端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器802可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器803可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供了一种基于上述页面表单的数据处理方法的计算机可读存储介质,所述计算机可读存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:向用户展示目标页面;其中,所述目标页面至少包含有待填写的目标表单;所述目标页面还布设有辅助组件;接收并响应针对所述辅助组件的触发操作,通过辅助组件在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,所述辅助交互悬浮窗内嵌有与目标页面关联的数据接口;通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;将所述目标物料数据和目标提示词组合后发送至云服务器;其中,所述云服务器配置有预设的大语言模型;所述云服务器根据所述目标提示词利用预设的大语言模型处理所述目标物料数据得到用于填写目标表单的目标内容数据;接收并根据目标内容数据,填充目标页面中的目标表单。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机可读存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
本说明书还提供了一种计算机程序产品,包含有计算机程序,所述计算机程序被处理器执行时实现以下步骤:向用户展示目标页面;其中,所述目标页面至少包含有待填写的目标表单;所述目标页面还布设有辅助组件;接收并响应针对所述辅助组件的触发操作,通过辅助组件在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,所述辅助交互悬浮窗内嵌有与目标页面关联的数据接口;通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;将所述目标物料数据和目标提示词组合后发送至云服务器;其中,所述云服务器配置有预设的大语言模型;所述云服务器根据所述目标提示词利用预设的大语言模型处理所述目标物料数据得到用于填写目标表单的目标内容数据;接收并根据目标内容数据,填充目标页面中的目标表单。
参阅图9所示,在软件层面上,本说明书实施例还提供了一种页面表单的数据处理装置,该装置具体可以包括以下的结构模块:
第一展示模块901,具体可以用于向用户展示目标页面;其中,所述目标页面至少包含有待填写的目标表单;所述目标页面还布设有辅助组件;
第二展示模块902,具体可以用于接收并响应针对所述辅助组件的触发操作,通过辅助组件在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,所述辅助交互悬浮窗内嵌有与目标页面关联的数据接口;
第一处理模块903,具体可以用于通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;
接收模块904,具体可以用于通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;
发送模块905,具体可以用于将所述目标物料数据和目标提示词组合后发送至云服务器;其中,所述云服务器配置有预设的大语言模型;所述云服务器根据所述目标提示词利用预设的大语言模型处理所述目标物料数据得到用于填写目标表单的目标内容数据;
第二处理模块906,具体可以用于接收并根据目标内容数据,填充目标页面中的目标表单。
在一些实施例中,上述第一处理模块903具体实施时,可以按照以下方式通过辅助组件获取目标表单的表单数据:通过辅助组件确定出辅助交互悬浮窗当前悬停的页面作为目标页面;在目标页面的网页数据中,通过检索表单结构标签字段,确定出与目标页面中的网页表单结构对应的表单结构区域;其中,所述表单结构标签字段包括:form字段和/或input字段;从所述目标页面的网页数据的表单结构区域中提取得到目标表单的表单数据。
在一些实施例中,所述网页表单结构具体可以包括以下至少之一:输入框、复选框、单选框、表格等。
在一些实施例中,在通过辅助组件获取目标表单的表单数据之后,所述装置具体实施时,还可以用于:根据目标表单的表单数据,提取得到针对目标表单的关键特征;根据目标表单的关键特征,查询预设的匹配特征表,以确定出用于填充目标表单的目标物料数据的数据名称和数据类型;根据目标物料数据的数据名称和数据类型,生成相应的物料数据上传提示信息;通过辅助交互悬浮窗向用户展示所述物料数据上传提示信息,以提示用户通过辅助交互悬浮窗上传符合要求的目标物料数据。
在一些实施例中,所述目标物料数据的数据类型具体可以包括以下至少之一:文本数据、语音数据、图片数据、视频数据等。
在一些实施例中,在一些实施例中,上述第一处理模块903具体实施时,可以按照以下方式根据目标表单的表单数据生成针对目标表单的目标提示词:利用预设的中间交互结构层处理所述目标表单的表单数据,以生成针对目标表单的目标提示词;其中,所述中间交互结构层包括LangChain。
在一些实施例中,所述预设的大语言模型至少包含有物料分类器,以及多个预设的语义处理模型;
相应的,所述装置具体实施时可以按照以下方式根据所述目标提示词利用预设的大语言模型处理所述目标物料数据以得到用于填写目标表单的目标内容数据:利用预设的大语言模型通过物料分类器处理目标物料数据,确定出目标物料数据的数据类型;利用预设的大语言模型根据目标物料数据的数据类型,从多个预设的语义处理模型中确定出相匹配的目标语义处理模型;利用预设的大语言模型通过目标语义处理模型处理目标物料数据,以从目标物料数据中提取得到中间语义处理结果;利用预设的大语言模型根据预设的拼接规则,拼接中间语义处理结果和目标提示词,得到拼接后的中间语义处理结果;利用预设的大语言模型处理所述拼接后的中间语义处理结果,得到用于填写目标表单的目标内容数据。
在一些实施例中,在通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据之后,所述装置具体实施时,还可以用于:通过辅助交互悬浮窗接收用户输入的自定义提示词;根据所述自定义提示词和目标提示词,生成联合提示词;将所述目标物料数据和联合提示词组合后发送至云服务器。
在一些实施例中,上述第二处理模块906具体实施时,可以按照以下方式,接收并根据目标内容数据,填充目标页面中的目标表单:接收云服务器反馈的目标内容数据;通过辅助交互悬浮窗向用户展示目标内容数据;接收并响应用户针对所述辅助交互悬浮框中的目标内容数据的确认操作,将目标内容数据进行格式转换,得到与目标表单相匹配的格式转换后的目标内容数据;通过与目标页面关联的数据接口,利用所述格式转换后的目标内容数据,填充目标页面中的目标表单。
在一些实施例中,在通过辅助交互悬浮窗向用户展示目标内容数据之后,所述装置具体实施时,还可以用于:通过辅助交互悬浮窗接收用户针对目标内容数据的修改数据;根据所述修改数据,修改目标内容数据,得到修改后的目标内容数据。
在一些实施例中,在通过辅助交互悬浮窗接收用户针对目标内容数据的修改数据之后,所述装置具体实施时,还可以用于:组合目标内容数据、修改数据、目标物料数据,以及目标提示词,得到模型训练数据;将所述模型训练数据发送至云服务器;其中,所述云服务器利用所述模型训练数据训练并更新预设的大语言模型。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
由上可见,基于本说明书实施例提供的页面表单的数据处理装置,能够较好地适用于多种不同的业务场景,辅助用户准确、高效地完成相关页面中表单的自动填写,有效地简化了用户侧的操作,使得用户可以获得较好的交互体验。
在一个具体的场景示例中,可以应用本说明书提供的页面表单的数据处理方法实现基于大模型的通用网页表单自动填充。可以参阅图10所述,具体实施过程可以包括以下内容。
具体实施前,构建并训练大模型(例如,预设的大语言模型)。其中,该大模型支持多模态形式的数据处理,例如能够同时处理图片、文字、语音等不同类型的数据。
同时,配置并安装浮窗组件(例如,辅助组件)。具体可以将浮窗组件集成到网页中;或者,构建基于浮窗组件的浏览器插件,启用该浏览器插件后能够将上述浮窗自动嵌入网页中,无需再作另外集成。
具体实施时,当用户打开网页后遇到需要填写表单(例如,目标表单)的时候,可以直接在页面右侧所展示浮窗与大模型进行交互即可。通过该浮窗,用户可以上传图片、文字、文档、语音等信息(例如,目标物料数据)。相应的,系统内部会自动识别网页的表单,并结合上传内容使用LangChain生成prompt提示词(例如,目标提示词),然后将内容发送给大模型,大模型会生成所需要的内容(例如,目标内容数据)返回到浮窗,用户只需要拖拽此内容到对应表单即可完成自动填写。
具体的,可以包括以下步骤:
S1:用户打开一个需要填写表单的网页(例如,目标页面);
S2:用户进入网页右侧浮窗与系统进行相应交互;
S3:用户根据表单内容上传物料(这里以身份证照片来举例),上传之后,系统会获取当前悬停网页的表单信息(通过网页Host或者遍历HTML的form表单获取offset,也可以通过手动输入表单信息来辅助生成提示词),内部使用LangChain来生成提示词;
S4:提示词生成完成后发送给大模型进行处理;
S5:大模型处理完成后返回信息,系统会根据表单内容来处理这些信息(一般处理成JSON);
S6:处理完成后,用户就可以通过拖拽的方式将结果拖动到表单处,表单内容就自动填充好了。
通过上述场景示例,验证了本说明书提供的页面表单的数据处理方法能够提供一种通用的用于表单内容自动填充的工具;并基于大模型,做到根据表单情况,自动从文本、图片、语音中抽取相应内容,填入表单,从而能够简化用户操作,提升用户体验,提高处理效率。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机可读存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

Claims (15)

1.一种页面表单的数据处理方法,其特征在于,应用于用户终端,包括:
向用户展示目标页面;其中,所述目标页面至少包含有待填写的目标表单;所述目标页面还布设有辅助组件;
接收并响应针对所述辅助组件的触发操作,通过辅助组件在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,所述辅助交互悬浮窗内嵌有与目标页面关联的数据接口;
通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;
通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;
将所述目标物料数据和目标提示词组合后发送至云服务器;其中,所述云服务器配置有预设的大语言模型;所述云服务器根据所述目标提示词利用预设的大语言模型处理所述目标物料数据得到用于填写目标表单的目标内容数据;
接收并根据目标内容数据,填充目标页面中的目标表单。
2.根据权利要求1所述的方法,其特征在于,通过辅助组件获取目标表单的表单数据,包括:
通过辅助组件确定出辅助交互悬浮窗当前悬停的页面作为目标页面;
在目标页面的网页数据中,通过检索表单结构标签字段,确定出与目标页面中的网页表单结构对应的表单结构区域;其中,所述表单结构标签字段包括:form字段和/或input字段;
从所述目标页面的网页数据的表单结构区域中提取得到目标表单的表单数据。
3.根据权利要求2所述的方法,其特征在于,所述网页表单结构包括以下至少之一:输入框、复选框、单选框、表格。
4.根据权利要求1所述的方法,其特征在于,在通过辅助组件获取目标表单的表单数据之后,所述方法还包括:
根据目标表单的表单数据,提取得到针对目标表单的关键特征;
根据目标表单的关键特征,查询预设的匹配特征表,以确定出用于填充目标表单的目标物料数据的数据名称和数据类型;
根据目标物料数据的数据名称和数据类型,生成相应的物料数据上传提示信息;
通过辅助交互悬浮窗向用户展示所述物料数据上传提示信息,以提示用户通过辅助交互悬浮窗上传符合要求的目标物料数据。
5.根据权利要求4所述的方法,其特征在于,所述目标物料数据的数据类型包括以下至少之一:文本数据、语音数据、图片数据、视频数据。
6.根据权利要求1所述的方法,其特征在于,根据目标表单的表单数据生成针对目标表单的目标提示词,包括:
利用预设的中间交互结构层处理所述目标表单的表单数据,以生成针对目标表单的目标提示词;其中,所述中间交互结构层包括LangChain。
7.根据权利要求1所述的方法,其特征在于,所述预设的大语言模型至少包含有物料分类器,以及多个预设的语义处理模型;
相应的,所述云服务器根据所述目标提示词利用预设的大语言模型处理所述目标物料数据以得到用于填写目标表单的目标内容数据,包括:云服务器利用预设的大语言模型通过物料分类器处理目标物料数据,确定出目标物料数据的数据类型;利用预设的大语言模型根据目标物料数据的数据类型,从多个预设的语义处理模型中确定出相匹配的目标语义处理模型;利用预设的大语言模型通过目标语义处理模型处理目标物料数据,以从目标物料数据中提取得到中间语义处理结果;利用预设的大语言模型根据预设的拼接规则,拼接中间语义处理结果和目标提示词,得到拼接后的中间语义处理结果;利用预设的大语言模型处理所述拼接后的中间语义处理结果,得到用于填写目标表单的目标内容数据。
8.根据权利要求1所述的方法,其特征在于,在通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据之后,所述方法还包括:
通过辅助交互悬浮窗接收用户输入的自定义提示词;
根据所述自定义提示词和目标提示词,生成联合提示词;
将所述目标物料数据和联合提示词组合后发送至云服务器。
9.根据权利要求1所述的方法,其特征在于,接收并根据目标内容数据,填充目标页面中的目标表单,包括:
接收云服务器反馈的目标内容数据;
通过辅助交互悬浮窗向用户展示目标内容数据;
接收并响应用户针对所述辅助交互悬浮框中的目标内容数据的确认操作,将目标内容数据进行格式转换,得到与目标表单相匹配的格式转换后的目标内容数据;
通过与目标页面关联的数据接口,利用所述格式转换后的目标内容数据,填充目标页面中的目标表单。
10.根据权利要求9所述的方法,其特征在于,在通过辅助交互悬浮窗向用户展示目标内容数据之后,所述方法还包括:
通过辅助交互悬浮窗接收用户针对目标内容数据的修改数据;
根据所述修改数据,修改目标内容数据,得到修改后的目标内容数据。
11.根据权利要求10所述的方法,其特征在于,在通过辅助交互悬浮窗接收用户针对目标内容数据的修改数据之后,所述方法还包括:
组合目标内容数据、修改数据、目标物料数据,以及目标提示词,得到模型训练数据;
将所述模型训练数据发送至云服务器;其中,所述云服务器利用所述模型训练数据训练并更新预设的大语言模型。
12.一种页面表单的数据处理装置,其特征在于,应用于用户终端,包括:
第一展示模块,用于向用户展示目标页面;其中,所述目标页面至少包含有待填写的目标表单;所述目标页面还布设有辅助组件;
第二展示模块,用于接收并响应针对所述辅助组件的触发操作,通过辅助组件在目标页面中展示出与辅助组件关联的辅助交互悬浮窗;其中,所述辅助交互悬浮窗内嵌有与目标页面关联的数据接口;
第一处理模块,用于通过辅助组件获取目标表单的表单数据;并根据目标表单的表单数据生成针对目标表单的目标提示词;
接收模块,用于通过所述辅助交互悬浮窗接收用户上传的与目标表单对应的目标物料数据;
发送模块,用于将所述目标物料数据和目标提示词组合后发送至云服务器;其中,所述云服务器配置有预设的大语言模型;所述云服务器根据所述目标提示词利用预设的大语言模型处理所述目标物料数据得到用于填写目标表单的目标内容数据;
第二处理模块,用于接收并根据目标内容数据,填充目标页面中的目标表单。
13.一种用户终端,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至11中任一项所述方法的步骤。
14.一种计算机可读存储介质,其特征在于,其上存储有计算机指令,所述指令被处理器执行时实现权利要求1至11中任一项所述方法的步骤。
15.一种计算机程序产品,其特征在于,包含有计算机程序,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述方法的步骤。
CN202311100997.3A 2023-08-29 2023-08-29 页面表单的数据处理方法、装置和用户终端 Pending CN116992081A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311100997.3A CN116992081A (zh) 2023-08-29 2023-08-29 页面表单的数据处理方法、装置和用户终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311100997.3A CN116992081A (zh) 2023-08-29 2023-08-29 页面表单的数据处理方法、装置和用户终端

Publications (1)

Publication Number Publication Date
CN116992081A true CN116992081A (zh) 2023-11-03

Family

ID=88526752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311100997.3A Pending CN116992081A (zh) 2023-08-29 2023-08-29 页面表单的数据处理方法、装置和用户终端

Country Status (1)

Country Link
CN (1) CN116992081A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117289841A (zh) * 2023-11-24 2023-12-26 浙江口碑网络技术有限公司 基于大语言模型的交互方法和装置、存储介质和电子设备
CN117474090A (zh) * 2023-11-20 2024-01-30 北京传通科技有限公司 一种提示词分享的方法与装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117474090A (zh) * 2023-11-20 2024-01-30 北京传通科技有限公司 一种提示词分享的方法与装置
CN117289841A (zh) * 2023-11-24 2023-12-26 浙江口碑网络技术有限公司 基于大语言模型的交互方法和装置、存储介质和电子设备

Similar Documents

Publication Publication Date Title
CN106155686B (zh) 界面生成方法、装置和系统
JP6488508B2 (ja) ウェブページのアクセス方法、装置、デバイス及びプログラム
US10817613B2 (en) Access and management of entity-augmented content
WO2019079071A1 (en) INTEGRATION OF EXTERNAL DATA PROCESSING TECHNIQUES IN A CLOUD COLLABORATION PLATFORM
CN116992081A (zh) 页面表单的数据处理方法、装置和用户终端
CN106649543B (zh) 记录阅读进度的方法、装置及终端
US20210149842A1 (en) System and method for display of document comparisons on a remote device
CN109144493A (zh) 业务规则的生成方法、电子装置及可读存储介质
US20190147029A1 (en) Method and system for generating conversational user interface
WO2014154033A1 (en) Method and apparatus for extracting web page content
US9285964B2 (en) Automatically recovering and maintaining focus
US20200225927A1 (en) Methods and systems for automating computer application tasks using application guides, markups and computer vision
CN106951495A (zh) 用于呈现信息的方法和装置
EP3961426A2 (en) Method and apparatus for recommending document, electronic device and medium
CN111611797A (zh) 基于Albert模型的预测数据标注的方法、装置及设备
TW201610713A (zh) 在文件中識別且呈現相關報告實物
CN113568621A (zh) 一种页面埋点的数据处理方法和装置
WO2015056816A1 (en) Method and system for conversion of smart phone applications to basic phone applications
CN114741014B (zh) 网页表单填写方法及装置
EP3654206A1 (en) System and method for producing transferable, modular web pages
KR101809362B1 (ko) Ocr 시스템을 이용한 거래정보 관리 시스템과 이를 이용한 전산 거래정보 관리방법
CN110515618A (zh) 页面信息录入优化方法、设备、存储介质及装置
CN111967273B (zh) 对话管理系统、方法和规则引擎设备
KR102336676B1 (ko) 웹 페이지 작성 기능을 제공하기 위한 전자 장치 및 그 동작 방법
CN116680032A (zh) 应用操作引导方法和装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination