CN112328871B - 一种基于rpa模块的回复生成方法、装置、设备及存储介质 - Google Patents

一种基于rpa模块的回复生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112328871B
CN112328871B CN202011162826.XA CN202011162826A CN112328871B CN 112328871 B CN112328871 B CN 112328871B CN 202011162826 A CN202011162826 A CN 202011162826A CN 112328871 B CN112328871 B CN 112328871B
Authority
CN
China
Prior art keywords
reply
user
service data
fields
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011162826.XA
Other languages
English (en)
Other versions
CN112328871A (zh
Inventor
武文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jizhi Digital Technology Co Ltd
Original Assignee
Shenzhen Jizhi Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jizhi Digital Technology Co Ltd filed Critical Shenzhen Jizhi Digital Technology Co Ltd
Priority to CN202011162826.XA priority Critical patent/CN112328871B/zh
Publication of CN112328871A publication Critical patent/CN112328871A/zh
Application granted granted Critical
Publication of CN112328871B publication Critical patent/CN112328871B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种基于RPA模块的回复生成方法、装置、设备及存储介质,该方法包括:接收用户输入的问题;当所述问题用于查询业务数据时,通过所述RPA模块获取所述问题对应的业务数据;从多个维度对所述业务数据进行分类,得到多个类别标签,所述多个类别标签中的每个类别标签用于标识回复模板是否包括对应的字段;根据基于所述多个类别标签生成的回复模板,利用自然语言处理算法生成针对所述问题的答复。因此,该方法利用了非固定的回复模板生成非固定的答复,能够生成针对用户所提出的问题的答复。

Description

一种基于RPA模块的回复生成方法、装置、设备及存储介质
技术领域
本申请涉及人工智能(artificial intelligence,AI)技术领域,特别是涉及一种基于机器人流程自动化(Robotic Process Automation,RPA)模块的回复生成方法、装置、设备及存储介质。
背景技术
客服系统能够对用户所提出的问题进行解答,人工客服在对用户提出的问题进行解答时,需要打开若干网站,查询相应的信息,然后根据查询到的信息以及自身的经验为用户进行解答。
一方面,当大量用户同时询问时,人工客服的工作量巨大,难以及时回复每一个用户所提出的问题;另一方面,不同的人工客服的业务水平不同,用户难以得到理想的答案。
为此,现有技术中提供了一种智能客服的解决方案。该解决方案中,智能客服能够针对用户所提出的问题,根据固定的回复模板生成答复。然而,智能客服根据固定的回复模板生成的答复存在僵化的问题,僵化的答复存在无法解决用户所提出的问题的情况。
发明内容
为了解决上述技术问题,本申请提供了一种基于RPA模块的回复生成的方法、装置、设备及存储介质,利用了非固定的回复模板生成非固定的答复,能够生成针对用户所提出的问题的答复。
本申请实施例公开了如下技术方案:
第一方面,本申请提供了一种基于RPA模块的回复生成方法,包括:
接收用户输入的问题;
当所述问题用于查询业务数据时,通过所述RPA模块获取所述问题对应的业务数据;
从多个维度对所述业务数据进行分类,得到多个类别标签,所述多个类别标签中的每个类别标签用于标识回复模板是否包括对应的字段;
根据基于所述多个类别标签生成的回复模板,利用自然语言处理算法生成针对所述问题的答复。
可选的,所述从多个维度对所述业务数据进行分类,得到多个类别标签,包括:
根据回复模板的可选字段确定多个维度;
根据所述多个维度,利用随机森林算法对所述业务数据进行分类,得到多个类别标签。
可选的,所述根据基于所述多个类别标签生成的回复模板,利用自然语言处理算法生成针对所述问题的答复,包括:
根据所述业务数据填充所述回复模板中的目标字段,所述目标字段为所述多个类别标签中标识所述回复模板包括的字段;
通过随机森林算法进行回归得到所述目标字段的相邻字段;
根据所述目标字段和所述相邻字段生成针对所述问题的答复。
可选的,通过所述RPA模块获取所述问题对应的业务数据,包括:
利用槽位提取技术从所述问题中提取至少一个关键词,根据所述至少一个关键词获得至少一个查询任务;
通过RPA模块执行所述至少一个查询任务,得到与所述问题对应的业务数据。
可选的,其特征在于,所述方法还包括:
当未查找到与所述问题对应的业务数据时,向所述用户提供人工查询入口。
可选的,所述接收用户输入的问题,包括:
通过用户界面接收所述用户输入的问题;或者,
通过麦克风接收所述用户输入的问题。
可选的,所述方法还包括:
通过所述用户界面呈现针对所述问题的答复;或者,
通过扬声器播放针对所述问题的答复。
第二方面,本申请提供了一种基于RPA模块的回复生成装置,包括:
接收模块,用于接收用户输入的问题;
查询模块,用于当所述问题用于查询业务数据时,通过所述RPA模块获取所述问题对应的业务数据;
分类模块,用于从多个维度对所述业务数据进行分类,得到多个类别标签,所述多个类别标签中的每个类别标签用于标识回复模板是否包括对应的字段;
生成模块,用于根据基于所述多个类别标签生成的回复模板,利用自然语言处理算法生成针对所述问题的答复。
第三方面,本申请提供了一种基于RPA模块的回复生成设备,所述设备包括:
存储器,用于存储计算机程序,并将所述计算机程序传输给所述处理器;
处理器,用于根据所述计算机程序中的指令执行第一方面中任一项所述的方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储基于RPA模块的回复生成系统所用的计算机软件指令,当所述计算机可读存储介质在计算机上运行时,使得计算机可以执行上述第一方面中任一项所述的回复生成方法。
由上述技术方案可以看出,本申请具有以下优点:
申请提供了一种基于RPA模块的回复生成方法、装置、设备及存储介质,该方法是从多个维度对用于回复的数据进行分类后,得到多个类别标签,然后基于该多个类别标签来确定最终的回复模板。具体地包括:接收用户输入的问题。当所述问题用于查询业务数据时,通过所述RPA模块获取所述问题对应的业务数据。从多个维度对所述业务数据进行分类,得到多个类别标签,所述多个类别标签中的每个类别标签用于标识回复模板是否包括对应的字段。根据基于所述多个类别标签生成的回复模板,利用自然语言处理算法生成针对所述问题的答复。
由于回复模板是基于业务数据来确定的,业务数据不同时,回复模板不同。其中,业务数据可以是单据数据,例如报销单据等。该回复模板是根据业务数据动态变化的模板,而不是固定的模板,从而解决的答复僵化的问题。
进一步的,该方法通过所述RPA模块获取所述问题对应的业务数据时,能够实现无侵入地获取业务数据。进而,对于数据提供方而言,无需开发特定的数据库接口。对于数据获取方而言,无需投入大量的人力去获取业务数据,而是通过RPA模块来模拟人进行操作来获取业务数据,提高获取业务数据的效率的同时,还能够提高数据提供方系统的安全性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种回复生成方法的场景架构图;
图2为本申请实施例提供的一种回复生成方法的流程图;
图3为本申请实施例提供的一种用户界面的示意图;
图4为本申请实施例提供的又一种用户界面的示意图;
图5为本申请实施例提供的再一种用户界面的示意图;
图6为本申请实施例提供的另一种用户界面的示意图;
图7为本申请实施例提供的又一种用户界面的示意图;
图8为本申请实施例提供的再一种用户界面的示意图;
图9为本申请实施例提供的另一种用户界面的示意图;
图10为本申请实施例提供的一种回复生成装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,首先对本申请涉及的一些技术术语进行介绍。
自然语言是日常生活中人与人之间交流所使用的语言。例如,自然语言可以是汉语、英语、法语等。本申请中,用户向智能客服提出问题时所使用的语言是自然语言的一种。而用户向智能客服提出问题时,智能客服通过自然语言处理(Natural LanguageProcessing,NLP)技术,对用户所提出的问题进行识别得到用户的意图,根据用户的意图生成相应的答复,进而实现人机之间的自然语言通信。
自然语言处理技术可以包括自然语言理解(Natural Language Understanding,NLU)技术和自然语言生成(Natural Language Generation,NLG)技术这两部分。自然语言理解技术是指使计算机能够理解人类社会的自然语言,例如以上介绍的汉语、英语等。自然语言生成技术是指使计算机能够表达人类社会的自然语言。计算机根据自然语言理解技术得到关键信息,基于该关键信息和内部预先设置的表达形式,通过自然语言生成技术来生成自然语言形式的答复。例如,在上述智能客服对用户所提出的问题进行识别的过程,利用的是自然语言理解技术,而根据识别出的用户的意图生成相应的答复的过程利用的是自然语言生成技术。
而现有的智能客服在针对用户提出的问题进行答复时,由于智能客服所采用的回复模板固定,进而生成的答复存在僵化的问题,即智能客服无法根据相关数据和业务需求动态地生成自然语言形式的答复来回复用户,问题解决效率低。
为了解决上述答复僵化的问题,本申请提供了一种基于RPA模块的回复生成方法,该方法是从多个维度对用于回复的数据进行分类后,得到多个类别标签,然后基于该多个类别标签来确定最终的回复模板。具体地包括:接收用户输入的问题。当所述问题用于查询业务数据时,通过所述RPA模块获取所述问题对应的业务数据。从多个维度对所述业务数据进行分类,得到多个类别标签,所述多个类别标签中的每个类别标签用于标识回复模板是否包括对应的字段。根据基于所述多个类别标签生成的回复模板,利用自然语言处理算法生成针对所述问题的答复。
由于回复模板是基于业务数据来确定的,业务数据不同时,回复模板不同。其中,业务数据可以是单据数据,例如报销单据等。该回复模板是根据业务数据动态变化的模板,而不是固定的模板,从而解决的答复僵化的问题。
进一步的,该方法通过所述RPA模块获取所述问题对应的业务数据时,能够实现无侵入地获取业务数据。进而,对于数据提供方而言,无需开发特定的数据库接口。对于数据获取方而言,无需投入大量的人力去获取业务数据,而是通过RPA模块来模拟人进行操作来获取业务数据,提高获取业务数据的效率的同时,还能够提高数据提供方系统的安全性。
可以理解,本申请提供的回复生成方法能够应用于数据处理设备,该数据处理设备可以是任意包含处理器如中央处理器(Central Processing Unit/Processor,CPU)的设备。在具体实现时,数据处理设备可以是终端,包括但不限于现有的、正在研发的或将来研发的智能手机、平板电脑、膝上型个人计算机、桌面型个人计算机、人工智能机器人等,当然,数据处理设备也可以是服务器。需要说明的是,该数据处理设备可以是独立的终端设备或者服务器,也可以是多个终端设备或者多个服务器形成的集群。
本申请提供的回复生成方法以应用程序或软件的形式存储于数据处理设备,数据处理设备通过执行上述应用程序或软件,以实现本申请提供的回复生成方法。为了方便介绍,后文均以终端作为数据处理设备,对本申请提供的回复生成方法进行介绍。
为了使本申请的技术方案更加清楚,易于理解,下面将结合具体场景对本申请提供的回复生成方法进行介绍。
参见图1所示的回复生成方法的场景架构图,该场景展示了用户101与终端102上的智能客服的互动。其中,用户101通过终端102向智能客服提出问题,当智能客服确定该问题用于查询业务数据时,智能客服根据该问题获取对应的业务数据,从多个维度对该业务数据进行分类,得到多个类别标签。其中,多个类别标签中的每个类别标签用于标识回复模板是否包括对应的字段,进而,智能客服能够根据得到的多个类别标签来生成回复模板,根据基于多个类别标签生成的回复模板,利用自然语言处理算法生成针对问题的答复。由于回复模板是基于业务数据来动态确定的,业务数据不同时,回复模板不同。即该回复模板是根据业务数据动态变化的模板,而不是固定的模板,从而解决的答复僵化的问题。
接下来,将从终端的角度对本申请提供的回复生成方法进行介绍。参见图2所示的回复生成方法的流程图,该方法包括:
S201:终端102接收用户101输入的问题。
本实施例中,问题由用户101输入,该问题是需要向用户101提供答复的语句或短语。举例说明,例如问题可以是“我的报销状态到哪一步了?”。描述该问题的语句并不局限于具有问号的语句,具有疑问、反问语气的语句。在一些实施例中,问题还可以是短语,例如问题可以是“查一下报销信息”。
用户101可以在终端102上的用户界面输入上述问题,参见图3所示的用户界面的示意图,用户101可以通过对话窗口300来向终端102输入问题,终端102接收到用户101输入的问题后,终端102上的智能客服将会对用户101输入的问题进行处理。
在该对话窗口300的对话区302会显示智能客服的回复与用户101输入的问题。例如,当用户101刚刚进入到对话窗口300的界面时,终端102上的智能客服可以先对用户101进行问候,或者提示用户101进行下一步操作。具体地,终端102上的智能客服可以先回复“请输入您想要查询的问题。”用户101通过对话区302看到终端102上的智能客服的提示后,可以在对话窗口300的输入区301上输入用户101需要提出的问题。举例说明,用户101可以在输入区301输入“查一下报销信息”。用户101在输入区301输入问题后,通过点击输入区301中的发送按钮3011,即可使终端102上的智能客服接收用户101输入的问题。当用户101点击输入区301的发送按钮3011后,用户101输入的问题会在对话区302进行显示。
以上介绍的是用户101通过文字输入的方式来输入问题,在另一种方式中,用户101还可以通过语音方式输入想要提出的问题,进而用户101需要通过终端102内置或外接的麦克风进行语音输入。举例说明,参见图4所示的用户界面的示意图,用户101可以通过长按输入区301中语音图标3012,同时用户101说出“查一下报销信息”,当用户101松开语音图标3012时,即可使终端102上的智能客服接收到用户101通过语音方式输入的问题。
本申请不限定终端102接收用户101输入的问题的方式,用户101可以通过文字方式输入问题,也可以通过语音方式输入问题。当用户101通过语音方式输入问题时,该终端102包括麦克风。该麦克风可以是终端102内置的麦克风,还可以是外接的麦克风,例如:带有麦克风功能的耳机。
S202:当所述问题用于查询业务数据时,终端102通过所述RPA模块获取所述问题对应的业务数据。
终端102在接收入用户101输入的问题后,可以通过自然语言理解技术对用户101提出的问题进行识别。具体地,可以在终端102中部署经过深度学习训练后得到识别模型,该识别模型能够对用户101提出的问题进行识别。终端102将接收到的用户101提出的问题发送给识别模型,识别模型基于接收到的问题来生成识别结果,并将识别结果返回给终端102,进而终端102根据识别结果确定用户101是否想要查询业务数据。
举例说明,当接收到的问题包括“报销”、“单据号”、“查询业务数据”等时,识别模型生成用户101想要进行查询业务数据的识别结果。例如,用户101提出的问题可以为“查一下报销信息”,由于该问题中包括“报销”,识别模型生成用户101想要查询业务数据的识别结果,并将该识别结果返回给终端102,进而终端102能够确定用户101想要查询业务数据。
终端102确定用户101所提出的问题是查询业务数据时,终端102还可以判断用户101是否具有查询业务数据的权限。具体地,终端102还会确定用户101的用户标识,根据用户标识,来判断该用户101是否具有查询业务数据的权限。其中,用户标识是用来唯一标识用户的标识,不同用户的用户标识不同。例如,用户A的用户标识为“00001”,用户B的用户标识为“00002”。用户A与其用户标识“00001”对应,用户B与其用户标识“00002”对应。即确定用户A后,即可唯一确定用户A的用户标识为“00001”。
本实施例中,终端102上的存储器中可以保存具有查询业务数据权限的用户标识,当终端102确定用户101的用户标识后,即可通过判断该用户标识是否保存在存储器中来判断该用户101是否具有查询业务数据的权限。以上述介绍的用户A和用户B为例,其中,用户A具有查询业务数据的权限,用户B不具有查询业务数据的权限。因此,终端102上的存储器中保存有用户标识“00001”,用户标识“00002”没有在存储器中保存。当终端102确定用户A的用户标识“00001”后,即可在存储器中查找到用户标识“00001”,判断用户A具有查询业务数据的权限。当终端102确定用户B的用户标识“00002”后,但未在存储器中查找到用户标识“00002”,判断用户B不具有查询业务数据的权限。
当终端102判断用户101不具有查询业务数据的权限时,终端102上的智能客服可以通过用户界面向用户101进行反馈,提示用户101不具有查询业务数据的权限。
需要说明,以上仅是介绍了一种终端102判断用户101是否具有查询业务数据的权限的实施方式,终端102还可以通过其他实施方式来判断用户101是否查询业务数据的权限。在另一些实施方式中,终端102也可以不判断用户101是否具有查询业务数据的权限,即本申请中终端102判断用户101是否具有查询业务数据的权限是可选的步骤。
当终端102判断用户101具有查询业务数据的权限时,终端102利用槽位提取技术,从用户101输入的问题中提取至少一个关键词,根据至少一个关键词获得至少一个查询任务。
其中,槽位提取技术可以是基于正则表达式的槽位提取技术,关键词可以是用户101所提出的问题中的一个字段。举例说明,参见图5所示的用户界面的示意图。当用户101所提出的问题为“查询报销单据,单据号为:202010”。其中,“报销”可以为一个关键词,“单据号”可以为一个关键词,“202010”可以为一个关键词。终端102确定关键词“报销”、“单据号”和“202010”后,即可生成查询任务。本实施例中不限定关键词的个数,终端102也可以仅根据一个关键词,或根据多个关键词的组合来生成查询任务。
在一些场景中,用户101提出的问题可能为“查询报销单据”,参见图6所示的用户界面的示意图,该问题中并未给出单据号,终端102接收到用户101提出的问题后,根据该问题确定用户101查询业务数据时,终端102上的智能客服会提示用户输入单据号。例如,终端102上的智能客服向用户101回复“请输入需要查询的报销单的单据号?”,进而用户101可以在输入区301输入需要查询的单据号,例如“202010”,并发送给终端102上的智能客服。此时,终端102根据关键词“202010”生成查询任务。终端102生成查询任务后,通过终端102上机器人流程自动化(Robotic Process Automation,RPA)模块执行查询任务,得到查询任务对应的业务数据。
其中,机器人流程自动化的核心是通过自动化、智能化技术来“替代人”进行重复性流程化操作,从而有效提升工作效率,减少错误。因此,基于RPA模块,终端102能够自动的模仿人从数据提供方的系统的前端获取对应的业务数据,而不是通过数据库接口从数据提供方的系统的数据库获取,进而实现无侵入地获取业务数据。对于数据提供方而言,无需向数据获取提供特定的数据库接口,数据获取方无法通过数据库接口的方式对数据提供方的系统的数据库进行访问,同时数据提供方无需对数据库接口的相关程序的开发,有效地保证了单据系统的安全性。
S203:终端102从多个维度对所述业务数据进行分类,得到多个类别标签,所述多个类别标签中的每个类别标签用于标识回复模板是否包括对应的字段。
终端102获取到业务数据后,可以根据业务数据动态地确定回复模板,并结合回复模板生成便于阅读的自然语言形式的答复后,再反馈给用户101。其中,多个维度是终端102通过回复模板中的可选字段确定。多个类别标签是终端102从多个维度对业务数据进行分类,得到的分类结果。终端102确定多个类别标签后,根据多个类别标签中的每个类别标签来判断最终的回复模板包括的字段。
为了便于本领域技术人员理解,下面结合具体的回复模板进行举例说明。回复模板包括多个可选字段:当前单据状态字段、签收时间字段、当前审批人字段、预计支付时间字段等。终端102能够根据该回复模板中包括的多个可选字段,确定多个维度,即当前数据状态维度、签收时间维度、当前审批人维度和预计支付时间维度。终端102根据确定的4个维度,利用随机森林算法对业务数据进行分类,得到4个类别标签,即当前数据状态类别标签、签收时间类别标签、当前审批人类别标签和预计支付时间类别标签。作为一种示例,以类别标签为“1”时,确定目标模板中包括该类别标签对应的字段,以类别标签为“0”时,确定目标模板中不包括该类别标签对应的字段。例如,终端102确定当前数据状态类别标签、签收时间类别标签、当前审批人类别标签和预计支付时间类别标签依次为“1”、“1”、“1”和“0”时,则终端102确定最终的回复模板包括三个字段:当前单据状态字段、签收时间字段和当前审批人字段。需要说明的是,上述三个字段是终端102需要进行填充的字段,即终端102将该字段对应的字段值填充到该字段中。
S204:终端102根据基于所述多个类别标签生成的回复模板,利用自然语言处理算法生成针对所述问题的答复。
终端102基于多个类别标签生成最终的回复模板后,根据业务数据对最终的回复模板中的目标字段进行填充,其中,目标字段为多个类别标签标识回复模板中包括的字段。具体地,终端102内部预先定义了业务规则,业务规则中存在业务数据中的数据与回复模板中的目标字段的映射关系。进而,终端102能够将业务数据中的数据作为目标字段的字段值填充到目标字段中。
为了便于理解,下面以具体地业务数据为例,例如:业务数据可以为单据数据。对上述终端102将业务数据中的数据填充到目标字段进行介绍。具体地业务数据如下表所示:
其中,业务数据中的“复审组名”项目对应的数据为“-”,表示复审组名对应的数据为空,以上的相似的表示形式均为该项目对应的数据为空,后续不再一一解释。
作为一种可能的实现方式,终端102根据上述业务数据后确定的最终答复模板包括的目标字段包括当前单据状态字段、签收时间字段和当前审批人字段时,终端102根据业务规则中存储的映射关系来对目标字段进行填充。例如映射关系可以是项目“付款状态”与当前单据状态字段之间的映射关系,当终端102确定需要填充的字段包括当前单据状态字段时,终端102将业务数据中的项目“付款状态”对应的数据“未付款”作为当前单据状态字段的字段值,将“未付款”填充到当前单据状态字段中。终端102对于其他字段的填充方式与此相似,故不再赘述。
终端102确定最终的回复模板中的目标字段后,还需要确定该目标字段的相邻字段,根据目标字段和相邻字段来生成针对用户101提出的问题的答复。其中,相邻字段可以为目标字段中的一个字段的前一个字段。作为一种示例,当目标字段为包括当前单据状态字段、签收时间字段和当前审批人字段时,终端102需要确定当前单据状态字段的前一个字段“当前单据状态”。“当前单据状态”为当前单据状态字段的一个相邻字段。同理,终端102也能够确定分别签收时间字段和当前审批人字段的相邻字段。具体地,终端102通过随机森林算法进行回归得到目标字段的相邻字段。参见图7所示的用户界面的示意图,终端102根据目标字段和相邻字段生成的答复可以为“当前单据状态:未付款。签收时间:2019-08-1617:00:00。当前审批人:张三。”。
在一些场景中,目标字段中会包括需要进行计算才能确定该字段的字段值。例如:目标字段包括预计支付时间字段时,则需要对预计支付时间字段的字段值进行计算。本实施例中,以上述介绍的业务数据为例,终端102将业务数据中的项目“影像上传时间”对应的数据“2019-08-16 17:00:00”作为预计支付时间字段的影响值,终端102在影响值的基础上增加N个工作日得到的日期作为预计支付时间字段的字段值,将该字段值充到预计支付时间字段中。其中,N为正整数,本实施例中不具体限定N的值,N可以为2或3,本领域技术人员可以根据实际需要选择N的值。
需要说明的是,当终端102确定最终的回复模板中包括预计支付时间字段时,终端102可以在计算预计支付时间字段的字段值的同时,填充最终的回复模板中的其他目标字段,其他目标字段指字段值不需要进行计算得到的字段。本实施例中终端102也可以先对其他目标字段的字段值进行计算后,再对目标字段中其他目标字段和非其他目标字段进行填充,对此本实施例中并不限定。其中,非其他目标字段为目标字段中除其他目标字段外的字段。
当终端102生成答复后,终端102可以通过用户界面呈现针对问题的答复,或者通过扬声器播放针对问题的答复。当通过扬声器的方式播放答复时,该终端102包括扬声器。参见图7所示的用户界面的示意图,终端102上的智能客服可以同时呈现文字答复和语音答复,当用户点击按钮3021时,则终端102会通过扬声器的方式播放答复。
此外,参见图8所示的用户界面的示意图,为了保证终端102上智能客服的鲁棒性,智能客服生成的答复后,会在对话区302向用户询问,“以上答复是否解决的您的问题?”,同时终端102的输入区301还会给出两个选项:“已解决”和“未解决”。参见9所示的用户界面的示意图,当用户101点击“未解决”时,智能客服会在对话区302回复“请联系人工客服。”,同时终端102的输入区301还会给出人工查询入口,来建议用户101联系人工客服。
以上介绍了基于RPA模块的回复生成方法,下面介绍本申请实施例提供的基于RPA模块的回复生成装置,参见图10所示的示意图,该装置包括:
接收模块1001,用于接收用户输入的问题;查询模块1002,用于当所述问题用于查询业务数据时,通过所述RPA模块获取所述问题对应的业务数据;分类模块1003,用于从多个维度对所述业务数据进行分类,得到多个类别标签,所述多个类别标签中的每个类别标签用于标识回复模板是否包括对应的字段;生成模块1004,用于根据基于所述多个类别标签生成的回复模板,利用自然语言处理算法生成针对所述问题的答复。
由于回复模板是基于业务数据来确定的,业务数据不同时,回复模板不同。其中,业务数据可以是单据数据,例如报销单据等。该回复模板是根据业务数据动态变化的模板,而不是固定的模板,从而解决的答复僵化的问题。
进一步的,该装置通过所述RPA模块获取所述问题对应的业务数据时,能够实现无侵入地获取业务数据。进而,对于数据提供方而言,无需开发特定的数据库接口。对于数据获取方而言,无需投入大量的人力去获取业务数据,而是通过RPA模块来模拟人进行操作来获取业务数据,提高获取业务数据的效率的同时,还能够提高数据提供方系统的安全性。
本申请实施例还提供了一种基于RPA模块的回复生成设备,所述设备包括:存储器,用于存储计算机程序,并将所述计算机程序传输给所述处理器;处理器,用于根据所述计算机程序中的指令执行以上介绍的回复生成方法。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储基于RPA模块的回复生成系统所用的计算机软件指令,当所述计算机可读存储介质在计算机上运行时,使得计算机可以执行以上介绍的回复生成方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元及模块可以是或者也可以不是物理上分开的。另外,还可以根据实际的需要选择其中的部分或者全部单元和模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
以上,仅是本申请的较佳实施例而已,并非对本申请作任何形式上的限制。虽然本申请已以较佳实施例揭露如上,然而并非用以限定本申请。任何熟悉本领域的技术人员,在不脱离本申请技术方案范围情况下,都可利用上述揭示的方法和技术内容对本申请技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本申请技术方案的内容,依据本申请的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本申请技术方案保护的范围内。

Claims (8)

1.一种基于RPA模块的回复生成方法,其特征在于,包括:
接收用户输入的问题;
当所述问题用于查询业务数据时,通过所述RPA模块获取所述问题对应的业务数据;
根据回复模板的可选字段确定多个维度;
根据所述多个维度,利用随机森林算法对所述业务数据进行分类,得到多个类别标签,所述多个类别标签中的每个类别标签用于标识回复模板是否包括对应的字段;
根据所述业务数据填充所述回复模板中的目标字段,所述目标字段为所述多个类别标签中标识所述回复模板包括的字段;
通过随机森林算法进行回归得到所述目标字段的相邻字段;
根据所述目标字段和所述相邻字段生成针对所述问题的答复。
2.根据权利要求1所述的方法,其特征在于,通过所述RPA模块获取所述问题对应的业务数据,包括:
利用槽位提取技术从所述问题中提取至少一个关键词,根据所述至少一个关键词获得至少一个查询任务;
通过RPA模块执行所述至少一个查询任务,得到与所述问题对应的业务数据。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
当未查找到与所述问题对应的业务数据时,向所述用户提供人工查询入口。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述接收用户输入的问题,包括:
通过用户界面接收所述用户输入的问题;或者,
通过麦克风接收所述用户输入的问题。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
通过所述用户界面呈现针对所述问题的答复;或者,
通过扬声器播放针对所述问题的答复。
6.一种基于RPA模块的回复生成装置,其特征在于,包括:
接收模块,用于接收用户输入的问题;
查询模块,用于当所述问题用于查询业务数据时,通过所述RPA模块获取所述问题对应的业务数据;
分类模块,用于根据回复模板的可选字段确定多个维度;根据所述多个维度,利用随机森林算法对所述业务数据进行分类,得到多个类别标签,所述多个类别标签中的每个类别标签用于标识回复模板是否包括对应的字段;
生成模块,用于根据所述业务数据填充所述回复模板中的目标字段,所述目标字段为所述多个类别标签中标识所述回复模板包括的字段;通过随机森林算法进行回归得到所述目标字段的相邻字段;根据所述目标字段和所述相邻字段生成针对所述问题的答复。
7.一种基于RPA模块的回复生成设备,其特征在于,所述设备包括:
存储器,用于存储计算机程序,并将所述计算机程序传输给处理器;
处理器,用于根据所述计算机程序中的指令执行权利要求1-5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储基于RPA模块的回复生成系统所用的计算机软件指令,当所述计算机可读存储介质在计算机上运行时,使得计算机可以执行上述权利要求1至5中任一项所述的回复生成方法。
CN202011162826.XA 2020-10-27 2020-10-27 一种基于rpa模块的回复生成方法、装置、设备及存储介质 Active CN112328871B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011162826.XA CN112328871B (zh) 2020-10-27 2020-10-27 一种基于rpa模块的回复生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011162826.XA CN112328871B (zh) 2020-10-27 2020-10-27 一种基于rpa模块的回复生成方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112328871A CN112328871A (zh) 2021-02-05
CN112328871B true CN112328871B (zh) 2024-04-26

Family

ID=74296444

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011162826.XA Active CN112328871B (zh) 2020-10-27 2020-10-27 一种基于rpa模块的回复生成方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112328871B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112925898B (zh) * 2021-04-13 2023-07-18 平安科技(深圳)有限公司 基于人工智能的问答方法、装置、服务器及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107301213A (zh) * 2017-06-09 2017-10-27 腾讯科技(深圳)有限公司 智能问答方法及装置
WO2018149326A1 (zh) * 2017-02-16 2018-08-23 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
CN109002483A (zh) * 2018-06-22 2018-12-14 平安科技(深圳)有限公司 文档管理方法、装置、计算机设备及存储介质
CN109460451A (zh) * 2018-09-29 2019-03-12 厦门快商通信息技术有限公司 主动获取用户信息的方法、智能客服方法及系统
CN109493166A (zh) * 2018-10-23 2019-03-19 深圳智能思创科技有限公司 一种针对电子商务导购场景任务型对话系统的构建方法
CN111159380A (zh) * 2019-12-31 2020-05-15 腾讯科技(深圳)有限公司 交互方法、装置、计算机设备及存储介质
CN111583931A (zh) * 2020-04-30 2020-08-25 中国银行股份有限公司 业务数据处理方法及装置
CN111611382A (zh) * 2020-05-22 2020-09-01 贝壳技术有限公司 话术模型训练方法、对话信息生成方法及装置、系统
CN111666393A (zh) * 2020-04-29 2020-09-15 平安科技(深圳)有限公司 智能问答系统的验证方法、装置、计算机设备及存储介质
CN111782793A (zh) * 2020-08-11 2020-10-16 深圳市北科瑞声科技股份有限公司 智能客服处理方法和系统及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190130226A1 (en) * 2017-10-27 2019-05-02 International Business Machines Corporation Facilitating automatic handling of incomplete data in a random forest model

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018149326A1 (zh) * 2017-02-16 2018-08-23 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
CN107301213A (zh) * 2017-06-09 2017-10-27 腾讯科技(深圳)有限公司 智能问答方法及装置
CN109002483A (zh) * 2018-06-22 2018-12-14 平安科技(深圳)有限公司 文档管理方法、装置、计算机设备及存储介质
CN109460451A (zh) * 2018-09-29 2019-03-12 厦门快商通信息技术有限公司 主动获取用户信息的方法、智能客服方法及系统
CN109493166A (zh) * 2018-10-23 2019-03-19 深圳智能思创科技有限公司 一种针对电子商务导购场景任务型对话系统的构建方法
CN111159380A (zh) * 2019-12-31 2020-05-15 腾讯科技(深圳)有限公司 交互方法、装置、计算机设备及存储介质
CN111666393A (zh) * 2020-04-29 2020-09-15 平安科技(深圳)有限公司 智能问答系统的验证方法、装置、计算机设备及存储介质
CN111583931A (zh) * 2020-04-30 2020-08-25 中国银行股份有限公司 业务数据处理方法及装置
CN111611382A (zh) * 2020-05-22 2020-09-01 贝壳技术有限公司 话术模型训练方法、对话信息生成方法及装置、系统
CN111782793A (zh) * 2020-08-11 2020-10-16 深圳市北科瑞声科技股份有限公司 智能客服处理方法和系统及设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Siamese Neural Networks with Random Forest for detecting duplicate question pairs;Godbole等;《Computation and Language》;20180128;1-7 *
中文问答社区答案质量的评价研究:以知乎为例;王伟等;《图书情报工作》;20171201(第22期);36-44 *
基于随机森林的ATM机监测预警方法;刘雅卉等;《电子技术与软件工程》;20180627(第12期);162-164 *
深度学习算法在问句意图分类中的应用研究;杨志明等;《计算机工程与应用》;20180914(第10期);154-160 *

Also Published As

Publication number Publication date
CN112328871A (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
CN110287479B (zh) 命名实体识别方法、电子装置及存储介质
US20240078386A1 (en) Methods and systems for language-agnostic machine learning in natural language processing using feature extraction
CN109800306B (zh) 意图分析方法、装置、显示终端及计算机可读存储介质
CN107807968B (zh) 基于贝叶斯网络的问答装置、方法及存储介质
CN111159380B (zh) 交互方法、装置、计算机设备及存储介质
CN111651497B (zh) 用户标签挖掘方法、装置、存储介质及电子设备
CN108268450B (zh) 用于生成信息的方法和装置
CN111741104B (zh) 应答消息的确定方法、配置方法、装置、设备及存储介质
CN112559865A (zh) 信息处理系统、计算机可读存储介质及电子设备
CN111639162A (zh) 信息交互方法和装置、电子设备和存储介质
CN112434501A (zh) 工单智能生成的方法、装置、电子设备及介质
CN110727782A (zh) 问答语料生成方法及系统
CN111782793A (zh) 智能客服处理方法和系统及设备
CN113051380A (zh) 信息生成方法、装置、电子设备和存储介质
CN112328871B (zh) 一种基于rpa模块的回复生成方法、装置、设备及存储介质
CN110990527A (zh) 自动问答方法及装置、存储介质及电子设备
CN117932022A (zh) 一种智能问答方法、装置、电子设备及存储介质
CN111933133A (zh) 智能客服应答的方法及装置、电子设备、存储介质
CN116955561A (zh) 问答方法、装置、电子设备以及存储介质
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN113360630B (zh) 交互信息提示方法
CN113505293A (zh) 信息推送方法、装置、电子设备及存储介质
CN113010664A (zh) 一种数据处理方法、装置及计算机设备
CN112487164A (zh) 一种人工智能交互方法
CN111008373A (zh) 智能问答的处理方法、装置、计算机可读介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant