CN117331820A - 会话机器人的测试方法、装置、终端、服务器及存储介质 - Google Patents
会话机器人的测试方法、装置、终端、服务器及存储介质 Download PDFInfo
- Publication number
- CN117331820A CN117331820A CN202311213960.1A CN202311213960A CN117331820A CN 117331820 A CN117331820 A CN 117331820A CN 202311213960 A CN202311213960 A CN 202311213960A CN 117331820 A CN117331820 A CN 117331820A
- Authority
- CN
- China
- Prior art keywords
- test
- task
- user
- robot
- session
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 469
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000010998 test method Methods 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims abstract description 13
- 230000002452 interceptive effect Effects 0.000 claims abstract description 6
- 238000004590 computer program Methods 0.000 claims description 18
- 238000012795 verification Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 8
- 230000003993 interaction Effects 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 6
- 238000007726 management method Methods 0.000 description 116
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3684—Test management for test design, e.g. generating new test cases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3688—Test management for test execution, e.g. scheduling of test suites
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种会话机器人的测试方法、装置、终端、服务器及存储介质,属于人工智能技术领域。所述方法包括:响应于管理用户针对任务编辑控件的交互操作,获取待测试的会话机器人的标识、测试内容及测试用户选择条件;响应于管理用户针对任务派发控件的触控操作,生成任务派发请求;将任务派发请求发送至即时通讯服务器,任务派发请求由即时通讯服务器发送至任务管理服务器,任务派发请求用于请求任务管理服务器确定多个测试用户,并将测试内容发送至多个测试用户,以使每个测试用户按照测试内容对会话机器人进行测试。本申请能够自动确定出测试用户,并将测试内容发送至测试用户,简化了会话机器人测试过程的复杂度。
Description
技术领域
本申请涉及人工智能技术领域,特别涉及一种会话机器人的测试方法、装置、终端、服务器及存储介质。
背景技术
随着人工智能技术的发展,会话机器人广泛应用于人机交互过程中,尤其是在智能客服场景中,极大地提升了业务查询和办理效率,在节省人工成本的同时,提升了服务质量。为确保用户能够获取到正确的答案,会话机器人在上线之前,往往需要进行测试。
相关技术中,手动选择测试用户,并告知测试用户具体的测试内容,测试用户按照测试内容与会话机器人进行交互,以完成对会话机器人的测试。
上述测试方法需要手动选择测试用户,且需要告知测试用户具体的测试内容,测试过程较为繁琐。
发明内容
本申请实施例提供了一种会话机器人的测试方法、装置、终端、服务器及存储介质,能够简化会话机器人测试过程的复杂度。所述技术方案如下:
第一方面,提供了一种会话机器人的测试方法,所述方法包括:
响应于管理用户针对即时通讯应用界面上任务管理控件的触控操作,显示任务管理界面,所述任务管理界面上显示有任务编辑控件和任务派发控件;
响应于所述管理用户针对所述任务编辑控件的交互操作,获取待测试的会话机器人的标识、测试内容及测试用户选择条件;
响应于所述管理用户针对所述任务派发控件的触控操作,生成任务派发请求,所述任务派发请求包括所述会话机器人的标识、所述测试内容及所述测试用户选择条件;
将所述任务派发请求发送至即时通讯服务器,所述任务派发请求由所述即时通讯服务器发送至所述任务管理服务器,所述任务派发请求用于请求所述任务管理服务器根据所述会话机器人的标识和所述测试用户选择条件,确定多个测试用户,并将所述测试内容发送至所述多个测试用户,以使每个测试用户按照所述测试内容对所述会话机器人进行测试,所述测试用户的即时通讯应用中预先安装有所述会话机器人。
第二方面,一种会话机器人的测试方法,所述方法包括:
接收即时通讯服务器发送的任务派发请求,所述任务派发请求包括待测试的会话机器人的标识、测试内容及测试用户选择条件;
根据所述会话机器人的标识和所述测试用户选择条件,确定多个测试用户,所述测试用户的即时通讯应用中预先安装有所述会话机器人;
将所述测试内容发送至所述多个测试用户,以使每个测试用户按照所述测试内容对所述会话机器人进行测试。
第三方面,提供了一种会话机器人的测试装置,所述装置包括:
显示模块,用于响应于管理用户针对即时通讯应用界面上任务管理控件的触控操作,显示任务管理界面,所述任务管理界面上显示有任务编辑控件和任务派发控件;
获取模块,用于响应于所述管理用户针对所述任务编辑控件的交互操作,获取待测试的会话机器人的标识、测试内容及测试用户选择条件;
生成模块,用于响应于所述管理用户针对所述任务派发控件的触控操作,生成任务派发请求,所述任务派发请求包括所述会话机器人的标识、所述测试内容及所述测试用户选择条件;
发送模块,用于将所述任务派发请求发送至即时通讯服务器,所述任务派发请求由所述即时通讯服务器发送至所述任务管理服务器,所述任务派发请求用于请求所述任务管理服务器根据所述会话机器人的标识和所述测试用户选择条件,确定多个测试用户,并将所述测试内容发送至所述多个测试用户,以使每个测试用户按照所述测试内容对所述会话机器人进行测试,所述测试用户的即时通讯应用中预先安装有所述会话机器人。
第四方面,提供了一种会话机器人的测试装置,所述装置包括:
接收模块,用于接收即时通讯服务器发送的任务派发请求,所述任务派发请求包括待测试的会话机器人的标识、测试内容及测试用户选择条件;
确定模块,用于根据所述会话机器人的标识和所述测试用户选择条件,确定多个测试用户,所述测试用户的即时通讯应用中预先安装有所述会话机器人;
发送模块,用于将所述测试内容发送至所述多个测试用户,以使每个测试用户按照所述测试内容对所述会话机器人进行测试。
第五方面,提供了一种终端,所述终端包括存储器及处理器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以实现如第一方面所述的会话机器人的测试方法。
第六方面,提供了一种服务器,所述服务器包括存储器及处理器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以实现如第二方面所述的会话机器人的测试方法。
第七方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序被处理器执行时能够实现如第一方面所述的会话机器人的测试方法,或第二方面所述的会话机器人的测试方法。
第八方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时能够实现如第一方面所述的会话机器人的测试方法,或第二方面所述的会话机器人的测试方法。
本申请实施例提供的技术方案带来的有益效果是:
在即时通讯应用中设置任务管理控件,通过触控该任务管理控件,显示任务管理界面,该界面上显示有任务编辑控件和任务派发控件,该任务编辑控件用于管理用户编辑对会话机器人的测试任务,该测试任务包括会话机器人的标识、测试内容及测试用户选择条件,该任务派发控件用于生成包括会话机器人标识、测试内容及测试用户选择条件的任务派发请求,并将该任务派发请求通过即时通讯服务器发送至任务管理服务器,使得任务管理服务器基于会话机器人的标识和测试用户选择条件,确定出多个测试用户,进而将测试内容发送至每个测试用户,以使测试用户能够对会话机器人进行测试。采用本申请实施例提供的方法无需管理用户手动选择测试用户,也无需专门告知测试用户具体的测试内容,即可按照管理用户的要求选择出测试用户,并将该测试内容派发给测试用户,简化了测试流程,测试方法更为智能。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种会话机器人的测试方法所涉及的实施环境方法流程图;
图2是本申请实施例提供的一种会话机器人的测试系统的框图;
图3是本申请实施例提供的另一种会话机器人的测试系统的框图;
图4是本申请实施例提供的一种会话机器人的测试方法流程图;
图5是本申请实施例提供的一种会话机器人的测试装置结构示意图;
图6是本申请实施例提供的另一种会话机器人的测试装置结构示意图;
图7示出了本申请一个示例性实施例提供的一种电子设备的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
可以理解,本申请实施例所使用的术语“每个”、“多个”及“任一”等,多个包括两个或两个以上,每个是指对应的多个中的每一个,任一是指对应的多个中的任意一个。举例来说,多个词语包括10个词语,而每个词语是指这10个词语中的每一个词语,任一词语是指10个词语中的任意一个词语。
本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
随着人工智能技术的发展,会话机器人被应用在各个方面。为了更好地服务于用户,会话机器人在上线前需要进行对话测试和问答体验。目前现有的即时通讯应用需要手动@人,比较繁琐,不够智能,且只有@具体的人和@所有成员的功能,没有随机点将和多人私聊功能,测试用户比较固定,且收集的测试数据缺乏随机性,不仅如此,还需要专门告知各个测试用户具体的测试内容,简言之,测试流程较为繁琐。
为简化会话机器人的测试流程,降低会话机器人测试流程的复杂性,本申请实施例提供了一种会话机器人的测试方法,该方法可在会话机器人上线前,随机邀请不同背景的成员来进行测试,并且可以通过完成测试任务来收集训练数据,让会话机器人回答问题更加专业。
请参考图1,其示出了本申请实施例提供的一种会话机器人的测试方法所涉及的实施环境,该实施环境包括:第一终端101、第二终端102、即时通讯服务器103及任务管理服务器104。
其中,第一终端101为管理用户所使用的终端。该第一终端101中安装有即时通讯应用,该即时通讯应用中集成有任务派发机器人和待测试的会话机器人,该会话机器人为一种知识或技术领域的人设机器人,比如医疗专家、通讯专家、银行大厅专员、历史学者、绘画师、小学老师、美食导员、法律顾问等。基于该任务派发机器人,管理用户可编辑对待测试的会话机器人的测试任务,包括待测试会话机器人的标识、测试内容及测试用户选择条件等,从而将包括待测试会话机器人的标识、测试内容及测试用户选择条件等的任务派发请求发送至即时通讯服务器103。
即时通讯服务器103用于接收第一终端101发送的任务派发请求,并将该任务派发请求发送至任务管理服务器104。
任务管理服务器104用于接收即时通讯服务器103发送的任务派发请求,并根据待测试的会话机器人的标识和测试用户选择条件,确定出多个测试用户,并将测试内容发送至每个测试用户。该任务管理服务器104维护一个问答数据库(图中未示出),该问答数据库中存储有每个测试问题对应的答案,从而可根据测试用户提出的测试问题,给出相应的答案。该任务管理服务器还维护另外一个数据库,该数据库用于存储各个测试用户与会话机器人的问答对及有效性校验结果,该问答对包括测试问题及其对应的答案。基于该数据库中所存储的数据,可对会话机器人的测试进度及测试结果进行统计。
第二终端102为测试用户所使用的终端,该第二终端102中安装有即时通讯应用,该即时通讯应用中集成有任务派发机器人和待测试的会话机器人。虽然第二终端102的即时通讯应用中集成有任务派发机器人,但是测试用户不具有任务派发权限,需要向管理员用户申请。当每个测试用户基于第二终端102接收到测试内容,可按照测试内容与待测试的会话机器人进行会话,从而完成对该会话机器人的测试任务。
上述第一终端101和第二终端102可以为智能手机、平板电脑、笔记本电脑、台式电脑、智能音箱等,但不局限于此。即时通讯服务器103和管理服务器104可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,本申请实施例不对即时通讯服务器103和管理服务器104的类型作具体的限定。
上述第一终端101和第二终端102与即时通讯服务器103及任务管理服务器104可以通过有线或无线通信方式进行直接或间接地连接,即时通讯服务器103与任务管理服务器104可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
需要说明的是,上述任务管理服务器104集成了对待测试的会话机器人的任务派发功能、问答服务功能及统计功能,为提高处理速度,可根据任务管理服务器104所要实现的功能,将任务管理服务器104拆分成不同的服务器,例如,任务派发服务器、会话机器人服务器及统计服务器等。其中,任务派发服务器用于实现任务派发功能;会话机器人服务器为一个基于会话机器人的服务系统,比如医疗方面的智能问答系统、图片生成系统,用于实现问答服务功能;统计服务器用于实现统计功能。
图3示出了本申请实施例提供的一种会话机器人的测试系统,参见图3,该会话机器人的测试系统包括第一终端(管理用户所使用的终端)、第二终端(测试用户所使用的终端)、即时通讯服务器、任务管理服务器等。基于该系统,本申请实施例提供的会话机器人的测试流程包括以下步骤:
1、第一终端通过检测管理用户的操作,获取管理用户在与任务派发机器人会话过程中输入的待测试机器人的标识、测试内容及测试用户选择条件等。
2、基于所获取的待测试机器人的标识、测试内容及测试用户选择条件等信息,第一终端生成包括这些信息的任务派发请求,进而将该任务派发请求发送至即时通讯服务器。
3、即时通讯服务器将任务派发请求发送至任务管理服务器,任务管理服务器根据会话机器人的标识和测试用户选择条件,通过与即时通讯服务器进行交互,确定出多个测试用户。
4、任务管理服务器将测试内容发送至每个测试用户。
5、第二终端在测试用户与待测试的会话机器人会话过程中,获取测试用户的测试问题,并将测试问题发送至管理服务器,管理服务器基于该测试问题,获取相应的答案,并将该答案发送至第二终端。
6-7、管理服务器调用大预言模型(例如GPT),对测试用户的测试问题及所给出的答案进行有效性校验,得到有效性校验结果。
8、管理服务器将测试用户的测试问题、测试问题对应的答案及有效性校验结果存储到数据库中。
9、管理服务器基于数据库中所存储的数据进行统计,得到会话机器人的测试进度以及每个测试问题对应答案的有效率等。
图4示出了本申请实施例提供的一种会话机器人的测试系统,参见图4,该会话机器人的测试系统包括第一终端(管理用户所使用的终端)、第二终端(测试用户所使用的终端)、即时通讯服务器、任务派发服务器、会话机器人服务器、统计服务器等。基于该系统,本申请实施例提供的会话机器人的测试流程包括以下步骤:
1、第一终端通过检测管理用户的操作,获取管理用户在与任务派发机器人会话过程中输入的待测试机器人的标识、测试内容及测试用户选择条件等。
2、基于所获取的待测试机器人的标识、测试内容及测试用户选择条件等信息,第一终端生成包括这些信息的任务派发请求,进而将该任务派发请求发送至即时通讯服务器。
3、即时通讯服务器将任务派发请求发送至任务派发服务器,任务派发服务器根据会话机器人的标识和测试用户选择条件,通过与即时通讯服务器进行交互,确定出多个测试用户。
4、任务派发服务器将所确定的多个测试用户的标识发送至会话机器人服务器。
5、会话机器人存储测试用户的标识、测试内容及待测试的会话机器人的标识之间的对应关系。
6、会话机器人服务器将测试内容发送至每个测试用户。
7、第二终端在测试用户与待测试的会话机器人会话过程中,获取测试用户的测试问题。
8、第二终端将测试问题发送至会话机器人服务器,会话机器人服务器基于该测试问题,获取相应的答案,并将该答案发送至第二终端。
9-10、会话机器人服务器调用大预言模型(例如GPT),对测试用户的测试问题及所给出的答案进行有效性校验,得到有效性校验结果。
11、会话机器人服务器将测试用户的测试问题、测试问题对应的答案及有效性校验结果存储到数据库中。
12、统计服务器基于数据库中所存储的数据进行统计,得到会话机器人的测试进度以及每个测试问题对应答案的有效率等。
基于图1所示的实施环境,本申请实施例提供了一种会话机器人的测试方法,参见图4,本申请实施例提供的方法流程包括:
401、响应于管理用户针对即时通讯应用界面上任务管理控件的触控操作,第一终端显示任务管理界面。
其中,管理用户为待测试的会话机器人开发完成之后,负责编辑对该会话机器人的测试任务的用户。本申请实施例中,第一终端中安装的即时通讯应用具有任务管理功能,其即时通讯界面上显示有任务管理控件。当管理用户想要派发任务时,管理用户可触控该任务管理控件,响应于针对该任务管理控件的触控操作,第一终端显示任务管理界面,该任务管理界面上显示有任务编辑控件和任务派发控件,其中,任务编辑控件用于管理用户编辑测试任务,该任务派发控件用于生成任务派发请求,并将该任务派发请求发送至即时通讯服务器。
402、响应于管理用户针对任务编辑控件的交互操作,第一终端获取待测试的会话机器人的标识、测试内容及测试用户选择条件。
在本申请实施例中,管理用户可通过任务编辑控件编辑测试任务。该任务编辑控件可以是任务派发机器人,还可以是多个任务编辑选项。
在一种可能的实现方式中,当任务编辑控件为任务派发机器人,管理用户可与该任务派发机器人进行会话,在管理用户与任务派发机器人的会话过程中,管理用户在会话中指定测试任务,第一终端获取管理用户的会话,进而从管理用户的会话中获取待测试的会话机器人的标识、测试内容及测试用户选择条件等。其中,待测试的会话机器人的标识用于唯一标识该会话机器人,可以为会话机器人的名称等。测试内容用于指示测试用户如何对会话机器人进行测试,包括测试问题、测试时间等。测试用户选择条件用于选择测试用户,包括测试用户的数量,还可以包括测试用户的属性等。
在另一种可能的实现方式中,任务编辑控件为多个任务编辑选项,该多个任务编辑选项用于编辑待测试的会话机器人的标识、测试内容、测试用户选择条件等。当需派发测试任务时,管理用户可触控多个任务编辑选项。响应于管理用户针对多个任务编辑选项的触控操作,第一终端获取管理用户输入或选择的会话机器人的标识、测试内容及测试用户选择条件等。
403、响应于管理用户针对任务派发控件的触控操作,第一终端生成任务派发请求。
其中,任务派发请求包括会话机器人的标识、测试内容及测试用户选择条件等。响应于管理用户针对任务派发控件的触控操作,第一终端获取管理用户所输入或选择的会话机器人的标识、测试内容及测试用户选择条件等,进而生成任务派发请求。
404、第一终端将任务派发请求发送至即时通讯服务器。
405、即时通讯服务器将任务派发请求发送至任务管理服务器。
406、当接收到即时通讯服务器发送的任务派发请求,任务管理服务器根据会话机器人的标识和测试用户选择条件,确定多个测试用户。
在一种可能的实现方式中,测试用户选择条件包括测试用户的数量,任务管理服务器根据会话机器人的标识和测试用户选择条件,确定多个测试用户,可采用如下步骤:
第一步,任务管理服务器根据会话机器人的标识,确定目标群组。
其中,目标群组内用户的即时通讯应用中预先安装有会话机器人,可以为待测试的会话机器人的研发公司内部的员工构成的群组。在本申请实施例中,会话机器人的标识与安装该会话机器人的目标群组之间的对应关系可以存储在即时通讯服务器中,还可以存储在任务管理服务器中。如果会话机器人的标识与安装该会话机器人的目标群组之间的对应关系存储在即时通讯服务器中,当接收到任务派发请求,任务管理服务器可根据会话机器人的标识,通过与即时通讯服务器交互,查询会话机器人的标识对应的目标群组。如果会话机器人的标识与安装该会话机器人的目标群组之间的对应关系存储在任务管理服务器中,当接收到任务派发请求,任务管理服务器可直接查询该对应关系,以获取目标群组。
第二步,任务管理服务器从目标群组内,随机选择该数量个用户,作为多个测试用户。
任务管理服务器根据测试用户选择条件中指示的测试用户的数量,从目标群组内,随机选择该数量个用户,作为多个测试用户。例如,目标群组包括100个用户,测试用户选择条件指示的测试用户的数量为20个,则任务管理服务器可从目标群组的100个用户中随机选择20个用户。
在另一种可能的实现方式中,测试用户选择条件包括测试用户的数量和属性,该属性可以为性别、年龄、学历等。管理服务器根据会话机器人的标识和测试用户选择条件,确定多个测试用户时,可采用如下步骤:
第一步,管理服务器根据会话机器人的标识,确定目标群组。
第二步,从目标群组内,选择数量个具有属性的用户,作为多个测试用户。
基于目标群组内的用户,管理服务器根据测试用户选择条件所指示的数量和属性,从目标群组包括的用户中选择该数量个具有指示属性的用户,作为多个测试用户。例如,目标群组包括100个用户,测试用户选择条件指示的测试用户的数量为20个,且10个测试用户为女性,10个测试用户为男性,则任务管理服务器可从目标群组中选择10个女性用户和10个男性用户,作为测试用户。
407、任务管理服务器将测试内容发送至多个测试用户,以使每个测试用户按照测试内容对会话机器人进行测试。
当确定出多个测试用户之后,为便于该针对会话测试机器人的测试任务进行监督,任务管理服务器可存储会话机器人的标识、测试内容及多个测试用户的标识之间的对应关系。
在本申请实施例中,当管理服务器将测试内容发送给多个测试用户之后,每个测试用户可基于该测试内容对会话机器人进行测试。以多个测试用户中的任一测试用户为例,当接收到测试内容后,测试用户可在测试时间内,基于测试内容中包括的测试问题,与会话机器人进行交互。该测试时间比较灵活,通常为一个时间段,例如几天、几小时等,在该测试时间内测试用户可以随时随地对会话机器人进行测试,测试时间较为灵活。当会话机器人获取到测试用户的测试问题,将该测试问题发送至管理服务器,管理服务器通过查询问答数据库,获取该测试问题对应的答案,进而将该测试问题对应的答案发送至会话机器人,由会话机器人提供给用户。
在本申请实施例中,在会话机器人与任一测试用户会话过程中,任务管理服务器获取会话测试机器人针对该测试用户的每个测试问题给出的答案,进而调用大语言模型,对测试用户的每个测试问题对应答案的有效性进行校验,得到测试用户的每个测试问题对应答案的有效性校验结果,然后存储测试用户的多个测试问题、每个测试问题对应的答案及有效性校验结果。其中,大语言模型可以部署在任务管理服务器上,也可以部署在其他服务器上,本申请实施例不对大语言模型的部署进行限定。
在本申请实施例中,任务管理服务器可统计完成会话机器人测试任务的测试用户的实际数量,并获取多个测试用户的数量,进而计算实际数量与数量之间的比值,得到会话机器人测试任务的完成率。当完成率小于第一预设比率,向目标用户发送提示消息,以提示目标用户完成会话机器人测试任务。其中,第一预设比率由管理用户进行设置,可以为80%、90%等,本申请实施例对此不作具体的限定。目标用户为接收到测试内容而未完成会话机器人测试任务的测试用户。进一步地,考虑到会话机器人的测试任务具有时效性,在向目标用户发送提示消息之前,任务管理服务器可检测当前时间是否超过测试时间,如果当前时间超过测试时间,则不再向目标用户发送提示消息。
在本申请实施例中,任务管理服务器还可以根据每个测试问题对应答案的有效性校验结果,计算每个测试问题对应答案的有效率,如果任一测试问题对应答案的有效率小于第二预设比率,则需要对测试问题对应答案进行更新,从而提高会话机器人回答问题的准确性,使得会话机器人更专业。其中,第二预设比率可由管理用户设置,可以为80%、85%等。
本申请实施例提供的方法通过任务派发机器人,可随机指定测试用户,并向测试用户发送测试内容,以对预上线的会话机器人进行测试,简化了测试流程。此外,会话机器人随机与不同的用户进行交流,收集的会话数据更全面,更具有随机性。另外,被分配的测试用户可以随时随地与会话机器人进行问答测试,测试方式更灵活。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
请参考图5,其示出了本申请实施例提供了一种会话机器人的测试装置的结构示意图,该装置可以通过软件、硬件或者二者结合实现,成为电子设备的全部或一部分,该装置包括:
显示模块501,用于响应于管理用户针对即时通讯应用界面上任务管理控件的触控操作,显示任务管理界面,任务管理界面上显示有任务编辑控件和任务派发控件;
获取模块502,用于响应于管理用户针对任务编辑控件的交互操作,获取待测试的会话机器人的标识、测试内容及测试用户选择条件;
生成模块503,用于响应于管理用户针对任务派发控件的触控操作,生成任务派发请求,任务派发请求包括会话机器人的标识、测试内容及测试用户选择条件;
发送模块504,用于将任务派发请求发送至即时通讯服务器,任务派发请求由即时通讯服务器发送至任务管理服务器,任务派发请求用于请求任务管理服务器根据会话机器人的标识和测试用户选择条件,确定多个测试用户,并将测试内容发送至多个测试用户,以使每个测试用户按照测试内容对会话机器人进行测试,测试用户的即时通讯应用中预先安装有会话机器人。
在本申请的另一个实施例中,任务编辑控件包括任务派发机器人,获取模块502,用于在管理用户与任务派发机器人的会话过程中,从管理用户的会话中获取会话机器人的标识、测试内容及测试用户选择条件。
在本申请的另一个实施例中,任务编辑控件包括多个任务编辑选项,获取模块502,用于响应于管理用户针对多个任务编辑选项的触控操作,获取管理用户输入或选择的会话机器人的标识、测试内容及测试用户选择条件。
请参考图6,其示出了本申请实施例提供了一种会话机器人的测试装置的结构示意图,该装置可以通过软件、硬件或者二者结合实现,成为电子设备的全部或一部分,该装置包括:
接收模块601,用于接收即时通讯服务器发送的任务派发请求,任务派发请求包括待测试的会话机器人的标识、测试内容及测试用户选择条件;
确定模块602,用于根据会话机器人的标识和测试用户选择条件,确定多个测试用户,测试用户的即时通讯应用中预先安装有会话机器人;
发送模块603,用于将测试内容发送至多个测试用户,以使每个测试用户按照测试内容对会话机器人进行测试。
在本申请的另一个实施例中,测试用户选择条件包括测试用户的数量,确定模块602,用于根据会话机器人的标识,确定目标群组,目标群组内用户的即时通讯应用中预先安装有会话机器人;从目标群组内,随机选择数量个用户,作为多个测试用户。
在本申请的另一个实施例中,测试用户选择条件包括测试用户的数量和属性,确定模块602,用于根据会话机器人的标识,确定目标群组,目标群组内用户的即时通讯应用中预先安装有会话机器人;从目标群组内,选择数量个具有属性的用户,作为多个测试用户。
在本申请的另一个实施例中,该装置还包括:
存储模块,用于存储会话机器人的标识、测试内容及多个测试用户的标识之间的对应关系。
在本申请的另一个实施例中,该装置还包括:
获取模块,还用于在会话机器人与任一测试用户会话过程中,获取会话测试机器人针对测试用户的每个测试问题给出的答案;
校验模块,用于调用大语言模型,对测试用户的每个测试问题对应答案的有效性进行校验,得到测试用户的每个测试问题对应答案的有效性校验结果;
存储模块,用于存储测试用户的多个测试问题、每个测试问题对应的答案及有效性校验结果。
在本申请的另一个实施例中,该装置还包括:
统计模块,用于统计完成会话机器人测试任务的测试用户的实际数量;
获取模块,还用于获取多个测试用户的数量;
计算模块,用于计算实际数量与数量之间的比值,得到会话机器人测试任务的完成率;
发送模块,还用于当完成率小于第一预设比率,向目标用户发送提示消息,以提示目标用户完成会话机器人测试任务,目标用户为未完成会话机器人测试任务的测试用户。
在本申请的另一个实施例中,该装置还包括:
计算模块,用于根据每个测试问题对应答案的有效性校验结果,计算每个测试问题对应答案的有效率;
更新模块,用于如果任一测试问题对应答案的有效率小于第二预设比率,对测试问题对应答案进行更新。
图7示出了本申请一个示例性实施例提供的一种电子设备700的结构框图。通常,电子设备700包括有:处理器701和存储器702。
处理器701可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable LogicArray,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(CentralProcessing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器701可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器701还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是CD-ROM(Compact Disc Read-Only Memory,只读光盘)、ROM、RAM(Random AccessMemory,随机存取存储器)、磁带、软盘和光数据存储设备等。该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序被执行时能够实现上述会话机器人的测试方法。
当然,上述电子设备必然还可以包括其他部件,例如输入/输出接口、通信组件等。输入/输出接口为处理器和外围接口模块之间提供接口,上述外围接口模块可以是输出设备、输入设备等。通信组件被配置为便于电子设备和其他设备之间有线或无线方式的通信等。
本领域技术人员可以理解,图7中示出的结构并不构成对电子设备700的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序被处理器执行时能够实现上述会话机器人的测试方法。
本申请实施例提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时能够实现上述会话机器人的测试方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (15)
1.一种会话机器人的测试方法,其特征在于,所述方法包括:
响应于管理用户针对即时通讯应用界面上任务管理控件的触控操作,显示任务管理界面,所述任务管理界面上显示有任务编辑控件和任务派发控件;
响应于所述管理用户针对所述任务编辑控件的交互操作,获取待测试的会话机器人的标识、测试内容及测试用户选择条件;
响应于所述管理用户针对所述任务派发控件的触控操作,生成任务派发请求,所述任务派发请求包括所述会话机器人的标识、所述测试内容及所述测试用户选择条件;
将所述任务派发请求发送至即时通讯服务器,所述任务派发请求由所述即时通讯服务器发送至所述任务管理服务器,所述任务派发请求用于请求所述任务管理服务器根据所述会话机器人的标识和所述测试用户选择条件,确定多个测试用户,并将所述测试内容发送至所述多个测试用户,以使每个测试用户按照所述测试内容对所述会话机器人进行测试,所述测试用户的即时通讯应用中预先安装有所述会话机器人。
2.根据权利要求1所述的方法,其特征在于,所述任务编辑控件包括任务派发机器人,所述响应于所述管理用户针对所述任务编辑控件的交互操作,获取待测试的会话机器人的标识、测试内容及测试用户选择条件,包括:
在所述管理用户与所述任务派发机器人的会话过程中,从所述管理用户的会话中获取所述会话机器人的标识、测试内容及测试用户选择条件。
3.根据权利要求1所述的方法,其特征在于,所述任务编辑控件包括多个任务编辑选项,所述响应于所述管理用户针对所述任务编辑控件的交互操作,获取待测试的会话机器人的标识、测试内容及测试用户选择条件,包括:
响应于所述管理用户针对所述多个任务编辑选项的触控操作,获取所述管理用户输入或选择的所述会话机器人的标识、测试内容及测试用户选择条件。
4.一种会话机器人的测试方法,其特征在于,所述方法包括:
接收即时通讯服务器发送的任务派发请求,所述任务派发请求包括待测试的会话机器人的标识、测试内容及测试用户选择条件;
根据所述会话机器人的标识和所述测试用户选择条件,确定多个测试用户,所述测试用户的即时通讯应用中预先安装有所述会话机器人;
将所述测试内容发送至所述多个测试用户,以使每个测试用户按照所述测试内容对所述会话机器人进行测试。
5.根据权利要求4所述的方法,其特征在于,所述测试用户选择条件包括测试用户的数量,所述根据所述会话机器人的标识和所述测试用户选择条件,确定多个测试用户,包括:
根据所述会话机器人的标识,确定目标群组,所述目标群组内用户的即时通讯应用中预先安装有所述会话机器人;
从所述目标群组内,随机选择所述数量个用户,作为所述多个测试用户。
6.根据权利要求4所述的方法,其特征在于,所述测试用户选择条件包括测试用户的数量和属性,所述根据所述会话机器人的标识和所述测试用户选择条件,确定多个测试用户,包括:
根据所述会话机器人的标识,确定目标群组,所述目标群组内用户的即时通讯应用中预先安装有所述会话机器人;
从所述目标群组内,选择所述数量个具有所述属性的用户,作为所述多个测试用户。
7.根据权利要求4所述的方法,其特征在于,所述将所述测试内容发送至所述多个测试用户之前,还包括:
存储所述会话机器人的标识、所述测试内容及所述多个测试用户的标识之间的对应关系。
8.根据权利要求4所述的方法,其特征在于,所述测试内容包括多个测试问题,所述将所述测试内容发送至所述多个测试用户之后,还包括:
在所述会话机器人与任一测试用户会话过程中,获取所述会话测试机器人针对所述测试用户的每个测试问题给出的答案;
调用大语言模型,对所述测试用户的每个测试问题对应答案的有效性进行校验,得到所述测试用户的每个测试问题对应答案的有效性校验结果;
存储所述测试用户的多个测试问题、每个测试问题对应的答案及有效性校验结果。
9.根据权利要求8所述的方法,其特征在于,所述存储所述测试用户的多个测试问题、每个测试问题对应的答案及有效性校验结果之后,还包括:
统计完成会话机器人测试任务的测试用户的实际数量;
获取所述多个测试用户的数量;
计算所述实际数量与所述数量之间的比值,得到所述会话机器人测试任务的完成率;
当所述完成率小于第一预设比率,向目标用户发送提示消息,以提示所述目标用户完成所述会话机器人测试任务,所述目标用户为未完成所述会话机器人测试任务的测试用户。
10.根据权利要求8所述的方法,其特征在于,所述存储所述测试用户的多个测试问题、每个测试问题对应的答案及有效性校验结果之后,还包括:
根据每个测试问题对应答案的有效性校验结果,计算每个测试问题对应答案的有效率;
如果任一测试问题对应答案的有效率小于第二预设比率,对所述测试问题对应答案进行更新。
11.一种会话机器人的测试装置,其特征在于,所述装置包括:
显示模块,用于响应于管理用户针对即时通讯应用界面上任务管理控件的触控操作,显示任务管理界面,所述任务管理界面上显示有任务编辑控件和任务派发控件;
获取模块,用于响应于所述管理用户针对所述任务编辑控件的交互操作,获取待测试的会话机器人的标识、测试内容及测试用户选择条件;
生成模块,用于响应于所述管理用户针对所述任务派发控件的触控操作,生成任务派发请求,所述任务派发请求包括所述会话机器人的标识、所述测试内容及所述测试用户选择条件;
发送模块,用于将所述任务派发请求发送至即时通讯服务器,所述任务派发请求由所述即时通讯服务器发送至所述任务管理服务器,所述任务派发请求用于请求所述任务管理服务器根据所述会话机器人的标识和所述测试用户选择条件,确定多个测试用户,并将所述测试内容发送至所述多个测试用户,以使每个测试用户按照所述测试内容对所述会话机器人进行测试,所述测试用户的即时通讯应用中预先安装有所述会话机器人。
12.一种会话机器人的测试装置,其特征在于,所述装置包括:
接收模块,用于接收即时通讯服务器发送的任务派发请求,所述任务派发请求包括待测试的会话机器人的标识、测试内容及测试用户选择条件;
确定模块,用于根据所述会话机器人的标识和所述测试用户选择条件,确定多个测试用户,所述测试用户的即时通讯应用中预先安装有所述会话机器人;
发送模块,用于将所述测试内容发送至所述多个测试用户,以使每个测试用户按照所述测试内容对所述会话机器人进行测试。
13.一种终端,其特征在于,所述终端包括存储器及处理器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以实现如权利要求1至3中任一项所述的会话机器人的测试方法。
14.一种服务器,其特征在于,所述服务器包括存储器及处理器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以实现如权利要求4至10中任一项所述的会话机器人的测试方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序被处理器执行时能够实现如权利要求1至3中任一项所述的会话机器人的测试方法,或权利要求4至10中任一项所述的会话机器人的测试方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311213960.1A CN117331820A (zh) | 2023-09-19 | 2023-09-19 | 会话机器人的测试方法、装置、终端、服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311213960.1A CN117331820A (zh) | 2023-09-19 | 2023-09-19 | 会话机器人的测试方法、装置、终端、服务器及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117331820A true CN117331820A (zh) | 2024-01-02 |
Family
ID=89282158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311213960.1A Pending CN117331820A (zh) | 2023-09-19 | 2023-09-19 | 会话机器人的测试方法、装置、终端、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117331820A (zh) |
-
2023
- 2023-09-19 CN CN202311213960.1A patent/CN117331820A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111917878B (zh) | 消息处理方法、装置、设备及存储介质 | |
CN110807962A (zh) | 一种智能组卷考试系统 | |
CN111510659B (zh) | 在线交互方法、装置、存储介质及电子设备 | |
CN111405224A (zh) | 在线交互控制方法、装置、存储介质及电子设备 | |
CN112015574A (zh) | 一种远程医疗教育培训方法、装置、设备及存储介质 | |
GB2604787A (en) | Systems and methods for objective-based skill training | |
WO2021196708A1 (zh) | 在线交互方法、装置、存储介质及电子设备 | |
CN112287767A (zh) | 交互控制方法、装置、存储介质以及电子设备 | |
CN113067952B (zh) | 用于多台机器人的人机协同无感控制方法和装置 | |
Garcia et al. | Provider factors predict use of evidence-based psychotherapies in veterans affairs posttraumatic stress disorder specialty programs: The role of profession, theoretical orientation, and training. | |
CN113741930A (zh) | 应用升级方法、装置、电子设备及计算机可读存储介质 | |
CN117911134A (zh) | 错误信息分析方法、装置以及计算机设备 | |
CN117331820A (zh) | 会话机器人的测试方法、装置、终端、服务器及存储介质 | |
CN116487012A (zh) | 一种临床医护人员智能实践教学方法、系统、介质及设备 | |
CN116795256A (zh) | 任务处理方法、装置、电子设备及存储介质 | |
CN111145907A (zh) | 体检数据处理方法、装置、介质及电子设备 | |
CN112232538A (zh) | 推荐系统、方法、装置及电子设备 | |
CN113268512B (zh) | 基于互联网平台的企业岗位职业技能培训系统 | |
CN113988779A (zh) | 一种外勤人员考勤方法及装置、存储介质、计算机设备 | |
CN106878761A (zh) | 直播互动方法、装置及服务器 | |
CN112381527A (zh) | 学习监督方法、装置、服务器及介质 | |
RU2625554C1 (ru) | Способ тестирования и/или опроса удаленных пользователей | |
CN113472628B (zh) | 一种信息收集控制方法、装置和计算机可读存储介质 | |
KR102431279B1 (ko) | 학습효율 증대 및 학습관리를 위한 방법 | |
CN109785198A (zh) | 基于数据分析的纪律约束方法、装置、介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |