CN116841615A - 一种基于大语言模型的人机交互方法及系统 - Google Patents
一种基于大语言模型的人机交互方法及系统 Download PDFInfo
- Publication number
- CN116841615A CN116841615A CN202310671634.9A CN202310671634A CN116841615A CN 116841615 A CN116841615 A CN 116841615A CN 202310671634 A CN202310671634 A CN 202310671634A CN 116841615 A CN116841615 A CN 116841615A
- Authority
- CN
- China
- Prior art keywords
- instruction
- task information
- user
- information
- user side
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013473 artificial intelligence Methods 0.000 claims description 53
- 230000006870 function Effects 0.000 claims description 42
- 238000004590 computer program Methods 0.000 claims description 30
- 230000002452 interceptive effect Effects 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 7
- 238000012545 processing Methods 0.000 abstract description 7
- 230000003068 static effect Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30145—Instruction analysis, e.g. decoding, instruction word fields
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Stored Programmes (AREA)
Abstract
本发明提供的一种基于大语言模型的人机交互方法及系统,通过用户端获取用户输入的任务信息,并根据任务信息获取对应的prompt解析指令,将prompt解析指令发送至人工智能语言平台,使得人工智能语言平台能够将用户随机输入的任务信息转换为用户端能够识别的标准指令,用户端根据标准指令确定任务信息的类型,从而获取任务信息对应的程序指令,根据程序指令完成用户指定的任务。本发明通过人工智能语言平台对用户随机输入的自然语言进行“标准化”处理,逐步引导用户输入标准化指令,以得到用户端可识别的指令,即计算机语言,以此简化应用程序与用户的信息交互过程,降低用户对应用程序的使用成本和学习成本,提高应用程序的使用便捷性。
Description
技术领域
本发明涉及人机交互技术领域,尤其涉及一种基于大语言模型的人机交互方法及系统。
背景技术
传统的应用程序在向用户提供的功能只能通过菜单或者快捷键的方式获取用户指令,但是随着应用科技以及手机功能的不断发展,应用程序的功能也随之增加,通过菜单或快捷键获取用户指令的方式,造成应用程序所配置的菜单内容越来越多,快捷键功能也越来越复杂;用户对应用程序的使用成本和学习成本也随之增加,不利于应用程序的使用便捷性。
发明内容
本发明所要解决的技术问题是:提供一种基于大语言模型的人机交互方法及系统,简化应用程序与用户的信息交互过程,降低用户对应用程序的使用成本和学习成本,提高应用程序的使用便捷性。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于大语言模型的人机交互方法,包括步骤:
用户端获取用户输入的任务信息,并根据所述任务信息获取prompt解析指令,将所述prompt解析指令发送至人工智能语言平台;
所述人工智能语言平台根据所述prompt解析指令得到标准指令,并将所述标准指令返回至所述用户端;
所述用户端根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息,并返回执行结果。
为了解决上述技术问题,本发明采用的另一种技术方案为:
一种基于大语言模型的人机交互系统,包括用户端和人工智能语言平台;所述用户端包括第一存储器、第一处理器及存储在第一存储器上并在第一处理器上运行的第一计算机程序,所述人工智能语言平台包括第二存储器、第二处理器及存储在第二存储器上并在第二处理器上运行的第二计算机程序,所述第一处理器执行所述第一计算机程序时实现:
获取用户输入的任务信息,并根据所述任务信息获取prompt解析指令,将所述prompt解析指令发送至所述人工智能语言平台;
接收所述人工智能语言平台返回的标准指令,根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息,并返回执行结果;
所述第二处理器执行所述第二计算机程序时实现:
根据所述prompt解析指令得到标准指令,并将所述标准指令返回至所述用户端。
本发明的有益效果在于:通过用户端直接获取用户输入的任务信息,并根据任务信息获取对应的prompt解析指令,将prompt解析指令发送至人工智能语言平台,使得人工智能语言平台能够将用户随机输入的任务信息转换为用户端能够识别的标准指令,并返回给用户端,用户端则根据标准指令确定任务信息的类型,从而获取任务信息对应的程序指令,用户端根据程序指令即可完成用户指定的任务。相比于现有技术中,通过设置菜单或者快捷键让用户输入指定命令的方式,本发明并未限制用户的输入信息格式或方式,而是通过人工智能语言平台对用户随机输入的自然语言进行“标准化”处理,逐步引导用户输入标准化指令,以得到用户端可识别的指令,即计算机语言,以此简化应用程序与用户的信息交互过程,降低用户对应用程序的使用成本和学习成本,提高应用程序的使用便捷性。
附图说明
图1为本发明公开的一种基于大语言模型的人机交互方法的步骤流程图;
图2为本发明实施例提供的一种基于大语言模型的人机交互方法的信息交互图;
图3为本发明实施例提供的一种基于大语言模型的人机交互系统的结构示意图;
标号说明:
4、用户端;5、人工智能语言平台;401、第一存储器;402、第一处理器;501、第二存储器;502、第二处理器。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
本发明涉及的技术术语解释:
请参照图1,本发明实施例提供的一种基于大语言模型的人机交互方法,包括步骤:
用户端获取用户输入的任务信息,并根据所述任务信息获取prompt解析指令,将所述prompt解析指令发送至人工智能语言平台;
所述人工智能语言平台根据所述prompt解析指令得到标准指令,并将所述标准指令返回至所述用户端;
所述用户端根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息,并返回执行结果。
从上述描述可知,本发明的有益效果在于:通过用户端直接获取用户输入的任务信息,并根据任务信息获取对应的prompt解析指令,将prompt解析指令发送至人工智能语言平台,使得人工智能语言平台能够将用户随机输入的任务信息转换为用户端能够识别的标准指令,并返回给用户端,用户端则根据标准指令确定任务信息的类型,从而获取任务信息对应的程序指令,用户端根据程序指令即可完成用户指定的任务。相比于现有技术中,通过设置菜单或者快捷键让用户输入指定命令的方式,本发明并未限制用户的输入信息,而是通过人工智能语言平台对用户随机输入的自然语言进行“标准化”处理,逐步引导用户输入标准化指令,以得到用户端可识别的指令,即计算机语言,以此简化应用程序与用户的信息交互过程,降低用户对应用程序的使用成本和学习成本,提高应用程序的使用便捷性。
进一步的,所述任务信息的类型包括操作指令;所述程序指令包括第一程序指令;
所述用户端根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息包括:
若所述用户端确定所述任务信息的类型为操作指令,则根据所述任务信息获取对应的prompt控制指令,并将所述prompt控制指令发送至所述人工智能语言平台;
所述人工智能语言平台根据所述prompt控制指令得到第一程序指令,并将所述第一程序指令返回至所述用户端;
所述用户端根据所述第一程序指令完成所述用户的任务信息,并返回执行结果。
由上述描述可知,当用户在已知用户端相关功能时,可直接输入用户端可识别的操作指令,则人工智能语言平台解析得到用户输入的任务信息为操作指令时,再次通过任务信息获取对应的prompt控制指令发送至人工智能语言平台;人工智能语言平台解析任务信息中所包含的具体操作内容,从而生成用户端可识别的指令,即第一程序指令,控制用户端完成对应的任务信息。以此方式,用户可通过一条任务信息一次性实现多级操作,无需通过用户端返回询问信息,提高了人机交互的效率。
进一步的,所述任务信息的类型包括交互信息;所述程序指令包括第二程序指令;
所述用户端根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息包括:
若所述用户端确定所述任务信息的类型为交互信息,则直接将所述交互信息发送至人工智能语言平台;
所述人工智能语言平台根据所述交互信息进行答复,生成与所述用户端相关的自然语言,并将所述自然语言返回至所述用户端;
所述用户端获取用于信息显示的第二程序指令,并根据所述第二程序指令显示所述自然语言。
由上述描述可知,当用户对用户端相关功能不了解时,用户可通过向用户端输入问题,即交互信息;用户端将用户的问题转发至人工智能语言平台,通过人工智能语言平台对交互信息进行翻译处理,从而生成与用户端相关的自然语言,以此逐步引导用户输入与用户端功能相关且正确的操作指令,完成其指定的任务。以此方式,用户无需投入学习成本也能够快速操作应用程序,简化应用程序的操作步骤。
进一步的,所述用户端获取用户输入的任务信息之前,包括:
所述人工智能语言平台获取所述用户端相关的数据集,并根据所述数据集进行微调训练;所述数据集包括所述用户端的功能信息;
所述人工智能语言平台根据所述prompt解析指令得到标准指令包括:
所述人工智能语言平台根据所述prompt解析指令以及所述功能信息得到标准指令。
由上述描述可知,通过在已经训练好的人工智能语言平台基础上,基于数据集进行二次微调,使得微调后的人工智能语言平台能够更有针对性地解析用户所输入的任务信息,即通过人工智能语言平台与用户之间问答对话,能够引导用户输入与用户端功能相关且正确的操作指令,减少了用户对用户端功能内容的学习成本和使用成本。
进一步的,所述用户端获取用户输入的任务信息之前,包括:
所述用户端构建聊天窗口,所述聊天窗口包括输入信息栏和显示信息栏;
所述用户端获取用户输入的任务信息包括:
所述用户端通过所述输入信息栏获取用户输入的任务信息;
所述用户端返回执行结果包括:
所述用户端通过所述显示信息栏返回执行结果。
由上述描述可知,用户端构建聊天窗口,分别用输入信息栏获取用户输入信息,显示信息栏返回执行结果,以便用户通过人机对话的方式控制用户端执行对应的程序功能,提高应用程序的使用便捷性。
请参照图3,本发明另一实施例提供的一种基于大语言模型的人机交互系统,包括用户端和人工智能语言平台;所述用户端包括第一存储器、第一处理器及存储在第一存储器上并在第一处理器上运行的第一计算机程序,所述人工智能语言平台包括第二存储器、第二处理器及存储在第二存储器上并在第二处理器上运行的第二计算机程序,所述第一处理器执行所述第一计算机程序时实现:
获取用户输入的任务信息,并根据所述任务信息获取prompt解析指令,将所述prompt解析指令发送至所述人工智能语言平台;
接收所述人工智能语言平台返回的标准指令,根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息,并返回执行结果;
所述第二处理器执行所述第二计算机程序时实现:
根据所述prompt解析指令得到标准指令,并将所述标准指令返回至所述用户端。
从上述描述可知,本发明的有益效果在于:通过用户端直接获取用户输入的任务信息,并根据任务信息获取对应的prompt解析指令,将prompt解析指令发送至人工智能语言平台,使得人工智能语言平台能够将用户随机输入的任务信息转换为用户端能够识别的标准指令,并返回给用户端,用户端则根据标准指令确定任务信息的类型,从而获取任务信息对应的程序指令,用户端根据程序指令即可完成用户指定的任务。相比于现有技术中,通过设置菜单或者快捷键让用户输入指定命令的方式,本发明并未限制用户的输入信息,而是通过人工智能语言平台对用户随机输入的自然语言进行“标准化”处理,逐步引导用户输入标准化指令,以得到用户端可识别的指令,即计算机语言,以此简化应用程序与用户的信息交互过程,降低用户对应用程序的使用成本和学习成本,提高应用程序的使用便捷性。
进一步的,所述任务信息的类型包括操作指令;所述程序指令包括第一程序指令;
所述根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息包括:
所述第一处理器执行所述第一计算机程序时实现:
若确定所述任务信息的类型为操作指令,则根据所述任务信息获取对应的prompt控制指令,并将所述prompt控制指令发送至人工智能语言平台;
接收所述人工智能语言平台返回的第一程序指令,根据所述第一程序指令完成所述用户的任务信息,并返回执行结果;
所述第二处理器执行所述第二计算机程序时实现:
根据所述prompt控制指令得到第一程序指令,并将所述第一程序指令返回至用户端。
由上述描述可知,当用户在已知用户端相关功能时,可直接输入用户端可识别的操作指令,则人工智能语言平台解析得到用户输入的任务信息为操作指令时,再次通过任务信息获取对应的prompt控制指令发送至人工智能语言平台;人工智能语言平台解析任务信息中所包含的具体操作内容,从而生成用户端可识别的指令,即第一程序指令,控制用户端完成对应的任务信息。以此方式,用户可通过一条任务信息一次性实现多级操作,无需通过用户端返回询问信息,提高了人机交互的效率。
进一步的,所述任务信息的类型包括交互信息;所述程序指令包括第二程序指令;
所述根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息包括:
所述第一处理器执行所述第一计算机程序时实现:
若确定所述任务信息的类型为交互信息,则直接将所述交互信息发送至人工智能语言平台;
接收所述人工智能语言平台返回的自然语言,获取用于信息显示的第二程序指令,并根据所述第二程序指令显示所述自然语言;
所述第二处理器执行所述第二计算机程序时实现:
根据所述交互信息进行答复,生成与所述用户端相关的自然语言,并将所述自然语言返回至用户端。
由上述描述可知,当用户对用户端相关功能不了解时,用户可通过向用户端输入问题,即交互信息;用户端将用户的问题转发至人工智能语言平台,通过人工智能语言平台对交互信息进行翻译处理,从而生成与用户端相关的自然语言,以此逐步引导用户输入与用户端功能相关且正确的操作指令,完成其指定的任务。以此方式,用户无需投入学习成本也能够快速操作应用程序,简化应用程序的操作步骤。
进一步的,所述获取用户输入的任务信息之前,包括:
所述第二处理器执行所述第二计算机程序时实现:
获取所述用户端相关的数据集,并根据所述数据集进行微调训练;所述数据集包括所述用户端的功能信息;
所述根据所述prompt解析指令得到标准指令包括:
根据所述prompt解析指令以及所述功能信息得到标准指令。
由上述描述可知,通过在已经训练好的人工智能语言平台基础上,基于数据集进行二次微调,使得微调后的人工智能语言平台能够更有针对性地解析用户所输入的任务信息,即通过人工智能语言平台与用户之间问答对话,能够引导用户输入与用户端功能相关且正确的操作指令,减少了用户对用户端功能内容的学习成本和使用成本。
进一步的,所述获取用户输入的任务信息之前,包括:
所述第一处理器执行所述第一计算机程序时实现:
构建聊天窗口,所述聊天窗口包括输入信息栏和显示信息栏;
所述获取用户输入的任务信息包括:
通过所述输入信息栏获取用户输入的任务信息;
所述返回执行结果包括:
通过所述显示信息栏返回执行结果。
由上述描述可知,用户端构建聊天窗口,分别用输入信息栏获取用户输入信息,显示信息栏返回执行结果,以便用户通过人机对话的方式控制用户端执行对应的程序功能,提高应用程序的使用便捷性。
本发明实施例提供的一种基于大语言模型的人机交互方法及系统,可应用于所有智能APP程序中,简化应用程序与用户的信息交互过程,降低用户对应用程序的使用成本和学习成本,提高应用程序的使用便捷性,以下通过具体实施例来说明:
请参照图1至图2,本发明的实施例一为:
一种基于大语言模型的人机交互方法,包括步骤:
S1、用户端获取用户输入的任务信息,并根据所述任务信息获取prompt解析指令,将所述prompt解析指令发送至人工智能语言平台。
在一些实施例中,所述prompt解析指令包括静态解析指令和动态输入指令。其中,动态输入指令即为用户输入的任务信息,所述静态解析指令具体为:
以下[]之间的内容是用户的任务信息,要求:
J1、请从下列词语中选择一个最合适的概括:“用户端功能1”、“用户端功能2”、“用户端功能3”。
J2、内容不要出现标定符号,模板如下:其它。
[用户输入的任务信息(动态输入指令)]
即,当用户端获取到用户输入的任务信息后,自动将其写入静态解析指令所限定的动态输入指令的区域中,从而构成完整的prompt解析指令。
S2、所述人工智能语言平台根据所述prompt解析指令得到标准指令,并将所述标准指令返回至所述用户端。
在一些实施例中,上述prompt解析指令中返回的内容即为标准指令,即为(用户端功能1、用户端功能2或用户端功能3),所述标准指令为一个简单的文本标识。例如:
用户输入:“新建一个ppt”(任务信息),则人工智能语言平台返回:“新建文件”(标准指令)。
用户输入:“设置字体为粗体,14号,微软雅黑”(任务信息),则人工智能语言平台返回:“设置字体”(标准指令)。
S3、所述用户端根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息,并返回执行结果。
需要说明的是,用户端通过人工智能语言平台提供的API(Application ProgramInterface,应用程序接口)向人工智能语言平台发送prompt信息,从而调用人工智能语言平台进行分析处理。
在一种可选的实施方式中,所述任务信息的类型包括操作指令;所述程序指令包括第一程序指令;需要说明的是,所述操作指令为用户输入与用户端功能相关且带有指示用户端完成指定动作的内容。
则所述S3包括:
S31、若所述用户端确定所述任务信息的类型为操作指令,则根据所述任务信息获取对应的prompt控制指令,并将所述prompt控制指令发送至所述人工智能语言平台。
在一些实施例中,每一个操作指令分别对应不同的prompt控制指令,通过prompt控制指令可分析出用户想要执行的操作指令的参数信息。所述prompt控制指令包括静态控制指令和动态输入指令。其中,动态输入指令即为用户输入的操作指令,所述静态控制指令具体为:
以下用户输入的内容,用[]分隔,请从中分析用户的操作。
以预设的结构化数据提供,结构化数据中所有字段的值不能为空,结构化数据的键值和解释如下:
{键值1:解释1,键值2:解释2,键值3:解释3}
[用户输入的操作指令(动态输入指令)]
即通过prompt控制指令将用户的操作指令进行格式化,使得用户端可识别用户的操作指令。例如:
用户输入:“设置字体为粗体,14号,微软雅黑”(任务信息),则人工智能语言平台返回:{type:blod,size:14,font:微软雅黑}(第一程序指令)。
S32、所述人工智能语言平台根据所述prompt控制指令得到第一程序指令,并将所述第一程序指令返回至所述用户端。
在一些实施例中,上述prompt控制指令中返回的格式化数据即为第一程序指令。
S33、所述用户端根据所述第一程序指令完成所述用户的任务信息,并返回执行结果。
在一些实施例中,当用户端根据第一程序指令完成所述用户的任务信息,则在聊天窗口中的显示信息栏返回操作成功。
在一种可选的实施方式中,所述任务信息的类型包括交互信息;所述程序指令包括第二程序指令;需要说明的是,所述交互信息为用户输入与用户端功能无关或带有询问意义的内容。
则所述S3包括:
S31、若所述用户端确定所述任务信息的类型为交互信息,则直接将所述交互信息发送至人工智能语言平台。
S32、所述人工智能语言平台根据所述交互信息进行答复,生成与所述用户端相关的自然语言,并将所述自然语言返回至所述用户端。
S33、所述用户端获取用于信息显示的第二程序指令,并根据所述第二程序指令显示所述自然语言。
在一些实施例中,若任务信息的类型为交互信息时,用户端则将用户输入的内容直接转发给人工智能语言平台进行翻译处理并答复后,用户端则返回人工智能语言平台的答复信息给用户,从而在用户与用户端之间实现人机对话的交互方式。
具体的,所述S1之前,包括:
S101、所述人工智能语言平台获取所述用户端相关的数据集,并根据所述数据集进行微调训练;所述数据集包括所述用户端的功能信息;
在一些实施例中,所述数据集的数量要求不少于500条;数据集包括用户端的功能信息,具体为:怎么使用用户端、用户端的特点等相关信息。
则所述S2包括:
S201、所述人工智能语言平台根据所述交互信息进行答复,生成与所述功能信息对应的自然语言。
具体的,所述S1之前,包括:
所述用户端构建聊天窗口,所述聊天窗口包括输入信息栏和显示信息栏;
则所述用户端通过所述输入信息栏获取用户输入的任务信息,所述用户端通过所述显示信息栏返回执行结果。
本发明的实施例二为:
一种基于大语言模型的人机交互方法应用于实际场景中。
在本实施例中,所述用户端为文本编辑器。
D1、人工智能语言平台获取与文本编辑器相关的数据集,并根据数据集进行微调训练;其中,文本编辑器的功能包括打开文件、保存文件、设置字体等。在本实施例中,数据集的内容具体为:
[{问:你能提供哪些功能”,答:“我提供的能力包括:打开文件,设置字体,保存文件”},{问:“什么是打开文件”,答:“你可以对我说:打开存储在某个位置的文件”},{问:“字体有哪些可以设置的功能”,答:“是否加粗,字号,字体”},……]
D2、用户端构建聊天窗口,聊天窗口包括输入信息栏和显示信息栏。
D3、用户端通过输入信息栏获取用户输入的任务信息为“将全部内容的字体设置为:14号,微软雅黑”。
D4、用户端根据所述任务信息获取prompt解析指令,将所述prompt解析指令发送至人工智能语言平台;在本实施例中,所述prompt解析指令具体为:
以下[]之间的内容是用户的任务信息,要求:
J1、请从下列词语中选择一个最合适的概括:“提问题”、“打开文件”、“设置字体”。
J2、内容不要出现标定符号,模板如下:其它。
[将全部内容的字体设置为:14号,微软雅黑]。
D5、人工智能语言平台根据上述prompt解析指令得到标准指令为“设置字体”,并将标准指令返回至用户端。
D6、用户端根据标准指令“设置字体”确定所述任务信息的类型为“操作指令”,则根据所述任务信息“将全部内容的字体设置为:14号,微软雅黑”获取对应的prompt控制指令,并将prompt控制指令发送至人工智能语言平台;在本实施例中,prompt控制指令具体为:
以下用户输入的内容,用[]分隔,请从中分析用户的操作。
以JSON格式提供,JSON中所有字段的值不能为空,JSON的key和解释如下:
{range:设置文本的范围,size:设置的字体大小,默认是10号字体,front:设置的字体类型,默认是宋体}
[将全部内容的字体设置为:14号,微软雅黑]
D7、人工智能语言平台根据上述prompt控制指令得到第一程序指令,并将第一程序指令返回至用户端;在本实施例中,第一程序指令具体为:
用户要求将全部内容的字体设置为14号的微软雅黑字体,操作为设置字体,操作的具体内容为设置字体的范围为全部内容,字体大小为14号,字体类型为微软雅黑,用户的操作可以转换为以下JSON格式的数据:
{range:“全部内容”,size:“14号”,front:“微软雅黑”}。
D8、用户端根据第一程序指令,将当前打开文件,并将文件中全部内容修改为:字号14,字体微软雅黑;在显示信息栏中返回“已为您更新字体和字号”。
本发明的实施例三为:
一种基于大语言模型的人机交互方法应用于实际场景中,其与实施例二的不同之处在于:所述任务信息的类型为交互信息。
D1、用户端通过输入信息栏获取用户输入的任务信息为“你能提供哪些功能”。
D2、用户端根据所述任务信息获取prompt解析指令,将所述prompt解析指令发送至人工智能语言平台;在本实施例中,所述prompt解析指令具体为:
以下[]之间的内容是用户的任务信息,要求:
J1、请从下列词语中选择一个最合适的概括:“提问题”、“打开文件”、“设置字体”。
J2、内容不要出现标定符号,模板如下:其它。
[你能提供哪些功能]。
D3、人工智能语言平台根据上述prompt解析指令得到标准指令为“提问题”,并将标准指令返回至用户端。
D4、用户端根据标准指令“提问题”确定所述任务信息的类型为“交互信息”,则直接将所述交互信息“你能提供哪些功能”发送至人工智能语言平台。
D5、人工智能语言平台根据所述交互信息进行答复,生成与用户端相关的自然语言为“我提供的功能包括:打开文件,设置字体,保存文件”,并将自然语言返回至用户端。
D6、用户端获取用于信息显示的第二程序指令,并根据第二程序指令将自然语言“我提供的功能包括:打开文件,设置字体,保存文件”显示于在显示信息栏中。
请参照图3,本发明的实施例四为:
一种基于大语言模型的人机交互系统,包括用户端4和人工智能语言平台5;所述用户端4包括第一存储器401、第一处理器402及存储在第一存储器401上并在第一处理器402上运行的第一计算机程序;
所述人工智能语言平台5包括第二存储器501、第二处理器502及存储在第二存储器501上并在第二处理器502上运行的第二计算机程序;
所述第一处理器402执行所述第一计算机程序时实现:
获取用户输入的任务信息,并根据所述任务信息获取prompt解析指令,将所述prompt解析指令发送至所述人工智能语言平台;
接收所述人工智能语言平台返回的标准指令,根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息,并返回执行结果;
所述第二处理器502执行所述第二计算机程序时实现:
根据所述prompt解析指令得到标准指令,并将所述标准指令返回至所述用户端。
具体的,所述第一处理器402执行所述第一计算机程序时实现实施例一、实施例二或实施例三中所述一种基于大语言模型的人机交互方法中用户端所执行的各个步骤。
具体的,所述第二处理器502执行所述第二计算机程序时实现实施例一、实施例二或实施例三中所述一种基于大语言模型的人机交互方法中人工智能语言平台所执行的各个步骤。
综上所述,本发明提供的一种基于大语言模型的人机交互方法及系统,通过用户端直接获取用户输入的任务信息,并根据任务信息获取对应的prompt解析指令,将prompt解析指令发送至人工智能语言平台,使得人工智能语言平台能够将用户随机输入的任务信息转换为用户端能够识别的标准指令,并返回给用户端,用户端则根据标准指令确定任务信息的类型;当用户对用户端功能具有一定了解时,可直接输入操作指令,由人工智能语言平台将用户的自然语言转换为计算机语言,从而控制用户端完成指定操作;当用户对用户端功能不了解时,可向用户端提出问题,由人工智能语言平台对用户进行引导和答复,从而使得用户快速获取正确的输入指令。相比于现有技术中,通过设置菜单或者快捷键让用户输入指定命令的方式,本发明并未限制用户的输入信息方式,而是通过人工智能语言平台对用户随机输入的自然语言进行“标准化”处理,逐步引导用户输入标准化指令,以得到用户端可识别的指令,即计算机语言,以此简化应用程序与用户的信息交互过程,降低用户对应用程序的使用成本和学习成本,提高应用程序的使用便捷性。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于大语言模型的人机交互方法,其特征在于,包括步骤:
用户端获取用户输入的任务信息,并根据所述任务信息获取prompt解析指令,将所述prompt解析指令发送至人工智能语言平台;
所述人工智能语言平台根据所述prompt解析指令得到标准指令,并将所述标准指令返回至所述用户端;
所述用户端根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息,并返回执行结果。
2.根据权利要求1所述的一种基于大语言模型的人机交互方法,其特征在于,所述任务信息的类型包括操作指令;所述程序指令包括第一程序指令;
所述用户端根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息包括:
若所述用户端确定所述任务信息的类型为操作指令,则根据所述任务信息获取对应的prompt控制指令,并将所述prompt控制指令发送至所述人工智能语言平台;
所述人工智能语言平台根据所述prompt控制指令得到第一程序指令,并将所述第一程序指令返回至所述用户端;
所述用户端根据所述第一程序指令完成所述用户的任务信息,并返回执行结果。
3.根据权利要求1所述的一种基于大语言模型的人机交互方法,其特征在于,所述任务信息的类型包括交互信息;所述程序指令包括第二程序指令;
所述用户端根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息包括:
若所述用户端确定所述任务信息的类型为交互信息,则直接将所述交互信息发送至人工智能语言平台;
所述人工智能语言平台根据所述交互信息进行答复,生成与所述用户端相关的自然语言,并将所述自然语言返回至所述用户端;
所述用户端获取用于信息显示的第二程序指令,并根据所述第二程序指令显示所述自然语言。
4.根据权利要求1所述的一种基于大语言模型的人机交互方法,其特征在于,所述用户端获取用户输入的任务信息之前,包括:
所述人工智能语言平台获取所述用户端相关的数据集,并根据所述数据集进行微调训练;所述数据集包括所述用户端的功能信息;
所述人工智能语言平台根据所述prompt解析指令得到标准指令包括:
所述人工智能语言平台根据所述prompt解析指令以及所述功能信息得到标准指令。
5.根据权利要求1所述的一种基于大语言模型的人机交互方法,其特征在于,所述用户端获取用户输入的任务信息之前,包括:
所述用户端构建聊天窗口,所述聊天窗口包括输入信息栏和显示信息栏;
所述用户端获取用户输入的任务信息包括:
所述用户端通过所述输入信息栏获取用户输入的任务信息;
所述用户端返回执行结果包括:
所述用户端通过所述显示信息栏返回执行结果。
6.一种基于大语言模型的人机交互系统,包括用户端和人工智能语言平台;所述用户端包括第一存储器、第一处理器及存储在第一存储器上并在第一处理器上运行的第一计算机程序,所述人工智能语言平台包括第二存储器、第二处理器及存储在第二存储器上并在第二处理器上运行的第二计算机程序,其特征在于,所述第一处理器执行所述第一计算机程序时实现:
获取用户输入的任务信息,并根据所述任务信息获取prompt解析指令,将所述prompt解析指令发送至所述人工智能语言平台;
接收所述人工智能语言平台返回的标准指令,根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息,并返回执行结果;
所述第二处理器执行所述第二计算机程序时实现:
根据所述prompt解析指令得到标准指令,并将所述标准指令返回至所述用户端。
7.根据权利要求6所述的一种基于大语言模型的人机交互系统,其特征在于,所述任务信息的类型包括操作指令;所述程序指令包括第一程序指令;
所述根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息包括:
所述第一处理器执行所述第一计算机程序时实现:
若确定所述任务信息的类型为操作指令,则根据所述任务信息获取对应的prompt控制指令,并将所述prompt控制指令发送至人工智能语言平台;
接收所述人工智能语言平台返回的第一程序指令,根据所述第一程序指令完成所述用户的任务信息,并返回执行结果;
所述第二处理器执行所述第二计算机程序时实现:
根据所述prompt控制指令得到第一程序指令,并将所述第一程序指令返回至用户端。
8.根据权利要求6所述的一种基于大语言模型的人机交互系统,其特征在于,所述任务信息的类型包括交互信息;所述程序指令包括第二程序指令;
所述根据所述标准指令确定所述任务信息的类型,并根据所述任务信息的类型获取对应的程序指令完成所述任务信息包括:
所述第一处理器执行所述第一计算机程序时实现:
若确定所述任务信息的类型为交互信息,则直接将所述交互信息发送至人工智能语言平台;
接收所述人工智能语言平台返回的自然语言,获取用于信息显示的第二程序指令,并根据所述第二程序指令显示所述自然语言;
所述第二处理器执行所述第二计算机程序时实现:
根据所述交互信息进行答复,生成与所述用户端相关的自然语言,并将所述自然语言返回至用户端。
9.根据权利要求6所述的一种基于大语言模型的人机交互系统,其特征在于,所述获取用户输入的任务信息之前,包括:
所述第二处理器执行所述第二计算机程序时实现:
获取所述用户端相关的数据集,并根据所述数据集进行微调训练;所述数据集包括所述用户端的功能信息;
所述根据所述prompt解析指令得到标准指令包括:
根据所述prompt解析指令以及所述功能信息得到标准指令。
10.根据权利要求6所述的一种基于大语言模型的人机交互系统,其特征在于,所述获取用户输入的任务信息之前,包括:
所述第一处理器执行所述第一计算机程序时实现:
构建聊天窗口,所述聊天窗口包括输入信息栏和显示信息栏;
所述获取用户输入的任务信息包括:
通过所述输入信息栏获取用户输入的任务信息;
所述返回执行结果包括:
通过所述显示信息栏返回执行结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310671634.9A CN116841615A (zh) | 2023-06-07 | 2023-06-07 | 一种基于大语言模型的人机交互方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310671634.9A CN116841615A (zh) | 2023-06-07 | 2023-06-07 | 一种基于大语言模型的人机交互方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116841615A true CN116841615A (zh) | 2023-10-03 |
Family
ID=88168009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310671634.9A Pending CN116841615A (zh) | 2023-06-07 | 2023-06-07 | 一种基于大语言模型的人机交互方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116841615A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117236416A (zh) * | 2023-11-13 | 2023-12-15 | 之江实验室 | 一种大语言模型交互方法和装置 |
-
2023
- 2023-06-07 CN CN202310671634.9A patent/CN116841615A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117236416A (zh) * | 2023-11-13 | 2023-12-15 | 之江实验室 | 一种大语言模型交互方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109271498B (zh) | 面向虚拟机器人的自然语言交互方法及系统 | |
US7020841B2 (en) | System and method for generating and presenting multi-modal applications from intent-based markup scripts | |
US8213719B2 (en) | Editing 2D structures using natural input | |
CN116841615A (zh) | 一种基于大语言模型的人机交互方法及系统 | |
CN111880813A (zh) | 实现安卓卡片ui的方法、存储介质 | |
CN116821290A (zh) | 面向多任务对话的大语言模型训练方法和交互方法 | |
Kumari et al. | Enhancing college chat bot assistant with the help of richer human computer interaction and speech recognition | |
CN114398871A (zh) | 金融实体抽取方法、装置、设备与计算机可读存储介质 | |
CN111158648B (zh) | 一种基于实景语义理解的互动帮助系统开发方法及其平台 | |
CN111723559A (zh) | 一种实时信息抽取方法及装置 | |
CN111475129A (zh) | 一种语音识别候选同音词的展示方法及设备 | |
CN115359793A (zh) | 一种车载语音交互方法、装置及车辆 | |
CN109002498A (zh) | 人机对话方法、装置、设备及存储介质 | |
CN114296708A (zh) | 结合rpa和ai的生成rpa代码方法、装置及电子设备 | |
CN112307186A (zh) | 基于情绪识别的问答服务方法、系统、终端设备及介质 | |
CN110796265A (zh) | 决策树模型的交互式操作方法、装置、终端设备及介质 | |
CN111797636B (zh) | 离线语义解析方法及系统 | |
CN109284811B (zh) | 一种面向智能机器人的人机交互方法及装置 | |
CN118051593A (zh) | 数据处理方法、装置和电子设备 | |
CN117149965A (zh) | 对话处理方法、装置、计算机设备及计算机可读存储介质 | |
CN116841525A (zh) | 一种计算机绘图方法、装置、电子设备和可读存储介质 | |
CN117952211A (zh) | 一种利用大语言模型确定操作指令的方法、装置以及系统 | |
CN113485619A (zh) | 信息收集表的处理方法、装置、电子设备及存储介质 | |
CN113190669A (zh) | 智能对话方法、装置、终端及存储介质 | |
CN117953899A (zh) | 一种基于语音交互的需求响应方法、系统、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |